Hallo liebes Forum,
bezugnehmend auf Huschis Antwort in diesem Thread:
(vor allem auf die Aussage zu "Mein Spamassassin läuft im Prinzip, aber er scheint nicht richtig dazuzulernen.").
Ich bin zwar nicht der betroffene ColumbusDB, aber ich habe ein ähnliches Problem, welches ich hier kurz wiedergeben möchte:
Meine Konfiguration besteht aus einem Strato-HE-Server, mit ServerAdmin24, vpopmail, qmail. Als OS läuft SuSE 9.3. Die verwendete Spamassassionversion ist 3.0.4.
Ich habe Spamassassion so konfiguriert, dass es mir in jeden Mailheader einen Spamscore hineinschreibt, das funktioniert wunderbar.
Bisher habe ich mittels sa-learn --spam --mbox ./dateimitspam.mbox ca. 1000 Mails erfolgreich als Spam in die Datenbank eingetragen.
Beim Abrufen der eMails (täglich ca. 200 Mails, davon 190 Spam) werden ca. 25-45 Mails maximal von SA als Spam erkannt, als solcher markiert (Subjectänderung, Bericht mit Vorschau +Attachment der Originalmail, zutreffende Regeln, etc.) und aussortiert.
Was mich wundert ist, dass bisher (Installation läuft so seit ca. 1 Woche) noch in KEINER der inzwischen aufgelaufenen ca. 1500 Mails im Header steht: "autolearn=yes".
Entweder die Mail ist als Spam markiert ("autolearn=no") oder sie ist es nicht ("autolearn=failed").
Meine Vermutung (leider reicht es vom Wissensstand her nur für eine solche, ich bin hier, um den Wissensstand zu erhöhen) ist, dass ich zwar eine Menge Spam in der sa-learn-Datenbank habe, aber diese Datenbank nicht beim Eintrudeln von eMails zu Rate gezogen wird. In den zutreffenden Regeln bei Spam-Mails steht nichts von Bayes, nur die Standardregeln, die ich in einigen .cf-Files dazugeladen habe.
Alle meine Sorgen wären sofort zerschlagen, wenn ich nur eine einzige Spam-Mail mit "autolearn=yes" sähe, dann wüsste ich, es läuft, er braucht nur noch eine Weile.
So bleibt der Verdacht, dass er ein Problem hat, die bereits gelernten Mails mit neu eintrudelnden zu vergleichen.
Nun einige Konfigurationsdaten:
Es gibt keinen ORDNER /var/spool/spamassassin/bayes, in /var/spool/spamassassin liegen nur 2 FILES bayes_seens und bayes_toks, ist das richtig???
und
(BTW: Wie bekomme ich NUR die Ausgabe der Übersicht, ohne die ellenlangen Zeilen dahinter?)
Meine Fragen:
- Wie stelle ich fest, ob die Datenbank, die ich mühsam täglich mit nicht identifizierten Spams anlerne, überhaupt zu Rate gezogen wird?
- Wenn sie es nicht wird, wie bekomme ich sie dann dazu? (Und welche Angaben braucht Ihr ggfs. von mir, um mir weiterhelfen zu können, bzw. mich auf die richtige Fährte zu stupsen?)
- Ist es u.U. sogar normal, dass in der ersten Zeit -trotz inzwischen vorhandener 1000 Spams- kein autolearn stattfindet und ich nur abwarten muss?
Sofern mir geholfen werden kann würde ich zum Thema gerne ein kleines Howto verfassen, da ich denke, es betrifft noch mehr hier, die ein ähnliches Problem haben.
Bisher schonmal vielen Dank an marneus, thenull und djrick, die mir bis zu diesem Punkt schon sehr viel gehofen haben!!
bezugnehmend auf Huschis Antwort in diesem Thread:
sa-learn per Email füttern
Es füllt sich die procmail.log, aber die sa-learn.log bleibt leer. Erstmal mußt Du rausbekommen, ob sa-learn richtig läuft. Aufschluß darüber gibt 'sa-learn --dump'. Ist es ok, die beiden eMail-Adressen in einem Postfach zu haben Theoretisch ja solange die TO-Zeile unverändert bleibt...
serversupportforum.de
(vor allem auf die Aussage zu "Mein Spamassassin läuft im Prinzip, aber er scheint nicht richtig dazuzulernen.").
Ich bin zwar nicht der betroffene ColumbusDB, aber ich habe ein ähnliches Problem, welches ich hier kurz wiedergeben möchte:
Meine Konfiguration besteht aus einem Strato-HE-Server, mit ServerAdmin24, vpopmail, qmail. Als OS läuft SuSE 9.3. Die verwendete Spamassassionversion ist 3.0.4.
Ich habe Spamassassion so konfiguriert, dass es mir in jeden Mailheader einen Spamscore hineinschreibt, das funktioniert wunderbar.
Bisher habe ich mittels sa-learn --spam --mbox ./dateimitspam.mbox ca. 1000 Mails erfolgreich als Spam in die Datenbank eingetragen.
Beim Abrufen der eMails (täglich ca. 200 Mails, davon 190 Spam) werden ca. 25-45 Mails maximal von SA als Spam erkannt, als solcher markiert (Subjectänderung, Bericht mit Vorschau +Attachment der Originalmail, zutreffende Regeln, etc.) und aussortiert.
Was mich wundert ist, dass bisher (Installation läuft so seit ca. 1 Woche) noch in KEINER der inzwischen aufgelaufenen ca. 1500 Mails im Header steht: "autolearn=yes".
Entweder die Mail ist als Spam markiert ("autolearn=no") oder sie ist es nicht ("autolearn=failed").
Meine Vermutung (leider reicht es vom Wissensstand her nur für eine solche, ich bin hier, um den Wissensstand zu erhöhen) ist, dass ich zwar eine Menge Spam in der sa-learn-Datenbank habe, aber diese Datenbank nicht beim Eintrudeln von eMails zu Rate gezogen wird. In den zutreffenden Regeln bei Spam-Mails steht nichts von Bayes, nur die Standardregeln, die ich in einigen .cf-Files dazugeladen habe.
Alle meine Sorgen wären sofort zerschlagen, wenn ich nur eine einzige Spam-Mail mit "autolearn=yes" sähe, dann wüsste ich, es läuft, er braucht nur noch eine Weile.
So bleibt der Verdacht, dass er ein Problem hat, die bereits gelernten Mails mit neu eintrudelnden zu vergleichen.
Nun einige Konfigurationsdaten:
Code:
Auszug aus der local.cf:
use_bayes 1
bayes_path /var/spool/spamassassin/bayes
bayes_file_mode 777
bayes_auto_learn 1
und
Code:
Der Beginn von "sa-learn --dump|more":
0.000 0 3 0 non-token data: bayes db version
0.000 0 1201 0 non-token data: nspam
0.000 0 0 0 non-token data: nham
0.000 0 107572 0 non-token data: ntokens
0.000 0 1151095896 0 non-token data: oldest atime
0.000 0 1154428578 0 non-token data: newest atime
0.000 0 0 0 non-token data: last journal sync atime
0.000 0 0 0 non-token data: last expiry atime
0.000 0 0 0 non-token data: last expire atime delta
0.000 0 0 0 non-token data: last expire reduction count
0.500 158 0 1154412709 0623e506fc
0.500 1 0 1152037984 0c07670101(...und so fort)
Meine Fragen:
- Wie stelle ich fest, ob die Datenbank, die ich mühsam täglich mit nicht identifizierten Spams anlerne, überhaupt zu Rate gezogen wird?
- Wenn sie es nicht wird, wie bekomme ich sie dann dazu? (Und welche Angaben braucht Ihr ggfs. von mir, um mir weiterhelfen zu können, bzw. mich auf die richtige Fährte zu stupsen?)
- Ist es u.U. sogar normal, dass in der ersten Zeit -trotz inzwischen vorhandener 1000 Spams- kein autolearn stattfindet und ich nur abwarten muss?
Sofern mir geholfen werden kann würde ich zum Thema gerne ein kleines Howto verfassen, da ich denke, es betrifft noch mehr hier, die ein ähnliches Problem haben.
Bisher schonmal vielen Dank an marneus, thenull und djrick, die mir bis zu diesem Punkt schon sehr viel gehofen haben!!
Last edited by a moderator: