Spamassassin mehrere Bayes DBs

Thunderbirdy

New Member
Hallo,

ich habe einen aktuelle Linux Vserver von Hosteurope, den ich gerade teste und bei dem ich derzeit mit Spamassassin und den Bayes Filtern kämpfe.

Auf dem System läuft qmail.

Lt. FAQs soll spamassassin automatisch angelernt werden, indem die Mailuser ihre Mails in den Spamordner verschieben. Soweit die Theorie.

In der Praxis markiert Spamassassin nicht eine einzige Mail als Spam und was mich etwas irritiert: Machmal finde ich Mails, die im Header keinen Eintrag von Spamassassin haben. :-(

Die Bayes Datenbank liegen auf dem Server an verschiedenen Stellen. z.B. unter

/var/qmail/mailnames/domain.tld/info/.spamassassin (dort liegt auch eine user_prefs) und unter
/root/.spamassassin

Die bayes_seen und bayes_toks sind an beiden Stellen verschieden groß und es scheint auch ein sa-learn zu laufen, denn das Datum der beiden Files ändert sich regelmäßig, jedoch ändert sich an der DB nichts.

sa-learn --dump magic zeigt mir eine Anzahl von nSpam und nHam und die ändert sich erst, wenn ich sa-learn manuell aufrufe. :-(

die configs sehen so aus:

etc/spamassassin/local.cf:
ifplugin Mail::SpamAssassin::Plugin::Shortcircuit
endif # Mail::SpamAssassin::Plugin::Shortcircuit
rewrite_header subject *****SPAM******
required_score 7.00

und
/var/qmail/mailnames/domain.tld/info/.spamassassin/user_prefs:
rewrite_header subject ***SPAM***
required_score 7
use_bayes 1
bayes_auto_learn 1


Habt Ihr eine Idee, was hier falsch läuft?

Viele Grüße
Robert
 
Bei Dir hat anscheinend jeder Mail-User seine eigene Bayes-DB. Das hat Vor- und Nachteile.
Vorteil: Bei jedem User wird abhängig vom Mail-Verkehr Spams und Hams angelernt.
Nachteil: Die DB braucht viel länger um sich aufzubauen, Spams von anderen Usern werden nicht ebenfalls erkannt, uvm.

Meiner Meinung nach überwiegt der Anteil der Nachteile und ich setzte immer auf eine zentrale Bayes-DB.

Du musst beim Überprüfen der Bayes-DB darauf achten, dass Du den richtigen User nimmst. Wenn Du nur sa-learn in der Console aufrufst, nimmt er immer die unter /root/.spamassassin/. Dein MDA allerdings nimmt die des jeweilige Users.

huschi.
 
Danke für die Antwort.

Wie kann ich SA denn beibringen, dass nur noch eine Datenbank verwendet wird?

Außerdem ist mir aufgefallen, dass bei Mails, die von Spamassassin als SPAM erkannt werden, keine Header geschrieben werden.
Bei denen, die nicht gefiltert werden stehen die X-Spam Header drin.

Obwohl die Mails korrekt als SPAM erkannt und in den Spam Ordner verschoben werden, wird der Betreff nicht mit *****SPAM***** ergänzt.

Habt Ihr hier eine Idee?

Viele Grüße
Robert
 
Wie kann ich SA denn beibringen, dass nur noch eine Datenbank verwendet wird?
In der globalen local.cf den bayes_path vorgeben. Z.B.:
Code:
bayes_path /var/spool/spamassassin/bayes
bayes_file_mode 777
(Verzeichnisse erstellen und für alle Lesbar machen versteht sich von selbst.)

Der Rest ist etwas unerklärlich. Was ich von Dir verstanden habe:
- Emails, die in den (Imap-?)Spam-Ordner verschoben werden, haben keine Erweiterung im Betreff und auch sonst keine X-Spam-Header.
- Emails, die in der Inbox landen, haben aber X-Spam-Header.

Das Klingt als ob es einen anderen Auslöser für die Verschiebung in den Spam-Ordner gibt.
Kenne ich von Plesk allerdings nicht so.

huschi.
 
Danke für die Hilfe.

Die local.cf habe ich angepasst.

Wenn ich jetzt ein manuelles sa-learn mache, muss ich dann noch den dbpath angeben oder wird der automatisch aus der local.cf gezogen?

Zu dem Header Problem:
Es handelt sich im Imap Folder. In Plesk konnte ich einstellen, dass Spam Mails automatisch dorthin verschoben werden sollen und dass SA diesen Ordner ebenfalls für das Autolearn verwendet.

Erkennt SA eine Mail als SPAM landet sie in dem Ordner, aber ohne die X-SPAM Header zu schreiben und ohne den Betreff zu ändern.

In welchem log-File müsste das Hinzufügen der X-SPAM Header zu finden sein?

Viele Grüße
Robert
 
Wenn ich jetzt ein manuelles sa-learn mache, muss ich dann noch den dbpath angeben oder wird der automatisch aus der local.cf gezogen?
Mit den Einstellungen arbeiten alle dann auf einer globalen Bayes-DB.

Erkennt SA eine Mail als SPAM landet sie in dem Ordner, aber ohne die X-SPAM Header zu schreiben und ohne den Betreff zu ändern.
Das muss dann ein neues Vorgehen sein. Da Plesk Closed-Source ist, hat man keine Möglichkeit einen Blick hinter die Kulisse zu werfen.

In welchem log-File müsste das Hinzufügen der X-SPAM Header zu finden sein?
Im Prinzip nirgends. Wenn man will, kann man SpamAssassin gesprächiger stimmen. Dann kommt die Ausgabe im maillog. Aber das will man i.d.R. nicht, weil es unendlich unverständliche Zeilen ins maillog schreibt.

huschi.
 
Back
Top