Bayesfilter

  • Thread starter Thread starter Tobster
  • Start date Start date
T

Tobster

Guest
Kann ich anhand den Einträgen vom spamassassin in der syslog erkennen, ob eine E-Mail anhand des Bayesfilters aussortiert wurde?

Was ist pro und kontra davon den Bayesfilter mit MySql zu betreiben?

Kann ich eine bestehende Installation konvertieren?

Reicht es die Dateien zu sichern oder was muss ich tun damit meine Informaionen nicht verloren gehn?

Ich verwende die neueste spamassassin Version und mysql 5
 
Da keiner Antwortet, gebe ich zumindest mal einen Teilsenf dazu:
Kann ich anhand den Einträgen vom spamassassin in der syslog erkennen, ob eine E-Mail anhand des Bayesfilters aussortiert wurde?
Im Maillog werden manchmal die Ergebnisse geloggt:
Code:
Jan 11 00:22:19 localhost spamd[7184]: result: Y 10 - BAYES_99,HTML_50_60,HTML_MESSAGE,MIME_QP_LONG_LINE,RCVD_IN_SORBS_DUL,UNWANTED_LANGUAGE_BODY,URIBL_AB_SURBL,URIBL_SBL scantime=6.6,size=4071,mid=<01c7350e$211ef640$6c822ecf@bstriglose>,bayes=1,autolearn=no
Das sagt aber nur aus, ob der Bayes-Filter angeschlagen hat. Nicht daß der Bayes diese Email aussortiert hat. Wichtig: Es sind immer alle Regeln dafür zuständig. Niemals nur Eine.

Was ist pro und kontra davon den Bayesfilter mit MySql zu betreiben?
Mehr Admin-Aufwand beim Einrichten. :)
...und vorallem: SA ist dann auf MySQL angewiesen, bzw. der Bayesfilter arbeitet nur bei laufenden MySQL-Server.
An einen Performance-Sprung glaube ich nicht da die BerkleyDB relativ flott ist und für die gespeicherten Tokens vollkommen ausreicht.

Kann ich eine bestehende Installation konvertieren?
Vom SA aus: "null problemo". Zum Konvertieren der BerkleyDB zu MySQL habe ich keine Ahnung. Falls Du es aber versuchst, wäre ich an Informationen interessiert.

Reicht es die Dateien zu sichern oder was muss ich tun damit meine Informaionen nicht verloren gehn?
Die BDB-Dateien werden danach nicht mehr benutzt und verbleiben einfach wo sie sind.
Die SA-Config kannst Du ja vorher sichern. Is ja nicht viel.

huschi.
 
Hallo!

Zur Sicherheit kann man sich ja vorher ein Backup der Datenbank anlegen

Code:
sa-learn --backup > backup.dat

Gruß flyingoffice
 
Huschi said:
Im Maillog werden manchmal die Ergebnisse geloggt:
Code:
Das weiß ich. Ich sollte vielleicht lernen mich so auszudrücken, dass ich verstanden werde. Ich glaube dafür denke ich aber um zu viele Ecken.
Huschi said:
Jan 11 00:22:19 localhost spamd[7184]: result: Y 10 - BAYES_99,HTML_50_60,HTML_MESSAGE,MIME_QP_LONG_LINE,RCVD_IN_SORBS_DUL,UNWANTED_LANGUAGE_BODY,URIBL_AB_SURBL,URIBL_SBL scantime=6.6,size=4071,mid=<01c7350e$211ef640$6c822ecf@bstriglose>,bayes=1,autolearn=no
BAYES und ein Zahlenwert wird aufgegeben in dem "Bericht" über den Scan. Das war das was ich eigentlich wissen wollte
Huschi said:
Das sagt aber nur aus, ob der Bayes-Filter angeschlagen hat. Nicht daß der Bayes diese Email aussortiert hat. Wichtig: Es sind immer alle Regeln dafür zuständig. Niemals nur Eine.
Selbes Problem wie oben ich drücke mich unverständlich aus.

Code:
sa-learn --backup > backup.dat
Das habe ich gesucht, aber um generell backups zu machen, nicht für die Umstellung.

Huschi said:
Mehr Admin-Aufwand beim Einrichten.
...und vorallem: SA ist dann auf MySQL angewiesen, bzw. der Bayesfilter arbeitet nur bei laufenden MySQL-Server.
Mein Exim und mein Courier arbeiten mit MySql zusammen von daher macht das für mich keinen Unterschied ob jetzt der Spamassassin auch nicht geht.

Huschi said:
An einen Performance-Sprung glaube ich nicht da die BerkleyDB relativ flott ist und für die gespeicherten Tokens vollkommen ausreicht.
Darauf habe ich spekuliert, denn beim Exim und Courier hat das einiges gebracht. Ging mir dabei in erster Linie um das einfache Administrieren. Cocoamysql ist doch viel komfortabler als auf der Kommandozeile Dateien zu
editieren.

Um zu dem Kern meiner Fragen zurück zu kommen. Ich habe vermutet, dass der Byesfilter nicht greift. Warum ich das nicht gleich geschrieben habe, weiß ich nicht.
So nach eingehendem greppen meiner syslog muss ich feststellen, dass kein Bayes-Filter (gegreppt nach "BAYES") anschlägt. Spammails von denen die ständig kommen kommen hat er eigentlich bekommen zum anlernen.

Welche Ursachen könnten dafür noch Verantwortlich sein?

Was ich vergessen habe meine Conf folgt. Ich habe jetzt keinen Key dabei.
 
Last edited by a moderator:
Um zu dem Kern meiner Fragen zurück zu kommen. Ich habe vermutet, dass der Byesfilter nicht greift. Warum ich das nicht gleich geschrieben habe, weiß ich nicht.
Ich auch nicht.
Aber der Kern ist ja wirklich ein ganz Anderer... :)

Code:
sa-learn --dump magic

PS: Und hast Du SA/Bayes global oder pro User konfiguriert?

huschi.
 
Code:
sa-learn --dump magic
0.000          0          3          0  non-token data: bayes db version
0.000          0       2702          0  non-token data: nspam
0.000          0        173          0  non-token data: nham
0.000          0     120028          0  non-token data: ntokens
0.000          0 1114283077          0  non-token data: oldest atime
0.000          0 1168448038          0  non-token data: newest atime
0.000          0          0          0  non-token data: last journal sync atime
0.000          0 1168404554          0  non-token data: last expiry atime
0.000          0   22118400          0  non-token data: last expire atime delta
0.000          0      79550          0  non-token data: last expire reduction count

Huschi said:
PS: Und hast Du SA/Bayes global oder pro User konfiguriert?
Keine Ahnung vermutlich per User, wenn du mich so fragst. Ich habe aber alles anlernen mit root gemacht und gescannt wird als Benutzer Debian-exim. Wie ändere ich das? Nochmals anlernen wird schwierig. Ich war so schlau mir die spammails wieder löschen so lassen nach dem anlernen.
 

Attachments

Last edited by a moderator:
Hallo!

Anhand Deiner local.cf würde ich sagen, daß die Byesdatenbank Zentral für alles genutzt wird. Was steht denn in Deiner /etc/sysconfig/spamd (kann ggf auch /etc/sysconfig/spamassassin sein)?

Gruß flyingoffice
 
Anhand Deiner local.cf würde ich sagen, daß die Byesdatenbank Zentral für alles genutzt wird. Was steht denn in Deiner /etc/sysconfig/spamd (kann ggf auch /etc/sysconfig/spamassassin sein)?

Ich habe Debian, so ein Verzeichnis/Datei habe ich nicht.

Code:
ls /etc/spamassassin/
FuzzyOcr.cf  FuzzyOcr.cf.real  FuzzyOcr.words  init.pre  local.cf  sa-update-keys  v310.pre  v312.pre
Such dir was aus... andere Dateien für spamassassin habe ich nur in /var/lib/ und in /usr/share/doc
 
Hallo Tobster!

Sorry, ich habe suse und da werden die Configs anders abgelegt. Aber es findet sich immer ein kompetenter Ansprechpartner im Chat den man fragen kann. Man sieht, es lohn sich immer mal vorbei zu schauen. Unter Debian solltes Du die entsprechende Datei unter /etc/default/spamassassin finden (spamassassin ist die Datei). Dort werden die Startparameter für spamd definiert. Poste doch mal deren Inhalt bitte.

Gruß flyingoffice
 
Last edited by a moderator:
Nicht sorry du sondern sorry ich. Ich hätte mich nicht so ruppig ausdrücken müssen. Und vorher stand auch nicht da.


Code:
# /etc/default/spamassassin
# Duncan Findlay

# WARNING: please read README.spamd before using.
# There may be security risks.

# Change to one to enable spamd
ENABLED=1

# Options
# See man spamd for possible options. The -d option is automatically added.

# SpamAssassin uses a preforking model, so be careful! You need to
# make sure --max-children is not set to anything higher than 5,
# unless you know what you're doing.

OPTIONS="--create-prefs --max-children 5 --helper-home-dir"

# Pid file
# Where should spamd write its PID to file? If you use the -u or
# --username option above, this needs to be writable by that user.
# Otherwise, the init script will not be able to shut spamd down.
PIDFILE="/var/run/spamd.pid"

# Set nice level of spamd
#NICE="--nicelevel 15
 
Die Lösung war
Code:
OPTIONS="--create-prefs --max-children 5 --helper-home-dir --nouser-config"

Dadurch wird die nur die allgemeine Einstellung in der local.cf verwendet. Achso und daran denke es müssen mindestens 200 Ham sein!

Die Lösung konnte durch Benutzung de Chattes sehr viel schneller gefunden werden.
 
Last edited by a moderator:
Back
Top