QMail stürzt grundlos ab

Jollitop

Registered User
Hallo,

ich habe seit einiger Zeit ein seltsames Problem: Und zwar endet manchmal der QMail-Prozess ohne ersichtlichen Grund. Ich merke das meistens erst daran, dass keine Mails mehr ankommen, die eigentlich verschickt werden sollten. Es ist keine Regelmäßigkeit zu erkennen.

Wenn ich im Webmin den Prozess wieder starte, ist alles "normal", d.h. die Warteschlange wird abgearbeitet und das Ding läuft auf unbestimmte Zeit wieder.

Wie kann ich herausfinden, wo das Problem liegt? Gibt es ggf. die Möglichkeit, per Crontab einen Job einzurichten, der so alle 15 Minuten prüft, ob QMail noch läuft und - falls nicht - neu startet? Wie würde so ein Skript aussehen?

Mit bestem Dank für Eure Antworten,
Jochen
 
Hi,

eine imho gute Möglichkeit, abstürzende Prozesse wieder zu starten, ist init: Schreib Deine qmail-Start-Kommandozeile mit in die /etc/inittab, und zwar auf folgende Art und Weise:

Code:
qmail:12345:respawn: /var/qmail/bin/qmail-send

Evtl. musst Du die Parameter von qmail-send noch etwas anpassen...

Wobei es natürlich eleganter wäre, den Grund für die Qmail-Abstürze herauszubekommen- so ist es nämlich immer nur ein Herumdoktern am Symptom!
 
Hallo,

um das eigentliche Problem, das abschalten von qMail, zu erkennen, müsstest du mal in den Logs nachschauen.

Code:
/var/log/mail.info
/var/log/mail.error

Man sollte ja sehen können zu welcher Uhrzeit das letzte Lebenszeichen gekommen ist von qMail, und die Uhrzeit einfach mal weiter verfolgen in den anderen Logs um zu sehen was passiert ist.

Eventuell einfach hier veröffentlichen die Zeitbereiche.
 
Mmh,

danke erstmal für die vielen schnellen Antworten.

Die /var/log/mail.err hat nur zwei uralte Einträge.

Der letzte Eintrag in der /var/log/mail.warn ist:
Oct 23 15:29:31 s11111111 qmail: 1161610171.670905 warning: unable to utime local/17/16818974; message will be retried too soon

Die /var/log/mail.info ist zu diesem Zeitpunkt ganz interessant (oder nicht?):
Oct 23 15:25:02 s11111111 qmail: 1161609902.931631 delivery 14550: success: did_0+1+0/qp_25623/
Oct 23 15:25:02 s11111111 qmail: 1161609902.931778 status: local 0/10 remote 1/20
Oct 23 15:25:02 s11111111 qmail: 1161609902.931908 end msg 16818975
Oct 23 15:25:03 s11111111 qmail: 1161609903.116212 delivery 14551: success: 212.227.15.167_accepted_message./Remote_host_said:_250_Message_0MKwtQ-1GbznZ2o0k-
0007Qv_accepted_by_mrelayeu2.kundenserver.de/
Oct 23 15:25:03 s11111111 qmail: 1161609903.116428 status: local 0/10 remote 0/20
Oct 23 15:25:03 s11111111 qmail: 1161609903.116560 end msg 16820034
Oct 23 15:29:31 s11111111 qmail: 1161610171.671224 status: exiting

Der hat anscheinend einfach aufgehört!? Danach der Neustart von heute Morgen mit den Queue, die er abgearbeitet hat...

Hilft Euch das beim Helfen weiter? :o
 
Hallo Jollitop,

da ich dein System nicht kenne kann ich dir leider nur hypotetisch antworten.

Aber solltest du ein PLESK System nutzen, welches ja bekannterweise auch mit qmail arbeitet, dann würde ich mal tippen, dass dein WatchDog den Dienst abschmieren lässt.

Verhindern kannst du das, indem du den qmail-Check im WatchDog rausnimmst, denn der Watchdog prüft ob qmail läuft, bekommt manchmal aber eine fehlerhafte Antwort von qmail und versucht ihn dann zu starten (obwohl er ja schon läuft).
Das mag der qmail-Dienst nicht und streikt.

Sollte das ganze nichts mit PLESK zu tun haben, dann vergiss es einfach ;)

Aber für die Zukunft:
Direkt von vornherein mehr Informationen zum System angeben.
->OS, Software, evtl. Hoster, Log-File-Auszüge, etc.

Lieben Gruß
Free
 
Back
Top