Serverabstürz / Logfile auswertung

Steini1980

New Member
Hallo,

mein Mailserver ist heute zweimal abgestürzt, also das ganze SUSE Linux 10.1 hat sich komplett aufgehängt!

Die Kiste läuft schon seit ca. 6 Monaten und hat zuvor noch nie Probleme gemacht. Laut den Logfiles konnte ich nichts außergewöhnliches Feststellen, lt. einigen Tests hat die Kiste auch kein offenes Relay und steht sonst relativ sicher hinter einer Firewall. Es sind eigentl. nur die Ports für den Mailserver, HTTP und FTP geöffnet. Derzeit fungiert die Maschine allerdings nur als Mailserver, dementsprechend waren die Logs vom Apache und FTP ziemlich leer:)

Da ich jetzt nicht unbedingt so der Mailserver-Experte bin habe ich mal den letzten Abschnitt vor dem Abstürz aus dem Logfile kopiert. Vielleicht kann mir jemand mehr dazu sagen und ob es damit zutun haben könnte. Alle anderen Logfiles scheiden eigentlich aus.
 

Attachments

Last edited by a moderator:
Was konkret heißt "komplett aufgehängt"?

  • Wie genau äußerte sich das Problem?
  • War der Rechner noch per ping oder ssh zu erreichen?
  • Wie lange dauerte das Problem an, bevor Du was unternommen hast?
  • Was hast Du unternommen, um das Problem zu lösen?
In dem kleinen Ausschnitt aus den Mail-Logs kann man nichts erkennen. Ich kann mir aber auch nicht so ganz vorstellen, dass das Mailsystem, das nicht wirklich stark mit dem Betriebssystem verwoben ist, den Rechner komplett zum Absturz bringen kann.
Was genau steht in /var/log/messages?

Viele Grüße,
LinuxAdmin
 
Also heute Morgen Stand die Kiste ca. 30-45 Min. bis ich was unternommen habe, heute Nachmittag ca. 10 Min. Ich konnte weder über IMAP, HTTP, FTP, SSH (nur im lokalen Netz möglich) zugreifen. Er hat sich aber Pingen lassen. Am Rechner direkt hat sich der Anmeldebildschirm auch aufgehängt, ich musste den Resetknopf am Gehäuse drücken.

Kann mir auch nicht so richtig vorstellen das es am Mailserver liegt, aber alles andere hatte ich ja eigentlich schon ausgeschlossen und die Hardware habe ich auch schon getestet.

Hier meine /var/log/messages/ bis kurz vor dem Absturz, es sieht aber den ganzen Tag nicht anders aus:

Code:
Oct 25 14:39:01 linux2 /usr/sbin/cron[12260]: (root) CMD (/root/confixx/confixx_counterscript.pl)
Oct 25 14:40:01 linux2 /usr/sbin/cron[12268]: (root) CMD (/root/confixx/confixx_counterscript.pl)
Oct 25 14:41:01 linux2 /usr/sbin/cron[12271]: (root) CMD (/root/confixx/confixx_counterscript.pl)
Oct 25 14:42:01 linux2 /usr/sbin/cron[12275]: (root) CMD (/root/confixx/confixx_counterscript.pl)
Oct 25 14:43:01 linux2 /usr/sbin/cron[12278]: (root) CMD (/root/confixx/confixx_counterscript.pl)
Oct 25 14:44:01 linux2 /usr/sbin/cron[12282]: (root) CMD (/root/confixx/confixx_counterscript.pl)
Oct 25 14:45:01 linux2 /usr/sbin/cron[12287]: (root) CMD (/root/confixx/confixx_counterscript.pl)
Oct 25 14:46:01 linux2 /usr/sbin/cron[12317]: (root) CMD (/root/confixx/confixx_counterscript.pl)
Oct 25 14:47:01 linux2 /usr/sbin/cron[12330]: (root) CMD (/root/confixx/confixx_counterscript.pl)
Oct 25 14:48:01 linux2 /usr/sbin/cron[12333]: (root) CMD (/root/confixx/confixx_counterscript.pl)
Oct 25 14:49:01 linux2 /usr/sbin/cron[12336]: (root) CMD (/root/confixx/confixx_counterscript.pl)
Oct 25 14:50:01 linux2 /usr/sbin/cron[12358]: (root) CMD (/root/confixx/confixx_counterscript.pl)
Oct 25 14:51:01 linux2 /usr/sbin/cron[12361]: (root) CMD (/root/confixx/confixx_counterscript.pl)
Oct 25 14:52:01 linux2 /usr/sbin/cron[12365]: (root) CMD (/root/confixx/confixx_counterscript.pl)
Oct 25 14:53:01 linux2 /usr/sbin/cron[12369]: (root) CMD (/root/confixx/confixx_counterscript.pl)
Oct 25 14:54:01 linux2 /usr/sbin/cron[12372]: (root) CMD (/root/confixx/confixx_counterscript.pl)

Danke für deine Bemühungen!
 
in deinem Fall würde ich mal die Hardware testen, also zumindest so die üblichen Kandidaten dazu drüber laufen lassen: memtest86, burn${Prozessortyp}, badblocks (speziell das würdest du aber auch in den Syslogs sehen)...

Was und wie genau hast du denn die Hardware getestet?
 
Hallo,

bis auf meine Bootpartition hatte ich bereits alle Partitionen mit badblocks gechecked. Den Speicher habe ich mit einem Testtool auf einer älteren Mandrake CD getestet, im gegensatz zu Memtest dauert dort der Test nur wenige Minuten. Heute habe ichs nochmal mit Memtest versucht, musste aber nach 40 Minuten abbrechen, da ich den Mailserver nicht länger vom Netz nehmen konnte. Bis dorthin hatte er bereits 6 Tests absolviert und noch keine Fehler angezeigt.

Ich werde nächste Woche nochmal einen CPU-Test versuchen, evtl. auch mal mit Prime95, dein burn${} sagt mir überhaupt nichts / kenne ich nicht, werds mir aber mal genauer ansehen. Wenn das alles nichts bringt muss ich halt mal die Speicher austauschen und den Memtest auf einer Testmaschine durchführen, damit der Mailserver erreichbar bleibt.

Jedenfalls konnte ich bis jetzt den Fehler noch nicht lokalisieren, dass Problem ist aber Gott sei Dank auch nicht mehr aufgetreten.
 
Back
Top