Frank Clausen
New Member
Hallo.
Unser Server läuft zwar (gerade), aber bei täglichen Abstürzen kann man wohl von Notfall sprechen.
Ich versuche mal alles detailreich zu schildern und hoffe, dass jemand von Euch weiterhelfen kann, ich bin da ziemlich verzweifelt.
Kurzinfo: Unser Server bei 1und1 stürzt zwischen täglich und alle drei Tage ab. Ping geht noch, sonst nichts (also auch kein SSH)
Erst ein paar Daten:
Suse 9.3
Linux 2.6.14.3-051207a
CPU: AuthenticAMD, AMD Opteron(tm) Processor 148
PLESK: psa v7.5.4_build75051209.14 os_SuSE 9.3
Samba (aktuell)
MySQL, PHP
ImageMagick
Seit einiger Zeit stürzt der Server ohne weitere Vorwarnung ab. Erst haben wir das Samba in die Schuhe geschoben, denn wir mounten die Festplatte eines zweiten 1und1 Servers, um dort auf Daten zuzugreifen (intensiv). Im /var/log/messages log traten regelmässig "SMBFS timed out" Fehlermeldungen auf, die anzeigten, dass Samba die Daten nicht schnell genug finden und ausliefern konnte. Wir haben dann auf Rat im Netz den Zugridd auf CFIS umgestellt, was die Fehlermeldungen nun beseitigt hat (und die Daten auch wieder zeitgerecht ausliefert).
Nur leider bleiben die plötzlichen Abstürze bestehen.
Im log gibt es nun keinerlei Vorwarnung, die ein Indikator wäre. Anpingen kann man den Rechner dann noch, allerdings kommt man weder über Plesk oder SSH noch an den Rechner ran, also hilft nur die Recovery Konsole bei 1und1, was mir jedesmal einen Schauer über den Rücken laufen lässt.
Wenn ich mir die Serverauslastung ansehe, dann kann ich nichts verdächtiges feststellen, der dümpelt (wenn nicht gerade ein convert Prozeß bei ImageMagick läuft) so zwischen 3 und 20 Prozent.
Uns gehen nun die Ideen aus, wie man noch weiter analysieren kann, was diesen Fehler verursacht.
Ich wäre sehr dankbar, wenn Ihr Serverprofis mir Ratschläge geben könntet, eventuell Handlungsanweisungen zur Bestimmung der Fehlerquelle.
Über jede hilfreiche Antwort würde ich mich sehr freuen, ich möchte mal wieder nen Tag Urlaub haben... ;(
Danke,
Frank
Unser Server läuft zwar (gerade), aber bei täglichen Abstürzen kann man wohl von Notfall sprechen.
Ich versuche mal alles detailreich zu schildern und hoffe, dass jemand von Euch weiterhelfen kann, ich bin da ziemlich verzweifelt.
Kurzinfo: Unser Server bei 1und1 stürzt zwischen täglich und alle drei Tage ab. Ping geht noch, sonst nichts (also auch kein SSH)
Erst ein paar Daten:
Suse 9.3
Linux 2.6.14.3-051207a
CPU: AuthenticAMD, AMD Opteron(tm) Processor 148
PLESK: psa v7.5.4_build75051209.14 os_SuSE 9.3
Samba (aktuell)
MySQL, PHP
ImageMagick
Seit einiger Zeit stürzt der Server ohne weitere Vorwarnung ab. Erst haben wir das Samba in die Schuhe geschoben, denn wir mounten die Festplatte eines zweiten 1und1 Servers, um dort auf Daten zuzugreifen (intensiv). Im /var/log/messages log traten regelmässig "SMBFS timed out" Fehlermeldungen auf, die anzeigten, dass Samba die Daten nicht schnell genug finden und ausliefern konnte. Wir haben dann auf Rat im Netz den Zugridd auf CFIS umgestellt, was die Fehlermeldungen nun beseitigt hat (und die Daten auch wieder zeitgerecht ausliefert).
Nur leider bleiben die plötzlichen Abstürze bestehen.
Im log gibt es nun keinerlei Vorwarnung, die ein Indikator wäre. Anpingen kann man den Rechner dann noch, allerdings kommt man weder über Plesk oder SSH noch an den Rechner ran, also hilft nur die Recovery Konsole bei 1und1, was mir jedesmal einen Schauer über den Rücken laufen lässt.
Wenn ich mir die Serverauslastung ansehe, dann kann ich nichts verdächtiges feststellen, der dümpelt (wenn nicht gerade ein convert Prozeß bei ImageMagick läuft) so zwischen 3 und 20 Prozent.
Uns gehen nun die Ideen aus, wie man noch weiter analysieren kann, was diesen Fehler verursacht.
Ich wäre sehr dankbar, wenn Ihr Serverprofis mir Ratschläge geben könntet, eventuell Handlungsanweisungen zur Bestimmung der Fehlerquelle.
Über jede hilfreiche Antwort würde ich mich sehr freuen, ich möchte mal wieder nen Tag Urlaub haben... ;(
Danke,
Frank