yoyo
Registered User
Hallo,
ich habe mir vor 2-3 Tagen einen zusätzlichen Server bei Leaseweb besorgt. So weit so gut, dass die Herren kein Rescuesystem etc. haben sollte bekannt sein. Also ist vorsicht angesagt!
Nun lief die Kiste 2 Tage ohne Probleme zu meiner vollen zufriedenheit. Heute morgen, um ca. 6:00 verabschiedete sich das Ding dann aber. Habe es dann (Langschläfer! ) gegen 12 bemerkt und habe ihn neugestartet. 10 Minuten (fsck vermutlich...) später war er dann wieder da. Natürlich ab in /var/log und alles durchforstet. Zu meiner Enttäuschung musste ich aber feststellen, dass der komplette Server einfach hängen geblieben ist. Keine Messages in den Logs etc. einfach zack, weg.
Dann habe ich erstmal smartctl ausgepackt und musste Feststellen, dass die blöde Hitachi-Platte kein S.M.A.R.T. kann. Gut. "badblocks" laufen lassen, was mir immerhin gesagt hat, dass es keine fehlerhaften Blöcke gefunden hat.
Habe ihn dann einfach mal weiter laufen lassen... ("Wird schon nicht so schlimm gewesen sein ")... Tja. Jetzt, eben, gegen 18:00 ist das gleiche wieder passiert. Zack, Bumm. Die Kiste ist weg. Wieder nichts in den Logs etc. kein auffällig hoher Load.
Interessant find ich die zeitliche parallele zwischen den beiden Abstürzen. Habe mal in die Crons geguckt und konnte aber nichts finden, was zu dieser Zeit aufgerufen wird, bzw. was an einem Hänger schuld sein könnte.
Da ich bei Leaseweb kein Rescuesystem habe, kann ich auch kein memtest durchführen. Oder geht das mit irgendwelchen kniffen auch im Betrieb?
Die Leute von Leaseweb habe ich bereits angeschrieben, ob sie meine Kiste nach Hardwarefehlern durchsuchen könnten. Sie meinten, dass das kostenlos wäre, wenn sie welche finden. Wenn nicht, darf ich blechen. (Holländer halt! )
Habt ihr noch ne Idee, was ich überprüfen könnte etc?
Gruß,
Johannes
ich habe mir vor 2-3 Tagen einen zusätzlichen Server bei Leaseweb besorgt. So weit so gut, dass die Herren kein Rescuesystem etc. haben sollte bekannt sein. Also ist vorsicht angesagt!
Nun lief die Kiste 2 Tage ohne Probleme zu meiner vollen zufriedenheit. Heute morgen, um ca. 6:00 verabschiedete sich das Ding dann aber. Habe es dann (Langschläfer! ) gegen 12 bemerkt und habe ihn neugestartet. 10 Minuten (fsck vermutlich...) später war er dann wieder da. Natürlich ab in /var/log und alles durchforstet. Zu meiner Enttäuschung musste ich aber feststellen, dass der komplette Server einfach hängen geblieben ist. Keine Messages in den Logs etc. einfach zack, weg.
Dann habe ich erstmal smartctl ausgepackt und musste Feststellen, dass die blöde Hitachi-Platte kein S.M.A.R.T. kann. Gut. "badblocks" laufen lassen, was mir immerhin gesagt hat, dass es keine fehlerhaften Blöcke gefunden hat.
Habe ihn dann einfach mal weiter laufen lassen... ("Wird schon nicht so schlimm gewesen sein ")... Tja. Jetzt, eben, gegen 18:00 ist das gleiche wieder passiert. Zack, Bumm. Die Kiste ist weg. Wieder nichts in den Logs etc. kein auffällig hoher Load.
Interessant find ich die zeitliche parallele zwischen den beiden Abstürzen. Habe mal in die Crons geguckt und konnte aber nichts finden, was zu dieser Zeit aufgerufen wird, bzw. was an einem Hänger schuld sein könnte.
Da ich bei Leaseweb kein Rescuesystem habe, kann ich auch kein memtest durchführen. Oder geht das mit irgendwelchen kniffen auch im Betrieb?
Die Leute von Leaseweb habe ich bereits angeschrieben, ob sie meine Kiste nach Hardwarefehlern durchsuchen könnten. Sie meinten, dass das kostenlos wäre, wenn sie welche finden. Wenn nicht, darf ich blechen. (Holländer halt! )
Habt ihr noch ne Idee, was ich überprüfen könnte etc?
Gruß,
Johannes