Server bootet nicht mehr

fitti70

Blog Benutzer
Hallo,

mein Server bei Serverloft macht Probleme.
Heute morgen sind einige Dienste ausgefallen, ich konnte mich aber noch per SSH einloggen und einige Tests machen. Die Platte war nur noch im Lesemodus eingebunden, warum weiß ich nicht.
Defekte Blöcke oder ähnliches konnte ich nicht finden.
Ich wollte einen Neustart machen, aber das funktionierte nicht, auch nicht per Hard-Reboot.

Da ich davon ausging, dass es mit einem Kernel-Update vor einiger Zeit (ohne anschließeneden Reboot) zu tun haben könnte, loggte ich mich unter dem Recoversystem ein und änderte in der menu-lst von grub den Default-Kernel auf den älteren.

Außerdem führte ich ein grub setup aus, root (hd0,0) ->setup (hd0).

Jetzt geht gar nichts mehr, selbst das Recoverysystem lässt sich nicht mehr aktivieren.
Hat es mit meinen Änderungen zu tun?

[edit: Recovery-System läuft wieder, aber ich komme dem Fehler nicht auf die Spur. Die ****** Kiste startet einfach nicht im normalen Modus!]

Hat jemand eine Ahnung, was hier los sein könnte?

Es handelt sich übrigens um AMD64. In den Logeinträgen finden sich keine Hinweise, auch nicht bei aktiviertem Boot-Log.
:confused:

Grüße,

fitti
 
Last edited by a moderator:

djrick

Registered User
Ein neuer Kernel ist auf einem Serversystem immer kritisch. Hatte ich auch schon ein paar Mal. Sicher dass du den alten Kernel in Grub wieder aktiviert hast?
Hast du im Recoverymodus mal einen Filecheck laufen lassen auf der Platte?
Ansonsten wird dir wohl nur noch ein Ticket beim Anbieter helfen.
 

fitti70

Blog Benutzer
Der Support von Serverloft loggt sich nicht auf dem System ein. Man kann höchstens um einen Hardwaretausch bitten, aber dann muss man schon genau wissen, wo der Fehler liegt.

Ich habe sie gebeten, einen Blick auf die Dioden der Festplatte zu werfen, aber selbst das machen sie nicht. (3 Platten im Raid 5 System, normalerweise zeigen die Dioden Fehler im Raid-System an)

fsck und badblocks bringen keine Ergebnisse.

Der Server muss mit acpi=ht gebootet werden, auch das habe ich extra noch mal überprüft. Weder mit neuem, noch mit altem Kernel lässt sich die Kiste booten.

und das Merkwürdigste daran: Trotz aktivierter Bootlog gibt es keinen Eintrag in /var/log/boot
Wie ist das denn überhaupt zu erklären?
Ist es vielleicht, weil der Raid-Controller irgendwelche langen Checks macht oder Fehlermeldungen ausgibt und abbricht?
Gibt es eine Möglichkeit, diese möglichen Fehler auszulesen?

Grüße,
fitti
 

djrick

Registered User
und das Merkwürdigste daran: Trotz aktivierter Bootlog gibt es keinen Eintrag in /var/log/boot
Wie ist das denn überhaupt zu erklären?
Naja der Bootlog kann erst geschrieben werden wenn die Festplatte eingebunden wurde und darauf geschrieben werden kann. Wenn dein Server vorher sagen wir mit einer Kernel Panic abbricht, siehst du keine Einträge. Ich hatte zum Beispiel mal das falsche Netzwerkmodul, da hatte ich die selben Symtome.
Ist es vielleicht, weil der Raid-Controller irgendwelche langen Checks macht oder Fehlermeldungen ausgibt und abbricht?
Gibt es eine Möglichkeit, diese möglichen Fehler auszulesen?
Das ist durchaus möglich, aber das kannst du leider nur sehen wenn du einen Monitor dran klemmst und guckst was passiert. Bietet dein Hoster keine Serielle Konsole an? Wenn nur der Kernel nicht bootet brauchst du ja keinen Hardwaretausch.
 

fitti70

Blog Benutzer
Naja der Bootlog kann erst geschrieben werden wenn die Festplatte eingebunden wurde und darauf geschrieben werden kann. Wenn dein Server vorher sagen wir mit einer Kernel Panic abbricht, siehst du keine Einträge. Ich hatte zum Beispiel mal das falsche Netzwerkmodul, da hatte ich die selben Symtome.
Ja logisch!. Sorry, Brett vorm Kopf!
Das ist durchaus möglich, aber das kannst du leider nur sehen wenn du einen Monitor dran klemmst und guckst was passiert. Bietet dein Hoster keine Serielle Konsole an? Wenn nur der Kernel nicht bootet brauchst du ja keinen Hardwaretausch.
Serielle Konsole? Serverloft bietet eine IPMI Remote Console, aber die ist aus irgendwelchen Gründen (schon vorher) nicht erreichbar.

Arrrg. Ich werd' verrückt.
Wahrscheinlich ist es wirklich der Kernel, aber was kann ich tun?

Grüße,
fitti
 
Last edited by a moderator:

fitti70

Blog Benutzer
Ich habe den alten Kernel als deb-File gefunden.
Wie kann ich ihn nun vom Recover-System aus installieren.
Mit dpkg klappt das nicht, oder?
 

fitti70

Blog Benutzer
Oh oh..

Das mit dem Mounten kriege ich in, aber das chrooten in den Mountpoint... :confused:
Kannst du mir die Befehle dafür nennen? *duck


fitti
 

Mordor

Registered User
Normalerweise geht das mit dem Befehl
Code:
chroot /verzeichnis/in/das/du/chroten/willst
 

djrick

Registered User
Also sagen wir du willst die Festplatte (hda3) nach /mnt mounten....:

Code:
Festplatte mounten:
mount /dev/hda3 /mnt

Boot Mounten:
mount /dev/hda2 /mnt/boot

Chrooten:
chroot /mnt

...Operationen ausführen...

Chroot verlassen:
exit

Umounten:
cd /
umount /mnt/boot
umount /mnt

Danach: System neustarten und hoffen
hda2 + 3 sind jetzt natürlich nur fiktiv. Mit fdisk -l kannst du dir anzeigen lassen welche Partitionen du hast.
 

beam

New Member
Ist zwar ein wenig spät, aber wenn das ServerView/IPMI mal nicht geht, kann man es durch ein Script von Serverloft wieder zum laufen bringen, oder überhaupt initial konfigurieren. Insbesondere die Server die Server der ersten zwei Monate wurden ohne konfigurierten ServerView in Betrieb genommen. Danach kann man dann wenigsten auf die serielle Konsole gucken, die unter anderem auch das BIOS sichtbar macht.
Das Script sollte auch aus einem Rescue-/Recovery-System laufen, wenn man IPMI-Treiber geladen bekommt.
Man findet es unter http://mirror.intergenia.de/others/scripts/ipmiconfig.sh.
Die Daten, die man während des Scriptlaufs eingeben muss, sind im Admin-Panel von Serverloft zu finden.

ciao
Beam
 

redled

New Member
einen Blick auf die Dioden der Festplatte zu werfen
Du musst ganz schön verzweifelt gewesen sein. Allerdings sind die Schottky-Dioden tatsächlich eine häufige Fehlerquelle bei toten! Festplatten
Aber anschauen tut das beim Support niemand. Null! Die reißen selbst bei
einem defekten Speicher den ganzen Rechner raus.
 
Top