Supergau... Hilfe?!

  • Thread starter Thread starter Deleted member 11691
  • Start date Start date
D

Deleted member 11691

Guest
Hallo,

ich habe keine Ahnung wie das passieren konnte.

Ich habe von einem Proxmox Node alle OpenVZ-Container auf einen anderen Proxmox Node migriert.

Der Aufbau ist wie folgt:

In jedem Server 4 Festplatten der genau selben Bauart. Ein Software-RAID 10 über die 4 Festplatten und am Software-RAID dann ein DRBD, wo dann ein LVM drauf ist. Funktionierte noch super. Jetzt ist folgendes Problem eingetreten:

Nach der Migration hat ein Container nicht mehr gestartet mit der Fehlermeldung "Cannot allocate memory". Ich habe den Container dann per Hand gestartet und dieser hat dann auf allen Kernen 100% Auslastung benutzt (IO). Allerdings nicht normale IO sondern ein wget... Und das auch nicht einmal sondern mehrere tausend Male...

Ich habe den Server darauf hin nichtmal mehr mit reboot -f rebooten können und musste ihn mit reboot -ndf sofort neustarten. Auch ein "sync" hat davor nichts gebracht (genau im Gegenteil, es hat sich sogar aufgehängt)...

Jetzt ist das Problem: Ich kann mein LVM nicht mehr mittels "mount /var/container/" mounten. Es passiert _überhaupt_nichts_ ... Außer eben, dass sich der Befehl einfach komplett aufhängt und zu einem Zombie wird...

cat /proc/drbd sehen auch OK aus. Sowie "vnstat -l -i bond0" (keine Aktivität). Ein lvscan -v zeigt mir meine aktive /dev/storage/ovz-glowstone Partition die ich aber auch nicht mittels "mount /dev/storage/ovz-glowstone /mnt" mounten kann (selber Effekt wie oben).

Das heißt nun, dass ich die Container alle auf dem anderen Node starten muss. Nun kommt aber noch ein Problem: Der Server, den ich hart neugestartet habe, hat das DRBD am anderen Server crashen lassen und dort ist jetzt auch nichts mehr zu gebrauchen.

Die smartwerte (mittels smartctl -a /dev/sd[abcde] ausgelesen) sehen auch in Ordnung aus. Genauso wie das Software-RAID, das unter /proc/mdstat keine Auffälligkeiten zeigt ("[UUUU]").

http://munin.dlserver.eu/dlserver.eu/glowstone.dlserver.eu/index.html
Benutzername: *******
Passwort: ************

Ich bin für jede Hilfe dankbar.
 
Last edited by a moderator:
So...

Nachdem ich auf dem anderen Server nachgeschaut habe, ist mir aufgefallen, dass dort das genau selbe ext4-Verzeichnis gemountet war und Proxmox mag ja bekanntlich kein OCFS2, wodurch ich also ein Verzeichnis gemountet habe, das von beiden Seiten gleichzeitig beschrieben aber nie repliziert wurde. Habe das Problem behoben, indem ich vom anderen Server auf diesen hier alles repliziert habe und es läuft wieder :-)
 
Wenn das Problem gelöst ist würde ich die Logindaten oben aber wieder löschen. Hätte ich eh nie ins Forum gepackt ;)
 
Ach, die sind nebensächlich. Werden eh bald wieder erneuert. Stehen ja inzwischen schon fast überall :D
 
Back
Top