mdadm klappt nicht, disabling device

Domi

Member
Hallo Leute, ich habe da ein sehr komisches Phänomen. Gestern gab es hier im Dorf einen Stromausfall und mein HP ProLiant war aus. Nachdem ich ihn neu gestartet hatte, gab es beim Bootvorgang die Information das es Probleme mit 'md0' gäbe.

Ich hatte dann mit re-assamble versucht das RAID 5 wiederherzustellen, klappte aber nicht. Gut, die Daten werden mir das Leben jetzt nicht zur Hölle machen weil sie weg sind... also habe ich die Partitionstabellen neu erstellt, auch die Partitionen habe ich angelegt und das RAID 5 neu aufbauen lassen.
Code:
mdadm --create /dev/md0 --auto md --level=5 --raid-devices=4 /dev/sda1 /dev/sdb1 /dev/sdc1 /dev/sdd1

Das funktionierte auch problemlos, allerdings stoppte der Prozess mit folgender Meldung...
Code:
2017 Jun 18 18:03:09 server md/raid:md0: Disk failure on sdb1, disabling device.\x0amd/raid:md0: Operation continuing on 2 devices.
2017 Jun 18 18:03:20 server Fail event detected on md device /dev/md0, component device /dev/sdb1

Da der kleine Server Einschübe für die Festplatte hat, hab ich die Festplatten mal umgetauscht, aber laut dem Bericht wird immer sdb disabled und ich weiß nicht wieso. Via Google hatte ich schon gesucht, es wurde vom Energiesparmodus der Festplatten gesprochen, der ist aber bei mir nicht eingerichtet.

Es handelt sich bei meinem kleinen Server im Keller um ein Ubuntu 14.04 LTS, falls das noch hilfreich ist. Hat jemand von euch schon mal solch ein Phänomen gehabt, werden noch Infos benötigt? Wie finde ich denn jetzt am besten heraus was da nicht stimmt und wie baue ich mein RAID 5 wieder auf?

Gruß, Domi
 
Bist du dir sicher, dass du die richtige Festplatte gezogen hast?
"sdb" muss nicht zwingend der zweite Schacht sein...
Hol dir mal mit "smartctl -a /dev/sdb" die Seriennummer der Festplatte und prüfe diese gegen.
Falls das Gerät nicht mehr da ist, hole dir die Seriennummern der anderen Festplatten und prüfe damit, dass du definitiv die richtige Festplatte in der Hand hälst.
 
Moin moin, sorry für die späte Rückmeldung... Ich hatte die Seriennummern gegengeprüft. Das war sogar einer der ersten Punkte um sicher zu stellen, dass die richtigen HDDs abgezogen werden.

Allerdings hab ich DA noch nicht bemerkt, dass zwei von vier Festplatten defekt sind. Als ich die Geräuschkulisse hier bei mir etwas runter gedreht habe, also Ton am Fernseher aus etc. hab ich dann auch beim Bootvorgang gehört, dass eine HDD echt gemeine Geräusche macht. Also schritt für schritt alle raus, und einzeln eingebaut um zu horchen welche Geräusche macht.

Zwischendurch machen sie nicht nur handelsübliche Geräusche wie eine Festplatte die arbeitet (wobei alle Festplatten die ich habe dagegen leise sind), macht sie auch ab und an mal "klick" und startet neu, oder eben gar nicht.

Das habe ich aber auch erst relativ spät heraus gefunden, da ich zwischenzeitlich noch gearbeitet habe.

Gruß, Domi
 
Also schritt für schritt alle raus, und einzeln eingebaut um zu horchen welche Geräusche macht.
Ob für Keilriemen beim Auto, Lüfter-Lagerschaden oder eine unruhige Festplatte - ein Sück (Garten)schlauch kann als Stethoscope-Ersatz für das Abhorchen genutzt werden.

, macht sie auch ab und an mal "klick" und startet neu, oder eben gar nicht.
Das könnte ein Schaden an der Festplatte oder eine unzureichende Stromversorgung sein. Von Controllerschaden über Drehgeschwindigkeit bis zu Headcrash kann alles Mögliche die Ursache sein, hier mal ggf SMART auslesen und einen self-test draufjagen um die konkrete Ursache hoffentlich zu finden.
 
Moin moin, den SMART Test kann man ja als kleine Variante ausführen und dann einmal als große Variante, wo man hinterher mit einem weiteren Parameter das Log File ausgeben kann. Das hat allerdings nicht geklappt, weil das device wieder irgendwann weg war.

Die Festplatte hatte ich in meiner Docking-Station getestet und auch dort hatte sie dann Geräusche gemacht. Auf die Idee mit dem Stethoskop bin ich allerdings nicht gekommen :D

Ich habe jetzt die Festplatten wegen Garantie (die besteht noch für grob 4 Wochen) eingeschickt und sehe, was zurück kommt.
 
So, ich wollte mich auch noch einmal melden und ein Feedback geben. Die Festplatten gingen ja aufgrund der restlichen Garantie an WD zurück und gestern sind zwei neue 3TB Festplatten geliefert worden. Ich hab jetzt noch nicht genauer in die Papiere geguckt, aber da die Seriennummern neu sind, gehe ich halt davon aus das die anderen beiden defekt waren und nun getauscht worden sind.

Habe mich nun aber parallel dazu entschlossen, 1x RAID 1 (2x 3TB, 2x 6TB) zu fahren. So kann ich Server-intern die Daten hin und her schaufeln die wichtig sind ohne dass gar nichts mehr geht. Zusätzlich hat mein kleiner HP MicroServer eine USV von APC bekommen die via USB angeschlossen wurde und laut "status" sogar erkannt wurde :)

Allerdings hätte ich noch eine kleine Frage bezüglich dem RAID nach einer Neuinstallation. Kann man die 'mdadm' RAID System neu einbinden, ohne "create" zu verwenden? Es geht mir dabei nur um die Synchronisation oder eventuellem Datenverlust.

Gruß, Domi
 
Allerdings hätte ich noch eine kleine Frage bezüglich dem RAID nach einer Neuinstallation. Kann man die 'mdadm' RAID System neu einbinden, ohne "create" zu verwenden? Es geht mir dabei nur um die Synchronisation oder eventuellem Datenverlust.

Mit create erstellst du einen neuen RAID-Verbund, der vorher nicht existiert hat. Wenn du einen vorhandenen einbinden willst, dann verwendest du IIRC assemble. Oder was willst du wissen?
 
Nabend, also aktuell habe ich im Keller meinen MicroServer mit Ubuntu 14.04 stehen. Ich könnte ein 'do-release-upgrade' machen, da sich aber hier und da schon mal Plunder angesammelt hat, würde ich gerne ein Ubuntu 16.04 komplett neu installieren.

Die bereits vorhandenen und vollständig existierenden RAID möchte ich dann einfach so übernehmen ohne Daten zu verlieren.

Den Befehl 'mdadm --assemble' hatte ich auch gesehen, ging aber eher davon aus das der nur zum scannen oder bearbeiten von einem bereits eingebundenen RAID ist.
 
mdadm --assemble für ein vorhandenes RAID dem laufenden System hinzu. Sofern die Platten beim Booten schon angeschlossen waren und die Partitionen den richtige Typ (Linux Raid Autodetect) haben, übernimmt der Kernel das für dich automatisch (z.B. notwendig, wenn die Root-Partition auf einem MD-Raid liegt).
 
Moin moin und vielen dank schon mal für diese Information.

Also ich habe '/' und '/boot' zwar separaten Partitionen zugewiesen, diese sind aber unabhängig von den Daten Platten. In meinem kleinen HP ProLiant sind fünf Festplatten drin.
- SSD (root + /boot)
- 2x 3TB HDD '/srv/md0'
- 2x 6TB HDD '/srv/md1'

Irgendwo hatte ich mal gelesen (ist schone in paar Jahre her), dass es Sinn macht root und /boot zu trennen und daran hab ich mich die Jahre immer gehalten. Die RAID 1 Laufwerke habe ich dann einfach unter /srv in separate Verzeichnisse gemountet und fertig war der Spaß.

So kann ich beruhigt am System selbst schrauben, ohne das ich Probleme mit meinen Daten habe / bekomme :) Von daher gehe ich mal aus dass das alles passt. Dann kann ich die 4 HDDs vom System trennen, Ubuntu mal ganz frisch, neu und sauber aufsetzen, später die HDDs wieder einsetzen und mein RAID einfach mit 'mdadm --assemble' aktivieren und mounten.

Gruß, Domi
 
Irgendwo hatte ich mal gelesen (ist schone in paar Jahre her), dass es Sinn macht root und /boot zu trennen und daran hab ich mich die Jahre immer gehalten.

Bei aktuellen Systemen in der Regel nicht mehr notwendig. Früher mußte der Boot-Loader und der Kernel ziemlich zu Beginn der Platte liegen, damit das BIOS des Rechners darauf zugreifen konnte (mit fällt das spontan die 2GB-Grenze ein, die es zu IDE-Zeiten mal gab).

So kann ich beruhigt am System selbst schrauben, ohne das ich Probleme mit meinen Daten habe / bekomme :) Von daher gehe ich mal aus dass das alles passt. Dann kann ich die 4 HDDs vom System trennen, Ubuntu mal ganz frisch, neu und sauber aufsetzen, später die HDDs wieder einsetzen und mein RAID einfach mit 'mdadm --assemble' aktivieren und mounten.

Wenn der Partitionstyp auf deinen HDDs richtig gesetzt ist, sollte der Linux-Kernel das "Assemblen" für dich automatisch übernehmen.
 
Back
Top