RAID 1 vs. RAID 5

consuli

Member
Hallo!

RAID-5 hat gegenüber RAID-1 ja den Vorteil, dass aus dem physische Bruttospeicherplatz der Platten mehr nutzbarer Nettospeicherplatz entsteht.

Vor einiger Zeit hat mir aber jemand erzählt, dass man Daten von einem defekten RAID-1 aufgrund der vollständigen Redundanz wesentlich einfacher retten kann (nämlich in etwa genau so wie von einer Festplatte ohne RAID) als von einem RAID-5, wo die Daten auf drei Festplatten verteilt sind. Dabei denke ich insbesondere an solche Fälle, bei denen der ganze RAID Verbund kaputt geht. Z.B. bei einem Wasserschaden kommt es regelmäßig vor, dass der RAID Controller erst noch wahllos wirres Zeug auf die Platten schreibt, bis er (endlich) ganz kautt geht.

Stimmt es, dass man Daten von einem DEFEKTEM RAID-1 Verbund einfacher (selbst) retten kann, als von einem DEFEKTEM RAID-5 Verbund?

Consuli
 
Last edited by a moderator:

elias5000

Site Reliability Engineer
Stimmt es, dass man Daten von einem DEFEKTEM RAID-1 Verbund einfacher (selbst) retten kann, als von einem DEFEKTEM RAID-5 Verbund?
Dazu lässt sich einfach feststellen: RAID ist kein Backup. Wenn dir das Ding so abschüsselt, dass der RAID-Verbund gegen die Wand fährt, dann hast du hoffentlich ein Backup. Wie viel du maximal verlieren magst, bestimmt dabei, wie oft du ein Backup deiner Kiste ziehst.

Zurück zum Thema: RAID schützt vor allem vor einem: Defekt von Bestandteilen des RAID. Da insbesondere vor defekten der Massenspeicher. Wenn man den alten Vergleich zum Auto heranzieht, dann sind die Festplatten sowas wie Bremsbeläge oder Kupplungsscheiben. Also Verschleißteile. Die gehen halt immer mal wieder kaputt und müssen ausgetauscht werden.
Das Ziel des RAID ist dabei, die Kiste am Laufen zu halten, während sie auf den Austausch der Hardware wartet. Für den Defekt des RAID (also den Zustand, dass das RAID selbst abgeschüsselt ist und nicht nur ein Bestandteil) hast ein Backup.

Die Frage ist also, welches RAID dir bei einem LW-Defekt das liefert, was du brauchst. Und da ist definitiv das RAID-1 im Vorteil, weil es ein 1:1-Spiegel ist. Im Fehlerfall hast du also nur eine Verringerung der Bandbreite für Lesezugriffe (weil nur von der hälfte der Platten gelesen werden kann - also z.B. zwei statt vier).
Das RAID-5 muss in dem Fall die fehlende Platte dadurch ersetzen, dass es die fehlenden Daten-Blöcke aus den Parity-Blöcken errechnen muss. Das ist mit erheblich geringerer Performance im Fall eines Laufwerksdefekts verbunden. Ich hatte mal einen (gar nicht mal so billigen) Root-Server für einen Kunden betreut, der bei einem Ausfall einer Platte des RAID-5 zwar noch lief aber die Performance war so eingebrochen, dass er faktisch offline war bis sowohl die Platte getauscht als auch das RAID den Resync fertig hatte. Bei einem RAID-1 hätte der Server vermutlich voll weiter funktioniert.

RAID-5 ist dann auch beim Wiederherstellen des RAID mit einer neuen Platte deutlich Ressourcen-intensiver, da nicht einfach Blöcke kopiert werden müssen, sondern die Parity-Blöcke neu errechnet.

RAID-1 und RAID-5 haben noch ein paar andere Unterschiede aber die haben weniger mit dem Fehlerfall zu tun als damit, auf wie viele Platten man gleichzeitig schreibt (weil Stripe-Set eben verteilt schreibt und Mirror im Schreiben keinen Vorteil gegenüber einer einzelnen Platte hat), aber das hat wenig mit dem Verhalten im Failure-Mode zu tun.
 
Last edited by a moderator:

IP-Projects.de

verifizierter Anbieter
Guten Morgen,

ich finde auf Wikipedia ist das Ganze sehr gut erklärt: https://de.wikipedia.org/wiki/RAID#RAID_01

Rein von der Datensicherheit her ist ein RAID 1 oder RAID 10 am besten. Es liefert die Beste Performance und ist zudem am Ausfallsichersten. Wir hatten in einem RAID 10 Verbund aus 8 Festplatten in der Tat den Fall, dass 3 Festplatten gleichzeitig ausgefallen sind. Glücklicherweise immer in einen der RAID 1 Arrays. RAID 5 oder RAID 6 setzen wir eigentlich nicht einmal mehr bei unseren Backupsystemen ein. Die Performance ist hier schlicht zu schlecht.

Man muss hier eben immer den Mittelweg zwischen Leistung, Sicherheit und benötigten Speicherplatz finden.
 

d4f

Müder Benutzer
RAID 5 oder RAID 6 setzen wir eigentlich nicht einmal mehr bei unseren Backupsystemen ein. Die Performance ist hier schlicht zu schlecht.
Das kann ich so nicht universal unterschreiben. Ich betreibe einen Raid-6 Backupserver mit 10 Festplatten und habe selbst wenn mehrere vHosts ihre LV-Backups mit Gbit rüberpumpen keine Performanceprobleme wobei man natürlich md1_raid6 schon recht oben in top findet. Deutlich ressourcenhungriger sind da die ganzen Deduplikationswerkzeuge auf vHost-Seite =)
Die Leistung fällt jedoch zugegeben recht stark wenn man nicht-sequentiell viele kleine Dateien liest, wie es bspw bei hardlinked datei-basierten Backups der Fall ist.

Auf einem Produktivsystem welches nicht als reiner und möglichst grosser Datenspeicher (NAS) zum Einsatz kommt würde ich allerdings in jedem Fall RAID1 oder RAID10 empfehlen - beim Supergau leichter zu flicken, performanter und weniger kompliziert und damit inherent weniger fehleranfällig.
 
Last edited by a moderator:

consuli

Member
Meine Ausgangsfrage ist noch nicht beantwortet.

Kann man die Daten von einem Raid-5 genauso unkompliziert retten, wie von einem RAID-1?

Falls ja, welche Datenrettungssoftware kann die Daten AUTOMATISCH wieder aus den RAID-5 Paritäten herstellen (wenn eben nicht die (nur) Festplatte kaputt geht) ?

Consuli
 

d4f

Müder Benutzer
Meine Ausgangsfrage ist noch nicht beantwortet.
Tut mir leid aber ich muss hier davon ausgehen dass TLDR (too long, did not read) angewendet wurde. Jede einzelne Antwort hat die Frage beantwortet.


Kann man die Daten von einem Raid-5 genauso unkompliziert retten, wie von einem RAID-1?
Nein. Ein Raid1 ist ein normaler Datenspeicher mit höchstens ein paar Byte Raid-Steuerungsdaten rundherum. Je nach System lässt sich eine Raid1-Festplatte schlicht ohne Raid verwenden oder wird, bspw bei Linux Softwareraid auch ohne weiteres zutun mit nur 1 von 2 Platten verwendbar.


Falls ja, welche Datenrettungssoftware kann die Daten AUTOMATISCH wieder aus den RAID-5 Paritäten herstellen
Wenn 2 Platten kaputt gehen und unlesbar bleiben sind unwiederbringlich alle Daten verloren. Wenn nur eine Platte kaputt geht wird die Recovery wie bei allen Raid-Level über die Steuersoftware selber angestossen. Das gleiche gilt bspw auch bei einem RAID10 wenn die "falschen" 2 Platten kaputt gehen.Falls die Platten nur partiell lesbar sind liesse sich über spezialisierte Firmen eine Einschick-Recovery wagen, Tools zum Eigengebrauch sind mir nicht direkt bekannt.
 

greystone

Member
Kann man die Daten von einem Raid-5 genauso unkompliziert retten, wie von einem RAID-1?
RAID-5 ist komplexer als RAID-1 also nein.

Ich habe selbst ehrlich gesagt auch noch nie mehrere Tausend EUR für einen Datenrettungspezialisten ausgeben müssen, weil ich immer ein Backup hatte.

Falls ja, welche Datenrettungssoftware kann die Daten AUTOMATISCH wieder aus den RAID-5 Paritäten herstellen (wenn eben nicht die (nur) Festplatte kaputt geht) ?
Sorry. Keine Ahnung. Aber es gibt Programme, die Daten nach Konfiguration automatisch sichern. Die Wahrscheinlichkeit dass das klappt, ist auch deutlich höher als bei Datenrettung.
 

Thunderbyte

Moderator
Staff member
Wenn bei Raid5 eine Platte defekt ist, sind die Daten normal lesbar. Wenn diese ausgetauscht und der Recoveryprozess ggfalls manuell angestoßen wird, wird die Redundanz wiederhergestellt.

Wenn bei Raid5 zwei Platten defekt sind, sind ALLE Daten weg, hier kann nichts manuell oder automatisch recovert werden. Daher empfehlt sich eigentlich mindestens ein Raid6, denn während der 100% Datenträgeraktivität eines Recoveries über mehrere Stunden kann leicht schon mal eine zweite Platte kaputt gehen. Mit Raid6 können zwei Platten (egal welche) kaputt gehen.

Wenn der Hardware Raid Controller defekt ist (ein solcher empfiehlt sich DRINGEND bei Raid5/6, insbesondere für die Schreibperformance) ist es oft möglich, das vorhandene Raid an einen neuen, gleichen Raid Controller oder mitunter einen neueren der gleichen Firma anzuschließen. Allerdings ist mir eigentlich noch nie ein defekter Raid Controller untergekommen.

Wer Wasser in seinem Rechner hat und dadurch seinen Controller schrottet, hat m.E. GRUNDLEGEND etwas falsch gemacht.:eek:

Und ansonsten gilt wie immer: Raid ersetzt kein Backup.:eek:
 

danton

Debian User
Falls ja, welche Datenrettungssoftware kann die Daten AUTOMATISCH wieder aus den RAID-5 Paritäten herstellen (wenn eben nicht die (nur) Festplatte kaputt geht) ?
Gar keine. Die Parität eines RAID-5 kann den Ausfall von genau einer Platte abfangen, bei RAID 6 von zwei Platten. Fallen mehr aus, sind die Daten nicht mehr vollständig wiederherstellbar. Auf Grund der verstreuten Daten wird auch die Herstellung durch ein Datenwiederherstellungslabor extrem schwierig.
Fallen mehr Platten aus einem anderen Grund als einem Plattendefekt aus (z.B. defektes Stromkabel), kann man bei einigen RAID-Controllern das Zusammenstellen eines solchen ausgefallenen RAID-Verbundes erzwingen - allerdings mit möglichen Inkonsistenzen - daher sollte man die Daten davon dann nur noch auf ein anderes Medium kopieren, den Verbund aber nicht einfach weiterbetreiben (also Daten sichern, RAID-Verbund auflösen und einen sauberen neuen erstellen).
 

consuli

Member
Wer Wasser in seinem Rechner (bekommt) und dadurch seinen Controller schrottet, hat m.E. GRUNDLEGEND etwas falsch gemacht.:eek:
Naja, Wasser (durch Überschwemmung/ Rückstau aus Kanal) und große Hitze sind in unseren Breiten die häufigsten Ursachen, dass ein abgesicherter RAID Verbund trotzdem Datenverlust erleidet. Guck mal in der Schadenstatistik einer Versicherung gegen Datenverlust nach...

Consuli
 

danton

Debian User
Gegen Wasserschäden oder Brandschäden soll ein RAID ja auch keinen Schutz bieten, dafür ist das Backup zuständig, bei dem die Backupmedien an einem anderen Ort gelagert werden.
 

consuli

Member
Gegen Wasserschäden oder Brandschäden soll ein RAID ja auch keinen Schutz bieten, dafür ist das Backup zuständig, bei dem die Backupmedien an einem anderen Ort gelagert werden.
Und trotzdem willst Du sehr wahrscheinlich auch nach einem Wasserschaden, Brand oder anderen Schadenereignis Deine AKTUELLSTEN Daten (vom RAID Verbund) retten, so weit wie eben möglich (und bezahlbar)!

Weshalb die Frage der Einfachheit der Datenrettung für die Entscheidung zwischen RAID-1, RAID-5 (oder RAID-6) sehr wohl relevant ist.

Quod erat demonstrandum.

Consuli
 

greystone

Member
Und trotzdem willst Du sehr wahrscheinlich auch nach einem Wasserschaden, Brand oder anderen Schadenereignis Deine AKTUELLSTEN Daten (vom RAID Verbund) retten, so weit wie eben möglich (und bezahlbar)!
Nein. Das ist IMHO keine Sache, für die ein RAID nicht zuständig ist, sondern eine Sache der Datensicherung.

Wenn es so wichtig ist, dass man wirklich alle Daten möglichst mit 0 Sekunden Verlust benötigt, dann richtet man die Sicherung entsprechend so ein.

Möglichkeiten

  • Datenbanksynchronisation direkt auf einen zweiten Server
  • Transaktionsprotokolle der Datenbanken direkt wegsynchronisieren
  • Relevante Dateien direkt bei Änderung wegsynchronsieren(lsyncd)

Das ist natürlich ein gewisser Aufwand, der eben auch Geld und Zeit kostet.

Eine Wiederherstellung von beschädigten Datenträgern ist keine geradlinige Sache und ob die funktioniert oder nicht, dass ist Glückssache. Und was Du dann von den defekten Platten an Daten noch runtergekratzt bekommst, dass musst Du dann selbst noch auf Konsistenz prüfen. Wie das geht? Sehr gute Frage! Ich kenne die Antwort nicht.

Ich habe eher den Eindruck, dass Du gerne den leichten Weg gehen möchtest, in dem Du sagst: Na wenn's RAID kaputt ist, dann hole ich mir eben die Daten kaputten RAID und spare mir die Datensicherung.

So ist es nun leider nicht. Defekt heisst meist nun mal defekt und mit Glück nur "Teildefekt". Aber willst Du wirklich darauf bauen, dass Du im Ernstfall mit Glück nur ein Teil der Daten und das für teuer Geld wieder bekommst?

Wenn das so ist, dann scheinen Deine Daten nicht sonderlich wichtig zu sein. Dann reicht auch eine normale Datensicherung mit nur täglichen Intervallen.

---

Aber Hey! Mach, das was Du denkst! Jeder muss seine Erfahrungen selber machen!
 
Last edited by a moderator:

Joe User

Zentrum der Macht
Meine Ausgangsfrage ist noch nicht beantwortet.

Kann man die Daten von einem Raid-5 genauso unkompliziert retten, wie von einem RAID-1?
Um die Frage dann mal zu beantworten: Nein.

Und gleichzeitig nochmals der Hinweis:
Auch für RAID1 und alle anderen RAID-Konfigurationen gilt: Nein.

Grund: Dafür ist RAID weder gedacht noch gemacht.

Lösung: Backup.
 

d4f

Müder Benutzer
Und trotzdem willst Du sehr wahrscheinlich auch nach einem Wasserschaden, Brand oder anderen Schadenereignis Deine AKTUELLSTEN Daten (vom RAID Verbund) retten, so weit wie eben möglich (und bezahlbar)!
In jedem der genannten Fälle sowie den anderen üblichen Fällen wie Diebstahl, Blitzeinschlag, ... kann man davon ausgehen dass die Controller aller Festplatten defekt sind und vermutlich auch die interne Mechanik, es können ja nur maximal wenige cm die Platten eines Rechners voneinander trennen. Hier wird also höchstens ein Datenrettungslabor zu entsprechend exorbianten Preisen was retten können zumal der alleinige Tausch des Hardwarecontrollers bei aktuellen Festplatten nicht mehr selbstständig durchführbar ist. Bei Raid1 stehen hier die Chancen logisch betrachtet deutlich besser als bei Raid5 da die eigentliche Datenstruktur zumindest bei Softwareraid denen einer nicht-geraideten Platte entspricht und somit die Suchalgorithmen beste Ergebnisse liefern können.


Wenn die Daten entsprechend kritisch sind, würde ich eher empfehlen zwei Systeme auf zu setzen, physikalisch zu trennen (Beispiel: Lan-Kabel oder Richtfunk zum Nachbarn oder auch nur ein System auf der obersten Etage und eins im Keller) und mit DRBD oder wie von greystone beschrieben auf Applikationsebene mirroren. Die einzelnen Systeme _sollten_ aber _müssen nicht_ nochmal ein eigenes Raid haben da ja hier dann bereits eine Sicherung auf höherer Ebene erfolgt.
Abgesehen von 10G-Direktverbindungen wird das aber die Systemleistung sehr merklich ausbremsen.

Sehr wichtig dabei ist, dass auch ein solches Setup keine Backups ersetzt da bspw Softwarefehler oder digitaler Schaden (Virus, ...) natürlich weder von Raid noch von high-availability Systemen abgedeckt wird.
Ich glaube es ist an der Zeit dass der TE mal genau definiert was für Fälle er überhaupt abdecken will.
 
Last edited by a moderator:

danton

Debian User
Und trotzdem willst Du sehr wahrscheinlich auch nach einem Wasserschaden, Brand oder anderen Schadenereignis Deine AKTUELLSTEN Daten (vom RAID Verbund) retten, so weit wie eben möglich (und bezahlbar)!
Bezahlbar ist ein dehnbarer Begriff. Ich finde es erstaunlich, was gute Datenrettungslabore noch nach einem Brand oder Wasserschaden von einer Festplatte retten können, aber da kommen nicht umsonst schnell mal mehrere tausend Euro zusammen. Aber hier ist alles von kompletter Wiederherstellung bis zum Komplettverlust drin.
Und aus meiner beruflichen Erfahrung muß ich sagen, da hier Qualität sehr wohl noch ihren Preis hat.
Außerdem gilt im Falle des Datenverlusts von so wichtigen Daten: Nichts selber versuchen, sondern das ganze direkt von den Profis einer Datenrettungsfirma deines Vertrauens bearbeiten lassen - das erhöht die Chance einer erfolgreichen Wiederherstellung ungemein.
Und ja, wenn mein RAID durch einen Hardware-Schaden zerstört wird, dann ist mein Backup aktuell genug, dass ich den Datenverlust verkraften kann.
RAID - sichert den Weiterbetrieb beim Ausfall einer (oder ggfl. auch mehrerer Platten, abhängig vom RAID-Level)
Backup - Sicherung der Daten vor äußeren Einflüssen, Bedienfehlern, Viren usw.
 

Thunderbyte

Moderator
Staff member
Ganz unabhängig von der Raid Diskussion:

Wenn man nen Wasserschaden (z.B. Hochwasser) befürchtet / befürchten muss, sollte man da nen Server halt auch da nicht hinstellen, wo das Wasser hinkommt! Also halt z.B. nicht in den Keller eines überflutungsgefährdeten Hauses. :rolleyes: Bleibt auch noch noch, die Daten in einem Rechenzentrum zu hosten, das hoffentlich nicht in einem Überschwemmungsgebiet liegt.

Gegen Blitzeinschlag kann man sich ohne weiteres mit Filtern schützen (manche USVs machen das auch).

Gegen Diebstahl hilft ggfalls ein verschlossenes Rack.

Brand wäre ein weiteres Problem, das überall auftreten kann. Hier fordert der Gesetzgeber ja mittlerweile Rauchmelder in jedem Raum. Natürlich und besonders in einem Serverraum braucht es natürlich einen Rauchmelder. Serverprovider haben mitunter noch eine wasserlose Löscheinrichtung.
 

danton

Debian User
Gegen Diebstahl hilft ggfalls ein verschlossenes Rack.
Und wenn man seine Daten im Falle eines Diebstahls schützen will, speichert man sie verschlüsselt auf den Festplatten des Servers, womit die Chancen einer Datenrettung sowieso gegen Null gehen.
Datenrettung sollte nur der allerletzte Notnagel sein, wenn alle anderen Sicherungsmassnahmen versagt haben und es muß klar sein, dass da höchstwahrscheinlich nicht alles oder sogar gar nichts zu retten ist.
 

d4f

Müder Benutzer
Hier fordert der Gesetzgeber ja mittlerweile Rauchmelder in jedem Raum.
[OT] Und hier wurde ein solcher Gesetzesvorschlag gekippt weil es einen zu tiefen Eingriff in das Privatleben der Einwohner darstellen würde :confused::D
Andere Länder, andere Sitten....

Gegen Blitzeinschlag kann man sich ohne weiteres mit Filtern schützen (manche USVs machen das auch).
Sofern man keine hier sinnlose offline (aka standby) USV nimmt schützt eine "normale" (line interactive) USV recht zuverlässig vor den Nebeneffekten von indirekten Blitzeinschlägen.
Gegen den enormen Stromfluss von (halbwegs) direkten Einschlägen sind aber auch diese Geräte nur sehr bedingt tauglich und rauchen im besten Fall nur selber ab, im schlechsten Fall braten sie den Rechner und die Platten während der Umschaltzeit mit - leider schon erlebt. Weder USV (und Akku) noch Rechner sahen danach hübsch aus - Elektrolyt und Schmauchspuren überall.

Entsprechende "echte" Filtersysteme sind für den Eigengebrauch weder erschwinglich noch wirklich verwendbar. Man sollte sich also nicht wirklich darauf verlassen dass es am Ende funktioniert - wie eigentlich alles was Absicherung und Redundanz, inklusive Raid, angeht. Natürlich ist aber selbst ein poppeliger "Blitzschutz" mit Varistor-Ableitung in der Steckdose besser als gar nichts. Auch hier sollte man aber nicht vergessen auch die anderen Anschlüsse - insbesondere Lan - auch ab zu sichern.

Wobei eine Flywheel-USV im Keller was hätte.... und eventuell noch als Wäscheschleuder missbraucht werden könnte? :D
 
Top