Archiv Server ca 20TB max 5.000€

natas77

New Member
hallo liebe Gemeinde,

ich stehe kurz vor einem großen Projekt :

verlangt wird ein Archiv Server der ca 20TB hat und max 5.000 kostet.
als OS werde ich OpenSolaris der FreeBSD einsetzen zwecks ZFS!

jetzt ist die frage welche Hardware?

mittlerweile kann man die Hardware einzeln kaufen und zusammenbauen.
würdet ihr mir dazu raten?

1X Intel CPU : Intel Xeon E5506
Mainboard : http://www.supermicro.com/products/motherboard/Xeon3000/X58/X8SAX.cfm
ECC Ram 4GB
Controler : http://www.adaptec.com/de-de/support/raid/sas_raid/sas-51645/
Der Server wird nicht online gehen und dient nur als Archiv Server!

Bin sehr dankbar für Anregungen oder Tipps
 
Last edited by a moderator:
Ggfs. sollte vorab geklärt werden, wie es mit z.B. den folgenden Faktoren aussieht:

a) Datensicherheit hinsichtlich möglicher Ausfälle von HD und/oder Controller
b) redunantes Netzteil?
c) USV?

Bestimmt auch von Interesse - zwar nicht online, aber welche Last bzw. welches Nutzungsverhalten ist zu erwarten?

Anzahl zeitgleicher Zugriffe und damit verbundener Datenbedarf? (evtl. Falschenhals RAM, HD oder Netzwerkkarte)?!
 
danke für deine Antwort Nuck Nuck

a) Die Daten Sicherheit wird am Anfang mittels DVDs und externe Festplatten Geregelt. Sobald der Server Mehrere Monate als max. 3 Monate im Einsatz war Wird ein Backup Server eingesetzt.

b)Ein redundantes Netzteil ist meiner Meinung nach sehr wichtig! Wenn alles im Rahmen der 5.000€ ist sollte es dabei sein!

c)USV ist bereist vorhanden.

Die Archivierung wird mittels eines CMS Systems in diesem Fall Drupal realisiert.
In der praksis Sieht das so aus: das maximal 3 user gleichseitig Videos, Ton und Bilder als Inhalt ins System einpflegen.

Danke
 
So weit geht das in eine gute Richtung. Die Frage nach redundantem Netzteil musst du abwägen: Kann das Archiv auch mal nen halben Tag offline gehen, weil du das Netzteil tauschen musst, oder nicht?

Wichtiger finde ich die Überlegung, welche RAID-Level und damit wie viel Platten eingesetzt werden. 3TB-Platten kommen mit BIOS nicht klar. Da müsstest du also vorher checken, ob die an dem Controller und mit dem Board überhaupt laufen. Bei 2TB-Platten hast du allein 10 Platten ohne Redundanz. RAID-5 würde ich da eher lassen, also mal mindestens 12 Platten im RAID-6. Wenn du das per Hardware-RAID laufen lässt, würde ich mir auch einen Controller auf Reserve hinlegen. Das wird wiederum mit 5000EUR knapp.

Ich würde auf jeden Fall ein entsprechendes Gehäuse mit Hot-Swap-Rahmen für die Platten einplanen. Bringt die beste Redundanz nix, wenn du die Kiste runterfahren musst, um die Platten zu tauschen.

Die Archivierung wird mittels eines CMS Systems in diesem Fall Drupal realisiert.

Really? Archivierung mit CMS? Wieso keine passende Software? Bin kein Profi auf dem Gebiet, aber Dokumentenmanagement a la Alfresco ist da schon viel näher dran. Kann mir nicht vorstellen, dass es da nix passendes unter GPL gibt.

Ach ja, der Backup-Server ist eingeplant? Der müsste ja dann nochmal mehr als 20TB mitbringen.
 
Last edited by a moderator:
thx @ Papabaer

also das Archiv kann auch mal mehrere Minuten offline bleiben.
das ist absolut kein Problem.

Was RAID angeht sollte es mindestens ein RAID 5 sein. Ich habe das Supermicro MB Schonmal eingesetzt. Es ist nicht das beste aber Es läuft! Dort habe ich 6 2TB in einem RAID 5 Verbund im Einsatz was stabil seit ca 1J läuft.

Aber RAID 6 wäre da sicher Sicherer und die Performance von einem RAID 5 Verbund ist bei meinem vorhaben nicht nötig und etwas überflüssig oder?

Sag mal wie findest du den Controller?

Was Software angeht bringt drupal die benötigten Module mit! Arbeite nun mehrere Jahre mit drupal und finde die Lösung am besten!
Da alle relevanten Einstellungen und Inhalte in Datenbanken gesichert werden ist ein backup und Wiederherstellung viel leichter als Alfresco.

aber Alfresco ist auch Sehr Sehr gut!
hmmm du hast recht alsfresco wie dafür geschaffen!

ICh werde mir Alfresco in einer VM anschauen!!
Danke
 
Last edited by a moderator:
Was RAID angeht sollte es mindestens ein RAID 5 sein. Ich habe das Supermicro MB Schonmal eingesetzt. Es ist nicht das beste aber Es läuft! Dort habe ich 6 2TB in einem RAID 5 Verbund im Einsatz was stabil seit ca 1J läuft.

Wenn Du den x8 Raid Controller einsetzen willst, dann sollte die Connectivity auch passen. Wenn Du denkst: ich hab ja 2x16x PCIe, dann bist du womöglich auf dem falschen Dampfer, denn in solche GRAFIK Slots muss man noch lange keine RAID Controller stecken können. Der PCIe 4x in einem 8x Slot ist zwar mechanisch OK, reduziert aber die Möglichkeiten und kann ebenfalls nicht funktionieren.

Aber RAID 6 wäre da sicher Sicherer und die Performance von einem RAID 5 Verbund ist bei meinem vorhaben nicht nötig und etwas überflüssig oder?

Du hast offensichtlich KEINE AHNUNG von Raid Levels :rolleyes:, weswegen Du diesen Mangel schnellstens beheben solltest: http://de.wikipedia.org/wiki/RAID

Sag mal wie findest du den Controller?

Der Controller ist sicher gut. Was mich bei der Website zum Controller irritiert: Da steht nichts von einer BBU (Battery Backup Unit) oder einer Flash Lösung. So etwas ist aber bei einem Controller mit Schreib Cache durchaus nötig, um bei einem Stromausfall die Volumes nicht in einem inkonsistenten Zustand fallen zu lassen.

Was Software angeht bringt drupal die benötigten Module mit! Arbeite nun mehrere Jahre mit drupal und finde die Lösung am besten!

Ich finde das auch mehr als seltsam, Drupal ist ein Web-CMS, kein Backup System!
 
Wenn du ZFS verwenden möchtest, dann sind 4GB RAM m.A. viel zu wenig. ZFS ist sehr speicherhungrig. Ich würde hier 16GB+ empfehlen.
 
Ich würde auch aus anderen Gründen vom Selbstbau absehen:

- Verantwortung: wenn ein Teil des Systems ausfällt, wer ist dafür verantwortlich? Im Fall eines Zusammenbaus bist das DU. Und wenn Du aber nun im Bett, im Urlaub, in Krankheit, in einem anderen Job bist?

- Ausfallszeit: professionelle Systeme kann man mit garantierten Servicefristen besorgen, die z.B. sicherstellen, dass das System in max 24/6/4 Std wieder einsatzfähig ist. Je kürzer umso teuerer, logisch.

- Verfügbarkeit von Ersatzteilen: wenn man Einzelteile zusammenkauft sind diese JETZT sicherlich gut verfügbar. In 5 Jahren (gut und gerne mal die Laufzeit eines solchen Systems) sieht die Sache sicherlich anders aus. Insbesondere bei Mainboards oder dem Raid Controller gibt es u. Ust. kaum Alternativen zu einem genauen Ersatz.

Das Budget UND die Leistung festzusetzen halte ich in diesem Zusammenhang für nicht zielführend.
 
Wir haben erst vor kurzem einen VMWare Server bei http://www.thomas-krenn.com/de/index.html gekauft, auf http://www.thomas-krenn.com/de/server-systeme/3HE-rack-server.html gibts z.B. Server mit bis zu 36 HDs.

Eine schnelle Beispielzusammenstellung (ohne OS!) habe ich mal im Anhang zusammengeklickt, statt 14 Platten kann man sicher auch gleich 16 nehmen, dann ist der Server voll.

Da kann man sicher noch optimieren. Aber dafür haben VERNÜNFTIGE Anbieter eben auch eine Hotline, die einem bei der Auswahl der richtigen Komponenten hilft. Dell (als Serveranbieter) wäre übrigens auch noch ein Anbieter, der in Frage käme.
 

Attachments

  • TK-Angebot.jpg
    TK-Angebot.jpg
    158 KB · Views: 269
Da Du beziehungsweise Deine Firma für 5000EUR niemals für die Einhaltung der CE garantieren kann/st, dies aber in der EU zwingend vorgeschrieben ist (es drohen sehr hohe Bussgelder bis hin zu Haftstrafen), rate ich dringlichst vom Selbstbau ab.
Die musst du einhalten wenn du das Geraet auch verkaufen willst. Wenn du eigene Racks befuellst kannst du die Geraete ohne jedgliches Gehause ins Regal schieben und niemand wird meckern ;)

Ist bisschen Overkill, aber von der Struktur her sollte es fuer dich passen:
http://blog.backblaze.com/2011/07/20/petabytes-on-a-budget-v2-0revealing-more-secrets/
http://blog.backblaze.com/category/storage-pod/
Ansonsten kann ich auch Thomas Krenn empfehlen.

Zu ZFS: Wie ein Vorposter schon geschrieben hat, kannst due NIE genug RAM fuer das Biest haben. (Zumal wenn du Dedup einschalten solltest)
Eine SSD als L2ARC ist da schon fast Pflicht (zB eine OCZ Vertex3 MAXIOPS 240GB - die 120'er Variante hat ein Stueck weniger Durchsatz)
 
Wo war da denn der Fehler in seiner Aussage? Die Datensicherheit ist doch im RAID 6 höher, die Performance hingegen im RAID 5. Oder bin ich gerade schief gewickelt? :)

Im Wesentlichen ist ein Raid 5 ein Array mit einer Parity Platte, bei Raid 6 werden 2 Platten für die Redundanz verwendet. Raid6 unterscheidet sich dabei m.E. nicht wesentlich im Bezug auf die Performance (zumindest bei der Verwendung vernünftiger, hardwarebeschleunigter Controller). Der Text klang darüber hinaus so, als wäre eigentlich ein Raid 0 oder 10 gemeint. DA ist wirklich mehr Performance zu erwarten.
 
Im Wesentlichen ist ein Raid 5 ein Array mit einer Parity Platte, bei Raid 6 werden 2 Platten für die Redundanz verwendet.

Naja, was du beschreibst ist ein Raid3 bzw ein RaidDP (nur bei NetAPP).
Im Raid 5/6 sind die Paritätsdaten verteilt auf alle HDDs.

Was ich mich aber frage: Wozu Raid?
Du willst unbedingt ZFS nutzen. Dann mach es doch richtig und richte ein Raidz2 o.ä. ein. Damit wird dann alles in Software erledigt. Die CPU-Ressourcen hast du ja und so würde auch das ganze Potential von ZFS ausgenutzt.
Hierzu dann so viel RAM wies geht und du wirst glücklich.
 
Hallo!

MOD: Die CE / EMV Diskussion wurde abgetrennt und findet sich unter
wieder.

mfG
Thorsten
 
Da mein Beitrag mit abgetrent worden ist, wiederhole ich die Frage nochmal.

Wieso wollen alle immer ein HW-Raid? Gerade wenn man ZFS einsetzen will, wird von einem HW-Raid laut Doku abgeraten.
 
Da mein Beitrag mit abgetrent worden ist, wiederhole ich die Frage nochmal.

Wieso wollen alle immer ein HW-Raid? Gerade wenn man ZFS einsetzen will, wird von einem HW-Raid laut Doku abgeraten.


Diese Frage stelle ich mir auch schon seit längerem. Gerade wenn ich Server habe, deren einziger Auftrag es ist, Daten zu speichern und mittels NFS oder iSCSI zur Verfügung zu stellen, sollte es ja nichts ausmachen, dass die ggf. erforderliche Paritätsberechnung durch die CPU vorgenommen wird. Die Kiste hat ja sonst nichts zu tun.

Würde gerne mal nen Benchmark sehen mit und ohne HW-Raid-Controller bei vier Platten im Raid 5 oder Raid 10 - aber solche Dinger sind schwer zu finden ;)
 
Ich glaube das macht niemand, da alle noch an der alten Tradition festhalten. Einer der Standardbegründungen ist: "Weil das Raid vom OS unabhängig ist"

Vielmehr stellt ZFS sicher, dass Daten beim Schreiben auch verifiziert werden. Der Controller macht das nicht. Soweit ich weiß, wird erst beim Zugriff auf die Daten selbst der Controller feststellen, dass mit einem Medium etwas nicht stimmt. Auch das austauschen defekter Medien nimmt für den Resync Zeit in Anspruch. Soweit ich weiß, wissen die HW-Raid-Controller auch nicht, welche Bereiche beschrieben sind. Also wird folglich das komplette Medium gespiegelt. In diesem Zeitraum ist der Server nicht wirklich einsatzfähig. Meist stellt man bei einem Raid5 auch noch fest, dass mehr als eine Platte defekte aufweist. Das ist dann beim Rebuild besonders toll.

Auf einen Benchmark mit ZFS mit Raid-Z zu einem anderen FS mit HW-Raid würde ich mich freuen. Ich würde dem OP empfehlen, die Performance des Servers mal ohne HW-Raid zu testen. Die Controller kann man hinterher immer noch kaufen. Da sowieso die Onboard-Ports für sein Vorhaben nicht ausreichen werden, wird er sich eh einen vernünftigen Controller anschaffen müssen. Es kann ja in dem Fall ein SAS-Controller sein, an dem er einfach billige SATA-Platten betreibt. Der Hauptspeicher des Servers sollte aber dementsprechend groß sein, wie schon bereits erwähnt worden ist.

PS: Hab da was gefunden: http://www.phoronix.com/scan.php?page=article&item=linux_kqzfs_benchmarks&num=1
 
Last edited by a moderator:
Soweit ich weiß, wird erst beim Zugriff auf die Daten selbst der Controller feststellen, dass mit einem Medium etwas nicht stimmt.

Er "weiß" und meldet natürlich schon, wenn eine Platte nicht mehr da ist (ggfalls inklusive Warnmail).

Soweit ich weiß, wissen die HW-Raid-Controller auch nicht, welche Bereiche beschrieben sind. Also wird folglich das komplette Medium gespiegelt.

Korrekt.

In diesem Zeitraum ist der Server nicht wirklich einsatzfähig.

Falsch. Ein degraded Raid 5 z.B. ist nach wie vor einsatzfähig (schreiben und lesen), wenn gerade ein Resync stattfindet kann das allerdings auf die Performance schlagen. Hier kann man aber oft einstellen, ob die Wiederherstellung eine hohe oder geringe Priorität hat.

Meist stellt man bei einem Raid5 auch noch fest, dass mehr als eine Platte defekte aufweist. Das ist dann beim Rebuild besonders toll.

Wenn das passiert ist ein Raid5 unrettbar verloren. Und SOOO häufig ist das wiederum auch nicht. Wenn man dem begegenen will, hat man die Wahl ein Raid6 aufzubauen.

Es kann ja in dem Fall ein SAS-Controller sein, an dem er einfach billige SATA-Platten betreibt.

Alle SAS Controller die ich kenne, sind professionelle Raid Controller mit eigener CPU und Cache Speicher (zum Lesen, oder mit BBU auch zum Schreiben). Warum sollte man dann nicht auf die hardwarebeschleunigte Raid Berechnung zurückgreifen, wenn man sie schon mitbezahlt? Sata Platten an einem SAS Controller zu betreiben macht preistechnisch in jedem Fall Sinn (mach ich auch so).
 
Ein degraded Raid 5 z.B. ist nach wie vor einsatzfähig (schreiben und lesen), wenn gerade ein Resync stattfindet kann das allerdings auf die Performance schlagen. Hier kann man aber oft einstellen, ob die Wiederherstellung eine hohe oder geringe Priorität hat.

Das kommt drauf an, was für Anwendungen das Raid nutzen. Bei recht IO-Intensiven Anwendungen führt das auch schnell mal dazu, dass der Rebuild komplett abbricht und von vorn begonnen wird. Auch bei Controllern in der mittleren und oberen dreistelligen Preisklasse. Praxiserfahrung. ;)

Wenn das passiert ist ein Raid5 unrettbar verloren.
Das kommt drauf an, wie defekt die 2. Festplatte ist und wie tolerant der Controller damit umgehen kann. Einige schaffen es auch, das Raid teilweise wiederherzustellen und die Lücken, die durch die kaputten Sektoren der 2. Festplatte nicht wiederhergestellt werden konnten, entsprechend aufzufüllen.
Das beschädigt zwar mit ziemlicher Sicherheit das Dateisystem da drauf. Erhöht aber die Wahrscheinlichkeit wenigstens den Großteil der Daten noch retten zu können.

Und SOOO häufig ist das wiederum auch nicht.
Wenn man nur eine Handvoll Systeme betreibt, mag das sicher stimmen. Bei einer Anzahl von um die 350 Systemen, rechne ich mit so einem Ausfall aller 2 bis 4 Monate. Praxiserfahrung. ;)

Alle SAS Controller die ich kenne, sind professionelle Raid Controller mit eigener CPU und Cache Speicher
Ich werfe da einfach mal den sehr populären LSI 1068 in den Raum. ;)
 
Back
Top