DRBD auf LVM2 auf RAID, barrier Verständnisfragen

apairon · Jul 6, 2012

Hallo,

ich habe 2 Hosts mit jeweils RAID10 far 2 Layout. Darauf Volumes per LVM2 und diese per DRBD mit dem anderen Host verbunden.

Wenn ich die Konfigurationen in DRBD "no-disk-barrier; no-disk-flush; no-md-flush" setzen ist die Performance in Ordnung. Ich schaffe damit die Schreibgeschwindigkeit der Gigabit NICs.

Wenn ich allerdings nur eine dieser Optionen weglasse und somit DRBD "flush" oder "barrier" nutzen darf sinkt die Geschwindigkeit unter 20 MegaByte/s.

Das Systeme sind Ubuntu 12.04 LTS. In einer alten Debian-Lenny Installation hatte ich diese Probleme nicht. Dabei waren die Platten in der alten Konfiguration sogar langsamer als die neuen.

Ich habe nun schon einige Nächte im Netz recherchiert und herausgefunden, dass scheinbar in Debian Lenny LVM noch keine "barrier" unterstützt hat und somit die Geschwindigkeit dadurch höher war, die Sicherheit der Schreiboperationen aber eben auch nicht wirklich gegeben war.
In neueren Distributionen soll LVM nun die barrier weitereichen/unterstützen und somit die Sicherheit erhöhen.

Die Schreibgeschwindigkeit bei großen Blöcken (also ca 20MB/s) ist nicht so extrem kritisch. Die Geschwindigkeit mit kleinen Blöcken (1024B) ist mit ca. 20KB/s aber einfach katastrophal. Hat man da ne SQLite-DB in SYNC-Modus mit vielen Updates ist die Anwendung nicht zu verwenden.
Schallte ich barrier und flush aus, habe ich bei diesen kleinen Blockgrößen ca. 400-500kb/s was der Geschwindigkeit der Debian Lenny Konfiguration entspricht.

/proc/drbd zeigt übrigens auch mit aktivierten "barrier" nur "wo:f" an, was ja auf "flush" hinweist. Einen Logeintrag, warum aber flush verwendet wird und nicht barrier finde ich nicht.

barrier=0 oder barrier=1 im ext4 der Dateisystems auf dem DRBD-Device hat übrigens keinen Einfluss auf die Geschwindigkeit. Ein Anpassen der "max-buffers" und "max-epoch-size" brachte auch keine spürbaren Veränderungen.

Jetzt meine Fragen:

Ist dieser Performance-Verlust durch die Verwendung von barrier wirklich so extrem und es liegt somit nicht an meiner Konfig?

Warum war Debian Lenny mit DRBD und "flush" schneller und es reicht nicht nur "no-disk-barrier" in meiner aktuellen Installation aus um die gleiche Performance zu erreichen?

Warum zeigt /proc/drbd "wo:f" an, auch wenn die "no-disk-barrier" Option nicht angegeben ist (wie geschrieben, kein Eintrag im Log, dass barrier nicht verwendet werden)?

Jede Website zu diesem Thema warnt davor, barrier und flush in DRBD abzuschalten, wenn man kein Batterie gepufferten Controller verwendet. Da ich diesen nicht haben (und auch nicht einbauen kann, da Hetzner Server), mit aktivierten barrier und/oder flush aber das System nicht verwendbar ist, ist die Frage: Was kann ich tun?

Ist es wirklich so gefährlich, diese Optionen einfach aus zu lassen? Ich kann damit leben, wenn die letzten Schreibvorgänge evtl. verloren sind. Ein komplett zerschossenen Dateisystem ist aber fatal. Kann das passieren?

Ist ein gewisser Grad an Sicherheit gegen, wenn im ext4 "barrier=1" gesetzt ist aber im darunterliegenden DRBD barrier und flush deaktiviert sind?

Konfigdateien und irgendwelche gewünschten Tests kann ich natürlich nachreichen. Es ist aber alles nach Anleitung der DRBD-Website gemacht und auch die Tuning-Tipps wurden angewendet. Es sind alles Standard-Pakete von Ubuntu. Also nix selbst kompiliertes.

Ich bin für jede Hilfe bzw. Aufklärung dankbar.

apairon

remote_mind · Jul 9, 2012

Es gibt ein altes Sprichwort das lautet (in etwa):

secure, fast, cheap. pick any two

Auf Deutsch: entweder Du hast den batteriegepufferten Raid-Controller oder Du musst mit der schlechten Performance leben.

Setzt Du no-disk-barrier; no-disk-flush ein und hast keinen Batteriepuffer gibt es im Ernstfall Datenverlust. Crash-recovery von Datenbanken und Dateisystemen funktioniert nur, wenn das Storage-Subsystem die Software nicht belügt - ein Transaktionsprotokoll muss sich darauf verlassen können das gilt: was geschrieben ist bleibt.

Alles andere erzeugt Datensalat.

beste Grüße,
Nils

apairon · Jul 10, 2012

Danke für die Erläuterung. Ich frage mich aber immer noch ob dieser Performanceverlust (20kb/s statt 400-500kb/s) wirklich normal ist oder ob da was anderes noch schief läuft.

Außerdem interessiert mich noch, ob durch deaktiviertes Flushing und Barrier in DRBD nur die letzten Daten gefährdet sind oder ob mit ext4 auch ein Totalschaden entstehen kann, weil z.B. irgendwelche Metadaten von Dateisystem gerade geschrieben werden.

Ich habe mehrere DRBD-Ressourcen für virtuelle Maschinen, so dass ich den Datenbankserver mit Barrier betreiben kann, aber den Webserver ohne Flush und Barrier. Die Projekte auf dem Webserver, die SQLite verwenden sind eher unkritisch und wenn da mal die letzte Änderung an einer Website durch einen Absturz verloren ist, ist das zu verkraften. Auch ein FTP-Upload ist nicht so kritisch und kann wiederholt werden.

Kritische Transaktionen gehen über einen Datenbank-Server mit MySQL und den kann ich mit Barrier betreiben.

Ich habe leider keine Möglichkeit einen batteriegepufferten Controller zu verwenden, da es ein Hetzner-Server ist und auch die angeboten RAID-Controller von Hetzner nicht batteriegepuffert sind.

apairon

apairon · Jul 23, 2012

Nur zur Info: Habe secure und fast gewählt

Hetzner bietet scheinbar doch Raid+BBU. Diese habe ich jetzt verbaut und ohne barrier/flush ca. 700 Requests/s (schreibend) über DRBD. Das ist OK und lässt mich ruhiger schlafen.

apairon

remote_mind · Jul 24, 2012

Das war sicher die richtige Entscheidung, damit hast Du die einiges an möglichen Ärger vom Hals geschafft.

Interessehalber: womit hast Du die Requests/s gemessen?

schöne Grüße,
Nils

apairon · Jul 24, 2012

Ich habe mit

Code:

dd if=/dev/zero of=testfile bs=1024 count=1000 oflag=direct,sync

gemessen. In einer VM, die auf einem DRBD-Device liegt, bekomme ich:

Code:

1000+0 records in
1000+0 records out
1024000 bytes (1.0 MB) copied, 1.50423 s, 681 kB/s

D.h. für mich, dass ich 681 Schreiboperationen (1k Block) pro Sekunde habe. Mit 4k Blöcken ist die Anzahl der Operationen noch fast identisch.

Ob das jetzt IOPS per Definition entspricht, weiß ich nicht, aber es ist für mich vergleichbar, da ich überall so gemessen habe.

Ohne DRBD direkt auf ein lokales Block-Device auf dem Raid, schafft das System übrigens ca. das zehnfache. Aber ich denke mal, das ist dem Stacking von LVM+DRBD (Gigabit Ethernet) und der VM (KVM, Cache None) zuzuschreiben.

Übriges, der IO Scheduler ist "deadline". Mit cfq waren diese Werte wesentlich schlechter.

apairon

DRBD auf LVM2 auf RAID, barrier Verständnisfragen

apairon

New Member

remote_mind

New Member

apairon

New Member

apairon

New Member

remote_mind

New Member

apairon

New Member

We value your privacy