HostEurope Root Server XXL + Plesk Backup (11.5) => Hohe IO

fmk

New Member
Hallo zusammen,

ich kämpfe seit Monaten mit dem Problem, dass der HostEurope XXL Server am Ende des Plesk (11.5) Backups für ca. 30-45min komplett unerreichbar ist. Dabei besteht eine ServerLoad von ca. 60.00-70.00 (=> 12 CPUs)...

Zu dieser Zeit werden die einzelnen Domain-Backups meiner Meinung nach zu einem einzigen Archiv zusammengefasst (schlussendlich bekomme ich am Schluss eine .tar mit ca 100GB), was viel I/O in Anspruch nimmt. Die I/O Auslastung beträgt in dieser Zeit ca. 100-150MB/s, also auch nichts weltbewegendes....

Was ich bereits ausprobiert habe:
Backup Prozesse in Plesk reduziert; Komprimierung deaktiviert, ....
Der HostEurope Support meint dass am Server alles in Ordnung sei und die Auslastung durch das Backup verursacht wird, und leider den ganzen Server ausser Gefecht setzt...

Über Ideen, wie ich das Problem in den Griff bekommen könnte, würde ich mich sehr freuen!
 
Priorität des Backup-Prozesses ändern, Schedulder wechseln, Programmcode des Backup-Prozesses ändern. Ungefähr in dieser Reihenfolge.

--
.A.
 
Machst du ein gesammtes Plesk Backup oder Backup einzelner Domains?
Ein Zeitliches Aufteilen der Backups/Zu sichernden Elementen hat bei mir auch Wunder bewirkt.

Ansonsten kann ich mich meinem Vorredner nur anschließen!
 
Plesk ist in dieser Hinsicht das pure Grauen....

Wenn jemand ne Idee hat, wie man bei Plesk Backups die I/O Last begrenzt, wäre ich sehr dankbar.
 
Priorität des Backup-Prozesses ändern, Schedulder wechseln, Programmcode des Backup-Prozesses ändern. Ungefähr in dieser Reihenfolge.

--
.A.

Das hört sich ja schonmal vielversprechend an, aber:
Wie kann ich die Priorität vom Plesk Backup niedriger einstellen (die Option "mit niedriger Priortät ausführen" ist bereits aktiviert).
Und was hat es mit dem Scheduler auf sich?
 
Machst du ein gesammtes Plesk Backup oder Backup einzelner Domains?
Ein Zeitliches Aufteilen der Backups/Zu sichernden Elementen hat bei mir auch Wunder bewirkt.

Ansonsten kann ich mich meinem Vorredner nur anschließen!

Ich mache einmal ein komplettes Backup des Servers... aufteilen versuche ich zu vermeiden, um mir so viel Pflegeaufwand zu sparen, wie möglich (> 50 Domains)
 
ich habs diese Nacht mal mit nice 19 probiert; Dasselbe erneut...

Auch wenn ich mittels folgenden Befehl
Code:
time sh -c "dd if=/dev/zero of=testfile bs=10000k count=1k && sync"
I/O Last erzeuge, dann ist der Server während dieser Zeit komplett ausgelastet und nicht erreichbar.

In dieser Zeit erzeugen folgende Prozesse viel Last:
jbd2/sda2-8
flush-8:0

Top sagt mir:
top - 10:50:09 up 33 days, 4:38, 3 users, load average: 11.51, 5.15, 2.99
Tasks: 556 total, 3 running, 553 sleeping, 0 stopped, 0 zombie
Cpu(s): 12.1%us, 4.0%sy, 0.0%ni, 58.4%id, 25.2%wa, 0.0%hi, 0.3%si, 0.0%st

Atop sagt mir:
DSK | sda | busy 101% | | read 1 | write 3313 | KiB/r 16 | | KiB/w 510 | MBr/s 0.00 | MBw/s 165.04 | | avq 144.44 | avio 3.02 ms |

Der Server ist aber komplett unerreichbar...
 
- SAR Werte während des Backups aufzeichnen lassen !
- Im KIS das HE eigene Daily Backup abgeschalten !
- Das System ist mittels BareMetal virtualisiert ?
- Was passiert bei Dateioperationen, auf dem System ? Ebenfalls "zu hohe" IO Last ? -> wenn ja HE das dedizierte RAID prüfen lassen (hier vor allem den Controller und dessen Batterie - nicht das die Schreibcaches deaktiviert sind)
 
- SAR Werte während des Backups aufzeichnen lassen !
- Im KIS das HE eigene Daily Backup abgeschalten !
- Das System ist mittels BareMetal virtualisiert ?
- Was passiert bei Dateioperationen, auf dem System ? Ebenfalls "zu hohe" IO Last ? -> wenn ja HE das dedizierte RAID prüfen lassen (hier vor allem den Controller und dessen Batterie - nicht das die Schreibcaches deaktiviert sind)

Im Kis ist das HE Daily Backup bereits abgeschaltet.
Das System ist ein Parallels Bare Metal Server, also virtualisiert.
Bei Dateioperationen ist es dasselbe Phänomen (=> HostEurope behauptet aber, dass das RAID einwandfrei ist). Was mir hier noch aufgefallen ist: Wenn ich während des IO-Tests meminfo ausgeben lassen
watch cat /proc/meminfo
Dann schrumpft
Buffers: 2633692 kB
immer weiter, bis es schlussendlich gar nur wenige kB hat, und dann das System voll aus dem Konzept bringt. Bis dahin siehts aber ganz normal aus....
 
Wahrscheinlich ist Dein Storage mit den Anfoderungen überfordert. Dann kannst Du entweder Dein Storage-System ausbauen oder den Durchsatz des Backups drosseln.

--
.A.
 
Dann schrumpft
Buffers: 2633692 kB
Das ist normal. Du liest/schreibst alle vom betroffenen Teile der Festplatte nur 1x, entsprechend kann er nichts buffern. Da er es aber versucht wirft er dadurch ständig Sachen aus dem Cache - auch wenn eigentlich LIFO genau das reduzieren/verhindern soll(te).

Du kannst über Cgroup (falls vorhanden) oder ionice drosseln, etwas schnelle Abhilfe wenn auch quick&dirty bringt der Prozess-Begrenzer cpulimit.
Lokale Plesk-Backups sind so terribel ineffizient, wenn du ausreichend Speicherplatz hast sollst du evntuell über rsync Backups auf andere Platten nachdenken.
 
Back
Top