Gegen 10:42 Uhr mussten wir leider eine Störung an der Stromversorgung in einem unserer Rechenzentren feststellen. Zum Zeitpunkt der Störung fanden Wartungsarbeiten an unserer Stromversorgung statt.
Trotz getroffener Vorsichtsmaßnahmen kam es dabei unerwartet zu einem kurzzeitigen Spannungsabfall sowie einer Überspannung, welche durch die Komponenten der Stromversorgung nicht ausgeglichen werden konnte.
Diese kurzfristige Störung der Spannungsversorgung führte dazu, dass neben einigen wenigen Servern in diesem Bereich auch die für diesen Rechenzentrumsabschnitt zuständigen zentralen Netzwerkkomponenten rebootet wurden.
Auch wenn Ihr System nicht rebootet wurde, kann es daher leider zu einer kurzen netzwerkseitigen Nichterreichbarkeit gekommen sein.
Die Stromversorgung stabilisierte sich bereits innerhalb weniger Augenblicke wieder.
Netzwerkseitig ist um 10:54 Uhr die Konnektivität grundsätzlich wiederhergestellt worden.
Leider gibt es noch für einige Systeme daraus resultierende Folgeprobleme, die wir derzeit noch prüfen; diese Meldung ist daher im Moment noch aktiv. Dass Sie diese Meldung sehen bedeutet somit aber nicht zwangsläufig, dass für Sie noch ein Problem besteht. Betroffene Systeme werden von uns derzeit geprüft und wieder hergestellt.
Sollte Ihr System weiterhin nicht erreichbar sein, kann dies also eine Nachwirkung dessen sein; bitte warten Sie den Abschluss dieser Meldung ab und melden Sie uns dann den Ausfall separat, wenn noch ein Problem besteht. Sollten Ausfälle über den Abschluss dieser allgemeinen Meldung hinaus für manche Systeme bestehen, werden wir dies hier separat dokumentieren.
Wir bedauern das Auftreten des Problems und werden Maßnahmen gegen eine Wiederholung ergreifen.
Früher sagte man dazu noch "Informatik-Kaufmann"...mein eigener Technical Account Manager
Wo Menschen arbeiten, passieren Fehler. Sollte halt nur nicht so oft vorkommen.Schon erstaunlich, dass sowas trotz aller Redundanz doch immer wieder passiert. Wäre schon interessant, was genau vorgefallen ist.
Hm, ein Tag Downtime für die Überprüfung (und offensichtlich Reparatur) eines Dateisystems ist natürlich heftig. Ich hätte hier eine Backupeinspielung bevorzugt - zumindest in der Theorie. Praktisch stellt sich hier natürlich die Frage, wie lange diese denn dauern würde. Ich betreue einen Webhosting-Node, dessen Wiederherstellung bei - denken wir mal positiv - konstanten 250 MBit/s ca. 16 Stunden dauern würde... Den Tag, an dem ein Fullbackup rein muss, will ich nicht erleben.Typ: Ausfall (Aktuell)
Beginn: 21.05.2013 10:00
Ende: 22.05.2013 10:00
Dauer: (vorläufig) 1 Tag(e)
Details: (vorläufig) Derzeit findet ein Neustart des Wirtssystem statt, in dessen Rahmen eine Dateisystemprüfung durchgeführt werden muss. Dadurch dauert diese Maßnahme leider einige Zeit. Wir gehen davon aus, dass danach der Server wieder mit dem vorherigen Datenstand online gehen wird.
Und sofern das KIS offline ist... die direkte Durchwahl zum TAM auswendig kennen ;-)
Ok, dann müssen wir zur Kenntnis nehmen, dass viele RZ-Betreiber offensichtlich das Thema USV und Notstromversorgung nicht im Griff haben. Liegt es vielleicht an der Komplexität? Befinden die sich mittlerweile in einer Komplexitätsfalle? Oder hat man hier vielleicht aufgrund sinkender Margen an der falschen Stelle gespart?
Auch wenn der Diesel nicht anspringt, sollte doch jede handelsübliche USV in der Lage sein, Server kontrolliert herunterzufahren.
Ein potentiell korruptes Filesystem aufgrund eines unkontrollierten Shutdowns ist aber ein klares No-Go.
Was die Downtime von Hostsystemen für vServer betrifft, lässt sich hier wohl ebenfalls sagen, dass hier Downtimes von 2 bis 8 Stunden branchenüblich sind.
Wow, das sind ja genau 4.38291 Stunden Ausfall im Jahr :Omit einer Verfügbarkeit von 99,95%:
26.29746 Minuten Ausfall im Jahr, sehr schönIm SLA [...] 99.995%(!):
We use essential cookies to make this site work, and optional cookies to enhance your experience.