Arxxx-Karte von 1&1 bei Hardwarefehler

arwed

New Member
Bin leicht frustriert. Habe seit Sep. letzten Jahres das Flaggschiff von 1&1, den Root Server 4XL64.
Seit dem ist der Rechner 7mal ohne ersichtlichen Grund hängen geblieben. Jedes Mal konnte er angepingt werden, aber es gab keinen Zugriff über ssh. Es half nur ein Reboot über das Recovery-Tool von 1&1. Danach läuft er wieder ohne Probleme (bis zum nächsten Crash). Kein einziger Hinweis in den Logs messages, warn etc, kein Coredump was ja wohl auf einen Hardwaredefekt schließen läßt.
Reaktion von 1&1 - Speichertest (5Stunden) an einem Montag Vormittag, ohne Rücksprache. Bei uns liefen die Telefone heiß und unsere Kunden waren sauer. Ergebnis: Zitat "die Überprüfung Ihres 1&1 Servers ist abgeschlossen, der Speichertest
verlief ohne Fehler. Ein Speicherproblem oder ein Hitzeproblem ist ausgeschlossen. Die Hardware ist in Ordnung. "
Dann ca. 2 Wochen später nächster Crash. 1&1 tauscht den zuvor für i.O. befundenen Speicher aus. Server sei jetzt i.O.
Nächster Crash ca 3 Wochen später. Mod_Security installiert um 100% sicher zu sein, dass es nicht vielleicht doch "von außen" kommt. Und ca. 2 Wochen später, heute Morgen 6:00 wieder Crash. Selbes Spiel - kein Hinweis in den Logs, kein Coredump.
Mittlerweile haben wir Platin-Service -> Wir als Administrator des Root-Servers müßten 1&1 den Hardwarefehler in Form einer Fehlermeldung nachweisen, bevor sie da was machen könnten.

Kann mir Irgendjemand sagen, wie ich 1&1 einen Fehler, der absolut unregelmäßig, nicht reproduzierbar und bisher in keinem Logfile sichtbar ist, nachweisen kann?
 
Das Problem ist, dass Du nicht an die "echten" logs dran kommst. Im Moment des "harten" Absturzes kann der syslogd die Fehlermeldung nicht auf die Platte schreiben, da der Kernel das zu diesem Zeitpunkt nicht mehr unterstützt. Normalerweise steht die Fehlermeldung aber noch auf der Console...

Wenn Du also erreichen könntest, dass Du eine echte Console (Stichwort Lara) an Deinen Server bekommst, auf die Du von einem anderen (v)Server permanent zugreifen kannst, könntest Du so evtl. dem Fehler auf die Spur kommen. Allerdings habe ich keine Ahnung, was 1&1 in dieser Richtung anbietet -- habe bei denen nur einen vServer...

Viele Grüße,
LinuxAdmin
 
Hallo LinuxAdmin,
Lara wäre schön. 1&1 bietet immerhin eine serielle Console. Kommt sicherlich auf den Grund der Crashes an, ob man da viel sieht. Nachdem ich wohl z.Z. von 1&1 keine Hilfe erwarten kann, muß ich wohl bis zum nächsten Mal warten und dann über die Console gehen. Hatte bisher immer zuviel Panik, daß unsere Kunden etwas von dem Ausfall mitbekommen, dass meine oberste Prio immer war den Server a.s.a.p. wieder zu rebooten.
Danke für den Tipp.
Gruß
arwed
 
...ist der Rechner 7mal ohne ersichtlichen Grund hängen geblieben. Jedes Mal konnte er angepingt werden, aber es gab keinen Zugriff über ssh.

spezifiziere "kein Zugriff". Hast du eine Fehlermeldung bekommen like...:

Code:
ssh: connect to host hellau&allaf.com port 22: Connection refused

Oder einen timeout?

Hast Du es mal über die remoteconsole versucht?
Code:
ssh u[I][your-number-here][/I]@sercon.onlinehome-server.info

Bei diesem Mega-Tarif bietet uns 1&1 doch einiges an Optionen um zumindest die Ursache einzugrenzen.

Ich persönlich hatte bis auf einen [zu vernachlässigenden] Schlaumeier nur gute Erfahrungen mit dem root-server-support bei 1&1 und das seit 7 Jahren


...und jez nix von wegen verlixtes 7. etc. :p
 
Last edited by a moderator:
Back
Top