Bin leicht frustriert. Habe seit Sep. letzten Jahres das Flaggschiff von 1&1, den Root Server 4XL64.
Seit dem ist der Rechner 7mal ohne ersichtlichen Grund hängen geblieben. Jedes Mal konnte er angepingt werden, aber es gab keinen Zugriff über ssh. Es half nur ein Reboot über das Recovery-Tool von 1&1. Danach läuft er wieder ohne Probleme (bis zum nächsten Crash). Kein einziger Hinweis in den Logs messages, warn etc, kein Coredump was ja wohl auf einen Hardwaredefekt schließen läßt.
Reaktion von 1&1 - Speichertest (5Stunden) an einem Montag Vormittag, ohne Rücksprache. Bei uns liefen die Telefone heiß und unsere Kunden waren sauer. Ergebnis: Zitat "die Überprüfung Ihres 1&1 Servers ist abgeschlossen, der Speichertest
verlief ohne Fehler. Ein Speicherproblem oder ein Hitzeproblem ist ausgeschlossen. Die Hardware ist in Ordnung. "
Dann ca. 2 Wochen später nächster Crash. 1&1 tauscht den zuvor für i.O. befundenen Speicher aus. Server sei jetzt i.O.
Nächster Crash ca 3 Wochen später. Mod_Security installiert um 100% sicher zu sein, dass es nicht vielleicht doch "von außen" kommt. Und ca. 2 Wochen später, heute Morgen 6:00 wieder Crash. Selbes Spiel - kein Hinweis in den Logs, kein Coredump.
Mittlerweile haben wir Platin-Service -> Wir als Administrator des Root-Servers müßten 1&1 den Hardwarefehler in Form einer Fehlermeldung nachweisen, bevor sie da was machen könnten.
Kann mir Irgendjemand sagen, wie ich 1&1 einen Fehler, der absolut unregelmäßig, nicht reproduzierbar und bisher in keinem Logfile sichtbar ist, nachweisen kann?
Seit dem ist der Rechner 7mal ohne ersichtlichen Grund hängen geblieben. Jedes Mal konnte er angepingt werden, aber es gab keinen Zugriff über ssh. Es half nur ein Reboot über das Recovery-Tool von 1&1. Danach läuft er wieder ohne Probleme (bis zum nächsten Crash). Kein einziger Hinweis in den Logs messages, warn etc, kein Coredump was ja wohl auf einen Hardwaredefekt schließen läßt.
Reaktion von 1&1 - Speichertest (5Stunden) an einem Montag Vormittag, ohne Rücksprache. Bei uns liefen die Telefone heiß und unsere Kunden waren sauer. Ergebnis: Zitat "die Überprüfung Ihres 1&1 Servers ist abgeschlossen, der Speichertest
verlief ohne Fehler. Ein Speicherproblem oder ein Hitzeproblem ist ausgeschlossen. Die Hardware ist in Ordnung. "
Dann ca. 2 Wochen später nächster Crash. 1&1 tauscht den zuvor für i.O. befundenen Speicher aus. Server sei jetzt i.O.
Nächster Crash ca 3 Wochen später. Mod_Security installiert um 100% sicher zu sein, dass es nicht vielleicht doch "von außen" kommt. Und ca. 2 Wochen später, heute Morgen 6:00 wieder Crash. Selbes Spiel - kein Hinweis in den Logs, kein Coredump.
Mittlerweile haben wir Platin-Service -> Wir als Administrator des Root-Servers müßten 1&1 den Hardwarefehler in Form einer Fehlermeldung nachweisen, bevor sie da was machen könnten.
Kann mir Irgendjemand sagen, wie ich 1&1 einen Fehler, der absolut unregelmäßig, nicht reproduzierbar und bisher in keinem Logfile sichtbar ist, nachweisen kann?