Server down

CEW4

Member
Guten Abend,

ich habe ein gewaltiges Problem: Mein vServer bei Strato (SuSe 11.2, Plesk v9.inrgendwas) ist nicht mehr erreichbar. Folgendes ist geschehen:

Der Server lief seit einigen Monaten, in letzter Zeit wurden keine Änderungen vorgenommen. Heute abend schrieb mich ein Kollege an, daß er sich nicht mehr in das Typo3-Backend einloggen könne. Ich probierte es meinerseits und bekam ebenfalls einen Korb (Typo3: Anmeldung fehlgeschlagen). Die statischen Webseiten wurden jedoch ausgeliefert.

Ich versuchte, mich an Plesk anzumelden: 500 - internal server error.

Dann meldete ich mich per SSH an, was funktionierte. Ich sah mir einige Logs an, in vielen war von "quota exceeded" die Rede, daneben von "SSL connection error".

Meine erste Vermutung war, daß sich die Platte über die Monate mit Logdateien vollgemüllt hätte. Also löschte ich einige Logs - die erwarteten GB-großen Fluten fand ich allerdings nicht vor.

Danach funktionierte Plesk immer noch nicht, also führte ich über die Strato-Oberfläche einen Reset durch. Und nun ging das Problem so richtig los:

Der Server startete nicht mehr. Ich kann ihn nicht einmal mehr pingen, auf keiner seiner beiden IPs. Benutze ich auf den Strato-Seiten das "Rettungssystem", so kann ich beide IPs pingen, mich in SSH anmelden und auf das Dateisystem zugreifen, aber die wichtigen Dienste (www, qmail) laufen offenbar nicht.


Bitte: Kann mir jemand sagen, wie ich nun weiterkomme? Wie finde ich heraus, was hier vorgeht? Kann ich irgendwo ein Log des fehlschlagenden Bootvorgangs auslesen? Welche Logdateien könnten interessant sein? Wenn die Vermutung bzgl disc space richtig war und ich nur die richtigen Dateien nicht gefunden habe: Wo liegen denn die wahrscheinlichsten Speicherfresser?

Ich bin für jede Hilfe sehr dankbar - momentan sind weder meine Webseiten noch email erreichbar!

Gruß,
CEW4
 
Disc Quota Exceeded = Festplatte voll

mit dem Befehl df hättest du das auch sehen können.

Ich würde hier aber weniger auf die paar MB Logs tippen, mehr aber auf Verwaltungsoberflächebedingte Logs.

Das Rescue System ist normal nicht dein normaler V-Server sondern nur die Möglichkeit auf die Daten des V-Servers zuzugreifen.

Suche auf der Partition nach Dateien, die größer als ein bestimmter Wert sind also z.B. Dateien, die größer als 20 MB sind. Ich würde hier einmal im /var/www Verzeichnis anfangen, da dieser Fehler nach einem internen Backup Problem klingt. Immer mehr Backups werden erzeugt aber keine alten gelöscht.

find /var/www -size +20M

sollte die Dateien anzeigen, die größer gleich 20 MB sind. Sollten dies unwichtige Files sein, über den Rescue Modus löschen und anschließend V-Server starten.
 
Hi,

danke für die Antwort. Fühlt man sich schon nciht mehr ganz so alleine. ;-)

df kenne ich zwar, kann aber den Output nicht vollständig interpretieren. Moment, aus dem Rettungssystem heraus ist es einfacher:

Filesystem 1K-blocks Used Available Use% Mounted on
/dev/vzfs 54732 44896 9836 83% /
/dev/vzfs 41943040 41943040 0 100% /repair
udev 8201728 40 8201688 1% /dev

Das heißt, das Volume /repair (Rettungssystem) ist randvoll, oder?

Ich habe eben auf Kommandozeile nach großen Dateien gesucht und auch tatsächlcih etwas gefunden - ein Backup-cronjob scheint brav regelmäßig Backups vom webspace gemacht zu haben, inklusive Bilder-Galerie und allem. Ich lösche gerade eines der Backups, vielleicht hilft das.

Wünsch' mir Glück! ;-)
 
Ufff - der Schlag, den Du vielleicht eben gehört hast, war der Stein, der mir vom Herzen fiel.

Das war's, jetzt läuft der Server wieder.

Ich habe mit folgendem Kommando (aus dem Rettungssystem) nach großen Dateien gesucht:

find /repair -type f -size +100000k -exec ls -lh {} \; | awk '{ print $9 ": " $5 }'

Das Ergebnis war relativ eindeutig.

Meine Herren, das waren unterhaltsame zwei Stunden. ;-I

Besten Dank jedenfalls für Deine Hilfe, und gute Nacht!

Gruß,
CEW4
 
Back
Top