automatisches Server Reboot

Spike2371

New Member
Moin,

habe nen Server bei S4Y auf dem nen BG läuft problematisch ist wenn sich der Server aufhängt und man mal nicht direkt neu übers Controll Panel neu rebooten kann. Zum Beispiel mitten in der Nacht.

Gibt es ne möglichkeit, dass man in solchen fällen irgendwie extern nen automatischen Reboot anschieben kann wenn zum Beispiel der Server länger als 10 Minuten nicht reagiert?
 

Whistler

Blog Benutzer
Falls es echte Server-Hardware mit passendem BMC und kein virtualisiertes System ist, schau Dir mal bmc-watchdog an.
Falls Du noch einen zweiten Server hast, kann man auch von dort aus das problematische System überwachen (z.B. per Nagios, Linux-HA oder selbstgeschriebenem Script) und im Falle eines Falles ebenfalls gescriptet einen Reset über das Kundenzentrum auslösen.
 

The_Nero

Supporter
Nabend,

so ein Verhalten hatte ich schon mal bei einem System, wo eine PHP Datei zum Dossen eingeschleußt wurde. Wenn der Server seine Komplette Bandbreite zum Attackieren fremder Server verbraucht, kommt es natürlich so vor, als ob dieser nicht mehr reagiert. Das würde auch auf das angegebene Zeitfenster ( Abends/Nachts ) zutreffen, wenn die Script Kiddies wieder mit Red Bull unterwegs sind.

Also: Augen auf und Monitoring an! Das System sollte definitiv mal durchgescannt werden und ggf. ein Skript zum Überwachen eingepflegt werden (IF Load >= X; then ps auxfwww >> /logging.txt;fi ...).

Just my 2 cents.
 

Spike2371

New Member
Ok gibts da irgend ne fertige software mit der man die Prozessauslastung loggen kann? Oder direkt ne Überwachung für PHP und PERL etc.

Nutze Ubuntu 12.04 LTS
 

fx123

New Member
Was jetzt? Ist der Server wirklich down oder nur (von aussen) nicht erreichbar?

Wenn der Server nicht erreichbar ist, aber gleichzeitig noch läuft, dann sollte man das ja z.B. anhand der Timestamps in den unterschiedlichsten Logs sehen können.
 

Whistler

Blog Benutzer
In solchen Fällen kann es hilfreich sein, einen Remote-Syslog-Server zu definieren.
Ich hatte (bei HP-Markengeräten) durchaus schon den Fall, daß nur der RAID-Controller unpäßlich war (Exception irgendwas in der Firmeware - es gab dann von HP ein Update) und die Kiste recht unresponsiv wurde (selbst Konsolen-Login ging nicht mehr, Ping und ein paar aus dem RAM bediente Services aber schon). Da war in den (lokalen) Logs auch nix von zu sehen :(
 

Spike2371

New Member
Was jetzt? Ist der Server wirklich down oder nur (von aussen) nicht erreichbar?

Wenn der Server nicht erreichbar ist, aber gleichzeitig noch läuft, dann sollte man das ja z.B. anhand der Timestamps in den unterschiedlichsten Logs sehen können.
Also die IP war weder per Browser noch SSH zu erreichen, musste über das Powerpanel bei S4Y nen Hardwarereset auslösen. letzter eintrag im syslog war 2 Uhr wo planmässig ein paar cronjobs abliefen (deren Logs zeigten keine Fehler).

Der nächste eintrag ging dann ab 9:20 wieder los, als der Server wieder hochfuhr, andere logs zeigten auch keine auffälligkeiten.
 

Top