Nach 145 Tagen absturz....

pas

Registered User
Hallo,
mein Server hatte nach 145 Tagen problemloser Arbeit einfach ein total Ausfall gebracht, konnte Ihn nur noch über einen Reboot bei der Adminconsole vom Provider wieder hochfahren, jedoch nach etwa 30 Min war der Server wieder down.... Hatte dann nochmals in Rebootet und nun läuft er wieder seit 2 Tagen, in den Logs habe ich jedoch keine Mermale für einen Ausfall gefunden.
Hier lediglich eine Zeitlücke:
Jul 28 15:49:01 p013 /usr/sbin/cron[10952]: (root) CMD (/root/confixx/confixx_counterscript.pl)
Jul 28 15:49:01 p013 /usr/sbin/cron[10954]: (web4) CMD (perl /home/www/web4/files/orderpanel/job/job.pl)
Jul 28 14:53:27 p013 syslog-ng[2231]: syslog-ng version 1.6.8 starting
Jul 28 14:53:29 p013 saslauthd[2267]: detach_tty : master pid is: 2267
Jul 28 14:53:29 p013 saslauthd[2267]: ipc_init : listening on socket: /var/run/sasl2//mux
Jul 28 14:53:32 p013 kernel: klogd 1.4.1, log source = /proc/kmsg started.
Jul 28 14:53:32 p013 kernel: AppArmor: AppArmor (version 2.0-19.43r6320) initialized
Jul 28 14:53:32 p013 kernel: audit(1185634261.214:2): AppArmor (version 2.0-19.43r6320) initialized
Jul 28 14:53:32 p013 syslog-ng[2231]: Changing permissions on special file /dev/xconsole
Jul 28 14:53:32 p013 syslog-ng[2231]: Changing permissions on special file /dev/tty10
.... SERVER START....

WIe Ihr in den logs seht, verändert sich lediglich die PID und die Uhrzeit (da diese später auch wieder synchronisiert wird) jedoch ist sonst nichts auffälliges in den WARN und MESSAGES Logs zu sehen.
Ein "uptime" konnte ich leider nicht mehr durchführen da ja der Server dabei schon down war....
Der aktuelle uptime:
Code:
 10:00am  an 2 Tage 18:10,  1 Benutzer,  Durchschnittslast: 1,03, 0,72, 0,48

Speicherplatz:
Dateisystem Größe Benut Verf Ben% Eingehängt auf
/dev/md0 146G 24G 115G 18% /
udev 499M 96K 498M 1% /dev
/dev/sda5 487M 15M 447M 4% /boot

Wie kann ich die Ursache herausfinden?
Habe nun manchmal Verbindungsprobleme, sprich Ladezeiten verlängern sich extrem, bei diesen Zeiträumen bekomme ich beim SSH-Login auch manchmal ein Timeout nach der Eingabe der Benutzerdaten....

Vielen DanK!
 
Last edited by a moderator:
Ich würde z.B. ein MRTG (oder ähnliches Teil) installieren und dann nach einem Absturz nach Zusammenhängen suchen.

Oder Du gest mit der Hand an Logfiles ran und untersuchst die Menge von Emails und die Menge von ausgelieferten Webseiten und die Anzahl der MySQL-Queries, etc...

-- verschoben nach Server --

huschi.
 
Back
Top