Hallo,
wir haben hier inzwischen den Notstand ausgerufen
Wir sind bei s4You und haben dort nen root-Server mit Suse10.1.
Ich kann leider nichtmehr genau sagen wann es eingesetzt hat, aber wir haben inzwischen seit Wochen Aussetzer des Servers die in unregelmäßigen Abständen auftreten.
Die Serverhardware wurde von S4You bereits geprüft und für einwandfrei erklärt.
Die Logfiles sagen uns auch herzlich wenig, außer dass das System herunter gefahren wird... Aber wie kann das sein, das sind nicht wir die das system halt auslösen!
Ich hab hier mal einige Auszüge aus der message.log
und 4minuten später:
und weitere 4min später:
Und heute ein wenig anders. Der Server war pingbar, aber weder per SSH noch FTP oder HTTP erreichbar. Den awstatsupdate-Cron hab ich mal vorrübergehend deaktiviert, aber das ist das einzige mal, dass dieser Cron unmittelbar bevor der Server weg war ausgeführt wurde.
Ich hoffe ihr könnt mehr entdecken als ich.
Welche Möglichkeiten gibt es noch den Fehler zu lokalisieren?
Viele Grüße,
Robin
wir haben hier inzwischen den Notstand ausgerufen
Wir sind bei s4You und haben dort nen root-Server mit Suse10.1.
Ich kann leider nichtmehr genau sagen wann es eingesetzt hat, aber wir haben inzwischen seit Wochen Aussetzer des Servers die in unregelmäßigen Abständen auftreten.
Die Serverhardware wurde von S4You bereits geprüft und für einwandfrei erklärt.
Die Logfiles sagen uns auch herzlich wenig, außer dass das System herunter gefahren wird... Aber wie kann das sein, das sind nicht wir die das system halt auslösen!
Ich hab hier mal einige Auszüge aus der message.log
Code:
Mar 7 17:14:31 login-server12 sshd[3252]: Accepted keyboard-interactive/pam for root from 80.171.48.39 port 32935 ssh2
Mar 7 17:14:31 login-server12 sshd[3252]: subsystem request for sftp
Mar 7 17:16:09 login-server12 sshd[3375]: Accepted keyboard-interactive/pam for root from 80.171.48.39 port 32968 ssh2
Mar 7 17:17:45 login-server12 kernel: st: Version 20050830, fixed bufsize 32768, s/g segs 256
Mar 7 17:20:01 login-server12 /usr/sbin/cron[3954]: (root) CMD (rcclamd restart #ClamAV Restart)
Mar 7 17:20:04 login-server12 syslog-ng[2376]: SIGHUP received, restarting syslog-ng
Mar 7 17:20:05 login-server12 syslog-ng[2376]: new configuration initialized
Mar 7 17:20:19 login-server12 shadow[4350]: group already exists - group=vscan, by=0
Mar 7 17:20:19 login-server12 useradd[4351]: account already exists - account=vscan, by=0
Mar 7 17:20:19 login-server12 shadow[4352]: default group changed - account=vscan, uid=65, gid=107, old gid=107, by=0
Mar 7 17:20:26 login-server12 syslog-ng[2376]: SIGHUP received, restarting syslog-ng
Mar 7 17:20:27 login-server12 syslog-ng[2376]: new configuration initialized
Mar 7 17:26:40 login-server12 shutdown[5040]: shutting down for system halt
Mar 7 17:26:41 login-server12 init: Switching to runlevel: 0
Mar 7 17:26:43 login-server12 saslauthd[2468]: server_exit : master exited: 2468
Mar 7 17:26:43 login-server12 sshd[2738]: Received signal 15; terminating.
Mar 7 17:26:43 login-server12 xinetd[2737]: Exiting...
und 4minuten später:
Code:
Mar 7 17:30:36 login-server12 xinetd[2683]: xinetd Version 2.3.14 started with libwrap loadavg options compiled in.
Mar 7 17:30:36 login-server12 xinetd[2683]: Started working: 1 available service
Mar 7 17:30:37 login-server12 webmin[2389]: Webmin starting
Mar 7 17:30:38 login-server12 kernel: BIOS EDD facility v0.16 2004-Jun-25, 2 devices found
Mar 7 17:30:41 login-server12 /usr/sbin/cron[3035]: (CRON) STARTUP (V5.0)
Mar 7 17:30:43 login-server12 kernel: eth0: no IPv6 routers present
Mar 7 17:30:46 login-server12 shutdown[3127]: shutting down for system halt
Mar 7 17:30:48 login-server12 init: Switching to runlevel: 0
und weitere 4min später:
Code:
Mar 7 17:34:31 login-server12 syslog-ng[2376]: syslog-ng version 1.6.8 starting
Mar 7 17:34:36 login-server12 kernel: klogd 1.4.1, log source = /proc/kmsg started.
Mar 7 17:34:36 login-server12 kernel: EXT3 FS on md1, internal journal
Mar 7 17:34:36 login-server12 kernel: ACPI: Power Button (FF) [PWRF]
Mar 7 17:34:36 login-server12 kernel: ACPI: Power Button (CM) [PWRB]
Mar 7 17:34:36 login-server12 kernel: NET: Registered protocol family 10
Mar 7 17:34:36 login-server12 kernel: lo: Disabled Privacy Extensions
Mar 7 17:34:36 login-server12 kernel: IPv6 over IPv4 tunneling driver
Mar 7 17:34:36 login-server12 saslauthd[2539]: detach_tty : master pid is: 2539
Mar 7 17:34:36 login-server12 saslauthd[2539]: ipc_init : listening on socket: /var/run/sasl2//mux
Mar 7 17:34:37 login-server12 ifup: sit0
Mar 7 17:34:37 login-server12 syslog-ng[2376]: Changing permissions on special file /dev/xconsole
Mar 7 17:34:37 login-server12 syslog-ng[2376]: Changing permissions on special file /dev/tty10
Mar 7 17:34:37 login-server12 ifup: No configuration found for sit0
Mar 7 17:34:37 login-server12 xinetd[2598]: Reading included configuration file: /etc/xinetd.d/chargen [file=/etc/xinetd.conf] [line=26]
Mar 7 17:34:37 login-server12 xinetd[2598]: Reading included configuration file: /etc/xinetd.d/chargen-udp [file=/etc/xinetd.d/chargen-udp] [line=12]
Mar 7 17:34:37 login-server12 xinetd[2598]: Reading included configuration file: /etc/xinetd.d/cvs [file=/etc/xinetd.d/cvs] [line=13]
Mar 7 17:34:37 login-server12 kernel: powernow-k8: Found 2 AMD Athlon 64 / Opteron processors (version 1.60.2)
Mar 7 17:34:37 login-server12 kernel: powernow-k8: 0 : fid 0xc (2000 MHz), vid 0xa (1300 mV)
Mar 7 17:34:37 login-server12 kernel: powernow-k8: 1 : fid 0xa (1800 MHz), vid 0xc (1250 mV)
Mar 7 17:34:37 login-server12 kernel: powernow-k8: 2 : fid 0x2 (1000 MHz), vid 0x12 (1100 mV)
Und heute ein wenig anders. Der Server war pingbar, aber weder per SSH noch FTP oder HTTP erreichbar. Den awstatsupdate-Cron hab ich mal vorrübergehend deaktiviert, aber das ist das einzige mal, dass dieser Cron unmittelbar bevor der Server weg war ausgeführt wurde.
Code:
Mar 9 02:27:01 login-server12 /usr/sbin/cron[18217]: (root) CMD (/root/uceprotect_spam_update/update #Uceprotect Spamliste aktualisieren)
Mar 9 02:45:09 login-server12 syslog-ng[2375]: STATS: dropped 0
Mar 9 03:27:01 login-server12 /usr/sbin/cron[18601]: (root) CMD (/root/uceprotect_spam_update/update #Uceprotect Spamliste aktualisieren)
Mar 9 03:45:10 login-server12 syslog-ng[2375]: STATS: dropped 0
Mar 9 04:17:01 login-server12 /usr/sbin/cron[18846]: (root) CMD (/usr/local/confixx/app-update.pl #Webapplication Update)
Mar 9 04:27:01 login-server12 /usr/sbin/cron[18881]: (root) CMD (/root/uceprotect_spam_update/update #Uceprotect Spamliste aktualisieren)
Mar 9 04:31:01 login-server12 /usr/sbin/cron[18936]: (root) CMD (/etc/reoback/run_reoback.sh #Backup Script)
Mar 9 04:45:10 login-server12 syslog-ng[2375]: STATS: dropped 0
Mar 9 05:27:01 login-server12 /usr/sbin/cron[19152]: (root) CMD (/root/uceprotect_spam_update/update #Uceprotect Spamliste aktualisieren)
Mar 9 05:27:01 login-server12 /usr/sbin/cron[19154]: (root) CMD (/usr/sbin/ntpdate ntp2.intergenia.de 2>/dev/null >/dev/null && hwclock -w 2>/dev/null >/dev/null)
Mar 9 05:27:01 login-server12 /usr/sbin/cron[19161]: (root) CMD (/root/uceprotect_spam_update/update #Uceprotect Spamliste aktualisieren)
Mar 9 05:45:11 login-server12 syslog-ng[2375]: STATS: dropped 0
Mar 9 06:00:01 login-server12 /usr/sbin/cron[19444]: (root) CMD ( /usr/sbin/awstats-update)
Mar 9 10:43:55 login-server12 syslog-ng[2393]: syslog-ng version 1.6.8 starting
Mar 9 10:43:56 login-server12 saslauthd[2431]: detach_tty : master pid is: 2431
Ich hoffe ihr könnt mehr entdecken als ich.
Welche Möglichkeiten gibt es noch den Fehler zu lokalisieren?
Viele Grüße,
Robin