Kernelfehlermeldung - was tun?

snake*sl

Registered User
Hi,

erstmal zum System:
Suse Linux 9.1 mit Confixx (1und1)

Der Server ist gestern abgestürzt, im Rescue-System hab ich die Platte gemountet und folgendes in var/log/messages gefunden:

Code:
Jan 11 18:51:06 p15134494 kernel: invalid operand: 0000 [#1]
Jan 11 18:51:06 p15134494 kernel: SMP
Jan 11 18:51:06 p15134494 kernel: Modules linked in: sg ide_cd cdrom md5 ipv6
Jan 11 18:51:06 p15134494 kernel: CPU:    0
Jan 11 18:51:06 p15134494 kernel: EIP:    0060:[<c00a4098>]    Not tainted VLI
Jan 11 18:51:06 p15134494 kernel: EFLAGS: 00010006   (2.6.9-041214)
Jan 11 18:51:06 p15134494 kernel: EIP is at 0xc00a4098
Jan 11 18:51:06 p15134494 kernel: eax: ca5e1fc4   ebx: b7dad448   ecx: 0000007b   edx: 00000000
Jan 11 18:51:06 p15134494 kernel: esi: 00000006   edi: c0111998   ebp: 00000000   esp: ca5e1f08
Jan 11 18:51:06 p15134494 kernel: ds: 007b   es: 007b   ss: 0068
Jan 11 18:51:06 p15134494 kernel: Process spamd (pid: 11941, threadinfo=ca5e0000 task=de3f9350)
Jan 11 18:51:06 p15134494 kernel: Stack: c0111a05 b7dad448 00000006 c0111998 bffff7a8 d99de680 c158e800 ca5e1fc4
Jan 11 18:51:06 p15134494 kernel:        c02f3f7e 00000006 0000000e 0000000b c13fae80 c0299b2f df7d2880 d99de280
Jan 11 18:51:06 p15134494 kernel:        d99de280 c888be80 c0299c06 d99de280 00000000 c029f136 d99de280 00000001
Jan 11 18:51:06 p15134494 kernel: Call Trace:
Jan 11 18:51:06 p15134494 kernel:  [do_page_fault+109/1309] do_page_fault+0x6d/0x51d
Jan 11 18:51:06 p15134494 kernel:  [<c0111a05>] do_page_fault+0x6d/0x51d
Jan 11 18:51:06 p15134494 kernel:  [do_page_fault+0/1309] do_page_fault+0x0/0x51d
Jan 11 18:51:06 p15134494 kernel:  [<c0111998>] do_page_fault+0x0/0x51d
Jan 11 18:51:06 p15134494 kernel:  [kfree_skbmem+23/28] kfree_skbmem+0x17/0x1c
Jan 11 18:51:06 p15134494 kernel:  [<c0299b2f>] kfree_skbmem+0x17/0x1c
Jan 11 18:51:06 p15134494 kernel:  [__kfree_skb+210/216] __kfree_skb+0xd2/0xd8
Jan 11 18:51:06 p15134494 kernel:  [<c0299c06>] __kfree_skb+0xd2/0xd8
Jan 11 18:51:06 p15134494 kernel:  [net_tx_action+110/308] net_tx_action+0x6e/0x134
Jan 11 18:51:06 p15134494 kernel:  [<c029f136>] net_tx_action+0x6e/0x134
Jan 11 18:51:06 p15134494 kernel:  [handle_IRQ_event+40/88] handle_IRQ_event+0x28/0x58
Jan 11 18:51:06 p15134494 kernel:  [<c0105fe4>] handle_IRQ_event+0x28/0x58
Jan 11 18:51:06 p15134494 kernel:  [gcc2_compiled.+106/212] __do_softirq+0x6a/0xd4
Jan 11 18:51:06 p15134494 kernel:  [<c011b69a>] __do_softirq+0x6a/0xd4
Jan 11 18:51:06 p15134494 kernel:  [do_IRQ+270/292] do_IRQ+0x10e/0x124
Jan 11 18:51:06 p15134494 kernel:  [<c010637a>] do_IRQ+0x10e/0x124
Jan 11 18:51:06 p15134494 kernel:  [error_code+45/56] error_code+0x2d/0x38
Jan 11 18:51:06 p15134494 kernel:  [<c01046ed>] error_code+0x2d/0x38
Jan 11 18:51:06 p15134494 kernel: Code: ff ff ff ff ff ff ff ff ff ff ff ff ff ff ff ff ff ff ff ff ff ff ff ff ff ff ff ff ff ff ff ff ff ff ff ff ff ff ff f
f ff ff ff <ff> ff ff ff ff ff ff ff ff ff ff ff ff ff ff ff ff ff ff ff ff
Jan 11 18:51:06 p15134494 kernel: klogd 1.4.1, ---------- state change ----------
Jan 11 18:51:06 p15134494 kernel: Inspecting /boot/System.map-2.6.9-041214
Jan 11 18:51:06 p15134494 kernel: Loaded 28013 symbols from /boot/System.map-2.6.9-041214.
Jan 11 18:51:06 p15134494 kernel: Symbols match kernel version 2.6.9.
Jan 11 18:51:06 p15134494 kernel: No module symbols loaded - kernel modules not enabled.
Jan 11 18:51:06 p15134494 kernel:  <3>KERNEL: assertion ((int)tcp_packets_in_flight(tp) >= 0) failed at net/ipv4/tcp_input.c (1170)
Jan 11 18:51:06 p15134494 kernel: KERNEL: assertion ((int)tcp_packets_in_flight(tp) >= 0) failed at net/ipv4/tcp_input.c (1170)
Jan 11 18:51:06 p15134494 last message repeated 9 times
Jan 11 18:51:06 p15134494 kernel: eth0: link down

Bei eth0: link down wurde vom 1und1-System automatisch die Verbindung gekappt. Diese wurde jetzt wiederhergestellt, damit wir im Rescue-System auf Fehlersuce gehen können. Nun kann ich mit der Meldung allerdings nichts anfangen.

Habt Ihr einen Hinweis oder eine Idee?

Vielen Dank schonmal!
 
Auf alle Fälle alle möglichen Daten zum Kernel (Distribution, eigener Kernel oder Distributionskernel, .config, geladenene Module,) plus das Log zum Kernelcrash sammeln und das ganze dann auf eine Mailingliste deiner Distribution oder auch gleich direkt auf die Kernelmailingliste. Kernelcrashes sind nicht gerne gesehen ...

Das ist ein Fehler im Umfeld des Virtual-Memory-Systems, mehr ist leider für mich nicht ersichtlich.
 
Sehr wahrscheinlich ein Defekt des Speichers (RAM, Video oder Cash); lasse mal memtest laufen (gut lange)
 
Back
Top