Unerklärliche Abstürze

Extrakt

Registered User
Hallo allerseits,
mein Server stürzt nun schon seit einiger Zeit öfters mal nach 2 Tagen ab, jedoch konnte Strato kein Hardwarefehler feststellen.
Folgende Zeilen erscheinen @ "warn":

Code:
Aug 25 15:19:15 hxxxx kernel: Unable to handle kernel NULL pointer dereference at virtual address 00000004
Aug 25 15:19:15 hxxxx kernel:  printing eip:
Aug 25 15:19:15 hxxxx kernel: c012f06d
Aug 25 15:19:15 hxxxx kernel: *pde = 00000000
Aug 25 15:19:15 hxxxx kernel: Oops: 0002
Aug 25 15:19:15 hxxxx kernel: CPU:    0
Aug 25 15:19:15 hxxxx kernel: EIP:    0010:[pte_free_fast+61/80]    Not tainted
Aug 25 15:19:15 hxxxx kernel: EIP:    0010:[<c012f06d>]    Not tainted
Aug 25 15:19:15 hxxxx kernel: EFLAGS: 00010202
Aug 25 15:19:15 hxxxx kernel: eax: 00000000   ebx: cc500000   ecx: c03ed880   edx: d6ef4000
Aug 25 15:19:15 hxxxx kernel: esi: 000002e0   edi: dbead2a0   ebp: bffe4000   esp: d6ef5e78
Aug 25 15:19:15 hxxxx kernel: ds: 0018   es: 0018   ss: 0018
Aug 25 15:19:16 hxxxx kernel: Process php (pid: 3830, stackpage=d6ef5000)
Aug 25 15:19:16 hxxxx kernel: Stack: d669e084 c012cd7b cc500000 d669ec00 dbead2a0 db60b140 00000000 dbead2a0 
Aug 25 15:19:16 hxxxx kernel:        00000000 c01307eb dbead2a0 00000000 00000300 00000000 dbead2a0 d6ef4000 
Aug 25 15:19:16 hxxxx kernel:        00000000 0000000b c011a095 dbead2a0 c03ef0c0 dbead2a0 c011ff3a dbead2a0 
Aug 25 15:19:16 hxxxx kernel: Call Trace:    [clear_page_tables+59/112] [exit_mmap+299/352] [mmput+117/224] [do_exit+218/720] [collect_signal+174/256]
Aug 25 15:19:16 hxxxx kernel: Call Trace:    [<c012cd7b>] [<c01307eb>] [<c011a095>] [<c011ff3a>] [<c0126fbe>]
Aug 25 15:19:16 hxxxx kernel:   [sig_exit+213/224] [dequeue_signal+100/208] [do_signal+486/720] [file_read_actor+0/272] [sys_read+206/272] [do_page_fault+0/1248]
Aug 25 15:19:16 hxxxx kernel:   [<c0126e25>] [<c0127074>] [<c0107456>] [<c0132d80>] [<c014533e>] [<c0116c40>]
Aug 25 15:19:16 hxxxx kernel:   [signal_return+20/24]
Aug 25 15:19:16 hxxxx kernel:   [<c01077a8>]
Aug 25 15:19:16 hxxxx kernel: 
Aug 25 15:19:16 hxxxx kernel: Code: ff 4a 04 8b 42 14 39 42 04 7c 02 5b c3 5b e9 f0 92 fe ff 80 
Aug 25 15:19:16 hxxxx kernel:  <6>note: php[3830] exited with preempt_count 2

..oder..

Code:
Aug 15 03:25:38 hxxxx kernel: Unable to handle kernel paging request at virtual address 4a2774d4
Aug 15 03:25:38 hxxxx kernel:  printing eip:
Aug 15 03:25:38 hxxxx kernel: 4a2774d4
Aug 15 03:25:38 hxxxx kernel: *pde = 00000000
Aug 15 03:25:38 hxxxx kernel: Oops: 0000
Aug 15 03:25:38 hxxxx kernel: CPU:    0
Aug 15 03:25:38 hxxxx kernel: EIP:    0010:[usb_stor_exit+1244099684/3222273936]    Not tainted
Aug 15 03:25:38 hxxxx kernel: EIP:    0010:[<4a2774d4>]    Not tainted
Aug 15 03:25:38 hxxxx kernel: EFLAGS: 00010282
Aug 15 03:25:38 hxxxx kernel: eax: dcabc0c1   ebx: df6dc620   ecx: bfffbba8   edx: dcabe000
Aug 15 03:25:38 hxxxx kernel: esi: bfffbba8   edi: dc6d5b00   ebp: bfffbba8   esp: dcabdef0
Aug 15 03:25:38 hxxxx kernel: ds: 0018   es: 0018   ss: 0018
Aug 15 03:25:38 hxxxx kernel: Process httpd2-prefork (pid: 936, stackpage=dcabd000)
Aug 15 03:25:38 hxxxx kernel: Stack: 00000000 dcabc000 00000000 00000000 013de117 df6dc620 df6dc63c c0116d78 
Aug 15 03:25:38 hxxxx kernel:        df6dc620 dc6d5b00 bfffbba8 00000001 dcabc000 00000001 dcabdf48 dcabdf90 
Aug 15 03:25:38 hxxxx kernel:        00030002 c037c5b0 de450ee0 dcabc000 c037c4fc c1030020 00000207 fffffffe 
Aug 15 03:25:38 hxxxx kernel: Call Trace:    [do_page_fault+312/1248] [sys_wait4+345/1168] [do_page_fault+0/1248] [error_code+52/64]
Aug 15 03:25:38 hxxxx kernel: Call Trace:    [<c0116d78>] [<c01202c9>] [<c0116c40>] [<c0107894>]
Aug 15 03:25:38 hxxxx kernel: 
Aug 15 03:25:38 hxxxx kernel: Code:  Bad EIP value.

Versteht vielleicht einer mehr als ich und kann den Fehler eventuell eingrenzen?
Ein Filesystem-Problem ist es ebenfalls nicht, habe auch schon Neuinstallationen durchgeführt.
 
Hi

Hast du schon mal dein hoster angeschrieben,???
ich bin zwar noch anfänger aber ich denke mal das es ein kernel problem ist,
hier mal ein beispiel:

Code:
Aug 25 15:19:15 hxxxx kernel: Unable to handle kernel NULL pointer dereference at virtual address 00000004

mfg
dereine
 
Naja, der Hoster hilft normalerweise nicht bei Kernel Problemen, es sei denn ist es ein gemanageter Server.

Aber prüfe mal die Configs und auch deine PHP Scripts, denn die Kernel Fehler kommen einmal vom Apache und einmal direkt von PHP

Aug 25 15:19:16 hxxxx kernel: Process php (pid: 3830, stackpage=d6ef5000)
Aug 15 03:25:38 hxxxx kernel: Process httpd2-prefork (pid: 936, stackpage=dcabd000)
 
Wobei ein PHP-Script oder ein httpd-Prozess eigentlich nicht den Kernel "killen" dürften, oder ? Hast du da irgendwas selbst dran gebastelt ? Also eigener Kernel, eigener Apache, eigenes PHP ?
 
Letztendlich fällt hier der Kernel auf die Nase, wobei PHP und Apache nur gerade vom Kernel behandelt wurden.
Der Fehler kann also durchaus im Kernel liegen.

tim
 
Ich würde zu 98,75% behaupten, dass da ein Speicherriegel einen Schuss hat.
Ist das ein vanilla-SuSE (oder welche Distro auch immer)-Kernel oder ein Eigenbau? Die Fehlermeldungen dem Support mailen mit der Bitte um Hardwaretausch (RAM).
 
Komisch dass Strato sich mit dem Austausch so anstellt...

Hier mal die Mail vom Support als mein Server defekt war. Vielleicht schickst du ihnen auch einfach mal ein Fax :D

Ihr HighEnd-Server soll wegen eines Hardwaredefektes ausgetauscht werden.

Beachten Sie bitte, dass durch den Austausch Ihres Servers alle Daten,
Einstellungen und zusätzlich installierten Software-Pakete verloren gehen,
die Sie nach Erhalt des Servers erzeugt, vorgenommen bzw. installiert haben.
Stellen Sie deswegen sicher, dass alle von ihnen erzeugten relevanten Daten,
installierte oder modifizierte Skripte, Einstellungen und sonstige
relevanten Dateien als Sicherungskopie vorliegen.

Benachrichtigen Sie uns bitte per Fax über Ihr Einverständnis zum Austausch
des Servers.

Nachfolgend ein Beispiel für ein entsprechendes Anschreiben:

"Bitte tauschen Sie meinen defekten HighEnd-Server durch einen neuen Server
aus. Ich bin informiert, dass alle auf dem Server hinterlegten Daten und
Konfigurationen hierbei verloren gehen."

Folgende Informationen müssen außerdem in Ihrem Schreiben enthalten sein:

1. Der Hostname des HighEnd-Servers
2. Diejenige Person, die den HighEnd-Server bestellt hat (Vertragspartner
mit der STRATO AG)
3. Die Telefonnummer, unter der der Vertragspartner erreichbar ist
4. Falls vorhanden: eine Emailadresse des Vertragspartners, auch wenn der
HighEnd-Server nicht mehr erreichbar ist
5. Die Auftragsnummer für den HighEnd-Server
6. Eine Ausweise-Kopie des Vertragspartners (Reisepass oder
Bundespersonalausweis).

Bitte beachten Sie:

1. Nur diejenige Person, die bei der Bestellung des HighEnd-Servers
angegeben worden ist (Vertragspartner), ist autorisiert, dieses Schreiben
einzureichen. Sie muss im Schreiben genannt sein und es unterschrieben
haben.

2. Falls die Ausweis-Kopie nicht lesbar ist, wird Ihr Schreiben abgelehnt.

3. Um sicherzustellen, dass bei der Strato Medien AG eine lesbare
Ausweis-Kopie eintrifft, sollten Sie Folgendes tun:

a) verwenden Sie idealerweise ein Faxgerät, und keine Fax-Software. Der
Einsatz von Fax-Software kann dazu führen, dass eine Ausweis-Kopie nach der
Fax-Übertragung unlesbar eintrifft.

b) Fügen Sie deswegen eine Fotokopie Ihres Ausweises dem Fax bei. Zu
empfehlen ist das Beilegen von zwei Fotokopien: Kopie 1 Ihres Ausweises ist
mit einer normalen Druckerschwärze erstellt worden, Kopie 2 mit einer
geringeren Druckerschwärze (helleres Kopierergebnis). Ist Kopie 1 nicht
lesbar, weil zu dunkel, dann sollte Kopie 2 lesbar sein.

4. Nach Erhalt Ihres Faxes, und nachdem die Technische Hotline das Fax auf
Richtig-, Vollständig- und Lesbarkeit hin überprüft und Ihren Auftrag
bezüglich des Hardware-Tauschs akzeptiert hat, kann der Server jederzeit und
ohne Ankündigung durch das Rechenzentrum ausgetauscht werden. Sie sollten
deswegen, bevor Sie das Fax an die Technische Hotline schicken, Ihre Daten,
die sich auf dem Server befinden, gesichert haben (unter der Voraussetzung,
dass der Zugriff auf Ihren Server möglich ist).

Schicken Sie bitte das unterschriebene Fax an folgende Nummer:

030 / 88 615 117
 
Hallo!
Strato treibt diesen Aufwand, da durch den Hardwaretausch die Daten verloren gehen.

mfG
Thorsten
 
Extrakt said:
mein Server stürzt nun schon seit einiger Zeit öfters mal nach 2 Tagen ab, jedoch konnte Strato kein Hardwarefehler feststellen.
Ich hatte dies ebenfalls vor Kurzem bei 1und1. Dort war es die Festplatte, die fast immer wärend des täglichen Backups vollständig aussetzte, ohne, daß es noch schaffte Fehlermeldungen in Logfiles zu schreiben.

Es gab allerdings vorher schon Hinweise darauf: etwas vier Wochen vorher begann es, daß regelmässig folgende Fehler geloggt wurden:
(einfach aus meinen logwatch-Mails kopiert)
Code:
1 Time(s): hda: drive not ready for command
1 Time(s): hda: status timeout: status=0xd0 { Busy }
1 Time(s): hda: timeout waiting for DMA
1 Time(s): ide0: reset: success
1 Time(s): ide_dmaproc: chipset supported ide_dma_timeout func only: 14

huschi.
 
Vielen Dank für eure zahlreichen Antworten ;)
Ja, Strato stellt sich wirklich bisschen dumm an, habe nun schon x Mails an Strato geschickt.
@Sasche: Wie soll ich dir nur danken? Bist wirklich sehr nett, mein Retter ;) :)
 
Back
Top