Boot-Probleme Strato HighQ XPro8 Ubuntu 10.04 + Plesk 10.2

strousberg

New Member
Guten Abend an Alle, ein schönes und offenbar hilfreiches Forum habt ihr hier -> das ist auch der Grund, warum ich mich mit meinem Problem an euch wende, bevor ich aus wirklichem Zeitdruck eine Datenrettung in den frühen Morgenstunden in Betracht ziehen muss. Mein Problem:

wir haben unseren Server seit ein paar Tagen in Betrieb. Eingerichtet sind 7 Domains, 7 Abonnements und 2 Kunden. Unter der Hauptdomain "h1930685.stratoserver.net" gibt es ausserdem einige Verzeichnisse, die als Testumgebung für Kunden genutzt werden. Heute morgen sollten dann einige Addons installiert werden:

- eine 2. IPv Adresse
- Plesk Add-on SpamAssassin und
- Plesk Add-on Power Pack (Linux)

Gestern wurde darüber hinaus eine IPv6 Adresse versucht anzulegen. Dies passierte "irgendwie" nach der Strato-Beschreibung, obwohl das sicherlich direkt über Plesk möglich gewesen wäre. Nach der Installation heute morgen (alle aufgeführten Punkte sind zumindest schon in unserem Paket integriert), wurde der Server rebootet. Nach Abschluss erschien nur noch HTTP (Port 80) ist offline. Es hat den gesamten Tag beansprucht, bis ein SSH Login über die RemoteConsole möglich war. Vorangegangen sind auf Anweisung des (ich weiss, nicht zuständigen weil eigenverantwortlich) Strato-Support diverse Boot-Vorgänge. Mal im Resche-, mal im Boot-Modus, mal mit und auch ohne "Maschine resetten". Mir sitzen seit heute morgen 3 genervte Kunden und ein nicht booten wollender Server im Nacken und langsam verlassen mich die Nerven -> das Wissen ist ohnehin aufgebraucht.

Log-Files poste ich gerne, will aber nicht von Anfang an alles zumüllen. Vielleicht gibt es ja schon Ansätze, die weiterhelfen. Ich danke allen schon im Voraus und vertraue mal dem Klischee, dass Admins genau so Nachtmenschen sind wie die Kreativen :)

- Sorry, ergänzend noch: es sind für die Hauptdomain sowie für 2 Kundendomains RapidSSL Zertifikate installiert, sowie für zwei weitere Domains ein TrueBusiness ID SAN-Zertifikat von Geo Trust.
 
Wie ist der Status im Moment? Wie kommst du per SSH an den Server ran? Nur Rescue-Modus oder auch, wenn die Bude normal bootet? In welchen Zustand bekommst du den Server, um darauf zu arbeiten?
 
Zugriff normal

Hi, wohl doch mal kurz weg genickt... also, der Zugriff nach normalem Boot funktioniert nur über den Rescue Mode.
 
Log nach "Strato FAQ"

Und damit der Durchblick leichter fällt, anbei doch einmal die kurze Fehlerauflistung - obwohl die Fehler sicher nicht in jeder Zeile vertreten sind.
Code:
Welcome to the Ubuntu Server!
 * Documentation:  [url]http://www.ubuntu.com/server/doc[/url]
root@h1930685:~# dmesg | grep [Ee]rro
[    2.820942] ACPI Error (psargs-0359): [ECEN] Namespace lookup failure, AE_NOT_FOUND
[    2.830002] ACPI Error (psparse-0537): Method parse/execution failed [\] (Node ffffffff81a65a80), AE_NOT_FOUND
root@h1930685:~# dmesg | grep [Ff]ault
[    0.000000] MTRR default type: uncachable
[    3.250009] NetLabel:  unlabeled traffic allowed by default
[    4.995068] io scheduler deadline registered (default)
root@h1930685:~# dmesg | grep [Nn]o
[    0.000000] SRAT: PXM 0 -> APIC 8 -> Node 0
[    0.000000] SRAT: PXM 0 -> APIC 9 -> Node 0
[    0.000000] SRAT: PXM 0 -> APIC 10 -> Node 0
[    0.000000] SRAT: PXM 0 -> APIC 11 -> Node 0
[    0.000000] SRAT: PXM 0 -> APIC 12 -> Node 0
[    0.000000] SRAT: PXM 0 -> APIC 13 -> Node 0
[    0.000000] SRAT: PXM 1 -> APIC 16 -> Node 1
[    0.000000] SRAT: PXM 1 -> APIC 17 -> Node 1
[    0.000000] SRAT: PXM 1 -> APIC 18 -> Node 1
[    0.000000] SRAT: PXM 1 -> APIC 19 -> Node 1
[    0.000000] SRAT: PXM 1 -> APIC 20 -> Node 1
[    0.000000] SRAT: PXM 1 -> APIC 21 -> Node 1
[    0.000000] SRAT: Node 0 PXM 0 0-a0000
[    0.000000] SRAT: Node 0 PXM 0 100000-e0000000
[    0.000000] SRAT: Node 0 PXM 0 100000000-220000000
[    0.000000] SRAT: Node 1 PXM 1 220000000-420000000
[    0.000000] NUMA: Allocated memnodemap from b040 - 13480
[    0.000000] Bootmem setup node 0 0000000000000000-0000000220000000
[    0.000000] Bootmem setup node 1 0000000220000000-0000000420000000
[    0.000000] [ffffea0007700000-ffffea00077fffff] potential offnode page_structs
[    0.000000]  [ffffea0000000000-ffffea00077fffff] PMD -> [ffff880001c00000-ffff880008dfffff] on node 0
[    0.000000]  [ffffea0007800000-ffffea000e7fffff] PMD -> [ffff880220200000-ffff8802271fffff] on node 1
[    0.000000]   Normal   0x00100000 -> 0x00420000
[    0.000000] Movable zone start PFN for each node
[    0.000000] early_node_map[5] active PFN ranges
[    0.000000] On node 0 totalpages: 2096712
[    0.000000]   Normal zone: 16128 pages used for memmap
[    0.000000]   Normal zone: 1163520 pages, LIFO batch:31
[    0.000000] On node 1 totalpages: 2097152
[    0.000000]   Normal zone: 28672 pages used for memmap
[    0.000000]   Normal zone: 2068480 pages, LIFO batch:31
[    0.000000] PM: Registered nosave memory: 0000000000001000 - 0000000000006000
[    0.000000] PM: Registered nosave memory: 000000000009d000 - 000000000009e000
[    0.000000] PM: Registered nosave memory: 000000000009e000 - 00000000000a0000
[    0.000000] PM: Registered nosave memory: 00000000000a0000 - 00000000000e6000
[    0.000000] PM: Registered nosave memory: 00000000000e6000 - 0000000000100000
[    0.000000] PM: Registered nosave memory: 00000000dfeb0000 - 00000000dfec0000
[    0.000000] PM: Registered nosave memory: 00000000dfec0000 - 00000000dfef0000
[    0.000000] PM: Registered nosave memory: 00000000dfef0000 - 00000000f0000000
[    0.000000] PM: Registered nosave memory: 00000000f0000000 - 00000000ffa00000
[    0.000000] PM: Registered nosave memory: 00000000ffa00000 - 0000000100000000
[    0.000000] NR_CPUS:256 nr_cpumask_bits:256 nr_cpu_ids:12 nr_node_ids:2
[    0.000000] Policy zone: Normal
[    0.000000] No AGP bridge found
[    0.000000] Node 0: aperture @ 20000000 size 32 MB
[    0.000000] Aperture pointing to e820 RAM. Ignoring.
[    0.000000] PM: Registered nosave memory: 0000000020000000 - 0000000024000000
[    0.000000] SLUB: Genslabs=14, HWalign=64, Order=0-3, MinObjects=0, CPUs=12, Nodes=2
[    0.095414] Inode-cache hash table entries: 1048576 (order: 11, 8388608 bytes)
[    0.180003] CPU 0/0x8 -> Node 0
[    0.050000] CPU 1/0x9 -> Node 0
[    0.050000] CPU 2/0xa -> Node 0
[    0.050000] CPU 3/0xb -> Node 0
[    0.050000] CPU 4/0xc -> Node 0
[    0.050000] CPU 5/0xd -> Node 0
[    0.050000] CPU 6/0x10 -> Node 1
[    0.050000] CPU 7/0x11 -> Node 1
[    0.050000] CPU 8/0x12 -> Node 1
[    0.050000] CPU 9/0x13 -> Node 1
[    0.050000] CPU 10/0x14 -> Node 1
[    0.050000] CPU 11/0x15 -> Node 1
[    2.720096] node 0 link 2: io port [1000, ffffff]
[    2.730007] node 0 link 2: mmio [e0000000, efffffff] ==> none
[    2.730009] node 0 link 2: mmio [f0000000, ffffffff]
[    2.730011] node 0 link 2: mmio [a0000, bffff]
[    2.730013] node 0 link 2: mmio [e0000000, dfffffff] ==> none
[    2.740001] bus: [00,1f] on node 0 link 2
[    2.830002] ACPI Error (psparse-0537): Method parse/execution failed [\] (Node ffffffff81a65a80), AE_NOT_FOUND
[    2.905186] ACPI: No dock devices found.
[    3.164816] vgaarb: device added: PCI:0000:01:04.0,decodes=io+mem,owns=io+mem,locks=none
[    3.336554] system 00:01: iomem range 0xfec20000-0xfec200ff could not be reserved
[    3.377231] system 00:09: iomem range 0xfec00000-0xfec00fff could not be reserved
[    3.705939] system 00:0e: iomem range 0x0-0x9ffff could not be reserved
[    3.732572] system 00:0e: iomem range 0xe0000-0xfffff could not be reserved
[    3.746577] system 00:0e: iomem range 0x100000-0xdfffffff could not be reserved
[    3.761328] system 00:0e: iomem range 0xfec00000-0xffffffff could not be reserved
[    3.918516]   alloc irq_desc for 53 on node 0
[    3.918521]   alloc kstat_irqs on node 0
[    3.932034]   alloc irq_desc for 54 on node 0
[    3.932035]   alloc kstat_irqs on node 0
[    4.016643] TCP reno registered
[    4.954528] alg: No test for stdrng (krng)
[    4.977795] io scheduler noop registered
[    5.013403]   alloc irq_desc for 56 on node 0
[    5.013408]   alloc kstat_irqs on node 0
[    5.013618]   alloc irq_desc for 57 on node 0
[    5.013620]   alloc kstat_irqs on node 0
[    5.326926]   alloc irq_desc for 16 on node 0
[    5.326931]   alloc kstat_irqs on node 0
[    5.393411]   alloc irq_desc for 17 on node 0
[    5.393413]   alloc kstat_irqs on node 0
[    5.509083]   alloc irq_desc for 19 on node 0
[    5.509085]   alloc kstat_irqs on node 0
[    5.911505]   alloc irq_desc for 18 on node 0
[    5.911507]   alloc kstat_irqs on node 0
[    6.344303] PNP: No PS/2 controller found. Probing ports directly.
[    6.479224] cpuidle: using governor ladder
[    6.487500] cpuidle: using governor menu
[    6.529512] powernow-k8: Found 2 AMD Opteron(tm) Processor 4180 processors (12 cpu cores) (version 2.20.00)
[    6.549211] powernow-k8:    0 : pstate 0 (2600 MHz)
[    6.559046] powernow-k8:    1 : pstate 1 (2300 MHz)
[    6.568891] powernow-k8:    2 : pstate 2 (1800 MHz)
[    6.578736] powernow-k8:    3 : pstate 3 (1300 MHz)
[    6.588582] powernow-k8:    4 : pstate 4 (800 MHz)
[    6.598829] powernow-k8:    0 : pstate 0 (2600 MHz)
[    6.608678] powernow-k8:    1 : pstate 1 (2300 MHz)
[    6.618512] powernow-k8:    2 : pstate 2 (1800 MHz)
[    6.628358] powernow-k8:    3 : pstate 3 (1300 MHz)
[    6.638203] powernow-k8:    4 : pstate 4 (800 MHz)
[    6.693272] EDD information not available.
[    6.755790]   alloc irq_desc for 22 on node 0
[    6.755792]   alloc kstat_irqs on node 0
[    8.616314]  md0: unknown partition table
[    8.734614]  md1: unknown partition table
[   19.944414] lp: driver loaded but no devices found
[   19.951540]   alloc irq_desc for 48 on node 0
[   19.951543]   alloc kstat_irqs on node 0
[   19.951783]   alloc irq_desc for 58 on node 0
[   19.951784]   alloc kstat_irqs on node 0
[   19.951790]   alloc irq_desc for 59 on node 0
[   19.951791]   alloc kstat_irqs on node 0
[   19.951794]   alloc irq_desc for 60 on node 0
[   19.951795]   alloc kstat_irqs on node 0
[   19.966668] EDAC amd64: f10_probe_valid_hardware() This machine is running with DDR3 memory. This is not currently supported. DCHR0=0x84100 DCHR1=0x3f48090d
[   20.114466] 0000:03:00.0: eth0: MAC: 3, PHY: 8, PBA No: ffffff-0ff
[   20.114615]   alloc irq_desc for 47 on node 0
[   20.114617]   alloc kstat_irqs on node 0
[   20.114863]   alloc irq_desc for 61 on node 0
[   20.114864]   alloc kstat_irqs on node 0
[   20.114869]   alloc irq_desc for 62 on node 0
[   20.114871]   alloc kstat_irqs on node 0
[   20.114874]   alloc irq_desc for 63 on node 0
[   20.114875]   alloc kstat_irqs on node 0
[   20.276108] 0000:02:00.0: eth1: MAC: 3, PHY: 8, PBA No: ffffff-0ff
[   20.303191] EDAC amd64: f10_probe_valid_hardware() This machine is running with DDR3 memory. This is not currently supported. DCHR0=0x84100 DCHR1=0x3f48090d
[   24.628341] CPUFREQ: Per core ondemand sysfs interface is deprecated - ignore_nice_load
root@h1930685:~# dmesg | grep [Dd]efect 
root@h1930685:~# dmesg | grep [Bb]ad
root@h1930685:~# dmesg | grep [Ff]ail 
[    2.820942] ACPI Error (psargs-0359): [ECEN] Namespace lookup failure, AE_NOT_FOUND
[    2.830002] ACPI Error (psparse-0537): Method parse/execution failed [\] (Node ffffffff81a65a80), AE_NOT_FOUND
[    6.648659] PM: Resume from disk failed.
root@h1930685:~# dmesg | grep [Ii]ncorrect 
root@h1930685:~# dmesg > /tmp/dmesg
root@h1930685:~# /etc/fstab
-bash: /etc/fstab: Keine Berechtigung
root@h1930685:~# /etc/mtab
-bash: /etc/mtab: Keine Berechtigung
root@h1930685:~# /boot/grub/menu.lst
-bash: /boot/grub/menu.lst: Keine Berechtigung
root@h1930685:~# /etc/lilo.conf
-bash: /etc/lilo.conf: Datei oder Verzeichnis nicht gefunden
root@h1930685:~#
 
Last edited by a moderator:
Wenn du am Rescue-System angemeldet bist, dann sind das Kernel-Meldungen von eben diesem Rescue-System, und nicht von dem Server, der nicht hoch kommt. Dateien unter /etc sind Config-Files, die kann man nicht ausführen, sondern nur ansehen (mit less oder cat). Aber auch das macht innerhalb des Rescue-Systems kaum Sinn.

Du müsstest dir mit fdisk -l ansehen, wie die Platten in deinem Server partitioniert sind und die Partitionen anschließend mounten. Dann kommst du an die eigentlichen Daten deines Servers ran.
 
Hi, okay, das werde ich gleich direkt ausprobieren. In 10 Minuten hoffe ich, etwas posten zu können. Ich bleibe im Rescuemode, richtig? Ich muss mir abgewöhnen, immer hier zu schreien, wenn diese Aufgaben verteilt werden. :)
 
fdisk

Das waren ja nicht einmal 10 Minuten - das kam heraus.

Platte /dev/sda: 1000.2 GByte, 1000204886016 Byte
255 Köpfe, 63 Sektoren/Spur, 121601 Zylinder
Einheiten = Zylinder von 16065 × 512 = 8225280 Bytes
Sector size (logical/physical): 512 bytes / 512 bytes
I/O size (minimum/optimal): 512 bytes / 512 bytes
Disk identifier: 0x0002f4b9

Gerät boot. Anfang Ende Blöcke Id System
/dev/sda1 1 128 1024000 fd Linux raid autodetect
Partition 1 endet nicht an einer Zylindergrenze.
/dev/sda2 128 638 4096000 82 Linux Swap / Solaris
Partition 2 endet nicht an einer Zylindergrenze.
/dev/sda3 638 121602 971640832 fd Linux raid autodetect

Platte /dev/sdb: 1000.2 GByte, 1000204886016 Byte
255 Köpfe, 63 Sektoren/Spur, 121601 Zylinder
Einheiten = Zylinder von 16065 × 512 = 8225280 Bytes
Sector size (logical/physical): 512 bytes / 512 bytes
I/O size (minimum/optimal): 512 bytes / 512 bytes
Disk identifier: 0x00022a73

Gerät boot. Anfang Ende Blöcke Id System
/dev/sdb1 1 128 1024000 fd Linux raid autodetect
Partition 1 endet nicht an einer Zylindergrenze.
/dev/sdb2 128 638 4096000 82 Linux Swap / Solaris
Partition 2 endet nicht an einer Zylindergrenze.
/dev/sdb3 638 121602 971640832 fd Linux raid autodetect

Platte /dev/md0: 1048 MByte, 1048510464 Byte
2 Köpfe, 4 Sektoren/Spur, 255984 Zylinder
Einheiten = Zylinder von 8 × 512 = 4096 Bytes
Sector size (logical/physical): 512 bytes / 512 bytes
I/O size (minimum/optimal): 512 bytes / 512 bytes
Disk identifier: 0x00000000

Festplatte /dev/md0 enthält keine gültige Partitionstabelle

Platte /dev/md1: 995.0 GByte, 994960146432 Byte
2 Köpfe, 4 Sektoren/Spur, 242910192 Zylinder
Einheiten = Zylinder von 8 × 512 = 4096 Bytes
Sector size (logical/physical): 512 bytes / 512 bytes
I/O size (minimum/optimal): 512 bytes / 512 bytes
Disk identifier: 0x00000000

chine is running with DDR3 memory. This is not currentl[Balid_hardware() This mac
-bash: Syntaxfehlfdisk -l

Platte /dev/sda: 1000.2 GByte, 1000204886016 Byte
255 Köpfe, 63 Sektoren/Spur, 121601 Zylinder
Einheiten = Zylinder von 16065 × 512 = 8225280 Bytes
Sector size (logical/physical): 512 bytes / 512 bytes
I/O size (minimum/optimal): 512 bytes / 512 bytes
Disk identifier: 0x0002f4b9

Gerät boot. Anfang Ende Blöcke Id System
/dev/sda1 1 128 1024000 fd Linux raid autodetect
Partition 1 endet nicht an einer Zylindergrenze.
/dev/sda2 128 638 4096000 82 Linux Swap / Solaris
Partition 2 endet nicht an einer Zylindergrenze.
/dev/sda3 638 121602 971640832 fd Linux raid autodetect

Platte /dev/sdb: 1000.2 GByte, 1000204886016 Byte
255 Köpfe, 63 Sektoren/Spur, 121601 Zylinder
Einheiten = Zylinder von 16065 × 512 = 8225280 Bytes
Sector size (logical/physical): 512 bytes / 512 bytes
I/O size (minimum/optimal): 512 bytes / 512 bytes
Disk identifier: 0x00022a73

Gerät boot. Anfang Ende Blöcke Id System
/dev/sdb1 1 128 1024000 fd Linux raid autodetect
Partition 1 endet nicht an einer Zylindergrenze.
/dev/sdb2 128 638 4096000 82 Linux Swap / Solaris
Partition 2 endet nicht an einer Zylindergrenze.
/dev/sdb3 638 121602 971640832 fd Linux raid autodetect

Platte /dev/md0: 1048 MByte, 1048510464 Byte
2 Köpfe, 4 Sektoren/Spur, 255984 Zylinder
Einheiten = Zylinder von 8 × 512 = 4096 Bytes
Sector size (logical/physical): 512 bytes / 512 bytes
I/O size (minimum/optimal): 512 bytes / 512 bytes
Disk identifier: 0x00000000

Festplatte /dev/md0 enthält keine gültige Partitionstabelle

Platte /dev/md1: 995.0 GByte, 994960146432 Byte
2 Köpfe, 4 Sektoren/Spur, 242910192 Zylinder
Einheiten = Zylinder von 8 × 512 = 4096 Bytes
Sector size (logical/physical): 512 bytes / 512 bytes
I/O size (minimum/optimal): 512 bytes / 512 bytes
Disk identifier: 0x00000000

Festplatte /dev/md1 enthält keine gültige Partitionstabelle
 
Da läuft ein Software-Raid über zwei Platten. Das wurde sogar schon schön sauber zusammengesetzt. /dev/md1 ist dein Freund. Da sind deine Daten drauf, auch logs & co.

Das mountest du jetzt an einen leeren Ordner (den du vorher u.U. noch anlegst). In diesem Ordner findest du dann deine Daten, um sie weiter auszuwerten. Spannend dürfte in erster Linie alles unter var/log sein.

An der Stelle musst du allerdings ohne mich weiter kommen. Die Uhrzeit und meine morgendlichen Verpflichtungen treiben mich in die Heia.
 
Vielen Dank

ich setze es mal noch nicht auf "gelöst" - ich bin gespannt, ob ich die Kiste auch wieder in Richtung online kriege :)
 
Hallo noch mal: aktueller Stand ist wie folgt: nach dem Hardwaretest bei Strato kam heraus, dass eine Festplatte defekt ist. Dank PapaBaer komme ich jedoch per Remote Console und SSH an meine Daten, die ich jedoch gemäß Strato hätte backuppen müssen. Eine Sicherung per SSH lokal oder auf einen anderen Server sei nicht vorgesehen.

Da ich softwareseitig ggfs. durch die Nutzung von Apple ein wenig eingeschränkt bin, habe ich noch eine Frage: gibt es einen Weg, problemlos - wie gesagt, Zugriff nur Remote - an meine Daten und vor allem an meine Datenbanken oder Dumps derselben zu kommen? Denn erst dann kann ich dem Servertausch bei Strato zustimmen.

Backups gibt es derzeit noch keine, da der Server erst seit 2 oder 3 Wochen in Nutzung ist.
 
Wenn du in der Rescue Konsole bist mountest du erstmal die "ROOT" Festplatte und gehst mit chroot rein.
Dann kannst du doch einfach alles was wichtig ist in ein .tar Archiv packen und "vorausgesetzt du hast inet im Rescue" das erstellte .tar auf einen FTP Space jagen.

Zeigt aber mal wieder wie "Wichtig" ein Vernünftiges Backup Setup ist.
Wenn du im Rescue inet hast kann ich dir einen FTP Space zur Verfügung stellen Voraus gesetzt es sind keine 300/400GB :D
Ein Backup Setup "muss" bestehen "bevor" der Server Produktiv Online gebracht wird! Da du von Kunden sprichst sollte dir das aber bewusst sein ;-)
 
Hallo Karl,

vielen Dank - ich werde jetzt mal an den Rechner gehen und mein Glück versuchen. Es sind glaube ich 5 GB. Allerdings weiss ich als wenig erfahrener und mit Problemen in dem Bereich nie konfrontierter User gar nicht, wie genau das mit dem FTP funktioniert -> denn mit (ich glaube so heisst es) lsftp bekomme ich wegen mangelnder Installation keine Verbindung, bzw. kann der Name ftp.usw.usw nicht aufgelöst werden...
 
"Gelöst"

Guten Morgen, nach einer langen, interessanten und lehrreichen Nacht (ja Karl, die Zukunft gehört den Backups!) habe ich die Daten weitestgehend vollständig lokal gesichert. Dabei habe ich -nach meinen Recherchen gibt es dieses Problem wohl häufiger- folgende ziemlich simple Vorgehensweise angewandt:

Über den RecoveryManager habe ich den Bootmodus auf Recovery 64bit 2.6 Kernel (ohnehin die empfohlene Variante) gesetzt und den Server ohne "Maschine resetten" gestartet.

Dann habe ich die entsprechende Platte per umount /dev/md1 ausgehängt und mich über Transmit (Cyberduck geht auch) als root per SSH verbunden. Da hatte ich dann auch eine wunderschöne grafische Benutzeroberfläche und konnte eine halbe Ewigkeit nach den Dateien suchen. Gefunden, lokal Verzeichnis angelegt und rüber gezogen. 80 % sind geschafft.

Karl, PapaBaer: Danke schön für die Hilfe - wenn's mal um Design geht: einfach PM :)
 
Back
Top