Server4you neapelXXX down

harvester84

New Member
Hi,

Gerade hab ich noch die Logfiles checken wollen (~0:15) da bricht die Verbindung zusammen (erst ein paar aussetzter bei 0.15 Last) dann vollkommen weg. Ins Powerpanel komm ich auch nicht mehr rein angeblich unbekannter user (Seite braucht ~25sek zum laden) und Hotline nicht mehr ereichbar ich könnt die decke hochlaufen!!

Noch jemand betroffen?

Gruß Harv
 
Ich glaube, da ist zZt. ne Störung im S4Y RZ.
Habe einen Server aus der Toronto-Reihe (62.75.220.xxx)

Alle Dienste laufen zwar, aber ich komm nicht mehr über SSH drauf.

Ins Powerpanel komme ich ebenfalls nicht mit der gleichen Fehlermeldung.

Ich glaube da ist ein DNS-Server ausgefallen und dann ist wohl die DB vom PowerPanel offline und die DNS-Auflösung vom Server geht nicht mehr.

Habe noch einen Serverloft-Server. Ich komm zwar drauf kann aber nichts anpingen.

Ich denke das Problem behebt sich heute Nacht von alleine (also nicht so ganz von alleine, sondern von Mitarbeitern die wohl jetzt eine Nachtschicht einlegen müssen).
..werde aber trotzdem so lange wach bleiben bis alles wieder geht :D

Edit: 00:58
Genau was ich vermutet habe ;) Alles geht wieder, PowerPanel und Server gleichzeitig. Da gab es ein DNS-Problem!!
 
Da bin ich ja einigermaßen beruhigt das ich nicht der einzige bin, hatte schon Angst das es wieder Hardwareseitig auf dem Server irgendwo geknallt hat (wäre dann das 2. mal innerhalb eines halben Jahres).

Ich bleib auch noch solange wach und wenns morgen um 7:00 nicht geht dürfen sich die Mitarbeiter auf einen nicht ausgeschlafenden Kunden freuen (und ich mich ab 6:00 auf meine ausgeschlafenen Kunden).

EDIT: 1:15 Bei mir leider noch nicht
 
Last edited by a moderator:
Wow...dann hast du häufig Probleme.
Mein Server läuft seit über 2 Jahren am Stück ohne Probleme.

Eigentlich is die Kiste schon steinalt aber "Never change a running system" :D

Geht es bei dir eigentlich auch wieder?
Ich kann die Neapel-Reihe von der Toronto-Reihe aus "sehen" ;)

Edit: geht bei dir das Powerpanel?
Mein Serverloft-Server kann nun auch wieder andere Domains erreichen ;)
 
Last edited by a moderator:
Server ist immer noch weg. 3 IPs vor und nach meiner IP sind die Server ereichbar. (hab dir mal ne PM mit der IP geschickt schau mal bitte ob du Port 80 über deinen Server ereichen kannst [mach aber keinen Portscan sonst ist deine IP für 10 min geblockt])

Naja ich brauchte vor einem Jahr aus Resourcen grunden (bin schon ziemlich lange bei denen hatte schon einen Server da hießen die noch Server4Free) einen neuen bin also umgezogen und nach gut 3 Monaten eine Festplatte ausgefallen, die freundlichen Mitarbeiter haben dann sich den Server angesehen und festgestellt die 1. Platte ist hinüber haben sie auch ganz schnell getauscht und leider dabei den SoftRaid danach Zerschossen und behauptet das wäre ein Konfigurationsfehler von mir. Noch in der selben Woche war er dann wieder down die Server Prüfung ergab Board defekt getauscht und Server wieder OK.

Die Probleme habe ich aber erst mit seit dem neuen davor lief alles Problemlos und konnte mich nicht beklagen.
 
Last edited by a moderator:
Nein komme nicht durch.
Da scheint noch zusätzlich was an deinem Server evtl. zu sein.

In die Neapel-Reihe komme ich.
Habe mal Neapel111 und Neapel123 angepingt.
Die sind OK.

Du solltest aber wieder ins PowerPanel kommen. Probiere doch mal einen Reboot.

Da hast du aber echt Pech mit deinem Server.
Habe meinen Toronto seit 2005 und ich kann mich nur an 2 Ausfälle erinnern:
1. Netzteil
2. Mainboard

Deshalb häng ich so an dem Toronto. Der läuft einfach und läuft und läuft.
Aber trotzdem muss er jetzt bald dem Serverloft-Server weichen ;)

Wenn der Reboot (Hard evtl.) nicht geht würde ich jetzt an deiner Stelle schlafen gehen und morgen früh direkt um 7 die Hotline anrufen.
 
Last edited by a moderator:
Da ich eh noch hier Kabel legen muss bleib ich sowieso noch etwas online. Also halte mich auf dem Laufenden ;)

Bzw. probiere mal das Recovery aus. Das springt ja auch an wenn die HDD kaputt sein sollte!
 
Last edited by a moderator:
Mach ich, ich Rechne damit das es etwas dauert der Server lief jetzt seit Februar durch und damit ist wieder ein FSCK fällig.

Die Frage ist nur hat der Softreset jetzt gegriffen oder nicht. Ich hab sonst nicht so drauf geachtet hast du eine Ahnung wie lange der FSCK bei 2x 500GB ca. brauchen wird? So das wenn die Zeit (+ein bischen) vorüber ist ich den Hardreset in Auftrag geben kann, will ihn ja nicht beim laufenden Test Resetten.

(Ich mach mir jetzt erstmal Kaffe....)
 
Hmm also meiner hat niedliche 80GB...da hat der letzte FSCK so 30 Minuten gedauert beim letzten Reboot.
Aber deine CPU / HDD werden ja schneller sein als meine ;)

Ich rechne mal mit einer Stunde oder so.
 
Hi,

wenn der Server gar nicht mehr erreichbar war, wird der Soft-Reboot im Regelfall nicht wirklich viel ausrichten.
Du könntest auch das Recovery-System anfordern und den fsck selber durchführen. Dann siehst Du auch direkt, ob er Dir Teile des Dateisystems zerlegt ;)


-W
 
Da ist was wahres dran.
Vor allem siehst du etwas schneller, ob der Server noch funktioniert, anstatt jetzt ewig zu warten!
 
Ich hätte mal früher wieder vorbeischauen sollen, das ist natürlich eine Idee.

Server ist natürlich jetzt nach anderthalb Stunden immernoch weg werd deinen Vorschlag jetzt mal Probieren.
 
Ich sehe eine Ping-Antwort ;)

So wies aussieht aus dem Recovery, da der Apache down ist.
Mobo, RAM und Netzteil scheinen ja schonmal OK zu sein!
 
Ja das scheint ok zu sein.

Recovery ist nun beim fsck auf /dev/md/1 irgendwo im 2. Prüfpunkt kurzfristig abgeschmiert (der 24h disconnect auf Clientseite kann es nicht gewesen sein den hab ich extra vorher manuell gemacht) mal sehen was jetzt ist....


ahhhrrrrg!

EDIT: RECOVERY scheint neugestartet worden sein mdadm wusste nix mehr vom letzten --assemble
mache jetzt erstmal ein RAM check....

EDIT2: ich liebe diesen Server
trying mlock
eine min später disconnect
 
Last edited by a moderator:
Ohohoh...das hört sich gar nicht gut an.
Ich glaube da wird wohl morgen früh ein RZ-Mitarbeiter Hand anlegen müssen.

Aber irgendwie Zufall, dass das gleichzeitig mit dem anderen Problem passiert?

Würd ich mal nachfragen morgen, was heute Nacht los war. Würde mich interessieren ;)

Ich gehe auf jeden Fall jetzt mal schlafen...um 10 ruft die Pflicht leider schon wieder.

Wünsch dir noch viel Erfolg. Werde morgen mal reinschauen, wie es aussieht :)
 
Würd ich mal nachfragen morgen, was heute Nacht los war. Würde mich interessieren
darauf kannst du dich verlassen, das interessiert mich auch!

So aus welchem grund auch immer, hat dieser durchlauf geklappt

gefundene Fehler
Code:
Block bitmap differences:  -28152528 -28162048 -31361346 -31361351 -31361386 -(64691395--64691433) -(64745888--64745942) -(64924465--64924492) -(65052
414--65052495)
Fix<y>? yes

Free blocks count wrong for group #859 (64, counted=66).
Fix<y>? yes

Free blocks count wrong for group #957 (0, counted=3).
Fix<y>? yes

Free blocks count wrong for group #1974 (0, counted=39).
Fix<y>? yes

Free blocks count wrong for group #1975 (0, counted=55).
Fix<y>? yes

Free blocks count wrong for group #1981 (0, counted=28).
Fix<y>? yes

Free blocks count wrong for group #1985 (0, counted=82).
Fix<y>? yes

Free blocks count wrong (49253432, counted=49253641).
Fix<y>? yes

Inode bitmap differences:  -14101353 -(14101357--14101358) -14101360 -14101362 -32411041 -32411404 -32411928 -32415123 -32569427 -(35558230--35558233
-(35791664--35791666) -(35791673--35791674) -(35791680--35791683) -35791685 -(35791692--35791694) -(35791696--35791697) -(35791700--35791703) -3579170
5 -35791708 -(35791710--35791712) -35791714 -(35791718--35791722)
Fix<y>? yes

Free inodes count wrong for group #859 (15699, counted=15704).
Fix<y>? yes

Free inodes count wrong for group #1974 (4542, counted=4546).
Fix<y>? yes

Free inodes count wrong for group #1984 (15197, counted=15198).
Fix<y>? yes

Free inodes count wrong for group #2166 (14168, counted=14172).
Fix<y>? yes

Free inodes count wrong for group #2180 (11775, counted=11805).
Fix<y>? yes

Free inodes count wrong (59013435, counted=59013479).
Fix<y>? yes


/dev/md/1: ***** FILE SYSTEM WAS MODIFIED *****
/dev/md/1: 2004793/61018272 files (1.4% non-contiguous), 72545015/121798656 blocks
ich hoffe ich brauch mein Backup von gestern nicht ...

ich lasse das ganze jetzt noch ein 2. mal durchlaufen um ein defekt der Platte auszuschließen danach kommt dann noch badblocks dran und ein cpu stress test. Dann ist es hoffentlich 7:00 Uhr und ein Techniker ist ansprechbar der dann den Ram nochmal checken darf:cool:

EDIT: 2. durchlauf wiedermal neustart der Recoveryconsole, ich sichere mir jetzt erstmal das komplette log

EDIT2: so Server läuft zwar es zieht sich aber etwas merkwürdiges durchs log:
Code:
Oct 20 05:34:46 delta kernel: hub 1-0:1.0: unable to enumerate USB device on port 1
Oct 20 05:34:46 delta kernel: hub 2-0:1.0: unable to enumerate USB device on port 1
Oct 20 05:34:46 delta kernel: hub 1-0:1.0: unable to enumerate USB device on port 1
[....]
Oct 20 05:34:51 delta kernel: hub 2-0:1.0: unable to enumerate USB device on port 1
Oct 20 05:34:51 delta kernel: hub 1-0:1.0: unable to enumerate USB device on port 1
Oct 20 05:34:51 delta kernel: hub 2-0:1.0: unable to enumerate USB device on port 1
Oct 20 05:34:51 delta kernel: hub 1-0:1.0: unable to enumerate USB device on port 1
Oct 20 05:34:51 delta kernel: hub 2-0:1.0: unable to enumerate USB device on port 1
Oct 20 05:34:52 delta kernel: hub 1-0:1.0: unable to enumerate USB device on port 1

das fing schon um 1:37 an also bevor ich in den SoftReboot in Auftrag gegeben hatte (soft reset hat nicht gegriffen zieht sich bis Recovery start ohne Pause es gab fast keine anderen Meldungen mehr)
Code:
Oct 20 01:37:44 delta kernel: hub 2-0:1.0: unable to enumerate USB device on port 1
Oct 20 01:37:44 delta kernel: hub 1-0:1.0: unable to enumerate USB device on port 1

Hab jetzt kurzerhand einfach die USB Module aus dem Kernel entladen, mal sehen was der support in 52min dazu zu sagen hat
 
Last edited by a moderator:
So Support meint eigendlich dürfte mein System (@LaForge auch deines) durch eine Wartung am USV System wo wir nicht dranhängen nicht betroffen gewesen sein. Die DNS und Resolver waren aber offline. Eine Wartung gab es noch um 2:20 wo mein Server hätte von betroffen sein können passt aber Zeitlich nicht.

Techniker sind am Prüfen.... und ich sag jetzt gn8
 
Genau das mit dem DNS passt auch zu meinem Problem.
Dann ist aber wohl bei dir zufälligerweise noch etwas anderes aufgetreten.
Das ist natürlich ärgerlich :(

Bis später...
 
Hiho,

rein Interessehalber:
EDIT2: ich liebe diesen Server
"trying mlock"
eine min später disconnect

Hast Du dem memtester noch irgendwelche Parameter mit übergeben oder ohne jedes Argument gestartet? Wenn Letzteres zutrifft, dann ist das Verhalten des Servers genau das Richtige.


-W
 
Back
Top