Probleme bei Serverloft?

Janny82

Blog Benutzer
Hi,
seit 20:25Uhr ist mein Server unerreichbar.
Auch das Kundenpanel zeigt nur ein "Server Error" und kein wirkliches Bild.
Ein Traceroute endet in Düsseldorf.

Ist noch wer betroffen?

Gruss
Janny
 

Vevelt

Registered User
Ja...

...dito hier: loft1080 ist auch betroffen... :-(
Ebenso kein Zugriff auf das Kundenpanel. Mal gucken, was da los ist.
 

michaelzz5

New Member
Hallo,

seit 20 Uhr ist alles Tot bei denen, hab angerufen "Switch Ausfall" inzwischen erreicht man nicht mal mehr deren Router. Ich dachte immer das das Redundant sei!?
 

Malibu

New Member
erster Monitorungalarm kam um 19.12...

Danach extrem langsamer Verbindungsaufbau, die internen nameserver waren nicht mehr ansprechbar, webserver down..seit 20:25 ist totale Stille..

scheint ein grösseres Routingproblem zu sein oder evtl. Core down ;)
 
Last edited by a moderator:

pepe24

New Member
Grüß Euch,

ja, hatte auch schon den Support in der Leitung. DIe sagten, dass es ein internes Anwendungsproblem gäbe, aber an dem Problem gearbeitet würde.

Mein Monitoring hat den Ausfall ab 19:16:33 Uhr gemeldet. Zum Glück ist es noch kein Produktivserver, also geht kein Geld verloren. Wie sieht es da bei euch aus?

Grüße,
Peter
 

Janny82

Blog Benutzer
Weil wir von unserer Anbindungsqualität überzeugt sind, garantieren wir eine Leitungsverfügbarkeit von min. 99,9% im Monatsmittel.
Nun kann bald das rechnen beginnen! :p

Und es ist natürlich ein Produktivserver...
 

michaelzz5

New Member
Meiner läuft auch Produktiv, man sollte meinen wer 99,9 garantiert hat das alles voll Redundant ausgelegt, aber naja.
 

teh_saint

Registered User
Moin,

bei mir geht ebenfalls garnichts mehr...
Der nette Mitarbeiter am Telefon, der sich anhörte als er aus dem Bett geholt wurde, meinte ebenfalls "anwendugsfehler" ...

Kann doch nicht so lange dauern :(
 

fitti70

Blog Benutzer
Habe das gleiche Problem. Server ist seit 19:15 Uhr nicht erreichbar, das Admin Panel nur sehr langsam.
 

Janny82

Blog Benutzer
Ein "Anwendungsfehler"?
Erst schleichende Verbindungsausfälle und dann ganz weg....hmmm....die WHL hats auch zerrissen...das SSF scheint wohl in einem anderen Netzbereich zu liegen...
 

serverloft

New Member
Wir sind dran

Hallo,

Kurz zur Info: uns sind zwei redundante Juniper Core-Switche nicht nachvollziehbar ausgestiegen. Die Spezialisten von Juniper arbeiten unter Hochdruck an einer Lösung. Alles weitere später.

Tom
 

teh_saint

Registered User
MOD: Bitte keine Fullquotes! Danke

"Holy Shit"

Nennt man wirklich Pech. Hoffen wir das es schnell behoben wird.

Mittlerweile schicke ich jedem den link zum SSF forum und nicht alles jedes mal neu zu erklären. :D
 
Last edited by a moderator:

peterz

New Member
Kein Wunder, bei einem Provider, wo man seine IPs nur mit der MAC der ersten Netzwerkkarte benutzen kann, weil die Switche angeblich nur eine MAC unterstützen..

Auf die Frage, warum man dann zwei Netzwerkkarten ins Angebot schreibt, kommt dann folgendes:
Die Server werden zukunftsorientiert ausgestattet; genauso wie GigaByte-Netzwerkkarten angeboten und verbaut werden, obwohl die Anbindung technisch gar nicht zur Verfügung steht.
Und jetzt die downtime... Aber ist halt auch nur Intergenia.
 

Thorsten

SSF Facilitymanagement
Staff member
Hallo!
Da wir nun schon alle wissen, was passiert ist, bitte ich darum von weiteren Mein server ist auch nicht erreichbar Meldungen abzusehen. Bitte habt etwas Geduld. Vielen Dank.

mfG
Thorsten
 

traced

Registered User
MOD: Bitte keine Fullquotes! Danke

@peterz:
Und Du könntest das sicher besser in Deinem Wohnzimmernetzwerk? Bitte, ich kenne keinen grossen Provider wo es nicht schon zu Ausfällen gekommen ist, also schalt mal bitte nen Gang runter!
 
Last edited by a moderator:

serverloft

New Member
Das war los

Hallo,

so, das Problem ist gelöst und wir sind seit 21:40 wieder komplett online.
Hier eine Beschreibung, was los war:

Gegen 19 Uhr beobachteten unsere Techniker erstmals, dass sich die beiden Juniper Core-Switche in unregelmässigen Abständen nicht mehr gegenseitig als aktiv erkannten und es zu Reroutings im internen Netzwerk kam.
Nach einer näheren Untersuchung wurde ein Ticket beim Hersteller Juniper eröffnet. Auf Anraten des Herstellers wurde die Redundanz zwischen den Switchen kurzzeitig gelöst, um so das Problem des Reroutings zu umgehen.
Die Auflösung der Redundanz führte jedoch zu einem Totalabsturz der beiden Geräte, eine erneute Inbetriebnahme war nicht mehr möglich. Hierdurch kam es zu einem Ausfall der Netzwerkanbindung.

Nachdem der Hersteller das Problem lokalisieren konnte und ein Workaround eingerichtet war, wurde die Erreichbarkeit wiederhergestellt.

Diese Geräte sind nun wieder wie gewohnt in Betrieb und wir rechnen mit keinen weiteren Störungen.

Wir werden mit dem Hersteller klären, wie es in einer redundanten Infrastruktur zu einem "Single Point of Failure" kommen kann und für die Zukunft sicherstellen, dass sich dieser Fehler nicht wiederholen kann.

So, das erstmal von mir.

Bis später

Tom
 

Patrick Bauer

New Member
Ich muss hier auch mal ein Lob aussprechen, als damaliger, leider etwas unzufriedener, S4Y Kunde.
Als heute Abend mein, erst gestern erhaltener, Server nicht mehr erreichbar war, war ich erstmal baff. Reboots probiert, Recovery-Konsole... alles tot.

"Einen Tag erst hier und schon ein Ausfall? Klasse! :mad:", dachte ich mir.

Kurz drauf erschien im Mail-Ordner ne Mail mit ne kurzen Erklärung was passiert sei und das man daran arbeite... super, somit stand ich nicht mehr im Regen :)

Nach ner weiteren 3/4 Stunde wars dann gegessen. Server wieder erreichbar, nette Entschuldigungsmail kam an, so soll das sein, so verzeiht man gerne.

Zum Glück war auch mein Server derzeit noch nicht produktiv geschaltet, aber auch wenn: Sowas kann jedem RZ mal passieren, man kann halt nicht immer mit allem rechnen.
Es ist schön zu sehen, dass sich so schnell darum gekümmert wurde und will mich hiermit bei Serverloft nochmal bedanken :)
 
Top