Aussetzer

mjay

New Member
Moinsen!

Irgendwie hat mein neuer vServer (Hosteurope, Linux 4.0 XL) ab und zu Aussetzer und für ein paar Sekunden (geschätzt max. 1 Minute) geht nix mehr.

Die Seiten sind dann nicht erreichbar, per Putty komme ich nicht drauf und wenn ich per Putty schon drauf bin, reagiert die Console nicht.
In den Logs finde ich keine Auffälligkeiten, laut 'top' idlet das Teil die ganze Zeit nur. Durch Munin kann ich mir die zurückliegenden Parameter ansehen, sieht alles normal aus, z.B. die Load liegt im Schnitt bei 0,01.
Laut netstat sind nicht wirklich viele Verbindungen offen, die komplette Ausgabe passt meistens knapp auf eine Bildschirmseite.

Vorhin habe ich von einem anderen HE-vServer mal ein 'ping' laufen lassen (Auszug):

Code:
64 bytes from xxx.hosteurope.de (xxx): icmp_seq=427 ttl=62 time=0.351 ms
64 bytes from xxx.hosteurope.de (xxx): icmp_seq=428 ttl=62 time=0.289 ms
64 bytes from xxx.hosteurope.de (xxx): icmp_seq=429 ttl=62 time=0.286 ms
64 bytes from xxx.hosteurope.de (xxx): icmp_seq=440 ttl=62 time=13.8 ms
64 bytes from xxx.hosteurope.de (xxx): icmp_seq=444 ttl=62 time=13.5 ms
64 bytes from xxx.hosteurope.de (xxx): icmp_seq=457 ttl=62 time=13.7 ms
64 bytes from xxx.hosteurope.de (xxx): icmp_seq=458 ttl=62 time=13.9 ms
64 bytes from xxx.hosteurope.de (xxx): icmp_seq=459 ttl=62 time=13.5 ms
64 bytes from xxx.hosteurope.de (xxx): icmp_seq=460 ttl=62 time=0.366 ms
64 bytes from xxx.hosteurope.de (xxx): icmp_seq=461 ttl=62 time=0.293 ms
64 bytes from xxx.hosteurope.de (xxx): icmp_seq=462 ttl=62 time=0.345 ms
64 bytes from xxx.hosteurope.de (xxx): icmp_seq=463 ttl=62 time=0.338 ms
64 bytes from xxx.hosteurope.de (xxx): icmp_seq=464 ttl=62 time=0.355 ms

--- xxx ping statistics ---
464 packets transmitted, 422 received, 9% packet loss, time 463227ms
rtt min/avg/max/mdev = 0.260/0.877/14.011/2.600 ms

Erst sah alles normal aus, dann kamen die 13,X ms. Danach hing er erstmal, daher wohl die verlorenen Pakete.

Wie kommt das? Was könnte ich übersehen haben? Wo sollte ich mal genauer nachsehen? Welche Wissenslücken habe ich (auf dieses Problem bezogen ;) ).

Das Teil ist relativ frisch, läuft erst seit einer Woche. So viel dran herumgeschraubt habe ich noch nicht. Aber auch gleich am Anfang nach der "Auslieferung" kam mir da teilweise was komisch vor.

(Welcher Teil ist eigentlich für das Beantworten eines pings zuständig?)

Gruß...
...Markus
 
Last edited by a moderator:
Was sagen denn die üblichen Verdächtigen (Serverprotokolle) aus?
Das ist ja mein Problem. :(
Die sagen nicht wirklich was aus.

Vorhin hatte ich wieder Aussetzer, die sich über ca. 3 Minuten hinzogen. Beim pingen sind teilweise fast die Hälfte der Pakete verloren gegangen. In Putty zog sich alles, die ssh-Verbindung wurde aber nicht unterbrochen. Top hat mir keine komischen Werte gezeigt. Die Netzwerkverbindungen habe ich mir nur über 'netstat | cat -n' anzeigen lassen, weil ich schnell wissen wollte, wie schnell und ob sich die Verbindungsanzahl verändert.

In den Logs gab es danach nichts auffälliges. Nix wurde gerade neu gestartet, keine cronjobs, keine E-Mail in dem Zeitraum verschickt oder empfangen, keine "bösen" Loginversuche, kein Swapspace wurde genutzt, der Apache hatte nicht viel zu tun usw.

Ich hab' mir sämtliche Logfiles angesehen, in keinem ist irgendwas auch nur annähernd komisches zu finden.
 
Jetzt gerade habe ich endlich mal etwas Last auf meiner VPS. Naja, was man bei mir so als Last bezeichnen kann. :D

Das Ding rennt wie Hulle, heute noch keine Aussetzer.

So langsam komme ich zu dem Schluss, dass das Blech, auf dem der vServer sitzt, zwischendurch mal die Arbeit verweigert...
 
Ueberpruef ob waehrend einem Aussetzer die beancounter hoch gehen (natuuerlich nur applizierbar sofern es eine OpenVZ/Virtuozzo Machine ist)
Ausserdem kann ein tracert dir viel verraten ob dein Provider, ein Carrier, die RZ-Anbindung, ein Switch, die Hostmachine oder dein Container schuld ist (aber nur wenn der tracert nicht laenger braucht als die Downtime :P)

Wen du den Verdacht hast dass es das Hostsystem sein koennte, melde es dem Support.
 
Die Beancounter verhalten sich völlig unauffällig. Ich bin so weit von den Grenzen entfernt, dass man die VPS schon fast als überdimensioniert ansehen könnte. ;)

Aus dem Traceroute werde ich ehrlich gesagt nicht so 100%ig schlau (die IP habe ich mal leicht verfälscht ;) ):

Code:
Routenverfolgung zu meinerdomain.de [178.77.22.333]  über maximal 30 Abschnitte:

  1    <1 ms    <1 ms    <1 ms  fritz.box [192.168.1.1]
  2   248 ms   196 ms    37 ms  lo1.br35.acham.de.hansenet.net [213.191.89.46]
  3    22 ms    22 ms    21 ms  ae0-105.cr01.weham.de.hansenet.net [62.109.116.125]
  4    29 ms    28 ms    30 ms  ae4-0.cr01.fra.de.hansenet.net [213.191.66.73]
  5    30 ms    80 ms    28 ms  ae0-0.pr03.decix.de.hansenet.net [213.191.66.138]
  6    31 ms    30 ms    31 ms  xe-0-3-0.cr-polaris.fra1.he-core.de [80.81.192.239]
  7    62 ms    32 ms    33 ms  xe-2-3-0.cr-nashira.cgn4.hosteurope.de [80.237.129.165]
  8    34 ms    85 ms    34 ms  lvps178-77-96-2.dedicated.hosteurope.de [178.77.96.2]
  9     *        *        *     Zeitüberschreitung der Anforderung.
 10    46 ms     *        *     lvps178-77-22-333.dedicated.hosteurope.de [178.77.22.333]
 11    47 ms     *        *     lvps178-77-22-333.dedicated.hosteurope.de [178.77.22.333]
 12    46 ms     *       46 ms  lvps178-77-22-333.dedicated.hosteurope.de [178.77.22.333]

Ablaufverfolgung beendet.

Ob ich den Ausfall noch erwischt habe, weiss ich nicht. Die Webseite wurde gleichzeitig dann doch geladen.
Mir sind die letzten 3 Zeilen nicht ganz klar, warum mein Server 3x aufgeführt wird. Sowas hab ich noch nicht gesehen (das soll aber nix heissen ;) ). Mein anderer vServer bei HE hat insgesamt eh 3 Hops weniger. Da kommt nach dem letzten "nashira" nur noch 'ne Zeitüberschreitung und dann 1x meine VPS.
 
Last edited by a moderator:
Ich schon wieder. ;)
Die Logs meines Servers sind weiterhin völlig unauffällig. Das einzige, was aufällig ist, sind die traceroutes.

Hier mal "normal", zu einer Zeit, wo ich keine Aussetzer hatte:
Code:
Routenverfolgung zu meinerdomain.de [178.77.22.333]  über maximal 30 Abschnitte:

  1    <1 ms     1 ms    <1 ms  fritz.box [192.168.1.1]
  2    24 ms    23 ms    21 ms  lo1.br35.acham.de.hansenet.net [213.191.89.46]
  3    23 ms    22 ms    22 ms  ae0-105.cr01.weham.de.hansenet.net [62.109.116.125]
  4    29 ms    29 ms    29 ms  ae4-0.cr01.fra.de.hansenet.net [213.191.66.73]
  5    29 ms    29 ms    29 ms  ae0-0.pr03.decix.de.hansenet.net [213.191.66.138]
  6    30 ms    30 ms    30 ms  xe-0-3-0.cr-polaris.fra1.he-core.de [80.81.192.239]
  7    33 ms    33 ms    32 ms  xe-2-3-0.cr-nashira.cgn4.hosteurope.de [80.237.129.165]
  8     *        *        *     Zeitüberschreitung der Anforderung.
  9    33 ms    32 ms    33 ms  lvps178-77-22-333.dedicated.hosteurope.de [178.77.22.333]

Ablaufverfolgung beendet.

Hab' ich Ausfälle, sieht es ungefähr so aus (Bis zum 7 Hop kommt immer das gleiche, deswegen kürze ich das mal etwas):

Code:
[...]
  7    32 ms    32 ms    32 ms  xe-2-3-0.cr-nashira.cgn4.hosteurope.de [80.237.129.165]
  8    33 ms    34 ms    33 ms  lvps178-77-96-2.dedicated.hosteurope.de [178.77.96.2]
  9     *        *        *     Zeitüberschreitung der Anforderung.
 10     *       47 ms    46 ms  lvps178-77-22-333.dedicated.hosteurope.de [178.77.22.333]

oder auch bis zu 3x meine VPS:

Code:
[...]
  7    62 ms    32 ms    33 ms  xe-2-3-0.cr-nashira.cgn4.hosteurope.de [80.237.129.165]
  8    34 ms    85 ms    34 ms  lvps178-77-96-2.dedicated.hosteurope.de [178.77.96.2]
  9     *        *        *     Zeitüberschreitung der Anforderung.
 10    46 ms     *        *     lvps178-77-22-333.dedicated.hosteurope.de [178.77.22.333]
 11    47 ms     *        *     lvps178-77-22-333.dedicated.hosteurope.de [178.77.22.333]
 12    46 ms     *       46 ms  lvps178-77-22-333.dedicated.hosteurope.de [178.77.22.333]

Auffällig ist jedenfalls der 8 Hop. Das Ding ist immer drin, wenn es nicht ganz rund läuft.
Sieht ja auch nach' ner VPS aus, aber was hat die da zu suchen?
 
Hi,

das mit dem HOP würde ich am ehesten beim Support anfragen ob es daran liegen kann und am Besten meldest du, dass du Probleme mit der Erreichbarkeit hast.


In der Regel sind die bei sowas kulant und prüfen das für dich kostenfrei ggf. auch auf dem vServer ;)
 
das mit dem HOP würde ich am ehesten beim Support anfragen
Wollte ich jetzt auch mal machen. Auf das Routing zu meinem Server habe ich ja kaum Einfluss.
Trotzdem würde mich mal interessieren, was man aus diesen traceroutes ablesen kann. Ich verstehe vor allem nicht, warum mein Server 3x aufgeführt wird.
Ist immer blöde wenn man meckert und selber nicht ganz versteht was da vor sich geht. ;)
 
Back
Top