Netzwerk Probleme

dms281

Registered User
Hallo Zusammen!

Wir haben einen vRoot XXL bei 1und1 mit SuSe 11.3 und seit einiger Zeit haben wir häufig Probleme mit der Erreichbarkeit für die ich keine Erklärung finde.

Unser TeamSpeak³ Server hat fast Täglich zu unregelmässigen Zeiten und von unregelmässiger Dauer Packet Loss von 40-50% (...bei ALLEN Usern!). Der Spuk dauert meist zwischen 5 Minuten und mehreren Stunden. Auch unsere Webseiten reagieren dann nur sehr langsam oder garnicht. Seit gestern nun sind unsere Webseiten fast garnicht mehr erreichbar (Ladezeiten von über 10 Minuten oder Verbindungsfehler) unabhängig vom Packet Loss des TeamSpeak Servers der aktuell wieder bei 0 ist.

Ich habe zum Zeitpunkt als der Packet Loss im TeamSpeak auftrat MTR ausgeführt mit folgenden Ergebnissen...

http://gft-filebase.de/mtr.jpg

Hier entsteht Packet Loss schon am 2. Punkt (vl-1995.gw-distp-a.bad.oneandone.net) innerhalb des 1und1 Netzwerkes.

1und1 behaupet nun seit 2 Monaten es liege nicht in ihrem Verantwortungsbereich da ich als Kunde selbst für meinen vRoot verantwortlich bin. So wie ich das sehe hat aber doch der Packet Loss kaum etwas mit meiner Konfiguration des Server zu tun sondern die Ursache liegt hier doch eher im Netzwerk/Routing bzw. was die Domains angeht an den DNS Servern von 1und1 oder sehe ich das falsch?

Von meinem Rechner auf den Server ergibt MTR momentan folgendes...
http://gft-filebase.de/mtr.html

Es gibt keinerlei Auffälligkeiten in den Serverprozessen und auch der Recourcenmonitor des PowePanels zeigt dass alles im grünen Bereich ist.
 
Last edited by a moderator:
Die 172er-IP habe ich bei meinen virtuellen Hosts auch - ein Router muss nicht zwingend im selben Subnetz stehen, es muss lediglich eine Route zum Router bekannt sein.

Es sieht danach aus, als wenn das Netzwerk komplett ausgelastet wäre. Entweder durch einen anderen Kunden-vServer auf dem selben Host oder der Switch/Router dahinter ist einfach dicht.

Sprich 1&1 doch mal darauf an ob man mal nachsehen könnte ob die Netzwerkauslastung kritische Werte erreicht. Ich habe zwar jetzt bei 1&1 keine Angabe zur Verfügbarkeit gefunden, aber man wirbt mit 100MBit/s Anbindung. Da du diese nicht bekommst und dies mit den MTRs auch nur schwer an dir liegen kann, sollten die sich bitte drum kümmern.

Vielleicht kann man dich auf einen anderen Virtualisierungshost verschieben, das hilft vermutlich schon.


Wenn du mir eine IP per PM zukommen lässt, kann ich diese zusammen mit 1-2 benachbarten IPs in mein Pingmonitoring aufnehmen. Vielleicht kann man damit ja Anstiege der Latenzzeiten und des Packetloss erkennen.
 
Danke schon mal für die raschen Antworten.

Ich hatte auch schon vermutet dass evtl. ein anderer Kunde auf der Hostmaschine den Verkehr sprengt. Gibt ja genug Flachzangen die meinen sie könnten auf einem vRoot Gameserver betreiben oder ähnliches. Bei 1und1 versichert man immer wieder das soetwas nicht möglich wäre und die Recourcen streng "portioniert" werden.

Ich wäre ja garnicht so angepisst wenn ich nicht schon vor 2 Jahren einen ähnlichen Fall mit 1und1 hatte bei dem auch immer wieder gesagt wurde es wäre alles in Butter und der Fehler kann nur an unserer Konfiguration liegen wofür wir selbst verantwortlich wären. Ich habe damals sogar den ganzen Server neu installiert und alles neu aufgespielt mit dem Ergebnis dass sich nix verbessert hat. Nach weiteren Wochen voller Ärger mit dem Server stellte sich dann auf einmal heraus dass ein Router bei 1und1 im Eimer war -> Router ausgetauscht und der Spuk war vorbei. Dankeschön!

Ich bin nun wirklich kein Profi, aber der Packet Loss der bei allen TeamSpeak Usern gleichzeitig auftritt, die Ergebnisse des MTR und die Tatsache dass derzeit keine unserer Domains ansprechbar ist lässt mich doch stark vermuten dass hier wieder ein ähnliches Problem vorliegt. Leider weist 1und1 alle Vorwürfe zurück, beteuert dass im Netzwerk keine Auffälligkeiten festzustellen sind und folglich ein Fehler bei unserer Administration vorliegen muss wofür sie nicht verantwortlich sind. Die Lieblingsausrede eines jeden Hosters eben.

Leider weis ich nicht wie ich denen beweisen soll dass der Fehler bei ihnen liegt, vor allem weil der Packet Loss nur sporadisch und unregelmässig auftritt. Ich habe ja schon versucht direkt bei auftreten des Problems den telefonischen Support anzurufen so dass sie direkt nachsehen können was da los ist aber wenn man über 40 Minuten (!) in der Warteschleife hängt und dann nichtmal jemanden von der Servertechnik dran hat wird das wohl nix :(

IP kann ich Dir gerne mal zukommen lassen, bin für jede Hilfe bei der Problemfindung dankbar.
 
Momentan kann ich die geschickten Links auch nicht aufrufen - das scheint aber kein Netzwerkproblem zu sein.
Packetloss habe ich zu dir hin keinen, auf den Grafiken der Monitoring-Server geht ebenfalls nichts verloren.

nmap zeigt auch, dass alle Ports offen sind - bis auf Port 80. Ist dir vielleicht einfach gerade der Apache verreckt?

Code:
# nmap -sT 212.227.99.139

Starting Nmap 6.01 ( http://nmap.org ) at 2012-10-28 22:30 CET
Nmap scan report for s15924834.onlinehome-server.info (212.227.99.139)
Host is up (0.051s latency).
Not shown: 986 closed ports
PORT     STATE    SERVICE
7/tcp    open     echo
21/tcp   open     ftp
25/tcp   open     smtp
53/tcp   open     domain
80/tcp   filtered http
106/tcp  open     pop3pw
110/tcp  open     pop3
143/tcp  open     imap
443/tcp  open     https
465/tcp  open     smtps
993/tcp  open     imaps
995/tcp  open     pop3s
3306/tcp open     mysql
8443/tcp open     https-alt

Nmap done: 1 IP address (1 host up) scanned in 2.65 seconds


Nachtrag: Über einen Connect auf Port 7 kann ich auch Problemlos Daten über den Echo-Dienst zurückgeben lassen.
 
Last edited by a moderator:
Code:
sxxxxxxx:/ # ps aux | grep apache2
root      1414  0.0  0.0   6164   612 pts/1    S+   22:42   0:00 grep apache2
root     30364  0.0  0.2 296476 20668 ?        Ss   20:42   0:00 /usr/sbin/httpd2-prefork -f /etc/apache2/httpd.conf -DSSL
wwwrun   30365  0.0  0.1 295432  9372 ?        S    20:42   0:00 /usr/sbin/httpd2-prefork -f /etc/apache2/httpd.conf -DSSL
wwwrun   30368  0.1  0.3 320228 33180 ?        S    20:42   0:07 /usr/sbin/httpd2-prefork -f /etc/apache2/httpd.conf -DSSL
wwwrun   30369  0.0  0.3 320228 32704 ?        S    20:42   0:05 /usr/sbin/httpd2-prefork -f /etc/apache2/httpd.conf -DSSL
wwwrun   30371  0.1  0.4 321252 35404 ?        S    20:42   0:08 /usr/sbin/httpd2-prefork -f /etc/apache2/httpd.conf -DSSL
wwwrun   31839  0.0  0.3 320228 32884 ?        S    20:43   0:04 /usr/sbin/httpd2-prefork -f /etc/apache2/httpd.conf -DSSL
wwwrun   31842  0.0  0.4 321252 35548 ?        S    20:43   0:05 /usr/sbin/httpd2-prefork -f /etc/apache2/httpd.conf -DSSL
wwwrun   31843  0.0  0.4 322276 35764 ?        S    20:43   0:06 /usr/sbin/httpd2-prefork -f /etc/apache2/httpd.conf -DSSL
wwwrun   31846  0.0  0.3 320228 32448 ?        S    20:43   0:06 /usr/sbin/httpd2-prefork -f /etc/apache2/httpd.conf -DSSL
wwwrun   31847  0.0  0.4 323300 35788 ?        S    20:43   0:05 /usr/sbin/httpd2-prefork -f /etc/apache2/httpd.conf -DSSL
wwwrun   31848  0.0  0.4 321252 35624 ?        S    20:43   0:05 /usr/sbin/httpd2-prefork -f /etc/apache2/httpd.conf -DSSL
wwwrun   31849  0.0  0.4 321252 36672 ?        S    20:43   0:06 /usr/sbin/httpd2-prefork -f /etc/apache2/httpd.conf -DSSL

Apache läuft, habe ich sogar schon 2 mal neu gestartet da scheint kein Problem zu sein. Plesk kann ich ja auch über die IP erreichen, das geht ja auch über den 80er nur die Domains eben nicht. Kann das sein dass da jemand auf der Maschine ´ne DDoS Party hat und 1und1 ihre Firewall dicht gemacht hat?

Wie gesagt, das Packet Loss Problem war auch nicht dauerhaft, immer sporadisch mal für 5 Minuten mal über Stunden, derzeit läuft der TeamSpeak Server einwandfrei ohne Loss. Nur die Domains sind eben tod.
 
Last edited by a moderator:
Das ist dann wohl ein eher getrenntes Problem.
Durchstöber mal die letzten Zeilen des error-log vom Apache, vielleicht fährt da jemand mit Slowloris gegen.
 
Code:
[Sun Oct 28 23:41:47 2012] [notice] caught SIGTERM, shutting down
[Sun Oct 28 23:41:48 2012] [warn] RSA server certificate CommonName (CN) `Parallels Panel' does NOT match server name!?
[Sun Oct 28 23:41:48 2012] [warn] RSA server certificate CommonName (CN) `Parallels Panel' does NOT match server name!?
[Sun Oct 28 23:41:48 2012] [warn] Init: Name-based SSL virtual hosts only work for clients with TLS server name indication support (RFC 4366)
[Sun Oct 28 23:41:48 2012] [notice] suEXEC mechanism enabled (wrapper: /usr/sbin/suexec2)
[Sun Oct 28 23:41:48 2012] [warn] module rewrite_module is already loaded, skipping
[Sun Oct 28 23:41:48 2012] [warn] RSA server certificate CommonName (CN) `Parallels Panel' does NOT match server name!?
[Sun Oct 28 23:41:48 2012] [warn] RSA server certificate CommonName (CN) `Parallels Panel' does NOT match server name!?
[Sun Oct 28 23:41:48 2012] [warn] Init: Name-based SSL virtual hosts only work for clients with TLS server name indication support (RFC 4366)
PHP Warning:  Directive 'safe_mode' is deprecated in PHP 5.3 and greater in Unknown on line 0
[Sun Oct 28 23:41:48 2012] [notice] mod_python: Creating 8 session mutexes based on 20 max processes and 0 max threads.
[Sun Oct 28 23:41:48 2012] [notice] mod_python: using mutex_directory /tmp 
[Sun Oct 28 23:41:48 2012] [notice] Digest: generating secret for digest authentication ...
[Sun Oct 28 23:41:48 2012] [notice] Digest: done
[Sun Oct 28 23:41:48 2012] [notice] Apache/2.2.15 (Linux/SUSE) mod_ssl/2.2.15 OpenSSL/1.0.0 mod_fcgid/2.3.6 mod_python/3.3.1 Python/2.6.5 DAV/2 mod_perl/2.0.4 Perl/v5.12.1 configured -- resuming normal operations
[Sun Oct 28 23:44:32 2012] [error] [client 66.249.76.111] File does not exist: /srv/www/vhosts/default/htdocs/robots.txt
[Sun Oct 28 23:51:19 2012] [error] [client 66.249.76.135] File does not exist: /srv/www/vhosts/default/htdocs/robots.txt
[Sun Oct 28 23:52:25 2012] [notice] caught SIGTERM, shutting down
[Mon Oct 29 00:02:49 2012] [warn] RSA server certificate CommonName (CN) `Parallels Panel' does NOT match server name!?
[Mon Oct 29 00:02:49 2012] [warn] RSA server certificate CommonName (CN) `Parallels Panel' does NOT match server name!?
[Mon Oct 29 00:02:49 2012] [warn] Init: Name-based SSL virtual hosts only work for clients with TLS server name indication support (RFC 4366)
[Mon Oct 29 00:02:49 2012] [notice] suEXEC mechanism enabled (wrapper: /usr/sbin/suexec2)
[Mon Oct 29 00:02:49 2012] [warn] module rewrite_module is already loaded, skipping
[Mon Oct 29 00:02:49 2012] [warn] RSA server certificate CommonName (CN) `Parallels Panel' does NOT match server name!?
[Mon Oct 29 00:02:49 2012] [warn] RSA server certificate CommonName (CN) `Parallels Panel' does NOT match server name!?
[Mon Oct 29 00:02:49 2012] [warn] Init: Name-based SSL virtual hosts only work for clients with TLS server name indication support (RFC 4366)
PHP Warning:  Directive 'safe_mode' is deprecated in PHP 5.3 and greater in Unknown on line 0
[Mon Oct 29 00:02:49 2012] [notice] mod_python: Creating 8 session mutexes based on 20 max processes and 0 max threads.
[Mon Oct 29 00:02:49 2012] [notice] mod_python: using mutex_directory /tmp 
[Mon Oct 29 00:02:49 2012] [notice] Digest: generating secret for digest authentication ...
[Mon Oct 29 00:02:49 2012] [notice] Digest: done
[Mon Oct 29 00:02:49 2012] [notice] Apache/2.2.15 (Linux/SUSE) mod_ssl/2.2.15 OpenSSL/1.0.0 mod_fcgid/2.3.6 mod_python/3.3.1 Python/2.6.5 DAV/2 mod_perl/2.0.4 Perl/v5.12.1 configured -- resuming normal operations
[Mon Oct 29 00:03:14 2012] [error] server reached MaxClients setting, consider raising the MaxClients setting

Irgendwie werden direkt nach dem Start des Indianers die MaxClients überschritten. :confused:


Komischerweise geht nmap bei mir durch...
Code:
Nmap scan report for s15924834.onlinehome-server.info (212.227.99.139)

Host is up (0.070s latency).

Not shown: 986 filtered ports

PORT     STATE SERVICE
7/tcp    open  echo
21/tcp   open  ftp
25/tcp   open  smtp
53/tcp   open  domain
80/tcp   open  http
106/tcp  open  pop3pw
110/tcp  open  pop3
143/tcp  open  imap
443/tcp  open  https
465/tcp  open  smtps
993/tcp  open  imaps
995/tcp  open  pop3s
3306/tcp open  mysql
8443/tcp open  https-alt
 
Last edited by a moderator:
Jetzt bin ich endgültig am verzweifeln! Ich habe da ich bei der Fehlersuche keinen Schritt weiter gekommen bin nun den gesammten vRoot neu installieren lassen und die Webseite neu aufgespielt. Die Webseite war 5 Minuten lang erreichbar und danach hatte ich die gleichen Probleme wie vorher.

Ruft man die URL auf läd sich die Seite entweder komplett tod oder öffnet sich nach meist über 15 Minuten ganz zögerlich. Das Problem tritt bei beiden Domains mit unterschiedlichen Webseiten gleichermassen auf und ich habe ein absolut jungfräuliches System.

Kann es irgendwie am Routing im Rechenzentrum oder an der Hostmaschine liegen? Kann es sein dass der DNS Server des Hosters die Probleme verursacht oder wie ich es schon vor 2 Jahren erlebt hatte dass einfach ein Router im RZ fehlerhaft arbeitet?

Ich weis langsam echt nicht mehr weiter denn 1und1 behauptet der Fehler liegt an uns und ich wüsste nicht wie ich das Gegenteil beweisen oder den Fehler lokalisieren sollte. :confused:
 
Last edited by a moderator:
Kannst du mal den Output von folgenden Befehlen posten?:

Code:
cat /var/log/apache2/access.log


Code:
netstat -ant && netstat -ant |uniq -u |wc -l
 
Back
Top