High CPU / Load Fehlersuche

sneakout

New Member
Hallo,

es ist manchmal zum Verzweifeln und offenbar gibt es niemand auf der Welt, der auch nur einen sinnvollen Ratschlag hat.

Kämpfe seit einigen Wochen auf unsere Managed Server bei Strato mit einer hohen CPU Auslastung und Load. Aber nicht von jetzt auf gleich, sondern das baut sich allmählich über Tage und Wochen auf.

Der Support von Strato verweist auf fehlerhfafte Scripts, kann mir aber auch nicht sagen, wie man die findet. Datenschutzgründe. Nun erhoffe ich mir hier, wie ich den Schuldigen finden kann.

Auf dem Webspace läuft nur eine Wordpress Installation und ein paar Plugins, aber selbst das Abschalten dieser und der Wechsel auf das Standard WP Template helfen nicht.

Ich habe Zugriff auf den Access Log, Error Log, sowie die SSH Konsole mit einigen Befehlen wie Top. Auch der Kill All Befehl hilft da nicht, CPU steigt sofort wieder erhöht ein.

Wie genau geht man nun vor, um den Fehler zu finden. Bin für jeden Ratschlag dankbar!

mfg
 
Ein hoher CPU Load kann viele Ursachen haben. Defekter RAM, defekte Festplatten, schlechte Scripte, ...

Es gibt verschiedene Tools womit man das untersuchen kann.

ps afx - zeigt dir die laufenden Prozesse an. Hier schauen ob ein Script übermäßig oft auftaucht oder ungewöhnliche Prozesse laufen.

htop - zeigt dir die laufenden Prozesse nach CPU / RAM Last an. Mit F6 kann man hier die Sortierung der Anzeige anpassen.

iostat -mN -d 5 - zeigt dir in 5 Sekunden Aktualisierung an, wie hoch die I/O Belastung der Festplatten ist.

iotop - zeigt dir, welche Prozesse gerade viel Festplattenauslastung erzeugen.

Wenn du das alles geprüft hast und nichts auffällt, hilft manchmal auch ein Blick in die /var/log/kern.log - dort nach Memory Fehlern ausschau halten oder CPU Fehlermeldungen.

Das alles ist aber eigentlich Aufgabe deines Managed Service Providers. Dafür bezahlt man ja eigentlich das Management.
 
Vielen Dank,

da geht es schon los, viele dieser Befehle gehen bei mir nicht, zb. Htop = Kommando nicht gefunden.

Wie erwähnt, ich habe keinen vollen Zugriff auf den Server, ist halt Managed und eigentlich denkt man, dass es deren Problem ist oder dass die zumindest mal einen Lösungsvorschlag haben.

Der war allerdings auch nur die SSH Konsole und der Top Befehl. Ja toll, damit kann ich dann auch nicht so viel anfangen.

Das ps afx geht und zeigt mir das auf dem Bild an, ist für mich aber auch nur Bahnhof. :/

Auch mal ein aktuelles Bild vom Top Befehl, wo ich gucken soll, aber wie gehts weiter?

PS: Die Server Hardware scheint in Ordnung. Nach einem Neustart des Webspace läuft alles ganz normal, erst die Tage danach baut sich das dann auch. Jetzt nach 14 Tagen ist der wieder bei 90% CPU Auslastung angekommen, aber der Webspace ist ohne probleme erreichbar und schnell.
 

Attachments

  • sss.jpg
    sss.jpg
    304.2 KB · Views: 197
  • top.png
    top.png
    28.7 KB · Views: 183
Last edited by a moderator:
Was heißt denn "hohe Load" konkret bei Dir? Und - wenn managed - warum kümmerst Du dich drum? Hast Du erhöhte Ladezeiten oder wie äußert sich das nach außen?

Für Wordpress gibt's noch ein paar nette Plugins, die einem auch SQL und andere Dinge auswerten - wobei Du vermutlich keinen direkten Zugriff auf die Datenbank hast, um dort nach evtl. suboptimalen Konfigurationen zu suchen?
 
Ja das frage ich mich auch, das Problem liegt laut Strato an irgendetwas, was bei uns auf dem Webspace ist. Nur was ist die Frage.

Da sind die raus und bieten keinen Support, weil es ja mein Ding ist, was ich darauf lagere etc.

Ich meine den Load über den Top Befehl. Load ist derzeit bei 5,5 bis 6, nach einem Neustart bei 0,5 bis 1. CPU wie gesagt aktuell um die 90 Prozent.

Doch, die SQL Datenbank kann ich aufrufen.

Mir geht es momentan darum herauszufinden, welches Plugin etc einfach durchdreht.
 
Last edited by a moderator:
Der Support von Strato verweist auf fehlerhfafte Scripts, kann mir aber auch nicht sagen, wie man die findet. Datenschutzgründe.
Wird jetzt Datenschutz schon für fehlende Motivation oder Kompetenz vorgeschoben? Jeden Tag was neues... :D

und eigentlich denkt man, dass es deren Problem ist oder dass die zumindest mal einen Lösungsvorschlag haben.
Das hängt von deinem Supportvertrag ab. Ich würde mal spontan davon ausgehen dass es zwar eigentlich dein Bier ist aber ein Server auf dieser Load nicht mehr korrekt laufen kann und damit Strato aktiv werden muss. Vermutlich gibt es aber eine "ausser vom Kunden verursacht" Klausel...

Wie erwähnt, ich habe keinen vollen Zugriff auf den Server
Damit kannst du die genannten Programme nicht nachinstallieren und eine anständige Überprüfung ist dir damit auch nicht wirklich möglich.

Falls du ausreichenden Zugriff hast kannst du eventuell aus den Prozess-Dateihandles die URsache rausfinden. Der Befehl dazu ist "lsof -p PID | more" wobei PID dann die ProzessID eines beliebigen PHP-Skriptes aus top ist.

Ich hoffe aber dass es hier php-fastcgi Prozesse sind und nicht steinzeitliche php-cgi Prozesse auch wenn es irgendwie nicht so aussieht.
 
Das kann ich nicht beurteilen, mich nervt es auch gewaltig.

Ja, da ist FastCGI aktiviert. Habs mal mit deinem Befehl und einer wiederkehrenden PID, die viel CPU nutzt, probiert, da passiert irgendwas, da steht dann immer:

php72-cgi 20492 XXXX cwd unknown /proc/20492/cwd (readlink: Permission denied)

Kann ich nun auch nix mit anfangen.

Der letzte Tipp von Strato war halt, da laufen irgendwelche Hintergrundprozesse, die sich nicht beenden würden und dann irgendwann stapeln.

Hatten das gleiche vor genau zwei Wochen. Da war die CPU Auslastung schon bei 99 Prozent, aber der Webspace war ohne Einschränkungen erreichbar und schnell wie immer. Von Strato wurde dann der Apache Server einmal neu gestartet und damit war es für die erledigt, aber das ist ja nun keine Lösung.

Trotzdem Danke erstmal.
 
Wenn du einen Managed Server hast, warum kümmerst du dich eigentlich um so etwas? Dafür hat man doch genau einen Managed Server, das man sich nicht um die Server Sachen kümmern muss.

Läuft ggfs. ein Skript das per Cronjob ausgeführt wird und dann per CLI läuft?
 
Ja das habe ich Strato schon hundert mal gefragt und die Antwort ist immer: Was auf dem Webspace läuft ist nicht unser Bier.

Die Crons hab ich heute überprüft und hab dabei drei rausgeworfen, deren wp plugins schon gar nicht mehr installiert waren.

Der Rest sind 6 vom Wordpress Core und 6 andere fürs Caching, Ads und ein Amazon Affliate Plugin etc, die einmal täglich bzw, wöchentlich durchlaufen. Aber ich hatte ja schon alle Plugins deaktiviert, ohne dass sich was getan hat.
 
Zumindest nach der Schilderung deines Sachverhalts sehe ich nichts was du aktiv unternehmen kannst um entweder den Schuldigen zu suchen, zu begrenzen oder zu blockieren da du schlicht nicht die notwendigen Systemrechte hast und derjenige der die Rechte hat (Strato) dir den Stinkefinger zeigt.

Sofern es keinen Grund für managed Server gibt würde ich dir an dieser Stelle empfehlen Strato den Rücken zu zeigen und zu einem Webspace-Anbieter zu wechseln. Stichworte wie "Cloudlinux" und "cPanel" finden da bspw generell Anbieter mit guter Nutzertrennung und vernünftiger Endkundenoberfläche.
Falls managed Server wegen anderen Hintergrunddiensten eine Pflicht ist kann ich bspw PHP-Friends anraten.

Die Crons hab ich heute überprüft und hab dabei drei rausgeworfen, deren wp plugins schon gar nicht mehr installiert waren.
Dann soll der Cron auch insignifikant Ressourcen belegen. Starten, "nix da", beenden.
Wordpress oder dessen Plugins sind Spezialist im Zombie-basteln; also Prozesse die noch laufen aber wo die Anfrage lange bereits beendet oder abgebrochen wurde und die entweder an einem Timeout hängen oder durch andere Ursache.

Bei Fastcgi Servern hatte ich das Problem mal durch einen halbstündlichen "Cleanup" cron gelöst welcher alle PHP-Prozesse des Webservers mit einem Alter grösser als die halbe Stunde abschiesst. Allerdings braucht man dazu entsprechende Berechtigung, du darfst ja nicht mal die Prozesse sehen.

Bei PHP-Umgebungen mit mod_php oder lsapi ist das Problem generell selbstregulierend so dass es da gar nicht erst so schlimm auftritt.
Seit dem Wechsel von fastcgi auf Cloudlinux lsapi vor paar Jahren habe ich bei unseren Webhosting-Kunden keine Probleme der oben beschriebenen Art mehr feststellen können.
 
So, vielen Dank erst einmal an alle ... werde jetzt noch einen Versuch starten herauszubekommen was das ist und dann den Anbieter wechseln.

Ein schönes Wochenende :)
 
Oder Management-Option kündigen und das gesparte Geld einem Admin geben, der sich richtig mit dem Problem auseinander setzt.
 
Wenns nur um eine Wordpress Installation und ein paar Plugins geht ist ein vServer auch schnell eingerichtet. Hier wird dir dabei gerne geholfen, meiner Meinung nach hast du schon fundiertes Grundwissen und mit der Bereitschaft zu lernen sollte ein eigener Server auch möglich sein!

Strato und 1&1 sind -imho- sowieso nicht empfehlenswert für alles wo man sich auf Support verlassen muss...
 
Back
Top