vServer lahmt ab und an total

b-machinery

Registered User
Servus zusammen,

ich habe ab und an ein heftiges Problem mit meinem vServer (Medium X2) bei S4U. Zwischendrin lahmt das Teil komplett, so daß kaum mehr was geht, es ist aber falls ich mal draufkomme eigentlich nicht mehr los wie sonst auch, nur die LoadAverage ist jenseits von Gut und Böse (4- teilweise 12), ich sehe aber keinen Prozess der diese Last auslösen könnte. Kann es sein daß ein anderer vServer auf dem Hostsystem das verursacht?
Hier mal ein kleiner Mitschnitt der LA von gestern:
Code:
09:15:04 up 1 day, 16:00,  0 users,  load average: 1.07, 0.41, 0.22
 10:15:06 up 1 day, 17:00,  0 users,  load average: 0.39, 0.27, 0.22
 11:15:07 up 1 day, 18:00,  0 users,  load average: 0.41, 0.24, 0.19
 12:15:11 up 1 day, 19:00,  0 users,  load average: 0.72, 0.30, 0.18
 13:15:03 up 1 day, 20:00,  0 users,  load average: 0.23, 0.12, 0.10
 14:15:04 up 1 day, 21:00,  0 users,  load average: 0.32, 0.37, 0.30
 15:15:05 up 1 day, 22:00,  0 users,  load average: 0.12, 0.16, 0.18
 16:15:10 up 1 day, 23:00,  0 users,  load average: 0.64, 0.42, 0.29
 17:18:50 up 2 days, 3 min,  0 users,  load average: 9.68, 8.26, 7.03
 18:15:52 up 2 days,  1:00,  0 users,  load average: 9.98, 7.23, 7.72
 19:15:02 up 2 days,  2:00,  0 users,  load average: 0.48, 0.18, 0.59
 20:15:08 up 2 days,  3:00,  0 users,  load average: 0.52, 0.21, 0.17
 21:15:03 up 2 days,  4:00,  0 users,  load average: 0.21, 0.18, 0.21
 22:15:04 up 2 days,  5:00,  0 users,  load average: 0.29, 0.23, 0.21
 23:15:02 up 2 days,  6:00,  0 users,  load average: 0.00, 0.05, 0.11
 00:15:01 up 2 days,  7:00,  0 users,  load average: 0.08, 0.09, 0.04
 01:15:08 up 2 days,  8:00,  0 users,  load average: 0.23, 0.09, 0.02
 02:15:08 up 2 days,  9:00,  0 users,  load average: 0.16, 0.05, 0.01
 03:15:10 up 2 days, 10:00,  0 users,  load average: 0.24, 0.11, 0.04
 04:15:07 up 2 days, 11:00,  0 users,  load average: 0.08, 0.16, 0.31
 05:15:08 up 2 days, 12:00,  0 users,  load average: 0.40, 0.14, 0.07
 06:15:03 up 2 days, 13:00,  0 users,  load average: 0.01, 0.03, 0.04
 07:15:02 up 2 days, 14:00,  0 users,  load average: 0.02, 0.03, 0.00
 08:15:02 up 2 days, 15:00,  0 users,  load average: 0.18, 0.07, 0.01
Wie Ihr seht war da zwischen 17 und 18 Uhr scheinbar die Hölle los, aber wie gesagt, ich sehe nichts in den Logs was diese Last erklären würde. Auf dem Server läuft ein SMF-Forum und sonst nur mein Mailgedöns. Speicher verbrate ich grad mal 70MB von verfügbaren 768 MB. Ich bin ziemlich ratlos, hat vielleicht einer von Euch eine Idee? Bin für jede Hilfe dankbar!

ps aux liefert
Code:
USER       PID %CPU %MEM   VSZ  RSS TTY      STAT START   TIME COMMAND
root         1  0.0  0.0  1620  508 ?        Ss   Jan12   0:01 init [3]      
root     15664  0.0  0.0  1528  256 ?        Ss   Jan12   0:01 syslogd -m 0
root     18270  0.0  0.1  3936  828 ?        Ss   Jan12   0:00 /usr/sbin/sshd
root     19683  0.0  0.0  2076  500 ?        Ss   Jan12   0:00 xinetd -stayalive -pidfile /var/run/xinetd.pi
root     19826  0.0  0.0  3664  604 ?        S    Jan12   0:00 /usr/sbin/vsftpd /etc/vsftpd/vsftpd.conf
root     20448  0.0  0.1  2144  880 ?        S    Jan12   0:00 /bin/sh /usr/bin/safe_mysqld --defaults-file=
mysql    21805  0.0  1.1 37048 9388 ?        Sl   Jan12   2:03 /usr/libexec/mysqld --defaults-file=/etc/my.c
cyrus    26105  0.0  0.1  4440  920 ?        Ss   Jan12   0:02 /usr/lib/cyrus-imapd/cyrus-master -d
root     29872  0.0  0.1  7532 1320 ?        Ss   Jan12   0:07 sendmail: accepting connections
smmsp    29962  0.0  0.1  6492  904 ?        Ss   Jan12   0:00 sendmail: Queue runner@01:00:00 for /var/spoo
cyrus    20362  0.0  0.0 28216  272 ?        S    Jan12   0:03 idled
root      9356  0.0  0.5 22436 4712 ?        Ss   Jan12   0:09 /usr/sbin/httpd
root      9592  0.0  0.0  2400  592 ?        Ss   Jan12   0:00 crond
root      9743  0.0  0.1  4044  816 ?        Ss   Jan12   0:00 /usr/sbin/saslauthd -m /var/run/saslauthd -a 
root     32581  0.0  0.1  3428  864 ?        S    Jan13   0:10 /usr/bin/perl /usr/local/confixx/pipelog.pl
apache   28463  0.3  1.2 28064 9596 ?        S    09:14   0:02 /usr/sbin/httpd
root     30248  0.0  0.2  7872 2300 ?        S    09:16   0:00 sendmail: server [88.227.4.253] cmd read
apache   22378  0.1  1.1 27540 8968 ?        S    09:18   0:00 /usr/sbin/httpd
root     20176  0.1  0.2  6792 2144 ?        Rs   09:26   0:00 sshd: root@pts/0 
root     27864  0.1  0.1  2152 1264 pts/0    Ss   09:27   0:00 -bash
root      9807  0.0  0.0  2304  752 pts/0    R+   09:27   0:00 ps aux

free liefert
Code:
             total       used       free     shared    buffers     cached
Mem:        786432      67188     719244          0          0          0
-/+ buffers/cache:      67188     719244
Swap:            0          0          0

user_beancounters:
Code:
Version: 2.5                                                                                                                     
       uid  resource                     held              maxheld              barrier                limit              failcnt
    138206: kmemsize                  3380777              9907538             11261712             12387883                    0
            lockedpages                     0                    0                  430                  430                    0
            privvmpages                 16788                54898               196608               204800                    0
            shmpages                      805                 1461                23020                23020                    0
            dummy                           0                    0                    0                    0                    0
            numproc                        23                   98                  144                  144                    0
            physpages                    6414                22670                    0  9223372036854775807                    0
            vmguarpages                     0                    0                98304  9223372036854775807                    0
            oomguarpages                 9166                25684                98304  9223372036854775807                    0
            numtcpsock                     13                  107                  244                  244                    0
            numflock                        6                   40                  336                  369                    0
            numpty                          1                    2                   24                   24                    0
            numsiginfo                      0                    2                  768                  768                    0
            tcpsndbuf                  126576               583656              1884024              3681759                    0
            tcprcvbuf                  212992               663168              1884024              3681759                    0
            othersockbuf                 9376               300312               844366              1481926                    0
            dgramrcvbuf                     0                 8488               844366               844366                    0
            numothersock                   11                   63                  288                  288                    0
            dcachesize                 761238               912087              2254786              2322430                    0
            numfile                      1807                 3081                 4256                 4256                    0
            dummy                           0                    0                    0                    0                    0
            dummy                           0                    0                    0                    0                    0
            dummy                           0                    0                    0                    0                    0
            numiptent                      35                   35                   96                   96                    0
 
Last edited by a moderator:
17:18:50 up 2 days, 3 min, 0 users, load average: 9.68, 8.26, 7.03
18:15:52 up 2 days, 1:00, 0 users, load average: 9.98, 7.23, 7.72

Dein System verursacht die Last. Tritt die hohe Load zu bestimmten Uhrzeiten auf oder sporadisch?
 
Lass doch mal ein MRTG mitlaufen. Bei mir steigt sporadisch die iowaits und die load. Wobei ich dann kaum den Server benutzen kann. Auch ich kann nicht mehr Last erkennen wie sonst und vermute starke Plattennutzung.

Grüße
elmo
 
Zitat aus Load (computing): - Wikipedia, the free encyclopedia
An idle computer has a load number of 0 and each process that is using CPU or waiting for CPU adds to the load number by 1. Most UNIX systems count only processes in the running (on CPU) or runnable (waiting for CPU) states. However, Linux also includes processes in uninterruptible sleep states (usually waiting for disk activity), which can lead to markedly different results if many processes are blocked in I/O due to a busy or stalled I/O system. This, for example, includes processes that are blocked due to an NFS server failure or slow media (e.g., USB 1.x storage devices), leading to an elevated load average, which does not reflect an actual increase in CPU use (but still gives an idea on how long you have to wait).

D.h. Du siehst in der angegebenen Zahl nicht unbedingt, dass so viele Prozesse laufen, sondern dass so viele Prozesse laufen könnten, wenn denn nur die benötigten Ressourcen zur Verfügung stehen würden. Bei Deinem System können Prozesse zu diesem Zeitpunkt nicht ausgeführt werden, weil ihnen irgendwas fehlt (z.B. Daten von der Platte, etc.).

Bei einem vServer teilt man sich die physisch tatsächlich vorhanden Ressourcen (die der VE nur virtuell zur Verfügung gestellt werden) mit anderen VEs. Wenn bei Deinem System tatsächlich alles in Ordnung scheint, und Du von Deiner Seite keinen Fehler finden kannst, bleibt Dir wohl nichts anderes übrig, als Dich bei Deinen lieben Nachbarn zu bedanken, die das System überlasten.

Kontrolliere zur Sicherheit, dass zu Zeiten extrem hoher Load wirklich nichts "fremdes" auf Deinem System läuft, d.h. dass niemand den Rechner als SPAM-Schleuder missbraucht, etc. Wenn Du so belegen kannst, dass es nicht an Dir liegt, kann vielleicht der Support den Nachbarn etwas auf die Finger klopfen.

Viele Grüße,
LinuxAdmin
 
Erst mal vielen Dank für Eure Antworten!

Dein System verursacht die Last. Tritt die hohe Load zu bestimmten Uhrzeiten auf oder sporadisch?
Die tritt ab und an sporadisch auf und ist dann auch wieder weg wie man sieht. Hatte gestern keine Gelegenheit nachzusehen, aber falls ich mal draufkomme, sehe ich daß meist einige sendmail-Prozesse hängen ebenso wie einige http-Prozesse. Aber in der Größenordnung bis 10, nicht mehr.

Ich habe auch das maillog durchforscht nach der betreffenden Uhrzeit um zu sehen was da los war, aber absolut nichts, ich dachte auch erst auf Grund der vielen sendmail-Prozesse daß da was nicht ganz sauber ist, dem ist aber nicht so. Das einzige was mir richtig aufgefallen ist, ist daß zum einen versucht wurde eine Menge Spam an nicht mehr existente Adressen abzuladen, zum anderen kamen grad zu der Zeit wo die Auslastung des Servers so hoch war eine Menge Meldungen a la
Code:
Jan 14 17:48:44 vs138206 sendmail[23633]: m0EGlIj3023633: red-200-119-254-056.ma
nquehue.net [200.119.254.56] (may be forged) did not issue MAIL/EXPN/VRFY/ETRN d
uring connection to MTA
Kann die hohe Last davon kommen? Bin leider nicht so firm mit sendmail.
 
Hi,

@b-machinery: Du liegst noch auf einem Hostsystem mit so einem lahmen LSI SCSI Controller. :( Die migrieren wir gerade nach und nach leer und ruesten die mit besseren Controllern und mehr Power aus. Bitte begulde dich noch ein wenig. :)
 
Na, das ist doch mal eine Antwort! Danke @mbroemme :), dann werde ich mich gedulden und erst mal nicht mehr weitersuchen. Komisch ist nur, daß die Kiste meistens flutscht...
 
Back
Top