Server4You vServer: Cannot allocate memory

martinj

New Member
Hi!
Als ich gerade nach Hause kam, konnte ich mich nicht mehr in den FTP einloggen.

Auch dynamische Webseiten waren mit dem Fehler Cannot allocate memory nicht mehr erreichbar.

Also habe ich mich auf meinen vServer 2061068 von Server4You eingeloggt.

Dort konnte ich gar nichts mit der Begründung Cannot allocate memory machen. Also habe ich ein paar Dienste abgeschaltet, um mir die /proc/user_beancounters anzuschauen. Auch die sieht sauber aus:

Code:
Version: 2.5                                                                                                                     
       uid  resource                     held              maxheld              barrier                limit              failcnt
   2061068: kmemsize                  5533686              7067715              7056211              7761832                 4360
            lockedpages                     0                    2                  344                  344                    0
            privvmpages                 40371                60893                87632                96396                    0
            shmpages                     1315                 1331                19567                19567                    0
            dummy                           0                    0                    0                    0                    0
            numproc                        63                   88                  128                  128                    0
            physpages                   12044                26551                    0           2147483647                    0
            vmguarpages                     0                    0                65536           2147483647                    0
            oomguarpages                12063                26572                65536           2147483647                    0
            numtcpsock                     50                   86                  172                  172                    0
            numflock                        6                    9                  224                  246                    0
            numpty                          2                    2                   16                   16                    0
            numsiginfo                      0                   41                  512                  512                    0
            tcpsndbuf                  178712               422936              1416560              2768240                    0
            tcprcvbuf                  162408               365184              1416560              2768240                    0
            othersockbuf                 9376               113872               655717              1153621                    0
            dgramrcvbuf                     0                32112               655717               655717                    0
            numothersock                   13                   31                  228                  228                    0
            dcachesize                 946121              1035963              1002127              1032191                29444
            numfile                      2062                 2441                 3008                 3008                    0
            dummy                           0                    0                    0                    0                    0
            dummy                           0                    0                    0                    0                    0
            dummy                           0                    0                    0                    0                    0
            numiptent                      10                   10                   64                   64                    0

Dennoch bekomme ich z.B. bei rkhunter den Fehler Cannot allocate memory (Spamassassin startet auch nicht mehr). Das war vorher nicht so.

Ein Ticket wurde bereits eröffnet.

Hat wer anderes das gleiche Problem?
 
Last edited by a moderator:
Hallo,

also ich sehe dort einen deutlichen Hinweis auf dein RAM Problem.

Beachte mal die Failcounts bei kmemsize.

Im übrigen wird dir ein Ticket bei dem Problem nicht weit helfen.

Du solltest (imho) den Server rebooten, und dann mal schauen was so alles läuft das dir nicht gehört ;)
 
Ich habe bereits auf kmemsize geachtet (die übrigends nicht die Barriere überschreitet oder sich dieser annähert, wenn die RAM-Fehler kommen) und bin kein blutiger Anfänger, was vServer angeht (ich weiß, wie die beancounters zu deuten sind).

Wie gesagt, die Werte erreichen nie das Limit, bis beim Startvorgang (Ich habe sehr viele Modifikationen am System vorgenommen, dadurch auch die failcnts nach dem Start). Trotzdem bekomme ich diese Fehlermeldungen.

Also gehe ich von einem Fehler seiten Server4You aus, vorallem, weil ich in der Zeit von gestern auf heute nichts an der Serverkonfiguration geändert habe. Und deshalb habe ich den Beitrag auch bei Server Down gepostet.

Einen Neustart habe ich schon probiert,
Martin
 
Last edited by a moderator:
ps aux
Code:
USER       PID %CPU %MEM    VSZ   RSS TTY      STAT START   TIME COMMAND
root         1  0.0  0.0   1484   528 ?        Ss   14:07   0:00 init [2]      
syslog   30038  0.0  0.0   1964   588 ?        Ss   14:08   0:00 /sbin/syslogd -
root     30065  0.0  0.0   1592   484 ?        Ss   14:08   0:00 /bin/dd bs 1 if
klog     30069  0.0  0.0   1488   380 ?        Ss   14:08   0:00 /sbin/klogd -P
root     30179  0.0  0.0   1652   392 ?        S    14:08   0:00 /usr/sbin/couri
root     30180  0.0  0.0   3480   768 ?        S    14:08   0:00 /usr/lib/courie
root     30184  0.0  0.0   3480   416 ?        S    14:08   0:00 /usr/lib/courie
root     30185  0.0  0.0   3520  1240 ?        S    14:08   0:00 /usr/lib/courie
root     30186  0.0  0.0   3520  1244 ?        S    14:08   0:00 /usr/lib/courie
root     30187  0.0  0.0   3520  1244 ?        S    14:08   0:00 /usr/lib/courie
root     30188  0.0  0.0   3520  1256 ?        S    14:08   0:00 /usr/lib/courie
root     30213  0.0  0.0   1752   500 ?        S    14:08   0:00 /usr/sbin/couri
root     30215  0.0  0.0   1656   472 ?        S    14:08   0:00 /usr/sbin/couri
root     30236  0.0  0.0   1752   500 ?        S    14:08   0:00 /usr/sbin/couri
root     30240  0.0  0.0   1652   468 ?        S    14:08   0:00 /usr/sbin/couri
dcc      30250  0.0  0.1  40872  8460 ?        Ssl  14:08   0:00 /usr/sbin/dccif
101      30488  0.0  0.0  10864  1460 ?        Ss   14:08   0:00 /usr/sbin/exim4
root     30501  0.0  0.0   1476   364 ?        Ss   14:08   0:00 /usr/sbin/inetd
root     31796  0.0  0.0   5940   988 ?        Ss   14:08   0:00 /usr/sbin/sasla
root     31816  0.0  0.0   4792  1040 ?        Ss   14:08   0:00 /usr/sbin/sshd
root     31953  0.0  0.0   2072   704 ?        Ss   14:08   0:00 /usr/sbin/cron
root     32596  0.0  0.0   7692  5256 ?        Ss   14:08   0:00 /usr/sbin/munin
root     32057  0.0  0.0  10672  5232 ?        Ss   14:20   0:00 /usr/sbin/apach
www-data 32712  0.0  0.0   4776  1824 ?        S    14:20   0:07 /usr/sbin/light
root     23862  0.0  0.0   3384  1532 ?        S    16:28   0:00 /usr/bin/courie
vmail    23864  0.0  0.0   3112   836 ?        S    16:28   0:00 /usr/bin/imapd
root     32677  0.0  0.0   2368  1164 ?        S    16:30   0:00 /bin/sh /usr/bi
mysql    32765  0.5  0.1  50680 14292 ?        Sl   16:30   0:07 /usr/sbin/mysql

top
Code:
top - 16:52:57 up  2:45,  1 user,  load average: 0.21, 0.19, 0.22
Tasks:  28 total,   0 running,  28 sleeping,   0 stopped,   0 zombie
Cpu(s):  2.3% us,  0.7% sy,  0.0% ni, 96.0% id,  1.0% wa,  0.0% hi,  0.0% si
Mem:   8144924k total,  8108432k used,    36492k free,    36344k buffers
Swap: 16557612k total,  4041452k used, 12516160k free,   882752k cached

  PID USER      PR  NI  VIRT  RES  SHR S %CPU %MEM    TIME+  COMMAND                                                                                         
    1 root      16   0  1484  528  464 S    0  0.0   0:00.00 init                                                                                            
30038 syslog    15   0  1964  588  484 S    0  0.0   0:00.05 syslogd                                                                                         
30065 root      17   0  1592  484  408 S    0  0.0   0:00.00 dd                                                                                              
30069 klog      18   0  1488  380  312 S    0  0.0   0:00.00 klogd                                                                                           
30179 root      19   0  1652  392  324 S    0  0.0   0:00.00 courierlogger                                                                                   
30180 root      16   0  3480  768  560 S    0  0.0   0:00.00 authdaemond.mys                                                                                 
30184 root      16   0  3480  416  208 S    0  0.0   0:00.00 authdaemond.mys                                                                                 
30185 root      16   0  3520 1240  768 S    0  0.0   0:00.00 authdaemond.mys                                                                                 
30186 root      15   0  3520 1244  772 S    0  0.0   0:00.00 authdaemond.mys                                                                                 
30187 root      16   0  3520 1244  772 S    0  0.0   0:00.00 authdaemond.mys                                                                                 
30188 root      16   0  3520 1256  772 S    0  0.0   0:00.00 authdaemond.mys                                                                                 
30213 root      16   0  1752  500  420 S    0  0.0   0:00.00 couriertcpd                                                                                     
30215 root      15   0  1656  472  400 S    0  0.0   0:00.00 courierlogger                                                                                   
30236 root      16   0  1752  500  420 S    0  0.0   0:00.00 couriertcpd                                                                                     
30240 root      16   0  1652  468  400 S    0  0.0   0:00.00 courierlogger                                                                                   
30250 dcc       15   0 40872 8460  688 S    0  0.1   0:00.00 dccifd                                                                                          
30488 Debian-e  16   0 10864 1460  928 S    0  0.0   0:00.08 exim4                                                                                           
30501 root      18   0  1476  364  308 S    0  0.0   0:00.00 inetd                                                                                           
31796 root      18   0  5940  988  692 S    0  0.0   0:00.00 saslauthd                                                                                       
31816 root      16   0  4792 1040  764 S    0  0.0   0:00.00 sshd                                                                                            
31953 root      16   0  2072  704  572 S    0  0.0   0:00.01 cron                                                                                            
32596 root      15   0  7692 5256 1528 S    0  0.1   0:00.18 munin-node                                                                                      
32057 root      15   0 10672 5232 3232 S    0  0.1   0:00.34 apache2                                                                                         
32712 www-data  15   0  4776 1576  928 S    0  0.0   0:07.12 lighttpd                                                                                        
23862 root      15   0  3384 1532 1256 S    0  0.0   0:00.00 couriertls                                                                                      
23864 vmail     16   0  3112  836  692 S    0  0.0   0:00.00 imapd                                                                                           
32677 root      16   0  2368 1164  944 S    0  0.0   0:00.01 mysqld_safe                                                                                     
32765 mysql     15   0 50680  13m 4332 S    0  0.2   0:07.82 mysqld





Angehangen ist eine Grafik meiner Serverüberwachung über den RAM.
Was auffällt ist, dass sowohl cache als auch unused im Vergleich zum Durchschnitt schwindend gering sind.
 

Attachments

  • memory-day.png
    memory-day.png
    54.3 KB · Views: 271
So wie es scheint, wird dcachesize überschritten, und ich habe das übersehen..

Das hatte ich noch nie.. :(

Komischerweise ist dcachesize recht niedrig, wenn der Apache aus ist. Wenn Apache an ist, ist es nah an der Barriere.

Früher (mit gleicher Apache-Konfiguration) lag dcachesize bei ca. 500000.

Auch noch offen ist die Frage, warum cache und unused im Vergleich zum Durchschnitt so klein sind. Vielleicht hänt das zusammen?

Im Vergleich ist die kmemsize auch relativ hoch, aber nicht im kritischen Bereich.

Hier mal meine alten Beancounterswerte:
Die aktuelle Serverkonfiguration unterscheidet sich bis auf die Installation von Munin nicht von der alten.

vzfree sagt das:
Momentan genutzt: 163.699 MB
Zugesichert: 256 MB
Maximal nutzbar: 376.547 MB

Martin
 
Last edited by a moderator:
Frustrierende Antwort vom Support:

durch den Einsatz neuester Virtualisierungssoftware ist es möglich die Ressourcen der Benutzer auf einem Hostsystem genauestens zu limitieren. Wir können garantieren, dass jeder User auf einem Hostsystem genau die CPU, RAM, Festplattenressourcen zur Verfügung stehen, die gebucht wurden.
Sollten in /proc/user/beancounter Überschreitungen Sein, legen wir Ihnen nahe, die Ressourcen entsprechend zu limitieren, oder auf ein größeres Serverprodukt Ihre dienst zu migrieren.


So, über diese bin ich jetzt leicht verärgert, da ich eine Standardantwort bekommen habe (Die im Thread hinterlassenen Informationen habe ich dort auch niedergeschrieben, samt der Auswertung des RAM Graphens).

Was mich verwundert ist folgendes:
In der OpenVZ Dokumentation steht, dass der Wert dcachesize (der als einziger an seinen Grenzen ist) auch im Wert kmemsize inkludiert wird, welcher nicht an seinen Grenzen ist (vgl. Beancounterwerte 1. Post):

The value accounted into dcachesize is also included into kmemsize.

Eine ähnliche Antwort ging auch an den Support raus,

Martin
 
Last edited by a moderator:
Meine obige Schlussfolgerung ist etwas falsch, ich habe weitergelesen.

Dort steht:

Dcachesize exists as a separate parameter to impose a limit causing file operations to sense memory shortage and return an error to applications, protecting from memory shortages during critical operations that shouldn't fail.

Kurz, dcachesize ist dafür da, zu verhindern, dass für wichtige Operationen / Prozesse zu wenig RAM zur Verfügung steht (Grundfunktionen des vServers).

Also meint Virtuozzo wohl bei mir ziemlich früh, dass nicht mehr genügend RAM mehr für kritische Operationen zur Verfügung steht.

Obwohl kmemsize bei 5186946 von 7056211 (26,49% von der Barriere werden also nicht benutzt) und privvmpages bei 34975 von 87632 liegt, meint Virtuozzo also, dass es sicherstellen muss, dass genug RAM für kritische vServerfunktionen da sein muss, da es sonst kritisch wird.

Das wären für mich logische Schlussfolgerungen, bisher hat Server4You mir aber nur eine Standardticketantwort geschrieben.

Es wäre nett, wenn sich jemand von Server4You (mbroemme? ;) ) hier mal melden könnte und Stellung bezieht (Vservernummer steht im 1. Beitrag, zur Zeit sind ein paar Dienste abgeschaltet, damit Webseiten und Mail noch gehen).


Btw, passt es doch zu Server Down?

Martin
 
Hi,

ich hab dcachesize mal fuer alle Kunden (vSERVER BASIC und vSERVER MEDIUM) erhoeht.

Edit: Das Limit ist zwar hoeher, und dein 'maxheld' ist nachdem Reboot auch unter 'barrier', da aber bei 'failcnt' immer noch was steht, ist das wohl wieder ein Leak im Kernel. :/ Beeinflusst aber nicht den Betrieb sieht nur unschoen aus. Ich habs mal SWsoft schon gegeben,
 
Last edited by a moderator:
Hi!
Gut, dass das Problem jetzt bekannt ist.. Ich war schon am verzweifeln (siehe Supportticketantwort seitens euch).. :(

Wann glaubst du wird SWsoft das Problem beheben? :)

Danke, dass du das hier in deiner Freizeit machst..

Martin
 
Hi,

naja das dauert schon ein paar Tage und nen Reboot des Hostsystems waere dafuer dann sicher auch wieder faellig.
 
:(

Ist etwas blöd, letztes mal war mein vServer vom 20.11.06 - 03.12.06 durchwegs langsam, und jetzt sind die Seiten darauf wieder nur manchmal für ein paar Tage erreichbar.. Aber da kann man wohl nichts machen..

Auch blöd war, dass der Support mir erzählt hat, ich würde die gesamten Ressourcen verbrauchen und ich jetzt dieses Forum benutzen musste, um der richtigen Person das Problem mitzuteilen.
 
Hi,

naja der ist up und die Dienste erreiche ich auch alle ohne irgendwelche Probleme oder Lags. Wie oben schon erwaehnt, dein 'dcachesize' Problem ist ja weg nur die Anzeige ist noch defekt.
 
Hi!

Na ja:

server01:~# rkhunter --checkall
/usr/local/bin/rkhunter: fork: Cannot allocate memory
Fatal error: can't find INSTALLDIR option in configuration file (/usr/local/etc/rkhunter.conf)
server01:~#
server01:~# /etc/init.d/lighttpd restart
-bash: fork: Cannot allocate memory
server01:~# tail -f /var/log/syslog
-bash: fork: Cannot allocate memory

Dadurch, dass dcachesize current zu kmemsize current addiert wird (AFAIK), wird kmemsize jetzt knapp..

Martin
 
Last edited by a moderator:
Hi,

hast du mal deinen Spamd angeguckt? Ich mein der verbraet 98 mb RAM, normal ist das nicht. Ich mein bei deiner VE reicht es nichtmal, wenn man den doppelten dcachesize Wert der Aenderung zur kmemsize addieren wuerde. Da ist irgendwas total im Eimer, was aber nicht mit der Virtualisierung zutun hat. :/
 
Hi,

@martinj: Ich hab jetzt mal die kmemsize geaendert (fuer alle BASIC/MEDIUM Kunden) hoeher macht aber absolut keinen Sinn mehr. Ich habs ueberall um 20% erhoeht.

server01:~# rkhunter --checkall


Rootkit Hunter 1.2.8 is running

Determining OS... Ready


Checking binaries
* Selftests
Strings (command) [ OK ]


* System tools
Performing 'known bad' check...
/bin/cat [ OK ]
/bin/chmod [ OK ]
/bin/chown [ OK ]
/bin/date [ OK ]
/bin/df [ OK ]
/bin/dmesg [ OK ]
/bin/echo [ OK ]
/bin/ed [ OK ]
/bin/egrep [ OK ]
/bin/fgrep [ OK ]
/bin/grep [ OK ]

...

PS: Warum versuchst du eigentlich beim Booten immer die Hostsystemuhr zu stellen. ;)
 
Last edited by a moderator:
Hi!
Erstmal danke, der vServer scheint soweit wieder zu funktionieren.

PS: Warum versuchst du eigentlich beim Booten immer die Hostsystemuhr zu stellen.
Na ja, der gute Wille zählt ;) Ne mal ehrlich, habe das übersehen und jetzt deaktiviert (Wird wohl beim Ubuntuwechsel auf den Server gekommen sein).. Danke für den Hinweis!

Spamassassin hab ich jetzt erstmal ausgeschaltet, ich muss jetzt zum Gitarre.. Schau ich mir heute Abend mal an, auch danke für den Hinweis.


Martin
 
Back
Top