dcache läuft zu

Lena

New Member
Hallo miteinander,

auf einem vServer BasicX2 von S4Y habe ich das Problem, dass mir dauernd der dcache überläuft.
Dieses Phänomen tritt erst seit einer Neuinstallation des RH9 auf.
Ich habe soweit die Grunddienste httpd und mysql so limitiert, dass ich mit einem Speicher von < 90MB unter Grundlast auskomme und diese dennoch hinreichend performant sind.
Clamav und Spamassassin laufen nicht als Daemons sondern on demand durch procmail.

Nun stellt sich mir die Frage, wie ich das System dazu bewege den Cache etwas agressiver zu leeren.
/proc/sys/vm/vfs_cache_pressure steht auf dem Standardwert 100 und es ist mir bisher nicht gelungen diesen Wert zu erhöhen.
Weder ein echo 200 > /proc/sys/vm/vfs_cache_pressure noch ein entsprechender Eintrag in der /etc/sysctl.conf brachten eine Veränderung dieses Wertes.

Wie gesagt hatte ich vor der Neuinstallation nie Probleme mit diesem Wert und das obwohl die Dienste wesentlich freizügiger konfiguriert waren.
Es kann doch nicht sein, dass ein Server, dessen zugesicherter Speicher nicht einmal zur Hälfte ausgenutzt wird, sich auf Grund von Speichermangel nach wenigen Stunden aufhängt.

Ich würde mich über jede Anregung freuen, denn ich möchte endlich wieder ein stabil laufendes System haben.

Herzliche Grüsse,

Lena.

P.S.: Wer übrigens glaubt der Plattenplatz sei auch nur annähernd ausgenutzt, der irrt - von den 10 GB sind gerade mal 1,8 GB benutzt.
Interessante Vorstellung was passiert, wenn der Platz vollständig genutzt wird.
Das grenzt doch alles langsam an Etikettenschwindel bzw. Betrug !!!
 
Last edited by a moderator:
Enorm!

Hhat diesmal 9 Stunden durchgehalten bis denn nichts mehr ging.
Na ja, 14 kastrierte, übliche Prozesse sind ja auch wirklich zuviel und mit einer kleinen index.html läuft der Server ja auch - also was mecker ich eigentlich - steht irgendwo das mehr geht ???
Oder war da mal was von "üblicher Verwendung" in der deutschen Rechtsprechung bezüglich den Spezifikationen, die ein Produkt einzuhalten hat?
 
Hallo,

Vielleicht ist das Hostsystem voll?
Meine Vserver-Zeiten sind schon lange vorbei, aber von damals weiss ich noch: Mein System war immer schön konfiguriert, so dass eigentlich nichts schief gehen konnte. Aber auf meinem Hostsystem waren soviele virtuelle Server, dass die realen Resourcen einfach den Bedarf nicht mehr decken konnten.
 
Ja, mir kommt es auch so vor als ob da etwas am Host definitiv überlastet ist.
Ich vermute einmal S4Y versucht so zu Lasten der Kunden ein für diese Last nicht ausgelegtes IO-System zu kaschieren.
Ist ja auch soweit noch ok wenn da etwas gecached wird, doch dann sollten die Einstellungen gefälligst auch so gesetzt werden, dass das System den Cache nicht regelmässig an das Limit fährt, denn so ist der Plattenplatz ja definitiv nicht zu nutzen.
Das ist ja fast so als würde ein Autohändler ein Auto mit 200 PS mit den Worten "da können Sie locker 200 km/h mit fahren" anpreisen würde, aber verschweigt, dass das Fahrwerk nur für Geschwindigkeiten bis maximal 30 km/h ausgelegt ist. "Na ja, wenn Sie sich nicht dauernd im Stadtverkehr überschlagen wollen, dann fahren Sie doch nur in verkehrsberuigten Zonen."
Na Dankeschön auch! Wer sich das wohl gefallen lassen würde?
Ich hatte lange Zeit keine Probleme mit S4Y doch so langsam scheint der Laden auseinander zu fallen.
Das Upgrade funktionierte nur nach manuellem Eingriff der Techniker (schon mal ein sehr vertrauenswürdiges Zeichen), seit über einem Monat kein Backupsystem (welches ja Vertragsbestandteil ist) und jetzt auch noch ein unbrauchbar konfigurierter vServer.
Ich erwarte ja für den Preis kein Rennpferd, aber ein Server der einige hundert bis maximal tausend Seiten am Tag ausliefern und ein paar hundert E-Mails durchschaufeln kann sind ja wohl im Rahmen dessen, was S4Y suggeriert mit diesem Angbot zu leisten.
 
Hi,

@Lena: Schick doch einfach mal deine Servernummer. Ich hatte die zwar schonmal weiss sie aber nicht mehr. Nochwas, wenn du dein dcachsize Limit ueberschreitest hat das nichts mit dem Hostsystem zutun, die Limitierung ist ja eben genau deshalb gesetzt, damit nicht du andere vSERVER Kunden stoerst. :) Genauso koennen andere an das Limit stoßen und du willst sicherlich auch nicht, das wir zu deinen Lasten anderen Kunden das Limit erhoehen und sie dich stoeren.
 
Hi,

@Lena: Schick doch einfach mal deine Servernummer. Ich hatte die zwar schonmal weiss sie aber nicht mehr.
Hallo mbroemme, das mache ich doch immer wieder gerne. Aber nicht wundern, wenn Du z.Zt. einen Failcount von 0 siehst - der counter wird bei jedem 2. bis 3. Neustart immer wieder zurückgesetzt. der dcache ist hingegen mittlerweile schon wieder von < 500.000 auf fast 1.000.000 geklettert.
Nochwas, wenn du dein dcachsize Limit ueberschreitest hat das nichts mit dem Hostsystem zutun, die Limitierung ist ja eben genau deshalb gesetzt, damit nicht du andere vSERVER Kunden stoerst. :) Genauso koennen andere an das Limit stoßen und du willst sicherlich auch nicht, das wir zu deinen Lasten anderen Kunden das Limit erhoehen und sie dich stoeren.
Das ist mir schon klar, dass es sich hier um den "lokalen" dcache handelt, aber der wird ja wohl dazu verwendet die Plattenzugriffe des Hostsystems zu entlasten, oder verstehe ich da was falsch?
Ausserdem geht doch der dcache vom normal verfügbaren Hauptspeicher ab, so das andere davon nicht betroffen werden.
Ich könnte mir vorstellen, dass wenn Ihr einfach das vfs_cache_pressure etwas erhöht (z.B. von 100 auf 200) der Spuk schon ein Ende hat.
 
Last edited by a moderator:
so sieht es dann kurz vor dem Kollaps aus:

Code:
VPS Speichernutzung:
Momentan genutzt:       86.0625 MB
Maximal genutzt:        145.918 MB
Zugesichert:            256 MB
Maximal nutzbar:        544 MB
Code:
 14:01:13  up  2:35,  1 user,  load average: 0.05, 0.13, 0.11
17 processes: 16 sleeping, 1 running, 0 zombie, 0 stopped
CPU0 states:   0.0% user   0.0% system    0.0% nice   0.0% iowait 100.0% idle
CPU1 states:   0.0% user   0.0% system    0.0% nice   0.0% iowait 100.0% idle
CPU2 states:   0.0% user   0.0% system    0.0% nice   0.0% iowait 100.0% idle
CPU3 states:   0.1% user   0.1% system    0.0% nice   0.0% iowait  99.3% idle
Mem:   524288k av,   88048k used,  436240k free,       0k shrd,       0k buff
            0k active,                  0k inactive
Swap:       0k av,       0k used,       0k free                       0k cached

  PID USER     PRI  NI  SIZE  RSS SHARE STAT %CPU %MEM   TIME CPU COMMAND
    1 root      16   0  1308  484   432 S     0.0  0.0   0:00   1 init [3]      
19737 root      16   0  1372  500   424 S     0.0  0.0   0:00   2 syslogd -m 0
19759 root      16   0  1972  808   660 S     0.0  0.1   0:00   0 xinetd -stayalive -pidfile /var/run/xinetd.pid
19791 root      17   0  2040 1040   892 S     0.0  0.1   0:00   0 /bin/sh /usr/bin/safe_mysqld --defaults-file=/etc/my.cnf
19827 mysql     16   0 13404 8164  3720 S     0.0  1.5   0:00   2 /usr/libexec/mysqld --defaults-file=/etc/my.cnf --basedir=/usr --datadir=/var/lib/mysql --user=mysql --p
19837 mysql     16   0 13404 8164  3720 S     0.0  1.5   0:00   2 /usr/libexec/mysqld --defaults-file=/etc/my.cnf --basedir=/usr --datadir=/var/lib/mysql --user=mysql --p
19838 mysql     16   0 13404 8164  3720 S     0.0  1.5   0:00   3 /usr/libexec/mysqld --defaults-file=/etc/my.cnf --basedir=/usr --datadir=/var/lib/mysql --user=mysql --p
19881 root      16   0 61828 9940  4148 S     0.0  1.8   0:00   1 /usr/sbin/httpd
19890 root      16   0  2624 1140   968 S     0.0  0.2   0:00   0 /usr/bin/perl /root/confixx/pipelog.pl
19906 root      16   0  1356  544   476 S     0.0  0.1   0:00   2 crond
19933 root      16   0  7636 4988  1312 S     0.0  0.9   0:00   1 /usr/bin/perl /usr/libexec/webmin/miniserv.pl /etc/webmin/miniserv.conf
20380 root      16   0  6724 2100  1732 S     0.0  0.4   0:00   2 sshd -i
20384 root      16   0  2220 1320   984 S     0.0  0.2   0:00   3 -bash
15661 apache    16   0 66244  21M 13428 S     0.0  4.1   0:04   2 /usr/sbin/httpd
31757 apache    16   0 66248  20M 13212 S     0.0  4.0   0:02   2 /usr/sbin/httpd
28345 apache    16   0 65988  20M 13160 S     0.0  3.9   0:01   0 /usr/sbin/httpd
18213 root      16   0  1860 1020   748 R     0.0  0.1   0:00   3 top
Code:
Version: 2.5                                                                                                                     
       uid  resource                     held              maxheld              barrier                limit              failcnt
    251050: kmemsize                  3228553              4110461              8467453              9314198                    0
            lockedpages                     0                    0                  344                  344                    0
            privvmpages                 21915                37355               131072               139264                    0
            shmpages                    11007                13583                19567                19567                    0
            dummy                           0                    0                    0                    0                    0
            numproc                        17                   28                  128                  128                    0
            physpages                   14351                26183                    0  9223372036854775807                    0
            vmguarpages                     0                    0                65536  9223372036854775807                    0
            oomguarpages                16514                27284                65536  9223372036854775807                    0
            numtcpsock                     10                   16                  172                  172                    0
            numflock                        1                    6                  224                  246                    0
            numpty                          1                    2                   16                   16                    0
            numsiginfo                      0                    4                  512                  512                    0
            tcpsndbuf                  100792               225024              1416560              2768240                    0
            tcprcvbuf                  163840               191512              1416560              2768240                    0
            othersockbuf                 8568               110616               655717              1153621                    0
            dgramrcvbuf                     0                35640               655717               655717                    0
            numothersock                    6                   24                  228                  228                    0
            dcachesize                1113885              [COLOR="Red"]1315683              1503190[/COLOR]              1548286                    0
            numfile                      1349                 1792                 3008                 3008                    0
            dummy                           0                    0                    0                    0                    0
            dummy                           0                    0                    0                    0                    0
            dummy                           0                    0                    0                    0                    0
            numiptent                      10                   10                   64                   64                    0

Das geht jetzt noch maximal eine Stunde gut und dann ist wieder "Schicht im Schacht"
Ja sind wir denn im Saarland? :rolleyes:
 
Last edited by a moderator:
there is allways one more :mad:
patsch, patch - :eek:

Spaß muß sein - sonst kommt ja keiner zur Beerdigung:rolleyes:
 
ja wenn man denn drauf wartet...

... dann dümpelt die Kiste natürlich ewig ein paar kB unter der Grenze rum - aber weche wenn man sich mal 'ne Stunde abwendet - Milchtopfeffekt!
 
da brat' mir einer 'nen Storch

Nun dümpelt die Kiste schon seit Stunden rum und hat das Limit mal gerade um 10kB ohne Probleme überschritten - so sollte es ja eigentlich sein. Cache, hinreichend groß, vernüftig genutzt, wunderbar.
Na warten wir mal ab, die letzte Woche war da durchaus anders geartet.
 
Durch ein freundliches "can't allocate memory" bei halbvollem (zugesichertem) RAM :-(

Speicher ist hier nicht gleich Speicher. Dir wird wohl 256 MB zugesichert, aber daß betrifft nur die Größe der Prozesse. Der Unix-Kernel braucht auch noch einiges an Speicher und da ist dein vServer wohl recht sparsam konfiguriert worden. Bei meinem vServer (ebenfalls 256MB aber anderer Anbieter) habe ich bei dcachesize und kmemsize (da wird der dcache mitgezählt) etwa 4x soviel zur Verfügung:

Code:
       uid  resource           held    maxheld    barrier      limit    failcnt
     xxxxx: kmemsize        4735938    4986094   31875611   35028144          0
            dcachesize            0          0    6155930    6340608          0

Wenn ich deine Werte mit unter UBC configuration examples table - OpenVZ Wiki angegebenen Konfigurationen vergleiche, dann scheinen mir die meisten Limits doch einiges unterhalb der Parameter für C (eine 256MB-Beispielkonfiguration) zu liegen.
 
Tja, das hilft mir nur leider wenig weiter, es sei denn jemand tätowiert diese Tabelle mal der Geschäftsleitung von S4Y auf die Stirn oder graviert sie in deren Brillen.
Nein, mal im ernst. Ich glaube kaum, dass da wirklich nur 8 VEs auf einem Host laufen und sofern Preis und Leistung stimmen ist das ja auch ok so. Nur funktionieren, was es ja auch lange Zeit lang tat, sollte es schon stabil.
Es gibt sicher Anbieter, die diese Konfigurationen so oder ähnlich fahren, doch ob die das dann auch für nicht ganz 13,- € pro VE hinbekommen ...?
Ca 1250 € / Jahr / Host, abzüglich Betriebskosten, abzüglich Investitionsrücklagen, abzüglich Lohn- und anderer Nebenkosten - das wird dann aber langsam recht eng.
Solange alles im erträglichen Rahmen funktioniert sollen die da meinetwegen gerne ein paar VEs mehr draufpacken, aber eben nur dann.
Gewinnoptimierung zu Lasten der Kunden nach dem Motto, ach die paar Rechtsstreite und abspringenden Kunden haben wir doch auf der anderen Seite locker wieder drinn, geht natürlich nicht und ist sicherlich geschäftsmännisch auch sehr kurzsicht gedacht, denn nicht die schnelle Mark, eh Euro, sondern der zufrieden Kunde zählen auf Dauer.
 
So, nun hat es den Failcounter zumindest schon einmal auf > 400 geschraubt, was aber diesmal erstaunlicher Weise noch ohne dramatische Folgen geblieben ist.

Code:
Version: 2.5                                                                                                                     
       uid  resource                     held              maxheld              barrier                limit              failcnt
    251050: kmemsize                  4230790              5522158              8467453              9314198                    0
            lockedpages                     0                    0                  344                  344                    0
            privvmpages                 25982                58400               131072               139264                    0
            shmpages                    12287                13583                19567                19567                    0
            dummy                           0                    0                    0                    0                    0
            numproc                        26                   40                  128                  128                    0
            physpages                   16319                42667                    0  9223372036854775807                    0
            vmguarpages                     0                    0                65536  9223372036854775807                    0
            oomguarpages                18853                45044                65536  9223372036854775807                    0
            numtcpsock                     14                   26                  172                  172                    0
            numflock                        1                    9                  224                  246                    0
            numpty                          2                    2                   16                   16                    0
            numsiginfo                      0                    5                  512                  512                    0
            tcpsndbuf                  128920               332848              1416560              2768240                    0
            tcprcvbuf                  175264               213472              1416560              2768240                    0
            othersockbuf                17136               158904               655717              1153621                    0
            dgramrcvbuf                     0                51480               655717               655717                    0
            numothersock                   14                   29                  228                  228                    0
            dcachesize                1341657              1535463              1503190              1548286                  403
            numfile                      1805                 2512                 3008                 3008                    0
            dummy                           0                    0                    0                    0                    0
            dummy                           0                    0                    0                    0                    0
            dummy                           0                    0                    0                    0                    0
            numiptent                      10                   10                   64                   64                    0

Die letzten Tage erreichte ich hingegen binnen max 6 Stunden einige hunderttausend mit entsprechenden Folgen.
 
Last edited by a moderator:
nun hat's ihn doch wieder erwischt

Code:
Version: 2.5                                                                                                                     
       uid  resource                     held              maxheld              barrier                limit              failcnt
    251050: kmemsize                  4131285              5522158              8467453              9314198                    0
            lockedpages                     0                    0                  344                  344                    0
            privvmpages                 23602                58400               131072               139264                    0
            shmpages                    11983                13583                19567                19567                    0
            dummy                           0                    0                    0                    0                    0
            numproc                        25                   40                  128                  128                    0
            physpages                   13990                42667                    0  9223372036854775807                    0
            vmguarpages                     0                    0                65536  9223372036854775807                    0
            oomguarpages                16768                45044                65536  9223372036854775807                    0
            numtcpsock                     16                   27                  172                  172                    0
            numflock                        1                    9                  224                  246                    0
            numpty                          1                    2                   16                   16                    0
            numsiginfo                      0                    5                  512                  512                    0
            tcpsndbuf                  168768               332848              1416560              2768240                    0
            tcprcvbuf                  175856               213472              1416560              2768240                    0
            othersockbuf                13256               195784               655717              1153621                    0
            dgramrcvbuf                     0                51480               655717               655717                    0
            numothersock                   13                   29                  228                  228                    0
            dcachesize                1363635              [COLOR="Red"]1535463[/COLOR]              1503190              1548286                 [COLOR="Red"]4348[/COLOR]
            numfile                      1958                 2512                 3008                 3008                    0
            dummy                           0                    0                    0                    0                    0
            dummy                           0                    0                    0                    0                    0
            dummy                           0                    0                    0                    0                    0
            numiptent                      10                   10                   64                   64                    0

Ich starte ihn jetzt einmal nicht neu um die Fehlersuche zu erleichtern, zumal die elementaren Dienste scheinbar noch laufen.
 
heute ist er schneller

Heute hat der Server bereits nach 2 1/2 Stunden > 250 Failcounts erreicht.
Ich hoffe der Bug wird bald gefunden und plattgehauen.
 
Das ist jetzt zwar nur eine Vermutung, aber es kommt mir fast so vor als ob es eher Vorgänge auf dem Host sind, die den Cache so anwachsen lassen.
Musste ich gestern den Server doch richtig quälen um den Fehler zu provozieren tritt nun heute wieder zügig von allein auf, ohne das auf dem Server besondere Aktionen durchgeführt wurden.
So habe ich gestern z.B. umfangreiche Archive entpackt, die locate db aktualisiert und ähnlich "gemeine" Dinge angestellt um reichlich auf die Verzeichnisse zuzugreifen und das ging ja erstaunlich lange gut.
Heute reichen wenige Stunden Normalbetrieb bei geringer Last und der Wert wird kräftig überschritten.
Wo hat sich also dieses fiese Insekt versteckt? :(
MB, fege doch bitte noch mal alle Relaiskontakte sauber ;)
 
bitte, hat denn keiner 'ne Idee

Das ist doch so kein Zustand:mad:

Code:
VPS Speichernutzung:
Momentan genutzt:       85.1992 MB
Maximal genutzt:        [COLOR="Red"]158.023 MB[/COLOR]
Zugesichert:            256 MB
Maximal nutzbar:        544 MB
Code:
Version: 2.5                                                                                                                     
       uid  resource                     held              maxheld              barrier                limit              failcnt
    251050: kmemsize                  3771208              4712586              8467453              9314198                    0
            lockedpages                     0                    5                  344                  344                    0
            privvmpages                 22075                40454               131072               139264                    0
            shmpages                    11007                11023                19567                19567                    0
            dummy                           0                    0                    0                    0                    0
            numproc                        19                   29                  128                  128                    0
            physpages                   14097                34374                    0  9223372036854775807                    0
            vmguarpages                     0                    0                65536  9223372036854775807                    0
            oomguarpages                16517                34374                65536  9223372036854775807                    0
            numtcpsock                     10                   18                  172                  172                    0
            numflock                        5                    8                  224                  246                    0
            numpty                          1                    1                   16                   16                    0
            numsiginfo                      0                    3                  512                  512                    0
            tcpsndbuf                   93760               290656              1416560              2768240                    0
            tcprcvbuf                  163840               359016              1416560              2768240                    0
            othersockbuf                 8568               115168               655717              1153621                    0
            dgramrcvbuf                     0                87120               655717               655717                    0
            numothersock                    7                   17                  228                  228                    0
            [COLOR="Red"]dcachesize                1444826              1548450              1503190              1548286               300301[/COLOR]
            numfile                      1825                 2302                 3008                 3008                    0
            dummy                           0                    0                    0                    0                    0
            dummy                           0                    0                    0                    0                    0
            dummy                           0                    0                    0                    0                    0
            numiptent                      10                   10                   64                   64                    0
Code:
 12:15:12  [COLOR="Red"]up 13:00[/COLOR],  1 user,  load average: 0.10, 0.13, 0.14
17 processes: 16 sleeping, 1 running, 0 zombie, 0 stopped
CPU0 states:   0.0% user   0.0% system    0.0% nice   0.0% iowait 100.0% idle
CPU1 states:  26.2% user   8.0% system    0.0% nice   0.0% iowait  65.0% idle
CPU2 states:   0.0% user   0.0% system    0.0% nice   0.0% iowait 100.0% idle
CPU3 states:   0.0% user   0.0% system    0.0% nice   0.0% iowait 100.0% idle
Mem:   524288k av,   87436k used,  436852k free,       0k shrd,       0k buff
            0k active,                  0k inactive
Swap:       0k av,       0k used,       0k free                       0k cached

  PID USER     PRI  NI  SIZE  RSS SHARE STAT %CPU %MEM   TIME CPU COMMAND
21953 apache    16   0 65976  22M 15472 S     6.5  4.4   0:01   1 /usr/sbin/httpd
16004 apache    15   0 65560  21M 15152 S     0.0  4.2   0:00   0 /usr/sbin/httpd
18416 apache    16   0 65360  16M  9612 S     0.0  3.1   0:00   1 /usr/sbin/httpd
 3135 root      16   0 61828 9912  4120 S     0.0  1.8   0:00   2 /usr/sbin/httpd
 3106 mysql     16   0 15264 9820  3860 S     0.0  1.8   0:00   1 /usr/libexec/mysqld --defaults-file=/etc/my.cnf --basedir=/usr --datadir=/var/lib/mysql --user=mysql --p
 3110 mysql     16   0 15264 9820  3860 S     0.0  1.8   0:00   2 /usr/libexec/mysqld --defaults-file=/etc/my.cnf --basedir=/usr --datadir=/var/lib/mysql --user=mysql --p
 3111 mysql     15   0 15264 9820  3860 S     0.0  1.8   0:00   0 /usr/libexec/mysqld --defaults-file=/etc/my.cnf --basedir=/usr --datadir=/var/lib/mysql --user=mysql --p
 3175 root      16   0  7620 4928  1268 S     0.0  0.9   0:00   1 /usr/bin/perl /usr/libexec/webmin/miniserv.pl /etc/webmin/miniserv.conf
28087 root      15   0  6724 2100  1732 S     0.0  0.4   0:00   2 sshd -i
28098 root      17   0  2216 1316   984 S     0.0  0.2   0:00   1 -bash
 3137 root      16   0  2624 1140   968 S     0.0  0.2   0:00   3 /usr/bin/perl /root/confixx/pipelog.pl
 2047 root      17   0  2040 1036   888 S     0.0  0.1   0:00   1 /bin/sh /usr/bin/safe_mysqld --defaults-file=/etc/my.cnf
 1809 root      16   0  1848 1008   748 R     0.0  0.1   0:00   1 top
 2029 root      15   0  1972  808   660 S     0.0  0.1   0:00   2 xinetd -stayalive -pidfile /var/run/xinetd.pid
 3146 root      15   0  1356  540   472 S     0.0  0.1   0:00   1 crond
 2001 root      16   0  1372  500   424 S     0.0  0.0   0:00   2 syslogd -m 0
    1 root      16   0  1308  480   428 S     0.0  0.0   0:00   1 init [3]
Man muß doch den Server auch mal für ein paar Tage unbeobachtet laufen lassen können:(
 
Back
Top