numfile - Brauche Hilfe, komme nicht mehr weiter

Roberino

New Member
Servus miteinand,

nun habe ich hier schon Stunden verbracht, komme aber aufgrund mangelnder Kenntnis mit vServern und Linux nicht darauf, was ich noch tun kann.

Code:
vsxxxxxx:~# cat /proc/user_beancounters
Version: 2.5
       uid  resource                     held              maxheld              barrier                limit              failcnt
    xxxxxx: kmemsize                  5887782              6700909              8467453              9314198                    0
            lockedpages                     0                    4                  344                  344                    0
            privvmpages                 56997                65441                98304               106496                    0
            shmpages                      641                 1681                19567                19567                    0
            dummy                           0                    0                    0                    0                    0
            numproc                        58                   67                  128                  128                    0
            physpages                   26397                29326                    0  9223372036854775807                    0
            vmguarpages                     0                    0                65536  9223372036854775807                    0
            oomguarpages                26609                29538                65536  9223372036854775807                    0
            numtcpsock                     36                  123                  172                  172                    0
            numflock                       29                   38                  224                  246                    0
            numpty                          1                    1                   16                   16                    0
            numsiginfo                      0                   44                  512                  512                    0
            tcpsndbuf                  192208               496928              1416560              2768240                    0
            tcprcvbuf                  177016               561760              1416560              2768240                    0
            othersockbuf               354240               564544               655717              1153621                    0
            dgramrcvbuf                     0                25080               655717               655717                    0
            numothersock                  207                  228                  228                  228                 3997
            dcachesize                1038960              1083915              1503190              1548286                    0
            [COLOR="Red"]numfile                      [/COLOR]2966                 3008                 3008                 3008                 9682
            dummy                           0                    0                    0                    0                    0
            dummy                           0                    0                    0                    0                    0
            dummy                           0                    0                    0                    0                    0
            numiptent                      10                   10                   64                   64                    0

Ich habe schon soviel rausbekommen, dass ich ein Prob mit den numfile habe. Ich kann auch keine Mails mehr empfangen.

Aber, Jungs, was kann ich dagegen tun. Wenn ich lsof / eingebe, dann sagt mir das soviel wie eine chinesische Bedinungsanleitung.

Kann mir bitte hier jemand ganz arg helfen? Habe rund 10 Webseiten auf dem Server und bei allen geht nix mehr (Mailtechnisch) :eek:

Merci
Rob
 
Muste rausfinden, welcher Prozess so viele Files offen hält.
Der Failcount für numothersock macht auch stutzig. Was passiert denn auf der Maschine gerade so?

Spam-Mailing vielleicht, das total viele Queue-Files und Sockets beschäftigt hält? ;)
 
:o
Muste rausfinden, welcher Prozess so viele Files offen hält.
Da liegt der Hund begraben: wie mache ich sowas?

Zur Zeit ist der Mailserver abgeschaltet, das eben alle anderen Dienste wieder tun. Ich werde laut Auskunft von der Supporthotline S4U mit Spam zugefahren. Der Server kommt nimmer nach.

Ich stehe vor einem Rätsel und weiß nicht so recht was ich nun tun muss :o
 
Ich werde laut Auskunft von der Supporthotline S4U mit Spam zugefahren.
In dem Fall musst du den MTA dazu bringen, die einliefernden Mailserver entsprechend auszubremsen und ihm das spawnen von Childs so begrenzen, dass er deine Ressource-Limits nicht zu sehr belastet.
Das wird dazu führen, dass auch die Einlieferung von erwünschten Mails langsamer wird, aber immerhin läuft alles.
 
Auf einem kleinen VServer muss man wirklich ressourcenschonend arbeiten.

So habe ich festgestellt, dass beispielsweise Postfix ein Numfile Killer ist. Hier fährt man mit Sendmail besser.
Auch Spamassassin gehört zu den Kandidaten, die je nach Mailaufkommen und Konfiguration schon einiges an Files benötigen.

Plesk als Controlpanel ist zwar hübsch, aber auch nicht gerade ressourcen schonend.

Schau Dir mal den Befehl lsof an. Der listet alle offenen Files.

Gruss
Markus
 
Hallo,

ich habe ein ähnliches Problem mit einem 1&1 Virtual Server.

Frage 1 dazu: kann ich dort irgendwo einstellen dass der "Container" wie es ja jetzt bei 1&1 heißt z.B. immer um 4 Uhr morgens automatisch neu startet?

Frage 2:

Ich habe vor allem mit folgenden Einträgen ein Problem:
Code:
       uid  resource                     held              maxheld                                                                                    barrier                limit              failcnt
 68251499:  kmemsize                 13202788             13390286             2                                                                      0971520             23068672                   42

            tcpsndbuf                  213024               220008                                                                                    1720320              2703360           1361362742

            numfile                      2397                 2417                                                                                       4096                 4096             60180171

nur was fange ich mit diesen Sachen jetzt an? :)

Danke im Voraus und Liebe Grüße
 
Der Thread hier ist schon etwas angestaubt. Wäre besser evtl. einen neuen aufzumachen und uns konkret zu beschreiben, warum Du ein Problem mit Deinem Server vermutest (was läuft auf der Kiste und was funzt wie nicht gewünscht), sonst müssen wir wieder unserer Kristallkugeln oder den Kaffeesatz von heute morgen bemühen und das ist nicht immer sehr effizient. :eek:
 
Bezüglich numfile lässt sich herausfinden, welche 50 Prozesse gerade die meißten Dateien offen haben:
Code:
lsof | awk '{print $2}' | sort | uniq -c | sort -rnk 1 | head -n 50
(Spalten/Felder sind: 1. Anzahl an Dateien, wie viele Dateien von einem Prozess geöffnet sind; 2. die PID des Prozesses)

Dann kannst Du mittels
Code:
lsof | grep PID
bzw.
Code:
ps auxww | grep [P]ID
herausfinden, welche Dateien von welchem Prozess geöffnet sind.

Auch lässt sich herausfinden, wie viele Dateien geöffnet sind:
Code:
lsof | wc -l
 
Back
Top