Hallo allerseits,
vorhin ist etwas "Interessantes" passiert: Das Monitoring meldete sich wegen eines nicht mehr per HTTP erreichbaren Servers (Timeout) per SMS, im Moment meines (trägen) SSH-Logins flatterte auch schon die monit-Mail ins Postfach:
Nach einer Minute konnte ich endlich top aufrufen und sehen, dass die Load von 120 wohl daraus resultierte, dass atop gute 28 GB RAM alloziert hatte. Da alle drei Sekunden eine top-Ausgabe geloggt wird, konnte ich feststellen, dass atop die ersten 20 GB binnen zehn Sekunden gefressen hat, der Rest folgte innerhalb einer Minute. atop wurde von meinem Kollegen aufgerufen, welcher sich Sekunden vorher eingeloggt hatte.
=> Hat irgendwer den Hauch einer Ahnung, wie das passieren konnte?
Zudem: Gibt es schon irgendeine Fertiglösung, um Prozesse mit > x GB RAM-Verbrauch hart zu killen und diesen Vorgang zu loggen oder per Mail zu melden?
Viele Grüße
Tim
vorhin ist etwas "Interessantes" passiert: Das Monitoring meldete sich wegen eines nicht mehr per HTTP erreichbaren Servers (Timeout) per SMS, im Moment meines (trägen) SSH-Logins flatterte auch schon die monit-Mail ins Postfach:
Code:
Resource limit matched Service web4
Date: Sun, 19 Jan 2014 22:59:34 +0100
Action: alert
Description: mem usage of 98.5% matches resource limit [mem usage>90.0%]
Nach einer Minute konnte ich endlich top aufrufen und sehen, dass die Load von 120 wohl daraus resultierte, dass atop gute 28 GB RAM alloziert hatte. Da alle drei Sekunden eine top-Ausgabe geloggt wird, konnte ich feststellen, dass atop die ersten 20 GB binnen zehn Sekunden gefressen hat, der Rest folgte innerhalb einer Minute. atop wurde von meinem Kollegen aufgerufen, welcher sich Sekunden vorher eingeloggt hatte.
=> Hat irgendwer den Hauch einer Ahnung, wie das passieren konnte?
Zudem: Gibt es schon irgendeine Fertiglösung, um Prozesse mit > x GB RAM-Verbrauch hart zu killen und diesen Vorgang zu loggen oder per Mail zu melden?
Viele Grüße
Tim
Last edited by a moderator: