HP DL 380 Server überwachen

Juan

New Member
Guten Morgen,

ich habe schon viel im Internet gesurfed und schon viel Schrott gelesen die letzten Wochen, ich habe mich hier in diesem Forum angemeldet, in der Hoffnung, ein paar gute Ratschläge und Tipps zu erhalten.

Was ich brauche:

Wir haben 2 Server Schränke voll mit HP DL 380ern und DL 360ern, darunter sind FileServer, Mail-Server, 2 DCs und Datenbankserver.

Unsere Klimaanlage hält den Raum bei etwa 18-19° C konstant kühl, uns ist jedoch schon einmal passiert, dass die Klimaanlage komplett ausgefallen ist und die Server ganz schön warm gelaufen sind.

Ich suche jetzt eine Lösung, womit ich meine Temperaturen überwachen kann und bei einer kritischen Temperatur der Server auch selbst herunter fahren soll (falls das ganze Nachts geschehen sollte). Mir ist wichtig, dass die Server nacheinander herunterfahren, in geordneter Reihenfolge. Zusätzlich noch eine SMS oder E-Mail versand wird zur Info, dass die Server down sind.

Verwaltet soll das ganze am besten über ein Web-Interface Zentral, oder wenns nicht anders geht, auch eben anders.. ;)

Ich habe schon von "Raumfühlern" gehört die die Temperatur im Raum messen, irgendwie sowas würde auch in Frage kommen, wenn die Dinger zuverlässig sind.

Ich hoffe ich hab mein Anliegen verständlich geschildert.
 
was läuft denn als OS auf den Kisten? Je nach dem lässt sich da durchaus die eine oder andere sinnvolle Lösung finden (Nagios, Tivoli, selbstgeschriebene Scripte auf SNMP-Datenbasis, ...)

Für die Überwachung des Raumes: Ein Blick zu http://www.wut.de/ lohnt sich da...

Habt ihr ILO-Karten oder andere Management-Interfaces in den Kisten?
 
Such mal nach "Thermal Degraded Action" im BIOS oder den System-Management-Tools.
Du kannst wahlweise das System herunterfahren oder Dich benachrichtigen lassen (oder es ignorieren :)).

Fürs Monitoring schreibe ich im MRTG:
Code:
Target[server]: .1.3.6.1.4.1.232.6.2.6.8.1.4.0.2&.1.3.6.1.4.1.232.6.2.6.8.1.4.0.1:community@server:
 
BIOS-Lösungen sind toll was die reine Überwachung angeht - was das "geordnete Herunterfahren" angeht aber meist völlig unbrauchbar...
 
Ich kenne das bislang nur vom Hersteller Rittal, Ich denke aber von HP und co. sollte es etwas vergleichbares geben.

http://www.rittal.de/produkte/katal...74&Dom=de&lang=D&NavName=Dynamic Rack Control

Leider bin ich mir nicht sicher, ob dies das entsprechende Modul ist, was bei uns im Einsatz ist. Was das Rack Modul bei uns kann ist prüfen, ob die Tür des Racks geöffnet ist, Temperaturüberwachung des Racks, Lüfterausfall am Rack prüfen, ... das alles mit Benachrichtigung per E-Mail, SMS und co.

Ich würde einfach einmal bei Rittal anrufen und mich erkundigen, welches Produkt an dieser Stelle den Wünschen entsprechend geeignet wäre.

Hierbei wird aber die Temperatur des gesamten Racks nicht des einzelnen Servers überwacht, aber das sollte ja eine vergleichbare Variante sein.
 
Ach, das OS... ja Windows Server 2008 R2 läuft überall.

ILO steht noch auf den Plan, das ganze zu konfigurieren, ist derzeit noch nicht im Einsatz. Diese Raumfühler scheinen ganz okay zu sein, muss ich mir mal genauer anschauen, erstmal Danke für diesen Tipp.

Im Bios habe ich schon geschaut, allerdings kann man damit ja nicht wirklich das nacheinander herunterfahren planen, wie es mir scheint, sondern die Server schalten sich dann einfach ab.

Das mit dem Rack ist auch nicht schlecht, ein Anruf ist da denke ich mal lohnenswert, mal schauen.

Ich habe mir mal gerade die Software Lösung angeschaut von Nagios und so, aber irgendwie werde ich da nicht schlau heraus, was braucht man denn alles von Nagios, das diese Software zur Lösung meines Anliegends wird?
 
Last edited by a moderator:
Hallo zusammen,

also ich habe bei uns im Serverraum über die Serielle Schnittstelle an einem Server mehrere Temperaturfühler angeschlossen (Zuluft, Abluft,...). Über das Tool digitemp lese ich diese Sensoren aus und werte die Temperaturen über ein kleines php-Script aus. Dieses schickt uns Administratoren bei überschreitung einer bestimmten Temperatur je nach Tageszeit eine Email/SMS und aktiviert im Notfall (bei Überschreitung eines 2. Grenzwertes) mehrere Gebläse und Entlüftungsklappen, die den kompletten Serverraum mit Außenluft durchfluten (lieber viel warme Sommerluft, als stehende Luft). Kannst natürlich auch genauso die Server herunterfahren lassen - aber das ist bei uns eigentlich nicht gewünscht ;)

Grüße Johannes
 
Im Bios habe ich schon geschaut, allerdings kann man damit ja nicht wirklich das nacheinander herunterfahren planen, wie es mir scheint, sondern die Server schalten sich dann einfach ab.

Hier steht:
With the Health Driver loaded and Thermal Shutdown enabled in RBSU, the Health Driver performs an orderly shutdown if it detects a cautionary temperature level.
If the server detects a critical temperature level before the orderly shutdown occurs, the server performs an immediate shutdown.
Additionally, the Health Driver performs an orderly shutdown if the following minimum requirements are not met: one working fan in the I/O zone, five working fans in the processor zone, and one working fan in the power supply zone.

In Zeiten von ACPI ist das ja kein Problem mehr.
 
@Whistler: natürlich fährt der Server dann sauber herunter (hoffentlich) - er kriegt ja ein Shutdown-Signal (vergleichbar meist sowas wie Ctrl-Alt-Entf) - ob das aber reicht, um die darauf laufenden Dienste sauber herunterzufahren ist eine andere Sache.

Außerdem ist es recht nett, wenn dann alle Server des Racks / Raumes gleichzeitig oder wild herunterfahren - anstatt zuerst die Clients, dann die DBs und File-Server, ...

-> BIOS ist nett als "letzte Change vor GAU" - aber im normalen Falle nicht so gewünscht...

@TE: Mit Nagios könntest Du z.B. per SNMP die Server oder Thermometer abfragen (Temp, Lüfter) und dann im Falle des Überschreitens von Warnschwellen eMails versenden oder / und entsprechende Aktionen starten, ...
 
Ich hab mich für die Raumfühler Methode glaube ich entschieden, kann mir jemand da was gutes Empfehlen? Bzw. worauf muss ich achten was es können sollte?

Ich habe zum Beispiel ein Angebot von unserer Klimaanlagen Firma erhalten, die mir das zum einmaligen Preis von 600 Euro anbieten könnte mit E-Mail Versand und Alamierung und allem.

Kann ich darauf noch irgendwie ein Server herunterfahren aufsetzen durch eine Software? Kann Nagios mit so einer Hardware kommunizieren oder muss dieser Raumfühler das auch unterstützen?
 
Prinzipiell kann Nagios auch mit einer Kaffeekanne kommunizieren, wenn diese die notwendigen Schnittstellen bietet - es hängt also sehr davon ab, was das Ding kann.

So Du über eine Standardschnittstelle wie z.B. snmp auf die Werte zugreifen kannst oder über ein Web-Frontend evtl. konkrete Werte auslesen kannst solltest Du mit den Standard-Plugins von Nagios auskommen. Wenn nicht - muss man halt selbst was codieren...

Auf was Du achten musst - kommt drauf an. Wie viele (phys.) Messpunkte willst Du? Wie genau? Historie möglich oder nur aktuelle Messwerte? Was willst Du messen (nur Temp. oder auch Luftfeuchte?), Ausfallsicherheit (Strom), Zugriff auf Daten über welches Protokoll, ...?

Wir hatten hier in unserem alten RZ das Webtherm von W&T - da war die Nagios-Einbindung kein Problem - welche Eskalationsketten dann da dahinter stehen hängt dann im konkreten Fall von deinen Anforderungen ab...
 
So ne Kaffekanne muss ich mir mal besorgen, einfach mit anstöpseln und überwachen lassen und sobald der Kaffee zu kalt wird, werden SMS und E-Mail versand, super Idee :D

Ich denke ich habe die passenden Informationen und Blickwinkel bekommen hier, und kann nun in Ruhe weiter planen ;)

Ich danke an die kompetente Hilfe hier im Board, wenigstens kennen sich ein paar Menschen im Internet noch aus.. :D

In dem Sinne, einen schönen Tag noch!
 
tach zusammen

teste doch mal server-eye. ich persönlich finde es deutlich einfacher zu bedienen wie nagios oder tivoli und du kannst damit jegliche funktionen eines servers auslesen und überwachen, wie zb temperatur, ausfall... das tool ist auch sehr übersichtlich und leicht zu bedienen.

die url ist www.server-eye.de glaub ich. das tool ist auch kostenlos testbar

gruß

winston
 
Back
Top