• This forum has a zero tolerance policy regarding spam. If you register here to publish advertising, your user account will be deleted without further questions.

ILO Fehlermeldung

rgiese

New Member
Hallo!

Ich bekomme im ILO4 meines HP DL380p Gen8 folgende Fehlermeldung angezeigt:

Smart Array P420i Controller Cache Module Status Degraded

Kann es sein das die HP 660093-001 Gen8 G8 FBWC Battery Unit BBU Capacitor Pack Smart Array P222 P420 defekt ist?

Gruß
Raimund Giese
 
Ich hatte es mir fast gedacht, wollte eigentlich nur noch eine 2. Meinung. Danke!!!

Wird diese Pufferbatterie eigentlich während des Betriebes aufgeladen?
 
bei den meisten Kontrollern ja - es gibt aber auch welche, wo wirklich eine Batterie verbaut ist.

So oder so - nach einiger Betriebszeit sind die Dinger einfach durch.
 
Wenn du die HP Smart Array Tools auf deinem Server installiert hast, sollte dort auch angezeigt werden, dass es die Batterie ist. Als wir noch HP-Server im EInsatz hatten, war nach 3-5 Jahren Ersatz fällig - HP empfiehlt den Tausch nach 3 Jahren.
 
Habe noch ein Problem mit dem ILO. Ein formatieren der SD über die ILO Oberfläche brachte keine Änderung. Ist die SD zwingend notwendig oder kann man den Fehler ignorieren?
1630245433843.png
 
Hallo,

auch wenn der Beitrag schon etwas her ist, habe ich da auch eine Frage zu.

Ich habe eine gebrauchten ProLiant Microserver Gen8. Dieser meckert seit einiger Zeit "Cache Module Status Degraded". Darauf hin habe ich nach Googlen usw. bei Servershop24.de ein Battery Pack https://www.servershop24.de/hp-fbwc-battery-unit-capacitor/a-113907/ gekauft. Dies ist mit dem bisher verbauten identisch.

Leider meckert der Server auch seit dem Tausch des Battery Packs immer wieder mal am Cache rum.
Wenn ich den Server neustarte ist die Meldung verschwunden und die LED leuchtet blau (Bei Fehler blinkt sie orange)

Der Server läuft nicht im Dauerbetrieb, sondern wird durch Lights-Out (nicht ilo) in den Ruhezustand versetzt, wenn kein Client mehr aktiv ist.
Kann das damit zusammenhängen?
 
Hallo,

auch wenn der Beitrag schon etwas her ist, habe ich da auch eine Frage zu.

Ich habe eine gebrauchten ProLiant Microserver Gen8. Dieser meckert seit einiger Zeit "Cache Module Status Degraded". Darauf hin habe ich nach Googlen usw. bei Servershop24.de ein Battery Pack https://www.servershop24.de/hp-fbwc-battery-unit-capacitor/a-113907/ gekauft. Dies ist mit dem bisher verbauten identisch.

Leider meckert der Server auch seit dem Tausch des Battery Packs immer wieder mal am Cache rum.
Wenn ich den Server neustarte ist die Meldung verschwunden und die LED leuchtet blau (Bei Fehler blinkt sie orange)

Der Server läuft nicht im Dauerbetrieb, sondern wird durch Lights-Out (nicht ilo) in den Ruhezustand versetzt, wenn kein Client mehr aktiv ist.
Kann das damit zusammenhängen?
Keiner einen Tipp für mich?
 
Servershop24.de ein Battery Pack
Erbsenzählerei, aber das ist kein Batteriepack sondern Superkondensatoren. Unterschied ist hauptsächlich in der zu erwarteten Lebenserwartung und Zuverlässigkeit.

Leider meckert der Server auch seit dem Tausch des Battery Packs immer wieder mal am Cache rum.
Überprüfe ob du auf neuster Firmware für den Controller als auch ILO bist und logge mal die Controller-Temperaturen im Betrieb.
Wenn es immer wieder auftritt gibt es ja eigentlich nur 2 Möglichkeiten
a) der Fehler ist persistent aber an der Detektionsgrenze und tritt unter bestimmten Konditionen auf.
b) der Fehler ist wiederkehrend
AFAIK muss der Fehler nicht zwingend eine Störung der BBU bedeuten. Gibt es keine weiteren Status/Log-Einträge als lapidar degraded?
 
Wie gesagt: Der Fehler tritt während des Betriebes des Servers nicht auf, sondern wenn er durch Lights Out in den Ruhezustand geschickt wird und dann nächsten Tag, sofern der erste Client aktiv ist wieder geweckt wird. Aber auch nicht immer.
Wenn der Fehler auftritt reicht ein erneuter Neustart des Servers und der Fehler ist verschwunden.

Daher meine Frage ob dies damit zutun haben kann, und wie ich das ggf. ändern kann ohne auf das Abschalten des Servers in den Ruhezustand zu verzichten. (Und ja, ich weiß. Server sind für den Dauerbetrieb konzepiert).
 
Da fehlen einige Firmware-Updates und solange dies der Fall ist, lässt sich nur schwer einschätzen, ob es ein Firmware- oder Hardware-Problem ist.

Also erstmal alle Firmware-Updates nachholen und dann erneut beobachten.
 
Da fehlen einige Firmware-Updates und solange dies der Fall ist, lässt sich nur schwer einschätzen, ob es ein Firmware- oder Hardware-Problem ist.

Also erstmal alle Firmware-Updates nachholen und dann erneut beobachten.
Ich hab doch aber bisher gar keine Firmware-Angaben gemacht. Wie kannst du das dann wissen?
 
Oops, der Screenshot ist ja gar nicht von Dir, Sorry :(

Hast Du denn restlos alle Updates installiert? Falls nicht, dann hole diese bitte zuerst nach, danke.
 
Wenn ich nach Updates und Firmware Updates suche, finde ich nur die, die ich schon installiert habe. Und Windows Updates sind auf dem 2016er Server auch alle installiert.
 
Ich habe die Vermutung dass es möglicherweise einen Firmware-Bug geben könnte der dein Problem auslöst. Wie du selber sagst sind Server nicht dazu gebaut (und generell verwendet) um regelmässig ausgeschaltet oder gar suspended zu werden. Es könnte sein dass der Controller entweder keine Zeit hat die Daten auf die Platte zu schreiben bevor Windows das Netzteil ausknipst, oder diesen Ruhezustand nicht immer korrekt versteht und beim Aufwachen nur plötzlich feststellt dass seine Superkondensatoren leer sind. Ersterer Fall wäre tragischer da Datenkorruption (sorry, in HPE-Speak "Inkonsistenzen") auftreten werden, zweiter wäre ein nerviger Bug welcher Probleme im weiteren Betrieb verursachen kann.

Ich kenne weder Lights-Out noch deine System-Konfiguration, aber es sollte möglich sein entweder die Deep-Sleep Powerstates der CPU im Bios zuu deaktivieren oder Windows in Hibernate zu zwingen statt hybrid-sleep. Beim direkten Hibernate fahren alle Komponenten ja analog zum Shutdown herunter so dass dies die Theorie bestätigen oder wiederlegen könnte.
 
Hallo,

hat etwas gedauert. Aber ich finde im BIOS keine Option zum deaktivieren vom Deep-Sleep.
Auch habe ich keine Idee, wie ich den Windows Server in den Hibernate zwingen kann.

Was ich mittlerweile festgestellt habe ist, dass der "Fehler" auch entsteht, wenn der Server durch Lights-Out herruntergefahren wird.
 
Hallo,

knapp vor Weihnachten letztes Jahr, so auch heuer eine diesbezügliche Info:
Ja, ist richtig, dass man immer alles aktuell halten sollte um dann mögliche Probleme von selbst gelöst zu bekommen. Nur in diesem Fall hilft dies nichts. Mittlerweile auf der aktuellsten Version von iLO 4 (2.81) und auch die schafft hier keine Abhilfe. Auch ein Reset von iLO über die Weboberfläche ändert nichts am Status. Neue Steckkarte+Batterie für den onboard P420i-Controller habe ich auch bei Servershop24 neu gekauft, funzt einwandfrei, löst aber dieses Problem nicht. (By the Way: Das Update auf 2.81 hat nur Ärger gemacht bei der Verwendung des RAID-Caches und iLO motzte ständig, dass keine Batterie da wäre - hier hat zumindest ein iLO-Reset die Sache wieder auf grün gesetzt.)
@rgiese: Im Grunde ist es egal, es stört halt das Auge, wenn nicht alles auf grün steht. Das einzige was vermutlich hier übrigbleibt ist diese Variante:
https://sysadminguides.org/2018/08/...embedded-media-manager-failed-initialization/
Über diese Anleitung bin ich nun öfters im Netz gestolpert. Ich selbst habe sie noch nicht durchgespielt, scheint mir aber plausibel zu klingen. Vielleicht geht sich in der Feiertagszeit eine Downtime des Servers für eine Bastelzeit aus.

Schöne Weihnachtszeit an alle.
 
Im Grunde ist es egal, es stört halt das Auge, wenn nicht alles auf grün steht. Das einzige was vermutlich hier übrigbleibt ist diese Variante:
https://sysadminguides.org/2018/08/...embedded-media-manager-failed-initialization/
Zur Vollständigkeit;

Ist Teil des Advisory diesbezüglich: https://support.hpe.com/hpesc/public/docDisplay?docId=a00048622en_us

In diesem wird, im Fall das der Fehler damit nicht behoben wird auf dieses weiterverwiesen: https://support.hpe.com/hpesc/public/docDisplay?docId=emr_na-c04996097

Wenn das noch immer nicht hilft ist es ganz einfach eine perma-bricked od. defekte Hardware.
 
Back
Top