Storage wird nicht immer erkannt

informant

Blog Benutzer
Hallo, wir haben einen DL785 G5 mit einem P812 Controller, welcher eine MSA60 mit 12x 3TB HDD im RAID6 angeschlossen hat. Wir haben das Problem, dass immer wieder die Storage nicht vom Controller erkannt wird. Wir müssen diese dnan hard ausschalten und wieder ancshaltne sowie den Server rebooten.

An was kann das liegen, RAID Controller, Storage? Würden uns auf eine Rückmeldung und Informationen freuen. Vielen Dank.

MfG
 

marce

Well-Known Member
Verschwindet das Ding im laufenden Betrieb oder ist es nach dem Start des Servers einfach nicht immer da?
 

informant

Blog Benutzer
Hi, bei einem zufälligen Start ist es plötzlich weg. Es kommt die Meldung: 1785-dirve array not configued
1794-drive array - array accelator battery charge low.
Nach einem Hardreboot der Storage wieder da.

Im IML steht auch was von Batterie leer bzw. low (s.o.). Aber dann sollte er das Array doch dennoch wenigstens finden.

Noch eine Idee?

MfG
 

witzi

Blog Benutzer
Ich gebe Marce recht, dass du die Batterie tauschen solltest, jedoch ist das definitiv nicht die Ursache des Problems...

Bei einem Defekt der Batterie wird lediglich das Cache Modul auf dem Raidctrl. deaktiviert.

Wo würden wir hinkommen, wenn der Raidctrl. nicht mehr erkannt wird, nur weil die Batterie leer ist.
 

Firewire2002

Registered User
Hängt an dem Controller auch interne Platten oder nur das JBOD über die externen Ports?
Verschwinden die internen Platten am gleichen Controller ebenfalls?

Habt ihr keine Ersatzhardware da? Paar SAS-Kabel, nen Controller und irgend nen anderen Server (muss ja nicht unbedingt für den Produktivbetrieb sein) hat man doch wohl mindestens im Schrank liegen. :rolleyes:
Dann wäre das klassische Ausschlussprinzip das einfachste:
SAS-Kabel tauschen
JBOD an anderem System mit anderem Controller anschließen (falls einfacher, weil schon bereitstehend), alternativ einfach mal den Controller tauschen und den vermeintlich defekten Controller unabhängig vom produktiven Betrieb mit einem anderen JBOD testen.
 

informant

Blog Benutzer
Hallo,

intern höngen keine HDDs dran, dafür ist nen extra Controller verbaut. Nur die Storage verschwindet. Bzgl. Ersatzteilen sind wir derzeit am prüfen, ob es daran liegen könnte und tauschen Teil für Teil aus.

MfG
 

marce

Well-Known Member
Ich kenn' die Kombination nicht, aber grundlegend, wenn das Storage nur beim Start nicht immer erkannt wird, würde ich vermuten, daß das Storage noch nicht sauber bereit ist und eben noch ein bisschen Zeit braucht - sprich Server und Storage nicht gleichzeitig anschalten sondern erst das Storage und z.B. 1min. später den Server.
 

Firewire2002

Registered User
Weiß nun nicht wie der DL785 von innen aussieht. Aber sofern möglich, hängt doch intern einfach mal eine Platte dran. ;)

@marce
Das Storage hat keine Logik die erst "booten" muss. Das ist nur ein dummes DAS-JBOD. Also ein Blechkasten mit Netzteil, SAS-Expander und Platten. Die einzige Zeit die da vergeht, ist die Schaltzeit des Netzteils.
Und da ja auch ein HP Server davor hängt, hast du dir auch einen Kaffee gekocht, bis der im BIOS überhaupt an der Stelle angekommen ist, um den Controller zu initialisieren und Platten zu erkennen. (Das verstehen nun wohl nur die, die schon mal HP Servern beim Booten zugeguckt haben) :p
 
Last edited by a moderator:

informant

Blog Benutzer
Hallo, laut Raid Status ist die Storage fertig und zeigt hinten auch P1 an.

Schau ich in der Console nach der Batrterie sagt er mir
Code:
 Cache Backup Power Source: Batteries
   Battery/Capacitor Count: 1
   Battery/Capacitor Status: OK

Im IML jedoch Status low, komische Geschichte.

Wir werden jetzt nochmal beides aus machen, dann die Storage starten und dann den Server. Normal soltle es jedoch sofort klappen, zumal ja auch die Storage schon erkannt wurde und nur der Server neu gestartet wurde und erst dann die Storage nicht erkannt wird. Melde mich danach nochmal.

PS: Gibts einen Command Befehl um zu sehen, ob die Storage erkannt wird? kenne nur die Raid Befehle mit hpacucli...

Danke Euch auf jeden Fall für die Mithilfe bis hier her.
 

Firewire2002

Registered User
Code:
hpacucli controller all show config detail

Sollte dir alles anzeigen, was der Controller irgendwie kennt/sieht. Auch unkonfigurierte Platten, Expander usw.
 

informant

Blog Benutzer
Hi, jo macht er auch:

Code:
Smart Array P812 in Slot 6
   Bus Interface: PCI
   Slot: 6
   Serial Number: PAGXQ0BRH0Q0K3
   Cache Serial Number: PBCDF0CRH0U2DV
   RAID 6 (ADG) Status: Enabled
   Controller Status: OK
   Hardware Revision: C
   Firmware Version: 6.40
   Wait for Cache Room: Disabled
   Surface Analysis Inconsistency Notification: Disabled
   Post Prompt Timeout: 0 secs
   Cache Board Present: True
   Cache Status: Not Configured
   Drive Write Cache: Disabled
   Total Cache Size: 1024 MB
   Total Cache Memory Available: 912 MB
   No-Battery Write Cache: Disabled
   Cache Backup Power Source: Capacitors
   Battery/Capacitor Count: 1
   Battery/Capacitor Status: OK
   SATA NCQ Supported: True


   Expander 250
      Device Number: 250
      Firmware Version: 3.10
      WWID: 50014380143570E6
      Vendor ID: HP

   SEP (Vendor ID HP, Model P812 INT EXP) 248
      Device Number: 248
      Firmware Version: 3.10
      WWID: 50014380143570E5
      Vendor ID: HP
      Model: P812 INT EXP

   SEP (Vendor ID PMCSIERA, Model  SRC 8x6G) 249
      Device Number: 249
      Firmware Version: RevC
      WWID: 50014380143570FF
      Vendor ID: PMCSIERA
      Model:  SRC 8x6G

Am Raid sagt er ja Firmware Version 6.40. Bei HP gibts eine 6.40(B). Ob das die selbe ist?
Wie kann man die Storage updaten? Firmware DVD hat da nichts angezeigt.

MfG
 

informant

Blog Benutzer
Hallo, die Anleitung haben wir auch. Wenn wir jetzt aber die Smart Start CD einwerfen und im Menü Ctrl+ALT+F1 drücken, landen wir auf der CD, wie kommen wir dann aber in den Mode:
Code:
3. Locate the cdrom entry in the list of mapped devices, and change to the device by entering its associated fs number (for example, fs0) under EFI Shell prompt.
4.     Move to the ODE directory:
fs0:\> cd \EFI\HP\DIAG\ODE

Im Verzeichnis mnt ist nichts drin außer CDROM wo die CD gemountet ist, USB Stick steckt dran und Smart Start CD liegen drin.
Wie kommen wir hier weiter um den Befehl ausführen zu können?
MfG
 

informant

Blog Benutzer
Hi, wir haben jetzt endlich eine scexe Firmware Datei auf der HP Downloadseite gefunden und die dazugehörigen libs installiert. Wenn wir diese Firmwareversion 2.28 ausführen kommt nur die Meldung:

./CP013530.scexe
./CP013530.scexe: 153: ./CP013530.scexe: pushd: not found
./CP013530.scexe: 158: ./CP013530.scexe: popd: not found
Copyright (c) 2006-2009 Hewlett-Packard Development Company L.P.
HP Enclosure ROM 2.28 Flash.
No devices updated.

bzw. mit -q
./CP013530.scexe -q
./CP013530.scexe: 153: ./CP013530.scexe: pushd: not found
./CP013530.scexe: 158: ./CP013530.scexe: popd: not found
Copyright (c) 2006-2009 Hewlett-Packard Development Company L.P.


HP Enclosure ROM 2.28 Flash.
Smart Array controller in slot 0 - not applicable

Smart Array controller in slot 6 - not applicable

No devices updated.

Installiert ist derzeit aber die Version:
Enclosure SEP (Vendor ID HP, Model MSA60) 246
Device Number: 246
Firmware Version: 2.18
WWID: 50014380067A7425
Port: 1E
Box: 1
Vendor ID: HP
Model: MSA60
SEP: (1) 2.18
Backplane Module (BPM): (1) 2.06, (2) 2.06
Fan Control Module (FCM): (1) 1.08, (2) 1.08
Health Monitor Module (HMM): (1) 1.10, (2) 1.10
Seven Segment LED Display: (1) 0.10

Was können wir hier noch machen, da es doch eine neuere Version ist? Erbitte Infos. Evtl. mal in die HP Firmware DVD einarbeiten auf USB Stick und damit testen? Vielen Dank.

MfG
 
Last edited by a moderator:

informant

Blog Benutzer
Hallo, kann es sein das die Wester Digital RED Pro HDDs ein zu geringes Timeout haben und daher die Verbindung zum RAID Controller beendet und somit das Array nicht gefunden wird?

MfG
 

PHP-Friends

Blog Benutzer
verifizierter Anbieter
Was für ein Timeout soll das sein? Wenn schon müsste der RAID-Controller einen Timeout definiert haben, der zu kurz ist, um die Platten zu erkennen. Oder meinst du was anderes?
 

informant

Blog Benutzer
Hallo, naja, komisch ist, dass sporadisch beim reboot die Storage nicht mehr erkannt wird und somit auch nciht das Array. Der Controller sagt dann immer kein Array konfiguriert, logisch wenn die Storage nicht gefunden wird. Komisch ist auch, dass die HDD LEDs an der Storage dann alle dauerhaft leuchten, als wenn diese sich aufgehangen hat. Ist doch aber nur ein Blechkasten. Hat noch jmd. eine Idee?

MfG
 

danton

Debian User
HP verwendet auf seinen Platten eine eigene Firmware und nicht die originale vom Festplattenhersteller - es ist also durchaus möglich, daß die WD-Platten sich etwas anders verhalten als es der RAID-Controller erwartet und es daher zu Problemen kommen kann.
 

informant

Blog Benutzer
Hallo, danke für deine Auskunft. Das HP eine eigene Firmware nutzt wissen wir, aber was kann man dagegen unternehmen, da die HDDs in jeder anderen Storage z.B. Synology normal laufen? Gibt es Workarrounds oder Einstellmöglichkeiten um den Fehler zu umgehen?
 
Top