HP Proliant DL160 G6: iLO100 "IPMI" ohne Funktion

Hi,
wir haben den Server vor etwa drei Wochen komplett neu aufgesetzt und Proxmox 8 mit pve-kernel-6.2 installiert - alles lief ganz prima.
Vor ein paar Tagen wurde der Kernel von Version 6.2.16-4 auf Version 6.2.16-5 (und heute 6.2.16-6) aktualisiert.

Seit 6.2.16-5 ist das iLO nicht mehr erreichbar (es reagiert zwar noch auf ping, http und ssh sind aber "down") und es scheint, dass der aktualisierte Kernel irgendwie nicht (mehr) mit dem iLO kommunizieren kann; eine andere Ursache ist natütlich auch nicht vollkommen ausgeschlossen... :)

Auf dem Host-System folgende Fehlermeldungen:
Code:
root@pve:~# ipmitool channel info
Could not open device at /dev/ipmi0 or /dev/ipmi/0 or /dev/ipmidev/0: No such file or directory
root@pve:~# systemctl status ipmievd.service
× ipmievd.service - IPMI event daemon
     Loaded: loaded (/lib/systemd/system/ipmievd.service; disabled; preset: enabled)
     Active: failed (Result: exit-code) since Wed 2023-07-26 15:53:13 CEST; 10s ago
    Process: 279491 ExecStart=/usr/sbin/ipmievd open daemon (code=exited, status=1/FAILURE)
        CPU: 52ms
root@pve:~#  dmesg |grep ipmi
[   33.533060] ipmi device interface
[   33.646428] ipmi_si: IPMI System Interface driver
[   33.646452] ipmi_si dmi-ipmi-si.0: ipmi_platform: probing via SMBIOS
[   33.646455] ipmi_platform: ipmi_si: SMBIOS: io 0xca2 regsize 1 spacing 1 irq 0
[   33.646459] ipmi_si: Adding SMBIOS-specified kcs state machine
[   33.646523] ipmi_si IPI0001:00: ipmi_platform: probing via ACPI
[   33.646571] ipmi_si IPI0001:00: ipmi_platform: [io  0x0ca2] regsize 1 spacing 1 irq 0
[   33.668225] ipmi_si dmi-ipmi-si.0: Removing SMBIOS-specified kcs state machine in favor of ACPI
[   33.668231] ipmi_si: Adding ACPI-specified kcs state machine
[   33.668312] ipmi_si: Trying ACPI-specified kcs state machine at i/o address 0xca2, slave address 0x20, irq 0
[   33.998685] ipmi_si IPI0001:00: There appears to be no BMC at this location
[   34.045562] ipmi_ssif: IPMI SSIF Interface driver
root@pve:/etc# systemctl status ipmievd.service
× ipmievd.service - IPMI event daemon
     Loaded: loaded (/lib/systemd/system/ipmievd.service; disabled; preset: enabled)
     Active: failed (Result: exit-code) since Wed 2023-07-26 15:53:13 CEST; 37min ago
    Process: 279491 ExecStart=/usr/sbin/ipmievd open daemon (code=exited, status=1/FAILURE)
        CPU: 52ms


Jul 26 15:53:13 pve systemd[1]: Starting ipmievd.service - IPMI event daemon...
Jul 26 15:53:13 pve ipmievd[279491]: Could not open device at /dev/ipmi0 or /dev/ipmi/0 or /dev/ipmidev/0: No such file or directory
Jul 26 15:53:13 pve systemd[1]: ipmievd.service: Control process exited, code=exited, status=1/FAILURE
Jul 26 15:53:13 pve systemd[1]: ipmievd.service: Failed with result 'exit-code'.
Jul 26 15:53:13 pve systemd[1]: Failed to start ipmievd.service - IPMI event daemon.

Reset des iLO nicht möglich:
Code:
root@pve:~# ipmitool mc reset warm
Could not open device at /dev/ipmi0 or /dev/ipmi/0 or /dev/ipmidev/0: No such file or directory
root@pve:~# ipmitool mc reset cold
Could not open device at /dev/ipmi0 or /dev/ipmi/0 or /dev/ipmidev/0: No such file or directory

Offenbar ist das device da...:
Code:
root@pve:~# cat /proc/devices | grep ipmi
241 ipmidev

aber die Knoten werden nicht angelegt.
Wenn man sie manuell mit...
root@pve:~# mknod /dev/ipmi0 c 241 0x0
anlegt, funktioniert es trotzdem nicht...

Die Kernel-Module sind geladen:
Code:
root@pve:~#  lsmod | grep ipmi
ipmi_watchdog          32768  0
ipmi_ssif              49152  0
acpi_ipmi              24576  0
ipmi_si                90112  0
ipmi_poweroff          16384  0
ipmi_devintf           20480  0
ipmi_msghandler        86016  6 ipmi_devintf,ipmi_si,ipmi_watchdog,acpi_ipmi,ipmi_ssif,ipmi_poweroff
root@pve:~# find /lib/modules/$(uname -r)/kernel/drivers/char/ipmi/ -type f -name '*.ko*' -exec modinfo {} \; | egrep "^filename|^description"
filename:       /lib/modules/6.2.16-5-pve/kernel/drivers/char/ipmi/ipmi_msghandler.ko
description:    Incoming and outgoing message routing for an IPMI interface.
filename:       /lib/modules/6.2.16-5-pve/kernel/drivers/char/ipmi/ipmi_watchdog.ko
description:    watchdog timer based upon the IPMI interface.
filename:       /lib/modules/6.2.16-5-pve/kernel/drivers/char/ipmi/ipmi_poweroff.ko
description:    IPMI Poweroff extension to sys_reboot
filename:       /lib/modules/6.2.16-5-pve/kernel/drivers/char/ipmi/ipmi_devintf.ko
description:    Linux device interface for the IPMI message handler.
filename:       /lib/modules/6.2.16-5-pve/kernel/drivers/char/ipmi/ipmi_si.ko
description:    Interface to the IPMI driver for the KCS, SMIC, and BT system interfaces.
filename:       /lib/modules/6.2.16-5-pve/kernel/drivers/char/ipmi/ipmi_ssif.ko
description:    IPMI driver for management controllers on a SMBus

modprobe ipmi_devintf
modprobe ipmi_msghandler
modprobe ipmi_poweroff
modprobe ipmi_si
modprobe ipmi_ssif
modprobe ipmi_watchdog

...geben keine Fehler aus

Trotzdem zusätzlich in /etc/modules:
#IPMI Module
ipmi_devintf
ipmi_msghandler
ipmi_poweroff
ipmi_si
ipmi_ssif
ipmi_watchdog

Es macht aber wohl keinen Unterschied ob diese Einträge in der Datei sind oder nicht.

Auch ein apt purge und Neuinstallieren von ipmitool_1.8.19-6_amd64.deb brachte keine Verbesserung.

Code:
ipmiutil health -x
ipmiutil health ver 3.18
ipmi_open: driver type =
ipmi_open_mv: cannot open /dev/ipmi/0
ipmi_open_mv: cannot open /dev/ipmi0
ipmi_open_mv: cannot open /dev/ipmidev0
ipmi_open_mv: cannot open /dev/ipmidev/0
imbapi ipmi_open_ia: open(/dev/imb) failed, No such file or directory
smbios: Driver=7(KCS), sa=20, Base=0x0ca2, Spacing=1
BMC KCS Initialized at 0x0ca2
ipmidir Cmd=01 NetFn=06 Lun=00 Sa=20 Data(0):
Send Netfn=06 Cmd=01, raw: 00 20 18 01
ipmidir Resp(1,1): status=-2 cc=00, Data(250):
open_direct: ProcessMessage(KCS) error = -2
ipmidir Cmd=01 NetFn=06 Lun=00 Sa=20 Data(0):
Send Netfn=06 Cmd=01, raw: 00 20 18 01
ipmidir Resp(1,1): status=-2 cc=00, Data(250):
open_direct: status=-400, KCS drv, ipmi=0
ipmi_open rc = -16 type =
Driver type , open rc = -16
Cannot open an IPMI driver: /dev/imb, /dev/ipmi0, /dev/ipmi/0,
     or direct driverless.
ipmiutil health, cannot open IPMI driver

Was kann man noch versuchen um iLO/IPMI wieder ans Laufen zu bekommen?

Danke Euch,
Mr. Mac :)
 
Ich hatte schon ein paar mal (allerdings vorwiegend auf Intel-Mainboards der SC2600er Baureihe) daß die ILO-Firmware komplett abgestürzt war.
Einziger Ausweg eines Resets war es, das System komplett für einige Minuten stromlos zu machen.
Hast Du mal ein Firmware-Update versucht? Ich habe hier die 4.26 (auf einem DL180G6) die eigentlich problemlos tut - allerdings ESXi.
 
Back
Top