Supermicro & Turbo Mode - IPMI meldungen Processor automatically throttled & Temperatur generell

Andi79

New Member
Ich habe 2 neue baugleiche Server.

Nach langem verzweifeln wegen zu hoher CPU Temperaturen habe ich jetzt als ich als letztes Mittel die Kiste runtertakten wollte im Bios die option "turbomode" gefunden. Scheinbar wird die CPU immer hochgetaktet bis 100 Grad erreicht werden, und dann wieder runter. Seltsam ist nur dass das IPMI dann tausende Criticalmeldungen raushaut pro Stunde (per Mail... horror).
Laut Supermicro ist das völlig normal, ich habe aber zweifel dass das so zuträglich für die CPU Lebenszeit ist. Hat da jemand Erfahrung damit? Cpu ist ne Xeon E2236, die ist für 100 Grad Coretemperatur freigegeben.

Auch ohne Turbomode wird diese Meldung ständig getriggert wenn z.B. backups laufen. Ist das wirklich normal? Durchschnittstemperatur bei Last liegt allerdings "nur" noch bei 80 Grad was OK sein sollte. Spitzen mit 100 Grad gibt es dennoch dauernd.

temp.png

.
turbomode.png
 
Für die CPU selbst ist das OK, da innerhlb der Specs.
Für das Darum könnte es widerum anders aussehen.
Wir hatten gerade einen Thread dazu und dort half mehr Luft, das heisst, mehr Lüfter, weniger Kabelsalat, mehr Platz im Gehäuse und hinter dem Luftauslass. Die Lüfter sollten so dimensioniert sein, dass bei ~4000 RPM mindestens 80% Volllast weggekühlt werden. Kürzere Kabel behindern den Luftstrom weniger, überflüssige Kabel und Komponenten rigeros entfernen. Hinter dem Luftauslass sollten optimalerweise mindestens zwei Handbreit Luft sein, was leider nicht in allen Racks möglich ist.
Notfalls muss man auf eine Festplatte oder RAM-Modul verzichten, um den Luftfluss zu verbessern.
 
Wo misst das IPMI? Auf dem Die sind 100 ok, aber am Kopf/Heatspreader nur 73.
Das ist die coretemperatur, bei 100 Grad taktet er dann auch runter und das ist laut Spezifikation auch die max. Höchsttemperatur dafür.

(TJUNCTION 100 GRad)

Laut Supermicro ist das auch völlig normal unter Volllast und schadet der CPU nicht, weil eben runter getaktet wird. Mit Turbo Mode war er auch mal ein paar Minuten auf über 90, jetzt kommt er eigentlich im Minutenmittel nicht über 80. Nach wie vor kommen aber je nach in der Stunde zwischen 10-500 Warnmails vom ipmi

SEL_TIME: 2022/07/26 07:27:03
SENSOR_NUMBER: 01
SENSOR_TYPE: Processor
SENSOR_NAME: CPU Temp
EVENT_DESCRIPTION: Processor automatically throttled
EVENT_DIRECTION: Assertion
EVENT SEVERITY:"critical"

Ich weiß das 1ms ausreicht um eine Meldung zu triggern und die Temperatur fällt sofort wieder runter auf 70-80 Grad (passiert dann gern auch mal 10x innerhalb von 30sek). Mach mir dennoch Sorgen, dass das Verhalten eben doch nicht "normal" ist. Wenn es normal ist finde ich diese Warnung ziemlich daneben (bzw. finde der Level dürfte max. Warning, eher noch Information sein).
 
Mir fällt auf, dass das eine recht alte und vergleichsweise ineffiziente CPU ist. Die Performance des 80W E-2236 https://www.cpubenchmark.net/cpu.php?cpu=Intel+Xeon+E-2236+@+3.40GHz&id=3607 können schon 15W Prozessoren ( https://www.cpubenchmark.net/cpu.php?cpu=AMD+Ryzen+5+5625U&id=4760 ) erreichen, verbrauchen dabei weniger Strom und produzieren weniger Wärme.

Ansonsten zum Verbau alles was @Joe User sagt. Evtl ist auch noch die Kühlpaste nicht ausreichend / zu viel, oder der Lüfter nicht vernünftig aufgebracht, oder der Airflow reicht nicht aus, dann müssten die Lüfter halt deutlich schneller eingestellt werden. Im Serverraum ist das ja wurscht. Und 19" Rack Server gehören ausschließlich in einen solchen.
 
Last edited:
Back
Top