Webtropia / Serverbasar Überhitzung im RZ

CentY

Registered User
Hi zusammen,

wenn ihr einen Serverbasar/Webtropia Server habt könnt ihr da mal nachsehen ob bei euch auch die Luft brennt ;)

Ein Server eines Kunden zeigt bei mir gerade stolze 99°C CPU Temperatur und 39°C Gehäusetemperatur.

Vielen Dank.
 
Code:
fan1:     1622 RPM  (min = 84375 RPM, div = 8)              ALARM
fan2:     1985 RPM  (min = 1171 RPM, div = 8)
temp1:       +36°C  (high =   +74°C, hyst =   +32°C)   sensor = thermistor
temp2:     +92.5°C  (high =  +100°C, hyst =   +95°C)   sensor = diode
Vorher waren die Temperaturen immer zwischen 50 - 60°C bei temp2.
 
cat /proc/cpuinfo

Code:
processor       : 0
vendor_id       : AuthenticAMD
cpu family      : 6
model           : 8
model name      : AMD Sempron(tm)   2600+
stepping        : 1
cpu MHz         : 1833.216
cache size      : 256 KB
fdiv_bug        : no
hlt_bug         : no
f00f_bug        : no
coma_bug        : no
fpu             : yes
fpu_exception   : yes
cpuid level     : 1
wp              : yes
flags           : fpu vme de pse tsc msr pae mce cx8 apic sep mtrr pge mca cmov pat pse36 mmx fxsr sse syscall mp mmxext 3dnowext 3dnow ts
bogomips        : 3670.36
clflush size    : 32

uptime

Code:
 21:33:02 up 83 days, 21:02,  1 user,  load average: 0.00, 0.00, 0.00
 
Liegt beim Sempron die Max-Temp nicht bei 90°C?

Wenn die 92 stimmen, dann wirds langsam kritisch, oder?
 
Hatte grad 100°C abschalten ist nicht drin zu wichtige Daten für den Kunden drauf. Austauschen muss das RZ jetzt denke ich sowieso schon. Also werd ich ihn laufen lassen bis er nicht mehr geht.

Im Systemlog tauchen schon immer öfter CRC Errors und Speicherfehler auf. Ich vermute das kommt auch vom Überhitzen.

Nachdem sich vom Support auch keiner meldet wird es wohl in Abwarten und Tee kochen ausarten ;)
 
Jetzt wirds wieder kühler. Bin jetzt auf 79,5°C gesunken. Auch das Mainboard ist wieder deutlich kühler.

Pendelt sich wohl jetzt zwischen 79,5°C und 85°C ein. Mainboard bei 33-25°C
 
Entweder hat sich der CPU-Lüfter selbst geheilt wenn Tom's Vermutung richtig war, oder die Putzfrau hat die Klimaanlage wieder eingeschalten nachdem sie deine Mail gelesen hat :)

In jedem Fall empfehle ich einen Hardwarecheck, aber wie ich dich kenne renne ich damit offene Türen ein ;)
 
Nachdem ich mittlerweile nicht mal mehr bzip2 Dateien entpacken kann wegen CRC Errors und Kernel Warnings. Wird da einiges kaputt sein ;)

Code:
kernel: Eeek! page_mapcount(page) went negative! (-1214248364)

Gut dass nen aktuelles Backup vorliegt ;) Bin nur gespannt wann der Support antwortet.
 
Jetzt kam eine Antwort dass das Mainboard getauscht wurde. Nur leider geht jetzt weder das normale System noch das Rescuesystem ;)
 
Bestimmt ist wieder der Switch kaputt ;) Ist zumindest die Standardausrede bei denen ;) Oder das Stromkabel kaputt das hatte ich auch schon einmal bei dem Kunden.
 
Back
Top