• This forum has a zero tolerance policy regarding spam. If you register here to publish advertising, your user account will be deleted without further questions.

Serverloft Warnung!

also die reboot probleme sind sowohl wie bei debian 5 auch bei ubuntu. Hab eben "last" ausgeführt und die reboots laufen immer noch.
 
du meinst den Recovery Modus?


Ich installiere grad mal Suse drauf, will wissen obs da auch dieses Problem gibt.

Gebe später Bescheid.
 
Last edited by a moderator:
der root rebootet wie immer

Code:
/root$ last
reboot   system boot  2.6.27.45-0.1-pa Sat Mar 20 21:25          (00:38)    
reboot   system boot  2.6.27.45-0.1-pa Sat Mar 20 21:16          (00:47)    
reboot   system boot  2.6.27.45-0.1-pa Sat Mar 20 20:33          (01:30)    
reboot   system boot  2.6.27.7-9-pae   Sat Mar 20 19:45          (00:45)    

wtmp begins Sat Mar 20 19:45:59 2010
 
Hallo!
OK, dass kann ich verstehen. Lass doch mal durch den Support prüfen, ob eventuell die Hardware im weiteren Sinne defekt sein könnte. Beispielsweise der Webresetter.

Ich hoffe, du kannst ausschließen, dass sich jemand illigal Zugang zum Kundenpanel verschafft hat, und sich jetzt den Spaß erlaubt, deinen Server permanent via Webinterface zu resetten.

mfG
Thorsten
 
kann man im Kundenpanel verfolgen wer sich mit welcher ip einloggt? Kann es zwar teoretisch ausschliessen, aber würde vielleicht gerne wissen wer da rein und raus geht. Habe eben mal das password geeändert. Falls die reboots immer noch sind, sag ich bescheid.
 
hab mal ein bischen im IPMI rumgeschaut und in der Eventlog das gefunden.

Code:
Event
Date	Event
Severity	Event
Source	Event
Description	Alert
Group
Critical	21-Mar-2010 12:09:11	Critical	iRMC	Power unit: A/C lost	System Power
Critical	21-Mar-2010 11:50:01	Critical	iRMC	Power unit: A/C lost	System Power
Critical	21-Mar-2010 08:11:31	Critical	iRMC	Power unit: A/C lost	System Power
Critical	21-Mar-2010 08:04:29	Critical	iRMC	Power unit: A/C lost	System Power
Critical	21-Mar-2010 07:57:23	Critical	iRMC	Power unit: A/C lost	System Power
Critical	21-Mar-2010 07:42:45	Critical	iRMC	Power unit: A/C lost	System Power
Critical	21-Mar-2010 07:10:39	Critical	iRMC	Power unit: A/C lost	System Power
Critical	21-Mar-2010 01:23:23	Critical	Stdby +5V	'Stdby +5V': Voltage Low Critical : 4.63 Volt	System Power
Critical	21-Mar-2010 01:16:35	Critical	iRMC	Power unit: A/C lost	System Power
Critical	21-Mar-2010 01:08:57	Critical	iRMC	Power unit: A/C lost	System Power
Critical	21-Mar-2010 01:06:59	Critical	Stdby +5V	'Stdby +5V': Voltage Low Critical : 4.66 Volt	System Power
Critical	21-Mar-2010 01:01:37	Critical	iRMC	Power unit: A/C lost	System Power
Critical	21-Mar-2010 00:55:05	Critical	iRMC	Power unit: A/C lost	System Power
Critical	21-Mar-2010 00:54:55	Critical	Stdby +5V	'Stdby +5V': Voltage Low Critical : 4.66 Volt	System Power
Critical	21-Mar-2010 00:49:03	Critical	iRMC	Power unit: A/C lost	System Power
Critical	21-Mar-2010 00:44:21	Critical	iRMC	Power unit: A/C lost	System Power
Critical	21-Mar-2010 00:44:16	Critical	Stdby +5V	'Stdby +5V': Voltage Low Critical : 4.66 Volt	System Power
Critical	21-Mar-2010 00:37:33	Critical	iRMC	Power unit: A/C lost	System Power
Critical	21-Mar-2010 00:28:11	Critical	iRMC	Power unit: A/C lost	System Power
Critical	21-Mar-2010 00:19:47	Critical	iRMC	Power unit: A/C lost	System Power
Critical	21-Mar-2010 00:08:39	Critical	iRMC	Power unit: A/C lost	System Power
Critical	20-Mar-2010 23:57:55	Critical	iRMC	Power unit: A/C lost	System Power
Critical	20-Mar-2010 23:40:07	Critical	iRMC	Power unit: A/C lost	System Power
Critical	20-Mar-2010 23:27:13	Critical	iRMC	Power unit: A/C lost	System Power
Critical	20-Mar-2010 23:12:39	Critical	iRMC	Power unit: A/C lost	System Power
Critical	20-Mar-2010 22:56:25	Critical	iRMC	Power unit: A/C lost	System Power
Critical	20-Mar-2010 22:27:47	Critical	iRMC	Power unit: A/C lost	System Power
Critical	20-Mar-2010 22:00:47	Critical	iRMC	Power unit: A/C lost	System Power
Critical	20-Mar-2010 21:23:35	Critical	iRMC	Power unit: A/C lost	System Power
Critical	20-Mar-2010 21:11:29	Critical	Stdby +5V	'Stdby +5V': Voltage Low Critical : 4.63 Volt	System Power
Critical	20-Mar-2010 20:23:13	Critical	iRMC	Power unit: A/C lost	System Power
Critical	20-Mar-2010 20:21:53	Critical	iRMC	Power unit: A/C lost	System Power
Critical	20-Mar-2010 20:14:35	Critical	iRMC	Power unit: A/C lost	System Power
Critical	20-Mar-2010 20:13:42	Critical	Stdby +5V	'Stdby +5V': Voltage Low Critical : 4.63 Volt	System Power
 
Hallo jay1110,

schau mal im IPMI unter dem Menüpunkt "Energieverwaltung/Ein-/Ausschalten" auf die Zeile "Betriebsstunden Zähler:". Dort sollte vermerkt sein, wie lange der Server schon ohne Unterbrechung am Stromnetz ist.

Bei mir steht, folgendes drin:
Betriebsstunden Zähler: 15 Monate 1 Tage 22 Stunden 15 Minuten

Wenn Dein Server auf Grund eines kurzem Spannungszusammenbruchs heute wieder neu gebootet ist, kann man davon ausgehen, dass eventuell die Spannungszufuhr zum Server die Uhrsache ist.
In diesem Fall dürfte dann auch der Betriebsstundenzähler zurück gesetzt worden sein.

Ein weiterer Grund könnte eventuell auch die Umgebungstemperatur sein, die eventuell weitaus höher ist als im Idealfall von 22 Grad. Dies kann dazu führen, dass die Bauteile des Netzteils sich so stark erhitzen, dass deren Schutzfunktion greift bzw. greifen muss und der Server aus Sicherheitsgründen heruntergefahren wird. Wenn aber im BIOS es so eingestellt ist, dass der Server danach sofort wieder starten soll, wiederholt sich dieser Vorgang solange, bis der Provider dafür sorgt, dass die Umgebungstemperatur auf nahe 22 Grad abgesenkt wird.

Der Grenzwert laut IPMI für die Umgebungstemperatur liegt beim meinem Server auf Grund der Luftkühlung mit Hilfe von Lüftern bei 37 Grad.

Wenn Dich das aber nicht stört, dass der Server auch bei höherer Umgebungstemperatur noch laufen soll, so kannst Du mit Gewalt dafür sorgen, das der Server auch noch dann läuft, wenn die Umgebungstemperatur über die 37 Grenze geht, in dem Du unter dem Menüpunkt "Energieverwaltung/Ein-/Ausschalten" des IPMI das Verhalten von eventuell derzeit "Bei Fehler anhalten" auf "keine Aktion" änderst.
Bei meinem Server ist dies sogar schon so voreingestellt.

Nachteil für diese Einstellung: Die einzelnen Bauteile werden dann auf Grund von Überhitzung gnadenlos zerstört.

Gruß
Andreas
 
Zusammenfassung
Aktueller System Status: eingeschaltet
Betriebstunden Zähler: 9 Monate 15 Tage 1 Stunden 50 Minuten
Letzter Einschalt Grund: Automatischer Neustart nach Stromausfall
Letzter Ausschalt Grund: Ausschalten - Stromausfall


Also ich hab den Server jetzt 3 Monate. Mit den Betriebsstunden stimmt das nicht über ein.

Umgebungstemeratur ist normal. Ich habe jetzt nochmal ein Ticket abgeschickt mit den logs auf IPMI. Mal sehen was jetzt unternommen wird.

Danke Andreas für dein Post ;)
 
Hallo jay1110,

ich hoffe sehr, dass Dir meine Mitarbeiter durch den Tausch des Netzteils nun weiterhelfen konnten und das Dein Server nun wieder zur Zufriedenheit läuft.

Ich bitte die entstandenen Unannehmlichkeiten zu entschuldigen und hoffe, dass wir Dich von nun an wieder von unserer Leistung überzeugen können.

Viele Grüße
Henrik
 
Hallo Henrik, Hallo jay1110!

Woran lag es denn nun? Netzteil kaputt und bei den 2 getauschten Maschinen auch?

Oder wird da nicht komplett alles getauscht? 3x einen Rechner mit kaputtem Netzteil? Oder steckt Ihr das gleiche Netzteil immer nur in neues Chassis, wo Board, RAM und CPU drauf sind?

Dass ein Netzteil bei Dauerlast von 80-90% irgendwann die Hufe reisst, liegt im Bereich des Möglichen. Und da der Rechner anscheinend schon 9 Monate läuft, kann der Vorgänger auch ordentlich Last produziert haben und der Verschleiss ist u. U. erklärbar.

Was ist das eigentlich für ein Rechner? Ein Xeon oder ein Opteron?

Das Netzteil ist bei den Xeons für 650 Watt ausgelegt und mit einem Single-Xeon aus der Harpertown-Reihe wird der Rechner unter Vollast kaum mehr als 300 Watt konsumieren. Das sind gute 50% Netzteillast, also nicht wirklich viel im Dauereinsatz. Was die Opterons nehmen, weiss ich nicht.
 
Last edited by a moderator:
Back
Top