Bluescreen nach weiteren RAM Riegel

Hallo,

ich habe meinem Server Zuhause einen weiteren RAM Riegel gegönnt, nur leider bedankt sich der Server jetzt bei mir mit einem Bluescreen nach einer gewissen Zeit.

Mainboard: Intel S1200BTLR
CPU: Xeon E3-1230 V2
RAM:2x Kingston KVR1333D3E9S/4G (DIMM A1 und B1)
Der neue Riegel ist ein Kingston KVR1333D3E9S/8G (DIMM A2).

Gestern morgen habe ich den Riegel eingebaut. Server fuhr auch normal hoch und wurde auch problemlos erkannt. Nach ein 3-4 Stunden ist der Server mit einem Bluescreen neu gestartet (Bild s. Anhang).
Problemsignatur:
Problemereignisname: BlueScreen
Betriebsystemversion: 6.1.7601.2.1.0.400.8
Gebietsschema-ID: 1031

Zusatzinformationen zum Problem:
BCCode: 124
BCP1: 0000000000000005
BCP2: FFFFFA800D718028
BCP3: 0000000000000000
BCP4: 0000000000000000
OS Version: 6_1_7601
Service Pack: 1_0
Product: 400_2

In der Event Log vom Mainboard fand ich dann folgende Meldung (Bild. s. Anhang):
"Uncorrectable ECC. CPU: 1, DIMM: A2. - Asserted"

Ich habe auch mal den Riegel in DIMM B2 gesteckt, aber über Nacht ist der Server mit den gleichen Symptomen wieder neu gestartet.
Heute morgen habe ich dann mal die Firmware (BIOS, BMC, ME, etc.) geupdatet. Vor ca. 1 Stunde wieder mit dem selben Bluescreen neugestartet.

memtest läuft seit ca. 1 Stunde und hat bis jetzt noch keine Fehler gefunden.

Was meint ihr?
Ist der Riegel defekt oder hat das Board mit der Kombination (2x 4GB und 1x 8GB) Probleme?
 

Attachments

  • Bildschirmfoto 2013-08-21 um 14.11.58.png
    Bildschirmfoto 2013-08-21 um 14.11.58.png
    23.7 KB · Views: 232
  • Bildschirmfoto 2013-08-21 um 13.50.02.png
    Bildschirmfoto 2013-08-21 um 13.50.02.png
    228 KB · Views: 225
  • Bildschirmfoto 2013-08-21 um 14.16.39.png
    Bildschirmfoto 2013-08-21 um 14.16.39.png
    23 KB · Views: 211
Ob es am Riegel liegt kannst Du doch einfach testen, in dem Du nur den 8er Riegel verwendest. Zumindest würde ich nach dem Ausschlussverfahren vorgehen, da alles andere bestenfalls Kaffeesatzleserei ist.
 
Wie wäre es denn mal mit einem Memtest? Ich meine, es scheint doch einen plausiblen Zusammenhang zwischen dem zusätzlichen RAM und den Bluescreens zu geben, also könnte da ja durchaus einfach der neue Riegel defekte Speicherstellen haben.
Einfach eine Memtest-CD einwerfen, davon booten und wenigstens 2 Passes abwarten.
Wenn der RAM wirklich defekt ist, wirst du vermutlich schon nach einigen Minuten mit rotem Hintergrund die fehlerhaften Speicheradressen gelistet bekommen, aber manche Fehler zeigen sich erst, wenn der RAM eine gewisse Zeit unter Dampf arbeitet.

Ein kurzer Memtest ist eigentlich generell bei allen Änderungen am RAM sinnvoll ;)


EDIT: Habe gerade im zweiten Screenshot gesehen, dass dir sogar ECC-Fehler gemeldet werden.
Also: Der. RAM. ist. Tod.
Oder inkompatibel.
 
memtest habe ich 1mal durchlaufen lassen, ohne Fehler.

Habe seit 15 Uhr jetzt nur die 8GB Riegel drin.
Gerade ist der Server wieder neu gestartet. Diesmal ohne Bluescreen, sondern einfach nur neu gestartet.

Windows meldet nur das:
Das System wurde neu gestartet, ohne dass es zuvor ordnungsgemäß heruntergefahren wurde. Dieser Fehler kann auftreten, wenn das System nicht mehr reagiert hat oder abgestürzt ist oder die Stromzufuhr unerwartet unterbrochen wurde.

Werde heute Nacht mal den memtest durchlaufen lassen und gucken was er morgen früh meldet.

Macht es Sinn, den 8GB Riegel wieder zurück zugeben und gegen 2x 4GB Riegel zu tauschen, so das 4x 4GB drin sind? Aufrüsten ist dann nur leider vorbei, da alle 4 Bänke belegt sind, deswegen habe ich mich extra für nur 1x 8GB entscheiden.
Laut Kingston Seite sind alle beide mit dem Mainboard eigentlich kompatibel.
 

Attachments

  • Bildschirmfoto 2013-08-21 um 20.01.24.jpg
    Bildschirmfoto 2013-08-21 um 20.01.24.jpg
    145 KB · Views: 216
http://de.wikipedia.org/wiki/Dual_Channel

Der Betrieb eines einzelnen 8GB Moduls ist vor diesem Hintergrund nicht sinnvoll. Da dieses Modul gerade einmal ~70€ kostet, wären durchaus 2x8GB anzuraten, dann am Besten gleich im Zweierset.

Laut http://ark.intel.com/de/products/65732 unterstützt die CPU auch 1600er Speicher. Insofern wäre es auch nicht verkehrt ein solches Set zu nehmen und die 2x4GB einfach rauszunehmen (dann hast Du auch wieder Platz frei).

Wenn Du absolut auf Nummer sicher gehen willst, checkst Du vor einem Kauf zuerst das Mainboardhandbuch / die Website, welche Ram Module explizit unterstützt werden, statt auf Verdacht den billigsten Speicher zu kaufen, den Du bekommen konntest.
 
memtest ist mehrmals durchgelaufen ohne Fehler.

Zu Mindestens habe ich den Riegel jetzt zurückgeschickt und mir 2x 8 GB gekauft, die von Intel auf jeden Fall unterstützt werden.

Da der Server nur privat (Homeserver) genutzt wird, muss es nicht das Teuerste vom Teuersten sein, da reicht der Kingston RAM völlig.
 
Stabile Hardware ist die Grundlage eines stabilen Systems... Hardware muss nicht teuer sein, um gut zu sein, aber sie sollte "vernünftig" sein. ;)
 
Die 2x KVR1333D3E9S/4G laufen sehr stabil und noch keine Abstürze gehabt, deswegen habe ich halt gedacht, dass der gleich Riegel, nur mit 8GB auch stabil läuft.
Aber leider falsch gedacht und Danke für die Tipps. ;)
 
Der 8 GB Riegel würde auch stabil laufen (außer er ist wirklich defekt), wenn Du ihm einen zweiten Riegel dazu gegönnt hättest. ;)

Aber das hast Du ja jetzt nachgeholt.
 
Warum einen zweiten? Laufen die im Single Channel etwa nicht stabil?
Auch wenn nur der eine 8GB Riegel drin war, hat sich das System verabschiedet.
 
Wie gesagt: es kann gut sein, dass Dein Riegel defekt ist.

So oder so sind die Mainboards schon seit es Dual Channel gibt eher darauf ausgelegt, dass RAM im Paar läuft (Mainboard beachten, welche Steckplätze für Dual Channel Betrieb zu besetzen sind). Da sich die Bandbreite bei Single Channel Betrieb halbiert, schenkt man ohne Not Performance her.
 
Sollten die 2x8GB sich ebenfalls mit einem BSOD verabschieden, dann bitte mal das ECC deaktivieren. Gerade bei billigen/günstigen RAM-Riegeln ist ECC häufiger als BSOD-Grund aufgefallen. Gab dazu auch mal eine Studie eines bekannten OS-Herstellers, finde ich nur leider gerade nicht wieder :(
 
So, die neuen Riegel sind gekommen. Leider ähnliches Problem.

Es sind jetzt 2x KVR13E9/8I eingebaut. Die werden lauf Intel Seite auch unterstützt.
Zu Mindestens kommt kein Bluescreen mehr, sondern er startet nach fast genau 22 Minuten einfach neu (schon 3x). Wenn ich am Monitor gucken und irgendwas probiere einzugeben, hängt er einfach, passiert einfach nichts. Nach paar Sekunden merkt das Board, dass das OS hängt und startet neu.

Ich habe das Gefühl, dass das Board 8 GB Riegel nicht mag.

Ich habe auch mal geguckt, ob man ECC ausschalten kann, aber ich habe nirgends eine Einstellung dazu gesehen.
Wo wäre so etwas denn möglich? Im BIOS?

memtest läuft seit 30 Minuten und bis jetzt ist noch kein Fehler gefunden.
Beim memtest wird außerdem ECC off angezeigt. Ist das ein Fehler oder ist ECC wirklich nicht eingeschaltet?
 

Attachments

  • Bildschirmfoto 2013-08-24 um 15.17.31.png
    Bildschirmfoto 2013-08-24 um 15.17.31.png
    46.5 KB · Views: 209
und mir 2x 8 GB gekauft, die von Intel auf jeden Fall unterstützt werden.

Für jedes Board gibt es eine qualified Vendor List in der kompatible Speicher gelistet sind.

Deine Aussage ist so zumindest falsch. Nicht jeder RAM eines Herstellers ist immer kompatibel.

Zu beachten ist aber auch, daß nicht immer alle kompatiblen RAM Speicher in der Qualified Vendor List eingetragen sind, sondern meist nur die gängigsten
 
Stimmt eingestellte Versorgungs-Spannung für den RAM im BIOS mit der Spezifikation des RAM-Herstellers überein?
 
Laut BMC Web Console schwankt der Wert BB +1.5V P1 MEM zwischen 1.498 Volts und 1.504 Volts. Der RAM braucht 1.50V.
Gleiche Werte wie bei den 4GB Riegeln.
 
Hier mal ein kurzer Zwischenstand.

Vor ca. 4 Stunde habe ich mal processor C3/C6 State, SpeedStep und TurboBoost deaktiviert. Seit dem an läuft der Server durch.
Vorher war er nach max. 30 Min eingefroren und neu gestartet, bei 6 Versuchen.

Ich habe außerdem mal beim Lieferanten angerufen (Computer und Server Hersteller aus Deutschland) und gefragt, ob die solche Probleme kennen, da die das Mainboard auch teilweise bei ihren Servern verbauen. Er am Telefon meinte, alle drei Kingston Riegel sind mit dem Mainboard kompatibel und hatten bis jetzt noch keine Probleme damit. So richtig erklären, konnte er sich das auch nicht und ich sollte mal über ein Mainboard Tausch nachdenken.
 
Bis jetzt läuft der Server noch durch (seit fast 10 Stunden).
Wenn er morgen früh immer noch läuft, werde ich SpeedStep und TurboBoost wieder einschalten und mal testen.
 
Seit ca. 10 Stunden sind SpeedStep und TurboBoost wieder aktiviert und der Server läuft noch.

Ich hoffe mal, dass das auch so bleibt und bedanke mich schon mal bei euch für die Hilfe. ;)
 
Back
Top