HP ML350p Gen8 ECC RAM MIX

Ich hatte euch im letzten Beitrag bereits angekündigt, dass ich über meine Erkenntnisse berichten werde, die ich bei dem Serverumbau / -reparatur machen durfte.
In diesem Beitrag geht es um den Mix von 1,5V und 3V ECC RAM Riegeln im HP-Server.

Im endeffekt hat alles damit angefangen, dass meine 96 GB RAM knapp wurden und ich mich nach einer RAM-Erweiterung umgeschaut hatte.
Hier wurde ich auch relativ schnell fündig. In einem Angebot auf eBay-Kleinanzeigen hatte ich mich für weitere 48 GB RAM entschieden.
Dazu muss ich gestehen, ich hab es noch nie so genau mit dem RAM genommen, wenn die meisten Werte passen, dann kommt das auch ins System. (Computerdenken).

Nach Ankunft des RAM’s wurde dieser direkt in den Server eingesetzt. Beim ersten Bootcheckup vom Mainbaord sah auch alles i.O aus. iLO4 und ESXI haben den neuen RAM ohne Fehler angezeigt und auch zur Verfügung gestellt.
Es dauerte nicht lange, da meldet mir iLO4 einen Speicherfehler den ich nicht nachvollziehen konnte.
Da ich den Wald vor lauter Bäumen auch nicht gesehen habe, ist mir nach genaueren hinschauen erst aufgefallen, dass die eine Hälfte der neuen RAM-Riegel auf 1,5V läuft und die anderen auf 3V.
Ich informierte mich in einschlägigen Foren ob dies ein Problem darstellt, wo zum Teil die Meinungen echt auseinander gingen.
Das Ré­su­mé war, schau rein was in deiner Mainboardbeschreibung steht.
Dort schreibt HP, dass es gehen sollte. Im den Foren wurde jedoch immer wieder empfohlen immer nur eine Voltzahl zu betreiben.

Ich konnte das immer noch nicht richtig glauben und habe verschiedenste Tests durchgeführt. Ich nahm alle RAM-Riegel heraus und steckte sie nacheinander wieder herein, bis der Fehler wieder auftrat.

Nun Googlete ich noch den Fehlercode den iLO4 im Log mir anzeigte.

POST ERROR: 207 -Invaild Memory Configuration – Processor 1, DIMM 8 refer to Memory Population Rules in Documentation

HP ML350p Gen8 iLO4 Log Massage


Dieser sagte aus, es liegt ein Problem mit dem Arbeitsspeicher vor (ACH NEE). Entweder soll das Board ein Fehler haben, oder die CPU hat einen Weg.

Damit ich diese Varianten ausschließen konnte, baute ich mir eine zweite CPU ein, die eh schon seit längeren geplant war.
Hier setzte ich auf die weißen RAM-Slots die 1,5V RAM-Riegel ein und auf die schwarzen RAM-Slots die 3V RAM-Riegel.

Erst einmal sah alles gut aus und das System lief auch über Stunden hinweg ohne Fehler, bis wieder der identische Errorcode im iLO4 hoch kam.
Nun wusste ich schon einmal, die CPU kann es nicht sein.

Als nächstes nahm ich die 3V Riegel raus und lies das System nur noch mit den 1.5V Riegeln laufen.

Siehe da, keine Fehler.

Seit dem läuft mein System wieder ohne einen Zwischenfall und ich frage mich bis heute, warum so etwas nicht explizit in der HP Dokumentation ausgewiesen ist?
Geht man davon aus, dass alle Anwender immer die passende Schulungen zur Hardware haben, oder ist es ein Geldthema, dass die Hersteller einfach ihre mega teuren Subscription verkaufen wollen?

Ich werde es wohl nie erfahren 🙂