Dellサーバー Poweredge R420で「CPU 1 MEM VTT PG voltage is outside of range.」および「CPU 1 MEM VDDQ PG voltage is outside of range.」とエラーが表示されて再起動が頻発する

サーバー構築

DellのPowerEdge R420がある日を境に再起動が頻発するようになりました

再起動が起きるタイミングに、iDRACに以下2つのログが表示されていました
CPU 1 MEM VTT PG voltage is outside of range.
CPU 1 MEM VDDQ PG voltage is outside of range.

原因

電圧が許容範囲を超えているといったようなエラー内容だったので、最初は電源ユニット周りを疑いました
サーバーから1つのUPSに電源を2口挿していましたが、これを2つのUPSに1口ずつ挿したり、壁のコンセント部分に直挿ししたりしましたが、変わりませんでした

ネットで調べたところ日本語のサイトは見つかりませんでしたが、以下のサイトでメモリを入れ替えたら直ったような記述がありました
https://www.dell.com/community/PowerEdge-Hardware-General/CPU-1-MEM-VDDQ-PG-voltage-is-outside-of-range/td-p/5166406/page/2

PowerEdge R420 は導入時から4GBメモリ×8本(32GB)で運用していました
本数が多い分電圧を圧迫している可能性があるかもなと思ったので、本数を減らして試してみようと思いました


最近ちょうど廃棄予定のサーバー(8GBメモリ×2)があったので 4GBメモリ×8本 + 8GBメモリ×2本(32GB)に組み直すことにしました

結果

入れ替えから数日経ちましたが、エラーは表示されなくなり頻発していた再起動もなくなりました
メモリの電圧量が原因だったようです


コメント

タイトルとURLをコピーしました