朝起きたらヘルス LED が点滅してた。
で、Insight Display を確認したらメモリの箇所が点灯。
取りあえず ESXi 上でエラーが出てないのと、iLO でも
システムの状態が “Degrade” ってなっているけど IML
に何にもログが出力されていないので一過性のものかなと
電源を落として SmartSTART でハードウェア診断を掛けたら
何事もなかったかのように完走 x3
しかも光ってた LED も消灯したので誤検知かな?と
火入れして経過観察していたら、1、2 時間後に再度点滅。
状況も前回と同じ。でやっぱり異常報告を受けている
モジュールは使えているらしい。
多分 ECC の Correctable error だろうなということで
急ぎじゃないけど、対処は必要と判断して交換しようかなと
予備部材を確認したら FB-DIMM の 2GB モジュールが手元
になかったので発注。
で、届いたモジュール hp 純正 2GB 2Rank
今後のことも考えて 2 枚。
交換準備が出来たのでシステム停止させシャシーを解放。
最近こんなことばっかりやってる気がする。。
エアフロー用のカバーが付いているので取り外す。
メモリモジュール群が見えるので
交換して作業完了。
交換後、再度念のため SmartSTART でハードウェア診断を
掛けて問題ないことを確認。
火入れしてから 2、3 日経っても再発しないので復旧と断定
して対応終了。
メモリ障害なんてそんなに起きないので予備パーツとか
押さえていなかったけど、起きるもんだなー
ってかリプレイスしてからハードウェア障害多くね?