HP ML350eのリダンダント電源交換 その四 ML350eが起動しない 2020年始動
2016年から放置状態であったML350e Gen8にGTX970を搭載させる作業を開始するためML350eの電源を入れたら、再起動を繰り返し、起動しなくなった。
症状
SW ONでRBSU(ROM ベースセットアップユーティリティー)もIntelligent Provisioningも選択できない状況 F9、F10、F11も押せない。
そもそもUSBキーボード及びマウスにも電源が供給されていない。 サーバーフロント部分にある状態表示にもエラーが表示されない。
しばらく、再起動を繰り返している状況を保つ(45分くらい)とやっとRBSU、Intelligent Provisioningが選択できるようになり、USBへの電源供給も復活しているのでRBSUで工場出荷状態にして、再起動すると現象が繰り返される。
またしばらく放置して、今度はIntelligent Provisioningのエラーチェックを10回テストするも、どこにもエラー表示が ない状況
最終手段として内蔵電池CR2032を取り外し、電源ケーブルを抜いて30分放置するも、改善しない。
リタンダント電源構成なので、電源を替えても同じ状況を繰り返す。
再起動を繰り返している状況を保つ(45分くらい)てRBSU、Intelligent Provisioningが選択できる状況になる前の画面の遷移状況を詳しく見てみると、なんとMemoryエラーが出ている。
筐体を開けて、Memoryの刺し直しを行ったところ、通常の起動シーケンスが始まり起動するようになった。
原因
長期間放置でMemoryの接点で接触不良が発生し、エラーが発生し再起動を繰り返す状況になるも、筐体内の温度が上昇して金属部分が膨張すると接触不良が解消し、POSTが通るようになる。
そのためIntelligent Provisioningのエラーチェックを行っても接触不良が解消しているので、エラーが出ない。 しかし、一旦電源を落として放置すると筐体内の温度が下がり、接触不良が発現し再起動を繰り返すことになっていた。
教訓
POST画面をよくみて、初期のMemory認識、CPU識別がちゃんと行われているかを確認する。 長期間放置したサーバーは、接点部分の抜き差しを行い、また必要あれば接点復活剤を塗布する。
RBSU、Intelligent Provisioningが選択できず、USBへの電源の供給されていない状況は、Memoryの接触不良が一因として考えられるので、面倒でも筐体を開けてMemoryの抜き差しを行う。
0 件のコメント:
コメントを投稿