2020年1月18日土曜日

PC環境 物欲のいじくり記 83 HP ML350eのリダンダント電源交換 その四 ML350eが起動しない

 HP  ML350eのリダンダント電源交換 その四 ML350eが起動しない 2020年始動
 
 2016年から放置状態であったML350e Gen8にGTX970を搭載させる作業を開始するためML350eの電源を入れたら、再起動を繰り返し、起動しなくなった。
 
 
原因究明 長期に渡って放置していたML350e Gen8が起動しなくなった。

症状
 SW ONでRBSU(ROM ベースセットアップユーティリティー)もIntelligent Provisioningも選択できない状況 F9、F10、F11も押せない。

 そもそもUSBキーボード及びマウスにも電源が供給されていない。 サーバーフロント部分にある状態表示にもエラーが表示されない。

  しばらく、再起動を繰り返している状況を保つ(45分くらい)とやっとRBSU、Intelligent Provisioningが選択できるようになり、USBへの電源供給も復活しているのでRBSUで工場出荷状態にして、再起動すると現象が繰り返される。

 またしばらく放置して、今度はIntelligent Provisioningのエラーチェックを10回テストするも、どこにもエラー表示が ない状況

 最終手段として内蔵電池CR2032を取り外し、電源ケーブルを抜いて30分放置するも、改善しない。
 リタンダント電源構成なので、電源を替えても同じ状況を繰り返す。

 再起動を繰り返している状況を保つ(45分くらい)てRBSU、Intelligent Provisioningが選択できる状況になる前の画面の遷移状況を詳しく見てみると、なんとMemoryエラーが出ている。

  筐体を開けて、Memoryの刺し直しを行ったところ、通常の起動シーケンスが始まり起動するようになった。

原因
 長期間放置でMemoryの接点で接触不良が発生し、エラーが発生し再起動を繰り返す状況になるも、筐体内の温度が上昇して金属部分が膨張すると接触不良が解消し、POSTが通るようになる。
 そのためIntelligent Provisioningのエラーチェックを行っても接触不良が解消しているので、エラーが出ない。 しかし、一旦電源を落として放置すると筐体内の温度が下がり、接触不良が発現し再起動を繰り返すことになっていた。

教訓
  POST画面をよくみて、初期のMemory認識、CPU識別がちゃんと行われているかを確認する。 長期間放置したサーバーは、接点部分の抜き差しを行い、また必要あれば接点復活剤を塗布する。
 RBSU、Intelligent Provisioningが選択できず、USBへの電源の供給されていない状況は、Memoryの接触不良が一因として考えられるので、面倒でも筐体を開けてMemoryの抜き差しを行う。

0 件のコメント:

コメントを投稿