ML115 G5 RAID HDD Degraded 復旧

2010/07/22
★★★

ML115 G5 で評価環境を構築し、約 1 年半の連続稼働を行ってきた。

それが、先日、急にリモートアクセスできなくなり、直接接続されたモニターで状況を確認。

ログを参照するも特に問題が発見できなかったので、サーバーを再起動した。

すると、起動時の HDD の検出が異常に時間がかかった。
HP System BIOS HDD Auto-Detecting 01

さらに何とか検出するも次の RAID のアレイ検出でデグレ (Degraded) とのステータスが表示された。
MediaSheld ROM BIOS Detecting Arrays Degraded

物理ディスク (1T) 4 玉を搭載し、RAID1 で、2 つのドライブを構成していたのだが、何故か Arrays は、3 つ検出された。

この状態でも OS は、何とか起動してくれた。
ただ、起動時間はかなり遅く、ハードディスクのアクセスランプは、点灯したまま。
システムのギリギリ度合が体感できたほど。

OS 起動後、ML115 G5 オンボード RAID ドライバー インストーラー でインストールされた [NVIDIA コントロール パネル] -> [ストレージ] より [ストレージ設定の表示] 画面で、ストレージのステータスを確認した。

劣化 = Degraded ってことなのだろうが、いったい何が原因で、この障害が発生しているかは判断できず。
ストレージ設定の表示 劣化

当然、この情報では、原因が分からないため、どのように障害をクリアして良いかも分からない。

選択枠の無い中で、原因追及のため、[SMART セルフテスト] を検出されているディスクに実行してみた。
SMART セルフテスト

セルフテストを実行する。
SMART セルフテスト 進行中

結果は、正常とのこと。
SMART セルフテスト パス

Windows の [ディスクの管理] 画面でも正常とのステータス。
Windows ディスクの管理

よって、OS レベルでの障害の原因究明を諦め、BIOS レベルにフォーカスした。

まず、HDD の自動検出をよく確認すると、Sec の HDD が検出されていない。
Sec の HDD の検出で大きく遅延していた。
HP System BIOS HDD Auto-Detecting 02

次に、MedhiaShield BIOS でステータスを確認すと何故か、アレイが 3 つ出現。
もちろん、RAID 1 構成時には、アレイは、2 つだった。
MediaSheld ROM BIOS Array List

アレイごとのステータスを確認。Array 1。
MediaSheld ROM BIOS Array 1

Array 2。
MediaSheld ROM BIOS Array 2

Array 3。
MediaSheld ROM BIOS Array 3

3 つのアレイのポートを参照すると、Port 0.0、Port 1.0、Port 1.1 とあり、やはり Sec HDD(Port 0.1) に障害がありそうだ。

さらに、BIOS の [HDD Configuration] を参照すると、やはり、Serial-ATA 0 Secondary Channel: "Not Detected" が確認され、HDD の物理障害だと判断した。
HP System BIOS HDD Configuration

そこで、HDD を物理的に交換することとした。

この続きは、次回の記事に記述する。

コメント (0)

コメントの投稿