OpenIndiana が入っているストレージサーバ。
なぜか、作業中にディスクが死ぬというアクシデント。
ざっくりとした構成としては、ML110G5の環境に、LSI_1064E を使用したRAIDコントローラに、SAS 10KRPM 72GBのディスク2本でRAID1、SATAディスク3本でRAIDZ2という構成で、RAID1はOS起動などシステム用。RAIDZ2はデータ領域用として構成。
LSI Logic LSI_1060E (3000円程度で買えます)
復旧作業中に、RAID1がものすごい音をたてて、SASディスクが死ぬという、超リーチのなかのリーチ。
ちょっと勘弁してよ。という感じです。
現地には予備ディスクをおいていたので、さくっと交換したのですが、交換したときの様子でも。
まずは変な音がしたので、RAIDの状態の確認。
# raidctl -l c2t0d0 Volume Size Stripe Status Cache RAID Sub Size Level Disk ---------------------------------------------------------------- c2t0d0 67.9G N/A DEGRADED ON RAID1 0.1.0 67.9G GOOD N/A 67.9G FAILED
# iostat -En c2t0d0 Soft Errors: 0 Hard Errors: 0 Transport Errors: 19 Vendor: LSILOGIC Product: Logical Volume Revision: 3000 Serial No: Size: 73.00GB <72999763968 bytes> Media Error: 0 Device Not Ready: 0 No Device: 0 Recoverable: 0 Illegal Request: 0 Predictive Failure Analysis: 0
とりあえず、RAIDの状態が死んでいるだけで、DEGRADEDになってる。じゃあ、ディスクを交換だ!
シャカシャカとディスクを組み込み、HDDを取り付けるだけ。
# raidctl -l c2t0d0 Volume Size Stripe Status Cache RAID Sub Size Level Disk ---------------------------------------------------------------- c2t0d0 67.9G N/A SYNC ON RAID1 0.1.0 67.9G GOOD 0.0.0 67.9G GOOD
SYNCが始まったので、様子を見ることにします。
dmesgに次のメッセージが表示されて、無事完了したとお知らせ。
Nov 25 12:31:25 storage01 scsi: [ID 107833 kern.notice] /pci@0,0/pci8086,29f1@1/pci103c,322b@0 (mpt0): Nov 25 12:31:25 storage01 Physical disk (target 1) is |online| Nov 25 12:31:25 storage01 scsi: [ID 107833 kern.notice] /pci@0,0/pci8086,29f1@1/pci103c,322b@0 (mpt0): Nov 25 12:31:25 storage01 Volume 0 is |enabled||resyncing||optimal| Nov 25 12:31:25 storage01 scsi: [ID 107833 kern.notice] /pci@0,0/pci8086,29f1@1/pci103c,322b@0 (mpt0): Nov 25 12:31:25 storage01 Volume 0 is |enabled||optimal|
じゃ、最後に確認して、完了。
# raidctl -l c2t0d0 Volume Size Stripe Status Cache RAID Sub Size Level Disk ---------------------------------------------------------------- c2t0d0 67.9G N/A OPTIMAL ON RAID1 0.1.0 67.9G GOOD 0.0.0 67.9G GOOD
とりあえず、まじめにあわてて、データのバックアップを取りましたよ。。。壊れても、とりあえずのバックアップはあるけど、再構築となると面倒なので。。