(続き)
HDD交換の顛末の間に、現状の確認。かなり抜粋。
yua# atacontrol list | egrep 'ad[0-9]+' Slave: ad1 <INTEL SSDSA2M040G2GC/2CV102HD> SATA revision 2.x Master: ad4 <WDC WD20EARX-00PASB0/51.0AB51> SATA revision 2.x Master: ad6 <WDC WD20EZRX-00DC0B0/80.00A80> SATA revision 2.x Master: ad8 <WDC WD20EARS-00MVWB0/51.0AB51> SATA revision 2.x Master: ad10 <WDC WD20EARS-00MVWB0/51.0AB51> SATA revision 2.x yua# smartctl -a /dev/ad4 | egrep '(Hours|Rate)' 1 Raw_Read_Error_Rate 0x002f 200 200 051 Pre-fail Always - 0 7 Seek_Error_Rate 0x002e 200 200 000 Old_age Always - 0 9 Power_On_Hours 0x0032 064 064 000 Old_age Always - 26604 200 Multi_Zone_Error_Rate 0x0008 200 200 000 Old_age Offline - 4 yua# smartctl -a /dev/ad6 | egrep '(Hours|Rate)' 1 Raw_Read_Error_Rate 0x002f 100 253 051 Pre-fail Always - 0 7 Seek_Error_Rate 0x002e 200 200 000 Old_age Always - 0 9 Power_On_Hours 0x0032 100 100 000 Old_age Always - 44 200 Multi_Zone_Error_Rate 0x0008 100 253 000 Old_age Offline - 0 yua# smartctl -a /dev/ad8 | egrep '(Hours|Rate)' 1 Raw_Read_Error_Rate 0x002f 199 199 051 Pre-fail Always - 2822 7 Seek_Error_Rate 0x002e 200 200 000 Old_age Always - 0 9 Power_On_Hours 0x0032 057 057 000 Old_age Always - 31664 200 Multi_Zone_Error_Rate 0x0008 192 183 000 Old_age Offline - 2332 yua# smartctl -a /dev/ad10 | egrep '(Hours|Rate)' 1 Raw_Read_Error_Rate 0x002f 200 200 051 Pre-fail Always - 63 7 Seek_Error_Rate 0x002e 200 200 000 Old_age Always - 0 9 Power_On_Hours 0x0032 057 057 000 Old_age Always - 31667 200 Multi_Zone_Error_Rate 0x0008 200 199 000 Old_age Offline - 109
ad8とad10が初期構築時から稼働しているHDDだが、ad8のエラー率が高いのが目立つ。これもういつ壊れてもおかしくなさそうだな。ad10もエラー数は1〜2桁低いけど稼働時間的には同じだから、もはやこの2台は寿命と考えたほうが良さそうかも。
で、今回の再構築中にエラー吐いたのはad4。smart上のエラー率はさらに低いけど、現にエラーを吐いたと言うことは何らかの前兆ではあるわけで、これ結局ad4,ad8,ad10全部(今回入れ換えたad6以外)「置き換えるべき」という結論になっちゃう?
さて、そうなると、いっそ3TB×4台で組み直してしまおうと言う案が現実的に。ZFSプールが健全であれば、現状(2TB×4台)のHDDを1台ずつ順に3TBに入れ換え、再構築、入れ換え、再構築と繰り返す手が使えるそうだが、今回はZFSプールが健全ではないのでたぶん無理。
となると、別途3TB×4のZFSプールを立ててデータ移行ということになるか。幸い、電源だけが死んでいる同筐体のサーバ(CPUは1ランク遅い)があるので、こちらの電源を復帰させて一時的に環境をミラーすれば、データ移行はネットワーク越しでいけそうかな。
ちなみにその予備機みたいなサーバ、実は元々は録画鯖はその旧機材で動いていて、これも2年くらい前に電源が壊れたときの抜け殻だったり。当初は電源だけ差し替えようと思ったんだけど予想以上に難儀しそうだったので、予備機として確保しておいた今の機材にHDD/SSDとPT2を繋ぎ替えたいきさつが。
まぁいずれにしろ、間違って開始してしまった再々構築が終わらないことには…orz。
(続く)