2014年9月上旬

2014年9月上旬 | 日記の目次へ


2014年9月9日(火) : 自宅鯖HDD交換(3/n) [PC]

(続き)

HDD交換の顛末の間に、現状の確認。かなり抜粋。

 yua# atacontrol list | egrep 'ad[0-9]+'
     Slave:   ad1 <INTEL SSDSA2M040G2GC/2CV102HD> SATA revision 2.x
     Master:  ad4 <WDC WD20EARX-00PASB0/51.0AB51> SATA revision 2.x
     Master:  ad6 <WDC WD20EZRX-00DC0B0/80.00A80> SATA revision 2.x
     Master:  ad8 <WDC WD20EARS-00MVWB0/51.0AB51> SATA revision 2.x
     Master: ad10 <WDC WD20EARS-00MVWB0/51.0AB51> SATA revision 2.x
 yua# smartctl -a /dev/ad4 | egrep '(Hours|Rate)'
   1 Raw_Read_Error_Rate     0x002f   200   200   051    Pre-fail  Always       -       0
   7 Seek_Error_Rate         0x002e   200   200   000    Old_age   Always       -       0
   9 Power_On_Hours          0x0032   064   064   000    Old_age   Always       -       26604
 200 Multi_Zone_Error_Rate   0x0008   200   200   000    Old_age   Offline      -       4
 yua# smartctl -a /dev/ad6 | egrep '(Hours|Rate)'
   1 Raw_Read_Error_Rate     0x002f   100   253   051    Pre-fail  Always       -       0
   7 Seek_Error_Rate         0x002e   200   200   000    Old_age   Always       -       0
   9 Power_On_Hours          0x0032   100   100   000    Old_age   Always       -       44
 200 Multi_Zone_Error_Rate   0x0008   100   253   000    Old_age   Offline      -       0
 yua# smartctl -a /dev/ad8 | egrep '(Hours|Rate)'
   1 Raw_Read_Error_Rate     0x002f   199   199   051    Pre-fail  Always       -       2822
   7 Seek_Error_Rate         0x002e   200   200   000    Old_age   Always       -       0
   9 Power_On_Hours          0x0032   057   057   000    Old_age   Always       -       31664
 200 Multi_Zone_Error_Rate   0x0008   192   183   000    Old_age   Offline      -       2332
 yua# smartctl -a /dev/ad10 | egrep '(Hours|Rate)'
   1 Raw_Read_Error_Rate     0x002f   200   200   051    Pre-fail  Always       -       63
   7 Seek_Error_Rate         0x002e   200   200   000    Old_age   Always       -       0
   9 Power_On_Hours          0x0032   057   057   000    Old_age   Always       -       31667
 200 Multi_Zone_Error_Rate   0x0008   200   199   000    Old_age   Offline      -       109

ad8とad10が初期構築時から稼働しているHDDだが、ad8のエラー率が高いのが目立つ。これもういつ壊れてもおかしくなさそうだな。ad10もエラー数は1〜2桁低いけど稼働時間的には同じだから、もはやこの2台は寿命と考えたほうが良さそうかも。
で、今回の再構築中にエラー吐いたのはad4。smart上のエラー率はさらに低いけど、現にエラーを吐いたと言うことは何らかの前兆ではあるわけで、これ結局ad4,ad8,ad10全部(今回入れ換えたad6以外)「置き換えるべき」という結論になっちゃう?

さて、そうなると、いっそ3TB×4台で組み直してしまおうと言う案が現実的に。ZFSプールが健全であれば、現状(2TB×4台)のHDDを1台ずつ順に3TBに入れ換え、再構築、入れ換え、再構築と繰り返す手が使えるそうだが、今回はZFSプールが健全ではないのでたぶん無理。
となると、別途3TB×4のZFSプールを立ててデータ移行ということになるか。幸い、電源だけが死んでいる同筐体のサーバ(CPUは1ランク遅い)があるので、こちらの電源を復帰させて一時的に環境をミラーすれば、データ移行はネットワーク越しでいけそうかな。
ちなみにその予備機みたいなサーバ、実は元々は録画鯖はその旧機材で動いていて、これも2年くらい前に電源が壊れたときの抜け殻だったり。当初は電源だけ差し替えようと思ったんだけど予想以上に難儀しそうだったので、予備機として確保しておいた今の機材にHDD/SSDとPT2を繋ぎ替えたいきさつが。

まぁいずれにしろ、間違って開始してしまった再々構築が終わらないことには…orz。

(続く)


2014年9月上旬 | 日記の目次へ

Tosy <tosy@wig.nu>