ども。
休日にボーリングをしたところ、腰痛が再発ぎみの担当ちゅんです。
9月6日未明に発生した北海道胆振東部地震による大停電により、非常用電源設備に接続されていたなかった機器が、相当数不調となってしまいました。中でもトラブルが多いのは「ストレージ」で、データの可用性を確保するための「RAID」が足を引っ張る皮肉な状態です。
RAIDというのは、複数の物理ディスクを1つのディスクに見立てて運用を行う技術です。この「見立てて」というところにいくつか手法があり、例えば2台のディスクに分散してデータを書き込むことによって書き込み速度を向上させる「ストライピング」や、2台のディスクに同じデータを書き込むことによって1台のディスクが故障しても運用が可能な「ミラーリング」など、その時々によって最適なものを選択して利用します。
我々が主に利用していたのはRAID1「ミラーリング」なのですが、通常の運用では、万が一のときデータ消失を免れるという保険的な利用の仕方ができます。ただ、今回のように突然電源が断たれるような状況にはめっぽう弱く、ハードウェア的には問題がなくても、ソフトウェア的に「論理障害」という状態になってデータの読み書きが不能になってしまったりと、むしろ「RAIDでなければ問題なかった」ともいえるような案件ばかりを複数抱えてしまう結果となりました。
結局のところ、RAIDは停電に弱いということをあらかじめ理解したうえで、そこに対しては無停電電源装置(UPS)を接続しておくなどの対策を行うことが模範回答かと思います。しかし、現場ではそうもいかない場面が多いのです。
確かにUPSが接続されていれば、停電の際に安全にシャットダウンを実行できます。しかし、UPSの内蔵バッテリーは通常3年程度で劣化してしまい、その都度交換が必要です。バッテリーの価格は物にもよりますが安価なNASの値段よりも高額なんてことも。なので、色々な場所で気軽に導入していくと後々ランニングコストに泣きを見ます。
ただ、こういう災害が発生したとき「UPSがあってよかった」となるのも事実であり、これが本当に悩ましいところです。最終的には「災害への備えとして掛け捨ての保険にいくら入っておくか」という考え方に近いのだと思います。今後、十分な論議が必要です。また、「RAIDにはUPSを接続しておく」と書いたものの、むしろここにきて「UPSが無い場所ではRAIDを使わない」というのも一考、というか実は大正解なのではないかと思い始めました。シングルのディスクを別なディスクに定期的にバックアップしておくことの方が、逆に安全ということもあるような気がしています。
NAS専用の交換ディスク。通称「赤ラベル」。
(投稿者:ちゅん)