ども。
職場のクールビズ開始の号令にあわせて上着を脱いだ担当ちゅんです。
今回の記事は長くなるので、計2回に分けて投稿します(今日は上下巻の上ですね)。
先日から頭を悩ませていたのが、町内小中学校の集中管理ファイルサーバのバックアップ問題です。基本的に全学校の校務用データを16TBのWindows Storage Server に集約して管理しているのですが、このサーバのバックアップに時間がかかり、丸一日近くバックアップし続けても終わらないという状況になってしまいました。
でも、状況としては十分ありえる話です。仮に1Gbpsの速度をフルに使って転送したとして、
1024Mbps ÷ 8 = 128MB/s
ということで、1秒間に128MBしか転送できないということになります。1分だと60倍して7.7GB、1時間だとさらに60倍して460GB。2時間かかっても1TBの転送すらできないのです。無圧縮で16TBを転送しようとすると35時間かかってしまう計算です。しかもこれはあくまでNICの通信速度から計算した「理論値」で、実際にはディスク速度なども影響して1Gbpsなど出ませんから、もっと時間がかかるということになります。
さて、どうしたものでしょう。とりあえず、日々のバックアップは「差分バックアップ」とし、専用のソフトウェアを使って圧縮転送していますが、夜の10時から翌朝7時までの9時間でなんとか終わらせたいところ。それを前述のように計算してみると、
9時間 × 460GB = 4TB
・・・って、あれ?4TBものデータを転送できる計算になります。何かおかしい。差分ファイルが4TBになるなど考えられませんし、まして丸一日たっても終わらないなどありえません。
ふと、バックアップ稼働中のサーバのタスクマネージャからパフォーマンスを確認してみました。すると、理由はわかりませんが、リミッターがかかったかの如く、通信速度が99.6Mbpsでビタッと天井に張り付いています。1GbpsのNICなので、少なくとも100Mbps以上、理想では200~300Mbps程度で通信していなければならないのに、これは明らかに異常。何かがボトルネックになって100Mbpsに速度が落ちているのでは!?
こうした推測のもと、いよいよ原因究明に乗り出したのでした・・・次回に続く。
速度が遅いときは、冷静に計算してみると色々わかってきます。
(投稿者:ちゅん)