ども。
今週一週間がやけに長く感じられる担当ちゅんです。
昨年から引き続きの「未解決案件」がありました。とある学校でのネットワーク不具合なのですが、症状としては不定期に通信断が発生するというものでした。解決を困難にした要因はこの「学校」「不定期」というキーワード。いつ障害が発生するのかが読めず、連絡が来ていざ学校に向かっても到着までに直ってしまうといったことも多々ありました。
そこで、昨年末からはExPingを使って通信を常時監視していました。年が明けてもなかなか症状が出ずにヤキモキしていたのですが、ついに昨日、同僚オールド氏が「症状出ました!」と声を上げ、監視PCの画面を見るとNGと表示されたPing結果がずらり。急ぎ車に飛び乗って学校まで出かけてみるも、なんと職員が不在で施錠されており入校不可・・・。ほんと、こういう時に限ってことごとく運の無い人間です。
次に症状が出るのはいつになるだろう・・・と思ったのですが、本日、また再発。今度は学校にも連絡がつき、おかしな話ですが「直るな、直るな」と願いながら現場に向かいました。到着後、さっそく障害の原因を探り始めましたが、なかなか原因の特定ができません。学校側のネットワーク構成は極めてシンプルなのですが、実はその学校はVPN接続で別な施設を基地局とした通信をしており、そちらとの疎通確認に手間取ります。色々なパターンを試しますが、どれもヒットしません。「これはもしかして学校側の問題ではなく、基地局側の問題ではないか」と仮説を立てるまでに2時間も要してしまいました。
結果、今回のネットワーク不具合は基地局側のHUBが故障していたことが原因であることをようやく突き止めました。結局のところ、不具合が発生したタイミングでいかに色々なパターンを試せるか、そして原因の箇所を絞り込んでいけるかというのがポイントだったと思います。こういう言い方をしてはなんですが、故障したならば故障したで完全に止まってしまった方がありがたいです。中途半端に頑張られると、故障なのか何なのかの判断がすごく難しくなります。特にHUBはそういう傾向にありますよね。
故障したHUB。たまに通信できなくなるという困った症状でした。
(投稿者:ちゅん)