ども。
数日ブログを書いていないと各方面から安否確認の連絡が来てしまう担当ちゅんです。すみません、元気です。
某所で稼働しているとある重要なシステムがあるのですが、先日からエラーが出るようになり対応しました。
そのシステム、何か事が起きるとパトランプが点灯してピーピーと音まで出る仕様。エラーの内容はクラウド上にあるシステム(サーバ)とPC端末の間で一瞬通信が途切れることによるネットワークエラーのようなのですが、エラーの頻度は1日に数回。原因を見つけて、とにかくピーピー鳴らないようにしないといけません。
まず疑ったのは通信。サーバと端末間でのネットワーク断を疑って機器のログをチェックしました。しかし、ルータのログを見てもセッションが切れた形跡はありませんし、端末のイベントビューアでもそれらしいものは発見できず。システムの運用元に確認しても、サーバやシステムには特に問題は起きていないとのこと。ルータと端末との間にはハブなどの機器は挟んでおらず、この状態で通信不良が起こるとすればケーブルの不良かPC端末の不調のどちらかということになってきます。ひとまず可能性は低いですがケーブルの不良もあるかもしれないので予防交換し、様子を見ることに。
しかし、予想どおり結果は変わりません。ここで、本当にネットワークが途切れているのか白黒つけるために、端末にExPingを仕込もうと準備をしていたのですが、その作業を行っているときにどうも端末の動作がおかしい。タスクマネージャーでパフォーマンスを確認してみると、ディスクの使用率が100%で張り付いていました。もしかして、通信が断しているように見えたのはシステムのリソースが不足していることで動作そのものが不安定だったからではないか、とあたりをつけて急遽ディスクをSSDに変更し・・・。もうここまで来たら完全に業者の域です。
ひとまず、やれることはすべてやって再び「様子を見てください」と言い残して職場に戻りました。それまで使用率100%になっていたディスクが正常に戻ったのでこれで直ればいいんですが。現場の方からすれば、「情シスが来て何かやって様子を見ろと言い残して帰った」というだけの話なのですが、裏側ではこんなことをやっているんですよ~というつぶやきでした。ひとまず、もう業務用端末はHDDでは無理、最低限SSDが必要な時代になっているのは事実上間違いないようです。
こんな頻度でエラーが出ていては業務に支障を来して当たり前です
(投稿者:ちゅん)