謎のエラーとの格闘録

ども。
数日ブログを書いていないと各方面から安否確認の連絡が来てしまう担当ちゅんです。すみません、元気です。

某所で稼働しているとある重要なシステムがあるのですが、先日からエラーが出るようになり対応しました。
そのシステム、何か事が起きるとパトランプが点灯してピーピーと音まで出る仕様。エラーの内容はクラウド上にあるシステム(サーバ)とPC端末の間で一瞬通信が途切れることによるネットワークエラーのようなのですが、エラーの頻度は1日に数回。原因を見つけて、とにかくピーピー鳴らないようにしないといけません。

まず疑ったのは通信。サーバと端末間でのネットワーク断を疑って機器のログをチェックしました。しかし、ルータのログを見てもセッションが切れた形跡はありませんし、端末のイベントビューアでもそれらしいものは発見できず。システムの運用元に確認しても、サーバやシステムには特に問題は起きていないとのこと。ルータと端末との間にはハブなどの機器は挟んでおらず、この状態で通信不良が起こるとすればケーブルの不良かPC端末の不調のどちらかということになってきます。ひとまず可能性は低いですがケーブルの不良もあるかもしれないので予防交換し、様子を見ることに。

しかし、予想どおり結果は変わりません。ここで、本当にネットワークが途切れているのか白黒つけるために、端末にExPingを仕込もうと準備をしていたのですが、その作業を行っているときにどうも端末の動作がおかしい。タスクマネージャーでパフォーマンスを確認してみると、ディスクの使用率が100%で張り付いていました。もしかして、通信が断しているように見えたのはシステムのリソースが不足していることで動作そのものが不安定だったからではないか、とあたりをつけて急遽ディスクをSSDに変更し・・・。もうここまで来たら完全に業者の域です。

ひとまず、やれることはすべてやって再び「様子を見てください」と言い残して職場に戻りました。それまで使用率100%になっていたディスクが正常に戻ったのでこれで直ればいいんですが。現場の方からすれば、「情シスが来て何かやって様子を見ろと言い残して帰った」というだけの話なのですが、裏側ではこんなことをやっているんですよ~というつぶやきでした。ひとまず、もう業務用端末はHDDでは無理、最低限SSDが必要な時代になっているのは事実上間違いないようです。

エラーの状況こんな頻度でエラーが出ていては業務に支障を来して当たり前です

(投稿者:ちゅん)


カテゴリー: つぶやき パーマリンク

コメント

  1. とむ のコメント:

    お疲れ様です。

    ディスクが100%に貼りついている場合は
    ・ページファイルが壊れている
    ・メモリ不足でページングが多発している
    ・ファイルシステムが破損している
    ・Windows Update中
    などですかね(全部体験済み(´・ω・`))

  2. 元ブ社のN のコメント:

    お疲れ様です。
    「ディスク使用率が100%」状態が続くのは、もう一つディスク上がひどいフラグメント状態になっている可能性も考えられますね。仮想記憶に使うディスク領域も、鬼のようにフラグメントしているかも。。。
    HDDのようにシーク都度物理的ヘッド移動が発生する媒体だと、シーク時間だけでも馬鹿にならないかもしれません。
    そうそう時間をかけてデフラグもしていられませんし、SSD化が正解でしょうが、それも工数と予算が。。。お察し申し上げます。

  3. 関西の自治体職員 のコメント:

    分かります。普通の端末でも、とあるソフトの挙動が不安定で調査していたところ、同じようにSSD又はHDDでもいいけど他に常駐ソフトが無くて快適な速度が出るなら問題ないという事象に出くわしました。新しいソフトやサービスは、それがサービス開始された時点で普通に使われているものが基準となり、端末を当時のスペック・状態で長く使い続けるのはユーザの勝手だよという圧をしばしば感じます。。。

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です