SSDの故障頻発

ども。
ついに我が子が「サンタの正体」に気がついたようで、それはそれで少し寂しさを感じている担当ちゅんです。

今年の春に10台ほどPCを調達しました。今後の調達を見越しての試験導入的な意味合いもあり、サイズは13.3インチのモバイルノートで、CPUはi5、メモリ8GB、SSDはM.2の256GBと、ようやく職場でも普通のスペックのPCが使えるようになりました。今までの端末はi3、4GB、HDDでしたので雲泥の差です。

ですが、導入から1年も経たないうちに、4台のPCでSSDが壊れてしまい困っています。症状としては「前の日まで問題なく利用できていたのに、翌日朝に端末を起動しようとしたらディスクが認識しない」という状態。つまり、デバイスが完全に故障した状態です。PC固有の問題も疑い、外付けUSBケースを用意して別な端末にも接続してみましたが、やはりデバイスとして認識できないようで、完全に故障しているようです。

SSDって結局のところ消耗品で、使えば使うほど寿命は短くなっていくものです。この指標としてはTBW(Terra Byte Written)という「この数値で示すバイト数までは書き込める」というものがあるのですが、今回トラブルが起きたSSDに関してはメーカーのウェブサイトを見ても非公表であり、さらに「本製品はNAS、RAID、NVR等のコンシューマ製品以外のご使用には対応しておりません」とあるので、普通に使えるけどそこまで耐久性に優れた製品ではないということはわかります。

そうだとしても、こんなに短期間で10枚中4枚ものSSDが故障するという状況は耐久性云々という話ではなく、普通に「初期不良」ですよね。このSSDにはメーカーによる3年間の保証が付帯されているので故障する都度別なSSDと交換の対応が受けられているのですが、故障=業務が止まってしまうということでもあり、現状で動作している6枚のSSDについても故障する前に何らか手を打たないといけないかなと思っています。

SSDロットによる当たり外れっていうやつでしょうか・・・

(投稿者:ちゅん)

カテゴリー: つぶやき | 1件のコメント

安定性

てんちょです。一気に雪が降ったので大型車が巻き上げる雪で道路がホワイトアウト状態でした。路面状況も悪そうなので気を付けて帰ります。

先日カギを忘れて作業ができなかったある場所の「降雪監視カメラ」、先週末にようやく片付きました。暗く寒い中で脚立を設置しての作業ですが、あまりの寒さに数分の作業でも気持ち的に折れそうになっていました。設置する場所の問題のせいか、脚立が不安定なのも要因ですね。しかし実は前回から別部署で所有している「2連はしご」を借りることができ、作業効率が格段にあがりました。安定性がまったく違う…。

で、このカメラですがなぜか通信速度が遅く、画像の表示までかなりの時間がかかる上に、静止画のような表示になってしまい全く使い物にならない状況です。
原因として考えられるのは、LTEモデム、ルータ、カメラの機器故障。あと寒さ。特に設置から年数の経過しているカメラ本体は、EdgeからのアクセスではIEモードでも設定画面に入ることができず、アップデートしていないWindows10端末のIEを使用してどうにか設定が確認できたような状況。その他機器の故障だった場合は一式外して持って帰ってくる覚悟でいました。

現場に向かう車内でちゅん氏と手順を再確認しつつ現地に到着。早速借りた2連はしごを設置して登ります。実は脚立の高さでも苦手でしたが、もう慣れましたね。今回は忘れずに持ってきたカギを使用して、まずはボックス内のブレーカーをオフにして機器の再起動。はしごで安定したとはいえ機器類を外すのは大変なので、これで解決してくれたらいいなぁと思いながらカメラを確認してみたところ、あっさりと動作してくれました!

1週間のかなりの時間をこのカメラに費やしましたが、これでようやく解決。しかしまた別のカメラ案件が発生しており、先週はなんだかネットワークカメラに呪われているかのような1週間でしたね…。年末年始に止まらないことを祈ります。


週末にかなり降ったので、真っ白。間に合ってよかったです。

(投稿者:てんちょ)

カテゴリー: つぶやき | コメントする

現場作業はなるべく最小限に

ども。
今年も残すところ半月です。頑張りましょう!担当ちゅんです。

言い換えれば12月もすでに半分が経過したということですよね。早いものです。にも関わらず、1日から運用を開始している降雪監視カメラの調子がどうも思わしくなく、これまで何度も現地に足を運んでは調整の繰り返しをしていました。1か所改善すると別な個所に不具合を生じる有様で、もしかしたらカメラの設置から年数も経過していて、設備的にはそろそろ更新が必要な状況になっているのかもしれません(ちょっと考えたくはありませんが)。

そんな状況ですが、この季節は企業さんの年末ご挨拶等もあって日中は来客対応が多くなっています。どうしても外に出られる時間は夕方になりがちで、16時30分には真っ暗になってしまう中で、夜な夜な山奥に向かうのは精神的にキツい業務です。
現地に到着しても、風が強くて雪もチラつき、数分外にいるだけで体の芯まで冷え切ってしまって、定期的に車中で暖を取らなければ本気で身の危険を感じるレベル。機器の不調の原因がはっきりわからないうえに「暗い」「寒い」という条件では、我々の心などあっという間に折れてしまい「今日はもうやめよう」としょんぼり帰路につく、そんな感じです。

ですが、今日はずっと不調だったカメラ1か所を正常に戻すことができました。いつもは現地に行ってからアレコレ考えて作業していましたが、効率が悪いので職場に設備を持ち帰ってじっくりと設定。やはり暖かくて安全かつ明るい職場は効率が段違いです。やりたかったことがスムーズに行えて、現地では機器を取り付けるだけで無事に動作確認完了。初めからこうしておけばよかったんですが、やはり現地に行くと「この場で片づけてしまいたい」という思いが先に立ってしまいます。

ここの部署で仕事をするようになり、師匠であるかつての上司92氏がよく言っていた「現場に行くときは頭の中で仕事が終わっている状態にせよ」という教えを思い出し、いくら忙しかろうが焦っていようが、やはり基本には忠実に、現場作業はなるべく最小限にすることが鉄則だなと再認識しました。

設定中の様子ルータのポート開放を現地でやろうとしたのがそもそもの間違いでした

(投稿者:ちゅん)

カテゴリー: つぶやき | コメントする

持ち物は確認しましょう。

てんちょです。12月も中旬に突入して今年も残り少なくなってきました。年内の目標は机の上を片付けることです。

先日設置を行った「降雪監視カメラ」。設置後から天候が良くカメラの出番はなさそうでしたが、設置を行った2ヵ所のカメラが接続に時間がかかったり、接続できなかったりと少し不安定な状況になっていました。

契約しているSIMは7GBのため、通信量節約のためと思いますがルータ側で着信設定がされているようです。ビューワーからアクセスがあったときに自動接続される設定のようでした。接続に時間がかかるのはこの設定だろうということで、まずは設定を変更してみることになりました。さらにモデムの保温用につけているペットボトルウォーマーも接続が不安定な要因になっていそうなので、とりあえず外して様子をみることに。

ということで早速、先週末に設定に行ってきました。早い時間から行く予定が、別件が入るなどで16時過ぎから現地に向かいました。しかしもうこの時期になると日没も早く、現地に着いたころにはもう薄暗くなっています。念のためにと持って行ったライトも使いながら脚立に登りLANケーブルを接続し、車内からちゅん氏が設定変更しつつ、ペットボトルウォーマーを外して作業完了。スマホからカメラを開いてみると、不安定さは解消されたようです。あとは通信量がどの程度になるのか確認が必要ですね。

そして昨日、残りの1か所へ。作業内容は先週と同様です。別件の外勤を済ませて現地に向かいました。またしても日没時間帯での作業になり周囲が暗い中で脚立を立てて、さぁ登るぞ!というところでカギを忘れたことに気づきました…。足場も悪い中で苦労して脚立を運び入れた苦労が…。持ち物の確認はしっかりやらないとですね。


脚立に登るのは慣れましたが高いところは苦手。

(投稿者:てんちょ)

カテゴリー: つぶやき | 2件のコメント

謎のエラーとの格闘録

ども。
数日ブログを書いていないと各方面から安否確認の連絡が来てしまう担当ちゅんです。すみません、元気です。

某所で稼働しているとある重要なシステムがあるのですが、先日からエラーが出るようになり対応しました。
そのシステム、何か事が起きるとパトランプが点灯してピーピーと音まで出る仕様。エラーの内容はクラウド上にあるシステム(サーバ)とPC端末の間で一瞬通信が途切れることによるネットワークエラーのようなのですが、エラーの頻度は1日に数回。原因を見つけて、とにかくピーピー鳴らないようにしないといけません。

まず疑ったのは通信。サーバと端末間でのネットワーク断を疑って機器のログをチェックしました。しかし、ルータのログを見てもセッションが切れた形跡はありませんし、端末のイベントビューアでもそれらしいものは発見できず。システムの運用元に確認しても、サーバやシステムには特に問題は起きていないとのこと。ルータと端末との間にはハブなどの機器は挟んでおらず、この状態で通信不良が起こるとすればケーブルの不良かPC端末の不調のどちらかということになってきます。ひとまず可能性は低いですがケーブルの不良もあるかもしれないので予防交換し、様子を見ることに。

しかし、予想どおり結果は変わりません。ここで、本当にネットワークが途切れているのか白黒つけるために、端末にExPingを仕込もうと準備をしていたのですが、その作業を行っているときにどうも端末の動作がおかしい。タスクマネージャーでパフォーマンスを確認してみると、ディスクの使用率が100%で張り付いていました。もしかして、通信が断しているように見えたのはシステムのリソースが不足していることで動作そのものが不安定だったからではないか、とあたりをつけて急遽ディスクをSSDに変更し・・・。もうここまで来たら完全に業者の域です。

ひとまず、やれることはすべてやって再び「様子を見てください」と言い残して職場に戻りました。それまで使用率100%になっていたディスクが正常に戻ったのでこれで直ればいいんですが。現場の方からすれば、「情シスが来て何かやって様子を見ろと言い残して帰った」というだけの話なのですが、裏側ではこんなことをやっているんですよ~というつぶやきでした。ひとまず、もう業務用端末はHDDでは無理、最低限SSDが必要な時代になっているのは事実上間違いないようです。

エラーの状況こんな頻度でエラーが出ていては業務に支障を来して当たり前です

(投稿者:ちゅん)

カテゴリー: つぶやき | 3件のコメント