ども。
私は年内最後の投稿です。今年1年お世話になりました。担当ちゅんです。
秋口からずっと苦戦が続いているとあるシステムがあります。このシステムはもともと今年度更新を予定していたもので、当初の計画では新たに物理サーバを用意したうえで旧サーバからデータ移行する、いわゆる「リプレイス」と呼ばれるもの。今思えば、当初の計画どおりにやれば特に問題は起こらなかったかもしれないのですが、つい欲を出して「仮想基盤としてHCIを導入したので、できればその上にシステム構築してほしい」とリクエストしたところから苦戦が始まりました。
とはいえ、その選択自体は正しかったと今でも確信はしているんです。せっかく仮想基盤があるのだから、バックアップなどの面から集中管理できることは効率的ですし、物理サーバとシステムを別管理とすることで、どちらか一方の更新サイクルに引っ張られることがなくなります。例えば、サーバが古くなったのでシステムごと更新する、またはシステムを更新したらサーバOSが合わなくなった、といった一蓮托生的な悩みから解放されます。
そんなメリットしかないような夢の構成なのですが、いざシステムを稼働させてみると職員から「動きが遅い」という苦情が・・・。一般的に、システムの動きが遅いとなればサーバのリソース不足か、システムそのものの不具合か、もしくはネットワークの輻輳か・・・といった原因が複数頭に浮かんでくるのですが、今回に関してはシステム構築業者さんに無理を言って「HCIでお願いしたい、リスクは許容するから」って言った手前、こうなったのは我々にも一定の責任はあるわけで、さあどうする?っていうのが今です。
そして今日、業者さんから「システム的に潰せるところは潰したつもりですが、それでも解決に至らない」と連絡を受け、最後の手段「リソース追加」に踏み切りました。仮想基盤を運用していて最も効果を発揮する場面。これまで割り当てていたCPUのコア数やメモリ容量などの割り当て変更が自由自在(もちろん物理容量の範囲内)です。今回は「動きが遅い」という原因を探るため、あえて極端に「CPUのコア数は2倍、メモリの容量は4倍」と大幅に割り当てを増やしました。これで解決するようであれば原因はリソース、解決しないようであればそれ以外の何か、ということになってきます。
いよいよ、こちらも打てる対策が少なくなってきましたが、この答えは「越年」となってしまいそうです。最近は特に、自分の理解している知識では解決できないような案件が多くて、苦労と綱渡りの連続です。来年は穏やかな年になればいいな・・・と願いを込め、私の本年の投稿を締めくくりたいと思います。
少し気が早いですが、よいお年をお迎えください。
(投稿者:ちゅん)