2021-07-17

予備は、たまに動かそう

夏が来ました。
先ほど少し用事があって屋外に出たのですが、暑すぎてすぐに屋内に戻ってきました。
これはちょっと危険な温度です。
今年の夏は他にも危なっかしい要素が幾つかあるので、できるだけ引きこもりの生活をしようと思っています。

さて、少し前の話になるのですが、残念なニュースがありました。
去年発生した、とあるシステム障害の調査結果ですが、内容が杜撰すぎるものでした。

なんでも、システムが止まったときに備えて用意していた予備に切り替えようとしたところ、切り替えができずに長時間の稼働停止につながったそうなのですが、どうやらシステムが動き始めた当初から「切り替えても動かない状態だった」にも関わらず、それを確認もせず、何年も放置していたらしいのです。

この問題は、2つの重大なミスがあると思います。

本当に動くかは、動かしてみないと分からない

一つ目は、予備を動かしてもいなかった点です。

ITシステムは案外細やかなバランスで動作しているので、動き始めの時はもちろん、何か設定を変更したときにも必ず、一度は動かしてみるものです。

ところが、最初に動かす前の時点で、何も試していなかったそうです。

実生活で例えるなら、ネット通販で品物を買ったまま箱の中にしまっていて、何年後かに箱を開けたら不良品だったと言っているようなものです。
おそらくそれで不平を言っている人がいたら、「その前に届いた時に箱開けろよ」とツッコミが入るのではないでしょうか?

定期点検は大切です

もう一つは、定期点検を行っていなかったことです。

コンピュータとはいえ、経年劣化で傷んでしまう部品が少なからず使われています。
たとえ最初の段階で動いていたとしても、しばらくすると何らかの理由で動作しなくなることは可能性としてあり得ます。

その可能性も考慮して、時々定期点検を行っていれば、少なくともその段階で気づいていたはずです。長い間問題が隠れていたということは、定期点検は実施されていなかったということです。

これも実生活に例えると、ビルなどの大きな建物で火災報知器の定期点検を行っていなかったという状況に似ているかと思います。
本当に火災などが発生してしまえば、管理者の人は警察に捕まってもおかしくないくらいの騒ぎになるはずです。
でも、今の日本のIT業界と呼ばれる場所は、それすらまかり通ってしまう危うい面があります。

切り替えは一瞬、ならば・・・

更にITシステムの場合は、基本的に「予備への切り替えは一瞬」です。
ならば、毎日とは言わずとも、週一回の頻度でも切り替えてみればいいのではないでしょうか?
それくらい備えがあれば、稀に故障が見つかったとして、替わりの調達など余裕をもって対応ができます。

他国のIT企業などでは、もっとシビアな方法でシステム動作を維持しているケースもあります。
なんでも、会社の中に「システムを突然遮断する権限」を持っている人がいて、予告無しにアクセスできなくするそうです。
これを日本のIT系の人に話すと、「やりすぎじゃない?」と否定的な見解を述べる人が多いのですが、
・予備に切り替わるのであれば問題はない。むしろ予備が動くことが確認できる
・仮に予備が動かなくても、遮断したシステムはその時点では動いているので、まずいと思ったらすぐに元に戻せる
という視点から、とても合理的だと思います。

別の闇

こうやって並べてみると改めて杜撰な出来事ですが、個人的にもっと悲しい点は、このシステムは300億円で発注されたものであるということです・・・
最近、ちょくちょく問題視されるようになってきましたが、何十億・何百億円というシステムを作っても、中身がボロボロなんてことは、少なくとも日本ではしょっちゅう起きています。

それは日本のIT業界の始祖が「転売業」だったという歴史に起因する部分もあるのですが、もうそろそろ止めにしませんか、と常々思っています。

とりあえず、このシステム屋本当に大丈夫かな? と思ったら、
・予備はあるよね?
・予備は動くよね? なら今ここで動かしてみて
と言うくらいの自衛策は取ったほうがいいのかもしれません。

0 件のコメント: