サラリーマン雑学@えつみん

サラリーマンに役立つ「お金とIT」の雑学です

会社で計画停電がありサーバを停止した話

こんにちは、えつみんです。今日は計画停電でサーバを停止した話をします。

先日の土曜日に、会社で電気設備の点検があって二時間ほど停電しました。パソコンやサーバは、いきなり電源が落ちると壊れることがありますので、事前に停止(=シャットダウン)が必要です。

 

1、パソコンとプリンタの電源オフ

会社内のパソコンとプリンタは約100台あります。「前日の帰宅時に、各自のパソコンは必ず電源を落としてください」と社員に通知しました。しかし、当日念のため見て回ると、不在の方のパソコンや、共有パソコン、プリンタなど5台ほど電源がついたままでした(T . T)、、仕方なく私の方で電源オフしました。

 

2、サーバの停止

各サーバはUPS(無停電電源装置※1)から電源供給しています。10〜20分程度の停電なら大丈夫ですが、二時間の停電には耐えられません。

そこで、サーバ室にある10台のサーバを順番にシャットダウンしていきました。

※1 UPSとは、雷などによる電圧低下や停電があっても、安定的に電源供給できるバッテリーのことです。容量とつなぐサーバの負荷によって持つ時間は変わります。停電が発生すると、自動的にサーバへ信号を出してシャットダウンしてくれます。

f:id:etsumin:20230409191109j:image

3、サーバとUPSの起動

電気の点検が終わり復電したので、サーバを起動します。UPSの電源を入れれば、自動的にサーバの電源が入るしくみになっています。

ここでトラブル発生❗️

あるサーバのUPSが、ピーというアラームが鳴りっぱなしで、そのUPSにつながるサーバの電源が入りません。UPSの電源ケーブルを抜いてもアラームは消えません。UPSの操作ボタンも効きません。焦りましたが、気をとりなおして暫定対策を行います。

①サーバの電源ケーブルを、他のUPSにつなぎ変え

②サーバを起動

③サーバのサポート窓口へ連絡。後日修理対応を手配

 

✳︎3日後にUPSを交換し復旧しました。UPS本体の故障と判断され、新しいUPSと取り替え。残念ながら、バッテリーは古いモノをそのまま流用となりましたが。(2023/4/15追記)

 

4、サーバの動作確認

最後に、各サーバのアプリが問題なく動作しているか確認しました。

 

ツボ1️⃣ サーバ停止は事前確認が大事

今回、停電の2週間前に、各サーバのメーカーサポートへ連絡を入れました。サーバの停止・起動の手順や注意点がないか確認。万一トラブルが起きた時の迅速な対応をお願いしました。サーバ以外には、エレベータ監視会社やセキュリティ監視会社へも連絡。

 

ツボ2️⃣  停電時の対応手順書を見直し

サーバの停止・起動の機会は、そんなにありません。前回の計画停電は二年前でしたので、その後サーバの入れ替えもあり、やり方が変わったりしています。この機会に手順書をだいぶ見直しました。他の担当者でもできるよう、ノウハウをまとめておきましょう。

 

まとめ

サーバは24時間365日動いて当たり前の世界ですので、停止する機会は滅多にありません。でも万一のトラブルに備えて、手順書の整備をしておく、定期的に実地訓練をする、ことがとても大事だと思います。『備えあれば憂いなし』