こんにちは、えつみんです。今日は計画停電でサーバを停止した話をします。
先日の土曜日に、会社で電気設備の点検があって二時間ほど停電しました。パソコンやサーバは、いきなり電源が落ちると壊れることがありますので、事前に停止(=シャットダウン)が必要です。
1、パソコンとプリンタの電源オフ
会社内のパソコンとプリンタは約100台あります。「前日の帰宅時に、各自のパソコンは必ず電源を落としてください」と社員に通知しました。しかし、当日念のため見て回ると、不在の方のパソコンや、共有パソコン、プリンタなど5台ほど電源がついたままでした(T . T)、、仕方なく私の方で電源オフしました。
2、サーバの停止
各サーバはUPS(無停電電源装置※1)から電源供給しています。10〜20分程度の停電なら大丈夫ですが、二時間の停電には耐えられません。
そこで、サーバ室にある10台のサーバを順番にシャットダウンしていきました。
※1 UPSとは、雷などによる電圧低下や停電があっても、安定的に電源供給できるバッテリーのことです。容量とつなぐサーバの負荷によって持つ時間は変わります。停電が発生すると、自動的にサーバへ信号を出してシャットダウンしてくれます。
3、サーバとUPSの起動
電気の点検が終わり復電したので、サーバを起動します。UPSの電源を入れれば、自動的にサーバの電源が入るしくみになっています。
ここでトラブル発生❗️
あるサーバのUPSが、ピーというアラームが鳴りっぱなしで、そのUPSにつながるサーバの電源が入りません。UPSの電源ケーブルを抜いてもアラームは消えません。UPSの操作ボタンも効きません。焦りましたが、気をとりなおして暫定対策を行います。
①サーバの電源ケーブルを、他のUPSにつなぎ変え
②サーバを起動
③サーバのサポート窓口へ連絡。後日修理対応を手配
✳︎3日後にUPSを交換し復旧しました。UPS本体の故障と判断され、新しいUPSと取り替え。残念ながら、バッテリーは古いモノをそのまま流用となりましたが。(2023/4/15追記)
4、サーバの動作確認
最後に、各サーバのアプリが問題なく動作しているか確認しました。
ツボ1️⃣ サーバ停止は事前確認が大事
今回、停電の2週間前に、各サーバのメーカーサポートへ連絡を入れました。サーバの停止・起動の手順や注意点がないか確認。万一トラブルが起きた時の迅速な対応をお願いしました。サーバ以外には、エレベータ監視会社やセキュリティ監視会社へも連絡。
ツボ2️⃣ 停電時の対応手順書を見直し
サーバの停止・起動の機会は、そんなにありません。前回の計画停電は二年前でしたので、その後サーバの入れ替えもあり、やり方が変わったりしています。この機会に手順書をだいぶ見直しました。他の担当者でもできるよう、ノウハウをまとめておきましょう。
まとめ
サーバは24時間365日動いて当たり前の世界ですので、停止する機会は滅多にありません。でも万一のトラブルに備えて、手順書の整備をしておく、定期的に実地訓練をする、ことがとても大事だと思います。『備えあれば憂いなし』