こんにちは、えつみんです。
ある社員から、変な英文メールが届いた!と連絡が入りました。
最近スパムメールが頻繁に社内に届くので、それかなと思い、そのメールを転送してもらいました。「一人または複数の相手先に、送信できなかった」という文面。これはメールサーバーからのアラートメールでした。
送信できなかったメールは、生産管理システムから自動的に送られる通知メールでした。同時に10名ほどの宛先に送信されたものです。
今まで、あまり見なかった現象なので、早速メールサーバーの管理画面に入り、送受信履歴を調査するとともに、メールサーバー会社のサポートにも聞きました。
①《管理画面で分かったこと》
(現象)
・該当メール送信の前後に、何件かのメールが送信エラーとなっていた
(応急処置)
・未送信のメールを、改めて再送。管理画面から、メールを選んで再送する機能がありましたので、すぐに対応できました。
・未送信のユーザーに、送信エラーのことと、再送したことを連絡
②《サポートから得た情報》
・メールが同時にたくさん重なって、メールサーバで処理しきれなかったことが原因とのこと。対処法は、メール処理制限の設定値を無制限にするか、数字を増やしてくださいとのこと。ただし無制限にすると、予期せぬ大量メール攻撃が来た時に困るので、制限値を上げることにしました。
(対策)
「単位時間内宛先数」の設定値を50→100へ、「単位時間内送信許可数」の設定値を100→150へ変更し、様子を見ることにしました。
③《根本原因は?》
そういえば、二ヶ月前にメールサーバーの入れ替えがあったことを思い出しました。今回サーバーと、アプリが大きく変わり、セキュリティ機能がかなり強化されていました。そこに変化点があり、今回の障害のトリガーとなったと思われます。
④《教訓》
・すぐに、事象を自分の目で確認せよ❗️
・トラブルが発生したときは最近の変化点を探せ❗️
今回はメール送信エラーの中身、送信ログをすぐに確認して対応できました。
まとめ
発生後、二週間経ちますが、送信エラーは発生していません。トラブル発生時は、すぐに事象を確認して、変化点を探ることが、早い解決につながります。たとえばハード、ソフトが変わった、担当者が変わったなどは要注意です。今回のように、変化点の後、しばらく経ってから異常が発生することもあるので、要注意です。