たぶん動く...

多分GIS系の人。あくまで個人的見解であり、所属団体を代表するものではありません。

EC2自動修復アクションを試す

今回は実験として、EC2のCPU使用率が90%を越えた場合、自動修復アクションにより、再起動されるように設定してみます。

アラームと自動修復アクションの設定

対象EC2の「モニタリングとトラブルシューティング」->CloudWatchアラームの管理より設定画面に入ります。 今回はCPU使用率90%が2回連続検出された場合(=10分継続した場合)再起動が実行されるように設定します。 通知は作成しませんでした。

テスト

EC2に負荷をかけます。 yesコマンド連打では大して負荷が上がらなかったので、opennsslコマンドを利用して負荷をかけました。

openssl speed -multi `grep processor /proc/cpuinfo|wc -l`

こちらのサイトを参考にしました。

Linuxで手軽にCPU/メモリの負荷をかける方法 #Linuxコマンド - Qiita

CloudWatchアラームからアラームの状態を観察します。

アラーム状態になってから再起動が発生し一気に負荷が減りました。