今回は実験として、EC2のCPU使用率が90%を越えた場合、自動修復アクションにより、再起動されるように設定してみます。
アラームと自動修復アクションの設定
対象EC2の「モニタリングとトラブルシューティング」->CloudWatchアラームの管理より設定画面に入ります。 今回はCPU使用率90%が2回連続検出された場合(=10分継続した場合)再起動が実行されるように設定します。 通知は作成しませんでした。


テスト
EC2に負荷をかけます。 yesコマンド連打では大して負荷が上がらなかったので、opennsslコマンドを利用して負荷をかけました。
openssl speed -multi `grep processor /proc/cpuinfo|wc -l`
こちらのサイトを参考にしました。
Linuxで手軽にCPU/メモリの負荷をかける方法 #Linuxコマンド - Qiita
CloudWatchアラームからアラームの状態を観察します。

アラーム状態になってから再起動が発生し一気に負荷が減りました。