【AWS】EBSが壊れた

AWS logo
怖かったです。



仕事で使っているアカウントへAWSから連絡。


Dear Amazon Web Services Customer,

Your volume experienced a failure due to multiple component failures and we were unable to recover it. Although EBS volumes are designed for reliability, including being backed by multiple physical drives, we are still exposed to durability risks when multiple concurrent component failures occur before we are able to restore redundancy. We publish our durability expectations on the EBS detail page here (http://aws.amazon.com/ebs/details).


Account Number: **********

Region: ap-northeast-1

Impacted Resource Identifier: vol-***************


You may use the following instructions to restore your data from a volume snapshot. http://docs.aws.amazon.com/AWSEC2/latest/UserGuide/ebs-restoring-volume.html

We apologize for the inconvenience this may have caused you. If you have any further questions or comments regarding this matter, please contact us at: http://aws.amazon.com/support.

Sincerely,
Amazon Customer Support

Amazon Web Services, Inc. is a subsidiary of Amazon.com, Inc. Amazon.com is a registered trademark of Amazon.com, Inc. This message was produced and distributed by Amazon Web Services Inc., 410 Terry Ave. North, Seattle, WA 98109-5210



簡単にいうと、EBSが壊れて自動復旧出来ないので、手動でリストアしてくださいということ。主要インスタンスについてはもちろん定期的にスナップショットを作成していますが、今回壊れたEBSは幸か不幸か特定プロジェクト向けのstagingインスタンス(動作確認用インスタンス)で、壊れてもサービスに影響が出ない代わりにスナップショットが作成されていないという状況。案内されているリストア方法は「スナップショットからの復元」なので、復元出来ないじゃん……

提案されている別の方法としては、「新たにボリュームを作成して手動でデータを移行させる」という方法もあったんですが「手動で」ってどうやるのかよくわからん。ほんとに泥臭い方法で手動でやるのかしら。でも起動出来ないし接続出来ないんじゃないのかな……詰んだ\(^o^)/



stagingインスタンスから作り直しました

小一時間悩んで進展しなかったので、諦めてインスタンスごと作り直しました。stagingインスタンスをコピーした上で設定を少し変えただけのインスタンスだったので、変更点がわかっているなら作り直した方が早い。幸い大枠については前任者がログを残していてくれたのでそれに従って変更、セキュリティグループなどは元のインスタンスから引き継いで、無事復旧出来ました。よかった。。

「AWSなら壊れないだろう」と思っているわけではないけど、どこかで不安を払拭したい気持ちはあり、こういう障害のことは考えないようにしてしまっているんでしょうね。



まとめ

  • AWSも壊れる
  • スナップショット大事
  • 変更ログ大事



いやでもやっぱりこれはラッキーだったんでしょうね。本番環境だったら大変だった……スナップショットを作っていても、タイムラグはどうしても生じてしまうしなあ。。