AWSの東京リージョンで大規模障害

本日13時15分頃からAWSの東京リージョンで大規模な障害が発生しました。このブログは大丈夫なんですが(でも Lightsail のサイトは繋がらない)昼の会社のサーバはすべてAWSにありそのほとんどが東京リージョンなので、必然的にサービスごと落ちまして、当然バックエンドのシステムも使えないので社員はみんな仕事になりません。いやもうほんとに大変。


最初、うちのDBだけに何らかの障害が発生したんだと思って、血の気が引きつつEBSの付け替えとか調べてたんですが、メンテナンスメッセージを表示させるのに使っているEC2を起動させようとしたらそれも起動しなくておかしいぞと。で、調べたところ、どうやらAWSで大障害が発生中。


AMAZONのクラウドコンピューティングサービス「AWS」で8月23日13時頃から大規模な障害が発生しているようだ。AWSを利用しているスマホゲームやSNS、ECサイトなど各種サービスで接続障害が発生しているという。

AWSで大規模障害が発生中 『アズレン』で通信障害を報告 『アナデン』『ダンメモ』『シノアリス』『ガルパ』などにも影響【追記】 | Social Game Info


まさか、ですよ。AWSってインスタンスごとに壊れたり取り替えたりというのはたまにあるとしても、リージョン単位で障害が起きるとかまるごと落ちるとか滅多にないわけで、その安心のためにお金出してるところもあるわけなので、それがバキッと落ちられると影響も大きいしショックもでかい。

僕の仕事自体は、デプロイとステージングを除けば、ローカルで動作確認しながらのコーディングになるので特に支障はないんですが、それでもAWSが復旧し次第、DBなど問題が起きていないか確認しなくてはいけないし、どうも落ち着かない。仕方ないことなんだけども。


いやあ、これ書いてる間に復旧しました、良かったねってならないかなと思って書いてたんですけど復旧しませんね。どうすんだこれ。



追記(18:28)

EC2に関しては17時頃に復旧しましたが、その後もElastiCacheが帰ってこないので、仕事で触っているサイトは激重になってました。ElastiCacheが復旧しさえすれば自然と直ると思うんですけど。。今日のお仕事はひとまず終了です。お疲れさまでした。