Amazonから先日の障害について続報がでました。
AWS障害、複数のアベイラビリティゾーン利用でも影響 AWSが説明を修正
https://www.itmedia.co.jp/news/articles/1908/29/news069.html
私のサイトでも取り上げましたが、ALBを利用していたサイトでも障害の影響が発生していたと記述しましたが、Amazon側も認めました。
これにより、当初はマルチAZ構成にしてないのかと批判が出ていましたが、マルチAZ構成でも障害の影響を受けることが現実として起きたわけです。(批判していた方々には反省していただきたく)
すべてのサービスが影響を受けたわけではないので、設計やデプロイ先のサーバの運などもあったとは思いますが、クラウドだから大丈夫とは一概には言えないという良い例になったと思います。
この問題に対して、明確な解決策は今の所出てきてはいないようですが、他社がインフラ周りの設計を行うとブラックボックス化が進むため、どこで何が起きているのか把握しずらくなります。そのため、ユーザ側で対処を行うのが難しくなります。
高可用性が求められるサービスでは、止めないためにもハイブリッドクラウドやオンプレでの運用を検討し、できる限り止めない設計にするのが望ましいといったところでしょうか。(その分、値段が上がるのでお金と要相談ですが)
逆にスモールスタートや可用性を問われないサービスはクラウドサービスをどんどん使って、素早くリリースしていきましょう!