SvmuuCoinbaseは、2026年5月7日に発生した大規模サービス中断インシデントに関する振り返りレポートを公開しました。今回の障害は約8時間継続し、完全な復旧には約12時間を要し、その間、取引、入金、出金、およびほとんどのコアサービスが利用不可または深刻なパフォーマンス低下状態となりました。
Coinbaseによると、障害の原因は、AWS us-east-1リージョンの特定のアベイラビリティゾーン(use1-az4)にあるデータセンターの冷却システムにおいて、複数の冷凍機が同時に故障したことです。これによりラックの熱保護シャットダウンが発生し、EC2インスタンスとEBSボリュームがオフラインになり、複数のインターネットサービスに影響が及びました。
復旧プロセスにおいて、Coinbaseの取引マッチングエンジンは、単一のAWSデータセンターのクラスターアーキテクチャにデプロイされていたため、過半数のノードを失いクォーラム(定足数)を喪失しました。緊急のコード調整と新しいノードグループの再構築を通じて復旧を進め、復旧プロセスの中で段階的に市場取引を再開しました。
さらに、AWSのマネージドKafka(MSK)サービスでコントロールプレーン障害が発生し、パーティションのプライマリノードが自動的に再選出できなくなりました。これにより、価格提示、手数料、および一部の決済・データフローシステムがさらに遮断され、全体的な影響範囲が拡大しました。CoinbaseとAWSのエンジニアリングチームが協力して手動でパーティションを移行した後、システムは徐々に正常に復旧しました。
Coinbaseは、今回のインシデントにより、クロスアベイラビリティゾーンでの自動フェイルオーバー能力とマネージドミドルウェアの災害対策における自社の不足が明らかになったと述べています。同社は、リージョン間のホットスタンバイアーキテクチャをアップグレードし、定期的な障害対応訓練を強化するとともに、Kafkaシステムを2アベイラビリティゾーン構成から3アベイラビリティゾーン構成に移行します。同時に、AWSと協力して根本原因の修正と改善を推進します。
Coinbaseが5月のダウンインシデントを振り返る:AWSカスケード障害がアーキテクチャリスクを露呈
免責事項:本内容は著者個人の見解であり、投資助言ではありません。違反内容を発見した場合クリックして通報
24H人気ランキング
-
Gateの株式専用エリアにて、ADSK(オートデスク)、BKNG(ブッキング・ドット・コム)など8銘柄の永久先物取引が開始されました
-
イラン外務省:イランと米国が合意文書に署名
-
バイナンス LRCX、KLACなど7つのU建て永久先物が上場予定
-
ALTHEAトークン(ALTH)とその分散型ネットワークについて詳しく知る
-
OKX DEX xStocks トレードコンテスト開催中、賞金総額は300,000 USDC
-
モルガン・スタンレーは、イーサリアムおよびSolanaのETF申請書類を更新し、0.14%の手数料を徴収する方針を示した
-
原油を10倍のレバレッジで買い、133万ドルの含み損。あるアドレスが3777万ドル相当のCLロングポジションを保有
-
アジアのレバレッジ型AI投資が過去最高を記録:韓国のSKハイニックスが2倍のロングETFを運用、運用資産総額は130億ドルに達した
-
イランメディアによると、イランと米国の交渉で5つの重要事項が合意されたという
-
ある「スマートマネー」が32万ドルを購入 ワールドカップのグループリーグでアルゼンチンがオーストリアに勝利
おすすめ記事




