CoinbaseのCEO:アーキテクチャの選択を再評価し、将来のダウンタイムを大幅に短縮する。
CoinbaseのCEOブライアン・アームストロングはXプラットフォームで、昨日Coinbaseでサービスの中断が発生したことは決して受け入れられないと投稿しました。根本的な原因は、AWSデータセンターの複数の冷却装置が同時に故障し、あるサーバールームが過熱したことです。Coinbaseのほとんどのシステムは、単一の可用性ゾーンの障害に対処するための冗長性を設計しており、昨晩も確かに正常に稼働していました。
しかし、中央集権型取引所は免れませんでした。なぜなら、そのアーキテクチャは低遅延と顧客の共置を追求するために特別に最適化されており、可用性ゾーンレベルのフォールトトレランスを同時に考慮することが難しいからです。取引所に可用性ゾーンの障害に対する耐性を持たせることは遅延の問題を引き起こし、顧客の共置を損なうことになりますが、チームはこれらのトレードオフを再評価し、少なくとも可用性ゾーンを切り替える必要がある場合には、ダウンタイムを大幅に短縮できるようにすることを約束しました。彼は徹夜で修理にあたったAWSとCoinbaseのチームに感謝の意を表し、後で詳細な技術説明を発表することを約束しました。








