アメリカの巨大企業が一斉に中国のAIモデルから「脱出」する

核心的な視点

おすすめの読書

2026-07-04 00:05:29

コレクション

CoinbaseのCEOは公に述べた：会社のAIは全面的に中国のモデルに切り替え、支出は半分に削減されるが、使用量は逆に倍増する。SnowflakeやLindyも同様のことを行っている——静かに「AIモデルの移行潮」が起こっている。

原文タイトル：アメリカ最大の暗号取引所が、中国のAIモデルに静かに切り替え、半分のコストを削減

原文著者：AI 上手筆記

シリコンバレーをざわつかせるデータ

最近、アメリカ最大の暗号通貨取引所CoinbaseのCEOブライアン・アームストロングが言った一言が、テクノロジー界を騒がせました：

「私たちはAIモデルを中国のGLM 5.2とKimi 2.7に切り替え、AI支出を半分に削減しました。」

半分に削減？それなら使用量も減ったのでは？

正反対です。Coinbaseのトークン使用量は常に増加しています。

コストを削減しながら、より多く使用することが、本当にOpenAIとAnthropicをざわつかせている点です。

どうやって実現したのか？三つのコスト削減戦略

Coinbaseは単に安いモデルに切り替えただけではありません。彼らは完全な「コスト削減システム」を構築しました：

第一の戦略：一つのモデルに縛られず、システムが自動で選択

Coinbaseは自動ルーティングシステムを構築しました。リクエストが来るたびに、システムはタスクの種類、価格、キャッシュ状況に基づいて、最も適切なモデルを自動的に選択します。

すべてのタスクが最も高価なモデルを必要とするわけではありません。簡単な翻訳には安いモデルを、複雑な推論には良いモデルを使用します------まるでスポーツカーで買い物に行かないように。

第二の戦略：キャッシュヒット率を5%から60%に引き上げる

これは最も効果的な戦略です。キャッシュ戦略を最適化することで、Coinbaseはキャッシュヒット率を5%から60%に引き上げました。

簡単に言えば、60%のリクエストは以前の計算結果を再利用でき、各呼び出しの実際のコストを大幅に削減しました。この最適化だけで、大きな費用を削減しました。

第三の戦略：コンテキストエンジニアリング

Coinbaseは開発者に対して、コンテキストを簡素化し、新しいタスクには新しいセッションを開くように求めています。一つの対話に多くの情報を詰め込まないように。

これは手抜きではなく、新しい学問です------業界ではコンテキストエンジニアリングと呼ばれています。Anthropicは技術ブログの中で明確に指摘しています：AIエージェントを管理する際、コンテキストエンジニアリングはプロンプトエンジニアリングよりも効果的です。

簡単に言えば：AIをより賢くするのではなく、AIにより正確な情報を提供することです。

▲ ますます多くの企業がAIモデルのコストを厳しく管理し始めています

Coinbaseだけではない、これは潮流です

Coinbaseは最初の試みではありません。

Lindy、25人のAIスタートアップ企業のCEOフロ・クリヴェロは、ClaudeをすべてDeepseekに切り替えました。彼はCNBCに対して「AIコストは人件費を超えており、これは持続可能ではありません」と述べました。モデルを切り替えた後、コストは「断崖式に下降」し、数百万ドルを節約しました。

SnowflakeのCEOスリダール・ラマスワミは、103のコーディングタスクで実際の比較を行いました：GLM-5.2は66%を解決し、Claude Opus 4.7は67%を解決しました。差は？ほとんどありません。

しかし、価格差は実際に存在します：

価格比較（百万トークンあたり）

GLM-5.2：入力 $1.40 / 出力 $4.40
Claude Opus 4.7：入力 $5 / 出力 $25
GPT-5.5：入力 $5 / 出力 $30

出力価格は5〜7倍の差があります。

安いものに良いものはない？結論を急がないで

ここまで読んで、あなたはこう思うかもしれません：こんなに安いのに、品質は同じですか？

正直に言うと、完全には同じではありませんが、差はあなたが思っているより小さいです。

Snowflakeのテストによると、GLM-5.2は特定のタスクで確かに安定性が不足しており------初回の成功率は47.6%、Opusの53.7%を下回りました。また、GLMは時々誤った方向に「こだわる」ことがあります：あるタスクでは、24分間で411回ツールを呼び出し、失敗しました。Opusは49回の呼び出しで9分で解決しました。

しかし、ほとんどのタスクでは、両者の最終成功率はほぼ同じです。重要なのは、あなたがその数パーセントの安定性のために5倍の価格を支払うことを望むかどうかです。

多くの企業にとって、答えはますます明確です：望まない。