アメリカの巨大企業が一斉に中国のAIモデルから「脱出」する
原文タイトル:アメリカ最大の暗号取引所が、中国のAIモデルに静かに切り替え、半分のコストを削減
原文著者:AI 上手筆記
シリコンバレーをざわつかせるデータ
最近、アメリカ最大の暗号通貨取引所CoinbaseのCEOブライアン・アームストロングが言った一言が、テクノロジー界を騒がせました:
「私たちはAIモデルを中国のGLM 5.2とKimi 2.7に切り替え、AI支出を半分に削減しました。」
半分に削減?それなら使用量も減ったのでは?
正反対です。Coinbaseのトークン使用量は常に増加しています。
コストを削減しながら、より多く使用することが、本当にOpenAIとAnthropicをざわつかせている点です。
どうやって実現したのか?三つのコスト削減戦略
Coinbaseは単に安いモデルに切り替えただけではありません。彼らは完全な「コスト削減システム」を構築しました:
第一の戦略:一つのモデルに縛られず、システムが自動で選択
Coinbaseは自動ルーティングシステムを構築しました。リクエストが来るたびに、システムはタスクの種類、価格、キャッシュ状況に基づいて、最も適切なモデルを自動的に選択します。
すべてのタスクが最も高価なモデルを必要とするわけではありません。簡単な翻訳には安いモデルを、複雑な推論には良いモデルを使用します------まるでスポーツカーで買い物に行かないように。
第二の戦略:キャッシュヒット率を5%から60%に引き上げる
これは最も効果的な戦略です。キャッシュ戦略を最適化することで、Coinbaseはキャッシュヒット率を5%から60%に引き上げました。
簡単に言えば、60%のリクエストは以前の計算結果を再利用でき、各呼び出しの実際のコストを大幅に削減しました。この最適化だけで、大きな費用を削減しました。
第三の戦略:コンテキストエンジニアリング
Coinbaseは開発者に対して、コンテキストを簡素化し、新しいタスクには新しいセッションを開くように求めています。一つの対話に多くの情報を詰め込まないように。
これは手抜きではなく、新しい学問です------業界ではコンテキストエンジニアリングと呼ばれています。Anthropicは技術ブログの中で明確に指摘しています:AIエージェントを管理する際、コンテキストエンジニアリングはプロンプトエンジニアリングよりも効果的です。
簡単に言えば:AIをより賢くするのではなく、AIにより正確な情報を提供することです。

▲ ますます多くの企業がAIモデルのコストを厳しく管理し始めています
Coinbaseだけではない、これは潮流です
Coinbaseは最初の試みではありません。
Lindy、25人のAIスタートアップ企業のCEOフロ・クリヴェロは、ClaudeをすべてDeepseekに切り替えました。彼はCNBCに対して「AIコストは人件費を超えており、これは持続可能ではありません」と述べました。モデルを切り替えた後、コストは「断崖式に下降」し、数百万ドルを節約しました。
SnowflakeのCEOスリダール・ラマスワミは、103のコーディングタスクで実際の比較を行いました:GLM-5.2は66%を解決し、Claude Opus 4.7は67%を解決しました。差は?ほとんどありません。
しかし、価格差は実際に存在します:
価格比較(百万トークンあたり)
- GLM-5.2:入力 $1.40 / 出力 $4.40
- Claude Opus 4.7:入力 $5 / 出力 $25
- GPT-5.5:入力 $5 / 出力 $30
出力価格は5〜7倍の差があります。
安いものに良いものはない?結論を急がないで
ここまで読んで、あなたはこう思うかもしれません:こんなに安いのに、品質は同じですか?
正直に言うと、完全には同じではありませんが、差はあなたが思っているより小さいです。
Snowflakeのテストによると、GLM-5.2は特定のタスクで確かに安定性が不足しており------初回の成功率は47.6%、Opusの53.7%を下回りました。また、GLMは時々誤った方向に「こだわる」ことがあります:あるタスクでは、24分間で411回ツールを呼び出し、失敗しました。Opusは49回の呼び出しで9分で解決しました。
しかし、ほとんどのタスクでは、両者の最終成功率はほぼ同じです。重要なのは、あなたがその数パーセントの安定性のために5倍の価格を支払うことを望むかどうかです。
多くの企業にとって、答えはますます明確です:望まない。

▲ 中西部と西部のAIモデルの価格差が業界の構造を再構築しています
これは私たち一般人に何を意味するのか?
あなたはこう言うかもしれません:私はCoinbaseではないので、これらは私に関係ありません。
実際、このトレンドはあなたがAIを使用する方法に対して三つの直接的な示唆を持っています:
1. 一つのモデルだけを信じない
多くの人がAIを使用する際、一つのモデルに固執します------ChatGPTかClaudeのどちらか。しかし、専門家はもうそうはしていません。異なるタスクには異なるモデルを使用することが、コストパフォーマンスの最も高い方法です。
日常の質問応答には安いモデルを、コーディングや分析には良いモデルを使用します。食事の際、毎回ミシュランに行くことはありません。
2. キャッシュと再利用がコスト削減の鍵
もしあなたがAIを使って似たようなことを頻繁に行うなら(例えば、毎週の週報を書く、毎日のノートを整理するなど)、キャッシュとテンプレートを活用することで消費を大幅に削減できます。
3. コンテキストを簡素化する = より良い結果
多くの人がAIと対話する際、すべての背景を詰め込みたがります。しかし、実際にはAIに少ないがより正確な情報を提供する方が、効果が良いことが証明されています。新しいタスクには新しい対話を開き、AIに歴史的な記録の中から答えを探させないでください。
より深い変化:AIの価格モデルが再構築されつつある
この「モデル移行の潮流」の背後には、AI業界全体の価格論理の揺らぎがあります。
OpenAIとAnthropicの高評価は、「収入が持続的に急成長する」という仮定に基づいています。しかし、もしますます多くの企業がCoinbaseやLindyのようにより安価な代替品に移行するなら、この仮定は成り立ちません。
報道によると、OpenAIとAnthropicの間で価格戦争が始まっています。OpenAIが最近発表したGPT-5.6シリーズでは、TerraモデルがGPT-5.5の半分の価格で、Lunaはさらに最低価格を打ち出しています。
ユーザーにとっては、これは良いニュースです。競争が激しくなるほど、価格は低くなり、選択肢が増えます。
アメリカの巨人たちが中国のモデルを使ってコストを削減し始めたことは、AIの競争がもはや実験室でのスコア競争ではなく、実際のコスト競争であることを示しています。同じことをより少ないお金で行うことが、本当の実力です。













