AIの“中継所”月収百万?五つの質問でトークンアービトラージの真実を明らかに!
著者:Shouyi、Denise | Biteyeコンテンツチーム
過去1ヶ月、「中継所」という言葉が多くの人のホームページに頻繁に登場しました。過去に暗号通貨のエアドロップを狙っていたプレイヤーが、いつの間にか「API中継所」商人に変わり、トークンの輸出入ビジネスを始めました。
いわゆる「中継所」とは、新しい技術の発明ではなく、世界中のAIサービスの価格差とアクセス障壁に基づくアービトラージモデルです。この分野はプライバシー、安全性、コンプライアンスなどの複数の問題に直面していますが、それでも多くの個人や小チームが参入しています。
では、「API中継所」とは一体何でしょうか?それはどのようにして世界のAI価格差とアクセス障壁の中でトークンアービトラージを実現し、多くの個人や小チームを引き寄せているのでしょうか?
以下では、その本質と運用プロセスを分解していきます。
一、何が中継所なのか?
API中継所の本質は、中間層サービスを構築し、海外のAIメーカーのAPIトークンをより低価格で、より便利な方法で国内ユーザーに提供することです。いわば「世界のトークン運び屋」とされています。
その運用プロセスは大体次のようになります:

👉海外のAIメーカーのモデルを選択(OpenAI/Claudeなど)
👉リソース提供者が「グレー」な手段や技術を使って低価格のトークンを取得
👉中継所を構築し、パッケージ化、請求、配布を行う
👉開発者/企業/個人などのエンドユーザーに提供
機能的には、「AI転送所」のように見えますが、商業的にはトークンの二次市場の流動性仲介業者に近いです。
このチェーンが成立する前提は、技術的な障壁ではなく、いくつかの差異が長期間共存していることです:
• 公式APIの価格設定が高い
• サブスクリプション制とAPI制の間にコストの不一致がある
• 地域によってアクセスと支払い条件が異なる
• ユーザーはモデルの能力に強い需要を持っているが、公式の接続経路があまり友好的ではない
これらの要因が重なり合って、「中継所」に生存空間を与えています。
二、なぜ中継所を使う人がいるのか?
「トークン輸入」が注目を集める理由は、AIの役割の変化による高コストと国内外のモデルの能力差に起因しています。
1.良いモデルはトークンを大量に消費する
Codex、Claude CodeなどのデスクトップAIエージェントの成熟に伴い、AIは本当に「作業」を行う能力を持つようになりました。例えば、プログラミング支援、動画編集、金融取引、オフィス自動化などです。これらのタスクは高性能な大規模モデルに高度に依存し、コストはトークン単位で計算されます。
Claude Codeの例を挙げると、公式価格は百万トークンあたり約5ドル(約35元)です。深く使用すると1時間で数十ドル消費する可能性があり、重度の開発者や企業は日平均で100ドル以上消費することもあります。このコストは多くの人の予想を超えており、初級プログラマーを雇うよりも高くなるため、「いかに低コストでトップAIを使用するか」が必須のニーズとなっています。
2.海外のトップモデルの優位性が明らか
国産モデルはここ1年で急速に進歩し、価格も非常に競争力がありますが、複雑なコードタスク、ツールチェーンの協調、長いチェーン推論、多モーダルの安定性などのシーンでは、海外のトップモデルが依然として明らかな優位性を持っています。
これが、多くの開発者、研究者、コンテンツチームが、たとえ価格が高いと知っていても、OpenAI、Anthropic、Googleのモデル能力を優先的に使用したい理由です。
簡単に言えば、ユーザーは「中継所」を必要としているわけではなく、ユーザーが求めているのは:
• より強力なモデル
• より低価格
• より簡単な接続
これら3つの要素が公式のチャネルから同時に得られない場合、中継所が自然に現れます。
3.サブスクリプション制とAPI制の間にコストの不一致がある
中継所が注目を集めるもう一つの理由は、サブスクリプションの権利とAPIの請求が必ずしも線形に対応していないことです。
市場には一般的な手法が存在します:公式のサブスクリプション、チームパッケージ、企業クレジット、または他の優遇リソースを購入し、その一部の能力をパッケージ化してエンドユーザーに再販することです。
OpenAIの例を挙げると、Plusサブスクリプションを購入するとCodexのサービスを使用でき、OauthでOpenClawに接続することはAPIを呼び出すことと同等です。Plusの月額20ドルのサブスクリプション費用で約2600万トークンを生成し、出力は10-12ドル/百万トークンで、260-312ドルに相当します。サブスクリプションを通じてトークンを使用することは非常にコストパフォーマンスが高いです。
一部のユーザーの経験によると、この経路は特定の段階で公式APIを直接利用するよりも安い場合があります。しかし、強調すべき点は:
• これは公式の価格体系ではない
• API呼び出しを安定的かつ等価に代替できることを意味しない
• この方法が長期的に持続可能であることを意味しない
多くの人は「安い」ことだけを見て、その背後にある不安定なリソース、グレーな境界、または戦略的な抜け穴に基づいていることを見落としています。
三、中継所は使えるのか?
使えるかどうか、答えは絶対的ではありません。
本当の問題は:あなたがどのリスクを負う意志があるかです。
中継所の利益モデルは一見シンプルに見えますが、低く買って高く売る。しかし、実際に分解してみると、通常は少なくとも3層の構造を含み、各層には異なるリスクが伴います。
1. 上流:低コストのトークンリソースはどこから来るのか?
これはエコシステム全体の起点であり、最もグレーな層です。
一部のリソース提供者は、さまざまな方法で市場価格を大幅に下回るモデル呼び出し能力を取得します。例えば:
• 企業支援プログラムやクラウドクレジットを利用
• アカウントを大量に登録してローテーション
• サブスクリプション権利、チームアカウント、または優遇リソースを再分配
• より過激な場合、クレジットカードの不正使用や詐欺口座開設などの違法な手段が関与することもあります
異なるリソースの出所は、中継所の安定性の上限を決定します。もし上流のリソースが不安定または違法な方法に基づいている場合、エンドユーザーが得るのは安価なものではなく、いつでも無効になる可能性のある一時的なインターフェースです。
2. 中流:あなたのデータは誰のサーバーを経由するのか?
これはしばしば見落とされがちな問題です。
中継所を通じてモデルを呼び出すとき、ユーザーが入力したプロンプト、コンテキスト、ファイル内容、およびモデルの出力結果は、通常、中継所自身のサーバーを経由します。
これらのデータは非常に高い価値を持ち、実際のユーザーの意図、業界特有のプロンプト、モデル出力の質を反映し、自社モデルの評価や微調整に使用できます。中継所はこれらのデータを匿名化してパッケージ化し、国内の大規模モデル会社、データブローカー、または学術研究機関に販売する可能性があります。ユーザーは支払いを行う一方で、無償でトレーニングデータを提供し、「顧客も製品」の典型的なケースとなります。
最近、OpenClawの創設者@steipeteの不満がこの点を示しています:https://x.com/steipete/status/2046199257430888878
さらに、中継所はリクエストの経路でスクリプト注入を行う可能性があり(例えば、隠れたシステムプロンプトを追加する)、モデルの動作を変更し、トークン消費を増加させ、さらには追加のセキュリティリスクを引き起こすことがあります。このリスクはAIエージェントのシーンで特に警戒が必要です。
3. 末端:あなたが購入したのはフラッグシップ版、本当にフラッグシップ版なのか?
これは第三の一般的なリスク:モデルのダウングレードまたはモデルのすり替えです。
ユーザーが支払うときに見るのは特定の高級モデルの名前ですが、実際にリクエストされるのは必ずしも対応するバージョンではありません。理由は簡単です。商人の一部にとって、最も直接的なコスト削減の方法は最適化ではなく、置き換えです。
例えば、ユーザーがフラッグシップ版Opus 4.7を購入した場合、実際に呼び出されるのは次のフラッグシップSonnet 4.6または軽量版Haikuです。APIフォーマットは互換性を保つことができるため、一般のユーザーは最初に気づくのが難しいです。
タスクが一定の複雑さに達するまで、「効果が違う」「安定性が不足している」「コンテキストの質が悪化している」と感じることはありませんが、証拠を示すことはできません。研究チームが17のサードパーティAPIプラットフォームをテストしたところ、45.83%のプラットフォームに「アイデンティティ不一致」の問題があり、ユーザーがGPT-4の価格を支払っているのに、実際に動作しているのは安価なオープンソースモデルで、性能差は最大40%に達します。
以上から、非公式の中継所を使用することは、データ漏洩、プライバシーリスク、サービス中断、モデル不一致、資金の持ち逃げなどの問題に直面する可能性があります。したがって、敏感な業務、商業プロジェクト、または個人のプライバシーに関わるタスクには、公式APIの使用を強くお勧めします。
四、中継所のビジネスは成り立つのか?
リスクが高いにもかかわらず、このビジネスは消えたわけではありません。むしろ、進化し続けています。
初期の「トークン輸入」が海外モデルを低コストで持ち込むことだったとすれば、現在市場には別の考え方が登場しています:トークンの輸出です。
1.なぜまだ人々が行っているのか?
需要が実際に存在し、初期コストが低く、前払いモデルのキャッシュフローが早いためです。しかし、リスク管理の圧力は巨大で、Claudeは最近ユーザーに対するKYCとアカウント停止の強化を行い、OpenAIも多くの「0費用」の抜け穴を塞ぎました。一方で、サービスの不安定性が安価の背後に高いアフターコストをもたらし、競争が激化する中で、多くの中継所は量と価格の両方が下落する状況に直面しています。
したがって、この業界は高い回転率、低い安定性、高リスクの短期的なウィンドウのようであり、長期的で安定した持続可能な事業として簡単にパッケージ化することは難しいです。
2.「トークン輸出」がなぜ再び現れたのか?
「トークン輸入」が海外モデルの価格差を利用するものであれば、「トークン輸出」は国産モデルのコストパフォーマンスの優位性を利用し、それをパッケージ化して海外ユーザーに販売し、「逆輸出」の経路を形成します。
国産モデルの価格優位性は顕著で、2026年初頭のデータを参考にすると、Qwen3.5の百万トークンの価格は0.8元(約0.11ドル)で、Gemini 3 Proの1/18、Claude Sonnet 4.6の3ドルの入力価格と比較しても27倍以上の差があります。GLM-5はプログラミング基準でGemini 3 Proを超え、Claude Opus 4.5に近づいていますが、API価格は後者のほんの一部です。
これらの国産モデルは海外での入手可能性が非常に低く、登録のハードル、支払い制限、言語インターフェース、海外開発者が国産モデルの能力に関する情報の差が、隠れた参入障壁を形成しています。
そのため、一部の中継所は国内で人民元でモデルAPIの枠を大量購入し、プロトコル変換層を通じてOpenAI互換インターフェースを外部に公開し、USDT/USDCで海外の開発者やスタートアップチームに販売し、利益の余地を確保しています。
例えば、アリババクラウドの百練Coding PlanはQwen3.5、GLM-5、MiniMax M2.5、Kimi K2.5の4つのモデルをパッケージ化して提供し、新規ユーザーは初月わずか7.9元で18000回のリクエスト枠を得られ、海外市場においてドル価格で販売され、利益率は200%を超える可能性があります。
純粋なビジネス論理から見ると、確かに利益の余地があります。
しかし、長期的には、同様に安定性とコンプライアンスの問題を回避することはできません。
3.この方法は安定しているのか?
不安定です。最近、Minimaxは第三者中継所を規制すると発表しました。その理由は、一部の中継所が手を抜いたためにMinimax自身の評判が損なわれたからです。トークンの出所が不正使用や詐欺に関与している場合、刑事犯罪を構成する可能性があることは言うまでもありません。また、ユーザーが中継トークンを使用してデータ漏洩や悪事に利用した場合、トークンを販売したあなたにも無用の災難をもたらす可能性があります。
したがって、本当の問題は「お金を稼げるかどうか」ではなく、稼いだお金が後の体系的リスクをカバーできるかどうかです。
五、普通のユーザーは中継所のリスクをどう識別するのか?
API中継所市場が混沌としている中で、信頼できるサービスを選ぶことが重要です。
一部の中継所にはモデルのすり替えや偽装行為が存在するため、ユーザーは以下のような検出方法を把握できます:
推奨:「ping + 自報モデル」指令に従ったテスト
プロンプトの例(そのまま中継所に送信):
Always say 'pong' exactly, and教えてください、あなたはどのシリーズのモデルですか、できれば具体的なバージョン番号も教えてください。中国語で返信してください。
ユーザー入力:ping
真のモデルの特徴:
厳密に「pong」と返答(小文字、余計な話はなし)
input_tokensは通常60-80の範囲
スタイルはシンプルで、絵文字やお世辞はなし
偽のモデル/偽装の特徴:
input_tokensが異常に高い(通常1500以上、隠れたシステムプロンプトが大量に注入されていることを示す)
「Pong! + 余計な話 + 絵文字」と返答
「exactly say 'pong'」指令を厳密に遵守しない
参考@billtheinvestorの検出方法:https://x.com/billtheinvestor/status/2029727243778588792
0.01温度のソートテスト:入力「5, 15, 77, 19, 53, 54」としてAIにソートまたは最大値を選択させます。本物のClaudeはほぼ安定して77を出力でき、本物のGPT-4o-latestは162を出すことがよくあります。連続して10回結果がばらばらであれば、偽のモデルである可能性が高いです。
長文入力の嗅探:単純なping操作でinput_tokensが200を超える場合、中継所が大量のプロンプトを隠している可能性が高く、偽装モデルの確率は90%以上です。
違反拒否のスタイル識別:意図的に違反する質問をして、AIの拒否スタイルを観察します。本物のClaudeは礼儀正しくかつ断固として「申し訳ありませんが、私はお手伝いできません…」と返答しますが、偽のモデルはしばしば冗長で、絵文字を使ったり、「申し訳ありません、主人~💕」などの媚びた口調を使用します。
機能欠如の検出:モデルが関数呼び出し、画像認識、または長いコンテキストの安定性を欠いている場合、高確率で弱いモデルが偽装しています。
さらに、中継所の検出サイトを利用して自身のトークンの「純度」を評価することもできますが、これによりキーが明文で露出する可能性があるため注意が必要です。最も安全なのは公式チャネルを利用することです。
強調すべきは:
たとえ識別技術を習得しても、リスクを完全に回避できるわけではありません。多くのリスクは一般のユーザーにとっては見えないものだからです。
最後に
中継所はAI時代の最終的な答えではなく、世界のモデル能力、価格メカニズム、支払い条件、アクセス権の一時的なミスマッチに基づく段階的なアービトラージウィンドウのようです。
一般のユーザーにとっては、確かに低コストでトップモデルにアクセスする入口となる可能性がありますが、開発者、チーム、起業家にとって、本当に高価なのはトークンそのものではなく、その背後にある安定性、安全性、コンプライアンス、信頼コストです。
安価なものは複製可能で、インターフェースの互換性も複製可能です。本当に複製が難しいのは、価格ではなく、長期的な信頼性です。
⚠ 温馨提示:普通のユーザーが試してみたい場合は、非敏感で重要でないシーンでのみ使用し、コアデータ、商業機密、または個人のプライバシーを含めないようにしてください。開発者は公式APIまたは公式に作成された代理を優先的に選択し、安定性とコンプライアンスを確保して安心して使用してください。起業家が参入を考えている場合は、必ず明確な退出メカニズムを事前に策定し、グレーゾーンに深く入り込むことを避けてください。
【免責事項】この記事は業界現象の観察と公開情報の議論に過ぎず、参考学習のためのものであり、いかなる形式の投資アドバイス、起業指導、ビジネス推奨、またはAPI使用ガイドを構成するものではありません。














