Cyber、EigenLayer、Sentient、RootData などが共同で Crypto AI Benchmark Alliance を立ち上げ、Crypto AI の新たな基準を確立しました。
Cyber、EigenLayer、Sentient などの14のブロックチェーンおよび人工知能プロジェクトが本日共同で Crypto AI Benchmark Alliance(CAIBA) の設立を発表しました。このオープンソースでコミュニティ主導のアライアンスは、暗号業界のAIモデルとエージェントのために透明で信頼できる評価基準を確立することに取り組みます。
初期の発起メンバー------Alchemy、Cyber、Dune、EigenLayer、Goldsky、IOSG、LazAI、Magic Newton、Metis、MyShell、OpenGradient、RootData、Sentient、Thirdweb------は、データセット、ツール、専門知識を共同で提供し、評価フレームワークを構築します。各ベンチマークは、タスク、参考答案、評価スクリプトを含み、GitHub、Hugging Faceなどのプラットフォームでオープンライセンス(許可範囲内で)で公開されます。

AIの暗号分野への応用が拡大する中、取引戦略から研究助手まで多岐にわたるため、従来のAIベンチマークはこの業界の独自のニーズを反映することが難しくなっています。CAIBAはこのギャップを埋めることを目指し、暗号シーンに特化した専門的な評価を導入します。
"透明で厳格なテストは非常に重要です。"とCyberの共同創設者Ryan Liは述べています。"モデルは問題に正確に答えるだけでなく、信頼性を持って実行し、ユーザーが意思決定を行う際により自信を持てるようにしなければなりません。"
アライアンスの最初の成果である Crypto AI Agents(CAIA) のベンチマークが現在オンラインで利用可能です。これはAIの能力を三つの次元から評価します:
- 知識(Knowledge):プロトコル、トークンなどの質問に正確に回答する
- 計画(Planning):複数のステップからなるタスクプランを策定する
- 行動(Action):ブロックエクスプローラーとAPIを利用して操作を完了する
CAIAはトークンエコノミクス、オンチェーン分析、プロジェクト研究、取引プロセスなどのシーンをカバーし、評価対象にはGPT-4o、Claude 4、Gemini 2.5、DeepSeek-R1などの汎用大モデルや複数の暗号ネイティブモデルが含まれます。
実際のタスクでモデルを検証することで、CAIBAは暗号AIのための統一された再現可能な評価基準を確立し、業界がより信頼できるインテリジェントアプリケーションを構築するのを支援します。アライアンスはさらに多くのベンチマークを開発中で、新しいメンバーの参加を歓迎します。開発者、研究者、プロトコルチームはモデルを提出して評価に参加するか、新しいタスクを提案できます。
Crypto AI Benchmark Alliance(CAIBA)について
Crypto AI Benchmark Allianceは、暗号シーンに特化したAI評価基準の策定に焦点を当てたコミュニティガバナンスのオープンアライアンスです。オープンデータセット、再現可能なタスク、公共のランキングを通じて、CAIBAは開発者、研究者、プロトコルにツールを提供し、ブロックチェーンアプリケーションにおけるAIシステムの評価と改善を支援します。詳細については、caiba.aiをご覧ください。







