Cyber, EigenLayer, Sentient, RootData 등은 Crypto AI Benchmark Alliance를 공동으로 출범시켜 Crypto AI의 새로운 기준을 세웠습니다
Cyber, EigenLayer, Sentient 등 14개의 블록체인 및 인공지능 프로젝트가 오늘 Crypto AI Benchmark Alliance (CAIBA)를 공동으로 설립했다고 발표했습니다. 이 오픈 소스, 커뮤니티 주도의 동맹은 암호화 산업의 AI 모델과 에이전트를 위한 투명하고 신뢰할 수 있는 평가 기준을 수립하는 데 전념할 것입니다.
첫 번째 발기인인 Alchemy, Cyber, Dune, EigenLayer, Goldsky, IOSG, LazAI, Magic Newton, Metis, MyShell, OpenGradient, RootData, Sentient 및 Thirdweb는 데이터 세트, 도구 및 전문 지식을 기여하여 평가 프레임워크를 공동으로 구축할 것입니다. 각 기준 세트는 작업, 참고 답변 및 채점 스크립트를 포함하며, GitHub, Hugging Face 등의 플랫폼에서 오픈 라이센스(허용 범위 내에서)로 배포됩니다.
AI의 암호화 분야에서의 응용이 계속 확장됨에 따라, 거래 전략에서 연구 보조에 이르기까지 전통적인 AI 기준은 이 산업의 독특한 요구를 반영하기 어려워졌습니다. CAIBA는 이러한 공백을 메우기 위해 암호화 시나리오에 맞춘 전문 평가를 출시할 예정입니다.
"투명하고 엄격한 테스트는 매우 중요합니다," Cyber 공동 창립자 Ryan Li는 말했습니다. "모델은 문제를 정확히 답해야 할 뿐만 아니라 신뢰할 수 있게 실행해야 하며, 사용자가 의사 결정을 내릴 때 더 큰 신뢰를 가질 수 있도록 해야 합니다."
동맹의 첫 번째 성과인 Crypto AI Agents (CAIA)의 벤치마크가 현재 온라인에 있으며, AI 능력을 세 가지 차원에서 측정합니다:
- 지식 (Knowledge): 프로토콜, 토큰 등에 대한 정확한 답변
- 계획 (Planning): 다단계 작업 계획 수립
- 행동 (Action): 블록 탐색기 및 API를 통해 작업 수행
CAIA는 토큰 경제학, 온체인 분석, 프로젝트 연구 및 거래 프로세스 등 다양한 시나리오를 포괄하며, 평가 대상에는 GPT-4o, Claude 4, Gemini 2.5, DeepSeek-R1 등 일반 대형 모델과 여러 암호화 네이티브 모델이 포함됩니다.
실제 작업에서 모델을 검증함으로써 CAIBA는 암호화 AI를 위한 통일되고 재현 가능한 측정 기준을 수립하여 산업이 더 신뢰할 수 있는 스마트 애플리케이션을 구축하는 데 기여하고 있습니다. 동맹은 더 많은 기준을 개발 중이며, 새로운 회원의 참여를 환영합니다. 개발자, 연구자 및 프로토콜 팀은 모델을 제출하여 평가에 참여하거나 새로운 작업을 제안할 수 있습니다.
Crypto AI Benchmark Alliance (CAIBA)에 대하여
Crypto AI Benchmark Alliance는 암호화 시나리오에 맞춘 AI 평가 기준을 수립하는 데 중점을 둔 커뮤니티 거버넌스 오픈 동맹입니다. 오픈 데이터 세트, 재현 가능한 작업 및 공공 순위를 통해 CAIBA는 개발자, 연구자 및 프로토콜에 도구를 제공하여 블록체인 애플리케이션 내 AI 시스템을 측정하고 개선할 수 있도록 합니다. 자세한 내용은 caiba.ai를 방문하십시오.