logo加载失败
掃碼下載
首頁
文章
快訊
代幣解鎖
專案排行榜
專題
專欄
ETF
知識庫
日曆
活動
工具導航
Grok3

OpenAI 員工公開指責 xAI 最新 AI 模型 Grok3 的基準測試結果具有誤導性

ChainCatcher 消息,据金十報導,OpenAI 的一名員工公開指責馬斯克旗下的xAI公司,稱其發布的最新 AI 模型 Grok3 的基準測試結果具有誤導性。對此,xAI 的聯合創始人伊戈爾・巴布什金(Igor Babushkin)則堅稱公司並無不當。xAI 的圖表顯示,Grok3 的兩個版本------Grok3 Reasoning Beta 和 Grok3 mini Reasoning------在 AIME 2025 上的表現超過了 OpenAI 當前最強的可用模型 o3-mini-high。然而,OpenAI 的員工很快在 X 平台上指出,xAI的圖表並未包含 o3-mini-high 在"cons@64"條件下的 AIME 2025 得分。巴布什金在 X 平台上辯稱,OpenAI 過去也曾發布過類似的誤導性基準測試圖表。儘管這些圖表是用於比較其自身模型的表現。
2025-02-23
OpenAI
xAI
Grok3
版權 © 2023
關於我們
媒體資源
申請專欄
免責聲明
RSS 連結
徵才
瓊ICP備2021009392號
瓊ICP備2021009392號
ChainCatcher 與創新者共建Web3世界
開啟App