掃碼下載
BTC $66,183.75 -1.32%
ETH $1,837.82 -3.64%
BNB $633.90 -3.77%
XRP $1.22 +0.40%
SOL $73.34 -3.77%
TRX $0.3350 -0.44%
DOGE $0.0927 -1.96%
ADA $0.2117 -1.30%
BCH $246.47 -12.56%
LINK $8.39 -1.75%
HYPE $72.06 +0.39%
AAVE $75.43 +0.45%
SUI $0.8264 +1.08%
XLM $0.2229 +2.96%
ZEC $609.29 +7.99%
BTC $66,183.75 -1.32%
ETH $1,837.82 -3.64%
BNB $633.90 -3.77%
XRP $1.22 +0.40%
SOL $73.34 -3.77%
TRX $0.3350 -0.44%
DOGE $0.0927 -1.96%
ADA $0.2117 -1.30%
BCH $246.47 -12.56%
LINK $8.39 -1.75%
HYPE $72.06 +0.39%
AAVE $75.43 +0.45%
SUI $0.8264 +1.08%
XLM $0.2229 +2.96%
ZEC $609.29 +7.99%

OpenAI 員工公開指責 xAI 最新 AI 模型 Grok3 的基準測試結果具有誤導性

2025-02-23 11:03:04
收藏

ChainCatcher 消息,据金十報導,OpenAI 的一名員工公開指責馬斯克旗下的xAI公司,稱其發布的最新 AI 模型 Grok3 的基準測試結果具有誤導性。對此,xAI 的聯合創始人伊戈爾・巴布什金(Igor Babushkin)則堅稱公司並無不當。

xAI 的圖表顯示,Grok3 的兩個版本------Grok3 Reasoning Beta 和 Grok3 mini Reasoning------在 AIME 2025 上的表現超過了 OpenAI 當前最強的可用模型 o3-mini-high。然而,OpenAI 的員工很快在 X 平台上指出,xAI的圖表並未包含 o3-mini-high 在"cons@64"條件下的 AIME 2025 得分。

巴布什金在 X 平台上辯稱,OpenAI 過去也曾發布過類似的誤導性基準測試圖表。儘管這些圖表是用於比較其自身模型的表現。

app_icon
ChainCatcher 與創新者共建Web3世界