OpenAI員工公開指責Grok3 基準測試爭議升級

近日,OpenAI的一名員工公開指責埃隆·馬斯克旗下的xAI公司,稱其發布的最新AI模型Grok3的基準測試結果具有誤導性。xAI的聯合創始人伊戈爾·巴布什金則堅稱公司并無不當。

xAI的圖表顯示,Grok3的兩個版本——Grok3 Reasoning Beta和Grok3 mini Reasoning——在AIME 2025上的表現超過了OpenAI目前最強的可用模型o3-mini-high。然而,OpenAI的員工很快指出,xAI的圖表并未包含o3-mini-high在“cons@64”條件下的AIME 2025得分。巴布什金辯稱,OpenAI過去也曾發布過類似的誤導性基準測試圖表。盡管這些圖表是用于比較其自身模型的表現。

? 版權聲明
評論 搶沙發
加載中~
每日一言
不怕萬人阻擋,只怕自己投降
Not afraid of people blocking, I'm afraid their surrender