站長之家(ChinaZ.com)2月18日 消息:今日中午12時,馬斯克旗下的人工智能公司xAI正式推出了其最新一代大模型——Grok3。
在數(shù)學(xué)推理、科學(xué)邏輯推理以及代碼寫作等多個能力表現(xiàn)方面,Grok3在多項(xiàng)基準(zhǔn)測試中均取得了優(yōu)異成績,超越了DeepSeek-v3、GPT-4o以及Gemini-2pro等競爭對手。特別是在AIME(評估模型在數(shù)學(xué)問題上的表現(xiàn))和GPQA(測試模型在博士級別物理、生物和化學(xué)問題上的表現(xiàn))等測試中,Grok3展現(xiàn)出了卓越的性能。此外,在Chatbot Arena這一眾包測試平臺中,Grok3的早期版本也表現(xiàn)不俗,贏得了用戶的廣泛好評。
值得注意的是,Grok3并非單一模型,而是一個包含多個版本的模型家族。其中,較小版本的Grok3mini能夠在犧牲一定準(zhǔn)確性的情況下,以更快的速度回答問題。目前,并非所有模型版本都已上線供用戶使用。
在軟件層面,xAI團(tuán)隊(duì)也對Grok3進(jìn)行了諸多優(yōu)化。通過改進(jìn)訓(xùn)練流程、引入合成數(shù)據(jù)集、自我糾錯以及強(qiáng)化學(xué)習(xí)等技術(shù),Grok3的性能得到了進(jìn)一步提升。這些技術(shù)的綜合應(yīng)用,使得Grok3在處理復(fù)雜任務(wù)時表現(xiàn)得更為出色。
此外,Grok3還推出了兩個變體版本——Grok3Reasoning(推理)和Grok3mini Reasoning。這兩個版本能夠像OpenAI的o3-mini和DeepSeek的R1等“推理”模型一樣,仔細(xì)“思考”問題,并在給出結(jié)果前進(jìn)行徹底的事實(shí)核查,從而避免了一些通常會困擾模型的錯誤。用戶可以通過Grok應(yīng)用訪問推理模型,并在遇到較難問題時使用“Big Brain”模式進(jìn)行更深入、更謹(jǐn)慎的推理。這些模式最適合用于數(shù)學(xué)、科學(xué)和編程相關(guān)的問題。
除了推理模型外,Grok3還引入了一項(xiàng)名為“DeepSearch”的新功能。xAI將其描述為一種新型搜索引擎,能夠掃描互聯(lián)網(wǎng)和X平臺上的信息,并以摘要的形式回應(yīng)用戶查詢。這一功能的加入,進(jìn)一步提升了Grok3的實(shí)用性和便捷性。
對于Grok3的訂閱服務(wù),xAI也進(jìn)行了詳細(xì)介紹。X平臺的Premium +訂閱用戶將率先體驗(yàn)到Grok3的各項(xiàng)功能。而其他功能則被整合到xAI推出的名為SuperGrok的訂閱服務(wù)中。SuperGrok的訂閱價格為每月30美元或每年300美元,用戶可獲得額外的推理和DeepSearch查詢權(quán)限,以及無限量的圖像生成功能。
馬斯克還透露,Grok將在未來一周內(nèi)推出“語音模式”,并在幾周后將Grok3模型和DeepSearch功能整合到xAI的企業(yè)API中。此外,xAI還計劃在未來幾個月內(nèi)開源Grok2。
(舉報)