OpenAI推出o1模型,推理能力提升
**OpenAI正式發(fā)布了o1預(yù)覽模型,該模型在復(fù)雜推理任務(wù)方面取得了突破。** **o1模型的特點(diǎn)是能夠在回答問(wèn)題之前進(jìn)行更深入的思考和推理,就像人類思考解決問(wèn)題一樣。** OpenAI表示,2023年發(fā)布的GPT-4相當(dāng)于高中生的智能水平,而o1模型則是AI邁向博士生水平的關(guān)鍵一步。 測(cè)試表明,o1模型在國(guó)際數(shù)學(xué)奧林匹克資格考試中,可以獲得83%的分?jǐn)?shù),而GPT-4o只能正確解決13%的問(wèn)題。在編程能力比賽Codeforces中,o1模型達(dá)到89%百分位的成績(jī),而GPT-4o只有11%。 OpenAI表示,在下一個(gè)更新版本中,o1模型在物理、化學(xué)和生物學(xué)的挑戰(zhàn)性基準(zhǔn)測(cè)試中的表現(xiàn)將與博士生水平類似。 與現(xiàn)有的大模型相比,o1模型可以解決更困難的推理問(wèn)題,并改善以前的模型中存在的機(jī)制性缺陷。 在解決編程問(wèn)題時(shí),o1模型會(huì)更加有條理,在編寫代碼之前,會(huì)全面思考整個(gè)回答流程。 o1模型會(huì)不斷試錯(cuò)和打磨答案,從而提高生成結(jié)果的準(zhǔn)確性和質(zhì)量。 OpenAI宣布,ChatGPT訂閱用戶從9月12日起可以訪問(wèn)這兩個(gè)新模型,o1-preview每周消息數(shù)量限制為30條,o1-mini則為50條。(舉報(bào))