月之暗面發(fā)布新一代推理模型
中國人工智能公司月之暗面推出首款推理能力強化模型k0-math。
k0-math采用強化學習和思維鏈推理技術,模擬人腦思考和反思過程,大幅提升了解決數學難題的能力。
在多項數學基準能力測試中,k0-math表現優(yōu)異,對標OpenAI o1系列兩款可公開使用的模型:o1-mini和o1-preview。
根據官方結果,k0-math在中考、高考、考研和MATH等4個數學基準測試中均取得第一。
在業(yè)界最常使用的MATH能力基準測試中,k0-math得分93.8,超過o1-mini和o1-preview。
與常規(guī)模型不同,k0-math花更長時間推理,包括思考、規(guī)劃思路和反思,以提高答題成功率。
當前版本k0-math尚無法解答難以描述的幾何圖形類問題,對于過于簡單或極難的數學問題也存在一定局限性。
月之暗面表示,這些局限性也為模型迭代提供了機遇和挑戰(zhàn),將在下一階段逐步改善。
(舉報)