站長(zhǎng)之家(ChinaZ.com)9月18日 消息:昆侖萬維表示,其自研的天工大模型在 Benchmark GSM8K 測(cè)試中取得了80% 的正確率,超過了 GPT-3.5和 LLaMA2-70B,達(dá)到了全球領(lǐng)先水平,接近于 GPT-4。
天工大模型還在 MMLU、C-EVAL、HumanEval 等多個(gè)數(shù)據(jù)集上表現(xiàn)出色,準(zhǔn)確率均高于其他主流大模型。同樣,在中文開源數(shù)據(jù)集 CMATH 測(cè)試中,天工大模型也表現(xiàn)優(yōu)秀,準(zhǔn)確率超過了其他主流大模型。
昆侖萬維表示,天工大模型的優(yōu)秀表現(xiàn)得益于其對(duì)多數(shù)據(jù)源的高效融合策略、不同語言間的能力遷移以及對(duì)基座邏輯推理能力的深入探索。與 GPT-3.5相比,天工大模型的解題思路更為簡(jiǎn)單、清晰。
天工大模型目前仍處于內(nèi)測(cè)階段,將持續(xù)提升技術(shù)實(shí)力,為用戶和企業(yè)提供強(qiáng)大的智能化助力。
(舉報(bào))