根據(jù) SuperCLUE 發(fā)布的中文大模型基準(zhǔn)測評報告,阿里巴巴的通義千問開源模型 Qwen2-72B-Instruct 在國內(nèi)通用能力上排名第一,并在全球范圍內(nèi)成為最強大的開源模型。
報告顯示,Qwen2-72B 在綜合測評中獲得了 77 分的高分,僅次于 OpenAI 的 GPT-4o,與 Claude-3.5-Sonnet 并列第二。它超越了百度文心一言 4.0、訊飛星火 V4.0、Llama-3-70B 等開閉源大模型。
在具體測評中,Qwen2-72B 在理科、文科和 Hard 三個維度的表現(xiàn)全面均衡。它在理科任務(wù)上的得分與 GPT-4o 僅相差 5 分,顯示出其在計算、邏輯推理和代碼測評方面的優(yōu)勢。
值得注意的是,在端側(cè)小模型測評中,Qwen2-7B 以 70 億參數(shù)的模型規(guī)模超越了上一代 320 億參數(shù)的 Qwen1.5-32B 和 130 億參數(shù)的 Llama-3-8B-Instruct,奪得排名第一。這證明了 Qwen2-7B 在小尺寸模型中的卓越性能,為端側(cè)小模型的落地提供了更多可能。
截至目前,Qwen 系列模型的下載量已突破 2000 萬次,其應(yīng)用場景覆蓋了工業(yè)、金融、醫(yī)療、汽車等多個垂直領(lǐng)域。
(舉報)