700 億參數(shù) LLaMA2 訓(xùn)練加速 195%，基礎(chǔ)大模型實(shí)踐再升級

2023-09-04 13:50 · 稿源：機(jī)器之心公眾號(hào)

ChatGPT 引發(fā)的大模型熱潮愈演愈烈，全球科技巨頭和明星初創(chuàng)爭相入局，打造以 AI 大模型為核心的競爭力和多樣化商業(yè)使用需求。其中 LLaMA 系列模型，因良好的基礎(chǔ)能力和開放生態(tài)，已積累了海量的用戶和實(shí)際應(yīng)用案例，成為無數(shù)開源模型后來者的模仿和競爭的標(biāo)桿對象。但如何降低類

......

本文由站長之家合作伙伴自媒體作者“機(jī)器之心公眾號(hào)”授權(quán)發(fā)布于站長之家平臺(tái)，本平臺(tái)僅提供信息索引服務(wù)。由于內(nèi)容發(fā)布時(shí)間超過平臺(tái)更新維護(hù)時(shí)間，為了保證文章信息的及時(shí)性，內(nèi)容觀點(diǎn)的準(zhǔn)確性，平臺(tái)將不提供完全的內(nèi)容展現(xiàn)，本頁面內(nèi)容僅為平臺(tái)搜索索引使用。需閱讀完整內(nèi)容的用戶，請查看原文，獲取內(nèi)容詳情。

即將跳轉(zhuǎn)到外部網(wǎng)站

安全性未知，是否繼續(xù)

繼續(xù)前往

（舉報(bào)）

相關(guān)推薦

關(guān)鍵詞：

苦等一年 Meta終于放大招正式發(fā)布開源大模型Llama 4

美國科技巨擘Meta重磅推出其迄今最為強(qiáng)大的開源AI模型Llama4，恰逢Llama3上市一周年之際。Llama4系列采用了先進(jìn)的混合專家架構(gòu)，這一架構(gòu)在模型訓(xùn)練及用戶查詢回答過程中展現(xiàn)出更高效率，通過將模型劃分為多個(gè)專注于特定任務(wù)的專家”子模型，實(shí)現(xiàn)精準(zhǔn)高效的處理。Meta首席執(zhí)行官扎克伯格表示：他們的目標(biāo)是建立世界領(lǐng)先的人工智能，將其開源，并使其普遍可用，以便世界上每個(gè)人都能受益。

?Meta ?Llama ?4
Llama 4大模型跌落神壇：作弊刷榜、代碼能力極差、和DeepSeek比就是偽開源

被寄予厚望的美國Meta公司的最新開源大模型Llama4發(fā)布不到2天時(shí)間，口碑急轉(zhuǎn)直下，被質(zhì)疑為刷榜作弊實(shí)際效果差、開源條件多部署門檻高是偽開源等。大模型評測平臺(tái)LMArena親自下場發(fā)文，打臉Meta提供給平臺(tái)的Llama4是“特供版”。Meta若繼續(xù)在商業(yè)控制與技術(shù)開放之間搖擺，恐將在AI競賽中進(jìn)一步失去開發(fā)者支持。

?Meta ?Llama ?4
Meta說他們的 Llama 4 偏見少了！但，“虛假對等”才是真偏見

Meta公司稱，相比之前的版本，他們最新的人工智能模型Llama4的政治偏見更少了。其中一部分便是通過允許該模型回答更多帶有政治爭議性的問題來實(shí)現(xiàn)這一點(diǎn)的。下次當(dāng)你使用Meta的AI產(chǎn)品時(shí)，它可能會(huì)為“通過服用馬用鎮(zhèn)靜劑來治療新冠病毒”這種觀點(diǎn)說好話！

?meta ?ai產(chǎn)品 ?Llama4
實(shí)錘了，Llama 4重測排名掉至32名！遠(yuǎn)不及DeepSeek和Qwen

LMArena更新了Meta最新發(fā)布的開源大模型Llama-4-Maverick的排名，從此前的第2名，直線掉到了第32名！這也實(shí)錘了此前開發(fā)者對Meta為刷榜排名向LMArena提供了“特供版”的Llama4大模型的質(zhì)疑。開源版同款Llama-4-Maverick-17B-128E-Instruct在LMArena的排名為32名，遠(yuǎn)低于Gemini2.5Pro、GPT4o、DeepSeek-V3-0324、DeepSeek-R1、Qwen2.5-Max，甚至連英偉達(dá)基于上一代Llama3.3改造的Llama-3.3-Nemotron-Super-49B-v1都不如。

?Meta ?Llama ?4
薦反擊DeepSeek失敗！Llama 4效果不好，Meta承認(rèn)有問題

今天凌晨1點(diǎn)半，Meta生成式AI領(lǐng)導(dǎo)者AhmadAl-Dahle在社交平臺(tái)發(fā)布了一篇長文，對前天剛開源的Llama4質(zhì)疑進(jìn)行了官方回應(yīng)。Ahmad表示，Llama4一開發(fā)完就發(fā)布了，所以，不同服務(wù)中模型質(zhì)量難免會(huì)有一些差異。由于關(guān)稅大戰(zhàn)的原因，Meta的股票遭遇重創(chuàng)，他們也需要一個(gè)利好消息來拉升股票，現(xiàn)在適得其反。

?Meta ?Llama4 ?生成式AI
薦剛剛，Llama 4深夜開源擊敗DeepSeek V3！2萬億多模態(tài)巨獸搶回王座

Llama4重磅發(fā)布了!Meta官宣開源首個(gè)原生多模態(tài)Llama4，首次采用的MoE架構(gòu)，支持12種語言，首批發(fā)布一共兩款:Llama4Scout:共有1090億參數(shù)，17B活躍參數(shù)，16個(gè)專家，1000萬上下Llama4Maverick:共有4000億參數(shù)，17B活躍參數(shù)，128個(gè)專家，100萬上下文另外，2萬億參數(shù)Llama4Behemoth將在未來幾個(gè)月面世，288B活躍參數(shù)，16個(gè)專家。Llama4的橫空出世，成為迄今為止開源最強(qiáng)，多模態(tài)能力最好的模型之一。L

?Llama4 ?多模態(tài)AI ?Meta開源
薦Llama 4五大疑點(diǎn)曝光，逐層扒皮，全球AI進(jìn)步停滯，NYU教授稱Scaling徹底結(jié)束

令人失望的Llama4，只是前奏已。接下來我們恐將看到——全球局勢的改變，將徹底阻止AI進(jìn)步!最近，一位AICEO做出長視頻，逐級對Llama4身上的六大疑點(diǎn)進(jìn)行了扒皮。GaryMarcus正在尋找對開發(fā)更可靠替代方法有興趣的投資者。

?Llama4 ?AI進(jìn)步 ?全球局勢
薦剛剛，商湯發(fā)布第六代大模型：6000億參數(shù)多模態(tài)MoE，中長視頻直接可推理

現(xiàn)在的國產(chǎn)AI應(yīng)用，一口氣看好幾分鐘的視頻，都可以直接做推理和解析了!瞧~只需“喂”上一段柯南片段，AI就搖身一變成“名偵探”做剖析:它會(huì)對整個(gè)視頻的內(nèi)容先做一個(gè)總結(jié)，再按照秒級，對視頻片段做內(nèi)容上的推演。商湯科技聯(lián)合創(chuàng)始人楊帆認(rèn)為:銀河通用合伙人、大模型負(fù)責(zé)人張直政表示:除此之外，上海交通大學(xué)副教授閆維新對這個(gè)問題的看法是:總言之，商湯作為國?

?國產(chǎn)AI ?視頻解析 ?智能剪輯
合合信息發(fā)布“大模型加速器 2.0”，助力大模型跨越“幻覺”障礙

近日，上海合合信息科技股份有限公司（簡稱“合合信息”）TextIn“大模型加速器 2.0”版本正式上線，憑借其多維度升級，為降低大模型“幻覺”風(fēng)險(xiǎn)、推動(dòng)大模型精準(zhǔn)應(yīng)用提供了強(qiáng)大助力。訓(xùn)練數(shù)據(jù)是影響大模型“認(rèn)知能力”的關(guān)鍵，合合信息“大模型加速器 2.0”基于領(lǐng)先的智能文檔處理技術(shù)，從數(shù)據(jù)源頭入手，對復(fù)雜文檔的版式、布局和元素進(jìn)行精準(zhǔn)解析及結(jié)構(gòu)化處理，

?大模型加速器 ?合合信息 ?智能文檔處理
薦從大模型到AI基礎(chǔ)設(shè)施，商湯的反向求解

大模型落地如火如荼，從上一代AI浪潮中殺出來的商湯，嗅到了這里面新的機(jī)會(huì)。在最火的具身智能賽道，這兩年誕生了許多明星創(chuàng)業(yè)公司。這些創(chuàng)業(yè)公司的創(chuàng)始人往往擁有技術(shù)明星的光環(huán)，不少都是在學(xué)術(shù)界中某個(gè)技術(shù)領(lǐng)域中響當(dāng)當(dāng)?shù)念I(lǐng)頭人。這些初創(chuàng)公司雖然在某一個(gè)單點(diǎn)技術(shù)上遙遙領(lǐng)先（大腦、小腦或者本體），但在機(jī)器人落地過程中，要突破從單一技術(shù)到整體復(fù)雜產(chǎn)品

?大模型 ?具身智能 ?機(jī)器人技術(shù)

熱文

3 天
7天

站長商機(jī)

商務(wù)合作侵權(quán)投訴廣告服務(wù) 版權(quán)聲明招聘