无码在线播放二区|久久亚洲精品国产精品|无码视频在线观看一区二区|在线观看国产日韩亚洲中

<menu id="yw4o4"></menu>

<menu id="yw4o4"><em id="yw4o4"></em></menu>

性能超越LLaMA2-7B！AI模型JetMoE-8B訓(xùn)練成本不到10萬(wàn)美元

2024-04-17 10:18 · 稿源：站長(zhǎng)之家

站長(zhǎng)之家（ChinaZ.com）4月17日消息:JetMoE-8B是一款采用稀疏激活架構(gòu)的人工智能模型，其性能卓越且訓(xùn)練成本不到10萬(wàn)美元，令人驚訝的是，它的表現(xiàn)甚至超越了LLaMA2-7B、LLaMA-13B和DeepseekMoE-16B。

JetMoE-8B由24個(gè)塊組成，每個(gè)塊包含兩個(gè)MoE層:注意力頭混合（MoA）和MLP專家混合(MoE)。每個(gè)MoA和MoE層有8個(gè)專家，并且每個(gè)輸入令牌激活2個(gè)專家。這種獨(dú)特的設(shè)計(jì)使得在不犧牲性能的情況下顯著降低了計(jì)算成本。

值得一提的是，盡管JetMoE-8B的總參數(shù)量達(dá)到80億，但由于其特殊的架構(gòu)設(shè)計(jì)，每個(gè)輸入令牌僅激活約22億參數(shù)，從而大大減少了總體的計(jì)算需求。

此外，JetMoE-8B的訓(xùn)練完全依賴于公開(kāi)數(shù)據(jù)，并且整個(gè)訓(xùn)練過(guò)程，包括代碼，都是完全開(kāi)源的，這無(wú)疑為AI領(lǐng)域的研究和應(yīng)用提供了極大的便利。

在與Open LLM排行榜相同的評(píng)估方法下，JetMoE-8B的性能表現(xiàn)優(yōu)于LLaMA2-7B、LLaMA-13B和DeepseekMoE-16B，這一結(jié)果無(wú)疑是對(duì)其高效性能的最好證明。

與此同時(shí)，與具有類似訓(xùn)練和推理計(jì)算的模型（如Gemma-2B）相比，JetMoE-8B展示了更優(yōu)異的表現(xiàn)。這不僅證明了其在性能上的優(yōu)勢(shì)，也展示了其在成本效益上的顯著優(yōu)勢(shì)。

模型地址:https://huggingface.co/jetmoe/jetmoe-8b

（舉報(bào)）

相關(guān)推薦

關(guān)鍵詞：

苦等一年 Meta終于放大招正式發(fā)布開(kāi)源大模型Llama 4

美國(guó)科技巨擘Meta重磅推出其迄今最為強(qiáng)大的開(kāi)源AI模型Llama4，恰逢Llama3上市一周年之際。Llama4系列采用了先進(jìn)的混合專家架構(gòu)，這一架構(gòu)在模型訓(xùn)練及用戶查詢回答過(guò)程中展現(xiàn)出更高效率，通過(guò)將模型劃分為多個(gè)專注于特定任務(wù)的專家”子模型，實(shí)現(xiàn)精準(zhǔn)高效的處理。Meta首席執(zhí)行官扎克伯格表示：他們的目標(biāo)是建立世界領(lǐng)先的人工智能，將其開(kāi)源，并使其普遍可用，以便世界上每個(gè)人都能受益。

?Meta ?Llama ?4
Meta說(shuō)他們的 Llama 4 偏見(jiàn)少了！但，“虛假對(duì)等”才是真偏見(jiàn)

Meta公司稱，相比之前的版本，他們最新的人工智能模型Llama4的政治偏見(jiàn)更少了。其中一部分便是通過(guò)允許該模型回答更多帶有政治爭(zhēng)議性的問(wèn)題來(lái)實(shí)現(xiàn)這一點(diǎn)的。下次當(dāng)你使用Meta的AI產(chǎn)品時(shí)，它可能會(huì)為“通過(guò)服用馬用鎮(zhèn)靜劑來(lái)治療新冠病毒”這種觀點(diǎn)說(shuō)好話！

?meta ?ai產(chǎn)品 ?Llama4
Llama 4大模型跌落神壇：作弊刷榜、代碼能力極差、和DeepSeek比就是偽開(kāi)源

被寄予厚望的美國(guó)Meta公司的最新開(kāi)源大模型Llama4發(fā)布不到2天時(shí)間，口碑急轉(zhuǎn)直下，被質(zhì)疑為刷榜作弊實(shí)際效果差、開(kāi)源條件多部署門檻高是偽開(kāi)源等。大模型評(píng)測(cè)平臺(tái)LMArena親自下場(chǎng)發(fā)文，打臉Meta提供給平臺(tái)的Llama4是“特供版”。Meta若繼續(xù)在商業(yè)控制與技術(shù)開(kāi)放之間搖擺，恐將在AI競(jìng)賽中進(jìn)一步失去開(kāi)發(fā)者支持。

?Meta ?Llama ?4
換個(gè)新題材，新品正式上線10天日流水突破10萬(wàn)美元

如果說(shuō)最近的手游市場(chǎng)里什么題材最火，“罪案”和“監(jiān)獄”很可能是最值得觀察的方向之一。此前筆者在統(tǒng)計(jì)北京廠商頭部合成產(chǎn)品的時(shí)候就發(fā)現(xiàn)，隨著市場(chǎng)競(jìng)爭(zhēng)越來(lái)越激烈，合成游戲的劇情走向也越來(lái)越緊張刺激?！窵andsofJail」的新思路雖然證明了市場(chǎng)潛力，但如果想要進(jìn)一步成長(zhǎng)為頭部產(chǎn)品，很可能需要對(duì)核心玩法做出更多具有特色的創(chuàng)新。

?手游市場(chǎng) ?罪案題材 ?監(jiān)獄游戲
薦反擊DeepSeek失??！Llama 4效果不好，Meta承認(rèn)有問(wèn)題

今天凌晨1點(diǎn)半，Meta生成式AI領(lǐng)導(dǎo)者AhmadAl-Dahle在社交平臺(tái)發(fā)布了一篇長(zhǎng)文，對(duì)前天剛開(kāi)源的Llama4質(zhì)疑進(jìn)行了官方回應(yīng)。Ahmad表示，Llama4一開(kāi)發(fā)完就發(fā)布了，所以，不同服務(wù)中模型質(zhì)量難免會(huì)有一些差異。由于關(guān)稅大戰(zhàn)的原因，Meta的股票遭遇重創(chuàng)，他們也需要一個(gè)利好消息來(lái)拉升股票，現(xiàn)在適得其反。

?Meta ?Llama4 ?生成式AI
實(shí)錘了，Llama 4重測(cè)排名掉至32名！遠(yuǎn)不及DeepSeek和Qwen

LMArena更新了Meta最新發(fā)布的開(kāi)源大模型Llama-4-Maverick的排名，從此前的第2名，直線掉到了第32名！這也實(shí)錘了此前開(kāi)發(fā)者對(duì)Meta為刷榜排名向LMArena提供了“特供版”的Llama4大模型的質(zhì)疑。開(kāi)源版同款Llama-4-Maverick-17B-128E-Instruct在LMArena的排名為32名，遠(yuǎn)低于Gemini2.5Pro、GPT4o、DeepSeek-V3-0324、DeepSeek-R1、Qwen2.5-Max，甚至連英偉達(dá)基于上一代Llama3.3改造的Llama-3.3-Nemotron-Super-49B-v1都不如。

?Meta ?Llama ?4
薦Llama 4五大疑點(diǎn)曝光，逐層扒皮，全球AI進(jìn)步停滯，NYU教授稱Scaling徹底結(jié)束

令人失望的Llama4，只是前奏已。接下來(lái)我們恐將看到——全球局勢(shì)的改變，將徹底阻止AI進(jìn)步!最近，一位AICEO做出長(zhǎng)視頻，逐級(jí)對(duì)Llama4身上的六大疑點(diǎn)進(jìn)行了扒皮。GaryMarcus正在尋找對(duì)開(kāi)發(fā)更可靠替代方法有興趣的投資者。

?Llama4 ?AI進(jìn)步 ?全球局勢(shì)
薦剛剛，Llama 4深夜開(kāi)源擊敗DeepSeek V3！2萬(wàn)億多模態(tài)巨獸搶回王座

Llama4重磅發(fā)布了!Meta官宣開(kāi)源首個(gè)原生多模態(tài)Llama4，首次采用的MoE架構(gòu)，支持12種語(yǔ)言，首批發(fā)布一共兩款:Llama4Scout:共有1090億參數(shù)，17B活躍參數(shù)，16個(gè)專家，1000萬(wàn)上下Llama4Maverick:共有4000億參數(shù)，17B活躍參數(shù)，128個(gè)專家，100萬(wàn)上下文另外，2萬(wàn)億參數(shù)Llama4Behemoth將在未來(lái)幾個(gè)月面世，288B活躍參數(shù)，16個(gè)專家。Llama4的橫空出世，成為迄今為止開(kāi)源最強(qiáng)，多模態(tài)能力最好的模型之一。L

?Llama4 ?多模態(tài)AI ?Meta開(kāi)源
AI驅(qū)動(dòng)食品供應(yīng)鏈，食品科技獨(dú)角獸GrubMarket再獲5000萬(wàn)美元融資

4 月 16 日消息，美國(guó)最大的私營(yíng)食品技術(shù)公司GrubMarket宣布獲得 5000 萬(wàn)美元G輪融資。本輪融資由LibertyStreet Funds、3Spoke Capital、ROC Venture Group、Portfolia、Pegasus Tech Ventures、Joseph Stone Capital以及其他未具名的投資者參與。自成立以來(lái)，GrubMarket已完成多輪融資，融資金額達(dá)5. 5 億美元，目前估值超過(guò) 35 億美元。GrubMarket創(chuàng)始人兼首席執(zhí)行官徐敏毅表示:"過(guò)去 12 個(gè)月公司實(shí)現(xiàn)了加速增長(zhǎng)?
英偉達(dá)將首次在美制造 AI 超算、及 Blackwell 芯片

站長(zhǎng)之家(ChinaZ.com) 4月15日消息:隨著 AI 行業(yè)的蓬勃發(fā)展，英偉達(dá)位于美國(guó)的人工智能芯片和超級(jí)計(jì)算機(jī)工廠將創(chuàng)造數(shù)千個(gè)就業(yè)機(jī)會(huì)。科技巨頭英偉達(dá)（NVIDIA）宣布，其 AI 超級(jí)計(jì)算機(jī)將完全在美國(guó)本土生產(chǎn)。在全球貿(mào)易戰(zhàn)的背景下，英偉達(dá)這一舉動(dòng)是為了減少對(duì)海外市場(chǎng)的依賴，并促進(jìn)美國(guó)國(guó)內(nèi)的生產(chǎn)。英偉達(dá)確認(rèn)，他們已開(kāi)始在臺(tái)積電位于美國(guó)亞利桑那州鳳凰城的工廠生產(chǎn)?

?NVIDIA ?臺(tái)積電 ?人工智能

熱文

3 天
7天

站長(zhǎng)商機(jī)

廣告

商務(wù)合作侵權(quán)投訴廣告服務(wù) 版權(quán)聲明招聘

?CopyRight 2002-2020 CHINAZ.COM

<rt id="oa2r9"></rt>

<rp id="oa2r9"><th id="oa2r9"></th></rp>