无码在线播放二区|久久亚洲精品国产精品|无码视频在线观看一区二区|在线观看国产日韩亚洲中

  • <menu id="yw4o4"></menu>
  • 
    <menu id="yw4o4"><em id="yw4o4"></em></menu>
  • 首頁 > 傳媒 > 關(guān)鍵詞  > MiniMax最新資訊  > 正文

    ?中國大模型公司提出新架構(gòu),解決Context無限長問題,開啟Agent時(shí)代

    2025-01-16 16:26 · 稿源: 站長之家用戶

    日月開新元,萬象啟新篇。

    1 月 15 日,MiniMax發(fā)布并開源新一代 01 系列模型,包含基礎(chǔ)語言大模型 MiniMax-Text-01 和視覺多模態(tài)大模型MiniMax-VL-01。該系列模型使用多項(xiàng)突破性創(chuàng)新,以大規(guī)模應(yīng)用線性注意力機(jī)制打破Transformer傳統(tǒng)架構(gòu)記憶瓶頸,在綜合性能比肩GPT-4o、Claude-3. 5 等海外領(lǐng)軍模型的基礎(chǔ)上,能夠有效處理高達(dá) 400 萬token的輸入,可輸入長度是GPT-4o的 32 倍,Claude-3.5-Sonnet的 20 倍。

    目前,MiniMax- 01 系列開源模型已應(yīng)用于MiniMax旗下產(chǎn)品海螺AI并在全球上線,企業(yè)與個(gè)人開發(fā)者可前往MiniMax開放平臺(tái)使用API。

    以架構(gòu)創(chuàng)新實(shí)現(xiàn)有效超長文本輸入

    2017 年,具有里程碑意義的論文《Attention Is All You Need》正式發(fā)表,Transformer架構(gòu)問世并逐步發(fā)展成為該領(lǐng)域的主流技術(shù)范式。自 2023 年起,自然語言處理領(lǐng)域迎來了一股創(chuàng)新浪潮,對(duì)模型架構(gòu)的創(chuàng)新需求日益增加。

    MiniMax- 01 系列模型初次將線性注意力機(jī)制擴(kuò)展到商用模型的級(jí)別,并使其綜合能力達(dá)到全球首先梯隊(duì)。而受益于此次架構(gòu)創(chuàng)新,該系列模型在處理長輸入的時(shí)候具有非常高的效率,接近線性復(fù)雜度。從Scaling Law、與MoE的結(jié)合、結(jié)構(gòu)設(shè)計(jì)、訓(xùn)練優(yōu)化和推理優(yōu)化等層面綜合考慮,MiniMax選擇模型參數(shù)量為 4560 億,其中每次激活 459 億,能夠有效處理高達(dá) 400 萬token的上下文,將有效替代Transformer傳統(tǒng)架構(gòu)并開啟超長文本輸入時(shí)代。

    MiniMax- 01 模型發(fā)布后,在國內(nèi)外迅速掀起了熱議浪潮。海外媒體與AI從業(yè)者聚焦該模型,深入探討其技術(shù)內(nèi)涵與潛在價(jià)值,對(duì)其所展現(xiàn)出的創(chuàng)新性給予了高度肯定。

    性能比肩國際領(lǐng)軍模型

    在應(yīng)用創(chuàng)新架構(gòu)之外,MiniMax大規(guī)模重構(gòu)了 01 系列模型的訓(xùn)練和推理系統(tǒng),包括更有效的MoE All-to-all通訊優(yōu)化、更長的序列的優(yōu)化,以及推線性注意力層的有效Kernel實(shí)現(xiàn),使得模型能力可與全球優(yōu)質(zhì)閉源模型相媲美。

    在業(yè)界主流的文本和多模態(tài)理解任務(wù)處理表現(xiàn)上,MiniMax- 01 系列模型大多情況下可以追平海外公認(rèn)先進(jìn)的兩個(gè)模型,GPT-4o- 1120 以及Claude-3.5-sonnet-1022。過往的模型能力評(píng)測中,Google的自研模型Gemini有著顯著的長文優(yōu)勢。而在 01 系列模型參評(píng)的長文任務(wù)下,相較于Gemini等一眾全球優(yōu)質(zhì)模型,MiniMax- 01 隨著輸入長度變長,性能衰減最慢,效果及其出眾。

    ▲ 多項(xiàng)任務(wù)評(píng)測結(jié)果顯示,MiniMax- 01 系列模型核心性能穩(wěn)居全球首先梯隊(duì)。(圖源MiniMax- 01 系列模型技術(shù)報(bào)告)

    ▲ MiniMax- 01 系列模型長上下文處理能力全球領(lǐng)先。(圖源MiniMax- 01 系列模型技術(shù)報(bào)告)

    加速AI Agent時(shí)代到來

    2025 年,AI將迎來至關(guān)重要的發(fā)展節(jié)點(diǎn),AI Agent有望成為新一年最重要的產(chǎn)品形態(tài),引領(lǐng)AI從傳統(tǒng)的“工具”角色向更具互動(dòng)性與協(xié)作性的“伙伴”角色轉(zhuǎn)變。AI Agent時(shí)代,由于智能體處理的任務(wù)變得越來越復(fù)雜,涉及的數(shù)據(jù)量也越來越大,單個(gè)智能體的記憶以及多個(gè)智能體協(xié)作間的上下文都會(huì)變得越來越長。因此,長上下文能力與多模態(tài)處理能力的提升,是AI Agent為各行業(yè)帶來更為豐富、有效、智能的解決方案的必要條件。

    MiniMax在Github上開源了Text- 01 模型、VL- 01 模型的完整權(quán)重,以便于更多開發(fā)者做有價(jià)值、突破性的研究。MiniMax表示,“我們認(rèn)為這有可能啟發(fā)更多長上下文的研究和應(yīng)用,從而更快促進(jìn)Agent時(shí)代的到來,二是開源也能促使我們努力做更多創(chuàng)新,更高質(zhì)量地開展后續(xù)的模型研發(fā)工作?!?/p>

    憑借開放、共享、協(xié)作的特點(diǎn),開源模型激發(fā)AI產(chǎn)業(yè)的創(chuàng)新活力,正在成為賦能新質(zhì)生產(chǎn)力發(fā)展的關(guān)鍵引擎。受益于Linear Attention層面的架構(gòu)創(chuàng)新、算力層面的優(yōu)化,以及集群上的訓(xùn)推一體的設(shè)計(jì),MiniMax以業(yè)內(nèi)相當(dāng)性價(jià)比的價(jià)格提供文本模型和多模態(tài)理解模型的API服務(wù),標(biāo)準(zhǔn)定價(jià)是輸入token1 元/百萬token,輸出token8 元/百萬token。

    論文鏈接:https://filecdn.minimax.chat/_Arxiv_MiniMax_01_Report.pdf

    推廣

    特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))均為站長傳媒平臺(tái)用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù),對(duì)本頁面內(nèi)容所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任,相關(guān)信息僅供參考。站長之家將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。任何單位或個(gè)人認(rèn)為本頁面內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),可及時(shí)向站長之家提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明(點(diǎn)擊查看反饋聯(lián)系地址)。本網(wǎng)站在收到上述法律文件后,將會(huì)依法依規(guī)核實(shí)信息,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

    • 相關(guān)推薦
    • 為什么說廣告是AI大模型公司最現(xiàn)實(shí)的商業(yè)化選擇?

      從ChatGPT開啟訂閱模式開始,業(yè)界似乎默認(rèn)大模型公司的C端商業(yè)化道路就是一條——訂閱制。原因似乎也說得通——推理是有成本的。在經(jīng)過谷歌、Perplexity等公司的實(shí)踐,OpenAI、騰訊的躍躍欲試之后,廣告大概率會(huì)成為更多大模型公司商業(yè)化的現(xiàn)實(shí)選擇。

    • ChatGPT終于發(fā)布長期記憶功能,開啟個(gè)人Agent時(shí)代

      今天凌晨1點(diǎn),OpenAI對(duì)ChatGPT功能進(jìn)行了大更新,新增長期記憶功能,可以記住你過去所有的聊天記錄,會(huì)根據(jù)你的興趣、偏好提供更個(gè)性化的回答。這對(duì)于寫小說、金融分析、教育等領(lǐng)域幫助巨大。Team、Enterprise和Edu用戶將在幾周后獲得使用權(quán)限。

    • Aloudata Agent公測開啟:NoETL+大模型=好數(shù)據(jù)驅(qū)動(dòng)真智能,讓“萬數(shù)皆可問”

      4月22日,Aloudata大應(yīng)科技推出自研的Aloudata Agent,這是一款基于NoETL明細(xì)語義層的分析決策智能體,旨在通過自然語言實(shí)現(xiàn)數(shù)據(jù)查詢、歸因診斷、報(bào)告生成等功能。該產(chǎn)品解決了企業(yè)數(shù)據(jù)分析面臨的五大挑戰(zhàn):語義鴻溝、口徑一致性、場景覆蓋度、性能優(yōu)化和數(shù)據(jù)權(quán)限管控。Aloudata Agent采用NL2MQL2SQL技術(shù)路徑,通過指標(biāo)語義層實(shí)現(xiàn)業(yè)務(wù)語言與數(shù)據(jù)語言的精準(zhǔn)對(duì)齊,顯著提升查詢準(zhǔn)?

    • 谷歌A2A協(xié)議是什么? MCP 和 Agent2Agent 有什么區(qū)別?

      4月10日,在GoogleCloudNext大會(huì)上,谷歌宣布開源Agent2Agent協(xié)議,這一協(xié)議被業(yè)界視為智能體交互領(lǐng)域的“通用語言”,旨在突破跨平臺(tái)、多模態(tài)協(xié)作及安全保障等核心技術(shù)瓶頸,并聯(lián)合全球50余家科技企業(yè)共同構(gòu)建新一代智能生態(tài)。本文從技術(shù)實(shí)現(xiàn)與行業(yè)變革兩個(gè)維度,深度解析A2A協(xié)議的核心價(jià)值。這一協(xié)議的推出,標(biāo)志著智能體協(xié)作模式從封閉系統(tǒng)向開放生態(tài)的范式轉(zhuǎn)變,為產(chǎn)業(yè)數(shù)字化轉(zhuǎn)型注入新動(dòng)能。

    • 醒醒,只靠MCP和A2A還帶不來AI Agent的大繁榮

      文章探討了AI Agents發(fā)展需要類似HTTPS的安全協(xié)議保障?;仡櫥ヂ?lián)網(wǎng)發(fā)展歷程,TCP/IP協(xié)議統(tǒng)一了網(wǎng)絡(luò)通信標(biāo)準(zhǔn),HTTP協(xié)議實(shí)現(xiàn)了全球互聯(lián),而HTTPS通過SSL加密解決了安全問題。類比互聯(lián)網(wǎng)發(fā)展,當(dāng)前AI Agents產(chǎn)業(yè)面臨類似挑戰(zhàn):Anthropic推出的MCP協(xié)議解決智能體與工具連接問題,Google的A2A協(xié)議實(shí)現(xiàn)智能體間協(xié)作,但缺乏安全標(biāo)準(zhǔn)。IIFAA聯(lián)盟正致力于構(gòu)建AI Agents安全生態(tài),推出ASL中間件保障數(shù)據(jù)隱私和身份認(rèn)證。文章指出,正如HTTPS推動(dòng)電商繁榮,AI Agents的安全標(biāo)準(zhǔn)化將加速商業(yè)化進(jìn)程,螞蟻集團(tuán)等企業(yè)已開始實(shí)踐MCP應(yīng)用。未來AI Agents可能通過統(tǒng)一入口調(diào)用工具池,改變現(xiàn)有交互模式。

    • 谷歌開源發(fā)布A2A協(xié)議 Agent2Agent智能體交互協(xié)議詳細(xì)介紹

      在GoogleCloudNext25大會(huì)上,谷歌宣布開源了首個(gè)標(biāo)準(zhǔn)智能體交互協(xié)議——Agent2AgentProtocol,這一舉措有望徹底改變智能體之間的交互方式,打破系統(tǒng)孤島,對(duì)智能體的能力、跨平臺(tái)協(xié)作以及執(zhí)行效率產(chǎn)生質(zhì)的飛躍。A2A協(xié)議是一種開放標(biāo)準(zhǔn),旨在為智能體提供一種通用的交互方式,使它們能夠在不同的底層框架和供應(yīng)商之間無縫協(xié)作。每個(gè)部分都有指定的內(nèi)容類型,這使得客戶端和遠(yuǎn)程智能體能夠協(xié)商所需的正確格式,并且明確包括用戶界面能力的協(xié)商,比如iframe、視頻、網(wǎng)絡(luò)表單等,從根據(jù)用戶的需求和設(shè)備的能力,提供最佳的用戶體驗(yàn)。

    • 接替Manus,字節(jié)的Agent王牌能打多久?

      字節(jié)跳動(dòng)旗下智能體平臺(tái)"扣子空間"推出首款由大廠發(fā)布的Agent爆款產(chǎn)品,自4月18日上線后引發(fā)用戶瘋搶邀請(qǐng)碼。該產(chǎn)品具備規(guī)劃、工具調(diào)用和記憶等關(guān)鍵能力,支持游戲攻略撰寫、市場調(diào)研等復(fù)雜需求,并首創(chuàng)"探索模式"和"規(guī)劃模式"雙交互設(shè)計(jì)。雖然底層模型能力較DeepResearch和Manus仍有差距,但憑借產(chǎn)品設(shè)計(jì)優(yōu)化和量大價(jià)優(yōu)的優(yōu)勢,成功填補(bǔ)了Manus留下的市場空白。字節(jié)同步推出企業(yè)版HiAgent解決私有化部署問題,半年內(nèi)智能體業(yè)務(wù)訂單量增長超330%。當(dāng)前行業(yè)正迎來Agent爆發(fā)期,但企業(yè)落地仍面臨系統(tǒng)接入、數(shù)據(jù)安全等挑戰(zhàn)。

    • 「扣子空間」內(nèi)測上線,和 Agent 一起開始你的工作

      “摘星空間”平臺(tái)正式推出,集生產(chǎn)、專業(yè)領(lǐng)域支持及雙模系統(tǒng)協(xié)作能力,通過多類型AI智能體實(shí)現(xiàn)高效辦公,具備生產(chǎn)提升、專家深度支持、雙模協(xié)同等四大核心功能,未來將持續(xù)擴(kuò)展Agent能力邊界。

    • 多模態(tài)和Agent成為大廠AI的新賽 點(diǎn)

      這是《窄播Weekly》的第52期,本期我們關(guān)注的商業(yè)動(dòng)態(tài)是:當(dāng)大廠的AI競爭策略開始傾斜向應(yīng)用場景,多模態(tài)能力和代理執(zhí)行成為兩個(gè)焦點(diǎn)。大模型落地C端場景的核心,就是讓大模型的能力越來越接近人。沿著這個(gè)主旋律,可以劃分出兩個(gè)進(jìn)化方向:一個(gè)是持續(xù)降低用戶與大模型進(jìn)行有效溝通的難度;另一個(gè)則是讓大模型具備執(zhí)行更復(fù)雜任務(wù)的能力。前者的實(shí)現(xiàn),需要給到大模型多

    • 多模態(tài)和Agent成為大廠AI的新賽點(diǎn)

      本期《窄播Weekly》聚焦AI大廠競爭策略向應(yīng)用場景傾斜的趨勢,重點(diǎn)分析了多模態(tài)能力和代理執(zhí)行兩大發(fā)展方向。文章指出,大模型落地的核心在于讓人機(jī)交互更自然,具體表現(xiàn)為:1)通過多模態(tài)技術(shù)降低用戶使用門檻,如阿里夸克新推出的"拍照問夸克"功能;2)通過代理執(zhí)行提升復(fù)雜任務(wù)處理能力,如字節(jié)、百度等推出的通用Agent產(chǎn)品。國內(nèi)外廠商路徑差異明顯:國?