无码在线播放二区|久久亚洲精品国产精品|无码视频在线观看一区二区|在线观看国产日韩亚洲中

<menu id="yw4o4"></menu>

<menu id="yw4o4"><em id="yw4o4"></em></menu>

?中國大模型公司提出新架構(gòu)，解決Context無限長問題，開啟Agent時(shí)代

2025-01-16 16:26 · 稿源：站長之家用戶

日月開新元，萬象啟新篇。

1 月 15 日，MiniMax發(fā)布并開源新一代 01 系列模型，包含基礎(chǔ)語言大模型 MiniMax-Text-01 和視覺多模態(tài)大模型MiniMax-VL-01。該系列模型使用多項(xiàng)突破性創(chuàng)新，以大規(guī)模應(yīng)用線性注意力機(jī)制打破Transformer傳統(tǒng)架構(gòu)記憶瓶頸，在綜合性能比肩GPT-4o、Claude-3. 5 等海外領(lǐng)軍模型的基礎(chǔ)上，能夠有效處理高達(dá) 400 萬token的輸入，可輸入長度是GPT-4o的 32 倍，Claude-3.5-Sonnet的 20 倍。

目前，MiniMax- 01 系列開源模型已應(yīng)用于MiniMax旗下產(chǎn)品海螺AI并在全球上線，企業(yè)與個(gè)人開發(fā)者可前往MiniMax開放平臺(tái)使用API。

以架構(gòu)創(chuàng)新實(shí)現(xiàn)有效超長文本輸入

2017 年，具有里程碑意義的論文《Attention Is All You Need》正式發(fā)表，Transformer架構(gòu)問世并逐步發(fā)展成為該領(lǐng)域的主流技術(shù)范式。自 2023 年起，自然語言處理領(lǐng)域迎來了一股創(chuàng)新浪潮，對(duì)模型架構(gòu)的創(chuàng)新需求日益增加。

MiniMax- 01 系列模型初次將線性注意力機(jī)制擴(kuò)展到商用模型的級(jí)別，并使其綜合能力達(dá)到全球首先梯隊(duì)。而受益于此次架構(gòu)創(chuàng)新，該系列模型在處理長輸入的時(shí)候具有非常高的效率，接近線性復(fù)雜度。從Scaling Law、與MoE的結(jié)合、結(jié)構(gòu)設(shè)計(jì)、訓(xùn)練優(yōu)化和推理優(yōu)化等層面綜合考慮，MiniMax選擇模型參數(shù)量為 4560 億，其中每次激活 459 億，能夠有效處理高達(dá) 400 萬token的上下文，將有效替代Transformer傳統(tǒng)架構(gòu)并開啟超長文本輸入時(shí)代。

MiniMax- 01 模型發(fā)布后，在國內(nèi)外迅速掀起了熱議浪潮。海外媒體與AI從業(yè)者聚焦該模型，深入探討其技術(shù)內(nèi)涵與潛在價(jià)值，對(duì)其所展現(xiàn)出的創(chuàng)新性給予了高度肯定。

性能比肩國際領(lǐng)軍模型

在應(yīng)用創(chuàng)新架構(gòu)之外，MiniMax大規(guī)模重構(gòu)了 01 系列模型的訓(xùn)練和推理系統(tǒng)，包括更有效的MoE All-to-all通訊優(yōu)化、更長的序列的優(yōu)化，以及推線性注意力層的有效Kernel實(shí)現(xiàn)，使得模型能力可與全球優(yōu)質(zhì)閉源模型相媲美。

在業(yè)界主流的文本和多模態(tài)理解任務(wù)處理表現(xiàn)上，MiniMax- 01 系列模型大多情況下可以追平海外公認(rèn)先進(jìn)的兩個(gè)模型，GPT-4o- 1120 以及Claude-3.5-sonnet-1022。過往的模型能力評(píng)測中，Google的自研模型Gemini有著顯著的長文優(yōu)勢。而在 01 系列模型參評(píng)的長文任務(wù)下，相較于Gemini等一眾全球優(yōu)質(zhì)模型，MiniMax- 01 隨著輸入長度變長，性能衰減最慢，效果及其出眾。

▲ 多項(xiàng)任務(wù)評(píng)測結(jié)果顯示，MiniMax- 01 系列模型核心性能穩(wěn)居全球首先梯隊(duì)。（圖源MiniMax- 01 系列模型技術(shù)報(bào)告）

▲ MiniMax- 01 系列模型長上下文處理能力全球領(lǐng)先。（圖源MiniMax- 01 系列模型技術(shù)報(bào)告）

加速AI Agent時(shí)代到來

2025 年，AI將迎來至關(guān)重要的發(fā)展節(jié)點(diǎn)，AI Agent有望成為新一年最重要的產(chǎn)品形態(tài)，引領(lǐng)AI從傳統(tǒng)的“工具”角色向更具互動(dòng)性與協(xié)作性的“伙伴”角色轉(zhuǎn)變。AI Agent時(shí)代，由于智能體處理的任務(wù)變得越來越復(fù)雜，涉及的數(shù)據(jù)量也越來越大，單個(gè)智能體的記憶以及多個(gè)智能體協(xié)作間的上下文都會(huì)變得越來越長。因此，長上下文能力與多模態(tài)處理能力的提升，是AI Agent為各行業(yè)帶來更為豐富、有效、智能的解決方案的必要條件。

MiniMax在Github上開源了Text- 01 模型、VL- 01 模型的完整權(quán)重，以便于更多開發(fā)者做有價(jià)值、突破性的研究。MiniMax表示，“我們認(rèn)為這有可能啟發(fā)更多長上下文的研究和應(yīng)用，從而更快促進(jìn)Agent時(shí)代的到來，二是開源也能促使我們努力做更多創(chuàng)新，更高質(zhì)量地開展后續(xù)的模型研發(fā)工作?！?/p>

憑借開放、共享、協(xié)作的特點(diǎn)，開源模型激發(fā)AI產(chǎn)業(yè)的創(chuàng)新活力，正在成為賦能新質(zhì)生產(chǎn)力發(fā)展的關(guān)鍵引擎。受益于Linear Attention層面的架構(gòu)創(chuàng)新、算力層面的優(yōu)化，以及集群上的訓(xùn)推一體的設(shè)計(jì)，MiniMax以業(yè)內(nèi)相當(dāng)性價(jià)比的價(jià)格提供文本模型和多模態(tài)理解模型的API服務(wù)，標(biāo)準(zhǔn)定價(jià)是輸入token1 元/百萬token，輸出token8 元/百萬token。

論文鏈接：https://filecdn.minimax.chat/_Arxiv_MiniMax_01_Report.pdf

（推廣）

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))均為站長傳媒平臺(tái)用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)，對(duì)本頁面內(nèi)容所引致的錯(cuò)誤、不確或遺漏，概不負(fù)任何法律責(zé)任，相關(guān)信息僅供參考。站長之家將盡力確保所提供信息的準(zhǔn)確性及可靠性，但不保證有關(guān)資料的準(zhǔn)確性及可靠性，讀者在使用前請(qǐng)進(jìn)一步核實(shí)，并對(duì)任何自主決定的行為負(fù)責(zé)。任何單位或個(gè)人認(rèn)為本頁面內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí)，可及時(shí)向站長之家提出書面權(quán)利通知或不實(shí)情況說明，并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明（點(diǎn)擊查看反饋聯(lián)系地址）。本網(wǎng)站在收到上述法律文件后，將會(huì)依法依規(guī)核實(shí)信息，溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

相關(guān)推薦

關(guān)鍵詞：

薦為什么說廣告是AI大模型公司最現(xiàn)實(shí)的商業(yè)化選擇？

從ChatGPT開啟訂閱模式開始，業(yè)界似乎默認(rèn)大模型公司的C端商業(yè)化道路就是一條——訂閱制。原因似乎也說得通——推理是有成本的。在經(jīng)過谷歌、Perplexity等公司的實(shí)踐，OpenAI、騰訊的躍躍欲試之后，廣告大概率會(huì)成為更多大模型公司商業(yè)化的現(xiàn)實(shí)選擇。

?大模型商業(yè)化 ?AI訂閱模式 ?廣告變現(xiàn)
薦ChatGPT終于發(fā)布長期記憶功能，開啟個(gè)人Agent時(shí)代

今天凌晨1點(diǎn)，OpenAI對(duì)ChatGPT功能進(jìn)行了大更新，新增長期記憶功能，可以記住你過去所有的聊天記錄，會(huì)根據(jù)你的興趣、偏好提供更個(gè)性化的回答。這對(duì)于寫小說、金融分析、教育等領(lǐng)域幫助巨大。Team、Enterprise和Edu用戶將在幾周后獲得使用權(quán)限。

?ChatGPT ?長記憶功能 ?個(gè)性化回答
Aloudata Agent公測開啟：NoETL+大模型=好數(shù)據(jù)驅(qū)動(dòng)真智能，讓“萬數(shù)皆可問”

4月22日，Aloudata大應(yīng)科技推出自研的Aloudata Agent，這是一款基于NoETL明細(xì)語義層的分析決策智能體，旨在通過自然語言實(shí)現(xiàn)數(shù)據(jù)查詢、歸因診斷、報(bào)告生成等功能。該產(chǎn)品解決了企業(yè)數(shù)據(jù)分析面臨的五大挑戰(zhàn)：語義鴻溝、口徑一致性、場景覆蓋度、性能優(yōu)化和數(shù)據(jù)權(quán)限管控。Aloudata Agent采用NL2MQL2SQL技術(shù)路徑，通過指標(biāo)語義層實(shí)現(xiàn)業(yè)務(wù)語言與數(shù)據(jù)語言的精準(zhǔn)對(duì)齊，顯著提升查詢準(zhǔn)?

?Aloudata ?大應(yīng)科技 ?智能BI
谷歌A2A協(xié)議是什么？ MCP 和 Agent2Agent 有什么區(qū)別？

4月10日，在GoogleCloudNext大會(huì)上，谷歌宣布開源Agent2Agent協(xié)議，這一協(xié)議被業(yè)界視為智能體交互領(lǐng)域的“通用語言”，旨在突破跨平臺(tái)、多模態(tài)協(xié)作及安全保障等核心技術(shù)瓶頸，并聯(lián)合全球50余家科技企業(yè)共同構(gòu)建新一代智能生態(tài)。本文從技術(shù)實(shí)現(xiàn)與行業(yè)變革兩個(gè)維度，深度解析A2A協(xié)議的核心價(jià)值。這一協(xié)議的推出，標(biāo)志著智能體協(xié)作模式從封閉系統(tǒng)向開放生態(tài)的范式轉(zhuǎn)變，為產(chǎn)業(yè)數(shù)字化轉(zhuǎn)型注入新動(dòng)能。

?Agent2Agent協(xié)議 ?智能體交互 ?跨平臺(tái)協(xié)作
薦醒醒，只靠MCP和A2A還帶不來AI Agent的大繁榮

文章探討了AI Agents發(fā)展需要類似HTTPS的安全協(xié)議保障?；仡櫥ヂ?lián)網(wǎng)發(fā)展歷程，TCP/IP協(xié)議統(tǒng)一了網(wǎng)絡(luò)通信標(biāo)準(zhǔn)，HTTP協(xié)議實(shí)現(xiàn)了全球互聯(lián)，而HTTPS通過SSL加密解決了安全問題。類比互聯(lián)網(wǎng)發(fā)展，當(dāng)前AI Agents產(chǎn)業(yè)面臨類似挑戰(zhàn)：Anthropic推出的MCP協(xié)議解決智能體與工具連接問題，Google的A2A協(xié)議實(shí)現(xiàn)智能體間協(xié)作，但缺乏安全標(biāo)準(zhǔn)。IIFAA聯(lián)盟正致力于構(gòu)建AI Agents安全生態(tài)，推出ASL中間件保障數(shù)據(jù)隱私和身份認(rèn)證。文章指出，正如HTTPS推動(dòng)電商繁榮，AI Agents的安全標(biāo)準(zhǔn)化將加速商業(yè)化進(jìn)程，螞蟻集團(tuán)等企業(yè)已開始實(shí)踐MCP應(yīng)用。未來AI Agents可能通過統(tǒng)一入口調(diào)用工具池，改變現(xiàn)有交互模式。

?TCP/IP協(xié)議 ?互聯(lián)網(wǎng)歷史 ?超文本傳輸協(xié)議
谷歌開源發(fā)布A2A協(xié)議 Agent2Agent智能體交互協(xié)議詳細(xì)介紹

在GoogleCloudNext25大會(huì)上，谷歌宣布開源了首個(gè)標(biāo)準(zhǔn)智能體交互協(xié)議——Agent2AgentProtocol，這一舉措有望徹底改變智能體之間的交互方式，打破系統(tǒng)孤島，對(duì)智能體的能力、跨平臺(tái)協(xié)作以及執(zhí)行效率產(chǎn)生質(zhì)的飛躍。A2A協(xié)議是一種開放標(biāo)準(zhǔn)，旨在為智能體提供一種通用的交互方式，使它們能夠在不同的底層框架和供應(yīng)商之間無縫協(xié)作。每個(gè)部分都有指定的內(nèi)容類型，這使得客戶端和遠(yuǎn)程智能體能夠協(xié)商所需的正確格式，并且明確包括用戶界面能力的協(xié)商，比如iframe、視頻、網(wǎng)絡(luò)表單等，從根據(jù)用戶的需求和設(shè)備的能力，提供最佳的用戶體驗(yàn)。

?Agent2Agent ?Protocol ?智能體交互
薦接替Manus，字節(jié)的Agent王牌能打多久？

字節(jié)跳動(dòng)旗下智能體平臺(tái)"扣子空間"推出首款由大廠發(fā)布的Agent爆款產(chǎn)品，自4月18日上線后引發(fā)用戶瘋搶邀請(qǐng)碼。該產(chǎn)品具備規(guī)劃、工具調(diào)用和記憶等關(guān)鍵能力，支持游戲攻略撰寫、市場調(diào)研等復(fù)雜需求，并首創(chuàng)"探索模式"和"規(guī)劃模式"雙交互設(shè)計(jì)。雖然底層模型能力較DeepResearch和Manus仍有差距，但憑借產(chǎn)品設(shè)計(jì)優(yōu)化和量大價(jià)優(yōu)的優(yōu)勢，成功填補(bǔ)了Manus留下的市場空白。字節(jié)同步推出企業(yè)版HiAgent解決私有化部署問題，半年內(nèi)智能體業(yè)務(wù)訂單量增長超330%。當(dāng)前行業(yè)正迎來Agent爆發(fā)期，但企業(yè)落地仍面臨系統(tǒng)接入、數(shù)據(jù)安全等挑戰(zhàn)。

?字節(jié) ?Agent ?AI
「扣子空間」內(nèi)測上線，和 Agent 一起開始你的工作

“摘星空間”平臺(tái)正式推出，集生產(chǎn)、專業(yè)領(lǐng)域支持及雙模系統(tǒng)協(xié)作能力，通過多類型AI智能體實(shí)現(xiàn)高效辦公，具備生產(chǎn)提升、專家深度支持、雙模協(xié)同等四大核心功能，未來將持續(xù)擴(kuò)展Agent能力邊界。
薦多模態(tài)和Agent成為大廠AI的新賽點(diǎn)

這是《窄播Weekly》的第52期，本期我們關(guān)注的商業(yè)動(dòng)態(tài)是:當(dāng)大廠的AI競爭策略開始傾斜向應(yīng)用場景，多模態(tài)能力和代理執(zhí)行成為兩個(gè)焦點(diǎn)。大模型落地C端場景的核心，就是讓大模型的能力越來越接近人。沿著這個(gè)主旋律，可以劃分出兩個(gè)進(jìn)化方向:一個(gè)是持續(xù)降低用戶與大模型進(jìn)行有效溝通的難度;另一個(gè)則是讓大模型具備執(zhí)行更復(fù)雜任務(wù)的能力。前者的實(shí)現(xiàn)，需要給到大模型多

?AI競爭策略 ?多模態(tài)能力 ?大模型應(yīng)用
薦多模態(tài)和Agent成為大廠AI的新賽點(diǎn)

本期《窄播Weekly》聚焦AI大廠競爭策略向應(yīng)用場景傾斜的趨勢，重點(diǎn)分析了多模態(tài)能力和代理執(zhí)行兩大發(fā)展方向。文章指出，大模型落地的核心在于讓人機(jī)交互更自然，具體表現(xiàn)為：1）通過多模態(tài)技術(shù)降低用戶使用門檻，如阿里夸克新推出的"拍照問夸克"功能；2）通過代理執(zhí)行提升復(fù)雜任務(wù)處理能力，如字節(jié)、百度等推出的通用Agent產(chǎn)品。國內(nèi)外廠商路徑差異明顯：國?

?AI應(yīng)用場景 ?多模態(tài)能力 ?代理執(zhí)行

熱文

3 天
7天

1

累了倦了就找 ChatGPT……AI正在淪為“情緒垃圾桶”！

站長商機(jī)

廣告

商務(wù)合作侵權(quán)投訴廣告服務(wù) 版權(quán)聲明招聘

?CopyRight 2002-2020 CHINAZ.COM