无码在线播放二区|久久亚洲精品国产精品|无码视频在线观看一区二区|在线观看国产日韩亚洲中

  • <menu id="yw4o4"></menu>
  • 
    <menu id="yw4o4"><em id="yw4o4"></em></menu>
  • 首頁 > 業(yè)界 > 關(guān)鍵詞  > RingAttention最新資訊  > 正文

    RingAttention:一種降低Transformer內(nèi)存需求的新AI技術(shù)

    2023-10-20 14:07 · 稿源:站長之家

    劃重點(diǎn):

    1. Transformer模型在處理長序列時(shí)面臨的內(nèi)存需求挑戰(zhàn),UC伯克利研究人員提出的RingAttention方法。

    2. RingAttention通過將自注意力和前饋網(wǎng)絡(luò)計(jì)算塊塊地分布在多個(gè)設(shè)備上,實(shí)現(xiàn)了內(nèi)存高效,允許訓(xùn)練超過500倍長度的序列。

    3. RingAttention的潛在應(yīng)用領(lǐng)域,包括大型視頻-音頻-語言模型和理解科學(xué)數(shù)據(jù)。

    站長之家(ChinaZ.com)10月20日 消息:UC伯克利的研究人員提出了一項(xiàng)名為RingAttention的新方法,以解決深度學(xué)習(xí)模型中內(nèi)存需求的挑戰(zhàn)。在最新的研究中,研究人員探討了Transformer模型在處理長序列時(shí)面臨的問題,特別是由于自注意力機(jī)制引發(fā)的內(nèi)存需求。這一問題已經(jīng)成為了在人工智能領(lǐng)域中提高模型性能的一個(gè)重要挑戰(zhàn)。

    Transformer模型是一種在自然語言處理等領(lǐng)域取得了重大突破的深度學(xué)習(xí)架構(gòu)。它基于自注意力機(jī)制,可以在進(jìn)行預(yù)測時(shí)權(quán)衡輸入序列的不同部分的重要性。然而,隨著輸入序列長度的增加,內(nèi)存需求呈二次增長,這導(dǎo)致了在處理長序列時(shí)的挑戰(zhàn)。

    UC伯克利的研究人員提出了RingAttention方法,通過將自注意力和前饋網(wǎng)絡(luò)計(jì)算分塊進(jìn)行,可以將輸入序列分布到多個(gè)設(shè)備上,從而實(shí)現(xiàn)內(nèi)存高效。這一方法的關(guān)鍵思想是將計(jì)算塊塊塊地分布在多個(gè)設(shè)備上,同時(shí)保持內(nèi)存消耗與塊大小成比例。這意味著每個(gè)設(shè)備的內(nèi)存需求與原始輸入序列長度無關(guān),從而消除了設(shè)備內(nèi)存的限制。

    image.png

    研究人員的實(shí)驗(yàn)證明,RingAttention可以將Transformer模型的內(nèi)存需求降低,使其能夠訓(xùn)練比以前的內(nèi)存高效方法長500倍以上的序列,而不需要對(duì)注意力機(jī)制進(jìn)行近似。此外,RingAttention還允許處理長度超過1億的序列,為處理大規(guī)模數(shù)據(jù)提供了可能性。

    盡管這項(xiàng)研究僅涉及方法的有效性評(píng)估,而未進(jìn)行大規(guī)模訓(xùn)練模型,但這一方法的性能取決于設(shè)備數(shù)量,因此還需要進(jìn)一步的優(yōu)化。研究人員表示,他們將來計(jì)劃在最大序列長度和最大計(jì)算性能方面進(jìn)行更多研究,這將為大型視頻-音頻-語言模型、利用擴(kuò)展反饋和試驗(yàn)錯(cuò)誤學(xué)習(xí)、代碼生成和理解科學(xué)數(shù)據(jù)等領(lǐng)域提供激動(dòng)人心的機(jī)會(huì)。

    論文網(wǎng)址:https://arxiv.org/abs/2310.01889

    舉報(bào)

    • 相關(guān)推薦
    • MCP協(xié)議和Function Calling 、 AI Agents的區(qū)別是什么?MCP優(yōu)勢有哪些

      MCP、FunctionCalling和AIAgents是三種重要的技術(shù)手段,它們?cè)趯?shí)現(xiàn)AI模型與外部系統(tǒng)交互方面各有特點(diǎn)。本文將詳細(xì)對(duì)比這三種技術(shù),并深入探討MCP的多項(xiàng)顯著優(yōu)勢。隨著MCP技術(shù)的不斷發(fā)展,我們有理由相信,它將在未來的AI領(lǐng)域發(fā)揮越來越重要的作用。

    • Windows Arm64 托管運(yùn)行器正式支持 GitHub Actions,加速開發(fā)流程

      Arm與GitHub深化合作,為Arm平臺(tái)開發(fā)者提供更高效的開發(fā)體驗(yàn)。

    • Trae國內(nèi)版怎么用?Trae IDE 內(nèi)置 MCP 市場配置使用指南

      字節(jié)跳動(dòng)旗下Trae+IDE發(fā)布新版本,通過MCP協(xié)議實(shí)現(xiàn)AI智能體與外部工具的深度集成。MCP作為標(biāo)準(zhǔn)化橋梁,讓開發(fā)者能靈活接入Supabase、FireCrawl等第三方服務(wù),只需@符號(hào)即可調(diào)用智能體完成數(shù)據(jù)庫操作、文檔搜索等復(fù)雜任務(wù)。新版本內(nèi)置MCP市場,支持Token快速配置,并演示了如何通過Figma+AI自動(dòng)生成前端代碼。該技術(shù)可應(yīng)用于Blender建模、K8s管理等多元場景,顯著提升開發(fā)效率。Trae+IDE將持續(xù)擴(kuò)展工具生態(tài),推動(dòng)AI協(xié)作開發(fā)新時(shí)代。

    • Trae重磅升級(jí):全面開放自定義AI能力,用戶可打造個(gè)人專屬“AI 工程師”

      Trae新版本通過整合AI技術(shù),提供更智能、高效的開發(fā)體驗(yàn),支持多語言文件輸入與多種功能擴(kuò)展。它突破傳統(tǒng)IDE模式,強(qiáng)調(diào)人機(jī)協(xié)作與個(gè)性化定制,實(shí)現(xiàn)需求快速轉(zhuǎn)化和技術(shù)方案優(yōu)化。同時(shí),其開放的插件系統(tǒng)和自定義能力,滿足不同場景的專業(yè)開發(fā)需求,推動(dòng)AI在編程領(lǐng)域的深度融合與創(chuàng)新應(yīng)用。

    • 追覓全球首創(chuàng)20萬轉(zhuǎn)高速數(shù)字馬達(dá)量產(chǎn)落地!吸塵器Z50 Station突破行業(yè)天花板

      在吸塵器行業(yè)持續(xù)突破性能極限的進(jìn)程中,追覓科技以突破性創(chuàng)新技術(shù)再次領(lǐng)跑賽道。2024年,追覓科技自研的20萬轉(zhuǎn)/分鐘高速數(shù)字馬達(dá)獲全球權(quán)威機(jī)構(gòu)沙利文全球首創(chuàng)認(rèn)證。追覓科技將以創(chuàng)新為引擎,持續(xù)引領(lǐng)全球清潔電器行業(yè)邁向智能化、高效化的新時(shí)代。

    • 聯(lián)想ThinkCentre neo Ultra 2025迷你機(jī)發(fā)布:RTX 5060/Ti桌面版、14999元起

      快科技4月29日消息,在日前的聯(lián)想Think AI終端2025春季發(fā)布會(huì)上,聯(lián)想正式推出了ThinkCentre neo Ultra 2025 AI元啟版。這款迷你主機(jī)沿用了上一代的外觀設(shè)計(jì),體積為3.6升,配備了英特爾酷睿Ultra系列桌面處理器和NVIDIA RTX 5060/5060 Ti桌面版顯卡。具體配置方面,ThinkCentre neo Ultra 2025目前公布售價(jià)的有兩個(gè)版本:RTX 5060版本:配備英特爾酷睿Ultra 5處理器、32GB內(nèi)存和1TB固態(tài)硬盤,售價(jià)為14999元。RTX 5060 Ti版本:配備英特爾酷睿Ultra 7處理器、32GB內(nèi)存和1TB固態(tài)硬盤,售價(jià)為19999元。還有英特爾酷睿Ultra 7處理器 RTX 5060

    • 人像夜神!vivo X200 Ultra首發(fā)全焦段閃光人像技術(shù)

      快科技4月14日消息,今天下午,vivo舉辦vivo X系列藍(lán)圖影像技術(shù)溝通會(huì),介紹了vivo X200 Ultra背后的影像細(xì)節(jié)。據(jù)悉,vivo X200 Ultra將首發(fā)行業(yè)領(lǐng)先的自研全焦段夜景閃光人像技術(shù),挑戰(zhàn)更極致的夜景人像,堪稱人像夜神”。官方介紹,在安卓陣營,vivo首創(chuàng)變焦閃光燈技術(shù)和獨(dú)家的閃光人像算法,從根源上解決夜景復(fù)雜光線下的人像攝影難題,還支持多風(fēng)格疊加,夜景氛圍感拉滿。

    • 努比亞Z70S Ultra攝影師版官宣:今年唯一真全面屏Ultra

      快科技4月18日消息,今天,努比亞宣布努比亞AI雙旗艦新品發(fā)布會(huì)將于4月28日舉行,努比亞Z70S Ultra攝影師版和努比亞首款神秘新品將同時(shí)亮相。本次發(fā)布會(huì)的重頭戲是努比亞Z70S Ultra攝影師版,對(duì)比其它Ultra機(jī)型,Z70S Ultra攝影師版采用1.5K真全面屏形態(tài),是今年唯一一款真全面屏Ultra。據(jù)悉,這塊屏幕采用全屏藍(lán)鉆排列,通過FIAA極致壓縮走線技術(shù)實(shí)現(xiàn)超高屏占比,加上內(nèi)置UDC Ultra

    • 小米SU7 Ultra首個(gè)OTA升級(jí):升級(jí)能量管理和超充樁體驗(yàn)

      今日,小米SU7Ultra汽車迎來了其首個(gè)OTA升級(jí),版本號(hào)為1.5.10。此次升級(jí)主要涉及兩項(xiàng)功能優(yōu)化:一是優(yōu)化能量管理策略,旨在提升駕駛體驗(yàn);二是優(yōu)化第三方超充樁的充電體驗(yàn),以提高充電效率和便捷性。2025年2月推送的1.5.5版本新增端到端全場景智能駕駛”,實(shí)現(xiàn)從車位啟動(dòng)到目標(biāo)泊車的全程自動(dòng)駕駛,覆蓋高速、城市道路及停車場場景,并支持跨樓層路線記憶。

    • 凱迪拉克VISTIQ亞洲首秀,搭載Momenta飛輪大模型定義豪華純電智能出行

      4月23日,凱迪拉克在上海舉辦"心馳·電掣"發(fā)布會(huì),推出亞洲首秀的VISTIQ車型。該車與Momenta深度合作,采用行業(yè)首個(gè)量產(chǎn)飛輪大模型技術(shù),實(shí)現(xiàn)L2全場景城區(qū)輔助駕駛功能,提供"有路就能開,有位就能停"的智能體驗(yàn)。凱迪拉克強(qiáng)調(diào)不應(yīng)通過堆砌硬件實(shí)現(xiàn)智能化,而需技術(shù)創(chuàng)新與用戶體驗(yàn)并重。此次合作展現(xiàn)了凱迪拉克擁抱智能化的決心,也彰顯了Momenta在自動(dòng)駕駛領(lǐng)域的技術(shù)領(lǐng)先地位。雙方將共同推動(dòng)豪華純電出行的智能化升級(jí)。