无码在线播放二区|久久亚洲精品国产精品|无码视频在线观看一区二区|在线观看国产日韩亚洲中

  • <menu id="yw4o4"></menu>
  • 
    <menu id="yw4o4"><em id="yw4o4"></em></menu>
  • 首頁(yè) > 業(yè)界 > 關(guān)鍵詞  > 正文

    中國(guó)研究人員提出DualToken-ViT:CNN和視覺(jué)Transformer的融合,提高圖像處理效率和準(zhǔn)確性

    2023-10-02 15:55 · 稿源:站長(zhǎng)之家

    要點(diǎn):

    1、DualToken-ViT將卷積和自注意力聯(lián)合使用,分別提取局部和全局信息,再將兩者輸出融合形成有效的注意力結(jié)構(gòu)。

    2、使用位置感知全局令牌提升全局信息質(zhì)量,令牌中還包含圖像位置信息,有利于視覺(jué)任務(wù)。

    3、在相同F(xiàn)LOPs下,DualToken-ViT在圖像分類、目標(biāo)檢測(cè)和語(yǔ)義分割任務(wù)上表現(xiàn)最好

    站長(zhǎng)之家(ChinaZ.com)10月2日 消息:最近,視覺(jué)Transformer(ViT)成為各類視覺(jué)任務(wù)如物體識(shí)別和圖片分類的有效架構(gòu)。這是因?yàn)樽宰⒁饬梢詮膱D片中提取全局信息,而卷積核大小限制了卷積神經(jīng)網(wǎng)絡(luò)(CNN)只能提取局部信息。隨著ViT模型和數(shù)據(jù)集規(guī)模的增大,相比CNN具有更好的擴(kuò)展性。但在輕量級(jí)模型上,由于缺乏某些歸納偏置,CNN優(yōu)于ViT。

    自注意力的二次復(fù)雜度導(dǎo)致ViT計(jì)算成本潛在很高,構(gòu)建輕量高效的ViT并不容易。為此,提出金字塔結(jié)構(gòu),將模型分為多個(gè)階段,每階段令牌數(shù)減少,通道數(shù)增加,以構(gòu)建更輕量高效的ViT。簡(jiǎn)化自注意力結(jié)構(gòu)以減輕其復(fù)雜度,但以犧牲注意力有效性為代價(jià)。一個(gè)典型策略是下采樣自注意力的key和value,減少參與注意力過(guò)程的令牌數(shù)。

    image.png

    論文地址:https://arxiv.org/abs/2309.12424

    本研究中,華東師范大學(xué)和阿里巴巴集團(tuán)的研究人員提出了緊湊高效的視覺(jué)Transformer模型DualToken-ViT。他們的方法使用卷積和自注意力聯(lián)合提取局部和全局信息,再將兩者輸出融合形成有效的注意力結(jié)構(gòu)。盡管窗口自注意力也可以提取局部信息,但他們發(fā)現(xiàn),在輕量模型上卷積更有效。他們采用逐步下采樣的方式生成key和value特征圖,在下采樣過(guò)程中保留更多信息,降低自注意力在傳播全局信息時(shí)的計(jì)算成本。

    此外,他們?cè)诿總€(gè)級(jí)別使用位置感知全局令牌來(lái)提高全局?jǐn)?shù)據(jù)質(zhì)量。與標(biāo)準(zhǔn)全局令牌不同,他們的位置感知全局令牌還可以維護(hù)和傳遞圖像位置信息,在視覺(jué)任務(wù)中為模型提供優(yōu)勢(shì)。如圖1所示,圖像中的關(guān)鍵令牌與位置感知全局令牌中的對(duì)應(yīng)令牌產(chǎn)生了更大的相關(guān)性。

    總之,他們的貢獻(xiàn)有:1)提出了緊湊高效的視覺(jué)Transformer模型DualToken-ViT,通過(guò)卷積和自注意力的優(yōu)勢(shì)實(shí)現(xiàn)有效的注意力結(jié)構(gòu);2)提出位置感知全局令牌,通過(guò)圖像位置信息來(lái)增強(qiáng)全局信息;3)DualToken-ViT在相同F(xiàn)LOPs下在多個(gè)視覺(jué)任務(wù)上表現(xiàn)最好。

    舉報(bào)

    • 相關(guān)推薦
    • 友商沉默!vivo X200 Ultra為何拍照這么強(qiáng):圖像傳感器平均面積大幅領(lǐng)先

      vivo舉辦新品發(fā)布會(huì),推出X200+Ultra新機(jī)。該機(jī)搭載超大底傳感器、全焦段覆蓋及防抖能力提升顯著,并配備兩顆藍(lán)玻璃濾光片LYT-818。此外,還提供外掛鏡頭頭,搭配聯(lián)合研發(fā)的2.35倍增距鏡頭,突破遠(yuǎn)攝極限,影像性能強(qiáng)大。

    • 微美全息(WIMI.US)探索量子圖像壓縮算法,引領(lǐng)圖像處理領(lǐng)域顛覆創(chuàng)新

      量子計(jì)算作為信息技術(shù)領(lǐng)域的顛覆性力量,其在量子圖像處理和圖像壓縮領(lǐng)域也顯示出巨大的技術(shù)潛力。隨著數(shù)字圖像處理技術(shù)的不斷演進(jìn),傳統(tǒng)圖像處理算法,本質(zhì)上依賴于并行計(jì)算,然,隨著圖像數(shù)量和分辨率的快速增長(zhǎng),這些經(jīng)典算法在計(jì)算資源和時(shí)間消耗上存在局限性。量子圖像壓縮技術(shù)的深入研究也將促進(jìn)量子算法和量子信息處理理論的進(jìn)一步發(fā)展,為量子信息技術(shù)的廣泛應(yīng)用奠定堅(jiān)實(shí)基礎(chǔ),推動(dòng)數(shù)字圖像處理技術(shù)邁向新的高度,實(shí)現(xiàn)更高效、更智能的圖像處理和壓縮。

    • 努比亞Z70S Ultra攝影師版官宣:今年唯一真全面屏Ultra

      快科技4月18日消息,今天,努比亞宣布努比亞AI雙旗艦新品發(fā)布會(huì)將于4月28日舉行,努比亞Z70S Ultra攝影師版和努比亞首款神秘新品將同時(shí)亮相。本次發(fā)布會(huì)的重頭戲是努比亞Z70S Ultra攝影師版,對(duì)比其它Ultra機(jī)型,Z70S Ultra攝影師版采用1.5K真全面屏形態(tài),是今年唯一一款真全面屏Ultra。據(jù)悉,這塊屏幕采用全屏藍(lán)鉆排列,通過(guò)FIAA極致壓縮走線技術(shù)實(shí)現(xiàn)超高屏占比,加上內(nèi)置UDC Ultra

    • Trae國(guó)內(nèi)版怎么用?Trae IDE 內(nèi)置 MCP 市場(chǎng)配置使用指南

      字節(jié)跳動(dòng)旗下Trae+IDE發(fā)布新版本,通過(guò)MCP協(xié)議實(shí)現(xiàn)AI智能體與外部工具的深度集成。MCP作為標(biāo)準(zhǔn)化橋梁,讓開(kāi)發(fā)者能靈活接入Supabase、FireCrawl等第三方服務(wù),只需@符號(hào)即可調(diào)用智能體完成數(shù)據(jù)庫(kù)操作、文檔搜索等復(fù)雜任務(wù)。新版本內(nèi)置MCP市場(chǎng),支持Token快速配置,并演示了如何通過(guò)Figma+AI自動(dòng)生成前端代碼。該技術(shù)可應(yīng)用于Blender建模、K8s管理等多元場(chǎng)景,顯著提升開(kāi)發(fā)效率。Trae+IDE將持續(xù)擴(kuò)展工具生態(tài),推動(dòng)AI協(xié)作開(kāi)發(fā)新時(shí)代。

    • 小米送Ultra Club首批會(huì)員禮盒:含金車(chē)模、紐北成績(jī)限定車(chē)牌等

      快科技4月19日消息,小米汽車(chē)今天宣布,為Ultra Club首批會(huì)員,準(zhǔn)備了一份限定禮盒。該禮盒包含小米SU7 Ultra 1:43合金車(chē)模、紐北成績(jī)限定車(chē)牌、紐北成績(jī)冰箱貼、專屬會(huì)員卡。官方表示,限定禮盒每一處都充滿細(xì)節(jié),希望車(chē)主打開(kāi)禮盒的這一刻,能感受到小米汽車(chē)最真摯的心意。據(jù)了解,小米Ultra Club會(huì)員俱樂(lè)部于今年2月27日成立,該俱樂(lè)部的年費(fèi)為3999元,首批限量2000人。入會(huì)可享60000積分,可享受以下專屬服務(wù):專屬賽道服務(wù):免費(fèi)存胎服務(wù),免費(fèi)賽道救援,賽道耗材88折等;獨(dú)享官方活動(dòng):德國(guó)紐北賽道之旅,專屬官方賽道日等。

    • 最有誠(chéng)意的Ultra!努比亞Z70S Ultra攝影師版外觀公布:真全面屏形態(tài) 同檔罕見(jiàn)

      快科技4月18日消息,努比亞宣布,努比亞Z70S Ultra攝影師版將于4月28日正式發(fā)布,倪飛稱這是今年最有誠(chéng)意的Ultra。根據(jù)官方公布的外觀,努比亞Z70S Ultra攝影師版后殼采用了原生復(fù)古經(jīng)典相機(jī)設(shè)計(jì)元素,相機(jī)模組通過(guò)一條富有動(dòng)感的分割線一分為二,上方是全新35mm大底主攝,下方是潛望長(zhǎng)焦以及超廣角。與此同時(shí),影像模組右上角延續(xù)了經(jīng)典相機(jī)的紅圈設(shè)計(jì),Neovision圖章致敬專

    • 小米SU7 Ultra限制馬力引熱議 博主稱車(chē)主強(qiáng)烈反對(duì) OTA已取消

      快科技5月2日消息,50多萬(wàn)就能擁有1500匹馬力,小米SU7 Ultra的加速能力有目共睹,但部分車(chē)主暴力駕駛的視頻也讓人觸目驚心。最近,多名網(wǎng)友表示小米SU7 Ultra在進(jìn)行OTA更新時(shí),發(fā)現(xiàn)更新內(nèi)容中有一條新增排位模式圈速考核,在指定賽道圈速達(dá)到官方建議成績(jī)可解鎖排位模式?!绷硗膺€新增了直線競(jìng)速等待功能,P擋狀態(tài)下等待60秒后才能開(kāi)啟直線競(jìng)速模式。不少人表示,小米SU7 Ultra更新以后開(kāi)始限制最大馬力的使用,需要通過(guò)跑賽道圈速成績(jī)解鎖,才能使用排位賽模式獲得1500匹馬力。有人認(rèn)為,此舉與自信駕馭強(qiáng)大”的宣傳語(yǔ)有悖,還有博主稱?

    • 誠(chéng)意滿滿!小米為SU7 Ultra Club首批會(huì)員推出限定禮盒

      小米汽車(chē)這次真是誠(chéng)意滿滿!SU7 Ultra Club首批會(huì)員收到了一份專屬的限定禮盒。里面的東西可不少:SU7 Ultra的1:43合金車(chē)模,做工精致,完全按照真車(chē)比例打造;除此之外,還有紐北成績(jī)限定車(chē)牌和冰箱貼,再加上專屬會(huì)員卡,這身份感瞬間拉滿。100%; word-break: break-word;"據(jù)悉,SU7 Ultra Club會(huì)員俱樂(lè)部是2月27日成立的,年費(fèi)3999元,首批限量2000人,入會(huì)就能拿到6

    • 小米15 Ultra快門(mén)音效將下放給所有徠卡小米作機(jī)型

      小米計(jì)劃將15 Ultra的快門(mén)音效開(kāi)放給所有徠卡合作機(jī)型用戶使用。該機(jī)型提供8種特色快門(mén)音效,包括默認(rèn)、機(jī)械、經(jīng)典、現(xiàn)代、膠片、文藝、質(zhì)感和元?dú)?,每種音效都源自不同徠卡機(jī)型。其中"機(jī)械"音效源自徠卡M6,快門(mén)超過(guò)0.4秒時(shí)會(huì)模擬機(jī)械馬達(dá)聲;"經(jīng)典"音效取自徠卡M9,包含固定長(zhǎng)度的機(jī)械處理聲;"默認(rèn)"音效對(duì)應(yīng)徠卡M3,使用率15%;"現(xiàn)代"音效來(lái)自徠卡M10,使用率14%。這些音效將為用戶帶來(lái)更個(gè)性化的拍攝體驗(yàn),滿足不同場(chǎng)景需求。

    • 中國(guó)獨(dú)享!Intel酷睿Ultra 200S處理器新增IPO優(yōu)化 游戲性能再+10%

      ArrowLake酷睿Ultra200S系列處理器的性能確實(shí)難以令人滿意,Intel自己也承認(rèn)沒(méi)做好,發(fā)布之后通過(guò)各種優(yōu)化,確實(shí)改善了一些性能,也修復(fù)了很多Bug。Intel又推出了IPO”,也就是IntelPerformanceOpitimizations,可以在默認(rèn)設(shè)置、手動(dòng)超頻之間保持平衡不影響質(zhì)保。這一功能僅提供給中國(guó)廠商,暫不清楚是否會(huì)拓展到全球。