中國(guó)研究人員提出DualToken-ViT:CNN和視覺(jué)Transformer的融合,提高圖像處理效率和準(zhǔn)確性

2023-10-02 15:55 · 稿源：站長(zhǎng)之家

要點(diǎn):
1、DualToken-ViT將卷積和自注意力聯(lián)合使用，分別提取局部和全局信息，再將兩者輸出融合形成有效的注意力結(jié)構(gòu)。
2、使用位置感知全局令牌提升全局信息質(zhì)量，令牌中還包含圖像位置信息，有利于視覺(jué)任務(wù)。
3、在相同F(xiàn)LOPs下，DualToken-ViT在圖像分類、目標(biāo)檢測(cè)和語(yǔ)義分割任務(wù)上表現(xiàn)最好。

站長(zhǎng)之家（ChinaZ.com）10月2日消息:最近，視覺(jué)Transformer（ViT）成為各類視覺(jué)任務(wù)如物體識(shí)別和圖片分類的有效架構(gòu)。這是因?yàn)樽宰⒁饬梢詮膱D片中提取全局信息，而卷積核大小限制了卷積神經(jīng)網(wǎng)絡(luò)(CNN)只能提取局部信息。隨著ViT模型和數(shù)據(jù)集規(guī)模的增大，相比CNN具有更好的擴(kuò)展性。但在輕量級(jí)模型上，由于缺乏某些歸納偏置，CNN優(yōu)于ViT。

自注意力的二次復(fù)雜度導(dǎo)致ViT計(jì)算成本潛在很高，構(gòu)建輕量高效的ViT并不容易。為此，提出金字塔結(jié)構(gòu)，將模型分為多個(gè)階段，每階段令牌數(shù)減少，通道數(shù)增加，以構(gòu)建更輕量高效的ViT。簡(jiǎn)化自注意力結(jié)構(gòu)以減輕其復(fù)雜度，但以犧牲注意力有效性為代價(jià)。一個(gè)典型策略是下采樣自注意力的key和value，減少參與注意力過(guò)程的令牌數(shù)。

論文地址：https://arxiv.org/abs/2309.12424

本研究中，華東師范大學(xué)和阿里巴巴集團(tuán)的研究人員提出了緊湊高效的視覺(jué)Transformer模型DualToken-ViT。他們的方法使用卷積和自注意力聯(lián)合提取局部和全局信息，再將兩者輸出融合形成有效的注意力結(jié)構(gòu)。盡管窗口自注意力也可以提取局部信息，但他們發(fā)現(xiàn)，在輕量模型上卷積更有效。他們采用逐步下采樣的方式生成key和value特征圖，在下采樣過(guò)程中保留更多信息，降低自注意力在傳播全局信息時(shí)的計(jì)算成本。

此外，他們?cè)诿總€(gè)級(jí)別使用位置感知全局令牌來(lái)提高全局?jǐn)?shù)據(jù)質(zhì)量。與標(biāo)準(zhǔn)全局令牌不同，他們的位置感知全局令牌還可以維護(hù)和傳遞圖像位置信息，在視覺(jué)任務(wù)中為模型提供優(yōu)勢(shì)。如圖1所示，圖像中的關(guān)鍵令牌與位置感知全局令牌中的對(duì)應(yīng)令牌產(chǎn)生了更大的相關(guān)性。

總之，他們的貢獻(xiàn)有:1）提出了緊湊高效的視覺(jué)Transformer模型DualToken-ViT，通過(guò)卷積和自注意力的優(yōu)勢(shì)實(shí)現(xiàn)有效的注意力結(jié)構(gòu);2)提出位置感知全局令牌，通過(guò)圖像位置信息來(lái)增強(qiáng)全局信息;3)DualToken-ViT在相同F(xiàn)LOPs下在多個(gè)視覺(jué)任務(wù)上表現(xiàn)最好。

（舉報(bào)）

相關(guān)推薦

關(guān)鍵詞：

友商沉默！vivo X200 Ultra為何拍照這么強(qiáng)：圖像傳感器平均面積大幅領(lǐng)先

vivo舉辦新品發(fā)布會(huì)，推出X200+Ultra新機(jī)。該機(jī)搭載超大底傳感器、全焦段覆蓋及防抖能力提升顯著，并配備兩顆藍(lán)玻璃濾光片LYT-818。此外，還提供外掛鏡頭頭，搭配聯(lián)合研發(fā)的2.35倍增距鏡頭，突破遠(yuǎn)攝極限，影像性能強(qiáng)大。
微美全息（WIMI.US）探索量子圖像壓縮算法，引領(lǐng)圖像處理領(lǐng)域顛覆性創(chuàng)新

量子計(jì)算作為信息技術(shù)領(lǐng)域的顛覆性力量，其在量子圖像處理和圖像壓縮領(lǐng)域也顯示出巨大的技術(shù)潛力。隨著數(shù)字圖像處理技術(shù)的不斷演進(jìn)，傳統(tǒng)圖像處理算法，本質(zhì)上依賴于并行計(jì)算，然，隨著圖像數(shù)量和分辨率的快速增長(zhǎng)，這些經(jīng)典算法在計(jì)算資源和時(shí)間消耗上存在局限性。量子圖像壓縮技術(shù)的深入研究也將促進(jìn)量子算法和量子信息處理理論的進(jìn)一步發(fā)展，為量子信息技術(shù)的廣泛應(yīng)用奠定堅(jiān)實(shí)基礎(chǔ)，推動(dòng)數(shù)字圖像處理技術(shù)邁向新的高度，實(shí)現(xiàn)更高效、更智能的圖像處理和壓縮。

?量子計(jì)算 ?圖像處理 ?圖像壓縮
努比亞Z70S Ultra攝影師版官宣：今年唯一真全面屏Ultra

快科技4月18日消息，今天，努比亞宣布努比亞AI雙旗艦新品發(fā)布會(huì)將于4月28日舉行，努比亞Z70S Ultra攝影師版和努比亞首款神秘新品將同時(shí)亮相。本次發(fā)布會(huì)的重頭戲是努比亞Z70S Ultra攝影師版，對(duì)比其它Ultra機(jī)型，Z70S Ultra攝影師版采用1.5K真全面屏形態(tài)，是今年唯一一款真全面屏Ultra。據(jù)悉，這塊屏幕采用全屏藍(lán)鉆排列，通過(guò)FIAA極致壓縮走線技術(shù)實(shí)現(xiàn)超高屏占比，加上內(nèi)置UDC Ultra

?努比亞 ?AI雙旗艦 ?Z70S
Trae國(guó)內(nèi)版怎么用？Trae IDE 內(nèi)置 MCP 市場(chǎng)配置使用指南

字節(jié)跳動(dòng)旗下Trae+IDE發(fā)布新版本，通過(guò)MCP協(xié)議實(shí)現(xiàn)AI智能體與外部工具的深度集成。MCP作為標(biāo)準(zhǔn)化橋梁，讓開(kāi)發(fā)者能靈活接入Supabase、FireCrawl等第三方服務(wù)，只需@符號(hào)即可調(diào)用智能體完成數(shù)據(jù)庫(kù)操作、文檔搜索等復(fù)雜任務(wù)。新版本內(nèi)置MCP市場(chǎng)，支持Token快速配置，并演示了如何通過(guò)Figma+AI自動(dòng)生成前端代碼。該技術(shù)可應(yīng)用于Blender建模、K8s管理等多元場(chǎng)景，顯著提升開(kāi)發(fā)效率。Trae+IDE將持續(xù)擴(kuò)展工具生態(tài)，推動(dòng)AI協(xié)作開(kāi)發(fā)新時(shí)代。

?字節(jié)跳動(dòng) ?Trae ?IDE
小米送Ultra Club首批會(huì)員禮盒：含合金車(chē)模、紐北成績(jī)限定車(chē)牌等

快科技4月19日消息，小米汽車(chē)今天宣布，為Ultra Club首批會(huì)員，準(zhǔn)備了一份限定禮盒。該禮盒包含小米SU7 Ultra 1:43合金車(chē)模、紐北成績(jī)限定車(chē)牌、紐北成績(jī)冰箱貼、專屬會(huì)員卡。官方表示，限定禮盒每一處都充滿細(xì)節(jié)，希望車(chē)主打開(kāi)禮盒的這一刻，能感受到小米汽車(chē)最真摯的心意。據(jù)了解，小米Ultra Club會(huì)員俱樂(lè)部于今年2月27日成立，該俱樂(lè)部的年費(fèi)為3999元，首批限量2000人。入會(huì)可享60000積分，可享受以下專屬服務(wù)：專屬賽道服務(wù)：免費(fèi)存胎服務(wù)，免費(fèi)賽道救援，賽道耗材88折等；獨(dú)享官方活動(dòng)：德國(guó)紐北賽道之旅，專屬官方賽道日等。

?小米汽車(chē) ?Ultra ?Club
最有誠(chéng)意的Ultra！努比亞Z70S Ultra攝影師版外觀公布：真全面屏形態(tài) 同檔罕見(jiàn)

快科技4月18日消息，努比亞宣布，努比亞Z70S Ultra攝影師版將于4月28日正式發(fā)布，倪飛稱這是今年最有誠(chéng)意的Ultra。根據(jù)官方公布的外觀，努比亞Z70S Ultra攝影師版后殼采用了原生復(fù)古經(jīng)典相機(jī)設(shè)計(jì)元素，相機(jī)模組通過(guò)一條富有動(dòng)感的分割線一分為二，上方是全新35mm大底主攝，下方是潛望長(zhǎng)焦以及超廣角。與此同時(shí)，影像模組右上角延續(xù)了經(jīng)典相機(jī)的紅圈設(shè)計(jì)，Neovision圖章致敬專

?努比亞Z70S ?Ultra ?攝影師版
小米SU7 Ultra限制馬力引熱議博主稱車(chē)主強(qiáng)烈反對(duì) OTA已取消

快科技5月2日消息，50多萬(wàn)就能擁有1500匹馬力，小米SU7 Ultra的加速能力有目共睹，但部分車(chē)主暴力駕駛的視頻也讓人觸目驚心。最近，多名網(wǎng)友表示小米SU7 Ultra在進(jìn)行OTA更新時(shí)，發(fā)現(xiàn)更新內(nèi)容中有一條新增排位模式圈速考核，在指定賽道圈速達(dá)到官方建議成績(jī)可解鎖排位模式?！绷硗膺€新增了直線競(jìng)速等待功能，P擋狀態(tài)下等待60秒后才能開(kāi)啟直線競(jìng)速模式。不少人表示，小米SU7 Ultra更新以后開(kāi)始限制最大馬力的使用，需要通過(guò)跑賽道圈速成績(jī)解鎖，才能使用排位賽模式獲得1500匹馬力。有人認(rèn)為，此舉與自信駕馭強(qiáng)大”的宣傳語(yǔ)有悖，還有博主稱?

?小米SU7 ?Ultra ?汽車(chē)OTA更新
誠(chéng)意滿滿！小米為SU7 Ultra Club首批會(huì)員推出限定禮盒

小米汽車(chē)這次真是誠(chéng)意滿滿！SU7 Ultra Club首批會(huì)員收到了一份專屬的限定禮盒。里面的東西可不少：SU7 Ultra的1:43合金車(chē)模，做工精致，完全按照真車(chē)比例打造；除此之外，還有紐北成績(jī)限定車(chē)牌和冰箱貼，再加上專屬會(huì)員卡，這身份感瞬間拉滿。100%; word-break: break-word;"據(jù)悉，SU7 Ultra Club會(huì)員俱樂(lè)部是2月27日成立的，年費(fèi)3999元，首批限量2000人，入會(huì)就能拿到6
小米15 Ultra快門(mén)音效將下放給所有徠卡小米合作機(jī)型

小米計(jì)劃將15 Ultra的快門(mén)音效開(kāi)放給所有徠卡合作機(jī)型用戶使用。該機(jī)型提供8種特色快門(mén)音效，包括默認(rèn)、機(jī)械、經(jīng)典、現(xiàn)代、膠片、文藝、質(zhì)感和元?dú)?，每種音效都源自不同徠卡機(jī)型。其中"機(jī)械"音效源自徠卡M6，快門(mén)超過(guò)0.4秒時(shí)會(huì)模擬機(jī)械馬達(dá)聲；"經(jīng)典"音效取自徠卡M9，包含固定長(zhǎng)度的機(jī)械處理聲；"默認(rèn)"音效對(duì)應(yīng)徠卡M3，使用率15%；"現(xiàn)代"音效來(lái)自徠卡M10，使用率14%。這些音效將為用戶帶來(lái)更個(gè)性化的拍攝體驗(yàn)，滿足不同場(chǎng)景需求。

?小米相機(jī) ?快門(mén)音效 ?徠卡合作
中國(guó)獨(dú)享！Intel酷睿Ultra 200S處理器新增IPO優(yōu)化游戲性能再＋10％

ArrowLake酷睿Ultra200S系列處理器的性能確實(shí)難以令人滿意，Intel自己也承認(rèn)沒(méi)做好，發(fā)布之后通過(guò)各種優(yōu)化，確實(shí)改善了一些性能，也修復(fù)了很多Bug。Intel又推出了IPO”，也就是IntelPerformanceOpitimizations，可以在默認(rèn)設(shè)置、手動(dòng)超頻之間保持平衡不影響質(zhì)保。這一功能僅提供給中國(guó)廠商，暫不清楚是否會(huì)拓展到全球。

?Arrow ?Lake ?酷睿Ultra

熱文

3 天
7天

站長(zhǎng)商機(jī)

商務(wù)合作侵權(quán)投訴廣告服務(wù) 版權(quán)聲明招聘

无码在线播放二区|久久亚洲精品国产精品|无码视频在线观看一区二区|在线观看国产日韩亚洲中

中國(guó)研究人員提出DualToken-ViT:CNN和視覺(jué)Transformer的融合,提高圖像處理效率和準(zhǔn)確性

友商沉默！vivo X200 Ultra為何拍照這么強(qiáng)：圖像傳感器平均面積大幅領(lǐng)先

微美全息（WIMI.US）探索量子圖像壓縮算法，引領(lǐng)圖像處理領(lǐng)域顛覆性創(chuàng)新

努比亞Z70S Ultra攝影師版官宣：今年唯一真全面屏Ultra

Trae國(guó)內(nèi)版怎么用？Trae IDE 內(nèi)置 MCP 市場(chǎng)配置使用指南

小米送Ultra Club首批會(huì)員禮盒：含合金車(chē)模、紐北成績(jī)限定車(chē)牌等

最有誠(chéng)意的Ultra！努比亞Z70S Ultra攝影師版外觀公布：真全面屏形態(tài) 同檔罕見(jiàn)

小米SU7 Ultra限制馬力引熱議博主稱車(chē)主強(qiáng)烈反對(duì) OTA已取消

誠(chéng)意滿滿！小米為SU7 Ultra Club首批會(huì)員推出限定禮盒

小米15 Ultra快門(mén)音效將下放給所有徠卡小米合作機(jī)型

中國(guó)獨(dú)享！Intel酷睿Ultra 200S處理器新增IPO優(yōu)化游戲性能再＋10％

熱文

全網(wǎng)最大的“AI色情網(wǎng)站”MrDeepfakes宣布永久關(guān)閉

馬斯克稱地球會(huì)被太陽(yáng)焚化，網(wǎng)友：有科學(xué)依據(jù)，但…

20周年紀(jì)念版iPhone迎來(lái)重大變革，全屏設(shè)計(jì)+屏下攝像頭

不顧特朗普的阻撓，??Uber繼續(xù)全球擴(kuò)張…攜手土耳其及中國(guó)企

今年第二次，亞馬遜的 Zoox 召回 270 輛無(wú)人駕駛出租車(chē)