无码在线播放二区|久久亚洲精品国产精品|无码视频在线观看一区二区|在线观看国产日韩亚洲中

  • <menu id="yw4o4"></menu>
  • 
    <menu id="yw4o4"><em id="yw4o4"></em></menu>
  • 首頁(yè) > 業(yè)界 > 關(guān)鍵詞  > AI框架最新資訊  > 正文

    FC-CLIP徹底改變?nèi)胺指睿航y(tǒng)一的單級(jí)AI 框架

    2023-09-27 14:11 · 稿源:站長(zhǎng)之家

    要點(diǎn):

    1、全景分割將語(yǔ)義分割和實(shí)例分割相結(jié)合,對(duì)圖像進(jìn)行精細(xì)分割標(biāo)注,但受限于數(shù)據(jù)集標(biāo)注成本。

    2、FC-CLIP通過(guò)凍結(jié)卷積CLIPbackbone實(shí)現(xiàn)掩碼生成和CLIP文本對(duì)齊分類的單階段統(tǒng)一,突破閉詞匯限制。

    3、FC-CLIP設(shè)計(jì)簡(jiǎn)單高效,參數(shù)和計(jì)算量都大大減少,性能顯著提升,可擴(kuò)展到開(kāi)放詞匯場(chǎng)景。

    站長(zhǎng)之家(ChinaZ.com)9月27日 消息:全景分割是將圖像分割成有意義的部分或區(qū)域的基礎(chǔ)計(jì)算機(jī)視覺(jué)任務(wù),對(duì)各種應(yīng)用如醫(yī)學(xué)圖像分析和自動(dòng)駕駛具有關(guān)鍵作用。全景分割將語(yǔ)義分割的對(duì)每個(gè)像素進(jìn)行對(duì)象分類,和實(shí)例分割的對(duì)同類不同實(shí)例進(jìn)行區(qū)分相結(jié)合,目標(biāo)是為每個(gè)實(shí)例生成不重疊的掩碼并賦予類別標(biāo)簽。

    多年來(lái),研究者不斷提升全景分割模型性能,重點(diǎn)關(guān)注全景質(zhì)量指標(biāo)。但是基于閉詞匯的限制嚴(yán)重制約了這些模型的實(shí)際應(yīng)用,因?yàn)閿?shù)據(jù)集細(xì)顆粒度標(biāo)注的高成本限制了語(yǔ)義類別數(shù)目。這成為全景分割應(yīng)用的關(guān)鍵難題。

    image.png

    項(xiàng)目地址:https://github.com/bytedance/fc-clip

    計(jì)算機(jī)視覺(jué)社區(qū)探索開(kāi)放詞匯分割來(lái)克服閉詞匯的限制。這種范式利用單詞的文本嵌入作為類別標(biāo)簽嵌入,大大增強(qiáng)了模型處理更廣泛類別的能力。CLIP等多模態(tài)預(yù)訓(xùn)練模型利用其從海量互聯(lián)網(wǎng)數(shù)據(jù)中學(xué)習(xí)對(duì)齊圖像文本特征表示的能力,在開(kāi)放詞匯分割中顯示出巨大潛力。

    近期的兩階段方法如SimBaseline和OVSeg改編了CLIP進(jìn)行開(kāi)放詞匯分割,但固有的低效和分割與分類不一致的問(wèn)題仍然存在。提出單階段統(tǒng)一框架FC-CLIP正是為解決這一關(guān)鍵問(wèn)題。

    image.png

    FC-CLIP在共享的凍結(jié)卷積CLIP backbone上無(wú)縫集成了掩碼生成和CLIP分類。這種設(shè)計(jì)基于以下核心思路:

    凍結(jié)的CLIP backbone保留了預(yù)訓(xùn)練的圖像文本對(duì)齊,支持開(kāi)放詞匯分類。

    添加輕量級(jí)解碼器后,CLIP backbone可作為強(qiáng)大的掩碼生成器。

    卷積CLIP在輸入尺寸放大時(shí)泛化能力提升,適合密集預(yù)測(cè)任務(wù)。

    單一凍結(jié)卷積CLIP backbone帶來(lái)極簡(jiǎn)但高效的設(shè)計(jì)。相較先前方法,F(xiàn)C-CLIP參數(shù)和計(jì)算量大幅減少,訓(xùn)練時(shí)間也更短,實(shí)用性強(qiáng)。在多個(gè)數(shù)據(jù)集上,F(xiàn)C-CLIP都顯著提升了狀態(tài)轉(zhuǎn)換水平。

    FC-CLIP開(kāi)創(chuàng)性的單階段框架統(tǒng)一了掩碼生成和文本匹配分類,具有巨大的潛力推動(dòng)全景分割向開(kāi)放詞匯場(chǎng)景擴(kuò)展,實(shí)現(xiàn)真正的圖像理解和交互。這項(xiàng)突破性工作為端到端的單階段全景分割方法提供了范例,值得進(jìn)一步改進(jìn)和擴(kuò)展。

    舉報(bào)

    • 相關(guān)推薦
    • 再獲權(quán)威認(rèn)可!數(shù)勢(shì)科技上榜IDC中國(guó)AI Agent應(yīng)用市場(chǎng)全景圖報(bào)告

      近日,國(guó)際數(shù)據(jù)公司(IDC)發(fā)布的《IDC Market Glance:中國(guó)AI Agent應(yīng)用市場(chǎng)概覽,1Q25》(Doc#CHC53057625, 2025 年 3 月)研究報(bào)告中,數(shù)勢(shì)科技憑借在企業(yè)級(jí)智能體應(yīng)用領(lǐng)域的技術(shù)突破,成功入圍"數(shù)據(jù)分析"細(xì)分領(lǐng)域代表廠商,成為該賽道智能化轉(zhuǎn)型的標(biāo)桿企業(yè)。數(shù)勢(shì)科技首發(fā)企業(yè)級(jí)決策分析智能體平臺(tái)SwiftAgent數(shù)勢(shì)科技SwiftAgent 作為基于DeepSeek及行業(yè)先進(jìn)大模型構(gòu)建的企業(yè)級(jí)智能決策分?

    • 比其它平臺(tái)晚了幾年!Apple Music Windows版本終于有了杜比全景

      近日,蘋果在AppleMusicforWindows10/11版本中添加了杜比全景聲支持,讓W(xué)indows用戶也能享受到沉浸式的音樂(lè)體驗(yàn)。此前AppleMusic的其他版本,如iOS版、iPadOS版、Mac版、AppleTV版和Android版都已經(jīng)在2021年之后陸續(xù)支持杜比全景聲,但Windows用戶一直未能享受到這一功能。需要注意的是,AppleMusic沒(méi)有免費(fèi)版,用戶需要訂閱后才能收聽(tīng)。

    • 攻克“癌癥之王”難題!我國(guó)專家成功繪制球首份“多組學(xué)全景圖譜”

      中國(guó)醫(yī)學(xué)專家歷經(jīng)五年研究,成功繪制出全球首張無(wú)功能性胰腺神經(jīng)內(nèi)分泌瘤多組學(xué)全景圖譜。基于該圖譜,專家們創(chuàng)新性提出針對(duì)這種沉默腫瘤”的分子分型框架、預(yù)后模型及靶向-免疫治療新策略,為臨床精準(zhǔn)診療提供了重要參考。更具臨床應(yīng)用價(jià)值的是,研究團(tuán)隊(duì)發(fā)現(xiàn)相關(guān)蛋白在患者血漿中的濃度與腫瘤進(jìn)展顯著相關(guān),這一突破性發(fā)現(xiàn)或?qū)⑼苿?dòng)診療模式從傳統(tǒng)的有創(chuàng)組織活檢”向無(wú)創(chuàng)血液檢測(cè)”轉(zhuǎn)變。

    • MCP協(xié)議和Function Calling 、 AI Agents的區(qū)別是什么?MCP優(yōu)勢(shì)有哪些

      MCP、FunctionCalling和AIAgents是三種重要的技術(shù)手段,它們?cè)趯?shí)現(xiàn)AI模型與外部系統(tǒng)交互方面各有特點(diǎn)。本文將詳細(xì)對(duì)比這三種技術(shù),并深入探討MCP的多項(xiàng)顯著優(yōu)勢(shì)。隨著MCP技術(shù)的不斷發(fā)展,我們有理由相信,它將在未來(lái)的AI領(lǐng)域發(fā)揮越來(lái)越重要的作用。

    • 美團(tuán)回應(yīng)腦癱女騎手文差評(píng)多:所有差評(píng)免責(zé)

      近日,杭州一位腦癱女騎手文景的勵(lì)志故事在網(wǎng)絡(luò)引發(fā)熱議。這位7年如一日?qǐng)?jiān)持送外賣的母親,用摔壞6輛電動(dòng)車的代價(jià),為家庭撐起一片天。盡管因語(yǔ)言障礙常被顧客誤解,甚至被部分網(wǎng)友戲稱為“差評(píng)最多騎手”,但她始終以日均10小時(shí)的工作強(qiáng)度

    • 網(wǎng)首發(fā)!首個(gè)AI投顧方向的盈米MCP Server發(fā)布

      4月8日,盈米基金發(fā)布業(yè)內(nèi)首個(gè)財(cái)富管理MCPServer,旨在將基金等相關(guān)數(shù)據(jù)和服務(wù)通過(guò)標(biāo)準(zhǔn)化的MCP協(xié)議進(jìn)行全新封裝,以此打通AI大模型獲取金融領(lǐng)域數(shù)據(jù)與服務(wù)的橋梁,為后續(xù)在DeepSeek、豆包、通義千問(wèn)等AI大模型的基礎(chǔ)上構(gòu)建專業(yè)、可靠的金融領(lǐng)域垂直AI應(yīng)用奠定基礎(chǔ)。盈米基金本次行業(yè)首發(fā),標(biāo)志著財(cái)富管理行業(yè)垂直領(lǐng)域與AI大模型的深度融合進(jìn)入了全新階段。先已全面開(kāi)放內(nèi)測(cè),歡迎大家申請(qǐng)?jiān)囉皿w驗(yàn)。

    • eBay 與 Checkout.com 達(dá)成球支付收戰(zhàn)略合作

      此次合作將升級(jí)拓展 eBay 的全球支付平臺(tái)功能,優(yōu)化消費(fèi)者購(gòu)物體驗(yàn)并提升運(yùn)營(yíng)效率。美國(guó)圣何塞與英國(guó)倫敦— 2025 年 4 月 16 日 — 全球電商領(lǐng)軍企業(yè) eBay 今日宣布與國(guó)際領(lǐng)先數(shù)字支付平臺(tái) Checkout.com 達(dá)成戰(zhàn)略合作伙伴關(guān)系。通過(guò)此次合作,eBay 將進(jìn)一步擴(kuò)展其全球支付平臺(tái)能力,為消費(fèi)者提供更流暢的交易體驗(yàn),同時(shí)實(shí)現(xiàn)降本增效。作為全球最大的電商平臺(tái)之一,eBay 平臺(tái)目?

    • MCP server資源網(wǎng)站去哪找?如何在Cline中配置MCP工具?

      隨著人工智能技術(shù)的快速發(fā)展,MCP服務(wù)已成為提升開(kāi)發(fā)效率和AI能力的重要工具。Cline作為一個(gè)強(qiáng)大的AI編程助手,支持多種MCP服務(wù),幫助開(kāi)發(fā)者更高效地完成任務(wù)。通過(guò)以上步驟,你可以在Cline中成功使用MCP服務(wù),提升開(kāi)發(fā)效率和AI能力。

    • 谷歌搜索棄用國(guó)別頂級(jí)域名后綴!統(tǒng)一為google.com

      快科技4月16日消息,谷歌宣布將在未來(lái)幾個(gè)月內(nèi)逐步將所有搜索用戶重定向至主域名google.com,將不再使用國(guó)家代碼頂級(jí)域名(ccTLD)。無(wú)論用戶使用哪個(gè)國(guó)家的域名訪問(wèn)谷歌搜索,如英國(guó)的google.co.uk或巴西的google.com.br,最終都將被重定向至google.com。谷歌表示,這一決定旨在簡(jiǎn)化用戶體驗(yàn),并確保所有用戶都能獲得一致的搜索結(jié)果。此前谷歌之所以采用國(guó)別頂級(jí)域名的后綴,主要是可以實(shí)現(xiàn)搜索結(jié)果的本地化,例如當(dāng)用戶訪問(wèn)的是google.com.uk,則側(cè)重于提供來(lái)自與英國(guó)有關(guān)的搜索結(jié)果。自2017年以來(lái),谷歌已經(jīng)根據(jù)用戶的地理位置自動(dòng)調(diào)整

    • 驍龍8至尊小折疊旗艦 小米MIX Flip 2獲認(rèn)證

      據(jù)中國(guó)質(zhì)量認(rèn)證中心官網(wǎng)顯示,日前,小米旗下一款型號(hào)為2505APX7BC”的新機(jī)已經(jīng)通過(guò)認(rèn)證,證書(shū)編號(hào)為2025011606767993,支持67W快充。該機(jī)為小米第二款小折疊手機(jī)小米MIXFlip2。值得一提的是,小米專門為其打造的影像套裝也非?;鸨?,很長(zhǎng)一段時(shí)間都賣斷貨,其本質(zhì)就是挎包照片打印機(jī),組合起來(lái)成為一款折疊屏拍立得”。

    熱文

    • 3 天
    • 7天