无码在线播放二区|久久亚洲精品国产精品|无码视频在线观看一区二区|在线观看国产日韩亚洲中

  • <menu id="yw4o4"></menu>
  • 
    <menu id="yw4o4"><em id="yw4o4"></em></menu>
  • 首頁 > 業(yè)界 > 關(guān)鍵詞  > 3D搜索技術(shù)最新資訊  > 正文

    即時(shí)3D搜索技術(shù)OVIR-3D開源 可從文本提示中檢索3D對(duì)象

    2023-11-10 10:06 · 稿源:站長(zhǎng)之家

    要點(diǎn):

    1. OVIR-3D是一個(gè)開放詞匯的3D實(shí)例檢索系統(tǒng),能夠在沒有對(duì)3D數(shù)據(jù)進(jìn)行訓(xùn)練的情況下,從RGB-D視頻和語言查詢中返回排名的3D實(shí)例段。

    2. 該系統(tǒng)通過將問題視為從語言引導(dǎo)的2D區(qū)域提議進(jìn)行3D融合的問題,提供了一種直觀而有效的解決方案,避免了由于缺乏足夠種類的注釋3D數(shù)據(jù)而難以直接訓(xùn)練開放詞匯3D分割模型的問題。

    3. OVIR-3D的流程包括下載倉(cāng)庫(kù)、安裝依賴、演示、數(shù)據(jù)集準(zhǔn)備、2D到3D融合和推理等步驟,具有廣泛的應(yīng)用前景,同時(shí)有相關(guān)研究作品OVSG。

    站長(zhǎng)之家(ChinaZ.com)11月10日 消息:OVIR-3D是一個(gè)開放詞匯的3D實(shí)例檢索系統(tǒng),它以直觀而有效的方式解決了在沒有對(duì)3D數(shù)據(jù)進(jìn)行訓(xùn)練的情況下獲取3D實(shí)例的問題。該系統(tǒng)通過語言引導(dǎo)的2D區(qū)域提議進(jìn)行3D融合,為機(jī)器人應(yīng)用(如操縱和導(dǎo)航)提供了解決方案。OVIR-3D的核心思想是直接訓(xùn)練開放詞匯的3D分割模型在實(shí)踐中變得困難,因此它從語言引導(dǎo)的2D區(qū)域提議出發(fā),通過在大量2D數(shù)據(jù)集上進(jìn)行訓(xùn)練,將2D實(shí)例信息在3D空間中投影和融合,以實(shí)現(xiàn)快速檢索。

    image.png

    項(xiàng)目地址:https://github.com/shiyoung77/ovir-3d

    OVIR-3D的使用包括下載倉(cāng)庫(kù)、安裝依賴、演示、數(shù)據(jù)集準(zhǔn)備、2D到3D融合和推理等多個(gè)步驟。作者提供了詳細(xì)的使用說明,包括如何獲取倉(cāng)庫(kù)、安裝依賴以及演示過程。此外,系統(tǒng)支持自定義數(shù)據(jù)集的準(zhǔn)備,通過開源的實(shí)感相機(jī)和KinectFusion實(shí)現(xiàn),用戶能夠以指定格式錄制和重建自定義3D場(chǎng)景。

    在OVIR-3D的背后,Detic作為2D區(qū)域提議網(wǎng)絡(luò)的骨干,通過查詢Imagenet21k的所有類別,生成置信度閾值為0.3的輸出蒙版和文本對(duì)齊特征。這一步驟的輸出被存儲(chǔ)在特定文件夾中,用戶可以選擇保存2D可視化,盡管這可能會(huì)降低推理速度。

    對(duì)于2D到3D的融合,OVIR-3D提供了一種算法來處理多個(gè)3D場(chǎng)景的并行融合,但作者建議至少擁有11GB內(nèi)存的顯卡以避免在處理大場(chǎng)景時(shí)出現(xiàn)內(nèi)存問題。一旦融合完成,用戶可以通過instance_query.py腳本與系統(tǒng)進(jìn)行交互,檢索3D實(shí)例。

    論文中提到OVIR-3D作為開放詞匯問題的一個(gè)解決方案,強(qiáng)調(diào)其評(píng)估方式采用信息檢索標(biāo)準(zhǔn)mAP,這是一種更合理的度量方式,盡管略有不同于通常用于封閉集實(shí)例分割的mAP度量。文章還提到了OVIR-3D的應(yīng)用前景,以及后續(xù)工作OVSG的介紹,該工作在OVIR-3D的基礎(chǔ)上構(gòu)建3D場(chǎng)景圖,實(shí)現(xiàn)更精準(zhǔn)的對(duì)象檢索。

    舉報(bào)

    • 相關(guān)推薦
    • 日銷破千元!AI生成的3D梗圖掛件,被我們賣爆了

      先說結(jié)論:我們花15天做的AI3D掛件,在線下賣爆了,單日營(yíng)收破千元!故事的開始,是因?yàn)槲覀儼l(fā)現(xiàn)把AI3D打印手辦做成一門小生意的可行性越來越高,這也激發(fā)了我們的“搞錢基因”。再加上前不久新榜在上海舉辦了「新榜內(nèi)容節(jié)」,一拍即合,我們于是做了一批模型去大會(huì)現(xiàn)場(chǎng)擺攤試水!最后結(jié)果還不錯(cuò),單日最高收入突破1000元,是我們“創(chuàng)業(yè)史”上的一個(gè)高光表現(xiàn)。歡迎大家

    • ?上海毅速推出第三代模具3D打印專機(jī)E3系列,引領(lǐng)模具制造技術(shù)革新

      導(dǎo)讀:近年來,金屬3D打印技術(shù)在模具制造領(lǐng)域得到了廣泛的應(yīng)用,模具行業(yè)正在迎來一場(chǎng)前所未有的技術(shù)變革,隨著應(yīng)用的逐漸深入,模具專用的金屬3D打印機(jī)應(yīng)運(yùn)而生。2025 年 4 月 15 日,上海毅速激光科技有限公司(以下簡(jiǎn)稱“毅速”)正式發(fā)布了其第三代模具3D打印專機(jī)系列——E3- 420 和E3-520。這一新品的推出,標(biāo)志著模具制造行業(yè)向增材制造邁出了重要一步。毅速E3- 420 ?

    • 聚首華南,2025下半年增材制造、3D 打印的頂尖展覽與活動(dòng)推薦

      2025年全球3D打印行業(yè)將迎來系列盛會(huì)。4月西安論壇成功舉辦后,下半年將迎來深圳Formnext Asia(8月26-28日)、東京論壇(9月25-26日)和法蘭克福Formnext展會(huì)(11月18-21日)三大國(guó)際活動(dòng)。這些平臺(tái)將匯聚全球頂尖企業(yè),展示航空航天、醫(yī)療健康、汽車工業(yè)等領(lǐng)域的最新技術(shù)成果,特別關(guān)注中國(guó)企業(yè)的快速成長(zhǎng)。法蘭克福展會(huì)預(yù)計(jì)吸引超900家展商,中國(guó)展商數(shù)量有望再創(chuàng)新高。系列活動(dòng)將搭建全球產(chǎn)業(yè)交流平臺(tái),推動(dòng)3D打印技術(shù)創(chuàng)新與商業(yè)應(yīng)用深度融合。

    • 10倍精度升級(jí)!騰訊混元3D模型v2.5版本發(fā)布

      騰訊混元3D模型升級(jí)至v2.5版本,建模精度和貼圖真實(shí)度顯著提升。新版本參數(shù)體量從1B增至10B,有效面片數(shù)增加超10倍,支持1024幾何分辨率。紋理系統(tǒng)支持4K高清貼圖和凹凸細(xì)節(jié),率先支持多視圖生成PBR模型。針對(duì)動(dòng)畫場(chǎng)景優(yōu)化骨骼蒙皮系統(tǒng),支持非標(biāo)準(zhǔn)姿態(tài)自動(dòng)綁定。新增文生/圖生3D減面模型、多視圖建模模板等專業(yè)工作流?;煸?D v2.5已全面更新至騰訊AI創(chuàng)作引擎,免費(fèi)生成額度提升至每日20次,并正式上線騰訊云API面向企業(yè)開放。GitHub開源版本累計(jì)Star超1.2萬。

    • 曝iPhone 18 Pro內(nèi)測(cè)屏下3D人臉識(shí)別:蘋果邁入單挖孔屏?xí)r代

      這意味著iPhone 18 Pro系列正式邁入單挖孔屏?xí)r代,向安卓主流屏幕形態(tài)看齊。需要注意的是,安卓陣營(yíng)普遍采用單挖孔 屏幕指紋識(shí)別方案,而iPhone則是采用屏下3D人臉識(shí)別方案,不支持屏幕指紋。

    • 創(chuàng)想三維十一周年慶典:多款新品發(fā)布,共筑3D打印新生態(tài)

      4月9日,全球消費(fèi)級(jí)3D打印領(lǐng)軍品牌創(chuàng)想三維在中國(guó)深圳、美國(guó)底特律兩地舉辦“創(chuàng)想三維十一周年慶典暨春季新品發(fā)布會(huì)”。公司聯(lián)合創(chuàng)始人陳春、敖丹軍、劉輝林、唐京科與來自全球的行業(yè)專家、核心經(jīng)銷商合作伙伴、供應(yīng)鏈合作伙伴及媒體代表共同見證品牌里程碑時(shí)刻。創(chuàng)想三維將持續(xù)加碼核心技術(shù)創(chuàng)新,通過技術(shù)突破、生態(tài)共建與用戶共創(chuàng),持續(xù)推動(dòng)3D打印技術(shù)從“小?

    • AI日?qǐng)?bào):騰訊混元3D生成模型2.5版本發(fā)布;海螺推出圖像人物參考功能;百度上線移動(dòng)端超級(jí)智能體心響App

      本文介紹了多款A(yù)I領(lǐng)域的新產(chǎn)品和技術(shù)進(jìn)展:1)Kortix-AI推出開源通用AI智能體平臺(tái)Suna;2)騰訊混元3D生成模型升級(jí)至2.5版本;3)海螺AI推出基于單張圖像生成多角度角色圖像功能;4)百度發(fā)布"心響"App整合多智能體協(xié)作;5)Nari Labs開源媲美真人的對(duì)話語音模型Dia;6)Grok新增視覺處理和多語言支持;7)Genspark推出AI幻燈片工具;8)Character.AI發(fā)布讓靜態(tài)圖片"說話"的AvatarFX模型;9)pad.ws結(jié)合白板和代碼編輯器;10)OpenBMB開源社區(qū)推出長(zhǎng)文本生成模型"卷姬";11)騰訊推出AI閱讀助手"企鵝讀伴";12)OpenAI有意收購(gòu)Chrome瀏覽器;13)字節(jié)跳動(dòng)調(diào)整AI產(chǎn)品線布局。這些創(chuàng)新展現(xiàn)了AI技術(shù)在自動(dòng)化、3D生成、語音交互、內(nèi)容創(chuàng)作等領(lǐng)域的快速發(fā)展。

    • 實(shí)力詮釋辦公生產(chǎn)力“新?lián)?dāng)”!Hi MateBook D 16/14新品來襲!

      4月26日,WIKO推出全新輕薄筆記本Hi MateBook D 16 2025和D 14 2025,主打全連接、智慧化和高性能三大優(yōu)勢(shì)。新品采用16:10黃金比例全面屏,屏占比高達(dá)90%,支持100% sRGB色域,通過德國(guó)萊茵低藍(lán)光認(rèn)證。搭載英特爾酷睿處理器,支持多屏協(xié)同功能,可同時(shí)開啟3個(gè)手機(jī)應(yīng)用窗口。AI慧眼支持背景替換和人臉追蹤,AI音效提供三種降噪模式。配備70Wh/56Wh大電池,支持65W快充。5月1日正式開售,起售價(jià)3899元。

    • Qwen3深夜正式開源,小尺寸也能大力出奇跡。

      阿里發(fā)布通義千問Qwen3大模型系列,包含8個(gè)不同規(guī)模的模型,從0.6B到235B參數(shù)全覆蓋。亮點(diǎn)包括:1)全球頂尖模型能力;2)首個(gè)開源的混合推理模型;3)支持119種語言;4)部署成本僅為DeepSeek+R1的三分之一;5)支持MCP協(xié)議。其中235B旗艦?zāi)P托阅軐?duì)標(biāo)頂級(jí)閉源模型,30B-MoE模型激活參數(shù)僅3B。所有模型均采用Apache2.0協(xié)議開源,支持商用。實(shí)測(cè)顯示Qwen3在代碼和寫作方面優(yōu)于DeepSeek

    • “榮昌豬小伙”13年后與譚sir重逢:稱從未放棄過自己的初心

      重慶小伙馬仁元13年后與曾因交通節(jié)目結(jié)緣的譚喬警官重逢。13年前馬仁元因邊騎三輪邊看手機(jī)被譚警官攔下,在節(jié)目中他不僅宣傳家鄉(xiāng)榮昌豬,還表達(dá)了將榮昌產(chǎn)品推向世界的夢(mèng)想。如今他仍在堅(jiān)持這一夢(mèng)想,雖經(jīng)歷困難但從未放棄初心。這次重逢不僅延續(xù)了兩人友誼,也展現(xiàn)了堅(jiān)持夢(mèng)想的力量。馬仁元的故事告訴我們,只要有夢(mèng)想并為之奮斗,就一定能實(shí)現(xiàn)人生價(jià)值。