无码在线播放二区|久久亚洲精品国产精品|无码视频在线观看一区二区|在线观看国产日韩亚洲中

<menu id="yw4o4"></menu>

<menu id="yw4o4"><em id="yw4o4"></em></menu>

<table id="u62iq"></table>

DINOv2：Meta AI 開源的自監(jiān)督計(jì)算機(jī)視覺模型

2023-05-25 08:40 · 稿源：站長(zhǎng)之家

站長(zhǎng)之家(ChinaZ.com) 5月25日消息:Meta AI Research 發(fā)布了 DINOv2 開源項(xiàng)目，這是一款用于計(jì)算機(jī)視覺（CV）任務(wù)的基礎(chǔ)模型。DINOv2 在一個(gè)由 1.42 億張圖像構(gòu)成的篩選數(shù)據(jù)集上進(jìn)行了預(yù)訓(xùn)練，可用作圖像分類、視頻動(dòng)作識(shí)別、語義分割和深度估計(jì)等多個(gè)任務(wù)的骨干模型。

Meta，元宇宙，F(xiàn)acebook

Meta 基于 Vision Transformer（ViT）架構(gòu)構(gòu)建了該模型，并對(duì)其進(jìn)行了自監(jiān)督學(xué)習(xí)目標(biāo)的修改。團(tuán)隊(duì)建立了一個(gè)自動(dòng)化流程，從網(wǎng)絡(luò)上獲取圖像并構(gòu)建了一個(gè)篩選數(shù)據(jù)集來訓(xùn)練模型。其中一個(gè)重要的貢獻(xiàn)是改進(jìn)了訓(xùn)練過程，該方法的速度是之前方法的兩倍，內(nèi)存使用量減少了三分之一。在計(jì)算機(jī)視覺基準(zhǔn)測(cè)試中，DINOv2 優(yōu)于其他自監(jiān)督學(xué)習(xí)（SSL）模型，并顯示出與弱監(jiān)督模型相媲美或更好的性能。根據(jù) Meta 的說法：

展望未來，團(tuán)隊(duì)計(jì)劃將該模型整合到一個(gè)更大、更復(fù)雜的人工智能系統(tǒng)中，該系統(tǒng)可以與大型語言模型進(jìn)行交互。具備豐富圖像信息的視覺骨干模型將使復(fù)雜的人工智能系統(tǒng)能夠?qū)D像進(jìn)行比單一文本描述更深入的推理。以文本監(jiān)督進(jìn)行訓(xùn)練的模型最終受限于圖像標(biāo)題的內(nèi)容。而使用 DINOv2，則沒有這樣的內(nèi)置限制。

計(jì)算機(jī)視覺任務(wù)的深度學(xué)習(xí)模型通常依賴于帶有人工注釋的大型圖像數(shù)據(jù)集，例如 ImageNet。2021 年，OpenAI 發(fā)布了 CLIP，這是一個(gè)使用弱監(jiān)督訓(xùn)練方法的計(jì)算機(jī)視覺基礎(chǔ)模型，其中的注釋是通過爬取與源圖像相關(guān)的 html 標(biāo)簽和其他網(wǎng)絡(luò)元數(shù)據(jù)自動(dòng)生成的。同年，Google 發(fā)布了 ViT 模型，它使用自監(jiān)督學(xué)習(xí)進(jìn)行訓(xùn)練。Meta 也發(fā)布了 DINO 的原始版本的研究成果，將 ViT 模型與知識(shí)蒸餾相結(jié)合，從而獲得了性能相當(dāng)?shù)〉哪Ｐ汀?/p>

對(duì)于 DINOv2，Meta 專注于收集更多訓(xùn)練數(shù)據(jù)并擴(kuò)大訓(xùn)練過程。對(duì)于訓(xùn)練數(shù)據(jù)，Meta 從互聯(lián)網(wǎng)上收集了 1.2B 個(gè)獨(dú)特的圖像，然后根據(jù)它們與 ImageNet 數(shù)據(jù)集中圖像的相似性對(duì)它們進(jìn)行聚類，以獲得最終的 142M 圖像集。為了擴(kuò)大訓(xùn)練規(guī)模，Meta 實(shí)施了自定義版本的 FlashAttention，并使用 PyTorch 進(jìn)行完全分片數(shù)據(jù)并行 (FSDP) 訓(xùn)練?？傮w而言，該項(xiàng)目消耗了大約 20 萬個(gè) GPU 日的計(jì)算量。

為了評(píng)估 DINOv2 作為基礎(chǔ)模型的性能，該團(tuán)隊(duì)在各種 CV 任務(wù)上對(duì)其進(jìn)行了測(cè)試，并將其與幾個(gè)基線 SSL 模型以及 CLIP 等弱監(jiān)督模型進(jìn)行了比較。在 ImageNet-1k 分類任務(wù)上，DINOv2 與其他 SSL 模型相比表現(xiàn)出「非常顯著的改進(jìn)」，并且表現(xiàn)優(yōu)于弱監(jiān)督模型。它還在三個(gè)視頻動(dòng)作識(shí)別基準(zhǔn)測(cè)試中創(chuàng)造了新的 SSL 最先進(jìn)記錄，并在實(shí)例級(jí)識(shí)別基準(zhǔn)測(cè)試和三個(gè)單眼深度估計(jì)基準(zhǔn)測(cè)試中表現(xiàn)優(yōu)于基線。

在 Hacker News 關(guān)于這項(xiàng)工作的討論中，一些用戶稱贊了 Meta 最近在計(jì)算機(jī)視覺方面的工作以及 PyTorch 等過去的貢獻(xiàn)。有人確實(shí)注意到 Meta 圍繞他們的工作進(jìn)行交流的轉(zhuǎn)變：

作為該領(lǐng)域的研究生，在 Yann LeCun 的內(nèi)部倡導(dǎo)下，Meta 一直為開源機(jī)器學(xué)習(xí)工作做出了不小的貢獻(xiàn)。最近發(fā)生變化的是他們的公關(guān)策略：[OpenAI] 基本上已經(jīng)向所有人表明，如果你的宣傳很糟糕，那么你是否有最好的模型并不重要。

GitHub 上提供了 DINOv2 代碼和模型。該項(xiàng)目站點(diǎn)托管了使用 DINOv2 的多個(gè)計(jì)算機(jī)視覺任務(wù)的交互式演示。

DINOv2 開源模型 GitHub 地址：https://github.com/facebookresearch/dinov2

DINOv2 開源項(xiàng)目： https://dinov2.metademolab.com/

（舉報(bào)）

相關(guān)推薦

關(guān)鍵詞：

苦等一年 Meta終于放大招正式發(fā)布開源大模型Llama 4

美國(guó)科技巨擘Meta重磅推出其迄今最為強(qiáng)大的開源AI模型Llama4，恰逢Llama3上市一周年之際。Llama4系列采用了先進(jìn)的混合專家架構(gòu)，這一架構(gòu)在模型訓(xùn)練及用戶查詢回答過程中展現(xiàn)出更高效率，通過將模型劃分為多個(gè)專注于特定任務(wù)的專家”子模型，實(shí)現(xiàn)精準(zhǔn)高效的處理。Meta首席執(zhí)行官扎克伯格表示：他們的目標(biāo)是建立世界領(lǐng)先的人工智能，將其開源，并使其普遍可用，以便世界上每個(gè)人都能受益。

?Meta ?Llama ?4
似乎，扎克伯格真覺得特朗普能讓 Meta 訴訟“消失”！

大型科技公司的億萬富翁們都認(rèn)為自己能搭上特朗普

?扎克伯格 ?特朗普 ?meta
Meta AI眼鏡“實(shí)時(shí)翻譯”功能全面開放，不聯(lián)網(wǎng)也能用！

用戶下載語言包后，即使沒有聯(lián)網(wǎng)（WiFi 或通信數(shù)據(jù)）也能使用，被認(rèn)為是“出行好伴侶”。

?人工智能 ?meta ?meta智能眼鏡
Meta被指“非法壟斷”，若敗訴，將被迫失去“50%收入”！

如果 Meta 敗訴，它將被迫出售占其廣告收入一半的 Instagram 和全球使用最廣泛的即時(shí)通訊應(yīng)用 WhatsApp。

?meta ?扎克伯格 ?Instagram
蘋果追趕Meta:庫克押注智能眼鏡搶占AR市場(chǎng)

蘋果公司正在開發(fā)一款配備攝像頭和麥克風(fēng)的智能眼鏡，作為實(shí)現(xiàn)真正AR眼鏡夢(mèng)想前的過渡產(chǎn)品，據(jù)彭博社記者馬克·古爾曼報(bào)道。這一舉措顯示了CEO蒂姆·庫克對(duì)AR技術(shù)的堅(jiān)定承諾。隨著Meta在智能眼鏡領(lǐng)域取得的成功，蘋果很可能會(huì)在實(shí)現(xiàn)完整AR眼鏡愿景之前推出某種形式的智能眼鏡產(chǎn)品，以保持在可穿戴設(shè)備市場(chǎng)的競(jìng)爭(zhēng)力。
庫克押注AR！蘋果的終極目標(biāo)是打造AR眼鏡：超越Meta

快科技4月15日消息，去年上市的蘋果Vision Pro因售價(jià)高昂、機(jī)身過重等問題并沒有引起太大反響。知名蘋果記者M(jìn)ark Gurman表示，Vision Pro不是蘋果的終極目標(biāo)設(shè)備，蘋果CEO庫克正全力推動(dòng)增強(qiáng)現(xiàn)實(shí)AR眼鏡的研發(fā)，誓要超越對(duì)手Meta。據(jù)悉，庫克十年來一直懷揣著打造真正AR眼鏡的宏大構(gòu)想，能讓用戶全天佩戴，輕巧便攜，還能提供類似visionOS的視覺體驗(yàn)。為此，蘋果還會(huì)持續(xù)對(duì)Vision Pr

?蘋果 ?增強(qiáng)現(xiàn)實(shí) ?AR眼鏡
大型科技公司審查更加嚴(yán)苛，蘋果和 Meta 遭歐天價(jià)罰款

針對(duì)蘋果和 Meta 的行動(dòng)可能僅僅是一個(gè)開始。谷歌和 X 也正在歐盟監(jiān)管機(jī)構(gòu)的監(jiān)管之下 —— 立法者正在推動(dòng)采取堅(jiān)定、一致的措施……

?蘋果公司 ?meta ?數(shù)字市場(chǎng)法
Meta重組仍在繼續(xù)，Reality Labs部門裁員超百人

“提高績(jī)效管理的標(biāo)準(zhǔn)，讓績(jī)效低下的員工盡快下崗”，扎克伯格在此前的備忘錄中如是寫道。同時(shí)，還敦促員工要提高積極性……

?meta裁員 ?meta ?RealityLabs
Meta說他們的 Llama 4 偏見少了！但，“虛假對(duì)等”才是真偏見

Meta公司稱，相比之前的版本，他們最新的人工智能模型Llama4的政治偏見更少了。其中一部分便是通過允許該模型回答更多帶有政治爭(zhēng)議性的問題來實(shí)現(xiàn)這一點(diǎn)的。下次當(dāng)你使用Meta的AI產(chǎn)品時(shí)，它可能會(huì)為“通過服用馬用鎮(zhèn)靜劑來治療新冠病毒”這種觀點(diǎn)說好話！

?meta ?ai產(chǎn)品 ?Llama4
預(yù)知特朗普關(guān)稅之災(zāi)？扎克伯格拋售 Meta 股份，套現(xiàn)超 50 億元

關(guān)稅之災(zāi)下……扎克伯格、杰米·戴蒙、薩弗拉·卡茲、尼科什·阿羅拉等美國(guó)富豪開啟“拋售潮”。

?扎克伯格 ?特朗普關(guān)稅政策 ?特朗普關(guān)稅

熱文

3 天
7天

1

累了倦了就找 ChatGPT……AI正在淪為“情緒垃圾桶”！

站長(zhǎng)商機(jī)

廣告

商務(wù)合作侵權(quán)投訴廣告服務(wù) 版權(quán)聲明招聘

?CopyRight 2002-2020 CHINAZ.COM