无码在线播放二区|久久亚洲精品国产精品|无码视频在线观看一区二区|在线观看国产日韩亚洲中

  • <menu id="yw4o4"></menu>
  • 
    <menu id="yw4o4"><em id="yw4o4"></em></menu>
  • 首頁 > 業(yè)界 > 關(guān)鍵詞  > DiffPortrait3D最新資訊  > 正文

    AI模型DiffPortrait3D:一張肖像圖就能創(chuàng)造各種逼真表情3D表情

    2023-12-28 14:29 · 稿源:站長之家

    # 劃重點(diǎn)

    1. ?? DiffPortrait3D是字節(jié)跳動(dòng)團(tuán)隊(duì)研發(fā)的一種條件擴(kuò)散模型,可從一張野外拍攝的肖像中創(chuàng)建逼真的、3D一致的視圖。

    2. ?? 該模型通過零樣本能力,能夠從單一的肖像生成多樣的面部視圖,包括不定姿態(tài)、夸張表情和各種藝術(shù)風(fēng)格,無需繁瑣的優(yōu)化或微調(diào)。

    3. ?? DiffPortrait3D采用了2D擴(kuò)散模型的生成先驗(yàn),結(jié)合特殊的條件控制模塊、交叉視圖注意力模塊和3D感知噪聲生成機(jī)制,實(shí)現(xiàn)了在多視角和野外場景下的高質(zhì)量、真實(shí)感的3D人像合成。

    站長之家(ChinaZ.com)12月28日 消息:近期,大型語言模型(LLMs)在人工智能社區(qū)引起了轟動(dòng),歸功于其出色的能力和性能。這些模型在幾乎所有基于AI子領(lǐng)域的行業(yè)中展現(xiàn)出了非凡的應(yīng)用,包括自然語言處理、自然語言生成和計(jì)算機(jī)視覺。盡管計(jì)算機(jī)視覺,尤其是擴(kuò)散模型引起了極大關(guān)注,但仍然存在使用有限輸入生成高保真、連貫新視角的挑戰(zhàn)。

    為了應(yīng)對這一挑戰(zhàn),字節(jié)跳動(dòng)的研究團(tuán)隊(duì)最近推出了DiffPortrait3D,這是一種獨(dú)特的條件擴(kuò)散模型,旨在從一張野外拍攝的肖像中創(chuàng)建逼真的、3D一致的視圖。DiffPortrait3D可以將一張二維(2D)非受限制的肖像重建為人臉的三維(3D)表示。

    image.png

    簡單來說,給定一張彩色照片作為輸入,該項(xiàng)目的目標(biāo)是合成具有保持身份和面部表情的合理但一致的面部細(xì)節(jié),以新的相機(jī)視角呈現(xiàn)出來。與耗時(shí)的優(yōu)化和微調(diào)不同,這種零樣本方法能夠很好地推廣到具有不規(guī)定相機(jī)視角、極端面部表情和多樣藝術(shù)描繪的任意人臉肖像。其核心思想是利用在大規(guī)模圖像數(shù)據(jù)集上預(yù)訓(xùn)練的2D擴(kuò)散模型作為渲染骨架,同時(shí)使用解耦的關(guān)注控制外觀和相機(jī)姿勢的去噪引導(dǎo)。

    為了實(shí)現(xiàn)這一點(diǎn),首先將參考圖像的外觀上下文注入到凍結(jié)的UNets的自注意層中。然后,使用一個(gè)新穎的條件控制模塊來解釋相機(jī)姿勢,該模塊通過觀察來自相同視角的一個(gè)交叉主體的條件圖像。此外,研究人員插入一個(gè)可訓(xùn)練的跨視圖注意模塊來增強(qiáng)視圖一致性,這進(jìn)一步通過推斷期間的新穎3D感知噪聲生成過程得以加強(qiáng)。

    DiffPortrait3D使用特殊的條件控制模塊來改變渲染視圖。該模塊分析從相同角度拍攝的主體的條件圖像,以解釋相機(jī)的態(tài)度。這使得模型能夠從不同視角結(jié)合一致的面部特征。

    為了進(jìn)一步提高視覺一致性,還引入了一個(gè)可訓(xùn)練的交叉視圖注意力模塊。在面對嚴(yán)重的面部表情或不定姿態(tài)的相機(jī)視角可能導(dǎo)致困難的情況下,這個(gè)模塊尤其有幫助。

    為了確保推理過程的彈性,還包括了一種獨(dú)特的3D感知噪聲生成機(jī)制。這一階段增加了合成圖像的整體穩(wěn)定性和逼真感。團(tuán)隊(duì)在嚴(yán)格的多視角和野外基準(zhǔn)測試上評(píng)估了DiffPortrait3D的性能,展示了在各種藝術(shù)風(fēng)格和環(huán)境設(shè)置下產(chǎn)生逼真高質(zhì)量面部重建的最新成果。

    該技術(shù)主要特點(diǎn)包括:

    1. 引入了一種獨(dú)特的零樣本方法,通過擴(kuò)展2D穩(wěn)定擴(kuò)散,從單一肖像創(chuàng)建3D一致的新視圖。

    2. 該方法在獨(dú)特視圖合成方面取得了令人印象深刻的成就,支持外觀、表情、態(tài)度和風(fēng)格各異的肖像,無需繁瑣的微調(diào)。

    3. 使用明確分離的外觀和相機(jī)視圖控制系統(tǒng),實(shí)現(xiàn)了有效的相機(jī)操作,而不影響主體的表情或身份。

    4. 該方法結(jié)合了交叉視圖注意力模塊和3D感知噪聲生成技術(shù),提供了3D視圖的長程一致性。

    項(xiàng)目網(wǎng)址體驗(yàn):https://top.aibase.com/tool/diffportrait3d

    論文網(wǎng)址:https://arxiv.org/abs/2312.13016

    舉報(bào)

    • 相關(guān)推薦
    • 日銷破千元!AI生成的3D掛件,被我們賣爆了

      先說結(jié)論:我們花15天做的AI3D掛件,在線下賣爆了,單日營收破千元!故事的開始,是因?yàn)槲覀儼l(fā)現(xiàn)把AI3D打印手辦做成一門小生意的可行性越來越高,這也激發(fā)了我們的“搞錢基因”。再加上前不久新榜在上海舉辦了「新榜內(nèi)容節(jié)」,一拍即合,我們于是做了一批模型去大會(huì)現(xiàn)場擺攤試水!最后結(jié)果還不錯(cuò),單日最高收入突破1000元,是我們“創(chuàng)業(yè)史”上的一個(gè)高光表現(xiàn)。歡迎大家

    • 10倍精度升級(jí)!騰訊混元3D模型v2.5版本發(fā)布

      騰訊混元3D模型升級(jí)至v2.5版本,建模精度和貼圖真實(shí)度顯著提升。新版本參數(shù)體量從1B增至10B,有效面片數(shù)增加超10倍,支持1024幾何分辨率。紋理系統(tǒng)支持4K高清貼圖和凹凸細(xì)節(jié),率先支持多視圖生成PBR模型。針對動(dòng)畫場景優(yōu)化骨骼蒙皮系統(tǒng),支持非標(biāo)準(zhǔn)姿態(tài)自動(dòng)綁定。新增文生/圖生3D減面模型、多視圖建模模板等專業(yè)工作流?;煸?D v2.5已全面更新至騰訊AI創(chuàng)作引擎,免費(fèi)生成額度提升至每日20次,并正式上線騰訊云API面向企業(yè)開放。GitHub開源版本累計(jì)Star超1.2萬。

    • AI日報(bào):騰訊混元3D生成模型2.5版本發(fā)布;海螺推出像人物參考功能;百度上線移動(dòng)端超級(jí)智能體心響App

      本文介紹了多款A(yù)I領(lǐng)域的新產(chǎn)品和技術(shù)進(jìn)展:1)Kortix-AI推出開源通用AI智能體平臺(tái)Suna;2)騰訊混元3D生成模型升級(jí)至2.5版本;3)海螺AI推出基于單張圖像生成多角度角色圖像功能;4)百度發(fā)布"心響"App整合多智能體協(xié)作;5)Nari Labs開源媲美真人的對話語音模型Dia;6)Grok新增視覺處理和多語言支持;7)Genspark推出AI幻燈片工具;8)Character.AI發(fā)布讓靜態(tài)圖片"說話"的AvatarFX模型;9)pad.ws結(jié)合白板和代碼編輯器;10)OpenBMB開源社區(qū)推出長文本生成模型"卷姬";11)騰訊推出AI閱讀助手"企鵝讀伴";12)OpenAI有意收購Chrome瀏覽器;13)字節(jié)跳動(dòng)調(diào)整AI產(chǎn)品線布局。這些創(chuàng)新展現(xiàn)了AI技術(shù)在自動(dòng)化、3D生成、語音交互、內(nèi)容創(chuàng)作等領(lǐng)域的快速發(fā)展。

    • AI日報(bào):Kimi全新音頻基礎(chǔ)模型Kimi-Audio;階躍星辰開源像編輯模型Step1X-Edit;?夸克AI超級(jí)框上線 “拍照問夸克”

      本期AI日報(bào)聚焦多項(xiàng)AI技術(shù)突破與應(yīng)用:1)Moonshot AI推出開源音頻模型Kimi-Audio,基于13億小時(shí)訓(xùn)練數(shù)據(jù),支持語音識(shí)別等任務(wù);2)階躍星辰開源圖像編輯模型Step1X-Edit,展現(xiàn)強(qiáng)大生成能力;3)夸克AI上線"拍照問夸克"功能,實(shí)現(xiàn)視覺問答;4)蘋果iOS18.5將在中國推送,帶來智能功能;5)谷歌發(fā)布601個(gè)生成式AI應(yīng)用案例,覆蓋多行業(yè);6)微軟推出深度整合Windows的UFO2自動(dòng)化系統(tǒng);7)OpenAI升級(jí)ChatGPT至GPT-4o版本,提升STEM領(lǐng)域能力;8)Ema公司推出高性價(jià)比語言模型EmaFusion;9)Liquid AI發(fā)布面向邊緣設(shè)備的Hyena Edge模型;10)LemonAI推出實(shí)時(shí)音視頻數(shù)字人產(chǎn)品Slice Live。此外,國內(nèi)方面,智譜與生數(shù)科技達(dá)成戰(zhàn)略合作推動(dòng)大模型發(fā)展,寶馬中國宣布新車將接入DeepSeek技術(shù)。

    • Trae國內(nèi)版怎么用?Trae IDE 內(nèi)置 MCP 市場配置使用指南

      字節(jié)跳動(dòng)旗下Trae+IDE發(fā)布新版本,通過MCP協(xié)議實(shí)現(xiàn)AI智能體與外部工具的深度集成。MCP作為標(biāo)準(zhǔn)化橋梁,讓開發(fā)者能靈活接入Supabase、FireCrawl等第三方服務(wù),只需@符號(hào)即可調(diào)用智能體完成數(shù)據(jù)庫操作、文檔搜索等復(fù)雜任務(wù)。新版本內(nèi)置MCP市場,支持Token快速配置,并演示了如何通過Figma+AI自動(dòng)生成前端代碼。該技術(shù)可應(yīng)用于Blender建模、K8s管理等多元場景,顯著提升開發(fā)效率。Trae+IDE將持續(xù)擴(kuò)展工具生態(tài),推動(dòng)AI協(xié)作開發(fā)新時(shí)代。

    • 曝iPhone 18 Pro內(nèi)測屏下3D人臉識(shí)別:蘋果邁入單挖孔屏?xí)r代

      這意味著iPhone 18 Pro系列正式邁入單挖孔屏?xí)r代,向安卓主流屏幕形態(tài)看齊。需要注意的是,安卓陣營普遍采用單挖孔 屏幕指紋識(shí)別方案,而iPhone則是采用屏下3D人臉識(shí)別方案,不支持屏幕指紋。

    • ?上海毅速推出第三代模具3D打印專機(jī)E3系列,引領(lǐng)模具制造技術(shù)革新

      導(dǎo)讀:近年來,金屬3D打印技術(shù)在模具制造領(lǐng)域得到了廣泛的應(yīng)用,模具行業(yè)正在迎來一場前所未有的技術(shù)變革,隨著應(yīng)用的逐漸深入,模具專用的金屬3D打印機(jī)應(yīng)運(yùn)而生。2025 年 4 月 15 日,上海毅速激光科技有限公司(以下簡稱“毅速”)正式發(fā)布了其第三代模具3D打印專機(jī)系列——E3- 420 和E3-520。這一新品的推出,標(biāo)志著模具制造行業(yè)向增材制造邁出了重要一步。毅速E3- 420 ?

    • 聚首華南,2025下半年增材制造、3D 打印的頂尖展覽與活動(dòng)推薦

      2025年全球3D打印行業(yè)將迎來系列盛會(huì)。4月西安論壇成功舉辦后,下半年將迎來深圳Formnext Asia(8月26-28日)、東京論壇(9月25-26日)和法蘭克福Formnext展會(huì)(11月18-21日)三大國際活動(dòng)。這些平臺(tái)將匯聚全球頂尖企業(yè),展示航空航天、醫(yī)療健康、汽車工業(yè)等領(lǐng)域的最新技術(shù)成果,特別關(guān)注中國企業(yè)的快速成長。法蘭克福展會(huì)預(yù)計(jì)吸引超900家展商,中國展商數(shù)量有望再創(chuàng)新高。系列活動(dòng)將搭建全球產(chǎn)業(yè)交流平臺(tái),推動(dòng)3D打印技術(shù)創(chuàng)新與商業(yè)應(yīng)用深度融合。

    • OPPO Find X8 Ultra堪稱電子阿膠:拍照直出氣血感

      今日晚間,OPPOFindX8Ultra正式亮相。該機(jī)帶來全新夜神五攝影像系統(tǒng),包括5000萬超廣角、5000萬1英寸LYT900主攝、5000萬像素3X鏡頭、5000萬像素6X望遠(yuǎn)鏡頭以及丹霞原彩鏡頭,同時(shí)配備OPPO超晶態(tài)藍(lán)玻璃,配合分區(qū)色溫感知技術(shù)和多模態(tài)協(xié)同計(jì)算技術(shù),一次性解決夜景人像細(xì)節(jié)糊、色彩偏、膚色怪的三大難題。根據(jù)官方實(shí)拍的對比樣張,F(xiàn)indX8Ultra能準(zhǔn)確還原人臉的膚色以及人像背后的環(huán)境,然后分別處理,讓人像看上去更有氣血感”,相比之下,iPhone16ProMax的人像樣張?jiān)朦c(diǎn)較多,膚色質(zhì)感跟OPPO有明顯差距。

    • Trae重磅升級(jí):全面開放自定義AI能力,用戶可打造個(gè)人專屬“AI 工程師”

      Trae新版本通過整合AI技術(shù),提供更智能、高效的開發(fā)體驗(yàn),支持多語言文件輸入與多種功能擴(kuò)展。它突破傳統(tǒng)IDE模式,強(qiáng)調(diào)人機(jī)協(xié)作與個(gè)性化定制,實(shí)現(xiàn)需求快速轉(zhuǎn)化和技術(shù)方案優(yōu)化。同時(shí),其開放的插件系統(tǒng)和自定義能力,滿足不同場景的專業(yè)開發(fā)需求,推動(dòng)AI在編程領(lǐng)域的深度融合與創(chuàng)新應(yīng)用。