无码在线播放二区|久久亚洲精品国产精品|无码视频在线观看一区二区|在线观看国产日韩亚洲中

<menu id="yw4o4"></menu>

<menu id="yw4o4"><em id="yw4o4"></em></menu>

AI模型DiffPortrait3D：一張肖像圖就能創(chuàng)造各種逼真表情3D表情

2023-12-28 14:29 · 稿源：站長之家

# 劃重點(diǎn)
1. ?? DiffPortrait3D是字節(jié)跳動(dòng)團(tuán)隊(duì)研發(fā)的一種條件擴(kuò)散模型，可從一張野外拍攝的肖像中創(chuàng)建逼真的、3D一致的視圖。
2. ?? 該模型通過零樣本能力，能夠從單一的肖像生成多樣的面部視圖，包括不定姿態(tài)、夸張表情和各種藝術(shù)風(fēng)格，無需繁瑣的優(yōu)化或微調(diào)。
3. ?? DiffPortrait3D采用了2D擴(kuò)散模型的生成先驗(yàn)，結(jié)合特殊的條件控制模塊、交叉視圖注意力模塊和3D感知噪聲生成機(jī)制，實(shí)現(xiàn)了在多視角和野外場景下的高質(zhì)量、真實(shí)感的3D人像合成。

站長之家（ChinaZ.com）12月28日消息:近期，大型語言模型（LLMs）在人工智能社區(qū)引起了轟動(dòng)，歸功于其出色的能力和性能。這些模型在幾乎所有基于AI子領(lǐng)域的行業(yè)中展現(xiàn)出了非凡的應(yīng)用，包括自然語言處理、自然語言生成和計(jì)算機(jī)視覺。盡管計(jì)算機(jī)視覺，尤其是擴(kuò)散模型引起了極大關(guān)注，但仍然存在使用有限輸入生成高保真、連貫新視角的挑戰(zhàn)。

為了應(yīng)對這一挑戰(zhàn)，字節(jié)跳動(dòng)的研究團(tuán)隊(duì)最近推出了DiffPortrait3D，這是一種獨(dú)特的條件擴(kuò)散模型，旨在從一張野外拍攝的肖像中創(chuàng)建逼真的、3D一致的視圖。DiffPortrait3D可以將一張二維（2D）非受限制的肖像重建為人臉的三維(3D)表示。

簡單來說，給定一張彩色照片作為輸入，該項(xiàng)目的目標(biāo)是合成具有保持身份和面部表情的合理但一致的面部細(xì)節(jié)，以新的相機(jī)視角呈現(xiàn)出來。與耗時(shí)的優(yōu)化和微調(diào)不同，這種零樣本方法能夠很好地推廣到具有不規(guī)定相機(jī)視角、極端面部表情和多樣藝術(shù)描繪的任意人臉肖像。其核心思想是利用在大規(guī)模圖像數(shù)據(jù)集上預(yù)訓(xùn)練的2D擴(kuò)散模型作為渲染骨架，同時(shí)使用解耦的關(guān)注控制外觀和相機(jī)姿勢的去噪引導(dǎo)。

為了實(shí)現(xiàn)這一點(diǎn)，首先將參考圖像的外觀上下文注入到凍結(jié)的UNets的自注意層中。然后，使用一個(gè)新穎的條件控制模塊來解釋相機(jī)姿勢，該模塊通過觀察來自相同視角的一個(gè)交叉主體的條件圖像。此外，研究人員插入一個(gè)可訓(xùn)練的跨視圖注意模塊來增強(qiáng)視圖一致性，這進(jìn)一步通過推斷期間的新穎3D感知噪聲生成過程得以加強(qiáng)。

DiffPortrait3D使用特殊的條件控制模塊來改變渲染視圖。該模塊分析從相同角度拍攝的主體的條件圖像，以解釋相機(jī)的態(tài)度。這使得模型能夠從不同視角結(jié)合一致的面部特征。

為了進(jìn)一步提高視覺一致性，還引入了一個(gè)可訓(xùn)練的交叉視圖注意力模塊。在面對嚴(yán)重的面部表情或不定姿態(tài)的相機(jī)視角可能導(dǎo)致困難的情況下，這個(gè)模塊尤其有幫助。

為了確保推理過程的彈性，還包括了一種獨(dú)特的3D感知噪聲生成機(jī)制。這一階段增加了合成圖像的整體穩(wěn)定性和逼真感。團(tuán)隊(duì)在嚴(yán)格的多視角和野外基準(zhǔn)測試上評(píng)估了DiffPortrait3D的性能，展示了在各種藝術(shù)風(fēng)格和環(huán)境設(shè)置下產(chǎn)生逼真高質(zhì)量面部重建的最新成果。

該技術(shù)主要特點(diǎn)包括:

1. 引入了一種獨(dú)特的零樣本方法，通過擴(kuò)展2D穩(wěn)定擴(kuò)散，從單一肖像創(chuàng)建3D一致的新視圖。

2. 該方法在獨(dú)特視圖合成方面取得了令人印象深刻的成就，支持外觀、表情、態(tài)度和風(fēng)格各異的肖像，無需繁瑣的微調(diào)。

3. 使用明確分離的外觀和相機(jī)視圖控制系統(tǒng)，實(shí)現(xiàn)了有效的相機(jī)操作，而不影響主體的表情或身份。

4. 該方法結(jié)合了交叉視圖注意力模塊和3D感知噪聲生成技術(shù)，提供了3D視圖的長程一致性。

項(xiàng)目網(wǎng)址體驗(yàn):https://top.aibase.com/tool/diffportrait3d

論文網(wǎng)址:https://arxiv.org/abs/2312.13016

（舉報(bào)）

相關(guān)推薦

關(guān)鍵詞：

薦日銷破千元！AI生成的3D梗圖掛件，被我們賣爆了

先說結(jié)論:我們花15天做的AI3D掛件，在線下賣爆了，單日營收破千元!故事的開始，是因?yàn)槲覀儼l(fā)現(xiàn)把AI3D打印手辦做成一門小生意的可行性越來越高，這也激發(fā)了我們的“搞錢基因”。再加上前不久新榜在上海舉辦了「新榜內(nèi)容節(jié)」，一拍即合，我們于是做了一批模型去大會(huì)現(xiàn)場擺攤試水!最后結(jié)果還不錯(cuò)，單日最高收入突破1000元，是我們“創(chuàng)業(yè)史”上的一個(gè)高光表現(xiàn)。歡迎大家

?AI ?3D打印 ?創(chuàng)業(yè)經(jīng)驗(yàn)
10倍精度升級(jí)！騰訊混元3D模型v2.5版本發(fā)布

騰訊混元3D模型升級(jí)至v2.5版本，建模精度和貼圖真實(shí)度顯著提升。新版本參數(shù)體量從1B增至10B，有效面片數(shù)增加超10倍，支持1024幾何分辨率。紋理系統(tǒng)支持4K高清貼圖和凹凸細(xì)節(jié)，率先支持多視圖生成PBR模型。針對動(dòng)畫場景優(yōu)化骨骼蒙皮系統(tǒng)，支持非標(biāo)準(zhǔn)姿態(tài)自動(dòng)綁定。新增文生/圖生3D減面模型、多視圖建模模板等專業(yè)工作流?；煸?D v2.5已全面更新至騰訊AI創(chuàng)作引擎，免費(fèi)生成額度提升至每日20次，并正式上線騰訊云API面向企業(yè)開放。GitHub開源版本累計(jì)Star超1.2萬。

?騰訊 ?混元3D ?模型升級(jí)
薦AI日報(bào)：騰訊混元3D生成模型2.5版本發(fā)布；海螺推出圖像人物參考功能；百度上線移動(dòng)端超級(jí)智能體心響App

本文介紹了多款A(yù)I領(lǐng)域的新產(chǎn)品和技術(shù)進(jìn)展：1)Kortix-AI推出開源通用AI智能體平臺(tái)Suna；2)騰訊混元3D生成模型升級(jí)至2.5版本；3)海螺AI推出基于單張圖像生成多角度角色圖像功能；4)百度發(fā)布"心響"App整合多智能體協(xié)作；5)Nari Labs開源媲美真人的對話語音模型Dia；6)Grok新增視覺處理和多語言支持；7)Genspark推出AI幻燈片工具；8)Character.AI發(fā)布讓靜態(tài)圖片"說話"的AvatarFX模型；9)pad.ws結(jié)合白板和代碼編輯器；10)OpenBMB開源社區(qū)推出長文本生成模型"卷姬"；11)騰訊推出AI閱讀助手"企鵝讀伴"；12)OpenAI有意收購Chrome瀏覽器；13)字節(jié)跳動(dòng)調(diào)整AI產(chǎn)品線布局。這些創(chuàng)新展現(xiàn)了AI技術(shù)在自動(dòng)化、3D生成、語音交互、內(nèi)容創(chuàng)作等領(lǐng)域的快速發(fā)展。

?人工智能 ?AI產(chǎn)品 ?開源平臺(tái)
薦AI日報(bào)：Kimi全新音頻基礎(chǔ)模型Kimi-Audio；階躍星辰開源圖像編輯模型Step1X-Edit；?夸克AI超級(jí)框上線 “拍照問夸克”

本期AI日報(bào)聚焦多項(xiàng)AI技術(shù)突破與應(yīng)用：1)Moonshot AI推出開源音頻模型Kimi-Audio，基于13億小時(shí)訓(xùn)練數(shù)據(jù)，支持語音識(shí)別等任務(wù)；2)階躍星辰開源圖像編輯模型Step1X-Edit，展現(xiàn)強(qiáng)大生成能力；3)夸克AI上線"拍照問夸克"功能，實(shí)現(xiàn)視覺問答；4)蘋果iOS18.5將在中國推送，帶來智能功能；5)谷歌發(fā)布601個(gè)生成式AI應(yīng)用案例，覆蓋多行業(yè)；6)微軟推出深度整合Windows的UFO2自動(dòng)化系統(tǒng)；7)OpenAI升級(jí)ChatGPT至GPT-4o版本，提升STEM領(lǐng)域能力；8)Ema公司推出高性價(jià)比語言模型EmaFusion；9)Liquid AI發(fā)布面向邊緣設(shè)備的Hyena Edge模型；10)LemonAI推出實(shí)時(shí)音視頻數(shù)字人產(chǎn)品Slice Live。此外，國內(nèi)方面，智譜與生數(shù)科技達(dá)成戰(zhàn)略合作推動(dòng)大模型發(fā)展，寶馬中國宣布新車將接入DeepSeek技術(shù)。

?AI日報(bào) ?音頻技術(shù) ?開源模型
Trae國內(nèi)版怎么用？Trae IDE 內(nèi)置 MCP 市場配置使用指南

字節(jié)跳動(dòng)旗下Trae+IDE發(fā)布新版本，通過MCP協(xié)議實(shí)現(xiàn)AI智能體與外部工具的深度集成。MCP作為標(biāo)準(zhǔn)化橋梁，讓開發(fā)者能靈活接入Supabase、FireCrawl等第三方服務(wù)，只需@符號(hào)即可調(diào)用智能體完成數(shù)據(jù)庫操作、文檔搜索等復(fù)雜任務(wù)。新版本內(nèi)置MCP市場，支持Token快速配置，并演示了如何通過Figma+AI自動(dòng)生成前端代碼。該技術(shù)可應(yīng)用于Blender建模、K8s管理等多元場景，顯著提升開發(fā)效率。Trae+IDE將持續(xù)擴(kuò)展工具生態(tài)，推動(dòng)AI協(xié)作開發(fā)新時(shí)代。

?字節(jié)跳動(dòng) ?Trae ?IDE
曝iPhone 18 Pro內(nèi)測屏下3D人臉識(shí)別：蘋果邁入單挖孔屏?xí)r代

這意味著iPhone 18 Pro系列正式邁入單挖孔屏?xí)r代，向安卓主流屏幕形態(tài)看齊。需要注意的是，安卓陣營普遍采用單挖孔屏幕指紋識(shí)別方案，而iPhone則是采用屏下3D人臉識(shí)別方案，不支持屏幕指紋。
?上海毅速推出第三代模具3D打印專機(jī)E3系列，引領(lǐng)模具制造技術(shù)革新

導(dǎo)讀：近年來，金屬3D打印技術(shù)在模具制造領(lǐng)域得到了廣泛的應(yīng)用，模具行業(yè)正在迎來一場前所未有的技術(shù)變革，隨著應(yīng)用的逐漸深入，模具專用的金屬3D打印機(jī)應(yīng)運(yùn)而生。2025 年 4 月 15 日，上海毅速激光科技有限公司（以下簡稱“毅速”）正式發(fā)布了其第三代模具3D打印專機(jī)系列——E3- 420 和E3-520。這一新品的推出，標(biāo)志著模具制造行業(yè)向增材制造邁出了重要一步。毅速E3- 420 ?

?金屬3D打印 ?模具制造 ?增材制造
聚首華南，2025下半年增材制造、3D 打印的頂尖展覽與活動(dòng)推薦

2025年全球3D打印行業(yè)將迎來系列盛會(huì)。4月西安論壇成功舉辦后，下半年將迎來深圳Formnext Asia（8月26-28日）、東京論壇（9月25-26日）和法蘭克福Formnext展會(huì)（11月18-21日）三大國際活動(dòng)。這些平臺(tái)將匯聚全球頂尖企業(yè)，展示航空航天、醫(yī)療健康、汽車工業(yè)等領(lǐng)域的最新技術(shù)成果，特別關(guān)注中國企業(yè)的快速成長。法蘭克福展會(huì)預(yù)計(jì)吸引超900家展商，中國展商數(shù)量有望再創(chuàng)新高。系列活動(dòng)將搭建全球產(chǎn)業(yè)交流平臺(tái)，推動(dòng)3D打印技術(shù)創(chuàng)新與商業(yè)應(yīng)用深度融合。

?3D打印 ?增材制造 ?技術(shù)交流
OPPO Find X8 Ultra堪稱電子阿膠：拍照直出氣血感

今日晚間，OPPOFindX8Ultra正式亮相。該機(jī)帶來全新夜神五攝影像系統(tǒng)，包括5000萬超廣角、5000萬1英寸LYT900主攝、5000萬像素3X鏡頭、5000萬像素6X望遠(yuǎn)鏡頭以及丹霞原彩鏡頭，同時(shí)配備OPPO超晶態(tài)藍(lán)玻璃，配合分區(qū)色溫感知技術(shù)和多模態(tài)協(xié)同計(jì)算技術(shù)，一次性解決夜景人像細(xì)節(jié)糊、色彩偏、膚色怪的三大難題。根據(jù)官方實(shí)拍的對比樣張，F(xiàn)indX8Ultra能準(zhǔn)確還原人臉的膚色以及人像背后的環(huán)境，然后分別處理，讓人像看上去更有氣血感”，相比之下，iPhone16ProMax的人像樣張?jiān)朦c(diǎn)較多，膚色質(zhì)感跟OPPO有明顯差距。

?OPPO ?Find ?X8
Trae重磅升級(jí)：全面開放自定義AI能力，用戶可打造個(gè)人專屬“AI 工程師”

Trae新版本通過整合AI技術(shù)，提供更智能、高效的開發(fā)體驗(yàn)，支持多語言文件輸入與多種功能擴(kuò)展。它突破傳統(tǒng)IDE模式，強(qiáng)調(diào)人機(jī)協(xié)作與個(gè)性化定制，實(shí)現(xiàn)需求快速轉(zhuǎn)化和技術(shù)方案優(yōu)化。同時(shí)，其開放的插件系統(tǒng)和自定義能力，滿足不同場景的專業(yè)開發(fā)需求，推動(dòng)AI在編程領(lǐng)域的深度融合與創(chuàng)新應(yīng)用。

?AI技術(shù)發(fā)展 ?編程工具變革 ?個(gè)性化編程

熱文

3 天
7天

1

全網(wǎng)最大的“AI色情網(wǎng)站”MrDeepfakes宣布永久關(guān)閉

1

全網(wǎng)最大的“AI色情網(wǎng)站”MrDeepfakes宣布永久關(guān)閉

站長商機(jī)

廣告

商務(wù)合作侵權(quán)投訴廣告服務(wù) 版權(quán)聲明招聘

?CopyRight 2002-2020 CHINAZ.COM