无码在线播放二区|久久亚洲精品国产精品|无码视频在线观看一区二区|在线观看国产日韩亚洲中

<menu id="yw4o4"></menu>

<menu id="yw4o4"><em id="yw4o4"></em></menu>

Meta AI發(fā)布炸裂項目audio2photoreal 可將音頻生成全身逼真的虛擬人物形象

2024-01-04 17:49 · 稿源：站長之家

站長之家（ChinaZ.com）1月4日消息:Meta AI最近發(fā)布了一項引人注目的技術(shù)，他們成功地開發(fā)出一種能夠從音頻中生成逼真的虛擬人物形象的系統(tǒng)。

這個系統(tǒng)能夠根據(jù)多人對話中的語音生成與對話相對應(yīng)的逼真面部表情、完整身體和手勢動作。這些虛擬人物不僅在視覺上非常逼真，而且能夠準(zhǔn)確地反映出對話中的手勢和表情細節(jié)，例如指點、手腕抖動、聳肩、微笑和嘲笑等。

項目及演示:https://people.eecs.berkeley.edu/~evonne_ng/projects/audio2photoreal/

代碼:https://top.aibase.com/tool/audio2photoreal

Demo:https://colab.research.google.com/drive/1lnX3d-3T3LaO3nlN6R8s6pPvVNAk5mdK

這個系統(tǒng)的工作原理如下:

首先，Meta AI團隊捕獲了一組豐富的雙人對話數(shù)據(jù)集，這些數(shù)據(jù)集能夠提供逼真的重建。然后，他們構(gòu)建了一個復(fù)合運動模型，其中包括面部運動模型、引導(dǎo)姿勢預(yù)測器和身體運動模型。

在生成面部運動時，系統(tǒng)使用預(yù)訓(xùn)練的唇部回歸器處理音頻，提取與面部運動相關(guān)的特征，并利用條件擴散模型生成面部運動。

在生成身體運動時，系統(tǒng)根據(jù)音頻自回歸地輸出每秒1幀的向量量化（VQ）引導(dǎo)姿勢。然后，將音頻和引導(dǎo)姿勢輸入到擴散模型中，以每秒30幀的速度生成高頻身體運動。

最后，生成的面部和身體運動被傳入訓(xùn)練好的虛擬人物渲染器，生成逼真的虛擬人物。

最終展示的結(jié)果是根據(jù)音頻生成的全身逼真虛擬人物，這些虛擬人物能夠表現(xiàn)出對話中的細微表情和手勢動作。

這項技術(shù)的發(fā)布將為虛擬人物的創(chuàng)造和應(yīng)用領(lǐng)域帶來巨大的進步。無論是在游戲開發(fā)、虛擬現(xiàn)實還是電影制作領(lǐng)域，這種能夠從音頻中生成逼真虛擬人物的系統(tǒng)都將發(fā)揮重要作用。

Meta AI的成果再次展示了他們在人工智能領(lǐng)域的卓越能力和創(chuàng)新精神。他們不斷推動著技術(shù)的邊界，為我們帶來了一個全新的虛擬人物生成的時代。我們可以期待在不久的將來，這種技術(shù)將成為我們生活中不可或缺的一部分。

（舉報）

相關(guān)推薦

關(guān)鍵詞：

Meta

薦AI日報：Kimi全新音頻基礎(chǔ)模型Kimi-Audio；階躍星辰開源圖像編輯模型Step1X-Edit；?夸克AI超級框上線 “拍照問夸克”

本期AI日報聚焦多項AI技術(shù)突破與應(yīng)用：1)Moonshot AI推出開源音頻模型Kimi-Audio，基于13億小時訓(xùn)練數(shù)據(jù)，支持語音識別等任務(wù)；2)階躍星辰開源圖像編輯模型Step1X-Edit，展現(xiàn)強大生成能力；3)夸克AI上線"拍照問夸克"功能，實現(xiàn)視覺問答；4)蘋果iOS18.5將在中國推送，帶來智能功能；5)谷歌發(fā)布601個生成式AI應(yīng)用案例，覆蓋多行業(yè)；6)微軟推出深度整合Windows的UFO2自動化系統(tǒng)；7)OpenAI升級ChatGPT至GPT-4o版本，提升STEM領(lǐng)域能力；8)Ema公司推出高性價比語言模型EmaFusion；9)Liquid AI發(fā)布面向邊緣設(shè)備的Hyena Edge模型；10)LemonAI推出實時音視頻數(shù)字人產(chǎn)品Slice Live。此外，國內(nèi)方面，智譜與生數(shù)科技達成戰(zhàn)略合作推動大模型發(fā)展，寶馬中國宣布新車將接入DeepSeek技術(shù)。

?AI日報 ?音頻技術(shù) ?開源模型
Meta重組仍在繼續(xù)，Reality Labs部門裁員超百人

“提高績效管理的標(biāo)準(zhǔn)，讓績效低下的員工盡快下崗”，扎克伯格在此前的備忘錄中如是寫道。同時，還敦促員工要提高積極性……

?meta裁員 ?meta ?RealityLabs
Meta AI眼鏡“實時翻譯”功能全面開放，不聯(lián)網(wǎng)也能用！

用戶下載語言包后，即使沒有聯(lián)網(wǎng)（WiFi 或通信數(shù)據(jù)）也能使用，被認為是“出行好伴侶”。

?人工智能 ?meta ?meta智能眼鏡
似乎，扎克伯格真覺得特朗普能讓 Meta 訴訟“消失”！

大型科技公司的億萬富翁們都認為自己能搭上特朗普

?扎克伯格 ?特朗普 ?meta
“奧迪助手”來了！全新AUDI車型接入豆包大模型

2025年4月24日上海車展期間，上汽奧迪發(fā)布全新A5L Sportback和首款量產(chǎn)車型E5 Sportback。同時推出與火山引擎合作開發(fā)的"奧迪助手"智能交互系統(tǒng)，基于豆包大模型實現(xiàn)自然對話體驗。該系統(tǒng)將搭載于兩款新車，并同步部署在車載端和手機APP端，支持跨設(shè)備對話記錄同步。火山引擎為系統(tǒng)提供大模型技術(shù)支持，實現(xiàn)語音指令控制、車輛功能講解等智能服務(wù)，并整合抖音、汽水音樂等內(nèi)容生態(tài)。上汽奧迪表示，該合作將助力品牌打造更智能、個性化的產(chǎn)品矩陣。

?上海國際車展 ?上汽奧迪 ?奧迪
AI革新了電子商務(wù)營銷：認識AID Lab的PhotoG

在當(dāng)今快速發(fā)展的消費格局中，全球生活方式市場前所未有地蓬勃發(fā)展。在Z時代重視個性化體驗的消費者的推動下，從家居裝飾到日常必需品的行業(yè)正在經(jīng)歷前所未有的繁榮。通過提高創(chuàng)意效率和實現(xiàn)卓越的消費者體驗，PhotoG有望重新定義技術(shù)、設(shè)計和商業(yè)之間的交叉點。

?消費格局 ?生活方式市場 ?個性化體驗
Meta被指“非法壟斷”，若敗訴，將被迫失去“50%收入”！

如果 Meta 敗訴，它將被迫出售占其廣告收入一半的 Instagram 和全球使用最廣泛的即時通訊應(yīng)用 WhatsApp。

?meta ?扎克伯格 ?Instagram
薦OpenAI沒說的秘密，Meta全揭了？華人一作GPT-4o同款技術(shù)，爆打擴散王者

Meta、西北大學(xué)和新加坡國立大學(xué)的研究團隊提出TokenShuffle技術(shù)，顯著提升了自回歸模型生成高分辨率圖像的能力。該技術(shù)通過局部窗口內(nèi)的token合并與解構(gòu)操作，將視覺token數(shù)量減少為平方分之一，首次實現(xiàn)2048×2048分辨率圖像生成?；?7億參數(shù)的Llama模型，TokenShuffle在GenAI基準(zhǔn)測試中獲得0.77綜合得分，超越同類自回歸模型0.18分，在人類評估中展現(xiàn)出更好的文本對齊和視覺質(zhì)量。該方法無需修改Transformer架構(gòu)，通過三階段訓(xùn)練策略（512→1024→2048分辨率）逐步提升生成能力，為多模態(tài)大語言模型的高效高保真圖像生成開辟了新路徑。

?自回歸模型 ?高分辨率圖像 ?多模態(tài)大語言模型
蘋果追趕Meta:庫克押注智能眼鏡搶占AR市場

蘋果公司正在開發(fā)一款配備攝像頭和麥克風(fēng)的智能眼鏡，作為實現(xiàn)真正AR眼鏡夢想前的過渡產(chǎn)品，據(jù)彭博社記者馬克·古爾曼報道。這一舉措顯示了CEO蒂姆·庫克對AR技術(shù)的堅定承諾。隨著Meta在智能眼鏡領(lǐng)域取得的成功，蘋果很可能會在實現(xiàn)完整AR眼鏡愿景之前推出某種形式的智能眼鏡產(chǎn)品，以保持在可穿戴設(shè)備市場的競爭力。
庫克押注AR！蘋果的終極目標(biāo)是打造AR眼鏡：超越Meta

快科技4月15日消息，去年上市的蘋果Vision Pro因售價高昂、機身過重等問題并沒有引起太大反響。知名蘋果記者Mark Gurman表示，Vision Pro不是蘋果的終極目標(biāo)設(shè)備，蘋果CEO庫克正全力推動增強現(xiàn)實AR眼鏡的研發(fā)，誓要超越對手Meta。據(jù)悉，庫克十年來一直懷揣著打造真正AR眼鏡的宏大構(gòu)想，能讓用戶全天佩戴，輕巧便攜，還能提供類似visionOS的視覺體驗。為此，蘋果還會持續(xù)對Vision Pr

?蘋果 ?增強現(xiàn)實 ?AR眼鏡

熱文

3 天
7天

站長商機

廣告

商務(wù)合作侵權(quán)投訴廣告服務(wù) 版權(quán)聲明招聘

?CopyRight 2002-2020 CHINAZ.COM

<rt id="rknxr"><del id="rknxr"><p id="rknxr"></p></del></rt>

<label id="rknxr"><th id="rknxr"></th></label>