无码在线播放二区|久久亚洲精品国产精品|无码视频在线观看一区二区|在线观看国产日韩亚洲中

<menu id="yw4o4"></menu>

<menu id="yw4o4"><em id="yw4o4"></em></menu>

<track id="ezdc5"><ruby id="ezdc5"></ruby></track>

面部圖像修復(fù)突破性AI方法Dual-Pivot Tuning 實(shí)現(xiàn)人臉模糊變高清

2024-01-04 09:44 · 稿源：站長(zhǎng)之家

**劃重點(diǎn):**
1. ?? 圖像修復(fù)是一個(gè)復(fù)雜的挑戰(zhàn)，研究人員提出了名為“Dual-Pivot Tuning”的個(gè)性化圖像修復(fù)方法。
2. ?? 該方法使用有限的高質(zhì)量個(gè)體圖像集，以保持圖像對(duì)個(gè)體身份的高保真性。
3. ?? 實(shí)驗(yàn)證明，“Dual-Pivot Tuning”技術(shù)在盲目和少數(shù)樣本的個(gè)性化面部圖像修復(fù)方面優(yōu)于其他最先進(jìn)的方法。

站長(zhǎng)之家（ChinaZ.com）1月4日消息:圖像修復(fù)一直是一個(gè)備受研究者關(guān)注的復(fù)雜挑戰(zhàn)，其主要目標(biāo)是在維持降質(zhì)輸入的感知質(zhì)量的同時(shí)，創(chuàng)建視覺(jué)上吸引人且自然的圖像。在沒(méi)有有關(guān)主題或降質(zhì)的信息的情況下（盲目恢復(fù)），了解自然圖像范圍至關(guān)重要。為了恢復(fù)面部圖像，必須在確保輸出保留個(gè)體獨(dú)特面部特征之前包含身份信息。以往的研究已經(jīng)探討了使用基于參考的面部圖像恢復(fù)的方法來(lái)解決這一要求。然而，將個(gè)性化整合到基于擴(kuò)散的盲目恢復(fù)系統(tǒng)仍然是一個(gè)持久性的挑戰(zhàn)。

加利福尼亞大學(xué)洛杉磯分校和Snap Inc.的研究團(tuán)隊(duì)開發(fā)了一種名為“Dual-Pivot Tuning”的個(gè)性化圖像恢復(fù)方法。雙軸調(diào)整是一種用于在盲目圖像恢復(fù)背景下定制文本到圖像的先驗(yàn)的方法。該過(guò)程涉及使用個(gè)體的一組有限數(shù)量的高質(zhì)量圖像來(lái)增強(qiáng)其其他降質(zhì)圖像的恢復(fù)。其主要目標(biāo)是確保恢復(fù)的圖像對(duì)個(gè)體的身份和降質(zhì)輸入圖像具有高保真度，同時(shí)保持自然外觀。

研究討論了基于擴(kuò)散的盲目恢復(fù)方法，當(dāng)應(yīng)用于降級(jí)的面部圖像時(shí)，可能無(wú)法有效保留個(gè)體的獨(dú)特身份。研究人員強(qiáng)調(diào)了以前在基于參考的面部圖像恢復(fù)方面的努力，引用了各種方法，如GFRNet、GWAINet、ASFFNet、Wang等，DMDNet和MyStyle。這些方法利用單個(gè)或多個(gè)參考圖像來(lái)實(shí)現(xiàn)個(gè)性化恢復(fù)，確保對(duì)降級(jí)圖像中個(gè)體獨(dú)特特征的更好保真度。與以往方法不同，提出的技術(shù)使用基于擴(kuò)散的個(gè)性化生成先驗(yàn)，而其他方法使用前饋架構(gòu)或基于GAN的先驗(yàn)。

研究概述了為圖像恢復(fù)個(gè)性化引導(dǎo)擴(kuò)散模型的方法。Dual-Pivot Tuning技術(shù)包括兩個(gè)步驟:基于文本的微調(diào)，將身份特定信息嵌入擴(kuò)散先驗(yàn)中，以及模型中心的樞軸，將引導(dǎo)圖像編碼器與個(gè)性化先驗(yàn)協(xié)調(diào)一致。文本到圖像擴(kuò)散模型的個(gè)性化運(yùn)算符被定義為通過(guò)樞軸微調(diào)模型以創(chuàng)建定制版本。該技術(shù)包括上下文文本樞軸，注入身份信息，然后是基于模型的樞軸，利用通用恢復(fù)在實(shí)現(xiàn)高保真度恢復(fù)的圖像之前。

提出的Dual-Pivot Tuning技術(shù)通過(guò)個(gè)性化恢復(fù)在恢復(fù)圖像中實(shí)現(xiàn)了高身份保真度和自然外觀。定性比較表明，基于擴(kuò)散的盲目恢復(fù)方法可能無(wú)法保留個(gè)體的身份，而提出的技術(shù)在保持高身份保真度的同時(shí)，沒(méi)有可感知的對(duì)降質(zhì)輸入的保真度損失。使用PSNR、SSIM和ArcFace相似性等指標(biāo)的定量評(píng)估表明，所提方法在恢復(fù)圖像方面對(duì)個(gè)體身份的高保真度非常有效。

通過(guò)Dual-Pivot Tuning實(shí)現(xiàn)的個(gè)性化恢復(fù)技術(shù)在恢復(fù)圖像中實(shí)現(xiàn)了高身份保真度和自然外觀。實(shí)驗(yàn)證明，與盲目和少數(shù)樣本的面部圖像恢復(fù)的各種最先進(jìn)替代方法相比，定制模型在個(gè)體身份方面表現(xiàn)更好，并且在一般圖像質(zhì)量方面優(yōu)于通用先驗(yàn)。該方法對(duì)不同類型的降解是不可知的，并在保持身份的同時(shí)提供一致的恢復(fù)。

項(xiàng)目體驗(yàn)網(wǎng)址：https://top.aibase.com/tool/personalized-restoration-via-dual-pivot-tuning

論文網(wǎng)址：https://arxiv.org/abs/2312.17234

（舉報(bào)）

相關(guān)推薦

關(guān)鍵詞：

薦AI日?qǐng)?bào)：ChatGPT重磅上線圖像庫(kù)功能；白嫖！Veo2登陸谷歌AI Studio；螞蟻百寶箱推“MCP專區(qū)”

歡迎來(lái)到【AI日?qǐng)?bào)】欄目!這里是你每天探索人工智能世界的指南，每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容，聚焦開發(fā)者，助你洞悉技術(shù)趨勢(shì)、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點(diǎn)擊了解:https://top.aibase.com/1、報(bào)道稱字節(jié)跳動(dòng)整合 AI 研發(fā)團(tuán)隊(duì)，AI Lab 即將并入 Seed字節(jié)跳動(dòng)正在進(jìn)行AI研發(fā)團(tuán)隊(duì)的整合，將獨(dú)立的字節(jié)AI Lab并入Seed團(tuán)隊(duì)。這一舉措體現(xiàn)了字節(jié)在AI領(lǐng)域戰(zhàn)略布局的調(diào)整，旨在進(jìn)?

?字節(jié)跳動(dòng) ?AI研發(fā) ?AI
薦UniToken：多模態(tài)AI的“全能選手”，一次編碼搞定圖文理解與圖像生成

復(fù)旦大學(xué)與美團(tuán)研究者提出UniToken框架，首次在統(tǒng)一模型中實(shí)現(xiàn)圖文理解與生成任務(wù)的"雙優(yōu)表現(xiàn)"。該方案融合連續(xù)和離散視覺(jué)編碼，有效解決了傳統(tǒng)多模態(tài)建模中的"任務(wù)干擾"和"表示割裂"問(wèn)題。通過(guò)三階段訓(xùn)練策略（視覺(jué)語(yǔ)義對(duì)齊、多任務(wù)聯(lián)合訓(xùn)練、指令強(qiáng)化微調(diào)），UniToken在多個(gè)基準(zhǔn)測(cè)試中性能超越專用模型。其創(chuàng)新性體現(xiàn)在：1）統(tǒng)一的雙邊視覺(jué)編碼

?UniToken ?多模態(tài)建模 ?視覺(jué)編碼
AI日?qǐng)?bào)： OpenAI推出gpt-image-1圖像生成API;納米AI發(fā)布MCP萬(wàn)能工具箱;中國(guó)占全球AI專利60%

【AI日?qǐng)?bào)】欄目聚焦人工智能領(lǐng)域最新動(dòng)態(tài)：1) OpenAI推出ChatGPT圖像生成API，開發(fā)者可輕松集成AI繪圖功能，已生成超7億張圖片；2) 谷歌Gemini月活用戶突破3.5億，但仍落后于ChatGPT的6億用戶；3) OpenAI預(yù)測(cè)2029年收入將達(dá)1250億美元，AI代理業(yè)務(wù)成主要增長(zhǎng)點(diǎn)；4) Ostris發(fā)布8B參數(shù)擴(kuò)散模型Flex.2-preview，優(yōu)化ComfyUI工作流；5) 英偉達(dá)推出多模態(tài)LLM模型Describe Anything，支持指定區(qū)域生成詳細(xì)描?

?OpenAI ?ChatGPT ?圖像生成
微美全息（WIMI.US）探索量子圖像壓縮算法，引領(lǐng)圖像處理領(lǐng)域顛覆性創(chuàng)新

量子計(jì)算作為信息技術(shù)領(lǐng)域的顛覆性力量，其在量子圖像處理和圖像壓縮領(lǐng)域也顯示出巨大的技術(shù)潛力。隨著數(shù)字圖像處理技術(shù)的不斷演進(jìn)，傳統(tǒng)圖像處理算法，本質(zhì)上依賴于并行計(jì)算，然，隨著圖像數(shù)量和分辨率的快速增長(zhǎng)，這些經(jīng)典算法在計(jì)算資源和時(shí)間消耗上存在局限性。量子圖像壓縮技術(shù)的深入研究也將促進(jìn)量子算法和量子信息處理理論的進(jìn)一步發(fā)展，為量子信息技術(shù)的廣泛應(yīng)用奠定堅(jiān)實(shí)基礎(chǔ)，推動(dòng)數(shù)字圖像處理技術(shù)邁向新的高度，實(shí)現(xiàn)更高效、更智能的圖像處理和壓縮。

?量子計(jì)算 ?圖像處理 ?圖像壓縮
ChatGPT上線圖庫(kù)功能：可管理AI生成圖片

快科技4月16日消息，據(jù)報(bào)道，OpenAI近日宣布將為ChatGPT推出全新的Image Library圖庫(kù)功能，該功能將幫助用戶更高效地管理和查看AI生成的圖像。這項(xiàng)創(chuàng)新功能將逐步向所有用戶開放，包括移動(dòng)端和網(wǎng)頁(yè)端的免費(fèi)版、Plus版及Pro版用戶。新功能的設(shè)計(jì)充分考慮了用戶體驗(yàn)的便捷性。用戶只需點(diǎn)擊ChatGPT側(cè)邊欄的Library入口，就能進(jìn)入一個(gè)直觀的圖像網(wǎng)格界面。在這個(gè)界面中，用戶可以輕?

?OpenAI ?ChatGPT ?Image
薦AI日?qǐng)?bào)：Kimi全新音頻基礎(chǔ)模型Kimi-Audio；階躍星辰開源圖像編輯模型Step1X-Edit；?夸克AI超級(jí)框上線 “拍照問(wèn)夸克”

本期AI日?qǐng)?bào)聚焦多項(xiàng)AI技術(shù)突破與應(yīng)用：1)Moonshot AI推出開源音頻模型Kimi-Audio，基于13億小時(shí)訓(xùn)練數(shù)據(jù)，支持語(yǔ)音識(shí)別等任務(wù)；2)階躍星辰開源圖像編輯模型Step1X-Edit，展現(xiàn)強(qiáng)大生成能力；3)夸克AI上線"拍照問(wèn)夸克"功能，實(shí)現(xiàn)視覺(jué)問(wèn)答；4)蘋果iOS18.5將在中國(guó)推送，帶來(lái)智能功能；5)谷歌發(fā)布601個(gè)生成式AI應(yīng)用案例，覆蓋多行業(yè)；6)微軟推出深度整合Windows的UFO2自動(dòng)化系統(tǒng)；7)OpenAI升級(jí)ChatGPT至GPT-4o版本，提升STEM領(lǐng)域能力；8)Ema公司推出高性價(jià)比語(yǔ)言模型EmaFusion；9)Liquid AI發(fā)布面向邊緣設(shè)備的Hyena Edge模型；10)LemonAI推出實(shí)時(shí)音視頻數(shù)字人產(chǎn)品Slice Live。此外，國(guó)內(nèi)方面，智譜與生數(shù)科技達(dá)成戰(zhàn)略合作推動(dòng)大模型發(fā)展，寶馬中國(guó)宣布新車將接入DeepSeek技術(shù)。

?AI日?qǐng)?bào) ?音頻技術(shù) ?開源模型
薛志強(qiáng)博士深度解讀塑妍萃優(yōu)勢(shì)，中面部抗衰迎來(lái)新突破

2025年4月15日，全球?qū)I(yè)皮膚學(xué)公司高德美宣布旗下聚左旋乳酸填充劑塑顏緹在中國(guó)全面上市。該產(chǎn)品具有25年安全使用驗(yàn)證，已在全球60個(gè)國(guó)家獲批，擁有同類產(chǎn)品中最多的臨床研究文獻(xiàn)和最長(zhǎng)的安全使用記錄。北京俊泰醫(yī)療總院長(zhǎng)薛志強(qiáng)博士作為塑顏緹首發(fā)導(dǎo)師級(jí)機(jī)構(gòu)代表出席盛會(huì)，分享醫(yī)美再生材料的前沿應(yīng)用與臨床經(jīng)驗(yàn)。數(shù)據(jù)顯示中國(guó)醫(yī)美市場(chǎng)抗衰需求持續(xù)攀升，30-55歲女性中超90%關(guān)注顏值管理。塑顏緹獨(dú)有的PLLA-SCA微粒能刺激膠原蛋白生成，實(shí)現(xiàn)緊致提升、容量恢復(fù)與膚質(zhì)改善三重功效。薛博士指出，該產(chǎn)品是再生領(lǐng)域唯一獲美國(guó)FDA批準(zhǔn)的材料，其精準(zhǔn)注射技術(shù)可最大化發(fā)揮產(chǎn)品優(yōu)勢(shì)，為中國(guó)求美者提供更安全長(zhǎng)效的抗衰解決方案。

?高德美 ?塑妍萃 ?醫(yī)美抗衰
薦挑戰(zhàn)GPT-4o！AI文生圖驚現(xiàn)黑馬，國(guó)產(chǎn)團(tuán)隊(duì)HiDream如何逆襲？

HiDream是一款由國(guó)內(nèi)團(tuán)隊(duì)開發(fā)的AI模型，擅長(zhǎng)生成復(fù)雜的圖片與多種風(fēng)格的藝術(shù)作品。它在多個(gè)測(cè)試中表現(xiàn)出對(duì)細(xì)節(jié)、材質(zhì)、光影控制以及創(chuàng)意概念的良好理解，尤其在人物動(dòng)態(tài)、精細(xì)繪畫等方面效果顯著。HiDream支持輸出4K高清圖片，并兼容多種應(yīng)用領(lǐng)域，包括商業(yè)用途。盡管在某些特定要求下還需提升表現(xiàn)，但其潛力和實(shí)際效果已受到關(guān)注。

?AI技術(shù) ?文生圖 ?開源模型
GPTBots 集成阿里通義千問(wèn) 3.0，持續(xù)為企業(yè)提供頂尖 AI 服務(wù)

GPTBots.ai平臺(tái)宣布完成與阿里通義千問(wèn)3.0系列模型的技術(shù)集成，成為企業(yè)級(jí)AI智能體構(gòu)建領(lǐng)域的標(biāo)桿平臺(tái)。該平臺(tái)通過(guò)混合推理架構(gòu)和多語(yǔ)言交互技術(shù)，支持119種語(yǔ)言服務(wù)，覆蓋全球主要市場(chǎng)。平臺(tái)提供雙模式智能任務(wù)處理：針對(duì)復(fù)雜業(yè)務(wù)場(chǎng)景的"深度思考"模式，以及高頻咨詢的"即時(shí)響應(yīng)"模式。搭載Qwen-3-235B旗艦?zāi)Ｐ秃蚎wen-3-30B輕量版，在代碼生成、數(shù)學(xué)推理等核心能力上達(dá)到行業(yè)頂尖水平。平臺(tái)實(shí)現(xiàn)與企業(yè)ERP、CRM等系統(tǒng)的無(wú)縫對(duì)接，推動(dòng)數(shù)據(jù)價(jià)值變現(xiàn)。通過(guò)標(biāo)準(zhǔn)化流程自動(dòng)化、全球化服務(wù)等核心價(jià)值，幫助企業(yè)提升運(yùn)營(yíng)效率70%、降低客服成本70%，并實(shí)現(xiàn)數(shù)據(jù)驅(qū)動(dòng)的決策升級(jí)。

?GPTBots ?阿里通義千問(wèn) ?AI服務(wù)
AI日?qǐng)?bào)：阿里騰訊全面支持MCP協(xié)議；階躍星辰多模態(tài)推理模型Step-R1-V-Mini；美圖WHEE圖像生成模型Miracle F1

歡迎來(lái)到【AI日?qǐng)?bào)】欄目!這里是你每天探索人工智能世界的指南，每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容，聚焦開發(fā)者，助你洞悉技術(shù)趨勢(shì)、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點(diǎn)擊了解:https://top.aibase.com/1、阿里巴巴已宣布全面支持MCP協(xié)議騰訊緊隨其后近日，中國(guó)人工智能領(lǐng)域迎來(lái)技術(shù)標(biāo)準(zhǔn)的變革，ModelContextProtocol成為國(guó)內(nèi)AI生態(tài)的事實(shí)標(biāo)準(zhǔn)。12.英偉達(dá)發(fā)布Llama3.1NemotronUltra253B，性能?

?人工智能 ?MCP協(xié)議 ?阿里巴巴

熱文

3 天
7天

站長(zhǎng)商機(jī)

廣告

商務(wù)合作侵權(quán)投訴廣告服務(wù) 版權(quán)聲明招聘

?CopyRight 2002-2020 CHINAZ.COM

<dfn id="khzn9"></dfn>

<tt id="khzn9"></tt>

<fieldset id="khzn9"><i id="khzn9"></i></fieldset>

<fieldset id="khzn9"></fieldset>