无码在线播放二区|久久亚洲精品国产精品|无码视频在线观看一区二区|在线观看国产日韩亚洲中

  • <menu id="yw4o4"></menu>
  • 
    <menu id="yw4o4"><em id="yw4o4"></em></menu>
  • 首頁(yè) > 業(yè)界 > 關(guān)鍵詞  > Dual-Pivot最新資訊  > 正文

    面部圖像修復(fù)突破性AI方法Dual-Pivot Tuning 實(shí)現(xiàn)人臉模糊變高清

    2024-01-04 09:44 · 稿源:站長(zhǎng)之家

    **劃重點(diǎn):**

    1. ?? 圖像修復(fù)是一個(gè)復(fù)雜的挑戰(zhàn),研究人員提出了名為“Dual-Pivot Tuning”的個(gè)性化圖像修復(fù)方法。

    2. ?? 該方法使用有限的高質(zhì)量個(gè)體圖像集,以保持圖像對(duì)個(gè)體身份的高保真性。

    3. ?? 實(shí)驗(yàn)證明,“Dual-Pivot Tuning”技術(shù)在盲目和少數(shù)樣本的個(gè)性化面部圖像修復(fù)方面優(yōu)于其他最先進(jìn)的方法。

    站長(zhǎng)之家(ChinaZ.com)1月4日 消息:圖像修復(fù)一直是一個(gè)備受研究者關(guān)注的復(fù)雜挑戰(zhàn),其主要目標(biāo)是在維持降質(zhì)輸入的感知質(zhì)量的同時(shí),創(chuàng)建視覺(jué)上吸引人且自然的圖像。在沒(méi)有有關(guān)主題或降質(zhì)的信息的情況下(盲目恢復(fù)),了解自然圖像范圍至關(guān)重要。為了恢復(fù)面部圖像,必須在確保輸出保留個(gè)體獨(dú)特面部特征之前包含身份信息。以往的研究已經(jīng)探討了使用基于參考的面部圖像恢復(fù)的方法來(lái)解決這一要求。然而,將個(gè)性化整合到基于擴(kuò)散的盲目恢復(fù)系統(tǒng)仍然是一個(gè)持久性的挑戰(zhàn)。

    image.png

    加利福尼亞大學(xué)洛杉磯分校和Snap Inc.的研究團(tuán)隊(duì)開發(fā)了一種名為“Dual-Pivot Tuning”的個(gè)性化圖像恢復(fù)方法。雙軸調(diào)整是一種用于在盲目圖像恢復(fù)背景下定制文本到圖像的先驗(yàn)的方法。該過(guò)程涉及使用個(gè)體的一組有限數(shù)量的高質(zhì)量圖像來(lái)增強(qiáng)其其他降質(zhì)圖像的恢復(fù)。其主要目標(biāo)是確保恢復(fù)的圖像對(duì)個(gè)體的身份和降質(zhì)輸入圖像具有高保真度,同時(shí)保持自然外觀。

    研究討論了基于擴(kuò)散的盲目恢復(fù)方法,當(dāng)應(yīng)用于降級(jí)的面部圖像時(shí),可能無(wú)法有效保留個(gè)體的獨(dú)特身份。研究人員強(qiáng)調(diào)了以前在基于參考的面部圖像恢復(fù)方面的努力,引用了各種方法,如GFRNet、GWAINet、ASFFNet、Wang等,DMDNet和MyStyle。這些方法利用單個(gè)或多個(gè)參考圖像來(lái)實(shí)現(xiàn)個(gè)性化恢復(fù),確保對(duì)降級(jí)圖像中個(gè)體獨(dú)特特征的更好保真度。與以往方法不同,提出的技術(shù)使用基于擴(kuò)散的個(gè)性化生成先驗(yàn),而其他方法使用前饋架構(gòu)或基于GAN的先驗(yàn)。

    image.png

    研究概述了為圖像恢復(fù)個(gè)性化引導(dǎo)擴(kuò)散模型的方法。Dual-Pivot Tuning技術(shù)包括兩個(gè)步驟:基于文本的微調(diào),將身份特定信息嵌入擴(kuò)散先驗(yàn)中,以及模型中心的樞軸,將引導(dǎo)圖像編碼器與個(gè)性化先驗(yàn)協(xié)調(diào)一致。文本到圖像擴(kuò)散模型的個(gè)性化運(yùn)算符被定義為通過(guò)樞軸微調(diào)模型以創(chuàng)建定制版本。該技術(shù)包括上下文文本樞軸,注入身份信息,然后是基于模型的樞軸,利用通用恢復(fù)在實(shí)現(xiàn)高保真度恢復(fù)的圖像之前。

    提出的Dual-Pivot Tuning技術(shù)通過(guò)個(gè)性化恢復(fù)在恢復(fù)圖像中實(shí)現(xiàn)了高身份保真度和自然外觀。定性比較表明,基于擴(kuò)散的盲目恢復(fù)方法可能無(wú)法保留個(gè)體的身份,而提出的技術(shù)在保持高身份保真度的同時(shí),沒(méi)有可感知的對(duì)降質(zhì)輸入的保真度損失。使用PSNR、SSIM和ArcFace相似性等指標(biāo)的定量評(píng)估表明,所提方法在恢復(fù)圖像方面對(duì)個(gè)體身份的高保真度非常有效。

    通過(guò)Dual-Pivot Tuning實(shí)現(xiàn)的個(gè)性化恢復(fù)技術(shù)在恢復(fù)圖像中實(shí)現(xiàn)了高身份保真度和自然外觀。實(shí)驗(yàn)證明,與盲目和少數(shù)樣本的面部圖像恢復(fù)的各種最先進(jìn)替代方法相比,定制模型在個(gè)體身份方面表現(xiàn)更好,并且在一般圖像質(zhì)量方面優(yōu)于通用先驗(yàn)。該方法對(duì)不同類型的降解是不可知的,并在保持身份的同時(shí)提供一致的恢復(fù)。

    項(xiàng)目體驗(yàn)網(wǎng)址:https://top.aibase.com/tool/personalized-restoration-via-dual-pivot-tuning

    論文網(wǎng)址:https://arxiv.org/abs/2312.17234

    舉報(bào)

    • 相關(guān)推薦
    • AI日?qǐng)?bào):ChatGPT重磅上線圖像庫(kù)功能;白嫖!Veo2登陸谷歌AI Studio;螞蟻百寶箱推“MCP專區(qū)”

      歡迎來(lái)到【AI日?qǐng)?bào)】欄目!這里是你每天探索人工智能世界的指南,每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容,聚焦開發(fā)者,助你洞悉技術(shù)趨勢(shì)、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點(diǎn)擊了解:https://top.aibase.com/1、報(bào)道稱字節(jié)跳動(dòng)整合 AI 研發(fā)團(tuán)隊(duì),AI Lab 即將并入 Seed字節(jié)跳動(dòng)正在進(jìn)行AI研發(fā)團(tuán)隊(duì)的整合,將獨(dú)立的字節(jié)AI Lab并入Seed團(tuán)隊(duì)。這一舉措體現(xiàn)了字節(jié)在AI領(lǐng)域戰(zhàn)略布局的調(diào)整,旨在進(jìn)?

    • UniToken:多模態(tài)AI的“全能選手”,一次編碼搞定文理解與圖像生成

      復(fù)旦大學(xué)與美團(tuán)研究者提出UniToken框架,首次在統(tǒng)一模型中實(shí)現(xiàn)圖文理解與生成任務(wù)的"雙優(yōu)表現(xiàn)"。該方案融合連續(xù)和離散視覺(jué)編碼,有效解決了傳統(tǒng)多模態(tài)建模中的"任務(wù)干擾"和"表示割裂"問(wèn)題。通過(guò)三階段訓(xùn)練策略(視覺(jué)語(yǔ)義對(duì)齊、多任務(wù)聯(lián)合訓(xùn)練、指令強(qiáng)化微調(diào)),UniToken在多個(gè)基準(zhǔn)測(cè)試中性能超越專用模型。其創(chuàng)新性體現(xiàn)在:1)統(tǒng)一的雙邊視覺(jué)編碼

    • AI日?qǐng)?bào): OpenAI推出gpt-image-1圖像生成API;納米AI發(fā)布MCP萬(wàn)能工具箱;中國(guó)占全球AI專利60%

      【AI日?qǐng)?bào)】欄目聚焦人工智能領(lǐng)域最新動(dòng)態(tài):1) OpenAI推出ChatGPT圖像生成API,開發(fā)者可輕松集成AI繪圖功能,已生成超7億張圖片;2) 谷歌Gemini月活用戶突破3.5億,但仍落后于ChatGPT的6億用戶;3) OpenAI預(yù)測(cè)2029年收入將達(dá)1250億美元,AI代理業(yè)務(wù)成主要增長(zhǎng)點(diǎn);4) Ostris發(fā)布8B參數(shù)擴(kuò)散模型Flex.2-preview,優(yōu)化ComfyUI工作流;5) 英偉達(dá)推出多模態(tài)LLM模型Describe Anything,支持指定區(qū)域生成詳細(xì)描?

    • 微美全息(WIMI.US)探索量子圖像壓縮算法,引領(lǐng)圖像處理領(lǐng)域顛覆創(chuàng)新

      量子計(jì)算作為信息技術(shù)領(lǐng)域的顛覆性力量,其在量子圖像處理和圖像壓縮領(lǐng)域也顯示出巨大的技術(shù)潛力。隨著數(shù)字圖像處理技術(shù)的不斷演進(jìn),傳統(tǒng)圖像處理算法,本質(zhì)上依賴于并行計(jì)算,然,隨著圖像數(shù)量和分辨率的快速增長(zhǎng),這些經(jīng)典算法在計(jì)算資源和時(shí)間消耗上存在局限性。量子圖像壓縮技術(shù)的深入研究也將促進(jìn)量子算法和量子信息處理理論的進(jìn)一步發(fā)展,為量子信息技術(shù)的廣泛應(yīng)用奠定堅(jiān)實(shí)基礎(chǔ),推動(dòng)數(shù)字圖像處理技術(shù)邁向新的高度,實(shí)現(xiàn)更高效、更智能的圖像處理和壓縮。

    • ChatGPT上線庫(kù)功能:可管理AI生成圖

      快科技4月16日消息,據(jù)報(bào)道,OpenAI近日宣布將為ChatGPT推出全新的Image Library圖庫(kù)功能,該功能將幫助用戶更高效地管理和查看AI生成的圖像。這項(xiàng)創(chuàng)新功能將逐步向所有用戶開放,包括移動(dòng)端和網(wǎng)頁(yè)端的免費(fèi)版、Plus版及Pro版用戶。新功能的設(shè)計(jì)充分考慮了用戶體驗(yàn)的便捷性。用戶只需點(diǎn)擊ChatGPT側(cè)邊欄的Library入口,就能進(jìn)入一個(gè)直觀的圖像網(wǎng)格界面。在這個(gè)界面中,用戶可以輕?

    • AI日?qǐng)?bào):Kimi全新音頻基礎(chǔ)模型Kimi-Audio;階躍星辰開源圖像編輯模型Step1X-Edit;?夸克AI超級(jí)框上線 “拍照問(wèn)夸克”

      本期AI日?qǐng)?bào)聚焦多項(xiàng)AI技術(shù)突破與應(yīng)用:1)Moonshot AI推出開源音頻模型Kimi-Audio,基于13億小時(shí)訓(xùn)練數(shù)據(jù),支持語(yǔ)音識(shí)別等任務(wù);2)階躍星辰開源圖像編輯模型Step1X-Edit,展現(xiàn)強(qiáng)大生成能力;3)夸克AI上線"拍照問(wèn)夸克"功能,實(shí)現(xiàn)視覺(jué)問(wèn)答;4)蘋果iOS18.5將在中國(guó)推送,帶來(lái)智能功能;5)谷歌發(fā)布601個(gè)生成式AI應(yīng)用案例,覆蓋多行業(yè);6)微軟推出深度整合Windows的UFO2自動(dòng)化系統(tǒng);7)OpenAI升級(jí)ChatGPT至GPT-4o版本,提升STEM領(lǐng)域能力;8)Ema公司推出高性價(jià)比語(yǔ)言模型EmaFusion;9)Liquid AI發(fā)布面向邊緣設(shè)備的Hyena Edge模型;10)LemonAI推出實(shí)時(shí)音視頻數(shù)字人產(chǎn)品Slice Live。此外,國(guó)內(nèi)方面,智譜與生數(shù)科技達(dá)成戰(zhàn)略合作推動(dòng)大模型發(fā)展,寶馬中國(guó)宣布新車將接入DeepSeek技術(shù)。

    • 薛志強(qiáng)博士深度解讀塑妍萃優(yōu)勢(shì),中面部抗衰迎來(lái)新突破

      2025年4月15日,全球?qū)I(yè)皮膚學(xué)公司高德美宣布旗下聚左旋乳酸填充劑塑顏緹在中國(guó)全面上市。該產(chǎn)品具有25年安全使用驗(yàn)證,已在全球60個(gè)國(guó)家獲批,擁有同類產(chǎn)品中最多的臨床研究文獻(xiàn)和最長(zhǎng)的安全使用記錄。北京俊泰醫(yī)療總院長(zhǎng)薛志強(qiáng)博士作為塑顏緹首發(fā)導(dǎo)師級(jí)機(jī)構(gòu)代表出席盛會(huì),分享醫(yī)美再生材料的前沿應(yīng)用與臨床經(jīng)驗(yàn)。數(shù)據(jù)顯示中國(guó)醫(yī)美市場(chǎng)抗衰需求持續(xù)攀升,30-55歲女性中超90%關(guān)注顏值管理。塑顏緹獨(dú)有的PLLA-SCA微粒能刺激膠原蛋白生成,實(shí)現(xiàn)緊致提升、容量恢復(fù)與膚質(zhì)改善三重功效。薛博士指出,該產(chǎn)品是再生領(lǐng)域唯一獲美國(guó)FDA批準(zhǔn)的材料,其精準(zhǔn)注射技術(shù)可最大化發(fā)揮產(chǎn)品優(yōu)勢(shì),為中國(guó)求美者提供更安全長(zhǎng)效的抗衰解決方案。

    • 挑戰(zhàn)GPT-4o!AI文生圖驚現(xiàn)黑馬,國(guó)產(chǎn)團(tuán)隊(duì)HiDream如何逆襲?

      HiDream是一款由國(guó)內(nèi)團(tuán)隊(duì)開發(fā)的AI模型,擅長(zhǎng)生成復(fù)雜的圖片與多種風(fēng)格的藝術(shù)作品。它在多個(gè)測(cè)試中表現(xiàn)出對(duì)細(xì)節(jié)、材質(zhì)、光影控制以及創(chuàng)意概念的良好理解,尤其在人物動(dòng)態(tài)、精細(xì)繪畫等方面效果顯著。HiDream支持輸出4K高清圖片,并兼容多種應(yīng)用領(lǐng)域,包括商業(yè)用途。盡管在某些特定要求下還需提升表現(xiàn),但其潛力和實(shí)際效果已受到關(guān)注。

    • GPTBots 集成阿里通義千問(wèn) 3.0,持續(xù)為企業(yè)提供頂尖 AI 服務(wù)

      GPTBots.ai平臺(tái)宣布完成與阿里通義千問(wèn)3.0系列模型的技術(shù)集成,成為企業(yè)級(jí)AI智能體構(gòu)建領(lǐng)域的標(biāo)桿平臺(tái)。該平臺(tái)通過(guò)混合推理架構(gòu)和多語(yǔ)言交互技術(shù),支持119種語(yǔ)言服務(wù),覆蓋全球主要市場(chǎng)。平臺(tái)提供雙模式智能任務(wù)處理:針對(duì)復(fù)雜業(yè)務(wù)場(chǎng)景的"深度思考"模式,以及高頻咨詢的"即時(shí)響應(yīng)"模式。搭載Qwen-3-235B旗艦?zāi)P秃蚎wen-3-30B輕量版,在代碼生成、數(shù)學(xué)推理等核心能力上達(dá)到行業(yè)頂尖水平。平臺(tái)實(shí)現(xiàn)與企業(yè)ERP、CRM等系統(tǒng)的無(wú)縫對(duì)接,推動(dòng)數(shù)據(jù)價(jià)值變現(xiàn)。通過(guò)標(biāo)準(zhǔn)化流程自動(dòng)化、全球化服務(wù)等核心價(jià)值,幫助企業(yè)提升運(yùn)營(yíng)效率70%、降低客服成本70%,并實(shí)現(xiàn)數(shù)據(jù)驅(qū)動(dòng)的決策升級(jí)。

    • AI日?qǐng)?bào):阿里騰訊全面支持MCP協(xié)議;階躍星辰多模態(tài)推理模型Step-R1-V-Mini;美WHEE圖像生成模型Miracle F1

      歡迎來(lái)到【AI日?qǐng)?bào)】欄目!這里是你每天探索人工智能世界的指南,每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容,聚焦開發(fā)者,助你洞悉技術(shù)趨勢(shì)、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點(diǎn)擊了解:https://top.aibase.com/1、阿里巴巴已宣布全面支持MCP協(xié)議騰訊緊隨其后近日,中國(guó)人工智能領(lǐng)域迎來(lái)技術(shù)標(biāo)準(zhǔn)的變革,ModelContextProtocol成為國(guó)內(nèi)AI生態(tài)的事實(shí)標(biāo)準(zhǔn)。12.英偉達(dá)發(fā)布Llama3.1NemotronUltra253B,性能?

    熱文

    • 3 天
    • 7天