无码在线播放二区|久久亚洲精品国产精品|无码视频在线观看一区二区|在线观看国产日韩亚洲中

  • <menu id="yw4o4"></menu>
  • 
    <menu id="yw4o4"><em id="yw4o4"></em></menu>
  • 首頁 > 業(yè)界 > 關(guān)鍵詞  > AI視頻最新資訊  > 正文

    Rerender A Video源代碼放出!解決AI視頻閃爍問題

    2023-09-26 11:23 · 稿源:站長之家

    站長之家(ChinaZ.com)9月26日 消息:Rerender A Video是一項(xiàng)令人印象深刻的技術(shù)成果,它旨在將大型文本到圖像擴(kuò)散模型的能力擴(kuò)展到視頻領(lǐng)域。該項(xiàng)目提出了一種零訓(xùn)練的文本引導(dǎo)視頻到視頻翻譯框架,能夠在視頻幀之間確保時(shí)間一致性,這一直是一個(gè)巨大的挑戰(zhàn)。

    它包括兩個(gè)主要部分:關(guān)鍵幀翻譯和完整視頻翻譯。第一部分使用適應(yīng)的擴(kuò)散模型生成關(guān)鍵幀,通過應(yīng)用層次交叉幀約束來強(qiáng)化形狀、紋理和顏色的連貫性。

    image.png

    項(xiàng)目地址:https://github.com/williamyang1991/Rerender_A_Video

    第二部分則通過時(shí)間感知的補(bǔ)丁匹配和幀混合將關(guān)鍵幀傳播到其他幀。這個(gè)框架以較低的成本實(shí)現(xiàn)了全局樣式和局部紋理的時(shí)間一致性,而無需重新訓(xùn)練或優(yōu)化。

    它還與現(xiàn)有的圖像擴(kuò)散技術(shù)兼容,可以利用它們,例如使用LoRA自定義特定主題,或者使用ControlNet引入額外的空間引導(dǎo)。大量的實(shí)驗(yàn)結(jié)果證明了該框架在渲染高質(zhì)量和時(shí)間一致性視頻方面的有效性。

    核心功能:

    時(shí)間一致性: 通過交叉幀約束實(shí)現(xiàn)低級別時(shí)間一致性,確保生成的視頻幀之間的平滑過渡。

    零訓(xùn)練: 無需對模型進(jìn)行訓(xùn)練或微調(diào),使其適用于各種視頻翻譯任務(wù)。

    靈活性: 與現(xiàn)成的模型(如ControlNet、LoRA等)兼容,可以根據(jù)需求自定義翻譯過程。

    WebUI界面: 提供了用戶友好的Web界面,使用戶可以輕松上傳視頻、輸入提示、選擇種子等,并運(yùn)行不同的翻譯步驟。

    命令行支持: 提供了靈活的命令行腳本,允許用戶通過命令行參數(shù)控制翻譯過程。

    舉報(bào)

    • 相關(guān)推薦
    • Chat Video:用GPT分析和總結(jié)視頻

      ChatVideo是一個(gè)基于人工智能的視頻分析和管理工具,致力于幫助用戶高效學(xué)習(xí)和管理視頻。在這個(gè)視頻泛濫的時(shí)代,ChatVideo憑借其獨(dú)特的AI技術(shù),為用戶節(jié)省大量時(shí)間,真正釋放視頻的價(jià)值。如果你希望高效管理視頻,ChatVideo一定是你的最佳選擇。

    • 登Nature兩年,谷歌「AI 6小時(shí)設(shè)計(jì)芯片」遭打臉?大神Jeff Dean論文被官方調(diào)查,疑似隱藏源代碼

      【新智元導(dǎo)讀】在2021年9月,由JeffDean領(lǐng)銜的谷歌大腦團(tuán)隊(duì)發(fā)表了一篇AI設(shè)計(jì)芯片的論文,曾引起業(yè)界轟動。隨后有多人發(fā)現(xiàn)這項(xiàng)工作并不能被復(fù)現(xiàn)關(guān)鍵數(shù)據(jù)和代碼被隱藏了,Nature也對此展開了調(diào)查。這篇曾引起整個(gè)EDA和IC設(shè)計(jì)社區(qū)的轟動的論文,如今在被Nature重新調(diào)查,不知后續(xù)會如何發(fā)展。

    • 螞蟻集團(tuán)開源代碼大模型CodeFuse-CodeLlama-34B 4bits量化版本

      螞蟻集團(tuán)代碼大模型CodeFuse-CodeLlama-34B4bits量化版本發(fā)布。CodeFuse-CodeLlama-34B-4bits是CodeFuse-CodeLlama-34B模型的4bits量化版本,后者是通過QLoRA對基座模型CodeLlama-34b-Python進(jìn)行多代碼任務(wù)微調(diào)得到的代碼大模型,模型輸入長度為4K。CodeFuse是螞蟻?zhàn)匝械拇a生成專屬大模型,根據(jù)開發(fā)者的輸入提供智能建議和實(shí)時(shí)支持,幫助開發(fā)者自動生成代碼、自動增加注釋,自動生成測試用例,修復(fù)和優(yōu)化代碼等,以提升研發(fā)效率。

    • Deci AI推出8.2億參數(shù)的文本到圖像潛在擴(kuò)散模型DeciDiffusion 1.0

      DeciAI最近推出了DeciDiffusion1.0,這是一項(xiàng)令人振奮的創(chuàng)新,旨在解決文本到圖像生成領(lǐng)域的挑戰(zhàn)。將文本描述轉(zhuǎn)化為栩栩如生的圖像一直是人工智能領(lǐng)域的難題,因?yàn)檫@涉及到自然語言理解和視覺內(nèi)容創(chuàng)建之間的巨大差距。隨著研究人員繼續(xù)推動AI能夠?qū)崿F(xiàn)的界限,我們可以期待進(jìn)一步的突破,使我們更接近一個(gè)世界,其中文本無縫地轉(zhuǎn)化為引人入勝的圖像,從在各個(gè)行業(yè)和領(lǐng)?

    • 農(nóng)狂喜!微軟提出CodePlan,跨168個(gè)代碼庫編任務(wù),LLM自動化完成

      微軟提出的CodePlan讓碼農(nóng)的生產(chǎn)力又提高了!對于大模型來說,擅長的是本地化編碼任務(wù)。但如果任務(wù)跨越了多個(gè)相互依賴的文件,LLM卻無法解決。它成功應(yīng)對了許多挑戰(zhàn),為高效可靠的軟件工程實(shí)踐開辟了新的可能性。

    • 萬能AI編程工具包插件Sidekick 提供個(gè)性化編程幫助

      SidekickAI是一款強(qiáng)大的VisualStudioCode擴(kuò)展,旨在幫助開發(fā)人員更快速、更高效地編寫代碼、提出問題和發(fā)現(xiàn)錯(cuò)誤。它由GPT-4引擎提供支持,為開發(fā)者提供高效、便捷的編程體驗(yàn)。這些核心功能使SidekickAI成為了開發(fā)人員的得力助手,能夠加速編碼過程、提高代碼質(zhì)量,并提供了智能工具來解決復(fù)雜的開發(fā)任務(wù)。

    • 姜子牙大模型開源代碼大模型Ziya-Coding-34B-v1.0

      IDEA研究院封神榜團(tuán)隊(duì)最近開源了最新的代碼大模型Ziya-Coding-34B-v1.0,該模型在HumanEvalPass@1的評測上取得了75.5的好成績,超過了GPT-4的得分。此次開源的Ziya-Coding-34B-v1.0,基于CodeLLaMA34B的預(yù)訓(xùn)練模型,經(jīng)過了兩個(gè)階段的有監(jiān)督精調(diào),支持多種與代碼相關(guān)的任務(wù),包括代碼生成、代碼解釋、代碼糾錯(cuò)以及單元測試的生成等。

    • 對標(biāo)GPT-4代碼解釋器!港中大讓模型寫代碼解決數(shù)學(xué)難題,得分超越GPT-4

      對標(biāo)GPT-4代碼解釋器,港中大最新研究放了個(gè)“大招”:他們開發(fā)了一個(gè)叫做MathCoder的大模型,數(shù)學(xué)能力直接在競賽級“題庫”Math上超過GPT-4。做到這一點(diǎn)靠的就是無縫集成代碼的能力——在遇到數(shù)學(xué)問題時(shí),它不僅能用自然語言推理能自動編寫和執(zhí)行代碼來建模、推導(dǎo)公式與方程。通訊作者為李鴻升,為港中大電子工程系副教授,同時(shí)也就職于上海人工智能研究室。

    • IDC:AI解決PC行業(yè)銷售問題的方案

      據(jù)IDC稱,AI被視為解決PC行業(yè)銷售問題的一種潛在方案,盡管該分析師承認(rèn)使用案例尚未完全明確。隨著ChatGPT的公開發(fā)布,生成式AI引起了廣泛的關(guān)注,大型軟件和硬件品牌正竭力將這一技術(shù)應(yīng)用到各個(gè)領(lǐng)域?!彼€表示,只要假日銷售不崩潰,PC供應(yīng)鏈中的庫存將在年底前保持在正常范圍內(nèi),即四到六周。

    • AI初創(chuàng)公司Delphi新舉措:將打造網(wǎng)紅和名人AI數(shù)字虛擬人

      人工智能初創(chuàng)公司Delphi致力于將名人和網(wǎng)紅的互動擴(kuò)展到更多人群。這家初創(chuàng)公司采用創(chuàng)新的方法,通過模仿名人和網(wǎng)紅的個(gè)性,為他們創(chuàng)建數(shù)字聊天機(jī)器人,以實(shí)現(xiàn)一對一互動。這一創(chuàng)新商業(yè)模式的成功與否,將在很大程度上取決于其技術(shù)的卓越性以及聊天機(jī)器人與原始人物的相似度。