无码在线播放二区|久久亚洲精品国产精品|无码视频在线观看一区二区|在线观看国产日韩亚洲中

  • <menu id="yw4o4"></menu>
  • 
    <menu id="yw4o4"><em id="yw4o4"></em></menu>
  • 首頁(yè) > 熱點(diǎn) > 關(guān)鍵詞  > AI創(chuàng)新最新資訊  > 正文

    字節(jié)跳動(dòng)發(fā)布豆包視頻生成模型 包括PixelDance、Seaweed兩個(gè)版本

    2024-09-24 16:37 · 稿源:站長(zhǎng)之家

    站長(zhǎng)之家(ChinaZ.com)9月24日 消息:在2024年AI創(chuàng)新巡展上,火山引擎科技有限公司隆重推出了豆包·視頻生成模型,標(biāo)志著其大模型家族再添新成員?;鹕揭婵偛米T待在會(huì)上表示,豆包·視頻生成模型具備多項(xiàng)創(chuàng)新性能,包括精準(zhǔn)的語(yǔ)義理解、多動(dòng)作多主體交互、強(qiáng)大的動(dòng)態(tài)效果和一致性多鏡頭生成能力。

    微信截圖_20240924165233.png

    該模型能夠理解和執(zhí)行復(fù)雜的指令,實(shí)現(xiàn)多個(gè)主體間的交互,并能在視頻主體的大動(dòng)態(tài)和鏡頭間進(jìn)行炫酷切換。此外,它還能夠在多鏡頭切換中保持一致性,10秒內(nèi)講述一個(gè)完整的故事,并支持多種風(fēng)格和比例,如黑白、3D動(dòng)畫(huà)、國(guó)畫(huà)等。

    微信截圖_20240924152238.png

    豆包·視頻生成模型包含兩個(gè)版本:Doubao-視頻生成PixelDance和Doubao-視頻生成-Seaweed。

    微信截圖_20240924164304.png

    PixelDance V1.4是ByteDance Research團(tuán)隊(duì)開(kāi)發(fā)的DiT結(jié)構(gòu)的視頻生成大模型,支持文生視頻和圖生視頻,能夠一次性生成長(zhǎng)達(dá)10秒的精彩視頻片段。它具備出色的語(yǔ)義理解能力,能快速生成優(yōu)質(zhì)的視頻片段,適用于影視創(chuàng)作、廣告?zhèn)髅降榷鄠€(gè)場(chǎng)景。

    Doubao-視頻生成-Seaweed模型支持文生視頻和圖生視頻兩種生成方式,基于Transformer結(jié)構(gòu),利用時(shí)空壓縮的潛空間進(jìn)行訓(xùn)練,原生支持多分辨率生成,適配橫屏、豎屏,并能夠根據(jù)用戶輸入的高清圖像分辨率進(jìn)行適配和保真。默認(rèn)輸出為720p分辨率、24fps、時(shí)長(zhǎng)5秒,并可動(dòng)態(tài)延長(zhǎng)至20-30秒。

    豆包·視頻生成模型預(yù)計(jì)將為電商營(yíng)銷、動(dòng)畫(huà)教育、城市文旅、微劇本(音樂(lè)MV、微電影、短劇等)等多個(gè)領(lǐng)域帶來(lái)創(chuàng)新和效率提升。火山引擎表示,該模型的發(fā)布將全面加速AIGC應(yīng)用創(chuàng)新。

    舉報(bào)

    • 相關(guān)推薦
    • 視頻生成模型Vidu Q1怎么用?Vidu Q1官網(wǎng)是什么?

      國(guó)產(chǎn)視頻生成大模型Vidu Q1在性能、價(jià)格和功能上實(shí)現(xiàn)重大突破。該模型由生數(shù)科技推出,在VBench評(píng)測(cè)中超越Sora等國(guó)內(nèi)外頂尖模型,支持1080p高清視頻生成,每秒價(jià)格低至3毛錢(qián)。其首尾幀功能僅需兩張圖即可實(shí)現(xiàn)電影級(jí)運(yùn)鏡效果,支持多元風(fēng)格生成和48kHz高采樣率混音功能。Vidu Q1已深度賦能影視、廣告、動(dòng)漫等行業(yè),大幅降低創(chuàng)作門(mén)檻。

    • 谷歌Gemini整合Veo 2視頻生成模型,8秒720P視頻輕松搞定

      谷歌宣布又有一款 AI 模型將加入 Gemini,但這次它不僅僅是一個(gè)聊天機(jī)器人。

    • 字節(jié)發(fā)布豆包1.5深度思考模型:“實(shí)拍級(jí)”圖像生成

      快科技4月17日消息,據(jù)報(bào)道,今日,在火山引擎AI創(chuàng)新巡展杭州站的現(xiàn)場(chǎng),字節(jié)跳動(dòng)旗下火山引擎總裁譚待正式發(fā)布了備受矚目的豆包1.5深度思考模型。譚待指出,豆包1.5深度思考模型在多個(gè)關(guān)鍵領(lǐng)域展現(xiàn)出卓越性能。在數(shù)學(xué)、編程、科學(xué)推理這類專業(yè)領(lǐng)域中,它能夠精準(zhǔn)高效地處理復(fù)雜問(wèn)題;在創(chuàng)意寫(xiě)作等通用任務(wù)方面,同樣表現(xiàn)出色。該模型采用MoE架構(gòu),總參數(shù)為200B,激?

    • 寶馬×字節(jié)跳動(dòng):以AI賦能汽車營(yíng)銷創(chuàng)新變革

      4月18日,華晨寶馬旗下領(lǐng)悅數(shù)字信息技術(shù)公司與字節(jié)跳動(dòng)旗下火山引擎達(dá)成合作,雙方將圍繞AI技術(shù)在汽車營(yíng)銷服務(wù)的創(chuàng)新應(yīng)用展開(kāi)深度合作。通過(guò)AI+場(chǎng)景的高效匹配,實(shí)現(xiàn)產(chǎn)品精準(zhǔn)推薦、內(nèi)容智能引導(dǎo),提升用戶購(gòu)車體驗(yàn)與經(jīng)銷商運(yùn)營(yíng)效率。寶馬集團(tuán)大中華區(qū)總裁高翔表示,此次合作是寶馬"360度全鏈AI戰(zhàn)略"在營(yíng)銷領(lǐng)域的重要實(shí)踐。領(lǐng)悅公司將借助火山引擎的大模型技術(shù),打造專屬智能營(yíng)銷工具,提供24小時(shí)在線客服、個(gè)性化推薦等服務(wù)。這是雙方自2019年以來(lái)的第三次合作,此前已在數(shù)字化運(yùn)營(yíng)、直播營(yíng)銷等領(lǐng)域取得成果。此次合作標(biāo)志著寶馬加速推進(jìn)AI技術(shù)在全業(yè)務(wù)鏈的應(yīng)用,持續(xù)深化中國(guó)市場(chǎng)數(shù)字化轉(zhuǎn)型。

    • 字節(jié)跳動(dòng)AI眼鏡有新動(dòng)作! 已和供應(yīng)商“搭上線”

      有知情人士透露了字節(jié)跳動(dòng)在AI硬件領(lǐng)域的又一重大布局計(jì)劃推出自家的AI智能眼鏡。字節(jié)跳動(dòng)自去年起便已啟動(dòng)AI眼鏡項(xiàng)目。意在為豆包尋找更廣泛的C端應(yīng)用場(chǎng)景,提升用戶粘性和使用頻率;另一方面,通過(guò)打通軟硬件,構(gòu)建更加完整的生態(tài)系統(tǒng),為公司的長(zhǎng)遠(yuǎn)發(fā)展奠定堅(jiān)實(shí)基礎(chǔ)。

    • AI日?qǐng)?bào):昆侖萬(wàn)維開(kāi)源Skywork-OR1系列模型;訊飛星辰Agent開(kāi)發(fā)平臺(tái)全面支持MCP字節(jié)跳動(dòng)布局AI智能眼鏡

      歡迎來(lái)到【AI日?qǐng)?bào)】欄目!這里是你每天探索人工智能世界的指南,每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容,聚焦開(kāi)發(fā)者,助你洞悉技術(shù)趨勢(shì)、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點(diǎn)擊了解:https://top.aibase.com/1、Kimi開(kāi)源視覺(jué)語(yǔ)言模型 Kimi-VL 與 Kimi-VL-Thinking,多項(xiàng)基準(zhǔn)超越 GPT-4oMoonshot AI 最近開(kāi)源了 Kimi-VL 和 Kimi-VL-Thinking 兩款視覺(jué)語(yǔ)言模型,展現(xiàn)出卓越的多模態(tài)理解與推理能力。這些模型采

    • AI日?qǐng)?bào):字節(jié)發(fā)布豆包1.5深度思考模型;微信首個(gè)AI助手 “元寶” 上線;OpenAI發(fā)布o4-mini、滿血o3

      歡迎來(lái)到【AI日?qǐng)?bào)】欄目!這里是你每天探索人工智能世界的指南,每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容,聚焦開(kāi)發(fā)者,助你洞悉技術(shù)趨勢(shì)、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點(diǎn)擊了解:https://top.aibase.com/1、OpenAI發(fā)布兩款多模態(tài)推理模型o4-mini、滿血版o3OpenAI在技術(shù)直播中推出了其最新的多模態(tài)模型o4-mini和滿血版o3,這兩款模型具備同時(shí)處理文本、圖像和音頻的能力,并能調(diào)用外部工?

    • 可靈AI開(kāi)啟視頻生成2.0時(shí)代!全球用戶數(shù)已突破2200萬(wàn)

      4 月 15 日,快手可靈AI在北京中關(guān)村國(guó)際創(chuàng)新中心舉行“靈感成真”2. 0 模型發(fā)布會(huì),宣布基座模型再次升級(jí),面向全球正式發(fā)布可靈2. 0 視頻生成模型及可圖2. 0 圖像生成模型。

    • AI日?qǐng)?bào):騰訊混元3D生成模型2.5版本發(fā)布;海螺推出圖像人物參考功能;百度上線移動(dòng)端超級(jí)智能體心響App

      本文介紹了多款A(yù)I領(lǐng)域的新產(chǎn)品和技術(shù)進(jìn)展:1)Kortix-AI推出開(kāi)源通用AI智能體平臺(tái)Suna;2)騰訊混元3D生成模型升級(jí)至2.5版本;3)海螺AI推出基于單張圖像生成多角度角色圖像功能;4)百度發(fā)布"心響"App整合多智能體協(xié)作;5)Nari Labs開(kāi)源媲美真人的對(duì)話語(yǔ)音模型Dia;6)Grok新增視覺(jué)處理和多語(yǔ)言支持;7)Genspark推出AI幻燈片工具;8)Character.AI發(fā)布讓靜態(tài)圖片"說(shuō)話"的AvatarFX模型;9)pad.ws結(jié)合白板和代碼編輯器;10)OpenBMB開(kāi)源社區(qū)推出長(zhǎng)文本生成模型"卷姬";11)騰訊推出AI閱讀助手"企鵝讀伴";12)OpenAI有意收購(gòu)Chrome瀏覽器;13)字節(jié)跳動(dòng)調(diào)整AI產(chǎn)品線布局。這些創(chuàng)新展現(xiàn)了AI技術(shù)在自動(dòng)化、3D生成、語(yǔ)音交互、內(nèi)容創(chuàng)作等領(lǐng)域的快速發(fā)展。

    • DeepSeek紅利耗盡后,元寶拿什么和豆包斗?

      短短60天內(nèi),中國(guó)AI原生應(yīng)用下載排行榜的位次排名,就三易其主。最新情況是,截至4月15日中午,中國(guó)區(qū)蘋(píng)果應(yīng)用商店免費(fèi)APP下載排行榜上,豆包再次超越DeepSeek,位列第二,緊隨其后的DeepSeek被擠到了第三的位置,騰訊元寶則滑落到了第七名。2月13日,作為首家在C端主力產(chǎn)品中接入DeepSeek-R1滿血版的元寶,一度趁著DeepSeek東風(fēng)崛起:3月3日力壓DeepSeek和豆包,首度登頂。但好景?

    熱文

    • 3 天
    • 7天