无码在线播放二区|久久亚洲精品国产精品|无码视频在线观看一区二区|在线观看国产日韩亚洲中

<menu id="yw4o4"></menu>

<menu id="yw4o4"><em id="yw4o4"></em></menu>

字節(jié)跳動(dòng)發(fā)布豆包視頻生成模型包括PixelDance、Seaweed兩個(gè)版本

2024-09-24 16:37 · 稿源：站長(zhǎng)之家

站長(zhǎng)之家（ChinaZ.com）9月24日消息:在2024年AI創(chuàng)新巡展上，火山引擎科技有限公司隆重推出了豆包·視頻生成模型，標(biāo)志著其大模型家族再添新成員?；鹕揭婵偛米T待在會(huì)上表示，豆包·視頻生成模型具備多項(xiàng)創(chuàng)新性能，包括精準(zhǔn)的語(yǔ)義理解、多動(dòng)作多主體交互、強(qiáng)大的動(dòng)態(tài)效果和一致性多鏡頭生成能力。

微信截圖_20240924165233.png

該模型能夠理解和執(zhí)行復(fù)雜的指令，實(shí)現(xiàn)多個(gè)主體間的交互，并能在視頻主體的大動(dòng)態(tài)和鏡頭間進(jìn)行炫酷切換。此外，它還能夠在多鏡頭切換中保持一致性，10秒內(nèi)講述一個(gè)完整的故事，并支持多種風(fēng)格和比例，如黑白、3D動(dòng)畫(huà)、國(guó)畫(huà)等。

微信截圖_20240924152238.png

豆包·視頻生成模型包含兩個(gè)版本:Doubao-視頻生成PixelDance和Doubao-視頻生成-Seaweed。

微信截圖_20240924164304.png

PixelDance V1.4是ByteDance Research團(tuán)隊(duì)開(kāi)發(fā)的DiT結(jié)構(gòu)的視頻生成大模型，支持文生視頻和圖生視頻，能夠一次性生成長(zhǎng)達(dá)10秒的精彩視頻片段。它具備出色的語(yǔ)義理解能力，能快速生成優(yōu)質(zhì)的視頻片段，適用于影視創(chuàng)作、廣告?zhèn)髅降榷鄠€(gè)場(chǎng)景。

Doubao-視頻生成-Seaweed模型支持文生視頻和圖生視頻兩種生成方式，基于Transformer結(jié)構(gòu)，利用時(shí)空壓縮的潛空間進(jìn)行訓(xùn)練，原生支持多分辨率生成，適配橫屏、豎屏，并能夠根據(jù)用戶輸入的高清圖像分辨率進(jìn)行適配和保真。默認(rèn)輸出為720p分辨率、24fps、時(shí)長(zhǎng)5秒，并可動(dòng)態(tài)延長(zhǎng)至20-30秒。

豆包·視頻生成模型預(yù)計(jì)將為電商營(yíng)銷、動(dòng)畫(huà)教育、城市文旅、微劇本（音樂(lè)MV、微電影、短劇等）等多個(gè)領(lǐng)域帶來(lái)創(chuàng)新和效率提升。火山引擎表示，該模型的發(fā)布將全面加速AIGC應(yīng)用創(chuàng)新。

（舉報(bào)）

相關(guān)推薦

關(guān)鍵詞：

視頻生成模型Vidu Q1怎么用？Vidu Q1官網(wǎng)是什么？

國(guó)產(chǎn)視頻生成大模型Vidu Q1在性能、價(jià)格和功能上實(shí)現(xiàn)重大突破。該模型由生數(shù)科技推出，在VBench評(píng)測(cè)中超越Sora等國(guó)內(nèi)外頂尖模型，支持1080p高清視頻生成，每秒價(jià)格低至3毛錢(qián)。其首尾幀功能僅需兩張圖即可實(shí)現(xiàn)電影級(jí)運(yùn)鏡效果，支持多元風(fēng)格生成和48kHz高采樣率混音功能。Vidu Q1已深度賦能影視、廣告、動(dòng)漫等行業(yè)，大幅降低創(chuàng)作門(mén)檻。

?國(guó)產(chǎn)視頻生成 ?Vidu ?Q1
谷歌Gemini整合Veo 2視頻生成模型，8秒720P視頻輕松搞定

谷歌宣布又有一款 AI 模型將加入 Gemini，但這次它不僅僅是一個(gè)聊天機(jī)器人。

?谷歌 ?谷歌gemini ?veo2
字節(jié)發(fā)布豆包1.5深度思考模型：“實(shí)拍級(jí)”圖像生成

快科技4月17日消息，據(jù)報(bào)道，今日，在火山引擎AI創(chuàng)新巡展杭州站的現(xiàn)場(chǎng)，字節(jié)跳動(dòng)旗下火山引擎總裁譚待正式發(fā)布了備受矚目的豆包1.5深度思考模型。譚待指出，豆包1.5深度思考模型在多個(gè)關(guān)鍵領(lǐng)域展現(xiàn)出卓越性能。在數(shù)學(xué)、編程、科學(xué)推理這類專業(yè)領(lǐng)域中，它能夠精準(zhǔn)高效地處理復(fù)雜問(wèn)題；在創(chuàng)意寫(xiě)作等通用任務(wù)方面，同樣表現(xiàn)出色。該模型采用MoE架構(gòu)，總參數(shù)為200B，激?

?豆包1.5深度思考模型 ?火山引擎AI創(chuàng)新 ?字節(jié)跳動(dòng)技術(shù)發(fā)布
寶馬×字節(jié)跳動(dòng)：以AI賦能汽車營(yíng)銷創(chuàng)新變革

4月18日，華晨寶馬旗下領(lǐng)悅數(shù)字信息技術(shù)公司與字節(jié)跳動(dòng)旗下火山引擎達(dá)成合作，雙方將圍繞AI技術(shù)在汽車營(yíng)銷服務(wù)的創(chuàng)新應(yīng)用展開(kāi)深度合作。通過(guò)AI+場(chǎng)景的高效匹配，實(shí)現(xiàn)產(chǎn)品精準(zhǔn)推薦、內(nèi)容智能引導(dǎo)，提升用戶購(gòu)車體驗(yàn)與經(jīng)銷商運(yùn)營(yíng)效率。寶馬集團(tuán)大中華區(qū)總裁高翔表示，此次合作是寶馬"360度全鏈AI戰(zhàn)略"在營(yíng)銷領(lǐng)域的重要實(shí)踐。領(lǐng)悅公司將借助火山引擎的大模型技術(shù)，打造專屬智能營(yíng)銷工具，提供24小時(shí)在線客服、個(gè)性化推薦等服務(wù)。這是雙方自2019年以來(lái)的第三次合作，此前已在數(shù)字化運(yùn)營(yíng)、直播營(yíng)銷等領(lǐng)域取得成果。此次合作標(biāo)志著寶馬加速推進(jìn)AI技術(shù)在全業(yè)務(wù)鏈的應(yīng)用，持續(xù)深化中國(guó)市場(chǎng)數(shù)字化轉(zhuǎn)型。

?華晨寶馬 ?人工智能 ?營(yíng)銷服務(wù)
傳字節(jié)跳動(dòng)AI眼鏡有新動(dòng)作！已和供應(yīng)商“搭上線”

有知情人士透露了字節(jié)跳動(dòng)在AI硬件領(lǐng)域的又一重大布局計(jì)劃推出自家的AI智能眼鏡。字節(jié)跳動(dòng)自去年起便已啟動(dòng)AI眼鏡項(xiàng)目。意在為豆包尋找更廣泛的C端應(yīng)用場(chǎng)景，提升用戶粘性和使用頻率；另一方面，通過(guò)打通軟硬件，構(gòu)建更加完整的生態(tài)系統(tǒng)，為公司的長(zhǎng)遠(yuǎn)發(fā)展奠定堅(jiān)實(shí)基礎(chǔ)。

?字節(jié)跳動(dòng) ?AI硬件 ?智能眼鏡
薦AI日?qǐng)?bào)：昆侖萬(wàn)維開(kāi)源Skywork-OR1系列模型；訊飛星辰Agent開(kāi)發(fā)平臺(tái)全面支持MCP；字節(jié)跳動(dòng)布局AI智能眼鏡

歡迎來(lái)到【AI日?qǐng)?bào)】欄目!這里是你每天探索人工智能世界的指南，每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容，聚焦開(kāi)發(fā)者，助你洞悉技術(shù)趨勢(shì)、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點(diǎn)擊了解:https://top.aibase.com/1、Kimi開(kāi)源視覺(jué)語(yǔ)言模型 Kimi-VL 與 Kimi-VL-Thinking，多項(xiàng)基準(zhǔn)超越 GPT-4oMoonshot AI 最近開(kāi)源了 Kimi-VL 和 Kimi-VL-Thinking 兩款視覺(jué)語(yǔ)言模型，展現(xiàn)出卓越的多模態(tài)理解與推理能力。這些模型采

?人工智能 ?視覺(jué)語(yǔ)言模型 ?Kimi-VL
薦AI日?qǐng)?bào)：字節(jié)發(fā)布豆包1.5深度思考模型；微信首個(gè)AI助手 “元寶” 上線；OpenAI發(fā)布o4-mini、滿血版o3

歡迎來(lái)到【AI日?qǐng)?bào)】欄目!這里是你每天探索人工智能世界的指南，每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容，聚焦開(kāi)發(fā)者，助你洞悉技術(shù)趨勢(shì)、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點(diǎn)擊了解:https://top.aibase.com/1、OpenAI發(fā)布兩款多模態(tài)推理模型o4-mini、滿血版o3OpenAI在技術(shù)直播中推出了其最新的多模態(tài)模型o4-mini和滿血版o3，這兩款模型具備同時(shí)處理文本、圖像和音頻的能力，并能調(diào)用外部工?

?人工智能 ?多模態(tài)模型 ?OpenAI
可靈AI開(kāi)啟視頻生成2.0時(shí)代！全球用戶數(shù)已突破2200萬(wàn)

4 月 15 日，快手可靈AI在北京中關(guān)村國(guó)際創(chuàng)新中心舉行“靈感成真”2. 0 模型發(fā)布會(huì)，宣布基座模型再次升級(jí)，面向全球正式發(fā)布可靈2. 0 視頻生成模型及可圖2. 0 圖像生成模型。

?可靈2.0 ?可靈AI ?快手
薦AI日?qǐng)?bào)：騰訊混元3D生成模型2.5版本發(fā)布；海螺推出圖像人物參考功能；百度上線移動(dòng)端超級(jí)智能體心響App

本文介紹了多款A(yù)I領(lǐng)域的新產(chǎn)品和技術(shù)進(jìn)展：1)Kortix-AI推出開(kāi)源通用AI智能體平臺(tái)Suna；2)騰訊混元3D生成模型升級(jí)至2.5版本；3)海螺AI推出基于單張圖像生成多角度角色圖像功能；4)百度發(fā)布"心響"App整合多智能體協(xié)作；5)Nari Labs開(kāi)源媲美真人的對(duì)話語(yǔ)音模型Dia；6)Grok新增視覺(jué)處理和多語(yǔ)言支持；7)Genspark推出AI幻燈片工具；8)Character.AI發(fā)布讓靜態(tài)圖片"說(shuō)話"的AvatarFX模型；9)pad.ws結(jié)合白板和代碼編輯器；10)OpenBMB開(kāi)源社區(qū)推出長(zhǎng)文本生成模型"卷姬"；11)騰訊推出AI閱讀助手"企鵝讀伴"；12)OpenAI有意收購(gòu)Chrome瀏覽器；13)字節(jié)跳動(dòng)調(diào)整AI產(chǎn)品線布局。這些創(chuàng)新展現(xiàn)了AI技術(shù)在自動(dòng)化、3D生成、語(yǔ)音交互、內(nèi)容創(chuàng)作等領(lǐng)域的快速發(fā)展。

?人工智能 ?AI產(chǎn)品 ?開(kāi)源平臺(tái)
薦DeepSeek紅利耗盡后，元寶拿什么和豆包斗？

短短60天內(nèi)，中國(guó)AI原生應(yīng)用下載排行榜的位次排名，就三易其主。最新情況是，截至4月15日中午，中國(guó)區(qū)蘋(píng)果應(yīng)用商店免費(fèi)APP下載排行榜上，豆包再次超越DeepSeek，位列第二，緊隨其后的DeepSeek被擠到了第三的位置，騰訊元寶則滑落到了第七名。2月13日，作為首家在C端主力產(chǎn)品中接入DeepSeek-R1滿血版的元寶，一度趁著DeepSeek東風(fēng)崛起:3月3日力壓DeepSeek和豆包，首度登頂。但好景?

?AI應(yīng)用 ?下載排行榜 ?豆包

熱文

3 天
7天

站長(zhǎng)商機(jī)

廣告

商務(wù)合作侵權(quán)投訴廣告服務(wù) 版權(quán)聲明招聘

?CopyRight 2002-2020 CHINAZ.COM