无码在线播放二区|久久亚洲精品国产精品|无码视频在线观看一区二区|在线观看国产日韩亚洲中

  • <menu id="yw4o4"></menu>
  • 
    <menu id="yw4o4"><em id="yw4o4"></em></menu>
  • 首頁(yè) > 業(yè)界 > 關(guān)鍵詞  > 生成模型最新資訊  > 正文

    Yann LeCun:生成模型不適合處理視頻,AI得在抽象空間中進(jìn)行預(yù)測(cè)

    2024-01-23 15:17 · 稿源: 機(jī)器之心公眾號(hào)

    AI 理解視頻不能依靠在像素空間中預(yù)測(cè)。在互聯(lián)網(wǎng)文本數(shù)據(jù)即將枯竭之際,很多 AI 研究者將目光轉(zhuǎn)向了視頻。但如何讓 AI 理解視頻數(shù)據(jù)成了新的難題。在2024世界經(jīng)濟(jì)論壇的一次會(huì)談中,圖靈獎(jiǎng)得主、Meta 首席 AI 科學(xué)家 Yann LeCun 被問到了這個(gè)問題。他認(rèn)為,雖然這個(gè)問題還沒有明確

    ......

    本文由站長(zhǎng)之家合作伙伴自媒體作者“機(jī)器之心公眾號(hào)”授權(quán)發(fā)布于站長(zhǎng)之家平臺(tái),本平臺(tái)僅提供信息索引服務(wù)。由于內(nèi)容發(fā)布時(shí)間超過平臺(tái)更新維護(hù)時(shí)間,為了保證文章信息的及時(shí)性,內(nèi)容觀點(diǎn)的準(zhǔn)確性,平臺(tái)將不提供完全的內(nèi)容展現(xiàn),本頁(yè)面內(nèi)容僅為平臺(tái)搜索索引使用。需閱讀完整內(nèi)容的用戶,請(qǐng)查看原文,獲取內(nèi)容詳情。

    舉報(bào)

    • 相關(guān)推薦
    • 谷歌Gemini整Veo 2視頻生成模型,8秒720P視頻輕松搞定

      谷歌宣布又有一款 AI 模型將加入 Gemini,但這次它不僅僅是一個(gè)聊天機(jī)器人。

    • 視頻生成模型Vidu Q1怎么用?Vidu Q1官網(wǎng)是什么?

      國(guó)產(chǎn)視頻生成大模型Vidu Q1在性能、價(jià)格和功能上實(shí)現(xiàn)重大突破。該模型由生數(shù)科技推出,在VBench評(píng)測(cè)中超越Sora等國(guó)內(nèi)外頂尖模型,支持1080p高清視頻生成,每秒價(jià)格低至3毛錢。其首尾幀功能僅需兩張圖即可實(shí)現(xiàn)電影級(jí)運(yùn)鏡效果,支持多元風(fēng)格生成和48kHz高采樣率混音功能。Vidu Q1已深度賦能影視、廣告、動(dòng)漫等行業(yè),大幅降低創(chuàng)作門檻。

    • AI日?qǐng)?bào):阿里騰訊全面支持MCP協(xié)議;階躍星辰多模態(tài)推理模型Step-R1-V-Mini;美圖WHEE圖像生成模型Miracle F1

      歡迎來到【AI日?qǐng)?bào)】欄目!這里是你每天探索人工智能世界的指南,每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容,聚焦開發(fā)者,助你洞悉技術(shù)趨勢(shì)、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點(diǎn)擊了解:https://top.aibase.com/1、阿里巴巴已宣布全面支持MCP協(xié)議騰訊緊隨其后近日,中國(guó)人工智能領(lǐng)域迎來技術(shù)標(biāo)準(zhǔn)的變革,ModelContextProtocol成為國(guó)內(nèi)AI生態(tài)的事實(shí)標(biāo)準(zhǔn)。12.英偉達(dá)發(fā)布Llama3.1NemotronUltra253B,性能?

    • 說個(gè)抽象的事,你現(xiàn)在可以在秘塔AI搜索里上課了。

      給我整不會(huì)了。周末我本來在用秘塔AI搜關(guān)稅的問題,特朗普一天一個(gè)說法,又說關(guān)稅要結(jié)束了。然后,意外的發(fā)現(xiàn),秘塔上了一個(gè)非常有意思的功能。“今天學(xué)點(diǎn)啥”。。。說實(shí)話,在進(jìn)入到這個(gè)頁(yè)面的瞬間,我以為我跳到不知道哪去了,直到看到秘塔左上角的logo還在,我才確定,這是他們的新功能。它的功能大概就是,把一份文件或者一個(gè)鏈接,變成一個(gè)像是B站UP專門為?

    • 阿里開源通義新模型:指定首尾圖片生成視頻

      快科技4月18日消息,據(jù)報(bào)道,阿里巴巴旗下通義萬相宣布開源其創(chuàng)新視頻生成技術(shù)首尾幀生視頻14B模型。這項(xiàng)突破性AI技術(shù)能夠根據(jù)用戶提供的起始和結(jié)束畫面,智能生成720p高清過渡視頻,為視頻創(chuàng)作帶來全新可能。該模型通過先進(jìn)的深度學(xué)習(xí)算法,能夠精準(zhǔn)理解輸入畫面的內(nèi)容、風(fēng)格及主題特征。當(dāng)用戶提供首尾兩幀圖像后,模型會(huì)智能分析畫面中的視覺元素,包括物體形?

    • AI日?qǐng)?bào):騰訊混元3D生成模型2.5版本發(fā)布;海螺推出圖像人物參考功能;百度上線移動(dòng)端超級(jí)智能體心響App

      本文介紹了多款A(yù)I領(lǐng)域的新產(chǎn)品和技術(shù)進(jìn)展:1)Kortix-AI推出開源通用AI智能體平臺(tái)Suna;2)騰訊混元3D生成模型升級(jí)至2.5版本;3)海螺AI推出基于單張圖像生成多角度角色圖像功能;4)百度發(fā)布"心響"App整合多智能體協(xié)作;5)Nari Labs開源媲美真人的對(duì)話語音模型Dia;6)Grok新增視覺處理和多語言支持;7)Genspark推出AI幻燈片工具;8)Character.AI發(fā)布讓靜態(tài)圖片"說話"的AvatarFX模型;9)pad.ws結(jié)合白板和代碼編輯器;10)OpenBMB開源社區(qū)推出長(zhǎng)文本生成模型"卷姬";11)騰訊推出AI閱讀助手"企鵝讀伴";12)OpenAI有意收購(gòu)Chrome瀏覽器;13)字節(jié)跳動(dòng)調(diào)整AI產(chǎn)品線布局。這些創(chuàng)新展現(xiàn)了AI技術(shù)在自動(dòng)化、3D生成、語音交互、內(nèi)容創(chuàng)作等領(lǐng)域的快速發(fā)展。

    • 低端顯卡登上AI的大船!6GB顯存就能生成高質(zhì)量視頻

      快科技4月20日消息,GitHub的Lvmin Zhang聯(lián)合斯坦福大學(xué)的Maneesh Agrawala,發(fā)布了一項(xiàng)突破性的新技術(shù)FramePack,通過在視頻擴(kuò)散模型中使用固定長(zhǎng)度的時(shí)域上下文,可以更高效地生成時(shí)間更長(zhǎng)、質(zhì)量更高的視頻。根據(jù)實(shí)測(cè),基于FramePack構(gòu)建的130億參數(shù)模型,只需一塊6GB顯存的顯卡,就能生成60秒鐘的視頻。FramePack是一種神經(jīng)網(wǎng)絡(luò)架構(gòu),使用多級(jí)優(yōu)化策略,完成本地AI視頻生成。目前,?

    • 可靈AI發(fā)布全新2.0模型:上線多模態(tài)視頻編輯功能

      快科技4月16日消息,據(jù)報(bào)道,可靈AI在北京舉行靈感成真”2.0模型發(fā)布會(huì),正式發(fā)布可靈2.0視頻生成模型及可圖2.0圖像生成模型。據(jù)介紹,可靈2.0模型在動(dòng)態(tài)質(zhì)量、語義響應(yīng)、畫面美學(xué)等維度保持領(lǐng)先;可圖2.0模型在指令遵循、電影質(zhì)感及藝術(shù)風(fēng)格表現(xiàn)等方面顯著提升。3月27日,全球AI基準(zhǔn)測(cè)試機(jī)構(gòu)Artificial Analysis發(fā)布了最新的全球視頻生成大模型榜單,快手可靈1.6pro(高品質(zhì)模

    • 優(yōu)質(zhì)MCP教程在哪看?適合新手的MCP教程去哪找?

      在人工智能領(lǐng)域,MCP正逐漸成為連接AI模型與外部世界的重要橋梁。AIbase正是探索MCP生態(tài)的絕佳平臺(tái),它為開發(fā)者和研究者提供了一個(gè)集中展示MCP相關(guān)開源項(xiàng)目和工具的網(wǎng)站,幫助用戶快速了解最新的開發(fā)趨勢(shì)和創(chuàng)新成果。無論是初學(xué)者還是資深開發(fā)者,都可以在AIbase上找到適合自己的資源和工具,推動(dòng)自己的學(xué)習(xí)和開發(fā)工作。

    • 字節(jié)發(fā)布豆包1.5深度思考模型:“實(shí)拍級(jí)”圖像生成

      快科技4月17日消息,據(jù)報(bào)道,今日,在火山引擎AI創(chuàng)新巡展杭州站的現(xiàn)場(chǎng),字節(jié)跳動(dòng)旗下火山引擎總裁譚待正式發(fā)布了備受矚目的豆包1.5深度思考模型。譚待指出,豆包1.5深度思考模型在多個(gè)關(guān)鍵領(lǐng)域展現(xiàn)出卓越性能。在數(shù)學(xué)、編程、科學(xué)推理這類專業(yè)領(lǐng)域中,它能夠精準(zhǔn)高效地處理復(fù)雜問題;在創(chuàng)意寫作等通用任務(wù)方面,同樣表現(xiàn)出色。該模型采用MoE架構(gòu),總參數(shù)為200B,激?