无码在线播放二区|久久亚洲精品国产精品|无码视频在线观看一区二区|在线观看国产日韩亚洲中

  • <menu id="yw4o4"></menu>
  • 
    <menu id="yw4o4"><em id="yw4o4"></em></menu>
  • 首頁 > 原創(chuàng) > 關(guān)鍵詞  > 人工智能最新資訊  > 正文

    AI日報:階躍星辰內(nèi)測視頻大模型Step-Video;即夢AI圖片2.1模型支持生成文字;騰訊發(fā)布混元視頻生成大模型

    2024-12-03 15:28 · 稿源:站長之家

    歡迎來到【AI日報】欄目!這里是你每天探索人工智能世界的指南,每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容,聚焦開發(fā)者,助你洞悉技術(shù)趨勢、了解創(chuàng)新AI產(chǎn)品應(yīng)用。

    新鮮AI產(chǎn)品點(diǎn)擊了解:https://top.aibase.com/

    1、階躍星辰視頻生成大模型Step-Video開啟內(nèi)測 可在躍問視頻申請

    階躍星辰的Step-Video模型正式開啟內(nèi)測,用戶可以通過躍問視頻官網(wǎng)申請資格。該模型支持從文本生成高達(dá)1080P分辨率、最長10秒的視頻,展現(xiàn)出在自動優(yōu)化提示詞、美學(xué)風(fēng)格和運(yùn)動控制方面的顯著優(yōu)勢。

    image.png

    【AiBase提要:】

    ?? Step-Video模型支持從文本生成高清視頻,分辨率高達(dá)1080P,最長可達(dá)10秒。

    ?? 在美學(xué)風(fēng)格上,Step-Video對中國風(fēng)題材的理解和生成尤為精準(zhǔn),符合古詩意境。

    ?? 該模型在運(yùn)動控制方面表現(xiàn)優(yōu)異,能夠生成符合物理規(guī)律的視頻,處理復(fù)雜的空間關(guān)系。

    詳情鏈接:https://top.aibase.com/tool/yuewenshipin

    2、Luma發(fā)布全新圖像生成模型Luma Photon,速度更快,成本更低!

    Luma Labs推出的Luma Photon和Photon Flash是兩款革命性的圖像生成模型,具有超高的生成速度和低成本優(yōu)勢。Luma Photon在多項(xiàng)測試中表現(xiàn)出色,能夠生成高質(zhì)量的圖像,適用于廣告、影視、藝術(shù)等多個領(lǐng)域。

    【AiBase提要:】

    ?? Luma Photon生成圖像速度是市場上其他模型的10倍,成本低至0.2美分每張1080p圖片。

    ?? 支持多輪自然語言指令,用戶可逐步優(yōu)化生成內(nèi)容,適合復(fù)雜創(chuàng)意任務(wù)。

    ?? 在質(zhì)量、創(chuàng)造力和理解力方面,Luma Photon在雙盲評估中超越市場上所有模型。

    詳情鏈接:https://lumalabs.ai/photon

    3、可靈AI導(dǎo)演共創(chuàng)計(jì)劃作品12月6日上線 將發(fā)布9部電影級AI視頻

    快手科技宣布將于12月6日正式上線中國首個AIGC導(dǎo)演共創(chuàng)計(jì)劃——“可靈AI導(dǎo)演共創(chuàng)計(jì)劃”。此計(jì)劃由快手自研的視頻生成大模型“可靈AI”聯(lián)合多位知名導(dǎo)演共同發(fā)起,旨在通過AI技術(shù)拓寬影視創(chuàng)作的邊界。

    image.png

    【AiBase提要:】

    ?? 計(jì)劃由快手科技與9位知名導(dǎo)演共同發(fā)起,涵蓋多元題材。

    ?? 所有短片將使用可靈AI進(jìn)行視頻生成,推動AI技術(shù)在影視創(chuàng)作中的應(yīng)用。

    ?? 可靈AI自發(fā)布以來已服務(wù)超500萬用戶,生成5100萬個視頻和1.5億張圖片。

    4、字節(jié)旗下即夢AI灰測圖片2.1模型 AI生圖終于可以出中文字體了!

    字節(jié)跳動旗下的即夢AI最近推出了圖片2.1模型,解決了AI圖像生成中文字體的問題。用戶只需簡單輸入文字描述,便可快速生成個性化海報,極大提高了設(shè)計(jì)師的工作效率。新模型的應(yīng)用場景廣泛,包括海報制作、書籍封面設(shè)計(jì)和社交媒體配圖。

    image.png

    【AiBase提要:】

    ?? 新模型支持中文字體生成,提升海報設(shè)計(jì)效率。

    ?? 用戶可通過文字描述創(chuàng)建個性化海報和封面。

    ?? 模型應(yīng)用場景廣泛,適用于社交媒體、故事創(chuàng)作等。

    詳情鏈接:https://top.aibase.com/tool/jimeng

    5、秘塔AI搜索:「學(xué)術(shù)搜索」數(shù)據(jù)增加7倍 新增”解釋“功能

    上海秘塔網(wǎng)絡(luò)科技有限公司最近對其AI秘塔學(xué)術(shù)搜索功能進(jìn)行了重大升級,數(shù)據(jù)量增加了7倍,用戶現(xiàn)在可以更全面地檢索到數(shù)千萬篇Open Access論文,包括40%的SCI論文及頂級期刊如《Nature》和《Science》。此次更新還新增了“解釋”功能,幫助用戶理解復(fù)雜的文獻(xiàn)內(nèi)容。

    微信截圖_20241203091022.png

    【AiBase提要:】

    ?? 數(shù)據(jù)量增加7倍,覆蓋數(shù)千萬篇Open Access論文,提升檢索能力。

    ?? 新增“解釋”功能,幫助用戶理解文獻(xiàn)中復(fù)雜的句子。

    ?? 支持44種語言的翻譯模型,消除小語種論文的閱讀障礙。

    6、李飛飛創(chuàng)業(yè)首秀:一張圖生成交互式3D 世界,AIGC 進(jìn)入全新時代!

    李飛飛的最新創(chuàng)業(yè)項(xiàng)目World Labs,帶來了顛覆性的3D生成技術(shù)。用戶只需提供一張圖片或一句話,就能創(chuàng)造出互動的3D場景,標(biāo)志著AIGC進(jìn)入全新的沉浸式時代。這項(xiàng)技術(shù)不僅能精準(zhǔn)還原細(xì)節(jié),還能模擬各種相機(jī)效果,賦予用戶導(dǎo)演般的控制感。

    【AiBase提要:】

    ??? 只需一張圖片或一句話,即可生成栩栩如生的3D場景,開啟全新交互體驗(yàn)。

    ?? 該技術(shù)支持模擬多種相機(jī)效果,讓用戶在3D世界中自由掌控鏡頭。

    ?? World Labs計(jì)劃持續(xù)提升3D世界的規(guī)模和精度,探索更多用戶互動方式。

    詳情鏈接:https://www.worldlabs.ai/blog

    7、告別語音克隆侵權(quán)!Hume AI推出語音控制功能,可創(chuàng)建個性化AI語音

    Hume AI最近推出了一項(xiàng)名為“語音控制”的實(shí)驗(yàn)性功能,使用戶能夠輕松創(chuàng)建個性化的AI聲音,無需任何編碼技能。該功能允許用戶通過滑塊調(diào)整聲音特征,提供多種維度的定制選項(xiàng),旨在滿足多樣化的應(yīng)用需求。

    image.png

    【AiBase提要:】

    ?? Hume AI推出“語音控制”功能,用戶可輕松創(chuàng)建個性化AI聲音。

    ??? 該功能無須編碼技能,用戶可以通過滑塊調(diào)整聲音特征。

    ?? Hume旨在通過個性化和情感智能的語音AI來滿足多樣化的應(yīng)用需求。

    詳情鏈接:https://www.hume.ai/blog/introducing-voice-control

    8、Cohere推新的搜索模型 Rerank3.5:可處理100多種語言精準(zhǔn)查詢

    Cohere最近推出的Rerank3.5搜索模型,標(biāo)志著企業(yè)數(shù)據(jù)檢索的重大進(jìn)步。該模型支持超過100種語言的查詢,尤其在阿拉伯語、日語和韓語等主要商業(yè)語言中表現(xiàn)出色,幫助跨國公司打破語言障礙。內(nèi)部測試顯示,Rerank3.5在金融服務(wù)領(lǐng)域的表現(xiàn)顯著提升,能夠節(jié)省成本并降低風(fēng)險。

    image.png

    【AiBase提要:】

    ?? Rerank3.5能夠處理100多種語言的查詢,幫助全球企業(yè)打破語言障礙。

    ?? 內(nèi)部測試顯示,該模型在金融服務(wù)領(lǐng)域的搜索表現(xiàn)大幅提升,能節(jié)省成本和降低風(fēng)險。

    ?? Cohere 通過主流云平臺的部署,力求成為企業(yè)搜索的行業(yè)標(biāo)準(zhǔn),同時企業(yè)需隨時適應(yīng)快速變化的 AI 環(huán)境。

    詳情鏈接:https://cohere.com/blog/rerank-3pt5

    9、OpenAI CFO 回應(yīng)廣告?zhèn)髀?當(dāng)前不考慮引入廣告模式

    OpenAI的首席財務(wù)官Sarah Friar在接受采訪時表示,當(dāng)前公司并無計(jì)劃引入廣告,盡管廣告收入對盈利公司來說是一個誘人的選擇。Friar提到,OpenAI正在快速增長,并在現(xiàn)有商業(yè)模式中發(fā)現(xiàn)了機(jī)會,未來可能會探索其他收入來源。

    【AiBase提要:】

    ?? OpenAI CFO Sarah Friar 表示當(dāng)前無意引入廣告,未來有可能探索其他收入來源。

    ?? OpenAI 招聘了多位廣告和市場營銷領(lǐng)域的專家,表明未來或?qū)⒖紤]廣告模式。

    ?? 公司高管頻繁變動,創(chuàng)始人 Sam Altman 依然在努力推動公司愿景。

    10、提到 “David Mayer”一詞ChatGPT就崩潰,這是什么神秘力量?

    最近,社交媒體上出現(xiàn)了一個讓人困惑的現(xiàn)象:OpenAI的聊天機(jī)器人ChatGPT在提到“David Mayer”時無法正常回應(yīng),并強(qiáng)制結(jié)束對話。這一現(xiàn)象引發(fā)了網(wǎng)友們的廣泛討論與猜測,許多人嘗試詢問ChatGPT有關(guān)“David Mayer”的信息,卻都遭遇了同樣的結(jié)局。

    image.png

    【AiBase提要:】

    ?? ChatGPT在提到“David Mayer”時無法回應(yīng),并強(qiáng)制結(jié)束對話。

    ?? “David Mayer”可能與法律問題有關(guān),涉及GDPR被遺忘權(quán)。

    ?? 其他姓名同樣會導(dǎo)致ChatGPT出現(xiàn)故障,凸顯AI模型的復(fù)雜性。

    11.WPS Office 推出 AI 語音速記功能

    WPS Office 近期發(fā)布了 AI 語音速記功能,增強(qiáng)了語音轉(zhuǎn)文字的體驗(yàn),支持實(shí)時錄音和多語言互譯。該功能通過聲紋識別和 AI 自動總結(jié)提升準(zhǔn)確性,并與 WPS 云文檔深度整合,確保用戶在錄音過程中能順利繼續(xù)錄音。用戶可在最新版本的 WPS Office 中輕松找到并使用此功能。

    微信截圖_20241203150637.png

    【AiBase 提要:】

    ??? 語音速記功能實(shí)現(xiàn)實(shí)時錄音與音頻轉(zhuǎn)文字。

    ?? 支持中英等多種語言的互譯功能。

    ?? 提供安全的文檔協(xié)作體驗(yàn),提升用戶便利性。

    12.騰訊發(fā)布混元視頻生成大模型: 130 億參數(shù)全面開源

    騰訊推出了混元視頻生成模型,擁有 130 億參數(shù),是當(dāng)前最大開源視頻生成模型。該模型支持高清、真實(shí)感視頻生成,適用于廣告和創(chuàng)意視頻等商業(yè)應(yīng)用。用戶可通過騰訊元寶 APP 和騰訊云接口進(jìn)行試用或?qū)?,降低了視頻生成的技術(shù)門檻,促進(jìn)了 AI 技術(shù)的普及。

    【AiBase 提要:】

    ?? 混元視頻生成模型具備超寫實(shí)質(zhì)感,適合多種商業(yè)場景使用。

    ?? 模型允許用戶細(xì)致刻畫生成內(nèi)容,提供高度語義遵循。

    ?? 開源模式推動了 AI 視頻生成技術(shù)的民主化,鼓勵創(chuàng)意與開發(fā)者創(chuàng)新。

    官網(wǎng):https://aivideo.hunyuan.tencent.com

    模型:https://huggingface.co/tencent/HunyuanVideo

    舉報

    • 相關(guān)推薦
    • AI日報:阿里騰訊全面支持MCP協(xié)議;階躍星辰多模態(tài)推理模型Step-R1-V-Mini;美WHEE圖像生成模型Miracle F1

      歡迎來到【AI日報】欄目!這里是你每天探索人工智能世界的指南,每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容,聚焦開發(fā)者,助你洞悉技術(shù)趨勢、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點(diǎn)擊了解:https://top.aibase.com/1、阿里巴巴已宣布全面支持MCP協(xié)議騰訊緊隨其后近日,中國人工智能領(lǐng)域迎來技術(shù)標(biāo)準(zhǔn)的變革,ModelContextProtocol成為國內(nèi)AI生態(tài)的事實(shí)標(biāo)準(zhǔn)。12.英偉達(dá)發(fā)布Llama3.1NemotronUltra253B,性能?

    • 視頻生成模型Vidu Q1怎么用?Vidu Q1官網(wǎng)是什么?

      國產(chǎn)視頻生成大模型Vidu Q1在性能、價格和功能上實(shí)現(xiàn)重大突破。該模型由生數(shù)科技推出,在VBench評測中超越Sora等國內(nèi)外頂尖模型,支持1080p高清視頻生成,每秒價格低至3毛錢。其首尾幀功能僅需兩張圖即可實(shí)現(xiàn)電影級運(yùn)鏡效果,支持多元風(fēng)格生成和48kHz高采樣率混音功能。Vidu Q1已深度賦能影視、廣告、動漫等行業(yè),大幅降低創(chuàng)作門檻。

    • AI日報:Kimi全新音頻基礎(chǔ)模型Kimi-Audio;階躍星辰開源像編輯模型Step1X-Edit;?夸克AI超級框上線 “拍照問夸克”

      本期AI日報聚焦多項(xiàng)AI技術(shù)突破與應(yīng)用:1)Moonshot AI推出開源音頻模型Kimi-Audio,基于13億小時訓(xùn)練數(shù)據(jù),支持語音識別等任務(wù);2)階躍星辰開源圖像編輯模型Step1X-Edit,展現(xiàn)強(qiáng)大生成能力;3)夸克AI上線"拍照問夸克"功能,實(shí)現(xiàn)視覺問答;4)蘋果iOS18.5將在中國推送,帶來智能功能;5)谷歌發(fā)布601個生成式AI應(yīng)用案例,覆蓋多行業(yè);6)微軟推出深度整合Windows的UFO2自動化系統(tǒng);7)OpenAI升級ChatGPT至GPT-4o版本,提升STEM領(lǐng)域能力;8)Ema公司推出高性價比語言模型EmaFusion;9)Liquid AI發(fā)布面向邊緣設(shè)備的Hyena Edge模型;10)LemonAI推出實(shí)時音視頻數(shù)字人產(chǎn)品Slice Live。此外,國內(nèi)方面,智譜與生數(shù)科技達(dá)成戰(zhàn)略合作推動大模型發(fā)展,寶馬中國宣布新車將接入DeepSeek技術(shù)。

    • AI日報:百度大招!發(fā)布文心大模型X1Turbo和AI開放計(jì)劃;OpenAI免費(fèi)開放輕量版Deep Research;即夢視頻3.0內(nèi)測

      【AI日報】主要報道了AI領(lǐng)域的最新動態(tài):1)百度發(fā)布文心大模型X1Turbo和4.5Turbo,性能價格優(yōu)勢顯著;2)百度推出AI開放計(jì)劃,降低開發(fā)者門檻;3)OpenAI免費(fèi)開放輕量版Deep Research研究工具;4)即夢視頻3.0內(nèi)測展示流暢運(yùn)鏡和精準(zhǔn)表情捕捉能力;5)百度發(fā)布全球首個內(nèi)容操作系統(tǒng)"滄舟OS";6)百度文庫與網(wǎng)盤聯(lián)合推出GenFlow超能搭子和AI筆記工具;7)Pixverse推出MCP協(xié)議簡化AI視頻創(chuàng)作;8)Tavus發(fā)布突破性唇形同步模型Hummingbird-0;9)豆包1.5深度思考模型上線,提供免費(fèi)額度;10)Adobe整合OpenAI和Google模型升級Firefly創(chuàng)意平臺;11)ImageSlider2.0即將加入Gradio核心產(chǎn)品線;12)李彥宏談DeepSeek現(xiàn)存痛點(diǎn),強(qiáng)調(diào)多模態(tài)能力與降本需求。

    • 阿里開源通義新模型:指定首尾圖片生成視頻

      快科技4月18日消息,據(jù)報道,阿里巴巴旗下通義萬相宣布開源其創(chuàng)新視頻生成技術(shù)首尾幀生視頻14B模型。這項(xiàng)突破性AI技術(shù)能夠根據(jù)用戶提供的起始和結(jié)束畫面,智能生成720p高清過渡視頻,為視頻創(chuàng)作帶來全新可能。該模型通過先進(jìn)的深度學(xué)習(xí)算法,能夠精準(zhǔn)理解輸入畫面的內(nèi)容、風(fēng)格及主題特征。當(dāng)用戶提供首尾兩幀圖像后,模型會智能分析畫面中的視覺元素,包括物體形?

    • AI日報即夢3.0內(nèi)測直出2K商業(yè)海報;ChatGPT又更新圖片生成功能;餓了么推“AI入駐智能經(jīng)理”

      歡迎來到【AI日報】欄目!這里是你每天探索人工智能世界的指南,每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容,聚焦開發(fā)者,助你洞悉技術(shù)趨勢、了解創(chuàng)新AI產(chǎn)品應(yīng)用。7、Genspark發(fā)布自動化AI代理SuperAgent具備自主思考、調(diào)用工具的能力Genspark最近推出了其全新的自動化AI代理SuperAgent,憑借其強(qiáng)大的自主思考和任務(wù)執(zhí)行能力,迅速成為行業(yè)的焦點(diǎn)。用戶只需輸入感興趣的主題,系統(tǒng)便能?

    • AI 大模型的困境:數(shù)據(jù)才是真正的“燃料”

      一旦掉入AI墳場,幻覺將永遠(yuǎn)存在,噩夢才剛開始。最近有許多客戶在考慮上AI大模型一體機(jī)、AI私有化、AI大模型部署等項(xiàng)目,但小心進(jìn)入AI大模型的墳場,在光鮮亮麗的背后,AI大模型也面臨著諸多困境,其中最為核心的問題便是數(shù)據(jù)。只有擁有高質(zhì)量、多樣化、易于管理的數(shù)據(jù),AI大模型才能發(fā)揮出其真正的潛力,為企業(yè)帶來更大的價值。

    • 谷歌Gemini整合Veo 2視頻生成模型,8秒720P視頻輕松搞定

      谷歌宣布又有一款 AI 模型將加入 Gemini,但這次它不僅僅是一個聊天機(jī)器人。

    • 阿丘科技李嘉悅:大模型驅(qū)動的AI檢測范式變革——大模型、小模型、智能體的協(xié)同進(jìn)化

      3月28日,由機(jī)器視覺產(chǎn)業(yè)聯(lián)盟主辦、慕尼黑展覽有限公司承辦的VisionChina2025機(jī)器視覺展在上海新國際博覽中心圓滿落幕。阿丘科技產(chǎn)品總監(jiān)李嘉悅在機(jī)器視覺及工業(yè)應(yīng)用研討會現(xiàn)場,圍繞“大模型驅(qū)動的AI檢測范式變革:大模型、小模型與智能體的協(xié)同進(jìn)化”的主題,發(fā)表了精彩演講?!苯衲?,在這個快速變化的時代,我要補(bǔ)充一句:“AI工業(yè)視覺的格局正在加速變革,不會用大模型的將會被善用大模型的人淘汰。

    • AI日報:小米首個推理大模型開源Xiaomi MiMo;快手上線AI筆記工具“喵記多”;騰訊拆分AI團(tuán)隊(duì)

      本文匯總了AI領(lǐng)域最新動態(tài):1)小米開源70億參數(shù)大模型Xiaomi MiMo,在數(shù)學(xué)推理和代碼競賽中超越OpenAI和阿里模型;2)快手推出AI筆記工具"喵記多",簡化筆記管理;3)Luma AI發(fā)布電影級鏡頭控制API,降低視頻生成門檻;4)騰訊重組AI團(tuán)隊(duì),加大語言模型研發(fā)投入;5)Anthropic為Claude引入新語音"Glassy";6)谷歌NotebookLM新增50+語言音頻概述功能;7)xAI將發(fā)布Grok3.5模型;8)Meta推出獨(dú)立AI助手應(yīng)用挑戰(zhàn)ChatGPT;9)OpenAI緊急修復(fù)GPT-4o"諂媚"問題;10)Mac本地AI助手Simular升級隱私保護(hù);11)CameraBench項(xiàng)目幫助AI理解鏡頭運(yùn)動;12)谷歌推出個性化語言學(xué)習(xí)AI工具。