无码在线播放二区|久久亚洲精品国产精品|无码视频在线观看一区二区|在线观看国产日韩亚洲中

<menu id="yw4o4"></menu>

<menu id="yw4o4"><em id="yw4o4"></em></menu>

<menu id="ke60w"></menu>

<pre id="ke60w"></pre>

<tfoot id="ke60w"><tbody id="ke60w"></tbody></tfoot>

AI日報：階躍星辰內(nèi)測視頻大模型Step-Video；即夢AI圖片2.1模型支持生成文字；騰訊發(fā)布混元視頻生成大模型

2024-12-03 15:28 · 稿源：站長之家

歡迎來到【AI日報】欄目!這里是你每天探索人工智能世界的指南，每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容，聚焦開發(fā)者，助你洞悉技術(shù)趨勢、了解創(chuàng)新AI產(chǎn)品應(yīng)用。

新鮮AI產(chǎn)品點(diǎn)擊了解:https://top.aibase.com/

1、階躍星辰視頻生成大模型Step-Video開啟內(nèi)測可在躍問視頻申請

階躍星辰的Step-Video模型正式開啟內(nèi)測，用戶可以通過躍問視頻官網(wǎng)申請資格。該模型支持從文本生成高達(dá)1080P分辨率、最長10秒的視頻，展現(xiàn)出在自動優(yōu)化提示詞、美學(xué)風(fēng)格和運(yùn)動控制方面的顯著優(yōu)勢。

【AiBase提要:】
?? Step-Video模型支持從文本生成高清視頻，分辨率高達(dá)1080P，最長可達(dá)10秒。
?? 在美學(xué)風(fēng)格上，Step-Video對中國風(fēng)題材的理解和生成尤為精準(zhǔn)，符合古詩意境。
?? 該模型在運(yùn)動控制方面表現(xiàn)優(yōu)異，能夠生成符合物理規(guī)律的視頻，處理復(fù)雜的空間關(guān)系。
詳情鏈接:https://top.aibase.com/tool/yuewenshipin

2、Luma發(fā)布全新圖像生成模型Luma Photon，速度更快，成本更低!

Luma Labs推出的Luma Photon和Photon Flash是兩款革命性的圖像生成模型，具有超高的生成速度和低成本優(yōu)勢。Luma Photon在多項(xiàng)測試中表現(xiàn)出色，能夠生成高質(zhì)量的圖像，適用于廣告、影視、藝術(shù)等多個領(lǐng)域。

【AiBase提要:】
?? Luma Photon生成圖像速度是市場上其他模型的10倍，成本低至0.2美分每張1080p圖片。
?? 支持多輪自然語言指令，用戶可逐步優(yōu)化生成內(nèi)容，適合復(fù)雜創(chuàng)意任務(wù)。
?? 在質(zhì)量、創(chuàng)造力和理解力方面，Luma Photon在雙盲評估中超越市場上所有模型。
詳情鏈接:https://lumalabs.ai/photon

3、可靈AI導(dǎo)演共創(chuàng)計(jì)劃作品12月6日上線將發(fā)布9部電影級AI視頻

快手科技宣布將于12月6日正式上線中國首個AIGC導(dǎo)演共創(chuàng)計(jì)劃——“可靈AI導(dǎo)演共創(chuàng)計(jì)劃”。此計(jì)劃由快手自研的視頻生成大模型“可靈AI”聯(lián)合多位知名導(dǎo)演共同發(fā)起，旨在通過AI技術(shù)拓寬影視創(chuàng)作的邊界。

【AiBase提要:】
?? 計(jì)劃由快手科技與9位知名導(dǎo)演共同發(fā)起，涵蓋多元題材。
?? 所有短片將使用可靈AI進(jìn)行視頻生成，推動AI技術(shù)在影視創(chuàng)作中的應(yīng)用。
?? 可靈AI自發(fā)布以來已服務(wù)超500萬用戶，生成5100萬個視頻和1.5億張圖片。

4、字節(jié)旗下即夢AI灰測圖片2.1模型 AI生圖終于可以出中文字體了!

字節(jié)跳動旗下的即夢AI最近推出了圖片2.1模型，解決了AI圖像生成中文字體的問題。用戶只需簡單輸入文字描述，便可快速生成個性化海報，極大提高了設(shè)計(jì)師的工作效率。新模型的應(yīng)用場景廣泛，包括海報制作、書籍封面設(shè)計(jì)和社交媒體配圖。

【AiBase提要:】
?? 新模型支持中文字體生成，提升海報設(shè)計(jì)效率。
?? 用戶可通過文字描述創(chuàng)建個性化海報和封面。
?? 模型應(yīng)用場景廣泛，適用于社交媒體、故事創(chuàng)作等。
詳情鏈接:https://top.aibase.com/tool/jimeng

5、秘塔AI搜索:「學(xué)術(shù)搜索」數(shù)據(jù)增加7倍新增”解釋“功能

上海秘塔網(wǎng)絡(luò)科技有限公司最近對其AI秘塔學(xué)術(shù)搜索功能進(jìn)行了重大升級，數(shù)據(jù)量增加了7倍，用戶現(xiàn)在可以更全面地檢索到數(shù)千萬篇Open Access論文，包括40%的SCI論文及頂級期刊如《Nature》和《Science》。此次更新還新增了“解釋”功能，幫助用戶理解復(fù)雜的文獻(xiàn)內(nèi)容。

微信截圖_20241203091022.png

【AiBase提要:】
?? 數(shù)據(jù)量增加7倍，覆蓋數(shù)千萬篇Open Access論文，提升檢索能力。
?? 新增“解釋”功能，幫助用戶理解文獻(xiàn)中復(fù)雜的句子。
?? 支持44種語言的翻譯模型，消除小語種論文的閱讀障礙。

6、李飛飛創(chuàng)業(yè)首秀:一張圖生成交互式3D 世界，AIGC 進(jìn)入全新時代!

李飛飛的最新創(chuàng)業(yè)項(xiàng)目World Labs，帶來了顛覆性的3D生成技術(shù)。用戶只需提供一張圖片或一句話，就能創(chuàng)造出互動的3D場景，標(biāo)志著AIGC進(jìn)入全新的沉浸式時代。這項(xiàng)技術(shù)不僅能精準(zhǔn)還原細(xì)節(jié)，還能模擬各種相機(jī)效果，賦予用戶導(dǎo)演般的控制感。

【AiBase提要:】
??? 只需一張圖片或一句話，即可生成栩栩如生的3D場景，開啟全新交互體驗(yàn)。
?? 該技術(shù)支持模擬多種相機(jī)效果，讓用戶在3D世界中自由掌控鏡頭。
?? World Labs計(jì)劃持續(xù)提升3D世界的規(guī)模和精度，探索更多用戶互動方式。
詳情鏈接:https://www.worldlabs.ai/blog

7、告別語音克隆侵權(quán)!Hume AI推出語音控制功能，可創(chuàng)建個性化AI語音

Hume AI最近推出了一項(xiàng)名為“語音控制”的實(shí)驗(yàn)性功能，使用戶能夠輕松創(chuàng)建個性化的AI聲音，無需任何編碼技能。該功能允許用戶通過滑塊調(diào)整聲音特征，提供多種維度的定制選項(xiàng)，旨在滿足多樣化的應(yīng)用需求。

【AiBase提要:】
?? Hume AI推出“語音控制”功能，用戶可輕松創(chuàng)建個性化AI聲音。
??? 該功能無須編碼技能，用戶可以通過滑塊調(diào)整聲音特征。
?? Hume旨在通過個性化和情感智能的語音AI來滿足多樣化的應(yīng)用需求。
詳情鏈接:https://www.hume.ai/blog/introducing-voice-control

8、Cohere推新的搜索模型 Rerank3.5:可處理100多種語言精準(zhǔn)查詢

Cohere最近推出的Rerank3.5搜索模型，標(biāo)志著企業(yè)數(shù)據(jù)檢索的重大進(jìn)步。該模型支持超過100種語言的查詢，尤其在阿拉伯語、日語和韓語等主要商業(yè)語言中表現(xiàn)出色，幫助跨國公司打破語言障礙。內(nèi)部測試顯示，Rerank3.5在金融服務(wù)領(lǐng)域的表現(xiàn)顯著提升，能夠節(jié)省成本并降低風(fēng)險。

【AiBase提要:】
?? Rerank3.5能夠處理100多種語言的查詢，幫助全球企業(yè)打破語言障礙。
?? 內(nèi)部測試顯示，該模型在金融服務(wù)領(lǐng)域的搜索表現(xiàn)大幅提升，能節(jié)省成本和降低風(fēng)險。
?? Cohere 通過主流云平臺的部署，力求成為企業(yè)搜索的行業(yè)標(biāo)準(zhǔn)，同時企業(yè)需隨時適應(yīng)快速變化的 AI 環(huán)境。
詳情鏈接:https://cohere.com/blog/rerank-3pt5

9、OpenAI CFO 回應(yīng)廣告?zhèn)髀?當(dāng)前不考慮引入廣告模式

OpenAI的首席財務(wù)官Sarah Friar在接受采訪時表示，當(dāng)前公司并無計(jì)劃引入廣告，盡管廣告收入對盈利公司來說是一個誘人的選擇。Friar提到，OpenAI正在快速增長，并在現(xiàn)有商業(yè)模式中發(fā)現(xiàn)了機(jī)會，未來可能會探索其他收入來源。

【AiBase提要:】
?? OpenAI CFO Sarah Friar 表示當(dāng)前無意引入廣告，未來有可能探索其他收入來源。
?? OpenAI 招聘了多位廣告和市場營銷領(lǐng)域的專家，表明未來或?qū)⒖紤]廣告模式。
?? 公司高管頻繁變動，創(chuàng)始人 Sam Altman 依然在努力推動公司愿景。

10、提到 “David Mayer”一詞ChatGPT就崩潰，這是什么神秘力量?

最近，社交媒體上出現(xiàn)了一個讓人困惑的現(xiàn)象:OpenAI的聊天機(jī)器人ChatGPT在提到“David Mayer”時無法正常回應(yīng)，并強(qiáng)制結(jié)束對話。這一現(xiàn)象引發(fā)了網(wǎng)友們的廣泛討論與猜測，許多人嘗試詢問ChatGPT有關(guān)“David Mayer”的信息，卻都遭遇了同樣的結(jié)局。

【AiBase提要:】
?? ChatGPT在提到“David Mayer”時無法回應(yīng)，并強(qiáng)制結(jié)束對話。
?? “David Mayer”可能與法律問題有關(guān)，涉及GDPR被遺忘權(quán)。
?? 其他姓名同樣會導(dǎo)致ChatGPT出現(xiàn)故障，凸顯AI模型的復(fù)雜性。

11.WPS Office 推出 AI 語音速記功能

WPS Office 近期發(fā)布了 AI 語音速記功能，增強(qiáng)了語音轉(zhuǎn)文字的體驗(yàn)，支持實(shí)時錄音和多語言互譯。該功能通過聲紋識別和 AI 自動總結(jié)提升準(zhǔn)確性，并與 WPS 云文檔深度整合，確保用戶在錄音過程中能順利繼續(xù)錄音。用戶可在最新版本的 WPS Office 中輕松找到并使用此功能。

微信截圖_20241203150637.png

【AiBase 提要:】
??? 語音速記功能實(shí)現(xiàn)實(shí)時錄音與音頻轉(zhuǎn)文字。
?? 支持中英等多種語言的互譯功能。
?? 提供安全的文檔協(xié)作體驗(yàn)，提升用戶便利性。

12.騰訊發(fā)布混元視頻生成大模型： 130 億參數(shù)全面開源

騰訊推出了混元視頻生成模型，擁有 130 億參數(shù)，是當(dāng)前最大開源視頻生成模型。該模型支持高清、真實(shí)感視頻生成，適用于廣告和創(chuàng)意視頻等商業(yè)應(yīng)用。用戶可通過騰訊元寶 APP 和騰訊云接口進(jìn)行試用或?qū)?，降低了視頻生成的技術(shù)門檻，促進(jìn)了 AI 技術(shù)的普及。

【AiBase 提要：】
?? 混元視頻生成模型具備超寫實(shí)質(zhì)感，適合多種商業(yè)場景使用。
?? 模型允許用戶細(xì)致刻畫生成內(nèi)容，提供高度語義遵循。
?? 開源模式推動了 AI 視頻生成技術(shù)的民主化，鼓勵創(chuàng)意與開發(fā)者創(chuàng)新。
官網(wǎng)：https://aivideo.hunyuan.tencent.com
模型：https://huggingface.co/tencent/HunyuanVideo

（舉報）

相關(guān)推薦

關(guān)鍵詞：

AI日報：阿里騰訊全面支持MCP協(xié)議；階躍星辰多模態(tài)推理模型Step-R1-V-Mini；美圖WHEE圖像生成模型Miracle F1

歡迎來到【AI日報】欄目!這里是你每天探索人工智能世界的指南，每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容，聚焦開發(fā)者，助你洞悉技術(shù)趨勢、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點(diǎn)擊了解:https://top.aibase.com/1、阿里巴巴已宣布全面支持MCP協(xié)議騰訊緊隨其后近日，中國人工智能領(lǐng)域迎來技術(shù)標(biāo)準(zhǔn)的變革，ModelContextProtocol成為國內(nèi)AI生態(tài)的事實(shí)標(biāo)準(zhǔn)。12.英偉達(dá)發(fā)布Llama3.1NemotronUltra253B，性能?

?人工智能 ?MCP協(xié)議 ?阿里巴巴
視頻生成模型Vidu Q1怎么用？Vidu Q1官網(wǎng)是什么？

國產(chǎn)視頻生成大模型Vidu Q1在性能、價格和功能上實(shí)現(xiàn)重大突破。該模型由生數(shù)科技推出，在VBench評測中超越Sora等國內(nèi)外頂尖模型，支持1080p高清視頻生成，每秒價格低至3毛錢。其首尾幀功能僅需兩張圖即可實(shí)現(xiàn)電影級運(yùn)鏡效果，支持多元風(fēng)格生成和48kHz高采樣率混音功能。Vidu Q1已深度賦能影視、廣告、動漫等行業(yè)，大幅降低創(chuàng)作門檻。

?國產(chǎn)視頻生成 ?Vidu ?Q1
薦AI日報：Kimi全新音頻基礎(chǔ)模型Kimi-Audio；階躍星辰開源圖像編輯模型Step1X-Edit；?夸克AI超級框上線 “拍照問夸克”

本期AI日報聚焦多項(xiàng)AI技術(shù)突破與應(yīng)用：1)Moonshot AI推出開源音頻模型Kimi-Audio，基于13億小時訓(xùn)練數(shù)據(jù)，支持語音識別等任務(wù)；2)階躍星辰開源圖像編輯模型Step1X-Edit，展現(xiàn)強(qiáng)大生成能力；3)夸克AI上線"拍照問夸克"功能，實(shí)現(xiàn)視覺問答；4)蘋果iOS18.5將在中國推送，帶來智能功能；5)谷歌發(fā)布601個生成式AI應(yīng)用案例，覆蓋多行業(yè)；6)微軟推出深度整合Windows的UFO2自動化系統(tǒng)；7)OpenAI升級ChatGPT至GPT-4o版本，提升STEM領(lǐng)域能力；8)Ema公司推出高性價比語言模型EmaFusion；9)Liquid AI發(fā)布面向邊緣設(shè)備的Hyena Edge模型；10)LemonAI推出實(shí)時音視頻數(shù)字人產(chǎn)品Slice Live。此外，國內(nèi)方面，智譜與生數(shù)科技達(dá)成戰(zhàn)略合作推動大模型發(fā)展，寶馬中國宣布新車將接入DeepSeek技術(shù)。

?AI日報 ?音頻技術(shù) ?開源模型
薦AI日報：百度大招！發(fā)布文心大模型X1Turbo和AI開放計(jì)劃；OpenAI免費(fèi)開放輕量版Deep Research；即夢視頻3.0內(nèi)測

【AI日報】主要報道了AI領(lǐng)域的最新動態(tài)：1)百度發(fā)布文心大模型X1Turbo和4.5Turbo，性能價格優(yōu)勢顯著；2)百度推出AI開放計(jì)劃，降低開發(fā)者門檻；3)OpenAI免費(fèi)開放輕量版Deep Research研究工具；4)即夢視頻3.0內(nèi)測展示流暢運(yùn)鏡和精準(zhǔn)表情捕捉能力；5)百度發(fā)布全球首個內(nèi)容操作系統(tǒng)"滄舟OS"；6)百度文庫與網(wǎng)盤聯(lián)合推出GenFlow超能搭子和AI筆記工具；7)Pixverse推出MCP協(xié)議簡化AI視頻創(chuàng)作；8)Tavus發(fā)布突破性唇形同步模型Hummingbird-0；9)豆包1.5深度思考模型上線，提供免費(fèi)額度；10)Adobe整合OpenAI和Google模型升級Firefly創(chuàng)意平臺；11)ImageSlider2.0即將加入Gradio核心產(chǎn)品線；12)李彥宏談DeepSeek現(xiàn)存痛點(diǎn)，強(qiáng)調(diào)多模態(tài)能力與降本需求。

?AI日報 ?人工智能 ?文心大模型
阿里開源通義新模型：指定首尾圖片生成視頻

快科技4月18日消息，據(jù)報道，阿里巴巴旗下通義萬相宣布開源其創(chuàng)新視頻生成技術(shù)首尾幀生視頻14B模型。這項(xiàng)突破性AI技術(shù)能夠根據(jù)用戶提供的起始和結(jié)束畫面，智能生成720p高清過渡視頻，為視頻創(chuàng)作帶來全新可能。該模型通過先進(jìn)的深度學(xué)習(xí)算法，能夠精準(zhǔn)理解輸入畫面的內(nèi)容、風(fēng)格及主題特征。當(dāng)用戶提供首尾兩幀圖像后，模型會智能分析畫面中的視覺元素，包括物體形?

?阿里巴巴 ?通義萬相 ?視頻生成技術(shù)
AI日報：即夢3.0內(nèi)測直出2K商業(yè)海報；ChatGPT又更新圖片生成功能；餓了么推“AI入駐智能經(jīng)理”

歡迎來到【AI日報】欄目!這里是你每天探索人工智能世界的指南，每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容，聚焦開發(fā)者，助你洞悉技術(shù)趨勢、了解創(chuàng)新AI產(chǎn)品應(yīng)用。7、Genspark發(fā)布自動化AI代理SuperAgent具備自主思考、調(diào)用工具的能力Genspark最近推出了其全新的自動化AI代理SuperAgent，憑借其強(qiáng)大的自主思考和任務(wù)執(zhí)行能力，迅速成為行業(yè)的焦點(diǎn)。用戶只需輸入感興趣的主題，系統(tǒng)便能?

?人工智能 ?圖像生成 ?AI產(chǎn)品
AI 大模型的困境：數(shù)據(jù)才是真正的“燃料”

一旦掉入AI墳場，幻覺將永遠(yuǎn)存在，噩夢才剛開始。最近有許多客戶在考慮上AI大模型一體機(jī)、AI私有化、AI大模型部署等項(xiàng)目，但小心進(jìn)入AI大模型的墳場，在光鮮亮麗的背后，AI大模型也面臨著諸多困境，其中最為核心的問題便是數(shù)據(jù)。只有擁有高質(zhì)量、多樣化、易于管理的數(shù)據(jù)，AI大模型才能發(fā)揮出其真正的潛力，為企業(yè)帶來更大的價值。

?AI ?大模型 ?數(shù)據(jù)質(zhì)量
谷歌Gemini整合Veo 2視頻生成模型，8秒720P視頻輕松搞定

谷歌宣布又有一款 AI 模型將加入 Gemini，但這次它不僅僅是一個聊天機(jī)器人。

?谷歌 ?谷歌gemini ?veo2
阿丘科技李嘉悅：大模型驅(qū)動的AI檢測范式變革——大模型、小模型、智能體的協(xié)同進(jìn)化

3月28日，由機(jī)器視覺產(chǎn)業(yè)聯(lián)盟主辦、慕尼黑展覽有限公司承辦的VisionChina2025機(jī)器視覺展在上海新國際博覽中心圓滿落幕。阿丘科技產(chǎn)品總監(jiān)李嘉悅在機(jī)器視覺及工業(yè)應(yīng)用研討會現(xiàn)場，圍繞“大模型驅(qū)動的AI檢測范式變革:大模型、小模型與智能體的協(xié)同進(jìn)化”的主題，發(fā)表了精彩演講?！苯衲?，在這個快速變化的時代，我要補(bǔ)充一句:“AI工業(yè)視覺的格局正在加速變革，不會用大模型的將會被善用大模型的人淘汰。

?機(jī)器視覺 ?AI檢測 ?工業(yè)應(yīng)用
薦AI日報：小米首個推理大模型開源Xiaomi MiMo；快手上線AI筆記工具“喵記多”；騰訊拆分AI團(tuán)隊(duì)

本文匯總了AI領(lǐng)域最新動態(tài)：1)小米開源70億參數(shù)大模型Xiaomi MiMo，在數(shù)學(xué)推理和代碼競賽中超越OpenAI和阿里模型；2)快手推出AI筆記工具"喵記多"，簡化筆記管理；3)Luma AI發(fā)布電影級鏡頭控制API，降低視頻生成門檻；4)騰訊重組AI團(tuán)隊(duì)，加大語言模型研發(fā)投入；5)Anthropic為Claude引入新語音"Glassy"；6)谷歌NotebookLM新增50+語言音頻概述功能；7)xAI將發(fā)布Grok3.5模型；8)Meta推出獨(dú)立AI助手應(yīng)用挑戰(zhàn)ChatGPT；9)OpenAI緊急修復(fù)GPT-4o"諂媚"問題；10)Mac本地AI助手Simular升級隱私保護(hù)；11)CameraBench項(xiàng)目幫助AI理解鏡頭運(yùn)動；12)谷歌推出個性化語言學(xué)習(xí)AI工具。

?人工智能 ?Xiaomi ?MiMo

熱文

3 天
7天

站長商機(jī)

廣告

商務(wù)合作侵權(quán)投訴廣告服務(wù) 版權(quán)聲明招聘

?CopyRight 2002-2020 CHINAZ.COM

<fieldset id="40wyy"><abbr id="40wyy"></abbr></fieldset>

<tbody id="40wyy"></tbody><tfoot id="40wyy"><abbr id="40wyy"></abbr></tfoot>

<nav id="40wyy"></nav>