无码在线播放二区|久久亚洲精品国产精品|无码视频在线观看一区二区|在线观看国产日韩亚洲中

<menu id="yw4o4"></menu>

<menu id="yw4o4"><em id="yw4o4"></em></menu>

<label id="zqpye"></label>

AI日報：Kimi全新音頻基礎(chǔ)模型Kimi-Audio；階躍星辰開源圖像編輯模型Step1X-Edit；?夸克AI框上線 “拍照問夸克”

2025-04-27 15:45 · 稿源：站長之家

歡迎來到【AI日報】欄目!這里是你每天探索人工智能世界的指南，每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點內(nèi)容，聚焦開發(fā)者，助你洞悉技術(shù)趨勢、了解創(chuàng)新AI產(chǎn)品應(yīng)用。

新鮮AI產(chǎn)品點擊了解:https://top.aibase.com/

1、Moonshot AI發(fā)布Kimi-Audio:開源音頻基礎(chǔ)模型樹立新標桿

Moonshot AI最近推出的Kimi-Audio是一款開源音頻基礎(chǔ)模型，旨在推動音頻理解、生成和交互技術(shù)的發(fā)展。該模型基于Qwen2.5-7B架構(gòu)，結(jié)合Whisper技術(shù)，支持多種音頻任務(wù)，如語音識別和音頻問答。憑借超過13億小時的多樣化音頻數(shù)據(jù)訓(xùn)練，Kimi-Audio在多項基準測試中表現(xiàn)出色，超越了現(xiàn)有模型。

【AiBase提要:】
?? Kimi-Audio具備強大的多功能音頻處理能力，支持語音識別、音頻問答等多項任務(wù)。
?? 該模型在超過13億小時的多樣化音頻數(shù)據(jù)上進行訓(xùn)練，展現(xiàn)了卓越的性能表現(xiàn)。
?? Kimi-Audio的開源策略降低了音頻AI技術(shù)的使用門檻，促進了全球AI技術(shù)的民主化進程。
詳情鏈接:https://github.com/MoonshotAI/Kimi-Audio

2、階躍星辰開源圖像生成模型Step1X-Edit:開源圖像編輯新標桿

Step1X-Edit是由Stepfun AI團隊推出的開源圖像編輯模型，結(jié)合了多模態(tài)大語言模型與擴散變換器，展現(xiàn)出強大的圖像生成能力。其開源特性和高性能表現(xiàn)吸引了業(yè)界的廣泛關(guān)注，尤其是在GEdit-Bench基準測試中表現(xiàn)優(yōu)異。該模型為內(nèi)容創(chuàng)作者和開發(fā)者提供了強大的工具，推動了圖像編輯技術(shù)的發(fā)展。

【AiBase提要:】
??: Step1X-Edit結(jié)合多模態(tài)大語言模型與擴散變換器，能高效生成高質(zhì)量圖像。
??: GEdit-Bench基準測試顯示其性能超越現(xiàn)有開源模型，接近閉源模型水平。
??: 開源特性為研究和開發(fā)提供了基礎(chǔ)，推動了圖像編輯技術(shù)的創(chuàng)新與普及。
詳情鏈接:https://huggingface.co/spaces/stepfun-ai/Step1X-Edit

3、夸克AI超級框升級上線“拍照問夸克”功能:啥都能答

阿里巴巴旗下的夸克AI超級框于4月25日推出了“拍照問夸克”功能，這一創(chuàng)新利用視覺理解和推理模型，能夠快速識別和理解用戶在現(xiàn)實生活中遇到的各種問題。用戶通過拍照可以獲取準確的信息和答案，涵蓋多個領(lǐng)域，包括文物講解、商品識別、健康分析等。

【AiBase提要:】
?? 新功能“拍照問夸克”基于視覺理解，能快速識別圖片中的內(nèi)容并提供相關(guān)信息。
?? 用戶可以通過上傳商品圖片直接跳轉(zhuǎn)到淘寶同款鏈接，提升購物體驗。
?? 該功能支持多種語言提問和翻譯，適用于旅行、健康、工作等多個場景。

4、國行版蘋果AI智能要來了?iOS18.5正式版預(yù)計5月份推送

蘋果公司即將在5月向中國用戶推送iOS18.5正式版更新，帶來備受關(guān)注的Apple智能功能。這一功能已在其他地區(qū)上線，中國用戶等待了近一個月。Apple智能是一套基于個人場景的AI系統(tǒng)，提供多樣化服務(wù)，包括照片消除和智能回復(fù)等。然而，只有iPhone15Pro系列及即將發(fā)布的iPhone16全系機型支持該功能，且用戶需確保設(shè)備有足夠的存儲空間。

【AiBase提要:】
?? Apple智能功能將于5月正式推送給中國用戶，標志著蘋果進入生成式AI時代。
?? 該功能包括照片消除、通知摘要和智能回復(fù)等多樣化服務(wù)，但僅支持iPhone15Pro及以上機型。
?? 用戶需確保設(shè)備至少有7GB可用存儲空間，這對部分用戶的存儲管理可能帶來挑戰(zhàn)。

5、谷歌AI發(fā)布601個真實世界的生成式AI應(yīng)用案例，涵蓋各行業(yè)

谷歌云最近發(fā)布了一份報告，展示了601個來自全球頂尖企業(yè)的生成式AI應(yīng)用案例，顯示出這一技術(shù)的快速發(fā)展和廣泛應(yīng)用。相比去年僅有的101個案例，增長了六倍，涵蓋了汽車、金融、醫(yī)療等多個行業(yè)。這些案例不僅突顯了生成式AI在運營和戰(zhàn)略中的重要性，還展示了其作為組織結(jié)構(gòu)一部分的潛力。

【AiBase提要:】
??601個生成式AI應(yīng)用案例展示了技術(shù)在各行業(yè)的廣泛應(yīng)用，較去年增長六倍。
?? AI代理分類清晰，展示了AI在客戶服務(wù)、內(nèi)部生產(chǎn)力和安全等方面的多重角色。
?? 各行業(yè)的實際應(yīng)用案例凸顯了生成式AI從實驗走向生產(chǎn)的重要趨勢。
詳情鏈接:https://cloud.google.com/transform/101-real-world-generative-ai-use-cases-from-industry-leaders

6、微軟發(fā)布全新Agent操作系統(tǒng)UFO2 ，深度整合Windows與智能自動化

微軟近期推出的UFO2版本在自動化領(lǐng)域帶來了顯著進步，特別是在與Windows系統(tǒng)的深度集成方面。新版本能夠直接調(diào)用Windows的原生API，極大提升了自動化任務(wù)的執(zhí)行效率。與OpenAI的Operator相比，UFO2在多個測試場景中的成功率明顯更高，尤其在處理復(fù)雜任務(wù)和跨應(yīng)用操作時表現(xiàn)出色。

【AiBase提要:】
?? UFO2與Windows系統(tǒng)深度集成，能直接調(diào)用原生API，提升自動化效率。
?? UFO2的自動化任務(wù)成功率顯著高于OpenAI的Operator，表現(xiàn)出色。
??? 新增的畫中畫模式實現(xiàn)自動化任務(wù)與用戶操作的隔離，提升用戶體驗。
詳情鏈接:https://github.com/microsoft/UFO?tab=readme-ov-file

7、OpenAI 推出 ChatGPT 新版本:更智能、更直觀的 GPT-4o

OpenAI 最近對其 ChatGPT 的 GPT-4o 版本進行了重要更新，重點在于如何更好地保存記憶以及提升在科學(xué)、技術(shù)、工程和數(shù)學(xué)（STEM）領(lǐng)域的技能。新版本旨在引導(dǎo)對話更有效地朝著富有成效的結(jié)果發(fā)展，同時提升模型的智能水平和人格特質(zhì)。盡管存在某些“光滑”過度的問題，OpenAI 承諾未來將進行改進。此外，開發(fā)者可以選擇新的 GPT-4.1系列，以獲得更穩(wěn)定的 API 體驗。

【AiBase提要:】
?? 更新的 GPT-4o 版本在記憶保存和 STEM 技能方面進行了優(yōu)化。
?? OpenAI 承認模型在某些情況下存在 “光滑” 過度的問題，未來將改進。
?? 開發(fā)者可選擇新推出的 GPT-4.1系列，以獲得更穩(wěn)定的 API 體驗。

8、Ema推新型語言模型EmaFusion:成本和準確性方面擊敗了 O3、Gemini

Ema公司推出了新型語言模型EmaFusion，聲稱在成本和準確性上超越了多款知名AI模型。EmaFusion采用“級聯(lián)”判斷系統(tǒng)，能夠動態(tài)平衡成本與準確性，并允許用戶根據(jù)任務(wù)需求進行微調(diào)。其準確率達到94.3%，運行成本顯著降低，成為企業(yè)AI發(fā)展的新選擇。

【AiBase提要:】
?? EmaFusion 的準確率達到94.3%，成本是市場平均水平的四分之一。
?? EmaFusion 能夠智能拆解復(fù)雜任務(wù)，并將其分配給最適合的 AI 模型。
?? Ema 正與 KPMG、Hitachi 等全球領(lǐng)軍企業(yè)合作，推動企業(yè) AI 的發(fā)展。
詳情鏈接:https://www.ema.co/emafusion

9、Liquid AI推出Hyena Edge，開創(chuàng)智能手機邊緣設(shè)備的新時代

Liquid AI近期推出了新型卷積模型Hyena Edge，旨在為智能手機及邊緣設(shè)備提供更高效的人工智能解決方案。該模型在計算效率和內(nèi)存使用上超越了傳統(tǒng)的Transformer++模型，尤其適合資源受限的環(huán)境。Hyena Edge在多個標準語言模型基準測試中表現(xiàn)出色，展示了自動化架構(gòu)設(shè)計的潛力，并計劃在未來開源，推動技術(shù)普及。

【AiBase提要:】
?? Hyena Edge 是Liquid AI公司推出的新型卷積模型，專為智能手機等邊緣設(shè)備設(shè)計。
?? 該模型在計算效率和內(nèi)存使用上優(yōu)于傳統(tǒng)的 Transformer++ 模型，適合資源受限的環(huán)境。
?? Hyena Edge 在多個標準語言模型基準測試中表現(xiàn)卓越，并計劃在未來開源以促進技術(shù)普及。
詳情鏈接:https://www.liquid.ai/research/convolutional-multi-hybrids-for-edge-devices

10、LemonAI 推出實時音視頻 AI 數(shù)字人模型 Slice Live

LemonAI 最近推出了其創(chuàng)新產(chǎn)品 Slice Live，這是一款全球首創(chuàng)的實時音視頻 AI 模型。用戶只需上傳一張照片，即可與虛擬角色進行實時視頻通話。Slice Live 采用先進的 Transformer 模型，以每秒25幀的速度渲染每個像素，確保畫面流暢且真實。該產(chǎn)品在娛樂和教育領(lǐng)域都展示了巨大的潛力，未來還將擴展到 AR、VR 和元宇宙應(yīng)用，同時重視用戶隱私和數(shù)據(jù)安全。

【AiBase提要:】
?? 用戶只需上傳一張照片，即可與虛擬角色進行實時視頻通話。
?? Slice Live 在娛樂和教育領(lǐng)域提供沉浸式互動體驗，帶來生動的學(xué)習(xí)內(nèi)容。
?? LemonAI 承諾持續(xù)探索隱私保護，確保用戶數(shù)據(jù)安全。

11、智譜與生數(shù)科技達成戰(zhàn)略合作專注大模型聯(lián)合創(chuàng)新

4月27日，清華大學(xué)旗下的智譜與生數(shù)科技宣布達成重大戰(zhàn)略合作，旨在通過雙方在大語言模型和多模態(tài)生成模型的技術(shù)積累，共同推進國產(chǎn)大模型的技術(shù)創(chuàng)新與產(chǎn)業(yè)落地。此次合作涵蓋聯(lián)合研發(fā)、產(chǎn)品聯(lián)動、解決方案整合等多個方面，雙方將聚焦多個行業(yè)，推動AI技術(shù)的應(yīng)用與發(fā)展，展示了國產(chǎn)大模型在技術(shù)創(chuàng)新和產(chǎn)業(yè)應(yīng)用方面的巨大潛力。

【AiBase提要:】
?? 智譜與生數(shù)科技將聯(lián)合研發(fā)大語言模型和多模態(tài)生成模型，推動技術(shù)創(chuàng)新。
?? 雙方的合作將整合各自的技術(shù)特長，打造更具競爭力的行業(yè)解決方案。
?? 合作將聚焦政企服務(wù)、文化旅游等領(lǐng)域，共同推動AI技術(shù)的規(guī)模化應(yīng)用。

12、寶馬中國宣布新車型接入DeepSeek 含5系、全新X3

寶馬中國在第三季度將推出搭載DeepSeek技術(shù)的新車型，標志著其在智能車載系統(tǒng)方面的重要進步。此技術(shù)將應(yīng)用于第九代操作系統(tǒng)的多款新車，增強車主與車輛的互動體驗。用戶可通過BMW智能個人助理以自然語言進行交流，系統(tǒng)能夠理解并響應(yīng)口語化指令，提供便捷的駕駛體驗。

【AiBase提要:】
?? 寶馬將在第三季度推出搭載DeepSeek技術(shù)的新車型，提升車載智能交互體驗。
??? 用戶可通過BMW智能個人助理以自然語言進行交流，系統(tǒng)能理解口語化指令。
?? DeepSeek技術(shù)旨在增強用戶與車輛的互動，提供更便捷的駕駛體驗。

（舉報）

相關(guān)推薦

關(guān)鍵詞：

薦秒殺同行！Kimi開源全新音頻基礎(chǔ)模型，橫掃十多項基準測試，總體性能第一

Kimi-Audio是一款開源的通用音頻基礎(chǔ)模型，在語音識別、音頻理解、音頻轉(zhuǎn)文本、語音對話等任務(wù)中表現(xiàn)優(yōu)異。該模型采用集成式架構(gòu)設(shè)計，包含音頻分詞器、音頻大模型和音頻去分詞器三大核心組件，支持多模態(tài)輸入處理。在十余項音頻基準測試中，Kimi-Audio均取得領(lǐng)先性能，如LibriSpeech ASR測試WER僅1.28%，VocalSound測試達94.85%。模型使用1300萬小時多語言音頻數(shù)據(jù)進行預(yù)訓(xùn)練，并構(gòu)建了自動處理流水線生成高質(zhì)量訓(xùn)練數(shù)據(jù)。評估結(jié)果顯示，Kimi-Audio在語音識別、音樂理解、語音情感分析等任務(wù)上全面超越同類模型，在OpenAudioBench和VoiceBench對話測試中也表現(xiàn)最佳。目前模型代碼、檢查點和評估工具包已在GitHub開源。

?音頻模型 ?語音識別 ?開源項目
薦AI日報：kimi宣布降價；OpenRouter發(fā)布免費模型Quasar Alpha；Midjourney V7重磅上線

歡迎來到【AI日報】欄目!這里是你每天探索人工智能世界的指南，每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點內(nèi)容，聚焦開發(fā)者，助你洞悉技術(shù)趨勢、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點擊了解:https://top.aibase.com/1、IDC:到2028年中國人工智能投資將突破1000億美元根據(jù)國際數(shù)據(jù)公司的預(yù)測，中國在人工智能領(lǐng)域的投資將顯著增長，預(yù)計到2028年總投資將突破1000億美元，年均復(fù)合增長率達到35.2%。

?人工智能 ?投資預(yù)測 ?生成式AI
AI日報：阿里騰訊全面支持MCP協(xié)議；階躍星辰多模態(tài)推理模型Step-R1-V-Mini；美圖WHEE圖像生成模型Miracle F1

歡迎來到【AI日報】欄目!這里是你每天探索人工智能世界的指南，每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點內(nèi)容，聚焦開發(fā)者，助你洞悉技術(shù)趨勢、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點擊了解:https://top.aibase.com/1、阿里巴巴已宣布全面支持MCP協(xié)議騰訊緊隨其后近日，中國人工智能領(lǐng)域迎來技術(shù)標準的變革，ModelContextProtocol成為國內(nèi)AI生態(tài)的事實標準。12.英偉達發(fā)布Llama3.1NemotronUltra253B，性能?

?人工智能 ?MCP協(xié)議 ?阿里巴巴
薦微信，OpenAI和Kimi想一起去了：大模型的盡頭依然還是社交平臺

AI圈最近彌漫著一股微妙的氣息。人們似乎不再熱議大語言模型的最新突破、以及AI應(yīng)用的無限可能時，一些代表著未來的AI巨頭，卻似乎正將目光投向互聯(lián)網(wǎng)那熟悉得不能再熟悉的角落——社交網(wǎng)絡(luò)與社區(qū)。近期的傳聞和動作頗具代表性，在大洋彼岸，手握ChatGPT和Sora等王牌的OpenAI，據(jù)稱正內(nèi)部測試類X的社交功能，其CEO Sam Altman甚至在私下征求反饋；而在國內(nèi)，憑借長文本能力

?AI社交網(wǎng)絡(luò) ?語言模型 ?OpenAI動態(tài)
“奧迪助手”來了！全新AUDI車型接入豆包大模型

2025年4月24日上海車展期間，上汽奧迪發(fā)布全新A5L Sportback和首款量產(chǎn)車型E5 Sportback。同時推出與火山引擎合作開發(fā)的"奧迪助手"智能交互系統(tǒng)，基于豆包大模型實現(xiàn)自然對話體驗。該系統(tǒng)將搭載于兩款新車，并同步部署在車載端和手機APP端，支持跨設(shè)備對話記錄同步?；鹕揭鏋橄到y(tǒng)提供大模型技術(shù)支持，實現(xiàn)語音指令控制、車輛功能講解等智能服務(wù)，并整合抖音、汽水音樂等內(nèi)容生態(tài)。上汽奧迪表示，該合作將助力品牌打造更智能、個性化的產(chǎn)品矩陣。

?上海國際車展 ?上汽奧迪 ?奧迪
薦AI日報：ChatGPT重磅上線圖像庫功能；白嫖！Veo2登陸谷歌AI Studio；螞蟻百寶箱推“MCP專區(qū)”

歡迎來到【AI日報】欄目!這里是你每天探索人工智能世界的指南，每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點內(nèi)容，聚焦開發(fā)者，助你洞悉技術(shù)趨勢、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點擊了解:https://top.aibase.com/1、報道稱字節(jié)跳動整合 AI 研發(fā)團隊，AI Lab 即將并入 Seed字節(jié)跳動正在進行AI研發(fā)團隊的整合，將獨立的字節(jié)AI Lab并入Seed團隊。這一舉措體現(xiàn)了字節(jié)在AI領(lǐng)域戰(zhàn)略布局的調(diào)整，旨在進?

?字節(jié)跳動 ?AI研發(fā) ?AI
重磅！傳月之暗面Kimi內(nèi)測內(nèi)容社區(qū)產(chǎn)品預(yù)計月底上線

快科技4月14日消息，今日，有媒體報道，月之暗面Kimi將推出首個內(nèi)容社區(qū)產(chǎn)品，目前正在進行灰度測試，預(yù)計本月底正式上線。這款產(chǎn)品于去年末啟動，之前一直維持小范圍測試狀態(tài)，是Kimi在用戶體驗上的最新嘗試。對于相關(guān)產(chǎn)品的具體信息，月之暗面已在規(guī)劃全新的內(nèi)容功能模塊，其定位類似于傳統(tǒng)內(nèi)容平臺的信息流模式。對于月之暗面來說，這一戰(zhàn)略布局不僅有望提升產(chǎn)

?月之暗面 ?Kimi智能助手 ?內(nèi)容社區(qū)產(chǎn)品
薦AI日報：小米首個推理大模型開源Xiaomi MiMo；快手上線AI筆記工具“喵記多”；騰訊拆分AI團隊

本文匯總了AI領(lǐng)域最新動態(tài)：1)小米開源70億參數(shù)大模型Xiaomi MiMo，在數(shù)學(xué)推理和代碼競賽中超越OpenAI和阿里模型；2)快手推出AI筆記工具"喵記多"，簡化筆記管理；3)Luma AI發(fā)布電影級鏡頭控制API，降低視頻生成門檻；4)騰訊重組AI團隊，加大語言模型研發(fā)投入；5)Anthropic為Claude引入新語音"Glassy"；6)谷歌NotebookLM新增50+語言音頻概述功能；7)xAI將發(fā)布Grok3.5模型；8)Meta推出獨立AI助手應(yīng)用挑戰(zhàn)ChatGPT；9)OpenAI緊急修復(fù)GPT-4o"諂媚"問題；10)Mac本地AI助手Simular升級隱私保護；11)CameraBench項目幫助AI理解鏡頭運動；12)谷歌推出個性化語言學(xué)習(xí)AI工具。

?人工智能 ?Xiaomi ?MiMo
薦AI日報：昆侖萬維開源Skywork-OR1系列模型；訊飛星辰Agent開發(fā)平臺全面支持MCP；字節(jié)跳動布局AI智能眼鏡

歡迎來到【AI日報】欄目!這里是你每天探索人工智能世界的指南，每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點內(nèi)容，聚焦開發(fā)者，助你洞悉技術(shù)趨勢、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點擊了解:https://top.aibase.com/1、Kimi開源視覺語言模型 Kimi-VL 與 Kimi-VL-Thinking，多項基準超越 GPT-4oMoonshot AI 最近開源了 Kimi-VL 和 Kimi-VL-Thinking 兩款視覺語言模型，展現(xiàn)出卓越的多模態(tài)理解與推理能力。這些模型采

?人工智能 ?視覺語言模型 ?Kimi-VL
可靈AI發(fā)布全新2.0模型：上線多模態(tài)視頻編輯功能

快科技4月16日消息，據(jù)報道，可靈AI在北京舉行靈感成真”2.0模型發(fā)布會，正式發(fā)布可靈2.0視頻生成模型及可圖2.0圖像生成模型。據(jù)介紹，可靈2.0模型在動態(tài)質(zhì)量、語義響應(yīng)、畫面美學(xué)等維度保持領(lǐng)先；可圖2.0模型在指令遵循、電影質(zhì)感及藝術(shù)風(fēng)格表現(xiàn)等方面顯著提升。3月27日，全球AI基準測試機構(gòu)Artificial Analysis發(fā)布了最新的全球視頻生成大模型榜單，快手可靈1.6pro（高品質(zhì)模

?可靈AI ?視頻生成模型 ?圖像生成模型

熱文

3 天
7天

站長商機

廣告

商務(wù)合作侵權(quán)投訴廣告服務(wù) 版權(quán)聲明招聘

?CopyRight 2002-2020 CHINAZ.COM

_{<li id="ascu2"></li>}