无码在线播放二区|久久亚洲精品国产精品|无码视频在线观看一区二区|在线观看国产日韩亚洲中

  • <menu id="yw4o4"></menu>
  • 
    <menu id="yw4o4"><em id="yw4o4"></em></menu>
  • 首頁 > 原創(chuàng) > 關(guān)鍵詞  > AI日報最新資訊  > 正文

    AI日報:Kimi全新音頻基礎(chǔ)模型Kimi-Audio;階躍星辰開源圖像編輯模型Step1X-Edit;?夸克AI框上線 “拍照問夸克”

    2025-04-27 15:45 · 稿源:站長之家

    歡迎來到【AI日報】欄目!這里是你每天探索人工智能世界的指南,每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點內(nèi)容,聚焦開發(fā)者,助你洞悉技術(shù)趨勢、了解創(chuàng)新AI產(chǎn)品應(yīng)用。

    新鮮AI產(chǎn)品點擊了解:https://top.aibase.com/

    1、Moonshot AI發(fā)布Kimi-Audio:開源音頻基礎(chǔ)模型樹立新標桿

    Moonshot AI最近推出的Kimi-Audio是一款開源音頻基礎(chǔ)模型,旨在推動音頻理解、生成和交互技術(shù)的發(fā)展。該模型基于Qwen2.5-7B架構(gòu),結(jié)合Whisper技術(shù),支持多種音頻任務(wù),如語音識別和音頻問答。憑借超過13億小時的多樣化音頻數(shù)據(jù)訓(xùn)練,Kimi-Audio在多項基準測試中表現(xiàn)出色,超越了現(xiàn)有模型。

    QQ20250427-090033.png

    【AiBase提要:】

    ?? Kimi-Audio具備強大的多功能音頻處理能力,支持語音識別、音頻問答等多項任務(wù)。

    ?? 該模型在超過13億小時的多樣化音頻數(shù)據(jù)上進行訓(xùn)練,展現(xiàn)了卓越的性能表現(xiàn)。

    ?? Kimi-Audio的開源策略降低了音頻AI技術(shù)的使用門檻,促進了全球AI技術(shù)的民主化進程。

    詳情鏈接:https://github.com/MoonshotAI/Kimi-Audio

    2、階躍星辰開源圖像生成模型Step1X-Edit:開源圖像編輯新標桿

    Step1X-Edit是由Stepfun AI團隊推出的開源圖像編輯模型,結(jié)合了多模態(tài)大語言模型與擴散變換器,展現(xiàn)出強大的圖像生成能力。其開源特性和高性能表現(xiàn)吸引了業(yè)界的廣泛關(guān)注,尤其是在GEdit-Bench基準測試中表現(xiàn)優(yōu)異。該模型為內(nèi)容創(chuàng)作者和開發(fā)者提供了強大的工具,推動了圖像編輯技術(shù)的發(fā)展。

    QQ_1745715180413.png

    【AiBase提要:】

    ??: Step1X-Edit結(jié)合多模態(tài)大語言模型與擴散變換器,能高效生成高質(zhì)量圖像。

    ??: GEdit-Bench基準測試顯示其性能超越現(xiàn)有開源模型,接近閉源模型水平。

    ??: 開源特性為研究和開發(fā)提供了基礎(chǔ),推動了圖像編輯技術(shù)的創(chuàng)新與普及。

    詳情鏈接:https://huggingface.co/spaces/stepfun-ai/Step1X-Edit

    3、夸克AI超級框升級 上線“拍照問夸克”功能:啥都能答

    阿里巴巴旗下的夸克AI超級框于4月25日推出了“拍照問夸克”功能,這一創(chuàng)新利用視覺理解和推理模型,能夠快速識別和理解用戶在現(xiàn)實生活中遇到的各種問題。用戶通過拍照可以獲取準確的信息和答案,涵蓋多個領(lǐng)域,包括文物講解、商品識別、健康分析等。

    image.png

    【AiBase提要:】

    ?? 新功能“拍照問夸克”基于視覺理解,能快速識別圖片中的內(nèi)容并提供相關(guān)信息。

    ?? 用戶可以通過上傳商品圖片直接跳轉(zhuǎn)到淘寶同款鏈接,提升購物體驗。

    ?? 該功能支持多種語言提問和翻譯,適用于旅行、健康、工作等多個場景。

    4、國行版蘋果AI智能要來了?iOS18.5正式版預(yù)計5月份推送

    蘋果公司即將在5月向中國用戶推送iOS18.5正式版更新,帶來備受關(guān)注的Apple智能功能。這一功能已在其他地區(qū)上線,中國用戶等待了近一個月。Apple智能是一套基于個人場景的AI系統(tǒng),提供多樣化服務(wù),包括照片消除和智能回復(fù)等。然而,只有iPhone15Pro系列及即將發(fā)布的iPhone16全系機型支持該功能,且用戶需確保設(shè)備有足夠的存儲空間。

    image.png

    【AiBase提要:】

    ?? Apple智能功能將于5月正式推送給中國用戶,標志著蘋果進入生成式AI時代。

    ?? 該功能包括照片消除、通知摘要和智能回復(fù)等多樣化服務(wù),但僅支持iPhone15Pro及以上機型。

    ?? 用戶需確保設(shè)備至少有7GB可用存儲空間,這對部分用戶的存儲管理可能帶來挑戰(zhàn)。

    5、谷歌AI發(fā)布601個真實世界的生成式AI應(yīng)用案例,涵蓋各行業(yè)

    谷歌云最近發(fā)布了一份報告,展示了601個來自全球頂尖企業(yè)的生成式AI應(yīng)用案例,顯示出這一技術(shù)的快速發(fā)展和廣泛應(yīng)用。相比去年僅有的101個案例,增長了六倍,涵蓋了汽車、金融、醫(yī)療等多個行業(yè)。這些案例不僅突顯了生成式AI在運營和戰(zhàn)略中的重要性,還展示了其作為組織結(jié)構(gòu)一部分的潛力。

    image.png

    【AiBase提要:】

    ??601個生成式AI應(yīng)用案例展示了技術(shù)在各行業(yè)的廣泛應(yīng)用,較去年增長六倍。

    ?? AI代理分類清晰,展示了AI在客戶服務(wù)、內(nèi)部生產(chǎn)力和安全等方面的多重角色。

    ?? 各行業(yè)的實際應(yīng)用案例凸顯了生成式AI從實驗走向生產(chǎn)的重要趨勢。

    詳情鏈接:https://cloud.google.com/transform/101-real-world-generative-ai-use-cases-from-industry-leaders

    6、微軟發(fā)布全新Agent操作系統(tǒng)UFO2 ,深度整合Windows與智能自動化

    微軟近期推出的UFO2版本在自動化領(lǐng)域帶來了顯著進步,特別是在與Windows系統(tǒng)的深度集成方面。新版本能夠直接調(diào)用Windows的原生API,極大提升了自動化任務(wù)的執(zhí)行效率。與OpenAI的Operator相比,UFO2在多個測試場景中的成功率明顯更高,尤其在處理復(fù)雜任務(wù)和跨應(yīng)用操作時表現(xiàn)出色。

    image.png

    【AiBase提要:】

    ?? UFO2與Windows系統(tǒng)深度集成,能直接調(diào)用原生API,提升自動化效率。

    ?? UFO2的自動化任務(wù)成功率顯著高于OpenAI的Operator,表現(xiàn)出色。

    ??? 新增的畫中畫模式實現(xiàn)自動化任務(wù)與用戶操作的隔離,提升用戶體驗。

    詳情鏈接:https://github.com/microsoft/UFO?tab=readme-ov-file

    7、OpenAI 推出 ChatGPT 新版本:更智能、更直觀的 GPT-4o

    OpenAI 最近對其 ChatGPT 的 GPT-4o 版本進行了重要更新,重點在于如何更好地保存記憶以及提升在科學(xué)、技術(shù)、工程和數(shù)學(xué)(STEM)領(lǐng)域的技能。新版本旨在引導(dǎo)對話更有效地朝著富有成效的結(jié)果發(fā)展,同時提升模型的智能水平和人格特質(zhì)。盡管存在某些“光滑”過度的問題,OpenAI 承諾未來將進行改進。此外,開發(fā)者可以選擇新的 GPT-4.1系列,以獲得更穩(wěn)定的 API 體驗。

    【AiBase提要:】

    ?? 更新的 GPT-4o 版本在記憶保存和 STEM 技能方面進行了優(yōu)化。

    ?? OpenAI 承認模型在某些情況下存在 “光滑” 過度的問題,未來將改進。

    ?? 開發(fā)者可選擇新推出的 GPT-4.1系列,以獲得更穩(wěn)定的 API 體驗。

    8、Ema推新型語言模型EmaFusion:成本和準確性方面擊敗了 O3、Gemini

    Ema公司推出了新型語言模型EmaFusion,聲稱在成本和準確性上超越了多款知名AI模型。EmaFusion采用“級聯(lián)”判斷系統(tǒng),能夠動態(tài)平衡成本與準確性,并允許用戶根據(jù)任務(wù)需求進行微調(diào)。其準確率達到94.3%,運行成本顯著降低,成為企業(yè)AI發(fā)展的新選擇。

    image.png

    【AiBase提要:】

    ?? EmaFusion 的準確率達到94.3%,成本是市場平均水平的四分之一。

    ?? EmaFusion 能夠智能拆解復(fù)雜任務(wù),并將其分配給最適合的 AI 模型。

    ?? Ema 正與 KPMG、Hitachi 等全球領(lǐng)軍企業(yè)合作,推動企業(yè) AI 的發(fā)展。

    詳情鏈接:https://www.ema.co/emafusion

    9、Liquid AI推出Hyena Edge,開創(chuàng)智能手機邊緣設(shè)備的新時代

    Liquid AI近期推出了新型卷積模型Hyena Edge,旨在為智能手機及邊緣設(shè)備提供更高效的人工智能解決方案。該模型在計算效率和內(nèi)存使用上超越了傳統(tǒng)的Transformer++模型,尤其適合資源受限的環(huán)境。Hyena Edge在多個標準語言模型基準測試中表現(xiàn)出色,展示了自動化架構(gòu)設(shè)計的潛力,并計劃在未來開源,推動技術(shù)普及。

    image.png

    【AiBase提要:】

    ?? Hyena Edge 是Liquid AI公司推出的新型卷積模型,專為智能手機等邊緣設(shè)備設(shè)計。

    ?? 該模型在計算效率和內(nèi)存使用上優(yōu)于傳統(tǒng)的 Transformer++ 模型,適合資源受限的環(huán)境。

    ?? Hyena Edge 在多個標準語言模型基準測試中表現(xiàn)卓越,并計劃在未來開源以促進技術(shù)普及。

    詳情鏈接:https://www.liquid.ai/research/convolutional-multi-hybrids-for-edge-devices

    10、LemonAI 推出實時音視頻 AI 數(shù)字人模型 Slice Live

    LemonAI 最近推出了其創(chuàng)新產(chǎn)品 Slice Live,這是一款全球首創(chuàng)的實時音視頻 AI 模型。用戶只需上傳一張照片,即可與虛擬角色進行實時視頻通話。Slice Live 采用先進的 Transformer 模型,以每秒25幀的速度渲染每個像素,確保畫面流暢且真實。該產(chǎn)品在娛樂和教育領(lǐng)域都展示了巨大的潛力,未來還將擴展到 AR、VR 和元宇宙應(yīng)用,同時重視用戶隱私和數(shù)據(jù)安全。

    【AiBase提要:】

    ?? 用戶只需上傳一張照片,即可與虛擬角色進行實時視頻通話。

    ?? Slice Live 在娛樂和教育領(lǐng)域提供沉浸式互動體驗,帶來生動的學(xué)習(xí)內(nèi)容。

    ?? LemonAI 承諾持續(xù)探索隱私保護,確保用戶數(shù)據(jù)安全。

    11、智譜與生數(shù)科技達成戰(zhàn)略合作 專注大模型聯(lián)合創(chuàng)新

    4月27日,清華大學(xué)旗下的智譜與生數(shù)科技宣布達成重大戰(zhàn)略合作,旨在通過雙方在大語言模型和多模態(tài)生成模型的技術(shù)積累,共同推進國產(chǎn)大模型的技術(shù)創(chuàng)新與產(chǎn)業(yè)落地。此次合作涵蓋聯(lián)合研發(fā)、產(chǎn)品聯(lián)動、解決方案整合等多個方面,雙方將聚焦多個行業(yè),推動AI技術(shù)的應(yīng)用與發(fā)展,展示了國產(chǎn)大模型在技術(shù)創(chuàng)新和產(chǎn)業(yè)應(yīng)用方面的巨大潛力。

    image.png

    【AiBase提要:】

    ?? 智譜與生數(shù)科技將聯(lián)合研發(fā)大語言模型和多模態(tài)生成模型,推動技術(shù)創(chuàng)新。

    ?? 雙方的合作將整合各自的技術(shù)特長,打造更具競爭力的行業(yè)解決方案。

    ?? 合作將聚焦政企服務(wù)、文化旅游等領(lǐng)域,共同推動AI技術(shù)的規(guī)模化應(yīng)用。

    12、寶馬中國宣布新車型接入DeepSeek 含5系、全新X3

    寶馬中國在第三季度將推出搭載DeepSeek技術(shù)的新車型,標志著其在智能車載系統(tǒng)方面的重要進步。此技術(shù)將應(yīng)用于第九代操作系統(tǒng)的多款新車,增強車主與車輛的互動體驗。用戶可通過BMW智能個人助理以自然語言進行交流,系統(tǒng)能夠理解并響應(yīng)口語化指令,提供便捷的駕駛體驗。

    【AiBase提要:】

    ?? 寶馬將在第三季度推出搭載DeepSeek技術(shù)的新車型,提升車載智能交互體驗。

    ??? 用戶可通過BMW智能個人助理以自然語言進行交流,系統(tǒng)能理解口語化指令。

    ?? DeepSeek技術(shù)旨在增強用戶與車輛的互動,提供更便捷的駕駛體驗。

    舉報

    • 相關(guān)推薦
    • 秒殺同行!Kimi開源全新音頻基礎(chǔ)模型,橫掃十多項基準測試,總體性能第一

      Kimi-Audio是一款開源的通用音頻基礎(chǔ)模型,在語音識別、音頻理解、音頻轉(zhuǎn)文本、語音對話等任務(wù)中表現(xiàn)優(yōu)異。該模型采用集成式架構(gòu)設(shè)計,包含音頻分詞器、音頻大模型和音頻去分詞器三大核心組件,支持多模態(tài)輸入處理。在十余項音頻基準測試中,Kimi-Audio均取得領(lǐng)先性能,如LibriSpeech ASR測試WER僅1.28%,VocalSound測試達94.85%。模型使用1300萬小時多語言音頻數(shù)據(jù)進行預(yù)訓(xùn)練,并構(gòu)建了自動處理流水線生成高質(zhì)量訓(xùn)練數(shù)據(jù)。評估結(jié)果顯示,Kimi-Audio在語音識別、音樂理解、語音情感分析等任務(wù)上全面超越同類模型,在OpenAudioBench和VoiceBench對話測試中也表現(xiàn)最佳。目前模型代碼、檢查點和評估工具包已在GitHub開源。

    • AI日報kimi宣布降價;OpenRouter發(fā)布免費模型Quasar Alpha;Midjourney V7重磅上線

      歡迎來到【AI日報】欄目!這里是你每天探索人工智能世界的指南,每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點內(nèi)容,聚焦開發(fā)者,助你洞悉技術(shù)趨勢、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點擊了解:https://top.aibase.com/1、IDC:到2028年中國人工智能投資將突破1000億美元根據(jù)國際數(shù)據(jù)公司的預(yù)測,中國在人工智能領(lǐng)域的投資將顯著增長,預(yù)計到2028年總投資將突破1000億美元,年均復(fù)合增長率達到35.2%。

    • AI日報:阿里騰訊面支持MCP協(xié)議;階躍星辰多模態(tài)推理模型Step-R1-V-Mini;美WHEE圖像生成模型Miracle F1

      歡迎來到【AI日報】欄目!這里是你每天探索人工智能世界的指南,每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點內(nèi)容,聚焦開發(fā)者,助你洞悉技術(shù)趨勢、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點擊了解:https://top.aibase.com/1、阿里巴巴已宣布全面支持MCP協(xié)議騰訊緊隨其后近日,中國人工智能領(lǐng)域迎來技術(shù)標準的變革,ModelContextProtocol成為國內(nèi)AI生態(tài)的事實標準。12.英偉達發(fā)布Llama3.1NemotronUltra253B,性能?

    • 微信,OpenAI和Kimi想一起去了:大模型的盡頭依然還是社交平臺

      AI圈最近彌漫著一股微妙的氣息。人們似乎不再熱議大語言模型的最新突破、以及AI應(yīng)用的無限可能時,一些代表著未來的AI巨頭,卻似乎正將目光投向互聯(lián)網(wǎng)那熟悉得不能再熟悉的角落——社交網(wǎng)絡(luò)與社區(qū)。近期的傳聞和動作頗具代表性,在大洋彼岸,手握ChatGPT和Sora等王牌的OpenAI,據(jù)稱正內(nèi)部測試類X的社交功能,其CEO Sam Altman甚至在私下征求反饋;而在國內(nèi),憑借長文本能力

    • “奧迪助手”來了!全新AUDI車型接入豆包大模型

      2025年4月24日上海車展期間,上汽奧迪發(fā)布全新A5L Sportback和首款量產(chǎn)車型E5 Sportback。同時推出與火山引擎合作開發(fā)的"奧迪助手"智能交互系統(tǒng),基于豆包大模型實現(xiàn)自然對話體驗。該系統(tǒng)將搭載于兩款新車,并同步部署在車載端和手機APP端,支持跨設(shè)備對話記錄同步?;鹕揭鏋橄到y(tǒng)提供大模型技術(shù)支持,實現(xiàn)語音指令控制、車輛功能講解等智能服務(wù),并整合抖音、汽水音樂等內(nèi)容生態(tài)。上汽奧迪表示,該合作將助力品牌打造更智能、個性化的產(chǎn)品矩陣。

    • AI日報:ChatGPT重磅上線圖像庫功能;白嫖!Veo2登陸谷歌AI Studio;螞蟻百寶箱推“MCP專區(qū)”

      歡迎來到【AI日報】欄目!這里是你每天探索人工智能世界的指南,每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點內(nèi)容,聚焦開發(fā)者,助你洞悉技術(shù)趨勢、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點擊了解:https://top.aibase.com/1、報道稱字節(jié)跳動整合 AI 研發(fā)團隊,AI Lab 即將并入 Seed字節(jié)跳動正在進行AI研發(fā)團隊的整合,將獨立的字節(jié)AI Lab并入Seed團隊。這一舉措體現(xiàn)了字節(jié)在AI領(lǐng)域戰(zhàn)略布局的調(diào)整,旨在進?

    • 重磅!傳月之暗面Kimi內(nèi)測內(nèi)容社區(qū)產(chǎn)品 預(yù)計月底上線

      快科技4月14日消息,今日,有媒體報道,月之暗面Kimi將推出首個內(nèi)容社區(qū)產(chǎn)品,目前正在進行灰度測試,預(yù)計本月底正式上線。這款產(chǎn)品于去年末啟動,之前一直維持小范圍測試狀態(tài),是Kimi在用戶體驗上的最新嘗試。對于相關(guān)產(chǎn)品的具體信息,月之暗面已在規(guī)劃全新的內(nèi)容功能模塊,其定位類似于傳統(tǒng)內(nèi)容平臺的信息流模式。對于月之暗面來說,這一戰(zhàn)略布局不僅有望提升產(chǎn)

    • AI日報:小米首個推理大模型開源Xiaomi MiMo;快手上線AI筆記工具“喵記多”;騰訊拆分AI團隊

      本文匯總了AI領(lǐng)域最新動態(tài):1)小米開源70億參數(shù)大模型Xiaomi MiMo,在數(shù)學(xué)推理和代碼競賽中超越OpenAI和阿里模型;2)快手推出AI筆記工具"喵記多",簡化筆記管理;3)Luma AI發(fā)布電影級鏡頭控制API,降低視頻生成門檻;4)騰訊重組AI團隊,加大語言模型研發(fā)投入;5)Anthropic為Claude引入新語音"Glassy";6)谷歌NotebookLM新增50+語言音頻概述功能;7)xAI將發(fā)布Grok3.5模型;8)Meta推出獨立AI助手應(yīng)用挑戰(zhàn)ChatGPT;9)OpenAI緊急修復(fù)GPT-4o"諂媚"問題;10)Mac本地AI助手Simular升級隱私保護;11)CameraBench項目幫助AI理解鏡頭運動;12)谷歌推出個性化語言學(xué)習(xí)AI工具。

    • AI日報:昆侖萬維開源Skywork-OR1系列模型;訊飛星辰Agent開發(fā)平臺面支持MCP;字節(jié)跳動布局AI智能眼鏡

      歡迎來到【AI日報】欄目!這里是你每天探索人工智能世界的指南,每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點內(nèi)容,聚焦開發(fā)者,助你洞悉技術(shù)趨勢、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點擊了解:https://top.aibase.com/1、Kimi開源視覺語言模型 Kimi-VL 與 Kimi-VL-Thinking,多項基準超越 GPT-4oMoonshot AI 最近開源了 Kimi-VL 和 Kimi-VL-Thinking 兩款視覺語言模型,展現(xiàn)出卓越的多模態(tài)理解與推理能力。這些模型采

    • 可靈AI發(fā)布全新2.0模型上線多模態(tài)視頻編輯功能

      快科技4月16日消息,據(jù)報道,可靈AI在北京舉行靈感成真”2.0模型發(fā)布會,正式發(fā)布可靈2.0視頻生成模型及可圖2.0圖像生成模型。據(jù)介紹,可靈2.0模型在動態(tài)質(zhì)量、語義響應(yīng)、畫面美學(xué)等維度保持領(lǐng)先;可圖2.0模型在指令遵循、電影質(zhì)感及藝術(shù)風(fēng)格表現(xiàn)等方面顯著提升。3月27日,全球AI基準測試機構(gòu)Artificial Analysis發(fā)布了最新的全球視頻生成大模型榜單,快手可靈1.6pro(高品質(zhì)模