11.11云上盛惠!海量產(chǎn)品 · 輕松上云!云服務(wù)器首年1.8折起,買1年送3個(gè)月!超值優(yōu)惠,性能穩(wěn)定,讓您的云端之旅更加暢享。快來騰訊云選購吧!
快科技4月30日消息,今日,DeepSeek 今日在 AI 開源社區(qū) Hugging Face 發(fā)布了一個(gè)名為 DeepSeek-Prover-V2-671B 的新模型。據(jù)介紹,DeepSeek-Prover-V2-671B 其參數(shù)量達(dá)到6710億,使用了更高效的 safetensors 文件格式,并支持 BF16、FP8、F32 等多種計(jì)算精度,方便模型更快、更省資源地訓(xùn)練和部署。在模型架構(gòu)上,該模型使用了DeepSeek-V3架構(gòu),采用MoE(混合專家)模式,具有61層Transformer層,7168維隱藏層。同時(shí)支持超長(zhǎng)上下文,最大位置嵌入達(dá)163840,使其能處理復(fù)雜的數(shù)學(xué)證明,并且采用了FP8量化,可通過量化技術(shù)減小模型大小,提
本文匯總了AI領(lǐng)域最新動(dòng)態(tài):1)小米開源70億參數(shù)大模型Xiaomi MiMo,在數(shù)學(xué)推理和代碼競(jìng)賽中超越OpenAI和阿里模型;2)快手推出AI筆記工具"喵記多",簡(jiǎn)化筆記管理;3)Luma AI發(fā)布電影級(jí)鏡頭控制API,降低視頻生成門檻;4)騰訊重組AI團(tuán)隊(duì),加大語言模型研發(fā)投入;5)Anthropic為Claude引入新語音"Glassy";6)谷歌NotebookLM新增50+語言音頻概述功能;7)xAI將發(fā)布Grok3.5模型;8)Meta推出獨(dú)立AI助手應(yīng)用挑戰(zhàn)ChatGPT;9)OpenAI緊急修復(fù)GPT-4o"諂媚"問題;10)Mac本地AI助手Simular升級(jí)隱私保護(hù);11)CameraBench項(xiàng)目幫助AI理解鏡頭運(yùn)動(dòng);12)谷歌推出個(gè)性化語言學(xué)習(xí)AI工具。
國內(nèi)AI企業(yè)智象未來研發(fā)的開源圖像生成模型HiDream-I1近日取得重要突破:該模型憑借17B參數(shù)規(guī)模,在圖像真實(shí)感、細(xì)節(jié)處理及指令響應(yīng)能力上超越行業(yè)標(biāo)桿,多項(xiàng)評(píng)測(cè)指標(biāo)超過GPT-4o與Flux1.1。繼登頂AI基準(zhǔn)測(cè)試平臺(tái)Artificial Analysis、獲Hugging Face收錄后,該模型正式被谷歌技術(shù)生態(tài)體系收錄,成為首個(gè)登頂該平臺(tái)榜首的中國自研開源模型。其24小時(shí)內(nèi)登頂?shù)募o(jì)錄,被視為中國AI技術(shù)全球競(jìng)爭(zhēng)力的重要里程碑。谷歌的收錄將推動(dòng)HiDream-I1觸達(dá)全球開發(fā)者,助力開源生態(tài)共建進(jìn)入新發(fā)展階段。
阿里集團(tuán)推出新一代開源AI模型"通義千問3"(Qwen3),包含8款不同規(guī)格的混合推理模型。旗艦型號(hào)Qwen3-235B采用混合專家架構(gòu),創(chuàng)下國產(chǎn)模型性能新紀(jì)錄;Qwen3-32B則以部署成本低、運(yùn)行穩(wěn)定見長(zhǎng)。該系列在邏輯推理、編程、翻譯等專業(yè)領(lǐng)域表現(xiàn)卓越,用戶可通過通義App和網(wǎng)頁版體驗(yàn)。升級(jí)后的通義App整合問答對(duì)話、圖像理解與生成等多項(xiàng)功能,持續(xù)強(qiáng)化代碼生成、數(shù)學(xué)解題等專業(yè)場(chǎng)景應(yīng)用能力,致力于打造實(shí)用性強(qiáng)的個(gè)人AI助手。
阿里發(fā)布通義千問Qwen3大模型系列,包含8個(gè)不同規(guī)模的模型,從0.6B到235B參數(shù)全覆蓋。亮點(diǎn)包括:1)全球頂尖模型能力;2)首個(gè)開源的混合推理模型;3)支持119種語言;4)部署成本僅為DeepSeek+R1的三分之一;5)支持MCP協(xié)議。其中235B旗艦?zāi)P托阅軐?duì)標(biāo)頂級(jí)閉源模型,30B-MoE模型激活參數(shù)僅3B。所有模型均采用Apache2.0協(xié)議開源,支持商用。實(shí)測(cè)顯示Qwen3在代碼和寫作方面優(yōu)于DeepSeek
阿里巴巴開源新一代通義千問模型Qwen3,采用混合推理架構(gòu),集成"快思考"與"慢思考"模式,能根據(jù)任務(wù)復(fù)雜度自動(dòng)調(diào)整計(jì)算資源。該模型參數(shù)規(guī)模235B,在GPQA等權(quán)威評(píng)測(cè)中表現(xiàn)優(yōu)異,以更小規(guī)模實(shí)現(xiàn)超越上一代模型的性能。Qwen3包含2款MoE模型和6款密集模型,部署成本大幅降低,僅需4張H20顯卡即可運(yùn)行滿血版,顯存占用僅為同類模型的三分之一。新模型通過智能分配算力,在簡(jiǎn)單任務(wù)上快速響應(yīng),復(fù)雜問題上深度思考,顯著提升能效比。
字節(jié)跳動(dòng)發(fā)布豆包1.5深度思考模型,升級(jí)文生圖能力。該模型在專業(yè)領(lǐng)域和通用任務(wù)中表現(xiàn)突出,采用MoE架構(gòu),總參數(shù)量200B,激活參數(shù)20B,推理成本優(yōu)勢(shì)顯著。同時(shí),其圖像生成模型Seedream 3.0性能追平GPT-4o等頂尖模型。全球AI產(chǎn)業(yè)加速發(fā)展,開源模型降低技術(shù)門檻,推動(dòng)商業(yè)化落地。微美全息等企業(yè)構(gòu)建開放AI生態(tài),DeepSeek等公司通過開源策略促進(jìn)技術(shù)普惠。行業(yè)迎來"開源AI+"新階段,企業(yè)需把握機(jī)遇應(yīng)對(duì)挑戰(zhàn)。
理想汽車4月28日宣布自研"星環(huán)OS"操作系統(tǒng)正式開源,成為全球首個(gè)實(shí)現(xiàn)整車級(jí)操作系統(tǒng)全面開源的車企。該系統(tǒng)代碼已通過Gitee平臺(tái)開放下載,采用Apache License V2.0開源協(xié)議,覆蓋智能車控、智能駕駛、通信中間件、信息安全四大核心模塊。該系統(tǒng)不同于車載屏幕系統(tǒng),而是整車全鏈路操作系統(tǒng),包括車輛控制等核心功能。研發(fā)始于2021年,投入200名研發(fā)人員和10億元人民幣。系統(tǒng)采用資源集中與共享架構(gòu),支持英飛凌、地平線等主流車規(guī)芯片,芯片適配驗(yàn)證時(shí)間比傳統(tǒng)閉源系統(tǒng)縮短80%。在性能方面,AI算力虛擬化損耗降低80%,傳感器訪問時(shí)延降低90%,存儲(chǔ)資源占用減少30%,響應(yīng)速度比AUTOSAR提升1倍。安全性能方面,120km/h高速狀態(tài)下AEB剎停距離縮短7米。
本期AI日?qǐng)?bào)聚焦多項(xiàng)AI技術(shù)突破與應(yīng)用:1)Moonshot AI推出開源音頻模型Kimi-Audio,基于13億小時(shí)訓(xùn)練數(shù)據(jù),支持語音識(shí)別等任務(wù);2)階躍星辰開源圖像編輯模型Step1X-Edit,展現(xiàn)強(qiáng)大生成能力;3)夸克AI上線"拍照問夸克"功能,實(shí)現(xiàn)視覺問答;4)蘋果iOS18.5將在中國推送,帶來智能功能;5)谷歌發(fā)布601個(gè)生成式AI應(yīng)用案例,覆蓋多行業(yè);6)微軟推出深度整合Windows的UFO2自動(dòng)化系統(tǒng);7)OpenAI升級(jí)ChatGPT至GPT-4o版本,提升STEM領(lǐng)域能力;8)Ema公司推出高性價(jià)比語言模型EmaFusion;9)Liquid AI發(fā)布面向邊緣設(shè)備的Hyena Edge模型;10)LemonAI推出實(shí)時(shí)音視頻數(shù)字人產(chǎn)品Slice Live。此外,國內(nèi)方面,智譜與生數(shù)科技達(dá)成戰(zhàn)略合作推動(dòng)大模型發(fā)展,寶馬中國宣布新車將接入DeepSeek技術(shù)。
Kimi-Audio是一款開源的通用音頻基礎(chǔ)模型,在語音識(shí)別、音頻理解、音頻轉(zhuǎn)文本、語音對(duì)話等任務(wù)中表現(xiàn)優(yōu)異。該模型采用集成式架構(gòu)設(shè)計(jì),包含音頻分詞器、音頻大模型和音頻去分詞器三大核心組件,支持多模態(tài)輸入處理。在十余項(xiàng)音頻基準(zhǔn)測(cè)試中,Kimi-Audio均取得領(lǐng)先性能,如LibriSpeech ASR測(cè)試WER僅1.28%,VocalSound測(cè)試達(dá)94.85%。模型使用1300萬小時(shí)多語言音頻數(shù)據(jù)進(jìn)行預(yù)訓(xùn)練,并構(gòu)建了自動(dòng)處理流水線生成高質(zhì)量訓(xùn)練數(shù)據(jù)。評(píng)估結(jié)果顯示,Kimi-Audio在語音識(shí)別、音樂理解、語音情感分析等任務(wù)上全面超越同類模型,在OpenAudioBench和VoiceBench對(duì)話測(cè)試中也表現(xiàn)最佳。目前模型代碼、檢查點(diǎn)和評(píng)估工具包已在GitHub開源。