歡迎來(lái)到【AI日?qǐng)?bào)】欄目!這里是你每天探索人工智能世界的指南,每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容,聚焦開(kāi)發(fā)者,助你洞悉技術(shù)趨勢(shì)、了解創(chuàng)新AI產(chǎn)品應(yīng)用。
新鮮AI產(chǎn)品點(diǎn)擊了解:https://top.aibase.com/
1、抖音打通豆包AI,字節(jié)跳動(dòng)開(kāi)啟超級(jí)AI生態(tài)戰(zhàn)略
抖音App正在測(cè)試接入豆包AI,標(biāo)志著字節(jié)跳動(dòng)加速推進(jìn)AI生態(tài)布局。通過(guò)在短視頻界面和消息列表中開(kāi)放入口,抖音旨在打破AI產(chǎn)品與流量平臺(tái)的壁壘,提升AI能力并引入更多用戶流量。字節(jié)內(nèi)部還在推進(jìn)多條AI產(chǎn)品業(yè)務(wù)線,展現(xiàn)出全方位的AI產(chǎn)品生態(tài)系統(tǒng)。
【AiBase提要:】
?? 抖音正在測(cè)試接入豆包AI,開(kāi)放兩個(gè)戰(zhàn)略性入口,提升AI能力和用戶流量。
?? 字節(jié)跳動(dòng)內(nèi)部推進(jìn)多條AI產(chǎn)品線,覆蓋多個(gè)領(lǐng)域,展現(xiàn)全方位的AI生態(tài)系統(tǒng)。
?? 互聯(lián)網(wǎng)巨頭對(duì)AI技術(shù)在內(nèi)容生態(tài)中的應(yīng)用高度重視,開(kāi)啟新的AI服務(wù)生態(tài)時(shí)代。
2、強(qiáng)強(qiáng)聯(lián)合!即夢(mèng)接入DeepSeek 從提示詞到繪畫一步到位
即夢(mèng)與DeepSeek的合作為AI繪畫愛(ài)好者帶來(lái)了極大的便利。通過(guò)DeepSeek的智能提示詞生成功能,用戶不再需要為創(chuàng)作靈感而煩惱,只需簡(jiǎn)單輸入需求,便能獲得精準(zhǔn)的提示詞,進(jìn)而生成高質(zhì)量的圖像。這一創(chuàng)新的聯(lián)動(dòng)不僅提升了創(chuàng)作效率,還讓繪畫過(guò)程變得更加流暢和愉悅。
【AiBase提要:】
??? 即夢(mèng)接入DeepSeek,提供智能提示詞生成功能,解決用戶創(chuàng)作難題。
? 用戶只需輸入簡(jiǎn)單需求,DeepSeek即可生成詳細(xì)精準(zhǔn)的提示詞,提升創(chuàng)作效率。
?? DeepSeek生成的提示詞質(zhì)量高,能夠有效引導(dǎo)AI生成高質(zhì)量圖像,用戶反饋良好。
3、Grok 語(yǔ)音模式全面開(kāi)放:11種模式上線,自帶字幕成英語(yǔ)學(xué)習(xí)利器
xAI公司的AI助手Grok正式向所有用戶開(kāi)放其備受期待的語(yǔ)音模式,帶來(lái)了11種獨(dú)特的語(yǔ)音交互模式和語(yǔ)音字幕功能。這一更新不僅增強(qiáng)了用戶的互動(dòng)體驗(yàn),還為英語(yǔ)學(xué)習(xí)者提供了新的學(xué)習(xí)工具。用戶對(duì)這一更新反響熱烈,雖然目前僅支持英文,但Grok的多樣化表達(dá)和流暢度已獲得用戶的高度評(píng)價(jià),未來(lái)擴(kuò)展語(yǔ)言支持的期待也在不斷增加。
【AiBase提要:】
?? Grok的語(yǔ)音模式現(xiàn)已向所有用戶開(kāi)放,提供11種獨(dú)特的交互風(fēng)格,包括2種18+限制模式。
?? 新增的語(yǔ)音字幕功能幫助用戶更好地理解內(nèi)容,成為英語(yǔ)學(xué)習(xí)的實(shí)用工具。
?? 用戶對(duì)Grok的流暢度和情感表達(dá)給予高度評(píng)價(jià),期待未來(lái)能支持更多語(yǔ)言。
4、vivo重組調(diào)整,成立新AI部門并將大模型訓(xùn)練轉(zhuǎn)向端側(cè)
vivo最近在其組織架構(gòu)上進(jìn)行了重要調(diào)整,成立了新的AI部門,顯示出其在人工智能領(lǐng)域的持續(xù)投入與戰(zhàn)略布局。新部門將專注于大模型的端側(cè)訓(xùn)練,并且暫停了對(duì)商業(yè)化的考核,反映出vivo對(duì)AI技術(shù)長(zhǎng)遠(yuǎn)發(fā)展的重視。此外,vivo還推出了DeepSeek-R1,提升了AI助手的智能化水平,進(jìn)一步推動(dòng)了用戶體驗(yàn)的提升。
【AiBase提要:】
?? vivo新設(shè)立AI部門,標(biāo)志著公司在人工智能技術(shù)上的持續(xù)投入和戰(zhàn)略布局。
?? 由于管理干預(yù),vivo決定暫時(shí)不對(duì)AI大模型的商業(yè)化進(jìn)行考核,并暫停資金投入。
?? 最新推出的DeepSeek-R1提升了AI助手的智能化水平,用戶體驗(yàn)得到了顯著改善。
5、全新技術(shù) Fast3R :實(shí)現(xiàn)千張圖片一鍵3D 重建,速度驚人!
Fast3R是一種創(chuàng)新的多視角3D重建技術(shù),能夠在一次前向傳播中處理多達(dá)1500張圖片,顯著提高重建速度。與傳統(tǒng)的DUSt3R方法相比,F(xiàn)ast3R利用基于Transformer的架構(gòu)并行處理視圖信息,省去復(fù)雜的對(duì)齊過(guò)程,提升了推理速度并減少誤差積累。
【AiBase提要:】
?? Fast3R技術(shù)可以在一次前向傳播中處理多達(dá)1500張圖片,大幅提高3D重建速度。
? Fast3R的Transformer架構(gòu)支持并行處理,省去傳統(tǒng)方法的復(fù)雜對(duì)齊過(guò)程。
?? 與DUSt3R相比,F(xiàn)ast3R在時(shí)間和內(nèi)存使用上展現(xiàn)出顯著優(yōu)勢(shì),適用于大規(guī)模3D重建應(yīng)用。
詳情鏈接:https://fast3r-3d.github.io/
6、音樂(lè)創(chuàng)作領(lǐng)域投下核彈!DiffRhythm 炸裂問(wèn)世:10秒 AI 神曲,人聲伴奏一鍵搞定!
DiffRhythm的問(wèn)世標(biāo)志著音樂(lè)創(chuàng)作的新時(shí)代,它通過(guò)擴(kuò)散模型實(shí)現(xiàn)了端到端的自動(dòng)生成音樂(lè),用戶只需輸入歌詞和風(fēng)格,即可在短短10秒內(nèi)獲得一首完整的歌曲。DiffRhythm不僅能生成伴奏,還能自動(dòng)創(chuàng)作歌詞,完美契合旋律,顛覆了傳統(tǒng)音樂(lè)創(chuàng)作的模式,開(kāi)啟了AI音樂(lè)創(chuàng)作的新紀(jì)元。
【AiBase提要:】
?? DiffRhythm通過(guò)擴(kuò)散模型實(shí)現(xiàn)端到端的音樂(lè)創(chuàng)作,用戶只需輸入歌詞和風(fēng)格即可生成完整歌曲。
? 生成速度極快,僅需10秒鐘便可完成一首4分45秒的歌曲,速度是傳統(tǒng)方法的50倍。
?? 內(nèi)置強(qiáng)大的大語(yǔ)言模型,能夠自動(dòng)創(chuàng)作歌詞并與旋律完美匹配,徹底顛覆傳統(tǒng)作曲方式。
詳情鏈接:https://huggingface.co/spaces/ASLP-lab/DiffRhythm
7、微軟開(kāi)源圖片模型ART,可生成多圖層透明圖片
在圖像生成領(lǐng)域,微軟研究人員推出的“Anonymous Region Transformer”(ART)技術(shù),革新了用戶與生成模型的互動(dòng)方式。通過(guò)匿名區(qū)域布局,ART能夠根據(jù)全球文本提示直接生成多層透明圖像,并引入逐層區(qū)域裁剪機(jī)制,大幅提升生成效率,速度比傳統(tǒng)方法快12倍。
【AiBase提要:】
?? ART可根據(jù)全球文本提示和匿名區(qū)域布局,直接生成多層透明圖像。
?? 采用逐層區(qū)域裁剪機(jī)制,顯著提高了圖像生成效率,比傳統(tǒng)方法快12倍。
?? 新型高質(zhì)量自編碼器支持多層透明圖像的精確控制與生成,推動(dòng)交互式內(nèi)容創(chuàng)作。
詳情鏈接:https://art-msra.github.io/
8、AI思維導(dǎo)圖神器 MindMapper :扔個(gè)鏈接就能生成交互式思維導(dǎo)圖
在信息爆炸的時(shí)代,Mind Mapper 應(yīng)用程序成為了思維整理的得力助手。它能夠?qū)⒂脩舻南敕ㄞD(zhuǎn)化為生動(dòng)的思維導(dǎo)圖,只需輸入網(wǎng)址、YouTube 視頻鏈接或文本提示,便能快速生成互動(dòng)式思維導(dǎo)圖。
【AiBase提要:】
??? Mind Mapper 能夠?qū)⑾敕ㄞD(zhuǎn)化為生動(dòng)的思維導(dǎo)圖,支持網(wǎng)址、視頻鏈接和文本提示輸入。
?? 采用 Mermaid.js 技術(shù),思維導(dǎo)圖不僅美觀,還具備動(dòng)態(tài)交互功能,用戶可輕松獲取詳細(xì)信息。
?? 提供將思維導(dǎo)圖下載為 PNG 圖片的功能,方便用戶分享知識(shí)和靈感。
詳情鏈接:https://github.com/misbahsy/MindMapper
9、雷軍亮相首場(chǎng)代表通道:小米將把最新的AI技術(shù)應(yīng)用到各個(gè)終端上
在全國(guó)人大十四屆三次會(huì)議的首場(chǎng)“代表通道”上,小米創(chuàng)辦人雷軍接受了記者提問(wèn),深入探討了小米在制造業(yè)中的角色及科技創(chuàng)新方向。他強(qiáng)調(diào)制造業(yè)是國(guó)家的基石,小米將加大研發(fā)投入,特別是在人工智能領(lǐng)域,以提升消費(fèi)者的科技體驗(yàn),并助力中國(guó)式現(xiàn)代化。
【AiBase提要:】
?? 制造業(yè)是國(guó)家立國(guó)之本,小米將堅(jiān)定走科技創(chuàng)新和高端化發(fā)展道路。
?? 小米計(jì)劃在2021至2025年間投入1050億元用于研發(fā),2025年預(yù)計(jì)投入300億元,AI相關(guān)業(yè)務(wù)占四分之一。
?? 小米致力于將最新的AI技術(shù)應(yīng)用于手機(jī)、汽車和智能家居等領(lǐng)域,提升全球市場(chǎng)的影響力。
10、愛(ài)詩(shī)科技完成A5輪融資,劍指AI視頻生成領(lǐng)域新高地
愛(ài)詩(shī)科技近日宣布完成A5輪融資,由靖亞資本獨(dú)家投資,融資額已超4億元,成為AI視頻生成領(lǐng)域的明星企業(yè)。公司成立于2023年,由前字節(jié)跳動(dòng)視覺(jué)技術(shù)負(fù)責(zé)人王長(zhǎng)虎創(chuàng)立,團(tuán)隊(duì)背景強(qiáng)大,迅速獲得多方投資者青睞。此次融資將用于加速研發(fā)和引進(jìn)人才,致力于打造領(lǐng)先的AI視頻生成大模型及應(yīng)用。
【AiBase提要:】
?? 愛(ài)詩(shī)科技完成A5輪融資,融資額已超4億元,成為AI視頻生成領(lǐng)域的明星企業(yè)。
?? 其產(chǎn)品PixVerse已擁有超過(guò)4000萬(wàn)用戶,月活躍用戶達(dá)1500萬(wàn),技術(shù)實(shí)力領(lǐng)先。
?? 公司計(jì)劃加速模型研發(fā)與高端人才引進(jìn),積極拓展B端企業(yè)服務(wù),面臨商業(yè)化挑戰(zhàn)。
(舉報(bào))