无码在线播放二区|久久亚洲精品国产精品|无码视频在线观看一区二区|在线观看国产日韩亚洲中

<menu id="yw4o4"></menu>

<menu id="yw4o4"><em id="yw4o4"></em></menu>

<th id="f5hqo"><strong id="f5hqo"><strong id="f5hqo"></strong></strong></th>

AI日?qǐng)?bào)：MJ推模型個(gè)性化功能；ComfyUI完成SD3 Medium模型適配；字節(jié)上線AI交友“小黃蕉”；微信輸入法內(nèi)測(cè)AI功能

2024-06-12 15:39 · 稿源：站長(zhǎng)之家

歡迎來(lái)到【AI日?qǐng)?bào)】欄目!這里是你每天探索人工智能世界的指南，每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容，聚焦開發(fā)者，助你洞悉技術(shù)趨勢(shì)、了解創(chuàng)新AI產(chǎn)品應(yīng)用。

新鮮AI產(chǎn)品點(diǎn)擊了解：https://top.aibase.com/

1、Midjourney推出模型個(gè)性化功能

Midjourney最近推出了一項(xiàng)創(chuàng)新的模型個(gè)性化功能，允許用戶根據(jù)審美偏好微調(diào)MJ模型，使生成的圖像更貼近個(gè)人喜好。個(gè)性化模型通過(guò)分析用戶喜歡的圖片來(lái)實(shí)現(xiàn)，學(xué)習(xí)用戶獨(dú)特審美，滿足用戶品味。用戶需對(duì)至少 200 張圖片進(jìn)行評(píng)分或點(diǎn)贊，啟用個(gè)性化功能后，在提示后添加特定代碼分享個(gè)性化效果。

【AiBase提要:】
?? 模型個(gè)性化功能允許用戶根據(jù)審美偏好微調(diào)MJ模型，使生成圖像更符合個(gè)人喜好。
?? 個(gè)性化模型通過(guò)分析用戶過(guò)往喜歡的圖片，學(xué)習(xí)用戶獨(dú)特審美，提高生成圖像準(zhǔn)確性。
?? 用戶需對(duì)至少 200 張圖片進(jìn)行評(píng)分或點(diǎn)贊，啟用個(gè)性化功能后，在提示后添加特定代碼分享個(gè)性化效果。
詳情鏈接:https://www.midjourney.com/rank

2、為了迎接即將開源的SD3 Medium 模型 ComfyUI已提前完成適配

SD3Medium 模型即將開源，為了迎接這一重要時(shí)刻，ComfyUI已經(jīng)提前進(jìn)行了適配工作，做好了迎接新模型的準(zhǔn)備。屆時(shí)，大家生圖可以體驗(yàn)更真實(shí)的質(zhì)感，更好的構(gòu)圖，更優(yōu)的性能以及更出色的微調(diào)能力。

QQ截圖20240611174410.jpg

【AiBase提要:】
?? SD3 Medium 模型即將開源，ComfyUI已完成提前適配工作。
??? SD3 Medium 在圖像生成方面取得顯著進(jìn)步，能夠生成細(xì)節(jié)豐富且高度逼真的圖像。
?? SD3 Medium 在生成高質(zhì)量、細(xì)節(jié)豐富的圖像方面具備強(qiáng)大能力。
詳情：
https://github.com/comfyanonymous/ComfyUI/commit/8c4a9befa7261b6fc78407ace90a57d21bfe631e

3、微信輸入法內(nèi)測(cè)AI功能只要按這個(gè)鍵就可以獲取AI回答

微信輸入法內(nèi)測(cè)版本新增AI助手功能，按“=”獲取AI生成回答。emoji和顏文字推薦支持。增強(qiáng)對(duì)時(shí)間、日期輸入格式支持。

【AiBase提要:】
??微信輸入法新增AI助手功能，按“=”獲取AI生成回答。
??更新加強(qiáng)對(duì)emoji和顏文字的支持，增強(qiáng)對(duì)時(shí)間、日期輸入格式的支持。
??目前內(nèi)測(cè)版本僅面向Windows用戶，iOS、Android和Mac平臺(tái)可能會(huì)推出。

4、字節(jié)上線AI虛擬交友聊天產(chǎn)品小黃蕉可生成照片，接近真人對(duì)話場(chǎng)景

近日，一款名為“小黃蕉”（英文名Chatwiz）的AI虛擬交友聊天產(chǎn)品上線，其特點(diǎn)是能夠生成照片，且對(duì)話過(guò)程非常接近真人。經(jīng)查證，該產(chǎn)品的工商主體為北京臻鼎科技有限公司(番茄小說(shuō))，而其背后的實(shí)際控制者是字節(jié)跳動(dòng)公司。

QQ截圖20240611160830.jpg

【AiBase提要：】
? 小黃蕉是AI虛擬交友聊天產(chǎn)品，能生成照片，對(duì)話接近真人。
? 字節(jié)跳動(dòng)積極布局AI大模型，推出多款A(yù)I產(chǎn)品和服務(wù)。
? “小黃蕉”展現(xiàn)了字節(jié)跳動(dòng)在AI應(yīng)用領(lǐng)域的持續(xù)探索和創(chuàng)新。

5、科大訊飛：將于 6 月 27 日發(fā)布訊飛星火V4.0 展示最新智能語(yǔ)音技術(shù)

科大訊飛將于 6 月 27 日發(fā)布訊飛星火V4.0，展示最新的端到端智能語(yǔ)音技術(shù)成果，包括一句話復(fù)刻、高噪音場(chǎng)景語(yǔ)音識(shí)別和多方言多語(yǔ)種免切換功能。劉慶峰透露，科大訊飛在全雙工技術(shù)和超擬人合成技術(shù)方面處于國(guó)際領(lǐng)先水平。未來(lái)，科大訊飛將專注于遠(yuǎn)場(chǎng)高噪音多人說(shuō)話場(chǎng)景、高表現(xiàn)力個(gè)性化場(chǎng)景等領(lǐng)域的研發(fā)。

【AiBase提要:】
?? 訊飛星火V4. 0 將展示最新的端到端智能語(yǔ)音技術(shù)成果，包括一句話復(fù)刻、高噪音場(chǎng)景語(yǔ)音識(shí)別和多方言多語(yǔ)種免切換功能。
?? 科大訊飛在全雙工技術(shù)和超擬人合成技術(shù)方面達(dá)到國(guó)際領(lǐng)先水平。
?? 未來(lái)，科大訊飛將專注于遠(yuǎn)場(chǎng)高噪音多人說(shuō)話場(chǎng)景、高表現(xiàn)力個(gè)性化場(chǎng)景等領(lǐng)域的研發(fā)。

6、蘋果宣布新AI功能后股價(jià)創(chuàng)歷史新高

蘋果公司股價(jià)周二收盤時(shí)上漲超過(guò)7%，創(chuàng)下歷史新高。這次反彈為蘋果今年的表現(xiàn)帶來(lái)了一線希望，展示了市場(chǎng)對(duì)蘋果新的人工智能功能的積極態(tài)度。

【AiBase提要:】
?? 蘋果股價(jià)周二上漲超過(guò)7%，創(chuàng)歷史新高，市值有望達(dá)到3. 18 萬(wàn)億美元，僅次于微軟。
?? 新的人工智能功能提高了蘋果設(shè)備的吸引力，包括改進(jìn)的 Siri 虛擬助手和多項(xiàng)AI功能。
?? 開發(fā)者活動(dòng)后，分析師上調(diào)對(duì)蘋果股票的目標(biāo)價(jià)，預(yù)計(jì)新功能將刺激秋季新iPhone系列的購(gòu)買。

7、Follow-Your-Emoji：通過(guò)捕捉人物表情變化生成表情豐富的動(dòng)畫

Follow-Your-Emoji是一項(xiàng)突破性技術(shù)，通過(guò)提取視頻中人物的面部特征生成全新的面部動(dòng)畫。這項(xiàng)技術(shù)精確捕捉面部特征和瞳孔點(diǎn)，排除面部輪廓干擾，實(shí)現(xiàn)更自然、更生動(dòng)的動(dòng)畫效果。應(yīng)用廣泛，娛樂(lè)、教育、商業(yè)領(lǐng)域皆可受益。

【AiBase提要:】
?? 用戶提供照片，技術(shù)生成視頻動(dòng)畫，捕捉微妙表情變化。
?? 身份保持，參考頭像身份特征得到保留，不會(huì)丟失。
?? 表情豐富，生成各種表情，包括瞳孔運(yùn)動(dòng)，讓動(dòng)畫更生動(dòng)、真實(shí)。
詳情鏈接:https://top.aibase.com/tool/follow-your-emoji

8、在線AI圖像編輯器Freepik Designer

Freepik Designer是一款創(chuàng)新的在線AI圖像編輯器，為用戶提供了簡(jiǎn)單易用的設(shè)計(jì)工具，無(wú)需專業(yè)設(shè)計(jì)技能即可快速上手。它的AI工具集成讓設(shè)計(jì)過(guò)程更高效，同時(shí)提供豐富的模板庫(kù)，滿足不同設(shè)計(jì)需求。

【AiBase提要:】
?? 簡(jiǎn)單易用的設(shè)計(jì)工具，無(wú)需專業(yè)設(shè)計(jì)技能即可快速上手
??? 提供豐富的模板庫(kù)，滿足不同設(shè)計(jì)需求
?? 內(nèi)置AI工具集成，提升設(shè)計(jì)效率和質(zhì)量
詳情鏈接:https://top.aibase.com/tool/freepik-designer

9、埃隆?馬斯克撤回對(duì) OpenAI 的訴訟

埃隆?馬斯克撤回了對(duì) OpenAI 的訴訟，指控其違約。馬斯克認(rèn)為 OpenAI 放棄了非營(yíng)利性使命，轉(zhuǎn)向商業(yè)利益。OpenAI 否認(rèn)指控，稱其“不連貫”和“荒謬”。

【AiBase提要:】
?? 埃隆?馬斯克撤回對(duì) OpenAI 的訴訟。
?? 馬斯克指責(zé) OpenAI 放棄非營(yíng)利性使命，轉(zhuǎn)向商業(yè)利益。
?? OpenAI 否認(rèn)指控，稱其“不連貫”和“荒謬”。

10、Yandex推出的開源工具YaFSDP 突破LLM訓(xùn)練效率瓶頸

Yandex開源的YaFSDP工具為全球AI社區(qū)帶來(lái)了突破性的LLM訓(xùn)練優(yōu)化方法，顯著提升訓(xùn)練速度，節(jié)省大量GPU資源，使自主LLM訓(xùn)練更具可行性。Yandex承諾持續(xù)貢獻(xiàn)全球AI社區(qū)發(fā)展，YaFSDP開源是其承諾的體現(xiàn)。

【AiBase提要:】
? YaFSDP是Yandex開源的高效大型語(yǔ)言模型訓(xùn)練優(yōu)化方法，可提升LLM訓(xùn)練速度26%。
?? YaFSDP專注于優(yōu)化GPU通信效率和內(nèi)存使用，在訓(xùn)練參數(shù)規(guī)模達(dá)到 300 億至 700 億時(shí)表現(xiàn)出色。
?? 采用YaFSDP訓(xùn)練 700 億參數(shù)模型可節(jié)省約 150 臺(tái)GPU資源，成本節(jié)約可達(dá) 50 萬(wàn)至 150 萬(wàn)美元。

11、速度提高 410 倍！TiTok僅需 32 個(gè)token就能重建與生成圖片

近期，生成模型的發(fā)展突顯了圖像標(biāo)記化在高分辨率圖像高效合成中的關(guān)鍵作用。TiTok是基于Transformer的一維標(biāo)記化框架，將圖像標(biāo)記化為一維潛在序列，極大提高了生成效率和質(zhì)量。它在處理高分辨率圖像時(shí)表現(xiàn)出色，生成速度顯著提高，同時(shí)保持高質(zhì)量樣本輸出。

【AiBase提要:】
?? 圖像token化降低計(jì)算需求，增強(qiáng)生成效率和有效性。
?? TiTok將圖像標(biāo)記化為一維潛在序列，用少至 32 個(gè)離散token表示256× 256 圖像。
?? TiTok在ImageNet基準(zhǔn)測(cè)試中表現(xiàn)優(yōu)異，生成速度提高 410 倍，同時(shí)保持高質(zhì)量樣本輸出。

12、MIT開發(fā)新算法DenseAV：通過(guò)觀看視頻學(xué)習(xí)語(yǔ)言含義

在MIT開發(fā)的新算法DenseAV中，研究人員利用機(jī)器理解動(dòng)物的交流方式，通過(guò)觀看視頻學(xué)習(xí)語(yǔ)言的含義。該算法能夠無(wú)監(jiān)督學(xué)習(xí)單詞的含義和聲音的位置，實(shí)現(xiàn)跨模態(tài)連接的自然區(qū)分。團(tuán)隊(duì)希望應(yīng)用于理解新語(yǔ)言和發(fā)現(xiàn)不同信號(hào)之間的模式關(guān)聯(lián)。

【AiBase提要:】
?? DenseAV是雙編碼器接地架構(gòu)，學(xué)習(xí)高分辨率、語(yǔ)義意義和視聽對(duì)齊的特征。
?? 無(wú)監(jiān)督學(xué)習(xí)發(fā)現(xiàn)單詞含義和聲音位置的關(guān)聯(lián)，自動(dòng)區(qū)分語(yǔ)言和聲音。
?? 在跨模態(tài)檢索方面優(yōu)于以前的模型ImageBind，應(yīng)用于學(xué)習(xí)大量視頻和理解新語(yǔ)言。
詳情鏈接:https://top.aibase.com/tool/denseav

13、讓AI更合乎倫理：Source.Plus 提供高質(zhì)量AI訓(xùn)練數(shù)據(jù)

Spawning 致力于為藝術(shù)家提供更多對(duì)其作品在線使用的控制權(quán)，Source.Plus 項(xiàng)目推出的數(shù)據(jù)集包含近 4000 萬(wàn)個(gè)公有領(lǐng)域圖片和采用 Creative Commons CC0 許可的圖片，為AI模型的訓(xùn)練提供高質(zhì)量的數(shù)據(jù)。該平臺(tái)為藝術(shù)家和創(chuàng)作者提供了更精細(xì)的作品使用權(quán)限管理，為AI技術(shù)的發(fā)展和應(yīng)用注入新活力。

【AiBase提要:】
?? 數(shù)據(jù)搜索與整理：用戶可快速搜索各種媒體數(shù)據(jù)，整理標(biāo)注以滿足訓(xùn)練需求。
?? 高質(zhì)量訓(xùn)練數(shù)據(jù)：經(jīng)篩選審核的數(shù)據(jù)保證安全質(zhì)量，合法同意使用。
?? 應(yīng)用場(chǎng)景廣泛：適用于各種AI模型訓(xùn)練，提高準(zhǔn)確性和魯棒性。
詳情鏈接:https://top.aibase.com/tool/source-plusSource.Plus

14、Mistral AI獲得6. 4 億美元B輪融資

Mistral AI近期宣布獲得6. 4 億美元的B輪融資，估值提升至近 60 億美元。這一輪融資由General Catalyst領(lǐng)投，多家知名投資機(jī)構(gòu)和公司參與，加速了Mistral在人工智能領(lǐng)域的發(fā)展和國(guó)際商業(yè)化進(jìn)程。

【AiBase提要:】
?? Mistral AI獲得6. 4 億美元B輪融資，估值提升至近 60 億美元。
?? General Catalyst領(lǐng)投，多家知名投資機(jī)構(gòu)和公司參與，加速了Mistral在人工智能領(lǐng)域的發(fā)展和國(guó)際商業(yè)化進(jìn)程。
?? 生成式AI市場(chǎng)預(yù)計(jì)未來(lái)十年內(nèi)將以每年42%的復(fù)合增長(zhǎng)率達(dá)到1. 3 萬(wàn)億美元，Mistral此次融資將加速商業(yè)化進(jìn)程，拓展分銷渠道。

15、自回歸圖像生成模型LlamaGen

LlamaGen 是一項(xiàng)顛覆性創(chuàng)新，展示了即使在沒(méi)有視覺(jué)信號(hào)歸納偏差的情況下，自回歸模型也能實(shí)現(xiàn)領(lǐng)先的圖像生成性能。該技術(shù)為圖像生成領(lǐng)域帶來(lái)新可能性，為未來(lái)研究提供新思路。

【AiBase提要:】
?? LlamaGen 提出了具有 16 倍降采樣比、0. 94 的重建質(zhì)量和97% 碼書利用率的圖像分詞器，在 ImageNet 基準(zhǔn)測(cè)試上表現(xiàn)優(yōu)異。
?? LlamaGen 推出了一系列類別條件圖像生成模型，范圍從111M到3.1B參數(shù)，在 ImageNet256× 256 基準(zhǔn)測(cè)試上取得了2. 18 的 FID，超越了流行的擴(kuò)散模型。
?? LlamaGen 推出了文本條件圖像生成模型，具有775M參數(shù)，在 LAION-COCO 的兩階段訓(xùn)練后，展現(xiàn)出高質(zhì)量的美學(xué)圖像和優(yōu)秀的視覺(jué)質(zhì)量與文本對(duì)齊性能。
詳情鏈接:https://top.aibase.com/tool/llamagen

16、未經(jīng)同意人工智能利用兒童照片引發(fā)隱私安全挑戰(zhàn)

這篇文章揭露了人工智能圖像生成器在訓(xùn)練數(shù)據(jù)集中未經(jīng)允許使用巴西兒童個(gè)人照片的嚴(yán)重問(wèn)題，引發(fā)了兒童隱私和安全的嚴(yán)峻挑戰(zhàn)。文章呼吁政府和科技公司承擔(dān)責(zé)任，保護(hù)兒童數(shù)據(jù)不被濫用，制定相應(yīng)的保護(hù)措施。

【AiBase提要:】
?? 未經(jīng)允許使用兒童照片：人工智能圖像生成器訓(xùn)練數(shù)據(jù)集中存在大量未經(jīng)允許使用的巴西兒童個(gè)人照片，涉及兒童整個(gè)童年時(shí)期的珍貴片段。
?? 兒童隱私風(fēng)險(xiǎn)：照片中包含兒童的姓名和位置信息，使其身份易被追蹤，可能導(dǎo)致欺凌、釣魚等風(fēng)險(xiǎn)，甚至生成不當(dāng)內(nèi)容。
?? 呼吁保護(hù)措施：人權(quán)組織呼吁政府明確禁止未經(jīng)允許使用兒童個(gè)人數(shù)據(jù)訓(xùn)練AI系統(tǒng)，加強(qiáng)兒童數(shù)據(jù)保護(hù)，設(shè)計(jì)追責(zé)途徑。

（舉報(bào)）

相關(guān)推薦

關(guān)鍵詞：

Midjourney

薦AI日?qǐng)?bào)：字節(jié)發(fā)布豆包1.5深度思考模型；微信首個(gè)AI助手 “元寶” 上線；OpenAI發(fā)布o(jì)4-mini、滿血版o3

歡迎來(lái)到【AI日?qǐng)?bào)】欄目!這里是你每天探索人工智能世界的指南，每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容，聚焦開發(fā)者，助你洞悉技術(shù)趨勢(shì)、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點(diǎn)擊了解:https://top.aibase.com/1、OpenAI發(fā)布兩款多模態(tài)推理模型o4-mini、滿血版o3OpenAI在技術(shù)直播中推出了其最新的多模態(tài)模型o4-mini和滿血版o3，這兩款模型具備同時(shí)處理文本、圖像和音頻的能力，并能調(diào)用外部工?

?人工智能 ?多模態(tài)模型 ?OpenAI
薦AI日?qǐng)?bào)：ChatGPT重磅上線圖像庫(kù)功能；白嫖！Veo2登陸谷歌AI Studio；螞蟻百寶箱推“MCP專區(qū)”

歡迎來(lái)到【AI日?qǐng)?bào)】欄目!這里是你每天探索人工智能世界的指南，每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容，聚焦開發(fā)者，助你洞悉技術(shù)趨勢(shì)、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點(diǎn)擊了解:https://top.aibase.com/1、報(bào)道稱字節(jié)跳動(dòng)整合 AI 研發(fā)團(tuán)隊(duì)，AI Lab 即將并入 Seed字節(jié)跳動(dòng)正在進(jìn)行AI研發(fā)團(tuán)隊(duì)的整合，將獨(dú)立的字節(jié)AI Lab并入Seed團(tuán)隊(duì)。這一舉措體現(xiàn)了字節(jié)在AI領(lǐng)域戰(zhàn)略布局的調(diào)整，旨在進(jìn)?

?字節(jié)跳動(dòng) ?AI研發(fā) ?AI
薦AI日?qǐng)?bào)：小米首個(gè)推理大模型開源Xiaomi MiMo；快手上線AI筆記工具“喵記多”；騰訊拆分AI團(tuán)隊(duì)

本文匯總了AI領(lǐng)域最新動(dòng)態(tài)：1)小米開源70億參數(shù)大模型Xiaomi MiMo，在數(shù)學(xué)推理和代碼競(jìng)賽中超越OpenAI和阿里模型；2)快手推出AI筆記工具"喵記多"，簡(jiǎn)化筆記管理；3)Luma AI發(fā)布電影級(jí)鏡頭控制API，降低視頻生成門檻；4)騰訊重組AI團(tuán)隊(duì)，加大語(yǔ)言模型研發(fā)投入；5)Anthropic為Claude引入新語(yǔ)音"Glassy"；6)谷歌NotebookLM新增50+語(yǔ)言音頻概述功能；7)xAI將發(fā)布Grok3.5模型；8)Meta推出獨(dú)立AI助手應(yīng)用挑戰(zhàn)ChatGPT；9)OpenAI緊急修復(fù)GPT-4o"諂媚"問(wèn)題；10)Mac本地AI助手Simular升級(jí)隱私保護(hù)；11)CameraBench項(xiàng)目幫助AI理解鏡頭運(yùn)動(dòng)；12)谷歌推出個(gè)性化語(yǔ)言學(xué)習(xí)AI工具。

?人工智能 ?Xiaomi ?MiMo
薦AI日?qǐng)?bào)：智譜開源32B/9B系列GLM模型并啟用Z.ai域名；OpenAI發(fā)布GPT-4.1系列模型；阿里魔搭上線MCP廣場(chǎng)

歡迎來(lái)到【AI日?qǐng)?bào)】欄目!這里是你每天探索人工智能世界的指南，每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容，聚焦開發(fā)者，助你洞悉技術(shù)趨勢(shì)、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點(diǎn)擊了解:https://top.aibase.com/1、智譜AI啟用全新域名Z.ai 并開源32B/9B 系列 GLM 模型智譜技術(shù)團(tuán)隊(duì)近期宣布開源32B和9B系列的GLM模型，并推出全新交互體驗(yàn)平臺(tái)Z.ai。這些模型遵循MIT許可協(xié)議，支持商業(yè)用途，提升了

?人工智能 ?開源模型 ?GLM模型
薦AI日?qǐng)?bào)：Kimi全新音頻基礎(chǔ)模型Kimi-Audio；階躍星辰開源圖像編輯模型Step1X-Edit；?夸克AI超級(jí)框上線 “拍照問(wèn)夸克”

本期AI日?qǐng)?bào)聚焦多項(xiàng)AI技術(shù)突破與應(yīng)用：1)Moonshot AI推出開源音頻模型Kimi-Audio，基于13億小時(shí)訓(xùn)練數(shù)據(jù)，支持語(yǔ)音識(shí)別等任務(wù)；2)階躍星辰開源圖像編輯模型Step1X-Edit，展現(xiàn)強(qiáng)大生成能力；3)夸克AI上線"拍照問(wèn)夸克"功能，實(shí)現(xiàn)視覺(jué)問(wèn)答；4)蘋果iOS18.5將在中國(guó)推送，帶來(lái)智能功能；5)谷歌發(fā)布601個(gè)生成式AI應(yīng)用案例，覆蓋多行業(yè)；6)微軟推出深度整合Windows的UFO2自動(dòng)化系統(tǒng)；7)OpenAI升級(jí)ChatGPT至GPT-4o版本，提升STEM領(lǐng)域能力；8)Ema公司推出高性價(jià)比語(yǔ)言模型EmaFusion；9)Liquid AI發(fā)布面向邊緣設(shè)備的Hyena Edge模型；10)LemonAI推出實(shí)時(shí)音視頻數(shù)字人產(chǎn)品Slice Live。此外，國(guó)內(nèi)方面，智譜與生數(shù)科技達(dá)成戰(zhàn)略合作推動(dòng)大模型發(fā)展，寶馬中國(guó)宣布新車將接入DeepSeek技術(shù)。

?AI日?qǐng)?bào) ?音頻技術(shù) ?開源模型
薦AI日?qǐng)?bào)：蘋果AI國(guó)行版或隨iOS 18.6月底上線；Suno v4.5正式上線；Runway發(fā)布圖像一致性參考功能

本文匯總了AI領(lǐng)域最新動(dòng)態(tài)：1)英偉達(dá)開源語(yǔ)音識(shí)別模型Parakeet-TDT-0.6B-V2，提升轉(zhuǎn)寫效率；2)Suno音樂(lè)平臺(tái)v4.5版本支持8分鐘歌曲生成；3)Runway推出圖像一致性參考功能Gen-4 References；4)Midjourney V7新增"Omni-Reference"圖像控制功能；5)Claude將引入MCP協(xié)議提升集成能力；6)iOS18.6或?yàn)橹袊?guó)用戶啟用AI功能；7)OpenAI宣布回歸非營(yíng)利模式；8)Freepik發(fā)布版權(quán)安全的F-Lite圖像模型；9)OpenAI以30億美

?人工智能 ?語(yǔ)音識(shí)別 ?開源軟件
最新AI資訊日?qǐng)?bào)平臺(tái)推薦 AI日?qǐng)?bào)周報(bào)合集去哪看？

AIbase基地是一個(gè)專注于人工智能領(lǐng)域的綜合性平臺(tái)，致力于為用戶提供豐富的AI資訊、工具和資源，幫助用戶更好地了解和探索人工智能的前沿動(dòng)態(tài)和發(fā)展趨勢(shì)。無(wú)論是關(guān)注行業(yè)動(dòng)態(tài)、學(xué)習(xí)AI技術(shù)是尋找AI產(chǎn)品和項(xiàng)目，AIbase基地都能滿足用戶的需求，是通往AGI之路上的一個(gè)重要助力。數(shù)據(jù)可視化:通過(guò)各種榜單的形式，將復(fù)雜的AI產(chǎn)品和項(xiàng)目數(shù)據(jù)進(jìn)行可視化展示，使用戶能夠更加直觀地了解市場(chǎng)趨勢(shì)和行業(yè)動(dòng)態(tài)，便于做出決策。

?人工智能 ?AI新聞 ?AI工具
可靈AI發(fā)布全新2.0模型：上線多模態(tài)視頻編輯功能

快科技4月16日消息，據(jù)報(bào)道，可靈AI在北京舉行靈感成真”2.0模型發(fā)布會(huì)，正式發(fā)布可靈2.0視頻生成模型及可圖2.0圖像生成模型。據(jù)介紹，可靈2.0模型在動(dòng)態(tài)質(zhì)量、語(yǔ)義響應(yīng)、畫面美學(xué)等維度保持領(lǐng)先；可圖2.0模型在指令遵循、電影質(zhì)感及藝術(shù)風(fēng)格表現(xiàn)等方面顯著提升。3月27日，全球AI基準(zhǔn)測(cè)試機(jī)構(gòu)Artificial Analysis發(fā)布了最新的全球視頻生成大模型榜單，快手可靈1.6pro（高品質(zhì)模

?可靈AI ?視頻生成模型 ?圖像生成模型
薦AI日?qǐng)?bào)：昆侖萬(wàn)維開源Skywork-OR1系列模型；訊飛星辰Agent開發(fā)平臺(tái)全面支持MCP；字節(jié)跳動(dòng)布局AI智能眼鏡

歡迎來(lái)到【AI日?qǐng)?bào)】欄目!這里是你每天探索人工智能世界的指南，每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容，聚焦開發(fā)者，助你洞悉技術(shù)趨勢(shì)、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點(diǎn)擊了解:https://top.aibase.com/1、Kimi開源視覺(jué)語(yǔ)言模型 Kimi-VL 與 Kimi-VL-Thinking，多項(xiàng)基準(zhǔn)超越 GPT-4oMoonshot AI 最近開源了 Kimi-VL 和 Kimi-VL-Thinking 兩款視覺(jué)語(yǔ)言模型，展現(xiàn)出卓越的多模態(tài)理解與推理能力。這些模型采

?人工智能 ?視覺(jué)語(yǔ)言模型 ?Kimi-VL
薦AI日?qǐng)?bào)：國(guó)內(nèi)首個(gè)多模態(tài)AI程序員上崗；字節(jié)啟動(dòng)Top Seed計(jì)劃招募AI人才；DeepSeek R1T Chimera上線OpenRouter

【AI日?qǐng)?bào)】今日AI領(lǐng)域重要?jiǎng)討B(tài)：1.百度發(fā)布文心快碼3.5及多模態(tài)AI程序員"文心快碼Comate Zulu"，提升開發(fā)效率；2.字節(jié)跳動(dòng)啟動(dòng)"Top Seed"計(jì)劃，招募30名AI博士人才；3.DeepSeek開源R1T Chimera模型上線OpenRouter平臺(tái)；4.阿里AI工程師余亮獲"全國(guó)勞動(dòng)模范"稱號(hào)；5.開源圖像編輯工具Step1X-Edit登陸Hugging Face，性能媲美GPT-4o；6.谷歌被曝每月向三星支付巨額資金預(yù)裝Gemini應(yīng)用

?人工智能 ?AI編程工具 ?多模態(tài)交互

熱文

3 天
7天

站長(zhǎng)商機(jī)

廣告

商務(wù)合作侵權(quán)投訴廣告服務(wù) 版權(quán)聲明招聘

?CopyRight 2002-2020 CHINAZ.COM