歡迎來(lái)到【AI日?qǐng)?bào)】欄目!這里是你每天探索人工智能世界的指南,每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容,聚焦開發(fā)者,助你洞悉技術(shù)趨勢(shì)、了解創(chuàng)新AI產(chǎn)品應(yīng)用。
新鮮AI產(chǎn)品點(diǎn)擊了解:https://top.aibase.com/
1、Midjourney推出模型個(gè)性化功能
Midjourney最近推出了一項(xiàng)創(chuàng)新的模型個(gè)性化功能,允許用戶根據(jù)審美偏好微調(diào)MJ模型,使生成的圖像更貼近個(gè)人喜好。個(gè)性化模型通過(guò)分析用戶喜歡的圖片來(lái)實(shí)現(xiàn),學(xué)習(xí)用戶獨(dú)特審美,滿足用戶品味。用戶需對(duì)至少 200 張圖片進(jìn)行評(píng)分或點(diǎn)贊,啟用個(gè)性化功能后,在提示后添加特定代碼分享個(gè)性化效果。
【AiBase提要:】
?? 模型個(gè)性化功能允許用戶根據(jù)審美偏好微調(diào)MJ模型,使生成圖像更符合個(gè)人喜好。
?? 個(gè)性化模型通過(guò)分析用戶過(guò)往喜歡的圖片,學(xué)習(xí)用戶獨(dú)特審美,提高生成圖像準(zhǔn)確性。
?? 用戶需對(duì)至少 200 張圖片進(jìn)行評(píng)分或點(diǎn)贊,啟用個(gè)性化功能后,在提示后添加特定代碼分享個(gè)性化效果。
詳情鏈接:https://www.midjourney.com/rank
2、為了迎接即將開源的SD3 Medium 模型 ComfyUI已提前完成適配
SD3Medium 模型即將開源,為了迎接這一重要時(shí)刻,ComfyUI已經(jīng)提前進(jìn)行了適配工作,做好了迎接新模型的準(zhǔn)備。屆時(shí),大家生圖可以體驗(yàn)更真實(shí)的質(zhì)感,更好的構(gòu)圖,更優(yōu)的性能以及更出色的微調(diào)能力。
【AiBase提要:】
?? SD3 Medium 模型即將開源,ComfyUI已完成提前適配工作。
??? SD3 Medium 在圖像生成方面取得顯著進(jìn)步,能夠生成細(xì)節(jié)豐富且高度逼真的圖像。
?? SD3 Medium 在生成高質(zhì)量、細(xì)節(jié)豐富的圖像方面具備強(qiáng)大能力。
詳情:
https://github.com/comfyanonymous/ComfyUI/commit/8c4a9befa7261b6fc78407ace90a57d21bfe631e
3、微信輸入法內(nèi)測(cè)AI功能 只要按這個(gè)鍵就可以獲取AI回答
微信輸入法內(nèi)測(cè)版本新增AI助手功能,按“=”獲取AI生成回答。emoji和顏文字推薦支持。增強(qiáng)對(duì)時(shí)間、日期輸入格式支持。
【AiBase提要:】
??微信輸入法新增AI助手功能,按“=”獲取AI生成回答。
??更新加強(qiáng)對(duì)emoji和顏文字的支持,增強(qiáng)對(duì)時(shí)間、日期輸入格式的支持。
??目前內(nèi)測(cè)版本僅面向Windows用戶,iOS、Android和Mac平臺(tái)可能會(huì)推出。
4、字節(jié)上線AI虛擬交友聊天產(chǎn)品小黃蕉 可生成照片,接近真人對(duì)話場(chǎng)景
近日,一款名為“小黃蕉”(英文名Chatwiz)的AI虛擬交友聊天產(chǎn)品上線,其特點(diǎn)是能夠生成照片,且對(duì)話過(guò)程非常接近真人。經(jīng)查證,該產(chǎn)品的工商主體為北京臻鼎科技有限公司(番茄小說(shuō)),而其背后的實(shí)際控制者是字節(jié)跳動(dòng)公司。
【AiBase提要:】
? 小黃蕉是AI虛擬交友聊天產(chǎn)品,能生成照片,對(duì)話接近真人。
? 字節(jié)跳動(dòng)積極布局AI大模型,推出多款A(yù)I產(chǎn)品和服務(wù)。
? “小黃蕉”展現(xiàn)了字節(jié)跳動(dòng)在AI應(yīng)用領(lǐng)域的持續(xù)探索和創(chuàng)新。
5、科大訊飛:將于 6 月 27 日發(fā)布訊飛星火V4.0 展示最新智能語(yǔ)音技術(shù)
科大訊飛將于 6 月 27 日發(fā)布訊飛星火V4.0,展示最新的端到端智能語(yǔ)音技術(shù)成果,包括一句話復(fù)刻、高噪音場(chǎng)景語(yǔ)音識(shí)別和多方言多語(yǔ)種免切換功能。劉慶峰透露,科大訊飛在全雙工技術(shù)和超擬人合成技術(shù)方面處于國(guó)際領(lǐng)先水平。未來(lái),科大訊飛將專注于遠(yuǎn)場(chǎng)高噪音多人說(shuō)話場(chǎng)景、高表現(xiàn)力個(gè)性化場(chǎng)景等領(lǐng)域的研發(fā)。
【AiBase提要:】
?? 訊飛星火V4. 0 將展示最新的端到端智能語(yǔ)音技術(shù)成果,包括一句話復(fù)刻、高噪音場(chǎng)景語(yǔ)音識(shí)別和多方言多語(yǔ)種免切換功能。
?? 科大訊飛在全雙工技術(shù)和超擬人合成技術(shù)方面達(dá)到國(guó)際領(lǐng)先水平。
?? 未來(lái),科大訊飛將專注于遠(yuǎn)場(chǎng)高噪音多人說(shuō)話場(chǎng)景、高表現(xiàn)力個(gè)性化場(chǎng)景等領(lǐng)域的研發(fā)。
6、蘋果宣布新AI功能后股價(jià)創(chuàng)歷史新高
蘋果公司股價(jià)周二收盤時(shí)上漲超過(guò)7%,創(chuàng)下歷史新高。這次反彈為蘋果今年的表現(xiàn)帶來(lái)了一線希望,展示了市場(chǎng)對(duì)蘋果新的人工智能功能的積極態(tài)度。
【AiBase提要:】
?? 蘋果股價(jià)周二上漲超過(guò)7%,創(chuàng)歷史新高,市值有望達(dá)到3. 18 萬(wàn)億美元,僅次于微軟。
?? 新的人工智能功能提高了蘋果設(shè)備的吸引力,包括改進(jìn)的 Siri 虛擬助手和多項(xiàng)AI功能。
?? 開發(fā)者活動(dòng)后,分析師上調(diào)對(duì)蘋果股票的目標(biāo)價(jià),預(yù)計(jì)新功能將刺激秋季新iPhone系列的購(gòu)買。
7、Follow-Your-Emoji:通過(guò)捕捉人物表情變化生成表情豐富的動(dòng)畫
Follow-Your-Emoji是一項(xiàng)突破性技術(shù),通過(guò)提取視頻中人物的面部特征生成全新的面部動(dòng)畫。這項(xiàng)技術(shù)精確捕捉面部特征和瞳孔點(diǎn),排除面部輪廓干擾,實(shí)現(xiàn)更自然、更生動(dòng)的動(dòng)畫效果。應(yīng)用廣泛,娛樂(lè)、教育、商業(yè)領(lǐng)域皆可受益。
【AiBase提要:】
?? 用戶提供照片,技術(shù)生成視頻動(dòng)畫,捕捉微妙表情變化。
?? 身份保持,參考頭像身份特征得到保留,不會(huì)丟失。
?? 表情豐富,生成各種表情,包括瞳孔運(yùn)動(dòng),讓動(dòng)畫更生動(dòng)、真實(shí)。
詳情鏈接:https://top.aibase.com/tool/follow-your-emoji
8、在線AI圖像編輯器Freepik Designer
Freepik Designer是一款創(chuàng)新的在線AI圖像編輯器,為用戶提供了簡(jiǎn)單易用的設(shè)計(jì)工具,無(wú)需專業(yè)設(shè)計(jì)技能即可快速上手。它的AI工具集成讓設(shè)計(jì)過(guò)程更高效,同時(shí)提供豐富的模板庫(kù),滿足不同設(shè)計(jì)需求。
【AiBase提要:】
?? 簡(jiǎn)單易用的設(shè)計(jì)工具,無(wú)需專業(yè)設(shè)計(jì)技能即可快速上手
??? 提供豐富的模板庫(kù),滿足不同設(shè)計(jì)需求
?? 內(nèi)置AI工具集成,提升設(shè)計(jì)效率和質(zhì)量
詳情鏈接:https://top.aibase.com/tool/freepik-designer
9、埃隆?馬斯克撤回對(duì) OpenAI 的訴訟
埃隆?馬斯克撤回了對(duì) OpenAI 的訴訟,指控其違約。馬斯克認(rèn)為 OpenAI 放棄了非營(yíng)利性使命,轉(zhuǎn)向商業(yè)利益。OpenAI 否認(rèn)指控,稱其“不連貫”和“荒謬”。
【AiBase提要:】
?? 埃隆?馬斯克撤回對(duì) OpenAI 的訴訟。
?? 馬斯克指責(zé) OpenAI 放棄非營(yíng)利性使命,轉(zhuǎn)向商業(yè)利益。
?? OpenAI 否認(rèn)指控,稱其“不連貫”和“荒謬”。
10、Yandex推出的開源工具YaFSDP 突破LLM訓(xùn)練效率瓶頸
Yandex開源的YaFSDP工具為全球AI社區(qū)帶來(lái)了突破性的LLM訓(xùn)練優(yōu)化方法,顯著提升訓(xùn)練速度,節(jié)省大量GPU資源,使自主LLM訓(xùn)練更具可行性。Yandex承諾持續(xù)貢獻(xiàn)全球AI社區(qū)發(fā)展,YaFSDP開源是其承諾的體現(xiàn)。
【AiBase提要:】
? YaFSDP是Yandex開源的高效大型語(yǔ)言模型訓(xùn)練優(yōu)化方法,可提升LLM訓(xùn)練速度26%。
?? YaFSDP專注于優(yōu)化GPU通信效率和內(nèi)存使用,在訓(xùn)練參數(shù)規(guī)模達(dá)到 300 億至 700 億時(shí)表現(xiàn)出色。
?? 采用YaFSDP訓(xùn)練 700 億參數(shù)模型可節(jié)省約 150 臺(tái)GPU資源,成本節(jié)約可達(dá) 50 萬(wàn)至 150 萬(wàn)美元。
11、速度提高 410 倍!TiTok僅需 32 個(gè)token就能重建與生成圖片
近期,生成模型的發(fā)展突顯了圖像標(biāo)記化在高分辨率圖像高效合成中的關(guān)鍵作用。TiTok是基于Transformer的一維標(biāo)記化框架,將圖像標(biāo)記化為一維潛在序列,極大提高了生成效率和質(zhì)量。它在處理高分辨率圖像時(shí)表現(xiàn)出色,生成速度顯著提高,同時(shí)保持高質(zhì)量樣本輸出。
【AiBase提要:】
?? 圖像token化降低計(jì)算需求,增強(qiáng)生成效率和有效性。
?? TiTok將圖像標(biāo)記化為一維潛在序列,用少至 32 個(gè)離散token表示256× 256 圖像。
?? TiTok在ImageNet基準(zhǔn)測(cè)試中表現(xiàn)優(yōu)異,生成速度提高 410 倍,同時(shí)保持高質(zhì)量樣本輸出。
12、MIT開發(fā)新算法DenseAV:通過(guò)觀看視頻學(xué)習(xí)語(yǔ)言含義
在MIT開發(fā)的新算法DenseAV中,研究人員利用機(jī)器理解動(dòng)物的交流方式,通過(guò)觀看視頻學(xué)習(xí)語(yǔ)言的含義。該算法能夠無(wú)監(jiān)督學(xué)習(xí)單詞的含義和聲音的位置,實(shí)現(xiàn)跨模態(tài)連接的自然區(qū)分。團(tuán)隊(duì)希望應(yīng)用于理解新語(yǔ)言和發(fā)現(xiàn)不同信號(hào)之間的模式關(guān)聯(lián)。
【AiBase提要:】
?? DenseAV是雙編碼器接地架構(gòu),學(xué)習(xí)高分辨率、語(yǔ)義意義和視聽對(duì)齊的特征。
?? 無(wú)監(jiān)督學(xué)習(xí)發(fā)現(xiàn)單詞含義和聲音位置的關(guān)聯(lián),自動(dòng)區(qū)分語(yǔ)言和聲音。
?? 在跨模態(tài)檢索方面優(yōu)于以前的模型ImageBind,應(yīng)用于學(xué)習(xí)大量視頻和理解新語(yǔ)言。
詳情鏈接:https://top.aibase.com/tool/denseav
13、讓AI更合乎倫理:Source.Plus 提供高質(zhì)量AI訓(xùn)練數(shù)據(jù)
Spawning 致力于為藝術(shù)家提供更多對(duì)其作品在線使用的控制權(quán),Source.Plus 項(xiàng)目推出的數(shù)據(jù)集包含近 4000 萬(wàn)個(gè)公有領(lǐng)域圖片和采用 Creative Commons CC0 許可的圖片,為AI模型的訓(xùn)練提供高質(zhì)量的數(shù)據(jù)。該平臺(tái)為藝術(shù)家和創(chuàng)作者提供了更精細(xì)的作品使用權(quán)限管理,為AI技術(shù)的發(fā)展和應(yīng)用注入新活力。
【AiBase提要:】
?? 數(shù)據(jù)搜索與整理:用戶可快速搜索各種媒體數(shù)據(jù),整理標(biāo)注以滿足訓(xùn)練需求。
?? 高質(zhì)量訓(xùn)練數(shù)據(jù):經(jīng)篩選審核的數(shù)據(jù)保證安全質(zhì)量,合法同意使用。
?? 應(yīng)用場(chǎng)景廣泛:適用于各種AI模型訓(xùn)練,提高準(zhǔn)確性和魯棒性。
詳情鏈接:https://top.aibase.com/tool/source-plusSource.Plus
14、Mistral AI獲得6. 4 億美元B輪融資
Mistral AI近期宣布獲得6. 4 億美元的B輪融資,估值提升至近 60 億美元。這一輪融資由General Catalyst領(lǐng)投,多家知名投資機(jī)構(gòu)和公司參與,加速了Mistral在人工智能領(lǐng)域的發(fā)展和國(guó)際商業(yè)化進(jìn)程。
【AiBase提要:】
?? Mistral AI獲得6. 4 億美元B輪融資,估值提升至近 60 億美元。
?? General Catalyst領(lǐng)投,多家知名投資機(jī)構(gòu)和公司參與,加速了Mistral在人工智能領(lǐng)域的發(fā)展和國(guó)際商業(yè)化進(jìn)程。
?? 生成式AI市場(chǎng)預(yù)計(jì)未來(lái)十年內(nèi)將以每年42%的復(fù)合增長(zhǎng)率達(dá)到1. 3 萬(wàn)億美元,Mistral此次融資將加速商業(yè)化進(jìn)程,拓展分銷渠道。
15、自回歸圖像生成模型LlamaGen
LlamaGen 是一項(xiàng)顛覆性創(chuàng)新,展示了即使在沒(méi)有視覺(jué)信號(hào)歸納偏差的情況下,自回歸模型也能實(shí)現(xiàn)領(lǐng)先的圖像生成性能。該技術(shù)為圖像生成領(lǐng)域帶來(lái)新可能性,為未來(lái)研究提供新思路。
【AiBase提要:】
?? LlamaGen 提出了具有 16 倍降采樣比、0. 94 的重建質(zhì)量和97% 碼書利用率的圖像分詞器,在 ImageNet 基準(zhǔn)測(cè)試上表現(xiàn)優(yōu)異。
?? LlamaGen 推出了一系列類別條件圖像生成模型,范圍從111M到3.1B參數(shù),在 ImageNet256× 256 基準(zhǔn)測(cè)試上取得了2. 18 的 FID,超越了流行的擴(kuò)散模型。
?? LlamaGen 推出了文本條件圖像生成模型,具有775M參數(shù),在 LAION-COCO 的兩階段訓(xùn)練后,展現(xiàn)出高質(zhì)量的美學(xué)圖像和優(yōu)秀的視覺(jué)質(zhì)量與文本對(duì)齊性能。
詳情鏈接:https://top.aibase.com/tool/llamagen
16、未經(jīng)同意 人工智能利用兒童照片引發(fā)隱私安全挑戰(zhàn)
這篇文章揭露了人工智能圖像生成器在訓(xùn)練數(shù)據(jù)集中未經(jīng)允許使用巴西兒童個(gè)人照片的嚴(yán)重問(wèn)題,引發(fā)了兒童隱私和安全的嚴(yán)峻挑戰(zhàn)。文章呼吁政府和科技公司承擔(dān)責(zé)任,保護(hù)兒童數(shù)據(jù)不被濫用,制定相應(yīng)的保護(hù)措施。
【AiBase提要:】
?? 未經(jīng)允許使用兒童照片:人工智能圖像生成器訓(xùn)練數(shù)據(jù)集中存在大量未經(jīng)允許使用的巴西兒童個(gè)人照片,涉及兒童整個(gè)童年時(shí)期的珍貴片段。
?? 兒童隱私風(fēng)險(xiǎn):照片中包含兒童的姓名和位置信息,使其身份易被追蹤,可能導(dǎo)致欺凌、釣魚等風(fēng)險(xiǎn),甚至生成不當(dāng)內(nèi)容。
?? 呼吁保護(hù)措施:人權(quán)組織呼吁政府明確禁止未經(jīng)允許使用兒童個(gè)人數(shù)據(jù)訓(xùn)練AI系統(tǒng),加強(qiáng)兒童數(shù)據(jù)保護(hù),設(shè)計(jì)追責(zé)途徑。
(舉報(bào))