歡迎來(lái)到【AI日?qǐng)?bào)】欄目!這里是你每天探索人工智能世界的指南,每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容,聚焦開(kāi)發(fā)者,助你洞悉技術(shù)趨勢(shì)、了解創(chuàng)新AI產(chǎn)品應(yīng)用。
新鮮AI產(chǎn)品點(diǎn)擊了解:https://top.aibase.com/
1、谷歌推超強(qiáng)多模態(tài)模型實(shí)驗(yàn)版Gemini1.5Pro,排名領(lǐng)先GPT-4o、Claude-3.5Sonnet
谷歌今天推出了Gemini1.5Pro實(shí)驗(yàn)版本0801,在人工智能領(lǐng)域取得重大突破。Gemini1.5Pro在多任務(wù)表現(xiàn)出色,具有多模態(tài)能力和廣闊上下文窗口,引發(fā)了AI發(fā)展和社會(huì)影響的討論。
【AiBase提要:】
?? 谷歌推出Gemini1.5Pro實(shí)驗(yàn)版本0801,在排行榜上領(lǐng)先競(jìng)爭(zhēng)對(duì)手。
?? 該模型在多任務(wù)中表現(xiàn)出色,具有多模態(tài)能力和廣闊上下文窗口。
?? 發(fā)布引發(fā)AI發(fā)展和社會(huì)影響的討論,谷歌尋求反饋以完善模型。
詳情鏈接:https://top.aibase.com/tool/gemini-pro
2、AI圖像生成迎來(lái)新霸主!開(kāi)源模型FLUX.1橫空出世,Midjourney、DALL·E3緊張了?
在人工智能領(lǐng)域,每一天都可能發(fā)生顛覆性的變革。FLUX.1作為一匹令人矚目的黑馬,以其強(qiáng)大性能和開(kāi)源特性引爆了AI圈。創(chuàng)始人Robin Rombach的權(quán)威背景和FLUX.1的創(chuàng)新架構(gòu)使其成為AI圖像生成領(lǐng)域的新霸主,為整個(gè)AI行業(yè)注入新活力。
【AiBase提要:】
?? FLUX.1超越閉源模型和開(kāi)源SD3系列,性能大幅領(lǐng)先
?? 基于Vision Transformer架構(gòu),采用流程匹配訓(xùn)練方法,提升模型性能
?? FLUX.1展現(xiàn)出在文本嵌入圖片等方面的明顯優(yōu)勢(shì)
詳情鏈接:https://github.com/black-forest-labs/flux
3、Stability AI推新AI模型Stable Fast3D:半秒內(nèi)生成3D圖像 速度提升1200倍
Stability AI最新推出的Stable Fast3D技術(shù)實(shí)現(xiàn)了從單張圖像快速生成3D圖像,處理速度比之前快1200倍,具有廣泛的實(shí)用價(jià)值。該技術(shù)基于先進(jìn)的生成式AI模型,為設(shè)計(jì)、建筑、零售、虛擬現(xiàn)實(shí)和游戲開(kāi)發(fā)等多個(gè)行業(yè)帶來(lái)革命性變革。
【AiBase提要:】
??Stable Fast3D技術(shù)實(shí)現(xiàn)半秒內(nèi)生成3D圖像,速度大幅提升
??新模型在設(shè)計(jì)、建筑、零售、虛擬現(xiàn)實(shí)和游戲開(kāi)發(fā)等多個(gè)行業(yè)具有實(shí)用價(jià)值
??Stability AI持續(xù)引領(lǐng)圖像生成技術(shù)發(fā)展,從2D到4D不斷創(chuàng)新
詳情鏈接:https://top.aibase.com/tool/stable-fast-3d
4、AI視頻創(chuàng)作平臺(tái)Hedra融資1000萬(wàn)美元
近日,AI視頻創(chuàng)作領(lǐng)域迎來(lái)重磅消息,Hedra成功籌集1000萬(wàn)美元種子資金,引發(fā)廣泛關(guān)注。Hedra推出了視頻基礎(chǔ)模型Character-1,已有超35萬(wàn)用戶(hù)創(chuàng)作超160萬(wàn)視頻,部分走紅網(wǎng)絡(luò)。多家公司推出視頻生成模型,大公司積極參與AI驅(qū)動(dòng)的視頻創(chuàng)作。
【AiBase提要:】
?? Hedra獲1000萬(wàn)美元種子資金,推出Character-1模型。
?? 超35萬(wàn)用戶(hù)使用Character-1創(chuàng)作超160萬(wàn)視頻,部分走紅網(wǎng)絡(luò)。
?? 多家公司推出視頻生成模型,大公司積極參與AI驅(qū)動(dòng)的視頻創(chuàng)作。
詳情鏈接:https://www.hedra.com/blog/announcement
5、阿里語(yǔ)音合成模型CosyVoice更新 讓AI說(shuō)話更有人味兒
阿里巴巴推出的最新語(yǔ)音合成模型CosyVoice展示了未來(lái)人機(jī)交互的美好藍(lán)圖,逼真度和靈活性令人驚嘆。該技術(shù)不僅能生成符合特定性別、年齡和個(gè)性的聲音,還能模擬人類(lèi)說(shuō)話時(shí)的自然特征,添加情感和風(fēng)格,使AI表達(dá)更加豐富多彩。CosyVoice與SenseVoice構(gòu)成FunAudioLLM框架,提升語(yǔ)音交互體驗(yàn),支持多語(yǔ)言識(shí)別和情感識(shí)別。技術(shù)突破預(yù)示著人機(jī)交互將迎來(lái)全新時(shí)代,為教育、娛樂(lè)、客戶(hù)服務(wù)等領(lǐng)域帶來(lái)革命性變化。
【AiBase提要:】
?? CosyVoice模型展示未來(lái)人機(jī)交互藍(lán)圖,逼真靈活,生成符合性別、年齡、個(gè)性聲音,模擬自然特征,添加情感風(fēng)格。
?? FunAudioLLM框架提升語(yǔ)音交互體驗(yàn),SenseVoice支持多語(yǔ)言識(shí)別和情感識(shí)別,反應(yīng)速度快,應(yīng)用前景廣泛。
?? 技術(shù)突破預(yù)示人機(jī)交互新時(shí)代,CosyVoice和FunAudioLLM為教育、娛樂(lè)、客戶(hù)服務(wù)等領(lǐng)域帶來(lái)革命性變化。
詳情鏈接:https://top.aibase.com/tool/cosyvoice
6、阿里國(guó)際站AI生意助手再升級(jí):文本類(lèi)AI生成能力完全免費(fèi)
阿里巴巴國(guó)際站總裁張闊宣布AI生意助手的全新發(fā)布,包括極簡(jiǎn)發(fā)品功能和AI自動(dòng)接待功能。AI技術(shù)的應(yīng)用顯著降低外貿(mào)行業(yè)門(mén)檻,已有3萬(wàn)家中小企業(yè)使用,優(yōu)化后的商品曝光量提高了37%,支付轉(zhuǎn)化率提升了50%。AI生意助手成為商家高效經(jīng)營(yíng)和快速接單的得力助手。更新的三大權(quán)益提供更靈活的使用方式,文本類(lèi)AI生成能力免費(fèi),不滿意的功能可免費(fèi)二次生成。將持續(xù)更新更多功能。
【AiBase提要:】
?? AI生意助手極簡(jiǎn)發(fā)品功能縮短商家發(fā)布時(shí)間至最快60秒。
?? AI自動(dòng)接待功能提升海外買(mǎi)家二次回復(fù)率約40%。
?? AI技術(shù)應(yīng)用降低外貿(mào)行業(yè)門(mén)檻,3萬(wàn)家中小企業(yè)使用,商品曝光量提高37%,支付轉(zhuǎn)化率提升50%。
7、桌面ChromeAI搜索升級(jí),引入類(lèi)似Circle to Search的功能
Google Lens在桌面版Chrome中進(jìn)行AI驅(qū)動(dòng)的升級(jí),為用戶(hù)帶來(lái)更便捷的搜索體驗(yàn)。用戶(hù)可以通過(guò)點(diǎn)擊搜索框中的新按鈕激活Google Lens,實(shí)現(xiàn)多重搜索并查看文本和圖像搜索結(jié)果。此更新將全球推出,部分功能僅對(duì)美國(guó)用戶(hù)開(kāi)放。另外,Chrome還新增了AI功能,允許用戶(hù)通過(guò)提問(wèn)搜索歷史來(lái)查找鏈接。這些功能將逐步在未來(lái)幾天或幾周內(nèi)在美國(guó)用戶(hù)中推出。
【AiBase提要:】
?? Google Lens在桌面版Chrome進(jìn)行AI驅(qū)動(dòng)升級(jí),用戶(hù)可通過(guò)點(diǎn)擊搜索框按鈕激活并進(jìn)行多重搜索。
?? 更新將在“未來(lái)幾天”全球推出,部分功能僅對(duì)美國(guó)用戶(hù)開(kāi)放。
?? Chrome新增可詢(xún)問(wèn)搜索歷史的AI功能,將“在未來(lái)幾周內(nèi)”在美國(guó)推出,用戶(hù)可選擇,目前依靠云模型提供結(jié)果。
8、以色列人工智能初創(chuàng)公司aiOla推出超高速開(kāi)源語(yǔ)音識(shí)別模型Whisper-Medusa
aiOla推出的Whisper-Medusa語(yǔ)音識(shí)別模型在速度上比OpenAI的Whisper提升了50%,并保持了準(zhǔn)確性。這一舉措將加快語(yǔ)音應(yīng)用的響應(yīng)速度,提升效率,降低成本。
【AiBase提要:】
?? 速度提升50%: Whisper-Medusa比OpenAI的Whisper速度快50%
?? 不損準(zhǔn)確性: Whisper-Medusa在提升速度的同時(shí)保持了與原模型相同的準(zhǔn)確性
?? 應(yīng)用前景廣: Whisper-Medusa有望加快語(yǔ)音應(yīng)用的響應(yīng)速度,提升效率,降低成本
9、Suno聲稱(chēng)用受版權(quán)保護(hù)的音樂(lè)進(jìn)行訓(xùn)練模型是“合理使用”
本文報(bào)道了美國(guó)唱片業(yè)協(xié)會(huì)(RIAA)對(duì)音樂(lè)生成初創(chuàng)公司 Udio 和 Suno 提起訴訟的情況。Suno 承認(rèn)使用受版權(quán)保護(hù)的音樂(lè)訓(xùn)練其 AI 模型,并聲稱(chēng)這屬于合理使用。RIAA 對(duì)此表示不認(rèn)同,認(rèn)為這是侵權(quán)行為。案件結(jié)果可能影響相關(guān)領(lǐng)域的先例。
【AiBase提要:】
?? RIAA 起訴 Udio 和 Suno 使用版權(quán)音樂(lè)訓(xùn)練模型。
?? Suno 承認(rèn)用受版權(quán)保護(hù)的音樂(lè)進(jìn)行訓(xùn)練模型,但稱(chēng)此為合理使用。
?? 案件結(jié)果可能開(kāi)創(chuàng)影響相關(guān)領(lǐng)域的先例。
10、微軟首次在SEC文件中將OpenAI列為競(jìng)爭(zhēng)對(duì)手
微軟近日在提交給美國(guó)證券交易委員會(huì)(SEC)的年度10K報(bào)告中,首次將其長(zhǎng)期合作伙伴OpenAI列為競(jìng)爭(zhēng)對(duì)手,引發(fā)業(yè)界猜測(cè)。這一舉動(dòng)可能受當(dāng)前反壟斷環(huán)境影響,微軟與OpenAI的關(guān)系走向仍有待觀察。
【AiBase提要:】
?? 微軟將OpenAI列為競(jìng)爭(zhēng)對(duì)手,引發(fā)業(yè)界關(guān)注。
?? 微軟投資OpenAI130億美元,成為獨(dú)家云提供商。
?? 合作伙伴與競(jìng)爭(zhēng)對(duì)手并非互斥,微軟與OpenAI關(guān)系變化有先例。
11、庫(kù)克稱(chēng)蘋(píng)果AI將推動(dòng)用戶(hù)升級(jí)
蘋(píng)果公司在2024年第三財(cái)季取得了穩(wěn)健的財(cái)務(wù)業(yè)績(jī),尤其是服務(wù)營(yíng)收實(shí)現(xiàn)了增長(zhǎng)。蒂姆·庫(kù)克透露了關(guān)于Apple Intelligence的部分特性和未來(lái)發(fā)布的新款iPhone16,展望了蘋(píng)果在人工智能領(lǐng)域的發(fā)展。
【AiBase提要:】
?? 蘋(píng)果公司2024年第三財(cái)季總凈營(yíng)收達(dá)857.77億美元,同比增長(zhǎng)5%。
?? iPhone營(yíng)收達(dá)392.96億美元,Mac和iPad營(yíng)收增長(zhǎng),服務(wù)營(yíng)收達(dá)242.13億美元。
?? Apple Intelligence功能將逐步推出,新款iPhone16即將發(fā)布,將支持AI技術(shù)。
12、300余名視頻游戲演員聯(lián)合抗議 聲討好萊塢無(wú)監(jiān)管AI使用!
在好萊塢星光閃耀的背后,演員們團(tuán)結(jié)起來(lái)抗議無(wú)監(jiān)管AI使用,維護(hù)自身權(quán)益。這場(chǎng)抗議凸顯了人工智能時(shí)代下演員生存權(quán)的重要性。
【AiBase提要:】
?? 演員抗議無(wú)監(jiān)管AI使用,維護(hù)權(quán)益。
?? 人工智能威脅演員生存,聲音形象或被濫用。
?? 演員與游戲公司談判僵局,關(guān)鍵在于誰(shuí)是表演者。
13、港大與MIT聯(lián)手打造ItiNera:你的私人AI導(dǎo)游,一鍵規(guī)劃完美Citywalk路線!
在都市的喧囂中,每個(gè)人都渴望一場(chǎng)說(shuō)走就走的citywalk,穿梭于大街小巷,探索歷史遺跡,沉浸在當(dāng)?shù)匚幕?。ItiNera系統(tǒng)通過(guò)結(jié)合空間優(yōu)化與大型語(yǔ)言模型,提供個(gè)性化的城市行程規(guī)劃服務(wù),為旅行者帶來(lái)全新的探索城市方式。
【AiBase提要:】
?? ItiNera是開(kāi)放域城市行程規(guī)劃系統(tǒng),能根據(jù)用戶(hù)自然語(yǔ)言描述生成個(gè)性化行程。
??? ItiNera利用LLM與空間優(yōu)化模塊,提取和排序POIs,打造空間連貫的行程。
?? ItiNera已在TuTu在線旅行服務(wù)上部署,吸引數(shù)千用戶(hù)使用其城市旅行規(guī)劃服務(wù)。
詳情鏈接:https://arxiv.org/pdf/2402.07204
(舉報(bào))