歡迎來到【AI日報(bào)】欄目!這里是你每天探索人工智能世界的指南,每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容,聚焦開發(fā)者,助你洞悉技術(shù)趨勢、了解創(chuàng)新AI產(chǎn)品應(yīng)用。
新鮮AI產(chǎn)品點(diǎn)擊了解:https://top.aibase.com/
1、清華團(tuán)隊(duì)發(fā)布視頻大模型Vidu 可生成16 秒、1080P 視頻
清華大學(xué)與生數(shù)科技在中關(guān)村論壇未來人工智能先鋒論壇上發(fā)布了中國首個(gè)長時(shí)長、高一致性、高動態(tài)性視頻大模型Vidu,標(biāo)志著中國在視頻生成技術(shù)領(lǐng)域取得重要進(jìn)展。該模型采用創(chuàng)新性的U-ViT架構(gòu),能一鍵生成高清視頻內(nèi)容,具備高時(shí)空一致性和豐富的想象力。
【AiBase提要:】
?? Vidu是中國首個(gè)長時(shí)長、高一致性、高動態(tài)性視頻大模型
?? 融合Diffusion與Transformer技術(shù),能一鍵生成長達(dá) 16 秒、1080P的高清視頻內(nèi)容。
?? 不僅能模擬真實(shí)物理世界,還具備豐富的想象力,支持多鏡頭生成
產(chǎn)品入口:https://top.aibase.com/tool/vidu
2、通義千問團(tuán)隊(duì)開源首個(gè)千億參數(shù)模型Qwen1.5-110B
通義千問團(tuán)隊(duì)開源的首個(gè)千億參數(shù)模型Qwen1.5-110B在基礎(chǔ)能力和Chat評估中表現(xiàn)出色,展示了模型規(guī)模擴(kuò)展對性能提升的重要意義。該模型采用Transformer解碼器架構(gòu),支持多種語言,具有高效的分組查詢注意力機(jī)制。Qwen1.5-110B是通義千問系列中規(guī)模最大的模型,擁有超過1000億參數(shù),在與SOTA模型的比較中表現(xiàn)出色。團(tuán)隊(duì)將繼續(xù)探索模型規(guī)模提升和擴(kuò)展預(yù)訓(xùn)練數(shù)據(jù)規(guī)模的優(yōu)勢。
【AiBase提要:】
?? Qwen1.5-110B是首個(gè)擁有超過1000億參數(shù)的模型,在Chat評估中表現(xiàn)更好,展示了更大規(guī)模模型的潛力。
?? 110B模型的性能提升主要來自于增加的模型規(guī)模,而訓(xùn)練方法并未大幅改變,表明模型規(guī)模擴(kuò)展對性能提升具有重要意義。
?? Qwen1.5-110B采用Transformer解碼器架構(gòu),支持多種語言,具有高效的分組查詢注意力機(jī)制,展示了在模型大小擴(kuò)展方面仍有提升空間。
模型鏈接:https://top.aibase.com/tool/qwen1-5-110b
3、Kimi Chat移動端UI大幅重構(gòu)
Kimi Chat移動端應(yīng)用迎來了重要的更新,版本1.2.1對用戶界面進(jìn)行了全面的重構(gòu),引入了“月之亮面”淺色模式,提供更加舒適和直觀的用戶體驗(yàn)。更新包括界面改進(jìn)、性能優(yōu)化、內(nèi)存管理、電池效率、功能增強(qiáng)、安全性提升、兼容性改進(jìn)、錯誤修復(fù)、本地化支持和輔助功能。用戶只需更新至最新版本1.2.1即可體驗(yàn)新功能。
【AiBase提要:】
?? 界面改進(jìn): 界面重新設(shè)計(jì),美觀易用,操作更直觀。
? 性能優(yōu)化: 提升響應(yīng)速度和流暢度,減少卡頓和延遲。
?? 安全性提升: 增強(qiáng)應(yīng)用安全性,保護(hù)用戶數(shù)據(jù)和隱私。
詳情鏈接:https://top.aibase.com/tool/kimi-chat
4、Domo AI新增樂高、美國漫畫等4個(gè)風(fēng)格 新用戶可免費(fèi)試用15個(gè)點(diǎn)數(shù)
DomoAI最近新增了樂高風(fēng)格、美國漫畫風(fēng)格、彩筆風(fēng)格、像素藝術(shù)四個(gè)新風(fēng)格,并且為慶祝其推特賬號粉絲超過1萬,新用戶可免費(fèi)試用15個(gè)點(diǎn)數(shù)。此前,DomoAI推出了視頻色度摳圖功能,用戶可以將扣出的人物合成到新背景中。用戶還可以輕松自定義后臺背景顏色,制作跳舞視頻等功能。
【AiBase提要:】
?? DomoAI新增了樂高風(fēng)格、美國漫畫風(fēng)格、彩筆風(fēng)格、像素藝術(shù)四個(gè)新風(fēng)格
?? 新用戶可免費(fèi)試用15個(gè)點(diǎn)數(shù)
?? 用戶可以使用 /move 命令將靜態(tài)照片變成動態(tài)視頻
詳情鏈接:https://top.aibase.com/tool/domoai
5、蘋果計(jì)劃與 OpenAI 合作,加強(qiáng) iPhone 人工智能功能
蘋果尋求與 OpenAI 合作,以提升 iPhone 的人工智能功能。前任機(jī)器學(xué)習(xí)總監(jiān)離職后,蘋果人工智能發(fā)展步履維艱。蘋果可能在全球開發(fā)者大會前推出新的生成式人工智能產(chǎn)品。
【AiBase提要:】
?? 蘋果尋求與 OpenAI 合作,提升 iPhone 的人工智能功能。
?? 前任機(jī)器學(xué)習(xí)總監(jiān)離職后,蘋果人工智能發(fā)展步履維艱。
?? 蘋果可能在全球開發(fā)者大會前推出新的生成式人工智能產(chǎn)品。
6、谷歌推出 AI 英語對話練習(xí)功能
谷歌最近推出了AI語音對話練習(xí)功能,讓用戶可以通過手機(jī)與對話機(jī)器人進(jìn)行英語會話練習(xí)。雖然功能目前僅限于部分國家使用,但谷歌可能會將其擴(kuò)展到更多國家。文章介紹了谷歌的語言學(xué)習(xí)工具提供的對話練習(xí)和反饋功能,以及其在AI輔助語言學(xué)習(xí)領(lǐng)域的發(fā)展。
【AiBase提要:】
??? 谷歌推出AI語音對話練習(xí)功能,讓用戶通過手機(jī)與對話機(jī)器人進(jìn)行英語會話練習(xí)。
?? 目前功能僅限于部分國家使用,但可能會擴(kuò)展到更多國家。
?? 雖然缺乏像Duolingo等應(yīng)用的課程設(shè)置,但提供了對話練習(xí)和反饋功能。
7、元象開源首個(gè)多模態(tài)大模型XVERSE-V
作為元象公司發(fā)布的首個(gè)多模態(tài)大型模型,XVERSE-V在多個(gè)權(quán)威評測中表現(xiàn)優(yōu)異,綜合能力出色。該模型融合整體和局部信息的策略,提高了圖像識別和分析的準(zhǔn)確性和全面性。除了圖像識別,XVERSE-V在信息圖理解、視障場景處理、文本生成、教育解題等實(shí)際應(yīng)用中也表現(xiàn)突出。
【AiBase提要:】
?? XVERSE-V是首個(gè)多模態(tài)大型模型,支持任意寬高比的圖像輸入
?? 該模型在綜合能力上表現(xiàn)出色,取得優(yōu)異成績
?? XVERSE-V采用融合整體和局部信息的策略,提高圖像識別和分析的準(zhǔn)確性和全面性
詳情鏈接:https://huggingface.co/xverse/XVERSE-V-13BModelScope
8、Perplexica:開源AI驅(qū)動的問答搜索引擎
Perplexica是一個(gè)開源的AI驅(qū)動搜索引擎,提供多種搜索模式,旨在為用戶提供更精準(zhǔn)、更智能的搜索體驗(yàn)。它具有先進(jìn)的機(jī)器學(xué)習(xí)算法,確保用戶隱私和提供最新的搜索結(jié)果。Perplexica致力于成為全面、高效的搜索解決方案。
【AiBase提要:】
?? 提供多種搜索模式,根據(jù)用戶需求調(diào)整搜索算法,以獲得更相關(guān)的搜索結(jié)果。
?? 使用先進(jìn)的機(jī)器學(xué)習(xí)算法來精細(xì)化搜索結(jié)果,包括相似性搜索和嵌入技術(shù)。
?? 確保隱私保護(hù),使用SearxNG作為當(dāng)前性保障,避免每日數(shù)據(jù)更新的開銷。
詳情鏈接:https://top.aibase.com/tool/perplexica
9、Meta 推出 LayerSkip:提升大語言模型推理速度
Meta公司最新發(fā)布的LayerSkip技術(shù)旨在提升大型語言模型的推理速度,通過優(yōu)化推理過程,減少計(jì)算資源消耗,保持模型性能。這對實(shí)時(shí)需求高的應(yīng)用場景具有重要意義,反映了Meta在AI模型效率方面的持續(xù)投入和創(chuàng)新。LayerSkip技術(shù)的未來展望將為大語言模型的部署和使用帶來更多可能性,特別是在需要快速處理大量語言數(shù)據(jù)的場合。
【AiBase提要:】
?? LayerSkip在CNN/DM文檔摘要任務(wù)中將推理速度提升了2.16倍,顯著提高了文檔處理效率。
? LayerSkip在編程任務(wù)中實(shí)現(xiàn)了1.82倍的速度提升,可能優(yōu)化編程輔助工具的性能。
?? LayerSkip在TOPv2語義解析任務(wù)上推理速度提升達(dá)到了2.0倍,對語義解析等自然語言處理任務(wù)有重要影響。
論文:https://huggingface.co/papers/2404.16710
10、調(diào)查顯示:1/3的翻譯者和1/4的插畫師已經(jīng)因AI失去了工作
AI技術(shù)的快速發(fā)展對創(chuàng)意產(chǎn)業(yè)造成深遠(yuǎn)影響,英國作家協(xié)會的調(diào)查揭示了AI對作家、翻譯者、插畫師等職業(yè)的影響,引發(fā)了行業(yè)內(nèi)的擔(dān)憂和呼吁。
【AiBase提要:】
?? 約五分之一的創(chuàng)作者在工作中使用過生成性AI,AI技術(shù)已經(jīng)開始滲透到各個(gè)創(chuàng)作領(lǐng)域。
?? 1/4的插畫師和1/3的翻譯者因生成性AI失去了工作,工作機(jī)會受到直接威脅。
?? 大多數(shù)小說家和非小說類作家擔(dān)心AI技術(shù)將對未來創(chuàng)意工作收入產(chǎn)生負(fù)面影響,強(qiáng)烈呼吁獲得版權(quán)保護(hù)和政府監(jiān)管。
11、WebLlama:基于Llama-3-8B的智能網(wǎng)頁瀏覽代理
WebLlama是一款基于Llama-3-8B模型的智能代理工具,通過對話與用戶互動,執(zhí)行網(wǎng)頁瀏覽相關(guān)任務(wù)。它能處理連續(xù)對話,理解用戶指令,自動完成網(wǎng)上搜索、導(dǎo)航和信息檢索等操作。WebLlama展示了強(qiáng)大的對話處理能力和網(wǎng)頁交互功能,提高用戶獲取信息效率,減少手動操作需求。在專業(yè)基準(zhǔn)測試中表現(xiàn)優(yōu)異,具有先進(jìn)性和實(shí)用性,有望在自動化網(wǎng)頁瀏覽和信息收集方面發(fā)揮更大作用。
【AiBase提要:】
??? 對話理解: 能聽取用戶指令,與用戶交互。
?? 自動網(wǎng)頁瀏覽: 執(zhí)行搜索、導(dǎo)航,幫助用戶獲取信息。
?? 完成復(fù)雜任務(wù): 能預(yù)定酒店、購物或查找信息等實(shí)際應(yīng)用任務(wù)。
詳情鏈接:https://top.aibase.com/tool/webllama
12、Mutable AI發(fā)布Auto Wiki v2:將代碼轉(zhuǎn)換為類似于維基百科風(fēng)格的文章
Mutable AI推出的Auto Wiki v2是一款革命性的工具,能夠自動將代碼轉(zhuǎn)化為維基百科風(fēng)格的文章,解決了代碼文檔化難題。這一創(chuàng)新解決方案提供了清晰描述的代碼文檔,可視化理解代碼,提升開發(fā)效率。
【AiBase提要:】
?? 自動將代碼轉(zhuǎn)化為維基百科風(fēng)格文章,解決代碼文檔化難題。
?? 自動生成清晰描述的代碼文檔,可視化理解代碼。
?? 提供代碼圖表、自動更新文檔等多項(xiàng)功能,提升開發(fā)效率。
詳情鏈接:https://top.aibase.com/tool/mutable
13、Cog-Become-Image:將任意人物圖像轉(zhuǎn)換成指定風(fēng)格的圖
Cog-Become-Image項(xiàng)目是一個(gè)創(chuàng)新的圖像轉(zhuǎn)換工具,可以將任意人物的面部圖像轉(zhuǎn)換成另一種風(fēng)格的圖片。該項(xiàng)目在藝術(shù)創(chuàng)作、媒體制作和娛樂行業(yè)有廣泛的應(yīng)用前景,為圖像轉(zhuǎn)換領(lǐng)域帶來新的可能。無論是專業(yè)開發(fā)者還是技術(shù)愛好者,都可以利用這個(gè)項(xiàng)目來實(shí)現(xiàn)創(chuàng)意圖像的轉(zhuǎn)換。
【AiBase提要:】
?? 面部圖像轉(zhuǎn)換: 用戶可以將2D動漫人物或其他風(fēng)格的人臉圖像轉(zhuǎn)換成逼真的真人圖像。
?? 動畫視頻制作: 轉(zhuǎn)換后的圖像可以進(jìn)一步利用Hyper AI等工具制作成動畫視頻。
?? 易于使用: 項(xiàng)目提供了Replicate和ComfyUI兩種運(yùn)行模型的方式,使得用戶可以輕松地進(jìn)行圖像轉(zhuǎn)換。
項(xiàng)目地址:https://top.aibase.com/tool/cog-become-image
試玩地址:https://replicate.com/fofr/become-image
14、PhysDreamer:讓3D物體符合物理規(guī)律動起來
通過視頻生成模型學(xué)習(xí)的物體動態(tài)先驗(yàn)知識,實(shí)現(xiàn)靜態(tài)3D物體對新型交互的真實(shí)響應(yīng)。PhysDreamer利用物理學(xué)方法賦予靜態(tài)3D物體交互式動態(tài),提升虛擬體驗(yàn)的真實(shí)感和吸引力。研究提出的PhysDreamer為靜態(tài)3D物體動態(tài)響應(yīng)提供了一種物理合理的方式。
【AiBase提要:】
?? 通過視頻生成模型學(xué)習(xí)的物體動態(tài)先驗(yàn)知識,實(shí)現(xiàn)靜態(tài)3D物體對新型交互的真實(shí)響應(yīng)。
?? PhysDreamer利用物理學(xué)方法賦予靜態(tài)3D物體交互式動態(tài),提升虛擬體驗(yàn)的真實(shí)感和吸引力。
?? 研究提出的PhysDreamer為靜態(tài)3D物體動態(tài)響應(yīng)提供了一種物理合理的方式。
詳情鏈接:https://top.aibase.com/tool/physdreamer
(舉報(bào))