歡迎來到【AI日?qǐng)?bào)】欄目!這里是你每天探索人工智能世界的指南,每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容,聚焦開發(fā)者,助你洞悉技術(shù)趨勢(shì)、了解創(chuàng)新AI產(chǎn)品應(yīng)用。
新鮮AI產(chǎn)品點(diǎn)擊了解:https://top.aibase.com/
??????AI應(yīng)用
Sora平替?2分鐘超長(zhǎng)AI視頻模型StreamingT2V免費(fèi)開源 試玩地址公布
【AiBase提要:】
? StreamingT2V可以生成長(zhǎng)達(dá)1200幀、時(shí)長(zhǎng)2分鐘的視頻,超越了Sora模型
? 采用先進(jìn)的自回歸技術(shù),保持視頻時(shí)間一致性和高質(zhì)量
? 它是一個(gè)免費(fèi)開源的項(xiàng)目,可以無縫兼容SVD和animatediff等模型
? 代碼已發(fā)布,試玩地址也已上線。生成時(shí)間較久,一個(gè)視頻預(yù)計(jì)要生成13分鐘以上。
開源代碼:https://top.aibase.com/tool/streamingt2v
論文地址:https://arxiv.org/pdf/2403.14773.pdf
試玩地址1:https://huggingface.co/spaces/PAIR/StreamingT2V
試玩地址2:https://replicate.com/camenduru/streaming-t2v
Udio AI提供多功能音頻生成 還可以創(chuàng)作喜劇、演講、電臺(tái)廣播等
【AiBase提要:】
? Udio不僅可以創(chuàng)作音樂,還可以創(chuàng)作喜劇、演講、NPC對(duì)話、體育分析、廣告、電臺(tái)廣播、ASMR、自然音效等。
? 簡(jiǎn)單的文字描述創(chuàng)作: 用戶可通過簡(jiǎn)單文字描述指導(dǎo)Udio生成特定主題和情感的音樂作品。
? 廣泛的音樂類型和風(fēng)格支持: Udio支持多種音樂類型和風(fēng)格,滿足不同用戶的音樂品味。
感興趣的可以點(diǎn)擊播放列表查看:https://www.udio.com/playlists/deGuVDLYd9MrXtxnxfX7z1
體驗(yàn)地址:https://top.aibase.com/tool/udio
美圖Wink“AI動(dòng)漫”功能升級(jí) 可將短劇作品轉(zhuǎn)化為動(dòng)漫風(fēng)格
【AiBase提要:】
? 近期美圖Wink升級(jí)“AI動(dòng)漫”功能,轉(zhuǎn)化短劇作品為動(dòng)漫風(fēng)格。
? 引入CFA模塊,優(yōu)化動(dòng)作一致性,生成更流暢自然的動(dòng)漫視頻。
? 分片技術(shù)處理長(zhǎng)視頻,減少等待時(shí)長(zhǎng),讓創(chuàng)作更自如流暢。
StableDesign:適用于室內(nèi)裝修設(shè)計(jì)的SD方案 文字提示就可修改室內(nèi)設(shè)計(jì)圖
【AiBase提要:】
?? 開發(fā)者創(chuàng)建了用于生成式室內(nèi)設(shè)計(jì)的項(xiàng)目
?? 通過下載愛彼迎房源數(shù)據(jù)和圖像元數(shù)據(jù),提取特征,實(shí)現(xiàn)訓(xùn)練
?? 使用ControlNet和勞拉模型訓(xùn)練,實(shí)現(xiàn)室內(nèi)設(shè)計(jì)生成的控制和文本到圖像轉(zhuǎn)換
在線體驗(yàn):https://huggingface.co/spaces/MykolaL/StableDesign
比換臉更強(qiáng)大!SwapAnything:替換圖片中的任意元素
【AiBase提要:】
?? SwapAnything框架具有精確控制對(duì)象和部分、保留上下文像素、適應(yīng)個(gè)性化概念等優(yōu)勢(shì)。
?? 通過定向變量交換和外觀調(diào)整技術(shù),SwapAnything展現(xiàn)了精確和忠實(shí)的交換能力。
?? SwapAnything能在圖像中精確控制任意對(duì)象,實(shí)現(xiàn)高質(zhì)量的個(gè)性化交換。
項(xiàng)目入口:https://top.aibase.com/tool/swapanything
AI延時(shí)視頻生成工具M(jìn)agicTime在線體驗(yàn)地址放出
【AiBase提要】
? 時(shí)間延遲視頻是攝影技術(shù),展示長(zhǎng)時(shí)間變化。
? MagicTime能根據(jù)文本描述生成時(shí)間延遲視頻。
? 應(yīng)用廣泛,可記錄自然現(xiàn)象和人為變化。
項(xiàng)目地址:https://top.aibase.com/tool/magictime
體驗(yàn)地址:https://huggingface.co/spaces/BestWishYsh/MagicTime
模型下載地址:https://huggingface.co/Kijai/MagicTime-merged-fp16
自動(dòng)化寫作工具STORM:可生成像維基百科一樣的深度長(zhǎng)篇內(nèi)容
【AiBase提要:】
??STORM自動(dòng)搜集資料,模擬專家對(duì)話,生成結(jié)構(gòu)化文章大綱。
??STORM高效研究、整合多角度信息,促進(jìn)深入理解和精準(zhǔn)問題生成。
??STORM生成文章大綱后,完整撰寫、潤色文章以提高整體質(zhì)量。
項(xiàng)目地址:https://top.aibase.com/tool/storm
Meta 推出 ViewDiff 模型:文本生成多視角3D 圖像
【AiBase提要:】
?? ViewDiff 解決了文本生成一致性、多視角3D 圖像的三大難點(diǎn)
?? 自回歸生成模塊使 ViewDiff 在任意視角上生成更多的3D 一致性圖像
?? ViewDiff 填補(bǔ)了文本生成多視角3D 圖像領(lǐng)域的技術(shù)空白
論文地址:https://arxiv.org/abs/2403.01807
項(xiàng)目地址:https://top.aibase.com/tool/viewdiff
??????AI新鮮事
首個(gè)AI程序員造假被抓,Devin再次“震撼”硅谷!扒皮視頻文字詳解附上
【AiBase提要:】
?? 油管程序員揭露首個(gè)AI程序員Devin視頻造假
?? Devin演示不如實(shí)際神奇,修復(fù)bug自創(chuàng)bug
?? 遭到疑問和打假,網(wǎng)友對(duì)AI產(chǎn)品炒作嗤之以鼻
詳細(xì)內(nèi)容:http://vquan.org.cn/2024/0415/1610127.shtml
馬斯克XAI發(fā)布Grok-1.5Vision多模態(tài)模型,可處理文本和圖片信息
【AiBase提要:】
?? Grok-1.5Vision模型展現(xiàn)卓越性能,超越GPT4V。
?? 在RealWorldQA基準(zhǔn)測(cè)試中表現(xiàn)優(yōu)異,理解真實(shí)世界物理空間。
?? Grok-1.5Vision模型具有強(qiáng)大的現(xiàn)實(shí)世界空間處理和理解能力。
官網(wǎng)地址:https://top.aibase.com/tool/grok-1-5-vision-preview
360智腦7B參數(shù)大模型正式開源 最長(zhǎng)支持約50萬字輸入
【AiBase提要:】
??360智腦7B參數(shù)大模型正式開源。
?? 支持不同文本長(zhǎng)度版本,最長(zhǎng)可處理360K長(zhǎng)文本。
?? 在能力測(cè)試中表現(xiàn)出色,綜合能力排名前三。
項(xiàng)目地址:https://github.com/Qihoo360/360zhinao
Adobe圖像生成AI “Firefly” 訓(xùn)練集中約有5%為AI圖像
【AiBase提要:】
? Adobe Stock開始接受AI內(nèi)容,約14%為AI生成圖像。
? 學(xué)者指出Firefly學(xué)習(xí)自Midjourney生成的圖像,與其聲稱不同。
? 用戶表示對(duì)Adobe用其作品訓(xùn)練Firefly感到不滿。
代碼、模型全開源!賈佳亞團(tuán)隊(duì)多模態(tài)模型 Mini-Gemini登上熱榜
【AiBase提要:】
?? Mini-Gemini模型在多模態(tài)任務(wù)上取得顯著成績(jī),開源代碼和模型數(shù)據(jù)。
?? Mini-Gemini結(jié)合圖像理解和生成,展現(xiàn)出色圖像推理能力。
?? 采用Gemini視覺雙分支信息挖掘方法,有效處理高分辨率圖像并生成內(nèi)容豐富的視覺和文本內(nèi)容。
項(xiàng)目地址:https://top.aibase.com/tool/mini-gemini
試玩地址: https://103.170.5.190:7860/
面壁智能開源MiniCPM2.0系列模型 OCR等能力顯著增強(qiáng)
【AiBase提要:】
? MiniCPM-V2.0是端側(cè)最強(qiáng)的多模態(tài)模型,具有強(qiáng)大的OCR能力。
? MiniCPM-1.2B是適配端側(cè)場(chǎng)景的基座模型,推理速度快成本低。
? MiniCPM-2B-128K是目前最小的長(zhǎng)文本模型,處理128K文本內(nèi)容。
MiniCPM-V2.0:
https://github.com/OpenBMB/MiniCPM-V
MiniCPM系列開源地址:
https://github.com/OpenBMB/MiniCPM
MiniCPM技術(shù)Blog地址:
https://openbmb.vercel.app/?category=Chinese+Blog
競(jìng)爭(zhēng)升溫!ChatGPT增長(zhǎng)疲軟3月全球訪問量17.7億次,Claude逐漸崛起
【AiBase提要:】
?? ChatGPT全球訪問量增長(zhǎng)放緩,盡管推出新功能。
?? Anthropic的Claude在歐洲市場(chǎng)蓬勃發(fā)展,加劇與ChatGPT的競(jìng)爭(zhēng)。
?? Claude3發(fā)布后持續(xù)快速增長(zhǎng),顯示新產(chǎn)品潛力。
InstantID團(tuán)隊(duì)推新風(fēng)格遷移方法InstantStyle 一鍵置身“梵高星空”
【AiBase提要:】
??特征相減:利用CLIP模型的特性,通過特征相減去除內(nèi)容信息,實(shí)現(xiàn)風(fēng)格和內(nèi)容解耦。
??僅風(fēng)格層注入:在特定風(fēng)格層完成特征注入,實(shí)現(xiàn)風(fēng)格和內(nèi)容解耦。
??通用性強(qiáng):InstantStyle的方法具有通用性,提供豐富代碼實(shí)現(xiàn),支持多種應(yīng)用場(chǎng)景。
項(xiàng)目地址:https://top.aibase.com/tool/instantstyle
在線試玩:https://huggingface.co/spaces/InstantX/InstantStyle
——————
每日midjourney prompt:小說古風(fēng)美女
圖源備注:圖片由AI生成,圖片授權(quán)服務(wù)商Midjourney
A beautiful woman from ancient China, dressed in a gorgeous red Hanfu, with long hair draped over her shoulders, sat in her boudoir with a smile. Ancient style, hanfu, boudoir, gorgeous, palace, screen, carpet, soft light, elegant temperament, ancient culture, in line with oriental aesthetics, rich details, best quality, exquisite makeup, clear eyeliner pen, slender eyebrows, textured skin, white skin, charming headdress, --ar3:4 --niji6 --style raw
一個(gè)中國古代美女,穿著華麗的紅色漢服,長(zhǎng)發(fā)披肩,微笑著坐在閨房?jī)?nèi)。古風(fēng),漢服,閨房,華麗,宮殿,屏風(fēng),地毯,柔和光線,高雅氣質(zhì),古代文化,符合東方美學(xué),細(xì)節(jié)豐富,品質(zhì)最佳,精致的妝容,清晰的眼線筆,纖細(xì)的眉毛,紋理皮膚,白皙的皮膚,迷人的頭飾
(舉報(bào))