无码在线播放二区|久久亚洲精品国产精品|无码视频在线观看一区二区|在线观看国产日韩亚洲中

<menu id="yw4o4"></menu>

<menu id="yw4o4"><em id="yw4o4"></em></menu>

<strike id="clpn0"></strike>

AI日?qǐng)?bào)：首個(gè)AI程序員Devin造假被抓；?Sora平替?StreamingT2V試玩地址公布；Udio AI還可以創(chuàng)作喜劇、演講；XAI發(fā)布Grok-1.5Vision多模態(tài)模型

2024-04-15 16:11 · 稿源：站長(zhǎng)之家

歡迎來到【AI日?qǐng)?bào)】欄目!這里是你每天探索人工智能世界的指南，每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容，聚焦開發(fā)者，助你洞悉技術(shù)趨勢(shì)、了解創(chuàng)新AI產(chǎn)品應(yīng)用。

新鮮AI產(chǎn)品點(diǎn)擊了解：https://top.aibase.com/

??????AI應(yīng)用

Sora平替?2分鐘超長(zhǎng)AI視頻模型StreamingT2V免費(fèi)開源試玩地址公布

【AiBase提要:】
? StreamingT2V可以生成長(zhǎng)達(dá)1200幀、時(shí)長(zhǎng)2分鐘的視頻，超越了Sora模型
? 采用先進(jìn)的自回歸技術(shù)，保持視頻時(shí)間一致性和高質(zhì)量
? 它是一個(gè)免費(fèi)開源的項(xiàng)目，可以無縫兼容SVD和animatediff等模型
? 代碼已發(fā)布，試玩地址也已上線。生成時(shí)間較久，一個(gè)視頻預(yù)計(jì)要生成13分鐘以上。
開源代碼:https://top.aibase.com/tool/streamingt2v
論文地址:https://arxiv.org/pdf/2403.14773.pdf
試玩地址1:https://huggingface.co/spaces/PAIR/StreamingT2V
試玩地址2:https://replicate.com/camenduru/streaming-t2v

Udio AI提供多功能音頻生成還可以創(chuàng)作喜劇、演講、電臺(tái)廣播等

【AiBase提要:】
? Udio不僅可以創(chuàng)作音樂，還可以創(chuàng)作喜劇、演講、NPC對(duì)話、體育分析、廣告、電臺(tái)廣播、ASMR、自然音效等。
? 簡(jiǎn)單的文字描述創(chuàng)作: 用戶可通過簡(jiǎn)單文字描述指導(dǎo)Udio生成特定主題和情感的音樂作品。
? 廣泛的音樂類型和風(fēng)格支持: Udio支持多種音樂類型和風(fēng)格，滿足不同用戶的音樂品味。
感興趣的可以點(diǎn)擊播放列表查看:https://www.udio.com/playlists/deGuVDLYd9MrXtxnxfX7z1
體驗(yàn)地址:https://top.aibase.com/tool/udio

美圖Wink“AI動(dòng)漫”功能升級(jí) 可將短劇作品轉(zhuǎn)化為動(dòng)漫風(fēng)格

微信截圖_20240415085954.png

【AiBase提要:】
? 近期美圖Wink升級(jí)“AI動(dòng)漫”功能，轉(zhuǎn)化短劇作品為動(dòng)漫風(fēng)格。
? 引入CFA模塊，優(yōu)化動(dòng)作一致性，生成更流暢自然的動(dòng)漫視頻。
? 分片技術(shù)處理長(zhǎng)視頻，減少等待時(shí)長(zhǎng)，讓創(chuàng)作更自如流暢。

StableDesign:適用于室內(nèi)裝修設(shè)計(jì)的SD方案文字提示就可修改室內(nèi)設(shè)計(jì)圖

【AiBase提要:】
?? 開發(fā)者創(chuàng)建了用于生成式室內(nèi)設(shè)計(jì)的項(xiàng)目
?? 通過下載愛彼迎房源數(shù)據(jù)和圖像元數(shù)據(jù)，提取特征，實(shí)現(xiàn)訓(xùn)練
?? 使用ControlNet和勞拉模型訓(xùn)練，實(shí)現(xiàn)室內(nèi)設(shè)計(jì)生成的控制和文本到圖像轉(zhuǎn)換
在線體驗(yàn):https://huggingface.co/spaces/MykolaL/StableDesign

比換臉更強(qiáng)大!SwapAnything:替換圖片中的任意元素

【AiBase提要:】
?? SwapAnything框架具有精確控制對(duì)象和部分、保留上下文像素、適應(yīng)個(gè)性化概念等優(yōu)勢(shì)。
?? 通過定向變量交換和外觀調(diào)整技術(shù)，SwapAnything展現(xiàn)了精確和忠實(shí)的交換能力。
?? SwapAnything能在圖像中精確控制任意對(duì)象，實(shí)現(xiàn)高質(zhì)量的個(gè)性化交換。
項(xiàng)目入口:https://top.aibase.com/tool/swapanything

AI延時(shí)視頻生成工具M(jìn)agicTime在線體驗(yàn)地址放出

【AiBase提要】
? 時(shí)間延遲視頻是攝影技術(shù)，展示長(zhǎng)時(shí)間變化。
? MagicTime能根據(jù)文本描述生成時(shí)間延遲視頻。
? 應(yīng)用廣泛，可記錄自然現(xiàn)象和人為變化。
項(xiàng)目地址:https://top.aibase.com/tool/magictime
體驗(yàn)地址:https://huggingface.co/spaces/BestWishYsh/MagicTime
模型下載地址:https://huggingface.co/Kijai/MagicTime-merged-fp16

自動(dòng)化寫作工具STORM:可生成像維基百科一樣的深度長(zhǎng)篇內(nèi)容

【AiBase提要:】
??STORM自動(dòng)搜集資料，模擬專家對(duì)話，生成結(jié)構(gòu)化文章大綱。
??STORM高效研究、整合多角度信息，促進(jìn)深入理解和精準(zhǔn)問題生成。
??STORM生成文章大綱后，完整撰寫、潤色文章以提高整體質(zhì)量。
項(xiàng)目地址:https://top.aibase.com/tool/storm

Meta 推出 ViewDiff 模型:文本生成多視角3D 圖像

【AiBase提要:】
?? ViewDiff 解決了文本生成一致性、多視角3D 圖像的三大難點(diǎn)
?? 自回歸生成模塊使 ViewDiff 在任意視角上生成更多的3D 一致性圖像
?? ViewDiff 填補(bǔ)了文本生成多視角3D 圖像領(lǐng)域的技術(shù)空白
論文地址:https://arxiv.org/abs/2403.01807
項(xiàng)目地址:https://top.aibase.com/tool/viewdiff

??????AI新鮮事

首個(gè)AI程序員造假被抓，Devin再次“震撼”硅谷!扒皮視頻文字詳解附上

【AiBase提要:】
?? 油管程序員揭露首個(gè)AI程序員Devin視頻造假
?? Devin演示不如實(shí)際神奇，修復(fù)bug自創(chuàng)bug
?? 遭到疑問和打假，網(wǎng)友對(duì)AI產(chǎn)品炒作嗤之以鼻
詳細(xì)內(nèi)容:http://vquan.org.cn/2024/0415/1610127.shtml

馬斯克XAI發(fā)布Grok-1.5Vision多模態(tài)模型，可處理文本和圖片信息

【AiBase提要:】
?? Grok-1.5Vision模型展現(xiàn)卓越性能，超越GPT4V。
?? 在RealWorldQA基準(zhǔn)測(cè)試中表現(xiàn)優(yōu)異，理解真實(shí)世界物理空間。
?? Grok-1.5Vision模型具有強(qiáng)大的現(xiàn)實(shí)世界空間處理和理解能力。
官網(wǎng)地址:https://top.aibase.com/tool/grok-1-5-vision-preview

360智腦7B參數(shù)大模型正式開源最長(zhǎng)支持約50萬字輸入

【AiBase提要:】
??360智腦7B參數(shù)大模型正式開源。
?? 支持不同文本長(zhǎng)度版本，最長(zhǎng)可處理360K長(zhǎng)文本。
?? 在能力測(cè)試中表現(xiàn)出色，綜合能力排名前三。
項(xiàng)目地址:https://github.com/Qihoo360/360zhinao

Adobe圖像生成AI “Firefly” 訓(xùn)練集中約有5%為AI圖像

【AiBase提要:】
? Adobe Stock開始接受AI內(nèi)容，約14%為AI生成圖像。
? 學(xué)者指出Firefly學(xué)習(xí)自Midjourney生成的圖像，與其聲稱不同。
? 用戶表示對(duì)Adobe用其作品訓(xùn)練Firefly感到不滿。

代碼、模型全開源!賈佳亞團(tuán)隊(duì)多模態(tài)模型 Mini-Gemini登上熱榜

【AiBase提要:】
?? Mini-Gemini模型在多模態(tài)任務(wù)上取得顯著成績(jī)，開源代碼和模型數(shù)據(jù)。
?? Mini-Gemini結(jié)合圖像理解和生成，展現(xiàn)出色圖像推理能力。
?? 采用Gemini視覺雙分支信息挖掘方法，有效處理高分辨率圖像并生成內(nèi)容豐富的視覺和文本內(nèi)容。
項(xiàng)目地址:https://top.aibase.com/tool/mini-gemini
試玩地址: https://103.170.5.190:7860/

面壁智能開源MiniCPM2.0系列模型 OCR等能力顯著增強(qiáng)

【AiBase提要:】
? MiniCPM-V2.0是端側(cè)最強(qiáng)的多模態(tài)模型，具有強(qiáng)大的OCR能力。
? MiniCPM-1.2B是適配端側(cè)場(chǎng)景的基座模型，推理速度快成本低。
? MiniCPM-2B-128K是目前最小的長(zhǎng)文本模型，處理128K文本內(nèi)容。
MiniCPM-V2.0:
https://github.com/OpenBMB/MiniCPM-V
MiniCPM系列開源地址:
https://github.com/OpenBMB/MiniCPM
MiniCPM技術(shù)Blog地址:
https://openbmb.vercel.app/?category=Chinese+Blog

競(jìng)爭(zhēng)升溫!ChatGPT增長(zhǎng)疲軟3月全球訪問量17.7億次，Claude逐漸崛起

【AiBase提要:】
?? ChatGPT全球訪問量增長(zhǎng)放緩，盡管推出新功能。
?? Anthropic的Claude在歐洲市場(chǎng)蓬勃發(fā)展，加劇與ChatGPT的競(jìng)爭(zhēng)。
?? Claude3發(fā)布后持續(xù)快速增長(zhǎng)，顯示新產(chǎn)品潛力。

InstantID團(tuán)隊(duì)推新風(fēng)格遷移方法InstantStyle 一鍵置身“梵高星空”

【AiBase提要:】
??特征相減:利用CLIP模型的特性，通過特征相減去除內(nèi)容信息，實(shí)現(xiàn)風(fēng)格和內(nèi)容解耦。
??僅風(fēng)格層注入:在特定風(fēng)格層完成特征注入，實(shí)現(xiàn)風(fēng)格和內(nèi)容解耦。
??通用性強(qiáng):InstantStyle的方法具有通用性，提供豐富代碼實(shí)現(xiàn)，支持多種應(yīng)用場(chǎng)景。
項(xiàng)目地址:https://top.aibase.com/tool/instantstyle
在線試玩:https://huggingface.co/spaces/InstantX/InstantStyle

——————

每日midjourney prompt:小說古風(fēng)美女

圖源備注：圖片由AI生成，圖片授權(quán)服務(wù)商Midjourney

A beautiful woman from ancient China， dressed in a gorgeous red Hanfu， with long hair draped over her shoulders， sat in her boudoir with a smile. Ancient style， hanfu， boudoir， gorgeous， palace， screen， carpet， soft light， elegant temperament， ancient culture， in line with oriental aesthetics， rich details， best quality， exquisite makeup， clear eyeliner pen， slender eyebrows， textured skin， white skin， charming headdress， --ar3:4 --niji6 --style raw

一個(gè)中國古代美女，穿著華麗的紅色漢服，長(zhǎng)發(fā)披肩，微笑著坐在閨房?jī)?nèi)。古風(fēng)，漢服，閨房，華麗，宮殿，屏風(fēng)，地毯，柔和光線，高雅氣質(zhì)，古代文化，符合東方美學(xué)，細(xì)節(jié)豐富，品質(zhì)最佳，精致的妝容，清晰的眼線筆，纖細(xì)的眉毛，紋理皮膚，白皙的皮膚，迷人的頭飾

（舉報(bào)）

相關(guān)推薦

關(guān)鍵詞：

Devin

薦AI日?qǐng)?bào)：國內(nèi)首個(gè)多模態(tài)AI程序員上崗；字節(jié)啟動(dòng)Top Seed計(jì)劃招募AI人才；DeepSeek R1T Chimera上線OpenRouter

【AI日?qǐng)?bào)】今日AI領(lǐng)域重要?jiǎng)討B(tài)：1.百度發(fā)布文心快碼3.5及多模態(tài)AI程序員"文心快碼Comate Zulu"，提升開發(fā)效率；2.字節(jié)跳動(dòng)啟動(dòng)"Top Seed"計(jì)劃，招募30名AI博士人才；3.DeepSeek開源R1T Chimera模型上線OpenRouter平臺(tái)；4.阿里AI工程師余亮獲"全國勞動(dòng)模范"稱號(hào)；5.開源圖像編輯工具Step1X-Edit登陸Hugging Face，性能媲美GPT-4o；6.谷歌被曝每月向三星支付巨額資金預(yù)裝Gemini應(yīng)用

?人工智能 ?AI編程工具 ?多模態(tài)交互
薦多模態(tài)和Agent成為大廠AI的新賽點(diǎn)

這是《窄播Weekly》的第52期，本期我們關(guān)注的商業(yè)動(dòng)態(tài)是:當(dāng)大廠的AI競(jìng)爭(zhēng)策略開始傾斜向應(yīng)用場(chǎng)景，多模態(tài)能力和代理執(zhí)行成為兩個(gè)焦點(diǎn)。大模型落地C端場(chǎng)景的核心，就是讓大模型的能力越來越接近人。沿著這個(gè)主旋律，可以劃分出兩個(gè)進(jìn)化方向:一個(gè)是持續(xù)降低用戶與大模型進(jìn)行有效溝通的難度;另一個(gè)則是讓大模型具備執(zhí)行更復(fù)雜任務(wù)的能力。前者的實(shí)現(xiàn)，需要給到大模型多

?AI競(jìng)爭(zhēng)策略 ?多模態(tài)能力 ?大模型應(yīng)用
薦多模態(tài)和Agent成為大廠AI的新賽點(diǎn)

本期《窄播Weekly》聚焦AI大廠競(jìng)爭(zhēng)策略向應(yīng)用場(chǎng)景傾斜的趨勢(shì)，重點(diǎn)分析了多模態(tài)能力和代理執(zhí)行兩大發(fā)展方向。文章指出，大模型落地的核心在于讓人機(jī)交互更自然，具體表現(xiàn)為：1）通過多模態(tài)技術(shù)降低用戶使用門檻，如阿里夸克新推出的"拍照問夸克"功能；2）通過代理執(zhí)行提升復(fù)雜任務(wù)處理能力，如字節(jié)、百度等推出的通用Agent產(chǎn)品。國內(nèi)外廠商路徑差異明顯：國?

?AI應(yīng)用場(chǎng)景 ?多模態(tài)能力 ?代理執(zhí)行
薦AI日?qǐng)?bào)：Kimi全新音頻基礎(chǔ)模型Kimi-Audio；階躍星辰開源圖像編輯模型Step1X-Edit；?夸克AI超級(jí)框上線 “拍照問夸克”

本期AI日?qǐng)?bào)聚焦多項(xiàng)AI技術(shù)突破與應(yīng)用：1)Moonshot AI推出開源音頻模型Kimi-Audio，基于13億小時(shí)訓(xùn)練數(shù)據(jù)，支持語音識(shí)別等任務(wù)；2)階躍星辰開源圖像編輯模型Step1X-Edit，展現(xiàn)強(qiáng)大生成能力；3)夸克AI上線"拍照問夸克"功能，實(shí)現(xiàn)視覺問答；4)蘋果iOS18.5將在中國推送，帶來智能功能；5)谷歌發(fā)布601個(gè)生成式AI應(yīng)用案例，覆蓋多行業(yè)；6)微軟推出深度整合Windows的UFO2自動(dòng)化系統(tǒng)；7)OpenAI升級(jí)ChatGPT至GPT-4o版本，提升STEM領(lǐng)域能力；8)Ema公司推出高性價(jià)比語言模型EmaFusion；9)Liquid AI發(fā)布面向邊緣設(shè)備的Hyena Edge模型；10)LemonAI推出實(shí)時(shí)音視頻數(shù)字人產(chǎn)品Slice Live。此外，國內(nèi)方面，智譜與生數(shù)科技達(dá)成戰(zhàn)略合作推動(dòng)大模型發(fā)展，寶馬中國宣布新車將接入DeepSeek技術(shù)。

?AI日?qǐng)?bào) ?音頻技術(shù) ?開源模型
可靈AI發(fā)布全新2.0模型：上線多模態(tài)視頻編輯功能

快科技4月16日消息，據(jù)報(bào)道，可靈AI在北京舉行靈感成真”2.0模型發(fā)布會(huì)，正式發(fā)布可靈2.0視頻生成模型及可圖2.0圖像生成模型。據(jù)介紹，可靈2.0模型在動(dòng)態(tài)質(zhì)量、語義響應(yīng)、畫面美學(xué)等維度保持領(lǐng)先；可圖2.0模型在指令遵循、電影質(zhì)感及藝術(shù)風(fēng)格表現(xiàn)等方面顯著提升。3月27日，全球AI基準(zhǔn)測(cè)試機(jī)構(gòu)Artificial Analysis發(fā)布了最新的全球視頻生成大模型榜單，快手可靈1.6pro（高品質(zhì)模

?可靈AI ?視頻生成模型 ?圖像生成模型
薦AI日?qǐng)?bào)：字節(jié)發(fā)布豆包1.5深度思考模型；微信首個(gè)AI助手 “元寶” 上線；OpenAI發(fā)布o4-mini、滿血版o3

歡迎來到【AI日?qǐng)?bào)】欄目!這里是你每天探索人工智能世界的指南，每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容，聚焦開發(fā)者，助你洞悉技術(shù)趨勢(shì)、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點(diǎn)擊了解:https://top.aibase.com/1、OpenAI發(fā)布兩款多模態(tài)推理模型o4-mini、滿血版o3OpenAI在技術(shù)直播中推出了其最新的多模態(tài)模型o4-mini和滿血版o3，這兩款模型具備同時(shí)處理文本、圖像和音頻的能力，并能調(diào)用外部工?

?人工智能 ?多模態(tài)模型 ?OpenAI
薦AI日?qǐng)?bào)：ChatGPT重磅上線圖像庫功能；白嫖！Veo2登陸谷歌AI Studio；螞蟻百寶箱推“MCP專區(qū)”

歡迎來到【AI日?qǐng)?bào)】欄目!這里是你每天探索人工智能世界的指南，每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容，聚焦開發(fā)者，助你洞悉技術(shù)趨勢(shì)、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點(diǎn)擊了解:https://top.aibase.com/1、報(bào)道稱字節(jié)跳動(dòng)整合 AI 研發(fā)團(tuán)隊(duì)，AI Lab 即將并入 Seed字節(jié)跳動(dòng)正在進(jìn)行AI研發(fā)團(tuán)隊(duì)的整合，將獨(dú)立的字節(jié)AI Lab并入Seed團(tuán)隊(duì)。這一舉措體現(xiàn)了字節(jié)在AI領(lǐng)域戰(zhàn)略布局的調(diào)整，旨在進(jìn)?

?字節(jié)跳動(dòng) ?AI研發(fā) ?AI
薦AI日?qǐng)?bào)：kimi宣布降價(jià)；OpenRouter發(fā)布免費(fèi)模型Quasar Alpha；Midjourney V7重磅上線

歡迎來到【AI日?qǐng)?bào)】欄目!這里是你每天探索人工智能世界的指南，每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容，聚焦開發(fā)者，助你洞悉技術(shù)趨勢(shì)、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點(diǎn)擊了解:https://top.aibase.com/1、IDC:到2028年中國人工智能投資將突破1000億美元根據(jù)國際數(shù)據(jù)公司的預(yù)測(cè)，中國在人工智能領(lǐng)域的投資將顯著增長(zhǎng)，預(yù)計(jì)到2028年總投資將突破1000億美元，年均復(fù)合增長(zhǎng)率達(dá)到35.2%。

?人工智能 ?投資預(yù)測(cè) ?生成式AI
AI日?qǐng)?bào)：阿里騰訊全面支持MCP協(xié)議；階躍星辰多模態(tài)推理模型Step-R1-V-Mini；美圖WHEE圖像生成模型Miracle F1

歡迎來到【AI日?qǐng)?bào)】欄目!這里是你每天探索人工智能世界的指南，每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容，聚焦開發(fā)者，助你洞悉技術(shù)趨勢(shì)、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點(diǎn)擊了解:https://top.aibase.com/1、阿里巴巴已宣布全面支持MCP協(xié)議騰訊緊隨其后近日，中國人工智能領(lǐng)域迎來技術(shù)標(biāo)準(zhǔn)的變革，ModelContextProtocol成為國內(nèi)AI生態(tài)的事實(shí)標(biāo)準(zhǔn)。12.英偉達(dá)發(fā)布Llama3.1NemotronUltra253B，性能?

?人工智能 ?MCP協(xié)議 ?阿里巴巴
薦AI日?qǐng)?bào)：小米首個(gè)推理大模型開源Xiaomi MiMo；快手上線AI筆記工具“喵記多”；騰訊拆分AI團(tuán)隊(duì)

本文匯總了AI領(lǐng)域最新動(dòng)態(tài)：1)小米開源70億參數(shù)大模型Xiaomi MiMo，在數(shù)學(xué)推理和代碼競(jìng)賽中超越OpenAI和阿里模型；2)快手推出AI筆記工具"喵記多"，簡(jiǎn)化筆記管理；3)Luma AI發(fā)布電影級(jí)鏡頭控制API，降低視頻生成門檻；4)騰訊重組AI團(tuán)隊(duì)，加大語言模型研發(fā)投入；5)Anthropic為Claude引入新語音"Glassy"；6)谷歌NotebookLM新增50+語言音頻概述功能；7)xAI將發(fā)布Grok3.5模型；8)Meta推出獨(dú)立AI助手應(yīng)用挑戰(zhàn)ChatGPT；9)OpenAI緊急修復(fù)GPT-4o"諂媚"問題；10)Mac本地AI助手Simular升級(jí)隱私保護(hù)；11)CameraBench項(xiàng)目幫助AI理解鏡頭運(yùn)動(dòng)；12)谷歌推出個(gè)性化語言學(xué)習(xí)AI工具。

?人工智能 ?Xiaomi ?MiMo

熱文

3 天
7天

站長(zhǎng)商機(jī)

廣告

商務(wù)合作侵權(quán)投訴廣告服務(wù) 版權(quán)聲明招聘

?CopyRight 2002-2020 CHINAZ.COM