11.11云上盛惠!海量產(chǎn)品 · 輕松上云!云服務(wù)器首年1.8折起,買1年送3個月!超值優(yōu)惠,性能穩(wěn)定,讓您的云端之旅更加暢享??靵眚v訊云選購吧!
本文介紹了多款A(yù)I領(lǐng)域的新產(chǎn)品和技術(shù)進展:1)Kortix-AI推出開源通用AI智能體平臺Suna;2)騰訊混元3D生成模型升級至2.5版本;3)海螺AI推出基于單張圖像生成多角度角色圖像功能;4)百度發(fā)布"心響"App整合多智能體協(xié)作;5)Nari Labs開源媲美真人的對話語音模型Dia;6)Grok新增視覺處理和多語言支持;7)Genspark推出AI幻燈片工具;8)Character.AI發(fā)布讓靜態(tài)圖片"說話"的AvatarFX模型;9)pad.ws結(jié)合白板和代碼編輯器;10)OpenBMB開源社區(qū)推出長文本生成模型"卷姬";11)騰訊推出AI閱讀助手"企鵝讀伴";12)OpenAI有意收購Chrome瀏覽器;13)字節(jié)跳動調(diào)整AI產(chǎn)品線布局。這些創(chuàng)新展現(xiàn)了AI技術(shù)在自動化、3D生成、語音交互、內(nèi)容創(chuàng)作等領(lǐng)域的快速發(fā)展。
騰訊最新公告,一口氣開源5個3D生成模型,通過騰訊混元3D官網(wǎng)即可體驗。這5個開源模型均基于Hunyuan3D-2.0打造:Turbo系列模型:在保證高精度和高質(zhì)量的基礎(chǔ)上,對幾何生成模型進行了數(shù)十倍的加速,確保整個生成過程能夠在30秒內(nèi)完成。除通用OBJ、GLB、FBX外,可輸出STL、USDZ及MP4等主流格式,無縫連接3D打印工具,也可支持模型快速預(yù)覽及移動端實時交互,滿足不同業(yè)務(wù)場景對3D模型格式的使用要求。
《黑神話·悟空》的火爆,帶火的不僅是3D游戲本身有背后暗潮洶涌的AI3D生成技術(shù)。外界對3D大模型賽道的關(guān)注度都稍遜于語言模型和視頻模型。3DScalingLaw或?qū)淼耐黄菩赃M展,似乎已經(jīng)預(yù)示了人工智能領(lǐng)域下一個焦點的方向。
上海交大和香港中文大學(xué)的研究團隊推出了一個名為Bootstrap3D的新框架,它通過結(jié)合微調(diào)的3D感知多模態(tài)大模型,能夠自動生成任意數(shù)量的高質(zhì)量多視角圖片數(shù)據(jù),顯著提升3D生成模型的能力。這個框架的合成數(shù)據(jù)集已經(jīng)全面開源,供研究人員和開發(fā)者免費使用。實驗結(jié)果證明,使用TTR策略的多視圖擴散模型在圖像-文本對齊、圖像質(zhì)量和視圖一致性方面表現(xiàn)優(yōu)異,有效提升了多?
使用大模型合成的數(shù)據(jù),就能顯著提升3D生成能力?來自上海交大、香港中文大學(xué)等團隊還真做到了。他們推出Bootstrap3D框架,結(jié)合微調(diào)的具備3D感知能力的多模態(tài)大模型。Bootstrap3D生成的數(shù)據(jù)集已經(jīng)全面開源,任何研究人員和開發(fā)者都可以免費訪問和使用。
谷歌推出的CAT3D模型在3D重建領(lǐng)域取得了顯著的進展,它通過使用多視角擴散模型來創(chuàng)建3D場景,提供了一種快速且高效的方法來生成3D內(nèi)容。主要特點:快速生成:CAT3D能夠在最短的時間內(nèi),即一分鐘內(nèi)完成整個3D場景的創(chuàng)建,這比現(xiàn)有的單圖像和少視圖3D場景創(chuàng)建方法要快得多。CAT3D的出現(xiàn)是3D重建技術(shù)的重大突破,它有潛力改變虛擬現(xiàn)實、游戲開發(fā)、建筑設(shè)計等多個行業(yè),為用戶
Spline的最新3D生成工具的發(fā)布,標志著3D設(shè)計領(lǐng)域的一次重大進步。這款在線3D編輯工具不僅支持從文字和圖片生成3D模型能夠混合和編輯3D模型,為用戶提供了一個全面強大的3D設(shè)計解決方案。這意味著用戶可以始終接觸到行業(yè)的最新趨勢,并將這些新功能應(yīng)用到自己的項目中,保持創(chuàng)作的前沿性和創(chuàng)新性。
StableVideo3D是StabilityAI推出的新模型,在3D技術(shù)領(lǐng)域取得了顯著進步。與之前發(fā)布的StableZero123相比,StableVideo3D提供了大幅改進的質(zhì)量和多視角支持。了解更多關(guān)于如何使用StableVideo3D以及產(chǎn)品特色,請訪問StableVideo3D官網(wǎng)。
StabilityAI和TripoAI昨晚聯(lián)合發(fā)布了一款名為TripoSR的3D生成模型。這款模型能夠在不到1秒的時間內(nèi)生成高質(zhì)量的3D模型,這一創(chuàng)新技術(shù)的推出無疑將為3D建模領(lǐng)域帶來革命性的變革。StabilityAI和TripoAI的這次合作,推出的TripoSR3D生成模型,不僅在技術(shù)上取得了突破,也為3D建模領(lǐng)域帶來了新的可能性。
Meshy-2這個版本在Textto3D領(lǐng)域有著巨大的飛躍,為3D對象提供更好結(jié)構(gòu)的網(wǎng)格和豐富的幾何細節(jié)。在Meshy-2中,Textto3D提供了四種風(fēng)格選擇:真實、卡通、低多邊形和Voxel,以滿足各種藝術(shù)偏好并激發(fā)新的創(chuàng)意方向。開發(fā)者上傳圖像并通過Meshy-2的Imageto3D功能改進生成的3D對象。