11.11云上盛惠!海量產(chǎn)品 · 輕松上云!云服務(wù)器首年1.8折起,買1年送3個月!超值優(yōu)惠,性能穩(wěn)定,讓您的云端之旅更加暢享。快來騰訊云選購吧!
據(jù)報道,月之暗面公司正式宣布推出其全新的SOTA模型k1.5多模態(tài)思考模型,在多模態(tài)推理和通用推理能力上都實現(xiàn)了突破。k1.5多模態(tài)思考模型具備多模態(tài)推理能力,能夠同時處理和分析來自不同模態(tài)的信息,如文本、圖像、聲音等,從提供更全面、更準(zhǔn)確的理解和知識。用戶在使用過程中如果發(fā)現(xiàn)模型切換按鈕,即可體驗這一全新升級的模型。
自回歸文生圖,迎來新王者——新開源模型Infinity,字節(jié)商業(yè)化技術(shù)團(tuán)隊出品,超越DiffusionModel。值得一提的是,這其實是從前段時間斬獲NeurIPS最佳論文VAR衍生來的文生圖版本。Infinity2B和20B的模型都已經(jīng)開放了網(wǎng)站體驗,感興趣的同學(xué)可以試一試效果。
10月24日,趣丸科技宣布與香港中文大學(xué)聯(lián)合研發(fā)的語音大模型“MaskGCT”正式在Amphion系統(tǒng)中開源,面向全球用戶開放使用。區(qū)別于傳統(tǒng)TTS模型,該模型采用掩碼生成模型與語音表征解耦編碼的創(chuàng)新范式,在聲音克隆、跨語種合成、語音控制等任務(wù)中展現(xiàn)出卓越效果。以“趣丸千音”為代表的產(chǎn)品的出現(xiàn),將加速國產(chǎn)短劇“走出去”,進(jìn)一步推動中華文化在全球不同語境下的傳播。
就在剛剛,英偉達(dá)開源了超強(qiáng)模型Nemotron-70B,后者一經(jīng)發(fā)布就超越了GPT-4o和Claude3.5Sonnet,僅次于OpenAIo1!AI社區(qū)驚呼:新的開源王者又來了?業(yè)內(nèi)直呼:用Llama3.1訓(xùn)出小模型吊打GPT-4o,簡直是神來之筆!一覺醒來,新模型Nemotron-70B成為僅次o1的最強(qiáng)王者!是的,就在昨晚,英偉達(dá)悄無聲息地開源了這個超強(qiáng)大模型。它立刻在AI社區(qū)引發(fā)巨大轟動。對齊模型的性能:所有模型均由Llama-3.1-70B-Inst
【新智元導(dǎo)讀】Robin3D通過魯棒指令數(shù)據(jù)生成引擎生成的大規(guī)模數(shù)據(jù)進(jìn)行訓(xùn)練,以提高模型在3D場景理解中的魯棒性和泛化能力,在多個3D多模態(tài)學(xué)習(xí)基準(zhǔn)測試中取得了優(yōu)異的性能,超越了以往的方法,且無需針對特定任務(wù)的微調(diào)。多模態(tài)大語言模型以文本模態(tài)為基礎(chǔ),將其它各種模態(tài)對齊至語言模型的語義空間,從實現(xiàn)多模態(tài)的理解和對話能力。這種大幅的提升體現(xiàn)了對抗性數(shù)據(jù)對模型識別能力的提升。
【新智元導(dǎo)讀】o1模型發(fā)布1周,lmsys的6k投票就將o1-preview送上了排行榜榜首。為了滿足大家對模型「IOI金牌水平」的好奇心,OpenAI放出了o1測評時提交的所有代碼。這位網(wǎng)友還表示,o1基本沿用了GPT-4的架構(gòu);那你想,改換架構(gòu)后的GPT-5能達(dá)到什么高度。
這次是在多模態(tài)領(lǐng)域:就在剛剛,阿里國際AI團(tuán)隊開源多模態(tài)大模型Ovis1.6。對于廣大開發(fā)者言,來自于實干家們的開源貢獻(xiàn),亦是福音。
【新智元導(dǎo)讀】Mini-Monkey是一個輕量級的多模態(tài)大型語言模型,通過采用多尺度自適應(yīng)切分策略和尺度壓縮機(jī)制,有效緩解了傳統(tǒng)圖像切分策略帶來的鋸齒效應(yīng),提升了模型在高分辨率圖像處理和文檔理解任務(wù)的性能。它在多項基準(zhǔn)測試中取得了領(lǐng)先的成績,證明了其在多模態(tài)理解和文檔智能領(lǐng)域的潛力。作者也驗證了多尺度自適應(yīng)切分策略在別的架構(gòu)的多模態(tài)大模型上的有效性,為緩解由切分增大分辨率導(dǎo)致的「后遺癥」提供了一種簡單有效的解決方案。
提升多模態(tài)大模型處理高分辨率圖像的能力越來越引起這個領(lǐng)域的關(guān)注。絕大多數(shù)方法致力于通過對圖像進(jìn)行切分再融合的策略,來提升多模態(tài)大模型對圖像細(xì)節(jié)的理解能力。作者也驗證了多尺度自適應(yīng)切分策略在別的架構(gòu)的多模態(tài)大模型上的有效性,為緩解由切分增大分辨率導(dǎo)致的「后遺癥」提供了一種簡單有效的解決方案。
【新智元導(dǎo)讀】號稱不可能輕易被擊敗的AGI基準(zhǔn)ARC-AGI被GPT-4o撼動,GPT-4o以在公共測試集50%、在訓(xùn)練集71%的準(zhǔn)確率成為了新的SOTA!ARC-AGI是唯一可以用來衡量通用人工智能進(jìn)展的基準(zhǔn),創(chuàng)造者Fran?oisChollets曾經(jīng)擲下豪言——「它不可能輕易被擊敗!」為了測試這一點,他于2020年在Kaggle上主辦了首屆ARC-AGI競賽。獲勝團(tuán)隊icecuber在測試集上僅取得了21%的成功率,這個成績強(qiáng)有力地證明了Fran?ois的斷言是正確的。「我的觀點并不是說GPT-4o相對于人類來說是聰明的,但我確實認(rèn)為它是具有『智能』的。