11.11云上盛惠!海量產(chǎn)品 · 輕松上云!云服務(wù)器首年1.8折起,買1年送3個(gè)月!超值優(yōu)惠,性能穩(wěn)定,讓您的云端之旅更加暢享??靵?lái)騰訊云選購(gòu)吧!
【新智元導(dǎo)讀】巨頭英偉達(dá),即將收購(gòu)阿里前副總裁賈揚(yáng)清的初創(chuàng)LeptonAI,交易價(jià)值或達(dá)數(shù)億美元!LeptonAI,僅僅創(chuàng)立兩年。國(guó)內(nèi)AI圈被這一消息刷屏了。曾有網(wǎng)友戲稱,學(xué)物理繞不開(kāi)牛頓,搞深度學(xué)習(xí),繞不開(kāi)賈揚(yáng)清。
日前,昇思人工智能框架峰會(huì)在北京召開(kāi),華為ICT戰(zhàn)略與業(yè)務(wù)發(fā)展部總裁彭紅華發(fā)表致辭。彭紅華表示,經(jīng)歷5年發(fā)展,昇騰硬件伙伴從5家發(fā)展到60多家,基于昇騰開(kāi)發(fā)的硬件產(chǎn)品已經(jīng)近千款。優(yōu)化自動(dòng)算子級(jí)策略傳播算法,降低80%并行策略配置,支持典型大模型。
根據(jù)研究團(tuán)隊(duì)發(fā)表的預(yù)印本文章,InstantMesh是由騰訊PCGARC實(shí)驗(yàn)室和上海科技大學(xué)的研究人員開(kāi)發(fā)的人工智能框架,能夠在僅需10秒的時(shí)間內(nèi),從單個(gè)2D圖像生成高質(zhì)量的3D網(wǎng)格。該開(kāi)源框架由多視圖擴(kuò)散模型和3D網(wǎng)格重建模型組成,通過(guò)使用不同角度合成的3D視圖來(lái)實(shí)現(xiàn)高質(zhì)量的重建。這一技術(shù)有望顯著提升3D行業(yè)生產(chǎn)力,尤其在視頻游戲開(kāi)發(fā)領(lǐng)域。
中國(guó)香港中文大學(xué)和SmartMore的研究人員推出了一種名為Mini-Gemini的新穎框架,通過(guò)增強(qiáng)多模態(tài)輸入處理來(lái)推動(dòng)VLMs的發(fā)展。Mini-Gemini采用了雙編碼器系統(tǒng)和一種新穎的補(bǔ)丁信息挖掘技術(shù),結(jié)合一個(gè)特別策劃的高質(zhì)量數(shù)據(jù)集,使其能夠有效處理高分辨率圖像并生成內(nèi)容豐富的視覺(jué)和文本內(nèi)容,從使其脫穎出。正如研究人員所承認(rèn)的那樣,Mini-Gemini在視覺(jué)理解和推理能力方面仍有改進(jìn)?
社交媒體上的毒性言論可能會(huì)像野火般蔓延,特別是針對(duì)個(gè)人和邊緣化群體。明顯的仇恨言論相對(duì)容易被發(fā)現(xiàn),但隱含毒性——依賴于刻板印象和編碼語(yǔ)言不是明顯的侮辱——提出了更為棘手的挑戰(zhàn)。但通過(guò)謹(jǐn)慎使用,它為賦予邊緣化聲音權(quán)力和遏制網(wǎng)絡(luò)上的壓制性言論提供了一條道路。
LaVague是一個(gè)旨在自動(dòng)化瀏覽器交互的大型動(dòng)作模型框架,通過(guò)將自然語(yǔ)言指令轉(zhuǎn)化為無(wú)縫的瀏覽器交互,重新定義了互聯(lián)網(wǎng)瀏覽體驗(yàn)。該框架的設(shè)計(jì)初衷是為用戶自動(dòng)化繁瑣的任務(wù),節(jié)省時(shí)間,讓用戶能夠?qū)W⒂诟幸饬x的事務(wù)。未來(lái)的發(fā)展方向可能包括優(yōu)化本地模型、改進(jìn)信息檢索以確保生成的代碼片段相關(guān)性、支持其他瀏覽器引擎等。
在最新的研究中,由卡內(nèi)基梅隆大學(xué)的研究團(tuán)隊(duì)開(kāi)發(fā),提出了一種名為H2O的框架,通過(guò)強(qiáng)化學(xué)習(xí)實(shí)現(xiàn)了人對(duì)人形機(jī)器人的實(shí)時(shí)全身遙控操作。該框架在僅使用RGB攝像頭的條件下,成功地讓人形機(jī)器人模仿并實(shí)時(shí)執(zhí)行各種動(dòng)態(tài)的全身運(yùn)動(dòng),包括行走、后空翻、踢球、轉(zhuǎn)身、揮手、推動(dòng)、拳擊等。這是首次在人形機(jī)器人領(lǐng)域?qū)崿F(xiàn)了這一技術(shù)上的突破,為全新的人機(jī)交互和協(xié)作場(chǎng)景?
加利福尼亞大學(xué)圣地亞哥分校和南加利福尼亞大學(xué)的研究人員最近推出了一種名為CyberDemo的新型人工智能框架,旨在通過(guò)視覺(jué)觀察進(jìn)行機(jī)器人模仿學(xué)習(xí)。傳統(tǒng)的模仿學(xué)習(xí)方法通常需要大量高質(zhì)量的示范數(shù)據(jù)來(lái)教導(dǎo)機(jī)器人完成復(fù)雜任務(wù),特別是對(duì)于需要高度靈巧的任務(wù)來(lái)說(shuō)。雖然為每個(gè)任務(wù)設(shè)計(jì)模擬環(huán)境需要額外的工作,但減少了數(shù)據(jù)收集的人為干預(yù),并避免了復(fù)雜的獎(jiǎng)勵(lì)設(shè)計(jì)?
MIT和Google的研究人員共同提出了一種名為Health-LLM的新型人工智能框架,旨在將大語(yǔ)言模型應(yīng)用于健康預(yù)測(cè)任務(wù),利用可穿戴傳感器的數(shù)據(jù)。該框架的提出標(biāo)志著健康領(lǐng)域在可穿戴技術(shù)和人工智能的交叉點(diǎn)上取得了重大突破。這為以更加可訪問(wèn)和可擴(kuò)展的方式應(yīng)用先進(jìn)的醫(yī)療保健分析打開(kāi)了新的可能性,從為個(gè)性化醫(yī)療的更廣泛目標(biāo)做出了貢獻(xiàn)。
隨著自然語(yǔ)言處理和自然語(yǔ)言生成的進(jìn)步,大型語(yǔ)言模型在實(shí)際應(yīng)用中得到了廣泛使用。由于它們能夠模仿人類行為,并具有通用性,這些模型已經(jīng)涉足各個(gè)領(lǐng)域。研究團(tuán)隊(duì)強(qiáng)調(diào)了對(duì)預(yù)訓(xùn)練數(shù)據(jù)篩選程序及其社會(huì)影響進(jìn)行更多研究的需求。