无码在线播放二区|久久亚洲精品国产精品|无码视频在线观看一区二区|在线观看国产日韩亚洲中

  • <menu id="yw4o4"></menu>
  • 
    <menu id="yw4o4"><em id="yw4o4"></em></menu>
  • 首頁 > 業(yè)界 > 關(guān)鍵詞  > 3D-語言模型最新資訊  > 正文

    懂3D的語言模型來了!UCLA、上交、MIT等聯(lián)合提出3D-LLM:性能大漲9%

    2023-08-03 15:39 · 稿源: 新智元公眾號

    【新智元導(dǎo)讀】有了3D-語言模型,去重慶導(dǎo)航也不在「話」下!大型語言模型(LLM)和視覺語言模型(VLM)在各種評測基準(zhǔn)中都展現(xiàn)出了強(qiáng)大的性能,比如可以看圖說話、進(jìn)行常識推理。但這些模型的訓(xùn)練過程并沒有引入3D物理世界,也就無法理解更豐富的現(xiàn)實(shí)概念,包括空間關(guān)系、布局、物體

    ......

    本文由站長之家合作伙伴自媒體作者“新智元公眾號”授權(quán)發(fā)布于站長之家平臺,本平臺僅提供信息索引服務(wù)。由于內(nèi)容發(fā)布時(shí)間超過平臺更新維護(hù)時(shí)間,為了保證文章信息的及時(shí)性,內(nèi)容觀點(diǎn)的準(zhǔn)確性,平臺將不提供完全的內(nèi)容展現(xiàn),本頁面內(nèi)容僅為平臺搜索索引使用。需閱讀完整內(nèi)容的用戶,請查看原文,獲取內(nèi)容詳情。

    舉報(bào)

    • 相關(guān)推薦
    • Evisort成功開發(fā)法律同領(lǐng)域的大型語言模型(LLM)

      Evisort成功開發(fā)了專門用于法律協(xié)議的大型語言模型,并將其作為其新的多方位生成AI引擎的關(guān)鍵組成部分。該LLM將使Evisort能夠提供比通用的第三方LLMs更準(zhǔn)確和響應(yīng)更靈活的AI創(chuàng)新,從幫助組織更好地管理合同。這一創(chuàng)新也受到了業(yè)界的認(rèn)可,得到了微軟風(fēng)投M12的高度評價(jià)。

    • 開源機(jī)器學(xué)習(xí)庫vLLM 提升大語言模型推理速度

      大語言模型在改變?nèi)藗兊纳詈吐殬I(yè)方面影響越來越大,因?yàn)樗鼈儗?shí)現(xiàn)了編程助手和通用聊天機(jī)器人等新應(yīng)用。這些應(yīng)用的運(yùn)行需要大量硬件加速器如GPU,操作成本非常高。更大的模型、更復(fù)雜的解碼算法和更長的序列會導(dǎo)致更明顯的改進(jìn)。

    • OpenAI科學(xué)家最新大語言模型演講火了,洞見LLM成功的關(guān)鍵

      OpenAI研究科學(xué)家HyungWonChung在首爾國立大學(xué)做了題為「LargeLanguageModels」的演講。他在自己的YouTube頻道上寫到:「這是一次雄心勃勃的嘗試,旨在總結(jié)我們這個爆炸性的領(lǐng)域。至于哪個AI模型將成為這個新范式的旗艦代表,就讓我們拭目以待吧。

    • Meta AI提出視頻摳圖新方法OmnimatteRF:結(jié)動態(tài)2D前景圖層和3D背景模型

      Omnimatte是迄今為止最有前景的視頻摳圖方法。它使用單應(yīng)性建模背景,因此只適用于背景為平面或僅有旋轉(zhuǎn)運(yùn)動的視頻。它也可助力構(gòu)建沉浸式的虛擬環(huán)境。

    • Auctoria利用生成AI創(chuàng)建3D視頻游戲模型

      波蘭虛擬現(xiàn)實(shí)游戲開發(fā)公司CarbonStudio的聯(lián)合創(chuàng)始人AleksanderCaban多年前觀察到現(xiàn)代游戲設(shè)計(jì)中存在一個重要問題:手動創(chuàng)建視頻游戲環(huán)境中的基本元素,如巖石、山丘、路徑等,通常是耗時(shí)且繁瑣的過程。為了解決這個問題,Caban決定開發(fā)技術(shù)來自動化這個過程。我們的團(tuán)隊(duì)兩年前開始開發(fā)這個工具,使我們能夠擁有一個可供使用的產(chǎn)品。

    • 生成式AI—大語言模型是如何生成內(nèi)容的?

      備受關(guān)注的大語言模型,核心是自然語言的理解與文本內(nèi)容的生成,對于此,你是否好奇過它們究竟是如何理解自然語言并生成內(nèi)容的,其工作原理又是什么呢?要想了解這個,我們就不得不先跳出大語言模型的領(lǐng)域,來到機(jī)器翻譯這里。傳統(tǒng)的機(jī)器翻譯方式是采用RNN循環(huán)神經(jīng)網(wǎng)絡(luò)。以上就是大語言模型的工作原理了,強(qiáng)大Transformer的實(shí)用性還不止于在自然語言處理領(lǐng)域,包括?

    • 創(chuàng)新型生成模型CityDreamer:一鍵生成無邊界的3D城市

      關(guān)于3D自然場景生成的研究已經(jīng)很多,但對于3D城市生成的研究相對較少。這是因?yàn)樵诔鞘协h(huán)境中,人們對結(jié)構(gòu)扭曲更加敏感生成3D城市比生成3D自然場景更為復(fù)雜。這一技術(shù)的應(yīng)用前景非常廣闊,將在游戲、城市規(guī)劃、虛擬現(xiàn)實(shí)等領(lǐng)域發(fā)揮關(guān)鍵作用。

    • 寒武紀(jì)提升產(chǎn)品在AIGC及大語言模型領(lǐng)域的性能并推動技術(shù)

      目前,人工智能芯片技術(shù)仍處于發(fā)展的初期階段,技術(shù)迭代速度加快,技術(shù)發(fā)展路徑尚在探索中,尚未形成具有絕 對優(yōu)勢的架構(gòu)和系統(tǒng)生態(tài)。隨著越來越多的廠商推出人工智能芯片產(chǎn)品,該領(lǐng)域市場競爭日趨激烈。寒武紀(jì)自成立以來一直專注于人工智能芯片設(shè)計(jì)領(lǐng)域,積累了較強(qiáng)的技術(shù)和研發(fā)優(yōu)勢,已獲得一批核心技術(shù)與關(guān)鍵專利,技術(shù)創(chuàng)新能力得到業(yè)界廣泛認(rèn)可,并較早實(shí)?

    • LayoutNUWA:一個基于大型語言模型的布局生成工具

      在網(wǎng)上創(chuàng)建引人注目的設(shè)計(jì)對于吸引用戶的興趣和幫助他們理解信息非常重要。這種新方法,被稱為LayoutNUWA,通過使用語言模型將編碼指令轉(zhuǎn)化為出色的布局,使這些設(shè)計(jì)更加智能。通過這些核心功能,LayoutNUWA為用戶提供了一個強(qiáng)大的布局生成工具,可以應(yīng)用于各種項(xiàng)目和領(lǐng)域,從提高布局生成的效率和質(zhì)量。

    • 法國初創(chuàng)公司 Mistral AI 免費(fèi)發(fā)布高性能語言模型 Mistral7B

      MistralAI,一家法國人工智能初創(chuàng)公司,最近發(fā)布了一款性能優(yōu)越的語言模型Mistral7B,并免費(fèi)向所有人提供使用。圖片來源:米斯特拉爾人工智能該模型基于Apache2.0許可證發(fā)布,除了歸屬之外,沒有任何使用或復(fù)制的限制。對于對Mistral7B模型的開放性以及未來發(fā)布計(jì)劃的一些疑問,我們已經(jīng)聯(lián)系了Mistral,并等待他們的回復(fù)。