无码在线播放二区|久久亚洲精品国产精品|无码视频在线观看一区二区|在线观看国产日韩亚洲中

  • <menu id="yw4o4"></menu>
  • 
    <menu id="yw4o4"><em id="yw4o4"></em></menu>
  • 首頁 > 熱點(diǎn) > 關(guān)鍵詞  > 正文

    元象XVERSE開源650億參數(shù)通用大模型XVERSE-65B

    2023-11-06 10:17 · 稿源:站長之家

    站長之家(ChinaZ.com) 11月6日 消息:元象XVERSE宣布 開源650億參數(shù)高性能通用大模型XVERSE-65B,無條件免費(fèi)商用。

    XVERSE-65B 是由深圳元象科技開發(fā)的一種支持多語言的大型語言模型。它采用了 Transformer 網(wǎng)絡(luò)結(jié)構(gòu),參數(shù)規(guī)模達(dá)到了650億。

    模型通過訓(xùn)練了2.6萬億個(gè)令牌的高質(zhì)量多樣化數(shù)據(jù),包含了40多種語言。XVERSE-65B 具有16K 的上下文長度,適用于多輪對話、知識問答和摘要等任務(wù)。模型已在多個(gè)標(biāo)準(zhǔn)數(shù)據(jù)集上進(jìn)行了測試,并取得了良好的性能。

    微信截圖_20231106101724.png

    主要特點(diǎn)如下:

    模型結(jié)構(gòu):XVERSE-65B 使用主流 Decoder-only 的標(biāo)準(zhǔn) Transformer 網(wǎng)絡(luò)結(jié)構(gòu),支持16K 的上下文長度(Context Length),能滿足更長的多輪對話、知識問答與摘要等需求,模型應(yīng)用場景更廣泛。

    訓(xùn)練數(shù)據(jù):構(gòu)建了2.6萬億 token 的高質(zhì)量、多樣化的數(shù)據(jù)對模型進(jìn)行充分訓(xùn)練,包含中、英、俄、西等40多種語言,通過精細(xì)化設(shè)置不同類型數(shù)據(jù)的采樣比例,使得中英兩種語言表現(xiàn)優(yōu)異,也能兼顧其他語言效果。

    分詞:基于 BPE(Byte-Pair Encoding)算法,使用上百 GB 語料訓(xùn)練了一個(gè)詞表大小為100,534的分詞器,能夠同時(shí)支持多語言,而無需額外擴(kuò)展詞表。

    訓(xùn)練框架:自主研發(fā)多項(xiàng)關(guān)鍵技術(shù),包括高效算子、顯存優(yōu)化、并行調(diào)度策略、數(shù)據(jù)-計(jì)算-通信重疊、平臺(tái)和框架協(xié)同等,讓訓(xùn)練效率更高,模型穩(wěn)定性強(qiáng),在千卡集群上的峰值算力利用率位居業(yè)界前列。

    項(xiàng)目地址:https://github.com/xverse-ai/XVERSE-65B

    舉報(bào)

    • 相關(guān)推薦
    • OPENVERSE獲重磅資本加持,元宇宙賽道再添生力軍

      我們正處于互聯(lián)網(wǎng)范式轉(zhuǎn)變的關(guān)鍵階段:從中心化的平臺(tái)驅(qū)動(dòng)(Web 2),邁向去中心化的用戶主權(quán)網(wǎng)絡(luò)(Web3)。在Web3 體系下,數(shù)據(jù)與內(nèi)容的所有權(quán)回歸用戶本人,價(jià)值創(chuàng)造與價(jià)值流通基于協(xié)議自動(dòng)執(zhí)行,平臺(tái)不再是控制者,而是服務(wù)型工具。這意味著,下一代互聯(lián)網(wǎng)不再依賴于少數(shù)平臺(tái)巨頭,而是建立在公開透明、用戶可驗(yàn)證、自治協(xié)作的價(jià)值網(wǎng)絡(luò)之上。OPENVERSE作為新一代 We

    • DeepSeek上新!開源發(fā)布DeepSeek-Prover-V2-671B模型

      快科技4月30日消息,今日,DeepSeek 今日在 AI 開源社區(qū) Hugging Face 發(fā)布了一個(gè)名為 DeepSeek-Prover-V2-671B 的新模型。據(jù)介紹,DeepSeek-Prover-V2-671B 其參數(shù)量達(dá)到6710億,使用了更高效的 safetensors 文件格式,并支持 BF16、FP8、F32 等多種計(jì)算精度,方便模型更快、更省資源地訓(xùn)練和部署。在模型架構(gòu)上,該模型使用了DeepSeek-V3架構(gòu),采用MoE(混合專家)模式,具有61層Transformer層,7168維隱藏層。同時(shí)支持超長上下文,最大位置嵌入達(dá)163840,使其能處理復(fù)雜的數(shù)學(xué)證明,并且采用了FP8量化,可通過量化技術(shù)減小模型大小,提

    • 剛剛,商湯發(fā)布第六代大模型6000參數(shù)多模態(tài)MoE,中長視頻直接可推理

      現(xiàn)在的國產(chǎn)AI應(yīng)用,一口氣看好幾分鐘的視頻,都可以直接做推理和解析了!瞧~只需“喂”上一段柯南片段,AI就搖身一變成“名偵探”做剖析:它會(huì)對整個(gè)視頻的內(nèi)容先做一個(gè)總結(jié),再按照秒級,對視頻片段做內(nèi)容上的推演。商湯科技聯(lián)合創(chuàng)始人楊帆認(rèn)為:銀河通用合伙人、大模型負(fù)責(zé)人張直政表示:除此之外,上海交通大學(xué)副教授閆維新對這個(gè)問題的看法是:總言之,商湯作為國?

    • 2025年度總票房破250億 《哪吒2》獨(dú)占150億

      據(jù)燈塔專業(yè)版數(shù)據(jù),截至今日17時(shí)38分,2025年度電影大盤票房成功突破了250億大關(guān)?!赌倪钢[海》以勢如破竹之勢,獨(dú)占了超過151.88億的票房,占據(jù)了總票房60.8%的驚人比例,斷層領(lǐng)跑整個(gè)市場。

    • 男子喝熱水養(yǎng)生20年查出舌癌 醫(yī)生:65℃以上的水為致癌物

      鄭州張先生因長期飲用65℃以上熱水20年,導(dǎo)致舌癌。世界衛(wèi)生組織將65℃以上熱飲列為2A類致癌物??谇火つみm宜37℃左右,高溫會(huì)立即灼傷黏膜,長期反復(fù)損傷會(huì)增加癌變風(fēng)險(xiǎn)。食道對熱刺激不敏感,患者往往到吞咽困難時(shí)才就醫(yī),此時(shí)多已到中晚期。專家建議:熱飲熱食要晾涼再入口,小口慢飲,避免貪圖一時(shí)口快而損害健康。

    • 微軟電腦管家推送自家Microsoft 365廣告:還沒法關(guān)閉!

      快科技5月1日消息,微軟電腦管家在最新的更新中加入了對自家Microsoft 365的推廣內(nèi)容。微軟電腦管家主要功能包括清理內(nèi)存、提升性能和清理存儲(chǔ)空間等,但如今這款工具卻成為了微軟推廣自家服務(wù)的渠道之一電腦管家中的廣告以提示”的形式出現(xiàn),推廣Microsoft 365的移動(dòng)版本,點(diǎn)擊后就會(huì)訪問Windows 11中的Microsoft 365網(wǎng)頁。最糟糕的是,直接廣告嵌入在應(yīng)用程序的界面中,還關(guān)不了。這并非微軟電腦管家首次被用于推廣微軟的其他服務(wù),此前,該應(yīng)用曾被曝出推廣必應(yīng)作為默認(rèn)搜索引擎,還以修復(fù)提示”的形式出現(xiàn)。微軟近年來在推廣自家服務(wù)?

    • 榮耀手環(huán)10發(fā)布:支持心臟健康守護(hù) 國補(bǔ)194.65元起

      榮耀手環(huán)10發(fā)布,提供標(biāo)準(zhǔn)版和NFC版兩種款式,四色可選。配備1.57英寸AMOLED屏,重22.1克,支持快速更換表帶。主打心臟健康監(jiān)測功能,可識別房顫等異常情況,并提供健康晨報(bào)。支持96種運(yùn)動(dòng)模式記錄,內(nèi)置180mAh電池,最長續(xù)航14天。NFC版支持公交、門禁等功能。標(biāo)準(zhǔn)版補(bǔ)貼后194.65元,NFC版228.65元。

    • 提升大模型自動(dòng)修Bug能力 豆包正式開源首個(gè)多語言類SWE數(shù)據(jù)集

      今日,字節(jié)跳動(dòng)豆包大模型團(tuán)隊(duì)宣布,正式開源首個(gè)多語言類SWE數(shù)據(jù)集Multi-SWE-bench,可用于評估和提升大模型自動(dòng)修Bug”能力。在SWE-bench基礎(chǔ)上,Multi-SWE-bench首次覆蓋Python之外的7種主流編程語言,是真正面向全棧工程”的評測基準(zhǔn)。相比于以往聚焦Python的單語言任務(wù),Multi-SWE-bench更貼近現(xiàn)實(shí)中的多語言開發(fā)場景,也更能反映當(dāng)前模型在自動(dòng)化軟件工程”方向上的實(shí)際能力邊界。

    • 魅族Note 16系列開啟1元預(yù)訂:購機(jī)享贈(zèng)耳機(jī)、365天只換不修等9大權(quán)益

      星紀(jì)魅族集團(tuán)中國區(qū)總經(jīng)理肖波此前表示,魅族Note16系列就是做人人都買得起、用得爽的國民手機(jī),大眾認(rèn)可很重要,設(shè)計(jì)團(tuán)隊(duì)打磨了數(shù)十個(gè)方案,通過多方調(diào)研,最終靈感源于中華千年藻井的方案脫穎而出。

    • 長安馬自達(dá)EZ-60全球首秀,接入豆包大模型

      4月23日,長安馬自達(dá)EZ-60在2025上海國際車展全球首發(fā)。作為品牌新能源戰(zhàn)略轉(zhuǎn)型產(chǎn)品,該車在美學(xué)設(shè)計(jì)、AI智能座艙、電感駕控及主被動(dòng)安全性能等方面實(shí)現(xiàn)突破。最大亮點(diǎn)是全面接入豆包大模型,用戶可通過語音指令實(shí)現(xiàn)復(fù)雜操作、互聯(lián)網(wǎng)信息問答及短視頻搜索等功能,打造"人-車-環(huán)境"跨模態(tài)交互體驗(yàn)。專屬AI助手支持超700項(xiàng)功能語音調(diào)用,實(shí)現(xiàn)"所說即所得"的智能交互。長安馬自達(dá)與火山引擎達(dá)成深度合作,將持續(xù)推進(jìn)大模型在智能座艙領(lǐng)域的創(chuàng)新應(yīng)用。