无码在线播放二区|久久亚洲精品国产精品|无码视频在线观看一区二区|在线观看国产日韩亚洲中

<menu id="yw4o4"></menu>

<menu id="yw4o4"><em id="yw4o4"></em></menu>

元象XVERSE開源650億參數(shù)通用大模型XVERSE-65B

2023-11-06 10:17 · 稿源：站長之家

站長之家(ChinaZ.com) 11月6日消息:元象XVERSE宣布開源650億參數(shù)高性能通用大模型XVERSE-65B，無條件免費(fèi)商用。

XVERSE-65B 是由深圳元象科技開發(fā)的一種支持多語言的大型語言模型。它采用了 Transformer 網(wǎng)絡(luò)結(jié)構(gòu)，參數(shù)規(guī)模達(dá)到了650億。

模型通過訓(xùn)練了2.6萬億個(gè)令牌的高質(zhì)量多樣化數(shù)據(jù)，包含了40多種語言。XVERSE-65B 具有16K 的上下文長度，適用于多輪對話、知識問答和摘要等任務(wù)。模型已在多個(gè)標(biāo)準(zhǔn)數(shù)據(jù)集上進(jìn)行了測試，并取得了良好的性能。

微信截圖_20231106101724.png

主要特點(diǎn)如下:

模型結(jié)構(gòu):XVERSE-65B 使用主流 Decoder-only 的標(biāo)準(zhǔn) Transformer 網(wǎng)絡(luò)結(jié)構(gòu)，支持16K 的上下文長度（Context Length），能滿足更長的多輪對話、知識問答與摘要等需求，模型應(yīng)用場景更廣泛。

訓(xùn)練數(shù)據(jù):構(gòu)建了2.6萬億 token 的高質(zhì)量、多樣化的數(shù)據(jù)對模型進(jìn)行充分訓(xùn)練，包含中、英、俄、西等40多種語言，通過精細(xì)化設(shè)置不同類型數(shù)據(jù)的采樣比例，使得中英兩種語言表現(xiàn)優(yōu)異，也能兼顧其他語言效果。

分詞:基于 BPE（Byte-Pair Encoding）算法，使用上百 GB 語料訓(xùn)練了一個(gè)詞表大小為100，534的分詞器，能夠同時(shí)支持多語言，而無需額外擴(kuò)展詞表。

訓(xùn)練框架:自主研發(fā)多項(xiàng)關(guān)鍵技術(shù)，包括高效算子、顯存優(yōu)化、并行調(diào)度策略、數(shù)據(jù)-計(jì)算-通信重疊、平臺(tái)和框架協(xié)同等，讓訓(xùn)練效率更高，模型穩(wěn)定性強(qiáng)，在千卡集群上的峰值算力利用率位居業(yè)界前列。

項(xiàng)目地址：https://github.com/xverse-ai/XVERSE-65B

（舉報(bào)）

相關(guān)推薦

關(guān)鍵詞：

OPENVERSE獲重磅資本加持，元宇宙賽道再添生力軍

我們正處于互聯(lián)網(wǎng)范式轉(zhuǎn)變的關(guān)鍵階段：從中心化的平臺(tái)驅(qū)動(dòng)（Web 2），邁向去中心化的用戶主權(quán)網(wǎng)絡(luò)（Web3）。在Web3 體系下，數(shù)據(jù)與內(nèi)容的所有權(quán)回歸用戶本人，價(jià)值創(chuàng)造與價(jià)值流通基于協(xié)議自動(dòng)執(zhí)行，平臺(tái)不再是控制者，而是服務(wù)型工具。這意味著，下一代互聯(lián)網(wǎng)不再依賴于少數(shù)平臺(tái)巨頭，而是建立在公開透明、用戶可驗(yàn)證、自治協(xié)作的價(jià)值網(wǎng)絡(luò)之上。OPENVERSE作為新一代 We

?Web3 ?去中心化 ?用戶主權(quán)
DeepSeek上新！開源發(fā)布DeepSeek-Prover-V2-671B新模型

快科技4月30日消息，今日，DeepSeek 今日在 AI 開源社區(qū) Hugging Face 發(fā)布了一個(gè)名為 DeepSeek-Prover-V2-671B 的新模型。據(jù)介紹，DeepSeek-Prover-V2-671B 其參數(shù)量達(dá)到6710億，使用了更高效的 safetensors 文件格式，并支持 BF16、FP8、F32 等多種計(jì)算精度，方便模型更快、更省資源地訓(xùn)練和部署。在模型架構(gòu)上，該模型使用了DeepSeek-V3架構(gòu)，采用MoE（混合專家）模式，具有61層Transformer層，7168維隱藏層。同時(shí)支持超長上下文，最大位置嵌入達(dá)163840，使其能處理復(fù)雜的數(shù)學(xué)證明，并且采用了FP8量化，可通過量化技術(shù)減小模型大小，提

?DeepSeek ?AI模型發(fā)布 ?開源社區(qū)
薦剛剛，商湯發(fā)布第六代大模型：6000億參數(shù)多模態(tài)MoE，中長視頻直接可推理

現(xiàn)在的國產(chǎn)AI應(yīng)用，一口氣看好幾分鐘的視頻，都可以直接做推理和解析了!瞧~只需“喂”上一段柯南片段，AI就搖身一變成“名偵探”做剖析:它會(huì)對整個(gè)視頻的內(nèi)容先做一個(gè)總結(jié)，再按照秒級，對視頻片段做內(nèi)容上的推演。商湯科技聯(lián)合創(chuàng)始人楊帆認(rèn)為:銀河通用合伙人、大模型負(fù)責(zé)人張直政表示:除此之外，上海交通大學(xué)副教授閆維新對這個(gè)問題的看法是:總言之，商湯作為國?

?國產(chǎn)AI ?視頻解析 ?智能剪輯
2025年度總票房破250億《哪吒2》獨(dú)占150億

據(jù)燈塔專業(yè)版數(shù)據(jù)，截至今日17時(shí)38分，2025年度電影大盤票房成功突破了250億大關(guān)?！赌倪钢[海》以勢如破竹之勢，獨(dú)占了超過151.88億的票房，占據(jù)了總票房60.8%的驚人比例，斷層領(lǐng)跑整個(gè)市場。

?電影市場 ?票房數(shù)據(jù) ?2025年度
男子喝熱水養(yǎng)生20年查出舌癌醫(yī)生：65℃以上的水為致癌物

鄭州張先生因長期飲用65℃以上熱水20年，導(dǎo)致舌癌。世界衛(wèi)生組織將65℃以上熱飲列為2A類致癌物?？谇火つみm宜37℃左右，高溫會(huì)立即灼傷黏膜，長期反復(fù)損傷會(huì)增加癌變風(fēng)險(xiǎn)。食道對熱刺激不敏感，患者往往到吞咽困難時(shí)才就醫(yī)，此時(shí)多已到中晚期。專家建議：熱飲熱食要晾涼再入口，小口慢飲，避免貪圖一時(shí)口快而損害健康。

?舌癌 ?熱飲致癌 ?養(yǎng)生習(xí)慣
微軟電腦管家推送自家Microsoft 365廣告：還沒法關(guān)閉！

快科技5月1日消息，微軟電腦管家在最新的更新中加入了對自家Microsoft 365的推廣內(nèi)容。微軟電腦管家主要功能包括清理內(nèi)存、提升性能和清理存儲(chǔ)空間等，但如今這款工具卻成為了微軟推廣自家服務(wù)的渠道之一電腦管家中的廣告以提示”的形式出現(xiàn)，推廣Microsoft 365的移動(dòng)版本，點(diǎn)擊后就會(huì)訪問Windows 11中的Microsoft 365網(wǎng)頁。最糟糕的是，直接廣告嵌入在應(yīng)用程序的界面中，還關(guān)不了。這并非微軟電腦管家首次被用于推廣微軟的其他服務(wù)，此前，該應(yīng)用曾被曝出推廣必應(yīng)作為默認(rèn)搜索引擎，還以修復(fù)提示”的形式出現(xiàn)。微軟近年來在推廣自家服務(wù)?

?微軟電腦管家 ?Microsoft ?365
榮耀手環(huán)10發(fā)布：支持心臟健康守護(hù) 國補(bǔ)194.65元起

榮耀手環(huán)10發(fā)布，提供標(biāo)準(zhǔn)版和NFC版兩種款式，四色可選。配備1.57英寸AMOLED屏，重22.1克，支持快速更換表帶。主打心臟健康監(jiān)測功能，可識別房顫等異常情況，并提供健康晨報(bào)。支持96種運(yùn)動(dòng)模式記錄，內(nèi)置180mAh電池，最長續(xù)航14天。NFC版支持公交、門禁等功能。標(biāo)準(zhǔn)版補(bǔ)貼后194.65元，NFC版228.65元。

?榮耀手環(huán)10 ?心臟健康監(jiān)測 ?AMOLED屏幕
提升大模型自動(dòng)修Bug能力豆包正式開源首個(gè)多語言類SWE數(shù)據(jù)集

今日，字節(jié)跳動(dòng)豆包大模型團(tuán)隊(duì)宣布，正式開源首個(gè)多語言類SWE數(shù)據(jù)集Multi-SWE-bench，可用于評估和提升大模型自動(dòng)修Bug”能力。在SWE-bench基礎(chǔ)上，Multi-SWE-bench首次覆蓋Python之外的7種主流編程語言，是真正面向全棧工程”的評測基準(zhǔn)。相比于以往聚焦Python的單語言任務(wù)，Multi-SWE-bench更貼近現(xiàn)實(shí)中的多語言開發(fā)場景，也更能反映當(dāng)前模型在自動(dòng)化軟件工程”方向上的實(shí)際能力邊界。

?字節(jié)跳動(dòng) ?多語言數(shù)據(jù)集 ?大模型自動(dòng)修復(fù)
魅族Note 16系列開啟1元預(yù)訂：購機(jī)享贈(zèng)耳機(jī)、365天只換不修等9大權(quán)益

星紀(jì)魅族集團(tuán)中國區(qū)總經(jīng)理肖波此前表示，魅族Note16系列就是做人人都買得起、用得爽的國民手機(jī)，大眾認(rèn)可很重要，設(shè)計(jì)團(tuán)隊(duì)打磨了數(shù)十個(gè)方案，通過多方調(diào)研，最終靈感源于中華千年藻井的方案脫穎而出。

?魅族Note ?16 ?新機(jī)發(fā)布
長安馬自達(dá)EZ-60全球首秀，接入豆包大模型

4月23日，長安馬自達(dá)EZ-60在2025上海國際車展全球首發(fā)。作為品牌新能源戰(zhàn)略轉(zhuǎn)型產(chǎn)品，該車在美學(xué)設(shè)計(jì)、AI智能座艙、電感駕控及主被動(dòng)安全性能等方面實(shí)現(xiàn)突破。最大亮點(diǎn)是全面接入豆包大模型，用戶可通過語音指令實(shí)現(xiàn)復(fù)雜操作、互聯(lián)網(wǎng)信息問答及短視頻搜索等功能，打造"人-車-環(huán)境"跨模態(tài)交互體驗(yàn)。專屬AI助手支持超700項(xiàng)功能語音調(diào)用，實(shí)現(xiàn)"所說即所得"的智能交互。長安馬自達(dá)與火山引擎達(dá)成深度合作，將持續(xù)推進(jìn)大模型在智能座艙領(lǐng)域的創(chuàng)新應(yīng)用。

?長安馬自達(dá) ?MAZDA ?EZ-60

熱文

3 天
7天

站長商機(jī)

廣告

商務(wù)合作侵權(quán)投訴廣告服務(wù) 版權(quán)聲明招聘

?CopyRight 2002-2020 CHINAZ.COM