无码在线播放二区|久久亚洲精品国产精品|无码视频在线观看一区二区|在线观看国产日韩亚洲中

  • <menu id="yw4o4"></menu>
  • 
    <menu id="yw4o4"><em id="yw4o4"></em></menu>
  • 首頁 > 傳媒 > 關(guān)鍵詞  > 中國聯(lián)通最新資訊  > 正文

    大規(guī)模專家并行推理集群實(shí)現(xiàn)性能3倍躍遷,聯(lián)通元景開啟推理新紀(jì)元

    2025-04-07 19:36 · 稿源: 站長之家用戶

    近日,中國聯(lián)通持續(xù)技術(shù)攻堅(jiān),依托元景大模型MaaS平臺(tái)成功搭建“大規(guī)模專家并行” 推理集群,實(shí)現(xiàn)DeepSeek MoE 大模型在多節(jié)點(diǎn)間的超有效集群推理,單卡吞吐提升 3 倍,解碼時(shí)延降低 50%這一成果不僅為人工智能技術(shù)的創(chuàng)新發(fā)展提供了強(qiáng)大助力,也讓各行業(yè)以更有效率應(yīng)用 AI 技術(shù),加速推動(dòng)千行百業(yè)的數(shù)字化轉(zhuǎn)型。

    伴隨大模型MoE結(jié)構(gòu)重大技術(shù)革新,以往少量“全能型”專家的模式逐漸被取代,大量“??菩汀毙<抑饾u成為主流。這一轉(zhuǎn)變,極大地提升了模型的針對(duì)性和精細(xì)化程度,使得模型效果顯著改善。

    推理應(yīng)用在各行業(yè)的落地隨之全面加速,市場(chǎng)對(duì)于推理服務(wù)的需求呈井噴式增長,Tokens 處理量的需求與日俱增,這對(duì)推理系統(tǒng)的性能提出了更高的要求。為應(yīng)對(duì)這一挑戰(zhàn),大規(guī)模專家并行推理技術(shù)應(yīng)運(yùn)而生,為大模型推理的加速規(guī)模應(yīng)用提供了強(qiáng)大的技術(shù)支撐。

    聯(lián)通元景大模型與昇騰深度合作,圍繞大規(guī)模專家并行推理技術(shù)展開全方位創(chuàng)新,將 DeepSeek 671B滿血版大模型的數(shù)百個(gè)“??菩汀?小專家按特出方式分布到不同的NPU上,使得單卡權(quán)重占用顯存降低 75%,權(quán)重加載耗時(shí)大幅減少,可用于數(shù)據(jù)計(jì)算的顯存顯著增加。

    在通信環(huán)節(jié),雙方對(duì)集群跨機(jī)通信方案進(jìn)行深度優(yōu)化,通過引入先進(jìn)計(jì)算與通信并行算法,整體通信效率提升40%。此外,雙方聯(lián)合創(chuàng)新多級(jí)負(fù)載均衡算法,準(zhǔn)確識(shí)別并均衡各NPU 的負(fù)載,將卡間負(fù)載差異成功控制在 10% 以下,有效提升系統(tǒng)吞吐和計(jì)算資源利用率。

    聯(lián)通元景大模型MaaS平臺(tái)結(jié)合大規(guī)模專家并行推理集群系統(tǒng),基于DeepSeek 671B 滿血版大模型持續(xù)進(jìn)行針對(duì)性推理優(yōu)化創(chuàng)新,打造高可靠、高性能、易運(yùn)維推理服務(wù)。

    圍繞高可靠

    依托實(shí)例內(nèi)和實(shí)例間的多級(jí)容災(zāi)機(jī)制,保障業(yè)務(wù)連續(xù)性,提供長穩(wěn)推理服務(wù)。圍繞高性能,進(jìn)行高并發(fā)請(qǐng)求調(diào)度、管理、轉(zhuǎn)發(fā)等,打造整個(gè)集群的有效數(shù)據(jù)請(qǐng)求管理入口。

    圍繞易運(yùn)維

    進(jìn)行集群內(nèi)推理業(yè)務(wù)狀態(tài)監(jiān)控、以及PD身份和資源管理與決策等,打造整個(gè)推理集群的狀態(tài)監(jiān)控器和決策大腦,持續(xù)提升大規(guī)模專家并行推理集群易用性。

    在數(shù)字經(jīng)濟(jì)蓬勃發(fā)展的浪潮中,中國聯(lián)通始終勇立潮頭,全面發(fā)力人工智能。從精心搭建智算基礎(chǔ)設(shè)施,構(gòu)建強(qiáng)大算力“引擎”,到成功落地大規(guī)模專家并行推理集群,打造高性能低時(shí)延推理“中樞”,聯(lián)通元景大模型持續(xù)筑牢國產(chǎn)化智算底座,以技術(shù)需求雙輪驅(qū)動(dòng),打造“普惠速成”的元景MaaS平臺(tái),讓人工智能更簡單,為 AI 產(chǎn)業(yè)發(fā)展注入強(qiáng)勁的“加速度”。

    這一推理創(chuàng)新舉措必將助力各行業(yè)在復(fù)雜多變、競(jìng)爭激烈的市場(chǎng)環(huán)境中搶占先機(jī),以智能化驅(qū)動(dòng)數(shù)字化轉(zhuǎn)型,進(jìn)而推動(dòng)實(shí)體經(jīng)濟(jì)高質(zhì)量發(fā)展。

    推廣

    特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))均為站長傳媒平臺(tái)用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù),對(duì)本頁面內(nèi)容所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任,相關(guān)信息僅供參考。站長之家將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。任何單位或個(gè)人認(rèn)為本頁面內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),可及時(shí)向站長之家提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明(點(diǎn)擊查看反饋聯(lián)系地址)。本網(wǎng)站在收到上述法律文件后,將會(huì)依法依規(guī)核實(shí)信息,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

    • 相關(guān)推薦
    • LIFETOO品牌麥角硫因:開啟抗衰養(yǎng)顏新紀(jì)元

      LIFETOO是一個(gè)專注于抗衰老營養(yǎng)健康的品牌,由多位生物學(xué)博士創(chuàng)立,依托美日先進(jìn)營養(yǎng)科學(xué)技術(shù)研發(fā)產(chǎn)品。其明星產(chǎn)品麥角硫因膠囊具有強(qiáng)效抗氧化功效,能改善皮膚狀態(tài)、增強(qiáng)彈性。品牌擁有專業(yè)研發(fā)團(tuán)隊(duì)和自有生產(chǎn)線,產(chǎn)品通過嚴(yán)格質(zhì)量控制,在全球多個(gè)國家銷售并獲得消費(fèi)者認(rèn)可。LIFETOO堅(jiān)持"探索營養(yǎng)與健康的未來"理念,致力于為消費(fèi)者提供高品質(zhì)、個(gè)性化的營養(yǎng)呵護(hù)方案。

    • 行業(yè)先行者,艾娑姟雅(EXOGAIA)開啟抗衰護(hù)膚新紀(jì)元

      艾嬈嬋雅(EXOGAIA)在美博會(huì)上展示前沿細(xì)胞科研成果,推出"雙外泌體"護(hù)膚理念。品牌采用TFF外泌體提取技術(shù),從羊胎盤和蓮葉中提取高活性物質(zhì),通過膜融合機(jī)制促進(jìn)膠原再生。其產(chǎn)品線涵蓋抗衰修護(hù)全系列,包括微囊精華液、人參精華油等明星單品。依托廣東慈惠生物科技強(qiáng)大的科研團(tuán)隊(duì),品牌專注于肌衰老機(jī)理研究,已獲得國際INCI認(rèn)證。艾嬈嬋雅通過創(chuàng)新技術(shù)重新?

    • 英氏攜手中國營養(yǎng)學(xué)會(huì)開啟科學(xué)喂養(yǎng)新紀(jì)元

      4月18日,中國營養(yǎng)學(xué)會(huì)與英氏控股集團(tuán)在瀏陽經(jīng)開區(qū)共同舉辦"嬰幼兒輔食科學(xué)5階喂養(yǎng)標(biāo)準(zhǔn)體系化建設(shè)暨深度科研啟動(dòng)儀式"?;顒?dòng)聚焦嬰幼兒輔食行業(yè)標(biāo)準(zhǔn)化發(fā)展,推出"科學(xué)5階精準(zhǔn)喂養(yǎng)體系",針對(duì)不同發(fā)育階段嬰幼兒營養(yǎng)需求進(jìn)行精準(zhǔn)劃分。英氏與江南大學(xué)、湖南省農(nóng)科院簽署戰(zhàn)略協(xié)議,共建"嬰童未來食品實(shí)驗(yàn)室"和"嬰幼兒輔食與營養(yǎng)產(chǎn)業(yè)發(fā)展研究院",推動(dòng)產(chǎn)學(xué)研深度融合。英氏投資建設(shè)的嬰幼兒營養(yǎng)與健康科學(xué)產(chǎn)業(yè)基地一期已在瀏陽建成投產(chǎn),致力于全生命周期營養(yǎng)產(chǎn)品研發(fā)。專家指出,科學(xué)喂養(yǎng)直接影響嬰幼兒成長發(fā)育,行業(yè)標(biāo)準(zhǔn)實(shí)施將規(guī)范市場(chǎng)秩序,提升國民嬰幼兒營養(yǎng)健康水平。

    • Funcom宣布《沙丘:覺醒》大規(guī)模測(cè)試即將開啟

      《沙丘:覺醒》將于6月10日正式上線,5月10日將在倫敦與PAX East同步舉行全球在線派對(duì)直播,并發(fā)放數(shù)萬測(cè)試密鑰。5月9日至12日將開啟大規(guī)模測(cè)試,玩家可體驗(yàn)前20小時(shí)內(nèi)容及第一章劇情。游戲基于弗蘭克·赫伯特經(jīng)典科幻小說改編,融合電影化敘事與開放世界生存玩法,玩家將探索厄拉科斯沙漠星球,揭開神秘預(yù)言與古老陰謀交織的故事。購買豪華版或終極版可提前5天進(jìn)入游戲。開發(fā)商Funcom曾推出《流放者柯南》等知名作品。

    • 妙音數(shù)科領(lǐng)航 VR 創(chuàng)新 ,《一念幻世》開啟沉浸式科技新紀(jì)元

      北京妙音數(shù)科推出國內(nèi)首個(gè)"AI覺醒與人類文明存續(xù)"主題VR大空間沉浸項(xiàng)目《一念幻世》。該項(xiàng)目融合AI與VR技術(shù),采用厘米級(jí)精準(zhǔn)追蹤系統(tǒng),支持玩家在數(shù)百平米真實(shí)場(chǎng)地自由探索虛擬場(chǎng)景。創(chuàng)新性地結(jié)合AI智能實(shí)時(shí)語音對(duì)話與手勢(shì)識(shí)別技術(shù),實(shí)現(xiàn)"所見即所感"的沉浸體驗(yàn)。項(xiàng)目以AI覺醒危機(jī)為主線,通過交互式解謎引導(dǎo)玩家思考科技倫理問題。首發(fā)落地河北邯鄲?

    • 超聚變探索者大會(huì)2025:算力煥新,開啟智能新紀(jì)元

      4 月 15 日- 17 日,以“共建智能體時(shí)代”為主題的超聚變探索者大會(huì) 2025 在鄭州成功舉行。大會(huì)匯聚 2500 余名行業(yè)領(lǐng)袖、專家、媒體等伙伴及客戶,提出并深入探討智能體時(shí)代的發(fā)展趨勢(shì)、驅(qū)動(dòng)要素與價(jià)值應(yīng)用,重磅發(fā)布超聚變算力業(yè)務(wù)、城企數(shù)智業(yè)務(wù)、智慧能源解決方案三大業(yè)務(wù)領(lǐng)域的全新產(chǎn)品矩陣,共同聚焦技術(shù)創(chuàng)新的廣闊應(yīng)用,與全球生態(tài)伙伴積極擁抱戰(zhàn)略機(jī)遇,攜手共

    • 不要思考過程,推理模型能力能夠更強(qiáng)

      UC伯克利和艾倫實(shí)驗(yàn)室的最新研究表明,推理模型無需依賴冗長的思考過程也能有效工作。研究人員提出的"無思考(NoThinking)"方法通過簡單提示直接生成解決方案,跳過了傳統(tǒng)推理模型中的顯性思考步驟。實(shí)驗(yàn)證明,在低資源(低token數(shù)量、少模型參數(shù))或低延遲情況下,NoThinking方法的表現(xiàn)優(yōu)于傳統(tǒng)思考方式,能減少token使用量并提高推理速度。該方法在數(shù)學(xué)問題解決、編程和形式定理證明等任務(wù)中表現(xiàn)優(yōu)異,尤其在資源受限時(shí)優(yōu)勢(shì)更明顯。研究還發(fā)現(xiàn),結(jié)合并行計(jì)算擴(kuò)展后,NoThinking能進(jìn)一步提升性能,在保持準(zhǔn)確性的同時(shí)顯著降低延遲和計(jì)算成本。這一發(fā)現(xiàn)挑戰(zhàn)了"推理模型必須依賴詳細(xì)思考過程"的傳統(tǒng)認(rèn)知。

    • 國產(chǎn)六大推理模型激戰(zhàn)OpenAI?

      2025年春節(jié)前夕,DeepSeek-R1模型發(fā)布,標(biāo)志著中國AI進(jìn)入推理模型新時(shí)代。文章梳理了國產(chǎn)大模型發(fā)展歷程:從2022年ChatGPT引發(fā)國內(nèi)追趕OpenAI熱潮,到2023年"百模大戰(zhàn)",再到2024年"AI六小虎"格局形成。重點(diǎn)分析了六大國產(chǎn)推理模型(DeepSeek、百度、阿里、科大訊飛、字節(jié)、騰訊)的技術(shù)特點(diǎn)與市場(chǎng)表現(xiàn),指出國產(chǎn)模型在性能上已接近GPT-4水平。特別強(qiáng)調(diào)科大訊飛星火X1憑借全國產(chǎn)化技術(shù)路線獲得政企青睞,以及DeepSeek-R1以560萬美元超低成本實(shí)現(xiàn)高性能的突破。文章還探討了英偉達(dá)芯片斷供危機(jī)下,國產(chǎn)全棧技術(shù)路徑的重要性,認(rèn)為自主可控將成為對(duì)抗國際不確定性的關(guān)鍵。最后指出,隨著推理模型成為競(jìng)爭焦點(diǎn),國產(chǎn)大模型正從技術(shù)追隨轉(zhuǎn)向自主創(chuàng)新階段。

    • 新增自主決策推理模型!理想汽車OTA 7.2開啟推送

      快科技4月3日消息,我們從理想汽車官方獲悉,OTA7.2版本車機(jī)系統(tǒng)正式開啟推送,預(yù)計(jì)一周內(nèi)完成,升級(jí)耗時(shí)約50分鐘。本次更新新增自主決策推理模型,該模型基于車載場(chǎng)景數(shù)據(jù)及通用推理模型數(shù)據(jù)打造,可根據(jù)問題內(nèi)容自主決策是否深度思考,面對(duì)車控指令等簡單問題時(shí),能夠保障響應(yīng)速度。智能座艙方面,新增全能兒童鎖功能,支持一鍵鎖定副駕老板鍵、后排座椅物理按?

    • 猿輔導(dǎo)開啟“教育+AI”新紀(jì)元,小猿AI三大產(chǎn)品重塑學(xué)習(xí)全場(chǎng)景體驗(yàn)

      4月15日,猿輔導(dǎo)集團(tuán)發(fā)布教育行業(yè)首個(gè)AI范式"小猿AI",推出覆蓋家校場(chǎng)景的三大戰(zhàn)略級(jí)產(chǎn)品。該AI系統(tǒng)基于十年教育數(shù)據(jù)沉淀,構(gòu)建四層技術(shù)架構(gòu):動(dòng)態(tài)學(xué)情數(shù)據(jù)庫、自研大模型矩陣和個(gè)性化學(xué)習(xí)方案。核心產(chǎn)品包括:1)小猿AI App,首創(chuàng)"五重錯(cuò)因分析系統(tǒng)",學(xué)習(xí)效率提升40%;2)小猿AI學(xué)習(xí)機(jī),搭載13英寸護(hù)眼屏和智能基座;3)飛象人工智能通識(shí)課,國內(nèi)首套K12全學(xué)段AI課程。創(chuàng)新亮點(diǎn)包括知識(shí)導(dǎo)航系統(tǒng)精準(zhǔn)度達(dá)91%、情感計(jì)算引擎識(shí)別8類情緒狀態(tài)。集團(tuán)宣布實(shí)施普惠計(jì)劃,基礎(chǔ)功能向全國中小學(xué)生免費(fèi)開放。此次發(fā)布標(biāo)志著我國教育智能化進(jìn)入新階段,通過"技術(shù)+內(nèi)容+終端"立體化布局,重新定義因材施教內(nèi)涵。