无码在线播放二区|久久亚洲精品国产精品|无码视频在线观看一区二区|在线观看国产日韩亚洲中

  • <menu id="yw4o4"></menu>
  • 
    <menu id="yw4o4"><em id="yw4o4"></em></menu>
  • 首頁 > 熱點(diǎn) > 關(guān)鍵詞  > 正文

    螞蟻集團(tuán)發(fā)布DevOps領(lǐng)域大模型評(píng)測(cè)基準(zhǔn)DevOps-Eval

    2023-11-02 15:09 · 稿源:站長(zhǎng)之家

    站長(zhǎng)之家(ChinaZ.com) 11月2日 消息:螞蟻集團(tuán)聯(lián)合北京大學(xué)發(fā)布了面向 DevOps 領(lǐng)域的大語言模型評(píng)測(cè)基準(zhǔn) ——DevOps-Eval。

    該評(píng)測(cè)基準(zhǔn)包含了計(jì)劃、編碼、構(gòu)建、測(cè)試、發(fā)布、部署、運(yùn)維和監(jiān)控等8個(gè)類別的選擇題,共計(jì)4850道題目。

    此外,還針對(duì) AIOps 任務(wù)做了細(xì)分,并添加了日志解析、時(shí)序異常檢測(cè)、時(shí)序分類和根因分析等任務(wù)。

    微信截圖_20231102151204.png

    目前,DevOps-Eval已發(fā)布了第一期的評(píng)測(cè)榜單,評(píng)測(cè)了 OpsGpt、Qwen、Baichuan 和 Internlm 等開源大語言模型。DevOps-Eval 的評(píng)測(cè)方式包括 Zero-shot 和 Few-shot,評(píng)測(cè)結(jié)果顯示各模型得分相差不大。

    未來,DevOps-Eval 將持續(xù)優(yōu)化,豐富評(píng)測(cè)數(shù)據(jù)集,重點(diǎn)關(guān)注 AIOps 領(lǐng)域,并增加更多的評(píng)測(cè)模型。

    GitHub 地址:

    https://github.com/codefuse-ai/codefuse-devops-eval

    HuggingFace 地址:

    https://huggingface.co/datasets/codefuse-admin/devopseval-exam

    舉報(bào)

    • 相關(guān)推薦
    • DeepSeek上新!開源發(fā)布DeepSeek-Prover-V2-671B新模型

      快科技4月30日消息,今日,DeepSeek 今日在 AI 開源社區(qū) Hugging Face 發(fā)布了一個(gè)名為 DeepSeek-Prover-V2-671B 的新模型。據(jù)介紹,DeepSeek-Prover-V2-671B 其參數(shù)量達(dá)到6710億,使用了更高效的 safetensors 文件格式,并支持 BF16、FP8、F32 等多種計(jì)算精度,方便模型更快、更省資源地訓(xùn)練和部署。在模型架構(gòu)上,該模型使用了DeepSeek-V3架構(gòu),采用MoE(混合專家)模式,具有61層Transformer層,7168維隱藏層。同時(shí)支持超長(zhǎng)上下文,最大位置嵌入達(dá)163840,使其能處理復(fù)雜的數(shù)學(xué)證明,并且采用了FP8量化,可通過量化技術(shù)減小模型大小,提

    • DeepSeek+物流行業(yè),AI大模型破解五大場(chǎng)景效能困局

      文章探討了AI大模型在物流行業(yè)的應(yīng)用現(xiàn)狀與挑戰(zhàn)。以DeepSeek為代表的AI技術(shù)正通過重構(gòu)業(yè)務(wù)流程、優(yōu)化資源配置、提升決策效率等方式,成為推動(dòng)行業(yè)降本增效的核心引擎。但成功應(yīng)用AI大模型需要企業(yè)具備數(shù)字化基礎(chǔ)、業(yè)務(wù)流程標(biāo)準(zhǔn)化和數(shù)據(jù)治理能力,而非簡(jiǎn)單技術(shù)堆砌。G7+易流梳理出五大核心應(yīng)用場(chǎng)景:工作效能輔助、經(jīng)營(yíng)數(shù)據(jù)分析、安全審查、智能客服和知識(shí)管理。這些

    • 螞蟻集團(tuán)專項(xiàng)招募全球頂尖AI人才 推“Plan A”AI人才專項(xiàng)計(jì)劃

      螞蟻集團(tuán)近日啟動(dòng)"Plan A"AI人才專項(xiàng)計(jì)劃,面向全球頂尖高校招募人工智能領(lǐng)域的研究人才。該計(jì)劃作為"螞蟻星"校園人才項(xiàng)目的重要組成部分,旨在吸引優(yōu)秀研究人員參與通用人工智能(AGI)的技術(shù)探索。螞蟻集團(tuán)CTO何征宇表示,公司將全力投入AGI技術(shù)研發(fā),推動(dòng)人工智能技術(shù)的普惠應(yīng)用。該計(jì)劃主要面向計(jì)算機(jī)、人工智能、網(wǎng)絡(luò)安全、數(shù)學(xué)等理工科專業(yè)的碩士及博士畢業(yè)生,要求申請(qǐng)者畢業(yè)時(shí)間不早于2025年11月。入選人才將獲得具有競(jìng)爭(zhēng)力的薪資待遇和科研條件。

    • DeepSeek領(lǐng)航大模型普惠化浪潮,xAI/微美全息加速開源AI布局打造新格局

      DeepSeek 作為當(dāng)前最受關(guān)注的大模型之一,憑借其技術(shù)創(chuàng)新正在加速 AI 普惠化進(jìn)程。根據(jù)機(jī)構(gòu)新報(bào)告顯示,DeepSeek已經(jīng)成為全球增長(zhǎng)最快的AI工具,其每月新增網(wǎng)站訪問量已經(jīng)超過OpenAI的ChatGPT。DeepSeek市場(chǎng)份額全球第三目前,DeepSeek市場(chǎng)份額6.58%,僅次于ChatGPT和Canva。DeepSeek是繼ChatGPT之后的又一現(xiàn)象級(jí)AI產(chǎn)品,它的市場(chǎng)份額從2.34%快速增長(zhǎng)至6.58%,展現(xiàn)出強(qiáng)勁的增長(zhǎng)態(tài)勢(shì)。全球著名?

    • Llama 4大模型跌落神壇:作弊刷榜、代碼能力極差、和DeepSeek比就是偽開源

      被寄予厚望的美國(guó)Meta公司的最新開源大模型Llama4發(fā)布不到2天時(shí)間,口碑急轉(zhuǎn)直下,被質(zhì)疑為刷榜作弊實(shí)際效果差、開源條件多部署門檻高是偽開源等。大模型評(píng)測(cè)平臺(tái)LMArena親自下場(chǎng)發(fā)文,打臉Meta提供給平臺(tái)的Llama4是“特供版”。Meta若繼續(xù)在商業(yè)控制與技術(shù)開放之間搖擺,恐將在AI競(jìng)賽中進(jìn)一步失去開發(fā)者支持。

    • IQ 過百的 AI 模型名單發(fā)布:ChatGPT、Deepseek等上榜

      人工智能IQ哪家強(qiáng)?o3 智商高達(dá) 132、Gemini 2.5 Pro Exp. 拿下 128 分、Claude 憑借 3.7 Sonnet Extended 位列第四、Deepsee R 1……

    • 媲美OpenAI-o3,剛剛開源模型DeepCoder,訓(xùn)練方法、數(shù)據(jù)集大公開

      今天凌晨4點(diǎn),著名大模型訓(xùn)練平臺(tái)TogetherAI和智能體平臺(tái)Agentica,聯(lián)合開源了新模型DeepCoder-14B-Preview。該模型只有140億參數(shù),但在知名代碼測(cè)試平臺(tái)LiveCodeBench的測(cè)試分為60.6%,高于OpenAI的o1模型,略低于o3-mini。TogetherAI剛獲得3.05億美元的B輪融資,其估值也從去年的12.5億美元翻倍至33億美元。

    • 深度deepin 23.1正式發(fā)布!AI默認(rèn)引擎切換至DeepSeek、修復(fù)超百項(xiàng)問題

      快科技4月16日消息,今天,深度操作系統(tǒng)宣布,deepin 23.1版本已正式發(fā)布。此版本聚焦于解決基礎(chǔ)組件更新后的安裝效率問題,大幅提升新用戶安裝體驗(yàn),同時(shí)集成多項(xiàng)功能優(yōu)化與問題修復(fù),進(jìn)一步優(yōu)化系統(tǒng)使用。本次版本的重點(diǎn)改進(jìn)包括內(nèi)核優(yōu)化、AI 默認(rèn)引擎切換至DeepSeek、修復(fù)超百項(xiàng)用戶反饋問題等,具體重點(diǎn)改進(jìn)如下:硬件兼容性與內(nèi)核優(yōu)化:集成6.6/6.12內(nèi)核更新、NVIDIA顯卡驅(qū)動(dòng)升級(jí)、Intel/AMD CPU微碼更新,全面提升硬件支持與底層性能;核心功能增強(qiáng):DDE新增智能鏡像源管理、緊湊模式入口,全局搜索支持離線自然語言與AI處理能力;?

    • 奧特曼:ChatGPT不是AGI!OpenAI最強(qiáng)開源模型直擊DeepSeek

      【新智元導(dǎo)讀】代碼截圖泄露,滿血版o3、o4-mini鎖定下周!更勁爆的是,一款據(jù)稱是OpenAI的神秘模型一夜爆紅,每日處理高達(dá)260億token,是Claude用量4倍。奧特曼在TED放話:將推超強(qiáng)開源模型,直面DeepSeek挑戰(zhàn)。持續(xù)的創(chuàng)新、豐富的資源和智能AI將會(huì)無縫融入日常生活,未來一代人將會(huì)覺得當(dāng)前人們又辛苦又落后。

    • AI日?qǐng)?bào):百度大招!發(fā)布文心大模型X1Turbo和AI開放計(jì)劃;OpenAI免費(fèi)開放輕量版Deep Research;即夢(mèng)視頻3.0內(nèi)測(cè)

      【AI日?qǐng)?bào)】主要報(bào)道了AI領(lǐng)域的最新動(dòng)態(tài):1)百度發(fā)布文心大模型X1Turbo和4.5Turbo,性能價(jià)格優(yōu)勢(shì)顯著;2)百度推出AI開放計(jì)劃,降低開發(fā)者門檻;3)OpenAI免費(fèi)開放輕量版Deep Research研究工具;4)即夢(mèng)視頻3.0內(nèi)測(cè)展示流暢運(yùn)鏡和精準(zhǔn)表情捕捉能力;5)百度發(fā)布全球首個(gè)內(nèi)容操作系統(tǒng)"滄舟OS";6)百度文庫與網(wǎng)盤聯(lián)合推出GenFlow超能搭子和AI筆記工具;7)Pixverse推出MCP協(xié)議簡(jiǎn)化AI視頻創(chuàng)作;8)Tavus發(fā)布突破性唇形同步模型Hummingbird-0;9)豆包1.5深度思考模型上線,提供免費(fèi)額度;10)Adobe整合OpenAI和Google模型升級(jí)Firefly創(chuàng)意平臺(tái);11)ImageSlider2.0即將加入Gradio核心產(chǎn)品線;12)李彥宏談DeepSeek現(xiàn)存痛點(diǎn),強(qiáng)調(diào)多模態(tài)能力與降本需求。

    熱文

    • 3 天
    • 7天