无码在线播放二区|久久亚洲精品国产精品|无码视频在线观看一区二区|在线观看国产日韩亚洲中

<menu id="yw4o4"></menu>

<menu id="yw4o4"><em id="yw4o4"></em></menu>

<samp id="sbgrg"><pre id="sbgrg"><p id="sbgrg"></p></pre></samp>
<track id="sbgrg"><dd id="sbgrg"></dd></track>

螞蟻集團(tuán)發(fā)布DevOps領(lǐng)域大模型評(píng)測(cè)基準(zhǔn)DevOps-Eval

2023-11-02 15:09 · 稿源：站長(zhǎng)之家

站長(zhǎng)之家(ChinaZ.com) 11月2日消息:螞蟻集團(tuán)聯(lián)合北京大學(xué)發(fā)布了面向 DevOps 領(lǐng)域的大語言模型評(píng)測(cè)基準(zhǔn) ——DevOps-Eval。

該評(píng)測(cè)基準(zhǔn)包含了計(jì)劃、編碼、構(gòu)建、測(cè)試、發(fā)布、部署、運(yùn)維和監(jiān)控等8個(gè)類別的選擇題，共計(jì)4850道題目。

此外，還針對(duì) AIOps 任務(wù)做了細(xì)分，并添加了日志解析、時(shí)序異常檢測(cè)、時(shí)序分類和根因分析等任務(wù)。

微信截圖_20231102151204.png

目前，DevOps-Eval已發(fā)布了第一期的評(píng)測(cè)榜單，評(píng)測(cè)了 OpsGpt、Qwen、Baichuan 和 Internlm 等開源大語言模型。DevOps-Eval 的評(píng)測(cè)方式包括 Zero-shot 和 Few-shot，評(píng)測(cè)結(jié)果顯示各模型得分相差不大。

未來，DevOps-Eval 將持續(xù)優(yōu)化，豐富評(píng)測(cè)數(shù)據(jù)集，重點(diǎn)關(guān)注 AIOps 領(lǐng)域，并增加更多的評(píng)測(cè)模型。

GitHub 地址:

https://github.com/codefuse-ai/codefuse-devops-eval

HuggingFace 地址:

https://huggingface.co/datasets/codefuse-admin/devopseval-exam

（舉報(bào)）

相關(guān)推薦

關(guān)鍵詞：

DeepSeek上新！開源發(fā)布DeepSeek-Prover-V2-671B新模型

快科技4月30日消息，今日，DeepSeek 今日在 AI 開源社區(qū) Hugging Face 發(fā)布了一個(gè)名為 DeepSeek-Prover-V2-671B 的新模型。據(jù)介紹，DeepSeek-Prover-V2-671B 其參數(shù)量達(dá)到6710億，使用了更高效的 safetensors 文件格式，并支持 BF16、FP8、F32 等多種計(jì)算精度，方便模型更快、更省資源地訓(xùn)練和部署。在模型架構(gòu)上，該模型使用了DeepSeek-V3架構(gòu)，采用MoE（混合專家）模式，具有61層Transformer層，7168維隱藏層。同時(shí)支持超長(zhǎng)上下文，最大位置嵌入達(dá)163840，使其能處理復(fù)雜的數(shù)學(xué)證明，并且采用了FP8量化，可通過量化技術(shù)減小模型大小，提

?DeepSeek ?AI模型發(fā)布 ?開源社區(qū)
DeepSeek+物流行業(yè)，AI大模型破解五大場(chǎng)景效能困局

文章探討了AI大模型在物流行業(yè)的應(yīng)用現(xiàn)狀與挑戰(zhàn)。以DeepSeek為代表的AI技術(shù)正通過重構(gòu)業(yè)務(wù)流程、優(yōu)化資源配置、提升決策效率等方式，成為推動(dòng)行業(yè)降本增效的核心引擎。但成功應(yīng)用AI大模型需要企業(yè)具備數(shù)字化基礎(chǔ)、業(yè)務(wù)流程標(biāo)準(zhǔn)化和數(shù)據(jù)治理能力，而非簡(jiǎn)單技術(shù)堆砌。G7+易流梳理出五大核心應(yīng)用場(chǎng)景：工作效能輔助、經(jīng)營(yíng)數(shù)據(jù)分析、安全審查、智能客服和知識(shí)管理。這些

?人工智能 ?大模型 ?物流行業(yè)
螞蟻集團(tuán)專項(xiàng)招募全球頂尖AI人才推“Plan A”AI人才專項(xiàng)計(jì)劃

螞蟻集團(tuán)近日啟動(dòng)"Plan A"AI人才專項(xiàng)計(jì)劃，面向全球頂尖高校招募人工智能領(lǐng)域的研究人才。該計(jì)劃作為"螞蟻星"校園人才項(xiàng)目的重要組成部分，旨在吸引優(yōu)秀研究人員參與通用人工智能(AGI)的技術(shù)探索。螞蟻集團(tuán)CTO何征宇表示，公司將全力投入AGI技術(shù)研發(fā)，推動(dòng)人工智能技術(shù)的普惠應(yīng)用。該計(jì)劃主要面向計(jì)算機(jī)、人工智能、網(wǎng)絡(luò)安全、數(shù)學(xué)等理工科專業(yè)的碩士及博士畢業(yè)生，要求申請(qǐng)者畢業(yè)時(shí)間不早于2025年11月。入選人才將獲得具有競(jìng)爭(zhēng)力的薪資待遇和科研條件。
DeepSeek領(lǐng)航大模型普惠化浪潮，xAI/微美全息加速開源AI布局打造新格局

DeepSeek 作為當(dāng)前最受關(guān)注的大模型之一，憑借其技術(shù)創(chuàng)新正在加速 AI 普惠化進(jìn)程。根據(jù)機(jī)構(gòu)新報(bào)告顯示，DeepSeek已經(jīng)成為全球增長(zhǎng)最快的AI工具，其每月新增網(wǎng)站訪問量已經(jīng)超過OpenAI的ChatGPT。DeepSeek市場(chǎng)份額全球第三目前，DeepSeek市場(chǎng)份額6.58%，僅次于ChatGPT和Canva。DeepSeek是繼ChatGPT之后的又一現(xiàn)象級(jí)AI產(chǎn)品，它的市場(chǎng)份額從2.34%快速增長(zhǎng)至6.58%，展現(xiàn)出強(qiáng)勁的增長(zhǎng)態(tài)勢(shì)。全球著名?

?DeepSeek ?AI工具 ?技術(shù)創(chuàng)新
Llama 4大模型跌落神壇：作弊刷榜、代碼能力極差、和DeepSeek比就是偽開源

被寄予厚望的美國(guó)Meta公司的最新開源大模型Llama4發(fā)布不到2天時(shí)間，口碑急轉(zhuǎn)直下，被質(zhì)疑為刷榜作弊實(shí)際效果差、開源條件多部署門檻高是偽開源等。大模型評(píng)測(cè)平臺(tái)LMArena親自下場(chǎng)發(fā)文，打臉Meta提供給平臺(tái)的Llama4是“特供版”。Meta若繼續(xù)在商業(yè)控制與技術(shù)開放之間搖擺，恐將在AI競(jìng)賽中進(jìn)一步失去開發(fā)者支持。

?Meta ?Llama ?4
IQ 過百的 AI 模型名單發(fā)布：ChatGPT、Deepseek等上榜

人工智能IQ哪家強(qiáng)？o3 智商高達(dá) 132、Gemini 2.5 Pro Exp. 拿下 128 分、Claude 憑借 3.7 Sonnet Extended 位列第四、Deepsee R 1……

?AI智商 ?ChatGPT ?Deepseek
薦媲美OpenAI-o3，剛剛開源模型DeepCoder，訓(xùn)練方法、數(shù)據(jù)集大公開

今天凌晨4點(diǎn)，著名大模型訓(xùn)練平臺(tái)TogetherAI和智能體平臺(tái)Agentica，聯(lián)合開源了新模型DeepCoder-14B-Preview。該模型只有140億參數(shù)，但在知名代碼測(cè)試平臺(tái)LiveCodeBench的測(cè)試分為60.6%，高于OpenAI的o1模型，略低于o3-mini。TogetherAI剛獲得3.05億美元的B輪融資，其估值也從去年的12.5億美元翻倍至33億美元。

?大模型 ?深度學(xué)習(xí) ?開源模型
深度deepin 23.1正式發(fā)布！AI默認(rèn)引擎切換至DeepSeek、修復(fù)超百項(xiàng)問題

快科技4月16日消息，今天，深度操作系統(tǒng)宣布，deepin 23.1版本已正式發(fā)布。此版本聚焦于解決基礎(chǔ)組件更新后的安裝效率問題，大幅提升新用戶安裝體驗(yàn)，同時(shí)集成多項(xiàng)功能優(yōu)化與問題修復(fù)，進(jìn)一步優(yōu)化系統(tǒng)使用。本次版本的重點(diǎn)改進(jìn)包括內(nèi)核優(yōu)化、AI 默認(rèn)引擎切換至DeepSeek、修復(fù)超百項(xiàng)用戶反饋問題等，具體重點(diǎn)改進(jìn)如下：硬件兼容性與內(nèi)核優(yōu)化：集成6.6/6.12內(nèi)核更新、NVIDIA顯卡驅(qū)動(dòng)升級(jí)、Intel/AMD CPU微碼更新，全面提升硬件支持與底層性能；核心功能增強(qiáng)：DDE新增智能鏡像源管理、緊湊模式入口，全局搜索支持離線自然語言與AI處理能力；?

?深度操作系統(tǒng) ?deepin ?23.1
奧特曼：ChatGPT不是AGI！OpenAI最強(qiáng)開源模型直擊DeepSeek

【新智元導(dǎo)讀】代碼截圖泄露，滿血版o3、o4-mini鎖定下周!更勁爆的是，一款據(jù)稱是OpenAI的神秘模型一夜爆紅，每日處理高達(dá)260億token，是Claude用量4倍。奧特曼在TED放話:將推超強(qiáng)開源模型，直面DeepSeek挑戰(zhàn)。持續(xù)的創(chuàng)新、豐富的資源和智能AI將會(huì)無縫融入日常生活，未來一代人將會(huì)覺得當(dāng)前人們又辛苦又落后。

?代碼泄露 ?OpenAI ?模型發(fā)布
薦AI日?qǐng)?bào)：百度大招！發(fā)布文心大模型X1Turbo和AI開放計(jì)劃；OpenAI免費(fèi)開放輕量版Deep Research；即夢(mèng)視頻3.0內(nèi)測(cè)

【AI日?qǐng)?bào)】主要報(bào)道了AI領(lǐng)域的最新動(dòng)態(tài)：1)百度發(fā)布文心大模型X1Turbo和4.5Turbo，性能價(jià)格優(yōu)勢(shì)顯著；2)百度推出AI開放計(jì)劃，降低開發(fā)者門檻；3)OpenAI免費(fèi)開放輕量版Deep Research研究工具；4)即夢(mèng)視頻3.0內(nèi)測(cè)展示流暢運(yùn)鏡和精準(zhǔn)表情捕捉能力；5)百度發(fā)布全球首個(gè)內(nèi)容操作系統(tǒng)"滄舟OS"；6)百度文庫與網(wǎng)盤聯(lián)合推出GenFlow超能搭子和AI筆記工具；7)Pixverse推出MCP協(xié)議簡(jiǎn)化AI視頻創(chuàng)作；8)Tavus發(fā)布突破性唇形同步模型Hummingbird-0；9)豆包1.5深度思考模型上線，提供免費(fèi)額度；10)Adobe整合OpenAI和Google模型升級(jí)Firefly創(chuàng)意平臺(tái)；11)ImageSlider2.0即將加入Gradio核心產(chǎn)品線；12)李彥宏談DeepSeek現(xiàn)存痛點(diǎn)，強(qiáng)調(diào)多模態(tài)能力與降本需求。

?AI日?qǐng)?bào) ?人工智能 ?文心大模型

熱文

3 天
7天

站長(zhǎng)商機(jī)

廣告

商務(wù)合作侵權(quán)投訴廣告服務(wù) 版權(quán)聲明招聘

?CopyRight 2002-2020 CHINAZ.COM