无码在线播放二区|久久亚洲精品国产精品|无码视频在线观看一区二区|在线观看国产日韩亚洲中

  • <menu id="yw4o4"></menu>
  • 
    <menu id="yw4o4"><em id="yw4o4"></em></menu>
  • 首頁 > 業(yè)界 > 關(guān)鍵詞  > 正文

    Abacus AI 推出開放式上下文大語言模型Long Context

    2023-08-04 15:38 · 稿源:站長之家

    站長之家(ChinaZ.com)8月4日 消息:Abacus.AI LLM Context Expansion 是一款能夠擴(kuò)展語境長度的工具,可以幫助用戶擴(kuò)展模型的語境長度,提高模型對(duì)長文本的處理能力。該工具基于 Abacus.AI 的 LLM(Language Model for Long-form Content)架構(gòu),提供了一系列代碼和工具,用于增加模型對(duì)長文本的理解能力。通過預(yù)訓(xùn)練和微調(diào),該工具可以使模型在處理超過2048個(gè)單詞的文本時(shí)仍然能夠保持高效和準(zhǔn)確。

    image.png

    項(xiàng)目地址:https://github.com/abacusai/Long-Context

    要點(diǎn):

    1、Abacus AI 的研究人員通過多次實(shí)驗(yàn),發(fā)現(xiàn)將 LLMs 的上下文長度能力擴(kuò)展到更長的上下文是可行的。

    2、研究人員使用不同的方法對(duì) RedPajama 數(shù)據(jù)集進(jìn)行了 fine-tune,并發(fā)現(xiàn)線性縮放方法在模型上下文長度上效果良好,而截?cái)嗪碗S機(jī)化方法在檢索任務(wù)上效果較差。

    3、通過評(píng)估模型在不同數(shù)據(jù)集上的表現(xiàn),研究人員發(fā)現(xiàn)將上下文長度進(jìn)行縮放可以顯著提高模型的性能,進(jìn)而改進(jìn)模型的困惑度,并更好地捕捉文檔的主題。

    image.png

    4、Abacus.AI LLM Context Expansion 提供了評(píng)估腳本和基準(zhǔn)任務(wù),用于評(píng)估模型在信息檢索方面的能力,并提供了重要的實(shí)驗(yàn)結(jié)果和復(fù)現(xiàn)指南,以幫助用戶進(jìn)一步改進(jìn)和構(gòu)建自己的模型。

    5、Abacus.AI提供預(yù)訓(xùn)練模型權(quán)重,對(duì)于表現(xiàn)最好的模型(線性插值 + 指令微調(diào),在縮放因子為4和16時(shí)),該工具提供了預(yù)訓(xùn)練模型的權(quán)重,方便用戶直接使用或進(jìn)行自己的測(cè)試。

    舉報(bào)

    • 相關(guān)推薦
    • MCP協(xié)議是什么?Model Context Protocol模型上下文詳解

      在當(dāng)今快速發(fā)展的AI時(shí)代,如何高效地將AI助手與各類數(shù)據(jù)系統(tǒng)連接起來,成為了一個(gè)亟待解決的問題。MCP協(xié)議應(yīng)運(yùn)生,它是由Anthropic公司提出并開源的一種開放標(biāo)準(zhǔn)協(xié)議,通過提供一個(gè)統(tǒng)一的開放標(biāo)準(zhǔn),極大地簡化了AI系統(tǒng)與數(shù)據(jù)源之間的連接,使得AI系統(tǒng)能夠更可靠地訪問所需數(shù)據(jù),從產(chǎn)生更相關(guān)、更優(yōu)質(zhì)的響應(yīng)。通過與AIbase的緊密結(jié)合,MCP協(xié)議能夠更好地發(fā)揮其優(yōu)勢(shì),為AI技術(shù)的發(fā)展提供更強(qiáng)大的動(dòng)力。

    • 時(shí)空壺接入大語言模型,跨語言溝通已成翻譯的藝術(shù)

      在當(dāng)今全球化浪潮中,跨語言溝通的需求如潮水般洶涌。從商務(wù)領(lǐng)域的跨國談判,到文化交流中的思想碰撞,高效、精準(zhǔn)的語言翻譯成為關(guān)鍵橋梁。隨著技術(shù)的不斷發(fā)展與迭代,時(shí)空壺有望持續(xù)引領(lǐng)行業(yè)變革,推動(dòng)全球交流合作邁向新的高度,真正實(shí)現(xiàn)跨越語言障礙,讓世界溝通無阻。

    • 為什么要使用MCP?MCP模型上下文協(xié)議能解決什么問題?

      在當(dāng)今數(shù)字化時(shí)代,AI應(yīng)用的開發(fā)和部署正面臨著一個(gè)關(guān)鍵挑戰(zhàn):如何將AI技術(shù)與現(xiàn)有的服務(wù)和系統(tǒng)高效集成。為了解決這一難題,MCP應(yīng)運(yùn)生。AIbase的MCP資源網(wǎng)站還提供了詳細(xì)的開發(fā)文檔和教程,幫助開發(fā)者快速上手并深入學(xué)習(xí)MCP技術(shù)。

    • 剛剛,OpenAI發(fā)布GPT-4.1,性能暴漲、100萬上下文

      今天凌晨1點(diǎn),OpenAI進(jìn)行了技術(shù)直播發(fā)布了最新模型——GPT-4.1。除了GPT-4.1之外,還有GPT4.1-Mini和GPT4.1-Nano兩款模型,在多模態(tài)處理、代碼能力、指令遵循、成本方面實(shí)現(xiàn)大幅度提升。特別是支持100萬token上下文,這對(duì)于金融分析、小說寫作、教育等領(lǐng)域幫助巨大。由于GPT-4.1的發(fā)布,OpenAI宣布將會(huì)淘汰剛發(fā)布不久的GPT-4.5,其能力可見一斑。目前,如果想體驗(yàn)GPT-4.1而無法通過API身?

    • 1000萬上下文!新開源多模態(tài)大模型,單個(gè)GPU就能運(yùn)行

      今年2月初,谷歌發(fā)布的Gemini2.0Pro支持200萬上下文,震驚了整個(gè)大模型領(lǐng)域。僅過了2個(gè)月,Meta最新開源的Llama4Scout就將上下文擴(kuò)展至1000萬,整整提升了5倍開啟千萬級(jí)時(shí)代。根據(jù)實(shí)驗(yàn)數(shù)據(jù)顯示,Llama4Behemoth在MMLUPro、GPQA、MATH-500等測(cè)試的數(shù)據(jù)比GPT-4.5、ClaudeSonnet3.7、Gemini2.0Pro更好。

    • 亞馬遜推出AI語音模型Nova Sonic:價(jià)格比GPT-4o便宜80%

      亞馬遜正式推出新一代生成式AI語音模型NovaSonic,標(biāo)志著其在人工智能語音領(lǐng)域取得重大突破。這款創(chuàng)新模型能夠原生處理語音輸入并生成自然流暢的語音輸出,在速度、語音識(shí)別準(zhǔn)確率和對(duì)話質(zhì)量等核心性能指標(biāo)上,已達(dá)到與OpenAI、谷歌等科技巨頭的尖端語音模型相媲美的水平。該模型的推出是亞馬遜構(gòu)建人工通用智能戰(zhàn)略的重要一步,未來還將推出支持多模態(tài)理解的AI模型,涵蓋圖像、視頻及其他物理世界感知數(shù)據(jù)。

    • AI日?qǐng)?bào):百度大招!發(fā)布文心大模型X1Turbo和AI開放計(jì)劃;OpenAI免費(fèi)開放輕量版Deep Research;即夢(mèng)視頻3.0內(nèi)測(cè)

      【AI日?qǐng)?bào)】主要報(bào)道了AI領(lǐng)域的最新動(dòng)態(tài):1)百度發(fā)布文心大模型X1Turbo和4.5Turbo,性能價(jià)格優(yōu)勢(shì)顯著;2)百度推出AI開放計(jì)劃,降低開發(fā)者門檻;3)OpenAI免費(fèi)開放輕量版Deep Research研究工具;4)即夢(mèng)視頻3.0內(nèi)測(cè)展示流暢運(yùn)鏡和精準(zhǔn)表情捕捉能力;5)百度發(fā)布全球首個(gè)內(nèi)容操作系統(tǒng)"滄舟OS";6)百度文庫與網(wǎng)盤聯(lián)合推出GenFlow超能搭子和AI筆記工具;7)Pixverse推出MCP協(xié)議簡化AI視頻創(chuàng)作;8)Tavus發(fā)布突破性唇形同步模型Hummingbird-0;9)豆包1.5深度思考模型上線,提供免費(fèi)額度;10)Adobe整合OpenAI和Google模型升級(jí)Firefly創(chuàng)意平臺(tái);11)ImageSlider2.0即將加入Gradio核心產(chǎn)品線;12)李彥宏談DeepSeek現(xiàn)存痛點(diǎn),強(qiáng)調(diào)多模態(tài)能力與降本需求。

    • IQ 過百的 AI 模型名單發(fā)布:ChatGPT、Deepseek等上榜

      人工智能IQ哪家強(qiáng)?o3 智商高達(dá) 132、Gemini 2.5 Pro Exp. 拿下 128 分、Claude 憑借 3.7 Sonnet Extended 位列第四、Deepsee R 1……

    • 重磅!Shokz韶音&Garmin佳明強(qiáng)強(qiáng)聯(lián)手,助力開放式運(yùn)動(dòng)市場(chǎng)向上發(fā)展

      Shokz韶音與Garmin佳明達(dá)成亞太區(qū)戰(zhàn)略合作,雙方將圍繞"Rock the Track/樂動(dòng)樂來勁"主題展開深度合作。作為全球領(lǐng)先的開放式耳機(jī)品牌,韶音將提供專屬福利給Garmin會(huì)員及跑團(tuán)成員,包括免費(fèi)試用運(yùn)動(dòng)耳機(jī)等。合作將整合雙方在運(yùn)動(dòng)科技領(lǐng)域的優(yōu)勢(shì),佳明手表提供專業(yè)運(yùn)動(dòng)數(shù)據(jù)監(jiān)測(cè),韶音耳機(jī)則通過開放雙耳設(shè)計(jì)保障運(yùn)動(dòng)安全,共同打造更優(yōu)質(zhì)的運(yùn)動(dòng)體驗(yàn)。此次合作順應(yīng)戶外運(yùn)動(dòng)市場(chǎng)繁榮趨勢(shì),未來雙方將持續(xù)創(chuàng)新,為全球跑者提供更專業(yè)、安全、愉悅的運(yùn)動(dòng)裝備。

    • AI日?qǐng)?bào):智譜開源32B/9B系列GLM模型并啟用Z.ai域名;OpenAI發(fā)布GPT-4.1系列模型;阿里魔搭上線MCP廣場(chǎng)

      歡迎來到【AI日?qǐng)?bào)】欄目!這里是你每天探索人工智能世界的指南,每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容,聚焦開發(fā)者,助你洞悉技術(shù)趨勢(shì)、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點(diǎn)擊了解:https://top.aibase.com/1、智譜AI啟用全新域名Z.ai 并開源32B/9B 系列 GLM 模型智譜技術(shù)團(tuán)隊(duì)近期宣布開源32B和9B系列的GLM模型,并推出全新交互體驗(yàn)平臺(tái)Z.ai。這些模型遵循MIT許可協(xié)議,支持商業(yè)用途,提升了