无码在线播放二区|久久亚洲精品国产精品|无码视频在线观看一区二区|在线观看国产日韩亚洲中

  • <menu id="yw4o4"></menu>
  • 
    <menu id="yw4o4"><em id="yw4o4"></em></menu>
  • 首頁(yè) > 業(yè)界 > 關(guān)鍵詞  > 正文

    AI初創(chuàng)公司Galileo推新工具,可解釋AI大模型的幻覺(jué)現(xiàn)象

    2023-09-20 11:23 · 稿源:站長(zhǎng)之家

    文章概要:

    1. 美國(guó)AI初創(chuàng)公司Galileo發(fā)布新工具,幫助用戶更好地理解和解釋大型語(yǔ)言模型(LLMs)的輸出,特別是幻覺(jué)現(xiàn)象。

    2. Galileo Studio現(xiàn)在具備實(shí)時(shí)監(jiān)測(cè)功能,允許用戶評(píng)估輸入和輸出,提供新指標(biāo)和防護(hù)措施以優(yōu)化LLMs的性能。

    3. Galileo還引入了"接地性"指標(biāo),用于確定模型輸出是否與訓(xùn)練數(shù)據(jù)相關(guān),以區(qū)分幻覺(jué)和模型輸出的真實(shí)性。

    站長(zhǎng)之家(ChinaZ.com) 9月20日 消息:在人工智能領(lǐng)域,特定生成型人工智能模型(LLMs)產(chǎn)生幻覺(jué)現(xiàn)象的問(wèn)題一直令人困惑。然而,舊金山的AI初創(chuàng)公司Galileo正在努力解決這一問(wèn)題,并為用戶提供了一系列新的監(jiān)測(cè)和指標(biāo)功能,以幫助他們更好地理解和解釋LLMs的輸出。

    Galileo Studio是該公司旗下的工具,最新更新使用戶不僅可以評(píng)估輸入和上下文,還可以實(shí)時(shí)觀察輸出。這些新的監(jiān)測(cè)功能使Galileo能夠更好地解釋為什么模型會(huì)產(chǎn)生特定的輸出,并提供新的指標(biāo)和防護(hù)措施來(lái)優(yōu)化LLMs的性能。

    機(jī)器人

    圖源備注:圖片由AI生成,圖片授權(quán)服務(wù)商Midjourney

    Galileo的聯(lián)合創(chuàng)始人兼CEO Vikram Chatterji在接受VentureBeat的獨(dú)家采訪中表示:“最近幾個(gè)月的真正新功能是我們添加了實(shí)時(shí)監(jiān)測(cè),因?yàn)楝F(xiàn)在您實(shí)際上可以觀察到出了什么問(wèn)題。這已經(jīng)成為一個(gè)端到端的產(chǎn)品,用于不斷改進(jìn)大型語(yǔ)言模型應(yīng)用?!?/p>

    LLMs通常依賴于應(yīng)用程序向LLM發(fā)出API調(diào)用以獲取響應(yīng)。Galileo攔截了這些API調(diào)用,包括輸入和生成的輸出。通過(guò)攔截這些數(shù)據(jù),Galileo能夠向用戶提供關(guān)于模型性能以及輸出準(zhǔn)確性的準(zhǔn)實(shí)時(shí)信息。

    當(dāng)我們討論生成的AI輸出的事實(shí)準(zhǔn)確性時(shí),通常會(huì)涉及到幻覺(jué)現(xiàn)象,即生成了與事實(shí)不符的輸出。Chatterji解釋說(shuō),LLM實(shí)際上是在嘗試預(yù)測(cè)下一個(gè)單詞應(yīng)該是什么,但它還有關(guān)于下一個(gè)備選單詞的想法,并為所有這些不同的標(biāo)記或不同的單詞分配概率。

    Galileo通過(guò)與模型本身連接,使其能夠準(zhǔn)確了解這些概率,然后提供額外的指標(biāo)來(lái)更好地解釋模型輸出并理解為什么會(huì)出現(xiàn)特定的幻覺(jué)現(xiàn)象。通過(guò)提供這些見(jiàn)解,Galileo的目標(biāo)是幫助開(kāi)發(fā)人員更好地調(diào)整模型和微調(diào)以獲得最佳結(jié)果。

    除了幻覺(jué)問(wèn)題,LLM基礎(chǔ)應(yīng)用程序提供的響應(yīng)可能會(huì)引發(fā)一些問(wèn)題,如不準(zhǔn)確、不當(dāng)?shù)恼Z(yǔ)言或機(jī)密信息泄露。為了解決這些問(wèn)題,Galileo Studio還引入了新的"防護(hù)措施"指標(biāo)。對(duì)于AI模型,防護(hù)措施是關(guān)于模型可以生成的信息、語(yǔ)氣和語(yǔ)言的限制。

    對(duì)于金融服務(wù)和醫(yī)療保健等領(lǐng)域的組織來(lái)說(shuō),存在與信息披露和語(yǔ)言使用相關(guān)的監(jiān)管合規(guī)性問(wèn)題。通過(guò)防護(hù)措施指標(biāo),Galileo用戶可以設(shè)置自己的防護(hù)措施,然后監(jiān)控和測(cè)量模型輸出,以確保LLMs不會(huì)偏離正軌。

    此外,Galileo還跟蹤一項(xiàng)被稱為"接地性"的指標(biāo),用于確定模型的輸出是否符合其提供的訓(xùn)練數(shù)據(jù)的范圍。如果一個(gè)模型在抵押貸款文件上進(jìn)行訓(xùn)練,但提供了與這些文件完全無(wú)關(guān)的答案,Galileo可以通過(guò)接地性指標(biāo)檢測(cè)到這一情況。這使用戶可以知道響應(yīng)是否與模型的訓(xùn)練背景相關(guān)。

    Galileo為用戶提供了一套全面的指標(biāo),使他們能夠更好地理解模型的輸出并解釋其真實(shí)性。這些指標(biāo)不僅有助于發(fā)現(xiàn)幻覺(jué)現(xiàn)象,還以可視化的方式解釋了模型在每個(gè)單詞基礎(chǔ)上的困惑,有助于開(kāi)發(fā)人員優(yōu)化模型以獲得最佳結(jié)果。同時(shí),通過(guò)防護(hù)措施和接地性指標(biāo),Galileo還幫助開(kāi)發(fā)人員確保LLMs的輸出不會(huì)引發(fā)問(wèn)題,如不準(zhǔn)確或不合規(guī)的響應(yīng)。

    舉報(bào)

    • 相關(guān)推薦
    • 為什么說(shuō)廣告是AI大模型公司最現(xiàn)實(shí)的商業(yè)化選擇?

      從ChatGPT開(kāi)啟訂閱模式開(kāi)始,業(yè)界似乎默認(rèn)大模型公司的C端商業(yè)化道路就是一條——訂閱制。原因似乎也說(shuō)得通——推理是有成本的。在經(jīng)過(guò)谷歌、Perplexity等公司的實(shí)踐,OpenAI、騰訊的躍躍欲試之后,廣告大概率會(huì)成為更多大模型公司商業(yè)化的現(xiàn)實(shí)選擇。

    • AI孫悟空”會(huì)說(shuō)中日英三語(yǔ)?訊飛星火AI大模型展項(xiàng)亮相大阪世博會(huì)

      4 月 13 日,主題為“構(gòu)想煥發(fā)生機(jī)的未來(lái)社會(huì)”的日本大阪·關(guān)西世博會(huì)(以下簡(jiǎn)稱“大阪世博會(huì)”)開(kāi)幕。大阪世博會(huì)中國(guó)館以“共同構(gòu)建人與自然生命共同體——綠色發(fā)展的未來(lái)社會(huì)”為主題,攜“嫦娥五號(hào)”月壤樣本、“蛟龍”號(hào)體驗(yàn)艙等頂尖科技成果亮相,并通過(guò)大量互動(dòng)裝置和數(shù)字化科技、AI技術(shù)等讓展品“活起來(lái)”、展項(xiàng)“動(dòng)起來(lái)”,向全球展示生動(dòng)靚麗的“中國(guó)?

    • AI大模型+全渠道整合:容聯(lián)七陌智能客服賦能制造業(yè)升級(jí)

      自《中國(guó)制造2025》戰(zhàn)略提出以來(lái),制造業(yè)的智能化發(fā)展進(jìn)入快車(chē)道,但行業(yè)仍面臨勞動(dòng)力成本上升、供應(yīng)鏈不透明、客戶需求碎片化等挑戰(zhàn)。企業(yè)亟需通過(guò)技術(shù)手段實(shí)現(xiàn)降本增效,而智能化客戶服務(wù)成為關(guān)鍵突破口。與此同時(shí),客服行業(yè)正經(jīng)歷顛覆性變革。傳統(tǒng)客服依賴人工響應(yīng),存在效率低、成本高、數(shù)據(jù)割裂等痛點(diǎn)。隨著AI大模型技術(shù)成熟,全渠道整合、智能客服機(jī)器人?

    • 斥資36億!OpenAI考慮收購(gòu)前蘋(píng)果設(shè)計(jì)師AI初創(chuàng)公司

      據(jù)報(bào)道,OpenAI近期正就收購(gòu)AI硬件初創(chuàng)公司ioProducts展開(kāi)深入談判,這筆潛在交易或?qū)⒅厮苋斯ぶ悄苡布袌?chǎng)格局。OpenAI高層曾考慮以至少5億美元的價(jià)格收購(gòu)這家由OpenAICEO薩姆阿爾特曼與前蘋(píng)果傳奇設(shè)計(jì)師喬納森艾維聯(lián)合創(chuàng)立的公司。這筆交易或?qū)㈤_(kāi)啟AI巨頭與頂尖工業(yè)設(shè)計(jì)團(tuán)隊(duì)強(qiáng)強(qiáng)聯(lián)合的新模式,為人工智能技術(shù)的終端落地開(kāi)辟全新路徑。

    • DeepSeek+物流行業(yè),AI大模型破解五大場(chǎng)景效能困局

      文章探討了AI大模型在物流行業(yè)的應(yīng)用現(xiàn)狀與挑戰(zhàn)。以DeepSeek為代表的AI技術(shù)正通過(guò)重構(gòu)業(yè)務(wù)流程、優(yōu)化資源配置、提升決策效率等方式,成為推動(dòng)行業(yè)降本增效的核心引擎。但成功應(yīng)用AI大模型需要企業(yè)具備數(shù)字化基礎(chǔ)、業(yè)務(wù)流程標(biāo)準(zhǔn)化和數(shù)據(jù)治理能力,而非簡(jiǎn)單技術(shù)堆砌。G7+易流梳理出五大核心應(yīng)用場(chǎng)景:工作效能輔助、經(jīng)營(yíng)數(shù)據(jù)分析、安全審查、智能客服和知識(shí)管理。這些

    • 邁富時(shí)AI大模型破解白酒行業(yè)三大痛點(diǎn)——與奇點(diǎn)國(guó)峰攜手共建酒業(yè)智慧生態(tài)

      近日,Marketingforce邁富時(shí)與中國(guó)奇點(diǎn)國(guó)峰控股有限公司(以下簡(jiǎn)稱“奇點(diǎn)國(guó)峰”)正式宣布達(dá)成 2025 年度戰(zhàn)略合作。此次合作標(biāo)志著雙方將充分發(fā)揮各自在人工智能、數(shù)智化營(yíng)銷(xiāo)以及白酒產(chǎn)業(yè)鏈上的獨(dú)特優(yōu)勢(shì),攜手構(gòu)建白酒AI大模型,致力于打造醬香白酒行業(yè)數(shù)智化轉(zhuǎn)型的標(biāo)桿案例,為傳統(tǒng)白酒產(chǎn)業(yè)的創(chuàng)新發(fā)展注入強(qiáng)大動(dòng)力。在雙方戰(zhàn)略合作的推動(dòng)下,Marketingforce邁富時(shí)憑借其?

    • 大模型AI基礎(chǔ)設(shè)施,商湯的反向求解

      大模型落地如火如荼,從上一代AI浪潮中殺出來(lái)的商湯,嗅到了這里面新的機(jī)會(huì)。在最火的具身智能賽道,這兩年誕生了許多明星創(chuàng)業(yè)公司。這些創(chuàng)業(yè)公司的創(chuàng)始人往往擁有技術(shù)明星的光環(huán),不少都是在學(xué)術(shù)界中某個(gè)技術(shù)領(lǐng)域中響當(dāng)當(dāng)?shù)念I(lǐng)頭人。這些初創(chuàng)公司雖然在某一個(gè)單點(diǎn)技術(shù)上遙遙領(lǐng)先(大腦、小腦或者本體),但在機(jī)器人落地過(guò)程中,要突破從單一技術(shù)到整體復(fù)雜產(chǎn)品

    • 合合信息發(fā)布“大模型加速器 2.0”,助力大模型跨越“幻覺(jué)”障礙

      近日,上海合合信息科技股份有限公司(簡(jiǎn)稱“合合信息”)TextIn“大模型加速器 2.0”版本正式上線,憑借其多維度升級(jí),為降低大模型“幻覺(jué)”風(fēng)險(xiǎn)、推動(dòng)大模型精準(zhǔn)應(yīng)用提供了強(qiáng)大助力。訓(xùn)練數(shù)據(jù)是影響大模型“認(rèn)知能力”的關(guān)鍵,合合信息“大模型加速器 2.0”基于領(lǐng)先的智能文檔處理技術(shù),從數(shù)據(jù)源頭入手,對(duì)復(fù)雜文檔的版式、布局和元素進(jìn)行精準(zhǔn)解析及結(jié)構(gòu)化處理,

    • AI日?qǐng)?bào):小米首個(gè)推理大模型開(kāi)源Xiaomi MiMo;快手上線AI筆記工具“喵記多”;騰訊拆分AI團(tuán)隊(duì)

      本文匯總了AI領(lǐng)域最新動(dòng)態(tài):1)小米開(kāi)源70億參數(shù)大模型Xiaomi MiMo,在數(shù)學(xué)推理和代碼競(jìng)賽中超越OpenAI和阿里模型;2)快手推出AI筆記工具"喵記多",簡(jiǎn)化筆記管理;3)Luma AI發(fā)布電影級(jí)鏡頭控制API,降低視頻生成門(mén)檻;4)騰訊重組AI團(tuán)隊(duì),加大語(yǔ)言模型研發(fā)投入;5)Anthropic為Claude引入新語(yǔ)音"Glassy";6)谷歌NotebookLM新增50+語(yǔ)言音頻概述功能;7)xAI將發(fā)布Grok3.5模型;8)Meta推出獨(dú)立AI助手應(yīng)用挑戰(zhàn)ChatGPT;9)OpenAI緊急修復(fù)GPT-4o"諂媚"問(wèn)題;10)Mac本地AI助手Simular升級(jí)隱私保護(hù);11)CameraBench項(xiàng)目幫助AI理解鏡頭運(yùn)動(dòng);12)谷歌推出個(gè)性化語(yǔ)言學(xué)習(xí)AI工具。

    • 阿丘科技李嘉悅:大模型驅(qū)動(dòng)的AI檢測(cè)范式變革——大模型、小模型、智能體的協(xié)同進(jìn)化

      3月28日,由機(jī)器視覺(jué)產(chǎn)業(yè)聯(lián)盟主辦、慕尼黑展覽有限公司承辦的VisionChina2025機(jī)器視覺(jué)展在上海新國(guó)際博覽中心圓滿落幕。阿丘科技產(chǎn)品總監(jiān)李嘉悅在機(jī)器視覺(jué)及工業(yè)應(yīng)用研討會(huì)現(xiàn)場(chǎng),圍繞“大模型驅(qū)動(dòng)的AI檢測(cè)范式變革:大模型、小模型與智能體的協(xié)同進(jìn)化”的主題,發(fā)表了精彩演講?!苯衲辏谶@個(gè)快速變化的時(shí)代,我要補(bǔ)充一句:“AI工業(yè)視覺(jué)的格局正在加速變革,不會(huì)用大模型的將會(huì)被善用大模型的人淘汰。

    熱文

    • 3 天
    • 7天