无码在线播放二区|久久亚洲精品国产精品|无码视频在线观看一区二区|在线观看国产日韩亚洲中

<menu id="yw4o4"></menu>

<menu id="yw4o4"><em id="yw4o4"></em></menu>

<samp id="qckqk"></samp>

<ul id="qckqk"><object id="qckqk"></object></ul>

<input id="qckqk"><abbr id="qckqk"></abbr></input>

AI初創(chuàng)公司Galileo推新工具，可解釋AI大模型的幻覺(jué)現(xiàn)象

2023-09-20 11:23 · 稿源：站長(zhǎng)之家

文章概要:
1. 美國(guó)AI初創(chuàng)公司Galileo發(fā)布新工具，幫助用戶更好地理解和解釋大型語(yǔ)言模型（LLMs）的輸出，特別是幻覺(jué)現(xiàn)象。
2. Galileo Studio現(xiàn)在具備實(shí)時(shí)監(jiān)測(cè)功能，允許用戶評(píng)估輸入和輸出，提供新指標(biāo)和防護(hù)措施以優(yōu)化LLMs的性能。
3. Galileo還引入了"接地性"指標(biāo)，用于確定模型輸出是否與訓(xùn)練數(shù)據(jù)相關(guān)，以區(qū)分幻覺(jué)和模型輸出的真實(shí)性。

站長(zhǎng)之家(ChinaZ.com) 9月20日消息:在人工智能領(lǐng)域，特定生成型人工智能模型（LLMs）產(chǎn)生幻覺(jué)現(xiàn)象的問(wèn)題一直令人困惑。然而，舊金山的AI初創(chuàng)公司Galileo正在努力解決這一問(wèn)題，并為用戶提供了一系列新的監(jiān)測(cè)和指標(biāo)功能，以幫助他們更好地理解和解釋LLMs的輸出。

Galileo Studio是該公司旗下的工具，最新更新使用戶不僅可以評(píng)估輸入和上下文，還可以實(shí)時(shí)觀察輸出。這些新的監(jiān)測(cè)功能使Galileo能夠更好地解釋為什么模型會(huì)產(chǎn)生特定的輸出，并提供新的指標(biāo)和防護(hù)措施來(lái)優(yōu)化LLMs的性能。

機(jī)器人

圖源備注：圖片由AI生成，圖片授權(quán)服務(wù)商Midjourney

Galileo的聯(lián)合創(chuàng)始人兼CEO Vikram Chatterji在接受VentureBeat的獨(dú)家采訪中表示:“最近幾個(gè)月的真正新功能是我們添加了實(shí)時(shí)監(jiān)測(cè)，因?yàn)楝F(xiàn)在您實(shí)際上可以觀察到出了什么問(wèn)題。這已經(jīng)成為一個(gè)端到端的產(chǎn)品，用于不斷改進(jìn)大型語(yǔ)言模型應(yīng)用?！?/p>

LLMs通常依賴于應(yīng)用程序向LLM發(fā)出API調(diào)用以獲取響應(yīng)。Galileo攔截了這些API調(diào)用，包括輸入和生成的輸出。通過(guò)攔截這些數(shù)據(jù)，Galileo能夠向用戶提供關(guān)于模型性能以及輸出準(zhǔn)確性的準(zhǔn)實(shí)時(shí)信息。

當(dāng)我們討論生成的AI輸出的事實(shí)準(zhǔn)確性時(shí)，通常會(huì)涉及到幻覺(jué)現(xiàn)象，即生成了與事實(shí)不符的輸出。Chatterji解釋說(shuō)，LLM實(shí)際上是在嘗試預(yù)測(cè)下一個(gè)單詞應(yīng)該是什么，但它還有關(guān)于下一個(gè)備選單詞的想法，并為所有這些不同的標(biāo)記或不同的單詞分配概率。

Galileo通過(guò)與模型本身連接，使其能夠準(zhǔn)確了解這些概率，然后提供額外的指標(biāo)來(lái)更好地解釋模型輸出并理解為什么會(huì)出現(xiàn)特定的幻覺(jué)現(xiàn)象。通過(guò)提供這些見(jiàn)解，Galileo的目標(biāo)是幫助開(kāi)發(fā)人員更好地調(diào)整模型和微調(diào)以獲得最佳結(jié)果。

除了幻覺(jué)問(wèn)題，LLM基礎(chǔ)應(yīng)用程序提供的響應(yīng)可能會(huì)引發(fā)一些問(wèn)題，如不準(zhǔn)確、不當(dāng)?shù)恼Z(yǔ)言或機(jī)密信息泄露。為了解決這些問(wèn)題，Galileo Studio還引入了新的"防護(hù)措施"指標(biāo)。對(duì)于AI模型，防護(hù)措施是關(guān)于模型可以生成的信息、語(yǔ)氣和語(yǔ)言的限制。

對(duì)于金融服務(wù)和醫(yī)療保健等領(lǐng)域的組織來(lái)說(shuō)，存在與信息披露和語(yǔ)言使用相關(guān)的監(jiān)管合規(guī)性問(wèn)題。通過(guò)防護(hù)措施指標(biāo)，Galileo用戶可以設(shè)置自己的防護(hù)措施，然后監(jiān)控和測(cè)量模型輸出，以確保LLMs不會(huì)偏離正軌。

此外，Galileo還跟蹤一項(xiàng)被稱為"接地性"的指標(biāo)，用于確定模型的輸出是否符合其提供的訓(xùn)練數(shù)據(jù)的范圍。如果一個(gè)模型在抵押貸款文件上進(jìn)行訓(xùn)練，但提供了與這些文件完全無(wú)關(guān)的答案，Galileo可以通過(guò)接地性指標(biāo)檢測(cè)到這一情況。這使用戶可以知道響應(yīng)是否與模型的訓(xùn)練背景相關(guān)。

Galileo為用戶提供了一套全面的指標(biāo)，使他們能夠更好地理解模型的輸出并解釋其真實(shí)性。這些指標(biāo)不僅有助于發(fā)現(xiàn)幻覺(jué)現(xiàn)象，還以可視化的方式解釋了模型在每個(gè)單詞基礎(chǔ)上的困惑，有助于開(kāi)發(fā)人員優(yōu)化模型以獲得最佳結(jié)果。同時(shí)，通過(guò)防護(hù)措施和接地性指標(biāo)，Galileo還幫助開(kāi)發(fā)人員確保LLMs的輸出不會(huì)引發(fā)問(wèn)題，如不準(zhǔn)確或不合規(guī)的響應(yīng)。

（舉報(bào)）

相關(guān)推薦

關(guān)鍵詞：

薦為什么說(shuō)廣告是AI大模型公司最現(xiàn)實(shí)的商業(yè)化選擇？

從ChatGPT開(kāi)啟訂閱模式開(kāi)始，業(yè)界似乎默認(rèn)大模型公司的C端商業(yè)化道路就是一條——訂閱制。原因似乎也說(shuō)得通——推理是有成本的。在經(jīng)過(guò)谷歌、Perplexity等公司的實(shí)踐，OpenAI、騰訊的躍躍欲試之后，廣告大概率會(huì)成為更多大模型公司商業(yè)化的現(xiàn)實(shí)選擇。

?大模型商業(yè)化 ?AI訂閱模式 ?廣告變現(xiàn)
“AI孫悟空”會(huì)說(shuō)中日英三語(yǔ)？訊飛星火AI大模型展項(xiàng)亮相大阪世博會(huì)

4 月 13 日，主題為“構(gòu)想煥發(fā)生機(jī)的未來(lái)社會(huì)”的日本大阪·關(guān)西世博會(huì)（以下簡(jiǎn)稱“大阪世博會(huì)”）開(kāi)幕。大阪世博會(huì)中國(guó)館以“共同構(gòu)建人與自然生命共同體——綠色發(fā)展的未來(lái)社會(huì)”為主題，攜“嫦娥五號(hào)”月壤樣本、“蛟龍”號(hào)體驗(yàn)艙等頂尖科技成果亮相，并通過(guò)大量互動(dòng)裝置和數(shù)字化科技、AI技術(shù)等讓展品“活起來(lái)”、展項(xiàng)“動(dòng)起來(lái)”，向全球展示生動(dòng)靚麗的“中國(guó)?

?大阪世博會(huì) ?中國(guó)館 ?人工智能
AI大模型+全渠道整合：容聯(lián)七陌智能客服賦能制造業(yè)升級(jí)

自《中國(guó)制造2025》戰(zhàn)略提出以來(lái)，制造業(yè)的智能化發(fā)展進(jìn)入快車(chē)道，但行業(yè)仍面臨勞動(dòng)力成本上升、供應(yīng)鏈不透明、客戶需求碎片化等挑戰(zhàn)。企業(yè)亟需通過(guò)技術(shù)手段實(shí)現(xiàn)降本增效，而智能化客戶服務(wù)成為關(guān)鍵突破口。與此同時(shí)，客服行業(yè)正經(jīng)歷顛覆性變革。傳統(tǒng)客服依賴人工響應(yīng)，存在效率低、成本高、數(shù)據(jù)割裂等痛點(diǎn)。隨著AI大模型技術(shù)成熟，全渠道整合、智能客服機(jī)器人?

?智能客服 ?AI大模型 ?制造業(yè)智能化
斥資36億！OpenAI考慮收購(gòu)前蘋(píng)果設(shè)計(jì)師AI初創(chuàng)公司

據(jù)報(bào)道，OpenAI近期正就收購(gòu)AI硬件初創(chuàng)公司ioProducts展開(kāi)深入談判，這筆潛在交易或?qū)⒅厮苋斯ぶ悄苡布袌?chǎng)格局。OpenAI高層曾考慮以至少5億美元的價(jià)格收購(gòu)這家由OpenAICEO薩姆阿爾特曼與前蘋(píng)果傳奇設(shè)計(jì)師喬納森艾維聯(lián)合創(chuàng)立的公司。這筆交易或?qū)㈤_(kāi)啟AI巨頭與頂尖工業(yè)設(shè)計(jì)團(tuán)隊(duì)強(qiáng)強(qiáng)聯(lián)合的新模式，為人工智能技術(shù)的終端落地開(kāi)辟全新路徑。

?OpenAI收購(gòu) ?AI硬件 ?io
DeepSeek+物流行業(yè)，AI大模型破解五大場(chǎng)景效能困局

文章探討了AI大模型在物流行業(yè)的應(yīng)用現(xiàn)狀與挑戰(zhàn)。以DeepSeek為代表的AI技術(shù)正通過(guò)重構(gòu)業(yè)務(wù)流程、優(yōu)化資源配置、提升決策效率等方式，成為推動(dòng)行業(yè)降本增效的核心引擎。但成功應(yīng)用AI大模型需要企業(yè)具備數(shù)字化基礎(chǔ)、業(yè)務(wù)流程標(biāo)準(zhǔn)化和數(shù)據(jù)治理能力，而非簡(jiǎn)單技術(shù)堆砌。G7+易流梳理出五大核心應(yīng)用場(chǎng)景：工作效能輔助、經(jīng)營(yíng)數(shù)據(jù)分析、安全審查、智能客服和知識(shí)管理。這些

?人工智能 ?大模型 ?物流行業(yè)
邁富時(shí)AI大模型破解白酒行業(yè)三大痛點(diǎn)——與奇點(diǎn)國(guó)峰攜手共建酒業(yè)智慧生態(tài)

近日，Marketingforce邁富時(shí)與中國(guó)奇點(diǎn)國(guó)峰控股有限公司（以下簡(jiǎn)稱“奇點(diǎn)國(guó)峰”）正式宣布達(dá)成 2025 年度戰(zhàn)略合作。此次合作標(biāo)志著雙方將充分發(fā)揮各自在人工智能、數(shù)智化營(yíng)銷(xiāo)以及白酒產(chǎn)業(yè)鏈上的獨(dú)特優(yōu)勢(shì)，攜手構(gòu)建白酒AI大模型，致力于打造醬香白酒行業(yè)數(shù)智化轉(zhuǎn)型的標(biāo)桿案例，為傳統(tǒng)白酒產(chǎn)業(yè)的創(chuàng)新發(fā)展注入強(qiáng)大動(dòng)力。在雙方戰(zhàn)略合作的推動(dòng)下，Marketingforce邁富時(shí)憑借其?

?戰(zhàn)略合作 ?人工智能 ?數(shù)智化營(yíng)銷(xiāo)
薦從大模型到AI基礎(chǔ)設(shè)施，商湯的反向求解

大模型落地如火如荼，從上一代AI浪潮中殺出來(lái)的商湯，嗅到了這里面新的機(jī)會(huì)。在最火的具身智能賽道，這兩年誕生了許多明星創(chuàng)業(yè)公司。這些創(chuàng)業(yè)公司的創(chuàng)始人往往擁有技術(shù)明星的光環(huán)，不少都是在學(xué)術(shù)界中某個(gè)技術(shù)領(lǐng)域中響當(dāng)當(dāng)?shù)念I(lǐng)頭人。這些初創(chuàng)公司雖然在某一個(gè)單點(diǎn)技術(shù)上遙遙領(lǐng)先（大腦、小腦或者本體），但在機(jī)器人落地過(guò)程中，要突破從單一技術(shù)到整體復(fù)雜產(chǎn)品

?大模型 ?具身智能 ?機(jī)器人技術(shù)
合合信息發(fā)布“大模型加速器 2.0”，助力大模型跨越“幻覺(jué)”障礙

近日，上海合合信息科技股份有限公司（簡(jiǎn)稱“合合信息”）TextIn“大模型加速器 2.0”版本正式上線，憑借其多維度升級(jí)，為降低大模型“幻覺(jué)”風(fēng)險(xiǎn)、推動(dòng)大模型精準(zhǔn)應(yīng)用提供了強(qiáng)大助力。訓(xùn)練數(shù)據(jù)是影響大模型“認(rèn)知能力”的關(guān)鍵，合合信息“大模型加速器 2.0”基于領(lǐng)先的智能文檔處理技術(shù)，從數(shù)據(jù)源頭入手，對(duì)復(fù)雜文檔的版式、布局和元素進(jìn)行精準(zhǔn)解析及結(jié)構(gòu)化處理，

?大模型加速器 ?合合信息 ?智能文檔處理
薦AI日?qǐng)?bào)：小米首個(gè)推理大模型開(kāi)源Xiaomi MiMo；快手上線AI筆記工具“喵記多”；騰訊拆分AI團(tuán)隊(duì)

本文匯總了AI領(lǐng)域最新動(dòng)態(tài)：1)小米開(kāi)源70億參數(shù)大模型Xiaomi MiMo，在數(shù)學(xué)推理和代碼競(jìng)賽中超越OpenAI和阿里模型；2)快手推出AI筆記工具"喵記多"，簡(jiǎn)化筆記管理；3)Luma AI發(fā)布電影級(jí)鏡頭控制API，降低視頻生成門(mén)檻；4)騰訊重組AI團(tuán)隊(duì)，加大語(yǔ)言模型研發(fā)投入；5)Anthropic為Claude引入新語(yǔ)音"Glassy"；6)谷歌NotebookLM新增50+語(yǔ)言音頻概述功能；7)xAI將發(fā)布Grok3.5模型；8)Meta推出獨(dú)立AI助手應(yīng)用挑戰(zhàn)ChatGPT；9)OpenAI緊急修復(fù)GPT-4o"諂媚"問(wèn)題；10)Mac本地AI助手Simular升級(jí)隱私保護(hù)；11)CameraBench項(xiàng)目幫助AI理解鏡頭運(yùn)動(dòng)；12)谷歌推出個(gè)性化語(yǔ)言學(xué)習(xí)AI工具。

?人工智能 ?Xiaomi ?MiMo
阿丘科技李嘉悅：大模型驅(qū)動(dòng)的AI檢測(cè)范式變革——大模型、小模型、智能體的協(xié)同進(jìn)化

3月28日，由機(jī)器視覺(jué)產(chǎn)業(yè)聯(lián)盟主辦、慕尼黑展覽有限公司承辦的VisionChina2025機(jī)器視覺(jué)展在上海新國(guó)際博覽中心圓滿落幕。阿丘科技產(chǎn)品總監(jiān)李嘉悅在機(jī)器視覺(jué)及工業(yè)應(yīng)用研討會(huì)現(xiàn)場(chǎng)，圍繞“大模型驅(qū)動(dòng)的AI檢測(cè)范式變革:大模型、小模型與智能體的協(xié)同進(jìn)化”的主題，發(fā)表了精彩演講?！苯衲辏谶@個(gè)快速變化的時(shí)代，我要補(bǔ)充一句:“AI工業(yè)視覺(jué)的格局正在加速變革，不會(huì)用大模型的將會(huì)被善用大模型的人淘汰。

?機(jī)器視覺(jué) ?AI檢測(cè) ?工業(yè)應(yīng)用

熱文

3 天
7天

站長(zhǎng)商機(jī)

廣告

商務(wù)合作侵權(quán)投訴廣告服務(wù) 版權(quán)聲明招聘

?CopyRight 2002-2020 CHINAZ.COM

<nav id="i4uag"><center id="i4uag"></center></nav>

<kbd id="i4uag"></kbd>