无码在线播放二区|久久亚洲精品国产精品|无码视频在线观看一区二区|在线观看国产日韩亚洲中

  • <menu id="yw4o4"></menu>
  • 
    <menu id="yw4o4"><em id="yw4o4"></em></menu>
  • 首頁 > 傳媒 > 關(guān)鍵詞  > 正文

    行業(yè)首創(chuàng) !Graph RAG :基于知識圖譜的檢索增強(qiáng)技術(shù)優(yōu)勢與對比

    2023-08-31 10:20 · 稿源: 站長之家用戶

    身處信息爆炸時代,如何從海量信息中獲取準(zhǔn)確全面的搜索結(jié)果,并以更直觀、可讀的方式呈現(xiàn)出來是大家期待達(dá)成的目標(biāo)。傳統(tǒng)的搜索增強(qiáng)技術(shù)受限于訓(xùn)練文本數(shù)量、質(zhì)量等問題,對于復(fù)雜或多義詞查詢效果不佳,更無法滿足 ChatGPT 等大語言模型應(yīng)用帶來的大規(guī)模、高并發(fā)的復(fù)雜關(guān)聯(lián)查詢需求。

    在此背景下,悅數(shù)圖數(shù)據(jù)庫率先實(shí)現(xiàn)了與 Llama Index、LangChain 等大語言模型框架的深度適配并在行業(yè)內(nèi)首 次提出了 Graph RAG(基于圖技術(shù)的檢索增強(qiáng))的概念,利用知識圖譜結(jié)合大語言模型(LLM)為搜索引擎提供更全面的上下文信息,可以幫助用戶以更低成本獲得更智能、更準(zhǔn)確的搜索結(jié)果。目前,悅數(shù)圖數(shù)據(jù)庫推出的這項(xiàng)技術(shù)在與向量數(shù)據(jù)庫結(jié)合的領(lǐng)域也獲得了相當(dāng)不錯的效果。

    今天我們就一起來了解下什么是 Graph RAG 以及它與其他 RAG 技術(shù)的對比,也歡迎進(jìn)入?悅數(shù)圖數(shù)據(jù)庫?官網(wǎng),通過 Demo 直觀感受這一功能。

    傳統(tǒng)檢索增強(qiáng)技術(shù)的瓶頸:缺少訓(xùn)練數(shù)據(jù),文本理解不足

    在傳統(tǒng)的搜索引擎中,檢索結(jié)果通常是基于關(guān)鍵詞的匹配。而隨著用戶對搜索比較準(zhǔn)確度和詞匯聯(lián)想能力要求的提高,傳統(tǒng)的搜索結(jié)果往往難以滿足用戶的實(shí)際需求,尤其是在處理復(fù)雜的問題和長尾查詢時,效果會明顯降低。

    為了解決這類問題,RAG 搜索增強(qiáng)技術(shù)應(yīng)運(yùn)而生。RAG (Retrieval-Augmented Generation),指的是通過 RAG 模型來對搜索結(jié)果進(jìn)行增強(qiáng)的過程。具體來說,它是將檢索技術(shù)和語言生成技術(shù)相結(jié)合來增強(qiáng)生成過程的一種技術(shù),可以幫助傳統(tǒng)搜索引擎生成更加準(zhǔn)確、相關(guān)和多樣化的信息來滿足用戶的需求。

    而為了使搜索結(jié)果更準(zhǔn)確,RAG 技術(shù)仍然面臨訓(xùn)練數(shù)據(jù)和文本理解的挑戰(zhàn):

    • 訓(xùn)練數(shù)據(jù):RAG 技術(shù)需要大量的數(shù)據(jù)和計(jì)算資源來訓(xùn)練和生成模型,尤其是在處理多語言和復(fù)雜任務(wù)時,但是互聯(lián)網(wǎng)上文本的質(zhì)量和準(zhǔn)確性是有限的,訓(xùn)練數(shù)據(jù)的不足會直接影響生成內(nèi)容的質(zhì)量

    • 文本理解:RAG 需要理解查詢的意圖,但是對于復(fù)雜的查詢或者多義詞查詢,RAG 可能會出現(xiàn)歧義或不確定性,從而影響生成的質(zhì)量

    因此,如何找到更強(qiáng)大的檢索增強(qiáng)技術(shù),以更有效率獲得更符合搜索者的預(yù)期的搜索結(jié)果的問題就顯得更迫在眉睫。

    什么是 Graph RAG:基于知識圖譜的檢索增強(qiáng)技術(shù)

    「Graph RAG」是由悅數(shù)圖數(shù)據(jù)率先提出的概念,它是一種基于知識圖譜的檢索增強(qiáng)技術(shù),通過構(gòu)建圖模型的知識表達(dá),將實(shí)體和關(guān)系之間的聯(lián)系用圖的形式進(jìn)行展示,然后利用大語言模型 LLM(Large Language Model)進(jìn)行檢索增強(qiáng)。

    在之前?和 Llama Index 的直播研討會?中我們提到,圖數(shù)據(jù)庫憑借圖形格式組織和連接信息的方式,天然適合存儲及表達(dá)復(fù)雜的上下文信息。通過圖技術(shù)構(gòu)建知識圖譜提升 In-Context Learning 的全面性為用戶提供更多的上下文信息,能夠幫助大語言模型(LLM)更好地理解實(shí)體間的關(guān)系,提升自己的表達(dá)和推理能力。

    Graph RAG 將知識圖譜等價(jià)于一個超大規(guī)模的詞匯表,而實(shí)體和關(guān)系則對應(yīng)于單詞。通過這種方式,Graph RAG 在檢索時能夠?qū)?shí)體和關(guān)系作為單元進(jìn)行聯(lián)合建模,從而更準(zhǔn)確地理解查詢意圖,并提供更準(zhǔn)確的檢索結(jié)果。

    Demo 演示:檢索強(qiáng)化效果對比:「悅數(shù)」官網(wǎng)可直接在線體驗(yàn)

    下面我們就通過 Demo 演示來直觀比較下 Graph RAG 與 Vector RAG、Text2Cypher 這三種檢索增強(qiáng)技術(shù)的區(qū)別和對比——

    Vector RAG 與 Graph + Vector RAG 的對比

    首先是 Vector RAG(向量檢索) 與 Graph + Vector RAG(圖技術(shù)增強(qiáng)的向量檢索)的對比。

    以《銀河護(hù)衛(wèi)隊(duì) 3》的數(shù)據(jù)集為例,當(dāng)我們詢問“彼得·奎爾的相關(guān)信息”時,單獨(dú)使用向量檢索引擎只給出了簡單的身份、劇情、演員信息,而當(dāng)我們使用 Graph RAG 增強(qiáng)后的搜索結(jié)果,則提供了更多關(guān)于主角技能、角色目標(biāo)和身份變化的信息——在這個例子中我們不難看出,?Graph RAG 的方法有效補(bǔ)充了 Embedding、向量搜索等傳統(tǒng)手段的不足。

    Graph RAG 與 Text2Cypher 的對比

    基于圖譜的 LLM 的另一種有趣方法是 Text2Cypher,即自然語言生成圖查詢。這種方法不依賴于實(shí)體的子圖檢索,而是將任務(wù)/問題翻譯成一個面向答案的特定圖查詢,和我們常說的 Text2SQL 本質(zhì)是一樣的。

    Text2Cypher 和 Graph RAG 這兩種方法主要在其檢索機(jī)制上有所不同。Text2Cypher 根據(jù)知識圖譜的 Schema 和給定的任務(wù)生成圖形模式查詢,而 (Sub)Graph RAG 獲取相關(guān)的子圖以提供上下文。兩者都有其優(yōu)點(diǎn),大家可以通過這個 demo ,更直觀理解他們的特點(diǎn):

    我們可以看到兩者的圖查詢模式在可視化下是有非常清晰的差異的,基于 Graph RAG 實(shí)現(xiàn)的檢索明顯呈現(xiàn)出更豐富的結(jié)果。用戶不僅獲得了最基礎(chǔ)的介紹信息,更能得到“彼得·奎爾是銀河護(hù)衛(wèi)隊(duì)的領(lǐng)導(dǎo) 者”、“這個角色暗示自己將在續(xù)集中回歸”以及角色性格等一系列基于關(guān)聯(lián)搜索和上下文進(jìn)行推理得出的結(jié)果。

    悅數(shù)圖數(shù)據(jù)庫:率先實(shí)現(xiàn) LLM 適配,一鍵構(gòu)建企業(yè)專屬知識圖譜應(yīng)用

    悅數(shù)圖數(shù)據(jù)庫不僅是國內(nèi)頭家提出 Graph RAG 概念的廠商,也率先實(shí)現(xiàn)了與大語言模型框架 Llama Index 、LangChain 等的深度適配,因此開發(fā)者可以專注于 LLM 的編排邏輯和 pipeline 設(shè)計(jì),而不用親自處理很多細(xì)節(jié)的抽象與實(shí)現(xiàn),一站式生成高質(zhì)量、低成本的企業(yè)級大語言模型應(yīng)用。

    Graph RAG 技術(shù)的出現(xiàn)可以說是為海量信息處理和檢索帶來了全新的思路。通過將知識圖譜、圖存儲集成到大語言模型(LLM) 技術(shù)棧中,Graph RAG 把上下文學(xué)習(xí)推向了一個新的高度。目前,用戶基于悅數(shù)圖數(shù)據(jù)庫 僅需要 3 行代碼就可以輕松搭建 Graph RAG,甚至整合更復(fù)雜的 RAG 邏輯,比如 Graph+Vector RAG。

    選擇相信隨著圖技術(shù)和深度學(xué)習(xí)算法的進(jìn)一步發(fā)展,Graph RAG 技術(shù)在信息處理和檢索領(lǐng)域的應(yīng)用也會越來越廣泛。歡迎大家聯(lián)系我們獲取悅數(shù)圖數(shù)據(jù)的免費(fèi)試用機(jī)會,輕松構(gòu)建您的專屬知識圖譜應(yīng)用!

    推廣

    特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))均為站長傳媒平臺用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù),對本頁面內(nèi)容所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任,相關(guān)信息僅供參考。站長之家將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。任何單位或個人認(rèn)為本頁面內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時,可及時向站長之家提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明(點(diǎn)擊查看反饋聯(lián)系地址)。本網(wǎng)站在收到上述法律文件后,將會依法依規(guī)核實(shí)信息,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

    • 相關(guān)推薦
    • 問界 M9 引爆市場:技術(shù)優(yōu)勢與用戶裂變締造 50 萬級銷冠傳奇

      華為問界M9在50萬級豪華SUV市場表現(xiàn)亮眼,上市13個月交付超18萬輛,連續(xù)11個月蟬聯(lián)中國50萬以上豪華車銷量冠軍。其成功源于華為ICT技術(shù)賦能,構(gòu)建智能駕駛、智能座艙等五大智能中樞,配合"硬件預(yù)埋+OTA持續(xù)進(jìn)化"模式實(shí)現(xiàn)產(chǎn)品力持續(xù)升級。在安全性能上獲得中保研超G級認(rèn)證,用戶凈推薦值(NPS)行業(yè)第一。問界M9不僅改寫了中國品牌在高端市場的競爭格局,更引領(lǐng)行業(yè)從"燃油時代"向"智能電動時代"轉(zhuǎn)型,被德媒評價(jià)為中國車企從"追隨者"向"定義者"轉(zhuǎn)變的標(biāo)志。其成功模式為行業(yè)提供了可復(fù)制的經(jīng)驗(yàn),推動中國汽車產(chǎn)業(yè)良性發(fā)展。

    • 攻克“癌癥之王”難題!我國專家成功繪制全球首份“多組學(xué)全景圖譜

      中國醫(yī)學(xué)專家歷經(jīng)五年研究,成功繪制出全球首張無功能性胰腺神經(jīng)內(nèi)分泌瘤多組學(xué)全景圖譜?;谠搱D譜,專家們創(chuàng)新性提出針對這種沉默腫瘤”的分子分型框架、預(yù)后模型及靶向-免疫治療新策略,為臨床精準(zhǔn)診療提供了重要參考。更具臨床應(yīng)用價(jià)值的是,研究團(tuán)隊(duì)發(fā)現(xiàn)相關(guān)蛋白在患者血漿中的濃度與腫瘤進(jìn)展顯著相關(guān),這一突破性發(fā)現(xiàn)或?qū)⑼苿釉\療模式從傳統(tǒng)的有創(chuàng)組織活檢”向無創(chuàng)血液檢測”轉(zhuǎn)變。

    • 追覓掃地機(jī)全球第一!以首創(chuàng)技術(shù)解決清潔困擾

      日前,追覓掃地機(jī)獲得沙利文“智能拖布拆卸地毯保護(hù)掃地機(jī)器人,2022- 2024 三年累計(jì)全球銷量第一”專業(yè)認(rèn)證。追覓科技在 2022 年發(fā)布的追覓X10 系列掃地機(jī)器人產(chǎn)品上率先搭載智能拖布拆卸技術(shù),核心解決掃地機(jī)器人清潔過程中對地面、地毯造成的二次污染情況,為掃地機(jī)器人行業(yè)的清潔能力提升起到了關(guān)鍵引領(lǐng)作用。最初的掃拖一體機(jī)器人從掃拖一體或拖地模式切換到掃?

    • 麥德通AI外觀檢索工具怎么用?

      跨境電商賣家面臨外觀專利侵權(quán)風(fēng)險(xiǎn),占比高達(dá)62%的侵權(quán)案件。麥德通推出AI外觀檢索工具,提供圖片檢索和關(guān)鍵詞檢索兩種方式,3秒內(nèi)精準(zhǔn)匹配全球?qū)@L(fēng)險(xiǎn)。首月限時免費(fèi)使用,支持多圖檢索、智能聯(lián)想功能,幫助賣家規(guī)避侵權(quán)風(fēng)險(xiǎn)。工具操作簡單,非專業(yè)人士也能快速上手,可篩選有效專利結(jié)果。麥德通還提供商標(biāo)檢索等知識產(chǎn)權(quán)全鏈路服務(wù),助力賣家提高品牌注冊成功率。

    • GTA增強(qiáng)版登錄XGP免費(fèi)玩!XGP怎么免費(fèi)玩GTA增強(qiáng)

      GTA增強(qiáng)版上線XGP了,GTA增強(qiáng)版可以說是讓我們的老朋友煥發(fā)了新的生機(jī),更頂尖的游戲畫面,更豐富的游戲內(nèi)容,一定給各位新老朋友帶來更好地體驗(yàn)。上XGP之后,我們的游玩也是多了一個新的選擇,在XGP中入手會員就能免費(fèi)玩GTA增強(qiáng)版,還有XGP的其他游戲,整體算起來還是比較優(yōu)惠的,今天教大家XGP怎么免費(fèi)玩GTA增強(qiáng)版。在XGP上玩游戲,要先優(yōu)化網(wǎng)絡(luò),作為一款外服平臺,?

    • 技術(shù)破界 × 空氣革命:綠島風(fēng)以數(shù)智化生態(tài)重構(gòu)新風(fēng)行業(yè)價(jià)值坐標(biāo)

      在"雙碳"戰(zhàn)略與健康人居需求的雙重驅(qū)動下,新風(fēng)行業(yè)迎來結(jié)構(gòu)性變革的黃金窗口期。2013-2020年間,我國新風(fēng)行業(yè)銷售額年均復(fù)合增長率超30%,預(yù)計(jì)2025年市場規(guī)模將突破600億元。智能化、節(jié)能化及場景適配化成為推動行業(yè)技術(shù)迭代的關(guān)鍵力量,物聯(lián)網(wǎng)技術(shù)與AI算法的深度融合正引領(lǐng)新風(fēng)設(shè)備從單一通風(fēng)向全屋空氣管理生態(tài)升級。綠島風(fēng)憑借前瞻性技術(shù)布局與全產(chǎn)業(yè)鏈協(xié)同優(yōu)勢,迅速占據(jù)市場領(lǐng)先地位,構(gòu)建起覆蓋家用、商用、工業(yè)三大場景的產(chǎn)品矩陣,通過自主研發(fā)的智能控制系統(tǒng)實(shí)現(xiàn)空氣質(zhì)量的動態(tài)優(yōu)化。企業(yè)以490項(xiàng)專利構(gòu)筑技術(shù)壁壘,堅(jiān)持"專注、務(wù)實(shí)、創(chuàng)新、責(zé)任、奮斗"理念,市場份額穩(wěn)步提升,成為行業(yè)"隱形冠軍"。2024年除濕機(jī)產(chǎn)銷量同比增幅均超38%,成為企業(yè)第二增長曲線。綠島風(fēng)將通過構(gòu)建空氣價(jià)值生態(tài)系統(tǒng),在2025中國制冷展上展示技術(shù)實(shí)力,開啟行業(yè)高質(zhì)量發(fā)展新篇章。(140字)

    • 困局即是機(jī)遇:IBM 以‘咨詢+技術(shù)’雙引擎助力中國汽車行業(yè)從跟跑到領(lǐng)跑

      IBM聚焦汽車行業(yè)數(shù)字化轉(zhuǎn)型,通過“咨詢+技術(shù)”模式助力車企構(gòu)建端到端智能生態(tài)系統(tǒng),推動業(yè)務(wù)持續(xù)創(chuàng)新與升級。重點(diǎn)提及AI在提升效率、優(yōu)化成本及創(chuàng)造價(jià)值方面的潛力,并強(qiáng)調(diào)數(shù)據(jù)驅(qū)動的智能化轉(zhuǎn)型戰(zhàn)略。同時,IBM展示其在全球范圍內(nèi)的豐富經(jīng)驗(yàn)和成功案例,提出未來將以AI為核心加速行業(yè)變革。

    • 技術(shù)革新下的行業(yè)新王誕生,堅(jiān)果N3成4K段位全能投影

      2024年,家用投影行業(yè)迎來了里程碑式的革新,堅(jiān)果投影推出N3系列三款新品。N3UltraMax憑借純?nèi)す?、真光學(xué)變焦、AI全智控云臺等核心技術(shù)突破,帶來了亮度、色彩、智能體驗(yàn)的全面升級,成為萬元內(nèi)投影市場的“性能天花板”,重新定義了家用投影的行業(yè)標(biāo)準(zhǔn)。其帶來的不僅是銷量數(shù)字,更是一個行業(yè)的價(jià)值重構(gòu)——當(dāng)“參數(shù)內(nèi)卷”被“體驗(yàn)至上”取代,當(dāng)“價(jià)格戰(zhàn)”被“技術(shù)戰(zhàn)”終結(jié),家用投影產(chǎn)業(yè)的黃金時代,或許才剛剛開始。

    • 行業(yè)案例 | PCB 板多碼掃碼方案

      在傳統(tǒng)的PCB生產(chǎn)流程中需要人工對各類元器件的標(biāo)號進(jìn)行檢查、標(biāo)記、追溯,而隨著工業(yè)4. 0 時代的到來,大多企業(yè)會選擇借助機(jī)器視覺技術(shù)或固定式讀碼器進(jìn)行自動采集信息。在PCB生產(chǎn)過程中需要實(shí)現(xiàn)一次性讀取PCB板上多個二維碼,完成信息上傳系統(tǒng)追溯,從而實(shí)現(xiàn)提高生產(chǎn)的效率,節(jié)約了勞動成本。讀碼挑戰(zhàn):1、生產(chǎn)過程中的打碼質(zhì)量不夠高,導(dǎo)致對比度不足,從而影響?

    • 快手在國家知識產(chǎn)權(quán)局開放日發(fā)出行業(yè)倡議 強(qiáng)化知產(chǎn)保護(hù)營造良好創(chuàng)新生態(tài)環(huán)境

      4月25日世界知識產(chǎn)權(quán)日之際,國家知識產(chǎn)權(quán)局舉辦開放日活動。快手集團(tuán)法務(wù)副總裁焦嬌作為企業(yè)代表發(fā)言,強(qiáng)調(diào)知識產(chǎn)權(quán)保護(hù)對AI等新興產(chǎn)業(yè)的重要性??焓忠牙塾?jì)獲得2.3萬件專利授權(quán),其自主研發(fā)的"可靈AI"視頻生成大模型全球用戶突破2200萬,累計(jì)生成1.68億條視頻素材,并提交百余件專利申請。快手還聯(lián)合多個知名品牌成立電商知產(chǎn)聯(lián)盟,通過多元活動提升員工知識產(chǎn)權(quán)意識。焦嬌呼吁行業(yè)加強(qiáng)知產(chǎn)保護(hù),共同迎接AI時代的機(jī)遇與挑戰(zhàn)。