爲什麼說 Agentic RAG 是 RAG 領域的王者?
前言
在之前的文章中《RAG 檢索增強生成的協同機制》《爲什麼 RAG 系統 "一看就會,一做就廢"》,我們瞭解 RAG 的核心思想是將檢索機制與大模型相結合,通過動態檢索外部知識庫來增強模型的生成能力,並生成上下文相關且準確的響應。RAG 突破了目前大模型的靜態知識限制,拓展了大模型開啓了 “生成 + 檢索” 協同工作的新範式。
傳統 RAG - 文本檢索的利器
首先回顧一下傳統 RAG 的核心鏈路。
傳統 RAG 的三個核心鏈路:
-
• 索引(向量嵌入):通過 Embedding 模型服務實現文檔的向量編碼,寫入向量數據庫。
-
• 檢索(相似查詢):通過 Embedding 模型服務實現查詢的向量編碼,使用相似性查詢(ANN)實現 TopK 結果搜索。
-
• 生成(文檔上下文):Retriver 檢索的結果文檔作爲上下文和問題一起提交給大模型處理。
之前的文章中《爲什麼 RAG 系統 "一看就會,一做就廢"》提到傳統 RAG 系統存在 12 個問題:
對 12 個問題歸納總結來看:
-
- 缺失內容(Missing Content)、錯過超出排名範圍的文檔(Missed Top Ranked)、不在上下文中(Not In Context)、數據攝取的可擴展性問題(Data Ingestion Scalability)、結構化數據的問答(Structured Data QA)、從複雜 PDF 文檔提取數據(Data Extraction from Complex PDFs):屬於知識庫工程層面的問題,可以通過完善知識庫、增強知識確定性、優化上下文整合策略解決。
-
- 未提取(Not Extracted)、錯誤的格式(Wrong Format)
、不正確的具體性(Incorrect Specificity):屬於大模型自身能力的問題,依賴大模型的訓練和迭代。
- 未提取(Not Extracted)、錯誤的格式(Wrong Format)
-
- 答案的不完整(Incomplete Answers):屬於 RAG 架構問題,更有前景的思路是使用 Agent 引入規劃能力。
雖然傳統 RAG 系統在知識檢索和生成方面表現出色,但是在實際應用場景中我們已經不滿足於只是生成對應的簡單回答,而是期待大模型能夠在處理動態、多步推理任務、適應性和複雜工作流的編排方面更好地應用於企業級場景。例如:
-
- 傳統 RAG 系統在面對需要從多源信息中抽取並綜合分析的情況時,存在明顯侷限性。當回答一個複雜問題涉及到通過識別和利用不同信息片段之間的共享屬性,來構建新的、綜合性答案時,傳統 RAG 無法有效連接這些關鍵點,導致在信息整合與關聯方面表現不足,無法充分滿足用戶對於準確、全面且深入信息處理的需求。
-
- 傳統 RAG 對大規模的數據集合或是單篇幅巨大的文檔進行全面而深入的理解時,它的表現會顯得較爲遜色。這主要是因爲傳統 RAG 在處理大量數據時,難以有效地捕捉和理解那些被濃縮於其中的關鍵語義概念,從而影響了整體的理解質量。
比如在醫療場景中:醫療診斷的複雜問題,需要綜合分析患者的病歷記錄、多項檢查報告以及不同的醫學研究文獻等多源信息。傳統 RAG 系統可能會分別從這些信息源中抽取相關內容,但如果要構建一個新的綜合性答案,比如確定一種罕見病的診斷依據,就需要識別和利用不同信息片段之間的共享屬性,如特定症狀、檢查指標等。
傳統 RAG 系統可能無法有效連接這些關鍵點,它可能知道患者有頭痛、發燒等症狀,也知道某項檢查指標異常,但難以將這些分散的信息片段與醫學文獻中關於某種罕見病的特徵描述進行關聯,從而無法爲醫生提供一個完整、準確的診斷建議。
爲了解決這些問題,2024 年 4 月微軟研究團隊發表了一篇論文《From Local to Global: A Graph RAG Approach to Query-Focused Summarization》論文中微軟的研究人員提出了一種從文本構建並增強知識圖的方法,即 GraphRAG(Graph-based Retrieval-Augmented Generation)。
GraphRAG - 圖結構的智慧
Graph RAG 中的 Graph 指的是知識圖譜 —— Knowledge Graph, KGs。一個用來表示實體及其相互關係的結構化圖形數據模型。在 Graph 中,節點(Nodes) 代表實體如人、地點、事件等;邊(Edges)則代表這些實體之間的關係,(如人物關係、地理位置等)。
GraphRAG 是一種結合了知識圖譜的檢索增強生成框架,是對傳統 RAG 實現的一種改進,專注於從圖結構數據中檢索信息。
GraphRAG 工作流程
GraphRAG 將文本構建爲知識圖譜,將信息表示爲實體和關係的互聯網絡。通過圖遍歷算法遍歷圖中的節點和邊即 KG 中的結構化信息,能夠捕捉和利用信息片段之間的複雜關係,以及在檢索和生成階段利用這些結構化信息。爲用戶提供更準確、相關和多樣化的檢索結果。
GraphRAG 的工作流程主要包括三個階段:基於圖的索引(Graph-Based Indexing)、圖引導檢索(Graph-Guided Retrieval)和圖增強生成(Graph-Enhanced Generation)。
-
• 索引階段,利用 LLM 來自動化構建知識圖譜,提取出對應的節點(如實體)、邊(如關係)和協變量(如主張),然後利用社區發現技術(如 Leiden 算法)對整個知識圖譜進行子圖劃分,然後自底而上對子圖利用 LLM 進行摘要、總結;
-
• 檢索階段,根據用戶查詢提取最相關的圖元素;
-
• 生成階段,利用檢索到的圖數據彙總生成答案。
GraphRAG 有兩種主要方法:
-
• 基於知識圖譜的 GraphRAG
從文本中提取三元組(主體、關係、客體),並通過多跳鄰居檢索信息。
例如,如果你詢問 “愛因斯坦的導師是誰?”,GraphRAG 會從知識圖譜中找到“愛因斯坦” 這個節點,然後通過 “導師” 關係找到 “赫爾曼 · 閔可夫斯基” 這個實體。 -
• 基於社區的 GraphRAG
在知識圖譜的基礎上構建層次化社區,並從社區中檢索信息。這種方法特別適合處理多跳問題和需要全局視角的任務。
例如,在處理 “愛因斯坦的導師的導師是誰?” 這樣的多跳問題時,基於社區的 GraphRAG 能夠通過社區的層次結構,逐步檢索出 “愛因斯坦” 的導師的導師:“卡爾 · 弗里德里希 · 高斯”。
Jeong Yitae 撰文《From RAG to GraphRAG , What is the GraphRAG and why i use it?》,總結了 Graph RAG 的不足:GraphRAG 和 RAG 一樣,具有明顯的侷限性,包括如何形成圖形、生成查詢這些圖形的查詢,以及最終根據這些查詢決定要檢索多少信息。
1. 信息抽取:如何構建高質量的知識圖譜?
信息抽取是構建圖索引的關鍵步驟,需從原始文本中提取結構化信息(如實體、關係、屬性等),並將其轉化爲知識圖譜(KG)中的節點和邊。若信息抽取不準確或不完整,後續的圖構建、檢索和查詢結果的不準確。例如:
-
• 實體識別複雜性
未能正確識別文本中的關鍵實體(如 “收入增長” 與“市場策略”),導致圖中節點缺失或錯誤關聯。 -
• 關係提取準確性
無法捕捉隱含的因果關係或邏輯關係(如 “產品銷量下降” 與“供應鏈問題”之間的聯繫),影響圖的語義完整性。
2. 查詢生成:如何在知識圖譜上的生成全面性和準確性的回答?
查詢生成是指模型根據用戶原始查詢生成子查詢,以驅動對圖中相關節點和邊的檢索。然而,原始查詢生成子查詢存在以下挑戰:
-
• 子查詢覆蓋不全
模型可能無法生成足夠多或足夠精準的子查詢,導致關鍵信息未被檢索到。例如,用戶詢問 “數據中的前 5 個主題”,但生成的子查詢未能覆蓋所有潛在主題的關鍵詞。 -
• 語義理解偏差
若原始查詢的意圖複雜(如需要多條件組合或跨領域關聯),生成的子查詢可能無法準確捕捉深層語義。
3. 推理邊界:如何平衡 “信息充分性” 與“計算效率”?
推理邊界指在信息檢索過程中如何平衡 “信息充分性” 與“計算效率”。具體挑戰包括:
-
• 信息篩選困難:如何確定哪些信息是 “關鍵” 且“相關”的,需要複雜的策略(如基於置信度或權重排序),但現有方法可能無法有效實現。
-
• 信息過載風險 :若檢索範圍過大(如包含過多相關節點和邊),會增加計算負擔,導致系統推理速度下降和響應速度。例如,處理大規模文檔時,若未合理限制檢索規模,模型可能因處理海量數據而失效。
KAG - 知識增強生成
雖然 RAG 技術實現了特定域應用程序的高效構建。但是也有侷限性,包括向量相似性與知識推理相關性之間的差距,以及對知識邏輯的不敏感如數值、時間關係、專家規則等,都阻礙了尤其是在法律、醫學和科學等需要分析推理的專業領域服務的有效性。
爲了解決以上問題,螞蟻集團知識圖譜團隊和浙江大學的撰寫的論文《KAG: Boosting LLMs in Professional Domains via Knowledge Augmented Generation》,提出了知識增強生成(Knowledge Augmented Generation,KAG)框架,該框架旨在充分利用知識圖譜和向量檢索的優勢,提升大語言模型在專業領域的表現。KAG 框架充分利用知識圖譜和 RAG 技術的互補優勢。不僅將圖結構整合到知識庫,還將知識圖譜的語義類型、關係以及知識圖譜問答(KGQA)中常用的邏輯形式整合到檢索和生成過程中。
論文對 KAG 的定位是專業領域知識增強服務框架,同時提到一個非常重要的觀點:一個專業的知識服務框架須具備 3 個重要特點:
-
• 具備知識的準確性:包括知識邊界、知識結構的完整性和語義的清晰性
-
• 具備邏輯嚴謹性、時間敏感性和數字敏感性
-
• 完備的上下文信息,以方便在知識決策時獲取完備的支持信息
KAG 框架通過對當前大語言模型與知識圖譜結合,對以下五個方面進行了增強:
-
• 對 LLM 友好的知識表示增強
-
• 知識圖譜與原文片段之間的互索引結構
-
• 邏輯符號引導的混合推理引擎
-
• 基於語義推理的知識對齊機制
-
• KAG 模型
KAG 框架
KAG 框架由三個部分組成:KAG-Builder、KAG-Solver 和 KAG-Model。
-
• KAG-Builder
專爲構建離線索引而設計,提出了一個 LLM 友好知識表示框架以及知識結構和文本塊之間的相互索引。 -
• KAG-Solver
引入了一個邏輯形式引導的混合推理求解器,它集成了 LLM 推理、知識推理和數理邏輯推理。
此外,通過語義推理進行知識對齊用於提高 KAG-Builder 和 KAG-Solver 中知識表示和檢索的準確性。 -
• KAG-Model
基於通用語言模型,針對每個模塊所需的特定能力進行優化,從而全面提升所有模塊性能。
KAG 框架設計思路是必須從受約束的知識庫出發,去構建圖譜或做邏輯推理。在一定程度上緩解大模型領域知識缺失以及幻覺的問題。
目前框架處於早期快速迭代階段,在功能具體實現方面應該還是存在一定的優化提升空間,需要團隊在實際業務場景中檢驗和迭代。
據螞蟻集團知識圖譜團隊分享,KAG 已在電子政務、電子醫療進行的應用,表現的還不錯。
Agentic RAG 破局
智能體檢索增強生成(Agentic RAG)通過將自主人工智能智能體嵌入 RAG 流程,克服了這些侷限性。Agentic RAG 利用智能體設計模式(反思、規劃、工具使用和多智能體協作)來動態管理檢索策略,迭代完善上下文理解,並通過從順序步驟到自適應協作等明確定義的操作結構來調整工作流程,在複雜任務中實現閉環的檢索 - 加工 - 驗證 - 優化,來提高決策能力和適應性。
比如當對於”2025 年政府工作報告中 [人工智能 +] 政策對就業與科技發展的綜合影響“複雜綜合分析時,Agentic RAG 能夠有效整合多源信息並進行多步深度推理、修正優化,給出完整的分析報告。而傳統的 RAG、GraphRAG 是難以企及的。
Agentic RAG 框架
Agentic RAG 如何工作?
智能體智能是 Agentic RAG 系統的基礎,使它們能夠超越傳統 RAG 的靜態和被動性質。通過集成能夠進行動態決策、迭代推理和協作工作流程的自主智能體,確保系統能夠精確且可擴展地處理複雜的現實任務。在處理複雜業務場景時,Agentic RAG 系統展現出更強的適應性和精確性。
- • 大語言模型(具有定義的角色和任務)
作爲智能體的主要推理引擎和對話接口。它解釋用戶查詢、生成回覆並保持連貫性。
- • 記憶(短期和長期)
在交互過程中捕捉上下文和相關數據。短期記憶跟蹤即時對話狀態,而長期記憶存儲積累的知識和智能體經驗。
- • 規劃(反思與自我批判)
通過反思、查詢路由或自我批判指導智能體的迭代推理過程,確保複雜任務能被有效地分解。
- • 工具(向量搜索、網絡搜索、API 等)
擴展智能體的能力,使其超越文本生成,能夠訪問外部資源、實時數據或進行專門的計算。
Agentic RAG 架構
Agentic RAG 的核心是 Agent,可以根據複雜度的不同進行擴展,分爲不同的架構框架。這些框架包括單智能體架構(Single-Agent RAG)、多智能體系統(Multi-Agent RAG)。每個框架都針對特定的挑戰進行了優化,以適應不同應用場景的性能需求。
單智能體 RAG(Single-Agent RAG,Router)
單智能體智 RAG 作爲一個集中式決策系統,由單個智能體管理信息的檢索、路由和集成。這種架構通過將這些任務整合到一個統一的智能體中,簡化了系統,使其特別適用於工具或數據源數量有限的設置。
單智能體 RAG 工作流程
1. 查詢提交與評估
用戶提交查詢後,協調智能體(或主檢索智能體)接收查詢並進行分析,以確定最合適的信息來源。
2. 知識源選擇
根據查詢類型,協調智能體從多種檢索選項中進行選擇:
-
• 結構化數據庫
對於需要訪問表格數據的查詢,系統可能使用與 PostgreSQL 或 MySQL 等數據庫交互的文本轉 SQL 引擎。 -
• 語義搜索
處理非結構化信息時,它使用基於向量的檢索來獲取相關文檔(如 PDF、書籍、組織記錄)。 -
• 網絡搜索
爲獲取實時或廣泛的上下文信息,系統利用網絡搜索工具訪問最新的在線數據。 -
• 推薦系統
針對個性化或上下文相關的查詢,系統調用推薦引擎,提供定製化的建議。
3. 數據集成與大語言模型合成
從選定的來源檢索到相關數據後,將其傳遞給大語言模型。大語言模型對收集到的信息進行合成,將多個來源的見解整合爲連貫且與上下文相關的回覆。
4. 輸出生成
最後,系統提供一個全面的、面向用戶的答案,回答原始查詢。該回復以可行、簡潔的格式呈現,並可選擇包含對所用來源的引用或參考。
單智能體 RAG 關鍵特徵和優勢:
-
• 集中式簡單性
單個智能體處理所有檢索和路由任務,使架構的設計、實現和維護都很直接。 -
• 效率與資源優化
由於智能體數量較少且協調簡單,系統所需的計算資源較少,能夠更快地處理查詢。 -
• 動態路由
智能體實時評估每個查詢,選擇最合適的知識源(如結構化數據庫、語義搜索、網絡搜索)。 -
• 工具通用性
支持多種數據源和外部 API,適用於結構化和非結構化工作流程。 -
• 適用於簡單系統
適合具有明確任務或有限集成需求的應用(如文檔檢索、基於 SQL 的工作流程)。
多智能體 RAG 系統(Multi-Agent RAG)
多智能體 RAG 是單智能體架構的模塊化、可擴展的演進,旨在通過利用多個專門的智能體來處理複雜的工作流程和多樣化的查詢類型。該系統不再依賴單個智能體來管理所有任務(推理、檢索和回覆生成),而是將職責分配給多個智能體,每個智能體針對特定的角色或數據源進行了優化。
多智能體 RAG 工作流程:
1. 查詢提交
流程從用戶查詢開始,由協調智能體或主檢索智能體接收。這個智能體作爲中央協調器,根據查詢的要求將查詢分配給專門的檢索智能體。
2. 專門的檢索智能體
查詢被分配到多個檢索智能體,每個智能體專注於特定類型的數據來源或任務。例如:
-
• 智能體 1:處理結構化查詢,如與基於 SQL 的數據庫(如 PostgreSQL 或 MySQL)進行交互。
-
• 智能體 2:管理語義搜索,從 PDF、書籍或內部記錄等來源檢索非結構化數據。
-
• 智能體 3:專注於從網絡搜索或 API 檢索實時公共信息。
-
• 智能體 4:專門處理推薦系統,根據用戶行爲或配置文件提供上下文感知的建議。
3. 工具訪問與數據檢索
每個智能體將查詢路由到其領域內適當的工具或數據源,如:
-
• 向量搜索:用於語義相關性檢索。
-
• 文本轉 SQL:用於結構化數據檢索。
-
• 網絡搜索:用於獲取實時公共信息。
-
• API:用於訪問外部服務或專有系統。 檢索過程並行執行,以便高效處理各種查詢類型。
4. 數據集成與大語言模型合成
檢索完成後,所有智能體的數據都被傳遞給大語言模型。大語言模型將檢索到的信息合成爲連貫且與上下文相關的回覆,無縫整合多個來源的見解。
5. 輸出生成
系統生成全面的回覆,並以可行、簡潔的格式返回給用戶。
多智能體 RAG 關鍵特徵和優勢:
-
• 模塊化:每個智能體獨立運行,允許根據系統需求無縫添加或刪除智能體。
-
• 可擴展性:多個智能體的並行處理使系統能夠高效處理高查詢量。
-
• 任務專業化:每個智能體針對特定類型的查詢或數據源進行了優化,提高了準確性和檢索相關性。
-
• 效率:通過將任務分配給專門的智能體,系統減少了瓶頸,提高了複雜工作流程的性能。
-
• 通用性:適用於多個領域的應用,包括研究、分析、決策和客戶支持。
多智能體 RAG 挑戰:
-
• 協調複雜性:管理智能體之間的通信和任務分配需要複雜的協調機制。
-
• 可擴展性與延遲:擴展 Agentic RAG 系統以處理大規模數據集和高頻查詢,同時不降低性能。解決多代理和圖工作流中的延遲問題。
-
• 擴展多模態能力:整合文本、圖像、音頻和視頻數據,以生成更豐富和全面的輸出。
-
• 倫理與負責任的 AI:在醫療和金融等敏感領域確保無偏見的檢索和決策。解決數據隱私問題,構建符合倫理標準的透明系統。
儘管 Agentic RAG 系統在技術實現層面仍面臨着諸多的挑戰,但是其通過如下 3 方面突破性進展,一定會成爲應對複雜問題的新利器。
-
- 交互範式完成了從被動響應到主動預測的轉型,系統能夠基於上下文深度理解主動預判用戶需求;2. 檢索機制實現了由單次關鍵詞匹配向多輪動態調整的跨越,通過實時反饋循環構建起包含意圖識別、語義修正、結果優化的自我進化體系;
-
- 任務處理能力完成了從簡單事實問答到複雜認知任務的質變突破,可支持多模態數據分析、跨領域知識推理、結構化報告生成等高端智能服務。
相信在不久將來 Agentic RAG 能夠像人類專家一樣,在面對複雜問題時不僅給出答案,更能給出詳細的推理過程和執行細節在內的一整套完整方案。
小結
Jerry Liu(LlamaIndex CEO)在報告《Beyond RAG: Building Advanced Context-Augmented LLM Applications》中也提出了 RAG 的未來是 Agent 相似觀點。無論是 RAG for Agents 還是 Agents for RAG,亦或是從 RAG 到 Graph RAG 再到 Agents,在可見的未來,Agent 將成爲推動 AI 應用發展的核心力量。
參考
1.《From Local to Global: A Graph RAG Approach to Query-Focused Summarization》https://arxiv.org/abs/2404.16130
2.《From RAG to GraphRAG , What is the GraphRAG and why i use it?》https://jeongiitae.medium.com/from-rag-to-graphrag-what-is-the-graphrag-and-why-i-use-it-f75a7852c10c
3.《KAG: Boosting LLMs in Professional Domains via Knowledge Augmented Generation》
https://arxiv.org/abs/2409.13731
4.https://github.com/OpenSPG/KAG
5.《Agentic Retrieval-Augmented Generation: A Survey on Agentic RAG》https://arxiv.org/abs/2501.09136
6.https://weaviate.io/blog/what-is-agentic-rag
本文由 Readfog 進行 AMP 轉碼,版權歸原作者所有。
來源:https://mp.weixin.qq.com/s/SJwe1lB6qNaLbZPSdeJOLg