LLM Agent 和 Agentic RAG 的最佳綜述
論文鏈接:https://arxiv.org/abs/2501.09136
Github 倉庫:https://github.com/asinghcsu/AgenticRAG-Survey
下面很多鏈接在這個 Github 倉庫,大家通過訪問 Github 倉庫訪問更多資料。
摘要
代理式檢索增強生成(Agentic RAG)通過在 RAG 管道中嵌入自主代理,代表了人工智能領域的重大飛躍。本倉庫補充了綜述論文《代理式檢索增強生成(Agentic RAG):綜述》,提供了以下方面的見解:
-
基礎原理,包括代理模式,如反思、規劃、工具使用和多代理協作。
-
Agentic RAG 系統的詳細分類,展示了單代理、多代理、分層、糾正、自適應和圖基 RAG 等框架。
-
傳統 RAG、Agentic RAG 和代理式文檔工作流(ADW)的比較分析,突出它們的優勢、劣勢和最佳適用場景。
-
跨行業的實際應用,如醫療、教育、金融和法律分析。
-
挑戰和未來方向,涉及擴展性、倫理 AI、多模態集成和人機協作。
目錄
-
📜 摘
-
🧩 引言
-
🤖 代理模式
-
🛠️ Agentic RAG 系統的分類
-
🔍 Agentic RAG 框架的比較分析
-
💼 應用
-
🚧 挑戰與未來方向
-
🛠️ RAG 代理分類的實現:技術與工具
-
📰 關於 Agentic RAG 的博客和教程
-
🖊️ 值得注意的相關概念
-
💡 Agentic RAG 的實際實現與用例
-
📚 參考文獻
-
🖊️ 如何引用
引言
檢索增強生成(RAG)系統結合了大型語言模型(LLMs)和檢索機制,生成上下文相關且準確的響應。雖然傳統 RAG 系統在知識檢索和生成方面表現出色,但在處理動態、多步推理任務、適應性和複雜工作流的編排方面往往存在不足。
代理式檢索增強生成(Agentic RAG)通過集成自主 AI 代理克服了這些限制。這些代理採用核心的代理模式,如反思、規劃、工具使用和多代理協作,動態適應任務特定需求,並在以下方面提供卓越性能:
-
多領域知識檢索。
-
實時、以文檔爲中心的工作流。
-
可擴展、自適應和符合倫理的 AI 系統。
本文探討了從 RAG 到 Agentic RAG 的演進,展示了:
-
代理模式:驅動系統適應性和智能的核心原則。
-
分類:Agentic RAG 架構的全面分類。
-
比較分析:傳統 RAG、Agentic RAG 和 ADW 之間的關鍵差異。
-
應用:跨醫療、教育、金融等領域的實際用例。
-
挑戰與未來方向:解決擴展性、倫理 AI 和多模態集成問題。
無論您是研究人員、開發者還是實踐者,本倉庫都提供了寶貴的見解和資源,幫助您理解和推進 Agentic RAG 系統。
檢索增強生成中的代理模式
Agentic RAG 系統的智能和適應性來源於定義明確的代理模式。這些模式使代理能夠處理複雜的推理任務,適應動態環境,並有效協作。以下是 Agentic RAG 的核心模式:
1. 反思
-
定義:代理評估自己的決策和輸出,識別錯誤和改進空間。
-
關鍵優勢:
-
支持結果的迭代優化。
-
提高多步推理任務的準確性。
-
示例:在醫療診斷系統中,代理根據檢索到的數據迭代反饋優化診斷結果。
2. 規劃
-
定義:代理創建結構化工作流和任務序列,以高效解決問題。
-
關鍵優勢:
-
通過分解任務促進多步推理。
-
通過優化任務優先級減少計算開銷。
-
示例:金融分析系統規劃數據檢索任務以評估風險並提供建議。
3. 工具使用
-
定義:代理與外部工具、API 和知識庫交互,檢索和處理數據。
-
關鍵優勢:
-
擴展系統能力,超越預訓練知識。
-
通過集成外部資源支持特定領域的應用。
-
示例:法律助理代理從合同數據庫中檢索條款,並應用領域特定規則進行合規分析。
4. 多代理協作
-
定義:多個代理協作分工,共享信息和結果,以解決複雜任務。
-
關鍵優勢:
-
高效處理大規模和分佈式問題。
-
結合專業化代理能力以獲得更好的結果。
-
示例:在客戶支持中,代理協作從 FAQ 中檢索知識、生成響應並提供後續跟進。
代理模式的意義
這些模式構成了 Agentic RAG 系統的核心,使其能夠:
-
動態適應任務需求。
-
通過自我評估改進決策。
-
利用外部資源進行領域特定推理。
-
通過協作處理複雜的分佈式工作流。
Agentic RAG 系統的分類
代理式檢索增強生成(RAG)系統涵蓋了多種架構和工作流,每種架構都針對特定任務和複雜性級別進行了優化。以下是這些系統的詳細分類:
1. 單代理 RAG
-
核心思想:單個自主代理管理檢索和生成過程。
-
工作流:
-
查詢提交給代理。
-
代理從外部源檢索相關數據。
-
數據處理併合成爲響應。
-
優勢:
-
適用於基本用例的簡單架構。
-
易於實施和維護。
-
侷限性:
-
擴展性有限。
-
對多步推理或大數據集效果不佳。
2. 多代理 RAG
-
核心思想:多個代理協作執行復雜的檢索和推理任務。
-
工作流:
-
代理動態分配任務(如檢索、推理、合成)。
-
每個代理專注於特定子任務。
-
結果彙總併合成爲連貫輸出。
-
優勢:
-
在分佈式、多步任務中表現更好。
-
模塊化和擴展性增強。
-
侷限性:
-
代理數量增加時協調複雜性增加。
-
代理之間可能存在冗餘或衝突。
3. 分層代理 RAG
-
核心思想:將代理組織爲層次結構,以更好地進行任務優先級和委派。
-
工作流:
-
頂層代理協調子任務給下層代理。
-
每個下層代理處理流程的特定部分。
-
結果在更高層次上迭代優化和集成。
-
優勢:
-
適用於大規模和複雜任務。
-
模塊化設計便於專業化。
-
侷限性:
-
需要複雜的協調機制。
-
高層可能存在瓶頸。
4. 糾正代理 RAG
-
核心思想:通過反饋循環使代理能夠迭代評估和優化其輸出。
-
工作流:
-
代理生成初始響應。
-
批評模塊評估響應的錯誤或不一致性。
-
代理根據反饋優化響應。
-
重複步驟 2-3,直到輸出達到質量標準。
-
優勢:
-
通過迭代改進實現高準確性和可靠性。
-
適用於易出錯或高風險任務。
-
侷限性:
-
計算開銷增加。
-
反饋機制需精心設計以避免無限循環。
5. 自適應代理 RAG
-
核心思想:根據任務需求動態調整檢索策略和工作流。
-
工作流:
-
代理評估查詢及其上下文。
-
根據可用數據和用戶需求實時調整檢索策略。
-
使用動態工作流合成響應。
-
優勢:
-
對多樣化任務和動態環境具有高度靈活性。
-
提高上下文相關性和用戶滿意度。
-
侷限性:
-
設計穩健的自適應機制具有挑戰性。
-
實時調整的計算開銷較大。
6. 圖基代理 RAG
圖基 RAG 系統通過集成圖數據結構進行高級推理,擴展了傳統 RAG。
6.1 Agent-G:圖 RAG 的代理框架
-
核心思想:使用圖知識庫和反饋循環動態分配任務給專業化代理。
-
工作流:
-
從圖知識庫中提取關係(如疾病到症狀的映射)。
-
補充來自外部源的非結構化數據。
-
使用批評模塊驗證結果並迭代優化。
-
優勢:
-
結合結構化和非結構化數據。
-
模塊化且適用於複雜任務。
-
通過迭代優化確保高準確性。
6.2 GeAR:圖增強代理 RAG
-
核心思想:通過圖擴展技術和代理架構增強 RAG 系統。
-
工作流:
-
擴展與查詢相關的圖以增強關係理解。
-
利用專業化代理進行多跳推理。
-
將圖結構化和非結構化信息合成爲響應。
-
優勢:
-
在多跳推理場景中表現出色。
-
提高深度上下文任務的準確性。
-
動態適應複雜查詢環境。
7. 代理式文檔工作流(ADW)
代理式文檔工作流(ADW)通過智能代理自動化以文檔爲中心的流程,擴展了傳統 RAG 系統。
工作流
- 文檔解析與結構化:
- 從發票或合同等文檔中提取結構化數據。
- 狀態維護:
- 在多步工作流中跟蹤上下文以確保一致性。
- 知識檢索:
- 從外部源或領域特定數據庫中檢索相關參考。
- 代理編排:
- 應用業務規則,執行多跳推理,並編排外部 API。
- 可操作輸出生成:
- 生成針對特定用例的結構化輸出(如報告或摘要)。
關鍵特性與優勢
-
狀態維護:確保多步工作流的一致性。
-
領域特定智能:適應特定領域的定製規則。
-
擴展性:高效處理大規模文檔處理。
-
增強生產力:減少人工工作量並增強人類專業知識。
可視化表示
- 單代理 RAG 圖
- 多代理 RAG 圖
- 分層 RAG 工作流
- 基於圖的 RAG 工作流
- ADW 工作流
Agentic RAG 框架的比較分析
下表提供了三種架構框架的全面比較分析:傳統 RAG、Agentic RAG 和代理式文檔工作流(ADW)。該分析突出了它們各自的優勢、劣勢和最佳適用場景,爲跨多樣化用例的適用性提供了寶貴見解。
關鍵要點
-
傳統 RAG 最適合需要基本檢索和生成能力的簡單任務。
-
Agentic RAG 在多代理協作推理中表現出色,適用於更復雜的多領域任務。
-
代理式文檔工作流(ADW) 爲企業級應用(如合同分析和發票處理)提供了定製的文檔中心解決方案。
應用
代理式檢索增強生成(RAG)系統在多個行業中具有變革性潛力,能夠實現智能檢索、多步推理和動態適應複雜任務。以下是 Agentic RAG 系統產生重大影響的關鍵領域:
1. 醫療與個性化醫學
-
問題:快速檢索和合成醫學知識以支持診斷、治療計劃和研究。
-
應用:
-
利用多模態數據(如患者記錄、醫學文獻)的臨牀決策支持系統。
-
自動化生成帶有相關上下文參考的醫療報告。
-
多跳推理分析複雜關係(如疾病到症狀的映射或治療到結果的相關性)。
2. 教育與個性化學習
-
問題:爲多樣化學習者提供個性化和適應性學習體驗。
-
應用:
-
設計能夠實時檢索知識和提供個性化反饋的智能導師。
-
根據學生進度和偏好生成定製教育內容。
-
多代理系統用於協作學習模擬。
3. 法律與合同分析
-
問題:分析複雜的法律文檔並提取可操作的見解。
-
應用:
-
合同摘要和條款比較,與法律標準進行上下文對齊。
-
檢索先例案例和法規指南以確保合規性。
-
迭代工作流
挑戰與未來方向
儘管代理增強檢索生成(Agentic RAG)系統展現出巨大的潛力,但仍存在一些未解決的挑戰和研究機會:
挑戰
- 多代理系統中的協調複雜性:
-
管理多個代理之間的通信和協作可能導致效率低下和計算開銷增加。
-
平衡任務分配和解決代理之間的衝突仍然是一個關鍵問題。
- 倫理與負責任的 AI:
-
在醫療和金融等敏感領域確保無偏見的檢索和決策。
-
解決數據隱私問題,構建符合倫理標準的透明系統。
- 可擴展性與延遲:
-
擴展 Agentic RAG 系統以處理大規模數據集和高頻查詢,同時不犧牲響應時間。
-
解決多代理和圖工作流中的延遲問題。
- 人機協作:
-
設計有效整合人類監督與自主代理的系統,以應對需要領域專業知識的任務。
-
在利用 AI 代理優勢的同時,保持用戶的信任和控制。
- 擴展多模態能力:
-
整合文本、圖像、音頻和視頻數據,以生成更豐富和全面的輸出。
-
處理實時應用中的多模態推理複雜性。
未來方向
- 增強的代理協調:
-
開發更強大的協調框架,用於分層和多代理系統。
-
引入自適應學習機制,動態改進任務分配。
- 領域特定應用:
- 爲法律分析、個性化教育和高級科學研究等特定領域定製 Agentic RAG 系統。
- 倫理 AI 與治理框架:
-
構建工具以監控、解釋和減輕 AI 輸出中的偏見。
-
制定高風險環境中倫理部署的政策和指南。
- 高效的圖推理:
-
優化大規模實際應用中的圖工作流。
-
探索結合圖推理與神經網絡的混合方法。
- 人機協同:
-
設計直觀的界面和工作流,使人類能夠有效地與 Agentic RAG 系統交互。
-
關注可解釋性和以用戶爲中心的設計。
RAG 代理分類的實現:技術與工具
關於 Agentic RAG 的博客和教程
-
DeepLearning.AI: 代理如何提高 LLM 性能。DeepLearning.AI
-
Weaviate 博客: 什麼是 Agentic RAG?Weaviate 博客
-
LangGraph CRAG 教程: LangGraph CRAG: 上下文檢索增強生成教程。LangGraph CRAG
-
LangGraph 自適應 RAG 教程: LangGraph 自適應 RAG: 自適應檢索增強生成教程。LangGraph 自適應 RAG. 訪問日期: 2025-01-14.
-
LlamaIndex 博客: 使用 LlamaIndex 的 Agentic RAG。LlamaIndex 博客
-
Hugging Face Cookbook. Agentic RAG: 通過查詢重構和自查詢加速檢索增強生成。Hugging Face Cookbook
-
Hugging Face Agentic RAG: https://huggingface.co/docs/smolagents/en/examples/rag
-
Qdrant 博客. Agentic RAG: 結合 RAG 與代理以增強信息檢索。Qdrant 博客
-
Semantic Kernel: Semantic Kernel 是微軟的開源 SDK,集成了大語言模型(LLMs)到應用程序中。它支持代理模式,能夠創建自主 AI 代理,用於自然語言理解、任務自動化和決策。它已在 ServiceNow 的 P1 事件管理等場景中使用,以促進實時協作、自動化任務執行和無縫檢索上下文信息。
-
GitHub - 使用 Semantic Kernel 的 RAG
-
GitHub - Semantic Kernel
-
ServiceNow 案例研究
Agentic RAG 的實際應用與用例
-
AWS 機器學習博客. Twitch 如何使用 Agentic 工作流與 RAG 在 Amazon Bedrock 上加速廣告銷售。AWS 機器學習博客
-
LlamaCloud 演示庫. 使用 LlamaCloud 的患者案例摘要工作流。GitHub 2025. 訪問日期: 2025-01-13.
-
LlamaCloud 演示庫. 使用 LlamaCloud 的合同審查工作流。GitHub
-
LlamaCloud 演示庫. 使用 LlamaCloud 的汽車保險索賠工作流。GitHub
-
LlamaCloud 演示庫. 使用 LlamaCloud 的研究論文報告生成工作流。GitHub
值得注意的相關概念
-
代理設計模式第 1 部分
-
代理設計模式第 2 部分,反思
-
代理設計模式第 3 部分,工具使用
-
代理設計模式第 4 部分,規劃
-
代理設計模式第 5 部分,多代理協作
-
使用 LlamaIndex 構建 Agentic RAG
-
使用 AutoGen 的 AI 代理設計模式
-
LangGraph Agentic RAG
參考文獻
關於 Agentic RAG 的研究論文
1. 單代理 RAG(基於路由器)
- Search-o1: 代理增強搜索的大推理模型 https://arxiv.org/abs/2501.05366
2. 多代理 RAG
- 用於時間序列分析的代理增強檢索生成 https://arxiv.org/abs/2408.14484
3. 糾正 RAG
-
企業系統的代理 AI 驅動技術故障排除 https://arxiv.org/abs/2412.12006
-
糾正 RAG (CRAG) https://langchain-ai.github.io/langgraph/tutorials/rag/langgraph_crag/
-
糾正檢索增強生成 https://arxiv.org/abs/2401.15884
-
企業系統的代理 AI 驅動技術故障排除 https://arxiv.org/abs/2412.12006
4. 自適應 RAG
-
Langgraph 自適應 RAG https://langchain-ai.github.io/langgraph/tutorials/rag/langgraph_adaptive_rag/
-
MBA-RAG: 一種基於 Bandit 的自適應檢索增強方法 https://arxiv.org/abs/2412.01572
-
CtrlA: 通過內在控制的自適應檢索增強生成 https://arxiv.org/abs/2405.18727
-
Adaptive-RAG: 通過問題複雜性學習適應檢索增強大語言模型 https://arxiv.org/abs/2403.14403
-
AT-RAG: 一種通過主題過濾和迭代推理增強查詢效率的自適應 RAG 模型 https://arxiv.org/abs/2410.12886
5. 圖增強 RAG
-
GeAR: 圖增強的檢索增強生成代理 https://arxiv.org/abs/2412.18431
-
Agent-G: 一種圖檢索增強生成的代理框架 https://openreview.net/forum?id=g2C947jjjQ
本文由 Readfog 進行 AMP 轉碼,版權歸原作者所有。
來源:https://mp.weixin.qq.com/s/c1YyvFKx4dQ4QPJ5g5Oq4w