LLM Agent 和 Agentic RAG 的最佳綜述

論文鏈接：https://arxiv.org/abs/2501.09136

Github 倉庫：https://github.com/asinghcsu/AgenticRAG-Survey

下面很多鏈接在這個 Github 倉庫，大家通過訪問 Github 倉庫訪問更多資料。

摘要

代理式檢索增強生成（Agentic RAG）通過在 RAG 管道中嵌入自主代理，代表了人工智能領域的重大飛躍。本倉庫補充了綜述論文《代理式檢索增強生成（Agentic RAG）：綜述》，提供了以下方面的見解：

基礎原理，包括代理模式，如反思、規劃、工具使用和多代理協作。
Agentic RAG 系統的詳細分類，展示了單代理、多代理、分層、糾正、自適應和圖基 RAG 等框架。
傳統 RAG、Agentic RAG 和代理式文檔工作流（ADW）的比較分析，突出它們的優勢、劣勢和最佳適用場景。
跨行業的實際應用，如醫療、教育、金融和法律分析。
挑戰和未來方向，涉及擴展性、倫理 AI、多模態集成和人機協作。

📜 摘
🧩 引言
🤖 代理模式
🛠️ Agentic RAG 系統的分類
🔍 Agentic RAG 框架的比較分析
💼 應用
🚧 挑戰與未來方向
🛠️ RAG 代理分類的實現：技術與工具
📰 關於 Agentic RAG 的博客和教程
🖊️ 值得注意的相關概念
💡 Agentic RAG 的實際實現與用例
📚 參考文獻
🖊️ 如何引用

引言

檢索增強生成（RAG）系統結合了大型語言模型（LLMs）和檢索機制，生成上下文相關且準確的響應。雖然傳統 RAG 系統在知識檢索和生成方面表現出色，但在處理動態、多步推理任務、適應性和複雜工作流的編排方面往往存在不足。

代理式檢索增強生成（Agentic RAG）通過集成自主 AI 代理克服了這些限制。這些代理採用核心的代理模式，如反思、規劃、工具使用和多代理協作，動態適應任務特定需求，並在以下方面提供卓越性能：

多領域知識檢索。
實時、以文檔爲中心的工作流。
可擴展、自適應和符合倫理的 AI 系統。

本文探討了從 RAG 到 Agentic RAG 的演進，展示了：

代理模式：驅動系統適應性和智能的核心原則。
分類：Agentic RAG 架構的全面分類。
比較分析：傳統 RAG、Agentic RAG 和 ADW 之間的關鍵差異。
應用：跨醫療、教育、金融等領域的實際用例。
挑戰與未來方向：解決擴展性、倫理 AI 和多模態集成問題。

無論您是研究人員、開發者還是實踐者，本倉庫都提供了寶貴的見解和資源，幫助您理解和推進 Agentic RAG 系統。

檢索增強生成中的代理模式

Agentic RAG 系統的智能和適應性來源於定義明確的代理模式。這些模式使代理能夠處理複雜的推理任務，適應動態環境，並有效協作。以下是 Agentic RAG 的核心模式：

1. 反思

定義：代理評估自己的決策和輸出，識別錯誤和改進空間。
關鍵優勢：
支持結果的迭代優化。
提高多步推理任務的準確性。
示例：在醫療診斷系統中，代理根據檢索到的數據迭代反饋優化診斷結果。

2. 規劃

定義：代理創建結構化工作流和任務序列，以高效解決問題。
關鍵優勢：
通過分解任務促進多步推理。
通過優化任務優先級減少計算開銷。
示例：金融分析系統規劃數據檢索任務以評估風險並提供建議。

3. 工具使用

定義：代理與外部工具、API 和知識庫交互，檢索和處理數據。
關鍵優勢：
擴展系統能力，超越預訓練知識。
通過集成外部資源支持特定領域的應用。
示例：法律助理代理從合同數據庫中檢索條款，並應用領域特定規則進行合規分析。

4. 多代理協作

定義：多個代理協作分工，共享信息和結果，以解決複雜任務。
關鍵優勢：
高效處理大規模和分佈式問題。
結合專業化代理能力以獲得更好的結果。
示例：在客戶支持中，代理協作從 FAQ 中檢索知識、生成響應並提供後續跟進。

代理模式的意義

這些模式構成了 Agentic RAG 系統的核心，使其能夠：

動態適應任務需求。
通過自我評估改進決策。
利用外部資源進行領域特定推理。
通過協作處理複雜的分佈式工作流。

Agentic RAG 系統的分類

代理式檢索增強生成（RAG）系統涵蓋了多種架構和工作流，每種架構都針對特定任務和複雜性級別進行了優化。以下是這些系統的詳細分類：

1. 單代理 RAG

核心思想：單個自主代理管理檢索和生成過程。
工作流：

查詢提交給代理。
代理從外部源檢索相關數據。
數據處理併合成爲響應。

優勢：
適用於基本用例的簡單架構。
易於實施和維護。
侷限性：
擴展性有限。
對多步推理或大數據集效果不佳。

2. 多代理 RAG

核心思想：多個代理協作執行復雜的檢索和推理任務。
工作流：

代理動態分配任務（如檢索、推理、合成）。
每個代理專注於特定子任務。
結果彙總併合成爲連貫輸出。

優勢：
在分佈式、多步任務中表現更好。
模塊化和擴展性增強。
侷限性：
代理數量增加時協調複雜性增加。
代理之間可能存在冗餘或衝突。

3. 分層代理 RAG

核心思想：將代理組織爲層次結構，以更好地進行任務優先級和委派。
工作流：

頂層代理協調子任務給下層代理。
每個下層代理處理流程的特定部分。
結果在更高層次上迭代優化和集成。

優勢：
適用於大規模和複雜任務。
模塊化設計便於專業化。
侷限性：
需要複雜的協調機制。
高層可能存在瓶頸。

4. 糾正代理 RAG

核心思想：通過反饋循環使代理能夠迭代評估和優化其輸出。
工作流：

代理生成初始響應。
批評模塊評估響應的錯誤或不一致性。
代理根據反饋優化響應。
重複步驟 2-3，直到輸出達到質量標準。

優勢：
通過迭代改進實現高準確性和可靠性。
適用於易出錯或高風險任務。
侷限性：
計算開銷增加。
反饋機制需精心設計以避免無限循環。

5. 自適應代理 RAG

核心思想：根據任務需求動態調整檢索策略和工作流。
工作流：

代理評估查詢及其上下文。
根據可用數據和用戶需求實時調整檢索策略。
使用動態工作流合成響應。

優勢：
對多樣化任務和動態環境具有高度靈活性。
提高上下文相關性和用戶滿意度。
侷限性：
設計穩健的自適應機制具有挑戰性。
實時調整的計算開銷較大。

6. 圖基代理 RAG

圖基 RAG 系統通過集成圖數據結構進行高級推理，擴展了傳統 RAG。

6.1 Agent-G：圖 RAG 的代理框架

核心思想：使用圖知識庫和反饋循環動態分配任務給專業化代理。
工作流：

從圖知識庫中提取關係（如疾病到症狀的映射）。
補充來自外部源的非結構化數據。
使用批評模塊驗證結果並迭代優化。

優勢：
結合結構化和非結構化數據。
模塊化且適用於複雜任務。
通過迭代優化確保高準確性。

6.2 GeAR：圖增強代理 RAG

核心思想：通過圖擴展技術和代理架構增強 RAG 系統。
工作流：

擴展與查詢相關的圖以增強關係理解。
利用專業化代理進行多跳推理。
將圖結構化和非結構化信息合成爲響應。

優勢：
在多跳推理場景中表現出色。
提高深度上下文任務的準確性。
動態適應複雜查詢環境。

7. 代理式文檔工作流（ADW）

代理式文檔工作流（ADW）通過智能代理自動化以文檔爲中心的流程，擴展了傳統 RAG 系統。

工作流

文檔解析與結構化：

從發票或合同等文檔中提取結構化數據。

狀態維護：

在多步工作流中跟蹤上下文以確保一致性。

知識檢索：

從外部源或領域特定數據庫中檢索相關參考。

代理編排：

應用業務規則，執行多跳推理，並編排外部 API。

可操作輸出生成：

生成針對特定用例的結構化輸出（如報告或摘要）。

關鍵特性與優勢

狀態維護：確保多步工作流的一致性。
領域特定智能：適應特定領域的定製規則。
擴展性：高效處理大規模文檔處理。
增強生產力：減少人工工作量並增強人類專業知識。

可視化表示

單代理 RAG 圖

多代理 RAG 圖

分層 RAG 工作流

基於圖的 RAG 工作流

ADW 工作流

Agentic RAG 框架的比較分析

下表提供了三種架構框架的全面比較分析：傳統 RAG、Agentic RAG 和代理式文檔工作流（ADW）。該分析突出了它們各自的優勢、劣勢和最佳適用場景，爲跨多樣化用例的適用性提供了寶貴見解。

KKgtzv

關鍵要點

傳統 RAG 最適合需要基本檢索和生成能力的簡單任務。
Agentic RAG 在多代理協作推理中表現出色，適用於更復雜的多領域任務。
代理式文檔工作流（ADW） 爲企業級應用（如合同分析和發票處理）提供了定製的文檔中心解決方案。

應用

代理式檢索增強生成（RAG）系統在多個行業中具有變革性潛力，能夠實現智能檢索、多步推理和動態適應複雜任務。以下是 Agentic RAG 系統產生重大影響的關鍵領域：

1. 醫療與個性化醫學

問題：快速檢索和合成醫學知識以支持診斷、治療計劃和研究。
應用：
利用多模態數據（如患者記錄、醫學文獻）的臨牀決策支持系統。
自動化生成帶有相關上下文參考的醫療報告。
多跳推理分析複雜關係（如疾病到症狀的映射或治療到結果的相關性）。

2. 教育與個性化學習

問題：爲多樣化學習者提供個性化和適應性學習體驗。
應用：
設計能夠實時檢索知識和提供個性化反饋的智能導師。
根據學生進度和偏好生成定製教育內容。
多代理系統用於協作學習模擬。

3. 法律與合同分析

問題：分析複雜的法律文檔並提取可操作的見解。
應用：
合同摘要和條款比較，與法律標準進行上下文對齊。
檢索先例案例和法規指南以確保合規性。
迭代工作流

挑戰與未來方向

儘管代理增強檢索生成（Agentic RAG）系統展現出巨大的潛力，但仍存在一些未解決的挑戰和研究機會：

挑戰

多代理系統中的協調複雜性：

管理多個代理之間的通信和協作可能導致效率低下和計算開銷增加。
平衡任務分配和解決代理之間的衝突仍然是一個關鍵問題。

倫理與負責任的 AI：

在醫療和金融等敏感領域確保無偏見的檢索和決策。
解決數據隱私問題，構建符合倫理標準的透明系統。

可擴展性與延遲：

擴展 Agentic RAG 系統以處理大規模數據集和高頻查詢，同時不犧牲響應時間。
解決多代理和圖工作流中的延遲問題。

人機協作：

設計有效整合人類監督與自主代理的系統，以應對需要領域專業知識的任務。
在利用 AI 代理優勢的同時，保持用戶的信任和控制。

擴展多模態能力：

整合文本、圖像、音頻和視頻數據，以生成更豐富和全面的輸出。
處理實時應用中的多模態推理複雜性。

未來方向

增強的代理協調：

開發更強大的協調框架，用於分層和多代理系統。
引入自適應學習機制，動態改進任務分配。

領域特定應用：

爲法律分析、個性化教育和高級科學研究等特定領域定製 Agentic RAG 系統。

倫理 AI 與治理框架：

構建工具以監控、解釋和減輕 AI 輸出中的偏見。
制定高風險環境中倫理部署的政策和指南。

高效的圖推理：

優化大規模實際應用中的圖工作流。
探索結合圖推理與神經網絡的混合方法。

人機協同：

設計直觀的界面和工作流，使人類能夠有效地與 Agentic RAG 系統交互。
關注可解釋性和以用戶爲中心的設計。

RAG 代理分類的實現：技術與工具

mYQkgd

關於 Agentic RAG 的博客和教程

DeepLearning.AI: 代理如何提高 LLM 性能。DeepLearning.AI
Weaviate 博客: 什麼是 Agentic RAG？Weaviate 博客
LangGraph CRAG 教程: LangGraph CRAG: 上下文檢索增強生成教程。LangGraph CRAG
LangGraph 自適應 RAG 教程: LangGraph 自適應 RAG: 自適應檢索增強生成教程。LangGraph 自適應 RAG. 訪問日期: 2025-01-14.
LlamaIndex 博客: 使用 LlamaIndex 的 Agentic RAG。LlamaIndex 博客
Hugging Face Cookbook. Agentic RAG: 通過查詢重構和自查詢加速檢索增強生成。Hugging Face Cookbook
Hugging Face Agentic RAG: https://huggingface.co/docs/smolagents/en/examples/rag
Qdrant 博客. Agentic RAG: 結合 RAG 與代理以增強信息檢索。Qdrant 博客
Semantic Kernel: Semantic Kernel 是微軟的開源 SDK，集成了大語言模型（LLMs）到應用程序中。它支持代理模式，能夠創建自主 AI 代理，用於自然語言理解、任務自動化和決策。它已在 ServiceNow 的 P1 事件管理等場景中使用，以促進實時協作、自動化任務執行和無縫檢索上下文信息。

GitHub - 使用 Semantic Kernel 的 RAG
GitHub - Semantic Kernel
ServiceNow 案例研究

Agentic RAG 的實際應用與用例

AWS 機器學習博客. Twitch 如何使用 Agentic 工作流與 RAG 在 Amazon Bedrock 上加速廣告銷售。AWS 機器學習博客
LlamaCloud 演示庫. 使用 LlamaCloud 的患者案例摘要工作流。GitHub 2025. 訪問日期: 2025-01-13.
LlamaCloud 演示庫. 使用 LlamaCloud 的合同審查工作流。GitHub
LlamaCloud 演示庫. 使用 LlamaCloud 的汽車保險索賠工作流。GitHub
LlamaCloud 演示庫. 使用 LlamaCloud 的研究論文報告生成工作流。GitHub

值得注意的相關概念

代理設計模式第 1 部分
代理設計模式第 2 部分，反思
代理設計模式第 3 部分，工具使用
代理設計模式第 4 部分，規劃
代理設計模式第 5 部分，多代理協作
使用 LlamaIndex 構建 Agentic RAG
使用 AutoGen 的 AI 代理設計模式
LangGraph Agentic RAG

參考文獻

關於 Agentic RAG 的研究論文

1. 單代理 RAG（基於路由器）

Search-o1: 代理增強搜索的大推理模型 https://arxiv.org/abs/2501.05366

2. 多代理 RAG

用於時間序列分析的代理增強檢索生成 https://arxiv.org/abs/2408.14484

3. 糾正 RAG

企業系統的代理 AI 驅動技術故障排除 https://arxiv.org/abs/2412.12006
糾正 RAG (CRAG) https://langchain-ai.github.io/langgraph/tutorials/rag/langgraph_crag/
糾正檢索增強生成 https://arxiv.org/abs/2401.15884
企業系統的代理 AI 驅動技術故障排除 https://arxiv.org/abs/2412.12006

4. 自適應 RAG

Langgraph 自適應 RAG https://langchain-ai.github.io/langgraph/tutorials/rag/langgraph_adaptive_rag/
MBA-RAG: 一種基於 Bandit 的自適應檢索增強方法 https://arxiv.org/abs/2412.01572
CtrlA: 通過內在控制的自適應檢索增強生成 https://arxiv.org/abs/2405.18727
Adaptive-RAG: 通過問題複雜性學習適應檢索增強大語言模型 https://arxiv.org/abs/2403.14403
AT-RAG: 一種通過主題過濾和迭代推理增強查詢效率的自適應 RAG 模型 https://arxiv.org/abs/2410.12886

5. 圖增強 RAG

GeAR: 圖增強的檢索增強生成代理 https://arxiv.org/abs/2412.18431
Agent-G: 一種圖檢索增強生成的代理框架 https://openreview.net/forum?id=g2C947jjjQ

本文由 Readfog 進行 AMP 轉碼，版權歸原作者所有。
來源：https://mp.weixin.qq.com/s/c1YyvFKx4dQ4QPJ5g5Oq4w

摘要

目錄

引言

檢索增強生成中的代理模式

1. 反思

2. 規劃

3. 工具使用

4. 多代理協作

代理模式的意義

Agentic RAG 系統的分類

1. 單代理 RAG

2. 多代理 RAG

3. 分層代理 RAG

4. 糾正代理 RAG

5. 自適應代理 RAG

6. 圖基代理 RAG

6.1 Agent-G：圖 RAG 的代理框架

6.2 GeAR：圖增強代理 RAG

7. 代理式文檔工作流（ADW）

工作流

關鍵特性與優勢

可視化表示

Agentic RAG 框架的比較分析

關鍵要點

應用

1. 醫療與個性化醫學

2. 教育與個性化學習

3. 法律與合同分析

挑戰與未來方向

挑戰

未來方向

RAG 代理分類的實現：技術與工具

關於 Agentic RAG 的博客和教程

Agentic RAG 的實際應用與用例

值得注意的相關概念

參考文獻

關於 Agentic RAG 的研究論文

1. 單代理 RAG（基於路由器）

2. 多代理 RAG

3. 糾正 RAG

4. 自適應 RAG

5. 圖增強 RAG

猜你喜歡