LLM Agent 和 Agentic RAG 的最佳綜述

論文鏈接:https://arxiv.org/abs/2501.09136

Github 倉庫:https://github.com/asinghcsu/AgenticRAG-Survey

下面很多鏈接在這個 Github 倉庫,大家通過訪問 Github 倉庫訪問更多資料。

摘要

代理式檢索增強生成(Agentic RAG)通過在 RAG 管道中嵌入自主代理,代表了人工智能領域的重大飛躍。本倉庫補充了綜述論文《代理式檢索增強生成(Agentic RAG):綜述》,提供了以下方面的見解:


目錄

  1. 📜

  2. 🧩 引言

  3. 🤖 代理模式

  4. 🛠️ Agentic RAG 系統的分類

  5. 🔍 Agentic RAG 框架的比較分析

  6. 💼 應用

  7. 🚧 挑戰與未來方向

  8. 🛠️ RAG 代理分類的實現:技術與工具

  9. 📰 關於 Agentic RAG 的博客和教程

  10. 🖊️ 值得注意的相關概念

  11. 💡 Agentic RAG 的實際實現與用例

  12. 📚 參考文獻

  13. 🖊️ 如何引用


引言

檢索增強生成(RAG)系統結合了大型語言模型(LLMs)和檢索機制,生成上下文相關且準確的響應。雖然傳統 RAG 系統在知識檢索和生成方面表現出色,但在處理動態、多步推理任務、適應性和複雜工作流的編排方面往往存在不足。

代理式檢索增強生成(Agentic RAG)通過集成自主 AI 代理克服了這些限制。這些代理採用核心的代理模式,如反思、規劃、工具使用和多代理協作,動態適應任務特定需求,並在以下方面提供卓越性能:

本文探討了從 RAG 到 Agentic RAG 的演進,展示了:

無論您是研究人員、開發者還是實踐者,本倉庫都提供了寶貴的見解和資源,幫助您理解和推進 Agentic RAG 系統。


檢索增強生成中的代理模式

Agentic RAG 系統的智能和適應性來源於定義明確的代理模式。這些模式使代理能夠處理複雜的推理任務,適應動態環境,並有效協作。以下是 Agentic RAG 的核心模式:

1. 反思

2. 規劃

3. 工具使用

4. 多代理協作


代理模式的意義

這些模式構成了 Agentic RAG 系統的核心,使其能夠:


Agentic RAG 系統的分類

代理式檢索增強生成(RAG)系統涵蓋了多種架構和工作流,每種架構都針對特定任務和複雜性級別進行了優化。以下是這些系統的詳細分類:

1. 單代理 RAG

  1. 查詢提交給代理。

  2. 代理從外部源檢索相關數據。

  3. 數據處理併合成爲響應。

2. 多代理 RAG

  1. 代理動態分配任務(如檢索、推理、合成)。

  2. 每個代理專注於特定子任務。

  3. 結果彙總併合成爲連貫輸出。

3. 分層代理 RAG

  1. 頂層代理協調子任務給下層代理。

  2. 每個下層代理處理流程的特定部分。

  3. 結果在更高層次上迭代優化和集成。

4. 糾正代理 RAG

  1. 代理生成初始響應。

  2. 批評模塊評估響應的錯誤或不一致性。

  3. 代理根據反饋優化響應。

  4. 重複步驟 2-3,直到輸出達到質量標準。

5. 自適應代理 RAG

  1. 代理評估查詢及其上下文。

  2. 根據可用數據和用戶需求實時調整檢索策略。

  3. 使用動態工作流合成響應。

6. 圖基代理 RAG

圖基 RAG 系統通過集成圖數據結構進行高級推理,擴展了傳統 RAG。

6.1 Agent-G:圖 RAG 的代理框架

  1. 從圖知識庫中提取關係(如疾病到症狀的映射)。

  2. 補充來自外部源的非結構化數據。

  3. 使用批評模塊驗證結果並迭代優化。

6.2 GeAR:圖增強代理 RAG

  1. 擴展與查詢相關的圖以增強關係理解。

  2. 利用專業化代理進行多跳推理。

  3. 將圖結構化和非結構化信息合成爲響應。

7. 代理式文檔工作流(ADW)

代理式文檔工作流(ADW)通過智能代理自動化以文檔爲中心的流程,擴展了傳統 RAG 系統。

工作流

  1. 文檔解析與結構化
  1. 狀態維護
  1. 知識檢索
  1. 代理編排
  1. 可操作輸出生成

關鍵特性與優勢


可視化表示


Agentic RAG 框架的比較分析

下表提供了三種架構框架的全面比較分析:傳統 RAG、Agentic RAG 和代理式文檔工作流(ADW)。該分析突出了它們各自的優勢、劣勢和最佳適用場景,爲跨多樣化用例的適用性提供了寶貴見解。

KKgtzv


關鍵要點


應用

代理式檢索增強生成(RAG)系統在多個行業中具有變革性潛力,能夠實現智能檢索、多步推理和動態適應複雜任務。以下是 Agentic RAG 系統產生重大影響的關鍵領域:

1. 醫療與個性化醫學

2. 教育與個性化學習

3. 法律與合同分析

挑戰與未來方向

儘管代理增強檢索生成(Agentic RAG)系統展現出巨大的潛力,但仍存在一些未解決的挑戰和研究機會:

挑戰

  1. 多代理系統中的協調複雜性
  1. 倫理與負責任的 AI
  1. 可擴展性與延遲
  1. 人機協作
  1. 擴展多模態能力

未來方向

  1. 增強的代理協調
  1. 領域特定應用
  1. 倫理 AI 與治理框架
  1. 高效的圖推理
  1. 人機協同

RAG 代理分類的實現:技術與工具

mYQkgd


關於 Agentic RAG 的博客和教程

  1. DeepLearning.AI: 代理如何提高 LLM 性能。DeepLearning.AI

  2. Weaviate 博客: 什麼是 Agentic RAG?Weaviate 博客

  3. LangGraph CRAG 教程: LangGraph CRAG: 上下文檢索增強生成教程。LangGraph CRAG

  4. LangGraph 自適應 RAG 教程: LangGraph 自適應 RAG: 自適應檢索增強生成教程。LangGraph 自適應 RAG. 訪問日期: 2025-01-14.

  5. LlamaIndex 博客: 使用 LlamaIndex 的 Agentic RAG。LlamaIndex 博客

  6. Hugging Face Cookbook. Agentic RAG: 通過查詢重構和自查詢加速檢索增強生成。Hugging Face Cookbook

  7. Hugging Face Agentic RAG: https://huggingface.co/docs/smolagents/en/examples/rag

  8. Qdrant 博客. Agentic RAG: 結合 RAG 與代理以增強信息檢索。Qdrant 博客

  9. Semantic Kernel: Semantic Kernel 是微軟的開源 SDK,集成了大語言模型(LLMs)到應用程序中。它支持代理模式,能夠創建自主 AI 代理,用於自然語言理解、任務自動化和決策。它已在 ServiceNow 的 P1 事件管理等場景中使用,以促進實時協作、自動化任務執行和無縫檢索上下文信息。


Agentic RAG 的實際應用與用例

  1. AWS 機器學習博客. Twitch 如何使用 Agentic 工作流與 RAG 在 Amazon Bedrock 上加速廣告銷售。AWS 機器學習博客

  2. LlamaCloud 演示庫. 使用 LlamaCloud 的患者案例摘要工作流。GitHub 2025. 訪問日期: 2025-01-13.

  3. LlamaCloud 演示庫. 使用 LlamaCloud 的合同審查工作流。GitHub

  4. LlamaCloud 演示庫. 使用 LlamaCloud 的汽車保險索賠工作流。GitHub

  5. LlamaCloud 演示庫. 使用 LlamaCloud 的研究論文報告生成工作流。GitHub


值得注意的相關概念


參考文獻

關於 Agentic RAG 的研究論文

1. 單代理 RAG(基於路由器)

2. 多代理 RAG

3. 糾正 RAG

4. 自適應 RAG

5. 圖增強 RAG

本文由 Readfog 進行 AMP 轉碼,版權歸原作者所有。
來源https://mp.weixin.qq.com/s/c1YyvFKx4dQ4QPJ5g5Oq4w