7 種 RAG 架構及其核心組件概覽

Retrieval-Augmented Generation（RAG）架構正發揮着日益重要的作用。它通過在 AI 生成過程中引入外部知識檢索，極大地提升了 AI 回答的準確性和全面性，從基礎的文檔查詢逐步發展爲多模態、多智能體協同的智能架構。本文將概覽 RAG 架構從基礎到高級的 7 種模式及其核心組件。

一、RAG 的 7 種模式

（一）Naive RAG：基礎架構的構建

Naive RAG 是 RAG 架構的最基礎形式。其工作流程主要包含三個關鍵步驟：文檔檢索、處理和生成響應。在文檔檢索階段，系統會根據用戶的查詢在文檔庫中查找相關內容；接着對檢索到的文檔進行處理，爲後續生成響應做準備；最後，生成模型利用這些處理後的信息生成最終的回答。這種簡單直接的架構爲 RAG 技術奠定了基石，讓我們初步領略到如何將外部知識引入 AI 生成過程。

（二）Retrieve-and-rerank：優化檢索結果

在 Naive RAG 的基礎上，Retrieve-and-rerank 模式增加了重排序步驟。當完成初始的文檔檢索後，重排序模型會根據一定的標準對檢索結果進行重新排序。這樣做的目的是優化檢索結果的相關性，使得最終提供給生成模型的上下文信息更加精準。通過這種方式，系統能夠更好地篩選出與用戶查詢最爲相關的文檔片段，從而進一步提高生成響應的質量。

（三）Multimodal RAG：突破文本限制

Multimodal RAG 的獨特之處在於它能夠處理多種類型的數據，而不僅僅侷限於文本。在當今數字化時代，信息的形式多種多樣，如圖像、音頻等。Multimodal RAG 可以將這些不同模態的數據進行整合處理，例如在處理包含圖像的文檔時，它能夠同時理解圖像中的信息以及與之相關的文本描述。這一模式拓寬了 RAG 架構的應用範圍，使其能夠適應更加複雜和多樣化的信息環境。

（四）Graph RAG：挖掘知識連接

Graph RAG 利用圖數據庫來增強知識連接。在這種模式下，文檔之間的關係不再是孤立的，而是通過圖結構進行表示。圖數據庫可以更好地捕捉文檔之間的語義關聯和邏輯關係，例如一篇關於科技的文章可能與其他相關的技術文檔、研究報告等通過引用、相似主題等關係連接起來。這樣，當進行查詢時，系統能夠基於這種知識圖譜更深入地理解文檔間的關係，提供更有深度和廣度的上下文信息，從而提升回答的準確性和全面性。

（五）Hybrid RAG：融合多種技術優勢

Hybrid RAG 正如其名，結合了多種技術的優勢。它既包含了圖結構所帶來的知識關係理解能力，又融合了傳統檢索方法的高效性。這種融合使得 Hybrid RAG 在處理複雜查詢時能夠靈活運用不同技術的長處。例如，在某些情況下，傳統檢索方法可以快速定位到相關文檔，而圖結構則有助於進一步挖掘文檔之間深層次的聯繫，從而爲生成模型提供更豐富、更準確的信息，以生成高質量的響應。

（六）Agentic RAG Router：智能路由查詢

Agentic RAG Router 引入了 AI Agent 來路由和處理查詢。AI Agent 在這裏扮演着智能決策的角色，它能夠根據用戶查詢的特點、當前系統的狀態以及可用資源等因素，選擇最適合的處理路徑。例如，當面對不同類型的查詢時，它可以決定是直接從向量數據庫中檢索信息，還是需要調用其他外部工具或服務。這種智能路由機制提高了系統的效率和靈活性，使得 RAG 架構能夠更好地應對多樣化的用戶需求。

（七）Agentic RAG Multi - Agent：多智能體協同工作

Agentic RAG Multi - Agent 模式則更進一步，它使用多個專門的 AI Agent 協同工作。這些智能體可以分別負責不同的任務，並且能夠調用不同的工具，如向量搜索、網頁搜索、Slack、Gmail 等。例如，一個智能體負責在向量數據庫中進行高效的信息檢索，另一個智能體則可以通過網頁搜索獲取最新的外部信息，還有的智能體可以與 Slack 或 Gmail 等通信工具交互，獲取相關的團隊協作或郵件信息。通過多智能體的協同合作，RAG 架構能夠整合來自多個渠道和資源的信息，爲用戶提供更加全面和準確的回答。

二、RAG 架構的核心組件

（一）嵌入模型

嵌入模型在 RAG 架構中起着關鍵作用，它負責將文本轉換爲向量表示。這種向量表示能夠將文本的語義信息以一種數學形式呈現，使得計算機能夠更好地理解和處理文本之間的相似性和相關性。例如，在文檔檢索階段，通過將查詢和文檔都轉換爲向量，系統可以快速計算它們之間的相似度，從而找到與查詢最相關的文檔。

（二）生成模型

生成模型是負責最終內容生成的核心組件。它基於檢索到的上下文信息，運用自身的算法和訓練知識，生成回答用戶查詢的文本內容。生成模型的性能和質量直接影響着 RAG 架構輸出的準確性和流暢性。不同的生成模型可能具有不同的特點和優勢，如某些模型在生成自然語言描述方面表現出色，而另一些模型則在處理特定領域知識時更加準確。

（三）重排序模型

重排序模型專注於優化檢索結果的相關性。在文檔檢索完成後，重排序模型會根據預先設定的規則和算法，對檢索到的文檔進行重新評估和排序。這些規則可能涉及文檔與查詢的關鍵詞匹配程度、語義相關性、文檔的質量和權威性等多個因素。通過重排序，系統能夠確保提供給生成模型的上下文信息是最相關和最有價值的。

（四）向量數據庫

向量數據庫是存儲和檢索向量化內容的重要設施。它爲 RAG 架構提供了高效的數據存儲和檢索能力，能夠快速定位與查詢向量相似的文檔向量。向量數據庫的設計和性能對於整個 RAG 系統的效率至關重要，它需要能夠處理大規模的向量數據，並支持快速的相似性搜索操作。

（五）提示模板

提示模板在 RAG 架構中起到規範化查詢處理的作用。它爲用戶查詢提供了一種標準化的格式，使得系統能夠更好地理解用戶的意圖。同時，提示模板也可以包含一些預定義的指令或引導信息，幫助生成模型更好地生成響應。例如，模板可以規定查詢的結構、需要包含的關鍵信息等，從而提高整個系統的準確性和一致性。

（六）AI Agent

AI Agent 是 RAG 架構中的智能決策和任務協調者。在不同的模式中，AI Agent 發揮着不同的作用，如在 Agentic RAG Router 中進行查詢路由決策，在 Agentic RAG Multi - Agent 中協調多個智能體的工作。它能夠根據系統的目標、環境和用戶需求，動態地調整系統的行爲，實現高效的任務執行和資源利用。

本文由 Readfog 進行 AMP 轉碼，版權歸原作者所有。
來源：https://mp.weixin.qq.com/s/t6EG2Ukug2qdpTl9sUza-g