7 種 RAG 架構及其核心組件概覽
Retrieval-Augmented Generation(RAG)架構正發揮着日益重要的作用。它通過在 AI 生成過程中引入外部知識檢索,極大地提升了 AI 回答的準確性和全面性,從基礎的文檔查詢逐步發展爲多模態、多智能體協同的智能架構。本文將概覽 RAG 架構從基礎到高級的 7 種模式及其核心組件。
一、RAG 的 7 種模式
(一)Naive RAG:基礎架構的構建
Naive RAG 是 RAG 架構的最基礎形式。其工作流程主要包含三個關鍵步驟:文檔檢索、處理和生成響應。在文檔檢索階段,系統會根據用戶的查詢在文檔庫中查找相關內容;接着對檢索到的文檔進行處理,爲後續生成響應做準備;最後,生成模型利用這些處理後的信息生成最終的回答。這種簡單直接的架構爲 RAG 技術奠定了基石,讓我們初步領略到如何將外部知識引入 AI 生成過程。
(二)Retrieve-and-rerank:優化檢索結果
在 Naive RAG 的基礎上,Retrieve-and-rerank 模式增加了重排序步驟。當完成初始的文檔檢索後,重排序模型會根據一定的標準對檢索結果進行重新排序。這樣做的目的是優化檢索結果的相關性,使得最終提供給生成模型的上下文信息更加精準。通過這種方式,系統能夠更好地篩選出與用戶查詢最爲相關的文檔片段,從而進一步提高生成響應的質量。
(三)Multimodal RAG:突破文本限制
Multimodal RAG 的獨特之處在於它能夠處理多種類型的數據,而不僅僅侷限於文本。在當今數字化時代,信息的形式多種多樣,如圖像、音頻等。Multimodal RAG 可以將這些不同模態的數據進行整合處理,例如在處理包含圖像的文檔時,它能夠同時理解圖像中的信息以及與之相關的文本描述。這一模式拓寬了 RAG 架構的應用範圍,使其能夠適應更加複雜和多樣化的信息環境。
(四)Graph RAG:挖掘知識連接
Graph RAG 利用圖數據庫來增強知識連接。在這種模式下,文檔之間的關係不再是孤立的,而是通過圖結構進行表示。圖數據庫可以更好地捕捉文檔之間的語義關聯和邏輯關係,例如一篇關於科技的文章可能與其他相關的技術文檔、研究報告等通過引用、相似主題等關係連接起來。這樣,當進行查詢時,系統能夠基於這種知識圖譜更深入地理解文檔間的關係,提供更有深度和廣度的上下文信息,從而提升回答的準確性和全面性。
(五)Hybrid RAG:融合多種技術優勢
Hybrid RAG 正如其名,結合了多種技術的優勢。它既包含了圖結構所帶來的知識關係理解能力,又融合了傳統檢索方法的高效性。這種融合使得 Hybrid RAG 在處理複雜查詢時能夠靈活運用不同技術的長處。例如,在某些情況下,傳統檢索方法可以快速定位到相關文檔,而圖結構則有助於進一步挖掘文檔之間深層次的聯繫,從而爲生成模型提供更豐富、更準確的信息,以生成高質量的響應。
(六)Agentic RAG Router:智能路由查詢
Agentic RAG Router 引入了 AI Agent 來路由和處理查詢。AI Agent 在這裏扮演着智能決策的角色,它能夠根據用戶查詢的特點、當前系統的狀態以及可用資源等因素,選擇最適合的處理路徑。例如,當面對不同類型的查詢時,它可以決定是直接從向量數據庫中檢索信息,還是需要調用其他外部工具或服務。這種智能路由機制提高了系統的效率和靈活性,使得 RAG 架構能夠更好地應對多樣化的用戶需求。
(七)Agentic RAG Multi - Agent:多智能體協同工作
Agentic RAG Multi - Agent 模式則更進一步,它使用多個專門的 AI Agent 協同工作。這些智能體可以分別負責不同的任務,並且能夠調用不同的工具,如向量搜索、網頁搜索、Slack、Gmail 等。例如,一個智能體負責在向量數據庫中進行高效的信息檢索,另一個智能體則可以通過網頁搜索獲取最新的外部信息,還有的智能體可以與 Slack 或 Gmail 等通信工具交互,獲取相關的團隊協作或郵件信息。通過多智能體的協同合作,RAG 架構能夠整合來自多個渠道和資源的信息,爲用戶提供更加全面和準確的回答。
二、RAG 架構的核心組件
(一)嵌入模型
嵌入模型在 RAG 架構中起着關鍵作用,它負責將文本轉換爲向量表示。這種向量表示能夠將文本的語義信息以一種數學形式呈現,使得計算機能夠更好地理解和處理文本之間的相似性和相關性。例如,在文檔檢索階段,通過將查詢和文檔都轉換爲向量,系統可以快速計算它們之間的相似度,從而找到與查詢最相關的文檔。
(二)生成模型
生成模型是負責最終內容生成的核心組件。它基於檢索到的上下文信息,運用自身的算法和訓練知識,生成回答用戶查詢的文本內容。生成模型的性能和質量直接影響着 RAG 架構輸出的準確性和流暢性。不同的生成模型可能具有不同的特點和優勢,如某些模型在生成自然語言描述方面表現出色,而另一些模型則在處理特定領域知識時更加準確。
(三)重排序模型
重排序模型專注於優化檢索結果的相關性。在文檔檢索完成後,重排序模型會根據預先設定的規則和算法,對檢索到的文檔進行重新評估和排序。這些規則可能涉及文檔與查詢的關鍵詞匹配程度、語義相關性、文檔的質量和權威性等多個因素。通過重排序,系統能夠確保提供給生成模型的上下文信息是最相關和最有價值的。
(四)向量數據庫
向量數據庫是存儲和檢索向量化內容的重要設施。它爲 RAG 架構提供了高效的數據存儲和檢索能力,能夠快速定位與查詢向量相似的文檔向量。向量數據庫的設計和性能對於整個 RAG 系統的效率至關重要,它需要能夠處理大規模的向量數據,並支持快速的相似性搜索操作。
(五)提示模板
提示模板在 RAG 架構中起到規範化查詢處理的作用。它爲用戶查詢提供了一種標準化的格式,使得系統能夠更好地理解用戶的意圖。同時,提示模板也可以包含一些預定義的指令或引導信息,幫助生成模型更好地生成響應。例如,模板可以規定查詢的結構、需要包含的關鍵信息等,從而提高整個系統的準確性和一致性。
(六)AI Agent
AI Agent 是 RAG 架構中的智能決策和任務協調者。在不同的模式中,AI Agent 發揮着不同的作用,如在 Agentic RAG Router 中進行查詢路由決策,在 Agentic RAG Multi - Agent 中協調多個智能體的工作。它能夠根據系統的目標、環境和用戶需求,動態地調整系統的行爲,實現高效的任務執行和資源利用。
本文由 Readfog 進行 AMP 轉碼,版權歸原作者所有。
來源:https://mp.weixin.qq.com/s/t6EG2Ukug2qdpTl9sUza-g