一文搞懂 RAG 檢索增強生成

RAG 檢索增強介紹

檢索增強生成（Retrieval Augmented Generation，RAG）是一種強大的工具，它通過將外部知識整合到生成過程中，增強了大型語言模型（LLM）的性能。

讓我們探索 RAG 的關鍵組成部分。
第一、定製知識庫
定製知識庫是指一系列緊密關聯且始終保持更新的信息集合，它構成了 RAG 的核心基礎。這個知識庫可以表現爲一個結構化的數據庫形態，也可以表現爲一套詳盡的文檔體系，甚至可能是兩者兼具的綜合形式。

第二、分塊

分塊技術是指將大規模的輸入文本有策略地拆解爲若干個較小、更易管理的片段的過程。這一過程旨在確保所有文本內容均能適應嵌入模型所限定的輸入尺寸，同時也有助於顯著提升檢索效率。

實施一種明智且高效的分塊策略，在優化信息處理流程方面具有關鍵作用，能夠極大地增強您的 RAG 系統的性能與響應能力。

第三、Embedding 嵌入 & Embedding Model 嵌入模型
一種將文本數據表示爲數值向量的技術，可以輸入到機器學習模型中。
嵌入模型負責將文本轉換成這些向量。

第四、向量數據庫
一系列預先計算的文本數據向量表示，用於快速檢索和相似性搜索，具有 SQL CRUD 操作、元數據過濾和水平擴展等功能。

第五、用戶聊天界面
一個用戶友好的界面，允許用戶與 RAG 系統互動，提供輸入查詢並接收輸出。
查詢轉換爲嵌入，用於從向量數據庫檢索相關上下文！
第六、提示模板
爲 RAG 系統生成合適提示的過程，可以是用戶查詢和定製知識庫的組合。
這作爲輸入給 LLM，產生最終回覆。

參考引用：https://mp.weixin.qq.com/s/CAcmAOJ6SC7JU80AqAsyuQ

我們梳理了下 AI 大模型的知識圖譜，包括 12 項核心技能：大模型內核架構、大模型開發 API、開發框架、向量數據庫、AI 編程、AI Agent、緩存、算力、RAG、大模型微調、大模型預訓練、LLMOps 等。

本文由 Readfog 進行 AMP 轉碼，版權歸原作者所有。
來源：https://mp.weixin.qq.com/s/exgBpwYXoXEiPuD1DiQ1OQ