一種模塊化大模型 Agent 框架全棧技術綜述

現有基於 LLM 的智能體雖然在功能上取得了進展,但缺乏模塊化,導致在研究和開發中存在術語和架構上的混淆,在軟件架構上缺乏統一。

“A survey on LLM based autonomous agents” 提出的框架,它並沒有明確指出大型語言模型(LLM)、工具、數據源和記憶是否是 Agent 的一部分。這種對每個模塊功能的模糊區分促進了軟件開發者之間的分裂,並導致不兼容和阻礙了可重用性

LLM-Agent-UMF 框架通過明確區分智能體的不同組件,包括 LLM、工具和新引入的核心智能體(core-agent),來解決這些問題。核心智能體是智能體的中央協調器,包含規劃、記憶、檔案、行動和安全五個模塊,其中安全模塊在以往的研究中常被忽視。

核心智能體作爲基於大型語言模型(LLM)智能體的中心組成部分

核心智能體(core-agent)的內部結構

核心智能體(core-agent)是 LLM-Agent-UMF 框架的關鍵組成部分。核心智能體被設計爲智能體的中央協調器,負責管理和協調智能體的各種功能和組件。內部結構被劃分爲五個主要模塊,每個模塊都有其特定的功能和責任:

核心智能體的內部結構

  1. 規劃模塊(Planning Module):
  1. 記憶模塊(Memory Module):
  1. 檔案模塊(Profile Module):
  1. 行動模塊(Action Module):
  1. 安全模塊(Security Module):

核心智能體(core-agent)的分類

對核心智能體進行了分類,區分爲主動核心智能體(Active Core-Agents)被動核心智能體(Passive Core-Agents),以闡明它們在結構和功能上的差異。

主動和被動核心智能體的內部結構

主動核心智能體(Active Core-Agents):

多主動核心智能體架構

被動核心智能體(Passive Core-Agents):

包括被動核心智能體的基於大型語言模型(LLM)的智能體架構

多被動核心智能體架構

混合多核心智能體(Hybrid Multi-Core Agent)架構,

一主動多被動核心智能體混合架構

多主動多被動核心智能體混合架構

核心智能體(core-agent)的有效性

使用 LLM-Agent-UMF 對最新智能體進行分類。

Toolformer 和 Confucius 的多被動核心智能體系統:結合了 Toolformer 和 Confucius 的被動核心智能體,以處理特定的工具調用和任務執行。

基於大型語言模型的智能體 1(LA1):Toolformer 和 Confucius - 多被動核心智能體架構。

ToolLLM 和 ChatDB 的多主動核心智能體系統:將 ToolLLM 的 API 檢索能力和 ChatDB 的複雜推理能力結合起來,創建了一個能夠執行高級任務規劃和執行的智能體。

基於大型語言模型的智能體 2-A(LA2-A):ToolLLM 和 ChatDB - 多主動核心智能體架構。

https://arxiv.org/pdf/2409.11393
LLM-AGENT-UMF: LLM-BASED AGENT UNIFIED MODELING FRAMEWORK FOR SEAMLESS INTEGRATION OF MULTI ACTIVE/PASSIVE CORE-AGENTS

本文由 Readfog 進行 AMP 轉碼,版權歸原作者所有。
來源https://mp.weixin.qq.com/s/raB8HGPOjML3FRZ9NANmNQ