Agent 的基本架構

根據《A survey on large language model based autonomous agents》智能體綜述文章，Agent 核心是需要具備以下幾個核心特性與模塊：

Profile 模塊： Profile 模塊的目的主要是做 Agent 角色認定，回答的核心問題有: 我是誰？我在哪？我該幹什麼？無論是在當前的人與人之間的協同，還是人與智能體的協同，亦或是智能體與智能體間的協同。
Memory 模塊: Memory 即記憶模塊，主要用來存儲、獲取、檢索信息。
Planning 模塊: 制定計劃，可以根據過去的行爲與目標動態規劃下一步的行動。
Action 模塊: 執行模塊，執行智能體的具體決策。

角色模塊的目的是識別代理的角色。代理通常通過承擔特定角色來執行任務，如程序員、教師和領域專家。角色模塊通過將代理的配置文件寫入提示中，影響 LLM 的行爲。代理配置文件通常包括基本信息（如年齡、性別和職業）、心理學信息（反映代理的個性）和社交信息（詳細說明代理之間的關係）。

角色生成策略：

記憶模塊在代理架構設計中起着非常重要的作用。它存儲從環境中感知到的信息，並利用記錄的記憶來促進未來的行動。記憶模塊幫助代理積累經驗、自我進化，並以更一致、合理和有效的方式行事。

記憶結構：

記憶格式：

記憶操作：

規劃模塊旨在賦予代理類似人類的能力，即將複雜任務分解爲更簡單的子任務並分別解決。規劃模塊根據代理在規劃過程中是否可以接收反饋分爲兩類：無反饋規劃和有反饋規劃。

無反饋規劃：

單路徑推理：最終任務被分解爲幾個中間步驟，每個步驟只導致一個後續步驟。例如，Chain of Thought（CoT）和 Zero-shot-CoT 使用推理步驟作爲提示。
多路徑推理：推理步驟被組織成樹狀結構，每個中間步驟可能有多個後續步驟。例如，Self-consistent CoT（CoT-SC）和 Tree of Thoughts（ToT）使用樹狀推理結構生成計劃。
外部規劃器：利用外部規劃器生成計劃。例如，LLM+P 和 LLM-DP 使用外部規劃器處理 PDDL。

有反饋規劃：

行動模塊負責將代理的決策轉化爲具體的結果。該模塊位於最下游位置，直接與環境交互。行動模塊受到角色、記憶和規劃模塊的影響。

行動目標：

行動生成：

行動空間：

外部工具：利用外部 API、數據庫和外部模型擴展行動空間。例如，HuggingGPT、ChatDB 和 ChemCrow 使用外部工具。
內部知識：依賴 LLMs 的內部知識指導行動。例如，DEPS、ChatDev 和 Generative Agent 使用 LLMs 的規劃、對話和常識理解能力。

行動影響：

通過上述模塊的協同作用，基於 LLM 的自主代理能夠模擬人類行爲，有效執行多樣化任務。

本文由 Readfog 進行 AMP 轉碼，版權歸原作者所有。
來源：https://mp.weixin.qq.com/s/Z5oYglZ01RlDUuR6E4qHnQ