4 大類 AI Agent 協議框架全面綜述
對現有的 LLM AI Agent 通信協議進行了系統性的概述,並將其分爲四大類,以幫助用戶和開發者爲特定應用場景選擇最適合的協議。
一、AI Agent 協議的發展
AI Agent 協議的定義:代理協議是標準化框架,定義了代理之間以及代理與外部系統之間結構化通信的規則、格式和程序。與傳統交互機制(如 API、GUI 或 XML)相比,協議在效率、操作範圍、標準化和 AI 原生性方面具有顯著優勢。
-
代理協議的作用:
-
互操作性:允許不同架構的異構代理系統無縫協作。
-
標準化交互:確保代理能夠輕鬆集成和擴展其功能,通過納入新工具、API 或服務。
-
安全性和治理:提供內置機制以管理代理行爲,確保在明確定義的安全操作參數內運行。
-
降低開發複雜性:通過抽象化交互邏輯,減少代理開發的複雜性,使開發者能夠專注於增強核心代理功能。
-
促進集體智能:通過標準化通信渠道共享見解和協調行動,使分佈式代理系統能夠實現單一架構無法實現的結果。
二、AI Agent 協議分類框架
提出了一個二維分類框架,將協議分爲上下文導向型(Context-Oriented Protocols)和代理間通信型(Inter-Agent Protocols),並進一步細分爲通用型(General-Purpose)和特定領域型(Domain-Specific)。
1、上下文導向型協議
面向上下文的協議主要解決 AI 代理與外部工具或數據源之間的交互問題,幫助代理獲取必要的上下文信息以完成任務。這類協議進一步分爲:
-
1.1 General-Purpose Protocols
-
MCP(Model Context Protocol):由 Anthropic 提出,是一個通用的上下文獲取協議,允許 AI 代理通過標準化的方式與外部資源(如數據、工具和服務)進行交互。它採用客戶端 - 服務器架構,將工具調用與 LLM 響應解耦,提高了數據安全性和隱私性。
-
1.2 Domain-Specific Protocols
-
agents.json:由 WildCardAI 提出,是一個基於 OpenAPI 標準的開源機器可讀合同格式,專門用於將傳統 API 與 AI 代理橋接,支持網站聲明 AI 兼容接口、認證方案和多步工作流。
2、Agent 間通信協議
面向代理間交互的協議專注於代理之間的協作和通信,以解決更復雜的任務。
-
2.1 General-Purpose Protocols
-
ANP(Agent Network Protocol):由開源社區開發,旨在實現不同代理之間的互操作性,構建一個開放、安全、高效的協作網絡。它支持跨域代理通信,採用去中心化身份認證機制。
-
A2A(Agent2Agent Protocol):由 Google 提出,專注於企業內部代理之間的複雜問題解決和協作,支持異步工作流和多模態交互。
-
AITP(Agent Interaction & Transaction Protocol):由 NEAR 基金會提出,支持代理之間的安全通信、協商和價值交換,特別適用於跨信任邊界的交互。
-
AConP(Agent Connect Protocol):由 Cisco 提出,定義了調用和配置代理的標準接口。
-
AComP(Agent Communication Protocol):由 Al and Data 提出,旨在標準化代理之間的通信,促進自動化和協作。
-
Agora:由牛津大學提出,是一個元協議,允許代理根據上下文采用不同的通信協議。
-
2.2 Domain-Specific Protocols
-
LMOS(Language Model Operating System):由 Eclipse 基金會提出,旨在構建一個互聯網代理生態系統,支持代理的發現、交互和互操作性。
-
Agent Protocol:由 AI Engineer Foundation 提出,定義了控制檯與 AI 代理之間的通信標準。
-
LOKA:由 CMU 提出,是一個去中心化的框架,用於建立知識型代理之間的信任和倫理協調。
-
PXP(Predict and eXplain Protocol):由 BITS Pilani 提出,專注於人機交互中的雙向可解釋性。
-
CrowdES:由 GIST.KR 提出,用於機器人代理之間的交互,模擬真實的人羣動態。
-
SPPs(Spatial Population Protocols):由利物浦大學提出,用於解決匿名機器人之間的分佈式定位問題。
三、案例分析
通過一個具體的用例——計劃從北京到紐約的五天旅行——來比較和分析四種不同的 AI 代理協議:MCP、A2A、ANP 和 Agora:
1. MCP: 單個代理調用所有工具
適用於任務定義明確且外部服務接口穩定的場景,但不適用於動態環境。
- 工作流程:
-
用戶向 MCP Travel Client 提出旅行計劃請求。
-
MCP Travel Client 直接調用 Flight Server、Hotel Server 和 Weather Server,分別獲取航班、酒店和天氣信息。
-
各服務返回信息後,MCP Travel Client 聚合所有響應,生成完整的旅行計劃。
2. A2A: 企業內部的複雜協作
適合企業內部多個專業代理直接通信的場景,依賴於穩定的內部基礎設施和高效的代理間數據交換。
- 工作流程:
-
用戶向 A2A Travel Planner 提出旅行計劃請求。
-
A2A Travel Planner 將任務分配給各個專業代理(如 Flight Agent、Hotel Agent、Weather Agent)。
-
各代理直接相互通信,獲取所需信息(例如 Flight Agent 直接從 Weather Agent 獲取天氣信息)。
-
各代理將結果返回給 A2A Travel Planner,由其彙總最終結果。
3. ANP: 跨領域代理協議
適合跨組織協作的場景,需要清晰的協議和安全機制。
- 工作流程:
-
用戶向 ANP Travel Planner 提出旅行計劃請求。
-
ANP Travel Planner 將任務分配給不同組織的代理(如 Flight Agent、Hotel Agent、Weather Agent)。
-
各代理通過跨組織協議進行交互(例如 Flight Agent 與 Weather Agent 跨組織交互)。
-
各代理將結果返回給 ANP Travel Planner,由其彙總最終結果。
4. Agora: 自然語言到協議生成
專注於用戶交互,將自然語言轉換爲結構化協議,適合需要高效用戶交互的場景。
- 工作流程:
-
用戶提出自然語言請求(如 “規劃從北京到紐約的五天旅行”)。
-
Agora 通過自然語言理解模塊解析用戶請求,提取關鍵信息(如出發地、目的地、持續時間、預算)。
-
協議生成模塊將這些信息轉換爲標準化協議(如 Flight Protocol、Hotel Protocol、Weather Protocol)。
-
協議分發模塊將協議分發給相應的專業代理(如 Flight Agent、Hotel Agent、Weather Agent)。
-
各代理根據協議響應,返回結果。
https://arxiv.org/pdf/2504.16736
A Survey of AI Agent Protocols
本文由 Readfog 進行 AMP 轉碼,版權歸原作者所有。
來源:https://mp.weixin.qq.com/s/NdmFcbg7eEJ-hHf6j_iDXg