4 大類 AI Agent 協議框架全面綜述

對現有的 LLM AI Agent 通信協議進行了系統性的概述，並將其分爲四大類，以幫助用戶和開發者爲特定應用場景選擇最適合的協議。

一、AI Agent 協議的發展

AI Agent 協議的定義：代理協議是標準化框架，定義了代理之間以及代理與外部系統之間結構化通信的規則、格式和程序。與傳統交互機制（如 API、GUI 或 XML）相比，協議在效率、操作範圍、標準化和 AI 原生性方面具有顯著優勢。

代理協議的作用：
互操作性：允許不同架構的異構代理系統無縫協作。
標準化交互：確保代理能夠輕鬆集成和擴展其功能，通過納入新工具、API 或服務。
安全性和治理：提供內置機制以管理代理行爲，確保在明確定義的安全操作參數內運行。
降低開發複雜性：通過抽象化交互邏輯，減少代理開發的複雜性，使開發者能夠專注於增強核心代理功能。
促進集體智能：通過標準化通信渠道共享見解和協調行動，使分佈式代理系統能夠實現單一架構無法實現的結果。

二、AI Agent 協議分類框架

提出了一個二維分類框架，將協議分爲上下文導向型（Context-Oriented Protocols）和代理間通信型（Inter-Agent Protocols），並進一步細分爲通用型（General-Purpose）和特定領域型（Domain-Specific）。

1、上下文導向型協議

面向上下文的協議主要解決 AI 代理與外部工具或數據源之間的交互問題，幫助代理獲取必要的上下文信息以完成任務。這類協議進一步分爲：

1.1 General-Purpose Protocols
MCP（Model Context Protocol）：由 Anthropic 提出，是一個通用的上下文獲取協議，允許 AI 代理通過標準化的方式與外部資源（如數據、工具和服務）進行交互。它採用客戶端 - 服務器架構，將工具調用與 LLM 響應解耦，提高了數據安全性和隱私性。
1.2 Domain-Specific Protocols
agents.json：由 WildCardAI 提出，是一個基於 OpenAPI 標準的開源機器可讀合同格式，專門用於將傳統 API 與 AI 代理橋接，支持網站聲明 AI 兼容接口、認證方案和多步工作流。

2、Agent 間通信協議

面向代理間交互的協議專注於代理之間的協作和通信，以解決更復雜的任務。

2.1 General-Purpose Protocols
ANP（Agent Network Protocol）：由開源社區開發，旨在實現不同代理之間的互操作性，構建一個開放、安全、高效的協作網絡。它支持跨域代理通信，採用去中心化身份認證機制。
A2A（Agent2Agent Protocol）：由 Google 提出，專注於企業內部代理之間的複雜問題解決和協作，支持異步工作流和多模態交互。
AITP（Agent Interaction & Transaction Protocol）：由 NEAR 基金會提出，支持代理之間的安全通信、協商和價值交換，特別適用於跨信任邊界的交互。
AConP（Agent Connect Protocol）：由 Cisco 提出，定義了調用和配置代理的標準接口。
AComP（Agent Communication Protocol）：由 Al and Data 提出，旨在標準化代理之間的通信，促進自動化和協作。
Agora：由牛津大學提出，是一個元協議，允許代理根據上下文采用不同的通信協議。
2.2 Domain-Specific Protocols
LMOS（Language Model Operating System）：由 Eclipse 基金會提出，旨在構建一個互聯網代理生態系統，支持代理的發現、交互和互操作性。
Agent Protocol：由 AI Engineer Foundation 提出，定義了控制檯與 AI 代理之間的通信標準。
LOKA：由 CMU 提出，是一個去中心化的框架，用於建立知識型代理之間的信任和倫理協調。
PXP（Predict and eXplain Protocol）：由 BITS Pilani 提出，專注於人機交互中的雙向可解釋性。
CrowdES：由 GIST.KR 提出，用於機器人代理之間的交互，模擬真實的人羣動態。
SPPs（Spatial Population Protocols）：由利物浦大學提出，用於解決匿名機器人之間的分佈式定位問題。

三、案例分析

通過一個具體的用例——計劃從北京到紐約的五天旅行——來比較和分析四種不同的 AI 代理協議：MCP、A2A、ANP 和 Agora：

1. MCP: 單個代理調用所有工具

適用於任務定義明確且外部服務接口穩定的場景，但不適用於動態環境。

工作流程：

用戶向 MCP Travel Client 提出旅行計劃請求。
MCP Travel Client 直接調用 Flight Server、Hotel Server 和 Weather Server，分別獲取航班、酒店和天氣信息。
各服務返回信息後，MCP Travel Client 聚合所有響應，生成完整的旅行計劃。

2. A2A: 企業內部的複雜協作

適合企業內部多個專業代理直接通信的場景，依賴於穩定的內部基礎設施和高效的代理間數據交換。

工作流程：

用戶向 A2A Travel Planner 提出旅行計劃請求。
A2A Travel Planner 將任務分配給各個專業代理（如 Flight Agent、Hotel Agent、Weather Agent）。
各代理直接相互通信，獲取所需信息（例如 Flight Agent 直接從 Weather Agent 獲取天氣信息）。
各代理將結果返回給 A2A Travel Planner，由其彙總最終結果。

3. ANP: 跨領域代理協議

適合跨組織協作的場景，需要清晰的協議和安全機制。

工作流程：

用戶向 ANP Travel Planner 提出旅行計劃請求。
ANP Travel Planner 將任務分配給不同組織的代理（如 Flight Agent、Hotel Agent、Weather Agent）。
各代理通過跨組織協議進行交互（例如 Flight Agent 與 Weather Agent 跨組織交互）。
各代理將結果返回給 ANP Travel Planner，由其彙總最終結果。

4. Agora: 自然語言到協議生成

專注於用戶交互，將自然語言轉換爲結構化協議，適合需要高效用戶交互的場景。

工作流程：

用戶提出自然語言請求（如 “規劃從北京到紐約的五天旅行”）。
Agora 通過自然語言理解模塊解析用戶請求，提取關鍵信息（如出發地、目的地、持續時間、預算）。
協議生成模塊將這些信息轉換爲標準化協議（如 Flight Protocol、Hotel Protocol、Weather Protocol）。
協議分發模塊將協議分發給相應的專業代理（如 Flight Agent、Hotel Agent、Weather Agent）。
各代理根據協議響應，返回結果。

https://arxiv.org/pdf/2504.16736
A Survey of AI Agent Protocols

本文由 Readfog 進行 AMP 轉碼，版權歸原作者所有。
來源：https://mp.weixin.qq.com/s/NdmFcbg7eEJ-hHf6j_iDXg

1、上下文導向型協議

2、Agent 間通信協議

1. MCP: 單個代理調用所有工具

2. A2A: 企業內部的複雜協作

3. ANP: 跨領域代理協議

猜你喜歡