Skip to content

构建多智能体 AI 系统的五大开放协议

多智能体 AI 系统正在成为企业技术栈的基础层,行业关注点也从优化单一模型转向让智能体之间能够协同思考、通信与行动。Accenture 的调查显示,三分之一的大型企业已部署 AI 智能体以推动创新;Gartner 则预测到 2028 年,三分之一的企业应用将嵌入 Agentic AI,其中 15% 的日常决策将由 AI 自主完成。

在这一趋势下,一系列面向智能体协作的开放协议应运而生。本文将介绍构建可扩展多智能体系统的五个关键协议:MCP(Model Context Protocol)、ACP(Agent Communication Protocol)、A2A(Agent-to-Agent Protocol)、ANP(Agent Network Protocol)和 AG-UI(Agent-User Interaction Protocol),并深入探讨它们各自解决的核心问题以及协同工作方式。

原文地址:https://onereach.ai/blog/power-of-multi-agent-ai-open-protocols/

1. 五大协议全景概览

可以把一个 AI 系统想象为一家大型组织,每个 AI 智能体就是一名员工或一个职能部门。要让这个组织高效运转,就需要清晰的结构、顺畅的沟通、无缝的协调、可获取的资源以及直观的交互界面。五大协议各自承担了这个"组织"中不同的角色:

协议类比角色核心职责
MCP内部 Wiki 与操作手册提供对组织内部工具、数据源和上下文的标准化访问
ACPSlack / Email / Jira跨职能、跨工具的结构化消息通信
A2A销售部与财务部的直接协作无需管理层介入的端到端多步骤协同
ANPHR 目录与采购系统在分布式网络中发现、认证和安全连接智能体
AG-UI内部仪表盘 / 工作流工具实时的人机双向交互与状态可视化

下面用一幅 Mermaid 图来展示它们之间的关系:

2. MCP:AI 的上下文标准翻译器

MCP(Model Context Protocol)为大语言模型提供结构化的上下文信息,包括工具、数据集和提示词。如果没有 MCP,每一个应用或数据源都需要为每个 LLM 编写定制化的集成代码——这无疑是维护噩梦。

MCP 就像是 AI 世界的 USB-C:一个即插即用、一次编写即可随处复用的通用标准。

2.1 核心特性

  1. 通用工具连接:标准化 AI 模型与外部工具、API 之间的连接方式。
  2. 数据源集成:允许智能体访问实时信息和数据库。
  3. 上下文感知:确保 AI 拥有准确且最新的数据。
  4. 安全通信:提供权限验证和管理方法。

2.2 工作流程

以一个 IT 运维场景为例:员工反馈 VPN 连接频繁断开,于是向 AI 智能体寻求帮助。

整个过程实时完成,无需人工 IT 介入。MCP 作为中间层负责标准化调用与返回格式,让智能体能够"理解"来自不同工具的数据。

3. ACP:智能体之间的通信总线

Agent Communication Protocol(ACP)解决的是"智能体如何清晰地交流"这一问题。它基于 RESTful API 和 MIME 类型扩展,支持多种消息格式,且不受编程语言或技术栈限制。

3.1 核心特性

  1. 工作流编排:确保多个智能体为共同目标协同时流程顺畅。
  2. 可靠的任务委派:任务分配和结果返回都遵循标准化格式。
  3. 上下文管理:在一系列交互中维持会话上下文。
  4. 可观测性:提供监控和审计智能体行为的工具钩子。

3.2 工作流程

  1. 编排智能体创建任务,并使用 ACP 消息格式将其委派给专业智能体。
  2. 各智能体接收任务后,通过 ACP 结构化消息汇报进度和结果。
  3. 智能体可以暂停或升级任务,请求额外输入或触发 Human-in-the-Loop 操作。
  4. 结果回流至编排智能体或沿着工作流链传递。
  5. 全过程可审计,并支持可观测性钩子。

IBM 和 Linux 基金会等业界巨头正在积极参与开放安全 AI 系统的开发。最近的一份报告指出,基于 ACP 的系统在复杂的长期任务中取得了 28.3% 的准确率,展现了出色的鲁棒性和可扩展性。

3.3 使用场景

在一个客户服务中心,ACP 允许 AI 智能体、人工座席和后端系统之间交换结构化消息,包括工单更新、客户意图或跨平台的任务交接。该协议支持异步通信,确保所有参与者无论使用何种工具或时间线都能保持信息同步。

4. A2A:智能体间的深度协作协议

Agent-to-Agent Protocol(A2A)由 Google 提出,建立在 HTTP 和 JSON-RPC 之上,支持跨平台智能体之间有状态的、长时间运行的交互

"A2A has the potential to unlock a new era of agent interoperability, fostering innovation and creating more powerful and versatile agentic systems." — Google

4.1 核心特性

  1. 智能体发现:通过公开的 Agent Card(智能体名片)来宣传自身的能力与联系方式。
  2. 能力共享:其他智能体可以发现这些能力并发起通信。
  3. 标准化通信:智能体之间传输的消息遵循统一格式。
  4. 体验协调:智能体可以制定如何向用户呈现自身以及如何最优交互的方案。

4.2 工作流程

以一个电商订单场景为例:

当顾客下单后,支付智能体立即处理扣款,反欺诈智能体同步验证交易合法性,物流智能体安排配送——全部自动即时完成,无需中央调度器。这种去中心化的智能体间协作让整个流程更加可靠,并可轻松跨区域、跨平台和跨供应商扩展。

4.3 与 ACP 的区别

虽然 ACP 和 A2A 都涉及智能体间通信,但侧重点不同。ACP 更像一个通用的消息总线,适合多方参与的工作流编排;而 A2A 专注于两个或多个智能体之间的直接、实时、有状态的深度协作,支持多模态(文本、音频、视频)交互。

5. ANP:构建智能体的互联网

Agent Network Protocol(ANP)解决的是更大规模的问题:跨组织、跨网络的智能体发现、身份认证与安全连接。如果说 A2A 是两个同事之间的直接对话,那么 ANP 就是帮你找到这个同事并验证他身份的 HR 目录系统。

5.1 三层架构

ANP 采用三层架构设计:

  1. 身份层(Decentralized Identity):每个智能体拥有可验证的身份标识(通常基于 DID 标准),确保安全的端到端加密通信。
  2. 元协议层(Meta-Protocol):用于通信协商,使不同组织的智能体能够就通信方式达成一致。
  3. 应用层(Application Layer):负责能力注册与发现,智能体可以宣传自己的功能,允许其他智能体查找并调用。

5.2 使用场景

想象一个全球供应链场景:供应商、制造商和配送合作伙伴的 AI 智能体需要跨组织协作。通过 ANP,这些智能体可以:

  • 在网络中定位彼此
  • 安全地认证对方身份
  • 交换库存、生产计划和配送路由等关键信息

整个过程无需中央监管或人工干预,实现了真正的分布式协同。

6. AG-UI:让 AI 对人类更友好

Agent-User Interaction Protocol(AG-UI)是面向人机交互的协议。无论后端 AI 系统多么强大,最终都需要通过直观的界面与人类用户互动。AG-UI 就像一个通用翻译器——无论智能体"说"什么语言,AG-UI 都确保与用户的沟通流畅自然。

6.1 核心特性

  1. 事件驱动架构:响应客户端或智能体端的事件,触发更新或响应。
  2. 标准化事件类型:定义常见的交互事件,如接收消息、启动任务、发送更新等。
  3. 双向交互:支持用户与智能体之间的双向互动循环。
  4. 实时流式更新:依赖 SSE(Server-Sent Events)或 WebSocket 推送实时更新,用户无需刷新或轮询。

6.2 工作流程

以一个 AI 财务顾问场景为例:用户正在咨询购房建议,AG-UI 使 AI 智能体能够实时提供推荐、追问细节并动态调整建议,如同与真人顾问交流般自然。

7. 从协议到实践:协同构建可扩展的 AI 生态

我们正进入企业 AI 的"协议中心化"阶段。未来的竞争力不在于你选用了哪个模型,而在于你的 AI 生态系统能否高效地通信、协作与协调

五大协议各自解决了不同维度的问题:

维度协议关键问题
上下文MCPAI 如何获取工具与数据?
通信ACP智能体之间如何传递消息?
协作A2A智能体如何直接深度合作?
发现ANP如何在网络中找到并认证智能体?
交互AG-UI人类如何与 AI 实时互动?

在实际落地中,并不需要一次性实现全部五个协议。可以根据具体场景从一两个协议入手,随着系统的成熟逐步整合更多协议。例如,对于一个内部客服系统,可以先引入 MCP 打通工具访问和 AG-UI 提升用户体验,然后再通过 ACP 和 A2A 实现多智能体协同。

8. 常见问题

8.1 这些协议为什么被称为"开放"协议?

开放协议是厂商中立的、公开文档化的,并且跨系统可互操作。它们使 AI 智能体、工具和平台能够无缝协作,不受专有技术锁定,非常适合大规模企业级 AI 架构。

8.2 构建 Agentic AI 系统必须实现全部五个协议吗?

不一定。每个协议解决一个特定的挑战——MCP 处理上下文、ACP 处理通信、A2A 处理协作、ANP 处理发现、AG-UI 处理人机交互。可以根据使用场景从一两个开始,随着系统成熟再逐步整合。

8.3 这些协议如何降低集成成本?

通过采用标准化格式和通信模型,这些协议避免了高成本的定制化集成,从而减少工程投入、部署时间和维护成本。这在大型多智能体系统中尤其重要,因为维护成本往往是首要关注点。

8.4 这些协议已在生产环境中使用了吗?

是的。MCP、ACP 和 A2A 已在医疗、金融和零售行业的实际项目中使用。Microsoft、Google 和 IBM 等巨头也在积极参与这些标准的开发与采用。