Agent 相关的核心要点是什么？

本文围绕 Agent、agentgateway、MCP、A2A、Gateway、Rust、Kubernetes、Linux Foundation 展开，当 Agent 成为一等公民，传统 API Gateway 不够用了。agentgateway 用 Rust 写了一个 AI 原生网关，同时支持 MCP、A2A 和 LLM 路由，已成 Linux Foundation 项目。。详细解读见正文。

Agent 爆发之后，谁来做流量网关？agentgateway 的答案

2026-05-28T07:42:00+08:00

AgentagentgatewayMCPA2AGatewayRustKubernetesLinux Foundation

Agent 爆发之后，谁来做流量网关？agentgateway 的答案

API Gateway 这个东西，从 Nginx 到 Kong 到 Envoy，已经卷了二十年。但当你开始部署 AI Agent——一个 Agent 要调 LLM、调工具、还要跟别的 Agent 通信——你会发现传统网关根本不够用。

LLM 请求不是普通 HTTP 调用，它有 streaming、有 token 计费、有 prompt 注入风险。MCP 工具调用不是 REST API，它有自己的协议和传输层。Agent-to-Agent 通信更是全新领域，A2A 协议才刚出来。

agentgateway 就是来填这个空白的。Rust 写的，2.8k stars，146 个贡献者，已经是 Linux Foundation 项目。它自称"第一个完整的 Agentic AI 连接方案"。

本文提纲

Agent 时代为什么需要新网关
agentgateway 的三层架构
LLM Gateway：统一模型调用
MCP Gateway：工具联邦
A2A Gateway：Agent 间通信
Inference Routing：智能推理路由
Guardrails：多层防护
Kubernetes 原生部署
和传统 API Gateway 的本质区别

Agent 时代为什么需要新网关

传统 API Gateway 解决的核心问题是：请求路由、负载均衡、限流、认证。

但在 Agent 系统里，你要面对的新问题：

多协议并存。一个 Agent 同时要跟 LLM（OpenAI/Anthropic API）、工具（MCP 协议）、其他 Agent（A2A 协议）通信。三种不同的协议，传统网关只能处理 HTTP。

流式响应。LLM 的输出是 streaming 的，一个请求可能持续几十秒。传统网关的请求-响应模型不适合。

Token 计费。不是按请求量收费，是按 token 收费。你需要预算控制、花费追踪、跨 provider 的成本优化。

安全边界不同。传统安全关注的是"谁能访问哪个 API"。Agent 安全关注的是"这个 prompt 有没有注入风险"、"这个工具调用是否越权"、"Agent 之间能不能互相信任"。

Agent 发现。在微服务里，服务发现靠 DNS 或 service mesh。在 Agent 系统里，Agent 怎么知道另一个 Agent 能做什么？A2A 协议定义了 capability discovery，但网关要能代理这个发现过程。

agentgateway 的思路：用 AI 原生协议（MCP + A2A）重新设计网关，而不是在传统网关上打补丁。

agentgateway 的三层架构

graph TB
    subgraph Agents
        A1["Agent 1"]
        A2["Agent 2"]
        A3["Agent 3"]
    end

    subgraph AgentGateway
        LLM["LLM Gateway
OpenAI / Anthropic / Gemini / Bedrock"]
        MCP["MCP Gateway
Tool Federation / OAuth"]
        A2A["A2A Gateway
Capability Discovery / Task Collab"]
        IR["Inference Routing
GPU / KV Cache / LoRA"]
        GR["Guardrails
Regex / Moderation / Webhooks"]
        SEC["Security
JWT / OAuth / RBAC / TLS"]
    end

    subgraph Backends
        B1["LLM Providers"]
        B2["MCP Servers"]
        B3["Other Agents"]
        B4["Self-hosted Models"]
    end

    A1 --> LLM
    A2 --> MCP
    A3 --> A2A
    LLM --> B1
    MCP --> B2
    A2A --> B3
    IR --> B4
    GR --> LLM
    SEC --> LLM

六个核心模块，三层连接：Agent → Gateway → Backend。

关键设计决策：所有协议在 Gateway 层统一处理，Agent 不需要知道后端是什么协议。你用 OpenAI SDK 调 Gateway，Gateway 帮你转发到 Anthropic；你用 MCP 协议调工具，Gateway 帮你做 tool federation。

LLM Gateway：统一模型调用

这是最基础的功能，也是最容易理解的。

统一 API：所有 LLM provider 都暴露成 OpenAI 兼容的 API。你的代码只需要改一个 base URL，就能在不同 provider 之间切换。支持 OpenAI、Anthropic、Gemini、AWS Bedrock、Azure AI Foundry 等。

预算和花费控制：这是生产环境最关心的。你可以设 token 预算上限，超了就拒绝请求。可以按用户、按项目、按 Agent 追踪花费。

Prompt 增强：在请求发给 LLM 之前，Gateway 可以自动注入 system prompt、添加 safety instruction、做 prompt 模板替换。

负载均衡和故障转移：同一个请求可以配多个后端 provider，一个挂了自动切到另一个。对于高可用场景，这是刚需。

MCP Gateway：工具联邦

这部分是 agentgateway 最有价值的创新。

工具联邦（Tool Federation）：一个 MCP Server 只暴露有限的工具。但你的 Agent 可能需要调很多工具。Gateway 层可以把多个 MCP Server 聚合起来，暴露一个统一的工具列表给 Agent。

多传输支持：MCP 协议支持 stdio、HTTP、SSE、Streamable HTTP 四种传输方式。Gateway 全部支持，而且可以在不同传输之间做桥接。

OpenAPI 集成：你有现成的 REST API，想让 Agent 调用？Gateway 可以把 OpenAPI spec 自动转成 MCP 工具定义，Agent 不需要知道底层是 REST 还是 MCP。

OAuth 认证：工具调用需要认证？Gateway 内建了 OAuth 支持。最新版本（v1.3.0-alpha.1）还加入了 Okta 作为一等公民的 MCP 认证 provider。

内置 Playground：agentgateway 有一个 Web UI，你可以直接在浏览器里试 MCP 工具调用、看请求响应、调试工具行为。这对开发阶段非常有用。

A2A Gateway：Agent 间通信

这是最前沿的部分。A2A（Agent-to-Agent）协议是 Google 提出的，用于解决 Agent 之间的互操作问题。

能力发现（Capability Discovery）：Agent A 想找能做"数据分析"的 Agent，Gateway 帮它发现 Agent B 有这个能力。

模态协商（Modality Negotiation）：Agent A 只能输出文本，Agent B 能接收文本和图片。Gateway 帮它们协商出一个双方都能理解的通信格式。

任务协作（Task Collaboration）：Agent A 把一个子任务交给 Agent B，Gateway 负责跟踪任务状态、转发结果、处理超时。

在 v1.3.0-alpha.1 版本中，A2A 已经成为一等公民的 backend 类型，说明这个功能正在快速成熟。

Inference Routing：智能推理路由

这个功能面向自托管模型的场景。

如果你在公司内部部署了自己的 LLM（用 vLLM、TensorRT-LLM 等），你需要一个路由层来决定每次推理请求发给哪个模型实例。agentgateway 的 Inference Routing 基于 Kubernetes Gateway API 的扩展实现，路由决策可以考虑：

GPU 利用率：哪个实例还有算力？
KV Cache：哪个实例已经缓存了相关的 context？
LoRA Adapter：哪个实例加载了你需要的微调权重？
队列深度：哪个实例排队最短？

这基本上是把 service mesh 的智能路由搬到了 AI 推理领域。

Guardrails：多层防护

安全不是单一层次的事，agentgateway 用了多层防护：

Regex 过滤：最基础的，用正则匹配 prompt 和 response 中的敏感内容。

OpenAI Moderation：直接调 OpenAI 的 moderation API 做内容审核。

AWS Bedrock Guardrails：如果你用 AWS，可以直接复用 Bedrock 的 Guardrails 配置。

Google Model Armor：Google Cloud 的内容防护。

自定义 Webhook：以上都不满足？写一个 webhook，Gateway 会把每个请求先发给你，你决定放行还是拒绝。

五层防护叠加，基本覆盖了从"简单过滤"到"复杂业务规则"的全场景。

Kubernetes 原生部署

agentgateway 不只是一个 standalone binary，它有完整的 Kubernetes 集成。

内置 Controller：不需要额外装 Istio 或其他 service mesh。agentgateway 自带 Kubernetes controller，可以动态发现和配置后端。

Gateway API 支持：使用 Kubernetes Gateway API 的标准 CRD（Custom Resource Definition）来配置路由。如果你已经熟悉 Gateway API，上手成本几乎为零。

Helm Chart：cr.agentgateway.dev/charts/agentgateway 一行命令装好。

Docker 镜像：cr.agentgateway.dev/agentgateway:v1.2.1 拉下来就能跑。

两种部署模式：

Standalone：本地开发或简单部署，一个 binary 搞定
Kubernetes：生产环境，用 controller + Gateway API 动态管理

和传统 API Gateway 的本质区别

维度	传统 API Gateway	agentgateway
核心协议	HTTP/HTTPS/gRPC	MCP + A2A + OpenAI API
路由目标	微服务 / API	LLM Provider / MCP Server / Agent
计费模型	按请求 / 按带宽	按 Token
安全模型	API Key / OAuth	Prompt 过滤 / RBAC / 工具权限
流式支持	有限	原生 streaming
工具发现	N/A	MCP Tool Federation
Agent 发现	N/A	A2A Capability Discovery
推理路由	N/A	GPU / KV Cache / LoRA
项目背景	各厂商	Linux Foundation

最关键的区别在第一行：传统网关的协议假设是 HTTP，而 agentgateway 的协议假设是 MCP 和 A2A。这不是功能增量的区别，是架构范式的区别。

技术栈：Rust（代理核心）+ Go（Kubernetes controller）。Rust 写的代理性能极高，Go 写的 controller 跟 Kubernetes 生态无缝集成。Rust edition 2024，最低 Rust 1.90，项目非常新。

背景：由 Blacksmith 赞助开发，核心贡献者 howardjohn 是 Istio 的前 maintainer。有 Istio 背景的人来做 AI 网关，service mesh 的经验直接复用。

项目治理：已经进入 Linux Foundation，有正式的 TSC（Technical Steering Committee）、贡献者指南、行为准则。不是个人项目，是社区治理的开源项目。

当前最新稳定版 v1.2.1（2026-05-15），alpha 版 v1.3.0-alpha.1（2026-05-23）。迭代速度很快，两周一个版本。

agentgateway 解决的是一个真实存在的痛点：当你的 Agent 系统从 demo 走向 production，你需要一个"AI 原生的 Nginx"。它不替你选模型、不替你写 prompt，但它把模型调用、工具连接、Agent 通信这三条线统一管起来，加上安全、可观测、治理。

如果你在做 Agent infra，值得花半小时跑一下 quickstart。

作者: itech001
来源: 公众号：AI人工智能时代
网站: https://www.theaiera.cn/
每日分享最前沿的AI新闻资讯和技术研究。

本文首发于 AI人工智能时代，转载请注明出处。

Agent 爆发之后，谁来做流量网关？agentgateway 的答案

Agent 爆发之后，谁来做流量网关？agentgateway 的答案

本文提纲

Agent 时代为什么需要新网关

agentgateway 的三层架构

LLM Gateway：统一模型调用

MCP Gateway：工具联邦

A2A Gateway：Agent 间通信

Inference Routing：智能推理路由

Guardrails：多层防护

Kubernetes 原生部署

和传统 API Gateway 的本质区别

相关阅读

AI 技术日报 - 2026-07-13

AI 技术日报 - 2026-06-27

AI 技术日报（2026.06.23）：OpenAI 发布 GPT-5.5-Cyber 安全模型

Vessel Browser：当 AI Agent 需要一双眼睛，这个开源浏览器给了它整个身体