返回博客列表

当 AI Agent 开始自主执行代码,谁来兜底?微软 MXC 给出了操作系统级的答案

2026-06-18T16:00:00+08:00
MicrosoftMXCAI Agent沙箱安全Build 2026

当 AI Agent 开始自主执行代码,谁来兜底?微软 MXC 给出了操作系统级的答案

大纲

  • AI Agent 的信任困境:能力越强,风险越大
  • MXC 是什么:不是 Docker,不是 K8s,而是 OS 级的 Agent 执行边界
  • 四层 Containment 频谱:从进程隔离到 Micro-VM
  • JSON Schema + TypeScript SDK:开发者怎么用
  • 生态落地:OpenAI、NVIDIA、Manus、OpenClaw 已接入
  • Agent 365 + MXC:企业治理闭环
  • 对行业的意义:Containment 先于 Trust

当你让一个 AI Agent 写一段 Python 脚本并立即执行时,你怎么确保它不会 rm -rf /、连接一个 C2 服务器、或者读取你桌面上的工资单 PDF?

这不是假设场景。GitHub Copilot CLI、OpenAI Codex、Claude Code 这些工具每天都在生成并执行代码。Agent 的能力在飞速增长,但运行环境的安全模型还停留在"相信用户不会做蠢事"的阶段。问题在于——Agent 不是用户,它是一个非确定性的、由模型驱动的自主程序。

微软在 Build 2026 上给出了他们的答案:Microsoft Execution Containers (MXC)

MXC 是什么:不是 Docker,不是 K8s,而是 OS 级的 Agent 执行边界

MXC 的核心定位很容易被误解。它不是一个容器编排系统(不与 Kubernetes 竞争),也不是一个传统的沙箱产品(不像 gVisor 或 Firecracker 那样独立部署)。MXC 是一个嵌入在 Windows 和 WSL 内核中的策略驱动执行层

用一句话概括:开发者声明 Agent 需要什么权限,操作系统内核负责强制执行这些边界。

开发者定义 Policy → MXC SDK 生成 Config → OS 内核执行 Containment

这个设计的巧妙之处在于:开发者不需要管理底层的隔离细节(AppContainer?Session?Micro-VM?),MXC 提供了一个统一的抽象层,相同的 Policy 可以映射到不同强度的隔离后端。

四层 Containment 频谱:从进程隔离到 Micro-VM

MXC 提供了四个层级的 containment 选项,形成一个"频谱"而非单一方案:

层级 后端 隔离强度 启动开销 适用场景
进程隔离 ProcessContainer 轻量 极低(ms 级) Coding Agent、快速迭代
会话隔离 IsolationSession 中等 长运行 Agent、UI 自动化
Micro-VM NanVix / Hyperlight 处理敏感数据、不可信代码
Linux 容器 WSL + LXC/Bubblewrap 中等 Linux-first Agent 工具链

进程隔离是最轻量的选项。Agent 生成的代码在一个专用进程中运行,该进程的文件系统和网络访问被限制在 Policy 声明的范围内。GitHub Copilot CLI 已经采用了这个方案——当 Copilot 生成并执行 shell 命令时,它在 MXC 进程隔离中运行,无法访问 Policy 之外的文件。

会话隔离更进一步。Agent 在独立的 Windows Session 中运行,拥有自己的桌面、剪贴板和输入设备。这解决了 UI 欺骗、输入注入和跨会话数据泄露的问题。每个 Session 绑定一个独立的本地 ID 或 Entra 云身份,所有操作都可追溯到具体的 Agent 身份。

Micro-VM 是安全边界最强的一层。它使用 hypervisor 级别的硬件隔离(类似 Firecracker),但启动时间仍然是毫秒级。这对于处理高价值数据或运行完全不可信的第三方代码的 Agent 至关重要——即使 Agent 发现了进程级沙箱的逃逸漏洞,Micro-VM 的 hypervisor 边界也能阻止它。

Linux 容器通过 WSL 将 containment 模型扩展到 Linux 生态。Agent 可以在 WSL 中使用 LXC 或 Bubblewrap 后端运行 Python ML 框架和 Linux 工具链,同时保持 OS 级别的隔离边界。

JSON Schema + TypeScript SDK:开发者怎么用

MXC 的配置完全通过 JSON 声明。一个典型的 Agent 执行配置:

{
  "version": "0.6.0-alpha",
  "process": {
    "commandLine": "python -c \"print('hello from sandbox')\"",
    "workingDirectory": "C:\\sandbox"
  },
  "filesystem": {
    "readonlyPaths": ["C:\\tools"],
    "readwritePaths": ["C:\\sandbox\\tmp"]
  },
  "network": {
    "allowOutbound": false
  },
  "timeoutMs": 30000
}

TypeScript SDK @microsoft/mxc-sdk 提供了两种 API 模式:

一次性执行(One-shot)——适合短生命周期的代码执行:

import { spawnSandboxFromConfig, createConfigFromPolicy } from '@microsoft/mxc-sdk';

const config = createConfigFromPolicy({
  version: '0.6.0-alpha',
  filesystem: {
    readonlyPaths: ['/usr/local/lib'],
    readwritePaths: ['/tmp/agent-workspace'],
  },
  network: { allowOutbound: false },
  timeoutMs: 30_000,
});
config.process!.commandLine = 'python analyze_data.py';

const child = spawnSandboxFromConfig(config, { usePty: false });
child.stdout!.on('data', (d) => process.stdout.write(d));

状态感知生命周期(State-aware)——适合长运行的 Agent 会话:

import {
  provisionSandbox, startSandbox,
  execInSandboxAsync, stopSandbox,
  deprovisionSandbox,
} from '@microsoft/mxc-sdk';

// 多步骤生命周期:provision → start → exec → stop → deprovision
const sandbox = await provisionSandbox(config);
await startSandbox(sandbox);
const result = await execInSandboxAsync(sandbox, 'python train_model.py');
await stopSandbox(sandbox);
await deprovisionSandbox(sandbox);

这种 lifecycle 模式特别适合需要多轮交互的 Agent:先 provision 环境,然后反复执行多个步骤,最后清理。整个过程 sandbox 状态保持一致。

生态落地:OpenAI、NVIDIA、Manus、OpenClaw 已接入

MXC 的生态合作伙伴名单值得仔细看看:

  • OpenAI:Codex 使用 MXC 执行环境安全地生成和运行代码。OpenAI 技术团队成员 David Wiesen 表示:"结合 Codex 的能力与 MXC 的执行环境,我们的目标是帮助开发者从意图到可靠执行更快。"
  • NVIDIA:将 OpenShell 带到 Windows 上,基于 MXC 构建。OpenShell 提供了一个易于部署的包,用于安全运行自主、常驻的 Agent。
  • OpenClaw:已使用 MXC 在 Windows 上安全运行 node 和 gateway。
  • Manus:首席产品官 Tao Zhang 表示:"MXC 给开发者提供了策略驱动的方式定义 Agent 可以访问什么,并在运行时强制执行这些边界。"
  • Hermes Agent(Nous Research):将集成 OpenShell 和 MXC。CEO Dillon Rolnick 说:"持续运行的本地 Agent 需要有意的隔离。MXC 提供了策略驱动的基础。"

这个名单的意义在于:MXC 不是微软的封闭生态锁定。它是一个开放 SDK,任何模型(GPT、Claude、Llama、DeepSeek)构建的 Agent 都可以接入。

Agent 365 + MXC:企业治理闭环

MXC 单独解决的是"containment"问题。但企业还需要"governance"——谁能部署 Agent?Agent 的行为可审计吗?策略怎么统一下发?

这就是 Agent 365 与 MXC 的集成价值所在:

  • Microsoft Entra:为每个 Agent 分配云身份,所有操作可追溯到具体 Agent
  • Intune:IT 团队通过策略统一下发 MXC containment 规则(如禁止访问某些文件路径)
  • Defender:实时检测 prompt injection 和其他 Agent 特有威胁
  • Purview:数据治理和合规审计

这意味着企业不需要为 AI Agent 建立一套全新的安全基础设施——用现有的 Entra + Intune + Defender 栈就能管理 Agent 的安全策略。

MXC 将首先在 Windows 11 24H2(Enterprise 和 Pro 版)中发布,Windows Server 2027 随后跟进。硬件要求——支持 VBS(虚拟化安全)和 SLAT(二级地址转换)的 CPU——在大多数现代商务设备上已是标配。

对行业的意义:Containment 先于 Trust

The Futurum Group 的 VP Mitch Ashley 说了一句关键的话:

"身份归属是绑定每一个 Agent 操作到可审计身份的承重元素。Agent 构建者和平台团队现在需要基于 OS 强制执行的权限和身份模型来设计。"

这揭示了一个行业级的认知转变:AI Agent 的信任不是通过更好的模型来建立的,而是通过更好的 containment 来建立的。

一个 99.9% 准确的模型仍然可能在 0.1% 的情况下做出危险操作。Containment 确保这 0.1% 不会造成实际损害。MXC 的设计哲学正是基于这个认识:不假设 Agent 永远正确,而是假设 Agent 一定会犯错,然后限制犯错的影响范围。

MXC 目前仍在 early preview 阶段,微软明确表示当前的策略"过于宽松",会在正式发布前收紧。但方向已经清晰:当 Agent 从"回答问题"进化为"自主行动",操作系统必须成为安全的最后一道防线。

Windows 正在把自己重新定位为 AI Agent 时代的可信运行时——不是因为模型更强,而是因为 containment 更深。


作者: itech001 来源: 公众号:AI人工智能时代 网站: https://www.theaiera.cn/ 每日分享最前沿的AI新闻资讯和技术研究。

本文首发于 AI人工智能时代,转载请注明出处。

觉得文章不错?分享给更多人!