返回博客列表

Anthropic 推出 Claude 认证架构师考试:不是考 Prompt,而是考你能不能造一个生产级 Agent

2026-06-20
[AnthropicClaude认证CCA-FAI AgentMCP]

终于有人给 AI 工程师发了一张「驾照」

2026 年 3 月,Anthropic 正式推出了 Claude Certified Architect – Foundations (CCA-F) 认证考试。

这不是一个「如何使用 ChatGPT 写邮件」的入门课。CCA-F 是一个严肃的架构师级别认证——60 道场景化选择题、120 分钟限时、监考环境、720/1000 的通过分数。它测试的不是你会不会写 prompt,而是你能不能用 Claude 设计、构建和运维一个生产级的 AI 系统。

目前考试对 Anthropic 合作伙伴公司员工开放,前 5,000 名合作伙伴员工免费参加。

考试长什么样?

基本参数

项目 详情
考试名称 Claude Certified Architect – Foundations (CCA-F)
出题方 Anthropic 官方
题型 60 道场景化多选题
时长 120 分钟
通过分数 720 / 1000
考试形式 在线监考(Proctored)
场景 从 6 个场景中随机选 4 个
费用 前 5,000 名合作伙伴员工免费

不是背题就能过

每道题都嵌入在一个真实的生产场景中。你不是在回答「Agent SDK 有哪些 API」,而是在回答:

"你是一个客户支持团队的架构师。你需要设计一个能处理退款、查询订单状态、并在复杂情况下自动升级到人工的 Agent。以下哪种架构最符合 Anthropic 的最佳实践?"

你需要理解:什么时候用 Agent SDK 的 hooks 做合规检查、什么时候该用 MCP 工具、什么时候该让 Agent 自己决定、什么时候必须人类审批。

5 大知识域,覆盖 Claude 生态全貌

考试覆盖 5 个域,每个域有明确的权重:

Domain 1:Agentic Architecture & Orchestration(27%)

这是最重的一块。考的是你能不能用 Claude 的 Agent SDK 设计和编排多 Agent 系统。

核心考点:

  • Agentic Loops:循环的终止条件不是靠固定次数,而是靠 stop_reasontool_use vs end_turn
  • Multi-Agent Orchestration:Hub-and-spoke 架构、coordinator-subagent 模式
  • Lifecycle Hooks:用代码而不是 prompt 来强制执行业务规则
  • Session Management:会话状态的恢复、分叉和隔离
  • Task Decomposition:把一个大任务拆成多个子 Agent 并行执行

Domain 2:Tool Design & MCP Integration(18%)

考的是你怎么给 Agent 设计工具,以及怎么集成 MCP(Model Context Protocol)服务。

核心考点:

  • 工具描述的最佳实践(description 写得不好 = 模型用不对)
  • 结构化错误响应:必须包含 isErrorerrorCategoryisRetryable 和上下文信息
  • 工具数量控制:每个 Agent 保持 4-5 个工具,超过 18 个工具的模型选择准确率显著下降
  • MCP Server 的配置和集成
  • Claude 内置工具(Read、Write、Bash、Grep、Glob)的选择策略

Domain 3:Claude Code Configuration & Workflows(20%)

考的是你怎么配置 Claude Code 来支持团队开发工作流。

核心考点:

  • CLAUDE.md 层级:全局 → 项目 → 目录 → 文件的配置继承
  • 自定义 slash commands 和 Skills
  • Plan Mode vs Direct Execution:什么时候让 Claude 先规划再执行,什么时候直接干活
  • 迭代优化技术
  • CI/CD 集成:用 -p 标志进行非交互式运行、--output-format json 获取结构化输出

Domain 4:Prompt Engineering & Structured Output(20%)

不是「写个好 prompt」,而是怎么在生产系统中可靠地获得结构化输出。

核心考点:

  • tool_use 模式:用 tool_use 而不是纯文本解析来获取结构化数据
  • JSON Schema 设计
  • Validation-Retry Loop:验证输出 → 不符合 schema → 自动重试
  • Few-shot prompting 保持一致性
  • Multi-instance & multi-pass review:用不同的 session 做 review,避免 reasoning context 偏见

Domain 5:Context Management & Reliability(15%)

考的是生产环境中最容易翻车的问题:上下文管理。

核心考点:

  • 长上下文处理与 progressive summarization 的风险
  • 多 Agent 间的上下文传递
  • Error propagation:错误在 multi-agent 系统中怎么传播
  • Escalation patterns:基于任务复杂度和策略缺口升级,不是基于情感分析
  • 信息溯源(Provenance)和多源综合
  • Confidence calibration:不要依赖模型的 self-reported confidence,用结构化标准判断

6 个考试场景(随机选 4 个)

考试不是抽象的知识点问答,而是把你放进 6 个真实场景之一:

1. Customer Support Resolution Agent

设计一个客服 Agent:处理咨询、解决问题、复杂情况升级人工。考 Agent SDK、MCP 工具、升级逻辑。

2. Code Generation with Claude Code

为开发团队配置 Claude Code 工作流。考 CLAUDE.md 配置、plan mode、slash commands、TDD 迭代。

3. Multi-Agent Research System

构建一个 coordinator-subagent 并行研究系统。考 multi-agent 编排、上下文隔离和传递、错误传播、结果综合。

4. Developer Productivity with Claude

用 Claude Agent SDK 构建开发者工具。考内置工具选择、MCP server 集成、代码库探索策略。

5. Claude Code for CI/CD

把 Claude Code 集成到 CI/CD 流水线。考 -p 非交互模式、structured output、Batch API、session 隔离。

6. Structured Data Extraction

从非结构化文档中提取结构化数据。考 JSON schema 设计、tool_use、validation-retry loop、few-shot prompting。

考试中的「陷阱答案」

CCA-F 的选择题设计得非常刁钻——错误选项看起来很合理,但都是常见的反模式。官方总结了一些高频陷阱:

循环终止

  • :用自然语言解析来决定是否继续循环

  • :检查 stop_reasontool_use 表示还需要调用工具,end_turn 表示完成)

  • :设置任意迭代上限(如「最多跑 10 次」)作为主要停止机制

  • :让 agentic loop 通过 stop_reason 自然终止

业务规则执行

  • :用 prompt 指令来强制执行关键业务规则
  • :用程序化的 hooks(如 onToolCall)做确定性检查

升级策略

  • :让模型自己报告 confidence score,然后基于此升级

  • :用结构化标准和程序化检查来决定是否升级

  • :基于情感分析升级(用户生气了 → 转人工)

  • :基于任务复杂度和策略缺口升级

错误处理

  • :通用错误消息(「操作失败」)

  • :包含 isErrorerrorCategoryisRetryable 和上下文的结构化错误

  • :静默吞掉错误(空结果 = 成功)

  • :区分「没有权限访问」和「确实没有数据」

工具管理

  • :给一个 Agent 塞 18+ 个工具
  • :每个 Agent 保持 4-5 个工具,超过后做工具分发(Tool Distribution)

代码审查

  • :同一个 session 里让 Agent 生成代码再自己审查
  • :用不同的 session 做 generator 和 reviewer,避免 reasoning context bias

备考路径

官方免费课程

Anthropic 的认证平台(anthropiccertifications.com)提供了完整的备考课程:

Claude Certified Architect — Foundations(30 节课)

  • 覆盖所有 5 个域
  • 包含动画图解、考试陷阱分析、动手练习、场景化测验

Claude Code 101(20 节课)

  • Claude Code 从入门到高级
  • Hooks、MCP Server、SDK 集成

Introduction to MCP(21 节课)

  • Model Context Protocol 端到端
  • 架构、primitives、构建 server 和 client

Introduction to Subagents(18 节课)

  • 子 Agent 委托
  • 上下文隔离、设计模式、多 Agent 编排

Introduction to Agent Skills(16 节课)

  • 端到端构建 Agent Skills
  • SKILL.md、progressive disclosure、多文件技能、分享

备考平台功能

  • Knowledge Graph:150+ 概念节点,可视化知识关联
  • Adaptive Practice:500+ 道自适应题目,针对弱项强化
  • Mock Exams:5 套完整模拟考试(60 题 / 120 分钟)
  • FSRS Spaced Repetition:科学的间隔复习调度
  • AI Tutor:Claude 驱动的个性化辅导

12 周学习计划

官方推荐的 12 周结构化学习计划,按周分配 5 个域的学习进度。

备考费用

项目 费用
认证平台基础版 免费(概念库、知识图谱、课程、间隔复习、自适应练习)
认证平台 Premium ₹999(一次性,约 ¥85):AI Tutor、5 套模拟考试、性能仪表盘
考试费 前 5,000 名合作伙伴员工免费
CertSafari 题库 614 道练习题(付费)

谁应该考这个?

适合的人

  • 解决方案架构师:正在用 Claude API 设计生产级 AI 应用
  • AI 工程师:负责 Agent 系统的架构和运维
  • 平台工程师:在团队中推广 Claude Code 和 MCP 集成
  • 技术主管:需要评估 AI 系统的质量和安全性

不适合的人

  • 只想学 prompt engineering 的初学者(去考 Anthropic 的 AI Fluency 课程)
  • 不在 Anthropic 合作伙伴公司的(暂时无法参加考试)
  • 只想拿个证书挂在 LinkedIn 的(这个考试真的需要懂 Agent 架构)

这个认证说明了什么?

说实话,AI 领域的认证目前还没有像 AWS Solutions Architect 或 Kubernetes CKA 那样的行业认可度。CCA-F 的价值取决于:

  1. Anthropic 的市场地位:Claude 在企业级 Agent 开发中的采用率
  2. 考试质量:从场景设计和反模式分析来看,这不是一个「交钱就过」的水证
  3. 实际需求:越来越多的公司在招 AI Agent 方向的工程师,一个有深度的认证可以作为筛选标准

但至少,CCA-F 的考试内容设计是认真的。它不考「Claude 有多少参数」这种 trivia,而是考「你的 Agent 在生产环境中出了错,你怎么让系统优雅地处理而不是崩溃」——这是真正做过 Agent 开发的人才会问的问题。

如何报名

  1. 访问 Anthropic Skilljar 注册页面
  2. 提交访问请求(目前仅限合作伙伴公司员工)
  3. 收到考试访问权限后,在线参加考试
  4. 考试结果即时出分

一句话总结

CCA-F 不是在考你知不知道 Claude 是什么,而是在考你能不能用它造一个真正能上线的系统——一个能在凌晨三点处理异常、在上下文爆炸时不崩溃、在多 Agent 协作时不丢数据的系统。

如果你的日常工作就是在干这件事,这个认证值得一试。如果你正在准备做这件事,它的备考材料本身就是一份极好的 Agent 架构指南。


作者: itech001 来源: 公众号:AI人工智能时代 网站: https://www.theaiera.cn/ 每日分享最前沿的AI新闻资讯和技术研究。

本文首发于 AI人工智能时代,转载请注明出处。

参考来源:

分享给朋友