Anthropic 推出 Claude 认证架构师考试:不是考 Prompt,而是考你能不能造一个生产级 Agent
终于有人给 AI 工程师发了一张「驾照」
2026 年 3 月,Anthropic 正式推出了 Claude Certified Architect – Foundations (CCA-F) 认证考试。
这不是一个「如何使用 ChatGPT 写邮件」的入门课。CCA-F 是一个严肃的架构师级别认证——60 道场景化选择题、120 分钟限时、监考环境、720/1000 的通过分数。它测试的不是你会不会写 prompt,而是你能不能用 Claude 设计、构建和运维一个生产级的 AI 系统。
目前考试对 Anthropic 合作伙伴公司员工开放,前 5,000 名合作伙伴员工免费参加。
考试长什么样?
基本参数
| 项目 | 详情 |
|---|---|
| 考试名称 | Claude Certified Architect – Foundations (CCA-F) |
| 出题方 | Anthropic 官方 |
| 题型 | 60 道场景化多选题 |
| 时长 | 120 分钟 |
| 通过分数 | 720 / 1000 |
| 考试形式 | 在线监考(Proctored) |
| 场景 | 从 6 个场景中随机选 4 个 |
| 费用 | 前 5,000 名合作伙伴员工免费 |
不是背题就能过
每道题都嵌入在一个真实的生产场景中。你不是在回答「Agent SDK 有哪些 API」,而是在回答:
"你是一个客户支持团队的架构师。你需要设计一个能处理退款、查询订单状态、并在复杂情况下自动升级到人工的 Agent。以下哪种架构最符合 Anthropic 的最佳实践?"
你需要理解:什么时候用 Agent SDK 的 hooks 做合规检查、什么时候该用 MCP 工具、什么时候该让 Agent 自己决定、什么时候必须人类审批。
5 大知识域,覆盖 Claude 生态全貌
考试覆盖 5 个域,每个域有明确的权重:
Domain 1:Agentic Architecture & Orchestration(27%)
这是最重的一块。考的是你能不能用 Claude 的 Agent SDK 设计和编排多 Agent 系统。
核心考点:
- Agentic Loops:循环的终止条件不是靠固定次数,而是靠
stop_reason(tool_usevsend_turn) - Multi-Agent Orchestration:Hub-and-spoke 架构、coordinator-subagent 模式
- Lifecycle Hooks:用代码而不是 prompt 来强制执行业务规则
- Session Management:会话状态的恢复、分叉和隔离
- Task Decomposition:把一个大任务拆成多个子 Agent 并行执行
Domain 2:Tool Design & MCP Integration(18%)
考的是你怎么给 Agent 设计工具,以及怎么集成 MCP(Model Context Protocol)服务。
核心考点:
- 工具描述的最佳实践(description 写得不好 = 模型用不对)
- 结构化错误响应:必须包含
isError、errorCategory、isRetryable和上下文信息 - 工具数量控制:每个 Agent 保持 4-5 个工具,超过 18 个工具的模型选择准确率显著下降
- MCP Server 的配置和集成
- Claude 内置工具(Read、Write、Bash、Grep、Glob)的选择策略
Domain 3:Claude Code Configuration & Workflows(20%)
考的是你怎么配置 Claude Code 来支持团队开发工作流。
核心考点:
- CLAUDE.md 层级:全局 → 项目 → 目录 → 文件的配置继承
- 自定义 slash commands 和 Skills
- Plan Mode vs Direct Execution:什么时候让 Claude 先规划再执行,什么时候直接干活
- 迭代优化技术
- CI/CD 集成:用
-p标志进行非交互式运行、--output-format json获取结构化输出
Domain 4:Prompt Engineering & Structured Output(20%)
不是「写个好 prompt」,而是怎么在生产系统中可靠地获得结构化输出。
核心考点:
- tool_use 模式:用 tool_use 而不是纯文本解析来获取结构化数据
- JSON Schema 设计
- Validation-Retry Loop:验证输出 → 不符合 schema → 自动重试
- Few-shot prompting 保持一致性
- Multi-instance & multi-pass review:用不同的 session 做 review,避免 reasoning context 偏见
Domain 5:Context Management & Reliability(15%)
考的是生产环境中最容易翻车的问题:上下文管理。
核心考点:
- 长上下文处理与 progressive summarization 的风险
- 多 Agent 间的上下文传递
- Error propagation:错误在 multi-agent 系统中怎么传播
- Escalation patterns:基于任务复杂度和策略缺口升级,不是基于情感分析
- 信息溯源(Provenance)和多源综合
- Confidence calibration:不要依赖模型的 self-reported confidence,用结构化标准判断
6 个考试场景(随机选 4 个)
考试不是抽象的知识点问答,而是把你放进 6 个真实场景之一:
1. Customer Support Resolution Agent
设计一个客服 Agent:处理咨询、解决问题、复杂情况升级人工。考 Agent SDK、MCP 工具、升级逻辑。
2. Code Generation with Claude Code
为开发团队配置 Claude Code 工作流。考 CLAUDE.md 配置、plan mode、slash commands、TDD 迭代。
3. Multi-Agent Research System
构建一个 coordinator-subagent 并行研究系统。考 multi-agent 编排、上下文隔离和传递、错误传播、结果综合。
4. Developer Productivity with Claude
用 Claude Agent SDK 构建开发者工具。考内置工具选择、MCP server 集成、代码库探索策略。
5. Claude Code for CI/CD
把 Claude Code 集成到 CI/CD 流水线。考 -p 非交互模式、structured output、Batch API、session 隔离。
6. Structured Data Extraction
从非结构化文档中提取结构化数据。考 JSON schema 设计、tool_use、validation-retry loop、few-shot prompting。
考试中的「陷阱答案」
CCA-F 的选择题设计得非常刁钻——错误选项看起来很合理,但都是常见的反模式。官方总结了一些高频陷阱:
循环终止
错:用自然语言解析来决定是否继续循环
对:检查
stop_reason(tool_use表示还需要调用工具,end_turn表示完成)错:设置任意迭代上限(如「最多跑 10 次」)作为主要停止机制
对:让 agentic loop 通过
stop_reason自然终止
业务规则执行
- 错:用 prompt 指令来强制执行关键业务规则
- 对:用程序化的 hooks(如
onToolCall)做确定性检查
升级策略
错:让模型自己报告 confidence score,然后基于此升级
对:用结构化标准和程序化检查来决定是否升级
错:基于情感分析升级(用户生气了 → 转人工)
对:基于任务复杂度和策略缺口升级
错误处理
错:通用错误消息(「操作失败」)
对:包含
isError、errorCategory、isRetryable和上下文的结构化错误错:静默吞掉错误(空结果 = 成功)
对:区分「没有权限访问」和「确实没有数据」
工具管理
- 错:给一个 Agent 塞 18+ 个工具
- 对:每个 Agent 保持 4-5 个工具,超过后做工具分发(Tool Distribution)
代码审查
- 错:同一个 session 里让 Agent 生成代码再自己审查
- 对:用不同的 session 做 generator 和 reviewer,避免 reasoning context bias
备考路径
官方免费课程
Anthropic 的认证平台(anthropiccertifications.com)提供了完整的备考课程:
Claude Certified Architect — Foundations(30 节课)
- 覆盖所有 5 个域
- 包含动画图解、考试陷阱分析、动手练习、场景化测验
Claude Code 101(20 节课)
- Claude Code 从入门到高级
- Hooks、MCP Server、SDK 集成
Introduction to MCP(21 节课)
- Model Context Protocol 端到端
- 架构、primitives、构建 server 和 client
Introduction to Subagents(18 节课)
- 子 Agent 委托
- 上下文隔离、设计模式、多 Agent 编排
Introduction to Agent Skills(16 节课)
- 端到端构建 Agent Skills
- SKILL.md、progressive disclosure、多文件技能、分享
备考平台功能
- Knowledge Graph:150+ 概念节点,可视化知识关联
- Adaptive Practice:500+ 道自适应题目,针对弱项强化
- Mock Exams:5 套完整模拟考试(60 题 / 120 分钟)
- FSRS Spaced Repetition:科学的间隔复习调度
- AI Tutor:Claude 驱动的个性化辅导
12 周学习计划
官方推荐的 12 周结构化学习计划,按周分配 5 个域的学习进度。
备考费用
| 项目 | 费用 |
|---|---|
| 认证平台基础版 | 免费(概念库、知识图谱、课程、间隔复习、自适应练习) |
| 认证平台 Premium | ₹999(一次性,约 ¥85):AI Tutor、5 套模拟考试、性能仪表盘 |
| 考试费 | 前 5,000 名合作伙伴员工免费 |
| CertSafari 题库 | 614 道练习题(付费) |
谁应该考这个?
适合的人
- 解决方案架构师:正在用 Claude API 设计生产级 AI 应用
- AI 工程师:负责 Agent 系统的架构和运维
- 平台工程师:在团队中推广 Claude Code 和 MCP 集成
- 技术主管:需要评估 AI 系统的质量和安全性
不适合的人
- 只想学 prompt engineering 的初学者(去考 Anthropic 的 AI Fluency 课程)
- 不在 Anthropic 合作伙伴公司的(暂时无法参加考试)
- 只想拿个证书挂在 LinkedIn 的(这个考试真的需要懂 Agent 架构)
这个认证说明了什么?
说实话,AI 领域的认证目前还没有像 AWS Solutions Architect 或 Kubernetes CKA 那样的行业认可度。CCA-F 的价值取决于:
- Anthropic 的市场地位:Claude 在企业级 Agent 开发中的采用率
- 考试质量:从场景设计和反模式分析来看,这不是一个「交钱就过」的水证
- 实际需求:越来越多的公司在招 AI Agent 方向的工程师,一个有深度的认证可以作为筛选标准
但至少,CCA-F 的考试内容设计是认真的。它不考「Claude 有多少参数」这种 trivia,而是考「你的 Agent 在生产环境中出了错,你怎么让系统优雅地处理而不是崩溃」——这是真正做过 Agent 开发的人才会问的问题。
如何报名
- 访问 Anthropic Skilljar 注册页面
- 提交访问请求(目前仅限合作伙伴公司员工)
- 收到考试访问权限后,在线参加考试
- 考试结果即时出分
一句话总结
CCA-F 不是在考你知不知道 Claude 是什么,而是在考你能不能用它造一个真正能上线的系统——一个能在凌晨三点处理异常、在上下文爆炸时不崩溃、在多 Agent 协作时不丢数据的系统。
如果你的日常工作就是在干这件事,这个认证值得一试。如果你正在准备做这件事,它的备考材料本身就是一份极好的 Agent 架构指南。
作者: itech001 来源: 公众号:AI人工智能时代 网站: https://www.theaiera.cn/ 每日分享最前沿的AI新闻资讯和技术研究。
本文首发于 AI人工智能时代,转载请注明出处。
参考来源: