返回博客列表

DeerFlow 2.0 深度拆解:字节跳动 70K Star 的 Super Agent Harness

2026-05-29T09:30:00+08:00
DeerFlowByteDanceAgentLangGraphMulti-AgentSandboxMIT

DeerFlow 2.0 深度拆解:字节跳动 70K Star 的 Super Agent Harness

2026 年 2 月 28 日,一个中国团队的开源项目冲上 GitHub Trending 全球第一。不是模型,不是框架,而是一个 Agent 运行时——DeerFlow 2.0。

三个月后,它的 star 数已经逼近 7 万,fork 超过 9400,成为全球最受关注的 Agent 开源项目之一。背后是字节跳动,但代码完全 MIT 协议开源。

DeerFlow 2.0 不是增量更新,而是从零重写。1.x 是一个 Deep Research 框架(类似于 DeepSeek 的深度搜索工具),2.0 则变成了一个完整的 Super Agent Harness——一个能让 AI Agent 真正"干活"的基础设施。

从 Deep Research 到 Super Agent

先说清楚 DeerFlow 2.0 到底是什么。

1.x 时代的 DeerFlow 本质上是一个研究工具:给它一个问题,它会搜索、阅读、总结,最后输出一份研究报告。很好用,但社区拿它做了很多意想不到的事——搭数据管道、生成 PPT、做网站、跑自动化内容工作流。

这让团队意识到一件事:DeerFlow 不是一个研究工具,它是一个 Harness——一个给 Agent 提供基础设施让它真正完成工作的运行时。

所以 2.0 从零重写。核心变化:

维度 DeerFlow 1.x DeerFlow 2.0
定位 Deep Research 框架 Super Agent Harness
能力 搜索→阅读→总结 沙箱执行+记忆+技能+子 Agent
任务类型 单次研究报告 分钟到小时级长任务
输出 Markdown 报告 文件、网站、PPT、代码、图片、视频
架构 脚本串联 LangGraph 多 Agent 编排

核心架构

DeerFlow 2.0 建在 LangGraph + LangChain 之上,采用 Gateway + Agent Runtime + Frontend 的三层架构:

┌─────────────────────────────────────┐
│  Nginx (:2026) — 统一入口            │
├──────────────┬──────────────────────┤
│  Frontend    │  Gateway API (:8001)  │
│  Next.js     │  FastAPI + 嵌入式      │
│              │  Agent Runtime        │
│              ├──────────────────────┤
│              │  Harness 包           │
│              │  ├─ agents/          │
│              │  ├─ sandbox/         │
│              │  ├─ subagents/       │
│              │  ├─ skills/          │
│              │  ├─ mcp/             │
│              │  ├─ memory/          │
│              │  └─ models/          │
└──────────────┴──────────────────────┘

有两个运行模式:标准模式(Gateway + 独立 LangGraph Server,4 个进程)和 Gateway 模式(Agent 运行时嵌入 Gateway,3 个进程)。Gateway 模式不需要 LangGraph Platform 许可证,资源占用更低,冷启动更快。

代码分为两层,有严格的依赖方向:

  • Harnessdeerflow.*):可发布的 Agent 框架包。包含 Agent 编排、工具、沙箱、模型、MCP、技能、配置——构建和运行 Agent 需要的一切。
  • Appapp.*):不发布的应用代码。包含 FastAPI Gateway API 和 IM 通道集成。

核心规则:App 可以 import deerflow,但 deerflow 不能 import App。这个边界由 CI 测试强制执行。

五大核心能力

1. 沙箱和文件系统

DeerFlow 不只是"说"要做事情,它有自己的执行环境。

每个任务获得一个独立的沙箱,拥有完整的文件系统视图:

/mnt/user-data/
├── uploads/      ← 用户上传的文件
├── workspace/    ← Agent 的工作目录
└── outputs/      ← 最终交付物

支持三种沙箱模式:

  • Local Execution:本地文件系统,代码直接在宿主机上跑
  • Docker Execution:Docker 容器隔离,代码跑在独立容器里
  • Kubernetes Execution:通过 Provisioner 在 K8s Pod 里执行

关键区别:Local 模式下默认禁用 bash 执行(因为不是安全隔离边界),只有 Docker/K8s 模式才开放完整的 shell 执行权限。这是一个聊天机器人加工具调用和一个拥有真正执行环境的 Agent 之间的分界线。

2. 子 Agent 并行

复杂任务不适合单次处理。DeerFlow 的解决方案是分解

Lead Agent 可以动态创建子 Agent——每个子 Agent 有自己独立的作用域上下文、工具和终止条件。子 Agent 尽可能并行运行,汇报结构化结果,Lead Agent 综合所有输出。

一个研究任务可能扇出十几个子 Agent,每个探索不同的角度,然后收敛为一份报告、一个网站、或一套带视觉效果的 PPT。一个 Harness,多只手。

执行模式分四档:

  • Flash:快速模式
  • Standard:标准模式
  • Pro:规划模式(带 TodoList 中间件)
  • Ultra:子 Agent 模式(并行分解)

3. 技能系统(Skills)

技能是让 DeerFlow "几乎能做任何事"的核心机制。

一个技能是一个结构化的能力模块——Markdown 文件定义工作流、最佳实践和参考资源。内置技能覆盖研究、报告生成、PPT 创建、网页、图片和视频生成等。真正的力量在于可扩展性:添加自定义技能、替换内置技能、或组合成复合工作流。

技能按需加载——只有任务需要时才加载,不是一次性全部塞进上下文窗口。这让 DeerFlow 即使在 token 敏感的模型上也能高效运行。

/mnt/skills/public
├── research/SKILL.md
├── report-generation/SKILL.md
├── slide-creation/SKILL.md
├── web-page/SKILL.md
└── image-generation/SKILL.md

/mnt/skills/custom
└── your-custom-skill/SKILL.md

还有一个特别的技能叫 claude-to-deerflow——让你直接从 Claude Code 终端跟运行中的 DeerFlow 实例交互,发送研究任务、检查状态、管理线程,不用离开终端。

4. 长期记忆

大多数 Agent 在对话结束时就把一切忘了。DeerFlow 记住。

跨会话持久化记忆:你的个人资料、偏好、累积的知识。用得越多,它越了解你——写作风格、技术栈、重复出现的工作流。记忆存储在本地,始终在你的控制之下。

记忆更新时会自动跳过重复条目,不会让重复的偏好和上下文在跨会话中无限累积。

5. 18 个中间件组成的 Agent 管线

这是 DeerFlow 架构最精细的部分。Lead Agent 的请求经过 18 个中间件按严格顺序处理:

  1. ThreadDataMiddleware — 创建线程隔离目录
  2. UploadsMiddleware — 跟踪上传文件
  3. SandboxMiddleware — 获取沙箱
  4. DanglingToolCallMiddleware — 修复中断的工具调用
  5. LLMErrorHandlingMiddleware — 模型调用错误处理
  6. GuardrailMiddleware — 工具调用前授权检查
  7. SandboxAuditMiddleware — 沙箱操作安全审计
  8. ToolErrorHandlingMiddleware — 工具异常转换
  9. SummarizationMiddleware — 接近 token 上限时压缩上下文
  10. TodoListMiddleware — 计划模式下的任务追踪
  11. TokenUsageMiddleware — Token 用量记录
  12. TitleMiddleware — 自动生成线程标题
  13. MemoryMiddleware — 异步记忆更新
  14. ViewImageMiddleware — 图片注入
  15. DeferredToolFilterMiddleware — 延迟工具过滤
  16. SubagentLimitMiddleware — 并发子 Agent 限制
  17. LoopDetectionMiddleware — 工具调用死循环检测
  18. ClarificationMiddleware — 澄清提问拦截

每个中间件只做一件事,但组合在一起就形成了一个健壮的 Agent 执行管线。LoopDetection 和 SubagentLimit 是生产环境的关键防线——没有它们,Agent 可能陷入无限循环或并发爆炸。

IM 通道:IM 原生接入

DeerFlow 支持直接从即时通讯工具接收任务,通道自动启动,无需公网 IP:

通道 传输方式 难度
Telegram Bot API 长轮询 简单
Slack Socket Mode 中等
飞书 / Lark WebSocket 中等
企业微信 WebSocket 中等

在 IM 里直接用命令交互:/new 新对话、/status 状态、/models 模型列表、/memory 查看记忆、/help 帮助。没有命令前缀的普通消息当作正常对话处理。

模型无关 + 推荐配置

DeerFlow 是模型无关的——任何实现 OpenAI 兼容 API 的 LLM 都能用。推荐的支持能力:

  • 长上下文窗口(100k+ tokens)用于深度研究和多步任务
  • 推理能力用于自适应规划和复杂分解
  • 多模态输入用于图片理解和视频理解
  • 强工具使用用于可靠的功能调用和结构化输出

配置示例(config.yaml):

models:
  - name: gpt-5
    display_name: GPT-5
    use: langchain_openai:ChatOpenAI
    model: gpt-5
    api_key: $OPENAI_API_KEY

  - name: deepseek-v4
    display_name: DeepSeek V4 Pro
    use: langchain_openai:ChatOpenAI
    model: deepseek-v4-pro
    api_key: $DEEPSEEK_API_KEY
    base_url: https://api.deepseek.com/v1

  - name: qwen3-32b-vllm
    display_name: Qwen3 32B (vLLM)
    use: deerflow.models.vllm_provider:VllmChatModel
    model: Qwen/Qwen3-32B
    api_key: $VLLM_API_KEY
    base_url: http://localhost:8000/v1
    supports_thinking: true

还支持 CLI 后端模型(Codex CLI、Claude Code OAuth),甚至可以通过 Codex CLI 路由到 GPT-5.4,通过 Claude Code OAuth 路由到 Claude Sonnet 4.6,无需 API Key。

安装和使用

Docker 一行启动(推荐):

git clone https://github.com/bytedance/deer-flow.git
cd deer-flow
make config     # 生成配置文件
# 编辑 config.yaml 配置模型
make docker-init && make docker-start

访问 http://localhost:2026

本地开发:

make check && make install && make dev

甚至可以让 Claude Code / Codex 帮你安装:

Help me clone DeerFlow if needed, then bootstrap it for local development 
by following https://raw.githubusercontent.com/bytedance/deer-flow/main/Install.md

可观测性

内建 LangSmith 和 Langfuse 双链路追踪。可以同时启用,所有 LLM 调用、Agent 运行、工具执行都会被追踪并上报到两个平台。

还有一个 DeerFlowClient 嵌入式 Python 客户端,可以在不启动 HTTP 服务的情况下直接在 Python 进程中使用所有 Agent 和 Gateway 能力。

为什么 70K Star

DeerFlow 2.0 的爆火不是偶然。它恰好踩在了 2026 年 Agent 生态的几个关键痛点上:

从"能聊"到"能干活"。 市面上大部分 Agent 还在"对话 + 工具调用"的阶段。DeerFlow 给了 Agent 一个完整的执行环境——文件系统、沙箱、记忆、技能。Agent 不再只是告诉你怎么做,而是直接做给你看。

从"单次问答"到"长任务"。 研究一个课题、生成一套 PPT、搭建一个网站——这些任务需要几分钟到几小时。DeerFlow 的子 Agent 并行 + 上下文压缩 + 持久记忆让长任务成为可能。

从"黑盒"到"白盒"。 18 个中间件组成的管线让每一步都可观测、可审计、可控制。Guardrail 和 Audit 中间件提供了安全和合规的抓手。

从"框架"到"运行时"。 你不需要"用 DeerFlow 写代码"。你配置好模型和技能,它就是一个能干活的 Agent。开箱即用,也可以拆开定制。

MIT 协议、模型无关、Python + TypeScript 双栈、IM 原生接入——这些设计选择让它能适配尽可能多的使用场景。70K Star 说明了一件事:市场需要的不是又一个 Agent 框架,而是一个能让 Agent 真正跑起来的运行时。


项目信息:


作者: itech001 来源: 公众号:AI人工智能时代 网站: https://www.theaiera.cn/ 每日分享最前沿的AI新闻资讯和技术研究。

本文首发于 AI人工智能时代,转载请注明出处。

觉得文章不错?分享给更多人!