DeerFlow 相关的核心要点是什么？

本文围绕 DeerFlow、ByteDance、Agent、LangGraph、Multi-Agent、Sandbox、MIT 展开，DeerFlow 2.0 从 Deep Research 工具彻底重写为 Super Agent Harness——沙箱隔离、长期记忆、子 Agent 并行、技能系统，一个能跑分钟到小时级长任务的开源 Agent 运行时。。详细解读见正文。

DeerFlow 2.0 深度拆解：字节跳动 70K Star 的 Super Agent Harness

2026-05-29T09:30:00+08:00

DeerFlowByteDanceAgentLangGraphMulti-AgentSandboxMIT

DeerFlow 2.0 深度拆解：字节跳动 70K Star 的 Super Agent Harness

2026 年 2 月 28 日，一个中国团队的开源项目冲上 GitHub Trending 全球第一。不是模型，不是框架，而是一个 Agent 运行时——DeerFlow 2.0。

三个月后，它的 star 数已经逼近 7 万，fork 超过 9400，成为全球最受关注的 Agent 开源项目之一。背后是字节跳动，但代码完全 MIT 协议开源。

DeerFlow 2.0 不是增量更新，而是从零重写。1.x 是一个 Deep Research 框架（类似于 DeepSeek 的深度搜索工具），2.0 则变成了一个完整的 Super Agent Harness——一个能让 AI Agent 真正"干活"的基础设施。

从 Deep Research 到 Super Agent

先说清楚 DeerFlow 2.0 到底是什么。

1.x 时代的 DeerFlow 本质上是一个研究工具：给它一个问题，它会搜索、阅读、总结，最后输出一份研究报告。很好用，但社区拿它做了很多意想不到的事——搭数据管道、生成 PPT、做网站、跑自动化内容工作流。

这让团队意识到一件事：DeerFlow 不是一个研究工具，它是一个 Harness——一个给 Agent 提供基础设施让它真正完成工作的运行时。

所以 2.0 从零重写。核心变化：

维度	DeerFlow 1.x	DeerFlow 2.0
定位	Deep Research 框架	Super Agent Harness
能力	搜索→阅读→总结	沙箱执行+记忆+技能+子 Agent
任务类型	单次研究报告	分钟到小时级长任务
输出	Markdown 报告	文件、网站、PPT、代码、图片、视频
架构	脚本串联	LangGraph 多 Agent 编排

核心架构

DeerFlow 2.0 建在 LangGraph + LangChain 之上，采用 Gateway + Agent Runtime + Frontend 的三层架构：

┌─────────────────────────────────────┐
│  Nginx (:2026) — 统一入口            │
├──────────────┬──────────────────────┤
│  Frontend    │  Gateway API (:8001)  │
│  Next.js     │  FastAPI + 嵌入式      │
│              │  Agent Runtime        │
│              ├──────────────────────┤
│              │  Harness 包           │
│              │  ├─ agents/          │
│              │  ├─ sandbox/         │
│              │  ├─ subagents/       │
│              │  ├─ skills/          │
│              │  ├─ mcp/             │
│              │  ├─ memory/          │
│              │  └─ models/          │
└──────────────┴──────────────────────┘

有两个运行模式：标准模式（Gateway + 独立 LangGraph Server，4 个进程）和 Gateway 模式（Agent 运行时嵌入 Gateway，3 个进程）。Gateway 模式不需要 LangGraph Platform 许可证，资源占用更低，冷启动更快。

代码分为两层，有严格的依赖方向：

Harness（deerflow.*）：可发布的 Agent 框架包。包含 Agent 编排、工具、沙箱、模型、MCP、技能、配置——构建和运行 Agent 需要的一切。
App（app.*）：不发布的应用代码。包含 FastAPI Gateway API 和 IM 通道集成。

核心规则：App 可以 import deerflow，但 deerflow 不能 import App。这个边界由 CI 测试强制执行。

五大核心能力

1. 沙箱和文件系统

DeerFlow 不只是"说"要做事情，它有自己的执行环境。

每个任务获得一个独立的沙箱，拥有完整的文件系统视图：

/mnt/user-data/
├── uploads/      ← 用户上传的文件
├── workspace/    ← Agent 的工作目录
└── outputs/      ← 最终交付物

支持三种沙箱模式：

Local Execution：本地文件系统，代码直接在宿主机上跑
Docker Execution：Docker 容器隔离，代码跑在独立容器里
Kubernetes Execution：通过 Provisioner 在 K8s Pod 里执行

关键区别：Local 模式下默认禁用 bash 执行（因为不是安全隔离边界），只有 Docker/K8s 模式才开放完整的 shell 执行权限。这是一个聊天机器人加工具调用和一个拥有真正执行环境的 Agent 之间的分界线。

2. 子 Agent 并行

复杂任务不适合单次处理。DeerFlow 的解决方案是分解。

Lead Agent 可以动态创建子 Agent——每个子 Agent 有自己独立的作用域上下文、工具和终止条件。子 Agent 尽可能并行运行，汇报结构化结果，Lead Agent 综合所有输出。

一个研究任务可能扇出十几个子 Agent，每个探索不同的角度，然后收敛为一份报告、一个网站、或一套带视觉效果的 PPT。一个 Harness，多只手。

执行模式分四档：

Flash：快速模式
Standard：标准模式
Pro：规划模式（带 TodoList 中间件）
Ultra：子 Agent 模式（并行分解）

3. 技能系统（Skills）

技能是让 DeerFlow "几乎能做任何事"的核心机制。

一个技能是一个结构化的能力模块——Markdown 文件定义工作流、最佳实践和参考资源。内置技能覆盖研究、报告生成、PPT 创建、网页、图片和视频生成等。真正的力量在于可扩展性：添加自定义技能、替换内置技能、或组合成复合工作流。

技能按需加载——只有任务需要时才加载，不是一次性全部塞进上下文窗口。这让 DeerFlow 即使在 token 敏感的模型上也能高效运行。

/mnt/skills/public
├── research/SKILL.md
├── report-generation/SKILL.md
├── slide-creation/SKILL.md
├── web-page/SKILL.md
└── image-generation/SKILL.md

/mnt/skills/custom
└── your-custom-skill/SKILL.md

还有一个特别的技能叫 claude-to-deerflow——让你直接从 Claude Code 终端跟运行中的 DeerFlow 实例交互，发送研究任务、检查状态、管理线程，不用离开终端。

4. 长期记忆

大多数 Agent 在对话结束时就把一切忘了。DeerFlow 记住。

跨会话持久化记忆：你的个人资料、偏好、累积的知识。用得越多，它越了解你——写作风格、技术栈、重复出现的工作流。记忆存储在本地，始终在你的控制之下。

记忆更新时会自动跳过重复条目，不会让重复的偏好和上下文在跨会话中无限累积。

5. 18 个中间件组成的 Agent 管线

这是 DeerFlow 架构最精细的部分。Lead Agent 的请求经过 18 个中间件按严格顺序处理：

ThreadDataMiddleware — 创建线程隔离目录
UploadsMiddleware — 跟踪上传文件
SandboxMiddleware — 获取沙箱
DanglingToolCallMiddleware — 修复中断的工具调用
LLMErrorHandlingMiddleware — 模型调用错误处理
GuardrailMiddleware — 工具调用前授权检查
SandboxAuditMiddleware — 沙箱操作安全审计
ToolErrorHandlingMiddleware — 工具异常转换
SummarizationMiddleware — 接近 token 上限时压缩上下文
TodoListMiddleware — 计划模式下的任务追踪
TokenUsageMiddleware — Token 用量记录
TitleMiddleware — 自动生成线程标题
MemoryMiddleware — 异步记忆更新
ViewImageMiddleware — 图片注入
DeferredToolFilterMiddleware — 延迟工具过滤
SubagentLimitMiddleware — 并发子 Agent 限制
LoopDetectionMiddleware — 工具调用死循环检测
ClarificationMiddleware — 澄清提问拦截

每个中间件只做一件事，但组合在一起就形成了一个健壮的 Agent 执行管线。LoopDetection 和 SubagentLimit 是生产环境的关键防线——没有它们，Agent 可能陷入无限循环或并发爆炸。

IM 通道：IM 原生接入

DeerFlow 支持直接从即时通讯工具接收任务，通道自动启动，无需公网 IP：

通道	传输方式	难度
Telegram	Bot API 长轮询	简单
Slack	Socket Mode	中等
飞书 / Lark	WebSocket	中等
企业微信	WebSocket	中等

在 IM 里直接用命令交互：/new 新对话、/status 状态、/models 模型列表、/memory 查看记忆、/help 帮助。没有命令前缀的普通消息当作正常对话处理。

模型无关 + 推荐配置

DeerFlow 是模型无关的——任何实现 OpenAI 兼容 API 的 LLM 都能用。推荐的支持能力：

长上下文窗口（100k+ tokens）用于深度研究和多步任务
推理能力用于自适应规划和复杂分解
多模态输入用于图片理解和视频理解
强工具使用用于可靠的功能调用和结构化输出

配置示例（config.yaml）：

models:
  - name: gpt-5
    display_name: GPT-5
    use: langchain_openai:ChatOpenAI
    model: gpt-5
    api_key: $OPENAI_API_KEY

  - name: deepseek-v4
    display_name: DeepSeek V4 Pro
    use: langchain_openai:ChatOpenAI
    model: deepseek-v4-pro
    api_key: $DEEPSEEK_API_KEY
    base_url: https://api.deepseek.com/v1

  - name: qwen3-32b-vllm
    display_name: Qwen3 32B (vLLM)
    use: deerflow.models.vllm_provider:VllmChatModel
    model: Qwen/Qwen3-32B
    api_key: $VLLM_API_KEY
    base_url: http://localhost:8000/v1
    supports_thinking: true

还支持 CLI 后端模型（Codex CLI、Claude Code OAuth），甚至可以通过 Codex CLI 路由到 GPT-5.4，通过 Claude Code OAuth 路由到 Claude Sonnet 4.6，无需 API Key。

安装和使用

Docker 一行启动（推荐）：

git clone https://github.com/bytedance/deer-flow.git
cd deer-flow
make config     # 生成配置文件
# 编辑 config.yaml 配置模型
make docker-init && make docker-start

访问 http://localhost:2026

本地开发：

make check && make install && make dev

甚至可以让 Claude Code / Codex 帮你安装：

Help me clone DeerFlow if needed, then bootstrap it for local development 
by following https://raw.githubusercontent.com/bytedance/deer-flow/main/Install.md

可观测性

内建 LangSmith 和 Langfuse 双链路追踪。可以同时启用，所有 LLM 调用、Agent 运行、工具执行都会被追踪并上报到两个平台。

还有一个 DeerFlowClient 嵌入式 Python 客户端，可以在不启动 HTTP 服务的情况下直接在 Python 进程中使用所有 Agent 和 Gateway 能力。

为什么 70K Star

DeerFlow 2.0 的爆火不是偶然。它恰好踩在了 2026 年 Agent 生态的几个关键痛点上：

从"能聊"到"能干活"。 市面上大部分 Agent 还在"对话 + 工具调用"的阶段。DeerFlow 给了 Agent 一个完整的执行环境——文件系统、沙箱、记忆、技能。Agent 不再只是告诉你怎么做，而是直接做给你看。

从"单次问答"到"长任务"。 研究一个课题、生成一套 PPT、搭建一个网站——这些任务需要几分钟到几小时。DeerFlow 的子 Agent 并行 + 上下文压缩 + 持久记忆让长任务成为可能。

从"黑盒"到"白盒"。 18 个中间件组成的管线让每一步都可观测、可审计、可控制。Guardrail 和 Audit 中间件提供了安全和合规的抓手。

从"框架"到"运行时"。 你不需要"用 DeerFlow 写代码"。你配置好模型和技能，它就是一个能干活的 Agent。开箱即用，也可以拆开定制。

MIT 协议、模型无关、Python + TypeScript 双栈、IM 原生接入——这些设计选择让它能适配尽可能多的使用场景。70K Star 说明了一件事：市场需要的不是又一个 Agent 框架，而是一个能让 Agent 真正跑起来的运行时。

项目信息：

GitHub：https://github.com/bytedance/deer-flow
官网：https://deerflow.tech
协议：MIT
语言：Python + TypeScript
Stars：~70K | Forks：~9.4K | Contributors：5+ 核心
核心贡献者：Daniel Walnut（hetaoBackend）、Henry Li（MagicCube）
联合方：字节跳动 / 火山引擎

作者: itech001 来源: 公众号：AI人工智能时代网站: https://www.theaiera.cn/ 每日分享最前沿的AI新闻资讯和技术研究。

本文首发于 AI人工智能时代，转载请注明出处。

DeerFlow 2.0 深度拆解：字节跳动 70K Star 的 Super Agent Harness

DeerFlow 2.0 深度拆解：字节跳动 70K Star 的 Super Agent Harness

从 Deep Research 到 Super Agent

核心架构

五大核心能力

1. 沙箱和文件系统

2. 子 Agent 并行

3. 技能系统（Skills）

4. 长期记忆

5. 18 个中间件组成的 Agent 管线

IM 通道：IM 原生接入

模型无关 + 推荐配置

安装和使用

可观测性

为什么 70K Star

相关阅读

DeerFlow 深度解析：字节跳出的超级 Agent 框架

AI Agent 写完代码谁来测？这个开源沙箱把 CI/CD 和多 Agent 协作全包了

Anthropic 实战总结：AI Agent 的 3 种工作流模式，选错代价很大

OpenAI 官方 Agent SDK 来了：22k Star，支持 100+ 模型，Python 10 行代码上手