Claude Code · 实验特性研究 · 2026

Agent Teams：
从单兵到协同编排

一个 lead 协调、多个独立 session 并行作业、彼此直接通信。本报告拆解架构、与 subagent 逐项对比、给出绿/黄/红决策框架，并落到你的内容 pipeline 上。

状态 Experimental · 默认关闭要求 v2.1.32+ · Opus 4.6

01架构拆解 02vs Subagent 03对照速查表 04决策框架 05成本经济学 06套到你的 pipeline 07启用与习惯 08核心结论

01 · 架构

它由什么组成

核心是一个 lead（你直接对话的主 session），负责拆解、分派、综合，但不亲自写代码。它 spawn 的每个 teammate 都是完整、独立的 Claude Code 实例——自己的 context window（上限 1M token）、自己的指令、甚至自己的终端 pane。teammate 之间不共享上下文，全靠两条显式通道协调。

Team Lead

主 Session（你在这里）

拆解 · 分派 · 综合 · 不做领域工作

Teammate A

独立 session

认领任务 · 执行 · 写回结果

◇ 隔离 context ≤1M

Teammate B

独立 session

可直接 message A / C

◇ 隔离 context ≤1M

Teammate C

独立 session

可被你单独追加指令

◇ 隔离 context ≤1M

Shared Task List实时队列 · pending / in-progress / completed · 依赖自动解锁：上游完成，被阻塞任务立即可认领

Mailbox点对点消息 · 发消息 = 向 inbox 文件追加 JSON · 协作被设计得像软件，而非聊天

状态文件落在本地 ~/.claude/teams/ 与 ~/.claude/tasks/，自动维护、别手改。显示模式有 in-process（都在主终端）和 split-pane（各自窗格，需 tmux/iTerm2）。注意：teammate 不继承 lead 的模型，需单独指定（可全设 Sonnet 省钱）。

02 · 核心对比

Agent Team 与 Subagent 的根本差别

两者都能并行，但解决的不是同一个问题。Subagent 的本质是上下文卫生——把噪音隔离在外，保持主对话干净；Team 的本质是协同编排——让多个不被污染的判断互相通信。一句话判据：你的 worker 们需要彼此对话吗？

SA

Subagent

Task 工具 · 单向委派

运行位置

在主 session 内部派生，阻塞主线程直到返回

通信

单向：做完只把最终摘要回传 lead，兄弟间不可对话

上下文

stateless，起步只带 lead 传入的 prompt，不继承对话历史；中间噪音留在自己窗口

本质价值

不是让 Claude 更聪明，而是保住已有 context 的信噪比

内置类型

Explore（只读快搜）· Plan（先调研再给方案）· General

自定义

.claude/agents/ 下的 markdown，按 description 自动委派

AT

Agent Team

独立 session · 点对点协调

运行位置

每个 teammate 是独立 Claude Code 实例，并行不阻塞

通信

点对点 mailbox + 共享任务列表，可互相挑战、自行协调

上下文

每人独立 1M 窗口，互不可见——刻意隔离防止半成品污染他人

本质价值

把会互相打架的工作拆成多份独立判断并行推进

协调层

依赖追踪自动解锁 + 文件锁处理并发写

交互

你可绕过 lead 直接给某个 teammate 追加指令

官方给的过渡信号

如果你正在跑并行 subagent，但开始撞 context 上限，或者 subagent 们需要看到彼此的发现才能做对——那就是从 subagent 升级到 agent team 的时机。反过来，team「比在一个 session 内协调更重、更贵」。

03 · 速查

逐项对照表

同一个决策的快速查表。左蓝右绿，蓝便宜简单、绿强大但贵。

维度

Subagent

Agent Team

通信模型

单向汇报，兄弟间不可对话

点对点 mailbox + 共享任务列表

上下文

隔离窗口，结果摘要回流主 session

各自独立 1M，互不可见

并行性

多个 Task 可并发，但单个会阻塞主线程

天然并行，互不阻塞

token 经济

小规模便宜；lead context 随结果膨胀，大规模会爆

初始化即 N× ；但无人背全局历史，大 pipeline 可更省

搭建/调试

简单好调，覆盖约 90% 并行需求

更难搭更难调；session 恢复有缺陷

状态

稳定、内置三种类型 + 可自定义

Experimental，迭代快，默认关闭

该用它当…

worker 只需独立干活然后汇报

worker 需共享发现、互相挑战、自行协调

一句话记忆

需要「干净的隔离」选 Subagent；需要「会对话的协作」选 Agent Team。找不出至少 3 条真正独立的并行工作流，就别上 team。

04 · 决策框架

什么时候用、什么时候反而更糟

核心始终是：协调开销，是否小于并行省下的时间？

绿灯 · 上 Team

有真优势

并行探索创造独立价值

多视角并行评审：三人同审一个 PR——查安全 / 测性能 / 看覆盖。单 agent 一旦先发现安全 bug 就会"锚定"，后续评审变浅；三个隔离 context 给三份真正独立的报告。
竞争性假设调试：一个 bug 五个可能成因，五人各追一个并互相攻击对方结论。
跨层特性开发：前端 / 后端 / 测试同时推进，后端改了 API 契约能直接 message 前端。
调研 + 综述：多人同查不同侧面再汇总互质——边界清晰、不写代码，最适合入门。

黄灯 · 先掂量

多半另有更优解

能拆，但未必值

独立但无需协调的批量改动：worker 不用对话时，协调层是纯浪费——用 /batch 或 async 更简单。
扇出极宽且重复：几十个文件、benchmark 矩阵——用 Dynamic Workflows 从脚本编排上千 subagent。
超大代码库单点任务：单 agent 光加载就吃掉 80–90% context 时，拆 team 的理由从"并行"变成"避免溢出"。

红灯 · 别用

一定更慢更贵

协调开销吃掉全部收益

严格顺序任务（A 阻塞 B 阻塞 C）· 同文件编辑（合并冲突几乎必然）· 十分钟能干完的小任务。
依赖密集紧耦合：teammate 大部分时间在等彼此，并行名存实亡。
普通 bug 修复 / 重构 / 加组件：team 是错的工具，你会更慢也更穷。

05 · 成本

token 的账要算在前面

没有固定价格，随 teammate 数量和工作量线性放大。反直觉点：并行不减少 token，而是把它乘起来——倍数在任何实际工作开始前就产生了。

3–4×单 session 的 token

典型 3 人 team 处理同任务的量级。4 人加载同一份项目上下文，初始化成本就是 4×，之后每条 agent 间消息还是一次计费往返。

单 session

1×

3 人 team

~3.5×

5 人 team

5×+

3起步人数，5 封顶

多数工作流从 3 人最平衡。token 线性增长，但协调开销增长更快。三个角色清晰的 agent 持续优于五个范围模糊的。每人 5–6 个任务保持高产又不过度切换。

超 5 人需明确理由——只有确有并行工作流在等，才加人。

什么时候 team 反而更省

大规模 pipeline（10+ worker）下，subagent 的 orchestrator 会把所有结果累积进自己 context、轻松冲到 30–50k token 甚至撞上限。而 team 里没有单一 agent 背负全局历史，每人只加载自己那块——临界点在于：协调开销 vs. context 溢出，谁更贵。

06 · 落到你的场景

套到「科技商业复盘」内容 pipeline

你的 topic scout → 全文抓取 → 脚本合成是一条顺序、阶段间有依赖的流水线。诚实说：端到端用 team 大概率红灯——阶段必须串行。但单个阶段内部有几处是漂亮的绿灯。

阶段级建议

1

选题发现 / 验证

多源（HN / Medium / RSS）抓取打分天然并行：一人负责时效筛选、一人评"复盘叙事潜力"、一人唱反调挑"是不是已被做烂"。三个隔离 context 给三份不被锚定的独立判断。

✓ 绿灯 · Agent Team（research/review 最佳入门）

2

全文抓取（trafilatura → Jina → Firecrawl 分层回退）

对 N 个 URL 做同构、独立、无需通信的批处理。worker 间无对话需求——上 team 黄偏红。用 /batch 或 subagent 扇出更简省，自动隔离。

→ Subagent / batch 扇出，别上 team

3

脚本合成（多源综合，绝不单篇搬运）

合成是收敛性单点创作，强行多 agent 会因同文件、强耦合打架。但前面可挂一个 team：reviewer 分别从"事实核查 / 叙事节奏 / 钩子强度"三个独立 lens 审稿。合成本身留给单 session。

→ 合成单 session · 评审可用 Team 多 lens

总结：team 用在"需要多个不被污染的独立判断"的节点（选题、审稿），串行流水线留给单 session + subagent 扇出。你在盯 token 配额，默认走便宜路径，只在"质量分歧值钱"处花 3–4× 的钱。

07 · 启用

开起来 + 几条保命习惯

# 1. 确认版本 ≥ v2.1.32，模型为 Opus 4.6
claude --version
# 2. 在 ~/.claude/settings.json 或环境变量中开启
export CLAUDE_CODE_EXPERIMENTAL_AGENT_TEAMS=1
# 3. 重启 Claude Code（开关启动时读取，跳过重启 = "功能没出现"头号原因）
# 4. 验证
echo $CLAUDE_CODE_EXPERIMENTAL_AGENT_TEAMS   # 应输出 1
# 5. 自然语言描述任务和角色，lead 自动建 team、spawn、派活
"Spawn 三个 teammate 评审 PR #142：一个查安全、一个测性能、
 一个验测试覆盖。让他们各自评审并汇报发现。"

习惯 · 权限

预批准文件写入与 shell

中途弹权限确认会卡住并行执行、需手动干预，抵消大半收益。启动前先为工作目录预批准。

习惯 · 恢复

别指望恢复 team

session 被清理后 /resume 和 /rewind 不恢复 in-process teammate。长跑前存好中间产物。

习惯 · 规划

Plan-first 不可妥协

不经批准就跳进代码是一团糟。先用 plan mode 定角色、边界、产出文件，再放手跑。

习惯 · 隔离

保持文件级隔离

操作不同文件的任务很少冲突；碰共享 config 的需小心排序。建议配 Git worktree。

08 · 收束

三句话带走

01

定位

Team 不是更聪明的 agent，而是把"会互相污染的判断"拆成独立 context 并行推进。需要干净隔离用 subagent，需要会对话的协作才用 team。

02

代价

典型 3 人约 3–4× token，协调开销更快增长。90% 场景单 session 或 subagent 就够，team 只为少数高价值场景存在。

03

对你

串行 pipeline 整体红灯；但选题验证、审稿是绿灯——在"质量分歧值钱"的节点花钱，其余走便宜路径。

04

判据

一问定生死：worker 们需要彼此对话吗？找不出 ≥3 条真正独立的并行工作流，就别上 team。

Claude Code 官方文档Anthropic · Opus 4.6 发布claude.com/blog · subagentsMindStudioBuilder.ioAI Builder ClubKimiAddy Osmani

Agent Teams 是实验特性，迭代很快（TeamCreate/TeamDelete 已在 v2.1.178 移除）。落地前以官方文档为准：code.claude.com/docs/en/agent-teams。时间/token 数字来自社区实测，非保证值；产品行为对照官方文档核实。

Agent Teams：从单兵到协同编排

它由什么组成

主 Session（你在这里）

独立 session

独立 session

独立 session

Agent Team 与 Subagent 的根本差别

Subagent

Agent Team

逐项对照表

什么时候用、什么时候反而更糟

有真优势

多半另有更优解

一定更慢更贵

token 的账要算在前面

3–4×单 session 的 token

3起步人数，5 封顶

套到「科技商业复盘」内容 pipeline

选题发现 / 验证

全文抓取（trafilatura → Jina → Firecrawl 分层回退）

脚本合成（多源综合，绝不单篇搬运）

开起来 + 几条保命习惯

预批准文件写入与 shell

别指望恢复 team

Plan-first 不可妥协

保持文件级隔离

三句话带走

定位

代价

对你

判据

Agent Teams：
从单兵到协同编排