Claude Code · 实验特性研究 · 2026

Agent Teams:
从单兵到协同编排

一个 lead 协调、多个独立 session 并行作业、彼此直接通信。本报告拆解架构、与 subagent 逐项对比、给出绿/黄/红决策框架,并落到你的内容 pipeline 上。

状态 Experimental · 默认关闭 要求 v2.1.32+ · Opus 4.6
01 · 架构

它由什么组成

核心是一个 lead(你直接对话的主 session),负责拆解、分派、综合,但不亲自写代码。它 spawn 的每个 teammate 都是完整、独立的 Claude Code 实例——自己的 context window(上限 1M token)、自己的指令、甚至自己的终端 pane。teammate 之间不共享上下文,全靠两条显式通道协调。

Team Lead

主 Session(你在这里)

拆解 · 分派 · 综合 · 不做领域工作
Teammate A

独立 session

认领任务 · 执行 · 写回结果
◇ 隔离 context ≤1M
Teammate B

独立 session

可直接 message A / C
◇ 隔离 context ≤1M
Teammate C

独立 session

可被你单独追加指令
◇ 隔离 context ≤1M
Shared Task List实时队列 · pending / in-progress / completed · 依赖自动解锁:上游完成,被阻塞任务立即可认领
Mailbox点对点消息 · 发消息 = 向 inbox 文件追加 JSON · 协作被设计得像软件,而非聊天

状态文件落在本地 ~/.claude/teams/~/.claude/tasks/,自动维护、别手改。显示模式有 in-process(都在主终端)和 split-pane(各自窗格,需 tmux/iTerm2)。注意:teammate 不继承 lead 的模型,需单独指定(可全设 Sonnet 省钱)。

02 · 核心对比

Agent Team 与 Subagent 的根本差别

两者都能并行,但解决的不是同一个问题。Subagent 的本质是上下文卫生——把噪音隔离在外,保持主对话干净;Team 的本质是协同编排——让多个不被污染的判断互相通信。一句话判据:你的 worker 们需要彼此对话吗?

SA

Subagent

Task 工具 · 单向委派
运行位置
主 session 内部派生,阻塞主线程直到返回
通信
单向:做完只把最终摘要回传 lead,兄弟间不可对话
上下文
stateless,起步只带 lead 传入的 prompt,不继承对话历史;中间噪音留在自己窗口
本质价值
不是让 Claude 更聪明,而是保住已有 context 的信噪比
内置类型
Explore(只读快搜)· Plan(先调研再给方案)· General
自定义
.claude/agents/ 下的 markdown,按 description 自动委派
AT

Agent Team

独立 session · 点对点协调
运行位置
每个 teammate 是独立 Claude Code 实例,并行不阻塞
通信
点对点 mailbox + 共享任务列表,可互相挑战、自行协调
上下文
每人独立 1M 窗口,互不可见——刻意隔离防止半成品污染他人
本质价值
把会互相打架的工作拆成多份独立判断并行推进
协调层
依赖追踪自动解锁 + 文件锁处理并发写
交互
你可绕过 lead 直接给某个 teammate 追加指令
官方给的过渡信号

如果你正在跑并行 subagent,但开始撞 context 上限,或者 subagent 们需要看到彼此的发现才能做对——那就是从 subagent 升级到 agent team 的时机。反过来,team「比在一个 session 内协调更重、更贵」。

03 · 速查

逐项对照表

同一个决策的快速查表。左蓝右绿,蓝便宜简单、绿强大但贵。

维度
Subagent
Agent Team
通信模型
单向汇报,兄弟间不可对话
点对点 mailbox + 共享任务列表
上下文
隔离窗口,结果摘要回流主 session
各自独立 1M,互不可见
并行性
多个 Task 可并发,但单个会阻塞主线程
天然并行,互不阻塞
token 经济
小规模便宜;lead context 随结果膨胀,大规模会爆
初始化即 N× ;但无人背全局历史,大 pipeline 可更省
搭建/调试
简单好调,覆盖约 90% 并行需求
更难搭更难调;session 恢复有缺陷
状态
稳定、内置三种类型 + 可自定义
Experimental,迭代快,默认关闭
该用它当…
worker 只需独立干活然后汇报
worker 需共享发现、互相挑战、自行协调
一句话记忆

需要「干净的隔离」选 Subagent;需要「会对话的协作」选 Agent Team。找不出至少 3 条真正独立的并行工作流,就别上 team。

04 · 决策框架

什么时候用、什么时候反而更糟

核心始终是:协调开销,是否小于并行省下的时间?

绿灯 · 上 Team

有真优势

并行探索创造独立价值
  • 多视角并行评审:三人同审一个 PR——查安全 / 测性能 / 看覆盖。单 agent 一旦先发现安全 bug 就会"锚定",后续评审变浅;三个隔离 context 给三份真正独立的报告。
  • 竞争性假设调试:一个 bug 五个可能成因,五人各追一个并互相攻击对方结论。
  • 跨层特性开发:前端 / 后端 / 测试同时推进,后端改了 API 契约能直接 message 前端。
  • 调研 + 综述:多人同查不同侧面再汇总互质——边界清晰、不写代码,最适合入门。
黄灯 · 先掂量

多半另有更优解

能拆,但未必值
  • 独立但无需协调的批量改动:worker 不用对话时,协调层是纯浪费——用 /batch 或 async 更简单。
  • 扇出极宽且重复:几十个文件、benchmark 矩阵——用 Dynamic Workflows 从脚本编排上千 subagent。
  • 超大代码库单点任务:单 agent 光加载就吃掉 80–90% context 时,拆 team 的理由从"并行"变成"避免溢出"。
红灯 · 别用

一定更慢更贵

协调开销吃掉全部收益
  • 严格顺序任务(A 阻塞 B 阻塞 C)· 同文件编辑(合并冲突几乎必然)· 十分钟能干完的小任务
  • 依赖密集紧耦合:teammate 大部分时间在等彼此,并行名存实亡。
  • 普通 bug 修复 / 重构 / 加组件:team 是错的工具,你会更慢也更穷。
05 · 成本

token 的账要算在前面

没有固定价格,随 teammate 数量和工作量线性放大。反直觉点:并行不减少 token,而是把它乘起来——倍数在任何实际工作开始前就产生了。

3–4×单 session 的 token

典型 3 人 team 处理同任务的量级。4 人加载同一份项目上下文,初始化成本就是 4×,之后每条 agent 间消息还是一次计费往返。

单 session
3 人 team
~3.5×
5 人 team
5×+

3起步人数,5 封顶

多数工作流从 3 人最平衡。token 线性增长,但协调开销增长更快。三个角色清晰的 agent 持续优于五个范围模糊的。每人 5–6 个任务保持高产又不过度切换。

超 5 人需明确理由——只有确有并行工作流在等,才加人。

什么时候 team 反而更省

大规模 pipeline(10+ worker)下,subagent 的 orchestrator 会把所有结果累积进自己 context、轻松冲到 30–50k token 甚至撞上限。而 team 里没有单一 agent 背负全局历史,每人只加载自己那块——临界点在于:协调开销 vs. context 溢出,谁更贵。

06 · 落到你的场景

套到「科技商业复盘」内容 pipeline

你的 topic scout → 全文抓取 → 脚本合成是一条顺序、阶段间有依赖的流水线。诚实说:端到端用 team 大概率红灯——阶段必须串行。但单个阶段内部有几处是漂亮的绿灯。

阶段级建议
1

选题发现 / 验证

多源(HN / Medium / RSS)抓取打分天然并行:一人负责时效筛选、一人评"复盘叙事潜力"、一人唱反调挑"是不是已被做烂"。三个隔离 context 给三份不被锚定的独立判断。

✓ 绿灯 · Agent Team(research/review 最佳入门)
2

全文抓取(trafilatura → Jina → Firecrawl 分层回退)

对 N 个 URL 做同构、独立、无需通信的批处理。worker 间无对话需求——上 team 黄偏红。用 /batch 或 subagent 扇出更简省,自动隔离。

→ Subagent / batch 扇出,别上 team
3

脚本合成(多源综合,绝不单篇搬运)

合成是收敛性单点创作,强行多 agent 会因同文件、强耦合打架。但前面可挂一个 team:reviewer 分别从"事实核查 / 叙事节奏 / 钩子强度"三个独立 lens 审稿。合成本身留给单 session。

→ 合成单 session · 评审可用 Team 多 lens

总结:team 用在"需要多个不被污染的独立判断"的节点(选题、审稿),串行流水线留给单 session + subagent 扇出。你在盯 token 配额,默认走便宜路径,只在"质量分歧值钱"处花 3–4× 的钱。

07 · 启用

开起来 + 几条保命习惯

# 1. 确认版本 ≥ v2.1.32,模型为 Opus 4.6
claude --version
# 2. 在 ~/.claude/settings.json 或环境变量中开启
export CLAUDE_CODE_EXPERIMENTAL_AGENT_TEAMS=1
# 3. 重启 Claude Code(开关启动时读取,跳过重启 = "功能没出现"头号原因)
# 4. 验证
echo $CLAUDE_CODE_EXPERIMENTAL_AGENT_TEAMS   # 应输出 1
# 5. 自然语言描述任务和角色,lead 自动建 team、spawn、派活
"Spawn 三个 teammate 评审 PR #142:一个查安全、一个测性能、
 一个验测试覆盖。让他们各自评审并汇报发现。"
习惯 · 权限

预批准文件写入与 shell

中途弹权限确认会卡住并行执行、需手动干预,抵消大半收益。启动前先为工作目录预批准。

习惯 · 恢复

别指望恢复 team

session 被清理后 /resume/rewind 不恢复 in-process teammate。长跑前存好中间产物。

习惯 · 规划

Plan-first 不可妥协

不经批准就跳进代码是一团糟。先用 plan mode 定角色、边界、产出文件,再放手跑。

习惯 · 隔离

保持文件级隔离

操作不同文件的任务很少冲突;碰共享 config 的需小心排序。建议配 Git worktree。

08 · 收束

三句话带走

01

定位

Team 不是更聪明的 agent,而是把"会互相污染的判断"拆成独立 context 并行推进。需要干净隔离用 subagent,需要会对话的协作才用 team。

02

代价

典型 3 人约 3–4× token,协调开销更快增长。90% 场景单 session 或 subagent 就够,team 只为少数高价值场景存在。

03

对你

串行 pipeline 整体红灯;但选题验证、审稿是绿灯——在"质量分歧值钱"的节点花钱,其余走便宜路径。

04

判据

一问定生死:worker 们需要彼此对话吗?找不出 ≥3 条真正独立的并行工作流,就别上 team。

Claude Code 官方文档Anthropic · Opus 4.6 发布claude.com/blog · subagentsMindStudioBuilder.ioAI Builder ClubKimiAddy Osmani

Agent Teams 是实验特性,迭代很快(TeamCreate/TeamDelete 已在 v2.1.178 移除)。落地前以官方文档为准:code.claude.com/docs/en/agent-teams。时间/token 数字来自社区实测,非保证值;产品行为对照官方文档核实。

← → 翻页 · 或点下方圆点