《Scaling Managed Agents》表面讲的是托管 agent 架构,真正有价值的是一套研发组织方法论:把可变智能放进 Brain,把危险执行隔离成 Hands,把不可丢失的任务事实沉淀为 Session。
Claude + harness:思考、规划、路由工具调用。
append-only event log:任务状态、证据、失败、恢复点。
sandbox / MCP / repo / browser / CI / deploy:可替换执行环境。
不是某个 API,而是如何设计能跨模型代际、跨工具实现、跨组织流程演进的稳定接口。
把 session、harness、sandbox 放在一个容器里很简单,但容器挂了任务就挂了,debug 还会碰到用户数据和凭据。
harness 离开容器,sandbox 变成普通工具调用;session log 在外部持久化,brain 和 hands 都可以 cattle 化。
AI 任务中心应是可恢复的 task session,而不是某个 agent 当前上下文、某个人本机或某段 summary。
关键变化:从“人/agent 管任务”转向“session 管任务”。
这些原则可以直接转成团队 AI coding / agent 协作规范。
记录目标、决策、文件、命令、失败、测试、下一步。summary 可以有,但不能替代 event log。
如果当前 agent 现在死掉,另一个 agent 应该能通过 session log 在 5 分钟内接手。
标准 devcontainer、bootstrap、seed data、test command、artifact path;不要依赖某个本机状态。
用 token broker、MCP proxy、短期权限、session scope。不要靠 prompt 告诉 agent “不要读 token”。
稳定的是 assign / readContext / execute / emitEvent / review / deploy / rollback,不是某个具体 agent 工具。
模型能力进步后,旧的频繁确认、小步拆分、过度汇报可能变成组织摩擦。
manager-worker 不是核心;核心是 shared session、resource registry、scoped hands、显式 handoff。
harness 不只是循环调模型,还要记录事件、管理 context、权限边界、失败恢复和 review artifact。
好的 handoff 是可恢复状态,而不是一段漂亮文字。
帮助快速进入,不承担唯一真相。
保留原始证据,允许未来 agent 回看、切片、重放。
让接手者拿到真实产物,而不是只能相信描述。
不要优先堆更多角色。先把任务闭环的底层对象做对。
从传统 PR-centric 流程,升级为 session-centric 的 AI-native 流程。
| 传统重点 | AI-native 重点 | 操作含义 |
|---|---|---|
| 谁负责这个任务 | session 是否完整 | 责任人可以变,但任务事实不能丢。 |
| 谁知道上下文 | context 是否可查询 | 上下文是对象,不是某个 agent 的记忆。 |
| 谁在本地跑了什么 | event log 是否可审计 | 命令、日志、失败路径都进入任务账本。 |
| 谁有权限 | capability 是否按 session 授权 | agent 只拿任务需要的能力,看不到长期凭据。 |
| 谁来接手 | 任何 brain 是否能恢复 | handoff by state, not by summary。 |
| PR 最终结果 | 决策和失败路径是否可追溯 | review 不只看 diff,也看过程证据。 |
适合拿这篇文章做研发团队研讨时直接使用。