ByteNoteByteNote

字节笔记本

2026年5月3日

Cursor - 扩展长时间运行的自主编码能力

API中转
¥120

本文介绍了 Cursor 团队在让编码 Agent 运行数周且完全自主工作方面的探索成果。通过同时运行数百个并发 Agent,协调它们的工作,成功写出超过一百万行代码和数万亿个 token。

来源: Cursor 博客 作者: Wilson Lin 发布时间: 2026年1月14日 原文链接: https://cursor.com/cn/blog/scaling-agents

核心要点

单个 Agent 的局限

  • 在专注的小任务上表现不错,但在复杂项目上显得缓慢
  • 并行运行多个 Agent 需要搞清楚如何协调它们

学习如何协同

最初方法(动态协调):

  • 所有 Agent 平等,通过共享文件自行协同
  • 使用锁机制防止任务抢占

失败原因:

  • Agent 持有锁太久或忘记释放
  • 锁机制成为瓶颈(20 个 Agent 降至 2-3 个有效吞吐量)
  • 系统脆弱,容易失败
  • Agent 回避困难任务,缺乏端到端责任

规划者和执行者

新的架构 - 将角色拆分开来:

规划者(Planners):

  • 持续探索代码库并创建任务
  • 可针对特定区域派生子规划者
  • 规划过程本身可以并行且递归地展开

执行者(Workers):

  • 领取任务并专注完成
  • 不与其他执行者协调
  • 完成后提交变更

每个周期结束时,评审 Agent 判断是否继续,下一轮迭代从干净的初始状态重新开始。

实验成果

从零构建浏览器

  • 持续运行近一周
  • 1,000 个文件,超过 100 万行代码
  • 成百上千个 worker 并发运行
  • 几乎没有冲突
  • GitHub: fastrender

Solid 到 React 迁移

  • 持续 3 周多
  • 代码增删量达 +266K/-193K
  • 有可能合并这次大规模改动

其他实验

项目提交次数代码行数
Java LSP7.4K55 万
Windows 7 模拟器14.6K120 万
Excel12K160 万
视频渲染优化-25 倍速度提升

关键发现

模型选择至关重要

  • GPT-5.2 系列在长时间自主工作方面更优秀
  • 更能遵循指令、保持专注、避免偏离
  • 实现更精确和完整
  • 不同模型在不同角色上各有所长
  • GPT-5.2 仍是更好的规划者

"减法"优于"加法"

  • 质量控制和冲突解决的集成者角色成为瓶颈
  • Worker 本身已能处理彼此之间的冲突
  • 最好的系统往往比你想的更简单

结构化程度

  • 结构太少:Agent 互相冲突、重复劳动、偏离
  • 结构太多:系统变得脆弱
  • 合适的结构介于两端之间

提示词的重要性

  • 系统行为很大程度上取决于提示词设计
  • 让 Agent 良好协作、避免异常行为
  • 保持长时间专注需要大量实验

未来方向

当前挑战

  • Planner 应该在任务完成时自动"醒来"
  • Agent 有时会运行时间过长
  • 仍需定期从头重启以对抗漂移

核心发现

"能否通过向一个问题投入更多 Agent 来扩展自主编码能力",答案比预期更乐观。

上百个 Agent 可以在同一个代码库上协同工作数周,推动雄心勃勃的项目取得实质进展。

相关文章

分享: