ByteNoteByteNote

字节笔记本

2026年5月3日

大道至简!Cursor 发表了一个长篇悔改书

API中转
¥120

Cursor 发布技术博客,系统性总结了 Agent 的使用偏差和改进方案。核心改进是"动态上下文发现"技术,通过将大量数据文件化、按需提取的方式,在保持任务质量不变的前提下,Token 用量减少了 46.9%。

问题诊断

在过去,Cursor Agent 的实施是把所有的类似文档、代码、日志全部都塞进上下文当中,结果是 Token 爆炸,成本飙升,模型在长篇幅的 Prompt 里迷失了方向,各种的幻觉和信息稀释。

解决方案:动态上下文发现

通过最新的动态上下文发现技术,保持任务质量不变,Token 减少了近 46.9%。

动态上下文发现核心逻辑很简单:按需提取

五大优化场景

一、工具响应文件化

这是最常见的浪费。当执行一个 Shell 命令或调用一个 API,返回的 JSON 可能长达几千行,直接把它塞进上下文窗口,既昂贵又无效。

常见的做法是截断,但这会丢失关键信息。

Cursor 改进做法是把输出写入文件。Agent 不再看到几千行的日志,而是看到一个文件路径。如果它需要查看具体的错误堆栈,它会调用读取工具,使用 tail 或 grep 一样,想要什么,直接通过搜索,在文件里面去查找,而不是一股脑的全部塞到上下文当中去。

只读需要的那部分,最高效。

二、历史记录

对话越长,模型越糊涂,通常会对长对话进行摘要。但摘要是有损压缩,细节必定丢失。

当 Agent 需要回溯某个具体的变量名时,压缩后的信息可能就无能为力了。

Cursor 也如法炮制,将完整对话历史存为文件,当触发摘要机制时,新的上下文中只包含摘要和一个指向历史文件的引用。Agent 如果发现摘要里的信息不够,它可以主动去搜索历史文件。

这相当于给 Agent 外挂了一个无限容量的精准硬盘,而不是强行扩容它的内存。

三、 Skills

大量使用 Agent Skills。Skills 是扩展模型能力的非常好的方式。Skill 本来就是文件,这是它的自然属性,天然就可以利用了文件系统的天然索引能力。

使用 Skills,Agent 可以做到先检索,再加载,最后执行

四、MCP 工具的懒加载

如果你连接了十个 MCP 服务器,每个服务器有几十个工具,光是工具描述就能撑爆上下文。

Cursor 认为初始状态下,Agent 只知道有哪些服务器就行,当它决定探索某个服务时,才会读取该目录下的工具列表,懒加载策略能省一半 Token。

五、终端也是文件

Cursor 后面将所有集成终端的输出自动同步到本地文件。这样 Agent 可以像读取日志一样读取你的终端会话,不需要你粘贴输出,使用 grep 定位错误行。

核心思想

总结下来,你会发现,五条里面有四条是用的文件系统

根本不需要什么复杂的向量数据库或高深的检索算法,一个简单的文本文件,加上最基础的读写权限,就是 Agent 的外脑。

大道至简,文件系统就是 Agent 的最好的元语。

实践建议

场景优化方式
工具输出写入文件,而不是直接返回
历史对话存为文件,上下文只保留摘要+引用
Skills利用文件系统的索引能力
MCP 工具按需加载,不要一次性全部加载
终端输出自动保存到文件,便于 Agent 检索

与 Claude Code 的对比

  • 断舍离经验: 不使用 compact 功能,保持上下文简洁
  • 裸奔状态: 不装 MCP,节省 98.7% Token 用量
  • MCP 正确打开方式: 使用二进制形式,减少 Token 消耗

发布状态

这些新特性,目前从官方措辞来看,应该是灰度发布,后续会面向所有用户开放。


原文链接: https://mp.weixin.qq.com/s/xIwf2-12ef-5KeLPbvFZAQ 发布时间: 2026年1月8日

分享: