字节笔记本
2026年2月20日
Sonnet 4.6 最被忽视的功能:动态过滤让 AI Agent 搜索效率提升 24%
本文介绍 Claude Sonnet 4.6 中一个被大多数人忽视的重要功能——动态过滤(Dynamic Filtering),它通过自动清理搜索结果显著提升了 AI Agent 的搜索效率并降低了 Token 消耗。
被忽视的亮点
当 Anthropic 发布 Sonnet 4.6 时,所有人的注意力都集中在基准测试分数和 100 万 Token 的上下文窗口上。但在同一天发布的另一篇技术博客却几乎被完全忽略——关于 Claude 如何处理网页搜索结果的更新。
这篇文章介绍的功能叫做动态过滤(Dynamic Filtering),它可能比你看到的任何基准测试都更重要,尤其是当你正在构建 AI 自动化工作流时。
AI Agent 搜索的痛点
每个构建 AI Agent 的开发者都会遇到这个问题:
你设置了一个 Agent,赋予它网页搜索能力。它出去抓取搜索结果,然后开始基于多个网站的原始 HTML 进行推理——包括页眉、页脚、导航菜单、Cookie 横幅、广告……所有这些垃圾信息都被塞进上下文窗口。
你的 Agent 正在花费 Token 阅读无用内容。更糟糕的是,所有这些噪音实际上会降低响应质量——信号被淹没在垃圾中。
这就是你的 AI Agent 每次搜索网页时都在做的事情,只是你看不到而已。
动态过滤如何工作
Sonnet 4.6 现在会自己编写代码来清理搜索结果,然后再进行阅读。
在 Sonnet 4.6 之前,Claude 会拉取原始搜索结果并对全部内容进行推理——每一个无关的段落、每一个侧边栏、每一个 Cookie 通知。
现在 Claude 会先编写并执行 Python 代码来过滤结果。它剔除噪音,只保留相关内容,然后基于干净的数据进行推理。
模型正在实时编写自己的预处理代码。它决定什么是相关的,扔掉不相关的内容,从更小的上下文窗口给出更清晰的答案。
这不是提示工程技巧,不是你写的自定义代码,它就在模型层面自动发生。
效果显著:准确率提升 11%,Token 减少 24%
Anthropic 在两个基准测试中验证了动态过滤的效果:
BrowseComp 测试
测试 Agent 能否在多个网站中挖掘找到特定信息的能力:
- Sonnet:从 33.3% 提升到 46.6%
- Opus:从 45.3% 提升到 61.6%
DeepsearchQA 测试
测试 Agent 能否系统性地找到研究查询的所有正确答案:
- Sonnet:从 52.6% 提升到 59.4%
- Opus:从 69.8% 提升到 77.3%
Token 使用量平均减少了 24%——同样的任务,更好的结果,你只需要支付更少的费用。
如果你在 n8n 或其他平台中运行搜索网页的 AI Agent,这 24% 的节省会在每次执行中累积。
Sonnet 4.6 其他重要更新
除了动态过滤,这次发布还有几个值得关注的更新:
免费默认模型
Sonnet 4.6 现在是免费的默认模型,不需要 Pro 订阅,所有人都可以使用。
100 万 Token 上下文窗口(Beta)
在 API 上,你需要达到使用等级 4 并传递特定的 Beta 头部才能访问。但当完全推出时,这足以在单次请求中容纳整个文档集、完整合同或数十篇研究论文。
Computer Use 大幅提升
早期用户报告在复杂电子表格导航和跨多个浏览器标签页填写多步骤网页表单等任务上达到了人类水平的表现。
代码执行和记忆工具正式可用
API 上的代码执行和记忆工具现已正式发布,不再需要 Beta 标志。
是时候升级了
如果你还在使用 Sonnet 4.5,现在是时候切换了。
这不是那种可以忽略几个月的增量更新。如果你有搜索网页的 AI Agent,你在 4.5 上支付更多费用却得到更差的结果——不是差一点,而是差 24%。
如果你正在构建新的自动化流程,Sonnet 4.6 应该是你的默认起点。成本计算一夜之间改变了。
如果你还没有开始构建 AI Agent,请密切关注这里的趋势。这些工具正在以惊人的速度变得更好。使用它们的人和旁观的人之间的差距每个月都在扩大。