ByteNoteByteNote

字节笔记本

2026年5月30日

RAG 的下一步不是查得更准,而是先想清楚再查

API中转
¥120

RAG 技术已经证明了它能帮大模型"查资料"。但如果目标不是回答问题,而是做决策呢?

比如一个制药公司需要决定关停哪座工厂、雇佣多少员工,才能既最小化生产成本又保证准时交付。传统做法是:人类制定分析计划,RAG 负责查数据,人类再做决策。最困难的部分——规划分析路径——始终落在人肩上。

PlanRAG 这篇论文想做的,就是把这个"规划"环节也交给 AI。

它的核心思路很直观:在做检索之前,先让语言模型生成一个分析计划。这个计划描述为了做出决策需要执行哪些数据分析任务,然后检索器根据计划去生成查询、拉取数据。如果第一次计划不够用,还可以重新规划。

听起来像是一个简单的流程调整,但效果很显著。在论文构建的 Decision QA 基准 DQA 上,PlanRAG 相比现有的迭代 RAG 方法,在定位场景中准确率提升了 15.8%,在构建场景中提升了 7.4%。

这个提升的来源,在于一个关键差异:传统 RAG 是"边查边想",PlanRAG 是"先想再查"。前者在处理复杂决策问题时容易遗漏关键数据——论文数据显示,迭代 RAG 在超过 60% 的定位问题和 95% 的建筑问题中未能从数据库检索到任何结果。而 PlanRAG 通过先规划再检索,将遗漏率从 3.3% 降到了 1.3%。

PlanRAG 架构示意图

当然,这还只是研究阶段的工作。论文也承认规划本身在复杂场景中仍然困难,特别是在需要多跳遍历的构建场景中。但方向已经清晰:当 RAG 从"回答问题"进化到"辅助决策"时,检索之前的规划环节可能是下一个真正的瓶颈。

对于正在搭建 RAG 系统的开发者来说,PlanRAG 的价值不在于照搬它的 SQL/Cypher 查询方案,而在于它揭示了一个容易被忽视的事实:检索策略的优劣,不只看你查到了什么,更看你查之前想清楚了什么。

分享: