RAG 的下一步不是查得更准，而是先想清楚再查

RAG 技术已经证明了它能帮大模型"查资料"。但如果目标不是回答问题，而是做决策呢？

比如一个制药公司需要决定关停哪座工厂、雇佣多少员工，才能既最小化生产成本又保证准时交付。传统做法是：人类制定分析计划，RAG 负责查数据，人类再做决策。最困难的部分——规划分析路径——始终落在人肩上。

PlanRAG 这篇论文想做的，就是把这个"规划"环节也交给 AI。

它的核心思路很直观：在做检索之前，先让语言模型生成一个分析计划。这个计划描述为了做出决策需要执行哪些数据分析任务，然后检索器根据计划去生成查询、拉取数据。如果第一次计划不够用，还可以重新规划。

听起来像是一个简单的流程调整，但效果很显著。在论文构建的 Decision QA 基准 DQA 上，PlanRAG 相比现有的迭代 RAG 方法，在定位场景中准确率提升了 15.8%，在构建场景中提升了 7.4%。

这个提升的来源，在于一个关键差异：传统 RAG 是"边查边想"，PlanRAG 是"先想再查"。前者在处理复杂决策问题时容易遗漏关键数据——论文数据显示，迭代 RAG 在超过 60% 的定位问题和 95% 的建筑问题中未能从数据库检索到任何结果。而 PlanRAG 通过先规划再检索，将遗漏率从 3.3% 降到了 1.3%。

PlanRAG 架构示意图

当然，这还只是研究阶段的工作。论文也承认规划本身在复杂场景中仍然困难，特别是在需要多跳遍历的构建场景中。但方向已经清晰：当 RAG 从"回答问题"进化到"辅助决策"时，检索之前的规划环节可能是下一个真正的瓶颈。

对于正在搭建 RAG 系统的开发者来说，PlanRAG 的价值不在于照搬它的 SQL/Cypher 查询方案，而在于它揭示了一个容易被忽视的事实：检索策略的优劣，不只看你查到了什么，更看你查之前想清楚了什么。

字节笔记本

RAG 的下一步不是查得更准，而是先想清楚再查