ByteNoteByteNote

字节笔记本

2026年6月14日

MCP:当AI工具有上百个时,怎么不让模型挑花眼

API中转
¥120

当 AI 助手拥有几十甚至上百种工具时,把所有工具描述一股脑塞进提示词是有问题的——浪费 token、增加延迟,还可能导致模型选错工具。模型上下文提供者(Model Context Provider,MCP)就是解决这个问题的智能调度层:先分析用户需求,只挑出相关的工具子集,再组合成精简的提示词发给大语言模型。

MCP 的工作流程

整个流程分七步:

  1. 接收用户请求
  2. 分析用户意图
  3. 从所有可用工具中选出相关的子集
  4. 构建动态提示词(系统指令 + 工具使用说明 + 仅选定工具的定义 + 对话历史 + 用户请求)
  5. 发送给 LLM
  6. 处理 LLM 输出——如果模型决定使用工具,MCP 执行工具并获取结果;如果不需要工具,模型直接生成回复
  7. 将工具执行结果或直接回复返回给用户

关键在于第 3 步和第 4 步:MCP 不是把所有工具都丢给模型,而是只塞入与当前请求相关的工具描述。

工具选择方法

MCP 可以通过多种方式判断哪些工具和用户请求相关:

  • 关键词匹配:用正则或字符串匹配检查用户请求中是否包含工具名称或描述中的关键词
  • 语义搜索/嵌入:将用户请求和工具描述转换为向量,找语义相似度最高的工具
  • 规则系统:定义明确规则,比如"如果查询包含'天气'和城市名,则包含天气查询工具"
  • 分类模型:用专门的模型或小型 LLM 分类用户意图并映射到相关工具

四种方法各有适用场景。关键词和规则快但死板,嵌入和分类灵活但需要更多计算。实际中往往组合使用。

MCP 的优势

  • 减少提示词大小:只包含相关工具,节省 token,降低延迟和成本
  • 提高可靠性:模型不容易被不相关工具混淆,选错工具的概率降低
  • 加快决策速度:选项越少,模型做出工具调用决策越快
  • 增强控制:可以精细控制对每个请求向模型公开哪些功能

这几个优势在工具数量多时尤其明显。当工具从 5 个增长到 100 个时,MCP 的价值就体现出来了。

实际应用场景

多功能 AI 助手是最典型的场景——几十种工具通过 MCP 智能选择,避免模型被淹没。其他场景包括:根据用户权限动态调整可用工具(个性化服务)、在计算资源有限的环境下减少不必要的工具描述、在医疗法律等专业领域根据问题类型选择专业工具。

实现上的技术考虑

搭建一个高效的 MCP 系统,几个关键点:

  • 工具分类体系:建立良好的分类结构,便于快速筛选
  • 嵌入向量数据库:为工具描述创建嵌入向量并存储,支持语义搜索
  • 缓存机制:缓存常见请求类型的工具选择结果,减少重复分析
  • 监控和反馈:跟踪工具选择的准确性,根据实际使用情况持续优化

MCP 代表了一个重要趋势:不是简单地增加模型规模或堆更多工具,而是优化模型与工具之间的交互方式。随着 AI 工具生态不断扩大,工具数量可能呈指数级增长,MCP 这样的智能调度层会越来越重要。

分享: