字
字节笔记本
2026年5月30日
Prompt 的底层不是指令,是概率工程
API中转
¥120
写了那么多提示词,有没有想过它到底是怎么起作用的?
大多数人把 prompt 当成一段给 AI 的"指令",说清楚就行了。但如果深入到模型的工作原理层面,你会发现 prompt 的运作方式远比"指令"复杂得多。
第一个原理:重塑概率分布。大语言模型本质上是一个概率系统。给定一段文本,模型预测下一个最可能的 token。你输入的 prompt,不是在"告诉"模型该做什么,而是在改变它内部的概率分布,让某些回答路径的可能性升高,其他路径的可能性降低。同一个问题,加一句"你是一个资深律师",和加一句"你是一个小学生",模型内部的概率分布完全不同。这不是角色扮演,这是概率工程。
第二个原理:约束生成路径。模型的推理过程不是线性的,而是树状的。在每一步,模型都有无数种选择。Prompt 的作用是在这个树状空间中剪枝,让模型沿着你期望的路径前进。结构化 prompt(分步指令、约束条件、输出格式)本质上是在每一步都限制了模型的选项空间,减少它走偏的概率。
第三个原理:激活特定知识模块。模型的训练数据覆盖了极其广泛的知识领域。但模型不会在每次回答时都动用全部知识。Prompt 的作用是激活模型中和当前任务相关的知识模块,同时抑制不相关的模块。一个关于物理学的 prompt 会激活模型在物理语料上学到的权重模式,同时抑制文学、历史等不相关的知识。
这三个原理不是独立运作的,它们叠加生效。好的 prompt 同时做到了重塑概率、约束路径和激活领域。差的 prompt 可能三条都做不到。
理解了这三个原理,你就不会再问"这个提示词该怎么写",而是会问"我想让模型的概率分布往哪个方向偏转"。后一个问题,才是提示词高手的思考方式。
分享: