DeepSeek-V4 模型价格说明

DeepSeek 于 2026 年 4 月推出 V4 系列模型，包括 DeepSeek-V4-Flash 和 DeepSeek-V4-Pro 两个版本。本文整理了最新的模型定价信息，帮助开发者了解成本构成和选择合适的模型。

价格总览

以下价格以"百万 tokens"为单位。Token 是模型用来表示自然语言文本的最小单位，可以是一个词、一个数字或一个标点符号等。费用根据模型输入和输出的总 token 数进行计量计费。

项目	DeepSeek-V4-Flash	DeepSeek-V4-Pro
BASE URL (OpenAI 格式)	`https://api.deepseek.com`	`https://api.deepseek.com`
BASE URL (Anthropic 格式)	`https://api.deepseek.com/anthropic`	`https://api.deepseek.com/anthropic`
上下文长度	1M	1M
输出长度	最大 384K	最大 384K
百万 tokens 输入（缓存命中）	0.02 元	0.025 元（2.5 折后）
百万 tokens 输入（缓存未命中）	1 元	3 元（2.5 折后）
百万 tokens 输出	2 元	6 元（2.5 折后）

请注意：DeepSeek-V4-Pro 当前处于 2.5 折优惠期，优惠延长至北京时间 2026/05/31 23:59。上表中 Pro 价格为折后价，括号内标注了折后单价。原价分别为：缓存命中 0.1 元、缓存未命中 12 元、输出 24 元。

V4 系列全模型支持非思考与思考模式（默认为思考模式），切换方式详见官方文档。

扣减费用 = token 消耗量 × 模型单价，对应的费用将直接从充值余额或赠送余额中进行扣减。当充值余额与赠送余额同时存在时，优先扣减赠送余额。

产品价格可能发生变动，DeepSeek 保留修改价格的权利。请依据实际用量按需充值，定期查看官方页面以获知最新价格信息。

deepseek-chat 与 deepseek-reasoner 两个模型名将于日后弃用。出于兼容考虑，二者分别对应 deepseek-v4-flash 的非思考与思考模式。建议开发者尽快迁移至新的模型名。

全系列模型输入缓存命中的价格已降至首发价格的 1/10，该价格调整自北京时间 2026/4/26 20:15 起生效。合理利用缓存可大幅降低成本，建议在重复性查询场景中注意缓存利用率。