ByteNoteByteNote

字节笔记本

2026年5月13日

DeepSeek-V4 模型价格说明

API中转
¥120

DeepSeek 于 2026 年 4 月推出 V4 系列模型,包括 DeepSeek-V4-Flash 和 DeepSeek-V4-Pro 两个版本。本文整理了最新的模型定价信息,帮助开发者了解成本构成和选择合适的模型。

价格总览

以下价格以"百万 tokens"为单位。Token 是模型用来表示自然语言文本的最小单位,可以是一个词、一个数字或一个标点符号等。费用根据模型输入和输出的总 token 数进行计量计费。

项目DeepSeek-V4-FlashDeepSeek-V4-Pro
BASE URL (OpenAI 格式)https://api.deepseek.comhttps://api.deepseek.com
BASE URL (Anthropic 格式)https://api.deepseek.com/anthropichttps://api.deepseek.com/anthropic
上下文长度1M1M
输出长度最大 384K最大 384K
百万 tokens 输入(缓存命中)0.02 元0.025 元(2.5 折后)
百万 tokens 输入(缓存未命中)1 元3 元(2.5 折后)
百万 tokens 输出2 元6 元(2.5 折后)

请注意:DeepSeek-V4-Pro 当前处于 2.5 折优惠期,优惠延长至北京时间 2026/05/31 23:59。上表中 Pro 价格为折后价,括号内标注了折后单价。原价分别为:缓存命中 0.1 元、缓存未命中 12 元、输出 24 元。

思考模式

V4 系列全模型支持非思考与思考模式(默认为思考模式),切换方式详见官方文档。

功能支持

功能DeepSeek-V4-FlashDeepSeek-V4-Pro
JSON Output支持支持
Tool Calls支持支持
对话前缀续写(Beta)支持支持
FIM 补全(Beta)仅非思考模式支持仅非思考模式支持

扣费规则

扣减费用 = token 消耗量 × 模型单价,对应的费用将直接从充值余额或赠送余额中进行扣减。当充值余额与赠送余额同时存在时,优先扣减赠送余额。

产品价格可能发生变动,DeepSeek 保留修改价格的权利。请依据实际用量按需充值,定期查看官方页面以获知最新价格信息。

模型名变更说明

deepseek-chatdeepseek-reasoner 两个模型名将于日后弃用。出于兼容考虑,二者分别对应 deepseek-v4-flash 的非思考与思考模式。建议开发者尽快迁移至新的模型名。

缓存命中价格说明

全系列模型输入缓存命中的价格已降至首发价格的 1/10,该价格调整自北京时间 2026/4/26 20:15 起生效。合理利用缓存可大幅降低成本,建议在重复性查询场景中注意缓存利用率。

分享: