ByteNoteByteNote

字节笔记本

2026年5月1日

MaaS 平台主流开源编程模型定价与选型指南(2026 年 5 月)

API中转
¥120

本文汇总当前主流 MaaS 平台上开源编程模型的定价与核心特性,帮助开发者在实际项目中做出性价比最优的模型选择。

编程场景模型定价速查

以下按输出价格从低到高排列,聚焦工具调用 + 编程能力突出的模型:

模型输入(元/K)输出(元/K)上下文核心特性
DeepSeek-V4-Flash0.0010.002100万2840亿总参/130亿激活,高 TPS,轻量编程
MiniMax-M2.50.00210.0084Excel/PPT/深度调研 SOTA,Agent 原生设计
DeepSeek-V3.20.0020.003GPT-5 水平,支持思考模式下工具调用
Qwen3.5 Plus0.00480.0048原生视觉语言,混合架构,性价比突出
GLM-50.0040.018Agentic Engineering SOTA,逼近 Claude Opus 4.5
Kimi K2.50.0040.021Agent/代码/视觉 SoTA,原生多模态
Kimi K2.60.00650.027256KK2 系列最新,SWE-Bench Pro 领先,支持视频输入
DeepSeek-V4-Pro0.0120.024100万1.6万亿总参/490亿激活,复杂推理首选
GLM-5.10.0060.024可独立处理任务 8 小时以上,长周期编程
Qwen3.6 Plus0.0120.0123.6 系列旗舰,Agent 编程与前端 SOTA
Qwen3 Max0.0060.024Agent 编程与工具调用专项升级
MiniMax-M2.70.00210.0084下一代 LLM,多智能体协同,自主任务规划
gpt-oss-20b0.000720.0036OpenAI 开源,210亿/36亿激活,单 GPU 可跑
gpt-oss-120b0.001080.0054OpenAI 开源,1170亿/51亿激活,H100 单卡

模型特性详解

DeepSeek 系列:性价比之王

DeepSeek-V4-Flash

  • 2840 亿总参数,130 亿激活参数
  • 100 万 token 上下文窗口
  • 专为快速推理和高吞吐量设计
  • 适用:编程助手、聊天系统、Agent 工作流

DeepSeek-V4-Pro

  • 1.6 万亿总参数,490 亿激活参数
  • 100 万 token 上下文窗口
  • 高级推理、编程和长程 Agent 工作流
  • 适用:全代码库分析、多步骤自动化

DeepSeek-V3.2

  • GPT-5 水平,支持思考模式工具调用
  • Speciale 探索版在国际竞赛中金牌级表现

Kimi 系列:Agent 能力领先

Kimi K2.5

  • Kimi 迄今最智能模型
  • Agent、代码、视觉理解开源 SoTA
  • 原生多模态,支持思考/非思考模式

Kimi K2.6

  • K2 系列最新旗舰
  • Humanity's Last Exam、SWE-Bench Pro、DeepSearchQA 领先
  • 支持文本/图片/视频输入

GLM 系列:智谱旗舰

GLM-5

  • 面向 Agentic Engineering 打造
  • Coding 与 Agent 能力开源 SOTA
  • 真实编程场景体感逼近 Claude Opus 4.5

GLM-5.1

  • 可独立持续处理单个任务超过 8 小时
  • 全程自主规划、执行并自我优化
  • 交付完整工程级结果

MiniMax 系列:Office 生产力 SOTA

MiniMax-M2.5

  • 专为 Agent 场景原生设计
  • Excel 高阶处理、PPT 生成、深度调研行业领先
  • 编程与智能体性能对标 Claude Opus 4.6

MiniMax-M2.7

  • 下一代大语言模型
  • 多智能体协同,动态环境中自主规划、执行与优化

Qwen 系列:阿里通义千问

Qwen3.5 Plus

  • 原生视觉语言模型
  • 混合架构(线性注意力 + 稀疏 MoE)
  • 纯文本与多模态双提升

Qwen3.6 Plus

  • 3.6 系列旗舰
  • Agent 编程、前端开发、复杂问题求解 SOTA

Qwen3 Max

  • Agent 编程与工具调用专项升级
  • 正式版达到领域 SOTA

OpenAI 开源系列

gpt-oss-20b

  • Apache 2.0 许可证
  • 210 亿参数/36 亿激活,MXFP4 量化
  • 消费级/单 GPU 可部署
  • 可配置推理等级、工具调用、结构化输出

gpt-oss-120b

  • 1170 亿参数/51 亿激活
  • H100 单卡高效运行
  • 完整思维链访问、原生工具调用

选型建议

场景推荐模型理由
日常编程助手DeepSeek-V4-Flash最低成本,高 TPS
复杂代码分析DeepSeek-V4-Pro1.6T 参数,长上下文
Agent 工作流Kimi K2.6 / GLM-5Agent 能力开源领先
前端开发Qwen3.6 Plus / GLM-4.7前端美感与长程任务
Office 生产力MiniMax-M2.5Excel/PPT/调研 SOTA
本地部署gpt-oss-20b单 GPU,Apache 2.0
多模态编程Qwen3.5 Plus原生视觉语言
超长任务GLM-5.18 小时持续处理

免费模型

以下模型当前限时免费:

  • LongCat-Flash-Lite(Meituan):685 亿总参/30 亿激活
  • Nemotron 3 Super(NVIDIA):1200 亿参数/120 亿激活,100 万上下文
  • GLM-4.5 Air(智谱):轻量级混合推理
  • Tencent/Hy3 Preview:可配置推理级别,Agent 工作流优化
  • Qwen3.5 35B A3B:原生视觉语言

其他能力模型

视频生成

模型价格特性
Kling-V30.6 元/秒15 秒高清,多镜头连贯,原生音频
Vidu Q3 Pro0.4375 元/秒高品质视听视频,音效语音同步
Vidu Q3 Turbo0.25 元/秒快速音频视频生成

图像生成

模型价格特性
Kling-V10.025 元/张文生图、图生图
Kling-V20.1 元/张多图参考、风格转绘
Kling-Image O10.2 元/张强参照控制图像编辑

语音

服务价格
ASR(语音识别)0.08 元/分钟
TTS(文本转语音)0.06 元/100 字符
分享: