字
字节笔记本
2026年5月1日
MaaS 平台主流开源编程模型定价与选型指南(2026 年 5 月)
API中转
¥120
本文汇总当前主流 MaaS 平台上开源编程模型的定价与核心特性,帮助开发者在实际项目中做出性价比最优的模型选择。
编程场景模型定价速查
以下按输出价格从低到高排列,聚焦工具调用 + 编程能力突出的模型:
| 模型 | 输入(元/K) | 输出(元/K) | 上下文 | 核心特性 |
|---|---|---|---|---|
| DeepSeek-V4-Flash | 0.001 | 0.002 | 100万 | 2840亿总参/130亿激活,高 TPS,轻量编程 |
| MiniMax-M2.5 | 0.0021 | 0.0084 | — | Excel/PPT/深度调研 SOTA,Agent 原生设计 |
| DeepSeek-V3.2 | 0.002 | 0.003 | — | GPT-5 水平,支持思考模式下工具调用 |
| Qwen3.5 Plus | 0.0048 | 0.0048 | — | 原生视觉语言,混合架构,性价比突出 |
| GLM-5 | 0.004 | 0.018 | — | Agentic Engineering SOTA,逼近 Claude Opus 4.5 |
| Kimi K2.5 | 0.004 | 0.021 | — | Agent/代码/视觉 SoTA,原生多模态 |
| Kimi K2.6 | 0.0065 | 0.027 | 256K | K2 系列最新,SWE-Bench Pro 领先,支持视频输入 |
| DeepSeek-V4-Pro | 0.012 | 0.024 | 100万 | 1.6万亿总参/490亿激活,复杂推理首选 |
| GLM-5.1 | 0.006 | 0.024 | — | 可独立处理任务 8 小时以上,长周期编程 |
| Qwen3.6 Plus | 0.012 | 0.012 | — | 3.6 系列旗舰,Agent 编程与前端 SOTA |
| Qwen3 Max | 0.006 | 0.024 | — | Agent 编程与工具调用专项升级 |
| MiniMax-M2.7 | 0.0021 | 0.0084 | — | 下一代 LLM,多智能体协同,自主任务规划 |
| gpt-oss-20b | 0.00072 | 0.0036 | — | OpenAI 开源,210亿/36亿激活,单 GPU 可跑 |
| gpt-oss-120b | 0.00108 | 0.0054 | — | OpenAI 开源,1170亿/51亿激活,H100 单卡 |
模型特性详解
DeepSeek 系列:性价比之王
DeepSeek-V4-Flash
- 2840 亿总参数,130 亿激活参数
- 100 万 token 上下文窗口
- 专为快速推理和高吞吐量设计
- 适用:编程助手、聊天系统、Agent 工作流
DeepSeek-V4-Pro
- 1.6 万亿总参数,490 亿激活参数
- 100 万 token 上下文窗口
- 高级推理、编程和长程 Agent 工作流
- 适用:全代码库分析、多步骤自动化
DeepSeek-V3.2
- GPT-5 水平,支持思考模式工具调用
- Speciale 探索版在国际竞赛中金牌级表现
Kimi 系列:Agent 能力领先
Kimi K2.5
- Kimi 迄今最智能模型
- Agent、代码、视觉理解开源 SoTA
- 原生多模态,支持思考/非思考模式
Kimi K2.6
- K2 系列最新旗舰
- Humanity's Last Exam、SWE-Bench Pro、DeepSearchQA 领先
- 支持文本/图片/视频输入
GLM 系列:智谱旗舰
GLM-5
- 面向 Agentic Engineering 打造
- Coding 与 Agent 能力开源 SOTA
- 真实编程场景体感逼近 Claude Opus 4.5
GLM-5.1
- 可独立持续处理单个任务超过 8 小时
- 全程自主规划、执行并自我优化
- 交付完整工程级结果
MiniMax 系列:Office 生产力 SOTA
MiniMax-M2.5
- 专为 Agent 场景原生设计
- Excel 高阶处理、PPT 生成、深度调研行业领先
- 编程与智能体性能对标 Claude Opus 4.6
MiniMax-M2.7
- 下一代大语言模型
- 多智能体协同,动态环境中自主规划、执行与优化
Qwen 系列:阿里通义千问
Qwen3.5 Plus
- 原生视觉语言模型
- 混合架构(线性注意力 + 稀疏 MoE)
- 纯文本与多模态双提升
Qwen3.6 Plus
- 3.6 系列旗舰
- Agent 编程、前端开发、复杂问题求解 SOTA
Qwen3 Max
- Agent 编程与工具调用专项升级
- 正式版达到领域 SOTA
OpenAI 开源系列
gpt-oss-20b
- Apache 2.0 许可证
- 210 亿参数/36 亿激活,MXFP4 量化
- 消费级/单 GPU 可部署
- 可配置推理等级、工具调用、结构化输出
gpt-oss-120b
- 1170 亿参数/51 亿激活
- H100 单卡高效运行
- 完整思维链访问、原生工具调用
选型建议
| 场景 | 推荐模型 | 理由 |
|---|---|---|
| 日常编程助手 | DeepSeek-V4-Flash | 最低成本,高 TPS |
| 复杂代码分析 | DeepSeek-V4-Pro | 1.6T 参数,长上下文 |
| Agent 工作流 | Kimi K2.6 / GLM-5 | Agent 能力开源领先 |
| 前端开发 | Qwen3.6 Plus / GLM-4.7 | 前端美感与长程任务 |
| Office 生产力 | MiniMax-M2.5 | Excel/PPT/调研 SOTA |
| 本地部署 | gpt-oss-20b | 单 GPU,Apache 2.0 |
| 多模态编程 | Qwen3.5 Plus | 原生视觉语言 |
| 超长任务 | GLM-5.1 | 8 小时持续处理 |
免费模型
以下模型当前限时免费:
- LongCat-Flash-Lite(Meituan):685 亿总参/30 亿激活
- Nemotron 3 Super(NVIDIA):1200 亿参数/120 亿激活,100 万上下文
- GLM-4.5 Air(智谱):轻量级混合推理
- Tencent/Hy3 Preview:可配置推理级别,Agent 工作流优化
- Qwen3.5 35B A3B:原生视觉语言
其他能力模型
视频生成
| 模型 | 价格 | 特性 |
|---|---|---|
| Kling-V3 | 0.6 元/秒 | 15 秒高清,多镜头连贯,原生音频 |
| Vidu Q3 Pro | 0.4375 元/秒 | 高品质视听视频,音效语音同步 |
| Vidu Q3 Turbo | 0.25 元/秒 | 快速音频视频生成 |
图像生成
| 模型 | 价格 | 特性 |
|---|---|---|
| Kling-V1 | 0.025 元/张 | 文生图、图生图 |
| Kling-V2 | 0.1 元/张 | 多图参考、风格转绘 |
| Kling-Image O1 | 0.2 元/张 | 强参照控制图像编辑 |
语音
| 服务 | 价格 |
|---|---|
| ASR(语音识别) | 0.08 元/分钟 |
| TTS(文本转语音) | 0.06 元/100 字符 |
分享: