MaaS 平台主流开源编程模型定价与选型指南（2026 年 5 月）

本文汇总当前主流 MaaS 平台上开源编程模型的定价与核心特性，帮助开发者在实际项目中做出性价比最优的模型选择。

编程场景模型定价速查

以下按输出价格从低到高排列，聚焦工具调用 + 编程能力突出的模型：

模型	输入(元/K)	输出(元/K)	上下文	核心特性
DeepSeek-V4-Flash	0.001	0.002	100万	2840亿总参/130亿激活，高 TPS，轻量编程
MiniMax-M2.5	0.0021	0.0084	—	Excel/PPT/深度调研 SOTA，Agent 原生设计
DeepSeek-V3.2	0.002	0.003	—	GPT-5 水平，支持思考模式下工具调用
Qwen3.5 Plus	0.0048	0.0048	—	原生视觉语言，混合架构，性价比突出
GLM-5	0.004	0.018	—	Agentic Engineering SOTA，逼近 Claude Opus 4.5
Kimi K2.5	0.004	0.021	—	Agent/代码/视觉 SoTA，原生多模态
Kimi K2.6	0.0065	0.027	256K	K2 系列最新，SWE-Bench Pro 领先，支持视频输入
DeepSeek-V4-Pro	0.012	0.024	100万	1.6万亿总参/490亿激活，复杂推理首选
GLM-5.1	0.006	0.024	—	可独立处理任务 8 小时以上，长周期编程
Qwen3.6 Plus	0.012	0.012	—	3.6 系列旗舰，Agent 编程与前端 SOTA
Qwen3 Max	0.006	0.024	—	Agent 编程与工具调用专项升级
MiniMax-M2.7	0.0021	0.0084	—	下一代 LLM，多智能体协同，自主任务规划
gpt-oss-20b	0.00072	0.0036	—	OpenAI 开源，210亿/36亿激活，单 GPU 可跑
gpt-oss-120b	0.00108	0.0054	—	OpenAI 开源，1170亿/51亿激活，H100 单卡

模型特性详解

DeepSeek 系列：性价比之王

DeepSeek-V4-Flash

2840 亿总参数，130 亿激活参数
100 万 token 上下文窗口
专为快速推理和高吞吐量设计
适用：编程助手、聊天系统、Agent 工作流

DeepSeek-V4-Pro

1.6 万亿总参数，490 亿激活参数
100 万 token 上下文窗口
高级推理、编程和长程 Agent 工作流
适用：全代码库分析、多步骤自动化

DeepSeek-V3.2

GPT-5 水平，支持思考模式工具调用
Speciale 探索版在国际竞赛中金牌级表现

Kimi 系列：Agent 能力领先

Kimi K2.5

Kimi 迄今最智能模型
Agent、代码、视觉理解开源 SoTA
原生多模态，支持思考/非思考模式

Kimi K2.6

K2 系列最新旗舰
Humanity's Last Exam、SWE-Bench Pro、DeepSearchQA 领先
支持文本/图片/视频输入

GLM 系列：智谱旗舰

GLM-5

面向 Agentic Engineering 打造
Coding 与 Agent 能力开源 SOTA
真实编程场景体感逼近 Claude Opus 4.5

GLM-5.1

可独立持续处理单个任务超过 8 小时
全程自主规划、执行并自我优化
交付完整工程级结果

MiniMax 系列：Office 生产力 SOTA

MiniMax-M2.5

专为 Agent 场景原生设计
Excel 高阶处理、PPT 生成、深度调研行业领先
编程与智能体性能对标 Claude Opus 4.6

MiniMax-M2.7

下一代大语言模型
多智能体协同，动态环境中自主规划、执行与优化

Qwen 系列：阿里通义千问

Qwen3.5 Plus

原生视觉语言模型
混合架构（线性注意力 + 稀疏 MoE）
纯文本与多模态双提升

Qwen3.6 Plus

3.6 系列旗舰
Agent 编程、前端开发、复杂问题求解 SOTA

Qwen3 Max

Agent 编程与工具调用专项升级
正式版达到领域 SOTA

OpenAI 开源系列

gpt-oss-20b

Apache 2.0 许可证
210 亿参数/36 亿激活，MXFP4 量化
消费级/单 GPU 可部署
可配置推理等级、工具调用、结构化输出

gpt-oss-120b

1170 亿参数/51 亿激活
H100 单卡高效运行
完整思维链访问、原生工具调用

选型建议

场景	推荐模型	理由
日常编程助手	DeepSeek-V4-Flash	最低成本，高 TPS
复杂代码分析	DeepSeek-V4-Pro	1.6T 参数，长上下文
Agent 工作流	Kimi K2.6 / GLM-5	Agent 能力开源领先
前端开发	Qwen3.6 Plus / GLM-4.7	前端美感与长程任务
Office 生产力	MiniMax-M2.5	Excel/PPT/调研 SOTA
本地部署	gpt-oss-20b	单 GPU，Apache 2.0
多模态编程	Qwen3.5 Plus	原生视觉语言
超长任务	GLM-5.1	8 小时持续处理

免费模型

以下模型当前限时免费：

LongCat-Flash-Lite（Meituan）：685 亿总参/30 亿激活
Nemotron 3 Super（NVIDIA）：1200 亿参数/120 亿激活，100 万上下文
GLM-4.5 Air（智谱）：轻量级混合推理
Tencent/Hy3 Preview：可配置推理级别，Agent 工作流优化
Qwen3.5 35B A3B：原生视觉语言

其他能力模型

视频生成

模型	价格	特性
Kling-V3	0.6 元/秒	15 秒高清，多镜头连贯，原生音频
Vidu Q3 Pro	0.4375 元/秒	高品质视听视频，音效语音同步
Vidu Q3 Turbo	0.25 元/秒	快速音频视频生成

图像生成

模型	价格	特性
Kling-V1	0.025 元/张	文生图、图生图
Kling-V2	0.1 元/张	多图参考、风格转绘
Kling-Image O1	0.2 元/张	强参照控制图像编辑

语音

服务	价格
ASR（语音识别）	0.08 元/分钟
TTS（文本转语音）	0.06 元/100 字符