字
字节笔记本
2026年6月18日
Ollama 上架 Kimi K2.7 Code:Moonshot AI 的编程专用模型
API中转
¥120
Moonshot AI 的 Kimi K2.7 Code 近日正式上架 Ollama。这是一款面向编程场景专门优化的 agentic 模型,基于 Kimi K2.6 升级而来,在长程软件开发任务上表现提升明显,同时 thinking-token 消耗降低了约 30%。
模型概览
Kimi K2.7 Code 由月之暗面(Moonshot AI)发布,定位是编程专用、支持 agentic 工作流的代码模型。它并非一个独立应用,而是可以通过 Ollama 直接下载运行的本地/云端模型。模型参数量达 1.04T,支持 256K token 的上下文窗口,可处理长代码库、长文档和复杂的多轮开发任务。
目前在 Ollama 的模型页面显示下载量约 18.5K,最后一次更新在 6 天前。Ollama 提供的标签为 kimi-k2.7-code:cloud,意味着它默认以云端形式运行,也支持 vision(视觉)、tools(工具调用)、thinking(推理链)能力。
核心特性
- 长程编程能力增强:在真实端到端软件工程任务上有显著提升,覆盖后端服务、基础设施、性能工程、系统编程、安全、前端、机器学习/数据工程等多种场景,支持 10 种以上编程语言。
- 推理更高效:相比 Kimi K2.6,thinking-token 使用量下降约 30%,同时复杂工作流的任务完成率有所提高。
- 更强的 agentic 工具调用:在多步工具调用和 MCP(Model Context Protocol)环境中表现更好,并支持
preserve_thinking跨轮保留推理链,适合做连贯的多步编码会话。 - 原生多模态:基于 MoonViT 视觉编码器,支持图像和视频输入。
- 超大上下文:256K token 的上下文长度,可一次性塞入大型代码库、技术文档或多段聊天记录。
基准测试表现
根据 Ollama 页面公布的数据:
Coding 基准
| Benchmark | Kimi K2.6 | Kimi K2.7 Code | GPT-5.5 | Claude Opus 4.8 |
|---|---|---|---|---|
| Kimi Code Bench v2 | 50.9 | 62.0 | 69.0 | 67.4 |
| Program Bench | 48.3 | 53.6 | 69.1 | 63.8 |
| MLS Bench Lite | 26.7 | 35.1 | 35.5 | 42.8 |
Agentic 基准
| Benchmark | Kimi K2.6 | Kimi K2.7 Code | GPT-5.5 | Claude Opus 4.8 |
|---|---|---|---|---|
| Kimi Claw 24/7 Bench | 42.9 | 46.9 | 52.8 | 50.4 |
| MCP Atlas | 69.4 | 76.0 | 79.4 | 81.3 |
| MCP Mark Verified | 72.8 | 81.1 | 92.9 | 76.4 |
从表格可以看出,Kimi K2.7 Code 在几乎所有 Moonshot AI 自家及第三方基准中都优于前代 K2.6,在部分 MCP 工具调用场景上甚至超过了 Claude Opus 4.8。
技术规格
| 项目 | 数值/说明 |
|---|---|
| 模型名 | kimi-k2.7-code:cloud |
| 参数量 | 1.04T |
| 上下文长度 | 256K tokens |
| 输入类型 | 文本 + 图像 |
| 用法级别 | high |
| 支持能力 | vision、tools、thinking、cloud |
| Hugging Face | 有参考链接 |
如何使用
通过 Ollama CLI 运行
bash
ollama run kimi-k2.7-code:cloud在代码中调用
bash
curl http://localhost:11434/api/generate -d '{
"model": "kimi-k2.7-code:cloud",
"prompt": "用 Python 写一个带重试机制的 HTTP 客户端"
}'python
import ollama
response = ollama.generate(
model='kimi-k2.7-code:cloud',
prompt='解释这段代码的瓶颈并提供优化方案'
)
print(response['response'])javascript
import ollama from 'ollama'
const response = await ollama.generate({
model: 'kimi-k2.7-code:cloud',
prompt: '把以下函数改写成 TypeScript 并加上类型注释'
})
console.log(response.response)已集成该模型的应用
Ollama 页面列出了多款已支持 kimi-k2.7-code:cloud 的客户端/工具:
- Claude Code:
ollama launch claude --model kimi-k2.7-code:cloud - Codex App:
ollama launch codex-app --model kimi-k2.7-code:cloud - OpenClaw:
ollama launch openclaw --model kimi-k2.7-code:cloud - Hermes Agent:
ollama launch hermes --model kimi-k2.7-code:cloud - Codex:
ollama launch codex --model kimi-k2.7-code:cloud - OpenCode:
ollama launch opencode --model kimi-k2.7-code:cloud
这些命令可以让你直接把 Kimi K2.7 Code 作为底层模型接入常用的 AI 编码工作流。
适用场景
- 端到端复杂开发任务:比如从需求描述到完整项目骨架、多文件重构、跨模块调试。
- 长上下文代码理解:把整份代码库或长文档贴进去,让模型基于上下文给出修改建议。
- MCP/工具链环境:在多步工具调用场景下,Kimi K2.7 Code 的 agentic 能力更稳定。
- 多模态辅助:需要看图、看截图、看日志截图来理解问题的场景。
注意事项
- 该模型标签为
:cloud,云端运行,实际推理并不在本地机器上进行,因此需要网络连接。 - 用法级别标注为
high,意味着在复杂任务上消耗会比较高,建议根据任务难度选择合适的上下文长度。 - 虽然参数量达 1.04T,但通过 Ollama 的云端方式运行,本地硬件门槛较低。
相关链接
- Ollama 模型页面:https://ollama.com/library/kimi-k2.7-code
- Ollama 官方文档:https://ollama.com/docs
- Moonshot AI / Kimi 官方资源可通过 Hugging Face 参考页查找
分享: