Ollama 上架 Kimi K2.7 Code：Moonshot AI 的编程专用模型

Moonshot AI 的 Kimi K2.7 Code 近日正式上架 Ollama。这是一款面向编程场景专门优化的 agentic 模型，基于 Kimi K2.6 升级而来，在长程软件开发任务上表现提升明显，同时 thinking-token 消耗降低了约 30%。

模型概览

Kimi K2.7 Code 由月之暗面（Moonshot AI）发布，定位是编程专用、支持 agentic 工作流的代码模型。它并非一个独立应用，而是可以通过 Ollama 直接下载运行的本地/云端模型。模型参数量达 1.04T，支持 256K token 的上下文窗口，可处理长代码库、长文档和复杂的多轮开发任务。

目前在 Ollama 的模型页面显示下载量约 18.5K，最后一次更新在 6 天前。Ollama 提供的标签为 kimi-k2.7-code:cloud，意味着它默认以云端形式运行，也支持 vision（视觉）、tools（工具调用）、thinking（推理链）能力。

核心特性

长程编程能力增强：在真实端到端软件工程任务上有显著提升，覆盖后端服务、基础设施、性能工程、系统编程、安全、前端、机器学习/数据工程等多种场景，支持 10 种以上编程语言。
推理更高效：相比 Kimi K2.6，thinking-token 使用量下降约 30%，同时复杂工作流的任务完成率有所提高。
更强的 agentic 工具调用：在多步工具调用和 MCP（Model Context Protocol）环境中表现更好，并支持 preserve_thinking 跨轮保留推理链，适合做连贯的多步编码会话。
原生多模态：基于 MoonViT 视觉编码器，支持图像和视频输入。
超大上下文：256K token 的上下文长度，可一次性塞入大型代码库、技术文档或多段聊天记录。

基准测试表现

根据 Ollama 页面公布的数据：

Coding 基准

Benchmark	Kimi K2.6	Kimi K2.7 Code	GPT-5.5	Claude Opus 4.8
Kimi Code Bench v2	50.9	62.0	69.0	67.4
Program Bench	48.3	53.6	69.1	63.8
MLS Bench Lite	26.7	35.1	35.5	42.8

Agentic 基准

Benchmark	Kimi K2.6	Kimi K2.7 Code	GPT-5.5	Claude Opus 4.8
Kimi Claw 24/7 Bench	42.9	46.9	52.8	50.4
MCP Atlas	69.4	76.0	79.4	81.3
MCP Mark Verified	72.8	81.1	92.9	76.4

从表格可以看出，Kimi K2.7 Code 在几乎所有 Moonshot AI 自家及第三方基准中都优于前代 K2.6，在部分 MCP 工具调用场景上甚至超过了 Claude Opus 4.8。

技术规格

项目	数值/说明
模型名	`kimi-k2.7-code:cloud`
参数量	1.04T
上下文长度	256K tokens
输入类型	文本 + 图像
用法级别	high
支持能力	vision、tools、thinking、cloud
Hugging Face	有参考链接

如何使用

通过 Ollama CLI 运行

bash

ollama run kimi-k2.7-code:cloud

在代码中调用

bash

curl http://localhost:11434/api/generate -d '{
  "model": "kimi-k2.7-code:cloud",
  "prompt": "用 Python 写一个带重试机制的 HTTP 客户端"
}'

python

import ollama

response = ollama.generate(
    model='kimi-k2.7-code:cloud',
    prompt='解释这段代码的瓶颈并提供优化方案'
)
print(response['response'])

javascript

import ollama from 'ollama'

const response = await ollama.generate({
  model: 'kimi-k2.7-code:cloud',
  prompt: '把以下函数改写成 TypeScript 并加上类型注释'
})
console.log(response.response)

已集成该模型的应用

Ollama 页面列出了多款已支持 kimi-k2.7-code:cloud 的客户端/工具：

Claude Code：ollama launch claude --model kimi-k2.7-code:cloud
Codex App：ollama launch codex-app --model kimi-k2.7-code:cloud
OpenClaw：ollama launch openclaw --model kimi-k2.7-code:cloud
Hermes Agent：ollama launch hermes --model kimi-k2.7-code:cloud
Codex：ollama launch codex --model kimi-k2.7-code:cloud
OpenCode：ollama launch opencode --model kimi-k2.7-code:cloud

这些命令可以让你直接把 Kimi K2.7 Code 作为底层模型接入常用的 AI 编码工作流。

适用场景

端到端复杂开发任务：比如从需求描述到完整项目骨架、多文件重构、跨模块调试。
长上下文代码理解：把整份代码库或长文档贴进去，让模型基于上下文给出修改建议。
MCP/工具链环境：在多步工具调用场景下，Kimi K2.7 Code 的 agentic 能力更稳定。
多模态辅助：需要看图、看截图、看日志截图来理解问题的场景。

注意事项

该模型标签为 :cloud，云端运行，实际推理并不在本地机器上进行，因此需要网络连接。
用法级别标注为 high，意味着在复杂任务上消耗会比较高，建议根据任务难度选择合适的上下文长度。
虽然参数量达 1.04T，但通过 Ollama 的云端方式运行，本地硬件门槛较低。

字节笔记本