字节笔记本
2026年5月16日
Ollama Anthropic Messages API 兼容层入门指南
Ollama 从 v0.14.0 开始正式支持 Anthropic Messages API 兼容层,核心能力是让只认 Anthropic 协议的工具(如 Claude Code)可以直接打到 Ollama 的 /v1/messages 接口,从而连接到本地开源模型或 Ollama Cloud 模型。
Claude Code
↓ Anthropic Messages API
/v1/messages
↓
Ollama
↓
本地模型 / Ollama Cloud 模型最简单用法
一行命令启动 Claude Code 并连接到 Ollama:
ollama launch claude指定模型:
ollama launch claude --model qwen3.5使用云模型:
ollama launch claude --model kimi-k2.5:cloudOllama 官方文档推荐了 kimi-k2.5:cloud、glm-5:cloud、qwen3.5 等模型。
手动配置方式
也可以不依赖 ollama launch,直接让 Claude Code 走 Ollama:
export ANTHROPIC_AUTH_TOKEN=ollama
export ANTHROPIC_API_KEY=""
export ANTHROPIC_BASE_URL=http://localhost:11434
claude --model qwen3.5关键点是 ANTHROPIC_BASE_URL=http://localhost:11434——Claude Code 以为自己在访问 Anthropic,但实际请求会打到 Ollama。ANTHROPIC_AUTH_TOKEN=ollama 只是占位符,实际会被忽略。
透传 Claude Code 参数
如果需要给 Claude Code 本身传参数,用 -- 分隔:
ollama launch claude --model kimi-k2.5:cloud -- --dangerously-skip-permissions-- 前面的参数给 ollama launch,后面的参数透传给 claude。
直接请求 Anthropic 协议接口
不通过 Claude Code,直接 curl 验证:
curl http://localhost:11434/v1/messages \
-H "Content-Type: application/json" \
-d '{
"model": "qwen3.5",
"max_tokens": 1024,
"messages": [
{
"role": "user",
"content": "写一个 Go 的 HTTP server 示例"
}
]
}'Ollama 的 Anthropic 兼容接口支持:messages、流式输出、system prompt、多轮对话、图片、tools/function calling、thinking 等能力。
功能限制
Ollama 的兼容层并非 100% 原生 Anthropic,以下功能目前不支持:
/v1/messages/count_tokens接口- prompt caching 的
cache_control - batches API
- citations
- PDF document content blocks
- URL 图片输入
Token 统计基于底层模型 tokenizer 的近似值,不是 Anthropic 官方 Claude 的精确计数。
非 localhost 连接
如果 Ollama 跑在另一台机器(如服务器 IP 192.168.1.10):
客户端配置:
export ANTHROPIC_AUTH_TOKEN=ollama
export ANTHROPIC_API_KEY=""
export ANTHROPIC_BASE_URL=http://192.168.1.10:11434
claude --model qwen3.5服务端配置: 让 Ollama 监听非本机地址:
OLLAMA_HOST=0.0.0.0:11434 ollama serveOllama 默认绑定 127.0.0.1:11434,暴露到局域网需通过 OLLAMA_HOST 改绑定地址。注意不要将 11434 直接裸露到公网,建议走内网、VPN、Cloudflare Tunnel 或 Nginx 反代加鉴权。