ByteNoteByteNote

字节笔记本

2026年2月21日

Ollama 本地模型配置完全指南

API中转
¥120

本文介绍如何在 AI 设置界面中配置 Ollama 本地大模型服务,实现自定义模型接入。

Ollama 简介

Ollama 是一个开源的本地大模型运行框架,支持在本地机器上运行各种开源大语言模型,如 Llama、Qwen、DeepSeek 等。无需依赖云服务,数据完全本地化处理。

配置步骤

在 AI 设置界面选择"自定义"服务商后,按以下方式填写:

服务商

保持"自定义"不变

模型

填写你想使用的模型名称,例如:

模型名称说明
llama3.2Meta 最新开源模型
qwen2.5阿里通义千问
deepseek-r1DeepSeek 推理模型
mistralMistral AI 模型

模型名称必须是你已经通过 ollama pull 拉取到本地的模型。

API 密钥

Ollama 本地运行不需要密钥,但该字段可能为必填项。随便填一个字符串即可,例如:

ollama

Base URL

填写 Ollama 的本地服务地址:

http://localhost:11434/v1

如果 Ollama 运行在其他机器上,把 localhost 替换为对应的 IP 地址:

http://192.168.1.100:11434/v1

验证配置

填写完成后:

  1. 点击"测试连接"验证是否正常
  2. 如果显示连接成功,点击"保存配置"
  3. 开始对话测试

常见问题

连接失败

  • 检查 Ollama 服务是否已启动:ollama serve
  • 检查端口是否正确:默认 11434
  • 检查防火墙设置

模型未找到

  • 确认模型已拉取:ollama list
  • 如未安装,先执行:ollama pull 模型名

跨机器访问

如果 Ollama 运行在另一台机器,需要设置环境变量:

bash
export OLLAMA_HOST=0.0.0.0:11434
ollama serve

相关命令

bash
# 列出已安装模型
ollama list

# 拉取新模型
ollama pull llama3.2

# 运行模型(命令行模式)
ollama run qwen2.5

# 查看模型信息
ollama show deepseek-r1

在 AI 技术快速迭代的今天,保持持续学习的能力比掌握任何特定的技术都更重要。理解底层原理可以帮助你在遇到新技术时更快地上手,可以在不同的技术方案之间做出更明智的选择。建议开发者建立自己的技术框架,而不是追逐每一个新的工具和框架。实践是最好的学习方式,在真实项目中应用新学到的技术,遇到问题并解决,这种经历比任何教程都更有价值。定期整理和复盘也是很好的习惯。将学到的知识归档整理,形成自己的知识库。当需要用到某个技术时,可以直接从自己的知识库中找到相关的参考,而不是从零开始搜索。

技术的价值不在于它有多前沿,而在于它能在多大程度上解决实际问题。AI 技术的快速迭代不是用来追赶的潮流,而是用来解决业务痛点的工具箱。在实际应用中,有时候简单的方案反而最有效。一个 RAG 系统用了最复杂的检索策略但文档处理没做好,效果不如一个文档处理完善但检索策略简单的系统。一个 Agent 系统用了最贵的模型但 prompt 设计粗糙,效果不如一个精心设计 prompt 的普通模型。建议在追求技术先进性之前,先把基础工作做扎实。文档清洗、数据标注、评测体系、监控告警,这些看似基础的工作,往往是决定 AI 项目成败的关键。

分享: