ByteNoteByteNote

字节笔记本

2026年6月21日

hermes教程-工具与工具集

API中转
¥120

可用工具

工具是扩展智能体能力的函数。它们被组织成逻辑上的工具集,可以按平台启用或禁用。

Hermes 内置了广泛的工具注册表,涵盖网络搜索、浏览器自动化、终端执行、文件编辑、记忆、任务委派、强化学习训练、消息投递、Home Assistant 等。

注意

Honcho 跨会话记忆 作为记忆提供者插件(plugins/memory/honcho/)提供,而非内置工具集。安装请参见 插件

高级分类:

类别示例描述
Webweb_search, web_extract搜索网络并提取页面内容。
X 搜索x_search通过 xAI 内置的 x_search 响应工具搜索 X(Twitter)帖子和线程——需要 xAI 凭证(SuperGrok OAuth 或 XAI_API_KEY);默认关闭,通过 hermes tools → 🐦 X (Twitter) 搜索选择加入。
终端与文件terminal, process, read_file, patch执行命令并操作文件。
浏览器browser_navigate, browser_snapshot, browser_vision支持文本和视觉的交互式浏览器自动化。
媒体vision_analyze, image_generate, text_to_speech多模态分析与生成。
智能体编排todo, clarify, execute_code, delegate_task规划、澄清、代码执行和子智能体委派。
记忆与回忆memory, session_search持久化记忆和会话搜索。
自动化与投递cronjob, send_message支持创建/列出/更新/暂停/恢复/运行/移除操作的定时任务,以及出站消息投递。
集成ha_*, MCP 服务器工具Home Assistant、MCP 及其他集成。

权威的代码派生注册表请参见 内置工具参考工具集参考

提示 — Nous 工具网关

付费的 Nous Portal 订阅者可以通过 工具网关 使用网络搜索、图像生成、TTS 和浏览器自动化——无需单独的 API 密钥。运行 hermes model 启用它,或使用 hermes tools 配置单个工具。

使用工具集

bash
## 使用特定工具集
hermes chat --toolsets "web,terminal"
## 查看所有可用工具
hermes tools
## 按平台交互式配置工具
hermes tools

常见的工具集包括 websearchterminalfilebrowservisionimage_genmoaskillsttstodomemorysession_searchcronjobcode_executiondelegationclarifyhomeassistantmessagingspotifydiscorddiscord_admindebuggingsafe

完整列表请参见 工具集参考,包括平台预设(如 hermes-clihermes-telegram)和动态 MCP 工具集(如 mcp-<server>)。

终端后端

终端工具可以在不同环境中执行命令:

后端描述使用场景
local在本地机器上运行(默认)开发、可信任务
docker隔离容器安全、可重现性
ssh远程服务器沙箱化,使智能体远离自身代码
singularityHPC 容器集群计算,无 root 权限
modal云端执行无服务器、可扩展
daytona云端沙箱工作区持久化远程开发环境

配置

yaml
## 在 ~/.hermes/config.yaml 中
terminal:
  backend: local    # 或:docker, ssh, singularity, modal, daytona
  cwd: "."          # 工作目录
  timeout: 180      # 命令超时时间(秒)

Docker 后端

yaml
terminal:
  backend: docker
  docker_image: python:3.11-slim

一个持久化容器,在整个进程中共享。 Hermes 在首次使用时启动一个长期运行的容器(docker run -d ... sleep 2h),并通过 docker exec 将所有终端、文件和 execute_code 调用路由到该容器中。工作目录更改、已安装的包、环境调整以及写入 /workspace 的文件都会在工具调用之间、跨 /new/resetdelegate_task 子智能体保留,直到 Hermes 进程结束。容器在关闭时停止并移除。

这意味着 Docker 后端的行为类似于一个持久化的沙箱虚拟机,而不是每个命令都使用新容器。如果你执行了一次 pip install foo,它会在整个会话中保留。如果你执行了 cd /workspace/project,后续的 ls 调用会看到该目录。完整生命周期详情以及控制 /workspace/root 是否在 Hermes 重启后保留的 container_persistent 标志,请参见 配置 → Docker 后端

SSH 后端

推荐用于安全场景——智能体无法修改自身代码:

yaml
terminal:
  backend: ssh
bash
## 在 ~/.hermes/.env 中设置凭证
TERMINAL_SSH_HOST=my-server.example.com
TERMINAL_SSH_USER=myuser
TERMINAL_SSH_KEY=~/.ssh/id_rsa

Singularity/Apptainer

bash
## 为并行工作器预构建 SIF
apptainer build ~/python.sif docker://python:3.11-slim
## 配置
hermes config set terminal.backend singularity
hermes config set terminal.singularity_image ~/python.sif

Modal(无服务器云端)

bash
uv pip install modal
modal setup
hermes config set terminal.backend modal

容器资源

为所有容器后端配置 CPU、内存、磁盘和持久性:

yaml
terminal:
  backend: docker  # 或 singularity, modal, daytona
  container_cpu: 1              # CPU 核心数(默认:1)
  container_memory: 5120        # 内存(MB,默认:5GB)
  container_disk: 51200         # 磁盘(MB,默认:50GB)
  container_persistent: true    # 跨会话持久化文件系统(默认:true)

container_persistent: true 时,已安装的包、文件和配置会在会话之间保留。

容器安全

所有容器后端都运行在安全加固环境下:

  • 只读根文件系统(Docker)
  • 丢弃所有 Linux 能力
  • 无权限提升
  • PID 限制(256 个进程)
  • 完全命名空间隔离
  • 通过卷实现持久化工作区,而非可写根层

Docker 可以通过 terminal.docker_forward_env 接收显式的环境变量允许列表,但转发的变量对容器内的命令可见,应视为暴露给该会话。

后台进程管理

启动后台进程并管理它们:

python
terminal(command="pytest -v tests/", background=true)
## 返回:{"session_id": "proc_abc123", "pid": 12345}
## 然后使用 process 工具管理:
process(action="list")       # 显示所有运行中的进程
process(action="poll", session_id="proc_abc123")   # 检查状态
process(action="wait", session_id="proc_abc123")   # 阻塞直到完成
process(action="log", session_id="proc_abc123")    # 完整输出
process(action="kill", session_id="proc_abc123")   # 终止
process(action="write", session_id="proc_abc123", data="y")  # 发送输入

PTY 模式(pty=true)支持交互式 CLI 工具,如 Codex 和 Claude Code。

Sudo 支持

如果命令需要 sudo,系统会提示你输入密码(会话期间缓存)。或者在 ~/.hermes/.env 中设置 SUDO_PASSWORD

警告

在消息平台上,如果 sudo 失败,输出中会包含一条提示,建议将 SUDO_PASSWORD 添加到 ~/.hermes/.env


分享: