字节笔记本
2026年6月21日
hermes教程-标题:CLI 界面
运行 CLI
## 启动交互式会话(默认)
hermes
## 单次查询模式(非交互式)
hermes chat -q "你好"
## 使用特定模型
hermes chat --model "anthropic/claude-sonnet-4"
## 使用特定提供商
hermes chat --provider nous # 使用 Nous Portal
hermes chat --provider openrouter # 强制使用 OpenRouter
## 使用特定工具集
hermes chat --toolsets "web,terminal,skills"
## 启动时预加载一个或多个技能
hermes -s hermes-agent-dev,github-auth
hermes chat -s github-pr-workflow -q "打开一个草稿 PR"
## 恢复之前的会话
hermes --continue # 恢复最近的 CLI 会话(-c)
hermes --resume <session_id> # 按 ID 恢复特定会话(-r)
## 详细模式(调试输出)
hermes chat --verbose
## 隔离的 git 工作树(用于并行运行多个代理)
hermes -w # 工作树中的交互模式
hermes -w -z "修复问题 #123" # 工作树中的单次查询界面布局
欢迎横幅一目了然地显示您的模型、终端后端、工作目录、可用工具和已安装的技能。
状态栏
输入区域上方有一个持久的状态栏,实时更新:
⚕ claude-sonnet-4-20250514 │ 12.4K/200K │ [██████░░░░] 6% │ $0.06 │ 15m
| 元素 | 描述 |
|---|---|
| 模型名称 | 当前模型(超过 26 个字符时截断) |
| Token 计数 | 已使用的上下文 token / 最大上下文窗口 |
| 上下文条 | 视觉填充指示器,带有颜色编码阈值 |
| 费用 | 估计的会话费用(对于未知或零价格模型显示 n/a) |
| 🗜️ N | 上下文压缩次数 — 运行中的会话被自动压缩的次数。首次压缩触发后出现。 |
| ▶ N | 活动后台任务 — 当前会话中仍在运行的 /background 提示数量。只要至少有一个任务在进行中,就会显示。 |
| 持续时间 | 已用会话时间 |
| ⚠ YOLO | YOLO 模式警告 — 当 HERMES_YOLO_MODE 开启时显示(启动时使用 hermes --yolo 或会话中通过 /yolo 切换)。与横幅行警告同步,确保您不会忘记处于自动批准模式。 |
状态栏会根据终端宽度自适应 — 宽度 ≥ 76 列时显示完整布局,52–75 列时紧凑显示,低于 52 列时仅显示模型 + 持续时间,以及 YOLO 徽章(如果激活)。
上下文颜色编码:
| 颜色 | 阈值 | 含义 |
|---|---|---|
| 绿色 | < 50% | 空间充足 |
| 黄色 | 50–80% | 即将填满 |
| 橙色 | 80–95% | 接近限制 |
| 红色 | ≥ 95% | 接近溢出 — 考虑使用 /compress |
使用 /usage 查看详细分解,包括按类别划分的费用(输入 vs 输出 token)。
会话恢复显示
当恢复之前的会话时(hermes -c 或 hermes --resume <id>),横幅和输入提示之间会出现一个“之前的对话”面板,显示对话历史的紧凑摘要。有关详细信息和配置,请参阅 会话 — 恢复时的对话摘要。
快捷键
| 按键 | 操作 |
|---|---|
Enter | 发送消息 |
Alt+Enter、Ctrl+J 或 Shift+Enter | 换行(多行输入)。Shift+Enter 需要终端能将其与 Enter 区分 — 见下文。在 Windows Terminal 上,Alt+Enter 被终端捕获(全屏切换);请改用 Ctrl+Enter 或 Ctrl+J。 |
Alt+V | 当终端支持时,从剪贴板粘贴图片 |
Ctrl+V | 粘贴文本并尽可能附加剪贴板图片 |
Ctrl+B | 当语音模式启用时,开始/停止语音录制(voice.record_key,默认:ctrl+b) |
Ctrl+G | 在 $EDITOR(vim/nvim/nano/VS Code 等)中打开当前输入缓冲区。保存并退出将编辑后的文本作为下一个提示发送 — 适合长段落提示。 |
Ctrl+X Ctrl+E | Emacs 风格的外部编辑器替代绑定(行为与 Ctrl+G 相同)。 |
Ctrl+C | 中断代理(2 秒内双击强制退出) |
Ctrl+D | 退出 |
Ctrl+Z | 将 Hermes 挂起到后台(仅 Unix)。在 shell 中运行 fg 恢复。 |
Tab | 接受自动建议(幽灵文本)或自动补全斜杠命令 |
多行粘贴预览。 当您粘贴多行文本块时,CLI 会回显一个紧凑的单行预览([已粘贴: 47 行, 1,842 字符 — 按 Enter 发送]),而不是将整个内容倾倒到回滚中。实际发送的仍然是完整内容;这只是显示上的优化。
最终响应中的 Markdown 剥离。 CLI 会从最终代理回复中剥离最冗长的 markdown 围栏和 **粗体** / *斜体* 包装,使其呈现为可读的终端散文而非原始源代码。代码块和列表会被保留。这不影响网关平台或工具结果 — 它们保留 markdown 以供原生渲染。
斜杠命令
输入 / 查看自动补全下拉列表。Hermes 支持大量 CLI 斜杠命令、动态技能命令和用户定义的快速命令。
常见示例:
| 命令 | 描述 |
|---|---|
/help | 显示命令帮助 |
/model | 显示或更改当前模型 |
/tools | 列出当前可用的工具 |
/skills browse | 浏览技能中心及官方可选技能 |
/background <prompt> | 在单独的后台会话中运行提示 |
/skin | 显示或切换当前 CLI 皮肤 |
/voice on | 启用 CLI 语音模式(按 Ctrl+B 录制) |
/voice tts | 切换 Hermes 回复的语音播放 |
/reasoning high | 增加推理努力程度 |
/title My Session | 为当前会话命名 |
/status | 显示会话信息 — 模型/配置文件/token/持续时间 — 后跟一个本地会话摘要块(最近轮次计数、使用最多的工具、接触的文件、最新用户提示 + 助手回复)。纯本地计算;无需 LLM 调用。 |
/sessions | 在经典 CLI 中打开交互式会话选择器(与 TUI 使用的界面相同)。输入过滤,方向键导航,Enter 恢复。 |
有关完整的内置 CLI 和消息命令列表,请参阅 斜杠命令参考。
有关设置、提供商、静音调整以及消息/Discord 语音使用,请参阅 语音模式。
提示
命令不区分大小写 —
/HELP与/help效果相同。已安装的技能也会自动成为斜杠命令。
快速命令
您可以定义自定义命令,这些命令会立即执行 shell 命令,而无需调用 LLM。这些命令在 CLI 和消息平台(Telegram、Discord 等)中均可使用。
## ~/.hermes/config.yaml
quick_commands:
status:
type: exec
command: systemctl status hermes-agent
gpu:
type: exec
command: nvidia-smi --query-gpu=utilization.gpu,memory.used --format=csv,noheader
restart:
type: alias
target: /gateway restart然后在任何聊天中输入 /status、/gpu 或 /restart。有关更多示例,请参阅 配置指南。
启动时预加载技能
如果您已经知道会话中需要哪些技能,可以在启动时传递它们:
hermes -s hermes-agent-dev,github-auth
hermes chat -s github-pr-workflow -s github-authHermes 会在第一轮对话之前将每个命名的技能加载到会话提示中。相同的标志在交互模式和单次查询模式下都有效。
技能斜杠命令
~/.hermes/skills/ 中的每个已安装技能都会自动注册为斜杠命令。技能名称成为命令:
/gif-search funny cats
/axolotl help me fine-tune Llama 3 on my dataset
/github-pr-workflow create a PR for the auth refactor
## 仅输入技能名称即可加载它,并让代理询问您需要什么:
/excalidraw个性
设置预定义的个性来改变代理的语气:
/personality pirate
/personality kawaii
/personality concise内置个性包括:helpful、concise、technical、creative、teacher、kawaii、catgirl、pirate、shakespeare、surfer、noir、uwu、philosopher、hype。
您还可以在 ~/.hermes/config.yaml 中定义自定义个性:
personalities:
helpful: "You are a helpful, friendly AI assistant."
kawaii: "You are a kawaii assistant! Use cute expressions..."
pirate: "Arrr! Ye be talkin' to Captain Hermes..."
## 添加您自己的!多行输入
有两种方式输入多行消息:
Alt+Enter、Ctrl+J或Shift+Enter— 插入新行- 反斜杠续行 — 以
\结束一行以继续:
❯ Write a function that:\
1. Takes a list of numbers\
2. Returns the sum信息
支持粘贴多行文本 — 使用上述任意换行键,或直接粘贴内容。
Shift+Enter 兼容性
大多数终端默认发送相同的字节序列给 Enter 和 Shift+Enter,因此应用程序无法区分它们。只有当终端通过 Kitty 键盘协议 或 xterm 的 modifyOtherKeys 模式发送不同的序列时,Hermes 才能识别 Shift+Enter。
| 终端 | 状态 |
|---|---|
| Kitty、foot、WezTerm、Ghostty | 默认启用不同的 Shift+Enter |
| iTerm2(较新版本)、Alacritty、VS Code 终端、Warp | 在设置中启用 Kitty 协议后支持 |
| Windows Terminal Preview 1.25+ | 在设置中启用 Kitty 协议后支持 |
| macOS Terminal.app、标准 Windows Terminal(稳定版) | 不支持 — Shift+Enter 与 Enter 无法区分 |
在终端无法区分的情况下,Alt+Enter 和 Ctrl+J 在所有地方仍然有效。在 Windows Terminal 上,Alt+Enter 被终端捕获(切换全屏)且永远不会到达 Hermes — 请使用 Ctrl+Enter(发送为 Ctrl+J)或直接使用 Ctrl+J 进行换行。
中断代理
您可以随时中断代理:
- 在代理工作时输入新消息 + Enter — 它会中断并处理您的新指令
Ctrl+C— 中断当前操作(2 秒内按两次强制退出)- 正在进行的终端命令会立即被终止(SIGTERM,1 秒后 SIGKILL)
- 中断期间输入的多个消息会合并为一个提示
忙碌输入模式
display.busy_input_mode 配置键控制当代理工作时按 Enter 的行为:
| 模式 | 行为 |
|---|---|
"interrupt"(默认) | 您的消息中断当前操作并立即处理 |
"queue" | 您的消息被静默排队,并在代理完成后作为下一轮发送 |
"steer" | 您的消息通过 /steer 注入到当前运行中,在下一个工具调用后到达代理 — 不中断,不产生新轮次 |
## ~/.hermes/config.yaml
display:
busy_input_mode: "steer" # 或 "queue" 或 "interrupt"(默认)"queue" 模式在您想准备后续消息而不意外取消正在进行的工作时很有用。"steer" 模式在您想在不中断的情况下重定向代理的中途任务时很有用 — 例如,在代理仍在编辑代码时说“实际上,也检查一下测试”。未知值会回退到 "interrupt"。
"steer" 有两个自动回退:如果代理尚未开始,或者附加了图片,消息会回退到 "queue" 行为,以确保不会丢失任何内容。
您也可以在 CLI 内部更改它:
/busy queue
/busy steer
/busy interrupt
/busy status提示 — 首次触摸提示
当您第一次在 Hermes 工作时按 Enter 时,Hermes 会打印一行提醒,解释
/busy开关(“(提示)您的消息中断了当前运行…”)。它只在每次安装时触发一次 —config.yaml中的onboarding.seen.busy_input_prompt标志会锁定它。删除该键可再次看到提示。
挂起到后台
在 Unix 系统上,按 Ctrl+Z 将 Hermes 挂起到后台 — 就像任何终端进程一样。Shell 会打印确认信息:
Hermes Agent 已被挂起。运行 `fg` 将 Hermes Agent 带回前台。
在 shell 中输入 fg 即可从离开的位置精确恢复会话。Windows 上不支持此功能。
工具进度显示
CLI 在代理工作时显示动画反馈:
思考动画(API 调用期间):
◜ (。•́︿•̀。) pondering... (1.2s)
◠ (⊙_⊙) contemplating... (2.4s)
✧٩(ˊᗜˋ*)و✧ got it! (3.1s)工具执行流:
┊ 💻 terminal `ls -la` (0.3s)
┊ 🔍 web_search (1.2s)
┊ 📄 web_extract (2.1s)使用 /verbose 循环切换显示模式:off → new → all → verbose。此命令也可以为消息平台启用 — 请参阅 配置。
工具预览长度
display.tool_preview_length 配置键控制工具调用预览行中显示的最大字符数(例如文件路径、终端命令)。默认值为 0,表示无限制 — 显示完整路径和命令。
## ~/.hermes/config.yaml
display:
tool_preview_length: 80 # 将工具预览截断为 80 个字符(0 = 无限制)这在窄终端上或工具参数包含非常长的文件路径时很有用。
会话管理
恢复会话
当您退出 CLI 会话时,会打印一个恢复命令:
Resume this session with:
hermes --resume 20260225_143052_a1b2c3
Session: 20260225_143052_a1b2c3
Duration: 12m 34s
Messages: 28 (5 user, 18 tool calls)恢复选项:
hermes --continue # 恢复最近的 CLI 会话
hermes -c # 短格式
hermes -c "my project" # 恢复指定名称的会话(最新分支)
hermes --resume 20260225_143052_a1b2c3 # 按 ID 恢复特定会话
hermes --resume "refactoring auth" # 按标题恢复
hermes -r 20260225_143052_a1b2c3 # 短格式恢复会从 SQLite 中还原完整的对话历史。代理会看到所有先前的消息、工具调用和响应 — 就像您从未离开过一样。
在聊天中使用 /title My Session Name 为当前会话命名,或从命令行使用 hermes sessions rename <id> <title>。使用 hermes sessions list 浏览过去的会话。
会话存储
CLI 会话存储在 Hermes 的 SQLite 状态数据库中,位于 ~/.hermes/state.db。数据库保存:
- 会话元数据(ID、标题、时间戳、token 计数器)
- 消息历史
- 跨压缩/恢复会话的谱系
- 由
session_search使用的全文搜索索引
某些消息适配器还会在数据库旁边保留每个平台的对话记录文件,但 CLI 本身从 SQLite 会话存储中恢复。
上下文压缩
长对话在接近上下文限制时会自动总结:
## 在 ~/.hermes/config.yaml 中
compression:
enabled: true
threshold: 0.50 # 默认在上下文限制的 50% 时压缩
## 在 auxiliary 下配置总结模型:
auxiliary:
compression:
model: "" # 留空以使用主聊天模型(默认)。或指定一个便宜快速的模型,例如 "google/gemini-3-flash-preview"。当压缩触发时,中间轮次会被总结,而前 3 轮和后 20 轮始终保留。
后台会话
在单独的后台会话中运行提示,同时继续使用 CLI 进行其他工作:
/background Analyze the logs in /var/log and summarize any errors from today
Hermes 立即确认任务并交还提示:
🔄 后台任务 #1 已启动: "Analyze the logs in /var/log and summarize..."
任务 ID: bg_143022_a1b2c3工作原理
每个 /background 提示会在一个守护线程中生成一个完全独立的代理会话:
- 隔离的对话 — 后台代理不知道您当前会话的历史。它只接收您提供的提示。
- 相同的配置 — 后台代理继承当前会话的模型、提供商、工具集、推理设置和回退模型。
- 非阻塞 — 您的前台会话保持完全交互。您可以聊天、运行命令,甚至启动更多后台任务。
- 多个任务 — 您可以同时运行多个后台任务。每个任务都有一个编号 ID。
结果
当后台任务完成时,结果会以面板形式显示在您的终端中:
╭─ ⚕ Hermes (background #1) ──────────────────────────────────╮
│ Found 3 errors in syslog from today: │
│ 1. OOM killer invoked at 03:22 — killed process nginx │
│ 2. Disk I/O error on /dev/sda1 at 07:15 │
│ 3. Failed SSH login attempts from 192.168.1.50 at 14:30 │
╰──────────────────────────────────────────────────────────────╯如果任务失败,您会看到错误通知。如果配置中启用了 display.bell_on_complete,任务完成时终端会响铃。
使用场景
- 长时间运行的研究 — “/background research the latest developments in quantum error correction” 同时您编写代码
- 文件处理 — “/background analyze all Python files in this repo and list any security issues” 同时您继续对话
- 并行调查 — 启动多个后台任务同时探索不同角度
信息
后台会话不会出现在您的主对话历史中。它们是独立的会话,拥有自己的任务 ID(例如
bg_143022_a1b2c3)。
安静模式
默认情况下,CLI 以安静模式运行,该模式:
- 抑制来自工具的详细日志
- 启用 kawaii 风格的动画反馈
- 保持输出干净且用户友好
对于调试输出:
hermes chat --verbose