字
字节笔记本
2026年6月22日
hermes教程-可选技能目录
API中转
¥120
可选技能
可选技能随 hermes-agent 一同提供,位于 optional-skills/ 目录下,但默认不激活。请显式安装它们:
bash
hermes skills install official/<category>/<skill>例如:
bash
hermes skills install official/blockchain/solana
hermes skills install official/mlops/flash-attention下方每个技能都链接到其完整定义、设置和用法的专用页面。
卸载方法:
bash
hermes skills uninstall <skill-name>autonomous-ai-agents
| 技能 | 描述 |
|---|---|
| antigravity-cli | 操作 Antigravity CLI (agy):插件、认证、沙箱。 |
| blackbox | 将编码任务委托给 Blackbox AI CLI 代理。多模型代理,内置评判器,通过多个 LLM 运行任务并选择最佳结果。需要 blackbox CLI 和 Blackbox AI API 密钥。 |
| grok | 将编码委托给 xAI Grok Build CLI(功能、PR)。 |
| honcho | 使用 Honcho 内存配置和集成 Hermes——跨会话用户建模、多配置文件对等隔离、观察配置、辩证推理、会话摘要和上下文预算强制执行。在设置 Honcho、故障排除时使用…… |
| openhands | 将编码委托给 OpenHands CLI(模型无关,LiteLLM)。 |
blockchain
| 技能 | 描述 |
|---|---|
| evm | 只读 EVM 客户端:钱包、代币、Gas,支持 8 条链。 |
| hyperliquid | Hyperliquid 市场数据、账户历史、交易回顾。 |
| solana | 查询 Solana 区块链数据并显示美元价格——钱包余额、代币投资组合及价值、交易详情、NFT、巨鲸检测和实时网络状态。使用 Solana RPC + CoinGecko。无需 API 密钥。 |
communication
| 技能 | 描述 |
|---|---|
| one-three-one-rule | 用于技术方案和权衡分析的结构化决策框架。当用户在多种方法之间做出选择时(架构决策、工具选择、重构策略、迁移路径),此技能…… |
creative
| 技能 | 描述 |
|---|---|
| baoyu-article-illustrator | 文章插图:类型 × 风格 × 调色板一致性。 |
| baoyu-comic | 知识漫画:教育、传记、教程。 |
| blender-mcp | 通过套接字连接直接控制 Blender(需安装 blender-mcp 插件)。创建 3D 对象、材质、动画,并运行任意 Blender Python (bpy) 代码。当用户想要在 Blender 中创建或修改任何内容时使用。 |
| concept-diagrams | 生成扁平、极简、支持浅色/深色模式的 SVG 图表,输出为独立 HTML 文件。使用统一的教育视觉语言,包含 9 种语义颜色梯度、句子大小写排版和自动深色模式。最适合教育和…… |
| ideation | 通过创意约束生成项目创意。 |
| hyperframes | 使用 HyperFrames 创建基于 HTML 的视频合成、动画标题卡、社交覆盖层、带字幕的说话人头视频、音频反应视觉和着色器过渡。HTML 是视频的真相来源。当用户想要……时使用。 |
| kanban-video-orchestrator | 规划、设置和监控由 Hermes Kanban 支持的多代理视频制作流水线。当用户想要制作任何视频时使用——叙事电影、产品/营销、音乐视频、解说、ASCII/终端艺术、抽象/生成循环…… |
| meme-generation | 通过选择模板并使用 Pillow 叠加文本来生成真实的梗图。生成实际的 .png 梗图文件。 |
| pixel-art | 像素艺术,支持时代调色板(NES、Game Boy、PICO-8)。 |
devops
| 技能 | 描述 |
|---|---|
| inference-sh-cli | 通过 inference.sh CLI (infsh) 运行 150+ 个 AI 应用——图像生成、视频创建、LLM、搜索、3D、社交自动化。使用终端工具。触发词:inference.sh, infsh, ai apps, flux, veo, image generation, video generation, seedrea…… |
| docker-management | 管理 Docker 容器、镜像、卷、网络和 Compose 堆栈——生命周期操作、调试、清理和 Dockerfile 优化。 |
| hermes-s6-container-supervision | 修改、调试或扩展 Hermes Agent Docker 镜像中的 s6-overlay 监督树——添加新服务、调试配置文件网关、理解 Architecture B 主程序模式。 |
| pinggy-tunnel | 通过 Pinggy 实现零安装的 SSH 本地主机隧道。 |
| watchers | 轮询 RSS、JSON API 和 GitHub,并带有水印去重功能。 |
dogfood
| 技能 | 描述 |
|---|---|
| adversarial-ux-test | 扮演产品最困难、最抗拒技术的用户。以该角色浏览应用,找出所有 UX 痛点,然后通过实用主义层过滤投诉,将真正的问题与噪音区分开。创建可操作的工单…… |
| 技能 | 描述 |
|---|---|
| agentmail | 通过 AgentMail 为代理提供专用电子邮件收件箱。使用代理拥有的电子邮件地址(例如 hermes-agent@agentmail.to)自主发送、接收和管理电子邮件。 |
finance
| 技能 | 描述 |
|---|---|
| 3-statement-model | 在 Excel 中构建完全集成的三表模型(利润表、资产负债表、现金流量表),包含营运资本计划、折旧摊销滚动、债务计划以及使现金和留存收益平衡的填充项。与 excel-author 配合使用。 |
| comps-analysis | 在 Excel 中构建可比公司分析——运营指标、估值倍数、与同行组的统计基准比较。与 excel-author 配合使用。用于上市公司估值、IPO 定价、行业基准测试或异常值检测。 |
| dcf-model | 在 Excel 中构建机构级 DCF 估值模型——收入预测、自由现金流构建、WACC、终值、悲观/基准/乐观情景、5x5 敏感性表格。与 excel-author 配合使用。用于内在价值股权分析。 |
| excel-author | 使用 openpyxl 无头构建可审计的 Excel 工作簿——蓝色/黑色/绿色单元格约定、公式优先于硬编码、命名区域、平衡检查、敏感性表格。用于财务模型、审计输出、对账。 |
| lbo-model | 在 Excel 中构建杠杆收购模型——资金来源与用途、债务计划、现金扫除、退出倍数、IRR/MOIC 敏感性。与 excel-author 配合使用。用于 PE 筛选、发起人案例估值或演示中的说明性 LBO。 |
| merger-model | 在 Excel 中构建增厚/稀释(合并)模型——备考利润表、协同效应、融资组合、EPS 影响。与 excel-author 配合使用。用于并购演示、董事会材料或交易评估。 |
| pptx-author | 使用 python-pptx 无头构建 PowerPoint 演示文稿。与 excel-author 配合使用,用于基于模型的演示文稿,其中每个数字都追溯到工作簿单元格。用于推介演示、IC 备忘录、收益说明。 |
| stocks | 通过 Yahoo 获取股票报价、历史数据、搜索、比较、加密货币。 |
gaming
| 技能 | 描述 |
|---|---|
| minecraft-modpack-server | 托管模组版 Minecraft 服务器(CurseForge、Modrinth)。 |
| pokemon-player | 通过无头模拟器 + RAM 读取玩宝可梦。 |
health
| 技能 | 描述 |
|---|---|
| fitness-nutrition | 健身房锻炼计划器和营养追踪器。通过 wger 按肌肉、设备或类别搜索 690+ 个练习。通过 USDA FoodData Central 查询 380,000+ 种食物的宏量和卡路里。计算 BMI、TDEE、单次最大重复次数、宏量营养素分配和身体…… |
| neuroskill-bci | 连接到正在运行的 NeuroSkill 实例,并将用户的实时认知和情绪状态(专注度、放松度、情绪、认知负荷、困倦度、心率、HRV、睡眠分期和 40+ 个衍生 EXG 分数)纳入响应中…… |
mcp
| 技能 | 描述 |
|---|---|
| fastmcp | 使用 FastMCP 在 Python 中构建、测试、检查、安装和部署 MCP 服务器。在创建新的 MCP 服务器、将 API 或数据库封装为 MCP 工具、暴露资源或提示、或为 Claude Code、Cur……准备 FastMCP 服务器时使用。 |
| mcporter | 使用 mcporter CLI 直接列出、配置、认证和调用 MCP 服务器/工具(HTTP 或 stdio),包括临时服务器、配置编辑和 CLI/类型生成。 |
migration
| 技能 | 描述 |
|---|---|
| openclaw-migration | 将用户的 OpenClaw 自定义配置迁移到 Hermes Agent。从 ~/.openclaw 导入与 Hermes 兼容的记忆、SOUL.md、命令允许列表、用户技能和选定的工作区资产,然后报告无法迁移的内容…… |
mlops
| 技能 | 描述 |
|---|---|
| huggingface-accelerate | 最简单的分布式训练 API。4 行代码即可为任何 PyTorch 脚本添加分布式支持。统一的 DeepSpeed/FSDP/Megatron/DDP API。自动设备放置、混合精度(FP16/BF16/FP8)。交互式配置、单一启动命令…… |
| axolotl | Axolotl:YAML 配置的 LLM 微调(LoRA、DPO、GRPO)。 |
| chroma | 面向 AI 应用的开源嵌入数据库。存储嵌入和元数据,执行向量和全文搜索,按元数据过滤。简单的 4 函数 API。从笔记本扩展到生产集群。用于语义搜索、RAG…… |
| clip | OpenAI 连接视觉和语言的模型。支持零样本图像分类、图像-文本匹配和跨模态检索。在 4 亿图像-文本对上训练。用于图像搜索、内容审核或视觉-语言任务…… |
| dspy | DSPy:声明式 LM 程序,自动优化提示,RAG。 |
| faiss | Facebook 的高效相似性搜索和密集向量聚类库。支持数十亿向量、GPU 加速和各种索引类型(Flat、IVF、HNSW)。用于快速 k-NN 搜索、大规模向量检索,或当……时使用。 |
| optimizing-attention-flash | 使用 Flash Attention 优化 Transformer 注意力,实现 2-4 倍加速和 10-20 倍内存减少。在训练/运行长序列(>512 tokens)的 Transformer、遇到 GPU 内存问题或需要更快推理时使用。 |
| guidance | 使用正则表达式和语法控制 LLM 输出,保证生成有效的 JSON/XML/代码,强制执行结构化格式,并使用 Guidance(微软研究院的约束生成框架)构建多步骤工作流。 |
| huggingface-tokenizers | 为研究和生产优化的快速分词器。基于 Rust 的实现,可在 <20 秒内分词 1GB。支持 BPE、WordPiece 和 Unigram 算法。训练自定义词汇表、跟踪对齐、处理填充/截断。集成…… |
| instructor | 使用 Pydantic 验证从 LLM 响应中提取结构化数据,自动重试失败的提取,安全地解析复杂 JSON,并使用 Instructor(经过实战检验的结构化输出库)流式传输部分结果。 |
| lambda-labs-gpu-cloud | 用于 ML 训练和推理的预留和按需 GPU 云实例。当您需要具有简单 SSH 访问、持久文件系统或用于大规模训练的高性能多节点集群的专用 GPU 实例时使用。 |
| llava | 大型语言和视觉助手。支持视觉指令微调和基于图像的对话。将 CLIP 视觉编码器与 Vicuna/LLaMA 语言模型相结合。支持多轮图像聊天、视觉问答和指令…… |
| modal-serverless-gpu | 用于运行 ML 工作负载的无服务器 GPU 云平台。当您需要按需 GPU 访问而无需基础设施管理、将 ML 模型部署为 API 或运行具有自动扩展的批处理作业时使用。 |
| nemo-curator | 用于 LLM 训练的 GPU 加速数据整理。支持文本/图像/视频/音频。功能包括模糊去重(快 16 倍)、质量过滤(30+ 启发式)、语义去重、PII 编辑、NSFW 检测。跨 GPU 扩展…… |
| obliteratus | OBLITERATUS:消除 LLM 拒绝(均值差异法)。 |
| outlines | Outlines:结构化 JSON/正则表达式/Pydantic LLM 生成。 |
| peft-fine-tuning | 使用 LoRA、QLoRA 和 25+ 种方法对 LLM 进行参数高效微调。在 GPU 内存有限的情况下微调大型模型(7B-70B)、需要训练 <1% 的参数且精度损失最小、或多适配器服务时使用。 |
| pinecone | 用于生产 AI 应用的托管向量数据库。完全托管、自动扩展,支持混合搜索(密集 + 稀疏)、元数据过滤和命名空间。低延迟(p95 <100ms)。用于生产 RAG、推荐系统或…… |
| pytorch-fsdp | 使用 PyTorch FSDP 进行完全分片数据并行训练的专业指导——参数分片、混合精度、CPU 卸载、FSDP2。 |
| pytorch-lightning | 高级 PyTorch 框架,包含 Trainer 类、自动分布式训练(DDP/FSDP/DeepSpeed)、回调系统和极简样板代码。使用相同代码从笔记本扩展到超级计算机。当您想要简洁的训练循环……时使用。 |
| qdrant-vector-search | 用于 RAG 和语义搜索的高性能向量相似性搜索引擎。在构建需要快速最近邻搜索、带过滤的混合搜索或具有 Rust 驱动性能的可扩展向量存储的生产 RAG 系统时使用。 |
| sparse-autoencoder-training | 提供使用 SAELens 训练和分析稀疏自编码器(SAE)的指导,以将神经网络激活分解为可解释的特征。在发现可解释特征、分析叠加或研究……时使用。 |
| simpo-training | 用于 LLM 对齐的简单偏好优化。无需参考模型的 DPO 替代方案,性能更优(AlpacaEval 2.0 上 +6.4 分)。无需参考模型,比 DPO 更高效。在需要简单……的偏好对齐时使用。 |
| slime-rl-training | 提供使用 slime(一个 Megatron+SGLang 框架)进行 LLM 后训练(强化学习)的指导。在训练 GLM 模型、实现自定义数据生成工作流或需要紧密的 Megatron-LM 集成以进行 RL 扩展时使用。 |
| stable-diffusion-image-generation | 使用 HuggingFace Diffusers 和 Stable Diffusion 模型进行最先进的文本到图像生成。在从文本提示生成图像、执行图像到图像转换、修复或构建自定义扩散流水线时使用。 |
| tensorrt-llm | 使用 NVIDIA TensorRT 优化 LLM 推理,实现最大吞吐量和最低延迟。用于 NVIDIA GPU(A100/H100)上的生产部署,当您需要比 PyTorch 快 10-100 倍的推理速度,或使用量化……服务模型时使用。 |
| distributed-llm-pretraining-torchtitan | 使用 torchtitan 进行 PyTorch 原生的分布式 LLM 预训练,支持 4D 并行(FSDP2、TP、PP、CP)。在 8 到 512+ GPU 上预训练 Llama 3.1、DeepSeek V3 或自定义模型时使用,支持 Float8、torch.compile 和分布式…… |
| fine-tuning-with-trl | TRL:用于 LLM RLHF 的 SFT、DPO、PPO、GRPO、奖励建模。 |
| unsloth | Unsloth:2-5 倍更快的 LoRA/QLoRA 微调,更少的 VRAM。 |
| whisper | OpenAI 的通用语音识别模型。支持 99 种语言、转录、翻译成英语和语言识别。六种模型大小,从 tiny(3900 万参数)到 large(15.5 亿参数)。用于语音转文本、播客…… |
payments
| 技能 | 描述 |
|---|---|
| mpp-agent | 通过机器支付协议(MPP)支付 HTTP 402 API。 |
| stripe-link-cli | 通过 Stripe Link 进行代理支付——卡片、SPT、审批。 |
| stripe-projects | 通过 Stripe Projects 配置 SaaS 服务并同步凭据。 |
productivity
| 技能 | 描述 |
|---|---|
| canvas | Canvas LMS 集成——使用 API 令牌认证获取已注册课程和作业。 |
| here.now | 将静态网站发布到 {slug}.here.now,并将私有文件存储在云驱动器中,用于代理间交接。 |
| memento-flashcards | 间隔重复闪卡系统。从事实或文本创建卡片,使用自由文本答案(由代理评分)与闪卡聊天,从 YouTube 转录生成测验,使用自适应调度复习到期卡片,并导出/导入…… |
| shop | 商店目录搜索、结账、订单跟踪、退货。 |
| shopify | 通过 curl 使用 Shopify Admin & Storefront GraphQL API。产品、订单、客户、库存、元字段。 |
| siyuan | SiYuan Note API,用于通过 curl 在自托管知识库中搜索、读取、创建和管理块和文档。 |
| telephony | 在不更改核心工具的情况下为 Hermes 提供电话功能。配置并持久化 Twilio 号码,发送和接收 SMS/MMS,拨打电话,并通过 Bland.ai 或 Vapi 进行 AI 驱动的外呼。 |
research
| 技能 | 描述 |
|---|---|
| bioinformatics | 来自 bioSkills 和 ClawBio 的 400+ 个生物信息学技能入口。涵盖基因组学、转录组学、单细胞、变异检测、药物基因组学、宏基因组学、结构生物学等。获取领域特定参考材料…… |
| darwinian-evolver | 使用 Imbue 的进化循环进化提示/正则表达式/SQL/代码。 |
| domain-intel | 使用 Python 标准库进行被动域名侦察。子域名发现、SSL 证书检查、WHOIS 查询、DNS 记录、域名可用性检查和批量多域名分析。无需 API 密钥。 |
| drug-discovery | 用于药物发现流程的制药研究助手。在 ChEMBL 上搜索生物活性化合物,计算药物相似性(Lipinski Ro5、QED、TPSA、合成可及性),通过 OpenFDA 查找药物-药物相互作用,解释 ADMET…… |
| duckduckgo-search | 通过 DuckDuckGo 进行免费网络搜索——文本、新闻、图片、视频。无需 API 密钥。优先使用 ddgs CLI(如果已安装);仅在验证 ddgs 在当前运行时可用后使用 Python DDGS 库。 |
| gitnexus-explorer | 使用 GitNexus 索引代码库,并通过 Web UI + Cloudflare 隧道提供交互式知识图谱。 |
| osint-investigation | 公共记录 OSINT 调查框架——SEC EDGAR 文件、USAspending 合同、参议院游说、OFAC 制裁、ICIJ 离岸泄漏、纽约市房产记录(ACRIS)、OpenCorporates 注册、CourtListener 法庭记录、Wayback…… |
| parallel-cli | Parallel CLI 的可选供应商技能——代理原生网络搜索、提取、深度研究、丰富、FindAll 和监控。优先使用 JSON 输出和非交互式流程。 |
| qmd | 使用 qmd 在本地搜索个人知识库、笔记、文档和会议记录——一个结合 BM25、向量搜索和 LLM 重排序的混合检索引擎。支持 CLI 和 MCP 集成。 |
| scrapling | 使用 Scrapling 进行网页抓取——通过 CLI 和 Python 进行 HTTP 获取、隐身浏览器自动化、Cloudflare 绕过和爬虫爬取。 |
| searxng-search | 通过 SearXNG 进行免费元搜索——聚合 70+ 个搜索引擎的结果。自托管或使用公共实例。无需 API 密钥。当网络搜索工具集不可用时自动回退。 |
security
| 技能 | 描述 |
|---|---|
| 1password | 设置和使用 1Password CLI (op)。在安装 CLI、启用桌面应用集成、登录以及为命令读取/注入密钥时使用。 |
| godmode | 越狱 LLM:Parseltongue、GODMODE、ULTRAPLINIAN。 |
| oss-forensics | 针对 GitHub 仓库的供应链调查、证据恢复和取证分析。涵盖已删除提交恢复、强制推送检测、IOC 提取、多源证据收集、假设形成/验证和…… |
| sherlock | 在 400+ 个社交网络上进行 OSINT 用户名搜索。通过用户名查找社交媒体账户。 |
| web-pentest | 授权的 Web 应用程序渗透测试——侦察、漏洞分析、基于证明的利用和专业报告。采用 Shannon 的“无利用,不报告”方法论,并带有严格的范围、授权……护栏。 |
software-development
| 技能 | 描述 |
|---|---|
| code-wiki | 为任何代码库生成 Wiki 文档 + Mermaid 图表。 |
| rest-graphql-debug | 调试 REST/GraphQL API:状态码、认证、模式、复现。 |
| subagent-driven-development | 通过 delegate_task 子代理执行计划(2 阶段审查)。 |
web-development
| 技能 | 描述 |
|---|---|
| page-agent | 将 alibaba/page-agent 嵌入到您自己的 Web 应用程序中——一个纯 JavaScript 的页面内 GUI 代理,以单个 <script> 标签或 npm 包形式提供,让您网站的用户可以用自然语言驱动 UI(“点击登录,填写用户名……”)。 |
贡献可选技能
要向仓库添加新的可选技能:
- 在
optional-skills/<category>/<skill-name>/下创建目录 - 添加
SKILL.md文件,包含标准前置元数据(名称、描述、版本、作者) - 在
references/、templates/或scripts/子目录中包含任何支持文件 - 提交拉取请求——该技能将出现在此目录中,并在合并后获得自己的文档页面
分享: