ByteNoteByteNote

字节笔记本

2026年6月21日

hermes教程-标题:AWS Bedrock

API中转
¥120

先决条件

  • AWS 凭证 — 任何 boto3 凭证链 支持的来源:
    • IAM 实例角色(EC2、ECS、Lambda — 零配置)
    • AWS_ACCESS_KEY_ID + AWS_SECRET_ACCESS_KEY 环境变量
    • AWS_PROFILE 用于 SSO 或命名配置文件
    • aws configure 用于本地开发
  • boto3 — 使用 pip install hermes-agent[bedrock] 安装
  • IAM 权限 — 至少需要:
    • bedrock:InvokeModelbedrock:InvokeModelWithResponseStream(用于推理)
    • bedrock:ListFoundationModelsbedrock:ListInferenceProfiles(用于模型发现)

提示 — EC2 / ECS / Lambda

在 AWS 计算资源上,附加一个具有 AmazonBedrockFullAccess 的 IAM 角色即可。无需 API 密钥,无需 .env 配置 — Hermes 会自动检测实例角色。

快速开始

bash
## 安装时包含 Bedrock 支持
pip install hermes-agent[bedrock]
## 选择 Bedrock 作为你的提供商
hermes model
## → 选择 "更多提供商..." → "AWS Bedrock"
## → 选择你的区域和模型
## 开始对话
hermes chat

配置

运行 hermes model 后,你的 ~/.hermes/config.yaml 将包含:

yaml
model:
  default: us.anthropic.claude-sonnet-4-6
  provider: bedrock
  base_url: https://bedrock-runtime.us-east-2.amazonaws.com

bedrock:
  region: us-east-2

区域

通过以下任一方式设置 AWS 区域(优先级从高到低):

  1. config.yaml 中的 bedrock.region
  2. AWS_REGION 环境变量
  3. AWS_DEFAULT_REGION 环境变量
  4. 默认值:us-east-1

护栏

要对所有模型调用应用 Amazon Bedrock 护栏

yaml
bedrock:
  region: us-east-2
  guardrail:
    guardrail_identifier: "abc123def456"  # 来自 Bedrock 控制台
    guardrail_version: "1"                # 版本号或 "DRAFT"
    stream_processing_mode: "async"       # "sync" 或 "async"
    trace: "disabled"                     # "enabled"、"disabled" 或 "enabled_full"

模型发现

Hermes 通过 Bedrock 控制平面自动发现可用模型。你可以自定义发现设置:

yaml
bedrock:
  discovery:
    enabled: true
    provider_filter: ["anthropic", "amazon"]  # 仅显示这些提供商
    refresh_interval: 3600                     # 缓存 1 小时

可用模型

Bedrock 模型使用推理配置文件 ID 进行按需调用。hermes model 选择器会自动显示这些模型,推荐模型位于顶部:

模型ID备注
Claude Sonnet 4.6us.anthropic.claude-sonnet-4-6推荐 — 速度与能力的最佳平衡
Claude Opus 4.6us.anthropic.claude-opus-4-6-v1能力最强
Claude Haiku 4.5us.anthropic.claude-haiku-4-5-20251001-v1:0最快的 Claude
Amazon Nova Prous.amazon.nova-pro-v1:0Amazon 旗舰模型
Amazon Nova Microus.amazon.nova-micro-v1:0最快、最便宜
DeepSeek V3.2deepseek.v3.2强大的开源模型
Llama 4 Scout 17Bus.meta.llama4-scout-17b-instruct-v1:0Meta 最新模型

信息 — 跨区域推理

us. 为前缀的模型使用跨区域推理配置文件,可提供更好的容量和跨 AWS 区域的自动故障转移。以 global. 为前缀的模型则路由到全球所有可用区域。

会话中切换模型

在对话中使用 /model 命令:

text
/model us.amazon.nova-pro-v1:0
/model deepseek.v3.2
/model us.anthropic.claude-opus-4-6-v1

诊断

bash
hermes doctor

诊断检查项:

  • AWS 凭证是否可用(环境变量、IAM 角色、SSO)
  • 是否安装了 boto3
  • Bedrock API 是否可达(ListFoundationModels)
  • 你所在区域中可用模型的数量

网关(消息平台)

Bedrock 可与所有 Hermes 网关平台(Telegram、Discord、Slack、飞书等)配合使用。将 Bedrock 配置为提供商,然后正常启动网关:

bash
hermes gateway setup
hermes gateway start

网关会读取 config.yaml 并使用相同的 Bedrock 提供商配置。

故障排除

"未找到 API 密钥" / "未找到 AWS 凭证"

Hermes 按以下顺序检查凭证:

  1. AWS_BEARER_TOKEN_BEDROCK
  2. AWS_ACCESS_KEY_ID + AWS_SECRET_ACCESS_KEY
  3. AWS_PROFILE
  4. EC2 实例元数据(IMDS)
  5. ECS 容器凭证
  6. Lambda 执行角色

如果都未找到,请运行 aws configure 或为你的计算实例附加 IAM 角色。

"不支持使用按需吞吐量调用模型 ID ..."

请使用推理配置文件 ID(以 us.global. 为前缀)而不是裸的基础模型 ID。例如:

  • anthropic.claude-sonnet-4-6
  • us.anthropic.claude-sonnet-4-6

"ThrottlingException"

你已达到 Bedrock 的每模型速率限制。Hermes 会自动重试并退避。要增加限制,请在 AWS Service Quotas 控制台 中请求配额增加。

一键 AWS 部署

如需在 EC2 上使用 CloudFormation 进行全自动部署:

sample-hermes-agent-on-aws-with-bedrock — 自动创建 VPC、IAM 角色、EC2 实例并配置 Bedrock。一键部署到任何区域。


分享: