ByteNoteByteNote

字节笔记本

2026年5月6日

OpenAI Agents SDK 新进化:原生沙箱执行 + 模型原生 Harness

API中转
¥120

OpenAI 更新了 Agents SDK,新增原生沙箱执行(Native Sandbox Execution)和模型原生 Harness,为开发者提供标准化基础设施,帮助构建安全、长时间运行的跨文件和工具的 AI 代理。

更新概述

此次更新解决了当前代理系统的三大痛点:

  • 模型无关框架灵活但无法充分利用前沿模型能力
  • 模型供应商 SDK 贴近模型但缺乏对 Harness 的足够可见性
  • 托管代理 API 简化部署但限制了运行位置和敏感数据访问方式

Agents SDK 的新架构让开发者获得一个既可即插即用又足够灵活的 Harness,轻松适配自己的技术栈。

模型原生 Harness

Harness 是代理的执行框架,更新后具备以下能力:

  • 可配置内存 — 支持长时间运行任务的状态管理
  • 沙箱感知编排 — 自动适应不同沙箱环境
  • Codex 级文件系统工具 — 支持 shell 执行、apply patch 文件编辑等操作
  • 标准化集成 — 内置 MCP 工具调用、Skills 渐进式披露、AGENTS.md 自定义指令等原语

这些原语包括:

原语说明
MCP工具调用标准协议
Skills渐进式能力披露
AGENTS.md自定义指令配置
Shell Tool代码执行
Apply Patch文件编辑

Harness 持续集成新的代理模式和原语,让开发者专注领域逻辑而非基础设施更新。通过与前沿模型的最佳执行模式对齐,提高了复杂任务(尤其是长时间运行或多工具协调场景)的可靠性和性能。

原生沙箱执行

工作空间

许多有用的代理需要一个可以读写文件、安装依赖、运行代码和使用工具的安全工作空间。原生沙箱支持开箱即用,无需自行拼凑。

支持的沙箱供应商

供应商类型
Blaxel云端
Cloudflare边缘
Daytona开发环境
E2B安全执行
Modal无服务器
RunloopGPU 沙箱
Vercel部署平台

Manifest 抽象

SDK 引入了 Manifest 抽象来描述代理的工作空间,实现跨供应商的环境可移植性:

  • 挂载本地文件 — 将本地目录映射到沙箱
  • 定义输出目录 — 指定结果写入位置
  • 对接存储服务 — 支持 AWS S3、Google Cloud Storage、Azure Blob Storage、Cloudflare R2

这提供了从本地原型到生产部署的一致环境管理方式,模型也能获得可预测的工作空间:输入在哪里、输出写到哪里、如何组织长时间运行任务。

安全设计

代理系统应假设存在提示注入和数据泄露尝试。Agents SDK 的安全架构:

  • Harness 与计算分离 — 将凭据排除在模型生成代码的执行环境之外
  • 持久执行 — 代理状态外部化,丢失沙箱容器不等于丢失运行状态
  • 快照与恢复 — 内置快照和重建机制,原始环境故障时可从检查点继续

可扩展性

  • 支持单沙箱或多沙箱运行
  • 按需调用沙箱
  • 子代理路由到隔离环境
  • 跨容器并行化执行

可用性与路线图

  • 当前可用 — Python SDK 已 GA,通过标准 API 定价(Token 和工具使用计费)
  • 即将推出 — TypeScript 支持、代码模式、子代理功能
  • 持续扩展 — 更多沙箱供应商、更多集成、更多接入方式

项目链接

分享: