ByteNoteByteNote
Open Browser Use - Codex Browser Use 的开源替代方案

字节笔记本

2026年5月12日

Open Browser Use - Codex Browser Use 的开源替代方案

API中转
¥120

本文介绍 Open Browser Use,一个开源的浏览器自动化层,作为 Codex Browser Use 的完整替代方案。该项目提供了多语言 SDK、命令行工具和 Chrome 扩展,帮助开发者在不同 AI Agent 运行时中轻松实现浏览器自动化操作。

项目简介

Open Browser Use 是由 iFurySt 开发维护的开源项目,截至目前在 GitHub 上已获得 29 stars,拥有 106 次提交和 34 个发布版本。该项目主要使用 JavaScript(49.8%)和 Go(34.8%)编写。

该项目是一层与 Agent 运行时无关的浏览器自动化层,也是 Codex.app 最近推出的 Chrome Browser Use 功能的开源替代品。它本质上由浏览器扩展 + open-browser-use CLI 两部分构成,支持通过 JavaScript SDK、Python SDK、Go SDK 以及 CLI 进行集成。

核心特性

  • 多语言 SDK 支持:同时提供 JavaScript/TypeScript、Python、Go 三种 SDK,满足不同技术栈的集成需求
  • CLI 工具:通过命令行即可快速完成 Chrome 扩展安装、Native Host 注册等配置工作
  • Chrome 扩展集成:配套的 Chrome 扩展通过 Native Messaging 协议与本地 CLI 通信
  • MCP Server 支持:内置 MCP 服务器,可无缝集成到支持 MCP 协议的 Agent 运行环境
  • Agent 运行时无关:独立于任何特定 AI Agent 框架,可自由搭配使用
  • 支持 Brew 安装:通过 Homebrew 即可一键安装,降低使用门槛

技术栈

  • Go - CLI 工具和 Native Host 通信层的核心语言
  • JavaScript/TypeScript - Chrome 扩展前端及 npm SDK
  • Python - Python SDK 的实现语言
  • Chrome Extension API - 浏览器端自动化能力接入
  • Native Messaging - 浏览器扩展与本地 CLI 的通信协议
  • Chrome DevTools Protocol (CDP) - 底层浏览器控制协议
  • Model Context Protocol (MCP) - 与 AI Agent 的标准化接口

安装指南

前置要求

  • Node.js >= 18(使用 npm 安装时)
  • Homebrew(macOS 推荐)
  • Google Chrome 浏览器

安装步骤

方式一:Homebrew 安装(推荐)

bash
brew tap iFurySt/open-browser-use
brew install open-browser-use

方式二:npm 全局安装

bash
npm i -g open-browser-use

设置 Chrome 扩展

安装完成后,运行 setup 命令完成 Chrome 扩展的注册和安装:

bash
open-browser-use setup

该命令会自动注册 Native Host、打开 Chrome Web Store 页面安装扩展,并在需要时提示重启 Chrome。

如果 Chrome Web Store 暂时不可用,可以使用 beta 模式进行手动安装:

bash
open-browser-use setup beta

升级

bash
brew upgrade open-browser-use

使用示例

场景 1:通过 SDK 进行浏览器自动化

JavaScript/TypeScript:

bash
npm install open-browser-use-sdk
typescript
import { OpenBrowserUse } from 'open-browser-use-sdk'

const obu = new OpenBrowserUse()

// 打开网页并获取内容
await obu.navigate('https://example.com')
const content = await obu.getContent()
console.log(content)

Python:

bash
pip install open-browser-use-sdk
python
from open_browser_use import OpenBrowserUse

obu = OpenBrowserUse()

# 打开网页
await obu.navigate('https://example.com')
content = await obu.get_content()
print(content)

Go:

bash
go get github.com/ifuryst/open-codex-browser-use/packages/open-browser-use-go
go
import obu "github.com/ifuryst/open-codex-browser-use/packages/open-browser-use-go"

client := obu.NewClient()
content, err := client.Navigate("https://example.com")
if err != nil {
    log.Fatal(err)
}
fmt.Println(content)

场景 2:作为 Claude Code Skill 使用

Open Browser Use 提供了可直接安装的 Skill,方便在 Claude Code 或 Codex 中使用:

bash
# 为 Claude Code 安装
npx skills add iFurySt/open-codex-browser-use -g -a claude-code --skill open-browser-use --copy -y

# 为 Codex 安装
npx skills add iFurySt/open-codex-browser-use -g -a codex --skill open-browser-use --copy -y

场景 3:作为 MCP Server 集成

配置 MCP Server 即可在任意支持 MCP 协议的 Agent 中使用:

json
{
  "mcp_servers": {
    "open_browser_use": {
      "command": "obu",
      "args": ["mcp"]
    }
  }
}

MCP 服务器会暴露标签页管理、导航、CDP 控制、Action Plan 执行等浏览器工具。

项目链接

分享: