ByteNoteByteNote

字节笔记本

2026年6月18日

OpenAI Codex 的 Record & Replay:一个录制按钮,正在送走传统 RPA

API中转
¥120

打败你的,永远不是同行。

干传统 RPA 的那帮人,估计没想到自己最后是被一个"做给我看"的功能送走的。

最近在写 LM Studio 那篇的时候,我遇到一个事,愣了一下。配了半天本地模型,跑通了,然后想把这套流程固定下来,方便下次换模型直接复用。我第一反应是打开备忘录,一条条往里记步骤。

记到第三步,停了。

我发现我在描述的东西,根本没法用文字说清楚。不是流程复杂,是"下拉菜单选第二个"、"看到绿色小圆点才算连上了"这种东西,写成文字,连自己看了都觉得是废话。但不写,下次又得重新摸一遍。

我一直觉得这是自动化工具的原罪。

不管是 RPA、Zapier 还是 Make,进去第一件事就是让你描述流程。用文字,用节点,用条件分支。但很多工作里最难描述的那部分,恰恰是"想当然就该这样"的那些步骤。你做起来是肌肉记忆,一到要写成规则就两眼一抹黑。

上周 OpenAI 给 Codex 推了一个功能,叫 Record & Replay。我看到的第一反应是:这个思路对了。

它解决的不是"如何自动化",是"如何描述你想自动化的事"

官方视频里用的例子是发 YouTube 视频。每次发视频,团队要从一个发布用的电子表格里提取元数据,找到对应的素材包,然后去 YouTube Studio 填标题、描述、上传缩略图、添加英文字幕,最后把视频设为私密保存。

每一步都固定,但想跟 AI 说清楚怎么做,还挺麻烦。

Record & Replay 的做法是,在 Codex 桌面端打开 Plugins,点加号,选 Record a skill,然后正常把这套操作做一遍。填标题、上传缩略图、选隐私设置,跟平时完全一样,就是多了个在旁边看着你的 Codex。

停止录制之后,它会回顾刚才的过程,生成一份 Skill 文件。

这个文件里有什么,我觉得是最值得说的地方。不是录屏,不是操作回放,是 Codex 把它看到的东西重新理解了一遍,用结构化的方式写下来,元数据在哪拿、素材包的目录结构长什么样、每次上传完要核对哪些字段。可以打开看,可以手动改,不是黑盒。

下次要处理下一个视频,开新对话,把素材包扔进去,告诉 Codex 用这个 Skill,它自己去对应表格、填字段、上传缩略图、设隐私,最后验证每一项有没有保存对。

你手上什么都不用做。

我自己想了几个能直接套上去的场景

发字节笔记本

我每次发文,要从草稿拷标题,配封面图,加摘要,选合集,设定时。这套操作我闭着眼睛能做,但真要写成说明书我估计写不清楚。录一遍,下次换一篇文章直接跑。

LM Studio 换模型

每次接一个新的 GGUF 模型,要配 context length、temperature、system prompt 模板,还要跑一组固定的 benchmark prompt 看效果。这套我在 4090 那台机器上做过很多遍了,就是每次都得重新想一遍。

Claude Code 提交前检查

提 PR 之前我有一套自己的习惯,看一遍 diff,确认没有调试日志漏掉,检查 CLAUDE.md 有没有要更新的,最后写 commit message。每次都靠记,有时候就漏了。

电商上新

每次新品上架,要在店铺后台填产品名、类目、主图、详情页、关键词、运费模板、库存,还要配限时折扣和赠品活动。淘宝、拼多多、抖音店的字段有细微差别,但结构相似。录一遍标准上新流程,下次给 Codex 一份新品信息表,它自己对应着填,每个平台的特殊选项全在 Skill 里。

每日数据汇总

运营每天要从广告后台、GA4、CRM 各拉一份数据,复制到汇总表今天那一行,算几个比率,填到早报模板里发给老板。这个过程录一遍,明天开始 Codex 自己做,从哪个页面取什么数字、粘到哪个单元格、公式怎么算,都在里面。

会议纪要整理

开完会,把录音丢进转录工具,按人名整理发言,提出待办事项,带上 DDL 和负责人,最后发到项目群。这套录一遍,下次会议结束把录音文件给 Codex,它按 Skill 里的结构处理,生成你习惯的格式发出去。

这几个场景有一个共同点,步骤固定,但没有一个适合写成文字的理由。不是因为复杂,是因为很多判断是"当然是这样",一旦要显式写出来反而会写错。

做一遍给它看,比写一遍给它读,快得多,也准得多。

它比传统 RPA 好在哪里

我觉得有一点很关键:它录下来的不是操作路径,是意图。

操作路径是脆的。界面改了、按钮挪了,流程就失效了。意图是弹性的,目标没变,执行方式可以跟着环境走。

我给 CC Log Workbench 配过一套本地打包发布的流程,每次 Wails 升了一个小版本,总有一两个命令参数变了,整套流程就得去查一遍。因为它记的是"执行这条命令",不是"完成这件事"。

这两件事的差距,就是 Record & Replay 和传统 RPA 的差距。

限制

目前只限 macOS,欧盟暂不可用,使用前要先开启 Computer Use。覆盖范围还有限,Windows 的同学先等着。

但方向是对的。

打败传统 RPA 的,不是更强的 RPA。

是一个录制按钮。

分享: