ByteNoteByteNote

字节笔记本

2026年5月3日

五步框架:把 Workflow 变成可进化的 Skill

API中转
¥120

传统 Workflow 编排虽然提供确定性和可审计性,但缺乏灵活性和可进化性。作者提出用 Agent + Skills 架构取代大部分 Workflow,通过五步框架(拆分、编排、存储、分摊、迭代)构建可自我进化的自动化系统。

Workflow 编排的"舒适区"

可视化工作流工具能火起来,是有道理的。拖拽节点、连连线,一个自动化流程就搭好了。不用写代码,改起来也直观。更重要的是,它给你确定性,节点 A 执行完一定是节点 B,不会突然跳到节点 C。

但 workflow 编排也有硬伤:

  • 它不够强大: 可视化节点能做的事情有限,复杂逻辑很难表达
  • 它不够灵活: 一旦流程定死,遇到输入变化就容易出错
  • 它难以移植: 平台锁定效应明显

Agent + Skills 的"降维打击"

几乎所有能用 workflow 完成的 AI 任务,都可以用 Agent + Skills 实现。关键在于怎么理解 skill。

Skill 应该被看作可组合的模块。你可以把多个 skill 串起来,用自然语言描述它们之间的协作关系。

五步框架详解

第一步:拆分

把工作流拆成单一职责的 skill 或 subagent。每个模块只做一件事,做好一件事。

第二步:编排

用自然语言描述整个流程,条件分支、并行执行、错误处理都可以用自然语言描述。Agent 能理解这些描述并执行。

第三步:存储

所有中间结果都保存成本地文件。这样做的好处是:

  • 可追溯:每一步的输出都有记录
  • 可断点续传:失败了可以从中间恢复
  • 可人工干预:随时可以检查和修改中间结果

第四步:分摊

Subagent 之间只传文件路径,不传内容。这样可以避免上下文窗口被撑满,每个 subagent 只需要关注自己负责的部分。

第五步:迭代

这是 Agent + Skills 相比传统 workflow 最大的优势,可以持续进化。发现问题让 Claude Code 帮你改,Skills 会越用越好。

实践示例

写作工作流

text
article-analyzer → outliner → writer-agent → polish
     ↓              ↓            ↓             ↓
analysis.md   outline.md   draft.md    final.md

配图工作流

text
generate-image (原子技能)
     ↓
article-illustrator (组合技能)
     ↓
cover-image (组合技能)

正面应对三大质疑

质疑一:稳定性怎么办?

  • 确定性逻辑不一定要交给 Agent
  • 把需要确定性的部分写成脚本
  • 混合架构: 代码处理确定性逻辑,Agent 处理需要判断的任务

"Skills 可以包含可执行代码,用于那些传统编程比 token 生成更可靠的任务。"

质疑二:成本太高

成本要算总账(开发成本、维护成本、迭代成本):

  • Rakuten(乐天): 用 Claude Skills 处理财务报表,8 倍效率提升(一天工作变一小时)
  • Box: 用 Skills 让用户即时转换文件格式,为团队节省数小时手工操作
  • Skills 采用"按需加载"设计优化成本

质疑三:门槛太高

  • AI 本身就能帮你创建 skill
  • /skill-creator 让 Claude Code 生成配置
  • Skill 比 workflow 更易维护(Git 管理版本、代码审查、跨机器同步)

边界在哪里

Agent + Skills 更适合

  • 输入多变、需要判断的任务
  • 跨系统协调的复杂流程
  • 需要频繁迭代的工作流
  • 需要分享复用的自动化逻辑

Workflow 仍有优势的场景

  • 严格审计要求的合规流程
  • 超高频执行的简单任务
  • 非技术用户的可视化需求

可进化的优势

Skill 架构有个经常被忽略的好处:它是活的,可以不断进化

"Claude Code 还有一个很强但很少人用的地方,是可以自己迭代 subagent 的 system prompt,配合 ralph-loop,已经可以完成自我迭代进化了。在 token 和系统资源充足的情况下,能进化成非常恐怖的存在。"

核心思想对比

维度WorkflowAgent + Skills
确定性高(固定流程)中(自然语言描述)
灵活性低(流程僵化)高(可随时调整)
可进化性无(搭好就定型)强(持续迭代优化)
可维护性中(平台锁定)高(Git 管理)
可移植性低(导出导入麻烦)高(几个文件)
学习门槛低(可视化)中(需要抽象能力)
开发效率低(一个个配置)高(自然语言描述)

关键洞察: 不是工具的选择,而是思路的转变。从"搭建固定流程"到"构建可进化系统"。


原文链接: https://mp.weixin.qq.com/s/R0WNSWPksZykDrWoPVAy2Q 作者: 宝玉AI 发布时间: 2025-01-11

分享: