ByteNoteByteNote

字节笔记本

2026年6月8日

lineage-skill:把一整套课程蒸馏成可溯源的私人课程导师 Skill

API中转
¥120

lineage-skill 是一个课程蒸馏 Skill,能把整套视频课、训练营、PDF 讲义、板书截图和笔记转化成一个可安装、可调用、可溯源的课程导师。面向 Codex、Claude Code、OpenClaw、Hermes 等多种 AI Agent,由 JuneYaooo 开发,采用 PolyForm Noncommercial License。

它的核心目标:把"我买过、看过、学过一套课"变成"我拥有一个能随时陪练和指导的课程导师"。

这不是课程总结,是方法沉淀

传统方式是让 AI "帮我总结一下这门课",得到一份摘要,看完就忘。lineage-skill 的思路完全不同——它从几十甚至上百小时的视频课程里,把老师长期积累的判断框架、问题分解方式、案例经验和隐性标准抽出来,变成 Agent 可以反复调用的能力。

蒸馏后的核心价值:

  • 从内容消费变成方法资产:不只是"看过这套课",而是沉淀出概念体系、判断标准、操作流程和模板库
  • 从一次学习变成长期陪练:Agent 按学习进度追问、复盘、找薄弱点,把课程变成持续训练系统
  • 从模糊记忆变成可溯源知识库:重要结论可以回到课时、原文、截图或讲义,避免把自己的理解误当成老师原意
  • 从听懂道理变成实际产出:生成方案、检查方案、设计流程、写模板、做决策辅助

蒸馏流水线

lineage-skill 按 Capture → Cite → Compress → Connect → Codify → Evaluate 六个阶段工作:

  • Capture:采集视频、音频、讲义、截图、OCR、转录和笔记
  • Cite:保留课时、时间戳、原文、截图和文档来源
  • Compress:把长材料压缩成结构化摘要和课程脉络
  • Connect:连接概念、案例、方法、课时和使用场景
  • Codify:把老师的方法固化成流程、清单、模板和判断标准
  • Evaluate:用课程标准做复盘、质检、追问和应用检查

先保留证据,再压缩蒸馏;先区分课时、讲义、板书、案例和笔记,再整理成概念、方法、步骤、模板和导师能力。

四种角色,按需选择

角色适合什么
mentor学习内化:追问、复盘、纠偏、阶段计划
expert证据回查:概念解释、课时定位、观点核对、来源引用
consultant情境决策:把老师的方法迁移到真实问题
practitioner资产生产:沉淀 playbook、checklist、template、质检规则

可以组合使用,例如"mentor + practitioner"既能像导师一样陪学,也能输出实操清单。

能力矩阵

能力产物
视频/音频转录transcripts/*.json
视频视觉理解(PPT、板书、软件界面)analysis/*_analysis.md
干货截图自动提取与去重analysis/screenshots/
PDF/文档 OCR 解析documents/
课程蒸馏与概念提炼course_distillation_*.md/json
CoursePackage 构建course_package.json
专属导师 Skill 生成可安装/调用的课程 Skill
断点与进度记录lineage_progress.json
多课程目录索引course_catalog.json

使用方法

安装 Skill

把这段话发给 Agent:

text
请安装这个 Skill:
https://raw.githubusercontent.com/JuneYaooo/lineage-skill/main/docs/install.md

安装后请告诉我可以怎样把我的课程材料整理成课程专家。

准备材料

把课程材料放在一个本地目录里即可,不要求固定格式:

  • 视频:.mp4
  • 音频:.mp3.wav.m4a.aac.flac
  • 文档:PDF、讲义、截图、OCR Markdown
  • 已有文本:转录、课程笔记、学习总结

如果已有转录或笔记,可以跳过重新转录,直接进入蒸馏和 Skill 生成。

模型接口配置

需要三个模型接口(按材料类型可选):

bash
# 语音转文字(处理视频/音频时需要)
AUDIO_TRANSCRIBE_API_KEY=
AUDIO_TRANSCRIBE_BASE_URL=https://api.siliconflow.cn/v1
AUDIO_TRANSCRIBE_MODEL=FunAudioLLM/SenseVoiceSmall

# 视觉理解(需要理解 PPT/板书时配置)
LINEAGE_VISION_API_KEY=
LINEAGE_VISION_BASE_URL=https://your-openai-compatible-vision-endpoint/v1
LINEAGE_VISION_MODEL=gemini-3.1-pro-preview

# 文本蒸馏(整理课程知识结构时建议配置)
LINEAGE_TEXT_API_KEY=
LINEAGE_TEXT_BASE_URL=https://api.openai.com/v1
LINEAGE_TEXT_MODEL=gpt5.5

最小配置取决于你的材料类型:已有转录只需 LINEAGE_TEXT_*;视频课程需要语音 + 文本;需要理解板书再加视觉模型。

本地工具依赖

处理视频或音频时需要安装 ffmpeg

bash
# macOS
brew install ffmpeg

# Ubuntu/Debian
sudo apt-get install -y ffmpeg

只从已有转录和笔记打包 Skill 时,可以暂时不装。

蒸馏后的典型用法

安装完生成的课程 Skill 后,可以像跟导师对话一样使用:

我学完前 5 课了。请按老师的体系复盘我的理解,追问我最可能漏掉的关键判断。 按这套课的方法,分析我这个业务场景,指出关键假设、判断步骤和风险。 把老师的方法整理成一个可复用 playbook:适用场景、操作步骤、检查标准、常见误区。 这个结论是不是课程原意?请给出课时、原文大意、证据强弱。

实际案例:倪海厦中医课程

作者展示了一个从 100GB+ 倪海厦中医视频课程材料蒸馏出的专门领域 Skill。经过完整流水线处理后,沉淀成可触发、可检索、可溯源的中医 Skill,支持课程检索、方证穴位辨析、学习笔记整理与板书截图证据索引。

这个案例说明了 lineage-skill 的一个重要能力:即使面对海量(100GB+)的课程材料,也能通过分片处理、压缩蒸馏的方式产出结构化的知识资产。

项目链接

  • GitHub 仓库:JuneYaooo/lineage-skill
  • 许可证:PolyForm Noncommercial License 1.0.0(商业使用需联系作者)
  • 鸣谢:Datawhale 开源社区、LINUX DO 社区
分享: