lineage-skill：把一整套课程蒸馏成可溯源的私人课程导师 Skill

lineage-skill 是一个课程蒸馏 Skill，能把整套视频课、训练营、PDF 讲义、板书截图和笔记转化成一个可安装、可调用、可溯源的课程导师。面向 Codex、Claude Code、OpenClaw、Hermes 等多种 AI Agent，由 JuneYaooo 开发，采用 PolyForm Noncommercial License。

它的核心目标：把"我买过、看过、学过一套课"变成"我拥有一个能随时陪练和指导的课程导师"。

这不是课程总结，是方法沉淀

传统方式是让 AI "帮我总结一下这门课"，得到一份摘要，看完就忘。lineage-skill 的思路完全不同——它从几十甚至上百小时的视频课程里，把老师长期积累的判断框架、问题分解方式、案例经验和隐性标准抽出来，变成 Agent 可以反复调用的能力。

蒸馏后的核心价值：

从内容消费变成方法资产：不只是"看过这套课"，而是沉淀出概念体系、判断标准、操作流程和模板库
从一次学习变成长期陪练：Agent 按学习进度追问、复盘、找薄弱点，把课程变成持续训练系统
从模糊记忆变成可溯源知识库：重要结论可以回到课时、原文、截图或讲义，避免把自己的理解误当成老师原意
从听懂道理变成实际产出：生成方案、检查方案、设计流程、写模板、做决策辅助

蒸馏流水线

lineage-skill 按 Capture → Cite → Compress → Connect → Codify → Evaluate 六个阶段工作：

Capture：采集视频、音频、讲义、截图、OCR、转录和笔记
Cite：保留课时、时间戳、原文、截图和文档来源
Compress：把长材料压缩成结构化摘要和课程脉络
Connect：连接概念、案例、方法、课时和使用场景
Codify：把老师的方法固化成流程、清单、模板和判断标准
Evaluate：用课程标准做复盘、质检、追问和应用检查

先保留证据，再压缩蒸馏；先区分课时、讲义、板书、案例和笔记，再整理成概念、方法、步骤、模板和导师能力。

四种角色，按需选择

角色	适合什么
`mentor`	学习内化：追问、复盘、纠偏、阶段计划
`expert`	证据回查：概念解释、课时定位、观点核对、来源引用
`consultant`	情境决策：把老师的方法迁移到真实问题
`practitioner`	资产生产：沉淀 playbook、checklist、template、质检规则

可以组合使用，例如"mentor + practitioner"既能像导师一样陪学，也能输出实操清单。

能力矩阵

能力	产物
视频/音频转录	`transcripts/*.json`
视频视觉理解（PPT、板书、软件界面）	`analysis/*_analysis.md`
干货截图自动提取与去重	`analysis/screenshots/`
PDF/文档 OCR 解析	`documents/`
课程蒸馏与概念提炼	`course_distillation_*.md/json`
CoursePackage 构建	`course_package.json`
专属导师 Skill 生成	可安装/调用的课程 Skill
断点与进度记录	`lineage_progress.json`
多课程目录索引	`course_catalog.json`

使用方法

安装 Skill

把这段话发给 Agent：

text

请安装这个 Skill：
https://raw.githubusercontent.com/JuneYaooo/lineage-skill/main/docs/install.md

安装后请告诉我可以怎样把我的课程材料整理成课程专家。

准备材料

把课程材料放在一个本地目录里即可，不要求固定格式：

视频：.mp4
音频：.mp3、.wav、.m4a、.aac、.flac
文档：PDF、讲义、截图、OCR Markdown
已有文本：转录、课程笔记、学习总结

如果已有转录或笔记，可以跳过重新转录，直接进入蒸馏和 Skill 生成。

模型接口配置

需要三个模型接口（按材料类型可选）：

bash

# 语音转文字（处理视频/音频时需要）
AUDIO_TRANSCRIBE_API_KEY=
AUDIO_TRANSCRIBE_BASE_URL=https://api.siliconflow.cn/v1
AUDIO_TRANSCRIBE_MODEL=FunAudioLLM/SenseVoiceSmall

# 视觉理解（需要理解 PPT/板书时配置）
LINEAGE_VISION_API_KEY=
LINEAGE_VISION_BASE_URL=https://your-openai-compatible-vision-endpoint/v1
LINEAGE_VISION_MODEL=gemini-3.1-pro-preview

# 文本蒸馏（整理课程知识结构时建议配置）
LINEAGE_TEXT_API_KEY=
LINEAGE_TEXT_BASE_URL=https://api.openai.com/v1
LINEAGE_TEXT_MODEL=gpt5.5

最小配置取决于你的材料类型：已有转录只需 LINEAGE_TEXT_*；视频课程需要语音 + 文本；需要理解板书再加视觉模型。

本地工具依赖

处理视频或音频时需要安装 ffmpeg：

bash

# macOS
brew install ffmpeg

# Ubuntu/Debian
sudo apt-get install -y ffmpeg

只从已有转录和笔记打包 Skill 时，可以暂时不装。

蒸馏后的典型用法

安装完生成的课程 Skill 后，可以像跟导师对话一样使用：

我学完前 5 课了。请按老师的体系复盘我的理解，追问我最可能漏掉的关键判断。 按这套课的方法，分析我这个业务场景，指出关键假设、判断步骤和风险。 把老师的方法整理成一个可复用 playbook：适用场景、操作步骤、检查标准、常见误区。 这个结论是不是课程原意？请给出课时、原文大意、证据强弱。

实际案例：倪海厦中医课程

作者展示了一个从 100GB+ 倪海厦中医视频课程材料蒸馏出的专门领域 Skill。经过完整流水线处理后，沉淀成可触发、可检索、可溯源的中医 Skill，支持课程检索、方证穴位辨析、学习笔记整理与板书截图证据索引。

这个案例说明了 lineage-skill 的一个重要能力：即使面对海量（100GB+）的课程材料，也能通过分片处理、压缩蒸馏的方式产出结构化的知识资产。

项目链接

GitHub 仓库：JuneYaooo/lineage-skill
许可证：PolyForm Noncommercial License 1.0.0（商业使用需联系作者）
鸣谢：Datawhale 开源社区、LINUX DO 社区