AI Research Skills：83 个 AI 研究工程技能库，让你的 AI Agent 成为研究助手

AI Research Skills 是目前最全面的开源 AI 研究工程技能库，包含 83 个专业技能，覆盖从模型架构到部署的完整 AI 研究生命周期。该库让你的编程代理能够自主实现和执行 AI 研究实验，包括数据准备、模型训练、评估和部署。

项目简介

AI Research Skills 由 Orchestra Research 团队开发和维护，目前在 GitHub 上已获得 3.5K+ stars 和 284 forks。这个开源项目旨在为 AI 编程代理（如 Claude Code、Cursor、Codex、Gemini CLI）提供专业的 AI 研究工程能力。

项目的核心理念是：AI 研究人员花在调试基础设施上的时间比测试假设还多，这减慢了科学发现的速度。AI Research Skills 提供了一套全面的专家级研究工程技能，使 AI 代理能够自主实现和执行 AI 研究实验的各个阶段。

核心特性

83 个专业技能：覆盖 AI 研究的 20 个主要领域
质量优先：每个技能提供 200-500 行聚焦的、可操作的指导
多代理支持：支持 Claude Code、Cursor、Codex、Gemini CLI、Qwen Code 等主流 AI 编程代理
一键安装：通过 npm 包实现跨代理的统一安装体验
持续更新：由专业团队维护，定期添加新技能和更新文档

技术栈覆盖范围

20 个技能类别

类别	技能数	代表项目
模型架构	5	LitGPT, Mamba, RWKV, NanoGPT, TorchTitan
分词器	2	HuggingFace Tokenizers, SentencePiece
微调	4	Axolotl, LLaMA-Factory, PEFT, Unsloth
可解释性	4	TransformerLens, SAELens, pyvene, nnsight
数据处理	2	Ray Data, NeMo Curator
后训练	8	TRL, GRPO, OpenRLHF, SimPO, verl, slime
安全对齐	4	Constitutional AI, LlamaGuard, NeMo Guardrails
分布式训练	6	DeepSpeed, FSDP, Megatron-Core, Accelerate
基础设施	3	Modal, SkyPilot, Lambda Labs
优化	6	Flash Attention, bitsandbytes, GPTQ, AWQ, GGUF
评估	3	lm-evaluation-harness, BigCode, NeMo Evaluator
推理服务	4	vLLM, TensorRT-LLM, llama.cpp, SGLang
MLOps	3	W&B, MLflow, TensorBoard
AI 代理	4	LangChain, LlamaIndex, CrewAI, AutoGPT
RAG	5	Chroma, FAISS, Pinecone, Qdrant
多模态	7	CLIP, Whisper, LLaVA, Stable Diffusion, SAM
提示工程	4	DSPy, Instructor, Guidance, Outlines
可观测性	2	LangSmith, Phoenix
新兴技术	6	MoE, 模型合并, 长上下文, 蒸馏, 剪枝
论文写作	1	LaTeX 模板, 引用验证

安装指南

前置要求

Node.js >= 16
npm 或 npx

快速安装

bash

# 交互式安装（推荐）
npx @orchestra-research/ai-research-skills

安装程序会自动：

检测你已安装的 AI 编程代理
将技能安装到 ~/.orchestra/skills/ 并创建符号链接
支持全部安装、快速入门包、按类别或单个技能安装
更新已安装的技能到最新版本

CLI 命令

bash

# 查看已安装技能
npx @orchestra-research/ai-research-skills list

# 更新已安装技能
npx @orchestra-research/ai-research-skills update

Claude Code Marketplace 安装

bash

# 添加市场
/plugin marketplace add orchestra-research/AI-research-SKILLs

# 按类别安装
/plugin install fine-tuning@ai-research-skills
/plugin install inference-serving@ai-research-skills
/plugin install distributed-training@ai-research-skills

快速开始

安装后使用

安装技能到你的代理：运行安装命令后，技能会自动链接到你的 AI 编码代理
开始对话：直接向你的 AI 代理提问相关技术问题
获得专业指导：代理会基于安装的技能提供专业的代码示例和解决方案

示例用法

text

用户: 我需要用 Axolotl 微调 Llama 3
代理: [基于 Axolotl 技能提供 YAML 配置和训练命令]

用户: 如何用 vLLM 部署高吞吐量推理服务？
代理: [基于 vLLM 技能提供 PagedAttention 配置和部署方案]

使用示例

场景 1：微调模型

bash

# 使用 Axolotl 进行微调
# YAML 配置示例
base_model: meta-llama/Llama-3-8B
model_type: LlamaForCausalLM
tokenizer_type: AutoTokenizer

load_in_8bit: true
adapter: qlora
lora_r: 32
lora_alpha: 16

datasets:
  - path: your_dataset.jsonl
    type: alpaca

场景 2：分布式训练

python

# 使用 DeepSpeed ZeRO-3
from transformers import Trainer, TrainingArguments

training_args = TrainingArguments(
    deepspeed="ds_config.json",
    per_device_train_batch_size=1,
    gradient_accumulation_steps=16,
)

trainer = Trainer(model=model, args=training_args)
trainer.train()

场景 3：高性能推理

python

# 使用 vLLM 部署
from vllm import LLM, SamplingParams

llm = LLM(model="meta-llama/Llama-3-8B")
sampling_params = SamplingParams(temperature=0.7, top_p=0.9)

outputs = llm.generate(prompts, sampling_params)

技能结构

每个技能遵循统一的格式：

text

skill-name/
├── SKILL.md          # 快速参考（50-150 行）
├── references/       # 深度文档（300KB+）
│   ├── README.md     # 官方文档
│   ├── api.md        # API 参考
│   ├── tutorials.md  # 教程指南
│   ├── issues.md     # GitHub 问题解决方案
│   └── releases.md   # 版本历史
├── scripts/          # 辅助脚本（可选）
└── assets/           # 模板和示例（可选）

项目链接

GitHub 仓库：https://github.com/Orchestra-Research/AI-research-SKILLs
npm 包：@orchestra-research/ai-research-skills
官方网站：https://www.orchestra-research.com
Slack 社区：加入讨论
Twitter：@orch_research

字节笔记本

AI Research Skills：83 个 AI 研究工程技能库，让你的 AI Agent 成为研究助手

项目简介

核心特性

技术栈覆盖范围

20 个技能类别

安装指南

前置要求

快速安装

CLI 命令

Claude Code Marketplace 安装

快速开始

安装后使用

示例用法

使用示例

场景 1：微调模型

场景 2：分布式训练

场景 3：高性能推理

技能结构

项目链接