字
字节笔记本
2026年2月15日
AI Research Skills:83 个 AI 研究工程技能库,让你的 AI Agent 成为研究助手
API中转
¥120
AI Research Skills 是目前最全面的开源 AI 研究工程技能库,包含 83 个专业技能,覆盖从模型架构到部署的完整 AI 研究生命周期。该库让你的编程代理能够自主实现和执行 AI 研究实验,包括数据准备、模型训练、评估和部署。
项目简介
AI Research Skills 由 Orchestra Research 团队开发和维护,目前在 GitHub 上已获得 3.5K+ stars 和 284 forks。这个开源项目旨在为 AI 编程代理(如 Claude Code、Cursor、Codex、Gemini CLI)提供专业的 AI 研究工程能力。
项目的核心理念是:AI 研究人员花在调试基础设施上的时间比测试假设还多,这减慢了科学发现的速度。AI Research Skills 提供了一套全面的专家级研究工程技能,使 AI 代理能够自主实现和执行 AI 研究实验的各个阶段。
核心特性
- 83 个专业技能:覆盖 AI 研究的 20 个主要领域
- 质量优先:每个技能提供 200-500 行聚焦的、可操作的指导
- 多代理支持:支持 Claude Code、Cursor、Codex、Gemini CLI、Qwen Code 等主流 AI 编程代理
- 一键安装:通过 npm 包实现跨代理的统一安装体验
- 持续更新:由专业团队维护,定期添加新技能和更新文档
技术栈覆盖范围
20 个技能类别
| 类别 | 技能数 | 代表项目 |
|---|---|---|
| 模型架构 | 5 | LitGPT, Mamba, RWKV, NanoGPT, TorchTitan |
| 分词器 | 2 | HuggingFace Tokenizers, SentencePiece |
| 微调 | 4 | Axolotl, LLaMA-Factory, PEFT, Unsloth |
| 可解释性 | 4 | TransformerLens, SAELens, pyvene, nnsight |
| 数据处理 | 2 | Ray Data, NeMo Curator |
| 后训练 | 8 | TRL, GRPO, OpenRLHF, SimPO, verl, slime |
| 安全对齐 | 4 | Constitutional AI, LlamaGuard, NeMo Guardrails |
| 分布式训练 | 6 | DeepSpeed, FSDP, Megatron-Core, Accelerate |
| 基础设施 | 3 | Modal, SkyPilot, Lambda Labs |
| 优化 | 6 | Flash Attention, bitsandbytes, GPTQ, AWQ, GGUF |
| 评估 | 3 | lm-evaluation-harness, BigCode, NeMo Evaluator |
| 推理服务 | 4 | vLLM, TensorRT-LLM, llama.cpp, SGLang |
| MLOps | 3 | W&B, MLflow, TensorBoard |
| AI 代理 | 4 | LangChain, LlamaIndex, CrewAI, AutoGPT |
| RAG | 5 | Chroma, FAISS, Pinecone, Qdrant |
| 多模态 | 7 | CLIP, Whisper, LLaVA, Stable Diffusion, SAM |
| 提示工程 | 4 | DSPy, Instructor, Guidance, Outlines |
| 可观测性 | 2 | LangSmith, Phoenix |
| 新兴技术 | 6 | MoE, 模型合并, 长上下文, 蒸馏, 剪枝 |
| 论文写作 | 1 | LaTeX 模板, 引用验证 |
安装指南
前置要求
- Node.js >= 16
- npm 或 npx
快速安装
bash
# 交互式安装(推荐)
npx @orchestra-research/ai-research-skills安装程序会自动:
- 检测你已安装的 AI 编程代理
- 将技能安装到
~/.orchestra/skills/并创建符号链接 - 支持全部安装、快速入门包、按类别或单个技能安装
- 更新已安装的技能到最新版本
CLI 命令
bash
# 查看已安装技能
npx @orchestra-research/ai-research-skills list
# 更新已安装技能
npx @orchestra-research/ai-research-skills updateClaude Code Marketplace 安装
bash
# 添加市场
/plugin marketplace add orchestra-research/AI-research-SKILLs
# 按类别安装
/plugin install fine-tuning@ai-research-skills
/plugin install inference-serving@ai-research-skills
/plugin install distributed-training@ai-research-skills快速开始
安装后使用
- 安装技能到你的代理:运行安装命令后,技能会自动链接到你的 AI 编码代理
- 开始对话:直接向你的 AI 代理提问相关技术问题
- 获得专业指导:代理会基于安装的技能提供专业的代码示例和解决方案
示例用法
text
用户: 我需要用 Axolotl 微调 Llama 3
代理: [基于 Axolotl 技能提供 YAML 配置和训练命令]
用户: 如何用 vLLM 部署高吞吐量推理服务?
代理: [基于 vLLM 技能提供 PagedAttention 配置和部署方案]使用示例
场景 1:微调模型
bash
# 使用 Axolotl 进行微调
# YAML 配置示例
base_model: meta-llama/Llama-3-8B
model_type: LlamaForCausalLM
tokenizer_type: AutoTokenizer
load_in_8bit: true
adapter: qlora
lora_r: 32
lora_alpha: 16
datasets:
- path: your_dataset.jsonl
type: alpaca场景 2:分布式训练
python
# 使用 DeepSpeed ZeRO-3
from transformers import Trainer, TrainingArguments
training_args = TrainingArguments(
deepspeed="ds_config.json",
per_device_train_batch_size=1,
gradient_accumulation_steps=16,
)
trainer = Trainer(model=model, args=training_args)
trainer.train()场景 3:高性能推理
python
# 使用 vLLM 部署
from vllm import LLM, SamplingParams
llm = LLM(model="meta-llama/Llama-3-8B")
sampling_params = SamplingParams(temperature=0.7, top_p=0.9)
outputs = llm.generate(prompts, sampling_params)技能结构
每个技能遵循统一的格式:
text
skill-name/
├── SKILL.md # 快速参考(50-150 行)
├── references/ # 深度文档(300KB+)
│ ├── README.md # 官方文档
│ ├── api.md # API 参考
│ ├── tutorials.md # 教程指南
│ ├── issues.md # GitHub 问题解决方案
│ └── releases.md # 版本历史
├── scripts/ # 辅助脚本(可选)
└── assets/ # 模板和示例(可选)项目链接
- GitHub 仓库:https://github.com/Orchestra-Research/AI-research-SKILLs
- npm 包:@orchestra-research/ai-research-skills
- 官方网站:https://www.orchestra-research.com
- Slack 社区:加入讨论
- Twitter:@orch_research
分享: