ByteNoteByteNote

字节笔记本

2026年2月15日

AI Research Skills:83 个 AI 研究工程技能库,让你的 AI Agent 成为研究助手

API中转
¥120

AI Research Skills 是目前最全面的开源 AI 研究工程技能库,包含 83 个专业技能,覆盖从模型架构到部署的完整 AI 研究生命周期。该库让你的编程代理能够自主实现和执行 AI 研究实验,包括数据准备、模型训练、评估和部署。

项目简介

AI Research Skills 由 Orchestra Research 团队开发和维护,目前在 GitHub 上已获得 3.5K+ stars284 forks。这个开源项目旨在为 AI 编程代理(如 Claude Code、Cursor、Codex、Gemini CLI)提供专业的 AI 研究工程能力。

项目的核心理念是:AI 研究人员花在调试基础设施上的时间比测试假设还多,这减慢了科学发现的速度。AI Research Skills 提供了一套全面的专家级研究工程技能,使 AI 代理能够自主实现和执行 AI 研究实验的各个阶段。

核心特性

  • 83 个专业技能:覆盖 AI 研究的 20 个主要领域
  • 质量优先:每个技能提供 200-500 行聚焦的、可操作的指导
  • 多代理支持:支持 Claude Code、Cursor、Codex、Gemini CLI、Qwen Code 等主流 AI 编程代理
  • 一键安装:通过 npm 包实现跨代理的统一安装体验
  • 持续更新:由专业团队维护,定期添加新技能和更新文档

技术栈覆盖范围

20 个技能类别

类别技能数代表项目
模型架构5LitGPT, Mamba, RWKV, NanoGPT, TorchTitan
分词器2HuggingFace Tokenizers, SentencePiece
微调4Axolotl, LLaMA-Factory, PEFT, Unsloth
可解释性4TransformerLens, SAELens, pyvene, nnsight
数据处理2Ray Data, NeMo Curator
后训练8TRL, GRPO, OpenRLHF, SimPO, verl, slime
安全对齐4Constitutional AI, LlamaGuard, NeMo Guardrails
分布式训练6DeepSpeed, FSDP, Megatron-Core, Accelerate
基础设施3Modal, SkyPilot, Lambda Labs
优化6Flash Attention, bitsandbytes, GPTQ, AWQ, GGUF
评估3lm-evaluation-harness, BigCode, NeMo Evaluator
推理服务4vLLM, TensorRT-LLM, llama.cpp, SGLang
MLOps3W&B, MLflow, TensorBoard
AI 代理4LangChain, LlamaIndex, CrewAI, AutoGPT
RAG5Chroma, FAISS, Pinecone, Qdrant
多模态7CLIP, Whisper, LLaVA, Stable Diffusion, SAM
提示工程4DSPy, Instructor, Guidance, Outlines
可观测性2LangSmith, Phoenix
新兴技术6MoE, 模型合并, 长上下文, 蒸馏, 剪枝
论文写作1LaTeX 模板, 引用验证

安装指南

前置要求

  • Node.js >= 16
  • npm 或 npx

快速安装

bash
# 交互式安装(推荐)
npx @orchestra-research/ai-research-skills

安装程序会自动:

  • 检测你已安装的 AI 编程代理
  • 将技能安装到 ~/.orchestra/skills/ 并创建符号链接
  • 支持全部安装、快速入门包、按类别或单个技能安装
  • 更新已安装的技能到最新版本

CLI 命令

bash
# 查看已安装技能
npx @orchestra-research/ai-research-skills list

# 更新已安装技能
npx @orchestra-research/ai-research-skills update

Claude Code Marketplace 安装

bash
# 添加市场
/plugin marketplace add orchestra-research/AI-research-SKILLs

# 按类别安装
/plugin install fine-tuning@ai-research-skills
/plugin install inference-serving@ai-research-skills
/plugin install distributed-training@ai-research-skills

快速开始

安装后使用

  1. 安装技能到你的代理:运行安装命令后,技能会自动链接到你的 AI 编码代理
  2. 开始对话:直接向你的 AI 代理提问相关技术问题
  3. 获得专业指导:代理会基于安装的技能提供专业的代码示例和解决方案

示例用法

text
用户: 我需要用 Axolotl 微调 Llama 3
代理: [基于 Axolotl 技能提供 YAML 配置和训练命令]

用户: 如何用 vLLM 部署高吞吐量推理服务?
代理: [基于 vLLM 技能提供 PagedAttention 配置和部署方案]

使用示例

场景 1:微调模型

bash
# 使用 Axolotl 进行微调
# YAML 配置示例
base_model: meta-llama/Llama-3-8B
model_type: LlamaForCausalLM
tokenizer_type: AutoTokenizer

load_in_8bit: true
adapter: qlora
lora_r: 32
lora_alpha: 16

datasets:
  - path: your_dataset.jsonl
    type: alpaca

场景 2:分布式训练

python
# 使用 DeepSpeed ZeRO-3
from transformers import Trainer, TrainingArguments

training_args = TrainingArguments(
    deepspeed="ds_config.json",
    per_device_train_batch_size=1,
    gradient_accumulation_steps=16,
)

trainer = Trainer(model=model, args=training_args)
trainer.train()

场景 3:高性能推理

python
# 使用 vLLM 部署
from vllm import LLM, SamplingParams

llm = LLM(model="meta-llama/Llama-3-8B")
sampling_params = SamplingParams(temperature=0.7, top_p=0.9)

outputs = llm.generate(prompts, sampling_params)

技能结构

每个技能遵循统一的格式:

text
skill-name/
├── SKILL.md          # 快速参考(50-150 行)
├── references/       # 深度文档(300KB+)
│   ├── README.md     # 官方文档
│   ├── api.md        # API 参考
│   ├── tutorials.md  # 教程指南
│   ├── issues.md     # GitHub 问题解决方案
│   └── releases.md   # 版本历史
├── scripts/          # 辅助脚本(可选)
└── assets/           # 模板和示例(可选)

项目链接

分享: