跳到主要内容

附录 D 开源工具与框架生态地图

训练 → 对齐 → 推理 → 应用 → 评测 分层。链接以官方仓库为准(2025);选型时看 许可证、GPU 支持、社区活跃度

训练与分布式

工具用途
PyTorch基础框架
DeepSpeedZeRO、流水线、推理
Megatron-LM大规模 TP/PP
FSDPPyTorch 原生分片
NeMoNVIDIA 端到端
torchtitanMeta 预训练参考
AI2 OLMo全开放训练栈

微调与对齐

工具用途
Hugging Face TRLSFT、DPO、PPO
LLaMA-Factory一站式微调 UI
AxolotlYAML 驱动微调
Unsloth快速 LoRA
peftLoRA/Adapter 库
OpenRLHFRLHF 分布式
verlRL 训练(GRPO 等)

推理与服务

工具用途
vLLM生产级 LLM 服务、PagedAttention
SGLang结构化生成、RadixAttention
TensorRT-LLMNVIDIA 优化推理
llama.cppCPU/边缘 GGUF
ollama本地模型管理
TGIHF Text Generation Inference
litellm多 API 统一网关

量化与压缩

工具用途
bitsandbytes8/4bit 训练推理
GPTQ / AutoGPTQ权重量化
AWQ激活感知量化
GGUFllama.cpp 格式生态

数据与分词

工具用途
Hugging Face datasets数据加载
datatrove大规模清洗
sentencepiece分词训练
tiktokenBPE(OpenAI 风格)

Agent 与 RAG

工具用途
LangChain链式编排
LlamaIndex数据索引 RAG
Haystack企业 RAG
LangGraph有状态 Agent 图
Semantic Kernel微软 Agent SDK
OpenAI Agents SDK官方 Agent 框架

评测与监控

工具用途
lm-eval-harness标准基准套件
OpenCompass中文等多基准
EleutherAI eval harness研究评测
Weights & Biases实验跟踪
MLflow模型注册
Langfuse / PhoenixLLM 可观测

约束解码与格式

工具用途
Outlines结构化生成
guidance模板约束
json schema mode各 API 内置

选型建议(简)

场景推荐组合
研究微调HF + peft + TRL
生产 APIvLLM 或 SGLang + litellm
笔记本实验ollama + LLaMA-Factory
Agent MVPLangGraph + 自有评测集

相关章节

  • 分布式训练:3.5
  • 推理框架:5.6.1
  • 量化:5.3
  • 本仓库 Agent:docs/