跳到主要内容

附录 F 学习资源与社区

汇总 课程、博客、社区、中文资源,与大纲正文互补。链接需自行验证可用性。

官方文档与教程

资源说明
Hugging Face CourseTransformer、微调、RLHF
PyTorch Tutorials深度学习基础
DeepSpeed Docs分布式训练
vLLM Docs生产推理
OpenAI CookbookAPI、Agent 模式
Google Gemma Docs边缘与多模态

高质量博客与通讯

资源说明
Lil'Log (Lilian Weng)综述型(RL、Agent、扩散等)
Sebastian Raschka论文速读与实践
Hugging Face Blog工具与模型发布
Interconnects (Nathan Lambert)RLHF、对齐、工业观察
SemiAnalysis芯片与算力(系统视角)
Andrej Karpathy教育视频与 nanoGPT

论文聚合

资源说明
arXiv cs.CL / cs.LG预印本
Papers with Code基准与实现
Semantic Scholar引用图谱
本仓库 paper-reading中文领读
本仓库 weekly-paper周刊

社区与讨论

资源说明
Hugging Face Forums模型与工具
r/LocalLLaMA本地部署与量化
Latent Space Discord/Podcast工程师访谈
GitHub Trending开源模型发布
知乎 / 公众号中文解读(注意营销稿)

中文课程与书籍(选)

资源说明
斯坦福 CS324 / CS336(各年网页)基础模型系统
《动手学深度学习》深度学习入门
本站点 LLMs 大纲结构化中文笔记
本站点 Agent Handbook docsAgent 应用

会议(跟踪前沿)

会议方向
NeurIPS / ICML / ICLR机器学习综合
ACL / EMNLPNLP
COLM语言模型专会
OSDI / MLSys系统与推理

实践项目建议

  1. lm-eval 评测一个 7B 模型,提交可复现表格。
  2. vLLM 部署并压测 TTFT vs 并发
  3. 读一篇 tech-report 并写笔记到 paper-reading 风格。
  4. 实现 最小 Agent(3 工具 + 循环)+ 回归用例。

检查清单(自学 / 落地)

步骤动作
1阅读官方 primary source(报告、博客、模型卡)
2固定 prompt 与解码参数,在自有验证集上建基线
3记录延迟、成本、上下文长度与是否启用思考模式
4与相邻章节对照,画出与上下游模块的数据流
5paper-reading 或本大纲相关节做深度笔记

常见误区

误区澄清
公开基准 = 产品表现必须用业务端到端任务回归
长窗口 = 长理解需 Needle + 真实文档任务验证
单次实验可定论固定随机种子、数据版本与评测脚本

延伸练习

相关章节