开源 LLM 技术报告
本栏目整理 2024–2026 年主流开源大模型技术报告 的结构化领读,并提供横向对比索引,便于从架构、训练、对齐、开源等维度快速对照不同路 线。
栏目定位
| 栏目 | 定位 |
|---|---|
| 本栏目(Tech Report) | 官方技术报告 / 模型卡的领读摘要 + 多模型横向对比 |
| Paper Reading · Agentic / RL | 学术方法与算法论文深度领读 |
| Weekly Paper | 每周论文速览 |
| LLMs 第八部分 | 按系列组织的系统学习大纲(占位章节,可与本栏交叉阅读) |
领读笔记目录
DeepSeek
| 笔记 | 主题 |
|---|---|
| DeepSeek-V2 | MLA + DeepSeekMoE,成本效率基座 |
| DeepSeek-V3 | 671B MoE、MTP、FP8 预训练 |
| DeepSeek-R1 | GRPO 纯 RL 激发推理 |
| DeepSeek-V4 | 1M 上下文、CSA+HCA、mHC |