Weekly Paper

Weekly Paper 是本站的每周论文精读栏目。每周整理在一篇独立 Markdown 中，本页作为总索引。

这个栏目到底为啥存在

先自报家门：我把自己设定成一个 AI Researcher。听起来很唬人，但真相是——论文每天像下饺子一样往 arXiv 上倒，而我的阅读速度大概和拨号上网时代的图片加载差不多。光靠"我有空再看"这种佛系誓言，最后的结局只有一个：收藏夹里躺着 999+ 篇"稍后再读"，而"稍后"永远不会来。

所以 Weekly Paper 的本质，是一台自我逼迫装置，目的有三：

用 deadline 倒逼自己学习：把"每周必须产出"写在明面上，相当于给未来的自己签了一份卖身契。读不懂也得硬着头皮读完、写完、发出来——拖延症最怕的就是公开打卡。
逼自己真的"读懂"，而不是"读过"：能把一篇论文讲清楚、写明白，才说明真的消化了。糊弄读者很容易，糊弄"要写下来"这件事很难。每写一篇，都是一次"假装懂 → 发现没懂 → 重新搞懂"的灵魂拷问。
把脑子里的东西全倒出来分享：与其让知识点在我脑子里慢慢长霉，不如趁热分享给同样在 arXiv 海里扑腾的同行。知识这玩意儿，藏着会贬值，讲出来反而越用越多——而且讲错了还有人帮我捉虫，简直血赚。

一句话总结这个栏目的座右铭：为了不让自己摆烂，只好当众读论文。 如果哪周更新断了，欢迎来催更，催得越狠越好。

栏目说明

更新节奏：每周整理 1～3 篇论文，侧重 Agent、LLM 训练对齐、推理、工具调用等方向。
组织方式：weekly-paper/ 下按周新建文档，如 第一周.md、第二周.md；在本页目录中追加链接即可。
命名规则：周文档不必写 title front matter；侧边栏会自动使用文档中的一级标题（# ...）。
笔记结构：论文信息 → 问题 → 方法 → 实验 → 个人理解 → 总结

与 Paper Reading 的区别

栏目	定位
Paper Reading	深度领读，单篇展开，含源码与细节分析
Weekly Paper	每周速览，聚焦当周热点与快速消化

周刊目录

周次	周期	主题
第一周	2025-05-26 ~ 2025-06-01	推理模型与 RL 激励长链推理

Weekly Paper

这个栏目到底为啥存在​

栏目说明​

与 Paper Reading 的区别​

周刊目录​

这个栏目到底为啥存在

栏目说明

与 Paper Reading 的区别

周刊目录