跳到主要内容

Weekly Paper

Weekly Paper 是本站的每周论文精读栏目。每周整理在一篇独立 Markdown 中,本页作为总索引。

这个栏目到底为啥存在

先自报家门:我把自己设定成一个 AI Researcher。听起来很唬人,但真相是——论文每天像下饺子一样往 arXiv 上倒,而我的阅读速度大概和拨号上网时代的图片加载差不多。光靠"我有空再看"这种佛系誓言,最后的结局只有一个:收藏夹里躺着 999+ 篇"稍后再读",而"稍后"永远不会来。

所以 Weekly Paper 的本质,是一台自我逼迫装置,目的有三:

  • 用 deadline 倒逼自己学习:把"每周必须产出"写在明面上,相当于给未来的自己签了一份卖身契。读不懂也得硬着头皮读完、写完、发出来——拖延症最怕的就是公开打卡。
  • 逼自己真的"读懂",而不是"读过":能把一篇论文讲清楚、写明白,才说明真的消化了。糊弄读者很容易,糊弄"要写下来"这件事很难。每写一篇,都是一次"假装懂 → 发现没懂 → 重新搞懂"的灵魂拷问。
  • 把脑子里的东西全倒出来分享:与其让知识点在我脑子里慢慢长霉,不如趁热分享给同样在 arXiv 海里扑腾的同行。知识这玩意儿,藏着会贬值,讲出来反而越用越多——而且讲错了还有人帮我捉虫,简直血赚。

一句话总结这个栏目的座右铭:为了不让自己摆烂,只好当众读论文。 如果哪周更新断了,欢迎来催更,催得越狠越好。

栏目说明

  • 更新节奏:每周整理 1~3 篇论文,侧重 Agent、LLM 训练对齐、推理、工具调用等方向。
  • 组织方式weekly-paper/ 下按周新建文档,如 第一周.md第二周.md;在本页目录中追加链接即可。
  • 命名规则:周文档不必写 title front matter;侧边栏会自动使用文档中的一级标题(# ...)。
  • 笔记结构:论文信息 → 问题 → 方法 → 实验 → 个人理解 → 总结

与 Paper Reading 的区别

栏目定位
Paper Reading深度领读,单篇展开,含源码与细节分析
Weekly Paper每周速览,聚焦当周热点与快速消化

周刊目录

周次周期主题
第一周2025-05-26 ~ 2025-06-01推理模型与 RL 激励长链推理