开放问题与研究方向
要解决的问题
尽管工业界产品日新月异,基础研究问题 大量未闭。列出供 选题、论文、创业技术壁垒 参考的方向(2025–2026)。
数据与预训练
| 问题 | 简述 |
|---|---|
| 数据墙 | 高质量文本是否即将耗尽?合成数据比例上限? |
| Scaling 是否放缓 | Chinchilla 之后最优分配是否随 MoE/推理变化? |
| 多语言低资源 | 119 语言宣称 vs 实际质量均衡 |
| 版权与合规 | 训练数据授权对开源的影响 |
架构
- 稀疏 vs 稠密 长期谁主导?DSA、Mamba、混合的最终份额?
- 统一多模态 是否一个 Transformer 吃掉全部模态?
- 可解释电路 能否定位 真实算法 而非探针故事?
对齐与安全
- 可扩展 oversight:超强模型谁来判断对齐?
- 可证明安全 是否可能,还是永远 概率缓解?
- 多目标对齐:有用 vs 无害 vs 诚实的 Pareto 前沿
推理与 Agent
- 测试时 compute 最优分配:何时思考、何时停?
- PRM vs ORM 何者更可扩展?(见 6.2.3)
- Agent 评测 如何防 环境泄漏 与 过拟合工具?
评测科学
- 动态基准(定期换新题)vs 静态榜。
- 污染检测 自动化可信度。
- 经济任务 基准(真实工单、客服)。