Llama 4（原生多模态 + iRoPE + 超长上下文）

Meta 技术材料与社区报告 | 领读：Llama 4 paper-reading

要解决的问题

Meta 需在 开源权重 路线中同时推进：原生多模态（非事后拼接）、超长上下文（10M 级宣传窗口）与 MoE 效率，并与 Llama 3.x 生态平滑迁移。

术语	含义
iRoPE	改进 RoPE 外推，支持更长有效上下文
原生多模态	视觉-语言联合预训练，而非仅 LLM + 冻结 ViT 拼接
MoE 变体	Scout / Maverick 等不同专家规模面向边缘与云端
10M context	产品级窗口目标；实际任务仍受 Needle、衰减限制

学习路径

本页为 第八部分大纲摘要。型号表、许可与基准领读见 Llama 4 技术报告领读。

项	说明
权重版本	核对 Hugging Face revision 与 `config.json`
Chat template	与官方 tokenizer 模板一致，避免 silently truncate
思考模式	明确 API 字段（reasoning / think budget）
成本	测 prefill+decode $/1M tokens @ 典型并发
合规	许可、地域、日志留存策略

类型	入口
原始报告	见正文 arXiv / 官方博客链接
权重与配置	Hugging Face `config.json` 与 model card
深度领读	见上文 `:::tip` 或 tech-report 索引
工具链	附录 D　工具生态
术语	附录 B　术语表