Gemma 2 / Gemma 3:Google 开源多模态
报告信息
| 项目 | 内容 |
|---|---|
| 机构 | Google DeepMind |
| 发布 | Gemma 2(2024)、Gemma 3(2025) |
| 规格 | 1B–27B+;Gemma 3 强调多模态与设备端 |
| 官方资料 | Gemma 官网、Hugging Face google/gemma |
| 许可 | Gemma 使用条款 |
定位与问题
在 Gemini 闭源产品之外,Google 通过 Gemma 提供 可微调、可端侧部署 的开源权重;Gemma 3 进一步统一 文本+图像+多分辨率,对标开源多模态与「思考」模型趋势。
架构要点
Gemma 2
- 稠密架构,知识蒸馏自更大 Gemini 系教师。
- 2B/9B/27B 等尺寸,强调安全与效率。
Gemma 3
- 多模态输入(图像+文本),改进长上下文与多语言。
- 提供 思考(Thinking) 变体,对齐推理模型潮流。
- 设备端与边缘场景优化。