跳到主要内容

GLM-4 家族:ChatGLM 技术报告

报告信息

项目内容
机构智谱 AI / 清华 KEG 等
发布2024 年(ChatGLM 家族技术报告)
代表产品GLM-4 API、GLM-4-9B 开源系列(128K / 1M)
官方报告arXiv:2406.12793
权重Hugging Face THUDMzai-org

定位与问题

在 ChatGLM-6B/2/3 积累的中文对话生态上,GLM-4 面向 通用对话、工具调用、长上下文 升级,并通过 9B 开源 降低部署门槛,与 Llama 3、Qwen2 等同期开源模型竞争。

架构要点

  • GLM 架构:自回归空白填充(AutoRegressive Blank Infilling)传统,在 4 代继续优化中英双语与对话模板。
  • 长上下文:API 版 128K;开源 9B 提供 128K 与 1M 上下文变体(工程优化为主)。
  • GLM-4 All Tools:智能体版本,集成浏览器、代码解释器等工具编排。

训练与数据

  • 预训练与对齐细节在报告中分阶段描述,强调 中文、工具、多轮对话 数据。
  • 9B 系列将旗舰能力 蒸馏/压缩 到小模型,便于端侧与二次开发。

后训练与推理

  • SFT + 人类偏好对齐;All Tools 强化 Agent 工作流
  • 工具调用与 Function Call 场景是产品差异化之一。

关键结论

  • 报告系统总结 ChatGLM 1–4 演进与评测,9B 开源在中文、代码等场景具备竞争力。
  • 为后续 GLM-4.5 MoE(ARC) 奠定品牌与工具生态。

个人理解

读 GLM-4 家族宜与 Qwen2.5、DeepSeek-V2 同期对照:三家都在 2024 下半年把「长上下文 + 工具」做成标配;4.5 才是 MoE 与 ARC 的主战场。

总结

GLM-4 家族报告 = 智谱 对话栈总览 + 9B 开源抓手;Agent 能力在 All Tools,规模能力在 4.5 续作。

参考链接