GLM-5.2 是智谱 AI 于2026 年 6 月 13 日正式发布的旗舰文本代码大模型,6 月 15 日港交所公告确认,定位为智谱目前最强开源模型,主打百万超长上下文与顶级工程编程能力。

(图源网络,侵删)
2026 年 6 月 13 日,智谱 AI 正式推出 GLM 系列迭代新作GLM-5.2,并同步面向全层级 GLM Coding Plan 用户开放调用权限,港交所公告同步确认产品上线信息。作为智谱现阶段综合实力最强的开源文本代码大模型,它凭借百万级超长上下文、断层领先的工程编程能力、长效自主 Agent 运行能力,站稳国产代码大模型第一梯队,性能对标海外 GPT-5.5、Claude Opus 4.8 顶级闭源模型。
744B MoE 高效混合专家底座

(图源网络,侵删)
GLM-5.2 延续 GLM-5 全系成熟稀疏 MoE 混合专家架构,核心硬件参数清晰平衡性能与推理成本:
1、参数配置
模型总规模 744B,单次推理仅激活 40B 参数,区别于稠密大模型全程满载运算;海量专家参数储备充足知识储备,小体量激活量压低算力消耗、提升生成速度。
2、训练数据基底
整体训练数据集达 28.5 万亿 Token,数据截止 2025 年 11 月,聚焦纯文本与代码双模态,暂未开放图像、音视频多模态输入输出能力,所有算力资源倾斜供给文字逻辑与工程代码训练。
3、推理速度优化
标准生成速度稳定维持 400–500 Token / 秒,对比前代 GLM-5.1 高速版本提速 25% 以上,大仓库批量解析、长文档通读场景稳定性大幅升级。
100 万 Token 真实可用超长上下文
这是 GLM-5.2 最标志性的突破,上下文窗口从前代 GLM-5.1 的 20 万 Token 直接扩容 5 倍至100 万 Token(1M),官方着重强调并非纸面虚标参数,全部经过真实业务工程验证:
可一次性完整载入完整开源代码仓库,直接完成全局代码重构、跨千份文件 BUG 排查、全栈项目从零搭建;
实测可一次性解析 74 万条服务器运行日志,自主定位故障根因;同时支持四份长篇商业合同同步比对、识别条款冲突差异;
单次最大输出上限 131072 Token,长方案、完整工程代码、万字技术白皮书可一次性输出,无需分段截断对话。
算力部署小贴士

一些开源大模型对 GPU 显存、集群调度有一定硬件门槛,但这并不意味着个人与中小企业需自建机房硬扛投入。
算家云依托东数西算贵安枢纽算力集群,预装适配 GLM 全系模型的优化镜像,提供 A100、RTX4090/5090 等多规格 GPU 弹性租赁,容器化一键部署推理、微调环境,异构算力统一调度,价格低至市场均价五成,支持按量、包月灵活计费,大幅降低部署开源大模型的硬件与运维成本,一键部署,快捷启用。
双档位深度思考模式
GLM-5.2 新增两套可手动切换的推理强度档位,摒弃单一固定推理逻辑,用户按需调配速度与精准度:
1、Max 极限思考档(编程 / 复杂工程首选)
启动深度长时序推理推演,逻辑校验严密、代码漏洞少、长周期任务交付完整性最高;适配大型软件开发、系统架构设计、海量日志分析、多文档交叉论证等高难度场景,也是冲击全球代码评测榜单的默认档位。
2、High 平衡档位
平衡响应速度与输出质量,日常文案撰写、问答咨询、中小型脚本开发、常规工具调用均可使用,兼顾效率与正确率,适合高频轻量化工作流。
模型取消低速极简快速档位,整体产品定位偏向严谨生产力工具,优先保障输出可靠性而非极致响应速度。
国产断层领先的编程与 Agent 能力
编程能力是 GLM-5.2 的核心护城河,多项权威评测交出顶尖成绩单:
1、第三方权威跑分
LLM Benchmark Code V3 全球综合排名第三,仅落后 GPT-5.5、Claude Opus 4.8;5 大主流工程场景中拿下 Flutter、Web 前端、游戏开发三项 A 档最高评级,前代 GLM-5.1 无法全覆盖该梯度工程需求,国产模型内拉开明显代差。
2、长效自主 Agent 迭代
自主连续稳定工作时长从 5.1 版本 8 小时提升至 12 小时以上,可自主完成多轮代码调试、环境部署、测试迭代、报错修复全闭环;工具调用、JSON 结构化输出实测通过率接近 100%,原生兼容 Claude Code、Cline、OpenCode 等 8 款主流 AI 编程 Agent 框架,迁移适配成本极低。
3、低幻觉工程表现
内测开发者反馈,十万行级监控项目排错、官网转小程序全流程开发场景,代码思路、逻辑完整度对标 Opus 4.8,仅纯推理速度受硬件算力影响存在小幅差距,代码可复用率高、冗余错误少,大幅减少人工二次修改工作量。
GLM-5 三代迭代对比
|
模型版本 |
发布时间 |
上下文窗口 |
核心迭代差异 |
|---|---|---|---|
|
GLM-5 |
2026.02 |
128K |
初代 744B MoE 旗舰,奠定代码 Agent 基础能力 |
|
GLM-5.1 |
2026.04 |
200K |
8 小时 Agent 自治,代码跑分超越 GPT-5.4 |
|
GLM-5.2 |
2026.06 |
1000K |
百万真实长上下文、双思考档位、工程能力对标海外顶级闭源模型 |
写在最后
GLM-5.2 是国产开源大模型一次关键性跨越,打破海外顶级闭源模型在高端工程编程领域的垄断格局,百万级可用上下文、成熟 MoE 高效架构、宽松商用开源协议三重优势叠加,让中小开发者与企业真正能用、用得起顶尖 AI 生产力模型。随着开源权重开放,搭配高性价比弹性算力底座,国内 AI 工程化落地速度将迎来新一轮提速。
174

被折叠的 条评论
为什么被折叠?



