GLM-5.2上线魔乐社区,1M无损上下文,长程任务开源SOTA
6月17日,智谱开源新一代旗舰模型GLM-5.2。在Artificial Analysis综合榜单上,GLM-5.2取得51分,位居全球前列,为开源模型SOTA。

在全球百万用户参与盲测的前端开发评估系统Code Arena上,GLM-5.2取得全球可用模型第一的表现。

GLM-5.2的线上推理依托多个国产算力平台,已在Day 0完成与为昇腾、平头哥、摩尔线程、寒武纪、昆仑芯、沐曦、海光、壁仞、天数智芯等国产算力平台的推理适配,在国产芯片集群上实现高吞吐、低延迟、大并发的稳定运行。
GLM-5.2已同步上线魔乐社区,欢迎开发者下载体验!
🔗 模型权重链接:
https://modelers.cn/models/zhipuai/GLM-5.2
https://modelers.cn/models/zhipuai/GLM-5.2-FP8
从2025初开始,智谱团队几乎投入全部力量攻关Coding,历时大半年,细扣每一个代码环境的优化,终于迎来代码基座GLM-4.5,年底的GLM-4.7已经成为效果最好的国产Coding模型。智谱团队不止于此,而是在通往AGI的路上不断突破。
今天GLM-5.2专为长程任务能力而生,全新特色包括:
- Solid 1M上下文,稳定支撑长程任务
- 更强体感,更实用的Coding能力
- 极致Infra优化,Day 0运行在国产算力平台
- MIT开源协议,无地域限制,技术平权无国界
1M上下文与长程任务
智谱团队花了几个月时间扩展1M Coding Agent的训练环境,覆盖自动化研究、性能优化等多个领域,使得GLM-5.2在1M上下文的solid表现有时甚至超过Opus(详见https://z.ai/blog/glm-5.2)。
1M上下文构成GLM-5.2的长程交付能力,多个长程任务基准表明GLM-5.2的表现介于Claude Opus 4.7与4.8之间,是排名最高的开源模型。在FrontierSWE(测试AI是否能够像软件工程师在数小时尺度上完成复杂技术项目的测试集)上仅比Opus 4.8低1%,超过GPT-5.5(1%)和Opus 4.7(11%);不过在SWE-Marathon(考察Agent自主完成超长软件工程的测试集)上确实还需要进一步提高,低于Opus 4.8不少(13%)。

在实际体验中,GLM-5.2完成开发、联调、测试到打包上线,完整交付一个覆盖Web、移动端与小程序的多端应用,累计处理88万tokens,几乎用满1M上下文窗口。过去,这样的大型工程需要一支团队协作数周,现在GLM-5.2能在一次长程任务中跑完。
Coding体感
GLM-5.2在前端、后端、长程任务上的成功率相比前一代GLM-5.1都有提升,复杂系统工程与深度调试更稳。在主流编程基准上,GLM-5.2保持开源SOTA,与Claude Opus 4.8处于可比区间。例如在Terminal-Bench 2.1(评测AI Agent完成不同类型的计算机终端任务),GLM-5.2比Opus 4.8低4%,相比GLM-5.1提升了17.5%;在MCP-Atlas(大规模工具调研评测的数据集),GLM-5.2比Opus 4.8低0.8%。

在模型发布前夕,智谱团队已提前向GLM Coding Plan用户全员开放,在数十万开发者的编程任务中,开发者反馈GLM-5.2的最大提升集中在:
- 项目级上下文承载更强,能把完整工程放进同一条推理链路里;
- 长程任务执行更稳定,复杂任务能持续推进,不容易中途跑偏;
- 生产级工程规范遵循更可靠,能守住团队研发流程里的硬约束;
- 客户端与移动端工程能力更扎实,不止写App,还能完成真机调试闭环。
GLM-5.2还引入了effort level(思考档位)控制,可以在能力、速度、成本之间做出平衡。在相近的token预算下,GLM-5.2的Coding能力大致位于Claude Opus 4.7与Claude Opus 4.8之间。

极致Infra优化
GLM-5.2的进步来自模型架构、推理系统和训练基础设施的协同设计。智谱团队提出IndexShare,在每四层稀疏注意力层之间复用同一个索引器(indexer),在1M上下文长度下,将单位token的FLOPs降低至2.9倍。此外,改进了用于投机解码(speculative decoding)的MTP层,将接受长度(acceptance length)最多提升20%。训练侧则依赖自研Slime框架支撑大规模Agentic RL和OPD训练。

随着GLM系列的持续迭代与调用量的快速增长,线上服务的稳定性与效率愈发关键。GLM-5.2的线上推理依托多个国产算力平台,已在Day 0完成与为昇腾、平头哥、摩尔线程、寒武纪、昆仑芯、沐曦、海光、壁仞、天数智芯等国产算力平台的推理适配,在国产芯片集群上实现高吞吐、低延迟、大并发的稳定运行。预计下半年昇腾 950 超节点上市后,也将成为GLM-5.2强劲的算力底座。
面向开发者与知识工作者
GLM-5.2能长时间自主推进更复杂、更长链路的任务,锁定高价值场景,这将改变开发者与知识工作者的工作方式。
GLM-5.2在大型重构工程上表现出色。有开发者用Rust从零再造了送人类登月的计算机,将当年65000行、一字未改的登月飞控程序移植为Rust,整个过程由Agent全自主走完。
通过智谱的Agent产品AutoClaw,GLM-5.2的1M上下文与长程任务能力服务于设计、法务等白领场景,例如一次性写出数十个原型页面,自主迭代和微调,在设计中保持品牌规范与一致性。
欢迎体验
GLM-5.2已同步上线魔乐社区,模型权重遵循最高权限MIT License,可自由下载、部署与商用。vLLM、SGLang、transformers等主流推理框架已经支持。
欢迎广大开发者下载体验 GLM-5.2!魔乐社区将陆续推出该模型适配国产算力平台的技术内容与行业动态,欢迎持续关注。
https://modelers.cn/models/zhipuai/GLM-5.2
鲲鹏昇腾开发者社区是面向全社会开放的“联接全球计算开发者,聚合华为+生态”的社区,内容涵盖鲲鹏、昇腾资源,帮助开发者快速获取所需的知识、经验、软件、工具、算力,支撑开发者易学、好用、成功,成为核心开发者。
更多推荐


所有评论(0)