GLM-5.2上线魔乐社区,1M无损上下文,长程任务开源SOTA
6月17日智谱开源新一代旗舰模型GLM-5.2。在Artificial Analysis综合榜单上GLM-5.2取得51分位居全球前列为开源模型SOTA。在全球百万用户参与盲测的前端开发评估系统Code Arena上GLM-5.2取得全球可用模型第一的表现。GLM-5.2的线上推理依托多个国产算力平台已在Day 0完成与为昇腾、平头哥、摩尔线程、寒武纪、昆仑芯、沐曦、海光、壁仞、天数智芯等国产算力平台的推理适配在国产芯片集群上实现高吞吐、低延迟、大并发的稳定运行。GLM-5.2已同步上线魔乐社区欢迎开发者下载体验 模型权重链接https://modelers.cn/models/zhipuai/GLM-5.2https://modelers.cn/models/zhipuai/GLM-5.2-FP8从2025初开始智谱团队几乎投入全部力量攻关Coding历时大半年细扣每一个代码环境的优化终于迎来代码基座GLM-4.5年底的GLM-4.7已经成为效果最好的国产Coding模型。智谱团队不止于此而是在通往AGI的路上不断突破。今天GLM-5.2专为长程任务能力而生全新特色包括Solid 1M上下文稳定支撑长程任务更强体感更实用的Coding能力极致Infra优化Day 0运行在国产算力平台MIT开源协议无地域限制技术平权无国界1M上下文与长程任务智谱团队花了几个月时间扩展1M Coding Agent的训练环境覆盖自动化研究、性能优化等多个领域使得GLM-5.2在1M上下文的solid表现有时甚至超过Opus详见https://z.ai/blog/glm-5.2。1M上下文构成GLM-5.2的长程交付能力多个长程任务基准表明GLM-5.2的表现介于Claude Opus 4.7与4.8之间是排名最高的开源模型。在FrontierSWE测试AI是否能够像软件工程师在数小时尺度上完成复杂技术项目的测试集上仅比Opus 4.8低1%超过GPT-5.51%和Opus 4.711%不过在SWE-Marathon考察Agent自主完成超长软件工程的测试集上确实还需要进一步提高低于Opus 4.8不少13%。在实际体验中GLM-5.2完成开发、联调、测试到打包上线完整交付一个覆盖Web、移动端与小程序的多端应用累计处理88万tokens几乎用满1M上下文窗口。过去这样的大型工程需要一支团队协作数周现在GLM-5.2能在一次长程任务中跑完。Coding体感GLM-5.2在前端、后端、长程任务上的成功率相比前一代GLM-5.1都有提升复杂系统工程与深度调试更稳。在主流编程基准上GLM-5.2保持开源SOTA与Claude Opus 4.8处于可比区间。例如在Terminal-Bench 2.1评测AI Agent完成不同类型的计算机终端任务GLM-5.2比Opus 4.8低4%相比GLM-5.1提升了17.5%在MCP-Atlas大规模工具调研评测的数据集GLM-5.2比Opus 4.8低0.8%。在模型发布前夕智谱团队已提前向GLM Coding Plan用户全员开放在数十万开发者的编程任务中开发者反馈GLM-5.2的最大提升集中在项目级上下文承载更强能把完整工程放进同一条推理链路里长程任务执行更稳定复杂任务能持续推进不容易中途跑偏生产级工程规范遵循更可靠能守住团队研发流程里的硬约束客户端与移动端工程能力更扎实不止写App还能完成真机调试闭环。GLM-5.2还引入了effort level思考档位控制可以在能力、速度、成本之间做出平衡。在相近的token预算下GLM-5.2的Coding能力大致位于Claude Opus 4.7与Claude Opus 4.8之间。极致Infra优化GLM-5.2的进步来自模型架构、推理系统和训练基础设施的协同设计。智谱团队提出IndexShare在每四层稀疏注意力层之间复用同一个索引器indexer在1M上下文长度下将单位token的FLOPs降低至2.9倍。此外改进了用于投机解码speculative decoding的MTP层将接受长度acceptance length最多提升20%。训练侧则依赖自研Slime框架支撑大规模Agentic RL和OPD训练。随着GLM系列的持续迭代与调用量的快速增长线上服务的稳定性与效率愈发关键。GLM-5.2的线上推理依托多个国产算力平台已在Day 0完成与为昇腾、平头哥、摩尔线程、寒武纪、昆仑芯、沐曦、海光、壁仞、天数智芯等国产算力平台的推理适配在国产芯片集群上实现高吞吐、低延迟、大并发的稳定运行。预计下半年昇腾 950 超节点上市后也将成为GLM-5.2强劲的算力底座。面向开发者与知识工作者GLM-5.2能长时间自主推进更复杂、更长链路的任务锁定高价值场景这将改变开发者与知识工作者的工作方式。GLM-5.2在大型重构工程上表现出色。有开发者用Rust从零再造了送人类登月的计算机将当年65000行、一字未改的登月飞控程序移植为Rust整个过程由Agent全自主走完。通过智谱的Agent产品AutoClawGLM-5.2的1M上下文与长程任务能力服务于设计、法务等白领场景例如一次性写出数十个原型页面自主迭代和微调在设计中保持品牌规范与一致性。欢迎体验GLM-5.2已同步上线魔乐社区模型权重遵循最高权限MIT License可自由下载、部署与商用。vLLM、SGLang、transformers等主流推理框架已经支持。欢迎广大开发者下载体验 GLM-5.2魔乐社区将陆续推出该模型适配国产算力平台的技术内容与行业动态欢迎持续关注。https://modelers.cn/models/zhipuai/GLM-5.2

相关新闻