GLM-5 开源：从代码到工程， Agentic Engineering 时代最好的开源模型

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

• 请不要在回答技术问题时复制粘贴 AI 生成的内容

今天，我们上线并开源 GLM-5 。

学界与业界正逐渐形成一种共识，大模型从写代码、写前端，进化到写工程、完成大任务，即从“Vibe Coding”变革为“Agentic Engineering”。

GLM-5 正是这一变革的产物：在 Coding 与 Agent 能力上，取得开源 SOTA 表现，在真实编程场景的使用体感逼近 Claude Opus 4.5 ，擅长复杂系统工程与长程 Agent 任务。

在全球权威的 Artificial Analysis 榜单中，GLM-5 位居全球第四、开源第一。

更大基座，更强智能

GLM-5 全新基座为从“写代码”到“写工程”的能力演进提供了坚实基础：

参数规模扩展：从 355B （激活 32B ）扩展至 744B （激活 40B ），预训练数据从 23T 提升至 28.5T ，更大规模的预训练算力显著提升了模型的通用智能水平。
异步强化学习：构建全新的“Slime”框架，支持更大模型规模及更复杂的强化学习任务，提升强化学习后训练流程效率；提出异步智能体强化学习算法，使模型能够持续从长程交互中学习，充分激发预训练模型的潜力。
稀疏注意力机制：首次集成 DeepSeek Sparse Attention ，在维持长文本效果无损的同时，大幅降低模型部署成本，提升 Token Efficiency 。

Coding 能力：对齐 Claude Opus 4.5

GLM-5 在编程能力上实现了对 Claude Opus 4.5 的对齐，在业内公认的主流基准测试中取得开源模型 SOTA 分数。在 SWE-bench-Verified 和 Terminal Bench 2.0 中分别获得 77.8 和 56.2 的开源模型 SOTA 分数，性能超过 Gemini 3 Pro 。

2026 年，大模型需要从“会写”走到“会完成”，尤其是端到端完成大型任务。GLM-5 是一个“系统架构师”，它不仅为开发精美的 Demo 而生，更为稳定交付生产结果而生。

在内部 Claude Code 评估集合中，GLM-5 在前端、后端、长程任务等编程开发任务上显著超越 GLM-4.7 （平均增幅超过 20%），能够以极少的人工干预自主完成 Agentic 长程规划与执行、后端重构和深度调试等系统工程任务，使用体感逼近 Opus 4.5 。

Agent 能力：SOTA 级长程任务执行

GLM-5 在 Agent 能力上实现开源 SOTA ，在多个评测基准中取得开源第一：在 BrowseComp （联网检索与信息理解）、MCP-Atlas （工具调用和多步骤任务执行）和 τ²-Bench （复杂多工具场景下的规划和执行）均取得最佳表现。

在衡量模型经营能力的 Vending Bench 2 中，GLM-5 获得开源模型第一的表现。Vending Bench 2 要求模型在一年期内经营一个模拟的自动售货机业务，GLM-5 最终账户余额达到 4432 美元，经营表现接近 Claude Opus 4.5 ，展现了出色的长期规划和资源管理能力。

这些能力是 Agentic Engineering 的核心：模型不仅要能写代码、完成工程，还要能在长程任务中保持目标一致性、进行资源管理、处理多步骤依赖关系，成为真正的 Agentic Ready 基座模型。

国产芯片支持线上推理集群

GLM 系列模型受到全球开发者喜爱，在 GLM Coding Plan 全球爆量后，我们不得不启动限售活动。本次 GLM-5 的上线依托众多国产芯片有力保障了线上服务的稳定和高效。

目前，GLM-5 已完成与华为昇腾、摩尔线程、寒武纪、昆仑芯、沐曦、燧原、海光等国产算力平台的深度推理适配。通过底层算子优化与硬件加速，GLM-5 在国产芯片集群上已经实现高吞吐、低延迟的稳定运行。

Agentic Engineering 典型场景

点击或在浏览器输入：showcase.z.ai，即可查看所有案例。

开源与使用方式

即日起，GLM-5 在 Hugging Face 与 ModelScope 平台同步开源，模型权重遵循 MIT License 。

GLM-5 已经纳入 Max 用户套餐，Pro 将尽快在 5 天内支持，接下来我们将逐步扩大范围，尽力让更多用户体验并使用 GLM-5 。GLM Coding Plan 支持 Claude Code 、OpenCode 等主流开发工具。

GLM Coding Plan 同步升级 Agentic Engineering 体验：

官方适配 OpenClaw：仅需简单几步即可完成配置，快速开启 Agent 工作流；
Pro / Max 用户限量赠送 AutoGLM-OpenClaw：支持将云端个人 AI 助手接入飞书，实现办公场景的长任务执行；
新增 GLM in Excel 权益：原生适配 Excel 环境的 AI 插件，支持在侧边栏以自然语言交互，深度赋能数据处理与表格工作流（ Beta 期仅 Max 用户可享套餐抵扣）。

93 条回复 • 2026-02-15 02:57:55 +08:00

shakaraka

PRO

2 月 12 日

试用套餐有不

shakaraka

PRO

2 月 12 日

code plan 的试用 GLM-5 的

Tink

PRO

2 月 12 日 via Android

lite 和 pro 都不支持

donggua997

2 月 12 日

比参数没输过，实际体验没赢过。

enano

2 月 12 日

开了 lite 像路边一条

whbbxw

2 月 12 日

你们自己用自己的模型吗？ 4.6 和 5.3 也参与一下测试吧。

donggua997

2 月 12 日

你真的确定配与 gpt 、gemini 、claude 放一起比吗？？？

mashimaroinfo1

2 月 12 日

篇幅好长, 能力几何?

opeth

2 月 12 日

先看看隔壁帖子对你们 coding plan 的背刺的吐槽吧

hugodotlau

2 月 12 日

来吹半天都没点福利抽奖么？这广告真白看了

zhuangpipi

2 月 12 日

不涨价还想购入，涨价确实性价比比较低了

qaq13037

2 月 12 日

跑分嘎嘎猛，实际用起来差很多

iorilu

2 月 12 日

我一直奇怪, 100 多可以上车正规的 google one 会员, 用 antigravity 不比这个强, 更别说谷歌还有很多其他 ai 服务?

flowerwow0316

2 月 12 日 via Android

你说是就是了

Muninn

2 月 12 日

现在这个价格完全没有竞争力了。更何况口碑已经完全坏了，超卖，水军营销，限速，降智，随意修改订阅协议，毫无诚信，吃相难看。

ProphetN

2 月 12 日

吃相太难看了，国产模型商永久拉黑这家吧。

iden

2 月 12 日

...评论哪儿来的那么大偏见。刷分不都是闭源模型常见的操作吗？
众所周知开源模型刷分风险更低，也能被吐槽高分低能？

tlerbao

2 月 12 日

吹你家死牛逼

Plutooo

2 月 12 日

是蒸馏模型吗

felixcode

2 月 12 日

用起来怎么样，能不能和 gpt 和 opus 比，自己心里没数吗？

phrack

2 月 12 日

虽然不咋样收费还贵

但是开源我就喜欢，等显存便宜了 1TB 我也买得起的时候本地试试

mogutouer

2 月 12 日

4.5 都废了，你怎么不对比同时代的 opus 4.6 ？

Dream4U

2 月 12 日

蒸馏对齐

jqknono

2 月 12 日

从 300B 涨到 700B, 涨价还算合理吧, 重要的是模型效果.

unifly

2 月 12 日

咋一个个都这么大戾气，不会是跟贴机器人吧，凡是跟老美有竞争的，网上舆论没有不被骂的……嘿嘿

felixcode

2 月 13 日

@bridgemindai
BridgeMind 发的测评和榜单，就这还在这腆着脸吹？

kneo

2 月 13 日 via Android

多个选择总是好的，没必要喷这么狠吧。我在 hackernews 上经常看老外盛赞中国开源模型，说现想跑本地大模型只能靠中国的开源模型。虽然比不上闭源模型，但只要和自己比是在进步，对他们来说就是个好消息。

longxk

2 月 13 日 via Android

LITE 套餐我明明记得之前写着支持最新模型，结果现在偷偷改成支持历史模型，这种毫无诚信可言的公司的产品也必然是注水严重。

jokcylou

2 月 13 日 via Android

@kneo v 站站不起来的人可太多了，不会念国产一点点好的，国产往死里挑刺国外往死里舔，老传统了

maolon

2 月 13 日

@unifly 你自己搜下他们最近干了啥就知道为什么骂了，看样子割韭菜没割到你头上说话就是轻松，啥事都来个什么大国叙事 smh

securityCoding

2 月 13 日 via Android

@maolon 宏大叙事的基本没脑子🤣，付费用户条款随意改不喷留着过年

maolon

2 月 13 日

@securityCoding 还真是留着过年 😂，过年前都要给用户添波堵你们智谱是有水平的

8e47e42

2 月 13 日

@jokcylou Yes this - 我是真的看不懂，但凡人有护照也不至于这样

ckzx

2 月 13 日

这就是一家骗子公司。。我也上当买了 LITE 。当时也写了支持最新的。

gux928

2 月 13 日 via iPhone

我也买了 lite 。让子弹飞两天看看。

AlexHsu

2 月 13 日

不如 minimax2.5

FH0

2 月 13 日

之前开过你们家的 Max 套餐，GLM 4.7 的速度很慢

EasonYan

2 月 13 日

Lite 套餐不让用。不过无所谓，4.7 都慢得没法用，就算让用 5 也不想用了。

EeveeRibbon

2 月 13 日

@unifly #25 GLM4.6 我是真掏钱用过的，还好没买年费，从此以后我不信任 GLM 的任何模型了

MaxwellX

2 月 13 日

之前买了 lite 的协议是给更新最新版模型的,现在又不给更新了,还经常来这里打广告,败好感啊

secretbytes

2 月 13 日

怎么感觉有点像某个手机品牌，都是参数如何如何牛逼，跑分如何如何，等你买回去了，就会发现一坨。要是你说它不好，还有人出来说它才多少钱啊，你拿它跟 XXX 比

felixcode

2 月 13 日

不好好做产品只知道吹的，不管产品质量只顾吹国产的，非蠢即坏。

LunarEcho24

2 月 13 日

吹的有点过了

zxjxzj9

2 月 13 日

@unifly 我看用过 GLM 的就没有不骂的，怎么都是国产 minimax 和 qwen 还有 kimi 好评就很多呢？尤其是 minimax ，人家股价也高说明真金白银看好，只不过没有那么多宣传罢了。

crackidz

2 月 13 日

@secretbytes

你这样说发烧手机可就急眼了

justdoit123

2 月 13 日

试用了下，响应真的太慢了啊，这个真的有点不能忍。是不是试用套餐的缘故？

gouLang

2 月 13 日

2.12 号买的 lite 还增加了周限额, 5 小时限额里跑满, 就是周限额的 20%, 也就是说一周只能跑 25 个小时, 平均每天只能跑满 5 个小时的量, 这能用来工作? 年费还升价了这么多, 太痛了

manwhatcanisay

2 月 13 日

广告帖为什么不放在“推广" 这又不是隔壁，没有“国产替代”

2 月 13 日

GLM-5 和 minimax2.5 比较，当然是 GLM-5 胜出，两个都多用过几次就知道

xiangqiankan

2 月 13 日

GLM5 不错的我已经把我的主力模型从 gemini3pro 切换成了 glm5

hihanley

2 月 13 日

该骂，超卖，水军营销，限速，降智，随意修改订阅协议，毫无诚信，吃相难看

cat9life

2 月 13 日

这个帖子我今天在不同地方看到多次了

namonai

2 月 13 日

@jokcylou 你先出点真金白银买个订阅再看看？不好用就是不好用，和是不是国产的有什么关系？国产是免死金牌？招笑，幼稚

PersueYan

2 月 13 日

@iorilu 家庭订阅吗？

jimrok

2 月 13 日

编程这个赛道广告是没有用的，一个程序员只有本科生水平，嘴巴叫的再大声自己厉害，也不会有公司给你一个博士生的薪水。

unifly

2 月 13 日

@namonai 估计你自己就是国产的吧，哈哈，是不是感到很沮丧？

Nexora

2 月 13 日

这是来找网暴的吗

wojiugaiming

2 月 13 日 via Android

我用了，推荐大家使用，真的很好用。使用效果图如下： https://imgur.com/a/S6nS8zk

wojiugaiming

2 月 13 日 via Android

@wojiugaiming 好像回帖不显示图片，我再补充一下

namonai

2 月 13 日

@unifly 是的，花了钱买了垃圾。那又如何？总比你这种根本没有回复你、却主动凑上来挨骂的人来得好。连钱都没花、用都没用过，就在这里扯什么老美，说别人是跟帖机器人，来维护你的可怜的不知所云的、沾沾自喜的、到了外网都要规避敏感词的、脆弱的、盲目的自尊心。怎么，不好用你要给我退钱吗？专门贴上来找骂的吗？

miusmile

2 月 13 日

我严重怀疑，你在骗我的铜币🐶

iorilu

2 月 13 日

@PersueYan 正规路子就是直接买 google one 会员, 以前包年 99 刀

现在可能涨了

不想花很多钱, 就找咸鱼拼车, 100 左右, 因为一个人可以邀请 5 个人一起用

unifly

2 月 13 日 via Android

@namonai 你也就这素质了，我安卓开发零基础，用 glm5 很顺利搞出了有自己一直想要功能的 app ，期间编译几乎不报错，我很满意，当然这两天服务器比较拥挤，体验不太好，至于你后面说的，算啦，观念不同，懒得理论…

namonai

2 月 13 日

@unifly 好好好，零基础小白玩转大模型开发是吧，怪不得怪不得，合理了。

Muninn

2 月 13 日

该骂就是该骂，竟然还有人打着国产模型的旗号辩护，这跟国产模型有关系吗？你看有这么多人骂 Kimi 和 Minimax 吗？ Kimi 就那么点额度，两下就用完，大家也就吐槽下，不会骂。人家没干什么不诚信的事啊。

unifly

2 月 13 日

@namonai 自己动手，丰衣足食，开开心心，咋，非程序员就不能用大模型么？你咋戾气这么重呢？

securityCoding

2 月 13 日 via Android

@maolon 你为啥喷我啊😢

molika

2 月 13 日 via iPhone

买了 pro 计划。看 tokens 现在缩水了差不多三倍。之前差不多 tokens 显示额度百分之五左右现在百分之 20 。之前我自己高频率用也没到 20% 现在随便就到 30%多了

wojiugaiming

2 月 13 日 via Android

@unifly 你自己问题，什么都要带上老美

xFrye

2 月 13 日

@unifly 差不多得了，他自己改了用于协议，搞得老套餐都用不了新模型，这也怪到美国头上？

MartinZBE

2 月 13 日

用的 4.7Max 套餐差很多呢(将一个 python 项目改为 Rust 项目 10 分钟后就 break 了,人家 Cousor 免费版都能在 3 次提示 vibe 的情况下,半小时内完成任务. 而且那个购买服务的饥饿营销策略很恶心.

unifly

2 月 13 日

@xFrye 好吧，商业操守的问题之前没经历没调查，咱不评论，从我使用角度看，个人认为 glm5 产品力还是不错的。
@wojiugaiming 是啊，咱不抵制人家，人家各种禁止使绊子，我还想买个完全体的 5090 耍耍呢，奈何人家不愿意啊，如果大家合作愉快，国内算力足够，凭诸位的聪明才智牛马精神，我相信咱的模型能力不会比不过人家，总比动不动被 Claude 封禁强多了？对不

psirnull

2 月 13 日

minimax m2.5 更快

wojiugaiming

2 月 13 日 via Android

@unifly 你用国产显卡啊，国产显卡不能用？

mns

2 月 13 日

自己卖的 coding plan ，lite 和 pro 不给用，有啥脸宣传？

felixcode

2 月 13 日

@unifly
商业操守的问题, 是最严重的问题，被你轻飘飘带过。
然后开始怪别人使绊子。
真有你的。

technode

2 月 13 日

所以 lite 不让用是因为技术太领先了吗？还是运营的脑子坏掉了

unifly

2 月 13 日

@felixcode 商业操守跟使绊子咋还搅合一块儿了，你跑题了。得，你慢慢反思吧，去跟有道德、有操守的圣贤公司玩儿吧，希望你能多找到几个……

unifly

2 月 13 日

@wojiugaiming 不是，我说 glm5 挺好的，你很难受么？

jokcylou

2 月 13 日 via Android

@namonai 你才怕不是来招笑的吧，谁给你的自信说我没买的，我是智谱的早期用户，从最开始的垃圾用起，到 4.5-4.7 现在的 5 。我是不想提国产耐不住 v 站一堆对国产吹毛求疵的啊，看不惯双标而已，你别应激

gotoschool

2 月 13 日

glm 就是垃圾啊特别垃圾巨垃圾

iamnotcodinggod

2 月 13 日

没用过 glm 哈，对模型质量没有概念。
但是如果打广告有排行榜的话，那 glm 肯定是当之无愧的第一名。

lithiumii

2 月 13 日 via Android

你们广告太多了，全平台国内国外到处都是。
虽然模型也不是不能用

namonai

2 月 13 日

@jokcylou minimax 是国产的吧？ kimi 是国产的吧？ deepseek 是国产的吧？卖 coding plan 的不止 GLM 一家吧？怎么，那么多家卖 coding plan 的供应商，怎么就 GLM 挨骂了？我还是前一阵刚买的 Pro 年费，忍着白天工作时间的龟速，不到半个月，额度也下调了，续费的价格也涨了，权益也被修改了。不该说？说了就是双标？

最新的 GLM-5 模型到底占用多少额度，发布多少天了，官方有明确的数字吗？连 Pro/Max 的额度都是写在 QA 里的，没有明确的文档标注，这个 QA 还是随时在偷偷修改的。看看隔壁家的 minimax ，能用多少条、每个模型占用多少额度，清清楚楚、明明白白，哪个正经的模型厂商会连额度都标不明白？

最起码的额度都模棱两可的，鸡贼得很。还是上市公司。还打算在沪市继续上市。怎么，不能说？说了就是双标？国产这两个字碰到你的玻璃心了？

cabing

2 月 13 日

很棒。主要是用得起，勉强能用也行。花美刀还是很贵。。

youshangdemajia

2 月 13 日

不明确说额度很正常吧，Antigravity 和 Codex 都没说具体的数字，反正它们可以随便降低，用户也只能骂街。
现在成本这么高，大如谷歌，不搞小动作也顶不住。

wojiugaiming

2 月 14 日 via Android

@unifly 哦，glm5 精神股东。有你这种人，本来对 glm5 没感觉，现在嘛，赶紧倒闭的

user1284

2 月 14 日

已购买 lite 套餐的用户禁止使用,还有脸打广告? 哪怕你限量呢, 这种态度, 几天后到期后我反正不续, 本身就是拿来分配简单任务 agent,核心 agent 还是 claude,gemini 模型, 用哪家对我来说都一样

unifly

2 月 14 日 via Android

@wojiugaiming 你咋这么幼稚，别回我了，我也不会再回你，拜拜

wwhc

2 月 14 日

支持开源模型，希望能尽快开源 air 版本

bli22ard

2 月 14 日

这直接注册不了，验证码提示出错

wojiugaiming

2 月 14 日 via Android

@unifly 你咋那么幼稚？哪里得出结论我难过？ glm 有如此劣质用户，可见这公司什么样子。另外你也不用回了，再回你就是侮辱全人类

gigishy

2 月 15 日 via iPhone

我看了标题直接看评论，发现我又防止被骗了几分钟😂

GLM-5 开源：从代码到工程， Agentic Engineering 时代最好的开源模型

更大基座，更强智能

Coding 能力：对齐 Claude Opus 4.5

Agent 能力：SOTA 级长程任务执行

国产芯片支持线上推理集群

Agentic Engineering 典型场景

开源与使用方式

1. 官方 API 接入

2. 在线体验

3. 开源链接

4. Agent

5. Blog