V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
Zhipuai
V2EX  ›  程序员

GLM-5 开源:从代码到工程, Agentic Engineering 时代最好的开源模型

  •  
  •   Zhipuai ·
    PRO
    · 1 天前 · 5396 次点击

    今天,我们上线并开源 GLM-5 。

    学界与业界正逐渐形成一种共识,大模型从写代码、写前端,进化到写工程、完成大任务,即从“Vibe Coding”变革为“Agentic Engineering”。

    GLM-5 正是这一变革的产物:在 Coding 与 Agent 能力上,取得开源 SOTA 表现,在真实编程场景的使用体感逼近 Claude Opus 4.5 ,擅长复杂系统工程与长程 Agent 任务。

    在全球权威的 Artificial Analysis 榜单中,GLM-5 位居全球第四、开源第一。

    更大基座,更强智能

    GLM-5 全新基座为从“写代码”到“写工程”的能力演进提供了坚实基础:

    • 参数规模扩展:从 355B (激活 32B )扩展至 744B (激活 40B ),预训练数据从 23T 提升至 28.5T ,更大规模的预训练算力显著提升了模型的通用智能水平。
    • 异步强化学习:构建全新的“Slime”框架,支持更大模型规模及更复杂的强化学习任务,提升强化学习后训练流程效率;提出异步智能体强化学习算法,使模型能够持续从长程交互中学习,充分激发预训练模型的潜力。
    • 稀疏注意力机制:首次集成 DeepSeek Sparse Attention ,在维持长文本效果无损的同时,大幅降低模型部署成本,提升 Token Efficiency 。

    Coding 能力:对齐 Claude Opus 4.5

    GLM-5 在编程能力上实现了对 Claude Opus 4.5 的对齐,在业内公认的主流基准测试中取得开源模型 SOTA 分数。在 SWE-bench-Verified 和 Terminal Bench 2.0 中分别获得 77.856.2 的开源模型 SOTA 分数,性能超过 Gemini 3 Pro 。

    2026 年,大模型需要从“会写”走到“会完成”,尤其是端到端完成大型任务。GLM-5 是一个“系统架构师”,它不仅为开发精美的 Demo 而生,更为稳定交付生产结果而生。

    在内部 Claude Code 评估集合中,GLM-5 在前端、后端、长程任务等编程开发任务上显著超越 GLM-4.7 (平均增幅超过 20%),能够以极少的人工干预自主完成 Agentic 长程规划与执行、后端重构和深度调试等系统工程任务,使用体感逼近 Opus 4.5 。

    Agent 能力:SOTA 级长程任务执行

    GLM-5 在 Agent 能力上实现开源 SOTA ,在多个评测基准中取得开源第一:在 BrowseComp (联网检索与信息理解)、MCP-Atlas (工具调用和多步骤任务执行)和 τ²-Bench (复杂多工具场景下的规划和执行)均取得最佳表现。

    在衡量模型经营能力的 Vending Bench 2 中,GLM-5 获得开源模型第一的表现。Vending Bench 2 要求模型在一年期内经营一个模拟的自动售货机业务,GLM-5 最终账户余额达到 4432 美元,经营表现接近 Claude Opus 4.5 ,展现了出色的长期规划和资源管理能力。

    这些能力是 Agentic Engineering 的核心:模型不仅要能写代码、完成工程,还要能在长程任务中保持目标一致性、进行资源管理、处理多步骤依赖关系,成为真正的 Agentic Ready 基座模型。

    国产芯片支持线上推理集群

    GLM 系列模型受到全球开发者喜爱,在 GLM Coding Plan 全球爆量后,我们不得不启动限售活动。本次 GLM-5 的上线依托众多国产芯片有力保障了线上服务的稳定和高效。

    目前,GLM-5 已完成与华为昇腾、摩尔线程、寒武纪、昆仑芯、沐曦、燧原、海光等国产算力平台的深度推理适配。通过底层算子优化与硬件加速,GLM-5 在国产芯片集群上已经实现高吞吐、低延迟的稳定运行。

    Agentic Engineering 典型场景

    点击或在浏览器输入:showcase.z.ai,即可查看所有案例。

    开源与使用方式

    即日起,GLM-5 在 Hugging Face 与 ModelScope 平台同步开源,模型权重遵循 MIT License 。

    GLM-5 已经纳入 Max 用户套餐,Pro 将尽快在 5 天内支持,接下来我们将逐步扩大范围,尽力让更多用户体验并使用 GLM-5 。GLM Coding Plan 支持 Claude Code 、OpenCode 等主流开发工具。

    GLM Coding Plan 同步升级 Agentic Engineering 体验:

    • 官方适配 OpenClaw:仅需简单几步即可完成配置,快速开启 Agent 工作流;
    • Pro / Max 用户限量赠送 AutoGLM-OpenClaw:支持将云端个人 AI 助手接入飞书,实现办公场景的长任务执行;
    • 新增 GLM in Excel 权益:原生适配 Excel 环境的 AI 插件,支持在侧边栏以自然语言交互,深度赋能数据处理与表格工作流( Beta 期仅 Max 用户可享套餐抵扣)。

    1. 官方 API 接入

    2. 在线体验

    3. 开源链接

    4. Agent

    5. Blog

    86 条回复    2026-02-13 23:38:42 +08:00
    shakaraka
        1
    shakaraka  
    PRO
       1 天前
    试用套餐有不
    shakaraka
        2
    shakaraka  
    PRO
       1 天前
    code plan 的试用 GLM-5 的
    Tink
        3
    Tink  
    PRO
       1 天前 via Android
    lite 和 pro 都不支持
    donggua997
        4
    donggua997  
       1 天前   ❤️ 27
    比参数没输过,实际体验没赢过。
    enano
        5
    enano  
       1 天前
    开了 lite 像路边一条
    whbbxw
        6
    whbbxw  
       1 天前   ❤️ 1
    你们自己用自己的模型吗? 4.6 和 5.3 也参与一下测试吧。
    donggua997
        7
    donggua997  
       1 天前   ❤️ 1
    你真的确定配与 gpt 、gemini 、claude 放一起比吗 ???
    mashimaroinfo1
        8
    mashimaroinfo1  
       1 天前   ❤️ 1
    篇幅好长, 能力几何?
    opeth
        9
    opeth  
       1 天前   ❤️ 1
    先看看隔壁帖子对你们 coding plan 的背刺的吐槽吧
    hugodotlau
        10
    hugodotlau  
       1 天前   ❤️ 1
    来吹半天都没点福利抽奖么?这广告真白看了
    zhuangpipi
        11
    zhuangpipi  
       1 天前   ❤️ 1
    不涨价还想购入,涨价确实性价比比较低了
    qaq13037
        12
    qaq13037  
       1 天前   ❤️ 1
    跑分嘎嘎猛,实际用起来差很多
    iorilu
        13
    iorilu  
       1 天前   ❤️ 1
    我一直奇怪, 100 多可以上车正规的 google one 会员, 用 antigravity 不比这个强, 更别说谷歌还有很多其他 ai 服务?
    flowerwow0316
        14
    flowerwow0316  
       1 天前 via Android   ❤️ 1
    你说是就是了
    Muninn
        15
    Muninn  
       1 天前   ❤️ 5
    现在这个价格完全没有竞争力了。更何况口碑已经完全坏了,超卖,水军营销,限速,降智,随意修改订阅协议,毫无诚信,吃相难看。
    ProphetN
        16
    ProphetN  
       1 天前   ❤️ 1
    吃相太难看了,国产模型商永久拉黑这家吧。
    iden
        17
    iden  
       1 天前   ❤️ 1
    ...评论哪儿来的那么大偏见。刷分不都是闭源模型常见的操作吗?
    众所周知开源模型刷分风险更低,也能被吐槽高分低能?
    tlerbao
        18
    tlerbao  
       1 天前   ❤️ 1
    吹你家死牛逼
    Plutooo
        19
    Plutooo  
       1 天前   ❤️ 2
    是蒸馏模型吗
    felixcode
        20
    felixcode  
       1 天前   ❤️ 1
    用起来怎么样,能不能和 gpt 和 opus 比,自己心里没数吗?
    phrack
        21
    phrack  
       1 天前
    虽然不咋样收费还贵

    但是开源我就喜欢,等显存便宜了 1TB 我也买得起的时候本地试试
    mogutouer
        22
    mogutouer  
       1 天前   ❤️ 1
    4.5 都废了,你怎么不对比同时代的 opus 4.6 ?
    Dream4U
        23
    Dream4U  
       1 天前   ❤️ 2
    蒸馏对齐
    jqknono
        24
    jqknono  
       1 天前
    从 300B 涨到 700B, 涨价还算合理吧, 重要的是模型效果.
    unifly
        25
    unifly  
       1 天前   ❤️ 2
    咋一个个都这么大戾气,不会是跟贴机器人吧,凡是跟老美有竞争的,网上舆论没有不被骂的……嘿嘿
    felixcode
        26
    felixcode  
       1 天前   ❤️ 3
    @bridgemindai
    BridgeMind 发的测评和榜单,就这还在这腆着脸吹?


    kneo
        27
    kneo  
       23 小时 21 分钟前 via Android   ❤️ 2
    多个选择总是好的,没必要喷这么狠吧。我在 hackernews 上经常看老外盛赞中国开源模型,说现想跑本地大模型只能靠中国的开源模型。虽然比不上闭源模型,但只要和自己比是在进步,对他们来说就是个好消息。
    longxk
        28
    longxk  
       22 小时 28 分钟前 via Android   ❤️ 3
    LITE 套餐我明明记得之前写着支持最新模型,结果现在偷偷改成支持历史模型,这种毫无诚信可言的公司的产品也必然是注水严重。
    jokcylou
        29
    jokcylou  
       19 小时 49 分钟前 via Android   ❤️ 4
    @kneo v 站站不起来的人可太多了,不会念国产一点点好的,国产往死里挑刺国外往死里舔,老传统了
    maolon
        30
    maolon  
       18 小时 31 分钟前   ❤️ 5
    @unifly 你自己搜下他们最近干了啥就知道为什么骂了,看样子割韭菜没割到你头上说话就是轻松,啥事都来个什么大国叙事 smh
    securityCoding
        31
    securityCoding  
       17 小时 49 分钟前 via Android   ❤️ 12
    @maolon 宏大叙事的基本没脑子🤣,付费用户条款随意改不喷留着过年
    maolon
        32
    maolon  
       17 小时 41 分钟前
    @securityCoding 还真是留着过年 😂,过年前都要给用户添波堵你们智谱是有水平的
    8e47e42
        33
    8e47e42  
       17 小时 24 分钟前
    @jokcylou Yes this - 我是真的看不懂,但凡人有护照也不至于这样
    ckzx
        34
    ckzx  
       17 小时 20 分钟前
    这就是一家骗子公司。。我也上当买了 LITE 。当时也写了支持最新的。
    gux928
        35
    gux928  
       17 小时 6 分钟前 via iPhone
    我也买了 lite 。让子弹飞两天看看。
    AlexHsu
        36
    AlexHsu  
       16 小时 41 分钟前   ❤️ 1
    不如 minimax2.5
    FH0
        37
    FH0  
       16 小时 30 分钟前   ❤️ 1
    之前开过你们家的 Max 套餐,GLM 4.7 的速度很慢
    EasonYan
        38
    EasonYan  
       15 小时 33 分钟前
    Lite 套餐不让用。不过无所谓,4.7 都慢得没法用,就算让用 5 也不想用了。
    EeveeRibbon
        39
    EeveeRibbon  
       15 小时 20 分钟前   ❤️ 1
    @unifly #25 GLM4.6 我是真掏钱用过的,还好没买年费,从此以后我不信任 GLM 的任何模型了
    MaxwellX
        40
    MaxwellX  
       15 小时 11 分钟前   ❤️ 1
    之前买了 lite 的协议是给更新最新版模型的,现在又不给更新了,还经常来这里打广告,败好感啊
    secretbytes
        41
    secretbytes  
       14 小时 57 分钟前   ❤️ 5
    怎么感觉有点像某个手机品牌,都是参数如何如何牛逼,跑分如何如何,等你买回去了,就会发现一坨。要是你说它不好,还有人出来说它才多少钱啊,你拿它跟 XXX 比
    felixcode
        42
    felixcode  
       14 小时 55 分钟前   ❤️ 1
    不好好做产品只知道吹的,不管产品质量只顾吹国产的,非蠢即坏。
    LunarEcho24
        43
    LunarEcho24  
       14 小时 33 分钟前
    吹的有点过了
    zxjxzj9
        44
    zxjxzj9  
       14 小时 25 分钟前   ❤️ 1
    @unifly 我看用过 GLM 的就没有不骂的,怎么都是国产 minimax 和 qwen 还有 kimi 好评就很多呢?尤其是 minimax ,人家股价也高说明真金白银看好,只不过没有那么多宣传罢了。
    crackidz
        45
    crackidz  
       14 小时 24 分钟前
    @secretbytes 你这样说发烧手机可就急眼了
    justdoit123
        46
    justdoit123  
       14 小时 8 分钟前   ❤️ 1
    试用了下,响应真的太慢了啊,这个真的有点不能忍。是不是试用套餐的缘故?
    gouLang
        47
    gouLang  
       14 小时 5 分钟前
    2.12 号买的 lite 还增加了周限额, 5 小时限额里跑满, 就是周限额的 20%, 也就是说一周只能跑 25 个小时, 平均每天只能跑满 5 个小时的量, 这能用来工作? 年费还升价了这么多, 太痛了
    manwhatcanisay
        48
    manwhatcanisay  
       13 小时 51 分钟前   ❤️ 1
    广告帖为什么不放在“推广" 这又不是隔壁,没有“国产替代”
    Ne
        49
    Ne  
       12 小时 26 分钟前
    GLM-5 和 minimax2.5 比较,当然是 GLM-5 胜出,两个都多用过几次就知道
    xiangqiankan
        50
    xiangqiankan  
       11 小时 33 分钟前   ❤️ 1
    GLM5 不错的 我已经把我的主力模型从 gemini3pro 切换成了 glm5
    hihanley
        51
    hihanley  
       11 小时 13 分钟前   ❤️ 1
    该骂,超卖,水军营销,限速,降智,随意修改订阅协议,毫无诚信,吃相难看
    cat9life
        52
    cat9life  
       10 小时 56 分钟前   ❤️ 1
    这个帖子我今天在不同地方看到多次了
    namonai
        53
    namonai  
       10 小时 52 分钟前
    @jokcylou 你先出点真金白银买个订阅再看看?不好用就是不好用,和是不是国产的有什么关系?国产是免死金牌?招笑,幼稚
    PersueYan
        54
    PersueYan  
       10 小时 50 分钟前
    @iorilu 家庭订阅吗?
    jimrok
        55
    jimrok  
       9 小时 51 分钟前   ❤️ 1
    编程这个赛道广告是没有用的,一个程序员只有本科生水平,嘴巴叫的再大声自己厉害,也不会有公司给你一个博士生的薪水。
    unifly
        56
    unifly  
       9 小时 34 分钟前
    @namonai 估计你自己就是国产的吧,哈哈,是不是感到很沮丧?
    Nexora
        57
    Nexora  
       9 小时 26 分钟前   ❤️ 1
    这是来找网暴的吗
    wojiugaiming
        58
    wojiugaiming  
       8 小时 39 分钟前 via Android
    我用了,推荐大家使用,真的很好用。使用效果图如下: https://imgur.com/a/S6nS8zk
    wojiugaiming
        59
    wojiugaiming  
       8 小时 35 分钟前 via Android
    @wojiugaiming 好像回帖不显示图片,我再补充一下
    namonai
        60
    namonai  
       8 小时 31 分钟前
    @unifly 是的,花了钱买了垃圾。那又如何?总比你这种根本没有回复你、却主动凑上来挨骂的人来得好。连钱都没花、用都没用过,就在这里扯什么老美,说别人是跟帖机器人,来维护你的可怜的不知所云的、沾沾自喜的、到了外网都要规避敏感词的、脆弱的、盲目的自尊心。怎么,不好用你要给我退钱吗?专门贴上来找骂的吗?
    miusmile
        61
    miusmile  
       8 小时 30 分钟前
    我严重怀疑,你在骗我的铜币🐶
    iorilu
        62
    iorilu  
       8 小时 24 分钟前
    @PersueYan 正规路子就是直接买 google one 会员, 以前包年 99 刀

    现在可能涨了

    不想花很多钱, 就找咸鱼拼车, 100 左右, 因为一个人可以邀请 5 个人一起用
    unifly
        63
    unifly  
       7 小时 51 分钟前 via Android
    @namonai 你也就这素质了,我安卓开发零基础,用 glm5 很顺利搞出了有自己一直想要功能的 app ,期间编译几乎不报错,我很满意,当然这两天服务器比较拥挤,体验不太好,至于你后面说的,算啦,观念不同,懒得理论…
    namonai
        64
    namonai  
       7 小时 46 分钟前
    @unifly 好好好,零基础小白玩转大模型开发是吧,怪不得怪不得,合理了。
    Muninn
        65
    Muninn  
       7 小时 29 分钟前   ❤️ 3
    该骂就是该骂,竟然还有人打着国产模型的旗号辩护,这跟国产模型有关系吗?你看有这么多人骂 Kimi 和 Minimax 吗? Kimi 就那么点额度,两下就用完,大家也就吐槽下,不会骂。人家没干什么不诚信的事啊。
    unifly
        66
    unifly  
       7 小时 11 分钟前
    @namonai 自己动手,丰衣足食,开开心心,咋,非程序员就不能用大模型么?你咋戾气这么重呢?
    securityCoding
        67
    securityCoding  
       7 小时 0 分钟前 via Android
    @maolon 你为啥喷我啊😢
    molika
        68
    molika  
       6 小时 56 分钟前 via iPhone   ❤️ 1
    买了 pro 计划。 看 tokens 现在缩水了差不多三倍 。 之前差不多 tokens 显示额度百分之五左右 现在百分之 20 。 之前我自己高频率用也没到 20% 现在随便就到 30%多了
    wojiugaiming
        69
    wojiugaiming  
       6 小时 37 分钟前 via Android   ❤️ 1
    @unifly 你自己问题,什么都要带上老美
    xFrye
        70
    xFrye  
       5 小时 53 分钟前   ❤️ 1
    @unifly 差不多得了,他自己改了用于协议,搞得老套餐都用不了新模型,这也怪到美国头上?
    MartinZBE
        71
    MartinZBE  
       5 小时 46 分钟前   ❤️ 1
    用的 4.7Max 套餐差很多呢(将一个 python 项目改为 Rust 项目 10 分钟后就 break 了,人家 Cousor 免费版都能在 3 次提示 vibe 的情况下,半小时内完成任务. 而且那个购买服务的饥饿营销策略很恶心.
    unifly
        72
    unifly  
       5 小时 19 分钟前
    @xFrye 好吧,商业操守的问题之前没经历没调查,咱不评论,从我使用角度看,个人认为 glm5 产品力还是不错的。
    @wojiugaiming 是啊,咱不抵制人家,人家各种禁止使绊子,我还想买个完全体的 5090 耍耍呢,奈何人家不愿意啊,如果大家合作愉快,国内算力足够,凭诸位的聪明才智牛马精神,我相信咱的模型能力不会比不过人家,总比动不动被 Claude 封禁强多了?对不
    psirnull
        73
    psirnull  
       5 小时 16 分钟前   ❤️ 1
    minimax m2.5 更快
    wojiugaiming
        74
    wojiugaiming  
       4 小时 14 分钟前 via Android   ❤️ 1
    @unifly 你用国产显卡啊,国产显卡不能用?
    mns
        75
    mns  
       4 小时 7 分钟前
    自己卖的 coding plan ,lite 和 pro 不给用,有啥脸宣传?
    felixcode
        76
    felixcode  
       4 小时 1 分钟前   ❤️ 1
    @unifly
    商业操守的问题, 是最严重的问题,被你轻飘飘带过。
    然后开始怪别人使绊子。
    真有你的。
    technode
        77
    technode  
       3 小时 51 分钟前   ❤️ 1
    所以 lite 不让用是因为技术太领先了吗? 还是运营的脑子坏掉了
    unifly
        78
    unifly  
       3 小时 49 分钟前
    @felixcode 商业操守跟使绊子咋还搅合一块儿了,你跑题了。得,你慢慢反思吧,去跟有道德、有操守的圣贤公司玩儿吧,希望你能多找到几个……
    unifly
        79
    unifly  
       3 小时 30 分钟前
    @wojiugaiming 不是,我说 glm5 挺好的,你很难受么?
    jokcylou
        80
    jokcylou  
       3 小时 6 分钟前 via Android
    @namonai 你才怕不是来招笑的吧,谁给你的自信说我没买的,我是智谱的早期用户,从最开始的垃圾用起,到 4.5-4.7 现在的 5 。我是不想提国产耐不住 v 站一堆对国产吹毛求疵的啊,看不惯双标而已,你别应激
    gotoschool
        81
    gotoschool  
       3 小时 4 分钟前   ❤️ 1
    glm 就是垃圾啊 特别垃圾 巨垃圾
    iamnotcodinggod
        82
    iamnotcodinggod  
       3 小时 0 分钟前   ❤️ 1
    没用过 glm 哈,对模型质量没有概念。
    但是如果打广告有排行榜的话,那 glm 肯定是当之无愧的第一名。
    lithiumii
        83
    lithiumii  
       2 小时 52 分钟前 via Android   ❤️ 1
    你们广告太多了,全平台国内国外到处都是。
    虽然模型也不是不能用
    namonai
        84
    namonai  
       2 小时 35 分钟前
    @jokcylou minimax 是国产的吧? kimi 是国产的吧? deepseek 是国产的吧?卖 coding plan 的不止 GLM 一家吧?怎么,那么多家卖 coding plan 的供应商,怎么就 GLM 挨骂了?我还是前一阵刚买的 Pro 年费,忍着白天工作时间的龟速,不到半个月,额度也下调了,续费的价格也涨了,权益也被修改了。不该说?说了就是双标?

    最新的 GLM-5 模型到底占用多少额度,发布多少天了,官方有明确的数字吗?连 Pro/Max 的额度都是写在 QA 里的,没有明确的文档标注,这个 QA 还是随时在偷偷修改的。看看隔壁家的 minimax ,能用多少条、每个模型占用多少额度,清清楚楚、明明白白,哪个正经的模型厂商会连额度都标不明白?

    最起码的额度都模棱两可的,鸡贼得很。还是上市公司。还打算在沪市继续上市。怎么,不能说?说了就是双标?国产这两个字碰到你的玻璃心了?
    cabing
        85
    cabing  
       2 小时 24 分钟前
    很棒。主要是用得起,勉强能用也行。花美刀还是很贵。。
    youshangdemajia
        86
    youshangdemajia  
       2 小时 6 分钟前
    不明确说额度很正常吧,Antigravity 和 Codex 都没说具体的数字,反正它们可以随便降低,用户也只能骂街。
    现在成本这么高,大如谷歌,不搞小动作也顶不住。
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   1035 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 31ms · UTC 17:45 · PVG 01:45 · LAX 09:45 · JFK 12:45
    ♥ Do have faith in what you're doing.