
今天,我们上线并开源 GLM-5 。
学界与业界正逐渐形成一种共识,大模型从写代码、写前端,进化到写工程、完成大任务,即从“Vibe Coding”变革为“Agentic Engineering”。
GLM-5 正是这一变革的产物:在 Coding 与 Agent 能力上,取得开源 SOTA 表现,在真实编程场景的使用体感逼近 Claude Opus 4.5 ,擅长复杂系统工程与长程 Agent 任务。
在全球权威的 Artificial Analysis 榜单中,GLM-5 位居全球第四、开源第一。

GLM-5 全新基座为从“写代码”到“写工程”的能力演进提供了坚实基础:

GLM-5 在编程能力上实现了对 Claude Opus 4.5 的对齐,在业内公认的主流基准测试中取得开源模型 SOTA 分数。在 SWE-bench-Verified 和 Terminal Bench 2.0 中分别获得 77.8 和 56.2 的开源模型 SOTA 分数,性能超过 Gemini 3 Pro 。
2026 年,大模型需要从“会写”走到“会完成”,尤其是端到端完成大型任务。GLM-5 是一个“系统架构师”,它不仅为开发精美的 Demo 而生,更为稳定交付生产结果而生。
在内部 Claude Code 评估集合中,GLM-5 在前端、后端、长程任务等编程开发任务上显著超越 GLM-4.7 (平均增幅超过 20%),能够以极少的人工干预自主完成 Agentic 长程规划与执行、后端重构和深度调试等系统工程任务,使用体感逼近 Opus 4.5 。

GLM-5 在 Agent 能力上实现开源 SOTA ,在多个评测基准中取得开源第一:在 BrowseComp (联网检索与信息理解)、MCP-Atlas (工具调用和多步骤任务执行)和 τ²-Bench (复杂多工具场景下的规划和执行)均取得最佳表现。

在衡量模型经营能力的 Vending Bench 2 中,GLM-5 获得开源模型第一的表现。Vending Bench 2 要求模型在一年期内经营一个模拟的自动售货机业务,GLM-5 最终账户余额达到 4432 美元,经营表现接近 Claude Opus 4.5 ,展现了出色的长期规划和资源管理能力。

这些能力是 Agentic Engineering 的核心:模型不仅要能写代码、完成工程,还要能在长程任务中保持目标一致性、进行资源管理、处理多步骤依赖关系,成为真正的 Agentic Ready 基座模型。
GLM 系列模型受到全球开发者喜爱,在 GLM Coding Plan 全球爆量后,我们不得不启动限售活动。本次 GLM-5 的上线依托众多国产芯片有力保障了线上服务的稳定和高效。
目前,GLM-5 已完成与华为昇腾、摩尔线程、寒武纪、昆仑芯、沐曦、燧原、海光等国产算力平台的深度推理适配。通过底层算子优化与硬件加速,GLM-5 在国产芯片集群上已经实现高吞吐、低延迟的稳定运行。

点击或在浏览器输入:showcase.z.ai,即可查看所有案例。
即日起,GLM-5 在 Hugging Face 与 ModelScope 平台同步开源,模型权重遵循 MIT License 。
GLM-5 已经纳入 Max 用户套餐,Pro 将尽快在 5 天内支持,接下来我们将逐步扩大范围,尽力让更多用户体验并使用 GLM-5 。GLM Coding Plan 支持 Claude Code 、OpenCode 等主流开发工具。
GLM Coding Plan 同步升级 Agentic Engineering 体验:
1
shakaraka PRO 试用套餐有不
|
2
shakaraka PRO code plan 的试用 GLM-5 的
|
3
Tink PRO lite 和 pro 都不支持
|
4
donggua997 1 天前 比参数没输过,实际体验没赢过。
|
5
enano 1 天前
开了 lite 像路边一条
|
6
whbbxw 1 天前 你们自己用自己的模型吗? 4.6 和 5.3 也参与一下测试吧。
|
7
donggua997 1 天前 你真的确定配与 gpt 、gemini 、claude 放一起比吗 ???
|
8
mashimaroinfo1 1 天前 篇幅好长, 能力几何?
|
9
opeth 1 天前 先看看隔壁帖子对你们 coding plan 的背刺的吐槽吧
|
10
hugodotlau 1 天前 来吹半天都没点福利抽奖么?这广告真白看了
|
11
zhuangpipi 1 天前 不涨价还想购入,涨价确实性价比比较低了
|
12
qaq13037 1 天前 跑分嘎嘎猛,实际用起来差很多
|
13
iorilu 1 天前 我一直奇怪, 100 多可以上车正规的 google one 会员, 用 antigravity 不比这个强, 更别说谷歌还有很多其他 ai 服务?
|
14
flowerwow0316 1 天前 via Android 你说是就是了
|
15
Muninn 1 天前 现在这个价格完全没有竞争力了。更何况口碑已经完全坏了,超卖,水军营销,限速,降智,随意修改订阅协议,毫无诚信,吃相难看。
|
16
ProphetN 1 天前 吃相太难看了,国产模型商永久拉黑这家吧。
|
17
iden 1 天前 ...评论哪儿来的那么大偏见。刷分不都是闭源模型常见的操作吗?
众所周知开源模型刷分风险更低,也能被吐槽高分低能? |
18
tlerbao 1 天前 吹你家死牛逼
|
19
Plutooo 1 天前 是蒸馏模型吗
|
20
felixcode 1 天前 用起来怎么样,能不能和 gpt 和 opus 比,自己心里没数吗?
|
21
phrack 1 天前
虽然不咋样收费还贵
但是开源我就喜欢,等显存便宜了 1TB 我也买得起的时候本地试试 |
22
mogutouer 1 天前 4.5 都废了,你怎么不对比同时代的 opus 4.6 ?
|
23
Dream4U 1 天前 蒸馏对齐
|
24
jqknono 23 小时 57 分钟前
从 300B 涨到 700B, 涨价还算合理吧, 重要的是模型效果.
|
25
unifly 22 小时 20 分钟前 咋一个个都这么大戾气,不会是跟贴机器人吧,凡是跟老美有竞争的,网上舆论没有不被骂的……嘿嘿
|
26
felixcode 19 小时 38 分钟前 |
27
kneo 18 小时 32 分钟前 via Android 多个选择总是好的,没必要喷这么狠吧。我在 hackernews 上经常看老外盛赞中国开源模型,说现想跑本地大模型只能靠中国的开源模型。虽然比不上闭源模型,但只要和自己比是在进步,对他们来说就是个好消息。
|
28
longxk 17 小时 39 分钟前 via Android LITE 套餐我明明记得之前写着支持最新模型,结果现在偷偷改成支持历史模型,这种毫无诚信可言的公司的产品也必然是注水严重。
|
31
securityCoding 13 小时 0 分钟前 via Android @maolon 宏大叙事的基本没脑子🤣,付费用户条款随意改不喷留着过年
|
32
maolon 12 小时 52 分钟前
@securityCoding 还真是留着过年 😂,过年前都要给用户添波堵你们智谱是有水平的
|
34
ckzx 12 小时 31 分钟前
这就是一家骗子公司。。我也上当买了 LITE 。当时也写了支持最新的。
|
35
gux928 12 小时 17 分钟前 via iPhone
我也买了 lite 。让子弹飞两天看看。
|
36
AlexHsu 11 小时 52 分钟前 不如 minimax2.5
|
37
FH0 11 小时 41 分钟前 之前开过你们家的 Max 套餐,GLM 4.7 的速度很慢
|
38
EasonYan 10 小时 44 分钟前
Lite 套餐不让用。不过无所谓,4.7 都慢得没法用,就算让用 5 也不想用了。
|
39
EeveeRibbon 10 小时 31 分钟前 @unifly #25 GLM4.6 我是真掏钱用过的,还好没买年费,从此以后我不信任 GLM 的任何模型了
|
40
MaxwellX 10 小时 22 分钟前 之前买了 lite 的协议是给更新最新版模型的,现在又不给更新了,还经常来这里打广告,败好感啊
|
41
secretbytes 10 小时 8 分钟前 |
42
felixcode 10 小时 6 分钟前 不好好做产品只知道吹的,不管产品质量只顾吹国产的,非蠢即坏。
|
43
LunarEcho24 9 小时 44 分钟前
吹的有点过了
|
44
zxjxzj9 9 小时 36 分钟前 @unifly 我看用过 GLM 的就没有不骂的,怎么都是国产 minimax 和 qwen 还有 kimi 好评就很多呢?尤其是 minimax ,人家股价也高说明真金白银看好,只不过没有那么多宣传罢了。
|
45
crackidz 9 小时 35 分钟前
@secretbytes
你这样说发烧手机可就急眼了 |
46
justdoit123 9 小时 19 分钟前 试用了下,响应真的太慢了啊,这个真的有点不能忍。是不是试用套餐的缘故?
|
47
gouLang 9 小时 16 分钟前
2.12 号买的 lite 还增加了周限额, 5 小时限额里跑满, 就是周限额的 20%, 也就是说一周只能跑 25 个小时, 平均每天只能跑满 5 个小时的量, 这能用来工作? 年费还升价了这么多, 太痛了
|
48
manwhatcanisay 9 小时 2 分钟前 |
49
Ne 7 小时 37 分钟前
GLM-5 和 minimax2.5 比较,当然是 GLM-5 胜出,两个都多用过几次就知道
|
50
xiangqiankan 6 小时 44 分钟前 GLM5 不错的 我已经把我的主力模型从 gemini3pro 切换成了 glm5
|
51
hihanley 6 小时 24 分钟前 该骂,超卖,水军营销,限速,降智,随意修改订阅协议,毫无诚信,吃相难看
|
52
cat9life 6 小时 7 分钟前 这个帖子我今天在不同地方看到多次了
|
55
jimrok 5 小时 2 分钟前
编程这个赛道广告是没有用的,一个程序员只有本科生水平,嘴巴叫的再大声自己厉害,也不会有公司给你一个博士生的薪水。
|
57
Nexora 4 小时 37 分钟前
这是来找网暴的吗
|
58
wojiugaiming 3 小时 49 分钟前 via Android
我用了,推荐大家使用,真的很好用。使用效果图如下: https://imgur.com/a/S6nS8zk
|
59
wojiugaiming 3 小时 46 分钟前 via Android
|
60
namonai 3 小时 42 分钟前
@unifly 是的,花了钱买了垃圾。那又如何?总比你这种根本没有回复你、却主动凑上来挨骂的人来得好。连钱都没花、用都没用过,就在这里扯什么老美,说别人是跟帖机器人,来维护你的可怜的不知所云的、沾沾自喜的、到了外网都要规避敏感词的、脆弱的、盲目的自尊心。怎么,不好用你要给我退钱吗?专门贴上来找骂的吗?
|
61
miusmile 3 小时 41 分钟前
我严重怀疑,你在骗我的铜币🐶
|
62
iorilu 3 小时 35 分钟前
|
63
unifly 3 小时 2 分钟前 via Android
@namonai 你也就这素质了,我安卓开发零基础,用 glm5 很顺利搞出了有自己一直想要功能的 app ,期间编译几乎不报错,我很满意,当然这两天服务器比较拥挤,体验不太好,至于你后面说的,算啦,观念不同,懒得理论…
|
65
Muninn 2 小时 40 分钟前 该骂就是该骂,竟然还有人打着国产模型的旗号辩护,这跟国产模型有关系吗?你看有这么多人骂 Kimi 和 Minimax 吗? Kimi 就那么点额度,两下就用完,大家也就吐槽下,不会骂。人家没干什么不诚信的事啊。
|
67
securityCoding 2 小时 11 分钟前 via Android
@maolon 你为啥喷我啊😢
|
68
molika 2 小时 7 分钟前 via iPhone
买了 pro 计划。 看 tokens 现在缩水了差不多三倍 。 之前差不多 tokens 显示额度百分之五左右 现在百分之 20 。 之前我自己高频率用也没到 20% 现在随便就到 30%多了
|
69
wojiugaiming 1 小时 48 分钟前 via Android
@unifly 你自己问题,什么都要带上老美
|
71
MartinZBE 57 分钟前
用的 4.7Max 套餐差很多呢(将一个 python 项目改为 Rust 项目 10 分钟后就 break 了,人家 Cousor 免费版都能在 3 次提示 vibe 的情况下,半小时内完成任务. 而且那个购买服务的饥饿营销策略很恶心.
|
72
unifly 29 分钟前
@xFrye 好吧,商业操守的问题之前没经历没调查,咱不评论,从我使用角度看,个人认为 glm5 产品力还是不错的。
@wojiugaiming 是啊,咱不抵制人家,人家各种禁止使绊子,我还想买个完全体的 5090 耍耍呢,奈何人家不愿意啊,如果大家合作愉快,国内算力足够,凭诸位的聪明才智牛马精神,我相信咱的模型能力不会比不过人家,总比动不动被 Claude 封禁强多了?对不 |
73
psirnull 27 分钟前
minimax m2.5 更快
|