深夜,智谱在没有任何预告的情况下,发了GLM - 4.5。
沉积了很久的智谱,终于有动作了。
看了一下效果,比之前的GLM-4强的不是一点半点。
大概总结一下:
1. 发了两个模型,GLM-4.5和GLM-4.5-Air,总参数量分别是355B和106B,但激活参数32B和12B。
2. 全面开源,MIT协议。
3. 参数优化的很不错,GLM-4.5参数量是DeepSeek-R1的1/2、Kimi-K2的1/3,但综合评测登顶,全球模型第三、国产模型第一、开源模型SOTA。
4. 在15万亿token的通用数据上进行了预训练,此后在代码、推理、智能体等领域的8万亿token数据上进行针对性训练,最后通过强化学习进一步增强模型推理、代码与智能体能力。
5. 定价极其离谱,超级便宜,API调用价格低至输入 0.8 元/百万 tokens,输出 2 元/百万 tokens。
6. 生成速度最高能达到100tokens/秒。
7. 在Agentic Coding的盲评测试中,跟Claude-4-Sonnet、Kimi-K2、Qwen3-Coder进行了对比,GLM-4.5在52个编程开发任务上的表现,国内最佳,在大部分场景中可以平替Claude-4-Sonnet,碾压了K2和Qwen3-Coder。
8. 为了保证透明度,还把测试题目和Agent轨迹全部公开了,放在HuggingFace上供大家验证复现。这种透明度,在模型厂商里真的少见,非常牛逼且自信。
9. 综合来看,应该是未来搭配Claude Code的最性价比模型,GLM-4.5+CC可能会成为主流。
10. 普通用户可以在z.ai上免费用,不要钱。
所有的素材我都放在评论区,这两天忙完手上的事详细测试一下,感觉堆在手上无数的任务。
海外疯狂涨价、国内疯狂开源。
这个生态,也是挺有意思的。(转载自数字生命卡兹克)
