智谱、阶跃、阿里大混战，大模型重回2023

智能涌现 2025-07-30 19:29

沉寂许久的大模型竞技场，在这个夏天，又硝烟四起。

最近一场战役，发生在刚刚落幕的“AI春晚”WAIC（世界人工智能大会）期间。贴身对垒的三方，是六小虎中的阶跃星辰和智谱，以及大厂中的模型强队，阿里。

7月25日，阶跃开源了最新的多模态推理模型：Step-3。同一天，阿里又发布了全新的通义千问3推理模型：Qwen3-235B-A22B。

28日，智谱发布了最新一代基座大模型：GLM-4.5。而阿里的攻势不断——再次在同一天，阿里放出了多模态大礼包，开源了通义万相2.2，涵盖文生视频、图生视频、统一视频生成三种模态。

其中颇有火药味的一幕是：7月25日，最新的通义千问3，还被阿里冠以“全球最强”之名；三天后，GLM-4.5就以新王之姿成了全球开源模型的“SOTA”（最强）——在智谱放出的综合性能榜单中，GLM-4.5排全球第3，通义千问3排第9。

△智谱GLM-43在模型综合性能榜单排第3。图源：智谱

一名智谱员工告诉《智能涌现》，算法团队几乎所有人都守着通义千问的更新，“太紧张了。”他说，“万一差距太大，我们后发就是个笑话。”直到GLM-4.5跑赢Agentic能力在内的多个测评集，他心中的石头才落地。

WAIC上的硝烟，是这两个月以来六小虎模型混战的一个缩影。

早在6月，在为期5天的发布日中，MiniMax开源的推理模型M1，在上下文长度和工具使用场景中领跑了所有开源权重模型；视频生成模型Hailuo 2，在海外创造了“小猫跳水”等爆款视频。

仅过了一个月，月之暗面的新开源推理模型K2，又以横扫之势，拿下了24项开源模型SOTA。

转型后的百川智能和零一万物，既缺席了WAIC，也缺席了新一轮的模型混战。

DeepSeek V3、R1发布后，六小虎在市场上已经沉寂了近半年。

高管离职、人才出走，也已是常态。脉脉的一份报告显示，截至2025年7月初，六小虎中41.07%的员工都把状态设置成了“看机会”。

后DeepSeek时代的战役，对六小虎能否回归舞台中央，甚至存亡，至关重要。这份成绩单，极大程度影响着公司后续的资本操作和商业化进展。

更重要的是，在市场口碑下滑、内部军心涣散的半年中，六小虎急需一场翻身仗，向内外证明自己仍有留在大模型牌桌上的底气。

但后DeepSeek时代的模型战役依然艰险。DeepSeek R1的掀桌，证明了模型要想一鸣惊人，不仅性能要好，还得发得早。

被抢先的感觉，至今仍让不少小虎心悸——我们得知，K2的训练从2024年末就开始筹备，也是月之暗面的自信之作，本计划在2025年中旬发布。然而，R1的抢先发布，抢走了本可能属于Kimi的荣光。

为了防守，R1发布的同一天，月之暗面不得不先释出带有遗憾的版本K 1.5。最后的市场声量，不尽人意。

K2发布后的好口碑，某种程度上也抚平了被DeepSeek抢先的创伤。发布当晚，月之暗面联合创始人张宇韬则在朋友圈写下：make kimi great again。

只是，K2的先声夺人，让同样主打Coding和Agentic能力的智谱，也感受到了不甘。

我们了解到，为了打赢推理模型的SOTA之战，GLM-4.5的训练已经花了将近3个月的时间。为了在多智能体任务上获得更好的表现，智谱甚至没有坚持一以贯之的Dense（稠密）路线，而是改用了MOE（混合专家模型）架构。

“一开始GLM-4.5是想做国内第一个对标Claude 4的模型。”有从业者告诉《智能涌现》，“可惜月暗的保密工作做得太好了，K2发布当天才知道技术细节。”

智谱被月之暗面打了个措手不及，最后一个月紧急加训，硬是把GLM-4.5的Coding和Agentic能力，在测评集上拔高到了“小断”K2的程度，占住了六小虎最高的山头。

△WAIC上智谱的展台。图源：智能涌现拍摄

如今赛场上兵刃相接、针锋相对，也让这几家大模型公司像曾经的2023年一样，重回了舞台中心。

不过，与2023年行业“重参数、搞闭源”的普遍风气不同，如今的中国模型，已经把打响技术口碑给玩明白了。

自DeepSeek起势后，开源和放出技术报告，成了六小虎发模型的标配。

“模型的第一批用户，肯定是开发者，如果没有抓住开发者，模型的声量是很难起来的。”一名在WAIC上的AI应用开发者告诉我们。

他将开源，比做大模型触达开发者的门：“现在找到开发者是很简单的，大家都聚集在Hugging Face、GitHub上，模型厂商要做的就是把开源链接发到上面。”

开源是门道，剩下的，就要交给技术实力。

即便经过了动荡的半年，但六小虎依然拥有远超普通创业公司的资金和人才储备。

可见的是，在这一轮模型混战中，六小虎都没有收获将彼此碾压的成绩，但各有各的亮点：

MiniMax已经坐稳了视频生成的头部；

Kimi K2和GLM-4.5先后狂拦推理模型的SOTA；

阶跃的Step-3则领跑了多模态这一尚且小众的赛道。

没有绝对的赢家，但经历这一轮模型混战后，六小虎在全球模型战场上，几乎都拥有了姓名。

模型开放平台OpenRouter的统计显示，2025年7月28日，Kimi K2位居全球模型调用量的第6，而GLM-4.5在发布当天，就冲上了第20的位置。

MiniMax发布Hailuo 2后，Hailuo AI的下载量猛增——点点数据显示，Hailuo AI 7月22日的单日下载量，达到了11万。

△2025年7月28日，全球模型调用量排行榜。图源：OpenRouter

上岸的四小虎，获得了继续游戏的续命符。

连续5天发布包括M1在内的模型和产品后，MiniMax传来了筹备IPO的消息。同样的，在阶跃发布会上，Step-3发布后一锤定音的，是一笔来自上海国投等机构的超5亿美元融资，以及阶跃星辰CEO姜大昕口中，“10亿元”的年营收目标。

不过，模型之战，还远未决出胜者。在以“中国不需要这么多的基座模型”为共识的前提下，六小虎在模型之战中，尚未走到可以安心的时刻。

角逐不仅发生在六小虎内部。WAIC期间阿里的接连猛攻，已为六小虎敲响警钟——多模态、Coding、Agent，六小虎无法兼顾的几个模型方向，大厂却可以轻松All in。

对剩余的四小虎而言，新一轮的淘汰赛才刚刚开始。（转载自智能涌现）

扫码下载app 最新资讯实时掌握

AI 大模型

上一篇雷军朱啸虎俞敏洪纷纷下场，没有文化的「孤独生意」难有未来

下一篇阿里推出AI医学助手App「氢原子」；京东测试AIGC产品「小星绪」