5月21日,第三方机构 Artificial Analysis 更新全球大模型榜单,阿里 Qwen3.7-Max 以56.6分超过Kimi、DeepSeek等国产模型,位列全球第五、国产第一。

但我觉得,这次最值得关注的,其实已经不是“谁第一”了。
而是国产大模型的竞争方向,彻底变了。
以前大家卷的是:谁更像最聪明的聊天机器人。
现在开始卷的是:谁更像真正能干活的AI员工。
你会发现,这次Qwen3.7-Max重点强调的,已经不是聊天能力,而是:Agent、自主编程、工具调用、长程任务。
甚至官方提到,它可以连续执行35小时任务,完成超1000次工具调用,还能兼容 Claude Code、OpenClaw、Hermes Agent 等各种Agent框架。
这背后释放了一个特别明显的信号:AI行业,正在从“聊天时代”,进入“执行时代”。
以前的大模型,更像一个会回答问题的人。但现在行业真正想做的,是一个能持续工作的数字员工。
它不仅要会聊天,还要会写代码、调工具、跑流程、拆解任务、连续执行。
而阿里现在的路线,也越来越清晰了。
Qwen快速迭代,百炼铺生态,强化Agent能力,持续推进开源。
它不像OpenAI那种“超级闭源大脑”的打法,反而越来越像:
AI时代的安卓生态。
它想做的,已经不只是一个模型。
而是未来所有AI应用、Agent、工作流背后的底层基础设施。
因为未来真正值钱的,可能已经不是“谁最会聊天”。
而是谁最能:替人真正干活。
从这个角度看,Qwen3.7-Max这次拿下国产第一,更像是一个行业信号:国产模型,已经开始从“卷参数、卷榜单”,进入“抢AI操作系统入口”的阶段了。(转载自AI普瑞斯)
扫码下载app 最新资讯实时掌握
