×
加载中...
国产第一!阿里千问3.7登顶国产最佳模型
鞭牛士 2026-05-21 19:14

5月21日,第三方机构 Artificial Analysis 更新全球大模型榜单,阿里 Qwen3.7-Max 以56.6分超过Kimi、DeepSeek等国产模型,位列全球第五、国产第一。

截屏2026-05-21 19.12.47.png

但我觉得,这次最值得关注的,其实已经不是“谁第一”了。

而是国产大模型的竞争方向,彻底变了。

以前大家卷的是:谁更像最聪明的聊天机器人。

现在开始卷的是:谁更像真正能干活的AI员工。

你会发现,这次Qwen3.7-Max重点强调的,已经不是聊天能力,而是:Agent、自主编程、工具调用、长程任务。

甚至官方提到,它可以连续执行35小时任务,完成超1000次工具调用,还能兼容 Claude Code、OpenClaw、Hermes Agent 等各种Agent框架。

这背后释放了一个特别明显的信号:AI行业,正在从“聊天时代”,进入“执行时代”。

以前的大模型,更像一个会回答问题的人。但现在行业真正想做的,是一个能持续工作的数字员工。

它不仅要会聊天,还要会写代码、调工具、跑流程、拆解任务、连续执行。
而阿里现在的路线,也越来越清晰了。

Qwen快速迭代,百炼铺生态,强化Agent能力,持续推进开源。

它不像OpenAI那种“超级闭源大脑”的打法,反而越来越像:
AI时代的安卓生态。

它想做的,已经不只是一个模型。

而是未来所有AI应用、Agent、工作流背后的底层基础设施。

因为未来真正值钱的,可能已经不是“谁最会聊天”。

而是谁最能:替人真正干活。

从这个角度看,Qwen3.7-Max这次拿下国产第一,更像是一个行业信号:国产模型,已经开始从“卷参数、卷榜单”,进入“抢AI操作系统入口”的阶段了。(转载自AI普瑞斯)

扫码下载app 最新资讯实时掌握