×
加载中...
通义千问推出Qwen3-Max模型,号称最大最强
Horch 鞭牛士 2025-09-24 11:04

9月24日消息,通义千问团队今日推出Qwen3-Max,号称是迄今为止规模最大、能力最强的模型。

截屏2025-09-24 10.58.56.png

目前,Qwen3-Max-Instruct 的预览版在 LMArena 文本排行榜上位列第三,超越了 GPT-5-Chat。

正式版本在代码能力和智能体(agent)能力方面进一步提升,在涵盖知识、推理、编程、指令遵循、人类偏好对齐、智能体任务和多语言理解的全面基准测试中均达到业界领先水平。

Qwen3-Max模型总参数超过1T,预训练使用了36T tokens。模型结构沿用了Qwen3系列的模型结构设计范式,使用了我们提出的global-batch load balancing loss。

Qwen3-Max-Instruct的预览版已在 LMArena 文本排行榜上稳居全球前三。正式发布版本进一步提升了其能力,尤其在代码生成与智能体表现方面表现卓越。在专注于解决现实编程挑战的基准测试 SWE-Bench Verified 上,Qwen3-Max-Instruct 取得了高达69.6分的优异成绩,稳居全球顶尖模型之列。

Qwen3-Max 的推理增强版本—— Qwen3-Max-Thinking,通过集成代码解释器并运用并行测试时计算技术,展现了前所未有的推理能力,尤其在极具挑战性的数学推理基准测试 AIME 25 和 HMMT 上,均取得了满分。(AI普瑞斯编译)

更多AI资讯请点击:http://www.aipress.com.cn/

原文:http://www.aipress.com.cn/news/details?id=70640

扫码下载app 最新资讯实时掌握