11月18日,马斯克旗下 xAI 宣布推出最新前沿模型 Grok 4.1,这是 Grok 系列迄今最大幅度的一次升级。官方称其在“对话智能、情绪理解和现实世界任务能力”等方面全面突破,并已在 Arena 榜、EQ-Bench、Creative Writing V3 等核心榜单上取得领先。

Grok 4.1 已面向所有用户免费开放,可通过 grok.com、grok.x.com 及移动端 App 使用。马斯克本人也第一时间转发并表示,用户会“明显感受到速度和质量的提升”。
多项榜单冲顶:对话推理、情绪理解、写作能力全面跃升
根据 xAI 公布的数据:
1)Arena 榜单第一名:1483 Elo

Grok 4.1-thinking 与 Grok 4.1 分列第一、第二,领先最近的非 xAI 模型 31 分,属于断档式优势。
2)情绪智商 EQ-Bench 第一名
Grok 4.1 Thinking 在 EQ-Bench 情绪智能测试中拿到 1586 Elo,是迄今表现最强的模型,在“情绪识别、共情、人际理解”等维度上显著提升。
3)写作能力暴涨 600 分

在 Creative Writing V3 中,Grok 4.1 拿到 1722 Elo,比上一代提升高达 600 分,追平甚至逼近早期 GPT-5.1 Polaris 的水平。
4)幻觉率下降 3 倍

官方称 Grok 4.1 是目前最不易产生幻觉的 Grok 模型,相比早期 Grok 4 Fast 幻觉率下降超过 3 倍。
用户实测:65% 情况下更偏爱 Grok 4.1 的回答
xAI 表示,团队在 11 月前两周对小规模用户悄然灰度测试了 Grok 4.1。在对比中,用户在 65% 的对战结果中更喜欢 Grok 4.1 的回复。

这意味着模型升级不仅仅是参数层面的,更在实际交互体验上得到显著认可。
免费开放:所有用户可直接使用最新 Grok
与其他厂商不同,xAI 将 Grok 4.1 面向所有用户免费开放,包括非订阅用户。目前:
grok.com
grok.x.com
grok 移动端 App(grok.com/download)
均已同步模型。
Grok 的战略:用“情绪智能”和“真实世界可用性”建立差异化
从此次升级可以看出,xAI 正在有意识地强化 Grok 在以下三条赛道的竞争力:
1.情绪理解与共情能力 EQ
这是 ChatGPT、Gemini、Claude 尚未完全攻克的“人际感知”维度,Grok 此次大幅领先 EQ-Bench,策略意义明显。
2.任务实用性和减少幻觉
降低错误率意味着 Grok 在搜索、决策、推荐等结构化任务中更具可用性。
3.快速推理 + 创意写作
兼具速度与创造力,有利于进军创作工具与社交场景。
Grok 4.1 的定位正逐步从“另类、有梗”向“强推理、有温度、能办事”的通用助手转变。
Grok 4.1 不再靠“嘴臭”吸睛,而是用 EQ、写作和速度争夺下一代 AI 助手的核心场景。(转载自AI普瑞斯)
更多AI资讯请点击:http://www.aipress.com.cn/
扫码下载app 最新资讯实时掌握
