×
加载中...
刚刚!马斯克强势发布Grok 4.1
鞭牛士 2025-11-18 13:46

1118日,马斯克旗下 xAI 宣布推出最新前沿模型 Grok 4.1,这是 Grok 系列迄今最大幅度的一次升级。官方称其在“对话智能、情绪理解和现实世界任务能力”等方面全面突破,并已在 Arena 榜、EQ-BenchCreative Writing V3 等核心榜单上取得领先。


图片


Grok 4.1 已面向所有用户免费开放,可通过 grok.comgrok.x.com 及移动端 App 使用。马斯克本人也第一时间转发并表示,用户会“明显感受到速度和质量的提升”。

多项榜单冲顶:对话推理、情绪理解、写作能力全面跃升

根据 xAI 公布的数据:

1Arena 榜单第一名:1483 Elo

Image

Grok 4.1-thinking  Grok 4.1 分列第一、第二,领先最近的非 xAI 模型 31 分,属于断档式优势。

2)情绪智商 EQ-Bench 第一名

Grok 4.1 Thinking  EQ-Bench 情绪智能测试中拿到 1586 Elo,是迄今表现最强的模型,在“情绪识别、共情、人际理解”等维度上显著提升。

3)写作能力暴涨 600 

Image

 Creative Writing V3 中,Grok 4.1 拿到 1722 Elo,比上一代提升高达 600 分,追平甚至逼近早期 GPT-5.1 Polaris 的水平。

4)幻觉率下降 3 

Image

官方称 Grok 4.1 是目前最不易产生幻觉的 Grok 模型,相比早期 Grok 4 Fast 幻觉率下降超过 3 倍。

用户实测:65% 情况下更偏爱 Grok 4.1 的回答

xAI 表示,团队在 11 月前两周对小规模用户悄然灰度测试了 Grok 4.1。在对比中,用户在 65% 的对战结果中更喜欢 Grok 4.1 的回复。

Image

这意味着模型升级不仅仅是参数层面的,更在实际交互体验上得到显著认可。

免费开放:所有用户可直接使用最新 Grok

与其他厂商不同,xAI  Grok 4.1 面向所有用户免费开放,包括非订阅用户。目前:

grok.com

grok.x.com

grok 移动端 Appgrok.com/download

均已同步模型。

Grok 的战略:用“情绪智能”和“真实世界可用性”建立差异化

从此次升级可以看出,xAI 正在有意识地强化 Grok 在以下三条赛道的竞争力:

1.情绪理解与共情能力 EQ

这是 ChatGPTGeminiClaude 尚未完全攻克的“人际感知”维度,Grok 此次大幅领先 EQ-Bench,策略意义明显。

2.任务实用性和减少幻觉

降低错误率意味着 Grok 在搜索、决策、推荐等结构化任务中更具可用性。

3.快速推理 + 创意写作

兼具速度与创造力,有利于进军创作工具与社交场景。

Grok 4.1 的定位正逐步从“另类、有梗”向“强推理、有温度、能办事”的通用助手转变。

Grok 4.1 不再靠“嘴臭”吸睛,而是用 EQ、写作和速度争夺下一代 AI 助手的核心场景。(转载自AI普瑞斯)

更多AI资讯请点击:http://www.aipress.com.cn/ 

扫码下载app 最新资讯实时掌握