×
加载中...
刚刚!OpenAI正式推出GPT-5.1 Pro
鞭牛士 2025-11-20 11:09

OpenAI 今日宣布向所有 Pro 用户正式推送 GPT-5.1 Pro相比基础版 GPT-5.1,新版本在复杂任务处理、写作、数据科学与商业分析等专业场景中显著增强,定位为“高级能力款”,主打更清晰、更智能、更可靠的输出。

图片

与此同时,OpenAI CEO Sam Altman 也对外确认,全新的 GPT-5.1 Codex-Max(代码模型)性能有重大提升,在 METR 测评中达到 2 小时 42 分钟的任务长度(50% accuracy),比 GPT-5 再延长 25 分钟。这意味着模型能在“更少人类介入”的情况下,独立完成更长链条的技术任务,代表着 LLM 在自动化工程能力上的又一次进阶。

图片

GPT-5.1 Pro:为更重的“工作场景”而来

根据 OpenAI 公布的信息,GPT-5.1 Pro 相较 GPT-5.1 在多项关键能力上进行了深度强化:

回答更清晰、逻辑链更完整。面对多步骤逻辑、论文级写作、企业分析等任务,GPT-5.1 Pro 输出的结构化程度更高,减少模型“跳步”或模糊回答的情况。

写作、数据分析、商业场景全面增强,OpenAI 表示 GPT-5.1 Pro 对复杂文本创作、数据处理、策略制定等专业领域都有明显提升,是“为实际工作准备的版本”。

GPT-5 在未来三个月内逐步退出默认选项,GPT-5.1 Pro 将作为 Pro 用户的主力模型,GPT-5 进入三个月的“迁移期”。这意味着 GPT-5 系列将全面升级至 5.1 世代,统一体验。

Codex-Max:开发者最关注的“大进步”出现了

Sam Altman 转发测评并给出一句简短评价:

New Codex model is a significant improvement!

METR 官方数据显示:

GPT-5.1 Codex-Max,任务可持续长度:小时 42 分钟(50% accuracy),比 GPT-5 再提升 25 分钟,平均得分:71.6%。

Codex-Max 更像是“自动化程序员 2.0,能在更长时间内保持一致推理链,不崩溃、不跳步,意味着自主完成复杂工程任务的能力正在快速逼近实用化阈值。

这类测评任务包括:漏洞利用(buffer overflow)、网站反爬抓取、修复 Python 库、训练模型以及更多高强度技术工作。

这也印证了一个趋势:

未来的 AI 工程师不是“编码补充工具”,而是“从头到尾自动跑一个项目的实体”。

GPT-5.1 家族完成一次“质变升级”

随着 GPT-5.1 InstantGPT-5.1 ThinkingGPT-5.1 Pro  GPT-5.1 Codex-Max 全面上线,OpenAI 等于一次性更新了“对话智能 + 推理智能 + 工作智能 + 编码智能”四条主线。

更关键的是:这次升级没有再强调“AGI或“superintelligence,而是直接把能力推向可落地的专业场景。

换句话说,ChatGPT 不再只是一个聊天机器人,而是:写作助手、数据分析师、商业顾问、自动化程序员和研究助理。

统一于一体的“AI 工作 OS雏形已经越来越清晰。

OpenAI 这波不是更新模型,而是在告诉所有 SaaS以后你们的功能,GPT 自己能做。(转载自AI普瑞斯)

更多AI资讯请点击:http://www.aipress.com.cn/

扫码下载app 最新资讯实时掌握