3月6日消息,OpenAI宣布,GPT-5.4 Thinking与GPT-5.4 Pro已开始在ChatGPT中推出,同时GPT-5.4也已向API和Codex开放。
新模型将其在推理、编程以及代理式工作流方面的最新能力整合为统一模型体系。

此次发布属于 GPT-5 系列的最新一次升级。此前 OpenAI 已先后推出 GPT-5、GPT-5.1、GPT-5.2 以及面向编程任务的 GPT-5.3 Codex,而 GPT-5.4 Thinking 被定位为该系列新的推理模型。
OpenAI称,新模型在多个能力评测中相较前代取得明显提升。

在计算机操作能力测试中,GPT-5.4 Thinking得分75%,不仅高于GPT-5.2 Thinking的47.3%,也超过Anthropic Claude Opus 4.6的72.7%。
在知识型任务评测中,GPT-5.4 Thinking得分83%,高于GPT-5.2与GPT-5.3 Codex的70.9%。
在软件工程基准 SWE-Bench Pro中,新模型得分57.7%,同样超过GPT-5.3 Codex的56.8%,显示其在真实代码任务中的改进。
此外,在代理浏览能力BrowseComp测试中,GPT-5.4 Pro达到89.3%,高于Claude Opus 4.6的84%以及Google Gemini 3.1 Pro的85.9%。
OpenAI表示,GPT-5.4的目标是统一推理模型与编程模型的能力,减少开发者在ChatGPT与Codex之间切换的需求,并提升复杂任务处理能力。
部分测试显示,新模型在前端开发等复杂编程场景中的表现优于GPT-5.3 Codex,同时响应速度也有所提升。
在产品层面,GPT-5.4 Thinking还加入了新的交互能力,例如在回答复杂问题前先生成推理计划,让用户可以在模型思考过程中调整方向,从而减少多轮对话。
目前,GPT-5.4 Thinking已开始向ChatGPT Plus、Team 和Pro用户逐步开放,而GPT-5.4 Pro则主要面向需要更高算力和复杂任务处理能力的企业与开发者。(转载自AI普瑞斯)
扫码下载app 最新资讯实时掌握
