Anthropic 正式发布 Claude Opus 4.8,价格与上代保持不变。

Opus 4.8 还与几个新功能一起发布:
claude.ai 上的用户现在可以控制 Claude 在任务上投入的推理强度。
Claude Code 具有新的“动态工作流程”功能,使其能够解决非常大规模的问题。
Opus 4.8 的快速模式——该模型可以以2.5倍的速度工作——现在比以前的型号便宜三倍。
Opus 4.8 全面领先前代
Opus 4.8 在编码、代理技能、推理和实用知识工作任务测试方面与其他模型的比较。
Opus 4.8 全面领先 4.7,大多数项目也超过 GPT-5.5 和 Gemini 3.1 Pro。
最大改进是诚实
官方称 Opus 4.8 最突出的改进之一是它的诚实。
早期测试人员报告说,Opus 4.8 更有可能标记其工作的不确定性,不太可能提出未经证实的声明。这一点在评估中得到了证实,这些评估表明,Opus 4.8 允许其编写的代码中的缺陷不经人评论的可能性比其4.7低四倍左右。
评估还显示,Opus 4.8 的错位行为(如欺骗或合作滥用)率大大低于 Opus 4.7,与自家最佳对齐模型 Claude Mythos Preview 相似。
Anthropic 提到自家最强模型 Claude Mythos Preview,已经在少数公司在用,预计在未来几周内将 Mythos 级模型带给所有客户。(转载自AI普瑞斯)
扫码下载app 最新资讯实时掌握
