8月21日,DeepSeek官方宣布,正式发布 DeepSeek-V3.1。
据官方介绍,本次升级包含以下主要变化:
混合推理架构:一个模型同时支持思考模式与非思考模式;
相比 DeepSeek-R1-0528,DeepSeek-V3.1-Think 能在更短时间内给出答案;
通过 Post-Training 优化,新模型在工具使用与智能体任务中的表现有较大提升。
官方 App 与网页端模型已同步升级为 DeepSeek-V3.1。用户可以通过“深度思考”按钮,实现思考模式与非思考模式的自由切换。
DeepSeek API 也已同步升级,deepseek-chat 对应非思考模式,deepseek-reasoner 对应思考模式,且上下文均已扩展为 128K。同时,API Beta 接口支持了 strict 模式的 Function Calling,以确保输出的 Function 满足 schema 定义。另外,DeepSeek还增加了对 Anthropic API 格式的支持。
此外,DeepSeek还宣布,将于北京时间 2025 年 9 月 6 日凌晨起,对 DeepSeek 开放平台 API 接口调用价格进行如下调整:执行新版价格表(如下图所示,详见定价页面);取消夜间时段优惠。
官方称,在 9 月 6 日前,所有 API 服务仍按原价格政策计费,用户可继续享受当前优惠。
值得一提的是,DeepSeek-V3.1使用了UE8M0 FP8 Scale的参数精度,官方解释称,UE8M0 FP8是针对即将发布的下一代国产芯片设计。
