DeepSeek-V3.1正式发布，主打Agent能力并调整API定价，AI竞赛加速

时间：2025年08月21日 15:11:28 中财网

[01导读] [第02页]

2 DeepSeek-V3.1正式发布，主打Agent能力并调整API定价，AI竞赛加速

　　21日，DeepSeek宣布，DeepSeek发布了其最新的大语言模型DeepSeek-V3.1，通过引入混合推理架构和显著增强的智能体(Agent)能力，进一步加剧了全球AI市场的技术竞赛。

　　V3.1版本的核心亮点是采用了全新的混合推理架构，允许模型在一个统一框架内支持“思考”与“非思考”两种模式。根据官方公告，新版本通过训练后优化，在工具使用与编程、搜索等智能体任务上表现获得较大提升。

　　据社区测试数据显示，新模型在Aider多语言编程基准测试中得分超越了Anthropic的Claude 4 Opus，同时保持了显著的成本优势。这一性能突破已在开发者社区引发广泛关注，模型在Hugging Face平台的热度迅速攀升。

　　DeepSeek同步升级了API接口，将上下文窗口扩展至128K，并新增了对Anthropic API格式的支持以简化迁移。更重要的是，公司宣布将于2025年9月6日起执行新的API定价方案并取消夜间优惠，这被视为其在服务能力扩容后，加速商业化进程的关键一步。

　　混合推理架构，迈向Agent时代据DeepSeek官网，本次升级包含以下主要变化：
　　混合推理架构：一个模型同时支持思考模式与非思考模式；更高的思考效率：相比 DeepSeek-R1-0528，DeepSeek-V3.1-Think 能在更短时间内给出答案；更强的 Agent 能力：通过 Post-Training 优化，新模型在工具使用与智能体任务中的表现有较大提升。在效率方面，新的思考模式(V3.1-Think)经过思维链压缩训练，相比上一代模型(R1-0528)，在任务表现基本持平的情况下，token消耗量可减少20%至50%。

　　新模型着重强化了以编程和搜索为代表的Agent能力。根据DeepSeek公布的数据，V3.1在代码修复(SWE)和命令行终端任务(Terminal-Bench)测试中，性能相较于公司以往模型有明显提高。在搜索任务上，模型在需要多步推理的复杂搜索测试(browsecomp)中也大幅领先。

　　社区进行的第三方测试进一步证实了其编程能力的跃升。数据显示，在Aider编程基准上，V3.1取得了71.6%的高分，超越了包括Claude 4 Opus在内的多个知名模型。同时，该测试也凸显了其成本效益，完成一次编程任务的成本仅为1.01美元，远低于部分专有闭源模型。这些性能指标的提升，直接增强了DeepSeek在自动化编程和复杂信息处理等商业场景中的吸引力。

　　开源与API更新同步推进DeepSeek继续其开源策略，已将V3.1的Base模型和后训练模型在Hugging Face与魔搭社区上发布。据称，此次发布的模型参数量为685B，Base模型在V3基础上额外进行了840B token的训练。公司特别提醒开发者，新模型采用了UE8M0 FP8 Scale的参数精度，且分词器(tokenizer)和聊天模板有较大调整，部署时需参考最新文档。

　　与此同时，API服务也全面升级。除了将上下文长度扩展至128K外，DeepSeek还为开发者提供了更强大的工具调用功能，例如支持strict模式的Function Calling以确保输出格式的规范性。

　　此外，为降低生态迁移成本，API增加了对Anthropic API格式的兼容支持，方便使用Claude Code框架的开发者接入DeepSeek模型。

　　商业化提速：API价格调整在即DeepSeek将于北京时间2025年9月6日凌晨起，对DeepSeek开放平台API接口调用价格进行如下调整：
　　输入：0.5元/百万tokens(缓存命中)；4元/百万tokens(缓存未命中)输出：12元/百万 tokens。

(华尔街见闻　张雅琦)

[01导读] [第02页]

　中财网