DeepSeek推出最新版模型DeepSeek V3.2，首次整合工具使用能力

中国AI初创公司DeepSeek本周发布了最新模型DeepSeek v3.2，首次将推理能力与工具使用能力深度融合。

DeepSeek v3.1是一款在计算效率、代理性能和推理能力之间取得良好平衡的模型。除了v3.2版本，该公司还开源了强化推理能力的DeepSeek v3.2-Speciale。

DeepSeek最新版本v3.2是v3.2-Exp的升级版，基于三项关键技术突破。首先是DeepSeek稀疏注意力机制，可显著降低计算复杂度，同时保持模型性能，尤其在长上下文场景中表现优异。其次是可扩展的强化学习框架，通过实施强化学习并扩大后训练计算规模，DeepSeek v3.2的性能可媲美OpenAI最新推出的GPT-5。

DeepSeek v3.2-Speciale的性能甚至超越GPT-5，其推理能力与Google Gemini 3.0-Pro相当。后者在2025年国际数学奥林匹克（IMO）和国际信息学奥林匹克（IOI）测试中均达到金牌水平，并在ICPC世界赛和IMO测试中表现优异。

第三项突破是大规模代理任务合成管道。研究团队开发了新型合成管道，可系统化生成大量训练数据，有助于大规模代理后训练，从而提升模型在复杂交互环境中的任务服从性与泛化能力。DeepSeek v3.2的训练数据包含超过1800种情境下的8.5万条指令。

DeepSeek表示，v3.2是该公司首个将思维能力直接整合到工具使用能力中的模型，无论在“思维模式”还是“非思维模式”下均支持工具调用。但v3.2-Speciale专为深度推理任务设计，不支持工具调用。

此外，DeepSeek v3.2更新了对话模板，主要调整了工具调用格式，并新增了“以工具思考”的功能。公司还提供了配套工具，在专用encoding文件夹中包含Python示例代码，用于将OpenAI兼容格式的对话消息编码为模型可接受的输入字符串，并附有测试用例，以降低开发者迁移成本。

两个模型均以MIT许可证开源。目前，DeepSeek v3.2已通过DeepSeek App、网页端和API上线，DeepSeek v3.2-Speciale目前仅提供API访问。

CB科技站

DeepSeek推出最新版模型DeepSeek V3.2，首次整合工具使用能力

与本文相关的文章