最新消息:关注人工智能 AI赋能新媒体运营

DeepSeek推出最新版模型DeepSeek V3.2,首次整合工具使用能力

科技资讯 admin 浏览

中国AI初创公司DeepSeek本周发布了最新模型DeepSeek v3.2,首次将推理能力与工具使用能力深度融合。

DeepSeek v3.1是一款在计算效率、代理性能和推理能力之间取得良好平衡的模型。除了v3.2版本,该公司还开源了强化推理能力的DeepSeek v3.2-Speciale。

DeepSeek最新版本v3.2是v3.2-Exp的升级版,基于三项关键技术突破。首先是DeepSeek稀疏注意力机制,可显著降低计算复杂度,同时保持模型性能,尤其在长上下文场景中表现优异。其次是可扩展的强化学习框架,通过实施强化学习并扩大后训练计算规模,DeepSeek v3.2的性能可媲美OpenAI最新推出的GPT-5。

DeepSeek v3.2-Speciale的性能甚至超越GPT-5,其推理能力与Google Gemini 3.0-Pro相当。后者在2025年国际数学奥林匹克(IMO)和国际信息学奥林匹克(IOI)测试中均达到金牌水平,并在ICPC世界赛和IMO测试中表现优异。

第三项突破是大规模代理任务合成管道。研究团队开发了新型合成管道,可系统化生成大量训练数据,有助于大规模代理后训练,从而提升模型在复杂交互环境中的任务服从性与泛化能力。DeepSeek v3.2的训练数据包含超过1800种情境下的8.5万条指令。

DeepSeek表示,v3.2是该公司首个将思维能力直接整合到工具使用能力中的模型,无论在“思维模式”还是“非思维模式”下均支持工具调用。但v3.2-Speciale专为深度推理任务设计,不支持工具调用。

此外,DeepSeek v3.2更新了对话模板,主要调整了工具调用格式,并新增了“以工具思考”的功能。公司还提供了配套工具,在专用encoding文件夹中包含Python示例代码,用于将OpenAI兼容格式的对话消息编码为模型可接受的输入字符串,并附有测试用例,以降低开发者迁移成本。

两个模型均以MIT许可证开源。目前,DeepSeek v3.2已通过DeepSeek App、网页端和API上线,DeepSeek v3.2-Speciale目前仅提供API访问。