法国AI初创公司Mistral本周发布了开源软件工程模型Devstral 2、轻量版Devstral Small 2,以及CLI代理工具,正式加入软件工程代理领域的竞争,并提供一段时间的免费API访问权限。
Devstral 是专为软件工程设计的代理式大语言模型,Devstral 2 是一个1230亿参数的稠密Transformer(dense transformer)模型,支持256K上下文长度。该模型经过指令遵循微调,非常适合对话式、指令驱动和代理型任务,擅长探索代码库、编辑多个文件,驱动软件工程代理。
Mistral同时发布了240亿参数的Devstral Small 2,可在笔记本电脑上本地部署,或通过API调用运行,适合本地部署和定制化微调。
尽管Devstral 2和Devstral Small 2的参数量分别比DeepSeek V3.2小5倍和28倍,比Kimi K2小8倍和41倍,但在基准测试SWE-bench Verified上,其表现分别达到72.2%和68.0%,仅略低于谷歌Gemini 3 Pro、OpenAI GPT-4.5和Anthropic Claude 4.5 Sonnet等大厂旗舰模型,且优于Grok Code Fast 1、Owen 3 Coder Plus及DeepSeek V3.2。
两款模型的轻量化特性使其可在基础硬件上部署,显著降低了开发者、中小企业和个人用户的使用门槛。Mistral宣称,在实际任务中,Devstral 2的成本效益是Claude Sonnet的7倍。
在软件辅助能力方面,Devstral 2支持探索代码库并协同修改多个文件,能够追踪框架依赖、检测错误并修复缺陷、现代化遗留系统。它还可针对特定编程语言进行微调,或适配大型企业级代码库。Mistral提供的数据显示,Devstral 2在与DeepSeek V3.2和Claude 4.5的对比中,胜率分别为42.8%和21.4%。
Mistral还推出了基于Devstral引擎的开源命令行助手Vibe CLI,提供对话式交互,支持文件操作、代码搜索、版本控制和命令执行等功能,并具备项目感知、智能引用、多文件协同、自动补全、历史记录保存和自定义主题等能力,用户可通过自然语言探索、修改和执行代码变更。该工具可直接在终端使用,或通过Agent Communication Protocol集成到主流开发环境中。
Devstral 2采用修改版MIT许可证开源,Devstral Small 2和Mistral Vibe CLI均采用Apache 2.0许可证开源。
目前,Devstral 2可通过Mistral API免费使用一段时间。免费期结束后,API将按输入/输出(每百万token)收费:Devstral 2为0.40美元/2.00美元,Devstral Small 2为0.10美元/0.30美元。