最新消息:关注人工智能 AI赋能新媒体运营

Mistral公布24亿参数程序设计代理人模型Devstral 可单机本地部署

科技智能 admin 浏览 评论
图片来源:

Mistral

法国AI新创公司Mistral本周宣布协助程序设计的代理人大语言模型(LLM)Devstral,可单机部署,且号称软工能力比GPT-4.1mini、Deepseek-V3还强。

Devstral是Mistral和开源 AI程序设计师专案OpenHands(原名OpenDevin)开发商All Hands AI合作开发。在OpenHands等程序撰写平台上,Devstral可和本地codebase互动,协助加速程序开发。而且由于Devstral仅24亿参数,使其适合执行在单一GPU 如Nvidia GeForce RTX 4090或32MB RAM的Mac电脑上,很适合在本地机器上的部署。

Devstral是从Mistral-Small 3.1微调成24亿参数的模型,具备最高128k字词的长context window。它具有工具使用能力,能用工具来探索codebase、编辑多个文件,支援软工(SWE)代理人。由于它在以Mistral-Small 3.1微调前,视觉编码器已经移除,因此支援编辑代理人时,Devstral只支援文字输出输入。

根据Mistral提供的资料,在SWE-Bench Verified的标竿测试中,Devstral跑分(46.8%)优于其他模型,包括Claude 3.5 Haiku、SWE-smith-LM 32B,并大幅超越GPT-4.1-mini(23.6%)。而在以同样的测试支架(scaffold,即OpenHands)上,Devstral在SWE-Bench Verified跑分,还超过更大模型如Deepseek-V3-0324 和 Qwen3 232B-A22B。

图片来源/Mistral

Devstral目前为实验预览版,将以Apache 2.0授权开源,意谓着可作商业或非商业用途。文件公开供开发人员试用、开发或客製化。

Mistral也透过其API提供devstral-small-2025给开发人员,费用等同Mistral Small 3.1,为输入每100万字词0.1美元,输出费用为每100万字词0.3美元。

欲自行部署者,即日起可以在Hugging Face、Ollama、Kaggle、Unsloth、LM Studio等网站下载。

发表我的评论
取消评论

表情

您的回复是我们的动力!

  • 昵称 (必填)
  • 验证码 点击我更换图片

网友最新评论