最新消息:关注人工智能 AI赋能新媒体运营

Mistral开源新版小模型Magistral Small 1.2 新增视觉能力

科技智能 admin 浏览

法国AI初创公司Mistral AI本周发布并开源新版小型语言模型Magistral Small 1.2,不仅提升了性能,还新增视觉编码功能,可在MacBook电脑上运行。

Magistral Small 1.2是1.1版本的升级版。Mistral表示,该模型基于Mistral Small 3.2(2506)开发,具备推理能力,可在回答前执行一连串复杂推理,并经过监督式微调(SFT)。训练数据来源于推理模型家族中Magistral Medium在推理过程中产生的轨迹,随后通过强化学习(RL)进一步优化,最终形成这款高效的小型推理模型。Magistral Small 1.2拥有240亿参数,支持最长128K上下文窗口。

Magistral Small系列均支持本地部署,经过量化(quantized)后可在配备Nvidia RTX 4090 GPU的设备或32GB内存的MacBook上运行。

与前一版本相比,Magistral Small 1.2新增了视觉编码器,能够接收多模态输入,包括文本和图像,推理能力也扩展至视觉领域。性能方面也有提升,在数学和编程基准测试中的得分提高了15%。此外,新模型增强了工具使用能力,可调用外部工具进行网络搜索、执行代码或生成图像。同时,该模型的回复更加清晰自然,文本排版和符号使用也更为美观。

Magistral Small 1.2支持20多种语言,包括英语、法语、德语、西班牙语、中文、日语、韩语等。

Mistral同时更新了其推理模型Magistral Medium 1.2,增加了视觉支持功能。与Small版本一样,Medium版本也支持最长128K上下文窗口。两个模型均以Apache 2.0许可证开源,允许用于商业或非商业用途,并可自由修改和分发。