Mistral Small 4 发布：更强更省的三位一体开源模型

Mistral Small4 开源：一个模型，搞定所有事

今天，Mistral AI 正式开源了 Mistral Small4 —— 不是又一个“升级版”，而是一个真正把多个能力揉进一个模型里的产品。它不再是你在“快”和“强”之间做选择时的妥协，而是直接把逻辑推理、图像理解、代码生成全塞进了一个开源模型里，而且还是 Apache 2.0 许可，商用无压力。

过去你可能要分别调用三个模型：一个用来写代码，一个用来分析图表，一个用来解数学题。现在，你只需要一个 Mistral Small4。它能看图、能写 Python、能推理出你没说清楚的意图。开发者社区早就喊着要“一模型多用”，这次 Mistral 真的把这事做成了。

128个专家，只用60亿参数在干活

Mistral Small4 总参数量高达1190亿，但别被数字吓到——它用的是 MoE（混合专家）架构，每个请求进来，系统只会激活其中4个专家模块，实际运行时只动用约60亿参数。这就像请了128个专家开会，但每次只叫4个人进会议室，效率高、成本低。

实测表明，在同等硬件下，它的推理速度比前代快了40%，同时支持256k上下文长度。这意味着你可以直接丢进去一份50页的PDF合同、一整段前端代码、一张产品设计图，它能同时理解内容、找出矛盾点、甚至帮你写个修复方案。

“调一下强度”：快响应，还是深思考，你说了算

最实用的一个功能，是“可配置推理强度”。你不需要改代码、换模型，只要在调用时加一行参数：

选“轻量模式”：响应快，适合聊天机器人、客服自动回复，延迟降低40%；
选“深度模式”：花时间思考，适合写复杂算法、分析财报、生成测试用例，吞吐量提升3倍。

有开发者在 Hugging Face 上测试后说：“我以前得用两个模型串起来做需求分析，现在一个请求就搞定，省了两次API调用，也省了调试的麻烦。”

加入NVIDIA Nemotron联盟，不是蹭热度

同一天，Mistral AI 宣布成为 NVIDIA 新成立的 Nemotron 联盟创始成员。这不是公关动作——Nemotron 是 NVIDIA 为加速企业级AI模型落地组建的生态，成员包括 Meta、AMD、Databricks 等。Mistral Small4 已经原生支持 NVIDIA TensorRT-LLM，能在 H100 和 Blackwell 上跑出最佳性能，企业部署成本直降。

目前，Small4 的权重已在 Hugging Face 和 ModelScope 开放下载，支持 GGUF、AWQ、FP8 等主流量化格式，连 4-bit 量化版都能在消费级显卡上跑起来。不少个人开发者已经用它跑起了本地代码助手 + 图片问答的桌面应用。

开源，不是口号，是行动

过去几年，很多公司嘴上说“开源”，实际上只放个轻量版，核心能力全藏在API里。Mistral Small4 不一样——完整权重、完整架构、完整训练细节，全公开。你甚至可以自己微调，加个行业术语库，变成你公司的专属智能体。

有人在 GitHub 上分享了用 Small4 做的“图纸理解助手”：上传一张机械设计图，它能自动标注尺寸、指出结构风险、生成对应的 SolidWorks 脚本。这不是演示，是真实项目。

如果你是开发者、产品经理、或者只是想在本地跑个全能AI助手，Mistral Small4 是今年最值得试试的开源模型之一。它不炫技，不吹牛，只是把该做的都做了——而且，免费。

CB科技站