小米发布MiMo-V2.5大模型，正式开启公测

小米发布MiMo-V2.5系列大模型，开源双旗舰引爆开发者圈

4月23日凌晨，小米正式推出MiMo-V2.5系列大模型，并同步开启全球公测。这不是一次普通的版本迭代，而是小米在AI基础设施上的全面升级。此次发布的系列包含四款模型：MiMo-V2.5、V2.5-Pro、V2.5-TTS（语音合成）和V2.5-ASR（语音识别）。最引人注目的是，小米宣布将V2.5-Pro和V2.5两款核心模型向全球开源，代码、权重全部开放，开发者可免费下载、商用、二次开发。这一举动让不少开发者直呼“没想到”——作为一家以硬件起家的公司，小米这次选择直接下场构建AI生态，而非仅做应用层整合。

百万上下文不是噱头，北大编译器项目实测惊人

MiMo-V2.5-Pro被定位为“长任务专家”，最大支持100万Token的上下文窗口——这在当前主流模型中属于第一梯队。但小米没停留在参数宣传，而是用一个硬核案例证明了它的能力：在北大《编译原理》课程的SysY编译器开发项目中，学生通常需要数周时间完成从语法分析、中间代码生成到目标代码优化的全流程。而MiMo-V2.5-Pro仅用4.3小时，通过672次工具调用，独立完成全部编码、调试与测试，最终通过所有验收用例，获得满分。

这不是模拟环境下的“跑分秀”，而是真实代码库的完整交付。项目负责人表示，模型不仅准确理解了课程文档中的抽象语法定义，还能根据错误日志自主调整编译器结构，甚至主动优化了内存分配逻辑。这种在长时间、多步骤任务中保持逻辑连贯的能力，让不少开源社区的开发者开始将其与Claude 3.5 Opus、GPT-4o等闭源模型做横向对比。目前，V2.5-Pro已在GitHub上线，支持Hugging Face和ModelScope两种部署方式，已有超过1.2万开发者下载使用。

标准版V2.5更强更便宜，多模态能力直逼行业顶尖

很多人以为Pro是唯一值得用的版本，但MiMo-V2.5标准版的表现反而更让人意外。它在图像、音频、视频三模态融合处理上表现突出，尤其在处理带图表的PDF文档、理解短视频中的关键动作、识别方言语音等实际场景中，准确率明显优于上一代Pro版本。在MMLU、MMBench、VideoMME等权威评测中，V2.5综合得分已超过Llama 3.1 70B和Gemini 1.5 Flash。

更关键的是成本。小米通过模型压缩和推理优化，将API调用费用砍掉近一半。以处理一张包含5张图表的科研论文为例，过去需要消耗2000 Token，现在仅需900 Token，且结果更精准。一位独立开发者在博客中分享：“我用V2.5替换了之前用的GPT-4 API，月支出从800美元降到320美元，效果反而更好。”

Token计费大改革：不再为“长文本”多花钱

这次小米在收费模式上也动了真格。过去很多大模型平台对长上下文实行“倍率计费”，比如20万Token收1倍，50万收2倍，100万收3倍。而MiMo-V2.5系列彻底取消这种设计——无论你用1万Token还是100万Token，每千Token价格统一。这意味着，做长文档分析、写代码、处理会议录音的用户，再也不用担心“越用越贵”。

同时，小米上线了“夜间特惠”计划：每天23:00至次日7:00，API调用价格再打七折。对全球开发者来说，这相当于把服务器成本摊到了低峰时段。此外，企业用户可开启“自动续费+用量封顶”功能，避免意外超支。一位深圳AI创业公司CTO告诉媒体：“我们测试了两周，发现用MiMo的总成本比用OpenAI低63%，而且响应速度更稳定。”

开源+低价+全模态，小米正在悄悄改变AI开发格局

过去，大模型是大厂的专利，开发者要么用昂贵的API，要么自己训练千亿参数模型。而小米这次，用开源放开了技术门槛，用价格打破了使用壁垒，用真实能力赢得了信任。目前，MiMo-V2.5系列已在小米手机、智能家居、汽车系统中逐步落地，这意味着它的能力不是“实验室玩具”，而是真实产品线的支撑。

开源地址：https://github.com/xiaomi/mimo-v2.5 文档与教程：https://mimo.xiaomi.com/docs API注册入口：https://api.mimo.xiaomi.com

如果你是独立开发者、开源项目维护者，或者正在为AI项目控制成本，现在可能是你重新评估模型选型的最佳时机。小米没喊“颠覆”，但它的动作，已经让很多人开始重新思考：AI，真的只能靠巨头垄断吗？

CB科技站