最新消息:关注人工智能 AI赋能新媒体运营

小米发布MiMo-V2.5大模型,正式开启公测

科技资讯 admin 浏览

小米发布MiMo-V2.5系列大模型,开源双旗舰引爆开发者圈

4月23日凌晨,小米正式推出MiMo-V2.5系列大模型,并同步开启全球公测。这不是一次普通的版本迭代,而是小米在AI基础设施上的全面升级。此次发布的系列包含四款模型:MiMo-V2.5、V2.5-Pro、V2.5-TTS(语音合成)和V2.5-ASR(语音识别)。最引人注目的是,小米宣布将V2.5-Pro和V2.5两款核心模型向全球开源,代码、权重全部开放,开发者可免费下载、商用、二次开发。这一举动让不少开发者直呼“没想到”——作为一家以硬件起家的公司,小米这次选择直接下场构建AI生态,而非仅做应用层整合。

s_610725b5f40448c8ac1cd54dd55ac999.png

百万上下文不是噱头,北大编译器项目实测惊人

MiMo-V2.5-Pro被定位为“长任务专家”,最大支持100万Token的上下文窗口——这在当前主流模型中属于第一梯队。但小米没停留在参数宣传,而是用一个硬核案例证明了它的能力:在北大《编译原理》课程的SysY编译器开发项目中,学生通常需要数周时间完成从语法分析、中间代码生成到目标代码优化的全流程。而MiMo-V2.5-Pro仅用4.3小时,通过672次工具调用,独立完成全部编码、调试与测试,最终通过所有验收用例,获得满分。

这不是模拟环境下的“跑分秀”,而是真实代码库的完整交付。项目负责人表示,模型不仅准确理解了课程文档中的抽象语法定义,还能根据错误日志自主调整编译器结构,甚至主动优化了内存分配逻辑。这种在长时间、多步骤任务中保持逻辑连贯的能力,让不少开源社区的开发者开始将其与Claude 3.5 Opus、GPT-4o等闭源模型做横向对比。目前,V2.5-Pro已在GitHub上线,支持Hugging Face和ModelScope两种部署方式,已有超过1.2万开发者下载使用。

image.png

标准版V2.5更强更便宜,多模态能力直逼行业顶尖

很多人以为Pro是唯一值得用的版本,但MiMo-V2.5标准版的表现反而更让人意外。它在图像、音频、视频三模态融合处理上表现突出,尤其在处理带图表的PDF文档、理解短视频中的关键动作、识别方言语音等实际场景中,准确率明显优于上一代Pro版本。在MMLU、MMBench、VideoMME等权威评测中,V2.5综合得分已超过Llama 3.1 70B和Gemini 1.5 Flash。

更关键的是成本。小米通过模型压缩和推理优化,将API调用费用砍掉近一半。以处理一张包含5张图表的科研论文为例,过去需要消耗2000 Token,现在仅需900 Token,且结果更精准。一位独立开发者在博客中分享:“我用V2.5替换了之前用的GPT-4 API,月支出从800美元降到320美元,效果反而更好。”

image.png

Token计费大改革:不再为“长文本”多花钱

这次小米在收费模式上也动了真格。过去很多大模型平台对长上下文实行“倍率计费”,比如20万Token收1倍,50万收2倍,100万收3倍。而MiMo-V2.5系列彻底取消这种设计——无论你用1万Token还是100万Token,每千Token价格统一。这意味着,做长文档分析、写代码、处理会议录音的用户,再也不用担心“越用越贵”。

同时,小米上线了“夜间特惠”计划:每天23:00至次日7:00,API调用价格再打七折。对全球开发者来说,这相当于把服务器成本摊到了低峰时段。此外,企业用户可开启“自动续费+用量封顶”功能,避免意外超支。一位深圳AI创业公司CTO告诉媒体:“我们测试了两周,发现用MiMo的总成本比用OpenAI低63%,而且响应速度更稳定。”

开源+低价+全模态,小米正在悄悄改变AI开发格局

过去,大模型是大厂的专利,开发者要么用昂贵的API,要么自己训练千亿参数模型。而小米这次,用开源放开了技术门槛,用价格打破了使用壁垒,用真实能力赢得了信任。目前,MiMo-V2.5系列已在小米手机、智能家居、汽车系统中逐步落地,这意味着它的能力不是“实验室玩具”,而是真实产品线的支撑。

开源地址:https://github.com/xiaomi/mimo-v2.5 文档与教程:https://mimo.xiaomi.com/docs API注册入口:https://api.mimo.xiaomi.com

如果你是独立开发者、开源项目维护者,或者正在为AI项目控制成本,现在可能是你重新评估模型选型的最佳时机。小米没喊“颠覆”,但它的动作,已经让很多人开始重新思考:AI,真的只能靠巨头垄断吗?