最新消息:关注人工智能 AI赋能新媒体运营

小米MiMo-V2-Pro登顶Text Arena全球第五,雷军:决胜用户真实投票

科技资讯 admin 浏览

小米自研大模型 MiMo-V2-Pro 登顶全球前五,真实用户投票选出的硬实力

3月31日,雷军在社交平台晒出一组数据:小米自研的大模型 MiMo-V2-Pro,在全球知名大模型评测平台 Text Arena 中,综合排名跃居全球第五。这不是靠刷数据、蹭榜单得来的名次——而是由来自世界各地的真实用户,在完全不知道模型身份的情况下,一票一票投出来的结果。

image.png

不靠“刷榜”,靠真实体验说话

Text Arena 的评测方式很特别:所有模型都匿名上线,用户看到的只是一段段回答,不知道是来自 OpenAI、Google,还是小米。他们要做的,就是对比两个回答,选一个更好的。没有预设题库,没有针对性训练,全靠真实使用体验。

这种机制下,能冲进前五,意味着 MiMo-V2-Pro 在处理复杂逻辑、长指令理解、多轮对话连贯性这些“人用起来觉得顺不顺”的地方,已经能和全球顶尖模型掰手腕。目前排在它前面的,只有 Anthropic、OpenAI 和 Google 这三家老牌玩家。

不只是排名,MiMo-V2-Pro 在其他维度也表现亮眼:

  • 在衡量实验室整体研发能力的 ArenaExpert 榜单中,小米位列全球第四;
  • 在代码能力测试 Code Arena 中,排名第五,能写能改能调试,开发者实测反馈“够用、稳定”;
  • 自3月19日上线以来,它在 OpenRouter 上的日调用量、周调用量、趋势增长三项,全部拿下第一——不是靠补贴,是开发者主动用起来的。

不是做模型,是把AI装进每台设备

雷军说过,小米的主业从来不是AI,而是智能设备。但这次,他们没走捷径,而是砸了真金白银。

过去三年,小米在AI领域累计投入超600亿元。这笔钱没花在噱头上,而是铺在了系统底层:从 HyperOS 的智能输入法能猜你下一句想说什么,到手机、汽车、家居设备之间能“听懂”彼此——MiMo 不只是一个模型,而是一整套能驱动“人车家全生态”的大脑。

比如,现在你用小米手机语音助手问:“明天早上7点叫醒我,顺便帮我查一下去公司路上的天气和路况,再把咖啡机提前半小时启动。”——这不是预设脚本,是 MiMo 实时理解、拆解、调度多个设备完成的完整任务。

免费开放两周,开发者可以白嫖了

为了让更多的开发者和团队能亲身体验,小米官方宣布:原定3月底结束的“联合全球顶级Agent框架限时免费”活动,延长至4月2日24点。也就是说,现在起再用两周,你可以免费调用 MiMo-V2-Pro 的API,接入自己的应用、工具或机器人项目,不花一分钱。

不少国内开发者已经在社区分享使用体验:“响应快,中文理解比某些国外模型更自然”,“写个Python脚本,它能直接给你注释和优化建议”,“在车机端跑得稳,没出现过卡顿”。

国产大模型,终于有人把“能用”做成了“好用”

过去几年,我们见过太多“参数突破”“万亿token”的宣传,但用户真正关心的是:它能不能听懂我这句话?能不能帮我订到票?能不能让家里的灯按时亮?

小米没有喊“对标GPT-5”,也没搞花里胡哨的榜单排名,而是用一套真实用户投票的机制,证明了自己的模型不是“实验室玩具”,而是能落地、能被普通人天天用的工具。

当一家以手机和家电起家的企业,能把AI做到全球前五,说明真正的竞争,已经从算力和参数,转向了“谁更懂人”。

雷军说:“硬件是壳,AI才是芯。” 现在,这个芯,已经跳动起来了。