最新消息:关注人工智能 AI赋能新媒体运营

小米MiMo大模型上线付费功能,正式进入收费时代

科技资讯 admin 浏览

小米开源大模型 MiMo-V2-Flash 正式开启付费模式,免费额度依然可用

小米近日宣布,其开源大模型 MiMo-V2-Flash 的 API 正式上线充值功能,意味着这款备受关注的模型即将进入商业化阶段。不过,小米明确表示:所有用户仍可免费使用一定额度的 API 调用,不会因为充值功能的上线而立即收费。系统将在近期正式计费,但在那之前,你依然可以放心调用,不消耗任何免费额度,也不用担心“被扣钱”。

目前,用户可以在个人账户的余额页面查看自己的免费额度详情。这个免费额度不是“试用期”,而是长期有效的基础用量,适合日常轻量使用——比如写个周报、查个资料、写点简单代码,完全够用。真正需要高频调用的开发者、企业用户,才需要考虑充值。

价格透明,国内便宜,海外友好

小米公布的计费标准非常清晰,没有隐藏费用:

  • 国内价格:输入每百万 tokens 0.7元,命中缓存的输入只要 0.07元(便宜10倍),输出每百万 tokens 2.1元。
  • 海外价格:输入每百万 tokens 0.1美元,缓存输入 0.01美元,输出 0.3美元。

对比市面上其他主流模型,这个价格相当有竞争力。尤其缓存命中后的价格,几乎是行业最低水平。这意味着如果你的应用有重复请求(比如问答系统、客服机器人),实际使用成本会低得惊人。

支付方式也照顾到了不同用户习惯:

  • 国内用户:需完成实名认证,支持小米支付、支付宝、微信支付。
  • 海外用户:无需实名,直接用 Apple Pay、Google Pay、Visa/Mastercard 就能充值。

这种区分处理,既符合国内监管要求,又避免了海外用户被复杂的认证流程劝退,细节上看得出小米是真想让全球开发者用起来。

3090亿参数,跑得比豆包、DeepSeek还快

MiMo-V2-Flash 不是“纸上谈兵”的模型。它总参数量高达 3090 亿,激活参数 150 亿——这个规模在开源模型里属于第一梯队。但真正让用户拍手的,是它的速度。

不少开发者实测反馈,MiMo-V2-Flash 在响应速度上明显快于豆包、DeepSeek、元宝等主流模型。一个典型的对话请求,平均延迟控制在 1.2 秒以内,代码生成、逻辑推理、多轮对话的流畅度,甚至接近部分闭源模型。有开发者在社区晒出对比视频:同样是写一个 Python 爬虫,MiMo-V2-Flash 两秒出结果,其他模型要三秒以上,还经常卡顿。

在 HumanEval、MMLU、GSM8K 等权威测试中,它的综合得分稳居开源模型前五,部分任务甚至超过 Llama 3 70B。更重要的是——它开源了,你可以在 Hugging Face 上直接下载权重,本地部署,不依赖云端。

不只是AI,是能用的工具

小米没把 MiMo-V2-Flash 当成“炫技项目”。它已经嵌入到小米手机的“小爱同学”、汽车智能座舱、智能家居控制中。如果你用小米手机,你可能已经在不知不觉中用过它了。

现在,开发者也能直接调用它做自己的应用。有人用它做法律文书生成,有人用它写自动化脚本,还有团队用它搭建了内部知识库问答系统,成本比用 GPT-4 低了八成。

目前,官方已开放开发者文档和 SDK,GitHub 上的示例项目更新频繁,社区活跃度在上升。如果你是独立开发者、初创公司,或者只是想试试“不花钱也能用上好模型”,现在就是最好的时机——免费额度还在,价格还没涨,速度还快。

未来,小米计划推出更多针对教育、医疗、制造业的垂直优化版本。但眼下,MiMo-V2-Flash 已经不是“未来科技”,它就在你手边,随时能用。

image.png