小米MiMo大模型上线付费功能，正式进入收费时代

小米开源大模型 MiMo-V2-Flash 正式开启付费模式，免费额度依然可用

小米近日宣布，其开源大模型 MiMo-V2-Flash 的 API 正式上线充值功能，意味着这款备受关注的模型即将进入商业化阶段。不过，小米明确表示：所有用户仍可免费使用一定额度的 API 调用，不会因为充值功能的上线而立即收费。系统将在近期正式计费，但在那之前，你依然可以放心调用，不消耗任何免费额度，也不用担心“被扣钱”。

目前，用户可以在个人账户的余额页面查看自己的免费额度详情。这个免费额度不是“试用期”，而是长期有效的基础用量，适合日常轻量使用——比如写个周报、查个资料、写点简单代码，完全够用。真正需要高频调用的开发者、企业用户，才需要考虑充值。

价格透明，国内便宜，海外友好

小米公布的计费标准非常清晰，没有隐藏费用：

国内价格：输入每百万 tokens 0.7元，命中缓存的输入只要 0.07元（便宜10倍），输出每百万 tokens 2.1元。
海外价格：输入每百万 tokens 0.1美元，缓存输入 0.01美元，输出 0.3美元。

对比市面上其他主流模型，这个价格相当有竞争力。尤其缓存命中后的价格，几乎是行业最低水平。这意味着如果你的应用有重复请求（比如问答系统、客服机器人），实际使用成本会低得惊人。

支付方式也照顾到了不同用户习惯：

国内用户：需完成实名认证，支持小米支付、支付宝、微信支付。
海外用户：无需实名，直接用 Apple Pay、Google Pay、Visa/Mastercard 就能充值。

这种区分处理，既符合国内监管要求，又避免了海外用户被复杂的认证流程劝退，细节上看得出小米是真想让全球开发者用起来。

3090亿参数，跑得比豆包、DeepSeek还快

MiMo-V2-Flash 不是“纸上谈兵”的模型。它总参数量高达 3090 亿，激活参数 150 亿——这个规模在开源模型里属于第一梯队。但真正让用户拍手的，是它的速度。

不少开发者实测反馈，MiMo-V2-Flash 在响应速度上明显快于豆包、DeepSeek、元宝等主流模型。一个典型的对话请求，平均延迟控制在 1.2 秒以内，代码生成、逻辑推理、多轮对话的流畅度，甚至接近部分闭源模型。有开发者在社区晒出对比视频：同样是写一个 Python 爬虫，MiMo-V2-Flash 两秒出结果，其他模型要三秒以上，还经常卡顿。

在 HumanEval、MMLU、GSM8K 等权威测试中，它的综合得分稳居开源模型前五，部分任务甚至超过 Llama 3 70B。更重要的是——它开源了，你可以在 Hugging Face 上直接下载权重，本地部署，不依赖云端。

不只是AI，是能用的工具

小米没把 MiMo-V2-Flash 当成“炫技项目”。它已经嵌入到小米手机的“小爱同学”、汽车智能座舱、智能家居控制中。如果你用小米手机，你可能已经在不知不觉中用过它了。

现在，开发者也能直接调用它做自己的应用。有人用它做法律文书生成，有人用它写自动化脚本，还有团队用它搭建了内部知识库问答系统，成本比用 GPT-4 低了八成。

目前，官方已开放开发者文档和 SDK，GitHub 上的示例项目更新频繁，社区活跃度在上升。如果你是独立开发者、初创公司，或者只是想试试“不花钱也能用上好模型”，现在就是最好的时机——免费额度还在，价格还没涨，速度还快。

未来，小米计划推出更多针对教育、医疗、制造业的垂直优化版本。但眼下，MiMo-V2-Flash 已经不是“未来科技”，它就在你手边，随时能用。

CB科技站

小米MiMo大模型上线付费功能，正式进入收费时代

小米开源大模型 MiMo-V2-Flash 正式开启付费模式，免费额度依然可用

价格透明，国内便宜，海外友好

3090亿参数，跑得比豆包、DeepSeek还快

不只是AI，是能用的工具

与本文相关的文章