中国移动发布MoMA平台，AI算力成本下降30%

MoMA平台上线：中国移动让大模型真正用起来

2026年移动云大会现场，中国移动正式发布“移动模型服务平台”（MoMA）。这不是又一个PPT里的概念，而是一个已经跑在真实业务里的系统——从银行风控到医院辅助诊断，从教育答疑到政务热线，已经有上百家企业在用它替代过去零散、昂贵、难维护的模型调用方式。

过去企业想用AI，得找好几个供应商，签多个合同，调多个接口，还要自己管模型版本、算力分配、故障排查。现在，只要接入MoMA，300多个主流模型一键可用。不只是“九天”这样的自研模型，DeepSeek、通义千问、Kimi、豆包、GLM这些市面上热门的模型，全都能在同一个平台里调用。不需要你懂技术细节，也不用反复改代码，就像用手机App一样简单。

不用选模型了，系统自动帮你挑

很多企业用AI最大的困扰不是没模型，而是“选哪个好”。效果好的贵，便宜的效果差，临时换模型还得重新测试。MoMA的智能路由引擎，就是为了解决这个烦心事。

你只要告诉系统你要什么：是追求最低成本？还是最高准确率？或者要平衡两者？系统会自动匹配最适合的模型。比如，凌晨的客服机器人问“营业时间”，用轻量模型就够了；白天处理贷款申请，就自动切到更重的模型。出了问题？秒级切换，用户根本察觉不到。

更实在的是成本控制。通过自研推理引擎+上下文缓存，同样的任务，Token消耗平均降了三成，GPU占用少了一半以上。一家中型银行测算过，用MoMA后，每月AI支出直接省了40%以上。

政务、金融能用吗？数据不外泄是底线

不是所有企业都能随便把数据扔进云里。特别是医院的病历、银行的交易记录、政府的审批材料——这些数据，别说泄露，连“被看到”都不行。

MoMA为此推出了“机密模型”服务。简单说，模型运行时，数据在加密的硬件隔离环境中处理，连平台方自己都看不到内容。这是基于国产可信计算芯片实现的，不是口号，而是通过了国家密码管理局和金融行业安全认证的方案。目前，已有多个省级政务平台和国有银行在试点。

用了多少，花多少钱，一分钟内看得清清楚楚

过去用AI，账单像“盲盒”——月底一看，怎么花了八万？原来测试时开了十个模型，跑了三个月没关。

MoMA把每一分钱都摊得明明白白。你用的每一个Token，从请求到响应，系统实时记录。账单延迟不超过60秒，微信推送、企业微信提醒、后台报表，三种方式随你选。开发者可以随时看：今天哪个部门调用最多？哪个模型最耗资源？哪个接口响应慢了？

这不是为了“监控你”，而是让你知道钱花在哪、值不值。很多企业现在用MoMA，不是“试试AI”，而是把它当成了和电费、网费一样的常规支出，纳入了预算管理。

不是“能用”，是“真能省事”

MoMA不是要取代所有AI公司，而是把那些零散、高门槛、难维护的模型服务，变成一个标准化、可管理、可计量的基础设施。

一个基层医院的医生，不用懂什么是Transformer，也能用它快速生成病历摘要；一个地市级的政务热线，不用招AI工程师，就能把人工坐席的重复问答自动化；一个中小电商，能用同样的接口，同时跑商品描述生成、客服应答、广告文案优化。

它不炫技，不堆术语。它做的，是让AI从“技术奇迹”变成“日常工具”——就像你不用关心水电怎么发电，但每天打开水龙头，就有水出来。

MoMA 机密模型智能路由引擎一站式模型聚合

CB科技站