MoMA平台上线:中国移动让大模型真正用起来
2026年移动云大会现场,中国移动正式发布“移动模型服务平台”(MoMA)。这不是又一个PPT里的概念,而是一个已经跑在真实业务里的系统——从银行风控到医院辅助诊断,从教育答疑到政务热线,已经有上百家企业在用它替代过去零散、昂贵、难维护的模型调用方式。
过去企业想用AI,得找好几个供应商,签多个合同,调多个接口,还要自己管模型版本、算力分配、故障排查。现在,只要接入MoMA,300多个主流模型一键可用。不只是“九天”这样的自研模型,DeepSeek、通义千问、Kimi、豆包、GLM这些市面上热门的模型,全都能在同一个平台里调用。不需要你懂技术细节,也不用反复改代码,就像用手机App一样简单。
不用选模型了,系统自动帮你挑
很多企业用AI最大的困扰不是没模型,而是“选哪个好”。效果好的贵,便宜的效果差,临时换模型还得重新测试。MoMA的智能路由引擎,就是为了解决这个烦心事。
你只要告诉系统你要什么:是追求最低成本?还是最高准确率?或者要平衡两者?系统会自动匹配最适合的模型。比如,凌晨的客服机器人问“营业时间”,用轻量模型就够了;白天处理贷款申请,就自动切到更重的模型。出了问题?秒级切换,用户根本察觉不到。
更实在的是成本控制。通过自研推理引擎+上下文缓存,同样的任务,Token消耗平均降了三成,GPU占用少了一半以上。一家中型银行测算过,用MoMA后,每月AI支出直接省了40%以上。
政务、金融能用吗?数据不外泄是底线
不是所有企业都能随便把数据扔进云里。特别是医院的病历、银行的交易记录、政府的审批材料——这些数据,别说泄露,连“被看到”都不行。
MoMA为此推出了“机密模型”服务。简单说,模型运行时,数据在加密的硬件隔离环境中处理,连平台方自己都看不到内容。这是基于国产可信计算芯片实现的,不是口号,而是通过了国家密码管理局和金融行业安全认证的方案。目前,已有多个省级政务平台和国有银行在试点。
用了多少,花多少钱,一分钟内看得清清楚楚
过去用AI,账单像“盲盒”——月底一看,怎么花了八万?原来测试时开了十个模型,跑了三个月没关。
MoMA把每一分钱都摊得明明白白。你用的每一个Token,从请求到响应,系统实时记录。账单延迟不超过60秒,微信推送、企业微信提醒、后台报表,三种方式随你选。开发者可以随时看:今天哪个部门调用最多?哪个模型最耗资源?哪个接口响应慢了?
这不是为了“监控你”,而是让你知道钱花在哪、值不值。很多企业现在用MoMA,不是“试试AI”,而是把它当成了和电费、网费一样的常规支出,纳入了预算管理。
不是“能用”,是“真能省事”
MoMA不是要取代所有AI公司,而是把那些零散、高门槛、难维护的模型服务,变成一个标准化、可管理、可计量的基础设施。
一个基层医院的医生,不用懂什么是Transformer,也能用它快速生成病历摘要;一个地市级的政务热线,不用招AI工程师,就能把人工坐席的重复问答自动化;一个中小电商,能用同样的接口,同时跑商品描述生成、客服应答、广告文案优化。
它不炫技,不堆术语。它做的,是让AI从“技术奇迹”变成“日常工具”——就像你不用关心水电怎么发电,但每天打开水龙头,就有水出来。