
全球首个万亿参数开源推理模型问世:蚂蚁集团 Ring-1T 震撼发布
2025年10月24日,蚂蚁集团重磅发布其最新研究成果——Ring-1T,全球首个参数规模突破万亿的开源推理模型。这一里程碑式的技术突破,不仅刷新了开源大模型的参数纪录,更以三大自研核心技术攻克了超大规模强化学习训练中的稳定性、效率与系统协同难题。在数学推理、代码生成和科学问题求解等关键任务中,Ring-1T 的表现已逼近 OpenAI GPT-5 和谷歌 Gemini 2.5 Pro,标志着中国在AI基础模型领域的竞争力迈上新台阶。
专注复杂推理:支持12.8万token上下文,MoE架构兼顾性能与效率
Ring-1T 的核心定位是“为复杂推理而生”。该模型基于蚂蚁此前发布的 Ling 2.0 架构打造,并以 Ling-1T-base 为训练起点,具备高达128,000 tokens的上下文处理能力——这意味着它可以完整理解一本中篇小说、一份法律合同或跨章节科研论文,无需外部工具拼接,极大降低了企业部署门槛。
尽管总参数达万亿级别,但通过先进的混合专家(MoE)架构设计,Ring-1T 每次推理仅激活约500亿参数,显著提升了算力利用率。这一“稀疏激活”机制使其能够在消费级GPU集群上高效运行,为中小企业和研究机构提供了前所未有的高性能推理能力。
性能惊艳:数学推理逼近IMO银牌水平,代码生成超越主流开源模型
在权威基准测试中,Ring-1T 展现出令人瞩目的推理能力。在AIME 25数学竞赛基准上,其得分高达93.4%,仅次于GPT-5,成为首个达到国际数学奥林匹克(IMO 2025)银牌水平的开源系统。尤为惊人的是,它能通过纯自然语言一次性解出IMO六道难题中的四道,对几何证明题的解答接近满分;即使在被广泛认为最难的第六题上,也能收敛到与Gemini 2.5 Pro一致的结果。
在代码生成方面,Ring-1T 显著优于 DeepSeek、Qwen 等主流开源模型,其训练数据经过精心筛选与构造,特别强化了算法逻辑与工程实践能力,为未来智能体(Agent)系统的构建打下坚实基础。
此外,在“人类偏好对齐”测试 Arena-Hard V2 中,Ring-1T 以81.59%的成功率位居开源模型榜首,紧追GPT-5-Thinking(82.91%);在专业医疗问答基准 HealthBench 上,也斩获开源领域最高分,展现出在高风险场景下的可靠性和专业性。
突破万亿级强化学习瓶颈:IcePop、C3PO++、ASystem 三箭齐发
训练一个万亿参数模型进行强化学习(RL),长期以来面临三大“不可能三角”:梯度噪声大、资源利用率低、系统协同难。为破解这些瓶颈,蚂蚁工程师团队推出了三项互联创新技术,形成从算法到系统的全栈解决方案。
IcePop:终结训练与推理的精度失配困局
在MoE架构中,动态路由机制常导致训练与推理阶段的概率偏差,尤其在长思维链(Chain-of-Thought)推理中,这种偏差会随步骤累积,最终引发训练崩溃。IcePop 创新性地引入“双面屏蔽校准”技术,精准过滤掉引发不稳定性的噪声梯度更新,同时避免传统梯度裁剪带来的推理延迟。实验证明,相比标准GRPO算法,IcePop 能将训推精度差异控制在极低水平,且不会随训练时间指数增长,为长序列RL训练提供了前所未有的稳定性保障。
C3PO++:GPU利用率提升2.5倍,告别“空转等待”
传统RL训练中,样本生成(Rollouts)与模型更新往往不同步,导致GPU大量闲置。C3PO++ 在蚂蚁原有C3PO系统基础上全面升级,采用“双池并行 + 令牌预算控制”机制:将任务拆分为独立的推理池(生成数据)和训练池(更新模型),实现真正意义上的并行处理;同时引入“token预算”机制,动态调控数据生成量,防止资源浪费。
这一设计使长任务训练效率提升2.5倍,彻底打破“生成等更新”或“更新等生成”的低效循环,让万亿级RL训练首次实现高吞吐、低延迟的稳定运行。
ASystem:分布式训练的“中央大脑”,权重交换进入秒级时代
面对万亿参数模型的异步训练挑战,ASystem 采用“SingleController + SPMD”(单程序多数据)架构,由一个中央控制器统一调度全局任务,各计算节点并行执行,既保证逻辑一致性,又消除节点间等待开销。
其核心技术包括“显存碎片秒级回收”和“零冗余权重交换”。通过自研的 AState 接口,模型权重可在节点间高速同步,将原本需数分钟的交换时间压缩至10秒以内。更重要的是,ASystem 实现了训练与推理流程的一体化管控,让大规模强化学习从“偶然成功的实验”转变为“可重复、可调度、可监控”的工程常态。
中国开源三驾马车崛起:Ring-1T 引领全球AI多元格局
Ring-1T 的发布,标志着中国AI企业在开源大模型赛道的战略全面落地。与美国科技巨头普遍采取闭源策略不同,蚂蚁集团、阿里云、DeepSeek 等中国企业正通过开源释放技术红利:模型权重、训练配置、优化方法均已公开,可在 HuggingFace 和魔搭社区自由获取,极大降低了科研与创业门槛。
目前,Ring-1T 与阿里云 Qwen3-Omni(多模态全能模型)、DeepSeek-OCR(高效文本图像压缩模型)共同构成中国开源AI的“三驾马车”,在性能、场景覆盖与工程化能力上形成差异化优势,与美国闭源模型展开正面竞争。
未来已来:万亿模型将重塑金融、科研与企业智能
随着 Ring-1T 的持续优化和开源社区的二次开发,这款万亿参数模型有望在多个高价值领域释放巨大潜力:在金融领域,可用于复杂风控建模与自动合规审查;在科学研究中,辅助跨学科知识整合与假设生成;在企业服务端,打造真正具备“深度思考”能力的智能助手。
更重要的是,蚂蚁此次公开的整套RL训练框架,为全球AI工程界提供了首个可复现的“万亿级模型工业化”模板,推动行业从“堆算力”向“精设计”转型。在全球AI发展路径日益多元的今天,Ring-1T 不仅是一次技术飞跃,更是一场开源精神与工程智慧的胜利。