阿里云发布128卡超节点服务器,真武M890芯片实测性能突破
在2026年阿里云峰会现场,阿里巴巴正式推出基于平头哥自研AI芯片“真武M890”的128卡超节点服务器。这台服务器不是简单堆砌芯片,而是通过平头哥自研的ICN Switch1.0互联芯片,将128颗AI计算单元无缝连接成一台真正协同工作的超级计算系统。实测数据显示,芯片间通信延迟低至120纳秒,比行业主流方案快近40%,在大模型训练和高并发推理场景中,效率提升显著。
为什么这台服务器能改变AI算力格局?
当前大模型训练动辄需要数千张GPU,但多机互联带来的通信瓶颈让算力利用率常常低于60%。而这台超节点服务器通过全自研互联架构,把原本需要跨机架、跨网络传输的数据,变成“在同一块电路板上跑”,大幅减少数据搬运时间。据内部测试,训练千亿参数模型时,训练周期缩短了35%,同时功耗降低22%。
更重要的是,它专为“智能体”(Agent)时代设计。未来一个AI智能体可能需要同时调用多个模型、处理多路实时数据,传统服务器难以支撑。这台服务器能并行运行数百个轻量级Agent,实现毫秒级响应,适合金融风控、智能客服、自动驾驶决策等对延迟和吞吐要求极高的场景。
不只是性能,还有落地的诚意
阿里云表示,该超节点服务器将率先在阿里内部的通义千问大模型训练、淘宝智能客服系统和菜鸟物流调度平台中部署。同时,阿里云将面向重点客户开放租赁服务,首批接入的包括医疗AI、自动驾驶和科研机构,无需采购整机,即可按需租用算力节点。
目前,该服务器已通过国家算力基础设施认证,并支持主流AI框架(如PyTorch、TensorFlow)的原生适配,企业无需重构代码即可迁移。价格方面,单位算力成本较国际主流方案低约30%,且提供三年硬件质保与专属技术团队驻场支持。
真实场景下的表现
某头部自动驾驶公司已试用该系统,用于训练其城市道路感知模型。过去需要3周完成的训练,现在仅需10天;模型推理延迟从280ms降至85ms,车辆决策响应速度接近人类水平。公司CTO表示:“这不是概念机,是我们明天就要用的工具。”
这台服务器的发布,标志着中国自研AI算力基础设施从“能用”迈向“好用”。它不靠炫技的参数,而是用真实性能和落地能力,回应了行业最朴素的诉求:更快、更稳、更便宜。