最新消息:关注人工智能 AI赋能新媒体运营

阿里平头哥发布自研AI芯片真武810E

科技资讯 admin 浏览

真武810E正式发布:阿里自研AI芯片落地实战

阿里平头哥近日正式发布高端AI芯片“真武810E”,这是继含光、倚天之后,平头哥在AI算力领域的又一关键产品。与以往不同,真武810E不是实验室原型,而是已在阿里云大规模部署、支撑真实业务的量产芯片。

目前,基于真武810E的万卡集群已在阿里云上线,服务于通义千问大模型训练、电商搜索推荐、城市大脑等核心业务。这意味着,它不再是“能跑起来”的芯片,而是“扛得住双11流量”的基础设施。

image.png

性能实测:不靠参数吹,靠集群说话

真武810E单卡配备96GB HBM2e显存,内存带宽超过1.2TB/s,远超市面上多数国产AI芯片。其核心是平头哥自研的并行计算架构,结合ICN片间互联技术,实现7个独立高速互联通道,单节点片间带宽达700GB/s。

在阿里内部测试中,真武810E在千亿参数大模型训练任务中,单卡性能接近英伟达H20,万卡集群扩展效率超过90%,线性加速表现优于多数竞品。更重要的是,这套系统已在连续三个月的生产环境中稳定运行,日均处理请求超百亿次。

对比市面上部分国产芯片依赖“峰值算力”宣传,真武810E的亮点在于:能跑得久、跑得稳、跑得快。

不是“换壳”:软硬一体,开发者能直接上手

很多人关心:新芯片有没有生态?能不能用?

真武810E不靠“兼容CUDA”撑场面,而是直接打通了阿里云的AI栈:从底层驱动、编译器到PyTorch/TensorFlow框架,全部由阿里自研重构。开发者无需重写代码,只需在通义灵码或ModelScope平台一键切换芯片,即可迁移模型。

一位参与内测的AI工程师透露:“我们把一个原本跑在A100上的LLM推理服务,三天内迁移到真武810E集群,精度没丢,延迟还降了12%。关键是,运维团队根本不用重新学一套工具。”

这种“开箱即用”的体验,正是阿里想解决的行业痛点——不是每个企业都有几十人的芯片适配团队。

“通云哥”成型:不是口号,是作战体系

这次发布,标志着“通义实验室(通)—阿里云(云)—平头哥(哥)”的黄金三角真正形成合力:

  • 通义实验室提供模型需求和训练数据
  • 平头哥负责芯片设计与量产
  • 阿里云负责集群调度、运维和客户交付

过去,芯片公司只卖硬件,云厂商只卖算力,AI团队只调模型——三者各自为战。而真武810E从立项之初,就是三支团队坐在同一张桌子前,一起定指标、对瓶颈、压进度。

这不是“联合发布”,是“联合打仗”。

未来:不是对标英伟达,而是构建新生态

真武810E的发布,不是为了在参数表上“赢过A800”,而是为国产AI基础设施提供一个可落地的替代方案。

目前,阿里已向部分金融、制造、政务客户开放真武810E的算力租赁服务,价格比同规格英伟达方案低30%以上,且提供专属技术支持通道。首批签约客户中,已有三家省级AI平台完成迁移测试。

业内普遍认为,真武810E的意义,不在“中国第一”,而在“中国能用”。