全国首个3万卡AI集群上线，万亿参数大模型算力无忧

全国首个3万卡超集群上线，国产算力迎来关键一跃

2月5日，中科曙光在国家超算互联网郑州核心节点正式上线全国首个3万卡scaleX超集群。这不是概念演示，也不是实验室原型——这是已投入运行、面向真实科研与产业需求的国产最大AI算力集群。从万卡到三万卡，仅用不到两个月时间，中国算力的建设速度，再次刷新了行业认知。

回看去年12月的HAIC大会，scaleX万卡系统刚刚首次公开亮相，当时还被视作“国产算力的重要一步”。如今，它已成长为支撑国家级科研与产业应用的基础设施。这种爆发式增长，背后不是口号，而是供应链、工程能力与系统架构的全面协同。从芯片适配、散热设计，到网络拓扑与调度系统，每一个环节都经受了真实负载的考验。

不挑卡、不挑框架，开放生态才是真底气

过去，国产算力平台常被诟病“生态孤岛”——换一块国产加速卡，整个软件栈就得重来。这次scaleX直接打破了这个魔咒。它支持NVIDIA CUDA生态，也兼容华为昇腾、寒武纪、海光等国产加速卡的混插部署。这意味着，高校实验室、AI初创公司、甚至传统企业，无需推倒重来，就能平滑迁移现有模型与代码。

截至目前，该系统已完成400多个主流大模型的适配与优化，覆盖从千亿参数的LLM训练，到医疗影像、气象模拟、工业仿真等高并发推理场景。一位来自华东某高校的AI研究员告诉笔者：“我们去年用A100跑一个蛋白质折叠模型，要等两周。现在用scaleX，三天就出结果，而且不用改一行代码。”

不只是跑模型，它正在改变科研的节奏

算力的价值，最终要落在解决真实问题上。在scaleX的支撑下，国内某材料基因组平台已实现新材料筛选效率提升百倍，成功登顶国际权威材料数据库排名。中科院某团队利用该集群进行蛋白质动态模拟，将原本需要数月的计算周期压缩至数小时，效率提升超过1万倍——这不再是“快一点”，而是“从不可能到可执行”的跨越。

在郑州超算互联网节点，每天有超过200个科研项目在排队使用算力资源，涵盖新能源电池设计、地震波反演、量子材料模拟等多个前沿领域。一位参与国家“人工智能驱动科学发现”专项的负责人坦言：“以前我们只能做小样本验证，现在能直接上全量数据、全尺度模拟。这不再是‘辅助工具’，而是研究的基础设施。”

3万卡不是终点，而是起点

中科曙光公开表示，该系统架构支持平滑扩展至十万卡甚至百万卡规模。这意味着，未来两年内，它有望成为我国首个面向百亿参数级模型训练的国家级算力底座。目前，已有多个国家级大科学装置和央企研发中心启动接入评估。

值得注意的是，这套系统并非孤立存在。它已接入国家超算互联网平台，与北京、天津、合肥、广州等地的超算中心实现算力调度互联。这意味着，一个在成都的科研团队，可以像调用本地资源一样，调用郑州的3万张卡，跨地域协同成为常态。

谁在用？答案藏在日常里

除了顶尖科研机构，一些你可能没注意到的领域，正在悄悄用上它：

某国产大模型公司，用它训练新一代金融风控模型，误报率下降42%；
一家汽车企业，用它做整车风阻仿真，研发周期从6个月缩短至35天；
国家气象中心正在测试用它做超长期天气预测，精度提升显著。

这些不是未来规划，而是正在发生的现实。3万张卡，不是为了炫技，是为了让“算力”真正成为像水电一样的公共基础设施。

如果说过去几年，国产算力在拼“有没有”；那么现在，它在拼“好不好用、能不能扛得住”。scaleX的上线，不是一场发布会的胜利，而是一次基础设施的真正升级。它不再问“你用什么芯片”，而是问：“你要解决什么问题？”

CB科技站