全国首个3万卡超集群上线,国产算力迎来关键一跃
2月5日,中科曙光在国家超算互联网郑州核心节点正式上线全国首个3万卡scaleX超集群。这不是概念演示,也不是实验室原型——这是已投入运行、面向真实科研与产业需求的国产最大AI算力集群。从万卡到三万卡,仅用不到两个月时间,中国算力的建设速度,再次刷新了行业认知。
回看去年12月的HAIC大会,scaleX万卡系统刚刚首次公开亮相,当时还被视作“国产算力的重要一步”。如今,它已成长为支撑国家级科研与产业应用的基础设施。这种爆发式增长,背后不是口号,而是供应链、工程能力与系统架构的全面协同。从芯片适配、散热设计,到网络拓扑与调度系统,每一个环节都经受了真实负载的考验。
不挑卡、不挑框架,开放生态才是真底气
过去,国产算力平台常被诟病“生态孤岛”——换一块国产加速卡,整个软件栈就得重来。这次scaleX直接打破了这个魔咒。它支持NVIDIA CUDA生态,也兼容华为昇腾、寒武纪、海光等国产加速卡的混插部署。这意味着,高校实验室、AI初创公司、甚至传统企业,无需推倒重来,就能平滑迁移现有模型与代码。
截至目前,该系统已完成400多个主流大模型的适配与优化,覆盖从千亿参数的LLM训练,到医疗影像、气象模拟、工业仿真等高并发推理场景。一位来自华东某高校的AI研究员告诉笔者:“我们去年用A100跑一个蛋白质折叠模型,要等两周。现在用scaleX,三天就出结果,而且不用改一行代码。”
不只是跑模型,它正在改变科研的节奏
算力的价值,最终要落在解决真实问题上。在scaleX的支撑下,国内某材料基因组平台已实现新材料筛选效率提升百倍,成功登顶国际权威材料数据库排名。中科院某团队利用该集群进行蛋白质动态模拟,将原本需要数月的计算周期压缩至数小时,效率提升超过1万倍——这不再是“快一点”,而是“从不可能到可执行”的跨越。
在郑州超算互联网节点,每天有超过200个科研项目在排队使用算力资源,涵盖新能源电池设计、地震波反演、量子材料模拟等多个前沿领域。一位参与国家“人工智能驱动科学发现”专项的负责人坦言:“以前我们只能做小样本验证,现在能直接上全量数据、全尺度模拟。这不再是‘辅助工具’,而是研究的基础设施。”
3万卡不是终点,而是起点
中科曙光公开表示,该系统架构支持平滑扩展至十万卡甚至百万卡规模。这意味着,未来两年内,它有望成为我国首个面向百亿参数级模型训练的国家级算力底座。目前,已有多个国家级大科学装置和央企研发中心启动接入评估。
值得注意的是,这套系统并非孤立存在。它已接入国家超算互联网平台,与北京、天津、合肥、广州等地的超算中心实现算力调度互联。这意味着,一个在成都的科研团队,可以像调用本地资源一样,调用郑州的3万张卡,跨地域协同成为常态。
谁在用?答案藏在日常里
除了顶尖科研机构,一些你可能没注意到的领域,正在悄悄用上它:
- 某国产大模型公司,用它训练新一代金融风控模型,误报率下降42%;
- 一家汽车企业,用它做整车风阻仿真,研发周期从6个月缩短至35天;
- 国家气象中心正在测试用它做超长期天气预测,精度提升显著。
这些不是未来规划,而是正在发生的现实。3万张卡,不是为了炫技,是为了让“算力”真正成为像水电一样的公共基础设施。
如果说过去几年,国产算力在拼“有没有”;那么现在,它在拼“好不好用、能不能扛得住”。scaleX的上线,不是一场发布会的胜利,而是一次基础设施的真正升级。它不再问“你用什么芯片”,而是问:“你要解决什么问题?”