
HPE
AI应用需求旺盛,其高耗能、高散热特性带动液冷式服务器的需求。HPE上周宣布液冷式超级电脑Cray Supercomputing EX系列,以及为大型语言模型(LLM)与多模态模型训练、和自然语言处理(NLP)而设计的新ProLiant服务器。
Cray Supercomputing EX是HPE高效能运算(HPC)产品线,为执行AI计画的研究单位及政府组织而设计的新产品线,採用100%无风扇直接液冷系统架构,且扩及运算节点、网路和储存,外加新软件。
两款Cray Supercomputing超级电脑,分别为EX 4252 Gen2 Compute Blade及EX154n Accelerator Blade。EX 4252 Gen2 Compute Blade搭载8颗第5代AMD EPYC处理器,在单一机柜内含最多98,304核心,是1U系统中提供业界最大效能的机种。EX154n Accelerator Blade,主打Grace Hopper下一代的Nvidia GB200 Grace Blackwell NVL 4 Superchip GPU,单一机柜安装最多224颗。每片加速器刀锋都包含4颗Blackwell GPU及2颗Grace CPU。EX 4252 Gen2 Compute Blade和EX154n Accelerator Blade,分别在2025年春天和年底上市。
Cray Supercomputing并推出了储存系统Storage Systems E2000,它是以开源Lustre文件系统为基础,可减少I/O运算的闲置时间,提升CPU和GPU运算节点利用率,预计明年初问世。此外也推出了管理软件User Services Software,以最佳化系统效能、调节耗能,并弹性执行多种负载。软件现已推出。
HPE另外还公布适用于AI服务供应商,为AI模型训练和调校打造的ProLiant家族服务器,内建该系列独有的存取管理软件Integrated Lights-Out(iLO),可选择特定人员赋予远端控制存取权限,提升安全性。ProLiant新服务器包含XD680及XD685服务器。XD680在单一小型机箱中内,配备8颗Intel Gaudi 3加速器,预定2024年12月问世。
图片来源/HPE
XD685服务器特色是使用了HPE液冷技术,作为5U机器,今年10月HPE推出内建AMD处理器的XD 685服务器,搭载8颗AMD Instinct MI325 X加速器及2颗EPYC CPU。在最新更新下,XD685推出Nvidia GPU的机种,内建8颗Nvidia H200 SXM Tensor Core GPU或是Blackwell GPU。HPE表示2025年初还会推出8颗H200 SXM Tensor Core GPU的版本。