
微软
彭博社(Bloomberg)及The Register本周引用投资银行TD Cowen所发布的研究报告,指出微软已经取消了在美国及欧洲涉及2GW电力的多个资料中心专案,TD Cowen认为,这可能是因为被应用在AI的电脑丛集已供应过剩,但The Register则有不同的看法,猜测或许是这些资料中心已无法满足随着高阶AI硬件而来的电力与冷却需求。
训练大型语言模型需要强大的运算能力,以Meta的AI超级电脑为例,它使用超过3.5万颗的Nvidia H100晶片,每颗晶片的功耗约为700W,总功耗就是25MW,大概是10万台高阶电竞桌机同时全速运转,还需要专门的冷却系统,这使得各大AI业者除了极力争取Nvidia的GPU之外,也竞相租赁配备Nvidia GPU的资料中心。
不过,微软与OpenAI在今年1月变更了彼此的合作关係,允许OpenAI在微软放弃的前提下,使用第三方的云端服务以研究及训练模型;TD Cowen今年2月亦揭露,微软已经取消了部分美国资料中心容量的租约,本周再指出微软放弃了涉及2GW电力的多个资料中心合约;日前亦传出微软取消了与美国云端GPU服务供应商CoreWeave的部分合作案。
种种迹象都让TD Cowen认为是用于AI的服务器丛集供应过剩,呼应了日前阿里巴巴董事长蔡崇信对AI资料中心的建置快过市场需求的担忧。
不过,The Register对微软的行为则有另一种解读,认为是市场上现有的资料中心配置,已无法满足最新或未来GPU或大型服务器丛集的冷却与电力需求,而且可从微软发表全新资料中心的设计一窥端倪。
微软则在提供给这两家媒体的声明中表示,该公司对于在2025财年(截至今年6月底)于基础设施上投入800亿美元的承诺并未改变,而且完全有能力满足现有与不断成长的客户需求,儘管会在某些市场策略性地调整基础设施,以将资源分配到未来的成长领域,但对所有市场的投入都将继续呈现强劲成长。