英特尔IT近期发表白皮书,揭露自家数据中心转型策略及成果。英特尔整合全球数据中心数量,从152个减少至53个,并通过五大策略优化数据中心运营,达成节能与成本控制目标。从2010年至2024年,累计节省约114.1亿美元。
英特尔IT产业合作总监兼区域发言人邱天意表示,回顾英特尔全球数据中心发展历程,2000年以前可称为“有需求就建”的数据中心战国时代,一方面是数据中心大规模扩张,另一方面是大型主机逐渐式微。自2006年起,英特尔成立数据中心团队,开始制定统一的发展战略,追求标准化设计与成本控制,并启动全球数据中心整合行动。
从2006年到2010年,英特尔持续优化数据中心运营效率,与其他企业一样,推动虚拟化以提升资源利用率,构建企业私有云,同时淘汰老旧服务器设备,导入更具能源效率的硬件。随着数据量持续增长,存储系统也不断优化,追求IT可持续发展。2010年至2023年间,随着业务重点转移,英特尔持续调整数据中心资源配置与能效。
“从2010年到2024年,英特尔IT总计节省约114亿美元成本,”邱天意表示。
英特尔如何实现这一成果?
目前,英特尔在全球15个地点运营53座数据中心,总电力为133MW,包含46.4万台服务器、高达1043PB的存储系统,以及近90万个网络端口,其数据中心PUE值最低可达1.06。
在数据中心管理方面,英特尔于2006年将全球数据中心划分为“DOME”四大领域,各领域承载不同工作负载需求。(下图来源:Intel)

其中,“D”代表Design/HPC,用于英特尔芯片设计与量产前的计算负载,该部分占英特尔96%的服务器;“OE”代表Office & Enterprise,即一般办公与企业运营负载,属于典型IT运算,对SLA要求较高,但仅占3%服务器;“M”代表Manufacturing Fab/ATM,主要支持工厂自动化,多部署于工厂周边,仅占1%服务器。
三大战略目标:优化数据中心、降低单位服务成本
英特尔IT分享数据中心三大核心战略目标,第一是采用最佳实践模型。
邱天意表示,最佳实践模型是指在无预算与人力限制下,所能构建的最优数据中心。以该理想模型为基准,对比现有数据中心的差距,目标是逐步缩小差距。此举有助于英特尔IT明确改进方向,评估各项措施的投资回报率(ROI),并循序渐进地引入创新方案。
第二是设定KPI目标。英特尔IT制定三项关键绩效指标:首先,设定合理且够用的SLA服务标准,而非盲目追求最高SLA;其次,每年降低单位服务成本10%;第三,所有资源利用率需提升至80%以上。三项KPI相互影响,需在三者间寻求最佳平衡点。
第三是界定优化范围。从总拥有成本(TCO)角度审视数据中心,涵盖计算、存储、网络、人员薪资、数据中心基础设施、操作系统授权与管理共六个维度。IT与财务部门共同制定“单位服务成本”(Cost per Service Unit)的计算方式,并持续优化。
英特尔将六大维度的TCO成本,除以各DOME领域对应的单位服务数量,计算出单位成本。例如,在“Design”芯片设计领域,以每个EDA-MIPS为单位;在“Office & Enterprise”领域,则以操作系统授权数量为单位。
“唯有通过单位服务成本,才能衡量是否达成每年降低10%成本的目标,”邱天意表示。结合DOME与单位成本概念,可分析各领域数据中心的成本结构。以2024年芯片设计领域的数据中心为例,成本占比最大的是“基础设施”(36.8%)与“服务器集群”(35.5%),可据此优先聚焦改善。
五大策略提升资源利用率与运营效率
英特尔IT分享五大降低成本、提升效率的策略:服务器设计优化、采用分层存储、提升网络效率、增强设施能效、改善运维效率。
在服务器方面,英特尔IT研发了一种“解构式服务器”(Disaggregated Server)专利技术。在数据中心内采用刀片式服务器提升密度,并将CPU与DRAM独立拆分。更换服务器时,仅需更新CPU与DRAM,保留网卡、硬盘等其他组件。相比传统整机更换,可节省约44%成本。

“英特尔约两年更新一次CPU,只需更换CPU与DRAM,即可获得最新性能,”他指出。由于仅替换核心组件,保留其他仍可正常使用的部件,不仅节省约44%成本,还能缩短77%的更换时间,并减少运输费用与电子废弃物处理成本。
英特尔自2016年起在数据中心部署解构式服务器设计,目前全球46.4万台服务器中,已有约39.5万台采用该架构。
在存储系统方面,采用分层存储(Tiered Storage),按性能、容量与成本划分为四层架构,兼顾SLA与资源利用率。相比纵向扩展(Scale-up)存储,英特尔IT认为横向扩展(Scale-out)更易于扩容,更适合自身需求。同时,加速淘汰老旧存储设备,引入高能效硬件,并应用数据去重与压缩技术。
邱天意表示,通过数据去重与压缩技术,曾在一年内成功缩减约220PB数据量。通过上述优化,存储资源利用率从46%提升至80%,未来目标为85%。
在网络方面,英特尔自2010年起逐步部署千兆以太网(GbE)设备,目前GbE占比在15年内提升至66%,未来目标为80%。
此外,2016年英特尔测试部署40GbE,但观察到100GbE正快速成为主流,遂于2019年全面导入100GbE。至2024年,100GbE端口数量已接近9.5万个,其中86%采用软件定义网络(SDN),实现网络自动化部署。
在提升数据中心设施效率方面,英特尔于2003年全球拥有最多152个数据中心,至2025年已缩减至52个,数据中心总占地面积减少18%。尽管数据中心数量减少,但总电力提升至133MW,意味着单位空间能效更高、部署更密集。
英特尔亦致力于降低PUE值,最低可达1.06。邱天意指出,英特尔将总部附近一座老旧工厂改造为大型数据中心,部署数十万台服务器。为解决散热问题,采用闭环蒸发冷却技术,通过再生水与外部冷却塔热交换,将热水冷却后送入机房热通道,辅助服务器散热。
邱天意表示,尽管仍采用传统风冷方式,但英特尔通过大量实验测试,逐步提高机房运行温度。即便在冷通道区域,工作人员仅需穿着短袖即可作业,无需像传统机房那样穿戴保暖衣物。经测试,提高温度后服务器故障率并未显著高于低温环境。
英特尔数据中心采用高密度刀片式服务器,单个机柜可容纳约200台服务器。据统计,2012年至2024年间,相较传统数据中心,累计节省约19亿千瓦时电力。
在提升运维效率方面,英特尔在芯片制造最后阶段“Tapeout”中,需大量算力支持仿真运算。英特尔内部研发HPC解决方案支撑Tapeout需求,目前已发展至第七代HPC,制程从早期45纳米演进至Intel 20A或18A。
邱天意指出,历代HPC持续引入新技术以提升算力,支撑Tapeout需求。从2005年至2024年,计算处理量提升631倍,因算力不足导致的Tapeout延误减少322倍。至2024年,Tapeout几乎不再受算力制约,显著加速芯片量产进程。
英特尔IT团队自2010年起提出一个问题:除持续优化自建数据中心外,自建与云服务在相同算力条件下,成本差异如何?
自2010年起,英特尔IT比较相同算力下,自建数据中心与云服务的单位成本。若以2010年为基期(100%),至2024年,自建数据中心单位成本已降至4%。同期,云服务单位成本虽从186%降至19%,但英特尔自建成本仍仅为云服务的约五分之一。

尽管近年来云服务日益成熟,单位成本显著下降,吸引众多企业上云,但邱天意强调,对以芯片设计为核心业务的英特尔而言,自建数据中心的单位成本仍显著低于云服务,性价比更高。作为芯片设计企业,英特尔也希望掌握核心资源的自主权。未来,英特尔IT将持续优化,保持成本竞争力。
优化数据中心资源,服务全球芯片设计团队
在芯片技术持续演进、市场竞争加剧的背景下,邱天意分享英特尔IT如何通过自建数据中心优化服务体验,支持全球芯片设计团队。以服务器部署为例,过去需十余天完成部署,如今仅需一天。这得益于服务器机架的标准化设计——服务器交付前,网络、供电及第三方厂商已预先完成配置,实现自动化部署。对每年部署数万台服务器的英特尔而言,部署速度的提升,使全球设计团队能更早投入使用。
此外,芯片设计师常需通过广域网(WAN)远程访问数据中心资源,可能影响体验。英特尔IT优化了WAN远程访问服务,例如改进TCP协议,使数据传输速率提升4倍,显著改善远程访问体验。