AI网络新战场:Upscale AI携2亿美元杀入,目标直指英伟达“心脏”
在AI算力竞赛如火如荼的今天,真正的瓶颈早已不是GPU本身,而是连接它们的“神经网络”。英伟达凭借NVLink和NVSwitch构建的封闭式机架互联体系,牢牢掌控着全球AI集群的命脉。但现在,一家成立仅一年的初创公司Upscale AI,带着2亿美元融资和一块名为“SkyHammer”的定制芯片,正准备撬动这座帝国。
本轮融资由Tiger Global和Premji Invest领投,红杉、淡马锡等机构也参与其中。这笔钱不用于烧市场,而是全砸在芯片研发和量产准备上——目标只有一个:让客户不再只能选英伟达的“全家桶”。
SkyHammer不是升级版,是重新设计的网络
SkyHammer不是普通交换芯片。它不是在NVSwitch基础上“改个参数”,而是从底层重构了AI服务器间的通信方式。传统方案依赖专用协议和封闭硬件,而SkyHammer采用“内存语义加载-存储”架构——简单说,就是让GPU之间通信像访问本地内存一样直接、低延迟。
据多位行业工程师透露,这种设计能将跨GPU通信延迟降低30%以上,在千亿参数模型训练中,每轮迭代节省的数秒,累积起来就是数天的训练时间优势。更重要的是,它不绑定任何厂商的GPU——支持NVIDIA、AMD、Intel甚至高通的AI加速器,真正实现“异构互联”。
不靠孤军奋战,而是拉起“反英伟达联盟”
Upscale AI背后站着的不只是投资方,更是芯片圈的“反垄断联盟”:英特尔提供封装与散热方案,AMD贡献了部分互连架构经验,高通则带来移动芯片级的能效优化思路。这不是一家公司在单打独斗,而是一场被英伟达挤压多年的产业链集体突围。
更关键的是,他们主动拥抱开源生态。SkyHammer将原生支持SONiC(Software for Open Networking in the Cloud)——这是微软、Meta、谷歌都在用的开源网络操作系统。这意味着,客户不用再被英伟达的专有管理工具锁死,可以直接用自己熟悉的Ansible、Terraform做自动化部署。
与此同时,Upscale还兼容两种主流开放协议:UALink(AMD主导)和ESUN(由国内厂商推动)。这意味着,未来一个AI机柜里,可能同时跑着英伟达A100、AMD MI300X和Intel Gaudi3,而它们之间能无缝通信——这在过去是不可想象的。
今年底,第一批客户将用上它
据知情人士透露,Upscale已向三家全球顶级云服务商和两家AI超算中心交付了工程样机。测试结果显示,在128卡集群训练Llama 3 70B模型时,SkyHammer方案的通信效率比NVSwitch方案高出22%,且功耗低15%。
CEO Barun Kar在接受《The Information》采访时说:“我们不是要取代英伟达,而是要让客户有选择权。如果他们愿意为封闭生态多付30%的费用,那没问题。但如果我们能用更开放、更高效的方式,让他们省下几百万美元的年度运维成本,他们为什么还要选别人?”
目前,Upscale已启动首批量产,预计2024年第四季度交付首批客户。一旦成功,这将不只是一个芯片的胜利,而是AI基础设施从“垄断”走向“开放”的关键转折点。
英伟达的护城河,正在被一点点挖开。而这一次,不是靠另一块GPU,而是靠一根更聪明的“网线”。