最新消息:关注人工智能 AI赋能新媒体运营

高通发布AI推理解决方案,进军AI数据中心市场

科技资讯 admin 浏览

高通发布AI200与AI250解决方案 正式进军数据中心市场

全球最大移动通信芯片及无线技术供应商高通(Qualcomm)周一(10/27)发布了AI200与AI250解决方案,相关方案包括AI200或AI250两款AI推理芯片、AI加速卡、机架以及软件堆栈等,正式进军AI数据中心市场。当天,高通宣布首家客户为沙特阿拉伯AI初创企业Humain,双方将在沙特部署先进AI基础设施,提供全球AI推理服务。此消息带动高通当日股价大涨11.09%,以187.68美元收盘。

目前市场上的AI芯片主要分为三大类:一是由英伟达(Nvidia)及AMD领军的通用型GPU,这类原本针对图像渲染设计的GPU可同时用于训练和推理模型,应用弹性高,但耗电且成本昂贵;二是特殊应用集成电路(Application-Specific Integrated Circuit,ASIC),为AI运算量身打造的专用芯片,例如Google TPU或OpenAI与博通的合作产品,在设计时即确定用于训练或推理;高通此次发布的则属于神经网络处理单元(Neural Processing Unit,NPU),是专为AI推理设计的处理器,其他例子还包括苹果神经引擎、三星NPU及Meta MTIA等。

不过,高通并非仅提供NPU芯片,而是推出机架级AI推理解决方案,旨在通过更低的总体持有成本,优化大型语言模型和多模态模型的推理性能,或其他AI工作负载。其中,搭载高通AI200的加速卡支持768GB的LPDDR内存;而搭载高通AI250的方案则采用创新的近内存计算(Near-memory Computing)架构,实现超过10倍的有效内存带宽。高通AI200与高通AI250将分别于2026年及2027年正式出货。

两款机架级解决方案均配备直接液冷系统以提升散热效率,支持PCIe及Ethernet接口,便于向上扩展和横向扩展,同时支持机密计算,整柜标准功耗为160kW。这意味着高通正式进入数据中心AI推理基础设施市场,不再局限于移动芯片供应商的角色。

同日,高通与Humain宣布合作。Humain主导沙特阿拉伯国家级AI计划,双方协议自2026年起,将部署200MW(0.2GW)的高通AI200/AI250机架式解决方案,为沙特阿拉伯及全球提供高性能AI推理服务。