最新消息:关注人工智能 AI赋能新媒体运营

英伟达发布Vera CPU,开启Agentic AI新时代

科技资讯 admin 浏览

英伟达首款智能体AI专用CPU Vera正式发货,科技巨头争相抢购

近日,英伟达宣布其专为智能体AI(Agentic AI)打造的首款定制CPU——Vera,已开始向多家行业领军企业交付首批产品。这不仅是英伟达在CPU领域的一次重要突破,更标志着AI基础设施正从“算力堆砌”转向“场景定制”的新阶段。

Vera的核心设计围绕“高单核性能”与“低延迟响应”展开,搭载88个英伟达自研的“奥林巴斯”核心,内存带宽达到1.2TB/s,相比上一代Grace CPU,整体性能提升约50%。不同于传统服务器CPU追求多核并行,Vera更注重单线程任务的快速响应,特别适合智能体在实时决策、环境模拟和多任务调度中的高频交互需求。

上周五,英伟达副总裁伊恩·巴克亲自带队,将首批系统送至Anthropic、OpenAI、SpaceX的AI团队以及甲骨文云基础设施部门。现场没有冗长的演讲,只有工程师们围着机箱拆解、测试、记录数据。

Anthropic的计算负责人詹姆斯·布拉德伯里在内部邮件中写道:“我们一直在等一个能跑通1000个并行智能体而不卡顿的CPU。Vera第一次让我们觉得,这不是概念,是能用的工具。”

在OpenAI总部,基础设施负责人萨钦·卡蒂当着巴克的面打开了系统外壳,指着散热片和内存通道的布局问:“这组通道是为低延迟缓存优化的吧?”得到肯定答复后,他立刻安排团队把Vera接入当前的强化学习训练流水线,准备下周上线实测。

SpaceX的AI团队则更关注实际场景——他们正用智能体模拟星舰着陆时的突发状况。创始人马斯克亲自签收设备,并在内部会议上说:“我们不需要1000个核心同时算一个数,我们需要一个核心在0.01秒内做出10个判断。Vera看起来能行。”

甲骨文的反应最直接——他们计划在2026年部署超过十万颗Vera芯片,用于支撑企业级AI代理服务,如自动客服、供应链预测和动态定价系统。云基础设施负责人卡兰·巴塔坦言:“客户不再问‘你们能跑多大的模型’,而是问‘你们的AI能多快响应我的订单变更’。Vera就是为这种问题设计的。”

image.png

Vera不是孤军奋战,它将和Rubin GPU组成“智能体双引擎”

英伟达并未把Vera当作独立产品。据内部消息,未来几天将正式发布“Vera Rubin平台”——一套将Vera CPU与新一代Rubin GPU深度绑定的系统架构。CPU负责实时决策与任务调度,GPU专注大规模并行推理,两者通过NVLink 5.0实现超低延迟通信,延迟比传统方案降低60%以上。

这套组合已在内部测试中被用于“AI代理集群”场景:一个智能体在Vera上实时分析用户行为,同时调用Rubin GPU生成个性化内容,整个流程在20毫秒内完成,远快于人类反应速度。

目前,已有至少五家大型云服务商和三家自动驾驶公司与英伟达签署优先采购协议。一位不愿具名的芯片采购负责人说:“我们之前买GPU,现在得买‘系统’。Vera+Rubin不是升级,是重新定义了AI服务器该长什么样。”

真正的竞争,从“谁的AI能更快动起来”开始

过去几年,AI竞赛聚焦在参数量和训练成本上。而现在,行业焦点正转向:谁的AI能更自然地与人、与环境互动?

Vera的出现,不是为了打败别的CPU,而是为了支撑一种全新的AI形态——不是被动回答问题,而是主动规划、执行、反馈的“智能体”。它们会管理你的日程、协调物流、模拟市场波动,甚至帮你谈判合同。

这些能力,不靠更大的模型,靠的是更快的响应、更低的延迟、更聪明的任务调度。而Vera,正是为这个新世界准备的第一把钥匙。

2026年,当你发现你的客服机器人突然能听懂你话里的潜台词,你的订票系统能自己改签最优路线,你的投资助手在你开口前就预判了风险——那背后,可能就有一颗Vera在默默工作。