
Nvidia
近日在Computex举行前夕,Nvidia在台大体育馆一场活动中展示一段2分钟的数位孪生地球影片。影片中Nvidia执行长黄仁勋用标準的中文进行解说,不论是声调、咬字发音相当到位,一点看不出来有什么不寻常的地方。黄仁勋还不时在影片中穿插,根据讲到的台词或段落,做出相对应的动作。
影片播完后,黄仁勋才透露,影片中的口述完全是由AI(他自称为Jensen AI)配音,他只负责编写讲稿,他还开玩笑反问现场参加者:「我(编按:Jensen AI)的国语讲的标準吗?」
这其实已不是黄仁勋第一次用AI替身出场,但在生成式AI快速窜红后,许多企业开始将这种对话式GenAI能力带进组织内部,为应用带来革新。这也是黄仁勋整场演讲的主轴,他大谈了对生成式AI的观察以及产业的冲击,更揭露了未来Nvidia AI运算的发展蓝图。他特别提到台湾在全球AI基础架构建设中扮演的重要角色,并强调在台湾拥有许多重要的合作伙伴。
资料中心就像是一座AI工厂,正在生成、创造、生产有价值的新商品
谈到ChatGPT对于AI发展的影响,黄仁勋指出,ChatGPT出现前,AI的发展主要集中在感知和侦测领域,例如自然语言理解、电脑视觉以及语音辨识。ChatGPT问世后,生成式AI才开始受到广泛重视。不同于以往的AI,生成式AI以Token为单位进行生成,这些Token可以生成多种形式,包括文字、图片、图表、表格、歌曲、语音和影片。甚至任何具有学习意义的事物,如化学物质、蛋白质、基因,或是在数位孪生地球Earth 2中生成气象资讯,还可以用来生成汽车方向盘控制讯号、或为机器人手臂生成关节等有价值的事物,「我们学到的一切,现在都可以生成。」
黄仁勋进一步强调:「我们现在已进到生成式AI时代,而不是AI时代」,这样的转变也促使原有的超级电脑进化成以输出Token为其唯一任务的资料中心。他形容这座资料中心就像是一座AI工厂,正在生成、创造、生产有价值的新商品。
他进一步解释,这座AI工厂可以为每个产业生产新商品,带来显着价值,而且这个工厂可以弹性扩展和和快速複製,将许多不同GenAI模型运用到各行业。这使得工厂不再仅仅是用来储存资料或进行资料处理,而是一个能为每个产业产生智慧的AI工厂,进而形成一个在製造过程中运用电脑的製造行业,不再以製造电脑为主,「这在以前从未发生过」黄仁勋这样说道。
以生成式AI为契机,3兆规模的IT产业也能够直接服务百兆规模的他产业
如同1890年发明的交流发电机开启了电力时代,黄仁勋表示,Nvidia的AI生成器可以产生Token,具有和过去AC发电机一样庞大潜在市场机会,几乎可以彻底改变每个产业,这将带来新的机会,以生成式AI为契机,「3兆规模的IT产业也能够直接服务百兆规模的他产业。」他指出,从加速运算开始,促成了AI的发展,更催生了生成式AI的诞生,现在,正掀起一场新的工业革命。
生成式AI的出现不只冲击其他产业,对于IT产业的影响也非常大。他特别提到,生成式AI驱动了全堆叠重塑,将传统的软件工厂转变成AI工厂,涵盖底层硬件、指令、检索和工具层都因此改变。举例来说,过去的运算模型是以检索为导向,而未来会由生成模式取代。电脑将能生成大量内容,只检索必要的讯息,这不仅需能够节省能源,还能生符合上下文相关性的资讯。甚至在这样的发展下,他说,电脑不再仅仅是一种工具,而是能够生成技能并执行任务的装置。
就像当年微软推出套装软件颠覆了PC产业一样,他表示,Nvidia针对新的AI工厂和新电脑中推出一种全新形式的软件,即NIM(Nvidia Inference Microservice)。
他进一步说明,NIM是一种容器化的推论微服务。在一个NIM容器中,包含了CUDA、cuDNN,以及提供推论服务的TensorRT LLM模型推论引擎和Triton推论服务器。不仅如此,NIM採用云原生架构,可以在Kubernetes环境中自动扩展,并提供AI监控管理工具和标準API。开发人员可以在装有CUDA的电脑上部署NIM,然后像使用ChatGPT一样与其对话。此外,NIM还支援400个经过认证的服务器和工作站产品,而且可部署在不同的基础设施上,涵盖工作站、云端到本地资料中心。
透过NIM,企业可以快速使用各种LLM和预训练模型建立自己的AI应用,包含文字生成模型、影像生成模型,多模态模型等,以及各种专用领域的模型,像是健康医疗模型,数位生物模型,以及数位人类模型等。此外,NIM也针对Hugging Face平台上最新大型语言模型Llama 3进行优化。
客服AI代理将是未来关键的GenAI应用
黄仁勋也指出,客服AI代理将是未来关键的GenAI应用,各产业可以快速建立不同客服AI代理人,应对不同的客户服务需求,如数位护士、数位客服和数位导师。这些代理人可以像护理师一样,协助处理非处方或非诊断的患者照护服务,也能应对零售客户服务、食品服务、金融服务、保险服务等各种需求。
他也提到,未来在AI应用服务中会有各种NIMs组成的AI代理,这些代理人可以协同执行任务。例如,有的NIMs会负责分配任务和拟定执行计画,而其他的NIMs则会负责检索资讯、进行搜寻,或者使用各种工具或执行SQL查询。每个NIMs都是代表某方面的专家,这些NIMs会组成一个AI团队的应用程序,「过去,应用程序是用指令编写的,现在则转变成了组建人工智慧团队的应用程序。」他强调。
黄仁勋深信,未来每家公司内部将拥有大量的NIMs。这些NIMS可以组成一个个团队,企业只需将任务交给NIM代理人,来负责分配任务和执行计画,甚至不必弄清楚如何连接它们,最后再将任务执行结果回报给企业,「就像人类一样互动,这就是未来应用程序的样貌。」他说,更大的愿景是实现数位人类,让应用程序也能像人类一样互动。
ACE正是Nvidia用来发展数位人类一套技术,以统一运算框架为基础,并提供软件工具和API,让开发人员可以製作出高度逼真和互动的虚拟分身。Nvidia最新推出了ACE NIMs,进一步将ACE整合进NIMs中,能够在Nvidia加速基础设施GDN部署和执行,可提供超过100个地区的低延迟处理。
ACE NIMs中包含了各种数位人类建立所需的NIMs。其中,Nemotron SLM和LLM NIMs负责用于理解使用者的意图并协调其他模型,而Riva语音NIMs则用于互动式语音和翻译。Audio2Face的NIMs用于生成脸部和身体动画,至于Omniverse RTX与DLSS则用于生成皮肤和头髮的神经渲染。
ACE不仅可以在云端执行,也能在装有RTX GPU的行动PC上执行。Nvidia表示,目前全球出货高达1亿台内建GeForce RTX的AI PC,推出逾200款内建RTX的Al笔电,在RTX GPU中包含了Tensor Core,可提供高达700个TOPS的在AI算力?。此外,在Computex 上,还有4款採用Nvidia GPU的AI PC将推出。
Nvidia还展示在RTX技术上的游戏AI助手Project G-Assist,让玩家可以在PC游戏中以文字、语音,以及游戏视窗的快照向游戏助手询问,来解答其在游戏中所遇到的任何问题。
除了支援AI PC之外,Nvidia还揭露资料中心AI运算的发展蓝图,除了现有的Blackwell架构GPU外,Nvidia预告将在明年推出Blackwell Ultra,后年发表Rubin。此外,Nvidia还进一步宣布将AI晶片的更新时程调快至每年一次,因应快速发展的生成式AI浪潮所需。
黄仁勋看好机器人应用将掀起下一波AI浪潮。他表示,这些机器人由生成式物理AI模型驱动,透过多模态大语言模型和强化学习模型,使得它们能够学习、感知并理解周围的世界,进而能够制定执行计划,以便能在现实世界中自动执行複杂任务。
他提到说,企业现今已可使用Nvidia AI超级电脑用于训练物理AI模型,并使用Jetson Orin以及下一代Jetson Thor机器人超级电脑用于执行这些模型推论。此外,还能透过Omniverse数位分身工具,让机器人在模拟世界中持续精进其技能。