最新消息:关注人工智能 AI赋能新媒体运营

英伟达发布自动驾驶AI模型Alpamayo家族,让自动驾驶汽车具备类人思考能力

科技资讯 admin 浏览

在消费电子展(CES)2026上,NVIDIA开源了自动驾驶AI模型Alpamayo系列,目标是让自动驾驶车辆能够像人类一样思考,在复杂环境中安全行驶,并发布了首款号称全球首个具备思考能力的视觉语言行为(Vision-Language-Action, VLA)模型,未来还将推出更多型号。

Alpamayo系列是具备思维链推理能力的VLA模型,可为自动驾驶的决策过程注入类似人类的逻辑推理能力。它能够在新型或罕见情境中逐步分析,提升在复杂环境中的驾驶安全性,并清晰解释其决策依据,这也是全栈式安全系统NVIDIA Halo的基础。

NVIDIA首席执行官黄仁勋表示,机器开始理解、思考并行动于真实世界,是“实体AI的ChatGPT时刻”。

今天NVIDIA发布的Alpamayo项目包含开源模型、模拟框架和数据集。首先是全球首个专为自动驾驶设计的思维链推理VLA模型Alpamayo 1,参数量为100亿,现已在Hugging Face上向研究人员和自动驾驶开发者开放。该模型可接收视频输入,生成行驶轨迹与推理线索,清晰展示每个决策背后的逻辑。开发者可将Alpamayo 1优化为适用于车载系统的轻量化推理模型,或作为推理评估、自动标注等开发工具的基础。NVIDIA同时开放了模型权重及开源推理脚本。

未来,Alpamayo家族将推出参数量更大、推理能力更精细的版本,并扩展输入输出的灵活性。目前Alpamayo 1以非商业授权开源,但NVIDIA表示未来将提供商业授权选项。

除了Alpamayo 1,NVIDIA还提供了AlpaSim模拟框架(位于GitHub)和实体AI开放数据集(位于Hugging Face)。AlpaSim提供完整的仿真环境,包括高保真传感器模拟、可配置的交通流以及可扩展的闭环测试平台,助力快速验证与策略调优。该数据集包含来自全球不同地区和气候环境下的1700多小时驾驶数据,涵盖多种罕见或极端路况,可用于训练高级推理架构模型。

NVIDIA宣布,包括Lucid、JLR、Uber和Berkeley DeepDrive在内的多家自动驾驶系统开发商已表示将采用Alpamayo开发L4级自动驾驶系统堆栈。