Waymo上周五(2月6日)公布了其最新的生成式自动驾驶模拟系统“Waymo世界模型(Waymo World Model)”,称该模型将成为自动驾驶安全验证的核心基础设施,使系统在真正上路前,能够在高度仿真的虚拟世界中完成数十亿英里的测试与训练。
Waymo世界模型基于Genie 3构建,该模型由Google DeepMind开发,是一套能够实时生成可交互3D世界的通用型世界模型。Waymo在此基础上进行了专门优化,使其符合自动驾驶需求,并能同步输出摄像头与激光雷达数据,完整还原自动驾驶车辆在真实道路上所接收的多传感器信息。
Waymo表示,其自动驾驶系统Waymo Driver至今已在美国多座城市完成近2亿英里的全自动驾驶行程,但实际道路测试仅是整体训练的一部分。模拟环境使Driver能够在极端与复杂场景中反复演练,是其AI安全体系的重要支柱之一。
具体而言,世界模型的最大价值在于能够系统性地模拟现实中极为罕见、但对安全至关重要的长尾场景,例如龙卷风、洪水、暴雪、逆向行驶车辆、道路突发障碍物,甚至大型动物或特殊装扮的行人闯入车道。这类事件在真实世界中难以大量采集,但一旦发生,将对自动驾驶系统的决策与反应能力构成严峻考验。
除了覆盖场景广泛,Waymo世界模型还具备高度可控性。工程师可通过语言指令、驾驶操作或场景配置,快速生成不同路线、天气、时间与交通行为的测试案例,进行反事实模拟,评估系统在不同选择下是否能做出更安全或更高效的判断。
此外,相较于仅能重建已有行程的传统模拟方法,生成式世界模型即使在路线大幅偏离原始数据时,仍能保持画面与物理的一致性。
Waymo认为,通过在虚拟世界中提前测试各种高风险与罕见情境,能够建立更严格、可验证的安全证据,并为未来将自动驾驶服务扩展至更多城市与驾驶环境奠定重要基础。
Google也于今年1月底推出了实验性原型Project Genie,率先向美国的Google AI Ultra订阅用户开放试用。这是一个网页版交互原型,基于Genie 3,并结合Nano Banana Pro与Gemini,让用户能够创建、探索并修改自己的虚拟世界。Project Genie会随着用户移动实时生成前方场景,并模拟物理与互动关系;用户可通过文字或图片草图构建世界,设定角色、视角与移动方式,也可混搭他人创作的世界,或将探索过程导出为视频。