最新消息:关注人工智能 AI赋能新媒体运营

李飞飞领衔World Labs估值达50亿美元,剑指世界模型

科技资讯 admin 浏览

李飞飞的“世界模型”正在重塑AI的未来

在大语言模型的喧嚣逐渐降温之际,AI领域的一场静默革命正在悄然上演。由李飞飞创办的初创公司World Labs,刚刚完成了一轮估值50亿美元的融资,计划募资5亿美元——这意味着,这家成立不到一年的公司,在短短12个月内,身价从2亿飙升至50亿,翻了25倍。

这不是一场普通的资本狂欢。World Labs背后站着的,是AI圈最顶尖的名字:a16z、Radical Ventures、英伟达、淡马锡,还有谷歌首席科学家Jeff Dean亲自参与投资。这些机构和人物,过去曾押注过OpenAI、DeepMind,如今集体转向一个更冷门、更硬核的方向——构建能理解真实世界的AI。

它不只生成图片,它在“造世界”

World Labs推出的首款产品叫Marble,不是聊天机器人,也不是图像生成器,而是一个能根据文字或图片,自动生成可交互3D环境的系统。你输入“一个阳光洒进的旧书店,书架歪斜,地板有裂痕”,它就能输出一个拥有真实物理结构的虚拟空间——你可以从不同角度查看,模拟物体碰撞,甚至让机器人在里面“走路”“推箱子”。

这听起来像游戏引擎,但它的核心是物理仿真。Marble生成的不只是视觉模型,还有“碰撞网格”(collision mesh),这是机器人训练、自动驾驶模拟、虚拟拍摄等场景的刚需。比如,一个机器人要学习开门,传统方法需要成千上万次真实实验;而用Marble生成的虚拟环境,可以在几小时内完成百万次模拟。

目前,World Labs已与多家机器人公司和影视制作团队达成合作。有业内人士透露,一家好莱坞特效公司正用Marble替代传统建模流程,把原本需要数周的场景搭建压缩到几小时,成本降低70%。

李飞飞的“空间智能”野心

李飞飞不是第一次“押对赛道”。她曾带领团队打造ImageNet,引爆了深度学习的浪潮。如今,她认为AI的下一个突破点,不在语言,而在“空间”。

“我们不需要更聪明的对话机器人,我们需要能理解桌子为什么不会穿过地板、水为什么往低处流的AI。”她在一次内部分享中说。

World Labs的愿景,是打造一个“数字物理世界引擎”。它不满足于模仿表面,而是试图复刻现实世界的底层规则:重力、摩擦力、材质反射、物体稳定性……这些,才是真实世界交互的基础。

如果成功,它将彻底改变多个行业: - **机器人**:训练成本从百万美元级降到数万美元; - **影视与游戏**:实时生成可交互的背景世界,不再依赖人工建模; - **AR/VR**:让虚拟物体“真实”地落在你家地板上,不会漂浮或穿模; - **自动驾驶**:在虚拟城市中测试极端路况,无需上路冒险。

另一边,Yann LeCun也在“造世界”

这场竞赛并非孤军奋战。图灵奖得主Yann LeCun创办的AMI Labs,同样在争夺“世界模型”的制高点,估值已达35亿美元。

但两人的路径截然不同。LeCun主张“无监督学习+抽象表征”,认为AI不需要精确建模物理世界,只需学会预测“接下来会发生什么”——就像人类婴儿通过观察就知道,球滚下坡会加速。他的JEPA(联合嵌入预测架构)模型,更像一种“直觉推理系统”。

李飞飞则走“显式建模”路线:先精确重建物理世界,再让AI在里面学习。一个像工程师,一个像心理学家。

目前尚无公开数据证明哪种方式更优。但资本市场显然在双线押注——这说明,没人敢赌错。

真正的战场,不在ChatGPT,而在物理世界

过去五年,AI的焦点是“说人话”;未来十年,AI的焦点将是“懂世界”。

当Meta、Google、苹果都在布局AR眼镜,当波士顿动力的机器人开始走进仓库,当电影《阿凡达》的虚拟世界越来越逼真——这些技术的底层,都需要一个能理解物理规律的AI大脑。

World Labs不是在做一个“AI工具”,它在搭建一个“数字地球的引擎”。这或许比GPT-4更重要,因为它不是让你和AI聊天,而是让AI进入你的世界。

李飞飞曾在斯坦福说过一句话:“我们教AI认猫,是为了有一天,它能认出危险。”

现在,她正在教AI认整个世界。