李飞飞领衔World Labs估值达50亿美元，剑指世界模型

李飞飞的“世界模型”正在重塑AI的未来

在大语言模型的喧嚣逐渐降温之际，AI领域的一场静默革命正在悄然上演。由李飞飞创办的初创公司World Labs，刚刚完成了一轮估值50亿美元的融资，计划募资5亿美元——这意味着，这家成立不到一年的公司，在短短12个月内，身价从2亿飙升至50亿，翻了25倍。

这不是一场普通的资本狂欢。World Labs背后站着的，是AI圈最顶尖的名字：a16z、Radical Ventures、英伟达、淡马锡，还有谷歌首席科学家Jeff Dean亲自参与投资。这些机构和人物，过去曾押注过OpenAI、DeepMind，如今集体转向一个更冷门、更硬核的方向——构建能理解真实世界的AI。

它不只生成图片，它在“造世界”

World Labs推出的首款产品叫Marble，不是聊天机器人，也不是图像生成器，而是一个能根据文字或图片，自动生成可交互3D环境的系统。你输入“一个阳光洒进的旧书店，书架歪斜，地板有裂痕”，它就能输出一个拥有真实物理结构的虚拟空间——你可以从不同角度查看，模拟物体碰撞，甚至让机器人在里面“走路”“推箱子”。

这听起来像游戏引擎，但它的核心是物理仿真。Marble生成的不只是视觉模型，还有“碰撞网格”（collision mesh），这是机器人训练、自动驾驶模拟、虚拟拍摄等场景的刚需。比如，一个机器人要学习开门，传统方法需要成千上万次真实实验；而用Marble生成的虚拟环境，可以在几小时内完成百万次模拟。

目前，World Labs已与多家机器人公司和影视制作团队达成合作。有业内人士透露，一家好莱坞特效公司正用Marble替代传统建模流程，把原本需要数周的场景搭建压缩到几小时，成本降低70%。

李飞飞的“空间智能”野心

李飞飞不是第一次“押对赛道”。她曾带领团队打造ImageNet，引爆了深度学习的浪潮。如今，她认为AI的下一个突破点，不在语言，而在“空间”。

“我们不需要更聪明的对话机器人，我们需要能理解桌子为什么不会穿过地板、水为什么往低处流的AI。”她在一次内部分享中说。

World Labs的愿景，是打造一个“数字物理世界引擎”。它不满足于模仿表面，而是试图复刻现实世界的底层规则：重力、摩擦力、材质反射、物体稳定性……这些，才是真实世界交互的基础。

如果成功，它将彻底改变多个行业： - **机器人**：训练成本从百万美元级降到数万美元； - **影视与游戏**：实时生成可交互的背景世界，不再依赖人工建模； - **AR/VR**：让虚拟物体“真实”地落在你家地板上，不会漂浮或穿模； - **自动驾驶**：在虚拟城市中测试极端路况，无需上路冒险。

另一边，Yann LeCun也在“造世界”

这场竞赛并非孤军奋战。图灵奖得主Yann LeCun创办的AMI Labs，同样在争夺“世界模型”的制高点，估值已达35亿美元。

但两人的路径截然不同。LeCun主张“无监督学习+抽象表征”，认为AI不需要精确建模物理世界，只需学会预测“接下来会发生什么”——就像人类婴儿通过观察就知道，球滚下坡会加速。他的JEPA（联合嵌入预测架构）模型，更像一种“直觉推理系统”。

李飞飞则走“显式建模”路线：先精确重建物理世界，再让AI在里面学习。一个像工程师，一个像心理学家。

目前尚无公开数据证明哪种方式更优。但资本市场显然在双线押注——这说明，没人敢赌错。

真正的战场，不在ChatGPT，而在物理世界

过去五年，AI的焦点是“说人话”；未来十年，AI的焦点将是“懂世界”。

当Meta、Google、苹果都在布局AR眼镜，当波士顿动力的机器人开始走进仓库，当电影《阿凡达》的虚拟世界越来越逼真——这些技术的底层，都需要一个能理解物理规律的AI大脑。

World Labs不是在做一个“AI工具”，它在搭建一个“数字地球的引擎”。这或许比GPT-4更重要，因为它不是让你和AI聊天，而是让AI进入你的世界。

李飞飞曾在斯坦福说过一句话：“我们教AI认猫，是为了有一天，它能认出危险。”

现在，她正在教AI认整个世界。

CB科技站