李飞飞新创公司World Labs获10亿美元融资,AI视觉领域再掀波澜
近日,由斯坦福大学人工智能实验室前主任李飞飞联合创立的初创公司World Labs宣布完成10亿美元融资,一举成为2024年全球AI领域最受瞩目的融资事件之一。这笔资金不仅刷新了AI初创公司的单轮融资纪录,更吸引了包括欧特克(Autodesk)、英伟达、AMD、Andreessen Horowitz在内的行业巨头集体押注。
其中,工业设计软件巨头欧特克出资2亿美元,成为最大单笔投资方。业内分析认为,这背后是AI与实体世界深度融合的信号——World Labs正尝试让AI不仅“看懂”图像,更能理解三维空间、物理规律与真实环境的交互,为建筑、制造、机器人等领域提供下一代视觉智能引擎。
李飞飞的名字在AI圈几乎等同于“视觉革命”。2006年,她主导的ImageNet项目集结全球学者,构建了包含超过1500万张标注图像的数据库,首次让机器具备了“认出猫、狗、汽车”的能力。这一项目直接催生了深度学习的爆发,2012年AlexNet在ImageNet竞赛中胜出,标志着AI真正从实验室走向现实。如今,她带着新的愿景归来:让AI不再只是“识别图片”,而是能“理解世界”。
据知情人士透露,World Labs的核心技术围绕“生成式三维场景建模”展开。其系统能根据一段文字或一段视频,自动生成高精度、可交互的3D环境——比如,输入“一个雨天的东京街头,霓虹灯下有行人撑伞走过”,系统就能输出具备真实光影、材质反射和物理运动的虚拟场景。这项能力已被用于影视特效、自动驾驶仿真和元宇宙内容生成,多家好莱坞工作室和汽车厂商已开始测试其技术。
英伟达的参与尤为关键。作为AI算力的基石,英伟达不仅投资,更将为World Labs提供专属GPU集群支持,加速其模型训练。而AMD的加入,则意味着其芯片技术有望成为未来边缘端AI设备的备选方案,降低部署成本。
与许多AI公司专注于语言模型不同,World Labs选择了一条更硬核、更重物理的道路。它不追求“写诗”或“聊天”,而是想让机器真正“看见”并“理解”我们生活的空间。正如李飞飞在内部信中所说:“我们不是在教AI认字,而是在教它认世界。”
目前,World Labs尚未公开产品名称,但已向部分开发者开放测试接口。有行业观察者预测,若其技术能稳定落地,可能成为继GPT之后,下一个改变人机交互方式的“视觉基座”。