最新消息:关注人工智能 AI赋能新媒体运营

谢赛宁再出重磅:多人视频世界模型Solaris发布,种子轮估值超35亿美元

科技资讯 admin 浏览

全球首个多人视频世界模型Solaris发布,AI开始“看懂”多人互动

2026年3月11日,谢赛宁团队正式推出Solaris——全球第一个能同时理解并生成多人实时互动视频的AI世界模型。这不是又一个“AI画图工具”,而是一个能让多个虚拟角色在同一个空间里自然互动、彼此影响、协同建造的动态世界。在《我的世界》的测试场景中,四位玩家各自搭建建筑,AI不仅能同步他们的动作,还能让砖块、光影、水流在所有人视角中保持一致,没有错位、没有穿模,更没有“一个人建塔,别人看到的是平地”的尴尬。

过去,AI生成视频只能处理单人、单视角的片段。你看到一个人走路,AI能模仿;但两个人同时跑动、碰撞、传递物品?那几乎不可能。Solaris打破了这个限制。它的核心,是团队新设计的“多人自注意力层”——简单说,就是让AI能“记住”每个玩家的位置、动作和意图,并实时计算他们之间的互动关系。这不是靠规则编程,而是靠数据和神经网络自己学会的。

image.png

背后公司AMI融资10亿美金,杨立昆亲自坐镇

Solaris的诞生,离不开一家刚浮出水面的公司——AMI。这家公司由图灵奖得主、Meta前首席AI科学家杨立昆(Yann LeCun)在2026年1月亲自创办,总部设在巴黎。杨立昆曾公开表示:“真正的智能,必须能理解世界如何运转,而不是只预测下一个像素。”AMI就是他为实现这一目标打造的实验场。

谢赛宁作为DiT(Diffusion Transformers)的原创作者,是AI视觉领域的公认先锋。他选择加入AMI,担任联合创始人兼首席科学官,负责技术落地。消息人士透露,AMI在成立不到两个月内,就完成了10.3亿美元的种子轮融资,投前估值达35亿美元。投资方包括红杉资本、a16z,以及几位来自游戏和元宇宙领域的资深投资人。

值得注意的是,AMI不打算做“AI网红工具”。他们的目标是构建底层引擎,让开发者能用它创建真正可交互的虚拟世界——不是预设动画,而是能被玩家改变、被AI理解、被多人共享的动态空间。

开源,是这场变革的起点

Solaris不是封闭系统。它的技术底座,是昆仑天工在2025年8月开源的Matrix-Game2.0——一个能处理长达数分钟、高分辨率视频序列的交互式生成模型。Solaris在此基础上,叠加了多人交互能力,并将核心模块、训练数据集和示例代码全部开放给开发者。

目前,GitHub上已上线Solaris的开发者工具包,支持Unity、Unreal Engine插件,也提供Python API。已有超过5000名开发者申请访问权限,其中不乏独立游戏团队、VR教育项目和机器人仿真实验室。一位来自东京的独立开发者用Solaris生成了一个“四人协作拼装机械”的教学场景,用户可以在VR中和AI角色一起动手,AI会根据你的动作调整讲解节奏——这在一年前,还只存在于科幻小说里。

不只是游戏,更可能是下一代交互界面

Solaris的意义,远不止于让游戏更逼真。教育、远程协作、心理治疗、甚至城市模拟,都可能因此改变。

一家德国公司正在测试用Solaris构建“虚拟工厂培训系统”:新员工戴上VR头盔,和AI导师一起操作设备,AI会根据你的错误动作实时生成对应的后果——比如误开阀门导致压力泄漏,系统会自动延展画面,让整个车间的灯光、警报、其他AI员工的反应都随之变化。

而在中国,有团队正尝试用它重建历史场景:用户可以“走进”1930年代的上海弄堂,看到多个虚拟居民在各自的生活节奏中行走、交谈、买卖——不是预录的片段,而是AI基于历史数据动态生成的日常。

当AI不再只是“看”视频,而是能“参与”世界,我们离的不是更炫的特效,而是一个真正能被共同体验、被共同塑造的数字空间。Solaris,或许只是第一步。但它的出现,已经让无数人重新思考:虚拟世界,到底该是谁的?