谢赛宁再出重磅：多人视频世界模型Solaris发布，种子轮估值超35亿美元

全球首个多人视频世界模型Solaris发布，AI开始“看懂”多人互动

2026年3月11日，谢赛宁团队正式推出Solaris——全球第一个能同时理解并生成多人实时互动视频的AI世界模型。这不是又一个“AI画图工具”，而是一个能让多个虚拟角色在同一个空间里自然互动、彼此影响、协同建造的动态世界。在《我的世界》的测试场景中，四位玩家各自搭建建筑，AI不仅能同步他们的动作，还能让砖块、光影、水流在所有人视角中保持一致，没有错位、没有穿模，更没有“一个人建塔，别人看到的是平地”的尴尬。

过去，AI生成视频只能处理单人、单视角的片段。你看到一个人走路，AI能模仿；但两个人同时跑动、碰撞、传递物品？那几乎不可能。Solaris打破了这个限制。它的核心，是团队新设计的“多人自注意力层”——简单说，就是让AI能“记住”每个玩家的位置、动作和意图，并实时计算他们之间的互动关系。这不是靠规则编程，而是靠数据和神经网络自己学会的。

背后公司AMI融资10亿美金，杨立昆亲自坐镇

Solaris的诞生，离不开一家刚浮出水面的公司——AMI。这家公司由图灵奖得主、Meta前首席AI科学家杨立昆（Yann LeCun）在2026年1月亲自创办，总部设在巴黎。杨立昆曾公开表示：“真正的智能，必须能理解世界如何运转，而不是只预测下一个像素。”AMI就是他为实现这一目标打造的实验场。

谢赛宁作为DiT（Diffusion Transformers）的原创作者，是AI视觉领域的公认先锋。他选择加入AMI，担任联合创始人兼首席科学官，负责技术落地。消息人士透露，AMI在成立不到两个月内，就完成了10.3亿美元的种子轮融资，投前估值达35亿美元。投资方包括红杉资本、a16z，以及几位来自游戏和元宇宙领域的资深投资人。

值得注意的是，AMI不打算做“AI网红工具”。他们的目标是构建底层引擎，让开发者能用它创建真正可交互的虚拟世界——不是预设动画，而是能被玩家改变、被AI理解、被多人共享的动态空间。

开源，是这场变革的起点

Solaris不是封闭系统。它的技术底座，是昆仑天工在2025年8月开源的Matrix-Game2.0——一个能处理长达数分钟、高分辨率视频序列的交互式生成模型。Solaris在此基础上，叠加了多人交互能力，并将核心模块、训练数据集和示例代码全部开放给开发者。

目前，GitHub上已上线Solaris的开发者工具包，支持Unity、Unreal Engine插件，也提供Python API。已有超过5000名开发者申请访问权限，其中不乏独立游戏团队、VR教育项目和机器人仿真实验室。一位来自东京的独立开发者用Solaris生成了一个“四人协作拼装机械”的教学场景，用户可以在VR中和AI角色一起动手，AI会根据你的动作调整讲解节奏——这在一年前，还只存在于科幻小说里。

不只是游戏，更可能是下一代交互界面

Solaris的意义，远不止于让游戏更逼真。教育、远程协作、心理治疗、甚至城市模拟，都可能因此改变。

一家德国公司正在测试用Solaris构建“虚拟工厂培训系统”：新员工戴上VR头盔，和AI导师一起操作设备，AI会根据你的错误动作实时生成对应的后果——比如误开阀门导致压力泄漏，系统会自动延展画面，让整个车间的灯光、警报、其他AI员工的反应都随之变化。

而在中国，有团队正尝试用它重建历史场景：用户可以“走进”1930年代的上海弄堂，看到多个虚拟居民在各自的生活节奏中行走、交谈、买卖——不是预录的片段，而是AI基于历史数据动态生成的日常。

当AI不再只是“看”视频，而是能“参与”世界，我们离的不是更炫的特效，而是一个真正能被共同体验、被共同塑造的数字空间。Solaris，或许只是第一步。但它的出现，已经让无数人重新思考：虚拟世界，到底该是谁的？

Solaris Matrix-Game2.0 多人自注意力层视频世界模型

CB科技站

谢赛宁再出重磅：多人视频世界模型Solaris发布，种子轮估值超35亿美元

全球首个多人视频世界模型Solaris发布，AI开始“看懂”多人互动

背后公司AMI融资10亿美金，杨立昆亲自坐镇

开源，是这场变革的起点

不只是游戏，更可能是下一代交互界面

与本文相关的文章