最新消息:关注人工智能 AI赋能新媒体运营

昆仑万维开源SkyReels-V3,实现多模态视频生成突破

科技资讯 admin 浏览

昆仑万维开源SkyReels-V3:一款真正能拍电影的AI视频工具

1月29日,昆仑万维正式将自研的视频生成模型SkyReels-V3开源,并开放限时免费API调用。这不是又一个“概念演示”,而是一个能让创作者直接上手、做出有逻辑、有情绪、有细节的AI视频的实用工具。

过去很多AI视频工具只能把一张图“动起来”,动得还很僵硬。SkyReels-V3不一样——它能用1到4张参考图,生成一个连贯、稳定、人物特征不跑偏的视频。你给它一张人物正面照、一张侧脸、一张手部特写,它就能让你的角色自然地转头、抬手、走路,连衣服褶皱和光影变化都跟得上。实测对比Vidu Q2和Kling1.6,它的画面细节和身份一致性明显更稳,不是靠“糊弄”骗过眼睛的那种。

QQ20260129-154437.png

不是拉长视频,是讲完一个故事

很多人试过AI视频延长功能——就是把10秒的片段硬生生拖到30秒,结果画面重复、动作卡顿,像PPT翻页。SkyReels-V3的“镜头切换延长模式”彻底改变了这一点。

它内置了专业级的电影转场逻辑:你可以让它从一个中景镜头,自然切到人物的正反打,再接一个主观视角的过肩镜头。不是机械地“复制粘贴”,而是像导演一样安排节奏。有用户用它生成了一段咖啡馆对话场景:人物说话、低头搅咖啡、抬头微笑、镜头拉远——整段视频有情绪起伏,有空间感,完全不像AI生成的。

这背后是模型对“叙事结构”的理解,而不是单纯预测下一帧。对短视频创作者、独立导演、广告团队来说,这意味着你不再需要花几小时剪辑拼接,AI能帮你把“想法”直接变成有结构的镜头语言。

让数字人说话,终于不“鬼畜”了

音频驱动虚拟形象(Talking Avatar)是SkyReels-V3的另一个亮点。过去AI数字人说话,嘴型对不上、语速怪、表情僵,听久了让人想关掉。

SkyReels-V3的口型同步精度大幅提升,哪怕是一段两分钟以上的对话,唇形依然能跟上每一个音节。更重要的是,它支持多角色互动——你可以同时生成两个角色对话,各自有不同表情和动作,语音和嘴型完全匹配。这在在线教育、虚拟主播、客服机器人场景里,体验是质的飞跃。

有教育机构已经用它做英语口语练习视频:AI老师提问,学生虚拟形象回答,系统自动打分。老师说“这比以前的工具真实10倍”。

QQ20260129-154523.png

开源,不画饼

昆仑万维这次没搞“内测预约”“限量内测”那一套。SkyReels-V3的完整代码、训练权重、使用文档,已经全部放在GitHub上,任何人都能下载、修改、商用(需遵守开源协议)。

同时,官方提供免费API调用额度,普通用户每天可生成几十秒视频,创作者和开发者也能申请更高权限。没有隐藏收费,没有“先免费后割韭菜”的套路。

这不是一场技术发布会,而是一次工具的交付。如果你是短视频创作者、独立动画师、教育内容制作者,或者只是想试试AI能不能帮你把脑洞变成视频——现在,你可以直接去用它了。

项目地址:https://github.com/SkyworkAI/SkyReels-V3