最新消息:关注人工智能 AI赋能新媒体运营

可灵AI 3.0上线:降低多模态创作门槛,实现电影级叙事普及

科技资讯 admin 浏览

可灵 AI 3.0 正式上线:让视频创作,回归人的直觉

今天,可灵 AI 正式发布 3.0 版本。这不是一次参数堆砌的更新,而是一次从“能生成”到“懂表达”的彻底转变。我们不再只是把文字变成画面,而是开始理解:一个镜头为什么这样拍,一段故事为什么这样讲。

image.png

不用再拼镜头,AI 开始当你的副导演

过去用 AI 做视频,最头疼的是:每个镜头都像独立的海报,拼在一起却讲不清故事。3.0 的“智能分镜”彻底改变了这一点。你只需要输入一段文字描述——比如“黄昏的车站,女孩等车,雨突然落下,她低头看手表”——系统会自动拆解出:远景拉近、中景特写、慢推镜头、雨滴打在玻璃上的细节。它不再只是生成画面,而是像一个有经验的剪辑师,知道什么时候该静、什么时候该动。

现在,视频时长从过去的5秒延长到15秒,足够讲完一个完整的小情绪。配合多语种口型同步,中文、英文、日文的对白都能自然对上嘴型,连语气停顿都贴合语境。有用户用它做了个30秒的独立短片,发到B站,评论区第一句是:“这真的是AI做的?感觉像学生作业。”

你拍的照片,它能记住一辈子

想让AI生成的角色,和你手机里那张自拍一模一样?以前得反复调参数,试几十次。现在,你只需上传3~5张参考图——正面、侧面、笑容、背影——系统会自动锁定五官结构、发丝走向、甚至衣纹的褶皱习惯。不是“像”,是“就是你”。

不止是人。你拍的那只猫、你家的旧沙发、你旅行时捡回来的石头,都能成为画面里的固定元素。一位插画师用这个功能,把童年照片里的玩具熊,无缝融入了她新画的童话场景,她说:“我终于不用再画第二遍了。”

图片不只高清,更懂氛围

3.0 的图像生成,不再追求“像素多”,而是追求“感觉对”。新增的影视级光影重构技术,能读懂“晨光透过百叶窗”“霓虹灯在湿漉漉的街道上反光”这类模糊描述,输出的不是模糊的渲染图,而是可以直接用作海报、封面、甚至电影概念图的2K~4K原生画质。

更实用的是,现在你可以同时上传10张参考图。一张是色调,一张是构图,一张是光影,再加两张风格参考——系统会自动融合,不是简单叠加,而是像一位老练的美术指导,知道哪些元素该保留,哪些该弱化。你不用在不同工具间来回切换,所有调整,都在一个界面里完成。

现在就能用,但别等“完美”

目前,智能分镜、多图参考、4K输出等核心功能,已对黑金会员开放。普通用户也能体验基础版,只是节奏慢一点,限制多一点。官方说,接下来几个月会陆续开放更多工具——比如自动配乐、语音转情绪、甚至一键生成分镜脚本。

我们没说“颠覆行业”,也没提“AI革命”。因为真正的改变,不是技术多炫,而是当你打开软件,不再想“怎么写提示词”,而是直接说:“我想拍一个,关于重逢的故事。”

可灵 AI 3.0,不是让你更会用AI,而是让你忘了它在用AI。