可灵AI 3.0上线：降低多模态创作门槛，实现电影级叙事普及

可灵 AI 3.0 正式上线：让视频创作，回归人的直觉

今天，可灵 AI 正式发布 3.0 版本。这不是一次参数堆砌的更新，而是一次从“能生成”到“懂表达”的彻底转变。我们不再只是把文字变成画面，而是开始理解：一个镜头为什么这样拍，一段故事为什么这样讲。

不用再拼镜头，AI 开始当你的副导演

过去用 AI 做视频，最头疼的是：每个镜头都像独立的海报，拼在一起却讲不清故事。3.0 的“智能分镜”彻底改变了这一点。你只需要输入一段文字描述——比如“黄昏的车站，女孩等车，雨突然落下，她低头看手表”——系统会自动拆解出：远景拉近、中景特写、慢推镜头、雨滴打在玻璃上的细节。它不再只是生成画面，而是像一个有经验的剪辑师，知道什么时候该静、什么时候该动。

现在，视频时长从过去的5秒延长到15秒，足够讲完一个完整的小情绪。配合多语种口型同步，中文、英文、日文的对白都能自然对上嘴型，连语气停顿都贴合语境。有用户用它做了个30秒的独立短片，发到B站，评论区第一句是：“这真的是AI做的？感觉像学生作业。”

你拍的照片，它能记住一辈子

想让AI生成的角色，和你手机里那张自拍一模一样？以前得反复调参数，试几十次。现在，你只需上传3~5张参考图——正面、侧面、笑容、背影——系统会自动锁定五官结构、发丝走向、甚至衣纹的褶皱习惯。不是“像”，是“就是你”。

不止是人。你拍的那只猫、你家的旧沙发、你旅行时捡回来的石头，都能成为画面里的固定元素。一位插画师用这个功能，把童年照片里的玩具熊，无缝融入了她新画的童话场景，她说：“我终于不用再画第二遍了。”

图片不只高清，更懂氛围

3.0 的图像生成，不再追求“像素多”，而是追求“感觉对”。新增的影视级光影重构技术，能读懂“晨光透过百叶窗”“霓虹灯在湿漉漉的街道上反光”这类模糊描述，输出的不是模糊的渲染图，而是可以直接用作海报、封面、甚至电影概念图的2K~4K原生画质。

更实用的是，现在你可以同时上传10张参考图。一张是色调，一张是构图，一张是光影，再加两张风格参考——系统会自动融合，不是简单叠加，而是像一位老练的美术指导，知道哪些元素该保留，哪些该弱化。你不用在不同工具间来回切换，所有调整，都在一个界面里完成。

现在就能用，但别等“完美”

目前，智能分镜、多图参考、4K输出等核心功能，已对黑金会员开放。普通用户也能体验基础版，只是节奏慢一点，限制多一点。官方说，接下来几个月会陆续开放更多工具——比如自动配乐、语音转情绪、甚至一键生成分镜脚本。

我们没说“颠覆行业”，也没提“AI革命”。因为真正的改变，不是技术多炫，而是当你打开软件，不再想“怎么写提示词”，而是直接说：“我想拍一个，关于重逢的故事。”

可灵 AI 3.0，不是让你更会用AI，而是让你忘了它在用AI。

CB科技站