最新消息:关注人工智能 AI赋能新媒体运营

Runway发布Gen-4.5:更快、更稳、更真实的视频生成引擎

科技资讯 admin 浏览

Runway Gen-4.5 正式发布:视频生成的新标杆,真实感与可控性全面突破

Runway 正式推出 Gen-4.5——其迄今为止最稳定、最细腻的文本生成视频模型。与前代相比,Gen-4.5 并非简单的参数堆砌,而是从底层架构上重构了动作物理模拟、材质响应与时空一致性逻辑,让生成的视频不再“像AI画的”,而是真正“像拍的”。

在第三方权威评测平台 Artificial Analysis 的最新榜单中,Gen-4.5 以 1247 Elo 分登顶全球第一,领先第二名近 80 分,创下当前视频生成模型的历史最高分纪录。这一成绩不仅印证了其在视觉质量上的领先地位,也标志着 AI 视频生成正式进入“工业可用”阶段。

动作更真实,物理更可信:从布料飘动到碰撞反馈,细节全面进化

过去 AI 视频常因“动作漂浮”“物体穿模”“头发像塑料”等问题被诟病。Gen-4.5 彻底改变了这一局面:

  • 人物奔跑时的重心转移、落地时的膝盖弯曲、衣物随惯性摆动,都精准还原了现实世界的力学规律;
  • 液体泼洒、风吹窗帘、头发在高速运动中的纠缠与分离,不再出现“帧间断裂”或“突然粘连”;
  • 多个角色同时互动时,空间关系稳定,遮挡关系自然,不会出现“角色突然穿墙”或“道具凭空消失”。

一位使用 Gen-4.5 制作短片的独立动画师表示:“我用它生成了一个人在雨中奔跑、甩动雨伞、踩水花的10秒镜头,前后调了3次提示词,每次输出都几乎可以直接用在成片里——这在以前根本不敢想。”

风格无缝切换:从实拍电影到日系动画,一帧不乱

Gen-4.5 不仅能“画得像”,更能“保持风格”。它首次实现了在单一生成序列中,对多种美术风格的高精度维持:

  • 真实系:光影层次细腻,肤色纹理自然,背景虚化符合光学规律;
  • 动画系:线条流畅、色块统一,能精准复刻宫崎骏、皮克斯或赛博朋克风格;
  • 生活片段(Slice of Life):晨光透过窗帘、咖啡杯的热气、翻书的手指——细节充满生活温度;
  • 电影质感:镜头推拉、焦点转移、光晕控制,甚至能模拟胶片颗粒与动态范围。

这意味着创作者无需为不同风格准备多个模型,也无需后期手动调色或帧修复。一个提示词,即可生成风格统一、情绪连贯的完整视频。

零学习成本:所有旧功能无缝升级,效率不降反升

Runway 没有抛弃老用户——Gen-4.5 完整保留了 Gen-4 的全部核心控制功能:

  • 图生视频(Image-to-Video):上传一张静图,自动生成动态场景;
  • 关键帧控制:手动设定关键帧,AI 自动补全中间动作;
  • 视频转视频(Video-to-Video):对现有视频进行风格迁移、分辨率提升或内容重绘;
  • 遮罩编辑、运动轨迹引导、镜头语言提示等高级功能全部保留。

更令人惊喜的是,生成速度与 Gen-4 完全一致,1080p 视频仍可在 1 分钟内完成,成本也未上涨。这意味着创作者无需为更强的性能支付更高代价——这在当前 AI 工具普遍涨价的环境下,实属罕见。

仍存挑战:因果错乱与物体消失,仍是行业共性难题

尽管 Gen-4.5 已大幅改善,但 AI 视频仍未“完美”。Runway 也坦诚承认当前仍存在的三大典型问题:

  • 因果错乱:比如“门把手还没被按,门却先开了”;
  • 物体不连续:被遮挡后再次出现时,可能形状、颜色或位置突变;
  • 行为过度成功:角色踢球偏了,球却精准入网——物理逻辑崩塌。

这些问题本质上是 AI 缺乏“世界模型”——即对现实物理、物体持久性、因果关系的深层理解。Runway 表示,团队正与 MIT、斯坦福的视觉认知研究组合作,构建基于物理引擎的“世界模拟器”,未来有望在 Gen-5 中实现“理解因果”的视频生成。

结语:离“真实创作”只差一步

Gen-4.5 不是革命,而是进化——但它足以让每一位内容创作者重新思考“视频制作”的边界。无论是短视频博主、独立电影人,还是广告公司、游戏美术团队,现在都可以用一句话,生成高质量、风格统一、动作可信的视频内容,无需昂贵的拍摄团队,无需复杂的后期流程。

它不完美,但已足够实用。正如一位影视导演在内测后所说:“我不需要它100%准确,我只需要它80%对,剩下的20%,我用手动剪辑补上——这比以前省了90%的时间。”

Gen-4.5,让 AI 从“辅助工具”,真正变成了“创作伙伴”。