
Google推出Veo 3.1,并在人工智能视频制作工具Flow中添加一系列更新,重点在于将音频引入现有流程,并提升叙事与写实表现。官方指出,此次更新让用户在Flow中以更精细的方式编辑片段,从前期设计到完成视频都拥有更高掌控度。
Flow底层采用生成式视频模型Veo,Google表示,自推出Flow以来,用户反馈最需要的是更强的艺术控制能力与音频支持,此次更新正是将这两点列为开发优先项。
Flow三项现有功能现已整合音频支持:其一是“图片生成视频”,允许上传多张参考图片,借此控制角色、物体与风格,现在可同时生成对应的音效;其二是“帧画面生成视频”,用户可提供起始与结束画面,系统自动补全中间过程及音频,适用于流畅转场;第三是“延长视频”,可根据前一段视频的最后一秒继续衔接,将镜头延长至约一分钟甚至更长,同时生成匹配的音频内容。
针对后期视频编辑,Flow新增了对象插入功能,可在任意场景中加入新元素,系统会自动处理阴影与场景光源,使合成效果更自然。此外,对象移除功能即将上线,用户移除不需要的对象后,Flow将自动重建背景与周边区域,减少视觉瑕疵。
在模型本身方面,Veo 3.1在提示遵循度、叙事控制与真实感上均有提升,特别是在图像转视频过程中的视听质量。官方表述为能捕捉更贴近真实材质的细节,目标是让生成内容在动态与声音上更接近实拍效果。
Veo 3.1除了可在Flow中直接体验外,也已通过Gemini API向开发者开放,并在Vertex AI平台面向企业用户推出,同时在Gemini应用中支持日常使用场景。Google同时表示,新功能已在Gemini API与Vertex AI开放对应支持,开发者文档也已标注Veo 3.1所支持的参考图片数量、首尾帧生成等功能。