Google Veo 3.1让AI视频能说话，视频制作工具Flow加入音频与长片段生成功能

Google推出Veo 3.1，并在人工智能视频制作工具Flow中添加一系列更新，重点在于将音频引入现有流程，并提升叙事与写实表现。官方指出，此次更新让用户在Flow中以更精细的方式编辑片段，从前期设计到完成视频都拥有更高掌控度。

Flow底层采用生成式视频模型Veo，Google表示，自推出Flow以来，用户反馈最需要的是更强的艺术控制能力与音频支持，此次更新正是将这两点列为开发优先项。

Flow三项现有功能现已整合音频支持：其一是“图片生成视频”，允许上传多张参考图片，借此控制角色、物体与风格，现在可同时生成对应的音效；其二是“帧画面生成视频”，用户可提供起始与结束画面，系统自动补全中间过程及音频，适用于流畅转场；第三是“延长视频”，可根据前一段视频的最后一秒继续衔接，将镜头延长至约一分钟甚至更长，同时生成匹配的音频内容。

针对后期视频编辑，Flow新增了对象插入功能，可在任意场景中加入新元素，系统会自动处理阴影与场景光源，使合成效果更自然。此外，对象移除功能即将上线，用户移除不需要的对象后，Flow将自动重建背景与周边区域，减少视觉瑕疵。

在模型本身方面，Veo 3.1在提示遵循度、叙事控制与真实感上均有提升，特别是在图像转视频过程中的视听质量。官方表述为能捕捉更贴近真实材质的细节，目标是让生成内容在动态与声音上更接近实拍效果。

Veo 3.1除了可在Flow中直接体验外，也已通过Gemini API向开发者开放，并在Vertex AI平台面向企业用户推出，同时在Gemini应用中支持日常使用场景。Google同时表示，新功能已在Gemini API与Vertex AI开放对应支持，开发者文档也已标注Veo 3.1所支持的参考图片数量、首尾帧生成等功能。

CB科技站

Google Veo 3.1让AI视频能说话，视频制作工具Flow加入音频与长片段生成功能

与本文相关的文章