Veo 3.1 正式上线:为短视频创作者量身打造的AI视频生成器
谷歌在本周二悄然更新了它的视频生成模型 Veo,这次不是小修小补,而是直接瞄准了每天刷 TikTok、刷 YouTube Shorts 的那群人——创作者。新版本 Veo 3.1 最大的改变,就是终于能原生生成 9:16 竖屏视频了。过去你用 AI 生成一段视频,结果发现是横的,还得自己裁剪、补背景、调比例,折腾半天。现在好了,直接在提示词里说“拍一条适合 TikTok 的短视频”,Veo 就会自动按对的尺寸输出,连边角都不用你操心。
这项功能已经深度集成进 YouTube Shorts 和 YouTube Create App,你打开应用,点一下“用 AI 生成”,输入几句想法,几秒后就能拿到一条可以直接发布的内容。不用再导出、转格式、再上传,整个流程像发朋友圈一样顺。

参考图一贴,角色活了
去年底的 Veo 3.0 已经能听懂音乐节奏、控制剪辑节奏,这次 3.1 把重点放到了“像不像”上。你上传一张人物照片,哪怕只是手机随手拍的,它都能在生成视频里还原那张脸的表情、神态,甚至眼神的转动。不是那种僵硬的“换脸”,而是真的像真人演出来的——笑的时候眼角会皱,说话时嘴唇会自然开合。
更实用的是,你现在可以混合搭配:比如把一个你朋友的照片放进科幻场景里,或者让一只卡通猫站在真实的城市街头。系统会自动统一光影、色调、质感,不会出现“卡通角色贴在实拍背景上”的违和感。很多用户试了之后都说:“这根本不像AI做的,倒像是哪个独立导演用绿幕拍的。”
从手机到专业设备,全都能用
普通用户不用下载任何工具,直接打开 Gemini App 就能用。你边喝咖啡边想个点子,10秒生成一条短视频,发到 Instagram Stories,点赞数可能比你拍一整天还高。
对专业创作者来说,这次升级更猛。通过 Flow 视频编辑器、Gemini API 或 Vertex AI,你可以调用最高 4K 分辨率的输出。这意味着你不再只是“做条短视频玩玩”,而是能用 AI 生成广告片、短剧、甚至电影预告片的初稿。不少独立电影人已经开始用 Veo 3.1 做分镜预演,省下几周的实拍时间。
谷歌还悄悄加了个“批量生成”功能——你给它 5 个不同文案,它能一次生成 5 条风格统一、但内容不同的视频,适合做 A/B 测试。有博主实测,用同一组素材,不同文案生成的视频在 TikTok 上的完播率能差出 37%。
目前,Veo 3.1 已对全球大部分地区开放,部分功能需登录 Google 账号并加入等待名单。如果你是内容创作者,哪怕只是偶尔发发朋友圈、小红书,也值得去试试——它可能不是最完美的工具,但它是第一个让你觉得“AI真能帮我干活”的视频生成器。