
谷歌发布“纳米香蕉”图像生成模型正式版,支持商用与批量生成
谷歌周四(10月2日)宣布,代号为“纳米香蕉”(Nano Banana)的图像生成模型Gemini 2.5 Flash Image正式进入生产阶段,新增10种长宽比、支持批量处理,并开始提供商业授权。
过去的AI图像工具大多仅依赖文字生成图像,缺乏对图片内容的深层理解。而“纳米香蕉”能够同时理解文字与图像,可直接修改用户上传的照片,理解自然语言指令,并保持角色一致性。凭借快速生成能力(耗时少于10秒),该模型自8月底开放预览以来迅速走红。据谷歌统计,期间仅Gemini应用中的“纳米香蕉”就被用于创作超过50亿个作品。
此次发布意味着Gemini 2.5 Flash Image模型已从预览阶段转为正式产品,可安全应用于生产环境,受商业条款保护,并将开始收费。价格为每百万输出Token 30美元。由于每张图平均消耗约1,290个Token,因此单张图像生成成本约为0.039美元。
正式版除开放商用和收费外,还带来多项升级。预览版“纳米香蕉”仅能生成16:9固定比例图像,正式版则新增支持21:9、16:9、4:3、3:2、1:1、9:16、3:4、2:3、5:4、4:5共10种比例,让用户更灵活地为不同平台和用途生成内容,如电影级横幅、方形社交帖文或竖版短视频封面等。
此外,模型现已支持批量处理,可一次性生成多张图像,显著提升工作效率,适用于营销素材、商品图或游戏角色的大规模制作场景。
谷歌还分享了“纳米香蕉”的四项使用技巧:利用其角色一致性功能创建虚拟形象或将自拍照卡通化;通过自然语言指令修改图像细节,例如“让狗闭上嘴巴”;使用简单口语化指令激发创意潜能;以及借助Gemini App的Canvas模式或Google AI Studio构建新应用。
其中值得一提的是,用户或开发者无需编写代码,只需输入一句提示语,即可生成完整的AI图像应用。例如:“帮我创建一个可以上传照片并添加滤镜的图片编辑App”。谷歌团队展示了多个案例,包括PictureMe——用户上传一张照片并选择“80年代商场写真”主题后,系统自动生成6张风格各异的照片;可将静态图转为GIF动画的Bananimate;以及帮助预览不同穿搭效果的Fit Check工具。
用户或开发者可通过Gemini App、Google AI Studio、Gemini API或Vertex AI访问“纳米香蕉”模型。目前Gemini App与Google AI Studio仍提供少量免费体验额度。