Google释出Gemini 2.5 Flash Image，已整合至Adobe与OpenRouter

图片来源:

Google

Google周二（8/26）正式推出内部代号为「奈米香蕉」（nano-banana）的图像生成模型Gemini 2.5 Flash Image。新模型提升了画质与控制力，同时强调角色一致性、多图融合及语意导向编辑能力，并首度与Adobe及OpenRouter合作，扩大应用生态。

Google是在去年底开始小规模地测试Gemini 2.5 Flash上的图像生成能力，继之于今年3月透过Google AI Studio扩大实验规模至全球市场，而Gemini 2.5 Flash Image应是它的首个正式版本。

Gemini 2.5 Flash Image有4个主要特色，包括能让同一人物或产品在不同场景中保持外观一致的角色一致性；让用户以自然语言指令精準修改图像，例如模糊背景、去除污渍，甚至是改变姿势；多图融合能力允许开发者可将多张图像合成，轻鬆将物件放入新场景；还能整合世界知识，理解手绘图表及教育应用，处理複杂的编辑需求。

新模型可透过Gemini API与Google AI Studio使用，定价为每百万输出Token收费30美元，由于每张图像约需要1,290个Token，平均每张图像约0.039美元。同时，所有生成与编辑的图像都将附带SynthID数位浮水印，以确保透明度与追溯性。

Adobe已宣布将Gemini 2.5 Flash Image模型整合至Adobe Firefly及Adobe Express，前者为Adobe于2023年推出的生成式AI图像与设计平台，后者属于大众化的多合一内容创作平台。Adobe表示，不管是社交平台创作者、行销人员或是视觉设计师都能利用该模型来实现使用者的创意。

图片来源／Adobe

Adobe用户可免费生成20张图像，付费订阅则能解锁无限使用。

此外，Gemini 2.5 Flash Image也已成为OpenRouter上首个支援图像生成的模型，宣称可用来生成网站页面、製作角色一致的漫画分镜，以及建立大量不同版本的标誌设计。

2023年创立的OpenRouter为一模型中介平台，定位为AI模型的App Store，让开发人员可透过单一API介面存取不同的AI模型，目前已支援超过480种模型，从文字、程序码到图像生成。

CB科技站

Google释出Gemini 2.5 Flash Image，已整合至Adobe与OpenRouter

与本文相关的文章