最新消息:关注人工智能 AI赋能新媒体运营

Google释出Gemini 2.5 Flash Image,已整合至Adobe与OpenRouter

科技智能 admin 浏览 评论
图片来源:

Google

Google周二(8/26)正式推出内部代号为「奈米香蕉」(nano-banana)的图像生成模型Gemini 2.5 Flash Image。新模型提升了画质与控制力,同时强调角色一致性、多图融合及语意导向编辑能力,并首度与Adobe及OpenRouter合作,扩大应用生态。

Google是在去年底开始小规模地测试Gemini 2.5 Flash上的图像生成能力,继之于今年3月透过Google AI Studio扩大实验规模至全球市场,而Gemini 2.5 Flash Image应是它的首个正式版本。

Gemini 2.5 Flash Image有4个主要特色,包括能让同一人物或产品在不同场景中保持外观一致的角色一致性;让用户以自然语言指令精準修改图像,例如模糊背景、去除污渍,甚至是改变姿势;多图融合能力允许开发者可将多张图像合成,轻鬆将物件放入新场景;还能整合世界知识,理解手绘图表及教育应用,处理複杂的编辑需求。

新模型可透过Gemini API与Google AI Studio使用,定价为每百万输出Token收费30美元,由于每张图像约需要1,290个Token,平均每张图像约0.039美元。同时,所有生成与编辑的图像都将附带SynthID数位浮水印,以确保透明度与追溯性。

Adobe已宣布将Gemini 2.5 Flash Image模型整合至Adobe Firefly及Adobe Express,前者为Adobe于2023年推出的生成式AI图像与设计平台,后者属于大众化的多合一内容创作平台。Adobe表示,不管是社交平台创作者、行销人员或是视觉设计师都能利用该模型来实现使用者的创意。

图片来源/Adobe

Adobe用户可免费生成20张图像,付费订阅则能解锁无限使用。

此外,Gemini 2.5 Flash Image也已成为OpenRouter上首个支援图像生成的模型,宣称可用来生成网站页面、製作角色一致的漫画分镜,以及建立大量不同版本的标誌设计。

2023年创立的OpenRouter为一模型中介平台,定位为AI模型的App Store,让开发人员可透过单一API介面存取不同的AI模型,目前已支援超过480种模型,从文字、程序码到图像生成。

发表我的评论
取消评论

表情

您的回复是我们的动力!

  • 昵称 (必填)
  • 验证码 点击我更换图片

网友最新评论