最新消息:关注人工智能 AI赋能新媒体运营

Google将于11月11日发布Nano Banana 2

科技资讯 admin 浏览

Google 即将发布 Nano Banana 2:AI 图像生成迎来“自我修正”时代

就在几小时前,Google 内部测试人员意外在 Media AI 平台开放了 Nano Banana 2 的限时体验通道,短短数小时内,数百名开发者和设计师已下载并测试了这一新版本。从流出的样张来看,Nano Banana 2 不仅在画质上实现了飞跃,更首次引入了“多步自我审查生成流程”——这标志着 AI 图像生成技术正从“一键出图”迈向“智能创作助手”的新阶段。

相比前代,Nano Banana 2 在细节处理上堪称革命性突破。无论是人物发丝的光影过渡、布料褶皱的物理真实感,还是文字内容的精准修正(如将英文商标“Coca-Cola”无缝替换为“可口可乐”并保持字体风格一致),系统都能在不依赖人工干预的情况下自动完成。有测试者表示:“它甚至能识别出我故意加错的透视错误,并在重绘时自动校正——这已经不是工具,而像一个有审美判断的助手。”

“自我审查”流程:AI 第一次学会“挑毛病”

传统 AI 图像生成模型往往“一次生成,直接输出”,即使出现逻辑错误(如五根手指、扭曲的建筑结构)也难以自纠。而 Nano Banana 2 引入的“多步生成流程”彻底改变了这一模式:

  • 第一步:规划 —— 系统先解析提示词,构建场景结构、光照逻辑与元素关系图谱;
  • 第二步:初稿生成 —— 输出基础图像;
  • 第三步:自动检测 —— 通过多维度模型扫描:解剖合理性、透视一致性、文字可读性、色彩和谐度;
  • 第四步:迭代修正 —— 针对问题区域局部重绘,最多可循环 3–5 次;
  • 第五步:最终输出 —— 选择最符合原始意图且无明显缺陷的版本。

据 Google 内部测试报告,这一流程使“视觉逻辑错误率”下降了 87%,远超 Midjourney v7 和 DALL·E 3 的表现。更令人惊讶的是,系统还能识别“过度美化”——例如在生成风景照时,若检测到天空过于饱和、云层失真,会主动降低渲染强度,追求“真实感优先”。

分辨率、画幅全面升级,专业创作者的福音

此次 Nano Banana 2 不再局限于“社交媒体尺寸”。它原生支持:

  • 画幅比例:1:1、4:5、16:9、21:9、3:2、甚至 1:2.35(电影宽银幕)
  • 分辨率输出:1K(1024px)、2K(2048px)、4K(4096px),部分测试版已支持 8K(8192px)
  • 专业格式:可导出 PNG-24、TIFF、EXR(支持透明通道与高动态范围)

这意味着设计师可以直接生成可用于印刷、影视背景或广告物料的高精度图像,无需后期拉伸或修复。有广告公司已开始用它制作户外大屏海报,成本降低 60%。

背后的技术:Imagen 4 还是 Gemini 3 Pro?真相正在浮出水面

尽管官方尚未公布技术细节,但多个技术分析机构(包括 The Verge 和 AnandTech)通过模型参数比对和推理路径追踪,认为 Nano Banana 2 实际是 Imagen 4 与 Gemini 2.5 Flash 的深度融合体

其图像生成核心沿用了 Imagen 4 的高保真扩散架构,但在语义理解、上下文推理和多轮修正能力上,完全依赖 Gemini 2.5 Flash 的语言-视觉联合推理引擎。这也解释了为何它能精准理解“把左边的咖啡杯换成星巴克的杯子,但不要改变阴影方向”这类复杂指令。

更值得关注的是,Google 已在内部启动代号为 Nano Banana Pro 的升级版本,据泄露的测试数据,其准确率是当前版本的 3 倍以上。在一项“图像拼图重建”测试中,Pro 版本能从 16 块随机打乱、部分缺失的碎片中,还原出原始图像的完整结构与风格,连被遮挡的背景纹理都推理得近乎完美——这一能力,此前仅在学术论文中出现过。

即将全平台落地:不只是一个图像生成器

Google 并不打算让 Nano Banana 2 只作为独立工具存在。根据内部路线图,它将:

  • 集成进 Photoshop AI(预计 2025 年底上线)
  • 成为 Google Search 的“图像生成”新入口(搜索“一张夕阳下的东京街景”即可直接生成)
  • 接入 YouTube Studio,支持 AI 自动生成视频封面与转场素材
  • Whisk Labs 合作,为广告主提供“一键生成电商产品图”服务

目前,Google 已在 Gemini App 界面悄悄上线了“即将上线”倒计时卡片,时间指向 2025 年 11 月 18 日。与此同时,部分海外开发者已收到邀请,可提前在 Google Cloud AI Studio 中申请测试权限。

用户最关心的三个问题,官方回应抢先剧透

  1. 是否收费? —— 免费版将保留基础功能(1K 分辨率,每日 10 次生成),Pro 版将通过 Google One 会员制开放(预计 $9.99/月)。
  2. 能生成真人照片吗? —— 根据 Google 最新政策,系统将自动屏蔽生成真实人物肖像,但允许生成“风格化人像”(如“一位穿着复古风衣的亚洲女性,背景为 1980 年代香港”)。
  3. 会不会取代设计师? —— Google 设计主管在内部会议中明确表示:“我们不是要取代创意,而是让创意不再被技术拖后腿。”

随着发布日期临近,全球创意圈已开始热议:这是否是 AI 图像生成领域的“iPhone 时刻”?无论答案如何,有一点已成共识——当 AI 开始学会“自我批评”,它就不再只是工具,而成了真正的创作伙伴。