OpenAI更新ChatGPT图像生成功能，生成速度提升四倍

OpenAI于周二（12月16日）更新了ChatGPT图像生成功能，新一代GPT Image 1.5能更稳定地遵循用户指令，图像生成速度是上一代GPT Image 1.0的四倍。目前该模型已整合至所有用户可用的ChatGPT中，并同步推出GPT Image 1.5 API，供开发者与企业接入使用。

根据OpenAI说明，GPT Image 1.5在图像生成与编辑的准确性上均有显著提升。用户不仅可从零开始生成图片，还能对已有照片进行编辑，模型在多次修改过程中，仍能保持光线、构图与人物外观等关键元素的一致性，有效减少反复调整导致的画质损耗。

此次更新的一大亮点，是ChatGPT内新增了专属的图像创作空间，提供默认风格、滤镜与提示模板，让图像探索与创作流程更贴近实际创意工作室的使用场景。

在技术能力上，GPT Image 1.5对指令的执行精度明显提升。当用户要求编辑图片时，模型能更精准地仅修改指定区域，其余内容完整保留，使照片修图、服装与发型试穿、风格转换等应用更加自然。此外，新模型还支持新增、移除、混合与变换等高级编辑操作，同时兼顾原始图像质量。

文字呈现能力也是此次升级的重点之一。OpenAI表示，GPT Image 1.5在处理密集或小尺寸文字时更为稳定，能更自然地将文字融入图像中，有助于信息图表、海报与品牌视觉素材的制作。

在API端，GPT Image 1.5同样提供上述改进，且图像输入与输出成本较前一代降低约20%。OpenAI指出，这使得该模型特别适用于营销设计、品牌视觉、标志制作，以及从单一源图生成多样化电商产品图库等场景。

OpenAI产品负责人Fidji Simo表示，人类的思维往往以图像、声音、动作与模式呈现，而不仅仅是文字。如果AI要真正释放人类潜能，就必须采用更贴近人类自然认知方式的交互界面。ChatGPT正从文字工具转向直觉型任务界面。

CB科技站