OpenAI于周二(12月16日)更新了ChatGPT图像生成功能,新一代GPT Image 1.5能更稳定地遵循用户指令,图像生成速度是上一代GPT Image 1.0的四倍。目前该模型已整合至所有用户可用的ChatGPT中,并同步推出GPT Image 1.5 API,供开发者与企业接入使用。
根据OpenAI说明,GPT Image 1.5在图像生成与编辑的准确性上均有显著提升。用户不仅可从零开始生成图片,还能对已有照片进行编辑,模型在多次修改过程中,仍能保持光线、构图与人物外观等关键元素的一致性,有效减少反复调整导致的画质损耗。
此次更新的一大亮点,是ChatGPT内新增了专属的图像创作空间,提供默认风格、滤镜与提示模板,让图像探索与创作流程更贴近实际创意工作室的使用场景。
在技术能力上,GPT Image 1.5对指令的执行精度明显提升。当用户要求编辑图片时,模型能更精准地仅修改指定区域,其余内容完整保留,使照片修图、服装与发型试穿、风格转换等应用更加自然。此外,新模型还支持新增、移除、混合与变换等高级编辑操作,同时兼顾原始图像质量。
文字呈现能力也是此次升级的重点之一。OpenAI表示,GPT Image 1.5在处理密集或小尺寸文字时更为稳定,能更自然地将文字融入图像中,有助于信息图表、海报与品牌视觉素材的制作。
在API端,GPT Image 1.5同样提供上述改进,且图像输入与输出成本较前一代降低约20%。OpenAI指出,这使得该模型特别适用于营销设计、品牌视觉、标志制作,以及从单一源图生成多样化电商产品图库等场景。
OpenAI产品负责人Fidji Simo表示,人类的思维往往以图像、声音、动作与模式呈现,而不仅仅是文字。如果AI要真正释放人类潜能,就必须采用更贴近人类自然认知方式的交互界面。ChatGPT正从文字工具转向直觉型任务界面。