ChatGPT升级到GPT-4o

在Google发表可以流畅与用户对话的Gemini Live同一天，OpenAI也正式公告，ChatGPT升级使用多模态模型GPT-4o。

上周媒体就已发现OpenAI悄悄发布了新版GPT-4o模型的更新版本，强调整体效能更快，前端回应表现也更好。模型更新版本名为GPT-4o-2024-08-06，主要提供给付费用户，涵括以ChatGPT提示介面或API存取二种管道。有人觉得连免费的ChatGPT都更强大了。

多模态模型允许用户上传程序码、图片或声音档作为输入提示，ChatGPT也可以根据提示生成图片。ChatGPT本来就以DALL-E-3模型为基础生成图片。ChatGPT升级到GPT-4o的意义在于，由于模型原生支援多模态资料，理应可以更快输出回应，且生成品质也更好。

但由于OpenAI没有提供详细说明，因此新模型提供了什么改进或不同功能，或是ChatGPT免费版是否也使用新版本模型，都没有获得官方证实。有用户觉得ChatGPT理解能力更好了，不过也有用户认为虽然改用了新模型，但输入的图片品质似乎没什么不同。

目前可以确定的是，以提示介面和API存取的是不同版本GPT-4o。OpenAI对VentureBeat说明，提供给API存取的是更为开发人员优化的功能。例如在Azure平台提供的GPT-4o版本简化模型结构化输出（structured output）的过程，允许开发人员指明希望从AI模型直接输出的格式，产生的资料可无缝整合到其他系统，有助于提升开发生产力。

GPT-4o

CB科技站

ChatGPT升级到GPT-4o

与本文相关的文章