
在Google发表可以流畅与用户对话的Gemini Live同一天,OpenAI也正式公告,ChatGPT升级使用多模态模型GPT-4o。
上周媒体就已发现OpenAI悄悄发布了新版GPT-4o模型的更新版本,强调整体效能更快,前端回应表现也更好。模型更新版本名为GPT-4o-2024-08-06,主要提供给付费用户,涵括以ChatGPT提示介面或API存取二种管道。有人觉得连免费的ChatGPT都更强大了。
多模态模型允许用户上传程序码、图片或声音档作为输入提示,ChatGPT也可以根据提示生成图片。ChatGPT本来就以DALL-E-3模型为基础生成图片。ChatGPT升级到GPT-4o的意义在于,由于模型原生支援多模态资料,理应可以更快输出回应,且生成品质也更好。
但由于OpenAI没有提供详细说明,因此新模型提供了什么改进或不同功能,或是ChatGPT免费版是否也使用新版本模型,都没有获得官方证实。有用户觉得ChatGPT理解能力更好了,不过也有用户认为虽然改用了新模型,但输入的图片品质似乎没什么不同。
目前可以确定的是,以提示介面和API存取的是不同版本GPT-4o。OpenAI对VentureBeat说明,提供给API存取的是更为开发人员优化的功能。例如在Azure平台提供的GPT-4o版本简化模型结构化输出(structured output)的过程,允许开发人员指明希望从AI模型直接输出的格式,产生的资料可无缝整合到其他系统,有助于提升开发生产力。