
OpenAI周一(4/14)释出了GPT-4.1、GPT-4.1 mini与GPT-4.1 nano,宣称它们的性能全面胜过现有的GPT-4o及GPT-4o mini,所支援的脉络长达100万个Token,知识截止时间为2024年6月。不过,GPT-4.1将仅透过API供应,ChatGPT则由持续改善的GPT-4o负责,至于原本规画中的GPT-4.5,现在OpenAI则说它只是个预览版,GPT-4.1拥有许多类似或超越的表现,因此準备在今年的7月14日关闭GPT-4.5。
GPT-4.1、GPT-4.1 mini与GPT-4.1 nano等3个不同等级的型号,都支援100万Token的脉络长度,其中的GPT-4.1能力最强,适合複杂任务,每输入/输出百万个Token的售价各为2美元及8美元,适用于企业级代理人、高精度AI助理,以及科学研究;GPT-4.1 mini属于中阶模型,每输入/输出百万个Token的售价各为0.4及1.6美元,适用于中大型应用、快速建置原型及自动客服系统等;GPT-4.1 nano每输入/输出百万个Token的售价各为0.1与0.4美元,适合逻辑明确及结构化的简单任务,像是分类或摘要等,可应用于手机或边缘运算,执行速度也最快。
OpenAI比较了GPT-4o、GPT-4.5、GPT-4.1在许多基準测试上的表现,例如GPT-4.1在用来修复开放原始码臭虫的SWE-bench Verified测试中,取得了54.6%的成绩,分别比GPT-4o及GPT-4.5高了21.4个百分点与26.6个百分点。或者是在评估指令遵循能力的Scale"s MultiChallenge?评测上,GPT-4.1也有38.3%的成绩,比GPT-4o多了10.5个百分点。在理解影片的Video-MME?测试中,GPT-4.1在长篇且无字幕的类别中取得了72%的成绩,比GPT-4o多出6.7个百分点。
此外,GPT-4.1及GPT-4.1 mini的延迟度,也低于GPT-4o与GPT-4o mini。
GPT-4.1可处理多达100万个Token的脉络,远高于GPT-4o的12.8万个,OpenAI认为这使得GPT-4.1非常适合处理大型的程序码库或者是大量的长文件。
至于原本準备上架,却突然宣布腰斩的GPT-4.5,OpenAI则解释,GPT-4.5是个研究预览版本,目的是为了探索与试验一个大型且运算密集的模型,已从开发人员的回馈中学到许多,準备在未来的模型中嵌入GPT-4.5各种受到讚赏的特质,例如创造力、写作品质与幽默感等。