
OpenAI
Meta周三发布最新版大语言模型Llama 3.1,来势汹汹,OpenAI则在宣布最新小模型GPT-4o mini不到一周后,再公布微调工具,提供免费使用特定用量2个月。
微调工具已可由API使用,一开始提供给tier 4和tier 5的用户。OpenAI计画会逐步推展到所有收费等级的用户。从即日起到9月23日间,每日头200万字符(token)可免费使用。
可提供微调的模型包括部分已上线或实验中的GPT-4和gpt-4o-mini。全部清单包括gpt-3.5-turbo-0125、gpt-3.5-turbo-1106、gpt-3.5-turbo-0613、babbage-002、davinci-002、gpt-4-0613(实验中)和gpt-4o-2024-05-13,及gpt-4o-mini-2024-07-18(建议)。OpenAI相信以效能和易用性来说,gpt-4o-mini对大部分用户而言是最适合的模型。
图片来源/OpenAI
而微调收费方式也依使用的模型而异。若使用GPT-4o mini(2024-07-18),从提示输入的费用为每输入100万字符为0.3美元,每输出100万字符则为1.2美元。若从Batch API输入,则分别为0.15美元和0.6美元。
OpenAI指出,使用API微调模型,可允许用户输入更多的训练範例,可提升GPT-4o mini模型生成结果的品质,而且由于用户不需使用那么长的提示,将能节省字符(及成本),延迟性也更低。OpenAI补充,微调工具可提升「few-shot learning」的效果。
所谓「few-shot learning」,是指利用範例告诉模型要如何执行任务。OpenAI说其文字生成模型原本已经在大量文字上预训练,但为了让模型更好用,他们又在提示中加入指令,偶尔也有一些範例,已经使用「few-shot learning」手法,今日启用的微调功能,允许用户提供大于提示的範例,因而提升了这类学习方法的效果。
GPT-4o-mini上周公布后,ChatGPT免费版、Plus、Team方案用户已经可存取GPT-4o mini,取代GPT-3.5。下周Enterprise方案用户也可开始存取。GPT-4o mini具备128K字符的context window,一次呼叫支援最多16K输出字符,训练资料集已更新到2023年10月。OpenAI宣称GPT-4o mini理解能力超越Claude Haiku、Gemini Flash,它最终会和GPT-4o一样具备多模能力,支援文字、图片、影音输入/输出功能,目前GPT-4o mini仅在API支援文字和视觉。