OpenAI公布GPT-4o mini微调工具对抗最新Meta Llama 3模型，免费使用2个月

图片来源:

OpenAI

Meta周三发布最新版大语言模型Llama 3.1，来势汹汹，OpenAI则在宣布最新小模型GPT-4o mini不到一周后，再公布微调工具，提供免费使用特定用量2个月。

微调工具已可由API使用，一开始提供给tier 4和tier 5的用户。OpenAI计画会逐步推展到所有收费等级的用户。从即日起到9月23日间，每日头200万字符（token）可免费使用。

可提供微调的模型包括部分已上线或实验中的GPT-4和gpt-4o-mini。全部清单包括gpt-3.5-turbo-0125、gpt-3.5-turbo-1106、gpt-3.5-turbo-0613、babbage-002、davinci-002、gpt-4-0613（实验中）和gpt-4o-2024-05-13，及gpt-4o-mini-2024-07-18（建议）。OpenAI相信以效能和易用性来说，gpt-4o-mini对大部分用户而言是最适合的模型。

图片来源／OpenAI

而微调收费方式也依使用的模型而异。若使用GPT-4o mini（2024-07-18），从提示输入的费用为每输入100万字符为0.3美元，每输出100万字符则为1.2美元。若从Batch API输入，则分别为0.15美元和0.6美元。

OpenAI指出，使用API微调模型，可允许用户输入更多的训练範例，可提升GPT-4o mini模型生成结果的品质，而且由于用户不需使用那么长的提示，将能节省字符（及成本），延迟性也更低。OpenAI补充，微调工具可提升「few-shot learning」的效果。

所谓「few-shot learning」，是指利用範例告诉模型要如何执行任务。OpenAI说其文字生成模型原本已经在大量文字上预训练，但为了让模型更好用，他们又在提示中加入指令，偶尔也有一些範例，已经使用「few-shot learning」手法，今日启用的微调功能，允许用户提供大于提示的範例，因而提升了这类学习方法的效果。

GPT-4o-mini上周公布后，ChatGPT免费版、Plus、Team方案用户已经可存取GPT-4o mini，取代GPT-3.5。下周Enterprise方案用户也可开始存取。GPT-4o mini具备128K字符的context window，一次呼叫支援最多16K输出字符，训练资料集已更新到2023年10月。OpenAI宣称GPT-4o mini理解能力超越Claude Haiku、Gemini Flash，它最终会和GPT-4o一样具备多模能力，支援文字、图片、影音输入／输出功能，目前GPT-4o mini仅在API支援文字和视觉。

CB科技站

OpenAI公布GPT-4o mini微调工具对抗最新Meta Llama 3模型，免费使用2个月

与本文相关的文章