6年后 OpenAI再释出开放权重的语言模型

图片来源:

GitHub

在公众期待下，在GPT-2推出6年后，OpenAI昨（5）日宣布释出2款开放权重的模型gpt-oss系列，目前仅支援文字，但具备高效能及推理能力。

最新释出的模型包含gpt-oss-120b及gpt-oss-20b。gpt-oss-120b号称是该公司最强大的开放权重模型，适合单一H100 GPU平台。gpt-oss-20b则为中等规模的开放模型，适合低延迟性应用。二者都是以宽鬆Apache 2.0授权开放，允许使用者自由开放，适合实验、客製或商用部署。

功能面而言，目前gpt-oss-120b和gpt-oss-20b都仅支援文字输出输入（尚不支援影音）和基础的回应，但是效能强大：提供131,072 context window，最大输出131,072 token，也双双使用完整思维链可提升除错和输出品质，并且都具备代理人能力，支援函式呼叫、上网、Python程序码执行及结构化输出。此外，两模型都允许依据应用场景和延迟性需求，调整推理能力强度、或微调参数。

OpenAI也提供二个模型和旗舰模型OpenAI o3和o4-mini的比较。作为免费模型，gpt-oss-120b在推理与知识、数学紧追封闭模型，甚至在标竿测试AIME 2024中还超越o3及o4-mini。

这是继2019年的GPT-2、2021的CLIP和2022年的Whisper开放计画之后，再度释出开放权重的重要模型。今年初中国DeepSeek引发关注，掀起美国业界讨论必须以开放模式加速AI普及，使OpenAI备受开放模型的压力。今年3月执行长Sam Altman承诺会释出开放权重模型。

透过最新公布，OpenAI说开放模型允许政府或讲求资料安全的组织自建模型及AI应用，该公司也计画把二个模型整合到今年5月宣布的OpenAI for Countries（国家合作计画），协助各国政府（第一个是美国）打造AI资料中心并确保资料主权。

CB科技站

6年后 OpenAI再释出开放权重的语言模型

与本文相关的文章