最新消息:关注人工智能 AI赋能新媒体运营

6年后 OpenAI再释出开放权重的语言模型

科技智能 admin 浏览 评论
图片来源:

GitHub

在公众期待下,在GPT-2推出6年后,OpenAI昨(5)日宣布释出2款开放权重的模型gpt-oss系列,目前仅支援文字,但具备高效能及推理能力。

最新释出的模型包含gpt-oss-120b及gpt-oss-20b。gpt-oss-120b号称是该公司最强大的开放权重模型,适合单一H100 GPU平台。gpt-oss-20b则为中等规模的开放模型,适合低延迟性应用。二者都是以宽鬆Apache 2.0授权开放,允许使用者自由开放,适合实验、客製或商用部署。

功能面而言,目前gpt-oss-120b和gpt-oss-20b都仅支援文字输出输入(尚不支援影音)和基础的回应,但是效能强大:提供131,072 context window,最大输出131,072 token,也双双使用完整思维链可提升除错和输出品质,并且都具备代理人能力,支援函式呼叫、上网、Python程序码执行及结构化输出。此外,两模型都允许依据应用场景和延迟性需求,调整推理能力强度、或微调参数。

OpenAI也提供二个模型和旗舰模型OpenAI o3和o4-mini的比较。作为免费模型,gpt-oss-120b在推理与知识、数学紧追封闭模型,甚至在标竿测试AIME 2024中还超越o3及o4-mini。

这是继2019年的GPT-2、2021的CLIP和2022年的Whisper开放计画之后,再度释出开放权重的重要模型。今年初中国DeepSeek引发关注,掀起美国业界讨论必须以开放模式加速AI普及,使OpenAI备受开放模型的压力。今年3月执行长Sam Altman承诺会释出开放权重模型。

透过最新公布,OpenAI说开放模型允许政府或讲求资料安全的组织自建模型及AI应用,该公司也计画把二个模型整合到今年5月宣布的OpenAI for Countries(国家合作计画),协助各国政府(第一个是美国)打造AI资料中心并确保资料主权。

发表我的评论
取消评论

表情

您的回复是我们的动力!

  • 昵称 (必填)
  • 验证码 点击我更换图片

网友最新评论