最新消息:关注人工智能 AI赋能新媒体运营

OpenAI发布生命科学语言模型GPT-Rosalind,进军药物研发

科技资讯 admin 浏览

OpenAI上周发布了专为生命科学产业训练的语言模型版本GPT-Rosalind,旨在加速药物研发与医学疗法的进展。

GPT-Rosalind是支持生物学、药物发现与转化医学研究的先进推理模型系列。传统上,药物研发从靶点发现到获得监管批准需耗时10至15年,缩短早期研究阶段的时间,有助于靶标筛选、提升生物假设质量与实验设计水平。然而,前端研究流程复杂且耗时,研究人员需处理海量文献、专业数据库、实验数据及不断变化的假设,以生成和评估科学构想。与许多其他AI模型一样,GPT-Rosalind的目标是加速生物科学研究进程。

该模型名称源于推动DNA结构发现的英国化学家罗莎琳德·富兰克林。GPT-Rosalind基于GPT架构,融合化学、蛋白质工程与基因组学知识,并具备调用相关工具的能力,全面优化生命科学研究流程。

目前,OpenAI已向药企与研究机构如安进(Amgen)、莫德纳(Moderna)、艾伦研究所(Allen Institute)、赛默飞世尔科技(Thermo Fisher Scientific)等提供GPT-Rosalind用于研究与开发。在与这些客户的评估中,GPT-Rosalind在化学、生物学子领域(如化学反应机制、蛋白质结构、突变效应与相互作用、DNA序列亲缘关系解析)及实验设计分析等核心推理任务中的表现优于GPT-5、5.2、5.4。同时,GPT-Rosalind在多步骤研究流程中,包括文献综述、实验结果解读、蛋白质功能识别、外部信息整合与后续实验设计等方面,均能有效调用科学工具与数据库支持推理。

该公司引用生物信息学与数据分析基准测试BixBench的结果显示,GPT-Rosalind的表现超越Gemini 3.1 Pro、Grok 4.2以及GPT-5、5.2、5.4。在科学研究基准测试LABBench2上,GPT-Rosalind在六项任务中均优于GPT-5.4,尤其在DNA与酶试剂设计测试CloningQA中进步显著。在与Dyno Therapeutics合作的RNA序列预测与生成测试中,该模型在预测任务上超越95%的人类专家,在序列生成任务上达到人类专家的第84百分位。

目前,GPT-Rosalind以研究预览版形式,通过ChatGPT、Codex和API向获得可信访问权限的机构开放。OpenAI还提供免费的Codex生命科学插件,使科研人员能够将GPT模型连接至50多个科学工具与数据源。

OpenAI表示,GPT-Rosalind是其生命科学模型系列的首个模型。未来,公司将持续提升模型的生物学推理能力,增强对高复杂度工具使用与长周期研究流程的支持,并与顶尖科研机构合作评估实际效果,例如与洛斯阿拉莫斯国家实验室(Los Alamos National Laboratory)合作开展AI驱动的蛋白质与催化剂设计研究。