OpenAI发布生命科学语言模型GPT-Rosalind，进军药物研发

OpenAI上周发布了专为生命科学产业训练的语言模型版本GPT-Rosalind，旨在加速药物研发与医学疗法的进展。

GPT-Rosalind是支持生物学、药物发现与转化医学研究的先进推理模型系列。传统上，药物研发从靶点发现到获得监管批准需耗时10至15年，缩短早期研究阶段的时间，有助于靶标筛选、提升生物假设质量与实验设计水平。然而，前端研究流程复杂且耗时，研究人员需处理海量文献、专业数据库、实验数据及不断变化的假设，以生成和评估科学构想。与许多其他AI模型一样，GPT-Rosalind的目标是加速生物科学研究进程。

该模型名称源于推动DNA结构发现的英国化学家罗莎琳德·富兰克林。GPT-Rosalind基于GPT架构，融合化学、蛋白质工程与基因组学知识，并具备调用相关工具的能力，全面优化生命科学研究流程。

目前，OpenAI已向药企与研究机构如安进（Amgen）、莫德纳（Moderna）、艾伦研究所（Allen Institute）、赛默飞世尔科技（Thermo Fisher Scientific）等提供GPT-Rosalind用于研究与开发。在与这些客户的评估中，GPT-Rosalind在化学、生物学子领域（如化学反应机制、蛋白质结构、突变效应与相互作用、DNA序列亲缘关系解析）及实验设计分析等核心推理任务中的表现优于GPT-5、5.2、5.4。同时，GPT-Rosalind在多步骤研究流程中，包括文献综述、实验结果解读、蛋白质功能识别、外部信息整合与后续实验设计等方面，均能有效调用科学工具与数据库支持推理。

该公司引用生物信息学与数据分析基准测试BixBench的结果显示，GPT-Rosalind的表现超越Gemini 3.1 Pro、Grok 4.2以及GPT-5、5.2、5.4。在科学研究基准测试LABBench2上，GPT-Rosalind在六项任务中均优于GPT-5.4，尤其在DNA与酶试剂设计测试CloningQA中进步显著。在与Dyno Therapeutics合作的RNA序列预测与生成测试中，该模型在预测任务上超越95%的人类专家，在序列生成任务上达到人类专家的第84百分位。

目前，GPT-Rosalind以研究预览版形式，通过ChatGPT、Codex和API向获得可信访问权限的机构开放。OpenAI还提供免费的Codex生命科学插件，使科研人员能够将GPT模型连接至50多个科学工具与数据源。

OpenAI表示，GPT-Rosalind是其生命科学模型系列的首个模型。未来，公司将持续提升模型的生物学推理能力，增强对高复杂度工具使用与长周期研究流程的支持，并与顶尖科研机构合作评估实际效果，例如与洛斯阿拉莫斯国家实验室（Los Alamos National Laboratory）合作开展AI驱动的蛋白质与催化剂设计研究。

OpenAI GPT-Rosalind 药物开发生命科学语言模型

CB科技站

OpenAI发布生命科学语言模型GPT-Rosalind，进军药物研发

与本文相关的文章