
科学家开发可预测千种疾病的AI模型Delphi-2M
欧洲分子生物实验室(European Molecular Biology Laboratory,EMBL)、德国癌症研究中心(German Cancer Research Centre,DKFZ)以及哥本哈根大学(University of Copenhagen)的科学家们本周发表了一个可预测未来疾病的Delphi-2M模型。该模型可根据人类的病史以及生活习惯,预测未来10年或20年罹患逾1000种疾病的可能性,相关研究已登上《自然》(Nature)期刊。
Delphi-2M采用类似大语言模型(LLM)的算法概念,利用英国生物样本库(UK Biobank)中40万名参与者的资料进行训练,使其能够根据个人过往的病史,结合年龄、性别、BMI以及吸烟与饮酒等习惯,一次性预测罹患1258种疾病的风险,例如是否或何时会患上癌症、糖尿病、心脏病、呼吸系统疾病等。它的输出形式类似于天气预报——天气预报系统说“这个周末有70%的概率下雨”,而Delphi-2M则会提示“在未来某一年有70%的概率罹患某种疾病”。
德国癌症研究中心科学家Moritz Gerstung表示,过去医务人员需要运行数十个模型才能完成全面评估,但Delphi-2M可以一次性完成全部预测。
此外,对于大多数疾病,Delphi-2M的预测准确度与当前用于评估单一疾病发病风险的模型相当,甚至更高;而且其表现也优于使用生物标志物(如体内特定分子或化合物浓度)来预测多种疾病风险的机器学习算法。Gerstung称,它的效果好得惊人。
研究人员还利用丹麦全国患者登记系统中的190万条数据验证了Delphi-2M的有效性。尽管在该数据集上的表现略低于在UK Biobank上的结果,但仍保持较高准确性,表明该模型具备良好的泛化能力,可适应不同国家的医疗数据体系。
科学家希望未来能将更多国家的电子病历数据纳入训练,并整合更丰富的个人生活与行为信息,以进一步优化模型性能。长远目标是将其嵌入临床决策支持系统,使医生在接诊时能实时获取患者的长期健康风险预测结果。