最新消息:关注人工智能 AI赋能新媒体运营

通义实验室联合开源LOGOS,1B参数超NatureLM

科技资讯 admin 浏览

通义实验室开源多领域科学生成模型LOGOS

2026年6月18日,通义实验室宣布开源多领域科学生成基础模型LOGOS。该模型由ATH-Token Foundry与中国人民大学高瓴人工智能学院联合研发,目标是用一套统一的框架处理蛋白质、小分子、材料和化学反应等不同科学对象,改变过去AI for Science领域“一任务一专家模型”的割裂局面。

LOGOS的核心设计是一套“科学语法”。研发团队将各类异构科学对象编码为统一的离散Token序列,让模型在原生大模型框架下完成自回归生成。借助空间交互离散化技术,模型不需要依赖稀缺的3D坐标数据,也无需专门的几何网络。它仅通过序列预测就能理解复杂的3D空间互作规律。预训练阶段与下游任务在形式和目标上保持完全一致。

LOGOS模型架构示意图

在性能测试中,参数量仅为1B的LOGOS-1B覆盖了六项代表性任务。在口袋条件配体生成、逆合成预测、口袋位点识别以及MOF材料生成等场景中,模型表现均匹配或超过了领域专用方法。具体数据显示,其逆合成预测Top-1准确率达到74.8%,HOLO4K数据集口袋位点识别Top-n准确率为58.5%,MOF材料生成的新型构建单元比例提升了76%。对比来看,该模型以1/56的参数量,在多项任务上超过了8×7B规模的NatureLM。

LOGOS模型性能评测对比图

工程部署方面,LOGOS继承了大语言模型的预训练权重。这意味着它可以直接接入vLLM推理加速和模型量化等现有基建。研究团队指出,这套框架打破了学科壁垒,推动自然科学研究从“筛选已知”向“设计驱动”转变。目前,模型权重、推理代码及技术报告已面向全球开源。