通义实验室联合开源LOGOS，1B参数超NatureLM

通义实验室开源多领域科学生成模型LOGOS

2026年6月18日，通义实验室宣布开源多领域科学生成基础模型LOGOS。该模型由ATH-Token Foundry与中国人民大学高瓴人工智能学院联合研发，目标是用一套统一的框架处理蛋白质、小分子、材料和化学反应等不同科学对象，改变过去AI for Science领域“一任务一专家模型”的割裂局面。

LOGOS的核心设计是一套“科学语法”。研发团队将各类异构科学对象编码为统一的离散Token序列，让模型在原生大模型框架下完成自回归生成。借助空间交互离散化技术，模型不需要依赖稀缺的3D坐标数据，也无需专门的几何网络。它仅通过序列预测就能理解复杂的3D空间互作规律。预训练阶段与下游任务在形式和目标上保持完全一致。

在性能测试中，参数量仅为1B的LOGOS-1B覆盖了六项代表性任务。在口袋条件配体生成、逆合成预测、口袋位点识别以及MOF材料生成等场景中，模型表现均匹配或超过了领域专用方法。具体数据显示，其逆合成预测Top-1准确率达到74.8%，HOLO4K数据集口袋位点识别Top-n准确率为58.5%，MOF材料生成的新型构建单元比例提升了76%。对比来看，该模型以1/56的参数量，在多项任务上超过了8×7B规模的NatureLM。

工程部署方面，LOGOS继承了大语言模型的预训练权重。这意味着它可以直接接入vLLM推理加速和模型量化等现有基建。研究团队指出，这套框架打破了学科壁垒，推动自然科学研究从“筛选已知”向“设计驱动”转变。目前，模型权重、推理代码及技术报告已面向全球开源。

CB科技站

通义实验室联合开源LOGOS，1B参数超NatureLM

通义实验室开源多领域科学生成模型LOGOS

与本文相关的文章