最新消息:关注人工智能 AI赋能新媒体运营

上海AI实验室开源全球最大科学多模态模型Intern-S1-Pro,参数达万亿级

科技资讯 admin 浏览

万亿参数,开源界的新标杆

上海人工智能实验室正式发布 Intern-S1-Pro——全球开源领域参数规模最大的科学多模态大模型,总参数量达1万亿。这不是又一次“参数竞赛”,而是一次真正为科研场景打造的系统性突破。它不再只是能回答问题的聊天机器人,而是能读懂实验数据、推演物理公式、理解显微图像与天文信号的“数字科研助手”。

目前,Intern-S1-Pro 已在 GitHub、Hugging Face 全面开源,任何人都可以免费下载、部署、修改。没有隐藏条款,没有API调用限制,连训练权重和推理代码都一并开放。这种开放程度,在千亿级模型中前所未有。

image.png

它不是“会算题”,而是“懂科研”

在国际权威的AI4S(AI for Science)评测中,Intern-S1-Pro 在数学推理、物理建模、化学反应预测等任务上,表现超越了此前所有开源模型。它的数学推理能力,已达到国际中学生物理奥林匹克竞赛金牌选手的水平——不是靠记忆公式,而是能从第一性原理出发,一步步推导出答案。

更关键的是,它能理解真实科研流程。比如,当你上传一张电子显微镜图像,它不仅能识别结构,还能结合材料热力学模型,推测其在不同温度下的稳定性变化;当你输入一段实验记录,它能自动指出数据异常点,甚至建议下一步的对照实验方案。这不是幻觉,而是经过大量真实科研文献和实验数据训练的结果。

怎么做到万亿参数,还能跑得动?

1万亿参数听起来吓人,但Intern-S1-Pro 的设计很“聪明”:它采用混合专家架构(MoE),每次推理只激活约220亿参数,相当于在百亿规模模型上运行,却拥有万亿级的知识容量。这意味着,即使你用一张A100显卡,也能流畅运行推理任务,无需昂贵的集群支持。

为了实现这一点,团队重构了模型的时序编码方式,引入傅里叶位置编码,让模型能更稳定地理解从飞秒级分子振动到千万年宇宙演化的时间尺度。同时,整个训练过程基于国产算力平台完成,从芯片到框架,实现了端到端的自主可控——这在大模型领域,是罕见的“全栈自研”案例。

谁在用?能干点啥?

目前,已有多个国内高校和科研机构在测试Intern-S1-Pro。一位材料学博士用它分析XRD衍射图谱,原本需要三天的手动比对,现在十分钟内就能生成结构匹配报告;一位天体物理研究生用它处理望远镜数据流,模型自动标记出三个此前被忽略的引力透镜候选体。

它不是万能的,但它是第一个真正“懂科研语言”的开源模型。你可以用它:

  • 解析论文中的公式推导,还原推导过程
  • 根据实验数据,生成可验证的假设
  • 对比不同文献中的实验条件,找出矛盾点
  • 为你的实验设计提供统计学建议

它不替你思考,但它能帮你把模糊的想法,变成可执行的科学问题。

现在就能试

你不需要申请权限,也不用等内测资格。直接打开在线体验:

https://chat.intern-ai.org.cn/

想本地部署?代码和模型权重已全部开放:

GitHub 仓库

Hugging Face 模型页

这不是一场发布会,而是一次开源行动。我们不需要更多的“AI神话”,我们需要的是能真正帮科研人员省时间、避弯路的工具。Intern-S1-Pro,是这个方向上,迈出的第一步坚实脚印。