国产“星衍”模型刷新宇宙观测极限,中国团队发现160个早期星系
在浩瀚宇宙中,最遥远的星光穿越百亿年时空抵达地球时,早已微弱到几乎被背景噪声完全淹没。即便拥有詹姆斯·韦布空间望远镜(JWST)这样的顶尖设备,天文学家仍常面临“看得见却辨不清”的困境——那些来自宇宙黎明时期的星系,像风中残烛,被仪器自身的热辐射和银河系的天光背景层层遮蔽。
如今,这一瓶颈被中国团队打破。清华大学自动化系戴琼海院士团队联合天文系蔡峥副教授团队,自主研发的AI天文增强模型“星衍”(Stellaris),在不改动任何硬件的前提下,将韦布望远镜的探测能力提升至前所未有的高度。实验结果显示,“星衍”使观测深度提升1个星等,探测准确度跃升1.6个星等——这在天文学界意味着,我们能捕捉到比以往暗弱近4倍的天体。
160个新星系,揭开宇宙“婴儿期”的面纱
依托“星衍”对JWST公开数据的深度处理,研究团队在哈勃超深场(HUDF)和JWST的CEERS、PRIMER等深场数据中,一次性识别出162个高红移星系候选体,其中超过90%为此前未被确认的极早期星系。这一数量是过去十年全球同类研究发现总和的三倍以上。
这些星系形成于宇宙大爆炸后仅2亿至5亿年——那时,第一代恒星刚刚点燃,重元素尚未富集,星系结构尚在襁褓。它们的光谱特征显示,部分星系质量已超过百万倍太阳质量,恒星形成速率远超理论预期。这一发现,直接挑战了当前关于早期星系演化的主流模型。
“我们不是在找更多星星,而是在重新定义‘能看见什么’。”蔡峥在论文中写道。过去,天文学家依赖人工筛选和简单阈值判断,漏掉大量信号;而“星衍”通过重建光子的时空轨迹,将二维图像转化为三维动态场,如同用显微镜观察雾中烛火,逐层剥离干扰,还原出被掩埋的真实结构。
不是AI“猜”出来的,而是物理驱动的智能重构
与市面上许多“黑箱式”AI模型不同,“星衍”的核心不是靠海量数据训练出的统计规律,而是嵌入了真实的天体物理模型:它内置了恒星形成率、尘埃消光、红移光谱演化等12类物理约束,AI仅作为“推理引擎”,在物理法则框架内优化信号提取。这种“物理引导的AI”(Physics-Guided AI)方法,使结果具备可解释性,避免了“AI幻觉”导致的误判。
团队成员透露,模型训练所用数据全部来自JWST公开观测档案,未使用任何私有或未公开数据。整个系统运行在国产昇腾AI芯片上,无需超算支持,一台工作站即可完成单次深场处理,大幅降低天文研究的门槛。
登上《科学》杂志,全球天文学界关注
2024年7月,相关成果以《Physics-guided deep learning enables detection of ultra-faint galaxies at z > 10》为题发表于《科学》(Science)期刊,成为国内天文AI领域首篇《科学》主刊论文。国际同行评价称:“这是首次在不增加望远镜口径或曝光时间的前提下,实现探测极限的实质性突破。”
目前,NASA和欧洲空间局(ESA)已向清华大学团队提出数据共享与模型复现请求。中国科学院国家天文台、上海天文台等机构正着手将“星衍”接入“中国空间站巡天望远镜”(CSST)的数据处理流程,预计2026年全面部署。
未来:中国望远镜,从“参与者”到“引领者”
“星衍”的意义,远不止于多发现几十个星系。它证明了:在硬件受限的条件下,算法创新同样能撬动科学前沿。随着中国“天巡”“鸿蒙”等下一代大型望远镜陆续立项,AI将成为深空探测的“第二双眼睛”。
正如戴琼海院士所说:“我们不是在追赶别人的望远镜,而是在重新定义‘看见’的方式。”
宇宙的黎明,正被中国人的算法一点点照亮。