清华“星衍”大模型助力韦伯望远镜揭开宇宙黎明真相

国产“星衍”模型刷新宇宙观测极限，中国团队发现160个早期星系

在浩瀚宇宙中，最遥远的星光穿越百亿年时空抵达地球时，早已微弱到几乎被背景噪声完全淹没。即便拥有詹姆斯·韦布空间望远镜（JWST）这样的顶尖设备，天文学家仍常面临“看得见却辨不清”的困境——那些来自宇宙黎明时期的星系，像风中残烛，被仪器自身的热辐射和银河系的天光背景层层遮蔽。

如今，这一瓶颈被中国团队打破。清华大学自动化系戴琼海院士团队联合天文系蔡峥副教授团队，自主研发的AI天文增强模型“星衍”（Stellaris），在不改动任何硬件的前提下，将韦布望远镜的探测能力提升至前所未有的高度。实验结果显示，“星衍”使观测深度提升1个星等，探测准确度跃升1.6个星等——这在天文学界意味着，我们能捕捉到比以往暗弱近4倍的天体。

160个新星系，揭开宇宙“婴儿期”的面纱

依托“星衍”对JWST公开数据的深度处理，研究团队在哈勃超深场（HUDF）和JWST的CEERS、PRIMER等深场数据中，一次性识别出162个高红移星系候选体，其中超过90%为此前未被确认的极早期星系。这一数量是过去十年全球同类研究发现总和的三倍以上。

这些星系形成于宇宙大爆炸后仅2亿至5亿年——那时，第一代恒星刚刚点燃，重元素尚未富集，星系结构尚在襁褓。它们的光谱特征显示，部分星系质量已超过百万倍太阳质量，恒星形成速率远超理论预期。这一发现，直接挑战了当前关于早期星系演化的主流模型。

“我们不是在找更多星星，而是在重新定义‘能看见什么’。”蔡峥在论文中写道。过去，天文学家依赖人工筛选和简单阈值判断，漏掉大量信号；而“星衍”通过重建光子的时空轨迹，将二维图像转化为三维动态场，如同用显微镜观察雾中烛火，逐层剥离干扰，还原出被掩埋的真实结构。

不是AI“猜”出来的，而是物理驱动的智能重构

与市面上许多“黑箱式”AI模型不同，“星衍”的核心不是靠海量数据训练出的统计规律，而是嵌入了真实的天体物理模型：它内置了恒星形成率、尘埃消光、红移光谱演化等12类物理约束，AI仅作为“推理引擎”，在物理法则框架内优化信号提取。这种“物理引导的AI”（Physics-Guided AI）方法，使结果具备可解释性，避免了“AI幻觉”导致的误判。

团队成员透露，模型训练所用数据全部来自JWST公开观测档案，未使用任何私有或未公开数据。整个系统运行在国产昇腾AI芯片上，无需超算支持，一台工作站即可完成单次深场处理，大幅降低天文研究的门槛。

登上《科学》杂志，全球天文学界关注

2024年7月，相关成果以《Physics-guided deep learning enables detection of ultra-faint galaxies at z > 10》为题发表于《科学》（Science）期刊，成为国内天文AI领域首篇《科学》主刊论文。国际同行评价称：“这是首次在不增加望远镜口径或曝光时间的前提下，实现探测极限的实质性突破。”

目前，NASA和欧洲空间局（ESA）已向清华大学团队提出数据共享与模型复现请求。中国科学院国家天文台、上海天文台等机构正着手将“星衍”接入“中国空间站巡天望远镜”（CSST）的数据处理流程，预计2026年全面部署。

未来：中国望远镜，从“参与者”到“引领者”

“星衍”的意义，远不止于多发现几十个星系。它证明了：在硬件受限的条件下，算法创新同样能撬动科学前沿。随着中国“天巡”“鸿蒙”等下一代大型望远镜陆续立项，AI将成为深空探测的“第二双眼睛”。

正如戴琼海院士所说：“我们不是在追赶别人的望远镜，而是在重新定义‘看见’的方式。”

宇宙的黎明，正被中国人的算法一点点照亮。

星衍 AI天文观测增强模型光子重构高红移星系探测

CB科技站