最新消息:关注人工智能 AI赋能新媒体运营

摩尔线程开源全链路自研代码大模型MusaCoder

科技资讯 admin 浏览

摩尔线程开源MusaCoder:基于国产GPU训练的代码生成模型

摩尔线程正式发布并开源MusaCoder。这是一个专门用于GPU底层算子生成的代码大模型,也是业内首个完全基于国产全功能GPU底座完成全流程训练与验证的开源代码模型。

该模型的完整后训练流程,均在基于MTT S5000 GPU搭建的“夸娥”智算集群上完成。这套流程验证了国产硬件能够承载复杂大模型的全链路开发任务,为行业提供了一条从底层硬件到上层模型训练的可参考路径。

在KernelBench评测中,MusaCoder-27B-RL版本的Overall Pass率达到93.2%,平均分88.60%。对比行业现有的主流代码模型,其成绩超过了Claude Opus 4.7、DeepSeek-V4 Pro、GLM-5.1以及Kimi K2.6,性能处于第一梯队。

开源MusaCoder是摩尔线程完善算力生态布局的步骤之一。公司此前已陆续完成对DeepSeek、Qwen、MiniMax等大模型的适配,并推出了配套的开源算子开发工具。开发者现在可以直接使用该模型,借助国产算力底座推进算子开发与训练,提升全功能GPU的计算利用率。

代码模型直接影响AI开发的效率与自主可控程度。通过全栈路径训练出的MusaCoder,为国内研发团队提供了新的工具选项,有助于进一步巩固国产人工智能底层技术架构。