马斯克点赞!Kimi论文突破大模型效率瓶颈:同等算力下性能提升25%
admin 2026-03-19 146浏览
为什么同样的算力,有的模型能多跑出25%的性能? 3月16日,月之暗面(Moonshot AI)发布了一篇让人眼前一亮的技术报告——《Attention Residuals》。它没有谈参数量、没吹训练数据,而是把...
admin 2026-03-19 146浏览
为什么同样的算力,有的模型能多跑出25%的性能? 3月16日,月之暗面(Moonshot AI)发布了一篇让人眼前一亮的技术报告——《Attention Residuals》。它没有谈参数量、没吹训练数据,而是把...