国产AI大模型迎新战：智谱GLM-5与MiniMax 2.5同步发布

春节AI爆发：GLM-5与MiniMax2.5同步上线，国产大模型进入“参数+效率”新阶段

这个春节，国产大模型没有歇着。继DeepSeek发布新模型后不久，智谱AI的GLM-5和MiniMax的MiniMax2.5在同一日上线，几乎同步向开发者开放。没有发布会，没有喧嚣的宣传，但技术圈已经炸了——这两款模型，直接把参数量和工程细节拉到了新高度。

GLM-5是智谱AI迄今最强的模型，总参数高达7450亿，几乎是上一代GLM-4.7的两倍。但它不是靠堆参数“刷数据”——架构上用了稀疏注意力（DSA）和多Token预测（MTP），这两项技术此前只在DeepSeek等少数顶尖模型中出现。这意味着它在处理长文本时更省资源，推理效率更高。78层隐藏层、256个专家模块，每次只激活其中8个，实际运行参数约440亿，兼顾了性能与成本。上下文窗口支持到202K Token，能一口气读完一本《三体》全本，还能在编程中保持上下文连贯。

更关键的是，GLM-5已直接上线智谱官网z.ai，开发者可以免费试用。不少人在GitHub上分享了测试结果：在Codeforces编程题、多轮复杂对话、长文档摘要等任务中，表现明显优于GPT-4o和Claude 3.5，尤其在中文语境下，逻辑推理和代码生成稳定性更优。

另一边，MiniMax也没闲着。距离MiniMax2.2发布才一个多月，2.5版本就悄无声息上线了。这次重点打磨的是“智能体”能力——也就是模型能像人一样，自主规划步骤、调用工具、迭代反馈。有开发者用它做了一个自动写周报+查邮件+订会议室的代理系统，全程无干预，完成时间比人工还快。MiniMax团队在内部文档中提到：“我们不再追求‘回答得多好’，而是追求‘能自己把事办了’。”

这两款模型的共同点很明显：不拼参数数字，而是拼“用起来爽不爽”。GLM-5擅长深度思考和复杂任务，MiniMax2.5则在自动化流程上更顺手。它们不是为了发论文，而是为了落地——开发者能直接调用API，接入自己的产品，甚至跑在本地服务器上。

有人算了一笔账：7450亿参数听起来吓人，但得益于稀疏架构，GLM-5在A100集群上的推理成本，比同等规模的密集模型低了近40%。这说明国产模型正在从“大而笨”转向“大而精”。而MiniMax一个月一迭代的节奏，也让不少海外团队感到压力——他们还在等下个季度的更新，我们已经把版本号推到2.5了。

这不是一场参数军备竞赛，而是一场“谁先让开发者用上、用得好”的实战。春节假期，GitHub上关于GLM-5和MiniMax2.5的开源项目暴涨300%。有人用它做法律文书助手，有人用它训练电商客服机器人，还有团队直接把它嵌入到自己的AI硬件中。

2026年的开年，国产大模型不再喊“追上国际水平”，而是直接站到了同一起跑线，甚至在某些场景下，跑得更快了。

GLM-5 MiniMax2.5 稀疏注意力多Token预测

CB科技站

国产AI大模型迎新战：智谱GLM-5与MiniMax 2.5同步发布

春节AI爆发：GLM-5与MiniMax2.5同步上线，国产大模型进入“参数+效率”新阶段

与本文相关的文章