智谱计划8月发布GLM-5.5大模型 参数量有望突破万亿
智谱定于今年8月推出新一代基座大模型GLM-5.5。这款模型将在架构上进行调整,参数量有望突破1万亿。
美国相关机构此前限制了对Anthropic旗下Fable5和Mythos5两款大模型的访问。智谱随即开源了基于GLM-5.0架构升级而来的GLM-5.2。该版本目前位居开源SOTA(State of the Art)榜单首位。在AI编程等指标上,它的表现处于前列,已被全球开发者视为编程大模型的首选之一。
当前GLM-5.2的总参数量约为7440亿,激活参数量约400亿。若GLM-5.5如预测达到万亿参数规模,模型整体容量将提升50%以上。结合智谱在大模型后训练优化方面的经验,该版本有望成为中国大模型对标全球顶尖水平的重要节点。
特斯拉CEO埃隆·马斯克曾认为中国大模型追赶全球顶尖水平尚需时日。智谱创始人唐杰回应称,实际进度会比外界预期更快。8月的发布窗口临近,市场正在观察GLM-5.5能否兑现这一判断。
从GLM-5.2到GLM-5.5的迭代,智谱依靠开源策略持续扩充国产算力生态。算力投入和技术攻关的压力依然存在。应用端的调用需求在增加,大模型国产化的推进已形成常态。