最新消息:关注人工智能 AI赋能新媒体运营

智谱GLM-5复用DeepSeek架构,性能跃升市值暴涨200%,登顶国产AI榜首

科技资讯 admin 浏览

GLM-5横空出世,国产大模型迎来“春节爆点”

2026年春节刚过,国产大模型圈就炸了锅。DeepSeek还没从全民热议中缓过劲来,智谱AI就甩出了一记重拳——GLM-5,一款被业内称为“中国版Claude Opus”的新模型,悄无声息地登上了全球模型平台OpenRouter,代号“Pony Alpha”。

一开始,没人知道这模型是谁做的。但很快,网友在它的系统提示词里发现了“GLM”字样,像极了当年“马甲模型”被扒的名场面。更绝的是,有人用一个老套路测试:输入“锅内倒入植物油烧热”,结果输出了GLM家族特有的逻辑异常——这就像指纹,别人模仿不来。一锤定音:Pony Alpha,就是GLM-5。

image.png

参数翻倍、架构复用,技术路线出人意料

GLM-5的参数量高达7450亿,是上一代GLM-4.7的两倍。但它的聪明之处,不在于堆参数,而在于“借力打力”——它直接复用了DeepSeek-V3的稀疏注意力架构(DSA),也就是“专家模型”那一套:256个专家,每次只激活8个,实际运算量约440亿参数,稀疏度不到6%。

这意味着什么?同样的算力,跑出更强的效果;同样的服务器,能扛更多并发。企业不用再为“买不起4090集群”发愁,部署成本直降三成。更关键的是,它能无缝对接vLLM、SGLang这些主流推理框架,连运维团队都不用重新培训。

有人问:这不就是“抄”了DeepSeek?智谱的回答是:我们不是抄,是站在巨人肩膀上,把房子盖得更高。GLM-5在DeepSeek的文本强项基础上,补上了最缺的一块拼图——多模态。

不只是文本王者,视频理解也杀进第一梯队

2026年的AI,早就不只是聊天和写代码了。用户要的是能看懂短视频、能分析直播画面、能从一段行车记录仪里识别事故原因的模型。

GLM-5支持高达202K的上下文窗口,相当于一口气读完一本《三体》全集。更硬核的是,它在视频理解上做了专项优化:能识别画面中人物动作、文字叠加、场景切换,甚至能根据几秒的监控片段,推测出“这个人是否在刻意隐藏什么”。

有开发者实测:让GLM-5看一段抖音热舞视频,它不仅能描述动作,还能分析节奏变化、音乐节拍与舞步的匹配度,甚至给出“适合改编成广场舞版本”的建议。这不是实验室玩具,这是能直接落地到电商、安防、教育场景的真本事。

image.png

股价暴涨200%,市值冲上1500亿港元

技术炸了,资本市场立刻跟上。消息公布后一周,智谱AI股价飙涨200%,总市值突破1500亿港元,是IPO时的三倍。投资机构纷纷调高评级:“这不是一次迭代,是国产大模型从‘能用’到‘敢用’的转折点。”

海外开发者也在悄悄转移阵地。GitHub上,GLM-5的API调用请求在两周内增长了470%,超过Llama 3.1,仅次于GPT-4o。不少海外中小企业开始用它替代Claude和Gemini——不是因为便宜,而是因为“更懂中文语境”。

真正的竞争,才刚刚开始

GLM-5的出现,让国产大模型从“追赶者”变成了“规则制定者”。它不靠烧钱堆算力,不靠营销造声量,而是用一套“低成本、高效率、强落地”的组合拳,重新定义了AI的性价比。

现在,越来越多的公司开始问:“你们能用GLM-5做智能客服吗?”“能接入我们的视频监控系统吗?”“能24小时监控直播间的违规内容吗?”

答案是:能。

这不是科幻,这是2026年春节后,中国AI真实发生的改变。