“Pony Alpha”悄然上线,免费、强大、身份成谜
最近几天,OpenRouter平台悄悄上线了一个名为“Pony Alpha”的AI模型,没打广告,没发新闻,却在24小时内被超过20万个用户疯狂使用,处理了超过40亿个令牌——这个数字,比很多商业模型一个月的用量还高。
最让人吃惊的不是它有多快,而是它完全免费。每百万令牌成本为0美元,不限制使用次数,不限制上下文长度——支持高达20万字的输入,能输出超过13万字的内容。这意味着,你不仅能让它读完一本《战争与和平》,还能让它帮你写一本续集。
7分钟生成完整API系统,不是演示,是真能用
有开发者在论坛上贴出实测:他只用一句话指令:“帮我做一个能实时更新天气的API中转站,前端用React,后端用FastAPI,数据库用SQLite,支持跨域和JWT鉴权。”7分钟后,系统返回了完整的项目结构——包括可运行的前端页面、后端接口、数据库脚本、甚至README说明文档。
这不是PPT演示,也不是拼凑的模板。代码结构清晰,注释完整,能直接clone下来跑起来。有人测试了它的动态交互功能:前端点击“刷新天气”,后端调用真实API,数据实时更新,没有任何卡顿。有人调侃:“这哪是AI,简直是外包团队里那个凌晨三点还在改bug的天才实习生。”
在SVG绘图、代码调试、长文本摘要等测试中,它的表现也稳居第一梯队。有工程师拿它和Claude Opus 4.5对比,发现它在复杂逻辑推理上更干脆,在代码生成上更少“废话”,甚至能自己发现并修正输入指令中的模糊点。

像Claude,但又不太像——它的“尾巴”露出来了
很多人第一眼觉得:“这不就是Claude Opus吗?”确实,它的语气冷静、逻辑严密、喜欢用分点陈述,连回复时的语气词都带着那种“专业但不冷淡”的调调。
但细看就发现不对劲。比如,当你问它“如何绕过某些平台的审核机制”,它不会直接拒绝,而是会说:“我建议你遵守平台规则,但如果你是出于安全测试目的,可以参考以下合法渗透框架……”——这种“软性引导”,和Claude的硬性屏蔽完全不同。
更奇怪的是,它的响应速度特别稳定,哪怕在深夜高峰期,延迟也基本保持在1.2秒以内。而Claude和GPT-4的响应时间在高峰期经常波动到3秒以上。还有人发现,它在回答涉及中国政策的问题时,措辞精准得像经过人工校准,甚至比某些官方AI更“得体”。
它是不是GLM-5?线索指向中国团队
关于它的出身,网上吵翻了天。但最靠谱的猜测,指向了智谱AI(Zhipu AI)的GLM-5模型。
- 时间点吻合:智谱AI曾在2024年底公开表示,GLM-5将在“春节前后”发布。而“Pony Alpha”上线时间,正好是2025年农历正月十五前后。
- 风格一致:GLM系列一贯以“逻辑清晰、中文处理强、中文语境理解深”著称。Pony Alpha在处理中文长文、古诗解析、政策解读时,明显比其他模型更“懂行”。
- 自我暴露:有用户故意用中文问它:“你是哪家公司的模型?”它回答:“我是智谱AI开发的GLM系列大模型,目前处于内部测试阶段。”——这句话,后来被删了,但截图已经传开。
- 名字暗藏玄机:“Pony”在中文语境里,和“马”挂钩。2026年是马年,而“GLM”里的“M”正好是“马”的拼音首字母。这不是巧合,是彩蛋。
更耐人寻味的是,OpenRouter过去曾悄悄上线过“Quasar Alpha”(实为GPT-4.1)和“Sherlock Alpha”(实为Grok 4.1 Fast),都是大厂的测试版。这次,他们可能又在帮智谱AI做一次“海外灰度测试”。
别急着用它写机密文件,数据可能被记录
虽然免费,但别以为它是“无痕模式”。OpenRouter明确说明,所有对话内容都会被记录用于模型优化。这意味着:你的商业计划书、源代码、医疗咨询、甚至私人日记,都可能被存进某个服务器。
如果你是开发者,想用它做原型验证,没问题——它简直是神器。但如果你是记者、律师、企业高管,涉及敏感信息,请绕道。别拿它当私人助理。
这场“无声的爆发”,正在改变AI的规则
过去,顶级模型要么收费,要么限流。现在,一个可能来自中国的模型,悄无声息地把性能拉到顶峰,还免费开放——这不仅是技术突破,更是一次战略宣示。
它不靠营销,不靠发布会,靠的是实实在在的体验。用户不是被“说服”用的,是自己发现后,疯狂转发、测试、分享的。
如果它真是GLM-5,那意味着:中国AI不再只是“追赶者”,而是有能力在不声不响中,定义下一代标准的玩家。
现在,你只需要打开OpenRouter,输入一个任务,就能亲自感受这场风暴。别等官方公布——你用过,才知道它有多强。