通义千问Qwen3.7预览版悄然上线,性能表现超出预期
就在前几天,阿里通义千问悄悄上线了两款新模型的预览版本:Qwen3.7-Max-Preview 和 Qwen3.7-Plus-Preview。它们已经可以在 Qwen Chat 和 Arena AI(原 LMArena)上直接体验,而官方很可能将在5月20日的阿里云峰会上正式发布。
这两款模型定位清晰,不搞花架子:
- Qwen3.7-Max-Preview:主打极致推理和综合能力,目前只开放了“思考模式”,还没开搜索、代码解释器这些工具,但光是纯文本推理,就已经让人眼前一亮。
- Qwen3.7-Plus-Preview:更偏向实用和稳定,推理和逻辑表达能力同样强劲,工具链也还没放开,但日常使用场景下已经足够扎实。

实测成绩:不靠宣传,靠榜单说话
别看是“预览版”,实际表现已经冲进了全球前列。在 Arena AI 的文本能力排行榜上,Qwen3.7-Max-Preview 直接冲到第13名,让通义千问成为全球第六大模型实验室——这可不是靠公关刷出来的,是全球开发者用真实问题测出来的。
细分领域更亮眼:
- 数学推理:第7名
- 专家级应用:第9名
- 软件与IT领域:第9名
- 编程能力:第10名
这意味着,你让它写个复杂算法、分析日志、推导数学公式,它不是“大概懂”,而是真能一步步给你理清楚。
视觉能力方面,Qwen3.7-Plus-Preview 在综合视觉榜排到第16,帮助通义千问在视觉模型阵营里冲进前五。更关键的是,在专门测试“高手提示词”的专家竞技场里,Qwen3.7-Max-Preview 也拿到了第9名——说明它不是靠简单问题撑场面,真遇到刁钻、复杂、边界模糊的任务,它也能扛得住。
对开发者和用户意味着什么?
这次不是“预告”,是“试用”。你不用等官宣,现在就能去 Arena AI 上亲自试试,看它能不能帮你写一段稳定运行的Python脚本,能不能看懂你写的模糊需求,能不能在一堆技术文档里精准抓出关键点。
阿里这次没搞“一代颠覆一代”的大跃进,而是走了一条更务实的路:小步快跑,每两周都有新进展。Qwen2.5到Qwen3.0,再到现在的Qwen3.7,迭代节奏明显加快。这不是为了发新闻稿,是为了让产品在真实场景里不断打磨。
如果你是开发者、数据分析师、AI产品经理,或者只是个爱折腾的科技爱好者——现在就是最好的入场时机。不用等“完美版”,先用起来,看看它是不是真能帮你省时间、提效率。等5月20日官宣,你已经比别人多用了半个月。
大模型的竞争,早就不只是参数和发布会了。谁能在真实任务里跑得稳、答得准、响应快,谁才能留下来。Qwen3.7预览版,已经交出了第一份答卷。