最新消息:关注人工智能 AI赋能新媒体运营

Qwen3.7 预览版上线:数学、编程、多模态全面升级,抢先体验思考模式

科技资讯 admin 浏览

通义千问Qwen3.7预览版悄然上线,性能表现超出预期

就在前几天,阿里通义千问悄悄上线了两款新模型的预览版本:Qwen3.7-Max-Preview 和 Qwen3.7-Plus-Preview。它们已经可以在 Qwen Chat 和 Arena AI(原 LMArena)上直接体验,而官方很可能将在5月20日的阿里云峰会上正式发布。

这两款模型定位清晰,不搞花架子:

  • Qwen3.7-Max-Preview:主打极致推理和综合能力,目前只开放了“思考模式”,还没开搜索、代码解释器这些工具,但光是纯文本推理,就已经让人眼前一亮。
  • Qwen3.7-Plus-Preview:更偏向实用和稳定,推理和逻辑表达能力同样强劲,工具链也还没放开,但日常使用场景下已经足够扎实。

image.png

实测成绩:不靠宣传,靠榜单说话

别看是“预览版”,实际表现已经冲进了全球前列。在 Arena AI 的文本能力排行榜上,Qwen3.7-Max-Preview 直接冲到第13名,让通义千问成为全球第六大模型实验室——这可不是靠公关刷出来的,是全球开发者用真实问题测出来的。

细分领域更亮眼:

  • 数学推理:第7名
  • 专家级应用:第9名
  • 软件与IT领域:第9名
  • 编程能力:第10名

这意味着,你让它写个复杂算法、分析日志、推导数学公式,它不是“大概懂”,而是真能一步步给你理清楚。

视觉能力方面,Qwen3.7-Plus-Preview 在综合视觉榜排到第16,帮助通义千问在视觉模型阵营里冲进前五。更关键的是,在专门测试“高手提示词”的专家竞技场里,Qwen3.7-Max-Preview 也拿到了第9名——说明它不是靠简单问题撑场面,真遇到刁钻、复杂、边界模糊的任务,它也能扛得住。

对开发者和用户意味着什么?

这次不是“预告”,是“试用”。你不用等官宣,现在就能去 Arena AI 上亲自试试,看它能不能帮你写一段稳定运行的Python脚本,能不能看懂你写的模糊需求,能不能在一堆技术文档里精准抓出关键点。

阿里这次没搞“一代颠覆一代”的大跃进,而是走了一条更务实的路:小步快跑,每两周都有新进展。Qwen2.5到Qwen3.0,再到现在的Qwen3.7,迭代节奏明显加快。这不是为了发新闻稿,是为了让产品在真实场景里不断打磨。

如果你是开发者、数据分析师、AI产品经理,或者只是个爱折腾的科技爱好者——现在就是最好的入场时机。不用等“完美版”,先用起来,看看它是不是真能帮你省时间、提效率。等5月20日官宣,你已经比别人多用了半个月。

大模型的竞争,早就不只是参数和发布会了。谁能在真实任务里跑得稳、答得准、响应快,谁才能留下来。Qwen3.7预览版,已经交出了第一份答卷。