最新消息:关注人工智能 AI赋能新媒体运营

阿里巴巴发布Qwen3.6-Max-Preview:新一代编程智能旗舰模型

科技资讯 admin 浏览

阿里巴巴发布Qwen3.6-Max-Preview:编程能力全面跃升,开发者可免费体验

阿里巴巴正式推出Qwen系列最新旗舰模型——Qwen3.6-Max-Preview,作为当前最强的预览版本,它已开放给开发者在QwenStudio平台直接对话体验,同时通过阿里云百炼API以 qwen3.6-max-preview 模型名调用。这不是一次普通的迭代,而是面向真实开发场景的一次深度重构。

image.png

真实编程能力,六项权威测试全第一

这次Qwen3.6-Max-Preview的突破,不是靠“理论分数”堆出来的。它在六个被行业广泛认可的编程基准测试中全部拿下第一名,涵盖从复杂项目部署、终端命令生成,到真实代码库理解与科学计算编程等多个硬核场景。

具体来看:

  • SWE-benchPro(真实GitHub项目修复任务)中,它能独立理解issue描述、定位代码缺陷并提交可运行的修复方案;
  • Terminal-Bench2.0 中,它能准确执行多步Linux命令链,处理依赖安装、环境配置等开发人员日常痛点;
  • SciCode 测试中,它在科学计算代码生成上提升超10分,意味着能更好处理Python科学库(如NumPy、SciPy)的复杂调用;
  • SkillsBench 中,它对多工具协同编程的调度能力提升近10分,能更自然地结合代码生成、文档查询、调试建议等动作。

这些不是实验室模拟,而是贴近真实开发流程的考验。不少开发者反馈,过去用AI写代码还得反复修正语法和逻辑,现在Qwen3.6-Max-Preview第一次就能给出结构清晰、可直接运行的代码片段。

不只是写代码,更懂你想要什么

除了写代码,它也更“聪明”了。

在世界知识方面,SuperGPQA(全球专业级知识问答)得分提升2.3分,意味着它对技术文档、论文、行业标准的理解更准了。比如你问“Kubernetes 1.30中PodSecurityPolicy被移除后如何替代?”,它能给出准确的官方迁移路径,而不是泛泛而谈。

中文场景也大幅优化,QwenChineseBench 提升5.3分,在处理中文技术文档、本地化术语、政策合规要求时表现更自然。对国内企业开发者来说,这意味着用中文写需求、提问题,它能更精准理解你的意图。

在工具调用方面,ToolcallFormatIFBench 提升2.8分,说明它能更稳定地调用API、插件、数据库连接器,不再出现“调用格式错误”这种低级问题——这对自动化脚本、智能助手开发至关重要。

现在就能用,未来还在升级

虽然标着“Preview”(预览版),但阿里巴巴已经开放了实际使用通道。你不需要等正式版,现在就可以登录 QwenStudio,直接和它对话,尝试写个Python爬虫、调试一个Dockerfile,或者让它帮你梳理一个技术方案。

阿里也明确表示,这个版本不是终点。团队正在持续收集真实用户的反馈,优化长上下文处理、多轮交互一致性、以及对新兴框架(如Rust、LangChain)的支持。预计未来几个月内,将推出更稳定的正式版,并支持更多云原生工具链集成。

开发者建议:别只当“代码生成器”

很多用户还在把AI当“自动补全工具”,但Qwen3.6-Max-Preview的真正价值在于:它能成为你的技术协作者。

试试这样用:

  • “帮我分析这个Git提交日志,找出可能引发内存泄漏的代码段”
  • “我有个Node.js服务在生产环境偶发500错误,这是日志,请帮我定位原因并写个监控脚本”
  • “根据这份产品需求文档,生成一个前后端接口定义和数据库ER图”

它不再是“写一行补一行”,而是能理解上下文、主动建议、甚至帮你拆解复杂任务。如果你是独立开发者、技术负责人或AI原生应用构建者,现在就是体验它的最佳时机。

免费开放,无需排队,直接上手——这或许是今年最值得开发者关注的一次大模型更新。