千问Qwen3.5-Plus正式开源:性能碾压Gemini 3 Pro,显存省六成,价格低至1/18
2026年2月16日除夕夜,阿里巴巴通义实验室正式开源千问Qwen3.5-Plus,这款模型不仅在多项权威评测中全面超越Gemini 3 Pro、GPT-5.2和Claude 4.5,更以“小身材、大能量”的设计重新定义了大模型的效率边界。
它总参数达3970亿,但实际激活参数仅170亿——这意味着你不需要万亿级算力,也能跑出比更大模型更强的效果。在同等硬件环境下,部署所需显存降低60%,推理吞吐量在256K超长上下文场景下提升19倍。开发者实测,一台消费级4090显卡即可流畅运行,而过去要达到类似效果,必须动用A100集群。
更让人意外的是它的价格。Qwen3.5-Plus的API调用成本仅为每百万Token 0.8元,是Gemini 3 Pro的1/18,是GPT-4o的1/20。对于中小企业、独立开发者和AI创业团队来说,这不再是“用得起的模型”,而是“不用就亏了”的选择。
不是升级,是代际跃迁:原生多模态,图文一体更自然
与前几代“文本为主、图像打补丁”的模式不同,Qwen3.5-Plus从训练底层就采用视觉与文本混合token架构,真正实现“图文同源”。你不再需要把图片转成描述再输入——直接上传一张手写公式、一张产品包装图,或一段会议白板照片,它能直接理解、推理、回答,甚至生成对应内容。
实测中,它能准确识别一张模糊的外卖菜单并列出热量信息;能看懂工程图纸上的标注并指出结构风险;还能根据一张孩子画的卡通图,生成完整的故事脚本。这种“看懂图、听懂话、懂上下文”的能力,在IFBench、MMMU、VQA等多模态榜单上均刷新纪录。
真实评测:不是参数游戏,是硬实力说话
在权威基准测试中,Qwen3.5-Plus的表现令人侧目:
- MMLU-Pro(综合知识理解):87.8分,超越GPT-5.2的86.1
- GPQA(高难度科学推理):88.4分,领先Claude 4.5的85.9
- IFBench(复杂指令遵循):92.3分,全球第一
- LiveBench(实时交互与多轮对话):89.1分,首次在开放对话中击败Gemini 3 Pro
这些不是实验室“调参”结果,而是多家第三方机构在真实场景下用相同硬件、相同数据集反复验证的结论。甚至有开发者在Reddit上晒出对比视频:同样问“如何修复我家漏水的屋顶”,Qwen3.5-Plus不仅给出材料清单、施工步骤,还主动提醒“建议先拍照发给保险公司,避免后续纠纷”。
已全面接入,开发者可立即使用
目前,Qwen3.5-Plus已同步上线通义千问App、通义万相、钉钉、淘宝AI助手等阿里系产品,并开放给所有开发者通过魔搭ModelScope平台免费下载权重,支持Hugging Face、vLLM、TensorRT-LLM等主流框架部署。
无需申请白名单,无需付费试用,开源即用。社区已出现多个落地案例:一家三线城市的教育机构用它自建AI家教,成本不到竞品的十分之一;一位独立游戏开发者用它生成NPC对话与剧情分支,开发周期缩短70%;甚至有农民用它识别病虫害图片,结合本地农技站数据给出种植建议。
这不是一次技术发布会,而是一场普惠的开源革命。当别人还在比谁参数更大,阿里已经让大模型,回到了真正有用的地方。
