前Qwen核心骨干：大模型正迈向智能行动时代

原阿里通义千问技术负责人林俊旸首次发声：大模型的下一程，不是“想得更多”，而是“做得更真”

离职数周后，原阿里通义千问（Qwen）大模型技术负责人林俊旸于3月26日晚首次公开发文，直指当前大模型发展的核心误区：我们太执着于让模型“多思考”，却忘了它最终要的是“做点什么”。

在他看来，过去一年行业都在围绕“推理链长度”打转——模型写100步推理才敢回答一个问题，看起来很“聪明”，实则效率低下、成本高昂。真正的突破，不在于模型能写出多长的逻辑，而在于它能不能在真实环境中，像人一样：观察、调整、行动、再调整。

千问的教训：强行融合“思考”与“执行”，结果两头不讨好

林俊旸在文中回忆了2025年初千问团队的一次大胆尝试：想打造一个“全能型”模型，能根据问题难度自动切换“思考模式”或“执行模式”。简单说，就是希望一个模型既能解微积分，又能发邮件、订机票、写周报。

结果呢？

模型在“思考”时拖泥带水，明明三步能解决的问题，非要绕五圈；到了“执行”环节，又频频出错，指令一复杂就卡壳，响应慢、成本高，连内部测试都难通过。团队最终不得不放弃“一统江湖”的幻想，转而分别推出Qwen-Instruct（专注指令执行）和Qwen-Thinking（专注复杂推理）两个版本——事实证明，分开做，反而更稳、更快、更省。

这不仅是技术路线的调整，更是对行业盲目追求“统一模型”幻觉的一次清醒回击。

未来AI不是“答题机器”，而是“行动伙伴”

林俊旸提出一个新标准：别再问“模型会不会解这道题”，该问“它能不能帮你把这事办成”。

一个能解出高数证明的模型，未必能帮你协调好一场跨部门会议；一个能写诗的AI，可能连你家冰箱里还剩几瓶牛奶都搞不清。

真正的智能，藏在“环境”里。它需要知道：什么时候该停、什么时候该改、谁在等结果、预算多少、deadline在哪。未来的AI系统，不再是孤立的模型，而是一整套“模型+工具+反馈+环境”的有机体。

这意味着，研发的重点将从“加数据、扩参数”转向：

如何设计真实、可交互的测试环境（比如模拟客服系统、电商后台、工厂调度）；
如何让多个AI智能体协同工作，像团队一样分工、纠错、补位；
如何建立可靠的“评估器”，不靠人工打分，而是看它能不能在连续任务中持续提升效率。

林俊旸的这番话，没有炫技术语，没有“革命性突破”的口号，却道出了许多一线工程师的切身感受：我们已经厌倦了“纸上谈兵”的AI。我们需要的，是能走进真实世界、扛得住混乱、改得了计划、最终把事办成的系统。

如果说过去AI在学“怎么答对题”，那接下来，它得学“怎么当个靠谱的同事”。

CB科技站

前Qwen核心骨干：大模型正迈向智能行动时代

原阿里通义千问技术负责人林俊旸首次发声：大模型的下一程，不是“想得更多”，而是“做得更真”

千问的教训：强行融合“思考”与“执行”，结果两头不讨好

未来AI不是“答题机器”，而是“行动伙伴”

与本文相关的文章