最新消息:关注人工智能 AI赋能新媒体运营

前Qwen核心骨干:大模型正迈向智能行动时代

科技资讯 admin 浏览

原阿里通义千问技术负责人林俊旸首次发声:大模型的下一程,不是“想得更多”,而是“做得更真”

离职数周后,原阿里通义千问(Qwen)大模型技术负责人林俊旸于3月26日晚首次公开发文,直指当前大模型发展的核心误区:我们太执着于让模型“多思考”,却忘了它最终要的是“做点什么”。

在他看来,过去一年行业都在围绕“推理链长度”打转——模型写100步推理才敢回答一个问题,看起来很“聪明”,实则效率低下、成本高昂。真正的突破,不在于模型能写出多长的逻辑,而在于它能不能在真实环境中,像人一样:观察、调整、行动、再调整。

千问的教训:强行融合“思考”与“执行”,结果两头不讨好

林俊旸在文中回忆了2025年初千问团队的一次大胆尝试:想打造一个“全能型”模型,能根据问题难度自动切换“思考模式”或“执行模式”。简单说,就是希望一个模型既能解微积分,又能发邮件、订机票、写周报。

结果呢?

模型在“思考”时拖泥带水,明明三步能解决的问题,非要绕五圈;到了“执行”环节,又频频出错,指令一复杂就卡壳,响应慢、成本高,连内部测试都难通过。团队最终不得不放弃“一统江湖”的幻想,转而分别推出Qwen-Instruct(专注指令执行)和Qwen-Thinking(专注复杂推理)两个版本——事实证明,分开做,反而更稳、更快、更省。

这不仅是技术路线的调整,更是对行业盲目追求“统一模型”幻觉的一次清醒回击。

未来AI不是“答题机器”,而是“行动伙伴”

林俊旸提出一个新标准:别再问“模型会不会解这道题”,该问“它能不能帮你把这事办成”。

一个能解出高数证明的模型,未必能帮你协调好一场跨部门会议;一个能写诗的AI,可能连你家冰箱里还剩几瓶牛奶都搞不清。

真正的智能,藏在“环境”里。它需要知道:什么时候该停、什么时候该改、谁在等结果、预算多少、deadline在哪。未来的AI系统,不再是孤立的模型,而是一整套“模型+工具+反馈+环境”的有机体。

这意味着,研发的重点将从“加数据、扩参数”转向:

  • 如何设计真实、可交互的测试环境(比如模拟客服系统、电商后台、工厂调度);
  • 如何让多个AI智能体协同工作,像团队一样分工、纠错、补位;
  • 如何建立可靠的“评估器”,不靠人工打分,而是看它能不能在连续任务中持续提升效率。

林俊旸的这番话,没有炫技术语,没有“革命性突破”的口号,却道出了许多一线工程师的切身感受:我们已经厌倦了“纸上谈兵”的AI。我们需要的,是能走进真实世界、扛得住混乱、改得了计划、最终把事办成的系统。

如果说过去AI在学“怎么答对题”,那接下来,它得学“怎么当个靠谱的同事”。