阿里大模型团队震荡,核心成员跳槽字节
不到一个月,阿里通义实验室接连两位核心人物离开。先是大模型技术负责人林俊旸离职,紧接着,原Qwen大模型后训练负责人郁博文正式加入字节跳动,担任Seed团队视觉与多模态交互方向的后训练负责人。
郁博文并非普通技术骨干。他是Qwen系列对话模型从0到1的关键推手之一,主导了模型在指令对齐、人类反馈强化学习(RLHF)和多轮对话优化上的核心工作。在业内,他被不少工程师称为“让Qwen更像人”的那个人。他的离开,让不少阿里内部员工感到意外——毕竟,Qwen曾是阿里在大模型领域最拿得出手的成果。
字节Seed团队,正在悄悄补上最后一块拼图
郁博文加入的Seed团队,是字节跳动内部最神秘也最激进的AI团队之一。团队负责人吴永辉,曾是百度深度学习研究院的元老,2022年带着整个团队跳槽至字节,目标明确:打造下一代多模态大模型。
过去一年,字节在文生图、视频生成、语音交互上动作频频,但始终缺一个能“听懂人话、看懂画面、说清逻辑”的统一后训练体系。郁博文的加入,正是为了解决这个问题——不是堆参数,而是让模型更“懂人”。
据知情人士透露,字节内部已启动“多模态对话优化专项”,目标是在2024年底前,让旗下剪映、抖音AI助手、飞书AI等产品,实现更自然的图文混合交互。而郁博文带来的,正是这套被阿里内部验证过、但尚未大规模落地的后训练方法论。
大厂抢人,抢的不是头衔,是经验
这不是简单的“挖人”。过去两年,大模型的竞争从“谁的参数更大”转向“谁的模型更听话”。后训练,这个曾经被忽略的技术环节,如今成了决定用户体验的分水岭。
一个真实的例子:同样是100B参数的模型,经过精细后训练的,能准确理解“帮我把上个月拍的海边照片做成短视频,配轻音乐”这种模糊指令;而未经优化的,只会生成一堆无关的图片或乱码。
字节要的不是“更强的模型”,而是“更懂用户的模型”。郁博文在阿里时,就曾用一套基于人工标注+自动反馈的混合训练系统,把Qwen-Chat的多轮对话准确率提升了37%。这套方法,现在正被字节复制进自己的系统。
人才流动背后,是技术路线的重新洗牌
阿里这次架构调整,表面是“整合资源”,实则是战略重心转移。通义实验室从“全面开花”转向聚焦云服务与企业级模型,Qwen团队被拆分,部分骨干被调往其他部门,也有像郁博文这样选择离开的人。
而字节则相反——他们不追求“全栈自研”,而是精准卡位:视觉有豆包,语音有火山,现在缺的是“对话大脑”。郁博文的加入,等于把阿里三年积累的对话优化经验,直接搬到了字节的产品线上。
这场人才流动,不是个人选择,而是行业风向的信号:当参数竞赛接近瓶颈,真正能赢的,是那些能把模型“调教”得更聪明、更自然的团队。而郁博文,就是那个最擅长“调教”的人。
接下来半年,我们或许会看到抖音AI助手突然变得“更会聊天”了——不是因为算力变强,而是因为,有人把阿里没来得及做完的事,做完了。