通义千问核心团队集体跳槽字节，大模型人才争夺白热化

阿里大模型团队震荡，核心成员跳槽字节

不到一个月，阿里通义实验室接连两位核心人物离开。先是大模型技术负责人林俊旸离职，紧接着，原Qwen大模型后训练负责人郁博文正式加入字节跳动，担任Seed团队视觉与多模态交互方向的后训练负责人。

郁博文并非普通技术骨干。他是Qwen系列对话模型从0到1的关键推手之一，主导了模型在指令对齐、人类反馈强化学习（RLHF）和多轮对话优化上的核心工作。在业内，他被不少工程师称为“让Qwen更像人”的那个人。他的离开，让不少阿里内部员工感到意外——毕竟，Qwen曾是阿里在大模型领域最拿得出手的成果。

郁博文加入的Seed团队，是字节跳动内部最神秘也最激进的AI团队之一。团队负责人吴永辉，曾是百度深度学习研究院的元老，2022年带着整个团队跳槽至字节，目标明确：打造下一代多模态大模型。

过去一年，字节在文生图、视频生成、语音交互上动作频频，但始终缺一个能“听懂人话、看懂画面、说清逻辑”的统一后训练体系。郁博文的加入，正是为了解决这个问题——不是堆参数，而是让模型更“懂人”。

据知情人士透露，字节内部已启动“多模态对话优化专项”，目标是在2024年底前，让旗下剪映、抖音AI助手、飞书AI等产品，实现更自然的图文混合交互。而郁博文带来的，正是这套被阿里内部验证过、但尚未大规模落地的后训练方法论。

这不是简单的“挖人”。过去两年，大模型的竞争从“谁的参数更大”转向“谁的模型更听话”。后训练，这个曾经被忽略的技术环节，如今成了决定用户体验的分水岭。

一个真实的例子：同样是100B参数的模型，经过精细后训练的，能准确理解“帮我把上个月拍的海边照片做成短视频，配轻音乐”这种模糊指令；而未经优化的，只会生成一堆无关的图片或乱码。

字节要的不是“更强的模型”，而是“更懂用户的模型”。郁博文在阿里时，就曾用一套基于人工标注+自动反馈的混合训练系统，把Qwen-Chat的多轮对话准确率提升了37%。这套方法，现在正被字节复制进自己的系统。

阿里这次架构调整，表面是“整合资源”，实则是战略重心转移。通义实验室从“全面开花”转向聚焦云服务与企业级模型，Qwen团队被拆分，部分骨干被调往其他部门，也有像郁博文这样选择离开的人。

而字节则相反——他们不追求“全栈自研”，而是精准卡位：视觉有豆包，语音有火山，现在缺的是“对话大脑”。郁博文的加入，等于把阿里三年积累的对话优化经验，直接搬到了字节的产品线上。

这场人才流动，不是个人选择，而是行业风向的信号：当参数竞赛接近瓶颈，真正能赢的，是那些能把模型“调教”得更聪明、更自然的团队。而郁博文，就是那个最擅长“调教”的人。

接下来半年，我们或许会看到抖音AI助手突然变得“更会聊天”了——不是因为算力变强，而是因为，有人把阿里没来得及做完的事，做完了。