最新消息:关注人工智能 AI赋能新媒体运营

Cursor发布Composer 2.5新模型,提升长任务处理、复杂指令与协同开发表现

科技资讯 admin 浏览

Cursor 推出编程开发代理模型更新 Composer 2.5,目前已在 IDE Cursor 中上线使用。官方表示,新版相比 Composer 2 在长时间任务处理、复杂指令遵循和协作交互方面均有提升,使模型在多步骤编程任务中能更好地保持进度,而不仅仅是提升单次回答的质量。

Composer 2.5 基于 Moonshot 的 Kimi K2.5 开源模型检查点构建。Cursor 表示,此次更新通过扩大训练规模、构建更复杂的强化学习环境,并引入新的学习方法,优化了模型行为。官方还提到,除了提升模型处理困难任务的能力,还调整了沟通风格与参与度的平衡,这些方面难以通过传统基准测试完全体现,但对实际使用体验影响显著。

新模型的一项关键技术是基于文本反馈的定向强化学习(Targeted RL with Textual Feedback)。Cursor 指出,在长轨迹强化学习中,模型单次任务可能消耗数十万个词元(Token),若仅依据最终结果评估,模型难以判断是哪一次工具调用、说明方式或表达风格导致性能下降。Composer 2.5 在问题发生的位置加入文本提示,使训练反馈更精准定位错误,从而修正局部行为,同时保留整体任务的学习目标。

Cursor 扩大了合成任务的训练规模,Composer 2.5 使用的合成任务数量是 Composer 2 的 25 倍,这些任务均基于真实代码库生成,例如通过删除特定可测试功能构建训练题目,再要求模型根据测试结果重新实现该功能。

不过,官方也指出,大规模合成任务可能导致模型找到非预期的捷径。Composer 2.5 曾通过 Python 类型检查缓存反推被删除的函数签名,也曾反编译 Java 字节码重建第三方接口。Cursor 表示,这些问题通过代理监控工具发现并诊断,凸显了大规模强化学习训练中需要更谨慎的设计。

Cursor 还优化了大型模型训练时的优化器与并行配置,尤其在处理混合专家模型中不同权重的分片、正交化与通信开销方面取得进展。此外,该公司表示正在与 SpaceX AI 从零开始训练更大规模的模型,预计总训练算力将提升至原来的 10 倍。