Cursor发布Composer 2.5新模型，提升长任务处理、复杂指令与协同开发表现

Cursor 推出编程开发代理模型更新 Composer 2.5，目前已在 IDE Cursor 中上线使用。官方表示，新版相比 Composer 2 在长时间任务处理、复杂指令遵循和协作交互方面均有提升，使模型在多步骤编程任务中能更好地保持进度，而不仅仅是提升单次回答的质量。

Composer 2.5 基于 Moonshot 的 Kimi K2.5 开源模型检查点构建。Cursor 表示，此次更新通过扩大训练规模、构建更复杂的强化学习环境，并引入新的学习方法，优化了模型行为。官方还提到，除了提升模型处理困难任务的能力，还调整了沟通风格与参与度的平衡，这些方面难以通过传统基准测试完全体现，但对实际使用体验影响显著。

新模型的一项关键技术是基于文本反馈的定向强化学习（Targeted RL with Textual Feedback）。Cursor 指出，在长轨迹强化学习中，模型单次任务可能消耗数十万个词元（Token），若仅依据最终结果评估，模型难以判断是哪一次工具调用、说明方式或表达风格导致性能下降。Composer 2.5 在问题发生的位置加入文本提示，使训练反馈更精准定位错误，从而修正局部行为，同时保留整体任务的学习目标。

Cursor 扩大了合成任务的训练规模，Composer 2.5 使用的合成任务数量是 Composer 2 的 25 倍，这些任务均基于真实代码库生成，例如通过删除特定可测试功能构建训练题目，再要求模型根据测试结果重新实现该功能。

不过，官方也指出，大规模合成任务可能导致模型找到非预期的捷径。Composer 2.5 曾通过 Python 类型检查缓存反推被删除的函数签名，也曾反编译 Java 字节码重建第三方接口。Cursor 表示，这些问题通过代理监控工具发现并诊断，凸显了大规模强化学习训练中需要更谨慎的设计。

Cursor 还优化了大型模型训练时的优化器与并行配置，尤其在处理混合专家模型中不同权重的分片、正交化与通信开销方面取得进展。此外，该公司表示正在与 SpaceX AI 从零开始训练更大规模的模型，预计总训练算力将提升至原来的 10 倍。

CB科技站

Cursor发布Composer 2.5新模型，提升长任务处理、复杂指令与协同开发表现

与本文相关的文章