上海交大发布SWE-Explore基准,揭示AI编程行级定位缺陷
admin 2026-06-16 189浏览
国际团队发布SWE-Explore基准测试,量化AI编码智能体行级定位短板 包含上海交通大学成员的国际研究团队正式发布评测工具SWE-Explore。该工具将代码搜索与实际修复阶段解耦打分,打破了...
admin 2026-06-16 189浏览
国际团队发布SWE-Explore基准测试,量化AI编码智能体行级定位短板 包含上海交通大学成员的国际研究团队正式发布评测工具SWE-Explore。该工具将代码搜索与实际修复阶段解耦打分,打破了...