MiniMax发布VIBE-Bench:以操作型智能体评估AI全栈开发能力
admin 2025-12-24 67浏览
为什么VIBE-Bench正在改变AI开发的评测方式? 过去,我们评价AI写代码的能力,靠的是看它生成的代码是否“看起来像样”——语法正确、注释清晰、结构工整。但这些,都不等于“能用...
admin 2025-12-24 67浏览
为什么VIBE-Bench正在改变AI开发的评测方式? 过去,我们评价AI写代码的能力,靠的是看它生成的代码是否“看起来像样”——语法正确、注释清晰、结构工整。但这些,都不等于“能用...