研究称AI代码通过率或被高估7倍:基准测试不反映真实能力
admin 2026-03-13 190浏览
AI写代码,真的靠谱吗?最新研究揭穿“高分低能”真相 你可能在新闻里看到过这样的标题:“GPT-5代码能力超越人类程序员”“Claude4.5在编程基准测试中拿下新纪录”。但一项由研究...
admin 2026-03-13 190浏览
AI写代码,真的靠谱吗?最新研究揭穿“高分低能”真相 你可能在新闻里看到过这样的标题:“GPT-5代码能力超越人类程序员”“Claude4.5在编程基准测试中拿下新纪录”。但一项由研究...
admin 2026-03-04 194浏览
MiniMax上市后首份年报:一场被误解的AI突围 2026年3月2日,上海稀宇科技(MiniMax)发布了上市后的第一份年度财报。这不是一份典型的科技公司业绩公告,而更像是一场关于“谁在真正...
admin 2026-02-15 106浏览
GLM-5开源即登顶,国产大模型迎来真实突破 2026年开年,国产大模型迎来一次不靠宣传、靠实绩的突破——智谱AI正式开源GLM-5,短短两周内,就在全球权威AI评估平台Artificial Analysis上冲...