ARC-AGI-3互动推理基准上线,人类可全解但主流AI得分却不到1%
admin 2026-03-27 86浏览
ARC Prize基金会发布ARC-AGI系列首个交互式推理基准ARC-AGI-3 与前两代以静态题目为主的设计不同,ARC-AGI-3采用陌生的回合制环境,测试AI代理系统在交互过程中的探索能力、目标判断、环境...
admin 2026-03-27 86浏览
ARC Prize基金会发布ARC-AGI系列首个交互式推理基准ARC-AGI-3 与前两代以静态题目为主的设计不同,ARC-AGI-3采用陌生的回合制环境,测试AI代理系统在交互过程中的探索能力、目标判断、环境...