Deepmind人工智慧系统在2024国际数学奥林匹亚竞赛达银牌标準

DeepMind展示了其在数学领域最新的人工智慧研究，透过结合AlphaProof与AlphaGeometry 2两个系统，解决了2024年国际数学奥林匹亚竞赛（IMO）6道数学难题中的4道题目，达到了与银牌得主一样的水準。

由于推理技能和训练资料的限制，目前人工智慧系统仍然苦手于解决一般数学问题，而拥有先进数学推理能力的通用人工智慧，将有助于发展尖端科学和科技。DeepMind在2024年初的时候，于《自然》期刊发表了能够解决数学难题的人工智慧模型AlphaGeometry。AlphaGeometry是一个以Gemini语言模型为基础的神经符号（Neuro-Symbolic）混合系统，透过结合神经网路和符号推理人工智慧技术，解决几何和数学複杂问题。

DeepMind持续推进在数学领域的人工智慧研究，并透过整合AlphaProof和第二代AlphaGeometry，在2024年国际数学奥林匹亚竞赛解题中表现优异。

AlphaProof是一个自训练并使用形式语言（Formal Language）Lean证明数学陈述的系统，其结合了预训练语言模型和AlphaZero增强学习演算法。在数学推理任务中，AlphaProof执行自动化证明，生成解答候选方案，并且透过在Lean语言中搜寻可能的证明步骤，来证明或是反驳这些方案。AlphaProof透过每次成功找到并验证的证明，来持续强化自身能力，以解决更具挑战的数学问题。

AlphaGeometry 2则是AlphaGeometry的改良版本，其符号引擎比第一代快两个数量级，面对新问题的时候，AlphaGeometry 2能够採用新的知识共享机制，实现不同搜寻树的进阶组合，解决更複杂的问题。AlphaGeometry能够解决IMO 25年历史考题中的53%，而AlphaGeometry 2能力大幅提升，可以解决其中的83％。

IMO 2024的题目被手动翻译，以形式化语言Lean表示，提供给DeepMind的人工智慧系统。该系统耗时三天解出其中4道题目，AlphaProof解决了两个代数问题和一个数论问题，其中有一道是今年最难的题目，所有参赛者仅有5名答对，而AlphaGeometry 2则证明了一道几何问题，但有两个组合数学题目没有解决。

每道题目答对可得7分，而今年IMO金牌门槛分数为29分，有58位参赛者达成，而DeepMind的人工智慧系统则得到28分，每个解决的问题都拿到满分。在正式比赛共有两节解题时间，每节4.5小时总共9小时，人工智慧系统则花费了三天的时间解出4题。

CB科技站

Deepmind人工智慧系统在2024国际数学奥林匹亚竞赛达银牌标準

与本文相关的文章