最新消息:关注人工智能 AI赋能新媒体运营

Deepmind人工智慧系统在2024国际数学奥林匹亚竞赛达银牌标準

科技智能 admin 浏览 评论

DeepMind展示了其在数学领域最新的人工智慧研究,透过结合AlphaProof与AlphaGeometry 2两个系统,解决了2024年国际数学奥林匹亚竞赛(IMO)6道数学难题中的4道题目,达到了与银牌得主一样的水準。

由于推理技能和训练资料的限制,目前人工智慧系统仍然苦手于解决一般数学问题,而拥有先进数学推理能力的通用人工智慧,将有助于发展尖端科学和科技。DeepMind在2024年初的时候,于《自然》期刊发表了能够解决数学难题的人工智慧模型AlphaGeometry。AlphaGeometry是一个以Gemini语言模型为基础的神经符号(Neuro-Symbolic)混合系统,透过结合神经网路和符号推理人工智慧技术,解决几何和数学複杂问题。

DeepMind持续推进在数学领域的人工智慧研究,并透过整合AlphaProof和第二代AlphaGeometry,在2024年国际数学奥林匹亚竞赛解题中表现优异。

AlphaProof是一个自训练并使用形式语言(Formal Language)Lean证明数学陈述的系统,其结合了预训练语言模型和AlphaZero增强学习演算法。在数学推理任务中,AlphaProof执行自动化证明,生成解答候选方案,并且透过在Lean语言中搜寻可能的证明步骤,来证明或是反驳这些方案。AlphaProof透过每次成功找到并验证的证明,来持续强化自身能力,以解决更具挑战的数学问题。

AlphaGeometry 2则是AlphaGeometry的改良版本,其符号引擎比第一代快两个数量级,面对新问题的时候,AlphaGeometry 2能够採用新的知识共享机制,实现不同搜寻树的进阶组合,解决更複杂的问题。AlphaGeometry能够解决IMO 25年历史考题中的53%,而AlphaGeometry 2能力大幅提升,可以解决其中的83%。

IMO 2024的题目被手动翻译,以形式化语言Lean表示,提供给DeepMind的人工智慧系统。该系统耗时三天解出其中4道题目,AlphaProof解决了两个代数问题和一个数论问题,其中有一道是今年最难的题目,所有参赛者仅有5名答对,而AlphaGeometry 2则证明了一道几何问题,但有两个组合数学题目没有解决。

每道题目答对可得7分,而今年IMO金牌门槛分数为29分,有58位参赛者达成,而DeepMind的人工智慧系统则得到28分,每个解决的问题都拿到满分。在正式比赛共有两节解题时间,每节4.5小时总共9小时,人工智慧系统则花费了三天的时间解出4题。

发表我的评论
取消评论

表情

您的回复是我们的动力!

  • 昵称 (必填)
  • 验证码 点击我更换图片

网友最新评论