Qiuming2月前
谷歌DeepMind研发的AI智能体Aletheia 近日,谷歌DeepMind研发的AI智能体Aletheia在数学界顶级挑战赛“FirstProof”中一鸣惊人,凭借完全自主的推理能力,成功解决了10道公认的极难数学问题中的6道。DeepMind高管Thang Luong表示,这一成就的意义甚至超过了去年AI获得国际数学奥林匹克(IMO)金牌的历史性时刻,因为它标志着AI已经能够胜任博士级别的纯粹数学研究。 Aletheia的核心突破在于其“自我过滤”机制。它内部设有“生成者”和“验证者”两个子系统,通过不断自我博弈来避免AI常见的“幻觉”问题。在解题过程中,对于无法确定的题目,Aletheia会坦率地表示“未找到解法”,而不是胡乱编造答案,这种严谨性赢得了顶尖学者的信任。 本次被攻克的第7题尤其震撼。这道困扰数学界数年的代数拓扑难题,不仅被Aletheia成功解答,其解题过程更得到了原提出者的亲自认证。Aletheia投入了前所未有的16倍算力,巧妙地运用了多个深奥的数学定理,展现出了惊人的逻辑串联能力。 菲尔兹奖得主、著名数学家陶哲轩在最新访谈中将AI定位为自己的“初级合著者”。他指出,AI正引领数学研究从传统的“个案研究”转向“大样本普查”,它能不知疲倦地处理人类望而却步的繁琐推演,并系统性地扫描海量问题,从中寻找突破口。 随着FrontierMath等基准测试题库被AI快速“刷穿”,以及FirstProof挑战赛的成功,人类正面临一个紧迫的问题:出题的速度已经快跟不上AI答题的速度。为了继续检验AI的极限,Epoch AI已推出包含真正未解之谜的“Open Problems”题库,而FirstProof团队也宣布将于3月14日启动难度更高的第二轮挑战。人类数学的最后一道防线还能守多久,答案或许很快就会揭晓。 https://x.com/rohanpaul_ai/status/2026559039241597070?s=20 https://www.theatlantic.com/technology/2026/02/ai-math-terrance-tao/686107/
00:00 / 03:56
连播
清屏
智能
倍速
点赞9
00:00 / 00:28
连播
清屏
智能
倍速
点赞73
00:00 / 00:22
连播
清屏
智能
倍速
点赞0