00:00 / 01:16
连播
清屏
智能
倍速
点赞14
00:00 / 00:21
连播
清屏
智能
倍速
点赞67
00:00 / 00:15
连播
清屏
智能
倍速
点赞53
00:00 / 02:27
连播
清屏
智能
倍速
点赞365
00:00 / 00:15
连播
清屏
智能
倍速
点赞14
00:00 / 06:57
连播
清屏
智能
倍速
点赞141
00:00 / 01:23
连播
清屏
智能
倍速
点赞161
00:00 / 01:49
连播
清屏
智能
倍速
点赞360
00:00 / 00:09
连播
清屏
智能
倍速
点赞149
00:00 / 00:15
连播
清屏
智能
倍速
点赞81
00:00 / 00:34
连播
清屏
智能
倍速
点赞37
Qiuming6天前
谷歌Gemini 3实力霸榜,陶哲轩亲测十分钟破解数学难题 谷歌新一代大模型Gemini 3近日发布,迅速在数学和物理领域的顶级基准测试中登顶,展现出强大的推理能力。 在权威的FrontierMath数学基准测试中,Gemini 3 Pro刷新了纪录,其综合能力指数也超越了此前领先的GPT-5.1。该测试由职业数学家设计,包含大量高难度原创题目,是衡量AI高端数学能力的“试金石”。 除了优异的“跑分”成绩,Gemini 3在实际应用中也证明了其价值。著名数学家陶哲轩表示,他利用Gemini的DeepThink模式,仅花费约十分钟便找到了一道百年数学难题——埃尔德什问题#367的关键证明思路。这表明,AI正成为顶尖科学家研究中高效的“超级合作者”。 同时,Gemini 3在一项名为CritPt的新型物理研究基准测试中也位居榜首。该测试模拟真实的前沿物理研究过程,旨在评估AI是否具备像物理学家一样进行复杂推理的能力。 尽管成绩亮眼,但Gemini 3在CritPt测试中的准确率仍不足10%,这说明AI在科学推理上仍有很长的路要走。然而,它已经清晰地预示了一个人机协作、加速科研的新未来。 https://x.com/EpochAIResearch/status/1991945942174761050 https://x.com/ArtificialAnlys/status/1991913465968222555?s=20 https://x.com/kimmonismus/status/1991968861747339508?s=20 https://mathstodon.xyz/@tao/115591487350860999 https://mathstodon.xyz/@tao/115585571504291318 https://www.kaggle.com/competitions/ai-mathematical-olympiad-progress-prize-3/overview
00:00 / 04:47
连播
清屏
智能
倍速
点赞0
00:00 / 01:41
连播
清屏
智能
倍速
点赞1
00:00 / 04:12
连播
清屏
智能
倍速
点赞72
00:00 / 03:30
连播
清屏
智能
倍速
点赞36