00:00 / 05:12
连播
清屏
智能
倍速
点赞7
DeepSeek开源IMO金牌AI硬刚Gemini和Gpt #DeepSeek 开源IMO金牌AI “正面硬刚” 谷歌的Gemini和OpenAI的GPT DeepSeekMath-V2成全球首个开源IMO金牌AI,破解5题夺冠,CMO、Putnam成绩碾压人类顶尖选手。三位一体自验证架构实现推理范式转变,几何等领域远超GPT-5和Gemini,开源为AGI研究提供新范式。 #DeepSeekMathV2 成为全球首个斩获国际数学奥林匹克(IMO)金牌的开源 AI 模型,在 2025 年 IMO 竞赛中成功破解 6 道题中的 5 道,同时在中国数学奥林匹克(CMO 2024)中也达到金牌水平。其在普特南数学竞赛(Putnam 2024)中更是以 118 分的成绩刷新纪录,超越人类参赛者 90 分的历史最高分。 该模型核心突破在于创新的「生成 - 验证 - 元验证」三位一体自验证系统。证明生成器负责解题并标注不确定步骤,验证器对证明逻辑严谨性打分(0 - 1 分),元验证器则审计验证器准确性,将验证质量分数提升至 0.96。这种架构使 AI 具备自我反思能力,在 CNML 测试集几何题中斩获 92 分,远超 Gemini 的 35 分。 为攻克顶级难题,DeepSeek 采用高算力策略:每道题生成 64 个候选证明,经 64 次独立验证筛选最优解。论文与代码已完全开源(github.deepseek - ai/DeepSeek - Math - V2),不仅打破谷歌在数学推理领域的技术垄断,更为 AGI 研究提供可复现的严谨推理范式,标志着开源模型正式进入顶级数学推理竞技场。
00:00 / 11:37
连播
清屏
智能
倍速
点赞8
00:00 / 01:51
连播
清屏
智能
倍速
点赞33
00:00 / 02:56
连播
清屏
智能
倍速
点赞308
00:00 / 10:54
连播
清屏
智能
倍速
点赞1
00:00 / 00:38
连播
清屏
智能
倍速
点赞1797
00:00 / 00:15
连播
清屏
智能
倍速
点赞19
00:00 / 06:02
连播
清屏
智能
倍速
点赞4
00:00 / 01:19
连播
清屏
智能
倍速
点赞5