00:00 / 00:50
连播
清屏
智能
倍速
点赞42
00:00 / 03:21
连播
清屏
智能
倍速
点赞101
00:00 / 01:15
连播
清屏
智能
倍速
点赞39
00:00 / 03:08
连播
清屏
智能
倍速
点赞11
00:00 / 01:47
连播
清屏
智能
倍速
点赞0
DeepSeek突然开源数学推理模型Math-V2 2025年11月27日,#DeepSeek 突然开源数学推理模型 #DeepSeekMathV2 以6850亿参数量刷新全球数学AI标杆。该模型不仅是首个达到国际奥数(IMO)金牌水平的开源系统,更在权威基准 IMO-ProofBench 中实现突破:Basic子集正确率高达99%(领先谷歌Gemini DeepThink 10个百分点),Advanced子集达61.9%,并在真实竞赛如Putnam考试斩获118分(满分120)。 其核心突破在于首创 「自验证机制」。传统模型依赖“答案对错”训练,易出现“过程错误但答案碰巧正确”的漏洞。Math-V2 则通过双重架构解决此问题: 验证器:实时检查推理链条的逻辑严谨性 生成器:基于验证反馈主动修正漏洞 更创新的是“扩展验证算力”技术,使模型能自主标注复杂样本迭代升级,形成能力进化闭环。 这一机制让 Math-V2 在无标准答案的开放问题中展现潜力。正如其技术论文《迈向可自验证的数学推理》所强调:数学AI的未来在于过程严谨性,而非结果投机性。模型在IMO 2025、CMO 2024等竞赛的金牌表现,证明其定理证明能力已超越依赖题库训练的传统方法。 开源后引发全球轰动。Reddit开发者称“DeepSeek这头鲸鱼终于回归”,知乎业内人士评价“数学推理团队是中国AI最王牌的力量”。随着模型代码与论文同步公开,数学AI研究正式进入“可自验证”新纪元,为攻克开放性数学难题铺平道路。
00:00 / 08:30
连播
清屏
智能
倍速
点赞12
00:00 / 00:29
连播
清屏
智能
倍速
点赞529