00:00 / 01:38
连播
清屏
智能
倍速
点赞31
00:00 / 01:09
连播
清屏
智能
倍速
点赞3
当Gemini、Qwen接连放出大招,在AI圈掀起一波又一波热度时,你是不是也和网友一样好奇:曾经的实力选手DeepSeek,怎么悄悄“隐身”了?别急,它带着王炸回来了!就在刚刚,DeepSeek在HuggingFace正式发布并开源了全新数学推理模型DeepSeekMath-V2,足足搭载了六百八十五亿参数,这波憋的大招也太让人惊喜了吧! 你可能会问,六百八十五亿参数的模型到底有多能打?答案绝对超出你的预期!论文显示,这款基于DeepSeek-V3.2-Exp-Base开发的模型,在国际数学奥林匹克竞赛(IMO)2025、中国数学奥林匹克竞赛(CMO)2024等顶级赛事中直接拿下金牌水平,更创造历史成为首个IMO金奖级别的开源模型!要知道,IMO可是全球最顶尖的中学生数学竞赛,能入选国家队的选手都是从全国千万考生中挑出的6位精英,含金量堪比数学界的“奥运金牌”;而CMO作为中国最高级别数学竞赛,题目难度甚至超过IMO,能在这里夺金的都是数学界的“少年天才” 。 更炸裂的还在后面!在美国普特南数学竞赛中,DeepSeekMath-V2狂揽一百一十八分,要知道这门竞赛满分才一百二十分,而人类参赛者的最高分仅为九十分!可能你对这个成绩没概念,给大家科普下:普特南是公认的“地狱级”本科数学竞赛,自1938年举办以来只有五人拿过满分,平均得分常年在零分或一分徘徊,就算是美国顶尖大学的数学尖子生,能考四十分就稳居前百分之一了 。AI比人类顶尖选手还多考二十八分,这实力是不是刷新了你对AI数学能力的认知? 能取得这么逆天的成绩,DeepSeek团队到底藏了什么秘诀?关键在于他们找到了全新方向——让AI不仅会做题,还会“自我纠错”!具体来说,团队先训练了一个“评判员”模型,专门挑证明过程中的漏洞和不严谨之处;再让“答题者”模型根据这些反馈反复修改,直到“评判员”挑不出任何毛病为止。这就像咱们做题时,既有顶尖老师批改把关,又能反复打磨过程,最后得出的答案自然又准又严谨,而不是靠运气蒙对的。这种“自查自纠”的能力,也让AI在处理复杂数学问题时,可靠性直接上了一个大台阶。 #deepseek数学 #deepseek概念 #deepseek最新 #昆仑万维
00:00 / 02:32
连播
清屏
智能
倍速
点赞399
00:00 / 00:27
连播
清屏
智能
倍速
点赞3298
00:00 / 00:49
连播
清屏
智能
倍速
点赞6