粉丝3.3万获赞32.4万


谷歌 gemini 三深度思考版本重大升级,而且它悄然降临! 那么就在四天前啊,谷歌就悄无声息地对 gemini 三的深度思考的版本进行了重大升级。但是非常令人奇怪的是啊,这么重大的新闻啊,其实主流媒体啊,竟然集体失声, 是因为他不够强吗?不,其实他已经强到让人有点害怕,因为他是一个专门为了突破人类智力极限,为了解决物理化学工程领域最顶尖的难题而生的那个数字大脑。 谷歌这次非常的低调,但数据不会撒谎,在被称之为人类最后的考试的榜单上, gemini 三 deep sink, 也就是深度思考版本,彻底杀疯了。 那么这个榜单是干什么用的呢?它是专门测试 ai 纯靠脑子硬算物理数学和逻辑难题的能力。结果呢,它不仅碾压了刚发布不到一周的 cloud 四 opus, 甚至还拉开了百分之八的那样的待查。 而且啊,在 arc agi 这个测试基准上,他也是遥遥领先,您可以看上图啊,提高了真的一大一大截啊!我个人觉得,为什么好多博主和主流的媒体都没有说这个事,这个绝对是一个大新闻啊, 那么这意味着什么呢?这意味着在纯粹的理性的思维领域啊, ai 现在正在以模仿人类,其实他开始进化了,那么目标非常明确,就是超越人类。 那咱们今天啊,就用这个短视频来深入的解析一下谷歌的 gemini 三深度思考版本的核心能力。 一、降维打击程序员的黄昏,是这样吗?如果说考试只是热身,那么在 code forces 上的表现,那真的就是一个神迹。 程序员朋友们可能都知道, code forces 是 全球最顶尖的算法竞赛的平台,普通人啊,一千两百分是入门,一千九百分就是职业高手了。 而将近三千五百分是个什么概念?那是人类历史上的顶级的天才才能触摸到的神一般的领域啊。 那么这面临三 deepthink 跑出了多少分呢?三千四百五十五分,这个分数就意味着,在全世界数百万竞技的程序员之中,他已经排到了全球第八, 只有七个活生生的人类现在能赢过他,他不是在写代码,他是在解决复杂的动态规划、图论、数论和组合的数学难题。 更恐怖的是啊,他和之前的 open a i o 三相比,整整拉开了一千一百分的差距,这已经不能说是叫进步了,这可能真的可以称之为是物种层面的进化了 那种啊,从这个逻辑底层进行的多不思迭代的思考,让他彻底的告别了那种东拼西凑答案这样的时代了。 二、不仅仅是思考,它有了什么呢?视觉驱动的灵魂。那么很多人啊,就会问,这种深度思考是不是只对数字它非常敏感呢? 那么看一下 mmu pro 这个视觉理解的榜单,以前啊, ai 看到的是,呃,看到复杂的电路图啊,直方图或者是医学影像,一旦感知层出错,那么你的大脑再强也是白搭的。 但 jvm 三 deep sync 就 引入了一个扩展思维链的技术,它不再是看一眼就给答案,而是在脑子里反复的推演。哎,这个像素点为什么在这里?这个电路的走向符合逻辑吗?它走向哪里呢?我去看,再看一眼。 它会不断地自我怀疑,自我修正,在视力和这个逻辑上边不断地修正。 虽然在纯视觉上的提升看似好像没有数学那么夸张,但是这种感知加推理的结合 能够让他理解人类最隐晦的那种工程图纸。这就意味着他已经具备了进入实验室,进入工厂,进入精密制造领域的基础。 三、科学界的数字同事,他已经上线了,让咱们来看一看他在现实的世界里都做了些什么吧。这真的是让我最吃惊的地方啊,咱们举几个例子。第一个例子就是他是数学家的纠错官。 那么罗格斯大学的数学家 lisa carbon, 哎,他是个教授,研究的是爱因斯坦的相对论和量子力学的统一。 他的一篇这个研究了好几年的论文经过了同行审,准备发表。那么就在发表前临门一脚的时候,他很偶然的就把论文喂给了这个 gemini。 三、 deep think。 结果 ai 直接指出第四点,二个命题是错的,并且给出了三个无可辩驳的理由。 教授当时都懵逼了,因为这超出了他的思维范式。最后他承认 ai 是 对的,他像一个从不睡觉,永不出错的顶级的数学同事。 那么第二个例子,他是半导体开发的炼金术士。那么王氏实验室啊,想生长出一百微米级的那种二维半导体的晶体,这在以前是需要专家花几个月去调试气体的流量和温度的。 那么 deepthink 给出了一个完美的方案,结果长出了一百三十微米的晶体,这是该实验室的历史最佳记录,它不仅给出了结果,还给了给出了完整的物理的热力学的模型。 第三个例子,他是从草图到实物的造物主,他能够把一张手绘的简陋的草图直接转化成为可以三 d 打印的具备立学结构的 stl, 也就是光固化立体造型。啊, 这样的方法啊,的工业模型,他懂材料,懂立学,懂设计,哇,这个非常可怕啊! 四、阿尔西亚自主研究的开端如果上面您听我说完,您感觉还不够震撼,那请您记住这个名字,阿尔西亚。 这是谷歌在 deep think 的 基础上构建的 ai 研究的智能题,它不仅仅是工具,它更是同事,它能够自主选择课题,自主查验材料,自主推演,然后自主写出一篇完整的学术论文,全程零人类的干预。 目前这篇论文已经提交给了正式的学术刊刊。不仅如此啊,他还对对着这个数学界著名的这个埃尔多斯猜想发起了冲锋。七百个困扰人类几十年的难题,他一口气自主解决了四个, 其中一个难题的解决方法直接启发了人类数学家团队发表了更深层次的研究成果。 那么谷歌给 ai 的 贡献分了等级,目前 ai 已经填满了 level 零,也就是这个零级和 level 二,也就是二级,二级指的就是既可发表的研究水平了。 虽一点啊, ai 现在还没有搞出办法来能够治愈癌症,也没有能够解决千禧年的那个数学难题。 但你看这个增长曲线,二零二五年的七月到二零二六年的二月,仅仅半年,他就在数学这个奥数级别的准确率就从百分就从百分之六十五飙升到了百分之九十以上啊。 您要关注的一定是这个斜率,这个速度,就像安德烈卡帕西所说的那样,不要关心你现在所处的那个点,你要关心你现在这个点的斜率。 咱们也总结一下吧,这就是我们所处的时代。以前我们觉得 ai 是 搜索引擎的升级版,后来啊,觉得他是效率工具,但今天他已经离开了我们这些普通人。正是啊,正正式式的成为了科学研究的领航员, 他不再是暴力破解,他是在学习如何思考,他不追求速度,他追求真理。当一个能够二十四小时不停歇的思考量子力学,寻找新型的超导材料来推演宇宙终极公式的智能体出现的时候, 人类的角色正在发生根本性的转变。我们啊,可能就是站在知识大爆炸的前沿,这场竞赛没有终点,而谷歌刚刚把这个起跑线又向前推进了一公里, 推进了六公里。为什么是六公里呢?因为我刚跑完六公里。那么问题来了啊,如果 ai 能够做 phd, 也就是博士的工作,我们人类未来的教育该走向何方呢? 我没有答案,但这绝对是一个大问题,这绝对是一个好问题,绝对值得天下所有的父母好好思考一下。

据鹿特社报道,德国数据保护专员梅克坎普二十七号在一份声明中声称,以要求苹果和谷歌公司从其在德国的应用商店下架中国初创公司自主研发的人工智能大语言模型深度求索,也就是 dipse 的应用, 理由是所谓数据安全担忧。对于部分国家泛化国家安全概念、将经贸科技问题政治化的做法,中方此前已多次明确表示反对。 坎普指控 depsek 非法将用户个人数据传输至中国,并声称苹果与谷歌需尽快审查这一要求,并决定是否在德国封禁该应用,但没有设定具体的处理实现。

六月二十二号,有网友在社交平台发帖称自己在使用 divesic 人工智能大模型查找资料时, divesic 输出了一个并不存在的科研结果,并且编造了科研团队、科研细节和商业化进展。 这名网友在向科研院所求证无果后,选择了向 dipstick 反馈错误。随后, dipstick 模型在回答中进行了纠错和致歉,并表示 立即停用错误信息,同时提出将补偿该网友三千元人民币。六月二十三号,该网友告诉记者,这三千元人民币自己并没有收到,并表示 tipsik 模型反馈的补偿措施可能又是一条错误信息。 tipsick 官网的用户协议中规定,本软件的输出不应成为您进一步作为或不作为的依据。 您根据输出的内容所做出的任何判断或者句子做出的后续相关操作行为所带来的后果和责任,均由您自行承担。随后,记者通过电子邮件向 bixic 平台进行了求证,但截止到发稿时,对方尚未回应。