谷歌 jimmy 上线思考强度调节功能,大模型交互迎来全新模式大家好,我是徐吴,专注 ai 前沿动态。五月十八日最新消息,谷歌在 i o 大 会前夕为 jimmy 推送重磅更新,上线独特的思维等级调节功能,提供标准和增强两种推理模式,用户可以根据不同需求,自主控制 ai 的 思考深度,简单问题快速回答,复杂分析深度思考。 同时, gemini 还接入了 github、 spotify、 whatsapp 等多款主流第三方软件,覆盖办公、生活、餐饮等多元场景。这标志着大模型正在从统一输出向个性化定制方向进化。你觉得这种可调节思考强度的功能会成为未来大模型的标配吗?关注徐无 ai 前沿说,带你吃透 ai 时代的每一个机会!
粉丝60获赞117

别再把 gemini 当百度用了,这三个真相能让你甩开百分之九十的人,尤其是最后一个,绝对颠覆你的认知!真相一,别让 ai 烧脑过度, 别再只知道按回车了! gemini 的 thinking level 功能能像汽车油门一样,精准控制 ai 的 思考深度,问问天气就调低,写商业计划书就拉满。 你掌握的不是一个聊天框,而是一个随叫随到、拥有一百万 tokens 上下文的庞大外脑。 真相二,告别无休止的对话黑洞!别再用聊天的思维去用了,赶紧切到 canvas 模式,它会变成一块可以随时微操的无线白板。如果需要更硬核的,就用 deep research 功能,哪怕你还在睡觉,它也能自己翻遍网页和数据库,自动生成带有专业图标的深度报告。 真相三,让他替你动手 gemini 不 仅能回答问题,更是能跨应用帮你干活的 ai 智能管家。它能理解屏幕内容,指挥 gmail 或浏览器帮你自动预定填表。同时, personalization 功能让他能学习你的偏好,为你制定专属的食谱或训练计划。 好了,兄弟们,这三个真相只是冰山一角,快去试试把它们组合起来用!你手里就握着一个能思考、能创造、还能操控数字世界的神器!

怎么用上洁面奶?我给你一个简单实操的方法,只需要三步让你搞懂。第一步,打开豆包勾选,深度思考输入 如何在国内用上洁面奶,而且帮我考虑到地区、网络还有账号的各种限制,我是一个智障,请一步一步的教我。第三,根据豆包的回答, 选择你想要的方式,追问豆包把地多少多少点,展开详细讲讲,你一定可以用得上,快去。

jama 奶它比国内大模型强很多的一个点就在于就是它会引导你去思考,就是很多人他根本不会问问题,或者他不知道自己有什么漏洞,那你只能问出你认知以内的问题吗?它有个很厉害的解释,它会引导你思考。 比如说你问了他这个之后,他就会反问你,因为你想想像豆包啊 davidson 有 个大问题,就是你问完他答完 ok 就 没了。你问他健身减脂餐,他就只回答你这个,但他不会引导出一些更深层你没想过的问题。 对面的你问他健身餐,他可能就会跟你说,啊,那我给你这份健身餐,但是这份健身餐你平时是工作,就是你时间是充裕的,还是说你时间很忙碌的,那你平时是怎么样一个生活习惯?要不要我再去帮你去调整?这份食谱 会更加适合你的一个工作,或者适合你的生活习惯。然后他又会再会提醒你,他说除了这个减脂餐之外,就是你的力量训练,还或者说你的睡,睡眠也要弄得很好,你看他会引导你另外要注意的点。

谷歌 gemini 三深度思考版本重大升级,而且它悄然降临! 那么就在四天前啊,谷歌就悄无声息地对 gemini 三的深度思考的版本进行了重大升级。但是非常令人奇怪的是啊,这么重大的新闻啊,其实主流媒体啊,竟然集体失声, 是因为他不够强吗?不,其实他已经强到让人有点害怕,因为他是一个专门为了突破人类智力极限,为了解决物理化学工程领域最顶尖的难题而生的那个数字大脑。 谷歌这次非常的低调,但数据不会撒谎,在被称之为人类最后的考试的榜单上, gemini 三 deep sink, 也就是深度思考版本,彻底杀疯了。 那么这个榜单是干什么用的呢?它是专门测试 ai 纯靠脑子硬算物理数学和逻辑难题的能力。结果呢,它不仅碾压了刚发布不到一周的 cloud 四 opus, 甚至还拉开了百分之八的那样的待查。 而且啊,在 arc agi 这个测试基准上,他也是遥遥领先,您可以看上图啊,提高了真的一大一大截啊!我个人觉得,为什么好多博主和主流的媒体都没有说这个事,这个绝对是一个大新闻啊, 那么这意味着什么呢?这意味着在纯粹的理性的思维领域啊, ai 现在正在以模仿人类,其实他开始进化了,那么目标非常明确,就是超越人类。 那咱们今天啊,就用这个短视频来深入的解析一下谷歌的 gemini 三深度思考版本的核心能力。 一、降维打击程序员的黄昏,是这样吗?如果说考试只是热身,那么在 code forces 上的表现,那真的就是一个神迹。 程序员朋友们可能都知道, code forces 是 全球最顶尖的算法竞赛的平台,普通人啊,一千两百分是入门,一千九百分就是职业高手了。 而将近三千五百分是个什么概念?那是人类历史上的顶级的天才才能触摸到的神一般的领域啊。 那么这面临三 deepthink 跑出了多少分呢?三千四百五十五分,这个分数就意味着,在全世界数百万竞技的程序员之中,他已经排到了全球第八, 只有七个活生生的人类现在能赢过他,他不是在写代码,他是在解决复杂的动态规划、图论、数论和组合的数学难题。 更恐怖的是啊,他和之前的 open a i o 三相比,整整拉开了一千一百分的差距,这已经不能说是叫进步了,这可能真的可以称之为是物种层面的进化了 那种啊,从这个逻辑底层进行的多不思迭代的思考,让他彻底的告别了那种东拼西凑答案这样的时代了。 二、不仅仅是思考,它有了什么呢?视觉驱动的灵魂。那么很多人啊,就会问,这种深度思考是不是只对数字它非常敏感呢? 那么看一下 mmu pro 这个视觉理解的榜单,以前啊, ai 看到的是,呃,看到复杂的电路图啊,直方图或者是医学影像,一旦感知层出错,那么你的大脑再强也是白搭的。 但 jvm 三 deep sync 就 引入了一个扩展思维链的技术,它不再是看一眼就给答案,而是在脑子里反复的推演。哎,这个像素点为什么在这里?这个电路的走向符合逻辑吗?它走向哪里呢?我去看,再看一眼。 它会不断地自我怀疑,自我修正,在视力和这个逻辑上边不断地修正。 虽然在纯视觉上的提升看似好像没有数学那么夸张,但是这种感知加推理的结合 能够让他理解人类最隐晦的那种工程图纸。这就意味着他已经具备了进入实验室,进入工厂,进入精密制造领域的基础。 三、科学界的数字同事,他已经上线了,让咱们来看一看他在现实的世界里都做了些什么吧。这真的是让我最吃惊的地方啊,咱们举几个例子。第一个例子就是他是数学家的纠错官。 那么罗格斯大学的数学家 lisa carbon, 哎,他是个教授,研究的是爱因斯坦的相对论和量子力学的统一。 他的一篇这个研究了好几年的论文经过了同行审,准备发表。那么就在发表前临门一脚的时候,他很偶然的就把论文喂给了这个 gemini。 三、 deep think。 结果 ai 直接指出第四点,二个命题是错的,并且给出了三个无可辩驳的理由。 教授当时都懵逼了,因为这超出了他的思维范式。最后他承认 ai 是 对的,他像一个从不睡觉,永不出错的顶级的数学同事。 那么第二个例子,他是半导体开发的炼金术士。那么王氏实验室啊,想生长出一百微米级的那种二维半导体的晶体,这在以前是需要专家花几个月去调试气体的流量和温度的。 那么 deepthink 给出了一个完美的方案,结果长出了一百三十微米的晶体,这是该实验室的历史最佳记录,它不仅给出了结果,还给了给出了完整的物理的热力学的模型。 第三个例子,他是从草图到实物的造物主,他能够把一张手绘的简陋的草图直接转化成为可以三 d 打印的具备立学结构的 stl, 也就是光固化立体造型。啊, 这样的方法啊,的工业模型,他懂材料,懂立学,懂设计,哇,这个非常可怕啊! 四、阿尔西亚自主研究的开端如果上面您听我说完,您感觉还不够震撼,那请您记住这个名字,阿尔西亚。 这是谷歌在 deep think 的 基础上构建的 ai 研究的智能题,它不仅仅是工具,它更是同事,它能够自主选择课题,自主查验材料,自主推演,然后自主写出一篇完整的学术论文,全程零人类的干预。 目前这篇论文已经提交给了正式的学术刊刊。不仅如此啊,他还对对着这个数学界著名的这个埃尔多斯猜想发起了冲锋。七百个困扰人类几十年的难题,他一口气自主解决了四个, 其中一个难题的解决方法直接启发了人类数学家团队发表了更深层次的研究成果。 那么谷歌给 ai 的 贡献分了等级,目前 ai 已经填满了 level 零,也就是这个零级和 level 二,也就是二级,二级指的就是既可发表的研究水平了。 虽一点啊, ai 现在还没有搞出办法来能够治愈癌症,也没有能够解决千禧年的那个数学难题。 但你看这个增长曲线,二零二五年的七月到二零二六年的二月,仅仅半年,他就在数学这个奥数级别的准确率就从百分就从百分之六十五飙升到了百分之九十以上啊。 您要关注的一定是这个斜率,这个速度,就像安德烈卡帕西所说的那样,不要关心你现在所处的那个点,你要关心你现在这个点的斜率。 咱们也总结一下吧,这就是我们所处的时代。以前我们觉得 ai 是 搜索引擎的升级版,后来啊,觉得他是效率工具,但今天他已经离开了我们这些普通人。正是啊,正正式式的成为了科学研究的领航员, 他不再是暴力破解,他是在学习如何思考,他不追求速度,他追求真理。当一个能够二十四小时不停歇的思考量子力学,寻找新型的超导材料来推演宇宙终极公式的智能体出现的时候, 人类的角色正在发生根本性的转变。我们啊,可能就是站在知识大爆炸的前沿,这场竞赛没有终点,而谷歌刚刚把这个起跑线又向前推进了一公里, 推进了六公里。为什么是六公里呢?因为我刚跑完六公里。那么问题来了啊,如果 ai 能够做 phd, 也就是博士的工作,我们人类未来的教育该走向何方呢? 我没有答案,但这绝对是一个大问题,这绝对是一个好问题,绝对值得天下所有的父母好好思考一下。

很多人还在问怎么用上 jimmy, 我 给你一个简单的实操方法,只需要三步让你搞懂。 第一步,打开豆包勾选,深度思考输入如何在国内用上 jimmy, 而且帮我考虑到地区、网络还有各种账号的限制,我是一个智障,请一步一步教我。第三,根据豆包的回答,选择你想要的方式, 追问豆包把地多少多少点,展开详细说说,你一定可以用得上,快去!

google 刚刚扔出一个重磅消息, gemini 三点五 flash 正式上线,直接成为 google gemini 应用和搜索 ai mod 的 默认模型。官方表示, 它在代码和 aaa 整值任务上已经超过上一代 gemini 三点一 pro 速度能达到部分前沿模型的四倍,而运行成本不到一半。最关键的不是性能数字,而是方向变了。简单说, 以前 ai 只是告诉你怎么做,现在它能自己查资料,调用工具,写代码,执行任务。 google 还确认下个月将发布 jamni 三点五 pro, 主要负责思考和调度,把具体任务交给 flash 去执行。 ai 竞争正在从谁更会聊天变成谁更会干活。问题来了,如果 ai 真变成数字员工,你觉得最先改变的会是什么行业?

一定要,一定要想办法尽快去用上谷歌 gmail。 我 不是在给你推荐一个工具,我是在跟你说一句非常现实的话,就是在这个时代,真正拉开普通人差距的东西,已经不是什么努力不努力,而是你有没有有一个 长期为你服务的顶级 ai。 我 已经深度使用 gmail 差不多一个多月的时间。说实话,最让我背后发凉的,根本不是他能生成图片,能够帮我写代码,能够总结视频内容, 而是我突然发现一件事情,他真的是在记住我。他不是记住我问了什么问题,而是在慢慢记住我这个人是怎么工作的,怎么去拆解思考问题的。当你每次跟他去聊项目进展, 聊你在这个项目中纠结的点是什么,聊你为什么在这个地方产生了犹豫,在那个地方又特别果断下决定,他都会一点一点存下来,用到后面,你甚至都不用再解释背景,他就已经知道你现在想要的到底是哪一种答案。 那种感觉就很奇怪,就好像你突然多了一个已经跟你共事很久,而且非常懂你,永远不会忘事,又可以帮助你去冷静去做决定的一个工作搭档。很多人一听到这里就会说一句话,这个东西不好用,太麻烦了,有门槛。 但你认真想一想,所有真正能够把人筛出来的东西,有哪一个一开始就非常顺手的?门槛这个东西从来不是用来难住你的,而是用来去帮你把大部分人去难在外面的 走路的人,和开火箭的人,差距不是一倍两倍,而是五十倍、一百倍。你只是比别人早一步坐在火线上,只要你肯拿出当年追女朋友的那种狠劲,你 一定可以用得上。而且一旦你真的把这个顶级 ai 调教成你的长期助手,那么你和普通人之间的差距就不是努力层面的事情上了,而且是竞争维度已经发生了根本性的改变。我已经见过太多人在 ai 的 帮助下,已经完成了自己以前根本不敢想的事情。 有人不会一行代码,却写出了自己人生的第一个 app, 有 人不会写出,但是借助 ar 可以 写出自己人生的第一本书。所以我想说一句非常直白的话,可能有点刺耳,但是是真话。 ar 可能是我们这代普通人真正能够改变自己命运机会的一个非常关键的一个节点。

就在刚刚,谷歌甩出新王炸发布悉尼代模型 gmna, 三点五三大基准全线刷新,综合推力九十二,博士级,数据级八十八,真实编程七十八,上下文直接拉到两百万!还配了深度思考模式, 一个模型全形态打通,视频音频三维模型代码全部原声生成,智能体,任务完成率干到七十一,订机票写报告,点外卖,全自动,速度三倍,价格直降六成。 更夯的是 flash model, 直接免费,无限次对话,多模态全开,白嫖到爽,横屏一眼看穿,全维度领先,同价为竞品! 你觉得 gemna 能成为新的王者吗?欢迎评论区聊聊!

一定要一定要一定要想办法尽快用上谷歌的,这么难,不管你用什么手段,我自己深度用了一个月,最震撼的不是这个 ai 的 画图编程或者视频总结功能,而是他对用户的长期记忆。你每次跟他聊工作细节、项目进展、思考方式,他都在悄悄记录, 记到最后,他就变成了最懂你的那个人。谷歌的东西在国内用不了,太麻烦了,但是只要你想用,一定能用的上,就拿出你那种在深更半夜里找小电影的那种劲头,找到使用它的方法。 而且正因为有门槛,把大多数人都帮你拦在了后面。走路的人和开车的人,路都差的不是一倍两倍,而是五十倍、一百倍。现在这个时代, 你能不能把一个顶级 ai 调教成你的超级助手,就是你和普通人之间最大的差距,这是一种恐怖的降维打击。我一个朋友今天告诉我, 他已经在 ai 的 辅助下出了人生的第一本书,在没有 ai 之前,这件事他想都不敢想。 ai 绝对是我们这一代普通人最大的翻身机会。

一定一定要使用杰米尼,不管你用什么样的手段,都一定要去体验一下。为什么这么推荐杰米尼呢?不是因为他的画图,编程这些技能,而是因为他对于用户的长期级,你每次跟他聊工作细节,思考方式,还有项目进展,他都在悄悄的记录,最后他就变成了最懂你的那个人。大家可能会说,国外的东西用不了有门槛, 我教你一个超级简单,能够立马实操的方法,让你轻松的用上它。只需要三步。第一步,打开豆包,选上深度思考,输入如何在国内用上杰米尼, 且让他综合的考虑到你的地区、网络等限制,让他一步一步的去教你。第二步,根据豆包的回答,针对不明白的步骤,让他详细的展开讲解。第三步,按照豆包详细讲解的步骤去操作,你就能顺利的在国内用上几名你。

今天是五月十九号,让我们看看上周 ai 圈又发生了什么。 先说谷歌明天即将到来的 ai 领域的重头戏 google i o 二零二六大会 将在太平洋时间五月十九日上午十点正式开幕。这可不是例行更新,据传 gemini 三点五 v o 四以及全新 gemini 桌面端的 gemini spark 都会在现场发布, 而且谷歌已经在大会前给 gemini 网页端做了预热式更新,新的主题样式已经上线 周使用额度机制做了调整,思考模式也被明确拆成了标准和拓展两档。谷歌现在能否和 cloud 四点七以及 gpt 五点五继续抗衡,就看它的 gemini 三点五表现如何了。接下来看看 openai 吧。 这周他们给拆的 gpt 手机端加了个 codex 的 远程控制,简单来说就是你可以把写代码这种重活挂在 mac 或者服务器上跑,自己拿着手机在外面溜达,遇到报错或者需要合并代码,手机上点一下审批就行了,这明显极大方便了远程办公 程序员,距离授权工程师的完全形态又进了一步。蚂蚁集团这边动作也挺快的,上周刚发了拎影,这周又开源了一个万亿参数的思考模型 ring 二点六一 t。 这个模型属于那种专门干重活的智能体引擎,数学啊写代码啊这种高难度任务他比较擅长,里面还专门搞了个强化学习算法, 据说是为了解决大模型长时间跑任务容易崩溃的问题。感觉他们是铁了心要在复杂任务这块卷到底了。还有一个比较有意思的是, thinking machines 前 open ai 核心成员搞的发了个多模态模型 t m l interaction small, 他 直接把那种你一句我一句的回合制聊天给废了, 能在你说话或者做动作的时候同时给出反应,延迟大概两百毫秒吧, 感觉以后跟 ai 聊天终于不用傻等它回复了。视觉和控制这一块呢。字节跳动开源了一个全能智能体 u i tars 一 点五,为了方便大家在自己电脑上跑,还特意发了个七十亿参数的清量版,主要就是帮你操作电脑桌面的定位还挺准的, 算是个不错的本地小助手底座。然后是英伟达他们开源了萨纳模型,原声支持四 k 声图,重点是它特别省算力,参数量只有 flex 的 二十分之一,速度却快了差不多一百倍。它们还顺手发了个视频生成版本。 再来看看开发工具 curser 更新了内置的 composer 二点五代码模型,底座是开源的 kimi 二点五跑分基本追平了现在最顶级的模型,但重点是它很轻,跑一次任务成本不到一美元, 对开发者还挺友好的。 andromic 那 边呢,给 cloud code 弄了个原生的命令行面板, 以后挂机跑那些耗时的代码任务就方便多了,不用开一堆窗口,直接在后台跑就行, 算是个提高幸福感的小更新吧。还有就是 metta 他 们搞了个叫 fast bite latent transformer 的 底层架构, 直接绕开了传统的分词器,做到了字节级别的并行解码,不仅省显存,速度也快了不少,感觉底层架构这块大家都在拼命优化。最后快速过两条短信,首先是 openai 发布了专为网络防御团队打造的 daybreak 平台, 利用内置的 codex 智能体在代码仓库里自动查漏补缺,还给配了个最高权限的预览模型,做安全的同学可以关注一下。第二条是何凯明团队发了篇新论文,提出了一种叫 e o f 的 语言扩散模型,打破了传统的竹词预测, 直接在连续空间里像处理图像一样生成文字,只用十分之一的训练量就干翻了一票,主流方法挺硬核的。接下来看下上周全球前十的生成式 ai 产品访问量排名, jamie 掉第五有段时间了,豆包现在已经在前十站住了脚。 然后再看一下近一年生成式 ai 访问量的变化。最后再看看本周 hugging face 上热度前十的开源模型有哪些,这期就这样,感谢收看!