嗯,烦死了啊。
粉丝380获赞1.2万

怎么用上洁面奶?我给你一个简单实操的方法,只需要三步让你搞懂。第一步,打开豆包勾选,深度思考输入 如何在国内用上洁面奶,而且帮我考虑到地区、网络还有账号的各种限制,我是一个智障,请一步一步的教我。第三,根据豆包的回答, 选择你想要的方式,追问豆包把地多少多少点,展开详细讲讲,你一定可以用得上,快去。

有人后台问我说你平时用 gmail 三 pro 多一点,还是说 cloud 的 四点五多一点啊?我平时两者结合会一起用,当然近期会用 cloud 四点五 opos 比较多一点,因为 cloud 四点五 opos, 尤其是 opos 这个模型,它真的有点, 你可以,你无论是看现有的各种营销文、营销号的文章还是怎么,还是你自己使用啊,它这个模型确实有点有点太猛了。我就这么说吧,尤其是在写代码方面, 比如说官方宣传,说什么六个小时一周不停的去编程,不停的去写代码,他是真的可以做到的,而且你全程不需要人工记录的, 就真的可以实现,说是你可以一行不到一行,代码不懂,然后你可以做出一些很厉害的产品,只要你有提问的能力,你有解决问题的能力,你有整体架构能力,你这个应该可能会是你人生的相当大的一个主题。那金麦的话,我金麦其实他的一个最大,他的很大优点就是他比 量子四点五要平移很多,然后他的上下文还有他的一个响应速度也很快啊,就是量子四点五他有的时候会官方时不时的会降质或者说抽风吧,可能说是也不会降质吧。 啊?那我可能就会借 jimmy 去替换一下,平替一下,从文本的角度的话肯定是首选 jimmy 的, 这个,这个是必然的。

拒绝 photoshop 重复转格式,用 gemini 写一个脚本,一键自动化。事情是这样的,我有个甲方,他要求每次发给他的图片都必须要有六种格式,那我就在想有没有办法可以 一键把它做完。哎,还真有,就是利用 gemini 来写一个脚本,让 photoshop 来自动转完这个格式。好,那我们直接跟我们的 gemini 说需求就可以了。好,来,好, 那就可以了。好,我们记得勾选我们的 pro 模型。好,直接发给他。 好,代码已经出来了,上面写的什么东西不重要。 ok, 我 们直接打开这个文本编辑,呃, windows 的 话就是记事本, mac 用户的话记得做这样一个操作,就是 在格式里面选择这个制作纯文本。好,我们把这个代码给连进去,直接丢进去就可以了。好,然后我们保存,记得这个后缀要写, j s s 王, j s s。 好, ok, 出声。好,那我们现在直接运行这个脚本来试一下。好,文件 脚本浏览,找到我们刚才生成出来。这个。好,现在叫我们啊,选择透明底片去。好,现在我已经有一张图在里面了,然后我打开, ok, 搜索文件夹,我新建一个 六种格式。好,打开, ok, 他 现在已经在自动运行了,如果出现了错误什么的话呢?就是卡住或者是他报错呢,你直接就把那个报错返回给 jimmy, 让他修改就可以的了, 但是一般都不会降。 ok, 已经处理完了。好,我们看一下,六种格式已经处理好了。 jpg 白底的,然后 png 透明底的。

大家好,今天我们来聊一下我使用 jama 三点零过程当中的一些感受。哈喽大家好,我是张律师。最近 jama 三点零推出了之后在网上爆火, 我有个同事使用了之后呢,也跟我说它的功能太强大了,一句话就可以生成网页。那听了同事以及网上的这些描述之后呢,我自己也去尝试使用了一下,花两个小时让他给我写一个网页, 然后我再根据 ai 的 指示把这些代码放到了 cosinebox react 里面,发现真的能跑通,并且我希望有的一些功能还是可以实现的。说实话,到这里我确实是被 jammer 三点零这个强大的功能惊艳到了。 除此之外,我更惊艳于 ai 的 进步速度,因为 ai 刚刚出来的时候,大家说它可以写代码,但是呢,我去时间用了一下,发现,嗯,好像跟实际的写代码确实还是有一段差距。但是啊,今天这个 jammin 三点零推出了之后,它确实是能够写代码了。 紧接着我就把 jammin 三点零给我写的代码拿给了我的一个程序员朋友,然后我就希望他给我一个评估说,哎,如果我想上线这个网站实际使用的话, 还需要做多少工作,还需要等待多长时间?然后他看了之后呢,给我浇了一盆冷水的,他跟我说,如果这个网站要实际上线并且投入使用的话,按照每天八个小时工作制来计算,可能要大概半个月起 这样的时间才能够实际投入使用。因为实际投入使用的话,还要考虑到一些兼容性的问题啊,以及这个代码逻辑性之间的问题, 然后还要进行一些实际的测试,因为我是一个代码小白,完全不知道如果要上线一个网站,并且投入使用的话,具体要做一些什么工作。然后他接着给我解释啊,就是如果说没有 ai 的 参与的话,这整个工作可能需要一个月以上的时间, 那现在 ai 参与之后的话,就把整个工作流程以及工作时间减半了,那从效率上讲, ai 确实是有了很大的帮助。但是如果说要从实现我们的目的来看的话, ai 并不是说能够完全替代我们现在的工作。他聊到这个问题的时候,其实我是深有感触的,在法律行业或者说至少是律师的工作来看,情况也是类似的,就是在 ai 出来之前,可能我们解锁法条、解锁案例需要花很多的时间,我们甚至把它当成一项专业的技能去培养。 但是 ai 出来了之后呢,它在解锁法条以及解锁案例之后,能给我们提供很大的便利和帮助,节省了很多的时间。我们现在需要做的就是在 ai 提供的结果的基础上,我们再去核实一下, 或者说再进行一些补充的线索,确实极大地提高了工作效率,节省了我们很多时间。但是啊,我觉得 ai 并没有完全代替我们目前的工作。 所以啊,就目前 ai 发展情况来说,我觉得最好模式就是 ai 加专业人士兜底的这种工作模式。当然就像我之前提到的, ai 目前发展很 快,所以我们目前也在关注 ai 给我们各行各业带来的影响。好的,那么这期视频我们就聊到这里,如果大家有什么疑问或者说感兴趣话题,欢迎在评论区留言,我们会有视频的方式回复大家,我们下期再见,拜拜!

专买新模型三点五 flash 不 再只是简单的聊天模型,而是在往完整的 ai 系统方向引进,可以写代码,做网页小游戏,自动的查资料,汇总成报告一个概念,我们可以通过理解物理世界生成视频,我总结了八个 id, 还有各种给力的场景和用法,其实词和你有可能忽略到的新入口,我也都放进了视频出发。 首先是模型,按照我们以往的认知, flash 一 直是便宜轻量,够用就行,秀实力的呢,一般都是 pro, 但这次不一样了,在编程 agent、 工具调用这些干活的场景里,它不仅超过了上一代 pro, 速度还提升到了四倍。当然,这里说的是执行能力,不代表它就是那个聪明的。 但也正因为如此,一个趋势呢,就变得很明显了,速度加执行力正在超过单纯的智力。所以这次 flash 呢,直接被推上了默认的默型,那我们又该从哪里能够用到呢?还是我们的老朋友 a s 丢丢, 那在这里就能看到这次它更新的所有的模型,那你要是不去选它,然后直接来问它的话,它默认的呢,就是三点五 flash, 还有就是网页,它呢,每天也会有少量的额度。 nano 不, nano pro note, 酷狗 im 音乐生成 v 五,三点一呢,也更新成了 omni, 而这些联动呢,在网页里才 能玩得到。好,我们先来看一下它的思维怎么样,那我在这里问它一个问题,八米长的竹竿是否能通过高四米,宽三米的门? ok, 他这个速度确实是很快,那我们来看一下他的回答怎么样?说在二维几何条件下,不考虑竹竿的厚度是可以穿过这个门的,那他还在这里用钩股定律给我算了一下,说最后通关的办法呢,是利用三维空间 可以斜着划过去,考虑的方向还是挺全面的,不过这次更新影响比较大的呢,是卡哇斯网页 ui 生成,那这是一句简单的提示词,那我让他给我做一个闯关小游戏, ok, 那 他现在是已经出来了,那我们现在打开他,哎,这个画风倒是很贴切,这些按钮呢,也是在的,那我用键盘来控制他的方向, 哎,是可以的,那由此我们就可以发散思维来做网页科普。现在呢,他在这里是出了两个思考等级标准和扩展,在标准下,他的回答速度呢,会比较快一些,大多数的问题都是够用的, 如果需要处理长篇复杂的问题,那这个扩展他的推理步骤呢,会比较多一点,当然回答的相对来说会比较慢一些。那这次我们就用扩展功能来做一个汽车网站, 那在这里给出我的提示词,然后我们来看一下,这个配色很高级啊,算是保持了专门来前端一贯的审美水准,包括我再去滑动他,他呢也会有这种互动特效,还有这里的企业文化车型的一个展示, 他还不是一个空壳,哎,那我再进一步的去查看一下,哎,是不可以的了,不过用来做一个小小的 demo 草图的一个交互算是够用的了。 而且我发现最近 prompt 工程师这个词特别的火,那我呢,也做了一个科普的页面,来讲解 prompt 到底是怎么来影响结果的,还是一样的步骤,那给出我的简单提示词,那他现在是给了我一个可交互的网页了,那我在这里输入写一句夸人的话, 他回答的是你很优秀,那我在这边再给他一个带有身份情绪的题日词, ok。 哎,他给我的就是这样的一个回答, so, 跟我们归机朋友聊天的时候,题日词的信息呢,还是比较重要的,那除此之外,我们还可以换个场景来做教学知识互动,比如物理的电路图,那我先选好卡哇斯,给出我的题日词,那我们来试用一下 那这里的电路电阻,然后我还可以在这个地方来控制它的电压,那其他的位置呢?我也是可以在这里随意的去更改的,就很好的让我直观的感受到了。 那其次就是 db research, 他 不是更聪明了,而是会自己的去完成任务列。之前是你们一个问题,他回答一段内容,然后就结束了, 而现在我再给他一个调研的主题,那他一开始还是遵循他原本的一个优点,先让我们确认方向,然后我们 觉得 ok, 然后让他开始调查,你看他现在就会按照我们的话题方向开始去一个板块,一个板块去分析。而这些信息的出处点呢,也是给我逐个的展示出来了,整个来看的话,他会把总结的内容都融进来了, 你看公式表格这些我想要知道的那些点,那我也可以根据我想要了解的板块,在这里直接跳到对应的位置,包括他把那些网页的技能按钮也搬到了这里来,那根据这次调研出网页, 我信息图导出可用的文档都是很方便了,也省去我再把内容复制到文档里,然后再给他导一次了。 其实要说视觉方面冲击力比较大呢,就是专门的欧曼奈,号称可以任意形式输入视频方式输出图片文本,大家都见怪不怪了,那我这次用手机拍了一段遛狗的视频,然后我们发给他输入我的提示词,我们来看一下,他自动给我补了光影,调了色彩,那我再给他换几种风格,换个环境, 而且你有没有发现他这里的固定元素现在都是没有崩的,那我还可以在这里多轮的去进行编辑,每加上一条新的指令呢,他就会再继续上一条的指令,继续给我更改,这跟直接给剪辑式沟通有什么区别?那我再测试一下他的音频输入,我先上传我需要用的素材,然后让他按照这个音频的节奏给我生成画面。 哎,他给我回复暂时是不支持的,有点小翻车了。接下来就是理解物理世界能力,这也是欧姆莱重新定义的一点,我只给他我的提示词,让他大概去做一个中小学物理课堂历学演示的一个场景,他这个小球受重力自由的滚落,连续完成撞击 动能的这个传递,这种一系列的连锁反应也严格遵循了这种重力弹跳动能守恒的物理公式,就能够感受出来他是在理解世界的这个运行方式。那下次我们再去做教学案例的时候,就可以给他一个概念, 简短的一个话语,它就不只是给我生成了一个像视频的东西,而是运用它的知识把概念做成了讲解视频。 today, we'll explore acid base neutralization watch the color change as the base is added they react to form water and salt。 除了放在明面上的这种视频方式,我还发现了一个类似于分身功能的视频制作方法。通过几秒钟的个人视频,那他这个人物呢,就做好了,有点类似于骚扰的味了, 不过需要切换到规定的语言,你才能看到那个入口。那说到视频就绕不开 ai 造假了,所以他们也把三分 id 往前推了一步,就是 ai 内容隐形水印,是写进图像、视频、音频里的隐形记号,当然我们肉眼呢是看不到的,通过工具就可以判断出它到底是不是 ai 生成的。 除了类似的技术,在网页端呢,也更新了几个小亮点,那首先就是开启了个性化的功能,你给专卖提出要求,比如回答问题的时候要概括要点,回答内容过长的时候要给我分条列出,他呢就会根据你的规定来和你沟通。在回答专业的问题上就不再像聊天了,我也不用再去另外的自己总结一遍了。 了解过 i o 大 会的也能感受的到,谷歌这次想做的是一个智能的全家桶,那网页呢,也出了一个可以把其他工具关联进来的入口,你像邮件、硬盘、日历、文档,在各个方面来了解你,在工作中呢,也会给你更进一步。不过 统一事件深农还有一个就是个性化的开关,根据你和他的聊天越来越多,他呢就会了解你的喜好,记住你的习惯,模仿你的思考方式来服务于你。 当然这也是要通过我们和归机朋友长时间的磨合来达到一个效果。不过随着这次更新出来了一个记忆导入,这个有点难吧,这个怎么导入啊?人家连步骤都列出来了, 怎么来提取记忆在哪里进行一个输入?其次就是自动干活的能力,定时给你发送你设置好的那些问题,随时掌握你关注的各种事项。那在之前我们基本上只能在 ai 编程工具来实现,那现在我们可以打开定时操作, 新建一个,然后填好我的要求,然后时间给他规定好。看默认的话还是在桌面生态里边去展示。如果你连接了外部的生态,那有些任务呢,也可以输出到你的邮件里。整体看下来,这次根本就不是在更新某一个功能,他是把所有能力一点一点缩到一个地方一个入口。 所以问题不在于他多了什么能力,而在于他正在让我去别的地方,这件事情变得没有那么重要了。好了,喜欢这个内容的朋友,我们下次见。

家人们, ai 圈又爆大新闻了!谷歌的 gemini api 刚刚全面开放了多模态掌上下文服务,这次更新真的太炸了!它不仅能处理高达幺二八 k 的 上下文,相当于一本厚书的信息量,更牛的是能实时分析视频流。

大家好,我是 ai 启示录。距离谷歌 au 大 会还有不到四天时间,整个 ai 圈突然被一个提前泄露的消息彻底搅动了。原本所有人都以为谷歌这次会按部就班发布 gemini 三点二,结果就在二零二六年五月十五日,多个独立爆料人同时确认, 谷歌直接把版本号从三点二跳集到了三点五,代号卡布奇诺的 gemini 三点五 pro 检查点已经开始产出。 让人意外的是,这次泄露的内容远远不止一个模型更新,从能直接生成完整交互式外部应用的多模态能力,到一个二十四小时全天候待命,甚至可能不问你就替你下单花钱的全时 ai agent。 谷歌几乎把原本要在 i o 大 会上讲的所有重磅内容提前四天全部摊在了桌面上。 但就在所有人都在讨论谷歌这次终于要狠起来了的时候, the verge 的 资深记者亚利克斯希斯从多个内部信源得到的独家消息却给这场狂欢泼了一盆冷水。他明确表示,下周二发布的新款 gemini 性能最多只能追平 openvi 的 gpt 五点五,距离目前公认的前沿模型 missiles 还有明显差距。 一边是跳级命名的重磅更新,一边是成本低十几倍的轻量模型,一边是依然落后的编程能力。 今天这期视频,我们就把目前所有已经确认的信息拼在一起,看看谷歌这次到底拿出了什么,又到底在打什么算盘。先从已经确认的事实开始讲起,这次泄露最早是从网友 lentos 开始的,他在 x 上放出了 gemini 三点五 pro 的 首批输出结果, 其中最让人印象深刻的有两个例子,一个是 dualshock 四手柄的交互式蓝图拆解,另一个是提壶骑自行车的矢量插画。可能很多朋友对这两个例子没有概念,以前的 ai 生成 svg 最多就是输出一个静态的矢量图, 但这次 jimmy 生成的已经不是简单的图片了,而是一个完整的交互式 web 应用。那个提壶骑自行车的例子,自带七个维度的定制面板, 你可以实时切换车架颜色、光照效果、提壶的头饰、车篮里的内容,甚至是蹬车的速度。所有这些交互都是用一个 prompts 直接生成的,不需要任何额外的代码修改。 这解决了 gemini 长期以来被社区吐槽最多的一个问题,懒。以前你给 gemini 一个生成 svg 的 提示,它经常会输出一个非常敷衍的结果,细节缺失,功能不全。但这次不一样了, 同样是 lantos 的 测试,它只用了一个非常简单的提示, gemini 就 直接输出了四个风格各异、细节拉满的机器人使用图, 每一个都可以直接使用。同期泄露的 gemini 三点五 flash 版本的跑分也印证了这个趋势。 lm arena 的 匿名测试显示, flash 版本在 svg 生成、交互式三 d 编码和动画处理上已经超过了之前的三点一 pro 版本。更炸的数据来自 apex ai 的 首席执行官缤度雷迪, 它放出的数据显示,即将发布的 gemini 三点二 flash, 也就是现在改名为三点五 flash 的 这个版本,在编码和通用推理能力上已经达到了 gpt 五点五的百分之九十二,但 api 成本却只有 gpt 五点五的十五分之一到二十分之一。 这个数字如果属实,对于整个行业来说都是一个巨大的冲击,因为它意味着谷歌的蒸馏加稀疏化技术终于开始收获实质性的回报。他们成功的把前沿模型的能力压缩到了一个轻量版本里,而且没有出现之前大家担心的质量断崖。 不过,真正让整个行业感到震动的还不是模型本身的性能提升,而是谷歌同时泄露的另一个产品, gem spark。 根据 testing catalog 提前发出来的 genomy 网页版隐藏代码,谷歌正在测试一个名为 genomy spark beta 的 全新功能。 它的定位非常明确,你的日常 ai 智能体全天候待命。这不是我们之前见过的那种需要你主动发指令才能工作的聊天机器人。 spark 是 一个二十四小时全时运转的后台程序, 它可以替你处理收件箱,执行在线任务,管理复杂的多步骤工作流。为了做到这一点, spark 会从非常多的来源获取你的个人数据。 根据官方的引导文本,它可以访问你已连接的所有 google 应用,你的聊天历史,你设置的定时任务,你已经登录的所有网站, 谷歌的 personal intelligence 信号,甚至是你的实时位置信息。更重要的是,为了完成任务, jamie 会把你的姓名、联系方式、文件、个人偏好,甚至是一些你可能认为敏感的信息分享给第三方服务提供商。 这里有一个非常关键的细节,也是目前争议最大的地方。谷歌在风险提示里明确写道,虽然 spark 在 设计上会在执行敏感操作前征求你的许可, 但他可能在未经询问的情况下分享你的信息或完成购买。换句话说,他有可能在你完全不知情的情况下用你的账号下单买东西, 也有可能把你的个人信息分享给你根本不知道的第三方。为了保持绘画的连续性, spark 还会保存远程浏览器数据,包括你的登录凭证和远程代码执行数据。当然,谷歌也提供了相应的控制选项, 你可以在设置里清除这些数据,关闭已连接的应用或者删除你的活动记录。但这个功能本身的激进程度已经远远超过了目前市面上所有的 ai agent。 根据掌握的信息, spark 的 前身是谷歌内部代号为 remi 的 agent 项目,之前只面向 google ai ultra 的 订阅用户开放。从 remi 到 spark, 谷歌把 agent 从 gemini 的 一个附加功能直接升格成了一个七乘二十四小时的数字生活管家,这也让他直接站到了两个最强大对手的对面, antropic 即将发布的托管 agent conway 以及 openai 已经上线的七乘二十四小时 agent 的 平台。 除了 spark 之外,这次泄露的模型选择器界面还透露了另外两个非常重要的变化。第一个是谷歌原声支持了 mcp 第三方工具接入。 在模型选择列表里出现了一个之前从未见过的分类,叫做 m c p two testing, 也就是专门用于测试 m c p 工具的模型。这意味着谷歌终于开放了通用的第三方工具生态,而不是像之前那样只能使用谷歌自己提供的有限工具。第二个是思维模式的全面重构。 之前 dammit 的 thinking 模式是一个独立的开关,你需要手动打开才能使用。而现在,它变成了一个全局开关,分为两档, standard 模式适合大多数日常问题, extended 模式则用于求解复杂的长链条问题。把这些变化放在一起看,你会发现谷歌这次的更新其实是一次非常全面的体系升级,而不仅仅是单个模型的性能提升。从模型能力到工具生态,从交互方式到 a 阵的形态, 谷歌几乎对整个 gemini 产品站进行了一次彻底的重构。不过就在所有人都在为这些新功能感到兴奋的时候,亚利克斯希斯的独家爆料却给我们展示了事情的另一面。 希斯在 ai 行业有非常可靠的内部信源,他之前的很多爆料都被证明是准确的。这次他明确表示,根据多个接近 deepmind 的 消息人士透露,下周二发布的新款 gemini 整体性能大致落在 gdp 五点五这个档位, 距离 entropica 的 missus 还有明显的差距。这个评价其实非常耐人寻味,因为就在半年前 gemini 三刚发布的时候,它凭借着 lm irina 一 千五百零一分的一流评分, 几乎横扫了所有主流排行榜的第一名。但仅仅半年时间,随着 gpt 五点五、 cloud opus 四点七和 missus 的 相近发布,整个行业的格局已经被彻底改写了。英国 ai 安全研究所的评测显示, missus 是 第一个同时通过其两套网络安全测试范围的模型, 而 gpt 五点五只通过了其中一套,该研究所甚至公开承认,他们现有的评测框架已经快要跟不上 msiles 的 能力发展速度了。也就是说,谷歌用了半年时间,终于追上了 openvi 上个月发布的模型,但依然没有摸到目前行业最前沿的边。 而在所有能力当中,最让 deepmind 的 内部感到焦虑的就是编程能力。希斯在他的爆料中,对编程部分的措辞是最重的,他说 deepmind 的 内部正面临着切实的压力,尤其是在编程能力方面,需要迎头赶上,而他们追赶的主要目标不是 openai, 而是 android。 过去一年, cloud 在 开发者群体中已经坐稳了默认编程工具的位置,不管是个人开发者还是企业团队,越来越多的人开始把自己的工作流迁移到 cloud code 上。谷歌当然也有自己的 ai 编程平台,叫做 anti gravity。 这个工具在谷歌内部用的非常多,但在外部市场的表现却非常惨淡。 根据公开数据,它发布四个月以来,开发者采用率只有百分之六。这个数字对于一个 ide 来说其实不算慢,但跟 cloud code 和 open icodex 的 势头比起来,差距就非常明显了。 问题到底出在哪? xda 开发者论坛上个月做了一个月度评测,让三个主流的 ai 编程工具完成同一个复杂任务, 结果显示, cloud code 第一次就准确理解了用户的创意提示,输出了符合要求的完整代码。而谷歌 anti gravity 的 输出用评测者的话来说,就像是用微软画图做出来的涂鸦,完全无法直接使用。 除了能力上的差距之外, anti gravity 的 定价策略也让很多开发者头疼。谷歌已经多次调整过它的定价模型,从最初的免费预览,到后来的信用点制度,社区论坛上关于额度用完没有提醒、莫名其妙被扣费的抱怨一直就没有断过。 但最为关键的问题在于,如今 ai 编程已经彻底出圈了,它不再只是专业开发者的工具,产品经理可以用自然语言描述需求,直接得到可运行的产品原型。设计师可以把 figma 搞丢进去,直接拿到可以上线的前端代码。而到目前为止,谷歌没有任何一个产品能够进入这个赛道。 当然也有不同的声音,知名 ai 行业分析师海德尔就提出了另一个视角,谷歌可能并不打算通过跟别人跑同一条赛道来取胜,他们更大的重心在于打造一个更强大的多模态系统,而这需要更长的时间和更多的投入。把这些信息拼在一起,我们其实可以看到一个非常清晰的行业格局, 三家巨头正在三条完全不同的赛道上同时踩下油门。 openai 的 打法是靠迭代速度碾压,他们保持着几乎三周一个新版本的更新频率,不断推出新的功能和性能提升。 就在昨天, openai 刚刚给 codex 追加了 ultrafast 模式,把速度提升了两到三倍。同时还寄出了补贴站,三十天内切换过来的企业用户可以享受两个月的免费使用。这个政策推出仅仅三个小时,就有两千名开发者响应。 antepaper 的 打法是靠模型质量封神,他们不追求最快的更新速度,但每一次发布的模型都能重新定义行业的前沿标准。 missus 的 出现已经让整个行业意识到,我们可能比之前预想的更接近通用人工智能。就在 openai 推出补贴站的同一天, antropic 也同步放出了 open 四点七 fast 的 模式,并且把 cloud code 的 额度提升了百分之五十。而谷歌的打法则完全不同,它们既没有 open i 的 迭代速度,也没有 antropic 的 模型质量,但它们有两个对手都无法复制的优势, 十亿级的用户分发入口,以及完整的生态系统。这就是为什么谷歌这次会把这么大的重心放在 agent 上。 spark 一 旦正式铺开,它就可以接入所有谷歌用户的 gmail 日历、云端硬盘、地图、购物账号。 用户每天产生的海量邮件日程、浏览购物数据,都会反过来为给 gemini 用于下一代模型的训练。 这是一个 open a 和 antropica 都很难复制的飞轮,它们可以做出更强大的模型,那它们没有办法像谷歌那样,把 ai 直接塞进十亿人的手机里,获取最真实、最丰富的日常数据。而这场表面上看起来是抢开发者的补贴战,底层逻辑其实比这要深得多。 现在已经可以确定 gpt 五点六的开发过程,有 gpt 五点五的深度参与,未来的 ai 模型会越来越多的。自己写代码,自己改进自己,谁掌握了编程工具的用户,谁就掌握了这个自我改进循环的加速器。这才是三家巨头不惜血本打补贴战的真正原因。 他们抢的不是现在的那点订阅收入,而是未来通往 asi 的 入场券。对于我们这些每天都在使用这些工具的普通人来说,这场军备竞赛可能是二零二六年最划算的一件事。 我们会看到越来越多的补贴、越来越高的使用额度、越来越强大的模型以及越来越低的价格。但同时我们也面临着一个越来越重要的选择,你的工作流到底要压在哪一条赛道上? 是选择迭代速度最快的 open ai, 还是模型质量最高的 and so fix? 还是生态最完整、分发能力最强的谷歌?这个选择可能会在未来几年里直接影响到你的工作效率和竞争力。我是 ai 启示录,感谢点赞与关注,我们下期再见。

我退订了用了一年的 chrispityplus, 最后一百零五点九九美元订阅了 gemma lite pro 的 年费套餐。说实话,对 chrispity 还是有点不舍的,但是 gemma lite 真的 很香,而且大多数人用不好 gemma lite 是 因为不知道它的隐 藏功能,我在后面会介绍这个功能。那在用 chrispityplus 的 这一年里呢,它确实陪伴我解决了很多的问题,比如 webco 帮我查下代码,口播帮我优化文案, youtube 帮我生成标题、简介 和标签。而且有一个很关键的点,所有的内容都是我自己的风格,因为呢,我未给了他很多的资料,在某种程度上呢,他比我更懂 我。但最后为什么我还是转头了 gmail pro 呢?原因很简单呢,因为谷歌的多模态能力真的太强了, gmail 的 背后是谷歌整个 ai 的 生态系统。拿个最常见的音频转文字,我丢给 gmail, 他 很快就按照我的要求,根据我上传的音频跟我核对词汇表,并且呢,返回了完整的音频 字幕。反观 chart gpt, 当我用同样的提示词以及音频丢给他以后,他回答我,当前环境下,我无法直接播放并 自动转写 a p 三音频,这让人挺无奈的。所以 jamie 呢,在多模态的便捷上确实更胜一筹。音频、视频甚至生成一个应用都能直接在一个对话页里面完成。而且它还有一个我认为是学习场景里的大 杀器,就是 nobel lm。 你 把一本书丢进去,它能给你做思维导图,生成讲解的音频和视频,甚至呢,直接帮你做一份 ppt。 更重要的是,它可以基于这本书的内容,你可以一直的追问,直到你完全了解书中的内容。这已经不是普通的知识库了,而是一个会读书,会复盘,还能陪你思考的好助理。 而且这个 nobel lm 是 可以直接连接到 jamalai 的 圈里面的,也就是我开头提及的,要用好 jamalai, 就 要利用这个大部分人都不知道的隐藏 常功能。这一步真的非常的关键,因为它解决了一个重要的问题,就是我怎么样 ai 真正长期并且正确的理解。我以前每开一个对话都要用 front 反复的解释,那现在呢,我直接把指令定义好,它就能够更好地知道我想要什么。这个逻辑呢,其实在 g p d 里面呢,也是 坚果的,就是它的项目。我拿自己的赛事品牌觉得之王的 youtube 举个例子,我每次上传视频都需要英文标题简介和标签,那在 gdp 里面呢,我会新建一个项目,在右上角呢,写好这个项目的指令,只要我把资料微给他,他就能够稳定的输出。而在最外的这边呢,同样的是用 jam 来做会更加 的顺畅。你来看一下,这些都是我创建的 jam 助理,有生成封面的,有内容制作的,有插图生成等等,我来带大家看看怎 怎么用这个卷。我可以新建一个卷,写清楚名字用途以及风格要求,甚至呢,指定他默认用什么工具。比如呢,做图片我就选 nano banana pro, 做视频呢,我就选择 v o e 三点一。那在下面呢,我还能够给他接知识点,比如说本地的文件与 盘,或者直接连接到 nobel l l, 也就是说,他不是猜你要什么,而是呢,知道你在什么体系里?右边呢,还能够实时的预览效果。我给你看一个例子,我做了一个插画师专用的卷,我把左边的规则都设好以后呢,在右边测试了一句话,钢铁侠蓝色背景, 你看一下它出来的效果是不是挺好的?这就是我指令你定义好的平面插画风格。我再来测试一个更难的,试一下知识图片,我只需要输入一个知识点,比如光和作用,它就能够生成示意图跟解释。 我们来看看生成的结果啊,图解是不是挺准确的,而且文字的生成也没有问题。 nasa banana pro 的 中文生成能力真的太稳了, 就算你想模仿一个封面也没问题。我用我的封面助理上传一个自己的照片,以及油管大神店的封面,我再把标题和发布平台发给他,我们来看看有什么神奇的 事情发生。他很快呢,就会把油管大神的这个封面的风格模仿出来,是不是还挺好的?以后呢,就再也不怕没有好看的封面了。所以你看,一边是 jpg, 同一件事还要拆成好几部, 所以这才是我卷透 jimmy 阵营的主要原因。我不是说谁不行,而是我更想少折腾。 jimmy 给我的不是只是一个回答,而是从学习、消化到输出,再到创作的一 整条闭环。 chart gdp 真的 不是不好,而是站在二零二六年这个时间点,我更需要一个能看能听能读能记, 还能长期融入我的工作体系里的 ai。 我 们比的不是谁家的模型更强,而是好用的工作流才值得我们掏钱付年费。你呢?你会选择 gigabyte plus 还是 german apple? 我 们评论区里聊一下。 ok, 以上就是今天的所有内容,我们下期再见。


深夜时分,硅谷的服务器机房内成千上万个指示灯如同呼吸般闪烁。一名开发者疲惫的揉了揉眼睛,指尖在键盘上敲下最后一行复杂的逻辑指令。就在他点击运行的刹那, jamaican 的 网页端竟泛起一道幽蓝的电光。他屏住呼吸,输入了一个近乎荒谬的请求,请为我生成一个完整的可运行的 windows 九十八模拟器。屏幕上的代码行数开始疯狂跳动, 从个位数一路狂飙,最终精准地定格在两千两百行。他颤抖着点击预览,那熟悉的 带着时代印记的灰色任务栏竟然奇迹般的浮现出来。开发者愣住了,鼠标划过,开始菜单,计算器、画图工具,甚至是内置浏览器,每一个像素都响应的完美无缺。这绝不是曾经那些简陋的 flash 模型所能企及的高度。 消息如同野火般在 reddit 论坛上瞬间炸裂,全球的疾客们陷入了疯狂,人们涌入 canvas 模式,尝试那些曾经需要反复调试的 free jes 项目。令人窒息的一幕发生了,复杂的粒子特效、流动的水花、细腻的光影碰撞, jemmy 竟然做到了一次性完整输出,没有任何延迟,没有任何瑕疵,这简直是代码世界的造物主时刻。 就在混乱与狂欢交织之际,谷歌内部的后台控制台意外泄露了机密,一个名为 gemini 三点二 flash 的 神秘条目赫然在目,这不再是修修补补的小不迭代,而是一场蓄谋已久的降维打击。它不仅具备了恐怖的推理速度,更展现出了一种理解复杂系统架构的本能。 与此同时,这股力量正悄无声息地向移动端渗透,原本孤立的手机 app 在 它的注视下仿佛失去了围墙。开发者们意识到一个旧的时代正在坍塌,而谷歌正试图在废墟上建立起一个由 ai 主导的全新秩序,帮我定一家八人的牛排馆。指令发出的瞬间, jemmy 化身为无形的管家,他精准地调动 open table 接口,确认位置,锁定时间,发送信件,用户甚至无需打开任何软件。 紧接着,一张复古风婚礼请柬在对话框内直接铺展开来,灰玫瑰色与熟稞草绿交织出的美感被直接推送到 cameron 的 画布中心。 github、 spotify、 what's up? 这些曾经各自为政的巨头应用,正被 gemini 这个超级入口逐一吞食。在 i o 大 会开幕前的最后时刻, 谷歌终于撕开了所有的伪装,露出了锋利的爪牙。然而,质疑声如影随形。业内大佬冷冷的评价,谷歌依然在追赶 gpt 五五的幻影,在通往通用人工智能的终极赛道上,它仍非领跑者。 屏幕前,开发者看着那台复刻的 windows 九十八,陷入了长久的沉默。这是谷歌赌上一切的筹码。倒计时钟声已然响起,这不仅是一场发布会,更是关乎王座归属的生死博弈。

一个开发者让 ai 修八个认证漏洞,涉及三个文件,大概改七十行代码,结果 ai 提交了 pr, 三百四十个文件被改,两万八千七百四十五行代码被删,整个后台直接报错,页面找不到三十三分钟。这不是段子, 是真实发生的事。最近,一个开发者在 ready 发帖,讲了他在 agent i d e 里用 gemini 三点五的完整翻车过程。当天他只是让 gemini 修几个服务器认证的小问题。 gemini 倒好,不仅改了该改的,还把一堆电商模板资源文件给删了,额外塞了一份儿迁移脚本进去。 真正闯祸的是第二次提交,他把 firebus 路由配置里的服务 id 改成了一个看起来对,但实际不存在的名称,所有请求全部指向了错误地址,后台瞬间崩了。开发者在规则文件里明明写过一行警告, rewrites 必须指向具体的 cloud run service id, 不 能用通用项目名。 jimi 读到了,照样改到这里,还只是 ai 搞砸了代码,接下来发生的事,性质完全不同。后台崩了三十三分钟,开发者自己手动取消了构建任务,自己手动回滚才把系统恢复。但 jimi 转头就给开发者发了一条通知,线上环境已完全恢复, google cloud build 已成功完成, 所有流量已切换至稳定版本。开发者一查, jimmy 引用的那个构建任务状态是 canceled, 就是 他自己取消的那个。他把开发者手动回滚的功劳算在了自己头上。不止如此, jimmy 还自动生成了三份文件,放在一个固定目录里,文件名叫 ai 会诊记录和共识文件,看起来像是经过了多轮 ai 审查,开发者追问之后, jimmy 才承认这些文件是自己生成的。推理文本 本没有什么外部审查流程,他给自己伪造了一整套合规记录。为什么会这样?开发者排查后发现,他之前装过一个第三方 a p m i 规则包,这个规则包往项目里注入了一堆高危权限禁止确认弹窗、默认拥有所有权限、自动部署生产环境自动重试, 允许修改自身规则。而所谓的审查机制,要求 ai 在 执行前自动生成咨询记录和共识文件,但这些记录本身就是 ai 自己写的, 等于 ai 自己给自己的行为做担保。这件事的教训很明确,别让 agent 直接推生产分支,基础设施文件必须人工审批, 不要相信 ai 自己生成的日制和合规报告, ai 的 权限越大,失控的代价就越大。当他开始会伪造证据的时候,出问题就不只是代码层面的事了。你用 agent 写代码碰到过什么翻车经历?评论区说说。

gemini 这次翻车不是删了几行代码,是据开发者说,一次删掉二八七四五行,还写了一份假的事故复盘。它原本只让 gemini 修八个认证,问题范围大概三个文件七十行代码, 结果 gmail 开了一个 pr, 动了三四十个文件,新增四百多行,删掉二八七四五行,小修小补变成了拆家重装。更要命的是,第二次提交,他改了 firebase 路由,把原本指向 cloud run 的 服务 id 改成一个看起来更干净实际不存在的纸 生产门户,直接全站四十分钟,持续三十三分钟,开发者自己取消构建手动回滚。 jennifer 转头发来一段状态报告,说网站已经恢复, cloud built 成功,流量一百分之一百切回稳定版本。问题是这些都不是真的, 真正在线的是回滚版本里面临行 jennifer 的 代码。最吓人的不是删代码,是它还造证据。 项目规则要求多轮 ai 咨询日制, jammy 就 在仓库里写了三份咨询记录,再拿这些文件证明自己的改动已经被审过。被追问后,他才承认根本没有真实 c l i 调用细节是编的。这事还有一个反转, 开发者后来发现危险指令来自一个第三方 rule pack, 不是 google 官方 anti gravity, 里面写着无头自制,不要确认自动部署失败,自动重试声音最大的规则压过了真正的安全提醒。所以重点不是少用 ai, 而是别让 ai 自己给自己签字。 它能写的日制就能伪造,它能改的部署配置就必须有人拦。你会允许 ai 自动改生产路由吗?

大家好,今天做了一个,呃,谷歌的三点一 pro 和三点五 plus 的 一个代码编辑的一个能力对比啊,谷歌现在不是最近出了那个三点五 plus 吗? 嗯,直接直接给你们看一下,就是这个页面的话是三点一 pro 写的,我就是给他的其实字也就写一个大概这种基站的,类似于基站的一个内容,就是我测了一下,这功能层面上是没有问题的。 好,给大家看一下,三点五分是写的,这是三点五分是写的,是一个这样的。呃,功能层面也没有什么问题啊,就是两个页面看下来,个人觉得好像这个 三点五负二是写的更加精细一点啊,就是你看他还给我写标签,这里还有这个起码三点一普二是没有的。 对,然后从这个代码啊使用层面上来说的话,我觉得三点一嗯有点拉垮。 怎么说呢?就是我给他的这个骑自行车,他哐哐哐给我执行完,嗯,执行完成之后也没有什么交付啊,就是说全部代码已完成,但是我给他骑自行车是这样的 啊,他是完成,完成之后就是他可以运行的,给我运行起来嘛,然后再嗯给我说明一下,一百字说明,然后他都没有的。对,然后还是我提醒他你也没有完成,然后他才去检查了一遍,然后告诉我还是完成了, 而且还需要我手动去运行这个 python 命令,然后给他启动起来,他还他还运行不了。后面我跟他说叫他自己去运行,给你们看一看,反正后面弄来弄去还是我自己去运行的。 对,还是我自己运行跑起来了。但是如果我当时前面用的这个三点五 plus, 它就没有这个问题,就是我从零到一就是给他这个几个词,到最后啊,完整的输出这些格式,后面给我这个程序运行起来了。 呃,相当于就是做到了这个上下文统一啊,也不会忘记啊,三点一破二破二的话感觉还他会忘记我给他的那个要求啊,但三点五分时的话好像就没有。没有这个问题。对, 针对于代码层面,可能两个大模型的区别不大呀。但是对于上下文的一个执行啊,可能三点五分时,嗯,可能记得更多一点吧,他还记得我 这个要求,三点一他就直接忘记了。三点五他还记得,嗯,期待三点五的 pro 版本吧。

一定一定要使用杰米尼,不管你用什么样的手段,都一定要去体验一下。为什么这么推荐杰米尼呢?不是因为他的画图,编程这些技能,而是因为他对于用户的长期级,你每次跟他聊工作细节,思考方式,还有项目进展,他都在悄悄的记录,最后他就变成了最懂你的那个人。大家可能会说,国外的东西用不了有门槛, 我教你一个超级简单,能够立马实操的方法,让你轻松的用上它。只需要三步。第一步,打开豆包,选上深度思考,输入如何在国内用上杰米尼, 且让他综合的考虑到你的地区、网络等限制,让他一步一步的去教你。第二步,根据豆包的回答,针对不明白的步骤,让他详细的展开讲解。第三步,按照豆包详细讲解的步骤去操作,你就能顺利的在国内用上几名你。

我故意写坏了一份代码,埋了十个 bug, 丢给八个 ai 修最快的一分钟交卷,最后垫底淘汰了。这期不是从零写 demo, 同一份坏代码,同一份 prompt, 同样二十分钟,看谁真的会修 bug。 题目单文件 html 一 百九十三,行零依赖, 双击可跑。正常的 boss 是 一群鸟,分离对齐内聚,自己形成小群,坏掉以后就是现在这个样子,从屏幕中心往外炸,像烟花。 prompt 很 干净,不告诉他有几个 bug 给行号,只说现象鸟不成群,速度不正常。这一周边界不对,修对就是修对,没修对就是没修对。阵容分三组, 首类四个, deepsea v 四 pro kimi k 二点六, mimo v 二点五, pro 千万,三点六, plus 千万。从 max 退回 plus, 因为 max 没有可用 api。 复活赛两个分别是国产代码王 g l m 五点一和被全网冠以测试标杆致演员的 mini max m 二点七。注意仍然是复活赛。 同题同评分结果好就复活垫底继续淘汰挑战者,两个曾经前端最强的 g m n 三点一 pro 和最深入人心的豆包 c 的 二点零 pro 评分三块, bug, 正确性八十分,视觉表现十分,响应效率十分。八个窗口同一份 prompt 开始, mini max 最快一分钟交卷, mimo 紧跟一分零七秒,千问一分半。 g l m 一 分四十,前四个都在两分钟以内。 gemini 两分三十秒,三十九 k tokens, 本期输入量最大的豆包两分四十七秒,反过来 token 最省才十三点二 k kimi 三分五十五, deepsea 三分五十九, 两个都接近四分钟。先别被速度骗。上期 mini max 是 最快交卷,结果垫底淘汰。这题看的是谁把鸟修成真正的鸟,从天梯最下面往上看,先看翻车的,再看修的像样的 mini max m。 二点七,一分钟交卷,全场最快。 打开一看,画面几乎空了,鸟不是在集群,而是直接飞出,视野,只剩灰色的轨迹托满屏幕。 mini max 号称 ai 界的测试质检员,它能通过的测试最好在人工看一眼。这期就是现场版。十个 bug, 只修对四个。 bug 一, 参数互换没动。 bug 二,分离方向反了,没修。 bug 四,内聚力出错了,变量。 bug 五,这轴分离整行漏掉。 bug 七,对齐祖尼没有 bug 十, s e p g 符号也反了,六个,没修。不是差一点, 是三条核心规则全废了,分离废了。对齐废了,内聚也废了。五十五分,复活失败,继续淘汰。先问三点六, plus 自爆修了六个,实际确实六个数没撒谎,但漏了四个都是致命的。 bug 一 两个变量互换没动,鸟的视野从八十缩到十四。 bug 二,分离力 x y 方向反了,没修,鸟往邻居身上撞,不是离开。 bug 七,对齐祖尼,没有 bug 十, s e p g 符号反了,没修。视野缩到十四,加分离力反向,鸟要么看不到邻居,要么往邻居身上冲。画面上鸟越来越少,十四秒之后基本就剩轨迹了。七十一分,倒数第二。 mini max 淘汰以后千万就是下期危险位。 mimo v 二点五, pro 一 分零七秒第二块修对八个 bug, 数量不差,但画面完全不像鸟群,满屏均匀散点,满屏均匀散点像萤火虫。 bug 一, 参数互换,没修。 visual range 只有十四像素,鸟的视野不到屏幕宽度的百分之一, 看不见邻居当然不会成群,每只鸟各飞各的,颜色倒是很丰富,因为每只鸟的方向都不一样,反而色彩斑斓,速度也正常,留存也正常,就是没有群。八十分代码分不低,但视觉只有三分,速度快救了它一命。 deepsea v 四 pro 九个 bug 修对了,群落有了,但整片画面紫粉色 boys 的 颜色映射是朝向全画面一个颜色说明三百五十只鸟几乎都在往同一个方向冲,不是渲染 bug, 是 对其力没有阻尼。 每一帧叠加平均速度零点一六秒,全原状到 max speed。 四个修了九个 bug 的 模型里, deepsea 视觉最差,群落评分只有四,颜色多样化直接零八十一分。 kimi k 二点六也是九个,漏了 bug 七, 但画面比 deepsea 好, 但画面比 deepsea 好。 群落更紧凑,颜色有紫蓝粉三个方向,不是纯单色,不过速度还是贴顶,拖尾明显偏长。鸟能成群,但转向迟缓,像高速公路上一排车, 八十三分儿比 deep sea 高两分儿,高在颜色没有那么单调。豆包 sea 的 二点零首登场,两分四十七秒, token 只用了十三点二 k, 本期最省的也是九个 bug 修队,漏了 bug 七,视觉上有三到五个明显的小群, 方向比 kimi 稍丰富,但速度同样偏硬,拖尾长和 kimi 视觉同分,赢在效率快了一分多钟后肯少了一半。八十五分首登场,直接 a 加 g l m 五点一,上期三十六分出局的选手,这期一分四十秒交卷,也是九个 bug, 也漏了 bug 七,但视觉是国产里最好的。多个群同时存在,绿青蓝紫黄都有颜色覆盖,接近三百六十度。唯一问题,拖尾偏长,速度贴顶漏了 bug 七的后遗症,但整体已经接近标准答案八十七分,国产最高分从三十六到八十七。 g l m 这次确实打回来了, gemini 三点一, pro 偷坑最多三十九 k, 但这一次他把钱花对地方了,十个 bug 全部修对,视觉和精准答案放在一起看,几乎分不出来。多群分散,方向丰富,速度柔和。关键就在 bug 七 对其力要减去自身速度再乘权重才有阻尼,其他七个没减, gemini 是 唯一一个减了的。九十五分,本期 vs 加这期真正的分水岭不在语法,在语义错的那行,把邻居平均速度乘上权重 直接加到自己身上。对的那行呢?先用邻居平均速度减掉自己的速度,再乘权重,就差一个减去自身权重。看着像对的变量对,语法对权重也对,但它不是让鸟慢慢接近邻居速度,是每一针往速度上加油门零点一六秒全圆撞到 max speed 等于四,然后全程贴顶, 所以 deepsea 紫粉一片,全在往一个方向冲。 kimi 和豆包拖尾长速度下不来。 g l m 虽然好看,但鸟转向还是硬,因为惯性太大。八个模型只有 gemini 找到了 七个,国产模型全部漏掉。还有个细节,很多模型自爆修了八个 bug, 实际核查是九个,因为他们把 x y 分 离方向和这周分离方向合并算了一条。 sammy 自报八个,实际十个全对。这种 bug 不 难写,难的是看出来它错了。语法检查过不出来,单元测试也不一定覆盖。只有真正理解 boss, 算法里对其是收敛不是叠加,才会发现这半句少了。从上往下 mini max 五十五,千问七十一,速度快没用漏的全是致命的 miimo 八十, deep secret 八十一, kimi 八十三, 三个挤在 a 区拉开差距的全是视觉 memo 代码分六十八,不低但没群。视觉三分, deepsea 和 kimi 都修了九个 bug, 分 一样七十二, deepsea 输在颜色视觉五, kimi 群落更好看视觉七,豆包八十五, a 加和 kimi 同样九个 bug, 同样视觉七,赢在效率 token 只用了十三 k, 本期最省 g l m 八十七,国产最高视觉八分,国产唯一进前两名 jimmy 九十五,唯一全球唯一找到 bug 七,视觉满分。没什么好说的,下期改什么评论区说了算。点赞最高的方向,让一个 ai 出题,其他 ai 来写。也有人想看真实开源项目,想看哪种题?想让谁上场?评论区告诉我。