谷歌刚刚发布 jamming 三点五的时候,很多人都在惊叹它有多强,但我真正害怕的不是它变强, 而是人类开始变得像多余的了。以前互联网最喜欢的词叫效率,现在 ai 最擅长的事也是效率。写方案,剪视频、做表格,整理会议记录。以前一个团队干的活,现在一个 ai 标签页就开始包圆了。 最有意思的是,人类努力了几十年,终于把自己优化成了 ai 最容易替代的样子。标准化、流程化、高效率,这些以前是公司最喜欢的词,现在 ai 听了都想投简历。以前我们以为 ai 只是聊天工具, 现在他已经开始向员工了,而且还是那种不用午休,不会摸鱼,甚至不会在厕所偷偷刷短视频的员工 资本。第一次发现,原来真正完美的打工人真的不需要是人。 gm 三点五真正可怕的地方可能不是他能做什么,而是他让越来越多人开始怀疑自己还能做什么。 ai 时代真正的竞争可能已经不是人和人之间了,如果 ai 越来越像人,人类该靠什么留下来? kane, skade, whoa la panda, hahaha! yeah!
粉丝13获赞1408

谷歌刚刚发布了 jimmy 三点五 plus, 同时还把他们的编程工具 antigravity 升级了二点零,那这次就很明显了,谷歌的话这次是要全面提升它的这个抠点能力。之前不管是在 coi 还是 ide 还有模型, 其实给我的感觉就表现很一般,那这一次的话,这个模型最大的亮点官方说就是它的这一个速度啊,是前模型的四倍, 所以这一期我们就测一个最关键的问题,这么快的速度,它整个的一个代码质量会不会缩水?那我直接会拿两道真实的一个编程任务,把它和 cloud op 四点七, gpt 五点五放到同样的项目里面,同样提示时看它大家的一个表现情况。那下面的话,我们大概去扫一下它官方改出来的一个奔驰 mark 评分哈, 在编程方面的话,主要就看这一个 terminal, 奔驰二点一,还有这一个 sw 一 奔驰 pro, 从这个评分看的话,这一个 jimmy 三点五 plus 这个评分还是可以的哈,但是基于我之前对于谷歌模型实测的结果来看,就是评分不代表一切,因为之前就感觉它在这个编程方面挺拉的,这次我们就看整个的一个三点五 plus 表现到底怎么样。那这一次的话,我们的整个测试题目哈,就是沿用之前测试 cloud of 四点七,还有就是 gpt 五点五的两道真实的一个编程任务。第一个的话就是我们这一个 skills agent 嘛,需要把它从一个 c o i 做成一个 web ui。 第二个的话是希望他从一个已有的比较复杂一个项目里面把这个认证登录给它迁移过来,这一块也比较复杂,需要支持啊, get 谷歌,然后还要做一个落地页。好,我们来看一下这两个实测项目哈,左边的话,就我刚刚说的这一个 skill is a 镜头嘛,第二个的话就我们图片生成 a 镜头,那这次的话,我们是用了这个 anti gravity 它的一个 c o i 终端工具, 整体这一块呢,它的交互的话是跟呃卡扣的很像,那我这边测试下来,他的速度是真的快,相当相当的快,他说四倍,一点都没夸张。 那大家看一下它这个交互的一个情况啊,其实还是感觉挺挺好的。这个交互,那至于整个模型的能力怎么样,那这两个任务我这边实测下来,它都没有一次性的去完成,它或多或少都有一些小问题。那同样的这个提示值,在同样的项目,我给到了 gpt 五点五 以及 calloff 四点七,它都是能够一次性完成的,不管这两边哪一个项目都可以完成。但是 gmail 三点五 plus 它除了快,但它其实还是会有一些或多或少的 bug 嘛。好,我们来看一下它整体的一个表现情况。 好,我们来看一下这个是 jimmy 三点五 plus 帮我们完成的 skus agent 的 一个 ui 界面嘛,它可以去执行一些操作,比如说我给他一篇文章,可以让他帮我们去总结,它就会去加载这个的 skus。 就 我之前有一期视频 专门讲了这个 skills 的 一个工作原理嘛,那这是它完成的一个效果,整体上 ui 这块还 ok, 那 这边的话是 g p d 五点五给我们完成的,左边也是有我们的一个的一些 skills 是 哪一些?那右边的话就是它整个的一个操作的一个过程嘛。怎么说它这个 ui 的 一个结果的话,我觉得就是呃 g p d 五点五的会好一些。 那关于图片生成这个项目,让它去做一个落地页,以及让它去做一个就是谷歌 get 五的认证登录嘛,那这块它也是完成的,但是不是一次对话完成的。 u i 这块的话就是谷歌还是可以的,就是相较于 g p t 五点五的话,我觉得还是会好一些,就 u i 这块的话,我们还是优先选择就是谷歌的模型嘛。 好,下面我们来看下整体这个评分结果哈,那这个评分的话,还是跟之前一样,我们是把所有的模型生成代码通敏之后,然后改到模型去做 review。 那 这边的话 g p t 五点五是要胜出的,它的分会高一些。 第二个的话就是 cloudoff 四点七会辞职,那 gpt 三点五 plus 的 话,它整体评分效果会低一些,也就是它除了快,那代码质量上的话是会差一些。那这边的话也有些解决方案,比如说你可以用 cloudoff 四点七做设计,或者 gpt 五点五做设计,然后再用呃 jimmy 三点五 plus 去做执行。 那这块儿它还不是还发布了这个 anti graphic 二点零嘛。那这个 id 的 话,你就把它等同于 codex 吧,跟 codex 一 模一样。那我这边的话 现在还登录不进去,不知道啥问题。好,下面我们来进行一个总结。那这次他的整个编码水平的话,就是速度上确实是领先很多,但是在交付的一个结果上来看的话,跟国外两家模型还是有差别,尤其是在一些复杂项目里面,他还是会有偷懒的情况。 如果你是需要去做一些原型啊,或者做一些 u i 啊,我觉得这个 jimmy 三点五 plus 真的 是有比较有吸引力,因为它整个速度比较快,而且它的价格也比较便宜。那如果你是需要一些复杂的项目啊,多文件呀,那阶阶段我还是更推荐大家使用 g p d 五点五,在 codex 里面 你运行起来也非常的快。扣袋子这个 app 我 强烈推荐给大家用,我已经最近用了一个多月了,真的非常非常的好用, card 的 话就是封号真的特别严重,我已经放弃了。 ok, 那 这就是这期视频所有内容了,如果大家觉得这期视频做的不错,可以跟我一箭双雕,我是阿江,我们下期见,拜拜。

就在刚刚五月二十号凌晨一点的时候,谷歌的开发者大会正式的开始直播,那肯定有很多朋友没有看这个直播,我只能说各位真是有先见之明,整个直播时长有两个多小时, 又臭又长,直接给我看历劫了。信息密度呢可以说是非常的小,就是发布了一个全新的模型三点五 flash, 其余的其他功能呢都是接入的这个模型,各种乱七八糟,内容呢都加了在一起,大会的后半段呢,直接变成了现场直播带货,我看完就是一句话,真是闹闹又麻麻 闹马。我们首先看一下大会的第一个部分,就是 gmail 模型家族,整场都在讲这个, gmail ai 发布了 gmail 三点五 flash, 它的定位呢是前沿智能模型和 agent 执行力合二为一的旗舰快速模型,头跟的输出速度呢是其他旗舰模型的四倍, 非常的夸张,而且在编程 agent 的 多模态基础上,超过了 gmail 三点一 pro 就是 一个 flash 模型,超过了三点一 pro 模型,这个就意味着这次模型呢是小而快,听起来非常的不错, 但是我不禁要问,那么代价是什么?没错,它的价格也赶上了 pro, 上一代的 pro 模型呢,每输入百万, token 呢是二美元,输出是十二美元。这次的三点五 flash, 它的输入是一点五美元,输出是九美元, 其实非常接近了,在他们直播中有这样一张图,说是用了九十三个 agent, 输出了二十六亿的 token, 总共金额小于一千美元啊,我先保持一下质疑, 这次价格涨的确实有点多,这还只是 flash 模型三点五 pro 呢,预计在下个月,也就是六月上线,那你想想吧,那个价格肯定会更高呀。那第二个呢,就是 jimmy 欧姆尼全新系列,目前用的也是三点五模型,核心定位呢是推理能力加创作能力融合首发的 jimmy 欧姆尼 flash 接受图片、音频、视频文本的输入,也可以输出生成视频,还可以创建我们自己的声音生成的视频呢,让他说话的声音就是我们自己的。 你可以理解为把视频生成模型,图片生成模型全都融到了一块,缝合怪奇美拉。另外顺带一提,它的内容检测能力呢,从 jimmy nike 的 app 版扩展到了搜索和谷歌浏览器中,也就是说,当你看到一个图片,你不知道它的真伪,那么你可以把这张图片发给他,问问他是否由 ai 生成 它可以进行判定。这个怎么说呢,就我体感下来,其他的生成模型我都能认出它是 ai, 唯独 g p t 的 那个确实是有点真假难分,你不会针对的 g p t 吧?那山姆就有话说了,你不是我的兄弟,你是个路人。 接下来就是重头戏,谷歌的 a i d e 反重力二点零上线了,全新独立的设计啊,真是不愧是谷歌啊。从这个设计页面上呢,我就看到了无数个神支持了 doa 盾,并且速度非常的快,而且如果你是新开通的,或者以前就是 o 叉用户,还会送你 一百套的额度,那去领吧。什么意思?下一个更新的是全新的设计语言,几乎是全平台桌面版、手机版以及网页端都进行了更新,变得非常优雅,动画非常丝滑,同时引用了全新的字体,不过对于阅读中文来说好像不是特别方便, 只是阅读英文的时候看起来确实很优雅。每天的额度呢,也改成了卡尔的那种限额五小时刷新,直到达到周限额 结束了,也就是说,如果你是 pro 用户,可能用一会就没有了这个额度。下一个 jimmy spark, 二十四小时全天候, agent 直接运行在云端,在手机上,电脑上拿起来就直接控制它使 用的模型呢是 jimmy, 三点五,可以实时监控我们的信用卡账单,追踪邮件,自动整理笔记,制作文档。这个几乎就是一个 agent 的 平台的标配了,它本身就是一个超级 mcp 客户端,接的非常多。这个时候可能有朋友说了,哎,这个不是小龙虾吗?是吗? 目前这个我们用不了,你是 plus 用户, pro 用户都用不了,你必须得是 air ultra 用户。二百五十美啊,不对,现在降价了,是二百美元一个月。但是这个计划对我个人吸引力不是特别大,再下去沉淀沉淀吧,我们看下一个谷歌搜索 三十年以来最大的更新,在二五年年底的时候呢,谷歌浏览器就推出了 ai 模式,那现在呢?把这个 ai 的 模型换成了 gmail。 三点五, 我们输入的越长,搜索框越会主动的进行扩展,因为它是内置在浏览器上,主要还是为了搜索嘛。当你一个很简单的问题,他就会给你回复很短的内容,但是当你长篇大论的跟他讨论的时候,他就会开始进行深度思考 啊。 deep think, 也就说类似可绕的那种,判断你的意图,以及你这个问题的复杂程度,他自己来决定给你回复多少。另外这样一个浏览器也有 agent 了,二十四小时全天监控。我们提一个问题, agent 在 后台跨博克新闻社媒以及谷歌的实时数据 持续监控,也就说你可以让他实时帮你监控一些内容。那这个监控的功能呢?我个人认为可以用在理财的方面,比如说黄金的金价,实时给你追踪一些股票的价格,实时的给你发送。 不过这个功能呢,暂未发布,夏季向 ai pro 凹叉用户开放下一个 mini app。 这个功能是在我们搜索的时候,那一个非常长的任务,它会自动给我们生成看板,或者是生成网页,生成一个小应用,我们可以直接快速的跟它交互,那比如说我问一个太阳 长什么样子,那它呢?就会生成一个类似网页,或者是一个三 d 的, 我们可交互,可以拖动旋转。这个太阳演示看下来呢,还是非常有意思的,但是仍未发布, 发布时间是未来几个月。 ai pro ultra 美国地区的用户可以使用,也就说你不在美国,或者你是免费用户,那么你都是用不了的,太可恶了,他不是我们的兄弟,他是路,厉害。最后还有几个我快速给大家过一下,因为我个人感觉非常的无聊,一个是全网通用购物车, 让 ai 帮我们去购物,去比价美国豆包啊,真是实至名归啊。还有一个呢,是给油管准备的 ask youtube, 可以 直接处理复杂的查询和后续的追问,其实跟 grog 差不多, grog 呢,是可以读取 x 平台的所有推文,那这个 youtube 呢,自然是可以读取油管上的所有视频,以结构化交互形式呈现。这个呢,现在已经可以用了,局限于 youtube 会员的美国用户啊,注意你得是会员哦。 最后呢,就是他们的带货环节,首先是他们的安卓 x r 啊,智能眼镜,想当年我也买了一个小米的异样眼镜,老傻了。我 目前呢是两个版本,一个是带屏幕的,一个不带屏幕的,只不过带屏幕的还没有发,各位感兴趣可以去看一看。大概 就这么多内容,如果各位非常闲的话也可以去看看。这个直播还是蛮催眠的。那以上呢,就是本期视频的全部内容了,如果你对上述我们提到的这些内容某 某一部分你感兴趣,可以在弹幕里留言,我们可能会单独出一些视频来测试,或者是解读一下。各位记得点赞,不点赞的话你就不是我的兄。 ok, 最后祝各位玩的愉快,我是段峰,我们下期再见!拜拜!

盘们欢迎来到 comx, 也就是纽约商品交易所的交易前线,每天盯着这些仓单、库存、盘面跳动的数据。哎,说实话,今天咱们不整那些昏昏巴脑的客套话,现在是二零二六年五月下旬,盘面上确切的说是平静的海面下正憋着一场超级风暴。 今天这份盘面解析,咱们就直接刺破表象,带你看看这帮资金到底在玩什么底牌。咱们直接点了, 我可不会给你们念干巴巴的教科书,更没空读什么说明书。咱们今天就是来拆解排面最核心的底层逻辑。你可能没意识到,咱们现在正踩在一个极具戏剧性的时间点上, 一场真金白银的胆小鬼博弈正在 call max 的 场子里疯狂上演,金银交割的大幕马上拉开,到底谁在虚张声势?谁又真有实货?咱们直接切入正题。 好,咱们先来搞懂最要命的规则。经常听人说,第一通知日,也就是 f n d 对 吧? 用咱们交易员的行话讲,这就是被逼着亮底牌的死线。这日子一过,你要是手里还赚着多头单子,你就得掏出真金白银证明你有钱接货。你要是做空的, 你就得老老实实把食物仓单排在桌上。没钱接盘交不出货,那没办法,必须赶紧脚底抹油平仓或者斩鸡跑路。说白了,要么交钱,要么交货,不然就给我滚蛋出局。咱们来看看现在这两位绝对主角的处境。 先看黄金的六月主力合约,这家伙现在正踩在悬崖边上,离第一通知日就剩不到两周了, 这可是最让人神经紧绷的主力宜昌期。另一边呢,白银的七月合约看着好像稍微有点喘息的空间,毕竟还在宜昌初期,但是千万别被这层表象给骗了, 虽然白银时间上还有点缓冲,但盘面上早就开始往外冒那些极其诡异的信号了。那么问题来了,这种诡异的信号咱们怎么去抓? 关键就是盯死这个数据位,平仓量,也就是咱们常说的 o i, 这绝对是我们今天审视的重中之重。你想啊,眼看交更日快到了, 正常资金肯定早就平仓或者滑溜的已到下个月了,可是偏偏就有那么一帮人喜欢玩心跳,咱们现在就来挖一挖,在这场博弈里,到底是谁哽着脖子死扛着就是不肯走? 你把黄金和白银的未平仓数据放一块看,嘿,这反差简直绝了!黄金这边未平仓量大概在三十七点六万手左右,甚至比去年铜基还低一点 多,投资金撤退的那叫一个丝滑,极其有序,这绝对是理性的捞钱作派。可是你再回头看看白银,他这个宜昌降速慢的简直离谱, 这说明什么?说明有一群口袋深不见底的白银多头,正跟钉子户一样死死咬在禁约合约上,他们就是在赤裸裸的试探,想看看你们这帮空投手里到底有没有真正的白银。 大家一定要死死盯住这个决定生死的库存数据。你看黄金,他的注册库存足足有两万八千七百万,昂司 极其充裕,碧苍风严老师说为零,这不过就是一场温和的机构间金融套利罢了。但是视线稍微往下挪一点,看看白银,天呐,显性库存已经跌到了近十年的历史大底,纸面上那种极度干瘪的紧张感, 正疯狂向食物端传到整个链上,极其脆弱。现在的白银盘面,毫不夸张的说就是一个随时可能引爆的定时炸弹。白银到底为什么这么缺货?们扒一扒这两边宜昌背后的真正玩家, 你就全明白了。黄金宜昌极快,发单子的都是老牌金融巨鳄,人家纯粹就是玩金融套利。但白银这边呢? 一仓及其黏糊,这真不是市场里那般反复在瞎炒作,每天在交割席位上雷打不动,接货的全是光伏、电子零部件。这些工业巨头,人家根本不跟你玩什么纸面富贵,人家是要真真正正的把实物白银一车一车往自己仓库里拉。 这就引出了咱们看盘的另一个绝对核心指标,月差结构。这里有两个词,大家务必得刻在脑子里。咱们说人话,空滩沟就是我这里,货多的是,大家排队慢慢来,所以远期价格比近期高,顺带赚点仓储费和利息。那 backeration 呢? 这可就吓人了,他是在尖叫着说,我立刻马上要现货,随便你开什么天价,近期价格反而比远期还贵。只要出现这个,就说明眼下已经火烧眉毛,食物极度短缺了。这两种结构一摆出来,天壤之别,直接堆你脸上了。 黄金走的是一个极其标准的肯贪构结构,不管是资金面还是食物,非常从容, 完美覆盖了持有成本。但你看看白银,这结构,简直扁平的可怕,甚至在最近几个结算日的局部细节里,已经开始一闪一闪的亮起微弱的现货倒挂红灯了, 这可是实物极度紧张的最强前兆啊!白银正在用盘面扯着傻子告诉你,他是真的没货了。 好,既然盘面已经把这些信号亮明了,再结合咱们现在面对的中东地缘局势,还有美联储天天喊的维持更久的宏观大背景,接下来到底会怎么走?形势其实非常清晰,现在的盘面已经被硬生生劈成了两个截然不同的阵营, 一边是按部就班及其理性的老钱黄金,另一边呢,就是暗流狂涌,随时准备原地起飞的高波动妖物白银,咱们先聊聊黄金, 别看他前阵子猛着冲上高位,现在这波技术性回调把他稳稳拉回了四千三百五十到四千五百五十美元这个区间, 但在我这个老交易员眼里,这不仅不可怕,反而是极其健康非常有序的洗盘,投机资金敢在交割日前落袋为安,市场自我重置。说实话,黄金这种长线牛市的底层逻辑, 连一根汗毛都没被伤到,为啥我敢这么肯定?你看看华尔街的顶级大鳄,人家的雷达早就锁定在二零二六年第四季度了,目标价直接给到了惊人的六千美元。所以啊, 眼下这种回调和震荡,对于真正做长线战略配置的买家来说,根本不是恐慌抛售的理由。这就叫主力在倒车接人呐,给你绝佳的开着卡车来进货的机会。但是把目光赚回白银, 这画风瞬间就变了。现在白银的价格在美昂斯七十四美元附近上蹿下跳,你看他现在的德行,哪还有半点稳重会金属的样子,活脱脱就是一只被极高纸面杠杆绑架的腰骨。那些手里压根没有现货的金融空投,现在完全就是在刀尖上舔血, 每天的保证金压力估计都能让他们喘不过气了。现在的白银绝对是暴风雨前的宁静,一旦咱们正式踏入六月七月的交割最高峰, 我跟你说,随便来点地缘政治恶化或者库存锐减的小道,小瞬间就能点燃导火线,一场由实物交割、链条崩断引发的史诗级挤仓,随时可能爆发,直接把白银的价格通到九十美元的夸张高位。当然了,你心里得有数,这种爆发绝对伴随着极其凶险, 足以把人甩下车的剧烈波动。那么问题来了,既然这史诗级的风暴就要砸下来了,咱们该怎么活下来?甚至去薅一把羊毛?这就到了亮出咱们压箱底剧本的时候了。记住,专业的操盘手从来不赌博, 咱们只看数据,死死划定风控底线。接下来这几个核心指标,就是用来帮你判断到底对家是假摔 还是真的要被逼仓逼死了。第一个底线,死死记住五月三十日这个日子,这是黄金第一通知日的绝对分水岭。到了这一天,如果你看到黄金六月合约的未平仓量极其顺利的降到了伊曼特一奶, 好常输一口气,这说明这是一次干干净净及其安全的换月,一切尽在掌控。同时,在这同一时期,你的眼睛绝对不能离开白银七月合约的一仓数据。实战中, 咱们怎么一眼看穿多空,谁在虚张声势呢?教你一招,在交割日前夕,如果静月合约的价格突然高抬跳水,同时为平昌量一天之内狂砍几万手,别慌,这叫假警报,这说明多头压根不想接石灰跑路了。但是划重点了啊, 如果静月价格死活就是跌不下去,月差牢牢盯死在倒挂状态,而且时长量居高不下, 哼哼,那空投可就惨说没了巨量资金死磕到底,空投将被迫去现货市场天价买进白银来交割,这就是最血腥的空投大出血现场,落实到咱们自己的账户上, 这是最终的战术执行纪律,针对黄金四个字,多看少动,但只要敢回调,就去买十二月的远月合约,做稳健的战略配置。 至于白银,我必须极其严肃的警告各位,绝对绝对不要在那种极端波动里脑子发热去追高,如果你实在手痒非要参与这波行情, 听我的,用微型白银合约去操作,严格掐死你的杠杆,不然在这个交割月前夕的残酷大洗盘里,你大概率会被踩踏出局。这就是此刻盘面上正在真实上演的绞肉机博弈, 没有教科书里那种温良恭俭让,全是真金白银的刺刀剑红。所以在交割周期的超级大战席卷大凡之前,好好问问你自己,你是已经备足了资金准备去接下那些闪闪发光的食物了呢?还是说你已经提前看好了退路,准备落荒而逃了? 希望今天这场盘面深浅,能让你们在这个吃人的市场里,我哪怕一分胜算,咱们下次解析再见!

朋友们,说实话,已经很久没有这么激动了,因为谷歌昨晚这波已经不是普通的模型更新了,而是 jimmy 开始全面 a 智能化了。而且更离谱的是,这次不是某一项能力更强,而是几乎所有方向都开始断崖式提升, 把所有玩法都整理进了文档。这次的更新包括推理、 coding、 网页生成多模态、长任务、 a 整执行,甚至已经开始自己操作电脑了。 ok? 那 jimmy 到底强在哪呢?很多人以前总说 bashmark 只是数字, 但问题是已经很久没有出现这种断崖式碾压的数字了。 ok, 不 说那么多,我们直接上手实测,现在专门来三点五,最离谱的其实是 recode, 一 句话,直接生成完整的交互网页。 最夸张的是,现在很多人已经开始拿 jimmy 做系统了,比如 ios、 mateos, 甚至各种 app ui。 你 会发现以前 ai 做网页还很像 demo, 但现在已经开始像产品原型了,而且成功率高的离谱, 很多效果真的是一句提示词就能直接做出来的。而且这次更重要的其实是 gemini spark, 你 可以把它理解成谷歌版的 minus。 以前你问一句 ai 回一句,现在 gemini 开始自己干活了。比如帮你查资料,整理 gmail 管理日程, 持续追踪任务,而且重点是它可以后台持续运行,这个味道已经非常像真正的 ai 智能。但最让我震撼的还是 gemini omni, 因为他已经不是单纯的纹身图、纹身视频了,而是开始理解整个世界。比如你给他一张静态图,他能直接变成动态镜头,你给他一个视频,他甚至能复刻风格、镜头、语言、应景节奏,包括空间关系、光影变化、 运动逻辑,他都开始理解了。还有个特别离谱的能力,就是做科普动画,比如一句话,用 s d v g 动画解释 g p u 工作原理, 他直接给你生成数据流动,并行计算结果输出,而且是动态的,甚至啊,比很多 ppt 动画还高级。而且这次还有个很恐怖的地方,他的多模态理解,比如你给他一段混剪视频, 他不仅能识别这是哪一部电影,甚至还能告诉你具体桥段、角色关系、时间线、剧情内容,而且识别的非常准。这意味着什么呢? 以后 ai 剪辑、 ai 自动拆解视频, ai 自动做混剪,可能真的快来了。以前大家觉得 ai 会先替代白领,结果现在最先冲击的反而是内容行业。 google 现在想做的已经不是聊天机器人了,而是整个互联网的新入口。 搜索是 ai, 浏览器是 ai, 邮箱是 ai, 视频也是 ai, 甚至未来整个安卓都可能变成 a 端系统。这才是这次真正可怕的地方。 过去两年呐, ai 的 核心还是帮你生成内容,但从 dream 这次开始, ai 的 核心可能变成了替你行动。你会觉得这次谷歌能不能靠 a 整一波翻盘, 把 open ai 甚至未来的手机厂商重新拖进它的生态里?我们评论区聊聊,我是郭总,关注我,让你在 ai 时代快人一步。


重磅消息,刚结束的二零二六谷歌后开发者大会, ai 圈迎来大洗牌,全是实打实的硬核黑科技。 首先,全新上线三大 gemini 重磅模型,第一个 gemini omni 真正做到全模态全能世界模型, 图文音视频全能打通,还能生成自带重力动能物理效果的实景视频,随意修改编辑,日常各大谷歌生态软件全都直接接入。其次, gemini 三点五 flash 正式就位,速度直接拉满,输出效率是同类模型四倍,专属环境下更是达到十二倍 成本,还直接砍掉大半,性价比拉满。现在已经成为谷歌搜索和 ai 软件默认主力模型,更强的三点五 pro 下月也即将登场。还有全天候云端 ai 代理 geminis park, 不 用开机也能后台自动干活, 整理邮件、规划行程、处理办公文档一键搞定,很快就会开启公测上线。开发端更是迎来大升级, anti gravity 二点零全面革新,支持多智能体协调作业,现场实测,九十三个 ai 智能体联手,仅用十二小时低成本从零搭建出完整操作系统,内核实力肉眼可见。 最后说句实在的,没有网传夸张碾压别家模型的说法,官方明确表态,多项核心数据超越前代模型,整体实力对标行业顶尖水准,接下来 ai 行业竞争只会越来越激烈,这波谷歌全新 ai 布局, 你觉得能不能领跑接下来的人工智能时代?评论区,聊聊您的看法,谢谢收看,我是探秘哥,下期见!

ai 圈有个不可能三角,性能、速度、成本你总得放弃一个,但 google 却说它可以全都要,这怎么可能?它们刚发布的 gemini 三点五 flash 简直刷新了我的认知, 它不仅拥有旗舰模型一样的聪明劲儿,速度更是其他领先模型的四倍。想象一下,以前那些需要程序员花好几天甚至审计师忙几周的任务,现在几分钟就能搞定,而且用的钱还不到其他模型的一半,这不就是鱼和熊掌都兼得了吗? 过去我们总觉得想要速度快,质量就得打折,想要性能好,成本就得飙升。但 gemini 三点五 flash 似乎找到了那个平衡点。 它到底是怎么做到的?凭什么能同时满足高智能、高效率、低成本这三个看似矛盾的要求?今天咱们就来深挖一下 google 是 如何打破这个 ai 行业公认的不可能三角的,这不仅是技术上的大突破,更会给我们的日常工作带来实实在在的改变。 所以别眨眼,精彩才刚刚开始。 ai 圈里总说性能、速度、成本总得牺牲一个,但 gemini 三点五 flash 出现直接打破这惯例,它不光快,智能水平也达到了旗舰模型。看它的关键数据, 在编码和复杂任务测试 terminalbench 二点一中, gemini 三点五 flash 拿到百分之七十六点二高分,超过 gemini 三点一 pro 智能体任务的 mcp atlus 精准测试,它也取得百分之八十三点六好成绩。 对多模态信息理解、文字、图片、视频这些他同样出色。 chart fourteen recent 测试得分高达百分之八十四点二,复杂信息他也能快速准确理解、 亮眼表现,得到权威机构 artificial analysis 认证。他们将 gemini 三点五 flesh 放在指数右上象限,表明他同时具备前沿智能和卓越速度。可以说, gemini 三点五 flesh 做到了鱼和熊掌兼得,他不光快,更是顶级的聪明选手。 而这种顶级智能,它用在了智能体任务这个新维度。这到底意味着什么?又会带来哪些改变呢? ai 的 下半场已经来了,以前它只会聊天、写东西,现在它要学会行动了。这个新趋势叫做智能体。 gemini 三点五 flash 就是 为这类长周期智能体任务量身打造的,它不再是被动生成内容,而是像个数字员工,能主动规划执行多步骤的工作。 google 为此专门推出了 anti gravity 平台,这个平台就是用来开发和部署智能体的,它能把多个子智能体组合起来,就像组建一个虚拟团队,大家一起解决那些大难题。 打个比方,以前一个项目可能要花几周,现在有了 anti gravity 和 gemini 三点五 flesh, 一个主智能体带着好几个子智能体,可能几分钟就能搞定大部分。这超出了我们对 ai 工具的想象,他不再是助手,而是一个能自主思考和执行的新同事。理论听起来挺厉害的,对吧? 那这些智能体到底能在实际工作中做什么呢?咱们就来看几个代码和开发领域那些颠覆性的真实案例。 智能体到底能干啥?看看 google 怎么用。 gemini 三点五 flash, 两个智能体,一个研究员,一个程序员,六小时内,它们就从 alpha zero 论文中学习并完整开发出一款游戏,这不是普通编程,是理解加创造, 还有老旧混乱的代码库程序员的痛点。三点五 flash 结合 ant gravity 平台,能自动重构这些遗留代码, 甚至直接迁移到 next js 框架,这节约的人工时间太惊人了。它还能并行设计,比如一个 app 的 结账流程,三点五 flash 在 六十秒内就能给出多种用户体验方案,它像个能自主思考执行的虚拟团队。这种认知劳作的自动化,会给商业带来多大的效率革命? 上次我们聊到 ai, 已经不光会生成内容了,它开始学会行动了。这种能自主思考执行的智能体,可不是只在代码世界里转。 现在他正在金融、电商这些大行业里变成真正的超级员工。比如电商巨头 shopify, 他 们现在就在用 gemini 三点五 flash 的 子智能体。这些智能体能像一支专业的分析团队一样,并行分析大量复杂的商家数据。 要知道,这些数据时间跨度长,信息量特别大,目标是干啥呢?更准确地预测全球商家的增长趋势。 以前这可能是个非常耗时耗力的工作,现在有了智能体,决策就能更及时,生意就能做得更准。再看看金融行业,澳大利亚的麦格里银行,他们就在试点用三点五 flash 来处理客户入职。想想看,一个新客户入职要审阅一百多页的复杂文件, 这些文件包括各种法律条款、财务信息。传统上人工审核耗时又容易出错。现在智能体可以低延迟推理这些文件。什么叫低延迟?就是响应速度非常快,客户入职流程大大加速,体验自然就好,银行也能更快地把客户服务做好。 还有大家熟悉的 sauce 巨头 salesforce, 他 们已经把 gemini 三点五 flash 集成到了自己的 agentforce 平台,通过部署多个能记住上下文,并且能调用各种复杂工具的子智能体,来自动化企业的日常任务。 就像有了很多个专业的虚拟助手,能处理客户服务、销售流程、数据分析等等。而且它还能确保这些任务的执行非常可靠,出错率大大降低。这不就是把效率直接拉满了吗? 你可能会觉得这种企业级的应用离普通人还很远,但其实这项技术已经悄悄来到了我们每个人的身边。你可能觉得这种企业级的应用离普通人还很远,但其实这项技术已经悄悄来到了我们每个人的身边。没错,我说的就是你的数字生活管家,他叫 gemini spark。 这个 spark 就是 基于 gemini 三点五 flash 打造的,你可以把它想象成一个私人助理,二十四小时在线,随时待命。它能帮你处理数字生活里的各种事,就向你的数字分身,比如帮你规划日程、整理邮件,甚至是在线处理一些信息。 而且啊, gemini 三点五 flash 不 光驱动 spark, 它还深度用在了 google 搜索的 ai 模式里。当你搜索一个复杂概念,比如回旋体模型, ai 模式就能给你生成一个交互式的视觉解释,像动画一样,特别直观。 这个超酷的 gemini spark 测试版会先在美国给 google ai ultra 的 订阅用户开放,很快它就会成为你数字生活里不可或缺的一部分。一个能全天候替你打理一切的 ai, 听起来是不是很强大?但同时也引出一个问题,这样的 ai 它安全吗?我们到底该不该信任它呢? 上集聊到 ai 已经能变成你的数字生活管家了,是不是觉得它特别强大?但同时心里会有点担心,这样的 ai 它到底安全不安全?我们能完全信任它吗? google 对 这个问题非常重视,它们为 jammin 三点五的开发专门建立了一套前沿安全框架。 这套框架可不是说说而已,它在好几个关键领域都加了江省。比如针对现在大家特别关心的网络安全,还有 cbrn 这种敏感的化学生物放射性核核信息, google 都做了特殊的防护增强。 也就是说,在这些非常重要的、潜在风险高的领域, gemini 三点五会有更严格的限制。它们还用了新的更高级的安全训练方法,这能大大降低 ai 模型生成有害内容,或者把一些本来无害的查询错误地当作安全问题拒绝回答的概率。 这就好像给 ai 不 断打磨它的道德指南针,让它更准确、更可靠。更让人放心的是, gemini 三点五还内置了可解释性工具,你知道这意味着什么吗? 就是说,在 ai 给出任何一个响应之前,我们不是被动接受结果。通过这些工具,我们可以检查和理解 ai 内部的思考过程,它是怎么得出这个结论的? 这就好比一个透明的黑箱,让它的决策不再是完全的秘密。这种透明度能帮我们更好地理解 ai, 监督 ai。 所以 说, google 不 仅仅是把工具交到你手里,它们也尽力让这把利器变得更安全、更可控。那么, google 到底会怎么把这些强大的工具推向世界? 他们的商业策略是什么?我们接着聊 google 为什么这么急?他正用 gemini 三点五 flash 打一场全面战争。这场 ai 战役不仅覆盖数十亿普通用户,更是直接把手伸向了开发者和企业,要跟微软 open ai 抢未来。 你可能已经感受到了, gemini 三点五 flash 已经进入了你的手机,通过 gemini 应用,还有 google 搜索的 ai 模式,全球几十亿人都能直接用到。它不仅仅是个聊天工具,更像一个随时待命的助理,帮你处理日常信息。但 google 的 野心不止于此, 他们也把这个强大的模型开放给了全世界的开发者,比如通过 google android studio, android studio 里的 gemini api, 开发者能用它来打造各种新应用,甚至直接改写代码逻辑。更关键的是,在企业层面, google 推出了 gemini 企业智能体平台, 还有专门的 gemini 企业版。这意味着从个人到企业,从我们日常生活到公司运营, gemini 三点五 flash 几乎是无孔不入, 它就像一个超级员工,帮企业自动化复杂的日常任务。 google 这么做目的很明确,就是要构建一个完整的 ai 生态,把所有的用户、开发者、企业都拉到自己的阵营里。 这可不只是技术竞争,更是商业版图的大争夺,它想把微软 open ai 甩在身后,成为 ai 时代的真正主导者。 所以,这不光是技术突破,也不光是商业落地,它预示着 ai 的 新时代已经完全到来了。我们聊了那么多,从 jammin 三点五 flash 的 速度、性能,到它如何成为你的数字生活管家,我们甚至看到了它在安全框架下的严格约束,还有 google 怎样把它推向全球市场。 但这些具体的例子都在指向一个更宏大的趋势,那就是 ai 已经不再只是一个信息工具了,它正在从一个知识的提供者转变为一个能真正行动的伙伴。以前你可能让 ai 帮你写个邮件,查个资料,现在它能帮你直接重构上百行代码,在短短几小时内就完成一个游戏原型。 或者就像我们前面说的,它能帮你处理复杂的财务报表,甚至还能像个专业的数字管家一样打理你的日程、邮件,甚至帮你在线处理一些信息。这意味着什么呢?这意味着我们和 ai 的 协助模式正在被彻底改写,它不再只是一个听话的助手,而是一个有思考、有执行能力的智能体。 google 用 gemini 三点五 flash 引领 ai 从信息工具转变为行动伙伴,它在用实际行动告诉我们, ai 的 下半场就是智能的行动时代。 所以,当 ai 能够独立思考并且像一个人一样去行动的时候,我们的工作和生活会变成什么样?我们的创造力又会怎样被它拓展呢? 那些重复性的任务是不是真的可以彻底交给 ai 了?这不光是技术突破,更是对我们未来世界的一次重新定义。思考一下,这其中是不是也有你的机会呢?

google i o 大 会正式宣告,今天速度的定义被彻底改写。 today, i'm excited to introduce gemini 3.5 flash our first in a series of models 输出速度达到同类前沿模型的整整四倍,响应时间缩短至惊人的零点二秒。 在 terminal bench、 mcp atlus 等多项积分测试中,它不仅刷新了速度记录,更在多模态推理上超越了自家的三点一 pro 模型, 支持多代理并行执行,无论是解析数万页论文,还是在沙河中自主编写并部署完整代码,复杂长周期任务一次搞定。拥有百万级上下文窗口与六万五的输出上限,内置四个思维档位,让复杂推理精准可控。 shopify salesforce mcquari bank 以深度部署发票识别财报分析代码迁移数周的流程,现在只需数分钟,而输出成本仅为旗舰模型的一半甚至三分之一,用后百分之五十的价格,撬动前百分之五的顶级性能。 依照前沿安全架构,内置推理可解释性检查与有害内容拦截,大幅降低误杀率,扫清全天候自动化的安全障碍。 gemini 三点五 flash 现已全球可用,去使用代码去创造未来。

想了,你有没有想过谷歌全新的揭秘奶三点五到底有多恐怖?第一个要点,他的逻辑装配速度快到超越人类感官,每一秒钟就能狂飙出数百万个逻辑包裹。想了第二个要点, 他拥有全息多模态神经交融,能在一瞬间同时看视频听你的语气,还能盲改代码,像超级人类一样多线思考。 第三个要点,他通过了终极算力阀门控制,哪怕遇到再庞大的问题,也能用超低功耗精准控制千亿级知识流向。想的关注我, 带你用大白话讲透世界最前沿的硬核黑科技。

谷歌今天推出了 gemini 三点五系列,打头阵的是三点五 flash, 一 款兼具前沿智能与行动力的代理模型。它在代理和编码基础上超越了三点一 pro, 多模态推理领先,输出速度比同类模型快四倍, 真正做到了质量与速度兼得。更关键的是,他擅长处理长期代理任务,成本往往只有其他前沿模型的一半。结合全新的 anti gravity 框架,可以部署多个子代理,自动完成资产分类、代码维护乃至财务文件,准备 把过去需要几天甚至几周的任务压缩到几分钟。在企业端, shopify 正用它并行分析数据,做出更准的增长预测。银行和金融科技公司用它自动化繁琐流程。 全新的 gmail spark 个人代理将二十四小时为您待命,搜索体验也迎来动态界面。而三点五 pro 预计下月推出。模型内置前沿安全框架,用可解释性工具理解推理更安全可靠。 总结,三点五 flash 以旗舰智能和极致速度重新定义代理模型,让强大 ai 普惠开启行动智能新篇章。

大家好,我是娜娜。距离谷歌 i o 大 会还有不到四天时间,整个 ai 圈突然被一个提前泄露的消息彻底搅动了。 原本所有人都以为谷歌这次会按部就班发布 gemini 三点二,结果就在二零二六年五月十五日,多个独立爆料人同时确认,谷歌直接把版本号从三点二跳集到了三点五,代号卡布奇诺的 gemini 三点五 pro 检查点已经开始产出。 更让人意外的是,这次泄露的内容远远不止一个模型更新,从能直接生成完整交互式外部应用的多模态能力,到一个二十四小时全天候待命,甚至可能不问你就替你下单花钱的全时 ai agent。 谷歌几乎把原本要在 i o 大 会上讲的所有重磅内容提前四天全部摊在了桌面上。但就在所有人都在讨论谷歌这次终于要狠起来了的时候, the word 的 资深记者亚利克斯希斯从多个内部信缘得到的独家消息却给这场狂欢泼了一盆冷水。 他明确表示,下周二发布的新款 gemini 性能最多只能追平 openai 的 gpt 五点五,距离目前公认的前沿模型 missos 还有明显差距。 一边是跳级命名的重磅更新,一边是最多追评的性能评价,一边是成本低十几倍的轻量模型,一边是依然落后的编程能力。 今天这期视频,我们就把目前所有已经确认的信息拼在一起,看看谷歌这次到底拿出了什么,又到底在打什么算盘。 先从已经确认的事实开始讲起,这次泄露最早是从网友 lentos 开始的,他在 x 上放出了 gemini 三点五 pro 的 首批输出结果,其中最让人印象深刻的有两个例子,一个是 dualshock 四手柄的交互式蓝图拆解,另一个是题胡骑自行车的矢量插画。 可能很多朋友对这两个例子没有概念,以前的 ai 生成 svg 最多就是输出一个静态的矢量图,但这次 gemini 生成的已经不是简单的图像了,而是一个完整的交互式 web 应用。 那个提壶骑自行车的例子,自带七个维度的定制面板,你可以实时切换车架颜色、光照效果、提壶的头饰、车篮里的内容,甚至是蹬车的速度。所有这些交互都是用一个 prompt 直接生成的,不需要任何额外的代码修改。 这解决了 gemini 长期以来被社区吐槽最多的一个问题,懒。以前你给 gemini 一个生成 svg 的 提示,它经常会输出一个非常敷衍的结果,细节缺失,功能不全。 但这次不一样了,同样是 lentos 的 测试,它只用了一个非常简单的提示, gemini 就 直接输出了四个风格各异、细节拉满的机器人矢量图,每一个都可以直接使用。同期泄露的 gemini 三点五 flash 版本的跑分也印证了这个趋势。 lm arena 的 匿名测试显示, flash 版本在 svg 生成、交互式三 d 编码和动画处理上,已经超过了之前的三点一 pro 版本。 更炸的数据来自 abacus ai 的 首席执行官冰度雷迪,他放出的数据显示,即将发布的 gemini 三点二 flash, 也就是现在改名为三点五 flash 的 这个版本,在编码和通用推理能力上已经达到了 gpt 五点五的百分之九十二, 但 api 成本却只有 gpt 五点五的十五到二十分之一。这个数字如果属实,对于整个行业来说都是一个巨大的冲击,因为它意味着谷歌的蒸馏加稀疏化技术终于开始收获实质性的回报。 他们成功地把前沿模型的能力压缩到了一个轻量版本里,而且没有出现之前大家担心的质量断崖。不过,真正让整个行业感到震动的还不是模型本身的性能提升,而是谷歌同时泄露的另一个产品, gemini spark。 根据 testing catalog 提前扒出来的 gemini 网页版隐藏代码,谷歌正在测试一个名为 gemini spark beta 的 全新功能。它的定位非常明确,你的日常 ai 智能体全天候待命。这不是我们之前见过的那种需要你主动发指令才能工作的聊天机器人。 spark 是 一个二十四小时全时运转的后台程序,它可以替你处理收件箱,执行在线任务,管理复杂的多步骤工作流。为了做到这一点, spark 会从非常多的来源获取你的个人数据。 根据官方的引导文本,它可以访问你已连接的所有 google 应用、你的聊天历史,你设置的定时任务,你已经登录的所有网站,谷歌的 personal intelligence 信号,甚至是你的实时位置信息。 更重要的是,为了完成任务, gemini 会把你的姓名、联系方式、文件、个人偏好,甚至是一些你可能认为敏感的信息分享给第三方服务提供商。 这里有一个非常关键的细节,也是目前争议最大的地方。谷歌在风险提示里明确写道,虽然 spark 在 设计上会在执行敏感操作前征求你的许可,但他可能在未经询问的情况下分享你的信息或完成购买。 换句话说,他有可能在你完全不知情的情况下用你的账号下单买东西,也有可能把你的个人信息分享给你根本不知道的第三方。为了保持绘画的连续性, spark 还会保存远程浏览器数据,包括你的登录凭证和远程代码执行数据。 当然,谷歌也提供了相应的控制选项,你可以在设置里清除这些数据,关闭已连接的应用或者删除你的活动记录。但这个功能本身的激进程度已经远远超过了目前市面上所有的 ai agent。 根据掌握的信息, spark 的 前身是谷歌内部代号为 remi 的 agent 项目,之前只面向 google ai ultra 的 订阅用户开放。 从 remi 到 spark, 谷歌把 agent 从 gemini 的 一个附加功能直接升格成了一个七乘二十四小时的数字生活管家, 这也让他直接站到了两个最强大对手的对面, antropica 即将发布的托管 agent con 以及 openai 已经上线的七乘二十四小时 agent 平台。 除了 spark 之外,这次泄露的模型选择器界面还透露了另外两个非常重要的变化。第一个是谷歌原声支持了 m c p 第三方工具接入。在模型选择列表里,出现了一个之前从未见过的分类,叫做 m c p two testing, 也就是专门用于测试 m c p 工具的模型。 这意味着谷歌终于开放了通用的第三方工具生态,而不是像之前那样只能使用谷歌自己提供的有限工具。第二个是思维模式的全面重构。之前 gemini 的 thinking 模式是一个独立的开关,你需要手动打开才能使用。 而现在它变成了一个全局开关,分为两档, standard 模式适合大多数日常问题, extended 模式则用于求解复杂的长链条问题。把这些变化放在一起看,你会发现谷歌这次的更新其实是一次非常全面的体系升级,而不仅仅是单个模型的性能提升。 从模型能力到工具生态,从交互方式到 agent 形态,谷歌几乎对整个 gemni 产品站进行了一次彻底的重构。 不过就在所有人都在为这些新功能感到兴奋的时候,亚利克斯希斯的独家爆料却给我们展示了事情的另一面。 希斯在 ai 行业有非常可靠的内部信源,他之前的很多爆料都被证明是准确的。这次他明确表示,根据多个接近 deepmind 的 消息人士透露,下周二发布的新款 gemini 整体性能大致落在 gpt 五点五这个档位,距离 antropica 的 missiles 还有明显的差距。 这个评价其实非常耐人寻味,因为就在半年前 gemini 三刚发布的时候,他凭借着 l m arena 一 千五百零一分的一漏评分,几乎横扫了所有主流排行榜的第一名。但仅仅半年时间,随着 g p t 五点五、 cloud、 opus 四点七和 misos 的 相近发布,整个行业的格局已经被彻底改写了。 英国 ai 安全研究所的评测显示, missus 是 第一个同时通过其两套网络安全测试范围的模型,而 gpt 五点五只通过了其中一套,该研究所甚至公开承认,他们现有的评测框架已经快要跟不上 missus 的 能力发展速度了。 也就是说,谷歌用了半年时间,终于追上了 openai 上个月发布的模型,但依然没有摸到目前行业最前沿的边。而在所有能力当中,最让 deepmind 内部感到焦虑的就是编程能力。 希斯在他的爆料中,对编程部分的措辞是最重的,他说 deepmind 内部正面临着切实的压力,尤其是在编程能力方面,需要迎头赶上,而他们追赶的主要目标不是 open ai, 而是 anthropic。 过去一年, cloud 在 开发者群体中已经坐稳了默认编程工具的位置。不管是个人开发者还是企业团队,越来越多的人开始把自己的 ai 编程平台叫作 anti gravity。 这个工具在谷歌内部用的非常多,但在外部市场的表现却非常惨淡。根据公开数据,它发布四个月以来,开发者采用率只有百分之六。 这个数字对于一个 ide 来说其实不算慢,但跟 cloud code 和 open ai codex 的 势头比起来,差距就非常明显了。问题到底出在哪? xda 开发者论坛上个月做了一个阅读评测,让三个主流的 ai 编程工具完成同一个复杂任务。 结果显示, cloud code 第一次就准确理解了用户的创意提示,输出了符合要求的完整代码。而谷歌 anti gravity 的 输出用评测者的话来说,就像是用微软画图做出来的涂鸦,完全无法直接使用。 除了能力上的差距之外, anti gravity 的 定价策略也让很多开发者头疼。谷歌已经多次调整过它的定价模型,从最初的免费预览,到后来的信用点制度,社区论坛上关于额度用完没有提醒、莫名其妙被扣费的抱怨一直就没有断过。 但最为关键的问题在于,如今 ai 编程已经彻底出圈了,它不再只是专业开发者的工具,产品经理可以用自然语言描述需求,直接得到可运行的产品原型。设计师可以把 figma 搞丢进去,直接拿到可以上线的前端代码。 而到目前为止,谷歌没有任何一个产品能够进入这个对话。当然也有不同的声音,知名 ai 行业分析师海德尔就提出了另一个视角,谷歌可能并不打算通过跟别人跑同一条赛道来取胜,它们更大的重心在于打造一个更强大的多模态系统,而这需要更长的时间和更多的投入。 把这些信息拼在一起,我们其实可以看到一个非常清晰的行业格局,三家巨头正在三条完全不同的赛道上同时踩下油门。 openai 的 打法是靠迭代速度碾压,它们保持着几乎三周一个新版本的更新频率,不断推出新的功能和性能提升。 就在昨天, openai 刚刚给 codex 追加了 ultrafast 模式,把速度提升了两到三倍。同时还寄出了补贴站,三十天内切换过来的企业用户可以享受两个月的免费使用。 这个政策推出仅仅三个小时,就有两千名开发者响应。 anthropic 的 打法是靠模型质量封神,它们不追求最快的更新速度,但每一次发布的模型都能重新定义行业的前沿标准。 misos 的 出现已经让整个行业意识到,我们可能比之前预想的更接近通用人工智能。就在 openai 推出补贴站的同一天, opus 四点七 fast 的 模式,并且把 cloud code 的 额度提升了百分之五十。而谷歌的打法则完全不同, 它们既没有 open ai 的 迭代速度,也没有 antropica 的 模型质量,但它们有两个对手都无法复制的优势,十亿级的用户分发入口,以及完整的生态系统。 这就是为什么谷歌这次会把这么大的重心放在 a 阵子上。 spark 一 旦正式铺开,它就可以接入所有谷歌用户的 gmail 日历、云端硬盘、地图、购物账号。用户每天产生的海量邮件日程、浏览购物数据,都会反过来喂给 gemini, 用于下一代模型的训练。 这是一个 open ai 和 astropica 都很难复制的飞轮,它们可以做出更强大的模型,但它们没有办法像谷歌那样,把 ai 直接塞进十亿人的手机里,获取最真实、最丰富的日常数据。而这场表面上看起来是抢开发者的补贴战,底层逻辑其实比这要深得多。 现在已经可以确定 gpt 五点六的开发过程有 gpt 五点五的深度参与,未来的 ai 模型会越来越多的。自己写代码,自己改进自己, 谁掌握了编程工具的用户,谁就掌握了这个自我改进循环的加速器。这才是三家巨头不惜血本打补贴战的真正原因。他们抢的不是现在的那点订阅收入,而是未来通往 asi 的 入场券。对于我们这些每天都在使用这些工具的普通人来说,这场军备竞赛可能是二零二六年最划算的一件事。 我们会看到越来越多的补贴、越来越高的使用额度、越来越强大的模型以及越来越低的价格。但同时我们也面临着一个越来越重要的选择,你的工作流到底要压在哪一条赛道上? 是选择迭代速度最快的 open ai? 还是模型质量最高的 antropic? 还是生态最完整、分发能力最强的谷歌? 这个选择可能会在未来几年里直接影响到你的工作效率和竞争力。好了,以上就是本期视频的所有内容,如果你喜欢本期视频,不要忘记订阅、点赞、分享,这样就不会错过每一期的精彩内容。感谢收看,我们下期再见!

谷歌 i o 只剩几天, jimmy 奶这一轮更新也开始进入密集测试期。可以看到,这次不是单点试验,而是 flash pro 多个 check point 同步推进,节奏非常紧。 先别急着看版本号,真正值得关注的是,它们在轻量和高配两条线上,已经同时把门槛往上抬了一截。 先看 jimmy nike 三点二 pro 整体不差,但问题也很明显提升,没有形成那种一眼能感受到的跃迁,尤其是前端输出,老是反复冒出相似的 pino 风格,审美很快就会疲劳。可命名一改,局面就变了, jimmy nike 三点二直接切到 jimmy nike 三点五。而且 flash 和 pro 会一起在 i o 上亮相,这说明这次不是小修小补, 而是一次正式升级。真正把气氛拉满的是 gemini 三点五 flash, 它最夸张的地方不是能生成,而是能生成一个完整的 minecraft clone, 有 背景音乐,有组建,有健康条,甚至还能连服务器移动切换 creative mode。 更关键的是,整体完成度已经接近可交互。前端不只是象,而是真的把玩法骨架搭出来了。更有意思的是,名义上它还是 flash t, 但实际表现已经能和更高端的模型掰手腕,甚至在多次前端生成里压过一些老牌强项。它的变化还不只是更强,而是更会做布局更干净,层级更清楚,重复 pawn 明显少了,空间一致性也稳了很多。 最能说明问题的是那只鹦鹉骑自行车的阿斯基二。这种任务最考验长城结构控制,很多模型会中途散掉,但给 minion 三点五 flash 把字幅画完整撑住了,还能调背景色调、字体大小和扫描线, 也就是说,它不只是快,而是开始同时兼顾速度、推理和审美。所以这次最值得记住的不是某一个炫技案例,而是 flash 线的定位变了,它不再只是便宜、响应快的备选项,而是开始往又快又聪明靠近。 ai 竞争真正拉开的往往不是单次经验,而是谁能把高质量输出稳定地做成日常能力。关注全球 ai 速递,获取更多 ai 前沿资讯!

谷歌 i o 大 会放出王炸 g m n i 三点五, flash 免费开放,输出速度超过每秒两百八十个偷啃是 g p p 五点五和 cloud opus 四点七的四倍,成本不到对手一半。这不是加速,是降维打击。智能水平逼近旗舰模型,却用经济舱的价格给到所有人。 最狠的是专为 ai ai 整和编程优化。谷歌不跟你比参数堆砌,直接把速度和价格同时拉到地板上。当对手用免费武器打你的付费产品,这仗还怎么打?

距离 google i o 只剩四天, google 这边却先泄了两条大消息,一个是 gemini 三点五 flash checkpoint 已经上了 arena, 另一个是新 agent 功能 gemini spark 也开始流出。更反常的是,这个 flash 的 输出完全不像大家印象里的 flash, 它被挂在 gemini 三 flash 的 名字下面,但表现却像在隐身状态里偷偷升级过。外界测试里,它的结果甚至传出压过 gemini 三点一, pro 还领先 cloud 四点七 opus。 也就是说,一个名义上走速度路线的模型,居然在质量上正面顶住了高端推理模型,这就很不寻常了。 更有意思的是,对比前几天那批 jimi、 nike 三点二 plus 和 pro 的 泄露,官感完全不是一个级别。前一轮还偏平庸,这一轮已经明显更干净更完整,单轮外部应用生成也更顺,速度还保留着 plus 应有的快乐。 只是要提醒一点, arina 只是偏好型,精准赢了不等于真实能力就一定碾压,真正要看的是推理评测和复杂任务完成度。但这次最能说明问题的不是排名,而是时机。 damon 有 人直接拿这个新 checkpoint 做了一个 minecraft 克隆,而且完成度被认为是同类里最好的之一。 他不只是能生成页面,还能把主菜单、世界、创建难度选择这些交互跑通,甚至还带多人功能的尝试。这里释放的信号很清楚, google 可能真的开始把更强的东西拿出来了。这 这类模型竞争,最后拼的不是谁的名字更响,而是谁能把快、稳、能、干活同时做到位。 flash 如果真能做到接近高端模型的质量,又保留低延迟和高效率,那它就不只是一个便宜版本,而是会重新改写大家对模型分层的理解。关注全球 ai 速递,获取更多 ai 前沿资讯!

google 今天发布了 gemni 三点五 flash, 官方说这是最快最便宜的闪存模型,但实际成本有点意外, 每百万输入 token 要一点五美元,输出 token 要九美元,比上一代 gemni 三 flash 贵了五倍以上, 甚至比 jamming 三点一 pro 在 某些任务上还贵百分之七十五。不过速度是真快,编码能力也很强。以前这种闪存模型只能做简单问答,现在它能规划百万行代码的修复,还能同时派多个子代理干活, 相当于一个工程师团队协作实测前端设计。它生成了一个 windows 九五桌面,有启动音效,有 b o s 启动界面,有功能性的画图和记事本,比同类型模型更精致。 svg 方面也强,能直接把一句话转成复杂矢量图。三 d 场景更夸张,用它做了一个 z o 的 游戏环境,光照、深度、色彩都到位,还自动配了背景音乐。 google 把旗舰智能塞进闪存模型,想法很好,但用户得掂量掂量钱包。最适合的场景是需要快速出创意原型或者做复杂前端编码,毕竟它确实能省时间,以前三天拼的前端界面,现在三分钟就能跑起来。

别划走, google 昨晚干的这件事可能要改变你以后用 ai 的 方式,而且大部分人还不知道 google i o 大 会。半年没动静的 google 一 口气放完所有大招,最炸的就一个 gemini 三点五 plus。 你别看他叫 flash, 在 google 家里这本来是又便宜又快的入门档,结果这次他把上一代的旗舰三点一 pro 在 编码 agent 多模态上全给干翻了。什么概念?一个经济型模型,反手把上一代顶配按在地上摩擦, 而且它输出速度是别家前沿模型的四倍,价格还比三点一 pro 便宜了整整百分之四十!又快又强又便宜,这不可能,三角他真就给你凑齐了。 但最让我头皮发麻的是,这个 google 现场直接让他从零搭了一个能真正运行的操作系统出来,能敲命令行,还能跑游戏。兄弟们,这已经不是帮你写文案了,这是真能把活甩给他去干。更狠的是,这还只是开胃菜! 更强的三点五 pro 下个月就到,还有个叫奥尼的,能让你动动嘴就把视频改了。哎呀,一夜变天,普通人到底该怎么跟上?关注我?这些我一个一个给你扒清楚,别让你掉队!

今天是五月十九号,让我们看看上周 ai 圈又发生了什么。 先说谷歌明天即将到来的 ai 领域的重头戏 google i o 二零二六大会 将在太平洋时间五月十九日上午十点正式开幕。这可不是例行更新,据传 gemini 三点五 v o 四以及全新 gemini 桌面端的 gemini spark 都会在现场发布, 而且谷歌已经在大会前给 gemini 网页端做了预热式更新,新的主题样式已经上线 周使用额度机制做了调整,思考模式也被明确拆成了标准和拓展两档。谷歌现在能否和 cloud 四点七以及 gpt 五点五继续抗衡,就看它的 gemini 三点五表现如何了。接下来看看 openai 吧。 这周他们给拆的 gpt 手机端加了个 codex 的 远程控制,简单来说就是你可以把写代码这种重活挂在 mac 或者服务器上跑,自己拿着手机在外面溜达,遇到报错或者需要合并代码,手机上点一下审批就行了,这明显极大方便了远程办公 程序员,距离授权工程师的完全形态又进了一步。蚂蚁集团这边动作也挺快的,上周刚发了拎影,这周又开源了一个万亿参数的思考模型 ring 二点六一 t。 这个模型属于那种专门干重活的智能体引擎,数学啊写代码啊这种高难度任务他比较擅长,里面还专门搞了个强化学习算法, 据说是为了解决大模型长时间跑任务容易崩溃的问题。感觉他们是铁了心要在复杂任务这块卷到底了。还有一个比较有意思的是, thinking machines 前 open ai 核心成员搞的发了个多模态模型 t m l interaction small, 他 直接把那种你一句我一句的回合制聊天给废了, 能在你说话或者做动作的时候同时给出反应,延迟大概两百毫秒吧, 感觉以后跟 ai 聊天终于不用傻等它回复了。视觉和控制这一块呢。字节跳动开源了一个全能智能体 u i tars 一 点五,为了方便大家在自己电脑上跑,还特意发了个七十亿参数的清量版,主要就是帮你操作电脑桌面的定位还挺准的, 算是个不错的本地小助手底座。然后是英伟达他们开源了萨纳模型,原声支持四 k 声图,重点是它特别省算力,参数量只有 flex 的 二十分之一,速度却快了差不多一百倍。它们还顺手发了个视频生成版本。 再来看看开发工具 curser 更新了内置的 composer 二点五代码模型,底座是开源的 kimi 二点五跑分基本追平了现在最顶级的模型,但重点是它很轻,跑一次任务成本不到一美元, 对开发者还挺友好的。 andromic 那 边呢,给 cloud code 弄了个原生的命令行面板, 以后挂机跑那些耗时的代码任务就方便多了,不用开一堆窗口,直接在后台跑就行, 算是个提高幸福感的小更新吧。还有就是 metta 他 们搞了个叫 fast bite latent transformer 的 底层架构, 直接绕开了传统的分词器,做到了字节级别的并行解码,不仅省显存,速度也快了不少,感觉底层架构这块大家都在拼命优化。最后快速过两条短信,首先是 openai 发布了专为网络防御团队打造的 daybreak 平台, 利用内置的 codex 智能体在代码仓库里自动查漏补缺,还给配了个最高权限的预览模型,做安全的同学可以关注一下。第二条是何凯明团队发了篇新论文,提出了一种叫 e o f 的 语言扩散模型,打破了传统的竹词预测, 直接在连续空间里像处理图像一样生成文字,只用十分之一的训练量就干翻了一票,主流方法挺硬核的。接下来看下上周全球前十的生成式 ai 产品访问量排名, jamie 掉第五有段时间了,豆包现在已经在前十站住了脚。 然后再看一下近一年生成式 ai 访问量的变化。最后再看看本周 hugging face 上热度前十的开源模型有哪些,这期就这样,感谢收看!