gemini 三点五 flash 发布三天变美国大豆包,这不是什么野鸡 ai, 这是谷歌三天前才在 i o 大 会上吹上天的 gemini 三点五 flash, 官方说它速度是一重一线 ai 的 四倍,性能远超自家前代旗舰,二十四小时不到就开始降至现在全网统一评价。快是真的快,蠢是真的蠢,它唯一的优点就是更快的告诉你错误答案。 有人让他写个护肤科普,肩带三点五开始犯病,直接给你输出几十行,死死死。 有人让他算三百加一百四等于多少,他一本正经的告诉你,等于四百六啊。很多人说这是谷歌的服务器,顶不住偷偷砍算。我翻了几百条开发者社区的贴子。第一个真相,他的默认是 high 档位, 而三点五 flyx 官方写的是 medium, 但实际逆向出来的却是 low。 为了达到二百八十九 tok 每秒的恐怖速度,他把所有能省的步骤都省了, 深度推理砍了,逻辑较验砍了,甚至连最基本的算术计算都懒得调用工具。第二个真相,它涨价了三倍,还更费 tok。 上一代三 flyx 的 每百万输出是 tok 零点五美元,输出九美元。 更坑的是,为了完成同样的任务,他会在后台进行更多无效的自我修正,导致 token 的 消耗量平均上涨了百分之四十。第三个真相,发布会吹的 computer use 功能上线直接没了,官方连个解释都没有,好像从来没提过这事一样。 那谷歌为什么要这么做?答案很简单,下个月要发布三点五 pro 了。这是谷歌玩了无数次的老套路,先发布一个吹上天的阉歌版,让所有人来测试,把流量炒起来,等大家骂他笨的时候,再推出一个真正好用的 pro 版,让你心甘情愿掏钱。而且他还故意把旧的 flash 模型下架, 要么用轻的更贵的 flash, 要么等更贵的 pro。 也许从某种角度来说,人家这是精准的商业算计,用一个阉割版模型吸引了全球流量,还涨了价,顺便为下个 pro 版铺路。大模型的军备竞赛早就变味了,现在比的不是谁更聪明,而是谁能把用户当韭菜割的最舒服。
粉丝23获赞1077

今天凌晨,谷歌 i o 二零二六如期而至,随即宣布 gemini omni、 gemini three point five、 flash 等等一系列新产品。 这是什么?硅谷年夜饭?算粒满汉全席。媒体老师也非常懂事,标题直接起飞,谷歌亲手淘汰谷歌 视频版 nano banana, 全能 ai 创作引擎,全场最大的 c 位,毫无悬念给了 gemini omni。 这玩意号称是真正的全能大模型,能吃进任何形式的输入,拉出任何形式的内容。文本、图片、音频、视频,只要你敢喂,他就敢接, 而且首发支持视频输出,江湖人称视频版 nano banana。 你 看这个排面,劈柴哥和哈萨比斯同台登场,大招跟不要钱一样往外扔。他们说 omni 不是 在简单拼接素材, 他是在理解物理世界。以前的 ai 画个物理现象,重力和动能常常让牛顿想从苹果树下爬起来打人。但阿米不一样,哈萨比斯说他实现了阶跃变化, 氨基酸折叠都能给你干成科学准确的定格动画。甚至你拿个手机自拍,手心里画个圈,他就能立刻给你生成一个黑洞。看起来这不仅仅是降维打击,这简直是从四维空间扔了二象薄, 画面太美,数据太狂,狂到让人觉得好莱坞明天就得集体去送外卖。但这还不够刺激,发布会的另一个高潮是 jammer 三点五 flash。 只要你懂点行,你就知道现在的大模型卷速度卷到了什么地步。 三点五 flash 在 精准测试里,把自家前代旗舰 jammer 三点一 pro 按在地上疯狂摩擦,更离谱的是,它的输出速度直接翻倍,对比 gpt 五点五和 opus 四点七,速度快了四倍有余。这什么概念? 你这边的提示词刚敲完回车,他那边的答案已经糊你脸上了。天下武功,唯快不破, ai 界直接来了个闪电侠。 这还没完,谷歌还顺手倒出了一箩筐的重磅炸弹。 anti gravity 二点零桌面应用直接进化成 agent 的 开发平台。 james park, 七乘二十四小时在线的赛博打工仔。不需要五险一金,不需要情绪价值,只要服务器不断电,它就能给你打工到宇宙热季。 顺带把 jimmy 也改版了,代号 neuralexpressive, 改成算力计费。你以为他在做慈善,其实他在教你什么叫资本的洋谋。 甚至连搞了二十五年的谷歌搜索都迎来了史诗级升级。接入三点五 flash 智能搜索框,自动生成小程序。这一套组合拳打下来,干货密度堪称历年之最。大场发力,寸草不生。 那你说这东西真的这么神吗?往往打榜数据越炸裂,发布会的 ppt 越精美,里面的水分往往就越能养活一太平洋的鱼。 我怀着激动颤抖的心,拿着号称能改变世界的 omni 进行了实测。这需求可太真实了。毕竟咱们干自媒体的,天天盯着各种 ai 视频工具找灵感,就指望他们能帮着出大片,但结果给我看笑了。哎, 硅谷的公关稿还是太保守了。这哪里是改变世界,这简直是重新定义了拉胯。宣传片里是好莱坞质感,随手一划就能变黑洞。小提琴手在雪山和赛博朋克之间无缝切换。物理逻辑严丝合缝。 到了我这呢,我输入几段简单的指令,生成出来的视频,当场给我整出了工伤。说好的理解世界呢?服务员你好, 我想要一杯客了!好的,没问题!这一刻,我都怕他给我念出一段大悲咒来超度我的显卡。那些在发布会上惊艳全场的连贯性记忆力和物理法则,在实测面前碎的渣都不剩。 这不叫接月变化,这叫当场火化。网上的各路媒体还在疯狂吹捧热搜,通稿满天飞,但和实际效果一比,简直是截然不同的两个平行宇宙,那还能说啥了?看完这场魔幻的体验,我算是彻底清醒了。 现在的 ai 圈有一种极其不健康的畸形风气,只要打榜厉害,只要 ppt 做的炫,就能吹成天神下凡。 巨头们在台上拿着特供版的 demo 疯狂秀肌肉,底下的信徒们跟着无脑狂欢。 ai 好 不好用?只有我们这些一个个坐在电脑前疯狂敲着键盘,试图用它来铲除实际价值的用户给出的真实反馈才算数, 你数据再炸裂到了用户手里,变成了一坨赛博垃圾,那他就是毫无价值!请这些 ai 公司收起你们的滤镜吧!面对用户的实测反馈,少吹点牛,多打磨点细节,这才是对技术真正的尊重。这里是起点世界,聚焦最新 ai 资讯,我们下期视频不见不散!

谷歌刚刚发布了 jimmy 三点五 plus, 同时还把他们的编程工具 antigravity 升级了二点零,那这次就很明显了,谷歌的话这次是要全面提升它的这个抠点能力。之前不管是在 coi 还是 ide 还有模型, 其实给我的感觉就表现很一般,那这一次的话,这个模型最大的亮点官方说就是它的这一个速度啊,是前模型的四倍, 所以这一期我们就测一个最关键的问题,这么快的速度,它整个的一个代码质量会不会缩水?那我直接会拿两道真实的一个编程任务,把它和 cloud op 四点七, gpt 五点五放到同样的项目里面,同样提示时看它大家的一个表现情况。那下面的话,我们大概去扫一下它官方改出来的一个奔驰 mark 评分哈, 在编程方面的话,主要就看这一个 terminal, 奔驰二点一,还有这一个 sw 一 奔驰 pro, 从这个评分看的话,这一个 jimmy 三点五 plus 这个评分还是可以的哈,但是基于我之前对于谷歌模型实测的结果来看,就是评分不代表一切,因为之前就感觉它在这个编程方面挺拉的,这次我们就看整个的一个三点五 plus 表现到底怎么样。那这一次的话,我们的整个测试题目哈,就是沿用之前测试 cloud of 四点七,还有就是 gpt 五点五的两道真实的一个编程任务。第一个的话就是我们这一个 skills agent 嘛,需要把它从一个 c o i 做成一个 web ui。 第二个的话是希望他从一个已有的比较复杂一个项目里面把这个认证登录给它迁移过来,这一块也比较复杂,需要支持啊, get 谷歌,然后还要做一个落地页。好,我们来看一下这两个实测项目哈,左边的话,就我刚刚说的这一个 skill is a 镜头嘛,第二个的话就我们图片生成 a 镜头,那这次的话,我们是用了这个 anti gravity 它的一个 c o i 终端工具, 整体这一块呢,它的交互的话是跟呃卡扣的很像,那我这边测试下来,他的速度是真的快,相当相当的快,他说四倍,一点都没夸张。 那大家看一下它这个交互的一个情况啊,其实还是感觉挺挺好的。这个交互,那至于整个模型的能力怎么样,那这两个任务我这边实测下来,它都没有一次性的去完成,它或多或少都有一些小问题。那同样的这个提示值,在同样的项目,我给到了 gpt 五点五 以及 calloff 四点七,它都是能够一次性完成的,不管这两边哪一个项目都可以完成。但是 gmail 三点五 plus 它除了快,但它其实还是会有一些或多或少的 bug 嘛。好,我们来看一下它整体的一个表现情况。 好,我们来看一下这个是 jimmy 三点五 plus 帮我们完成的 skus agent 的 一个 ui 界面嘛,它可以去执行一些操作,比如说我给他一篇文章,可以让他帮我们去总结,它就会去加载这个的 skus。 就 我之前有一期视频 专门讲了这个 skills 的 一个工作原理嘛,那这是它完成的一个效果,整体上 ui 这块还 ok, 那 这边的话是 g p d 五点五给我们完成的,左边也是有我们的一个的一些 skills 是 哪一些?那右边的话就是它整个的一个操作的一个过程嘛。怎么说它这个 ui 的 一个结果的话,我觉得就是呃 g p d 五点五的会好一些。 那关于图片生成这个项目,让它去做一个落地页,以及让它去做一个就是谷歌 get 五的认证登录嘛,那这块它也是完成的,但是不是一次对话完成的。 u i 这块的话就是谷歌还是可以的,就是相较于 g p t 五点五的话,我觉得还是会好一些,就 u i 这块的话,我们还是优先选择就是谷歌的模型嘛。 好,下面我们来看下整体这个评分结果哈,那这个评分的话,还是跟之前一样,我们是把所有的模型生成代码通敏之后,然后改到模型去做 review。 那 这边的话 g p t 五点五是要胜出的,它的分会高一些。 第二个的话就是 cloudoff 四点七会辞职,那 gpt 三点五 plus 的 话,它整体评分效果会低一些,也就是它除了快,那代码质量上的话是会差一些。那这边的话也有些解决方案,比如说你可以用 cloudoff 四点七做设计,或者 gpt 五点五做设计,然后再用呃 jimmy 三点五 plus 去做执行。 那这块儿它还不是还发布了这个 anti graphic 二点零嘛。那这个 id 的 话,你就把它等同于 codex 吧,跟 codex 一 模一样。那我这边的话 现在还登录不进去,不知道啥问题。好,下面我们来进行一个总结。那这次他的整个编码水平的话,就是速度上确实是领先很多,但是在交付的一个结果上来看的话,跟国外两家模型还是有差别,尤其是在一些复杂项目里面,他还是会有偷懒的情况。 如果你是需要去做一些原型啊,或者做一些 u i 啊,我觉得这个 jimmy 三点五 plus 真的 是有比较有吸引力,因为它整个速度比较快,而且它的价格也比较便宜。那如果你是需要一些复杂的项目啊,多文件呀,那阶阶段我还是更推荐大家使用 g p d 五点五,在 codex 里面 你运行起来也非常的快。扣袋子这个 app 我 强烈推荐给大家用,我已经最近用了一个多月了,真的非常非常的好用, card 的 话就是封号真的特别严重,我已经放弃了。 ok, 那 这就是这期视频所有内容了,如果大家觉得这期视频做的不错,可以跟我一箭双雕,我是阿江,我们下期见,拜拜。

朋友们,今天凌晨,谷歌扔出了一枚深水炸弹。就在刚刚结束的 google i o 二零二六大会上,谷歌宣布推出 gemini 三点五 flash 模型,并且向全球所有用户免费开放。这不是阉割版,不是试用版,而是谷歌宣称的迄今为止最快、最有效的模型。 它可以接受任何形式的输入文字、图片、音频、视频,用户甚至可以用自然语言直接编辑视频。谷歌在现场算了一笔账,对于头部企业来说,如果把大部分工作负债切换到 flash 系列模型,每年节省的成本可能高达十亿美元级别。免费开放多模态视频编辑,年省十亿, 这不仅是模型升级,这是全球 ai 巨头在用极致性价比重构竞争格局。很多人可能对三点五 flash 这个命名没概念,我帮你翻译一下。 第一,速度快得离谱。谷歌表示, g m 三点五 flash 在 输出令牌速度上是其他前沿模型的四倍,而在优化平台上的版本,速度还能再提升到十二倍。什么概念?你以前问 ai 一个问题,等三秒才有回复,现在一秒不到答案就出来了。第二,性能不降反升。你可能会想,速度快是不是牺牲了智能? 恰恰相反, gemini 三点五 flash 在 多项精准测试中,超越了四到五个月前的旗舰模型。在代理式 ai 能力、代码编辑、多模态理解等关键维度上,三点五 flash 都达到了前沿级别的水平。用谷歌的话说,性能是旗舰级,成本只有三分之一到一半。第三,真正的多模态来了。 gemini 三点五 flash 可以 接受任何形式的输入文本、图片、音频、视频。更炸裂的是,用户可以用自然语言直接编辑视频。你说把这段视频中的夕阳调亮一点, ai 立刻执行, 不像是模型升级,更像是人机交互方式的彻底重构。第二部分,谷歌的阳谋,用极致性价比打一场价格战。很多人问谷歌为什么要免费开放,低价收费?难道做慈善?答案很简单,抢市场、抢用户、抢生态。第一, ai 的 竞争已经从参数竞赛转向成本竞赛。谷歌现场算了一笔账, 目前头部企业每天在谷歌云上处理海量 token, 如果把大部分工作负债切换到 flash 系列模型,每年节省的成本是十亿美元级别。 对于正在烧钱搞 ai 的 企业来说,成本就是生死线,谁能在保证性能的前提下把价格压到最低,谁就能抢走对手的客户。第二,谷歌要用免费圈住十亿用户。 gemini 应用的月活用户已经超过九亿,一年前这个数字只有四亿。谷歌搜索 ai 模式的月活用户也在一年内突破了十亿。策略很清晰,用免费的 flash 模型留住 c 端用户,用低价的 a p i 吸引弊端开发者。当所有人都习惯了 gemini 生态,谷歌的 ai 收入就会像当年的搜索广告一样源源不断。 第三,谷歌有降维打击的底气。自研芯片,谷歌使用的是自研 p p u, 而不是像其他厂商那样采购英伟达 g p u。 自研芯片意味着更低的单位算力成本、更高的利率。二零二六年,谷歌预计资本支出将达到一千八百亿至一千九百亿美元,六倍于二零二二年的三百一十亿美元。 这种不计成本的投入,就是在为未来五年的 ai 算力霸主地位铺路。谷歌 ai 大 模型升级,最直接的受益者不仅是谷歌自己,还有整条 ai 算力产业链,大模型训练和推理需要海量算力。 杰米尼三点五 flash 的 免费开放,意味着全球用户的使用量将暴增,直接拉动 ai 服务器需求。据产业链消息,谷歌 tpu 机柜总数量预计将从二零二六年的约六万柜,快速成长到二零二七年的约十点五万柜,年增幅高达百分之七十五。工业复联 ai 服务器代工龙头,深度绑定英伟达、谷歌等大客户直接受益。 互电股份 ai 服务器 pcb 核心供应商、 pcb、 数据中心等领域的订单持续增长,大模型参数越大,数据传输需求越高。 光模块是 ai 算力集群的神经系统中继续创全球光模块龙头。一点六 t 光模块已批量交付。谷歌 gemini 流量增长将直接拉动八百 g 一 点六 t 需求。 天福通信一点六 t 光引擎规模量产,深度绑定海外头部大客户业。三点五 flash 的 免费开放受益于 ai 数据中心互联需求。 gemini 三点五 flash 的 一大亮点是端侧轻量化,让更多中低端设备也能流畅运行本地 ai 功能。瑞生科技向 ai 手机 x 二可穿戴设备输出光波导、高端散热系统等感知方案。康奈特光学、夸克 ai 眼镜独家镜片供应商受益于 ai 端侧设备放量。当然,话要说回来, 第一, gemini 三点五 flash 的 免费策略可能会引发整个 ai 行业的价格战,如果竞争对手被迫跟进降价,整个行业的利率可能被压缩。 第二,谷歌 tpu 供应链相关标的近期已有较大涨幅,工业复联中继续创等估值处于历史高位,短期追高需谨慎。第三,谷歌的资本支出虽然庞大,但能否持续产生回报,还需要看 ai 应用的商业化落地节奏。 总之, gemini 三点五 flash 免费开放是谷歌在 ai 成本占中的一次亮剑,它的意义不亚于当年安卓系统免费开放。 用极致性价比抢下生态入口,再用生态反捕算力投入工业复联在造服务器中继续创。在铺光模块,天府通信在生产光引擎,瑞生科技在布局端测硬件。当谷歌用十亿用户、万亿 toker 向全球宣告 ai 不 再是奢侈品时,中国算力产业链上的卖产人正在闷声发大财,这个赛道的故事正在翻开新的一章。 好,这个话题就聊到这。以上内容和提到的公司是基于公开信息的逻辑梳理与产业推演,不构成任何投资建议。市场有风险,投资需谨慎。

瑞平内外 ai 大 模型从夯到拉,首先是开山鼻祖 chat gpt 五点五推出之后可以说是全面到离谱,不仅可以自己规划任务,还能自己调工具改代码,虽然价格比五点四贵了一倍,但它完全值得,综合能力稳坐目前第一梯队,给到夯爆了。 接下来是 gemini, 五月二十号凌晨,谷歌发布了 gemini 三点五 flex, 命名直接从三点一跳到了三点五,不难看出谷歌对这次更新的信心。实测下来,三点五 flex 在 编码测试和 a 帧的能力上都有不小的提升,输出速度更是比其他前沿模型快了四倍。而更强的三点五 pro 也确定在六月发布, 据爆料, gemini 三点五 pro 的 性能直逼 gpt 五点五,有望撼动王座,但三点五 flex 的 话目前只能给到顶级。 接下来是 deep c 可 v 四,优点非常明显,一照上下文混合推理,代码牌全球第三,价格便宜,量大管饱,但硬伤也很明显,没有多么太,还是纯文本, 在神仙打架的今天,普通用户够用,但专业用户用起来还是差点,感觉可以给到人上人。接下来是 grok 四点三,从某些你懂的方面来说,它称得上是憨爆了,但专业任务处理上稳定性不强,事实准确性在主流旗舰里垫底,还是偏向 ai 玩具,不适合拿来做生产任务。等级给到拉完了, 接下来是 cloud ops 四点七,写代码这块它还是当之无愧的王者,综合 agent 能力也是第一梯队,而且幻觉很低,逻辑严谨,写出来的东西不用反复改,给人的感觉也是最没有 ai 位的,等级给到憨爆了。 接下来是豆包 c 的 二点零 pro, 豆包很多指标其实不算差,而且功能丰富,门槛极低,并不是不能打。它最大的问题是不够稳定,复杂任务容易给出看起来不错,但经不起推敲的答案。 它是国产 ai 里最好的普及选手,但不是最强的专业选手,所以综合下来只能给到 npc。 接下来是千问三点六。阿里这次更新确实有不少亮点, agent 编程能力全面突破,复杂代码仓库级问题,前端开发、长城规划全面领先,而且加量不加价,但它的升量更多是在 b 端, 普通人对他的认知大多还停留在薅奶茶的阶段,勉强给到人上人。接下来是混元,腾讯从 openai 挖人重建了团队推出的混元三,上线两周掉用量就翻了十倍,整体势头是往上走的。但说实话,这波更多是开发者尝鲜带来的数据,脱离了腾讯生态之后,他的存在感依然有限,能力到位了,但记忆点还不够,只能给到 npc。 接下来是智普 g l m 五点一,编程 agent 能力开源第一 s w e bench pro 刷新国产记录,很多海外用户为了买上便宜的国内套餐,已经开始研究怎么注册支付宝。 这波热度是真实的市场验证,它不是那种大众热搜型模型,但是真到干活的时候,表现还是很能打的,可以给到人上人。接下来是 minimax m 二点七,它在开发圈子里口碑不错,速度快,价格便宜,工具调用稳定。今年一季度 openmarter 周掉用量更是拿下全球第一。不得不说它是一个好用选手,但还不是那种能改变格局的选手,目前只能给到 npc。 接下来是 kimi k 二点六,一个被很多人低估的选手,很多人对他的印象还停留在长文本阶段,但这次升级,他的代码能力提升了百分之二十,任务能力和 ab 的 能力都有大幅提升,已经可以给到人上人。最 后是文星五点一,号称 ab 的 能力超越了 deepsea 威斯 pro, 但本质只是对五点零做了压缩蒸流,说到底只是效率的提升,并不是能力的突破。这家总是起个大早赶个晚集,直到今天除了搜索能力还是没有什么记忆点,直接给到拉完了。最后声明,本期排名纯属个人观点,没有任何利益,相关方有不同意见,欢迎评论区讨论。

谷歌的界面的三点五正式上线了,整体的实力大幅提升,在多模态识别代码的边写以及智能交互体验都相当的不错,运行也很丝滑流畅,还支持大容量的上下文创作和办公,都很适配, 新手也能轻松的上手使用。大家好,我是温谷,我相信有很多小伙伴们已经在界面的官网中已经使用了三点五这样一个模型,我教大家三个使用方法,适合自建工作流, ai 的 写作、文案生成、图片、海报和抖音运营的同学。 第一,课请求调用,适合在工作中前开始调试。第二,通过 python 代码的 sdk 的 调用,适合自建 skills, 最后给 open claw 和 hammer agent 使用。第三, n 八 n 工作流使用,适合打造自己的数字能演示。一,我们用这个课请求来试一试, 好吧,然后课请求就是 c u r o, 这个大家可以往上搜一下,大家可以看一下,就是我这里 api 的 端点,就是 generate language, 谷歌点 api 点 com, 请大家注意一下这个,它不是一个呃, open ai 的 标准的一个模式,就是 如果你是那个 open ai 的 一个标准的模式,它应该是左斜杠杠归,然后再左斜杠 chat 它,这个不是,所以说我们一般做调试用,可以看一下这里面,我这边的这个,你看它后面紧接的模型是 jame 三点五, flash, genevate content, 然后 key 就 跟到我这个 key 啊,这个这个,我 key 把它暴露出来没?其实没有关系啊,因为反正这也是免费的,你看他是,你是一个专业的专业助手,解释一下什么是 leg 这个技术啊,他就已经回复了,从那里看这个这么多模型。那其实啊,这也不是我说的是这个,这个我给大家看一下, as 丢了的话,你去 get 这个 apikey 啊,我这里有好几个 apikey, 拿到这个 apikey 以后,哎,你就可以去做这个啊,就可以去把这个呃,你的 apikey 放在这里就可以做调试使用,调通了以后,你再把这个再去放到代码里面进行调试啊,然后这里它有一个这个 这个限制的。在这个地方啊,你可以看一下这里的 c 末啊,有个三点五 flag, 我 找一找啊,他这个用这个表经常会刷新的,哎,这个有个 jimi 的 三点五是吧?这是个文本输入过大模型, 它的 p r m 也就是每分钟的这个 token 啊,就每分钟五个这样是吧? t p m 这个是代表它每分钟的 token 数,它每分钟给了你两万五千个 token 啊,所以说你养龙虾可能够呛,但是你做这个自动化变卖流啊,是吧? n 八 n 啊,包括底价都是没任何问题,它一个这个分钟应该是可以, 应该是每秒了,是吧? pick lock, 那 每分钟给允许你掉五次是吧?每每分钟给你两万五千个头等,这应该是够用的啊。这个这是最最近昨天更新出来的,因为昨天这个谷歌二零二六的开发者大会是公开了个 gmail 三点五 啊,然后那个杠 max 啊,还 pro 还没有发布吧?应该是啊,但是呢, flash 应该非常强了啊,非非常强,他现在给大家免费的话,呃,大家一定要去用啊。然后第二种用法的话,就是我这个地方调了一下这个这个这个这个这个地方给大家看一下,就是 啊,这里是生成一一张什么图片啊?这这这个倒没什么,这个是我,我那个是纹身图的,是吧?我这里是用的这个谷歌的追未来的一个这个 sdk 啊,大家去引入这个 sdk 啊, flunk 谷歌 input 的 追未来 ai, 然后你下载它的 sdk 就 可以用了,是吧?然后再把我的 api 放进去,你可以跟我老师给大家演示一下啊。好, 我逻辑了下,我这里可以总共使用有五十二个模型啊,有些是收费的,有些是免费的,然后等一等, 哎,这里出来了,是吧?做的是一个让他设计这个一个品牌的一个文案,是吧?文案是吧?对对对,好, 那第三种情况也是大家常最常用的,就是这个在 n 八 n 里面这么用的,我把它拿过来给大家看一下,这个是刚刚跑出来的结果啊,之前我演示的是这个,用这个魔大平台,这个地方我用的是谷歌的,是吧?谷歌的这个是吧?然后这个地方你需要把这个 api 塞上去,哎,这里塞上去以后它连接成功了,连接成功了以后, 在这个地方你可以选择它的模型了,是吧?你一定要选择三点五是吧?最早啊,就是上周前指的免费的模型,就是街面的二点五那个比较拉快啊, 是吧?已经谷歌让我们二点五已经是发布两年前的模型啊,这个是昨天最新的模型,呃,比较强大。其他的都是收费的啊。其他这个 pro、 pro、 vivo 啊,包括这个 max 啊,都是收费的。但是三点五 plus 目前是免费的啊,为什么是免费的?刚刚跟我老师给大家看的是谷歌官网,是 是选选择,目前是现在是免费的,应该他在开发者大会上已经说了这个是免费给大家用,我相信他也不会说他给大家用一两头就关掉他,是吧?谷歌应该丢不起这个脸,是吧?好,然后这个给大家跑一下吧,对, 跑一下,这个乱乱一下就好了,哎,这个我是做了一个这个新闻的整理啊,就是第一步就是我再去搜索这个新闻,是吧?然后搜索到新闻,最后拿到这个新闻的素材,是吧?然后把这个套的新闻给我整理出来,最后拿到这个话我就会发到什么,是吧?是吧?某某抖是吧? 啊?你看这个是今天上午啊,五月二十一号的 a i 新闻,等等等等,是吧?是吧?噔噔噔噔噔,好,这是我今天给大家三个用法,希望大家去调试和使用,有问题的话小伙伴可以在这个评论区留言,我看到都会回复大家的。

google gemini 三点五正式上线,这次的核心突破不是聊得更聪明,而是能真的把事做成。官方直接用 frosheine 定义它。前沿智能加上实打实的行动能力,说白了, ai 不 能再只停留在回答问题的阶段,得能主动推进任务,解决实际问题。 率先登场的是 gemini 三点五 flash, 目前已经全面落地 gemini app 搜索 ai 模式, google ai studio、 android studio 里都能用到,开发者也可以通过君明莱 a p i 调用模型 id 就是 gemini 三点五 flash, 而且已经 ga 正式可用。不是小范围测试, 是 google 真的 准备让开发者和企业直接用到生产场景里。这次更新最关键的三个能力,每一个都瞄准做事。一是百万级上下文窗口, 能轻松处理超长文档、整个代码库甚至大型项目资料,二十六万五千字的输出上线,不再是碎片化的短回答,能生成完整的方案、报告或代码。三是支持思考、练工具调用和长流程任务。 它更像一个能自主推进的智能助手,而不是简单的聊天机器人。在我看来, ai 竞争已经悄悄换了赛道,过去大家比的是回答像不像人,文字流不流畅。但接下来真正有价值的,是 ai 能不能理解你的目标, 拆解步骤,调用合适的工具,然后一步步把任务跑完。这就是 a 阵的时代的核心 ai, 从对话伙伴变成执行助手。 google 把 jammer 三点五铺进搜索 app 开发工具和企业平台,其实是在抢 a 阵的时代的入口。 以后你用 ai, 可能不用特意打开聊天框问问题,它会主动帮你整理项目资料、调试代码、查最新信息,写完整方案,甚至持续跟进整个工作流。还有个重要信号, jammer 三点五 pro 已经在 google 内部使用,官方说下个月就会推出。 flan 是 主打速度和落地, pro 大 概率会负责更复杂的推理和任务执行。所以这次发布不是结束,更像是新一轮 a 阵的竞赛的发令枪。你现在更倾向把 ai 当聊天助手,还是能帮你做事的执行助手?评论区聊聊你的看法。我是尼库,关注尼库科技,每天一条,帮你把 ai 的 下一步看得明明白白。

昨天 demo 三点五 flash 更新了,最大的利好是谁呢? hyperframes? 如果你不知道 hyperframes 是 什么,那你稍微在 ai 圈有点落伍了。简单来说,它就用 ai 做视频的工具。之前咱们在视频里边也提到过 remotion 这个工具,它们两个都是用 ai 来做视频的,都用的是前端技术。但是我对它俩的看法是截然相反的。 当时 remotion 出来的时候,我就认为它用的是 react 技术定义的一堆 components, 强迫用 react 技术的话,就会把你死死的控制在这个圈儿里。虽然它也是前端技术,没有那么难,事实上它限制了很多东西。但这次 hyperframe 出来之后,我一看它的技术栈 itemix 加上 gcep 这个前端的动画库, 我就知道这个东西一定会非常火,一定非常好用。因为它最简单只是 atml 加 js 加 gcep 的 动画库,甚至它允许你在里边加上 three 点 js 或者其他的前端的动画库。这样一旦你在网页上可以做到所有的动效字体 转场,你想象的任何东西都可以在你的视频里实现,这样生产视频的想象力被无限的放大了。为什么说 jimmy nike 的 这次更新立好 hyperframes 很 简单,因为 jimmy nike 的 前端编码能力实在太强了。还记得之前 jimmy nike 三出来的时候,前端技术做各种炫酷的效果,什么圣诞树,还有各种粒子效果,如果把这些动效和效果加入你的视频里边儿, 画面应该有多精彩。这次三点五 flash 的 更新,它增加了多模态,再加上它超大的上下文窗口,所有这些加在一起,让你的视频变得无限可能。对于我这种程序员出身,审美没有那么好的人,这是一个降维打击式的优势。如果你的审美已经很好的,再加上一些对细节的控制,你的视频可以轻松达到非常专业的级别。 光说不练,单人屏下面展示一下我用 jimmy 三点五 flash 再加上 hyperframes 做的我自己网站宣传的视频的效果。 record videos like a pro without memorizing a single line viral prompter keeps your eyes near the camera with smooth scrolling then lets you shoot in crisp 4k at 60 frames per second no monthly fees just 1999 once for lifetime access download viral prompter on the app store。 好 了,今天视频就到这里,希望这个视频可以帮到您,谢谢大家!

大家好,今天早上,呃, google 开了他们的 i o 大 会,然后也正式推出了 gemini 三点五 flash 的 新的模型,然后我们现在来快速测一下,看它的能力怎么样。 这第一个我要它创建一个 ppt, 然后大概是一个呃客服的一个系统,然后要六页 ppt, 然后它们的字体要清晰啊,然后要每个问题有一个,呃自己的一个,嗯, 要产品要有一个,然后问题有一个,价格有一个,然后啊,等等最后的一些一个流程吧。然后他根据我的需求呢,先制定了一个计划啊,这是他的计划,然后我可可以继续,我们看一下怎么样,这个地方需要跑,那我就继续。 好,这个结果出来了哈,就是就是他做的 ppt, 感觉这个审美还是非常在线,比这个 codex 我 感觉强不少, 就是字体啊,或者是它的这个选择的颜色,还有这个动画设计啊啊,都是挺不错的啊,觉得可以,我们干第二个测试吧。第二个测试的话, 我跟他说要一个这种啊大览图,然后需要有这个产品的一些按,按不同的进行分类,然后他也是啊,搞了一个这个计划 啊,主题啊,字体啊,然后它的画面啊,它的这个整个结构啊,它应该怎么样去去设计,然后它的边框啊,它主要的画板等等,就是它自己有一个有计划以及验证,这都差不多,跟 codex 跟 cloud code, 我 们待会儿看一眼 效果用,哎,好了,第二个也做好了,我们去看一下啊,这是它的一个整体的状态, 都还有各个的一些详细的数据 面框, 根据这个自动进行一个变化,然后它的,哇,感觉这个完全没问题啊。就是这个,我的 u i 还是很能打,前端确实比这个 open i 强不少。我感觉再看一下第三个,三个我要它做一个小游戏吧,看它能不能做。 对,这边同样是有一个,先有计划,然后让你继续啊。 对,这个就是在浏览器里面做一个小游戏,然后就是这个用来收集一些啊 token, 然后用你的键盘去控制上下左右啊,然后重启啊等等,看看行不行。 对啊,这边还是反复地出现这个,而且你点一它不好使,你必须点 submit。 这个是就是他们新的这个 啊, i d e anti gravity 就 反重力。我觉得这个设计还是一个是抄了 codex 二,一个抄的还不好啊,挺挺值得被吐槽的我觉得。 而且他们,呃,我看他们最新的这个就是这个叫 anti gravity, 它另外有一个,如果你想要看它具体代码,就像以前的 i d e 一 样,它把它原本的那个名字改成了 i, 就是 把这个新的,把这个名字 啊做成了新版的 anti gravity, 但是原本的那个就叫做 anti gravity i d e 就 重新改了一下名字啊,也是让人挺摸不着头脑。嗯,有点奇怪。 嗯,看起来也好了,我们去看一眼啊,这是这个游戏的一个页面,我们看看他,是他说哎呦,它是有音效的哇,这个怎么?嗯啊,要接住 a p i, 然后接住接住绿的这个意思吗? 对,那就是要避开对不对?嗯啊对, 让我自己死一下嘛。会重启只有一次 ok 啊,最后得分,然后重启 ok, 还挺有趣的,就是整个没什么问题,音效也很好,然后动作也很连贯,不错不错,达到了这个要求。好,我们现在再看另外一个测试吧,就是一个三 d 的 模型,看它行不行。 三 d 模型啊,相当于要用那个 three d j s 去创建一个,然后是一个旋转的,同样有一个计划,然后让它执行, 同样的我们继续 使让它进行跑这个脚本, 然后这要是做完了,我们可以看一下,哎,中间有遇到一个错误,然后我修复了一下,我们可以看一下啊,工作了十九秒,然后它就生成 三 d 的 for harvard 的, 上面 这个有三点五。 有点看不明白哦,这个是什么东西? ok, ok, 相当于你把鼠标放在上面,它会显示各个模型的一些细节,它感觉整个是一个,它在晃动,现在我点上去之后,它在来回的晃动,也看不清楚,然后这个下边可能会显示一些这个,呃, 基本的东西,就是不动,拉不动,这个有一点点拉垮了,效果不太好,有点,有点不太行。 先看一下他们这个评分的一个标准,他们就今天早上刚刚发布的这个三点五哦,他们在扣顶上,是这边,是啊,七十六点二,然后仅次于这个五点五,然后比这个四点七还要高哦, 然后比之前的 pro 是 他们的轻量级模型啊,他说比他之前三点一的这个 pro 版本还要高哦, 然后就是这种就是 agent 的 能力, agent 能力也是远远的超过了前两个。就是这种啊,也超过了 opus 四点七,仅次于这个五点五,然后 看一下,就总的来说还是像这种打这个中的都是啊,搜塔就相当于是最高分的,感觉 从评分上来看是很优秀的,但是在网上其实已经很多人出现吐槽,就是实际上生生产用起来就是不如啊,首先不如五点五也不如这个啊, opus 四点七哈,这个是大家的一个目前来看测评的一个结果 啊,所以我这边测评主要是看一下前端是不是还是一样能打。因为啊, jennifer 来说他们的一直设计这一块啊,是比那个呃周鹏 i 要好一点点。总的来说就是啊,我的个人体验就是 啊 gemini 这个三点五 flash 我 觉得一般般,就是我如果你要问我日常啊,工作或者是生活,又会用这个啊来作为我的主力模型吗?我觉得答案就还是不会,就是我本来现在用的也不多,因为啊,它在逻辑推理啊以及这种 agantatic 的 能力上还是 明显的弱于 open i 跟这个 cloud。 所以 啊,我会持续关注吧,因为他们下个月应该会推出他们的三点五 pro 啊,那会是他们的旗舰模型,也希望到时候他们能够啊奋起直追啊,这样就是不要被他们两个另外两家落下太多,有机会大家也可以去试一试。


家人们,人工智能圈这次真的变天了! google deepmind 刚刚悄悄扔下了一枚重磅炸弹, gemini three point five flash 正式发布了!我原以为它只是个常规的小版本迭代,结果看完第三方权威评测数据,我整个人直接被惊呆了!这哪里是微调啊,这简直是轻量级模型的一场史诗级暴走! 如果你正在寻找一款坚固、极致、速度与顶尖智能的工具,听我的,闭眼冲它就对了。 一打破不可能的,怕累拖前沿。以前我们用大模型总要在速度和智商之间做妥协,想要聪明的,就得忍受它像挤牙膏一样一个字一个字往外吐。想要快的,智商又往往缺那么点意思。 但是 gemini 3.5 flash 把这个行业铁律给砸得粉碎。根据 artificial analysis 的 最新权威评测数据,在综合智能指数上,他直接轰下了五十五分,比前代足足飙升了九分,甚至一举超越 grog 四点三的五十三分和 cloudsonnet four 六的五十二分。 更夸张的是,他的输出速度直接突破了每秒两百八十个 token, 比上一代快了整整百分之七十!他现在是全球智能与速度帕累托最优前沿上无可争议的绝对领跑者。 二、 agent 能力的跨级碾压更让我感到惊喜。也是最想强烈推荐给大家的,是他这次在 agent 智能体能力上的外挂级进化。以前 gemini 处理多步骤的复杂工作流时,总让人觉得有点吃力,但这次他原生支持了思维保留技术,多人对话里那些中间推理过程决不丢掉数据从来不会说谎。在模拟真实世界 agent 任务的 gdp vol a a 严苛评测中, gemini three point five flash 轰出了一千六百五十六分的天花板级一楼天梯分。这是什么概念?他不仅把前代 flash 的 一千两百零四分远远甩在身后,甚至跨级碾压了自家老大哥 gemini three point one pro 的 一千三百一十四分, 距离行业天花板 g p t 五点四仅仅只有一步之遥。用轻量级的费率和速度跑出近乎顶级旗舰模型的 agent 的 操控力,这性价比真的绝了!三、 告别胡说八道与成本考量当然,大模型最让人头疼的就是胡说八道。这次 google 显然下了狠功夫, 在衡量知识储备与幻觉控制的 a a operations 精准测试中,它的得分暴涨,十一分模型幻觉率大幅下降至百分之六十一, 相比前代幻觉的绝对值,整整锐减了三十一个百分点,回答的准确性和严谨性得到了质的提升。不过客观来看,天下没有免费的午餐,因为他的 agent 复杂多轮对话能力变强了,导致输入的 token 量激增, 运行全套智能评测的总成本来到了一千五百五十二美元,是钱袋的五点五倍。但别慌,它的基础定价依然非常亲民,每百万输入 token 只要一点五美元,如果缓存命中,还能享受一折优惠,低至零点一五美元。这个价格对开发者和企业来说依然是真香。警告, 依照的超大上下文,原生多模态支持动态分级思考机制,毫无疑问, gemini 三点五 flash 就是 开启全面 agent 时代的里程碑式轻量模型。 各位开发者、科研党、生产力极客们,赶紧去 google ai studio 或官方平台搞个 api 体验一下,相信我,用过之后你绝对回不去了。

vivo neo 三点五 pro 全网首爆谷歌这次的更新速度让人措手不及,直接跳过三点二版抢先亮相。这次 jimmy neo 的 升级不仅是数字的变化,功能也大幅提升。新版本在编码和推理上接近 gpt 五点五,但成本更低。更吸引人的是 jimmy spark 这个全新的 aia 枕的, 可以帮你管理邮件、执行任务,甚至可能不经你同意就下单。但问题是, jimmy nike 的 性能虽然赶上了 j p t 五点五,但与米嫂仍有差距,这让人对其未来更新充满期待。在编程领域,尽管新街美奈有改进,但低普买的仍需与安斯 rock pick 较量,后者在开发者中已占据一席之地。 不过谷歌拥有巨大的分发入口, spark 一 旦全面推广,将为 jammy 奈的训练提供丰富的数据反哺资源。三巨头在 ai 赛道上互不相让,谷歌的战略是通过广泛的用户基础和 agent 来弥补模型性能上的劣势。关注全球 ai 速递,获取更多 ai 前沿资讯。

这么耐,三点五来了,谷歌官方说这是一个全能大模型,感兴趣的可以去试试,试完之后感受怎么样?欢迎打在评论区哦!但今天咱们不聊评测,聊一个更有意思的问题。 大家还记不记得,二零一七年,谷歌的团队发表了一篇论文,叫 attention is all your need, 提出了 transformers 框架。今天你听到的所有的大模型, chatbtcloud, 包括谷歌自己的 gemini, 你 曾用的都是这个东西。可以说,没有谷歌这篇论文,就没有今天这轮 ai 浪潮。 但问题来了,那谷歌作为点火的人,为什么没有第一个举着火把冲出去?答案其实很残酷,就一个字,钱。谷歌靠什么赚钱? 搜索广告?二零二三年,光搜索广告就干了一千七百五十亿美元,占了谷歌总营收的一半以上。而搜索广告这个生意,编辑成本极低,数据中心建好之后,每多处理一次搜索请求,几乎不用花钱,但每一次点击都能收钱, 这可能是人类历史上最赚钱的商业模式之一。然后你再看 ai 搜索是什么情况?传统搜索处理一次请求大概花零点三美分,能挣四点五美分。 ai 搜索呢? 处理一次请求要花三到三十美分,但收入反而只有二点五到三点五美分,成本高了十倍甚至上百倍,收入还更低了。你要是谷歌的管理层,你做不做? 做了,等于主动拿一个成本更高、利润更薄的东西去冲击自己最赚钱的业务。所以二三年的三月份,微软直接把 gpt 四塞进了并搜索谷歌,却拖到了八月份才推出 sge, 慢了将近半年,这半年不是技术追不上,是利益格局挡在那。 这个事让我想到一个经典的案例,柯达一九七五年数码相机就是柯达自己发明的,但胶卷行业太赚钱了,推数码等于革自己的命,结果一直犹豫,最后被数码浪潮彻底淘汰了。 你看这两件事是不是有点像?而且谷歌内部其实一直在纠结,一手把杰姆奶团队做大,投入上百亿美元搞大模型,另一手又调搜索算法,压低 ai 生成内容的曝光率, 左手创新,右手防守,相互打下。因为越大的集团越追求稳定性,新事物对上面的人来说意味着风险和不确定性。宁可守住一个确定能赚钱的平台,也不愿赌一个可能更大但也有可能翻车的未来。不是做不到,是不敢做。 但话说回来,谷歌毕竟不是克他,他有钱有人,有几十年积累下来的数据,二五年谷歌做了一个关键动作,把 gemini 和用户的谷歌搜索历史打通了,你的搜索记录、 youtube 观看记录,甚至几秒内容, gemini 都能参考给你做深度个性化的回复, 这一点 omi 做不到,因为他没有搜索生态。到了 jimmy 三发布的时候,已经有不少评测者感叹说他的前端代码能力、网页复刻能力非常强,三轮对话就能做出一个完整的小游戏。我当时呢,也是 jimmy 的 忠实用户,确实很好用, 到三点一 pro 上线已经变成了妥妥的第一踢腿,所以 jimmy 三点五确实值得我们期待。好,回到最开始那个问题,船大就真的不好调头了,我觉得准确的说,是不是船大的问题,是只有一台发动机的问题。 搜索广告,这台发动机太强了,强到舍不得换,但当这台发动机开始减速,骨骼被迫启动了第二台。最后送大家两句话,如果你是创业者,别怕巨头,他们的惯性就是你的机会,巨头看不上或者还没有注意到的市场,如果你在大公司内部,也要保持思考,看好机会,我们下期见。

哈喽啊,小伙伴们,给你们展示一个瞬间移动的超能力。一眨眼的功夫,周围就变成了阳光、沙滩,海浪就在身后拍上来,风里都是海水的味道。这感觉也太真实了, 不是抠图,不是套滤镜,是这是谷歌最新视频模型 omni 生成的。我们熟悉的那些视频生成工具,基本上是文字转视频,你打一段描述,它生成一段画面,生成完了,如果要改,那对不起,得重新来。 omni 作为真正的多模态视频生成模型,能够把文字、 图片、音频、视频这些输入理解了之后,统一生成出来。谷歌 deepmind ceo 在 发布会上演示的时候,直接拿了一段真实录像,让 omni 修改环境风格、镜头角度,还可以把你画的草图、 其他场景的图片一起塞进去,让他参考。接下来我们看看这次的重头戏,全新模型 jimmy 三点五 flash 这次居民来网页端焕然一新,弥散风,极简留白, 整体都很干净。嗯,怎么说呢,有点 chat gpt 纳胃了。我们选择最新的 jmi 三点五 flash。 第一个测试,我让它做了一个打地鼠小游戏,游戏整体很流畅,游戏机制和逻辑也没问题,点击炸弹扣分,偶尔刷新黄金属,每次点击都有音效。 这个小细节是有的,就是有一个问题,这个老鼠长得不太像老鼠。最近 token 这个词很火,那么第二个测试,我用它做了一个关于 token 预测的科普页面,它生成了一个可以实时交互的网页,解释 ai 是 怎么一个词一个词往下猜的, 页面里的候选词、概率条、温度、滑杆都可以拖动,一步步生成自己的故事。以前要解释 token 概率、温度,大家可能听三秒就走了,现在做成直观可交互的网页,反而更容易让人懂。这次更新 jamie 还带来全新的思考,等级 有标准和扩展两档可选,我们选择 g m i 三点五 flash 扩展复刻了一个 android 时期最新系统,结果确实有点惊艳。它生成出来的界面不只是一个空壳,音乐可以调整进度条也能切割, 相机入口有了,但不能正常打开。信息功能倒是挺完整,能正常发送,甚至还能收到回复,等一下,难道真的能操控?哦哦,好吧,是我想多了。这个设置界面真的很细节, wifi 关闭开启状态栏也会同步显示,亮度调整也会实时控制屏幕明暗,整体来说完成度很高。如果你是做交互草图功能演示,这种能力已经很实用了。此次还更新了全新音频模型 live 三。 这个我一共生成了两段,第一段是八比特游戏 bgm, 我 给他的需求是三十秒,结果他给我生成了足足五十三秒。不过风格确实挺符合我的要求,街机感有,节奏也轻快,放在小游戏里不会抢戏。 第二首,我本来想生成一首 r b, 但听下来我觉得它更像偏华语流行的风格,歌词探讨了人工智能、 陪伴与自我寻找的主题。关键是 larry 三除了能生成音乐,还会同步生成歌名和封面,这个真的好评,他甚至还有和声处理,时间有限,我们快速听一下。让我没想到的是,结尾居然还有一句独白,一下子升华了。 最后快速过一下网页端的几个更新, jimmy 现在可以开记忆,从你过往的对话里慢慢了解你这个人,越聊越懂你。还可以关联你手机里装的应用, 让它在你的生活里更有存在感。这个功能我玩了一下,挺有意思的。复制这段提示词到其他 ai, 然后再把结果粘贴回来, gemine 就 能快速获取你的偏好和一些记忆。我把这段话拿去问 chat gpt, 结果太透彻了,给我分析的明明白白的,感兴趣的小伙伴也可以试试。 提示词我会放在评论区。 pro 版现在有每日用量和每周用量两个维度,重置时间显示的很清楚。看到这个界面,我第一反应是,嗯,这不就是向 cloudy 看齐吗?你可以设置让 jimmy 定期自动帮你做事。新闻摘要、新知探索、晚餐食谱、 晨间激励、内置模板都有,也可以自己建。这个功能我觉得很适合做信息收集整理。好,快速总结。 google 这次不是单独发了新模型,而是把 gemini、 omni、 linear 三拼成了一条完整的创作链。以前要开五六个工具,而现在谷歌是想让你在一个地方搞定。好啦,这期就到这里,具体详细对比实测,期待后续评测。

谷歌刚刚发布 jamming 三点五的时候,很多人都在惊叹它有多强,但我真正害怕的不是它变强, 而是人类开始变得像多余的了。以前互联网最喜欢的词叫效率,现在 ai 最擅长的事也是效率。写方案,剪视频、做表格,整理会议记录。以前一个团队干的活,现在一个 ai 标签页就开始包圆了。 最有意思的是,人类努力了几十年,终于把自己优化成了 ai 最容易替代的样子。标准化、流程化、高效率,这些以前是公司最喜欢的词,现在 ai 听了都想投简历。以前我们以为 ai 只是聊天工具, 现在他已经开始向员工了,而且还是那种不用午休,不会摸鱼,甚至不会在厕所偷偷刷短视频的员工 资本。第一次发现,原来真正完美的打工人真的不需要是人。 gm 三点五真正可怕的地方可能不是他能做什么,而是他让越来越多人开始怀疑自己还能做什么。 ai 时代真正的竞争可能已经不是人和人之间了,如果 ai 越来越像人,人类该靠什么留下来? kane, skade, whoa la panda, hahaha! yeah!

谷歌今天推出了 gemini 三点五系列,打头阵的是三点五 flash, 一 款兼具前沿智能与行动力的代理模型。它在代理和编码基础上超越了三点一 pro, 多模态推理领先,输出速度比同类模型快四倍, 真正做到了质量与速度兼得。更关键的是,他擅长处理长期代理任务,成本往往只有其他前沿模型的一半。结合全新的 anti gravity 框架,可以部署多个子代理,自动完成资产分类、代码维护乃至财务文件,准备 把过去需要几天甚至几周的任务压缩到几分钟。在企业端, shopify 正用它并行分析数据,做出更准的增长预测。银行和金融科技公司用它自动化繁琐流程。 全新的 gmail spark 个人代理将二十四小时为您待命,搜索体验也迎来动态界面。而三点五 pro 预计下月推出。模型内置前沿安全框架,用可解释性工具理解推理更安全可靠。 总结,三点五 flash 以旗舰智能和极致速度重新定义代理模型,让强大 ai 普惠开启行动智能新篇章。

哈喽,兄弟们,昨晚通宵看了谷歌 i o 大 会,现场演示是天花乱坠,从模型到 agent 再到硬件,全线 ai 产品轮番上阵,看得我那叫一个心潮澎湃。结果实测之后就一句话,大部分都挺拉垮的。 omni 是 这次发布会重磅首推的演示效果相当炸裂。官方定位很明确,万物皆可生成的第一步,代表着在世界理解多模态和编辑能力上的一次全面飞跃,人物细节、风格、 环境角度全都能随意切换。听上去视频模型的新标杆好像就这么立起来了。 其次是 jamming, 三点五, flash 主打一个快高效能打复杂任务,多模态也不在话下,而且官方特别强调他的 agent 能力,在个人 agent 助理和全新的 anti gravity 二点零中都主推三点五,要的就是性能和速度的那个平衡点,吹的都很猛,但到底行不行,还得上手册。 听发布会的同时,我第一时间打开了 gemini, omni 已经上线了,这个版本应该是 omni。 flash 拿前两周做的慢剧提示词测一下,他们家首尾帧要在提示词里写明给大家看一下,这是首帧,这是尾帧续章里祁昌云来凌虚城开奶茶铺的那一段, 等了差不多五分钟,速度还可以直接上,结果 那就开个奶茶铺,大翻车,场景一致性全崩,细节缩水,两档衣服跟原图差了十万八千里,运镜拉胯。最后的配音我差点笑没再放一遍。你们听 开个奶茶铺,对比一下我之前用 cds 做的视频提示词,一个字没改,一轮直出没抽卡, 那就开个奶茶铺, 这个差距就一目了然了吧,而且我用的是 c dance two fast, 再给他一次机会,换个正脸图,输入仍然跟 c dance two 完全一样,节省时间。直接看成片 回到其梦里,对比一下 c dance 的 出品, 首帧,双方表现都很好,中间部分 omni 未能理解提示词中的雷劫,而到了尾帧再次出现了场景偏移。详见屏幕。对比之下, c dance 准确遵循了首尾帧及提示词中的天雷滚滚。 本轮 omni 的 表现略有改善,但首尾帧一致性不足,实用价值有限。 中文视频我感觉奥尼是真不行,正准备测一下英文的时候,屏幕上直接提示额度不够了,大家看,我一个月二十美金买的 pro 订阅就跑了两视频,五小时的额度直接见底了。谷哥你这是搞啥呢?离了大谱了。 得了,就剩这点额度了,给大家测一下 flash 三点五吧。先确认一下,现在用的是新版的 flash 模型,没有问题。第一道题,咱们来测测新版 flash 的 中文,我让他用王家卫的风格写个黑咖啡文案,这个输出速度比 deepsea v 四 flash 慢多了。 我真的读了三遍,只能说太尴尬了啊。抄的几句不说了,我读下这句,零点零一公分,那是我们之间最近的距离。等等,你看看文理,我们是谁啊?这句话有点太不合适了吧, 谷歌这个蒸馏技术是不是把情商也给蒸发了?从二点五时代起, gemini pro 一 直负责我的创意写作,中文一直能打,可是最近这两代 flash 在 这道题上都翻车了, 大家对比一下,左边是三点一,老 flash 跑同一道题的输出,一上来就王家卫说特别僵硬,那最后一句更是让人读不懂他在说什么。然而今天右边的三点五 flash 又刷新了我的认知, 我就不信邪了,它到底强在哪?都说 svg 是 大模型视觉能力的一道坎,因为它逼着 ai 左手写代码,右手还得有审美。那就让三点五先出一个造型精致的 svg。 机器人是可以当吉祥物的那种,要求有点高,我们直接打开扩展思考模式, 提示词我打在屏幕上了,需要的可以截屏。扩展模式花了不少时间,我们直接快进,看结果效果还行,方方正正的。机器人要求的组建细节都到位了, 可惜金属质感和微妙的光晕没画出来,做吉祥物还是差了点意思。再看老版 flash 生成的整体感觉还是比新版弱一些,基本全是线条拼出来的。但话说回来,新版三倍的价格有点不值, pro 就 不用比了,虽然做不到惊艳,但光泽感强太多。 最后用真实世界的复杂任务测一下 flash。 三点五,谷歌这次重磅发了 antigravity, 二点零,我升级好,打开那一刻真的蒙了。看屏幕,他说升级后就剩 agent 的 工作台了, ide 得单独下个 app, 我 当时火就上来了,虽然 agent 和 ide 我 都用,但你不声不响搞成两个也太莫名其妙了吧。 只能收拾一下心情,打开一个一直想重构的工程。上周用老版本 jimmy flash 写的这个项目我不怎么满意,今天刚好让升级版出马,修一修自己之前挖的坑。 这个页面并不简单, remotion 和 three js 做的三 d 短视频编辑器配了十套模板,但模板实现的很套路,随便看两个,第一个三 d 效果平庸,文字对比度不足。 第二个质量还行,就是风格不够。赛博交互逻辑也有不少坑。滚个模板列表全页跟着动,还加了一堆没有实际意义的元素。 打开升级后的反重力,选择新版 flash 模型,思考强度选 high, 在 升级后仅剩的输入框窗口里,让它全面重构刚才这个页面以及所有相关代码。我的要求是更新 u i u x, 优化已有的视频模板,并新增十个不同的模板, 每个视频效果都要做到最佳。目测这个重构速度比老版本的 flash 快 了一到两倍,但是达不到官方宣传的十二倍提速。 三分钟后,重构结束,来打开验一下这个重构后的版本,把排版整个重写了一遍,模板加到了二十个标题,文字全都调过,还新增了模板搜索栏,左侧列表滚动终于独立了。 打开第一个模板,看看配色,这次合理多了,光效也能看清楚,动效马马虎虎吧。再看第二个框线,换成了绿色,但好像就没做更多优化了。下面看新加的模板, 选这个运动实时遥测做的挺好,足球场上有球员轨迹,中央的圆圈有点抢戏,运动方向需要调一下。 最后看个分子料理装盘,配色很赞,中央旋转的菜品标签让人眼前一亮,那些大波纹似乎想表达味道,有点用力过猛。改下标题看看, 没问题,功能正常,小节一下,新版 flash 三点五在反重力加持下提速很明显,能力也增强了,但代价呢?额度消耗是之前的三倍多,刚才这个重构五小时额度的四分之一没了,你算算五小时满打满算只能干十二分钟。 对比升级前老板 flash 几乎无限的额度,大伙啥感受?评论区说说看。 i o 大 会我每年都看,二点五发布后 jammin 就 成为我的主力模型之一, 但这次的翻车程度恐怕仅次于一点零发布的灾难现场。你们可能会在其他地方看到清一色的异美之词,我敢说没实际跑过的探击生物退役指南,喜欢就点个关注,下期见。

大家知道啊,我一般不轻易说离谱这种词,但就在刚刚,我把谷歌二零二六 i o 大 会上最新发布的 gemini 三点五 flash 接入微信的时候,真的忍不住说了句,这也太离谱了。为什么呢?因为 gemini 三点五 flash 让微信活了过来,我甚至觉得它已经突破了土林测试, 不仅非常认真,非常自然地回复了用户,甚至做到了用户根本不知道他就是在跟 ai 聊天。比如,当用户说话说到一半的时候,他能够带着情绪去回复用户说,哎,你说话只说了一半吧,急死我了,这哪里是 ai, 这是真人吧! 更夸张的是,但 jimmy 三点五 flash 结合十六 ai 桌面智能体,它更是具备了操作电脑的能力,能像真人一样的自己去识别聊天窗口, 点开新的对话,新的私信、新的群,跑过去回复用户。我们的一些用户真的已经开始玩土林测试了,看看到底谁能分清楚这是 ai 还是真人。如果你也想体验这款 jimmy 三点五 flash 加微信智能体,让你的微信自己会看、会想、会说,就在评论区打 ai。

昨天果哥开发者大会新发布的 germany 三点五 plus, 这里现在也是用上了,需要的朋友们可以搞起来。

ai 圈有个不可能三角,性能、速度、成本你总得放弃一个,但 google 却说它可以全都要,这怎么可能?它们刚发布的 gemini 三点五 flash 简直刷新了我的认知, 它不仅拥有旗舰模型一样的聪明劲儿,速度更是其他领先模型的四倍。想象一下,以前那些需要程序员花好几天甚至审计师忙几周的任务,现在几分钟就能搞定,而且用的钱还不到其他模型的一半,这不就是鱼和熊掌都兼得了吗? 过去我们总觉得想要速度快,质量就得打折,想要性能好,成本就得飙升。但 gemini 三点五 flash 似乎找到了那个平衡点。 它到底是怎么做到的?凭什么能同时满足高智能、高效率、低成本这三个看似矛盾的要求?今天咱们就来深挖一下 google 是 如何打破这个 ai 行业公认的不可能三角的,这不仅是技术上的大突破,更会给我们的日常工作带来实实在在的改变。 所以别眨眼,精彩才刚刚开始。 ai 圈里总说性能、速度、成本总得牺牲一个,但 gemini 三点五 flash 出现直接打破这惯例,它不光快,智能水平也达到了旗舰模型。看它的关键数据, 在编码和复杂任务测试 terminalbench 二点一中, gemini 三点五 flash 拿到百分之七十六点二高分,超过 gemini 三点一 pro 智能体任务的 mcp atlus 精准测试,它也取得百分之八十三点六好成绩。 对多模态信息理解、文字、图片、视频这些他同样出色。 chart fourteen recent 测试得分高达百分之八十四点二,复杂信息他也能快速准确理解、 亮眼表现,得到权威机构 artificial analysis 认证。他们将 gemini 三点五 flesh 放在指数右上象限,表明他同时具备前沿智能和卓越速度。可以说, gemini 三点五 flesh 做到了鱼和熊掌兼得,他不光快,更是顶级的聪明选手。 而这种顶级智能,它用在了智能体任务这个新维度。这到底意味着什么?又会带来哪些改变呢? ai 的 下半场已经来了,以前它只会聊天、写东西,现在它要学会行动了。这个新趋势叫做智能体。 gemini 三点五 flash 就是 为这类长周期智能体任务量身打造的,它不再是被动生成内容,而是像个数字员工,能主动规划执行多步骤的工作。 google 为此专门推出了 anti gravity 平台,这个平台就是用来开发和部署智能体的,它能把多个子智能体组合起来,就像组建一个虚拟团队,大家一起解决那些大难题。 打个比方,以前一个项目可能要花几周,现在有了 anti gravity 和 gemini 三点五 flesh, 一个主智能体带着好几个子智能体,可能几分钟就能搞定大部分。这超出了我们对 ai 工具的想象,他不再是助手,而是一个能自主思考和执行的新同事。理论听起来挺厉害的,对吧? 那这些智能体到底能在实际工作中做什么呢?咱们就来看几个代码和开发领域那些颠覆性的真实案例。 智能体到底能干啥?看看 google 怎么用。 gemini 三点五 flash, 两个智能体,一个研究员,一个程序员,六小时内,它们就从 alpha zero 论文中学习并完整开发出一款游戏,这不是普通编程,是理解加创造, 还有老旧混乱的代码库程序员的痛点。三点五 flash 结合 ant gravity 平台,能自动重构这些遗留代码, 甚至直接迁移到 next js 框架,这节约的人工时间太惊人了。它还能并行设计,比如一个 app 的 结账流程,三点五 flash 在 六十秒内就能给出多种用户体验方案,它像个能自主思考执行的虚拟团队。这种认知劳作的自动化,会给商业带来多大的效率革命? 上次我们聊到 ai, 已经不光会生成内容了,它开始学会行动了。这种能自主思考执行的智能体,可不是只在代码世界里转。 现在他正在金融、电商这些大行业里变成真正的超级员工。比如电商巨头 shopify, 他 们现在就在用 gemini 三点五 flash 的 子智能体。这些智能体能像一支专业的分析团队一样,并行分析大量复杂的商家数据。 要知道,这些数据时间跨度长,信息量特别大,目标是干啥呢?更准确地预测全球商家的增长趋势。 以前这可能是个非常耗时耗力的工作,现在有了智能体,决策就能更及时,生意就能做得更准。再看看金融行业,澳大利亚的麦格里银行,他们就在试点用三点五 flash 来处理客户入职。想想看,一个新客户入职要审阅一百多页的复杂文件, 这些文件包括各种法律条款、财务信息。传统上人工审核耗时又容易出错。现在智能体可以低延迟推理这些文件。什么叫低延迟?就是响应速度非常快,客户入职流程大大加速,体验自然就好,银行也能更快地把客户服务做好。 还有大家熟悉的 sauce 巨头 salesforce, 他 们已经把 gemini 三点五 flash 集成到了自己的 agentforce 平台,通过部署多个能记住上下文,并且能调用各种复杂工具的子智能体,来自动化企业的日常任务。 就像有了很多个专业的虚拟助手,能处理客户服务、销售流程、数据分析等等。而且它还能确保这些任务的执行非常可靠,出错率大大降低。这不就是把效率直接拉满了吗? 你可能会觉得这种企业级的应用离普通人还很远,但其实这项技术已经悄悄来到了我们每个人的身边。你可能觉得这种企业级的应用离普通人还很远,但其实这项技术已经悄悄来到了我们每个人的身边。没错,我说的就是你的数字生活管家,他叫 gemini spark。 这个 spark 就是 基于 gemini 三点五 flash 打造的,你可以把它想象成一个私人助理,二十四小时在线,随时待命。它能帮你处理数字生活里的各种事,就向你的数字分身,比如帮你规划日程、整理邮件,甚至是在线处理一些信息。 而且啊, gemini 三点五 flash 不 光驱动 spark, 它还深度用在了 google 搜索的 ai 模式里。当你搜索一个复杂概念,比如回旋体模型, ai 模式就能给你生成一个交互式的视觉解释,像动画一样,特别直观。 这个超酷的 gemini spark 测试版会先在美国给 google ai ultra 的 订阅用户开放,很快它就会成为你数字生活里不可或缺的一部分。一个能全天候替你打理一切的 ai, 听起来是不是很强大?但同时也引出一个问题,这样的 ai 它安全吗?我们到底该不该信任它呢? 上集聊到 ai 已经能变成你的数字生活管家了,是不是觉得它特别强大?但同时心里会有点担心,这样的 ai 它到底安全不安全?我们能完全信任它吗? google 对 这个问题非常重视,它们为 jammin 三点五的开发专门建立了一套前沿安全框架。 这套框架可不是说说而已,它在好几个关键领域都加了江省。比如针对现在大家特别关心的网络安全,还有 cbrn 这种敏感的化学生物放射性核核信息, google 都做了特殊的防护增强。 也就是说,在这些非常重要的、潜在风险高的领域, gemini 三点五会有更严格的限制。它们还用了新的更高级的安全训练方法,这能大大降低 ai 模型生成有害内容,或者把一些本来无害的查询错误地当作安全问题拒绝回答的概率。 这就好像给 ai 不 断打磨它的道德指南针,让它更准确、更可靠。更让人放心的是, gemini 三点五还内置了可解释性工具,你知道这意味着什么吗? 就是说,在 ai 给出任何一个响应之前,我们不是被动接受结果。通过这些工具,我们可以检查和理解 ai 内部的思考过程,它是怎么得出这个结论的? 这就好比一个透明的黑箱,让它的决策不再是完全的秘密。这种透明度能帮我们更好地理解 ai, 监督 ai。 所以 说, google 不 仅仅是把工具交到你手里,它们也尽力让这把利器变得更安全、更可控。那么, google 到底会怎么把这些强大的工具推向世界? 他们的商业策略是什么?我们接着聊 google 为什么这么急?他正用 gemini 三点五 flash 打一场全面战争。这场 ai 战役不仅覆盖数十亿普通用户,更是直接把手伸向了开发者和企业,要跟微软 open ai 抢未来。 你可能已经感受到了, gemini 三点五 flash 已经进入了你的手机,通过 gemini 应用,还有 google 搜索的 ai 模式,全球几十亿人都能直接用到。它不仅仅是个聊天工具,更像一个随时待命的助理,帮你处理日常信息。但 google 的 野心不止于此, 他们也把这个强大的模型开放给了全世界的开发者,比如通过 google android studio, android studio 里的 gemini api, 开发者能用它来打造各种新应用,甚至直接改写代码逻辑。更关键的是,在企业层面, google 推出了 gemini 企业智能体平台, 还有专门的 gemini 企业版。这意味着从个人到企业,从我们日常生活到公司运营, gemini 三点五 flash 几乎是无孔不入, 它就像一个超级员工,帮企业自动化复杂的日常任务。 google 这么做目的很明确,就是要构建一个完整的 ai 生态,把所有的用户、开发者、企业都拉到自己的阵营里。 这可不只是技术竞争,更是商业版图的大争夺,它想把微软 open ai 甩在身后,成为 ai 时代的真正主导者。 所以,这不光是技术突破,也不光是商业落地,它预示着 ai 的 新时代已经完全到来了。我们聊了那么多,从 jammin 三点五 flash 的 速度、性能,到它如何成为你的数字生活管家,我们甚至看到了它在安全框架下的严格约束,还有 google 怎样把它推向全球市场。 但这些具体的例子都在指向一个更宏大的趋势,那就是 ai 已经不再只是一个信息工具了,它正在从一个知识的提供者转变为一个能真正行动的伙伴。以前你可能让 ai 帮你写个邮件,查个资料,现在它能帮你直接重构上百行代码,在短短几小时内就完成一个游戏原型。 或者就像我们前面说的,它能帮你处理复杂的财务报表,甚至还能像个专业的数字管家一样打理你的日程、邮件,甚至帮你在线处理一些信息。这意味着什么呢?这意味着我们和 ai 的 协助模式正在被彻底改写,它不再只是一个听话的助手,而是一个有思考、有执行能力的智能体。 google 用 gemini 三点五 flash 引领 ai 从信息工具转变为行动伙伴,它在用实际行动告诉我们, ai 的 下半场就是智能的行动时代。 所以,当 ai 能够独立思考并且像一个人一样去行动的时候,我们的工作和生活会变成什么样?我们的创造力又会怎样被它拓展呢? 那些重复性的任务是不是真的可以彻底交给 ai 了?这不光是技术突破,更是对我们未来世界的一次重新定义。思考一下,这其中是不是也有你的机会呢?