专买新模型三点五 flash 不 再只是简单的聊天模型,而是在往完整的 ai 系统方向引进,可以写代码,做网页小游戏,自动的查资料,汇总成报告一个概念,我们可以通过理解物理世界生成视频,我总结了八个 id, 还有各种给力的场景和用法,其实词和你有可能忽略到的新入口,我也都放进了视频出发。 首先是模型,按照我们以往的认知, flash 一 直是便宜轻量,够用就行,秀实力的呢,一般都是 pro, 但这次不一样了,在编程 agent、 工具调用这些干活的场景里,它不仅超过了上一代 pro, 速度还提升到了四倍。当然,这里说的是执行能力,不代表它就是那个聪明的。 但也正因为如此,一个趋势呢,就变得很明显了,速度加执行力正在超过单纯的智力。所以这次 flash 呢,直接被推上了默认的默型,那我们又该从哪里能够用到呢?还是我们的老朋友 a s 丢丢, 那在这里就能看到这次它更新的所有的模型,那你要是不去选它,然后直接来问它的话,它默认的呢,就是三点五 flash, 还有就是网页,它呢,每天也会有少量的额度。 nano 不, nano pro note, 酷狗 im 音乐生成 v 五,三点一呢,也更新成了 omni, 而这些联动呢,在网页里才 能玩得到。好,我们先来看一下它的思维怎么样,那我在这里问它一个问题,八米长的竹竿是否能通过高四米,宽三米的门? ok, 他这个速度确实是很快,那我们来看一下他的回答怎么样?说在二维几何条件下,不考虑竹竿的厚度是可以穿过这个门的,那他还在这里用钩股定律给我算了一下,说最后通关的办法呢,是利用三维空间 可以斜着划过去,考虑的方向还是挺全面的,不过这次更新影响比较大的呢,是卡哇斯网页 ui 生成,那这是一句简单的提示词,那我让他给我做一个闯关小游戏, ok, 那 他现在是已经出来了,那我们现在打开他,哎,这个画风倒是很贴切,这些按钮呢,也是在的,那我用键盘来控制他的方向, 哎,是可以的,那由此我们就可以发散思维来做网页科普。现在呢,他在这里是出了两个思考等级标准和扩展,在标准下,他的回答速度呢,会比较快一些,大多数的问题都是够用的, 如果需要处理长篇复杂的问题,那这个扩展他的推理步骤呢,会比较多一点,当然回答的相对来说会比较慢一些。那这次我们就用扩展功能来做一个汽车网站, 那在这里给出我的提示词,然后我们来看一下,这个配色很高级啊,算是保持了专门来前端一贯的审美水准,包括我再去滑动他,他呢也会有这种互动特效,还有这里的企业文化车型的一个展示, 他还不是一个空壳,哎,那我再进一步的去查看一下,哎,是不可以的了,不过用来做一个小小的 demo 草图的一个交互算是够用的了。 而且我发现最近 prompt 工程师这个词特别的火,那我呢,也做了一个科普的页面,来讲解 prompt 到底是怎么来影响结果的,还是一样的步骤,那给出我的简单提示词,那他现在是给了我一个可交互的网页了,那我在这里输入写一句夸人的话, 他回答的是你很优秀,那我在这边再给他一个带有身份情绪的题日词, ok。 哎,他给我的就是这样的一个回答, so, 跟我们归机朋友聊天的时候,题日词的信息呢,还是比较重要的,那除此之外,我们还可以换个场景来做教学知识互动,比如物理的电路图,那我先选好卡哇斯,给出我的题日词,那我们来试用一下 那这里的电路电阻,然后我还可以在这个地方来控制它的电压,那其他的位置呢?我也是可以在这里随意的去更改的,就很好的让我直观的感受到了。 那其次就是 db research, 他 不是更聪明了,而是会自己的去完成任务列。之前是你们一个问题,他回答一段内容,然后就结束了, 而现在我再给他一个调研的主题,那他一开始还是遵循他原本的一个优点,先让我们确认方向,然后我们 觉得 ok, 然后让他开始调查,你看他现在就会按照我们的话题方向开始去一个板块,一个板块去分析。而这些信息的出处点呢,也是给我逐个的展示出来了,整个来看的话,他会把总结的内容都融进来了, 你看公式表格这些我想要知道的那些点,那我也可以根据我想要了解的板块,在这里直接跳到对应的位置,包括他把那些网页的技能按钮也搬到了这里来,那根据这次调研出网页, 我信息图导出可用的文档都是很方便了,也省去我再把内容复制到文档里,然后再给他导一次了。 其实要说视觉方面冲击力比较大呢,就是专门的欧曼奈,号称可以任意形式输入视频方式输出图片文本,大家都见怪不怪了,那我这次用手机拍了一段遛狗的视频,然后我们发给他输入我的提示词,我们来看一下,他自动给我补了光影,调了色彩,那我再给他换几种风格,换个环境, 而且你有没有发现他这里的固定元素现在都是没有崩的,那我还可以在这里多轮的去进行编辑,每加上一条新的指令呢,他就会再继续上一条的指令,继续给我更改,这跟直接给剪辑式沟通有什么区别?那我再测试一下他的音频输入,我先上传我需要用的素材,然后让他按照这个音频的节奏给我生成画面。 哎,他给我回复暂时是不支持的,有点小翻车了。接下来就是理解物理世界能力,这也是欧姆莱重新定义的一点,我只给他我的提示词,让他大概去做一个中小学物理课堂历学演示的一个场景,他这个小球受重力自由的滚落,连续完成撞击 动能的这个传递,这种一系列的连锁反应也严格遵循了这种重力弹跳动能守恒的物理公式,就能够感受出来他是在理解世界的这个运行方式。那下次我们再去做教学案例的时候,就可以给他一个概念, 简短的一个话语,它就不只是给我生成了一个像视频的东西,而是运用它的知识把概念做成了讲解视频。 today, we'll explore acid base neutralization watch the color change as the base is added they react to form water and salt。 除了放在明面上的这种视频方式,我还发现了一个类似于分身功能的视频制作方法。通过几秒钟的个人视频,那他这个人物呢,就做好了,有点类似于骚扰的味了, 不过需要切换到规定的语言,你才能看到那个入口。那说到视频就绕不开 ai 造假了,所以他们也把三分 id 往前推了一步,就是 ai 内容隐形水印,是写进图像、视频、音频里的隐形记号,当然我们肉眼呢是看不到的,通过工具就可以判断出它到底是不是 ai 生成的。 除了类似的技术,在网页端呢,也更新了几个小亮点,那首先就是开启了个性化的功能,你给专卖提出要求,比如回答问题的时候要概括要点,回答内容过长的时候要给我分条列出,他呢就会根据你的规定来和你沟通。在回答专业的问题上就不再像聊天了,我也不用再去另外的自己总结一遍了。 了解过 i o 大 会的也能感受的到,谷歌这次想做的是一个智能的全家桶,那网页呢,也出了一个可以把其他工具关联进来的入口,你像邮件、硬盘、日历、文档,在各个方面来了解你,在工作中呢,也会给你更进一步。不过 统一事件深农还有一个就是个性化的开关,根据你和他的聊天越来越多,他呢就会了解你的喜好,记住你的习惯,模仿你的思考方式来服务于你。 当然这也是要通过我们和归机朋友长时间的磨合来达到一个效果。不过随着这次更新出来了一个记忆导入,这个有点难吧,这个怎么导入啊?人家连步骤都列出来了, 怎么来提取记忆在哪里进行一个输入?其次就是自动干活的能力,定时给你发送你设置好的那些问题,随时掌握你关注的各种事项。那在之前我们基本上只能在 ai 编程工具来实现,那现在我们可以打开定时操作, 新建一个,然后填好我的要求,然后时间给他规定好。看默认的话还是在桌面生态里边去展示。如果你连接了外部的生态,那有些任务呢,也可以输出到你的邮件里。整体看下来,这次根本就不是在更新某一个功能,他是把所有能力一点一点缩到一个地方一个入口。 所以问题不在于他多了什么能力,而在于他正在让我去别的地方,这件事情变得没有那么重要了。好了,喜欢这个内容的朋友,我们下次见。
粉丝9103获赞5.7万

谷歌的界面的三点五正式上线了,整体的实力大幅提升,在多模态识别代码的边写以及智能交互体验都相当的不错,运行也很丝滑流畅,还支持大容量的上下文创作和办公,都很适配, 新手也能轻松的上手使用。大家好,我是温谷,我相信有很多小伙伴们已经在界面的官网中已经使用了三点五这样一个模型,我教大家三个使用方法,适合自建工作流, ai 的 写作、文案生成、图片、海报和抖音运营的同学。 第一,课请求调用,适合在工作中前开始调试。第二,通过 python 代码的 sdk 的 调用,适合自建 skills, 最后给 open claw 和 hammer agent 使用。第三, n 八 n 工作流使用,适合打造自己的数字能演示。一,我们用这个课请求来试一试, 好吧,然后课请求就是 c u r o, 这个大家可以往上搜一下,大家可以看一下,就是我这里 api 的 端点,就是 generate language, 谷歌点 api 点 com, 请大家注意一下这个,它不是一个呃, open ai 的 标准的一个模式,就是 如果你是那个 open ai 的 一个标准的模式,它应该是左斜杠杠归,然后再左斜杠 chat 它,这个不是,所以说我们一般做调试用,可以看一下这里面,我这边的这个,你看它后面紧接的模型是 jame 三点五, flash, genevate content, 然后 key 就 跟到我这个 key 啊,这个这个,我 key 把它暴露出来没?其实没有关系啊,因为反正这也是免费的,你看他是,你是一个专业的专业助手,解释一下什么是 leg 这个技术啊,他就已经回复了,从那里看这个这么多模型。那其实啊,这也不是我说的是这个,这个我给大家看一下, as 丢了的话,你去 get 这个 apikey 啊,我这里有好几个 apikey, 拿到这个 apikey 以后,哎,你就可以去做这个啊,就可以去把这个呃,你的 apikey 放在这里就可以做调试使用,调通了以后,你再把这个再去放到代码里面进行调试啊,然后这里它有一个这个 这个限制的。在这个地方啊,你可以看一下这里的 c 末啊,有个三点五 flag, 我 找一找啊,他这个用这个表经常会刷新的,哎,这个有个 jimi 的 三点五是吧?这是个文本输入过大模型, 它的 p r m 也就是每分钟的这个 token 啊,就每分钟五个这样是吧? t p m 这个是代表它每分钟的 token 数,它每分钟给了你两万五千个 token 啊,所以说你养龙虾可能够呛,但是你做这个自动化变卖流啊,是吧? n 八 n 啊,包括底价都是没任何问题,它一个这个分钟应该是可以, 应该是每秒了,是吧? pick lock, 那 每分钟给允许你掉五次是吧?每每分钟给你两万五千个头等,这应该是够用的啊。这个这是最最近昨天更新出来的,因为昨天这个谷歌二零二六的开发者大会是公开了个 gmail 三点五 啊,然后那个杠 max 啊,还 pro 还没有发布吧?应该是啊,但是呢, flash 应该非常强了啊,非非常强,他现在给大家免费的话,呃,大家一定要去用啊。然后第二种用法的话,就是我这个地方调了一下这个这个这个这个这个地方给大家看一下,就是 啊,这里是生成一一张什么图片啊?这这这个倒没什么,这个是我,我那个是纹身图的,是吧?我这里是用的这个谷歌的追未来的一个这个 sdk 啊,大家去引入这个 sdk 啊, flunk 谷歌 input 的 追未来 ai, 然后你下载它的 sdk 就 可以用了,是吧?然后再把我的 api 放进去,你可以跟我老师给大家演示一下啊。好, 我逻辑了下,我这里可以总共使用有五十二个模型啊,有些是收费的,有些是免费的,然后等一等, 哎,这里出来了,是吧?做的是一个让他设计这个一个品牌的一个文案,是吧?文案是吧?对对对,好, 那第三种情况也是大家常最常用的,就是这个在 n 八 n 里面这么用的,我把它拿过来给大家看一下,这个是刚刚跑出来的结果啊,之前我演示的是这个,用这个魔大平台,这个地方我用的是谷歌的,是吧?谷歌的这个是吧?然后这个地方你需要把这个 api 塞上去,哎,这里塞上去以后它连接成功了,连接成功了以后, 在这个地方你可以选择它的模型了,是吧?你一定要选择三点五是吧?最早啊,就是上周前指的免费的模型,就是街面的二点五那个比较拉快啊, 是吧?已经谷歌让我们二点五已经是发布两年前的模型啊,这个是昨天最新的模型,呃,比较强大。其他的都是收费的啊。其他这个 pro、 pro、 vivo 啊,包括这个 max 啊,都是收费的。但是三点五 plus 目前是免费的啊,为什么是免费的?刚刚跟我老师给大家看的是谷歌官网,是 是选选择,目前是现在是免费的,应该他在开发者大会上已经说了这个是免费给大家用,我相信他也不会说他给大家用一两头就关掉他,是吧?谷歌应该丢不起这个脸,是吧?好,然后这个给大家跑一下吧,对, 跑一下,这个乱乱一下就好了,哎,这个我是做了一个这个新闻的整理啊,就是第一步就是我再去搜索这个新闻,是吧?然后搜索到新闻,最后拿到这个新闻的素材,是吧?然后把这个套的新闻给我整理出来,最后拿到这个话我就会发到什么,是吧?是吧?某某抖是吧? 啊?你看这个是今天上午啊,五月二十一号的 a i 新闻,等等等等,是吧?是吧?噔噔噔噔噔,好,这是我今天给大家三个用法,希望大家去调试和使用,有问题的话小伙伴可以在这个评论区留言,我看到都会回复大家的。

兄弟们,你们猜我发现了什么?谷歌的 jamie 脸 ai pro 会员竟然又可以白嫖一年了,而且可以赠送你三百美金的 api 调用额度哦!注意,这不是学生优惠,不是之前的学生优惠,是三月份的最新方法, 趁着现在知道的人不多,咱们赶紧去薅起来吧!你不用怀疑啊,经过我的亲测,不管是你的老账号还是你的新账号,甚至说你之前购买过杰米尼的学生优惠的账号 被搬掉的,咱们现在都可以去薅这个羊毛。我已经把这个方法整理成了文档,有需要的 滴滴一下,我免费的分享给你。最后呢,老规矩啊,咱们就是测试用的一个账号,我们随机抽取一位有缘人免费的赠送给他。好吧, 呃,最后说一句啊,我会持续给大家带来关于如何挣钱 ai 相关的这些信息,有喜欢的朋友,咱们欢迎持续关注。

每天一个工具小技巧第四期,今天我们带来的是 jimmy jimmy 小 技巧免费 api 调用。上期视频我们讲了 skill finder 实验技能查找器, 这期视频我们带你免费使用 jimmy, 话不多说,我们开始今天的小技巧。首先我们需要先去创建一个免费 api, 登录官方开发者平台,开启模型权限, 找到这个创建 a p i 的 按钮进行点击,然后就会进入这个页面,找到右上角的一个创建按钮,然后点击创建, 就会弹出一个密钥的创建页面,填入一些说明标记信息后就可以点击创建按钮,点击后你的 a p i 密钥就生成完成了,此时我们就拥有了测试权限。之后我们怎么使用这个密钥呢? 我这边演示的是一个我在用的一个使用方案,配合常用的开源调试工具进行连接我使用的这个,然后下滑找到其安装命令,通过简单的环境配置完成对接,我们打开终端输入安装命令并回车等待配置完成后,我们通过这个命令 输入,加上我们开始的创建的 api 秘钥后,回车之后会出现选择界面,这里我们选择 yes, 然后到了输入界面,再输入界面我们选择 api 选项,然后我们的这么奈可以就安装完成了,这里我们只需要输入启动命令,这么奈就可以打开这个聊天界面了, 在这里可以体验多模型带来的智能响应,赶快去试试吧。好了,本期的视频就到这里了,觉得这个小技巧有用的话可以点赞收藏本期视频,想了解更多小技巧的小伙伴可以关注我,每日更新工具类小技巧,我们下期视频再见喽!

gemini 三点五 flash 终于发布了。按惯例, flash 系列一直是轻量级选手,主打性价比和速度,真正的旗舰得看 pro。 但现在行业趋势就是这样,新一代小模型直接碾压上一代大模型,三点五 flash 也不例外,在编码 agent, 工具调用这几项上全面超越了上一代的三点一 pro。 定价上,输入一点五美元每百万 token, 输出九美元,每百万 token, 比上代三 flash 贵了三倍,但比三点一 pro 便宜百分之四十。全行业 token 涨价确实是大势所趋了。数据说话, terminalbench 二点一,编码精准,三点五 flash 拿下百分之七十六点二,三点一 pro 是 百分之七十点三, gdp 榜 a a 这个衡量真实世界经济任务的榜单。三点五 flash 一 千六百五十六分,三点一 pro 一 千三百一十四分,拉开了三百多分,跑分层面确实有肉眼可见的提升,但也不是全赢。 humanity's last exam 上三点五 flash 只有百分之四十点二,三点一, pro 是 百分之四十四点四, r k g 二上百分之七十二点一,也没打过 pro 的 百分之七十七点一。 这两项考的主要是世界知识储备和纯粹的抽象推理,换句话说,这一代依然是用知识面的缩水换来了实际干活能力的飞跃。速度方面,输出比同级别前沿模型快四倍。三点五 flash 今天起直接成为 gemini app 和搜索 amoled 的 默认模型,全线上线,所有人现在就能用。

google 这次不是高调发布,而是把 gemini 三点五 flash 悄悄推到了更强的位置,表面上名字没变,实际输出质量却像换了一个模型。更关键的是,这种提升不是小修小补,而是直接逼进 gemini 三点一 pro 的 水平。 与此同时, vrtix ai 的 企业客户也收到了通知, gemini 三点一 flashlight 很 快会进入正式可用阶段。也就是说, google 不是 单点测试,而是在公开。 erina 三 flash 在 vox 场景里明显更完整,结构更稳,画面也更像样。更有意思的是,最近几轮 arina 对 战里,他出现的非常频繁,说明这不是偶然抽中,而是一个稳定在场的新变体。 再往后看, google 很 可能会走分阶段路线,先补强 flash, 再在大会节点放出更高规格的 pro, 最后把更清亮的 flash 版本补齐。这个节奏很聪明,因为它能把产品线的断层先抹平,让用户感受到的是连续升级,而不是突然跳档。 最能说明问题的是,前端生成让 gemini 三点五 flash 去做一个浏览器里的 micros 桌面,它居然把 finder、 safari、 chromium、 setting 这些组建都组织出来了,还能做壁纸、亮度、音量这些细节。 更绝的是,它不是只会画个壳,而是真的把桌面系统的层级感做出来了。对比下来,很多模型连基础结构都不稳,它却已经能交出接近 pro 级别的前端成品。 对于需要原型 u i 和交互页面的人来说,这种模型的价值非常直接,质量接近高端,成本却更低。 后面的三百六零产品查看器、 ps 五控制器、三 d 建模、幺九七零三 tv 模拟器也都在说明同一件事, gmail 三点五 flash 已经不是能生成,而是开始能完成复杂任务。它能处理 react g s a p 动画滚动交互,也能在三 g s 里搭出多频道电视开关机动画和不同场景切换。虽然山地地形那一项还暴露出交互和物理逻辑的短板,但整体趋势已经很清楚了。 flash 级别模型正在逼近 pro 的 能力边界。 真正值得关注的不只是它变强了,而是它把便宜、快、能干活这三件事第一次放到了一起。关注全球 ai 速递,获取更多 ai 前沿资讯。

这周, ai 工具圈发生了一件大事。 google 在 i o 大 会上发布了新一代 gemini 模型,价格直接砍掉一半甚至三分之一。新发布的 gemini 三点五 flash 同等能力比上一代便宜了一半, 普通用户和开发者用得起的门槛又低了一大截。 gemini 三点一 ultra 支持两百万 token, 上下文窗口,文字、图片、音频、视频全都原声,支持一次能读进去的内容。还有一个叫 gemini spark 的 功能, ai agent 可以 在你手机上的各种 app 之间自动推理和行动,目前还在被它测试,但方向很清楚。顶级 ai 博主 matt wolf 受邀参加了 google i o, 他的评测视频里提到了一个很有意思的争议点, google 的 ai 越来越倾向于直接回答问题,不再把你推到外部网站。 这对内容创作者来说可能是个坏消息,因为流量会被 ai 截走。这个现象背后是一个更大的信号, ai 已经不是稀缺资源了,它正在变成水电气那样的基础设施。同年, open ai 在 四月发布了 gpt 五点五、 anthropic, 刚出了 cloud open 四点七 几家顶级模型,能力越来越强,价格越来越低,方向完全一致。这对普通人来说是红利,但不是所有人都能吃到。拥有 ai 工具本身不再是竞争优势了,真正的竞争力是,你会不会用, 会用 ai 完成真实产出的人,效率是不会用的人的十倍甚至百倍。这场价格战在加速一个分化,会用的人越来越强,不用的人越来越落后,而且这个差距在加速拉大。不是现行的。 我在 cstu 读书,学校从二零一八年就开 ai 课了,不是现在跟风,而是七年前就把 ai 工具融入课程,鼓励学生用 ai 来辅助学习和做项目。这种思维训练比工具本身更值钱。不是教你用哪个模型,而是教你怎么和 ai 合作,怎么把 ai 能力转化成你的实际产出。 我是 vina, 一个在硅谷陪读的妈妈,也是 cstu 加州科技大学的研究生。你现在用 ai 最多的场景是什么?是聊天还是真的用它做出了什么东西?评论区告诉我,我们聊聊。

便宜半速度四倍,同价位档 arena 排名第一, google 这新模型直接刷新性价比,它叫 gemini 三点五 flash, deepmind 新家族首发, google 亲自盖章代理和编程最强扣的 arena 前端榜单一千五百零七分,同价位的所有模型分数都没它高。第一名 更狠的是,单代涨了七十分,四项主流基准全面打过自家上一代的 gemini 三点一 pro 月季反杀速度是其他前沿模型的四倍,质量却没掉档,从此不用在快和聪明之间选一个, 成本更夸张,官方说做同样的活,他要的钱不到其他同级模型的一半。而瑞纳这份不是刷题刷出来的,是真实用户每天拿它搭 html 和 react 网站打出来的票, 演示更离谱,配合 anti gravity 架子,他六小时啃完 alpha zero 那 篇论文,顺手写出一款能玩的游戏。更骚的是,他开两个子代理,一个负责造,一个负责玩,边玩边改自己的代码,六十秒能给一个结账流程生成好几套 u x 方案。 mccore 银行让他读一百多页文件,秒抓重点。 企业那边已经动起来, shopify 拿它预测全球商家业绩, salesforce 把它装进 agentforce 自动跑流程 rap, 用它识别复杂发票。 zero 全自动对账报税 data bricks 让它盯数据找异常。更反预期的是,你可能早就在用它 gemini app 和 google 搜索的 ai 模式,默认模型就是它。 彩蛋更强的三点五 pro 下个月也来, google 内部已经在用,普通人很快能上手。总结一句话,便宜一半,快四倍,同价位党冠军,想试就打开 gemini app 开口聊就行。更多最新 ai 知识分享,关注我,下期见。

二零二六谷歌 i o 大 会重磅发布 gemini 三点五 flash, 综合评分紧追 g p t。 五点五,差距仅五分,输出速度达每秒两百八十 token 是 g p t。 五点五的四倍, api 定价超低,输入一点五美元,输出九美元,每百万 token 约为 g p t。 五点五的三分 之一。多模态与智能体测试领跑,现已全球免费开放呈谷歌搜索默认模型。 ai 性价比革命,企业迁移年省十亿级成本。

别划走, google 昨晚干的这件事可能要改变你以后用 ai 的 方式,而且大部分人还不知道 google i o 大 会。半年没动静的 google 一 口气放完所有大招,最炸的就一个 gemini 三点五 plus。 你别看他叫 flash, 在 google 家里这本来是又便宜又快的入门档,结果这次他把上一代的旗舰三点一 pro 在 编码 agent 多模态上全给干翻了。什么概念?一个经济型模型,反手把上一代顶配按在地上摩擦, 而且它输出速度是别家前沿模型的四倍,价格还比三点一 pro 便宜了整整百分之四十!又快又强又便宜,这不可能,三角他真就给你凑齐了。 但最让我头皮发麻的是,这个 google 现场直接让他从零搭了一个能真正运行的操作系统出来,能敲命令行,还能跑游戏。兄弟们,这已经不是帮你写文案了,这是真能把活甩给他去干。更狠的是,这还只是开胃菜! 更强的三点五 pro 下个月就到,还有个叫奥尼的,能让你动动嘴就把视频改了。哎呀,一夜变天,普通人到底该怎么跟上?关注我?这些我一个一个给你扒清楚,别让你掉队!

一定要,一定要,一定要想尽千方百计把 gmail 三用起来。 gmail 三对中国的用户特别友好,他也不降智哦,他几乎是可以白嫖,接口非常的便宜, 如果你们想要三大免费的接口,我可以给你们 gmail 三最大的突破。他不是说技术上面有多先进,而是他把做东西、开发东西、创造东西这件事情的门槛降到了最低,最低,最低。 他不是那种听起来不很牛,但是用起来却很懵的科技概念,他是真真切切能让一个完全不懂代码的普通人,在几十秒之内可以做出以前需要几万几个工程师几周时间才能搞定的东西。假如我要做一个物理学习的网站, 我看到一个非常非常精美,然后很炫酷的网站,我想复制他,但是我又不会写代码。 现在有了 gmail 三之后,你只需要截一个图,然后你告诉他,哎,我想要这种风格的网页,他几十秒就能直接帮你做出来了。在这里面,你可能都不需要自己去准备素材, 他会去调用他自己的模型 banana, banana 去生成你想要的图片。最重要的,他是不会特别有 ai 感,他的生态非常强,他可以生成代码,你可以一样事全部帮你搞定。别再傻乎乎的去报什么编程班、 ai 兴趣班了, 你家孩子五年级数学几何,如果他老是学不会,你就把那个题拍一个照片上去, 你就说,哎,给我做一个能拖动哎,能旋转哎,能一步一步演示的动画插件。后来三直接给你生成的是可以交互的三 d 模型,他比学校老师那个 ppt 深度一百倍, 你把这个工具给到孩子用,他不是在学习哦,他是在玩透知识。他更狠的是,可以让孩子自己去提需求,自己去做课间,一个十岁的小孩 就可以只靠几句话就能做出的教学工具,这种创造力的训练值多少钱?你不要再被套路迷惑了。未来的竞争,他不是会写代码的, 而是会 ai 创造。 m 三的专家推理正确率是百分之九十一点九,达到了人类教授的水平。这意味着什么?意味着你生活中任何一个难题,从孩子早恋怎么搞,到家里装修,怎么避坑 到副业怎么样做可以月入过万,他都能给出接近专家级的解决方案,并且立即给你落地的生产工具。 我那句话可不是危言耸听,平庸的代价从未如此的昂贵。如果你对 jama 三不感兴趣, 受损失的不是你自己,是你的家庭。因为当别的家长用 jama 三给孩子生成个性化的学习系统,培养 ai 写作能力的时候,你的孩子还在刷短视频,背标准答案,一点幸福感都没有。 三年后的差距,它不是分数,而是思维的方式,是解决问题的方法论,是驾驭工具创造财富的能力,这才是真正的起跑线。 m 三,它不是一个连话都听不懂的人工智能,而是真正能代替你工作的超级 ai。 三十秒就能做出微信,一分钟就能复制一个淘宝,像以前换装的 app。 我 们在电商里面也许会看见这样子的程序,复杂吧, 前端和后端的工程师协做好几天,可能只能做出一个非常非常简单的 demo, 两三个工程师花两到三周都不一定搞得定, 但 demo 三可以让一个普通的不会代码的人,只需要把你的需求列清楚,就能生成一个特殊的应用。它不仅可以给你写代码,它还能做测试、修 bug, 最后对接各种 a、 b、 i。 jimmy 三打破了行业的规则,他不是粗制滥造者,他不像很多的 ai, 做出来的就像是哄小孩的一样,很失真。而 jimmy 三做出来的东西,是真的可以 做出各种风格和类型的游戏,比如说餐厅的手写食谱,你只要上传给到 jimmy 三,很快就能做出双语 可分享的电子菜单,小程序发一段球赛的视频上去,它很快就可以分析出哪里打得不好,以及后续的详细训练计划。你传一篇 pdf 论文,直接会给你变成名词解释和动画的教学工具。它其实有三个最大的亮点,第一是成功率高的离谱。以前我们用 ai 生成代码,经常会出错,反复出错。如果像我这样的小白遇到这样的情况,基本上两手一摊,没有任何对策 和办法去解决。但是真的三应该是内置了自动测试和自动修 bug 的 模式,相当于帮你省了百分之九十的调试时间。 第二,所有的素材都能用 jimmy 三来生成,这是一托于谷歌, jimmy 强大的生态,包括 vio 生成视频,包括 nala baba 生成图片以前我们做网页,我们必须自己去找图片、找素材、找图标, jimmy 三就是一站式服务,全部帮你搞定。 第三个最大的亮点就是完全免费,谷歌提供了很多很多免费的入口,我整理了三个,你们可以来找我要,尤其是 ai studio 里面这个 build 模式功能强大到让人怀疑人生。你不要再被那些所谓的 ai 门槛给吓退了, 我我我不会任何代码,我就是一头扎进来学习如何使用 ai。 因为我知道流量和效率是一切生意的本质。 当你还在为做一个 ppt 焦头烂额的时候,你的对手已经用 gmail 三生成了一个交互式的数据网站。当你还在为孩子补习班的费用发愁的时候,别人的孩子已经用 ai 给自己定制了专属的学习系统。 这就是最大的性提倡。在这个时代平庸,不是因为你的能力不够,而是因为你明明你手里握着核武器,却还在拿石头砸核桃。再说个我自己真实做过的案例,我那个闲鱼的课程, 以前我只要更新一集,我就要录屏,我要写文案,我要做 ppt, 我 要剪视频,我必须得折腾好几天。现在我只要录完屏,我扔给 jimmy 三说给我生成课程笔记,配套的 ppt 宣传海报和三条短视频脚本,一小时全套都齐活 了。我算了一下,效率提升了四十七倍,不,是百分之四十七,哦,是四十七倍。有人问我这么厉害,会不会替代我呀? 我说他替代的从来都不是人,而是那些拒绝使用他的人。他不会让一个优秀的人失业,但是会让一个用 ai 的 人替代十个不用 ai 的 人。我知道你现在可能有点懵,有点兴奋,也有点焦虑,是因为没有想到 ai 已经这么强了。 兴奋是因为看到了可能性,焦虑是因为担心自己已经落后了。但是我想告诉你,真正的红利才刚刚开始, 谷歌免费开放的这些能力,是为了培养用户的习惯,抢占生态位。这个时间呢,窗口可能只有六到十二个月,等到所有人都会用的时候,比拼的就是谁先起步,谁更有创意,谁更敢行动。 所以我最后的一个问题是,看完这条视频,你是准备收藏了吃灰,还是现在就打开你的浏览器,亲手做出你的第一个 ai 作品? 最后, ai 时代最应该引发深思的应该是我们要问问自己,既然创造变得如此简单,未来的商业世界什么最值钱? 不是产品,也不是技术,那什么才是人类在 ai 时代的最后护城河?我下期的视频会给你们分享我作为一个普通人的实用心得。

google 今天发布了 gemni 三点五 flash, 官方说这是最快最便宜的闪存模型,但实际成本有点意外, 每百万输入 token 要一点五美元,输出 token 要九美元,比上一代 gemni 三 flash 贵了五倍以上, 甚至比 jamming 三点一 pro 在 某些任务上还贵百分之七十五。不过速度是真快,编码能力也很强。以前这种闪存模型只能做简单问答,现在它能规划百万行代码的修复,还能同时派多个子代理干活, 相当于一个工程师团队协作实测前端设计。它生成了一个 windows 九五桌面,有启动音效,有 b o s 启动界面,有功能性的画图和记事本,比同类型模型更精致。 svg 方面也强,能直接把一句话转成复杂矢量图。三 d 场景更夸张,用它做了一个 z o 的 游戏环境,光照、深度、色彩都到位,还自动配了背景音乐。 google 把旗舰智能塞进闪存模型,想法很好,但用户得掂量掂量钱包。最适合的场景是需要快速出创意原型或者做复杂前端编码,毕竟它确实能省时间,以前三天拼的前端界面,现在三分钟就能跑起来。

五月二十日,谷歌宣布推出 gmail 三点五 flash 模型,称这是谷歌迄今为止最快、最有效的模型,速度超其他前沿模型四倍,成本仅为同类模型的一半,性能全面超越三点一 pro, 即日起向全球免费开放使用。

家人们真的绷不住了,谷歌二零二六这场发布会最精彩的地方居然是观众的叹气声,你没听错,号称要吊打 g p t 的 gemini 三 five pro 直接宣布下个月再发,现场劈叉自己都尴尬的不行, 三个核心产品,三个都在画大饼,这到底是科技发布会还是力向汇报会?咱们来看看这波操作有多迷。 真正的旗舰 gemini 三点五 pro 直接跳票,说好下个月发,结果下个月 g p t 五点六都出来了,到时候还不是被吊打?这叫什么?这叫战略性放弃!第二个号称能替你打工的全天候智能体 spark, 听着挺玄乎,结果呢?只给可信测试员用?就算你是花了近百美元订阅的 otr 会员,也得等普通用户,想都别想。说白了 这就是个 demo 视频。最离谱的是性能,文章作者实测了,同样是写东西做复盘,这个吹上天的 flash 版本居然干不过柯达 opus 四点七和 gpt 五 five。 谷歌吹嘘的速度快四倍,便宜百分之四十,全是跟自己比,跟对手比,不好意思,没一句对位的话。那问题来了,想自己试试这些全球顶尖模型,非得折腾账号和网络吗?顺便说一下,文章中提到的 quite opus、 g p t 五 five 以及全球三百加最新模型都已经上线。青云聚合 e p i 一 pop 点 pop 直接调用就行,不用翻墙, 高速稳定,价格大多只要官方的十分之一,文档丰富,小白也能轻松上手。这才是普通人玩转 ai 的 正确姿势。总结一下,谷歌这波属实是雷声大雨点小,你们觉得谷歌还能翻盘吗?还是说 ai 时代 谷歌已经掉队了?评论区聊聊,关注我,咱们不聊虚的,直接实测几个能赚钱的 ai 工具。

不要再给那些昂贵的 ai 交智商税了。今天谷歌发布了 gmail 三点一 flash light, 这又是 ai 界的一个网站,它不仅价格低,而且处理速度是之前的二点五倍, 哪怕你给他一万张照片,他也能在很短的时间之内帮你把照片分的明明白白的。那根据官方给出的说法是,以前问 ai 可能需要五秒钟,现在至少提升了二点五倍。 其中最离谱的还是价格,每百万 token 的 价格只有零点二五美元,这意味着什么?你可以让 ai 二十四小时盯着你的监控,处理你监控产生的视频素材,但是他一天花的钱还不到一杯咖啡的钱。 作为一个爱好摄影的人,最可怕的一个事情就是拍了延时摄影,但是延时摄影当中出现了某几张照片有一个污点, 现在就可以用这种 ai, 让它瞬间帮你找到这个污点。可以说它不是能不能用,而是现在让你随心所欲的用,成本不断降低,速度越来越快,这才是我们想要的 ai, 这也是 ai 的 未来。

二零二六年五月二十日,谷歌在 i o 开发者大会上发布 gemini 三点五 flash, 主打轻量旗舰,重点面向智能体和编程场景。 这次最受关注的是,它把速度和性能一起拉高了。官方公开数据里,它在 terminal bench、 二点一 gap 八 a a 和 m c p atlus 等测试里都超过了上一代旗舰。 gemini 三点一 pro 属于明显的能力,跃迁 速度也很夸张。 gemini 三点五 flash 的 输出速度达到每秒二百八十九个 tokens。 谷歌还说,在安泰 gravity 智能体平台联合优化后,速度最高能再提到十二倍,直接把同级竞品甩开一截。 成本同样是重点,它的 api 定价是输入一点五美元每百万 token, 输出九美元每百万 token, 定位很清楚,就是让高性能模型更适合大规模落地。 另外,它还支持一百万 tocan 输入和六四 k tocan 输出,原声兼容文本、图像、音频、视频、多模态输入,等于把长上下文和多模态能力一起打包了。 目前, gemini 三点五 flash 已经同步上线 gemini app, 谷歌搜索 ai 模式和 gemini api, 并成为默认模型。 对谷歌来说,这不只是一次模型更新,而是智能体战略的核心底座。如果后续实际体验也能接住这组指标,詹麦奈,三点五 flash 很 可能会成为今年最值得关注的轻量旗舰之一。

朋友们,如果你这半年已经开始让 ai 帮你干活,那你大概率遇到过三件事,问一句话,要等半天,用顺手了突然又要加钱。别人推荐的好工具你这边还用不上。 二零二六年的 ai 年终大戏,最后砸到普通用户面前,就是三道题,更快更便宜。好模型到底谁能用得上? 第一道题,骨骼先打轻量模型还能不能当主力? jameson 三点五 flis 把上下文直接拉到一百万,实测输出接近二百八十九,都是每秒部分的 agent 还有扣点性能压过上一代的图。 flis 呢,开始从便宜替身挤上主力中。 可是一旦轻量模型能干重活,那么下一刀就落到价格上了。 big six 直接把 a p i 成本往下砸,缓存命中,价格降到了首发价的十分之一。 v 四 pro 呢,切得更低。他逼所有的模型必须要回答一个问题,就是你凭什么卖那么贵? 价格被打穿之后,智普给出了第三个答案,在便宜之外,还要选高速场景和出海。 glm 五点一高速版官方输出最高四百多个视频秒他瞄准扣定 agent, 还有实时工具调用 这个特性呢,先在开发者圈被验证,等能力被塞进普通工具里之后,用户感受到的其实就是更快以及更顺手。 所以呢,这场年中大戏的启程转合很清楚,谷歌把轻量模型推上主座, deepsea 把价格底线砸穿,智浦呢,去抢速度和出海位置。下半场的关键就看谁先变成普通人。每天顺手打开的入口。

谷歌 gemini 又搞事情了,继推出了 gemini 三和 nano platinum pro 之后,又放出了一个极致性价比的版本 gemini 三 flash。 前两天 check gpt 才刚放出 images 一 点五,热度还没持续多久, gemini 这边直接接管了热搜。最近的 ai 圈你会发现一个现象,越到年底,他们反而拼得越凶。而这次谷歌放出的 gemini flash 并不是那种名字听着就像缩水的版本,而是用白菜价跑出了接近其 旗舰版的体验。不信的话,我们上帕莱托前沿图给大家看一下。这个图的重坐标反映的是模型的能力,越往上越好,横坐标反映的是价格,越往右越便宜。 你看呐, jameson flash 在 这张图当中简直就是性价比的一颗独苗啊,能力不仅比自家 jameson pro 二点五强,还超越了 crouops 四点五、 gr 四点一和 chat gpd 五点一。 关键的是人家比你强,还比你便宜,这步操作也没谁了。那该怎么使用呢?你可以直接从手机端的 gemini app 上使用,或者用谷歌搜索的 ai 模式也可以用上。如果你是开发者,可以在 google ai studio 或者 google analytics 平台使用。在 gemini 的 企业版当中呢,也加入了这个模型, 那我们现在就来看一下这个性价比之王到底强在哪里?我们先来看一下官方放出的第一个对比实验,你会看到 gemini 三 flash 不 仅速度上优于 gemini 二点五后 加厚的 tokens 呢,还比它少一倍多,速度提升了三倍,还极大的降低了成本,简直就是生产力的新宠啊!测试完速度和成本,我们再来看看大家都很 关注的编程能力,可能很多人会觉得,这不就是一个速度更快的清量模型吗?编程能力应该不怎么样吧,但实际测试下来,在评估真实编程代理能力的 s w 一 百里面呢, jameson fast 居然拿到了百分之七 七十八,不仅碾压了二点五系列,在一部分的任务上呢,甚至超过了 german 三 pro, 这也太强了吧!我们直接来上几个案例。第一个呢,是一个首部追踪抛球解谜的游戏 german 三 press, 可以 一边理解玩家的动作,一边用多模态来推理,而且呢,几乎是十 实时的给出反应,在这个场景下,反应速度稍微慢一点都搞不定啊,可见呢,这家伙还真挺能干的。第二个案例是一个前端的真实场景,就是加载动画的 a b 测试, jameson 三 friends 几乎是即时生成新的旋转动画方案,同时把设计和代码一起搞定,再一次证明它的反应速度以及解决能力真的很强。 第三个案例就更直观了,它能够几乎同一时间分析一张图片时,结合上下文,直接生成带交互逻辑的界面覆盖层,把一张静态的图片变成可以操作的交互体 验。如果不够聪明,这样的复杂任务根本没法完成了。那关于编程的最后一个案例,也是很多开发者觉得很爽的,只用一条指令, jimmy 三 flash 就 能写出几种完全不同设计风格的程序版本, 就像一个学霸做一道题,变着花样的用不同的解法,而且答案还正确,不得不佩服啊!你会发现,这四个案例的背后本质都是同一件事情,就是这个模型它不仅能干,它还能够实时迭代,并且呢,明白你想要什么,简直就是开发者的好帮手。接下来我们再来说说它的 交互部分,这个部分呢,我觉得才是 jimmy 三思跟普通人最密切相关的地方,到底能不能帮我们在工作生活中降本增效呢?继续看案例。 首先看看生活上,你可以直接把一段短视频丢给他,比如官方的这段推求的动作视频, jimmy 三 fresh 能够快速的理解视频里面的细节,并且告诉你 哪个动作做不对,应该怎么调整。这下好了,你直接多了一个万能的私人教练。再来看看画图的理解能力,不是丢给他静态图哦,而是你实时画的草图。想想以前你画个草图,如果画工稍微欠佳一点,你还得跟大模型解释半天你在画什么。 现在你在画板上勾了几条线条,前面的三 flash 已经能够看出你是在画猫还是画狗,你是画圆还是画方?你还没有画完,他已经大概理解你想要干什么了,这个功能对于我这种灵魂画手 实在太有用了。再来看一个音频的案例,这可是学习的利器,你可以直接上传一段录音, jimmy 三 fresh 不 仅仅是帮你转入成文字,他还会猜测你哪里可能会有疑惑。然后呢,自动帮你生成针对性的测试题,还能把答案拆开讲清楚。这个能力对于学习型的用户来说实在太友好了。 所以你会发现 jimmy 三 fresh 在 交互能力上不是简单的你问我答,他是分分钟比你还了解你自己,帮你成长。 我觉得这才是 ai 该有的样子。 jamesonfast 的 这些能力真的震惊了整个 ai 圈,它的模型体积更小,但反应更快,而且更便宜。 你不要小看这个突破,它打破的不是某一个榜单,而是一个老共识。以前我们默认的是速度、成本、能力三者不能兼得,你要快,你就别指望它聪明,你要聪明,你就得忍着慢和贵。那 jamesonfast 直接掀桌子,不好意思,成年人不做选择,我全都要了。可以说谷歌狠起来连自己人都干了。以后大家要用后版本的时候,就要问问自己,我是真的需要极限推力,还是选择这个性价比之王?从 jimmy 三 fresh 的 发布我们可以看到,这背后其实是谷歌一个非常明确的信号, ai 已经不止 专属于专业人员了,还要进入主力机的时代。就像当年搜索引擎一样,你必须快,必须准,慢一秒搜不全,用户就不会选择你了。现在的大魔星也开始走同一条路了,谁能又快又便宜,还不拉垮谁就能收获用户的心。所以你会发现,年底的这波 ai 的 厮杀,已经不是比谁 谁参数更大,而是谁能把高级能力变成日常的基础设施。接下来三 flash 就是 谷歌在这个阶段丢出来的一张王牌。接下来压力就回到了 open ai 这边了,你更看好谁呢?我们评论区里聊一下, ok, 以上就是今天的所有分享,我们下期再见!