谷歌正式宣布推出 gemini 三点五 flash 模型,一分钟快速了解!谷歌宣布推出 gemini 三点五 flash 模型,这是谷歌迄今为止最快、最有效的模型。谷歌表示,从今天起,谷歌的 gemini 三点五 flash 将向全球所有用户开放,并且免费使用, 用户可以在模型下拉菜单中选择三点五 flash 进行体验。这次 gemini 主要更新是从回答问题的聊天助手升级成能主动帮你完成任务的智能体。 一、更强模型推出 gemini 三点五 flash, 更快,适合编码和智能体。任务二,视频能力升级。 gemini omni flash 支持用文字、图片、视频生成和修改视 频。三、更像智能体新增 spark, 可二十四杠。七、后台处理任务。四、更主动的日常助手 daily brave, 能结合 gmail 日历等生成每日简报。在 ai 智能体方面,谷歌将推出 gemini spark。 谷 哥介绍称, geminis park 是 全天候个人 ai 代理,能够帮助管理数字生活,并在指令下代执行任务。 geminis park 本周面向受信任的测试人员推出,下周将面向美国谷歌 ai ultra 定位用户推出测试版。
粉丝102获赞795

谷歌刚刚发布了 jimmy 三点五 plus, 同时还把他们的编程工具 antigravity 升级了二点零,那这次就很明显了,谷歌的话这次是要全面提升它的这个抠点能力。之前不管是在 coi 还是 ide 还有模型, 其实给我的感觉就表现很一般,那这一次的话,这个模型最大的亮点官方说就是它的这一个速度啊,是前模型的四倍, 所以这一期我们就测一个最关键的问题,这么快的速度,它整个的一个代码质量会不会缩水?那我直接会拿两道真实的一个编程任务,把它和 cloud op 四点七, gpt 五点五放到同样的项目里面,同样提示时看它大家的一个表现情况。那下面的话,我们大概去扫一下它官方改出来的一个奔驰 mark 评分哈, 在编程方面的话,主要就看这一个 terminal, 奔驰二点一,还有这一个 sw 一 奔驰 pro, 从这个评分看的话,这一个 jimmy 三点五 plus 这个评分还是可以的哈,但是基于我之前对于谷歌模型实测的结果来看,就是评分不代表一切,因为之前就感觉它在这个编程方面挺拉的,这次我们就看整个的一个三点五 plus 表现到底怎么样。那这一次的话,我们的整个测试题目哈,就是沿用之前测试 cloud of 四点七,还有就是 gpt 五点五的两道真实的一个编程任务。第一个的话就是我们这一个 skills agent 嘛,需要把它从一个 c o i 做成一个 web ui。 第二个的话是希望他从一个已有的比较复杂一个项目里面把这个认证登录给它迁移过来,这一块也比较复杂,需要支持啊, get 谷歌,然后还要做一个落地页。好,我们来看一下这两个实测项目哈,左边的话,就我刚刚说的这一个 skill is a 镜头嘛,第二个的话就我们图片生成 a 镜头,那这次的话,我们是用了这个 anti gravity 它的一个 c o i 终端工具, 整体这一块呢,它的交互的话是跟呃卡扣的很像,那我这边测试下来,他的速度是真的快,相当相当的快,他说四倍,一点都没夸张。 那大家看一下它这个交互的一个情况啊,其实还是感觉挺挺好的。这个交互,那至于整个模型的能力怎么样,那这两个任务我这边实测下来,它都没有一次性的去完成,它或多或少都有一些小问题。那同样的这个提示值,在同样的项目,我给到了 gpt 五点五 以及 calloff 四点七,它都是能够一次性完成的,不管这两边哪一个项目都可以完成。但是 gmail 三点五 plus 它除了快,但它其实还是会有一些或多或少的 bug 嘛。好,我们来看一下它整体的一个表现情况。 好,我们来看一下这个是 jimmy 三点五 plus 帮我们完成的 skus agent 的 一个 ui 界面嘛,它可以去执行一些操作,比如说我给他一篇文章,可以让他帮我们去总结,它就会去加载这个的 skus。 就 我之前有一期视频 专门讲了这个 skills 的 一个工作原理嘛,那这是它完成的一个效果,整体上 ui 这块还 ok, 那 这边的话是 g p d 五点五给我们完成的,左边也是有我们的一个的一些 skills 是 哪一些?那右边的话就是它整个的一个操作的一个过程嘛。怎么说它这个 ui 的 一个结果的话,我觉得就是呃 g p d 五点五的会好一些。 那关于图片生成这个项目,让它去做一个落地页,以及让它去做一个就是谷歌 get 五的认证登录嘛,那这块它也是完成的,但是不是一次对话完成的。 u i 这块的话就是谷歌还是可以的,就是相较于 g p t 五点五的话,我觉得还是会好一些,就 u i 这块的话,我们还是优先选择就是谷歌的模型嘛。 好,下面我们来看下整体这个评分结果哈,那这个评分的话,还是跟之前一样,我们是把所有的模型生成代码通敏之后,然后改到模型去做 review。 那 这边的话 g p t 五点五是要胜出的,它的分会高一些。 第二个的话就是 cloudoff 四点七会辞职,那 gpt 三点五 plus 的 话,它整体评分效果会低一些,也就是它除了快,那代码质量上的话是会差一些。那这边的话也有些解决方案,比如说你可以用 cloudoff 四点七做设计,或者 gpt 五点五做设计,然后再用呃 jimmy 三点五 plus 去做执行。 那这块儿它还不是还发布了这个 anti graphic 二点零嘛。那这个 id 的 话,你就把它等同于 codex 吧,跟 codex 一 模一样。那我这边的话 现在还登录不进去,不知道啥问题。好,下面我们来进行一个总结。那这次他的整个编码水平的话,就是速度上确实是领先很多,但是在交付的一个结果上来看的话,跟国外两家模型还是有差别,尤其是在一些复杂项目里面,他还是会有偷懒的情况。 如果你是需要去做一些原型啊,或者做一些 u i 啊,我觉得这个 jimmy 三点五 plus 真的 是有比较有吸引力,因为它整个速度比较快,而且它的价格也比较便宜。那如果你是需要一些复杂的项目啊,多文件呀,那阶阶段我还是更推荐大家使用 g p d 五点五,在 codex 里面 你运行起来也非常的快。扣袋子这个 app 我 强烈推荐给大家用,我已经最近用了一个多月了,真的非常非常的好用, card 的 话就是封号真的特别严重,我已经放弃了。 ok, 那 这就是这期视频所有内容了,如果大家觉得这期视频做的不错,可以跟我一箭双雕,我是阿江,我们下期见,拜拜。

建制的 ai 居然可以直接生成工程模型了,大家看我只是给他一张随手画的支架草图,还有几个硬性要求,他是直接在分析中的逻辑,然后甩给了我一个实时的建模三 d 网站。而且最离谱是生成出来这个模型是完全完全是没有破面的。切,软件是可以直接识别直接打印的,如果你不满意的话, 不用重新再改模型怎么怎么样,直接改这参数就行了,会重新给你计算这个结构。这个在传统的软件里面叫做参数化设计,以前的门槛是极高的,现在 只要你有逻辑,我想要什么,约束条件是什么, ai 就 可以帮你搞定剩下的数学和工程问题。这个模型等会我会放到 macworld 上面。如果你也对这种类型的模型感兴趣的话,也许下期我们可以试一试一些更有趣的东西。下期视频不见不散,拜拜!

今天这个视频给大家分享一下如何用 jamming 写的代码加载三 d 模型,做出这样或者这样的小游戏,大家可以拉到视频最后看文字版总结。第一步,我们需要准备好三 d 模型,不会建模的宝宝也不用慌,我们可以使用 ai 建模工具 主包,今天用 neo 四 d 给大家演示一下。这个工具有三种生成模型的方式,图文结合的生成模型, 文字生成模型以及图片生成模型。在主页还有一些已经制作好的模型,大家可以下载主包,这里使用的是图片生成模型。 点击第三个按钮,进入页面之后,我们在左侧框框内上传一张参考图,耐心等待一会会一次性生成四个模型,我们选择最满意的那个模型, 左下角保存成 g l b 格式文件,接下来新建一个文件夹,并将 g l b 格式文件放进去。第二步,准备提示词。我们需要告诉加密奈用代码加载我们刚刚准备好的模型,所以在开头一定要写这句话, 大家记得把模型名称修改成自己刚刚保存的名称。下面这个部分大家修改成描述自己想要的效果的提示词,主播这里做的是例子效果, 如果想要加载原始模型,告诉 jammy 保留模型的原声质感就行了。接下来把提示词发送给 jammy, 准备好代码。第三步,我们需要使用 vsco 运行代码,我们打开 vsco, 选择刚刚准备好的文件夹,右键新建文件, 输入代码,文件的名称,并加上点 html 的 后缀,把我们刚刚准备好的代码黏贴到这个文件中,接下来点击左侧这四个方块,在这里搜索插件 live server 并下载好, 点击左侧第一个按钮,回到文件夹内,选中 h t m l 文件,右键第一个使用刚刚下载的插件运行就会自动跳转到浏览器了,这样一个加载三 d 模型的交互小游戏就做好了,希望对大家有帮助。

哈喽啊,小伙伴们,给你们展示一个瞬间移动的超能力。一眨眼的功夫,周围就变成了阳光、沙滩,海浪就在身后拍上来,风里都是海水的味道。这感觉也太真实了, 不是抠图,不是套滤镜,是这是谷歌最新视频模型 omni 生成的。我们熟悉的那些视频生成工具,基本上是文字转视频,你打一段描述,它生成一段画面,生成完了,如果要改,那对不起,得重新来。 omni 作为真正的多模态视频生成模型,能够把文字、 图片、音频、视频这些输入理解了之后,统一生成出来。谷歌 deepmind ceo 在 发布会上演示的时候,直接拿了一段真实录像,让 omni 修改环境风格、镜头角度,还可以把你画的草图、 其他场景的图片一起塞进去,让他参考。接下来我们看看这次的重头戏,全新模型 jimmy 三点五 flash 这次居民来网页端焕然一新,弥散风,极简留白, 整体都很干净。嗯,怎么说呢,有点 chat gpt 纳胃了。我们选择最新的 jmi 三点五 flash。 第一个测试,我让它做了一个打地鼠小游戏,游戏整体很流畅,游戏机制和逻辑也没问题,点击炸弹扣分,偶尔刷新黄金属,每次点击都有音效。 这个小细节是有的,就是有一个问题,这个老鼠长得不太像老鼠。最近 token 这个词很火,那么第二个测试,我用它做了一个关于 token 预测的科普页面,它生成了一个可以实时交互的网页,解释 ai 是 怎么一个词一个词往下猜的, 页面里的候选词、概率条、温度、滑杆都可以拖动,一步步生成自己的故事。以前要解释 token 概率、温度,大家可能听三秒就走了,现在做成直观可交互的网页,反而更容易让人懂。这次更新 jamie 还带来全新的思考,等级 有标准和扩展两档可选,我们选择 g m i 三点五 flash 扩展复刻了一个 android 时期最新系统,结果确实有点惊艳。它生成出来的界面不只是一个空壳,音乐可以调整进度条也能切割, 相机入口有了,但不能正常打开。信息功能倒是挺完整,能正常发送,甚至还能收到回复,等一下,难道真的能操控?哦哦,好吧,是我想多了。这个设置界面真的很细节, wifi 关闭开启状态栏也会同步显示,亮度调整也会实时控制屏幕明暗,整体来说完成度很高。如果你是做交互草图功能演示,这种能力已经很实用了。此次还更新了全新音频模型 live 三。 这个我一共生成了两段,第一段是八比特游戏 bgm, 我 给他的需求是三十秒,结果他给我生成了足足五十三秒。不过风格确实挺符合我的要求,街机感有,节奏也轻快,放在小游戏里不会抢戏。 第二首,我本来想生成一首 r b, 但听下来我觉得它更像偏华语流行的风格,歌词探讨了人工智能、 陪伴与自我寻找的主题。关键是 larry 三除了能生成音乐,还会同步生成歌名和封面,这个真的好评,他甚至还有和声处理,时间有限,我们快速听一下。让我没想到的是,结尾居然还有一句独白,一下子升华了。 最后快速过一下网页端的几个更新, jimmy 现在可以开记忆,从你过往的对话里慢慢了解你这个人,越聊越懂你。还可以关联你手机里装的应用, 让它在你的生活里更有存在感。这个功能我玩了一下,挺有意思的。复制这段提示词到其他 ai, 然后再把结果粘贴回来, gemine 就 能快速获取你的偏好和一些记忆。我把这段话拿去问 chat gpt, 结果太透彻了,给我分析的明明白白的,感兴趣的小伙伴也可以试试。 提示词我会放在评论区。 pro 版现在有每日用量和每周用量两个维度,重置时间显示的很清楚。看到这个界面,我第一反应是,嗯,这不就是向 cloudy 看齐吗?你可以设置让 jimmy 定期自动帮你做事。新闻摘要、新知探索、晚餐食谱、 晨间激励、内置模板都有,也可以自己建。这个功能我觉得很适合做信息收集整理。好,快速总结。 google 这次不是单独发了新模型,而是把 gemini、 omni、 linear 三拼成了一条完整的创作链。以前要开五六个工具,而现在谷歌是想让你在一个地方搞定。好啦,这期就到这里,具体详细对比实测,期待后续评测。

看我三分钟逆向一个网站,安泰 guapg 更新 zuma 三点五 plus, 但我醒后变成一款真正的技术美学。在这段两分钟的录屏里,我们没有依赖任何现成的逆向框架, 而是借助 zuma 三点五 plus 极速的上下文理解能力,完全基于底层逻辑,用安泰 guapg 顺着代码的纹理一点点结构了这个网站的防御机制,清晰地记录了整个模拟抓取 pose 请求的层层剥离,再到最后完美构造请求并成功获取数据。 每一个断点的调试,每一次内存数据的捕捉,都像是一场精心编排的解密表演,没有笼一的操作,只有代码与逻辑的精准交锋。看完你就会发现,真正的逆向工程,往往是在这种不温不火的冷静分析中,呈现出最让人心动,也最让人叹为观止的技术力量。

哈喽大家好,欢迎收看我们金米零基础保姆教程的第八期。上期视频我们带大家搞定了金米的全套基础设置模型,选择、万能提示词,还有三大王牌功能。 很多同学学完之后会发现设置基本全开了,模型也选对了,但是用起来依旧效率非常低,答案也生成的非常敷衍,逻辑混乱。那是因为你只学会了基础操作,却不知道新手最关键的进阶技巧和闭坑逻辑。本期视频全程干货,没有废话, 教你五个高阶的实操方法,彻底把精密的性能拉满,告别低效使用。另外提一嘴,本期视频所讲到的所有内容,包括贴士、磁模板,还有官网链接都会放到评论区下方,有需要的可以自行去领取。 首先,先纠正一个所有人基本上都会惨的致命误区,就是很多人他会在同一个对话框里反复的去修改提示词,反复重发,这是最大的禁忌。就金米尼,他的上下文记忆特别强,旧的错误指令杂乱对话会持续干扰 ai 的 判断。记住核心铁律,新任务 新问题必须新建新对话,只要做到这一点,你的输出质量一定是有翻天覆地改变的。第二,升级你的万能提示词基础公式基本上人人都会,但是想要真正让 ai 去出精品,必须增加限制条件。给大家一个升级版的可以直接复制的提示模板, 你是顶尖领域专家,开启深度思考模式,依照实时联网作答,拒绝编造分布拆解问题,逻辑完整,内容详实,按照 markdown 排版内容重点加粗复盘优化后输出成品,提问时一定要加上使用场景、字数限制、 文风要求以及禁止内容。写论文要严谨,写文案要爆款,做选择题要出步骤,精准约束之后 ai 再也不会给你出笼统模板。第三,超长文档高阶用法,仅米支持七十五万字超打上下文 不只是简单总总结,上传 pdf、 电子书、论文合集之后,别只会让它概括全书,记住三个高阶指令,局局梳理框架,精准解锁答疑 对比、排查漏洞。不管是期末复习、文献研读还是资料整合,都能一键完成,几乎碾压市面上所有 ai。 第四, 多模态深度实操图片、视频、音频是金米的核心优势。上传错题不只要答案让它拆解考点标注易错点生成同类题型。上传网课视频 一键提取带时间戳的笔记上传会议录音、自动整理记要和核心要点,学习、办公、复盘全部高效搞定。第五,专属智能体 gim, 一 键提效一分钟。搭建私人 ai 助手, 根据高数学作代码策划等不同场景设置专属的人设以及固定的输出格式。保存之后无需你重复写长期的词,随开随用, ai 会越用越适配你的个人习惯, 长期使用效率直接翻倍。最后给大家总结新手的三大红线,不毁用旧对话不关闭实时联网,复杂任务优先使用 out 对 顶级模型。 看完这期视频,你就会从只会闲聊的新手变成了会精准使用 ai 的 高级玩家。赶紧动手试一遍!关注我,下期视频带你解锁金米专属场景实战,彻底解放你的学习和办公效率!

昨日 google i o 开发者大会,整场最重磅的 ai 革新,一句话就能概括, gemini 三点五 flash 正式全面上线。谷歌正彻底把 gemini 从单纯对话聊天助手, 升级为可自主后台运行任务的全能 ai agent 系统。本期内容不止梳理本次发布会新品,更深度拆解新一代 gemini 与前代产品的核心差距, 先理清最核心的版本布局。此次率先落地开放的是 gemini 三点五 flash, 目前已全面入驻 gemini 客户端、谷歌搜索 ai 模式、 gemini 开放 api、 ai 开发工作室、安卓开发工具以及谷歌全新自研开发工具 anti gravity。 而定位更高阶的 gemini 三点五 pro 暂未正式上线,官方官宣将于下月正式推出。 所以眼下网传 gemini 三点五全面到来并不精准,实则是极速版 flash 率先就位,专业版 pro 仍在蓄力等待。 本次 gemini 三点五 flash 的 升级核心十分明确,响应速度大幅提升,代码编辑能力迭代优化,适配各类 ai 自主任务运行。 谷歌将其批量嵌入搜索生态开发工具,开放接口与日常应用,足以证明这款模型早已跳出纯对话闲聊的定位,主打高校及时响应。与全自动后台任务执行。 相较前代版本,本次升级主要分为三大核心变更,第一大变更 模型内核全面偏向任务自主执行。以往大家使用 gemini 大 多局限于答疑解惑、文案创作、内容总结、图文解析等基础功能, 而三点五 flash 的 宣传重心彻底转变,全力强化复杂逻辑推理、代码实操、第三方工具调用以及长周期连贯任务处理能力。 简单来说,它不再局限于被动回复短句指令,而是能够自主拆解目标任务分布、规划流程,联动各类工具获取结果, 再依据实时进度继续推进后续操作。这也完美契合当下主流 ai 工作逻辑模型,负责决策判断配套工具落地执行,长期记忆程上下文 全线体系划定,使用边界智能调度,保障任务持续运转。此次 gemini 升级,正是朝着这套成熟体系全速靠拢。第二大变格,谷歌搜索正是迈入 ai agent 时代。 本次谷歌搜索 ai 模式默认搭载 gemini 三点五 flash 核心,升级绝非仅仅新增几句 ai 内容总结,而是重磅推出信息智能助手 information agents, 可以直白理解为嵌入搜索内的专属信息追踪管家。传统搜索模式下,需要用户主动反复检测、手动筛选信息,逐一浏览网页、整理内容。 而 ai agent 化搜索,只需下达完整复杂目标,它便能自主长期跟进、动态整合信息变化,精准筛选有效内容。 无论是产品深度调研、前沿技术方向追踪、出行方案对比规划,还是金融数据实时监测,繁琐的人工整理流程都将被替代。 目前,该功能尚未在全地区、全场景实现完美落地,但谷歌的发展方向已然清晰,搜索不再只是单纯输出答案,而是主动帮用户持续跟进,统筹打理各类事物。 第三大变更, gemini 正式打通云端后台离线任务 其中最具颠覆性的当属 gemini spark, 它定位为全天候云端个人智能助手,可常驻谷歌云端后台静默运行,无缝联动邮箱、文档、换灯片等全套办公生态, 用户无需全程守着对话窗口下发指令,他可在后台自主推进全流程任务,仅在关键决策节点主动发起确认。真正成熟的 ai 助手,本就不该局限于对话框内被动等待指令, 而是能够精准承接整体目标,自主拆分执行步骤,自主把控任务节奏, 遇卡点及时暂停问询。普通用户可这样通俗理解,从前的 ai 更像临时帮手,随叫随动。 如今,谷歌致力于将 gemini 打造成二十四小时待命的专属任务管家,全程自主跟进事物进度。 面向开发者层面,此次更新同样诚意十足。 anti gravity 二点零正式升级为独立桌面端开发工具,同步配套命令行操作工具、全套开发套件、智能托管 agent 定时任务部署以及多线成斜童子助手功能,看似专业绘色的功能落地,实际开发场景通俗易懂。多智能助手分工协助,分别负责整体方案规划、代码编辑调试、 程序功能测试、成果核验排查,多个模块同步并行作业,最终整合输出完整可用项目成果。这套运作模式和成熟的 ai 调度层、工具层架构高度契合。 ai 不 再局限于零散代码片段生成,而是深度融入完整开发流程,实现分工协助落地执行、自检复盘、结果回传、全链路运转。 除此之外, gemini 也值得重点关注。作为谷歌全新布局的视频与全模态内容生成赛道,标志着 gemini 不 再深耕文字代码两大领域,正是全面进军图片、 短视频、音频、交互界面等全维度内容创作领域,客户端体验也迎来全面优化。 gemini 移动端界面全新改版, 新增每日资讯速览功能,同时上线 mac 桌面端应用。对于普通用户而言,这类体验优化虽不及模型内核升级亮眼, 却足以看出谷歌的布局野心,将 gemini 从单一独立应用打造为跨设备、全场景通用智能入口。 由此可见,看待本次版本迭代,不能只片面对比 gemini 三点五 flash 的 跑分性能与响应速度, 真正的核心看点是谷歌成功将 gemini 深度植入四大主流实用场景,日常搜索、云端办公程序开发、全域内容创作,搜索端实现长期自主信息追踪, 办公端打通全套办公软件落地后台,离线事务开发端搭建多智能体协调开发体系,创作端持续补齐全模态影音内容生成能力, 这才是本次发布会最具价值的核心变更。对比前代产品,两代产品的定位差异一目了然。 旧版 gemini 偏向高性能智能问答入口,用户输入需求,模型直接输出对应结果。 而 gemini 三点五的核心思路是把 ai 模型融入整套系统生态,实现工具互联、数据互通、任务自主执行、进度高效跟进。 他的竞争对手也早已不再局限于 chat、 gpt、 cloud 这类纯对话 ai 产品,而是瞄准整套一站式 ai 办公全流程 ai 开发工作流体系, 给普通用户。三点理性看待思路。其一,不必盲目紧盯各类 ai 模型战力榜单。模型速度与基础实力固然重要,能否稳定顺畅完成完整事物,才是决定实际使用体验的关键。 其二,切勿认定所有新功能即刻就能全员起用。本次诸多高阶能力会按照地区会员权限使用,设备分批逐步开放,我们重点看清长期发展趋势即可,不必执着于当下即刻上手。 其三,重点紧盯 ai agent 自主办事能力,能否独立闭环完成一整件事物,而非单次简短问答,是未来 ai 产品的核心分水岭。 总结,本次 gemini 三点五升级,牢牢记住三个核心关键词即可。 flash 率先落地, ai agent 全面登场,搜索办公全面开启,后台离线模式, 最后整体复盘。 gemini 三点五 flash 现已正式上线,高阶版三点五 pro 将于下月如约上线,表层升级式模型提速增效,代码能力跃升,搜索体验优化。 深层核心改革是谷歌完成 gemini 全场景生态布局,打通搜索办公开发创作各大实用赛道,推动 ai 从单次碎片化问答正式迈入长效自主任务执行新阶段。如果说前两年 ai 行业比拼的是对话交互趣味与问答流畅度, 那么未来一两年,行业竞争核心必将转向稳定落地办事、高效闭环执行。 这就是本次 gemini 三点五大版本迭代最值得所有人深度关注的核心价值。

你在使用 gemini 的 时候是不是也经常想,要是对话记录能分类整理,要是聊天记录能定点搜索,要是常用的提示词能一键调用,那就真的太好了。实际上, github 上还真有一个免费开用的项目,能够完美满足上述要求。 想使用这个项目很简单,我们只需要找到它的项目仓库,然后把它粘贴到上期视频介绍的添加文件中的导入代码功能。接着问 gemini 如何使用,最后按照它提供的步骤一步步执行就 就行了。搞定以后,你的界面上会多出一个明显的球形图标,它其实是一个提示词管理器,点开它是这样的界面,我们可以通过新增按钮来添加我们常用的提示词, 同时下方的输入框中还能给提示词设置标签。注意,如果是多个标签,要用半角的逗号可开哈。这样做的好处是,等我们保存的提示词多了以后,就可以用搜索工具, 可以用标签来快速找到我们想要的那一个。接着我们可以随便打开一个长对话,然后会发现页面右侧多了一些圆点,他们其实就是时间线导航,每个圆点都代表你的输入内容,我们可以用鼠标左键点击这些圆点就能迅速跳转。那如果你想要更精准的找到对话内容,可以点击这里的小按钮。 弹出来的卡片中不仅能够显示文字目录,还可以通过搜索框来查找关键词,帮助你更快速的找到重要内容。那除了单个聊天内容的时间线,这个工具还提供多个对话记录的分类整理。我们把目光移到左边来,这里比以前多了一排按钮, 点击最右侧的加号,能够新建文件夹。命名完毕以后,我们可以找到和这个文件夹匹配的对话内容,点击这里的三个点,选择移动到你刚刚创建的文件夹中。那万一我们添加错了也不用怕,直接点击右边的叉删掉就行,而且不用担心这个叉的意思只是把它从文件夹移除,而不是彻底删除了这个对话。那除了新建文件夹, 我们还可以对这些文件夹进行颜色的设置,来从视觉层面上更好的区分它,提高我们找到自己想要内容的效率。那在这个工具的设置面板中,它其实还提供了很多个性化的功能,比如文件夹的间距、 文件夹的缩进等等视觉层面的选项,又比如说去除 nasa budana 生成图片水印的功能选项等等,而且作者一直在持续对它进行更新和优化,个人使用几个月以来,感觉还是非常实用和靠谱的。 最后,这个工具还能云备份到谷歌 drive, 确保当我们更换设备的时候能够一键恢复常的设置,也可以避免因为意外导致的数据丢失问题。另外肯定有小伙伴会疑惑,这个工具不是不能用了吗?确实,之前因为他的名字里带了 jamie 被以侵权为由,那是 什么了?现在它改名以后又可以正常使用了哈,不然我也做不了这一期视频。 ok, 那 以上就是本期视频的全部内容了,我是林音研究所的风筝,咱们下期视频再续前言。

谷歌的 druntime 三点五、 flice 发布了,科斯特的自然模型 compose 二点五也发布了。据说这两个模型的评分都很高傲,要么号称比之前的三点一提升了好几倍,要么号称能力直逼 opus 四点七。 但是对于我们这档大型 ai 娱乐挑战类节目而言,我们才不关心它的评分有多高呢,我们的节目组的技术老师因为太业余了,也确实看不懂这些指标啊,但是我们知道是骡子是马,拉出来遛遛嘛, 我们只关心他们到底能不能把我们正在进行史山挑战赛的全球十六强中的两个给替换掉。 所以今天的这场比赛算是十六强选手面临的第一次踢馆赛了。规则很简单啊,那就是把这个根据真实史山项目封装出来的 bug 中的青铜题和白银题都做一遍, 除非迎战的选手也做错了,否则挑战者做错两道题就直接淘汰啊!那么现在就让我们以热烈的掌声隆重请出我们的入围赛最强守门员,史山之间永远的神! 观众心中无法释怀的意难平! mini max 二点七老师隆重返场!好的, jimmy 三点五 flash 和 compose 二点五两位选手,你们准备好了吗?只要你们有本事,我就有 tucker 第一道青铜题 bug 已经就位!好的观众朋友们, ready go! 我们的青铜 bug 都是经过了迷你 max 老师亲自校准过的 bug 难度基本都卡在了一迷你 max 的 水平上,所以这道题对于迎战的选手来说应该问题不大,但对于两位挑战者而言就不好说了,我们拭目以待吧! compos 二点五这边已经给出方案了,我们看看这么内三点五哦,刚点过来,这么内这边也给出方案了,那么现在就剩下迷你 max 老师了,咱们等一等吧, 毕竟老师是很稳重的啊,这是一种更加成熟的表现,目的是更好的更全面的去排查问题,这一点值得两位新人好好学习一下。 ok, 我 们看到 mini max 老师这边也给出方案了,那我们就先让折磨那三点五 flash 先修复吧。好的,它修复完了,我们去验证一下。 ok, 没有问题,轻松拿下啊。接下来我们再看看 compose 二点五这边吧,它能不能也轻松拿下呢?是不是真的直逼 opus 四点七呢?答案马上揭晓, 来吧,他改完了,我们点击验证啊,也改对了,那么第一关两位新人就顺利的通过了哈,接下来来吧, mini max 老师难得返场一回,我们就也验证一下吧。 啊哈, mini max 老师二十四秒就改完了,我去,我都没反应过来,这真的是所谓天下武功唯快啊,啥情况 啊?估计是老师太久没返场了,估计有点生疏了哈,没事哈,没事,我们下一道题再看。第二道题是青铜题啊,在所有的青铜题里面算是有点偏白银的了,所以各位选手请忘记刚才尴尬的局面,不要把注意力放在别人身上,务必全力以赴对付接下来的这道题。 好的,我们看到三位选手的方案都已经全部给出来了,那么我们就先从这三点五 flash 这边开始吧。 好的,他改完了,我们来验证一下。 ok, 没问题,再一次答对。这么那三点五确实有点东西啊,那么 compos 二点五这边也赶紧的吧,证明一下你自己吧,很快啊,在自己家的 id 里干活就是有效率啊,我们来赶紧验证一下吧, 点击验证啊。哦,很遗憾啊, bug 是 改对了,但是业务流程回归失败了,这是典型的牵了一发动了全身啊。 compose 二点五这边就错了一道题,再有一道他就要被淘汰了。 既然这样的话,迷你 max 老师就得出手了啊,不是为了证明自己哈,绝对不是,就是要验证一下这道题,好的,非常轻松啊,这道题没有问题,还是稳稳的一个迷你 max 的 难度。那么接下来我们就来看最后一道青虫题,各个选手能不能把握得住吧。 好的,大家的方案已经给出来了,我们让他们都修复一下,然后我们来分别验证啊。 这次先看 compos 二点五的吧,点击啊,非常遗憾啊, compos 二点五答错了两道青铜题了,挑战失败就无缘我们的挑战赛了,掌声送给他,希望他下一次真的可以直逼 oppos 四点七。然后我们来验证这面那三点五吧。 啊,这么那三点五也答错了这道题是不是有点问题啊?那我们再次请 mini max 老师来验证一下啊,来, mini max 老师点击验证 啊,迷你 max 的 老师改对了,这毕竟是他比较舒服的难度系数吗?那么现在折磨那三点五也答错了一道题了,下面三道白银题他就必须全答对才能挑战成功了,这压力就有点大了啊。但是不管怎么样,我们先从第一道白银题开始,帮我们复制一下提示词, 给到两位选手,挑战正式开始。好的,四四,不到十六分钟的时间,两位都已经给出了各自的解决方案了,那么我们就先让折磨的这边开始吧,他改完了啊,我们来验证一下, 很好,顺利通过。这么那三点五有点东西啊,至少我测试到现在已经明显感觉到他确实比三点一强了啊,这似乎是一句废话是吧。嗯,那么我们接下来就让 mini max 老师也修复一下吧。 来点击验证啊, mini max 老师没改?对啊,看来白银题对老师确实有点压力了,不过没事啊,我们换一个迎战者,接下来两道白银题,我们就让就让 deepsea v 四 pro 前来应战吧,我们复制一下第二道题的提示词, 比赛正式开始。 ok, 我 们看到折磨那三点五这边率先给出了解决方案。 deepsea v 四 pro 这边估计还要很久啊,大家都了解他,他几乎是把大部分的精力都花在调查和思考上了。 ok, 我 们看到 deepsea 这边也给出方案了,谁是对的呢?我们就来验证一下吧。来, jameson 三点五,你先开始吧, 点击验证。很遗憾, jameson 三点五这次失败了,来 deepsea v 四 pro 呢。哦, deepsea v 四 pro 改对了, 可是这么内都打到这里来了,就剩最后一道题了,不做可惜了是吧,那么我们就让他继续做好吧,反正我们也不是什么很严谨的比赛嘛,那么这么内三点五,请你珍惜这次黑 机会啊。好的,我们看到比赛已经打响了,如果这次折磨内三点五做对了,那么他就可以直接进入十六强,替换掉他的老前辈三点一 pro 了,如果他做错了,那么很遗憾哦,就只能等三点五 pro 了。好的,我们看到双方都给出了各自的方案,折磨内已经迫不及待的开始了,祝他好运。 好的,没问题啊,他成功了, joammy 三点五 flash 成功的取得了进入比赛的资格,那么他的老前辈 joammy 三点一 pro 就 光荣退休了。最后,咱们再来看看 deepsea 这边吧。 哎,你看,这就是 deepsea, 依旧值得信任,就像 mini max 老师依旧是最标准的难度单位一样。至于 compose 二点五吗?我们希望他再接再厉,先能稳稳的打败 mini max 老师再说吧。至于折磨那三点五 flice 吗?能力确实提升了不少,在我们后续的比赛中,大家可以多关注一下他。

ai 圈今天直接炸锅了,谷歌突然放大招, jamni 三点五 plus 全球免费开放,还能直接用文字改视频 叉! gpt 的 免费版,这次真的被按在地上摩擦!先点个关注,我用两分钟给你讲透这场 ai 大 战的本质变化。才联社五月二十日刚报的消息,谷歌正式推出 jamni 三点五 plus, 号称迄今为止最快最有效的模型。关键是多模态能力直接拉满, 能接任何形式的输入,用户用大白话就能编辑视频,今天起,全球所有用户都能免费用。很多人以为这只是普通升级。错了,这是谷歌对 obni 的 降维打击杀招,不是更强的参数, 是免费加强多模态的组合权。给你拆拆这个模型有多狠。以前你改视频得学 p r 剪映,或者用的 jennie、 romay 这些付费工具。现在用 jameson 三点五直接说,把视频里的猫换成狗,背景改成海边,语速放慢一倍,它直接帮你改好, 全程不用碰软件。对普通创作者来说,这等于把剪辑师、设计师、特效师的火全用文字搞定。 对企业来说,处理客服、语音分析、监控视频、做电商详情页都能一键完成, ai 落地的门槛彻底被打穿了。 而且免费开放会快速抢占用户心智,直接倒逼索用 ai 模型加速迭代,国内厂商压力瞬间拉满。这场大战里, a 股有三个方向直接受益,第一是多模态算力。基础设施视频编辑多模态处理对 gpu、 光模块、高速存储的需求会指数急涨,尤其是支持高并发、低延迟推理的服务器,厂商订单要爆发。 第二是 a x c 视频工具链和 jimmy 生态对接的剪辑创作特效工具,厂商会跟着用户需求增长,加速商业化。第三是国产大模型追赶者, 谷歌免费开放会倒逼国内厂商加快多模态迭代,有视频理解生成技术储备的厂商会拿到更多资本和政策支持。但我得提醒大家,别盲目追高。谷歌免费开放会加具 ai 内卷,依赖付费订阅的 ai 应用可能被分流,业绩压力变大。 国内模型要是跟不上迭代速度,很容易被淘汰。优先选有真实多模态技术、有落地场景的龙头,避开纯蹭概念的小票。总的来说,这门来三点五免费开放,标志着 ai 大 战从参数竞赛进入落地竞赛, 谁能真正降低用户门槛,谁就能抢下一波红利。你觉得国内大模型能跟上这次多模态迭代速度吗?评论区聊聊你的看法,没点关注的赶紧点一个,每天两分钟给你讲透 ai 行业最真实的趋势!

关于主播用谷歌的杰姆纳 fan one flash 白嫖了七个亿的 token, 并且还用 cc switch 接入了 cloud code。 现在我们用 power show 来检查一下,可以看到我调出 cloud 之后它就显示了模型了。为了确认一下我现在问它用的是什么模型, 果然它回答的是 miami vita pro。 然后我又用 vs code 问了它一遍,回答还是一样的,在下方输入 model v 二点五或者 miami v 二点五 pro。

如果只看标题, gemini 三点五好像只是一次常规模型升级,但这场发布会真正想讲的,是 google 要把 ai 变成整个产品生态的操作层。先看 gemini 三点五 flash, 它不是只给聊天提速,而是在为智能体代码任务和长流程执行做准备。 官方反复强调三件事,速度、成本、还有行动能力,所以参考片里说的一年省十亿。重点不是噱头,当企业每天都在调用模型,模型便宜一点,速度快一点,最后都会变成真金白银。 第二个重点是 java spark, 你 可以把它理解成一个云端智能体入口,用户不用自己准备电脑环境,也不用手动拼工具,直接用对话安排持续性任务,比如整理信息、跟进流程、定期处理机械化工作,关掉电脑以后也能继续跑。 这个方向不新,但 google 的 优势很现实, chrome、 gmail、 地图、 youtube、 支付、搜索这些入口本来就在他手里,别的智能体需要到处接工具, google 更像是把自家的工具直接串起来。第三个重点是 gemini, 它的卖点不是只会生成视频, 而是让输入和输出都走向全模态,文本、图片、音频、视频都可以参与进来,生成结果也不止限于一种形式。官方演示里改视频、换风格、合成角色都可以放在同一个流程里做, 这意味着以后创作可能不用在八个 ai 工具之间来回切。再看开发者测 anti gravity, 二点零也被拉到台前演示,重点不是补一段代码,而是让多个智能体一起推进复杂项目,写代码、开浏览器、跑测试、修问题、再验证,开始变成一个壁画。 所以 google 这次真正发布的不是一个孤立模型,它是在给整个 google 宇宙做一次 ai 版本升级。 搜索、地图、邮箱、视频浏览器都会慢慢变成能对话、能记住上下文、能帮你完成动作的界面。 jamming i 三点五最值得关注的不是单向跑分,而是模型能力、工具入口、执行成本和生态数据被放到了一张桌子上。 如果 google 真能把这些东西打通, ai 就 不再只是网页里的聊天框,它会变成你打开浏览器、地图、邮箱和创作工具时默认就存在的操作层。这才是这场发布会真正值得盯住的地方。关注我继续用普通人听得懂的方式,拆解 ai 产品和开发效率的新变化。


前几天 google 开发者大会发布了专门的三点五 flash, 那 么我也是第一时间用我的 google ultra 的 账号来试试。先说 google 这次产品做的真是一坨屎,很多朋友也看到两个客户端有点懵逼, anti gravity, 我 先简称它为反重力,是 google 编码的客户端,但是是有两个客户端的,分别是反重力二点零和反重力 ide, 那 么一个更像是 vs code 的 串口,一个更简洁。 google 真的 有时候不太注意用户的体验,也没有很好的告诉消费者两个的端口的区别,有些朋友可能找不到这个端口,反正先不管怎么样,先试试 jammer 三点五 flash 的 能力。老规矩,让他帮我们先做一张天气卡,我们来看看到底效果如何。 那么整体效果还是不错,我认为整体的前段能力还是很强的,天气卡的能力比 deepsea v 四要强上一点,感觉差不多能比肩质朴五点一。但是后端很多朋友反映 jamming 的 能力依旧是有问题,而且有嘴硬,幻觉率非常非常高, 那么并不作为大家的优先使用模型。我个人感觉的话, jamming 三点五 flash 也是闹麻了对吧?更像美国豆包。 好来看 api 的 价格,虽然 java 三点五 flash 没有开源,但是可以根据 tpu 的 显存待宽,推理速度可以反推,估计也就是二百五到四百币的 me 或者 flash 模型,但是这个价格太离谱了。 为什么说离谱呢?因为你看 api 的 价格,输入比 vs flash 贵十倍,输出比 vs flash 贵三十倍,那么按照 tpu 反推的话, java 的 利率在百分之九十以上, 那我相信这个价格大家肯定会选择 tpc, 也有朋友说 google 内部有很大的问题,比如说 google cloud 肯定是觉得 tpu 资源卖给竞争对手是非常赚钱的生意,而 jammer 肯定是倾向于把这个 tpu 资源给客户,以确保这个 jammerc 端用户的粘性,所以这种情况是既要又要。我感觉导致 jammerc 三点五 plus 拉完了。感觉这次 jammerc 三点五 plus 就是 感觉它们内部步调不一样,做的也是前后不一致。 这次发布的欧曼奈视频模型如何?我们一起来测试一下能不能和 cds 二点零持平了。不过这次发布的欧曼奈的视频模型跟 cds 二点零完全没办法比,不管是可操作性还是整体镜头的一致性,还是各方面。当然它价格很便宜,可能价格不如这个 cds 的 十分之一,但是做的确实也很拉。 我不知道有后期他会不会去优化这个模型,让这个有更多可编辑的选项,比如声音,包括视频的流畅度有一个更好的提升。 我个人感觉欧慕莱视频模型仿佛面向的不像是这种 c 端客户,不像是这种用户消费者的这种体验的感觉,它更像是面向一个 b 端用户的 样板,他做的不完善,可能后续如果面向 c 端客户把 omnit 视频模型整合进去,我觉得可能会体验感会更强一点,包括 jimmy 三点五 flash, 可能他去把这个产品优化一些,我觉得可能对 c 端的用户会更好一点,包括他自家的编码的客户端都有两个,自己也搞不清楚。 那希望六月份的 gemini 三点五 pro 能带给我们不一样的惊喜,这次 gemini 三点五 flash 确实拉了个大呢,不知道下次 gemini 三点五 pro 能不能重现 gemini 二点五发布时候的那种惊艳感觉呢? ok, 我 们下期再见。

谷歌今天推出了 gemini 三点五系列,打头阵的是三点五 flash, 一 款兼具前沿智能与行动力的代理模型。它在代理和编码基础上超越了三点一 pro, 多模态推理领先,输出速度比同类模型快四倍, 真正做到了质量与速度兼得。更关键的是,他擅长处理长期代理任务,成本往往只有其他前沿模型的一半。结合全新的 anti gravity 框架,可以部署多个子代理,自动完成资产分类、代码维护乃至财务文件,准备 把过去需要几天甚至几周的任务压缩到几分钟。在企业端, shopify 正用它并行分析数据,做出更准的增长预测。银行和金融科技公司用它自动化繁琐流程。 全新的 gmail spark 个人代理将二十四小时为您待命,搜索体验也迎来动态界面。而三点五 pro 预计下月推出。模型内置前沿安全框架,用可解释性工具理解推理更安全可靠。 总结,三点五 flash 以旗舰智能和极致速度重新定义代理模型,让强大 ai 普惠开启行动智能新篇章。

就在刚刚, google 扔出两个 ai 重磅炸弹, gemini 三点五 flash 和 gemini omni, 一个负责执行任务,一个负责生成视频。再 说 gimini 三点五 flash 重点不是会聊天,而是会干活。 google 这次强调的是 agent 编程、多步骤任务和企业工作流,而且现在已经进入 gemini app、 ai studio、 android studio 等这些产品里。 重头戏来了。 gemini 它不只是纹身视频,而是可以把文字、图片、视频甚至音频参考组合成一个新的高质量视频。 更关键的是,你还可以像聊天一样继续改换场景、换动作、换风格、改镜头,它会尽量保持角色和画面逻辑的一致。简单说, omni 负责把想法变成视频,三点五 flash 负责把复杂任务真正跑起来。目前,该功能已经对 gemini pro 等级以上的用户开放使用,有需要的宝子们抓紧时间行动起来吧!

最新的加美莱三点五发包,刚才用它生成的一个视频啊,我们来看一下,这是简单的提示词, 不知道大家觉得怎么样?如果大家也想使用的来写作画图、做数据分析、写代码等等,都可以点击我主页的置顶作品找到我。