我他妹的,我看到这个十五点五十以后的时候,我以为到了三点五十以后他这个额度会重新刷新,然后到了四点多我给他发消息的时候,我发现他还给我这个弹窗, 这个是呃, google 这个 it gravity 的 一个客户端, 然后他不是第一次谈这个啊,我以为他到了几个小时可能就会轮回,然后就会刷新这个免费额度,没想到我再仔细看了一下,他全是五月二十七号,我现在是 五月二十一号,也就是他这个是以周围单位去记的,我,我再要用这个就出发到五月二十七号了,因为我用的是比较,一直是比较把这个能力比较强的。这几个两个模型你看都是这个 cloud ops 四点六,这个应该在 cross 四点七发出之前,这两天刚发的四点七是最强的模型, 因为我开我是在开发一个呃,一个大模型的记忆系统吧,因为我觉得 从底层逻辑来讲,现在的记忆系统它都会有各种缺陷。大模型的提取的其实就是你逻辑上,就是你整理你的文件的一个逻辑,你整理的你的文件和你读取你的文件的一个逻辑,你整理的越具体越巧,然后你读取的时候越快 啊,这个越精准,这样的话你不光说是你这个速度快,你这个手头肯,而且大模型给你的回答会越精准,因为你没有干扰因素啊,这这方面我觉得我们这些 做工程师的他是个强项,他本来就就喜欢去整理他的资料,大家有空可以开给大家看一下,我整理我的,我做的规范的,我给你念,讲真的是整理的非常的细致,每个规范我都自己单独给他执行了一个命令,按统一的格式 就十几个 g 的 规范,所以说我自己就想改造一个这个 ai 政策的一个记忆系统。 但是我我我这个比较思考的比较复杂,这里面有,你看有各种,有各种这个逻辑,逻辑的判断,还有一个循环, 这个只是其中一个很小的一个解锁模块,就这么复杂,还有还有机器的模块,还有互相的直接之间的联动关联传输, 所以说我就用的比较高一点的这个模型,能力比较强一点的模型,所以说很快把它耗完了啊,我现在在考虑了,我给大家配一个其他的模型,再试一下,看能不能验证一下这个想法。
粉丝271获赞1.5万

google 这次更新最有意思的地方不是诱发了多少模型,而是把 anti gravity 直接拆开了。以前像一个完整工具箱,现在变成两套入口,一个是偏传统开发的桌面 ide, 另一个是专门管智能体协助的 agent chat。 也就是说,写代码归写代码,调度 ai 归调度 ai 边界一下就清楚了。这个变化看着有点绕,但逻辑其实很明确。 google 想把 anti gravity 做成一个本地桌面 ai 代理平台,而不是单纯的聊天框。真正拉开差距的是 dynamic sub agents。 这个设计很像给主代理配了一支临时小队,主代理不用一个人硬扛所有上下文,而是可以在执行过程中随时拉起此代理,把任务拆成多个分支并行处理。 这样一来,复杂项目就不再是一个模型在大脑过载里死撑,而是像团队协助一样,谁负责查资料,谁负责跑任务,谁负责收尾,分工非常清楚。 更现实的是, google 还把限制额度和使用门槛收得更紧了。所以这次升级虽然更专业,但体验并不一定更轻松。更绝的是, anti gravity 二点零还把后台自动化补 齐了一步任务、定时任务 slash go、 slash browser。 这些能力一加上去,它就不再只是问一句答一句的工具,而是能持续在后台推进工作。 项目管理也从单一 ripper 升级成 project 级别,能跨文件夹配权限配工作流。与此同时, google 还把 gemini c l i 直接改名成 anti gravity c l i, 意思很直白,桌面端、终端、云端统一进同一套代理体系。 对开发者来说,这种变化的价值不在于名字,而在于入口。终于开始收拢了。这次最值得注意的其实是 google 在 补一整套代理基础设施 ai studio 里出现了 ant gravity preview 五百二十六,底层还是远程主机加 linux 环境,说明它不是普通聊天模型,而是真能执行代码、调用工具、处理复杂任务的自主代理。 再加上 modern web guidance, chrome dev tools sdk 这些插件 and it gravity 的 方向已经很清楚了,不是做一个更聪明的聊天框,而是做一个能写、能跑、能自动化还能审查结果的 ai 工作台。 说到底,这类产品的竞争已经不是谁回答的更像人,而是谁能把人不想碰的琐碎流程稳定地接过去。关注全球 ai 速递,获取更多 ai 前沿资讯。

谷歌你做模型给我做好了呀,接下来三点五 flash 真的 就拉完了,就比如我问他三点五 flash 大 概是个什么水平,他回答我这个什么,他回答我 step 三点五 flash, 他 直接这个理解能力首先就不行, 然后我就想着那我再问一句吧,我说 jamming 的, 结果他回我什么 jamming, 一 点五 flash, 他 甚至连连网搜索都懒得搜,他就直接用旧的知识库里的信息去给我回答,直到最后我直接说三点五 flash, 他 才去就真正的回答对了。 然后我们去用 cloud 去跟他对比一下,我问 cloud 三点五 flash 的 什么水平,他第一时间是能反应过来,我再问三点五 flash 的, 然后后面我又补了一句,他就直接就回答对了,对了,而且这个是三奈特啊,几个月前的模型,我们再看一下他新出的那个 antigo, 二点零只有这个,嗯,对话历史和日常任务没了,就就这俩。 然后我们看 codex, 真的 就没法比,有插件,有自动化,还有搜索,就就光这这一个侧边栏都比它多那么多功能,而且还有直接能用的什么 play mode, agent mode 之类的, 然后这个 antigravity 呢?他甚至连一个直接能看见的 play mode 都没有,真的就拉完了。不知道谷歌在下什么大级,但是现在的见面礼真的很拉,还是希望谷歌以后越来越好,我是不开心,祝你们天天开心。

谷歌刚刚发布了 jimmy 三点五 plus, 同时还把他们的编程工具 antigravity 升级了二点零,那这次就很明显了,谷歌的话这次是要全面提升它的这个抠点能力。之前不管是在 coi 还是 ide 还有模型, 其实给我的感觉就表现很一般,那这一次的话,这个模型最大的亮点官方说就是它的这一个速度啊,是前模型的四倍, 所以这一期我们就测一个最关键的问题,这么快的速度,它整个的一个代码质量会不会缩水?那我直接会拿两道真实的一个编程任务,把它和 cloud op 四点七, gpt 五点五放到同样的项目里面,同样提示时看它大家的一个表现情况。那下面的话,我们大概去扫一下它官方改出来的一个奔驰 mark 评分哈, 在编程方面的话,主要就看这一个 terminal, 奔驰二点一,还有这一个 sw 一 奔驰 pro, 从这个评分看的话,这一个 jimmy 三点五 plus 这个评分还是可以的哈,但是基于我之前对于谷歌模型实测的结果来看,就是评分不代表一切,因为之前就感觉它在这个编程方面挺拉的,这次我们就看整个的一个三点五 plus 表现到底怎么样。那这一次的话,我们的整个测试题目哈,就是沿用之前测试 cloud of 四点七,还有就是 gpt 五点五的两道真实的一个编程任务。第一个的话就是我们这一个 skills agent 嘛,需要把它从一个 c o i 做成一个 web ui。 第二个的话是希望他从一个已有的比较复杂一个项目里面把这个认证登录给它迁移过来,这一块也比较复杂,需要支持啊, get 谷歌,然后还要做一个落地页。好,我们来看一下这两个实测项目哈,左边的话,就我刚刚说的这一个 skill is a 镜头嘛,第二个的话就我们图片生成 a 镜头,那这次的话,我们是用了这个 anti gravity 它的一个 c o i 终端工具, 整体这一块呢,它的交互的话是跟呃卡扣的很像,那我这边测试下来,他的速度是真的快,相当相当的快,他说四倍,一点都没夸张。 那大家看一下它这个交互的一个情况啊,其实还是感觉挺挺好的。这个交互,那至于整个模型的能力怎么样,那这两个任务我这边实测下来,它都没有一次性的去完成,它或多或少都有一些小问题。那同样的这个提示值,在同样的项目,我给到了 gpt 五点五 以及 calloff 四点七,它都是能够一次性完成的,不管这两边哪一个项目都可以完成。但是 gmail 三点五 plus 它除了快,但它其实还是会有一些或多或少的 bug 嘛。好,我们来看一下它整体的一个表现情况。 好,我们来看一下这个是 jimmy 三点五 plus 帮我们完成的 skus agent 的 一个 ui 界面嘛,它可以去执行一些操作,比如说我给他一篇文章,可以让他帮我们去总结,它就会去加载这个的 skus。 就 我之前有一期视频 专门讲了这个 skills 的 一个工作原理嘛,那这是它完成的一个效果,整体上 ui 这块还 ok, 那 这边的话是 g p d 五点五给我们完成的,左边也是有我们的一个的一些 skills 是 哪一些?那右边的话就是它整个的一个操作的一个过程嘛。怎么说它这个 ui 的 一个结果的话,我觉得就是呃 g p d 五点五的会好一些。 那关于图片生成这个项目,让它去做一个落地页,以及让它去做一个就是谷歌 get 五的认证登录嘛,那这块它也是完成的,但是不是一次对话完成的。 u i 这块的话就是谷歌还是可以的,就是相较于 g p t 五点五的话,我觉得还是会好一些,就 u i 这块的话,我们还是优先选择就是谷歌的模型嘛。 好,下面我们来看下整体这个评分结果哈,那这个评分的话,还是跟之前一样,我们是把所有的模型生成代码通敏之后,然后改到模型去做 review。 那 这边的话 g p t 五点五是要胜出的,它的分会高一些。 第二个的话就是 cloudoff 四点七会辞职,那 gpt 三点五 plus 的 话,它整体评分效果会低一些,也就是它除了快,那代码质量上的话是会差一些。那这边的话也有些解决方案,比如说你可以用 cloudoff 四点七做设计,或者 gpt 五点五做设计,然后再用呃 jimmy 三点五 plus 去做执行。 那这块儿它还不是还发布了这个 anti graphic 二点零嘛。那这个 id 的 话,你就把它等同于 codex 吧,跟 codex 一 模一样。那我这边的话 现在还登录不进去,不知道啥问题。好,下面我们来进行一个总结。那这次他的整个编码水平的话,就是速度上确实是领先很多,但是在交付的一个结果上来看的话,跟国外两家模型还是有差别,尤其是在一些复杂项目里面,他还是会有偷懒的情况。 如果你是需要去做一些原型啊,或者做一些 u i 啊,我觉得这个 jimmy 三点五 plus 真的 是有比较有吸引力,因为它整个速度比较快,而且它的价格也比较便宜。那如果你是需要一些复杂的项目啊,多文件呀,那阶阶段我还是更推荐大家使用 g p d 五点五,在 codex 里面 你运行起来也非常的快。扣袋子这个 app 我 强烈推荐给大家用,我已经最近用了一个多月了,真的非常非常的好用, card 的 话就是封号真的特别严重,我已经放弃了。 ok, 那 这就是这期视频所有内容了,如果大家觉得这期视频做的不错,可以跟我一箭双雕,我是阿江,我们下期见,拜拜。

大家好,今天来分享一期谷歌 antigrati 零基础教程,我会从十四个点分别介绍 antigrati, 结合案例一步步带大家更加了解 antigrati。 第一部分, antigrati 介绍如果你以前听说过 cuda、 cloud code code, 或者听说过一些 ai 编程,但是不知道这些工具怎么用,这期视频就是给你准备的, 我会从最基础的地方开始,一步步带你看懂 antiquity 是 什么,怎么安装界面,怎么看,怎么让它帮我们写代码,检查网页、连接外部工具,以及怎么用 scare 来帮我们固定工作流程。 简单说, antiquity 不是 一个普通的代码编辑器,它更像是一个可以管理 ai 员工的工作台,不是只让 ai 回答问题,而是可以给他一个任务,让他自己规划,自己写代码,自己打开浏览器检查,最后把结果交给你确认。这就是这期视频要讲清楚的东西。 如果你第一次接触 integrity, 看完这期视频,你至少会三个问题,第一, integrity 能做什么?第二,普通人应该从哪里开始?第三, m c p、 scares、 ross。 这些东西听起来很专业,到底是什么意思?视频制作不易,欢迎大家三连。 第二部分, antiquity 是 什么?你可以把它理解成一个 ai 版的代码编辑器,但是这个说法还不够准确。传统代码编辑器,比如 vs code, 主要是用来写代码,打开文件,自己运行,自己检查。 后来出现了 ai 编辑器,比如 coder, 它可以在你写代码的时候帮你补全,帮你解释代码,帮你修改某一段代码。再后来出现了 cloud code、 cortex 这类工具, 它们不止补全代码,而是可以帮你执行一个任务,比如修 bug、 写测试、生成网页。而 antgrity 更进一步,它的重点是 ai 帮你写几行代码,而 ai agent 帮你完成一个任务。 这里的 agent 我 们可以理解成一个智能体,你不用把它想得太玄乎,其实它就像是一个会自己干活的 ai 助手, 告诉他帮我做一个登录页面的开发,他不会只回答你一段代码,他会先理解你的需求,然后按照当前文件夹有什么文件,再列出任务清单,写实施计划,修改文件,运行项目, 打开浏览器检查页面,最后告诉你他做了什么。普通 ai 更像是在回答你的问题, integrity 更像是在替你执行任务。 所以我们可以用一句话总结, antiquity 是 谷歌推出的以 ai agent 为中心的开发工具,它可以让 ai 在 编辑器、终端、浏览器之间工作,帮你完成比较复杂的软件任务。如果你不会编程, 你可以把它理解成一个能够帮你做网站、看项目、改代码、写文档、查问题的 ai 工作台。第三个, ontgrity 和其他 ide 的 区别很多朋友问,那我经常听说 cuda、 cloud code code dex、 ontgrity 和它们有什么区别? 其实 ai 编码编辑器基本能力已经拉平, m c p、 scare 多 agent 等这些 ai 代码编辑器都能够实现。但是 ontgrity 强调的是 agent first, 还有免费的模型可用,内置的有最新的 gmail 模型, cloud 模型。所以我们重点分享 integrity。 integrity 的 特点是什么?它最特别的地方就是 agent manager, 专门管理 ai agent 任务界面,你可以把它理解成一个任务控制台。以前你可能打开一个聊天框和 ai 来回聊天, 但在 antiquity 里面,你可以同时打开多个任务,比如 agent 帮你做网页, agent 帮你测试,一个 agent 帮你怎么研究部署,你就像一个项目经理一样,在这个界面可以管理它们。所以 antiquity 的 核心不是一个聊天框,而是多个 agent 任务管理, 这就是它和很多 ai 编程工具不一样的地方,当然工具没有好坏。 integrity 更强调 agent 的 自动执行,浏览器验证、任务管理和工作过程可见。第四部分, integrity 安装、登录和出手话设置。大家直接在浏览器里面搜索谷歌 integrity, 进入官网, 进入官网之后点击 download, 支持 mac windows linux, 如果你是 mac, 下载完的软件,拖进 application 就 可以。如果你是 windows, 双击直接安装,跟普通软件一致。第一次打开 antiquity 的 时候,它会让你做几个出手话设置。 第一个设置是否导入你以前编辑器里面的配置,比如 vscode 浏览器。如果你是新手,我建议你不用纠结,直接点击默认配置就可以。第二个设置,选择主题,浅色深色,这个完全看个人习惯。 第三个设置比较重要,是 a 件的工作模式,也就是你希望 ai 有 多大的自主选择权。有些模式比较保守, ai 做关键决策之前会询问你的意见。有些模式比较自动, ai 可以 自主执行更多命令。 如果你是第一次用,我建议你选择 review drive development。 最后一步,需要登录我们的谷歌账号,我们点击登录 选择自己的账号, 登录完之后,我们就进入了主界面。第五个, antiquity 主界面结构介绍如果你用过 vs code, 大家可能会觉得很熟悉,左侧是文件列表,中间是代码编辑区域,右边是 a 帧的区域。我们可以在这个 a 帧的区域下侧 选择模型,它内置的有 gimini 最新模型和 cloudsonitops 相关模型,自己手动可以切换。如果你只想修改一个文件,或者问一段代码什么意思,可以让 ai 修改这个小功能, 我们直接拖进输入框跟它沟通就可以。或者通过 app file 命令,然后选择自己的文件跟它沟通就可以,它会帮你完成相应代码的调整。还有一个比较重要的功能叫做 agent manager, 这才是 antigue 最有特色的地方。 agent manager 可以 理解成 ai 任务管理台,你可以在这里创建任务,查看正在运行的 agent, 看它完成了哪一些步骤,查看它当前的计划截图和总结。这个界面通常会看到以下几种东西,第一个 workspace, workspace 就是 工作区,也可以理解成一个项目文件夹,比如要做一个网站,就新建一个网站项目目录文件, ai 在 这个项目里面生成文件,修改代码,都会放到当前工作区。第二个 conversation, conversation 就是 一次对话,也可以理解成一次任务, 比如帮我做一个个人主页,就是一次 conversation。 第三个 browser, browser 就是 浏览器 integrity 的 agent, 可以 打开浏览器看网页,点击按钮、截图、检查页面都没问题。第四个 terminal, terminal 就是 终端,很多项目需要运行命令,比如安装依赖 启动网站、运行测试 agent 都可以在终端里面执行这些操作。所以 integrity 的 界面可以理解成 edit 是 你和代码一起工作的地方。 agent 的 manager 是 ai agent 干活的地方, browser 是 ai 检查网页效果的地方, tome 是 ai 执行命令的地方, workspace 是 存放所有文件的地方。第六个, agent 是 怎么工作的?接下来我们看一下 integrity 最核心的流程, agent 是 怎么工作的?我们不要把它当成一个聊天机器人,它更像是一个会按步骤的工作助理,给他一个任务,比如帮我做一个个人簿客,它通常不会乱写代码。第一步,它会先理解需求, 它会判断你到底要什么页面,需要哪些模块,用什么技术来实现。第二步,它会扫描当前项目,也就是当前文件夹。 workspace 是 空项目,还是已有的 rack vue 这样的项目。第三步,它会生成一个 implementation plan, 也就是实现计划。它会告诉你准备修改哪些文件,为什么这么改。如果我们对它实现的计划我们不太满意,我们可以直接添加评论,它会按照我们的计划修改。第四步,它会生成一个 tasklist, 也就是任务清单,比如创建项目目录结构,创建簿刻的列表,还有文章详情,导航,启动本地服务,打开浏览器检测修复,发现问题会创建一个 task list。 第五步,才是真正它修改代码的地方。 第六步,它会运行命令,比如安装依赖启动项目,跑测试,它会打开浏览器进行验证。这一步非常重要, 因为很多 ai 工具只会写代码,但不知道页面长什么样。 integrity 可以 自己打开页面看效果,截图,发现问题自己修改。最后一步,它会生成一个完成总结, 它会告诉你我做了什么,改了哪些文件,怎么验证,都有相应的截图。所以 integrity 的 完整流程不是你问我答,而是你给任务它规划、 执行,验证、总结,然后你 review, 这就是 agent 工作流。第七个,我们讲一下 advise, 我 们刚才提到了 task, list, implementation, plan, workflow, 这些东西都是 integrity 里面叫做 atiface。 atiface 这个词听起来有点专业,你可以把它理解成 ai 干活过程中留下来的工作材料。比如一个真实员工完成任务,不应该说一句我做完了,他最好告诉你我计划怎么做,我实际做了什么,我遇到什么问题, 我怎么检查结果,还有哪一些风险? adfast 就是 这些东西。常见的 adfast 包括任务清单、实现、计划、修改、总结、浏览器截图、页面录屏、测试结果、知识记录。为什么这个东西重要?因为 ai 最大的问题就是黑箱, 他改了很多文件,你不知道为什么这么改,他说已经完成了修改,你不知道有没有真正检测,他说没问题,你不知道有没有跑过测试。 有了 atfast, 你 就可以检查它的过程,你可以查看它的计划是否合理,查看截图是否符合预期,可以查看它有没有启动项目,有没有报错。所以 anti grati 的 思路是, ai 不 止交付结果, 还交付了整个过程,对普通用户非常重要,因为你不一定能看懂每行代码,但是你能看懂它的任务清单, 截图和总结。第八个,浏览器能力,让 agent 自己检查页面。接下来我们介绍一个特别实用的功能,浏览器能力。普通 ai 写完网页的时候经常有一个问题,他觉得自己写好了,但你打开一看,页面很丑, 按钮重叠,可能文字超出屏幕,手机端完全断掉。为什么?因为他是在生成代码,不一定真实看个页面。 antigrity 的 浏览器能力就是为了解决这个问题,它可以帮你打开本地网页,运行在 logos 的 三千,也可以自己打开这个网址。我们给他一个网站,帮我测试一下。个人簿客点击发送, 它可以滚动页面,可以点击页面按钮,可以输入内容,可以查看控制台报错, 也可以截图。如果发现问题,还可以回滚代码继续修改。所以以后你让他做网页提示词,里面一定要加一句, 完成后启动本地服务,打开浏览器检查并提供截图。这句话非常重要,因为他会强迫 agent 不 只写代码,还要检查结果。第九个, mcp。 mcp 全称是模型上下文协议 model context prote, 这就是 ai, 可以 调用外部工具,你只需要知道 m c p 是 让 ai 连接外部工具的接口。没有 m c p 的 时候, integrity 主要是看你本地项目的文件 运行终端,打开浏览器。但现实工作里,我们需要连接其他工具。我们一起来看一下 integrity 如何安装 m c p。 我 们来到右侧的 a 镜的区域,点击三个点, 选择 m c p server。 大家可以看到这里有很多 m c p 服务,比如数据库相关的, github 相关的,比如数据库相关的,我们的 agent 就 可以通过这个 m c p server 去连接我们的 my circle。 github 相关的,我们的 agent 可以 安装 m c p 服务来连接我们的 github。 本地,我们来演示一个设计稿相关的 fig 码,我们可以在这里搜索, 因为我这里安装了,如果没有安装是 install, 首次点开,我们直接点击安装,这样我们的 m c p 服务就能安装。在本地,这里安装的是 figma 的 m c p, 也就是我们的 agent 可以 去读我们 agent 中的设计稿,我们一起来看一下。我们返回 agent, 我们来到设计稿,我这里有一个设计稿,我们选中 copy link to selection, 给他一条指令,帮我读取设计稿,然后点击发送。这些外部工具怎么连接到 ai? 这个时候就需要 mcp, 你 可以把 mcp 想象成一个插头, 数据库有数据库的插头, figma 有 figma 的 插头。 antgrity, 通过这些插头就能让 agent 使用对应的工具。所以 mcp 解决的问题是,什么? agent 能连接什么?我们这里配置了 figma mcp, agent 就 可以读取设计稿, 然后帮我们还原页面。我们刚才看到了,在 figma 中,我这里有一个设计稿, antgrity 安装了 figma, mcp 给他了 figma 的 设计稿的地址, 它已经帮我分析出来了,这是一个电商设计首页,这个页面的核心板块,它都已经帮我分析出来了,背景色、主色调它都能分析出来, 说明我们的 agent 通过了这个 m c p 连接到了我们 figma 这个外部工具。但是这里一定要注意安全, m c p 一 旦连接外部工具, 也就意味着 agent 有 更多的实操能力,它这里可以来读取我的设计稿。一句话总结, mcp 是 integrity 连接外部世界的一种新方式,也是所有的 ai 工具都是通过 mcp 来连接外部服务,让 agent 具有更强大的能力。第十个 scares, 让 agent 学会固定工作方法。 刚讲完 mcp, 我 们再来讲讲 scares。 scares 也很重要,而且和 mcp 很 容易混淆。我们先用一句话区分 mcp 解决的是 ai 能连接什么工具。我们刚才使用 mcp 连接我们的设计稿,它能够读取我们的设计稿。 scares 解决的是 ai 遇到某类问题该怎么做,比如让 ai 做代码审查。我们来演示一下,大家可以打开这个网站,这个网站有常见的 scares antiquity 的 常见 scares, 我 们一起来看一下,这里说选择你的工具,我们这里使用的是 antiquity, 我 们复制这个命令,来到我们的 antiquity, 打开终端,输入这个命令回车,这样就可以把我们这一个工具包里面常见的 scares 都安装上。我们稍等一下, 安装完了,我们来看一下有哪一些 scares。 我 们通过 nps scares list 就 可以查看, 我们刚才安装的这个插件里面有很多 scares。 我 们来找一个代码审查的 scares, 我 们就拿这个 code review scares 来举例,我们复制一下它的名字,来到 agent 的 区域,给他一条指令, 使用这个 scares 帮我检查当前类的代码,我们发送给他,我们稍等一会儿,如果没有 scares, 它会没有规范的检查代码, 然后说代码不错,但是如果我们给他一个 scar, 这个 scar 里面写清楚,先看代码的改动,再找 bug 有 没有风险,有没有缺陷测试,最后再看严重的输出问题。下次 ai 做代码审查的时候,就会按照我这个 scar 的 这个流程 来检查。你可以把 scar 理解成 ai 的 工作说明书,告诉 ai 遇到这个问题,按照哪一些步骤来执行,需要注意哪些问题,最后的输出格式是什么?这就是 scar。 比如说常见的有很多开源的 scar, 我 们也可以自定义 scar, 比如说写文章,写小红书,代码审查,写测试,数据分析,都有很多很多 scar。 如果要区分 mcp 和 scar, 可以 这样记, mcp 像是工具箱,负责连接工具。 scar 是 说明书,告诉 ai 怎么干活。 我们看一下刚才我们用的这个 scar 来分析这个页面,它已经执行完了核心审查中发现架构与 seo 瓶颈,版权、年份印编码, 是不是它分析出来了,有这么多缺陷?这就是我们用的这个 code review scasse。 在 后面我们会通过一个具体的案例来进行演示,这里使用的是一个 scasse。 第十一个 rules workflows, 我 们一起来看一下。 除了 m c p, scarce 还有两个概念值得讲一下,一个是 loose, 一个是一个是 workflows。 loose 就是 规则,我们看一下在哪里配置 loose, 我 们打开 a 键的区域,点击更多, 我们选择第一个,这里有一个 loose, 我 这里已经配置了两个。看一下,这里有一个是前局的 global, 还有一个是 workspace, 我 们来打开看一下, 我这个例子很简单,它的要求就是回答用简体中文, 它是一个前局的,所以看到 agent 的 回答的时候, 他回答的时候是不是把我们的这个回答变成了中文?这就是我们配置的一个规则。我们常见的在这个 list 里面,我们可以配置配置的有,比如说默认中文回答这个项目使用的语言,不要使用哪一些库, 所有的按钮都要和设计系统里面的组建一致,修改代码后必须要运行测试,这一些都是长期规则,也可以结合自己的项目来设置自己的规则。这个规则可以针对的是当前的 workspace, 也可以是前局的, 这是 loose workflows, 是 工作流,是一致的,它也是有前局的,跟 workspace。 我 们看一下,我这里配置了一个前局的 workspace f two p, 它的描述是根据设计稿还原页面,这个是我们等一下要做一个项目案例演示的, 我们看一下,它里面写的很简单,第一个深度拉取数据,通过 m c p。 第二步样式对齐,跟设计稿的样式要对齐。第三步才是结构化编码。第四步是动态注入, 就是扫描设计稿上的一些组建。第五步是视觉检查,定义了 workfloor, 它其实就是一个工作流。接下来我们 来演示案例的时候,他会按照我们定义的一二三四五步这个工作流来完成我们代码的一个实现。比如说我们一个发布的流程,先跑测试,再更新版本号,再写 log, 再打 tag, 再部署,这就是一个完整的一个流程。 我这里定义的这个流程就是我们会根据 fake 码上的一个设计页面,然后来生成代码,它规范的一个流程。 这几个概念跟大家再总结一下, roles 就是 要遵守的规则, skills 就是 需要用到的方法包 ai 使用的说明书。 work flows 就是 一套固定的工作流程, mcp 是 连接外部的工具的接口。第十二个权限和安全,我们来看一下 a 境的权限, a 境它能做什么?第一个,运行命令,打开浏览器,获取和编辑代码,还有使用工具, 比如说配置 m c p 可以 使用外部工具。 a g 的 能力很强,但权限有限,我们只能让他在明确的边界内工作。第二个权限最小原则,明确边界,我们尽量只给他当前项目的工作目录。第二个代码需要有一个版本管理, 他可以读写删代码,所以我们需要一个代码的版本管理,防止他误删。 第三个,不要给予最高的权限使用,普通用户运行不需要 root 管理员权限,避免系统级风险。第四个,高风险操作必须需要有一个确认, 我们可以配置规则,比如说删除文件,部署项目,修改数据库,系统配置,这些都需要经过人工确认才能执行操作。 敏感信息我们绝对不能交给 agent, 比如说密码,密钥,生产环境的权限,还有敏感的配置,我们这一些信息千万不能交给 agent。 最后我们总结一下,给 agent 最小的权限只能在当前项目目录中工作, 所有的代码变更都需要通过 get 管理,不要使用管理员权限,避免系统风险。 高风险,必须高风险,操作必须经过人工确认,防止误操作,敏感信息不共享, 保护密码,生产环境更安全。定期审查 a 件的操作日记,及时发现异常。第十三个完整案例演示,我们通过一个具体的案例 来把我们刚才所分享的一些 mcp, scare, workflow, rules、 figma, 我 们结合起来,把这些知识点结合起来,生成一个完整的案例。我们这一次要实现的一个功能是 figma 中的一个设计稿,也是 ai 生成的,我们打开看一下, 就是当前页面一个电商的首页,我们再来看一下 ai 生成完的页面是什么样子,这是 ai 生成的页面,我们的 integrity 需要读取我们的设计稿,我们这里用到了一个 mcp 服务是 figma, mcp 这里安装就可以。第二步,我们讲一下 rules 和 workflows, workflows 里面我们配置了返回用简体中文,刚才前面已经讲过。第三个 workflows workflows, 这是我自定义的一个工作流,然后定义了五步, 这个五步里面插入了一个东西,插入了一个 scare, 看一下。最后一步,使用 webos code review 这个 scare 做代码分析, 它会按照我们的这个工作流来给我们生成代码。这里讲到了 rose 和 workflows mcp, 我 们看一下它是怎么实现的,怎么来还原我们这个设计稿的,我就给他了一个指令, f two p 是 我们刚才定义的工作流,然后给他了我本地 figma 的 一个设计稿地址,这是通过 mcp 生成的,然后它会给我们生成一个计划, 我们计划怎么看呢?我们只需要点击 atfast implementation, 它给我们写了一个计划,需要我们确认的有三点。 刚才我们定义了 workflows, 第一个环境准备、结构转换、样式迁移、动态注入、交互、实现格式化检查和代码审查。这个代码审查我们是不是用到了一个 scare, 然后他会按照他自己制定的这个计划来实现,他会给自己列一个 tasklist, 最后 tasklist 他 都完成了之后,他会生成一个 walkthrough, 就是 一个结果结果报告,他生成的结果报告里面有截图还原效果图, 还有帧机演示图,这是一个视频,对不对?最后还用到了我们定,我们给他定义的这个 scale 写了一个代码规范审查的一个合规报告,比如说代码逻辑完整性、 t s 严谨度,还有交互性审查,它都做了一个检查,这样它是不是把我们的 m c p, scare rules, workflow 这些都结合起来, 生成了我们这个代码,这个代码的这个代码运行起来就是这样的。第十四个总结一下,到这里我们把 antiquity 零基础内容完整的走了一遍,我们讲了它是什么,和其他 ide 有 什么区别,怎么安装 主界面怎么看, agent 是 什么? at first 是 什么?浏览器怎么用, m c p scale workflows 是 什么?以及最后我们生成了一个完整的实操案例。 如果用一句话总结 antiquity antiquity 它不是 ai 在 旁边给你提建议,而是让 ai 进入编辑器终端浏览器,帮你真正完成任务。 它代表一种新的工作方式,以前我们在 id 里写代码,现在我们在 id 里管理 agent, 未来的软件开发很可能会像这样人负责目标判断、验收, ai 负责执行检查和总结。 好的,这期视频就分享到这里,希望你有所收获,如果你觉得有帮助,别忘记三连,我们下期见。

gemini 也出桌面端了,我用它做了动画,开发了游戏,还尝试了一系列的常用功能,还真有点平替 codex 的 意思了。就在昨天 google i o 开发者大会上,发布了一系列面向模型搜索、开发者工具和多模态创作的一整套 ai 更新, 有新一代基础模型 gemini 三点五,有融合了 nano、 banana 和 vivo 等模型能力的多款桌面端 agent 的 重度用户。 我们也终于等来了 google 版的 codex itigraphy 二点零,我已经迫不及待想上手玩一玩了,那么话不多说,马上实测。嗨,这里是头哥不请自来的 ai 频道,我们先来看一下它的界面,如果不仔细看,我真的以为自己打开的是 codex。 左边是项目和对话任务,右边是主要的对话窗口,对用过 codex co work 或者其他桌面端 a 阵的工具的朋友来说,基本没有任何的学习门槛。这里可以看到, atigraphy 已经把刚刚发布的 gemini 三点五 flash 集成到了模型列表中, 而且之前 it gravity ide 版本里已经支持的模型也被保留了下来,比如 cloud sonic 四点六,还有 cloud ops 四点六。光是模型种类这一点, it gravity 就 比 codex 丰富了不少。 所以接下来我们就通过几个案例详细盘一盘 it gravity 的 能力到底怎么样。第一个案例当然是制作我们熟悉的 remotion 动画视频,之前的节目里,我们已经详细介绍过如何使用 codex 配合插件市场中自带的 remover 插件制作像这样的动画效果。但 itagraft 有 一个很明显的区别,它并没有自带的技能库和插件市场,所以这里我们先要安装下这个技能。 我们先新建一个项目,然后把 remotion 最佳实践这个 scale 手动安装到项目的点 a 阵子文件夹中。接下来我们就直接输入这段指令,使用 remotion 制作一个介绍 it graffiti 二点零的动画视频,要求浅色主题,将 logo 与 logo 的 配色融入到视频风格中。 输入完成后, a 阵的没有马上开始写代码,而是先开始分析我们的需求以及当前项目里这个 remote skill 的 能力。然后他先给我们生成了一版详细的实施计划。 这一点就和 codex 的 工作方式有着明显区别,因为我们一开始并没有主动开启 autograph 的 计划模式, 但他仍然先进入了计划阶段。从体验上来看, itgraphy 这一点很打动我,所以这里我先检查了一下他的实施计划, 确认整体思路没有问题之后,就让 agent 继续执行,并自动渲染出了视频文件,你看效果是不是还不错?第二个案例我想稍微上一点难度,我们让 agent 使用 react 加 three 点 gs 开发一个三 d 太空设计游戏。 这一次我们直接开启 atigraphy 的 计划模式,先不让它马上写代码,而是让 agent 先和我们讨论具体要做成什么样子。这点就很像 codex 里的计划模式, agent 会一步一步向用户确认游戏细节,比如核心玩法是什么, 是固定视角还是第三人称视角,有没有剧情模式,有没有关卡推进等等。待所有细节都确认完成以后, agent 就 会生成一个详细版的实时计划,确认没有问题,我们就让 agent 继续执行。 经过几分钟的开发,一款打开浏览器就能玩的三 d 太空设计游戏就搞定了。到目前体验下来,我们的感觉是, atigraphy 并不是只把 codex 的 界面复刻了一遍。像这种面对复杂任务时停下来先把任务规划清楚,再一步一步执行的能力, 是现代 a 阵的终端里最重要的能力之一。最后,我们再来测试一些平时经常会用到的场景,比如 codex 里的自动化功能, 它可以让 a 阵子定时执行一条指令,每天帮你检查信息、整理资料或者生成固定格式的简报。而在 atigraphy 里,这个能力叫做定时任务, 它提供了几乎相同的能力,比如,我们可以指定一个每天都要执行的指令,每天早上九点检查 github training 里推荐的热门开源项目并输出中文总结。 创建方式也很简单,你可以像这样在定时任务菜单里直接添加,也可以在聊天窗口里通过杠 schedule 加上这段自然语言描述,直接创建定时任务。 这样一来,它就不只是一个你输入才会工作的工具。甚至在一些固定的标准任务上,它已经几乎可以替代像 openclaw 这样的常驻智能笔了。 下面我还想测一下 itigraphy 能不能生成图片。在 itigraphy 里, agent 也同样继承了自家的 nano banana 生图模型,我们只需要在提示词里明确要求它生成图片, agent 就 可以直接完成图片创作,这个能力对内容创作者很有帮助。 最后, ideography 还带来了动态 sub agents 功能,就是一个主 agent 带领一群专业的子 agent 一 起完成复杂任务。我们可以直接在体脂词里指定使用 dynamic sub agents 创作多个子智能体。 然后 atigraphy 就 会自动启动紫 a 阵特并行处理每项工作。展开右侧边栏,可以看到每一个子 a 阵特都在并行工作中。把复杂任务拆分成多个紫 a 阵特之后,每个紫 a 阵特只需要专注于一个非常垂直的小领域,它的 目标更清楚,上下文更集中,出错概率也就更低。这次体验下来,不敢说全新的上下文更集中,出错概率也就更低。这次体验下来,不敢说全新的 atigraphy 可以 平替 code, 但确实值得你认真尝试一下。 桌面端 a 阵子越来越卷,可实用的工具也越来越多,希望朋友们都可以用上能力更强,成本更低的好工具。智能指手段,人类才是答案。这里是头哥不请自来,我们下期再见,拜拜!

google 发布 antigravity 二点零,从 ai 辅助写代码走向 ai 的 原生应用时代。这次它不再只是一个传统 ide, 而是定位成 ai first 原生应用核心变化是从人写代码 ai 辅助转向 ai 组队执行任务。 从界面看,它有点像 codex a p p 和 curson agents 的 结合可能预示着下一代 ai 应用的主流形态。关注我,每天带你拆一个正在爆发的 ai 新趋势。

google i o 二零二六这次很多人会盯着 gemini 三点五,但我觉得对开发者真正重要的不是又多了一个更强的模型,而是 google 在 把 ai agent 往开发闭环里塞, 比如 anti gravity 二点零, anti gravity clea。 还有一个更关键的东西, chromedev tools for agents。 这意味着什么?以前 ai 帮你写代码,本质上是在文本里猜,它生成一段 react, 生成一个接口,调用, 生成一个页面修复方案,然后你自己打开浏览器接口有没有五百。但如果 agent 能直接用 chrome dev tools, 它就不只是写代码了,它可以看页面,看控制台报错,看 network 请求,看性能瓶颈,然后再回头改代码。这一步很关键, 因为软件开发最贵的从来不是敲那几行代码,而是验证它到底有没有真的解决问题,有没有引入新 bug。 所以我觉得未来开发者的竞争力不是会不会问 ai 一个 prompt, 而是你能不能设计一个可验证的工作流,让 agent 改代码,让测试跑起来,让浏览器自己检查页面,让日智告诉你哪里坏了, 最后你来验收差异。以前前端报错接口、日制链路追踪、数据库慢查询是几套割裂的东西,以后 agent 很 可能会把它们串起来,页面按钮点不动,往下查 network, 发现接口四零幺,再往后查 spring security 配置。 所以 google i o 这次最值得看的不只是 gemini 三点五,而是一个信号。 ai 编程正在从生成代码进入验证代码的阶段,谁先把验证闭环搭起来,谁就先把 ai 变成真正的工程队友。

大家好,我是七教 nuts! 大家好,我是伊基斯。 今天特别高兴告诉大家我们的频道有自己的专属网页啦!那么我们话不多说,来看看我们自制的网页如何吧!感觉这个网页很赛博科幻呐。确实哦,那么先看看这些影像都有什么吧 哈, yummyo 西兆这个变身动作很标准,很帅哦!哈哈,过奖了过奖了。 此偶尔也会做些类似的一件来缅怀我的青春。我们选择的生物图腾是朱鲨,那为什么要选这只鸟呢? 因为齐昭纳特。我呀,就是陕西汉中人呀!东是我的老家,也是朱环的老家,因此对他的情感记忆很深刻。珠神鸟的传说 总指挥。各位,人类想要彻底打败冤星人,必须利用从朱环金钟提取的 d factor 完成朱雨虹变身手环的最终开发测试,反复测试数据震荡负荷过载。高层和地球访问总部都在质疑这套方案,甚至觉得红色系统完全不具备实战性。 好帅的蜡笔 救援五战士再加油啊! 那么这些就是星环战队的设定级了呗。又错,我已经迫不及待想听星环战队的歌曲了呢!没错,那我们一起来听听吧! 这个下载区域可以下载到有关新环战队的所有企划与设计稿。是的呢,我们所有的资料都会免费刊研出来的,放在我们的网页里。 其实我更想看看旁边 zara 破晓之盾的相关资料呢。好的,那我们一起来看看吧! 六六六还有演唱会啊,更有意思的还在后面呢, 没想到右下角还有下载按钮呀!此处 这边也是可以下载相关文本的呀。嗯,是这样的呢。 哎呦,七兆跳舞跳的不错啊。 由于现在网页还有很多不完善的地方,还是处于内部测试阶段,等到后面各项指标都测试完成结束后就会第一时间上线的。谢谢大家的收看,爱你们呦。

看我三分钟逆向一个网站,安泰 guapg 更新 zuma 三点五 plus, 但我醒后变成一款真正的技术美学。在这段两分钟的录屏里,我们没有依赖任何现成的逆向框架, 而是借助 zuma 三点五 plus 极速的上下文理解能力,完全基于底层逻辑,用安泰 guapg 顺着代码的纹理一点点结构了这个网站的防御机制,清晰地记录了整个模拟抓取 pose 请求的层层剥离,再到最后完美构造请求并成功获取数据。 每一个断点的调试,每一次内存数据的捕捉,都像是一场精心编排的解密表演,没有笼一的操作,只有代码与逻辑的精准交锋。看完你就会发现,真正的逆向工程,往往是在这种不温不火的冷静分析中,呈现出最让人心动,也最让人叹为观止的技术力量。

google anti gravity 绝对是一款颠覆性的 ai 编程工具,它完全改变了我日常使用 ai 的 习惯。现在很多人还只是把哲米奈当做聊天机器人使用,但如果我告诉你,你完全可以通过使用 anti gravity 管理任何项目,设计自动化的工作流,开发优质的 ai 产品,而且不需要你写一行代码,当然前提是你要学会正确的使用它。 在二零二六年, web coding 基础的 ai 开发绝对是每个人都应该掌握的技能,所以我会用这条视频带大家完全解锁 antiquity 的 全部功能,让你的 ai 使用效率原地起飞。我会教你如何从零开始,一步一步的搭建 ai 应用,包括如何使用最近爆火的 skills。 就 算你是完全零基础的小白, 话不多说,我们直接开始。首先, antigravity 是 谷歌推出的一款编程工具,它的核心是基于 ai agent 智能体驱动的思维模式,不仅能够写代码,更能同时自主构建完整的项目。就像是你可以拥有一支全天候为你服务的智能体团队,他们会随时跟你进行汇报对其项目进度, 而你只需要用通俗易懂的自然语言告诉他你的需求,就像是跟朋友对话一样。首先我们进入官网这里直接去下载跟你电脑对应的软件版本就好了,正常安装。 提醒一下,国内使用的话需要科学上网, ip 最好是美区。然后你一定要开启增强模式之后,你才能来到这个界面,点击创建新的文件夹,一个文件夹就是一个项目,里边会包含所有跟这个项目有关的全部文件,然后我们在桌面创建,比如我们就叫 test, 大部分人可能因为不熟悉编程就卡在这里了,我最开始使用 cursor 就是, 所以想要完全的掌握 ant gravity, 最好的学习办法就是大家可以跟着视频边做边学习。 你可以看到在这个初识界面,右边是你和 ai 对 话的窗口,中间区用来显示文件,左边是你管理项目文件的地方。我们先进行一些基础设置,首先来到拓展这边,在这里搜索 chinese 插件, 直接安装其他插件,等到有需求的手按 t widget, 会自动提醒你安装。然后呢,我们来到右上角,这里三个点,点击 customization, 我 们来设置一下全局规则和项目规则, 不把 nt gravity 当做一家餐厅入死,就好比是你的员工守则,在这里呢,你可以规定 ai 跟你对话的方式,比如说不要讲废话,你要求他全部使用中文回答。项目规则呢,是可以仅仅在当前的项目生效,也可以部署在全区,你可以自由的选择 ai 出发的方式, 比如说这里入死,我们直接使用科室内部员工发在 x 上的一段提示词,直接把这一段复制粘贴下来, 直接粘贴到这里,然后记得在这边加一句 always response in 简体中文,这样你能保证应该大概率是用中文来回答你。然后项目规则,我们直接使用 github 上开源的一段检测 bug 的 描述,直接把这段提示词全选复制,然后在这里添加 workspace, 然后粘贴到这里。可以看到在左边这里自动添加了一个文件,那下面是添加描述的地方,我们直接就粘贴到这里。触发的方式你可以选择是总是触发,也可以手动或者是让 ai 来决定什么时候使用。然后我们把它保存一下, command 加 s 保存就可以。看到这边已经添加上了视频,里面全部使用到的提示词,我都会在评论区放链接。基础设置完成,我们就可以开始接下来的开发了。前段时间我有刷到那种片场探班的视频, 就是一个人拿着手机可以和很多的电影人物,比如泰坦尼克号,复仇者联盟里面的角色自拍,我觉得很有趣。那我就想着先做一个这样的生图 app, 然后我就可以拿这些图片直接去做视频。 如果你完全不懂编程和开发,在打框架这一步你就可以交给 ai, 你 可以使用任何你熟悉的大模型帮你理清思路。谷歌 germina, cloud g p t 或者 deepsea 都可以。 比如在这里你可以直接跟他说,呃,我想要开发一个外部应用,它的核心功能是使用谷歌 nasa banana 的 声图功能。 当用户上传了一张自己的任意的图片,输入喜欢的电影名称,就能够生成一张他和这个电影主角在片场休息时的合照。嗯,我希望是那种很真实的抓拍版,就好像他真的去探班了一样。背景希望是真实的拍摄场景。 不需要着急给我整体的方案和代码。我需要你先挑战我的问题,帮我梳理和完善思路。你可以向我提问,直到你完全理清楚我的需求。 接下来 ai 可能会问你很多的问题,你把你的需求全部理清了之后,你就要再对 ai 说,我需要你根据我们的对话帮我生成一份 sop 或者产品需求文档,然后我们再交给 ai 进行开发。看这边他已经有回复了。 高安蒂 gravity, 把 ai 最后给你的提示词直接粘贴到这里的对话框。模型,你可以选择 jimmy, nike, cloud 或者 gpt, 每种模型都有不同的特点,比如说 jimmy, nike, 他 做出的 ui 界面就很强, cloud 编程能力很强, gpt 属于各方面都很均衡。 然后这里是有 fast 和 planning 两种模式可以选择, fast 比较适合你执行快速简单的小任务。 plan 模式下,它会先生成一份计划书,跟你确认每一步的关键步骤。然后我们今天选择 plan 模型,选择最高的, 可以看到 ai 就 开始工作了。好,可以看到这边它先给我们生成了一份计划书,它会告诉你总共有哪些步骤,每一步需要做哪些事情,你可以逐条的分析,然后跟它对话。这也是我觉得 intgrity 特别实用的一点。比如你看这边有很多加号, 每一条你都可以随意的添加自己的批注,任何需求都可以通过注视添加,这样我们就可以实现一个实时的交互。比如说这边他有最后提到 u i 风格,我想添加一点自己的设计,我就直接点这边的加号给他说, 嗯,我希望你可以添加一些克莱因蓝的元素,我很喜欢这个颜色。嗯,然后再添加一些电影胶片的 icon, 当然整体的设计要符合我整个项目的风格。 直接添加,如果你有更多的需求,也可以随时的添加批注。左侧的项目文件里,如果你有自己的品牌或者 logo 图片,也可以自己拖拽过来给 ai 参考。如果没什么问题,我们就直接点击这个 percy 的 执行,然后这些文件都可以关掉了。 在 ai 执行的过程中呢,我给大家介绍一个相比其他 a 一 工具,我觉得 ituiptive 最能体现智能体驱动的工作模式。这里我们点击右上角有一个 open agent manager, 在这里呢,左侧面板会显示你所有的项目。想象一下,在这个界面,你可以同时创建管理多个智能体,让他们在同一个时间处理不同的工作。你只需要点击这里的加号,就可以创建新的对话框,比如说刚才的任务是进行整个外部应用的开发,这里呢,我想让 ai 帮我搜集一些比较好看的前端页面, 点加号你看就可以弹出一个新的动画框。在当前的项目里面,我直接跟他说,嗯,请你去飞格玛帮我搜集一些具有电影元素的前单页面,你可以给我三到四个链接, 这里我们使用 fast 的 模式就可以了,然后模型选择快速。当然你还可以再添加执行不同任务的智能体,只要你有需求,电脑配置跟 token 都足够的话,你可以无限的添加。 在这边左侧面板,你可以看到几个不同的智能体同时在干活。左上角的收件箱它会显,它会实时的显示智能体的工作状态,所有的过程你都可以实时的追踪。当智能体需要你协助的时候,它们会发信息给你,要求你 proceed, 这里我们直接点击 proceed, 所以 antigo 体是可以同时显示两个工作窗口,一个是现在的智能体管理窗口,它会显示所有 ai 智能体工作的状态。一个就是我们刚才的代码编辑器,你可以随时的切换试图如 如果你有多个显示器的话,那会更加的方便。自动调用浏览器也是我觉得 itguoyot 非常惊艳的能力,它可以直接在内置的浏览器中动态测试,当我们开发网页时,它就可以自动测试网页功能, u i 交互,完全实现自动化的操作,然后给你反馈的结果。这个蓝色的边框就相当于它在自动的调用这个页面去帮我们进行搜集,可以看到它已经打开了三个页面,这一步完全没有电脑操作。 可以看到这边我刚让他去飞格玛帮我搜集页面,他已经执行完成了,这边就是他给我们的一个进度汇报,你看他直接给我们附上了链接,我们可以直接点击就能打开, 你可以一个一个的点进去看是不是你想要的那种风格,我这边只是做一个简单的展示。 好,现在这个任务已经执行完成了,我们可以让他打开帮我们测试看一下。这边我们新建一个对话窗口,你也可以直接 ctrl 加勾,然后输入 npm, 你 当然也可以跟大家说,请使用自带的浏览器帮我打开页面,我要进行功能的测试,两种方法都可以啊,我们这边点击这个链接打开,随便找一个链接打开, 可以看到这边他提示我们是要输入 api k 的, 然后我们就去获取一下 api k, 直接打开 google 的 as 丢丢,在这里面拿到一个你的通行证,直接复制,然后回到刚才的页面,粘贴到这里, 然后我们就可以看到整个页面的设计还是不错的,他加入了很多我喜欢的克拉英兰的元素,标题就是 hollywoodcut。 然后这边是可以用来上传自己的照片,这里输入电影名称,然后选择画幅比例,这边应该是会生成一个 呃生图的提示词,那我们就随便找一张照片进行测试一下,我这里面就拿了一张我从之前视频里面的截图,然后电影名字,他推荐爱乐之城,我们我们换一个,比如我们选择蜘蛛侠 三,英雄无归,然后这些其他我们先暂时不要动,直接点击 action 啊,可以看到他已经生成了一张照片,这个应该他只选了荷兰第一个角色。那我们这边可以下载,但是这边还可以输入指令,然后进行进一步的画面调整, 可以看到这张照片清晰度还是挺高的,然后整体确实是有那种真实的在片场拍照的感觉。那比如说如果我希望再做进一步的调整,这个是我从网上随便找的一张图片,我觉得很适合我这个网站的风格,我希望把它加在整个项目里面。那我们就比如截图, 然后我们这里回到 antigravity, 直接拖拽上来,你可以跟他说请使用这张图片帮我作为 logo 添加在当前的项目页面中, 所以你看你其实是可以随时的提要求,让 ai 进行修改和优化。这里注意,建议大家每次修改完成之后呢,都点击一下这里的提交,把你的修改保存在本地的 get, get 就 相当于是你游戏的存档,它会记录你每次版本更新的内容。如果你后面改着改着发现自己不喜欢,或者说 ai 改错了,出现 bug 了,你还可以找回之前的记录,一定要养成好习惯。嗯,可以看到最新更新的画面,它已经把我刚才要添加的这个 logo 添加上去了, 所以我真的很喜欢 tikblr 这种实时双向合作的开发方式。你可以把每个智能体都当做不同的员工来看待,你可以同时运行多个不同的项目,而你只需要做的就是管理好你的收件箱,确保它们都在执行就可以。另外呢,再向大家展示这里的 playground 功能, 你可以把它当做你的临时工作窗口,当你不确定要不要进行完整的开发,或者说你只想做一个 demo 的 时候,就可以来到这边。 当一个项目开发完成,你下一步就是要把它保存在 github 里面,不然你每次都需要打开 id 浏览器,它才能够运行。首先我们来到右上角,点击这三个点, 点击 m c p 服务管理 m c p m c p 全称模型上下文协议,这个协议本质上是利用一套通用的语言标准,让 ai 可以 和各类的应用实时互联,无缝对接,所以你可以把它当做一张通行证。举个例子,比如说你这家餐厅打算供应宁夏滩羊,可 是你的冰箱里面根本就没有这个食材,那厨师是不是你们没法做了?那有了 m c p 呢?你就能够连接到宁夏太阳的原产地供应商,当你需要这个食材了,那边得到许可,就可以给你进行固定的配送。那对于 ai 来讲,比方说你链接了飞格玛,有了 m c p, 你 的 entire gravity 项目才可以跟飞格玛的前端设计稿实时互联。比方说你链接了 notion m c p, 那 你就可以直接在 anti gravity 里面说,帮我在 notion 创建一个表格。 那可以看到这里其实内置了很多的 m c p, 一 旦连接你存放在各个服务器里的项目都能够直接调用,而你不用担心兼容或者格式的问题,所以你可以按需添加。现在我们需要配置一下 get up 的 m c p, 可以 看到我这里面已经配置过了,这里需要你去 get up 手动获取,然后复制过来。 打开你的 github, 建议每个人都要注册,因为这里是全世界最大的开源代码的一个存放的平台,它可以储存文件,还能直接托管我们的项目。在右侧的面板找到设置选项,然后找到 developer settings, 点击 personalize tokens, 就 在这里你可以创建一个新的 token, 这里要验证一下你的密码, 验证完了之后呢,在这里取一个名字,然后你在这边添加你的权限,添加权限之后点击创建 token, 添加权限之后就会生成完整的授权码,然后你回到这里粘贴就可以。 另外说一下,使用 github 的 mcp 需要 docker 这个软件在后台运行,不然你无法添加,也无法使用这个软件,也直接在官网安装下载就可以。 添加完成之后呢,点击 refresh, 就 在左侧出现工具面板,可以看到系统最多同时支持一百个工具的调用。但是我建议你不要一次性的开太多,按需加载就可以,建议每次控制在二十个左右。 如果你要添加未收入在 m c p store 里面的 m c p, 就 点击这个原始的配置仕图。注意看,这里就是你 m c p 的 原始配置文件。最简单的办法就是选中,然后把它们全部 复制在这边。新建一个对话框,你就直接让他编写某一个供应商的 m c p, 然后你去这个供应商的网站获取授权码,再粘贴回来保存就可以了。一定要养成凡事都用 ai 的 习惯。添加完成之后呢,这里新建一个对话框,因为我不希望有太多其他内容的干扰, 你就直接对他说,嗯,我希望新建一个 github 仓库,用来存放并且发布这个项目,仓库的名字就叫 hollywoodcut。 同时帮我设计这个部署的工作流,会使用的环境参数请参考 ev example 文件,并且将全部的操作流程都更新到 readme 的 文档。在上传前请帮我检查,确保我没有任何的个人信息,比如说 api 可以 泄露的风险。注意这些全部都不要写在前端的代码里面, 没有什么问题就直接按下回车,然后你的系统将会自动将这些变更同步到 gitlab。 保存完成之后呢,你就可以获取到一个网址链接,随时可以添加到浏览器里面打开。如果希望更进一步呢,我们就可以选择通过我 style 进行部署,这样这个前端应用就可以上线了。 在我 style 里面,我们需要关联 gitlab 仓库,这样你的我 style 就 可以看到你 gitlab 里面的代码库,直接点击这里的 is new, 点击 project 可以 看到这里面已经显示了好礼物 cut 的 这个项目,然后点击 input 项目就会直接导入框架预设,全部都会自动填充,直接点击 deploy 部署,就可以把应用发布在公共的域名上面。 所以现在你基本上就打通了一套从开发部署发布这样一个前端项目的全流程,通过 gitlab 同步,然后 gitlab 触发我 style 部署, 整个过程都是时事联动的,是不是很酷?这样我们就可以自己尝试打造出功能独特又实用的 app, 而且随时可以分享给朋友。 但是要强调一下,我们今天开发的仅仅是一个前端的 top 应用,在网上刷到的内容帖子,我用十分钟开发出了某某软件,基本都是这种类似的。 如果你想要进行完整的开发,那么你还需要了解后端数据库,购买域名,开放支付,包括商业化等等技能,这些都需要你进行更深一步的学习。但是 web coding 的 乐趣就在于,当你看到了一款很不错的软件,是不是可以先想象一下自己有没有办法复刻出来做一个简单的应用,比如 比如说口语学软件,语音助手就放在本地自己使用。我觉得对于没有任何编程基础的小白来说,真的可以算是打开了新世界的大门。那最后我们再来简单讲解一下 skills, skills 其实很好理解,因为它翻译过来就是技能。我们还拿厨师举例,比方说你已经有了一个非常厉害的厨师, 他本身就会做很多菜,但是川味鱼香肉丝的做法和其他地方那就是不一样的。你要是不提前给厨师讲情书,如果他按照自己的习惯发挥,可能味道也不错,但是绝对不会是你想要的那个川味。但是如果啊,你可以提前把这套独家秘籍给打包好,比方说油温多少度,配菜有哪些,什么时候该来一勺豆瓣酱, 怎么摆盘等等这些操作,全部打包成一个技能包交给厨师。那他平常呢,不需要把这些厚厚的技能包都背在脑子里,因为这样太占内存了,也就是太费 token 了。 那他只需要在腰上挂好这个技能包,等什么时候客人点名要吃那个川味鱼香肉丝的时候啊,他提前看一眼,再决定要不要读取这个技能。 然后呢,照着这个步骤精准地来一遍。这样做的话,既可以节省 token, 又能够保证干活的质量。这个啊,就叫做渐近式批漏。所以其实本质上,你可以把任何一个自己经常会用到的流程、工作流都打包成一个 skills, 这样你每次调用的时候,都不需要你提前说那么一大堆的背景提示词。 比方说,我们可以直接去 github 上下载 ansorepic 公司,也就是 cloud 那 个公司自己开源的 skills, 可以 看到这里的 skills 有 包括修改 word 文件,修改 pdf, 包括数据处理,还有一些前端设计的 skills。 我 们直接点这里的 code, 复制整个仓库的链接,然后回到 antigo 这里,我又重新建了一个项目,你就直接跟 ai 说,帮我下载这个仓库里面全部的 skills, 并且部署在局的路径下, 然后把这个仓库的链接发过去。部署在全集路径下的好处就是说,不管你打开什么项目,都可以直接全部地调用这些 skills。 果然教程都是发给 ai 看的,如果想要多做一步呢,你还可以跟他说,帮我把这些 skills 都配置成为斜杠可以调用的形式,这样当你明确想要调用某个 skill 的 时候,就可以直接选中了。 另外呢,再给大家推荐一个前端设计的 skills, 叫做 u i u x pro max skill 也是一样的步骤,在 code 这里复制整个仓库的链接,回到 ant gravity, 把仓库复制给他,对他说,帮我下载这个仓库的 skills, 然后直接点击回车就可以了。 这里可以看到我的斜杠已经可以调用这些 skills 了,我们就简单测试一下,帮我制作一个健身房的宣传落地页,你可以规定他使用哪些技能,比如说我打字使用就是我们最新安装的这个 u i u x 的 skill 直接发送。 可以看到这里已经调用了 u i u x pro max 的 升图模型,帮我们生成了两幅图片,我们直接在浏览器里面打开去预览一下, 那可以看到这个页面这个人物介绍部分他就使用了刚才的图片,整体来看还是挺有特色。就目前来讲,这个红黑配色不是我喜欢的风格,但是这只是一个初步的搭建,之后你有什么想法可以让他进行个性化的修改。其实你看关于一个健身房落地页的基本元素他这里都是有的。 好了,以上就是本期全部的关于 antiquity 的 基础教程,基本上你使用 cursor tree 或者任何的 id 工具,它的界面操作啊都是一通百通的。 web coding 时代,学习 ai 最快的方式就是先用起来,先做出一个东西,然后慢慢地补足专业技能,这样你才能有源源不断的学习动力。

今天是二零二六年五月二十日, ai 编程工具这两天有两条很值得放在一起看的新闻, composer 连续更新, composer 二点五和 gera 云代理集成。 google 则在 i o 上推出 antigravity 二点零, 表面看都是写代码,实际是在争夺下一代软件生产入口。先看 curser, 五月十八日, curser 发布 composer 二点五, 官方强调它相比 composer 二,在长时间任务复杂、指令遵循、携作、手感和投入程度较准上都有提升。价格也很明确,标准版每百万输入零点五美元,输出二点五美元,默认 fast 版更快,但价格更高。 第二条是五月十九日, caster 进入 gera 团队,可以把 gera 公单直接分配给 cursor, 或者在评论里提到 cursor 启动一个云端代理,它会读取公单评论和仓库设置去修 bug, 加功能补测试完成后,把状态和 pr 链接回填到 gera。 再看 google anti gravity。 五月十九日, google i o 二零二六上 google 发布 anti gravity 二点零桌面应用,它的关键词不是单个编辑器,而是 agent first 开发平台一个中心界面里编排多个代理并行工作, 支持动态子代理后台定时任务,并连接 ai studio、 android 和 firebase。 更关键的是, antigravity 同时给了 cli sdk 和 gemini api 里的 managed agents, managed agents 可以 通过一次 api 调用,启动一个隔离 linux 环境,让代理推理用工具执行代码,还能保留文件和状态。也就是说, google 想把代理能力变成可编程、可托管、可接入企业系统的底座放在一起看, casser 的 路线更像从开发者真实工作流切进去编辑器模型 gera pr 越来越贴近团队交付, anti gravity 的 路线则更平台化,桌面命令行、 sdk、 云端托管环境一起铺开。短期看, casser 更容易吃到开发团队的日常习惯。 长期看, google 如果把 gemini、 android、 firebase 和云代理串拢,可能会变成更大的代理操作系统。 ai 编程工具的竞争已经不只是代码补全,而是谁能管理真正的软件任务。

朋友们,你真的可以去卸载你的 openclaw 了,因为它真的不适合电商提效。我最近一直在 costas 新出的网页插件,去跑一些电商运营里重复又耗时间的工作,这个体验真的有点惊到我了。例如做亚马逊查关键词排名,虽然我们可以用软件去查关键词排名, 但如果你要是手上链接很多,一个个复制,一个个下载整个流程,其实还是很费劲。更别说沃尔玛特、姆希英他们都 没有比较成熟的查排名工具。当然是现在有了 codex, 你 可以把这套动作直接自动化,每天上午九点自动打开浏览器的无痕模式,搜索指定 h 在 指定关键词下的位置。它就像一个运营助理 一样,自己打开网页,自己搜索,自己记录,最后把它统一整理在表格里。那你再举一反三,它既然都能够监控自己的关键词排名了, 是不是也可以监控竞品的运动作呢?好,再来说 t k, 我 现在已经实现了任何采集对标账号的数据和视频文案,同时还可以监控自有账号和竞对账号的数据。像我们团队编导,以前,光检查账号数据这些事可能就要花两到三个小时了。然后如果你要是说想要去搭建一个工作流,基础好的人,可能要花半天到一天的时间打 完,没基础的小玩意想要自己打可能要两到三天,但是现在他只要用一句话就能够搞定了。所以我在我的线下课里, ai 工作流提效这一块,我重点只讲 codex, 因为我觉得一个不会写代码的小白一头扎进技术里,最后导致没时间做业务。那我觉得这有点不合理,本末倒置了。我研究 webkit 的 时候,我一直想实现一件事,不会写代码的人 只需要说清楚需求,剩下的搭建工作流,写代码跑网页,整理数据这些事全交给 ai。 现在 codex 是 真的可以实现了。

朋友们,昨天的谷歌 i o 大 会你们看了吗?我早上起来刷他的新闻,好像没什么波澜啊,但是有另一个新闻,然后我一下就清醒了, codex 的 额度又重置了警感信,而且 sam 奥特曼的推写的特别漫不经心, 让我隐约觉得谷歌这场大会肯定是有点料的。所以我用了一早上,仔仔细细看完了,也分析了,果然让我发现了三条重要的线索。当然,我还是建议大家完整的看一下这场发布会,我觉得料特别多,然后再结合我给的三条线索,看看你们有没有收获。 这场大会简而言之,没有什么创新,但是非常的务实,他发了很多东西, google omni, 一个可以从任意输入到任意输出的世界模型 gimna, 三点五 flash, 质量超越了三点一 pro, 当然价格也差不多,速度飞快。还有一个全面向 codex 的 ui 靠拢的 anti gravity, 二点零, 一个和 ospec 命名完全一致的 managed agents api, 一个叫做 german spark 的 谷歌版小龙虾,还有七十二小时在后台帮你搜索的 google search agent。 最后还有一个不知道多少场都已经发布过的仅有语音版的智能眼镜。因为都是产品发布会啊,所以就信息特别的零散, 但是呢,我是能看到有几个非常清晰的大方向的。我先说第一条啊, gemini omni, 这是一个号称能从任意输入产生任意输出的世界模型, 虽然看大家测试的结果啊,视频生成效果比不上 cds 二点零,但是如果从 word model 的 角度看,它可能还真的有点特殊意义。你想象这么一个画面啊,就你站在一条河边,左边有一条断掉的独木桥,地上有一根木棍, 上方呢,垂下来一根细细的藤蔓,右边还有一条破了洞的小船。这如果是真实世界,你打算要怎么去过河? 所以,不管你选择哪条路,我相信你在你的脑海里一定都会闪过每一条路径的预演画面。但是如果是未来的机器人呢?也是一样,他应该不只能看见这些东西,他必须在脑子里先模拟走断桥的时候会不会塌, 木棍能不能当支撑,藤腕能不能承重,破船漏水的速度够不够撑到对岸。如果未来我们要进入一个机器人时代,我们就必须有一个阶段,需要一个模型来生成符合物理世界规则的内容,让机器人去学习。这就叫 word model。 在一个给定的物理体系里,不是要画的像,而是要符合规则。前两天我看了一个演讲,是英伟达的金饭在红杉资本分享会上的一个演讲,他讲了一个很关键的路线,叫 real to seem to real 什么意思呢?就是先把真实世界扫描进来,变成一个可交互的仿真环境,然后在仿真里大规模生成变化的内容,训练机器人的策略,最后再把训练好的能力迁移回真实的机器人。这其实就是在复制大语言模型的成功路径啊。 大元模型是预测下一个 token, 而在机器人世界,要预测的是物理世界的下一个状态。未来真正关键的就是能不能把真实的世界变成可训练、可推力、可交互的模拟世界。 这就是为什么我觉得 omni 这条线非常重要?如果 jamming omni 真的 能做到任意输入到任意输出,并且能保证物理的一致性,那它就不是普通的视频模型了,而是迈向巨深智能训练闭环的关键基础设施。 它的价值就远不止发布会上那些整活的视频。当然,我的设想的场景还太遥远了。只是举个例子,我用 c 氮二点零是完全没法过河的, 但是我用了 gpt image 二,它就能想象出多种场景,并且推演出最符合逻辑的过河方式。虽然这不是视频,但似乎有那么点味道了。 于是我又用了一张迷宫的图交给他,他也能正确生成走出迷宫的路径。我用了很多视频模型都去尝试,答案不意外,没有任何一个能做到。 很可惜啊, api 还没开放,我无法访问 gemini omni。 但是如果它能做到,那它的价值就不可小觑了,就不应该再把它和 cds 做比较,而是把它放在更重要的位置去看。所以,这就是第一条线索,谷歌很可能向世界模型迈出了一大步。 那第二条线索呢?是我看到了交互方式正在飞速的演进。你们还记得吗?去年这个时候,大部分的人应该已经开始从科斯转到 cloud code 的 这种终端交互的形式了吧。 但是我相信现在很多人的主力应该已经切换到 codex 的 桌面版了吧?为什么呢?因为命令行输出的文字界面里,大部分其实都是我们不关心也看不懂的信息。 但桌面版它的右边就可以弹浏览器啊,也可以弹 preview 啊,可以有更丰富的表达和交互。 anti gravity 现在就是在走向这种眼镜,它把以前的 id 已经藏起来了,给了一个和 codex 基本上差不多的一个工作台。 它不再强调你去点目录,读文件,手动改代码,它强调的是 agent first。 谷歌用了一个词叫 mission control。 这句话很准确啊,未来的 agent 的 控制面不是让你盯着代码细节的,而是让你看清更多的 agent 的 状态,谁在做网站,谁在做素材,谁在规划架构,哪个任务需要批准,哪个任务可以接管,哪个 agent 跑偏要暂停,这才是桌面版 codex anti gravity 这类界面真正适合做的事儿 就是变成一个多 agent 的 状态,面板和指挥台。我们现在再来看 ai studio 的 一个 demo, 它是一个电台演示的 demo。 谷歌说了一句很关键的话,这句话的中文含义是生成式的 u x。 举个例子就是 ai 在 运行过程中生成小组件来和人类交互。 前段不是有一种讨论在说让 ai 生成 html 比生成 markdown 更好,因为人类很快就能看懂网页,而看 markdown 就 很费劲。说就是这个道理。 u i 和 u x 的 作用现在变了,它们不再是为人类的体验服务了,而是让人类更快的去确认结果。那为什么不用更加动态更丰富的表现来提高人类的效率呢?所以相信我, generative u x 由 ai 实时生成的交互在未来的几个月十分重要。我不知道是几个月啊,因为实在是发展的太快了。而后面的语音部分更加精彩了,这是谷歌的拿手好戏。谷歌的实时语音我不知道大家用过没,非常强, 演示者直接用语音,让 antigravity 去微调 gem 四音频模型,能听懂 lara 这种专业词。 agent 接着生成实现计划,写代码,跑训练。这不是语音输入法,这也不是 tts, 不是 asr, 这是语音直接指挥 agent 端到端的语音。 如果再结合发布会后面提到的 x r 眼镜,把航班、酒店、旅行信息用特殊的卡片实时显示到眼镜前,那就让这条路线更清楚了。 现在是 codex 式的控制台,还有输入框,未来会不会直接是语音输入了?会不会连电脑屏幕也不需要了?手表、眼镜、手机是不是都是可以交互可以确认结果的设备?那我现在正在做的多一阵系统正在策划做语音的部分。 我每年暑假都会带女儿去三亚冲浪,如果能在路上用语音麦克风来输入车机的屏幕来确认工作结果,让 agent 随时都在家里的服务器里干活,这是我非常向往的场景,我现在正在为他努力,而且我也相信这就是未来的 agent 的 交付方式。 所以一个核心的洞察就是,如果要做产品,绝对不能再停留于 chat 这样的交互了,我们脑洞应该开的更大一点,想的更远一点。 那第三条线索就是谷歌也搞了一个 open crawl, 而且可以多 a 着呢,和谷歌最擅长的搜索一起交互。 openclaw 当时最吸引人的就是它通过心跳或者说定时任务,可以二十四小时不间断地干活。要知道真实世界的行动是不是都是信息驱动的,比如说金融信息、地缘政治,还有突发的信息都会影响我们的决策,所以谷歌做了一件很务实的事, 他把搜索能力塞进了能七成二十四小时后台运行的 agent 里。谷歌在发布会上把它叫 search agents, 他 们不是等你搜索,而是你设好目标,他们就在后台一直盯着。 这里的重点不只是持久,他甚至还可以同时有多个 a 阵的为你服务,时刻盯着不同维度的信息源。而且他有多 a 阵的来解决信号产生时的动作。我们不再是搜索一个答案了,而是 a 阵时刻发现我们想要的答案,然后把方案做好。给我们 发布会里举了几个例子,比如说你关注某类生物科技的股票,他就会接入实时的金融数据库, 市场一动就会给你综合的更新。如果你在找房,他就会扫全网社交平台和论坛,如果你喜欢球鞋,他就会盯着运动员联名的发售动态。这个功能叫 germanspark, 更像是一个入口,而 search agent 是 一个触发器,多 agent 提供了解决方案, 所以这一整套就串起来了。那顺便提一句, gmail api 里也出现了一个 managed agents, 看我前几期视频,应该听着很耳熟吧,最早是 onslap 提出的,现在谷歌也复刻了一套, 一个 api 调用就能拉起无数个带沙箱环境的云端 agents。 这说明谷歌啊,不只是想让 agent 来陪你聊天儿,它是在补执行层面的东西。 这就是第三条线索。我认为很快云端随时待命的大量 agent 呢,都不会是稀奇的事了。而发生什么样的信号,产生什么样的行动,依然需要我们去定义。 我很感慨啊,前不久我还在思考什么样是一个好的架构,一转眼人家成熟的方案已经摆在眼前了。所以总结一下,如果只是从产品看,这些都没啥新意,不是谷歌独创的。但是如果按这三条线索看,就会发现他在顺应一些时代的方向, 世界模型的方向,交互方式的进化,云端二十四小时不停歇的多 agent, 而这些越来越强大,越来越成熟的基础设施,怎么样才能进入我们的生活,这依然是最难的问题。 谷歌的大部分服务我都无法访问,我相信你们肯定也是一样,但用不了。谷歌不是重点,重点是国产玩家有没有在做同样的事,他们能不能追上。 所以呢,下一期我想继续顺着这个线索聊,我们怎么样国产变得更好。好了,以上就是本期的全部内容了,谢谢大家。

以前做 app 要先装环境,现在 google 说,你先描述安卓工位,我替你摆好。五月十九日, google 在 i o 二零二六上发布了一串开发者工具更新, anti gravity、 二点零 gemini api、 managed agents 以及 google ai studio 原声 android web coding。 重点不是又多了一个写代码按钮。 ai studio 现在可以在 build tab 里直接选 build an android app, 然后用 prompt 生成原声。安卓的应用 google 写得很具体,不需要安装软件,不需要管理 sdk, 不 需要本地环境。 它能生成 callen 和 jetpack compose 代码,在浏览器里跑 android emulator 也能通过 adb 装到帧机,还能连接 google play developer account, 一 键发布到 internal test track。 这对 ai 编程赚钱的人很直接。 以前你拿工具截图,据说我会 ai, 现在客户会问,那你能不能今天给我一个能点能测能改的版本? 反讽点是,门槛降低,并不会自动让大家都赚钱。因为客户买的不是你会提示词,而是需求澄清、原型交付、测试上架、数据接入和后续维护。 会提示词的人很多,会把提示词变成报价单和验收表的人才开始有生意。

大家好,我们上次分享了 integrity mcp 的 安装,今天我们继续分享如何让设计稿变成代码,完成首页三个页面的开发。点赞加关注,我们开始 我这里是以 ios app 为例,如果大家想开发安卓 h 五都可以。首先我用叉 code 创建了一个空项目,只有一行代码。 hello, 我们来到 integrity, 我 们给他第一条指令,读取当前项目结构,熟悉代码发送给他, 他已经返回了,对我们当前项目进行了一个熟悉。项目处于起步阶段,代码量极少,因为是我刚创建的一个新项目。我们来到 figure, 选中页面,右击 copy link to selection, 我们给他一条指令,帮我开发当前页面。 figma 链接主界面是一个 tab 点发送,他给我做了一个计划, 我们可以看一下。他给我做了一个计划,我们点击继续,他自动给我生成代码,左侧我只有两个文件,都是空文件,什么都没有。我们稍等一下, 选择接受所有。我们运行一下,看一下效果。 它给我们创建了一个类首页,我们来看一下,大家看首页的效果,已经有了,虽然有 bug。 我 们点击这个心情,应该切换背景, 我们来开发第二个页面,现在第二个页面和第三个页面都是空白的,切换到 figma, 选中页面,选择 copy link to selection 这两个页面,让它一起开发。 给他一条指令,帮我开发这两个页面。两个页面的链接发送给他, 我们来看一下,他说已经完成了全部开发,我们来运行一下项目, 报了两个错,我们复制这个错误,我们复制错误发送给他,让他自己来修,他已经修复完了我们这个错误,他说现在项目可以运行了,我们来试一试, 项目已经运行起来了,我们看一看,刚才他还给我加了一个格式化的图标,首页,我们点击心情记录,背景色是改变的, 我们来修改一下这个 bug, 复制了四个设计图的链接,给他一条指令,首页记录心情,背景色是会改变的,参考设计图发送给他,已经完成了关键改动,我们来运行一下,看看项目报错了,没关系,我们复制 继续丢给 ai, 他 说已经修改完了,我们再来运行一下,运行起来了,我们看一下 现在这个颜色改变了,但是颜色值好像有点差别。这三个我们看一下,切换到 good 这个心情的时候,这个背景颜色和我们设计稿的颜色差异很大,应该是这个颜色, 我们给他一条指令, good 的 设计稿,点击 good, 参考这个设计图颜色,我们让它继续修改,修改完了,我们来看一下运行效果,跟我们这个颜色差异很大,我们切换一个模型, 我们再来运行一下,现在跟我们的颜色一致了,对不对?首页颜色有点偏深,我们让他继续把首页颜色改一改,给他一条指令,参考这个,点击首页 great 参考设计稿调整 返回了,说首页已经改完了,我们点击接受。我们来看一下首页的颜色,现在首页的颜色太深了, 首页的颜色现在跟我们的设计稿是不是保持了一致,我们看一下我们是不是不需要写一行代码,直接通过 ai 帮我们完成了从设计稿到代码的一个过程,现在我们已经 web coding 的 工作结束了, 三个主界面的功能都已经完成了。开发是不是很简单?我们只需要跟他沟通页面整体的开发,局部的调整他都可以帮我们完成。包括 他生成代码的时候报错了,我们直接把报错的信息发送给他,他也可以自动帮我们完成错误的修改。 下一次我们分享如何把项目发布到应用市场,让你的 a p p 走向世界。点赞关注收藏三年不要错过,下期,我们下期见,拜拜!

最近我出了好几期关于 anti gravity 的 视频,这是谷歌推出的一款完全免费的智能体 id, 能让自主 ai 智能体进行编码和规划,并端到端地构建几乎任何项目。 我们也介绍过 open code, 它可以说是最好的开源 ai 编程智能体之一,适用于您的终端。它也支持 i d e, 让你能全面掌控代码的编写和编辑,还能借助你想要的几乎任何大元模型来浏览代码。 但问题是,他们各自都欠缺对方最擅长的能力。比如说 anti gravity 就 强的离谱,在高层级智能体编排和自主规划方面, 但在精确性方面他就不太行了,在确定性、代码编辑和深度仓库及控制方面也不行,而这恰恰是 open call 的 拿手好戏。此外,他的使用频率限制对很多用户来说是个大麻烦,即便是 anti gravity 的 付费版,使用额度很快就可能限定。 反观 open code, 它擅长进行外科手术式的精准代码修改,深层的差异文件清晰明了,螺旋选择也很灵活。但它处理不了长周期智能体工作流,也缺乏真正的多步骤自主能力这方面远不如 anti gravity。 所以 很明显,这两款工具各有所短, 也各有所长,但若将它们结合,就能取长补短,优势互补。因为 anti gravity 擅长端到端的规划推理与智能体协调, 而 open code 则能执行清晰可审查的代码变更,借助任意大圆模型,强强联合后,它们不仅能写代码,更能将你的任何构想变为现实。所以今天我就来为大家演示如何在 antigravity 中直接调用 open code, 两者结合, 你就能打造出最高效的编程工作流,完全免费。首先,你需要有一个谷歌账户,并确保已安装好 antigravit, 无论你的系统是 macos、 windows 还是 linux, 都能安装。准备好之后, 就可以轻松全局安装 opencode 了,比如使用 curl 命令、 npm 帮 brew or peru。 不 过还有另一种方式,你其实可以直接把 opencode 作为插件集成到 anti gravity。 打开 anti gravity, 你 可以进入扩展商店, 然后搜索 opencode。 打开 opencode 的 插件页面后,你会在左侧的插件面板里看到 opencode, 点击即可安装。 安装好后,你可以用几个命令来快速启动它。在 mac 上,你可以用 command 加 escape 快 捷键启动它。在 windows 上,则可以用 ctrl 加 e s d 快 捷键。在 linux 上,你可以新建绘画使用 command 加 shift 加 escape 即可,或者在 linux 上也可以用 ctrl 键代替。这样一来,上下文感知功能就会自动将你当前选中的内容或标签页同步给验。 open code 这确实是个很强大的功能,因为你可以和 anti gravity 协同工作。你将能够 直接在 open code 里进行上下文驱动的操作,同时也能调用你代码仓库里的所有内容。大家可以看到这个按钮,点一下就能直接打开,然后就能使用这个面板来配合使用 open code 和 ant gravity 智能体。 我知道可能有人会在右边面板这里问,为什么要两个一起用。其实呢,如果你把两者结合, 你就能让这两个工具各司其职,以不同方式实现,这样才能物尽其用,因为你可以让 anti gravity 担任指挥,你可以让 open code 来当首席工程师。所以只要你明确这两条规则, 就能让这工作流发挥最大效用。 anti gravity 擅长高层次的智能体编排,而 open code 则经于具体的代码实现。 更棒的一点是, open code 具有很大的灵活性,在可选的 ai 模型方面,可供选择的模型提供上非常多。但呢, anti gravity 这边选择不多,而且调用次数明显受限。我之前做过一个视频,演示了如何在 open code 里直接使用 anti gravity 的 认证, 大家可以通过这个视频了解一下。具体展示了如何直接调用 antigravity 的 o 在 open code 中实现,这样你就能完全免费使用 open code 了。 如果你有 pro 版,就能直接在 open code 里用,从而调用 opus 模型。但我更推荐你现在可以 直接在 antigravity 里操作,比如按 ctrl 加 p, 而且你可以选择不同的文件,直接在环境本身里进行选择。 现在我们来看看实际操作效果。接下来,我们切换到 antigravity 智能 t 选择规划模式,并且用 opus 四点五思维模式。 之所以这么做,是因为 opus 非常擅长规划,它能进行推理,并制定出分阶段的具体实施计划。它速度快,可靠。它尤其擅长为智能体工作流进行多步骤推理, 因此原子 gravity 是 完成此任务的理想工具。具体来说,看起来实施计划已经生成,任务列表也已经完成。大家看,我正在创建一个 crm 仪表板,这就是深沉的执行计划,可以看到它完成的非常出色,把每一个步骤都详细列了出来, 说明了 open code 的 智能体将如何写作开发这个项目,而且非常详细。正因为它强大的推理能力,所以我倾向于使用 op 四点五。 另外,再告诉大家一个小技巧,你完全可以创建多个 open code 智能题,这样就可以同时运行多个绘画。这确实是个很棒的设计,因为你可以新建一个终端,然后直接在终端里运行 open code, 这非常方便。接下来把实施计划导入到 opencode, 只需使用 at 命令即可。我们直接选中它。现在我要让它完整实现并执行这个计划。 我已经提前为此配置好的提示。接下来我们就可以将这个指令发送给 opencode, 让它部署多个智能体来帮我们创建 crm 仪表板。 他会立刻开始执行这个计划,他甚至会自行推理来消化这份实施计划,并将其拆分成多个阶段,以便着手开发这个 crm 仪表板。就这样,一个精美的 crm 仪表板便生成了。 而这一切它只用了大约五分钟就构建出了前端,还一并构建了后端。这是一个功能完美的 crm 仪表盘,你可以用它来添加新实体和新客户,还能进行联动修改。

强烈推荐 google 推出的 anti gravity, 它是一款 ai 控制工具,并且完全免费使用。它是一款由帧面三驱动的工作流编辑器,能帮你将应用创意变为现实。多个 a 帧,它会同步写作,负责项目规划、代码编辑。但它的独特之处在于它具备浏览器模式, ai 会真实打开你的应用,像真人用户一样点击操作所有功能。 一旦发现漏洞, ai 会自动修复,全程无需你手动干预。此外,你无需局限于真皮脸模型,还能根据项目需求切换至 cloud 或 chat gpt 等其他模型。你可以通过上述链接使用,快去试试吧!

你是不是也想搞懂时空信息怎么发?想给朋友来一条生日祝福短信定时发送,或者体验一把时空短信跟时空邮局的浪漫,甚至写一篇时空小作文存着等以后再发。 翻来覆去发现那些教程还又长又麻烦。后来我发现了一个办法,打开我们的浏览器输入,跟他说点信息,注意中间有个小数点,打不开,就换个浏览器试试。进去一划,输入对方的号码和你想说的话就行了。 如果不知道时空信怎么写,里面还有大量时空短信文案供你选择,这个就是对方收到的样子啦。而且你还能够选好具体的日期跟时间到点自动发出,不用下载任何软件,也不用担心忘了卡点。 一条从过去寄来的匿名信息,就这样子安安静静落在对方的手机上,比任何的时空邮局都省事。