hello, 下班了,今天看到了一个挺有意思的新闻, oppo 的 内部出了一个 iphone 局,叫 agent smith。 一 开始我以为又是一个什么内部的一个小 demo, 但其实看了一下发现还和我想象的不太一样。这个东西它的一个核心功能是,如果你想要写代码的话, 他就能在后台帮你把代码写完,甚至你人不在公司没开电脑的情况下,通过手机发个指令,他自己就能把任务跑起来,写完了还能自己把文件给你展示出来, 不需要你手动去找。听起来好像没什么,嗯,但是仔细想一想啊,这相当于是什么呢?相当于是给每个研发人员配备了一个二十四小时可随时唤醒的一个助手, 当你不用它的时候,可以把它关机下线,你需要它的时候一键唤醒。这样的话,比现在需要实时在线才能用的龙虾工具简直方便太多了。由于这个工具实在是太受欢迎了,虎口现在已经在内部给它限制访问的权限, 就说明它是真的好用,并不是什么 ppt 的 一个产品。不灵,也就是现在。 google 的 联合创始人在上个月的内部会议上专门提到了 ai 政策,他说这将是公司今年的一大重点,而且还暗示说今年也有一个叫龙虾的项目在做类似的事情。 不过像 agent smith 这种东西的出现,很大程度上会给人带来一种危机感。 如果他只是帮 google 的 工程师提高效率,那么其实在本质上还是在提高人的生产力,这并不是说代替人嘛。 但如果是公司在用这种工具去替代人力,那性质其实就完全不一样了。还有一点,这个工具他能访问员工的个人资料和文档, 说明他就存在了信息安全的问题,是存在一些安全隐患的,但是自朝目前来看,这个方向真的是一个大趋势,而且信号是越来越明显的。最后想和大家说一下我自己的一个想法, 其实行业在变化,这是一个常态,大家千万不要抵触,要积极的去拥抱变化,把工具用起来才不会被时代淘汰。好,今天要分享的就这些,拜拜。
粉丝134获赞767

谷歌最近更新的这个设计 agent, 我 愿意给到一个吭的级别,只要动动嘴就能做出网页,关键是可以及时修改,连交互都是自定义的,审美也在线,最重要的是解决了以往 ai 做网页的痛点。 那到底更新了什么?今天一个视频告诉你,那详细的文档也整理好给大家啦。第一,它支持 url 提取设计系统,直接把参考网站的链接丢给他 ditch 就 能瞬间提取出整套配色方案,包括它的交互版式,甚至反推成 markdown 形式的提示词文档,我们自己附用或者参考逻辑结构的时候就很方便。 第二,指哪改哪。除了有跟其他 ai 做网站的自然语言交互功能,它也支持一键识别你做出来的页面,指哪改哪也支持上传自己的图片进行修改, 还可以调用 ai 进行修改。而且我们知道谷歌它接的是香蕉模型,那这个深图效果不用说。第三,即时原型做好的静态设计呢?在这里点一下就能快速变成预览版的交互原型, 甚至可以直接在页面指定某个按钮交互的跳转,在这里也可以更换不同的转换效果。第四,你也可以直接对着画布截图说话,让 speech 一 边听一边改。 i think i'd like to see three different color variations of rate your mail screen that's a good idea i'll work on creating three distinct color variations for rate your mail。 能给你实时的设计反馈,那这个情绪价值真的直接拉满。 而且我觉得整个页面都很傻瓜式,即使你之前没有接触过设计的相关理论,也可以用它真正的去帮你参与整个设计流程,那感兴趣的小伙伴赶紧去试一下吧!

很多人对让 ai 帮你干活这件事情还没有实干,那我来带你们体验一下。这个是我在上课,我写了一个 ai agent, 我 就可以一边上课一边让他帮我去刷小红书,刷谷歌地图,去做攻略, 可以看到我的双手是完全解放的,也没有在控制它,它可以自己在跑这个任务,我其实通过 close skills 就 给了它这么一句任务,让它帮我生成京都的餐厅攻略,它就完全可以通过浏览器的 mcp 去打开浏览器,打开小红书,去看 n 个帖子,然后去汇总帖子的信息, 之后它还会去直接打开到谷歌 map, 一 方面去验证这些餐厅,其次它可以去保存谷歌 map 每个餐厅的一个地址。 最后呢,他能给我生成这样一个文档,就真的是我解放了双手,我可以一边上课或者一边刷手机,让这个 agent 来帮我干活。 这个其实就是用 close skills 加上 m c p 这个能力做了这样的一个 ai agent。 现在我来教一下大家怎么做方法其实比较简单,你没有技术背景也可以去做 前面这几步基础的环境配置我要熟悉的同学可以跳过我简单讲一下,就比方说我们以开公司为例,第一步最基础的 node js 是 给这个公司去租一个办公室,我们还要去安装 cloud code, cloud code 在 这面角色就相当于这个公司一个 ceo 入职,我们要给 cloud code 去配置智普的 api, 其实相当于我们让这个 ceo 去商学院进修,让他换一个更强大脑。在安装完 cloud code 之后,在这个里面其实就是用到 cloud code 如何去调用 mcp 这个能力,我就用 mcp router 这样一个 mcp 管理器,在这个里面我可以直接去下载,去配置 chrome 还有 lark, 也就是文档的这两个 mcp。 我 通过这个 chrome 的 mcp, 我是 可以让 ai 直接去访问小红书两个工具,那我们就可以把它理解成这公司的两个员工, 那最近很火的 skill 的 这个概念,其实它你就可以理解这个公司我们去执行某一个任务的一个工作文档,它可有非常多的 skills, 它其实是通过 ceo 下发任务,也就是说我想去做一个旅行攻略,那这两个员工,也就是 crm 的 mcp, 还有 lark 的 mcp, 它们根据这个任务的工作文档,我们最近聊的这个 skills, 他会告诉你说做旅行攻略,你首先要去看视频,小红书,你要总结里面的内容,小红书的筛选逻辑等等,会有一套规则都是写在了这个 skills 里面。我们通过 cloud code 在 m c p 去打造个人 a 站的流程,这套流程的这个教程我们会打包成文件文档,可以多人进群来一起学习。好了,我是小妖,我们下期见。

谷歌昨天更新的 flow 智能体也太好用了吧,可以直接一次性生成十四张图片,再也不需要一张一张去生成了,一起来看看是怎么使用的吧。今天给大家介绍一下最新的 flow 的 这一个 agent, 呃,特别好用啊,它的最好用的点在哪呢?就是它和一次性生成的图片没有上线。 嗯,假如说大家看到像我当前的这一个画面,我可以给他一个画面,他瞬间呢就可以给我生成十四张完全的这样的照片,大家看到瞬间十四个角度,这都可以了。好,这个具体怎么来操作呢?首先第一个,这是我的根图啊,随便拿一张你的图片出来啊,添加到这里面。第二个,这里使用智能体。 好,然后的话呢,点开这个智能体,好,我把它删掉,添加指令,添加指令之后的话呢,把我们的这一个十四分镜的这个模板给它拉进来,放到这里面粘贴啊,就可以了,点击确认。好,这样子的话呢,那么 他就有了十四个的规则啊,有了这个规则之后,那么你就写关键词叫生成十四张图。好,然后根据以上 十四个以上规则,就是因为我的那个里边是有十四个角度啊,以上规则生成十四个角度 的图片,这样子的话呢,你就直接点击开始。哎,这样的话呢,那么他这边就会稍等啊,他这边就会有这个 需要你确认,如果你是 bro 的 这个会员的话呢,升图是免费的,那么他就会让你确认一下,然后您啊积分啊可以使用,当然你也可以批量的生成多个视频。好,这个是 第一个操作,就是大家可以看到他会瞬间给你生成十四个角度的这一个图片,这第一种的。好,第二个的话呢,那么有了这一个之后啊,那么第二个就是我们以前做画面是使用九宫格的,那么以后我们其实从理论上来说就不再需要做九宫格了,那么我们的九宫格直接就可以变成, 大家可以看一下。好,我们的九宫格直接就可以变成一张一张的图。好,那这个的话呢,也是很简单的直接选择智能体,然后的话呢随便选一张这个九宫格啊,对,这些都是我刚刚已经弄完的。 好,假如说我到这个地方选择这张,呃,前面的这个九宫格吧,选择这个九宫格添加到这里面。好,那么直接生成啊,九宫生成九张图片。好,把以上九宫格图,九宫格图片啊,放大每一宫格。 好就可以了。好,直接点击它就可以了啊,这个时候你看到这里就会放大每一宫格的图片,点击确认。好,那么直接点击确认。哎,这个时候的话呢,他就会收到信息, 就帮你把这个呃画面啊,生成九张这种独立的照片,这样子就可以了啊,效果非常好,包括清晰度,大家可以看一下清晰度, 嗯,没有任何问题。好,这个就是他的智能体的使用啊,非常的方便。好,感谢大家观看。

兄弟们两天没睡好,全因为给他们上刷到一本书。这本书是一个谷歌的资深工程师亲手写的,专门拆解 ai agent 底层设计逻辑的硬核内容,中文名叫智能体设计模式。 我之前对 agent 的 认知说实话就很乱,知道有这个概念,但是就是联系不起来。这本书简直就是给我打通了任督二脉 提示词怎么串联成炼乳工作调用的出发机制,多个智能题,怎么协同配合?这些东西怎么拼在一起,怎么让 agent 真的 能干活, 里面全都有。更香的是有人专门做了完整的中文翻译版,直接免费放在 excel 上。目前已经积累了五 k 的 star, 想把 agent 吃透的这本不看一定会后悔的。

大家好,今天来分享一期谷歌 antigrati 零基础教程,我会从十四个点分别介绍 antigrati, 结合案例一步步带大家更加了解 antigrati。 第一部分, antigrati 介绍如果你以前听说过 cuda、 cloud code code, 或者听说过一些 ai 编程,但是不知道这些工具怎么用,这期视频就是给你准备的, 我会从最基础的地方开始,一步步带你看懂 antiquity 是 什么,怎么安装界面,怎么看,怎么让它帮我们写代码,检查网页、连接外部工具,以及怎么用 scare 来帮我们固定工作流程。 简单说, antiquity 不是 一个普通的代码编辑器,它更像是一个可以管理 ai 员工的工作台,不是只让 ai 回答问题,而是可以给他一个任务,让他自己规划,自己写代码,自己打开浏览器检查,最后把结果交给你确认。这就是这期视频要讲清楚的东西。 如果你第一次接触 integrity, 看完这期视频,你至少会三个问题,第一, integrity 能做什么?第二,普通人应该从哪里开始?第三, m c p、 scares、 ross。 这些东西听起来很专业,到底是什么意思?视频制作不易,欢迎大家三连。 第二部分, antiquity 是 什么?你可以把它理解成一个 ai 版的代码编辑器,但是这个说法还不够准确。传统代码编辑器,比如 vs code, 主要是用来写代码,打开文件,自己运行,自己检查。 后来出现了 ai 编辑器,比如 coder, 它可以在你写代码的时候帮你补全,帮你解释代码,帮你修改某一段代码。再后来出现了 cloud code、 cortex 这类工具, 它们不止补全代码,而是可以帮你执行一个任务,比如修 bug、 写测试、生成网页。而 antgrity 更进一步,它的重点是 ai 帮你写几行代码,而 ai agent 帮你完成一个任务。 这里的 agent 我 们可以理解成一个智能体,你不用把它想得太玄乎,其实它就像是一个会自己干活的 ai 助手, 告诉他帮我做一个登录页面的开发,他不会只回答你一段代码,他会先理解你的需求,然后按照当前文件夹有什么文件,再列出任务清单,写实施计划,修改文件,运行项目, 打开浏览器检查页面,最后告诉你他做了什么。普通 ai 更像是在回答你的问题, integrity 更像是在替你执行任务。 所以我们可以用一句话总结, antiquity 是 谷歌推出的以 ai agent 为中心的开发工具,它可以让 ai 在 编辑器、终端、浏览器之间工作,帮你完成比较复杂的软件任务。如果你不会编程, 你可以把它理解成一个能够帮你做网站、看项目、改代码、写文档、查问题的 ai 工作台。第三个, ontgrity 和其他 ide 的 区别很多朋友问,那我经常听说 cuda、 cloud code code dex、 ontgrity 和它们有什么区别? 其实 ai 编码编辑器基本能力已经拉平, m c p、 scare 多 agent 等这些 ai 代码编辑器都能够实现。但是 ontgrity 强调的是 agent first, 还有免费的模型可用,内置的有最新的 gmail 模型, cloud 模型。所以我们重点分享 integrity。 integrity 的 特点是什么?它最特别的地方就是 agent manager, 专门管理 ai agent 任务界面,你可以把它理解成一个任务控制台。以前你可能打开一个聊天框和 ai 来回聊天, 但在 antiquity 里面,你可以同时打开多个任务,比如 agent 帮你做网页, agent 帮你测试,一个 agent 帮你怎么研究部署,你就像一个项目经理一样,在这个界面可以管理它们。所以 antiquity 的 核心不是一个聊天框,而是多个 agent 任务管理, 这就是它和很多 ai 编程工具不一样的地方,当然工具没有好坏。 integrity 更强调 agent 的 自动执行,浏览器验证、任务管理和工作过程可见。第四部分, integrity 安装、登录和出手话设置。大家直接在浏览器里面搜索谷歌 integrity, 进入官网, 进入官网之后点击 download, 支持 mac windows linux, 如果你是 mac, 下载完的软件,拖进 application 就 可以。如果你是 windows, 双击直接安装,跟普通软件一致。第一次打开 antiquity 的 时候,它会让你做几个出手话设置。 第一个设置是否导入你以前编辑器里面的配置,比如 vscode 浏览器。如果你是新手,我建议你不用纠结,直接点击默认配置就可以。第二个设置,选择主题,浅色深色,这个完全看个人习惯。 第三个设置比较重要,是 a 件的工作模式,也就是你希望 ai 有 多大的自主选择权。有些模式比较保守, ai 做关键决策之前会询问你的意见。有些模式比较自动, ai 可以 自主执行更多命令。 如果你是第一次用,我建议你选择 review drive development。 最后一步,需要登录我们的谷歌账号,我们点击登录 选择自己的账号, 登录完之后,我们就进入了主界面。第五个, antiquity 主界面结构介绍如果你用过 vs code, 大家可能会觉得很熟悉,左侧是文件列表,中间是代码编辑区域,右边是 a 帧的区域。我们可以在这个 a 帧的区域下侧 选择模型,它内置的有 gimini 最新模型和 cloudsonitops 相关模型,自己手动可以切换。如果你只想修改一个文件,或者问一段代码什么意思,可以让 ai 修改这个小功能, 我们直接拖进输入框跟它沟通就可以。或者通过 app file 命令,然后选择自己的文件跟它沟通就可以,它会帮你完成相应代码的调整。还有一个比较重要的功能叫做 agent manager, 这才是 antigue 最有特色的地方。 agent manager 可以 理解成 ai 任务管理台,你可以在这里创建任务,查看正在运行的 agent, 看它完成了哪一些步骤,查看它当前的计划截图和总结。这个界面通常会看到以下几种东西,第一个 workspace, workspace 就是 工作区,也可以理解成一个项目文件夹,比如要做一个网站,就新建一个网站项目目录文件, ai 在 这个项目里面生成文件,修改代码,都会放到当前工作区。第二个 conversation, conversation 就是 一次对话,也可以理解成一次任务, 比如帮我做一个个人主页,就是一次 conversation。 第三个 browser, browser 就是 浏览器 integrity 的 agent, 可以 打开浏览器看网页,点击按钮、截图、检查页面都没问题。第四个 terminal, terminal 就是 终端,很多项目需要运行命令,比如安装依赖 启动网站、运行测试 agent 都可以在终端里面执行这些操作。所以 integrity 的 界面可以理解成 edit 是 你和代码一起工作的地方。 agent 的 manager 是 ai agent 干活的地方, browser 是 ai 检查网页效果的地方, tome 是 ai 执行命令的地方, workspace 是 存放所有文件的地方。第六个, agent 是 怎么工作的?接下来我们看一下 integrity 最核心的流程, agent 是 怎么工作的?我们不要把它当成一个聊天机器人,它更像是一个会按步骤的工作助理,给他一个任务,比如帮我做一个个人簿客,它通常不会乱写代码。第一步,它会先理解需求, 它会判断你到底要什么页面,需要哪些模块,用什么技术来实现。第二步,它会扫描当前项目,也就是当前文件夹。 workspace 是 空项目,还是已有的 rack vue 这样的项目。第三步,它会生成一个 implementation plan, 也就是实现计划。它会告诉你准备修改哪些文件,为什么这么改。如果我们对它实现的计划我们不太满意,我们可以直接添加评论,它会按照我们的计划修改。第四步,它会生成一个 tasklist, 也就是任务清单,比如创建项目目录结构,创建簿刻的列表,还有文章详情,导航,启动本地服务,打开浏览器检测修复,发现问题会创建一个 task list。 第五步,才是真正它修改代码的地方。 第六步,它会运行命令,比如安装依赖启动项目,跑测试,它会打开浏览器进行验证。这一步非常重要, 因为很多 ai 工具只会写代码,但不知道页面长什么样。 integrity 可以 自己打开页面看效果,截图,发现问题自己修改。最后一步,它会生成一个完成总结, 它会告诉你我做了什么,改了哪些文件,怎么验证,都有相应的截图。所以 integrity 的 完整流程不是你问我答,而是你给任务它规划、 执行,验证、总结,然后你 review, 这就是 agent 工作流。第七个,我们讲一下 advise, 我 们刚才提到了 task, list, implementation, plan, workflow, 这些东西都是 integrity 里面叫做 atiface。 atiface 这个词听起来有点专业,你可以把它理解成 ai 干活过程中留下来的工作材料。比如一个真实员工完成任务,不应该说一句我做完了,他最好告诉你我计划怎么做,我实际做了什么,我遇到什么问题, 我怎么检查结果,还有哪一些风险? adfast 就是 这些东西。常见的 adfast 包括任务清单、实现、计划、修改、总结、浏览器截图、页面录屏、测试结果、知识记录。为什么这个东西重要?因为 ai 最大的问题就是黑箱, 他改了很多文件,你不知道为什么这么改,他说已经完成了修改,你不知道有没有真正检测,他说没问题,你不知道有没有跑过测试。 有了 atfast, 你 就可以检查它的过程,你可以查看它的计划是否合理,查看截图是否符合预期,可以查看它有没有启动项目,有没有报错。所以 anti grati 的 思路是, ai 不 止交付结果, 还交付了整个过程,对普通用户非常重要,因为你不一定能看懂每行代码,但是你能看懂它的任务清单, 截图和总结。第八个,浏览器能力,让 agent 自己检查页面。接下来我们介绍一个特别实用的功能,浏览器能力。普通 ai 写完网页的时候经常有一个问题,他觉得自己写好了,但你打开一看,页面很丑, 按钮重叠,可能文字超出屏幕,手机端完全断掉。为什么?因为他是在生成代码,不一定真实看个页面。 antigrity 的 浏览器能力就是为了解决这个问题,它可以帮你打开本地网页,运行在 logos 的 三千,也可以自己打开这个网址。我们给他一个网站,帮我测试一下。个人簿客点击发送, 它可以滚动页面,可以点击页面按钮,可以输入内容,可以查看控制台报错, 也可以截图。如果发现问题,还可以回滚代码继续修改。所以以后你让他做网页提示词,里面一定要加一句, 完成后启动本地服务,打开浏览器检查并提供截图。这句话非常重要,因为他会强迫 agent 不 只写代码,还要检查结果。第九个, mcp。 mcp 全称是模型上下文协议 model context prote, 这就是 ai, 可以 调用外部工具,你只需要知道 m c p 是 让 ai 连接外部工具的接口。没有 m c p 的 时候, integrity 主要是看你本地项目的文件 运行终端,打开浏览器。但现实工作里,我们需要连接其他工具。我们一起来看一下 integrity 如何安装 m c p。 我 们来到右侧的 a 镜的区域,点击三个点, 选择 m c p server。 大家可以看到这里有很多 m c p 服务,比如数据库相关的, github 相关的,比如数据库相关的,我们的 agent 就 可以通过这个 m c p server 去连接我们的 my circle。 github 相关的,我们的 agent 可以 安装 m c p 服务来连接我们的 github。 本地,我们来演示一个设计稿相关的 fig 码,我们可以在这里搜索, 因为我这里安装了,如果没有安装是 install, 首次点开,我们直接点击安装,这样我们的 m c p 服务就能安装。在本地,这里安装的是 figma 的 m c p, 也就是我们的 agent 可以 去读我们 agent 中的设计稿,我们一起来看一下。我们返回 agent, 我们来到设计稿,我这里有一个设计稿,我们选中 copy link to selection, 给他一条指令,帮我读取设计稿,然后点击发送。这些外部工具怎么连接到 ai? 这个时候就需要 mcp, 你 可以把 mcp 想象成一个插头, 数据库有数据库的插头, figma 有 figma 的 插头。 antgrity, 通过这些插头就能让 agent 使用对应的工具。所以 mcp 解决的问题是,什么? agent 能连接什么?我们这里配置了 figma mcp, agent 就 可以读取设计稿, 然后帮我们还原页面。我们刚才看到了,在 figma 中,我这里有一个设计稿, antgrity 安装了 figma, mcp 给他了 figma 的 设计稿的地址, 它已经帮我分析出来了,这是一个电商设计首页,这个页面的核心板块,它都已经帮我分析出来了,背景色、主色调它都能分析出来, 说明我们的 agent 通过了这个 m c p 连接到了我们 figma 这个外部工具。但是这里一定要注意安全, m c p 一 旦连接外部工具, 也就意味着 agent 有 更多的实操能力,它这里可以来读取我的设计稿。一句话总结, mcp 是 integrity 连接外部世界的一种新方式,也是所有的 ai 工具都是通过 mcp 来连接外部服务,让 agent 具有更强大的能力。第十个 scares, 让 agent 学会固定工作方法。 刚讲完 mcp, 我 们再来讲讲 scares。 scares 也很重要,而且和 mcp 很 容易混淆。我们先用一句话区分 mcp 解决的是 ai 能连接什么工具。我们刚才使用 mcp 连接我们的设计稿,它能够读取我们的设计稿。 scares 解决的是 ai 遇到某类问题该怎么做,比如让 ai 做代码审查。我们来演示一下,大家可以打开这个网站,这个网站有常见的 scares antiquity 的 常见 scares, 我 们一起来看一下,这里说选择你的工具,我们这里使用的是 antiquity, 我 们复制这个命令,来到我们的 antiquity, 打开终端,输入这个命令回车,这样就可以把我们这一个工具包里面常见的 scares 都安装上。我们稍等一下, 安装完了,我们来看一下有哪一些 scares。 我 们通过 nps scares list 就 可以查看, 我们刚才安装的这个插件里面有很多 scares。 我 们来找一个代码审查的 scares, 我 们就拿这个 code review scares 来举例,我们复制一下它的名字,来到 agent 的 区域,给他一条指令, 使用这个 scares 帮我检查当前类的代码,我们发送给他,我们稍等一会儿,如果没有 scares, 它会没有规范的检查代码, 然后说代码不错,但是如果我们给他一个 scar, 这个 scar 里面写清楚,先看代码的改动,再找 bug 有 没有风险,有没有缺陷测试,最后再看严重的输出问题。下次 ai 做代码审查的时候,就会按照我这个 scar 的 这个流程 来检查。你可以把 scar 理解成 ai 的 工作说明书,告诉 ai 遇到这个问题,按照哪一些步骤来执行,需要注意哪些问题,最后的输出格式是什么?这就是 scar。 比如说常见的有很多开源的 scar, 我 们也可以自定义 scar, 比如说写文章,写小红书,代码审查,写测试,数据分析,都有很多很多 scar。 如果要区分 mcp 和 scar, 可以 这样记, mcp 像是工具箱,负责连接工具。 scar 是 说明书,告诉 ai 怎么干活。 我们看一下刚才我们用的这个 scar 来分析这个页面,它已经执行完了核心审查中发现架构与 seo 瓶颈,版权、年份印编码, 是不是它分析出来了,有这么多缺陷?这就是我们用的这个 code review scasse。 在 后面我们会通过一个具体的案例来进行演示,这里使用的是一个 scasse。 第十一个 rules workflows, 我 们一起来看一下。 除了 m c p, scarce 还有两个概念值得讲一下,一个是 loose, 一个是一个是 workflows。 loose 就是 规则,我们看一下在哪里配置 loose, 我 们打开 a 键的区域,点击更多, 我们选择第一个,这里有一个 loose, 我 这里已经配置了两个。看一下,这里有一个是前局的 global, 还有一个是 workspace, 我 们来打开看一下, 我这个例子很简单,它的要求就是回答用简体中文, 它是一个前局的,所以看到 agent 的 回答的时候, 他回答的时候是不是把我们的这个回答变成了中文?这就是我们配置的一个规则。我们常见的在这个 list 里面,我们可以配置配置的有,比如说默认中文回答这个项目使用的语言,不要使用哪一些库, 所有的按钮都要和设计系统里面的组建一致,修改代码后必须要运行测试,这一些都是长期规则,也可以结合自己的项目来设置自己的规则。这个规则可以针对的是当前的 workspace, 也可以是前局的, 这是 loose workflows, 是 工作流,是一致的,它也是有前局的,跟 workspace。 我 们看一下,我这里配置了一个前局的 workspace f two p, 它的描述是根据设计稿还原页面,这个是我们等一下要做一个项目案例演示的, 我们看一下,它里面写的很简单,第一个深度拉取数据,通过 m c p。 第二步样式对齐,跟设计稿的样式要对齐。第三步才是结构化编码。第四步是动态注入, 就是扫描设计稿上的一些组建。第五步是视觉检查,定义了 workfloor, 它其实就是一个工作流。接下来我们 来演示案例的时候,他会按照我们定义的一二三四五步这个工作流来完成我们代码的一个实现。比如说我们一个发布的流程,先跑测试,再更新版本号,再写 log, 再打 tag, 再部署,这就是一个完整的一个流程。 我这里定义的这个流程就是我们会根据 fake 码上的一个设计页面,然后来生成代码,它规范的一个流程。 这几个概念跟大家再总结一下, roles 就是 要遵守的规则, skills 就是 需要用到的方法包 ai 使用的说明书。 work flows 就是 一套固定的工作流程, mcp 是 连接外部的工具的接口。第十二个权限和安全,我们来看一下 a 境的权限, a 境它能做什么?第一个,运行命令,打开浏览器,获取和编辑代码,还有使用工具, 比如说配置 m c p 可以 使用外部工具。 a g 的 能力很强,但权限有限,我们只能让他在明确的边界内工作。第二个权限最小原则,明确边界,我们尽量只给他当前项目的工作目录。第二个代码需要有一个版本管理, 他可以读写删代码,所以我们需要一个代码的版本管理,防止他误删。 第三个,不要给予最高的权限使用,普通用户运行不需要 root 管理员权限,避免系统级风险。第四个,高风险操作必须需要有一个确认, 我们可以配置规则,比如说删除文件,部署项目,修改数据库,系统配置,这些都需要经过人工确认才能执行操作。 敏感信息我们绝对不能交给 agent, 比如说密码,密钥,生产环境的权限,还有敏感的配置,我们这一些信息千万不能交给 agent。 最后我们总结一下,给 agent 最小的权限只能在当前项目目录中工作, 所有的代码变更都需要通过 get 管理,不要使用管理员权限,避免系统风险。 高风险,必须高风险,操作必须经过人工确认,防止误操作,敏感信息不共享, 保护密码,生产环境更安全。定期审查 a 件的操作日记,及时发现异常。第十三个完整案例演示,我们通过一个具体的案例 来把我们刚才所分享的一些 mcp, scare, workflow, rules、 figma, 我 们结合起来,把这些知识点结合起来,生成一个完整的案例。我们这一次要实现的一个功能是 figma 中的一个设计稿,也是 ai 生成的,我们打开看一下, 就是当前页面一个电商的首页,我们再来看一下 ai 生成完的页面是什么样子,这是 ai 生成的页面,我们的 integrity 需要读取我们的设计稿,我们这里用到了一个 mcp 服务是 figma, mcp 这里安装就可以。第二步,我们讲一下 rules 和 workflows, workflows 里面我们配置了返回用简体中文,刚才前面已经讲过。第三个 workflows workflows, 这是我自定义的一个工作流,然后定义了五步, 这个五步里面插入了一个东西,插入了一个 scare, 看一下。最后一步,使用 webos code review 这个 scare 做代码分析, 它会按照我们的这个工作流来给我们生成代码。这里讲到了 rose 和 workflows mcp, 我 们看一下它是怎么实现的,怎么来还原我们这个设计稿的,我就给他了一个指令, f two p 是 我们刚才定义的工作流,然后给他了我本地 figma 的 一个设计稿地址,这是通过 mcp 生成的,然后它会给我们生成一个计划, 我们计划怎么看呢?我们只需要点击 atfast implementation, 它给我们写了一个计划,需要我们确认的有三点。 刚才我们定义了 workflows, 第一个环境准备、结构转换、样式迁移、动态注入、交互、实现格式化检查和代码审查。这个代码审查我们是不是用到了一个 scare, 然后他会按照他自己制定的这个计划来实现,他会给自己列一个 tasklist, 最后 tasklist 他 都完成了之后,他会生成一个 walkthrough, 就是 一个结果结果报告,他生成的结果报告里面有截图还原效果图, 还有帧机演示图,这是一个视频,对不对?最后还用到了我们定,我们给他定义的这个 scale 写了一个代码规范审查的一个合规报告,比如说代码逻辑完整性、 t s 严谨度,还有交互性审查,它都做了一个检查,这样它是不是把我们的 m c p, scare rules, workflow 这些都结合起来, 生成了我们这个代码,这个代码的这个代码运行起来就是这样的。第十四个总结一下,到这里我们把 antiquity 零基础内容完整的走了一遍,我们讲了它是什么,和其他 ide 有 什么区别,怎么安装 主界面怎么看, agent 是 什么? at first 是 什么?浏览器怎么用, m c p scale workflows 是 什么?以及最后我们生成了一个完整的实操案例。 如果用一句话总结 antiquity antiquity 它不是 ai 在 旁边给你提建议,而是让 ai 进入编辑器终端浏览器,帮你真正完成任务。 它代表一种新的工作方式,以前我们在 id 里写代码,现在我们在 id 里管理 agent, 未来的软件开发很可能会像这样人负责目标判断、验收, ai 负责执行检查和总结。 好的,这期视频就分享到这里,希望你有所收获,如果你觉得有帮助,别忘记三连,我们下期见。

接上一条视频啊, agent stack 最吓人的地方不是它的名字高级,而是它把 ai 员工这件事情从概念变成了一套工程的流程。 哎,大概分四层,第一层 adk, 你 可以把它理解为 ai 员工的入职系统。你要定义这个 agent 是 谁,负责什么,能用什么工具, 遇到任务怎么思考。第二层是 m c p, 这是 ai 员工的工具箱啊。以前 ai 只能在聊天框里说,有了 m c p, 他 就可以去接搜索代码,执行数据库内部系统。也就是说,他不只是会回答,他能开始动手。 第三层就是 atv, 这是 ai 员工之间的公司通讯录啊。一个 agent 不 必什么都干,他可以把任务交给一个,交给另外一个更专业的 agent, 向市场部找数据库,数据库再找工程部。第四层就是 vertex ai agent, 这是,这是把 ai 员工扔进云端上班的系统啊。部署扩容、日制监控,不再是靠你手搓服务器。 这四层合起来才是真正的重点。 ai 不 再是单点的工具,开始变成一个组织结构。以前我们问 ai, 你 能帮我写一段话,哎,以后我们可能会说,这是目标,这是资源,这是截止时间,你们几个 agent 自己分工,把结果交给我, 他就不是聊天机器人了。这是 ai 企业操作系统的雏形。所以真正要学的不是怎么问 ai, 而是怎么设计一个 ai 团队。

让 ai 帮你爬取并筛选全网优质 ai 资讯的神器来了!已经收获二点六 k 星标!它聚合了全球四百多个顶级的 ai 信息来源,包括 open i、 谷歌、狄麦、 anselfo 等大厂的博克和山姆奥特曼、卡帕西大神等行业大佬的推特。 核心亮点是用 ai 对 每篇文章进行智能评分、摘药和翻译,帮你过滤百分之九十的信息噪音,只看高质量的干货,覆盖编程、 ai、 产品设计、商业科技等五大领域。支持文章播客、视频推文四种内容形态,完全开源免费 支持 r s s。 订阅和开放 a p i。 每周五还有精选的周刊推送,已经有五千多个 ai 爱好者订阅了。赶紧去蹲一下,这可能就是你获取 ai 信息效率提升十倍的神器!


以后公司可能真的只需要一个 ceo 了啊,而且这个 ceo 甚至可以先去睡觉,剩下的员工全是 ai。 这个听起来像是段子,但是今年 一定会实现。 google cloud 官方的 code lab 里面已经把这套工具写成了工程教程,叫 agent stack。 它不是一个 ai 陪你聊天,它是让一群 ai 分 工干活, 一个负责理解目标,一个负责查资料,一个负责调研工具,一个负责执行任务,一个负责把结果交回来。中间用 adk 搭 agent, 用 mcp 连接,外部的工具用 a to a, 让 ai 之间相互沟通,再用 vertex ai, agent 不 熟到云端。这已经很像一家小公司了,只不过是员工不打卡,不摸鱼,不请假,也不会下午三点。突然说,啊,我脑子有点乱。当然了,人类还没有完全被替代,但是变化已经很明显, 以前是你亲自干活,以后你更像是在只会一群 ai 干活。未来最值钱的人,不一定是最会熬夜的人,而是最会给 ai 团队下任务的人。你准备好当 ai 的 老板了吗?评论区聊聊。

大家不要把提词词想的这么的高大上,你不要期望个人的能力能把提词词的水平写得多高,它这个性不性的一个工程,我觉得普通人可以快速让你的提词词水平提高。就是用 agent 模式, 这种 a 阵的模式不是说就在这个软件里边用,而是你自己要有一个拿手的,用着趁手的一款软件。如果要进行创,我起码要用三个 ai 工具,一个 ai 工具是是拆的 gpt, 另外一个是谷歌的 jamming, 还有一个我会用国内的这个 kimi 二点六, 我会用他们三个分别给我提示词,然后用这三个提示词来进行生图,哪个效果好就用哪个。我不想花时间去研究提示词,这个写起来是很麻烦,你除非脑子里边有一个非常具象的画面,并且你如果创造的是具类的东西,就是短具类的东西, 成系列的东西,你肯定是需要把前因后果所有的资产库全部要想清楚的,所以这部分工作我全部是交给 ai 来进行完成的。如果你觉得有没有可能快乐马需要更专业的提示词,我觉得这个肯定是有的,因为提示词不光是对快乐马有影响,它对所有的生图生视频的软件,它 这种模型其实都会有影响。你的提示词越精准,越精确,越详细,它生出的效果会更加好。这个就跟刚才咱们在公屏里边有位朋友在提的一样,就是用专业的这种电影语言去描述这种提示 ai 会生出的效果会更加好。 所以在用 ai 的 时候,一定要结合自己的这种专业情况,你如果本身就是做影视创作的,你用它你会更有优势一点。