粉丝5286获赞2.2万

谷歌 antigravity ide 现在终于支持 agent skills 了, 这是 open ai codex 支持 agent skills 之后,又一个 ai 巨头的编程之手,加入了 agent skills 阵营。所以说二零二六年正式成为 skills 元年。 ai 编程从传统的给 ai 编程工具一句提示词,让 ai 临时发挥, 升级为给 ai 编程工具装一套技能,让 ai 按照技能稳定产出代码。 agent skills 是 osopik 最初开发现已成为开放标准的智能体能力扩展格式。 它解决了一个核心问题, ai 虽然越来越聪明,但它缺乏你的领域知识,你的工作流程,你的最佳实践。 而 skills 的 作用就是把公司、团队甚至个人的工作流以及最佳实践,还有脚本等工具像模块一样打包进去,让 ai 编程助手等智能体按需加载,反复复用。所以我特别喜欢用一句话来区分 agent skills 和 prompt, prompt 是 临时指令,而 agent skills 才是长期资产。这次 anti gravity 支持 agent skills 的 意义非凡,尤其是对于非专业开发者,福利最大。 哪怕你完全不懂编程,不会写代码,也可以通过安装现成的 skills, 打造一个真正懂你业务的专属 ai 编程助手。 aging skills 的 本质就是 ai 专用业务手册,通过文件夹和 markdown 文件来打包知识工作流,最佳实践还有脚本、 ai 编程助手等 ai 智能体会,自动发现并且按需加载特定的 skills 来实现能力赋用,还有标准化, 而且是渐进式加载,从而避免上下文爆炸。好,本期视频教大家详显式我们如何在 anti gravity 中使用 agent skills 以及如何创建 agent skills? 并且我选择了一个最具代表性的 agent skills uix pro max。 我们将借助这个 skills 让 anti gravity 创建最为现代化,最为美观的 ui。 这个 skills 能让你在做界面时自动获得专业的配色,排版,布局,还有交互建议,来解决很多开发者做出的产品能用但不美观的难题。 好,想在 anti gravity 中使用 agent skills 非常简单。首先我们要确保我们已经将 anti gravity 升级到了最新版。 好,下面我们可以先测试一下在 antigraph 中使用 anselpic 官方发布的 skills。 anselpic 官方发布了多个 agent skills, 在 官方给出的这些 skills 中包含前端设计的 skill, 还有创建 ppt 的 skill。 下面我们只需要将这个项目克隆到本地。下面我们打开终端命令行,直接用 get 克隆的命令将这个项目克隆到我们本地。好,这里克隆完成,我们直接用 cd 命令进入到这个项目的路径。 根据 anti gravity 提供的官方文档,我们可以将 agent skills 放在这两个路径下,其中这一个就是我们当前的项目路径。如果只允许 agent skills 在 当前项目路径下加载,那么我们就可以放在我们当前的项目路径下。 如果希望 agent skills 在 所有项目中都能调用,那么我们就可以放在这个大局路径下。好,下面我们回到终端命令行,我这里直接用这条命令将 agent skills 放在官方推荐的这个大局路径下,我们直接运行就可以。 然后我们用 cd 命令进入到这个大局路径,然后用 l s 列出这些 skills。 好, 可以看到这里成功将这些 skills 都放在了这个大局路径下。 然后大家如果不习惯执行命令,也可以直接将这些 skills 文件夹全选复制,然后粘贴到 antigravity 存放 skills 的 这个路径下。像这样的话,在 antigravity 中,我们只要创建了新项目, 它都能调用到这个大局路径下存放的这一些 agent skills。 好, 下面我们就测试一下 ansopek 这一些 skills 中的前端设计 skill。 我们回到 anti gravity。 好, 下面我们就可以输入提示词,这里我输入的提示词是创建一个咖啡店的落地页,并且使用这个前端设计的 skill。 在 模型这里,我选的是 gemini pro 模型,因为这个模型非常适合用于前端 u i u x 设计。然后我们直接点击发送, 可以看到这里它正在搜索 skill。 这里它需要运行命令,我们允许它执行。好。非常神奇的是,它这里自动调用了 nano banana 模型来生成了这个网站所需要的这些图像。 然后我们点击打开,这是它生成的第一张咖啡馆内的这个景象的图像,这里放着一杯冒着热气的咖啡。这里它生成了第二张图像,这张图像是咖啡豆的图像,我们可以放大看一下。 anti gravity 自动调用 nano banana 模型来生成图像。这个功能是其他 ai 编程助手所不具备的,因为无论我们在使用 codex 还是使用 cloud code, 它们都不会自动来生成图像,而 anti gravity 它为我们开发这种前端 ui 的 时候,它能自动生成最为适配的图像。 好,这里提示这个咖啡馆落地页,这里已经创建成功,并且使用的是 next j s 还有 telenovela css。 然后下面我们就可以根据他给出的命令来运行一下,看一下效果。我们直接复制他给的命令, 然后打开 anti gravity 的 终端,粘贴这条命令,并且运行好,运行成功。我们直接打开这个链接,打开之后我们就看到了他为我们创建的这个咖啡馆的落地页面,然后这个页面的背景图像就是他刚才调用 nano banana 来生成的这个图像。 这里是这个页面的导航栏,可以看到设计的非常不错。然后我们继续往下拉,在这里他还将刚才生成了这个咖啡豆的图像 也加入到了这个页面中。可以看到它设计的这个咖啡馆的落地页非常精美,而且它用 nano banana 生成的这种配图效果也非常不错,这可以说是 anti gravity 独有的技能。 这样的话我们测试的是在 antigravity 中来加载已有的这一些 skills 项目。好,下面我们还可以测试一下手动创建这些 skill。 在 antigravity 官方文档这里,它给出了手动创建 skill 的 这些步骤,而且这里还给出了一个用于代码审查的最简单的 skill。 下面我们就可以使用官方给出的这个例子,在我们当前的项目路径下来创建这个 skill。 在 当前项目中,创建 skills 非常简单,我们只需要按照官方他给出的这个文件路径进行创建就可以 在 anti gravity 的 终端命令行,我们直接执行这条命令来创建用于存放 agent skills 的 路径。 好,这里创建成功,下面我们就可以将官方给出的这个案例放入到刚才我们创建的路径中,然后我们直接复制这个内容回到 anti gravity。 在 anti gravity 中我们就看到了刚才我们创建的这个路径,然后这里我们新建一个文件 昵名为 skill 点 md, 然后将刚才复制的内容直接粘贴并且保存就可以了。下面我们就可以测试一下调用这个 skill 进行代码审查,输入梯式词,使用 code review 审查当前项目的代码,然后我们运行可以看到这里它正在读 skill md 这个文件,正在分析这个项目的代码。 好,这里完成了代码审查,这里输出了代码审查的这个结果,这里还给出了用于优化这个项目性能的这些建议。这就是我们在 anti gravity 中通过手动创建 skill 并且调用 skill 的 方式。如果想创建更加复杂的 skill, 然后我们可以使用这个开源的项目 skillseeker, 我 在之前的视频中为大家详细演示过,然后如果不熟悉的话,可以查看我之前发布的这一期视频, 它可以一键将任何开源项目或者网站转为 agent skill。 好, 下面为大家演示这一款最强大的用于 u i u x 设计的 agent skill u i u x pro max, 而且它支持多种技术站,包括默认的 html 加 tailwind, 还支持 react next js, 甚至还支持 swift, react native, 还有 flutter。 想在 antigravity 中使用 ui ux pro max 非常简单,然后我们只需要按照官方给出的命令去执行就可以。我们直接先复制这条 npm 命令用于安装这个项目, 然后汇到 antigravity 中。我们直接在 antigravity 的 终端命令行粘贴这条命令并且运行就可以。好,这里安装成功。 下面我们就可以运行这条命令,针对 anti gravity 的 命令进行安装,然后在 anti gravity 的 终端直接粘贴这条命令并且运行就可以。好,这里提示已经安装成功。 在 anti gravity 中,我们只需要用斜杠命令就可以调出 u i u x pro max。 下面我们就可以来输入一个提示词。我这里输入的提示词是让它使用 react 构建一个 to do list, 要求使用拟物化的风格, 包括添加任务,完成任务,删除任务,而且还要具有柔和的阴影和微妙的紧身效果。然后这里我还是使用 jimmy 三 pro 模型,我们直接点击发送。像这样的话,在 anti gravity 中它就能够使用 u iux pro max 这个 agent skills 来获得 u iux 设计的经验还有最佳实践,从而为我们生成更加美观,更加现代化的 u i。 好 在等待了几分钟之后,这里完成了这个项目的创建,然后我们运行一下,查看一下效果。 可以看到这里他成功为我们开发出了这个你物的 to do list 的。 然后我们可以测试一下添加任务。注入这个任务之后,这里就会出现这个按钮,然后我们点击添加好,这里添加成功。然后下面的任务当完成之后,我们就可以点击完成,我们再添加一个任务测试一下。 好,这里添加成功,当完成之后,我们就点击完成。可以看到他设计的这个你物化的 u i 效果确实非常不错。 这样的话我们就实现了在 antigravity 中使用 u i u x pro max 这个 agent skills 项目实现 ui 设计。 agent skills 还有更多更实用的应用场景。 由于时间有限,本期视频只为大家演示了用于 ui 设计的 agent skills。 后续的视频中,我将为大家演示更多更实用的 agent skills 以及 agent skills 的 使用技巧和最佳实践。

codex 啊,已经超越了 cloud code 成为了全世界最热门的 ai 编程工具了,它之所以能够超过 cloud code 成为全世界最热门的 ai 编程工具啊,原因在于它的价格相对来说比较亲民,而且对于国内的用户是比较友好的啊,不像 cloud code 那 样经常被 封号,限流和降质。好,那么接下来这个视频呢,就带着大家从零到一的来搭建 codex, 并且在 codex 里面使用当前最火的 skill 来进行 ppt 的 生成啊。好,那话不多说,接下来咱 们就进入正文。好,那么首先呢,你要安装 codex 啊,这块给大家讲两种方式,一种方式呢,就是原生的命令行的这种方式来使用,另外一种方式呢,就是通过 vs code 的 这种 id 的 方式来进行使用啊。 好,那当咱们使用命令行的方式来使用 code x 的 时候呢,首先需要保证咱们本地已经安装了 node js 的 环境啊,如果你本地没有 node js 的 环境呢?好,这时候先去这个网站啊,然后去找到和自己系统相对用的 node js 进行下载安装就行了, 安装的时候呢,没有什么难的,一路下一步就行了,没有注意的事项啊,安装成功之后,这时候怎么样确定自己本地到底有没有安装 node js 啊?你在这输入一个 node, 然后杠 v 啊,如果它显示 note g s 的 版本,说明你本地已经安装成功了啊,那么这时候呢,咱们就可以使用这一行命令啊, npm install 杠 g 啊,全局通用的方式来安装 codex 了,复制它, 当然这个仓库呢,是 openai 的 官方的仓库啊,在它这个说明文档里面有相应的信息,那我复制这个信息,来到命令行窗口里面敲回,这就行了,这时候保持你整个网络畅通,它就可以很快地去安装 code x 了。好, 那么很快呢, code x 它就安装好了,但是要使用 code x 啊,我们需要有叉的 gpt 的 账号,并且我们的叉的 gpt 的 账号 要是 plus 用户才行。那这时候怎么样去注册账号,把账号变成 plus 用户呢?给大家去说一下。首先你去访问这个网址,官方的网址啊,叉点 d p t 点 com, 访问完成之后呢,在右侧有一个免费注册, 然后这个时候 ok, 你 可以使用谷歌账号,或者是使用你自己的邮箱,如果你没有谷歌账号的话,就使用自己的邮箱,然后继续下一步输入密码,然后注册就行了。然后注册完成之后呢,这时候把你的账号升级为 plus 用户。当你把你的账号升级成 plus 用户之后呢,这时候咱们就可以用指令来启动 codes 了。 好,那这时候呢,咱们在里面呢去输入 codes 啊,第一次的时候它会让你弹到这个页面上啊,让你先登录的。登 完成之后呢,那你的用户的授权信息就会加载到 codex 里面啊,那我就可以继续用了。好,那我这个时候我不是一邮箱啊,我是谷歌账号,应该是谷歌账号啊, 咱们来试一下。呃,申请账号的时候也要去保证你的。呃,网络啊,你的网络是 ok 的 才行。好,我这呢应该是这个账户。 ok, 点击继续。好。登录成功了啊,这时候呢,咱们切换到咱们这边啊,切换到这边好, ok, 那 么咱们的状态就已经是登录的状态了。 好,这时候大家可以看到啊,它默认的这个 model 啊,就是使用的是 gpt 五点二呃,控制器的 model 啊,那你要切换的话,你可以杠啊。 model, 敲回车,大家可以看到了,它现在呢有五点二的,这个是一个综合性的模型,还有五点一的啊,五点一 mini 的, 那我目前使用的是五点二啊控制器,那我就使用这个五点二就行了。 那么当你选定完模型之后呢,来到了这个页面了啊,这个页面是针对于这个模型的一个模式选择,它的模式呢?有路啊,有,呃, high, 呃,当然路的这种模式呢,它推理的能力不是特别好,但是它响应的速度非常快。呃,那么 high 的 这种模式呢,它推理的能力很强,但是执行的速度比较慢,所以通常情况下咱们选择第二个啊,中间的就 ok 了,然后敲回车。 好,那么这时候它就使用了最新的 j b t 的 模型来进行代码的编写了。好,那这时候咱们可以首先先进入到一个目录里面啊,进入到一个项目目录里面,然后在一个文件夹目录底下进行操作,当然在这个方底下去操作的话也也行 啊,那相对来说,你后面去找这些文件的话,不太好找啊。那好,那我这时候可以把它关掉啊,关掉,关掉完了之后呢? ok, 我 在我的桌面上去创建一个项目文件啊,项目文件呢,不要是中文的啊,最好是英文的,好起个名字,比如说我这儿呢,就叫做 my coders 啊,好,然后进入到当前的页面里面之后呢,在当前的文件夹里面 c、 m、 d 啊,来去启动命令行,然后完了之后呢?还是啊首先我要去启动我的 coders。 好, 那么第一次登录完成之后呢,以后就不需要去登录了啊,我现在所有的这个操作的话,都是在当前的这个文件夹底下进行相应的一些操作的。好,那这时候比如说我想要让他去生成一个页面的话,我是直接可以给他指令让他去生成的啊。好,比如说我让他去生成 啊,生成一个呃美观的登录页面啊,然后呃页面的名字咱们可以给它规定一下,比如说叫做 log in 点 html 啊,咱们先让它来完完成一个基础的一个工作, 咱们先来看一下它生成的一个质量啊,等这个页面儿做完之后呢,给大家来演示一下怎么样去安装呃 skills, 然后来完成一些扩展工作啊?那什么是 skills 呢?在它生成的这个时候呢,刚好给大家去讲一下 skills 啊, skills 呢,其实它就是给你的 ai 员工 去安装一个员工手册,有了这个员工手册之后呢,那么他每次在执行任务的时候,会按照预期你给他指定的方式来稳定的执行任务,并且在 skills 里面你可以做一添加一些扩展工具,那这时候就可以去增强咱们大模型的能力了啊,所以总体来说你可以认为它是一个 升级版的一个提示词啊,但是在这个提示词里面它有三部分,这个咱们前面讲过了,它有原数据啊,它有提示词啊,我任务应该怎么样去执行的?那么还有一个就是资源包,在资源包里面可能会有一些工具啊,然后我再去执行一个任务的时候,我按照提示词的方式 一步一步来进行,稳定地去执行,然后有一些任务可能需要去调用一些啊, python 文件去完成的,那就去我的这个资源文件里面去调用,去执行。所以说呢,那个 skills 啊,它本身是一个让大模型能够按照预期的方式去执行的一个 技能啊,然后在这个技能里面我可以有一些插件啊,这就是 skills 它本质的东西啊。好,那么这时候呢,它已经生成了,然后问咱们是否同意?呃,写入。好,这时候咱们去同意啊,那么它就可以把刚才生成这个代码呢,然后进行写入了。好,那么写完了之后呢,接下来咱们来看一下。 ok, 在 这个 呃,项目的目录里面呢,就有 logan 的 html, 然后咱们看一下生成的效果如何啊?双击好啊,生成的效果呢?整体来说还不错啊,是吧?还不错啊,当然你可以有一些样式问题的话,你还可以让它继续让它追加啊,让它进行修改也是没有问题的啊。 好,那么咱们,呃基础的功能用完之后呢?那这时候怎么样去给当前的 tools 去安装 skills 啊?给大家来说一下,那么安装的话,咱们首先先要去找到你要去使用的 skills 啊,自己去写的也也可以啊,那么刚开始学之前呢,可以先用别人的。好,那么 astropica 本身是有 skills 的 啊,然后大家可以去这个网站,然后去访问 abstract 它底下这个 skills, 然后,呃,在它这个 skills 目录里面有很多的 skills 啊,其中有一个是关于 ppt 生成的对吧?它还有 pdf 啊, 还有关于 converse 啊等等啊这些,那我这个时候, ok, 必须,比如说我现在要去安装这个 ppt 生成的 skills, 那, 那我就好访问它的这个目录,对吧?啊,复制这个地址,然后回到咱们的这个 mini 行里面啊,然后咱们使用 skills insert, 然后加上那个地址啊,就可以进行安装了,那么也就是这行命令啊, double 符,对吧?啊,你要执行 skills 的 insert 安装了,那然后安装哪个 skills 啊?就是安装这个 skills 就 可以了。好,这时候咱们去敲回车,还是一样啊,同意它进行写入啊。好,那么呃,经过短短的 十几秒之后呢,它就把这个 skills 去安装到呃 coders 的 啊全区目录里面了,所以咱们在 以后任何一个项目里面都可以去使用这个 skills 的。 好,这时候呢,那我就可以去呃问他啊,你包含哪些 skills 啊,那这时候他就会去查询自己的这个 skills 啊,到底有哪些。然后啊,这块呢,大家可以看到里面的这个 ppt x 就是 刚才咱们已经安装的 skills 了啊,但 skills 的 话,这种是在线安装的方式,咱们直接给他输入一个地址,让他去去安装的啊,当然你也可以通过 呃离线的方式手动去下载,然后把它放到文件夹里面,或者是放到全屏目录里面啊,这两种方式都是可以的。那么离线的方式呢,咱们在呃 jamaican 之前的视频里面讲过啊,这块咱们就不说了。好,那我这时候要让它去生成一个。呃, ppt 的 话, skills 的 话,那我就用命令的方式来去告诉它就行了。好,这时候呢,比如说我让它呃,生成, 生成一个关于,然后写主题,对吧?呃,什么是 skills? 什么是 skills 的? 呃, ppt 要求极简风格 啊,其他就不用去输了啊,这块简单给他一个描述就行了。当然啊,如果是生产级别的话,建议大家是 词啊,越多越明确,那么它执行的效果可能是越好的啊,咱们这测试的话,可以简单来写一下。好,这时候咱们来敲回车。好,当咱们去敲完回车之后,其实咱们是可以看到的,它目前是使用。呃,它上面写的,对吧?它用的是 ppt, 呃, skills 啊,然后来去执行咱们的任务的 啊,咱们从网址里面是可以去看到的。好,然后他问咱是否去创建这样的一个 ppt 文件啊?好,咱们点,呃,回车啊,这时候呢,他就开始去创建了。好,然后咱们继续敲回车。 好,那么经过四分钟的执行之后呢, ppt 已经生成好了啊,然后这个时候咱们来看一下生成,呃,最终的一个 ppt 啊。好,咱们来打开看一下,什么是 skills 啊?然后确实挺极简的是吧? 呃,然后是把附用的流程封装成可以调用的能力啊,这个介绍的话还是很 ok 的 啊,然后定义然后它的组成是吧?啊?组成就三部分吧。呃,原数据,然后它的 prompt, 然后它的 scope, 它的这个,嗯,执行的脚本啊,然后最后呢写它适用的地方啊,和它本身 scope 的 价值是啥,对吧?好, ok, 那么大家觉得生成的这个 ppt 质量如何呢?可以评论区留下你的宝贵意见啊。好, ok, 那 么这样的话,咱们的呃命令行的 codex 就 安装好了, skills 呢也安装好并且使用了。好,那如果我想要在 id 里面去用,怎么用啊啊?首先当然啊,咱们需要去呃官网去安装 呃这个 vs code 的, 直接搜索 vs code 的, 然后下载安装就行了啊,安装完了之后呢,这时候呢,在扩展工具里面啊,然后点击扩展工具,然后可以去搜索 open ai 或者搜索 codes 啊,都可以了。好,这时候呢,第一个就是 open ai 官方提供的插件,然后点击安装就行了啊,如果说你本地像我刚才一样已经通过 note g s 的 方式在命令行安装了 codes 了, 那这时候来到 v s code 里面是不需要任何配置的啊,这时候它是可以去共享 codes 命令行进行使用的。好,那么安装完成之后呢, ok, 咱们就可以打开项目啊,打开文件夹,文件夹呢,其实就是咱们 桌面上的这个项目,然后去选择它,然后选择完它之后啊,大家就可以看到了。 ok, 这边就是咱们刚才去执行 codes 的 命令啊,它已经完成了,对吧?然后咱们就可以在啊这个里面啊,这个命令里面上一个绘画命令里面继续来 进行相应的执行了。那么 a d e 相比于咱们的呃命令行窗口,它的优势是啥?它的优势是你可以直接去打开这个文件来看这个文件,而且呢在它里面去执行一些命令的时候,你是可以进行一些回滚操作的啊,然后并且 它进行截图上传的时候是比较方便的,比如说我现在啊,我要让它去复现一个页面,是吧?啊,那我就复制一下,然后 ctrl v 在 这进行粘贴一下就行了,粘贴完之后呢,那我就去写西安的需求,写完之后,那么执行是和咱们在命令行窗口这边执行是 一样的啊,那比如说咱们的这个登录页面,我想让登录页面的这个颜色变成极简的白色啊,那我就可以在基础上去呃,去去去,告诉他啊,这时候呢,咱们就输啊,将将呃 login 点 html 背景换为极简的白色风格啊,然后完了之后, ok, 底下这些设置呢,不需要去动它,这就是咱们命令行的设置嘛。 啊,使用最新的模型好,然后这时候去发送好,然后在 id 里面呢也能看到它的修改啊,它从原来的,这是上面啊原来的,然后加了一些什么内容啊?我可以允许这次的执行或者是原词此次绘画的所有的执行啊,那我就去选择就行了 啊,那么到这儿,呃,它的 login 就 已经修改好了,然后并且有修改的行数啊,然后这块呢,你可以进行回滚啊,可以进行回滚操作,这就是 id 它的优势啊。好,那这时候咱们打开 页面, ok, 已经变成极简的白色了,对吧?好,这时候如果说,哎,你不是满啊,很满意哎,我就需要之前的那个啊,那我这时候就可以撤销啊,回滚到上一个版本了。那么到这咱们关于 codex 的 两种使用方式以及 codex 加上 skills 的 演示呢,就给大家执行完了。我是磊哥,咱们下期内容再见。

在 oslopec 发布 agent skills 两个月之后, openai 现在终于支持 agent skills 了, 现在我们就可以在 codex 的 最新版中使用 agent skills。 同时 openai 官方还发布了 gpt 五点二 codex 模型, 我们只需要确保 codex 已经升级到最新版,然后用斜杠命令加 model 就 可以查看。 g p t 五点二 codex 模型我这里选择的它的推理级别,选的是 high, 这里也支持 extra high。 通过我一上午的使用发现 g p t 五点二 codex 模型它最大的缺点就是速度太慢了,像一个简单的任务,它可能需要耗费五分钟甚至更长时间。 本期视频我们将在 codex 中测试一下 agent skills 的 使用方式以及效果,并且在 codex 中重点测试 gpt 五点二 codex 模型的编程能力。 好视频呢,开始我们可以先简单回顾一下 agent skills。 对 于不了解 agent skills 的 用户来说,我们可以先通俗地讲解一下什么是 skills。 aging skills 的 本质就是把人类的专业知识还有工作流程用机器可以理解的方式固化下来,让 ai agent 呢能够稳定可控可附用的来执行任务, 这样的话就能将 ai 从聊天助手变成了可控的工程工具。我们可以将没有使用 skills 的 ai 或者 ai agent 呢理解为一个非常聪明但没有经过培训的员工, 每次布置任务都需要口头讲一遍规范。有了 skills 就 相当于给员工配备了工作手册,所有流程和规范都写在 skills 里面, ai agent 就 可以随时翻阅。比如说我们在让 ai 写测试的时候,如果没有 skills, 每次我们都要告诉 ai 帮我写测试,要使用 test 覆盖率达到多少以上,命名规范是怎样的,每个测试都要怎样怎样,然后 ai 就 会按照我们的提示词来写测试。 当后续我们再要求 ai 来写测试的时候,我们还需要重复一遍之前所用到的提示词,像这样的话非常浪费时间。但是有了 skills 之后,我们可以将测试做成 skills, 也就是将所有的测试规范脚本还有模板都放入 skills 文件中。当给 ai 配置好这个 skills 之后, 我们再需要测试的话,直接告诉他帮我写测试,那么 ai 就 会完全按照这个 skills 里的这些测试规范脚本还有代码自动为我们执行测试。相比 mcp agent, skills 非常节省。 token, 当启动时只加载 skill 的 名称和描述,而且可以根据任务自动匹配。 而且 skills 在 执行时才会完整地加载 skills 里的所有内容还有附属资源。所以有了 skills 的 支持,我们就可以为 codex 增加各种技能以及增加各种知识。在 codex 中使用 agent's skills 非常简单。 首先我们要确保将 codex 升级到了最新版本,然后我们再用命令打开 codex 的 配置文件。 在 features 这里我们要将 skills 设为 true, 下面这里还给它设置了权限,这些设置好之后,我们直接保存并且关闭就可以。然后我们再启动 codex, 再使用斜杠命令来查看 skills。 这里有自带的三个 skills, 这个 pptx, 还有这一个都是我手动安装的。 想安装 skills 非常简单,我们只需要选择这一个 skills, 在 后面我们就可以输入 skills 的 仓库链接,比如说我这里使用 oslopec 的 skills 仓库,我们可以进入这个文件的路径,这里面就列出了非常多的 skills, 比如说我这里找一个前端设计的 skills, 然后直接完整地复制它的链接,再回到 codex, 我 们直接粘贴这个链接,直接运行就可以,它就会为我们安装我们刚才选择的这个 skills。 这里安装成功,我们只需要重新启动一下 codex, 就 可以看到我们刚才安装的这个前端设计的 skills, 然后我们就可以选择这个 skills。 在 后面我输入了提示词,开发一个登录页的 ui, 可以 看到这里它读取了 skill 点 md 文件,这里提示它使用前端设计的 skill 完成了登录页的 ui, 然后我们打开这个页面看一下效果, 打开之后我们就可以看到这个登录页设计的非常不错,非常美观。下面我们还可以测试一下,让它为我们制作 ppt, 然后我们输入命令,找到做 ppt 的 这个 skill。 我 输入的提示词是把这篇关于介绍 agent skills 的 文章做成十页的 ppt。 受众是开发者,风格是极简,深色,语言是中文,这里是要输出的文件名, 这里就是介绍 agent skills 的 文章链接,也就是这一篇文章,然后我们直接发送,好在等待了几分钟之后,它终于制作完成,然后我们打开这个 ppt 看一下效果,它确实制作了十页 ppt, 可以 看到它制作的这个 ppt 效果还是比较不错的,完全符合我们要求的深色极简风格,并且用中文介绍了 agent skills。 下面我们就可以在 codex 中测试 gpt 五点二 codex 模型的编码能力。 在测试之前,我们可以先看一下官方给出的 gpt 五点二 codex 模型的基准测试。在 swebench pro 这个基准测试中, gpt 五点二 codex 达到了百分之五十六点四,超过了 gpt 五点二以及 gpt 五点一。在另一个基准测试中, gpt 五点二 codex 也超过了 gpt 五点二以及 gpt 五点一 codex max。 好, 下面我们开始在 codex 中通过几个案例测试一下 gpt 五点二 codex 模型它的真实能力到底怎样。 好,下面我们准备一张 ui 截图,然后让 codex 为我们复刻这个 ui, 然后我们看一下它复刻的 ui 效果怎么样, 然后我们就可以输入提示词,用最适合的前端技术复刻这个 ui 页面后面我们就跟上这个图像,然后直接运行。在这里可以看到它调用了前端设计的 skill, 在 等待了十九分四十五秒之后,它终于为我们完成了这个 ui 的 复刻。 复刻这个 ui 的 耗时真的太久了,我们如果用 cloud code 的 话,基本上不到一分钟就能复刻完成。然后我们打开看一下它复刻的效果, 可以看到它复刻的这个 ui 总体还算可以,然后这些表格内容跟原图相比效果还算可以。它复刻的第二个表格跟原图相比的话,确实非常不错, 它基本保持了原图中的这些布局,还有样式。好,接下来我们再用一个非常简单的智能体框架转换题来测试,让它将微软的智能体框架 out 站编写了一个旅游智能体的简单代码, 重构为谷歌的 adk 智能体框架。可以看到这个旅游规划的智能体代码非常少,甚至不到一百行,但是我们上次在测试 gpd 五点二的时候,它没有实现将这个智能体代码非常少,甚至不到一百行,但是我们上次在测试 gpd 五点二的代码非常少,甚至不到一百行,但是我们上次在测试 gpd 五点二的代码非常少,甚至不到一百行,但是我们上次在测试 gpd 五点二的代码。 好,下面我们可以看一下这个提示词,先让他阅读谷歌 adk 的 官方文档,然后告诉他将这个旅游规划的智能体代码重构为谷歌 adk 框架的智能体代码, 要求保持原有智能体的逻辑和功能,并未重构后的智能体加入 ui 操作界面。然后下面这里就是刚才我们查看的不到一百行的旅游规划的智能体代码。我们直接完整地复制这个提示词,然后粘贴到 codex 并且执行。 像这个简单的任务,我们就直接用 web 扣领的方式让它直接阅读文档和代码,并且直接进行改写。 像这个测试题可以测试 gpd 五点二 codex 模型的信息解锁与文档理解能力,还有代码理解与分析能力,以及跨框架迁移,还有重构能力,还能测试多任务协调能力。所以这个题目用来测试 gpd 五点二 codex 模型还是非常适合的。在等待了九分五十三秒之后, 他终于完成了将旅游规划智能体的框架重构为谷歌 adk 框架。下面我们就按照他给的步骤运行一下这个项目,打开之后我们看到了这个 ui 界面,然后再输入框,我们就可以输入任务,让他规划三天的尼泊尔旅行,我们直接发送。 下面我们看一下这个智能体的执行步骤,还有结果是否正确。首先是输出的三天的尼泊尔旅行的一个简单计划,第二部分是当地特色,还有深度体验, 这个是没问题的。然后第三部分,它给出了一个最终的旅行规划,在微软智能体代码中,这里还包含这个当地的语言专家会给出当地的这些常用语, 但 gpt 五点二 codex 它改写后的这个代码就缺少了语言专家这个智能体。所以这个测试题虽然它耗时将近十分钟,但它并没有复刻微软的这个旅行规划智能体所有的执行流程还有逻辑。 好,下面我们准备一个更加复杂的开发项目,让他开发一个 ios 原声背单词应用,这里给出了应用名称,目标用户。这里是具体的技术要求,而且要遵循 mvvm 架构模式,并且使用 swift data 进行数据持有化,还要实现单词发音功能, 还支持深色浅色模式。这里是具体的界面结构,包括首页练习,还有进度还有设置。下面这里就是核心的功能,包括单词卡片, 还有发音功能,还有收藏等。这个测试题我用来测试 cloud code, cloud code 能一次给出完全可以正确运行,而且包含所有功能的代码。在开发之前,我们先用 x code 初步化一个项目,这里我们就选择 ios, 选择 app, 下一步这里我们就输入项目名称,然后我们选择一个文件夹, 然后我们打开终端命令行,切换到刚才的路径,再打开 codex, 我 们先用 edit 命令让它来创建 agent 文件,这样的话它就能学到我们部署化后的这个项目的这些内容。好,这里运行完成耗时将近两分钟。 由于这个测试题目比较复杂,所以在 codex 中我们可以先让它为这个开发任务制定计划,我们直接调出它的计划模式,然后粘贴这个提示词直接运行,先让它根据我们的开发需求来制定一个完整的计划。 好,可以看到这里它调用了制定计划的 skills, 它这里只耗时四十八秒就完成了计划的制定,这个速度还是非常快的,然后这里它询问是否需要调整细节,第二个就是直接实现,第三个就是保存到这个目录,然后我们这里就让它根据计划直接实现。 由于这个项目比较复杂,它开发估计需要非常长的时间,我们直接略过这个开发步骤,直接跳到它开发完成的步骤,这里耗时将近三十三分钟,终于完成了这个项目的开发。下面我们在 xcode 中测试一下这个项目能否正常运行, 我们先点击运行,看一下能否正常的翻译好,这里提示报错,然后我们直接先复制一些报错发给他,让他来修复,这里修复完成,我们再测试一下。好,这里提示翻译成功。 好,这里又出现了报错,然后我们将报错发送给 codex, 这里提示修复完成,然后我们再运行一下,看一下这次能否正常的执行,然后还是出现了报错,我们还是让他来修复 好,这里提示修复完成,我们再运行这里,还是报错,我们还是发送错误给他,然后我们再运行, 还是出现报错,我们还是让他继续修复好,这里修复完成,我们按照他的提示清空一下模拟器,然后我们重新运行好,这里终于能正常打开这个 app, 但是这个界面竟然是英文的,他没有用中文的,可以看到这里可以正常做练习,这里终于加载出了单词, 可以正常翻转 line, 可以 听到能够正常播放声音。下面我们让 cloud code 分 析一下他开发的这个项目是否遵循了我们提示词中的 mvvm 架构模式, 然后我输入提示词,检查这个项目是否符合 mvvm 架构模式,直接发送 cloud code 很 快输出了回答,我们看一下他说这个项目部分符合 mvvm, 然后这里提到了所有代码都在这个文件中,约两千多行。然后我们在 xcode 中查看一下,可以看到这个文件中的这些代码真的达到了两千多行。然后这里就是需要改进的地方,应该拆分为多个文件,并且这里给出了典型的 mvvm 势利。 通过 cloud code 的 分析,我们就发现了这个非常不应该存在的问题,它将两千多行代码都放在了这个文件中,这是非常不应该的。好,通过测试可以发现 g p t 五点二 codex 它确实相比之前的 g p t 五点一有了一些提升。


大家好,欢迎来到本期科技快报,今天我们来深度探讨 openai 的 最新代码工具 codex。 这个工具不仅可以帮助开发者自动化代码编辑,还能优化测试和重构等流程,大大提升工作效率。 codex 是 一款由 openai 推出的编码助手,专为开发者设计。通过 c l i i, d e 扩展以及云端环境, codex 能够帮助开发者处理繁琐的常规任务,让他们有更多时间专注于设计和架构等复杂挑战问题。 在本期播课中,我们将为大家提供 codex 的 高层次介绍。首先是如何安装和设置 codex, 然后介绍 agent steer md 文件,这是 codex 快 速获取项目上下文的关键。接着探讨如何通过 c l i 和 ide 操作 codex 以及最佳实践提示。有报导指出, codex 让开发者能够快速完成代码审查和寻找 bug 的 工作,还可以用于自动编辑代码以及生成测试用力。开发者甚至可以通过自定义 m c p 的 接口,让 codex 连接到 j r, figma 或 data dog 等工具中,为生产环境提供支持。 如果你是初学者,可以尝试从小任务开始,比如让 codex 为你的项目生成文档,寻找并修复 bug, 或者增强测试覆盖率。同时你还可以让它重构多个文件,提取组建的通用代码。 对于更高级的用户, codex 幺二还支持无界面操作,能够用于流水线集成和复杂的自动化程序开发。例如, codex 可以 被用来自动进行代码审查,并在检测到 c i 错误时深层修复的 pro request。 还可以根据新创建的问题自动添加标签来帮助团队分配优先级。 最后提醒一下,企业开发者和管理员还可以利用专门的指南,包括企业管理员手册、安全指南和 codex 使用账单说明书,帮助团队更好的管理和利用这款工具。希望今天内容对您了解 codex 并提高编程效率有所帮助。感谢您的收听,我们下期再见。

用 cloud 官方 skill 三步生成文字可编辑和风格可配置的 ppt。 首先从 github 下载官方 ppt skill, 放到这个目录,我用的是 codex, 其他工具放置目录请参考截屏。 第二步,准备好 ppt 内容素材和模板,最后打开 codex 斜杠 skills, 调出制作 ppt 的 skill, 输入如下提示词,生成 ppt 生成的 ppt 的 确可编辑。

上周 openai 它刚刚 release 了一,那个就是 codex, 就是 codex, 它把那个 skill 的 功能放在 codex 里面,它目前也已经实现出来了, 这个项目也是开源的。 openai 的 这个应该也是不错的,这个写代码里面它是属于第一阵营的。这个 openai 的 这个 codex 跟 cloud code 的 牛的一拼,目前它也能够支持 skill 的 这个功能,谷歌也可以的。 这个都是他们大厂必加、兵家必争之地,这个都很强,他们会投入大量的资源和精力在这个上面去竞争的,因为他是一个超级入口,我们 ai 写代码的,他的这是他们这些工具都是一个超级入口,所以他都要去抢的。

大家好,我是 kate。 最近呢 skills 比较火,我呢,早在 ossopek 正式推出 cloud skills 之前,就在官网上发现他当时已经用到 skills 来做报告表格, ppt。 后来我还专门出了一期视频,详细介绍了 crowd skills, 我 呢,当时找到了啊 episodic 官网上所有关于啊 skills 的 文档,然后做了一期详细的视频,其中最重要的一篇呢,就是 skill 的 编写最佳实践, 待会我会再带大家回顾一下这篇最佳实践。我们看现在很多 ai 编程工具呢,都有用到 skills, 大家可以在这里截下图。 crowd 的 skill 呢,最先推出来的它的项目级还有它的用户级配置呢,是非常好记。 而呃 curser 也是比较好记的,因为它前面呢都是 curser 的 这样一个目录。而 open code 呢,我们看到这里会稍微有点区别。 在用户级别的话,这里有一个点 configure。 谷歌呢,它既有 demo c o i, 还有谷歌的 anti gravity 啊,这两者稍微有点区别,大家可以了解一下。今天我将介绍一些呃 skill 好 用的工具和一些好用的 skill。 首先介绍的是 versa 最近开源的 adskill, 它呢非常好用, 支持多个平台,我们看这些主流的平台它都支持了,现在呢,我来演示一下。在中端里输入命令, 它会呃克隆一下仓库,可以通过空格来进行选择。那我先安装一个 web design 呃 guidelines, 再接着它呢,是有多个 ai 编程工具默认选择, 那我假设我这里只要安装啊 open code, 那 我就可以将其他的通过空格呢都取消, 接着选择 enter, 接下来还可以选择是项目级别的还是局,那我选择局,让它进行一个安装,最后安装好呢,它会告诉我安装到哪里了,点开之后就会看到左侧这样的一个 scale 文档,它支持多种方式安装, 你可以直接呃给到这样的一个仓库名称,或者是完整的 gitlab url, 那 你也可以给它非常详细的直接的目录,而且呢,它支持多个快捷参数。有一个 skill 的 市场,它呢是收入了六万多的 skill, 大家有兴趣的话可以在里面看一下, 我个人比较推荐在 gitlab 里面呃,搜索你想要的关键词加 skill, 会有一系列的仓库, 你呢就可以啊,仔细观察看看有哪些比较适合你。再来推荐几个最近非常好用的 skill。 第一个是 versa 最近推出来的 agent skills, 它将 react 的 最佳实践,多年的一个经验 都放在这个 skill 里面了。第二个呢,是啊, expo 最近官方开源的 skill, 可以 帮助你去构建调试 expo 应用。第三个呢是上下文工程管理的 agent skill, 这些都是值得大家花时间去探索的。还要推荐一下 hackin face 的 skills, 它呢是针对啊 ai 还有机器学习的任务,可以帮助你下载模型数据集, 模型评估,可以帮助你训练微调模型,构建脚本等等。 obsidian 的 ceo 呢?最近推出来的 obsidian skill 也非常好用, 它推出来的三个 skill 里面呢,有一个是呃,是关于 jason canvas skills 的, 可以帮你生成非常好看的画板内容,如果你是做苹果相关的开发的话,一定不要错过这样的一个 skill, 它呢,这里内容特别多,基本覆盖了苹果开发的方方面面, 非常详细,绝对是让你事半功倍的。再来看一个非常特别的 skill 工具,它呢,可以将文档网站 get, 把仓库还有 pdf 转化成呃, crowd skills, 它可以自动抓取多个来源,然后深度分析, 检测冲突,最终组织文档。即使是简单的 skill, 我 也是非常推荐大家下载下来。呃,让 ai 运行之后,要盯着看它的 skill 运行中出现了什么问题, 要根据你电脑的一些实际情况,或者你自己的一个实际需求,让让 ai 帮你去啊更新 skill。 比如说我从网上下了一个 youtube 登录的 skill, 它的 skill 里文档里呢,写明的保存路径呢是 mnt。 虽然说每次 ai 它跑到这里呢,它识别出这个路径只能只读不能保存,它会想办法将下载后的文件呢改放到别的路径里去。但是这样的话,对 ai 来说的话,第一浪费它的 token, 第二的话,嗯,处理时间也会增长了。 所以的话,呃,需要你去观察一下这个 skill, 然后你就可以提示它让它去修改。呃,你你喜欢的一个路径,修改后的 skill 的 话,是会更匹配你的需求。再看一下官方 skill 啊编辑最佳实践 会,可以让我们的 skill 写得更好。第一个原则呢是简洁是关键。我们在做一个新的 skill 之前, 默认假设呢是 cloud 已经非常聪明,关于 pdf 的, 那 cloud 肯定知道 pdf 是 做什么的,它有哪些工具,就不需要再跟它解释一下用哪个库来处理。第二原则是设置适当的自由度, 我们可以使用一致的命名模式,让 skills 更容易引用和讨论。缩缩略官方建议是将 skills markdown 文件正文保持在五百行以下。缩缩略是建议避免深层嵌套的参考, 保持参考一级深度。所有的参考文件呢,直接从 skills markdown 链接,以确保 crowd 在 需要的时候读取完整文件。对于超过一百行的参考文件呢,在顶部包含目录。对复杂任务呢,使用工作流, 先是指示它复制,然后这里有个任务清单,给到代班事项之后。步骤一,什么步骤二三四五最好最有效的 skill 开发流程呢?就是和 cloud 一 起迭代开发。 先要求 cloud a 创建一个 skill, 审查它是否简洁,还可以让它改进信息架构,之后使用 cloud b 在 相关用力上使用这个 skill, 然后观察 cloud b 是 遇到困难或者遗漏了什么,再返回让 cloud a 进行一个迭代。我们可以观察 cloud 如何导航 skills, 它是否以你没有预料到的顺序读取文件,错过一些重要的参考,还有对某些部分的过度依赖,或者是忽略一些内容。即使是在 windows 上面的话,也是要改成 这种正斜杠,除非必要,不要给他太多方法让他选择这下方呢,有一些有效 skills 的 检查清单, 对于不需要代码的 skills 呢,我们可以提供一个清单 code, 可以 将它复制到响应中,并且进行检查, 让他研究。还有一个原则非常重要,就是让他创建可验证的中间输出,这是一个示意,先是给他了一个脚本,让他去做一个提取,然后呢提示他这样的一个输出。 还有一些小细节非常重要,你对确定性操作呢?优先使用脚本,如果你的 skill 使用 mcp, 那 就要在 skill 里面去设置一下,让他要找到工具。 我们看这两个例子呢,左边它其实都是 m c p 服务器的名称,右边是这个 m c p 对 应的工具,将它们这样连接起来,这样它就不会出现找不到工具的错误。还有个细节是避免假设工具已安装。

上期视频我为大家演示了在谷歌 antigraphy 中 agent skills 的 基础用法。 视频发布后,很多朋友在问 agent skills 是 否有更高级的玩法,从而能够提升开发效率,答案是肯定的,而且效果非常不错。本期视频我将为大家演示 agent skills 生态中被开发者称为灵魂技术的核心技巧,决策树。 本期视频我们要讲的决策树不是机器学习里的那个需要训练数据的算法,而是一种需要在 skill md 文件里嵌入结构化的 if else 决策逻辑,让 anti gravity、 cloud code code、 x c l i 等 ai 智能体在执行任务时具备真正的自主决策的高级能力。 因为我们在用 anti gravity 还有 cloud code 执行特定任务的时候, ai 编程助手经常问下一步该怎么做,让原本应该自动化完成的工作流变成了人机问答。而决策树就是解决这个问题的终极方案。 根据 osoup 官方文档, agent skills 是 通过 markdown 文件教会 ai agent 如何完成特定任务,而 而决策式优化就是在这个 markdown 文件中显示定义条件、分支、优先级排序还有异常处理,从而让 ai 编程助手能够自主判断,自主选择最佳方案,从而减少百分之五十到百分之八十的手动干预,能大幅提升 ai 编程助手的智能度。还有任务完成效率。 为 agent skills 实现决策术,这是目前社区公认的最强大的 agent skills 的 高级技巧。而且本期视频为大家演示的技巧不仅适用于 anti gravity, 还适用于 cloud code, 还有 codex 等任何支持 agent skills 的 ai 编程助手, 而且我会用一个我亲自开发的使用决策术方式实现代码审查的 agent skill 进行演示。 这个 agent skill 叫 code review root, 它能让 anti gravity 等 ai 编程助手智能判断我们的代码变更类型,然后自动路由到最适合的代码审查工具。在这个 skill 中,我添加了 gemini c l i 以及 codex c l i, 然后 ai 编程助手就会根据任务的复杂度来自主决策,是选择 gemini c l i 还是选择 codex c l i 用于代码审查。 因为平时我们在进行项目开发的时候,大家经常习惯使用 codex 或者 java c l i 对 我们使用 cloud code 或者 anti gravity 写的代码进行代码审查。 由于 codex 进行代码审查的时候速度非常慢,所以对于复杂的变更或者后端技术栈,大家才会选择 codex 进行代码审查。而写前端代码的时候,更适合使用 java 进行代码审查。让 ai 编程助手自主判断是使用 java c l i 进行代码审查还是使用 codex c l i 进行代码审查。 像这样的话,就不需要我们手动去干预或者手动去确认让 anti gravity 或者 cologne 的 自主决策选择哪个工具。像这样的话,不仅能让代码审查更加专业,还能解决一个非常令人头疼的问题,那就是所有任务都用 anti gravity 内置的这些模型去实现, 这样就会非常消耗 antigravity 的 token 额度。但我们如果将一些任务分配给 gemini c l i 或者 codex c l i, 像这样就能实现大幅度节省 antigravity 的 用量。 在视频开始前,先为大家简单讲解一下什么是决策术,以便让不懂编程或者不懂机器学习的用户能够理解我们为什么要在 agent skills 中使用决策术的方式。 简单来说,决策树就是通过层层的 if 占条件判断,从根节点到业节点逐步筛选,最终得出确定性决策结果的树状逻辑结构。 在这里我举了一个最简单的例子,以便大家能够理解。根据天气预报是否有雨进行决策。当天气预报预报有雨的时候,判断是否会下大雨,如果下大雨,那么就带雨伞,如果不下大雨,那 那么就带折叠伞。如果天气预报预报的没有雨的话,那么就可以根据外出时间进行判断。外出时间长的话可以带一件外套,外出时间不长的话,那么就不用带任何伞,也不用带外套。 好,这是一个最简单的决策树的案例。好,下面为大家演示一下我们在 antigravity 中使用我创建的这个用于代码审查的具备决策树能力的 agent skill 的 效果。 将这个 skill 放在了项目路径,因为无论是 anti gravity 还是 cloud code 还是 codex, 它们都优先加载项目路径下的 skill。 因为这个 skill 是 用于代码审查,所以我们让它在我们当前这个已有的项目上让它添加一个功能,以便测试这个代码审查的 skill 它的效果。 这个当前项目是我开发的一个库姆浏览器的插件,这个插件的功能就是一个定时任务的功能,然后我们可以点击这个插件的图标查看一下这个插件的功能,这是我设置的定时任务, 当时间到了我设置的这个时间之后,它就会自动打开我设置的对应的目标网站,然后在目标网站根据提示词来搜索与 ai 相关的这些新闻。比如说我设置的这个定时按钮,让它立即来执行, 然后我们可以测试一下我这里点击执行,点击之后它就打开了我设置的这个 grok, 然后在 grok 中自动输入了我给他预设的提示词,然后 grok 就 会根据任务来搜索这些相关的 ai 资讯。 在这个库姆插件中,我们可以看到这里有这个日制功能,然后我们可以让它新增一个点击这个日制就会在库姆浏览器中自动打开这个 ai 的 对话记录, 所以在 anti gravity 中我们就可以输入我们要实现了这个任务,我输的提示词是为这个 chrome 扩展。新增一个点击日期中的条目,就可以在浏览器中打开对应的任务记录。然后这里我还给它举了一个例子,在模型这里,我们这里就选择 cloud 三点五,然后我们点击发送。 当它完成这个功能新增之后,我们就可以测试这个代码审查 skill 的 效果。好,这里它开始修改这个代码,这里我们要稍等一下。好,这里提示这个功能已经完成,下面我们就可以调用这个 agent skill 进行测试。 为了方便调用,我将这个 skill 做成了斜杠命令,我们直接输入斜杠,这里就会出现这个 review, 然后我们直接选择这个 review, 直接点击发送就可以。好,这里它就提示它将使用代码审查工具进行审查好,可以看到这里它正在决策到底是使用 java 还是使用 codex 进行代码审查。 好,这里提示它现在分析复杂度,并且执行审查。然后这里是代码审查路由分析,这里检测到更改,包括九个文件, 他对代码更改的复杂度给出了一个评分,然后十分,给出了三分,也就是比较简单,更改的代码数小于三百行,因为这个代码变更的复杂度非常小,所以这里他就给出了决策,他要使用 java c r i 对 变更的代码进行审查。纯前端 js 更改,复杂度低, 无敏感代码,无数据库或 api 更改。然后这里正在执行审查。为了检测这个代码审查的 skill 它的智能程度,当它开始调用 java c l i 的 时候,我就将网立即断掉了, 然后这里它就开始提示 java c l i 遇到了错误,现在它需要使用 codex c l i 作为备选方案,然后我们这里就允许它执行。 像这样的话,它能根据代码的复杂程度智能地选择使用 java 或者 codex。 当它选择 java c l i 出现网络问题之后,它就开始选择 codex c l i 作为备选方案, 这样的话它就能通过决策树来智能地选择对应的代码审查工具。这里提示 codex 审查完成好,这里输出了这个审查报告,然后这里给出了一个性能问题, 这里还给出了一个安全问题,这里还给出了建议修复,下面我们就可以在输入框中让它根据审查报告对代码进行修复,然后我们直接点击发送, 像这样的话,我们就实现了在 antigrip 中,通过斜杠命令来智能地调用 java c l i 或者 codex c l i。 对这些变更的代码进行审查,就能让我们的项目代码变得更加完善,更加稳健。这里生成了修复总结。下面我们回到 chrome 浏览器中测试一下。在 chrome 浏览器中,我们让它再次执行一下这个任务, 这里它自动输入,并且自动点击了发送。好,这里谷 rock 正在执行,我们看一下它是否记录到了这个对话。我们点击日制, 在当前这个日制,这里就有这个查看对话。好,下面我们就可以详细看一下我创建了这个 skill, 它是如何实现决策数的。 我们可以先看一下这个代码审查 agent skill 它的执行的流程图。当对代码变更进行审查的时候,它会首先判断是否是 get 仓库,如果不是 get 仓库的话, 会运行 get in it 命令。当满足是 get 仓库的时候,就会判断 java c l i 和 code c l i 是 否可用。 如果都不可用,就会安装 java c l i 和 code c l i。 如果只有一个可用,就会直接使用当前这个可以使用的 c l i。 两者都可用的话,那么就会运行到这一步,分析 get diff, 然后判断是否有变更,如果没有变更就无需进行审查。然后如果有变更,就会到第三步,计算复杂度,进行评分,然后这里是评分规则,然后到这一步就开始进行决策。 这里就是硬性规则匹配,如果匹配到 codex 规则,比如说代码中包含敏感的文件或代码,文件数大于二十或者行数大于五百行,还有数据库迁移, a p i 服务层修改,还有跨三个顶级目录,还有复杂的 ts 范型,像这样的话就会通过 codex 进行审查,然后 gemini 的 审查规则是纯前端的代码,或者是 python 生态,或者是纯文档。如果是这些简单的内容,就会由 gemini 进行审查。当这个得分大于等于六的时候,就会由 codex 对 这些高复杂度的代码进行深度分析, 然后当得分小于六的时候,它属于中等或者简单的任务,就会由 gemini c l i 进行分析,然后这里是默认使用 gemini c l i 进行快速反馈循环。当判断好选择 codex c l i 还是 gemini c l i 的 时候,就 开始执行代码审查,到这一步就会判断是否执行成功,当失败的时候就会尝试调用备用的。比如说刚才我们调用 gemini c l i 的 时候,我故意将网关掉了,然后它就会调用备用的 codex c l i 再次执行代码审查,当执行完成之后,这里就会结束。 下面我们就回到 anti gravity, 详细看一下这个代码审查的 skill 里的这些内容,这里就是这个 skill 的 名称,这里就是这个 skill 的 描述, 在这里我们就列出了什么时候不使用这个技能。下面就开始进入流程,这是第一步环境检查,也就是检查是否有 get 仓库对应我们这个流程图上的这一步,然后到这一步就检查 java c l i 和 code c l i 是 否可用,就对应我们刚才看到的这一步。 然后到第三步的时候,就是来分析 get diff 对 应流程图上的这一步,当没有变更的时候,就直接报告没有变更,然后到这一步就开始对复杂度进行评分,这里面给出了多种评分方式,也就是对应流程图上的这一个流程, 然后这一步就是探测语言还有框架,就对应我们流程图上的检测语言框架,还有安全性等方面的这个流程。然后到这一步就开始进行路由决策, 因为这些内容比较多,所以这里我们就不再具体去看了,也就是对应图上刚才我们查看的这一部路由决策树,它会根据这些规则来判断是选 codex c l i 还是选 gemini c l i。 到这一步就是执行代码审查,在这里我们设置了 gemini c l i, 它能执行哪些命令,然后 codex c l i, 它能执行哪些命令。对应流程图就是这里执行代码审查,然后在这一步就是判断是否执行成功,也就是对应示意图上的这一步,当执行失败的时候,就会报告这个失败, 然后尝试切换另一个 c l i 进行执行,然后这一步就是格式化输出,也就是对应图上的这一个执行流程。像这样的话,这个用了决策树的 agent skill, 它就能让 anti gravity 或者让 cloud code 等 ai 编程助手具备自主决策的能力。 最后再为大家演示一下我们如何将这个 skill 在 这个对话框通过斜杠命令快速调出。像这个方式非常简单,首先我们要确保我们已经在当前的工作路径设置好了我们的 agent skills, 下面我们点击 anti gravity 右上方这三个点,然后点击自定义,再点击这个 workflow, 然后再点击这个 workspace, 然后我们新建一个工作流点, 点击之后,这里我们给工作留念个名称,比如说 review。 输入好之后,按下 enter 键,然后这里就会弹出这个输入框,这里有这个描述的输入框。在描述这里我输的就是代码审查,遵循团队标准,然后在下面的这个内容这里, 在这里我输入的就是代码审查工作流,然后这里我用了艾特符号来引用了我们这个用于代码审查的这个 skill, 这里要求他将这个代码审查里的指南用于所有的目标文件,这里输入的就是审查用户指定的文件,没有指定则不审查。 在最后这里就是让他创建包含严重程度分类的审查结果的工具。当描述和内容创建好之后, 然后在 anti gravity 的 这个输入框,我们直接输入斜杠命令加这个 review, 我 们就可以成功通过这个工作流的方式来调用我们设置好的这个 skill。 由于时间有限,本期视频只为大家演示了用于代码审查的 skill, 大家也可以将决策树的 agent skills 用于更多场景。本期视频所用到的代码和笔记,我都会放在视频下方的描述栏或者评论区。

大家好,欢迎来到 codex mcp 配置教程,你是否希望你的 ai 编程助手能够自动访问文件、系统操作浏览器、调用、远程服务? 今天我将用最简单的三步配置,教你释放 ai 编程的无限潜能。 mcp, 也就是模型上下文协议,能够让 codex 连接外部工具和服务,实现十倍效率提升。仅需一个配置文件,你就能让 ai 助手拥有文件操作、浏览器控制、 http 服务调用等强大能力。 这是一个最小化教程,只讲核心要点,让你快速上手。准备好了吗?让我们开始吧!首先,让我们了解什么是 m c p。 m c p 的 全称是 model context protocol, 翻译过来就是模型上下文协议,它是连接 ai 与外部世界的桥梁。 mcp 带来三大核心价值,第一,连接外部工具。通过 mcp, codex 可以 访问文件、系统操作、浏览器调用、 http 服务等各种外部资源。这意味着 ai 不 再局限于文本对话,而是能够真正与你的开发环境交互。第二,扩展 ai 能力。 mcp 让 ai 从纯文本交互升级到真实环境操作。 你可以让 ai 帮你自动提取文件、批量处理数据,甚至操作网页元素,实现真正的自动化任务处理。 第三,提升开发效率。有了 m c p, 那 些重复性的、机械性的工作都可以交给 ai 自动完成, 你可以专注于更有创造性的工作,开发效率轻松提升十倍,这就是 m c p 的 强大之处。接下来让我们看看如何配置它。配置 m c p 非常简单,只需要三个步骤。第一步,找到配置文件,你需要定位或创建一个名为 config and tomml 的 配置文件,这个文件是 m c p 配置的核心。 第二步,添加 m c p 配置。在配置文件中编辑内容,添加你需要的 m c p 服务,并定义相关参数。这一步决定了你要使用哪些外部工具。第三步,启动并测试启动 codex, 验证 m c p 服务是否正常加载,然后就可以开始使用了。是不是很简单, 整个过程不超过五分钟,接下来让我们详细看看每一步该怎么做。第一步,找到配置文件。配置文件的位置取决于你的操作系统。如果你使用 linux 或者 mac os 系统,配置文件路径是波浪线斜杠点 codex 斜杠 config 点 toml。 波浪线代表你的用户瞩目路。如果你使用 windows 系统,配置文件路径是 c 盘反斜杠 users 反斜杠,你的用户名反斜杠点 codex 反斜杠, config 点 tom l。 这里有个小提示,如果配置文件不存在,不用担心,你可以手动创建它。 只需要创建点 codex 目录,然后在里面新建一个 config 点 toml 文件就可以了。找到或创建好配置文件后,我们就可以进入下一步了。第二步,添加 mcp 服务配置。打开刚才找到的 config 点 toml 文件,我们需要按照特定格式添加 mcp 服务配置模板是这样的, 方括号, m c p 下滑线 servers 点服务名称,这是服务的标识,你可以自定义。下面是 command 等于引号 m p x 引号,这是执行命令,然后是 argus 等号。方括号里面是命令参数数组, 还可以选择性添加 env, 用来设置环境变量。让我给你个实际的例子,配置文件系统服务,我们写 m c p 下滑线 servers, 点 file system command 等于引号 m p x 引号 argus 等号方括号 里面写引号减 y 引号,引号 at 符号 model context protocol 斜杠 server 加 file system add 符号 latest 引号。最后是你的工作目录路径,比如引号斜杠 workspace 引号。就是这样简单的几行配置,就能让 codex 访问你的文件系统了。第三步,启动并测试保存配置文件后,我们来验证配置是否成功。 第一个操作,在终端中输入 codex, 启动 codex, 查看已加载的 codex 服务列表。 如果配置成功,你会看到类似这样的输出, m c p services 冒号 file system 括号已连接,这个绿色的对勾表示服务已经成功连接。恭喜你,配置完成了。 现在你的 codex 已经具备了访问文件系统的能力,你可以让 ai 帮你读取文件,创建目录,批量处理文件。所有这些操作都变得自动化了。当然, m c p 不 仅仅是文件系统服务,还有更多强大的服务可以使用。让我给你介绍几个常用的 m c p 服务, 每一个都能大幅提升你的工作效率。第一个,文件系统服务,这是最基础也是最常用的服务。 通过它, ai 可以 访问你的文件和目录,帮你读写文件,批量处理数据。配置方式我们刚才已经演示过了。第二个框,开发工具,这个服务让 ai 能够操作浏览器,实现网页自动化,你可以用它来进行网页抓取、 ui 测试、数据采集等任务。 配置也很简单,服务名写 chrome command, 用 npx arcsoft 写 chrome 减 devtools 减 mcp at 符号 latest。 第三个远程 http 服务, 通过这个服务, ai 可以 连接远程 api, 调用第三方服务或云端资源。配置方式略有不同,需要指定 url 参数指向远程服务地址,并设置 experimental 下划线 use 下划线 r m c p 下划线 client 为 true。 这三个服务覆盖了大部分使用场景, 你可以根据需要选择配置一个或多个服务。让我们看一个完整的配置视力,在 config 点 toml 文件中,你可以同时配置多个 mcp 服务,比如这个视力。我们配置了文件系统服务和 chrome 开发工具,保存文件后重启 codex, 这两个服务就都可以使用了。 让我们总结一下今天学到的核心要点。第一,三步配置快速上手,找到配置文件,添加服务配置,启动测试,整个流程不超过五分钟。 第二,连接外部工具服务 mcp, 让 ai 能够访问文件系统,操作浏览器,调用远程 api, 将 ai 从文本世界带入真实开发环境。 第三,十倍效率提升自动化重复任务,让你专注于创造性工作,真正实现高效开发。 mcp 是 提升 ai 编程效率的关键技术,配置简单,效果显著。现在就开始配置 mcp, 释放 ai 编程的无限潜能吧。感谢观看,如果对你有帮助,请点赞关注我们,下期再见!

agent skills 为什么能在短时间内拿下三点六万加星标?还有 cursor、 code x、 vcode 和 code body 等编码工具的陆续接入,它到底解决了什么问题?什么是 agent skills? 以及我们要如何构建自己的 agent skills? 一个视频讲清楚。先用一句话总结为什么要用 agent skills。 目前的 m c p 和 agent, 它们的本质是解决 ai 能不能干活的问题, 也就是 ai 能调用哪些工具。而 agent skills 解决的是 ai 能不能把活干好的问题。它最大的亮点是保证结果的稳定输出和件件式批注机制。什么意思呢? 比如让 ai 帮你写一份行业分析报告,它会自己调用搜索工具查资料,然后总结观点,最后输出一份看起来逻辑通顺的文档, 但是这份文档你敢直接交付吗?肯定不敢。不是 ai 不 够聪明,而是因为 ai 不 懂你的业务习惯,不懂你们公司的审核标准,更不懂你老板或者你客户的关注点在哪里,而且每次生成的质量还不稳定。所以 目前的现状就是, ai 能帮你做事,但他不一定能把这些事做好,因为他不知道所谓好的标准是什么。而 agent 解决的标准提前写清楚,固定下来,反复让 ai 照着做。 它不再让 ai 凭感觉做事,而是按你事先定好的流程规则和标准去做事,最终稳定输出一个符合你预期的结果。那到底什么是 agent skills 呢?从概念上说,它是一套可附用的做事规范和做事经验。 而在技术层面,其实它就是一个文件夹,里面包含了指令脚本和资源。指令就是名叫 skill 点 m d 的 markdown 文件,它是告诉 ai 什么场景下按什么步骤去做事,这个文件是必须要有的,而资源和脚本是可选的,资源可以放公司的成功案例、文案模板,等 到 ai 去参考引用脚本是让 ai 执行简单的代码、调用工具等。整个文件夹就构成了一个完整的 skill, 如果还有其他 skill, 复制上面的目录结构就行。接下来演示一遍怎么构建自己的 agent skills 就更好理解了。拿写周报为例,先在 skills 文件夹里新建一个文件夹叫写周报,然后在里面创建 s, k, i, l, d, m, d 文件。在文件开头需要用三横线包裹 name 和 description, 这就是技能的原数据大模型,刚开始只会加载名称和描述,并不会加载全部内容,否则就太好 token 了。 然后在下面用 markdown 格式写周报的要求、规范和注意事项等。写完之后,在目录下按右键选择,在终端打开,输入 curl, 再输入斜杠 skills。 看到刚创建的写周报技能,就说明已经被正确识别到了。 这时你在输入帮我写周报模型会询问你是否使用写周报技能。选 yes, 此时才加载了技能包里的全部内容。按要求输入本周的工作内容后,最终一份符合你预期的周报就生成了。好了,以上就是本视频的全部内容,如果对你有帮助,别忘了点赞关注我们,下期继续!

在之前的视频中,我为大家演示过多种与 cloud code 和 codex 相关的开发工作流,包括 be my method、 spiket、 openstack 等。 最近我又发现了一个更加工程化、更完整的开源工作流 superpowers, 它是一个面向 ai 编程助手的完整软件开发工作流系统。它支持 cloud code, 还支持 open ai 的 codex, 还支持开源的 ai 编程助手 open code。 而且我在 cloud code 中使用 superpowers 开发了一款 ios 的 时间线笔记的原声应用。在这个时间线笔记中,我们可以记笔记, 比如说这里我们输入一个笔记内容,还可以输入标签,在这里还可以选择图像,比如说我随便选择两张图像, 我们就可以点击发布,然后它就会以时间线的方式显示在最顶部,底下是我之前发布的这一些笔记内容,而且我们还可以对笔记进行编辑或者删除,还可以点击放大这些图像。 superpowers 它的功能不是让 ai 随心所欲的写代码,也就是我们通常所说的 web coding, 而是把一整套接近专业工程团队的开发方法论固化下来,让 ai 编程助手在写代码时能够自动遵循最佳的实践,包括先澄清需求,再编辑计划,再分布实现,而且每一步都有检查点, 从而避免 ai 编程助手采用 web 扣顶的方式把项目越写越乱。它最大的特色就是测试驱动开发贯穿始终,作为铁律,强制执行 每个任务都会委派一个新的 sub agent, 这样就不会造成上下文污染。它的实现方式是把研发流程打包成一组可组合的 skills 与启动指令,并通过指令还有技能库,还有工作流编排的组合,让 ai 在 不同阶段按流程做正确的事。 好,本期视频我们将结合实际项目,带大家测试 superpowers 这个开源工作流的使用方式以及使用效果。因为 superpowers 它对 cloud code 的 支持要更好。 在 cloud code 里它可以借助 cloud code 原声支持的 skills 功能以及插件功能,实现一键安装、加载与自动触发。 所以本期视频我们将重点在 cloud code 中来测试这个开源的工作流项目。在 cloud code 中使用 superpowers 这一个插件非常简单。首先我们打开终端命令行,然后进入 cloud code, 再复制官方给出的这一条命令,然后回到 cloud code 中进行粘贴并且执行。下面我们再复制官方给出的第二条命令,然后粘贴到 cloud code 中直接执行。 在 codex 中安装也非常简单,我们只需要复制官方给出的这个提示词,在 codex 中直接粘贴这个提示词并且执行就可以。在 opencode 中安装也非常简单,我们也是直接复制官方给出的提示词,然后在 opencode 中直接粘贴提示词并且运行就可以。 下面我们就可以在 cloudcode 中输入斜杠命令,再加 super, 然后我们就可以看到 superpowers 它支持的这三条命令。 第一条命令是用于头脑风暴,也就是我们只需要简单的描述我们要开发的内容,与 ai 进行苏格拉底式对话,从而帮助我们厘清我们真正的需求。然后这一条命令是用来写开发计划,它能实现编辑二到五分钟的小任务,包含精确的文件路径, 完整的代码片段,还有明确的验证步骤。在这里还包含第三条命令,也就是执行计划,所以他的执行流程非常简单,先是实现头脑风暴,再实现工作区隔离,他会创建新的分支来隔离开发环境, 再实现项目部署化,再验证测试的基线。然后就是编辑计划,当计划编辑好之后,再分配给这些子代理进行开发。它的原则就是测试驱动开发循环,包括写失败测试最小实现,最后清理优化。 而且它的特点就是两阶段代码审查,第一阶段是规格符合性审查,第二阶段就是代码质量审查。当 superpowers 设置好之后,下面我们就可以用一个实际的例子来测试一下使用 superpowers 它的开发流程以及开发效果。 在开始执行之前,我们可以先在 xcode 中虚化一个 ios 的 项目,然后用 cd 命令进入到我们创建的这个路径,再启动 cloud code。 我们可以直接用斜杠命令来开启 superpowers 的 头脑风暴模式,然后还可以直接输入开发需求,这样的话会自动激活头脑风暴这个 skill。 我 这里输入的开发需求就是开发一个个人时间线笔记的 ios 应用, 像 x 一 样能够发布短笔记,按时间线浏览,还能支持图片和标签。然后我们直接运行,先看一下效果,这里就提示使用头脑风暴这个 skill, 然后这里我们就允许他执行这个头脑风暴。像这样的话,不需要我们去执行命令,我们只需要输入开发需求,他就能自动激活 superpowers 的 头脑风暴,这个技能 好,这里他看到了我刚才创建了一个空的 xcode 项目,他需要查看这个项目的结构,这里提示这是一个新的 xcode 项目。然后他说他理解了我们想创建一个时间线的笔记 app。 这里他需要我们来澄清下面这几个问题。第一个问题就是他希望我们如何来创建笔记,包括他提到是采用类似 x 右下角的加号按钮,点击即可打开拽写窗口。 第二项就是顶部拽写栏,时间线顶部始终可见的文本框,直接输入即可发布。然后第三项是下拉拽写,在时间线上下拉即可显示拽写区域。然后他问我们选择哪种方式,这里我们就选择。第一项,我们直接输入一, 这里他很快输出了回答,他说悬浮按钮既方便又能保持时间线的简洁。然后这里他又开始询问我们问题,他这里询问的是笔记在时间线上应该如何显示。 一种就是卡片样式,每条笔记以圆角卡片的形式呈现。第二种就是扁平列表,形式类似 x。 第三种方式就是气泡形式,类似聊天气泡的显示方式。然后这里我们就选择第一种,让他实现这种圆角卡片的风格,我们直接输入一。 紧接着他又开始询问我们笔记中的图片应该如何显示?第一种就是内嵌式展开图片,在卡片内全宽显示,类似于 x 风格。第二种方式就是缩略图,网格 多张图片显示为小缩略图,点击展开。第三种方式就是单张预览,如果有更多图片则显示徽章。然后他问我们哪种方式最合适,然后这里我们就选择第二项,让他实现缩略图的网格,我们就输入二,然后发送。 下面他又询问我们标签如何运作?第一种方式就是在笔记中内嵌标签,第二种就是单独的标签选择器。第三种就是两者兼备,这里我们就选择第一种, 直接输入一,也就是像 x 中一样,输入井号键就能填写标签。好,下面这里他询问当点击标签后会发生什么? 一种就是筛选时间线,仅显示带有该标签的笔记。第二种就是标签详情页,跳转到专门的页面。 第三种就是快速筛选栏,将标签添加到顶部的筛选栏,可以组合多个标签,这样的话这里我们选择第二项,也就当点击这个标签之后,就能跳转到专门的页面,然后我们这里输入二。 好,下面这里他又询问我们是否需要搜索功能。第一种就是权威搜索,第二种就是锦标签搜索,然后这里我们就选择第三项,我们直接输入三,直接发送。 下面他开始问我们笔记编辑还有删除应该如何操作?第一种是向左滑动删除,向右滑动编辑。第二种方式是长按来显示编辑删除或者复制的选项。第三种是点击查看详情,在详情中包含删除按钮, 然后这里我们就选择第三项。好,这里他又生成了一个问题,他问我们是否需要数据的备份, 一个选项就是不需要备份,为了快速开发,这里我们就选择第一项,不需要备份好,这里他就生成了一个最终的方案, 下面这里就是他分析的这个设计,最后这里他询问这个数据模型看起来是否正确,然后我们直接输入正确,然后发送好。这里他紧接着输出了第二部分,也就是这个项目的结构,还有导航,这里包含详细的交互设计, 然后我们直接让他继续去执行。好,这里他又输出了这个 u i 设计,包括时间线,还有这些笔记卡片。然后我们直接让他继续去执行。 这里紧接着生成了这个项目结构,然后他询问这个结构是否合理,并且询问是否准备执行,然后下面我们就可以输入提示词,然后我输的是这个结构看起来很好,并且让他按照 superpowers 的 工作流继续执行, 让他创建隔离的工作区,然后再使用这个技能创建详细的 t d d 实现计划,然后我们直接运行,看一下效果,这里提示他将先保存这个设计文档,然后继续执行这些工作流, 这里他需要执行 get 命令,我们让他继续去执行。这里他开始使用创建工作区的这个技能,我们允许他执行。这里他选用我们将在哪里创建独立开发的这个工作数。然后我们就直接按照他给出的推荐的第一项,我们直接运行, 像这样的话,它就执行到创建工作区,包含创建新分制隔离开发环境,项目部署化,还有验证测试基线。现在开始运行到了写计划的这个步骤,然后我们直接让它来执行, 这里提示调用了这个 writing plans 的 这个 skill, 这里提示它会创建一个综合性的 t d d 执行计划,在这里它提示它将使用 writing plans 这个 skill 来创建这个执行计划。好,这里提示这个执行计划已经存入到了这个文件里, 在这里它给出了两种选择方式,第一种就是使用 sub agent 驱动的,然后这里我们就选择第一种输入一,然后直接发送,这里提示它需要调用这个 skill, 然后我们这里允许它执行,它将使用 sub agent 来执行我们这个计划。 好,现在生成了这些任务,这里一共生成了十三个任务,像这样的话就到了 sub agent 开发的这个步骤,在这个步骤中,每个任务都会有一个 sub agent, 而且会进行刚才我们提到的两阶段检查, 包括规格检查,还有代码质量检查,通过 tdd 循环,直到通过为止。在等待了大概十多分钟之后,他执行到了这一步,他需要调用这个 skills, 然后我们这里允许他执行好,这里提示在执行第一步,验证测试好,这里提示测试成功,下面他需要执行第二步。 好,这里开始执行第三步,这里给出了三个选项,第一个选项就是本地合并回主分支,我们就选一 让他合并回主分支。好,我们这里允许他执行命令。好,这里提示执行完成,这里合并到了主分支,在这里就提示我们可以运行这个项目了,下面我们就可以测试一下, 在 xcode 中打开这个项目,然后我们运行,这里提示构建成功。打开之后我们就看到了他为我们生成的这个时间线的笔记,我们可以先添加一个测试一下, 然后我们点击发布,这里我们就看到了我们发布的笔记,然后我们再测试一下,然后我们点击图片库,点击添加一个图像查看一下,这里我们随便添加一个,然后我们再添加一个图像,然后点击发布,这里我们就看到了我们发布的第二篇笔记,我们再添加一个, 我们再添加几张图像,然后我们点击发布,这样的话这个图像就按照缩略图的方式进行了显示,然后我们就可以向下滑动来查看我们所发布的这些笔记,然后我们再选一篇笔记,点击进入详情。 好,这样的话就进入到了这个笔记的详情,下面我们点一下这个标签,看一下,这里就将带有这个标签的所有笔记显示在了这里,然后我们点击第二篇笔记,然后测试一下删除,我们点击这个删除这里,确认 好,这里删除成功。这样的话我们就在 cloud code 中使用 superpowers 为我们完成了这个时间线风格的笔记应用的开发,而且一次就通过测试没有出现任何报错。

tiktok 上最近出现了一个非常火的项目, agent skills for contest engineering, 发布不到一周就斩获了二点三 k stars。 为什么它能瞬间引爆社区?今天我们深入来聊聊这个项目。你可能有过这样的经历,用 ai 编程时,明明给了足够的上下文,可 ai 要么答非所问,要么被永长的历史信息绕晕。最近 github 上的一个项目或许能解决这个痛点。 这个叫用于上下文工程的智能体技能的项目,发布不到一周就拿下了二点三 k 星。为什么他能这么火?我们从二零二五年末的技术背景说起, 这些年大厂白皮书里反复提到上下文工程,但对每天敲代码的开发者来说,那些理论太飘了。 我们需要的不是什么是上下文的论文,而是能直接用到 cloud code 里的工具。这个项目恰恰填补了这个空白,它把灰色的上下文管理策略打包成十个即插即用的智能体技能,借助 cloud 的 自动加载和触发机制, 让 ai 终于能像资深工程师一样自己管理内存。这就是一套上下文工程的最佳实践工具库。怎么理解它的核心逻辑?项目把上下文拆解成五个部分, 系统指令、工具定义、查找文档、消息、历史和工具输出。其中工具输出是最拖后腿的。研究显示,原始工具返回结果往往占了上下文百分之八十以上的体积,就像你电脑开了太多网页导致卡顿。 ai 的 上下文也有注意力,预算 一旦超支,性能就会下降。项目提出的渐进式路由策略就是解决这个问题的关键。初始状态下,智能体只读取所有技能的名称和简短描述,就像你手机桌面只显示常用 app 图标。 当你输入 prompt 后,智能体会自动进行语义匹配,找到相关能力,再加载详细内容。这跟操作系统的液交换机制很像,确保模型始终处理最相关的高信号信息。 你可能听说过 ai 的 迷失在中间现象,当信息放在上下文中间位置时,召回准确率比两端低百分之十到百分之四十。 除了这个,长对话里还会出现上下文中毒、干扰、混淆、冲突等问题。比如你先问 ai 怎么写 python 爬虫,再问怎么优化 java 性能。旧的爬虫信息可能干扰 ai 对 java 问题的回答。项目里提到的压缩优化技术能帮我们解决这些问题。 比如观察掩码技术,读取原文后提取核心结论,把原文从上下文里替换成引用 id, 这样上下文体积能骤降百分之九十。就像你把厚厚的参考手册换成一张锁影卡,需要时再去查详情。还有铆钉、叠带、摘药技术, 维护结构化的状态快,包括绘画意图、状态清单、决策记录和下一步行动向,让 ai 始终记得对话的核心目标。在多智能体协助场景里,上下文隔离很重要。比如一个项目分三个智能体, 写前端的,写后端的,做测试的。如果写前端的智能体看到后端的代码细节,可能反而会影响它的工作效率。 项目建议,每个子智能体只关心自己的任务,拥有专用工具,减少后选工具数量,实现故障阻断。 就像工厂里的流水线,每个工位只做自己的事,互不干扰。记忆系统也是上下文工程的重要部分。传统的向量检索有个时态盲区,它能找到相关的知识,但不知道这些知识的时间顺序。比如, ai 可能会把二零二三年的旧技术和二零二五年的新技术混在一起。 项目里提到的时态知识图谱就是给知识加上时间戳,让 ai 能区分旧方法和新进展。在工具设计方面,项目提出了一个反直觉的建议, 不要为每个细小功能写一个工具,而是把高度藕合的步骤合并。比如,你要做读取文件加分析代码加生成报告,与其写三个工具,不如合并成一个,这样能减少工具调用次数,提升效率。 项目还建立了完整的评估体系。智能体性能的百分之九十五变异由三个因素决定, token 使用量占百分之八十,工具调用次数占百分之十,模型本身选择占百分之五。这意味着优化上下文比换模型更能提升性能。 最后,项目给出了从 demo 到生产环境的五阶段流水线方法论。第一阶段,先用人肉方式跑通流程,再写代码。第二阶段,利用文件系统作为状态机,管理任务进度。这跟软件开发的最小可行产品思路类似,先验证流程可行,再投入开发。 通过这个项目,我们能看到,智能体开发已经进入了系统工程时代。以前我们可能只关注模型本身,现在发现,上下文工程才是构建确定性系统的关键。就像造房子,模型是地基,上下文工程就是框架, 没有好的框架,再好的地基也建不起高楼。这个项目的意义在于,它把抽象的上下文工程理论变成了开发者能直接用的工具,让更多人能用上高质量的智能体。说到这里,你可能会想, 以后 ai 会不会自己变得越来越会管理自己?我们会不会不再需要花太多时间调整 prompt? 这些问题或许会在未来的技术发展中找到答案。好了,今天的内容就聊到这里了,如果你有什么想法,欢迎在评论区交流,我们下期再见。

好,朋友们好,本期视频我们一起来看一个开源项目,叫 u i u x pro max skill, 这个 skill 大家都很熟悉,像是 cloud 最近提出来一个概念, cloud 们 cp 很 火,慢慢的已经开始成为规范式了。那本期我们要介绍的是一个叫 u i u x pro max 这么一个开源项目,这开源项目大家可以看到,对吧?包括 cloud code, cursor, 温塞尔 artcraft, 对 吧?都已经开始接入了,包括我们最近很火的 kilo codex code code 这些主流的编程工具都已经开始,对吧?接入这个 u i u x pro max, 它的作用就是可以帮助我们 写出不同的这种配色风格的,这种 u i 主题可以完美的彻底解决我们 ai 生成紫色渐变的情况。 如果大家看不懂这个英文,很简单,就是他提供了一个中文版的开源项目,就这个中文的杠 c n, 对 吧?你看这个中文版的,这个官方也是一样的,好吧,好,我们可以看到他的作用就是可以帮助你去全人的设计这个, 这个,这个配色,包括这个 ui 的 风格啊,配色方案啊,字体配,对啊,现在已经提供了五十七种 ui 风格,就是你再也不用去跟他说,哎,我想要商务风格,我想要这个科技风格,你再也不用这样说,你想要什么风格,对吧?你直接去用, 用完之后就是这个效果,好吧,每个人都可以去复刻一模一样的效果,而不是说,哎,你沟通出一个黑色风格,他沟通出一个白色风格,这样很浪费时间,好吧,那首先我们来看怎么使用,第一个 它是美化我们 u i, 对 吧?那你要安装,点击安装这一章节你要安装,对不对?你直接从这里,首先你要如果直接使用的话,你通过这条命令安装切换到一个指定的目录,然后这个时候呢,你再指定你要的这个 ai 助手,比如说我是 cloud, 那 我就 使用这条命令,对吧?我就执行,或者你是 ctrl, 就是 这个地方,嗯,执行好,你执行完了之后呢,你去看它的版本是不是安装成功了?好,安装成功了,对不对?而且就使用了,你看怎么使用,你点下使用,你看, 首先如果是 cloud code 的 话,你直接跟他说,哎,我要去做一个什么样的产品,你我要一个什么样的风格,这个时候呢,他会自动的去调用这个 skill, 你 看你可以通过这些题的词呢去,哎去调,也就是说你前置步骤通过这些方法去安装,完成之后你再 去掉,这个时候就会自动掉这个 skill, 就是 这个 skill, 这个 skill 的 作用就是它会自动的将这些提示词呢啊,给你封装好了,比如说我要开发一个什么样的风格,你看这是这个 color skill, 你 点进去,你看它的数据啊,它就提供了一大堆的这种配色风格的样式,你可以看到它会自动的从这里面去, 哎,你看是吧?每种风格都列的清清楚楚,包括字体应该什么样式,这些就是它的这个字体风格的提示词,也就说相当于你去用了这个 skill, 就会自动的引用当前项目当中的 prompt 的 这个接字啊,是一个非常好的开源项目啊。那本期视频我们主要做一个介绍,因为时间关系啊,下期视频的话,我们将哎实际的用我们一些啊,一些项目做一个实操。好吧,那就本期视频的全部内容了,如果你也对这项目感兴趣的话,我们下期再见。

大家好,这里是刘花花。大家在使用 cloud code 或者 code s 这样的工具的时候,可能会有这样的疑问,有 pullman, skills, mcp 等等这样的,但是它们有什么区别?那么今天这期视频我们就来一起来看一下。如果你想获取本集视频的文字版, 可以在浏览器输入以下网址。我们先来看最简单的,比如这里我们想做一个去北京三天的攻略,我们就直接给大魔镜说 我做一个北京三天游的攻略,那么我们说的这句话他就是朋们。现在我们再来看 m c p 三亚文协议 m c p, 我 们可以理解为让模型接触到外面的世界,比如说网页搜索外部数据等等。 假如这时候我们想看一下我们住的酒店该怎么到故宫,这时候如果直接给大朋友说我住的这个酒店怎么到故宫,他们可能就会有我们去过一个不存在的地铁站, 这对我们的出行是非常不好的。如果这时候我们接触了高德的 m c p, 那 么他就会帮我们查一下我们的住的酒店到故宫他有多远, 应该做几号线路。有了 m c p 之后,我们还希望他每次都按照我们的习惯方式做攻略,别一会儿像小红书,有了又像学术论文。这时候我们就该用到 skills 了,我们可以提前做一堆简陋规划的 skills, 比如说 北京三日游的模板,节点节奏控制预算还有交通方式。我已经在开始执行任务前,会首先看到每个 skills 的 名字和描述这一条信息,然后 只会选择应该使用的进行读取,加载完整的内容,这样做的好处就是可以省 token。 skills 和 m c p, 它们两个不是替代关系, 而是互补关系。 m c p, 它主要是连接外部, skills 呢则是给用法应该怎么做?同时 skills 还可以很大程度上的省成本。 skills 为什么会省成本呢? 因为它加载的时候会先读取所有 skills 的 名称和描述。下面的内容是不会读取的, 大家可以看我这个图片,上面高呢是最开始会读取的,下面的是不会的,然后他会在读取到的所有的数字里面选择最佳的进行使用,然后才会读取他下面的这些详细内容。 这个运行其实叫做间接式批录,就好比我们去图书馆读书,我们会先看他的宿名和简介,然后才会看剩下的内容。 下了我们再来看自定义命令,下了我们可以看做一个题日词模板。就比如我们觉得每次给模型说我要去北京玩,做一个餐厅的攻略怎样怎样,这样太麻烦了,我们就可以做一个自定义命令,每次我们说一个斜杠命令就可以了,比如我们设置一个斜杠北京。那么自定义命令和 skills 应该怎么选呢? 如果只是想打打字调用一个 poem 的 模板,那就用自定义命令。如果是想教模型套复杂流程,且可以自主调用,那么就用 skills。 我 们现在再来看 agent agent, 它不是一个更长的 poem agent, 它合计是两件事,一个是循环,一个是状态管理,也就是它会反复计划,行动,检查,然后再来,直到达到标准后输出,而不是一次性为它完就结束。我们看一下 智能体循环它是怎么做的好,我们先想清楚怎么做,也就是计划阶段,然后再去用工具,拿到真实结果就是工具调用,最后检查一下对不对,如果对的话就做出完成,如果不对的话就反复迭代。还是以去北京的三天游为例子, 我先会先看一下我们的收入有什么缺失的信息,然后他会调用 m c p 进行查路线,安排一个行程,假如说他发现这个行程对我们来说时间不够, 会自动调整,再进行一次迭单,最终来说出一个方案,对这里每一步都依赖上一步的结果,这又是状态 agent, 记得自己做了差什么,下一步要补什么。我们来看最后一个概念, sub agent, 子智能体, 也叫子 agent。 设想一下,这时候我们的主 agent 正在整理三十九的大纲,但是呢,我们又要查无线计划,交通方式以及耗时换成方案等等。 果都在主 a 键的里面跑,我们的屏幕就会被一大堆调用日期和中间的数据刷屏,这时候我们就可以开一个词 a 键的去跑,也就是 sub a 键的它呢对于主 a 键来说就是一个工具,跑完就会返回一个真正的结果。这样做的好处有两个, 一个是保证我们住 agent 的 上下,我们不会污染,另外一个是并行,我们可以同时派三个 agent, 一个去查机票,一个去查酒店,一个去查门票。关于他们六个的关系方式,大家可以看屏幕上面的这张图, 我们可以通过 poem 或者是命令来调用一个九维整数,它可以使用 skills, m, c, p, seven 或者是 seven 整数来辅助完成任务。我这里用了一个表格,把它们六个做了一个简单的对比,大家可以暂停观看。如果您喜欢我的视频,还请关注、点赞、支持。

hello, 本节课的内容会带着大家去熟悉最近非常火的 agent skill, 那 相信大家已经从很多的公众号或者视频当中看到了 agent skill 的 一些能力和概念, 但我看市面上大部分的内容其实都对于工作流的一个封装,那我们这节课呢,会更加的务实,围绕我们课程 web coding 主题 去讲 agent skills 的 一个使用。那除了 agent skill 的 基础概念之外呢,我还会教大家如何去找到一些好用的 agent skills 的 资源,那这些 agent skills 的 资源呢,都可以当做前期入门使用,也是一个很好的去编辑 skills 的 一个材料。 那我们还会教大家呢,如何去 cloud code 以及在 cursor 包括 code x 当中。因为考虑到这三个工具不同的学员都有可能在使用,我们会用具体的一个案例让大家熟悉这些工具当中去使用 skills。 那 最终呢,我会教大家如何用 skills 加三个提示词,编辑一个 ai 视频的一个套壳网站,我们可以 去看一下最终的效果。这个呢是网站的一个落地页,然后我们点登录, 登录成功之后呢,会进入到一个纹身视频的控制台,你可以选择下面的一个模型啊,我们现在只接了三个,去粘贴一个提示词, 然后去点击开始生成。 ok, 这是可临生成的,最终的效果就是两个人在玩雪还不错。那同时呢,网站的一个最终的圆满呢,大家都是可以在文档的底部获取,包括出师化项目的圆满以及最终的一个圆满。好了,话不多说,我们开始上课。

我给大家讲一下怎么使用 code code, code 是 现在最好用的编程 ai, 嗯,很多人都需要用,不管你是学生还是程序员,它可以取代你百分之九十以上的工作量,但是我们直接使用不了,而且即使你可以使用 也极其的不稳定,我给大家讲一下怎么直接稳定的使用。来到我们的进项网页 fesci, 进来之后直接点击 code, 这里就可以使用 color code, 就 可以使用 code x, 甚至可以使用 jiffy 来,我推荐大家都使用 color code 的 color code 有 两个安装步骤低不下来。路由器,路由器我已经下载了,让它验证一下就 ok, 出现虚列号说明正常安装,然后我们再安装路由 code, 然后你又不利用用户,一定要将 s 九丢,获取管理员的权限。 安装完成之后我们输入 q 二开始使用,所以特别注意一下,你需要使用,必须使用退换券激活,激活之后它才能正常输出结果。激活码在我主页地址, 这里就是 qq 的 最新的使用界面,我们可以看一下有哪些模型,模型现在有所有,四点五, oppo 四点五,还有海狗模型,我建议大家都使用 default 模型, 然后就可以直接开始使用,如果你还需要使用这样子的 g p l g p t 同时也有行,就这样大家需要使用可以看一下,同时也可以点个赞和收藏,拜拜。