上周 openai 它刚刚 release 了一,那个就是 codex, 就是 codex, 它把那个 skill 的 功能放在 codex 里面,它目前也已经实现出来了, 这个项目也是开源的。 openai 的 这个应该也是不错的,这个写代码里面它是属于第一阵营的。这个 openai 的 这个 codex 跟 cloud code 的 牛的一拼,目前它也能够支持 skill 的 这个功能,谷歌也可以的。 这个都是他们大厂必加、兵家必争之地,这个都很强,他们会投入大量的资源和精力在这个上面去竞争的,因为他是一个超级入口,我们 ai 写代码的,他的这是他们这些工具都是一个超级入口,所以他都要去抢的。
粉丝4.4万获赞31.5万

在 oslopec 发布 agent skills 两个月之后, openai 现在终于支持 agent skills 了, 现在我们就可以在 codex 的 最新版中使用 agent skills。 同时 openai 官方还发布了 gpt 五点二 codex 模型, 我们只需要确保 codex 已经升级到最新版,然后用斜杠命令加 model 就 可以查看。 g p t 五点二 codex 模型我这里选择的它的推理级别,选的是 high, 这里也支持 extra high。 通过我一上午的使用发现 g p t 五点二 codex 模型它最大的缺点就是速度太慢了,像一个简单的任务,它可能需要耗费五分钟甚至更长时间。 本期视频我们将在 codex 中测试一下 agent skills 的 使用方式以及效果,并且在 codex 中重点测试 gpt 五点二 codex 模型的编程能力。 好视频呢,开始我们可以先简单回顾一下 agent skills。 对 于不了解 agent skills 的 用户来说,我们可以先通俗地讲解一下什么是 skills。 aging skills 的 本质就是把人类的专业知识还有工作流程用机器可以理解的方式固化下来,让 ai agent 呢能够稳定可控可附用的来执行任务, 这样的话就能将 ai 从聊天助手变成了可控的工程工具。我们可以将没有使用 skills 的 ai 或者 ai agent 呢理解为一个非常聪明但没有经过培训的员工, 每次布置任务都需要口头讲一遍规范。有了 skills 就 相当于给员工配备了工作手册,所有流程和规范都写在 skills 里面, ai agent 就 可以随时翻阅。比如说我们在让 ai 写测试的时候,如果没有 skills, 每次我们都要告诉 ai 帮我写测试,要使用 test 覆盖率达到多少以上,命名规范是怎样的,每个测试都要怎样怎样,然后 ai 就 会按照我们的提示词来写测试。 当后续我们再要求 ai 来写测试的时候,我们还需要重复一遍之前所用到的提示词,像这样的话非常浪费时间。但是有了 skills 之后,我们可以将测试做成 skills, 也就是将所有的测试规范脚本还有模板都放入 skills 文件中。当给 ai 配置好这个 skills 之后, 我们再需要测试的话,直接告诉他帮我写测试,那么 ai 就 会完全按照这个 skills 里的这些测试规范脚本还有代码自动为我们执行测试。相比 mcp agent, skills 非常节省。 token, 当启动时只加载 skill 的 名称和描述,而且可以根据任务自动匹配。 而且 skills 在 执行时才会完整地加载 skills 里的所有内容还有附属资源。所以有了 skills 的 支持,我们就可以为 codex 增加各种技能以及增加各种知识。在 codex 中使用 agent's skills 非常简单。 首先我们要确保将 codex 升级到了最新版本,然后我们再用命令打开 codex 的 配置文件。 在 features 这里我们要将 skills 设为 true, 下面这里还给它设置了权限,这些设置好之后,我们直接保存并且关闭就可以。然后我们再启动 codex, 再使用斜杠命令来查看 skills。 这里有自带的三个 skills, 这个 pptx, 还有这一个都是我手动安装的。 想安装 skills 非常简单,我们只需要选择这一个 skills, 在 后面我们就可以输入 skills 的 仓库链接,比如说我这里使用 oslopec 的 skills 仓库,我们可以进入这个文件的路径,这里面就列出了非常多的 skills, 比如说我这里找一个前端设计的 skills, 然后直接完整地复制它的链接,再回到 codex, 我 们直接粘贴这个链接,直接运行就可以,它就会为我们安装我们刚才选择的这个 skills。 这里安装成功,我们只需要重新启动一下 codex, 就 可以看到我们刚才安装的这个前端设计的 skills, 然后我们就可以选择这个 skills。 在 后面我输入了提示词,开发一个登录页的 ui, 可以 看到这里它读取了 skill 点 md 文件,这里提示它使用前端设计的 skill 完成了登录页的 ui, 然后我们打开这个页面看一下效果, 打开之后我们就可以看到这个登录页设计的非常不错,非常美观。下面我们还可以测试一下,让它为我们制作 ppt, 然后我们输入命令,找到做 ppt 的 这个 skill。 我 输入的提示词是把这篇关于介绍 agent skills 的 文章做成十页的 ppt。 受众是开发者,风格是极简,深色,语言是中文,这里是要输出的文件名, 这里就是介绍 agent skills 的 文章链接,也就是这一篇文章,然后我们直接发送,好在等待了几分钟之后,它终于制作完成,然后我们打开这个 ppt 看一下效果,它确实制作了十页 ppt, 可以 看到它制作的这个 ppt 效果还是比较不错的,完全符合我们要求的深色极简风格,并且用中文介绍了 agent skills。 下面我们就可以在 codex 中测试 gpt 五点二 codex 模型的编码能力。 在测试之前,我们可以先看一下官方给出的 gpt 五点二 codex 模型的基准测试。在 swebench pro 这个基准测试中, gpt 五点二 codex 达到了百分之五十六点四,超过了 gpt 五点二以及 gpt 五点一。在另一个基准测试中, gpt 五点二 codex 也超过了 gpt 五点二以及 gpt 五点一 codex max。 好, 下面我们开始在 codex 中通过几个案例测试一下 gpt 五点二 codex 模型它的真实能力到底怎样。 好,下面我们准备一张 ui 截图,然后让 codex 为我们复刻这个 ui, 然后我们看一下它复刻的 ui 效果怎么样, 然后我们就可以输入提示词,用最适合的前端技术复刻这个 ui 页面后面我们就跟上这个图像,然后直接运行。在这里可以看到它调用了前端设计的 skill, 在 等待了十九分四十五秒之后,它终于为我们完成了这个 ui 的 复刻。 复刻这个 ui 的 耗时真的太久了,我们如果用 cloud code 的 话,基本上不到一分钟就能复刻完成。然后我们打开看一下它复刻的效果, 可以看到它复刻的这个 ui 总体还算可以,然后这些表格内容跟原图相比效果还算可以。它复刻的第二个表格跟原图相比的话,确实非常不错, 它基本保持了原图中的这些布局,还有样式。好,接下来我们再用一个非常简单的智能体框架转换题来测试,让它将微软的智能体框架 out 站编写了一个旅游智能体的简单代码, 重构为谷歌的 adk 智能体框架。可以看到这个旅游规划的智能体代码非常少,甚至不到一百行,但是我们上次在测试 gpd 五点二的时候,它没有实现将这个智能体代码非常少,甚至不到一百行,但是我们上次在测试 gpd 五点二的代码非常少,甚至不到一百行,但是我们上次在测试 gpd 五点二的代码非常少,甚至不到一百行,但是我们上次在测试 gpd 五点二的代码。 好,下面我们可以看一下这个提示词,先让他阅读谷歌 adk 的 官方文档,然后告诉他将这个旅游规划的智能体代码重构为谷歌 adk 框架的智能体代码, 要求保持原有智能体的逻辑和功能,并未重构后的智能体加入 ui 操作界面。然后下面这里就是刚才我们查看的不到一百行的旅游规划的智能体代码。我们直接完整地复制这个提示词,然后粘贴到 codex 并且执行。 像这个简单的任务,我们就直接用 web 扣领的方式让它直接阅读文档和代码,并且直接进行改写。 像这个测试题可以测试 gpd 五点二 codex 模型的信息解锁与文档理解能力,还有代码理解与分析能力,以及跨框架迁移,还有重构能力,还能测试多任务协调能力。所以这个题目用来测试 gpd 五点二 codex 模型还是非常适合的。在等待了九分五十三秒之后, 他终于完成了将旅游规划智能体的框架重构为谷歌 adk 框架。下面我们就按照他给的步骤运行一下这个项目,打开之后我们看到了这个 ui 界面,然后再输入框,我们就可以输入任务,让他规划三天的尼泊尔旅行,我们直接发送。 下面我们看一下这个智能体的执行步骤,还有结果是否正确。首先是输出的三天的尼泊尔旅行的一个简单计划,第二部分是当地特色,还有深度体验, 这个是没问题的。然后第三部分,它给出了一个最终的旅行规划,在微软智能体代码中,这里还包含这个当地的语言专家会给出当地的这些常用语, 但 gpt 五点二 codex 它改写后的这个代码就缺少了语言专家这个智能体。所以这个测试题虽然它耗时将近十分钟,但它并没有复刻微软的这个旅行规划智能体所有的执行流程还有逻辑。 好,下面我们准备一个更加复杂的开发项目,让他开发一个 ios 原声背单词应用,这里给出了应用名称,目标用户。这里是具体的技术要求,而且要遵循 mvvm 架构模式,并且使用 swift data 进行数据持有化,还要实现单词发音功能, 还支持深色浅色模式。这里是具体的界面结构,包括首页练习,还有进度还有设置。下面这里就是核心的功能,包括单词卡片, 还有发音功能,还有收藏等。这个测试题我用来测试 cloud code, cloud code 能一次给出完全可以正确运行,而且包含所有功能的代码。在开发之前,我们先用 x code 初步化一个项目,这里我们就选择 ios, 选择 app, 下一步这里我们就输入项目名称,然后我们选择一个文件夹, 然后我们打开终端命令行,切换到刚才的路径,再打开 codex, 我 们先用 edit 命令让它来创建 agent 文件,这样的话它就能学到我们部署化后的这个项目的这些内容。好,这里运行完成耗时将近两分钟。 由于这个测试题目比较复杂,所以在 codex 中我们可以先让它为这个开发任务制定计划,我们直接调出它的计划模式,然后粘贴这个提示词直接运行,先让它根据我们的开发需求来制定一个完整的计划。 好,可以看到这里它调用了制定计划的 skills, 它这里只耗时四十八秒就完成了计划的制定,这个速度还是非常快的,然后这里它询问是否需要调整细节,第二个就是直接实现,第三个就是保存到这个目录,然后我们这里就让它根据计划直接实现。 由于这个项目比较复杂,它开发估计需要非常长的时间,我们直接略过这个开发步骤,直接跳到它开发完成的步骤,这里耗时将近三十三分钟,终于完成了这个项目的开发。下面我们在 xcode 中测试一下这个项目能否正常运行, 我们先点击运行,看一下能否正常的翻译好,这里提示报错,然后我们直接先复制一些报错发给他,让他来修复,这里修复完成,我们再测试一下。好,这里提示翻译成功。 好,这里又出现了报错,然后我们将报错发送给 codex, 这里提示修复完成,然后我们再运行一下,看一下这次能否正常的执行,然后还是出现了报错,我们还是让他来修复 好,这里提示修复完成,我们再运行这里,还是报错,我们还是发送错误给他,然后我们再运行, 还是出现报错,我们还是让他继续修复好,这里修复完成,我们按照他的提示清空一下模拟器,然后我们重新运行好,这里终于能正常打开这个 app, 但是这个界面竟然是英文的,他没有用中文的,可以看到这里可以正常做练习,这里终于加载出了单词, 可以正常翻转 line, 可以 听到能够正常播放声音。下面我们让 cloud code 分 析一下他开发的这个项目是否遵循了我们提示词中的 mvvm 架构模式, 然后我输入提示词,检查这个项目是否符合 mvvm 架构模式,直接发送 cloud code 很 快输出了回答,我们看一下他说这个项目部分符合 mvvm, 然后这里提到了所有代码都在这个文件中,约两千多行。然后我们在 xcode 中查看一下,可以看到这个文件中的这些代码真的达到了两千多行。然后这里就是需要改进的地方,应该拆分为多个文件,并且这里给出了典型的 mvvm 势利。 通过 cloud code 的 分析,我们就发现了这个非常不应该存在的问题,它将两千多行代码都放在了这个文件中,这是非常不应该的。好,通过测试可以发现 g p t 五点二 codex 它确实相比之前的 g p t 五点一有了一些提升。

谷歌 antigravity ide 现在终于支持 agent skills 了, 这是 open ai codex 支持 agent skills 之后,又一个 ai 巨头的编程之手,加入了 agent skills 阵营。所以说二零二六年正式成为 skills 元年。 ai 编程从传统的给 ai 编程工具一句提示词,让 ai 临时发挥, 升级为给 ai 编程工具装一套技能,让 ai 按照技能稳定产出代码。 agent skills 是 osopik 最初开发现已成为开放标准的智能体能力扩展格式。 它解决了一个核心问题, ai 虽然越来越聪明,但它缺乏你的领域知识,你的工作流程,你的最佳实践。 而 skills 的 作用就是把公司、团队甚至个人的工作流以及最佳实践,还有脚本等工具像模块一样打包进去,让 ai 编程助手等智能体按需加载,反复复用。所以我特别喜欢用一句话来区分 agent skills 和 prompt, prompt 是 临时指令,而 agent skills 才是长期资产。这次 anti gravity 支持 agent skills 的 意义非凡,尤其是对于非专业开发者,福利最大。 哪怕你完全不懂编程,不会写代码,也可以通过安装现成的 skills, 打造一个真正懂你业务的专属 ai 编程助手。 aging skills 的 本质就是 ai 专用业务手册,通过文件夹和 markdown 文件来打包知识工作流,最佳实践还有脚本、 ai 编程助手等 ai 智能体会,自动发现并且按需加载特定的 skills 来实现能力赋用,还有标准化, 而且是渐进式加载,从而避免上下文爆炸。好,本期视频教大家详显式我们如何在 anti gravity 中使用 agent skills 以及如何创建 agent skills? 并且我选择了一个最具代表性的 agent skills uix pro max。 我们将借助这个 skills 让 anti gravity 创建最为现代化,最为美观的 ui。 这个 skills 能让你在做界面时自动获得专业的配色,排版,布局,还有交互建议,来解决很多开发者做出的产品能用但不美观的难题。 好,想在 anti gravity 中使用 agent skills 非常简单。首先我们要确保我们已经将 anti gravity 升级到了最新版。 好,下面我们可以先测试一下在 antigraph 中使用 anselpic 官方发布的 skills。 anselpic 官方发布了多个 agent skills, 在 官方给出的这些 skills 中包含前端设计的 skill, 还有创建 ppt 的 skill。 下面我们只需要将这个项目克隆到本地。下面我们打开终端命令行,直接用 get 克隆的命令将这个项目克隆到我们本地。好,这里克隆完成,我们直接用 cd 命令进入到这个项目的路径。 根据 anti gravity 提供的官方文档,我们可以将 agent skills 放在这两个路径下,其中这一个就是我们当前的项目路径。如果只允许 agent skills 在 当前项目路径下加载,那么我们就可以放在我们当前的项目路径下。 如果希望 agent skills 在 所有项目中都能调用,那么我们就可以放在这个大局路径下。好,下面我们回到终端命令行,我这里直接用这条命令将 agent skills 放在官方推荐的这个大局路径下,我们直接运行就可以。 然后我们用 cd 命令进入到这个大局路径,然后用 l s 列出这些 skills。 好, 可以看到这里成功将这些 skills 都放在了这个大局路径下。 然后大家如果不习惯执行命令,也可以直接将这些 skills 文件夹全选复制,然后粘贴到 antigravity 存放 skills 的 这个路径下。像这样的话,在 antigravity 中,我们只要创建了新项目, 它都能调用到这个大局路径下存放的这一些 agent skills。 好, 下面我们就测试一下 ansopek 这一些 skills 中的前端设计 skill。 我们回到 anti gravity。 好, 下面我们就可以输入提示词,这里我输入的提示词是创建一个咖啡店的落地页,并且使用这个前端设计的 skill。 在 模型这里,我选的是 gemini pro 模型,因为这个模型非常适合用于前端 u i u x 设计。然后我们直接点击发送, 可以看到这里它正在搜索 skill。 这里它需要运行命令,我们允许它执行。好。非常神奇的是,它这里自动调用了 nano banana 模型来生成了这个网站所需要的这些图像。 然后我们点击打开,这是它生成的第一张咖啡馆内的这个景象的图像,这里放着一杯冒着热气的咖啡。这里它生成了第二张图像,这张图像是咖啡豆的图像,我们可以放大看一下。 anti gravity 自动调用 nano banana 模型来生成图像。这个功能是其他 ai 编程助手所不具备的,因为无论我们在使用 codex 还是使用 cloud code, 它们都不会自动来生成图像,而 anti gravity 它为我们开发这种前端 ui 的 时候,它能自动生成最为适配的图像。 好,这里提示这个咖啡馆落地页,这里已经创建成功,并且使用的是 next j s 还有 telenovela css。 然后下面我们就可以根据他给出的命令来运行一下,看一下效果。我们直接复制他给的命令, 然后打开 anti gravity 的 终端,粘贴这条命令,并且运行好,运行成功。我们直接打开这个链接,打开之后我们就看到了他为我们创建的这个咖啡馆的落地页面,然后这个页面的背景图像就是他刚才调用 nano banana 来生成的这个图像。 这里是这个页面的导航栏,可以看到设计的非常不错。然后我们继续往下拉,在这里他还将刚才生成了这个咖啡豆的图像 也加入到了这个页面中。可以看到它设计的这个咖啡馆的落地页非常精美,而且它用 nano banana 生成的这种配图效果也非常不错,这可以说是 anti gravity 独有的技能。 这样的话我们测试的是在 antigravity 中来加载已有的这一些 skills 项目。好,下面我们还可以测试一下手动创建这些 skill。 在 antigravity 官方文档这里,它给出了手动创建 skill 的 这些步骤,而且这里还给出了一个用于代码审查的最简单的 skill。 下面我们就可以使用官方给出的这个例子,在我们当前的项目路径下来创建这个 skill。 在 当前项目中,创建 skills 非常简单,我们只需要按照官方他给出的这个文件路径进行创建就可以 在 anti gravity 的 终端命令行,我们直接执行这条命令来创建用于存放 agent skills 的 路径。 好,这里创建成功,下面我们就可以将官方给出的这个案例放入到刚才我们创建的路径中,然后我们直接复制这个内容回到 anti gravity。 在 anti gravity 中我们就看到了刚才我们创建的这个路径,然后这里我们新建一个文件 昵名为 skill 点 md, 然后将刚才复制的内容直接粘贴并且保存就可以了。下面我们就可以测试一下调用这个 skill 进行代码审查,输入梯式词,使用 code review 审查当前项目的代码,然后我们运行可以看到这里它正在读 skill md 这个文件,正在分析这个项目的代码。 好,这里完成了代码审查,这里输出了代码审查的这个结果,这里还给出了用于优化这个项目性能的这些建议。这就是我们在 anti gravity 中通过手动创建 skill 并且调用 skill 的 方式。如果想创建更加复杂的 skill, 然后我们可以使用这个开源的项目 skillseeker, 我 在之前的视频中为大家详细演示过,然后如果不熟悉的话,可以查看我之前发布的这一期视频, 它可以一键将任何开源项目或者网站转为 agent skill。 好, 下面为大家演示这一款最强大的用于 u i u x 设计的 agent skill u i u x pro max, 而且它支持多种技术站,包括默认的 html 加 tailwind, 还支持 react next js, 甚至还支持 swift, react native, 还有 flutter。 想在 antigravity 中使用 ui ux pro max 非常简单,然后我们只需要按照官方给出的命令去执行就可以。我们直接先复制这条 npm 命令用于安装这个项目, 然后汇到 antigravity 中。我们直接在 antigravity 的 终端命令行粘贴这条命令并且运行就可以。好,这里安装成功。 下面我们就可以运行这条命令,针对 anti gravity 的 命令进行安装,然后在 anti gravity 的 终端直接粘贴这条命令并且运行就可以。好,这里提示已经安装成功。 在 anti gravity 中,我们只需要用斜杠命令就可以调出 u i u x pro max。 下面我们就可以来输入一个提示词。我这里输入的提示词是让它使用 react 构建一个 to do list, 要求使用拟物化的风格, 包括添加任务,完成任务,删除任务,而且还要具有柔和的阴影和微妙的紧身效果。然后这里我还是使用 jimmy 三 pro 模型,我们直接点击发送。像这样的话,在 anti gravity 中它就能够使用 u iux pro max 这个 agent skills 来获得 u iux 设计的经验还有最佳实践,从而为我们生成更加美观,更加现代化的 u i。 好 在等待了几分钟之后,这里完成了这个项目的创建,然后我们运行一下,查看一下效果。 可以看到这里他成功为我们开发出了这个你物的 to do list 的。 然后我们可以测试一下添加任务。注入这个任务之后,这里就会出现这个按钮,然后我们点击添加好,这里添加成功。然后下面的任务当完成之后,我们就可以点击完成,我们再添加一个任务测试一下。 好,这里添加成功,当完成之后,我们就点击完成。可以看到他设计的这个你物化的 u i 效果确实非常不错。 这样的话我们就实现了在 antigravity 中使用 u i u x pro max 这个 agent skills 项目实现 ui 设计。 agent skills 还有更多更实用的应用场景。 由于时间有限,本期视频只为大家演示了用于 ui 设计的 agent skills。 后续的视频中,我将为大家演示更多更实用的 agent skills 以及 agent skills 的 使用技巧和最佳实践。

今天刚刚刷到一个新闻, openai 它们的 gps 有 一个 data analytics 的 一个分析工具,然后和它的 codex 命令行的代码编码助手工具, 它们悄悄地都支持了 skills。 skills 是 最近 esoteric, 也就是 cloud 它们母公司 cloud code 它们支持的一个功能 或者叫工具,它主要的意思就是它会将所有的一些知识库文档,它会把它整理到一个文件夹下面,它文件夹会分成非常多的文件夹进行命名,在里面具体的文件夹下再写上这种 markdown 的 格式, 这些文档里面你就可以去存一些你的技能,你应该怎么样调用,存一些知识库或者存你的工作流描述都是可以的。 这样的话,这些智能体使用的时候,它就不需要加载很多工具,也不需要加载很多预构建的上下文,它可以自动动态的去加载它的上下文,它自己去发现上下文加载到它的上下文中再去完成任务,这样的话它的性能会提高的同时,而且它的脱口令消耗也会下降很多。 最有意思的就是 openai 悄悄地也支持了 skills, 而且国内的有一个代码助手也是最近也是支持了 skills, 因为 skills 它是一个非常轻便的知识库,可以这样说明,让大模型或者说让这些智能体它自己去加载,去动态地加载上下文。 最近这个技能框架已经悄悄地成为了行业标准,隐隐有一种取代 m c p 工具的一个趋势,因为这些 m c p 工具你可以把它写到 skills 里面,让这些大模型去执行这种代码沙盒来调用 m c p 工具 也可以,甚至这些 m c p 工具所有都不需要。 m c p 工具说白了它还是一个一段代码,你直接把这段代码放在它的 markdown 的 文件里面,作为视例参考,让这些大模型去发现了之后去附用这些代码就可以了。 这样的话它有一个特别大的好处,就是它非常的轻便,你在做能力或者技能扩展的时候会非常的方便,因为你 m c p 还是需要你人去自定义,自己去开发。但是这些 skills 只要智能体执行了之后,你 skills 或者说它的系统提示词里面,你给它写一句,只要你执行完成,你觉得是 ok 的, 用户觉得是 ok 的, 你就把这样的内容,你执行的整个过程或者代码去保存到一个新的 skills 里面,能力里面,下一次你进行执行的时候,哦,它就可以自动加载上一次成功的经验, 这样的话就能达到非常动态而且轻便的扩展能力的功能。这也是我们有一个智能体,未来可能都会改成这种方式,可能都不会再使用 find calling mcp 工具,调用的方式可能全部都只给他一个工具,就是 ko 的 沙盒还有 skills。


哈喽啊, chu 友们,这个和这个是我用 solo 加同一段 prom 做出的头像生成器网页,我们对比一下,看一看是不是右边的这个整个 ui 上看着更精致更高级。其实做它俩时的唯一区别就是我在开发右边这个网页的时候加了 skills。 是 的, chu 现在已经支持 skills 了。 skills 是 基于高标准的重复工作沉淀的可复用技能包,可以持续稳定地按照你的要求输出高质量的产物。 那么如何在 tree 里创建 skills 呢?有两种方式,第一种,直接在对话中描述你的需求,比如我这里对 ai 说创建一份能审查我的代码效果问题的 skill, 你 看 ai 会直接帮我写一个 markdown 文档,然后放在 tree skills 下面的对应文件夹中。第二种,从设置中创建, 点击设置按钮,进入规则和技能页面,在技能模块处点击创建。这里你可以直接导入现成的 skill 文件进行智能解析。因为 tree skills 是 基于开放的 agent skills 标准构建的,完全兼容社区生态。 当然,你也可以手动输入技能名称描述和指令,添加更符合你需求的工作流及工具调用。现在我添加好了一个前端设计的 skill, 我们在做图像生成器的时候就可以用到它了。你看在 ai 对 话流中可以看到它自动调用了这个前端设计 skill。 如果你的任务比较复杂或者需要持续稳定输出的时候,你也可以在 prompt 中明确告诉 ai 要用哪个 skill, 这样你就可以更精准的控制输出结果了。就像这个网页前端设计的优化一样, 使用 skills 是 可以帮你稳定地按照你的标准输出高质量结果的。除此之外呢,还可以自动化你的重复性工作流,甚至成为专业能力规范知识进行沉淀和分享的方式。所以快去吹 solo 中试试吧!中国版和国际版都有哦!

大家都知道现在 cloud code 是 现在最强的 ai 编程工具,但是很尴尬,它是闭源的,所以说今天给大家分享一个 open code, 它是一个纯开源的,为什么不直接我用 cloud code 就 行了呗,它肯定这个开源的还是比不过闭源的嘛, 是因为这个 open code 基本上一比一赋刻了这个 cloud code 的 功能和代码,基本上是一个逆向的项目,因为 cloud code 的 它的效果非常的好,所以说很多人 或者说我们都是想要去看一下这个 cloud code 它里面到底是怎么样实现的,可以借鉴它的一些机制,可以搬到我们的一些智能体项目上, 因为像这种通用的智能体项目,最强的基本上就是 cloud code 了,如果能复刻 cloud code, 或者说拿 cloud code 的 代码来去梳理一下,那么应用在自己的智能体上,那么你的技术肯定是很牛逼的,而且你的这个应用肯定也达到了现在比较前沿的水平。 ok, 所以 说今天给大家分享这个 opencode 的 这个项目,给大家简单梳理一下它是怎么样构建的。其实我最最重要的是关注它其实也是支持 cloudcode 的 里面的 skills 这个东西的,我想要看一下它是怎么样的一个流程去支持这个 skills 的。 其实 skills 大家都知道它非常简单,只需要读写的一些基础的功能,然后就完成了,但是还是有一些具体的东西你需要去查看的,要不然你自己去想当然的实现,肯定效果是不好的。 ok, 我 们也大概看一下这个,这个安装起来也跟 cloud code 是 差不多的,而且它的功能也是差不多的,此智能体去构建你的规则,构建你的 skills, 这些都是完全可以支持的,这就是这个项目。我也让这个 deep weak 去梳理了一下,我重点是让它梳理了一下它是否支持 cloud code 的 功能,它说它是 ok 的, 它是支持的,它原声也是在检测这种 cloud code 相似的这种文件夹,可以看到它们其实都是一样的,它检在检测这种 cloud code 的 相似的文件夹,你把它放在这种文件夹下面,它就能够支持 cloud code 的 skills。 这个功能 ok, 格式都跟 cloud code 的是一样的格式,我重点是想让它梳理某一个 skills 的 流程,是 怎么样去执行这些 skills 的 一些文件脚本啥的,它就给了我这样一个完整的流程。首先启动这个,它会扫描这个技能的一些目录, 看一下有哪些技能文件,然后解析这个 markdown 的 文件,它会把上面的一些原数据直接加载到智能体的这个上下文中,然后 智能体就知道它有哪些 skills 了。如果你的任务是需要调 skills 的, 它会根据这个原数据的一些提示词,自己去判断是否要调这个 skills 的 工具,然后去读取这个 skills 具体的内容,但是它是没有没有具体去说了,因为下面还有一些 geos, 它的一些脚本或者参考文件,它其实这里还要做很多循环,这样才是一个比较完整的 ok, 它其实扫描这些功能,它都说了,用两个这种关键词嵌入的方式进行的扫描和实现这些就很简单,其实就是用用了一个扫描工具就可以了, 扫描工具的一个脚本预先加载到你的智能体上下文中,然后我就说了一下它这个视力的话,只有一个 markdown 的 文档,而且很多这些 skills, 它还有一些脚本和一些参考的文件资料,它是怎么样看的?我也让它给我梳理了一下,它其实是专门做了一页一个 to 或者叫 m c p 工具也可以,他就用这些 m c p 工具去读取里面具体的一些参考文件,或者是专门写了一个工具去抓取这种脚本,在这个工具里面进行执行, 在沙盒里面进行执行,整个过程是这样的,我也让这个 notebook 整理了一下这个内容,可能会更加的直观清晰一点。 然后他就说了一下这个 skills 有 哪些好处。传统的一些智能体开发它的一些 prompt 上下文非常多,而且非常杂乱,很容易造成里面的一些混杂和冲突,智能体就会造成幻觉。 他就说了一下这些 skills, 它其实渐进式发现动态加载的一个过程,是由智能体自己去判断并加载,而且还有一些脚本是可以附用的,还有一些文件或者参考的数据,你是可以查看的。 ok, 他 就说了下去,为什么要构建这个 skills, 他 是想要按需的加载能力,而不是直接加载到大模型的上下文中。还有统一的资源访问,这些资源可以放在这个文件夹下面,然后由智能体自己去判断是否要去访问这些资源和信息, 可以安全地执行脚本,在沙盒里面执行了脚本,拿到这样的结果之后,然后再去返回到这样智能体的这个结果中。 还有就是这个系统的可维护性,它不像 m c p 工具需要比较重的这种开发,这个 skills 它非常轻,你的脚本开发起来也非常轻,你的 markdown 文件也是修改起来非常轻的。当然它也会带来这一个问题,容易被人注入一些恶意的内容,比如说你的 markdown 文件里面容易被人注入 去修改,当然这个你也可以做一下,它只读,或者说它直接把你这个内容 skills 的 内容直接打包发给别人,这个也是有可能的。 他就说了一下 skills 里面主要包含了什么内容。首先第一个内容就是它的说明书, skills 的 markdown 文件,第二个就是它的资源文件,第三个就是它的脚本,当然还有其他的一些资源文件其实也是可以有的。 这几个参考文件和一些具体的内容这个就不说了,其实最重要的我个人感觉啊是它的 markdown 文件的说明书,这个说明书可以写你的工作流程 以及你应该怎么样使用这些脚本,使用这些资源它可以给你这些资源和脚本说一个简单的一个说明, 它智能体它才知道什么情况下它需要去看这些资源文件和执行这种脚本,而且这种脚本它跟 m c p 是 有一定冲突的,或者说有一定竞争关系的。也是为什么现在很多自媒体或者说我们会觉得它其实是跟 m c p 有 一个替代的关系的, 这些脚本其实都可以把它看作为一个 m c p, 所以 说这个内容 skills 它是能替代掉 m c p 的 一部分功能的。 ok, 然后他就说了一下这个技能目录,它首先它会给智能体它的一个技能有哪些目录,或者说它的一个简要的介绍,然后再去按序加载你想要的那个技能, 解剖了一下它这个名字,这个就不说了,还有 skills 的 一个 markdown 的 文件,这个技能的说明书, 还有这个 jason 文件,其实主要的这个是不加载的,或者说也不用的,主要就是应用于这种你的 skills 的 一些用户的内容版本,以及它是否开源的一些许可证。 这个里面就主要放的一些可执行的脚本,这是一些模板,这是参考的资料,当然这三个都是资料,或者说一些脚本模板啥的,其实这三个把它放成一个也可以,这两个放成一个也可以, 这其实就是一些参考的具体的资料。马赛丹啊, pdf 的 这种具体的内容,这个就是一些静态的资源,比如说图片,你想要展示一张页面的时候,你其实可以加载这里面的图片内容。 case 这个就不说了,都是一些脚本类的东西了,这个可能没有理解到,就是版本作者和他的一些许可证啥的, 当然这个许可证也是防君子不防小人。这个 skills 有 很大的一个垢病的点,就是它的这种隐私性特别差, 很有可能你哪一个权限做得不好,可能智能体就直接把你的 skills 打个包丢给用户了, 或者你的竞争对手拿到了这样的 skills, 相当于你公司的一些精密文件,他就已经拿到了,他想要复刻的话就会非常的简单, 这也是很多人诟病的一个原因。之前都有一个 openai 的 data analyze, 呃,这个应用工具,它把有用户去做这种攻击和恶意注入这种提示词,让这个 data analyze 把它的 skills 的 一些文件打包成了一个内容发给了用户, 让人发现这个 open ai 的 data analysis 也是支持这个 skills 功能的。 ok, 它这个才是我最最想要知道的,就是一个智能体,它要包含什么样的工具或者说流程,它才能支持这种 skills 的 技能。 ok, 它就首先说了一下,发现所有的这个技能其实就是一个工具 tool, 这个工具专门列出所有的技能,并且加载 这个技能,它的一些描述就是它的原提示词了。第二个部分就是另外一个工具,就是加载某一个具体的 skills 里面的 md 的 内容, markdown 的 论文内容。 第三个就是资源访问的工具,你直接输入这个 skills 它的文件,然后会可以查找到有哪些文件是你可以用的。 第二个就是把里面具体的文件拿出来读,然后就是执行工具了,就是你的这个脚本它的脚本怎么样抓取,然后在一个沙箱里进行执行,这就是 run skills 的 一个 script, 其实就是执行脚本了,在沙箱里面执行脚本,这里一定要非常的注意,它执行出来的结果,会返回给这个智能体,当然外部还要做一个智能体,去收集这些工具,执行出来的结果就应该返回一个数据, 这个工具就要做一下,而且这里一定会做一些这种安全性的或者权限的一些限制避免,比如说你不想让他上网,或者不想让他去访问某一些文件夹,在这儿的时候一定要做一些操作,要不然就会造成让人诟病这个 skills 的 原因啊。 然后运行的工作流,比如说一个完整的智能体交互,用户帮我清洗这个数据表格模型,就发现它的有一个技能是可以清洗这个脚本的,然后它浏览了这个目录,它是有这样的一个技能哈,然后它就加载了这个技能的 down 的 文件, 然后根据这个 markdown 里面的文件的工作流,用这个 skills 里面的有一个脚本去执行这样的一个脚本,然后在沙箱里面运行完成,沙箱里面完成的这个结果就会返回给大模型,或者说返回这个文件的 id, 然后大模型就可以用这个文件的 id 再去调用一个工具,再把这个文件返回给用户就可以了,整体就是这样的一个完整流程, 但是一定要注意避免暴露真实的路径,不要让大模型知道在你电脑上的一个真实路径就是容易出问题。还有就是这种 skills 一定访问方式是只读的,它唯一能做的就是它沙箱里面可以执行代码,而且只能在沙箱里面执行代码,避免用户的一些提示词注入的攻击。 他也说了一下,必须要做一些沙箱的一些管理,比如说工作目录的隔离,网络的控制,你到底想不想你的脚本可以访问网络,这个也很重要。还有就是依赖一定要可控,比如说在这种 docker 里面做执行 脚本的白名单,嗯,能不能执行哪些脚本?或者说只能执行那个 jason 文件,在权限文件里面的一些特别的脚本, 它那个节省文件也还可以做一些限制的哈。其实这个 skill 它设计的时候是考虑到了这个问题的,如果你没有做好,其实是你没有详细去看它这个设计, ok。 写入路径的限制也是很重要的,其实不能把它写入路径的限制写死,甚至你不能给他,你最多就是在沙箱里面跑。当然如果你需要访问的,我建议你就直接把这个文件直接丢到沙箱里面去,把沙箱里面的路径把它写死,这样可能会更加的安全一点。 然后就是一些版本和权限管理了,主要是节省文件里面的,还有它也强调了一下这种权限一定危险性,人员和内容和止读,其实止读就已经可以解决大部分问题了。 第二个就是可以用这个文件进行授权,好,这个后面就没啥了,主要的一些框架。如果说你想要构建这样的一个支持 skills 的 智能体,那么应该要做哪些工作?首先你要有这个 skills, 然后 可以列出这些 skills 的 一些原数据,然后可以加载这个工具,要有。然后就是列的一些工具,读取的一些工具,还有执行脚本的一个沙盒工具,工作区要隔离和这种核心安全的一些内容。 还有这种版本号啊和一些权限控制,这个也是非常重要的,这个就是今天的一个内容,就是教大家怎么样去做一个智能体,可以支持现在的 skills?

嘿,大家好,咱们今天聊个开发者都关心的话题,你是不是也受够了那些 ai 编程助手又贵,账号又动不动就被封?那如果我告诉你,有一套方案,不仅功能强大,而且完全免费,关键是它完完全全由你掌控,你会不心动? 行,那今天咱们就来好好拆解一下这个开源神器,他可能会彻底颠覆你的工作流。你看,这话简直说到了心坎里,很多朋友,尤其是咱们开发者,估计都被可 low 的 这类工具的账号和费用问题给折磨的不行。 本来嘛, ai 助手应该是来帮我们减负的,结果呢,高昂的订阅费,还有那种随时可能被封号的焦虑感,反而成了新的负担。所以我们今天就是来解决这个问题的,而且是彻底解决。 是的啊,这可不是危言耸听,原作者就分享了他自己的真实经历,可以说是相当惨痛了,他兴冲冲的订阅了 cloud pro, 结果你猜怎么着?两个月里账号被封了两次, 两次,你说这找谁说理去?再加上每个月轻松轻松就花掉几百块的订阅费和 a p i 费用,这对于重度用户来说,真的是一笔不小的开销啊。 所以你看,问题的核心啊,全在这张对比图里了。左边就是咱们现在熟悉的旧方案,比如说 klaus pro, 总结一下就是成本高,只能用它那一个模型,最要命的是还有被封号的风险。 再看右边就是咱们今天要介绍的新方案,不仅能做到几乎零成本,还能让你连接超过七十五种不同的模型。最关键最关键的一点是,你的数据,你的工具控制权完全在你自己的手里。 好,那这个听起来这么神奇的新方案到底是个啥呢?其实它是由三个核心组建构成的, open code、 o、 m o 还有 skills。 别急,接下来咱们就一个一个的拆开看看,看它们仨是怎么打配合实现这个强大目标的。 首先是这整套方案的基石, open code。 简单来说,它就是一个开源的 ai 拼成吨, 它最大的好处是什么?就是让你彻底摆脱被任何一家大厂绑架的困境。不管是国外的 gpt、 cloud, 还是咱们国内的 glm, 甚至是你没听错,甚至是你在自己电脑上跑的本地模型,它都能无缝接入。 这就意味着你终于可以自由地去选择哪个模型最适合你当下的任务,而不是只能被动地接受厂商给你的那一个。 但是你以为 open code 的 厉害之处就只是模型的灵活性吗?那可不止,它还有一个真正的杀手锏,就是这个, 它完全兼容 cloud skills 的 生态。这话什么意思呢?意思就是社区里已经存在的成千上万个现成的功能强大的技能包,你都可以直接拿过来免费用,即插即用,懂吗?一下子就能让你的 ai 助手战斗力翻倍。 咱们刚才一直说免费,这才是关键点,那到底是怎么做到零成本的呢?很简单,通过 open call, 你 可以连接到一个叫 g l m 杠四点七的模型。 根据原文作者的分享啊,这个模型目前是限时免费的,当然他的性能可能比不上那些最顶级的付费模型,但是对于咱们日常的编程调试、代码重构这些工作来说,他绝对是绰绰有余了,这就相当于给了你一个超级强大而且还不用花钱的起点, ok? 如果 open coder 只是一个能连很多模型的终端,那其实也还不够惊艳。真正让这套方案封神的是我们可以给它装上插件,把它从一个普普通通的对话工具,直接升级成一个智能的写作平台, 那这就是 o m o。 插件的魔力所在。一旦你装上它,你的 open coder 不 再是一个简单的聊天窗口了,它会变成一个 ai 团队的工作台。 这个比喻特别形象,你不再是那个埋头苦干的马农,而是直接升级成了项目经理。 你只需要下达一个比较宏观的指令,比如说帮我开发个小功能, o m o 就 会自动把任务拆解,然后派给不同的 ai 智能体去分头执行,可能一个负责写代码,一个负责做测试,还有一个负责查文档,最后他们一起协同完成,再把结果汇报给你, 扣不扣?最后就是咱们这套组合拳的第三个核心组建 skills, 也就是技能。这个 skills 到底是个啥?你可以把它想象成咱们编程里用的函数库,或者玩游戏时候的技能快捷键, 它能把一整套复杂的专家级的操作流程打包成一个超级简单的命令。这样一来,以后再碰到类似的任务,你再也不用吭哧吭哧写一大堆复杂的提示词了, 只要喊一声这个 skill 的 名字, ai 就 能自动帮你搞定一整套流程,这本质上就是把你的经验变成了一个可以无限附用的工具。 咱们来看几个具体的例子,你就马上能感受到 skills 的 威力了。比如这个 obsidian skills, 能让你用一句话就直接生成那种非常精美的思维导图和笔记。还有这个 superpowers, 它更厉害,简直就是一套完整的软件开发工具集,从需求分析到代码审查,方方面面全都给你包了。 最绝的是这个 skill creator, 它能让你把你自己独特的工作流程也打包成一个专属于你的 skill, 实现知识的真正辅。 好了,说了这么多,你是不是已经摩拳擦掌,跃跃欲试了?先别激动,也别担心会很复杂。整个配置过程说出来你可能不信,简单到出乎意料。 接下来咱们就一步一步地走一遍,我保证,大概也就是一刻钟的时间,你就能从零开始,搭建起一个完全属于你自己的 ai 团队。整个过程啊,真的就这么简单,拢共就四步,第一步,在你的终端里敲一行命令,把核心程序 open code 给装上。 第二步,连接咱们说的那个免费模型,这一步它会自动弹出一个浏览器,让你登录授权,完事之后把那个 api key 复制粘贴回来就行。 第三步,同样是一行命令,把我们刚才说的那个项目经理插件 o m o 给装上。最后一步,也是最酷的一步, 你连命令都不用敲,直接在对话框里跟 ai 说,哎,帮我安装那个 obsidian q, 然后它就自己去搞定了。 对咱们开发者来说,全程真的就是几号命令的事儿。那么这套系统打好了,在实际干活的时候,到底表现怎么样呢?原作者分享了一个特别棒的例子,他就输入了这么一句非常简单的话,画一个 canvas 解读金字塔原理。 大家想想,这个任务其实相当复杂对吧?他需要 ai 先理解再总结,最后还要用可式化的方式把一整本书的核心思想给呈现出来。 结果呢?你猜用了多久?从他下达指令到 ai 自动分析总结,最后生成一个结构清晰、内容完整的知识数思维导图,整个过程只用了不到两分钟。两分钟啊,朋友们,这简直完美地展示了这套系统自动化复杂任务的惊人能力。 你自己想一下,要是靠咱们自己手动去做这件事,查资料、画图,每个半小时,一个小时能搞定吗? 当然了,咱们也得实事求是,世界上没有完美的工具。为了让大家有一个全面的认识,在结尾这里我们也需要非常客观的聊一聊这道方案的一些局限性和你需要注意的地方。 所以在你动手之前,有三句大实话你一定要记在心里。第一,它不是万能药,免费的 g l m 四点七虽然够用,但你要说跟最顶级的付费模型,比如 cloud 三点五比,那能力上肯定还是有差距的。 第二,免费这事不会是永久的,未来很可能会变成按使用量付费,但即使是那样,用多少付多少,也比那种死贵的包月并月要划算得多。 第三,这道方案毕竟是为开发者设计的,所以你需要对命令行、对村端操作有一定的熟悉度。尽管有上面说的那些前提,但原作者最后还是给出了一个非常有利的结论, 他说你花上一点时间来配置和学习这套系统,最坏的结果是什么?不就是浪费了半个小时吗?但是最好的结果呢?你可能会因此发现一个全新的工作方式,一种拥有整个 ai 团队为你服务的感觉, 一旦你习惯了这种感觉,就真的再也回不去了。所以这就把我们带回到了最初的那个问题,拥有一个完全属于自己的,可以随心所欲定制的 ai 智能体团队,这会是咱们编程的未来吗?这个问题其实没有标准答案, 也许只有当你亲手去搭建、去体验过这大系统之后,才能找到那个属于你自己的答案。

这个 agent skill 每天可以节省你好几个小时,直接用它和你的 ai 对 话,就能自动连接 notebook lm。 我 之前用它生成了一段播课全程,完全不需要手动操作。网页 and apple chose, google's gemini to power the next generation of siri it's not just a friendly deal i think you described it perfectly before it's a shared vote a shared vote。 安装方法特别简单,下面手把手教你。首先你需要一个支持 skills 的 客户端,目前 cloud, opencode and gravity 等都支持。然后把 github 上这个项目页面发给你的 ai, 告诉他帮你安装这个 skill 就 行。 安装完成后,比如在 opencode 中,需要把这个 skill 加载的配置文件用同样的方式把这个页面发送给 ai, 他 会按照文档帮你配置好。成功后你就能看到这个 skill 了。现在让 ai 调用定制 skill, 自动搜索近期硅谷科技动态,汇总信息,并同步到 notebook i m, 最终生成一段定制薄刻整过程完全自动化,体验非常流畅。你甚至可以设定每日定时任务,让它自动为你完成这些工作。这样一来,就不再被动接收碎片化信息, 而是每天收获一段高质量的薄刻,轻松节省下几个小时的信息整理时间。而这个 skill 的 强大还不止如此,只要是 notebook i m 上有的功能,它全都可以调用,更多好用的玩法等你来发现!关注我,了解更多 ai 干货,感谢大家观看!

三十秒看完今日 ai 要点首先,三 d 动画制作要被 ai 全自动一条龙搞定了。腾讯放出狠活 vise, 一 条 ai 工作流把骨骼生成智能蒙皮,动画生成智能插针全面打通, 直接进入游戏制作,制作工期从几天压到了几分钟。其次,叉七 p t 可能要迎来技能系统。外媒爆料 open n i 政策是 skills 功能,像装了个技能包,把复杂工作流直接交给他。 最后,字节发布形式化数学推理专用模型,专攻高难度的数学问题。它能像数学家一样一步步写证明,并自动调用工具进行推理、检查、修正,最终得出证明结果。今日还有如下信息值得关注, ever ai 每天带你了解 ai 新鲜事!


这两年做 agent, 名词一波接一波, m c p skills agent at r m d。 别混着聊,它们各管一层,让大模型从聊天变成稳定干活。一个比喻讲清楚, m c p。 是 统一插件,负责连接上外部数据和工具。 agent 点 m d。 是 给 agent 的 readme, 负责让他在仓库里按规矩做事。 skills 是 可插拔的 s o p。 加工具箱,负责把流程知识打成模块,按需加载。 所以有了 m c p, 为什么还要 skills? 因为插座只负责管电,不管怎么把活干对。 skills 的 核心是渐进式,譬如 先露出技能和简介,用到哪一项带读对应的 skill 点 m d。 细节,在拆到参考文件里,需要时才翻信息,按需放大上下文才撑得住。 更硬核一点, skills 可以 带代码确定性的步骤,交给脚本跑模型负责判断和沟通,结果更稳,更可付现, 但不可信。来源要审计 open ai 会不会跟,至少 cortex 已经落地。选中 skill 就 注入 skill 点 md, 每个 session 只加载一次,怎么开始? 别一口气做全公司技能库,先挑一个最复杂最容易翻车的流程,一个文件夹加一个 skill 点 md, 减轻交付物触发条件,需要外部系统再用 mcp 去接。 一句话收尾, m c p。 让他连上世界。 agent d m d。 让他懂规矩 skill, 让他按 s o p 干活。我是博导,欢迎关注。

大家好,我是小木头。在最近的视频分享中,我们介绍了许多关于 agent skills 方面的内容。在分享中,有许多朋友也反馈到, 受限于 cloud 或 cloud code 访问,无法很好地体验或使用它。那本期视频咱们就来分享一套解决方案,帮助大家更加自由地、更便宜地玩转 agent skills。 我们会介绍的是基于 open code 这款目前非常流行的开源编程智能体。咱们以智普 g o m 大 模型为例,来看看如何在 open code 环境下,通过 g o m 大 模型来驱动 agent skills 的 运转。那现在就开始今天咱们的分享吧。 首先咱们对今天分享的两个主角做一番介绍。第一个是 open code, 这是近期非常热门的一款开源 ai 编程智能体, 他支持绝大多数主流的大模型供应商。作为一款开源项目,他在 github 目前已经接近到了六十七 k 的 小星星,非常非常的热门。另一个主角就是 g o m 智谱大模型, 当前最新版本是四点七,在编程能力上,它已经非常非常的接近于 clod opus 四点五。如果大家无法访问 opus 四点五呢?不妨采用 gm 四点七来做日常的编程工作,也是非常有效的。 智谱大冒险目前也给到了开发者套餐,有不同的规格的选择。在 opencode 也支持了两种方式的接入,一种是基于 coding plan, 另一种呢是 apikey。 在 后续演示中我们马上会看到。那介绍完主角,现在呢,我们就来实测一番, 看看如何安装 opencode, 如何集成 g o m 的 大模型。最后呢,来看看如何加载,如何使用 agent skills。 opencode 安装非常简单,这里呢有一行命令复制运行就好, 有多种的安装方式,还可以通过 n, p, m, bomb, brew 等不同的方式来安装。我们以 curl 命令为例, 一键的安装非常方便,目前最新版本是一点一点一八,使用方式与 clockcode 几乎一模一样。来到对应的项目目录,通过 opencode 命令启动命令行接口就好。 opencode 不 仅仅提供了命令行的接口,咱们还可以通过不同的方式集成到格式化的界面中,比如集成到 vscode。 今天的演示呢,我们还是以命令行为主,现在咱们输入 opencode, 在 next just ballerplate 这个项目当中运行 open code。 首先我们要做的是连接模型供应商,要配置模型供应商,咱们通过 connect meaning 来完成。 通过 slash connect meaning, 我 们可以选择自己期望使用的模型供应商。我们搜 z 点 ai, 这就是质朴大模型的供应商。 目前支持两种集成方式或接入方式,一种呢是 z 点 ai 这种,这个呢就是基于 api key。 另一种呢是 z 点 ai coding plan, 这个呢就是给予大家订阅的套餐。我们以 api key 的 方式为例, 选择 z 点 ai, 在 这里需要输入一个自己有效的 api key, 大家在智普的控制后台 api key 这里创建配置就好。完成配置后,选择自己期望使用的模型, 我们以四点六为例吧,一切就绪,那现在呢,我们就可以像日常氛围编程那样,通过问答的方式开始编辑代码了。 现在呢,我希望他对 api os 代码实现呢做一番审核。这是一个非常简单的对话场景,从功能上来讲呢, api 调用成功,我们也能够看到模型对代码的审核, 这并不是今天咱们分享的重点,我们重点想要分享的是如何在当前的这套开发环境中集成 agent skills 并且使用它。 现在我们回到 opencode 官方文档,在这里呢有一个独立章节, agent skills 做了非常详细的介绍。关于配置有两种级别,一个是项目级别的,一个是全局的。 项目级别的呢,就在 dot opencode skill 底下放置对应的技能包,而全剧的呢,是在用户的主目录底下 dot config opencode skill。 另一方面, opencode 还对 cloud 做了兼容,也就是说在 cloud 配置的 skill, 它也能够自动地识别加载, 这对大家来讲就非常的方便了。我们以全局的配置为例吧,在主目录下到 config open code, 我 们看看有没有 skill 目录。在初次 open code 完成安装后,是没有这么一个目录的,那么我们来创建一个就好。 接下来在这个 skill 目录下放置自己的技能包文件夹。在上一期的视频分享中,我介绍了自己开发的 agent skills 已经上传到了代码仓库,我们就以它为例吧,我将这个代码仓库的名字呢做了一番修改,因为用 agent skills, 那 我再声明 技能包或插件市场的时候呢,不能使用 agent skills 这个名字。咱们以 next js security scan 这个技能包为例,实际上这个技能包已经在我本地的代码仓库里,那么我将其拷贝到 open code skill 目录就好。 拷贝完毕,技能包呢,也正确地被放置在了 open code skill 目录之下,我们可以直接回到 open code 对 话界面,这里 我们直接提问他是否能够看到这个技能包,看起来呢,他已经加载成功了,接下来我们要做安全扫描就变得非常的简单了, 我们可以通过对话的方式让他对一些代码进行扫描,比如让他扫描刚才他已经阅读过的 office api 的 实现, 我们给他一些时间看看扫描的结果如何。好了,扫描完毕,现在他给到我们一个比较完善的改进报告,其中呢,对不同级别的问题呢,都做了总结。如果看过上一期视频的朋友应该能够 看出来,这个报告呢与上一期视频扫描出来的呢是几乎一样的。那上一期呢,我们是用的 curl code, 看起来 glm 模型也不错,至少在这个技能包的加持下,对安全问题安全漏洞的扫描呢,效果还蛮好。如果需要呢,我们还可以针对某一个级别的问题让它展开更加详细的介绍, 比如我们让他把低优先级的问题呢展开来介绍一下细节,我们来看看细节信息。这正是在上一期视频分享中也提及的几个依赖包的升级,在老版本中 都存在着不同的安全漏洞,扫描的报告中都给到了我们同样的建议,将这些依赖包呢升级到最新版本来规避掉安全风险。好了,这就是咱们今天所做的分享, 当然不仅限于目前我所分享这个技能包,大家完全可以将目前市场上非常热门的好用的技能包放到 open code 来帮助大家提高日常的开发效率。那大家在日常的使用中有哪些好用的技能包呢?也欢迎在评论区给咱们留言。 那今天的视频分享就先到这里吧,受限于 clockcode 访问的朋友不妨试试 opencode, 看起来效果也不错哟。那咱们就下期视频分享,再见同学们,拜拜!