打开这个平平无奇的命令行窗口,输入 open code, 回车,现在就激活了 ai 神力的模式,把公司一堆财务数据表格直接拖进去, 然后输入对表格数据进行摘要分析,并可识化为车。不到一分钟,他就自动帮我们生成了一份包含六张专业图表的分析报告,甚至连相关性分析都做好了。 把喜欢的视频链接扔进去,输入下载视频到当前目录,回车视频自动下载到了本地, 本地文件乱的像猪窝。把文件夹路径给他,让他整理一下文件夹回车,文件瞬间归类的整整齐齐,甚至还能直接帮我们拣写学术综述论文,只需要将题目发送给他, 让他帮我们剪辑总结刊写。现在我们只需要喝杯茶,一万多字,一百多篇参考文献的综述 就生成了。这些操作全都归功于最近火出圈的 agent skill, 可以 说是近期最能提升效率,最值得折腾的 ai agent 了,我亲测呢,非常值得拥有。 那今天我们就手把手带大家配置和使用,并且毫无保留地分享我私藏的十个超好用的 skill 视频。最后我还会教大家定制专属于自己业务的 agent skill, 点好收藏关注,赞! let's go! 那首先要拥有这个绳力,我们需要一个代替,就是 open code, 它是近期呢热度最高的 ai 编程终端,你可以把它看作是一个免费版,开源版的一个可乐的 code, 最大优势呢是对咱们中国用户呢特别友好,不需要魔法呢,也能顺畅使用。而且内置的像 glm、 四点七、 mini max 二点一这些很强的一个免费模型,安装起来呢也非常简单, windows 用户呢,我们推荐使用 note gs 方式, 我们先来安装 note g s, 下载对应的安装包,直接双击安装一路 nex 呢即可。接着呢,我们来安装 open code, 我 们首先进入 open code 官网,点击右上角的 free, 我们直接复制第二行命令,然后 windows 加二,输入 cmd 回车,然后粘贴我们刚才拷贝的命令回车,这样我们就安装完成。输入 open code, 出现 open code 的 界面呢,就代表我们安装成功。 open code 最棒的呢是它内置了一个免费模型。我们输入杠 model 可以 看到右边带 free 的 呢,就是我们的免费模型,这里面有 g l m 四点七以及 mini max 二点一。 这两个国产模型的编程能力和中文能力呢,还算是比较强,我们直接使用上下格选择即可。当然了,如果你想使用更强大的一个模型,有个神级插件 open code and gravity, 我 们直接访问它的 github 主页,然后复制这行命令粘贴到 open code 中执行。我们等待 ai 自动完成安装, 显示需要登录的时候呢,我们直接打开新的命令行窗口,然后拷贝命令粘贴,然后回车。模型供应商呢,我们来选择谷歌 登录方式呢,选择 antigravity。 我 这里呢已经登录,大家第一次登录的话,在浏览器中会自动跳转到谷歌浏览器,让我们来登录谷歌的账号。 我们登录完成之后,复制生成的 u r l 粘贴到命令行的选择回车,就完成了一个配置,然后输入杠 model。 此时呢,我们就可以在谷歌这一栏就可以看到有 cloud office 四点五以及 dreamline 三 pro 的 一个免费模型。 好了,重头戏来了,我为大家精选了十个呢,能让你的工作效率原地起飞的一个 scale。 第一个 scale 是 数据分析神器,这呢也是我常用的一个 scale, 不 管是销售报表还是科研数据,丢给它呢,它不仅能总结,还能自己写 python 代码来画图。这是公司的一个财务数据,包括产品收入、利润等信息。 我们直接拖动到 opencode, 然后输入对表格数据进行摘要分析和格式化。 opencode 呢,会直接输出这样包含六张格式化图的一个财务数据分析报告,甚至呢,连相关性分析图呢,也是一目了然。 第二个 style 呢,是文件整理助手,如果呢,你跟我一样下载文件夹呢,永远是乱的。 这个 skill 呢,就必装,它能理解文件名,把电影文档、安装包等等各样的一个文件呢,进行自动的一个归类,甚至呢,还能帮我们删除重复的一个文件。我们只需要输入帮我整理一下下载文件夹 回车。然后呢,它就会自动地进行分类,重命名,清理重复文件。我们无需花精力呢进行繁琐的手动整理了,这是 ai 帮我自动整理后的一个效果。 第三个 style 呢,是视频下载器,这个功能呢,简单粗暴呢,但超级好用。我们把喜欢的视频链接呢粘贴进去,然后输入下载视频呢,到当前目录 回车。我现在呢,就用它来下载视频,不用到处再来找下载器,命令行里一句话呢,就能搞定,干净呢又卫生。第四个 skill 呢,是知识库问答, 这个 style 呢,我也是非常喜欢。如果呢,你把一堆的 pdf 文档, youtube 链接呢,都丢给了谷歌的 notebook lm 里,就可以让 oppo code 直接去读取你 notebook lm 里的知识库,然后基于你的知识库呢,给出待引用的一个答案, 这样呢,就有据可依,减少的一个瞎编。使用前呢,我们需要先进行身份的一个验证,复制这行命令,然后输入到 opencode 中回车。通过身份验证之后呢,我们就可以直接进行提问了, 我们拷贝自己 notbook 的 一个链接,然后粘贴到 opencode 中, 比如我问他深度学习模型呢,如何通过政策化技术来防止过紧核,可以看到它是基于我们笔记本的知识库的内容来进行的一个回答,这样就完全杜绝了 ai 瞎编乱造的一个毛病。 第五个 scale 呢,是医学影像 ai 文献综述 scale。 这个 scale 呢,对学术研究者来说简直是神器,它可以拷写医学影像 ai 研究领域的一个文献综述输入,帮我拷写医学影像大模型研究综述, 它能自动地把我们检索文献,总结摘药。最后呢,生成一个一万多字的一个综述,出稿 八个章节,一百一十篇参考文献,甚至呢,还推荐了八个复图以及后续计划和目标期刊的一个建议, 这就很离谱了。当然这个 scale 的 思路呢,完全是可以迁移到我们自己的研究领域,大家呢只需要修改一下配置呢就行。 第六个 scale 呢,是 word 文档处理 ai 生成的内容呢,通常都是马克当的一个格式,转 word 呢,还有排版就非常的一个麻烦。而这个 scale 呢,就可以让 ai 呢去自动地进行 word 生成,编辑和分析。 我们直接将一个马克当的文件呢拖入进来,然后让它转化成 word。 现在呢,可以看到它已经自动地在调用我们的到可技能。 我们打工人的周报合同一键生成 word 呢,对经常需要交付 word 文档的职场人士来说呢,确实是,还是非常实用的。第七个 scale 呢,是 ui 设计大师。 这个 scale 呢,在 github 上呢,已经收获超过一万多个 star 了。它能够分析我们的项目需求,并生成一套完整且量身定制的一个设计系统, 配色、字体组建规范,甚至 css 代码呢,都给我们准备好了。这是我前期开发的一个 ai 专利,写作智能体的一个界面, 我直接输入帮我设计新的一个 ui 主键和页面,然后这是一键优化后的一个效果,我们再也不用担心 ai 做出来的网页呢, ai 味儿太浓了。第八个 scale 呢,是 scale 创建器。如果你觉得以上的 scale 呢,仍然无法满足你的需求, 这时呢,我们就可以用这个 scale, 它是 arropic 官网出的一个原技能, 通过对话式引导的方式呢,就可以帮助我们生成符合官方规范的一个自己专属的 scale。 比如呢,作为自媒体博主,我想让 ai 根据我的视频脚本呢,自动地推荐爆款的标题,转载视频简介以及推荐标签。此时呢,我只需要告诉他我的需求,他就能够帮我创建一个专属的 scale, 输入我的需求。 然后呢,将我之前自己写的一个提示词呢直接拖入回车,这是 ai 帮我直接生成的一个结果,然后这是他帮我写的 scale, 点 md 的 一个文件。第九个 scale 呢, 自媒体神器,这就是我用上一个 scale creator 做出来的我自己私人的 scale, 它可以根据脚本或者字幕内容的一个标题,视频简介以及 时间轴和标签。以前呢,我都是自己写提示词,拷贝到 ai 中来手动执行。现在呢,我们把字幕文件呢直接拖进来,这是一个字幕文件,我们直接拖入到 open code 中,输入帮我生成视频的标题和简介。 回车可以看到 open code 呢,会自动地识别任务来调用我刚才创建的一个 scale 进行分析,这是他帮我推荐的十个标题以及视频简介,时间轴和标签。今天的视频标题呢,我就是通过这样的方式来生成的。最后呢,来给大家介绍一个宝藏的仓库, 在这个仓库中呢,收入了有六十多个主流场景的一个 skill, 包括各类文档的一个处理,开发工具的一个集成、创意设计辅助、学术研究、写作支持、安全取证分析等等。强烈建议大家呢收藏。 说了这么多 scale, 我 们来看看具体到底应该怎么部署 scale 呢?是从放在点 open code gos 文件夹下的一个功能模块,如果我们是使用局部技能的话,就放在当前项目根目录下点 open code gos 目录之下, 此时呢,所有的技能呢,就仅当前项目可用。如果我们想所有的项目都通用的话, windows 用户呢, 直接放在用户主目录下的一个点, config open code scales 这样的一个目录之下,我们直接演示一下新建一个项目的一个文件夹,我们命名为 scale project, 然后打开文件夹,接着新建一个点 open code 这样的一个文件夹,再新建一个 scales 的 文件夹,大家注意这里有一个 s, 现在呢,我们就可以将 scales 文件夹直接 copy 过来, 这就是本期视频中涉及的所有十个 scale。 我 们要在当前项目之下使用 scale 的 话,直接进入项目的一个文件夹,右击点击,在终端中打开,然后输入 open code。 接着呢,我们输入我有哪些 scale, 此时呢, iphone code 呢,就会显示当前我们项目中存在的 所有的一个 scale。 我 们再来看一下 scale 的 一个文件规范,每个 scale 的 核心呢是 scale, 点 md 文件,我们任意打开一个 scale 看一下, 其核心呢就是这个大写 scale, 点 md 这个文件我们直接打开可以看到呢,首先是原数据层,六个横杠包裹的这部分,它包括两部分内容,一个呢是技能的一个名称, 另外呢就是对技能的一个简短的一个描述,应该会根据这个来判断是否需要加载该技能。第二层呢是指令层,这个呢是必须的。 第三呢就是资源层,包括 script, 它里面呢是可执行的一些程序脚本,参考文件夹会放置一些参考文档, asp 文件夹里呢会放一些图片等资源。那最后呢,关于怎么来用这些 scale, 其实逻辑非常优雅,你把这些 scale 文件放在项目里,或者配置成全局技能, 当你提问时呢, open code 会先扫描这些技能的一个目录,也就是原数据,如果有需要,它才会去加载详细的一个指令, 这种按需加载的方式既省 tokyo 呢,又让 ai 变得巨聪明。我把今天提到的所有 skill 的 下载链接, 还有详细的配置教程呢,都会放在评论区。好了,以上呢,就是本期视频的所有内容,如果这些 skill 对 你有帮助,记得点赞收藏关注,我们下次再见!拜拜!
粉丝5.5万获赞15.7万


哈喽啊, chu 友们,这个和这个是我用 solo 加同一段 prom 做出的头像生成器网页,我们对比一下,看一看是不是右边的这个整个 ui 上看着更精致更高级。其实做它俩时的唯一区别就是我在开发右边这个网页的时候加了 skills。 是 的, chu 现在已经支持 skills 了。 skills 是 基于高标准的重复工作沉淀的可复用技能包,可以持续稳定地按照你的要求输出高质量的产物。 那么如何在 tree 里创建 skills 呢?有两种方式,第一种,直接在对话中描述你的需求,比如我这里对 ai 说创建一份能审查我的代码效果问题的 skill, 你 看 ai 会直接帮我写一个 markdown 文档,然后放在 tree skills 下面的对应文件夹中。第二种,从设置中创建, 点击设置按钮,进入规则和技能页面,在技能模块处点击创建。这里你可以直接导入现成的 skill 文件进行智能解析。因为 tree skills 是 基于开放的 agent skills 标准构建的,完全兼容社区生态。 当然,你也可以手动输入技能名称描述和指令,添加更符合你需求的工作流及工具调用。现在我添加好了一个前端设计的 skill, 我们在做图像生成器的时候就可以用到它了。你看在 ai 对 话流中可以看到它自动调用了这个前端设计 skill。 如果你的任务比较复杂或者需要持续稳定输出的时候,你也可以在 prompt 中明确告诉 ai 要用哪个 skill, 这样你就可以更精准的控制输出结果了。就像这个网页前端设计的优化一样, 使用 skills 是 可以帮你稳定地按照你的标准输出高质量结果的。除此之外呢,还可以自动化你的重复性工作流,甚至成为专业能力规范知识进行沉淀和分享的方式。所以快去吹 solo 中试试吧!中国版和国际版都有哦!

建议所有人都去学 cloud skills 真的 太香了!之前我们写篇文章,从折腾选择题到搜集资料,再到写出稿改稿叫对,就算是专业的创作者,至少也要两小时起步。 现在我将大博主都在用的写作流程提炼成 s o p, 再让 cloud 帮我写成 skill, 就 可以让 ai 帮你自动化写作和规党。一篇高质量的文稿,从之前的两小时起步到二十分钟就能搞定, 今天手把手带你过一篇整个流程,看看 skills 到底有多爽。前置的 clod code 安装模型接入切换 skill 如何安装的基础知识我这里不展开讲相关的操作,我会整理好知识库放在评论区。 装好 clod code, 建议大家第一步,先安装 skill creator 这个官方创建 skill 的 技能,它可以交互式引导你创建 skill, 只需通过一系列问题帮你梳理需求,就能自主帮你生成 skill。 在 开始创建我们的写作 skill 之前,我们需要拆解下我们的工作流程, 分为理解需求、信息搜集、选择题确认、创建任务拆解、学习我的风格、初稿创作、降 ai 位这几个步骤。第一步,理解需求,按照格式自动保存项目 brief 文件夹。第二步,信息搜集与知识管理。因为涉及到科技产品测评,所以多渠道的信息搜集是必须要做的。搜索完了自动保存到对应文件夹, 内容必须包含信息收集时间和信息来源。第三部,选择题讨论是必做的,不要让 ai 直接写文章,而是要先和你讨论选择题,让 ai 根据需求提供三到四个选择题,方向包含核心内容方向、工作量评估、内容大纲等。 第四步,如果选择题要真实测试或配图, ai 会创建文档到协助文件夹,帮你做一个任务肖像清单。第五步,学习风格,参考文件夹中历史文章的风格,提取开头方式、结构偏好、语言特征、京剧风格等内容。 第六步,根据我的风格加入实践案例进行初稿创作。初稿无需特别完美,咱们让它先把框架先搭出来。第七步,让它进行三重审效。就像在媒体工作一样,初稿是小编写的,刊登前要经过编的一层层审核,从数据校对到去 ai 位, 再到细节打磨,让初稿成为直接能用的高质量中稿文档。我同样整理在知识库了,直接把文档上传到 cloud, 让它理解内容,自己执行。你只等待十几分钟就创建好了创建好的 skill 文档,存放目录,在这个文件夹,你可以打开,确认文件是否符合 skill 的 标准。 skill dot、 md 是 必须有的。 重点关注 name description 这两个原数据,里面包含了 ai 自动触发的要求,其他的 reference 是 参考文档, scripts 是 运行脚本, templates 是 模板。大家可以看一下我的写作 agent 的 目录结构风格参考,放我之前写的几个平台数据都不错的报文 写作技巧。放我自己整理的 markdown 文件规范指南,目前是放一些防限流指南、运营细节、用户人设,关于我想让他知道的我的信息和写作需求与倾向。我的项目是按照文档用途分类,让 cloud code 自动写入对应文件夹,这样这个写作 agent 会随着我沉淀的资料越来越多,会变得越来越专业。 你只需自然语言就可以触发调用这个自动化写作 skill, 按需加载,高效的同时还十分节省投更消耗,真的很香。以上就是今天的全部分享,希望对你有所启发和帮助。我是 jackie, 关注我,陪你在 ai 时代无限生长!

谷歌 antigravity ide 现在终于支持 agent skills 了, 这是 open ai codex 支持 agent skills 之后,又一个 ai 巨头的编程之手,加入了 agent skills 阵营。所以说二零二六年正式成为 skills 元年。 ai 编程从传统的给 ai 编程工具一句提示词,让 ai 临时发挥, 升级为给 ai 编程工具装一套技能,让 ai 按照技能稳定产出代码。 agent skills 是 osopik 最初开发现已成为开放标准的智能体能力扩展格式。 它解决了一个核心问题, ai 虽然越来越聪明,但它缺乏你的领域知识,你的工作流程,你的最佳实践。 而 skills 的 作用就是把公司、团队甚至个人的工作流以及最佳实践,还有脚本等工具像模块一样打包进去,让 ai 编程助手等智能体按需加载,反复复用。所以我特别喜欢用一句话来区分 agent skills 和 prompt, prompt 是 临时指令,而 agent skills 才是长期资产。这次 anti gravity 支持 agent skills 的 意义非凡,尤其是对于非专业开发者,福利最大。 哪怕你完全不懂编程,不会写代码,也可以通过安装现成的 skills, 打造一个真正懂你业务的专属 ai 编程助手。 aging skills 的 本质就是 ai 专用业务手册,通过文件夹和 markdown 文件来打包知识工作流,最佳实践还有脚本、 ai 编程助手等 ai 智能体会,自动发现并且按需加载特定的 skills 来实现能力赋用,还有标准化, 而且是渐进式加载,从而避免上下文爆炸。好,本期视频教大家详显式我们如何在 anti gravity 中使用 agent skills 以及如何创建 agent skills? 并且我选择了一个最具代表性的 agent skills uix pro max。 我们将借助这个 skills 让 anti gravity 创建最为现代化,最为美观的 ui。 这个 skills 能让你在做界面时自动获得专业的配色,排版,布局,还有交互建议,来解决很多开发者做出的产品能用但不美观的难题。 好,想在 anti gravity 中使用 agent skills 非常简单。首先我们要确保我们已经将 anti gravity 升级到了最新版。 好,下面我们可以先测试一下在 antigraph 中使用 anselpic 官方发布的 skills。 anselpic 官方发布了多个 agent skills, 在 官方给出的这些 skills 中包含前端设计的 skill, 还有创建 ppt 的 skill。 下面我们只需要将这个项目克隆到本地。下面我们打开终端命令行,直接用 get 克隆的命令将这个项目克隆到我们本地。好,这里克隆完成,我们直接用 cd 命令进入到这个项目的路径。 根据 anti gravity 提供的官方文档,我们可以将 agent skills 放在这两个路径下,其中这一个就是我们当前的项目路径。如果只允许 agent skills 在 当前项目路径下加载,那么我们就可以放在我们当前的项目路径下。 如果希望 agent skills 在 所有项目中都能调用,那么我们就可以放在这个大局路径下。好,下面我们回到终端命令行,我这里直接用这条命令将 agent skills 放在官方推荐的这个大局路径下,我们直接运行就可以。 然后我们用 cd 命令进入到这个大局路径,然后用 l s 列出这些 skills。 好, 可以看到这里成功将这些 skills 都放在了这个大局路径下。 然后大家如果不习惯执行命令,也可以直接将这些 skills 文件夹全选复制,然后粘贴到 antigravity 存放 skills 的 这个路径下。像这样的话,在 antigravity 中,我们只要创建了新项目, 它都能调用到这个大局路径下存放的这一些 agent skills。 好, 下面我们就测试一下 ansopek 这一些 skills 中的前端设计 skill。 我们回到 anti gravity。 好, 下面我们就可以输入提示词,这里我输入的提示词是创建一个咖啡店的落地页,并且使用这个前端设计的 skill。 在 模型这里,我选的是 gemini pro 模型,因为这个模型非常适合用于前端 u i u x 设计。然后我们直接点击发送, 可以看到这里它正在搜索 skill。 这里它需要运行命令,我们允许它执行。好。非常神奇的是,它这里自动调用了 nano banana 模型来生成了这个网站所需要的这些图像。 然后我们点击打开,这是它生成的第一张咖啡馆内的这个景象的图像,这里放着一杯冒着热气的咖啡。这里它生成了第二张图像,这张图像是咖啡豆的图像,我们可以放大看一下。 anti gravity 自动调用 nano banana 模型来生成图像。这个功能是其他 ai 编程助手所不具备的,因为无论我们在使用 codex 还是使用 cloud code, 它们都不会自动来生成图像,而 anti gravity 它为我们开发这种前端 ui 的 时候,它能自动生成最为适配的图像。 好,这里提示这个咖啡馆落地页,这里已经创建成功,并且使用的是 next j s 还有 telenovela css。 然后下面我们就可以根据他给出的命令来运行一下,看一下效果。我们直接复制他给的命令, 然后打开 anti gravity 的 终端,粘贴这条命令,并且运行好,运行成功。我们直接打开这个链接,打开之后我们就看到了他为我们创建的这个咖啡馆的落地页面,然后这个页面的背景图像就是他刚才调用 nano banana 来生成的这个图像。 这里是这个页面的导航栏,可以看到设计的非常不错。然后我们继续往下拉,在这里他还将刚才生成了这个咖啡豆的图像 也加入到了这个页面中。可以看到它设计的这个咖啡馆的落地页非常精美,而且它用 nano banana 生成的这种配图效果也非常不错,这可以说是 anti gravity 独有的技能。 这样的话我们测试的是在 antigravity 中来加载已有的这一些 skills 项目。好,下面我们还可以测试一下手动创建这些 skill。 在 antigravity 官方文档这里,它给出了手动创建 skill 的 这些步骤,而且这里还给出了一个用于代码审查的最简单的 skill。 下面我们就可以使用官方给出的这个例子,在我们当前的项目路径下来创建这个 skill。 在 当前项目中,创建 skills 非常简单,我们只需要按照官方他给出的这个文件路径进行创建就可以 在 anti gravity 的 终端命令行,我们直接执行这条命令来创建用于存放 agent skills 的 路径。 好,这里创建成功,下面我们就可以将官方给出的这个案例放入到刚才我们创建的路径中,然后我们直接复制这个内容回到 anti gravity。 在 anti gravity 中我们就看到了刚才我们创建的这个路径,然后这里我们新建一个文件 昵名为 skill 点 md, 然后将刚才复制的内容直接粘贴并且保存就可以了。下面我们就可以测试一下调用这个 skill 进行代码审查,输入梯式词,使用 code review 审查当前项目的代码,然后我们运行可以看到这里它正在读 skill md 这个文件,正在分析这个项目的代码。 好,这里完成了代码审查,这里输出了代码审查的这个结果,这里还给出了用于优化这个项目性能的这些建议。这就是我们在 anti gravity 中通过手动创建 skill 并且调用 skill 的 方式。如果想创建更加复杂的 skill, 然后我们可以使用这个开源的项目 skillseeker, 我 在之前的视频中为大家详细演示过,然后如果不熟悉的话,可以查看我之前发布的这一期视频, 它可以一键将任何开源项目或者网站转为 agent skill。 好, 下面为大家演示这一款最强大的用于 u i u x 设计的 agent skill u i u x pro max, 而且它支持多种技术站,包括默认的 html 加 tailwind, 还支持 react next js, 甚至还支持 swift, react native, 还有 flutter。 想在 antigravity 中使用 ui ux pro max 非常简单,然后我们只需要按照官方给出的命令去执行就可以。我们直接先复制这条 npm 命令用于安装这个项目, 然后汇到 antigravity 中。我们直接在 antigravity 的 终端命令行粘贴这条命令并且运行就可以。好,这里安装成功。 下面我们就可以运行这条命令,针对 anti gravity 的 命令进行安装,然后在 anti gravity 的 终端直接粘贴这条命令并且运行就可以。好,这里提示已经安装成功。 在 anti gravity 中,我们只需要用斜杠命令就可以调出 u i u x pro max。 下面我们就可以来输入一个提示词。我这里输入的提示词是让它使用 react 构建一个 to do list, 要求使用拟物化的风格, 包括添加任务,完成任务,删除任务,而且还要具有柔和的阴影和微妙的紧身效果。然后这里我还是使用 jimmy 三 pro 模型,我们直接点击发送。像这样的话,在 anti gravity 中它就能够使用 u iux pro max 这个 agent skills 来获得 u iux 设计的经验还有最佳实践,从而为我们生成更加美观,更加现代化的 u i。 好 在等待了几分钟之后,这里完成了这个项目的创建,然后我们运行一下,查看一下效果。 可以看到这里他成功为我们开发出了这个你物的 to do list 的。 然后我们可以测试一下添加任务。注入这个任务之后,这里就会出现这个按钮,然后我们点击添加好,这里添加成功。然后下面的任务当完成之后,我们就可以点击完成,我们再添加一个任务测试一下。 好,这里添加成功,当完成之后,我们就点击完成。可以看到他设计的这个你物化的 u i 效果确实非常不错。 这样的话我们就实现了在 antigravity 中使用 u i u x pro max 这个 agent skills 项目实现 ui 设计。 agent skills 还有更多更实用的应用场景。 由于时间有限,本期视频只为大家演示了用于 ui 设计的 agent skills。 后续的视频中,我将为大家演示更多更实用的 agent skills 以及 agent skills 的 使用技巧和最佳实践。

好,这节我们继续来学习 cloud 当中的 skills, 那 上一节当中我们学习的如何使用 ui ux pro max 这个项目去开发一个这样的 ui, 那 其实啊,整体流程大概是这样子,对吧?我们分布一个任务,然后 ai 读这个 skills 文件,最后去通过这个脚本查出当前样式,最后返回给你。那上一节呢? 嗯,没看的小伙伴可以去看一下。好吧,这一节我们就不过多追述了,我们这一节呢,主要是给大家分享一下,就是关于 cloud skills 是 如何去使用的,因为我发现很多小伙伴有这方面疑问,就是什么是 skills 以及 skills 呢?它能够给我们的 cloud code 带来什么?或者给我们的 cloud 的 模型带来什么,对吧?首先我们先要明确一个, 首先我们需要明确一个概念,就是,呃, skills 呢,实际上是给 ai 加装的一个插件,类似一个插件,你可以理解为它是一个 prompt 的 集合, 需要按顺序加载,能够帮助你提高你的效率。那相比于 m c p 呢?它不需要去调用一些外部的工具,它只是单纯的一段题的词,仅此而已。好,我们开始走什么 skills? 我 们刚说了,本上 skills 呢,就是一个文件夹,这个文件夹里面包含了指定脚本资源, cloud 呢,会按需加载,就是这个指令,什么时候需要使用这个指令,它会自己去找。什么时候需要这个脚本呢,它也会自己去找。那这时候呢, cloud 呢,是完全自动地接管了你的这个啊,这个权限,然后去,哎,去掉这个 skill, 哎,我该干什么干什么,所以你可以在这个 skill 里面去写,哎,你需要干什么?简单来说,对吧,给 cloud 加技能包, 让 cloud 变得更聪明,那这四个特性大家简单看一下就行了。好吧,我们就往下走,那下面我们来简单说一下, cloud 目前有三种分类,第一种呢是个人技能,也就是说你这个 skill 呢,你的所有项目 都可以使用,比如说我现在配置的一个全职的 skills, 对 吧?那你需要配置在这个点, cloud 杠 skills 下面,这是一个全职的技能,也就是你所有的项目啊,都可以去使用这个 skills, 而不仅仅局限于某一个项目。 第二个是项目级别 skills, 也就是说你这个 skills 呢,只对当前的这个项目的跟目录下面的所有文件生效。哎,秃了这个文件,对吧?它就不生效了,懂我意思吧?第三个是插件的插件也是一样的,就是你安装之后,你所有项目也是一样生效,只是说你可以随时卸载它。好吧, 我们继续往下走啊,首先我们要去使用 skills 呢,需要去插件市场安装一下啊,下面我给大家演示一下。首先我们打开 cloud code, 那 这里呢?我去,哎,去清空一下啊,这时候如果说我需要安装 skills, 你 可以执行这条 mini, 哎,去安装一下 astroc 的 这个 skills 啊,因为我这里呢,要叫有个窗口,我就发跳价哦,我直接发进到高度的 啊。然后这个时候我们再执行这条 mini, 这是那个 cloud 当中的一个 plugin mini 插件 mini 回车啊,这时候我们可以看到,对吧?它在添加这个 skills, 你 看 这个 skills 呢,它是存在 astropica 的 官网,所以呢,它通过 get 啊,给它下载下来啊,就就安装完成了,就安装这个配置,就安装完成了, 好吧,那这里我们就退出了,好吧,那我们可以选择去,哎,可以去安装你的插件,也可以选择去卸载你的插件,好吧,这时候我们就安装完成,之后呢,那 这时候我们就可以使用 skills 了,就这么简单。那这个默认的 skills 里面有什么东西呢?很好的一个问题,它目前提供了两个问题,第一个是 document, pdf 文件之类的, 第二个是一些视力技能包,比如说 m c, p 啊,视觉之类的,就是官方提供了两个 skills。 好, 这时候我们可以就可以去掉这个 skills。 好, 看它是不是创建成功了,比如说,哎,请你给我创建一个学生管理系统需求的啊,文件使用 skills 啊,这是这是 student 点 pdf, 它就这样子,它会给你一个 pdf 文件,那用到 skills 呢?其实这个 cloud code 呢,也会告诉我们是不是用到了这个 skills, 我 们可以看一下 啊,这时候你可以看到是否使用这个 skills, 也就是用这个 pdf 的 skills, 也可以看到这个地方出现这一段话,就是我们用到了什么,用到了第一个 skills, 这个 skills 呢,因为有一个 pdf 文件,那这时候我们可以选择 yes, 也可以选择,哎,下次不提醒它,我们选择, 那这时候我们可以的话就去调这个 skills 了,然后呢,哎,这个 skills 里面呢,因为本身就包含了这个这个命令,所以呢,你看它会自动去执行这个命令,我们并没有跟他说,哎,你要执行某一个命令,使用什么什么库,为什么?因为它的这个 skills 里面就包含了 pdf 的 操作。好,最后总结一下,对吧?所以我们实际上就是将 啊 astroc 它整理的一些啊技能包在这个 prompt 当中啊,给你声明好了,这些啊,比如说调 pdf, 它需要用到哪些工具,需要用到哪些题的词,对吧?它需要用到哪些插件,哪些库,对吧?它都给你整理好了,所以呢,这个时候我们就可以啊,去看到这个啊,这个目录下面会有一个这个 pdf 相关的技能包啊,类似于我们之前学习这个 啊 kilo 的 时候,你看是不是?我们学习 kilo 时候是不是讲过,对吧?是不是有一个 skill, 你 看这 skill 嘛,它会声明你用的是什么 python 什么的啊,什么样的版本,那就那么一个意思,好吧,好,最后呢,安装完成会保证这个目录下面我们先不讲啊,这里我们就我们可以看到就用了这个 skill, 我 们就跳过这样,我们执行完成之后还会确实会给你生成一个 pdf, 类似于人家已经封装好的 prompt, 好 吧, 这时候我们就明白了,对吧?当我们使用 skills 的 时候呢啊, cloud 会自动加载这个 pdf skills 以及文档分析 skills, 最后输出给你一个结果,而不是全部加载上下文中,有效节省头壳,就就是类似于那个 cloud 的 一个机制,好再往下走呢,其实我们和 mcp 的 一个区别是什么?就我们可以看到,对吧? m c p 呢,是外部提供的应用工具能力,而 scuse 呢,更像是去教模型如何使用工具,在那个结识当中去声明,哎,声明我到底该怎么做,对吧?引导他去执行啊?教模型的一种方法,一般来说我们会通过 m c p 和 scuse 协调工作,最后呢,再通过 scuse 引导去来最终执行。好吧,那这个,这个是什么意思呢?这是斜杠命令啊,意思啊, 所以呢,它也是一个区别。好吧,好,那就本期视频的全部浏览。如果呢,你也对这种 sku 感兴趣的话,不妨去试一下。那通过这个杠 prang 的 插件,对吧?去选择你要安装的插件,包括这个管理所需要的插件。那正常的一个 sku 目录呢?是一个这样的目录,比如说文档啊,文档里面有这个,这个角落会写在这里面啊,资源会写在这里面,它就有一个清晰的分类,这就是所谓的 sku, 那 包括我们也可以看到,对吧?它全程在使用这个 sku 来去执行,我们并没有去插手。好吧,好,那就本期视频的全部浏览,我是小刘,我们下期再见。

用好 ai, 不 一定要死磕题日词了,如果你还在为写题日词而掉头发,那么这个爆火的项目可能就是你的救星。这个叫 agent skills 的 东西,居然让我再也没有费力写题日词,我只用给 ai 说六个字,就可以让他开始今天的工作,一边访问我的电脑,一边帮我干活,直到绘画结束,一份完整的文件便出现在了我的桌面。 这么说吧,大家其实苦传统题日词久矣,因为 ai 是 很难一句话就听懂你想要什么的,得把一大坨一大坨的题日词搬来搬去,把背景、需求、格式交代一遍,还得把各种成就老文件喂给 ai, 看着它学。 结果还没开始, ai 的 上下文就顶不住了,聊天框又得重开了。这次爆火的 agent skills 并不是说不用写提示词了,而是把那些常用的提示词给打包封装了。这就好比写代码,以前我们每次都要从底层代码开始手搓,现在有了封装好的标准化函数,你只需要直接调用 skills 就 能激活对应能力。 虽然这看起来只是工程上的小优化,但可能对 ai 的 产业化影响极大。一个是不需要再手打涌泉的提日词了,大家可以把更多的精力放在需求和创意上了。另一方面,就像强大的函数库构建了今天的互联网,标准化的 skills 也能让 ai 的 能力变成了可以随意组合的积木。 这种从手抄题日词的 ai 手工时代到工业标准化时代转变的那味道了。叽里呱啦说了一堆,这玩意到底怎么用?我们直接用最原生的 code 来做演示。首先,你得在设计里找到 skill 这个功能,接着你会发现它早就内置了一堆初设 skills, 像什么文档处理、网页设计等等,你只需要打开上面的开关,就可以在对话中使用了。比如,我可以直接让它做一个苹果公司风格的 ppt, 而它的技能文档会指导它直接使用 html 加 css 写换灯片,所见即所得,然后自动转换成原声, powerpoint 的 格式直接导出。我 又用 jimmy 三试了一下,在接到我的要求后,它居然说不能直接生成 ppt, 但可以通过以下三种方式协助我。 我还可以直接调用他的前端技能,做一个老板 qq 的 前端页面,这蓝底风格还真没问题,甚至还有经典的开会员环节。 甚至你只给他一段 python 函数代码,他就参考 dog's dream 技能里的规范,帮你补上符合 python 官方标准的 dog's dream, 再也不用被代码规范困扰了。当然,如果你觉得技能不够用,你还可以自创武功, 只需要调用 ai 本身的 skill create 技能,用你的语言描述自己的需求,让 ai 自动帮你生成一门技能,使用起来非常友好。 ai 会一步步引导你说出你的需求,你只需要回答问题就行。 有的人就要问了,这不还是提日词吗?我还得噼里啪啦一顿敲吗?错误的比起提日词,它的优点可太多了。若是提日词,你每次都得自己敲或者搬,还疯狂吃你的上下文。但使用 skills 后,你只需要在创建 skill 时描述一遍你的上下文了。 而且在创建 skills 的 过程中, ai 会对你逐步进行引导,比从零开始错题日词友好太多。最方便的是,这玩意可以直接打包成压缩包,分享就像个 u 盘,即插即用,丝滑无比。因此,你可以从社区里薅到不少大佬分享技能包,而我也用自己的数据搓了个差评。写作助手 在上班之前,我只需要发一句话,帮我写篇稿子。装了技能包的 ai 瞬间就开始工作了,他是直接在自己的技能库里搜索了这个写稿技能,接着像个老练的编辑一样,自己去里面翻题,自己去对风格。然后不到一分钟,一份大纲直接甩到了我脸上。 当我同意继续写作后,一份完整的文章就送到我的面前,我就有更多的时间做微调工作了。如果不用 skills 呢?我得打开 gmail, 先粘贴一个八百字提示词模板,后面还得加点关于我们频道的限制词, 然后上传资料、论文、素材、文章, ai 就 开始输出了。一顿操作下来,上下文就已经塞了几十万 tokens 了,修改几轮就到上线了。 最后,总的来说,自从用上了 skills, ai 来了全干了,那叫一个舒适。而且 anthropomorphic 这次又想做带头人了,直接把 skills 做成了一个开放标准。这意味着这玩意儿绝对不止 cloud 能用,理论上可以直接拿去给别的 ai 用。 目前已经有这个趋势了,像 cloud code、 open i 的 codex 都支持 skills 了,连 chat gbt 也有跟进的消息。 有的人就要问了,你上次也是这么说,什么叫 m c p? 咋又来这套,换个屁筐我是吧?还真不是。简单来说, m c p 定义了 ai 如何访问外部数据, 如本地文件、数据库、 github 等。而 skill 定义的是 ai 在 获取数据后如何处理的问题。因此,如果没有 m c p, ai 就 不能操作我的桌面。但如果没有 skills, ai 也不知道怎么操作才能让我满意。当然,这玩意儿也不是百分百安全, skills 本质上赋予了 ai 读写文件和执行代码的权限, 如果技能包中包含恶意脚本,可能就会很麻烦。要是哪个神人在包里藏了个删完库,还得问你需要其他帮助吗?那就得不偿失了。 总的来说, skillster 出现让 ai 越来越像个正经干活的打工人了。虽然现在各家 ai 还没有完全适配,但相信我,这绝对是跟 m c p 差不多的新趋势。

agent skills 为什么能在短时间内拿下三点六万加星标?还有 cursor、 code x、 vcode 和 code body 等编码工具的陆续接入,它到底解决了什么问题?什么是 agent skills? 以及我们要如何构建自己的 agent skills? 一个视频讲清楚。先用一句话总结为什么要用 agent skills。 目前的 m c p 和 agent, 它们的本质是解决 ai 能不能干活的问题, 也就是 ai 能调用哪些工具。而 agent skills 解决的是 ai 能不能把活干好的问题。它最大的亮点是保证结果的稳定输出和件件式批注机制。什么意思呢? 比如让 ai 帮你写一份行业分析报告,它会自己调用搜索工具查资料,然后总结观点,最后输出一份看起来逻辑通顺的文档, 但是这份文档你敢直接交付吗?肯定不敢。不是 ai 不 够聪明,而是因为 ai 不 懂你的业务习惯,不懂你们公司的审核标准,更不懂你老板或者你客户的关注点在哪里,而且每次生成的质量还不稳定。所以 目前的现状就是, ai 能帮你做事,但他不一定能把这些事做好,因为他不知道所谓好的标准是什么。而 agent 解决的标准提前写清楚,固定下来,反复让 ai 照着做。 它不再让 ai 凭感觉做事,而是按你事先定好的流程规则和标准去做事,最终稳定输出一个符合你预期的结果。那到底什么是 agent skills 呢?从概念上说,它是一套可附用的做事规范和做事经验。 而在技术层面,其实它就是一个文件夹,里面包含了指令脚本和资源。指令就是名叫 skill 点 m d 的 markdown 文件,它是告诉 ai 什么场景下按什么步骤去做事,这个文件是必须要有的,而资源和脚本是可选的,资源可以放公司的成功案例、文案模板,等 到 ai 去参考引用脚本是让 ai 执行简单的代码、调用工具等。整个文件夹就构成了一个完整的 skill, 如果还有其他 skill, 复制上面的目录结构就行。接下来演示一遍怎么构建自己的 agent skills 就更好理解了。拿写周报为例,先在 skills 文件夹里新建一个文件夹叫写周报,然后在里面创建 s, k, i, l, d, m, d 文件。在文件开头需要用三横线包裹 name 和 description, 这就是技能的原数据大模型,刚开始只会加载名称和描述,并不会加载全部内容,否则就太好 token 了。 然后在下面用 markdown 格式写周报的要求、规范和注意事项等。写完之后,在目录下按右键选择,在终端打开,输入 curl, 再输入斜杠 skills。 看到刚创建的写周报技能,就说明已经被正确识别到了。 这时你在输入帮我写周报模型会询问你是否使用写周报技能。选 yes, 此时才加载了技能包里的全部内容。按要求输入本周的工作内容后,最终一份符合你预期的周报就生成了。好了,以上就是本视频的全部内容,如果对你有帮助,别忘了点赞关注我们,下期继续!

这是 cloud code, 如果你让他开发一个美观的博克网站,他给你的结果啊,可能是这样的,这一点也不美观,对吧。于是啊,你告诉他, 不要使用蓝紫渐变色,不要使用 emoji 图标,而要使用 svg 图标。把上面这一堆要求呢,都告诉 cloud code, 让他再重新开发一个美观的博克网站。这一次啊,情况就要好很多了。 那么问题来了,我不想每次开发项目的时候,都啰里啰嗦的写这么一大段,能不能让 class code 记住这些要求,我不用每次都叮嘱呢, 哎, class code 提供了一个方法,我们可以把这一大段要求啊,放到一个单独的文件中,以 markdown 的 格式书写。那后续呢,我们再让 class code 干活的时候啊,他就把这个文件一起带上,发给 ai 了,这样呢,就不用每次都要写一遍了。但这样呢,有一个新的问题,如果我只是在 class code 里面聊聊天,提提问, 反正不是开发网站,他也要把这一堆内容发给 ai, 这不是白白浪费托管吗?能不能简化一下这个流程,只有当真正需要用到这个文件的时候, clark 才把它发给 ai 呢。我们可以这样做,给这个文件啊,取个名字,然后加个描述,放在文件最开始的地方。 同样呢,还是以 markdown 格式书写,这两个字都啊,简单介绍了这个文件叫啥,是干啥用的。然后 cloud code 在 与 ai 沟通的时候呢,他告诉 ai, 我 这里啊有个文档,他的名字和描述是这样的,如果你有需要,可以问我要具体的内容。 后面 ai 收到用户的指令,发现是要开发网站。这个时候啊,他在告诉 cloud code, 把这个文件给我发来就可以了。那经过这样一通改造呢,就避免了每次都要把这个文件传给 ai 浪费拖开的问题了。 你发现这一招还挺好使,于是啊,如法剖制写了一堆不同的文档,比如 svg 动画制作点 md, 用来详细指导 ai 如何制作网页。 svg 动画 ppt 制作点 md, 用来详细指导 ai 如何制作美观的 ppt 日报生成点 md 呢,用来详细指导 ai 如何书写符合你们公司风格规范的工作日报。那可乐扣的与 ai 交互的时候呢,只需要把这些文档的名字和描述信息作为一个目录清单发给 ai, 就像他当初把 m c p 服务清单发给 ai 那 样, ai 根据用户的提示词呢,自行决定动态加载哪些文档。 那同样的 cloud code, 同样的 ai 大 模型,因为有了这一堆文档的加持呢,你手里的这一套比别人多了很多技能,他更擅长做出好看的网站 ui, 更擅长做 svg 动画,更擅长做 ppt, 更擅长写日报,完美 nice! 刚刚这套技术啊,有一个闪亮的名字,它就是 agent skills。 这一个个文档呢,就是一个个的 skill, 也就是一个个的技能。简单理解的话,这些个 skill 呢,就是一个个的技能手册, cloud code 和 ai 根据这些手册呢,就能完成特定的工作。 为了规范管理呢, cloud code 通过文件夹的形式来管理这些 scale, 并且把每个 scale 的 主文件都统一命名为 scale 点 md, 回到我们这个网站 ui 设计的 scale, 随着你不断的迭代啊,这个 markdown 文件也变得越来越长, 因为好看的 ui 样式啊,实在太多了,各种各样的风格呢,层出不穷,你很难用一个单一的 markdown 文档来全部写完。而且,就算你能全部写在里面,但实际上呢, ai 只能用到其中的一部分, 其他大部分用不上的内容呢,又白白浪费了上下文的 talk 了。于是啊,你打算把每一种风格单独拎出来写一个文件,然后在原来这个主文件里面呢,做一个汇总,里面写上,如果要做简约风网站呢,就读取简约风点, md。 如果要做科技风网站呢,就读取科技风点 md, 如果要做小清新风格的网站呢,就读取小清新点 md。 这样一来啊,当你用 cloud code 做一个科技风的网站的时候呢, ai 发现要先读取网站 ui 设计这个 skill, 在 读取这个主 markdown 文档之后呢,再根据需要进一步读取科技风调 md, 这个文档。这样按需渐进式的加载啊,极大节省了 talkin, 让 ai 只在有必要的时候呢,才读取相应的内容。 再后来啊,你发现需要对网站的 ui 做更精细化的控制,比如按钮、段落图标、配色图标等等。用这样的单个文档方式呢,还是不太好维护。你决定啊,技术升级,把这些细力度的 ui 内容啊,全部用数据表来进行管理。那为了简单起见呢,你选择了用 csv 表格文件来进行管理。 然后,你希望 ai 在 开发网站的时候呢,按照下面这一套工作流来确定最终选择的样式。为了让 ai 知道如何搜索啊,上面的每一步呢,你都写了详细的文字说明,你还专门编写了一个 python 脚本,并告诉 ai 如何执行这个脚本,来从这一堆 csv 文件里面进行搜索。 现在 ai 大 模型在 colorado 的 配合下,在拿到你这个 scale 的 md 文档之后啊,就按照你写的流程,一步步执行里面的操作,执行拍成脚本,完成解锁,最后拿到完整的 ui 设计信息,开始为你开发网站。 事情发展到这里啊,这份 scale 不 仅是提供简单的文字信息供 ai 参考,还能指定工作流,还能提供程序让 colorado 来执行完成更加复杂的工作了。 上面介绍的这个 scale 呢,不是我虚构的,而是一个真实存在的 scale。 它在 github 上面啊,已经收获了超过十四 k 的 star 了。通过这个 scale 呢,我们可以让 colossal 的 这样的编程智能体啊,开发出 ui 更美观的产品。而这个 scale 背后的原理呢,正如我们前面介绍的那样。 最后,让我们来梳理一下整个的过程。首先,每一个 scale 呢,都需要一个 markdown 文件,并且在文件的最开始呢,有名字和描述两个字段,这属于这个 scale 的 原数据, metat 对 它 cloud code 在 启动的时候呢,加载这些原数据,并将它们包含在系统提示词中。 因为这两个字段呢,本身内容比较短,所以呢一般不会占据太多的托根。第二,每个 markdown 文件除了前面的原数据之后的中文内容呢,叫做指令,它本质上呢就是一段提示词,用来指导 code code 如何做特定的事情。 只有当 ai 需要使用这个 skill 的 时候呢,才会加载它,官方称之为触发时加载。第三,资源和代码 skill 相关的其他文件和代码脚本呢?只有当 ai 在 使用 skill 的 过程中需要用到的时候呢,才会动态加载,官方称之为按需加载。 以上啊,就是 astonrapik 推出的 agent scares 技术了,扒掉这些晦涩的名词概念呢,它其实就是一项提示词工程技术的应用,和之前的 m c p 技术呢,也有很多类似之处。如果你还不知道 m c p 是 什么,欢迎观看我的这期视频。 agent skills 也好, m c p 也好,那本质上都是属于提示词的工程,只不过是符合特定规范,相对复杂的提示词。而为了规范管理和各种工程设计考虑啊,引入了一堆技术名词而已。那现在你知道什么是 agent skill 了吗?你还知道有哪些不错的 skill, 也欢迎在评论区分享。 好啦,以上呢,就是这期视频的全部内容啦,如果觉得有帮助,别忘了点赞、收藏转发哦!我是轩辕,我们下期再见!

这个 agent skill 每天可以节省你好几个小时,直接用它和你的 ai 对 话,就能自动连接 notebook lm。 我 之前用它生成了一段播课全程,完全不需要手动操作。网页 and apple chose, google's gemini to power the next generation of siri it's not just a friendly deal i think you described it perfectly before it's a shared vote a shared vote。 安装方法特别简单,下面手把手教你。首先你需要一个支持 skills 的 客户端,目前 cloud, opencode and gravity 等都支持。然后把 github 上这个项目页面发给你的 ai, 告诉他帮你安装这个 skill 就 行。 安装完成后,比如在 opencode 中,需要把这个 skill 加载的配置文件用同样的方式把这个页面发送给 ai, 他 会按照文档帮你配置好。成功后你就能看到这个 skill 了。现在让 ai 调用定制 skill, 自动搜索近期硅谷科技动态,汇总信息,并同步到 notebook i m, 最终生成一段定制薄刻整过程完全自动化,体验非常流畅。你甚至可以设定每日定时任务,让它自动为你完成这些工作。这样一来,就不再被动接收碎片化信息, 而是每天收获一段高质量的薄刻,轻松节省下几个小时的信息整理时间。而这个 skill 的 强大还不止如此,只要是 notebook i m 上有的功能,它全都可以调用,更多好用的玩法等你来发现!关注我,了解更多 ai 干货,感谢大家观看!

现在我们正站在一个转折点上, ai agent 正从会聊天转向能做事,但在执行真实世界任务时,依然存在很多瓶颈。今年十月十六日, anthropic 发布了官方文档 equipping agents for the real world with agent skills, 提出了解决方案 skills 机制。这篇文章为 agent 进入真实世界任务做好了准备。原文首先肯定了 cloud 的 强大,但也指出在现实工作中,他缺少两样关键能力,第一,缺乏过程知识,即不知道事情该怎么做。第二, 缺乏组织背景,既不知道东西在哪里。我们可以把一个 agent 想象成一个聪明但没经验的新员工。这个新员工虽然很聪明,但入职第一天什么都做不了。 为什么?因为他面临两个巨大的能力差距。第一,他不知道公司如何做事,他会问我们的报销流程是什么?我该如何提交代码,这就是过程知识的缺失。第二,他不知道公司的资料放在哪,他会问我们的项目 api 密钥在哪里? t t t 模板在哪? 这就是组织背景的缺失。没有这两样东西, agent 就 无法处理真实世界中的具体工作。要解决这两个问题,我们通常会给新员工一本标准化的 s o p 入职指南或岗位手册。而在 on traffic 的 设计中,这本手册就是 skill。 skill 的 核心定义是由指令、脚本和资源组成的结构化文件夹。智能体能够动态发现并加载这些内容,以提升特定任务的表现。我们来拆解 skill 的 三要素, instructions 相当于手册中的 s o p 文字,告诉他如何一步步完成任务。 scripts 需要执行的 python 文件 resources, 执行过程中用到的配置文件或模板,如 json 或 d o c x 文件。这三要素正好对应我们开头提到的两个痛点,过程,知识的缺失由指令和脚本解决。 组织背景的缺失由资源解决。定义的后半句同样非常关键,智能体能够动态发现并加载这些内容,以提升特定任务的表现。这句话意味着 skill 不 再被固定在系统提示中, 而是可以被动态检测、挂载和使用。当 cloud 面对不同任务时,比如分析财报、提取合同字段或生成合规文档,它会主动发现最相关的 skill, 加载其中的 s o p 脚本和模板, 使输出更精准、更一致,也更可复现。这就是提升特定任务表现的真正含义。 skill 不 只是知识的存储单元, 而是让 agent 在 特定场景下变得更专业的能力模块。换句话说,它赋予了 cloud 在 需要时加载能力模块的心智模式,让智能边界不再受上下文窗口限制,而是能随任务实时扩展。 也正因为如此, cloud 才能实现近似无限上下文的工作流。这一机制在原文中被称为渐近式。譬如,下期我们将精读这一部分,看看 unstrapix 是 如何通过这套机制让大模型的思考空间实现逻辑上的无限扩展。总结这一部分, agent 就 像一个聪明但没经验的新员工, skill 就是 给他的一本标准化 s o p 入职指南。那么,这个 skill 在 系统架构里是如何体现的呢?这张图展示了配置和实现之间的联系。 一、右侧 agent 虚拟机从右侧开始看更容易理解它是 agent 的 电脑和双手,是真正执行任务的地方。在顶部,我们可以看到 bash、 python 等图标。 python 表示这台电脑安装了 python 引擎,当 skill 文件夹中包含脚本时, l l m 就 能调用它执行。 bash 表示系统具有命令行终端, agent 可以 通过它操作文件,比如使用 l s 列出文件或 cut 提取文件内容。这说明 agent 不 仅能聊天,还能真正动手做事。文件系统中存放着所有 skill 的 实体。二、 左侧 agent 配置左侧的 l l m 是 大脑,是决策中心。 agent 的 配置更像是 l l m 可访问的 s o p 锁影,其中包含核心系统提示,以及一份以装备技能的清单。列出了技能名称和简介,如 pdf, d o x s 等。 当 cloud 想使用某个 skill, 比如 pdf 时,它会通过 tool 操作虚拟机执行命令。 run bash commandant, 这意味着 cloud 指挥虚拟机打开并获取一个 s o p 文件,获取到的内容会返回给 l l m 的 相关公口, cloud 便能学习并决定下一步该怎么做。总结来看,这个架构展示了 l l m 提取 agent 配置并调用虚拟机来执行 skill。 到这里,很多人会问,既然 skill 也能触发执行, 那它和 tool 有 什么区别?两者看起来相似,但角色完全不同。 skill 最终会调用 tool, 但它们的架构地位不同。可以这样理解, tool 像一台烤箱,是底层的执行能力。 它功能强大,但需要精确指令才能工作。 skill 则像一份妈妈的烤鸡食谱,它本身不烤鸡,但封装了全部过程知识烤多久,温度多少,需要哪些原料甚至经验性的诀窍?我们从几个维度来区分它们? two 回答的是 what 我 能做什么?技术上,它执行代码。 skill 回答的是 how 我 该如何做好这件事?技术上,他指导如何完成任务。 tool 是 原子化能力,一个 api 或函数。 skill 是 完整的 sop, 包含指令、脚本和资源。 tool 是 执行器 被动等待调用。 skill 是 流程编排者主动指导 l l m 调用 tool 完成任务。 tool 的 目标是提供原子能力。 skill 的 目标是封装、可移植、可附用的过程知识。总结下, skill 不是 tool 的 替代品, 而是调用 tool 的 sop, 它封装了可组合的过程知识,让 agent 真正具备会做事的能力。好了,第一期内容就到这里,我们搞清楚了 agent skills 是 什么,它的系统架构 以及它和 to 的 核心区别。下一期我们讲详细讲述 skill 如何通过渐进式批录实现近似无限上下文。

在 cursor 中怎么使用 agent skill 的 功能?咱们一个视频说明白啊。上个视频咱们聊了 agent skill 的 基本概念,今天咱们继续来做实操。 首先咱们打开 cursor, 点击文件首选项 cursor setting, 然后选择这个 root subagent commands 这个选项啊,就可以看到里面有 input agent skill 的 这个开关儿哎,但是大部分小伙伴可能会发现,哎,我的 cursor 怎么就没这个功能呢?啊,为什么呢?我已经更新最新版本了 啊,因为截止我视频发布,这 cursor 的 正式版还没这个功能哎。不过不要紧啊,大家可以切换到开发版来使用 skill 功能, 大家可以在 cursor setting 中点 beta 这个选项啊,然后把第一个选项,哎,这个大家应该是 default 给它改为 nightly。 nightly 是 开发版的意思啊,大家就当做是像游戏内测的版本就行,能提前体验一些功能,但是功能可能不太完善, 如果大家体验完了,不想用这个开发版了啊,也可以回来把这个 nightly 改为 default, 再重新更新一下就回来了啊,所以这个大家可以放心修改 啊。那咱们继续啊,改完这个 nightly 之后呢,再点击帮助选项,点击检查更新啊,然后等程序更新完成之后,再回到 cursor setting 里面这个 rules subazon 这个选项,就能看到 import asian skill 开关了。打开这个开关, cursor 的 环境咱们就配置完了。 那具体要如何在 cursor 里用 skill 的 功能呢?我先创建一个新的项目,在 cursor 中打开一个空的文件夹。那要想使用这个 skill 的 功能,咱们需要在项目中先创建一个点 cursor 的 目录, 点 cursor 里面我们再创建一个 skills 的 目录,那这个 skills 目录里面存放的内容就是智能体可以使用的 skill 了。 大家看,我这里有一个写好的项目啊,里面我放了好几个 skill 啊,有操作 excel 的, 有操作 pdf 的, 还有将 markdown 转换成 stm 毛的各个 skill。 那 我们打开一个 skill, 看看里面到底具体有什么东西,我们就打开这个 text converter, 它是一个把 markdown 转换成 stm 的 skill 啊, 打开之后可以看到里面有一个 skill 点 m d 文件,那这个文件就是 skill 的 主文档,里面描述了这个 skill, 它能干什么活?文档开始的内容呢,叫做原数据,那这个很重要啊,里面定义了 skill 的 名字描述,还有版本 curser 的 对话框。如果调这个 skill, 其实就是根据这个描述来决定什么时候来调这个 skill 来工作的啊,比如我这个 skill 里面描述是当用户询问把 markdown 转换成 atm 等等。问啊,那如果用户说了这些的话啊,这个 agent 呢,就会调这个 skill 来干活了,那我们来调一下试一下啊。 呃,我打开 cursor 的 ai 对 话模式,咱们得调成 agent, 我 对这个 agent 说呢,将 pip 的 这个教程的 markdown 文档转换成 a。 天毛,大家可以看到 agent 就 开始干活了, 他会先读这个 skill 点 m d 啊,然后按照文档里面的要求执行任务啊,执行过程中还会参考 skill 目录中 example 文件夹来参考里面这个事例来操作, 那这样的话,它就可以按照我们给的这个视例来更准确地完成任务,那这样 agent 工作的准确度就会更高了。而且 agent skill 还有一个巨大的优势, 就是 skill 目录里面的所有内容,包括这个主文档,还有 example, 可能还有一些代码,它都是这个 skill 被调用之后才加载的,相当于是一个懒加载,不会在初始状态占用大模型的过多上下文,那这样性能就上来了 啊。那最后呢,大家可以看到啊,我得到了一个想要的 atm 文件,这就是 cursor agent skill 的 用法。那有朋友可能问了,说,那这个 skill 都得自己写吗?啊,当然不是啊,我们还可以使用第三方的 skill, 比如我这个 skill 目录里面的 excel pdf 的 skill 呢, 其实就是 as topic 在 github 上发布的 skill 啊,都是官方的 skill, 大家可以到 github 上直接下载下来。你想用哪个 skill 呢?就把这个 skill 复制粘贴到自己的 cursor 的 这个 skill 目录里面啊就行,直接复制粘贴就行啊,特别方便。所以大家以后如果让智能体干什么事儿的话 啊,以前咱们可能需要 m c p 啊,然后填写配置文件啊,参数错了还得改,就很麻烦。但是以后呢,直接复制一个 skill, 哎,这功能就能实现了,是不是特别方便 啊?当然不是说 a n 的 skill 就 可以代替 m c p 啊,它们还是各有各的优势。那具体 skill 和 m c p 有 什么区别?下个视频咱们再来做详细的介绍啊,不知道我讲的清不清楚啊,朋友们有问题可以给我留言啊,我是小周,分享 ai 开发知识,咱们下期再见。

大家好,我是小木头。如果你是一个开发者,你可能遇到过这样的场景, 花了几个月时间开发了一个很棒的开源项目,或者一个有意思的 sas 产品。代码写得很优雅,功能也很实用,但是没有人知道。 或许此时你需要一个推广视频,那传统的做法是什么呢?第一种,找设计师或者视频制作的外包, 但问题是他们不懂你的技术栈,不理解你的产品特色,你需要写很长的文档解释,沟通成本也非常的高。最后做出来的视频很有可能还达不到你的预期。 第二种,自己学习 after effects 或者 premium, 但是这类产品的学习曲线很陡峭,而且改一次要重新渲染,等半天。你是个开发者,不是设计师,为什么要花这么多时间在非核心的技能上呢? 第三种,用模板工具,比如 camera, 剪映。这些确实很方便,但太通用了,没办法体现你产品的技术特色。 或许这些都不是最要命的,最要命的是,你的产品会迭代,功能会更新,每次迭代视频就意味着要重新做一遍,这完全无法规模化。那有没有更好的方式呢? 今天我想和你分享一个全新的视频制作范式。开发者用 agent skills 生态来轻松地完成视频的制作,这不仅仅是一个新的工具,而且是一种思维方式的转变。 在视频分享中,我会用一个真实的项目来演示如何快速地基于代码仓库直接生成一个专业的推广视频。那现在我们就开始吧。 在近期的视频分享中,我们介绍了许多 agent skills 方面的内容,那它是什么呢?简单来说就是给 ai 助手预装的技能包, 就像 npm 之于 javascript。 agent skills 是 ai 助手的包管理器,你可以安装不同的技能包,让 ai 在 特定的领域拥有专业知识。 remotion 是 一款非常流行的视频制作工具,可以使用 react 来创建真实的 mp4 视频,非常非常的强大。感兴趣的朋友可以来到官方网站了解一下究竟它有哪些优秀的应用场景。 在一月二十号,他们就发布了自己的 agent skills, 使得开发者能够在 ai 场景中轻松地利用 remote 来制作视频,不需要了解 remote 的 技术细节,通过自然语言交互,就可以轻松生成非常精彩的视频片段。 那本期视频我们来寻找一个项目,看看它生成的视频效果究竟如何。我们就利用 session 这个产品来做演示,为它生成一份推广视频。 session 是 我最近开源的一款浏览本地 clockcode 绘画的桌面应用,希望能够以一种非常优雅方便的方式帮助大家浏览在本地众多的 clockcode 绘画。它会以项目为单元,组织过去所有的历史绘画, 在绘画中能看到所有的交流信息,不仅仅是 ai 的 响应,还包含了工具的调用,思考的过程。 大家也可以来到官方网站点击下载尝试,也欢迎大家来到代码仓库提意见,提合并请求。 作为一个新上线的项目,我希望呢能够为他做一款推广视频。咱们现在就来到 session 代码仓库,给他这么一个需求,我期望他阅读当前的代码仓库,了解这个项目的本质,抓住他的亮点和主要的功能和特性, 然后使用 remote skill 来生成一款推广视频。我们呢给他一些时间,看看他的生成效果。 到现在, remote 技能包完成了他的视频准备工作,现在呢,会启动一个开发服务器,我们可以在本地预览生成的视频效果。 在这个网页环境中,我们可以预览这个效果,如果没有问题呢,再在本地通过命令的执行来生成 mp 四版本的视频。我们先来看看它的效果吧, 大家觉得这个效果怎么样呢?我个人还是非常满意的,它已经抓住了 session 这个桌面应用主要的功能特点。对于目前这个项目来讲呢,这个推广视频应该足够了。当前呢, cloud 还在利用 chrome 开发者工具来测试推广视频的开发环境,我觉得已经很不错了,就让它终止了。 如果需要,大家还可以引入在过去视频分享中我们介绍的 ui ux pro max 这类技能包,对当前生成的这个视频的效果风格样式呢进行自定义, 尝试使用一些更加不同的风格来生成不同的推广视频版本,从而选择最符合自己需求,最满意的一款来推广。 我告诉他这个视频已经足够好了。接下来我想要生成 mp 四的版本该怎么做? 很简单,来到对应的目录,运行 mpm run build 就 可以生成 mp 四版本。在底下,它还给到了我们一些满足我们不同需求的视频规格,比如更高质量的,四 k 的 等等。我们就生成一个标准版的吧,大家来看看效果。 好了,视频生成,打开看看效果吧, 大家觉得怎么样呢?这跟刚才我们阅览的是一样的,如果期望更高清分辨率的呢,我们可以选择添加参数,在这里呢咱们就不再演示了,接下来我们或许可以再配上一些精彩的背景音乐,这样就有了一个非常非常完善的推广视频。 好了,今天的视频分享呢就先到这里,感兴趣的朋友一定要来尝试一下,特别是个人创业者,你的产品是否需要一款精彩的推广视频呢?除了找人帮你完成, 你还可以使用 remote agent skills, 非常方便的就能够帮助作为开发者朋友的你做出一款完美的视频哦。那大家在使用中有什么心得和体会,也欢迎在评论区给我留言。那今天的分享就先到这里,我们下次视频分享再见同学们,拜拜!

不用节点,不用堆砌复杂的工作流,口喷就行。 code 二点零更新 agent skills, 普通人口喷就行。 你们是不是看到那些智能体工作流的搭建节点,数据类型就头大?又是拖拽节点,又是配置工作流,代码看不懂,流程理不清,最后忙活半天啥也没做出来? 但今天我要告诉你, code 二点零直接把门槛干到地板!它的核心就是把场景最佳实践加所需工具封装成可直接调用的技能模块,不用懂代码,不用手动搭建流程,你只用张嘴说需求, ai 就 能拥有专业能力。 先给你们划重点,这个 agent skills 真的 做到了,口喷式操作,人人都能玩。第一,普通用户零门槛,想做视频格式转换,想导出 gif, 直接甩个开源工具链接,再用大白话描述你的需求。扣子直接帮你打包成专属 skill, 一 两分钟直接部署使用。 第二,技能覆盖全场景,技能商店里法律类案解锁、新年绘本制作、互动教学模板全都是现成的,一键安装就能调用,还能多技能智能组合,效率直接翻倍。第三,经验能沉淀,还能交易, 行业专家可以把你的独门方法封装成 skill 出售,躺着赚钱。企业团队可以共享 sop, 新人直接附用熟练员工的能力培训成本直接降为零。而且扣子二点零可不止一个 skills 这么简单, 它还有三大杀器,全场景提效。第一个 agent plan, 你 设定一个长期目标,比如三周完成十万字书稿,运营自媒体涨粉十万 ai 自动拆解步骤持续执行,还会主动向你汇报进度,再也不用你天天盯着催进度了。 第二个 agent office 简直是职场人的福音,写 word 报告,做 ppt, 整理 excel 数据,五分钟就能产出高质量成果,还能给你提供底层逻辑洞察,加班?不存在的。 第三个 agent coding, 对 话式开发,不用拖拽节点,你用大白话描述需求,就能生成智能体网站或者移动应用,一键部署上线, 不懂代码也能当开发。我已经把这操作指南,还有我亲自调优的三个顶级 skill 配置方案全都整理好了,放在我的朋友圈。关注我,加入惠子的 ai 朋友圈,咱们普通人一起 ai 落地。

最近呢,这个 agent skill 讨论非常的多啊,有人说呢,这是 ai 编程真正开始工程化的标志。也有人说呢, skills 其实就是一套复杂一点的提示词的模板。那在我看来的话呢,这个 agent skills 或许是二零二六年最值得我们关注的 ai 使用方式。 那今天呢,我们就不讲概念,也不争谁对谁错啊,我直接用一个一个的案例来让你对 agent skills 有 一个更加详细的了解。 这上面呢,它就是把一类任务的工作方法从一次性 prompt 升级为可附用,可组合,可长期使用的能力模块。 注意啊,我们这边呢,出现了三个英语单词,第一个是 prompt, 第二个是 agent, 第三个是 skills。 那 我再额外给大家补充三个吧,一个是 m c p, 另外是 rules, 还有这个 memory。 这六个单词呢,大家或多或少都听说过啊,有一定的了解。那为了能够更加简单直观的把它们的本质以及使用场景讲清楚的话呢,我这边画了一个表格。首先这个 prompt 啊,它的本质是什么呢?它其实就是一个一次性的输入文本,那它是不可附用的,也不是啊,长期有效的,所以说呢,它就强依赖当前的上下文。 agent 呢,它是一个正在运行的 ai 执行的实力,它不是附用的,也不会长期有效,结束了就消失了。 而 agent skills 呢,它是一个可赋用的工作方法的模块,并且它这边是跨任务跨绘画的。然后 m c p 呢,它其实是一种外部工具和数据访问的协议啊,这边是可以赋用,也是长期有效的,与 agent 的 这个生命周期是啊, 无关的。最后是 rules 啊,它这边呢,是一个局的 ai 行为的约束啊,也是可以赋用和长期有效的,并且是始终生效的。 那最后呢,是这个 memory 啊,就是可以去持续地存储某一类状态,它这边也是可以附用和长期有效的。那这里的话呢,大家可能对这个 agent 不 可附用啊提出质疑啊,那我来解释一下, agent 呢,它本质是一种运行状态啊,就是类似一个正在工作的进程或者是现成。 那任务完成了之后呢,这个 agent 的 生命周期其实也就相应地结束了啊,你不能说我想要去附用上一次那个 agent, 你 只能说我再启动一个新的 agent 实力。 那为什么很多人会感觉这个 agent 呢,好像能够服用呢?这是因为我们的这个 agent 呢,它当中啊有这个 prompt, skill, rules 和 memory 这些配置。所以说呢,真正可以服用的其实是 agent 它自身的这个配置, 而不是 agent 的 本身。那上面这个表格呢,我们其实已经讲到了六者之间的不同的分工啊,那接下来的话呢,我们来看一下它们之间的一个差异吧,这里我也让 chat 的 gpt 帮我会总了一个 表格。首先我们来看这个关注点啊, prom 呢?他是说什么?然后 agent 呢?是谁来做? agent? skills 是 怎么做? 然后 m c p 呢?是我们要用到什么样的一个工具?而 rules 呢?是啊,我们去归约了,什么事情是不能做的?最后这个 memory, 是 啊,有一些长期的这个对话的过程,想要去让你去记住的一些记忆点, 这个大家可以暂停来看一下。 ok, 那 下面的话呢,我们正式进入这个实操环节啊,首先呢就是我们来解决一个大家比较关心的问题,这个 agent skills 到底是从哪里来的啊?是不是每次我们都需要自己去写这个 agent skills 其实是不用的啊,因为现在社区它已经有很多成熟县城 拿来就能用的 skills 啊。第一个就是这个 atroc 它官方的这个 skills 仓库,那这个仓库呢,它非常重要的一点就在于它给出了官方推荐的一些啊 skill 的 写法啊,这个就是行业规范, ok 也提供了一些比较基础的这种 demo 势例。 第二个来源呢,就是这个 awesome cloud skills 这个项目啊,它这里呢是汇集了成百上千个 skills 啊,覆盖的这个场景是非常的多,那它更像是一个 skills 的 目录和生态集合啊。那第三个来源呢,就是这个 skills mp 点 com 这个网站,这个网站它的交互是非常有意思的啊,有点像一个命令行的界面啊, 你可以去按照分类浏览,也可以去啊按照你自己的这个用途和这个喜好去搜索。那这个呢,我就不展开了,回头大家可以去自己慢慢探索一下。呃,目前的话呢,我们主流的这个 a 编程工具其实都是支持 agent skills 的 啊,而且它的这个安装方式其实也都是大同小异的。 这里呢我提前就下载了 athropic skills 那 个开源项目,然后现在的话呢,我们就演示如何安装到 coder 当中去。首先呢我们打开一个项目,然后在这个项目的根部路呢,去创建点儿 coder skills 这样的一个文件层级,接下来的话呢,我们只需要去把一些开源的 skills 的 文件复制过来就可以了。那这里呢,就是复制以后的一个文件层级了。 ok, 现在的话呢,我们来尝试做一下对比啊,比如说同样的提示词,我们让 coder 去做一个 toto list 的 这样的一个小应用, 左边呢是不带 skills 的, 右边是带 skills 啊,那可以看到呢,右边的这个设计,它明显是更加高级,更加美观的。 是因为呢,我们这个提示词当中的前端 ui 设计触发了这条 skill, 而这条 skill 呢,它不是在教 ai 去啊怎么写这个前端的代码,而是呢,它在替 ai 做一个规约啊,就是当你去做前端设计的时候呢,你必须向一个真正的 设计师那样去思考。这里呢,我也让 ai 去分析了一下这条 skill 啊,感兴趣的同学呢,可以来暂停看一下。 ok, 那 到这里的话呢,你其实已经不难发现了,就是其实不是一个效果好不好的问题,而是一个做事方式, 呃,要不要改变的问题啊?就是加了 skills 之后呢, ai 并不是变得比之前更加聪明了,而是呢,他开始知道在这一类任务当中啊,什么样的事情,它的这个优先级是最高的, 哪些判断是不能够随便啊糊弄过去的啊,就是它会减少 ai 的 一个幻觉,更加的去标准化,更加的去符合我们人类的一个定义和预期。 那这也是为什么同样一句提示词,加不加 skills, 你 可以看到它的这个结果完全是不一样的, ok, 所以 说 agent skills 它真正的一个价值不在于它写的有多么的复杂,而是在于它能不能够稳定地去改变 ai 面对一类任务时候的一个行为方式。 ok, 当你开始呃真正的在项目当中去使用 ai, 而不是只去做一些简单 demo 的 时候呢,你就会越来越在意这种稳定性,而不是, 嗯,就是 ai 的 某一次。呃,灵光乍现表现很好啊,就是你会在意它的一个稳定性。那所以说的话呢,下一期我们也会直接带大家去从零到一的写出一条自己的这个 agent skills。 然后呢,我也会讲清楚一个真正可以附用的 skill 应该怎么样去设计,以及什么时候我们该用 skill, 什么时候该把这个东西交给 m c p 来做。感兴趣的同学啊,可以来关注我。 ok, 那 以上呢,就是本期视频的一个全部内容了,感谢大家的收看,我们下个视频再见, peace。