太炸裂了,我最近发现了一个写作的 ai skills, 让我的写作效率整整提升了百分之六百,原来需要写两个小时的文章,现在只要二十分钟就搞定了。这个 skill 的 工作流程非常的智能,第一步呢,自动理解需求,然后保存成项目 brief。 第二步呢,进行信息搜索,多渠道解锁,并且它还能够自动保持记录。第三步呢,讨论选择题,这个时候不要让 ai 自己来写, 拿三到四个选择题和你讨论。第四步,如果需要测试或者配图,让 ai 去给你列出来计划清单。第五步,学习你的行文风格,然后去分析你的爆款特征。 第六步,基于你的风格进行创作。最后一步,进行校对,然后不断地去打磨。用 skill creator 来创建这个 skill 会非常的简单,它呀会不断地和你去聊天对话,逐步地把这个过程梳理清楚, 然后自动生成 skill。 重点呢是关注 name 和 description 这两个数据,因为它决定了你的这个 skill 什么时候自动触发。并且呢,这个 skill 还可以去调用其他开发者开源的 skill, 像什么每日新闻剪辑, 然后去 ai word, 根据文本生成图片,自动发布到对应的平台等等。最让我惊喜的是,这个 skill 会随着我沉淀的资料越来越多,它会变得越来越专业,越来越懂我。现在呢,只需要自然语言就能够触发调用,而且它是按需加载的,还能节省非常多的头肯。 传统的写作你可能需要三四个小时,但是呢,现在用 skill 基本上半个小时就可以搞定了,效率提升了百分之九十。 如果按每周两篇来计算的话,每个月可以节省三十二个小时,那就相当于整整四个工作日。这个不仅仅是创作时间的节省,还是你创作质量的提升。 ai 它不会马虎,每次都能够按照你的 skill 文档来,一如既往的专业性的完成它的任务。所以不要再亲自动手去码字写文章了, 让 skill 去帮助你。你的时间和注意力应该放在创意上面,而不是简单的重复劳动上。关注我, ai 时代不迷路。
粉丝1.9万获赞10.3万

小白也能看懂的 skill creator 教程来了,厉害!哈喽,大家好,我是姚路行。之前我给大家详细介绍了什么是 skills, 以及在哪找好用的 skills, 其中提到了一个神器, skill creator。 先简单说一下什么是 skill creator? skill creator, 其实一个 cloud 官方推出一个创造技能的技能,听起来有点绕哦,简单说,你想让 ai 有 什么新本事,直接告诉他,他就能自己给自己装上技能包。是不是听起来很牛? 那咱今天就来实操一把,手把手教大家如何用这玩意创建一个自己专属的 skill。 可能有同学要问了,我自己手动创建 skill 不 行吗?当然行,但问题是手动创建得懂目录结构, skill markdown 怎么写对新手不太友好。标准目录结构如下, 而 skill creator 就 不一样了,你只管说需求,剩下的全交给 ai。 接下来我们直接上手,以 cloud code 为例,来创建一个专门创作 ppt 的 skill。 第一步,安装 skill creator, 拿到上面提到的 skill creator 的 文件,放在你自己的目录下。 第二步,直接跟 ai 提需求,打开 cloud code, 直接对 ai 说,我要创建一个 ppt 的 助手的一个 skill, 你 帮我看一下如何创建,就这么简单。 ai 一 看就懂,会自动调用 skill creator, 开始帮你分析。第三步,跟着 ai 的 引导走, 接下来 ai 就 会变身需求调研员了,会开始问你各种细节,这个时候你就别客气,把你的想法都说出来。 第四步,坐等 ai 干活。细节都确定好了, ai 就 开始自动创建了,这个过程大概十分钟左右,具体要看 skill 的 一个复杂程度。 第五步,检查成果创建完成后, close skills 文件夹里就可以看到你新的 skill 了。如果有什么不满意的地方直接改就行,要么手动编辑文档,要么直接跟 ai 说,这里改成叉叉叉,让他帮你优化。 第六步,测试使用。你可以直接说用 ppt 助手帮我写一个关于 ai 编程的 ppt, 不 一会儿就写完了。这里我为了演示 skill 提示词描述的比较简单,你在写 skill 提示词的时候一定要尽量描述清楚, 而且我没有加 ppt 模板,所以说 ppt 没有样式,只有内容。后面我也会继续迭代这个 skill。 总结一下,今天教大家用 skill creator 创建自定义的 skill, 整体流程就是提需求,回答 ai 细节追问、 ai 自动创建,测试使用,随时迭代优化,新手也能分分钟上手。 好了,今天就到这,赶紧去试试创建自己的一个专属 skill 吧!感谢大家,三连谢谢大家,记得关注再走!

大家好啊,本视频分享如何在脆上使用这个技能啊,那么脆在最近版本更新之后啊,已经说了在 solo 模式下可以使用技能,那么我也试了一下,在普通模式下,同样的提示词,让他去给我创建技能,他整个交互过程是没有任何的跟技能相关的, 那么在 solo 模式下,那么同样的提示词的话,他就会调用他自己内置的一个创建技能的技能,然后来走一个这样创建技能的一个流程。所以说大家一定要在这个 solo 模式下去做技能相关了创建啊,或者使用啊,那么在这个普通模式下是没办法触发的。那第二个就是怎么去创建技能呢? 那么你打开这个啊 tree 的 这个工具啊,切换了这个 solo 模式,不管是这个 code 还是 builder 都可以打开之后呢,在这边点这个设置啊,这个加号啊,这边有一个这样的啊,这边设置, 然后的话,这边点击这个规则和技能规则和技能,然后的话在这里在右边这边可以看到技能,然后背他, 然后的话你有了这个地方时候,你就可以在这创建了,所以创建技能的第一种方式就能手动在这个界面里面创建啊,输入这个界面,这个技能的名称最好是不要喊中文描述这个技能是干什么用的,然后通过什么关键词来触发使用这个技能,然后这边就是你要描述的是 这个技能在使用过程中它的步骤是什么样的。那么第二种就是第二种创建技能的方式,就是你现在已经有有了技能,对不对?你已经有了一些可能在别的 ai 编程工具,或者在网上看一些比较好用的技能,那么你就可以 在这边创建的时候啊,在这边创建的时候去导入啊,它支持这个包含这个技能这个文件,这个 z 部文件,或者说点 skill 文件,那比如说我现在选一个啊,比如说我现在选一个, 那我这边是很多别的地方的一些技能要下载下来了,然后打包选中进去, ok, 他 这边就会解压,解压完之后他会把这个信息啊,都会把它写到这里面去,然后点确认,那么你在这个 编辑器里面你就能看到,看到没有你,他就会把这个技能呢放到这个点 tree, 点 skills 里面,然后这个目录里面去, 那这个目录就是 tree 这个 ai 编程工具存放技能的目录了,那么你也可以在设置里面啊,能看到啊,在这边的话是有这个技能的,这个啊列表里面有这个技能的, 那么你就能看到他的描述,对吧?你会告诉你在什么情况下会调用到这个这种方式是可以导入,就是导入你已经打好包的这个技能。那么第三种方法就是你可以让 ai 来下载,就是你觉得啊,你需要的这个网上看到那些技能,比如说举个例子, 比如说现在这个技能啊,非常好用,这个专门用来写计划文档,那定义这个 task 了,那么你就找到这个 github 这个地址啊,你就找到这个 scares 的 目录,看到没有,然后点击进去,然后呢把这个地址复制一下啊,你就说 帮我下载这个技能,然后帮你去把它给下到,下载到这个啊 tree 里面能识别的这个技能的这个目录里面去,所以这个是很关键的,就你路通过别的方式去弄的话,它下载的这个目录啊,不是 不是这个 tree 点啊, scares 这个目录是别的目录它是引不到的,这个是非常的重要的。那么它这边的话,你看它在下载过程中,它也会调用这个 skier 点 creator, 然后他下载完之后啊,你就反正就运行就行了,他会创建这样的目录。 ok, 他 这边已经下载好了,我们来看一下,看到没有,他下载的这个技能会自动到这个目录里面去,然后包含了这个 skill 点 m d, 这就是他的一个技能的说明书,然后还有一个这些引用的文件,然后还有脚本, 这就这就下载下来了。所以说这种方式就是你看到哪些好用的这个 github 上的一些技能啊,你可以直接通过这种方式下载。 那么还有一种最后一种方式,就是可能你用的最多的就是自己去创建技能。那么我这边也准备了一个例子啊,比如说 我发现我在开发小程序的时候,经常会去找这种小程序底部的这个图标啊,这菜单的图标,那么我的流程是通过这种中文的名字去这个 iconform 里面去搜索, 做完这下载,然后放到一个目录里面去,那这个就是一个标准的一个流程啊,那么我们可以把它技能化,这样你就可以去用。这样的话就是我需要创建一个什么样的技能, 然后流程是什么样子的,就把这个流程简单描述一下,那么对于这个吹的话,他收到你这样的提示词,他会主动去触发刚刚的那个 创建技能的技能,然后去帮你去分析来生成这样的技能的文件,所以它是内置了一个这样的一个通用的,像 cloud 的 官方的那个 skill creator 一 样,有一个这样的创建技能的一个很方便的快捷操作,所以他这边已经生成好了。我们来看一下他帮我们做的这个技能是什么样子啊?名称 啊?描述啊?触发,当用户询问下载图标啊,或者说获取小程序图标的时候,或者是搜索这个 icon 的 时候会触发,然后它的流程是什么样子呢?搜索然后的话找找到,应该是找到这个第一个,然后下载, 然后保存,那他这边用到的工具是这个 mcp chrome 这个工具,然后举了一个例子,然后就这样的一个流程 啊,我们可以看一下他有没有效果啊,如果说没有效果你是要去调整的,就是他不是说一次次的技能都有用,你可以让他不断的去调整,我们可以让他试一下,帮我下载一个这样的图标,对吧? ok, 他 这边已经 下载下来了,他找的是这个图标,但其实他调用的这个 m c p 失败了,这个 m c p 失败了,应该是有一个这样的共占用,这个就已经被用了,我们先不管它就整个流程,就大家可以在这里面这个过程中找到这种感觉,就是你平时经常用的 啊,这个流程你可以把它总结或者抽象成一个技能,那这样下次的话,你直接比如说我现在开发不同的小程序,那我就可以直接让他去帮我去下载什么图标,那我就不需要去自己去手动打开网页去下载了,就很方便的去处理,这样的就是重复的东西就提效了。 我们可以看一下他下载下来的是这样这样子的啊,就是一个这样的一个图标底部的图标啊,刚刚我们已经演示了如何使用这个。最后就是来说一下,就是目前这个版本啊,吹这个版本这个技能的一个缺陷啊,第一个就是他没办法设置全局技能, 那我们也可以看到在设置里面他是这个技能只对这个项目是生效了啊,目前是在这个有全局的生效,所以这个可能要在后续的这个版本更新。 那第二个就是没办法共享 cloud 的 技能,就是在 cloud 的 木里面,他是不会去加载技能到垂直的木里面。那第三个就是手动创建这个技能的时候啊,比如我们通过手动创建技能, 他这也是没办法去创建,比如说脚本,对吧?那一个技能的话,如果你做的比较复杂的话,是有一些脚本在里面的,还有一些引用的文件,还有一些资源文件, 就是不只是只有一个 skill 的 md, 还有很多其他的文件,所以说这个你在手动创建的时候是没办法创建创建出来的。比如说我们举个例子,那么在我们使用这个 prane, prane 这个 进入的时候,你看它是有这样的脚本的,然后的话有这样的文档,所以它这个文件是非常多的,通过手动创建只能只能创建一个 skill md, 其实这个还是有,目前还是有缺陷的,但是也可以大家可以去多去尝试一下,就是一定要先用起来,就是把自己重复的这种高频的这个流程啊,用技能包装一下。那有些技能可能比如说刚刚我是涉及到了浏览器的操作,可能不会成功,或者我换一个这种浏览器的这种插件, 那么可能就可以成功,或者说让他调用接口的方式啊,或者说爬虫的方式。反正就是你如果说这个技能没达到你的效果,你就继续去跟他沟通,他会去修改这个技能的。 ok, 那 本期视频就到这啊,谢谢你的关注。

大家好,我是破旺,那我们来今天的这一个阶段性的整理啊,今天也不是实况啊,是阶段性整理,那这个阶段性整理呢?是关于 skill 的 一个使用啊,关于 skill 的 一个使用, 那这个 skill 这个技能就是其实都是有很多的一些的用法,很多的一些用法。但是呢目前对于,呃我当前的这个实战啊,实战这个项目当中 啊,就是多角色配音这个这个项目当中其实我只是使用到了 skill 当中的两个能力,那第一个能力呢,就是固化了一些的提示词啊, 啊,就固化了一些的体式词啊,也就是说当这个 agent 或者是 sub agent, 然后再去运行的时候啊,它可以通过这一些固化的一个体式词去应对一些的情况,那比如说呢,就是看我当前的这几个啊 skill 啊,当前的这个 skill, 就 比如说以这个,以这个为例吧。啊,这个是比较典型的 就是叫快速启动协调器啊,快速启动协调器我也不知道他为什么会命名成这个,但也无所谓吧, 就是当我们要想进行一个任务的一个开始的时候,那我正常情况下呢,我可能要去跟他去做很多的这个一些的描述啊,就比如说这样的一个情况, 嗯,就比如说这样的一个情况,就是我需要你阅读这样的一个方案,然后呢用 sabrizen 对 当前的情况做一些深度调研,然后设计信息, 然后呢再使用这个 sabrizen, 然后完成接下来的第二阶段,第三阶段的一些的构造与测试,然后最终来进行验收,生成信息报告等等,这这些我都每一次都要打一遍这些字儿的 啊,每一次都要打遍这些字的,但是呢如果要是不想打这些字呢,那就可以去做这样的一个处理,就是把这个东西呢固化成一个整体的这个一个 skill。 但实际上呢他说的他所描述的这些东西就是就是这个其实就是这个事, 那这个 skill 呢,它也是属于跟着这个另一个 skill 去配合的,因为可以看一下这个是另一个是干嘛的? 另一个呢就是属于在啊上一个任务之前,上一个完成任务之前,然后那个任务完成了嘛,然后对那个任务进行一些的总结啊, 那主要是针对这个上下文窗口有限的一个问题,然后创建简节结构化的一些的项目状态的一些目录,然后去来解决这个问题啊,做一些的一个文档啊,就是做这样的一些的总结。 那做完总结之后呢,然后就会回到这样的一个 skill 上啊,回到这样的一个 skill 上,然后呢它就会起通过这个啊这个 skill, 然后去运行的时候,就会把之前的那个 skill 的 一些的总结或者一些的文档等等进行一定的阅读,然后呢去打一些的配合,然后呢再去做一些相关的执行啊,相关的一个执行就可以了, 那这个呢就是我的第一个用法啊,第一个用法就是这个固化一些的题词词啊,然后第二个呢就是间接式,譬如啊 那间接式譬如呢也是 skill 的 一个设计的一个核心,也是我核心比较看重的一些的一个部分,那这个呢就是我以另一个 skill 为例啊,就是这个 啊,这个 skill 它的那个整体的就还是呃,需要借鉴式的,是比较典型的,那这个是啥呢?就是它是管理对外部的系统性的 a p i 的 对接啊,或者说一些的部署服务器的信息,就这样的一些的解释和说明 啊,当需要进行第三方的集成,或者说部署或者说一些的那个啊,调试的时候就要去来去阅读这个 skill, 那这里面呢具体的内容呢?都有啥可以看到?就是比如说这一些外部的 api 的 一个对接啊,然后部署任务 啊,具体的一个算法案例,就是因为我们之前设计的是有阿里云的这个云合成和火山引擎的嘛,那阿里云的和那个这个云合成,那你就要去读这样的一个这个文档啊,如果要是关于火山引擎呢,你就读这个文档就可以了,那这个文档在哪呢?就是在这啊, 然后它就会自己根据不同的一个情况,然后去读这个是阿里云的,然后呢这个是 api 集成的啊, api 集成的,这个呢是部署环境的啊,相关的一些的信息,这个呢是火山引擎的, 也就是说当我们就不用再去反复跟它去强调这些的信息,它如果有需要的话,会自动去读取这个 skill, 然后再去读取这四个的一个相相关的一个信息, 而且他当他读起阿里云的时候,这三个就不会去读取了,这个是能够大幅度节省我们的一个上下文的一个空间的。嗯,那这个是属于第二点 啊,其实还有一个第三点,那第三点呢?实际上是自动化啊,执行一些的脚本,自动化,执行一些的脚本, 呃,而自动化执行脚本呢,其实我用的还是比较少,用的比较少。为啥呢?因为我整体的就是可以在看了这么多期的一个实战下来啊, 就是我基本上都是以手动的啊,以手动的,那后面呢?有一些的自动化,但是呢,以这两个啊,以这两个就为主就可以了啊,以这两个就足够了, 我不需要他去帮我去执行一些什么样的一些的自动化的一些脚本。但如果你要是把 skill 当做工作流程去用,那就是可能需要大量的使用这个这个功能了,但是我目前的这个项目里面是没有涉及到这些东西的,而且即便是要去我另一个项目 啊,他有是有工作流的一些的编排,但是那些工作流的编排我也不会用这个 skill 来去做相关的一个处理,而是直接用程序来处理。因为你大模型,你再去做这种工作流的编排,然后再去做这样的一个自动化执行的话 啊,他有一定概率不触发,或者说触发偏了啊,这些都是有可能的。大家看我的一个词框也是能够发现,其实并没有让他触发的时候他给触发了,然后不让他触发的时候,他反而偏偏偏偏 就是让他触发,偏偏就是不触发,哎,这点就很烦。所以你用程序执行自动化脚本,这个我认为是比较好的啊,好,就这样,拜拜。

在 astropica 官方提供的众多 skill 中, skill creator 是 一款极具价值的工具。顾名思义,它能帮助我们构建其他的 skill, 让你能够随心所欲地定制属于自己的功能。这种用 skill 创建 skill 的 能力,仿佛是用魔法创造魔法,实现了功能的自我繁衍与扩展。 以 antigravity 项目为例,安装首先从 github 下载 antropica skill creator, 并将其复制到 antigravity 项目的 agent skills 目录下。 在对话框中输入指令,我需要创建一个新的 skill, 用于根据某一个主题来收集相关信息和素材。只需等待片刻, antigravity 便会在 agent skills 目录下自动生成一个名为 topic researcher 的 新 skill。 让我们试用一下这个新生成的 skill, 输入话题,研究稻盛和夫的六项精进。稍后片刻查看 topics 目录,你会发现,关于六项精进的详细输出文件已经生成完毕。 关于如何使用这些新创建的技能,每个 skill 目录下的 s, k, i, l, l 点 m, d 文件中都有明确说明, 特别是 when to use 部分,详细定义了技能的触发场景。得益于大模型的理解能力,即使使用中文指令,只要意图表达清晰, skill 也会被精准调用。拥有了 skill creator, 我 们就掌握了无限扩展 ai 能力的钥匙。

大家好,今天我要讲一个知识库解锁 skill。 那 在我们平时使用 ai 来读取我们的知识库和文档内容的时候,经常我们会面临两个问题,一个是 token 的 极度浪费,因为我们经常会粗暴地把文档为 ai 去读取, 那他会读取一些他不需要的知识,不需要的内容,那这样的话会极度消耗我们的托克,那也算是在浪费我们的金钱。那第二个致命的就是上下文的问题,那所有大模型都有上下文限制,一旦资料量爆棚, ai 就 会失忆,经不住你的指令, 导致后续生成的内容都是胡言乱语的。那么如何在不喂给 ai 全部内容的前提下,可以让他能精准的获取他需要获取的资料呢?那么今天我们就给大家分享一下如何使用 secure 这个工具来打造一个知识库解锁 skill。 那 我让他读取这个 呃创建工具,这个刚刚我之前呃视频里面讲过这个 sku create 这个 sku 工具,它是用来创建 sku 的 啊,你有了它之后,我们不需要要知道怎么去创建这个 sku, 只要用这个工具去创建工具就可以了 啊,那我用了这个工具之后呢,他就去读取啊我的资料,然后了解我的需求,他就给了这个方案,创建一个专业的知识库解锁 skill, 然后他设计了一个三层件件式批漏系统啊,里面设计一个 skill 核心的文档,第二个是一个模块缩影的一个啊啊一个文件, 然后第三个是一个脚本,一个解锁的脚本啊,当这样去设计这样一个呃 skq, 好 的,我一起总共跟 ai 启动了三个对话,第二个对话是让他去对这个 skq 进行一个测试,测试之后我又让他对这个 skq 的 名称进行了一下更改, 那最后这个 skq 他 检查名称都没问题,那最后我们来给他测试一下,试下这个 skq 到底能不能精准。帮我们去查找我们的资料,我让这个 ai 去使用这个 skq, 是 使用这个 sql 来查询一下我们项目使用的对象存储是哪个平台的。好,可以看到他已经使用了这个 sql, 正在读取他找到了 ai 资产架构方案和我们的 os 配置信息,那这些都是我们的运维方面的项目资料,他已经把信息告诉我们了, 我们未来我们当前使用的是阿里云的,那未来我们上线使用的是特训员的,那说明这个是 q 还是有效的。好,我们再来测试一个我们平时经常会用到的一个规范,就是我们在接入 ai 的 api 的 时候的一个规范, 那我输入这个提示词之后,我可以看到 ai 在 搜索到我们这样一个是 q, 经过这个是 q 的 引导和解锁,它读取了我们 ai api 的 记录的规范, 把规范的一个内容发给了我们,所以我们刚才去创建的 qq 的 这个知识库解锁 还是非常有效。那这样的情况下,他都不需要我们去扔一堆的文档,因为有些时候我们在开发任务的时候,可能我们自己也不知道需要给 ai 去读取哪些规范文档, 那这样的情况下,我们有了这个知识库 qq, ai 会根据我们下到的任务提示,他会自己去根据我们这个 qq 的 设计相关的一些规则, 他会去读取他应该读的,我们这里可以看到他读取了这份规范文档的第一行至一百一十行,那这样的话我们是非常节省我们的头壳,而且很关键一点是他不会占用我们太多的上下文,因为我们平时在新建一个对话去执行开发任务的时候,我们这个脚钉窗口他其实是有一个上下门上限的, 我们使用的每个模型他都有上下门的限制,如果超过这个限制,他就像失去记忆一样,面的内容他会忘记,后面的内容他才 记得住,那这样的情况下就会出现一个神经错乱,我们下的任务他可能不会根据我们的指令去执行任务。所以我很建议大家可以去研究下我们前面说到的如何去创建一个知识库解锁的 cq, 结合你的使用场景是非常能高效的提高我们的工作效率。特别是像我们这种 开发场景,它不仅可以降低我们的上下门占用,它还可以降低我们在使用一些 api 模型的时候,降低我们的掏坑的消耗。好了,今天的分享就到这里,感谢大家的点赞和关注,谢谢大家。

用 skill 做自媒体也太方便了吧,在这个地方录入计划的发布时间, ai 会根据你的发布时间去预测爆款选择题,断写脚本位置好每个脚本对应的封面, 三分钟带你把它搓出来。首先我们需要理解一下 skill 的 搭建方式,简单的说就是提示词加流程的组合。我们在前端输入指令后, ai 会依次调取我们准备好的提示词,并最后给出输出结果。回到我们的任务,让 ai 根据发布时间帮我们预测爆款选择题并生成内容。我们输入的是发布时间, ai 一 次调取选择题脚本封面的提示词。所以在整个搭建 skill 的 过程里面,准备提示词是一件非常重要的事情。提示词之间需要遵循循序渐进的顺序,第一条选择题, 它的书写过程遵循常规的提示书写方式即可。便当的部分已经帮大家标注出来,需要替换成自己需要的内容。那接下来的脚本提示词,它在第一句话里面需要对选题提示词做一个承接,以及最后的封面提示词也是对脚本提示词的内容做承接。当提示词全部都书写完成之后,我们就可以开始正式搭建我们的 skill。 打开这个软件,切换到技能,回到文档,把我们准备好的导语粘贴过去,点发送,这时候 ai 会告诉我们需要依次提供三段对应的提示词, 再回到飞书。在全部收到三段提示词之后, ai 会开始给我们构建这个 skill, 耐心等待就可以。好,可以看到当右边预览的部分出现内容之后,就说明这 skill 已经构建完成了,那我们可以在这个地方做一个简单的测试,输入我们的发布时间,他已经按照我们要求的步骤在给我们生成内容了。 首先是选择题,然后接下来是脚本文案,最后是封面的会制。如果你对这个 skill 的 输出结果有什么不满意的地方, 在对话框里面输你的要求,让他继续去帮你做调整,觉得 ok 的 话就可以部署。当打包构建部署的三个步骤完成之后,后面就可以非常轻松的去掉取我们的这个 skill 了。点击右下角的更多,把你设置好的 skill 调取出来,就可以快捷方便的生成内容啦。

最近香港大学开园了一个项目,叫 nano bot。 nano bot 是 一款超轻量级个人 ai 助手,仅用约四千行代码即可实现核心代理功能。 nano bot 内置了五个 skill cq, 本质上一个 markdown 文件,里面用自然语言告诉 l l m 遇到某类任务时该怎么做。它不是代码插件,而是提示词工程的模块化封装,把人类的最佳实践写成 markdown, 在 需要的时候喂给大模型。 这个设计很聪明,你不需要会写代码就能给 ai 加能力。我们让 nano bot 列出它的四 q 和对应的功能。 skill creator 技能作用是让 agent 自己创建新技能,它会自己生成 skill, 点 m d。 自我进化微的天气查询,用于获取天气和预报,无需 api 密钥。 还有一些需要额外依赖的 skill summarize, 内容摘要总结或提取文本转入内容。 team x 终端绘画管理,用于远程控制 team x 绘画。 github 与 github 交互。这里我们提问,让他帮我们查询当地的天气。 l l m 会调用 read file 读 read skill, 点 md, 按照 skill 指令执行返回结果。我们看查询结果。今日二六年二月四日,温度十一点八摄氏度,天气多云阴天。我跟他说帮我做一个翻译技能 c q, 文件夹下多了一个 translate, 它会自己生成 skill, 点 m d, 写好触发条件,放到 workspace 目录。下次你说让它翻译这段话,它就自动加载使用了。下面我们来一起本地部署 nano bot。 它用了 lightlam 做模型路由,理论上支持一百多个模型。 openai, 智普 d p 格莱玛本地模型,我们按照官方命令克隆项目并安装依赖,安装依赖完成后运行驶使化命令,它会生成 config 点接收文件。这里我们用的是性价比高的智普 glm 四点七模型。 需要注意的是前缀过时问题。 nano bot 代码里用的前缀是基普,但来铁来来米已经在二五年十二月改成了 z i i。 智普不认识老前缀处理后的 api 了,所以报令牌已过期。错误, 我们需要修改 schema 点 py 和 linux provider 点 py 文件。原来字段叫 gpl, 改成 gai 后 nano bot 才能正确读到你 can fake 点 jason 里 z i 下面的 api key 深度对比 opencloud 和 nano bot 架构 下面是我觉得最值得聊的部分。 opencloud 和 nano bot 架构下面是我觉得最值得聊的部分。 tik 经济学用 ai agent 做事,每一次对话都要把系统提示词、工具定义既能描述打包发给大模型,这些东西,哪怕你只是问一句,二加二等于几。 opencloud 系统提示词大概一万四千个 token, 工具定义八千个 token, 您还没问问题呢,光底噪就已经两万两千 token 了。 nano bot 系统提示词压缩到三千到五千, token, 工具只保留了九个核心的定义,开销两千五百 token, 同样的简单查询大概六千六百 token, 省了百分之七十二。再看复杂任务,比如读文件、分析内容,搜索网页跑五轮工具调用 open core 要烧掉十二万 token 的 输入, nano bot 只要三点五万,差了三倍多。为什么差距这么大? 我叉了七个维度来看第一个系统提示词, openclaw 是 全量注入,不管你问什么底噪固定一万四千 token, nano bot 做了精简核心指令压缩,既能只放一个 xml 锁影加样。第二个,反射循环, 这个差异非常关键, openclaw 有 深度 reflection 机制,出错了会反思,反思完重试,重试失败再反思,听起来很智能, 但最坏情况下五轮反射成本直接放大十倍, nano bot 没有反射失败就报错,好处是绝对不会成本失控,坏处是复杂任务的自愈能力弱一些。 第三个,工具加载策略, opencloud 是 二十多个工具全量注入,加上所有 skill 原数据,假设你十次对话只用了一个 skill, 剩下九次全是浪费,会白白浪费。十万 token, nano bot 用了一个巧妙的两级加载 系统提示词里只放技能的 x m l 锁影大模型,看到锁影后自己决定要不要加载完整内容。 第四个,上下文压缩, openclaw 有 autocompaction, 但预值设在五万 token, nanobot 完全没有压缩消息,只会追加敲现了 api, 直接报四百错误。第五个,工具返回结果, opencloud 的 浏览器工具可能返回完整网页 html, 动辄几万 token, nano bot 用 brave search api 返回结构化加载,不过是要和文件读取,两边都没做截断, 但是这个 brave search api 申请需要绑卡,大家有条件的可以尝试一下。第六个,塞设历史管理, openclaw 保存完整消息,包括中间的工具调用列五十轮对话后历史可能超过五万 token, nanovo 只存问答,对中间的工具调用过程不存, 所以增长慢很多,五十轮也就一点五万 token 左右。再看 skills 系统两边都用四 q 点 m d 文件定义技能,但加载策略完全不同。 openclaw 是 全量注入,所有技能都塞进系统提示词, 好处是模型随时能用任何工具,坏处是不管用不用都占 token。 nano bot 在 系统提示词里只放一个技能,所以列表模型看到所以后判断需要哪个技能,再用 red file 工具加载完整内容, 多花一轮调用,但省了大量偷看。你看现在 cloud 的 system prompt 里也有类似的 siegs 列表, mcp 协议本质上也在做同样的事。 skills 这个模式以后一定是标配,不管什么 ai agent 框架,最终都要解决怎么把领域知识高效注入给模型这个问题。 最后总结一下, openclose 定位全能但昂贵,它的功能覆盖确实最全,反射机制让它处理复杂任务时有自愈能力,但代价是每次对话的固定成本高, 存在成本失控风险。 nano bot 代码量只有百分之一,但该有的 react 循环工具调用技能系统一样没少。它不适合所有场景,但对于个人开发者和小团队来说,性价比极高。这期就到这里,觉得有用的话点个赞收藏一下,我们下期视频再见!

skill 功能发布已经有一段时间了,目前国外的 cloud code coser, 还有国内阿里推出的 code 字节的 tree 都陆续上线了 skill 功能,不知道你有没有上手体验过这个能翻倍提效的 ai 神器。本期视频我们不讲概念,我们以更适合普通人上手的字节 tree 为例,以 初学者的视角,手把手给大家分享如何用 tree 玩转各种 skill。 不 管你是写代码的程序员,还是其他行业的从业者,哪怕是职场小白, 都能靠它快速提高工作效率,少走弯路。话不多说,我们直接开始。这里我有两个比较热门的 sku, 详细讲解 sku 的 安装以及使用。其他 sku 的 使用方式类似第一个 pdf sku, 这是一个全面的 pdf 操作工具包, pdf 文件相关的问题我们基本上都可以用它来解决, 比如说提取文本和表格,创建新的 pdf, 多个文档合并,文档资料拆分以及文档表单处理。有了它我们就不用手动或者去第三方网站去处理我们的数据了。那么我们应该如何在翠中安装和使用这个 skill 呢?第一种方式,我们可以从 skill 是 map 点 com 或者 get help 下载下来, 下载,下载之后我们直接解压这个压缩包,这个压缩包里面核心就有一个 escape 点 md 文件,然后我们把解压之后的压缩包直接放到点 tree sql 目录文件下面,我们就可以直接使用了。第二种方式,我们点击 tree 的 settings, 然后点击 nodes sql, 在 打开的窗口中,我们点击最上面,然后把我们刚才下载的 sql 点 md 文件直接导入进来, tree 就 会自动解析这个文件,填充到下面的输入框中,我们只需点击 com, 这样这个技能就导入进来了。 第三种方式适合动手能力比较强的小伙伴。在刚才第二种方式打开的窗口中,我们手动指定技能的类型,技能名称,技能描述和技能的指定,然后点击确认 sku 就 安装好了。 我们该如何使用这个 sku 呢?我们直接在聊天窗口中指定使用 sku 做什么事情,比如帮我们把 pdf 转成 word 吹,就会自动调用 pdf sku, 使用 ai 大 模型自动把 pdf 转成 word 格式的文档。 除此之外,如果我们想提取 pdf 的 文本和表格,多个文档合并,文档资料拆分等等,我们都可以告诉 tree, 帮我们完成复杂任务。第二个, excel 表 skill。 以前使用 excel 表 skill 绘制一些流程图或者架构图的时候,你是不是和我一样,手动的一个箭头一点一点的进行绘制, 整个过程费时又费力。好在现在已经有了 excel 表 skill, 我 们可以让 ai 大 模型直接帮我们绘制流程图。我们在 skill 点 mp 网站直接把 skill 的 技能包下载下来, 解压之后直接放到点 tree skills 目录下面,我们就可以直接使用了。在聊天窗口中直接输入我们想要绘制什么流程图, tree 就 会自动调用相应的 skill 帮我们完成绘制任务,整个过程既简单又省力,而且绘制出来的流程图 不仅美观而且详细,真的是一句话就能生成一个流程图。除了刚才介绍的这两个 sku, 还有非常多好用的 sku, 比如方案的 design, 这个 sku 可以 帮我们把前端页面设计的更加美观人性化, 不会让你一眼看起来就知道是 ai 生成的,这是修改之前的样式,这是修改之后的样式。还有 work report skill, 一 句话就可以帮我们写出来属于我们自己的工作报告和周报。除了使用别人已经做好的 skill, 我 们怎么样根据自己的风格定制自己的 skill 呢? 其实非常简单,比如说我想创建一个检查代码规范的 sku, 我 们在聊天窗口中直接输入创建一个检查代码规范的 sku, 就 会自动调用内置的 sku creator 帮我们生成一个检查代码规范的 sku。 如果我们有什么个性化的需求,直接告诉 sku 就 行,它都能帮我们实现。使用的 sku 非常多,在这里就不一一缕举了。给大家介绍几个比较好用的 sku 网站。第一个 sku 四点 s h 这是一个 ai 智能体技能商店,只需一个命令即可安装 被开发者称为 ar ag 的 时代的 npm。 这里可以根据下载量排名,还有 skill 趋势分析,还可以根据热度排名。第二个 skill skill 点 com skill skill 点 com 是 全球最大的 ai 智能体技能聚合与发现平台,目前已收入了十四万多个 skill。 我 们想找什么 skill, 只需要点击四二七,然后在输入框输入 skill 名称,就能查找到所有相关的 skill。 这里还支持按照分类查找,比如工具类、开发类等等。 第三个就是 azureopex 官方提供的一些 sku, 这里收入了一些常用的 sku, 比如 pdf 相关的、 excel 相关的、前端页面优化相关的,大家可以按需索取。以上这几个 sku 地址我都放在了评论区,这期视频就到这里,拜拜!

最近这个 skill 特别火,然后我想说一下这个 skill 啊,无论是 skill 还是 ospec, 其实都是在规范 ai 行为啊。我们如果不懂技术的话,想要用口语化的表达,让 ai 去帮我们完成产品全站的开发,那我们就必须去约束 ai 行为 啊,让它按照项目级别流程专业去开发。这个时候我们就一定要用到一些专业的工具和或者手段,让它规范起来啊。 skill 跟 ospec 就是 可以帮助我们去规范他们的工具。 想要创建一个 skill, 最简单的方法就是啊,让 ai 给你写一个,但这个他写出来的 skill 并不一定很好用。我觉得最好的方法就是你去网上找一些大佬,他写他们写过的 skill 啊,因为他们的 skill 就 可能已经是他们不断优化过,不断迭代过,就是好用,他们才会分享出来一个 skill, 他 并不是说你写出来他就是很好用的,需要不断去优化。然后我们回到这里,就是你让 ai 给写完一个 skill 之后,然后在这边他就会生成一个 skill 的 nb, 就这样子,然后当你触发一些他的一些关键词,他就会自动去掉到这个 skill 啊,我们可以看一下一个实力,我这里写了一个,请帮我写一个介绍保时捷跑车的一个 ppt, 因为刚才我写的是一个 ppt 的 一个 skill, 然后所以说他现在就会自动去触发他的关键词,自动去掉他这个 skill, 然后我们再收回这个 open, 在我们跟 ai 表示我们需求的时候,我们有可能比较口语化去表述,这时候其实可以用一下这个,然后我这里写的就是一个很简单的一句话,就是让他给我生成一个 web, 然后在本地生成一个 i s 点 html 文件,然后这时候点这个融化这个内容, 你稍等一下,然后他就会给我生成一个稍微规范一点的话,这个时候一般就是都要切到这个酷狗这个模式,然后把这个 pan 打开, 在后面我加了一句这样的话,我这里写了,就让这个信息专家 a 人去帮我进行信息,然后调这个产品专家 a 人帮我去写这个 p r d, 然后我们发送就一定要点上这个 plan, 它这个生成需要一点时间。嗯,我们可以看上另外一款软件,就是这个 q 有 两种模式,一个就是 spec, 一个就是 y, 然后这个 spec 就是 就是 open spec, 在你使用这个 spec 的 时候,就是他会生成几个文件,一个是这个 requirement, 第三,然后还有这个 test, 这个 test, 是 啊,这是最关键的, 我们可以看到这个 test 其实他已经把我们开发周期,包括啊开发一些功能点,他其实已经拆成一个一个的主键,包括一个一个的步骤, 我们直接去点这个 star task 就 可以去运行了,它一般它运行完就是这个 task 它就完成了意思,然后一般这右上角会有一个 one or task, 就是 点之后它就是会帮你全部 task 都跑。 可能是我用的不太熟的原因,好像并不是多进城去跑的,我就算你就是一次性让它全部 task 都去跑,但是它实际上还是一个一个 test 去运行,这里你们就会看看到就是它可能当前运行这个 test 去运行这里你们就会排队,都在他这个队列里面去排队, 然后我们会要吹他这边的 open stack 的 使用,就是最终会将你每一个功能点拆成一个一个的主键,然后每个主键下面都会有一个 stack and d stack and d stack and d。 看一下他这大致就拆成一二三四五个五个主键。我觉得他比 kill 好 的一点就是他可以新建多个绘画,然后同时去写每个主键的功能是可以做到就是同时去跑的, 怎么去写也很简单,直接把这个拖过来,一定要打开这个 pro pro 模式,然后同样这边也是把这个拖过去,很简单,就这样来运行就行。

五分钟教会如何开发一个 agent skill 第一步是理解 skill 需求, 目的是明确 skill 功能和触发场景。这里以高中语文作文评分 skill 为例, skill 需要支持的功能 可能有作文评分、点评、改进建议等。用户触发场景可能是给出一篇作文要求、打分等等。所有功能和触发场景 agent 需要清晰掌握 skill 的 功能与应用场景。第二步,规划可附用 skill 内容, 其中可能包含脚本、参考文件等。 以高中语文作文评分 skill 为例,我们可能需要有一个作文评分标准,还需要一个字数统计的拍损脚本。 第三步,出场 skill 利用 skill create 的 出场脚本生成标准模板, 这里我们看到脚本的用法是脚本后加 skill name 后接路径 path 依旧。以高中语文作文评分四 q 为例, 可以看到这样就成功在指定目录创建了一个 skill 标准模板。 第四步,编辑 skill, 优先实现可附用资源及完善 skill 文档。首先编辑 scripts reference 以及 assets 中的内容,这里我们看到的就是刚刚创建的标准 skill 模板。 我们首先要编辑 python 脚本,实现统计作文正文字数的功能。将提前写好实现功能的脚本粘贴。 将我们需要的作文评分标准 reference 放到文件夹中,如视频所示,这是在网络搜集的评分标准,我们命名为 scoring criteria 点 md。 最后也是最重要的编辑 skill m d 必须包含前置原数据,其中 description 中需要同时说明 skill 功能与触发场景 正文使用 markdown 格式选择性添加可执行脚本目录参考文档目录输出目录。由于我们不需要储存用于产出的文件,可以直接删除 s s 部分。 这里我直接粘贴一个完整的 skill。 在 这里我们可以看到 s k, i, l, l 中包含了引用资源的目录以及脚本文件的用法。 这里我们删除多余的 assets 文件夹。最后第五步,打包 skill。 这里利用了一个用于打包的 python 脚本,可以进行格式检查与验证文件完整性。 打开终端执行这个脚本参数,加上 skill 的 路径以及可选的输出路径, 可能会曝如视频所示的错误。这是由于 windows 默认使用 g b k 编码打开了文档, 我们需要对 quick validate p y 进行编辑,找到包含 read text 括号的行,在括号内添加 in coding 等于 utf 八撇指定以 utf 八编码打开 保存文件,回到终端重新执行打包的脚本,可以看到已经验证通过并打包。由于 skill 打包本质上是压缩维 c 盘件,我们可以通过更改后缀查看其内部结构, 可以看到文件结构与打包前无变化。我们将 skill list 指令可以看到 已经正确安装了我们刚刚编辑的 skill, 那 么现在我们尝试调用这个 skill。 这里我使用 ai 搜集了一道作文题以及其对应的高分作文。先把题目交给 jammy, 然后按照要求提交作文, 等待 agent 输出即可。过程中可能需要允许 agent 执行脚本。 最后一份符合我们要求的报告生成完毕, 可以看到 agent 对 评分标准进行了较好的掌握,输出了一个合理的分值与建议, 这样就完成了一个 skill 从确定需求到落地应用的完整流程。

u i u x pro max skill 这个项目连续两周都出现在了 get 排行榜前二十名,我相信很多人都听说过这个项目,那它到底有什么用?怎么用?本期我将做一期从安装到使用的完整教程,希望通过这个视频让大家对这个项目有一个更加全面的了解。 在卡扣中可以通过 plug in 指令安装。在其它受支持工具中,可以先安装 ui pro cni 这个命令,然后根据对应的 ai 编程工具执行相应的粗俗化命令即可。 当然我们也可以参考文档,手动复制需要的文件到项目中进行手动安装。我个人认为这种方式自动化程度太低,太麻烦,不建议。说到底它就是一个技能,理论上只要 ai 工具支持标准的技能就可以使用。除此之外,拍腾三环境也是必须的,后面在使用的时候会调用到拍腾脚本 这个视频我使用翠意 solo 模式进行演示。首先执行粗制化命令进行安装,粗制化之后,可以在设置中的规则和技能中看见 u r u x pro max 这个技能已经被安装上了,如果没看见,可以点击一下刷新按钮。确认技能安装完成之后,我们丢一段提示词给翠, 让翠帮我们写一个程序员的个人网站。在对话框中,我们可以看见智能体已经调用 u i u x pro max 这个技能了。随后 python 脚本被执行,并且输出了设计方案。在右侧的终端输出中,我们可以看到 u i u x pro max 给我们提供的设计方案, 翠在制定计划的时候会考虑这份设计方案,并且写到计划中去。最后我们让翠按照这份制定的方案开始执行任务。当然,在 play 模式中,如果方案不合心意,我们可以再次修改,翠会再次调用 u r u x pro max, 按照我们的要求进行重新设计开发完成。我们来看看这个效果, 总的来说还是非常不错的。这个技能的工作方式总结一下,有以下几个主要步骤,第一步,分析用户提示词,使用 ai 进行推理。第二步,根据推理出来的风格、排版、颜色等信息,在数据库中搜索设计方案。这个设计方案中还包含了一个质量检查表,用于代码生成之后的检查。 第三步,交给 ai 工具,完成最后的代码生成工作。从以上信息可以看出,最终的交付结果终究还是依赖于编程工具的支持程度以及大模型本身的一个编程能力。 至少目前翠的支持程度个人感觉表现一般,在 pr 模式下,并没有完整的将 u i u x pro max 提供的设计方案完全覆盖。除了翠之外,我们可以看到还有很多编程工具受支持, 他们通过工作流、插件技能等不同方式接入。不过随着各个 ai 编程工具对标准技能的支持,以及官方仓库最近新增了标准的 skills 目录, 未来也许都会像翠等工具一样通过技能的方式集成。那我们需不需要用到这个技能呢?我个人认为,如果仅仅是氛围编程,没有设计稿,也没有明确的验收标准,那么有必要装上这个技能, 毕竟它可以为你提供一套完整的设计标准,不需要我们手动输入一堆提示词,而且也有一个相对不错的效果。好了,本期视频就到这,我是赛博笔记,我们下期见。

二零二五年十月十六号, anthropic 正式推出了 agent skill。 起初官方对它的定位相当克制,只是希望用它来提升 cloud 在 某些特定任务上的表现。 但大家很快发现,这套设计实在是太好用了,因此行业里很快就跟上了节奏,包括 vs code、 codex、 cursor 等工具都陆续加入了对 agent skill 的 支持。 在这样的背景下,十二月十八日, osrbake 做出了一个重要决定,正式将 agent skill 发布为开放标准,支持跨平台、跨产品服用。这意味着 agent skill 已经超越了 cloud 单一产品的范畴,正在演变为 ai agent 领域的一个通用的设计模式。 那么,这个让大厂纷纷跟进的 agent skill 到底是解决了什么核心痛点?它和我们所熟悉的 mcp 又有着怎样的区别和联系呢? 今天这期视频我们就分几个部分彻底讲清楚这个 agent skill。 我 们首先从 agent skill 的 概念出发,也就是给大家讲明白 agent skill 到底是个什么东西。然后我来给大家演示一下它的基本使用方法。 在了解了基本用法之后,我们再来看看它的高级用法。高级用法一共是包含两块,分别是 reference 和 scp。 最后,我会把 agent skill 和 mcp 做个比较,告诉你到底应该选哪一个。 好了,话不多说,让我们直接开始哦,不好意思,只是想证明自己不是 ai, 那 我们现在真的要开始喽。 那什么是 agent skill 呢?用最通俗的话来讲, agent skill 其实就是一个大模型,可以随时翻阅的说明文档。 举个例子,比如你想要做一个智能客服,你可以在 skill 里面明确交代,遇到投诉得先安抚用户的情绪,而且不得随意承诺。 再比如,你想要做会议总结,你可以直接在 skill 里面规定必须要按照参会人员议题决定这个格式来输出总结的内容。这样一来,你就不用每次对话都去重复粘贴那一长串的要求了。大模型自己翻翻这个说明文档就知道该怎么干活了。 当然,说明文档只是一个为了方便理解的简化说法,实际上 agent skill 能做的事情要远比这个强大,它的高级功能我们待会儿就会讲到,不过在目前的起步阶段,你就把它当成是一个说明文档就行。下面我就用会议总结这个实际的场景带大家看看它到底是怎么使用的。 这里我们使用 client skill, 要想使用 agent skill, 那 当然是要先创建一个啦。 根据 cloud code 的 要求,我们需要在用户目录下的 cloud skill 文件夹创建我们的 agent skill。 所以呢,就让我们先进入到这个文件夹中,然后执行 maker 会议总结助手来创建一个文件夹,这个文件夹的名字就代表了我们 agent skill 的 名字,然后再使用 vs code 来打开这个文件夹,这样的话我们编辑文件会更方便一些。打开这个文件后,我们在里面创建一个叫做 skill 点 md 的 文件, 然后填好这个文件的具体内容,就是这样了,每一个 agent skill 都需要有这么一个文件,它用来描述这个 agent skill 的 名称,能干什么事以及怎么干这个事情的。比如我们这里要创建的 agent skill 就是 用于总结会议目录内容的, 它的 skill 点 m d 一 共分为两部分,头部的这几行被两段短横线包起来的是叫做原数据,英文叫做 matte data。 这一层就只写了 name 和 description 这两个属性。 name 呢是 agent skill 的 名称,必须与文件夹的名字相同。 name 的 下面呢是 description, 它代表这个 agent skill 的 描述,主要是向大模型说明这个 agent skill 是 用来干什么的。然后再看下面剩余的部分,这个呢就是具体的 agent skill 的 说明了, 官方把这一部分呢是叫做指令,对应的英文是 instruction, 这一部分就是在详细描述模型需要遵循的规则。比如说你看这里,我规定了它必须要总结参会人员议题和决定这几个方面的内容, 然后为了确保他真的理解了,我这里还举了一个例子,输入的是会议的录音内容,然后输出的呢就是我们所需要的格式了。好,现在我们的 agent skill 应该是做好了。对,就是这么简单,就是一个说明文档。 下面我们打开 cloud code 来验货,首先随便找一个空目录,打开 cloud code, 然后输入下面这个问题,你有哪些 agent skill? cloud code 给我们回答了,可以看出他已经发现了我们写好的 agent skill。 然后我们来看看 cloud code 是 怎么使用这个 agent skill 的。 我们输入请求总结以下会的内容,然后粘贴一段会议录英文本回车,让我们看看 cloud code 会如何应付我们这个问题。 好, cloud code 有 反应了,大家注意看屏幕,这里 cloud code 并没有直接开始下编,他根据我的指令意识到了这事归我们刚才上传的那个 agent skill 管,所以呢,他是在向我询问能不能使用这个 agent skill, 那 我们当然是同意了。同意之后,他就开始读取我们写的那个会议总结助手了,主要就是读取其中的那个 skill 点 m d 文件,让我们稍作等待 好,结果出来了,参会人员议题决定三点都清清楚楚,这完全符合我们在 skill 里面定的规矩。这个呢,就是 agent skill 的 基础用法了,是不是很简单?现在你知道了如何创建和使用 agent skill, 那 不妨让我们想想刚才到底发生了什么。 首先,整个流程中一共有三个角色,用户 cloud code 以及 cloud code 的 背后所使用的大模型。在我们的例子里,这个就是 cloud 模型 流程一开始的时候,用户会输入请求,此时 cloud code 会把用户的请求连同所有 skill 的 名称和描述一起发给大模型。注意,这里只带了名称和描述, 也就是我们前面所说的 skill 原数据层。虽然说我们之前只演示了一个 skill, 但是你可以想象一下,哪怕你装了十几个 skill, 此时的大模型呢,也只是在看一份轻量级的目录,因为毕竟只有名称和描述嘛。 在接到了用户请求和每一个 skill 的 名称描述后,大模型会发现用户的请求呢,可以使用会议总结助手这个 agent skill 来解决, 此时呢,他就会把这个信息告诉 cloud code。 cloud code 接到大模型的响应之后,会去会议总结助手那个目录里面读取完整的 skill md。 正文儿对,这个时候读取的呢,才是 skill md 的 全部内容,之前就只是名称和描述, 而且要注意,他只读取了会议总结助手这一个 agent skill 的 内容哦。在拿到了会议总结助手的 skill md 内容后, cloud code 会把用户的请求和完整的 skill md 内容发给大模型, 大模型会根据 skill 点 m d 的 要求来生成响应,并且把响应发给 cloud code, cloud code 进而呢,会把这个响应发挥给用户,这样呢,用户就会看到结果了。 这就引出了 agent skill 的 第一个核心机制,按需加载。虽然 skill 的 名字和描述是始终对模型可见的,但具体的指令内容只有在这个 skill 被选中之后才会被加载进来给模型看,这个呢,就节省了很多的 token 了。 前面我们讲了,一开始 cloud code 会把所有 agent skill 的 名称和描述都给到模型,比如说什么爆款文案 skill、 会议总结 skill、 数据分析 skill 等等。模型呢,会从中选择一个, 之后只有选中的那个 skill 的 skill 的 md 文件才会给到模型。说白了呢,就是按需加载,这个呢,已经很省头肯了, 但是它还不够极致。大家试想一下,我们的会议总结助手可能会越来越高级,我们希望它不仅仅是简单复述,而是能够提供更有价值的补充说明。 比如说,当会议决定要花钱时,它能直接在总结里标注是否符合财务合规,当涉及到合同时,它能够提示法务风险。这样大家在看会议总结的时候,就不需要再去翻规章制度,一眼就能够看到这些关键的补充信息,这就非常方便了。 但问题在于, skill 能做这些事情的前提是它要把相关的财务规定和法律条文都写入到 skill 点 m d 文件里。这些文件可能会非常长,都写进去的话, skill 点 m d 文件就会变得无比的臃肿, 哪怕只是开个简单的早会,都要被迫加载一堆根本用不上的财务和法律废话,浪费模型资源。那能不能做到暗虚中的暗虚呢?比如说,只有当会议内容真的聊到了钱, cloud code 才会把财务规定加载给模型看。 其实这个呢,也是可以的, agent skill 呢,提供了 reference 的 概念,干的就是这个活,让我们来试一下。首先我们来给它加一个文件,也就是 agent skill 术语里面的 reference。 我们把这个文件叫做集团财务手册,里面写明了各种费用的报销标准,比如说是住宿补贴五百一晚,餐饮费人均三百一晚之类的。然后我们在原来的 skill 点 m d 文件里面新增一个财务提醒规则,里面写明仅在提到钱预算采购费用的时候出发。 出发的时候呢,需要读取集团财务手册点 m d 这个文件,根据文件内容指出会议决定中的金额是否超标,并明确审批人,这就可以了。我们回到 cloud code 这里再试一下。 这次我们的请求仍然是总结下这个会议的内容,不过呢,这次使用的会议内容稍微换了一下, 这段对话呢,我们就不细看了,你只需要知道,在这段对话里面,老陈让小李订一千二百一晚的酒店,这涉及到了钱。 按道理来说, cloud code 应该触发我们刚才新增的财务提醒规则,让我们看看 cloud code 能不能意识到这一点。首先, cloud code 意识到了这个请求跟我们的会议总结助手相关联,请求使用这个 agent skill, 我 们同意。 然后他意识到了这个会议跟钱相关,根据 skilled md 文件的指示,他请求读取集团财务手册,这个文件用于查看里面的财务合规信息,这个呢,我们也同意。 最后他根据实际的会议内容生成了总结,可以看出,总结中不仅包含参会人员、议题、决定等基本信息,还包含了财务提醒,这完美符合我们的需求。 这个呢,就是 reference 的 核心逻辑了,在 agent skill 的 体系里面,集团财务手册点 m d 这个文件就是一个典型的 reference, 请大家记住它的特性,它呢是条件触发的。 在刚才的例子里面,只有当 cloud code 读取完 skill 的 md 文件,判断出需要查账时,才会去加载这个文件。反过来说,如果这是一个跟前无关的技术复盘会,那么这个财务文件就只会躺在硬盘里面,绝不会占用哪怕一个 token 的 上下文。 好,讲完了 reference, 接下来我们来讲讲如何让 agent skill 跑代码,毕竟查资料只是第一步,能直接动手运行代码,帮我们把活干了,这才是真正的自动化。这个呢,就用到了 agent skill 的 另一大能力, script, 让我们在文件夹里面创建一个 python 脚本,文件名就叫做 uploader pi, 用于上传文件。之后我们填好这个代码文件的内容,然后我们来到 skill md 这个文件里,再加上一段关于上传规则的描述, 如果用户提到了上传同步或者是发送到服务器这样的字眼,你必须运行 uploader pi 脚本,将总结内容上传到服务器。然后呢,我们来到 cloud code 这边,输入请求,总结下这个会议的内容,并把它上传到服务器中,然后我们粘贴会内容。 跟之前一样, cloud code 意识到了这个请求与我们的会议总结助手相关,所以呢,他请求使用这个 agent skill, 我 们同意,然后他把会议的总结内容输出了出来,并准备上传到服务器中,他请求执行 up 六点 pi 文件来实现这个功能,我们也同意 好上传成功。而且 cloud code 还把上传相关的一些信息也展示了出来,非常棒。 这里面呢,有个小插曲,大家注意一下,我这次所使用的会议内容跟钱其实没什么关系,所以 cloud code 呢,也并没有去读取集团财务手册那个文件, 结果中呢,也没有财务提醒相关的内容。这正好印证了我前面所说的观点, reference 是 按需加载的,如果用户没有提到与 reference 相关的内容,那 cloud code 是 不会去读取它的,这样就达到了节省上下文 token 的 目的。 好让我们再回到代码执行部分,注意看这里, cloud code 申请执行这个 uploader pie 文件,它并没有去读取这个文件。没错, agent skill 里面的代码只会被执行,不会被读取。 这就意味着,哪怕你的脚本写了一万行复杂的业务逻辑,它消耗的模型上下文呢,也几乎是零。 cloud code 只关心脚本的运行方法和运行结果,至于这个脚本的内容,它可以说是毫不在意, 所以呢,虽然 reference 和 script 都属于 agent skill 的 高级功能,但是呢,它们对于模型上下文的影响其实是截然不同的。 reference 是 读,它会把内容加载到上下文里面,所以呢,是会消耗 token 的。 script 呢,是跑,它只会被执行,不会占用模型的上下文。讲到这里,我们需要停下来稍微做个总结,聊一聊 agent skill 的 渐进式批漏机制。 agent skill 的 设计其实是一个精密的渐进式批漏结构,这个结构里面一共有三层,每一层的加载机制都不太一样。 第一层是原数据层,这里有所有的 agent skill 的 名称和描述,它们是始终加载的,相当于大模型里面的目录。大模型每次回答前都会看一下这一层的信息,然后决定用户的问题是否与某个 agent skill 相匹配。 第二层是指令层,对应 skill 的 md 文件里面除了名称和描述之外,其余的部分,只有当大模型发现用户的问题与某个 agent skill 相匹配的时候,它才会去加载这一层的内容,所以呢,我们称这一层为按需加载。 第三层是资源层,这个呢,是最深的一层,它一共是包含 reference 和 script 两方面的内容。其实按照官方最新的规范,应该还有一个组成部分叫做 assets, 不 过我看了一下,它跟 reference 的 定义似乎有部分重叠,因此我们这里先忽略它。 好,我们刚才例子里面的集团财务手册和 uploader pie 脚本就属于这一层,只有当模型发现用户问题与财务或者上传相关的时候,它才会去加载这一层的内容, 这就相当于是在按需加载的指令层基础上又做了一次按需加载,所以我们可以称它为按需中的按需加载, 当然这是我起的名字啊。 reference 和 script 的 加载方式其实不太一样, reference 是 被读取的, cloud code 会把对应文件的内容放到模型的上下文中,以供回答式参考。而 script 是 被执行的, cloud code 根本就不会去看代码的内容,它只关心代码的执行结果。 当然这个也不是铁律啊,如果你没有把代码的执行方法说清楚, cloud code 还是有可能会去看一下代码的,毕竟跑不下去了嘛,这样的话呢,就会占用模型的上下文了。所以还是请大家写 skill 的 时候尽可能的把一切都解释清楚。 那聊完了 agent skill 的 用法,很多朋友可能会有种似曾相识的感觉, agent skill 好 像是跟 m c p 有 点像啊,本质上都是让模型去连接和操作外部世界。既然功能重叠,那我们到底应该用哪一个呢? 关于这个问题,按 serapic 官方写过一篇相关的文章来解释,核心观点就一句话就在这里, mcp connects cloud data skills teach cloud what to do with that data。 这句话可以说是直接点明了 mcp 与 agent skill 的 区别,它其实就是在说 mcp 给大模型供给数据,比如说查询昨天的销售记录,读取订单的物流状态等等。 而 skill 是 教会大模型如何处理这些数据的,比如说是会议总结必须要有个议题啊,汇报文档必须要包含具体的数据啊等等。到这里,有些同学可能就会问了, 不对啊, agent skill 里面也能写代码,我直接在 agent skill 里面写连接数据的逻辑不就好了吗?这样呢,就不需要 m c p 了, agent skill 就 直接把这两个活都给干了。 确实啊, agent skill 也能连数据,功能上与 m c p 有 所重叠,但是能干并不代表适合干, 这就好像是瑞士军刀也能切菜,但没有人会这么干。我们这个场景呢,其实也是这样, m c p 本质上是一个独立运行的程序,而 agent skill 本质上是一段说明文档,它们的本质不同决定了适合的场景也是不同的, agent skill 更适合跑一些轻量的脚本,处理简单的逻辑。在代码执行方面, agent skill 的 安全性和稳定性都不及 mcp, 所以 大家还是要根据场景选择合适的工具。甚至在很多的场景下,我们需要把 agent skill 和 mcp 结合起来一起使用,以便尽可能的满足我们的需求。 好,今天的视频呢,就到此结束了,我是马克,用最通俗的语言讲最硬核的技术。如果我的视频对你有帮助,欢迎点赞订阅,我们下次再见,拜拜!

skill 最大的好处我觉得就是它可以非常定制化,接下来跟大家分享我用呃 brainstorm 和 skill creator 这两个 skill 帮我自己去搭的一个新的做用户访谈分析的 skill。 首先我先调用的是 brainstorm skill, 然后想要你帮我去想一个结构化的提示词,去抽出这个访谈中有价值的信息,然后它会根据我的这一句话简单的需求群的来 问我,然后每次都会有一个问题去呃把这个点做的越来越清晰, ok, 然后他就设计出来了第一个版本非常通用的一个呃提示词, 然后呢这个我觉得当然是不够的,因为我想要的输出其实是呃根据我们自己本身的这个访谈的结构来的,这样的话我可以去规范他。最后这个 skill 给我输出的东西是一个嗯, 我需要的,然后我就给他了一个我们的这个访谈清单,他来根据我给到的信息做一个化,然后最后给到了一个非常明确的新的提示词, ok, 当我觉得没有问题了之,他就可以帮我来创建这个 skill 了,这个就是用到第二个 skill 就是 skill creator, 然后他创建了 skill 之后, 我就可以调用这个新的 skill 来帮我做这个用户分析了,然后直接把我的这个文件给到他之后他就可以帮我生成一个 markdown 的那个用户访谈的整个呃信息和内容,这个东西就非常好用了,所以后面但凡我有竹子稿的话,我直接把它扔给这个 skill 之后,它就可以帮我生成一段非常详尽并且完整的用户访谈的分析,而且所有的分析结构都是一样的,想想这个事情能生活多少的时间和精力,真的太牛了。

最近 agent skill 这个词在 ai 圈,尤其是在 ai 编程圈子里面特别火,它最早是由 cloud code 的 母公司 ansorepic 在 二零二五年十月份提出来的,因为效果太惊艳,现在各大顶尖 ai 编程工具,比如说 cursor codex, anti gravity 以及字节推出的 tree 都在第一时间进行了适配。由于 tree 对 国内小伙伴没有什么使用门槛, 而且它非常全能,能够兼容几乎所有的大模型,尤其是它上手极快,支持一句话,创建技能。所以本期视频我就以 tree 为例,给大家做一个详细的讲解,包括 skill 到底是什么,怎样在 tree 中创建 skill, 以及我们普通人可以用 skill 来做什么具体的事情。最后还有跟大家推荐一些非常好用的 skill。 首先跟大家讲一下这个 skill 到底是个啥?举个通俗易懂的例子,假如你把 ai 当做你刚招的 skill 到底是个啥?举个通俗易懂的例子,假如你把 ai 把写文章的 prompt, 也 就是具体要求和注意事项强调一遍,而使用了 skill 之后,你就可以把写文章的规则要求封装到一个 markdown 文档里面,你只需要告诉他写什么主题, ai 就 可以自动从 skill 中获取文章写作的要求。所以说 skill 要解决的核心问题就是让 ai 彻底告别间歇性失忆。有了 skill, 就 像是给 ai 装了记忆,你只需要告诉他想做什么,他 就能够自动调取写好的技能包,按照你的流程瞬间搞定。那这本给 ai 准备的操作手册在电脑里面长什么样子呢?其实它本质上就是一个普通的文件夹 里面最核心也是唯一必须的文件叫做 skill 点 m d, 你 可以把它理解成这本手册的核心,大脑里面清清楚楚的写的这个技能叫什么,什么时候触发,以及具体的执行步骤。如果你想让这个实习生表现的更加专业,你还可以往文件夹里面塞几个附件包,比如说在 examples 文件夹里面放几篇满分范文给 ai 参考,或 或者是在 resources 文件夹里面放一些复杂的背景资料和自动化脚本。所以 skill 的 结构其实非常简单透明,它就是把你的经验打造成了一个标准的知识包,只要把这个文件夹交给 ai, 它就能够瞬间读起并掌握这项新技能。那怎样在翠中创建 skill 呢?主要有三种方式。 一种方法最为简单,就是直接白嫖其他人分享的 skill 技能,你可以去 github 找到各种大牛写好的 skill, 把包含 skill 点 m d 的 整个文件夹下载到本地,然后在 tree 的 设置里点击规则和技能,选择创建并导入文件夹就可以了。第二种方式是对话式创建,也最适合小白用户。首先打开 tree 的 solo 模式, 然后你只需要像平时聊天一样对翠说,帮我创建一个检查代码性能的 skill, 真的 只需要一句话,翠就能够自动理解你的需求,帮你把名称、描述和指令瞬间生成好。 而且最方便的是,翠的内部就集成了很多非常专业的技能模板,我们直接调用就可以了,完全不需要再额外下载或者是配置任何复杂的环境。第三种方式适合动手能力强的小伙伴,那就是手动创建,直接在标准的 markdown 模板里面填写技能名称、出发条件和详细的操作步骤。 简单的 skill 其实只需要名字和描述就能够跑起来,复杂的流程还可以慢慢的往里面加具体的执行指令。无论你是直接导还是想自己写,核心都是为了给这个实习生立规矩,让他彻底变成最懂你工作习惯的专业助理。 学会了创建,那创建好的 skill 到底该怎么用呢?有两种姿势,第一种叫做显性调用,也就是点将法,当你想要精准控制输出结果时,直接告诉翠用哪个技能,比如说用 用周报大师帮我整理一下工作,或者用小红书分身写一个文案,这时候翠就像接到命令的专家,严格按照你设定的流程干活。第二种更高级,叫隐性调用,你只要在创建时把什么时候用写清楚,比如 skill 的 出发条件是用户要求写复盘,那下次你随口问一句,看看我这周表现怎么样, 就能够自动识别并瞬间激活,这个技能完全不需要你指定。虽然 skill 是 ai 编程工具中的功能,但它的应用场景远不止写代码。对咱们普通打工人来说,只要你的工作有规律有模板,它就是你翻倍提效的秘密武器。 比如说你可以用来做下面几种事情,第一个是职场提效,写周报复盘,再也不用发愁建个周报大师技能,把模板和语气存进去以后,随手甩一段白话总结,翠就能够秒出一份专业报告。 面对几十页的 pdf 或者是乱码表格,你不需要记住任何复杂公式,调用数据分析技能,它就能够自动完成清洗和分析,直接给出你要的答案。第三个是标准化创作,不管是小红书的爆款逻辑,还是回邮件的固定语气, 都能把要求通通打包,以后每次调用的效果都像你亲手写的一样稳。说白了,这就是把经验变成自动驾驶,只要你想把专业知识沉淀下来,它就是你最强的全自动助理。 最后跟大家分享几个可以找到优质 skill 的 地方。首先要推荐的就是 osropic 官方维护的这个 skill 开源项目,目前已经收获了四万五千多个 star, 这里面的 skill 覆盖了非常多的类型,比如创意设计类、开发技术类、企业沟通类,以及最实用的文档生产类, word、 ppt、 excel、 pdf 这一整套全部都给你安排上了。 其次再跟大家分享一个专注分享 skill 技能的导航网站,该网站目前已经收入了七万多个实用技能,它把公开的 skill 做了搜索和分类,量非常大,适合找冷门场景。

大家新年好,今天是一个重磅的分享,经常看我视频的伙伴都知道,我在过去的时间里,用不读一行代码的方式,一种黑盒编程的方式,已经把一个项目做出了一个雏形。在这个过程中,我也积攒了一些经验,会陆续做成视频分享给大家。 去年 cloud 推出了这个 agent skills 这个功能之后,我也做了一些视频。现在 skills 的 使用价值已经完全的超越 mcp 了,而且我认为它的使用门槛是相当的低, 但是可能很多朋友还没有学会怎么用,今天我就教你们一个使用 skill 做自动化流程,给自己提效的一个万能公式。所谓的万能公式就是所有人都可以不用写代码就可以用。 那首先提到这个万能公式,我先介绍一个工具啊。这个经验来自于我之前用黑河编程做的项目,我经常让 ai 去做后端测试,他特别喜欢用这个命令, 我根据这条命令就构建了一套它用于测后端的一个脚本,所以我的项目开发的也比较顺。但这个命令我觉得我们不用去学习,你只需要知道,它可以模拟我们所有操作网页的方式。 如果你常用的 web 服务器是支持 api 访问的,那么你只需要让 ai 读一下 api 的 文档,它就可以构建出一套纯自动化的流程。当然这么听可能有点抽象,我会用了这个命令,跟我的这个 万能公式又有什么关系呢?我来举一个例子你们就懂了。我的女儿前几天考这个 g s p 的 五级 c y y 的 一个考试,她没考好,我分析了一下,其实是刷题刷的不够,虽然我给他做了一个 ai 工具,新奥制题助手,这个我之前分享过, 但是这个工具有一个问题,就是他没有自己的题库,这些所有的题其实还是我自己在网上找的,我要通过这个工具的内置功能给它加入进去。 但是这个怎么说也比较麻烦,你得录入题目,你得用 ai 分 析测试点,还得找答案。虽然我也在工具上做了一个类似 a 证的抓网页的功能,但我觉得不好用,而且它只能抓题目,它的测试点和答案你还得另找这个软件,它已经完全落后于这个时代了,我也懒得再去狗尾续貂, 但是我想了另外一个招,这招是什么呢?就是因为我的信号制题助手,它启动之后就会有一个后端服务器, 当初我觉得在这个 electron 里运行一个 python 服务器,这种设计还挺奇葩的,但是现在想想还是挺明智的。我把后端的 api 的 代码喂给这个 cloud code 之后,他竟然就把这个 skill 做出来了。 我只需要打开这个应用,然后让 ai 分 析我孩子的代码,让他有针对性的推荐题目,然后调用我的后端 api 加入我的提库。 所以说如果你有一个学习系统,他也是有后端的, ai 就 可以完全实现。他作为一个可以操作你后端的一个机器人,根据你的要求来操作你的后端,比如说给你出题,或者是帮你分析,可以把所有人需要去做的 任务一下一下点击做的任务,变成一个让 ai 去做的一个工作流,而且实现这个工作流,你不需要干任何事,你只要一句话,他就可以去执行很长时间。 给大家看一下我这个技能,做了两个技能,一个是一个叫 csp, 一个叫对拍。能不能看一下这个 csp 的 这个技能,这个技能 总体来说它就只有一个文档,它就是描述我这个信号制题助手的后端的 api, 它描述了一些场景,比如说它的基础的 url, 它怎么样去管理题库,应该怎么获取编程题,它的这个格式是什么? 给了一些例子,怎么样去获取答题记录,是用什么样的格式?如果你要验证代码,用沙盒验证沙盒的 api 是 什么, 包括你可以 c 加加,也可以用 python, 它描述了一些场景,场景一是怎么样添加新题目,怎么样看学生的答题记录,怎么用沙盒快速验证, 还给了一个文档,这个文档是一个完整的一个 api 参考,我只是把我的这个 api doc 给 ai, 通过这个 sql creator, 它就自己给我全部创建了。我给大家演示一下啊。首先这是这次我女儿没做的这道题,五级的一个题,她没做出来,我就说我就用通过这一个 prompt, 让她来分析她的算法和考点,然后在立扣上帮我找类似的题, 然后制度相关的要求,难度中等,把题单抓下来,放到我的题库里,在入库之后,用对拍这个技能来求解,让他一步一步执行。你看他先做了个计划,他知识点,他分析出来了, 好去立扣抓题,他用了很多的任务,子任务,最后抓到了五道题,这入库的结果,他现在做了五道题,他能获取我们这个资料库,然后找到资料库,把题目放进去,然后就开始就要用对拍工具做对拍来求解了。 当然这个对拍工具我觉得还需要优化,他用的时间巨长无比,他现在已经跑了四十分钟还没有做完。 当然一次搞五道题可能是有点贪心了,但是它还在积极的运行中,如果我们正常的使用来说,其实就可以把它扔这,让它自己去搞就行。好吧,只是给大家演示一下这个 skill 运行好了是什么结果,基本上我到目前为止, 我除了输入那个 prompt 之后,我还没有管过,所以其实基本上就是 one side, 你 可以让它自己一直搞下去。那我们如果再把脑洞开大一点, 比如公司的系统是用来查数据库而做分析的,你也完全可以让 ai 去调用一个 skill 去查,直接做分析。现在的外部架构基本上都是有为 api 的 设计的,所以任何带有后端的服务,我们都可以通过 api 把它做成 skill, 然后让 cloud code 成为它的外挂,而你不需要做任何的开发, 这就是我称之为任何人都可以使用 skill 提效的万能公式。可能有朋友问了,那如果我有一个服务器,但是我不知道 api, 我 没有它的文档,或者说我不会做 skill, 那 该怎么办? ok, 我 今天推荐两个工具啊,第一个就是 chrome devtools 这个工具,它简单来说就是给你的 cloud code 的 一个浏览器,我们来看一下,你看,我现在是让它用 chrome devtools 启动一个浏览器,访问落谷点 com, 它会打开这样一个浏览器,我在这上面做一个操作,接着我让它读一下它网络请求的这个日记。我刚做了个搜索,能不能分析下格式 ai, 它会自动从这个工具里把这个 network 的 请求全部列表出来,然后分析出来这个格式, 它会总结成一个文档,这个 json 格式。刚才我搜索了其实有一个是标签,这里要选标签的标签,标签其实它也是有一个 api 的, 所以我就问他有没有获取标签列表以及标签意义的处理啊?他发现找到了之后,他就给我去列举,他能把所有的标签列举出来,我让他去用这个方法去测试一下 五级减的二分题目,他很快就给我找到了一些这么多题目,五十三道题。有了这样一个东西, 我就可以让他帮我去找题目了。当然并不鼓励大家用这种方式对任何网站做这样的分析。你首先要看这网站允许不允许你这样做,如果他要求必须登录才能用的话,我建议还是不要做,这样 不太好。你们如果说你们自己的系统,比如说你公司内部的一个数据库,那你就完全随便了, 即使你没有这个文档,你也可以用我这种方法来获取。获取完了之后你会发现这整个的上下文就会充斥着这些关于结构的一些知识。我们该怎么做呢?我把以上获取的这个技巧放到一个新的技能,我让它创建技能了。最重要你要提到这个 skill creator, 这个 skill crit 是 一个 osophic 推出 skills 时的一个默认的一个基础技能,但是你需要去安装它, 我等一下说怎么安装?如果你安装好了之后,你在做任何技能的时候,你不需要自己去做,你直接告诉 cloud 用 skill crit 把以上的经验做成 skill 就 好了,就这么简单, 它会放到这样一个结构底下,就是放 skill 点 m d, 然后它会给你创建一堆脚本,当然这个脚本是什么样你们不用管,就反正它做好了,你直接用就行了。那么 skill crate 在 哪里找呢?在这个 repo 里头,这是一个 safari 推出的, 它也提供了一些安装手法, plug in, 通过 marketplace 方式,用 plug in 把这个 skill 安装进去,安装好了之后,它这个文档里头就会有所有的这个技能,其中你们看,这有一个 skill creator, 就是 这个 skill creator。 我 们再总结一下,如果你没有 api 的 文档,你不会做 skill 怎么办?首先你先操作一遍,让它抓取,然后给你生成一个文档, 接下来直接告诉他,用 skill creator 来做一个 skill, 就 这么简单。经常看我视频的朋友知道,我过去还分享过千万三 omni 的 语音互助,还有我的监工 agent 的 项目,还有我的 finnus 上的一些场景。 我相信呢,在今年就一定会实现一个场景,就是我们再也不需要使用 cloud code, 而是直接通过语音发出一个命令,然后我们的 worker 就 会在 boss 上给我们完成一个长线的任务,最后把结果给我们呈现出来。 所以我想说的是呢,我分享的这些内容并不是零散的,他们都是在为了实现这样一个目的,这样一个场景的技术战之一,所以我做的内容并不是为了做内容而找主题,而是为了实现我理想中的 agi 的 场景, 然后把我过程中的一些发现分享给大家,这是一个真实的长线的 ai 的 学习和成长,所以关注我,你们也可以获得同样的成长。 ok, 以上就是今天所有的内容了,谢谢大家。

hello, 如果你正在学 web coding, 那 可能会被四个词搞晕过, prompt、 system prompt, skill 和 workflow。 那 今天呢,我们就用最简单的方式,和大家一起理清楚这几个词之间的概念和应用场景。我们先说 prompt, 它是一次性的指令, 比如说现在我让 ai 去帮我 review 一下这段代码,这个就是一个 prompt, 它的特点是临时的 令,具体用完呢,即扔,就像调用一个函数一样,我们把参数传进去,拿到结果,那这个就结束了。这个部分呢,很多人可能会有一个小误区,是会把所有的一些规则都塞到 prompt 里面,结果呢, prompt 就 会越写越长,然后根本就没有办法去维护,这个是需要注意的。那上面讲了,这个 prompt 什么应该放在 system prompt 里面呢? system prompt 是 ai 的 一个人格设定,它不管这次做什么,它管的是人体局的配置, 会告诉 ai 你 是谁,应该怎么样去思考。比如我们可以告诉 ai, 你 是一个存储引擎的专家,核心,会关注数据的一致性,会主动地去找返利,去验证和验否。这个就特别像我们写这个程序的时候,去做一个局的配置, 一次设定,然后大局和全程就会生效。那再说说 skill, 它呢,是 ai 学会的一种可复用的能力,比如说,呃,写这个 bug 测试,或者是做一些单元测试,那这些能力呢,都可以抽象成 skill。 skill 的 核心是输入明确,输出比较稳定,而且可以反复地去做一些调用,就像我们封装一些工具函数一样,哪里需要呢,就可以在哪里去调用。 那什么时候呃需要去抽象 skill 呢?那如果我们发现同样的 prompt 我 们写了三遍以上,那这个时候我们就该考虑可以抽象成一些可附用的 skill 的 能力啊,去进行封装。 那最后一部分呢,是 workflow, 它是多步协作的一个完整的流程,比如说我们要修一个 bug, 那 我们完整的一个流程是我们先 review 一下代码。那第二步是我们先呃生成一些猜想,哪一步可能出了问题, 第三步就是再写一些测试。第四步就是检验一下我们的这个呃 bug 的 定位是不是准确的,然后最后再去进行这个 bug 的 fix 修复和 review。 那 这一套流程呢?就是一个 workflow, 那 它可能会有这个分支,也可能会去有回滚, 呃,也会有多个 agent 之间去进行协助,就像这个 pipeline 一 样。那如果我们担心会搞混淆呢?我们可以记住下面这个对照表, uh prompt 是 我们想让 ai 这一次帮我们做什么,那 system prompt 是 告诉 ai 应该用什么样的身份去进行思考, 那 skill 呢?是这个能力我们以后还会用到 workflow 是 我们做成这个事情,我们需要拆分成几个步骤来去进行。 那最后分享一个啊, web coding 的 实战的心法就是先去设计我们的 workflow 啊,后去进行 skill 的 一一些提取,然后最后去啊具体去写 prompt。 第一步呢,我们先想清楚这是一个流程吗? 如果我们可以通过一个流程去描述这件事,那我们就先把我们的 workflow 每一步要做什么,然后先设计出来。那第二步我们再去拆 skill, 哪些步骤可能会反复地去出现,反复地去进行复用,我们可以把它抽象成可复用的 skill 的 能力。第三步,最后我们再去告诉 ai 每一步应该具体去做什么,那这就是很明确、很具体的一些指令。