梅猴王朋友们, agent skill 最近真的太火了,但很多朋友肯定还是很困惑, skill 到底是啥?有什么牛的?没关系,草旅从 skill 大 全它来了。 今天呢,我们会通过一个逐步升级的案例来理解 skill 的 结构和原理,然后我们还会学会定制自己的 skill 这个 skill 呢,只需要我们说帮我做一个促销海报啊,优惠券,员工服装,它就会生成符合我们品牌风格,带 logo 的 物料图片。 另外,我也会推荐给大家一些好用的必用的 skill, 比如说帮你的文章配图,把杂乱的知识变成教学网页,一句话处理表格等等等等。 我还做了个秋之技能生成器,大家只要回答一下 ai 给的选择题,为你量身定制的技能就轻松完成了。并且今天所有的资料链接以及补充资料我都做成了一个网页,大家只需要一步步的跟着做,跟着看,就一定能搞定, 非常值得一个点赞收藏关注哦!来吧,准备好我们 go go! go! 首先,到底什么是 skill skill 呢?翻译过来就是技能呗, 它其实和人类的技能是类似的,比如说你是一个厨师,那你就有炒菜的技能,处理食材的技能,摆盘的技能等等等等。那每个技能里面,比如说炒菜技能,这里面就包含了你的流程,你要先炒什么,后放什么, 还有你的配方,你的油温多高,盐放多少。有了流程和配方呢,你可能还会需要一些工具,需要煤气灶什么的, 甚至你可能还会有一些独家的材料,有一勺秘制辣椒酱什么的。那 agent 的 技能也是同理,它要来做菜,它也得有流程、配方、工具和材料。 所以在 agent skill 的 术语里面呢,它就是 skill 点 md, references, scripts 和 assets 这些东西打包成一个文件夹,这就是一个技能,一个 skill 了。我们先来个简单的, 比如说我们要做一个写作 skill, 那 我们就在 skill 里面可以要求他先去啊这些网站去搜集信息,然后再按这个爆款原则去写个大纲,然后再参考这个语气来写稿啊,最后按照平台要求来审稿等等等等。那有朋友就很疑惑, 那这不就是写提示词吗?哎,本质上还真是的,毕竟啊,我们跟大模型的交互其实都离不开提示词, 但是呢,这并不是 agent skill 的 全部,它在工程上是有很多优势的,能做的肯定比我们拷贝粘贴提示词要多很多。好处我们后面都会说到,那先让我们通过创建一个 skill 来理解它的结构和原理, 我这里用的是谷歌反重力来做编辑器来看文件,然后呢,用的是 cloud code 来做 agent 来处理任务。这俩东西的下载方式呢,我也都放在资料里了,非常清晰简单,大家一步步跟着做就行了。 接着你只要在反重力的这里创建一个项目,比如说我的就叫丘之 project 吧,然后呢,我们调出终端, 输入 cloud cloud code 就 调用出来了,这个界面大家看着会有点复杂,但是不要怕,跟着我一步步来就可以了,之后我们跟 agent 的 对话都会在这里进行。 ok, 那 我们开始创建, 那我们先要做的是一个最简单版本的 skill, 后面呢,我们会逐步升级的哈, 那现在假设我是一家轻食店的老板,那这是我们秋之餐厅的一个品牌 logo, 那 我希望做一个 skill 呢,能够按照我的品牌调性和视觉规范,帮我们去想各种物料的创意,做一个创意生成器。 那按照 cloud 的 规定,我们创建一个 skill, 得在规定的点儿 cloud skills 文件夹里面去创一个 skill 文件,那我们用最原始的方式,直接手动的来创建这些文件夹哈,点儿 cloud skills, 然后我们再创建一个文件夹,这个文件夹的名字呢,就是我们 skill 的 名字,我们叫它秋之创意吧。那这个 skills 的 文件夹里面呢,必须规定有一个 skill 点 md 的 文件,这个大写的文件,那文件里面放啥呢?我已经写好了, 粘贴进来,那就是这么些文字。好了,这就是一个 skill 了,大家先压住脑子里面的问号,我们再来细看一下,那这个文件里呢,上面这两个横线里面的它叫做元信息 matlab, 写着两个东西啊,一个呢是 skill 的 名字,一个呢是 skill 的 描述,这两个东西专门用来告诉 ai 这个 skill 叫什么名字,是干嘛用的,什么时候可以用它,那我这就写着是做创意物料用的啊,当用户说要做个海报什么的物料,他就自己触发它了。 而下面这些信息呢,叫做指令 instruction, 其实就是具体告诉 ai 怎么样做的一些提示词喽。 ok, 那 我这写了我们的餐厅叫做秋之餐厅,品牌的风格有这么些要求,输出的格式让他是这样等等等等,非常的简单哈,那我们保存好一个 skill, 真的 就创建完了?来,我们启动 cloud code 来问问他,你有哪些 skill? ok, 你 看,他现在就已经识别到了我们的秋之创意 skill 了。 ok, 我 们直接问他,我要做一个秋之餐厅的春节促销海报,让他给个创意 好,他这里就开始提示我们,他正在加载这个 skill 了,我们同意 ok, 他 就输出了创意,并且是按照我们的要求和格式来的。 那有朋友就受不了了,哎呀,这一通操作不还是提示词吗?跟我自己写一段这个提示词存着给 cloud code 看有什么区别呢?最大的区别之一在于它是按需加载的, 什么意思呢?其实啊,当我们正常的这样跟 cloud 去聊天的时候,大模型它只会看到我们这个 skill 里面这两行短短的圆信息。 只有当我们说我们要做一个秋之物料的时候,他才意识到,哦,该看具体的指令了,他才会去加载这下面这部分的完整指令,否则这些他都不会看到。 这样的好处就是方便我们可以同时拥有很多个 skill。 每次 a 正的都会看一遍所有 skill 的 简短的原信息,但是只有当 a 正的意识到他要去具体调用一个技能了,他才会去看下面的一大堆指令,而且 ai 的 回答也会更精准, 因为他没有了其他提示词的干扰,那 ai 加载的少了, open 自然也就省了一堆。那这是他按需加载的第一层。 当然了,刚刚这个 skill 实在是太基础了啊,就算一口气把它下面的指令都加载完,好像 token 也不多哈。 但是如果我们的要求变得复杂了呢,比如说我们秋之餐厅的物料其实分很多种, 常规的呢,有海报、菜单,也有比较特别的一些实体物料要设计,比如说餐盒、杯子,员工服装,还有一些社交媒体的物料,比如说公众号封面,微博配图等等等等,他们的尺寸都不一样,配色要求也不一样, 还得符合各平台的一个规范。每一个物料呢,我们都假设它有详细的长长的说明,那这时候我们如果把所有物料的要求都写进 skill 点 m d 里面,那这个文件就会变得巨长。 但是很多时候呢,我只是想做一个,比方说实体餐盒的设计大模型,根本就不需要知道公众号封面的规格,但是 ai 还是得把整个文件都读一遍,那这就造成了 token 的 浪费,也可能会造成一些信息干扰。那怎么办呢? isopec 就 又规定了一个文件夹叫做 references, 我 们呢可以把实体的物料和社交媒体的物料这个两个规格单独拆出来,单独的给它放到这个 reference 文件夹里面去。 那这个实体物料规格点 md, 我 们就写一些线下的工服呀,餐盒之类的要求, 那这个社交媒体物料规格呢,我们就去写公众号封面呀,微博配图这些的尺寸和要求,甚至我们都可以拆得更细。 然后呢,我们只需要在 skill 点 m d 这个总指令里面只留下那几个常见的物料要求,并且我们还需要写上一个指引 啊,告诉他如果用户要做线下物料的话,那就要去读这个实体物料规格点 m d。 如果要做社交媒体类的图,那就要去读社交媒体规格点 m d, 那 现在同样的一句话, 他给出的方案就更精准了。这样当我们只做常规物料的时候,这两个 reference 的 文件大模型压根就不会看。然而当我们说做实体参合的时候,他也会通过 skill 点 md 的 指引,只去看 reference 里面的这个实体规格文件, 那这就是它的进一步按需加载了。那我们可以想象,我们可以有好多种不同情况的 reference, 反正它只会在需要的时候自己去看指定的文件。 但是现在我们的秋之创意 skill 呢,只能输出创意,还得我们自己去做图,所以呢,我就还想让它可以按照我们的品牌规格,直接帮我们把图做出来, 也没有问题。那这就要用到 skill 的 另一种文件夹了,叫做 scripts, 那 这个 scripts 里面呢,一般放的是一些可执行的脚本, 那我这里呢,实际上也就放了一个非常短非常简单的脚本,其实就是在调用 nano banana 的 api 来生图的一个脚本。那有了这个脚本之后呢,我们还得去 skill md 里面在指令里说一声,告诉他,如果用户要求直接生成图片, 那他就得把之前我们想的这个创意转化成生图的提示词,然后按照这个命令去调用这个生图脚本,这样他就能一句话自动去生成精准的图片了。 不然我们还得自己去拷贝提示词,打开软件再粘贴,再生成,再下载保存,现在我们一句话就搞定了。 另外我还有个需求,我希望深层物料的图片能保持秋之餐厅的 logo 不 变, 所以我们还得给他几张 logo 图作为深图的这个参考。那我们就可以再建一个 最新规定的一个 s s 文件夹,我们把两张的 logo 图片放到这个文件夹里,当然我们还要回到 skill 的 md 里面,告诉他参考图在这个 s s 文件夹里面,如果要深图的话,需要把这个图片当做参数给脚本传进去来执行。 好朋友们,现在这个 skill 就是 一个完整的官方完全形态了,其实有点像我们在用自然语言写程序,对吧?那我们先来试试效果,来帮我做一张周六饮料免费的一个实体海报, 你看它发生了什么?它先是加载了这个 skill, 然后它内部可能发现啊,要做的是这种实体物料,它就要去看另一个解说,于是它去检查了这个实体物料的规范。那并且它意识到我们需要的是直接生成图片, 所以呢,它又生成了提示词,把这个提示词和 logo 图片一起给到,并且运行了这个脚本。那最后它输出的图片告诉我们,在这里我们看看结果, 你瞧瞧它这个尺寸,配色 logo 是 完全符合我们这个品牌规范的啊。那为了防止这个是一次性的结果,我还多试了几次,它这个深层的效果都很不错。 然而如果我们的要求还跟之前一样,我们只要创意并不要直接深图的话,那他的这个脚本他也不会被执行。 而且呢,刚才我们说到这个 scripts 脚本,这里面其实还有一个重点,这个脚本里的代码它是写好了的, agent 根本就不需要去看里面写了什么,它只要知道我们在 skill 点 m d 里面写的那些指引,告诉它传什么参数,会输出什么,它只管运行脚本就行了。 所以不管我们在 scripts 里面写了多少行代码,大模型它都不会去读取,一点 token 都不占。 当然了,如果我们在 skill 点 md 里面的那个指引写得不够清楚,大模型不知道怎么用这个脚本,那他有可能也会不得不自己去看一下这个脚本,但他的机智和园艺是不需要去读这些脚本的。 好,那我们来回顾一下,其实创建 skill 就是 在指定的文件夹下去创建一些文件,那最简单的 skill 呢?只要一个 skill 点 m d 就 够了,里面有这个原信息和指令,而完整形态的 skill 可以 加上 references, script s s 这些可选的文件,那这些东西是怎么配合工作的呢?这就是 skill 最重要的设计。按需加载的三层结构,第一层,源信息。 这一层呢,是始终加载的, ai 的 每一次对话都会看一眼所有的 skill 的 源信息,它去看到自己有哪些技能,就像一个目录。那第二层,指令层, 这层是只有当 ai 判断并且决定我要用这个 skill 的 时候,它才会去加载完整的 skill 点 m d 文件。第三层,资源层, 这层包括了 reference 里面的参考资料, scripts 里的脚本, assets 里的资源。只有当 ai 进一步判断任务需要更详细的信息,或者它需要执行某个脚本的时候,它才会去按需加载,并且脚本它是只执行不读取的,完全不占用托克。 好了,这下我们完全理解 skill 的 按需加载,也就是官方定义的渐进式批漏机制和三层结构了。可是对于普通人来讲,这又是写 markdown 又是脚本的,好像创建一个 skill 还是挺复杂的。 no no, no, 现在谁会用手写呢?我是用这个创建 skill 的 skill 啊,秋之 skill creator 创建的。 那这个呢,是我基于很火的 skill 创建器改良的一个更加互动式,更加小白的一个 skill 创建器。那大家把它下载下了以后,放到这个点儿 cloud skills 文件夹里面就好了。那下好之后,我们想要创建什么 skill, 直接打开 cloud 直接跟它说就行, 或者我们也可以斜杠来调用他,那他呢,会开始一步步的引导和追问我们,来帮我们梳理这个需求。而且我特意设计的是这种用选择题的方式来追问我们整个过程,我们就只需要用大白话回复他的问题,以及按一按上下键做一做选择题就好了。 他这个追问的过程啊,到时候大家问题可能和我现在这个不一样,因为他会根据你的需求去做灵活的调整啊,他都是现编的。 然后呢,这个过程中因为我们要做图片,所以我们还需要给他提供 logo 图的参考,以及那个 nano 不 nana 的 a p i 和文档。那我也给他直接拖到了这个项目文件里,然后告诉他了一下这个文件的路径, 他就会自己去参考和把它们放到 excel 文件夹里面。那这两个素材我也都已经放在了我们的课后网页上了,大家可以去用做练习来试试复现它。 那问完这些问题之后呢,他还会给我们核对一下方案,如果我们看着方案没问题,那他就会自动帮我们生成所有的 skill 文件了。 那做好 skill 之后呢,他还会帮你想几个例子来跑一下测试。我们这里其实测了好几个,风格都很一致,很好看。大家在这个调整的过程中,也可以去点开他写的这些 skill 文档来手动的修改一些,反正都是提示词嘛。 所以总之只要你有明确的输出要求,或者有明确的方法规范流程知识,创建器就会指引你帮你来写出一个定制的 skill。 而且除了自己创建,网上也有很多现成的 skill 资料里,我也整理了一些集合网站和 skill 仓库,成千上万的 skill, 大家可以去逛逛。并且我也给大家打包了几个普通人常用的必备 skill, 比如做 ppt, 处理文档, excel, pdf 这些基础的,我们直接把它拖进 skill 文件夹就可以,一句话让它帮你把乱糟糟的表格梳理得整整齐齐。 还有这个官方的前端设计 skill, 这是直接让 cloud code 生成的前端网页,而这个是挂载了这个前端 skill, 做出来的网页,效果明显大幅提升。还有这个动画生成的 skill, 用这么一段提示词就可以做出这样一段演示动画。 当然大家也不用去装一堆自己根本用不上的技能,一个游戏英雄也只需要四个技能 q w e r 就 能杀遍全场。所以最有效的还是把你最最高频做的几件事,打磨成一个你独家的稳定产出的 skill。 尤其是你对结果有明确的要求,你有经验和方法,你验证过的事情。 比如说打工人,你的周报每周都要写,那就做一个让 ai 来主动采访你,然后出周报的一个 skill。 比如说老师每节课都要背课,那就做一个你只要给出课题,就能给你一整套课件习题和 ppt 的 skill。 又比如说,你总是要给你的文章配图,那就做一个给他一篇文章,他就按你的风格做配图的 skill。 又比如说,你总是在审核,那就做一个按照你的规矩自动批阅合同来写备注的 skill。 因为大多数的人都不需要成为一个技能开发者, 我们只要先把自己掌握的小技能交给 ai, 让他替你重复劳动。好了,资料链接都在评论区了,大家动手试试吧!这个时候呢,点赞、收藏、关注的技能就该出发了,我们下次见了!
粉丝103.1万获赞532.0万

你是小阿八,正在用 ai 开发网站,为了让 ai 生成的效果更好,你告诉 ai 界面不要使用蓝紫渐变色,不要生成一大堆没用的文档,你要遵循公司的代码规范。阿八阿八,洋洋洒洒几百字 之后,每次开发网站时,你都要写这么一段又臭又长的提示词,太麻烦了。于是聪明的你开始想办法, 先把常用的提示词保存到单独的文件,每次手动投喂给 ai。 然后创建了资源文件夹,把公司的代码、规范、设计素材都塞进去,告诉 ai 参考这些去写。 接着你还写了一些脚本,让 ai 生成代码后自动执行格式化运行测试,提交代码到 get 仓库。最后再写着 agent 点 m d 文件,把所有规范和工作流程都写进去,让 ai 自动读取,你沾沾自喜, 嘿嘿,俺这套工作流堪称完美。但很快你发现了问题,随着规范越写越多,文档越来越臃肿,每次对话都要占用很多 ai 上下文空间,浪费 tokens。 于是你找到号称没有人比他更不懂 ai 的 鱼皮,求助阿爸阿爸,俺还能咋办啊?不是有 agent skills 吗?为啥不直接用呢? 呃,啥玩意儿?这可是最近 a h r 爆火的技术,下面我来带你玩转 agent skills, 让你知道它是什么,怎么用,有什么魔力,怎么自己开发。点着收藏,我们开始。 agent skills 是 astropic 推出的一套开放标准,目的是让 ai 能够学习使用各种专业技能,而不用每次都重复输入提示词。简单来说,它就是给 ai 装备的技能包,技能包里有精心设计的提示词、代码、脚本,还有各种资源文件, 把 ai 想象成一个职场小白,给他装上文档处理技能,他就立刻知道怎么生成 ppt 处理 excel 表格。装上代码规范技能,他就知道怎么按照公司的标准写代码。 你挠挠头,呃,等等,这不就是俺在做的事吗?把教 ai 做事的文档和 ai 要用到的文件打包成文件夹差不多,但 osropet 把它做成了一个通用标准,而且在实现原理上有一些新花样。 可恶啊,俺差点就改变世界了,这能有什么新花样?下面我先来带你用一下 agent skills, 再跟你说说其中的奥秘。 目前对 agent skills 支持最完善的工具是 asteroid 官方的 cloud code, 我 们就以此为例,安装并使用 skills, 先打开 cloud code, 并输入命令,添加官方技能市场。这就像是在你的 ai 助手里开通了一个技能商店,接下来你就可以从商店中获取技能了。 然后在 toloud code 中输入命令,安装官方提供的技能包。这着 example skills 包含了一堆官方势力技能,包括前端设计、网页测试、动图制作等等。 装完之后,你就可以直接让 ai 使用这些技能了。比如你要做一个网站,以前没装技能的时候, ai 生成的代码又是那个熟悉的蓝紫渐变色,千篇一律的 ai 审美。 现在安装了 front design 这个教 ai 生成专业设计版网站的技能后,你输入提示词,帮我开发个人作品及网站。 ai 会主动问你,我发现你安装了前端设计技能,需要用它来生成证据设计版的页面吗? 确认之后, ai 会利用技能生成代码,告别篮子渐变,生成独特风格的精美页面。我们不用每次都给 ai 输入一大堆相同的提示词,装一次技能就行了。 除了代码相关的技能,官方还提供了文档处理技能包,同样在 cmd code 中输入一行命令安装。 这只技能包里有 ppt 制作、 word 文档生成、 excel 数据分析、 pdf 解析等技能。接下来,如果你让 ai 做着 ppt, 它会自动调用 ppt 制作技能,直接生成排版好的 ppt 文件,帮你节省几个小时。 你好奇道,咦,为什么 stills 能做到安装即用?技能包里面到底有啥? ai 又是怎么知道该用哪个技能的? 好问题技能其实就是一个包含 still 点 m d 技能说明文件的文件夹,还可以包含可执行脚本资源和参考文档。 由于每个技能的复杂度不同,结构也会存在区别,我们可以在本地目录中找到已安装的技能文件夹。以官方的 ppt 制作技能为例,它的结构是这样的,包含一个核心的技能说明文档, still 点 m d, 还有脚本参考文档和各种资源文件。 而 front and design 前端设计技能只有一个, still 点 m d 文件。 still 点 m d 文件是每个技能的核心,它包含两个关键部分,第一部分是原数据,用 yam 格式写在文档开头, 其中 name 是 技能的名字, description 是 技能的描述,告诉 ai 什么时候应该使用这个技能。 描述写得越清晰, ai 就 越容易在合适的时机调用它。第二部分是指令内容,就是一套经过精心设计的提示词,指导 ai 具体怎么做。以前端设计技能为例,它的指令内容包括设计思考、前端美学指南和必称指南。 你挠了挠头,如果有多着 stux, ai 怎么知道该用哪个技能呢?如果把每个技能说明文的都塞给 ai, 不是 很占用上下文吗? 这就要说到渐进式批漏这个核心机制了。当你让 ai 执行任务时,它会先扫描技能目录,但不会把所有内容都加载到上下文中,而是只读取每个技能的原数据, 发现描述和任务相关,就知道该用这个技能了。然后才把完整的技能说明文档读进来,按照里面的指令执行,并根据需要加载技能包中的其他资源,用到哪个查哪个,既精准匹配又节省上下文,这就是渐进式纰漏的精髓。 所以 agent skills 的 本质就是把专业知识打包成一个文件夹,让 ai 按需读取并使用。呃,那除了 cloud code 之外,其他 ai 工具支持 agent skills 吗?俺平时用 curser 比较多, 当然能, agent skills 已经成为通用标准, curser、 west code code、 dex 等工具都支持。 skills 的 社区也非常活跃,你可以在 cloud skills、 hub 市场开源的 awesome、 cloud skills 等地方找到很多现成的技能, 比如有着叫 uiu 叉 pro max 的 技能特别火,专门用于提升 ai 的 设计能力。用法很简单,首先按照开源仓库文档的指引,安装官方提供的命令行工具, 然后进入到你的项目目录下,根据使用的 ai 工具执行对应的命令。比如我这里用 cursor, 它会自动把技能安装到 cursor 的 配置目录里,安装完成后,可以看到它的文件结构。接下来当你让 ai 开发一个网站时,可以使用斜杠命令手动触发技能,或者让 ai 自动识别技能。 ai 会根据你的需求识别出产品类型和需要的页面类型,然后调用设置点 p y 搜索脚本,在 data 目录里进行多维度搜索,找到适合的配色、字体、布局风格。接下来综合搜索结果,生成完整的设计方案。最后 ai 再按照设计方案生成代码, 这样一来,生成的界面既专业又有设计感。 ai 不 需要把所有规则都背下来,而是用到哪个查哪个,这就是 agent skills 的 精髓。 用了很多别人的技能后,你产生了一个大胆的想法,哎,能不能把公司的周报折式封装成一个技能,以后推荐给新来的同事,还能卖几个钱,嘿嘿嘿。嗯,有点东西,那你打算怎么做呢?当然是发挥程序员最擅长的事情。复制粘贴。 俺先复制一个官方的技能包,修改目录名称为自己的,然后修改技能说明文的 still, 点 m d 的 原数据指令内容这些关键部分。最后把公司的 logo、 ppt 模板爆照样例放在子文件夹里就行了。妈妈再也不用担心我的周报了。 不错不错,但其实有更简单规范的方法。在前面安装的 example stills 官方势力技能包里有一个叫 still creator 的 技能,专门用来帮你创建新技能。你只需要跟 ai 说,帮我创建一个专门生成公司周报的技能。接下来 ai 会问你几个问题, 你希望周报包含哪些主要部分,以什么格式输出?你通常会如何使用这个周报技能?希望周报的语言风格是什么?很快,一个完整的技能包就生成了,你会看到一个点 scale 为后缀的文件,本质上是一个压缩包,你可以把它解压到你的个人技能目录下,你的所有项目都能用。 如果你想让技能只在某个项目生效,可以把它放到项目的 cloud, 同步给项目组其他成员 测试。没问题后,你还可以把它开源到 github, 或者上传到 chaleo 的 stokes hub 这样的社区平台,让所有用户都能用,你开心极了。原来开发一个 stokes 这么简单,但是这玩意儿跟之前火爆的 mcp 和邪道命令有啥区别? 好问题, m c p 就 像给 ai 装上了手和眼睛,让 ai 能够连接外部工具和数据源,比如搜索网页、读取代码、仓库、查询数据库,适合需要获取数据或操作外部系统的场景。 而 agent skills 正像是给 ai 发了一本工作手册,把专业知识和工作流程打包起来,教 ai 在 特定领域该怎么做。 至于斜杠命令,它就像是快捷键,是需要你手动输入常按的命令来触发的固定操作。而 steils 的 特点是, ai 可以 自动识别该用什么技能,不需要你显示调用。对了,其实 mcp 和 steils 是 可以结合起来的。 举个例子,如果你想让 ai 帮你发周报, m c p 负责获取数据,从任务管理数据库拉取这周的任务列表。 skills 负责加工数据,把获取到的原始数据整理成老板爱看的格式,一个提供食材,一个提供配方, 你看这技能文件夹的结构,突然怪叫一声,阿爸,哈!等等,俺突然意识到一个问题,这不就是我们程序员玩烂的封装附用、模块化懒加载那一套吗?写几个代码文件,打着包发到网上,让其他程序员下载下来用 不是一回事吗?为什么 agent stux 能突然让整个 ai 圈为之疯狂?好问题,从技术的角度来看,它并没有发明什么惊天动地的算法。在我看来,它能火主要是两个原因。第一,它是开放标准,封装一次技能包后就能在各种 ai 工具里附用,还能通过社区共享。 更重要的是, stux 能立刻让 ai 的 工作更专业可靠,让普通人无感地享受到技术带来的价值。以前想让 ai 变聪明,你得学提示词、工程配置各种工具链。现在只需要像装 app 一 样安装技能包, ai 就 立刻变专业了。 一项技术的成功不在于它有多复杂,而在于它能让普通用户在不关注技术细节的情况下感受到技术的价值。 你点点头,学会了,学废了。降低门槛才是技术走向大众的钥匙。没错, agent skills 不 仅仅是个技术概念,更是一种新的工作方式。 你可以把它融入到自己的日常工作中,比如把重复的任务封装成技能,把团队的最佳实践固化成技能,让 ai 真正成为你的得力助手。 在这个 webtopod 盛行的年代,技术的门槛正在崩塌,而想象力的边界正在无限扩张。你可以在我免费开源的 ai 编程零基础入门教程中学到更多 ai 编程技巧,也欢迎关注鱼皮,学习更多 ai 和编程的技巧。那么问题来了,你最想让 ai 学会什么技能呢?

扣子新出的 skills 技能,百分之九十的人都理解错了,很多人以为它可以替代工作流,结果调试来调试去,踩了不少的坑。那么 skills 到底是什么?它和工作流、智能体有着什么样的本质区别? skills 可以 帮你做哪些事情?最重要的是它不能帮你做哪些事情,什么时候我们必须用到工作流,什么时候我们可以用 skills, 那看完这期视频可以帮你省下至少一个月的弯路。首先我们来讲 skills 究竟是什么? skill? 其实这个英文单词把它翻译成中文就是技能,那么 skills 也就代表着很多个技能的一个组合体,也就是技能包,对不对? 所以我们在使用 skills 的 时候呀,你可以把 ai 看作是一个人,那这个人呢?他身上有很多个小口袋,每一个小口袋里面都是一个技能,当你输入一句话的时候,他识别到你的需求,他就从某一个特定的小口袋里面拿出一个小小的技能来帮你完成这个需求 么?这个拥有着不同技能调用的一个 ai 呢?我们就可以称为是一个 skills, 所以 skills 它本质上也是一个 ai, 只是说这个 ai 它有着很多很多的技能包,它可以在不同的时候调用不同的技能, 所以呢,它跟我们之前搭建的智能体和工作流是不一样的哈。我相信很多人都有玩过游戏,那在游戏世界里面,主角是不是有很多个技能点,他在面对不同的敌人的时候呢? 它也会使用到不同的技能,所以你可以简单地把这个 skills 想象成是这样的一个又一个的技能,那我在处理不同的事情的时候呢,我就用到不同的技能就可以了。 那说到这里,大家应该知道 skills, 智能体还有工作流,它们是三个完全不同的东西,对不对?我们之前说过智能体它是什么?它本质上是一个会聊天的 ai 助手,它根据我们已经给他的一个系统提示词 和我们输入进去的那句话来跟我们进行对话的交互。那工作流是什么呢?它本质上是把一段又一段的代码给封装起来了,变成一个小节点。 那我们可以通过编排这些节点,自己就不用去写代码,而是通过在节点里面编排这些数据,来实现一些复杂的可式化的流程。所以工作流呢,它非常适合一些复杂任务的编排, 适合一些高需求高定制的任务啊。那么 skills 是 什么呢?是我们刚刚说的这个 ai, 它有很多个技能的小口袋,它可以根据我们提的需求去掏不同小口袋里面的工具来帮我们完成任务。 skills 有 一个很好的地方,就是它不需要门槛,它不像智能体和工作流一样,需要一定的门槛才能去搭建。它的好处是只要你会自然语言描述, ai 就 可以给你生成一个技能包, 因为你只需要告诉他啊,我要写 ppt, 我 要把这个 word 变成一个这种格式,他就给你生成这样一个技能包。那下次你来找他用的时候,他就把这个技能包呢给掏出来,然后用里面的工具呢来给你完成这个任务。 所以当你是一个职场的新手小白,你每天可能有一些很简单的,比如说文稿上的 ppt 之类的,这些任务你想要处理,但是你又不会搭建的话,那么你就可以使用扣子上面的 skills, 让他去给你生成一个技能包去使用。 所以对于 skills 来说,它的典型用途是你每天要做的一些标准流程的简单的复用,它的优势是很容易上手,但是它的缺点是它根本替代不了主流的工作流搭建。 就像如果你现在肚子饿了,你可以去吃一包方便面,但是如果你家里来了客人,你想要招待他,那你就不可能给他吃方便面,对不对?所以这就是两个最直观的区别。你这个 skills 你 完全可以自己用,或者说你上架到商店给一些个人用, 但是你想把它面向企业做一些复杂的定制,它是完全做不到的哈。它跟传统工作流呢,还有一个很大的区别,就是传统的工作流画布,我们每一步都是自己编排的,是不是?这就代表着我们每一步都可以自己修改,自己去完善? 是 skills 目前是扣子的 ai 帮我们自动生成的,也就代表着我自己没办法去这个项目文件里面改,因为你使用这个东西的人,他是新手小白,他不懂代码,如果你想要改,你就得懂代码才能改。所以这就会造成一个很矛盾的事情,就像我们之前讲的扣子编程那期一样, 用这个东西的人他是新手,但是新手他又不会改,他只能跟 ai 对 话让 ai 改,同时 ai 改的时候呢,又可能把之前的东西给改坏,所以说这个 skills 它并不灵活, 它只能给你做一些很简单的需求。而且大家要知道, skills 这个概念其实已经出来很久了,最早是在二零二四年的这个年底的时候,当时 cloud 就 已经推出了 agent skills, 只是当时我们只能在本地的电脑上运行一些 skills, 后面呢, cloud 就 把它做成了一个开放的标准, 然后后面国外的一些大厂也就逐渐的开始使用 skills 了。只是之前国内没有厂商去做 skills 这个东西,扣子是目前在国内第一个做这个东西的厂商,所以 skills 其实出来已经有一两年了, 那为什么它还没有替代工作流呢?答案就是因为 skills 它只能做百分之十左右的一些简单的场景, 那么百分之九十的场景其实他都搞不定的。你想想一个客户去定制项目,你需要多分支决策,需要动态的一些循环,还需要人工经常去调整一些提示词,那这些场景 skills 能做吗?他都做不了, 所以主流的搭建方式仍然是工作流搭建。好。在我们知道 skills 是 什么之后,我们是不是得知道他擅长做哪些事情,不擅长做哪些事情呢?首先第一类呢,就是这种内容创作,比如说你是一个设计师,你每次都要生成符合你们品牌风格的一个 ppt 模板, 那么你就可以用 skills 把你们公司的设计规范给固化进去,也就是一个流程给固化进去。在你生成这个 skills 之后呢,你每次只需要调用这个 skills, 然后把你的内容输进去, ai 就 可以根据你的这个品牌风格去自动生成 ppt 模板。 那像这样的写周报,写月报,或者说你丢一个抖音视频进去,然后把它转成公众号文章都是可以的。像这样的话,我们一般都是要调用插件的哈,那你也可以让 skills 去调用插件,这个都是可以的。 还有一些呢,就是你自己的个人画写作,有些人他可能有自己的很独特的风格画写作,但是每一次你都是自己人工去写的, 你可以做一个 skills, 让这个 skills 去学习你的文风,并且呢每次之后生成的内容呢,都保持你这个风格,那么你下次可能只需要丢一个标题给他,他就可以给你生成符合你个人风格化的这么一个作品了。 还有像这样的格式转化类的内容呢,都是 skills 比较擅长的,比如说 pdf 转成 word 或者说 excel 数据呢,把它转成一个格式化的图标,格式化的一个网页,或者说把你给的一篇文章给转成一个演讲稿,这些都是可以的。 但是我们说到的这些搭建,其实工作流也都是可以做的,并且用工作流搭建起来呢,也是很简单的好。那么第三个大类呢,就是一个专业分析类,比如说你给他发一个图片,一个简历之类的,让他去给你诊断优化。那其实这个类型呢,就比较像我们的一个智能体类型了, 因为它偏向于一个文本分析和一个数据的分析审查哈,所以看到这些项目大家就能知道 skills 它能够做的就是任务边界非常清晰的内容,知道我这次要输入什么,并且知道我这一次要输出什么, 并且这些任务呢,它是会反复做的,没有什么分支的,也就是我不需要处理什么循环啊,不需要处理什么批处理啊,还有文声图图声视频这些东西它都不需要处理, 它就处理一些简单的文字化的职场上的东西。这也就是为什么最近扣子更新啊,它说职场 ai 工作 ai 就 用扣子之类的这种啊, slogan 对 不对?这种标语 说明扣子他针对自己这一次的一个更新呢,他定位到职场人了,也就是现在很多年轻人他刚进职场,但是呢,他也没有去学这个搭建,但是他又想用 ai, 他 就把自己目前的一个市场定位呢,定位到这一批人身上了,也就是他可以帮你完成你 平时职场上工作上需要重复处理的一些文案、文本上的事情。 skills 还是很擅长的哈, 那么他不擅长做的事情是什么呢?比如说一些复杂的数据处理,就像我们课内教的批量采集一个抖音博主的这种视频链接,然后把它数据全部采到分数表格,然后又进行改写, 然后又进行数据写入,这样的内容呢,他是不适合的哈,因为他没有一个复杂的判断逻辑,他也没有办法进行一个批处理和循环,所以呢,他不适合做一些复杂的数据处理, 同时呢也不适合去做一些多分制的决策,也就是你这个路走完之后,我要走其他路,或者说我 a 路线、 b 路线、 c 路线的内容我要结合起来, 最后整合成一个东西,比如说我们做这种视频自动化的东西,他就做不了哈,所以他可以帮你完成一些简单的职场上的一些工作哈,可以帮你省下一些事情, 但是它替代不了复杂的工作流搭建逻辑。并且呢,现在扣子它针对 skills, 它还有一个付费的功能,这个东西我们稍后呢会实操的去讲哈, 所以大家要认识到 skills 它是面向小白的,如果说你是想要做一个工具的创造者,你想要创造一些高价值的 ai 的 工作流,并且把这些东西呢交付给企业去用的话,那你还是必须选工作流搭建,所以这个 skills 呢,终究还是一个开箱即用的面向小白的产品。 ok, 那 么说了这么多呢,我们现在来实操搭建一个 skills, 并且教大家怎么使用别人的 skills, 怎么把自己的 skills 给上架,并且让别人付费去用。 那么我们在浏览器里面搜索扣子啊,来到扣子的整个网页,可以看到现在扣子呢,它也更新了自己的一个 ui, 并且啊扣子他现在在扩充自己的一个产品啊,就包括我们原来的扣子开发平台,现在呢变成了这个扣子编程,还有呢,现在的扣子也把他的这个目光呢放到了很多职场上,办公上的场景, 可以看到扣子现在出的这么一个这种图啊,可以看到他是各种人群他都想通吃的,看到没有,也就是不管你是上班的也好,还是你想要做自媒体的也好,还是你想要做一些其他乱七八糟的东西也好,他都想把你这个人群的给通吃掉,不管你是有复杂的任务想做, 还是你只要办公看到没有办公三件套,还是你想使用 skills 这样成熟的技能的时候,你都可以使用到扣子的一个产品,所以说相当于现在他们在扩充自己的一个产品的一个版图,所以大家一定要清楚的认识这一点啊, 现在这个 skills 它并不是替代原有的工作流,而是扣子在它原来的版图上新增了这么一个小板块,那这个小板块它的目标人群是职场,是小白,是新手哈, 可以看到它这有个清晰的描述啊,就是职场前辈一键召唤。看到扣子对自己这个技能它的一个定位是什么?在技能商店中探索和使用同行前辈们训练好的 ai 技能,也就是像我之前说的, 你可以把这个技能想象成这个 ai, 他 是一个人,他身上有很多小口袋,每一个小口袋里面都是一个成熟的技能,你想要他用哪个技能帮你完成这个任务,你就把这个技能这个小口袋给掏出来,让他使用这个小口袋里面的工具给你做事啊。 ok, 那 我们来到扣子之后呢,点这个免费使用,进来之后就是扣子的一个这样的新版界面哈,这里呢顺便再来说一下这个界面, 我们可以看到左侧呢,已经完全跟之前不一样了啊,我们点击顶部的这个扣子编程,就会跳转到原来我们的一个扣子开发平台的地方,我们点一下 ok, 就 可以看到这里就是原来的这个扣子开发平台了,也就是现在的扣子编程啊,如果你想回到旧版的话,只要点 顶部这个回到旧版就可以了。那么原来的资源库,也就是新建工作流的地方呢?还是在这个地方啊?如果说你想要新建一个智能体的话,还是在这个项目管理,但是你来到这个地方呢,我们就点击上面的新增项目,他就又跳到这个页面来了,对不对?那我们怎么创建智能体啊? 现在原来那个手动创建智能体的地方已经没有了,现在大家只能在这个地方,也就是 d 代码模式这里有一个智能体开发,你点了之后他就会跳到原来这个旧版。所以说啊,如果你对新版的界面不熟悉的话啊,大家可以在进来之后直接点到这个顶部的这个回到旧版就可以了。 ok, 那 我们怎么去创建一个技能呢?我们来到这个扣子编程的页面,可以看到它有智能体、工作流、网页应用、 移动应用,还有一个技能,是不是那我们就可以在这个地方输入我们的需求?假设我现在是一个职场人,我每个星期都要做 ppt, 但是呢我不想自己做 ppt, 那 我就可以在这个地方 写我一个需求,让 ai 来帮我做出一个技能,我之后每次调用这个技能,它就可以帮我生成一个 ppt。 这里呢我来粘贴一个我之前写好的一个技能要求啊, 这跟大家讲一下,我要求这个技能呢,他可以接受用户的两种输入,第一种是输入主题,如果输入主题的时候,他就先联网搜索这个主题相关的知识,如果用户输入的是一个链接,那就先读取这个链接的内容,并且呢深度理解这个文章的逻辑之后 再结合这个美学设计去生成一个十六比九的 html 的 换灯片。所以呢,我还把这个核心的能力告诉他,也就是说我希望他有这么几个核心的能力, 就是大家不写这个底下的核心能力也没关系的,因为 ai 它会自己给你去思考啊,所以你只需要写前面这一段也可以,那我们写完之后只要点击发送就行了, 可以看到发送之后我们又来到了一个这样的沙箱环境啊。在我们扣子编程那节课,我有跟大家讲过这样的一个环境,他是一个虚拟环境,他不会受到外界的一个干扰, 也就是你在这个里面的一个代码的一个 bug, 他 不会影响到扣子本身的一个代码环境的。在我们之前的课也讲过什么叫沙箱,就像你小时候去游乐场,有一些那种围起来的地方,他不是会让你进去玩沙子吗? 在里面怎么去砌城堡,然后再把它推掉推坏都是没关系的,你在沙箱环境里面可以随便你怎么玩。所以呢,像我们生成的这种 skills, 大家也不用特别的在意它有没有调坏怎么的, 如果它实在调坏了,大不了我们再来建一个,是不是这种沙箱环境都随便玩的哈。 ok, 我 们这里输入了一个需求之后呢,可以看到它一直在给我们生成,这里呢,我们点到右上角这个文件,这里切换文件目录,那么左边就会跳出来这么一个文件框, 我们把它展开,可以看到这里有四个这样的文件。首先这三个是文件夹啊,底下是一个 skill 点 md, 这个 md 是 一个 markdown, 是 一个文档。这里需要跟大家讲一下这几个文档究竟是干什么用的,让大家更加透彻的理解 skill 它到底是怎么工作的哈?假设我现在在一个公司认知 并且呢我每天都有一些固定的活想要干,但是我现在想要离职了,我不想干了,那我是不是就得把我原来每天干什么活,我电脑的密码,我电脑里面的软件,我做什么事情应该用什么软件,还有我平时工作踩一些坑,然后一些应对的方法,我都得移交给新的同事,对不对? 假设你现在要把这些东西移交给你的新同事,同时你还不能跟他讲话,你, 你只能跟它写文档,那么我们是不是得写清晰的文档?所以说对于 skills 来说,这三个项目文件和底下这个文档就是我们刚刚说的提交工作的文档,那它们三个分别代表了什么呢?首先我们来看这个 skill 点 md, 它这个地方,如果我们点开的话, 会看到他是一个这样的文字版的文档,对不对?这个里面他会告诉这个 ai 你 是一个什么样身份的人,你有哪些技能,这个技能是干什么的,什么时候用,怎么用,就相当于我如果要提交一个工作, 我就得跟这个前同事说啊,我这个岗位是干嘛的,每天我应该做什么,每个星期要做什么?比如说我每个星期五我就要交周报啊,我这个周报的步骤是什么?第一步我要列这个工作的重点, 第二个我要写我这个星期的具体成果。第三个我还要提下周的计划。所以呢,在这个 skill 点 md 里面,它就是让 ai 知道我这个技能是干什么的,什么时候应该用,所以这个地方是它一个整体规划的地方啊。 ok, 那 我们往上面看,是一个 scripts 的 一个脚本,也就是可执行工具的地方。那这个里面放的呢?是一些可执行的代码脚本,我们可以把它展开,里面有三个 python 的 一个代码。那放到我们刚刚讲的例子里面来,也就是说我得告诉这个同事, 你是不是要做事?但你做这个事情的时候,你用这个 word, 你 做那个事情的时候,你就用这个 excel, 那 你做另外的事情的时候,你可能要用公司的一个这样的软件,所以说这个 scripts 里面它放的是一些可执行的脚本, 相当于我们要移交的一个什么一个软件,我们是放在这个里面的。那再往上面看呢?是一个 reference, 那 这个 reference 在 中文里面其实要参考手册啊,也就是说我要把这个事情移交给我的新同事的话, 我还得告诉他我们这个工作呢,有一些什么样的问题解决指南,有哪一些注意事项?参考文档全部都是在这个 reference 里面,可以看到它全部是一个这样子文字版说明,因为我们想让它生成 ppt 嘛,它就会在这个地方说啊,这个丙图是什么东西?应该是一个什么样的格式的? 那包括这个模板,这个 templates, 也就是这个幻灯片生成的时候,应该用哪些模板,都会放在我们这个 reference 里面,也就是这个是给我的一个新同事的一个参考的指南。好,那再往上面看,这是一个 assets, 那 这个 assets 呢?其实是资产, 也就是说我在我们这公司工作这么久,我是不是之前也有一些案例,也有些模板,有一些格式规范?那我也把这个我的资产啊,这些工作上的资产我移交给这个啊新同事, 并且跟他说,哎,这是我们过去三个月的周报,你可以参考一下我的这个格式。这是我们部门喜欢用的一个 ppt 模板。配色呢,我们喜欢用哪个配色我都写在这里了,你以后用的话就可以直接按照这个来。所以说这三个文件夹加上底下这一个 skill 点 m d, 就是 扣子给我们生成的这个 skills, 它来接替我们工作的时候所需要用到的四个东西,每一个东西呢,它都有一个自己的分工责任在这里哈。 所以当我们想要把自己平时日常生活中的一些呃,重复性的工作移交给 ai, 让它给我们生成一个 skills 的 时候,它就会给我们生成一个这样子的标准化的模板, 这个就是我们数字化的一个交接大礼包,是不是?那下次我想要调用它给我干活的时候,它就只需要翻阅这次生成的这个文档,它就能够知道要怎么才能帮我干好活。我希望输出的是一个什么样的格式, 为什么能够知道?因为在我们这些几个文件夹里全部都已经写好了对不对?他只需要去翻手册就行了,相当于他已经掌握了这个技能,所以这个就是技能 skills 的 一个本质上的含义啊。 ok, 这里呢,我等待了很久啊,也就是跟大家讲完这么多内容之后啊, 他还没有给我把这个项目文件给生成完。为什么呢?这也就是我在之前的一个扣子编程里面说到的一个问题,就是这个东西他是 ai 写的,他很有可能有 bug, 知道吧?你看到没有,他说他这里发现问题了,然后又查看这个二百八十行是什么, 所以说这个东西对于职场小白来说,你前期的调试可能会比较麻烦。那对于一个你已经会工作流大进的人来说,我是不建议大家花很长时间在这个上面的, 因为你让它去生成这么久,然后还要在那改来改去的,有这个时间你自己都已经搭建好了啊,但是呢,大家可以了解一下 skills 是 什么,有时间的时候玩一玩都没关系。那这里呢,我就懒得等它了,我用我之前已经生成好的一个同样功能的一个 skills 才给大家演示,因为这个等它还不知道要多久啊,它这个写代码有点慢。 ok, 那 我这里呢,拖了一个之前我已经写好的一个测试的 skills 过来给大家看一下。那它这边呢,还是跟之前一样啊,是这三个文件夹加上一个 skills 的 markdown 格式的东西。 它的这个技能呢,还是根据用户提供的一个主题或者网页生成一个 html 的 一个换灯片哈,那当 ai 给你生成完之后,我们还是跟之前一样点击右上角的这个部署,只要点这个部署,然后点击这里的开始部署就行了。 但是这里呢跟我们在原来教的扣子编程那节课是不一样的,我们在原来的扣子编程那节课部署完之后,我们还得调用,是不是它发布完之后是一个 api, 但是这个东西这个 skills 它发布之后就是一个直接能用的东西了,我们点这个立即体验啊。 ok, 点完之后可以发现它就带我们来了这么一个对话页面,并且呢这里它就已经用了我们刚刚 生成的这个 skills, 那 么这里呢我就可以给他来输入一句话,比如说如何正确快速的学习扣字,也就是我现在输入这句话,并且在输入这句话的同时呢,我调用我刚刚已经生成的这个技能,然后我一键发送出去, 我们来看一下,可以看到他接收到我这个语句之后呢,完成了这个技能加载,因为我在这个技能里面说,如果我输的是一个话题,他要先干嘛?先联网搜索,是不是?所以他在这个地方呢联网搜索了一些内容, 并且呢他完成这个技能文件提取之后,他就创建了一个这样的扣子学习的换灯片,这里我们可以稍微等一下, ok, 可以 看到他这里呢已经给我们生成了, 并且它这里会显示一个这样的弹窗,大家点这个允许就可以了啊,它生成完成之后呢,我们可以看到它是一个 html 的 一个文件,并且呢在这个右侧,我们可以在这个地方啊去拖动它,把它打开, 那么这个地方跟原来的扣子编程最大的区别是什么?是你在这里可以分享,也就是你可以把生成出来的这个东西呢,给生成一个长图,也可以复制链接。比如你这个 ppt 生成出来, 你是想要给你们老板看,那你可以把这个东西来复制下链接,然后发到你们群里,或者说给你们老板看,都是可以的。他已经生成一个这样子的完整的可以看的 ppt 了啊。如果说大家想要修改这个 ppt 的 一个范式的话呢,就可以在这个地方再跟他对话啊,也就是在这个下面这里再跟他对话就行了。 那如果你想要把这个 ppt 呢给下载下来,我们就点击右上角的这个下载,那它下载下来,它其实是一个 html 的 一个文件啊,我们点开可以看到它给我们生成了这么一个 ppt, 但是我发现它这个呃尺寸不太对,对不对?那我们是不是可以跟他说,也就是说你觉得哪个地方不对,你可以再跟他说啊, 你就说目前生成的 ppt 的 尺寸不对,我希望可以兼容各种浏览器,然后咱们把这个话呢给发送出去, 可以看到它发送出去之后呀,它又在调整这个 ppt 的 一个尺寸了哈, ok, 可以 看到它这里呢,又给我们生成了一份新的,但是我们把它打开之后呀,发现它还是原来这个尺寸啊,所以说像这样的 ai 自动编程的东西有很大的缺陷啊, 它生成出来的东西不稳定。第二个是呢,我们自己不好修改,如果说你像这样的问题,我们是自己在工作流里面划不上搭建的,我们可以很快的就修改,这也回到我们最开始的这个问题,也就是这样的 skills, 它不能够做复杂的事情,它也替代不了传统的工作流搭建。 我们如果想要做一些复杂的,可定制化的、高商用化的东西,必须使用工作流搭建哈,必须手动搭建,那这个地方的话就不纠结了哈,我就不花时间去改了, 我们不想用的话呢,就直接点击右上角这个叉掉就可以把它退出去。那我们再来说我们已经做好了这个技能,要怎么把它上架到商店,我们做好之后呢,我们自己的一个技能,在这个技能商店这里, 然后大家可以点到这个我的技能,然后我们点我创建的,那这里就会有我刚刚生成的这个内容,生成幻能片的这个技能,我们点这三个点,然后点这个上架到商店, 上架到商店之后我们就只要填这个详细的描述就行了,这里呢我们可以把这个复制下来,然后你选一个分类嘛,我们可以选一个办公与效率。那这个案例呢,就是你之前用这个东西生成出来的这个案例啊, 我们这里呢可以随便填一下它,这里呢需要我们去搞一个分享链接啊,也就是刚刚我们生成了一个任意一个 ppt 的 一个分享链接,这里我们可以回去搞一下。怎么回去啊?这里也教大家一下,在这个历史对话这里看到没有我们刚刚输入的这一句学习扣子使用教程, 我们生成完之后,这个右上角会有一个分享该任务,这里呢就会有一个复制链接,我们把它复制下来,然后到这个技能商店这里来重新来把它上架一下, 我们先来添加这个分享链接,并且呢把原来这个前面这里给删掉,删掉之后这个就是他的分享链接了, 那这个案例名称就叫如何快速学习扣子,那这个配图他是必须上传一个配图的,这里我们可以随便先上传一个图,这里的话我就随便先上传一个我之前的一个视频的封面好了。 然后呢我们点保存这个详细描述,我们重新来把它粘贴一下,分类也选一下啊, ok, 我 们选好这东西之后啊可以看到它这里还有一个点, 就是你可以把这个技能呢设置成一个免费的,还可以设置成一个付费的,也就是现在扣子呢,它允许你自己做的一个 skills, 是 别人必须花钱啊,多少钱一个月别人才可以用你这个 skills, 所以 说这个是一个很适合新手小白的一个便捷方式, 也就是说当你在某一个垂直领域啊,大家一定要听清楚,是垂直领域,你做的非常非常优秀, 你能够生成一个很好用很好用的技能时候,那你就可以把它上架啊,上架到扣子的一个商店,然后把这个按月付费,把它打开,让别人给你出钱,就出点小钱,然后来用你这个 skills, 所以 这个也是新手可以变现的一个方向,只是说大家一定不要去做这种铺天盖地的 很简单的东西,一定要做一个垂直领域的,然后确实是有这个付费需求的,并且你这个 skills 确实是做的好,别人才能来付费,对不对? 如果你做的不好,那他就没有一个付费的理由了嘛?那这个是否开源,如果我们把它打开的话,那别人就可以直接看到我们这个 skills 的 一个代码啊。所以说如果你要付费的话,那他这个就关掉,我们默认就关掉就行了。并且如果说你想要上架到商店的话,你是需要有三个精选案例的, 也就是说扣子他们现在希望上架到商店的呢,都是一些精品的一个 skills 啊,所以说大家一定要已经做出一个比较好的东西,你再去上架啊, 那这里我没有那么多的案例,我就先不去搞了,那大家只要凑齐三个案例,然后点击这个上架到商店就行了,这里呢我就把它取消掉。我们最后再来说一下怎么来开通这个付费啊?也就是你想让别人来对你这个 skills 付费使用的话,一定要点这个右上角的开通商户, 那目前他支持的一个商户呢?就是抖音支付和一个支付宝,我们点击开通,如果你是个人,而且你没有营业执照的话呢,你就选这个小微商户就行了, 如果你是企业的话,你可以选这个,如果你有个体工商户的这个营业执照,也可以选这个都行。那你选完小微商户之后,就只要在下面填你的这个信息就可以了啊,比如说你是什么个体户张三,然后这个名字也可以写个体户张三 这个证件类型就是身份证嘛,然后你把你的证件啊什么的传到这里来,这个资质证明啊,需要跟大家讲一下,如果你的这个 skills 是 用于一个特殊的行业的话,它可能是需要资质的啊,那具体哪些行业需要资质,大家需要点到这个资质说明里面去看一下啊。 他这个就跟支付宝的一个商户申请是差不多的。那这个结算信息,也就是说啊,这个钱到账之后,他是对私还是对公?对公也就是你必须是公司的公户才行。如果对私的话,也就是你自己私人的一个银行卡吗?你就可以把它填到这里来, 填完之后你再写一个管理员信息,这个管理员信息也就是说你这个收款账号究竟是谁在管理?如果你是个人的话,你就把自己的信息填到这里来, 然后这个补充材料一般是不需要的哈。然后这个支付宝呢,你也可以一起把它勾选上,如果你勾选上之后,用户就可以通过支付宝支付来付你这个月费了,那下面的信息也都是一样填的,就填自己的一个真实信息就可以了。 注意这种地方都必须是真实信息啊,不能填虚假信息的。那这个结算信息的话,我们可以选择支付宝账号,也就是你想要把这个钱结到哪个支付宝账号上, 然后你把它填上,填上之后再点这个提交材料并同意,然后你再提交就可以,等审核就行了哈。对,目前这个扣子呢,它是支持一个 skills 的, 一个变现的。 ok, 那 我们怎么才能做别人已经上架到商店的 skills 呢?我们这里呢需要先点到左边的这个扣子, 点到扣子之后他就来到了这个最新版的这个页面,是不是我们左边呢有一个技能商店,我们点进来到这里呢,就可以看到很多别人已经创建好的这么一个技能了,我们可以直接点进来任意一个技能,然后点安装就可以了, 那右下角他会显示一个技能安装成功啊,安装完之后我们直接点这个使用就好了,并且呢我们可以看到这个对话框这里就已经有一个我们刚刚加进来的技能了, 那我们就可以直接使用一句话来生成一个新年绘本了,对不对?那如果我们不想用这个技能呢,我们就可以把它退掉,退掉之后如果我还想添加这个技能进来,怎么弄? 点击这里的一个更多,这里可以看到我已经有了一个技能,这个技能是内容生成幻灯片,那这个是我刚刚在技能商店加进来的,如果你按住旁边这个小钉子,他就会把它置顶是不是?但是大家需要注意的是,我们点完这个小钉子之后啊,他这个置顶不是说在这个地方置顶啊,是到这里来了,看到没有, 也就是我不需要到这个更多这里来找他,而是说我在这个地方就能够直接找到他了,看到没有?我们可以点这个地方,他是置顶到这里啊,不是说在这个地方,那如果我们要把这个新年绘本置顶的话,也就是置顶到这个地方看到没有第一个新年绘本, 所以如果我们还想要有更多的技能,我们可以点这个发现更多技能,然后就可以跳转到这里的一个技能商店,我们就可以添加自己想要的这么一个技能,把它安装过来就可以了哈, 并且在这里跟他对话就行了。但是大家在使用别人已经写好的一个技能之前,最好先看一下他这个技能到底是怎么用的, 然后他这里有一些精选案例,就是说这个技能到底生成出来的效果好不好,大家可以点进来看一下,不要盲目的去选择别人的这么一个技能。 ok, 那 除了这个技能之外呢?扣子最近还有一个更新啊,也就是这里的一个长期计划,那这个长期计划是什么?我们下期视频再讲啊。 ok, 希望大家通过这一期都已经学会 skills 技能到底怎么创作,并且呢?怎么发布自己的一个技能,怎么去引用别人的技能?并且如果你在某一个垂直领域你真的做得很好,你也可以把你自己熟知的一些东西做成一个 skills 发布到商店来变现啊,只要开通你的一个商户,就可以实现一个收款。在这个视频正式结束之前呢,我想专门花几分钟跟大家聊一个很多新手都有的一个焦虑点和担心点, 这几个点是什么呢?首先是有些同学,他担心老师我学完工作流,学完智能体大件,会不会这个技术很快就被迭代了啊? skills 刚出来,那工作流会不会过时?我现在学工作流还有意义吗? 还有一个点就是 ai 工具更新这么快,到底哪个 ai 工具才是主流,我到底学哪个才不会被淘汰? 我现在学的技能会不会很快又被新的产品给取代?我会不会竹篮打水一场空呢?大家要知道这些焦虑是很多新手小白都有的,我也特别理解大家的焦虑,因为现在 ai 行业的更新速度确实太快了, 那么在这样的情况下,我们到底还要不要学技能?学了会不会白学呢?我可以告诉大家一个很明确答案,就是一定要学,并且一定要尽早开始学。 为什么呢?首先是我们在课内,至少我自己的这一百多节课学的这个扣子,不仅仅只是学扣子这一个平台,我们学的是一个底层的一个逻辑,这些逻辑是不会变的。 不管你用什么样的工具,你都需要知道怎么把一个复杂的任务拆解成多个小步骤,对不对?这个能力它是通用的, 比如说你要做一个自动生成短视频的系统,不管你是用扣子还是用 defi, 还是用 n 八 n, 你 都需要把它拆解成生成文案,生成配图,生成配音,再合成视频这么一个链路。 那么这个拆解的一个思维和能力,跟你用什么工具根本没有任何的关系。第二个就是工作流的思维方式,在所有的 ai 平台上都是通用的, 你在扣子上面学了工作流的设计,换到 define 上,可能界面不一样,但是思维方式是一样的,只要你稍微熟悉一下界面,你的核心能力还在,你很快就能够迁移到其他的平台。那么第四个就是一个提示词工程,怎么跟 ai 沟通,怎么写好的提示词,怎么引导 ai 生成你想要的效果, 这个能力不管未来的 ai 模型怎么迭代,怎么升级,都是一个刚需,都是一个恒久不变的东西。不管你是用国外的弹幕信号也好,还是你用国内的弹幕信号,还是你要使用 skills 也好,都是需要一个好的替值词工程的。 包括我们未来做一些 ai 的 编程方面东西,都是需要提示词工程的,这个是一个很久的非常核心的内容。最后一个就是一个数据流的设计,我们在课内学的设计数据的一个输入输出,怎么让数据在不同的节点之间正确的流转,怎么处理异常的情况, 这些能力是一个人能够用好 ai 的 基础,这些东西它通通都不会因为一个工具的更新就过时, 所以大家一定要有这个观念,当你把这些底层逻辑全部吃透之后,不管未来的工具怎么变,你都能够以不变去应万变,因为你已经掌握了这个时代学习 ai 的 底层逻辑,当你把这些东西学会之后, 你迁移到其他任何平台的成本就很低了,你的这个能力是可以在所有平台相互相通的, 是不需要你再花很长的时间去学习的。大家要知道工具只是一个表层工具,它也许会被迭代,但是你的这个思维才是你的内核,你真正要学会的,其实它都不是扣子本身这一个工具, 而是你在这个 ai 时代的一个思考,一个工作的方式。大家要知道在未来的十年之内, 很多很多传统的工作方式是必然会被 ai 取代的,只是说一个时间长久的问题,那么我们现在要学的其实就是在 ai 时代,我如何利用各种工具的一个思维方式,一个思考方式啊, 所以这个工具日后只会越来越多,越来越先进,我们一定要掌握这些底层的思考逻辑,以不变去应万变啊。就像你做数学题一样, 一个母题底下可能会有一百个变种题,但是只要你会解答这一个母题,不管这个题怎么变,你都会解好。那么第三个点就是我们在学习 cos、 工作流搭建和这种应用开发的过程中,你积累的不仅仅是一个平台的技术能力,而是一个很复合的能力。 比如说你会搭建工作流,你会写提示词,你会调试系统,它这个东西其实是一个复合能力, 并不是一个表层的只会使用工具的能力是不是?并且你在学习的过程中,你会知道想要做一个什么样的产品,你就应该先做什么,再做什么,这样设计产品的能力又比这个技术能力要更加深入一层了, 这个产品能力是不管你使用什么工具都是有价值的。还有一个就是业务能力,当你真正的进入这个行业啊,你能够了解别人那些痛点,然后呢?知道实际的需求,知道怎么把 ai 应用到落地的真实的业务场景, 并且把这个场景跟你能够做的一些自动化工作留给结合起来,这个就会形成你自己的一个业务能力,这个业务能力是最深层次的,最有价值的一个能力, 这些东西才是你这么长时间以来积累下来的核心竞争力,这些东西是不会被那些只会用自然语言描述,然后自动生成 skills, 或者自动生成 ai 编程的这些其他人给替代的,知道吗?大家要知道,你自己走的每一步路一定都不是白走的, 你在这个 ai 行业一旦踏进来,你越走越深,那你未来的路就会越来越宽,因为你的眼界越来越宽,你了解到的东西也越来越多了。 这也就是我为什么跟大家说一定要越早学,他就能够越早的把握到一个趋势。 因为未来 ai 一定是一个普通人人人都应该会的技能,只是这个技能我也会,你也会,但是我可能只会一点点,但是你呢?可能会的很多, 那我们肯定是早学早受益的,未来肯定还会有各种各样的工具出现,大家一定不要把眼光呢给局限到某一个特定的工具,不要抱着一种我学的扣子,或者说我学的什么东西,我就万事大吉了,以后什么东西都不用学了,这种心态,大家要保持一种持续学习,终身学习, 一直进步的一个心态啊。我们刚刚说到这几个能力,他都不会因为工具的更新就消失了,工具变了没有关系,你换一个工具就行,但是你的理解,你的经验,你的案例库,这些东西都在 未来的这些企业,他需要的不是说会用某个工具的人,而是说会组合各种 ai 工具,能用 ai 来解决实际业务问题的人。 所以你越早学习的话,才能够把握住这个趋势。目前这种 ai 的 落地场景开发还处于很早期啊,很多人都还不会,所以整个市场需求呢很大, 现在学的话是一个比较好的红利期,所以呢,大家不要焦虑,放心大胆的去学,你学的每一个技能,做过的每一个项目,踩的每一个坑啊,这些东西都会成为你自己的一个核心的竞争力,这些工具也许会随着时间慢慢的进步, 会从一个简单的工具使用者,慢慢的变成一个 ai 场景落地开发的开发者。所以这个其实是一个很清晰的成长路径,哪怕对于我自己来说,其实也是这样的,一定要记住,工具只是表层,我们真正要关注的是这些底层逻辑和在学习过程中 积累起来的经验和能力。所以大家不要再去等待,也不要去害怕,也不要让焦虑去吞,是自己啊,从现在开始就学起来,其实都还很早。 ok, 那 我们这期视频呢就到这里了,我们下期视频再见。拜拜。



用 agent skills 做知乎检测是一种什么体验呢?它能比传统的分块儿加向量匹配的 r a g 效果更好吗? 大家好,欢迎来到库德明花园,我是花园老师。这一期呢,我们进入 agent skill 的 实战章节,上一期视频中啊,我们介绍了 skill 的 工作原理和使用方法啊,下面我们简单做一个回顾。 skill 是 最近 astropok 推出的一个 a 证领域的行业标准,它呢本身就是一个文件夹,里面存放着具体的使用说明啊,也就是 skill 点 md 更详细的参考文档以及可执行的脚本。 它的核心特性呢,就是渐进式加载策略。在 a 证启动的时候啊,它只会将所有 skill 的 基本描述加入 ai 的 上下文。那当用户发出需求的时候呢, 大家会根据 skill 的 描述啊来判断具体要调用哪个 skill, 对 了之后呢,再去读取这个 skill 的 具体的使用说明,然后啊,根据这个使用说明,进一步的读取更详细的参考文档,以及决定是否要执行某个脚本来连接外部世界。 那通过这样的模式呢,可以让 agent 既能节省大量的上下文,又能精准地响应用户的需求,找到并执行某个技能。 那 skill 的 使用呢,也非常简单啊,你只需要把它的文件夹放到特定的 agent 的 目录之下啊,比如说而 cloud 杠 skills, 那 ai 呢,就会在下次启动的时候自动识别到这个 skill, 并且根据用户的需求判断是否需要调用啊。下面呢,我们就来实战探索一下 skill 啊,有哪些有意思的玩法, 有我的粉丝都知道啊,我本人对传统的通过 truck 加 and bidding 这种实现 ig 的 模式有比较大的偏见啊, 虽然呢,这种模式最后也能调教出比较好的效果,但是啊,调教过程实在是太痛苦了。那我是真正的经历过这个过程的独胆啊,才会有这种感觉啊,相信很多同学也是感同身受的。所以呢,我一直觉得这种方案啊,只是当下的一种妥协模式啊,他终究会被时代淘汰的。 那最近呢,浪漫 index 的 创始人啊,他发表了一条 twitter 啊,我刚才的观点是比较类似的啊,他说 r g 啊,本身是没有死的啊,但是固定的 trunk 加 and binding 这道模式应该已经死了。如果 agent 可可以动态地去扩展周围文件的上下文,那么过多地考虑出一块的大小就没有意义了。 哎,我们可以想象一下啊,这个 agent skills 的 渐进式批量策略是不是有点这个意思呢?所以呢,我们考虑借鉴一下 skill 的 设计模式,来实现一个专用于知识解锁的 skill。 我 希望啊,他能帮我解决下面这些问题。 首先啊,他能够在指定目录里解锁我们关心的问题,比如啊,我让他从公司内部的智库找出最近三年的销售趋势,或者啊,从某个项目资料里找出所有性能优化的建议。 第二点啊,它能够跨多种文件格式进行联合查询,也就是啊,能够根据不同的文件类型选择适合的方式来进行读取和理解。比如说啊, macdown, pdf, excel 啊,这些不同的格式,它处理的方式是不一样的,但是啊,对于使用者来讲,是不应该去操心这些内容的。 第三点啊,不能一上来就把所有的文件全部读取出来,而是需要像人一样,先按一些关键词来逐步的缩小范围,最后再精准的打开少量的相关文件,快速的定位答案。这样呢,可以确保 ai 只需要用到比较少量的头藤啊,就可以准确的找到答案。 第四点啊,他不能简单的给出一堆命中行,而是呢,需要结合上下文,把问题相关的内容拼在一起,尽可能啊给出一条可读的啊,成段的这种回答。 最后啊,他需要能够支持在复杂的问题上进行多人查找,那比如说你问的是对某个政策的关键影响啊,他可能先在目录里锁定几分核心的 pdf, 然后在这些 pdf 里面按章节进行解锁,最后再结合所有之前解锁到的内容啊进行总结回答。 下面我们先来演示一下这个 skill 的 具体效果啊,然后这个呢,是我们在本地创建的一个数据之库啊,它里面包含了几个不同领域的知识,然后也包含多种不同的文件类型。那比如这目录啊,它主要是一些上市公司的具体的财报的数据,然后是 pdf 格式的, 然后这个目录里呢,包含了一些电商的订单的数据啊,比如说这个顾客信息,员工信息啊,订单信息之类的啊,主要是 excel 格式的。 然后啊,还有一些 ai 领域的行业的资料啊, pdf 格式的,然后以及安全领域的一些专业知识啊,有 back down 和 t s t 格式的,那可以发现啊,这个知识库它是非常的分散,并且包含多个不同的格式的,那我们的 skill 的 实际效果怎么样呢? 我们先来问一个金融领域的具体数据问题,我们让他解锁一下致富啊,三一重工前三大股东是谁呢?那首先啊,这个数据啊,存储在我们这个三一重工 q 三的财报的这个数据里面啊,这是个 pdf 文件,这里面有他前十大股东啊,在这个季度的具体的持股的情况。 哎,我们看到解锁成功了啊,这个具体的结果呢,跟实际这个文档里面的结果是完全一致的 啊,我们来看一下它的解锁的步骤啊,首先啊,它找到了我们这个 skill, 然后啊,它通过一些命令找到了我们这个知识库的文件夹,然后啊,它读取了我们这个知识库的目录的文件啊,然后啊,它应该是看到了这个海报的数据是一个 pdf 的 格式啊,然后它进一步的读取了 这个 skill 的 reference 啊,这里面有具体怎么样去处理这个 pdf 的 数据哎,然后它把我们这个 pdf 原本的 pdf 的 数据转换成了 txt, 然后下面啊,他根据用户的问题啊,拆解除了一些关键词,然后开始在这个文件夹之内进行剪辑啊,然后剪辑的过程中呢,他还是分段进行剪辑的,他并不是直接会去读取整个文件内容的,整个过程啊,看起来是非常的智能化啊,并且呢花费的 token 啊是非常少的。 然后下面啊,我们紧接着在这个文件夹追问一些问题啊,比如我问三一重工的母公司的附带表,他的情况具体是什么样的呢?哎,然后这个过程他就快很多了,因为前面他已经把这个 pdf 处理完成了啊,接下来呢,他只需要去使用啊相应的关键字进行剪辑就可以了。 那所以说呢,如果啊,我们本身这个知识库所有的文件就已经是纯文本的,使用这个 skill, 它的剪辑效率应该是非常高的。 然后我们再问一下另外一个文件里面的问题啊,问一下航天动力的啊,他这个前十大股东的持股的情况,哎,然后这个过程也非常快啊,他直接把这个 pdf 处理成了 tst, 然后去匹配里面的内容,很快的给出了结果啊,下面我们尝试问另外一个电商领域的问题啊,正确买了啥? 想要回答这个问题呢,他需要分析两个 excel, 首先啊,是这个顾客表,他需要在这张表里面找到啊,这个名叫证券的人,他的 id 是 什么?然后再去这个订单表,根据用户的 id 找,找到啊,他具体购买的商品是什么? 哎,啊,我们看一下分析结果啊,啊,依然准确地找到了数据啊,是蓝牙耳机。然后啊,我们再看一下它的步骤 和刚刚过程的区别呢,就是他额外去读取了 excel 的 具体啊,如何分析和处理的这个 reference。 然后呢啊,他根据这个 reference 里面给到的方法呢,去具体分析了这个这两张表里面的数据啊,然后正确的给出了结果啊。然后我们再问一个更复杂一点的问题啊,有哪些用户买了儿童绘本,在什么时间? 哎,这次 a 阵更快的给出了结果啊,这个过程啊,已经比较接近于我理想的 ai 智能知识解锁的形态了,其实呢,啊,这个过程也比较像我们正常的一个人啊,去一个大的文件夹里面去找,首先逐步的去缩小范围,然后啊,找到了不同的文件之后, 根据具体的这个参考文档啊,使用不同的脚本,然后去处理啊,然后最后啊,再把这个解锁的知识总结一下,大家觉得怎么样呢? 下面我们来看一下这个 skill 的 实现原理。首先啊,对一个能执行 skill 的 agent, 比如说 open code, 它本身就已经具备了一些基础的文件解锁能力, 比如 l s grab look。 那 我们要做的呢,就是在这个 skill 中教会如何更好地使用这些能力。首先啊,第一步,定位领域,通过分析用户的问题,然后结合知乎的目录导引,定位出知识可能存在的领域啊,也就是文件夹。 然后第二步,定位文件啊,使用 grab 这样的命令,在指定的目录文件里面进行查找,筛选出可能相关的文件。下面啊,再按照不同的工具去读取和分析这些文件的关键部分。比如说不同的文件类型呢,我们有不同的策略,比如啊,对于 markdown 啊,那我们就直接定位到匹配的段落,结合上下文进行分析就好了。 如果是 pdf 呢,我们需要编辑专门的代码去把 pdf 解析成纯文本,然后按页按章节去提取内容。如果是 excel 呢,我们需要编辑代码去提取和分析 excel。 然后啊,只看跟我们本次问题相关的表行和列,而不是把整份表格都提取进来。 那这里呢,还有两条关键的设计原则啊,第一个啊,间接式的解锁啊,尽量少读啊,但是读的要准确,优先去查找最可能有答案的文件。提取文件内容的时候呢,仅提取相关的行,必要的时候再进行扩展范围,避免无意义的投屏消耗。 第二,保持简单可控,那用户呢,只需要告诉他数据库在什么位置,其余的解锁策略都由这个 still 自动去完成。 另外啊,想要让这个知识解锁更高效和精准,还有两个技巧,首先啊,文件夹尽量我们需要按领域去划分,每个文件夹之内呢,只包含特定领域下的文件,比如说啊,金融数据,电商数据啊,另外啊,最好每一个文件夹之下啊,都有一个目录所有的文件 啊,也就是这个 data structure 点 and d。 那 如果说啊,我们文件命名不是很规范,而且呢,包含 pdf 等存件格式啊,这个就是必要的。那这个文件中呢,描述了当前文件夹下每个文件的用途, 比如说我们看一下我们的支付的数据啊,在这个电商的表里边,我们就通过这个目录所有文件啊,告诉他了每个文件里面都大概是一个什么样的数据。那这里呢,我们也参考了 skill 的 电竞式批漏的设计原则,如果有多几欠套的领域呢, ai 找到了这个领域之后,才会去读取这个领域的目录导引。 那这个 skill 具体是怎么实现的呢?其实啊,你把我们上面提到的核心流程,设计原则,关键技巧给到我们上个教程中讲到的 skill creator, 这个 skill 自己就可以帮我们创建出来了,我们只需要经过细微的调整,下面我们来看一下我们这个 skill 的 目录结构啊。首先是 skill 点 md, 它是这个技能的使用说明书啊,里面描述了如何去找本地的知识库, 如何根据目录缩影去逐层的剪索知识,对不同的文件的处理方式啊,具体去参考哪个 reference 以及啊最终的回答风格等等。那这个 reference 呢,具体放置了,具体去分析一个 pdf 或者 excel 的 时候, 再去阅读这个 reference 的 具体文档,会节省 token 和大冒险的注意力。那 script 里面呢,放置了一些 pdf 的 特殊的数据脚本啊,比如说解析 pdf, 或者说 pdf 转图片等等。 那如果我们的本地入户比较复杂啊,比如说后面你还会有其他的格式,我们就可以用这样的思路去扩展 reference 或者 script。 那 我们这个 skill 以及刚刚我们演示过程中使用到的这个 github 上,大家感兴趣呢,可以自己去克隆这个仓库,然后在本地自己去实验啊, 我们可以把这套方案理解为不需要预见向量数据库,本地目录级渐近式剪缩的 r g 啊,它的优势呢,主要在于,首先啊,不需要预见向量数据库 更清亮简单啊,适合快速搭建本地的个人数据库的场景。另外,剪缩更智能啊,传统的 r g 呢,主要靠向量匹配内容,大模型只做总结,而在这个过程中呢,大模型可以参与分词上下文的匹配和决策,并且可以智能进行调整。其实这就是一个典型的 agent 和 r g 的 工作模式啊。 当然呢,当前只是一个初步的尝试,它还有一定的缺陷,首先是首次解锁效率的问题啊,如果啊,我们分析的文件是一个 p f 或者说其他特殊的格式, 它需要先调用脚本进行转换,所以首次效率是比较低的。所以啊,如果你使用这套方案的话,推荐预处理为纯文本,它的它的解锁效率呢,会高很多。第二点啊, skill 的 调用稳定性 在多轮的检测之后呢, ai 可能会去忘记调用这个 skill, 从而丢失一些关键的处理步骤啊。这个呢,在很多其他的 skill 上也会有类似的问题,就要我们从这个 a 帧的扣端层面去解决。 第三啊, token 消耗是要更大一点的,因为整个检测过程是 ai 控制的,当第一次没有检测到想要的答案的时候, ai 会继续切换一些新的参数或者文件进行检测,直到找到最终的结果, 虽然结果更准确,但消耗的 token 可能要更多一点了。刚刚我们介绍的这个 skill 呢,是一个通用的知识解锁的尝试啊, 但是如果你已经有一个固定格式的支库,比如这样一个文档站啊,里面可能已经包含了多个本地的文档了,那我们还可以通过 skill creator, 让它去自己分析我们这个文档站,然后创建出符合我们文档站风格的知识解锁的 skill 啊。 然后啊,我们下面在这个 ezdecet 的 文档站这个仓库里面来测试一下。这个呢,就是我们 ezdecet 本地的这个文档站的仓库了啊,里面其实都是一些 macdown 的 文档。然后啊,我们在这个 skill 里面加入这个 skill creator 这个 skill, 然后啊,我们在这个文档站下打开 open code, 输入这样一段提示词, 我们告诉他当前项目是一个文档占包含多个 markdown 的 文档。我想创建一个专用于知识剪辑的 skill, 它可以替代传统的 r g 用于当前文档占的知识剪辑啊,你来帮我创建这个 skill。 使用中文 skill 的 基本思路是,先根据用户的问题提取出需要剪辑的可能关键字,然后使用 graph 命令找到对应的上页文,然后分析上页文。 如果解锁到的信息和问题不符呢,需要继续解锁其他可能的关键词,最大重试五次。好啊,我们看到这个 skill 已经创建成功了啊,它里面具体介绍了在我们当前这个文案站进行知识解锁的一个最佳实践啊, 因为这个文案站主要就是 markdown 的 格式,没有什么特殊的文件啊,所以它这里面只有一个 skill 点 m d, 没有其他的 reference 或者或者 script, 非常简单啊。下面我们尝试问一个问题啊,解锁支付如何使用 e z desc 生成评估数据集? a i 准确的给出了答案。然后我们再问一个 easy to set 有 哪些分块策略的问题,回答很快,而且答案非常完美啊。 通过这样的思路呢,大家就可以在任何一个你已经在本地建好的一个知识库里面去实现一个知识解锁的 skill 啊。好,我们本期教程呢就讲到这,如果本期对你有所帮助,希望得到一个免费的三连和关注。感谢大家,我们下期见。

你以为 ai 助手已经很强大了,其实真正让 ai 变得无所不能的秘密,就藏在 agent 和 skills 这两个词里。很多人用 ai, 却没搞明白这俩到底有啥区别。今天我就用最简单的比喻,一次性讲透。先说 agent, 你 可以把 agent 想象成一个刚入职的实习生,脑子灵活,理解力强,什么都能聊两句。 但你真让他干活,比如打包一个 github 项目,整理一堆文件,他就蒙了,因为他没你的工作手册,不知道具体流程。这时候 skills 就 登场了。 skills 其实就是一套 sop 手册,把每个具体的工作流程、脚本、模板、规范都整理好,随时可以查 agent, 只要需要,就能自己翻手册,按步骤把事办妥。 那 prompt 又是什么? prompt 就 像你站在实习生旁边,临时口头交代任务,今天让他写公众号开头,明天让他改,语气灵活但不长久,对话一关啥都没了。而 skill 是 长期有效的能力库, agent 随时能用,所以 agent 是 会思考的执行者。 skills 是 可附用的能力模块,两者结合, ai 才能既聪明又能干,帮你解决各种实际问题。你觉得 agent 和 skills 哪个更重要?评论区聊聊你的看法。

这是你朋友给你发的神秘工具,有的能生成好看的照片,有的能让 ai 越狱,还有的能一键复活。老大,离谱的 ai 用法总是离不开离谱的提示词和工具,渴望学习的你是在评论区找大佬分享,还是晚上偷偷来我家让我教你呢?其实这些都不用,因为这个 game 上爆火的 skills 项目可以解决一切问题。 不过在说它之前,我们首先要知道,最近全网吹爆的 skills 真的 那么万能吗?它背后的原理又是什么呢?小白又要如何用它?本期视频将带你一探究竟,同时也会分享几种离谱的玩法,建议各位在父母的陪同下使用。在使用之前,我们先来诉通一下 skills 究竟是什么。 二零二五年十月份的时候,一家叫 ansopik 的 公司先提出了名为 cloud skill 的 技术,然后基于这个技术又推出了 agent skill 开放标准,让起初只能在自家软件上使用的 skill 也可以在其他软件上使用。不 过即便这么良心,这个标准制作完成后,它还是不温不火。但是随着时间的流逝,它的好处也在慢慢显现,因为 skill 可以 很方便地分享给别人使用。于是有不少人自发的将自制的 skill 上传到 github 上,吸引网友下载, 结果好评如潮。有人夸他的功能非常离谱,有人夸他非常节省偷啃。这是因为他用了一种叫做渐进式批漏的技术, 也就像洋葱一样,一层一层一层的把提示词给 ai 看。例如,这是一个 pdf 处理技能,可以分为三层,第一层叫做原数据,包含技能的名字和描述。第二层叫做指令,这里写着给 ai 看的工作流,比如让他用什么工具从 pdf 中提取文本。 第三层是参考资料和代码,让 ai 在 执行工作流的时候按需阅读。所以相较于传统提示词按需加载的特性,让它不仅能实现复杂的功能,而且占用上下文的长度会更小,也就更节省。头等, 如果你没有听懂的话也没有关系,会用就可以,除非你对 skos 的 底层细节非常感兴趣。那么你可以看看这篇官方文档和架构图, 我在这里只讲它最核心的几点。那么接下来呢?我们讲讲 skills 有 哪些离谱的用法和技巧。我们先来看几个案例,例如你想做一个产品动画,只需要像这样抒你的需求,完全不需要你懂剪辑就可以达到很好的效果,还可以拿来做软件宣传片, 或者那种高大上的数据动态演示,是不是非常香?再看这个剪辑技能,它能帮你下载播客这类长视频,再剪辑出其中的精华,然后生成带双语字幕的短视频,还能配上发布文案,非常适合做切片。另外还有这个漫画技能,想要批量生成漫画,只需要输入一个编好的故事, skill 就 会将 ai 加载特定的提示词,让 ai 一 连串的执行操作,生成这样的效果,看起来是不是画面非常精美,还有分镜和对白。 最后再推荐一个去 ai 味的技能,要比我之前推荐的提示词会智能不少。这里还有一个技能,下载的排行,热门的 skill 都可以在这里找到。以上提到的技能链接以及安装教程我也都整理好了,放在了视频的下方,你可以自取。 看到这里,想必你对 skyo 有 了一定的了解,但我还想提醒的一点是, skyo 并非适用于任何场景,因为简单的任务提示词就够了,复杂的系统需要写代码才行。而 skyo 适合处理中等难度的任务, 当流程繁琐但又不值得为它开发一个 app, 使用它就好了。好了,以上就是本期视频的全部内容了,如果你觉得有所收获的话,不要忘记点赞收藏。最后,我是元宝,一台 ai 和黑科技的挖掘机,我们下期见!

最近老师刷到一个话题,说的是工作流已死, skill 崛起。那我相信有很多刚开始想学工作流,或者说正在学工作流的同学,是不是听到这个消息就会有一点迷茫慌了,不知道到底该不该继续学工作流。 这个视频我会彻底帮你灭掉这个焦虑的火,让你不被某些信息给误导,不要被标题给吓到。我们打开扣子之后,你会发现智能体、工作流,还有最近很火的 skill, 他都有。想要解决刚刚的焦虑,我们就必须弄清楚这三个东西是什么,为了新手小白可以听得懂,我们今天就来开一个智能体餐厅。首先我们把扣子比喻成一个大商场, 我们现在就要在这个商场里面开一家餐厅。那么智能体、工作流、 skill, 他 们三个在这家餐厅应该担任什么样的角色呢?首先我们要讲的是智能体,也叫做 agent, 他 在这家店里面是门口的迎宾,同时也是这家店的店长, 他最大的本事就是可以听懂人话,并且看能下菜碟。举个例子,如果客人进来说我要一份宫保鸡丁,少盐多辣,并且再加个蛋炒饭,那店长一听这个需求有点复杂得现做,这个时候他就会把这个单子派给后厨去处理,也就是工作流。 如果客人只说我要一份宫保鸡丁,并没有提其他的要求,那店长一听这个要求简单,他就直接可以拿一个预制菜放进微波炉里面,一热 就可以给客人了,这个微波炉也就是 skill。 那 讲完了智能体,我们第二个要讲的是工作流,英文叫做 work flow, 就是 刚刚说的后厨流水线, 客人要的是宫保鸡丁,第一步要先切肉,第二步下锅,第三步勾芡,每一步怎么做,放多少盐跟辣椒,这都是由你来制定,由你来设计, 这就是上个视频我所讲的逻辑设计。现在我们来讲一下第三个,也就是最近很火的斯科,他的中文其实就是技能的意思,大家可以通俗的把它理解为是一种自动机器,比如说自动咖啡机、自动贩卖机等等, 他执行的是一个单一标准化的任务,并且他有个特点就是快速高效。那总结一下,智能体,他其实就是这家餐厅的大脑, 他可以与用户沟通,并且利用店长的职务去调动这家店所拥有的资源。工作流,他就是这家餐厅的双手,他可以负责一些比较复杂的任务,比如说刚刚讲的宫保鸡丁,需要少盐又多辣, 包括客人如果点了多道菜,他都是可以去完成的。那么 skill 他 其实就是一个工具,他负责的是快速高效的执行某些简单的任务。那从这里看,他们三个其实并不冲突, 他们是进行一个分工,而不是一个竞争的关系,这就是为什么我告诉大家不用焦虑的原因。那讲到这里,可能有些同学又会冒出一个问题,那就是工作流与 skill 应该先选哪个? 那我想说的是,如果你已经开始在学工作流,那你就继续学,你要把所有工作流的节点,底层逻辑都理解明白之后,你再去扣着技能商店里面去使用别人的 skill, 体验一下它的用法,搞懂输入什么,输出什么,先对 skill 有 一个直观的认知,之后你再把他们的 skill 给拆解掉, 试着去改一下里面的参数,再熟悉一下节点的基本操作。接着你就可以去试一下自主的搭建一些简单的工作流, 把它分装成 skill。 那 我们根据综上所述分析就知道,如果你只是准备开始学的话,那肯定是要由工作流入手的。那为什么新手小白要先从工作流来学起?因为他可以锻炼你的逻辑思维。就好比开餐厅,你得先学会炒菜, 然后再雇一个优秀的店长,最后再买几台高级的机器来锦上添花。如果你连后厨的火都不会开,直接去搞那些花里胡哨,这家餐厅离倒闭也不远。有些人可能会说,那五年后厨一起过不就好。 这也是很多新手小白喜欢做的事,就是上来就想直接拿到结果去复制别人成品的工作流,如果一报错,你就傻眼了吧。这就好像是上学的时候,很多同学都喜欢抄别人的作业, 答案可能是对的,但是老师如果一问你答题思路的话,你就暴露了你的实力。所以我是觉得在 ai 这条路上, 自学之道不在急行,而在深耕,一定要把思维逻辑这个内功念清楚,而不是一心只想着耍花招。下一个视频,我将手把手的带着大家熟悉一下扣子的界面,明开始讲解扣子系列教学的第一课,关注寻泽,带你轻松入门 ai!

突然就有点慌了哈,被制造焦虑了,最近有很多人都在说 agent skills, 并且还说取代了传统的工作流智能体,那到底是不是真的?你还真别说哈,我确实研究了好几个小时,其实刚开始大家说的时候我也没有在意,但是说的人越来越多的时候,哎,我就觉得有点非常非常的焦虑, 所以呢,我今天早上从起床到现在哈,我看看一点半,六七个小时,到现在还没有吃饭,我终于给他研究明白了。所以这个视频呢,我给大家主要是从下面几个方面来说一下哈。首先,什么是 agent skills? 他 可以做哪些事情?那有了 agent skills 之后呢,还要不要学习传统的工作流和智能学的搭建? 最后呢,我们会做一个数据分析的 agent, 我 们就来实操演示一下小白或者说是职场新人该如何使用 agent skills 来搭建自己的 agent, 然后帮助自己来提效,看完这个视频可以至少帮你少走一个月的弯路,大家可以先点赞收藏啊!首先呢,什么是 agent skill skill? 它就是技能, 就是说它是 agent 的 技能,其实本质上就跟我们人的技能是一样的哈,比如说我是一个程序员,那我有架构设计的技能,代码开发的技能,我也有 debug 的 技能, 有需求分析的技能,如果你告诉我你的需求,其他的你都不用管,那我会自己去架构,自己去设计开发,最后呢,按照你的需求输出你想要的产品,那现在 agent skills 呢,他就是将这些技能全部的打包,所以呢, agent 技能其实和人他是一模一样的道理, 当他掌握了某一个包含各种知识、工具,流程和规则的技能包之后呢,如果你让他干活,你只需要给他一句话,他就能够自动按照专业的要求给你做好了。第二个就是 agent 呢,他可以帮我们做哪些事情呢? 首先,如果你是职场新人,业务人员,或者是普通的个人用户,如果想要快速的让 ai 帮你简化日常的琐事,任务边界呢,非常的清晰,输出也非常的明确,并且需要反复的执行。那这些技能呢? agent skills, 它是非常在线的,如果你是职场人士,平常有这些需求的话,你完全可以让 agent skills 来代替,但是在这个复杂的现实世界中,人的需求总是很复杂的啊。对于这些技能,如果你想让 agent else 来完成的话,那你付出的沟通成本是非常非常高的,并且你的输出呢,相对来说不是很稳定啊,就像开盲盒一样,有时候呢它非常的惊艳,有时候呢又非常的离谱, 比如说你一个数据格式不对了,你的文本的文件的类型不对了,它都可能会导致你整个系统运行不了。我们就带大家来用 agent 的 skills 搭建一个数据分析的工作流,我们选择工作流,我觉得工作流呢,可能你更清晰的看到它的架构以及它的处理流程,我们更能够直观的感受到什么是 agent 的 key。 四、首先呢,我们进入到 cos 的 官网哈,在浏览器中输入 cos, 点 c n, 它就进入到了这个页面,进入到了 cos 的 首页,然后我们在这里呢点击 cos 编程,在这个地方我们就可以用 it 的 skills 来开发我们的 agent 了哈,那我们开发一个数据分析的 agent, 我 们给它输入我们已经准备好的提示词,要点击发送 啊,你看他正在开发的过程中啊,在这里呢,我们就可以看到他的整个的流程,如果在这个过程中有问题呢,他自己就会去修复,就会去 bug。 其实这就是因为他 ag 的 skill, 他 有自己的编程能力,有 bug 的 能力,然后也有架构的能力,那正在测试的过程当中,哎, 测试结束了,没问题,你看他现在测试完成之后呢,我们就可以正常使用了,我们在这边可以看到,就是他已经实现了我们在其实字里面写的一些需求了。接下来呢,我们就用我们自己的文件来做一个测试哈,那我们就上传一个文件,上传我这个文件呢,是我之前准备的一个测试文件,然后我们上传上去可以看一下哈。 啊,你看他运行失败了,那我们就是点击它自动修复就可以了啊, 刚才失败的原因就是没有这个扩展名叉 l s x, 其实我们的其实字里面是 x l 和 c v s, 那 把这个扩展名加上应该就没有问题了,那在整个过程中呢,就是如果有问题就不断的去自动修复就可以了, 那这个过程呢?呃,最终呢,我改过一个提示词,让它生成了 html, 最终我觉得生成的效果还是不错的哈。啊,我们可以看到它有柱状图,有折线图,也有丙图,然后如果这个过程中有问题呢,我们就不断的去跟它沟通协调,然后让它去修改就可以了, 大家可以使用这个来搭建自己的一些 agent, 我 觉得非常非常的方便,运行结束没有问题。之后呢,我们可以点击右上角的这个部署啊,然后我们可以写你看有域名,然后我们这个没有数据库,环境变量我们都可以配置啊,然后我们用用开部署就可以了, 然后你看他有有分为三个步骤啊,打包弓箭和部署,可以等着他部署就可以了。我们可以在这个技能商店里面可以使用别人创建好的一些技能,然后我们先安装,然后就可以使用了,应该在这里呢,我们就可以选择一个技能,如果不要的话,我们点退出就可以了。 有了 a 型的 skills, 还要不要去学习传统的工作流和智能体?说实话前几天我看到铺天盖地的这个消息的时候,我还真不敢说这话,但是体验下来之后,我觉得我可以百分之百的保证要学,非常的肯定要学,并且要早学。去年我说了差不多一年的时间让大家去学习 ai, 但是现在我觉得 仅仅学习跟 ai 聊天已经不够了。 ai 的 二点零时代就是 ai 的 技能时代,如果你是开发者、解决方案架构师,或者你需要交付复杂的项目的专业人士的话,工作流依然是你的核心的生产线工具。并且学习工作流的过程,他不是说让你看着那个模仿, 然后让你去搭建一个工作流,而是你需要知道底层的架构,你需要有架构的能力,你需要有任务拆解的能力,其实是这些底层的能力不管在任何时候他都是通用的,我们传统的工作流和正智能型的 会让你变得更加的强大。那扣子推出这个 skills 呢?其实是扩展了他的产品赛道,他的 skill 是 职场 a 阵,对于一些职场简单的一些功能,比如说你要做个 ppt, 比如说你要做个会议机,要,你需要一个简单的数据分析,那这些它都是可以的,那就是开箱即用,不需要编程基础, 主要是解决的是标准化、重复性的简单的任务。那对于复杂的流程,你必须要学会自己搭建工作流,你可以根据自己的需求去搭建、去调试、去修改。

agent skill 现在太火了,火到都要认为要杀死工作流,真的是这样吗?先来看看什么是 agent skill, 其实就是大模型每次在执行任务的时候去查的说明文档,替代掉了原来简单的提词词,把提词词与工作流中的逻辑的部分 放在 skill 文件中,然后每次大模型执行任务时都会去查一遍 skill, 既可以查询资料与触发规则,也可以跑代码文件,比原来的工作流中每次都要跑上下文的提示词, skill 则是按区获取规则与信息来闪下不少 token。 skill 基本上能替代掉原来的工作流,但是只是相对简单的工作流, 因为当前正确率达不到工作流的水平,企业级的那种复杂的工作流是没有办法用 skill 完全替代掉的。很多人就会问, agent 的 skill 不是 和 m c p 作用一样吗?都是让模型去连接外部的数据, 其实既有相似的地方,也有不同的用法。 m c p 是 给大模型提供各类数据,比如订单数据啊,天气数据啊,而 skill 是 告诉大模型怎么去处理这些数据与一些规则与逻辑上的东西 打包放在文件夹中。所以 skill 与 m c p 根据不同的场景选择用法,也可以一块结合使用。 但是当前 agent 的 skill 杀不死工作流,因为当前工作流的确定性,稳定性与正确率都要高于 skill, 但随着 skill 技术升级,大部分的场景下工作流可能还是会被替代掉。

这是一个从零到一构建 skills 的 完整方法和操作的流程,它可以让你彻底搞懂什么是 skills, 以及如何去使用。不管你是新手小白,还是说有一定的经验啊,我觉得它都有很大的一个价值。 视频最后呢你可以直接拿走,下面呢我们来看一下这个文档的主要内容。这个文档呢主要分为六个部分,第一部分呢是 skills 的 方法论好,也就是说我们在学习它之前呢,一定要了解一下它的一个定义, 以及它的一个优势,它能做哪些事情,它的一个使用场景是什么好在这个里面呢就有这个模型的架构,对应的呢就是 skills 的 一个文件的系统,打开这个文件夹就可以看到它的一个层级,包括下面呢有生态位的一个对比,跟它跟这个 mcp 跟工作流啊,到底有什么区别 啊?何时去使用啊?如果你是高频,每天高频重复的这个应用的场景就可以去使用, 包括有固定的这个题词,多步骤的操作。下面呢有给出的一个具体的案例,比如说场景一,你是代码开发中,你在代码开发里面可以去用它, 包括电商运营的批量生产线,这个呢就是说有固定的一个格式,包括我们的文案,我们的视频,这个呢就属于说批量生产这个内容好,本地支库。下面我们来看第二部分, 第二部分是什么呢?就是如何去使用了啊?从这一部分就开始如何去使用,那么这个使用呢,我们分了几个部分,那么现在第二个部分呢,就是标准的使用方法,也就是说什么意思啊?在 cloud code 里面 去使用,这个呢,也是当前来说,这个呃相当于满血版的这个使用的方式可以使用国际上顶尖的大模型,比如说 cloud 使用 gpt 的 大模型,而且呢,而且呢这个 skills 的 标准就是 cloud 的 公司他们去开发的,所以说咱们就使用它的 这个标准的,就是最完整的这个使用的方式,但是呢,他使用是有一定的门槛的,大家看这里对你的网络呢是有一定是有一定的要求。 第三部分就是在国内的这个编辑器,比如说吹编辑器去使用,那么这个呢门槛就相对就更低一点了,他对你的网络呢没有要求,而且他是可以去免费使用的,他使用的呢就是国内的大模型,然后怎么去使用呢?下面都有这个完整的流程。 好,如果你还想要再简单一点,那当然方法也是有的,直接在线版的使用扣子,直接去在线版使用,不用你去布置环境,也对你的机器没有任何的要求,只要你能上网就可以使用。而且呢他的一个使用的方式啊,其实是完全相同的,跟你在本地的,只不过呢,他是在云端的, 而且呢他也是只能使用国内的大模型,那么如何去使用呢?我们只要需要打开这个扣字编程,对吧?第一个阶段使用完全使用自然语言去生成你想要的这个 skills 的 他的一个技能,阶段二呢去修改,阶段三呢直接去发布,阶段四,然后就开始去使用。 好,这个呢就非常简单,我推荐大家啊,可以去试一下。好,第五个部分呢,就不是关于使用方面的一个介绍了,是关于我们 使用这个 skills, 或者说使用这个 ai 如何去落地的方面的一个介绍。你像我们平时啊,我们只会用这个提词词,对吧?包括我们大部分人,百分之九十的人都是使用提词词的方式去这个跟大模型去交流,那么这样呢,就缺少了中间知识库的一个层面, 这个知识库是什么意思?就是我们自己的一个资料,你自己行业的,包括你自己业务的方面的一个标准,还有你自己包括多少年的工作的一个经验,我们都需要打包成知识库,然后发给这个大模型呢,让他去学习。如果你没有这个呢,他就只能使用互联网上公开的 啊,比较普通的一些经验去给你去工作,那么这个效果就肯定会更差一点。如何打造呢?我们这边也有完整的视频的教程,大家直接可以去看一下。那么第六部分就是属于更高级的用法,就是如何去开发这个插件,对吧?这个呢就是如果你前面都学习过之后再去看这个。 好,最后呢就是这个最后总结就是我们如何去选择 skills, 还是就是我们在什么情况下去使用这个 skills, 还是在使用提词词加向量知识库的方式,那么这两种方式我们如何去选择, 对吧?中小企业,中小企业该怎么去选择?大家这个文档呢?给这个最后的这一部分,大家也要去看一下。好,这个呢就是完整的一个呃,文档,文档的流程,这个 skill 也是最新呢,最近呢刚出的一个 ai 的 技能,大家呢学习 ai 啊,一定要了解这个最新的技术,它的发展的方向, 那么了解这个方向之后呢,你看你自己行业适合不适合好,这个文档呢,也是我们经过这个几天的时间来打造的,而且所有的流程呢,大家看到这里边所有的文字都是我们经过实际的验证的,他确实是可以跑的通的好需要这个文档的呢,其实没有任何的套路,直接在视频下方说一下,直接就给你了。

agent skill 到底是什么?长什么样?怎么工作的? skill 和 mcp 的 区别是什么? mcp 会被淘汰吗? 去哪里找 skill? 怎么使用 skill? 怎么自己创建一个 skill? 如何使用 skill 实现知识库解锁?它比传统的 rg 优势在哪呢?为什么说 skill 非常不安全?使用它有哪些安全风险呢? 大家好,欢迎来到 co 的 秘密花园,我是花园老师,今天这一期,我们来聊透关于 agent skill 的 一切。 agent skill 最近非常火啊,它的成长路线和 mcp 也非常像,二零二五年十月发布的时候,只有 antropica 自家产品支持, 后来 cursor code, open code 等产品看到了 skill 的 优势,于是纷纷开始支持。再后来,社区开始涌现了大量开源的 skill 以及 skill 的 开放市场。当下大家已经默认了 skill 已经成为又一个 agent 领域的标准实践。 在传统的 ai 聊天模式中呢, ai 的 能力取决于他原本学过什么,以及你临时在对话框里告诉他什么。 这就像你招了一个什么都懂一点的实习生,每次干活的时候你都得重新教一遍。而 agent skill 带来了一种全新的玩法,模块化的能力插件, 你可以把 cloud 想象成一个超级大脑。而 agent skill 呢,就是给这个大脑安装了一个外接的工具箱,这个工具箱里面不仅有工具本身,还包含了详细的使用说明书。 大脑不需要理解具体有哪些工具啊,以及工具的用法是什么,只需要在需要的时候查看一下工具的说明书,然后再把工具拿出来用。那如果你写过代码呢?可能很容易理解啊,想要编辑一个程序,并不一定所有的代码都是我们自己写的, 我们可能会通过 import 来引入一些外部的包,这些包呢,可能存放在固定的位置,当我们的程序需要调用这些包的能力的时候呢,就会从指定的文件夹里面取出来对应的代码,然后执行。 那 skill 也是类似的逻辑啊,每个 skill 其实都是一个文件夹,它存放在了一个固定的位置,这个文件夹里面装着几样东西啊,首先啊,是 skill 点 md, 它里面会告诉 ai 具体怎么使用,然后还可能会有更详细的参考文档以及脚本, 让 skill 也可以调用 web 能力,还可能包含一些图片、模板等可能使用到的 web 资源。如果啊,你在你的 agent 执行目录放了这个文件夹,那下次和 agent 对 话的时候啊,它就可以自动根据你的需求匹配到这个 skill, 不 需要你再进行额外的配置。 比如希望 ai 帮你润色文章啊,就可以编写这样一个 skill, 这个就是它的一个基本的构成结构啊,上面三根短横线的部分相当于 skill 的 身份证啊, name 呢,是它的唯一标识。 description 是 skill 的 关键描述啊,决定什么时候会触发这个 skill。 那 下面呢,就是 skill 的 正文部分啊,比如说它的核心目标,使用步骤,注意事项等等啊,那看起来还挺普通的啊,似乎很多能力都可以做这件事。 比如啊,我们直接把这段文字和文章发给大模型,或者说放到系统提示词里面,或者封装一个 flow, 或者编写一个 agent 点 m d 或者项目级的 rules, 这些方式呢,看似不同,但是本质上只是把提示词放在了不同的位置。在真实的业务场景中呢,一个 agent 不 可能只干这么简单的一件事,大家可以想一下啊,如果你要给你的 ai 装五十个技能, 每个技能都有几千字的说明书,那要是系统一启动的时候,就把这些全部塞进它的上下文里面,那么就会首先成本爆炸啊,每次对话都可能会消耗几万的头啃,那 ai 的 注意力呢,也可能会被分散,变得这也想干,那也想干,那 skill 的 出现呢,就是为了解决这种问题啊,它有一个非常核心的机制,叫渐进式纰漏, 说人话呢,就是按需加载,用多少拿多少啊。这个呢,也是我觉得 agent skill 设计的最聪明的地方, 那你可以把它想象成啊,我们去图书馆查资料的三个步骤,第一层,先看目录,当 agent 刚启动的时候呢,就会把所有 skill 的 名称和描述加载到上下文里面,那这一层呢,占用的资源可能非常少,可能就几百个 token, 那 它的作用呢,就是告诉 cloud 自己会什么啊,你可能有查周报,处理 excel 这些技能,但是这个时候 cloud 知道自己会什么,但是还不知道具体要怎么做。 那如果你说帮我把这个 excel 处理一下的时候,那可老的发现,哎,这事我能干啊,然后他才会去查找 excel 处理啊,刚才这个技能里面的这个 skill 点 md 的 文件,那只有在这个时候呢,那些详细的操作步骤,注意事项,才会进入 ai 的 上下文 第三层啊,要实际去动手干活了,也就是真正要执行具体步骤的时候,才会去加载相应的 reference 和 script。 比如说用户下达的任务可能是分析 excel 啊,也可能是创建 excel, 那 这两个操作呢,可能有完全不同的处理步骤, 详细的步骤呢,不一定都在 skill 点 md 里面,可以分开存放在不同的参考文件下。当 cloud 识别到你要做的是分析 excel 的 时候,才会去查找分析 excel 的 reference。 那 skills 里面也可以去内置一些可执行的 excel 处理脚本啊。那在 skill 点 id 啊,或者刚才查找的具体的参考文献下,它会告诉你应该调用 以及如何去调用这些脚本。那还有最重要的一点啊, cloud 只需要按照指引去执行脚本,而执行脚本的代码是不会塞给 ai 去读的。你完全不用担心一个超大的代码的文件会消耗头衔,因为它根本就不会进入 a 诊的上下文。 这也就意味着一个 skill 可以 打包整套的书面文档,大量的执行脚本,但只要任务不需要,这些内容就永远不会占用上下文。和 m c p 一 样, skill 成了开放标准之后,开始爆发式增长,社区也出现了大量的开源 skill。 我 们可以看到啊, skills mp 啊这个网站里面的这个 skills 数量最近在经历着爆发式的增长,那这个增长速度呢?要比之前 m c p 爆火的时候还要快啊。这个就不得不提 skill 的 另一大优点,编写门槛低。 m c p 虽然有一套标准的规范,但是终究还是要靠代码来实现的。即便啊,有了 ai 辅助,对于小白来讲还是有一定门槛儿的,而 skill 就 不一样了,只要你会写提示词就能写 skill, 可以遇见的是大量的固定工作流,可能会在未来都会被改写成 skill, 这意味着 agent 的 编写门槛儿被再一次大幅降低了。那如果你想找一个 skill 呢啊,我们就可以进入这样一个 skill 市场,然后搜索我们想要使用的 skill 啊,然后这里我们还以绘图软件 excel 为例啊, 可以看到啊,社区已经有大量的 s k dj 的 skill 了。进入详情之后呢,我们可以看到这个 skill 的 详情啊,我们可以选择不同的安装方式啊,这里我们选一个最简单的方式啊,我们直接把这个包下载下来, 下载下来之后呢,这是一个安装包啊,然后我们解压一下,哎啊,我们就可以看到这个熟悉的结构啊,一个 skill 点 m d, 还有一个 reference, 接下来呢,你只需要把这个目录拷贝到我们指定的位置啊,不同的 agent 的 目录大同小异啊,基本上都是 agent name, 然后杠 skills 这样一个目录。这里啊,我们使用最近比较火的 open code 来演示啊,所以我们创建这样一个新的文件夹啊,然后我们创建一个点 open code skills 的 目录, 然后我们把刚刚解压的文件夹拷贝过来,然后我们打开终端啊,打开 open code, 然后我们输入这段提示词啊,帮我绘着一个价格图啊,讲解什么是五 w 二 h 分 析法,然后直接帮我在当前目录下生成一个 excel, 然后开始编辑这个文件, 然后这里我们发现啊,我们不需要手动去安装或者运行这个 skill, 只要我们刚刚的文件夹位置放对了,那 opencode 的 ai 就 会自动根据我们的需求判断是不是要调用这个 skill, 然后帮我们生成代码, 好,代码生成完了,然后我们来到这个目录看一下,哎,他帮我们生成这样的代码啊,然后我们把这个 excel 的 配置啊,然后我们拷贝到这个网站里面, 哎,粘贴,哎,就是这么简单,他直接帮我们生成了一个手绘风格的架构图,如果啊你想使用其他的 skill 啊,也是一样的啊,进到这个详情里面,然后把这个目录下载下来,拷贝到刚才那几个目录之下啊,然后你去问对应的问题,就可以自动识别并且调用这个 skill 了, 下面我们来一起尝试自己做一个 skill, 那 虽然 skill 的 开发门槛很低,但这不意味着我们就要自己去写 as topic, 官方呢,直接给我们提供了一个生产 skill 的 skill, 也就是这个 skill creator 啊,你不需要写一行代码或者说配置文件,你只需要用自然语言告诉它你想做什么,它就会自动为你生成一个符合标准的 skill 啊,然后啊,我们还是把这个包下载一下,然后我们解压这个包啊,我们看到这个熟悉目录啊,然后我们把这个包拷贝到我们刚刚的 open code 的 这个 skill 的 目录下, ok 啊,然后下面我们打开 open code, 然后我们重启一下啊,我们输入这样一段提示词啊,帮我创建一个可以获取当前系统时间的 skill 啊,然后写一个脚本,然后脚本使用 node js, 然后呢,他找到了这个 skill creator 的 这个 skill 啊,然后开始帮我们根据我们的需求创建这个 skill, 然后我们打开我们的编辑器。哎,我们发现多了一个这个 system time 的 这个 skill 啊,然后这个 skill 点 md 里面说明了啊,怎么去获取一个准确的时间啊,它要去调用这个脚本啊,然后这里面有获取系统时间的代码。接下来呢,我们询问一下 opencode, 帮我获取一下当前的系统时间。 哎,他找到了我们刚刚创建的这个 systemtime 的 skill 啊,然后给出了这个准确的系统时间。创建一个 skill 啊,就是这么简单, 即便你不懂代码,不懂 skill 内部的执行原理啊,只要你把你的需求描述的足够清楚,它就可以准确地生成一个 skill。 看到这呢,你可能会觉得 skill 和 mcp 是 不是有点像呢?它们似乎都可以做到按需加载给 ai 去扩展外部的能力呢, 这个也是很多同学可能会弄混的问题。在之前的教程中呢,我们详细学习过 m c p 啊,它就像是一个通用的 usb 接口,制定了统一的规范,不管是连接数据库、第三方 a p i 还是本地的文件等各种外部的资源,都可以通过这个通用的接口来完成, 让 ai 模型与外部的工具和数据源之间的交互更加标准化,可附用。那假如你的 a 阵能连接了多个 m c p 呢?它似乎也能实现按需加载, 根据用户的意图来决定调用哪个工具。但是这个按需加载的背后啊,代价是非常巨大的。那在 mcp 的 架构之下呢,仅仅是连接这个动作,就已经在透视你的上下文了。这个呢,也是由大模型的工具调用机制决定的, 为了让 ai 知道他有哪些能力可以用,每一个连接的 mcp server, 都必须在对话开始前,将他所有的工具的完整定义一次性的注入到大模型的上下文里面。 那每个 mcp 呢,一般都会包含大量的工具啊,比如说 github mcp server, 它自己就包含了三十多工具。假如说每个工具消耗五百个头肯,那只连接这么一个 mcp 就 需要消耗将近两万个头肯, 那在真实的环境下呢,一个 agent 不 会只去连接一个 mcp server 的。 假如啊,你只问了 ai 一个非常简单的问题, agent 已可能已经烧掉了大几万的头肯,这个成本是非常恐怖的。 那更深层的原因呢,也在于,连接过多的 m c p server, 也可能会导致大模型的注意力下降,从而降低工具调用的准确性。 那在我们之前的教程中呢,有讲过一个专门测试工具调用准确度的基准, m c p atlus, 在 这个基准中呢,包含了四十多个不同的 m c p server, 三百多个工具的复杂环境。那模型呢,必须自己去发现合适的工具,并且正确的调用。 目前最强的 cloud up 四点五啊,也只能拿到百分之六十二的准确率,那其他的模型的准确率呢,也普遍低于百分之五十,随着连接工具的增多,这个准确率还会进一步的下降。 而我们上面刚讲到的 skill 的 核心机制啊,间接是批漏,恰好是可以解决这两个问题的。在首次连接的时候,相比 m c p 需要将三百多个工具全部塞进模型的上下文模型,只需要加载四十个 skill 的 原数据啊,可能只消耗几千头肯。 另外呢, skill 采用的是漏斗式的引导啊,先通过目录判断大体的方向啊,确认要干活了,再加载具体的说明,最后通过找到详细的文档和脚本再执行,让 ai 每次只专注于当前的任务,即使是能力比较弱的模型啊,在这种机制下也能够保持比较好的准确率。 那看到这,你可能会问了, skill 看起来更智能,更节省资源,那 mcp 肯定不会被完全淘汰的,但是对它的需求可能会大幅减少。 首先啊, mcp 协议层的价值是不可替代的,因为它制定了一套标准的接口,统一了 api 连接世界的方式。那如果呢,你是一个通用的第三方平台啊,比如说高德地图,你想发布一个工具,让其他的 agent 都能用上你的能力,那首选呢?还是使用 mcp? 但是啊,如果你是有一些重复性的工作流,比如说啊,我要有固定的流程来读写本地的文件,要用一个标准的规范来 review 代码,有一套固定的风格来写文章。那这些场景呢,都推荐使用 skill 来实现。 那在过去呢,这些需求中的文件读写,连接 github, 给文章生成图片啊等等,这些需要连接外部世界能力的,可能都需要通过 m c p 去实现。那现在呢,你可以把它们都打包到 skill 里面。那未来的格局呢?可能是这样的,首先, agent 本身内置了一部分核心的能力啊,包括终端或者说文件的读写等等。 那少数通用的 m c p server 呢?负责连接远程的数据啊,比如数据库啊, api 等等。上层呢,还有大量的 skill, 封装了标准的工作流程,连接本地的知识库,那这些能力呢,也会在必要的时候进行协助,但是 skill 会承担绝大部分教 ai 怎么做事儿的工作啊,比如说啊,教 ai 怎么用这些 m c p server, 怎么用其他的 skill 啊,怎么调用好这些核心能力等等。好,本期视频呢,我们就先讲到这儿,大家已经了解了 agent skill 的 基本原理,以及如何使用和创建一个 skill, 如果本期教程对你有所帮助呢?希望得到一个免费的三连和关注。下一期啊,我们会进入实战章节,一起来使用 agent skill 实现一个知识库解锁的功能。相比传统的 ig, 它的效果究竟怎么样呢?我们下期见。

最近 ai 圈爆火的 agent skills 到底是个啥?今天用三分钟给你讲,看完直接上手用。我们先上结论, agent skills 呢,就是给 ai agent 配了一个工具箱,里面呢全是你常用的工具和操作流程, 关键是这个工具箱它是你自己设计的。我们先来看一下这张图,以前呢, agent 它只有单技能的这个 mcp 可以用,它没有操作手册,我们呢,就只能自己手把手地去指挥 ai, 去调工具干活。在这种情况下呢,遇见相同的任务,就会经常地给 ai 发送重复的指令, 你说一句他动一下,而且每次都得重复说。现在呢,我们有了 agent skills 这样一个组合技能以后,我们就可以直接把那些常用的重复的操作写进这个 skills 里面,我们就像给 ai 做 sop 的 手册一样,下次呢,再遇到同样的活, ai 呢,它就会自动帮你干了, 你也就再也不用重复的折腾了。比如我这里列了三个技能,第一个技能,你看我们每日的热点筛选, 以前呢,我们都是逐个的让 ai 去做,或者自己搭一个工作流去弄,那这样的话门槛就高了。现在呢,直接可以把搜索分析、写报告、发邮件这样的步骤给他按照步骤执行就搞定了。 还有第二个技能,财报分析,找数据分析,评估预判风险,用代码生成报表。还有第三个技能,海报设计,你把你的公司的品牌规范设计要求都放进去,然后让 ai 按照要求去设计海报,我们呢,就可以把这些常规的动作都给他 打包进这个 skills 里面。如果这个不太好理解呢,我这里再举了一个游戏的例子,这张图呢,玩过王者荣耀的应该都比较熟悉了,你看王者呢,每一个英雄都会给他三到四个技能, skills 呢,相当于就是把这些技能给他配了一个固定的连招,比如三一二 a。 编好以后呢,我们再给他绑定一个咒语,下次呢,只要你一念这个咒语,他就会自动释放这个技能的。当然啊,现在的王者是没有这个功能的,我这里呢,就举个例子,方便大家理解。接下来呢,我们再来看一下这个 skills 他 具体长什么样子。 一个完整的 skills 呢,它主要包含以上四个文件,其中它的核心文件就是这个 skill md 了,我们来看一下它具体长什么样。那一个 skill md 呢,它主要有两部分构成,这个以上部分呢,是它的第一部分,也就是它的核心,然后第二部分呢,就是这一块, 就是他的内容。像第一部分这里呢,主要我们就要描述他的技能名称,还有这个技能的功能有哪些,以及什么时候去调用他。那下面这个部分呢,我们就描述指令使用场景,具体执行步骤,还有以什么格式输出,然后给他一个 demo 例子作为参考。 这里呢,我们就不详细的去聊了,感兴趣的小伙伴可以截个图。这里呢,我再补充一点,看,我这里提到了热点,需要根据我的人设进行匹配分析,那这个人设呢,我们就可以把它写进这个参考文档当中,那 ai 呢,就会从这个参考文档去读取人设内容去进行分析了。 如果你想对 skill 进行深入的了解,我们还可以打开这个 cloud 官方开源的 skill 的 仓库,自己进去看一下,它提供了很多模板,大家可以看一下它具体是怎么写的。那最后呢,我们说一下如何使用啊? 像现在除了 cloud code 以外呢,像 coser 去 open code 还有 codebody, 它们都已经把 skill 集成进去了,而且呢官方都有说这个东西具体怎么用,今天呢,你就可以把这个工具下载下来, 然后把你反复使用的那些操作写进 skills 里面来解放你的生产力。如果你用的是确的话,你看用这个就很简单了,你可以直接通过提示词告诉他,帮我去创建一份能审查我的代码效果问题的 skills, 然后呢 他就会去给你生成一个 skills 的 模板文件,看这里面的内容都写了,你遇到不符合的你自己修改就可以了。如果你觉得用代码来处理比较麻烦呢?他也提供了这种直接新建文件的方式, 就按照他的要求去填写就 ok 了。好了,我们今天的分享就到这里了,你也可以在评论区把你想写进 sketch 的 东西在这里分享出来,我们大家一起讨论,我们下期再见,拜拜。

扣子在二零二六年啊,全新的更新,二点零的版本,无论是整个页面还是功能啊,都焕然一新,同时增加了非常多的 agent skills 供我们去使用,可以自动化的搭建工作流和智能体。当然手动搭建工作流的方式依然存在,还是同样的网址啊,但是整个的页面会发生了很巨大的变化。首先啊,我们左侧是你的图标,然后在这里边 默认会有一个新建的对话,这个对话就是这个位置啊,当然了,我们想做任何的事情都可以在这里边去发布消息。那其实这次更新的最主要的就是这里边有一个技能商店,就是我刚才提到的 agent skills, 它这里边有非常多的技能啊,你可以点开它,然后 这里边我测试了一个新年的绘本啊,当你直接点击它,然后呢,第 第一步你需要安装,安装完成之后再点使用,他就会跳转这个页面,然后你看这个对话框里边啊,就会有这个技能了,那么你直接在后边输入内容就行了。那我的测试是说,在这里边我只输了一个,给我设计一个 哪吒故事的儿童绘本,你看他经过他的思考和处理之后,最终给我生成了这样的一个内容啊,那么在这里啊,我们可以直接点击自动播放看一下,同时啊,你还可以一键打印啊, 自动播放太乙真人,用莲花、莲藕和荷叶为哪吒重新塑造了身体, 莲花绽放,哪吒重生了,比以前更加英俊强壮。 哪吒骑着风火轮要去教训东海龙王, ok, 可以 暂停一下,有声音,有画面,同时我们可以啊手动的去看一下他产出的内容, 这个就是我们扣子的一个非常大的更新啊,那其实啊,在我们的技能商店里边有非常多的技能,你可以去点开它去使用啊,但是有的地方你需要去仔细看一下,好吧,那么在这里啊,你直接点击这个技能,然后啊直接点击安装, ok, 然后我们现在再点击一下使用,在这里边历史课间生成,你想生成什么样的历史,你就直接输入就好了,比如说明朝的, 汉朝的好不好,唐朝的都可以啊,这里边就是快速的使用 agent skills 这样的功能啊,来帮我们生成内容。那么其实最重要的一点还是在 cos 编程里边,当然不要被它的名字所吓到啊,点开它你会发现这里边有一个新的界面了,对吗?点击右上角啊,你可以展开它, 这里边会有非常多的内容,跟我们之前的扣子的页面是有不同啊,这里边可以通过一句话,自动的搭建智能体工作流网页,移动的应用,还有技能, 如果这个页面你看着不舒服,你可以返回到旧版啊,当我们点击返回旧版的时候,他就会返回到我们原来的扣子的页面了,那么在这里啊,还有一个更新是说 你看这里边 ai 编程对话可以免费七天啊,在这里边他有一个套餐的升级啊,右上角点击这个按钮啊, 没有更新之前啊,我们用到的都是个人进阶版,那如果说你对于资源点有需求,或者功能上有需求啊,你可以看一下这两个内容啊,同时啊,还有企业的版本, ok 也在这里啊,大家根据情况去设定就好,其实整体的更新呢,我觉得是增加了非常多的 agent skill, 还有呢就是它还是可以我们手动的去构建工作流的啊,在我们这里边有个资源库啊,你直接点进去,其实这里边就可以构建工作流,点击资源找到我们的工作流。 那其实跟我们老的版本啊,返回旧版,其实它的逻辑是一样的,依然是在资源库里边创建工作流。 同理啊,也可以创建我们的智能体和应用,这个就是它的一个更新啊,其实我们可以着重的去尝试一下金融商店里边的这些技能啊,还有扣子编程里边的这些,通过一句话怎么去搭建智能体和工作流?