粉丝12.2万获赞40.2万

二零二五年十月十六号, anthropic 正式推出了 agent skill。 起初官方对它的定位相当克制,只是希望用它来提升 cloud 在 某些特定任务上的表现。但大家很快发现,这套设计实在是太好用了,因此行业里很快就跟上了节奏,包括 vs code、 codex、 curser 等工具都陆续加入了对 agent skill 的 支持。在这样的背景下,十二月十八日, anastropics 做出了一个重要决定,正式将 agent skill 发布为开放标准,支持跨平台、跨产品服用。 这意味着 agent skill 已经超越了 cloud 单一产品的范畴,正在演变为 ai agent 的 领域的一个通用的设计模式。那么这个让大厂纷纷跟进的 agent skill 到底是解决了什么核心痛点?它和我们所熟悉的 mcp 又有着怎样的区别和联系呢? 今天这期视频我们就分几个部分彻底讲清楚这个 agent skill。 我 们首先从 agent skill 的 概念出发,也就是给大家讲明白 agent skill 到底是个什么东西。然后我来给大家演示一下它的基本使用方法。 在了解了基本用法之后,我们再来看看它的高级用法。高级用法一共是包含两块,分别是 reference 和 script。 最后,我会把 agent skill 和 mcp 做个比较,告诉你到底应该选哪一个。 好了,话不多说,让我们直接开始哦,不好意思,只是想证明自己不是 ai, 那 我们现在真的要开始喽。 那什么是 agent skill 呢?用最通俗的话来讲, agent skill 其实就是一个大模型,可以随时翻阅的说明文档。 举个例子,比如你想要做一个智能客服,你可以在 skill 里面明确交代,遇到投诉得先安抚用户的情绪,而且不得随意承诺。 再比如,你想要做会议总结,你可以直接在 skill 里面规定,必须要按照参会人员一提决定这个格式来输出总结的内容。这样一来,你就不用每次对话都去重复粘贴那一长串的要求了。大模型自己翻翻这个说明文档就知道该怎么干活了。 当然,说明文档只是一个为了方便理解的简化说法,实际上 agent skill 能做的事情要远比这个强大,它的高级功能我们待会儿就会讲到,不过在目前的起步阶段,你就把它当成是一个说明文档就行。下面我就用会议总结这个实际的场景,带大家看看它到底是怎么使用的。 这里我们使用 cloud code 来演示如何使用 agent skill。 要想使用 agent skill, 那 当然是要先创建一个了。 根据 cloud code 的 要求,我们需要在用户目录下的 dot cloud skill 文件夹创建我们的 agent skill。 所以呢,就让我们先进入到这个文件夹中,然后执行 maker 会议总结助手来创建一个文件夹,这个文件夹的名字就代表了我们 agent skill 的 名字,然后再使用 vs code 来打开这个文件夹,这样的话我们编辑文件会更方便一些。打开这个文件后,我们在里面创建一个叫做 skill 点 md 的 文件, 然后填好这个文件的具体内容就是这样了,每一个 agent skill 都需要有这么一个文件,它用来描述这个 agent skill 的 名称,能干什么事以及怎么干这个事情的。比如我们这里要创建的 agent skill 就是 用于总结会议目录内容的, 它的 skill 点 m d 一 共分为两部分,头部的这几行被两段短横线包起来的是叫做原数据,英文叫做 matte data, 这一层就只写了 name 和 description 这两个属性。 name 呢是 agent skill 的 名称,必须与文件夹的名字相同。 name 的 下面呢是 description, 它代表这个 agent skill 的 描述,主要是向大模型说明这个 agent skill 是 用来干什么的。然后再看下面剩余的部分,这个呢就是具体的 agent skill 的 说明了, 官方把这一部分呢是叫做指令,对应的英文是 instruction, 这一部分就是在详细描述模型需要遵循的规则。比如说你看这里,我规定了它必须要总结参会人员议题和决定这几个方面的内容, 然后为了确保他真的理解了,我这里还举了一个例子,输入的是会议的录音内容,然后输出的呢就是我们所需要的格式了。好,现在我们的 agent skill 应该是做好了。对,就是这么简单,就是一个说明文档, 下面我们打开 cloud code 来验货,首先随便找一个空目录,打开 cloud code, 然后输入下面这个问题,你有哪些 agent skill? cloud code 给我们回答了,可以看出他已经发现了我们写好的 agent skill。 然后我们来看看 cloud code 是 怎么使用这个 agent skill 的。 我们输入请求总结以下会的内容,然后粘贴一段会议录英文本回车,让我们看看 cloud code 会如何应付我们这个问题。 好, cloud code 有 反应了,大家注意看屏幕,这里 cloud code 并没有直接开始下编,他根据我的指令意识到了这事归我们刚才上传的那个 agent skill 管,所以呢,他是在向我询问能不能使用这个 agent skill, 那 我们当然是同意了。同意之后,他就开始读取我们写的那个会议总结助手了,主要就是读取其中的那个 skill 点 m d 文件,让我们稍作等待 好,结果出来了,参会人员议题决定三点都清清楚楚,这完全符合我们在 skill 里面定的规矩。这个呢,就是 agent skill 的 基础用法了,是不是很简单?现在你知道了如何创建和使用 agent skill, 那 不妨让我们想想刚才到底发生了什么。 首先,整个流程中一共有三个角色,用户 cloud code 以及 cloud code 的 背后所使用的大模型。在我们的例子里,这个就是 cloud 模型 流程一开始的时候,用户会输入请求,此时 cloud code 会把用户的请求连同所有 skill 的 名称和描述一起发给大模型。注意,这里只带了名称和描述, 也就是我们前面所说的 skill 原数据层。虽然说我们之前只演示了一个 skill, 但是你可以想象一下,哪怕你装了十几个 skill, 此时的大模型呢,也只是在看一份轻量级的目录, 因为毕竟只有名称和描述嘛。在接到了用户请求和每一个 skill 的 名称描述后,大模型会发现用户的请求呢,可以使用会议总结助手这个 agent skill 来解决, 此时呢,他就会把这个信息告诉 cloud code。 cloud code 接到大模型的响应之后,会去会议总结助手那个目录里面读取完整的 skill。 md 正文儿对,这个时候读取的呢,才是 skill md 的 全部内容,之前就只是名称和描述, 而且要注意,他只读取了会议总结助手这一个 agent skill 的 内容哦。在拿到了会议总结助手的 skill md 内容后, cloud code 会把用户的请求和完整的 skill md 内容发给大模型, 大模型会根据 skill 点 m d 的 要求来生成响应,并且把响应发给 cloud code, cloud code 进而呢,会把这个响应发挥给用户,这样呢,用户就会看到结果了。 这就引出了 agent skill 的 第一个核心机制,按需加载。虽然 skill 的 名字和描述是始终对模型可见的,但具体的指令内容只有在这个 skill 被选中之后才会被加载进来给模型看,这个呢,就节省了很多的 token 了。 前面我们讲了,一开始 cloud code 会把所有 agent skill 的 名称和描述都给到模型,比如说什么爆款文案 skill、 会议总结 skill、 数据分析 skill 等等, 模型呢,会从中选择一个,之后只有选中了那个 skill 的 skill 的 md 文件才会给到模型。说白了呢,就是按需加载, 这个呢,已经很省 token 了,但是它还不够极致。大家试想一下,我们的会议总结助手可能会越来越高级,我们希望它不仅仅是简单复述,而是能够提供更有价值的补充说明。 比如说,当会议决定要花钱时,它能直接在总结里标注是否符合财务合规,当涉及到合同时,它能够提示法务风险。这样大家在看会议总结的时候,就不需要再去翻规章制度,一眼就能够看到这些关键的补充信息,这就非常方便了。 但问题在于, skill 能做这些事情的前提是它要把相关的财务规定和法律条文都写入到 skill 点 m d 文件里,这些文件可能会非常长,都写进去的话, skill 点 m d 文件就会变得无比的臃肿, 哪怕只是开个简单的早会,都要被迫加载一堆根本用不上的财务和法律。废话,浪费模型资源。 那能不能做到暗虚中的暗虚呢?比如说,只有当会议内容真的聊到了钱, cloud code 才会把财务规定加载给模型看。 其实这个呢,也是可以的, agent skill 呢,提供了 reference 的 概念,干的就是这个活,让我们来试一下。首先我们来给它加一个文件,也就是 agent skill 术语里面的 reference。 我们把这个文件叫做集团财务手册,里面写明了各种费用的报销标准,比如说是住宿补贴五百一晚,餐饮费人均三百一晚之类的。然后我们在原来的 skill 点 m d 文件里面新增一个财务提醒规则,里面写明仅在提到钱预算采购费用的时候出发。 出发的时候呢,需要读取集团财务手册,点 m d 这个文件,根据文件内容指出会议决定中的金额是否超标,并明确审批人,这就可以了。我们回到 cloud code 这里再试一下。 这次我们的请求仍然是总结下这个会议的内容,不过呢,这次使用的会议内容稍微换了一下, 这段对话呢,我们就不细看了,你只需要知道,在这段对话里面,老陈让小李订一千二百一晚的酒店,这涉及到了钱。按道理来说, cloud code 应该触发我们刚才新增的财务提醒规则,让我们看看 cloud code 能不能意识到这一点。 首先, cloud code 意识到了这个请求跟我们的会议总结助手相关联,请求使用这个 agent skill, 我 们同意。 然后他意识到了这个会议跟钱相关,根据 skilled md 文件的指示,他请求读取集团财务手册,这个文件用于查看里面的财务合规信息,这个呢,我们也同意。 最后,他根据实际的会议内容生成了总结,可以看出,总结中不仅包含参会人员、议题、决定等基本信息,还包含了财务提醒,这完美符合我们的需求。 这个呢,就是 reference 的 核心逻辑了。在 agent skill 的 体系里面,集团财务手册点 m d 这个文件就是一个典型的 reference, 请大家记住它的特性,它呢是条件触发的。 在刚才的例子里面,只有当 cloud code 读取完 skill 的 md 文件,判断出需要查账时,才会去加载这个文件。反过来说,如果这是一个跟钱无关的技术复盘会,那么这个财务文件就只会躺在硬盘里面,绝不会占用哪怕一个 token 的 上下文。 好,讲完了 reference, 接下来我们来讲讲如何让 agent skill 跑代码,毕竟查资料只是第一步,能直接动手运行代码,帮我们把活干了,这才是真正的自动化。这个呢,就用到了 agent skill 的 另一大能力, script 让我们在文件夹里面创建一个 python 脚本,文件名就叫做 upload 点 pi, 用于上传文件。之后我们填好这个代码文件的内容,然后我们来到 skill 点 m d 这个文件里再加上一段关于上传规则的描述, 如果用户提到了上传同步或者是发送到服务器这样的字眼,你必须运行 uploader pi 脚本,将总结内容上传到服务器。然后呢,我们来到 cloud code 这边,输入请求,总结下这个会议的内容,并把它上传到服务器中,然后我们粘贴会内容。 跟之前一样, cloud code 意识到了这个请求与我们的会议总结助手相关,所以呢,他请求使用这个 agent skill, 我 们同意,然后他把会议的总结内容输出了出来,并准备上传到服务器中,他请求执行 up 六点 pi 文件来实现这个功能,我们也同意 好,上传成功。而且 cloud code 还把上传相关的一些信息也展示了出来,非常棒。 这里面呢,有个小插曲,大家注意一下,我这次所使用的会议内容跟钱其实没什么关系,所以 cloud code 呢,也并没有去读取集团财务手册那个文件, 结果中呢,也没有财务提醒相关的内容。这正好印证了我前面所说的观点, reference 是 按需加载的,如果用户没有提到与 reference 相关的内容,那 cloud code 是 不会去读取它的,这样就达到了节省上下文 token 的 目的。 好让我们再回到代码执行部分,注意看这里, cloud code 申请执行这个 uploader pie 文件,它并没有去读取这个文件。没错, agent skill 里面的代码只会被执行,不会被读取。 这就意味着,哪怕你的脚本写了一万行复杂的业务逻辑,它消耗的模型上下文呢,也几乎是零。 cloud code 只关心脚本的运行方法和运行结果,至于这个脚本的内容,它可以说是毫不在意。 所以呢,虽然 reference 和 script 都属于 agent skill 的 高级功能,但是呢,它们对于模型上下文的影响其实是截然不同的。 reference 是 读,它会把内容加载到上下文里面,所以呢,是会消耗 token 的。 script 呢,是跑,它只会被执行,不会占用模型的上下文。讲到这里,我们需要停下来稍微做个总结,聊一聊 agent skill 的 渐进式批漏机制。 agent skill 的 设计其实是一个精密的渐进式批漏结构,这个结构里面一共有三层,每一层的加载机制都不太一样。 第一层是原数据层,这里有所有的 agent skill 的 名称和描述,它们是始终加载的,相当于大模型里面的目录。大模型每次回答前都会看一下这一层的信息,然后决定用户的问题是否与某个 agent skill 相匹配。 第二层是指令层,对应 skill 的 md 文件里面除了名称和描述之外,其余的部分,只有当大模型发现用户的问题与某个 agent skill 相匹配的时候,它才会去加载这一层的内容。所以呢,我们称这一层为按需加载。 第三层是资源层,这个呢,是最深的一层,它一共是包含 reference 和 script 两方面的内容。其实按照官方最新的规范,应该还有一个组成部分叫做 assets, 不 过我看了一下,它跟 reference 的 定义似乎有部分重叠,因此我们这里先忽略它。 好,我们刚才例子里面的集团财务手册和 uploader pie 脚本就属于这一层,只有当模型发现用户问题与财务或者上传相关的时候,它才会去加载这一层的内容, 这就相当于是在按需加载的指令层基础上又做了一次按需加载,所以我们可以称它为按需中的按需加载, 当然这是我起的名字啊。 reference 和 script 的 加载方式其实不太一样, reference 是 被读取的, cloud code 会把对应文件的内容放到模型的上下文中,一共回答式参考。而 script 是 被执行的, cloud code 根本就不会去看代码的内容,它只关心代码的执行结果。 当然这个也不是铁律啊,如果你没有把代码的执行方法说清楚, cloud code 还是有可能会去看一下代码的,毕竟跑不下去了嘛,这样的话呢,就会占用模型的上下文了。所以还是请大家写 skill 的 时候尽可能的把一切都解释清楚。 那聊完了 agent skill 的 用法,很多朋友可能会有种似曾相识的感觉, agent skill 好 像是跟 m c p 有 点像啊,本质上都是让模型去连接和操作外部世界。既然功能重叠,那我们到底应该用哪一个呢? 关于这个问题,按 serapic 官方写过一篇相关的文章来解释,核心观点就一句话就在这里, mcp connects cloud data skills teach cloud what to do with that data。 这句话可以说是直接点明了 mcp 与 agent skill 的 区别,它其实就是在说 mcp 给大模型供给数据,比如说查询昨天的销售记录,获取订单的物流状态等等。 而 skill 是 教会大模型如何处理这些数据的,比如说是会议总结必须要有个议题啊,汇报文档必须要包含具体的数据啊等等。到这里,有些同学可能就会问了, 不对啊, agent skill 里面也能写代码?我直接在 agent skill 里面写连接数据的逻辑不就好了吗?这样呢,就不需要 mcp 了, agent skill 就 直接把这两个活都给干了。 确实啊, agent skill 也能连数据,功能上与 mcp 有 所重叠,但是能干并不代表适合干, 这就好像是瑞士军刀也能切菜,但没有人会这么干。我们这个场景呢,其实也是这样, m c p 本质上是一个独立运行的程序,而 agent skill 本质上是一段说明文档,它们的本质不同决定了适合的场景也是不同的。 agent skill 更适合跑一些轻量的脚本,处理简单的逻辑。在代码执行方面, agent skill 的 安全性和稳定性都不及 mcp, 所以 大家还是要根据场景选择合适的工具。甚至在很多的场景下,我们需要把 agent skill 和 mcp 结合起来一起使用,以便尽可能的满足我们的需求。 好,今天的视频呢,就到此结束了,我是马克,用最通俗的语言讲最硬核的技术。如果我的视频对你有帮助,欢迎点赞订阅,我们下次再见,拜拜!



好,这节我们继续来学习 cloud 当中的 skills, 那 上一节当中我们学习的如何使用 ui ux pro max 这个项目去开发一个这样的 ui, 那 其实啊,整体流程大概是这样子,对吧?我们分布一个任务,然后 ai 读这个 skills 文件,最后去通过这个脚本查出当前样式,最后返回给你。那上一节呢? 嗯,没看的小伙伴可以去看一下。好吧,这一节我们就不过多追述了,我们这一节呢,主要是给大家分享一下,就是关于 cloud skills 是 如何去使用的,因为我发现很多小伙伴有这方面疑问,就是什么是 skills 以及 skills 呢?它能够给我们的 cloud code 带来什么?或者给我们的 cloud 的 模型带来什么,对吧?首先我们先要明确一个, 首先我们需要明确一个概念,就是,呃, skills 呢,实际上是给 ai 加装的一个插件,类似一个插件,你可以理解为它是一个 prompt 的 集合, 需要按顺序加载,能够帮助你提高你的效率。那相比于 m c p 呢?它不需要去调用一些外部的工具,它只是单纯的一段题的词,仅此而已。好,我们开始走什么 skills? 我 们刚说了,本上 skills 呢,就是一个文件夹,这个文件夹里面包含了指定脚本资源, cloud 呢,会按需加载,就是这个指令,什么时候需要使用这个指令,它会自己去找。什么时候需要这个脚本呢,它也会自己去找。那这时候呢, cloud 呢,是完全自动地接管了你的这个啊,这个权限,然后去,哎,去掉这个 skill, 哎,我该干什么干什么,所以你可以在这个 skill 里面去写,哎,你需要干什么?简单来说,对吧,给 cloud 加技能包, 让 cloud 变得更聪明,那这四个特性大家简单看一下就行了。好吧,我们就往下走,那下面我们来简单说一下, cloud 目前有三种分类,第一种呢是个人技能,也就是说你这个 skill 呢,你的所有项目 都可以使用,比如说我现在配置的一个全职的 skills, 对 吧?那你需要配置在这个点, cloud 杠 skills 下面,这是一个全职的技能,也就是你所有的项目啊,都可以去使用这个 skills, 而不仅仅局限于某一个项目。 第二个是项目级别 skills, 也就是说你这个 skills 呢,只对当前的这个项目的跟目录下面的所有文件生效。哎,秃了这个文件,对吧?它就不生效了,懂我意思吧?第三个是插件的插件也是一样的,就是你安装之后,你所有项目也是一样生效,只是说你可以随时卸载它。好吧, 我们继续往下走啊,首先我们要去使用 skills 呢,需要去插件市场安装一下啊,下面我给大家演示一下。首先我们打开 cloud code, 那 这里呢?我去,哎,去清空一下啊,这时候如果说我需要安装 skills, 你 可以执行这条 mini, 哎,去安装一下 astroc 的 这个 skills 啊,因为我这里呢,要叫有个窗口,我就发跳价哦,我直接发进到高度的 啊。然后这个时候我们再执行这条 mini, 这是那个 cloud 当中的一个 plugin mini 插件 mini 回车啊,这时候我们可以看到,对吧?它在添加这个 skills, 你 看 这个 skills 呢,它是存在 astropica 的 官网,所以呢,它通过 get 啊,给它下载下来啊,就就安装完成了,就安装这个配置,就安装完成了, 好吧,那这里我们就退出了,好吧,那我们可以选择去,哎,可以去安装你的插件,也可以选择去卸载你的插件,好吧,这时候我们就安装完成,之后呢,那 这时候我们就可以使用 skills 了,就这么简单。那这个默认的 skills 里面有什么东西呢?很好的一个问题,它目前提供了两个问题,第一个是 document, pdf 文件之类的, 第二个是一些视力技能包,比如说 m c, p 啊,视觉之类的,就是官方提供了两个 skills。 好, 这时候我们可以就可以去掉这个 skills。 好, 看它是不是创建成功了,比如说,哎,请你给我创建一个学生管理系统需求的啊,文件使用 skills 啊,这是这是 student 点 pdf, 它就这样子,它会给你一个 pdf 文件,那用到 skills 呢?其实这个 cloud code 呢,也会告诉我们是不是用到了这个 skills, 我 们可以看一下 啊,这时候你可以看到是否使用这个 skills, 也就是用这个 pdf 的 skills, 也可以看到这个地方出现这一段话,就是我们用到了什么,用到了第一个 skills, 这个 skills 呢,因为有一个 pdf 文件,那这时候我们可以选择 yes, 也可以选择,哎,下次不提醒它,我们选择, 那这时候我们可以的话就去调这个 skills 了,然后呢,哎,这个 skills 里面呢,因为本身就包含了这个这个命令,所以呢,你看它会自动去执行这个命令,我们并没有跟他说,哎,你要执行某一个命令,使用什么什么库,为什么?因为它的这个 skills 里面就包含了 pdf 的 操作。好,最后总结一下,对吧?所以我们实际上就是将 啊 astroc 它整理的一些啊技能包在这个 prompt 当中啊,给你声明好了,这些啊,比如说调 pdf, 它需要用到哪些工具,需要用到哪些题的词,对吧?它需要用到哪些插件,哪些库,对吧?它都给你整理好了,所以呢,这个时候我们就可以啊,去看到这个啊,这个目录下面会有一个这个 pdf 相关的技能包啊,类似于我们之前学习这个 啊 kilo 的 时候,你看是不是?我们学习 kilo 时候是不是讲过,对吧?是不是有一个 skill, 你 看这 skill 嘛,它会声明你用的是什么 python 什么的啊,什么样的版本,那就那么一个意思,好吧,好,最后呢,安装完成会保证这个目录下面我们先不讲啊,这里我们就我们可以看到就用了这个 skill, 我 们就跳过这样,我们执行完成之后还会确实会给你生成一个 pdf, 类似于人家已经封装好的 prompt, 好 吧, 这时候我们就明白了,对吧?当我们使用 skills 的 时候呢啊, cloud 会自动加载这个 pdf skills 以及文档分析 skills, 最后输出给你一个结果,而不是全部加载上下文中,有效节省头壳,就就是类似于那个 cloud 的 一个机制,好再往下走呢,其实我们和 mcp 的 一个区别是什么?就我们可以看到,对吧? m c p 呢,是外部提供的应用工具能力,而 scuse 呢,更像是去教模型如何使用工具,在那个结识当中去声明,哎,声明我到底该怎么做,对吧?引导他去执行啊?教模型的一种方法,一般来说我们会通过 m c p 和 scuse 协调工作,最后呢,再通过 scuse 引导去来最终执行。好吧,那这个,这个是什么意思呢?这是斜杠命令啊,意思啊, 所以呢,它也是一个区别。好吧,好,那就本期视频的全部浏览。如果呢,你也对这种 sku 感兴趣的话,不妨去试一下。那通过这个杠 prang 的 插件,对吧?去选择你要安装的插件,包括这个管理所需要的插件。那正常的一个 sku 目录呢?是一个这样的目录,比如说文档啊,文档里面有这个,这个角落会写在这里面啊,资源会写在这里面,它就有一个清晰的分类,这就是所谓的 sku, 那 包括我们也可以看到,对吧?它全程在使用这个 sku 来去执行,我们并没有去插手。好吧,好,那就本期视频的全部浏览,我是小刘,我们下期再见。

如何在 obsidian 中使用 cloud skill 实现一个 ai 智能体? obsidian 的 ceo stefan 最近发布的三个 skill, 你 用上了吗? 我先来做个展示,如何用一句话让智能体下载 youtube 视频,并总结视频内容,刊写知识笔记,然后在无线画布中画出知识结构图。在 obsidian 界面中,我向 ai 发送了一个 youtube 视频链接,这个视频是油管著名博主单口大神的一条视频, 我让 ai 帮我下载这个视频的文案内容,然后提取视频的核心知识点,并刊写一篇带有 obsidian 专属于法的 macdonald 知识笔记, 然后根据视频的知识内容,在一幅无线画布上画出知识结构图。 ai 在 接收到指令后,先调用了 youtube transcript 这个视频,转录 skill, 下载了视频文案, 然后调用了 obsidian markdown 这个 skill, 拣写了一篇 obsidian 知识笔记,然后调用 jason combs 这个 skill 在 无线画布上画出了视频的知识加固图。后面的两个 skill, 也就是 obsidian markdown 和 jason combs, 就是 obsidian 的 ceo stefan 最近发布的三个 skill 中的两个。 我们来看一下生成的内容。首先是 obsidian 知识笔记,可以看到知识笔记带有详细的元素句区,并且含有 obsidian 专属的 callout 语法。 我们打开当前笔记的关系图谱,就能看到笔记中的双向链接。然后我们来看一下 ai 绘制的无线画布, 可以看到视频的知识架构被清晰的整理到了无限画布中,甚至还带有原视频的链接。那有了这样的智能体能,为我们省下很多重复性劳动,让我们能够专注在学习和思考上。 今天我就用一个视频教会大家这个智能体的实现步骤,整个流程非常简单,具体步骤和相关知识点还有提示词我都整理成了知识笔记,最后会分享给大家。 首先我们来快速安装一下相关的环境。首先是 cloud code, 关于 cloud code 和 cloud skill 这部分内容在我的上一期视频中已经讲得很详细了。如果你还不知道 cloud skill 和 cloud code, 我 强烈建议大家回看我的上一期视频。那么这里我就快速的过一下安装流程。 我们先安装 windows, 直接去官网下载,然后双击安装即可。打开命令行,通过一行命令来安装。卡洛克,如果你在这一步有网络问题,可以使用网络加速,或者使用国内的 npm 镜像。具体的做法是在命令行后面添加额外的参数, 具体的命令我也展示在屏幕上。安装完成之后,我们要把 cloud 的 ai 替换成兼容模型,因为 cloud 对 网络和地区的限制非常严格,且价格较贵。 目前国内的 ai 比如 deepsea、 智普 glm 都支持了 ospec 的 api 接口。相关的官方文档我已经展示在屏幕上。 我们在命令行中分别输入这三行命令,来把 cloud code 的 ai 接口替换成智普 glm, 然后重启命令行,输入 cloud, 然后回车, cloud code 就 运行起来了。那么到此 cloud code 就 安装完毕了。 接下来我们来配置 obsidian, 这里我们需要安装一个插件,名字叫 cloud 点,是专门为 obsidian 适配 cloud code 的 插件,目前这个插件还没有正式发布到第三方市场中, 我们在 github 上找到 clouding 的 仓库,在 reedme 中能看到安装方法。我们手动下载三个文件,分别是 main 点 js, mainfast 点 json, 还有 style 点 css, 然后来到 obsidian 仓库所在的文件夹,在点 obsidian 文件夹中找到 plug ins 文件夹,然后在 plug ins 文件夹下创建一个叫 clouding 的 文件夹, 并且把刚才下载的三个文件放进去。然后我们打开 obsidian, 在 第三方插件界面把 cloudian 这个插件的开关打开, 然后来到设置界面,插件的设置界面有一些基础设置,比如 cloud 应该如何称呼你,这里我填 jason。 然后我们把滚动条拉到最下面,找到自定义变量,这里我们需要设置三个变量, 分别是 ai 的 u, r, l, a, p, i, t 和模型名称,那这里我们依然使用智普 g l l 模型,那你也可以使用 deep six 模型,那具体的参数我已经展示在屏幕上了。 设置完毕后,重启 off c 点,然后在键盘上按下 ctrl 加 p, 打开命令面板,输入 cloud 点,选择 open chat view 来打开 cloud 点的 ai 对 话窗口,在对话窗口中输入一个你好能看到 ai 返回结果,说明配置成功, 那么到此我们就完成了环境的配置。那接下来我们要把相关的 skill 放置进来。首先就是 obsidian ceo 发布的三个 skill, 我 们来到 github 搜索 obsidian skills, 找到 cappano 这个人的仓库,点进来,我们看到说明文档中已经说得很详细了,一共 seven skill, 分 别是 obsidian markdown, 用来拷写含有 obsidian 专有语法的 markdown 知识笔记。第二个是 jason canvas, 是 用来让 ai 帮你绘制无线画布 canvas 的 skill。 第三个是 obsidian basis, 是 让 ai 来帮你创建 obsidian 数据库用的。我们点击右上角绿色的 code 按钮,把整个仓库以 zip 压缩包的形式下载下来, 解压缩之后,把 skills 这个文件夹复制出来,然后来到我们的 obsidian 仓库所在的文件夹,找到点 cloud 这个文件夹,进入之后把刚才复制的 skills 文件夹拷贝进来,那么现在我们的 obsidian 就 已经有这三个 skill 了。 我们回到 abc 界面,在 abc 插件的 ai 对 话窗口输入斜杠 skills, 然后回车 ai 如果能够列出它所拥有的 skills, 那 么我们的整个流程就实现完成了。我的 ai 之所以有这么多的 skills, 是 因为我在 cloud code 的 全句目录下放了很多 skills, 大家可以回看我上一期讲 cloud skill 的 视频, 那么现在我们就可以让智能体来调用 skill 帮我们完成任务了。首先我让他用无线画布 canvas 来画出有关地中海饮食的知识结构图,并把生成的无线画布文件保存到 opposite 仓库的根部部。 我们可以看到 ai 在 接收到指令后,马上选择使用 jason canvas 这个 skill, 经过一段时间的思考之后,画出了知识库的根目录中。我们点开这个无线画布来看一下, 可以看到 ai 画出了地中海饮食的知识框架,并使用不同的颜色模块进行了分组。那么到此我们就成功在 office 界面中调用 cloud skill 来实现智能体功能了。 如果你想要为自己的智能体安装更多的 skill, 可以 到 github 上搜索相关仓库,比如 awesome cloud skill 这个仓库,以及 ospec 官方 github 仓库相关内容大家可以回看我们上一期视频。 这里我想额外说一个问题, stefan 发布的这三个 skill 是 全英文的,如果你向 ai 发送中文指令, 大模型在匹配的时候不一定每次都能精准地认识到应该使用哪个 skill, 那 解决的办法也有很多,你可以在提示词中明确要求它使用某一个 skill, 也可以来到 clouding 插件设置界面中的系统提示词选项, 在系统提示词中,要求 ai 在 接受到用户指令后,优先思考应该使用哪个 skill。 那 这样一来,你的 ai 有 了 skill 的 加持,就能变得更加智能,对特定任务也会完成的更加精确。对于 obsidian 的 ceo stefan 发布的这三个 skill, 我 个人认为更多的是代表官方的态度。 dolphin 他 没有发布在 obsidian 官方的 github 上,而是发布在了自己的 github 账号上。可以看到 minimo 这个外观主题也是在他的这个账号上发布的,因为他是这个主题的作者嘛。至于他之前接受采访中所传达的理念,可以说是知心合一的。 之前的采访中他说过,出于隐私等因素, obsidian 对 于发布官方 ai agent 的 持谨慎态度,这一点是不同于 notion 的。 由于 obsidian 的 文件隐私性,他鼓励用户自己去决定以什么样的方式使用 ai。 也就是说,你如果想要 ai 智能体,就自己手搓一个,而如今他自己亲自下场,带头手搓 agent skill, 并且发布在他自己的推特和 github 账号上,而不是官方账号, 这就非常符合他之前所传达的观点。 obsidian 不 像 notion 那 样环境是封闭的,限制那么多, obsidian 的 文件完全本地化,完全掌握在你自己手里,大家可以根据自己的需求,灵活地通过各种方式使用 ai。 那么今天的视频内容就到这了,大家现在就可以上手把 stefan 发布的 thank you 用起来了。视频中的内容和知识点我都整理成了知识笔记,大家可以在我的主页或频道信息中找到我的个人主页地址来下载资料,有任何问题都可以在评论区中给我留言,记得点赞关注,谢谢大家!


资源、指令和工具理解了这三个要素,你就理解了 agent skills。 一个月前,也就是二零二五年十二月十八日, anthrobi 正式宣布将 agent skills 发布为开放标准。今天我们不吹不黑,一条视频,讲清楚它到底是啥, 它和我们之前讲的提示词、工程、 m、 c、 p, 甚至知识库等等有什么关联和区别。 agent skills 顾名思义,就是让 ai agent 有 各种各样的技能,让他能做的事情更多。 首先我们思考一个本质问题,当你让 ai 帮你干活的时候,他内部到底发生了什么?现在你是一个超级大公司的 ceo, 你 的秘书是一个 ai, 你 对他说帮我根据去年营收写一篇全员信, 信中还要包含今年的目标,要符合公司规定,并且还要发送给全体员工。如果我们将整个流程的要素抽象出来,就不难发现, ai 的 工作需要资源,例如公司营收和设密规定 指令,例如规划今天的目标,并写一篇全员信。工具,例如通过邮件接口去发送给全体员工。那么在 agent skills 出来之前, ai 是 如何接受并处理这三要素的呢? 首先谈谈资源,其实也可以称为知识。我们常用的 ai 都是利用互联网上的公开数据训练出来的,那么像公司规范这些内部非公开的数据, ai 肯定无法获得,怎么办?以往我们的方法有两种,要么用这些非公开数据对模型进行微调训练, 要么就将它们放到一个知识库里,供 ai 查找调用。其次是指令,这个好理解,指令也叫提示词,提示词的质量往往决定了 ai 输出的质量,这也就是为什么大家之前一直在强调提示词工程, 还有就是工具。说到工具就离不开 mcp 协议,它允许 ai 使用外部的数据源和工具接口。比如我可以通过 mcp 协议调用 github 接口,让 ai 帮我将代码直接上传到 github 上。 也可以通过 m c p 协议调用电子邮件接口来让 ai 给其他人发送电子邮件。讲了这么多陈年老知识,可能你要问,这和 agent skills 有 什么关系? agent skills 其实就是一个将提示式工程、 m c p 甚至知识库融为一体的纠集缝合关。首先我们来看看 agent skills 结构,它分为三层结构,原数据、指令、资源 指令和资源。好像刚才都提到了,那么原数据又是什么?为了便于理解,这里直接给大家实操演示。如果大家安装了 cloud code, 在 主目录的点 cloud code 文件夹中,你可以找到一个 skills 文件夹,这里面就集成了 ai 所有的技能。 比如我已经实现了让 ai 写全元信的技能,这就是 agent skills 的 本质。在这个本质里面, skill 点 md, 这个文件就是整个模块最重要的部分。 第一部分,由三个横线包裹起来的部分就是原数据,它是对于这个技能的必要介绍,包含名称和描述,缺一不可。下面的部分称之为指令部分, 其实和系统提示词很像,它是内部规定好的,去指导 ai 执行任务的指令。在指令里面,我规定了 ai 需要执行三个任务,总结、营收、规划、明年以及写信。当然,为了确保它真正理解,我给了它一个视力, 现在让我们运行 cloud code, 输入我们的要求,并且给他去年公司营收情况,让他执行来看看效果。经过一段时间的思考后, cloud code 的 弹窗提示他检测到了有一个全员性助手的 skill, 问我们是否需要调用。 点击试,他就会按照我们预定义好的技能总结营收规划明年,并且写好信件。但是显然还有两件事情他并没有完成,一是没有参考公司规范检查信件内容,二是没有将信件通过邮件发送给全体员工。 这就涉及到了 agent skills 结构中的第三层,资源层,我们前面提到的三要素中的资源和工具都属于这一层。比如,我们要求全员性的助手能够参考公司规范。首先,我们要在文件夹下新建一个公司规章制度点 md 的 文件,然后将准备好的内容粘贴进去。 随后,在 skills 点 md 中,我们需要加上一个声明,要求信件必须满足公司规章制度的规定。 此外,为了让这个全员性助手能够将写好的信件发出去,我们还需要在文件夹中新建一个 email 点 p y 的 脚本, 我们将预先准备好的脚本内容粘贴进去,然后再在 skills 点 md 里面新增一个发送邮件的功能规定,如果指令里包含发送邮件等字样,则必须执行该脚本。 现在我们再执行一次 cloud code, 看看会发生什么。这一次,当我们输入指令,选择执行全员性助手后,他会先开始查看公司规章制度点 md 这个文件,确保生成的信件内容符合要求。生成信件之后,他又开始执行发送邮件的脚本, 通过最终的任务完成总结,我们发现,这一次这个小助手不仅帮我们生成了信件,他还识别到了一些违规内容。 原来我们原始的指令里面存在着公司规章制度不允许出现的返点等信息,这次小助手自动帮我们删除了返点信息相关的内容, 并且他还识别了发送邮件的指令,去调用了发送邮件的脚本,这就是完整的 agent skills 工作流。 那么你可能会说,这也没什么新技术,不就是把之前的题设词、工程知识库还有工具调用融合在了一起吗?它有什么优点吗?有!如果你仔细思考过就会发现,除了一开始加载 agent skills 以外, 后续功能里面是否参考公司规章制度,是否调用脚本等等,都是按需加载的。按需加载意味着 ai 不 需要一次性考虑所有内容,也就意味着更省 token, 更意味着用户只要花更少的钱就能享受更专业的服务。 当然, agent skills 框架适合轻量级开发,更多场景下,比如要求调用一些专业软件的接口, m c p 协议可能会更合适,未来二者的结合一定会是主要趋势。

目前全网最火的 skill 你 还不会用吗?今天我教你一个最简单最直观的方法,看完你还不会用,你来打我!这个方法就是使用扣子,扣子前段时间做了一次重磅的升级,推出了 agent skills、 agent plan、 agent office 和 agent coding 等等重磅功能, 其中让我觉得最有趣的无疑是对目前全网最火的 skills 的 支持。我体验了一下,我觉得对于没有技术背景的朋友来说,如果你想要用上 skill, 这个应该是我目前找到的最简单最直接的方法。不过在开始之前呢,我想要先简单的介绍一下什么是 skill, 因为我发现很多朋友还不知道 skill 到底是个什么东西, 在这里呢,我觉得最重要的是要从概念和定位上面去理解它,而不是去纠结说它到底是由什么组成的。那么在概念上呢,其实也很简单,那就是 skills 这个英文单词的中文意思,技能,就跟我们平时说一个人有弹钢琴的技能,有游泳的技能,有说服别人的技能,对吧, 其实就是这里的技能的意思。只不过我们今天要聊的这个 skill 呢,它不是人的技能,而是 ai 工具的技能。 当目前来说,并不是所有的 ai 工具都有技能这个东西啊,但是对于这些有这个东西的这些 ai 工具,你就可以给它们来增加一些技能啊,比如说增加一个做 ppt 的 技能,增加一个数据分析的技能,对吧? 那什么样的事情适合用 skill 来做呢?在这里就说到为什么要用 skill 这个东西了,那么简单说呢, skill 的 意义就在于它们能够让我们刚刚提到的这些 ai 工具能够更好地去完成一些任务, 比如说数据分析,对吧?你可以把一堆数据直接扔给 ar, 让他来给你做一个数据分析,那么大概率他也能做。但是呢,如果你给这个 ar 工具安装了一个专门的做数据分析的 skill, 那 么大概率他做出来的数据分析会更加的专业,同时更加符合你自己想要的一个结果。 其实跟我们日常生活中也是差不多的啊,比如说一个没有做饭技能,比如说我,对吧?我去做一餐饭,跟一个有多年经验的大厨,他做出来的一顿饭,味道应该是完全不一样的啊。这个就是因为有技能的这个差别,所以什么样事情适合用 skill 来做,那其实答案就很明显了, 基本上就是所有的这种技术活就是有一定技术成分的,这些工作以及一些流程化的事情,都适合用 skill 来让这些 ai 工具能够更好的去完成。当然每种 ai 工具它创建和使用 skill 的 方法是不一样的,像 coco 的 这种可能就需要一定的技术背景,对于不懂编程的朋友来说,可能会有一定的上手难度。 所以接下来我就介绍一下如何在扣子里面来轻松方便的创建和使用一个 skill。 ok, 我 们打开扣子首页,然后点击这里的扣子编程,再点击这里的技能,在这里我们就可以通过对话的方式来生成一个 skill 了。 这里呢,结合我自己的需要,我们让它来生成一个小红书爆款标题的 skill, 我 们直接跟他说帮我开发一个 skill, 根据我提供的视频脚本或主题生成十个小红书爆款标题。好, enter, ok, 可以 看到它这边就开始在帮我创建这个 skill 了。 ok, 它现在就帮我们生成了这个 skill 啊,然后可以看到它这边有一些简单的介绍。好,我们来试一下。这边我们上传一个脚本文件,然后跟他说生成十个标题。 enter, 可以看到他这边在读取我的脚本文件,然后根据这些内容来生成小红书爆款标题。好,这边就已经生成好了。然后这边呢还有一些简单的解析,他到底是怎么生成的?那对于标题的生成呢?我其实是有一些自己的一些方法论的,所以在这里我们也可以让他来根据这些方法论来帮我们生成标题, 那我们就可以继续完善这个 skill, 我 们跟他说这里有一些起标题的方法论,你参考一下。那下面这些就是我比较喜欢的一些起标题的方法论。我们提交 ok, 可以 看到现在蔻子就在根据我们的要求来更新这个技能了。好,很快蔻子就帮我们升级好了这个技能, 可以看到它这边增加了这样的一些起标题的一些理论。那为了更加清楚地看到它生成的这些标题有没有按照我们这些理论来生成,我们可以进一步升级这个 skill, 让它在输出这些标题的时候呢,简单地解释一下这个标题是怎么生成的。好,我们跟他说对于每一个标题简单解释一下它的原理,为什么这样设计 好。提交 ok, 扣字,又在帮我们升级这个 skill 了, ok, 升级完毕,然后我们再来试一下上传脚本,然后跟他说生成标题。 ok, 我 们再来看一下这一次它生成的这些标题。好,可以看到这一边每个标题后面都有一些简单的解释啊,它设置的原理是什么? 所以它的输出结果还是符合我们刚刚给它这些要求的。然后整体来说,我觉得这些标题的效果还是蛮不错的啊,像这个标题我觉得是可以直接拿来用的, 那到这里这个技能就差不多已经做好了,当然你可以根据你的要求去进一步的对他进行一些优化。比如说我之前在 dunk 上面学到的一个点,就是你可以把你之前 表现最好的一些作品的标题喂给他,让他来去参考,这样的话他取出来的标题会更加符合你自己的这个风格。再比如说你可以让他同时生成封面文字和标题这样的一个组合,因为像我这样的话,封面文字跟标题之间其实是一起思考的,然后他们俩之间会有一个相互配合的关系。 ok, 这个技能创建好了以后呢,我们需要部署一下啊,点击右上角的这里的部署,再点击下方的这个开始部署。 ok, 很 快它就部署好了,然后我们点击这里的立即体验, 就可以在扣子的这个对话框里面来使用这个技能了啊,在这边可以看到由我们刚刚生成的这个爆款标题生成技能啊,选中,然后呢上传一个脚本,我们选一个别的,然后跟它说生成标题。 enter。 好,可以看到这边就在开始利用这个技能来帮助我们生成标题了,那输出的这个格式可以看到跟刚刚呢也是差不多的。 ok, 以上就是在 code 里面创建和使用一个 skill 的 方法,整个过程直接对话就行啊,简单到不能再简单,呵呵。 而且除此之外呢,在这里的 code 技能商店里面还有大量的现成的 skill, 都是一些经验丰富的专家和开发者创建的 skill, 你 可以直接拿来用的,使用这些 skill 基本上做任何事情都能够得到一个更好的结果, 所以如果你还不会用 skill 去试试扣子 skill 的 功能,相信你会有完全不一样的感觉。 ok, 这个视频就到这里,大家想要创业什么样的 skill 呢?欢迎在评论区留言,最后别忘了点赞关注我是昌哥,我们下期见,拜拜!

最近呢,这个 agent skill 讨论非常的多啊,有人说呢,这是 ai 编程真正开始工程化的标志。也有人说呢, skills 其实就是一套复杂一点的提示词的模板。那在我看来的话呢,这个 agent skills 或许是二零二六年最值得我们关注的 ai 使用方式。 那今天呢,我们就不讲概念,也不争谁对谁错啊,我直接用一个一个的案例来让你对 agent skills 有 一个更加详细的了解。 这上面呢,它就是把一类任务的工作方法从一次性 prompt 升级为可附用,可组合,可长期使用的能力模块。 注意啊,我们这边呢,出现了三个英语单词,第一个是 prompt, 第二个是 agent, 第三个是 skills。 那 我再额外给大家补充三个吧,一个是 m c p, 另外是 rules, 还有这个 memory。 这六个单词呢,大家或多或少都听说过啊,有一定的了解。那为了能够更加简单直观的把它们的本质以及使用场景讲清楚的话呢,我这边画了一个表格。首先这个 prompt 啊,它的本质是什么呢?它其实就是一个一次性的输入文本,那它是不可附用的,也不是啊,长期有效的,所以说呢,它就强依赖当前的上下文。 agent 呢,它是一个正在运行的 ai 执行的实力,它不是附用的,也不会长期有效,结束了就消失了。 而 agent skills 呢,它是一个可赋用的工作方法的模块,并且它这边是跨任务跨绘画的。然后 m c p 呢,它其实是一种外部工具和数据访问的协议啊,这边是可以赋用,也是长期有效的,与 agent 的 这个生命周期是啊, 无关的。最后是 rules 啊,它这边呢,是一个局的 ai 行为的约束啊,也是可以赋用和长期有效的,并且是始终生效的。 那最后呢,是这个 memory 啊,就是可以去持续地存储某一类状态,它这边也是可以附用和长期有效的。那这里的话呢,大家可能对这个 agent 不 可附用啊提出质疑啊,那我来解释一下, agent 呢,它本质是一种运行状态啊,就是类似一个正在工作的进程或者是现成。 那任务完成了之后呢,这个 agent 的 生命周期其实也就相应地结束了啊,你不能说我想要去附用上一次那个 agent, 你 只能说我再启动一个新的 agent 实力。 那为什么很多人会感觉这个 agent 呢,好像能够服用呢?这是因为我们的这个 agent 呢,它当中啊有这个 prompt, skill, rules 和 memory 这些配置。所以说呢,真正可以服用的其实是 agent 它自身的这个配置, 而不是 agent 的 本身。那上面这个表格呢,我们其实已经讲到了六者之间的不同的分工啊,那接下来的话呢,我们来看一下它们之间的一个差异吧,这里我也让 chat 的 gpt 帮我会总了一个 表格。首先我们来看这个关注点啊, prom 呢?他是说什么?然后 agent 呢?是谁来做? agent? skills 是 怎么做? 然后 m c p 呢?是我们要用到什么样的一个工具?而 rules 呢?是啊,我们去归约了,什么事情是不能做的?最后这个 memory, 是 啊,有一些长期的这个对话的过程,想要去让你去记住的一些记忆点, 这个大家可以暂停来看一下。 ok, 那 下面的话呢,我们正式进入这个实操环节啊,首先呢就是我们来解决一个大家比较关心的问题,这个 agent skills 到底是从哪里来的啊?是不是每次我们都需要自己去写这个 agent skills 其实是不用的啊,因为现在社区它已经有很多成熟县城 拿来就能用的 skills 啊。第一个就是这个 atroc 它官方的这个 skills 仓库,那这个仓库呢,它非常重要的一点就在于它给出了官方推荐的一些啊 skill 的 写法啊,这个就是行业规范, ok 也提供了一些比较基础的这种 demo 势例。 第二个来源呢,就是这个 awesome cloud skills 这个项目啊,它这里呢是汇集了成百上千个 skills 啊,覆盖的这个场景是非常的多,那它更像是一个 skills 的 目录和生态集合啊。那第三个来源呢,就是这个 skills mp 点 com 这个网站,这个网站它的交互是非常有意思的啊,有点像一个命令行的界面啊, 你可以去按照分类浏览,也可以去啊按照你自己的这个用途和这个喜好去搜索。那这个呢,我就不展开了,回头大家可以去自己慢慢探索一下。呃,目前的话呢,我们主流的这个 a 编程工具其实都是支持 agent skills 的 啊,而且它的这个安装方式其实也都是大同小异的。 这里呢我提前就下载了 athropic skills 那 个开源项目,然后现在的话呢,我们就演示如何安装到 coder 当中去。首先呢我们打开一个项目,然后在这个项目的根部路呢,去创建点儿 coder skills 这样的一个文件层级,接下来的话呢,我们只需要去把一些开源的 skills 的 文件复制过来就可以了。那这里呢,就是复制以后的一个文件层级了。 ok, 现在的话呢,我们来尝试做一下对比啊,比如说同样的提示词,我们让 coder 去做一个 toto list 的 这样的一个小应用, 左边呢是不带 skills 的, 右边是带 skills 啊,那可以看到呢,右边的这个设计,它明显是更加高级,更加美观的。 是因为呢,我们这个提示词当中的前端 ui 设计触发了这条 skill, 而这条 skill 呢,它不是在教 ai 去啊怎么写这个前端的代码,而是呢,它在替 ai 做一个规约啊,就是当你去做前端设计的时候呢,你必须向一个真正的 设计师那样去思考。这里呢,我也让 ai 去分析了一下这条 skill 啊,感兴趣的同学呢,可以来暂停看一下。 ok, 那 到这里的话呢,你其实已经不难发现了,就是其实不是一个效果好不好的问题,而是一个做事方式, 呃,要不要改变的问题啊?就是加了 skills 之后呢, ai 并不是变得比之前更加聪明了,而是呢,他开始知道在这一类任务当中啊,什么样的事情,它的这个优先级是最高的, 哪些判断是不能够随便啊糊弄过去的啊,就是它会减少 ai 的 一个幻觉,更加的去标准化,更加的去符合我们人类的一个定义和预期。 那这也是为什么同样一句提示词,加不加 skills, 你 可以看到它的这个结果完全是不一样的, ok, 所以 说 agent skills 它真正的一个价值不在于它写的有多么的复杂,而是在于它能不能够稳定地去改变 ai 面对一类任务时候的一个行为方式。 ok, 当你开始呃真正的在项目当中去使用 ai, 而不是只去做一些简单 demo 的 时候呢,你就会越来越在意这种稳定性,而不是, 嗯,就是 ai 的 某一次。呃,灵光乍现表现很好啊,就是你会在意它的一个稳定性。那所以说的话呢,下一期我们也会直接带大家去从零到一的写出一条自己的这个 agent skills。 然后呢,我也会讲清楚一个真正可以附用的 skill 应该怎么样去设计,以及什么时候我们该用 skill, 什么时候该把这个东西交给 m c p 来做。感兴趣的同学啊,可以来关注我。 ok, 那 以上呢,就是本期视频的一个全部内容了,感谢大家的收看,我们下个视频再见, peace。

skill, 它不是软件,它是大模型的一个菜谱,它是一个打包的文件,那这个文件包里面它包括哪些内容?首先有这个 skill 的 名称叫原数据,其次有一些流程指令,就这个 md 文件里面会去描述你这个 skill 第一步做什么?第二步做什么?第三步做什么?第四步做什么?其 有的时候还会有一些 example, 还会有一些参考文件给他看,除此之外他会有一些代码的脚本,比如说这个地方 p y 的 这样的一个文件, python 脚本可以帮你去做一些代码的执行任务,那这个文件包它通常都放在一个本地的文件夹下面,这也就意味着我们不能单独使用 skill, 它不是一个软件,不是你双击一下就能用的。我们必须在一些大模型里面, 比如说 cloud, 或者说一些已经具备了 skill 能力的软件里面,比如说 cloud code 或者 cursor, 还有一些其他的陆续在增加这个能力的国内的软件,那在这些软件里面,我们才能去加载这个文件包,让它发挥它的作用,跟大模型写作,按照这个 文件包里面的流程去做一个非常稳定的 sop 化的一个工作产出。那具体到底咋使用 skill? 刚才我们都说了这个 skill 它是个文件包,是放在本地的,那就意味着我们必须 把它搞到我们本地来,那怎么搞到我们本地来呢?两个方法,要不然你自己创建,要不然你可以下载创建的话,又有两种方法,你要不然就是把你的工作任务梳理成一 步一步的,比如第一步要发数据,第二步要清数据,第三步要分析数据,再让这些有 skill 能力的这些模型或者软件帮你去生成这个 skill。 现在最常用的是 cloud, 目前陆续有国内的很多软件在增加这个能力,后面咱们的视频里面也会讲到。 那第二种方法呢?就是你跟 cloud 写作,比如说我跟他合作写了一篇文章,中间我改了很多次,再改出来你心满意足的文章之后,你让 cloud 一 键总结一下你上面的工作流程,再让它生成一个 skill, 这个也是一个超好用的创建 skill 的 方式。那除了自己创建之外,你还可以下载别人已经做好的 skill 文件包,你可以去各种各样的 marketplace, 里面会有很多 skill 供你下载。后面的视频里咱们也会陆续介绍一些非常好玩的 skill 和 marketplace, 那不管你是创建还是你是下载,当你已经把这个 skill 的 文件包放到你的本地之后,我们可以直接在可以使用 skill 的 这些软件,比如说 cloud code, 比如说 cloud, 比如说后面会介绍的一些国内的 ai 软件里面直接通过提示词来调用你的 skill, 比如说我之前做过一个分析爆品的 skill, 那 我就可以直接用一句提示词,请使用叉叉叉叉叉这个 skill 帮我完成某项任务,你直接这样大白话告诉他,大模型就可以一键无痛地执行你在这个 skill 里面给他写的 n 个步骤, 并且具有相对稳定的一个产出。 ok, 今天先分享到这,大家还有任何觉得困惑的问题,欢迎留言,我们一一解答,记得一键参联,下期见!


hello, 大家好,我是 henry, 今天想跟大家一起讨论一下 agent skill, mcp 以及复利工程。为什么会有 agent skill? 那 首先第一点,如果你在企业当中想要把 ai agent 的 商业化甚至产品化,那特别是在一些标准化的流程当中,你肯定是希望它能够稳定地执行的, 能够具备工程化落地的能力。那以往来说呢,我们会使用很长的 prompt, 那 实际的结果呢?针对同样的问题,会有不同的路径, 它会忘记一些关键的步骤。第二点, m c p m c p 是 anthropoid 的 去年提出的一个上下文协议,它标准化了 agent 与外界工具的这个连接,它规定了 agent 哪些工具是可以使用的,哪些是不可以使用的, 但是呢,什么时候使用以及怎么去用是没有说明的。所以呢,针对以上的两点呢,我认为。然后就有了 agent skill。 agent skill 呢,官方是把定义为是可重复使用的能力模块,那可重复使用,那可以用我们刚才说的,它针对一些标准化的流程,那能力模块呢?是是包含一些,比如说说明指令,还有相对应的资源。 那第三点,复利工程我为什么要提到呢?我可以给大家举一个例子,关于 agent m c p agent skill, 比方说 agent, 那 我们就可以把它 看待为是一个数字的员工,打比方说他这个是数字员工,是一个 crm 的 faq agent, 那 你招了这个数字员工之后,你就要给他配备相应的工具,也就是我们的 mcp, 比方说他可以访问知乎库,或者说一些数据统计的工具。 然后呢,那有了工具之后,你会制定岗位的 sop, 也就是我们的 agent skill, 它相当于一些员工手册,比方说如何生成销售报告呀?然后这个员工手册呢,也明确了一些职权范围。 那当下的情况就是我们已经有了这个数字员工,我们给他配备了相应的工具,以及明确了职权范围。那最终呢?我觉得如果我是老板,我希望这个员工他是能够自我成长和沉淀的,这也就是我为什么会提复利工程。 那我们会在 prompt 当中提出一个复盘沉淀的指令,然后搭配相应的 skill 或者工具,它可以自己复盘。是否有新的问题? 回答是否明确。所以说不仅要让他能干活,会干活,更要不断积累经验,自我优化,最终实现一次搭建持续增值的福利效果。