在生成式 ai 的 架构中,大型语言模型本质上是一个基于概率应设的参数化黑盒。 尽管它拥有数万亿参数,但由于训练数据截断和沙盒环境限制,它与真实世界是脱节的。要构建真正的智能体,我们需要解决意图对齐、上下文获取与功能执行的通信问题。 promp 并不是简单的文字聊天,它是对模型推理编制的动态干预。我们通过 seismome 定义边界条件,在模型的上下文窗口中建立初矢向量。它不改变模型本身,而是像导航仪一样,引导模型在概率分布中命中符合预期的区间。 m c p 解决的是看哪里。在 m 四 p 之前,接入数据需要无数私有 api, 导致生态碎片化。 m c p 引入了基于 samplink 的 标准化协议,采用宿主客户端架构统一通信。 它是一个通用的数据总线,让 ai 能实时安全地访问本地代码库或数据库,无需重复开发。 stealth 即 function calling 是 ai 产生副作用,改变外部世界状态的能力。当 prom 确定意图, m c p 提供情报, slyz 则是执行的末端,它将模型从单纯的文本生成器转变为能够运行代码发送请求的闭环生产力单元。 prom 是 软件层的逻辑引导,思考深度。 m c p 是 硬件层的连接标准,连接广布。 skellets 是 功能层的模块化能力,三者结合构成未来的一整 day work flow harm 给出战略, m c p 提供情报, skellets 实施打击,这就是智能体的终极形态。
粉丝69获赞342

你是小阿八,正在用 ai 开发网站,为了让 ai 生成的效果更好,你告诉 ai 界面不要使用蓝紫渐变色,不要生成一大堆没用的文档,你要遵循公司的代码规范。阿八阿八,洋洋洒洒几百字 之后,每次开发网站时,你都要写这么一段又臭又长的提示词,太麻烦了。于是聪明的你开始想办法, 先把常用的提示词保存到单独的文件,每次手动投喂给 ai。 然后创建了资源文件夹,把公司的代码、规范、设计素材都塞进去,告诉 ai 参考这些去写。 接着你还写了一些脚本,让 ai 生成代码后自动执行格式化运行测试,提交代码到 get 仓库。最后再写着 agent 点 m d 文件,把所有规范和工作流程都写进去,让 ai 自动读取,你沾沾自喜, 嘿嘿,俺这套工作流堪称完美。但很快你发现了问题,随着规范越写越多,文档越来越臃肿,每次对话都要占用很多 ai 上下文空间,浪费 tokens。 于是你找到号称没有人比他更不懂 ai 的 鱼皮,求助阿爸阿爸,俺还能咋办啊?不是有 agent skills 吗?为啥不直接用呢? 呃,啥玩意儿?这可是最近 a h r 爆火的技术,下面我来带你玩转 agent skills, 让你知道它是什么,怎么用,有什么魔力,怎么自己开发。点着收藏,我们开始。 agent skills 是 astropic 推出的一套开放标准,目的是让 ai 能够学习使用各种专业技能,而不用每次都重复输入提示词。简单来说,它就是给 ai 装备的技能包,技能包里有精心设计的提示词、代码、脚本,还有各种资源文件, 把 ai 想象成一个职场小白,给他装上文档处理技能,他就立刻知道怎么生成 ppt 处理 excel 表格。装上代码规范技能,他就知道怎么按照公司的标准写代码。 你挠挠头,呃,等等,这不就是俺在做的事吗?把教 ai 做事的文档和 ai 要用到的文件打包成文件夹差不多,但 osropet 把它做成了一个通用标准,而且在实现原理上有一些新花样。 可恶啊,俺差点就改变世界了,这能有什么新花样?下面我先来带你用一下 agent skills, 再跟你说说其中的奥秘。 目前对 agent skills 支持最完善的工具是 asteroid 官方的 cloud code, 我 们就以此为例,安装并使用 skills, 先打开 cloud code, 并输入命令,添加官方技能市场。这就像是在你的 ai 助手里开通了一个技能商店,接下来你就可以从商店中获取技能了。 然后在 toloud code 中输入命令,安装官方提供的技能包。这着 example skills 包含了一堆官方势力技能,包括前端设计、网页测试、动图制作等等。 装完之后,你就可以直接让 ai 使用这些技能了。比如你要做一个网站,以前没装技能的时候, ai 生成的代码又是那个熟悉的蓝紫渐变色,千篇一律的 ai 审美。 现在安装了 front design 这个教 ai 生成专业设计版网站的技能后,你输入提示词,帮我开发个人作品及网站。 ai 会主动问你,我发现你安装了前端设计技能,需要用它来生成证据设计版的页面吗? 确认之后, ai 会利用技能生成代码,告别篮子渐变,生成独特风格的精美页面。我们不用每次都给 ai 输入一大堆相同的提示词,装一次技能就行了。 除了代码相关的技能,官方还提供了文档处理技能包,同样在 cmd code 中输入一行命令安装。 这只技能包里有 ppt 制作、 word 文档生成、 excel 数据分析、 pdf 解析等技能。接下来,如果你让 ai 做着 ppt, 它会自动调用 ppt 制作技能,直接生成排版好的 ppt 文件,帮你节省几个小时。 你好奇道,咦,为什么 stills 能做到安装即用?技能包里面到底有啥? ai 又是怎么知道该用哪个技能的? 好问题技能其实就是一个包含 still 点 m d 技能说明文件的文件夹,还可以包含可执行脚本资源和参考文档。 由于每个技能的复杂度不同,结构也会存在区别,我们可以在本地目录中找到已安装的技能文件夹。以官方的 ppt 制作技能为例,它的结构是这样的,包含一个核心的技能说明文档, still 点 m d, 还有脚本参考文档和各种资源文件。 而 front and design 前端设计技能只有一个, still 点 m d 文件。 still 点 m d 文件是每个技能的核心,它包含两个关键部分,第一部分是原数据,用 yam 格式写在文档开头, 其中 name 是 技能的名字, description 是 技能的描述,告诉 ai 什么时候应该使用这个技能。 描述写得越清晰, ai 就 越容易在合适的时机调用它。第二部分是指令内容,就是一套经过精心设计的提示词,指导 ai 具体怎么做。以前端设计技能为例,它的指令内容包括设计思考、前端美学指南和必称指南。 你挠了挠头,如果有多着 stux, ai 怎么知道该用哪个技能呢?如果把每个技能说明文的都塞给 ai, 不是 很占用上下文吗? 这就要说到渐进式批漏这个核心机制了。当你让 ai 执行任务时,它会先扫描技能目录,但不会把所有内容都加载到上下文中,而是只读取每个技能的原数据, 发现描述和任务相关,就知道该用这个技能了。然后才把完整的技能说明文档读进来,按照里面的指令执行,并根据需要加载技能包中的其他资源,用到哪个查哪个,既精准匹配又节省上下文,这就是渐进式纰漏的精髓。 所以 agent skills 的 本质就是把专业知识打包成一个文件夹,让 ai 按需读取并使用。呃,那除了 cloud code 之外,其他 ai 工具支持 agent skills 吗?俺平时用 curser 比较多, 当然能, agent skills 已经成为通用标准, curser、 west code code、 dex 等工具都支持。 skills 的 社区也非常活跃,你可以在 cloud skills、 hub 市场开源的 awesome、 cloud skills 等地方找到很多现成的技能, 比如有着叫 uiu 叉 pro max 的 技能特别火,专门用于提升 ai 的 设计能力。用法很简单,首先按照开源仓库文档的指引,安装官方提供的命令行工具, 然后进入到你的项目目录下,根据使用的 ai 工具执行对应的命令。比如我这里用 cursor, 它会自动把技能安装到 cursor 的 配置目录里,安装完成后,可以看到它的文件结构。接下来当你让 ai 开发一个网站时,可以使用斜杠命令手动触发技能,或者让 ai 自动识别技能。 ai 会根据你的需求识别出产品类型和需要的页面类型,然后调用设置点 p y 搜索脚本,在 data 目录里进行多维度搜索,找到适合的配色、字体、布局风格。接下来综合搜索结果,生成完整的设计方案。最后 ai 再按照设计方案生成代码, 这样一来,生成的界面既专业又有设计感。 ai 不 需要把所有规则都背下来,而是用到哪个查哪个,这就是 agent skills 的 精髓。 用了很多别人的技能后,你产生了一个大胆的想法,哎,能不能把公司的周报折式封装成一个技能,以后推荐给新来的同事,还能卖几个钱,嘿嘿嘿。嗯,有点东西,那你打算怎么做呢?当然是发挥程序员最擅长的事情。复制粘贴。 俺先复制一个官方的技能包,修改目录名称为自己的,然后修改技能说明文的 still, 点 m d 的 原数据指令内容这些关键部分。最后把公司的 logo、 ppt 模板爆照样例放在子文件夹里就行了。妈妈再也不用担心我的周报了。 不错不错,但其实有更简单规范的方法。在前面安装的 example stills 官方势力技能包里有一个叫 still creator 的 技能,专门用来帮你创建新技能。你只需要跟 ai 说,帮我创建一个专门生成公司周报的技能。接下来 ai 会问你几个问题, 你希望周报包含哪些主要部分,以什么格式输出?你通常会如何使用这个周报技能?希望周报的语言风格是什么?很快,一个完整的技能包就生成了,你会看到一个点 scale 为后缀的文件,本质上是一个压缩包,你可以把它解压到你的个人技能目录下,你的所有项目都能用。 如果你想让技能只在某个项目生效,可以把它放到项目的 cloud, 同步给项目组其他成员 测试。没问题后,你还可以把它开源到 github, 或者上传到 chaleo 的 stokes hub 这样的社区平台,让所有用户都能用,你开心极了。原来开发一个 stokes 这么简单,但是这玩意儿跟之前火爆的 mcp 和邪道命令有啥区别? 好问题, m c p 就 像给 ai 装上了手和眼睛,让 ai 能够连接外部工具和数据源,比如搜索网页、读取代码、仓库、查询数据库,适合需要获取数据或操作外部系统的场景。 而 agent skills 正像是给 ai 发了一本工作手册,把专业知识和工作流程打包起来,教 ai 在 特定领域该怎么做。 至于斜杠命令,它就像是快捷键,是需要你手动输入常按的命令来触发的固定操作。而 steils 的 特点是, ai 可以 自动识别该用什么技能,不需要你显示调用。对了,其实 mcp 和 steils 是 可以结合起来的。 举个例子,如果你想让 ai 帮你发周报, m c p 负责获取数据,从任务管理数据库拉取这周的任务列表。 skills 负责加工数据,把获取到的原始数据整理成老板爱看的格式,一个提供食材,一个提供配方, 你看这技能文件夹的结构,突然怪叫一声,阿爸,哈!等等,俺突然意识到一个问题,这不就是我们程序员玩烂的封装附用、模块化懒加载那一套吗?写几个代码文件,打着包发到网上,让其他程序员下载下来用 不是一回事吗?为什么 agent stux 能突然让整个 ai 圈为之疯狂?好问题,从技术的角度来看,它并没有发明什么惊天动地的算法。在我看来,它能火主要是两个原因。第一,它是开放标准,封装一次技能包后就能在各种 ai 工具里附用,还能通过社区共享。 更重要的是, stux 能立刻让 ai 的 工作更专业可靠,让普通人无感地享受到技术带来的价值。以前想让 ai 变聪明,你得学提示词、工程配置各种工具链。现在只需要像装 app 一 样安装技能包, ai 就 立刻变专业了。 一项技术的成功不在于它有多复杂,而在于它能让普通用户在不关注技术细节的情况下感受到技术的价值。 你点点头,学会了,学废了。降低门槛才是技术走向大众的钥匙。没错, agent skills 不 仅仅是个技术概念,更是一种新的工作方式。 你可以把它融入到自己的日常工作中,比如把重复的任务封装成技能,把团队的最佳实践固化成技能,让 ai 真正成为你的得力助手。 在这个 webtopod 盛行的年代,技术的门槛正在崩塌,而想象力的边界正在无限扩张。你可以在我免费开源的 ai 编程零基础入门教程中学到更多 ai 编程技巧,也欢迎关注鱼皮,学习更多 ai 和编程的技巧。那么问题来了,你最想让 ai 学会什么技能呢?

这是你朋友给你发的神秘工具,有的能生成好看的照片,有的能让 ai 越狱,还有的能一键复活。老大,离谱的 ai 用法总是离不开离谱的提示词和工具,渴望学习的你是在评论区找大佬分享,还是晚上偷偷来我家让我教你呢?其实这些都不用,因为这个 game 上爆火的 skills 项目可以解决一切问题。 不过在说它之前,我们首先要知道,最近全网吹爆的 skills 真的 那么万能吗?它背后的原理又是什么呢?小白又要如何用它?本期视频将带你一探究竟,同时也会分享几种离谱的玩法,建议各位在父母的陪同下使用。在使用之前,我们先来诉通一下 skills 究竟是什么。 二零二五年十月份的时候,一家叫 ansopik 的 公司先提出了名为 cloud skill 的 技术,然后基于这个技术又推出了 agent skill 开放标准,让起初只能在自家软件上使用的 skill 也可以在其他软件上使用。不 过即便这么良心,这个标准制作完成后,它还是不温不火。但是随着时间的流逝,它的好处也在慢慢显现,因为 skill 可以 很方便地分享给别人使用。于是有不少人自发的将自制的 skill 上传到 github 上,吸引网友下载, 结果好评如潮。有人夸他的功能非常离谱,有人夸他非常节省偷啃。这是因为他用了一种叫做渐进式批漏的技术, 也就像洋葱一样,一层一层一层的把提示词给 ai 看。例如,这是一个 pdf 处理技能,可以分为三层,第一层叫做原数据,包含技能的名字和描述。第二层叫做指令,这里写着给 ai 看的工作流,比如让他用什么工具从 pdf 中提取文本。 第三层是参考资料和代码,让 ai 在 执行工作流的时候按需阅读。所以相较于传统提示词按需加载的特性,让它不仅能实现复杂的功能,而且占用上下文的长度会更小,也就更节省。头等, 如果你没有听懂的话也没有关系,会用就可以,除非你对 skos 的 底层细节非常感兴趣。那么你可以看看这篇官方文档和架构图, 我在这里只讲它最核心的几点。那么接下来呢?我们讲讲 skills 有 哪些离谱的用法和技巧。我们先来看几个案例,例如你想做一个产品动画,只需要像这样抒你的需求,完全不需要你懂剪辑就可以达到很好的效果,还可以拿来做软件宣传片, 或者那种高大上的数据动态演示,是不是非常香?再看这个剪辑技能,它能帮你下载播客这类长视频,再剪辑出其中的精华,然后生成带双语字幕的短视频,还能配上发布文案,非常适合做切片。另外还有这个漫画技能,想要批量生成漫画,只需要输入一个编好的故事, skill 就 会将 ai 加载特定的提示词,让 ai 一 连串的执行操作,生成这样的效果,看起来是不是画面非常精美,还有分镜和对白。 最后再推荐一个去 ai 味的技能,要比我之前推荐的提示词会智能不少。这里还有一个技能,下载的排行,热门的 skill 都可以在这里找到。以上提到的技能链接以及安装教程我也都整理好了,放在了视频的下方,你可以自取。 看到这里,想必你对 skyo 有 了一定的了解,但我还想提醒的一点是, skyo 并非适用于任何场景,因为简单的任务提示词就够了,复杂的系统需要写代码才行。而 skyo 适合处理中等难度的任务, 当流程繁琐但又不值得为它开发一个 app, 使用它就好了。好了,以上就是本期视频的全部内容了,如果你觉得有所收获的话,不要忘记点赞收藏。最后,我是元宝,一台 ai 和黑科技的挖掘机,我们下期见!

梅猴王朋友们, agent skill 最近真的太火了,但很多朋友肯定还是很困惑, skill 到底是啥?有什么牛的?没关系,草旅从 skill 大 全它来了。 今天呢,我们会通过一个逐步升级的案例来理解 skill 的 结构和原理,然后我们还会学会定制自己的 skill 这个 skill 呢,只需要我们说帮我做一个促销海报啊,优惠券,员工服装,它就会生成符合我们品牌风格,带 logo 的 物料图片。 另外,我也会推荐给大家一些好用的必用的 skill, 比如说帮你的文章配图,把杂乱的知识变成教学网页,一句话处理表格等等等等。 我还做了个秋之技能生成器,大家只要回答一下 ai 给的选择题,为你量身定制的技能就轻松完成了。并且今天所有的资料链接以及补充资料我都做成了一个网页,大家只需要一步步的跟着做,跟着看,就一定能搞定, 非常值得一个点赞收藏关注哦!来吧,准备好我们 go go! go! 首先,到底什么是 skill skill 呢?翻译过来就是技能呗, 它其实和人类的技能是类似的,比如说你是一个厨师,那你就有炒菜的技能,处理食材的技能,摆盘的技能等等等等。那每个技能里面,比如说炒菜技能,这里面就包含了你的流程,你要先炒什么,后放什么, 还有你的配方,你的油温多高,盐放多少。有了流程和配方呢,你可能还会需要一些工具,需要煤气灶什么的, 甚至你可能还会有一些独家的材料,有一勺秘制辣椒酱什么的。那 agent 的 技能也是同理,它要来做菜,它也得有流程、配方、工具和材料。 所以在 agent skill 的 术语里面呢,它就是 skill 点 md, references, scripts 和 assets 这些东西打包成一个文件夹,这就是一个技能,一个 skill 了。我们先来个简单的, 比如说我们要做一个写作 skill, 那 我们就在 skill 里面可以要求他先去啊这些网站去搜集信息,然后再按这个爆款原则去写个大纲,然后再参考这个语气来写稿啊,最后按照平台要求来审稿等等等等。那有朋友就很疑惑, 那这不就是写提示词吗?哎,本质上还真是的,毕竟啊,我们跟大模型的交互其实都离不开提示词, 但是呢,这并不是 agent skill 的 全部,它在工程上是有很多优势的,能做的肯定比我们拷贝粘贴提示词要多很多。好处我们后面都会说到,那先让我们通过创建一个 skill 来理解它的结构和原理, 我这里用的是谷歌反重力来做编辑器来看文件,然后呢,用的是 cloud code 来做 agent 来处理任务。这俩东西的下载方式呢,我也都放在资料里了,非常清晰简单,大家一步步跟着做就行了。 接着你只要在反重力的这里创建一个项目,比如说我的就叫丘之 project 吧,然后呢,我们调出终端, 输入 cloud cloud code 就 调用出来了,这个界面大家看着会有点复杂,但是不要怕,跟着我一步步来就可以了,之后我们跟 agent 的 对话都会在这里进行。 ok, 那 我们开始创建, 那我们先要做的是一个最简单版本的 skill, 后面呢,我们会逐步升级的哈, 那现在假设我是一家轻食店的老板,那这是我们秋之餐厅的一个品牌 logo, 那 我希望做一个 skill 呢,能够按照我的品牌调性和视觉规范,帮我们去想各种物料的创意,做一个创意生成器。 那按照 cloud 的 规定,我们创建一个 skill, 得在规定的点儿 cloud skills 文件夹里面去创一个 skill 文件,那我们用最原始的方式,直接手动的来创建这些文件夹哈,点儿 cloud skills, 然后我们再创建一个文件夹,这个文件夹的名字呢,就是我们 skill 的 名字,我们叫它秋之创意吧。那这个 skills 的 文件夹里面呢,必须规定有一个 skill 点 md 的 文件,这个大写的文件,那文件里面放啥呢?我已经写好了, 粘贴进来,那就是这么些文字。好了,这就是一个 skill 了,大家先压住脑子里面的问号,我们再来细看一下,那这个文件里呢,上面这两个横线里面的它叫做元信息 matlab, 写着两个东西啊,一个呢是 skill 的 名字,一个呢是 skill 的 描述,这两个东西专门用来告诉 ai 这个 skill 叫什么名字,是干嘛用的,什么时候可以用它,那我这就写着是做创意物料用的啊,当用户说要做个海报什么的物料,他就自己触发它了。 而下面这些信息呢,叫做指令 instruction, 其实就是具体告诉 ai 怎么样做的一些提示词喽。 ok, 那 我这写了我们的餐厅叫做秋之餐厅,品牌的风格有这么些要求,输出的格式让他是这样等等等等,非常的简单哈,那我们保存好一个 skill, 真的 就创建完了?来,我们启动 cloud code 来问问他,你有哪些 skill? ok, 你 看,他现在就已经识别到了我们的秋之创意 skill 了。 ok, 我 们直接问他,我要做一个秋之餐厅的春节促销海报,让他给个创意 好,他这里就开始提示我们,他正在加载这个 skill 了,我们同意 ok, 他 就输出了创意,并且是按照我们的要求和格式来的。 那有朋友就受不了了,哎呀,这一通操作不还是提示词吗?跟我自己写一段这个提示词存着给 cloud code 看有什么区别呢?最大的区别之一在于它是按需加载的, 什么意思呢?其实啊,当我们正常的这样跟 cloud 去聊天的时候,大模型它只会看到我们这个 skill 里面这两行短短的圆信息。 只有当我们说我们要做一个秋之物料的时候,他才意识到,哦,该看具体的指令了,他才会去加载这下面这部分的完整指令,否则这些他都不会看到。 这样的好处就是方便我们可以同时拥有很多个 skill。 每次 a 正的都会看一遍所有 skill 的 简短的原信息,但是只有当 a 正的意识到他要去具体调用一个技能了,他才会去看下面的一大堆指令,而且 ai 的 回答也会更精准, 因为他没有了其他提示词的干扰,那 ai 加载的少了, open 自然也就省了一堆。那这是他按需加载的第一层。 当然了,刚刚这个 skill 实在是太基础了啊,就算一口气把它下面的指令都加载完,好像 token 也不多哈。 但是如果我们的要求变得复杂了呢,比如说我们秋之餐厅的物料其实分很多种, 常规的呢,有海报、菜单,也有比较特别的一些实体物料要设计,比如说餐盒、杯子,员工服装,还有一些社交媒体的物料,比如说公众号封面,微博配图等等等等,他们的尺寸都不一样,配色要求也不一样, 还得符合各平台的一个规范。每一个物料呢,我们都假设它有详细的长长的说明,那这时候我们如果把所有物料的要求都写进 skill 点 m d 里面,那这个文件就会变得巨长。 但是很多时候呢,我只是想做一个,比方说实体餐盒的设计大模型,根本就不需要知道公众号封面的规格,但是 ai 还是得把整个文件都读一遍,那这就造成了 token 的 浪费,也可能会造成一些信息干扰。那怎么办呢? isopec 就 又规定了一个文件夹叫做 references, 我 们呢可以把实体的物料和社交媒体的物料这个两个规格单独拆出来,单独的给它放到这个 reference 文件夹里面去。 那这个实体物料规格点 md, 我 们就写一些线下的工服呀,餐盒之类的要求, 那这个社交媒体物料规格呢,我们就去写公众号封面呀,微博配图这些的尺寸和要求,甚至我们都可以拆得更细。 然后呢,我们只需要在 skill 点 m d 这个总指令里面只留下那几个常见的物料要求,并且我们还需要写上一个指引 啊,告诉他如果用户要做线下物料的话,那就要去读这个实体物料规格点 m d。 如果要做社交媒体类的图,那就要去读社交媒体规格点 m d, 那 现在同样的一句话, 他给出的方案就更精准了。这样当我们只做常规物料的时候,这两个 reference 的 文件大模型压根就不会看。然而当我们说做实体参合的时候,他也会通过 skill 点 md 的 指引,只去看 reference 里面的这个实体规格文件, 那这就是它的进一步按需加载了。那我们可以想象,我们可以有好多种不同情况的 reference, 反正它只会在需要的时候自己去看指定的文件。 但是现在我们的秋之创意 skill 呢,只能输出创意,还得我们自己去做图,所以呢,我就还想让它可以按照我们的品牌规格,直接帮我们把图做出来, 也没有问题。那这就要用到 skill 的 另一种文件夹了,叫做 scripts, 那 这个 scripts 里面呢,一般放的是一些可执行的脚本, 那我这里呢,实际上也就放了一个非常短非常简单的脚本,其实就是在调用 nano banana 的 api 来生图的一个脚本。那有了这个脚本之后呢,我们还得去 skill md 里面在指令里说一声,告诉他,如果用户要求直接生成图片, 那他就得把之前我们想的这个创意转化成生图的提示词,然后按照这个命令去调用这个生图脚本,这样他就能一句话自动去生成精准的图片了。 不然我们还得自己去拷贝提示词,打开软件再粘贴,再生成,再下载保存,现在我们一句话就搞定了。 另外我还有个需求,我希望深层物料的图片能保持秋之餐厅的 logo 不 变, 所以我们还得给他几张 logo 图作为深图的这个参考。那我们就可以再建一个 最新规定的一个 s s 文件夹,我们把两张的 logo 图片放到这个文件夹里,当然我们还要回到 skill 的 md 里面,告诉他参考图在这个 s s 文件夹里面,如果要深图的话,需要把这个图片当做参数给脚本传进去来执行。 好朋友们,现在这个 skill 就是 一个完整的官方完全形态了,其实有点像我们在用自然语言写程序,对吧?那我们先来试试效果,来帮我做一张周六饮料免费的一个实体海报, 你看它发生了什么?它先是加载了这个 skill, 然后它内部可能发现啊,要做的是这种实体物料,它就要去看另一个解说,于是它去检查了这个实体物料的规范。那并且它意识到我们需要的是直接生成图片, 所以呢,它又生成了提示词,把这个提示词和 logo 图片一起给到,并且运行了这个脚本。那最后它输出的图片告诉我们,在这里我们看看结果, 你瞧瞧它这个尺寸,配色 logo 是 完全符合我们这个品牌规范的啊。那为了防止这个是一次性的结果,我还多试了几次,它这个深层的效果都很不错。 然而如果我们的要求还跟之前一样,我们只要创意并不要直接深图的话,那他的这个脚本他也不会被执行。 而且呢,刚才我们说到这个 scripts 脚本,这里面其实还有一个重点,这个脚本里的代码它是写好了的, agent 根本就不需要去看里面写了什么,它只要知道我们在 skill 点 m d 里面写的那些指引,告诉它传什么参数,会输出什么,它只管运行脚本就行了。 所以不管我们在 scripts 里面写了多少行代码,大模型它都不会去读取,一点 token 都不占。 当然了,如果我们在 skill 点 md 里面的那个指引写得不够清楚,大模型不知道怎么用这个脚本,那他有可能也会不得不自己去看一下这个脚本,但他的机智和园艺是不需要去读这些脚本的。 好,那我们来回顾一下,其实创建 skill 就是 在指定的文件夹下去创建一些文件,那最简单的 skill 呢?只要一个 skill 点 m d 就 够了,里面有这个原信息和指令,而完整形态的 skill 可以 加上 references, script s s 这些可选的文件,那这些东西是怎么配合工作的呢?这就是 skill 最重要的设计。按需加载的三层结构,第一层,源信息。 这一层呢,是始终加载的, ai 的 每一次对话都会看一眼所有的 skill 的 源信息,它去看到自己有哪些技能,就像一个目录。那第二层,指令层, 这层是只有当 ai 判断并且决定我要用这个 skill 的 时候,它才会去加载完整的 skill 点 m d 文件。第三层,资源层, 这层包括了 reference 里面的参考资料, scripts 里的脚本, assets 里的资源。只有当 ai 进一步判断任务需要更详细的信息,或者它需要执行某个脚本的时候,它才会去按需加载,并且脚本它是只执行不读取的,完全不占用托克。 好了,这下我们完全理解 skill 的 按需加载,也就是官方定义的渐进式批漏机制和三层结构了。可是对于普通人来讲,这又是写 markdown 又是脚本的,好像创建一个 skill 还是挺复杂的。 no no, no, 现在谁会用手写呢?我是用这个创建 skill 的 skill 啊,秋之 skill creator 创建的。 那这个呢,是我基于很火的 skill 创建器改良的一个更加互动式,更加小白的一个 skill 创建器。那大家把它下载下了以后,放到这个点儿 cloud skills 文件夹里面就好了。那下好之后,我们想要创建什么 skill, 直接打开 cloud 直接跟它说就行, 或者我们也可以斜杠来调用他,那他呢,会开始一步步的引导和追问我们,来帮我们梳理这个需求。而且我特意设计的是这种用选择题的方式来追问我们整个过程,我们就只需要用大白话回复他的问题,以及按一按上下键做一做选择题就好了。 他这个追问的过程啊,到时候大家问题可能和我现在这个不一样,因为他会根据你的需求去做灵活的调整啊,他都是现编的。 然后呢,这个过程中因为我们要做图片,所以我们还需要给他提供 logo 图的参考,以及那个 nano 不 nana 的 a p i 和文档。那我也给他直接拖到了这个项目文件里,然后告诉他了一下这个文件的路径, 他就会自己去参考和把它们放到 excel 文件夹里面。那这两个素材我也都已经放在了我们的课后网页上了,大家可以去用做练习来试试复现它。 那问完这些问题之后呢,他还会给我们核对一下方案,如果我们看着方案没问题,那他就会自动帮我们生成所有的 skill 文件了。 那做好 skill 之后呢,他还会帮你想几个例子来跑一下测试。我们这里其实测了好几个,风格都很一致,很好看。大家在这个调整的过程中,也可以去点开他写的这些 skill 文档来手动的修改一些,反正都是提示词嘛。 所以总之只要你有明确的输出要求,或者有明确的方法规范流程知识,创建器就会指引你帮你来写出一个定制的 skill。 而且除了自己创建,网上也有很多现成的 skill 资料里,我也整理了一些集合网站和 skill 仓库,成千上万的 skill, 大家可以去逛逛。并且我也给大家打包了几个普通人常用的必备 skill, 比如做 ppt, 处理文档, excel, pdf 这些基础的,我们直接把它拖进 skill 文件夹就可以,一句话让它帮你把乱糟糟的表格梳理得整整齐齐。 还有这个官方的前端设计 skill, 这是直接让 cloud code 生成的前端网页,而这个是挂载了这个前端 skill, 做出来的网页,效果明显大幅提升。还有这个动画生成的 skill, 用这么一段提示词就可以做出这样一段演示动画。 当然大家也不用去装一堆自己根本用不上的技能,一个游戏英雄也只需要四个技能 q w e r 就 能杀遍全场。所以最有效的还是把你最最高频做的几件事,打磨成一个你独家的稳定产出的 skill。 尤其是你对结果有明确的要求,你有经验和方法,你验证过的事情。 比如说打工人,你的周报每周都要写,那就做一个让 ai 来主动采访你,然后出周报的一个 skill。 比如说老师每节课都要背课,那就做一个你只要给出课题,就能给你一整套课件习题和 ppt 的 skill。 又比如说,你总是要给你的文章配图,那就做一个给他一篇文章,他就按你的风格做配图的 skill。 又比如说,你总是在审核,那就做一个按照你的规矩自动批阅合同来写备注的 skill。 因为大多数的人都不需要成为一个技能开发者, 我们只要先把自己掌握的小技能交给 ai, 让他替你重复劳动。好了,资料链接都在评论区了,大家动手试试吧!这个时候呢,点赞、收藏、关注的技能就该出发了,我们下次见了!

哈喽啊, chu 友们,这个和这个是我用 solo 加同一段 prom 做出的头像生成器网页,我们对比一下,看一看是不是右边的这个整个 ui 上看着更精致更高级。其实做它俩时的唯一区别就是我在开发右边这个网页的时候加了 skills。 是 的, chu 现在已经支持 skills 了。 skills 是 基于高标准的重复工作沉淀的可复用技能包,可以持续稳定地按照你的要求输出高质量的产物。 那么如何在 tree 里创建 skills 呢?有两种方式,第一种,直接在对话中描述你的需求,比如我这里对 ai 说创建一份能审查我的代码效果问题的 skill, 你 看 ai 会直接帮我写一个 markdown 文档,然后放在 tree skills 下面的对应文件夹中。第二种,从设置中创建, 点击设置按钮,进入规则和技能页面,在技能模块处点击创建。这里你可以直接导入现成的 skill 文件进行智能解析。因为 tree skills 是 基于开放的 agent skills 标准构建的,完全兼容社区生态。 当然,你也可以手动输入技能名称描述和指令,添加更符合你需求的工作流及工具调用。现在我添加好了一个前端设计的 skill, 我们在做图像生成器的时候就可以用到它了。你看在 ai 对 话流中可以看到它自动调用了这个前端设计 skill。 如果你的任务比较复杂或者需要持续稳定输出的时候,你也可以在 prompt 中明确告诉 ai 要用哪个 skill, 这样你就可以更精准的控制输出结果了。就像这个网页前端设计的优化一样, 使用 skills 是 可以帮你稳定地按照你的标准输出高质量结果的。除此之外呢,还可以自动化你的重复性工作流,甚至成为专业能力规范知识进行沉淀和分享的方式。所以快去吹 solo 中试试吧!中国版和国际版都有哦!

全网爆火的扣子 skills, 详细的操作 sop 流程来了,从零到一,手把手教你如何搭建 skills, 这里呢是我搭建的一个是 ai 实时抓取新闻数据的 skills, 一个文案润色 skills 包括爆款标题的 skills, 以前入色文案需要一个智能体,打开一个对话框,然后热点搜索,打开一个智能体,一个对话框,对吧?那现在有了这个 skills, 我 们只需要在一个对话框中直接三个技能同时调取 来,我们直接来上案例,比如说搜索全网关于 ai 最新热点新闻,并提炼总结爆款文案, 三条爆款,来我们看看他是怎么来工作的,你看正在加载技能热点已经提炼出来了啊,在写脚本,三条标题封面文字,你看标题封面 包括核心策略说明都给你写的明明白白,这里呢等于是调用了三个技能,一个是热点搜索,一个是文案润色,一个是爆款标题。那这是怎么实现的呢?其实很简单, 下面呢我们来一步一步来实现,首先呢就是这里扣子平台网站打开之后呢,点击这里右边有个技能,在这里用自然语言去描述就可以了,你看我们具体到我们每一条我们文案润色的技能, 那根据用户输入的话题,或者对标的文案或者新闻热点进行文案二次创作一篇爆款短视频文案,他呢就会自动的给你生成一个技能,但是呢,这个技能肯定不是你 最终想要的结果,肯定不好,对吧?那我们需要一步一步的去调整,怎么调整?这个很关键,你看下面,我说开头钩子不够好优化开头钩子爆款短视频文案最重要的标准就是看开头 有没有开好,开好了就成功了一半,对吧?那他呢,就会再根据这样的信息再去优化,那经过这样一轮两轮三轮的优化,最后呢结果呢?就差不多了,但是呢,在扣子平台呢,你这里只能使用豆包模型, 懂的都懂,对吧?你要想让他更牛逼,输出的结果更好呢?一个是你优化你的,这里你看 skill 的 就是你,其实也是贴着词,说白了还有一个呢,就是要换大模型,换大模型呢就就不能在扣子平台上去用这个技能了,我们需要跑到 本地化部署你这个技能,那具体怎么实现呢?其实也很简单,我这里呢给大家稍微简单的说一下,你看点击右边这个文件夹这里把它点开,点开之后呢,左边有一个点 skills 文件,你看直接点击下载好。 下载完之后呢,你打开这个 tree, 这个是本地话的软件,打开之后点击右边这个设置,设置下面 找到规则和技能,点开下面有一个技能创建技能,你看这里我现在已经有四个技能了,我再创建一个点击,然后我把刚才我们从兔子平台下载的那个技能呢加载上来就可以了, 你看就这个润色文案的技能呢,就加载上来,加载上来之后呢,我们可以点开看看他的这个技能里面都有哪些内容,你看角色战略,核心原理,营销 人设风格,那这些呢?发现没有,还是我们体式词 prompt, 但是这个体式词呢,又和我们智能体那个体式词还有略微的不一样,因为这里我们要把它给分层, 你看热点捕捉借势的方法,给它弄成一个单独的文件,让 ai 去调用。这样做的好处呢,就是为了节省 tok 嘛,之前 tok 太多很费钱,一个是提高效率,一个是节省钱。你看平台包含文案结构提炼出来放成一个文件夹, 然后呢这个 skill 的 点 md 呢?它就会根据需要来去调取这里面的信息, 来最终生成你的爆款文案。我们总结出来最核心的就是最少必要知识。什么意思?就是把你认为的和网上所有那些讲短视频文案怎么写的老师,把他们的核心观点,核心技能给他提取出来, 就写成这样的文档放到这里面,那 ai 呢,就会直接来拿来参考用了,那最终呢,在右边这个对话框呢,他就会是自动的去调取对应的技能 来生成你需要的内容。那所有的这些操作步骤呢,都在我们总结的这个非熟文档了,需要的兄弟直接说一下拿去。

什么是 agent skill? 你 有没有遇到过这种情况?同样的提示, ai 每次给的结果都不一样,有时候好用,有时候完全跑偏。今天教你一个方法,让 ai 像专家一样稳定输出,而且还能跨平台复用。我们先来看一个真实的场景, 假设你录了一个视频,用 ai 自动生成了字幕,但字幕里有一些错别字,比如 cloud code 被识别成了克劳德 code, skill 被识别成了死狗。那怎么办呢?你有一份原始讲稿,想让 ai 对 照着讲稿,把字幕里的错别字修正过来,听起来很简单,对吧?我们来试试。 第一次,我给 ai 发送提示词,请根据这份讲稿处理这个字幕文件。 ai 回答了,改了一些地方。第二次,同样的提示词,同样的文件,结果呢? ai 这次改的地方不一样了,有些该改的没改,不该改的反而改了。第三次,每次结果都不同。这就是 ai 生成的不确定性问题。 同样的输入,每次输出都可能不一样。你可能会说,那我把提示词写得更详细一点不就行了?确实,详细的提示词能提高准确率。但问题是,第一,每次都要复制粘贴一大段提示词,很麻烦。 第二,提示词太长,消耗的 token 也多,成本高。第三,即便提示词很详细, a 的 随机性还是存在。那有没有一种方法能让 ai 在 执行特定任务时,始终遵循同样的规则,给出一致的结果呢?有,这就是 skill 技能。 skill 全称 agent skills, 最早是 antropica 在 二零二五年十月为 cloud code 推出的功能。 简单来说, skill 就 像是给 ai 写的一本操作手册,当你需要 ai 完成某个特定任务时, ai 会先翻阅这本手册,了解任务应该怎么做,有哪些规则必须遵守,需要调用哪些工具和资源, 然后严格按照手册来执行。这样一来,无论你执行多少次, ai 都会遵循同样的流程,结果自然就一致了。 回到刚刚的例子,如果使用了 skill 功能,同样的字幕校对任务重复多次,每次输出的结果都是稳定且符合需要的。那哪些 ide 支持 skill 呢?二零二五年十二月正式将 agent skill 发布为开放标准, 截止二零二六年一月。原声支持 skill 的 ide 有 cloud code、 cursor、 萃死、 anti gravity 等,但像 wind of kiro 这些主流 ai 编程工具并没有原声支持 skill 功能。这就要引出我们今天的主角 open skills。 open skills 是 一个开源项目,就像一个万能适配器,让所有 ai 编程工具都能使用跟 cloud code 一 模一样的 skill 技能。今天我们就以 qio 为例,演示如何通过 open skills 使用 skill。 open skills 的 安装非常简单,只需要一行命令,首先确保你的电脑上已经安装了 node js。 打开终端,输入 npm install gopen skills 安装完成后,可以批量下载 ansorex 港 skills。 然后在项目文件夹新建 agents md 文件,输入 open skill sync, 通过键盘上下键和空格选择要加载的 skill, 回车后即可加载到 agents md 文件中。 open skills 的 工作原理很巧妙,第一, skill 文件存放在 c 盘用户目录下的点 cloud 杠 skills 文件夹里。第二,在项目文件夹中生成 agents md 文件,记录要使用的 skill。 第三, ai, 读取 agents md, 了解有哪些 skill 可用。第四, ai 通过 open skills read 命令,按需加载完整的 skill 内容。这个设计的优势是 ai 不 需要一次性加载所有 skill, 节省 token。 skill 格式与 cloud code 的 完全兼容,任何能读取 agents md 的 ai ide 都能使用。 agents md 文件里会列出所有可用的 skill, 包括名称、描述和位置。 ai 只需要读取这个轻量级的目录,就知道有哪些 skill 可用。当 ai 决定使用某个 skill 时,才会去加载完整内容。回到开头提到的场景,我有一个字幕文件,里面有错别字,还有一份正确的讲稿。在 kiro 中我输入,请根据这份讲稿 处理这个字幕文件。 ai 会读 subtitle proof free 的 详细指令。了解,必须保持时间戳和换行格式对照讲稿只修正错别字,直接保存到原文件。 执行完成后,字幕文件中的错别字都被修正了,但时间戳和换行完全没变,而且无论执行多少次,结果都是一致的。这就是 skill 解决不确定性的实际效果。 来看第二个更实用的案例,从零开始创建一个视频讲稿生成 skill。 很多内容创作者都有这样的痛点,每次写视频讲稿都要反复调整提示词,才能让 ai 生成符合自己风格的内容,而 且下次换个主题又得重新调整一遍。如果我们能创建一个专属的 skill, 把自己的写作风格和要求固化下来,那就能一劳永逸了。第一步,加载 skill creator 到项目。 open skills 生态里有一个特殊的 skill 叫 skill creator, 它的作用就是帮你快速创建规范的 skill。 首先在终端输入 open skill sync, 在 弹出的 skill 列表中用上下键找到 skill creator, 按空格勾选,然后回车 终端显示 ad 的 skill creator to agents md current skills 一, 这样, skill creator 就 加载到当前项目的 agents md 中了。 第二步,使用 skill creator 创建 skill。 现在在 hero 中输入以下提示词,这份提示词既有这个 skill 的 作用说明,又有什么时候调用这个 skill。 同时还有对应的 skill 规则要求。 ai 开始工作几秒钟后,生成了完整的 skill 文件结构,包括 skill md 文件、 references 文件夹、 scripts 文件夹、 assets 文件夹。现在我们来看看这个 skill md 文件的结构,这是 skill 最核心的文件,它决定了 ai 如何工作。 打开 skill md, 你 会看到它分为两个部分,第一部分是原数据,文件开头用三个横杠包裹的部分就是原数据。这里有两个关键字段, name 是 skill 的 名称,必须与文件夹名称完全一致。 description 是 skill 的 描述,这是最重要的部分。 description 的 作用是告诉 ai 什么时候应该调用这个 skill, 写得越清楚, ai 的 判断就越准确。比如这里写了,当用户需要转载视频讲稿、口播文案、教学视频脚本时调用, ai 看到用户说帮我写个视频讲稿,就知道该用这个 skill 了。 第二部分是指令源数据,下面的所有内容就是详细的指令。这部分可以写得很详细,因为它只在 skill 被调用时才会加载。 指令部分,通常包括工作流程、 ai 应该按什么步骤执行规则要求必须遵守的规则、输出格式、结果应该是什么样子?注意事项,特殊情况的处一。比如我们这个 video script writer 的 指令部分就规定了,第一步,必须读取 references 文件夹里的参考文档, 开头钩子必须在二十秒以内。语言要口语化,适合口播,结尾要总结三个核心要点。这就是为什么使用 skill 后, ai 的 输出会如此稳定,因为所有规则都写在这里了。 skill 的 三层结构在文件中的体现是原数据层,包括 name 和 description。 始终加载 指令层是原数据,下面的内容按需加载。资源层是 references, scripts, assets 文件夹按需加载。 ai 看到提示词时,只会先读取原数据层,判断是否需要这个 skill。 如果需要,才会加载指令层,了解具体怎么做。如果指令里提到了要读取某个文件,才会加载资源层,这就是渐性式,譬如的设计, 既节省 token, 又保持灵活。第三步,添加参考文档到 resources 层。现在 skill 的 框架有了,但还缺少最关键的参考风格。我把之前写过的几份优质讲稿放到 references 文件夹里,这些参考文档就是 skill 的 资源层。 ai 在 生成讲稿时,会先读取这些文档,学习我的写作风格。关于资源层,除了 references 文件夹,还可以包含 scripts 文件夹和 assets 文件夹。 scripts 文件夹存放可执行脚本,比如 python shell 脚本 i 可以 调用这些脚本来执行具体任务。 脚本的代码不会加载到 ai 上下文,只会被执行适合处理文件操作、数据处理等自动化任务。 assets 文件夹存放其他资源文件,比如图片模板等,可以是代码模板、配置文件等。 ai 可以 提取这些文件作为参考。比如如果你的 skill 需要批量处理 excel 文件,就可以在 scripts 文件夹里放一个数据处理脚本, i 在 指令中会调用这个脚本,但脚本代码本身不占用 token, 这就是 skill 设计的巧妙之处。 references 是 独取的, scripts 是 执行的,各司其职。第四步,复制到局 skills 文件夹。现在 skill 创建好了,我需要把它放到局的 skills 目录, 让所有项目都能使用在 windows 系统上。全局 skills 目录是 c 盘用户目录下的点 cloud 杠 skills 文件夹,我把刚才生成的 video script writer 文件夹整个复制到这个目录下。第五步,使用 open skill sync 加载到项目。回到我的项目文件夹, 现在需要把这个 skill 加载到当前项目的 agents md 中。在终端输入 open skills sync, 这个命令会扫描全区 skills 目录,列出所有可用的 skill, 让你选择要加载哪些 skill。 我用键盘上下键选择 video script writer, 按空格勾选,然后回车终端显示 a, d, d video script writer to agents md current skills 二、现在打开 agents md 文件,可以看到新增了一条记录。 第六步,执行 skill 生成讲稿。在 kiro 中,我输入阅读这几个参考文件内容,帮我写一个关于 skill 技能的视频讲稿介绍,然后再提供我自己的讲稿思路。几分钟后,一份完整的视频讲稿出来了,开头有吸引人的钩子, 语言口语化,用了类比,结构清晰,完全符合参考文档里的风格。然后我们可以重复几次看,每次生成的结果,都是按照同样的流程进行执行, 从阅读搜索到参考 references 中固定文档,再最后生成文稿,按照一套我们规范好的流程执行。最关键的是,下次写其他主题的讲稿,只需要一句话,写一份关于什么什么的讲稿,那也就会按照同样的标准和风格生成。 你可能会问,这个流程看起来挺复杂的,值得吗?答案是,非常值得。第一次创建 skill 时,使用 skill creator 五分钟创建标准结构,添加参考文档 十分钟,复制到大局目录 sync 加载一分钟,总共十五到二十分钟。之后,每次使用一句话,调用 skill, 按一自动按照标准生成,不需要反复调整提示词,每次节省三十到六十分钟。而且这个 skill 可以 在所有项目中附用,分享给团队成员,持续优化和改进。 这就是 skill 的 第二个优势,一次投入,长期受益。讲到这里,你可能会想, skill 不 就是把提示词固定下来吗?表面上看是这样,但 skill 的 价值远不止于此。 第一,渐近式。譬如传统的提示词,无论多长,都会一次性加载到 ai 的 上下文中。这里有个关键问题, ai 的 上下文窗口是有限的,就像人的短期记忆一样, ai 一 次能记住的信息量是有上限的。比如,如果你同时给 ai 发送十个详细的提示词,每个都有几千字, ai 的 上下文窗口很快就会被占满,这时候要么 ai 会忘记前面的内容,要么你就无法再添加新的 skill 或信息。 而且 token 消耗越多,成本也越高。但 skill 采用了三层结构,原数据层只包含名称和描述,始终加载只占用很少的 token。 指令层是详细的执行规则,按需加载,只有被选中才加载。资源层包括参考文档、脚本等,按需加载,只有需要时才读取。这样设计的好处是节省 token, 降低成本。不用的 skill 不 会占用上下文, ai 的 上下文更清晰,不会被无关信息干扰,可以使用多个 skill。 即使有十个、二十个 skill, ai 一 开始只看到他们的名称和描述,不会爆掉上下文。举个例子,传统方式是十个详细提示词乘以两千字等于两万字,全部占用上下文。 skill 方式是十个 skill 的 原数据乘以五十字等于五百字。只占用这么多,当 ai 需要使用某个 skill 时,才会加载那一个 skill 的 详细内容,这就是按需加载的威力。第二,知识沉淀和团队协助。 skill 可以 把你的经验和最佳实践固化下来。 比如你摸索出了一套高效的代码审查流程,可以做成 skill。 你 总结了一套写作风格指南,可以做成 skill。 你 的团队有特定的工作规范,可以做成 skill。 这样,新人加入团队时,不需要花时间学习,直接使用 skill 就 能按照团队标准工作。 同时,网上有很多大神制作好的 skill 技能,大家也可以直接下载到本地进行附用,简直就是工作效率提升利器。第三,与 mcp 的 互补。很多人会问, skill 和 mcp 有 什么区别?简单来说, mcp 是 连接外部工具和数据,比如查询数据库,调用 api。 skill 是 教 ai 如何处理这些数据,比如如何分析,如何输出,它们是互补的关系。举个例子, mcp 可以 让 ai 连接你的日历,获取今天的日程。 skill 可以 教 ai 如何根据日程生成一份工作计划,两者结合, ai 才能真正成为你的智能助手。好了,今天我们深入讲解了 ai skill 技能,记住三个核心要点,第一, skill 解决了 ai 生成的不确定性问题,让结果稳定一致。 第二, open skills 让任何 ide 都能使用 skill, 包括 kiro 这样不原生支持的工具。第三, skill 的 价值在于知识沉淀和赋用,而不仅仅是固定提示词。如果你觉得这期内容有用,记得点赞、收藏、关注,我们下次见!

最近 ai 圈爆火的 agent skills 到底是个啥?今天用三分钟给你讲,看完直接上手用。我们先上结论, agent skills 呢,就是给 ai agent 配了一个工具箱,里面呢全是你常用的工具和操作流程, 关键是这个工具箱它是你自己设计的。我们先来看一下这张图,以前呢, agent 它只有单技能的这个 mcp 可以用,它没有操作手册,我们呢,就只能自己手把手地去指挥 ai, 去调工具干活。在这种情况下呢,遇见相同的任务,就会经常地给 ai 发送重复的指令, 你说一句他动一下,而且每次都得重复说。现在呢,我们有了 agent skills 这样一个组合技能以后,我们就可以直接把那些常用的重复的操作写进这个 skills 里面,我们就像给 ai 做 sop 的 手册一样,下次呢,再遇到同样的活, ai 呢,它就会自动帮你干了, 你也就再也不用重复的折腾了。比如我这里列了三个技能,第一个技能,你看我们每日的热点筛选, 以前呢,我们都是逐个的让 ai 去做,或者自己搭一个工作流去弄,那这样的话门槛就高了。现在呢,直接可以把搜索分析、写报告、发邮件这样的步骤给他按照步骤执行就搞定了。 还有第二个技能,财报分析,找数据分析,评估预判风险,用代码生成报表。还有第三个技能,海报设计,你把你的公司的品牌规范设计要求都放进去,然后让 ai 按照要求去设计海报,我们呢,就可以把这些常规的动作都给他 打包进这个 skills 里面。如果这个不太好理解呢,我这里再举了一个游戏的例子,这张图呢,玩过王者荣耀的应该都比较熟悉了,你看王者呢,每一个英雄都会给他三到四个技能, skills 呢,相当于就是把这些技能给他配了一个固定的连招,比如三一二 a。 编好以后呢,我们再给他绑定一个咒语,下次呢,只要你一念这个咒语,他就会自动释放这个技能的。当然啊,现在的王者是没有这个功能的,我这里呢,就举个例子,方便大家理解。接下来呢,我们再来看一下这个 skills 他 具体长什么样子。 一个完整的 skills 呢,它主要包含以上四个文件,其中它的核心文件就是这个 skill md 了,我们来看一下它具体长什么样。那一个 skill md 呢,它主要有两部分构成,这个以上部分呢,是它的第一部分,也就是它的核心,然后第二部分呢,就是这一块, 就是他的内容。像第一部分这里呢,主要我们就要描述他的技能名称,还有这个技能的功能有哪些,以及什么时候去调用他。那下面这个部分呢,我们就描述指令使用场景,具体执行步骤,还有以什么格式输出,然后给他一个 demo 例子作为参考。 这里呢,我们就不详细的去聊了,感兴趣的小伙伴可以截个图。这里呢,我再补充一点,看,我这里提到了热点,需要根据我的人设进行匹配分析,那这个人设呢,我们就可以把它写进这个参考文档当中,那 ai 呢,就会从这个参考文档去读取人设内容去进行分析了。 如果你想对 skill 进行深入的了解,我们还可以打开这个 cloud 官方开源的 skill 的 仓库,自己进去看一下,它提供了很多模板,大家可以看一下它具体是怎么写的。那最后呢,我们说一下如何使用啊? 像现在除了 cloud code 以外呢,像 coser 去 open code 还有 codebody, 它们都已经把 skill 集成进去了,而且呢官方都有说这个东西具体怎么用,今天呢,你就可以把这个工具下载下来, 然后把你反复使用的那些操作写进 skills 里面来解放你的生产力。如果你用的是确的话,你看用这个就很简单了,你可以直接通过提示词告诉他,帮我去创建一份能审查我的代码效果问题的 skills, 然后呢 他就会去给你生成一个 skills 的 模板文件,看这里面的内容都写了,你遇到不符合的你自己修改就可以了。如果你觉得用代码来处理比较麻烦呢?他也提供了这种直接新建文件的方式, 就按照他的要求去填写就 ok 了。好了,我们今天的分享就到这里了,你也可以在评论区把你想写进 sketch 的 东西在这里分享出来,我们大家一起讨论,我们下期再见,拜拜。

谷歌 antigravity ide 现在终于支持 agent skills 了, 这是 open ai codex 支持 agent skills 之后,又一个 ai 巨头的编程之手,加入了 agent skills 阵营。所以说二零二六年正式成为 skills 元年。 ai 编程从传统的给 ai 编程工具一句提示词,让 ai 临时发挥, 升级为给 ai 编程工具装一套技能,让 ai 按照技能稳定产出代码。 agent skills 是 osopik 最初开发现已成为开放标准的智能体能力扩展格式。 它解决了一个核心问题, ai 虽然越来越聪明,但它缺乏你的领域知识,你的工作流程,你的最佳实践。 而 skills 的 作用就是把公司、团队甚至个人的工作流以及最佳实践,还有脚本等工具像模块一样打包进去,让 ai 编程助手等智能体按需加载,反复复用。所以我特别喜欢用一句话来区分 agent skills 和 prompt, prompt 是 临时指令,而 agent skills 才是长期资产。这次 anti gravity 支持 agent skills 的 意义非凡,尤其是对于非专业开发者,福利最大。 哪怕你完全不懂编程,不会写代码,也可以通过安装现成的 skills, 打造一个真正懂你业务的专属 ai 编程助手。 aging skills 的 本质就是 ai 专用业务手册,通过文件夹和 markdown 文件来打包知识工作流,最佳实践还有脚本、 ai 编程助手等 ai 智能体会,自动发现并且按需加载特定的 skills 来实现能力赋用,还有标准化, 而且是渐进式加载,从而避免上下文爆炸。好,本期视频教大家详显式我们如何在 anti gravity 中使用 agent skills 以及如何创建 agent skills? 并且我选择了一个最具代表性的 agent skills uix pro max。 我们将借助这个 skills 让 anti gravity 创建最为现代化,最为美观的 ui。 这个 skills 能让你在做界面时自动获得专业的配色,排版,布局,还有交互建议,来解决很多开发者做出的产品能用但不美观的难题。 好,想在 anti gravity 中使用 agent skills 非常简单。首先我们要确保我们已经将 anti gravity 升级到了最新版。 好,下面我们可以先测试一下在 antigraph 中使用 anselpic 官方发布的 skills。 anselpic 官方发布了多个 agent skills, 在 官方给出的这些 skills 中包含前端设计的 skill, 还有创建 ppt 的 skill。 下面我们只需要将这个项目克隆到本地。下面我们打开终端命令行,直接用 get 克隆的命令将这个项目克隆到我们本地。好,这里克隆完成,我们直接用 cd 命令进入到这个项目的路径。 根据 anti gravity 提供的官方文档,我们可以将 agent skills 放在这两个路径下,其中这一个就是我们当前的项目路径。如果只允许 agent skills 在 当前项目路径下加载,那么我们就可以放在我们当前的项目路径下。 如果希望 agent skills 在 所有项目中都能调用,那么我们就可以放在这个大局路径下。好,下面我们回到终端命令行,我这里直接用这条命令将 agent skills 放在官方推荐的这个大局路径下,我们直接运行就可以。 然后我们用 cd 命令进入到这个大局路径,然后用 l s 列出这些 skills。 好, 可以看到这里成功将这些 skills 都放在了这个大局路径下。 然后大家如果不习惯执行命令,也可以直接将这些 skills 文件夹全选复制,然后粘贴到 antigravity 存放 skills 的 这个路径下。像这样的话,在 antigravity 中,我们只要创建了新项目, 它都能调用到这个大局路径下存放的这一些 agent skills。 好, 下面我们就测试一下 ansopek 这一些 skills 中的前端设计 skill。 我们回到 anti gravity。 好, 下面我们就可以输入提示词,这里我输入的提示词是创建一个咖啡店的落地页,并且使用这个前端设计的 skill。 在 模型这里,我选的是 gemini pro 模型,因为这个模型非常适合用于前端 u i u x 设计。然后我们直接点击发送, 可以看到这里它正在搜索 skill。 这里它需要运行命令,我们允许它执行。好。非常神奇的是,它这里自动调用了 nano banana 模型来生成了这个网站所需要的这些图像。 然后我们点击打开,这是它生成的第一张咖啡馆内的这个景象的图像,这里放着一杯冒着热气的咖啡。这里它生成了第二张图像,这张图像是咖啡豆的图像,我们可以放大看一下。 anti gravity 自动调用 nano banana 模型来生成图像。这个功能是其他 ai 编程助手所不具备的,因为无论我们在使用 codex 还是使用 cloud code, 它们都不会自动来生成图像,而 anti gravity 它为我们开发这种前端 ui 的 时候,它能自动生成最为适配的图像。 好,这里提示这个咖啡馆落地页,这里已经创建成功,并且使用的是 next j s 还有 telenovela css。 然后下面我们就可以根据他给出的命令来运行一下,看一下效果。我们直接复制他给的命令, 然后打开 anti gravity 的 终端,粘贴这条命令,并且运行好,运行成功。我们直接打开这个链接,打开之后我们就看到了他为我们创建的这个咖啡馆的落地页面,然后这个页面的背景图像就是他刚才调用 nano banana 来生成的这个图像。 这里是这个页面的导航栏,可以看到设计的非常不错。然后我们继续往下拉,在这里他还将刚才生成了这个咖啡豆的图像 也加入到了这个页面中。可以看到它设计的这个咖啡馆的落地页非常精美,而且它用 nano banana 生成的这种配图效果也非常不错,这可以说是 anti gravity 独有的技能。 这样的话我们测试的是在 antigravity 中来加载已有的这一些 skills 项目。好,下面我们还可以测试一下手动创建这些 skill。 在 antigravity 官方文档这里,它给出了手动创建 skill 的 这些步骤,而且这里还给出了一个用于代码审查的最简单的 skill。 下面我们就可以使用官方给出的这个例子,在我们当前的项目路径下来创建这个 skill。 在 当前项目中,创建 skills 非常简单,我们只需要按照官方他给出的这个文件路径进行创建就可以 在 anti gravity 的 终端命令行,我们直接执行这条命令来创建用于存放 agent skills 的 路径。 好,这里创建成功,下面我们就可以将官方给出的这个案例放入到刚才我们创建的路径中,然后我们直接复制这个内容回到 anti gravity。 在 anti gravity 中我们就看到了刚才我们创建的这个路径,然后这里我们新建一个文件 昵名为 skill 点 md, 然后将刚才复制的内容直接粘贴并且保存就可以了。下面我们就可以测试一下调用这个 skill 进行代码审查,输入梯式词,使用 code review 审查当前项目的代码,然后我们运行可以看到这里它正在读 skill md 这个文件,正在分析这个项目的代码。 好,这里完成了代码审查,这里输出了代码审查的这个结果,这里还给出了用于优化这个项目性能的这些建议。这就是我们在 anti gravity 中通过手动创建 skill 并且调用 skill 的 方式。如果想创建更加复杂的 skill, 然后我们可以使用这个开源的项目 skillseeker, 我 在之前的视频中为大家详细演示过,然后如果不熟悉的话,可以查看我之前发布的这一期视频, 它可以一键将任何开源项目或者网站转为 agent skill。 好, 下面为大家演示这一款最强大的用于 u i u x 设计的 agent skill u i u x pro max, 而且它支持多种技术站,包括默认的 html 加 tailwind, 还支持 react next js, 甚至还支持 swift, react native, 还有 flutter。 想在 antigravity 中使用 ui ux pro max 非常简单,然后我们只需要按照官方给出的命令去执行就可以。我们直接先复制这条 npm 命令用于安装这个项目, 然后汇到 antigravity 中。我们直接在 antigravity 的 终端命令行粘贴这条命令并且运行就可以。好,这里安装成功。 下面我们就可以运行这条命令,针对 anti gravity 的 命令进行安装,然后在 anti gravity 的 终端直接粘贴这条命令并且运行就可以。好,这里提示已经安装成功。 在 anti gravity 中,我们只需要用斜杠命令就可以调出 u i u x pro max。 下面我们就可以来输入一个提示词。我这里输入的提示词是让它使用 react 构建一个 to do list, 要求使用拟物化的风格, 包括添加任务,完成任务,删除任务,而且还要具有柔和的阴影和微妙的紧身效果。然后这里我还是使用 jimmy 三 pro 模型,我们直接点击发送。像这样的话,在 anti gravity 中它就能够使用 u iux pro max 这个 agent skills 来获得 u iux 设计的经验还有最佳实践,从而为我们生成更加美观,更加现代化的 u i。 好 在等待了几分钟之后,这里完成了这个项目的创建,然后我们运行一下,查看一下效果。 可以看到这里他成功为我们开发出了这个你物的 to do list 的。 然后我们可以测试一下添加任务。注入这个任务之后,这里就会出现这个按钮,然后我们点击添加好,这里添加成功。然后下面的任务当完成之后,我们就可以点击完成,我们再添加一个任务测试一下。 好,这里添加成功,当完成之后,我们就点击完成。可以看到他设计的这个你物化的 u i 效果确实非常不错。 这样的话我们就实现了在 antigravity 中使用 u i u x pro max 这个 agent skills 项目实现 ui 设计。 agent skills 还有更多更实用的应用场景。 由于时间有限,本期视频只为大家演示了用于 ui 设计的 agent skills。 后续的视频中,我将为大家演示更多更实用的 agent skills 以及 agent skills 的 使用技巧和最佳实践。

你知道这个 a i a n 的 智能体是什么概念吗?你就说它里面的大模型 m c p skills r g memory 这概念是什么吗?我用一分钟带大家去了解一下这个 a i a n 的 相关的概念。 比如说我们可以以做菜为例,我们做菜呢,我们的大脑就是我们的一个大模型,它来去附赠我们要做什么一个菜,那么我们做菜的话需要一个菜谱,那菜谱会规定我们需要做哪些菜,以及做菜的步骤,这个的话就是我们可以定义成 skills, 那么大模型会根据这个 skills 去帮我完成做菜步骤。那么做菜如果说要使用到任何的工具,锅碗瓢盆这些呢?以及说各种菜类的话,都是属于我们的这个 m c p 的 工具,那我们要大模型会选择性地去选择这些 m c p 的 工具。 然后如果说客人想吃什么,那这个就需要我们的记忆功能了,其实分为两类,一类是长期记忆,一类是短期记忆,长期记忆的会对记忆进行压缩,比如说以前顾客喜欢点什么 啊?之前的顾客点餐习惯短期记忆的话,就是顾客这次想点什么,这次呢不要加葱或者这个这个菜的话需要哪些忌讳的地方,这是我们的记忆功能。当然 r a g 的 话是指什么呢?就是如果说客人想点的菜谱, 想点的菜的话,是厨师没有做过的,这时候厨师呢就可能要去网上去找查找资料,然后查找资料去看一下这个菜怎么去做, 这就是我们的 r a g 的 技术,从这个做菜到上菜这个过程的话,就是我们智能体的一个执行过程,那我们智能体现在我们的 ai 发展已经从逐渐的从一个对话型的助手转身就可以帮你做事,完成任务的一个智能体助手,这就是我们现在的智能体说说的概念。

agent skills 最近的热度真的太高了,如果说 m c p 定义了 ai 调用工具的规范,那 skills 就 能让大模型将复杂的任务按规定的流程稳定运行。现在不少国内的 ide 都将 skills 集成到了自己的工具中。本期视频我会以 code 为例, 介绍什么是 skills, 以及如何通过 code 加上 skills, 让 ied 的 能力再上升一档。 skills 由三块内容组成,原数据、指令以及资源和代码。原数据用简短的描述说明了这个 skills 是 干什么的。 这部分数据会始终加载到模型的上下文中,原数据的内容很少,意味着可以同时配置很多的 skills, 而不会产生太大的上下文成本。 第二部分是指令。如果大模型觉得应该使用这个 skill, 这部分指令的内容才会被加载到上下文中。指令中会存放这个 skill 的 主要内容, 比如这是一个处理 pdf 的 skill, 指令部分的内容就定义了拿到一个 pdf 后如何处理 pdf 的 方式。指令和原数据都会放在 pdf 文件中。第三部分是资源和代码,在第二部分的指令中可以引用其他的文件, 比如要使用高级功能,就让 ai 去读 reference dmd, 要填写表单的话就读 form dmd 也可以指定当遇到某种情况就运行某个脚本,脚本一般都是拍存文件或者是有脚本, ai 会直接拿到运行之后的结果。通过这样一个 skill, 能让 ai 直接多了一个遇到 pdf 之后的处理能力。 同理,我们还可以写数据库迁移的 skill, 但把 review 的 skill 或者视频文案标题分面全部自动生成的 skill, 接下来就是怎么把 skill 在 ai 版本。先来看 ai 版本, 比如我现在想把这个 pdf 的 skill 做成用户级的能力,就在这个目录下创建 pdf skill, 里面放的就是 skill 相关的文件了。我现在手上有一个 pdf 文件,我通过这个 skill 让 code 将 pdf 转成图片,一行说明,直接搞定,完全解放双手,把 skill 集成到 id 中就更好用了。 code ide 最值得关注的特性就是它的快捷模式,这是一种完全的自主编程能力,特点就是无需持续人工介入就可以长时间持续执行。现在这个功能也可以通过 skills 扩展自己的能力了。就以这个 pdf skills 作为例子来演示,如果只想在当前项目下使用 skill, 就 可以在项目的点 code skills 目录下将刚刚这个 pdf skill 放进去。 现在我们要做一件事情,通过快捷模式模仿叉叉 u drop 生成一个定时任务管理页面,再通过 pdf skill 直接将产品使用文档整理成一个 pdf 文档。快捷有三套不同的模式可以选择,选择的场景不同,执行的方式也会不一样。我们这次主要是做个网站,那就选择构建网站就可以了,如果要做复杂项目的话, speak 会更加严谨。 另外,快捷模式还支持本地执行、并行执行和语音端服务的执行,我们这次就选择本地执行。快捷在执行前会自动根据需求对任务进行拆分。我们刚刚已经把 pdf skill 配置到项目中了,可以看到任务的最后一步就是通过 pdf skill 创建用户使用文档 quets 对 skill 的 支持是内置的,只需要把 skills 放到对应的目录中, quets 在 执行的时候就会自动去调用。现在通过前面五步任务,一个 web 项目就生成出来了,大家可以看一下生成的效果。第六步,通过 pdf skill 生成的文件也放在了项目目录内,内容十分详细。 代码能自动生成, pdf 文件也能通过 skill 自动生成。现在你就得到了一个完整的权限项目, 以及一份完整的产品使用说明。 pdf 文档所有你能想象出来的,能用代码写出来的功能,现在都可以作为一个个 skill 了。另外,如果你长时间使用 quick 做项目,会发现它对项目的理解会越来越深,这其实是 quick 的 一个技术突破点,可以做到自主进化,快速学习。以上就是本期视频的全部内容,我是鱼仔,我们下期再见。

ai agent skills 的 数量爆炸式的增长到了十三万个主流的 ai 平台都支持了,包括最火的 open cloud。 作为程序员,我们首先是要去用 skills, 第二呢, 我们所有的软件项目可能都需要开发一个 skill, skill 甚至可以理解成是一个 ai 的 app 的 标准。在 skill 中呢,你其实可以去调用其他的程序,然后还有 m c p, 然后完成一个工作流这么重要的技术。我们通过对 skill 标准的分析,然后我们手写一个 skills, 并最终呢在 cloud open code cache 这里面运行。你只有写过和跑过,你才能真正理解一个技术,就是理解 skill。 作为 cgi 开发者呢,我是希望用 skill 去生成符合我要求的 cgi 代码, 并且呢用 skill 去实现我的代码的自动化构建和测试,这个在我的 cgi 大 项目课程当中准备体现出来。我们先看 skill 标准啊,它就是一个目录,其实也可以像我们 app 一 样以 压缩包的形式去安装。里面呢主要包含四块内容, skill d, m d 这个是必须的,而且名字是固定的,可以只有它,所以我们待会也是重点分析,还有三个可选项,这也没有固定的格式要求。 scripts 里面存放的是脚本,目前呢支持 python 和 bash, 我 们如果是用 c d i 写的程序呢,我们就用 python 的 脚本 来运行它。 reference 里面是渐近式的,譬如内容,这也是为了节省 token, 当满足一些条件时候再去读取。比如说我们让 ar 写 c 加代码用到现成词的时候,我们可以让它读取 reference 里面的一个规则, asset 里面就是一般是,还有就是资源文件,比如说一些图片,也可以是一些参考模板,比如说我们 cmake 的 标准写法。 ai 编程时代,我感觉项目可能还是尽量用 cmake 来管理比较方便。那我们重点来分析 skill 点 md, 它的内容呢?主要分为三层, 第一层是 y a m l 格式的,这部分其实就是 skill 高效的核心,在 skill 没有被调用的时候,我们是只加载这部分内容, 其他内容是在用的时候再加载,这样也是减少 token 的 使用。它里面有多个字典,而且这些字典可能后期会调整。我们说两个最核心的字典是必填的,一个是 name, 也就 skill 的 名字, 名字我之前看的要求是和 skill 的 目录一致,现在好像也不是必须,我们还是把它写成一致。下面就是 description, 它限定在一零二四个字节, ai 呢,再会根据你的描述 判断什么情况下触发你的 skill。 所以 说在这个描述当中呢,我们一般要包含三块内容,这也不是必须,第一个就是你的作用,这个 skill 是 用来做什么的,然后第二个是什么时间触发,第三个是关键词,就是在一些特定关键词的情况,下面我们去触发调用这个 skill, 我们做一个视例啊,手写一个 skill, 当然了这个 skill 本身也可以直接用 ai 生成,很多细节操作我们就不演示了, ai 时代呢,要学习它的根本操作方法,会不但变化,但原理不变。理解了 skill 的 本质,你就可以考虑怎么把它应用到你的项目当中。下次我们再演示一下 skill 和 mcp 的 交互, 我们先用 clode 来演示,后面呢我们再用 opcode、 coser 和确能演示。首先第一个在 clode 当中, 我们 cloud 目录下面有个点, cloud 在 里面,我们创建一个 skills 啊,这里面是 ai 可以 自动去生成的,你比方说你可以让它去生成一个 skills, 我 们在里面手写一下。好,这时候我们可以在里面建立一个目录,就是待会我们要做的这个 skill, 比方说我们这边是 现代 c 加加 modding cpp, 在 这个目录下面呢,我们创建一个文件,这个文件的名字是固定的啊,这个是必须要满足协议的,那我们就是 skill, 大 写的 skill, 而且也是区分大小写的 md markdown 的 格式啊,这样的话我们就是在这个位置创建的一个 skill, 具体怎么安装的,各个平台不一样,而且它一直在变化,有时候可能会自动安装一般,呃,自动安装它其实是有一定风险的,就是说你如果说在里面写了更太多的权限,其实会造成一些问题的。我们打开这个 skill, 好,三个横线中间我们就写它的关键字 name, 跟我们的目录名称一样,然后下面是描述,你在写完之后也可以让 ai 来帮你改,我们在描述中只要包含三块内容, 然后第一个做什么的,然后什么时候调用,使用新特性的时候,然后还有触发条件,一些关键字的触发条件,这个添加完之后我们就可以 cloud 当中去安装,我们直接用语义告诉他要安装这个 skill, 那这时候我们再来列出所有的 skill。 好, 可以看到这就是刚刚我们手写的一个 skill, 下面我们要测试这个 skill 里面的内容,而且我们要确保这个 skill 能被调用到。 所以说我们在这里面加入一段描述,其实就用自然语言描述就行了。比如说我先加一个步骤,让它所有在所有代码前加一个注示啊,这个主要是为了测试一下我的这个 skill 调用了,其实在这里面你应该是写一些规则和一些代码的势力,让 ai 按照你的规则来去写入啊。测试前我们再给一下这个 skill, 在这里面我们除了正常流程之外,我们再加入一个现成词的流程,也就是说如果说你要让它生成代码里面包含现成词,我们就让它去渐近式的批露 swift pool md 里面的内容,同样呢,在这个 swift pool 里面呢,我们也只是放在同一个目录下面 reference 里面, 在这个里面我们也不加入任何的代码,我们只是说明一下,在代码前加入这样一个注示,这里面用指令让它生成 c d r 十四的包含现成池的代码。可以看到在这一步的话,它就已经进行了 sql 的 加载,然后读了一个文件,这个文件其实就读的我们现成池的代码, 这是我们看它最终生成的代码是否包含了我们加的两行注示。 好,可以看到我们两行注是夹在了它的生成的代码前面,就是我,也就是我们 script 的 执行成功了,我们再来准备一个 python 的 代码,这个 python 代码当中调用的一个执行程序,这个执行程序就可能是我们 c 加加或者是其他语言写的程序, 然后我们在 skill 点 m d 当中,我们把流程里面增加两项运行这个 python 脚本,并且输出控制台的内容就是我们再来测试一下,这里我们直接通过杠命令直接运行 skill, 可以 看到它是完成了任务, 并且打开了我们这个执行程序,我们再把这个做好的模型到 open code 当中去运行。在 open code 呢,它的兼容性比较强,我们可以直接把 cloud 里面的 skill 直接复制过去,甚至不用复制,你告诉他在哪边,让 open code 再进行一下安装。 我们安装完成,我们在 open code 当中再去执行这个 skill 去生成代码, 可以看到代码生成呢,它也调用了相应的说明文件,并最终执行了这个执行程序。 我们再到 cursor 当中, cursor 呢,目前它是 skill 安装在当前目录的点 cursor, 然后 skills 目录下面,然后我们可以手动复制过去,也可以就直接用让它去自己去安装,把文件复制过去,所以在这里面我们选择了让它自己安装, 安装完成之后我们确认,然后这时候我们来测一下这个 skill 输入生成代码的指令, 我打开了执行程序,在 ctrl 当中呢也完成了我们 skill 的 执行。最后到确当中,我们同样执行一遍流程,先是安装,然后执行, 安装过程基本上是一致,我就发现很多功能体到最后的所有的工具都趋同了,现在哪个工具好用不好用,其实我们都可以去试一下。然后一些使用的方法其实我们是可以同步过去的,然后可以看到这个安装好之后我们同样去执行这个指令, 可以看到执行的执行代码生成的,然后我们的执行程序调用需要我们确认一下,确认完之后 它也完成了调用。我们现在开发出的应用除了要提供 skill 之外,也要考虑支持 m、 c p。 以后所有应用的入口都是 ai, 你 的程序是一定要给 ai 调用的。最后记得点赞关注夏老师, ai 快 速发展时代还是要打好根基,想要学习 c 加加的同学可以看一下评论区。

你以为 ai 助手已经很强大了,其实真正让 ai 变得无所不能的秘密,就藏在 agent 和 skills 这两个词里。很多人用 ai, 却没搞明白这俩到底有啥区别。今天我就用最简单的比喻,一次性讲透。先说 agent, 你 可以把 agent 想象成一个刚入职的实习生,脑子灵活,理解力强,什么都能聊两句。 但你真让他干活,比如打包一个 github 项目,整理一堆文件,他就蒙了,因为他没你的工作手册,不知道具体流程。这时候 skills 就 登场了。 skills 其实就是一套 sop 手册,把每个具体的工作流程、脚本、模板、规范都整理好,随时可以查 agent, 只要需要,就能自己翻手册,按步骤把事办妥。 那 prompt 又是什么? prompt 就 像你站在实习生旁边,临时口头交代任务,今天让他写公众号开头,明天让他改,语气灵活但不长久,对话一关啥都没了。而 skill 是 长期有效的能力库, agent 随时能用,所以 agent 是 会思考的执行者。 skills 是 可附用的能力模块,两者结合, ai 才能既聪明又能干,帮你解决各种实际问题。你觉得 agent 和 skills 哪个更重要?评论区聊聊你的看法。

如果你觉得现在的 ai agent 还不够好用,那很可能你还没用过 agent skills。 它是 snoop 及 m c p 之后推出的新一代 agent, 开发标准是基于通用 ai agent 的 工程扩展包。通过加载不同的 skill, ai agent 就 可以分装成具备专业知识的垂直 agent, 从而稳定可靠地完成特定领域的具体工作。比如加载一个金融类的 skill, 它就可以帮我们自动完成财务分析以及日常费用报销等等。加载一个法律类的 skill, 它就可以帮我们自动处理合同审查、 准备诉讼材料等等。可以说不论你从事哪个行业, agent skills 都能帮你把工作中重复的那些流程封装成一个 agent, 让它去自动执行,帮你节省大量的时间。而且随着它的使用范围越来越广,目前主流 ai 编程工具几乎都已经支持了 agent skills, 比如像 cursor、 cloud code codex 等等。 那这期视频我们就来为大家详细介绍 agent skills, 包括它的使用方法、运行原理、资源查找以及技术优势。好了,下面我们就来开始今天的视频内容。 接下来我们使用 cloud code 来介绍 it 的 skills, 如果还没有安装 cloud code, 可以 按照这个文档去安装,首先安装 root js, 然后如果是 windows 用户,还需要安装 git, 接着执行这条 npm 命令安装 cloud code, 安装完成以后可以执行 cloud, 刚刚默认验证一下是否安装成功。那如果是国内用户,直接使用 cloud 模型可能不太方便,我们可以给 cloud code 设置一个国产 ai 模型,比如像 deepsea、 千问 kimi k 二都可以。 那这里我们以 g i m 四点七这个模型为例来演示一下,这个 i 模型呢,有提供一些免费额度,而且效果也挺不错,那可以看到它这里支持三种配置方式,分别是自动化助手、自动化摇本,还有手动配置, 我们选择。第一步,我们需要在用户目录下的点 cloud 文件夹里面的这个 settings, 点 jason 这个文件中添加上下面这段 jason 配置。 我们先打开用户目录,那由于点 cloud 是 一个隐藏文件夹,默认是不显示的,要让它显示的话, mac 用户可以同时按下 command 加 shift, 加点这三个键。 windows 用户呢,可以在文件资源管理器中点击查看,然后显示,然后勾选上隐藏的项目, 这样就能看到这个点开了的文件夹了。然后我们打开这个文件夹,找到 settings 点 json 这个文件,如果没有这个文件,可以自己手动创建一个,那接着我们把这段 json 配置复制过来,注意这里这个 api key 要替换成我们自己的 api key, 在 这里新建一个,然后复制过来就可以了。 然后第二步,我们需要在用户目录下的这个点 cloud 点 json 这个文件中添加上这个配置参数。我们回到用户目录, 然后打开这个点 cloud 点 json 文件,我们可以在这个文件中先搜一下是否已经配置了这个参数,那可以看到这里显示它默认是包含这个参数的,那我们就不需要再去配置它了。好了,完成配置以后,我们就可以正常使用 cloud to code 了, 执行 cloud 命令,启动 cloud code, 然后选择信任这个配置文件,那可以看到它就成功绕过了这个 astropica 的 身份认证,直接进入到了 cloud code 它的对话页面,我们执行斜线 models, 那这里显示的模型呢?依然是 cloud 模型,它和 glm 模型的对应关系是这样的, cloud ops 四点五和 cloud solid 四点五对应的都是 glm 四点七,而这个 cloud hq 四点五对应的是 glm 四点六。 我们选择使用这个 solid, 也就是 glm 四点七模型来测试一下。好了,现在这个 cloud code 就 可以正常使用了。 那接下来我们来介绍一下如何在 cloud code 中使用这个 it 的 skills。 这是 esoteric 官方维护的一个 get up 项目, 打开这个 skills 这个文件夹,那这些就是 esoteric 给我们提供的一些 skills 势例,比如设计前端的 skill、 操作 pdf 的 skill, 操作 ppt 的 skill。 那这里面对我们最有用的是这个 skill creator, 那 这是一个用来生成 skill 的 skill。 没错, isrook 官方推荐的使用方式呢,就是使用这个 skill 去自动生成你需要的任何 skill。 那 要怎么使用这个 skill creator 呢?我们回到这个项目页面,点击这里,先下载代码, 可以使用 get clone, 或者直接下载这个压缩包,下载完成后,把代码解压出来, 找到这个 skill creator 这个文件夹,然后把它复制到我们当前用户目录下这个点 cloud 文件夹下面的这个 skills 文件夹里面就可以了。如果这个点 cloud 下面没有这个 skills 文件夹,可以自己手动创建一个, 那其他 skill 呢?如果有需要也可以复制过来,比如这个操作 pdf 的 skill, 还有这个操作 ppt 的 skill, 我 们也一并复制过来。好了,这样这三个 skill 就 配制成功了。那接下来我们就可以在 cloud code 中去使用它们了。 我们用 vs code 打开用户目录下的这个点开了的文件夹,那第三个就是刚才配置的 skill。 那 接着我们打开命令行,切换到这个用户目录,启动 cloud code。 好 了。下面呢,我们根据一个真实的工作场景,从零开始来生成一个 skill, 来帮助我们自动化处理重复性的工作。那具体的场景是这样的, 比如我们是一家公司,负责招聘 hr, 每天都要筛选很多份辞职简历,然后根据公司的招聘标准筛选出符合条件的简历,并根据筛选的结果生成一份分析报告,并通过邮件发送给你的上级。 这套流程你可能需要经常执行,那针对这类重复性的工作,我们就可以把它封装成一个 skill 来自动处理。回到 copy, 粘贴上相应的提示词,让它根据我们的工作场景来生成这个 skill, 要求它从一个本地文件夹读取文件夹内的所有 pdf 简历,然后分析简历内容并进行筛选。 筛选过程需要参考公司的招聘标准文档,包括销售、开发这些岗位。接着分析完成以后,要根据这个报告模板生成一份分析报告,并通过 email 发送出去,而且发送 email 的 操作要求是可选的。好了,我们来执行任务, 那可以看到它,这里提示它会使用我们前面配置的这个 skill creator 这个 skill 来完成这个任务,然后它就会引导我们去一步一步完成创建。首先它问我们是否准备了这个招聘标准文档,还是需要让 ai 去生成一个视屏模板, 那这里我们让他去生成数据模板,如果有自己公司的招聘文档的,也可以直接使用。然后他让我们选择邮件发送使用什么方式,我们选择使用 python 脚本。好了,确定方案以后,我们点击提交让他去执行。 执行结束后,我们来看一下这个 resume skinner, 就是 skill creator 给我们生成的这个 skill。 打开这个文件夹,这就是一个典型的 skill 的 结构。首先这个 skill 点 m d, 这是一个 markdown 文件,它里面存储的就是这个 skill 的 主体逻辑。 那可以看到它的内容呢?主要有两部分。首先是这个 skill 的 原数据,包括这个 skill 的 名字还有描述,那 ai 呢?根据这些原数据就可以确定这个 skill 的 功能是什么,什么时候可以调用它。比如我们给 ai 发送消息, 需要筛选某个文件夹下面的简历,那 ai 就 会去匹配所有 skill 的 原数据。当匹配到这个 skill, 通过对比它的描述信息就可以确定这个 skill 呢就能满足我们的功能需求。接着它就会去使用这个 skill, 那 可以发现它的这个匹配原理和 m c p 是 一样的, 但是相比于 m c p 呢, agent's skills 有 一项非常明显的优势,就是投币消耗明显降低,这些我们在后面会具体介绍 好了。在 skill 点 m t 中,除了原数据,剩下的就是这个 skill 的 具体执行逻辑。首先是需要准备的数据包括三个部分,一是存放这个简历的文件夹,二是这个招聘标准的文档, 它这里使用的是这个 reference 这个目录下的这两个 markdown 文件。三是一个报告模板,使用的是 size 目录下的这个 markdown 文件。那准备完数据以后,接着就是读取简历内容,然后分析简历。这里需要注意,在分析简历这一步呢, 它使用了这个 pdf 这个 skill 来读取这个简历的内容。也就是说多个 agent 的 skills 呢,是可以互相联动使用的。我们来看一下这个 pdf skill, 在它的这个 skill 点 m d 文件中,这个表格总结了它知识的功能,这里面包括合并 pdf, 切分 pdf, 提取 pdf 内容等等。我们这个简历筛选 skill 使用的就是这个 extract text 的 这个功能来提取 pdf 简历的内容。 在 skill 中,除了脚本文档,默认都是 markdown 格式的,如果不熟悉 markdown 语法,可以先去了解一下。在我们之前的这期视频中有介绍过 markdown 语法使用也非常简单,只需要几分钟就能快速掌握 好了。我们回到这个简历筛选 skill, 那 在新的 skill 中是否需要调用其他 skill 的 能力呢? 我们可以根据使用需求来决定,比如新的 skill 只是给自己使用,这时候就可以选择调用已有的 skill 能力,那这样可以减少开发和调试的时间,因为已有的 skill 它的能力已经经过了验证。但是如果这个新的 skill 除了自己使用,我们还要分享给其他人, 或者需要多个人去联合开发。最好就不要选择调用已有 skill 的 能力,而是应该告诉 ai 使用脚本去单独实现这部分功能,这样可以确保这个 skill 的 独立性,分享或联合开发都会更方便。分析完简历以后,接着使用这个模板去生成报告, 最后使用这个 scripts 这个目录下的 send email 这个 python 脚本来发送 email。 最后他还给了几个使用视例,只需要这样和 ai 对 话,他就会调用这个 skill 帮我们自动筛选简历。 我们可以选择只筛选简历或者筛选简历并发送报告。那可以看到通过结合 ai 模型的语义理解, ai skills 的 使用是非常灵活的,他可以通过对话内容灵活选择需要的功能,避免浪费 token。 那接着我们再来看一下这几个文件夹,这个 scripts 里面存储的就是可以被 skill 调用的脚本,比如这个发送邮件的脚本,然后 reference 里面就是 skill md 需要参考的文档, 一个是开发人员招聘标准,一个是销售人员招聘标准,里面罗列了很多细色,包括专业背景、工作经验等等。我们可以使用自己公司的招聘文档替换到这些模板,或者直接在模板中按照自己的需要去进行修改。 这个 assess 文件夹里面存放的是 skill 的 一些素材资源,比如像模板文件,公司的 logo, 字体文件等等。这个就是简历筛选后生成报告的模板,可以看到里面的内容还是很详细的,包括通过筛选的人员,未通过筛选的人员,以及每位应聘者在各个方面的具体表现, 能够帮助 hr 快 速掌握应聘者的具体情况。好了,下面我们来测试下这个简历筛选的 skill, 看一看效果怎么样。这里我用 ai 生成了两份开发人员的简历,打开来看一下,左侧这份简历的应聘者呢,没有软件开发的相关工作经验是不符合招聘标准的, 而右侧这份简历的应聘者就有比较好的开发经验,符合公司的招聘标准。我们就用这两份简历来进行测试。把这个简历文件夹拖到这个 id 号框, 然后我们让它去分析这个文件夹下面的所有简历生成报告,但是不要发送邮件,可以看到它提示可以调用这个 resume scanner 这个 skill 来进行处理。我们点击执行, 执行结束以后输出了一个分析结果,而且在这个简历文件夹下面生成了一份 markdown 格式的分析报告。我们把这个报告拖进来看一下, 点击这个预览,这个就是生成后的分析报告,那可以看到内容也非常详细,里面包括报告预览、数据汇总,通过筛选的人,未通过筛选的人以及应聘者在各个方面的评估。那通过这份报告就能帮助我们快速了解所有应聘者的具体情况, 并及时给符合条件的应聘者安排面试。接下来我们再来测试一下这个发送邮件的功能。先来配置一下发送邮件的参数,我们直接问 ai 如何配置这些参数, 按照他给出的说明,我们需要配置这些参数。先来创建一个邮箱的应用密码, 然后复制这个密码保存下来。接着我们让它修改一下这个发送的脚本,我们让它改为从本地环境变量去读取这些参数。 好了,修改完成以后,我们执行 exit, 先退出 client code, 然后执行这几条 export 命令,设置一下这个发送邮件的参数,这里面包括发件人、收件人,还有这个邮箱的英文密码,注意这个密码中间的这个空格要删掉。 然后我们再重新启动 cloud code, 再来重新执行一次这个简历分析任务。但是这次我们要求它在生成报告之后,需要发送电子邮件。 执行结束来看一下这个收到的邮件,那可以看到这里面它没有附带上那个生成的报告,而且这个邮件的内容也过于简单,我们让它来优化一下,要求还是从环境变量读取参数, 而且在邮件中要以附件的形式带上生成的报告,还有所有的 pdf 简历,并且这个邮件的内容要优化一下,需要能够体现这个邮件的用途。 好了,修改完成以后,这个 ai 它自动完成了测试。我们来看一下收到的邮件,这次就没有问题了,首先这个邮件的内容包含了这个邮件的用途,然后附件也包含了这个生成的报告, 还有这些是所有的 pdf 简历,方便去对比查看。好了,那这样我们这个简历筛选的 skill 再经过一些详细的测试,就可以用来帮我们自动筛选简历来处理一些重复的工作了。 那接下来我们结合这个简历筛选的 skill, 来介绍一下 it skills 的 工作原理。在 it skills 的 工作过程中呢,一共有三个角色参与其中,第一就是作为用户的我们, 第二就是我们使用的 ai 工具 cloud code, 第三就是 ai 工具背后使用的 ai 模型,在这里是 g m 四点七, 整个过程大概是这样的,当 cloud code 启动以后,里面所有的 agent skills 都会先把自己 skill 的 原数据加载到 ai 的 上下文窗口中,那这些原数据我们在前面介绍过, 就是 skill 点 m d 这个文件中 skill 的 名字和描述信息,那这些原数据可以用来匹配 skill 的 调用,而且这些原数据呢,通常都很短,长度只有几百个 token, 所以 它们是常住在 ai 上新闻窗口中的,不会造成负担。 然后当用户发送消息要求筛选简历,这个消息就会通过 cloud code 转发到 ai, ai 就 会检测上下文窗口中所有 skill 的 原数据,当检测到这个 resume scanner 这个 skill, 通过匹配描述信息发现这个 skill 恰好能够满足需求, 接着他就会去使用这个 skill 来完成这个任务,那这时候他才会去真正把 skill 的 主体逻辑,也就是 skill 点 md 读取过来,然后按照这个 skill 点 md 里面的设定开始进行处理。 首先调用 pdf skill 提取简历的内容,然后提取这个招聘标准的文档进行简历分析, 接着根据这个分析结果读取这个报告模板去生成报告。最后就是调用邮件发送这个脚本去发送邮件,而且这个发送邮件是可选的,这就是 agent skills 的 执行过程。那可以发现这套设计呢,遵循了一个理念, 就是只有在真正需要的时候,才会把数据读取到 ai 的 上下文窗口,这样就可以大大减少拖延消耗。 比如在 cloud code 启动后, ai 只会获取 skill 的 原数据,而只有在确定调用某个 skill 之后,才会去真正获取 skill 的 各种文档。这种工作方式叫做间接式批录或者延迟加载,主要目的就是减少拖坑的消耗。而且在这个过程中,脚本并不会全部读到 ai 上下文, 只需要读取调用脚本所需的最小信息就可以。那我们这个简历筛选的 skill 后期还可以继续扩展,比如添加面试规划的功能,但是需要注意,一个 skill 不 宜过大,最好合理划分多个 skill, 然后去联动使用多个 skill 来完成复杂的任务,这样更方便管理和扩展。 下面我们再来介绍一个可以查找 agent skills 的 免费网站,就是这个 skills mp, 这里收入的都是 github 上开源的 agent skills, 目前为止一共收入了六六五四一个。要使用它,我们可以点击这个搜索功能, 比如我们搜索关于交易类的相关 skill, 这里就返回了我们需要的。我们打开一个,可以看到这些就是 skill 的 内部文档,包括 skill md, 还有 reference 下面的参考文档 scripts 下面的 shop 脚本。 要使用这个 skill 也非常简单,只需要点击这里下载文件,然后解压出来,把这个 skill 文件夹复制到点 cloud 下面的 skills 文件夹下面就可以了。 我们执行斜线 skills, 可以 看到这个生成交易计划的 skill 就 已经配置完成了,那下面我们用它来生成一份贵金属的交易计划来试一试。 执行结束后,它就给我们生成了一份 markdown 格式的计划文档,我们拖进来看一下, 这个就是生成的这个交易计划文档了,内容还是比较详细的。我们回到这个网站,如果想要查看这个 skill 对 应的 github 项目,可以点击这里跳转到 github, 这些都是可以使用的 skill。 那除了搜索,我们还可以点击这里按照分类来查看 skill, 这里面包括生产工具类、自动化工具类等等,在这里还可以按照 star 树或者更新日期来排序。那这个网站用来快速查找需要的 skill 还是挺不错的。 最后我们来对比一下 agent skills 和 m c p 这两项 ai 技术使用起来让人感觉非常相似,那我们应该选择哪一个去使用呢?其实它们都是 astropica 推出的开放标准,两者的区别主要体现在设计理念和适用场景这两方面。我们先来看一下 agent skills, 结合我们前面这个简历筛选的例子,那可以发现 agent skills 是 在做什么呢?它是在封装一系列需要重复执行的步骤,把这些步骤封装成一个 skill 去自动处理。比如发票报销,也是一个需要重复执行的多个步骤的流程,同样可以封装成一个 skill。 那 mcp 又是怎么回事呢?我们在之前的这期视频中有介绍过 mcp, 有 需要的话可以去看一下。 mcp 的 核心设计理念是什么呢?一句话就是连接万物,也就是把各种外部服务通过 mcp 这个万能的 usb 接口全部接入到 ai 里面,比如各种软件、各种社交平台、网站以及各种数据库等等,所以这两者在最初的设计理念上就是截然不同的。 我这里总结了一个表格,来对 agent skills 和 mcp 做一个对比。先看作用上的区别, agent skills 主要解决的是一件事,就是把步骤、规则、逻辑判断封装起来,也就是说,它是把一套专业的流程直接做成一个可以附用的能力。 而 mcp 干的事情不一样,它的核心作用呢,是给 ai 提供标准化的工具接口,让 ai 可以 安全规范地接入外部的系统,比如像 api、 数据库、底层服务。 再来看适用场景, agent skills 呢,它更适合用在流程固定,需要反复执行,而且依赖专业经验的人物,本质上就是把专业知识固化下来,然后让 agent 按照规则去稳定执行。 而 mcp 呢,更适合用在 ai 需要获取外部数据,或者需要调用外部系统去完成某个操作。比如像查询数据、发送消息、调用接口这些事情,那如果看典型的应用,比如像筛选简历、报销审批、流程审核, 这些都是多步骤、规则强的任务。而 mcp 的 典型场景呢,比如像查询 github, 发送 select 消息、访问数据库,它本质上呢,是在帮助 ai 去使用工具。那再往下看一下使用门槛, agent skills, 它的使用门槛相对比较低, 通常使用 markdown 加一些脚本就可以定义清楚流程,还有能力,但 mcp 的 门槛就要高不少,你需要理解协议配置接口, 有时候还需要去自己部署 m c p server, 对 工程能力的要求更高。最后是我们最关心的偷窥消耗, agent skills 呢,采用的是见进披露的方式, 只有在需要的时候才加载对应的步骤还有信息,所以整体的偷窥消耗相对比较低。而 m c p 往往是一次性加载全部的数据,它的偷窥消耗明显会更高。所以我们可以这样理解 agent skills, 它负责的是怎么把工具用起来, 它们两者并不是替代关系,而是在一个 agent 系统里面各自解决不同层面的问题。那关于 agent skills 我 们就介绍完了,可以说这绝对是一项非常实用的 ai 技能,大家可以想一想在自己工作中存在哪些重复性的流程, 是否可以封装成 skill, 让它去自动执行,然后呢,可以去动手试一试。好了,最后感谢大家的观看和点赞支持,我们下期视频再见,谢谢!

二零二五年十月十六号, anthropic 正式推出了 agent skill。 起初官方对它的定位相当克制,只是希望用它来提升 cloud 在 某些特定任务上的表现。 但大家很快发现,这套设计实在是太好用了,因此行业里很快就跟上了节奏,包括 vs code、 codex、 cursor 等工具都陆续加入了对 agent skill 的 支持。 在这样的背景下,十二月十八日, osrbake 做出了一个重要决定,正式将 agent skill 发布为开放标准,支持跨平台、跨产品服用。这意味着 agent skill 已经超越了 cloud 单一产品的范畴,正在演变为 ai agent 领域的一个通用的设计模式。 那么,这个让大厂纷纷跟进的 agent skill 到底是解决了什么核心痛点?它和我们所熟悉的 mcp 又有着怎样的区别和联系呢? 今天这期视频我们就分几个部分彻底讲清楚这个 agent skill。 我 们首先从 agent skill 的 概念出发,也就是给大家讲明白 agent skill 到底是个什么东西。然后我来给大家演示一下它的基本使用方法。 在了解了基本用法之后,我们再来看看它的高级用法。高级用法一共是包含两块,分别是 reference 和 scp。 最后,我会把 agent skill 和 mcp 做个比较,告诉你到底应该选哪一个。 好了,话不多说,让我们直接开始哦,不好意思,只是想证明自己不是 ai, 那 我们现在真的要开始喽。 那什么是 agent skill 呢?用最通俗的话来讲, agent skill 其实就是一个大模型,可以随时翻阅的说明文档。 举个例子,比如你想要做一个智能客服,你可以在 skill 里面明确交代,遇到投诉得先安抚用户的情绪,而且不得随意承诺。 再比如,你想要做会议总结,你可以直接在 skill 里面规定必须要按照参会人员议题决定这个格式来输出总结的内容。这样一来,你就不用每次对话都去重复粘贴那一长串的要求了。大模型自己翻翻这个说明文档就知道该怎么干活了。 当然,说明文档只是一个为了方便理解的简化说法,实际上 agent skill 能做的事情要远比这个强大,它的高级功能我们待会儿就会讲到,不过在目前的起步阶段,你就把它当成是一个说明文档就行。下面我就用会议总结这个实际的场景带大家看看它到底是怎么使用的。 这里我们使用 client skill, 要想使用 agent skill, 那 当然是要先创建一个啦。 根据 cloud code 的 要求,我们需要在用户目录下的 cloud skill 文件夹创建我们的 agent skill。 所以呢,就让我们先进入到这个文件夹中,然后执行 maker 会议总结助手来创建一个文件夹,这个文件夹的名字就代表了我们 agent skill 的 名字,然后再使用 vs code 来打开这个文件夹,这样的话我们编辑文件会更方便一些。打开这个文件后,我们在里面创建一个叫做 skill 点 md 的 文件, 然后填好这个文件的具体内容,就是这样了,每一个 agent skill 都需要有这么一个文件,它用来描述这个 agent skill 的 名称,能干什么事以及怎么干这个事情的。比如我们这里要创建的 agent skill 就是 用于总结会议目录内容的, 它的 skill 点 m d 一 共分为两部分,头部的这几行被两段短横线包起来的是叫做原数据,英文叫做 matte data。 这一层就只写了 name 和 description 这两个属性。 name 呢是 agent skill 的 名称,必须与文件夹的名字相同。 name 的 下面呢是 description, 它代表这个 agent skill 的 描述,主要是向大模型说明这个 agent skill 是 用来干什么的。然后再看下面剩余的部分,这个呢就是具体的 agent skill 的 说明了, 官方把这一部分呢是叫做指令,对应的英文是 instruction, 这一部分就是在详细描述模型需要遵循的规则。比如说你看这里,我规定了它必须要总结参会人员议题和决定这几个方面的内容, 然后为了确保他真的理解了,我这里还举了一个例子,输入的是会议的录音内容,然后输出的呢就是我们所需要的格式了。好,现在我们的 agent skill 应该是做好了。对,就是这么简单,就是一个说明文档。 下面我们打开 cloud code 来验货,首先随便找一个空目录,打开 cloud code, 然后输入下面这个问题,你有哪些 agent skill? cloud code 给我们回答了,可以看出他已经发现了我们写好的 agent skill。 然后我们来看看 cloud code 是 怎么使用这个 agent skill 的。 我们输入请求总结以下会的内容,然后粘贴一段会议录英文本回车,让我们看看 cloud code 会如何应付我们这个问题。 好, cloud code 有 反应了,大家注意看屏幕,这里 cloud code 并没有直接开始下编,他根据我的指令意识到了这事归我们刚才上传的那个 agent skill 管,所以呢,他是在向我询问能不能使用这个 agent skill, 那 我们当然是同意了。同意之后,他就开始读取我们写的那个会议总结助手了,主要就是读取其中的那个 skill 点 m d 文件,让我们稍作等待 好,结果出来了,参会人员议题决定三点都清清楚楚,这完全符合我们在 skill 里面定的规矩。这个呢,就是 agent skill 的 基础用法了,是不是很简单?现在你知道了如何创建和使用 agent skill, 那 不妨让我们想想刚才到底发生了什么。 首先,整个流程中一共有三个角色,用户 cloud code 以及 cloud code 的 背后所使用的大模型。在我们的例子里,这个就是 cloud 模型 流程一开始的时候,用户会输入请求,此时 cloud code 会把用户的请求连同所有 skill 的 名称和描述一起发给大模型。注意,这里只带了名称和描述, 也就是我们前面所说的 skill 原数据层。虽然说我们之前只演示了一个 skill, 但是你可以想象一下,哪怕你装了十几个 skill, 此时的大模型呢,也只是在看一份轻量级的目录,因为毕竟只有名称和描述嘛。 在接到了用户请求和每一个 skill 的 名称描述后,大模型会发现用户的请求呢,可以使用会议总结助手这个 agent skill 来解决, 此时呢,他就会把这个信息告诉 cloud code。 cloud code 接到大模型的响应之后,会去会议总结助手那个目录里面读取完整的 skill md。 正文儿对,这个时候读取的呢,才是 skill md 的 全部内容,之前就只是名称和描述, 而且要注意,他只读取了会议总结助手这一个 agent skill 的 内容哦。在拿到了会议总结助手的 skill md 内容后, cloud code 会把用户的请求和完整的 skill md 内容发给大模型, 大模型会根据 skill 点 m d 的 要求来生成响应,并且把响应发给 cloud code, cloud code 进而呢,会把这个响应发挥给用户,这样呢,用户就会看到结果了。 这就引出了 agent skill 的 第一个核心机制,按需加载。虽然 skill 的 名字和描述是始终对模型可见的,但具体的指令内容只有在这个 skill 被选中之后才会被加载进来给模型看,这个呢,就节省了很多的 token 了。 前面我们讲了,一开始 cloud code 会把所有 agent skill 的 名称和描述都给到模型,比如说什么爆款文案 skill、 会议总结 skill、 数据分析 skill 等等。模型呢,会从中选择一个, 之后只有选中的那个 skill 的 skill 的 md 文件才会给到模型。说白了呢,就是按需加载,这个呢,已经很省头肯了, 但是它还不够极致。大家试想一下,我们的会议总结助手可能会越来越高级,我们希望它不仅仅是简单复述,而是能够提供更有价值的补充说明。 比如说,当会议决定要花钱时,它能直接在总结里标注是否符合财务合规,当涉及到合同时,它能够提示法务风险。这样大家在看会议总结的时候,就不需要再去翻规章制度,一眼就能够看到这些关键的补充信息,这就非常方便了。 但问题在于, skill 能做这些事情的前提是它要把相关的财务规定和法律条文都写入到 skill 点 m d 文件里。这些文件可能会非常长,都写进去的话, skill 点 m d 文件就会变得无比的臃肿, 哪怕只是开个简单的早会,都要被迫加载一堆根本用不上的财务和法律废话,浪费模型资源。那能不能做到暗虚中的暗虚呢?比如说,只有当会议内容真的聊到了钱, cloud code 才会把财务规定加载给模型看。 其实这个呢,也是可以的, agent skill 呢,提供了 reference 的 概念,干的就是这个活,让我们来试一下。首先我们来给它加一个文件,也就是 agent skill 术语里面的 reference。 我们把这个文件叫做集团财务手册,里面写明了各种费用的报销标准,比如说是住宿补贴五百一晚,餐饮费人均三百一晚之类的。然后我们在原来的 skill 点 m d 文件里面新增一个财务提醒规则,里面写明仅在提到钱预算采购费用的时候出发。 出发的时候呢,需要读取集团财务手册点 m d 这个文件,根据文件内容指出会议决定中的金额是否超标,并明确审批人,这就可以了。我们回到 cloud code 这里再试一下。 这次我们的请求仍然是总结下这个会议的内容,不过呢,这次使用的会议内容稍微换了一下, 这段对话呢,我们就不细看了,你只需要知道,在这段对话里面,老陈让小李订一千二百一晚的酒店,这涉及到了钱。 按道理来说, cloud code 应该触发我们刚才新增的财务提醒规则,让我们看看 cloud code 能不能意识到这一点。首先, cloud code 意识到了这个请求跟我们的会议总结助手相关联,请求使用这个 agent skill, 我 们同意。 然后他意识到了这个会议跟钱相关,根据 skilled md 文件的指示,他请求读取集团财务手册,这个文件用于查看里面的财务合规信息,这个呢,我们也同意。 最后他根据实际的会议内容生成了总结,可以看出,总结中不仅包含参会人员、议题、决定等基本信息,还包含了财务提醒,这完美符合我们的需求。 这个呢,就是 reference 的 核心逻辑了,在 agent skill 的 体系里面,集团财务手册点 m d 这个文件就是一个典型的 reference, 请大家记住它的特性,它呢是条件触发的。 在刚才的例子里面,只有当 cloud code 读取完 skill 的 md 文件,判断出需要查账时,才会去加载这个文件。反过来说,如果这是一个跟前无关的技术复盘会,那么这个财务文件就只会躺在硬盘里面,绝不会占用哪怕一个 token 的 上下文。 好,讲完了 reference, 接下来我们来讲讲如何让 agent skill 跑代码,毕竟查资料只是第一步,能直接动手运行代码,帮我们把活干了,这才是真正的自动化。这个呢,就用到了 agent skill 的 另一大能力, script, 让我们在文件夹里面创建一个 python 脚本,文件名就叫做 uploader pi, 用于上传文件。之后我们填好这个代码文件的内容,然后我们来到 skill md 这个文件里,再加上一段关于上传规则的描述, 如果用户提到了上传同步或者是发送到服务器这样的字眼,你必须运行 uploader pi 脚本,将总结内容上传到服务器。然后呢,我们来到 cloud code 这边,输入请求,总结下这个会议的内容,并把它上传到服务器中,然后我们粘贴会内容。 跟之前一样, cloud code 意识到了这个请求与我们的会议总结助手相关,所以呢,他请求使用这个 agent skill, 我 们同意,然后他把会议的总结内容输出了出来,并准备上传到服务器中,他请求执行 up 六点 pi 文件来实现这个功能,我们也同意 好上传成功。而且 cloud code 还把上传相关的一些信息也展示了出来,非常棒。 这里面呢,有个小插曲,大家注意一下,我这次所使用的会议内容跟钱其实没什么关系,所以 cloud code 呢,也并没有去读取集团财务手册那个文件, 结果中呢,也没有财务提醒相关的内容。这正好印证了我前面所说的观点, reference 是 按需加载的,如果用户没有提到与 reference 相关的内容,那 cloud code 是 不会去读取它的,这样就达到了节省上下文 token 的 目的。 好让我们再回到代码执行部分,注意看这里, cloud code 申请执行这个 uploader pie 文件,它并没有去读取这个文件。没错, agent skill 里面的代码只会被执行,不会被读取。 这就意味着,哪怕你的脚本写了一万行复杂的业务逻辑,它消耗的模型上下文呢,也几乎是零。 cloud code 只关心脚本的运行方法和运行结果,至于这个脚本的内容,它可以说是毫不在意, 所以呢,虽然 reference 和 script 都属于 agent skill 的 高级功能,但是呢,它们对于模型上下文的影响其实是截然不同的。 reference 是 读,它会把内容加载到上下文里面,所以呢,是会消耗 token 的。 script 呢,是跑,它只会被执行,不会占用模型的上下文。讲到这里,我们需要停下来稍微做个总结,聊一聊 agent skill 的 渐进式批漏机制。 agent skill 的 设计其实是一个精密的渐进式批漏结构,这个结构里面一共有三层,每一层的加载机制都不太一样。 第一层是原数据层,这里有所有的 agent skill 的 名称和描述,它们是始终加载的,相当于大模型里面的目录。大模型每次回答前都会看一下这一层的信息,然后决定用户的问题是否与某个 agent skill 相匹配。 第二层是指令层,对应 skill 的 md 文件里面除了名称和描述之外,其余的部分,只有当大模型发现用户的问题与某个 agent skill 相匹配的时候,它才会去加载这一层的内容,所以呢,我们称这一层为按需加载。 第三层是资源层,这个呢,是最深的一层,它一共是包含 reference 和 script 两方面的内容。其实按照官方最新的规范,应该还有一个组成部分叫做 assets, 不 过我看了一下,它跟 reference 的 定义似乎有部分重叠,因此我们这里先忽略它。 好,我们刚才例子里面的集团财务手册和 uploader pie 脚本就属于这一层,只有当模型发现用户问题与财务或者上传相关的时候,它才会去加载这一层的内容, 这就相当于是在按需加载的指令层基础上又做了一次按需加载,所以我们可以称它为按需中的按需加载, 当然这是我起的名字啊。 reference 和 script 的 加载方式其实不太一样, reference 是 被读取的, cloud code 会把对应文件的内容放到模型的上下文中,以供回答式参考。而 script 是 被执行的, cloud code 根本就不会去看代码的内容,它只关心代码的执行结果。 当然这个也不是铁律啊,如果你没有把代码的执行方法说清楚, cloud code 还是有可能会去看一下代码的,毕竟跑不下去了嘛,这样的话呢,就会占用模型的上下文了。所以还是请大家写 skill 的 时候尽可能的把一切都解释清楚。 那聊完了 agent skill 的 用法,很多朋友可能会有种似曾相识的感觉, agent skill 好 像是跟 m c p 有 点像啊,本质上都是让模型去连接和操作外部世界。既然功能重叠,那我们到底应该用哪一个呢? 关于这个问题,按 serapic 官方写过一篇相关的文章来解释,核心观点就一句话就在这里, mcp connects cloud data skills teach cloud what to do with that data。 这句话可以说是直接点明了 mcp 与 agent skill 的 区别,它其实就是在说 mcp 给大模型供给数据,比如说查询昨天的销售记录,读取订单的物流状态等等。 而 skill 是 教会大模型如何处理这些数据的,比如说是会议总结必须要有个议题啊,汇报文档必须要包含具体的数据啊等等。到这里,有些同学可能就会问了, 不对啊, agent skill 里面也能写代码,我直接在 agent skill 里面写连接数据的逻辑不就好了吗?这样呢,就不需要 m c p 了, agent skill 就 直接把这两个活都给干了。 确实啊, agent skill 也能连数据,功能上与 m c p 有 所重叠,但是能干并不代表适合干, 这就好像是瑞士军刀也能切菜,但没有人会这么干。我们这个场景呢,其实也是这样, m c p 本质上是一个独立运行的程序,而 agent skill 本质上是一段说明文档,它们的本质不同决定了适合的场景也是不同的, agent skill 更适合跑一些轻量的脚本,处理简单的逻辑。在代码执行方面, agent skill 的 安全性和稳定性都不及 mcp, 所以 大家还是要根据场景选择合适的工具。甚至在很多的场景下,我们需要把 agent skill 和 mcp 结合起来一起使用,以便尽可能的满足我们的需求。 好,今天的视频呢,就到此结束了,我是马克,用最通俗的语言讲最硬核的技术。如果我的视频对你有帮助,欢迎点赞订阅,我们下次再见,拜拜!


用 agent skills 做知乎检测是一种什么体验呢?它能比传统的分块儿加向量匹配的 r a g 效果更好吗? 大家好,欢迎来到库德明花园,我是花园老师。这一期呢,我们进入 agent skill 的 实战章节,上一期视频中啊,我们介绍了 skill 的 工作原理和使用方法啊,下面我们简单做一个回顾。 skill 是 最近 astropok 推出的一个 a 证领域的行业标准,它呢本身就是一个文件夹,里面存放着具体的使用说明啊,也就是 skill 点 md 更详细的参考文档以及可执行的脚本。 它的核心特性呢,就是渐进式加载策略。在 a 证启动的时候啊,它只会将所有 skill 的 基本描述加入 ai 的 上下文。那当用户发出需求的时候呢, 大家会根据 skill 的 描述啊来判断具体要调用哪个 skill, 对 了之后呢,再去读取这个 skill 的 具体的使用说明,然后啊,根据这个使用说明,进一步的读取更详细的参考文档,以及决定是否要执行某个脚本来连接外部世界。 那通过这样的模式呢,可以让 agent 既能节省大量的上下文,又能精准地响应用户的需求,找到并执行某个技能。 那 skill 的 使用呢,也非常简单啊,你只需要把它的文件夹放到特定的 agent 的 目录之下啊,比如说而 cloud 杠 skills, 那 ai 呢,就会在下次启动的时候自动识别到这个 skill, 并且根据用户的需求判断是否需要调用啊。下面呢,我们就来实战探索一下 skill 啊,有哪些有意思的玩法, 有我的粉丝都知道啊,我本人对传统的通过 truck 加 and bidding 这种实现 ig 的 模式有比较大的偏见啊, 虽然呢,这种模式最后也能调教出比较好的效果,但是啊,调教过程实在是太痛苦了。那我是真正的经历过这个过程的独胆啊,才会有这种感觉啊,相信很多同学也是感同身受的。所以呢,我一直觉得这种方案啊,只是当下的一种妥协模式啊,他终究会被时代淘汰的。 那最近呢,浪漫 index 的 创始人啊,他发表了一条 twitter 啊,我刚才的观点是比较类似的啊,他说 r g 啊,本身是没有死的啊,但是固定的 trunk 加 and binding 这道模式应该已经死了。如果 agent 可可以动态地去扩展周围文件的上下文,那么过多地考虑出一块的大小就没有意义了。 哎,我们可以想象一下啊,这个 agent skills 的 渐进式批量策略是不是有点这个意思呢?所以呢,我们考虑借鉴一下 skill 的 设计模式,来实现一个专用于知识解锁的 skill。 我 希望啊,他能帮我解决下面这些问题。 首先啊,他能够在指定目录里解锁我们关心的问题,比如啊,我让他从公司内部的智库找出最近三年的销售趋势,或者啊,从某个项目资料里找出所有性能优化的建议。 第二点啊,它能够跨多种文件格式进行联合查询,也就是啊,能够根据不同的文件类型选择适合的方式来进行读取和理解。比如说啊, macdown, pdf, excel 啊,这些不同的格式,它处理的方式是不一样的,但是啊,对于使用者来讲,是不应该去操心这些内容的。 第三点啊,不能一上来就把所有的文件全部读取出来,而是需要像人一样,先按一些关键词来逐步的缩小范围,最后再精准的打开少量的相关文件,快速的定位答案。这样呢,可以确保 ai 只需要用到比较少量的头藤啊,就可以准确的找到答案。 第四点啊,他不能简单的给出一堆命中行,而是呢,需要结合上下文,把问题相关的内容拼在一起,尽可能啊给出一条可读的啊,成段的这种回答。 最后啊,他需要能够支持在复杂的问题上进行多人查找,那比如说你问的是对某个政策的关键影响啊,他可能先在目录里锁定几分核心的 pdf, 然后在这些 pdf 里面按章节进行解锁,最后再结合所有之前解锁到的内容啊进行总结回答。 下面我们先来演示一下这个 skill 的 具体效果啊,然后这个呢,是我们在本地创建的一个数据之库啊,它里面包含了几个不同领域的知识,然后也包含多种不同的文件类型。那比如这目录啊,它主要是一些上市公司的具体的财报的数据,然后是 pdf 格式的, 然后这个目录里呢,包含了一些电商的订单的数据啊,比如说这个顾客信息,员工信息啊,订单信息之类的啊,主要是 excel 格式的。 然后啊,还有一些 ai 领域的行业的资料啊, pdf 格式的,然后以及安全领域的一些专业知识啊,有 back down 和 t s t 格式的,那可以发现啊,这个知识库它是非常的分散,并且包含多个不同的格式的,那我们的 skill 的 实际效果怎么样呢? 我们先来问一个金融领域的具体数据问题,我们让他解锁一下致富啊,三一重工前三大股东是谁呢?那首先啊,这个数据啊,存储在我们这个三一重工 q 三的财报的这个数据里面啊,这是个 pdf 文件,这里面有他前十大股东啊,在这个季度的具体的持股的情况。 哎,我们看到解锁成功了啊,这个具体的结果呢,跟实际这个文档里面的结果是完全一致的 啊,我们来看一下它的解锁的步骤啊,首先啊,它找到了我们这个 skill, 然后啊,它通过一些命令找到了我们这个知识库的文件夹,然后啊,它读取了我们这个知识库的目录的文件啊,然后啊,它应该是看到了这个海报的数据是一个 pdf 的 格式啊,然后它进一步的读取了 这个 skill 的 reference 啊,这里面有具体怎么样去处理这个 pdf 的 数据哎,然后它把我们这个 pdf 原本的 pdf 的 数据转换成了 txt, 然后下面啊,他根据用户的问题啊,拆解除了一些关键词,然后开始在这个文件夹之内进行剪辑啊,然后剪辑的过程中呢,他还是分段进行剪辑的,他并不是直接会去读取整个文件内容的,整个过程啊,看起来是非常的智能化啊,并且呢花费的 token 啊是非常少的。 然后下面啊,我们紧接着在这个文件夹追问一些问题啊,比如我问三一重工的母公司的附带表,他的情况具体是什么样的呢?哎,然后这个过程他就快很多了,因为前面他已经把这个 pdf 处理完成了啊,接下来呢,他只需要去使用啊相应的关键字进行剪辑就可以了。 那所以说呢,如果啊,我们本身这个知识库所有的文件就已经是纯文本的,使用这个 skill, 它的剪辑效率应该是非常高的。 然后我们再问一下另外一个文件里面的问题啊,问一下航天动力的啊,他这个前十大股东的持股的情况,哎,然后这个过程也非常快啊,他直接把这个 pdf 处理成了 tst, 然后去匹配里面的内容,很快的给出了结果啊,下面我们尝试问另外一个电商领域的问题啊,正确买了啥? 想要回答这个问题呢,他需要分析两个 excel, 首先啊,是这个顾客表,他需要在这张表里面找到啊,这个名叫证券的人,他的 id 是 什么?然后再去这个订单表,根据用户的 id 找,找到啊,他具体购买的商品是什么? 哎,啊,我们看一下分析结果啊,啊,依然准确地找到了数据啊,是蓝牙耳机。然后啊,我们再看一下它的步骤 和刚刚过程的区别呢,就是他额外去读取了 excel 的 具体啊,如何分析和处理的这个 reference。 然后呢啊,他根据这个 reference 里面给到的方法呢,去具体分析了这个这两张表里面的数据啊,然后正确的给出了结果啊。然后我们再问一个更复杂一点的问题啊,有哪些用户买了儿童绘本,在什么时间? 哎,这次 a 阵更快的给出了结果啊,这个过程啊,已经比较接近于我理想的 ai 智能知识解锁的形态了,其实呢,啊,这个过程也比较像我们正常的一个人啊,去一个大的文件夹里面去找,首先逐步的去缩小范围,然后啊,找到了不同的文件之后, 根据具体的这个参考文档啊,使用不同的脚本,然后去处理啊,然后最后啊,再把这个解锁的知识总结一下,大家觉得怎么样呢? 下面我们来看一下这个 skill 的 实现原理。首先啊,对一个能执行 skill 的 agent, 比如说 open code, 它本身就已经具备了一些基础的文件解锁能力, 比如 l s grab look。 那 我们要做的呢,就是在这个 skill 中教会如何更好地使用这些能力。首先啊,第一步,定位领域,通过分析用户的问题,然后结合知乎的目录导引,定位出知识可能存在的领域啊,也就是文件夹。 然后第二步,定位文件啊,使用 grab 这样的命令,在指定的目录文件里面进行查找,筛选出可能相关的文件。下面啊,再按照不同的工具去读取和分析这些文件的关键部分。比如说不同的文件类型呢,我们有不同的策略,比如啊,对于 markdown 啊,那我们就直接定位到匹配的段落,结合上下文进行分析就好了。 如果是 pdf 呢,我们需要编辑专门的代码去把 pdf 解析成纯文本,然后按页按章节去提取内容。如果是 excel 呢,我们需要编辑代码去提取和分析 excel。 然后啊,只看跟我们本次问题相关的表行和列,而不是把整份表格都提取进来。 那这里呢,还有两条关键的设计原则啊,第一个啊,间接式的解锁啊,尽量少读啊,但是读的要准确,优先去查找最可能有答案的文件。提取文件内容的时候呢,仅提取相关的行,必要的时候再进行扩展范围,避免无意义的投屏消耗。 第二,保持简单可控,那用户呢,只需要告诉他数据库在什么位置,其余的解锁策略都由这个 still 自动去完成。 另外啊,想要让这个知识解锁更高效和精准,还有两个技巧,首先啊,文件夹尽量我们需要按领域去划分,每个文件夹之内呢,只包含特定领域下的文件,比如说啊,金融数据,电商数据啊,另外啊,最好每一个文件夹之下啊,都有一个目录所有的文件 啊,也就是这个 data structure 点 and d。 那 如果说啊,我们文件命名不是很规范,而且呢,包含 pdf 等存件格式啊,这个就是必要的。那这个文件中呢,描述了当前文件夹下每个文件的用途, 比如说我们看一下我们的支付的数据啊,在这个电商的表里边,我们就通过这个目录所有文件啊,告诉他了每个文件里面都大概是一个什么样的数据。那这里呢,我们也参考了 skill 的 电竞式批漏的设计原则,如果有多几欠套的领域呢, ai 找到了这个领域之后,才会去读取这个领域的目录导引。 那这个 skill 具体是怎么实现的呢?其实啊,你把我们上面提到的核心流程,设计原则,关键技巧给到我们上个教程中讲到的 skill creator, 这个 skill 自己就可以帮我们创建出来了,我们只需要经过细微的调整,下面我们来看一下我们这个 skill 的 目录结构啊。首先是 skill 点 md, 它是这个技能的使用说明书啊,里面描述了如何去找本地的知识库, 如何根据目录缩影去逐层的剪索知识,对不同的文件的处理方式啊,具体去参考哪个 reference 以及啊最终的回答风格等等。那这个 reference 呢,具体放置了,具体去分析一个 pdf 或者 excel 的 时候, 再去阅读这个 reference 的 具体文档,会节省 token 和大冒险的注意力。那 script 里面呢,放置了一些 pdf 的 特殊的数据脚本啊,比如说解析 pdf, 或者说 pdf 转图片等等。 那如果我们的本地入户比较复杂啊,比如说后面你还会有其他的格式,我们就可以用这样的思路去扩展 reference 或者 script。 那 我们这个 skill 以及刚刚我们演示过程中使用到的这个 github 上,大家感兴趣呢,可以自己去克隆这个仓库,然后在本地自己去实验啊, 我们可以把这套方案理解为不需要预见向量数据库,本地目录级渐近式剪缩的 r g 啊,它的优势呢,主要在于,首先啊,不需要预见向量数据库 更清亮简单啊,适合快速搭建本地的个人数据库的场景。另外,剪缩更智能啊,传统的 r g 呢,主要靠向量匹配内容,大模型只做总结,而在这个过程中呢,大模型可以参与分词上下文的匹配和决策,并且可以智能进行调整。其实这就是一个典型的 agent 和 r g 的 工作模式啊。 当然呢,当前只是一个初步的尝试,它还有一定的缺陷,首先是首次解锁效率的问题啊,如果啊,我们分析的文件是一个 p f 或者说其他特殊的格式, 它需要先调用脚本进行转换,所以首次效率是比较低的。所以啊,如果你使用这套方案的话,推荐预处理为纯文本,它的它的解锁效率呢,会高很多。第二点啊, skill 的 调用稳定性 在多轮的检测之后呢, ai 可能会去忘记调用这个 skill, 从而丢失一些关键的处理步骤啊。这个呢,在很多其他的 skill 上也会有类似的问题,就要我们从这个 a 帧的扣端层面去解决。 第三啊, token 消耗是要更大一点的,因为整个检测过程是 ai 控制的,当第一次没有检测到想要的答案的时候, ai 会继续切换一些新的参数或者文件进行检测,直到找到最终的结果, 虽然结果更准确,但消耗的 token 可能要更多一点了。刚刚我们介绍的这个 skill 呢,是一个通用的知识解锁的尝试啊, 但是如果你已经有一个固定格式的支库,比如这样一个文档站啊,里面可能已经包含了多个本地的文档了,那我们还可以通过 skill creator, 让它去自己分析我们这个文档站,然后创建出符合我们文档站风格的知识解锁的 skill 啊。 然后啊,我们下面在这个 ezdecet 的 文档站这个仓库里面来测试一下。这个呢,就是我们 ezdecet 本地的这个文档站的仓库了啊,里面其实都是一些 macdown 的 文档。然后啊,我们在这个 skill 里面加入这个 skill creator 这个 skill, 然后啊,我们在这个文档站下打开 open code, 输入这样一段提示词, 我们告诉他当前项目是一个文档占包含多个 markdown 的 文档。我想创建一个专用于知识剪辑的 skill, 它可以替代传统的 r g 用于当前文档占的知识剪辑啊,你来帮我创建这个 skill。 使用中文 skill 的 基本思路是,先根据用户的问题提取出需要剪辑的可能关键字,然后使用 graph 命令找到对应的上页文,然后分析上页文。 如果解锁到的信息和问题不符呢,需要继续解锁其他可能的关键词,最大重试五次。好啊,我们看到这个 skill 已经创建成功了啊,它里面具体介绍了在我们当前这个文案站进行知识解锁的一个最佳实践啊, 因为这个文案站主要就是 markdown 的 格式,没有什么特殊的文件啊,所以它这里面只有一个 skill 点 m d, 没有其他的 reference 或者或者 script, 非常简单啊。下面我们尝试问一个问题啊,解锁支付如何使用 e z desc 生成评估数据集? a i 准确的给出了答案。然后我们再问一个 easy to set 有 哪些分块策略的问题,回答很快,而且答案非常完美啊。 通过这样的思路呢,大家就可以在任何一个你已经在本地建好的一个知识库里面去实现一个知识解锁的 skill 啊。好,我们本期教程呢就讲到这,如果本期对你有所帮助,希望得到一个免费的三连和关注。感谢大家,我们下期见。

最近很火的 agent skill 到底是什么?你会用吗?潘潘带你五分钟搞明白什么是 agent skill。 简单来说, skill 就是 一份给大模型准备的说明文档。 那以前我们想要让 ai 高校干活,是不是需要给他写一大堆提示词,告诉他你是某某领域的专家,为了完成我给你的任务,需要做 a, b, c, d。 那 现在我们只需要把所有的规则和指令全部塞到一个文档里面, 相当于你给 ai 准备了一份员工手册,要用到什么样的内容自己去翻就可以了,不需要我们重复粘贴一样的内容。那接下来就让我们以 gemna 为例,打造一个专属于我们自己的客服助手。 在 gemna 中使用 agent skill 非常直观,核心就是一个文件夹加一份文档。首先我们来创建一个文件夹,名字可以就叫做跨境电商客服助手,然后在里面新建一个 skill 的 md。 这份 skill 的 md 包含了两个关键部分,首先是 meta data, 通常就在文档开头写了这个 skill 的 名称和描述,让 jammy 知道他是一个客服助手,主要是用来处理投诉和咨询的。 接下来是 instruction, 这里就是一些具体的规则了,比如说我规定收到投诉必须要先道歉,问清楚问题之后再给方案,语气呢,要专业并且亲切。那我们接下来来实际演示看一看。当我在 gemma 里面输入一段客户的投诉, jeffrey 就 会首先识别出这个归客服助手馆,再去读具体的指令内容,然后就严格按照指令的要求去生成一些回复,那这就是按需加载,也就是说只有在用到的时候才会去看说明书的具体内容。 那当我们的客服工作变得更加复杂的时候,光光有这么一点点指令已经不够用了,就需要用到 skill 的 高级能力。 reference 和 script reference 其实就是暗虚中的暗虚。假如说我们有非常详细的退货政策,关税政策,洋洋洒洒可能有几千页, 直接塞进指令里面会非常臃肿,那我们就可以把它存为独立的退货政策点 md, 在 skill 点 md 里面呢?我们再去写一下触发的逻辑, 比如说只有当客户提到退货的时候,才会去读取这个文件,那如果说只是普通那些咨询,这个文件夹就直接躺在硬盘里面,完全不会占用模型的头啃,就非常节省资源了。 那如果说客服不光要动嘴,还要干活,比如说要把回复同步到 c i m 系统,我们就需要用到 script, 也就是这个脚本功能,让 ai 直接动手。 比如说我们可以写一个 python 脚本,在 skill 里面就规定好,当用户提到上传或者存档的时候,自动运行这个脚本去上传数据。这里有一点非常关键,也就是脚本只会被执行,不会被提取内容。这也意味着哪怕你的业务逻辑有几万行,也不会消耗模型的上下文。 总结一下, agent skill 的 核心是精密的渐进式结构,第一层是原数据始终在线,也就相当于是说明书的目录。那第二层就是指令层,只有在匹配成功之后才会加载,里面就放了一些具体的规则。第三层资源层, reference 负责读资料, script 负责跑代码,这种设计让你的 ai 工作流变得既聪明又高效。我们还给大家准备了 ansplo pay 官方提供的 agent skills 包,感兴趣的朋友可以在下方评论区留言获取。如果你发现了什么更有趣的玩法,不要忘记给我们分享,我们一起抄作业!