之前我做了一期 agent 的 skills 的 入门视频,评论区有两类比较极端的人,一类人觉得这不就是个提示词吗?另一类人又过于神话,觉得 skills 能做任何方向的事情。其实 skills 的 核心确实是 prompt, 但它也是像 m c p 一 样非常聪明的设计。今天我们就直接看源码,通过两个开源 skills 案例来搞清楚 s 到底是什么,看完你就明白为什么说它是聪明的设计。 ok, 我 们直接在 github 搜索 awesome skills, 这里的 awesome 在 github 里是一个比较知名的词,基本上任何一个技术站你都可以搜到类似的 awesome cool, 它会包含这个技术站所有比较有价值、比较热门的项目。我们打开这个库, 有二十五 k stars, 你 看这里,它把 skills 分 成了好几类。我们先解读第一个 skills 文章提取器。你看一个 skills, 其实就是一个文件夹,里面最核心的就是这个 skill 点 m g 文件,文件最上面是原数据,用三个横线包裹起来。 noun skill 的 名称 description。 简单描述一句话说明这个 skills 做什么, 这就是 skills 的 渐进式。譬如的第一步, cloud 只需要扫描所有 skills 的 原数据,再决定要不要加载完整的指令,做到节省 token 的 目的。这部分告诉大模型两件事,这个 skills 是 干什么的,什么时候应该用这个 skill, 这里就是清晰的自然原指令。 大模型能够理解。这部分是具体的执行步骤,一步一步告诉 cloud 应该怎么做。你看整个 skill 点 m d 文件,就这么简单,原数据核心指令执行步骤。你可能会说,这不就是个 prompt 吗?我直接复制粘贴也能用啊。是的,但它超越提示词的地方在于, 第一,标准化格式,所有 skills 都遵循同样的结构,大模型,知道该怎么写,这个 prompt 直接按照模板填就行。第二,渐近式批录, cloud 不 会一次性加载所有 skills, 它只加载相关的。第三,可组合多个 skills 协同工作。比如先用这个 skills 提取文章,再用其他的 skills 总结文章,然后翻译文章,都是可以的。而且现在 skills 已经成为跨平台标准,其他 ai d e 也都支持。 ok, 我 们再来看官方的 pdf skill, 这个 skill 用来处理 pdf 文件,你看这个文件夹里的内容就丰富多了,这就是简单 skill 和复杂 skill 的 区别。我们先看 skill 的 md, cloud 在 执行这个 skill 的 时候,会先读取 skill 的 md, 理解要做什么,然后调用 script 下面的脚本文件执行实际的 pdf 处理,最后把结果返回给用户。 这就是为什么说 skills 超越 prompt, 它不只是告诉 ai 应该怎么思考,还能让 ai 执行实际的代码。这些代码如果你看不懂的话也没关系,因为都是可以让 ai 生成的。 ok 啊。以上就是两个 agent 的 skills 的 源码解读,通过这两个例子,你应该能理解为什么 skills 超越题是词了,因为它有标准的格式化,它 采用渐进式路由,节省 token, 它可以包涵可执行代码,它可以跨平台赋用。 skills 的 核心确实是 prompt, 但它通过聪明的设计,让 prompt 变得可管理、可敷用、可执行。如果你也在用 ai 做 skills, 欢迎在评论区聊聊你的方法,想看我接下来做什么的话,欢迎关注。
粉丝1491获赞4953

你是小阿八,正在用 ai 开发网站,为了让 ai 生成的效果更好,你告诉 ai 界面不要使用蓝紫渐变色,不要生成一大堆没用的文档,你要遵循公司的代码规范。阿八阿八,洋洋洒洒几百字 之后,每次开发网站时,你都要写这么一段又臭又长的提示词,太麻烦了。于是聪明的你开始想办法, 先把常用的提示词保存到单独的文件,每次手动投喂给 ai。 然后创建了资源文件夹,把公司的代码、规范、设计素材都塞进去,告诉 ai 参考这些去写。 接着你还写了一些脚本,让 ai 生成代码后自动执行格式化运行测试,提交代码到 get 仓库。最后再写着 agent 点 m d 文件,把所有规范和工作流程都写进去,让 ai 自动读取,你沾沾自喜, 嘿嘿,俺这套工作流堪称完美。但很快你发现了问题,随着规范越写越多,文档越来越臃肿,每次对话都要占用很多 ai 上下文空间,浪费 tokens。 于是你找到号称没有人比他更不懂 ai 的 鱼皮,求助阿爸阿爸,俺还能咋办啊?不是有 agent skills 吗?为啥不直接用呢? 呃,啥玩意儿?这可是最近 a h r 爆火的技术,下面我来带你玩转 agent skills, 让你知道它是什么,怎么用,有什么魔力,怎么自己开发。点着收藏,我们开始。 agent skills 是 astropic 推出的一套开放标准,目的是让 ai 能够学习使用各种专业技能,而不用每次都重复输入提示词。简单来说,它就是给 ai 装备的技能包,技能包里有精心设计的提示词、代码、脚本,还有各种资源文件, 把 ai 想象成一个职场小白,给他装上文档处理技能,他就立刻知道怎么生成 ppt 处理 excel 表格。装上代码规范技能,他就知道怎么按照公司的标准写代码。 你挠挠头,呃,等等,这不就是俺在做的事吗?把教 ai 做事的文档和 ai 要用到的文件打包成文件夹差不多,但 osropet 把它做成了一个通用标准,而且在实现原理上有一些新花样。 可恶啊,俺差点就改变世界了,这能有什么新花样?下面我先来带你用一下 agent skills, 再跟你说说其中的奥秘。 目前对 agent skills 支持最完善的工具是 asteroid 官方的 cloud code, 我 们就以此为例,安装并使用 skills, 先打开 cloud code, 并输入命令,添加官方技能市场。这就像是在你的 ai 助手里开通了一个技能商店,接下来你就可以从商店中获取技能了。 然后在 toloud code 中输入命令,安装官方提供的技能包。这着 example skills 包含了一堆官方势力技能,包括前端设计、网页测试、动图制作等等。 装完之后,你就可以直接让 ai 使用这些技能了。比如你要做一个网站,以前没装技能的时候, ai 生成的代码又是那个熟悉的蓝紫渐变色,千篇一律的 ai 审美。 现在安装了 front design 这个教 ai 生成专业设计版网站的技能后,你输入提示词,帮我开发个人作品及网站。 ai 会主动问你,我发现你安装了前端设计技能,需要用它来生成证据设计版的页面吗? 确认之后, ai 会利用技能生成代码,告别篮子渐变,生成独特风格的精美页面。我们不用每次都给 ai 输入一大堆相同的提示词,装一次技能就行了。 除了代码相关的技能,官方还提供了文档处理技能包,同样在 cmd code 中输入一行命令安装。 这只技能包里有 ppt 制作、 word 文档生成、 excel 数据分析、 pdf 解析等技能。接下来,如果你让 ai 做着 ppt, 它会自动调用 ppt 制作技能,直接生成排版好的 ppt 文件,帮你节省几个小时。 你好奇道,咦,为什么 stills 能做到安装即用?技能包里面到底有啥? ai 又是怎么知道该用哪个技能的? 好问题技能其实就是一个包含 still 点 m d 技能说明文件的文件夹,还可以包含可执行脚本资源和参考文档。 由于每个技能的复杂度不同,结构也会存在区别,我们可以在本地目录中找到已安装的技能文件夹。以官方的 ppt 制作技能为例,它的结构是这样的,包含一个核心的技能说明文档, still 点 m d, 还有脚本参考文档和各种资源文件。 而 front and design 前端设计技能只有一个, still 点 m d 文件。 still 点 m d 文件是每个技能的核心,它包含两个关键部分,第一部分是原数据,用 yam 格式写在文档开头, 其中 name 是 技能的名字, description 是 技能的描述,告诉 ai 什么时候应该使用这个技能。 描述写得越清晰, ai 就 越容易在合适的时机调用它。第二部分是指令内容,就是一套经过精心设计的提示词,指导 ai 具体怎么做。以前端设计技能为例,它的指令内容包括设计思考、前端美学指南和必称指南。 你挠了挠头,如果有多着 stux, ai 怎么知道该用哪个技能呢?如果把每个技能说明文的都塞给 ai, 不是 很占用上下文吗? 这就要说到渐进式批漏这个核心机制了。当你让 ai 执行任务时,它会先扫描技能目录,但不会把所有内容都加载到上下文中,而是只读取每个技能的原数据, 发现描述和任务相关,就知道该用这个技能了。然后才把完整的技能说明文档读进来,按照里面的指令执行,并根据需要加载技能包中的其他资源,用到哪个查哪个,既精准匹配又节省上下文,这就是渐进式纰漏的精髓。 所以 agent skills 的 本质就是把专业知识打包成一个文件夹,让 ai 按需读取并使用。呃,那除了 cloud code 之外,其他 ai 工具支持 agent skills 吗?俺平时用 curser 比较多, 当然能, agent skills 已经成为通用标准, curser、 west code code、 dex 等工具都支持。 skills 的 社区也非常活跃,你可以在 cloud skills、 hub 市场开源的 awesome、 cloud skills 等地方找到很多现成的技能, 比如有着叫 uiu 叉 pro max 的 技能特别火,专门用于提升 ai 的 设计能力。用法很简单,首先按照开源仓库文档的指引,安装官方提供的命令行工具, 然后进入到你的项目目录下,根据使用的 ai 工具执行对应的命令。比如我这里用 cursor, 它会自动把技能安装到 cursor 的 配置目录里,安装完成后,可以看到它的文件结构。接下来当你让 ai 开发一个网站时,可以使用斜杠命令手动触发技能,或者让 ai 自动识别技能。 ai 会根据你的需求识别出产品类型和需要的页面类型,然后调用设置点 p y 搜索脚本,在 data 目录里进行多维度搜索,找到适合的配色、字体、布局风格。接下来综合搜索结果,生成完整的设计方案。最后 ai 再按照设计方案生成代码, 这样一来,生成的界面既专业又有设计感。 ai 不 需要把所有规则都背下来,而是用到哪个查哪个,这就是 agent skills 的 精髓。 用了很多别人的技能后,你产生了一个大胆的想法,哎,能不能把公司的周报折式封装成一个技能,以后推荐给新来的同事,还能卖几个钱,嘿嘿嘿。嗯,有点东西,那你打算怎么做呢?当然是发挥程序员最擅长的事情。复制粘贴。 俺先复制一个官方的技能包,修改目录名称为自己的,然后修改技能说明文的 still, 点 m d 的 原数据指令内容这些关键部分。最后把公司的 logo、 ppt 模板爆照样例放在子文件夹里就行了。妈妈再也不用担心我的周报了。 不错不错,但其实有更简单规范的方法。在前面安装的 example stills 官方势力技能包里有一个叫 still creator 的 技能,专门用来帮你创建新技能。你只需要跟 ai 说,帮我创建一个专门生成公司周报的技能。接下来 ai 会问你几个问题, 你希望周报包含哪些主要部分,以什么格式输出?你通常会如何使用这个周报技能?希望周报的语言风格是什么?很快,一个完整的技能包就生成了,你会看到一个点 scale 为后缀的文件,本质上是一个压缩包,你可以把它解压到你的个人技能目录下,你的所有项目都能用。 如果你想让技能只在某个项目生效,可以把它放到项目的 cloud, 同步给项目组其他成员 测试。没问题后,你还可以把它开源到 github, 或者上传到 chaleo 的 stokes hub 这样的社区平台,让所有用户都能用,你开心极了。原来开发一个 stokes 这么简单,但是这玩意儿跟之前火爆的 mcp 和邪道命令有啥区别? 好问题, m c p 就 像给 ai 装上了手和眼睛,让 ai 能够连接外部工具和数据源,比如搜索网页、读取代码、仓库、查询数据库,适合需要获取数据或操作外部系统的场景。 而 agent skills 正像是给 ai 发了一本工作手册,把专业知识和工作流程打包起来,教 ai 在 特定领域该怎么做。 至于斜杠命令,它就像是快捷键,是需要你手动输入常按的命令来触发的固定操作。而 steils 的 特点是, ai 可以 自动识别该用什么技能,不需要你显示调用。对了,其实 mcp 和 steils 是 可以结合起来的。 举个例子,如果你想让 ai 帮你发周报, m c p 负责获取数据,从任务管理数据库拉取这周的任务列表。 skills 负责加工数据,把获取到的原始数据整理成老板爱看的格式,一个提供食材,一个提供配方, 你看这技能文件夹的结构,突然怪叫一声,阿爸,哈!等等,俺突然意识到一个问题,这不就是我们程序员玩烂的封装附用、模块化懒加载那一套吗?写几个代码文件,打着包发到网上,让其他程序员下载下来用 不是一回事吗?为什么 agent stux 能突然让整个 ai 圈为之疯狂?好问题,从技术的角度来看,它并没有发明什么惊天动地的算法。在我看来,它能火主要是两个原因。第一,它是开放标准,封装一次技能包后就能在各种 ai 工具里附用,还能通过社区共享。 更重要的是, stux 能立刻让 ai 的 工作更专业可靠,让普通人无感地享受到技术带来的价值。以前想让 ai 变聪明,你得学提示词、工程配置各种工具链。现在只需要像装 app 一 样安装技能包, ai 就 立刻变专业了。 一项技术的成功不在于它有多复杂,而在于它能让普通用户在不关注技术细节的情况下感受到技术的价值。 你点点头,学会了,学废了。降低门槛才是技术走向大众的钥匙。没错, agent skills 不 仅仅是个技术概念,更是一种新的工作方式。 你可以把它融入到自己的日常工作中,比如把重复的任务封装成技能,把团队的最佳实践固化成技能,让 ai 真正成为你的得力助手。 在这个 webtopod 盛行的年代,技术的门槛正在崩塌,而想象力的边界正在无限扩张。你可以在我免费开源的 ai 编程零基础入门教程中学到更多 ai 编程技巧,也欢迎关注鱼皮,学习更多 ai 和编程的技巧。那么问题来了,你最想让 ai 学会什么技能呢?

哈喽啊, chu 友们,这个和这个是我用 solo 加同一段 prom 做出的头像生成器网页,我们对比一下,看一看是不是右边的这个整个 ui 上看着更精致更高级。其实做它俩时的唯一区别就是我在开发右边这个网页的时候加了 skills。 是 的, chu 现在已经支持 skills 了。 skills 是 基于高标准的重复工作沉淀的可复用技能包,可以持续稳定地按照你的要求输出高质量的产物。 那么如何在 tree 里创建 skills 呢?有两种方式,第一种,直接在对话中描述你的需求,比如我这里对 ai 说创建一份能审查我的代码效果问题的 skill, 你 看 ai 会直接帮我写一个 markdown 文档,然后放在 tree skills 下面的对应文件夹中。第二种,从设置中创建, 点击设置按钮,进入规则和技能页面,在技能模块处点击创建。这里你可以直接导入现成的 skill 文件进行智能解析。因为 tree skills 是 基于开放的 agent skills 标准构建的,完全兼容社区生态。 当然,你也可以手动输入技能名称描述和指令,添加更符合你需求的工作流及工具调用。现在我添加好了一个前端设计的 skill, 我们在做图像生成器的时候就可以用到它了。你看在 ai 对 话流中可以看到它自动调用了这个前端设计 skill。 如果你的任务比较复杂或者需要持续稳定输出的时候,你也可以在 prompt 中明确告诉 ai 要用哪个 skill, 这样你就可以更精准的控制输出结果了。就像这个网页前端设计的优化一样, 使用 skills 是 可以帮你稳定地按照你的标准输出高质量结果的。除此之外呢,还可以自动化你的重复性工作流,甚至成为专业能力规范知识进行沉淀和分享的方式。所以快去吹 solo 中试试吧!中国版和国际版都有哦!

你一不小心打开了这个 tab, 又一不小心在树光树了 scales 手滑点到了第一个项目。恭喜你发现了一个 scales 的 开源合集。这个项目的 star 数已经来到了二十八点九 k。 scales 其实本质上就是将复杂的题词,脚本,还有模板还有资源什么的打包成为一个可用的能力包。在 excel 分 派任务的时候,它可以动态地加载相关的 scale。 这个项目包含了多种类型的 scales 实力,包括创业设计、技术开发、企业工作流什么的。通过这些实力学习如何编写 scale, 点 mac 的 文件,定义清晰的指令和原数据交导 cloud 的 执行,比如说数据分析,代码生成,或者说创建指定类型的文档这些复杂的操作。 那除了开源的势力技能之外呢?该仓库还包含了一些 source available 的 文档处理技能,比如说处理 pdf, word, ppt, 还有 excel 文件的能力,这些 skill 会教你的。 cloud 在 生产级的 ai 应用中,处理复杂的文档的底层逻辑和模式还是挺有参考价值的。我是不是拉 chris 关注我,带你了解更多 ai 相关的开源项目和工具。

谷歌 antigravity ide 现在终于支持 agent skills 了, 这是 open ai codex 支持 agent skills 之后,又一个 ai 巨头的编程之手,加入了 agent skills 阵营。所以说二零二六年正式成为 skills 元年。 ai 编程从传统的给 ai 编程工具一句提示词,让 ai 临时发挥, 升级为给 ai 编程工具装一套技能,让 ai 按照技能稳定产出代码。 agent skills 是 osopik 最初开发现已成为开放标准的智能体能力扩展格式。 它解决了一个核心问题, ai 虽然越来越聪明,但它缺乏你的领域知识,你的工作流程,你的最佳实践。 而 skills 的 作用就是把公司、团队甚至个人的工作流以及最佳实践,还有脚本等工具像模块一样打包进去,让 ai 编程助手等智能体按需加载,反复复用。所以我特别喜欢用一句话来区分 agent skills 和 prompt, prompt 是 临时指令,而 agent skills 才是长期资产。这次 anti gravity 支持 agent skills 的 意义非凡,尤其是对于非专业开发者,福利最大。 哪怕你完全不懂编程,不会写代码,也可以通过安装现成的 skills, 打造一个真正懂你业务的专属 ai 编程助手。 aging skills 的 本质就是 ai 专用业务手册,通过文件夹和 markdown 文件来打包知识工作流,最佳实践还有脚本、 ai 编程助手等 ai 智能体会,自动发现并且按需加载特定的 skills 来实现能力赋用,还有标准化, 而且是渐进式加载,从而避免上下文爆炸。好,本期视频教大家详显式我们如何在 anti gravity 中使用 agent skills 以及如何创建 agent skills? 并且我选择了一个最具代表性的 agent skills uix pro max。 我们将借助这个 skills 让 anti gravity 创建最为现代化,最为美观的 ui。 这个 skills 能让你在做界面时自动获得专业的配色,排版,布局,还有交互建议,来解决很多开发者做出的产品能用但不美观的难题。 好,想在 anti gravity 中使用 agent skills 非常简单。首先我们要确保我们已经将 anti gravity 升级到了最新版。 好,下面我们可以先测试一下在 antigraph 中使用 anselpic 官方发布的 skills。 anselpic 官方发布了多个 agent skills, 在 官方给出的这些 skills 中包含前端设计的 skill, 还有创建 ppt 的 skill。 下面我们只需要将这个项目克隆到本地。下面我们打开终端命令行,直接用 get 克隆的命令将这个项目克隆到我们本地。好,这里克隆完成,我们直接用 cd 命令进入到这个项目的路径。 根据 anti gravity 提供的官方文档,我们可以将 agent skills 放在这两个路径下,其中这一个就是我们当前的项目路径。如果只允许 agent skills 在 当前项目路径下加载,那么我们就可以放在我们当前的项目路径下。 如果希望 agent skills 在 所有项目中都能调用,那么我们就可以放在这个大局路径下。好,下面我们回到终端命令行,我这里直接用这条命令将 agent skills 放在官方推荐的这个大局路径下,我们直接运行就可以。 然后我们用 cd 命令进入到这个大局路径,然后用 l s 列出这些 skills。 好, 可以看到这里成功将这些 skills 都放在了这个大局路径下。 然后大家如果不习惯执行命令,也可以直接将这些 skills 文件夹全选复制,然后粘贴到 antigravity 存放 skills 的 这个路径下。像这样的话,在 antigravity 中,我们只要创建了新项目, 它都能调用到这个大局路径下存放的这一些 agent skills。 好, 下面我们就测试一下 ansopek 这一些 skills 中的前端设计 skill。 我们回到 anti gravity。 好, 下面我们就可以输入提示词,这里我输入的提示词是创建一个咖啡店的落地页,并且使用这个前端设计的 skill。 在 模型这里,我选的是 gemini pro 模型,因为这个模型非常适合用于前端 u i u x 设计。然后我们直接点击发送, 可以看到这里它正在搜索 skill。 这里它需要运行命令,我们允许它执行。好。非常神奇的是,它这里自动调用了 nano banana 模型来生成了这个网站所需要的这些图像。 然后我们点击打开,这是它生成的第一张咖啡馆内的这个景象的图像,这里放着一杯冒着热气的咖啡。这里它生成了第二张图像,这张图像是咖啡豆的图像,我们可以放大看一下。 anti gravity 自动调用 nano banana 模型来生成图像。这个功能是其他 ai 编程助手所不具备的,因为无论我们在使用 codex 还是使用 cloud code, 它们都不会自动来生成图像,而 anti gravity 它为我们开发这种前端 ui 的 时候,它能自动生成最为适配的图像。 好,这里提示这个咖啡馆落地页,这里已经创建成功,并且使用的是 next j s 还有 telenovela css。 然后下面我们就可以根据他给出的命令来运行一下,看一下效果。我们直接复制他给的命令, 然后打开 anti gravity 的 终端,粘贴这条命令,并且运行好,运行成功。我们直接打开这个链接,打开之后我们就看到了他为我们创建的这个咖啡馆的落地页面,然后这个页面的背景图像就是他刚才调用 nano banana 来生成的这个图像。 这里是这个页面的导航栏,可以看到设计的非常不错。然后我们继续往下拉,在这里他还将刚才生成了这个咖啡豆的图像 也加入到了这个页面中。可以看到它设计的这个咖啡馆的落地页非常精美,而且它用 nano banana 生成的这种配图效果也非常不错,这可以说是 anti gravity 独有的技能。 这样的话我们测试的是在 antigravity 中来加载已有的这一些 skills 项目。好,下面我们还可以测试一下手动创建这些 skill。 在 antigravity 官方文档这里,它给出了手动创建 skill 的 这些步骤,而且这里还给出了一个用于代码审查的最简单的 skill。 下面我们就可以使用官方给出的这个例子,在我们当前的项目路径下来创建这个 skill。 在 当前项目中,创建 skills 非常简单,我们只需要按照官方他给出的这个文件路径进行创建就可以 在 anti gravity 的 终端命令行,我们直接执行这条命令来创建用于存放 agent skills 的 路径。 好,这里创建成功,下面我们就可以将官方给出的这个案例放入到刚才我们创建的路径中,然后我们直接复制这个内容回到 anti gravity。 在 anti gravity 中我们就看到了刚才我们创建的这个路径,然后这里我们新建一个文件 昵名为 skill 点 md, 然后将刚才复制的内容直接粘贴并且保存就可以了。下面我们就可以测试一下调用这个 skill 进行代码审查,输入梯式词,使用 code review 审查当前项目的代码,然后我们运行可以看到这里它正在读 skill md 这个文件,正在分析这个项目的代码。 好,这里完成了代码审查,这里输出了代码审查的这个结果,这里还给出了用于优化这个项目性能的这些建议。这就是我们在 anti gravity 中通过手动创建 skill 并且调用 skill 的 方式。如果想创建更加复杂的 skill, 然后我们可以使用这个开源的项目 skillseeker, 我 在之前的视频中为大家详细演示过,然后如果不熟悉的话,可以查看我之前发布的这一期视频, 它可以一键将任何开源项目或者网站转为 agent skill。 好, 下面为大家演示这一款最强大的用于 u i u x 设计的 agent skill u i u x pro max, 而且它支持多种技术站,包括默认的 html 加 tailwind, 还支持 react next js, 甚至还支持 swift, react native, 还有 flutter。 想在 antigravity 中使用 ui ux pro max 非常简单,然后我们只需要按照官方给出的命令去执行就可以。我们直接先复制这条 npm 命令用于安装这个项目, 然后汇到 antigravity 中。我们直接在 antigravity 的 终端命令行粘贴这条命令并且运行就可以。好,这里安装成功。 下面我们就可以运行这条命令,针对 anti gravity 的 命令进行安装,然后在 anti gravity 的 终端直接粘贴这条命令并且运行就可以。好,这里提示已经安装成功。 在 anti gravity 中,我们只需要用斜杠命令就可以调出 u i u x pro max。 下面我们就可以来输入一个提示词。我这里输入的提示词是让它使用 react 构建一个 to do list, 要求使用拟物化的风格, 包括添加任务,完成任务,删除任务,而且还要具有柔和的阴影和微妙的紧身效果。然后这里我还是使用 jimmy 三 pro 模型,我们直接点击发送。像这样的话,在 anti gravity 中它就能够使用 u iux pro max 这个 agent skills 来获得 u iux 设计的经验还有最佳实践,从而为我们生成更加美观,更加现代化的 u i。 好 在等待了几分钟之后,这里完成了这个项目的创建,然后我们运行一下,查看一下效果。 可以看到这里他成功为我们开发出了这个你物的 to do list 的。 然后我们可以测试一下添加任务。注入这个任务之后,这里就会出现这个按钮,然后我们点击添加好,这里添加成功。然后下面的任务当完成之后,我们就可以点击完成,我们再添加一个任务测试一下。 好,这里添加成功,当完成之后,我们就点击完成。可以看到他设计的这个你物化的 u i 效果确实非常不错。 这样的话我们就实现了在 antigravity 中使用 u i u x pro max 这个 agent skills 项目实现 ui 设计。 agent skills 还有更多更实用的应用场景。 由于时间有限,本期视频只为大家演示了用于 ui 设计的 agent skills。 后续的视频中,我将为大家演示更多更实用的 agent skills 以及 agent skills 的 使用技巧和最佳实践。

hello, 大家好,今天想给大家分享一下在课本里面如何使用 skills, 关于 skills 是 什么的话在上面文章已经讲过,今天就不再细讲。本视频的话包含这五部分内容,接下来的话我们就针对每一部分内容进行详细讲解。首先我们用管理员的身份打开 c、 n、 d, 然后进入到我们创建好的文件目录下, 然后我们现在安装一下 open skills。 安装这个东西的目的的话是为了让柯德的项目员可以使用 skills, 然后直接在这个命令行这里输入这一道命令就行了, 如果他在命令行这里打印的这些内容的话,就说明已经安装成功了,然后这下面这一些的话,就是他让我们升级可以先不用管它。接下来第二步的话是安装官方的 skills, 也是一样,在这个命令行这里,然后输入这道命令。 执行完成之后呢,我们可以看到它这边已经报错了,然后看到这个报错原因的话,它是没法访问这个 get, 那 应该就是网络问题,因为 get 是 国外的,这里的话就需要魔法一下。我这边重新设置之后呢,重新执行一下,看看它这边已经执行成功了, 那我们点一下键盘的 enter 键,它就可以将这些 skills 全部都下载下来,如果打印了这些内容的话,就说明已经下载成功了,然后这些官方提供的 skills 我 们都是可以拿来用的。 然后在我们刚刚创建的这个文件这里也可以看到它已经全部都拉下来了。 接下来第三步呢,我们在这个目录下创建一个 markdown 格式的空文件, 然后回到 cmd 这边执行同步命令,然后这里呢也是一样,点击 enter 键 命令框这里打印以上内容的话,就说明已经同步成功了。然后我们打开刚刚我们创建的空文件,它这边的话会显露了一些内容,简单理解的话就是这个 skills 如何使用以及具备哪些 skills。 接下来呢,我们就回到 cmd 进行验证一下,同样的也是打开我们刚刚那个项目, 假设我们现在想让 a s 能测试用力,然后并且使用 excel 的 skills, 将用力写入到 excel 里面。接着这个对话框这里输入这一段指令,然后点击发送 到模型,它就会去读取 excel 的 skill, 然后创建拍成文件并执行 全部执行完成之后呢,它会将临时创建的拍摄文件进行删除,在这边的话也生成了一下文件。然后呢格式这里是不支持打开查看的,我们过来这边查看一下看看, 在这里可以看到它按照我们的要求将用力生成到一下里面,生成效果也不错。 以上的话就是今天分享的格式如何使用 skill 的 一些相关实战操作,今天的话就分享到这里。

如果要说目前最火的 ai 玩法, skills 绝对是当之无愧的,之前因为网络和工薪门槛,很多人只能看着眼馋不过去,终于支持 skills 了,而且我实测了一下,真的是有所就行,今天我就把四种创建 skills 的 方法一次性教会你,详细的操作记录,我也整理成这个文档里面了。 第一种也是最简单的 ai 对 话,自动创建,打开去进入 solo 模式,直接在对话框下打指定,创建一个技能,将文本内容啊转化为小红书风格的图片。 看任务执行完,技能列表里面自动就多了一个文件,好不好用呢?我们直接测一下,将下面的文字转化为小红书风格的图片。这里的话我们不需要任何额外的操作,它会自动调用我们之前创建那个 skills, 看这里生成的小红书图文效果怎么样,如果不满意啊,你还可以继续让它修改样式内容,直到完全符合你的需求。方式二,手动创建,前往设置 规则和技能,找到技能模块,点击创建弹窗里填好名称,描述和指令, 点击保存,系统就会自动生成一个文件。然后方式三的话是导入外部的技能,如果你有现成的样式或者是压缩包,同样在设置里面,点击导入上传文件,解析完成后点确认别人的技能瞬间就变成你的了。 方程四的话是从 gitcap 导入,这个是最强的,看到大佬开源的技能库,你不用去下载,直接在对话框里面把 gitcap 的 地址发给,告诉他安装这个地址,看这里他就已经个人到你的本地技能库了, 如果不知道怎么找到这些开源项目,看这个网址会自动爬起。 gitcap 上面的 skills 现在有六万多个了,都是开源的,直接白嫖。其他的一些细节以及 gitcap 的 地址都在这个文档里面。

如果你觉得现在的 ai agent 还不够好用,那很可能你还没用过 agent skills。 它是 snoop 及 m c p 之后推出的新一代 agent, 开发标准是基于通用 ai agent 的 工程扩展包。通过加载不同的 skill, ai agent 就 可以分装成具备专业知识的垂直 agent, 从而稳定可靠地完成特定领域的具体工作。比如加载一个金融类的 skill, 它就可以帮我们自动完成财务分析以及日常费用报销等等。加载一个法律类的 skill, 它就可以帮我们自动处理合同审查、 准备诉讼材料等等。可以说不论你从事哪个行业, agent skills 都能帮你把工作中重复的那些流程封装成一个 agent, 让它去自动执行,帮你节省大量的时间。而且随着它的使用范围越来越广,目前主流 ai 编程工具几乎都已经支持了 agent skills, 比如像 cursor、 cloud code codex 等等。 那这期视频我们就来为大家详细介绍 agent skills, 包括它的使用方法、运行原理、资源查找以及技术优势。好了,下面我们就来开始今天的视频内容。 接下来我们使用 cloud code 来介绍 it 的 skills, 如果还没有安装 cloud code, 可以 按照这个文档去安装,首先安装 root js, 然后如果是 windows 用户,还需要安装 git, 接着执行这条 npm 命令安装 cloud code, 安装完成以后可以执行 cloud, 刚刚默认验证一下是否安装成功。那如果是国内用户,直接使用 cloud 模型可能不太方便,我们可以给 cloud code 设置一个国产 ai 模型,比如像 deepsea、 千问 kimi k 二都可以。 那这里我们以 g i m 四点七这个模型为例来演示一下,这个 i 模型呢,有提供一些免费额度,而且效果也挺不错,那可以看到它这里支持三种配置方式,分别是自动化助手、自动化摇本,还有手动配置, 我们选择。第一步,我们需要在用户目录下的点 cloud 文件夹里面的这个 settings, 点 jason 这个文件中添加上下面这段 jason 配置。 我们先打开用户目录,那由于点 cloud 是 一个隐藏文件夹,默认是不显示的,要让它显示的话, mac 用户可以同时按下 command 加 shift, 加点这三个键。 windows 用户呢,可以在文件资源管理器中点击查看,然后显示,然后勾选上隐藏的项目, 这样就能看到这个点开了的文件夹了。然后我们打开这个文件夹,找到 settings 点 json 这个文件,如果没有这个文件,可以自己手动创建一个,那接着我们把这段 json 配置复制过来,注意这里这个 api key 要替换成我们自己的 api key, 在 这里新建一个,然后复制过来就可以了。 然后第二步,我们需要在用户目录下的这个点 cloud 点 json 这个文件中添加上这个配置参数。我们回到用户目录, 然后打开这个点 cloud 点 json 文件,我们可以在这个文件中先搜一下是否已经配置了这个参数,那可以看到这里显示它默认是包含这个参数的,那我们就不需要再去配置它了。好了,完成配置以后,我们就可以正常使用 cloud to code 了, 执行 cloud 命令,启动 cloud code, 然后选择信任这个配置文件,那可以看到它就成功绕过了这个 astropica 的 身份认证,直接进入到了 cloud code 它的对话页面,我们执行斜线 models, 那这里显示的模型呢?依然是 cloud 模型,它和 glm 模型的对应关系是这样的, cloud ops 四点五和 cloud solid 四点五对应的都是 glm 四点七,而这个 cloud hq 四点五对应的是 glm 四点六。 我们选择使用这个 solid, 也就是 glm 四点七模型来测试一下。好了,现在这个 cloud code 就 可以正常使用了。 那接下来我们来介绍一下如何在 cloud code 中使用这个 it 的 skills。 这是 esoteric 官方维护的一个 get up 项目, 打开这个 skills 这个文件夹,那这些就是 esoteric 给我们提供的一些 skills 势例,比如设计前端的 skill、 操作 pdf 的 skill, 操作 ppt 的 skill。 那这里面对我们最有用的是这个 skill creator, 那 这是一个用来生成 skill 的 skill。 没错, isrook 官方推荐的使用方式呢,就是使用这个 skill 去自动生成你需要的任何 skill。 那 要怎么使用这个 skill creator 呢?我们回到这个项目页面,点击这里,先下载代码, 可以使用 get clone, 或者直接下载这个压缩包,下载完成后,把代码解压出来, 找到这个 skill creator 这个文件夹,然后把它复制到我们当前用户目录下这个点 cloud 文件夹下面的这个 skills 文件夹里面就可以了。如果这个点 cloud 下面没有这个 skills 文件夹,可以自己手动创建一个, 那其他 skill 呢?如果有需要也可以复制过来,比如这个操作 pdf 的 skill, 还有这个操作 ppt 的 skill, 我 们也一并复制过来。好了,这样这三个 skill 就 配制成功了。那接下来我们就可以在 cloud code 中去使用它们了。 我们用 vs code 打开用户目录下的这个点开了的文件夹,那第三个就是刚才配置的 skill。 那 接着我们打开命令行,切换到这个用户目录,启动 cloud code。 好 了。下面呢,我们根据一个真实的工作场景,从零开始来生成一个 skill, 来帮助我们自动化处理重复性的工作。那具体的场景是这样的, 比如我们是一家公司,负责招聘 hr, 每天都要筛选很多份辞职简历,然后根据公司的招聘标准筛选出符合条件的简历,并根据筛选的结果生成一份分析报告,并通过邮件发送给你的上级。 这套流程你可能需要经常执行,那针对这类重复性的工作,我们就可以把它封装成一个 skill 来自动处理。回到 copy, 粘贴上相应的提示词,让它根据我们的工作场景来生成这个 skill, 要求它从一个本地文件夹读取文件夹内的所有 pdf 简历,然后分析简历内容并进行筛选。 筛选过程需要参考公司的招聘标准文档,包括销售、开发这些岗位。接着分析完成以后,要根据这个报告模板生成一份分析报告,并通过 email 发送出去,而且发送 email 的 操作要求是可选的。好了,我们来执行任务, 那可以看到它,这里提示它会使用我们前面配置的这个 skill creator 这个 skill 来完成这个任务,然后它就会引导我们去一步一步完成创建。首先它问我们是否准备了这个招聘标准文档,还是需要让 ai 去生成一个视屏模板, 那这里我们让他去生成数据模板,如果有自己公司的招聘文档的,也可以直接使用。然后他让我们选择邮件发送使用什么方式,我们选择使用 python 脚本。好了,确定方案以后,我们点击提交让他去执行。 执行结束后,我们来看一下这个 resume skinner, 就是 skill creator 给我们生成的这个 skill。 打开这个文件夹,这就是一个典型的 skill 的 结构。首先这个 skill 点 m d, 这是一个 markdown 文件,它里面存储的就是这个 skill 的 主体逻辑。 那可以看到它的内容呢?主要有两部分。首先是这个 skill 的 原数据,包括这个 skill 的 名字还有描述,那 ai 呢?根据这些原数据就可以确定这个 skill 的 功能是什么,什么时候可以调用它。比如我们给 ai 发送消息, 需要筛选某个文件夹下面的简历,那 ai 就 会去匹配所有 skill 的 原数据。当匹配到这个 skill, 通过对比它的描述信息就可以确定这个 skill 呢就能满足我们的功能需求。接着它就会去使用这个 skill, 那 可以发现它的这个匹配原理和 m c p 是 一样的, 但是相比于 m c p 呢, agent's skills 有 一项非常明显的优势,就是投币消耗明显降低,这些我们在后面会具体介绍 好了。在 skill 点 m t 中,除了原数据,剩下的就是这个 skill 的 具体执行逻辑。首先是需要准备的数据包括三个部分,一是存放这个简历的文件夹,二是这个招聘标准的文档, 它这里使用的是这个 reference 这个目录下的这两个 markdown 文件。三是一个报告模板,使用的是 size 目录下的这个 markdown 文件。那准备完数据以后,接着就是读取简历内容,然后分析简历。这里需要注意,在分析简历这一步呢, 它使用了这个 pdf 这个 skill 来读取这个简历的内容。也就是说多个 agent 的 skills 呢,是可以互相联动使用的。我们来看一下这个 pdf skill, 在它的这个 skill 点 m d 文件中,这个表格总结了它知识的功能,这里面包括合并 pdf, 切分 pdf, 提取 pdf 内容等等。我们这个简历筛选 skill 使用的就是这个 extract text 的 这个功能来提取 pdf 简历的内容。 在 skill 中,除了脚本文档,默认都是 markdown 格式的,如果不熟悉 markdown 语法,可以先去了解一下。在我们之前的这期视频中有介绍过 markdown 语法使用也非常简单,只需要几分钟就能快速掌握 好了。我们回到这个简历筛选 skill, 那 在新的 skill 中是否需要调用其他 skill 的 能力呢? 我们可以根据使用需求来决定,比如新的 skill 只是给自己使用,这时候就可以选择调用已有的 skill 能力,那这样可以减少开发和调试的时间,因为已有的 skill 它的能力已经经过了验证。但是如果这个新的 skill 除了自己使用,我们还要分享给其他人, 或者需要多个人去联合开发。最好就不要选择调用已有 skill 的 能力,而是应该告诉 ai 使用脚本去单独实现这部分功能,这样可以确保这个 skill 的 独立性,分享或联合开发都会更方便。分析完简历以后,接着使用这个模板去生成报告, 最后使用这个 scripts 这个目录下的 send email 这个 python 脚本来发送 email。 最后他还给了几个使用视例,只需要这样和 ai 对 话,他就会调用这个 skill 帮我们自动筛选简历。 我们可以选择只筛选简历或者筛选简历并发送报告。那可以看到通过结合 ai 模型的语义理解, ai skills 的 使用是非常灵活的,他可以通过对话内容灵活选择需要的功能,避免浪费 token。 那接着我们再来看一下这几个文件夹,这个 scripts 里面存储的就是可以被 skill 调用的脚本,比如这个发送邮件的脚本,然后 reference 里面就是 skill md 需要参考的文档, 一个是开发人员招聘标准,一个是销售人员招聘标准,里面罗列了很多细色,包括专业背景、工作经验等等。我们可以使用自己公司的招聘文档替换到这些模板,或者直接在模板中按照自己的需要去进行修改。 这个 assess 文件夹里面存放的是 skill 的 一些素材资源,比如像模板文件,公司的 logo, 字体文件等等。这个就是简历筛选后生成报告的模板,可以看到里面的内容还是很详细的,包括通过筛选的人员,未通过筛选的人员,以及每位应聘者在各个方面的具体表现, 能够帮助 hr 快 速掌握应聘者的具体情况。好了,下面我们来测试下这个简历筛选的 skill, 看一看效果怎么样。这里我用 ai 生成了两份开发人员的简历,打开来看一下,左侧这份简历的应聘者呢,没有软件开发的相关工作经验是不符合招聘标准的, 而右侧这份简历的应聘者就有比较好的开发经验,符合公司的招聘标准。我们就用这两份简历来进行测试。把这个简历文件夹拖到这个 id 号框, 然后我们让它去分析这个文件夹下面的所有简历生成报告,但是不要发送邮件,可以看到它提示可以调用这个 resume scanner 这个 skill 来进行处理。我们点击执行, 执行结束以后输出了一个分析结果,而且在这个简历文件夹下面生成了一份 markdown 格式的分析报告。我们把这个报告拖进来看一下, 点击这个预览,这个就是生成后的分析报告,那可以看到内容也非常详细,里面包括报告预览、数据汇总,通过筛选的人,未通过筛选的人以及应聘者在各个方面的评估。那通过这份报告就能帮助我们快速了解所有应聘者的具体情况, 并及时给符合条件的应聘者安排面试。接下来我们再来测试一下这个发送邮件的功能。先来配置一下发送邮件的参数,我们直接问 ai 如何配置这些参数, 按照他给出的说明,我们需要配置这些参数。先来创建一个邮箱的应用密码, 然后复制这个密码保存下来。接着我们让它修改一下这个发送的脚本,我们让它改为从本地环境变量去读取这些参数。 好了,修改完成以后,我们执行 exit, 先退出 client code, 然后执行这几条 export 命令,设置一下这个发送邮件的参数,这里面包括发件人、收件人,还有这个邮箱的英文密码,注意这个密码中间的这个空格要删掉。 然后我们再重新启动 cloud code, 再来重新执行一次这个简历分析任务。但是这次我们要求它在生成报告之后,需要发送电子邮件。 执行结束来看一下这个收到的邮件,那可以看到这里面它没有附带上那个生成的报告,而且这个邮件的内容也过于简单,我们让它来优化一下,要求还是从环境变量读取参数, 而且在邮件中要以附件的形式带上生成的报告,还有所有的 pdf 简历,并且这个邮件的内容要优化一下,需要能够体现这个邮件的用途。 好了,修改完成以后,这个 ai 它自动完成了测试。我们来看一下收到的邮件,这次就没有问题了,首先这个邮件的内容包含了这个邮件的用途,然后附件也包含了这个生成的报告, 还有这些是所有的 pdf 简历,方便去对比查看。好了,那这样我们这个简历筛选的 skill 再经过一些详细的测试,就可以用来帮我们自动筛选简历来处理一些重复的工作了。 那接下来我们结合这个简历筛选的 skill, 来介绍一下 it skills 的 工作原理。在 it skills 的 工作过程中呢,一共有三个角色参与其中,第一就是作为用户的我们, 第二就是我们使用的 ai 工具 cloud code, 第三就是 ai 工具背后使用的 ai 模型,在这里是 g m 四点七, 整个过程大概是这样的,当 cloud code 启动以后,里面所有的 agent skills 都会先把自己 skill 的 原数据加载到 ai 的 上下文窗口中,那这些原数据我们在前面介绍过, 就是 skill 点 m d 这个文件中 skill 的 名字和描述信息,那这些原数据可以用来匹配 skill 的 调用,而且这些原数据呢,通常都很短,长度只有几百个 token, 所以 它们是常住在 ai 上新闻窗口中的,不会造成负担。 然后当用户发送消息要求筛选简历,这个消息就会通过 cloud code 转发到 ai, ai 就 会检测上下文窗口中所有 skill 的 原数据,当检测到这个 resume scanner 这个 skill, 通过匹配描述信息发现这个 skill 恰好能够满足需求, 接着他就会去使用这个 skill 来完成这个任务,那这时候他才会去真正把 skill 的 主体逻辑,也就是 skill 点 md 读取过来,然后按照这个 skill 点 md 里面的设定开始进行处理。 首先调用 pdf skill 提取简历的内容,然后提取这个招聘标准的文档进行简历分析, 接着根据这个分析结果读取这个报告模板去生成报告。最后就是调用邮件发送这个脚本去发送邮件,而且这个发送邮件是可选的,这就是 agent skills 的 执行过程。那可以发现这套设计呢,遵循了一个理念, 就是只有在真正需要的时候,才会把数据读取到 ai 的 上下文窗口,这样就可以大大减少拖延消耗。 比如在 cloud code 启动后, ai 只会获取 skill 的 原数据,而只有在确定调用某个 skill 之后,才会去真正获取 skill 的 各种文档。这种工作方式叫做间接式批录或者延迟加载,主要目的就是减少拖坑的消耗。而且在这个过程中,脚本并不会全部读到 ai 上下文, 只需要读取调用脚本所需的最小信息就可以。那我们这个简历筛选的 skill 后期还可以继续扩展,比如添加面试规划的功能,但是需要注意,一个 skill 不 宜过大,最好合理划分多个 skill, 然后去联动使用多个 skill 来完成复杂的任务,这样更方便管理和扩展。 下面我们再来介绍一个可以查找 agent skills 的 免费网站,就是这个 skills mp, 这里收入的都是 github 上开源的 agent skills, 目前为止一共收入了六六五四一个。要使用它,我们可以点击这个搜索功能, 比如我们搜索关于交易类的相关 skill, 这里就返回了我们需要的。我们打开一个,可以看到这些就是 skill 的 内部文档,包括 skill md, 还有 reference 下面的参考文档 scripts 下面的 shop 脚本。 要使用这个 skill 也非常简单,只需要点击这里下载文件,然后解压出来,把这个 skill 文件夹复制到点 cloud 下面的 skills 文件夹下面就可以了。 我们执行斜线 skills, 可以 看到这个生成交易计划的 skill 就 已经配置完成了,那下面我们用它来生成一份贵金属的交易计划来试一试。 执行结束后,它就给我们生成了一份 markdown 格式的计划文档,我们拖进来看一下, 这个就是生成的这个交易计划文档了,内容还是比较详细的。我们回到这个网站,如果想要查看这个 skill 对 应的 github 项目,可以点击这里跳转到 github, 这些都是可以使用的 skill。 那除了搜索,我们还可以点击这里按照分类来查看 skill, 这里面包括生产工具类、自动化工具类等等,在这里还可以按照 star 树或者更新日期来排序。那这个网站用来快速查找需要的 skill 还是挺不错的。 最后我们来对比一下 agent skills 和 m c p 这两项 ai 技术使用起来让人感觉非常相似,那我们应该选择哪一个去使用呢?其实它们都是 astropica 推出的开放标准,两者的区别主要体现在设计理念和适用场景这两方面。我们先来看一下 agent skills, 结合我们前面这个简历筛选的例子,那可以发现 agent skills 是 在做什么呢?它是在封装一系列需要重复执行的步骤,把这些步骤封装成一个 skill 去自动处理。比如发票报销,也是一个需要重复执行的多个步骤的流程,同样可以封装成一个 skill。 那 mcp 又是怎么回事呢?我们在之前的这期视频中有介绍过 mcp, 有 需要的话可以去看一下。 mcp 的 核心设计理念是什么呢?一句话就是连接万物,也就是把各种外部服务通过 mcp 这个万能的 usb 接口全部接入到 ai 里面,比如各种软件、各种社交平台、网站以及各种数据库等等,所以这两者在最初的设计理念上就是截然不同的。 我这里总结了一个表格,来对 agent skills 和 mcp 做一个对比。先看作用上的区别, agent skills 主要解决的是一件事,就是把步骤、规则、逻辑判断封装起来,也就是说,它是把一套专业的流程直接做成一个可以附用的能力。 而 mcp 干的事情不一样,它的核心作用呢,是给 ai 提供标准化的工具接口,让 ai 可以 安全规范地接入外部的系统,比如像 api、 数据库、底层服务。 再来看适用场景, agent skills 呢,它更适合用在流程固定,需要反复执行,而且依赖专业经验的人物,本质上就是把专业知识固化下来,然后让 agent 按照规则去稳定执行。 而 mcp 呢,更适合用在 ai 需要获取外部数据,或者需要调用外部系统去完成某个操作。比如像查询数据、发送消息、调用接口这些事情,那如果看典型的应用,比如像筛选简历、报销审批、流程审核, 这些都是多步骤、规则强的任务。而 mcp 的 典型场景呢,比如像查询 github, 发送 select 消息、访问数据库,它本质上呢,是在帮助 ai 去使用工具。那再往下看一下使用门槛, agent skills, 它的使用门槛相对比较低, 通常使用 markdown 加一些脚本就可以定义清楚流程,还有能力,但 mcp 的 门槛就要高不少,你需要理解协议配置接口, 有时候还需要去自己部署 m c p server, 对 工程能力的要求更高。最后是我们最关心的偷窥消耗, agent skills 呢,采用的是见进披露的方式, 只有在需要的时候才加载对应的步骤还有信息,所以整体的偷窥消耗相对比较低。而 m c p 往往是一次性加载全部的数据,它的偷窥消耗明显会更高。所以我们可以这样理解 agent skills, 它负责的是怎么把工具用起来, 它们两者并不是替代关系,而是在一个 agent 系统里面各自解决不同层面的问题。那关于 agent skills 我 们就介绍完了,可以说这绝对是一项非常实用的 ai 技能,大家可以想一想在自己工作中存在哪些重复性的流程, 是否可以封装成 skill, 让它去自动执行,然后呢,可以去动手试一试。好了,最后感谢大家的观看和点赞支持,我们下期视频再见,谢谢!

朋友们,全网爆火的 skills 你 也能轻松创建了,具体怎么做,一个视频教会你。比如我想做一个能处理视频的 skill, 点击进入扣子官网,点击左上角的创建技能,进来后看到这个扣子编程页面,我们要用到的是这个技能 type 光标已经默认定位好了, 然后你只要在这个对话框里输入提示词就可以了。这里说一下新建这个 skill, 我 们要用到一个开源项,叫做 fanpack, 输入提示词以后,按回车键发送,它就会自动提取信息。开始构建,大概两分钟左右就构建好了,然后再点击右上角的部署,部署好了以后, 你就可以前往扣子去进行体验了。比如我给他输入一段我拍摄的骆驼视频,让他转成十 m 以内的 g i f, 你 看一下就给你按要求生成了。以前做一次这样的修改,你还得打开剪映,打开 pr 进行一顿操作,现在只要一句话就可以完成。 二零二六年是 skills 的 一年,所以我们也把战略规划、营收增长、运营管理等等这些 skill 全部整合进了泽思 ai, 你 只需要填写信息, 则思 ai 三步就能交付结果。如果你也想掌握这项技能,评论区留言 ai, 我 把操作步骤和提示词发给你,看完记得点个关注,给你分享最前沿的 ai 工具。


ai 编程领域, skills 彻底爆了,浓眉大眼的扣子也冲进来参战了。我用新版扣子的 skill 功能给自己做了一个文字转小红书图片的功能,效果是这样的,还不错吧。制作方法,在技能这个 type 里就写一句话, 输入 markdown 格式的文字,生成用于在小红书分享的图片扣子。忙活了十三分钟,全部完成。 看右侧,确实生成了一个符合 skills 规范的文件夹。当 skills 的 制作成本越来越低的时候,它真正的威力才会显现出来。你看到的所有成品 skill 都只是参考, 把你自己的工作流和最佳实践用 skill 的 方式记录下来,固化下来,让 ai 帮你去完成你的工作,再根据实际效果微调改进你自己的 skill, 这就是你获得十倍生产效率的新法。关注我,带你玩转 agent 加 skill!

你一不小心打开了个 tab, 又不小心在树框输了这个手滑点到了第一个项目。恭喜你发现了一个聚焦上下文工程的 scales 合集库。这个项目呢, star 数来到了六点二 k。 所谓的上下文工程,就是把用户历史工具、定义、提示内容等所有进入模型注意力窗口的信息,合理组织和约束 这个参观者技能模块。系统整理了很多实用的技能,比如说包括基础的技能,上下文理解啊,还有这个上下文降解识别啊,压缩策略,还有多智能体架构设计、记忆系统设计、工具设计等架构性的技能,以及优化评估,还有生产级项目开发等操作性的技能。它不仅适合 cloud code 的 这种支持 skills 的 平台,还可以把这些技能内容提取到自己的智能体框架里, 用来提升长期任务的表现,减少上下文窗口带来的失效,构建更稳健的多智能体系统。下方呢,是有一个使用的势例,就是与 cloud code 的 用法。 这个步骤呢,也是详细的给你放在这里了,大家可以尝试去使用一下这个 scales。 简单来说呢,这不是一个单一的工具,它是一个可以服用,可以组合的智能体能力集合,能够让你的 ai 智能体真正的理解和管理上下文,而不是单纯的靠堆。 prom 这里罗列了支持的可用的插件以及技能,大家可以根据需要去使用这些 scales。 我是 不吃辣的 chris, 关注我,带你了解更多 ai 相关的开箱项目和工具。


这个组合简直就是 ai 时代知识管理与内容创作的终极秘诀,由 obsidian cloud 点以及 obsidian skills 组成,用它们可以给文章制作类似这样的框架图, 也可以给我的所有文章知识笔记制作这样的管理系统,包含分类、标题、字数、更新时间等等。这个组合中的第一部分是 obsidian, 它是一个本地的 markdown 知识库,比较轻量化,即开即用,拥有双向链接,知识图谱,还有非常丰富的插电生态。 call 点插件,它是一个能够嵌入到 obsidian 中使用的一个侧边栏插件,能够实现文件读写、搜索、执行、图像识别等等。 通过 call 点这个插件,我们可以调用 obsidian skills 并不丰富我们 obsidian 的 功能,所有的流程以及安装步骤我都已经整理成非常详细的图教程。我们安装好 obsidian 之后,我们在 github 上找到这个开源项目,把它下载到本地之后解压到 对应的文件夹中。安装之后在 abcd 中打开这个第三方插件。在设置中需要自行配置一些 api, 比如我这里使用的是国产模型 glm 四点七的。 在自定义变量中输入我们的 token, url 以及 model 的 名称。在个性化设置中,我们可以设置 call 点如何称呼我们以及排除的标签或者媒体 文件夹,还可以自定义设置系统提示词。当然在安装的过程中如果有报错的话,还需要我们进一步处理。敲点这个插件安装之后的样子是这样的,打开 mc 点,左侧是我们的 文件列表,中间是文档内容,右侧就是可导点的这个对话框,在对话框中我们输入消息,然后 ai 就 会自动回复我们,比如他说他是可导点,然后知道我们正在查看这篇文章,可以帮我们阅读分析笔记,编辑优化文章内容等等。比如我把我的文章发送给他,让他帮我看这篇文章的内容, 他读出了文章内容之后,就开始分析这篇文章的优缺点,还提出了我这个需要完善的地方,比如有部分是空的,缺少结尾总结,没有实际应用案例等等。 在安装好 cloud 点之后,我们进一步安装 obsidian skills。 obsidian skills 是 obsidian 官方呢推出的三个 cloud skill 技能文件。其中第一个 skill 可以 创建思维导图和流程图,我们在对话中呢直接 这样使用,比如说调用某某某 skills 为当前的文章创作文件,方便查漏补缺,完善文章,它就开始夺取文章的内容,然后调用这个 skills 来创建文件的结构导图。当它创建成功后,我们打开就是这样的一个文章结构审查图,包含的内容也非常全面, 然后对我们的的文章内容进行了详细的总结。第二个技能呢是 obsidian markdown, 它是一个 obsidian 格式化专家,能够对我们写好的 markdown 文件呢,进一步优化匹配到 obsidian 中的格式。第三个 obsidian business, 它是一个数据库试图管理器可以制作,比如文章管理系统。 下面这个图片里显示的内容,就是我使用 obsidian busy 的 这个 skills 给我自己的一些文章创建的公众号文章管理系统。以上我们把 obsidian coding 以及 obsidian skills 结合在一起的一个流程和应用的案例。具体来说,我们可以 用它来写文章的一些初稿,包括用 ai 辅助优化,还可以转换成口播稿以及录制视频,人工微调,最终完成我们整个的流程,剪辑发布,完成创作。 当然还有一些使用的技巧,比如我们可以自定义系统提示词,来设置一些我们个人的定位,包括我们的核心栏目,写作风格等等。比如我是这样设置的, 我是一名科技自媒体的博主的 ai 助手,专门帮助我进行这些,包括写作风格也进有一个要求,使用第一人称,我多用短距,避免长难区等等,这个大家都可以根据自己的需求进行实际的微调。 还有风格模仿与复刻,我们想让它模仿某种文章风格的,我们可以提前写作,创建一个写作风格 md 文档, 或者是直接创建一个 skill 的, 让它自动调用。比如我这里提前自己就准备好了一个我自己文章的风格提示词,在这里我直接让它引用这个模板,然后为我其他的文章进行一些优化。 当然最重要的就是一定要备份,它的默认是在原文件上进行直接的修改,在系统提示词中我们可以添加,不要在原文件直接修改,需要修改时需要创建副本,否则可能无法恢复。通过这些组合 使用 ai 呢?让我们把知识从静态存储变成了动态对话,但是在使用的过程中, ai 始终是副手,我们才是船长。利用 ai 在 知识管理内容创作的过程中乘风破浪。以上就是本期视频的全部内容,我们下期再见!

hello, 各位二零二六年 ai 圈的人呢,都离不开 skills。 我 们常说要去向高手学习,但是顶级高手的经验往往是碎片化的。所以今天呢,我想分享一个我自己私藏的知识库,叫做 learning skills, 它可能是目前 ai 和产品圈我觉得是最硬核的一个外脑 learning podcast 我 相信大家都已经很熟悉了,我在以前的视频啊,也多次去反复提到过,那 open ai、 figma、 meta 呢?这些顶级 公司的一个总监大神都是这个 procs 的 一个常客。但这个 skills 酷啊,做了一个更酷的事情,他呢,把访谈变成了一个可以去迁移,可以去附用的 skills。 他 把二百九十七期长的音频内容直接提炼成了十一个类别,八十七个核心技能点,三千多个可执行的洞察。不是那种泛泛而谈的一个总结啊,而是真正能够拿来就能去用的干货。从产品管理到团队招聘到 ai 策略,每个类别下面都会有对应的一个技能数。 我最喜欢的是它的 playbox 功能,循序渐进的指南,整合了特定的角色和工作流程所需的基本的技能。举个例子,我点开初次创业者的 playbook, 里面有从 mvp 设计到用户增长的一个完整路径, 每个环节都会有具体的一个方法论和真实的案例,都是那些实战大佬亲自验证过的经验。说实话,这个酷虽然有硅谷视角的一个局限性所在,但在方法论的颗粒度上,真的做的是非常的细致。那 对我们来说呢,他最大的价值不是去照搬,而是去建立坐标系,看一看世界顶级的同行都在用什么标准去工作?

大家好,我是 kate。 最近呢 skills 比较火,我呢,早在 ossopek 正式推出 cloud skills 之前,就在官网上发现他当时已经用到 skills 来做报告表格, ppt。 后来我还专门出了一期视频,详细介绍了 crowd skills, 我 呢,当时找到了啊 episodic 官网上所有关于啊 skills 的 文档,然后做了一期详细的视频,其中最重要的一篇呢,就是 skill 的 编写最佳实践, 待会我会再带大家回顾一下这篇最佳实践。我们看现在很多 ai 编程工具呢,都有用到 skills, 大家可以在这里截下图。 crowd 的 skill 呢,最先推出来的它的项目级还有它的用户级配置呢,是非常好记。 而呃 curser 也是比较好记的,因为它前面呢都是 curser 的 这样一个目录。而 open code 呢,我们看到这里会稍微有点区别。 在用户级别的话,这里有一个点 configure。 谷歌呢,它既有 demo c o i, 还有谷歌的 anti gravity 啊,这两者稍微有点区别,大家可以了解一下。今天我将介绍一些呃 skill 好 用的工具和一些好用的 skill。 首先介绍的是 versa 最近开源的 adskill, 它呢非常好用, 支持多个平台,我们看这些主流的平台它都支持了,现在呢,我来演示一下。在中端里输入命令, 它会呃克隆一下仓库,可以通过空格来进行选择。那我先安装一个 web design 呃 guidelines, 再接着它呢,是有多个 ai 编程工具默认选择, 那我假设我这里只要安装啊 open code, 那 我就可以将其他的通过空格呢都取消, 接着选择 enter, 接下来还可以选择是项目级别的还是局,那我选择局,让它进行一个安装,最后安装好呢,它会告诉我安装到哪里了,点开之后就会看到左侧这样的一个 scale 文档,它支持多种方式安装, 你可以直接呃给到这样的一个仓库名称,或者是完整的 gitlab url, 那 你也可以给它非常详细的直接的目录,而且呢,它支持多个快捷参数。有一个 skill 的 市场,它呢是收入了六万多的 skill, 大家有兴趣的话可以在里面看一下, 我个人比较推荐在 gitlab 里面呃,搜索你想要的关键词加 skill, 会有一系列的仓库, 你呢就可以啊,仔细观察看看有哪些比较适合你。再来推荐几个最近非常好用的 skill。 第一个是 versa 最近推出来的 agent skills, 它将 react 的 最佳实践,多年的一个经验 都放在这个 skill 里面了。第二个呢,是啊, expo 最近官方开源的 skill, 可以 帮助你去构建调试 expo 应用。第三个呢是上下文工程管理的 agent skill, 这些都是值得大家花时间去探索的。还要推荐一下 hackin face 的 skills, 它呢是针对啊 ai 还有机器学习的任务,可以帮助你下载模型数据集, 模型评估,可以帮助你训练微调模型,构建脚本等等。 obsidian 的 ceo 呢?最近推出来的 obsidian skill 也非常好用, 它推出来的三个 skill 里面呢,有一个是呃,是关于 jason canvas skills 的, 可以帮你生成非常好看的画板内容,如果你是做苹果相关的开发的话,一定不要错过这样的一个 skill, 它呢,这里内容特别多,基本覆盖了苹果开发的方方面面, 非常详细,绝对是让你事半功倍的。再来看一个非常特别的 skill 工具,它呢,可以将文档网站 get, 把仓库还有 pdf 转化成呃, crowd skills, 它可以自动抓取多个来源,然后深度分析, 检测冲突,最终组织文档。即使是简单的 skill, 我 也是非常推荐大家下载下来。呃,让 ai 运行之后,要盯着看它的 skill 运行中出现了什么问题, 要根据你电脑的一些实际情况,或者你自己的一个实际需求,让让 ai 帮你去啊更新 skill。 比如说我从网上下了一个 youtube 登录的 skill, 它的 skill 里文档里呢,写明的保存路径呢是 mnt。 虽然说每次 ai 它跑到这里呢,它识别出这个路径只能只读不能保存,它会想办法将下载后的文件呢改放到别的路径里去。但是这样的话,对 ai 来说的话,第一浪费它的 token, 第二的话,嗯,处理时间也会增长了。 所以的话,呃,需要你去观察一下这个 skill, 然后你就可以提示它让它去修改。呃,你你喜欢的一个路径,修改后的 skill 的 话,是会更匹配你的需求。再看一下官方 skill 啊编辑最佳实践 会,可以让我们的 skill 写得更好。第一个原则呢是简洁是关键。我们在做一个新的 skill 之前, 默认假设呢是 cloud 已经非常聪明,关于 pdf 的, 那 cloud 肯定知道 pdf 是 做什么的,它有哪些工具,就不需要再跟它解释一下用哪个库来处理。第二原则是设置适当的自由度, 我们可以使用一致的命名模式,让 skills 更容易引用和讨论。缩缩略官方建议是将 skills markdown 文件正文保持在五百行以下。缩缩略是建议避免深层嵌套的参考, 保持参考一级深度。所有的参考文件呢,直接从 skills markdown 链接,以确保 crowd 在 需要的时候读取完整文件。对于超过一百行的参考文件呢,在顶部包含目录。对复杂任务呢,使用工作流, 先是指示它复制,然后这里有个任务清单,给到代班事项之后。步骤一,什么步骤二三四五最好最有效的 skill 开发流程呢?就是和 cloud 一 起迭代开发。 先要求 cloud a 创建一个 skill, 审查它是否简洁,还可以让它改进信息架构,之后使用 cloud b 在 相关用力上使用这个 skill, 然后观察 cloud b 是 遇到困难或者遗漏了什么,再返回让 cloud a 进行一个迭代。我们可以观察 cloud 如何导航 skills, 它是否以你没有预料到的顺序读取文件,错过一些重要的参考,还有对某些部分的过度依赖,或者是忽略一些内容。即使是在 windows 上面的话,也是要改成 这种正斜杠,除非必要,不要给他太多方法让他选择这下方呢,有一些有效 skills 的 检查清单, 对于不需要代码的 skills 呢,我们可以提供一个清单 code, 可以 将它复制到响应中,并且进行检查, 让他研究。还有一个原则非常重要,就是让他创建可验证的中间输出,这是一个示意,先是给他了一个脚本,让他去做一个提取,然后呢提示他这样的一个输出。 还有一些小细节非常重要,你对确定性操作呢?优先使用脚本,如果你的 skill 使用 mcp, 那 就要在 skill 里面去设置一下,让他要找到工具。 我们看这两个例子呢,左边它其实都是 m c p 服务器的名称,右边是这个 m c p 对 应的工具,将它们这样连接起来,这样它就不会出现找不到工具的错误。还有个细节是避免假设工具已安装。

给你们看一下 scuse 到底有多恐怖?这个是提取工具,它支持某书、某音、 pk 避战等各大媒体平台提取,这个主要做分析来用, 它可以从关键词手段敏感、内容风险、商业化程度、互动出发,潜力和内容结构这六大方面逐一分析。而这个可以根据你的要求来生成不同平台的视频脚本,算是 某书、某音、电商和门户网站的都可以。而最后这个就是运营发布了,它可以发布到某书、某音等各大主流平台。刚才所看到的这些工具, scuse 完全可以把它们结合成一个工具,可想而知这样的风格怪到底有多恐怖。找不到和那些不会用的小伙伴,主页踢我。

这是我用 ai 生成的 github 生成器,只要粘贴任意的 github 链接,它就能帮我把整个项目打包成一个本地的整合包,对于小白极其友好,可以用脚本一键启动,还有一个很不错的前端页面。从此呢,像我们这样的普通用户,也能无痛地使用各种大佬的 开源项目了。而这也离不开最近在 ai 圈爆火的这个单词, skis。 这 skills 到底是个啥呢?它对于我们到底有什么用?我也花了好几天的时间做了这期视频,希望一次性给你讲透 skills 的 意义,还有怎么用。视频制作不易,希望大家多多善念转发。话不多说,我们开始 skys 呢,翻译过来就是技能,就是给 agent 用的技能,它跟传统的 prom 有 非常大的一个区别,这就好比在工作中让你带一个新人,你可以把 agent 呢想成一个刚刚入职的一个实习生,他很聪明,理解能力也很强,他啥都能跟你聊,但是你让他真的开始干活,他最大的问题呢,是不守你家的规矩。 prom 是 啥呢? prom 就 像你站在他旁边啊,当场口头交代任务,今天让他写一段公众号的开头,明天让他把语气改得更加克制一点。他天然适合那种一次性的,临场的,随时变的那种指令。同时他有一个非常大的缺点,就是你把这个对话一关掉,就像刚刚你说过的话一样,没得了啊,木有了。 而 skills 呢,就像你给他一本公司内部的那种 s o p 手册,它更像是一个知识库般的一个文件夹,里面呢可以放你的规范,你的脚本,你的模板,你的参考资料,等等等等等等。 agent 这个最棒的实习生,他会在自己需要的时候自己去翻。这里面有个非常关键的设计啊,叫渐进式批录, 就是先让你看这个目录,再看这个章节,最后犯这个副路。 skr 的 一个原信息呢,是先加载一小段,让模型知道有这么个手册适用范围是啥。当他判断这次任务真的用得上的时候,再把完整的 skr md 读进它的上下文理。用这样的方式,不仅可以保证 a j 的 能准确的执行任务,还可以在长轮的对话中闪向大量的托肯,因为在大模型的交互中,对话越长,模型越笨,这几乎就是一个共识。听完了上面的故事,我相信你肯定清楚 scales 和 problem 的 区别了,那我们就可以来看看一个基本的 scale 的 配置是个什么样的。 一般来说啊,一个完整的 skill 包含下面的这些文件,这里是要注意啊,文件夹的名称必须是小写的字母,还有连字服务。而这个 md 是 它的核心文件,它的结构呢,是固定的,分为两部分, 头部包含着你的 name 和你的描述字段,这是 agent 用来识别 skill 的 名片。 markdown 的 主体呢,也包含着详细的工作流程,输出格式要求,还有这个实力,最最核心的其实就是描述的这个 skill。 这个时候呢,可能很多朋友就会说啊,停停停停停停,这么多东西都要我自己设好麻烦,有没有那种能帮我直接生成一个 scar 的 scar? 你 别说,还真有,高德他们官方呢,就开源了一个 scar 的 仓库,里面就有不少极度实用的 scar, 这里面有能生成 scar 的 scar。 安装这个 secure 呢,也特别简单,直接对着你的 cloud code 或者你的 open code 发一段这个 prompt 就 可以,它就会自己去安装了。就比如我那个整合包生成器的 secure, 你 直接说你的 prompt 先用 plan 模式规划一下,确定了所有的文档之后切换模式,然后开干就可以, 很快你的 secure 就 做好了,然后安装到你的本地。然后呢,我只需要将任意一个 github 上的链接扔到我们的 open code 或者是 cloud code 里面,它都能帮我做出一个自带前端界面,开箱即用的本地整合包。 看完了我们的 kids 之后,相信你也能大概的明白 skr 能做一些什么样有趣的东西了。到现在我也依然觉得 skr 这玩意的价值还是被大家大大的低估了。 无论你是专业者,自己把自己的经验或者 workflow 封装成各种各样的 skr, 还是跟我一样的普通小白,把一个一个的痛点需求封装成 skr, 方便未来我们持续做调用这玩意儿我觉得它都有莫大的潜力。 目前除了 cloud code 之外,像 open code, cursor code, body 等等的一些编程工具也基本上都兼容了 skills。 今天你就可以把它用上,把你最常用的一个动作固化下来,比如说选择题,筛热点,比如说把报错日期修成一个修复方案, 或者把一堆链接变成摘药和观点。做完这一个,当它运行起来的那一瞬间,你就会懂 skill 的 价值在于服用,那时你就能感受到自由创造的乐趣了。