很多人听到 skill, 会以为这是某种高级能力或者 agent 专属魔法,但我们先把它拉回实际。 skill 本质上就是你早就会的那件事,把一件重复发生、部署、稳定、结果、可预期的工作整理成一套可以附用的做法。 你以前可能把它叫做模板、脚本、流程、 sop、 小 工具。现在我们把这些统一叫 skill, 只是为了让 agent 也能用同样的方式来工作。 关键不是名字变了,而是你开始用可附用的模块来思考工作。如果要把 skill 编成一个摸得着的东西,我最喜欢的比喻是一个文件夹。 这个文件夹里通常会放三类东西,第一,说明书告诉你这件事要达成什么目标,输入是什么,输出长什么样。第二,材料包,比如模板、视例、参考文案、品牌规范。第三,执行方法、步骤清单、检查点,或者一段脚本和提示词。 所以 skill 不是 一句我会做,而是一套别人拿走也能做的交付物。它让能力从人的脑子里搬到一个可传递的、可附用的载体里。 skill 最关键的武器其实就是四个字,按需加载。我们做工作时也一样,你不会把所有知识同时摊在桌上,你会在某个 task 出现时拿出对应的模板、规范和工具。 skill 就是 在帮 agent 做同样的事, task 来了,再把这一小包专用知识加专用流程加载进来。这样做有两个直接好处,第一, task 边界更清晰,输出更稳定。第二,维护成本更低。你改一个 skill, 就 等于更新了一类 task 的 做法,而不是指望模型自己悟。 所以 skill 不是 让模型变聪明,而是让工作变可控。我们用一个很生活化的例子,给一家轻食店做品牌物料。如果这件事每次都从零开始,就会遇到同样的问题,文案风格不统一,视觉元素乱跑,输出物料缺东缺西, 那我们就把它做成 skill。 这个 skill 的 因素很明确,店铺定位、目标人群、主打产品价格区间以及品牌调性 keywords。 它的材料包也很明确, logo 使用规范,配色与字体,几条固定的文案与期限里,常用物料模板,比如海报、菜单、设备封面等等。 流程更像一条 assembly line, 先定一句核心主张,再扩展三条卖点,再落到不同物料的版式与文案,最后用检查清单保证一致性。结果就是,不管谁来做,产出的品牌物料都向同一家店说出来的。很多人卡在这里。我知道 skill 很好,但我没时间写 sop 整理模板,这里有个省力的方法,也手写。让 ai 帮你做 skill。 你只要提供三样东西,第一,你过去做过的几个真实案例。第二,你评判做的好的省下,比如风格和规点,常见错误。第三,你希望最终产出的格式,比如一份流程清单,一套模板,一段可附用的提示词。 ai 擅长把散的经验整理成结构化的模块,它可以帮你抽共同步骤,补缺漏,把隐性规则写清楚。你要做的不是从零写,而是审核和微调,把它校准到符合你的工作习惯与质量线。那问题来了,我到底该从哪里做 skill? 答案通常不是最酷的,而是最平凡的。你可以用一个简单的判断,这件事情上是不是经常做,是不是每次都差不多,是不是出错,代价很大,或者质量波动会让你反复返工。如果是,那它就非常适合 skill 化。 因为 skill 的 价值本质是把一次次重复的脑力劳动变成一次性的整理,然后反复服用。高频工作最容易立刻看到收益,时间省下来,质量也更稳定,你还更容易把经验交接给团队。最后,我们把 skill 压缩成一句话, skill 不是 能力本身,而是把能力模块化、可附用、可按需来加载的方式。 他把你脑子里的经验变成一个可以被调用的工作包,把不稳定的临场发挥变成可控的流程。与时单纯把每次重新想变成每次直接用。当你用这种方式组织工作,你会发现你不是在追逐更聪明的工具,而是在打造一套更稳定的生产。
粉丝3471获赞1.7万

别再瞎找了,这是你唯一需要的一个 skill。 find skills 就是 帮你找 skills 的 skill。 比方如我想找一个 ios 开发的 skill, 那 就跟 ai 说,用找 skill 的 skill 帮我找一个开发 ios app 的 skill, 它就会自动调用 find skill 找到符合你描述的 skill。 当然,描述的越精确,找的就越精确。安装方法也非常简单,只需要官方的这行命令就可以。 这里需要注意的两个点是,第一是最好选择全局安装,第二个选择复制到所有的 a 阵,否则可能找不到这个 skill。 好 了,如果不会安装,可以在评论区留言关注我,了解更多 ai 干货,感谢大家观看!

装了 openclaw, 但发现它什么也干不了,甚至有点笨。那是因为你还没有去 clawhub 给它装 skill。 clawhub 上有一万七千多个 skill, 我 从下载量前三十和我自己高频使用的做了交叉筛选, 只推荐这十个,装完至少强三倍。第一个 skill writing, 安全审查员,他会在你安装任何 skill 之前扫描安全风险检查红旗标识、权健范围和可疑模式,能检测 prom 的 注入工具、逃毒、隐藏恶意代码。建议在装任何其他 skill 之前先把它装上。第二个自我进化 skill, 它是 cloud 交互下载量第一的 scale, 解决大模型失忆症。它会自动把每次的错误日期、成功经验和你的编号存到本地数据库,下次遇到类似问题,直接调用历史经验实现,越用越聪明。这个 scale 的 价值不在于第一天,而在于第三十天, 用的越久, agent 越像你的数字分身。第三个, tablie search ai 专属搜索引擎,让 agent 学会上网搜索,而且搜出来结果是 ai 友好的。 不同于传统搜索引擎返回一堆链接, tabl 直接返回干净的结构化内容, agent 拿到就能用。第四个 summarize, 全格式内容,摘药专家,网页、 pdf, 图片、音频、视频,什么格式都能一口吞下去给你摘药。 我的日常用法是 tabla 搜索加 summary 总结,先搜到相关页面,再把整篇内容压缩成五百字未给上架文,效率翻倍。第五个, find scales, 寻找 scale 的 scale, 用自然语言告诉 agent 你 需要什么技能,它帮你找到并安装对应的 scale, 不知道装什么的时候直接问他就行。六个 using superpowers 来源于 superpowers, 这个强大的插件,核心理念是让 agent 严格按照先查 scale 再行动的规则做事,杜绝偷懒和无距离探索。如果你发现 agent 不 用你装好的 scale, 就 自己瞎搞, 这个 scale 能帮你管教他。第七个, react 最佳实践技能的性能优化圣经 worst one 方共同团队出品, react 和 next 最佳实践前端开发者必装。 第八个前端设计技能,帮你写出更有设计感的前端页面。按 zorbike 官方出品强制 agent 先做设计思考,再写代码,把从能跑就行提升到设计合格。第九个, github github 全流程操控,让 agent 直接操作你的 github 仓库, asos prci 一 条命令搞定。最后一个浏览器操作技能,让你的 opencloud 像人一样打开网页,点击按钮,填写表单,截图画面。最后帮大家总结一下。

最近 agent skill 这个词真的火得一塌糊涂,但说实在话,真正懂它本质的人是少之又少。上周末我参加四三 college 的 活动,当时一位分享者终于让我把 skills 的 本质用大白话理解了。他说,这三年 ai 圈变化那么快,但是有一件事情从来没变,本质上都是 prompt。 当时全场都懵了,就明明从这个 prompt engineer 提示词工程,到上下文工程、 context engineer, 再到最近很火的 agent skills 概念换了一轮又一轮,怎么还是 prompt? 然后他笑了笑说,太多人把 prompt 狭隘的理解为用户提示词就是你跟大模型聊的对话,但其实无论概念再怎么包装,其实在模型的眼里,这些概念都从来没有变过本质。这句话让我整个人都清醒了。 然后他就开始拆解 agent skills 的 本质。他说,本质上, agent skills 就是 一个 markdown 文件,是对大模型窗口的一种工程学的改造。 这是什么意思呢?就是你知道现在大模型的上下文窗口能做到多大吗?两百万头肯听起来很厉害对吧?但是这时候问题来了,就是资源是昂贵的,而且注意力是分散的, 就像你同时打开一百个网页,那你的电脑即使再好也会卡顿,对吧?所以怎么精心地呃设计、裁剪跟拼接,未给模型的文字去列,就成了非常关键的事情。这时候他开始拆解 agent skills, 他 画了三个框,然后他说, agent skills 本质上就是由这三个部分组成。 第一个框叫做原数据,有点类似于你通讯录里面的花名册,他可以告诉模型说,哎,这里有一百个技能,那么谁是做算力的,谁是做餐饮的,而且只会消耗几百个头肯,所以非常的省钱。第二个框叫做指令,也就是我们熟悉的提示词, 这里的提示词不是用来聊天的,而是用来塑造一个工作环境。第三个框叫做资源,这里面装的是代码文档和数据库,只有当你举手说,哎,我要买算力,那那个做算力的技能才会激活,他的指令,才会开始加载,然后他背后的团队工程师、供应商,也就是他的资源 会被暗区调取出来。那如果你不触发呢,那些庞大的资源就会静静的待在那里,完全不会消耗你的头肯,费用,也不会占用模型的注意力。你看,这就是 agent skills 渐进式疲劳的魅力。 然后那个老师说了一句话,他说过去的 prompt 是 你问,大模型答是一个聊天,但是现在的 agent skills 是 给了大模型手和脚,这什么意思?就是 agent skills 可以 访问你的电脑文件系统,它可以调用你的代码解释器, 甚至可以在你电脑的 bash, 就是 那个黑框框里面直接执行命令。你现在可以跟大模型说,欸,遇到你不懂的,你可以打开我电脑第一盘里面的某个文件夹的文件,欸,那大模型它真的能做到, 所以它不再是一个聊天工具了,而是你的数字员工。所以你可以看到,其实这三年 ai 圈的概念满天飞,但其中始终不变的就是那个 prompt 提示词,从 prompt 到 context engineer, 再到呃, agent skills, 名字在变,但其实它的本质是不变的,我们现在做的所有努力都是在抢占,还有精心装修那个非常宝贵的模型上下文窗口。 那现在很多 ai 圈人还在追新概念啊,今天学 gbt, 明天学 cloud, 后天又学一个什么新出的新工具。但真正懂行的人早就看透了,在模型眼里,众生皆为头肯, 仔细输了一点的 no 号,然后把它提炼为简练的提示词,这才是 ai 圈里不变的道理。听懂了这个逻辑,你才算真正拿到了 ai 下半场的入场券。那么周末的呃,关于 agent skills 的 小笔记我也整理好了,需要的跟我说。

如果大龙虾只装一个 skill, 就 装这个 skill self improving agent 中文翻译很奇怪啊,但是这个 skill 就是 一个让你的小龙虾学会自己复盘的 skill, 每一次他做错了任何事情,他都会 自己去记录正确的操作是什么,下一次的时候他就会使用这个记忆。你看每一次的时候我就说复盘使用提升 skill, 你 看看他是怎么说的,他说好怎么怎么怎么样,现在执行自我进化,把这次教训写到系统里面,这个真的非常 ok。

二零二六年最值得学习的技能呢,就是 cloud skill, 现在 osopik、 谷歌 openai 已经全部支持 skill 了,分享七个。最近一个月呢,在开元社区热度上涨最高的 skill 项目。第一个是 obsidian ceo, 他 自己写的一个 skill, 非常牛的用法是 直接绘制格式化的 canvas 画布。比如说,我让他创建一个 canvas 来解读刻意练习这本书,它会自动识别出需要调用 jason canvas 这个 skill。 大 概呢,花了两分钟啊,运行完成,生成一张 canvas 图,它直接把刻意练习书里面的内容和相互之间的关联化 出来,整本书的逻辑呢,一目了然。以前看书呢,容易迷失在细节和特定章节里面,现在用这种彩色的画布,让你瞬间纵览全书。再比如呢,让它创建一个读书的阅读管理系统,跟踪目前我读书的进度啊,它会自动识别并调用 obsidian faces 这个 skill, 然后生成一套读书管理系统, 显示了每本书的基本信息以及阅读的情况,并创建了子文件夹,对每本书进行总结。你还可以自行进行扩展,添加更多书籍笔记到书籍文件夹里面。地址呢,在这里。 第二个是 ospec 官方 skill, 里面有非常多的 skill, 比如说对 word, pdf 进行处理的 skill, 可以 从 pdf word 里面提取文本。再比如呢,前端设计的 skill, 最重要的是这个 skill creator, 它可以指导你创建自己的 skill。 地址呢,在这里啊。第三个是 gitup 上二点二万 star 的, 它可以指导你创建自己的 skill。 地址呢,在这里啊!第三个是 gitup 上二点二万 star 的 star, 它可以指导你创建自己的 这套 skill。 什么用呢?第一个,他懂得三思而后行,普通的 ai 拿到需求呢,一般直接开干,但是装了 superpowers skill 之后,他会先按住暂停键,会启动头脑风暴这个模式。 反过来问你这个功能的具体场景是什么,有没有边缘情况啊?他会先和你把需求聊透,把模糊的想法呢变成清晰的文档。第二呢,他是一个不折不扣的计划通,需求确定之后呢,他不会乱写,而是会生成一份详细的 实施计划。他会把大任务呢拆解成一个个两到五分钟就能完成的小任务,就像一个靠谱的架构师,把蓝图呢都给你画好了,你点头呢,他才开工。第三,他强制执行测试驱动开发,这是很多高级的程序员才有的习惯啊。他会先写测试用力,如果测试失败再去写代码让测试通。 最后呢,还要重构,这意味着它写出来的代码呢,其实会更加的健壮。这个 skill 库呢,还有很多功能,地址呢,在这里啊,大家可以去进一步的探索。第四个是模仿 manners 的 skills planning with fields。 这个 skills 借鉴的 manners 的 设计理念,将上下文窗口类比为内存,一时 有限。将文件系统类比为磁盘,持久而且无限。而核心的原则是重要信息均写入磁盘,而不是待在内存里面。 针对每一个复杂的任务呢,需要创建三个关键的 markdown 文件。第一个 task pen md, 用于跟踪任务阶段和进度。第二个 finding md, 储存研究内容与发现结果。第三个文件 progress md, 记录绘画日记和测试的结果。这个 skill 非常适合 多步骤的任务,三步及其以上研究类任务,以及需要多次调用工具的任务。地址呢,在这个地方,第五个是自动上传内容到 notebook l m 的 skill。 这个 skill 呢,也可以让你通过 cloud code 快 速获取带有来源引用的打 答案。对于每一个从 cloud 发出的问题呢,会先通过 notebook lm 进行一次答案的综合,然后再用 cloud 进行回答。这个技能借助 notebook lm 的 预处理能力,让 cloud 仅需要发送查询指令,接收精准答案,大幅地降低了 token 的 消耗。地址呢,在这个地方,第六个啊,是 skill prompt 检测 rater。 这个呢,是用来生成图片提示词的,内置了十二个专业领域的 skills, 比如说人像提示词专家,艺术风格专家、平面设计专家等等。它会根据用户的输入呢,自动匹配 对应的专家来帮助生成图片提示词,从而实现精细化生成的效果。比如说我让他生成生成电影级的亚洲女性张艺谋电影风格。使用豆包得到的图片呢,是这样的,而这个呢,是没有使用这个 skill 的 生成结果。我们可以发现呢,如果没有使用这个 skill, 生成的结果呢,更加的发散和随意。第七个是用来做内容营销的 skill, 可以根据多个关键词来生成文章,适用于 s e o 的 场景。地址呢,在这个地方, skill 呢,将 agent 和工作流的门槛呢,又降低了一个级别。二零二六年注定是各行各业 skill 的 爆发年。 现在看完这个视频呢,你就可以立刻去用起来,有什么不懂的可以评论区告诉我,想系统化学习呢,也可以加入我们的社区,下一期呢继续。

现在市面上所有的 a 键的工具都配备了 skill 功能,如果你还没用过 skill, 或者用了以后感觉依然有点懵,那这期视频请一定不要错过。哈喽,大家好,我是专注于动画科普 ai 的 阿 k, 今天我站在新手角度跟大家好好唠唠 skill 到底是什么,怎么用,以及使用过程中要注意哪些坑。 skill 其实就是一个 markdown 格式的文本文件,注意,这里的 skill 必须大写哈,这个文件里存的其实本质上还是提示词,只不过这里的提示词必须按照画面上的这个固定格式书写。 这个部分是配置区,它属于是 skill 的 身份证, name 是 它的名字,一定要用英文哈,因为你的 skill 点 md, 文件必须放在 name 同名的文件夹内,这个文件夹又必须放在 a 键的指定的目录,比如我用的 cloud 就 必须放在它的根目录下的 skills 文件夹中。如果没有这个文件夹,就自己创建一个, 那如果你的 name 是 中文,文件夹也是中文,意味着你的文件路径会包含中文。这样 a 键呢,在调用的时候是有可能报错的,所以 name 必须用英文。那如果不理解文件路径跟目录和文件夹结构的小伙伴,一定要抓紧时间恶补一下哈,这些知识既基础又重要。接下来的 description 是 描述定义它是干嘛的和什么时候调用, 这个部分是指令区,也就是写提示词的地方。它规定的是这个 skill 遵循的规则和采用的流程。之所以一定要用 skill, 是 因为它能实现按需加载。简单说就是没活的时候,它不占用任何 token, 只有匹配到任务了, ai 才会把这个 skill 点 m d 文件加载进来。这不仅能极大的节约 token 消耗,最重要的是能让 ai 随时根据你的需求切换不同的专家身份。总而言之,它就是好,就是棒,棒棒,就是该用。 那这里就又有个问题了,既然它本质还是提示词,那到底该怎么规划逻辑,才能让它按照我的需求老老实实干活呢?放心, cloud 官方早就帮咱准备好了一个专门生成 skill 的 skill, 跟紧我一分钟学会部署和使用。 大家直接把整个仓库下载到电脑理解压,找到 skills 文件夹中的 skill creator 文件夹,把它复制粘贴到 a 键的指定位置。比如我用的 cloud code, 就 直接扔进根目录的 skills 文件夹里。如果你用的是其他 a 键的工具,直接问他你的 skill 文件夹在哪,他会告诉你 配置好以后,我们启动 agent, 直接输入斜杠 skill, 就 能呼出这个顶级专家了。接着我们只需要用大白话描述你想创建一个什么 skill, 注意哈,你对需求描述的越清楚,沟通的越细,它生成的 skill 就 越贴合你的需求。如果你没有思路,也可以跟他一步一步探讨,也能得到非常不错的成果哈。 比如我平时经常要用 a 键的开发一些自用小工具,我就用它创建了一个名为 project manager 的 项目经理 skill。 它能让我这种不懂代码的人也能构建出结构科学、功能清晰且具备可扩展性的工具。这玩意用起来真的很顶那聊到这,估计大家心里都在犯嘀咕,这 skill 到底能帮我解决什么具体的问题呢? 我结合自己的实战经验,给大家盘了三个应用场景,相信总有一个能戳中你的痛点。第一个场景主要应对那些繁琐的杂活。 举个例子,大家平时经常开会吧,开完会总得总结会议纪要。以前咱得录音加笔记,会后还要花大量时间去腾抄归档,特别心累。现在有了 ai, 咱们可以直接做一个叫 meeting 的 skill, 把工作留定死。 第一步, skill 只会转写工具,把原始录音瞬间变成文字。但注意, skill 本身是没办法直接做语音找文字的,但这类工具往上一搜一大把,你随便部署一个到电脑里以后是可以用 skill creator, 它会自动帮你写好调用逻辑。 然后是第二步,剔除文稿中那些语气词。接着是第三步,深度分析会议内容,按需整理成档。最后是第四步,把文件自动保存到你电脑里的指定位置。那有了这个 skill 以后,开完会你只需要把原始录音直接甩给他,他自己就去调兵遣将跑完整个流程。 这种一键扫荡的爽感,你用过一次就再也离不开了。甚至如果你的需求更复杂,比如要经常查找不同会议里的重要节点,或者要合并拆分不同的文件,都可以塞到提示词里。 第二个场景是一个真实案例,我每周日都会发一个 ai 新闻回顾的视频,我专门做了一个 skill 来把这个视频生产的各个环节串起来,让我不用在各种工具和网站中切来切去。具体的大家可以看看我这期视频讲的非常详细。 第三个场景就属于是高级玩法了,它是通过同时加载多个 skill, 构建一个完整的生产流水线,这适用于需要多个专业环节配合的复杂任务。 比如在内容生产场景下,你可以配置三个 skill, 一个负责通过数据检测来分析选题,一个负责按固定风格创作文案,最后一个负责排查违禁词和逻辑漏洞。这种模式的核心优势在于,你不再需要分布输入指令,也不需要手动把上一步的结果复制给下一步。你只需要下载一个初始任务编辑呢,就会自动按顺序调用这三个 skill 来完成。 这种模块化的写作,能极大降低大模型在处理长任务时容易出现的逻辑偏移,也就是我们常说的幻觉。这个场景其实还蛮复杂的,我自己也在慢慢构建,以后有成果了会第一时间跟大家分享。 最后有小伙伴想让我聊聊 skill 和 mcp 的 区别,其实一句话就能说明白, skill 是 提示词、是指令,是流程,而 mcp 是 工具,是接口。 skill 可以 调用 m c p 来扩展自己的能力边界,但 m c p 永远只能在 skill 划定的规则下干活。 ok, 那 以上就是本期视频的全部内容了,我专程用动画科普 ai 的 阿 k, 无惊无险又到六点,下了个班儿。

现在全网都在吹 open klo, 更魔幻的是有人还花四百九十九去安装这玩意。醒醒吧,百分之九十九的人安装了都不知道能干嘛。你缺的是工具吗?你缺的是想法,哪里热就跟风钻哪里。 open klo 本质和 kolok 的 没啥区别,甚至还没有 kolok 的 做的好。所有 a 阵的能力上限都取决于模型的能力。简单地说, open klo 只是把给模型边界工具变成了电脑执行权限,它的模式仍然是工具加上下文,压缩加实时任务加一直调用模型。而且给他很高的权限,会有很多提示词诱导泄露隐私和安全的问题。 比如你让他回复邮件,邮件内容有很多钓鱼的提示词引导他执行泄露隐私的风险。换个角度理解,他这么火,也就是把 manders 的 部分功能平权给了我们普通的用户。以前我们用 manders 做任务, manders 自己起虚拟机做一些任务,现在变成了你的 mac mini。 我 来说说 a 阵的现在最新的思路。现在大模型特别适用于不需要严谨输出的、可以融错的修正的场景,类似工具类的写代码写标书呀。大模型确实已经很强了,一般人不会用简单的对话,给不了模型需要的上下文。 你想想人类解决问题的路径是什么?实践反馈再实践。模型也是,但是模型没有手呀,连接不了物理世界。解决问题中只是简单的给模型对话,给不了模型有效的、持续的、连续的上下文。需要借鉴可洛克的这种 ai 编程工具的思想, 分这几点,第一,让模型规划任务编排并显示记录任务步骤状态,每次反馈给模型,防止模型跑偏,就是让模型自己显示的记录步骤完成了到哪里。 第二,连续动作后,提取压缩着重需要的上下纹,他这个压缩上下纹分两种,第一种就是简单的把一些无关紧要的造声直接去掉。第二种就是让模型再次提取归纳之前的上下纹,将有效的上下纹着重给大模型聚焦注意力。虽然说大模型已经建立了很长的上下纹,但是溶于的上下纹始终不会比有效的上下纹带来的效果好。 三、使用多 agent 并行解决问题。让主的 agent 可以 自己按需生成子 agent 去执行并行的任务,比如需要主色的安装一些工具,或者负责特定的功能,就让子 agent 只负责完成分配给他的任务,然后把结果给主人,主 agent 就 行了,主 agent 呢,他只负责分发任务,并建立多 agent 间的通信机制。 第四,提供有边界的工具给模型加手,给模型提供工具调用,比如读文件啊,写文件啊等等工具。第五,增加 sq 技能,按需让模型使用说明书,减少提示词滥用 sq 其实就是提示词,好比就是一个一百页的空调安装说明书, 你不用一开始就直接喂给模型,只要一开,只要开始的时候给模型说我这有安装空调的说明书,你用的时候再来看模型,需要安装空调的时候按需加载这个 sq 技能就行。 第六,提供 m c p 功能,有效的利用其他平台及聚焦封装的功能。 sq 再牛也不一定有平台自己封装的 m c p 好, 平台自己根据底层数据封装的 m c m c p 有 时候就是比 sq 好, sq 达不到这个功能。简单的说,比如 我是生生产导弹的工厂,提供一个 m c p 功能调用就可以生产导弹,你总不能按照导弹生产的说明书的 sq 自己造自己造导弹吧?这就是我理解现在 aj 的 方案的最新思路,并且一直关注分享给大家。

哈喽,朋友们,我是阿水, a 正的 skill 最近真的太火了,但是很多朋友肯定想知道到底啥是个 skill, 凭什么这么火?那朋友们莫慌莫慌, 我呢已经为大家整理好了一套小白必读的 skill 大 全,今天的内容呢,我们将从简单到困难,一路升级打怪。首先呢,我们来看 skill 的 结构和它的原理, 然后呢,我们通过学习来定制自己的 skill。 这个 skill 呢,我们只需要简单的一句话,帮我根据这篇文章生成 ppt 分 析和内容规划,那它就会自动去执行和生成我想要的资料。 另外呢,我还会给大家推荐一些好用而且必用的 skill, 比如说帮你的文章配图,把杂乱的知识变成一个教学网页, 一句话处理表格等等等等等等。这期所有的资料我都已经整理成了文档,只需要一步一步跟着做,跟着看,就一定可以学会。那还在等什么呢?赶快点赞收藏关注呀! ok, 那 我们就 let's go! 那说了这么半天,到底什么是 agent skill 呢?直译过来呢,其实就是技能呗,比如可以把它看成一只小狗,这只小狗呢,它会记路线,听指令,使用工具,能听懂你的语气。那 agent 呢,也是同理,它要和你和平相处,也是要会这些东西的。 所以在 a 证的 skill 的 术语里面呢,它最最最核心的文件就是 skill 点 m d ai 的 工作手册,当然呢,还会有其他的文件,最后将这些文件集合在一起,打包成一个文件夹,这就是一个技能,一个 skill 了。 那有同学就要问了,阿水看着挺复杂的呀,这么做的好处是什么?本质上来说, skill 对 不懂代码和不懂怎么去创建软件的小白群体来说, 是大大降低了门槛的来,如果还是不懂,我们做一个超级简单的 skill 就 好了。这里呢,我用到的是谷歌的反重力工具 模型呢,因为可多扣的真的封号太严重了,我就用 jimna。 那 这个软件的下载方式呢?我已经放进了文档里面,可以说是非常的 perfect, 比如说我们打开反重力,在这里呢,选择模型 jimna pro 就 可以, ok, 我 们就可以开始创建了。那我们就先创建一个可以制作 ppt 的 skill 吧,可以根据我输入的文章链接或者文字帮我生成一个 ppt 内容规划。那按照反重力的创建规范呢?局 skill 必须在这个目录下面, 那我们先用最基础的方式手动创建这些文件夹,这个文件夹的名字呢,就是我们的 skill, 名字就叫做阿水 ppt 吧。这里的文件夹里面呢,必须有一个核心的文件,就是 skill 点 md, 文件 内容我已经创建好了,我们只需要把它粘贴过来就可以了。好了,这就是一个 skill 了啊啊, 有同学就会问了,这么多内容代表什么呀?别着急,我们一个一个来看。那这个文件里面呢,上面两条横线里面的内容,它叫做原信息,里边呢,有两个信息,一个是 skill 的 名字,一个是描述,就是它用来干嘛的,什么时候可以用它? 那我这里呢,直接写的,用 ppt 的 时候可以用。下面这一大段信息呢,就叫做指令,其实这里就是告诉 skill 它应该怎么做。那这里呢,我就直接写到怎么用,输出的格式是什么?那这个时候呢,就有同学又要问了,你这和自己写提示词有什么区别呢?嗯, 其实呢,还是稍微有点区别的,比如我们之前在用 jimmy 里面去生成,每次都是需要去重复输入提示词, 那如果现在去用 ide 文件,那我们只需要去输入需求就可以了。当然上面这个案例呢,是最最最初级的创建方法,简单的 skill 完全可以这么实现。那在做这个的时候,我就在想,有没有创建 skill 的 skill 呢? 果然不出我所料呀,可罗得克的官方出了一个创建 skill 的 skill, 它可以通过你的自然语言描述帮你创建一个 skill。 那 这个 skill 的 安装方法呢?大家可以去看我上期视频,巨简单。 当然这期的文档中呢,我也整理了安装方法。安装好了之后呢,我们只需要在这里用大白话描述帮我创建一个可以根据我提供的文章链接 pdf word 帮我生成 ppt 图片。这里呢,因为我们需要用到 nintendo 的 模型 api, 我 们就直接将 api 输入进去就好了。那通过我们这么一番描述,可以看到 ppt scale 就 创建好了,现在的 scale 就是 一个完整的 scale, 可以看到有说明文档,有脚本,还有输出文件夹。嗯,奇怪,我怎么感觉高级版创建起来怎么还比初级版创建起来更快更方便,更简单呢?对,主要是我们使用了创建 skill 的 skill 工具, 那我们来试试效果,出来的效果图呢,都是很不错的。那其实这个案例看下来呢,我们更多的是在用自然语言去写程序的一个功能,降低了代码的难度,而且拉近了普通人和创建软件的距离。所以只要你有明确的输入要求,或者有明确的方法 规范流程知识,创建 skill 工具呢,都会帮你创建出来一个定制的 skill 文档,里面呢,我整理了一些收集 skill 的 网站,里面有成千上万的 skill, 并且呢,我也给大家搜罗了一些普通人常用必备的 skill 工具,比如做 ppt 处理,文档表格处理,我们可以直接拖进文件夹就可以使用了。还有这个就是前端设计的 skill, 还有这个动画生成 skill, 可以 帮你做一些数学上难懂的演示动画。 当然大家也不用太焦虑怎么去把所有的东西都创建一个 skill, 我 们每个人呢,都不是必须成为技能开发者, 我们只需要把自己已经掌握的小技能或者已经沉淀出来的一些方法,重复性的事情交给让他去帮你做一些重复性的劳动力就可以了。那最后呢,资料链接我都放在了评论区, 大家快去手动创建试试吧。这个时候呢,大家就不要吝啬自己的点赞收藏关注技能了,我们下期再见,拜拜!

先给结论,剪辑式的 skill 本质是专业提示词加工具接口的组合器,同时通过渐近式提示词让 ai 按步骤完成整个剪辑流程, 这不是未来,而是正在发生的现实。 skill 的 两点核心本质,一、加 a 专业提示词加工具接口组合 提示词告诉 ai 风格节奏、剪辑规则,工具接口让 ai 调用剪辑软件素材库、音频处理工具执行操作。二 d 渐近式提示词展现 skill 不是 一条一次性指令, 而是分阶段分步骤驱动 ai。 比如先筛选素材,再剪辑片段,再调整时间轴,再添加转场,再处理音频,再生成字幕,再生成字幕,最后输出多版本。每个阶段的提示词都有明确目标, ai 根据前一阶段结果逐步完成下一阶段任务。第一次点名剪辑师的具体工作内容, 你每天做的事包括 skill。 将每一步拆解成可执行模块, ai 自动按步骤执行,几乎不需要人工干预。 skill 拆解流程示意,一 john 上传素材并选择风格。一、 ai 根据提示词筛选高质量片段。二、抵 a 时间轴排列, ai 按节奏自动剪辑。三、 它我转场特效处理耶, ai 自动添加符合风格的特效。四、 ro 音频处理耶自动匹配音乐和音量 五、 g a 字幕生成一,自动生成并嵌入六天它多版本输出杀不同平台尺寸和格式自动生成,每一步都是渐进式提示词驱动,确保 ai 完整理解目标并执行智能体协调。多个 skill 同时运行,全天候处理几十条视频, 输出,质量可控统一,无需疲劳,企业效率提升数倍,成本大幅下降。最后一句话, skill 的 本质决定了它能逐步替代剪辑师的重复工作,这是不可逆的趋势。

面试官问你, m c p 和目前 skill 有 什么区别?很多人在这个问题上就开始含糊了,什么都往上堆,说了一堆听起来都对,但其实没抓住重点,其实一句话就能说清楚。 skill 定义的是能力, m c p 定义的是连接 skill, 告诉 ai 怎么做事, m c p 告诉 ai 去哪拿东西。展开来说的话, skill 本质上是一组预定义好的指令和处理逻辑,你可以理解为一本操作手册。 比如你写了一个 skill, 教 agent 按照公司的规范去做数据分析报告,先按区域拆分,再算同比还比,最后按模板输出, 这就是一种能力,跟数据从哪来没有半毛钱关系。 m c p 呢?它是一个标准化的开放协议,解决的是 agent 和外部系统之间怎么通信的问题。你的数据库,你的网盘,你的代码仓库,这些东西都在 agent 的 外部, m c p 负责把这些通道打通,让 agent 能实时的去读取和操作这些外部资源,而且它是持续在线的,不是调一次就断了。 打个比方,你是一个厨师, skill 就是 你脑子里的菜谱,记录着每道菜怎么做, m c p 就是 你厨房里通向冰箱,通向菜市场的那条路,菜谱再好,没有食材通道你也做不出菜。食材通道再畅通,你不会做也只能干瞪眼。 这个时候,面试官大概率会追问一句,既然这样,为什么不在 skill 中加入数据获取的 a p i 呢?那不就能取代 m c p 了吗?这个问题其实是个陷阱,听起来很合理, 但经不起推敲。首先你要承认一件事,在 skill 里面写 api 调用技术上是可以跑通的,目前构建 skill 也需要放一些实际的代码,比如数据清洗的代码,格式转换的代码,这些都是 skill 里面很正常的组成部分。所以有人说,那我顺手把调 api 拿数据的脚本也放进去不就完了吗?逻辑上好像很通顺, 如果你只是偶尔调一个简单的接口,确实能用,但问题是能跑和能用好是两回事。第一个问题是认证,真实业务场景下,你对接的系统基本都有健全 off token 刷新,密钥轮换,这些事情你全得自己在 skill 里面处理,写一个还好,写十个你就疯了。而 m c p 在 协议层统一处理了这些事情,接进来就能用, 不用每个数据员单独搞一套认证逻辑。第二个问题是连接模式完全不同, skill 里面的脚本是被触发一次执行一次的,跑完就结束了,它本质上是一个无状态的东西, 但很多真实场景需要的是持续连接,比如监听数据库的变更,比如实时同步文件的更新。 m c p 建立的是一条常驻的通道, agent 可以 随时去查、去写、去监听,这是 skill 里面一段脚本做不到的事情。 第三个问题是扩展性。今天你要接一个 google drive, 在 skill 里面写一套请求逻辑,明天要接 github, 再写一套后, 后天街公司内部数据库又是一套,每一套都要单独处理分页错误,重试、数据格式转换,你会发现你的 skill 越写越臃肿,最后百分之八十的代码都在处理数据获取,真正的业务逻辑反而被埋没了。 m c p 的 意义就在于,它是一个标准协议,数据源那边实现一个 m c p server, 你这边直接连所有数据员,用同一套交互方式,不用重复造轮子。第四个问题也是架构层面最根本的问题就是职责混乱。软件工程里有一个基本原则叫关注点分离。 skill 的 职责是定义处理方法, m c p 的 职责是打通数据通路, 你把数据获取的逻辑塞进 skill 里面,就好比你在一份菜谱里面同时写了怎么养鸡,怎么种菜,怎么搭建冷链物流,能写吗?能,但这本菜谱会变得无法维护。 哪天 a p i。 改了一个字段,你得翻遍所有 skill, 去找哪些地方受影响。但如果数据层和能力层是分开的, a p i 变了,你只用改 m c p 那 一层,所有 skill 完全不用动。 所以结论是什么呢?在 skill 里面写 a p i 调用,本质上是在能力层里面硬塞了一个连接层的活,短期看能跑,长期看一定会疯。 m c p 和 skill 不是 谁取代谁的关系,而是各管一层,组合在一起才是一个完整的架构。 m c p 打通数据 skill, 提供方法通路加能力,这才是一个真正能在生产环境里跑起来的 agent。

q, 到底会不会取代 m c p? 很多人在问这个问题啊,答案呢,非常明确,我不会。 m c p 呢,有成千上万种,到底怎么来选?我本人呢,用了几十个 m c p, 沉淀下来最常用,并且呢,使用的效果又很好的有四个 m c p, 少而精。在视频后面呢,我 会给大家详细分享这四个常用的 m c p。 先回答,为什么 q 它不会取代 m c p 啊?这两个呢,看起来它是都跟上下文相关,但其实呢,有很大的不同。举个例子呢,你就明白, 我们现在这个任务呢,是要搜索技术文档。 m c p 的 作用呢,是让大模型能够连接到搜索引擎,这其实是提供了一种能 力啊,那 skill 的 作用呢?它规定了搜索的策略以及最后处理的方法,也就是怎么搜,始终优先查找官方的 api 文档,而不是网上的一些驳客文章,以及怎么总结将搜索结果呢,总结为带有引用链接的简报的这种格式。所以在这个例子里面, m c p 呢,它提供了一种搜索的工具或者说能力。 skill 呢,则提供了关于如何搜索知识以及搜索结果如何进行处理的方案。这点呢,在 osapi 最近的工作簿刻里面,其实已经明确指出了它们之间的这种区别啊,官方的表达是 m c p 呢,它用于连接,那 skill 呢,是用于 程序化的知识,所以从这个表述来看, skill 呢,更像是轻量级的工作流。下面跟大家分享四个我常用的用起来的工作流,下面呢,叫做 context seven m c p。 那 这个呢,绝对是编程的利器,它会自动去寻找你这个编程项目相关的库的最新的文档,比如说 python 呢,很多库呢,它都是不断更新的,但是大模型本身呢,往往会滞后于这些库的更新。比如说最近的库呢,它是 v 五版本的,但是呢,大模型训练的时候呢,它只看过 v 三的库, 如果不用这个 m c p 啊,大模型就会按照 v 三的版本来写这个代码。但是呢, v 三里面的请求参数啊,还说名称这些呢,在最新版本里面已经是弃用了,或者说已经有变化了,因此呢,写出来的代码呢,往往就会报错。那 context seven 这个 m c p 呢,就是用来解决这个问题的。 在写代码前,它会把相关的库的最新的 introduction, fake, start 以及 api 的 reference 呢全部读一遍,从而获得最新的这个上下文的信息。第二个呢是 markdown m c p, 这个是在开源社区下载量最高的一个 m c p 啊,它的核心功能是把一个网页变成 markdown 的 文本,那这个为什么这么有用呢?它的核心就在于它减少了 token 的 消耗,因为大家都知道,网页本身它是带有大量的这种 html 的 标签,以及 c s s 的 内联样式,这些标签样式呢,它其实占据了不少的这个上下文,而大模型需要的其实只是文本本身,那这个工具呢,把这些无效的这种信息呢给去掉,转为层次清晰的 markdown 格式,保留文本本身。从我个人的经验来看呢,同样一个网页, 用了这个工具呢,能够减少大概三分之一的上下文。当网页内容很多的时候,如果你不做处理的话,这些内容其实会把上下文给爆掉,导致模型变笨。所以说如果你经常要处理网页,那必须要用这个 m c p。 第三个呢是 exa mcp, 这是目前口碑很好的一款搜索 mcp 大 冒险,本身呢,它是没有搜索功能的, 那这个工具呢,具有语义搜索的能力,它不仅是匹配关键词,而且呢可以理解你要表达的这个含义啊,它可以根据任务的需要呢,自动地去搜索最新的讨论,业界的动态以及博客文章。第四个呢,叫做 payride mcp, 这个工具呢非常强大啊,它 可以操作浏览器,有头和无头这两种模式,区别呢,就是说他是否在电脑上呈现操作浏览器的这个过程。既然是操作浏览器,大家应该立刻能意识到这个用处呢,就非常的大。因为我们日常的办公工作,其实大部分跟浏览器相关的, 比如说写完前端的页面之后,可以让 paywrite 截图, ai 通过分析截图呢,来调整 c s s 样式,比如说你的居中啊,颜色重叠这些问题,这笔只看代码来干想呢,强一百倍,这是通过 paywrite 来做视觉的反馈。再比如有些动态的网页的内容呢,你靠一般的 http 请求 呢,一般是拿不到的。那这个时候呢,模拟操作浏览器就有大的用处了,这个 m c p 呢,它会打开这个网址,执行网页里面的 js 代码。最后呢,拿到一个结构完整的,包含网页所有文字和图片的这样一个 dom 数,那以上四个呢,都是用途很广。 m c p, 如果你是用的像 cherry studio 这样的 a i 客户端,那还应该需要一个 build system 这种 m c p, 它能够让你从 ai 客户端里面直接创建文件,修改文件的内容以及重构文件夹的结构。好了,如果本期内容呢?有收获可以点赞收藏。下期我们继续讲四 q 和 m c p 的 这个系列。

openclaw 会有一万三千加 skills, 到底哪个值得装?

晚上听小生哔哔和秋之他们在聊那个养龙虾的事情嘛,然后我觉得有一个点是我特别有共鸣的,就是,呃,当你有了 skill 之后,你再也不用重复的去教人做一件事情了,因为我不知道大家会会不会很喜欢带人,反正我是很不喜欢这一件事情重复讲很多很多遍。 然后呢?自从我可以自己创建 skill 了之后,我可以把我过往的经验,我的 s o p 全部都沉淀在一个 skill 里面,然后东西不仅我能看得懂,我的 coco 的, 我的小龙虾都能看得懂,甚至我把它发给我的其他同事们,他们也能看得懂,然后他们的 ai 也能看得懂。哇, 这个简直就是超级的无敌爽,你再也不需要就是一个事情,我可能重重复复跟一个同事说好几遍,然后最后他还是没有按照我那种方式执行,我觉得太崩溃了。就我觉得这个真的是 啊,真的太爽了,太爽了。就为什么要创造自己的 skill, 就是 因为它要非常迎合你们整个工作流里面的那个 sop, 但是非常重要的,然后你就省去了 百分之八十的那种待教时间,我觉得会非常非常的快乐。就所以我觉得现在的热度可能都在说怎么安装小龙虾身上,但我觉得其实如果你真的想要好好研究一下怎么去创建 skill 和调用 skill, 这个是很重要的一个点。就这样啦,拜拜,晚。