每天一个 open class q, 今天是 ai agent tools、 catalog, 八十多个即插即用的 ai agent 工具包, python 和 tax script 都能直接用。这条讲清有哪些工具,怎么集成,怎么配置。 开发 ai agent 的 时候,最头疼的就是找工具,搜索要写集成代码,数据库要写连接器、浏览器自动化,又要找新的库,每个工具都要自己封装,开发周期动辄几周,还容易出 bug。 现在有了 ai agent tools catalog, 一 切都不一样了。这是一个开源工具目录,收入了六大类八十多个即插即用的工具包,支持 lan、 chain、 file、 data q、 ai 等主流框架。 比如你想给 agent 加搜索能力,直接引入 table 里或 excel 工具包,一行代码就能调用 agent 自动联网搜索,返回结构化结果,不需要自己写爬虫,在 open cloud 里把工具包配置到 cloud skills 目录,填写 a p i t, 就 能用。 工具集成时间从几周缩短到几分钟,开发效率提升十倍以上。从自己封装每个工具,到直接引入现成的工具包,八十多个工具覆盖搜索数据库、浏览器、 co interpreter 代码执行、 productivity 生产力集成 web browsing、 网页浏览、 database 操作、 file operations 文件处理。 适用于构建 ai 搜索助手、自动化办公流程、数据分析 agent 网页信息,抓取多元数据,整合客户服务、机器人等场景。 传统方式需要自己找库封装接口处理错误。 ai agent tools catalog 提供统一接口,开箱即用,支持多框架兼容。 三步配置,一、从 catalog 选择需要的工具包。二、安装对应依赖。三、配置 a p i t, 即可在 agent 中调用。点赞、收藏、关注我,每天一个 open class, 明天见!
粉丝2755获赞4939

这个是我用 opencloak skill 自动发的推特,从写作到发送都是它自动完成的,这个录屏的图呢,也是我用 opencloak skill 让它自动化的。今天就来给大家分享两种在 opencloak 里面使用 skill 的 方法。第一种就是直接把这些在 cloak code 里创建的 skill 全部都 copy 一 份过来。 之前也跟大家讲过, skill 的 本质上其实就是一个文件包,所以其实我就直接让它去到 cloak code 下放 skill 的 默认文件夹里面去找我想用的 skill。 比如说我之前最有这个 obsidian 画图的 skill, 然后我就让他找到这个 skill, 让他复制一份到他自己的文件夹下面,我就可以直接在我的飞书里面去直接使用它了。那这个就是我当时让他去文件夹里面找之前 obsidian 的 skill, 然后他找到了之后帮我平移过来的过程其实非常的丝滑,很快就能搞定了,搞定完了之后我直接用就行了。然 第二种方式呢,其实是根据大家自己跟小龙虾的写作流程,让他把这些流程抽象一下,固定一下,然后自己生成一个 skill。 我 昨天跟他去看怎么发推推的时候,其实是他写了一个脚本,然后我们还存了很多的各种各样的 app, 然后我就让他把这个脚本直接封装成了一个 skill, 他 接下来就可以直接去写推文,直接调用推推的 a p i 直接去发布了。 他发的内容是长这样的,也跟大家看一下,欢迎大家关注这个土豆账号。那这个步骤其实也非常简单,就是我跟小龙虾已经把这个发推的流程完全的走过一遍了,从写胶本到调 api 再到去存各种各样的 k 字到发送,那我就让他直接把这个流程提炼出来,然后让它封装成一个 skill 就 可以了,非常简单。 但这种方式其实我觉得可能是咱们会用的更普遍的方式,因为在咱们的很多很多的写作流程里面,会衍生出来很多独属于咱们自己的这种流程和 skill。 我 知道最常见的还有一种就是在官方的 flowhub 里面去下载一些 skill, 这个方法咱们下期再聊,今天就先到这,大家新年快乐,下期见。

opencloud 小 龙虾天天失忆?昨天一起熬过的夜,今天早上一问全忘了。教你一个技能彻底解决这个问题。和你的小龙虾说安装 cloudhub 的 agent rachel 技能,这是我自己制作的 agent 记忆复盘和自我迭代的技能。最后一步,添加定时任务。 这么跟小龙虾说,凌晨两点执行 agent retry 技能复盘昨天的行为,并且把结果发给我。第二天一早检查小龙虾昨晚发送的这样的信息,就是成功执行了。你的龙虾会失忆是因为我们看到的聊天记录不等于它的记忆。 agent retro 会把前一天我们所有的聊天记录拉出来,详细的分析做了什么事情,做对了哪些做错了哪些有什么需要改进的,以及分析用户的画像, agent 自己的画像,最后再去更新它的长期记忆文件。长期记忆是 open cloud 的 特点, 在记忆的基础上,能够自我迭代的龙虾机器人会是越来越懂你的 ai 助手,关注我,带你玩转 open cloud!

如果你的 android skill 安装了,但是发现并不好用,比如说总是不触发,大概率是 description 没有写对。今天分享六个呢, skill 创建的技巧,全部是从 ospec 官方仓库里面扒出来的实战经验。第一个 skill md, 要有黄金结构。很多人写 skill md 呢,就是一坨文字糊上去, cloud 其实根本看不懂。 正确的写法是分块, purpose, when to use process, decision, logic, output。 每一块呢,都用标题和列表写清楚。 cloud 呢,一看就知道该怎么执行。 第二点啊, description 的 写法是否正确,直接决定了处罚率,这是最容易踩的坑啊。你写帮助用户处理 excel, 这太模糊了, ai 不知道什么时候该调用你,你得写清楚两个关键信息,第一个呢,叫做能做什么?第二个呢,是什么场景来调用?比如正确的写法呢?是这样的 好,你看前半句,列出了四个具体能力,提取数据,执行透视表,生成图表。后半句呢,写明了处罚的场景,分析表格数据或者自动化工作流,具体化,以 才能被精准触发。而且第二个信息点更关键,因为很多人会写干什么,但是常常忘记写什么时候来触发这个 script。 第三啊,重复的活呢,封装成 scripts。 比如说你经常要抓取网页内容,每次呢,让 ai 现写代码又慢又不稳定,直接写一个脚本呢,扔进 scripts 文件夹,然后在 s q m d 里面呢,告诉 ai 调用脚本就行。注意啊, scripts 文件夹里面的内容再多都是不加载到上下文里面的,而只是执行,因此 intoken。 而且由于是代码逻辑呢,是前后一致的,完全是稳定的。第四个, reference 文件夹要按需加载, qmd 里面超过了多少字就要拆分呢?从时间来看呢,最多不要超过五千字啊,如果超过就 把详细文档呢放进 reference 文件夹里面,在 qmd 里面写上需要时读取某某文件,这样 ai 不 会一次性的塞满上下文,只会在用到它的时候呢才加载。第五个, 直接抄官方的优秀案例, ospeak 官方的 skills 仓库呢,有六万多的 star, 里面的 m c, p, builder, web app, testing, internal, commerce 这些呢,都是生产级的 结构,怎么组织,指令怎么写,资源怎么分配,全部呢,都是现成答案,抄完改成你的领域就行。第六个,打包分享出去, skill 则遵循开放的标准,一个 skill m d 呢,加上 scripts, reference, assets 三个文件夹,打包呢就能给别人用。你做的 skill 呢,越专业,附用的价值呢就越高,对你带来的影响力呢也就 越大。总结一下, description 决定了触不触发,触发率是多少, skill m t 的 结构呢,决定了执行的质量, scripts 和 reference 呢,决定了效率的上限。 ok, 这一期呢,讲到这儿,觉得不错的点个赞,后续呢,还会拆解更多的 skill 的 实战的玩法。

哈喽,朋友们,我是阿水, a 正的 skill 最近真的太火了,但是很多朋友肯定想知道到底啥是个 skill, 凭什么这么火?那朋友们莫慌莫慌, 我呢已经为大家整理好了一套小白必读的 skill 大 全,今天的内容呢,我们将从简单到困难,一路升级打怪。首先呢,我们来看 skill 的 结构和它的原理, 然后呢,我们通过学习来定制自己的 skill。 这个 skill 呢,我们只需要简单的一句话,帮我根据这篇文章生成 ppt 分 析和内容规划,那它就会自动去执行和生成我想要的资料。 另外呢,我还会给大家推荐一些好用而且必用的 skill, 比如说帮你的文章配图,把杂乱的知识变成一个教学网页, 一句话处理表格等等等等等等。这期所有的资料我都已经整理成了文档,只需要一步一步跟着做,跟着看,就一定可以学会。那还在等什么呢?赶快点赞收藏关注呀! ok, 那 我们就 let's go! 那说了这么半天,到底什么是 agent skill 呢?直译过来呢,其实就是技能呗,比如可以把它看成一只小狗,这只小狗呢,它会记路线,听指令,使用工具,能听懂你的语气。那 agent 呢,也是同理,它要和你和平相处,也是要会这些东西的。 所以在 a 证的 skill 的 术语里面呢,它最最最核心的文件就是 skill 点 m d ai 的 工作手册,当然呢,还会有其他的文件,最后将这些文件集合在一起,打包成一个文件夹,这就是一个技能,一个 skill 了。 那有同学就要问了,阿水看着挺复杂的呀,这么做的好处是什么?本质上来说, skill 对 不懂代码和不懂怎么去创建软件的小白群体来说, 是大大降低了门槛的来,如果还是不懂,我们做一个超级简单的 skill 就 好了。这里呢,我用到的是谷歌的反重力工具 模型呢,因为可多扣的真的封号太严重了,我就用 jimna。 那 这个软件的下载方式呢?我已经放进了文档里面,可以说是非常的 perfect, 比如说我们打开反重力,在这里呢,选择模型 jimna pro 就 可以, ok, 我 们就可以开始创建了。那我们就先创建一个可以制作 ppt 的 skill 吧,可以根据我输入的文章链接或者文字帮我生成一个 ppt 内容规划。那按照反重力的创建规范呢?局 skill 必须在这个目录下面, 那我们先用最基础的方式手动创建这些文件夹,这个文件夹的名字呢,就是我们的 skill, 名字就叫做阿水 ppt 吧。这里的文件夹里面呢,必须有一个核心的文件,就是 skill 点 md, 文件 内容我已经创建好了,我们只需要把它粘贴过来就可以了。好了,这就是一个 skill 了啊啊, 有同学就会问了,这么多内容代表什么呀?别着急,我们一个一个来看。那这个文件里面呢,上面两条横线里面的内容,它叫做原信息,里边呢,有两个信息,一个是 skill 的 名字,一个是描述,就是它用来干嘛的,什么时候可以用它? 那我这里呢,直接写的,用 ppt 的 时候可以用。下面这一大段信息呢,就叫做指令,其实这里就是告诉 skill 它应该怎么做。那这里呢,我就直接写到怎么用,输出的格式是什么?那这个时候呢,就有同学又要问了,你这和自己写提示词有什么区别呢?嗯, 其实呢,还是稍微有点区别的,比如我们之前在用 jimmy 里面去生成,每次都是需要去重复输入提示词, 那如果现在去用 ide 文件,那我们只需要去输入需求就可以了。当然上面这个案例呢,是最最最初级的创建方法,简单的 skill 完全可以这么实现。那在做这个的时候,我就在想,有没有创建 skill 的 skill 呢? 果然不出我所料呀,可罗得克的官方出了一个创建 skill 的 skill, 它可以通过你的自然语言描述帮你创建一个 skill。 那 这个 skill 的 安装方法呢?大家可以去看我上期视频,巨简单。 当然这期的文档中呢,我也整理了安装方法。安装好了之后呢,我们只需要在这里用大白话描述帮我创建一个可以根据我提供的文章链接 pdf word 帮我生成 ppt 图片。这里呢,因为我们需要用到 nintendo 的 模型 api, 我 们就直接将 api 输入进去就好了。那通过我们这么一番描述,可以看到 ppt scale 就 创建好了,现在的 scale 就是 一个完整的 scale, 可以看到有说明文档,有脚本,还有输出文件夹。嗯,奇怪,我怎么感觉高级版创建起来怎么还比初级版创建起来更快更方便,更简单呢?对,主要是我们使用了创建 skill 的 skill 工具, 那我们来试试效果,出来的效果图呢,都是很不错的。那其实这个案例看下来呢,我们更多的是在用自然语言去写程序的一个功能,降低了代码的难度,而且拉近了普通人和创建软件的距离。所以只要你有明确的输入要求,或者有明确的方法 规范流程知识,创建 skill 工具呢,都会帮你创建出来一个定制的 skill 文档,里面呢,我整理了一些收集 skill 的 网站,里面有成千上万的 skill, 并且呢,我也给大家搜罗了一些普通人常用必备的 skill 工具,比如做 ppt 处理,文档表格处理,我们可以直接拖进文件夹就可以使用了。还有这个就是前端设计的 skill, 还有这个动画生成 skill, 可以 帮你做一些数学上难懂的演示动画。 当然大家也不用太焦虑怎么去把所有的东西都创建一个 skill, 我 们每个人呢,都不是必须成为技能开发者, 我们只需要把自己已经掌握的小技能或者已经沉淀出来的一些方法,重复性的事情交给让他去帮你做一些重复性的劳动力就可以了。那最后呢,资料链接我都放在了评论区, 大家快去手动创建试试吧。这个时候呢,大家就不要吝啬自己的点赞收藏关注技能了,我们下期再见,拜拜!

二零二六年,每一个用 ai 的 人都应该学会 agent 加 skill 来给自己提升效率。 agent, 我 使用免费开源的 open code, 在 官网下载桌面客户端就可以使用。这个中文站点有完善的文档和最佳实践供我们参考。 skill, 我 们从可能是全球最大的技能市场 skill mp 中获取。搜索 frontend design, 下载到电脑备用。建好项目文件夹, 放入 skill 和我们要创作的内容,用 open code 打开,输入这段提示词来驱动,静候片刻,这个制作精美的内容展示网页就完成了。 你可以用来部署站点或者是分享到社交网络。这就是 agent 加 skill 最基本的用法,轻量好感,易分发,零代码。这就是获得十倍生产力的秘籍。关注我,带你玩转 agent 加 skill!

装了 openclaw, 但发现它什么也干不了,甚至有点笨。那是因为你还没有去 clawhub 给它装 skill。 clawhub 上有一万七千多个 skill, 我 从下载量前三十和我自己高频使用的做了交叉筛选, 只推荐这十个,装完至少强三倍。第一个 skill writing, 安全审查员,他会在你安装任何 skill 之前扫描安全风险检查红旗标识、权健范围和可疑模式,能检测 prom 的 注入工具、逃毒、隐藏恶意代码。建议在装任何其他 skill 之前先把它装上。第二个自我进化 skill, 它是 cloud 交互下载量第一的 scale, 解决大模型失忆症。它会自动把每次的错误日期、成功经验和你的编号存到本地数据库,下次遇到类似问题,直接调用历史经验实现,越用越聪明。这个 scale 的 价值不在于第一天,而在于第三十天, 用的越久, agent 越像你的数字分身。第三个, tablie search ai 专属搜索引擎,让 agent 学会上网搜索,而且搜出来结果是 ai 友好的。 不同于传统搜索引擎返回一堆链接, tabl 直接返回干净的结构化内容, agent 拿到就能用。第四个 summarize, 全格式内容,摘药专家,网页、 pdf, 图片、音频、视频,什么格式都能一口吞下去给你摘药。 我的日常用法是 tabla 搜索加 summary 总结,先搜到相关页面,再把整篇内容压缩成五百字未给上架文,效率翻倍。第五个, find scales, 寻找 scale 的 scale, 用自然语言告诉 agent 你 需要什么技能,它帮你找到并安装对应的 scale, 不知道装什么的时候直接问他就行。六个 using superpowers 来源于 superpowers, 这个强大的插件,核心理念是让 agent 严格按照先查 scale 再行动的规则做事,杜绝偷懒和无距离探索。如果你发现 agent 不 用你装好的 scale, 就 自己瞎搞, 这个 scale 能帮你管教他。第七个, react 最佳实践技能的性能优化圣经 worst one 方共同团队出品, react 和 next 最佳实践前端开发者必装。 第八个前端设计技能,帮你写出更有设计感的前端页面。按 zorbike 官方出品强制 agent 先做设计思考,再写代码,把从能跑就行提升到设计合格。第九个, github github 全流程操控,让 agent 直接操作你的 github 仓库, asos prci 一 条命令搞定。最后一个浏览器操作技能,让你的 opencloud 像人一样打开网页,点击按钮,填写表单,截图画面。最后帮大家总结一下。

用 open cloud 的 朋友应该都知道聊天可以,但是一旦你认真跑多个 agent 自动化任务,定时触发任务的时候,问题就来了,你不知道现在发生了什么,不知道谁在执行,谁卡住了,谁在等,你, 不知道今天消耗了多少桃梗,也不知道后面有多少个定时任务正在排队,所以你知道 openclaw 很 强,但是你不知道它到底在干什么。为了解决这个问题啊,我做了这个 openclaw 的 控制中心,把所有分散的信息啊全都回收回来,让你一眼看到每个 agent 现在的状态,以及他们的人设文件,谁在工作,谁出了问题, 任务到底有没有在执行,以及今天的消耗是不是异常,所以我把它开源出来,你可以只拿去用,或者是你拿去改,按你自己的团队,你自己的工作流,你自己的审美继续定制。如果你也想让你的 openclaw 彻底告别黑河,千万别眨眼,我们马上开始。 你不需要你手动安装,最好就是让 openclaw 帮你安装,可以往下拉。我给大家准备了这样一个特别大的 pump, 根据你的环境,根据你的网关,根据你用的模型跟你的 agent, 根据你的情况来接入整个的控制中心,为你所用。这个过程不是一蹴而就的,每个人的环境都不一样,我们用的模型也不一样,但是呢,你可以让 open cloud 慢慢的 把这个软件调整到你最想要呈现的状态,尤其是展现你最想要看到的信息。首先第一个页面是总览,总览我只想说一个,就是这个健康分,大家可以看到现在是一百分,它由四个维度决定, 分别是审阅队列,就是有没有任务就卡住了,需要你人工审批才能继续进行。运行异常就是异常停滞执行,就是他在无效执行,他没有更新,他没有产出,但他一直在消耗着资源。预算风险就是有预算有没有达到当前的百分之八十 是扣分制,大概是每一项有一个问题就扣十八分,看到目前我没有问题。那么除此之外呢,其他的所有的信息在总栏里面都来自于我们左边栏啊,这些 信息的一些汇总。下一个是个特别实用的页面,就是看我们具体的用量,这里呢可以分为今天或者是累计的用量来看。对于我来说,因为我是订阅制嘛,所以具体的 talk 用量或者是估价对我来说都不重要,重要的就是有没有达到五小时和一星期的上限,这里呢也可以看到。 其次就是很重要的是我们需要看到到底是哪些类型的任务在消耗我们大部分的 talkin, 就 这时候啊,可以看到这个统计对于我来说是矿定时的任务消耗大部分 talkin, 其次是在 disco 里面对话给他的任务, 那么由于定时任务消耗了最大的 talkin, 那 么定时任务又有很多,到底哪一些任务消耗了更多的 talkin 呢?这还有一个继续的统计,对于我来说,消耗最多的就是这个在 x 上搜索情报的这样一个任务, 因为它每三个小时就要出发,就要去操作浏览器,在我的账号里面浏览相关信息,然后再汇总给我,所以它确实是消耗最多的, 那么你可以看到整个的所有消耗的任务,然后你可以根据它的用量进行一些优化,哪一些可以去掉,那么哪一些呢?是需要保留或者是继续再把它减轻的?那么下一个页面就是 agent 页面,里面就有所有的你的 agent 当前的状态,有没有工作,然后最近的产出,有没有排班儿 等等等等。那么关于我的呃 agent 团队每一个员工的工作去干什么呢?我在上个视频都说了,感兴趣的朋友大家可以去看一下,然后设置自己的 ai agent 的 团队。 那么这里还有一点我想说,就是往下拉,大家可以看到每一个 agent 它用的是什么模型,以及它的工作目录是怎么样的,还有它的权限是怎么样。下一个功能就是我们可以查看和修改任何 agent 的 记忆。 记忆呢,一共分为两种啊,一个是长期记忆,一个就是我们对话县城的对话记忆。我们还以 monkey 为例,那么这里 memory md 就是 猴子的长期记忆,看到这里我可以看到啊,然后这里我们也可以修改它的记忆, 那么拎任何的下面带 session 开头的就是对话记忆了,也可以查看和修改。每个 agent 都有自己的人设,自己的性格,自己的语气,自己的任务, 那么这些呢,也可以查看和修改,这就是我们点击这个文档页面,我们还是以 monkey 为例啊,之前讲多 agent 团队的时候,我们讲过 agent 点 m d 就 定义了这个 agent 的 任务,这里呢我们可以查看他的任务,然后呢,如果有不到的地方,我们可以直接进行修改, 同理呢,你也可以修改其他的 markdown 文件,比方说心跳啊, tools 等等等。最后一个功能就是看任务了,尤其是定时任务或者是心跳任务。这里我们点开我们的任务界面 左边的半截,我们可以看到一共有九个有效的定时或者心跳任务,其中三个已经在今天还要继续完成,而六个已经完成了,明天会接着继续。 那么右边的半截可以看到我们所有的心跳任务。好呢,这就是我自己为自己的 open class 做的控制面板了,希望你呢以它为起点,改变出你自己的风格,加入你自己想要的信息,或者是改变整个的排版。那么这期视频就到这里了,不要忘记点赞和关注,我们下期再见。

来,咱们今天用代码聊一个构建 ai 的 好东西,智能体技能。如果你写过 ai 智能体,肯定有过这种头疼经历,提示词越来越长,又慢又贵。智能体技能就是来解决这个的, 它能把专业能力打包成独立文件。那它是怎么做到的呢?诀窍在于一个叫渐近式批露的架构设计,简单说就是三步走,只在需要时加载全部信息,让上下文保持清爽。 一个技能的结构其实特简单,就是一个文件夹里面放一个 s k l 点 m d 文件。这个文件分两部分,你看开头是烟某格式的原数据,定义了名字和描述, 下面就是 markdown 正文了。这里才是给智能体看的具体操作指南,要是任务复杂点没问题,你还可以加各种资源,比如脚本或者数据文件。 这时候你可能会问,这跟函数调用什么的到底有什么不一样?区别大了,这么记,技能是告诉 ai 怎么做,而工具是让 ai 去做, 看这张表就更清楚了。最大的好处就是按需加载,能省下大把的 token。 好 了,理论聊得差不多了,上,代码在项目里到底怎么用起来呢?我们用 mak 点 net 举个例子啊,第一步,创建一个注册表,从文件夹着加载技能, 然后比如用户输入了一个斜杠明令,咱们就用它来激活对应的技能。最后也是最关键的一步,把技能里的指令直接塞进发给模型的提示里,所以整个过程就是调用大模型前,把技能说明书和用户问题打包发过去。 这么做的好处显而易见,你的技能可以到处用,还能版本控制,多帮。好了,现在轮到你了,想想看你智能体里哪个流程最长?重复,那就是你的下一个技能。

这个呢,就是整个的一个 skill 的 一个架构和流程的一个方式。大家好,我是双月, 今天我们聊一下啊, ai agent 智能体 skill 部分的架构和流程。我们之前就聊过 agent 智能体的整体流程以及一部分的那个细分流程,今天我们接着聊 skill 部分啊, 呃,我们从最最原始的开始说哈,就是智能体吗?它是一个大模型,对吧?大模型呢,一般情况下是远程的,我们会调用它的接口啊,本地部署呢也有,但是应用比较少。 一般情况下,我们作为一个用户啊,我们去发送一个啊消息,然后呢我们传递到这个大模型,然后大模型呢会返回一个 呃结果,然后给我们最终的这个用户,对吧?好,这就是这么一个过程。但是最开始的时候呢,大家会发现,我们在调用这个大模型的时候呢,我们去配合这个提示词啊,就是这个 system prompts 啊,配合提示词配合好了之后呢,我们回复的这个质量会高很多。比如说你让他去写一个简历啊,直接说写简历,那大模型会给你写一个简历,但是这个格式呢,那就不一定了,而且不同大模型写出来的格式也是不一定的。 但如果说你在这个提示词里面给他规定好了写简历呢,你要这么写,要先写什么后写什么,然后这些内容要包含什么什么格式啊,都给他规定好了, 好之后呢,这个大模型写出来就是按照你规定的内容啊,对吧?而且不同大模型产生的这个格式呢,也是一样的。所以说这个系统提示词的研究是我们一开始使用大模型就有的,但是 从这个话题引起就是如果说这个大模型我们变成了一个通用的啊,通用的啊,或者说一个综合的 一个大模型,它功能比较多,内容比较多,应对的用户群体比较多,需求比较多,那大家任何的需求都会往这填,你写简历需要写一个提示词,那我制定一个出游计划是不是要写个提示词? 那我们在制定一个什么早餐计划,什么帮我列一个那个什么什么菜菜单菜谱,是不是也要制定个提示词?然后其他需求是不是也要制定个提示词,对吧?这样的话你的提示词会怎么样?会,会爆炸,对吧?会爆炸, 所以说太多了之后呢,会带来很多很多的影响。首先是你这个内容你就管不住,你因为你这个一深入到工作生活中,这个需求太多了,对吧?你 hold 不 住。然后呢,就是你的头肯受不了,对吧?你这个花费很多头肯。另外就是你这个多了之后,这个效率也也不行,也会慢啊。 还有一个就是如果内容多了,很容易造成这个大模型他的一个幻觉啊, 幻觉啊,幻觉是文明的说法,其实说白了他就是什么,就是可能就是错误或者瞎编啊,内容一多他就会产生幻觉,内容少了,这个幻觉就会概率就会低很多啊。所以说我们得解决这个问题啊,怎么解决这个问题呢? skills 就是 一个非常好的解决范啊。 skills 的 解决方法其实非常简单啊,这个世界上其实没有什么从零开始的创新,他就是一个微创新,每一步都是一个微创新啊。 我们就是把这个之前的 system prompt 这个系统提示的东西,我们给它做一个拆分啊,比如说这个 a 模块,我们放到这, b 模块单独放在这,对吧? c 模块单独放在这,我们把每一个都单独做一个拆分啊。然后这每一个模块都包含什么东西呢? 我们包含最基本的啊,名称,然后描述啊,这些内容比较少,每个模块都有,对吧?另外呢还有一些比较详细的,像啊主要的 content, 主要的流程,有的呢还可能会包含一些,呃, script, 就是 脚本 一些代码啊,有的呢可能还会包含一些那个 sauce, 就是 一些资源,一些数据之类的,这些内容就是比较多,比较详细。好,那我们分完之后我们要怎么办呢?就是 当我们这个 agent 启动的时候呢,我们都会抓取所有的这些 skills, 所有的这个 啊, name 和 description 就是 它的它的这个名称和描述,因为这块信息比较少,所以说你全部抓取出来之后呢,它会形成一个目录,对吧?形成一个目录,那这个目录的内容也是比较少的,然后我们再看这个 message 的 情况, 然后我们再去目录中去筛选可用的这个 skill。 比如说我们一看这个 message 输入的内容呢,我们都通过目录这个名称和描述一筛选发现,哎,第二个是可用的和第三个呢,也是可用的, 那我们就把这些可用的信息的这些详细的信息给他引入到这个提示提示词中来,这样就做到了。什么东西呢?这样就做到了一个动态,然后加 按需啊,这个就很关键啊,一动态一按需,这样的话就解决了我们刚才说的这个 token 效率以及幻觉的问题,对不对?所以说这两个是很关键的啊。 另外我们再细节说一说,怎么样去通过这个 message 的 信息,然后和名和和一系列的名称和描述找到可用的这个 skill 呢?啊,其实啊, 可以通过这种向量的方式,先把它向量化,然后通过向量搜索找到可用的这个向量搜索呢?其实我们在啊,我们在上一节 讲那个 r a g 的 时候,我们都已经讲过了,所以说这块没听过的,大家可以翻一翻之前的视频,看看这个 r a g 它到底是呃怎么样使用这个项链,以及为什么使用项链,以及什么是项链啊?这个都有,我们不重复讲了啊, 就是这是把这个呃提示词给拆分了,然后呢按需去加载动态,去加载相关的内容啊,然后做到这个解决了这个头盔大的问题,效率低的问题以及幻觉的问题,对吧? 那解决这两个问题的同时呢,其实还带来了一个新的好处,就是这个社区里面的积累啊。呃,积累 就是之前大家都往这个提示词里面瞎写,混着写,他是没法积累的,你写你的,我写我的,你说咱俩的提示词能能附用吗?附用不了,你写的格式我也不认,我写的格式你也不认,对吧?而且我的内容和你的内容不是完全相同啊,咱们可能有部分相同,但是有部分相同怎么弄呢?你拷贝下来这也不好弄,对吧? 但是你一旦这么完成了拆分之后,那就不一样了,那这个社区的这个附用和积累就开始了啊。首先是什么? 我们这有格式了,名称、描述、 content, 还有脚本,还有资源等等,这些我们可以做标准化和规范化,对吧?做完标准化规范之后呢,我们可以 附用啊。这个附用这东西就太关键了,我们做研发软件研发流程的时候,我们最强调的就是什么?就是解偶合,然后附用,对吧?所以 比如说你去做 react 开发,你去做 java 开发,你总会看到社区里面就有标准化的 react 最佳实践, java 最佳实践都是标准化的,你直接拿过来,直接往这一放,然后就可以用了, 对吧?多好,不用你自己写,你自己写的你也不如他写的好,对吧?所以这个拆分标准化很利于社区的积累,以及拿来就用的这么一个附用的一个方式,这是一个非常非常大的进步。所以说现在这个 skills, 你 可以说它就是 agent 里面 完全不可或缺的一种能力啊。好,继续。刚才我们说我们用,我们在这个通用的和这个综合的这种智能题里面,我们会用到很多很多的这些提示词,所以说我们要拆分, 那如果说我们只是单一功能的这么一个 agent 呢?我们不需要很多的这些,呃,分类,也不需要很多的内容,那我们这个单一功能的 agent, 我 们还需要这个 skill 吗? 答案是需要啊,同样需要单一共用的 agent, 同样需要这个 skill, 为什么呢?因为 skill 我 刚才说了,它有标准化,它有规范,而且它可以附用它本身它的这个 content, 这里面的内容就是一个比较规范化的一个计划 和一个说明,对吧?包含包括这里面的脚本啊,然后 saas 这资源啊,都是一些非常规范化的一些计划和说明, 这个非常有利于你们产品的,哪怕是单一 agent, 你 们产品的一个,呃,这个开发积累,以及多人之间的相同的一个学习和商量啊,总比你混在一块写这个题的词要好很多。所以说 这个 skill 它也可以完全适用于单一功能的 agent 啊,所以附用标准化这块就能拿出来,呃,在在在在这在这搞事情,对吧?非常非常好啊, 好,下个话题。我们这说啊,我们这有脚本,脚本呢,基本上是比如说 g s 代码,然后那个 python 大 码代码,还有一些那些 shell 的 一些脚本,对吧?就这些脚本呢,我们是能直接运行吗? 因为你在写这个 skill 或者看这个 skill 的 源码的时候呢,你看到脚本呢?你下意识的以为它好像就可以直接执行,但实际上不是的啊,因为脚本呢,我们说脚本啊,资源,它都是作为文本啊,都是作为文本去放在这个 system prompt 中的, 放到提示词中的,所以它本质上还是做一个文本,那这个文本它是不能直接执行的,那怎么执行呢啊?可以回顾最早一开始我们讲这个 agent 的 流程和架构的时候,我们有个什么,有个 tos 啊,就是工具,对吧?我们这些东西都需要工具来执行,比如说我们可以建一个工具叫做库的啊,执行各种各样代码,对吧? 然后呢,不仅仅是代码执行需要这个工具,比如说我们在这个内容里面,我们去写一些搜索网络信息之类的,我们是不是需要一些类似于 search 的 这么一个工具,对吧?比如说我们在这里面我们要去下载或生成一个 pdf 文档,我们是不是需要一个 pdf 相关的工具? 比如说我们要去生成流程图,我们是不是需要一个图之类的一个工具, 对吧?有很多很多的工具,所以你看到一些已经成型的智能体,就是我们正在用的一些智能体,你可以看到或者说你可以写很多脚本啊,描述啊都可以写,他都可以帮你执行和实现, 这是因为它内部已经内置了很多很多很多这样的工具,它已经帮你内置好了,你直接可以用就行了。但是你如果说你自己去从零开发一个智能体,那你还是需要去实现这个 toos 的 机制, 包括实现怎么样去识别这个名称描述,以及怎么样去把这个呃,根据名称描述去搜索可用的 skill 啊,这都是需要你自己从零去实现的啊。好,最后一个问题就是我们再看这个这个地方的这个资源, 资源看似是一些资源和数据,那我们能不能把我们所有的一些资源和数据全部给它放到这个 sauce 里面来呢? 啊?当然这样是不行的啊,这样是不行的啊,因为这里的资源和数据最终也是要被加载到这个 prompt 中的啊。提示词中的你不能太多,你可以是少部分的资源引导和说明啊,文字形式的,如果太多的话,我们可以参考上一节的这个 r a g, 我们最终还是要定一个数据库啊,无论是向量数据库还是其他数据库,然后根据这个输入内容去数据库里面做搜索,搜索出的结果呢,我们再做什么排序啊之类的东西,再放到这个整个的这个提示词中,然后给它 啊,所以这个 skill 它是什么?它是一个指导说明,那真正的数据啊,真正的数据员,我们最终还是要放到这个 db 这个数据库里面来 啊。 ok, 这个呢就是整个的一个 skill 的 一个架构和流程的一个方式啊。我们讲到了 skill 为什么会有,因为它要它要拆分,不拆分的话会有各种各样的问题,然后做到了按需和动态对不对,以及 这个 skill 的 拆分会带来社区的积累和规范,还有附用,这是非常好的以及 skill 和 to 的 关系,以及和 r a g 的 关系啊。 因为 ag 呢,它是一个综合的一个比较麻烦的一个架构啊。 scale 只是其中的一个部分,所以它和其他的东西呢,可能会有一些关联,也会有一些影响啊,甚至有有的地方可能会有一些呃, 可以在这儿用,也可以在那儿用的这么一个矛盾,看似是个矛盾,但是其实它它们有呃不同的用途,所以说一定要明白这个 skill 它到底是干嘛的,然后这个 r a g 的 这个数据它到底是干嘛的?这两个千万不要混了啊,如果混了的话,那很可能会导致你的 skill 里面塞了很多很多大量的数据,导致你的系统变慢,然后适得其反啊, ok, 到此为止。然后我们下一节我们再去分享 agent 相关的其他的一些详细内容。

最近 openclaw 实在太火了,周围的朋友十个里面有九个都在养虾,剩下一个正在琢磨怎么样去养虾。然后我发现,其实很多人没有仔细地研究过 openclaw 它的底层的一些逻辑,比如说决定一个龙虾好用不好用,很大程度上是由 scale 来决定的, 而大部分人对于 skill 这个概念反而是有些陌生的。那今天这期视频呢,我就尝试用一个真实案例来带你掌握 skill, 让你了解什么是 skill, 以及如何去创造自己的 skill。 大家都知道,我其实算是半个应酬公司吧,公司也没有钱去聘请一个专门的财务,所以像发票报销这样的事情呢,都是我自己去做的 啊,之前我没觉得这事有多麻烦啊,后来我自己整了之后觉得,哇,还是挺恶心的,因为像每月我的发票,有餐饮发票,有办公发票,对吧?它的类型还不太一样 啊,一般会分成三种类型。第一种呢,就是这个邮件里面会带一个 pdf 的 附件,我直接把这个 pdf 下载下来就是发票了。第二种呢,就是比如说像一些火车票, 它的附件呢是一个 zip 文件,你还得下载完了之后再解压,再把 pdf 文件提取出来。第三种呢,就更恶心一点,比如说有些餐饮店,它的发票其实它不是以一个附件的形式发给你, 它是一个链接的形式啊,你还得点一下这个链接,然后跳转完了之后呢,你再点这里的下载 pdf 才能够下下来。 下载完之后,我一般会把它放到一个文件夹下面,但这事还没结束,因为代账公司那边是有要求的,我得按照指定的格式去收集这些发票信息,比如说日期、报销明细、金额、支付人填写到这样的 excel 表格之后再发给我的代账公司,这事才结束。 呃, ok, 现在考一下大家你觉得整个流程里面哪个环节是最容易用 ai 去提效的啊?这个其实很明显哈,倒数第二步是最容易的, 就是我其实可以把我的发票文件呢,这收集好的 pdf 啊,直接发给 manage, 然后呢,让 manage 或者是 codes 或者是豆包,根据我的 excel 表格的格式啊去提取、收集、整理,最后生成一份新的 excel 表格给我。但这事有一个问题啊, 其实前面的第一步非常麻烦,尤其是当你的发票数量多的时候,你就得一个一个去点开这些邮件,一个一个去下载,然后去 copy, 然后再去解压啊等等等等。我记得我中间有一个月,那个月的发票收集了四十五张, 然后光前面的第一步就给我整的有点崩溃了,我一直想要把整套流程全部自动化,然后最近呢,我琢磨出来一套方法呢,是 tree, 呃,据来说是 tree 的 solo 模式, 其实你可以理解为它是一个运行在本地的 agent, 然后你就可以像跟 ai 聊天一样去跟它对话,只不过它的工作环境呢,是在你本地的文件夹下面,比如说我这里面有一个文件夹叫做 auto email test v 三。 然后我就像跟 ai 聊天一样,我先把我的需求发给他,比如说,呃,我告诉他我每个月都要整理发票,然后呢都在邮箱里面,我希望他整理一下我们二零二六年一月份啊以内的所有的发票,然后呢,我希望他整理一下我们二零二六年一月份保存到一个文件夹下面,然后我还告诉了他我的邮箱是 多少。在收到了我的这个信息之后呢,他其实做了一个思考,同时有个很关键的步骤,就是他进行了一个提问,也是从他的提问里面我才知道,如果要想让 ai 去访问我的邮箱,可能我需要提供一个东西叫授权码,然后我就研究了一下,把这个授权码我就发给他了。但大家也可以放心啊,这个授权码现在已经失效了,所以不用担心我的隐私或者信息会被泄露啊。 好在收到了我的授权码之后呢,他就开始工作了,呃,很快他就帮我把所有的邮件都整理出来了,一共有四封,同时放到了这个文件夹下面,然后我看了一下, 让我回过头来去 review 了一下,我发现呢,他其实是通过理解你的意图之后,编写了一段 python 脚本啊,你可以看到他在这边其实写了一段 python 脚本去执行整个任务啊,从读取我的邮箱到提取附件,然后再把这个附件下载下来,然后再保存到文件夹下面。 在他执行完任务之后呢,我又检查了一下,我发现有两个小问题,第一个就是他下载的这四封邮件里面,其中有一封他的日期呢,是二月份,不是一月份,所以说我可能需要让他在日期筛选这块再调整再精准一些。这是第一个问题,其实这个问题好解决一些。 第二个问题呢,就比较难,嗯,因为我仔细检查了一下,我一月份所有的发票大概有五份,其中有两份发票的邮件呢,它其实是没有任何附件的,它只有两个链接。那针对这种特殊情况,也就是,呃没有附件,只有链接的情况, ai 应该怎么去处理才比较合适呢? 相信有一些对 agent 呢比较熟悉的朋友,很快就能想到一个名词叫做 mcp, 那 mcp 你 可以理解为是让 agent 去操作外部的一些小的工具接口, 那在众多的 m c p 工具里面,有一类 m c p 工具叫做浏览器 m c p, 比如说,像啊翠 solo 模式下面,我之前配过的一个 m c p 叫做啊 chrome m c p, 它其实就能控制你的浏览器。欢迎,这我们刚才链接如果发给他,它是能够直接打开并且点击下载然后保存起来的。我给大家演示一下哈。 我现在重新开启了一个任务,呃,把刚才的发票邮件里面的这个链接呢直接粘贴过来了。然后我让 agent, 也就是翠 solo 帮我把呃这个 pdf 的 发票直接从这个链接里面提取出来。然后我们启动一下这个任务,大家可以一起看一下它会怎么样去执行类似的任务啊。 首先呢,它看到了这个发票的链接,然后,呃稍微梳理了一下,它需要去下载这个 pdf 发票,然后你可以看到它使用了这个 chrome mcp 来打开了这个页面。这个页面在哪呢?你可以看到在这儿,它自动地打开,并且自动地下载好了这个发票的 pdf。 换言之,回到我们一开始的这个任务,其实我们也可以让它呃使用 mcp 去处理这种特殊的链接形式的发票。 然后呢,我就给他发了第二段指令。这段指令呢,主要有两个要素,第一个,我让他检查一下月份,确保一下我们提取的一定是一月份的发票。第二个呢,是我告诉他有一些这个发票的邮件,虽然没有附件啊,但是提供了链接。你可以使用一些 m c p, 比如说啊, chrome 的 这个 m c p 去直接控制浏览器来下载对应的 pdf。 在 收到我的指令之后呢,它整体执行了三个步骤,第一步是先检查了月份,然后移除了二月份的发票。第二步是尝试去 写了一个脚本去提取发票的下载链接。第三件事情呢,其实就是通过 m c p 直接去下载这个链接当中的发票,然后最后他帮我把整个五条呃,发票都提取出来了,那到这其实还没结束,对吧?因为我们有了 pdf 之后,我们还希望他能够直接按照我们之前的 excel 的 格式帮我整理。 所以我又进一步地向他提了需求,我说,请你按照这个报销明细 excel 这样的格式呢,来收集整理这个发票的数据,报销人都是我自己,然后整理输出一份全新的 excel 表格。 在收到我的任务之后呢,他,其实啊,先去读取了这个 excel, 了解了格式之后呢,写了一段 python 的 脚本,去尝试从发票的 pdf 里面去提取日期明细,金额信息,提取完了之后,再创建一个全新的 excel 表格 啊。最后呢,这个一月份报销明细的 excel 表格就创建完了,然后在右侧其实也能看到啊,在这 整体的效果还是不错的。到这里我通过 tree 已经帮我把整个发票整理的全流程搞定了, a 卷呢,还是非常强的。但是各位有没有想过一个问题啊,假设到二月份到三月份到四月份,我又得重复的执行刚才的步骤吗? 我一直在想,我有没有什么办法能够把我刚才的整套流程做成一个标准化的工具?这样的话,下次 agent 再去收集整理我的二月份的发票的时候,它就不用再重复我刚才的流程了,不然我还得跟它反复的对话四五轮。 这里面就涉及到我们今天最重要最重要的概念,叫做 skill。 其实 skill 就是 做这样的事情,帮你把你的 sop 直接工具化。比如这里面我直接告诉翠,我说请你帮我梳理一下刚才的所有的流程和关键的动作,做成一套标准的 skill。 每个月当我需要整理发票的时候呢,你可以自动出发。同时我还考虑到火车票的 pdf 的 格式呢,跟一般的发票 pdf 的 格式不太一样,所以我让它适配一下火车票的这套 pdf。 在 收到我的任务之后呢,它其实调用了一个东西,叫做 skill creator。 这个东西很有意思啊, 放大给大家看一下,那 skill creator 呢?它其实是用来创建 skill 的 skill, 也就是说 skill 本身你是不需要自己手动去写,当然你要想手动调也 ok 啊。 大部分时候,我们都是通过 ai 调用这个 skill creator 来创建对应的 skill, 然后它大概执行了五分钟,创建完了完整的这套 skill。 这套 skill 呢,长这个样子,它里面包含了三个部分,分别是 skill 点 md、 啊 script 和 reference。 那 skill 点 md 是 一个非常重要的文件啊,啊 script 下面其实存放的是一些脚本,也就是代码,比如说用来处理邮箱发票下载的脚本和发票信息提取的脚本。其实这东西都是 ai 写的啊,而 reference 里面存放的是发票格式的参考文档。 那这样一套 skill 在 做完了之后,我应该怎么去使用呢?我给大家演示一下,我们还是打开一个全新的文件夹。 首先这个 skill 在 哪?在 tree 里面呢,右侧有一个设置的选项,点开之后呢,我们可以找到这里面的规则和技能。哎,技能,其实它英语就是 skill 嘛,我们点开这个技能,翻到最下面,你就能看到你的局部技能当中有一个东西叫 monthly invoice organizer。 其实这个就是我们刚才创建好的 每个月整理发票的 skill。 然后怎么去触发呢?我们在左侧呃,尝试给他一段新的指令,比如说帮我整理 二月份的发票。我们关注,当我这个指令发给 agent 之后呢,他是否会主动地调用这个对应的 skill? 首先他会分析问题,然后呢,呃,他开始查看这个 skill 的 详细说明。好,然后他开始调用这个对应的 skill。 这个 skill 的 第一步呢,其实是确认一些信息,比如说邮箱的地址啊,包括 m a p 的 授权码啊。当然,其实我们后续可以改进这个 skill, 把我的一些信息啊直接内置进去,这样的话他就不用再问我了。 好好,那我们再回到刚才创建 skill 的 这个对话里面,我们可以进一步的来观察一下,第一个就是这个使用方式,当我告诉他你帮我整理某个月的发票的时候,这个 skill 会自动出发,出发之后他会按照以下这些步骤去执行。第一步呢是确认信息,比如说啊,月份呐,邮箱啊,授授权码呀。 第二步呢是下载发票,它是通过什么样的方式下载的?通过脚本来下载的。第三步是处理链接啊,通过 m c p 来下载。第四步呢是验证一些日期。第五步呢是生成最终的报表,其实也是通过 python 的 脚本来实现的。如果你去仔细地观察这个 skill 的 整个流程的话,你会发现 其实它特别像是把我们在执行某个 sop 的 整个流程发给了这个 agent 啊,非常有意思。 好,那我带着大家再回到我们的 skill 本身,它其实包含了三块嘛,刚才讲了 script, 下面是一些脚本啊, reference 下面是一些参考的文档。其实最关键的是,第一个叫 skill md, 我 们在右侧打开这个 skill md, skill md。 这个文件呢,你整体可以分成两个部分去阅读。第一部分呢是最前面会告诉这个 skill 的 它的名字以及 description, 也就是这个发票是用来干嘛的,在什么情况下触发这个很重要,然后从此处往下,其实都是在描述整个工作流程。 我随便举个例子啊,比如说这里面的。第一步,收集必要的信息,然后第二步下载发票。这个邮件的附件你可以注意到它在 skill 点 m d 里面写得很清楚。第二步需要执行这个 python 的 脚本,包括针对链接的情况,也指定了我要使用这个 m c p 去打开链接,下载 pdf, 相当于是我的 skill 点 m d, 是 一张非常详细的说明地图,我简单做个分析啊,其实 skill 你 可以看到它由好几个部分组成,比如说像 skill 点 m d, 它其实就是一个执行步骤的说明书, 告诉这个 agent 在 执行这个任务的时候,它的步骤有哪些,每一步要用到什么样工具。那假设它需要用到代码, ok, 在 skill 里面其实也有指定的代码区,然后包括用到的工具啊,你可以指定我在中间的某一步骤使用什么样的 m c p, 包括你可能需要有一些参考文档,它都是打包一起放到这个 skill 了。 所以本质上,其实 skill 是 在帮你把你执行任务的 sop 印刷给了 agent。 而且不光是 sop, 还把这个 sop 当中所涉及到的需要的一些必要的工具也都准备好了,一起交给 agent。 这样的话, agent 呢,在做这样的任务的时候就会非常的轻松了。下面我来介绍一下 skill 的 两个重要的特性。 第一个呢,叫做渐近式,譬如听起来好像很专业啊,其实也很好理解,刚才我们做的这个发票的 skill 里面,既有 skill 点 m d, 也有 reference, 也有 script, 其实很多,对吧?那这样一个 skill 大 小肯定还不小,可能有个几千甚至上万个字符。 如果把这样的一个 skill 直接丢给 ai, 它会占用它的上下文空间,至少占用一部分。那如果你此时有十几个,二十个,一百个 skill 啊,这么多的 skill 如果都交给 agent 去读取的话,可能就没有额外的空间去执行你的任务了, 那怎么办呢?所以 skill 它设计了一套机制,叫做渐进式批录。就一开始的时候, agent 去加载这些 skill, 其实它只加载一个部分, 叫做 skill 的 描述。对,如果你还能记得我们前面几分钟讲过的 skill 的 m d, 最开始有一个部分分别介绍了 skill 的 名字和 description, 这个东西就是 skill 的 描述。好,那假设它加载了这十几个 skill 的 描述之后呢,它会根据当前的这个任务去分析哪一个 skill 是 最匹配的。 例如,假设它的任务就是用来处理发票的话,它会首先识别到我们的发票,处理的 skill 是 最匹配的。接着它会进行第二次读取。第二次读取呢,其实读取的就是 skill 点 m d 的 正文,也就是它的整个执行的步骤。 好,那假设执行到第二步,需要去使用某个脚本去获取邮箱里面的邮件的时候呢,它又会再去读取对应的代码或者是参考文档。 所以你可以看到啊, scale 虽然很大,但它并不是一次性丢给 ai 的, 它是按需加载,一层一层往下,这个就叫什么渐进式批录。哎,这个反过来去理解,其实很好理解的。 第二点呢,叫做可复用。可复用是什么意思呢?其实你会发现啊, skill 跟 agent 之间是截有关系的,就是在 skill 里面其实没有任何一个强约束告诉你,这个 skill 一定只能被某一个 agent 去使用啊。所以你在 tree 里面做的 skill, 在 cloud code 里面也可以去用,在 code 编程里面也可以去用,反过来也是一样的, 那 skill 本质上是在约束某一个任务下, agent 到底应该怎么做,以及需要哪些必要的素材。其实 skill 都给它准备好了, 所以有这么一套 skill, 任何 agent 呢,都可以很好地完成任务。举个例子啊,比如说,我们公司假设来了一个新人,然后呢,我决定把我的每个月的发票整理的工作交给他了。其实我不用再教他怎么样去梳理我整个发票,我只需要把这个 skill 文件发给他, 他去加载到他的 a 智能里面,然后就可以执行我的任务。所以他的可封信是很强的。你也可以想一想你的部门,你的组织内部其实有很多人,他的工作流程是有一些重合的。那么重合的这一部分 sop 如果能做成 skill, 那 大家是不是都可以共用一套 skill 呢?反而还能约束大家的这个产出,保持更好的一致性。 那为了开拓大家的视野呢?我再举一个额外的例子啊,那假设你是个 hr, 你 每天需要去筛选简历,现在呢,你面前一共有一个初筛的标准, 在经过出差标准之后呢,你筛选了其中的三个,分别是简历二三四,紧接着你还有自己的一套复筛的打分标准。 通过这套标准,你可以给每个简历打上分,输出一份简历的评估报告。同时每个简历呢,有一定的分数,你选举了分数最高的前两个简历。哎,你可以看到整套流程是非常固定的,他的输入输出也是非常清晰的, 那这样的 sop 就 非常值得做成 skill, 虽然我们没有实力的去做这个 skill, 你 也能猜出来这个 skill 做完了之后,它的结构大概是什么样子的。它应该有两个重要的部分,第一个呢,肯定是 skill md, 这这是任何一个 skill 都必须有的部分。第二个呢,其实就是 reference, 也就是参考文档。那参考文档里面一定会有两个东西,一个叫初筛的筛选标准,一个是复筛的打分标准。当然这套 skill 也不太可能是你自己手写的, 大概率你是通过 agent 去调用 skill creator 这个原 skill 去创建这个简历分析的 skill。 那 讲到这里呢,我相信你也能发现,其实在二零二六年的这个时间节点,如果你想去用 ai 去提效,你一定离不开一个东西叫做 skill。 因为在 skill 出来以前,人是重复执行某个 sop 的 执行者, 那即使你的 sop 当中有某一些节点啊,可以点对点的用 ai 提效,但是人还是执行者,那在有了 skill 之后呢?其实人往往只需要执行前面几次的 sop, 执行完了之后,他发现,第一这套 sop 流程固定,第二他可能会重复运行,这时候你就可以尝试把这个 sop 转化成 skill, 同时不断地打磨这套 skill, 接着以后类似的去调用指定的 skill 完成。 那你其实可以想一想,你的日常工作里面可能不止一个 sop, 你 可能有十个 sop, 那 你可以做出来十个 skill, 每个 skill 处理特定的任务,然后由 agent 去动态地调用这些 skill, 帮你完成你的工作,你的效率提升可能就不止十倍了。 以上是这期视频的全部内容,视频很长,也很干。如果你能看到这里,我相信你对 skill 的 理解应该上了一个台阶。接下来你可以尝试去分析你自己的日常工作和 sop, 尝试把它们做成 skill, 就 像我这样,拜拜。


最近随着 openclaw 爆火,你是不是也经常听到有人张口就是 skills? 好 像有了 skills 就 无所不能。如果你以为 skills 是 一种一键自动化的魔法按钮,那就误会了,其实它只是把一件事情的流程提前写好,然后交给 ai 按步骤执行。为什么有时候用了 skill 反而更慢? 因为每次调用的时候,系统都要带上一份说明书,包括流程模板、输入规则、权限说明等等,这些都会占用更多的百分之七十,响应时间也会变慢一点。 听起来是不是有点不划算?但别急,它换来的东西其实很重要,稳定可附用多人协助。换句话说, skill 不是 魔法按钮,而是一种带规则的 ai 功能模块。那它到底是什么?什么时候才值得用? 先纠正一个常见误解, skill 不是 让 ai 变得更聪明,而是让 ai 做事更稳定、更可控,所以你会感觉它更慢、更贵。因为系统每次都要带上流程模板、输入规则和权限说明,但换来的好处是输出更稳定,过程更可追溯。 举个例子,如果每天都要做品牌逾期总结、抓帖子、去重分类、写报告、存数据库,这就是一个固定流程 输入,可以标准化关键词、时间范围平台,而且还要调用爬虫和数据库,这种场景就很适合做 skill。 相反,如果只是临时想几个广告文案,用 prop 就 够了。记住两个关键问题,流程能不能固定?有没有工具或权限?很多场景其实问到这里就已经有答案了, skill 的 重点不是更聪明,而是更有秩序。可以把它理解为三块拼在一起,第一块是流程, ai 做事情的步骤提前写好。 第二块是权限, ai 只能用指定的工具和数据。第三块是附用,这个流程可以让团队反复使用。举个例子,做余情摘要,模板里写死五个步骤,抓取、清理噪声、分类、总结。写入数据库 参数,只留下关键词和时间范围。权限只允许访问指定网站和一个数据库,写入接口,这样即使换一个人接手,也能照样跑。 skill 真正的价值就在这里。流程稳定,权限清晰,结果可复现。 skill 更像一条有规则的生产线,而不是简单的一问一答。第一步是模板,把事情的流程写好。第二步是参数规则,检查输入格式是否正确。第三步是权限, ai 只能使用白名单里的工具和数据,通过之后才会真正执行任务,整个过程都会留下日记, 为什么会更慢?因为每次调用都要带上这些规则说明。举个简单的想象,如果输入只有二百个字,但流程说明就有几百 token, 这样虽然更贵,但换来的好处是流程稳定,可以复用,还能审计。 想象一个团队每天都要写余情总结,如果只是用 prop, 不 同的人写出来的结构可能完全不一样,有人写三段,有人写五段等。领导问这个结论依据是什么,可能也找不到当时的数据来源。 如果换成 skill 模板,会把结构写死,比如固定四段报告,输入只有关键词和时间范围,所有调用的工具和数据都会记录到日记里。 skill 最大的差别不是更聪明,而是写作更容易,结果更一致。 很多人只看每次调用是不是更贵,但忽略了另一个成本。返工时间。比如三个人每天要做二十份余情报告,如果用 prompt, 很多报告要改来改去。如果用 skill, 每次可能多花一点 token, 但结果更稳定,返工会大幅减少。 skill 真正解决的不是模型能力,而是流程稳定。 可以把 skill 想象成一个带护栏的叉槽, ai 只能在规定范围里工作,它不是一段随便写的提示词,而是一个可以被版本管理记录日期的功能模块。什么时候值得做 skill? 当事情可以标准化,需要多人协助,需要权限控制的时候,否则直接用 prompt 更轻。 如果要真的做一个 skill, 最好先把目标写清楚,否则很容易变成边做边改。以 cloud 为例,我会先写一个系统模板,把流程固定下来,抓取去,造句类总结,写入数据库,然后定义输入参数,比如关键词、序组、时间、范围、渠道和语言。 接着绑定工具,比如 http, 抓取接口、向量检测、情感分析函数,以及数据库写入 api。 同时还要写清楚一些规则,例如超时八秒,失败,重试一次,敏感信息过滤,记录完整日制。最后给这个 skill 一个目标,比如十秒内完成 token 不 超过一千五百, 反功率低于百分之五。简单说就是三件事,流程写清楚,输入写规范,全线设边界。创建 skill 通常可以分三步,第一步是写模板,也就是把整个流程和输出结构固定下来。第二步是写输入规则,也就是 jason schemer, 它的作用就像表单校验,输入不符合规则, skill 直接拒绝执行。第三步是权限配置,只允许访问指定网站、指定工具、指定数据库表,这样可以避免 ai 随意访问数据。一个实用的小经验是,模板里只放固定不变的内容,所有变量都放到 schema 里。 权限一定要最小化,只开必要的工具。把这三件事情做好, skill 的 稳定性就已经有很大保障。 skill 创建好之后,真正重要的是测试调用方式,通常是在对话里 skill, 然后填入参数, 系统会先检查参数格式,如果不符合 schema 就 直接拒绝。如果参数没问题,还会检查权限,比如是否访问了不允许的工具,如果这些都通过 skill, 才会真正执行任务,整个过程都会留下日记。 测试的时候,建议重点关注三件事,参数是否经常被拒绝,有没有越权访问、 token 和延迟是否稳定。很多人以为问题出在模型,其实大多数问题来自输入和权限配置。 skill 也不是没有风险。最常见的问题有五类,成本、延迟、幻觉、越权和依赖变化。比如 token 成本过高可能是模板太长。延迟过高可能是工具调用太多幻觉通常是因为没有证据来源。越权则是权限配置太宽。 很多团队遇到问题时会怪模型,但复盘之后发现大部分问题其实来自工程配置。解决办法也很简单,设置清晰的规则和日制,这样问题出现时就能快速定位。 最后一个建议不要一开始就做很多 skill, 先挑一个最明确的场景,比如余情摘要,写好模板和参数规则,权限只开最必要的部分,然后设定目标。比如延迟不超过十秒, token 不 超过一千五百,反功率低于百分之五。先小规模测试,如果稳定,再逐渐扩大使用范围。 skill 真正的价值不在于炫技,而在于长期积累。当一个团队拥有很多稳定可附用的 skill, 其实就相当于拥有了一套 ai 能力库。

最近爆火的 agent skills, 一个多月时间数量从三万充到了二十七万,翻了将近十倍。有做产品动画的 skill, 有 可以整理文档做 ppt 的 skill, 还有可以设计网页的 skill。 那 今天我们就来搞清楚什么是 skill, 有 哪些好用的 skill, 怎么找和安装 skill, 以及怎么创建自己的 skill。 每个 skill 就是 这样的一个文件夹。以这个周报 skill 为例, skill 点 md 是 核心文件。很多人会问,这跟平时的提示词有什么区别? 其实 skill 本质上也是提示词,但它真正的威力在于特殊的加载机制。这个机制分为三层,第一层是 skill 点 md 里顶部的 name 和 description, 它们叫做原数据, 如这里就记录着这个技能,是用来写周报的,下面的这些信息叫做指令,记录着写周报的流程。第三层是文件夹里其他的文件,叫做资源与代码, 比如这里的周报模板和制作表格的代码脚本。我们可以把一个 skill 理解成给 cloud 招了一个员工, 数据就是员工的名片,记录着员工的名字和能力,他们会长住在系统中, cloud 每一次接到任务会先扫描一遍所有员工的名片,匹配上了才叫那个员工来,员工来了才会按照工作手册,也就是指令去干活, 干到某一步需要什么才去取对应的资料或者工具。这个过程在技术上就叫做渐进式。譬如这样一来,就算你装了几十上百个 skill, 也只有在用到的时候才会加载,不仅极大节省了 token, 也保证了 ai 在 能力变强的同时不会被稀释掉注意力。 首先是 cloud 官方推出的办公四件套,可以让 ai 帮我们处理 word、 ppt 表格和 pdf。 比如我最近看到了一篇关于 web coding 的 深度长文,我就让 ai 帮我进行要点提炼,方便沉淀,形成自己的知识库, 还能快速生成 ppt, 整体结构非常清晰完整。第二个,动画视频生成 remote, 原本是程序员才能驾驭的动画工具,有了这个 remote skill, 你 只需要告诉 ai 每一段想要呈现什么画面,剩下的交给 ai。 海外已经有网友用它做出了这样的产品视频, 我自己也用这个 skill 做了两段,一句话特效,整体效果还是很不错的。第三个,网页设计。这个 skill 可以 避免 ai 的 通用美学, 做出一些风格化的页面设计,这是我没用 skill 生成的个人薄客网页,非常朴素,这是我用了 skill 之后设计出来的网页,大胆撞色,页面瞬间生动起来, 装上这个,让你的 ai 瞬间升级为设计师。第四个,头脑风暴。每当你有一个模糊的想法需要落地,这个 skill 就 派上用场了。它会使用苏格拉底式提问,帮你一步一步把想法具体化,最终形成一个方案。比如我想开发一个记账 app, 它就会一步一步的追问细节, 核心功能是什么, ui 风格是什么样的,形成设计文档之后才会进行开发。来看看效果,可以记下自己的支出,也可以记录收入、账本统计设置,该有的功能都有了。 说了这么多,那我们怎么自己找技能和安装技能呢?我给大家推荐两个网站, skills m p 和 skill s h。 skill m p 里输入了大量的 skill, 可以 按名称解锁 skill, 也可以按分类去浏览 skill six 点 s h 更适合看最近的热点 skill, 它有一个下载量的排行榜,也可以实时看到最近二十四小时内爆火的 skill, 随时都能尝鲜。那么问题就来了,这么多的 skill, 每次用的时候去找也太麻烦了。不用担心, find skills 就是 为此而生的。我们把这个网址给 ai, 让他大局安装 find skills, 安装好之后告诉他你想要什么样的 skill, 这个 skill 就 会自动在 skills 点 s h 上帮你寻找。比如我想找一个制作小红书封面的 skill, 可以 看到它会自动调用 find skill 这个技能去帮我们寻找。技能找到之后,我们就直接让 ai 安装就好。 它还有一个安全评级,可以帮你对 skill 做一个风险的初步判断。有时候我们可能需要把自己的工作流程做成 skill, 那 ansore pick 官方的原技能,也就是创建技能的技能就派上用场了。 skill creator 可以 帮助你按照 skill 规范生成 skill。 比如我想创建一个写周报的 skill, 它就会自动调取这个 skill creator, ai 会对我们进行一步步的引导,如这里它会提问使用场景、输出方式、 输出风格。比如这里我们就可以说包装一下语言,显得工作量多一些。这里他还会向我们提问需要包含哪些模块,那最后他就帮我们生成了一个周报 skill。 ok, 我 们来测试一下。 怎么说呢,这字还是很多的,本期就到此结束了,如果对你有帮助的话,记得点赞、收藏加关注。

ai skill 设计实战四步,写出高效能 agent 插件,你是不是也困惑, ai agent 用起来还是笨?问题的本质是你没搞懂 skill 结构, ai 中的 skill 就是 给大模型安装的专业工具包,但百分之九十的人写 skill 只写一句话,调用成功率不到百分之三十。 第一招, skill 结构要完整,包含五个要素,场景描述、目标定义、触发条件、调用案例、输出格式。 场景,让 ai 知道什么时候用目标,让 ai 知道要完成什么。触发条件,设定关键词调用案例,给 ai 示范输出格式,规定返回结构。第二招,场景描述要具体, 不要写处理邮件,要写收到客户投诉邮件,情绪负面需要安抚并记录问题,加上用户画像情绪状态,调用准确率提升三倍。第三招,触发条件要设计 设置关键词组合,比如查一下,分析一下生成报告,还要设计上下文触发,比如上一句提到数据,下一句说格式化,就调用图标 skill。 第四招,调用案例要丰富,给 ai 看三到五个真实对话,视例覆盖正常请求边界情况错误处理,案例越多,执行越稳定。写好 skill 的 本质是结构化思维,把模糊需求翻译成 ai 能理解的精确指令,今晚就试试 选一个重复最多的工作环节,按五个要素写一个 skill 场景,五十字目标,一句话触发条件,三个关键词调用案例、两个输出格式,用 mark 等。关注我,获取更多 ai skill 设计实战方法,收藏起来,随时找到写好 skill 的 进阶技巧!