the skill 点 md pattern 如何编辑真正有效的 ai 代理技能?这篇文章由 beback pod 拷写,介绍了编辑 a 阵的 skill 的 最佳实践。如果你的技能没有触发,问题几乎从来不是指令本身,而是描述。这是大多数人经过一小时的挫折后才意识到的。 你编写了一个 skill 点 md, 放在正确的文件夹中,让代理使用它,结果什么也没发生。你重写了指令,仍然没有反应。 问题从来不是你在技能中写了什么,而是代理用来决定是否激活它的顶部两行内容。技能不是插件,也不是连接到 api 的 脚本。把它想象成为新团队成员。编辑入职指南, 你不用在每次对话中重新解释工作流程和偏好,而是将它们打包一次。当你的请求匹配时,代理会自动获取它们。唯一必须的文件是 skill 点 m d, 其他都是可选的。 skill 点 md 格式是 antropic 在 二零二五年十二月发布的开放标准,适用于 cloud code, open ai codex 和 open cloud。 在 编辑任何内容之前,你需要知道把它绑定哪里。每个平台从特定位置加载技能位置定义了范围。 cloud code 使用用户目录下的点 cloud 斜杠 skills 作为个人技能。点 cloud 斜杠 skills 作为项目级技能, open ai codex 使用类似的路径。 openclaw 使用用户目录下的点 openclaw 斜杠 skills 作为全局技能。当一个技能与另一个同名时,项目级技能会覆盖个人技能,这是大多数人跳过的部分。它解释了几乎所有的技能问题。技能使用渐进式批录三级加载系统, 第一级是原数据始终加载,每个技能约一百个 token, 代理只读取 yaml 前置内容中的名称和描述。第二级是指令触发时加载少于五千个 token, 代理读 skill 点 m d 的 完整内容。第三级是引用文件和脚本按需加载,实际上是无限的,这就是技能可扩展的原因,空闲时的透坑成本为零。最常见的错误是描述字段不是给人类看的,它是代理在决定是否激活你的技能时使用的触发条件。 糟糕的描述只说帮助处理文档。同样糟糕的是指描述了什么,以及何时使用,包含具体的触发短语。 有效的结构是既能做什么,加上何时使用它,以及具体的触发短语。让我们从简单到复杂构建四个技能。 readme writer 是 基础文件输出, get commit writer 展示多个触发短语, code reviewer 展示多文件结构, linear sprint planner 展示 mcp 集成 从 get 和 commit writer 开始。需要文件输出时使用 readme writer 模式。技能太长时像 code review 那 样拆分,需要外部工具协调时使用 linear spring planner 模式。技能一, readme writer 关键模式是收集上下文, 编辑保存到磁盘。第一步,收集项目上下文检查 package jill 或 pie project tom 查找 a n v 视力检查 s e a s e a 文件。第二步,使用标准结构编辑 readme 特性先决条件安装使用许可证。第三步,写入磁盘。 第四步,质量检查没有占位符文本命令准确。技能二, get commit message generator 关键模式是覆盖用户可能提出的不同方式的多个触发短语, 包含这些触发短语,编辑提交消息,帮我提交,总结,我的更改,我的提交应该说什么?起草提交。输出格式使用 conventional commis 规范类型,括号范围,冒号。简短描述类型包括 fit, fix, doc, refractor 等。技能三, code reviewer 展示多文件结构,关键模式是将内容拆分到多个文件中。 skill 点 md 保持约四十行,包含主流程。详细审查标准放在 reference 斜杠 criteria md 中,只有在实际审查时才加载。 输出结构包括摘药,堵塞问题,建议和积极评价。引用文件包括安全性、正确性、可读性、性能和测试的审查标准。技能四, linear sprint planner 展示 m c p 增强模式, 关键模式是技能加 m c p 服务器等于强大的自动化。在前置内容中声明 m c p server lina 流程包括从 lina 获取当前周期和代办事项,分析团队容量,优先处理代办事项,提交计划,供用户批准创建周期并分配问题。 一句话就能触发整个工作流程。 allow tools 自断限制技能,激活时代可以调用的工具,这对于止读技能很有用,防止代理意外写入或执行任何内容。例如日制分析器技能只允许 read grab club 工具。 激活此功能后,代理无法执行 shell 命令写入文件或进行外部调用。这是为观察技能添加安全保证的简单方法。当技能没有触发时的调试步骤,第一,检查你的描述,添加更多具体的触发短语。 第二,检查文件路径,确保 skill 点 md 在 正确的位置。第三,检查 yaml 语法前置内容必须从第一行的三个短化线开始。第四,重启绘画技能,在绘画开始时快照。 第五,使用显示调用测试,如果显示调用有效,但自动触发无效,说明描述需要改进。安全注意事项,技能可以捆绑可执行代码,这种力量使它们变得危险。 实用规则,永远不要安装要求你粘贴密钥的技能。安装前始终阅读 scripts 文件夹。对进行出站网络调用的技能持怀疑态度, 优先使用来自官方来源的技能,如 entropix, open ai 或你的团队。 clawhub 有 virus total 集成,可在安装前检查技能。关键要点总结,第一,描述等于触发条件,不是解释。第二,三级加载原数据质量引用。第三,从简单开始, 逐步增加复杂性。第四,将大型技能拆分为 skill 点 md 加 reference 文件夹。第五, skill 点 md 是 一个开放标准,可跨平台移植资源链接 agent skills 规范在 agent skills 点趟按抽象技能仓库在 github 点 com 斜杠按抽象斜杠 skills open ai 技能仓库在 github 点 com 斜杠 open ai 斜杠 skills 原文链接在 baggy podd 的 page 播课,感谢观看。
粉丝2.0万获赞12.9万

我们去哪儿装 skill 呢? cloud hub, 点儿 ai, 这个就是我们全球所有的这个玩儿这个龙虾的人,他们已经在这儿上传了好多 skill, 对 吧?你在这儿可以搜索,对不对?你可以搜索 skill, 比方说我们是学术人的话,我们可以搜这个 research, 对 吧? 哎,他默认的话是按照从高到低排序,比方说这个地方有一个 deep research pro, 我 们可以点开看一下,我们点开就可以看到这个人的整个的人家的 skill 点 md 长得什么样?你现在如果看不懂的话,可以把人家的这个 skill 点 md 怎么样啊?整个复制下来, 对吧?整个复制下来你就可以直接比方说我们可以直接翻译成,我们翻译成经典中文,看看他在讲啥。 这个即便是你自己目前不用龙虾,你是不是也可以把这个 skill 拿到你的大模型对话当中去学习提示词,对吧?比方说这是深度研究专业版,然后呢,工作原理是什么? 当用户对任何主题进行研究时,遵循以下工作流理解目标,问你两个简短的澄清问题。第二步呢,规划研究,搜索前清思考。然后呢,步骤三,执行多源搜索,对吧?针对每个子问题,运行脚本等等。 你其实看人家的这个 skill 过程,你就可以看看这到底是不是你需要的,对不对?如果是你需要的,你就可以去安装它。

如果你是技术小白,千万不要划走,看完这个视频,你将能够任意创作专属 skill, 甚至还可以变现。上个视频给大家详细介绍了 agent skill, 今天带大家用扣子创建自己的专属 skill, 目前有三种创建方法。第一个方法,先创建技能,再叠带优化。我们进入扣子平台的技能商店,点击右上角的创建技能,进入扣子编程平台,这里可以直接输入需求, 比如说创建一个生成 ai 话题播客的技能,然后扣子会创建一个虚拟环境,然后独立完成这个任务,咱们只需要耐心等待就可以。生成好之后我们来进行迭代优化,可以通过对话让扣子自动修改,也可以直接修改 skill 包中的内容。 修改好之后我们预览看一下效果,欢迎收听 pos ai 拨克。 hello, 大家好!哎,你最近有没有刷到腾讯新出的那个元宝派啊?我前几天看到好多人在讨论,感觉这玩意有点意思,今天咱们就来唠唠。哎对,我也刷到了, 怎么样?这个效果相当不错吧,和真人拨克几乎没有太大区别。创建好技能之后一定要部署,这样我们后面才可以继续调用。 第二个方法是直接在扣子的对话当中让他完成任务并进行优化,最后直接让他打包成一个技能。但是我个人更推荐第一个方法,因为打包成技能之后通常还需要再调整,所以不如直接先创建技能,然后再一起来进行迭代进行优化。 第三个方法是直接上传 skill 包,也许你已经在 github 或者说各种社群里收集了一大堆 skill 包,那你可以直接上传并使用。如果你想把技能公开分享,那可以上架到技能商店,找到刚刚创建的技能,点击上架到商店。 这里需要注意的是,需要在扣子平台,而不是扣子编程平台,然后填写各种信息,上传案例,甚至可以设置付费,然后就可以上传到机能商店了。是不是创建一个 skill 非常简单?那赶快去创建吧,让 ai 来替你完成工作。最后,如果你有一点收获,欢迎点赞、关注、转发。如果有疑问,欢迎在评论区大家一起讨论。

上个视频介绍了 open class 最核心的整体设计能力是四六点 m d, 那 四六点 m d 其实它是一个 markdown 格式的一个文件核心就包括四维度的一个内容的书写,包括 skill 的 一个定义,描述出餐和入餐,因为它其实你可理解为人的一个技能, 比如说我的技能是数据分析啊,写报告啊,画画等,那我比如说数据分析和写报告,我可以再封装为一个大的技能, 如果进行数据分析之后,均数分析结果生成对应的报告,那当然每一项他又可以作为独立的个子技能, 那我刚才说涉及到技能就是这些,那我们都可以用 skill 去实现 skill 点 md 文件的四大要素格式来写。 首先名称和描述,其实名称这个定义就好了,描述这个是我们要重点去介绍的,我们要介绍我们的这个智能体,他能做什么?不能做什么?他的边界在哪?比如说哪些问题他是可以回答,哪些拒绝回答的,比如说超出他的范围的。 本来说我是想设一个数据爬虫和分析报告的一个知识点,但是你突然问了我一个医疗上的问题,或者是其他方面的问题,就是拒绝回答的。以前我们可以通过提示词去写,那现在可以存储到对应的知识中,让 skill 去直接调用对应的知识库 去作为约束条件。实际的工程化业务中去应用的时候,它核心就是我定义出来一个技能的时候,你要去调些工具去辅助,比如说我要减肥,这个生成对应的解决方案, 我就要知道这个人的身高、体重、年龄、性别这些基本要素,不同的性别、年龄,它对应的 bmi 值是标准值是不同的,而这些标准值我们可以用知识库去让 skill 去调取,所以 skill 它想实现这个结果, 它是具备调用工具库的能力的。而这个兔你可以认为是某个知识库,比如刚才说的 bmi 的 一个标准文件, 也可以是数据库数据集,比如说我刚才我说到的我的基本信息,身高、体重、年龄这些基本信息,以及我要使用一些 a p i 或者 m c p, 它都可以调用。六、实现完整技能,我们需要产品经理给定出来的,所以使用这个东西我们基于它的四要素的模板来设计, 而每部设计中我要的什么技能,需要的什么工具是要定义出来的。如说是一个复杂的业务逻辑,它是否需要这个技能,根据用户的意图来去匹配最适合匹配的一个 skill 是 什么?来最后给用户回答这样的问题, md 文件怎么去写的?写了这个文件,那我们再做成设计中点型,又写的是这个文件,那当然可能我们上了这些手搓点 skill 的 md 文件,就是我们业务来我们的业务逻辑之后, 人产品经理人工手搓六点 m 文件可能有难度的时候呢?那我们完全是把这些的各种约束条件,它的一个思路,出餐、入餐可以写成对应的需求文档,把这个需求文档直接扔给 大模型,让大模型生成对应的 s 六点 m d 文件之后我们拿过来再改,然后把改好的改好的去应用就可以了,就这个思路会更简单一些。 那其实这么看来,能够基于欧欧根克拉的这种模式的 nba 设计,整个逻辑思路就通了。那么刚才讲到 skill 它可以调用 a p i, 又可以调用 mvp, 那 skill 本身它又可以封装成 mcp, 而这个逻辑怎么去理解呢?我们下个视频。

如果你的 android skill 安装了,但是发现并不好用,比如说总是不触发,大概率是 description 没有写对。今天分享六个呢, skill 创建的技巧,全部是从 ospec 官方仓库里面扒出来的实战经验。第一个 skill md, 要有黄金结构。很多人写 skill md 呢,就是一坨文字糊上去, cloud 其实根本看不懂。 正确的写法是分块, purpose, when to use process, decision, logic, output。 每一块呢,都用标题和列表写清楚。 cloud 呢,一看就知道该怎么执行。 第二点啊, description 的 写法是否正确,直接决定了处罚率,这是最容易踩的坑啊。你写帮助用户处理 excel, 这太模糊了, ai 不知道什么时候该调用你,你得写清楚两个关键信息,第一个呢,叫做能做什么?第二个呢,是什么场景来调用?比如正确的写法呢?是这样的 好,你看前半句,列出了四个具体能力,提取数据,执行透视表,生成图表。后半句呢,写明了处罚的场景,分析表格数据或者自动化工作流,具体化,以 才能被精准触发。而且第二个信息点更关键,因为很多人会写干什么,但是常常忘记写什么时候来触发这个 script。 第三啊,重复的活呢,封装成 scripts。 比如说你经常要抓取网页内容,每次呢,让 ai 现写代码又慢又不稳定,直接写一个脚本呢,扔进 scripts 文件夹,然后在 s q m d 里面呢,告诉 ai 调用脚本就行。注意啊, scripts 文件夹里面的内容再多都是不加载到上下文里面的,而只是执行,因此 intoken。 而且由于是代码逻辑呢,是前后一致的,完全是稳定的。第四个, reference 文件夹要按需加载, qmd 里面超过了多少字就要拆分呢?从时间来看呢,最多不要超过五千字啊,如果超过就 把详细文档呢放进 reference 文件夹里面,在 qmd 里面写上需要时读取某某文件,这样 ai 不 会一次性的塞满上下文,只会在用到它的时候呢才加载。第五个, 直接抄官方的优秀案例, ospeak 官方的 skills 仓库呢,有六万多的 star, 里面的 m c, p, builder, web app, testing, internal, commerce 这些呢,都是生产级的 结构,怎么组织,指令怎么写,资源怎么分配,全部呢,都是现成答案,抄完改成你的领域就行。第六个,打包分享出去, skill 则遵循开放的标准,一个 skill m d 呢,加上 scripts, reference, assets 三个文件夹,打包呢就能给别人用。你做的 skill 呢,越专业,附用的价值呢就越高,对你带来的影响力呢也就 越大。总结一下, description 决定了触不触发,触发率是多少, skill m t 的 结构呢,决定了执行的质量, scripts 和 reference 呢,决定了效率的上限。 ok, 这一期呢,讲到这儿,觉得不错的点个赞,后续呢,还会拆解更多的 skill 的 实战的玩法。

最近爆火的 agent skills, 一个多月时间数量从三万充到了二十七万,翻了将近十倍。有做产品动画的 skill, 有 可以整理文档做 ppt 的 skill, 还有可以设计网页的 skill。 那 今天我们就来搞清楚什么是 skill, 有 哪些好用的 skill, 怎么找和安装 skill, 以及怎么创建自己的 skill。 每个 skill 就是 这样的一个文件夹。以这个周报 skill 为例, skill 点 md 是 核心文件。很多人会问,这跟平时的提示词有什么区别? 其实 skill 本质上也是提示词,但它真正的威力在于特殊的加载机制。这个机制分为三层,第一层是 skill 点 md 里顶部的 name 和 description, 它们叫做原数据, 如这里就记录着这个技能,是用来写周报的,下面的这些信息叫做指令,记录着写周报的流程。第三层是文件夹里其他的文件,叫做资源与代码, 比如这里的周报模板和制作表格的代码脚本。我们可以把一个 skill 理解成给 cloud 招了一个员工, 数据就是员工的名片,记录着员工的名字和能力,他们会长住在系统中, cloud 每一次接到任务会先扫描一遍所有员工的名片,匹配上了才叫那个员工来,员工来了才会按照工作手册,也就是指令去干活, 干到某一步需要什么才去取对应的资料或者工具。这个过程在技术上就叫做渐进式。譬如这样一来,就算你装了几十上百个 skill, 也只有在用到的时候才会加载,不仅极大节省了 token, 也保证了 ai 在 能力变强的同时不会被稀释掉注意力。 首先是 cloud 官方推出的办公四件套,可以让 ai 帮我们处理 word、 ppt 表格和 pdf。 比如我最近看到了一篇关于 web coding 的 深度长文,我就让 ai 帮我进行要点提炼,方便沉淀,形成自己的知识库, 还能快速生成 ppt, 整体结构非常清晰完整。第二个,动画视频生成 remote, 原本是程序员才能驾驭的动画工具,有了这个 remote skill, 你 只需要告诉 ai 每一段想要呈现什么画面,剩下的交给 ai。 海外已经有网友用它做出了这样的产品视频, 我自己也用这个 skill 做了两段,一句话特效,整体效果还是很不错的。第三个,网页设计。这个 skill 可以 避免 ai 的 通用美学, 做出一些风格化的页面设计,这是我没用 skill 生成的个人薄客网页,非常朴素,这是我用了 skill 之后设计出来的网页,大胆撞色,页面瞬间生动起来, 装上这个,让你的 ai 瞬间升级为设计师。第四个,头脑风暴。每当你有一个模糊的想法需要落地,这个 skill 就 派上用场了。它会使用苏格拉底式提问,帮你一步一步把想法具体化,最终形成一个方案。比如我想开发一个记账 app, 它就会一步一步的追问细节, 核心功能是什么, ui 风格是什么样的,形成设计文档之后才会进行开发。来看看效果,可以记下自己的支出,也可以记录收入、账本统计设置,该有的功能都有了。 说了这么多,那我们怎么自己找技能和安装技能呢?我给大家推荐两个网站, skills m p 和 skill s h。 skill m p 里输入了大量的 skill, 可以 按名称解锁 skill, 也可以按分类去浏览 skill six 点 s h 更适合看最近的热点 skill, 它有一个下载量的排行榜,也可以实时看到最近二十四小时内爆火的 skill, 随时都能尝鲜。那么问题就来了,这么多的 skill, 每次用的时候去找也太麻烦了。不用担心, find skills 就是 为此而生的。我们把这个网址给 ai, 让他大局安装 find skills, 安装好之后告诉他你想要什么样的 skill, 这个 skill 就 会自动在 skills 点 s h 上帮你寻找。比如我想找一个制作小红书封面的 skill, 可以 看到它会自动调用 find skill 这个技能去帮我们寻找。技能找到之后,我们就直接让 ai 安装就好。 它还有一个安全评级,可以帮你对 skill 做一个风险的初步判断。有时候我们可能需要把自己的工作流程做成 skill, 那 ansore pick 官方的原技能,也就是创建技能的技能就派上用场了。 skill creator 可以 帮助你按照 skill 规范生成 skill。 比如我想创建一个写周报的 skill, 它就会自动调取这个 skill creator, ai 会对我们进行一步步的引导,如这里它会提问使用场景、输出方式、 输出风格。比如这里我们就可以说包装一下语言,显得工作量多一些。这里他还会向我们提问需要包含哪些模块,那最后他就帮我们生成了一个周报 skill。 ok, 我 们来测试一下。 怎么说呢,这字还是很多的,本期就到此结束了,如果对你有帮助的话,记得点赞、收藏加关注。

很多人觉得写一个给 ai 的 skills 很 难,其实 skills 你 一行字儿都不用写。今天给大家分享一下我去用 ai 写 skills 的 技巧。这是一个给博克配封面图的一个 skills, 就 拿这个来举例, 这个 skills 的 主要功能就是我把我的内容给了它,它就帮我使用 nano banana two 配一个动漫风格的封面图。这个 skills 看着非常复杂,但是整个 skills 我 没有写一行字儿都是 ai 帮我写的。第一步,我会同时打开 jimmy 和下的 gpt, 告诉他我的需求。其实这个任务的核心就是根据博客内容去生成身图的提日词。第二步就是自己反复地确认 ai 惨作是否满足我的需求。我会让他尝试给我不同风格的提日词,然后到 navata 里面去使用 banana 三层, 这是 jimmy 三层的,这是 java gpt 生成的。第三步呢,我会挑选几个我觉得最满意的提日词,告诉 ai, 这是我认为最好的方案,请你帮我封装出一套 skills。 这一步呢,需要把 agent 要完成的工作理由给它说明白,包括一些边界的情况之后, gmail 和其他 gpt 就 会分别给到我 skills。 最后,我会同时在 umind 里面创建两个 skill, 分 别测试它们 有点像员工之间的赛马,等跑一段时间之后再决定保留哪一个。那最终胜出的 skills 呢?就可以交给 open cloud, 用多个 skills 组合的方式,自动地去跑完整的一个泊客通道任务了。所以 skills 看着很难写,但人真正做的事情只有三件,提需求、 做实验和拍板。 a s 呢?我真心建议大家都应该养成在工作中封装 skills, 迭代自己 skills 的 习惯,然后努力地让 agent 把自己的工作给替代掉。

skill 爆火却不会用?今天一分钟教你创建扣子! skill 不 用懂代码,零门槛上手打开扣子工作台,左侧索道技能商店右上角创建技能,进入创建页面,在这里选择技能。然后呢,再输入框输入需求。例如, 我想要一个能深度解析文献的技能,提交给扣子,扣子会自动根据你的需求拣写 skills, 并编写任务所需的脚本。最后呢,形成一套 skills 文件体系, 不到三分钟就生成好了。这里还明确了技能的用途和触发的条件,点击右上角的部署,自动上线,专属 skill 就 做好了,还不赶紧试试?我是斌哥,关注我,带你走进学术的 ai 世界!

今天是周六,博主的工作是双休的,闲着也是闲着,博主把之前学过的 agent skills 演示一遍,简单地写了一个获取系统信息的 skill 开始运行, 博主在命令窗口敲入获取设备的系统信息,然后敲回车键,待会代码执行的时候,就会命中博主写的这个 skill。 md, 然后 skill 会使用 run exact 工具执行 system info 命令。 run exact 是 博主写的一个用于执行系统命令的工具, ai 获取到系统信息后,会按照 skill 里的要求,将系统名称、系统版本、处理器型号这三个信息提取出来,然后以接送的格式返回给博主。这里还需要等一等, ai 的 处理速度有点慢。 ok 了,可以看到结果已经出来了。再看看左边这个,这个是博主在命令行窗口手动敲写 system info 命令的返回结果,可以看到 ai 返回的信息是准确无误的。本次分享就到这里,下次再见。

首先我们打开火山的模型开通管理页面, h t t p s 冒号斜杠斜杠 c o n s o l e 点 v o l c e n g i n e 点 com 斜杠不知道怎么开的同学可以看我前面的教学视频,打开后选择视觉模型,然后找到屌爆 see dream 四点五模型, 未开通的会显示开通服务按钮,点击开通服务,找到 crem 四点五勾上,然后点击确定开通即可。接下来我们点击 cdrem 四点五模型进入详情页,我们点击 api 接入,点击快速接入测试, 然后点击红框框起来的复制按钮。接下来我们转到飞书或者你的 open call 界面,这里两个页面都演示一下。首先是飞书,将视频中的一大串内容艾特你的飞书员工,他就会开始创建 skill 了。这里说一下 apikey, 直接在火山控制台 apikey 管理页面创建即可,然后点击对应 key 的 眼睛即可出现复制按钮,点击即可复制 pip, 填写好后点击回车。如果出现这个问题,则需要检查一下飞书开放者平台的权限是否开通, 直接复制他给出的链接即可到达对应权限页面,开通后如图所示,这样告诉他等待执行完毕即可。 聊天界面是一样的,输入内容回车等待他执行即可。在稍等几分钟后,正常情况你的非署员工会告诉你如下内容,表示 skill 生成成功了,如果还有权限不足的提醒,我们复制他给到的链接,直接浏览器打开授权即可。 完成后我们试一下图片生成,稍等片刻后就可以拿到结果了,之后只需要给他 prompt, 让他执行生图即可。大家如果训练过程中遇到了什么问题,欢迎评论区留言,我基本会逐个解答。训练的 prompt 放在评论区了。

如果说你想在克拉蔻的里面真正的去掌握 skill 的 话,你就不能够只从网上去下载别人的 skill 来使用。你需要去了解它们是如何工作的,为什么能够起作用,以及你应该如何去创建测试 优化自己的 skill。 在 这一期视频里面,我会向你完整的分享我平时自己使用 skill 的 一些心得,以及我是如何创建 skill 的。 左边的这一个是没有任何提示词的,直接使用 ai 默认生成的一个网站前端的 页面。右边呢,是我们加了一个设计 skill 之后的一个效果。但是你会不会以为 skill 仅仅只是增强了 colorado code 的 某一个特定功能,但其实不是。我们还可以使用 skill 来构建一个完整的工作流,让 skill 去调用 其他的一个 skill, 从而将我们的生产力提高。但是在学习如何自定义 skill 之前,我们需要了解 skill 到底是什么。不用担心,它的底层原理其实特别的简单, skill 只是告诉 cloud code 用特定的方式去做特定的事情的一个方法而已, 应该来说是一个文档而已,文档规则它就是这么简单。所以只要你能够在克罗德克的里面用提示时做到的事情,你都可以把它变成一个 skill。 它的灵活性是极其高的,几乎可以应用到任何的一个场景里面。 他的工作原理是这个样子,可以访问你列表中所有已经安装的是,他们并不是直接全部加载到你的上下文窗口中。他只是列出了所有你已经安装好的十六的名称,以及一个简短的描述,比如我自己安装的这一些十六, 一些是关于内容创作的,一些是关于视频制作的,还有一些是发布排版的,也有 以及一些关于开发的。每一个 skill 的 功能都不一样,但是它们可以串联成一个流水线。所以当你跟可乐扣子说我想设计一个网站的前端的时候,他就会去看你的 skill 列表里面有没有合适的 skill 能用上,然后他就会抓取对应的关键词, 当他抓取到对应的关键词,发现你的 skill 列表中有关于前端设计的这一个 skill, 他 他就会把这一个 skill 塞到上下文的窗口中,然后使用 skill 里面的内容来进行前端的设计。但是这里他虽然流程是这样,但是我们其实是下意识的做了 两个假设的。这里我们需要讲开第一个假设是我们假设他每一次都能够选对正确的 square, 我 们说过每一个 square 都有一段描述,这段描述可以帮助 colorado 的 做出正确的选择,但如果我想建一个网站来设计一下, 他是不是每次都能判断出哦?要建立网站,所以要用前端,所以要调用那个 skill。 如果说你不止安装了一个前端设计,你安装了很多关于设计的 u a 的 一些 skill 技能的话,你就会看到问题的所在, 我们需要做其他的事情来缓解这两个问题。首先在选对 skill 的 这个问题上,我们要尽量的去精简我们的一个 skill, 使 我们需要的是一把精确的手术刀,而不是说其他的乱七什乱七八糟的什么西瓜刀、菜刀之类的。除此之外,我们还要优化 skill 的 描述,这个可以用 skill creator 来做。后面我会进行演示如何去确保 skill 能被触发, 这是跟提示词的写法有关的。要让 code code 使用某一个特定的 skill, 我 们有三种方式,第一种是给一个模糊的自然语言提示词,然后希望它能够自己匹配上,比如说帮我建立一个个人网站, 这就只是在期望他自己去触发 skill。 第二种方式是明确的告诉他要用哪一个 skill, 比如说使用前端设计的 skill 来帮我做一个个人网站, 他就会听懂。第三种也是最靠谱的方式,用斜杠命令强制去调用,输入斜杠你的提示词名称,这个时候不管你后面说什么,他都会百分百的去调用那一个 skill 呢?一种方式是输入 plink, 打开你的插件市场,你可以搜索,也可以直接往下翻,比如说你想装 load 选的这一个插件,就点击它,然后你会看到三个选项,为你个人安装,为所有的协助者安装,或者仅在你当前仓库安装。 在上一条视频中,我们提到了上下文窗口的这一个问题。所以在添加 skill 的 时候,你得先想一想是不是我每一个项目都需要这一个 skill。 如果说 你只是在特定的项目里面使用特定的这一个 sku 的 时候,你就不需要全局去安装,你只需要把它装到项目级别就 ok 了。在我们安装完之后,你只你只需要重启你的 cc, 你 就可以打开使用这些 sku, 并且很多时候你可能会从别人的视频或者说公众号之类的看到别人分享的一些 skq, 你 想去安装,一般这种分享的 skq 都会附带对应的安装命令或者说 gethelp 页面,你想要安装也特别简单,比如以洞哥的这一个 skq 为例,直接把 他的这一个 gethelp 页面丢给你的可拉的扣的,然后给他说帮我安装一下这一个 skq, 他 就会帮你搞定。如果说你想自己去寻找 skq 的 话,你也可以打开一些 skq 的 聚合网站,然后去寻找你想要的 skq。 讲完安装,我们来聊一下 对于我们自身最有用的一个部分,就是创建属于你自己的自定义 skill。 skill creator 是 a 社官方出的一个 skill, 你 可以在插件市场找到它,也可以在格拉哈普的页面找到它。我们不仅可以用它来创建 新的 skill, 还可以修改和优化你自身现在已经有的 skill, 测量 skill 的 一个性能,或者说去跑一个精准的测试 功能非常多,这就是真正让你的 skill 如虎添翼的一个工具。使用方法也特别的简单啊,直接携带命令,然后 skill creator 就 可以了。然后你只需要描述你想创建什么类型的 skill, 你 甚至可以把这一步也交给克拉的扣的来想,可以看到我这里的视频流水线好像是少了一个标题,对吧?那我们就制作一个标题的这一个 skill creator, 先给 先调用出来,打开我们的一个计划模式,然后给他说你想要的这一个 skill 是 做什么的,比如说我现在我想要创建一个标题深层的 skill, ok, 就 这样,就是这么简单。在使用这一个 skill creator 创建的时候,他不管你是不是会开启计划模式,都会有对应的问题问你。但是我的建议是,你不管做什么,在你没有明确你的方向之前,都把计划模式开散,然后 不断的通过和他去对话,最终完全的去规划好你想要的东西,最后才让他进行创新。我这里就直接选通用标题,这里是可以多选的,然后如果说你有其他的想法,你也可以在这里直接给他沟通。我现在不太确定这一个标题是给我能不能适应多种平台, 所以说我需要你来帮我判断,我们可以继续下一步输入形式是什么?是竹子稿还是选题还是大干?直接选择选择竹子稿,方法论是什么呢?有现成的方法论这里你可以根据自己的需求来进行选择,我这里有动哥的一个知识库,所以我就直接选择 有现成方法论,然后 ai 就 会不断的在和你进行沟通的一个过程中 创建好一个计划,然后这个计划会进行去实施。 ok, 这里有一个集成方式,这里就是我们之前讲过的,通过一个 skill 去调用另外一个 skill, 就是 不断的进行套娃。但是在这里的话,我现在不希望他接入我的视频流水线, 因为我现在还没有进行过这一个 skill 的 测试以及后续的优化,所以我现在希望它独立的使用,但是我需要你保留一部分的接口,以便于后面我优化完成之后呢,把它集成到我的视频流水线里面, 在这个创建思路的过程中,就是我们不断的去和 ai 进行探讨,就是有任何问题就一定要及时的跟 ai 去说。这一点在上一期的视频中我提到过,就是你不知道什么是你不知道的,就是你不知道什么东西是对的,什么东西是错的,那么 你就应该让 ai 去帮你矫正你的道路是对的还是错的,虽然 ai 矫正的东西也不一定对,同时这一个矫正的道路是更多的是对于你自己的想法的一个补充,你不能够完全依赖 ai 给你产出的内容,因为 ai 因为 ai 的 上下文是会腐烂的,说着说着他就变成了一些特别奇怪的东西,当他做好设计计划的时候,你就可以看到他的一些描述的内容,以及他的一些目录结构之类的东西,他是如何去进行工作的,以及 他使用了哪一些方式。当你确定没有问题的时候,你就可以让他继续生成。当你觉得有问题的时候,有哪里不对,你就可以在 后面给他说有哪里不对,他会重新评估你说的话,然后重新给你生成新的计划,我这里只是示范,所以我就直接让他进行生成了。 其实在我自己创建 skill 的 这一个过程中,我都是经常这样,就是让它快速的出一个原型,然后快速的进行验证,然后再不断的去进行打磨和优化。当你从一开始就想把它打磨的很好的时候,其实是很浪费你的时间的,因为你没有通过实际的验证,你就 不知道你的东西做出来到底是对的还是错的。 ok, 当我们创建完成之后,他就会告诉你调用的命令或者说其他的一个东西,然后如果说你觉得他的名字不好,你也可以是进行修改的, 我这里就直接先进行一个测试。 ok, 当我们在发送一条消息,觉得这一条消息不对的时候,是可以按左上角的 esc 撤回的,然后这就是关闭了,然后连续按两下,你就可以回退到你上一条说的话的时候, 然后进行继续的一个补充,使用这一条竹子稿进行测试。 ok, 你 看到了创建一个 skill 就是 这么的简单,然然后续的效果是需要我们不断地去进行优化 和打磨的。但是如果说你在一个行业里面深耕的足够久,当你把这个行业的所有的方法论,制度库都共享给客户的时候,那么他能够给你产出的一个内容的效果是完全会超乎你的想象的。同时,如果说你有一些重复的工作,比如说选择题,精密分析,甚至哪怕只是 把你一个文件夹里面的所有发票都给你整理好,你就可以和他通过一步步的工作规划成一个工作流, 固化成一个 skill。 那 么在你日后工作的时候,你只需要打开这一个 skill, 它就能够去自动化的帮你去完成。 ok, 在 本期视频中,我们讲的是 skill 的 安装,使用以及创建你自己的一个 skill。 当然所有关于克拉的一切都是我自己去自学的,所以说有任何不对的地方也欢迎提出来指正。 ok, 这一期的视频就到此为止,我们就下一期再见。

勾喷科奥,如何抓取小红书热门笔记?本地生成笔记,然后发送到小红书?勾喷科奥有一些关于小红书的 skill, 不 同的 skill 对 应不同的事情。 发送小红书用的是浏览器自动化,这种事人工登录后模拟人操作发送小红书相对安全很多。勾喷科奥本地资料生成小红书笔记用的是 auto red book skills, 当用户需要创建小红书笔记素材时,使用这个技能。技能包含根据用户的需求和提供的资料,拷写小红书笔记内容,标题加政文生成图片、卡片、封面加政文卡片以及发布小红书笔记。 oppo 壳号抓取小红书热门笔记用的是 autoreb com, 它是小红书热点抓取与去 ai 为改写工具。抓取首页热点生成去 ai 为改写提示词本地存储。 open core 发送和管理小红书用的是 raybook 博尔 offshoot skill, 它通过浏览器自动化发布和管理小红书内容。 这个 skill 对 输入的输入有要求,需要把 auto raybook skills, auto raybook content 的 输出用 opencore 整理下,才能调用 raybook 博尔 offshoot skill 来发送。安装这些 skill 的 方法为 npxcore, 预览了 dosto skill 名字。

今天我们开始学习 agent, 通过今天的视频,你也可以在短视频平台做视频解说。今天视频大部分内容是由这个视频剪辑 agent 中的一二步骤来完成的,包括字母识别,字母优化,根据字母生成配音。我们接着往下看。 大家好,从今天开始我们将完成一个视频剪辑 agent, 第一步是字幕提取与优化,第二步是字幕生成语音,第三步视频自动剪辑。第四步是将提取的字幕生成的语音,还有剪辑后的视频,将这几个素材融合成,最终生成想要的最终视频。 今天需要完成的工作是字幕提取与优化,主要采用了音视频分离技术,所使用的工具是 full pack。 接下来是音频转字幕, 使用的工具是 whisper。 然后是字幕内容优化,我们将字幕内容交给大模型,对字幕内容进行优化,我们这里使用的是 deep seek。 接下来我们看一下字幕提取优化这个 skill, 我发给他一段四十五秒的视频,让他提取字幕, 一段时间后,他完成字幕提取并返回结果,这就是返回给我们的字幕文件。 这里可以看到字幕文件包含时间轴和字幕内容。这里还有一些错误,但可以通过微调系统修正,以保持更高的精确度。 下一步我们看一下这个 still 的 组成结构。 首先我们看到 video to subtitle, 这是主工作脚本,它最主要的函数入口就是 video to subtitle 这个函数在这个函数里用于在 pdf 提取音频, 然后在这里加载了 which pro 模型,加载模型后通过该模型提取音频字幕。提取字幕后,将整个字幕转成一个 list 列表,然后将整个列表交给大模型进行输出, 在这个位置,最后输出大模型优化文本的结果,然后再写回到字幕文件里。脚本最重要的部分取决于两个方面,第一是我们自己发音标准,第二是关于大模型的提示词, 重点是要告诉他大模型在这里承担什么样的角色,帮我们达到什么样的目的。下一个文件我们重点关注这个 skill md, 这是一个 skill 说明文件。 大模型 openclaw 调取这个 md 文件,理解如何使用这个 skill, 包括它的参数,这里只是一个说明文件最重要的一个入口,对于 openclaw 来说,它的入口是这个 manifest, 这个入口 在这里就定义了这个 skill 的 名称。这个 skill 包含了工具和这个工具的一个简介。然后这个 skill 的 入口文件在哪里?这里我们指向了 video to subtitle pi 这个脚本文件, 然后这个脚本文件又指向了其中呢? video to subtitle 这个函数, 也就是主函数入口。最后是关于参数文件是 schema, 这个参数文件指向了 schema g, s, o, n 这个 在这里面就定义了它有哪些参数。第一个是视频的路径,第二个是语言,第三个是是否调用大模型进行优化这个参数。 第四个是每次向大模型提交的语句数量,这里我们取了一个中间值。五,不能一次提交太多, 提交太多容易导致大模型堵塞。最后一个地方定义了一个 b 传参数,视频路径是 b 传的,还有这个文件,这是一个纠错脚本,由于发音不标准和口音影响,我们经常会发音错误 或者语音转文本识别错误,那么它会进行纠错,将我们的结果, 比如它发音成千问,我们就直接纠错为千问。领取纠错为领取, 然后立即领取,纠错为立即领取。 open claw 纠错为 open claw, skill 纠错为 skill, open claw 转成了 open claw 函数,纠错为函数。 我们有时会把大模型说成大模型,这里与我们就错为大模型,这就是整个 skill 的 工作方式, 这就是今天所有的内容。如果你觉得对你有用,你需要这个 skill 文件进行学习,你可以关注私信我,我将整个 skill 文件打包发给你,谢谢大家。

周五下班,我拖着疲惫的身躯,挤上回乡的大巴看着城。推开院门,奶奶正坐在老槐树下摘菜,看到我,脸上瞬间绽开了花。午后的阳光洒在院子里,奶奶摇着蒲扇给我讲小时候的事。 傍晚,我们一起在灶台前忙活,锅铲碰撞的声音是我听过最动听的。选晚饭后,我陪奶奶在院子里看星星,这就是幸福最简单的模样。

今天带大家零到一口喷做一个 ai 产品经理的 p r d 生成的 skill。 首先给大家看一下我用这个 skill 针对于合同文件审查智能体生成的一个 p r d 文件,这个目录我是专门在这个 skill 里面去写进去的, 你可以发现这里的目录的链接是可以点击的跳转到对应的文件。 ai 产品的 p r d 和传统的 p r d 其实是非常不一样的,除了业务背景目标进行分析产品方案以外,大家可以看到详细设计,这边会有 a 证的工作流设计, prom 设计规范,术语模型, 然后非功能需求有一些性能的要求,以及我们讲 ai 产品经理非常重要的关于你产品的整个的评估体系,包括数据评测级和 bad case 分 析和迭代闭环。所以这个 prd 相对于来说是非常非常完整的。比如说这个 ai a 阵的角色的工作流设计, 这个里面会包括四个 a 阵的一个文档解析的 a 阵,这个 a 阵执行它的一个角色以及它需要的信息能力和工具清单其实都是有的。整个的这个合同智能体的 a 阵其实是一个多智能体协调架构,它包括四个 a 阵。 在这个 prd 里面所有的这种流程图都是可以通过 moment 来进行渲染的,非常非常直观。包括这里的持续图,包括所有的 prompt 设计规范,整个的工具调用规范,以及呃, ai 帮我们生成的评估的指标,生成的评估的测试体。整个的 prd 作为初稿来说,基本上六十分肯定是有的,还是需要去进行一些优化,同时把你优化调整的部分去不断的再去完善这个 skill。 给大家看一下我的 skill 文件,之前我也有很多视频跟大家讲了 skill 是 什么,这个里面包括概述使用方法,它的执行的流程,具体的信息,它的设计规范等。 呃,跟大家讲一下我的整个的这个 skill 开发的过程,我是把整个的 skill 开发完了以后,结合 excel 的 插件,让 ai 帮我自动形成了一个这个开发的流程。整体来说我的一点零的这个 skill 分 成四个阶段,第一个是我给到 ai 提供了一个优秀的 p r d 的 文件的样例以及核心模块的一个书写的要求, 同时要求他按照我给他提供的样例帮我去生成这个 p r d 的 呃 skill 的 md 的 文件,同时他创建了个进度管理文件,在第一阶段完成以后,出版本或说槽稿版本的 skill 就 已经开发完成了。这个时候我用出版本的 skill 我给他提供了个新的场景,说你帮我去写一个合同的审查智能提的这么一个 p r d 的 文件,在理解了我的需求以后,跟我写作了以后,基于这个 skill 帮我生成了 p r d 的 文件,然后我对于 p r d 的 文件去进行了一些检查以及校验,告诉他这个 p r d 文件里面哪里还有具体的问题, 跟他写作的过程当中去解决了很多 bug 以及优化的流程。最后基于这个 p r d 的 文件,我跟他写作过程,他在反向的去优化哦他的 skill 文件,直到我们把 p r d 完成了以后,形成了这个一点零版本的 skill, 然后给大家看一下我和他那个开发过程。首先第一句话我会给他发一个 quarry, 就是 我是一个 ai 产品经理,我想 做一个自动化写 p r d 的 skill, 请你参照 color skill 的 结构,帮我开发这个 skill, 并保存在 skill m d 文件当中。然后我就给了他两个参考文件,第一个是我们过往写作的一个优秀的 p r d 的 视例,第二个的话就是一个 ai 产品 p r d 的 核心模块的书写规范,我告诉他,请你参考这两个文件,帮我抽象出这个 p r d 写作 skill。 我 后续的所有的场景都需要附用这个 skill, 他就正在读取这两份 pdf 文件,在这个时候他就已经可以创建这个 skill md 的 文件了,也就是刚给大家展示的这个草稿的这个 skill 文件。第二步我就告诉他,请调用这个 prd 的 skill 文件,帮我写一个合同文件审查智能体的 prd, 我 会基于他生成的 prd 的 结果和他进行写作调整,逐步来完善这个 skill。 所以 在这个过程当中他就跟我交互,最后把这个合同文件审查智能体的 prd 写出来,也就是这份文件。针对于这份 prd 文件,我会发现有几个坑, 第一个坑是一开始他给我的时序图还有流程图都是代码形式的,但是我想要去做格式化呈现,所以我就告诉他,我想调用 mmm 工具来做格式化的呈现,他就给我去做了一些脚本上,以及嗯,帮我去建议我去加哪些插件,我就可以最终实现这样一个格式化的一个效果。同时我要求 他帮我把这条规则补充进 p r d skill 中,他就帮我去更新我的 skill 文件,包括说一开始他帮我做出的这个时序图和流程图,有一些色块和字体是看不清楚的,比如说像这种我就直接口喷告诉他需求他就可以给我改,对,改成这样 其实是非常快的。当我的 skill 开发完成了以后,我又艾特他,我当时给到他的一个对应的核心模块及规范,让他帮我 review 一下他现在生成的这个 skill 是 否已经完全的从这个核心模块规范文件当中抽象画出 p r d 写作的规范。在他 review 的 过程当中,他继续的帮我补充了一些信息,最后我将这个 skill 文件保存为一点零的版本, 同时告诉他帮我把这个 skill 研发的过程帮我总结一下。同时因为开发这个 skill 文件踩过了很多坑,所以我让他把这些经验教训保存在一个叫做 lessons md 的 这个文件当中。开发过程当中踩过了坑,后续的话不希望呃在其他的项目当中去复现。他给我形成的这个 lessons md 就是 开发经验教训与避坑指南,其实就在这里, 包括 moment 的 开发的问题,我看不清的问题等等各种各样的问题吧。所以也给大家一个启发,就是可以及时的和 ai 交流一些开发当中的坑,然后及时的去保存在这个经验教训的文档当中,你的 ai 会越用越聪明。我检查过程当中,我还发现他一看给我的目录只是文字的形式, 我觉得上下拖拉拽是非常难的,而且我很难定位,所以我又让他帮我去在目录这里去增加一个定位的超链接,让我对应点击就可以到对应的这个章节的内容,方便我去阅览我的 pdf 文件当中去 整个的 skill 的 研发过程当中,自己是没有写一行代码的,这种 skill 的 创建的过程,以及我们在研发过程当中和 ai 的 交互,包括经任教训的总结,以及整个开发流程的回顾, 以及给到 ai 相关的一些参考的信息,从具体的事例当中去抽象出一些规则,让 ai 自己去学习的这种方法是我们自己在 coding 的 一个可以积累的经验,如果你有兴趣的话,可以自己动手去试一试。


你敢信,连代码都不用碰,三分钟就能亲手做出一个 ai 技能?零基础也能上手,不用懂编程,不用写一行代码,跟着我一步步操作,从零到一,手把手带你搞定。别再觉得 ai 高不可攀,今天你就自己动手,做出属于你的第一个 ai 技能。 skill 到底是什么鬼?简单说,它就是 ai 的 技能包。就像人类会画画、会写作、会计算一样,有了 skill, ai 就 能帮你做特定任务,比如自动回复、数据分析、写文案这些全靠 skill 支撑。记住,有了 skill, ai 才有了超能力, 百分之九十的人第一步就错了。错误做法,我就想做个智能体,功能越多越好,什么都想包含。正确做法,我要做一个课程推荐助手,核心功能就是根据用户需求推荐课程,不做其他无关功能。 目标越精准,效果越好,别贪多,把一件事做好就行。输入设计不对, ai 就 会瞎蒙。错误做法,随便写点什么,用户输入信息, ai 应该懂的。正确做法, 请输入你的学习目标,如学拍摄、学数据分析,请输入你的当前水平。如零基础有编程经验,请输入你的时间安排,如每天两小时,周末集中学习,输入越清晰,输出越准确。把话说清楚, ai 才能懂你。 你是不是也这样?让 ai 推荐课程?就甩一句,帮我推荐课程就行吧,你应该懂的,结果 ai 直接给你整不会了,醒醒吧兄弟, ai 不是 你肚子里的蛔虫,更不是算命先生, 你不说明白,他只能瞎猜,猜错了你还怪他?真正会用 ai 的 人都是这么写提示词的。 第一难度要匹配,别给编程小白推高速,也别给大神塞 hello world。 第二,内容要对口,想学数据分析就别整一堆爬虫课糊弄人。 三时长得合理,人家每天只有两小时,你就别推一百小时的马拉松课程。 第四,优先选高分,四点八分和四点零分,傻子都知道选哪个。第五,附上链接学习建议,别让人家自己大海捞针。记住,提示词就是给 ai 的 说明书,你写的越细,它干的越漂亮。 多花两分钟说清楚,少踩十个坑,写完就上线,你疯了吧?错误做法, 写完就上线,有问题再说,差不多就行。正确做法,先测试三个至五个典型案例,记录不满意的回答,分析问题原因,修改提示词,再次测试,循环优化,直到满意。 好的 skill 是 改出来的,不是一次写完的,多测试,多修改,才能做出真正好用的东西。 你是不是也踩过这些 ai 使用的大坑?别急,百分之九十的人都中招了。第一个,指望一个技能包治百病,一次就完美, 醒醒吧, ai 不是 万能药。第二个提示词,就写几个字,还觉得 ai 该懂你?拜托它又不是你肚子里的蛔虫。第三个,写完就直接上线,用户反馈一堆问题才后悔,这不叫省事,这叫埋雷!避开这三个坑,才能真正用好 ai, 稳扎稳打,效果才靠谱。 看完这个案例,你马上就能动手,我们来做一个旅行攻略助手。目标,做一个旅行攻略助手, 输入目的地、出发时间、预算。旅行偏好,如美食、自然景观、历史文化。提示词, 根据用户提供的旅行信息,深层包含以下内容的攻略,第一,三天到五天的行程安排。第二,每日推荐景点及理由。第三,美食推荐符合预算。第四,住宿建议。第五,交通路线 结果生成的攻略,结构清晰,个性化强,实用性强,学一个案例会一类问题,举一反三才是本事。

大家好,之前有人问我 agent 到底是什么,还有人问我 agent 和 lolm 有 什么区别,更有人觉得工具以及 skill 的 调用都是大模型自己来调用的。所以今天我就来把 agent 和 lolm 它们两个的分工以及交互流程讲清楚。你有没有想过你对 ai 说一句话,它为什么真的能去读文件,去跑命令? 先来说一下他们的分工, lolm 式决策是在给定上下文下生成,要说什么,要补要条,工具参数是什么? agent 是 执行,是真正去调用模型。解析, to cause 在 你的环境里跑工具,写回 to 消息干活发生在 agent 这一层,不是模型自己在读文件,跑命令。 agent 在 流程上其实就五 步,先组装上下文,再调用调大模型,这一步把球交给 lolm 生成。下一步如果返回里带了 to cause, 接下来执行工具的是 agent, 不是 模型本身,执行完把结果作为 tool 消息追加进历史,再发下一轮请求,一直到模型不再要工具或者碰到轮数长度上限为止。对话里有四种角色比较关键, system 放系统提示和规则,比如 skills 怎么用, user 是 用户问题, assistant 是 模型回复里面可以欠 tool cost, tool 是 工具执行结果,而且必须带上和 tool cost 对 齐的 tool cost id, 如果顺序错了很多, a p i 会直接报错。看一个协议实力, 首轮请求里除了 system 和 user, 还会带上 tools 组,里面用 dos schema 描述每个函数叫什么,参数长什么样。 tool choice 设为 auto, 表示由模型自己决定要不要调用 模型,读完用户问题和工具说明就能规划下一步视力是按 openai 的 协议来写的,其他各个厂商的 api 字段名可能略有不同。模型如果决定读文件,响应里 finish reason 会是 to cause, 表示要走工具 assistant 这条消息里会带 to cause 树组。 to cause 里有 type function, function 里有 name 和 arguments。 arguments 在 协议里是字符串,里面会再包一层。 jason agent 会解析这个字符串,再去真正读盘或调接口。 这里已经离开模型了,是本地代码。在执行工具跑完之后,要再调一次大模型。上一轮模型说我要调工具的那条 assistant 的 消息,里面记着他想调什么,以及每次调用对应的 id。 在 这条后面会再加一条新消息,角色是 to, 这条消息里的 to call id 要和上一条 assistant 里某一次 to call 的 id 对 得上。像回执单编号一样, content 里写工具真正跑出来的结果。比如读到的文件内容。 如果模型一口气要调好几个工具,就每个工具各发一条 to 消息,每条都对应的 id 拼好以后,再 post 一 次模型,看见执行结果就能用正常话回答用户了。 那 skills 在 哪一层?通常不会多出一种神秘协议,常见做法是在 system 里告诉模型有哪些 skill, 路径在哪,什么时候要读全文,真正读 skill md, 还是走读文件这类工具调用。所以 skills 本质上是规则加文档,仍然落在同一套 to 循环里。 串起来看用户提问, agent 拼消息调 lolm, lolm 的 响应里可能代表用意图,真正执行工具链的是 agent, 再把结果以 tool 消息回关,再调 lolm, 直到结束。 ok, 我 们来最后回顾一下三个核心要点, lolm 再上下文理深层下一句回复或 to cause 急打酸调什么参数是什么,但不执行具体工具。 agent 在 运行时真正执行 ping messages post 模型,跑工具写 tool, 消息循环直到结束。协议本质就是多轮 messages 加可选 tools 标准 http 对 话并没有玄学。

看到库克拉克的分享的 skill 的 设计模式,感觉使用克拉克的 qd x 的 兄弟们,你们可以直接抄了啊。兄弟们啊,以前总是乱写 skill, 乱写一些 prompt, 哎呀,很容易乱猜或跳步幻觉啊,现在用这种五种简单的方式啊,就稳定多了。兄弟们,我把原文和解读版全部都贴在这里了,你们需要的你们自己去拿。好吧,我尽量的把原文全部翻译过来。

我跟你们说,我之前用 cloud code 简直就是在受刑,每次我让他帮我更新周会表格,我都会像个老妈子一样跟他反复交代, 你还记得吗?上次我跟你说的那个链接,帮我再更新一遍,然后他就开始漫长的回忆,加载,找数据,一通操作下来,每次生成的格式还都不一样,真的超级崩溃,感觉自己像花钱雇了一个每天都在失忆的实习生。但是最近我打通了他的两个隐藏技能,简直是打开了新世界的大门,真的太爽了! 第一个就是 m d 文档,说白了就是你给 ai 做的一份专属的入职手册,你是谁,你喜欢什么样的风格,你的任务有什么样的规矩,全都写在里面。 ai 每次开工前都会强制的先去翻一翻这个手册,你再也不需要跟他废话去交代背景了。 第二个就是 skill, 这个更牛,相当于你给 ai 定制的一件 s o p。 比如我们经常要搞封面和视频的爆款拆解,以前每次都得先输一大段咒语啊,风格是什么样儿的,用什么字体等等,都需要去跟他交代很多内容。 现在我写了一个 skill, 我 只需要一句话,封面生成,它就全都自动搞定,生成封面了,真的太省心了!给你们看一下我的文件目录,这里就建了几个专门的 md 周会更新封面生成视频分析,我给你们演示一下现在有多夸张。以前我让它更新一个周会表格,我交代加等待的时间可能要十几分钟, 现在我只需要输入杠周会更新,哎,他就开始自动更新了,看分毫不差的更新好了,一句废话都不用多说,你牛不牛?当然,肯定会有人说啊啊,我不会写这种规则文档啊什么的。 别慌,我教你一招,你不用一开始就自己写,你先跟 cloud code 进行正常的一个聊天。呃,你告诉他你平时是怎么干这个活的,你反复的跟他沟通、打磨,等他能生成一个正常的结果,就说明他已经能完全理解你的流程了。这个时候你直接跟他说, 把我们刚才沟通的内容生成一个 skill, 它就会乖乖地自动帮你生成。好了,压根儿不需要你自己写。用魔法打败魔法,真的太绝了!姐妹们,听我的,今天赶紧跟着搞一遍,明天你就会有惊喜哦!