hello, hello, 这里是迪姐。很多人在用 ai 的 时候,会经常遇到两个问题,然后第一个呢,就是每次都得重新去教 ai, 它的身份是什么,应该怎么去干活。第二个问题就是 ai 的 输出结果不稳定,经常需要碰运气, 但是呢,已经有一批人在用一种方式让 ai 越用越聪明,一句话就能让 ai 直接自动去干活儿,这个东西叫做 skill。 今天这条视频呢,迪姐会跟大家去分享,讲清楚四件事情,第一个是 skill 呢,它是什么?第二个是 skill 它长什么样子, 我们应该怎么去把 skill 用起来?为什么我们说 skill 是 ai 最核心的能力?首先第一部分 skill 是 什么? 那一句话总结呢? skill 呢,是给 ai 写一份工作的说明书,它不是提示词, want 呢,是一次性的指令。而 skill 呢,它是把你的能力、流程、经验全部都打包成一个可赋用的模块。比如说哈,我们写小红书,那可以去固化成一套固定的结构, 我们做数据分析,可以拆出一套分析的流程,做 ppt 可以 抽取出一套设计规范,那这些东西它都全部可以变成 skill。 而且最关键的一个点是,我们不用每次都去手动调用 skill。 ai 呢,它会根据我们说的话自动去判断,说我应该去帮用户去选哪个 skill 去用, 就像一个非常懂我们的 ai 的 助理,你一开口呢,它就知道这个活应该自动用哪个模块儿,应该怎么去干。 第二部分呢, skill, 它到底长什么样子呢? skill, 它实质上它是一个文件夹,这个文件夹里面最重要的一个文件呢,叫做 skill 点 m d, 那 这个文件呢,核心是干两个事情, 它的上半部分呢,是告诉 ai 什么时候要调用这个呃 skill 的 文件。比如说用户要写文章,或者是用户要做 ppt 了,要分析数据,触发了关键词,就可以调起这个 skill 的 模块。而它的下一半部分呢,是告诉 ai 具体应该怎么去做,比如说第一步做什么,第二步再去执行什么操作,输出的格式是什么?我们应该用什么样的风格?大家能看到说这个文件它的实质呢,是给我们的 ai 助理写一份工作操作手册。 第三部分,我们日常应该怎么去把 skill 用起来呢?这里哈讲三种最实用的方法。第一种呢,是咱们直接用别人做好的 skill, 如果呢,你想把一篇文章变成 ppt, 只需要三步, 第一步呢,是找一个 ppt 的 skill, 第二步,把它丢给 call code。 第三步,说一句帮我安装这个 skill, 那 以后呢,只需要你输入一句话,它就会自动调起 skill 的 模块,帮你把文章自动去变成 ppt, 然后存储在你的电脑里。第二种呢,就是咱们自己做一个 skill, 这个呢,是呃 ai 时代很核心的一个能力。举个例子,如果说你是做自媒体的,那你可以做一个 skill, 是 从自动去找热点到生成选择题,最终再去输出内容。那我们只需要去说一句话, 帮我找一下今天的 ai 选择题,那这个 skill 它就会自动去抓信息给你选择题,然后最终帮你把内容写完。那这个呢,实质上是把你的自媒体的工作的 sop 工作流固化下来。 第三种呢,是让 ai 帮我们做 skill, 我 们可以直接去跟 ai 说帮我做一个 skill, 它的功能是什么?什么?那 ai 呢?它就会自动去帮我们拆解需求,帮我们自动去生成 skill 的 结构,然后最终可以直接去使用起来,相当于 ai 是 成为了我们的 skill 的 开发工程师。那为什么我们说啊 skill 它是拉开使用 ai 的 分水岭,它是 ai 的 核心能力,因为我们会发现说大部分人现在用 ai 的 分水岭,它是 ai 的 核心能力,因为我们会发现说大部分人现在用 ai 还是这样的,问一次,然后用一次,但是是没有产生积累的。 但是 skill 它会做一个非常关键的事情,是把我们的经验去沉淀,去固化下来。那我们只需要去教 ai 一 次,它未来就可以无限次地去复用。所以实质上 skill 它不是工具。 skill 呢,是我们能力的放大器,它像一个杠杆一样,它把你的优质的经验 沉淀下来,把它放大,把它加速起来。这就是为什么有些人 ai 它会越用越强,越用越聪明。但是呢,如果我们停留在对话的阶段,那还是会存在很多的重复劳动,所以差距就在这里。关注迪姐的频道,下一条视频呢,我会去讲怎么用 skill 搭建一个内容创作的工作流,帮我们去 呃提升效率,甚至帮我们去挣钱。评论区答, skill, 我 会发你一份完整的 skill 使用指南,我们一起把 ai 用到极致。那我们就下一期视频再见。拜拜。
粉丝1.8万获赞5.3万

codex 是 我过去几个月高频使用的 ai 助手之一,我用它做研究,写文档、做 ppt, 整理内容灵感,做网页原型。上个视频讲了 codex 基础,这期视频讲一个今年很值得先搞懂的 ai 概念 skill, 因为它决定了 codex 到底只是陪你聊天,还是能按你的工作方式反复干活。简单理解一份可以重复使用的工作说明书, 你可以把某类任务的流程规则、检查标准提前写进去,下次再让 codex 做类似的事,他就不用每次重新听你解释一遍。比如你经常让 codex 做网页,你不想每次都重复说页面不要太 ai 味,不要蓝紫配色, 这些都可以写进一个设计类 skill 里。以后你只要让 codex 用这个 skill 检查页面,他就会按那套规则去看代码、改样式,再告诉你改了哪里。 这就是 skill 最实用的地方。把你反复说的要求变成一套固定流程,那么在哪里看和怎么用 skill, 可以 去 codex 的 侧边栏这个入口里看,里面会有一个 skill 子页面, 已经添加或创建过的 skill 会出现在这个列表里。使用的时候,通常可以在聊天里输入 skill 名称,或者用斜杠跳出来。比如你有一个 find skill, 就 可以直接斜杠选中,帮我找一个适合做 ppt 的 skill, codex 就 会按 skill 里的流程去跑。那怎么创建 skill? 有 两种方法, 第一种最简单直接这样说,请创建一个 skill 以后,我给你一个网页项目时,你要先检查移动端排版按钮样式、文字层级、颜色是否太乱,最后输出修改文件和检查结果。这种叫 prompt skill, 但我更推荐第二种,先把流程跑通,再把流程固化成 skill。 举个我刚实测的例子,我想做一种白板手绘风讲解图,我先给他一个参考图,让 codex 按我的要求生成讲解图 第一版如果不满意我就继续改,比如少一点黄色纸张质感画面更像课堂白板。等到有一版我觉得可以附用,我再说。把它固化成一个 skill, 这时候 codex 会反推刚才的流程,它会把这次反复调整出来的规则写进一个 skill。 md, 这样下次我再用白板手绘讲解图, 就不用重新解释一遍审美和结构,直接调用这个 skill 就 行。如果你想让 codex 使用 skill creator, 它会按更标准的格式帮你生成可附用 skill。 我是 ai 知识派,我们下期见。

大家好,我是松哥。你写的 skill 其实是个半成品,好用的 skill 都是改出来的,但大部分人改的方式就不对,要么写完一板就再也不碰了,不好使就重新写个新的,要么凭感觉改,觉得哪里不对改哪里,改完也没有去验证,改差了你都不知道。最近看到一个挺有意思的方法, 有个开发者写了几十个 skill, 在 反复迭代的过程中总结出来一套优化原则。我觉得不管你用不用他的工具,这几条原则本身就是值得参考。第一条,一次只改一个地方,你一口气改了好几个 skill 的 触发词、步骤、 输出、格式,改完发现有的地方变好了,有的地方变差了,到底是哪个地方改动导致的,根本分不清楚。管过项目的都知道这个道理, 同时改太多变量,出了问题就没法排查,一次一个别贪多,控制最小变量。第二条,写的好不等于用的好,你的 sq 格式完美,步骤清晰,什么规范都到位了,但实际跑出来的效果可能还不如不加这个 sq。 所以 评估改通两层看 一层看结构对不对,一层看真实,让我跑一遍的效果。说实话,纸面上再漂亮跑不出结果,那都是零。第三条,改差了就撤回,不是每次迭代都能把它改好,改完发现效果变差了,直接回退到改之前的那个版本, 当这次修改没有发生过,只保留确实变好的改动。这样做的好处是,你可以放心大胆的试试,错的成本为零,因为差的改动会被撤掉, the q 的 质量只会往上走。第四条,自己改的东西不要往自己提, 自己改完自己打分,肯定觉得改的还不错,得让一个没有参与修改过程的 ai 来帮你重新评一点, 拿到比较客观的判断。说实话,这四条说出来都不复杂,但你回想一下自己平时迭代 skill 的 方式,是不是凭感觉改,改完不验证,改差了也不知道。把这几条用上,你的 skill 会越用越好,而不是越改越乱。今天的分享就到这里,欢迎大家在评论区交流,关注松哥,一起少加班!

windows 或者 open 格式,平时用 browse 这个 skill 去抓网页,是不是有个特别麻烦的问题?很多网站是需要登录的,比如小某书啊叉呀,或者是一些后台系统等等。 每次跑任务,它都会重新开一个新的浏览器环境,登录菜没了, cookie 没了,又得重新扫码,真正浪费时间呢。不是抓数据,而是反复登录。其实解决方法非常简单,只要是一句话,你只要在对话里啊。不是抓数据,而是反复登录,其实解决方法非常简单,只要是一句话,你只要杠杠 browse real 模式, 它会调用你本机真实的浏览器,之前登录过的账号,绘画信息,权限信息都会直接附用,不用登录了,体验是不是完全不一样?很多人觉得访问浏览器的 skill 太笨,其实不是它笨,是模式用错了。

今天咱们要聊的呢,是一个能够让 ai 智能体的技能库,可以自动地去进化驱虫和共享的一个机制。嗯,这个机制可以让技能库不断地自我完善,还可以跨设备跨框架地去使用。错,没错,这个话题很有意思, 那我们就直接进入今天的讨论吧。咱们先来说说现有的这个 agent skill 的 体系到底有哪些痛点?对,我觉得这是特别值得聊的。就现在这个技能库管理到底存在什么问题?其实现在的技能体系的话,它有三大问题。嗯,第一个呢,就是这个技能膨胀, 就是你会不断的有各种重复的、过期的,甚至是只做了一半的技能堆积在这个库里,然后又没有任何的反馈机制,所以你也不知道这个技能到底表现怎么样,你也不知道它到底适合用在哪些场景下,听起来确实挺让人头大的。那第二个问题是什么? 第二个呢,就是缺乏消化,就是技能越来越多的时候,它没有一个去重和优化的机制,所以就导致调用的时候越来越混乱。对,然后第三个呢,就是所谓的经验孤岛,就是多 agent 或者说多设备之间的这个技能是没有办法去共享的, 就大家经常会在不同的地方重复地去创造同样的技能,确实挺让头疼的。对,那有没有什么比较好的解决办法呢? 有啊,阿里最近开源了一个项目叫 skill claw, 它其实就是给 agent skill 这个体系加入了一个持续进化的机制。哎,那这个持续进化到底是怎么实现的?它是通过真实的对话轨迹去自动地提炼经验, 然后可以做到,比如说自动地发现并去除掉重复的技能,把类似的方法进行合并,对那些质量不高的技能进行改善,再把这些结果写回到技能库里面,所以整个过程是完全不需要人工干预的。 哇,听起来真的很不错,那这个 skill cloud 它到底是怎么设计的?它的核心的进化引擎又是怎么工作的?呃,它的架构其实也很有特点,它是一个 client proxy 和一个可选的 evolve server 组成的, 然后他们之间是通过阿里巴巴 o s s 或者是 s three, 或者是本地的共享存储来进行连接的,所以所有的技能都是用统一的 sq 点 md 格式来存储的。感觉这个架构设计确实还挺巧妙的,那它这个具体的工作流程是怎么样?就是 client proxy, 它会代理所有的请求, 然后记录下来任务的输入工具的调用反馈和最终的结果。那 evolve server 呢?它会去分析哪些是高频的技能,哪些是重复的流程,哪些是有缺陷需要改进的地方,然后它会去更新这个技能库。 那它的核心其实并不是说把所有的经验都塞进去,而是它会去判断哪些经验是值得沉淀下来的, 确实很实用。那这个 evolve server, 它具体是靠什么东西来驱动这些技能的进化的呢?它有两类引擎,一类呢,是一个三阶段的 l l m 流水线,就是先总结再聚合,最后去执行。 另一类呢,是基于 open cloud 的 一个 agent engine, 它是可以直接在工作区里面对 skill 进行修改的。它其实就像一个后台的编辑部, 当前台的任务在运行的时候,他在后台就默默地帮你合并去重,然后帮你补全质量,帮你提炼出通用的流程。了解了,那接下来咱们要聊的这个话题, 就跟这个 skillcloud 的 核心有关了。嗯,就是事实记忆和行动记忆的区别。对,就是 skillcloud, 它为什么会更强调行动记忆?其实普通的记忆系统,它更多的是在记录发生了什么, 对,它是一种事实记忆。而 skill cloud 它专注的是提炼出那些可以反复使用的行动方法。嗯,就是它会告诉你每一个 skill 它里面具体的规划是什么,需要调用哪些工具,怎么去验证这个结果,甚至包括一些容易踩的坑要怎么去避开。 它更像是一个不断在修定的操作手册。听起来确实很不错,那我们接下来再讲一讲这个 skill cloud 的 共享机制。嗯,和它的上手难度到底怎么样? a skillcloud, 它的这个多 agent 之间是可以互相打破技能孤岛的,就是它可以跨设备跟着用户走。就比如说你们团队里面有一个人遇到了一个坑,它解决了之后,所有人都可以立刻用这个新的技能。 然后它的安装也很简单,就正常的 git clone 或者是 p i p 安装,再运行一个 skillcloud setup, 还有 skillcloud start 加一个 diamond 就 可以了。如果是需要本地币还的话,你就启动一下这个 shared storage。 还有这个 skillcloud evolve server, 如果是要跟 hermes 集成的话,在 set up 的 时候它就会帮你自动配置,那就是说这个东西它到底是怎么让 agent 真正地学到解决问题的能力,然后又是怎么推动群体智能发展的呢?其实 agent 它要真正地变得智能,它就不能只是记住一些偏好或者是对话的历史,它要真正地能够掌握解决问题的具体步骤,那 skill cloud 它就是通过这个 分布式的贡献和集中式的进化,把这些解决问题的经验整合到了技能库里面,然后让所有的 agent 都可以利用这些不断进化的知识来行动。它其实不光是在单机上面让技能可以成长,它还可以让这个技能的智慧在不同的设备之间流动起来。 嗯,今天我们跟大家聊了技能库管理的难题,然后也聊了 skill cloud 它是怎么通过自动的去重整合和跨设备的共享,让 ai 的 技能可以不断地进化。好的,那这期节目咱们就到这里了,谢谢大家的收听,然后我们下次再见吧,拜。

如果你现在还停留在会用 skill, 但不懂 skill 的 阶段,那这期视频你一定要看一看。同一个任务,两个人一个呢?改了一晚上,一个喝着咖啡就做完了。差距不在模型,也不在,他们的智商在于 skill。 我 们先来讲讲 skill 到底是什么? skill 的 中文是技能经验,它的真实用途也是如此。 比如说哈,你想完成一个复杂的功能,你和 ai 呢?沟通了很久,最终研究出来了一套方法论。第二天再次打开电脑,你和 agent 呢?说,我想做同样的事,你会发现他不记得了,你要去重新解释调试,踩一遍昨晚的坑。但如果昨晚的方法论直接就写成一个 skill, 第二天你只需要说一句话,他就知道该怎么做。 这就是 skill 的 核心价值,让经验可以复用。那大模型是怎么识别和调用 skill 的 呢?首先,我们要清楚 skill 的 构成,它的本质是一个 markdown 文件。以 cloud 的 举例哈,它会放在这个目录下。 每一个 skill 是 一个独立的文件夹,里面呢,有一个 skill 的 md, 这个 md 文件本质上来说就是一个说明文件, 他会告诉大模型这个 skill 的 触发条件、执行步骤和注意事项。 cloud 运行的时候,会把 skill 的 名称和触发描述注入到系统提示词中。比如说,你给 cloud 配置了一个自动写微信公众号的 skill, 这时候 cloud 每次回答你的问题的时候,系统提示词都会有这么一段, m d two wechat, 当用户想转换微信文章,上传草稿,生成封面图的时候,使用此 skill。 当你说帮我写一篇公众号文章, cloud 看到这句描述会主动地去判断,然后就会自动调用这个 skill。 skill 文件里面写着具体的执行步, code 按步骤走,然后就完成了任务。但是这也意味着,如果你配置的 skill 越多,系统的提示词也就越长,消耗的 token 也就越多。你也可以选择在窗口斜杠加 skill 的 名称,这样不依附于 code 的 自动判断,一定会命中。我们自己能不能创建一个自己的 skill 呢?有的兄弟,有的 你可以加载一个辅助你做 skill 的 skill, 然后和 agent 能表明你的 skill 的 触发条件、执行步骤和注意事项,然后就大功告成。以前你把经验交给新人要花几个月,而现在只要几分钟。 guo 的 思想才是真正有价值的地方,不是省那几分钟,而是把你的注意力和方法论变成真正的可付用的东西。我是逍遥,希望本期视频可以帮助到你,下期再见。

同样是小龙虾,别的龙虾勤奋在线,你的龙虾昙花一现,别的龙虾干活利落,你的龙虾总是报错,别的龙虾审美拔尖,你的龙虾审美跑偏, 这中间大概率就差一个东西, skill。 我 拉大家上期呢,教大家怎么零门槛安装小龙虾,但想让它真正的替你干活,还得给它配上好用的 skill。 那 接这期呢,我用五分钟带你从头到尾搞懂什么是 skill, 哪些是必装的 skill 及它的安装教程,记得点赞关注收藏,我们正式开始! skill 就是 小龙虾能调用的一项能力,简单来说,它俩的关系就像是哆啦 a 梦和口袋道具的关系, 你想要缩小就打开缩小灯,你想要飞起来就带上竹蜻蜓。你想要瞬间移动就打开传送门。口袋里有什么道具,哆啦 a 梦就能做什么事儿。你装上什么 skill, 小 龙虾就拥有什么能力。 从查天气、写表格、追热点到自动化操作,这些都需要 skill。 有 了专门的 skill, 小 龙虾才能从一个会聊天的 baby 虾变成一个会干活的效率虾。而 skill 能做的也远不止单个功能, 还可以把多个功能聚合到一起。比如说我之前做的 ai 升视频的工作流,涉及到升脚本、升分镜、升图,也可以直接做成一个全链路的 skill。 那 这样的话,我就可以很从容的只发一个产品卖点和产品图过去,小龙虾就知道一二三,每一步该怎么做,直接跑完全程非常的省心, 那你的经验就变成了他的能力,这样一个 skill 还可以高效的赋用到团队的其他人用。 想要养出效率虾,这四个 skill 必须第一时间安排。第一个 skill waiter 技能审查就是你的电子保安,你要安装新 skill 的 时候就会触发 skill waiter, 他 就会给出一份风险评估。如果说啊,他弹出说这个是高风险的,咱呢还是别撞了。第二个 tively search 搜索技能 是给小龙虾联网冲浪用的 skill, 那 opencloud 自己呢,是没有办法直接联网的,有了 tively search, 他 才能找到最新的资讯。 第三个 agent browser 浏览器的操作技能,比如说呢,帮你打开浏览器啊,抓取网页信息,填写表单,全程都不用你动手, 这样呢,一个自动抓取的表格就给你做好了。第四个是 self improving agent 自我改进技能,遇到了问题,它会复盘,会改进,会自动迭代,所以这是一个越用越强的养成系 skill, 也是 graphhoop 上面最热门的 skill。 以上就是养龙虾必备的四个 skill, 那 国产龙虾一般都会默认安装好这几个 skill, 大家可以查漏补缺看看。 完成了 skill 的 基建,我再跟大家分享,非常好用好看,能快速提升工作质量的 skill。 那 第一个呢,叫做 front and design, 是 一个审美极好的 skill, 我 让它生成了一个拉拉面包店的网站,可以看到呢,它的配图非常的有质感,整体都是淡黄色的配色和色系,排版也非常的清晰和高级。 我还用它生成了一个拉拉服装店的一个面向二十到三十岁欧美女性的独立站,网页整体是非常有活力的,多巴胺的渐变风格,最戳我的是这个鼠标的设计细节,你看它是一直会跟着这个鼠标,有五个彩色的圆点,你鼠标移动起来,这个圆点一起移动,看起来非常的有交互感。 front and design 呢,是 anthropomorphic 推出的 skill, 大家可以相信 xfopy 的 审美出来的效果都非常的有独特的质感。第二个 remote skill, 一个用来升高级视频的 skill, 那 比如说啊,我想要做一个介绍 openclaw 和 skill 的 科普视频, 它呢就能很快地给我做出一条视频,二十秒的时间,里面的图文格式化动效都非常的丝滑高级,也非常适合做数据的格式化,像这种让周报图表动起来的效果是不是也蛮不错的?或者呢是做一个产品介绍的视频,可以看这条 看整体是不是非常的有质感,感觉是那种直接能用的视频。那 remotion 呢,是以图形元素为主体的视觉风格,非常适合去做一些比较冷静的或是高级的一些视频内容。 最后呢,我们就要讲一讲 skill, 它的安装方式大致分为三类,第一种的话就是手动安装,因为 skill 本质是一个文件夹,所以呢,你可以直接从 github 或者是 clonehub 上面下载这个 skill 的 安装包,解压之后直接就拖到小龙虾的文件夹下面重启一下就可以直接使用了。 那第二种是半自动的安装,你只要找到了这个 skill 的 在线链接啊,直接丢给小龙虾,让它自己去安装就更省事一些。 第三种是全自动安装,你甚至都不需要知道这个 skill 叫什么或它的链接是什么,你只要提前的安装一个 find skill 的 skill, 就是 让它自己找 skill 的 这个 skill。 那 比如说现在呢,我需要你做我的投资顾问,你呢?先去搜索一下需要具备哪些 skill 才能做好这件事儿。 好的,就可以看到它自己会去技能库里巴拉巴拉巴拉的一通搜索,然后找到最匹配的几个 skill, 最后我们确认一下想选哪一个,一般呢选个星比较高的那几个 skill 啊,直接就下载安装就可以直接用起来了。 好的,以上呢就是 skill 的 全部实操介绍, skill 的 本质呢,其实就是让你的小龙虾叠各种 buff 啊,技能叠齐了,只要你敢想,它就能帮你搞定。 今天这期视频呢就到这里啦,欢迎在评论区里分享你用过的神奇的 skill。 下期我们再聊一聊怎么手搓一个你自己的 skill。 那 如果这期视频帮助到你的话呢,记得点赞收藏关注。

别再纠结是 codex 还是 cloud code 了,我在实测了数十个 agent 之后,发现真正决定生产力上限的不仅仅是 agent 工具,还有你手里的 skill 配置。如果你的 skill 没配对,换再强的 agent 也是在浪费时间。 所以我根据实际开发场景和我的日常使用,筛选出了这四组最核心的顶级 skill, 包含了原能力扩展、工程化开发、前端设计和内容创作。 它们完全不挑平台,不管你以后切换到哪个 agent 装上都能用。先讲最根本的两把钥匙,我称为原 skill。 你 可以把它理解成让 ai 自我进化的能力,它不负责具体的活,而是专门用来扩展 agent 的 能力边界的。不管你用 ai 做什么,这都是你第一天就应该打好的地基。 第一个是 skill creator, 来自 antropic 官方。如果你想把一套成熟的工作流变成一个新的 skill, 便于后续调用,那么选它就对了。 以前想自己做个 skill 特别麻烦,得先去研究半天复杂的格式,不然可能写出来的 skill 还会报错。就算写出来了,使用效果也不一定尽如人意。但现在有了它,你不需要去研究什么复杂的格式,也不用手动改文件, 你只需要像给同事交代工作一样,用大白话把你的流程说一遍,或者直接把你的操作手册丢给他,他就会自动帮你起草、测试、反复迭代。在你自己完全不用看开发文档的情况下,一分钟就能写出一个既标准又好用的 skill。 安装和使用方式也很简单,在安装完成后, 只需要在 agent 里选中 skill creator, 然后输入你的需求,和它一步步地进行沟通就好。建议直接局安装,这样无论你在哪个项目里,都可以随时进行调用。第二个是 find skills, 大家千万别把它当成一个普通的搜索插件, 觉得还得自己手动去查。真正的用法是你直接给 agent 派任务就行了。比如你让他帮你做个 ui 设计,要是他发现自己不会,他就会自动把你的需求拆解成 ui 抵赞你这种关键词,然后自己去全网搬救兵。他在后台连接的是 skill 点 s h 这个平台,他会自己查看哪个 skill 安装量大,哪个作者靠谱, 然后挑出最好的那个供你进行选择。在你选择好之后,它还能直接一行命令帮你安装上 skill。 creator 是 让它能自己造工具,而 find skills 是 让它能去外面找现成的,这两个配合使用,一定能大大提升你的 agent 的 工作效率。接下来是针对具体场景的 skill。 先说软件开发, 我选了这三个, superpowers, j stack 和一个前端大神的 skill, 它们针对的场景略有区别,但核心都在解决同一个问题,就是终结那种看似逻辑闭环,实则无法落地的代码幻觉,帮你守住工程底线。第一个 superpowers, 他的杀手锏在于他把测试驱动开发这套严苛的工程标准,直接变成了 agent 必须遵守的硬规则。其实很多人刚开始用 ai 编程,最容易上手的场景就是让他写测试,而 superpowers 顺着这个逻辑直接把开发流程给正规化了,他 会强制 agent 进入一套标准的红绿重构循环,先写一个必然失败的测试,证明功能还没实现,然后写最少量的代码,让它变绿,最后再进行优化, 而且它非常稳。 agent 写完之后,它会自动开启两轮内部审计,一轮看代码,实现跟你的需求对不对的上。另一轮则专门盯着代码的质量挑毛病。这种慢思考的模式能帮你抓出很多隐藏的边界问题。 虽然看起来多花了一点点时间,但因为它第一遍就能把代码写到八十分以上,省掉了后面无数次反复抵 bug 的 时间,长期来看反而更省头肯也更省钱。它的整个工作流程大致如下, 首先他会拉着你做头脑风暴,把需求细节彻底磨清楚,先出一份整体的设计文档。然后他会把大任务拆成一个个几分钟就能搞定的小碎活儿,每个活儿都有明确的验证标准。接着就是让紫 a j 特自己去跑, 他自己写,自己查,严禁跳步,你只要在旁边关键节点确认一下就行。最后等测试全部通过了,他会把选项丢给你,是直接合并代码,还是先留着分支,或者觉得不行直接丢掉?第二个是 j stack, 作者是 y c 的 总裁 gary 谭。如果你还不知道 y c 是 什么,简单说,它就是全球最牛的创业孵化器,像 airbnb、 dropbox 这种巨头都是它孵化出来的。所以这位大佬出的工具,骨子里带的就是那种硅谷创业者的实战基因。这个工具有一点不同, 它不是那种功能单一的 skill, 而是在 agent 里内置了二十三个不同的专家角色,从 ceo、 设计师到发布工程师,你都可以通过斜杠命令直接调用,这相当于给 agent 配齐了一整支团队,让他不再是单兵作战。为什么要搞这么多角色? 因为真正做商业系统,代码行数不值钱,能跑通才值钱。有了这群专家帮你交叉审计, agent 就 能在不同的专业视角下, 把你揪出那些隐藏极深的问题。我来向你介绍一下它的实战流程。首先,在你动手写第一行代码之前,先跑一下 office hours 命令。这就是 yc 最出名的灵魂拷问。 ai 不 会立刻写代码,而是像个严厉导师一样, 反问你六个最尖锐的问题,把不靠谱的假设先掐死。接着可以用 plan ceo review 命令,让 agent 站在 ceo 的 高度审视计划,看看有没有更优解。到了代码复合阶段, review 命令就是你的资深工程师,他不光找小 bug, 更盯着那些 c i 能过,但一上线就可能爆炸的工程隐患。另一个具有实战特色的是 q a 命令,以前 a 阵呢,只能在代码里纸上谈兵,但这个命令是真的,会打开浏览器,像真人测试员一样去点击验证, 直接把 bug 抓出来修掉。最后活干完了,直接执行 shift 命令,它会自动同步跑测试、推代码、开 pr。 整套发布动作一气呵成。该瑞坦统计过,二零二六年,它的代码产出是二零一三年的二百四十倍。这不是说 ai 写的代码行数多就是厉害,而是同样的需求, 他一个人现在能顶一支小团队在干活,这就是角色分工带来的本质变化。第三个是一套前端大神 mod, 自己日常工作用的 skill, 作者是 typescript 的 布道者,如果你平时前端开发比较多,那么可以试试这个。 这套工具重点解决的是人与 agent 之间沟通对不起的问题。 mark 总结过,如果没有好的引导规则, agent 写代码很容易陷入几种困境。首先是理解偏差, agent 可能根本没听懂你需要什么,或者写得太啰嗦,废话很多。然后是执行失败,好不容易写出来的代码,结果发现根本跑不通。最后是架构隐患, 虽然代码能跑,但因为缺乏整体规划,后期维护起来会非常痛苦。所以他的这套 skill 核心逻辑很简单,宁可在前期多花几分钟对其需求, 也不要在后期花几个小时去处理这套低质量的代码。具体到这套 skill 里面的指令,我建议你重点关注这几个。首先是 graeme 系列的命令,这就是刚才提到的拷问模式,当你提了一个模糊的需求,比如说想加个登录功能,他不会马上动手,而 是会回过头来不停地拷问你细节。可能问完之后,他发现你真正想要的是 sso 环境下的多租户登录,这就把隐患消灭在开工之前了。接着是 tree 命令,也就是 aure 分 诊,他会帮你把所有的任务都过一遍, 分清楚轻重缓急,确保你不是在修一些细枝末节的小 bug, 而忽视了真正堵塞进度的核心问题。最后还有一个 improve 命令,这是代码库的架构急救包, 你可以每隔几天就跑一次,让 agent 站在大局的视角审视你的代码库,找出那些以后可能会越来越难改的地方,并给出重构的建议。接下来是前端页面设计,这是最开始编程 agent 出来时,他做的最差的一个领域之一。 agent 化 u i 出来的永远都是那些固定的套路, 固定的字体,蓝紫色的渐变背景、圆角卡片、特定的按钮样式。你在网上看到的那些 ai 生成的界面,十个里面有十二个长的都一样。解决这个问题的 skill 有 两个,第一个是 frontend design, afropic 官方出品。如果你受够了那种千篇一律的 ai 审美, 那它就是你的救星。以前的 ai 画 ui, 一 眼看过去全是圆角卡片加紫色渐变,就像是在共用一套廉价的模板。 而 front and design 的 核心是帮你洗掉这些 ai 位。它不是机械的套用组建,而是根据你的产品调性去推敲更有质感的纹理,或者尝试那种更有呼吸感的非对称布局。比如你给他提一个具体的风格要求,想要一个杂志感带点硬核感的页面,他给出的方案里, 字体的比例和模块间的留白都会处理的很到位。有了这种对视觉细节的把控,你的 ui 就 从一眼 ai 变成了真正意义上的耐看。 第二个是 u i u x pro max。 如果说前面的工具是帮你找灵感,那这个就是直接帮你配了一个设计总监。它的特点在于,它不是在靠直觉画图,而是把专业设计的那些条条框框全部变成了底层的逻辑。比如你要做一个金融或者医疗类的界面,它会非常明确地告诉你 什么样的配色能体现安全感,什么样的字体更显专业。他甚至还会给你列出一份避坑指南,直接点出哪些设计在商业场景里是绝对不能碰的。之所以能这么专业,是因为他后台内置了一百六十多个行业的深度规则, 不管你遇到多冷门的业务,他都能拿出一套成体系的方案,从交互细节到动效走位,都给你安排的明明白白。 而且它有一个很实在的功能,就是能帮你生成一套可以持久化附用的设计系统。有了这套规范,你下次再开发新项目, 直接把文件丢给 agent 就 能用,不用每次都从零开始打磨风格。而且它的上手门槛很低,无论是装插件还是用命令行,都能快速跑起来。 这两款工具的分工也很明确, front and 底钻负责把画面画得出彩,而 u i u x pro max 负责把产品做的更专业。有了它们, ai 的 输出就再也不会有那种廉价感了。最后一类,内容创作。如果你用 agent 做内容创作,那这组宝玉老师的 skill 我 一定要强力推荐给你。 它首先解决的就是内容本身的高质量产出,比如它能帮你生成一张极具审美,完全不输专业设计师的封面图,或者把一大段枯燥的文字直接变成一张高信息密度的格式化信息图。 在内容做漂亮之后,他还会顺手帮你搞定后面那些讨厌的碎活,比如说转格式、做排版,最后还能直接一键发布到各个平台,他把从生产到发布的全流程都打通了,有了它,你就能真正实现生产和发布一体化,把所有的精力都集中在打磨好内容上。 宝玉老师的这套工具箱里包含了十几个好用的 skill, 我 这里简单带大家看几个。首先是用于生成封面图的 cover image skill, 它最强的地方在于有一套五维控制系统,从构图类型、色调方案、渲染风格到文字排版和情绪基调, 全都能精准调优。这七十七种预设组合,能让封面彻底告别开盲盒的随机感,每一张出来的效果都像是为你的文章量身定制的专业设计。 如果你平时觉得画逻辑图、架构图很头疼,那这个信息图相关的 skill 绝对是神器。它内置了二十一种专业的信息布局,像分析原因的鱼骨图、做转化的漏斗图、梳理层级的金字塔图应有尽有。更聪明的是, 它能自动读懂你文案里的逻辑结构,直接推荐最合适的布局方案。以前要在设计软件里磨半天的信息大图, 现在只需要几秒钟就能产出出版级的可量化成果。如果你经营小红书,那么可以使用小红书 image skill, 它能将长文章自动拆解为一到十张卡通风格的轮播卡片。通过内置的十一种视觉风格和八种排版模式, 如对比、清单、流程等,可以快速生成符合平台排版习惯的图文内容。针对排版环节, 这个 markdown to html 的 skill 解决的是一个非常具体的痛点,那就是在微信公众号这种不支持 markdown 的 平台上,如何保留精致的排版。它内置了多套公众号主题,能自动处理代码、高量和数学公式。 最实用的一点是,它能把文中的普通外链自动转为文末的底部引用,彻底解决了公众号里链接打不开或者被截断的尴尬。如果你平时还有翻译文章或者精读外文资料的需求,那这个翻译 skill 就 派上用场了。 他最强的地方在于提供了一个正式出版级的模式,这个模式不是直接进行翻译,而是会走分析、翻译、校正再到润色这整整四步的流程。 而且他有一个非常人性化的功能,就是能让你指定你的读者是谁。比如你告诉他你的读者是资深开发者,他就会自动省略掉那些庸愚的解释, 翻译出来的语气读起来就像是真正的圈内人写的。最后,当你把内容全部准备妥当,可以通过发布微信或者发布微博这两个 skill 来实现一键跨平台分发。 它区分了不同的分发逻辑,你可以发长文形式的文章,也可以选择只发几张图片配一段摘药的贴图模式。它把那些复杂的后台操作全都变成了 agent 里面的一行指令, 从本地草稿到最终发布,整套流程都可以在 agent 里面直接闭环完成。今天分享的这些 skill 只是个开始,其实最关键的是大家要根据自己的工作流程和使用场景,去打磨出真正适合自己的 skill。 如果觉得视频对你有帮助,别忘了点赞和订阅,我是俊旺,我们下期再见!

hi, 大家好,我是西西。为什么 skill 突然火了?是因为大家终于发现, ai 最大的问题不是不够聪明,而是会的太多太杂了,容易乱。先说说 skill 为什么有用,以及怎么用。第一种用法,它可以用来拆解复杂的任务, 比如医药、客服、财务、法务这些场景。规则越多,如果全都塞进一个大的提示词模型,很容易乱。 但如果我们拆成不同的 skill, 该用哪个就用哪个,就稳定很多。第二个用法是接企业内部的数据库和知识库,把公司的内部规则、业务知识查出规则,封装成一个一个的 skill。 边回家的时候呢,就不容易胡编乱造, 因为他只会查他该查的那一部分。但问题很现实,最大的问题就是请神容易,送神难, skill 加进来容易,清出去很难。 skill 一 旦挂多了,上下文就会乱,再加上多个 skill 之间还会相互干扰。比方说 skill a 说要查的全面一点, skill b 说要简单一点,查听谁的,到现在都还没有完全解决。所以呢, skill 不是 万能药, 它就是代表一个事情, ai 产品从会聊天往会干活走了。我是西西,记得点赞收藏关注哦,拜拜!

当你用 ai 用久了,你会发现一个现象,就是 ai 它在标准的项目表现的非常好,但是在一些老项目,在一些复杂的项目, 尤其你的项目里面用了你的自研框架, ai 的 表现就差点意思。原因也很简单,就是你想无论是 compile 还是 c compiler 这些 ai 编程工具,它们背后使用的那些模型,无论是 clode 还是 gpt, 他们都是基于开源数据训练的模型学习的,都是优秀的标准的啊编程范式。而你自定义的那些领域规则,在 ai 训练的数据里面微乎其微,所以在你的项目里面表现不好就非常正常了。你想是不是 解法也非常简单,就是把你项目里面所有的无论是显性信息还是以前都是口口相传的信息全部落实到文档里, 然后把它形成一个 scale。 当,当你用任何一个编程工具的时候啊,使用这个 scale 效果就会大大提升,不信你就试试看。

现在的 skill 越来越多,但只有三个,我管他们叫原 skill, 这三个之外的所有 skill 其实都是他们的延伸。我把他们的原码都读了一遍,今天分享一下。 先说第一个, g stock, 这是 yc 总裁 gary 公开分享的工作流套件,里面其实是二十三个子 skill 的 合集,它直接能把 cloud code 变成一个工程团队,包括 ceo、 设计师、工程经理、 qa、 安全官、发布工程师,每个角色都有专门的 skill。 mary 自称用了这套工作流之后,代码产出速度是二零一三年的八百一十倍,同时他还在全职运营 y c。 举几个例子, office owners 用于帮你判断一个产品想法值不值得做。这个 skill 的 数据来源是 y c 投过的所有公司案例 从中提炼而出。 investigate 是 修复项目 bug 用的 skill, ship 是 发布项目用的 skill。 装一个 g stack, 等于一次性装了一套别人验证过的工程团队。有了工作流套件还不够,因为你的需求会越来越多。这就要用到第二个 find skills, 找其他 skill 的 skill, 你告诉他我想实现什么功能,他就会自动去 skills 排行榜查热门的 skill。 源码里还有一条质量筛选规则,安装量一千以上的优先,低于一百的,他才会提示你谨慎选择,搜到合适的还会直接给你安装命令。 如果你找不到现成的 skill, 可以 自己做。这就是第三个 skill。 creator, 做 skill 的 skill。 这个 skill 里面有很多关于怎么写 skill 的 优化,最让我意外的是它的 description 优化器,很多人写完 skill 之后发现触发不准, ai 该用的时候不用,不该用的时候乱用,这个优化器把触发准确率直接拉满了。这个细节官方文档都不写, 只有读野马才知道。为什么这三个我管它叫原 skill g stack 给了你一个起点,装一个就有一整套的工程团队。 founder skills 给了你扩展 skill, creator 则给你定制起点,扩展定制你后面所有的 skill 需求都可以从这三个原 skill 长出来。

你装了多少个 skill? 我 以为自己只装了几十个,但前两天数了一下,总共有一百多个,但日常真正使用到的不到十个,剩下的全在吃灰。说一句反常识的话,最好用的 skill 从来都不是外面装的,是我们自己工作里面 长出来的。装的时候挺爽,刷推特看到有人推荐这个 skill 好 用,装刷小红书,看到有人安利又装,装的时候压根没想到自己在哪个场景呢。 用得上,反正先收着,但装多了之后我就踩了两个坑。第一个, skill 之间会冲突,我之前推荐过 stop, stop 是 英文版本的去 ai word, 后来又装了一个中文版本的去 ai word skill, 我 让 ai 帮我改一段文案。两个 skill 都想接受,规则还不一样,改出来的语气直接前后冲突。装之前最好先看一眼功能有没有重叠的。 第二个,别人的 skill 未必适合。举个例子,别人写的会议就要 skill, 把每个人的发言都要摘出来,但你的老板可能只看结论,这种细节不改,用起来就特别别扭。我下过不少别人推荐的 skill, 用两次觉得不对劲就扔了,后来才想明白,不是 skill 不 行, 是我根本没有根据自己的情况去修改。那踩完这两个坑之后,我现在有三个习惯,第一个,装之前,我们先看一下 skill 的 思路,别人是怎么拆流程的要看的懂,不合适我们可以自己去改。 第二个,平时干活的时候要多留意,同一件事情一周做了三遍,那就让 ai 帮你成建成一个 skill, 这种比从外面装的好用十倍。三,每个月清理一次, 一个月没打开的就要删掉,功能重的留一个就够了,真正每天用得上的 skill 也就十几个。好了,今天的分享就到这里,你最常用的 skill 是 哪个?关注松哥,一起少加班!

ai 对 于职场的冲击绝对不只是停留在说 ai 更高效,或者说 ai 更便宜。所以公司要去裁人的公司不是突然决定不要你的,公司是先让你把自己的经验讲清楚,录下来,写下来,流程化,再决定以后还用不用你。 现在很多公司都开始要求员工去创建自己的 agent, 自己的 skill 不 仅要写,还要能够替代你自己,而且还要纳入到考核里面,表面上是为了提高效率,但是你往死里面去想,这个难道不就是要进行一次权力结构的重写吗?给你的价值很大一部分是来自于黑盒能力, 是你知道怎么做,别人不知道,那些独属于你的踩坑经验,判断路径以及人际拿捏就是你不可以替代的地方。但现在 skill 就是 要把你的这些黑盒的能力一步一步拆解成流程指令和可以无限的操作路径,说白了就是要把人翻译成是机器也能够听得懂的说明书。我觉得这个是 ai 时代真正让我们不舒服的地方, 而且这种趋势是不可以逆的。从公司的角度来看,这个太合理了,可复制,可沉淀,可以规模化,比依赖一个人要稳定的多,要确定的多。 员工离职了,但是 skill 还在,员工状态不对, age 呢,还在跑,企业要的就是这种确定性。但是从个体角度来看,个人的经验被蒸馏,被结构化,这个是在明目张胆的资产化,员工从一个个活生生的人变成了一套套可以被附用的生产资料,而且还是你自己亲手训练出来的一个可以去替代掉自己的版本, 一旦你的核心经验完全被抽干,那我们人就只剩下执行层的壳了,而执行层是不值钱的呀。有朋友可能会觉得说,哎呀,没有那么严重, skill 只是会消化人类已有的东西,真正有价值的还是得靠我们人类自己的判断和审核。 短期是成立的,但是长期可未必啊,因为我们人所谓的那些判断力,本质上也是在大量的案例当中训练得出来的。如果说我们给 ai 接入了足够多的场景,你会发现你连训练判断力的土壤都有可能消失。最后可能并不是你在审核 ai, 而是 ai 在 定义什么是正确的。那么问题来了, 你要不要去写这个 skill 呢?我觉得趋势是挡不住的,但是边界要自己想办法去守,只传播做法,不传播思路和路径,只传播技术,不分享道数。你可以试一试,把共享里面的几个关键的数据 给它修改,城市定制,然后再自己另做一个文档,用于动态值的计算。你人没在背后更新改动?当然我不是个技术人员啊,我不知道这个方式方法能不能做,能不能执行,但是 我觉得思路一定是对的,就是我们要去设计一个程序,让任何人都可以去学会这个操作,预算结果都没有问题,但是一旦你停止了维护,这个结果就会逐渐偏离,最后它会慢慢的变得无效。而且里面需要经验的算法不说,要让他们也全部都踩一遍才知道为什么你要这样去算。 现在很多公司,你比如说腾讯啊,免费去发放透坑支持员工,其实也是在用人工把 ai 训练起来之后呢,为以后的财源去做打算。所以大家在去判断自己安不安全的时候,你不能只是看自己的能力强不强,你还得去看另外一件事情,就是你的价值, 是我会做这件事情,还是说离开我这个系统可能就不赚了,或者说慢慢的偏离正常值了。未来一定是属于那些能够构建 skill, 能够调用 agent 的 人,不会属于那些完全被蒸馏干净的人,前者特别容易被提取,后者更难被替代。

千万不要使用和安装各种各样的 skills, 我 不是否认 skills 不好,相反我觉得 skills 的 发明是一件非常有意义的事情, 他能够让这个编程大模型的能力越来越强。但是啊,你会发现有一个问题,就是像卡洛克的这种编程大模型,你肮脏的差劲和肮脏的 stress 越来越多, 你就会发现这个卡洛克怎么就有点在降质,变得越来越笨了。 实际上啊,他就是因为这个插件和这个 chaos 安装的太多了之后,那么就会出现一种现象, 各种各样的 chaos 之间会相互打架,也就是会有一些冲突, 然后还有一些 chaos 或者一些插件,他表面上说是能够去优化这个托肯的使用量, 节约你的一个成本,但是他背后的运行机制,他会把一些这个编程大模型的输入和输出进行一些优化, 但是不是每一个这种优化工具他都能够处理的非常的好,可能他有时候在优化的过程之中,就也把一些引本非常重要的信息 给优化掉了,也就是把一些非常关键的一些非常有用的信息 给搞烂了,或者是把它给截掉了,那这个时候他就会造成整个上下文对于 ai 这个编程大模型的理解就会出现一定的出入, 因为整个上下文的信息啊出现了一种混乱和中毒的这种情况的发生,那么就会造成这个卡洛克的他越来越笨。 所以啊,我建议大家,如果自己对这些 skills 和这些插件没有一个充分理解的情况下,我建议大家不要随便的去安装各种各样的 skills 或者插件, 但是啊,你真的非要使用这些 skos 的 话,就是一定要去使用那种市场上面大家公认做的比较好的 或者经过用户检验的这些 skos 或者插件,如果没有充分检验过的这种插件,大家能不安装就不安装, 因为啊,毕竟我们在写代码的时候,保持这个冰城大模型一种聪明的状态才是最优的一种选择。

现在很多人对 ai 有 一个误解,以为 ai 能帮你生成一个工具,一个页面、一个工作流,你就已经会做产品了,或者说会用 ai 了。 但我最近在用 ai 产出一些东西的时候,越来越明显的感觉到, ai 时代做一个东西其实越来越简单,真正难的是你怎么把它迭代好用。比如我做了一个热点,抓取匹配选择题的 skill, 一 开始我会把我的需求工作流都告诉他,他会帮我去创建这个 skill 验证,发现一系列不太满意的地方,这个时候就开始迭代。第一个问题就是输出的内容太窄,一开始他的这个 skill 只做了 ai 相关的搜索, 我就问他,如果我这个 skill 想给别人用的话,但别人不想了解 ai 相关的内容,那怎么办?然后他给了我个解决方案,就是在文件夹里面加一个 person md 文档, 这样的话就可以修改这个 md 文档,抓取想要了解的领域。第二个问题就是我发现他输出的选择题匹配度不是很高, 又讨论了一番方案,他的匹配数值设计的不太合理,然后他给的方案就是将百分比的方式修改成等级的方式,对选择题匹配度的条件做了一些调整,调整后的匹配度明显有提升。第三个大的问题就是他只推荐和账号相关的内容, 可能会错过更大的热点。就比如有些热点暂时看起来和也没有关系,但它可能正在影响用户的注意力,或者说 可以作为内容的素材。所以后来又加了一个能力,除了推荐和账号匹配的选择题之外,也给我推荐了一份全网前二十的热点信息,这样我既能看到和自己账号相关的内容,也能够知道今天 外部世界发生了什么。这里我只列据了三条。我想表达的是,这个过程中最耗时的不是让 ai 创建 skill, 最耗时的是你不断地使用它,然后发现问题,提出问题,做判断,决定怎么改。做一个产品也好,做一个 skill 也好, ai 正在把从零到一做出来的门槛变得越来越低,但真正决定产品好不好,用的是你对需求的判断,以及持续迭代的能力。 这也是我做这个热点选题 skill 最大的收获。 ai 让做东西变得更简单了,但也让会判断、会提问、会迭代的人变得更值钱了。

昨天看了一下新更新的奥尼四点三零版本的 skill 技能库,三十一个 skill, 像智能灯泡、麦克、服务器终端发邮件,大概率我以后都不用用到它。 还有以前自己为某个工作做过任务做的 skill, 以后只是有可能会用到,但我一直没有删它,删了之后万一哪天要用万一就是大多数人合伙把 ai 助手用成 垃圾堆的原因吧。不是装的越多越响,是杂物越多,你越听不见那个真正有用的信号。所以我今天要用这个哈尼斯的新功能来管理他们。就三步。第一步,打开排行,直接问我最不常用的三个技能是什么,所以哪个大用哪个吃亏清清楚楚。 像我的 ppt 制作,只用了两次,可以移动了。第二步,归档,移进这个叫 kf 的 文件夹,这样移动时不会扫描, 加载变快,后悔时随时捞回来。三十一个变十七个,清灰一半。第三步,修正,去除两个公众号技能,连一个过期的路径换掉的 a、 p i 全部重新修理一遍。 能装的时候很厉害的样子,但实际上你装上了也不会怎么用,因为不是你自己打磨出来的。 装一万个不如自己手写一个正手。这六最好的数量不是三十一也不是十七,是越少越好。现在打开你的 ai 助手,看看有多少技能是你装完再也没有碰过了,就问一下你的 ai 助手评论区,告诉我答案。

三十秒带你学一个 ai 新知识。今天我们讲 skill 技能。如果把 agent 比作一个数字员工,那大模型是他的大脑, skill 就是 他简历上写的专业技能。 大脑负责思考、规划 skill 插件来精确地执行。它的精髓在于即装即用。 agent 在 执行任务时会自主地判断现在需要哪项技能, 然后调用对应的工具。他让 ai 突破了只能聊天的限制,真正拥有了处理复杂任务的实力。 agent 的 能力上限也取决于他掌握了多少 skill。

大家好,我是阿里厂长,今天聊一个写 skill 配置文件总踩的坑,分享五种 skill 设计模式。 最近这段时间,我自己写了一堆 skill, 有 些 skill 你 写完之后, agent 看都不看一眼。有些 skill 你 写完之后, agent 自动就拿来用,用的还挺顺。中间差的不是模型,也不是 prompt 技巧,就是模式不对。这事是 google adk 团队的一个 cloud 工程师在薄课里说破的, 我看完之后愣了一下,觉得它真说到点子上了。 skill 配置文件这个规范其实只规定了一个容器长什么样, ym 头要写啥,参考目录放哪,模板目录放哪,脚本目录放哪, 但容器里的内容应该怎么组织,从来没人告诉你。很多人写 skill 写得没效果,不是格式错了,是根本没想清楚这个 skill 是 干嘛的。 这哥们儿给了五种 skill 设计模式。第一种叫 tool wrapper, 最简单的一种,其实就是把你团队的某个工具约定、某个库的最佳实践打包成 skill。 比如你们公司用 fast api 有 一套自己的约定,写成 tool wrapper 形式, agent 写代码的时候自然就带着这些约定走。我自己写过一个,把团队命名规范塞进去,第二天同事 p r 提上来,看着就清爽了。 第二种叫 generator, 按模板填空,每次产出都按固定结构来,模板放模板目录,风格规则放参考目录, instructions 只管编排过程。 我用它做过一个周报生成器,每周五自动按固定结构写完,比我自己写快五倍。第三种叫 reviewer, 拿着检查清单逐条评分,按 error、 warning、 道稿、 info 三档给报告查什么和怎么查分离,换张清单就能做不同的审查,代码频审,文案审稿, 安全审计都是这种。第四种叫 inversion, 这种很有意思,颠倒了交互方向。不是你告诉 agent 做啥,是 agent 先采访你,按阶段分批问,没把你问明白之前不动手, 我自己经常犯一个错, agent 一 开干跑了两千次才发现要的根本不是这个。用 inversion 包一层之后,这个问题就少多了。 第五种叫 pipeline, 顺序多步,每步带门禁,前一步没做完不能跳。文档生成流程,数据清洗,活动策划,这种 特别适合。那怎么挑?我自己的建议是,刚开始就从 two rapper 写起,写一个 fast api 约定包,写完立刻能感觉到 agent 在 写代码的时候会主动照着你的约定来。 这种我教 agent 一 件事, agent 真的 学会了的成就感是上手最快的正反馈,等这官跑通了再去玩 generator 和 reviewer, 最后再碰 pipeline。 pipeline 涉及多部状态管理,新手很容易卡在为啥这一部不触发这种细节上。 但这五种模式我觉得最大的价值其实不是用来挑,是用来当镜子照自己以前写过的 skill。 你 回想一下是不是有这些情况,描述字段写得特别模糊, helps with a p s。 这种 agent 永远不激活,这是 to rapper 没写对描述要当搜索关键词写。 把开发者真的会敲的术语全列上一个 skill 配置文件的 instructions 写了三千字,所有规则都塞顶层,这是该用 generator 拆开模板搬到模板目录,风格规则搬到参考目录, skill 跑完看不出哪些做到了,哪些没做到,没法验收。 这是该用 reviewer 强制 error warning warning 音符分级输出, agent 听到需求就开干,回头发现要的根本不是这个。这是该用 inversion instructions, 顶部加 face gate, 按 face 二分之一还三分。阶段提问,多部任务里, agent 偷偷跳步,把没确认的中间产物当输入。这是该用 pipeline 每部显示写 do not proceed to step line until 这种硬命令。这五个坑背后其实是同一个问题。 写 skill 配置文件的时候,全身力气都用在了容器上,没人告诉你内容应该怎么组织。回到挑模式这块,还有一点很重要,五种不是互斥的,生产里一般两到三个组合着用。 举个最常见的新人, onboarding skill inversion。 先采访新人需求, generator 按模板生成项目骨架, reviewer 拿清单自审一遍,外层再套一个 pipeline 串起来加门禁。 这套一下用了四种,再补一个 two rapper 提供约定参考,五种全用上,但这种五种全用上的组合,理论上很美,我自己也还在摸索。第一次用 generator 的 时候,模板写得太死, agent 反而被框住了。第一次用 reviewer, 清单写得太长,跑一遍要三十秒,体验比手写还差。 第一次用 pipeline, 门禁,忘了写 agent 还是跳步,这些都是踩坑踩出来的,光看文章是看不出来的,必须自己写一遍才知道哪儿不对。聊到这里,我突然想起一个事, 我们写代码的人,从小被训练的就是,框架很重要,设计模式很重要,但你看那些真正写得好的代码,框架是辅助,内容才是灵魂。 同样一个 mac 框架,能写出史山,也能写出宫殿,写 skill 配置文件,现在就是这个阶段,我们都在学规范,学格式,学 emoji 怎么写,学参考目录怎么放, 但真正决定一个 skill 有 没有用的,是你脑子里那个。这个 skill 到底是干嘛的?想清楚了没有?模式给你股价,内容才是肉 挑对模式是起点,不是终点。我自己也还在路上,这篇就当跟大家分享一下最近的一点心得。如果你正好在写 skill, 可以 拿这五种模式回去对照一下,看看哪个对得上 好。这期就到这里,觉得这一期有用,记得点个关注收藏一下。我是阿里厂长,下一期喜欢听什么,欢迎评论区告诉我。

你说 ai 写代码时是不是经常翻车?他会替你脑补需求,还会越写越复杂,甚至乱改无关的代码。这个项目你一定要看看,他把卡巴西大神的观点做成了 excel, 里面只有一个文件,但是非常厉害。 核心就四个原则,先想清楚再动手。能简单就别复杂,只改必须要改的点,结果一定要验证。就这么四个原则,直接把错误率降低了百分之九十,开发效率直线上升。

你有没有装过别人推荐的 skill? 满怀期待,用了两次以后就放弃了。我有过,看见别人推荐就装,装了一堆,结果大部分现在都在吃灰,用起来总觉得哪里不对。后来想明白了, skill 本质上是别人把自己的工作流程固化下来,交给 ai 去执行,但每个公司的客户团队 打法都不一样,一套流程换个场景大概率是跑不通的。这就跟你去买一份 sop 模板一样, 市面上那些营销 sop 模板,投放 sop 模板你买了能直接用吗?不能的,你的客户不一样,你的渠道不一样,你的团队能力也不一样,你得改成自己的才好用。 skill 也是一样的道理。那应该怎么做呢?我现在看见别人的 skill 不 直接装了,先把它拆开,看 每一步解决的是什么问题,为什么要这么安排?看懂了之后根据自己团队的情况来调,或者干脆参考他的思路自己建一个。慢慢你会发现,最好用的 skill 都是从自己团队的工作里长出来的。你的业务每天都在跑,哪些事在重复做你是最清楚的。 把这些重复的事变成 skill, 比装一百个别人的都管用。还有一件事,装了不用的 skill, 记得清理掉。之前有聊过 ai 越用越笨的问题, 其中一个原因就是上下文太乱,一堆不用的 skill 占着上下文, ai 每次启动都得读一遍,拜拜,浪费。 我的做法是每隔一段时间看看列表,超过两周没打开的就直接给删掉。说来说去还是那个道理, 你自己最懂你的业务,这是别人的 skill, 给不了你的可以参考,但最终得变成你自己的。大家感兴趣的话,欢迎在评论区聊聊你装了多少个 skill, 真正在用的有几个?关注妞妞,一起用 ai 升级公司。

最近我尝试了一种新的方法,让 agent 自动帮我去优化 skill。 不知道大家有没有遇到像我这样的问题,就是 线上有些 skill 我 们已经在业务里面去跑了,但它的推理效果有时候会让我不太满意。就以前我的做法都是自己去跟 agent 一 轮一轮的反馈,让它去改, 然后我也会去看它改完之后的那个 skill 点 md 或者是其他的一些文件来判断,说是不是符合我的一个想法。后来我发现这个方法有两个挺明显的问题。 第一个就是我们本身并不是 skill 的 使用者, skill 的 真正的使用者是 agent, 所以 我们人觉得有问题的地方,它不一定是这个 skill 最本质的问题,只是我们觉得它不符合我们的一个业务预期,但具体它的问题点在哪里, 其实我觉得用 agent 来判断其实是更合理的。第二个就是人去一轮一轮的改其实真的太慢了,而且很容易漏掉一些潜在的问题。 我们指出了 a 问题,可能又忽略了 b 问题。这种优化其实很多时候是不全面的,而且效率也低,效果也很难做的很到位。所以我现在是用了一种新的方法,就是让两个全新的 agent 互相去盲测,帮我把 skill 一 轮一轮的迭代到位。 试下来我觉得基本上迭代个三轮左右效果就挺不错了。这期就具体讲一下我具体是怎么做的。这里有一个前提需要说清楚,就是双盲测这个方法只针对推理类的 skill, 它才是有意义的。 如果你的 skill 它是这种纯脚本类型的,比如说去采集某个渠道的数据,如果跑出来不对,那肯定就是脚本有 bug, 我 们直接让这个 cloud code 或者 codex 去修脚本就完事了,没有必要去做这种双盲测,因为起多个 agent 的 去盲测,这个 token 消耗还是挺大的。 盲测其实要解决的是这种推理类 skill 优化的场景,就是 skill 已经写了,也已经在业务里面跑了一段时间,但是推理的结果在某些场景下依然不符合我们的业务预期,这种时候盲测才是比较有意义的。 那在启动盲测之前,有两件事情是 a i t 带不了我们的,必须我们先去讲清楚的。第一件事情就是 当前的这个 skill, 它的问题到底是什么?我演示的这个例子就是我有一个自动化广告出价的 agent skill, 它的工作流呢,我是希望它能够多去探索一下不同的出价区间后,去找到我的广告毛利最大化的那一个出价点。跑了一段时间之后,我发现它的探索动力不是很足, 经常是找到一个 roi 一 点二,一点三的一个点之后,他就觉得,哎,不错了,能赚钱,然后就收点了,他就不会再主动地去做探索了。虽然我在 skill 里面也写了一些方法论,让他要多去探索,但是他最终并没有 去落实,所以这个就是我想优化的一个具体的问题,我想让它能够真正地更主动地去做探索,不管是涨价还是降价,我希望它能多去试一些不同的价格,然后去找到一个权取毛率最大化的一个点。第二个我们需要去定义好的点,就是这次 skill 优化它的约束是什么? 这一步我觉得也特别关键,因为如果我们只是把问题抛出去而不给约束的话,那么 agent 对 于 skill 的 改动很容易变成一个反方向的硬规则的这种 补丁。比如说我指出的问题是,他不愿意去做探索,那他可能就会疯狂写一些提示词,让他疯狂的去做探索, 那可能有一些确实不需要探索的地方,他又花了很多成本去探索,这等于就是从一个极端跳到了另一个极端。所以啊,在这个例子下面,我给的约束很明确,就是不管是 skill 的 描述还是工作流的设计,只能给 agent 教方法,不能给他加一些死规则。 因为加死规则的话,像 agent, 他 碰到规则之外的场景他就懵了,他的推理,他的出价逻辑直接就会崩掉,完全没有任何逻辑。 但是如果我们教方法的话,他不管是遇到什么样的情况,他都能用这个方法去帮自己去找到一个合适的解法。所以我在这个 skill 优化环节里面主要就做这两件事情,第一个就是定义问题是什么,第二个就是定义我的约束是什么。 那把问题和约束想清楚,定义好了之后,盲测的迭代其实就是三步。第一步我们在主对话里面把问题和描述一起交代清楚, 让主对话先帮我们去改一版方案,这一版改完之后,我自己都不会怎么去看这个结果改的结果对不对,而是直接进入到第二步,就是让主对话起两个全新的 agent 去盲测, 我一般会用一个 codex 和一个用一个 cloud, 这两个 agent 是 没有我跟主对话之间的这种上下文的,主对话会把这个改完的这个 skill 和我最开始提到的那个问题一起,会给这两个盲测 agent, 让他们独立地去判断这版改完的 skill 到底能不能解决我一开始提出的那个问题, 因为他们没有任何鲜艳的认知,这其实就是我们常说的这个 harness engineering 里面非常重要的一个点,就是做开发任务的 agent 和做 review 的 agent 不 能是同一个 agent, 一个 agent 不 能既当裁判又当运动员,所以盲测的意义就是在这里。到了第三步的话,就是两个盲测 agent 会把他们认为还不到位的地方,需要优化的地方再返回给主 agent, 那 主 agent 会判断这个问题它是不是一个真问题,如果是的话,会按照我一开始给的这个约束,教方法 不交死亏者这样的一个约束继续去优化这个 skill, 那 么这一套反复跑个两三轮盲测和迭代优化这个 skill 基本上就优化的差不多了,这个时候我们就可以把它放回到生产里面,再去看它的实际表现。 那么如果还有问题的话呢,就还是再走一遍这套流程,继续去磨这个 skill 的 一些细节。那么整个迭代过程中,我觉得我作为人的这个工作边界就更加清晰了,就是我只需要去定义我发现的这个 skill, 它的存在的一个问题,以及我在业务上 的一个约束,然后 skill 到底怎么改成什么样子,提示词怎么调,工作流应该怎么设计去编排,这些全部交给主对话和两个盲词 agent 去模。这里面的细节我只关心一个事情,就是这个 skill 再次投入到生产中去应用的时候,最开始提出的那个问题有没有被解决? 说实话啊, skill 跑了一段时间之后,其实这种长推理流程的 skill, 它的啊 skill 点 md, 还有一些 reference 的 文件,一般都还是比较长的,文件也比较多,我们自己去读都还是挺费劲的,更别说一个一个去优化它们。 所以让盲测 a 检测帮我们去找问题做优化,效率我觉得比人手动的去做真的高太多了。如果你们也遇到了这种推理类 skill, 跑了一段时间,但是业务上有一些不满意的地方,我推荐大家按这个方式去试一试。