tiktok 上有一个项目,一天涨了五千多。 star 叫 madcap skills, 作者 madpoc, 是 typescript 社区很有名的开发者,他把自己每天用 cloud code 干活时用的 skill 全部开源了。 skill 的 生态现在已经很成熟了,市场上的 skill 质量参差不齐。 mad 的 这套是社区公认写的最好的参考实现之一。他要解决两个最常见的 agent 失败模式。第一个, agent 做出来的东西不是你想要的,你以为你说清楚了, agent 也以为他听懂了,结果做出来完全不对。 软件开发里最大的失败模式从来都是需求对不齐, ai 时代也一样。第二个, agent 太啰嗦,原因是 agent 对 你项目的术语不熟悉,他不知道你们管某个东西叫什么,只能用二十个词去描述一个你们内部一个词就能说清楚的概念。他最核心的 skill 叫 grill with dogs, 翻译过来就是带着文档拷问你, 你告诉 agent 你 想做什么? agent 的 不是直接开始写代码,而是开始疯狂提问,沿着你的设计方案的每一个分支往下追,问一个问题,一个问题的问,每个问题还给出他自己的建议答案,等你确认或纠正。但这个 skill 比单纯的问问题多了两个关键能力。 第一个,他会维护一份叫 context temd 的 共享语言文档,在提问过程中,每当你们对一个术语达成共识,他就立刻写进去。比如你们项目里 order 到底是什么意思? customer 和 user 是 不是同一个东西?哪些词是同义词,应该统一用哪个? 这份文档的格式很讲究,每个术语一句话定义,下面列出要避免使用的同义词、术语之间的关系,甚至还有一段事例对话,展示这些术语在真实讨论中怎么用。 一旦 context md 建立起来, agent 后续所有的工作都会用这套语言。变量命名、函数命名、文件命名全部对齐, agent 也不需要再用二十个词去解释一个概念了。第二个能力,它会在合适的时候生成 a、 d、 r 架构决策记录,但不是什么决策都记, 三个条件同时满足才会建议写难以逆转。没有上下文的人看了会觉得奇怪,确实有过真实的取舍,这个判断标准本身就很值得学。再看另一个 skill diagnose, 这是一个 bug 流程, 它把 bug 变成了一个六阶段的纪律流程。最关键的是,第一阶段建立反馈循环。原文说这就是这个技能的全部,其他一切都是机械的。意思是,在你开始猜原因之前,先建立一个可以自动化运行的确定性的,能快速告诉你 bug 还在不在的信号, 可以是一个失败的测试,可以是一个 curl 命令,可以是一个 play right 的 脚本。它列了十种建立反馈循环的方法,从最理想的到最不理想的。而且明确说,如果你实在建不起反馈循环,就停下来告诉用户你试了什么,为什么不行。 不要在没有反馈循环的情况下开始猜。第三阶段也很有意思,要求在测试任何假设之前,先列出三到五个排序。好的假设,每个必须是可政委的, 然后把列表给用户看,因为用户往往有领域知识,能直接帮你重新排序。还有一个很小但很精妙的 skill 叫 caveman, 让 agent 用聪明的原始人的方式说话,去掉所有冠词填充词,客套化,只保留技术实质, 声称能减少大约百分之七十五的 token 消耗。正常回答是, sure i'd be happy to help you with that the issue you're experiencing is likely caused by caveman。 模式下变成 bug in off malware token expiry check use is less than not is less than equals fix。 但它有一个例外规则,涉及安全警告或不可逆操作的时候自动退出 caveman 模式,用完整的语言说清楚,说完再切回去。最后说一个 meta 层面的 skill 叫 writer skill, 他 教你怎么写 skill。 从这个 skill 里能提炼出几个关键原则。 第一, description 是 唯一决定 skill 会不会被加载的东西。这就是渐进式加载的第一层。 agent 在 系统提示词里只能看到名字和 description, 它根据这个来判断当前任务需不需要加载这个 skill, 所以 description 必须写清楚做什么和什么时候触发。 第二 skill, 米迪控制在一百行以内,超过了就拆成多个文件,主文件只放核心流程细节放到引用文件里,这就是渐近式加载的第二层和第三层。 agent 先看精简的主文件,需要细节的时候再去读引用文件。 第三,能用脚本做的事情不要让 agent 生成代码,确定性的操作,写成脚本放在 scripts 目录里省 token, 而且比 agent 每次重新生成更可靠。 回过头来看 mat 的 这套 skill, 它们有一个共同的设计哲学,不要让 agent 的 自由发挥,给他一个结构化的流程, grill with dogs 给了 agent 一 套怎么问,问完怎么记录,什么时候该写 adr 的 完整流程。 diagnose 给了他一个先见反馈,循环再列假设,再逐个验证的纪律, tdd 强制他一个测试,一个实现的垂直切片节奏。这跟 harness engineering 的 核心理念完全一致。 agent 的 可信链不在模型,在模型周围的系统, skill 就是 这个系统里最重要的组成部分之一, 而且因为它是开放标准,你写的 skill 可以 跨 cloud code、 codex、 cursor 使用,不绑定任何一个平台。一句话总结, skill 已经从一个概念变成了一个跨平台的开放标准和完整生态。 写 skill 的 关键不是告诉 agent 做什么,而是给 agent 一个结构化的流程,让他在每一步都有明确的判断标准。 macbook 的 这套 skill 是 目前最好的参考实现,值得每个用 ai 编程的人看一。
粉丝3.3万获赞14.9万

最近半年使用 cologod 安装了近百个 skr, 最后发现真正能提升工作效率的其实只有三个技能,今天免费分享给大家。第一个, superpowers, 这个 skr 改变了我用 cologod 的 方式。以前我是直接把需求交给 cologod 的, 让他来写代码,写出来虽然能跑,但是经常跑偏,改来改去浪费大量时间。 装了 superpowers 之后,我养成了一个新习惯,每次开弓前先跑一遍,不认英斯德尔敏。这个技能能让可洛的反过来问我问题,你打算怎么处理并发数据库选什么 等等等等。问完一圈,他会把讨论结果写成设计文档存到本地。听起来多了一步,但这一步帮我拦住了无数次的反攻。有些问题你自己都想不到,但是可洛替你想到了。 注意, superpowers 包含了二十多个紫技能,千万别全开,我只用 breamstorming, 头脑风暴, 其他的按需加载,要不然会浪费大量上下文。第二个技能, playing with fails, 这个技能解决了我被坑过无数次的问题。 cloud 有 个问题,它做到一半就失忆。不知道你们有没有遇到过 一个复杂的任务,聊了半个小时,可乐突然说,好的,让我们开始吧,然后就把之前做过的事情又重来一遍。根本原因是对话太长了,上下文被压缩,之前的计划全丢了。普莱因维的 flow 的 做法很聪明,就是别把计划写在脑子里,它是存在纸上 克拉的扣的。每次动手前会先建一个计划文件,每完成一步就在这个文件里打勾,就算上下文清空了,重新读一下文件就能接着干。 这个思路跟 minnes 很 像, minnes 做常任务为什么玩?因为它所有的中间状态都存在本地了。第三个技能, roughlop, 我 给这个技能起了个外号,监工 sky, 你一定体验过 cloud 的 摸鱼模式。写到一半突然说基础框架已经搭好了,你可以在此基础上继续完善。 翻译过来就是活我没干完,我先下班了。 raflopp 通过一个或可拦截 cloud 的 退出动作,他退出的时候或可会检查。你说的完成标准达标了吗?没达到,回去继续写。 我用它写过,完成过一个 c r u d 模块,设了条件,所有接口测试通过加 redmi 写完才算结束。 kloth 中间响停了三次,但都被塞回去了,最后确实把活干完了。但要注意的是,完成条件一定要写写具体做完用户模块这种话等于没说, kloth 分 分钟说服自己已经完成了写成。完成登录接口可用 单元测试,覆盖率百分之八十。加 redmi 包含 api 文档,它才没法浑水摸鱼。以上就是我常用的三个技能,今天希望能够对大家有所帮助,感谢观看,拜拜,下期见!

大家也关注那个 ai 编程这块技术的话,就会经常刷到,哎,什么一个 skill 在 google 上面掌握多少新?那么这个 skill 是 怎么写的?今天我们来讲解一下,就是这样子的,比如说你看这是一个写 ppt skill, 它怎么写的呢? 其实 skill 可以 当做它是一个说明书,是规范,它只是告诉了这个告诉了什么?告诉了 ai 它是 需要去怎么去实现。就像你要,就算他是个思维翻译过来是个技能吗?就相当于你要开车,那么开车怎么开? a s 不知道, a s 非常聪明,他学习能力是非常快,而且处理速度是非常快的,所以说我们这个时候他这样这么聪明,但是他什么都不会,所以说我们得告诉他 一个知识,就说这个这个 ppt 我 们要怎么写,怎么写,告诉他这个规范,告诉他字体标题怎么搞,内容怎么写,对吧?当然这是国外写的,所以说他就是英文。如果说我们想自己写他,因为 ai, 他 是能看懂 全球的语言的,所以说不管你是用英文还是英文,它都可以的。那么看我后面我就会搜出了一个 skill, 那 么我搜出 skill 是 什么呢?比如说啊,大家都知道这个威士扣的,它是一次一次任务 就是按次来收收费的,就是什么呢?就是我一次给他一百个任务,他也是算一次,那么给他一千个也算一次,给他一个任务也算一次,那么很多人就是会吃一个小亏,就说在这里面一个一个问,一个问好,这样的话效果很高,那么怎么去写这个是 q, 这个时候我们就想到那么一次能不能问一百个,那可以问一百个,那么我不能在这里问完,应该在这里问的话,他会有限制。 好,那么我就开始想写 sql, 写 sql, 那 么 sql 第一个说我用它去读取我的 tasks, 你 看我的 sql 怎么写的好,就在这里也好看它,我写了好多版本啊,这是这个二, 这是我以前的版本,那这个版本给我们检查检一下。呃,首先他对话,对话是一对话就会说去读取,我的是 task 格式, md 格式的文件,对吧?执行第一个代均括号,如果他执行完成之后就标记叉 啊,那么再重新去读取,找下一个,再循环,再就当全部完成之后再进入 继续优化模式,分析项目先并记录优,记录优化点,就说我让他做好所有的任务之后,我还让他去给我分析我的项目有哪些优化点, 他这里我是可以接着他去做,但是我没有写一句我们可以再接着优化点又去做,那么他就是个死循环,他会一直做一直做,当然我不想让他这样搞,因为这样的话我会不受控,所以说我只要他记录优化点之后就结束了,就是,呃,就结束了,如果说他没有新任务就结束了。 好,那看看这就是我的规则,让他怎么最什么写的呢?那么先看这个具体是,嗯, 具体,那我具体怎么写?其实我也不知道怎么写了,那么我直接就把我刚刚的要求你看步骤一读起了,我把这个步骤, 这是一个步骤,我直接就发给了 ai, 说你不按照这个写一个 skill 出来,他就吭吭吭就把这个生成出来了,所以说 skill 我 不用自己去写,我用 ai 去写,我直接有一个思维,我需要这个 skill 干什么? 当然我们以后,比如说在工作中,我们会遇到很复杂的环境,或者说遇到一些重复的工作,重复去沟通,记住只要重复沟通多次的时候,你就需要用到写的 skill, 比如说他也会经常问你,呃,你会经常告诉他哪个是数据库,哪个是什么数据库,哪个是规范,就说你建表的时候你怎么规范,那么你就这个时候你就会想到要写一个规范 skill, 就 规范时候就说告诉他建表的时候必须要哪些字段,怎么命名,这就是我公司内部规范的 skill, 就就是我们在日常工作中,我们会遇到各种各样的问题,当我的门问题只要出现两次或两次以上之后,我们就可以把它去优化成 skill, 这样 ai 去问答时候,它就会去先去读我们的有哪些 skill, 然后再去处理这个问题。 比如说他一旦建表,一遇到建表,他就会去读建表的 skill, 哎,是这样规范的,那么他会注册东西,就是我们想要的。关注我,下期我们讲讲啊,讲其他技术。

你天天说我要用 ai 提效,结果呢?每次让 ai 干活都要跟他啰嗦半天。用 pytest 啊,断言写详细点,报告,按这个格式,等你解释完自己手写都写完了,问题出在哪?不是 ai 不 行,是你没给他规矩。 skill 就是 给 ai 定的规矩,你把它写清楚, ai 就 按你的套路出牌调教,终身受用。 我直接给你八个写好的 skill, 拿去就能用。 skill 一, prd 转测试用力,输入需求,文档输出标准,测试用力等价类边界值,异常场景, ai 全给你覆盖到。 skill 二,刷一个转接口脚本,扔个接口文档, ai 给你生成 paytest 加 request 的 自动化代码, 断言都写好了。 skill 三, bug 报告生成器,你说登录页密码输错没提示, ai 帮你写成步骤预期实际优先级截图建议完整报告。 skill 四,日制智能分析贴,报错站, ai 告诉你哪个文件哪一行,什么原因怎么改, 排查 bug 时间看办。 skill 自动化脚本生成,用自然语言描述场景, ai 帮你写 screen 或 playwrite, 代码定位器都帮你找好。 skill 六,测试报告加载跑完回归测试, ai 给你总结通过率,失败,用力分布,主要风险,下轮测试建议直接贴近周榜。 skill 七,代码 review 贴你的自动化代码, ai 检查有没有硬等待,断言够不够异常,补货了没? skill 八,压测报告分析贴,解密聚合报告, ai 告诉你 qps 为什么上不去,哪段时间响应时间飙高,怎么调优,用 skill 干活就三个字,快,稳、爽! 以前一小时,现在十分钟,输出格式每次都一样,不用返工, ai 真正变成你的马仔,指哪打哪,而且这些 skill 是 一次投入就回报你,今天花点时间配好,以后每次用 ai 都能享受标准化的红利,团队里其他人也可以用,你们测试组的标准就统一了。这套 skill 适合谁呢? 想从手工测试提升的,每天被重复工作磨掉耐心的面试,想让面试官眼前一亮的不适合谁?连试都不想试的觉得反正有人帮我干的,那你可以划走了。 bug skill 每个都配 md 文档拿到手就能用 nice。

m c p 和 skills 到底有什么区别?测试工程师又该怎么用?首先说 m c p 这三个字是 model context protocol 的 缩写,翻译过来呢,就叫模型上下文协议。 m c p 就是 一个标准,一个让 ai 跟外部工具说话的统一接口。打个比方, 就像 usb 接口,不管你用 u 盘移动硬盘还是手机,插上去就能用,因为大家都遵循 usb 的 标准。 m c p 也是这个道理,它让 ai 不 管你用什么测试工具, zelda 也好, cosplay 也好, jacks 也好, 只要工具支持 m c p 协议, ai 就 能调用它。这就是 m c p 的 核心价值,解决怎么连接的问题。其次说 skills, 中文叫技能 skill, 就是 把 ai 的 能力封装成一个一个独立的小模块,每个模块专门干一件事,比如说测试用力生成技能, 这是报告生成技能,这是数据准备技能。你打开手机应用商店,每个 app 都有自己的功能,对吧? skill 就是 ai 时代的 app, 每一个 skill 都是独立的,可以单独使用,也可以组合起来用。最后说核心区别,一句话概括 m c p 解决的是怎么让 ai 和工具对话的问题,它定义了通信标准。而 skills 呢,解决的是 ai 能帮你做什么的问题,它提供具体能力。打个更形象的比喻, m c p 就 像家里的水管管道, skills 就 像水龙头出来的水 管道负责把水引进来,水龙头负责让你用上水,两个缺一不可。那么在测试领域的实践应用, m c p 和 skills 又是怎么配合使用的呢?先说 m c p 的 应用, ai 可以 通过 mcp 调用 selenio playlist 这样的自动化测试工具,让 ai 直接操作浏览器做 ui 测试。 ai 可以 通过 mcp 连接 jitters、 githop、 gitlab 这样的 cicd 系统实现自动化部署和测试。 ai 还可以通过 mcp 连接 gera 这样的一个测试管理平台,自动更新测试状态。接着做 skills 的 应用,基于 m c p 的 连接功能, skills 可以 帮你自动生成 测试,用力生成测试报告,准备测试数据,自动化执行测试脚本。简单来说呢, m c p 负责打通了关节, skills 负责具体执行, 两者配合在一起, ai 就 能真正帮你做测试了。总结来说,记住一句话, m c p 是 管道, skills 是 工具。 反正负责连接,工具负责干活。搞清楚这个区别,你就知道怎么让 ai 真正帮你提升特制效率。那么你平时在 ai 学习中有遇到过什么问题吗?欢迎一起来聊聊你的经验。

一项复杂功能被删掉一万五千行代码后,竟然只用 markdown 就 能跑起来? 近日在一场关于 cursor 的 分享里, david gomez 抛出一句很工程师风话的结论, markdown 正在变成新的代码,他们把 cursor 里一个重量级功能直接拆掉,累计删除大约一万五千行代码, 最后用一套写在 markdown 里的 skills 与子 agent 流程复刻出几乎同等体验,兼说这个功能到底在解决什么问题。 gitworks 可以 理解为同一个仓库的多份独立检出,你想让多个 ai agent 同时改同一个项目,同时跑命令,同时产出不同时限,但又不想互相踩文件,互相污染环境,那就给每个 agent 开一个独立 work tree。 文件看起来是同一份,但每个 worktree 里改动命令、执行 link, 结果都是隔离的。 cursor 之前把它做成了一个完整产品能力,你能在网格里开多个 agent 并行干活,甚至把同一个任务同时丢给不同大语言模型作对比,再从结果里选最喜欢的实现,最后直接从对应 worktree 开 pr。 问题在于,第一次把它做成硬功能时,工程复杂度非常高,要写创建 worktrees 管理生命周期,把它们喂给 agent 当上下文,还要保证隔离,防止 agent 跑到主目录乱改。还要支持用户的 set up scripts, 还要有裁判机制去判断哪个模型结果更好。最后还得处理清理逻辑, 因为有人会开上百个 work trees 把词盘撑爆,于是他们做了一个大胆的反向操作,把大多数能力从代码里移走,改成两种现有元语的组合, skills 和子 agent。 新思路的核心很朴素,把如何创建 work tree, 如何切目录,如何运行 set up scripts, 如何始终只在该 work tree 里操作,写成一段明确指令,让模型按步骤执行。 再用子 agent 把同一个任务分发给多个大语言模型,让每个子 agent 在 自己的 work tree 里产出实现副 agent, 最后汇总对比,给表格、给点评,甚至还能把多个实现的优点拼接到一起。 为了让它更像产品能力,它们把它做成斜杠命令。 worktree best event apply worktree slash delete worktree。 这里还有一个关键取舍,之所以做成命令而不是本地 skills, 是 为了把提示词放在服务端可控,他们想改提示词就能立刻迭代,用户不需要更新版本就能拿到最新流程。 这套提示词集功能的收益非常直接。第一,维护成本暴降, worktrees 本来就是少数高阶用户才会用的能力,不值得长期背着一大坨代码依赖和测试。第二,交互更轻, 用户聊着聊着半路随时可以切到 worktree 继续做事,不需要复杂下拉框,把界面弄得很重。第三, 以前在多仓库,也就是前后端分两个 repo 的 场景下做不了 work trees。 现在命令流程反而能覆盖 agent 会在每个 repo 各建一个 work tree, 开 pr 时甚至会开两个 pr, 但代价同样清晰,而且很功成。现实 最大的失败模式是隔离,从硬约束变成软约束。以前系统能做到让模型物理上无法触碰 worktree 以外的文件,现在你是在信任模型,用更激进的提示词反复强调不要越界, 一旦对话很长,模型注意力漂移,尤其是较弱的模型,就可能忘记自己应该在哪个目录工作,出现幻觉式操作,跑去逐拣处理改文件。第二个问题是体感变慢。流程里创建 work tree、 切换目录,这些步骤会在对话里显示出现, 虽然实际不一定更慢,但用户会感觉在浪费时间。第三是可发现性变差,以前 ui 里有明显入口,现在需要你知道有 work tree 这个命令才用得上 了。他们的改进路线也很典型,用 evos 把是否越界做成可量化指标,再反过来优化提示词,同时把这类任务放进强化学习,也就是 r l 训练,让自家模型 composer 在 这种必须严格在指定目录内行动的环境里更稳定。他们已经做了两类打分, 一类检查模型是否在 work tree 里按预期工作,另一类反向检查模型是否在逐检处里做了不该做的事。 测试下来,小模型更容易偏行,而更强的模型包括 composer, grak 表现更稳。最后还有一个重要信号,他们并不认为全部交给提示词就是终局 cursor 三点零会有更偏 agent 的 交互窗口。 团队计划在新界面里做更原生、更完整的 worktrees 实现,同时也在研究不依赖 gitworktrees 的 本地并行源语。因为 gitworktrees 创建慢,占磁盘,而且只能用于 git 仓库。 这件事真正的价值在于,当你把产品行为从代码搬到提示词,迭代速度会极快,但你必须面对可控性、可评测性、可发现性的妞成本你更信硬隔离还是提示词约束?

很多人以为给 cloud 写技能很麻烦,要手写代码,要懂格式等等,其实完全不是。今天我教你最简单的方式,让 cloud 替你写技能。我们先花三十秒了解一下技能长什么样。 一个技能就是一个文件夹,里面通常有几样东西, skill 点 md 核心文件,这个必须有 script, 放可执行脚本,比如自动发邮件,调用 api 的 代码等等。 reference 放参考文档,比如你公司的写作规范,行业术语表等等。 assess 放模板素材,比如固定格式的周报模板,邮件模板等等。 记住一件事就够了。 skill 点 m d 是 灵魂,其他都是配件。 skill 点 m d 分 两部分,第一部分是原数据,就是一段固定格式的说明, name 添技能名称 description, 写这个技能是干什么的,什么时候用, 其中最关键的就是 description, cloud 就 靠这段话来判断要不要加载这个技能。 所以 description 必须说清楚两件事,能做什么,以及什么场景下用, 最好带上你平时真实会说出口的关键词。第二部分是正文,用普通 markdown 写清楚步骤,视力常见问题就行,没有什么特别格式的要求。流程总共分三步,非常简单。第一步,先口头描述需求,把流程跑通。 比如我每周需要整理客户反馈,按问题类型分类,生成一份儿总结报告,然后一起把这个流程完整跑一遍,确认结果是你想要的。第二步,用 skill creator 封装流程跑通以后,直接说用 skill creator 把我们刚才的流程封装成一个技能,它会自动生成格式规范的 skill 点 m d 原数据, description 步骤指令全部帮你搞定。第三步,启用技能这里分两种情况,如果你用的是 cloud, 点 ai 网页端,把文件压缩成 zip, 进入设置里的技能页面上传开启就行。 如果用的是 cloud code 更简单,封装好之后直接就能用,不需要上传任何东西。 cloud 会自动识别本地的 skills 文件, 之后只要你说出触发关键词,它就自动加载,不用每次重新解释。如果你想改,直接告诉 cloud 哪里不对,让它自己改,全程一行代码都不用动。

最近 ai 圈爆了个词, scares, 你 会发现它串串红的速度比当年的 prompt 还猛。你一定会问, scares 到底是什么?和 prompt 以及 m c p 到底有什么关系?那今天用融化给大家揭秘。 你一开始接触 ai 的 时候呢,会觉得它像个超级搜索框,问一句答一句。可突然有一天, ai 开始帮你做事了,改代码,写方案,分析数据, 它不再是回答问题的工具,而是你上班的同事想知道 ai 是 怎么工作的?听好了,它全靠三个核心, prompt、 scares、 n c t。 那 第一步, prompt, 你 对新人说,这个任务先分析风险,再给我个方案。那听上去像是个命令,对吧?那它的作用呢?是明确目标,告诉 ai 你 希望它做什么, 那这一秒 ai 就 被启动了,它只是按照你的指示开始行动。那这就是 prompt 任务指令,它属于一锤子买卖。那第二部 scares, 你 不会天天教新人怎么写周报,对吧?那只会说按标准来,那为什么呢?因为他早就会了。 scares 呢,就是 ai 已经掌握的技能,像一个工具包, p d p r d, 写作啊,代码审查呀,生成测试报告啊,全都不需要你再教了。那 ai 随时是可以调取,用得起,随时用 它,它不是即兴发挥,它是封装好的技术。那最后 m c p, 这才是命脉。想象一下, ai 再强,如果没有系统权限,无法调取数据库, 没办法进入内部的 a p i, 它就只是一个空洞的纸上谈兵。这时候呢, m c p 就是 ai 的 通行证,有了它呢, ai 能访问真实数据,调用工具进入你公司最核心的部分,那没有 m c p ai 只能嘴上说,那有了 m c p, ai 才能真正的动手做事。 ok, 那 总结一下,你让 ai 去做一件事情,分析这个仓库最近的 p r 质量问题。一开始 prompt 让他知道目标和任务, 接着 scares 让他用代码审查技能、分析技能去执行任务。最后 m c p 为他打开了仓库的大门, ai 可以 真正获取数据,完成分析工作。现在明白了吗? ai 不 再是一个 回答问题的工具,他是你的工作的助手,是公司的一员,你交代的任务,他给你反馈给你解决方案。而这正是 ai agent 的 真正含义, 能被指挥,能执行、能行动。所以记住这三点,一, prompt 是 你给出的指令。二、 scares ai 掌握的技能随时能使用。三、 m c p ai 的 系统权限,打开工作大门要三者具备。 ai 不 再是工具,它直接能变成你的团队成员,你的工作助手。 那最后呢?我整理了一份某个大厂内部的 ai 产品经理必须要文档,包含了 ai 产品研发全流程和大模型未来发展方向以及学习路线图需要的直接安排。

欢迎来到本期深度解析,今天咱们要聊点特别硬核,但也绝对能戳中每一位拍发者痛点的话题,也就是所谓的工业级 ai 治理。 你想啊,现在的 ai 编程术手满天飞,但我们怎么才能阻止他们产生那种虚假成功的幻觉呢?今天咱们就来看看,如何通过一套软件开发协议,彻底把 ai 从一个只会聊天的机器人升级成严谨的工业级的自动化开发者。 咱们先来看这个人的对比,过去或者说现在很多人还在用的是那种聊天机器人模式,你给他下个指令,他在那靠脑补直接生成代码,然后咱们就凭着信仰假装相信他能跑通。但说实话,这太不可靠了, 原材料明确指出,我们要彻底告别这种模式,转向工业级开发者思维。什么是工业级?就是期约优先,凡事讲究基于证据。 各位,咱们肯定都经历过这种令人绝望的时刻对吧? ai 信誓旦旦的跟你说搞定了测试,跑通了,结果呢?当你试图把代码拉下来打包或者准备部手上线的时候,轰!整个系统直接崩溃了。 这不仅让人纳闷为什么他在 ai 的 环境里就能跑,到了发布的时候就成了灾难?答案其实就在这原材料里,把这个叫做樟树效应。 简单来说就是你的 ai 其实运行在一个被严重污染的本地工作区里,那里头乱七八糟的塞满了未被 get 追踪的文件,以前运行残留的旧日制,甚至还有老旧的数据库缓冲。 ai 就是 靠着这些本地的脏一赖跑通了,然后给了你一个成功的幻觉,但实际上它根本没有触及真正的原码真相。 那么为了解决这种混乱,咱们需要实施这套包含六个部分的软件开发协议。首先是升级至工业级 ai, 接着是逃离樟树陷阱, 然后探讨契约优先模式以及决策三权分离,再到基于证据的工程化。最后是如何构建机构记忆,咱们马上逐一拆解。 好的。第一部分,升级至工业级 ai 停滞,把 ai 当做聊天机器人,咱们来看看为什么直接听信 ai 的 话是个巨大的陷阱。原文件在这里的表述极其直接, 永远永远不要相信一张简单的截图或者聊天框里的一句任务已完成。说真的,把口头结论当成验收标准,绝对是重灾区。 那些截图里的日制或者数据,你根本不知道是不是同一次运行产生的。接下来是第二部分,逃离脏树陷阱,寻找源码真相。 既然不能听信一面之词,我们要怎么去找到真正的源码呢?这个对比真的非常绝,你个 ai 必须也是只能从 get index 或者 had 中去获得源码的真相, 千万别让他去读本地那个又脏又乱,未经追踪的工作数来做判断。如果你只盯着本地文件,那些根本没进入版本控制的运行依赖绝对会引发大问题。咱们来看第三部分,弃约优先模式停止,一上来就写代码, 搞定了原码源头。接下来咱们要给 ai 建立规矩了,想要避免一个小小的修府,最终变成一场无法收场的代码大重写,这道名为 start gate 的 起跑门槛协议就显得直观重要了。 在 ai 真正去碰哪怕一行代码之前,他必须先过这一关。他得用中文向你重述他理解的目标,列出关键的假设,并且定义出最小的可行范围。最关键的是,他必须停下来,静静等待,你给他一个明确的批准,不这么做,后果不堪设想。 好了,第四部分,角色三权分立,防止任务无休止扩张。 为了进一步强制执行刚才说的纪律,我们要引入一套新机制原材料强烈推荐把 ai 系统强行划分为三个独立的现成,也就是决策上的三权分立。你看,控制者负责掌控大局和任务气约。 执行者呢,只管最窄范围的代码实线,最后是审核者,他的工作就是只拿着最初的契约,死死盯着代码叉一看。通过这三条独立的线程,所有的实线都会被牢牢拴在最初的契约上,决不允许越界。 第五部分,基于证据的工程化定义什么是真中的完成?咱们进入发布阶段,看看什么是无可辩驳的证据。 为了保证代码绝对能交付,这里提出了一套静态发布流水线。什么意思呢?就是把代码拉到一个完全隔离的新目录里, 脱离刚才那些复杂的负极环境,然后一步穿过这五道验证关卡。特别是最后一步,必须是在隔离环境里做全新的冒烟测试,缺一不可。 这就引出了整套协议里最核心的一句真言了,请记住,相信我,这 bug 我 修好了。这句话在工业级 ai 面前彻底失效。一项任务真正完成的唯一标准,是拿出实打实的证据根。 那么,什么是有效的证据根呢?它不是什么旧记录的残留,而是全新的在无菌环境中运行成功的实锤。比如退出码必须是 pass, 还要有全新生成的日制,加上经过哈希文政的包,只有当这些证据摆在面前时,控制者才会点头认可, 也表示着咱们从信仰编程真正迈向了基于证据的工程化。最后一部分第六部分,构建机构记忆,从环境陷阱中学习,光有流长不行,系统自己也得会长记忆深。 咱们来想象这样一个极其让人抓狂的场景,六十秒,仅仅因为在处理大文件 pdf 的 时候,外部的一个 ocr 工具自带了六十秒的硬性超时限制,导致整个流水线默默地、没有任何预兆的彻底亏本了。 排查这种问题简直能让人亏本,一旦这种戏讽级的隐蔽陷阱被揪出来,总不能只留在某个开发者的脑子里吧? 所以,解决方案齐集系统哈协议强制要求把每一次失败,不管是刚才说的 ocr 超时,还是让人头疼的 windows 换行符问题,甚至是 s q l i t 被锁住的假失败,统统记在一个专门的 lessons learned 经验教训文档里, 每次开工权 ai 必须先读一遍。这样一来,系统自然而然就拥有了极高的稳定性,做到默认即可交付 好了,当咱们准备把这些强大的 ai 助手引入到团队的日常工作流中时,不妨问自己一个核心问题, 你是打算继续依赖盲目的信仰,任由 ai 在 樟树环境里野蛮生长呢?还是准备好实施这套严格的协议要求硬核的证据 彻底迈入工业级自动化开发的新时代,我想答案已经非常明显了。感谢大家收看本期的深度解析,我们下期再见!

一个视频讲明白 ai 领域的 skills 到底是什么? ai 怎么从只会说话的语言模型变成真正能干活的智能体?答案就两个字, skills。 你 可以把 ai 想象成一个超级大脑,但没有手脚。 skills 就是 给这个大脑装上各种工具,搜索、写代码、挑 api。 有 了工具, ai 才能真正干活。 skills 按功能分三大类,第一类,信息获取、搜索网页、抓取数据。第二类,计算执行、运行代码做数学。第三类,交互控制,调 api 操作系统。每个 skill 的 底层都是一份 json 格式的工具描述器,约 它告诉模型三件事,工具叫什么名字,能干什么,要传什么参数公式就是 to, 等于名字加描述加参数的 json 模型。看懂这份契约,才知道什么时候该调用哪个工具模型使用工具的过程,遵循一个经典模式, react, 循环三步走,先思考,再行动,调用工具,最后观察结果, 然后回到第一步,继续思考,直到任务完成。就像厨师做菜,想菜谱,动手炒,尝味道再调整。面对多个工具,模型怎么决定用哪个?其实模型会给每个工具打一个饮食的概率分数, 最适合当前任务的工具,得分最高,被优先选中。这不是随机的,是模型基于训练数据学到的判断力。你说一句自然语言,模型要把它转化成结构化参数, 比如查北京天气,模型自动提取 ct 等于北京,这个过程叫参数提取,是 skills 能正常工作的关键。 工具运行不是在模型内部,而是在独立的沙箱环境里。沙箱就像一个玻璃展柜, ai 能看里面,但无法随意操控外部系统,这是安全边界的核心设计。 工具调用的底层是一套请求响应协议模型,发出结构化调用请求,包含工具名和参数。外部执行器收到后运行,把结果打包返回给模型, 就像客户下单,餐厅做菜,服务员端菜回来。真正厉害的地方在于工具可以练式调用,先搜索拿到数据,再用代码处理,最后通过 a p i 发送结果。 多个工具串联完成复杂任务,有个隐藏成本。你必须知道,每次工具调用结果都会塞进上下文窗口,上下文窗口是有限的, top 数量有上限。 工具调用越多, token 消耗越快,成本越高,速度越慢。所以工具不是越多越好,要精准使用,工具调用不总是成功的。错误处理同样是 skills 的 一部分,超时就重试参数,错误就修正参数,再试, 权限不足就放弃,并告知用户原因。安全设计的核心是最小权限原则, ai 应该只拥有完成当前任务所必需的最小权限。字集能读数据,但不能随意写。系统删文件,这防止了工具被滥用,保护了用户数据安全。 skills 不 只是文字工具,现代 ai 的 技能已覆盖多种模态,视觉工具分析图片、语音工具处理音频、浏览器工具操控网页,让 ai 真正拥有多感官能力。你可能听过 function、 calling to use actions 这些词, 它们叫法不同,但底层机制完全一致。东市定义、气约、模型、决策、执行、返回这三步, skills 是 对这套机制的通用描述,换个名字原理不变。高级玩法是用 d a g 有 向无环图来编排工具,多个工具可以并行执行,结果汇聚后再传入下一个工具。 这种编排方式大幅提升了复杂任务的执行效率。总结一下, skills 就是 ai 的 行动力定义、契约模型、决策杀伤、执行结果反馈、四步循环。明白了这套机制,你就真正懂了 ai agent 的 底层原理。

大家好,欢迎来到收看澜沧 ai 学习日记。今天咱们就来完整拆解 ai skills, 怎么把通用聊天 ai 变成能真正教出专业成果的模块化 ai agent。 二零二六年的 ai 正经历一个关键的分水岭,从过去的 prompt engineering 走向现在的 delivering ai。 之前咱们用 ai 的 手写老长的指令,反复提醒,别忘这个格式要那样,结果还是长漏细节,格式乱、输出不稳定, 本质上就是靠运气的闲聊。但现在不一样了, doing ai 阶段,咱们靠标准化工作流程、自动化流水线和质量检查, 把大模型变成能稳定交付实际业务价值的专业组建。核心结论很简单,大模型能力已经够强了,缺的是把这些能力封装成可靠可附用、能规模化部署的业务组建。那到底什么是 ai skills 呢?它可不是一句简单的提示词,而是包含指令、脚本、模板和资源的实体文件夹, 就像给 ai 准备的标准化工作手册加专业工具箱,也就是常说的 sop, 能彻底消除上下文焦虑,把隐性知识变成看得见的显性资产。用上 skills 后, ai 就 能像插件一样按需加载内容瞬间从通用模型变成特定领域的专家。 和传统提示词比, ai skills 在 四个维度都是降维打击、形态特征、加载机制、执行一致性,还有经济效率。传统提示词每次都得把全部内容塞进上下文儿, toc 消耗大还容易错。但 skills 用渐进式,譬如只有需要某个步骤时才动态加载对应内容,既省 toc 又提精度。 ai skills 有 三大核心应用场景,第一类是文档与品牌创作,能严格跟着企业 v i 规范, 自动生成高质量的 pptx 和 excel 专业报表。第二类是数据与代码标准,能按公司特定规范完成复杂的数据清洗、 e、 t、 l 转换、代码审查和重构。 第三类是自动化工作流,能无缝连接 slack、 git、 up、 notion 这些外部系统,形成真正的多步骤闭环自动化执行。从物理结构看,一个完整的 skill 就是 独立文件夹,通常有核心的 skill 点 md 文件,还有 temp files 和 scripts 两个子文件夹。 skill 点 md 是 大脑里面定义了触发元数据 角色称法、详细的 sop 执行步骤,还有严格的红线约束。进阶架构里还能结合代理式提示、畅线封城和 mcp 圈 web hooks, 实现更复杂的外部工具调用和真实世界交互。部署方式也灵活,开发者爱用命令行,普通业务人员可以用 web 界面直接艾特技能名称调用。企业能通过 api 实现后台全自动化。 比如实战里用户说用 pdf 词典提取这份发票的数据, ai 会先动态加载 skill, 理解唱像和约束,自动执行脚本,完成格式校验,最后输出干净标准,能直接入库的结构化数据。 对团队来说,建企业级 skills 库意义大着呢,能把资深员工的隐性知识显性化,用 get 做版本控制,确保全团队的 ai 行为始终最新且高度一致。 告诉大家,最成功的团队不是最会写提示词的,而是拥有最庞大、最完善、不断迭代的 skills 插件库的团队。总结一下, ai 正在从单纯的聊天助手彻底变成标准化、可信赖的专职员工, 而 skills 就是 实现这一转变的关键技术。行动建议来了,今天就梳理你工作中最痛苦最重复的一个流程,新建个文件夹,写下你的第一个 skill, 点 md 把知道怎么做,真正变成 ai 自动会做。感谢观看,如果你们正在实践 ai skills, 欢迎在评论区分享你的使用案例,咱们下次见。

我太激动了,刚看到国外大神开源的 agent skill 和演讲视频,就迫不及待地给大家做出视频分享,因为这实在太强了,我想让更多的人看到。 我简单给大家捋一下核心干货。大神点出了 ai 写代码时普遍遇到的四大核心问题,并且配套给了对应的战术 skill 技能,完美对症下药,全部开源可直接拿去用。 问题一, ai 没有按照我的意愿去做。问题二, ai 说话太啰嗦。问题三,申请的代码无法运行。问题四,代码是一团乱麻,大家可按照自己的需求选择对应曲线观看接下来进行实际内容。 第一个问题, ai 没有按照我的意愿去做。当我觉得我有个好主意去和 ai 沟通,此时其实在做需求收集,他从你这里论清楚你的想法。 然而我和 ai 之间并没有混响一个设计概念,于是做出了我不想要的东西。 于是这位大神想出了一个技能。这个技能非常简单,过程就是不断采访,确认计划细节,直到达成共识。 这个过程中, ai 大 概会问你大约四十个、六十个问题,深入涉及的每个分支足以解决角色之间的依赖关系。此时 ai 是 你的对手,不断的向你抛出想法,努力达成共同理解。 还有一个好处,之后生成的对话可以拿来变成产品需求文档,这比 c c 或者其他 a 帧的工具里的计划模式要好。计划模式非常急于创建一个计划并开始执行一个想法,不会被几个问题就解释清楚。 第二个问题, ai 说话太啰嗦。 ai 在 说话时总是用太多的词语表达他在做什么,人与 ai 之间并不是在用同一种语言交流, 所以大神做了一个技能,这个技能就是通用语言技能,他的基本原理就是扫描你的代码库,查找术语,然后生成一个马克档文件。他会创建一个通用语言的马克档文件,里面包含一堆所有术语的马克档表格, 然后把这个文件转给 ai, 当然自己也能阅读它。领域驱动设计,简称 d d d 有 一个通用语言的概念技能类似通过通用语言,人与 ai 之间的交流全部源自同一个领域模型。这就是第二个小技巧, 和 ai 创建一套通用语言。第三个问题,假设你已经和 ai 达成了一致,你很清楚你要构建的是什么。 ai 也确实构建出了正确的东西,但是不能正常运行。我们就可以利用反反馈循环。 ai 往往是一次性做太多事情,生成大量代码,然后才可能做一下类型检测 或者跑一下测试,这导致速度太快。反馈的速度决定了速度上限,应该边走边测试,采取小而谨慎的步骤,而不是超过这个速度,而 ai 默认情况下在这方面做的并不好。 所以第三个技能就是 tdd, 使用测试驱动改法,因为 tdd 会迫使大语言模型真正采取小步前进的方式。先写一个测试,让这个测试通过,然后再重构代码,让它更优雅并考虑设计。 第四个问题,代码是一团乱码。简单说一下,代码库中浅层模块功能不多,但接口却很复杂。如所图,你会看到有大量不同的小块 ai 在 其中穿梭和导航,实际上这让 ai 很 难进行探索,而 ai 其实很擅长生存这这种代码库,于是 ai 根本不理解代码在做什么。他会尝试去探索代码,但由于结构混乱且充满了浅层模块, 可能无法及时找到正确的模块,或者无法理解所有的依赖关系。他无法理解代码。代码库中的深层模块,如右图,代码本身没变,只是被组织在了边界内,边界外有接口。 那么如何把浅层模块的代码变成深层模块的代码?于是第一次想进,人就来了,也就是探索一下代码库,寻找那些彼此相关的代码,把这些代码都分进一个深层模块里。 你在进行接口测试,通过这个接口来验证。这其实也解决了另一个难题,当你的反馈循环已经正常运行,假设一切都开始步入正轨,那么你现在能交付的代码比任何以往都多的多, 但你的大脑却跟不上。在开发过程中,你可能会感觉比任何时候都更疲惫,而且浅层模块的代码库实际上让你的大脑更加吃力,因此深层模块更有必要。这种方式不仅让你更容易理解和阅读,还可以把这些模块当回合来对待。 而你设计接口,把实线交给 ai。 最后接出大神的话,希望这次的分享能让你在这个新的 ai 时代充满信心,这样你就能产生积极的影响。开源库放在评论区了,大家自取。

如果你最近开始用 ai 工具,一定会越来越常看见一个词,就是 getop, 就 别人给你发一个开源项目教程,让你去 getop 上面去下载 ai, 也经常让你看 readme, store issue。 很多时候很多人打开一开始就懵了,这不是程序员看代码的地方吗? 所以说这期我不会讲一些 getme, 也不会讲怎么写代码,我只想讲普通小白怎么用最简单方式去看懂 getop。 ok, 大家好,我是 fred, 专注从普通小白的视角分享怎么从零开始用 ai 和 web 口令提升自己的工作和生活的效率。 你会越来越常看到 github, 是 因为很多的 ai 工具插件,包括自动化脚本和开源的软件,都会把说明、下载、更新和问题反馈在这里。 对于普通小白而言,你可以把 github 理解为四件事,就是一个是找工具的入口啊,别人做好的工具 以及项目的说明书和使用前的这种判断的材料。所以说你要看的不是说哎这个项目代码写的有多厉害,而是这个东西有没有人维护,要不要账号,要不要权限,会不会碰到你自己的文件和数据。这样理解就比一个所谓的代码网站要好,理解非常多。 就很多人怕吉他,是因为他第一眼确实看起来很不友好,全英文的网站对吧?英文的文件名、按钮、标签、技术词就一下子全部堆在你面前。但是实际上你不用从代码开始看啊, 就更简单的方式,你把 github 当成一个工具的详情页,就像你看一个工具之前,你会先看它是干什么的,怎么用,别人有没有反馈,以及最近有没有更新, github 也是一样,所以说你不一定要会照这个工具, 但要会判断是它是不是你想要的,值不值,是,然后以及能不能让 ai 帮你先读懂。就如果用大白话来讲, github 就是 一个公开的一个项目主页,一个 github 的 仓库就是一个项目页面, 你要你先不用把它想成一堆代码,也不用着急去下载,而是把它当成一个工具和这一个项目的主页,它会告诉你这个项目叫什么,想解决什么问题,谁在维护,以及最近有没有更新, 所以说这一页只需要记记住这个理解就 ok 了。就仓库不是一个神秘的文件夹,它就是一个项目的页面, 而当你打开一个 excel 的 一个主页啊,其实就长这个样子,第一次打开这个项目,就你不用试图把所有的文件去读完啊,你就少这四个地方。第一个就是项目的名称 啊,然后一个一计划的简介,确认它到底在解决什么问题。第二,你可以看 readme 的 这个文件,它就是你的这个项目的使用的说明。 第三,你可以看它的 star, 就是 有多少人给他点赞啊, fork 就是 有多少人复制出来,以及最新的一些更新的时间,知道有没有人关注,以及最近是不是还在更新和改动。 然后第四个就是你可以看它的 issues, actions 和 release, 就是 看有没有问题的反馈,运行的记录和一些稳定的版本。就大家要注意的就是就 starts 很 高,只能说明它热度高,但不一定代表就它真的很安全,或者不一定代表它真的适合你, 然后呢?刚刚那一页解决的是看哪里?那我们这一页解决的就是要不要试的问题,你可以直接问三个问题,就是第一它到底有没有解决我的问题? 第二就这个项目到底有没有日常在更新一个二三年的项目,你可能完全不需要再去参考了。比如说第三,那就是我能不能先用一些测试的文件去小范围试一下, 如果前两个问题都解释不清楚,那就不用再花时间了。如果第三个问题也说不清,那就不要直接拿一些真实的文件,真实的账号或者一些重要的数据去跑, 这样你去看 guitar 的 时候就不是在去学一些技术的名堂,而是在做一个普通人的一个使用的一个判断, ok。 然后我觉得现在真正去降低 guitar 门槛的一个地方就是在于大家可以用 web coding, 因为你不用自己去硬读这种英英文的文档啊,你可以直接让 codex 去帮你把 guitar 翻译成你能够看得懂的一些话, 比如说你可以这样问,就是我不是程序员啊,就能帮我去 github 上面去找一些能够批量整理 pdf 表格的工具, 然后以及让它不要只给我链接,能够帮我去判断说它到底能做什么,怎么安装和使用它的 star 数,更新时间和依据,说明什么,然后会读取什么文件数据,有没有一些联网或者权限的风险,然后以及怎么去验证。 所以说这样子 ai 给到你的就不是一堆项目的链接,而是一个能不能用,怎么用,以及哪里需要小心的这样一个判断报告。 然后这里还有一个关键点就是你不要一开始就去搜很多的技术词,就很多小白会直接说,哎,帮我去找那种拍摄的爬虫,或者帮我去找一些什么项目,但实际上你完全不需要懂这些。更好的顺顺序是先说你想要批量整理 pdf 的 表格, 我要把视频转字幕,我要自动汇总一些公开的网页信息,然后让 ai 去找后选项目,然后让他去读懂 readme 和一些视例,然后再最终用一些测试的文件和脱敏的数据去跑一个小样,跑通之后再考虑自己要不要接入自己的工作流。 然后呢, github 也不只是可以放代码,就比如说之前我自己做了一个 store map 就是 门店信息的这种项目啊,就本质上就是把门店数据整理出来,再变成一个前端的看板。 那这种项目就可以在 github 上面去管理, pages 去发布页面, action 是 可以定期的更新, issue 是 去记录问题, release 去记录稳定的版本。所以说 github 也不是是程序员的一个代码仓库,它完全可以是我这样一个小白做这种清亮的项目的一个管理和发布的入口。 所以说最终总结一下,第一,把 gitap 当成一个项目的主页,不用先被这种代码啊去吓住。第二就是你可以看一些项目的名称, read me, 更新时间,然后再决定要不要试。 第三呢,就是你可以让 code 去帮你翻译成你能看懂的话,然后再用一些测试的文件和托米的数率数据去去验证。 最后呢,就是非常想强调一个点,就是免费开源就不等于它可以直接去运行,如果涉及到一些敏感的文件啊,账号啊,你的 api key 啊,或者一些权限啊,一定要让 codex 或者 cloud code 帮你解释清楚它会做什么,再决定要不要继续。 ok, 我是 fred, 后面我会持续用一些真实的案例告诉大家怎么把 ai 用到自己的工作流,我们下期再见。

前面分享了两期零基础使用和创建 skills 的 内容,还是有很多朋友有疑问,就是使用和创建必须要使用编程工具吗? 自己看到那些工具在配置的时候就已经被劝退了,本期我们分享更简单的方法,我相信很多朋友也接触过也使用过,那就是扣子,完全不需要任何代码,就和写提示字一样,就可以创建自己的专属技能。 开始之前我们再简单介绍一下什么是 scales, 我 们回顾一下,比如我们用 ai 生成内容或者是做分析的时候, 我们每次都要重复去输入格式,要求输入一长串的提示词,再次做同样任务还是需要再重新说一遍,那 scales 就是 把我们经常使用的提示词,或者是处理某件事情的流程生成一个 scale 点 md 的 文件, 把工作规范和要求全部写进去。当我们再次使用的时候,就不用重新输入长串的提示词,让 ai 记住我们每个人独有的工作习惯。下面我来举一个例子,一听就懂了,这就好比不用每次都告诉厨师,糖少许,盐适量,火候七成, 你只需要说老规矩,来份鱼香肉丝,这时候厨师就懂了这个老规矩,就是我们创建的 scale。 下面我们直接进入实操环节,就是手把手带大家去把我们常用的提日词封装成一个 scale, 下面我们来到扣子,然后选择扣子编程, 然后在这里我们选择技能,把我们经常使用的提示词粘贴过来,然后我们再给他指令,就是把以上提示词制作一个 excel, 然后我们直接发送,这时候他就已经开始制作了 啊,这时候就制作完成了,我们可以在左上角这里去改名称,比如我们加一个二零二六,然后我们还需要做一件事情,就是右上角这里的部署,然后我们选择开始部署, 部署成功之后我们选择立即体验,我们在这里就可以去调用我们刚刚创建的技能了,在这里我们让他写一篇文章,就是 以如何学习 ai 为标题,帮我写一篇 seo 文章,在这里我们使用了这个技能, 我们只需要给他关键词,让他帮忙写文章就可以,然后我们直接发送,他说先加载 s e o 文章写作的技能,这时候就已经调用了我们刚刚创建的, 当我们完成之后,他就会给我们一个 markdown 文件,然后我们可以点开看一下,这就是帮我们写好的。右上角这里我们就可以保存文件到本地 pdf markdown, 还有 word 文档。我们创建的技能都在这个技能商店里面,然后选择我的技能,然后我创建的,如果我们使用通过这里也是可以的,选择立即使用, 直接就引用了过来。还有一个简变方法,就是我们在输入框这里直接输入艾特符号,然后选择技能,然后再选择也直接引用了过来,是非常方便的,这就是创建和使用技能的所有方法。 本期我们分享在平台创建和使用 skills 的 原因,第一个就是零代码,完全不需要任何编程工具,就像写题日词一样简单。 第二个就是快速创建,就是把我们高频的题日词一键变成永久的技能,当创建好之后,这些都是我们可以重复使用的数字资产, 一次创建,永久受益。我们可以想象一下,你不仅可以创建内容创作的技能,还可以把周报生成器、会议机要整理等等这些所有重复的工作 都做成这样的技能。现在你已经成功地从重复输入者升级为了技能创作者。好了,这就是我们本期的所有内容,大家可以把自己重复的事情做成 skill, 只有多用它才能真正地变成你的生产力。 好了,本期内容分享就到这里,下期我将会分享另外一个使用 skills 的 方法,帮助大家找到合适的 ai 伙伴,我们下期再见。

代码写完了,测试全率了,审查通过了,然后呢?很多人就停在这里,东西能跑就行,分支留着就留着,下次再说。但 superpowers 告诉你,这不是结束,收尾和闭环才是专业和业余的分水岭。 这是 superpowers 深度教程的最后一集。 e p 八,今天讲最后两个技能, finishing a development branch。 完成开发分支,还有 writing skills 创建你自己的技能。而且咱们会在结尾回顾整个系列的八级内容,给你一张完整的十四技能全景图。 先说第一个技能, finishing a development branch 什么时候触发。当你所有任务都做完了,测试全率,代码审查也通过了, ai 会自动调用这个技能。它不再问你接下来做什么,而是直接给你四个明确的选项, 每个都有对应的清理流程。第一个选项,本地合并,这是最常用的。如果你的分支代码已经准备好进入主分支,选择 merge to main a 哀会先确认没有未提交的更改,然后合并清理工作区适合功能已经完全完成,测试通过,不需要他人审查的场景。第二个选项,推送并建 pr。 如果你的项目有 code review 流程,或者你想让团队成员看看你的改动, 选这个 ai 会促使分支到远程,然后创建 po request 适合多人协助项目,或者你想留一个正式的审查记录。 第三个选项,先保留。如果分支上的工作还没完全做完,或者你在等后端接口,等设计稿确认,但你当前想切换到其他任务,选这个 ai 会把当前状态保存好,让你干净的切走,不留半成品污染工作区, 这里有一个核心铁律,不允许半成品留在工作区。 superpowers 要求你每次结束工作的时候,要么把东西收尾干净, 要么清楚地标记为进行中,但先保留,不能有那种你也不知道这个分支是干嘛的状态。第四个选项,丢弃。如果这个分支的实验方向错了,或者你决定不继续了,选择丢弃, ai 会直接删除分支,清理所有相关的工作区文件, 不纠结、不内耗,干净利落,适合那些试试看但发现走不通的探索分支。这四个选项覆盖了所有收尾场景,关键不是选项多,关键是每次结束工作的时候,你必须选一个,不能什么都不选就跑了, 这就是闭环,每一次打开的工作都有一个明确的关闭动作好。第二个技能, writing skills。 这是 superpowers 十四个技能里最特殊的一个,它不是一个给别人用的工具技能,而是一个教你创造工具的原技能。 当你在 ai 编程中反复做同一类事情,比如每次提交前都要运行某个格式检查, 每次创建新文件都要套用某个模板,每次部署都要执行一串固定命令,这时候你就应该把这个流程写成技能。一个技能由四个部分组成,第一, s、 k、 i、 l l 点 md。 技能的入口文件 定义触发条件,当用户说了什么关键词,或者在什么场景下,这个技能会被自动触发。第二, c l、 a、 u、 d、 e 点 md。 给 ai 的 行为指令包括铁律、工作流步骤,不该做什么。 第三, references 目录放参考资料、文档、规则、文件视力。第四, scripts 目录放可执行的脚本, python 或 shell 都行。创建技能的时候有一个核心铁律,好技能向法律条文精确无歧义,可执行。 你说代码格式要好看, ai 不知道怎么执行,你说用 preiter 默认配置格式化所有 ts 和 t s x 文件, ai 就 知道怎么执行了。定义触发条件有两种方式,一种是关键词触发,用户说了包含某些词的话,既能自动激活。另一种是场景触发, 在某些文件类型被创建或者某些 get 操作发生后,技能自动激活。好的触发条件要精确,但不要太窄,太窄了,技能永远触发不了,太宽了,技能在不该触发的时候也跳出来。 技能的工作流要写成步骤,每一步写清楚在什么条件下执行什么动作,预期的输出是什么,出错了怎么处理。不是写散文,是写操作手册。纸上谈兵,不如看个实力, 咱们来做一个技能,叫代码格式化检查,需求是每次提交代码之前,自动检查所有 type script 文件的格式是否符合 prety 规范。第一步,创建 s k, i, l, l, 点 m d, 开头写出发条件,当用户说格式化检查,检查格式 format check 或者执行 git commit 之前触发本技能。 第二步,写 c l, a, u, d, e, 点 m, d, 这是 ai 的 行为指令。核心铁律写清楚, 只检查不改写,如果格式不对,报告差异,但不要自动修改,除非用户明确要求。工作流分三步,先用 npx printer check 扫描文件,如果发现不符的,列出文件和行号,最后问用户要不要自动修复。 第三步, references 不 需要放,因为这个技能很简单, scripts 可以 放一个 shell 脚本,把 prettier check 的 命令封装好,方便直接调用。 这个例子很小,但它展示了技能的核心,把一段你反复做的事定义成一个结构化的 ai 可以 自动执行的流程。你今天写一个小技能,明天就多了一个不知疲倦的 ai 搭档帮你盯着格式。 最后一步是验证,建完后自己用一次,看看触发是不是准确,工作流是不是顺畅,有没有奇异的地方。好的技能靠迭代不是一蹴而就。好技能讲完了,现在咱们站在终点,回头看看这八级走了多远。 ep 一, 全景认知咱们知道了 superpowers 是 什么,不是工具,是方法论。七步强制工作流十四、技能覆盖从需求到收尾的全链路,核心理念四个字,流程优先。 ep 二, brainstorming 设计先于代码 hard gate 硬门禁,没有设计文档就不许写代码,没有例外。九步清单, 从探索上下文到用户审批,每一步都不可跳过。 e p 三, writing plans 完美实施计划,铁律是 t b d 和 t o d o 一 律禁止考计划向乐高积木,每个步骤完整独立可验证。 e p 四, work trees 加 sub agent 工作区隔离与多代理开发。 get work tree 让每个功能独立运行在一个干净沙箱里。 sub agent 让多个 ai 代理并行干活, 两轮审查才通过。 e p 五, t d d 测试驱动开发红绿重构循环,没有失败的测试就不许写实现代码,先想清楚这个功能要验证什么,再写怎么验证, 最后才写怎么实现。 e p 六, systematic debugging 系统性调试四阶段调查分析、修复验证。没有根音分析就不许动手改 bug 不是 碰运气修,是定位到根音再修。 ep 七, review and verification 代码审查与完成前验证,自动派遣独立的审查代理。 critical, important, minor 三级分类,完成前最后一道关卡 verification before completion ep 八,就是今天分支收尾与技能创建四个收尾选项,保证每次工作都有闭环。 writing skills, 让你从技能的创造者把这八级串起来,就是 superpowers 的 十四技能全景图。 他们不是十四个孤立的工具,而是一条完整的链路,从需求到设计,从设计到计划,从计划到实施, 从实施到测试,从测试到审查,从审查到收尾,每一步都有明确的入口和出口, 每一个环节都有不可跳过的质量关卡。最后了点行而上的 superpowers 的 核心哲学三句话,第一句,不是更快,而是更稳。 ai 已经够快了,你不需要让它更快,你需要让它更可靠。 superpowers 所有技能的目的不是加速 ai 写代码, 而是保证 ai 写的代码是经过思考的,经过验证的,经过审查的。第二句,不是更聪明,而是更守规矩。 ai 已经很聪明了,但他没有判断力,他不知道什么时候该停,什么时候该检查,什么时候该问。 superpowers 给 ai 的 不是更多智商,而是一套什么时候做什么事的纪律,纪律写在技能里,技能就是 ai 的 操作规程。第三句,流程释放能力。 很多人觉得流程是束缚错了,流程不是束缚,流程是释放。当你不需要每次都决定下一步做什么, 当你有一套标准工作流可以依赖,你的大脑就被释放出来,去想真正重要的事情。 需求对不对,设计好不好?方案优不优?流程处理怎么做?你处理做什么和为什么。这三句话就是 superpowers 全部十四技能背后的底层逻辑。 八级十四技能,一条完整的 ai 编程方法练录。如果你是从一 p 一 一路看过来的,现在你已经不是一个用 ai 写代码的人了,你是一个知道怎么让 ai 在 你设定的框架里,按照你定义的流程达到你要求的标准的人。这两者之间的差距就是 professional 和 amateur 的 差距。 superpowers 在 github 上已经有十五万 star, 因为它解决了一个真实的问题, ai 编程的随机性。它不是让你多写代码,是让你少写反攻。当然,这个系列结束了,但你的 superpowers 之旅才刚刚开始, 因为你今天学会了 writing skills, 创建自己的技能。从今天起,你遇到的每一个最好每次都这样的操作,都可以变成你的专属技能。 你的 superpowers 工具集会随着你的工作越来越多,越来越好,别忘了点赞收藏这个系列,如果你觉得有用,分享给那些被 ai 编程随机性折磨的朋友。 superpowers 深度教程八集全部完结,咱们后会有期。

屁磕不上,一个没代码只有六十五行字的文件,凭什么狂揽一点六万星?因为他治好了 ai 写代码的三大绝症,前后被 ai 创始人卡帕西吐槽。现在的 ai 写代码,一爱瞎脑补,二过度复杂化, 三休 book 时总顺手把你的好代码改坏。于是大神把他的吐槽提炼成了四条给 ai 看的纪律手册,做成了 call m 文件,只要扔进你的项目, ai 立刻变乖。一句话总结,这不只是一个文件,更是一套顶级的 ai 工作流。把大神经验固化成系统纪律,你才能真正掌控 ai, 而不是被他牵着走。

用了一段时间 cloud code, 你 会发现有些事情在反复做,每次 t p r 都要解释代码风格,每次 code review 都要重复说按团队标准来, 这种重复不只是麻烦,更重要的是不一致。你需要一种机制,让这些工作方式被保存下来,随时调用 skills 就是 这个答案。 skills 是 可以被附用的指令集合,让你把固定的工作方式封装成一个命令。类比一下普通的 cloud code 对 话,相当于每次都写内联代码, skills 就 相当于把逻辑封装成了方法,写一次,调用多次。 skills 遵循 agent skills 开放标准,本质上是提示词,不是代码。 你写的是如何做的指令, cloud 读取后,用自己的工具来完成任务。 skills 解决三类问题,第一,重复性工作的标准化。 把每次都要说的话写进 skill, 保持一致性,一次修改,全职生效。第二,复杂工作流的封装。创建新微服务模块可能需要建目录、生成模板、注册、配置、创建测试, 把这些步骤写进 skill, 一个命令完成。第三,团队知识的沉淀。 skills 可以 放在项目目录下提交到 get, 让整个团队共享同一套工作流。新来的同事克隆仓库立刻就能用上团队积累的 skills。 每个 skill 是 一个目录, 核心是一个 skill 点。 m d 文件,文件由两部分组成, y a m l 配置区和 markdown 指令区。配置区写 name 和 description 指令区写 clod 要执行的步骤触发方式有两种,手动输入斜杠命令或者 clod 自动识别,并使用 description 字段,决定 clod 能否在合适时机自动触发 skill。 好的 description 要具体说明,触发场景太模糊会导致误触发或漏触发。有副作用的操作,比如部署数据库迁移,要设置 disable modal invocation, 这样只有你显示调用时才会执行,避免 close 自动触发危险操作。 skills 还支持参数传递,用美元 arguments 接收输入,实现动态指令。 用 context fork, 让 skill 在 独立子 agent 中运行,不污染主对话上下文。用 allowed tools 限制可用工具,只读 skill, 可以 放心在任何项目上运行。 最佳实践,每个 skill 做一件事,单一职责,职责清晰,有副作用的操作一律加 disable modelinvocation, 不 冒风险。把项目 skills 提交到 git, 团队共享,新人上手即用。个人通用偏好放全区目录,项目特有规范,放项目目录和 get 配置分工逻辑一致。 skills 的 核心价值是把临时的口头指令变成持久的可附用工作流,最大价值在于团队共享,把项目规范、背景、知识、标准、流程封装成 skills 提交到 get, 让整个团队共享同一套 ai 工作方式,这才是 cloud code 在 团队协助场景下的真正竞争力。

说一下这个全能开发,积累这个 skars 的 一个经验,你在面试时候面试我问你,那在企业开发上非常有帮助,那么我们开发中比较高频的场景,就是说我们肯定要传这个运行组或者 uic 稿,然后给这种,呃,这种 ai 工具嘛,让他帮你生成代码。 那他经常生成的有个痛点,第一是他首先是还原的不准。第二个,第二个问题呢,就是说 很多时候我们项目要保持一样的风格,对吧?他经常会不按照你项目的风格来改,比如说你要生成一个表格,他经常不按照你的风格来改,然后你你的项链可能有好几个页面其实都是同样的布局的,对吧?但他不会按照你的布局来,就是不会参考你的项目,那么 怎么办呢?对吧?我们就是首先装一个呃, create skills 这个相关的这个技能, 然后呢你就用这个,然后去跟他说,对吧?我因为我们比如说有个问题,你会发现他很难还原设计稿或者 ui 原型图符合你的要求,你可能问了半个小时,一个小时终于给他问出来了,好,那你现在就 问出来,之后,就在这个对话里面,你就用这个呃, create skill 这个创建技能,这个就是这个技能,让他帮你创建个技能,就是根据我的对话,对吧?我刚才问了这么半天才把东西问出来,对吧?我需要你还原设计稿,我需要你 啊,跟我的项目其他页面风格比较一致啊,你犯了这么多错,你终于把这个东西弄出来,请你把这经验总结成一个 sky, 然后他就会总结成这样一个 sky, 对 吧?然后呢?总结完之后呢?你还要什么呢?你还要跟他说明,对吧? 下次,对吧?我说你参考这个圆形图,参考这个 u i 界面,参考我其他的这个组键的时候,你就会要出触发这个 sky, 因为 sky 它是自动触发的,对吧?不可能让我们每次我们自己选 sky 去用,但太麻烦了, 你就要多设计这种呃低中高这种触发词,这样话你说,哎,下次你比如传个原图,哎,请参考原图帮我做一下,他就会自己去查看原图,查看你项目里面有没有相关的这种呃页面,有没有比较匹配的,让他去做,这样可以保保证风格一致,对吧? 然后呢,你这么总结出来之后呢?下次你再去写这种呃原型图,或者就有一个跟你页面里面可能比较匹配的页面,或者再增加一个新的页面的时候,他就去看你的就是你的项目里的页面,怎么实现呢?对吧? 那这样就会方便很多。你原来可能比如用一个小时终于问出来,这次你可能用可能用二十分钟半小时问出来,那下次呢? 你会发现你去用的时候,可能你还是得问一次或者两次才能把它问出来。 ok, 那 你这次问完之后,你再 跟在这个对话里面说,你看我这次又跟你问了一次,才把这个结果就问出来,对吧?才你才还原这个设计稿或者原设计,或者你才实现我这个功能,请你把这个经验再补充到我的这个之前的那个 speed 当中,对吧?对吧?因为我们之前创建了一个 speed 吗? 那么这一次你下次再用的时候,他可能就更开了,就是你用的次数越多,他的经验越多,他还原更准。就比如说你可能参考你的项目的某个源头还原,但是你这次比如说文字的字数比较多,他导致他换行了,对吧?那你之前那这个就是他没有考虑到点,那你要补充进去。哎, 我这次虽然按那个布局,是吧都还原了,但是因为我这里的文字比较多,导致我这个可能这个 label 换行了,你把这一点记下来,下次你要考虑到我的文字多,你也不能要考虑到换行不能换行那个问题,对吧?这样你问多了之后,下次你再去还原设计稿的时候,你再去还原原形图的时候,你再 需要有一个新的功能,新的页面,新的组建,让他加的时候,他就会去参考你你的项目里面的有没有相关的东西,这样可以保证风格匹配,然后呢?不局限匹配,对吧?因为你项目里面有的东西基本上已经做好了,对吧? 然后你就是包括还有就是你原型图里面,对吧?他可能那个展示的那个样式跟你的主页库不匹配,你的主页库里面可能比如说一个弹窗,他的标题, 对吧?他并不是在中间的,他可能在左上角默认的,对吧?就这种情况也可以补充,你会发现,对吧?你也跟他说啊,你这次不要要参考我的主见来做,下次他也会更更有经验。总之就是我们有一个这样的 skier, 这也是个前端比较高频的一个场景,对吧?你让他创业之后,你每次跟他说的时候, 他都会自动去调用了,对吧?然后越用经验越丰富,这样他越来越越明白啊,因为这个是比这个你写规则是要好很多的,因为规则是死的,你的项目,对吧?你的项目很可能是不一样的, 你的 ai 工具里面他有规则权局的规则,规则他,他太死板了,你发现没?就是,对吧?像这种 skier 可不一样了,你在迭代升级啊,规则可不是规则全剧死的,对吧?这种 skier 你 可以创建很多,对吧?那我们这个是专门用来还原原型图, ui 设计稿或者新增功能新增组建的啊,就是专门还原页面的,这种的话, 我认为,对吧?就是非常的就是有成长性,对吧?它可以不断的进化,对吧?那我们在其他功能里面还可以加一些其他 skier, 我 们再创建啊,这是我一个经验。当然如果说这样这样以后你再加功能的时候就越来越好用了,不至于说每次都是, 就是说你可能每次每个对话都是新的,对吧?那他就不知道那些东西,那我们自己建了个 sky 在 里面叠带,你下次在还原工作时候,他是越来越好用了,越来越好用,对吧?他虽然没有你的历史的记记录,但是他在还原页面这块,他这些东西他全记得有了 啊,非常好用啊,我们根据需求也可以创建很多 sky, 然后去叠带啊,这是一个还原页面的一个 sky。 当然如果说你的简历可能不太好啊,你的项目不太好,对吧?你的 各方面不太好,你也可以找我给你辅导。而且最重要的是我们创建这个 sky 是 根据我们专门匹配的,你会发现网上下的很多 sky 不好用,网上有钱的开发 sky 是 不好用的。