粉丝1991获赞1.1万

大家好,很多迹象表明,二零二六年人与人的差距将会快速拉大,关键在于你会不会让 ai 帮你干活,帮你赚钱。但有一些残酷的现实我不得不说,比如说很多人看到封面上几个陌生的英文单词就直接划走了, 有些人觉得他可以用网页版 ai 或者是 app 版的,就足以应付这个时代了。但实际上这和会用 ai 没有什么关系。 我的这个 cloud code 超神系列视频就是要帮助普通人认识到这个信息差,并且解决它。所以点个关注转发一下,就是对我最大的鼓励。那么我们刚说了,这俩的区别像什么呢?网页版 ai 其实是玩具,而 cloud code 是 印钞机, 能跑赢百分之九十九的人都在用后者。那么为什么差距这么大呢?因为使用 colosco 的 人都在用其中的一个 agent skills, 用它让 ai 直接操作工作目录,用工具自动化整个工作流程。拿我自己的例子来说吧,我出一个视频的要求很简单, 我要求只用一个早晨,从写稿到录制好发布,全部完成。为了实践这个高效的流程,我给自己做了三个秘密武器。首先,第一个是 ppt 生成器,它能从我的原稿自动生成口播稿,然后再生成 ppt, 甚至它连横版竖版的封面都能生成。 第二, cut x, 它其实是一个剪口播的一个技能,让我可以 one take 录完,比如说我什么废话呀,说错啊,重复啊,间隔,它帮我全剪掉。现在我已经实现了和其他付费的剪辑软件一样的功能,但是我还要继续优化,最终实现我能一键生成,不用人参与。 第三个字幕校对器,它其实是从 ai 生成字幕都开始,但是 ai 生成的字幕经常会有错吧,它还能一键修改,还会记忆那些经常容易识别错误的词。三招下去,一个视频的出版基本就完成了。 如果我再用 ai 来读稿,那差不多可以完全自动化,但是我觉得完全没有必要了。那么作给我最入门的方法是什么?其实非常简单。 首先我们需要通过这个 cloud code 里,通过这个 slash plugin 命令,然后添加一个 market space, 这样我们就拥有了 skill creator 这个技能。从此 cloud code 就 可以按照格式来帮我们生成技能。 在你的工作目录里,跟他直接对话,就说我该如何把一个视频生成字幕并叫对。你就算不懂技术,不懂工具链,你直接问他, 他也可以帮你做出来,他会给你一个完整的方案,中间那些复杂的脚本代码你完全不用管。他最后会给你生成一个可用的字母文件,然后提示 ai 使用 skill creator。 一 句话就可以让他从刚才的流程里总结出来一个 skill, 这非常简单对不对?你几乎可以不用操心吧, cologne code 都可以给你完整地做出来,不过这只是起步。真正让 cologne code 变成印钞机的是工具链。你的 cologne code 到底是一个傻的 ai, 还是一个能卖十亿 dollar 的 minus? 区别只有一个,就是工具链。 一提到工具呢,我希望大家忘掉 windows 的 图形界面,我现在说的工具链全部是命令行的。命令行有一个特点,就是它有一个一段文字的输入和一段文字的输出, 因为 ai 本身也是这样工作的,所以 ai 更擅长使用命令行工具。我的 ppt 生成器呢,是一个工具链,它先从脚本生成封面和结构,再编辑把内容加进去。我的字幕生成器呢,则是一个更加复杂的工具链。 我们来讲一个例子,首先我需要声明的是,这三个技能都是 ai 帮我生成的,我没有办法给你们去讲解这里面每一个脚本是怎么做,因为我自己都不知道他怎么做的,所以大家只需要看我们这个 是长什么样,你们心里有一个概念,你们自己去生成,就能知道他做的对不对了。我用一个比较复杂的例子吧,就是这个 subtitle, 这个是用来教这个 ai 生成字幕的,但是我这个人比较懒, 我家这个环境是这样子的,我自己本机是个麦克,我有一台 gpu 服务器,但是这个机子我平时不开,我会用这个脚本把这个 gpu 服务器唤醒, 唤醒完了之后,它会通过远程调用那个 whisper 去生成一个 srt 的 字母,然后再把它拷贝回本机。以前我自己要搞半天,我把这个视频要传上去运行命令行,然后再把那个 s r t 文件考下来。我现在觉得比较麻烦,我就直接全部做脚本了,而且这些脚本其实我只是提了个需求,我发现 ai 居然全都做出来了,执行结束之后就会产生一个 s r t 文件,你们看它这个做了好多排帧文件,它会自己做一个 fix, 就是 cv 文件,他把这个文件作为这个输入参数,然后经过一系列的处理,然后做一个替换,最后生成一个报告,然后他在这个 skill 文件里面也指示了一些他的这些常用的 规则,什么需要纠正,不要纠正这种语气词什么的,最后我会根据这个报告,如果需要迭代,就是我提出来让他迭代。 所以其实做 skill 就是 这么简单。但是在这个工作里,你必须有一个自己清楚的 sop, 这个你自己人已经用手动已经实现了很多次,你把它描述清楚,他自己会知道哪一步用哪个工具。当然你如果更厉害一些,你知道应该做什么样的工具,那就更快了。 所以这整个做 skill 是 非常简单的。如果你用过 n 八 n 或者 define 这类工作流的产品,那工作流有一个特点,就是它会有自己的逻辑来约束每个节点的输入输出。 你用 ai 调用工具练的话,可以实现和工作流产品完全一样的逻辑,就是每一个工具的输入输出,它其实都会约束 ai 的 随机性。怎么说呢?如果说 ai 输出了幻觉,工具会调用失败,然后 ai 就 会去纠正,然后继续直到 成功。工具除了本身的功能性,还有一个重要的作用就是让出现幻觉的时候快速失败。那么很多人说 ai 不好用,其实就是因为 ai 有 随机性,但是如果你学会了用工具来约束它的随机性,生成 skill, 你就可以放心的把这些任务交给他们。但是 ai 依旧还会出错,有时候还是需要一定程度的人介入吧,如果人参与的事太麻烦,就会拖慢效率。比如说我从来不 review 代码,因为太慢了。 这时候我们就需要一个评估系统,评估系统可以帮助你来确认 ai 的 生成物是否正确,所以最高级的做法,所有的评估系统都应该是由脚本生成,这样会很快嘛。比如说 ai 修改的字幕 有可能会不符合格式,那你做一个脚本来检测出来,如果出错就让他重做。评估系统也可以是非常方便的,可示化可操作的,由人来确认。但是很方便的东西。比如说简口播这件事, 假如说我现在这句话是废话,应该剪掉的话,那么 ai 会帮助我高亮出它,识别出来需要修改的部分,然后由我来确认,这就是评估系统。一句话来说就是提升 ai 确认 ai 成果的效率。 另外还有一件事就是你的 skill 都是需要不断迭代的,大部分时候 ai 流程都不是最优的,这导致你的任务会很耗时,而且费 token。 让 ai 能总结流程并更新 skill 也是一个很好的技巧。二零二六年,如果你可以扔掉那些网页, ai 开始用 cloud code, 那 么你已经跑赢了百分之九十的人。如果你学会去网上安装别人做的 skill, 那 你绝对不可能被这个时代淘汰。 如果你有一套优化自己工作流的方法论,那么你会在 ai 时代始终立于不败之地。 ok, 以上就是本期的全部内容了,谢谢大家。

cloud skill 到底是什么?应该如何使用?我们先来看一下效果。我在 cloud code 中输入了一段提示词,我要求 ai 读取一个 youtube 视频链接。这个视频是油管著名博主单口大神的一期视频,我让 ai 提取视频中的核心知识点, 并整理成一篇 obsidian 格式的 markdown 知识笔记,然后把视频中的知识结构用无线画布画出一幅知识结构图,最后把生成的知识笔记转换为电子书格式,方便我离线阅读。 我把这个指令发送给 cloud code 之后,我的双手就离开键盘了,完全由 cloud code 来接管这个任务。 color code 调用了四个 skills 来完成这个任务。这四个 skills 分 别是 youtube transcript, 也就是 youtube 视频的文案转录,还有 obsidian, macdunn 和 jason combs 这两个 obsidian 的 skill, 以及 macdunn to epub 这个电子书生成 skill。 我 们可以看到,在当前文件夹下,他先下载了视频的字幕文件点 v t t, 然后提取知识点,并拣写成 macdunn 知识笔记, 然后又用无线画布画出了知识结构图,最后生成了电子书文件。在任务全部完成之后,他还进行了自我检查,确认我要求的文件全部创建成功,然后才结束任务。 我们来检查一下生成的文件,首先字幕文件点 v t t, 可以 看到这是单口大神的原版英文口播字幕是带有时间戳的。我们再来看看生成的 macdunk 知识笔记和无线画布。我们把这两个文件放到 obsidian 中,首先看 macdunk 知识笔记, 笔记中是带有 obsidian 专有语法的,比如 copy 块儿,同时还建立了双向链接,我们可以在当前笔记中的知识图谱中看到它所建立的双链儿。 我们再来看无限画布,在 comics 文件中, ai 根据视频的内容画出了知识结构图。那最后我们用电子书工具打开 ai 生成的电子书文件,可以看到生成的电子书文件也是没有任何问题的, 所以你看,如果你看到了一个知识博主的视频,就可以用这样的方式,只输入一段提示词,就可以实现视频内容的下载和转录,生成知识笔记和结构图。这就是 cloud 为我们带来的智能体以及智能体的专属操作手册 cloud skill。 那 么今天我就用一期视频来快速带领大家安装并运行起来这个智能体整个过程非常的简单,而且我们还可以避开 cloud 的 严格的地区和网络限制, 哪怕你在中国大陆也一样顺畅使用。今天的视频分为以下几个部分,首先我们来快速的安装 cloud code, 并且使用兼容模型,绕过 cloud 的 账号和地区限制。 然后我们来看一下什么是 cloud skill, 以及如何在 cloud code 中使用 skill。 最后我会带大家浏览一些 astropic 官方发布的 skill 以及一些优质的第三方 skill, 大家完全不需要自己手写 skill, 很多常用的 skill 都是现成的,直接拿来就可以使用。那视频中的知识点和详细流程我都总结成了知识笔记。视频的最后会分享给大家,那我们就正式开始。 首先我们快速安装 cloud code, 第一步就是安装 node js, node js 是 我们的老朋友了,我在我之前的 n 八 n 和 m c p 相关视频中都使用过它。安装方式也很简单, 来到 note g s 官网下载之后,双击安装就可以了。安装完毕后,打开命令行窗口,输入 note 空格横线 v 和 npm 空格横线 v, 查看版本号,能够输出版本号则证明安装成功。 然后我们运行一个命令来安装 cloud code。 这个命令我已经展示在屏幕上了。如果你在这一步的安装过程中遇到了网络问题,那么你可以考虑使用网络加速,或者使用国内的 n p m 中转命令,我也展示在屏幕上了。安装成功之后, cloud code 就 已经在我们电脑上了。但是不要急,我们需要解决 cloud 账号的问题。我们都知道 cloud 对 地区的限制非常的严格,封号也很严重, 仅限欧美地区用户使用。那如果你身处欧美地区,并且能够成功申请 cloud 账户,那你现在只需要直接在命令行中输入 cloud 空格 log in, 然后再打开的浏览器中登录 cloud 账号,就可以使用 cloud code 了。 但如果你所在的地区不被 cloud 支持,那么我们可以使用其他兼容的大模型来解决这个问题。 目前类似智普 g l m deep sec 都推出了兼容 astropix 的 a api。 地址相关的官方文档我已经展示在屏幕中了。 我们在命令行中分别输入屏幕上的这三行命令,这三行命令的意思就是把 cloud code 的 背后所使用的大模型 url 和 api t 替换成智普 g l m 的 大模型。那这样一来,我们就不需要走 cloud 的 官网的登录,就可以直接使用 cloud code 了。 那另一种方法是通过修改本地的配置文件来修改这些环境变量。二指的原理是一样的,我已经把这种方法展示在屏幕上了。 在 cloud 的 全句目录下创建 settings 点 json, 把屏幕上的内容复制过去,把里面的 a p i t 替换成你自己的 a p i t。 a p i t 可以 在智谱的官网找到,然后在你的用户目录下找到点 cloud 的 点 json 文件,添加一个属性叫 has completed onboarding 值设置为处就可以了,大家可以自行修改。那么我们切换为 glm 模型,相比于使用 cloud, opus 四点五有什么优劣 呢?在性能方面, cloud 肯定是编程领域的 number one, 毫无争议,但是呢,它对地区的严格限制以及昂贵的价格是它最大的劣势。所以如果你对 cloud code 的 需求并不是那种产业链级别的需求, 要拿它做商业交付式的编码,那么你是没有必要非要使用 cloud 模型的。尤其是像我刚才展示的下载 youtube 视频并转载知识笔记这种任务,肯定是不需要使用 cloud 的, 类似 glm、 deepsea 这样的大模型足够胜任,并且它们的价格便宜,性价比高,网络和地区限制也非常宽松。所以这个方法目前是解决 cloud 的 地区限制的最好方法。 只有当你要做项目级的商业交付的时候,再去考虑用各种中转方式使用 cloud, 同时你要注意风险。 那么到此,我们的 cloud 的 code 就 安装完毕了。我们来到命令行输入 cloud, 然后回车, cloud 的 code 就 启动起来了,随便输入一个你好就能看到 ai 返回结果,那么就说明成功了。 我这里使用的是 glm 四点六模型,因为有免费额度啊,可以专门用来做视频。呃,目前 glm 最新的版本是四点七,性能非常强,大家根据自己的需求来切换模型就可以了。 那么接下来我们来看一下什么是 skill, 如何在 cloud code 中使用 skill。 我 们打开一个 skill 文件,可以看到它是 markdown 格式的,长得非常像我们平时使用的 ai 提示词,那其实它就是一个包含了详细功能指南的,更专业更详细的提示词, 通用的 ai 智能体,比如 cloud code, 它就像是一个刚大学毕业,智商很高,但是没有实际工作经验的大学生, 那它的技能是靠海量的训练数据。而 skill 就 像是给他写了一本专业级的操作手册,告诉他在遇到这样一个特定任务的时候,应该执行哪些操作。那有了这个手册, ai 就 成了这个领域的专家, 你也可以理解为在游戏中你的法师角色学习了一本技能书,什么暴风雪、火球树这些,那么火球树这本技能书其实就是 skill。 那 么我们来看一下如何使用 skill。 首先我们来到 cloud 的 全局目录,默认地址是 c 盘用户你的用户名点 cloud, 在这个文件夹下创建一个文件夹叫 skills, 全小写。然后在这个文件夹内创建一个文件夹,名字就叫 skill 的 名称,比如 markdown to epub。 很 明显这个 skill 就是 把 markdown 转换成 epub 电子书。 而 skill 文件夹内必须要有一个文件是 skill 点 m d, 其中 skill 这五个字母必须大写, 这个文件是必须的,我在屏幕上展示了一个文件夹结构,那除了 skill 点 m d 之外,还可以有一些资源文件,比如代码模板。 至于对于这个目录结构,大家了解一下就可以了,也不要觉得麻烦,因为就像我视频开头所说的,很多通用的 skill 我 们都可以下载得到,一般不需要自己手写。 我现在的文件夹里就是从 github 上下载了二十多个 skill, 比如 pdf, excel, word, ppt 的 相关 skill, 还有关于头脑风暴和前端设计的 skill。 我 们来简单看一下 skill 文件的内部结构。首先是原数据区,它的作用就是匹配用户的指令 属性, name 和 description 分 别代表 skill 的 名称和描述。 description 就 会被 ai 用于匹配用户指令,如果用户发出的指令与这个 skill 的 description 相匹配,那么 ai 就 会调用这个 skill。 那 只有第一部分,这个元素句式会在你发送指令的时候被 ai 读取, 那后面的内容只有在 skill 被调用后才会录取,是非常节省 token 的。 那接下来第二部分就是具体的指令,指令会告诉 ai 遵循什么样的要求去执行任务,这里的内容可以是具体的步骤,以及调用哪些资源和代码。 那第三部分就是资源区,列出 skill 需要用到的具体文件,比如 python, 代码、文档、数据等等,那这些资源就是我们在刚才的目录结构中放置的那些资源文件。 那么以上就是 skill 的 本质,我们在这里创建了 skill 之后就可以直接使用了。在这个 user 文件夹下的点 cloud 文件夹内创建的 skill 是 全局 skill, 你 也可以在你的项目文件夹中创建点 cloud 文件夹并放置 skill, 层级结构是一样的, 只不过这样的话,这个 skill 就 只作用于当前项目。我们来测试一个 skill, 我 这里有一个叫 frontend design skill, 前端设计啊,是生成网页的,这是一个 cloud 的 官方发布的 skill, 我 们在 cloud 的 code 中输入提示词, 为一家叫 nexus 的 ai 初创公司制作一个网页,风格要求是暗黑风发光渐变毛玻璃特效保存到当前文件夹, 然后回车,科拉的 code 就 开始运行了。这里他识别出了我的命令,然后问我是否要使用 frontend design script, 我 直接输入确定,然后他就开始设计网页了,过程中需要一定的时间,我就把过程进行了加速,那最后他生成了一个 index 点 html 的 网页, 我们把这个网页打开来看看,我们可以看到这个网页的样式设计的其实非常好,非常符合 ai 初创公司的风格。 呃,其实说实话,做视频的时候我都被这个样式惊艳到了,不愧是 cloud 的 官方的 skill。 呃,我之前视频里拿 jimmy 的 canvas 做的网页确实比这个丑多了,那么这样我们就成功执行了一个 skill。 那 么我视频开头展示的用一个提示词,让智能体下载视频字幕提炼总结成知识笔记,在无线画布中画出知识图谱,然后再生成电子书,这个任务大家就可以自己进行尝尝试了。 那视频开头我做展示的时候授予了 cloud 的 完全自主权,而不是每次调用 skill 都征求我的同意,想授予 cloud 的 这个权限,你可以在启动 cloud code 的 时候添加参数。那具体的命令是, cloud 空格横线横线 dangerously 横线 skip 横线 permissions。 但是就像这个命令你的内容一样, dangerously 危险。 cloud 有 了完全自主权就可以随意删除代码和文件了,你要谨慎使用这个命令,那我在视频开头完全是为了做展示才这么做 的。那接下来我为大家展示一些可以直接下载的现成的 skill。 首先就是 cloud 官方发布的 skill, 在 github 上,也就是 app 的 官方 github, 大家可以找到这个仓库。 另外一个我推荐给大家的是一个叫 awesome cloud skill 的 get up 仓库,这里面汇总了很多优质的 skill, 我 之前展示的大部分 skill 都来自于这两个仓库。 另外,如果你是 obsidian 用户, obsidian 的 ceo 最近亲自下场发布了三个 skill, 大家直接搜索 obsidian skill 就 能搜就能找到。 那我的下一期视频就会单独针对 obsidian 的 skill 来为大家讲解如何在 obsidian 中调用 cloud code 并执行 skill 来实现 obsidian 的 aia 任何功能。 那么以上就是今天视频的全部内容,大家现在就可以上手尝试使用 cloud code 和 cloud skill 了。视频内容中的知识笔记可以在我的个人简介和频道信息里找到我的个人主页地址,然后进行下载。大家如果在使用过程中有什么问题,可以在我的个人简介和频道信息里找到我的个人主页地址,然后进行下载。大家如果在使用过程中有什么问题记得点赞关注,谢谢大家!

现在最值得你立刻掌握的信息差,绝对就是 agent skill 很 离谱啊,三个月前,这玩意还没人讨论,结果突然一下就火遍全网了。 openai、 谷歌、阿里字节、全球这帮科技巨头全在疯狂跟进。我尝试一下,把这层窗户纸给你捅破。先点个收藏,这条视频值得反复观看。 首先问你个问题啊,你说为什么大部分人用 ai, 目前就是只能聊聊天,今天运气,今天运气好,他给你个惊喜, 明天稍微复杂点,他就给你乱编,驴唇不对马嘴。但 skill 不 一样,他不是跟 ai 商量,他是直接把高手的办事流程直接告诉给 ai, 第一步干啥,第二步调用谁,第三步怎么检查,全给你规定死了。 哪怕你完全不懂技术,只要你会套别人的 skill, 你 就在指挥 ai 用高手的脑子去干活。比如说,咱拿刚开源的这个视频剪辑的技能举例啊,他需要干的事是让 ai 把 youtube 长视频自动剪成带双语字幕的短视频, 不是纯搬运,咱通常管它叫长剪短。你想想人工处理需要怎么做呢?你得下载视频吧,八字幕一帧帧跳素材翻译成中文,配字幕剪辑,然后配视频标题。 这一套下来,熟手也得干两个小时,还得换三四个软件。现在呢,就一个动作,把链接往里一扔,回车,然后等待就行了。 他自己把刚才说的这些事都干了,成品直接到手,你自己发布就行了,甚至你可以再接一个自动发布的技能。所以回答刚才的问题,他凭什么火呢?就是他把干活这个事变成了确定性的。拥有了 skill, 你 就是拥有了一台印钞机,不 需要带脑子,不需要懂技术,你只需要按回车,然后验收。那最最爽的一点来了,就这种 skill, 其实压根用不着咱们自己从头写。现在有很多网站公开了技能,比如这个网站有七千多个 skill, 做 ppt 的, 剪视频的,写代码的,搞数据分析的,搞内容创作的,基本上你能想到的刚需场景都有人为爱发电给你做好了,而且全是免费的,直接站在巨人的肩膀上,他不香吗? 牛,是很牛,那这玩意到底怎么用呢?如果你有条件,我现在最推荐的就是用 cloud code, 你 把下载下来的 skill 文件夹往对话框里直接一拖, cloud code 自己就能识别调用,这绝对是目前体验最丝滑的方式了。 如果没有 cloud code, 用扣子也行,扣子里头有个技能商店,里面堆了一大把现成的 skill, 点一下就能用。当然,你也可以把 get up 上找来的 skill 上传进去,直接跑起来 听我一句劝,先别急着自己动手做,先把别人做好的好东西用起来,只要你用过一次,基本就停不下来了。二零二六年,咱们已经一脚踏进技能时代的大门了, 在这个时代,每个人都可以直接调用别人的技能,快速搞定以前想都不敢想的作品。你当然也可以创造自己的技能,把它分享出去,甚至拿去卖钱。技能就是接下来这个时代最硬的通货。关注我,接下来我会带着你把各行各业那些神级的 skill 一个一个拆解给你看。

好,朋友们好,本期视频我们一起来看一个开源项目,叫 u i u x pro max skill, 这个 skill 大家都很熟悉,像是 cloud 最近提出来一个概念, cloud 们 cp 很 火,慢慢的已经开始成为规范式了。那本期我们要介绍的是一个叫 u i u x pro max 这么一个开源项目,这开源项目大家可以看到,对吧?包括 cloud code, cursor, 温塞尔 artcraft, 对 吧?都已经开始接入了,包括我们最近很火的 kilo codex code code 这些主流的编程工具都已经开始,对吧?接入这个 u i u x pro max, 它的作用就是可以帮助我们 写出不同的这种配色风格的,这种 u i 主题可以完美的彻底解决我们 ai 生成紫色渐变的情况。 如果大家看不懂这个英文,很简单,就是他提供了一个中文版的开源项目,就这个中文的杠 c n, 对 吧?你看这个中文版的,这个官方也是一样的,好吧,好,我们可以看到他的作用就是可以帮助你去全人的设计这个, 这个,这个配色,包括这个 ui 的 风格啊,配色方案啊,字体配,对啊,现在已经提供了五十七种 ui 风格,就是你再也不用去跟他说,哎,我想要商务风格,我想要这个科技风格,你再也不用这样说,你想要什么风格,对吧?你直接去用, 用完之后就是这个效果,好吧,每个人都可以去复刻一模一样的效果,而不是说,哎,你沟通出一个黑色风格,他沟通出一个白色风格,这样很浪费时间,好吧,那首先我们来看怎么使用,第一个 它是美化我们 u i, 对 吧?那你要安装,点击安装这一章节你要安装,对不对?你直接从这里,首先你要如果直接使用的话,你通过这条命令安装切换到一个指定的目录,然后这个时候呢,你再指定你要的这个 ai 助手,比如说我是 cloud, 那 我就 使用这条命令,对吧?我就执行,或者你是 ctrl, 就是 这个地方,嗯,执行好,你执行完了之后呢,你去看它的版本是不是安装成功了?好,安装成功了,对不对?而且就使用了,你看怎么使用,你点下使用,你看, 首先如果是 cloud code 的 话,你直接跟他说,哎,我要去做一个什么样的产品,你我要一个什么样的风格,这个时候呢,他会自动的去调用这个 skill, 你 看你可以通过这些题的词呢去,哎去调,也就是说你前置步骤通过这些方法去安装,完成之后你再 去掉,这个时候就会自动掉这个 skill, 就是 这个 skill, 这个 skill 的 作用就是它会自动的将这些提示词呢啊,给你封装好了,比如说我要开发一个什么样的风格,你看这是这个 color skill, 你 点进去,你看它的数据啊,它就提供了一大堆的这种配色风格的样式,你可以看到它会自动的从这里面去, 哎,你看是吧?每种风格都列的清清楚楚,包括字体应该什么样式,这些就是它的这个字体风格的提示词,也就说相当于你去用了这个 skill, 就会自动的引用当前项目当中的 prompt 的 这个接字啊,是一个非常好的开源项目啊。那本期视频我们主要做一个介绍,因为时间关系啊,下期视频的话,我们将哎实际的用我们一些啊,一些项目做一个实操。好吧,那就本期视频的全部内容了,如果你也对这项目感兴趣的话,我们下期再见。

全网有三万个免费的 skills, 有 人说他会取代 m c p, 甚至替代扣子和 m m 之类的工资流。不吹不黑,我们来看看 skills 到底能够做什么。我们先来看看他的提出者, ospek 的 官方势力,可以制作 ppt, 写 word 文档,还能够做品牌设计,做网页,包含了办公室工作的方方面面。打工人狂喜, 先别高兴的太早,这里的技能和一般的软件功能完全不是一回事,把它用好是有门槛的。当你了解了它的工作运作机制之后,你就明白了 skill 是 怎么来的,他怎么就能够制作 ppt 呢? skill 里面最早是用在 coco 的 里面, 而 cloud code 的 核心能力是编程,但这只能够挣程序员的钱。而 safari 觉得这打够啊,只要是计算机打交道的,我全都要。所以他们就提出了 skill 这个概念,目的就是去扩展 cloud code 的 能力。那么如何扩展呢? 通常是先开发,然后再发布,但这个周期就太长了。 color code 本身就会开发,为啥不是因为需要什么,我就现场制作一个呢?当你需要制作一个 ppt 的 时候, color code 就 会为你现场开发一个 ppt 的 制作程序,然后去运行这个程序来生成 ppt。 而 scale 的 作用就是去告诉 ai 如何去生成这个 ppt, 其本质就是一本说明书,一个 ai 提示词包。但是从说明书到制作一个能用的 ppt, 中间有一条巨大的横沟,就像一本新手如何月入十万到我实际收入的一个距离。 所以 scale 最终的效果取决于 ng 的 与大模型是否足够强,以及使用者自身的能力。 有位人配合顶尖的模型, skill 的 天花板就很高,可以做出那种完整的自动化工作流,相反使用者的水平一般的情况下能够运行起来都相当的困难。接下来我们就以官方的 pdf 为视例,带你体验整个过程。 我们先来看一下这个 skill 它到底长什么样子啊?这个是 opcode 的 一个呃,官方的视例仓库,我们点开看一下, 然后在这个 skill 里面的话,它就是它官方的所有的这个 skill, 我 们随便点开一个进去,比如说像这个 pdf skill 的 话,它是一个提示词包,所以说它对整个这个结构的要求是很低的,只有这一个 skill 点, md 是 要求必须这么写啊,其他都没有做任何要求。然后再点进去之后的话,这里面有两个关键的,呃属性,一个是名称,另外一个就是描述没了, 其他的都不是必须的啊,那么这个对应的写法也是这样子的啊,就这样写的,就是用 markdown 是 没有格式的写法啊。为了让大家更加的理解 skill, 我 们就简单的来创建一个鲁班点 skill, 在 当前这个项目里面创建啊,那我们首先去创建一个目录,好,这就是我们当前项目啊,我们创建一个目录, 然后进到这个目录里面去去创建对应的这个内容, 好,非常简单,对吧?就是一个名称,一个描述,下面就是一段话,好,然后我们保存,打开 cloud code, 然后我们进来, 这个时候我们输斜杠 skills 就 可以看到有个鲁班啊,这个鲁班就是我们已经安装好的 skill, 整个项目里面就只有这一个 skill 啊, ok, 接下来的话我们就随便跟大模型说一句话,就是 hello 啊,那么这个时候的话,他就会把对应的这一个 scale 的 名称和描述全部发给大模型,哪怕这句话跟我这个技能毫无关系,他都会发啊,你装了多少个 scale, 就 会把所有的 scale 全部发过去。 然后我们来看一下,这个是抓包的啊,抓包的一个工具叫做 proxima 啊,刚刚呢,这条请求是这个啊,哈喽啊,如果你看过我之前的关于 m c p 或者是关于那个 color code 的 基础原理的讲解的话,就关于他的这个请求的话,应该是非常清楚啊, 但是有些同学可能是第一次听我的视频,那我还是把整个的 call 的 请求啊,再给大家讲一遍啊,我们把它复制到这里来 好,它总共是分为三个部分啊,第一部分是就是用户的提示词啊,你看用户说 hello, 然后接着就是系统提示词两段。第一段就是告诉这个模型啊,你是 color code 的 一个一个官方模型是用来解决程序员的编码问题的,然后这个就是你如何去解决这个编码问题啊,这就是你整个的系统提示词,非常的长。当然今天的重点是在这个兔老师工具列表 库拉库的话,它会提供十七个官方的工具啊,如果说你接入 m c p 之后的话, m c p 里面的工具的话,也会一起加入到这个列表里面去,相当于就是它的一个插件和扩展一样的。然后在这个官方工具里面就有个工具叫做 skill, 呃,在这个 skill 里面就会夹杂着你所有已经安装的 skill 的 名称和描述,就是你装的越多,这个 skill 里面会带的越多。 当那个大模型发现用户的问题和你的安装的这个 scale 名称或描述有一定的关联性,这个时候大模型就会去返回一个指令,要求这个 n g 的 去执行这个 scale。 比如说像我们刚刚对应的 scale 是 鲁班,那么这个时候大模型就会要求 n g 的 去执行鲁班这个 scale。 所谓的执行就是把鲁班 scale 对 应的那个 scale 点 md 文件发给大模型, 这就是所谓的执行 scale, 它没有别的作用,它就是一堆的说明书。好,那么到底是不是这样的,我们就来看一下啊。找到,在这个工具列表里面找到对应的 scale 那 个工具,这些都是它的官方工具啊,总共是十七个啊,在这里面我们找到了啊,这个 scale 好, 我们对应的这个 scale 的 描述里面就会带上 我们已经安装的这个 scale, 我 们把它复制到这里来,看起来不是特别好看,我们就把这个对应的杠 n 给它去掉。 ok, 好,大家发现没有,前面这一部分是告诉大模型怎么去使用 skill 这个工具,它包括里面相关的一些视力。最下面就是你已经安装好的所有的 skill 的 名称和描述,假如你后面安装了一百个 skill 好, 那么最后面的话就会跟上 skill 一, 描述什么什么什么什么 skill。 二,描述什么什么?你装的越多,这里面加载的越多,哪怕你发个 hello, 他 也会把对应的 skill 的 名称和描述一起发给这个大模型, 所以说我强烈大家安装 skill 的 时候一定要慎重的选择,要不然你的这个 token 哗啦啦的就就就没了啊。那么接下来的话就问一个跟我们当前这个鲁班 skill 相关的话题,比如说我问鲁班是谁,帮我打开他的个人主页,这个时候的话,模型就会发现鲁班大叔 用户提的这个问题,和他对应的去读取鲁班对应的这个 skill。 然后我们来看一下大模型要求 niger 的 去读取鲁班这个 skill, 但是你同不同意还得用户自己同意,我们可以再看一下对应的请求,对应请求在这里。好,这个是我们写的一个解析工具,如果大家有需要的话可以评论区留言,我直接发给你们,因为直接看这个接绳串不是特别方便,看这个就比较方便,你看这边这是它 之前的历史记录,这个是我新提出来的问题,对,在这个问题里面,我们会把对内这个 scale 给它加上,在 scale 的 内部里面再包含了鲁班大叔的对内这个 scale, 就 一层套一层。接下来我们要看的是它整个大模型的返回, 好,它返回的是一个 s s 一 的内容,我们就直接用我们的解析工具来看一下,大家发现没有,这个时候大模型会返回它的相关的一些思考, 同时最重要的是他要求 ng 的 去执行 skill 这个工具,去读取鲁班对应的这个文件,这个时候如果说我们用户同意了点,同意了之后的话,那个 ng 的 他就会去把鲁班这个 skill 点 md 文件 给给它展示出来,我们来看一下上面的全是历史记录,然后这里面要求去读取鲁班这个 skill, 所谓的鲁班这个 skill 其实就是去读取那个 skill 点 md 文件,然后把对应的这个内容 发给这个大模型,大模型拿到结果之后的话啊,他就知道下一步怎么办了,他就会告诉用户鲁班是谁,同时打开他的这个主页啊,看,这个鲁班主页刚刚已经打开了啊,这就是 scale 的 一个最基础的一个展示,我们就再做一个更复杂的这个展示,就是它的官方 cd pdf 的。 那么如何安装呢?最简单的办法就是把这个 pdf 整个目录,包括里面的所有内容全下载下来,把它放到那个 color code 的 这个 scale 的 目录里面去,这里我已经提前安装好了啊,这么一个 md 文件,我们把它转成 pdf。 帮我把 啊转成 pdf 啊,就这么简单,就开始慢慢请求吧,我们来看一下最终要多少条请求之后能够完成 啊。你看这里面他已经去访问了 sk pdf 这个 scale, 而且已经加载好了,逻辑是和我们刚刚访问那个鲁班的 scale 是 一样的,就是把对应的这个 pdf 里面的那个 scale 文件 发给大模型,就这么简单,它已经创建了一个 m d 点 pdf, 我 们这里面让它全自动执行。我们说过嘛,所谓的技能就是你需要什么程序,我就现场给你创建一个,再去运行这个程序,但是运行的过程可能会有出错啊,但是呢,一般像这种简单的话,大模型肯定会自动帮你解决啊。好,那么我们就让它慢慢跑 好,它已经生成了啊,生成了好,我们来看一下啊,它说已经生成了,我们来打开看一下, 哎哎,确实啊,已经生成了, ok 啊 ok, 好, 总结一下, scale 的 本质就是一本说明书,由 scale 点 md 和其他的文件组成。 scale 的 md 中有名称描述和两个原数据,其他都不是必须的。 然后原数据它会合并到 scale 工具的描述中, and 你 的每次请求都会把它带上,所以你的 scale 多了之后,你的 token 就 会爆炸。 大模型会根据用户的问题去匹配对应的技能,并要求 n g 的 去读取那个 scale 点 md 大 模型再给出解决方案,或者要求 n g 的 继续批录 scale 之外的其他的内容, 循序渐进,直到任务完成。另外,所谓的 scale 的 分层批录,其顺序是,一原数据。二、 scale 点 md 三、其他文件。为了检验大家是不是真的已经弄懂了 scale, 我 们来进行一场快问快答。 scale 能取代 m c p 吗? scale 相当于菜谱说明书, m c p 相当于菜勺工具,菜谱把菜勺给取代了。这个问题本身就很奇怪, scale 能够替代扣子 n 八 n 之类的工作流吗?短期不会,但长期看绝对是的,扣子二点零就是在朝着这个方向在走。 scale 本身就是构建程序,它的功能是没有天花板的,但是使用门槛很高, 需要有一定的工程思维才能够去组织那种复杂的工作流。普通人如何去使用 skill? 首先从一次性工具开始,不要去构建那种复杂的工作流。第二就是每天坚持用 ai, 提升自己对 ai 的 驾驭能力。三就是学习一定的编程基础,不需要你掌握细节,但要掌握编程思维,比如说数据从哪来到哪去,流程怎么出发的,下期讲什么? 下期我们用 skill 手把手的带大家做一个小红书的自动运营工作流,从抓取爆款到自动生成图章视频,全流程自动化,想看的同学点个关注,别掉队了,我是大叔,我们下期见。

最近 cloud code 非常火,相信关注编程 agent 的 同学应该都已经上手体验过了,不过要把这个工具从入门真正落地到生产环境,光会敲几个简单的命令是远远不够的, 所以这期视频咱们不整虚的,直接带大家从头到尾把 cloud code 的 实战流程彻底走一遍。这个视频呢,一共是分为以下四个部分,第一,环境的搭建与基础交互。 第二,复杂任务处理与终端控制。第三,多模态与上下文管理。最后呢是高级功能的扩展与定制,大家可以看到屏幕上密密麻麻的知识点和时间戳, 这期视频的含金量呢绝对是拉满的,只要你花点时间看完这期视频,我保证你能够彻底吃透 cloud code, 把它变成你手心里最顺手的生产工具。 另外我知道市场上还有其他类似的编程 agent, 比如 codex、 open code 等等,其实它们无论从功能上还是使用上都跟 cloud code 没有什么太大区别,所以我相信在看完了这期视频之后,你一定会一通百通,同类的产品基本上都能够直接上手。好话不多说,那我们直接开始。 首先我们来到 cloud code 的 官方网站,就是这个页面了,然后呢,我们点击这里面的复制按钮,再回到终端粘贴,这样呢就开始安装 cloud code 了。 安装完成后,我们试着用它来做一个代码软件。首先使用命令 m k d i r 来创建一个目录,就叫做 my to do 就 好了,我们所有的代码呢,都放在这个目录里面, 然后我们进入到这个目录里,再执行 cloud 这个命令来打开 cloud code。 刚进来的时候, cloud code 可能会提示你进行登录,如果你像我这样没有被提醒的话,可以执行杠 login 命令来主动触发登录流程。 呃,可以看出啊, cloud code 官方一共是提供了两种标准的接入方式。第一种呢是订阅制,如果你购买了 cloud 的 pro 或者是 max 会员,那就直接选这个就好了。第二个呢是使用官方的 api key, 按照 token 的 用量计,费用多少花多少。 我呢是订阅用户,所以我选择第一项。选择之后, cloud code 会弹出一个网页提示,我授权,我们同意。 可以看出登录成功,我们关掉当前页面,回到终端,这里按下回车登录呢,就结束了。这里顺便提一下, 有些同学可能没有办法使用 cloud 的 官方订阅或者是 api, 这个时候呢,你也可以使用国产模型来驱动 cloud code, 比如说是 g, l, m, mini, max 等等。 cloud code 是 一个通用的编程 agent, 它本身其实并不跟 cloud 的 模型绑定,你完全可以使用其他的模型来驱动 cloud code。 具体使用国产模型的方法呢,这里就不再赘述了,其实很简单,设置几个环境变量就行了,网上一搜一大堆, 有需要的同学可以自己搜索一下。好,言归正传,我们再回到 cloud code 这里开始使用它。前面的我们说过,我们要做的是一个代办软件,那我们现在就把这个需求告诉 cloud code, 让他帮我们实现。给我做一个代办软件,使用 html 实现。可以看到 cloud code 开始工作了,让我们稍作等待。 cloud code 想要创建一个叫做 index dhtml 的 文件,询问我们是否同意, 这里面呢?一共有三个选项,第一项 yes 是 单词授权,意思就是说只同意创建当前的这么一个文件,如果它接下来还需要创建其他文件的话,它还会再次向我们询问确认。 第二项呢是 yes allow all edits during this session。 选中了它就意味着在本次的对话期间,后续所有的文件操作都会自动通过,不会再反复打扰我们。 第三项是不同意,选择了它之后,你可以继续输入你的想法, cloud code 会根据你的输入生成代码,并再次向你确认。呃,为了演示方便,我们这里就选择第二项,开启自动模式,把后续的工作全权交给他 好。选完之后注意看,输入框下方多了一行字,就是这个 accept and it's on。 这个呢,就表示目前的自动同意模式已经开启了。那如果说你后悔了,想换一个模式怎么办呢? 这个时候就要用到 shift 加 tab 键来切换模式了,我们来按一下试试看。现在变成了 play mode, 也就是规划模式,这个模式主要用来探讨复杂的方案,只聊天不执行。具体用法呢,我们后面再细讲。我们再按一次, 注意看,底部的 play mode 消失了,取而代之的是一行灰色的提示问号 for shortcuts, 也就是按问号显示快捷键。大家千万别误会,这个呢并不是什么快捷键模式,这行字呢,只是 cloud code 的 一个小提醒而已,跟当前的模式没有关系。 呃, cloud code 其实在这个时候没有标注当前的模式,而这种没有标注的模式就是默认模式。 不知道你还有没有印象,我们刚进入 cloud code 的 时候用的就是默认模式,在默认模式下, cloud code 表现的最为谨慎,每次创建文件或者是修改文件的时候,它都会先去询问用户的意见,所以大家看出来了吗? shift 加 tab 就 在这三种模式之间循环,让我们稍微总结一下。 第一个是默认模式,也就是显示问号 for shortcuts 的 那个模式,在这个模式下,创建和修改文件之前一定会询问用户最为稳妥。 第二个呢是自动模式,也就是那个 accept edit on, 在 这个模式下, cloud code 会自动创建或修改文件,不会去询问用户,最为方便。第三个是规划模式,也就是那个 plan mode on, 这个模式只讨论不修改文件,适合构思 这个模式,我们后面会详细解释。好。这个呢就是 cloud code 的 三种模式了,我们再按一次 shift tab, 来到 accept add its on 模式。选择好模式之后,我们再回头看看之前 cloud code 给我们写好的文件,我们要打开它, 那怎么打开呢?你可以去文件管理器里面找到这个文件,双击打开它。不过这里我想要教另外一个方法,我们可以直接在 cloud code 里面执行终端命令来打开它。首先呢,我们输入一个叹号, 看 cloud code 有 反应了,现在我们处在 bash 模式下,可以运行任意的中断命令了。紧接着我们来输入 open index 点 html 来打开这个 html 文件 代码。软件做的还算不错,一次成功,这不得不给 cloud code 点个赞。不过这里面有个小坑,他把所有的代码都写到 index 点 html 里面了, 小项目还好,要是项目做大了,维护起来简直是个灾难,所以咱们最好趁早是换成 react, type script 和 white 这种现代架构,把代码分模块儿管理, 我们可以直接向 cloud code 提出这个请求,让它改掉。不过呢,改架构是个大工程,最好是先确定细节再动手。这个呢,就是 play mode 登场的时候啦, 它就是专门用来讨论方案,确定细节的。让我们先关掉当前页面,回到终端这里,然后按一下 shift 加 tab, 进入到 play mode。 然后呢,输入我们的请求,将当前的代办应用重构为使用 react 加 type script 加 white 的 项目。 呃,问题到这里还没有结束,这个时候呢,我们想换行。怎么换行?敲回车吗?敲回车显然是不行的,敲回车的话,我们的问题就提交了。换行呢,是需要按 shift 加回车,然后我们就可以继续写了,保留所有的现有功能。 呃,这里顺便提一句,如果你按 shift 加回车不好用的话,那你大概利用的 cloud code 版本比较旧,需要升级一下。 呃,另外还有一点,有些同学可能会觉得这个终端的输入框实在是太难用了,想用一些比较现代化的编辑器来替代它。这个呢,其实也是可以的,我们可以按一下 ctrl 加 g, 这个时候 cloud code 就 会打开一个 vs code 的 标签页,在这里面编辑就方便多了,回车随便按,也不用担心不小心提交问题了。当然,这要求你先事先装好 vs code, 我 们就在这里把要求补充完,再加一句,且 ui 风格保持一致。 写完了之后,我们保存,然后关掉这个标签页。此时 cloud code 就 会把 vs code 里面的内容全部放到输入框里面,我们直接再按个回车就可以提交请求了,可以看到 cloud code 开始工作了,让我们稍等一下, 计划似乎是产好了,我们把滚动条往上移一移,看一看它这个计划具体是个什么样子的。 这个计划呢,是从这里开始看起来还是挺完善的,目标项目清单、目录结构之类的信息全部都有覆盖。到最后他询问我们是否要执行, 他一共给了我们三个选项,第一个是执行计划,并且进入到同一模式,后续修改文件前就不再询问用户了。 第二个也是执行计划,只不过后续会使用默认的模式,也就是说之后每次写完文件前都需要询问用户。第三项是继续修改计划,如果你对计划不满意的话,那可以在这里面继续输入, cloud code 会根据你的要求再修改这个计划,产出一份新的。 这里假设我们对计划不满意,选择第三项提出我们的修改意见,给每个蛋白事项增加一个优先级,比如高中低,并且用不同的颜色标记出来。然后我们按一下回车,这个时候呢, cloud code 就 开始修改它的计划了,让我们再稍微等待一下。 好, cloud code 又产出了一份计划,具体内容呢,我们就不看了,单从最后的测试部分我们就可以看到,它确实是把我们的优先级的需求考虑进去了,这次差不多了,要不我们就同意吧。 让我们选择第一项执行这个计划,并且进入到自动同意模式,也就是说后续修改文件的时候就不要再询问我们了。好,回车可以看到当前模式切换到了 accept edit it's on, 没问题,这个呢,跟我们的选择是一样的,后面写入文件的时候呢,便不会再麻烦我们了。 现在 cloud code 开始执行计划了,时间估计会比较长,我们慢慢等待一下。 cloud code 暂停了,他现在想用 m k d i r 来创建目录,然后询问我们是否同意。 稍微等一下,这个是什么情况?我们不是跟 cloud code 说过了吗?不需要每次都询问用户的。还记不记得我们是在 accept add it on 这个模式下面,那怎么现在又开始询问了呢? 对,我们确实是说过,不过那只不过是写入文件的时候,不需要询问用户,这个呢,是在执行终端命令。 cloud code 认为执行终端命令呢是一个比较危险的操作,所以需要征得用户同意才会继续。 不仅如此,这里面还没有一个自动执行所有终端命令的选项,即使是第二项,那只不过是告诉 cloud code 以后都可以自由地访问 s r c 目录,不需要询问用户。至于执行别的命令,那还是要问的。 如果你觉得每次选择都太麻烦的话, cloud code 其实是提供了一个比较隐蔽的选项,可以跳过这个选择的步骤,让它想执行什么命令就执行什么命令。这个呢,是需要在启动 cloud 的 时候加上一个选项,叫做 dangerously skip permissions。 我 来给大家新开一个终端标签页演示一下。 我们先进入到原来的这个 my to do 目录里面,然后我们来输入 cloud, 再加上 dangerously skip permissions, 意思就是跳过所有的权限检测,大家注意看这个参数里面的单词, dangerously, 也就是危险的。 官方把危险两个字写在了脸上,意思非常明确,一旦加上了这个参数, cloud code 就 彻底放飞自我了。 进来之后你会发现模式变成了 bypass permissions, 这就意味着接下来它执行任何终端命令都不会再征求你的意见了,无论是安装依赖还是删除文件还是创建目录,都不会再问了。 这个呢,其实是一把双刃剑,往好了说,它能够极大地提升开发效率,全自动干活,不用你一直盯着点。同意, 但是往坏了说,他理论上呢,就拥有了和你一样的终端权限。虽然 cloud code 只有在极度发疯的情况下才能去破坏你的电脑,这种概率呢,可以说是微乎其微。但是作为一个负责任的博主,我必须要提醒大家,这个选项会让 cloud code 彻底的放飞自我。所以理论上呢,还是有一定的危险性的, 是否要为了效率承担这一丢丢的理论上的风险?决定权是在你们手里。好,演示完毕,回到我们原的例子里,我们呢,还是不用这个选项了,我们来选择第二项,只同意它以后可以自由地访问 s r c 目录。回车让 cloud code 继续。 cloud code 询问我们能不能执行 n p m 引导命令,我们选择以后都同意。 这里 cloud code 想要使用 npm run dev 来启动服务器,启动了服务器就可以查看网页的效果了,启动也行。不过呢,这里我们先取消,待会我想用它来给你演示如何手动启动它,并且借这个机会来解释任务相关的一些概念。 cloud code 看我们拒绝了,在询问我们应该要做什么,我们来跟他说一下这个命令呢,等会我自己执行,你确保其他部分都完成了就可以了。然后呢, cloud code 就 开始确认了,好,确认完毕,看起来一切正常。现在我们就可以自己来运行这个命令了,我们来试一下 服务器启动成功,我们来点击这里面的链接,看一下效果怎么样。不错,效果还可以,我们来随便点点,看起来没有什么问题,增加个代办事项也是可以的。 然后呢,我们可以再增加一个其他的代办事项,调一下优先级,再添加,一切完美,我们再回到 cloud code 这里,这里有一点需要给大家强调下, 这个服务的运行呢,是会堵塞 cloud code 的, 比如说我们在这里输入一个 hi, 你 看 cloud code 没有给我们任何回应,那是因为服务还在运行, cloud code 就 没有办法处理这个新的请求。那怎么办呢?很简单,看这里按 ctrl 加 b, 可以 把这个服务放置在后台,我们按一下试试, 好像是起作用了。 cloud code 开始处理我们的请求了,它给了我们一个回复,而且注意这里有一个后台任务正在运行, 我们输入杠 tasks 就 可以查看这个任务。在这里面可以看出,这确实是我们所启动的那个 npm run dev 的 命令, 注意这行提示,按 k 可以 关掉这个服务,不过我们目前还不打算关掉它,我们按 esc 回到原来的那个界面里面,就让这个服务先一直跑着吧,这样的话呢,我们后续的修改也能够实时看到效果。 那现在假设我们想加一个切换语言的功能,目前使用的是中文,我们希望它能够在右上角切换为英文,让我们来输入请求,在页面右上角增加一个切换语言的选项,用户可以选择中文或者是英文,默认为中文。回车, cloud code 开始运作了,让我们稍作等待。 好,可以看到 cloud code 改完了,我们回到页面这里看看。效果不错,确实是加上了切换语言的选项,而且切换的效果呢,也是符合预期的。 不过你转念一下,不对,我的用户都能看懂中文啊,我加这个功能干什么呢?要不就回滚吧。 好吧,那 cloud code 能回滚吗?当然是可以的,对应的命令呢,就是 go reverse, 或者是说呢,有个更简单的办法,你可以直接按两下 esc, 这样呢就进入到了回滚页面。我们每次输入请求的时候, cloud code 都会创建一个回滚点,比如说我们不是想回滚到增加语言选项之前的那个版本吗?那就选择这个回滚点就好了,选好之后按下回车。 然后呢, cloud code 会给我们四个选项,是回滚代码和绘画,还是说是只回滚绘画还是只回滚代码,或者说呢,我们就放弃回滚,我们来选择第一个代码和绘画都回滚。 好,现在回滚成功了,让我们来验证下。打开页面没问题,确实是回滚成功了,没有那个切换语言的选项了,是不是很棒呢? 好,假设,这个时候啊,你觉得 react 加 type script 加 white 这套架构好像是有点过于复杂了, 你在想要不干脆我们就回滚到只有 index 点 html 的 那个版本就好了。好,那继续用回滚功能就行了。不过呢,在这之前,我们最好把 npm run dev 这个后台任务给关掉,毕竟回滚之后相关的文件都没了,这个后台任务呢,也就没有什么用了。 我们回到 cloud code 这里,输入杠 tasks 来查看后台任务,然后再按 k 结束掉当前的这个后台服务。 呃,这个时候 cloud code 提示我们开发服务器运行正常。这个呢,纯属是 cloud code 晕了啊,大家忽略它,我们的开发服务器现在实际上已经被关掉了。服务器关掉之后,我们就可以开始回滚流程了,先按两下 esc, 然后选择一开始重勾代码的那个回滚点。 然后呢,我们再选择第一项恢复代码和绘画。好看起来呢,是已经回滚完成了。我们来看看当前目录下是不是只有 index 域是天秒这个文件。我们使用 ls 这个命令, 这个命令呢,可以用来列举当前目录下的文件列表运行。看结果好像是不太对啊,除了 index 底下是天秒文件,这个目录下还有很多其他的文件,它默认只显示了一部分,我们可以按一下 ctrl o 来显示所有的文件列表, 看起来总的文件数量还不少呢。这个是怎么回事呢?难道是 cloud code 出 bug 了吗? 其实不是,这些文件呢,是之前用终端命令创建的,比如说是 m k d i r n p m install 之类的 cloud code 呢,只能回滚它自己写入的那些文件。至于由终端命令生成的文件, cloud code 是 没有办法回滚的。 所以呢,我建议大家还是不要太依赖 cloud code 的 这个回滚功能了,如果要精准回滚的话,大家还是使用 git 会更好一点 好。不过呢,问题其实不大, index html 呢,是 cloud code 自己把控的,所以呢,这个文件一定是回滚成功了,我们把别的文件都删掉就行了, 说干就干,让我们打开文件管理器,删掉除了 index html 之外别的文件。然后呢,再回到 cloud code 这里,执行一下 ls 命令,可以看到文件确实只剩一个了。然后这个时候呢,我们可以使用 open 命令打开这个 html 来验证一下它的效果。 没问题,跟我们之前的那个 index 表 tm 的 效果呢是一样的,到这里回滚才算是彻底结束了。好,回滚呢,我们就讲到这里,现在假设你对 cloud code 做的页面一直都不太满意,所以呢,你去 figma 上面自己画了一个界面,就大概是这个样子的了, 你希望 cloud code 仿照这个界面来做,那具体该怎么实现呢?很简单,我们只要把这个设计稿图片传给 cloud code 就 可以了。首先我们需要在 figma 上面操作下,把当前的这个设计稿导出为一个 png 图片, 导出的方法很简单,就按这个 export frame 就 可以了。然后呢,我们回到访答这里,可以看到图片导出的非常成功,下面我们的任务呢,就是把这个图片传给 cloud code。 那 怎么做到这一点呢? 有两个方法,其中第一个方法就是直接把这个图片拖到 cloud code 这里,看到这里面的 a 位二了吗?这就代表 cloud code 已经接收到我们的图片了,这个呢只是其中的一个方法。还有另外一个方法呢,就是复制这个文件, 然后来到 collab 这里,按 ctrl 加 v 粘贴。注意啊,这里面我说的这个快捷键呢,是 ctrl 加 v, 不是 command 加 v。 即使你用的是 micros, 你 也要用 ctrl 加 v 来粘贴这个图片,按 command 加 v 是 不起作用的, 这一点要记住了。这样呢,我们就可以继续输入请求,让 collab 根据图片来修改代码儿。 具体的过程我就不演示了,这个方法肯定行得通。不过说实话,很多时候呢,可能还原的并没有那么精确,比如说字体啊,间距啊之类的, cloud code 很 难通过图片做到非常精确的把握。 所以这个时候呢,我们其实还有另外一个方法,一个更为精确有效的方法,那就是使用 m c p 来实现这个还原 figma 设计稿的需求。 m c p 是 大模型与外界沟通的渠道,我之前讲过 m c p 的 使用方法和相关原理,感兴趣的同学可以自己看一下。 figma 提供了一个很好用的 m c p server, 我 们可以接入进来用用。首先呢,我们是需要安装这个 m c p server, 根据 figma 官方的要求,我们需要执行这一行命令, 因此呢,我们先把它复制一下,然后回到 cloud code 这里,先按两下 ctrl c 退出,然后执行这行命令。 可以看到, mcp server 已经是安装成功了。之后呢,我们需要重新打开 cloud code, 不过好像之前的对话全都没了呀,这可怎么办呢?别担心,我们可以使用杠 resume 命令来回到之前的对话。这里面的第一个就是我们刚才的那个对话了,我们按回车来选择它,你看这个对话不就回来了吗? 呃,另外啊,还有一种更为简单的办法,那就是在启动 cloud code 的 时候呢,加上一个参数,我们来试一下。首先退出 cloud code, 然后呢我们执行命令 cloud 空格杠 c, 这里面的 c 呢就是 continue 的 缩写,它的功能就是打开 cloud code, 并自动恢复上一次的对话。好,对话恢复了,我们执行杠 m c p 命令,来查看目前所安装的 m c p 工具, 目前呢只有一个,就是我们刚刚安装的 figma, 可以 看到我们需要健全才能够使用这个工具。我们来选择这个 m c p 工具,然后呢再选择 authenticate, 这个时候呢会自动弹出一个页面,让我们授权我们同意, 然后再回到 cloud code 这里执行杠 m c p, 选择 figma, 这个时候呢可以看到 m c p server 呢就是一个可用的状态了。我们选择 view tools, 就 可以看到这个 m c p server 内部所包含的工具列表, 其中有用来截图的,有创建设计规则的等等,具体呢我们就不看了,我们其实也不用太关心到底该使用哪个工具来完成我们的需求,我们让 cloud code 来判断, 所以呢,我们按 esc 退出这个界面,然后输入我们的需求,修改当前的页面,使它与 figma 搞件保持一致。啊,问题还没完,我们现在回到 figma 页面这里复制这个设计稿的链接, 就点击这里面的 copy link to selection 就 好了。然后呢再回到 cloud code 这里粘贴,再回车,这样呢应该就可以了,可以看出 cloud code 开始工作了, 它首先呢是发现了我们的 figma m c p 可以 解决这个问题,请求调用 get design context 这个 m c p 工具来实现,需求我们同意, 然后呢, cloud code 请求调用 get screenshot 工具获取对应设计稿的截图,我们也同意。 现在调完两工具之后呢, cloud code 就 获取到了全部的设计稿信息了,其中不仅包括设计稿的截图,还有各种组建的间距、字体样式等,非常的详细。拿到这些信息后, cloud code 就 开始紧锣密鼓的修改现有的 html 代码,使它与 figma 设计稿相同,让我们稍作等待。 好,看起来是完成了,我们来到浏览器那边看一下效果怎么样。 这个呢,就是 cloud code 根据 figma 设计稿所搞出的页面,我把原始的设计稿也放在这里,大家可以比较一下,看看效果怎么样, 反正我觉得还原程度还是挺高的。当然这个页面还有一些细节需要打磨,比如说里面的 undefined, n a n 之类的,可能需要修改一下,但整体效果我觉得真的还是可以了。 好,那 m c p 呢?我们暂时就讲到这里,下面我们来看一下上下文压缩。在之前我们写了很多的代码,然后 cloud code 呢也调用了很多的工具,相信这个时候呢, cloud code 的 上下文里面就有了非常多的信息,这里面有一些是有用的,有一些其实没什么太大用处, 我们可以根据需要对上下文做一些压缩,这里需要用到的命令是杠 compact, 我 们可以直接去执行这个命令,也可以选择性的在它后面追加一些具体的压缩策略,比如说是重点保留用户提出的需求之类的。 呃,不过我们就不在后面加需求了,我们就直接执行这个杠 compact 命令,看一下它的效果怎么样。 压缩完成了,我们按一下 ctrl 加 o, 就 可以看到压缩后的上下文内容,这个呢就是压缩之后的结果了。 呃,我们之前呢,在上下文里面有很多的信息,有代码,有 m c p 的 调用结果之类的,现在呢,全部的内容就只剩这么一点了。 这样的话呢,不仅 cloud code 的 性能有了保障,后面在执行任务时, token 的 消耗量也会少很多。好,现在我们按一下 ctrl 加 o, 再回到原来的这个界面里。这里再提一下关于上下文的另外一个命令,就是这个杠 clear, 他呢做的更为极端,就会直接把所有的上下文内容都给清空掉。一般来说,如果我们后面的任务跟之前的上下文并没有什么关联的话,我们就可以使用这个 clear 命令来清空所有的上下文内容。 这个命令我们就不演示了,毕竟我们还需要之前的上下文,演示了之后,那就什么都没了,我们还是保留这个压缩后的结果好。现在压缩完成了,但是压缩结果的可控性并没有那么强,比如假设你想手动改改这里的压缩结果, cloud code 可并没有给你提供这个选项。 另外,无论亚不压缩上下文呢,都跟某个绘画绑定,我们下次进入到 cloud code 的 时候,还必须要来到这个绘画,否则 cloud code 是 不知道之前发生了什么的。那有没有什么办法可以解决这些问题呢? 有没有一种方案可以让 cloud code 每次进来的时候都读取一些我们自己设定的一些信息,这样 cloud code 就 知道这是一个什么项目,用户有什么需求,我们甚至可以把各种注意事项都写在这里面。了解了这些信息之后, cloud code 就 可以更好地为我们工作了。有这种方案吗? 当然是有的,这个呢就是 cloud d r m d。 我 们来尝试使用一下,我们首先让 cloud code 自己生成一份 cloud d r m d 文件,用的是杠 in it 命令。 好, cloud code 创建完毕了,我们来打开 cloud md 文件看一下,它就放在当前目录里面, 看起来内容是有模有样的,不过很可惜,它的语言呢是英文,看起来不太方便,我们要不让 cloud code 再把它给转成中文? 转换完毕,我们再回来看一下,没问题,确实是中文了。另外提一下,这里面的内容呢,是可以随便修改的,比如说我们可以在最后面加上一句注意事项,每次回答到最后,必须要追加这么一句 happy coding, 然后我们回到 cloud code 这里先退出,然后再重新进入,这样 cloud code 就 会重新加载我们那份最新的 cloud 点 md 文件。我们来随便给 cloud code 说一句,比如说是 hi, cloud code 回答了它,最后呢,确实是加上了 happy coding, 可以 看到我们的 cloud 点 md 真的 是起作用了。 所以呢,如果你有什么东西是希望 cloud code 每次都读取的,那就直接放到 cloud md 文件里就好了。 试验完毕,现在我们把 cloud md 结尾中的那个注意事项去掉,要不每次都出现 happy coding, 会影响我们后续的演示。我们可以直接找到 vs code 编辑 cloud md 文件。不过这里嘛,我想顺便教大家另外一个打开 cloud md 的 方法, 我们在这个输入框里面输入杠 memory, 在 这里可以看出 cloud md 文件呢一共是有两种,一种是项目级别的,对应的文件就放在当前的目录里,对当前项目生效。第二个呢是用户级别 对应的文件放在用户目录里,对当前用户生效。我们之前用的是第一个,所以选择第一项,选择好了之后,对应的 cloud md 文件就自动打开了,这样呢,就不用每次都自己在文件管理器里面找了,会稍微方便一点。 打开 cloud 点 m d 文件之后,我们删掉最后面的注意事项保存,再回到 cloud code 这里重启一下, 然后再随便问一句,可以看到 happy coding 已经没了,这说明我们的修改已经生效了。那 cloud 点 m d 文件就讲到这里, cloud code 还有个 hook 功能,允许用户在运行工具前后等时机执行一段自己指定的逻辑,比如说我们可以用它来做自动格式化,也就是说在 cloud code 写完代码之后,自动执行我们设定的格式化函数,以便让最终的代码更加美观,更加符合我们的需求。 首先我们执行杠 hooks 命令,进入到 hook 的 配置页面,这里我们可以配置 hook 的 执行时机,比如说是工具使用前,工具使用后,工具使用失败发送通知等等。我们来选择第二项 post to use, 也就是工具使用后来执行这个 hook。 然后呢,我们再选择 add new matrix, 这里面呢,我们需要选择对应的工具,也就是说我们希望在哪个工具执行之后再运行我们的 hook 逻辑,我们填写的是 write 或者是 edit, 也就是说在创建或者是编辑文件的时候来执行这个 hook。 然后呢,我们再选择 add new hook, 这里输入我们具体的格式化命令。这 这个命令看起来很长,我们来仔细分析下。首先在运行的时候, cloud code 会给我们传这么一份 json 过来,其中的 file path 就是 cloud code 刚刚编辑好的文件路径,因此我们需要解析这个 json 结构,把其中的 file path 的 值给取出来。我们刚才命令里面的这一部分就是用来干这个活的, 其中 jq 是 解析 json 的 一个程序,不熟悉的同学可以自己查下。获取到文件路径之后,我们把这个文件路径通过 x arcs 传递给 preder 命令,然后剩下的工作呢,就是只用 preder 来格式化这个文件的内容了。 所以总结下来,这段命令其实就是使用 jq 来获得当前编辑好的文件路径,然后再使用 preder 来格式化这个文件。 好,讲完了,让我们再回到 cloud code 这里,写好代码之后,我们按回车确认。此时 cloud code 会询问我们应该把这个 hook 保存在哪一级,一共是有三个选项, 第一个呢是本地的项目级别,也就是说这个 hook 只会在本机本项目生效。选择这个选项之后, cloud code 会把配置放在项目目录里面的 settings, 点 local, 点 json, 加入到 get 的, 点 get ignore 文件里面, 所以呢这个文件不会共享给别人。第二个呢是项目级别,也就是说所有使用这个项目的用户呢,都能够用到这个 hook, 它对应的配置文件呢是 settings there jason, 这个文件呢会随着 get 分 发给所有人。 第三个呢是用户级别对当前的用户生效对应的配置保存在用户的目录里面,每一个用户都有一份,不会互相影响,也不会跟着项目保定。我们来选择第二个,所有使用这个项目的人呢,都能够用到这个 hook。 然后呢,这个 hook 就 算是创建好了,我们按 esc 退出。 最后呢输入请求来试一下。我们的请求是创建一个新的文件 test, 点 html 里面随便写点 html 就 行,所有的内容都写在一行里面。回车,我们来稍微等一下, 通过这个写入文件的请求就可以看出, cloud code 确实是把所有的内容都写入到一行里面了,我们同意执行完毕。我们来看看最终生成的 test 点 html 的 文件内容。 可以看到这个文件的内容呢已经被格式化好了,并不是像一开始 cloud code 写入的那样只有一行,这说明我们刚才写的那个 hook 生效了,在 cloud code 写入完代码之后,我们的 hook 启动把那个文件给格式化了,所以呢,我们现在看到的就是格式非常漂亮的 html 代码。 hook 的 功能呢,就讲到这里,现在假设你每天都想写一个总结,记录下今天开发了哪些功能,而且呢,这个总结必须要遵循一定的格式,比如一定要包含日期开发招标开发详情之类的。 你可以把对应的格式要求直接粘贴在这个输入框里面,让 cloud code 帮你写一份,只不过这样的话,你每天都要重复粘贴一遍,很麻烦。这种事情其实非常适合使用 agent skill 来解决,我之前出过一个系统性讲 agent skill 的 视频,有兴趣的同学可以看一下, 不过没看过也没关系,你可以大致把它理解为一个给大家看的说明书,一个动态加载的 prompt。 我 们来创建一个 agent skill 试一下。 首先我们新开一个终端 tab, 使用 m k d r 命令,在用户目录下的 their cloud skills 文件夹下面创建一个新的文件夹,就叫做 daily reports。 我 们使用 vs code 来打开这个文件夹, 然后呢,在这个文件夹下面创建一个叫做 skill 点 md 的 文件,在这里面填入这样的一些内容。 这个文件呢,一共分为两部分,前面的 name 和 description 分 别代表这个 agent skill 的 名称和描述, cloud code 会根据这一部分的内容来决定是否要使用这个 agent skill。 后面呢,就是这个 agent skill 的 具体描述了,这里主要是写了日报需要遵循的格式。 写好了之后,我们回到终端,关掉这个新开的标签页。然后呢,再重启一下这个 cloud code, 然后输入杠 skills, 可以 看到 cloud code 已经发现了我们的 agent skill。 然后呢,我们回到输入框,这里面打入我们的请求,写一份每日总结,回车开始执行。 可以看出, cloud code 发现了这个请求与我们刚才录的那个 agent skill 相关,请求使用这个 agent skill, 我 们同意。 然后呢,我们的每日总结就写好了,跟我们要求的格式是一模一样的。这个呢就是 agent skill 的 使用方法了,是不是很简单? 呃,另外啊,这个 agent skill 的 调用请求呢,是由大模型发现并且发起的,除此之外呢,我们也可以这样来主动地发起这个 agent skill, 就是 先输入杠 daily reports, 然后呢后面加上具体的请求。 这个跟之前的效果呢,其实是一样的,只不过是省去了大模型意图识别的过程,直接由用户调用了这个 agent skill, 结果更加可控一些,具体我们就不演示了,我们来把它给删掉 啊。 agent skill 呢,就大致讲到这里了,当然 agent skill 还有很多高级的用法,感兴趣的同学可以看一下我的上一个视频。 下面我们再讲讲 cloud code 的 另外一个重要功能, sub agents。 这个呢,其实就是一个独立的 agent, 有 着自己独立的上下文,独立的工具,独立的 skill, 可以 独立完成某一件事情。我之前讲过 agent 的 原理, 有感兴趣的同学呢可以自己来看一下。呃,下面呢,让我们来创建一个用于代码审核的 sub agents, 然后选择 create new agent。 这里面要选择 agent 类型是项目级别还是用户级别,我们来选择项目级别, 也就是说使用这个项目的人呢,都能用。接下来选择 agent 的 创建方法,一种是用 cloud code 的 初设化,另外一种呢是完全手动创建,第一种是推荐方法,所以我们选它。 接下来我们描述一下这个 agent 要做的事情,我们填入以下内容,这是一个用于代码审核的 sub agent, 在 用户要求代码审核的时候调用它。回车可以看到 cloud code 正在生成这个 sub agent, 让我们稍等一下。 接下来呢,我们选择这个 sub agent 能用的工具,我们选择 read only tools 就 好,也就是说只能够使用止读工具,其余的都去掉。模型呢,就选择默认的 sonnets, 接下来选择这个 sub agent 的 颜色。 cloud code 在 运行这个 sub agent 的 时候,会使用我们选择的颜色来展示它,我们用绿色吧。 呃,然后呢, cloud code 就 会给我们生成这个 sub agent。 可以 看到这个 sub agent 的 描述呢是英文的,而且里面的内容大概率也不会跟我们期望的完全相同。我们按一下 e 来编辑一下这个 sub agent 的 描述。 这个呢就是 cloud code 给我们生成的 sub agent 描述了,不过呢,它跟我们想要的那个版本差距有点大,所以这里呢,我来给这个 sub agent 整体替换一下,换成适合我们这个场景的。 sub agent 的 结构与 agent skill 类似,一共是分为两部分,上面呢是原数据写明了这个 sub agent 的 名称,描述所使用的模型、颜色等等。下面呢就是这个 sub agent 具体要干的事情了。 呃,我的要求呢,有两条,一个是审查的准则里面有两项,一项是针对 js 的, 一项是针对 css 的。 最后呢会有一个输出格式方面的一个要求啊,我们后面去看一下 cloud code 能否遵循这个 sub agent 的 规范。 呃,填完了这个 sub agent 的 描述之后呢,我们来到 cloud code 这里给它重启一下, 重启完后我们提交请求,给我做一下代码审核。 可以看出 cloud code 调用了我们刚才创建的 sub agents, 并把对应的任务描述传给了它,让它处理。而且看这里 cloud code 是 用绿色来表示这个 sub agents, 这跟我们之前的配置也是相符的,它估计还要再运行一会儿,让我们稍作等待。 它运行了一会儿之后,给出了代码审核报告,可以看出,它检查的内容确实是我们在 sub agent 描述文件里面要求的。这个呢,就是 sub agent 的 使用方法了。 有人可能会问, agent skill 跟 sub agent 很 像啊,它俩什么区别?其实吧,它俩最大的区别就在于对上下文的处理方式不同。 agent skill 运行的时候,它会完全继承并且共享你当前主对话的上下文,这就意味着它执行过程中的每一行日记,每一个思考过程,都会记录到你的当前上下文。 想象一下,如果你让 skill 去审核一个有着几万行代码的项目,这些项目会逐步塞满你的上下文窗口, token 消耗飙升, agent 也会因为记忆过载而变慢变傻。 所以呢, agent skill 最适合处理那些与上下文关联比较大,而且对上下文影响不大的人物。比如说是根据今天的开发过程写一个每日总结之类的。 而 sub agent 呢,则拥有自己完全独立的上下文。当你启动它时,它会开辟一个全新的对话窗口,它在这个窗口里面看的所有的代码,生成的所有的中间分析过程,都不会回传到你的主对话里面。只有当它把活干完了,它才会拿着一个最终的执行结果来向你汇报。 这样一来,你的主对话依然干干净净,永远不会被琐碎的中间过程所冲爆。所以, sub agent 比较适合处理那些与上下文关联比较小,而且对上下文影响比较大的任务。因此, agent skill 与 sub agent 的 最大区别就在于对上下文的处理方式不同,大家要根据具体的场景来选择合适的方案。 下面我们再讲讲 plug in 这个东西。你可以把 plug in 想象成一个全家桶的安装包,有点儿像是 micros 的 dmg 或者是 windows 下面的 exe 文件。它把一系列的 skill, sub agents, hook 等能力全部打包在一起,你只需要一键安装 cloud code, 就 能够瞬间获得整套高级能力。 下面呢,我来给大家演示一下。我们先输入杠 plug in, 进入到插件管理器,这里面呢有三个选项,分别是 discover, 也就是发现新插件 installed 已安装的插件和 marketplaces。 呃,插件市场,我们在 discover 里面找到这个 friend and design, 按回车安装。 接下来要选择安装范围,有三个可选范围,分别是对当前用户生效,对当前项目生效或者是对当前用户的当前项目生效。我们维持默认就好了, 确定后安装就完成了。对,就是这么快。这里简单说明一下, front and design 是 一个用来做前端设计的插件, 一般来说啊,大模型做的前端呢,都有一定的共性,比如说使用深紫色的主题啊等等。这个插件呢,据说可以打破这个共性,让界面看起来更加好看一点,我们等会儿来看看是不是这个样子的。 安装好了之后,我们重启 cloud code, 然后使用 m k d r 命令新建一个目录,就叫做 my to do r。 然后呢,我们进入到这个目录里面, 再启动 cloud code。 启动好了之后,我们输入杠 plugin, 再次进入到插件的管理页面, 然后再选择 installed, 可以 看到 installed 这一个 tab 下面多了一项,就是我们刚才安装的这个 front and design。 我 们按回车看一下它的详情。可以看到这个 plugin 的 主要的组成元素就是一个叫做 front and design 的 agent skill。 既然我们已经安装了这个 plugin, 那 对应的 agent skill 应该也安装了,我们不妨验证一下。让我们回到输入框这里面, 然后打杠 skills。 你 看这里面是不是多了一个叫做 front and design 的 agent skill 呢?所以呢,安装这个插件本质上就是安装了这个 agent skill。 当然,这个 plugin 比较特殊,就只有一个组成元素,有些 plugin 里面包含了 agent skill, mcp, hook 等多个组成元素,你可以把它理解为整套解决能力,一次性全部安装了进来。下面呢,我们就来用用这个 frontin design, 看看它跟原装的前端设计有没有什么区别。 让我们回到输入框这里,输入我们的请求,按照 frontin design 的 要求做一个代码软件,使用 html 来实现。 注意看, cloud code 并没有立即开始写代码,它首先是意识到用户要求使用 front and design 的 规范,于是呢,它会先请求使用这个 agent skill。 呃,我们点同意? 读取完了之后呢,它就拥有了 antropic 官方沉淀的一整套 ui 的 设计直觉。接着呢,它开始写代码了,让我们稍微等一下。 写好了,我们先用 l s 命令看看当前目录下有哪些文件没问题,只有一个 index html 文件。然后呢,我们就可以使用 open 命令来打开这个文件看一下效果怎么样? 大家看这个呢?跟我们一开始写出来的那个 demo 相比,风格就完全不一样了,它的排版更加高级,色彩更加协调,交互呢,也更符合现代审美。 这个就是 france and design 这个插件的力量了。目前 cloud code 的 插件市场还在迅速的增长,除了 ui 设计之外,还有一些针对特定编程语言的 lsp 插件等等。 呃,当然,如果你觉得自己的配置写得非常好的话,也可以参考官方的文档,把你的 skill, sub agent, mcp 等等东西打包成插件,分享给你的团队或者是社区。 好, cloud code 到这里就讲完了,如果我的视频对你有帮助,别忘了点赞关注。我是马克,用最通俗的语言讲最硬核的技术,我们下期再见。拜拜。

在本视频中,我将向你展示如何在 cloud code 中设置自我改进的技能。目前,大型语言模型存在的一个问题是,它们实际上并不会从我们这里学习。举个例子,假设你正在开发一个网页应用程序,在他尝试做的第一轮中,你所用的代码、执行环境或模型可能会犯一些错误。假设你想添加一个新功能, 并且这个功能中包含一个按钮。一个简单但相对常见的错误是 l l m。 实际上并不知道你可能想要使用的那个特定按钮。一般来说,你可以通过某些输入和按钮判断出哪些内容实际上是由 l l m 生成,这时你可能会纠正这个错误。 说好的,我其实是想让你引用这个按钮,但问题在于,当你在当前绘画中纠正了这个错误后,下次开启新绘画时,它还是会犯同样的错误。你又得重新纠正,或者记得明确指定要引用那个特定的按钮。 下一次绘画也是一样。这个循环会一直持续下去,每一次对话实际上都是从零开始的。而这个问题的关键在于,它影响到市面上的每一个模型 以及每一个编程工具。在我看来,如果编程工具本身没有一个良好且有效的记忆机制,确实会带来各种各样的挫败感。这种挫败感可能会以多种不同的方式表现出来。他可能不会遵循命名规范, 也不会使用正确的日期记录规范。他可能不会像你在其他组建中那样以正确的方式验证输入。你是否有过这样的经历?心里想着,我昨天才告诉过你这个或者我上周才跟你说过。问题在于这里没有记忆机制,你的偏好设置不会被保存下来。 实际上,如果没有某种记忆机制,你就会一直重复同样的事情。这个问题的解决方法其实相对简单,我们实际上可以设置一个反射技能来分析绘画、提取、修正内容,并更新技能文件。 我最近在尝试的一件事是把我在整台机器上使用的全局技能全部在 github 上进行版本管理。 随着我对这些特定技能进行反思和迭代,我可以随着时间推移看到所有不同的记忆。如果出现了回推或者我想要回滚也很容易。因为所有内容都在 get 的 版本控制之下。所以现在我设置的方式是有几种不同的机制, 而且相对来说很简单,我可以开启反思,关闭反思,还可以查看反思状态。我们有两种不同的方法可以实现这一点,一种是手动方式,另一种是自动方式。首先我们来讲一下手动流程,有一个叫做 reflect 的 技能,然后还有个斜杠命令。当你进行对话时,如果有你想让他记住的内容, 你只需调用那个斜杠命令,他就会获取对话的上下文,然后引用特定的技能,并相应的进行更新。 手动更新的好处在于,你可以更好地控制实际在技能文件中被更新的内容。我们来举一个假设性的例子,所以你可能会利用这个技能。他可能会说,这是我对认证模块的评选,而你可能会意识到哦,他实际上并没有检查 c 框注入,我们可以进一步指定始终检查 c 框注入。 然后从那时起, cloud 会在当前绘画中检查 coco 注入。就像我之前举的按钮示意一样,理想情况下它会返回并向你展示已经完成了。而这其中非常棒的一点是, 所有的修正都是可以成为良好记忆的。信号批准则是进一步的确认,而 reflect 命令和技能会提取这两者。然后在这个过程之后,我们所需要做的就是实际运行 reflect 命令。我们有两种不同的方法可以做到这一点。我们可以运行 reflect 命令, 或者也可以显示地传入技能名称。但如果你只传入 reflect, 它会因为处于该对话进程中而具备上下文感知能力,从而知道该技能实际被调用的时间。 实际上, cloud 会分析并扫描对话内容以查找修正。它会识别成功模式技能更新后的情况,并且这种设置方式会为你提供不同致性度级别的详细分析。致性度会分为高中和低。如果我说 绝不要做 x, 比如在这个项目中绝不要自己设计按钮样式。你完全可以像这样具体说明。中等执行度会是那些表现良好的模式,而低执行度则是需要后续复查的观察结果。而所有这些功能都只通过这个技能文件来实现。你可以编辑它对其进行调整。如果你想要版本控制或者不需要, 也可以直接添加 git 机程。另外,如果你不想用它,也可以直接移除。我会把所有这些内容放在视频描述里。在实际更新相应技能之前,审核和批准流程是这样的,我们可以看到检测到的信号, 提出的更改,以及如果我们接受这些更改后将要添加的提交信息。此外,在这里我们还可以直接进行更改,而且可以用自然语言来修改,这就是这个功能非常棒的地方之一。至于如何将这些更改实际应用到我们的技能目录并推送到 git, 我们可以点击 y n, 也可以用自然语言输入我们希望在 cloud code 中进行的不同更改。然后,一旦你做出了这些更改,或者你接受了 cloud 提出的建议,它就会编辑相应的技能,并在 get 中提交这些更改,接着再推送上去。 关于这个流程,有一点是我在自己的设置中非常想要实现的,那就是对于它在技能中做出的所有不同更改,一定要确保你也对这些更改进行了版本管理。 接下来,你其实可以采用同样的流程并将其自动化。你可以通过 hooks 钩子来自动触发反思操作。如果你之前没有用过 hooks, 实际上它们就是在不同事件发生时运行的命令。现在有一个 stop hook, 通过它你可以让 clod 持续运行并自动执行。 你实际上可以绑定一个 shell 脚本,每当 stop hook 被触发时,就调用它让 clod 继续运行。但它同样也非常适合用于绘画结束时的分析。 就像这现在这里势利中的语法是有问题的,但实际上它的作用就是在 stopbook 上我们会去触发那个 shell 脚本来进行反思。如果你打算让这个过程自动运行, 你确实需要对反思机制以及它实际执行的内容有很高的信心,但它的作用是,你会像之前一样经历整个流程,然后一旦绘画结束,这个后壳就会分析并自动更新所有不同的学习内容。 这将成为你在 cloud code 中可以拥有的持续自我改进循环。你同样也可以在其他代理系统中利用这种持续学习的策略。所以他会做的事情是,比如在那个按钮的例子中,他会继续进行并从绘画中学习。在 cloud code 中的表现是,我们会看到一个从绘画中学习的提示, 并且会显示它更新了哪个技能,所以这实际上更像是一种静默通知。但就像你在屏幕上看到的这种提示一样,它确实更新了那个特定的技能。然后,关于在停止钩子上被调用的 reflect shell 脚本, 我们可以将其开启。有一个机制可以开启或关闭 reflect, 这实际上会以和我们之前的 reflect 模式相同的方式工作,只不过现在是自动的。让我觉得兴奋的一点是,你可以利用这些技能做很多不同的事情,这可以用于代码审查, api 设计, 测试,文档编辑以及许多其他用力,而且让技能能够从你的对话中学习。我认为这是一件非常强大的事情, 而且把它集成在技能中,你就不必担心嵌入记忆以及我们常见的典型记忆系统所带来的各种复杂性。所有这些内容都会保存在一个 markdown 文件中,你可以直接用自然语言阅读。我喜欢的另一点是把它放在 get 里, 因为你可以看到系统是如何随着时间学习的。如果你有一个前端技能,你可以看到在使用过程中学到的所有不同内容,而不必每次都从零开始。 我认为更有趣的一点是,你可以看到这些技能是如何随着时间演变的,以及随着你与系统的对话,系统是如何变得越来越智能的。如果你也在 get 中利用这个功能,你将能够看到针对特定技能的所有不同学习过程。最后总结一下, 如果你对代理技能还不太熟悉,我会在视频描述中放上一些链接。我也可能会在这个月内做一些关于这类主题的其他视频。所以,如果你对这类内容感兴趣, 欢迎订阅我的频道。好的,最后,但同样重要的是,我们来总结一下刚才讨论的内容。有几种不同的方法可以实现这一点。你可以通过自动检测的方法来做,也可以通过手动的方法,或者你也可以切换开关,结合两种方式使用。如果你想利用自动检测的方法看看它的效果,也可以尝试一下。 另外,我建议你熟悉一下实际的 reflect 机制,然后我们还有切换机制。所以,如果你想结合手动和自动两种方式使用,你需要在 hock 触发时开启自动检测机制。 好的,总的来说,这一切的目标就是只需修正一次,之后就再也不用修正了。这只是一个开始。我并不是说这一定是最终的解决方案,但希望它能为你在技能提升、自我改进以及持续学习方面带来一些启发。

好,这节我们继续来学习 skill, 这节我们要学习的是剪映 skill, 它可以帮助我们通过 ai 自动化的方式去创建视频以及编辑视频。那你现在看到的这个成果呢,就是完全使用的是剪映的 skill, 创造出来的 有字幕,并且呢有特效,能够帮助我们快速地生成这样的一个视频。那我们通过这样的方式创造出了一个属于我们自己的视频, 我们就可以不断的去优化我们的题型,让我们的视频变得更加的精美。好,我们简单看一下怎么去使用这个 skill, 以及这个 skill 能帮助我们做什么?首先你可以去看到可以进行多轨道管理,高级剪辑,包括自动化导出以及设置不同的格式,通过这些方式你都可以把这些工作变成自动化的方式。比如说像我们就使用这个 skill, 你只需要在 github 上搜索剪映 skill 就 可以出来这一个项目。然后呢,我们只需要将这个题词给他下到你的本地,然后呢,最终你就做一件事就可以了,你简单一点,你说,哎,把这个付交给他,你说就跟他说,哎,请你帮我啊,下载到本地,对吧?然后配置 到啊,这个 skill 是 当中啊,你不需要去看任何教程,你直接把这个东西交给 skill, 交给 call 的, 他会帮你完成全流程的操作。这时候呢,你再问他怎么使用他,好吧,我就这样子的,你看,我在问他怎么使用,这个时候呢,你看, 哎,就帮我生成了第一个声音,就这么简单,没有任何的花里胡哨的步骤,你就直接跟他说,哎,就可以了,好吧,好,那通过这样的方式我们就 能够实现这个视频呢?最后来说一下,就是这个原理是什么?为什么通过这样的方式可以创造出视频?那这个时候我们就不得不提及他这个 skill 到底为我们的电脑做了什么操作,我们输了一个 e s 进去, 其实我们,嗯 k 叉四的名已经有一个推断了,对吧?你就说他这个项目本质上做的工作就是在里面呢 帮助我们啊,用了一些 python 库,这个 python 库呢是用来处理视频的,相当于编辑视频的,比如说,哎,某个库它可以帮助你去添加字幕,某个库它可以去帮你找素材,又某个库它可以帮你加通话。 通过这样的方式,你最后再通过艾特的方式帮我生成,比如说我现在在问他,对吧?你说,哎,我继续啊,我继续,哎,请你帮我把视频改成,呃,十秒吧,啊,你看,我跟他说改成十秒,这个时候呢,你注意看啊,这个时候, 哎,我等待一下吧,你看他改成十秒,他立刻立刻改了,你看他在改了, 你看它本身就是改 python, 对 不对?改 python 的 代码,嗯,懂我意思吧,它实际上操作的就是 python, 你 看它改成十秒了,我们等一下,我们看结果吧,已经,它已经生成了,对吧?它已经生成了, ctrl 加 o 生成了,我们点一下,呃,点一下这个 command, 点一下, 注意看是不是十秒钟,十秒钟吧,没错吧?没问错,问题吧,是不是十秒钟?好,那我们再看啊,这个 skill 呢,我们说了,对吧?我们要看代码,是不是啊?看他,首先这个 skill 里面你看到没有告诉我们你要用哪些库?包括呢?你要用哪一些方式去创建?以及你要用哪些方式去添加媒体?添加文本如何保存?如何 创建草稿如何保存时间轴?如何导出字幕?你看他就做这件事情,非常简单。下一节呢,我们讲一下如何去创建一个我们自己的 skill, 包括任何行业的 skill, 如何去创建。好吧,那就是本期视频的全部内容了,我是小刘,我们下期再见。

好,这节我们继续来学习 cloud 当中的 skills, 那 上一节当中我们学习的如何使用 ui ux pro max 这个项目去开发一个这样的 ui, 那 其实啊,整体流程大概是这样子,对吧?我们分布一个任务,然后 ai 读这个 skills 文件,最后去通过这个脚本查出当前样式,最后返回给你。那上一节呢? 嗯,没看的小伙伴可以去看一下。好吧,这一节我们就不过多追述了,我们这一节呢,主要是给大家分享一下,就是关于 cloud skills 是 如何去使用的,因为我发现很多小伙伴有这方面疑问,就是什么是 skills 以及 skills 呢?它能够给我们的 cloud code 带来什么?或者给我们的 cloud 的 模型带来什么,对吧?首先我们先要明确一个, 首先我们需要明确一个概念,就是,呃, skills 呢,实际上是给 ai 加装的一个插件,类似一个插件,你可以理解为它是一个 prompt 的 集合, 需要按顺序加载,能够帮助你提高你的效率。那相比于 m c p 呢?它不需要去调用一些外部的工具,它只是单纯的一段题的词,仅此而已。好,我们开始走什么 skills? 我 们刚说了,本上 skills 呢,就是一个文件夹,这个文件夹里面包含了指定脚本资源, cloud 呢,会按需加载,就是这个指令,什么时候需要使用这个指令,它会自己去找。什么时候需要这个脚本呢,它也会自己去找。那这时候呢, cloud 呢,是完全自动地接管了你的这个啊,这个权限,然后去,哎,去掉这个 skill, 哎,我该干什么干什么,所以你可以在这个 skill 里面去写,哎,你需要干什么?简单来说,对吧,给 cloud 加技能包, 让 cloud 变得更聪明,那这四个特性大家简单看一下就行了。好吧,我们就往下走,那下面我们来简单说一下, cloud 目前有三种分类,第一种呢是个人技能,也就是说你这个 skill 呢,你的所有项目 都可以使用,比如说我现在配置的一个全职的 skills, 对 吧?那你需要配置在这个点, cloud 杠 skills 下面,这是一个全职的技能,也就是你所有的项目啊,都可以去使用这个 skills, 而不仅仅局限于某一个项目。 第二个是项目级别 skills, 也就是说你这个 skills 呢,只对当前的这个项目的跟目录下面的所有文件生效。哎,秃了这个文件,对吧?它就不生效了,懂我意思吧?第三个是插件的插件也是一样的,就是你安装之后,你所有项目也是一样生效,只是说你可以随时卸载它。好吧, 我们继续往下走啊,首先我们要去使用 skills 呢,需要去插件市场安装一下啊,下面我给大家演示一下。首先我们打开 cloud code, 那 这里呢?我去,哎,去清空一下啊,这时候如果说我需要安装 skills, 你 可以执行这条 mini, 哎,去安装一下 astroc 的 这个 skills 啊,因为我这里呢,要叫有个窗口,我就发跳价哦,我直接发进到高度的 啊。然后这个时候我们再执行这条 mini, 这是那个 cloud 当中的一个 plugin mini 插件 mini 回车啊,这时候我们可以看到,对吧?它在添加这个 skills, 你 看 这个 skills 呢,它是存在 astropica 的 官网,所以呢,它通过 get 啊,给它下载下来啊,就就安装完成了,就安装这个配置,就安装完成了, 好吧,那这里我们就退出了,好吧,那我们可以选择去,哎,可以去安装你的插件,也可以选择去卸载你的插件,好吧,这时候我们就安装完成,之后呢,那 这时候我们就可以使用 skills 了,就这么简单。那这个默认的 skills 里面有什么东西呢?很好的一个问题,它目前提供了两个问题,第一个是 document, pdf 文件之类的, 第二个是一些视力技能包,比如说 m c, p 啊,视觉之类的,就是官方提供了两个 skills。 好, 这时候我们可以就可以去掉这个 skills。 好, 看它是不是创建成功了,比如说,哎,请你给我创建一个学生管理系统需求的啊,文件使用 skills 啊,这是这是 student 点 pdf, 它就这样子,它会给你一个 pdf 文件,那用到 skills 呢?其实这个 cloud code 呢,也会告诉我们是不是用到了这个 skills, 我 们可以看一下 啊,这时候你可以看到是否使用这个 skills, 也就是用这个 pdf 的 skills, 也可以看到这个地方出现这一段话,就是我们用到了什么,用到了第一个 skills, 这个 skills 呢,因为有一个 pdf 文件,那这时候我们可以选择 yes, 也可以选择,哎,下次不提醒它,我们选择, 那这时候我们可以的话就去调这个 skills 了,然后呢,哎,这个 skills 里面呢,因为本身就包含了这个这个命令,所以呢,你看它会自动去执行这个命令,我们并没有跟他说,哎,你要执行某一个命令,使用什么什么库,为什么?因为它的这个 skills 里面就包含了 pdf 的 操作。好,最后总结一下,对吧?所以我们实际上就是将 啊 astroc 它整理的一些啊技能包在这个 prompt 当中啊,给你声明好了,这些啊,比如说调 pdf, 它需要用到哪些工具,需要用到哪些题的词,对吧?它需要用到哪些插件,哪些库,对吧?它都给你整理好了,所以呢,这个时候我们就可以啊,去看到这个啊,这个目录下面会有一个这个 pdf 相关的技能包啊,类似于我们之前学习这个 啊 kilo 的 时候,你看是不是?我们学习 kilo 时候是不是讲过,对吧?是不是有一个 skill, 你 看这 skill 嘛,它会声明你用的是什么 python 什么的啊,什么样的版本,那就那么一个意思,好吧,好,最后呢,安装完成会保证这个目录下面我们先不讲啊,这里我们就我们可以看到就用了这个 skill, 我 们就跳过这样,我们执行完成之后还会确实会给你生成一个 pdf, 类似于人家已经封装好的 prompt, 好 吧, 这时候我们就明白了,对吧?当我们使用 skills 的 时候呢啊, cloud 会自动加载这个 pdf skills 以及文档分析 skills, 最后输出给你一个结果,而不是全部加载上下文中,有效节省头壳,就就是类似于那个 cloud 的 一个机制,好再往下走呢,其实我们和 mcp 的 一个区别是什么?就我们可以看到,对吧? m c p 呢,是外部提供的应用工具能力,而 scuse 呢,更像是去教模型如何使用工具,在那个结识当中去声明,哎,声明我到底该怎么做,对吧?引导他去执行啊?教模型的一种方法,一般来说我们会通过 m c p 和 scuse 协调工作,最后呢,再通过 scuse 引导去来最终执行。好吧,那这个,这个是什么意思呢?这是斜杠命令啊,意思啊, 所以呢,它也是一个区别。好吧,好,那就本期视频的全部浏览。如果呢,你也对这种 sku 感兴趣的话,不妨去试一下。那通过这个杠 prang 的 插件,对吧?去选择你要安装的插件,包括这个管理所需要的插件。那正常的一个 sku 目录呢?是一个这样的目录,比如说文档啊,文档里面有这个,这个角落会写在这里面啊,资源会写在这里面,它就有一个清晰的分类,这就是所谓的 sku, 那 包括我们也可以看到,对吧?它全程在使用这个 sku 来去执行,我们并没有去插手。好吧,好,那就本期视频的全部浏览,我是小刘,我们下期再见。

揭阅 ai 桌面伙伴小月全面登陆 windows 平台,号称可以重塑用户桌面办公体验的工具。目前内测阶段需通过邀请码激活系统,有需要的朋友可以在评论区留言。官方群提供了操作文档,我选举两个功能测试一下实际效果。 先来试试网页信息获取功能,给定一个网址,要求获取知乎排名前五的话题。他会先分析需求,整理出执行计划,等待授权后才会开始工作。 如果计划不符合预期,还可以提出修改意见,这点是很不错的。确认计划后,小月便开始工作,他自带内置浏览器,能自主操控网页展示和操作,遇到需要密码验证的环节,还能一键切换,手动接管。 值得关注的是,当指定网址没法直接获取内容时,他居然会模拟真人操作,打开百度,一步步搜索,补齐信息,最终完成任务。再来测试表格合并功能, 照着官方势利,把一堆杂乱的统计表格丢给他整理优化,虽然没有成功,但经过观察 ai 的 执行逻辑,只有再给点时间,他是可以处理好的。 官方还有个重磅补充妙计,已全面支持 close girl, 这将进一步增强他的工作能力,我将继续深挖他的隐藏玩法。今天的分享就到这里,感兴趣的朋友欢迎在评论区留言交流。

hello, 朋友们大家好,这边是大卫呃,我今天 cloud code 的 remotion skill 去将我的一篇文章直接转成了视频,我们闲言少叙,先直接看一下视频的效果。 ok, 看完了感觉怎么样?是不是效果还挺好的? 那我是用什么东西给他呢?就是将啊的这篇文章,就今天刚刚早上发的这篇文章啊,要的内容就是我把配图写到 skill 里面去抽离出来了,然后我就把这篇文章整个的一个素材丢给他, 然后生成出来的这样的一个内容。 ok, 那 我们用这个 remotion skill 的 时候,你不需要去知道呃 remotion 的 细节,你不需要去知道怎么样去生成特效等等,你只需要提供素材给他, 然后他就生成对应的一个结果,这个 skill 能干什么?哈,其实刚才已经简单的去介绍到了,比方说我刚才给的这篇文章给他,他可以把文章拆成六到八屏的一个 呃场景,然后每一屏有独立的风格,然后中间可以有节奏转场的这种效果切换,然后可以将音乐进行对应的卡点,而且呢,你在这个过程当中你有任何的不满意,你都可以反馈给他,他可以不断的去更改。 所以呢,跟传统的方式一对比的话,就是你可能原来的方式是你改一个文案,你要重新去做对齐,你做转场的话,你要重新对不断的去调,但是在现在来说的话,就你只需要跟 ai 沟通就 ok。 那 么怎么样子去使用这个叫做 remote 的 skill 呢? 就是啊,把这一条命令然后复制呃到你的中端,或者是你打开了 cloud code 之后,你把这一条命令复制出来啊,然后比方说我先打开啊,我的终端 好出来了,我就跟他说帮我安装这个 skill 啊,然后你可以指定是安装到一个全局目录,还是安到安装前的项目目录,那我就跟他说安装到当前的项目 目录,然后你一回车他就会自己去帮你装好。我这边的话,因为我已经装好了,所以的话呢,我就不再重复的去做这个安装了, 然后你在这可以看到我这里有很多就是我跟他沟通的那个过程,比方说啊,我刚才是让他去配了那个音乐, 但是呢,一个开头的那个点总是卡不好,所以我会让他不断的往,再往后一些,往后一些他就把那个音乐开始的时间再往后调了,然后后面调完了之后呢,他就出来这样的一个总结的一个效果给我 等等,那完了之后你就可以去直接去看,那我可以给你看一下我的啊,他给我看的那个编辑器的那个位置,大概就是长这个样子,就是你在这里可以去看,也可以 去调整,当然最好的话就是不要自己去调整,你让他去给你补灯就好了,然后我在这里我是这样的,这个一样的效果,那你在这里预览完了之后,你就可以让他给你将视频导出来, ok 了, ok, 再回到我们的。好,那在这里呢,刚才说的哈,我们已经装好了,然后我刚才也说了,哎,你在这个过程当中怎么样子去跟他啊进行沟通,其实 就是非常的简单啊,装好了之后你就说,哎,我要做一个怎么样子的风格的一个视频啊?大概时长是多少啊?内容的来源跟素材是哪里?比方说我刚才这个的话,我就是把啊,我的内容来源,我的素材就是这个。 那你不需要去掌握任何的,比方说 api 啊,动画的细节,配置文件等等,只需要去明确你的问题,你的需求,你的场景,你告诉他,如果你告诉的越精准,那最终出来的效果就会越好,你中间需要迭代的那个过程也会越短。那么怎么样调试? 那就是像你写文章,或者是你让他给你生图一样的啊,不断的跟他去沟通, 比方说可能你一开始怎么样去使用呢?就是我想用 remote skill 去做一个二十秒左右的视频,内容的话,是我下面给你的这篇文章,那你把它拆成六到八个场景,每个场景的转场呢?要炫酷一点,不要重复,你可以先给我一个版本,然后我不满意的会让你继续去改。那 我刚才生成出来了之后,其实一开始的效果我是不太满意的,我让他去改,改成一个像苹果发布会这样子的风格,然后结构要更快一点。结尾呢,他开始是做了一些很炫酷的那种 ending 的 动画的,我让他改成了一个静止的这样的效果。那 现在来说就是你要去做这个视频,你已经不需要去掌握任何技术上的细节,你只需要明确你的需求。 好,那我为什么会要去用这个 skill 呢?就是我原来是有一个写作攻略,然后呢,配图跟写其实都是一起的, 就像我刚才那文章讲了,其实配图从里边给猜出来,那先是写作是一个工作流,然后配图是另外的一个工作流的 skill, 然后现在呢?又有有了这个 skill, 那 我就可以啊,先 出文字,出完文字之后呢,我再出配图,然后我再把整篇文章可以给到这个 remote 的 skill, 它可以帮我去生成一个像刚才我跟大家去演示的这样效果的视频。 ok, 好, 那就是今天想跟大家去分享的内容,谢谢大家,拜拜。

我今天用 cloud code 做了我的第一个 skill, 真的 不到三分钟,过程比我想象的简单,我属于一行代码都不会写的那种,但是过程中确实是不需要写一行代码,今天我就分享一下我是如何做的。首先你需要先安装 cloud code, 这个是我已经安装好的一个状态, 如果你还没有安装,就把我上面贴出来的这句话发给 ai, ai 会指导你安装,如果中间有报错,就把日制发给 ai, ai 都能帮你解决。那在安装 skill 之前呢,你也需要先购买一个服务器的套餐,我买的是智普的, 进入到智普的官网,选择一个适合你的套餐就可以。购买完之后呢,会生成一个 api k, 把 api k 复制过来就可以。 那我现在把这段命令复制给他,让 cloud code 来安装一下 skill, 当看到这个提示的话,就说明 skill 已经安装成功了。下面我让他帮我去写一个 skill, 我 给他的需求是帮我写一个 skill, 主要功能是生成一份格式化的 em 日检报。我直接回车发给他 之后,他是在问我这段代码要存到这个网页里吗?还是点击 yes 给到他?中间这个过程他可能会不断给你发出一些问题,基本上就是一直点击 yes 就 可以了。现在可乐扣的已经帮我把这个 skill 创建成功了, 你看他有,他有来,他有跟我说,只要说看新闻, skill 将自动启动,我们来试着启动一下看新闻, 哎,我今天的 ai 简报已经生成了他给我生成的 h t m l 链接,打开看一下他给我生成的今日 ai 简报,一共是抓取了七条的新闻, 哎,这条新这条新闻正好我今天也有阅读到最后就是这个网络的风格和内容,你也可以通过 prom 的 形式让可乐 code 去帮你进行迭代。其实你们也可以看一下刚才我整体的操作流程,其实就是反复的点击确认,就可以生成一个这样格式化的一个简报页面,大家也可以按照上面的步骤去试试看。

随着 ai 的 兴起,新出现的这些名词比你换的女朋友次数还要多,什么 agent, prompt、 react, m c p, 还有大火的 agent skill, 而这个 agent skill 我 觉得是真正可以高效率的执行 ai, 并且可以节省大量 token 的 方案。首先 agent skill 用一句话总结就是把怎么做这一类事情的经验, 从一次用完就丢的 prompt, 变成以后都能反复用,还能随便组合的能力。 在没有 agent skill 的 时候,比如我让 ai 重构一段代码,它完成的效果很可能并不是你想要的。比如命名不规范,注式格式不正确,异常处理也没有使用规定的 code 码,那么就需要写好这些提示, 参考阿里巴巴规范手册,使用驼峰,命名异常要精准补货,从 basecode 获取对应的 code 码,把这些规则再告诉给 ai, 让 ai 再给你重构一遍。这样确实是可以了, 但有个不好的地方,当我以后再让 ai 重购代码的话,还要把这些规则再写一遍发给 ai, 次数多了以后就很麻烦啊。那能不能让 ai 直接就记住这些规则?不用,我每次都要告诉 ai 呢?有的兄弟有的 可以把这些要求写到一个 markdown 格式的文档中,有 kolod 保存这个文档,等我们再让 ai 重构代码时, kolod 会先读取这个文档,然后把文档的内容和要重构的代码一起发给 ai, 这样就不用每次自己来写这些要求了。 但是又有新的问题,如果我是让他干别的,只是简单问问技术问题而已,也不用筹够代码,那他还是要把这些文档的要求发给 ai, 这样 token 用的不就是没有必要了吗? 所以还得有个判断。当真正需要重构代码的时候, cloud code 才会把文档的内容要求发给 ai, 可以变成这个样子,给文档加个名字,知道他叫什么,还要再加个描述,知道是干什么用的。等我们让 cloud code 重构代码的时候, cloud code 会告诉 ai 有 个文档名字和描述是这样的, 如果你要用到的话,我可以给你文档的详细内容, ai 就 会根据文档的名字和描述和用户输入的内容进行匹配。当 ai 发现了这个文档就是要干这个活的时候,他就会通知 kolodok, 把这个文档的完整内容告诉我, 我好按照这个要求来执行重构,这时 kolodok 才会把完整内容发给 ai, 接着 ai 执行重构,返回给用户内容。 因为名字和描述内容本身就很短,所以就不会出现过多浪费 topic 的 问题了。一看这个功能还真的比较好用,那就开始加一些别的要求呗。例如代码重复规范的文档是告诉 ai 如何按照规范要求重复代码。 get 提交规范的文档是用来告诉 ai 如何生成合理的提交信息。单元测试编辑的文档 用来告诉 ai 如何编辑符合团队测试覆盖率的单元测试。当 colocode 与 ai 沟通的时候,就可以把这些文档的名字和描述当成一个缩写目录发给 ai, ai 就 会根据用户输入的提示词来匹配这些文档的名字和描述信息 匹配到了,就会让 colocode 把这个文档的详细内容发给 ai, 然后 ai 按照上面的要求来执行。这样下来, ai 在 干每一件事情的时候,因为是按照我们列出的文档要求实现的,所以完成的效果就符合我们的要求。而这一系列功能的实现就是 agent skills, 这里面的每个文档就是 skill, 这些文档就像使用说明书一样, ai 根据内容来挑选对应的说明书来实现具体的功能。当然了,这些文档也不能随便的乱放,要有个规范来管理起来。 可拷扣的规定,不同功能的文档要放在不同的文件夹下,文件夹的名字就是文档的名字,而文档的名字要统一改成 skill 点 md, 当然到这里并没有完,还是看这个代码重构的例子。 随着后续的一直更新,这个重构规范的文档内容也会越来越长,因为要规范的内容很多,命名规范、异常扣的码规范、日制规范、并发编程规范等等。当要求 ai 重构代码时,可绕扣的会把这个文档的内容都告诉给 ai, 而实际上呢,每次让 ai 重构代码也只能用到文档的内 容,都告诉给 ai。 而实际上呢,每次让 ai 重构代码也只能用到文档的内容,都告诉给 ai。 而实际上呢,每次让 ai 重构代码也只能用到文档的内容,都告诉给 ai。 而实际上呢,每次让 ai 重构代码也只能用到文档了。 这时候就可以进行优化,把每一种规范单独写到一个文档中,然后在之前的这个主文档中,把这些单独规范的文档给整合进来。里面可以这样写, 如果要处理异常相关的代码,就读取异常,处理规范点, md, 如果要处理病发相关的代码, 就读取并发编程规范点 md。 如果要读取日制相关的代码,就读取日制规范点, md。 等。我们要重构一段多现成的代码时,可拷 code 把要重构的代码和 skill 文档发给 ai, ai 根据 skill 名字和描述确实匹配到了,告诉 colocod, 把这个 skill 文档全部内容告诉我, colocod 就 会把文档内容发给 ai, ai 再读取这个主文档的内容之后,再进一步读取到并发编程规范这个文档, 就会让可绕扣的把病发编程规范的文档内容发给我,可绕扣的就会把病发编程文档的内容告诉给 ai, 这样就实现了按需加载,让 ai 只有在必要的时候才会请求对应的内容,这样就可以很大程度的节省掏空了。 其实 scale 不 仅能管理文档,还能实现更加复杂的功能,比如还能让 ai 执行脚本完成一些他本身做不到的任务,比如图片批量压缩这个功能, ai 本身是没法直接压缩图片文件的, 但你可以在 scale 文档里面这么写,当用户需要批量压缩图片时,先确认图片所在的目录和目标,压缩质量, 然后执行下面这段 python 脚本。脚本里面调用 py 库,便利目录下的所有图片,按照指定的质量参数进行压缩,保存到输出目录。你还在 py 文档里面详细说明了,如果用户没装 py 库,先执行对应的命令来安装依赖, 现在 ai 在 可绕扣的配合下,在拿到这个 py 文档之后就知道该怎么做了。 先问用户图片在哪个目录,想压缩到什么质量保存到哪里,然后按照你写的流程执行 python 脚本, 脚本跑完之后告诉用户压缩完成,一共处理了多少张图片,节省了多少空间。到这里 agent skill 的 功能就介绍完了。怎么样,是不是特别的简单?

看好了,不登录、不绑卡,没有网络问题,国内顶尖模型免费用!打开终端,输入命令,敲下回车,立刻就能开始生成代码,这就是能力比肩 cloud code 的 同时,完全开源,完全免费,完全开放的 ai 编程界新星 opencode, 全平台支持安装使用超级简单,全部只需要这一行命令就可以完成。 mac 下还可以用 homebrew 安装。官方网站有非常详细的功能说明和完整的配置项列表可以供我们参考。 如果你不想看英文的话,也有这个中文站,有完整的官方文档翻译,可以帮助我们快速的上手使用。更加劲爆的是, open code 完美支持 cloud 的 agent, 直接把 md 文档复制过来,立刻就可以使用。 所以最最无敌的是社区还有这个 o my open code 的 插件,提供了开箱就可以使用的赛博研发军团。 看看这些真实的用户反馈,下一期视频,我来介绍一下他的详细用法。当顶级的工具已经免费并且极低门槛就可以使用的时候,决定你和高手之间的差距,就只剩下行动力了。不要收藏了,现在立刻马上就去把它安装起来,用起来!关注我,带你玩转 ai 编程!