大家好啊,我是 pro, 然后我们开启今天的这一期啊,之前的几期里面视频当中也是提及了啊,也是提及了,就是每一次运行呢都要好久好久好久,真的是要好久, 半个多小时,将近一个小时,这些这些都是快的,甚至有的任务呢还要执行一个小时甚至一个多小时 啊,这个这一点呢我就有点受不了了,你说在这个期间呢,你说刷手机呢也不太对,因为你要毕竟还是要盯着,那你说盯着呢,它就整体的信息量又很又很弱,那在这里面怎么办呢?那就是用这个病形去测出。为什么我会想到病形啊?是因为 啊,之前在用这个别的项目当中用的这个 ctrl 嘛,然后用 ctrl 的 时候呢啊,我发现就是左键呢会瞬间并行好多,并行四个啊,最多可以并行四个,并行四个三位键呢,一起去做一些相关的任务,那样执行起来就会很快。但是呢 啊,在用错的过程当中这个萨贝特呢就只用行了一个啊,就是一个串行了,那就是一个单纯的串行呢,这个也不对,那我就怎么办呢?就问就问他呗,我说你能定型萨贝特呢吗?然后啊快手去想一想 不,不是这个错,去想一想啊,我是可以定型的啊,我是可以定型的,是的啊,可以定型。然后呢根据这个工具的一个说明 啊,你可以在单个小程序当中调用多个工具的实力,从而实现多个啊,代理纸代理的一个并机并行的一个处理,并且你看啊,我跟你一起并行了一个东西, 我说那你并行的这个东西呢是两个不同的 a 帧的,那你可以并行一个相同的 a 帧的吗?就比如说这个 code build, 就是你勾注代码吗?勾注代码,这个是最常用的一个并行的一个东西吗?还有一个是调研,然后呢,他说是的,我确实可以 并行相同的啊,这个设备呢,比如说多个这个,或者说多个这个,我刚才实际操作已经演示了这一点啊,我刚才实际操作已经演示了一个这一点,那我刚才演示了,就是你看我两个同时进行了一个调研,两个同时进行调研, 然后呢?但是在这个里面呢就是说,呃,对于刚才我说的这个 code build 啊,对,说 code build, 他 说没有这个,没有这个代理,但是呢有的是这个这个代理啊,有的是这个代理,它非常适合并行构建不同的一个模块, 那同时可以同时多个,但是要注意呢,就是这个啊,有一些的就是啊依赖啊,有一些的依赖这些的一些的问题, 那举例也有还给了举例一些场景,那我说既然是可以呢,那怎么办呢?那就是接下来我要求他啊,接下来我需要你讲这个病情使用的技巧,固化为一个 skill 啊,那调用条件呢?是当使用 side 的 时候就要进行这个病情,能病情的要进行病情就是进行使用啊,这个就是能能病情的进行病情,但在这里面要注意啊,就是关于依赖的一些的处理问题,然后呢这个 他就整个翠就想了想,然后最终啊给我构建了,根据我们创建啊,创建 skill 的 skill 啊,创建技能的技能的一些的要求,确认了一些的细节,确认一些细节方便更好的确认。确认啊,你要什么名字呢?呃, 有什么功能呢?有什么这个条件细化呢?一代处理是指什么什么东西呢?我的建议是啥啥啥呢? 我说你这个东西调用条件,其其他的都可以,但是这个调用条件还是有一点问题,就是当 a 证呢,只要他使用萨维森的时候, 而不仅仅是说明确的啊去使用,或者说检测到可以运行,或者是等两下,就只要你使用了萨维森,就要去考虑这个能不能运行,就要触发这个这个这个 skill, 然后呢加了这个条件之后,他就完成了这样的一个 skill 的 一个创建, 完成了一个这样的一个十十个创建。然后呢在这里面我还要看到了,就是对于相同的啊,对于相同的,上辈子的,我感觉他好像没有做了提及,然后呢他也说啊,我确实做了一个提及,并且呢也是做了一个,呃,视例。那第一个呢,并行代码搜索或者说批量文档审核 去做了这样的一个设计。那有了这个东西之后呢,我们后续再去调用这个 safari 的 时候,就会很容易啊,就会很容易好,这个呢,今天以上就是我们今天的内容,拜拜一。
粉丝196获赞808

下班了,给大家快速分享让自己的 agent 变强的两种方案, skills 和 sub agent 该如何选? skills 的 本质就是插件,比如你的主谓志只能对话,然后你想让它有画图的能力。 skills 的 做法就是将自己的执行过程 调用的方式一股脑塞到你的主谓志上下文里面。伪智能学会之后呢,就可以自己画画。而 sub agent 的 本质是外包,你将画图这个任务外包给了具体的画图的 agent, 他在自己的上下文里面完成工作,最后呢,只会返回对应的执行的结果,中间产生的临时的数据过程都只在 side agent 那 边,不会污染主 agent 里面的上下文。如果你在画图的时候,想要给用户展示具体的执行的过程,比如找素材中、分隔确认中、绘画中就可以使用 skills。 但如果你要的任务很重,只想要一个最终的结论,那就托管给 step agent 就 好了。为什么复杂任务建议托管呢?是因为你需要管理你的 agent 的 注意力,过于复杂的任务会让你的 agent 上下文过载,会轻占他的上下文,他就算不过来了。 当然,这是最基础的区分,实际上会复杂很多,也会有很多衍生的方案。比如 skills 虽然会轻占你的上下文,但你也可以执行完之后再压缩。再比如,你可以将一些 skills 的 能力赋给 step agent, 这两个是你中有我,我中有你的方案,它不是互斥的核心,还是用什么样的工具来管理你的 agent 能够调度的工具,所以本质上还是上下文管理。

大家看哈,我只需要在这个文件夹拖入我想要改写的这个文章,然后在输入框这个地方呢,输入这个快捷指令,然后点击发送给 cloud code, 这个时候呢 cloud code 它就能全自动的帮我去干活,那整个过程呢,我只需要去点击 yes 去做一个审核就 ok 了。然后最关键的是它还能直接输出你指定的这个文件格式,完成之后呢,直接帮你保存到电脑的这个本地文件啊,然后打开就能用。 那这一套呢,就目前用 cloud code 结合 skills 和 subintelligence 搭建的智能改写的这样一个系统。那相比以前我们用大模型来做这个任务的话, 其实这套方法呢,会更加的自动化,智能化,批量化,而且呢我对比了一下和国内的顶尖大模型输出的这个质量哈,其实在 cloud code 的 里面,它完成的表现的还要更好一些。 那在讲这个系统之前呢,我给大家展示一下我是如何搭建的这样一个思路的。那如果你对 cloud code 和 skill 方面的这个内容比较感兴趣的话,那大家可以在评论区留言,我会赠送相应的学习的基础文档以及相关的学习渠道。 那我们来看一下啊,我这个地方主要是用到了一个 skill 和六个 sub agents 来帮我完成这个事儿,那这个 skill 呢,就主要负责去统筹全区,安排这六个 sub agents 来完成这个事儿。那其中一个 sub agent 呢,主要是拆解这个原文,呃,还有三个呢,是帮我做一个病型的改写, 另外一个呢是帮我负责输出固定格式文件的这样一个智能体,最后一个呢就是审查,那这样的一套系统呢,是我 打磨了将近两周做出来的一个商单,在这个地方呢给大家去呈现一个他全流程干活的这样一个思路啊。其实用起来这套系统很简单,我只需要在这个输入框这输入一个斜杠,然后把这个指令发给他, 然后系统呢它就会自动的去左侧这地方帮我们去读取相关的这个工作流配置,然后大家可以看到啊,首先呢调用这个 skill 去统筹全区做一个分析,然后分别先后派这六个 agents 来帮我们干活。首先是这个分析器, 你看他这地方会帮我们去拆解原文,然后去读取我们放置在这的要改写的这样一个样本,然后呢他会让我们去选要改写哪篇文章,紧接着啊他就开始调用我们文章分析的这样一个智能体, 可以看到他这方是非常详细的在拆解这样一篇文章的一个过程,那最后会形成一个蓝图,接下来就交给这三个改写大概一整词,然后让它们并行去输出,完了之后呢这一方会有一个格式的转换。 最后呢就是这个审核员会对比我们这个里边的要求,他会一一的去进行检查, 最终没有问题呢就直接输出。那这个地方呢你可以多开几个窗口同时去跑啊,也可以通过几轮的方式让他去批量生成 整个过程,你就只需要等着去验收他的结果好了。那虽然看你们看到的是这么丝滑的一套工作流,但是其实每一个工作文档里面其实都是由一系列的结构化题式组成的,其实最核心的一个大点就是首先你要对这个任务有一个流程拆解的这样一个思维, 那其次呢,你要懂得怎么去写好相应的这个提示词。那你们可以看到最后改写的这个文章啊,基本上是能够符合甲方的这个需求的, 包括整个字体,还包括里边该加粗的加粗,该上色的上色,以及包含一些特殊符号,它都完全保留了,但是文章呢,还是有区别的 好。那以上就是我们本期视频所有的内容了,那如果你对这样一套系统感兴趣的话,大家可以在评论区留言。那后边呢,小曾也会持续的去分享 skills 和内容创作相关的一些玩法,那如果你感兴趣的话,不妨点个关注。 ok, 我 们下个影片再见喽!拜拜。

hello, 大家好,上次我们利用 opencode 创建自己的一些啊 agent, skill, mcp, network, server, 还有一些就是 plug in, 那 我这次讲的是一个 怎么样在 opencode 里面创建自己的 agent, 那 那 agent 它分为两个,一个是 primary agent, 还有一个 subagent, 那 我过过一会儿会给大家举个例子,怎么样创建这些 agent? 还有一个我会讲怎么样把它被用成被用的一个镜像,就 d 格式镜像,以容器的方式把它起来。这样就有一些例子, 就比如说你想要创建一个 agent, 你 有些 agent skill 还 mcp, 这些 agent skill 已经创建好了,比如说你想实现你们公司里面一些 workflow, 你 这些东西都已经准备好了,你想分享给你的 team, 它 让你们 team 里面的人用你的这个 agent 做一些事情,所以也比较方便一点,以一个网页的形式分享给你们 team 做,让你们 team 很 方便的通过一个 agent 实现一些 workflow 或者一些 process。 那 首先我来一个说,就比如说 agent, 那 我刚才也说了, agent 大 致分为两种类型,所有的 coding agent 都是一样的,它里面 agent 都有 primary agent, 还有一个 sub agent sub agent, 那 primary agent, 比如说一个主要的 agent, 比如说他是一个写 code 的 agent, 或者是一个 plan agent, 或者是 the bug agent。 这是 以我们让 open code 做一些事情的时候,写代码的时候,它首先会通过直接我们会调用 prime agent, 那 prime agent 会根据它的些任务会调它的 sub agent, 它里面的 sub agent 有 选择性调一些 sub agent, 所以 我看一下就 open code 这边,应该它里面 build 有 两个 primary agent, 一个是一个是 build 这个 agent, 一个是 plan agent, 看一个是 build agent, 一个是 plan agent, 那 subagent 它这边也应该有几个?一个是应该有两个吧?一个是 agent, 就是 general agent, 它是一个做一些推理,一些,完成一些复杂的一些任务啊,这些东西,还有个 explore, explore agent 主要搜集相关的文件,呃,来用的就 explore agent, 还有些其他的 agent 呢?这个 agent 都是隐藏的,这两个 agent compaction, 还有那个 title, 还有个 summary, 这 agent 都是隐藏的,那我们能看到的应该是 两个 prime agent 和两个三倍 agent。 那 我们看一下啊,我们起一下 open code server, 这个项目是我们之前用的一个项目,那我们再访问一下这个页面,那首先我们怎么看他有几多少个 agent? 我 们这样说, what what agent 等于 have? 很 简单,我们看一下他在回答什么? general 和 explore explore to as smart。 我 问一下啊, what primary agent do you have? 这两个是 summer agent, 就是 general general 和 explorer explorer, 我 看 the primary type i can run here。 这好像还说的有错的,有问题,那我们怎么看?其实 primary agent build 里面这边有一个 build agent, 有 plan agent, 所以 默认是 build。 你 要做一些计划,比如说你像你,你的任务比较复杂,你想要先给他计划一下, 看一下这个计划怎么样实现你这大的任务。先做个 plan, 完了之后再利用这个 build agent 给他做事情,做计划了之后一个一个的小的任务。好,那我们利用命令的方式创建一下这个 agent, 那 比如说我要 创建一个什么样的 a j? 首先怎么样创建?以命令的方式这样创建,比如说我们看一下它里面命令有多少。这边有一个 open code a j, 你 要创建一个 a j, 就 这样创建 open code open code a j。 创建什么? a j? 创建一个 delete 的 a j。 先看创建一个, 一个 debug agent 就是 fix 问题的一个 agent。 好 吧,那我们就是 create create debug agent, debug and fix agent unit 简单点吧。 three steps first step is replicate user issue or exception。 第二个 fix fix fixing it include。 第三 try create it is fix or not。 很 简单的一个这个按钮主要是 fix 我 们的问题的,比如说我们遇到某一个问题,有些 exception 让它 fix, 那 我们就给它三个步骤,第一个就是把我们这个问题重现了,第二个就是 fix 掉,第三个试一下 这个 fix 还没 fix, 那 我们看一下,那一般它会调用这个,它根据这个描述,它会自动地调用。我们的大模型会生成一个 markdown 文件,生成 markdown 文件,一个 agent, 一个 markdown, 它会让你选择你这个 agent 要用哪些 tool。 那 我们就是末日,把所有的缺血上,好吧,来末日,所有缺血中 agent 的 末一共有三个,一个是 r, 一个是 primary, 一个是 sub agent。 那 我们选这个作为一个 primary agent 好 完了,是吧?那我们在哪里看?其实这个 agent 在 这边,它会给你创建一个 agent 的 目录。你们有玩过那么一些,我们先 review 一下,有 description, 这边有 description mode 是 primary。 primary 很 简单的一个 就是包含两部分,一个是 description, 一个是 mod, 一个是 mod, 那 我们怎么用它?那我们起来用一下。首先我看看,好吧,先起把 oppo 扣子先起来,起来,我们刷新一下,创建一个,创建一个新的参数吧。好了, 我们可以看到这边有一个,有个 a j, 我 们创建,咱们想想让它 fix 一个问题,看一下,创建个慢拍,慢拍森 造一个梦问题出来,是吧?这等一下,这截木子错了的,我们直接创到外边删掉,好内容怎么写?我们就随便写一个,一个问题,对吧?随便搞一个问题出来,好吧?就是最简单的问题,就一处零的问题,他会很简单,会报错,对不对? 这个是最简单的,我们不管是学 java 还是学 python, 其实都知道这个问题。好,那我们先给他试出来一个错误,把这个错误三频给拿出来执行一下。刚才文件开始文件把这个有三频留给有三频,把它敲出来,敲完之后你直接粘贴给他, 我们试一下,我们最主要是试一下我们这个 idea, 这个不是说这个问题比较简单,我们试一下,看看它听不听话。我们这个 idea 呢?创建完之后是不是按照我们这个思路来走的?那是不是看看一下?哦? 第一步 reproduce 我 们这个问题,我们这个问题 replica 第一步看到了吗? replica 第一步这个问题。第二步 fix, 是把它 fix。 第三步 verify 跟着我们这个节奏来走,那我们给他定义什么,他就给我做什么。那这个 agent 创建了之后,那我们再看一个,再创建一个 primary agent, 那 我们再来一遍 agent, right, 好, 我们创建哪个 sub agent? 我 们再创建一个 sub agent, 比如说我们想一个场景,我们把每次对话的 user 的 preference 把它记录下来,用这个 sub, 用这个 sub-agent。 这个 sub-agent 就是 primary agent, 会根据你 sub-agent 的 描述,然后有选择,你会调用它。那我们这样是 store user 的 user preference user user preference user preference store it into into user use a preference use a preference t x t 吧。 t x use a preference t x t 好, 就这样。好吧,简单一点,我们的目的就我们看一下它这个 subagent subagent 是 不是我们定义它, 它当它执行某些 primary primary agent 的 时候,它会调用我们这个 subagent 的 pos, 用所有的那 subagent, 我 们选一个 subagent。 好了,可以了,我们看一下他创建结果啊,这个他给我,根据我的需求,给我把这个三百帧给我创建了一遍,看一下他最主要是个目的,三百帧。那我们再启动一下,刷新一下。好嘞,那我们先问一下我们这个他知不知道我们三百帧,对吧? what's the boundary we have? 对 不对?我们用这个略对吧? what's the boundary do you have? 你 可以看到它原来不是有 general 和 explorer, explorer 这是两个三倍镜了吗?现在我们创建了一个 userpreface writer 的 一个三倍镜。好, 那你你可以说一个我的一个,比如说 i like use open claw, those days。 我 们看一下它是不是把那个东西,把我的喜好都给我记录到你的文件里面,看 是不是它开始调我的 version, 它开始搜集我的 preference, 把它记录到那文件里面。我们先看一下它记录的东西。 choose preference use, 对, 可以看到它是不是记录下来了,是吧?再说一下吧。 i like traveling when i'm free when i'm free。 看一下,再让他记一下。你看到是不是他在执行他的 partying 的 时候,他在调我的这个 subging, 我 自己创建的 subging, 看一下 hobby, enjoy traveling in free time。 感觉这个很 nice, 很 nice, 一切都是按照我们想象来的,是吧?好了,那这个是 power engine 和 seven engine 怎么创建呢?还有一个是 commas, 对 吧?那这个也很这个也应该是比较比较实用的吧?比较实用的吧,我看一下它这里面可以创建吗? open code 有 没有这个 coma 的 这一项? coma 的 coma 的。 没有 coma 的 这个东西,没有 coma 的 这个东西。 那行吧行吧,那就按照它这个目录来吧。好吧,我们试看一下,看一下它是什么样效果。嗯,我也不知道,我知道格式里面是有这个这个东西的,但是没用过它在这里面的, 这里面的重启一下,按道理如果和格式一样的话,它也是一个斜线就可以弹出来 command, 那 我们看一下它是不是和我预想一样的,好像是的,是的, no 的。 哦, 我看看。哦,我知道了,他那个我选一个模型,对吧? ipa, 然后 gpt gp 四。哇,他这还比较好的,这里面还可以配置那个模型,你用哪个模型?我记得他还是还可以在这个, 在这个 open jason 里面还可以配这个模型的那个 temperature。 这个是还是不错的,就说你某些任务,你想要改变它的那个模型的那个 temperature, 就是 超餐, 你可以改这个我感觉还是比较灵活的,这还是比较好的一个功能哦,看一下,这个就是一个 command, 看 rise 或者是这个这个这个这个,好吧?那不用管它了,其实不用管它,这个 就是侃马的,就这侃马的其实就是说他根据你这个 macdunk 文件里面的内容,然后做事情,这 macdunk 里面你写的是指令,然后他根据这个指令然后做事情, 这个没关系了。哦,那就这样,那还有一个就是说我们,我们比如说有些场景,就比如说你,你已经做了,他听过这个 u i, 对 吧?然后他也听过一些 m c p, 还有个 agent 的 plug in, 对 吧?那你那你想把这些你做的一个 agent 之后,你想要分享给你们 team, 然后以网易的形式给它分分享出来,那怎么做呢?那我们可以拿 build 的 一个 dunk 镜像,然后 这样你在 dunk 镜像里面运行起来之后,然后把那个链接给给给给你们 team 分享出去。那怎么样备用这个 dunk 镜像呢? 我们就是要首先在项目里面要要要创建一个 docker file 文件,对吧?然后还有一个就是就是把营销运行的时候的环境 把它背后出来,比如说 python 环境到 js 环环境和 get 环 get 的 环境,这些都在那个 docker file 里面,把它全部配好,配好之后然后把这个把 open code 把它运行起来。那我在这里的话,我就 docker 文件,我就不需要,我我我我不需要,就是 手动创建了,然后这里面我之前已经创建好了,那我们直接 copy 过来吧,好吧?看看一下我在哪里呢? copy 过来,对吧?那我们就先看一下,大致看一下嘛,最主要这个 dunk file, 对 吧?我刚才 copy 两个文件,一个是 dunk file 文件,一个是 啊 hpo 的 一个文件,那 document 文件的话,主要是定义就是说你的 best 镜像是那个 ubit 图的,然后你做的事情最主要一步就是首先你把你的那个 open code, 把它登录一下的 install install 好, 然后还有就是说你的到 note 啊,还有就是说你的 python 环境, 因为你癌症 skill 有 可能会执行 python 嘛,然后要 python 的 环境,所以你把 python 环境准备好。还有一个就是 note 减死的环境,就是 note 减死环境,你要把它 build 出来,把它 install 好, 然后 build 出来 就是 note 减死这环境。还有一个是 get 环境,那 get 环境什么意思?就是它会,它会用这个 get, 然后借助于 get, 然后看一下你的代码,代码改变哪些代码,然后做一些做这些这方面的事情, 然后这样定的话,你就给它配一个假的,一个一秒拽死就可以了,一秒拽死就就可以,对吧?这边然后还有一点就是说你把你本地的这些文件配置的 agesgo, 然后把它 copy 到, copy 到根目录里面, 或者是后目录里面的一个点 open code 的 这个这个文件夹里面就可以了,就可以了。 接下来就是会调用这个 atropoid, atropoid 占脚本,这个 atropoid 占脚本很简单,就是把它直接起来嘛,就是 open code server 直接起来, 那么必有镜像的话很简单嘛,就是我们,我们直接必有那个镜像 cd 的, 可怎么必有镜像呢?然后 open key, 然后 open key 编辑,好吧, 这个开始了,对吧?给大家表演一个镜像,哦,我知道了,与文件有问题,对吧?这个不需要,这个不需要,你把它删掉,把这个删掉,好吧,咱们再创建,那这个其实这个东西就是你 准备的拍摄环境的时候,你最好是创建这个,这个这个 requirement, 对 吧? requirement tst, 对 吧? 那我们创建一下吧,因为有些时候真实环境的时候,你肯定肯定是要这个文件的,你肯定要这个文件的,把你的拍起来里面用到的包全放在这里面了,我们先建的时候, 试验的时候就是就是把它创建成空的就可以了,对吧?这个过程比较长一点,这个过程比较长一点,我到时候我到时候直接把它暂停掉啊,然后说我们这个镜像已经变得完了,对吧? 这项备用的完之后,我们就是直接把它启动起来,对吧? g 杠 d, 欧邦,欧邦扣的一六八 p 四零九六 四零九六,是吧?欧邦扣的镜像名字好,启动之后一点点它,看一下效果怎么样,是不是第一次比较慢一点?应该是他要他要那个,那完之后一般都是要重新选一下 work space, 重新选一下,就这边, 因为我们的那个镜像里面不是那个那个什么那个那个用的是默认的是 workspace 嘛?这个 workspace, 所以 我们这边选中选它这个, 然后我看一下它吧,还可以,对吧?然后看一下 m c p 也有,对吧? s p 证明讲的成功,是吧? markin 也在,对吧?这个不是大问题,对吧?行吧, 那就那就还有一个问题,就刚才不是有个问题吗?就是我刚试一下,好像不成功, 有次不成功的原因是是因为我这边有个 oppo 扣子,这边有一个 bios, u i 这边设置的是 logo, 设置 local 的 话, local host 的 话这边就有问题了。所以如果是 dunk 起的话,这边是把这个 local host 改成这个 host 的, dunk intern 就 可以了,就就可以了。好,就这样,那就, 那就拜拜。就是我会把这个仓库仓库地址会代码会上传到那个 game 里面,然后到时候在我在 b 站里面, b 站的那个视频底下,我会把这个仓库地址会给你们,然后你们到时候就可以看到那个地址,然后进一步研究研究这些代码。好,拜拜。那就拜拜。

一页图讲清楚 ai 硬核技术,上期 qd code 用 memory files 立规矩,上下文工程管主 sub agent 协作,这期补齐关键一环, memory files 到 skills 动态执行。一张图讲透视 cloud code 渐近式批录黑科技,存图下来,跟着我三分钟拆明白。 先看顶层结论, memory files 渐进批录到 skills y a m l 标准化 main agent 调度零改动批录机制产品化升级,不是推倒重来换引擎,而是从每项目手工造轮子升级到标准化,可附用引擎,工程效率直接拉到十倍。左边第一张卡片讲眼镜真相, memory files 的 痛点特别现实,每项目都要手动写两百行缩影文件,维护成本高得吓人,吐扣路径还得印编码,重复劳动特别多。 skills 彻底解决了这个问题,用 y a m l frontmet 声明技能定义,自动扫描匹配,执行完零污染回收,开箱即用 一个 skills 文件,全项目附用,省时百分之八十,手工造轮子直接变成生态共享。中间这张卡是全篇重头戏, skills 的 四部闭环,加上下文工程 main agent 主导全程。第一步,启动扫描,只读 y a m l front matter 抓技能名称描述触发条件,一百 token 搞定,完全不浪费。 第二步,匹配任务,根据你当前需求,自动挑最相关的 skill。 第三步,注入正文五 k token 级别。 这里分两种执行模式,简单技能用内联模式,主 agent 直接突物靠执行。复杂技能用 fork 模式派 sub agent 的 隔离深挖,比如长链路调用,或者外部 api 结果回流汇合到主线。第四步,执行回收两百 token, 玻璃 只留结果摘耀,上下文干净如新。这套主 sub agent 分 工加动态注入玻璃,就是 skills 的 上下文,工程核心主线永远保持干净。 右边卡片把动态化收益一目了然。第一块,零污染上下文,从一百 token 扫描到五 k 执行,再到两百摘药,用完即收,窗口永远不爆炸。 第二块,零部署,零配置, y a m l 声明加 md 执行说明,放进 c q s 目录就行,完全不像 m c p 需要部署复杂服务。第三块,静态加动态互补 memory files, 当目录,告诉 ai 项目里有什么, cygos 当执行引擎,教它怎么用,两者缺一不可。底下的药丸总结特别到位,一百吨到五 k 吨到两百吨,零污染回收,静态动态完美互补,底部对比把三家彻底拉平。 memory files 是 静态规则目录,启动时加载,告诉 cloud 项目里有什么,但不执行具体操作。 cygos 是 动态执行模块,按需加载,零部署,零污染回收。 mcp 是 外部接口标准,功能上指示通路部署复杂,成本高。 现在二零二六年趋势很清楚, m c p 退居基础设施底层, skills 成为 agent 标准接口,人人能写,人人能用。最后看 take a 为一句话带走 c skills, 用渐近律路实现标准化执行。 memory files 原型升级到 c skills 产品化, main agent 调度零改动,工程效率十倍提升,引爆整个社区生态。 cursor、 wind surf 都在跟进, 社区 skills 生态快速壮大,标准化执行正在成为 a 证开发新范式,跟前面几期连起来看,系列彻底齐活了。 lossless curl 是 无损全量规,当 windows 是 多模型漏斗选料, cloud code 用 memory files 立规矩,加上下文工程。现在 skills 把静态记忆升级成动态执行,让整个 agent 从精英工具变成全民技能。 cloud code 的 生态闭环达成。这张图你一定要存下来! 下期终极横屏, curser 乘 windsor 乘 claud, 谁的上下文工程最能打?点个关注不迷路,我们下期见!

如果大龙虾只装一个 skill, 就 装这个 skill self improving agent 中文翻译很奇怪啊,但是这个 skill 就是 一个让你的小龙虾学会自己复盘的 skill, 每一次他做错了任何事情,他都会 自己去记录正确的操作是什么,下一次的时候他就会使用这个记忆。你看每一次的时候我就说复盘使用提升 skill, 你 看看他是怎么说的,他说好怎么怎么怎么样,现在执行自我进化,把这次教训写到系统里面,这个真的非常 ok。

今天来聊一个多 agent 写作中的核心问题, opencloud skills 是 怎么分层调用和管理的? 你有没有遇到过这种情况,明明改了 skill 文件跑起来却发现生效的是另一个版本,完全没有变化。这就是 skills 调用的玄学问题,今天给你把它说清楚。 首先搞清楚两个概念, tool 是 能力层,是 agent 可以 直接调用的操作,比如读文件、执行命令、控制浏览器,解决的是能不能做的问题。 skill 是 方法层,是工作流程和操作说明,核心是 skill md 这个作战手册配套 references 和 scripts 资源,解决的是怎么做,按什么步骤做的问题。 openclaw 从四层目录发现, skill 每一层的共享范围和优先级完全不同,这是理解整个机制的关键。 第一层是 extraders, 在 openclaw g s o n 里配置额外目录,优先级最低,适合挂在团队共享 skill 包,而不污染系统目录。 第二层是内置层, openclaw 安装包自带,比如 healthcheck, weather 这类通用 skill, 所有 agent 都能访问。 第三层是共享层斜杠 openclaw skills, 这是官方唯一的跨 agent 共享路径,同机器所有 agent 可见。 第四层是私有 workspace 层,各 agent 专属目录,优先级最高同名 skill 会覆盖下层所有版本,最低优先级是 extras 在 open core gson 里配置的额外目录,适合团队共享 skill 包, 内置层随 openclaw 安装包发布,比如 healthcheck, weather, 所有 agent 都能访问。共享层是 openclaw steals 官方唯一的跨 agent 共享路径,同机器所有 agent 可见。 最高优先级是私有 workspace 层,各 agent 专属同名 steal 会覆盖下层所有版本, main agent 正常夹在四层 skill, 而 sub agent 官方文档明确说明使用 minimal。 系统提示 skills 整个模块被省略,只注入 agents md 和 tools md。 也就是说,不管是局层、共享层还是私有层, sub agent 一个 skill 都用不了。 官方文档 system prompt md 原文 minimal 模式用于 sub agents, 省略 skills、 memory recall model, aliases 等模块。 而且 sub agent 绘画只注入 agents md 和 tools md, 其他引导文件都被过滤掉,目的是保持 sub agent 的 上下文尽量小。 同名 skill 同时存在时,优先级是私有, workspace 层最高,然后是共享层,再是内置层,最低是 extras 配置目录。 高优先级的 skill 会覆盖低优先级的版本,这就是为什么改了文件却没生效,你改的是低优先级的那个。原则一,分层放置公共能力,放共享层角色专用流程放肆,有 workspace 不要混在一起。 原则二, sub agent 另辟蹊径。 sub agent 完全不加在 skills, 如果需要给他传递工作流指令,要通过 task 描述 attachments 附件或 sessions 下划线 send 消息来传递,不能靠 skill。 原则三,附用优先需要多个常规 agent 共用的 skill 优先放到斜杠 openclo skills 共享层避免放在私有 workspace。 原则四,边界清晰,专属角色的 skill 留在其私有。 workspace 明确职责,降低排障成本。 核心结论, open cloud 的 skills 不是 统一目录插件,而是分层发现按 workspace 和共享范围组织的工作流系统。常规 agent 按四层优先级加载 skill, sub agent 是 个例外, skills 整个模块被省略, 设计多, agent 写作时认清这个边界才能避免踩坑。好了, openclaw skills 的 分层管理机制就讲完了, 记住三件事,四层目录按优先级加载共享层是跨 agent 写作的关键, sub agent 完全不加载 skills。

opencloud 装完,先别急着用技能商店上万个 skill, 但真正的底座就这六个,排行榜安装量最高的一条命令全装完!第一个, agent browser 浏览器自动化, 让 ai 自己去操控浏览器,点按钮、填表单、截图、下文件,连动态渲染的页面都能读,相当于给 ai 装了一双手。第二个, heavily search, ai 专属联网搜索,返回结果没广告,结构化输出,直接给 ai 消费网页正文,自动提炼关键信息, 你的 ai 终于不用靠过期知识回答问题了。第三个, self improving agent, 自我进化,记住你的代码风格和习惯,从每次出错中学习,自动修复, 跨绘画,保持记忆,越用越懂你,效率越来越高。第四个, find skills 技能,发现神器,像逛应用商店一样搜索 skill, 自然语言描述需求就能匹配排行榜推荐加批量管理,升级回退,一站搞定。第五个 skill vendor 安全审查官,装任何 skill 之前,先让它扫一遍,检测恶意代码拦截权限越界,阻止隐私泄露,出具安全评分报告, 相当于给工具链装了个门禁。第六个, email management 邮件管家, ai 帮你读邮件,写回复,自动分类整理常规邮件,直接朝你发送。 gmail、 outlook 幺六三 qq 全都支持。

大家好,今天给大家介绍 cloud code 的 一个强大功能, surveillance 代理并行任务。什么是 surveillance? 它是 cloud code 强大的并行任务处理功能,它允许你同时启动多个子代理,让它们分别处理不同任务。最后,汇总结果。 这就像拥有一个整个工程师团队,你一个人就能指挥。首先,定型执行,你可以让多个子代理同时工作,每个代理独立处理一个任务,例如,让一个代理重构代码,另一个代理写测试,第三个代理查文档, 三个任务同时进行,大大提升效率。其次,专业分工,不同的子代理可以擅长不同领域。你可以创建专门负责代码审查的代理,专门写测试的代理,专门处理文档的代理。主模型会根据任务自动选择合适的子代理。 第三,信息汇总。子代理完成任务后,主模型会自动汇总所有结果,你不需要分别与多个代理沟通,只需给出一个总体指令, cloud code 会协调所有子代理 使用方法很简单,在对话中直接指定子代理任务即可。例如,请让代码审查代理检查这个 pr, 让测试代理补充测试用力。 survegence 适用于多种场景、多文件并行处理,代码审查加重构,同时调研多个技术方案,大项目拆解分工。 总结一下, surveys 让 cloud code 变成了一个团队指挥官,一个指令,多线并行,效率翻倍。学会这个技巧,你一个人就是一支开发团队。

大家好,我是破旺,那我们来今天的这一个阶段性的整理啊,今天也不是实况啊,是阶段性整理,那这个阶段性整理呢?是关于 skill 的 一个使用啊,关于 skill 的 一个使用, 那这个 skill 这个技能就是其实都是有很多的一些的用法,很多的一些用法。但是呢目前对于,呃我当前的这个实战啊,实战这个项目当中 啊,就是多角色配音这个这个项目当中其实我只是使用到了 skill 当中的两个能力,那第一个能力呢,就是固化了一些的提示词啊, 啊,就固化了一些的体式词啊,也就是说当这个 agent 或者是 sub agent, 然后再去运行的时候啊,它可以通过这一些固化的一个体式词去应对一些的情况,那比如说呢,就是看我当前的这几个啊 skill 啊,当前的这个 skill, 就 比如说以这个,以这个为例吧。啊,这个是比较典型的 就是叫快速启动协调器啊,快速启动协调器我也不知道他为什么会命名成这个,但也无所谓吧, 就是当我们要想进行一个任务的一个开始的时候,那我正常情况下呢,我可能要去跟他去做很多的这个一些的描述啊,就比如说这样的一个情况, 嗯,就比如说这样的一个情况,就是我需要你阅读这样的一个方案,然后呢用 sabrizen 对 当前的情况做一些深度调研,然后设计信息, 然后呢再使用这个 sabrizen, 然后完成接下来的第二阶段,第三阶段的一些的构造与测试,然后最终来进行验收,生成信息报告等等,这这些我都每一次都要打一遍这些字儿的 啊,每一次都要打遍这些字的,但是呢如果要是不想打这些字呢,那就可以去做这样的一个处理,就是把这个东西呢固化成一个整体的这个一个 skill。 但实际上呢他说的他所描述的这些东西就是就是这个其实就是这个事, 那这个 skill 呢,它也是属于跟着这个另一个 skill 去配合的,因为可以看一下这个是另一个是干嘛的? 另一个呢就是属于在啊上一个任务之前,上一个完成任务之前,然后那个任务完成了嘛,然后对那个任务进行一些的总结啊, 那主要是针对这个上下文窗口有限的一个问题,然后创建简节结构化的一些的项目状态的一些目录,然后去来解决这个问题啊,做一些的一个文档啊,就是做这样的一些的总结。 那做完总结之后呢,然后就会回到这样的一个 skill 上啊,回到这样的一个 skill 上,然后呢它就会起通过这个啊这个 skill, 然后去运行的时候,就会把之前的那个 skill 的 一些的总结或者一些的文档等等进行一定的阅读,然后呢去打一些的配合,然后呢再去做一些相关的执行啊,相关的一个执行就可以了, 那这个呢就是我的第一个用法啊,第一个用法就是这个固化一些的题词词啊,然后第二个呢就是间接式,譬如啊 那间接式譬如呢也是 skill 的 一个设计的一个核心,也是我核心比较看重的一些的一个部分,那这个呢就是我以另一个 skill 为例啊,就是这个 啊,这个 skill 它的那个整体的就还是呃,需要借鉴式的,是比较典型的,那这个是啥呢?就是它是管理对外部的系统性的 a p i 的 对接啊,或者说一些的部署服务器的信息,就这样的一些的解释和说明 啊,当需要进行第三方的集成,或者说部署或者说一些的那个啊,调试的时候就要去来去阅读这个 skill, 那这里面呢具体的内容呢?都有啥可以看到?就是比如说这一些外部的 api 的 一个对接啊,然后部署任务 啊,具体的一个算法案例,就是因为我们之前设计的是有阿里云的这个云合成和火山引擎的嘛,那阿里云的和那个这个云合成,那你就要去读这样的一个这个文档啊,如果要是关于火山引擎呢,你就读这个文档就可以了,那这个文档在哪呢?就是在这啊, 然后它就会自己根据不同的一个情况,然后去读这个是阿里云的,然后呢这个是 api 集成的啊, api 集成的,这个呢是部署环境的啊,相关的一些的信息,这个呢是火山引擎的, 也就是说当我们就不用再去反复跟它去强调这些的信息,它如果有需要的话,会自动去读取这个 skill, 然后再去读取这四个的一个相相关的一个信息, 而且他当他读起阿里云的时候,这三个就不会去读取了,这个是能够大幅度节省我们的一个上下文的一个空间的。嗯,那这个是属于第二点 啊,其实还有一个第三点,那第三点呢?实际上是自动化啊,执行一些的脚本,自动化,执行一些的脚本, 呃,而自动化执行脚本呢,其实我用的还是比较少,用的比较少。为啥呢?因为我整体的就是可以在看了这么多期的一个实战下来啊, 就是我基本上都是以手动的啊,以手动的,那后面呢?有一些的自动化,但是呢,以这两个啊,以这两个就为主就可以了啊,以这两个就足够了, 我不需要他去帮我去执行一些什么样的一些的自动化的一些脚本。但如果你要是把 skill 当做工作流程去用,那就是可能需要大量的使用这个这个功能了,但是我目前的这个项目里面是没有涉及到这些东西的,而且即便是要去我另一个项目 啊,他有是有工作流的一些的编排,但是那些工作流的编排我也不会用这个 skill 来去做相关的一个处理,而是直接用程序来处理。因为你大模型,你再去做这种工作流的编排,然后再去做这样的一个自动化执行的话 啊,他有一定概率不触发,或者说触发偏了啊,这些都是有可能的。大家看我的一个词框也是能够发现,其实并没有让他触发的时候他给触发了,然后不让他触发的时候,他反而偏偏偏偏 就是让他触发,偏偏就是不触发,哎,这点就很烦。所以你用程序执行自动化脚本,这个我认为是比较好的啊,好,就这样,拜拜。

所以,如果你也在做智能体,我建议你今天开始换一个思路,不要再指定 the prompt, 而是先问自己这四件事,任务怎么拆?模式怎么选?上下文怎么给?结果谁来审?当你开始这么想的时候,你的 agent 才真正从 demo 走向系统。 这是昨天谷歌发布的一套 a 阵的架构设计方法,我觉得这个内容特别值得讲,因为现在很多人在做智能体,还停留在写提示词、接几个工具,拼一个工作流这个阶段。但谷歌这次其实讲的很明确,真正决定 a 阵的上线的不是提示词,而是架构。 这套内容里,他总结了五大 a 阵的技能设计模式。看完你就会明白,为什么有些智能体只能做 demo, 有 些却真的能落地, 为什么要开始从模块化思考。这一页其实是在讲一个很现实的问题,很多团队现在做 agent, 其实越做越乱,前面加一个提示词,后面挂一个工具,中间再塞点知识库,最后整个系统像毛绒球一样,谁都不敢动。所以谷歌这里提了一个非常关键的方向, 不要再把 a 证它当成一个大一桶黑盒,而是要拆成模块。比如输入要怎么处理,上下文怎么拿,输出怎么生成,结果怎么审核,每一块都应该有边界,只有这样,你这个智能体才能赋用,才能维护,也才能往企业场景里放。先拆开一个 a 证,它技能包 一个完整的 agent 技能其实不是一句提示词,而是一整套设计,里面通常包括什么呢?有角色定义,有模板、有参考资料、有规则说明, 说白了就是 agent, 不 只是你,是谁?请你帮我干什么这么简单。他背后应该有完整的技能包,这样他在执行任务的时候才知道自己该按什么标准做,遇到什么情况,怎么处理,输出又该长什么样。那以后做 agent 不要只写 prompt, 要开始写 skill。 第一个模式叫 to rapper, 你可以把它理解成把一个明确能力分装成工具,让 agent 去调用。比如查数据库,查知识库,发请求,调接口,执行动作,这些都很适合做成图。 这样 agent 本身不需要什么都懂,他只需要知道我什么时候该调用这个工具,传什么参数,拿回来什么结果。这个模式最大的好处就是两个字,稳定。因为你把能力边界定义清楚了, agent 就 不会老是自由发挥。 所以如果你要做企业里的智能体,像审批、查询报表、数据检测这种,我觉得 to rapper 基本是绕不开的。第二个模式叫 generator, 也就是生成器。这个模式适合干什么?适合做报告、邮件、方案、总结文案这种有固定结构的内容生成。 谷歌这里强调的重点不是让模型随便写,而是模板驱动生成,先把格式固定好,再让模型往里面填。比如一份周报,开头写本周正点,中间写进展,后面写风险和计划。那你就不要每次让模型自己想结构,而是直接给他模板,让他按这个框架输出, 这样做出来内容就会更稳,也更适合业务场景。所以这一页其实在告诉你,生成了 agent 想要好用,关键不是更能写,而是更会套模板。第三个模式叫 reviewer, 也就是审查者。这一页我觉得特别重要,因为很多人做智能体只关注怎么生成,但真正决定能不能用的,往往是谁来检查。让一个 agent 负责产出,另一个 agent 负责审核。审什么呢? 审格式对不对?逻辑顺不顺?内容全不全?有没有明显风险?本质上,它是在模拟真实团队里的分工,一个人写,一个人审。 这个模式就特别适合高要求场景,比如合同、报告、方案、流程、文本、制度、文档。因为你只靠一个 a 站台一次生成很容易飘,但如果后面再挂一个 review 了, 整体质量就会文很多。第四个模式叫 in in 第四个模式叫 in warren。 这页稍微抽象一点,它特别关键,它想表达的是,不要一开始就把所有的上下文都塞给 agent, 而是让 agent 在 真正需要的时候再去拿对应的信息。 比如有些知识规则、历史记录,并不是整个流程每一步都需要,那你其实没必要从头带到尾, 应该是谁需要谁去取,什么时候需要,什么时候再加载。这样做的好处很明显,第一节省上下文,第二减少干扰,第三也更利于系统扩展。说白了,这一页讲的就是上下文不是越多越好,而是越精准越好。 第五个模式叫 poplan, 也就是流水线。这个模式就很好理解了,你把一个复杂任务拆成各个步骤,那第一步理解输入,第二步处理任务, 第三步检查结果,第四步整理输出。每一步只做一件事,前一步过了再走下一步,这就像工厂流水线一样。为什么这个模式重要?因为很多 a 站的失败,不是模型能力不够,而是他把所有事情一次性做完,结果中间出了问题也没人发现。 而 powerline 的 好处就是可控、可查、可回溯,非常适合企业里那些流程明确,结果却要求高的任务。到了这一页,谷歌其实在做一个汇总,意思很明确, 如果你是调工具做 agent, 不要上来就问哪个框架最强,你应该先问自己,我这个任务到底属于哪一种模式?这一页其实已经不是在讲单一模式了,而是在教你怎么选架构。 它像一个决策树一样,先问你几个问题,你需不需要结构化产出?你需不需要检查和反馈?你需不需要步骤编排?你需不需要调用工具? 这一页是我觉得最有价值的一页。因为谷歌明确说明了,真正好用 a 阵。真正好用的 agent, 通常不是只用一种模式,而是多种模式组合。比如用 powerplay 把流程串起来,那比如说,如果,如果要查外部数据,那再通过 to rapper 去调用工具。 你看,这一下就从单个智能体升级为完整系统了。所以说,很多人老问智能体到底怎么做才专业?答案往往不是更会些 prom, 而是更会做模式组合。 adk 的 思路,渐进式批录, 这一页讲的是一个特别像工程实践的概念,叫鉴定式。譬如什么意思?就是不要一上来就把所有信息暴露给模型,而是随着任务推进,逐渐给他需要的那部分。比如一开始只给目标和基本上下文,后面需要再调用知识再补知识,需要审核规则再补规则,需要执行工具再补工具。

通俗讲解,大模型、 a、 简体、 m、 c、 p、 skill、 open call 到底是啥?家人们今天把 a、 简体、 m c p、 skill、 open call 这几个 ai 核心概念一次性讲透听完,保证你对这些知识点理解的明明白白。咱们先从跟上说起。第一个必须先讲大模型。 大模型是啥?说白了,它就是个能跟你对话的 ai 大 脑,你跟它说话,它就能回你消息。但它有个致命问题,没记忆。比如你跟它说我是小周,它回你,你好,等你再问我是谁,它直接蒙圈,压根记不住。 为啥会这样?因为大模型底层是靠神经网络一层一层计算,最后通过概率生成回复,不是真的记住了你说的话,所以还容易出现幻觉瞎回答。 ai 没有记忆肯定不行啊。所以大家就做出了话题,也就是聊天机器人 八 t 是 干嘛的?他就是大模型和咱们之间的中间人。你跟八 t 说我是小周,他会把这句话记下来,等你再问我是谁。八 t 不 会只把我是谁发给大模型,而是把之前所有的聊天记录一起发过去。 大模型看到完整的对话记录,就知道你是小周了。所以八 t 的 作用就是让大模型看上去有记忆,能正常跟人聊天。 但光会聊天的 bug 功能太弱了,你让他关电脑,执行程序,查今天天气,他啥也干不了。所以就在聊天机器人的基础上,又升级出了一个东西, a 兼体,也就是智能体。 a 兼体用一句话总结能调用工具的 ai 程序, 那什么是工具?比如一段能查天气、看日期的代码接口。大模型本身是有知识盲区的,比如他是二零二五年五月一号训练完的,那五月一号之后的是实时天气,今天几号他全都不知道,因为没训练过这些数据。 但一阶梯不一样,他能调用工具,先通过工具拿到实时天气、当前日期这些信息,再把结果传给大模型,大模型分析完再给你回复。 简单说, a g n t 就是 靠调用工具帮大模型补齐信息短板,解决大模型做不到的事。 可新问题又来了, a g n t。 要调用的工具太多了,高德的天气接口、饭店接口、景区票务接口,每个平台的接口规则都不一样, a g n t 调用起来麻烦,第三方平台开发接口也麻烦。 咋办?那就定一个统一的调用协议,只要 a 检测和第三方平台都遵守这个规则, a 检测就能轻松拿数据调工具。这个协议就是 m c p 模型上下文协议。 一句话,既死 m c p, 就是 为了让 a 检测更方便地调用各种工具,再把工具获取的信息传给大模型,让大模型能精准回复。 接下来讲 skil, 之前口误说成 sk 啦!之前 a g n t。 调用工具有个大弊端,得把所有工具的说明书、参数全都发给大模型,数据又多又乱,还影响性能, 所以就推出了 a g n t skil 这个方案。 skil 其实就是一个文档,比如文档文件只需要在里面写几行元,数据定义好,用户有什么需求时调用这个 skil, 不 用把所有细节都塞给大模型。 这样一来,一个 a 监 t 能绑定一堆 skill, 需要用的时候直接调用,性能直接提升。而且 skill 的 本事超大,能做知识库,能定义工作流,各种复杂流程都能装进去,所以直接混出圈了。 简单说, skill 就是 一套做事的规范文档,规定好一件事该怎么干,要用哪些工具。一个 skill 能关联调用一堆 mcp 和工具,能力直接拉满 skill 这么强大,能操作浏览器,写代码,搭建工作流,甚至能替代传统的流程工具。所有 ai 开发工具都赶紧接入了 skill, 这时候 opencall 就 登场了。 opencall 是 啥?它就是一个完全依靠 skill 生态的智能体, 它的核心特点,自身没什么固定能力,所有能力全靠接入的 skill。 想让 opencall 变强,不用改动它本身,直接去 call 平台下载对应的 skill, 装上就能实现各种功能, 所以压根不用操心 opencall 本身强不强。它的能力上线,全看接入的 skill 生态有多丰富 到这大模型。 but a g n t m c p skill opencall 的 关系,小荣就给大家讲透了。 打磨行驶基础, ai 大 脑八 t 解决记忆问题 a 减 t 负责调用工具 m c p 简化工具调用流程 skill 规范做事逻辑。 open call 靠 skill 生态实现全能能力!

open 壳三十二天烧了二十亿 token, 这两个 skill 直接帮你把浏览器的 token 砍掉百分之八十。 先说结论, bb browser 能用就优先用,不支持的再用 agent browser。 为什么呢?因为这两个 skill 啊,它核心就干一件事,就是只给大模型最精简的交互信息,所以 token 可以 直接砍掉一大截。 其中 b b browser, 它直接把网站当 a p i 用,还能附用登录状态,但是它只支持固定的平台,大概三十六个。那通用的网站怎么办呢?交给 agent browser, 它负责像人一样操作网页,点击输入翻页。所以啊,这两个组合起来,专门解决登录问题和偷看爆炸。

hello, 大家好,是不是辛辛苦苦跟着教程装好的 open curl, 满心欢喜的以为自己能够拥有一个无所不能的超级助理,结果发现他好像什么也干不了,甚至还有点笨。 你让他去查看文件,他会说没有权限,你让他搜索一下天气吧,他又说没有联网。先别着急着怀疑人生, 接下来我会手把手教你给 open curl 装上这六个 skill, 让它真正的从一个聊天助手进化成一个赛博牛马。正式开始之前呢,咱们先来熟悉三个最常用的命令, windows 的 用户请你打开 power show, mac 用户呢,请你打开终端。 open clone 呢,有一个官方的技能市场叫做 cohab, 上面足足有两万多个大佬们已经写好的 skill, 咱们全部都可以直接拿来用。 接下来我要给大家重点推荐的六个超强的 still 呢,也全部都在这个里面。不过先别着急,在正式的把它们装进我们电脑之前呢,我们需要花一分钟的时间搞定几个关键的前置操作。第一步, 我们需要先给它装一个应用商店,也就是 apple store。 windows 用户打开 power show, mac 用户呢,进入终端输入这行命令。后面呢,装其他的技能也就是一句话的事,装完这个呢,先别着急着跑,这里有一个新手极其容易踩的超级大坑, 从二零二六点三点二版本开始呢, open club 默认对本地文件的读写做了严格的限制,如果你不想你的 ai 连个本地的文档都打不开,那需要把你的权限 全部解开,操作呢,非常简单,打开 power show 或者终端输入这行命令。那么 现在呢,我们我们就把工具的权限切换成了完整版,注意,运行完之后呢,我们一定要重启一下网关, 让我们的配置生效。搞定这一步呢,你就可以让 open call 自由的去读写和修改你电脑中的各种文件。底层的权限和应用商店呢,都已经准备好了,接下来我们就是见证奇迹的时刻, 我将会把最必要的六个核心的技能教给你,咱们挨个装。 第一个 skill, 突破次元币的一个联网神器 telesearch。 你 肯定好奇为什么你的 ai 总是两眼一抹黑, 原因很简单,因为呢,他还没连上网。所以呢,咱们第一个必装的技能就是 table search, 这里呢,有一个坑,大家注意避雷啊!这个插件呢,最近在 cohab 的 应用商店下架了,不过别慌,咱们可以去 w 三 c school 的 备份站那下载,安装的方式非常非常省事,我们只要把安装包下载好之后呢,直接告诉 open call 你 的包在哪,比如说 帮我安装这个目录下的这个技能。但是注意,装完还不算完,我们还需要去 telly search 的 官网去注册新建一个密钥,它每个月都会有免费的额度,而且完全不需要绑定 visa 卡。 拿到密钥之后呢,直接发给 open klo, 让他帮我们配置好。搞定这一步之后呢,你的 ai 就 正式的拥有了一个看世界的眼睛。第二个 skill, 授人以渔的技能,雷达 find skill。 如果你每次都需要手动的去给 ai 找技能,那真的是太累了,那么我们不如格局打开,直接教给他,让他自己去找。 那么这个 skill 呢,可以帮你去搜索你所需要的一个 skill, 装上这个神器之后,比如 你想找自媒体运营相关的技能,你直接问他,他会非常精准的给你一个推荐。那么操作步骤,我们打开终端,输入这行命令。那么第三个 skill, 打工人觉醒的主动型牛马 pro active agent, 一个让 open clone 变成一个卷王之王的 skill, 有 了它呢,你的 ai 就 有了主动权。比如你丢给他一个大的任务,他会根据自己来去拆解步骤,然后自己呢去找工具去执行, 遇到问题呢,他还会自己去想办法去绕过去,再也不用你去一步一步盯着他干活,这呢才是一个合格的赛博牛马。 那么方法呢,和上面一样,我们输入这行命令,然后进行安装。第四个 skill, 一个究极进化的自我反思的 skill self improving 拍拍手,讲重点了啊,这个技能绝对绝对是王炸, 普通的 ai 做错事只会原地的死机,或者给你胡说八道。但是这个 skill, 他 就有了一个反思的能力,就像我们平时做 ui 设计 d 稿 b 了,没关系,复盘一下,哪里不对,我们改完呢,又是一条好汉。 他也一样,任务执行失败了呢,他会根据自己总结经验,然后调整策略,再重新试一遍,简直真的是越用越聪明。同样的 操作方式呢,也是在终端呢,我们输入这行命令就安装可成功了。第五个 skill, 眼观六路的多元搜索 multi search internet。 这个 skill 呢,可以让我们的 open curl 同时调用多个搜索引擎, 然后去交叉对比信息,然后彻底告别我们单一的个信息源,然后导致我们的误导,给你最最最安全,最最准确的答案。 有时候呢,只用一个搜索引擎,搜出来的东西可能不是那么全面,那么我们就给他多配几个第六个 skill, 替你去上网冲浪的赛博双手 agent browser。 最后这个 skill 呢,不仅能让他联网,还能让他像真人一样去浏览和操作网页。这里安装是稍微特殊一点点, 需要分为两步,一步呢是先去给电脑的局安装浏览器依赖, 第二步呢,再把它安装到我们的框架里面。搞定这个之后呢,他就能够帮你去各个网站去爬取关键的数据,阅读一些长篇的文章,真正能够成为你互联网的手气。好了,以上呢,就是让你的 openclo 脱胎换骨的六大核心技能,赶快去试一试,保证让你的工作效率原地起飞。下一期呢,我会给大家更新更干的内容,记得点赞收藏加关注,我们下期见!

open call 用着不顺手,多半是这十个技能你还没装,我从一堆技能里挑了十个好用的,装上你就知道差别了。第一个 find skills, 找技能特别方便,你直接用一句话描述它就能帮你匹配,还会按热度推荐,也能一键批量管理。第二个, self improving agent, 它会自己不断优化,每次出错都会记住自动修正,用着用着就越来越聪明。第三个 agent browser, 它能直接帮你操作浏览器,点按钮、填表、截图这些都能搞定。不会动网页的 agent, 说实话用处不大。第四个 table search, 专门给爱用的搜索工具,结果干净没广告还能直接拿来用,不会搜索的 agent 其实很难干活。第五个 skill worker 技能审查员装任何 skill 之前先让它扫一遍,守住安全红线,让每一个技能都值得信任。第六个, microsoft foundry, 更像一个 ai 工厂,用来搭建和管理各种智能体和 ai 应用,还能跑复杂流程, 是一个完整的 ai 构建与生产环境。第七个 summers, 可以 帮你快速看懂 pdf 或者长视频,一键抓取重点,不管是网页还是视频,用起来省时又方便。第八个 skill creator, 用来帮你设计和搭建自己的技能,用起来很方便。第九个 agent tools, 帮助 agent 调用外部工具,扩展它的能力和效率。第十个 proactive agent, 是 主动型智能体,它会根据环境和上下文主动判断任务,并采取行动,提供更贴合的服务。


如果今年你准备要学 ai 了,一定要去掌握这个 skill, 假如你要安装龙虾,龙虾里面这个技能就是指的 skill, 如果你平时就在使用扣子,扣子里面技能商店这里面的这些技能也都是指的 skill, 那 skill 到底是个什么东西?我看到一个说法,这个说法特别的准确, 拿出来给大家分享一下。就如果我们把 openclaw 看成手机或者 app store 的 话,那 skill 它就相当于是 app, 手机本身很强大,但没有 app 它就是一个空壳,就像一块砖了,就本身就没有价值了。 同样道理,就 openclaw 它再厉害,你如果不会用 skill 的 话,它就只是一个摆设。 skill 它是相当于 agent 的 一个可执行能力单元,就像一个又一个能干活的机器人一样, 大家这个要品一下,当你发出指令的时候,大模型会自动匹配到合适的 skill, 然后才开始干活。所以用好 skill 是 你开始 ai 的 第一步,也是最重要的一步。那我这里会推荐给大家有三个这种入门的方法。 第一个入门的方法就是直接用内置的这个 skill 就是 它内置的很多 skill 就 开箱即用。 open 里面有很多默认内置的 skill, 不 需要额外配置,直接就在对话框里面就能直接调用了。 比如像一些天气查询呐, getapp 操作,这些都已经很成熟了,而且是目前比较常用或者比较受欢迎的一些技能。你可以直接在 open graph 的 外部端里面找到它们,也可以直接对话,让它给你做一个列表,你可以列一下目前你一共掌握了多少 skill。 第二个方式就是你要用自然语言去构建, open class 里面内置了已经有个 skill 创建的一个技能,你只需要在对话框里面就直接用自然语言描述就行,你想要什么功能,它就会自动给你生成一个完整的 skill, 不 用写代码,你聊着天就把这个 skill 给嵌好了。 第三个方式就是你从 github 安装,像 github 里面已经有几十万,这种开源的 skill 选择很多,你直接看到你觉得想用的,你就直接把这个链接直接发给 opencloud, 或者直接发给让他帮你安装就可以了。 但是这个里面要注意一点,因为它这个很多,它鱼龙混杂,你用的时候一定要考虑这个安全问题,检查一下它是不是存在风险。掌握这三个方法,基本你对 skill 的 一个入门就很快速的就可以掌握它 真正能够用于生产产生价值的,还是得你自己会写 skill, 把你的工作流程或者是业务 sop 去落到 skill 的 一个 mark 文档里面去,让 ai 按照你自己的一个标准来执行,然后根据反馈持续的去迭代,会有一个成长周期的,就是它一开始一个比较偏简单的,那你用着用着它就会越来越完善, 会用现成的一个 skill 只是一个入门,等你会自己写自己需要的 skill, 那 个时候你对 ai 就 完全具备了一个掌控力, 也就具备了真正的一种生产力,到时候你用 ai 干活会用的特别舒服。我最近就整理了一个知识库,这个知识库除了讲 ai 的 底层逻辑,还有这种提示词,对 ai 有 一个正确的认知, 主要核心部分就是围绕 cloud code, 再加上这个 skill, 它们相互配合,怎么样去不断地把很多我们内容创作的场景,或者一些工作上、业务上提交的场景,把它落实成一个又一个可以使用的一种教程和方案,大家感兴趣的话也可以找我聊聊。 像 skill 这个功能我是越用越兴奋,你是运营也好,做自媒体也好,或者是财务,只要涉及到这种内容型的,全都可以用这个 skill 去解决,这样我们就可以把更多的精力省下来,做更有价值的事情。

现在市面上所有的 a 键的工具都配备了 skill 功能,如果你还没用过 skill, 或者用了以后感觉依然有点懵,那这期视频请一定不要错过。哈喽,大家好,我是专注于动画科普 ai 的 阿 k, 今天我站在新手角度跟大家好好唠唠 skill 到底是什么,怎么用,以及使用过程中要注意哪些坑。 skill 其实就是一个 markdown 格式的文本文件,注意,这里的 skill 必须大写哈,这个文件里存的其实本质上还是提示词,只不过这里的提示词必须按照画面上的这个固定格式书写。 这个部分是配置区,它属于是 skill 的 身份证, name 是 它的名字,一定要用英文哈,因为你的 skill 点 md, 文件必须放在 name 同名的文件夹内,这个文件夹又必须放在 a 键的指定的目录,比如我用的 cloud 就 必须放在它的根目录下的 skills 文件夹中。如果没有这个文件夹,就自己创建一个, 那如果你的 name 是 中文,文件夹也是中文,意味着你的文件路径会包含中文。这样 a 键呢,在调用的时候是有可能报错的,所以 name 必须用英文。那如果不理解文件路径跟目录和文件夹结构的小伙伴,一定要抓紧时间恶补一下哈,这些知识既基础又重要。接下来的 description 是 描述定义它是干嘛的和什么时候调用, 这个部分是指令区,也就是写提示词的地方。它规定的是这个 skill 遵循的规则和采用的流程。之所以一定要用 skill, 是 因为它能实现按需加载。简单说就是没活的时候,它不占用任何 token, 只有匹配到任务了, ai 才会把这个 skill 点 m d 文件加载进来。这不仅能极大的节约 token 消耗,最重要的是能让 ai 随时根据你的需求切换不同的专家身份。总而言之,它就是好,就是棒,棒棒,就是该用。 那这里就又有个问题了,既然它本质还是提示词,那到底该怎么规划逻辑,才能让它按照我的需求老老实实干活呢?放心, cloud 官方早就帮咱准备好了一个专门生成 skill 的 skill, 跟紧我一分钟学会部署和使用。 大家直接把整个仓库下载到电脑理解压,找到 skills 文件夹中的 skill creator 文件夹,把它复制粘贴到 a 键的指定位置。比如我用的 cloud code, 就 直接扔进根目录的 skills 文件夹里。如果你用的是其他 a 键的工具,直接问他你的 skill 文件夹在哪,他会告诉你 配置好以后,我们启动 agent, 直接输入斜杠 skill, 就 能呼出这个顶级专家了。接着我们只需要用大白话描述你想创建一个什么 skill, 注意哈,你对需求描述的越清楚,沟通的越细,它生成的 skill 就 越贴合你的需求。如果你没有思路,也可以跟他一步一步探讨,也能得到非常不错的成果哈。 比如我平时经常要用 a 键的开发一些自用小工具,我就用它创建了一个名为 project manager 的 项目经理 skill。 它能让我这种不懂代码的人也能构建出结构科学、功能清晰且具备可扩展性的工具。这玩意用起来真的很顶那聊到这,估计大家心里都在犯嘀咕,这 skill 到底能帮我解决什么具体的问题呢? 我结合自己的实战经验,给大家盘了三个应用场景,相信总有一个能戳中你的痛点。第一个场景主要应对那些繁琐的杂活。 举个例子,大家平时经常开会吧,开完会总得总结会议纪要。以前咱得录音加笔记,会后还要花大量时间去腾抄归档,特别心累。现在有了 ai, 咱们可以直接做一个叫 meeting 的 skill, 把工作留定死。 第一步, skill 只会转写工具,把原始录音瞬间变成文字。但注意, skill 本身是没办法直接做语音找文字的,但这类工具往上一搜一大把,你随便部署一个到电脑里以后是可以用 skill creator, 它会自动帮你写好调用逻辑。 然后是第二步,剔除文稿中那些语气词。接着是第三步,深度分析会议内容,按需整理成档。最后是第四步,把文件自动保存到你电脑里的指定位置。那有了这个 skill 以后,开完会你只需要把原始录音直接甩给他,他自己就去调兵遣将跑完整个流程。 这种一键扫荡的爽感,你用过一次就再也离不开了。甚至如果你的需求更复杂,比如要经常查找不同会议里的重要节点,或者要合并拆分不同的文件,都可以塞到提示词里。 第二个场景是一个真实案例,我每周日都会发一个 ai 新闻回顾的视频,我专门做了一个 skill 来把这个视频生产的各个环节串起来,让我不用在各种工具和网站中切来切去。具体的大家可以看看我这期视频讲的非常详细。 第三个场景就属于是高级玩法了,它是通过同时加载多个 skill, 构建一个完整的生产流水线,这适用于需要多个专业环节配合的复杂任务。 比如在内容生产场景下,你可以配置三个 skill, 一个负责通过数据检测来分析选题,一个负责按固定风格创作文案,最后一个负责排查违禁词和逻辑漏洞。这种模式的核心优势在于,你不再需要分布输入指令,也不需要手动把上一步的结果复制给下一步。你只需要下载一个初始任务编辑呢,就会自动按顺序调用这三个 skill 来完成。 这种模块化的写作,能极大降低大模型在处理长任务时容易出现的逻辑偏移,也就是我们常说的幻觉。这个场景其实还蛮复杂的,我自己也在慢慢构建,以后有成果了会第一时间跟大家分享。 最后有小伙伴想让我聊聊 skill 和 mcp 的 区别,其实一句话就能说明白, skill 是 提示词、是指令,是流程,而 mcp 是 工具,是接口。 skill 可以 调用 m c p 来扩展自己的能力边界,但 m c p 永远只能在 skill 划定的规则下干活。 ok, 那 以上就是本期视频的全部内容了,我专程用动画科普 ai 的 阿 k, 无惊无险又到六点,下了个班儿。

其实 agent 我 们把它分成 lead agent 和 sub agent, 主要是说不同的 agent 它会有不同的职责。 lead agent 主要做的事情就是把各个执行任务的 agent, 他 们的那个任务给串联起来,对,来规划他们。那,那这个结构跟原来我们看到的一些叫 multi agent 的 它的优势在哪里?它的优势在于说我们可能用这样的一个架构,我们可以把我们的整一个设计或者说是做产品的重点放在比如说给它配套怎么样的 上下文,给他配套怎么样的工具,以及给他配套怎么样的技能上,还不用去过过度的在比如说工程的结构上做太多的研究。所以就说这种 lead agent 和 sub agent 的 结构其实本身是更清楚的,外界 context 或者外界 skill 基本上就可以了,是明白。