二零二五年, agint 成为了 ai 的 主流形态,模型开始会规划、拆解任务,自己调用工具。但当问题变得复杂时,再强的 agint 也只能同时思考有限的事情。本质上它仍然是一个单体智能, 但复杂问题从来不是靠一个大脑就能解决的。就像人类文明的跃迁,靠的不只是更聪明的人,还需要分工和写作。 ai 已经足够聪明,所以 ai 的 下一步进化方向很可能不再是更强的单体 agent, 而是让多个 agent 协同工作,形成真正的 agent 的 集群。我们已经看到各个大模型厂商在新一代大模型中探索落地这种多 agent 的 合作模式。比如 cloud code 的 agent teams, 它允许多个 cloud agent 像一个团队一样, 在一个项目上并行工作,每个 agent 负责自己的任务部分,并且能直接互相沟通和协调,压缩传统串行工作所需时间。 国内的 kimi 大 模型甚至更早就开始探索多 agent 的 方案,在大模型训练的时候就引入了并行设计能力,在这个基础上推出了 agent swarm 功能 open ai, 在 gpt 五点三 codex 相关的文章里也暗示了下一步 agent 的 迭代将朝着多 agent 的 交互上做努力。 那么问题就来了, agent teams 和 agent swarm 的 区别是什么?和 sub agents 有 什么区别?我们先从单 agent 的 情况说起。 从单 agent 到 agent teams, 我 们知道 cloud code 的 最基础的功能就是在一个窗口上让一个 cloud agent 替你干活,如果有多个任务,就在一个窗口里依次串行执行,但这样所有对话都挤在一个聊天框里,有上下文过长的问题, 所以我们一般会自己拆分任务,手动开多个窗口并行执行。但这样要是各个窗口改动出现冲突,就需要自己手动和代码。 于是 cloud code 又引入了 sub agents 功能,通过一个主 agent 来控制多个子 agent 的 工作,效果上相当于让主 agent 替你开多个子窗口,独立进行执行,最后由它来自动汇总结果。 但子 agent 之间没法直接交流,所以更适合改动相对独立、偶合较少的任务。于是 cloud code 又又引入了 agent teams。 在 agent teams 里,依然有一个主 agent 的 角色,他将任务通过共享任务清单的形式把任务给到各个子 agent, 子 agent 并行申领并执行任务,并且可以互相通信,这样多 agent 间合作可以更紧密。 agent team 实测大概原理懂了,我们用一个实际例子看一下 agent team 的 工作流程。我们先执行 cloud update, 确保 cloud code 是 最新版本,然后在 cloud settings 点 json 文件里将 team 相关的环境变量打开。在 cloud code 输入框里提到 agent team 关键词,就可以触发相关功能。 比如使用 agent team 创建多个 agent, 从不同角度讨论二零二六年还适不适合在上海买房, cloud code 就 会创建多个 agent, 并行的从不同角度去做头脑风暴。最后给出一份讨论结果看起来挺好,但我认为短期内它依然只能是个实验性功能,因为它有两个比较严重的问题, 首先是 token 量爆炸。 sub agent 方案里,子 agent 会把执行上下文总结后返回给主 agent, 所以 上下文长度更可控。而在 agent 的 teams 里,则会让所有子 agent 的 共享上下文,每个 agent 的 每一轮提示词都要包含所有 agent 的 历史消息,任务越往后,执行。 agent 的 的历史消息任 务越往后,执行。 agent 的 成员通常在任务开始时就根据角色定下来了,很难在任务中途根据工作量动态扩容。 比如,我一直想做一个关于归机文明简史的话题,讲述从二进制到计算机,再到 transformer 等一系列推动 ai 发展的一百个事件。 它分成几个阶段任务。首先是需要一位研究员收集人类历史出现过哪些关键事件,审核员筛选事件 图片生成员生成一百张图片,图片审核员教演图片风格是否一致,再让 u i 设计师生成网页风格。最后才是给程序员开发网页。 这个例子中, agent teams 只会创建六个 agent, 尤其是在图片生成阶段,可能还是由那一个图片生成员慢慢画一百张图,他不会因为发现任务量大,就临时裂变出多个 agent 同时开工。那有方案可以解决上面提到的两个问题吗?有。让我没想到的是,国内的 kimi agent swarm 把问题给解决了。 kimi agent swarm 功能实测,我们先来看一下执行效果,再了解下 kimi agent swarm 和 agent teams 的 区别。先将上面提到的归机文明简史任务描述粘贴到 kimi 下拉框,选择 agent swarm 执行, kimi 会启动一个叫 kimi's computer 的 虚拟机, kimi k 二点五会作为主 agent, 像项目经理一样,将复杂任务拆分成多个步骤的子任务,并现场决策。生成六个子 agent, 每个子 agent 只负责这一个阶段子任务的上下文,这样 agent 的 上下文更短,注意力更聚焦,可以大大降低幻觉和出错概率。 点击每个 agent 都能看到它对应的照片和角色描述,就像一个电子员工一样。其中,研究员会在互联网上发起多轮搜索,从国内知名技术资讯站点获得几千条搜索结果,再从里面筛选出一百三十八个候选事件,生成一个 md 格式的结果文档交付给审核员。点击底部的 all files 可以找到这个结果文件。点击查看文件内容,可以看到研究员已经将收集的内容按年代进行排序,并给出事件的历史意义。审核员淘汰三十八个,留下一百个真正改变世界的技术。以 md 文档格式给到图片生成员, 图片生成员拿到审核员筛选过的文件内容后, kimi k 二点五发现多张图片。生成一百张图片的任务时间会很长,于是将子任务进一步拆分成五个小批次,临时创建五个新的子 agent 并行去执行生图任务。 比起单个 agent 挨个串行执行任务改成并行之后,任务的实际运行时间会明显变短。 点击列表里的任务,可以看到每个任务的具体执行情况。注意看,这里面会有一些失败和报错, a 警的内部会不断调整策略,重试并最终完成子任务。 这要是在传统多个单体的 a 警的架构中,一个 a 警的内部报错,就算内部有重试,也会大大增加执行耗时。而 a 警的 swarm 架构中,局部任务的失败并不会严重影响大局,这样系统稳定性更高。之后经过图片审核员、 ui 设计师和程序员的合作完成了网页,可以看到,网页按时间线给出了每个年代影响 ai 的 重要事件,且美术风格一致。 kimi agent swarm 通过多个 agent 的 互相协助,只花了几分钟时间就完成了我可能需要花一天甚至几天才能完成的任务。 agent teams 和 kimi agent swarm 的 区别最后总结下 kimi agent swarm 和 agent teams 的 差异。首先是价格逻辑不同, kimi agent swarm 逻辑上更接近 sub agents 的 增强版, 子 agent 之间上下文物理隔离,只负责局部的子,任务生成的中间结果会被总结后再返回给主 agent, 这样既保证了任务聚焦,又把 token 消耗压到了最低。 其次,支持动态并行。 kimi k 二点五在训练时引入了并行代理,强化学习技术,也就是 p a r l, 这让他具备了动态编排的能力。他像一个聪明的项目经理,能根据工作量现场摇人,比如身徒任务多,他会动态创建几十个 a g 的 并行跑,效率能比传统串行提升四倍以上。 最后是集成度不同, cloud code 更像是一个程序员的专业工具。想用好 a g 的 teams, 你 需要自己配环境,安装各种 skills。 而 kimi agent swarm 自带 kimi's computer 虚拟机,申图、搜索、写代码、运行网页,全是开箱即用,对普通用户来说更友好。从单体智能到群体协助, ai 正在复刻人类文明的跃迁路径,不是更聪明的大脑,而是更聪明的协助。 当无数 agent 学会像团队一样并肩作战,分工配合, ai 就 不再是工具,而是队友,而这可能才是通往通用人工智能的真正基地。现在大家通了吗? 好啦,如果你觉得这期视频对你有帮助,记得转发给你那不成器的兄弟,文字版的笔记见评论区,这里是小白的 bug, 我 们聚焦一切可能影响人类历史进程的技术,如果你感兴趣,记得关注我们,下期见!嘟嘟嘟嘟。
粉丝61获赞225

大家好, cloud 在 发布这个 open 四点六的时候, cloud code 也有一个新的功能,叫 cloud agents teams, 就是 你可以自己开启一个这样的团队去开发功能。那本期视频呢?将从四个方面来介绍一下 agent teams 是 什么, 然后我也结合了一个网页,里面有一些动画特效,来给大家详细的讲解一下 agent teams 和 sub agents 的 区别是什么。因为这两个问题就是什么是 cloud agent teams。 在了解这个 claw 的 teams 之前,我们来看一下整个我们跟 claw 的 进行对话,或者说跟类似的 a 技能对话的一个发展的历程。 那么一开始的时候,当你启动一个这样的 claw 的 实力,那说明对话的时候只有你和这个 claw 的 主主 agent, 我 们把它标志成叫主 agent, 主代理,那这个阶段叫做啊,我们叫做主代理进行对话,那这个阶段叫做独行侠时代,就是只有你和主代理进行一对一的对话, 那这个总对话方式优点就是简单,你说什么他就做什么,大家都是创新的去执行,就是你发布任务执行完成,你看结果,然后再接着发布第二个任务。 那这样的缺点是什么?就是你的上下文窗口有限,就是上下文很容易就被塞满了,比如说你现在要让他进行一个 p r d 文档的书写, 那么生成的这个 prd 文档可能有一万个字,那这一万个字就会占用你跟它对话的这个上下文,那就会触犯压缩,而且你每一次只能做一件事情,对吧?写 prd 文档的时候写 prd 文档,写代码的时候写代码,那为了解决这个三个问题呢? 那就进入了我们的这个 safari 子代这个时代,那子代的时代就是你的有些事情可以分配给其他的这种代理去执行。比如说我刚刚说到的 写 prd 文档,那么你可以有一个叫产品经理的子代理,你发给他,让他去创建这样的 prd 文档,那么他创建 prd 文档生存那一万个字,他是不会在跟跟你的主对话,跟你的主代理之间是不会影响的,不会影响的, 我们假设一下,你跟主代理之间进行了十次对话,产生一百个字,这个时候你需要去创建一个文产产品说明文档,这个时候如果你发给这个 产品经理,让他去创建了吗?产品经理创建了一个一万次的这个文档,他创建完成之后,他自己的上下文就销毁了,然后你这边的上下文还是那十轮对话的上下文, 如果不使用这种子代理,那么你就会把这个 p r d 的 这个整个生成过程产生的上下文塞到这个主对话里面去。所以呢子代理 的出现就解决了这么个非常大的问题,就是断线纹隔离,而且他能并行执行。你在写代码的时候边写边测试,那么你可以设置一个写代码的主代理,主代理就是你写代码,然后子代理去测试你的代码,那这样的话就并行执行,然后还选能选择不同的模型, 对吧?你测试可能是你要求没那么高,要求快速的,那么你会选择一个这种 flash 啊,或者其他的这种型号的模型。但是这种子代理也有什么问题呢?就是每一个 agent 子 agent 之间是不不能沟通,不能交流的, 大家都是独立完成任务,然后告诉一个这样的摘药,给到我,给到你,然后你其实你如果你需要完成的是一系列的任务,比如说你现在做一个从零到一,做一个产品,那这里面涉及到 prd 文档,涉及到前端代码,后端代码, 对吧?测试,那大家其实都是围绕怎么从零到一完成这个产品这一系列的任务来的, 那这个时候你可以想象一下,在一个公司里面,如果你要做一个产品,那么肯定是一个协助的过程, 那前端开发,开发完之后如果有什么问题需要跟后端去对接去沟通,那后端弄完之后可能要找测试去测试,那需每一个人之间是有沟通的。所以呢, it 的 teams 就是 拥有了这些 teams 的 这个优点, 它除了有 sub agents 的 这个特点之外,它又新增了个,新增了些,每一个这样的子代理 agent 之间都是可以发消息来沟通的,那有一个 team leader 来负责整个的这个协调, 整个队伍的这个任务分配协调啊,这个消息的发送啊,或者其他的这种东西,它有一个总的这样的一个去管理,就跟我们真实的团队是一样的,那 这种就做到了真正的就像一个很强大的一个这样有效的这种工作运行的工作方式。所以呢, teams 比这个 subteams 又进行了一个升级。 那我们再往下看,就是用一个公司来比喻理解的话,那普通模式就是你只有你一个人,只有你一个人,你一个人能力是有限的,你只能创建去执行,按顺序执行这个任务。 那纸质问题就是你是一个老板,你派人去帮你查资料,审代码,那么你关注的是这个结果, 你关注的是结果,而且他们各自的这个做的这些事情是没有任何联系的,是断开的。查资料是查资料, 省大脑,省大脑,这两之间是没有任何关联关系的,是不存在,他们需要沟通,不需要去协助,非常独立,所以他们能有拥有独立的上下文,能够干完这个事情就把上下文销毁掉,会影响那 tips, 就是 这些人需要去沟通,去共享或整个任务列表的。所以说 teams 就 非常适合你。这一个大任务里面有很多这样的小任务,那每一段的小任务需要一个人去参与, 而而且是共同去参与,去讨论,而不是像组织人体三倍镜词一样去可以他们的每一个组织人体是没有任何的交流的,零交流 是没有没有这共性的,所以这是两个是非常非常大的区别,你只有把这两个区别搞清楚了,你才能知道什么情况下我要用子代理,什么情况下要去开启一个 teams。 所以 一定要抓住这一点,队员或者说你子代理之间需不需要沟通, 他们是不是做的是同一个事情,只是不同的阶段,不同的角色。那这个时候你就要开启 teams, 如果不需要沟通, 他做的是个独立的事情,那么这个时候就是开启的是紫代理。如果你要开启,或者说开启一个这样的一个 team, 是 吧?他是有这些,比如说有这样的一个三个这样的一个队员,前端后端测试,那么还有一个队长,那队长的任务就是负责创建团队分配任务和协调, 那队员的话就是你要各个去完成自己的这个角色了,那这边呢?还有个任务任务版,那还有个消息可以去沟通, 去沟通,那这这个是他的步骤,创建团队任务拆分,那在后面的实战例子里面可以看到他这个过程,创建团队任务拆分、并行执行、沟通、协调、汇总、清理,那完成之后他是需要去做一个清理团队资源的, 那我们可以来通过这样一个动画来进一步来加深大家对这个 sub agencies 和这个 agent teams 的 一个区别。如果我们现在是子正人体,那我们可以开始来演示,然后点一下,开始演示。第一步就是你自己啊,主对话就是我们刚刚说的开启的这个 cloud code。 好,第一个 ok, 你 现在需要子代理做这三样事情,安全审查员、性能分析师、测试检查员,这三个子代理派出去,那么这三个子代理之间是不存在任何的这个联系的。好,开始干活了, 开始干活了没有? ok, 他 正在干,干活了啊,干完了,这是他的一个结果。第二个这三个是可以并行执行的,这是演示,我们就可以让他那个 是这样。 ok, 他 执行完成之后呢,每个人都会有个结果,看到没有,那这个结果的摘药就会同步给 我们的主绘画,就是你同步给我们的这个主绘画,那么我们可以最后一步就是会,他会把这个生成一个这样的结果啊,就会告诉他,哎, 每一个人不同的结果,让他去拿到,拿到这个摘药去使用。那你对于这个主绘画来说,他是不用关心安全审查员里面到底是怎么去做的,他不用,他只要关注 这一部分东西就行了,他只要关注这本,这部分是会传给先前摘药,是会传给我们的主对话的,就回到我们的跟 cloud, 就 回到我们这个 cloud 的 对话里面去。那么 teams 呢?是什么区别呢?我们也可以看一下。这个好,开始,那这边队长开始组建团队了, 比如说现在要创建一个团队来开发用户登录功能,它这个功能非常小啊,那实际的场景里面这么小的功能是不适合用来开启个 tims 的。 ok, 好, 开始分配任务啊。前端后端测试,那么就会创建一个这样的一个任务列表, 那这个任务列表的话就会分配好谁干什么,谁干什么。那这边的话会有一个这样的一个,比如说测试的话可能会依赖 后端,或者说前端的一些步主要完成它才能测试,那这个时候它就会处于一个 block 状态就阻塞的状态,它是等待的状态啊,它是依赖前面完成之后它才能去完成的。你在开启这个 teams 的 时候, cloud 那 边会告诉你这个有一个 等待的一个状态。 ok, 我 们下一步开始。好,现在就是前端后端同时开始去领任务去开始开发了,对吧?前端前端后端开始领任务去开发了,那只有这个测试现在还在等再进行下一步。好,这个时候我们的前端 在问啊,前端在问,哦,我们需要一个这样的一个接口,他问这个后端我们需要一个接口,那后端就会把这个接口啊告诉他,发给他, 注意啊,这就是一个最大特点,他们之间会通信啊,会沟通,会对话的,他他这边前端拿到之后,他就开始去开发了,所以这一块是非常非常重要,他们之间是可以沟通的。 下一步好,前端他要完成,后端他要完成,前端他要完成后完成,这个时候测试的这个条件已经满足了,这个时候他就需要去进行一个这样的测试了,他就可以开始进入测试了。 ok, 那 整个测试完成之后,那整个任务就完成了,就会告诉队长任务已经完成了, ok, 完成。所以在整个两个对比的过程中,我们就可以明显的看到子正体跟 tms 之间最大的区别就是子正体跟子正体之间,他是 一个是不能沟通,一个是能沟通,他能沟通的,这个为什么能沟通?就在于 teams 的 每一个 agent 都会继承这样的上下文,每个人的上下文都是一样的, 就说相当于你在一个公司里面,你的 teams 每个团队成员对于你现在要做的事情是一定是了解的很清楚了,不然的话就会偏题了,所以这个是非常大的区的区别的。那我们再回到这个啊文档当中, 在前面我们已经讲过了,怎么去,什么是 teams, 什么是 smartins, 相信大家已经有啊,有一定的认识了,那这个时候我们就来个实战,那这个实战呢?就是我们要去开启这样的 cloud agent team, 那 有两种方法,一种是你可以通过这种房间变量的方式去设置一个这样的零使用的,那么你再下一次开启终端设置,这个又没没有了,那么一种永久使用的,就是通过配置的方式就配置到这个 cloud 的 这个 settings 的 目录里面去,那注意啊,就是如果没有的话,你可以新建一个, 然后的话把这个内容保存一下就行了。但是呢,目前因为 cloud agent team 还是个实验性的功能,所以还是比较建议大家使用这种这种方式,如果你想一直用的话,也可以这种方式没问题。 那刚刚说了,终端你可以使用这个啊,自己系统自带的终端,或者使用 v s code 啊 cos 这样的终端也可以使用像 t max 这样的终端,我看这个 t max 好 像不支持 windows, 所以 说大家用普通的终端也可以, 然后使用 agent teams 的 话,就是用关键词啊 agent team 这种方式去使用就行了。 ok, 那 我们就开始看一下这个整个的效果吧,当你把这个 agent teams 在 你的设置文件配置好之后,或者说设置临时变量,那我们就可以开始去使用 agent teams。 那 么在使用 agent teams 的 时候,你可以使用各种终端,比如说你系统自带的终端,或者说使用 vs code, 也可以使用 cos 这样的,它们都有这种终端,那么这些终端的话, 你开启这个 agent teams 之后,是需要通过 shift 加 page up page down 就 上下键来去观看每一个队员的情况,那么你如果需要在一个屏幕里面分屏去显示的话,那么你可以使用这种 tmax 这个这种终端方式。 那如果是你是 mac 电脑端,你装完之后直接启动 tmax 就 行了,那启动完之后呢?那么你就可以去开启我们的 cloud code, 开启完之后, ok, 那 么你就可以去开始我们的这个呃任务了。那么我这边是让他阅读我们这里面有一个 prd 文档,那 这个 prd 里面的文档啊,就是具体的这个网站的内容啊,然后他创建一个这样的 agent teams, 那 这就是一个触发这个关键词,让他知道我们他要去创建一个这样的 teams 去完成开发。那么我是指定了三个这样的队员啊,一个是前端开发,一个这样的 teams 去完成开发。那么我是指定了三个这样的队员啊,让他也可以根据情况来设置队员。 那么这里就是使用关键词的方式去出发的。那么这里呢有为什么会有个 prd 文档?其实我刚开始是也是创建一个团队,团队里面是有产品经理,让产品经理去啊,去生成这样的 prd 文档。但是我发现 所有的队员都会在等待产品经理把 prd 文档写完之后才开始去做,开始去干活,那这样其实是一种变成一种创新的方式了,那所有的队员都在等待一个去完成,就会被堵塞, 那我觉得这样的一个流程是不太适合用 agent teams 的, 所以呢,我用其他的方式去生成这样 p r d。 文档,那么你在生成 p r d。 文档的时候,你也可以开启一个这样 teams, 你 可以去设置一个什么市场调查员,或者说一些行行业的一些分析员,他们这种不同的队员去 通力去协助,然后去生成一个 p r d 文档,那最后再进入到这个开发流程去设置一个,这样我目前的这种 agent teams, 那 这样是比较合适的,就是 teams 最大的用处是 并行去开发,而且能互相沟通,这是他最大的优点,如果你这个任务是串行的,那就会出现很多问题。 ok, 他 这边已经去开启了这个啊,多个这样的考的实力,大家可以看到 会有三个这样的实力啊,分别代表了这三个不同的这个队员,那第一个是前端开发工程师,看到没有?第二个是这个后端开发工程师,那这边的话应该是一个测试 测试工程师,那么他这边就开启呢,就开始去沟通,去沟通了,他们就是相当于是并行去执行这样的事情,那么这边多个队员就开始在这边去 做事情了,比如说测试工程师,他就会去制定这样的测试用力,那么前端就在正在开发前端,那如果说他们之间需要去协调的话,比如说前端在等待后端的接口,他就会给他发信息,告诉他我需要一个后端的接口来帮我去实现, 那它是人们之间是可以互相去沟通交流的,那么在这个后端开发这边的话,它是使用的是 java, 那 其实在我们的 p r d 文档,或者说我们其实应该在里面说明就是使用什么技术栈,这样是更更加好一些, 它自己去根据情况去选了一个这样的技术栈。那么在前面例子里面我使用的是这个啊智普和这个 kimi, 我在整个例子里面其实就是我开始使用的是 kimi, 但很快它这一天的用量就用了,所以它是消耗 token 是 非常非常多的,所以我又把它切成了这个质朴的这个模型。那么之前我也用 opus 四点六,那 那的确是用用不起啊,真的是用不起太太,消耗 token 实在是太多了啊。最后我们来总结一下,就是啊,我们使用 cloud agent teams 的 缺点和使用建议啊,第一个缺点, 第一个缺点这 talk 消耗巨大。第二个就是呢,缺点就是上下文是笼鱼的,就是以我们现在来设计的角度来看,因为每一个 队员他是一个独立的实力,他都要把这些上下文都加载一遍,比如说你的 cloud md 文件,对吧?你的这个 m c p 的 描述,你的 skills 的 这个技能的描述,每个人都是一样的, 每个人都是这样就开启了,你开启了五个队员,那就五个窗口,五个实力,那五个这样的一个上下文。第三个就是我觉得是非常大的一个问题,就是文件冲突, 比如说你如果没有分好每个队员去做什么事情,比如说你开两个后端开发工程师,那么这两个后端开发师可能会对针对同一个文件进行编写,就会产生文件冲突,大家都在抢占这一个文件, 写的东西都在一个文件里面,那就会有问题,所以说这个是一个非常大的问题,你在开启要去使用这个 agent team 的 时候,一定要把模块规划好,或者说你的每一个队员到底要做什么事情,这一定要想好,如果你都没有想好去做的话,那就是跟你不开是一样的, 或者说开之后反而效果没有那么好,所以第四个就是怎么去分配,就我刚刚说的怎么去分配队员,每个队员应该做什么事情,如果存在依赖性强的对吧?你要要 队员 a 完成之后你才能去,队员 b 才能开始去完成,那这样 team c 意识不大的,你创新没有,并且的效率高, 所以这种这也是非常的要依赖经验去来做这个事情。还有一个就是 agent teams 啊,现在是实验功能,就具体以后会发生什么样,或者是具体怎么个样子还不知道, 所以这个东西大家可以去用,但是不建议就说把它作为一个常规的一个开发的东西了,这里非常推荐大家使用三维剑士去完成很多功能,去如何的去利用三维剑士可以极大的提高你的这个效率的。 这边呢,我也是给出自己的建议啊,就是其实根据官方文文档中提到的这个 tims 最佳实践啊,他也在大多都是偏向于探索和辩论, 就是你可以让他多个队员去针对同一个主题来发表自己的意见,那最后得到一个这样综合性的一个结果,这种是没问题,因为 你辩论的话是不存在说去,比如说上面这些问题去文件冲突啊,干什么,大家各抒己见。还有一种像这种多维度的,就大家在不同的维度不同的方向去做事情,也可以避免冲突,然后也可能极大的发挥每一个队员,每一种队员的这个特色或特长。 然后呢,从零到一做 mvp 这个阶段也是适合,因为这里面就是啊,你能够很快去拆分不同的模块,比如说我刚刚引衍生的例子就是一个 mvp 的 产品,它就有几个功能,那你就可以分配 前端后端测试,那很快就是这个东西,就是这个过程就非常的清晰了,前端发展前端,后端开发,后端测试做测试,它不存在有相互交叉的地方。第四个就是 tim 饲料,作用是多个队员并行开发,所以 我一直在强调,如果你这个任务是创行的,互相等待的,那么是不太建议,那这个就是不要为了换个灯泡去召开这个董事会,什么意思呢?就是你不要一个小功能,也是开启这样 team, 那 这样是得不偿失,而且非常非常浪费的。那 ok, 那 本期视频到这里,如果你对 ai 编程有兴趣,可以多多关注。

hello, 大家好,今天跟介绍一下 agent teams 分 屏功能的实现。首先要安装 t m u x 终端输入 brew install t m u x 等待安装完成,输入 t m u x, 进入到 t m u x 命令行状态。为了能够使用鼠标切换并激活不同的窗口,终端输入 nano 点 t m u x 点 config 终端输入 set 杠 g mouse on set g base index e control 加 x, 接着输入 y, 然后输入 t m u x source tel dot t m u x dot c o n f 生效。紧接着我们开启 agent teams 功能, 这个时候我们就看到了四个 agent teams 功能,这个时候我们就看到鼠标点击即可。

哈喽,大家好,我们现在来教大家去如何去安装和使用酷呆斯增强版。我们首先 拿到这个 get up 的 地址,我们会在评论区放出来,我们首先访问这个 get up 的 仓库,先进来首先点一个 star, 然后我们再看 安装方法。 mark linux wsl 的 话可以直接使用这一行命令,我们复制它,直接在终端粘贴就可以安装了。 windows 的 也是一样的,复制这一行命令,然后在你的终端 粘贴,然后就可以继续安装了。我们打开我们的终端,然后粘贴刚才的命令,我们直接回车等待它的安装。 安装话跟你的网速有关系,如果你的网速不够快的话,可能需要等一会, 不快,它安装好了,它默认的话会把你二进字文件安装在你的 logo 并目落下的。我们可以检查一下使用命令,我们检查一下它安装好了是不是 ok, 确定安装好之后,我们可以查看一下它的最新版本, 最新版本的话是一点二点零,默认的脚本安装就会安装最新版本到你的本地。 然后我们查看一下当前酷带 s 增强版具体有哪些新增的功能,比如 agent, teams, hux, 繁琐拎拎, ip agent 以及 webui。 我们可以先看一下路由 server 是 怎么实现的,可以看到路由 server 是 使用 httpss 去进行实现的,这样最大的优势呢就是, 呃,你启动多个 c 型只会占用一个进程,这样的话你的进程消耗就会非常少。我们直接使用路由 server 将微博 ui 启动起来。 cordless server 会随机启动一个端口和随机的托克密钥,你拿到这个端口和密钥呢?可以在本地启动一个内网穿透,这样你在外面就可以通过手机访问微博 ui 去进行远程的微博扩顶。 我们可以直接切换到移动界面去进行测试,先随机选择一个目录 发送嗨来进行测试。 ok, 我 们开始测试下一个功能,我们回到仓库地址,我们看一下 agent team 和 hux 以及奥斯突击 api agent, 我 们首先演示一下 agent team, 使 我们来到这个仓库,我们通过 code s 启动。然后怎么使用呢?首先第一步你需要在配置文件里面去启动多媒体的配置,我们 可以看一下在这个配置文件 copy 里面去将这个配置多媒体给它启动, 我们就可以开始那个尝试这个功能了。比如说我们 use agent teams 这样子告诉模型,告诉模型,比如说告诉了五点二, 我们需要需要启动 a 键的 team 来去做接下来的工作。比如说我们分析当前项目,就代表了我们使用 a 键的 team 来分析当前项目, ai 会分析任务难度来判断具体创建多少个 a 帧。 ok, 我 们看到它根据呃项目复杂度启动了五个 a 帧,五个分析帧 这个中括号括起来的这个就是我们的具体的一个执行 aint, 比如说是其中的五个分析的 aint, 然后来去并行的执行分析当前项目,它对于仓库结构 rooster 的 库的代码,然后 build c i 以及文档以及安全 sandbox, 然后去单独的 每一个单独的去进行分析。啊,这五个的话就是在并行的那五个都是同时创建,然后在并行的这里就会有一个等待所有的 a 帧,我们现在可以等他返回。 ok, 全部 a 帧已经返回了,五个 a 帧都已经执行完成,然后返回了他的一个结果,分析结果, 然后五个 a 帧的全部返回成功之后呢?慢 a 帧就会去收集五个 a 帧返回的内容,做一个汇总,然后再去判断当前的分析是否完成了,然后模型会自己去判断 是否还会需要继续的去进行分析,如果不需要的话,他就会直接返回结果,如果需要的,他还会去再次的创建 a 帧去进行分析。 ok, agent teams 全部结束,返回了最终的结果,这就是整个 agent teams 的 一个调用过程。

agent teams 的 早期原型试验烧了两万美金,得出了哪些经验教训呢?今天我们继续来读这篇 cloud agent teams 的 原型实验。 block building a c compiler with a team of parallel clouds caroline 在 这次实验中反复踩坑后,总结出了四条非常实用的工程经验。第一条经验,编写极高质量的测试。在这个 agent 自主运行的系统中,测试套件往往是人与 agent 沟通的主要方式,它只是起用了一组新测试,让 agent 自己搞清楚如何通过。 这就意味着任务验证器几乎必须近乎完美,因为 cloud 会自主解决任何你给他的问题。若验证器有问题, 它往往会解决那个错误的问题。这就像自动驾驶测试驱动的 a 键,就像你输入了一个 gps 坐标,车子自己规划路线,避让行人、处理红绿灯 到达终点。第二条经验,设身处地为 cloud 着想。它有一个先天不足,第一,上下文窗口污染 人类习惯看几千行滚动日制,但这对 cloud 是 致命的,会瞬间挤爆它的短期记忆。所以必须把控制台输出压缩到只有几行,剩下的详细信息全部写入文件。而且这个日制文件要对机器友好,比如报错行必须包含 error 关键字和具体原因,确保存成了一行。 这样 cloud 用 grip 就 能一下搜出来,不用费劲儿去分析上下文。还有,最好把统计数据也预先算好,也就是不管是看日制还是看数据,不要让模型去算,直接给它看结果,保持极高的信噪比, cloud 才能更聪明。第二,时间无感。 cloud 没有时间概念,如果无人干预,它会乐此不疲地运行测试,而不是推进项目进展。所以测试框架默认带一个 fast 选项,每次只运行百分之一或百分之十的随机测试样本。这里有个巧妙的设计,每个 agent 的 子样本是确定性的, 但不同虚拟机之间是随机的。这样一来,整个集群仍然能覆盖所有测试文件,每个 agent 也能精准识别自己引入的回归问题。这里还有一个记忆问题,因为每次启动任务都是兴起一个纯净的 container。 这就好像让一个新员工入职第一天直接干活儿。 他没有任何上下文,不知道项目背景,也不知道之前谁干了什么的。他需要花大量时间去阅读代码,搞清楚状况。实验的做法是强制要求 agent 维护一份极度详尽的 v, d, r 和 progress 文档,这不仅仅是写给人看的,更是写给下一个接棒的 agent 看的。入职手册, 有了它,新 agent 才能一眼看懂哦。上一个同事坐到这了,那我接着干。所以给 agent 设计反馈机制,往往需要是极简的、快速的、文档化的。第三条经验,让并行变得简单。如果是独立的小测试,比如翻译 radis 或 skyta, 并行很简单,每人领一个项目就行。但在编一 linux 内核这种巨大的单体任务上,所有 a 阵都卡住了。因为大家都在同一个大工地上干活儿,每个人遇到的都是同一个 bug, 修好后又互相覆盖, 十六个机器人的各干各的反而乱成一锅粥。解法式引入 g c c g c c 是 最成熟的 c 编一起,我们可以把它当做标准答案。 作者重写了测试框架,让 g c c 翻译百分之九十九的文件,只留百分之一给 cloud。 如果内核跑通了,说明这百分之一没问题。如果崩了,就进一步缩小范围,用 g c c 替换这百分之一里的一部分,直到定位到具体是哪个文件出了问题。 这样一个巨大的单体任务,瞬间被拆解成了无数个独立的微任务。十六个 agent 终于可以并行,每个人只盯着自己那几个文件修 bug, 哪怕是最复杂的内核翻译也能跑满并发。最后一条经验,专业化分工 l y m。 写的代码有个毛病,经常重复实现已有功能。 所以与其让所有 agent 都去写功能代码,不如划拨一些 agent 做专门的事儿。比如让一个 agent 专门负责合并重复代码,让另一个 agent 专门优化翻译器本身的性能, 让第三个 agent snap 负责确保输出的翻译结果是高效的。还有一个 agent, 从 rust 开发者的视角来评判项目设计,做结构性的改进来提升代码质量。最后还有一个 agent 专门写文档,当你有足够多的 agent 可以 调度时, 与其让每个人都干一样的活,不如让每个人只做自己擅长的事。总结一下,今天我们讲了构建 agentic system 的 四条核心经验,测试及导航。设身处地为 cloud 着想,通过分治创造并行、专业化分工。这里是慢学 ai, 我 们下期再见。

大家用 curl code 干复杂的任务,你大概你有碰到过这三个问题,第一个,这个上下文越聊越长,到后面他就开始忘记前面改了什么东西。第二个的话,任务明明能并行,他却只能一个一个的串行去啃,那第三个的话,一个 a 帧只有一个视角,看安全他就顾不上性能。 其实这不是 prompt 写的不够好,这就是单 agent 它的一个结构性的瓶颈。那最近 cloud 官方发布了 agent teams, 今天我们就通过这个视频来把它讲透,最后还通过一个真实的项目,带着大家去一步步看这个 agent teams 到底是怎么写作的。那这个 agent 到底是什么呢?很简单,它就是可以允许多个 cloud code 这个实力去协同工作, 有一个团队的管理者,然后去派发多个团队成员去干活啊,他们团队成员之间还可以互相去通信,并且这个团队老大也可以实时的去跟这些成员去通信。 那下面有一个这一个图哈,就是你的用户嘛,就我们嘛啊,你发了一个任务,那这个 team leader 就 去拆,拆完了之后他就开始去啊,就给了这个成员,让他去执行后端,让这一个团队成员去执行前端,让这个去做 q a 啊,然后呢,他们共享这一个任务,就是他们会都会从这个任务列表里面去 接受任务,然后去更新任务的状态,然后回填,那他们团队成员之间也可以通过这一个去通信,那这样就打通了从团队到成员互相通信,成员与成员之间也可以互相通信, 它的最佳的使用场景,第一个是研究与审查,第二个是一些新模块的开发,第三个是一些竞争性的假说,也就是说 你发现一个 bug 啊,你开多个成员让他们互相讨论啊,我反对你,你反对,最终我们去劳报出来一个真正可能的一个答案。第四个的话是一个跨城协调,也就是说我们正常的一个开发流程中,前后端 其实你是可以并行去做了嘛?因为当我们有架构完了之后,有设计文档,有一些什么 api 文档,有数据库的文档,这个时候前后端就可以干活了,那同时前后端干完之后,这个时候测试就可以跟上嘛,测试完了之后,那就可以做后续一些事情。 下面我们来看一下这个 agent teams 跟 sub agent 的 区别哈,这个核心的差异对比我都放在这块,大家可以截图看一下,我就讲两个核心的,第一个就是通信的方式, sub agent 呢?只能向主 agent 的 报告结果,那这个的话是这个队员他是可以互相去通信发消息的。 有一个选择的一个规则的话,就是如果需要去快速专注的工作者来完成任务并报告结果的话,选 sub agent。 如果你需要去分享发现,需要去互相质疑并自主协调,你就选 agent teams。 好, 下面我们来做两个选择题。第一个大家可以暂停一下,看你选什么, 那我来选一下啊,就是如果你在五个目录中需要去搜索特定模式的文件,你应该选什么?这种就应该选 sub agent 啊,因为这是典型的一个 sub agent 的 场景,你不需要跨绘画去协调。那第二个你要做一个 pr 审查,就是你提的代码吗?让一个人帮你去审代码, 你希望有多个审查者互相质疑对方的发现,这种就要选 agent teams, ok, 那 么点下一步,其中的话也很简单,大家去到这个文件里面去编辑一下, 加一个这个配置,就是开启这个 agent teams 的 一个实验性质,或者是你可以通过一个临时的变量开启,开启完了之后把 cloud code 这个终端重启一下就 ok 了。好,我们下面来看一下如何去触发,让它去创建一个团队,并且团队成员之间互相去 并且去干活。很简单,官网给了一些势力,我们来以这种代码审查的吧,就是我们有一个代码仓库,他有一些 pr, 然后我们让他去审核某一个。好,我们给了一个提示,就让他去创建 a 型的团队,去审核我们这一个的代码的提交,让他有三个角色,一个是专注安全,一个是检查性能,第三个是去做测试覆盖率。 ok, 可以 看到这个时候他已经创建了一个审查团队,启动了三个 a 镜头,并且是并行去做的。然后我们可以进到某一个 a 镜头里面去看一下他的一个情况,可以看到其实他本质上就是一个靠的实力吗?然后给他一段提示词, 完事之后这一个他的老大给他发了一个消息,让他去审查 pr, 然后他就开始去做这个事情了。同时你也可以 换到另外一个安全的这一个审查 a 技能里面点一下它其实也是跟刚刚那个一样的,就是并行,就把这 a 技能并行,就这么简单,然后他们之间可以通信,这两个三个之间可以通信,然后他的老大跟他们之间也可以互相通信,就这么简单。 ok, 我 们终止一下。 好,我们回来刚刚只是演示了一个并行代码去做审查的一个试验,其实你也可以去指定创建你的那个团队里面成员有哪个,每个 tim 他 也可以指定一些单独的模型。 好,下面我们来看一下他整个的一个架构与通信。在最开始我们其实可以看到他有一个领导嘛,有个领导他会去创建整个团队的一个主要绘画,负责去派生出来各种团队的成员,就是各种 agent 嘛。那这个时候每一个成员的话,他是一个独立的 cloud code 私密,他可以收到一段提示词, 然后由这一个领导给他发的一条消息。那下面就是这一个任务列表,这个很关键,这一个是由 领导者去创建任务了,然后这个任务之间的一些依赖关系都由他来去指定,指定完了之后,成员之间就是我们的 agent 嘛,他自己去领任务,领完之后去更新状态执行,然后去把消息回传给他。 那这个过程中势必会有一些任务,他是需要有一个先后顺序的,那这一块全部由领导去分配好了,他去挨个执行就行了。 如果他发现他要依赖任务 a, 那 就他就在阻设等,等到任务 a 完成了之后,他就知道该他,他就做这个事情了。还有的话他们还有一个消息系统,这个消息系统是用于 agent 之间直接通信的,也就是说两个 agent 之间他可以直接通过这一个组建来通信, 那下面的话是他的一个存储的结构,他的团队配置任务信息全是放在本地的,就是本地的文件嘛,也是在这个点 call 的 文件下面的。我们下面来看一下整个的一个真实的配置长什么样子。哈,我们点开 可以看到我这里有一个啊, ui 重构的一个团队嘛,就是我给他一段提示,让他帮我们去重构 ui, 那 重构 ui 的 话,你会涉及到它把主要的色调确定完了之后,其实你要改 n 个文件,完全是可以并行,一个 agent 它负责一二三个文件,那第二个 agent 它负责四五六, 那这样子的话,他就可以通过组的一个 a 境呢?他可以派生出来更多的成员去做这个事情,那这块他就派生出来了。呃,四个成员,第一个成员是他自己嘛?他是一个领导性质的。那那紧接着其他的就是一些他的团队成员嘛?然后加入的时间是什么?他的 a 境的 id 是 什么?名字是什么?他的 type 类型是什么?你要用的模型这块都在你 这一这一切都在你说那一句提示时,之后他默认在背后去帮你做的事情。看这个数据结构其实看起来也不是特别复杂,是不是? ok? 好, 那上下文跟通信的话,其实前面讲就是每一个 a g 的 实力吗?他有他自己的一个独立上下文,并且他在启动的时候,他会收到他的老大给他派发的一个 提示词,他根据这个提示词去干活。啊。那权限这块呢?就是你的成员是继承你领导的一个权限吗?如果给他了一个最高权限,那你的团队成员也可以继承这一个权限。好,当领导创建完任务之后,任务其实有三种状态,一种是待处理,第二种是进行中,第三种是已完成。 团队成员按自己的需要去领任务,然后去完成,完成完了之后把消息通知给领导完事了,那整个过程是通过一个文件所的机制去防止多个成员去共同认领同一个任务。 ok, 那 待会我会给大家看一下一个做真实项目去开发功能的一个 agent team 协助的一个流程。好,我们现在开始首先确保你的环境变量配置了 agent team 的 实验功能。第二个要保证你的版本是最新的,我们把提子词给到它 这个提示层里面的话,重要的一句话就是这个,你要创建一个五个人的 agent teams, 它会自动去帮你创建,然后你只需要告诉他,你每一个成员就是你的团队成员嘛,有架构设计,有后端 啊,有前端,有 qa, 有 review, 它会自动去创建团队,会给每一个 agent 去分配一个名字,以及它所需要完成的任务。执行顺序的话,肯定是架构先设计嘛,设计完了之后,后端跟前端可以去做并行开发,最后再有 qa 去测试,最后再导入代码,整个过程其实就跟我们传统做软件开发的流程是一样的。好,我们看到他这边给我们创建了团队和任务, 先创建任务,再去设置好依赖关系,因为肯定是设计先行嘛,你得设计完了之后端跟前端才能去进行执行任务嘛,这时候他就开始执行一个架构的 a 技能去执行我们的第一个任务,可以看到这下边有个这下边哈,他这个是我们的主 a 技能嘛,下面是他的那个团队里面的成员,我们其实可以点进去看一下他在干嘛,这时候你可以从上面可以看到哈,因为这个 这个就是一个 curl code 的 实力,这个时候有他的一个提示词,你的任务项目背景关键的文件,那他就开始去做了啊,这从这里可以看到他其实是新开了一个那个 curl code, 我 们回去 后续的话,我们会在这个位置可以看到有多个进来,就是会有一个后端前端的进来, ok, 从这块可以看到他在这个地方启动了后端前端的 a 帧,这个时候这两个在这下面就开始去单独的一个 curl code 时里面去完成任务了,他会接收到 他的老大派给他的一些任务,会交代他的一些背景提示是什么,他要完成的任务是什么,我们点进去看一下, 可以看到也是跟刚刚那个一样的,就是你要去做什么,你是这个团队的后端开发者,你的任务是干嘛的?你的核心要求是什么?实现步骤大概给了你一些,你就去干活吧, 干完活之后你再向我汇报,就是项目经理那一套,项目经理去把任务拆分完成之后,后端去领任务,前端去领任务,领完之后开发完了之后,最后再交给 qv, qv 车队完了之后你再去做一些代码的审查,就是这一套流程,那前端其实也一样的,你看嘛 可以看到后端,现在我们可以看到后端跟前端都弄完了,弄完了这个时候他就可以走到 q a 阶段了,所有都是由这个主 agent 去协调他的团队成员,后端前端 q a review 去完成任务,这 q a 他 收到的任务就是一段让他去做测试的嘛,包括单元测试、集成测试。 ok, 这个 q a 的 agent 他 已经干完活了啊,他说结果非常好, 跑完了他,并且把他的任务标记完成了。这个时候我们的这个领导啊,老大接收到这一个他的队员啊,把这个任务完成了之后,他就下面开始安排另外一个小工去干活了,就这个代码 review, 马上下面就会创建一个 review 的 agent, 我 也可以看到这里面已经开始干活了,也是一样的,开启了一个 cloud code 的 实力, 整体完成度的话八十分吧,因为他中间会有一些 bug, 最开始不是一次可用的,有一个有两个前段的 bug, 有 一个后段的 bug, 是 数据库那边相关的。就我们测试这个任务总共花了三千万托克,大家觉得怎么样? ok, 这就是今天所有的视频内容了,其实核心就这一个图,如果你觉得这个视频做的不错了,可以给我一箭三连,大家拜拜。拜拜。

最近爆火的 openclaw 让 agent 这个话题再次变成热点,不过 openclaw 由于需要部署,配置非常繁琐,而最近的 mini max agent 更新了一个专家 agent 功能,已经支持全平台使用,体验更加便捷好用,甚至可以帮你来管理你电脑的文件进 行归类。比如说现在我想让他帮我整理一下电脑的桌面,可以直接点击下面的文件整理助手。首先他会扫描所有文件有哪些,然后创建文件夹,接着创建一个脚本来智能分类,所有操作都在几秒钟之内完成。 再来一个比较复杂的,我让他在小红书找到 ai 标签的视频,将所有视频抓取链接,封面,标题,然后制作表格并保存到我的桌面,最后直接生成一个 excel 文件,他也是成功的完成了。甚至如果我们已经登录了我们的账户, 我们可以让他为我们发布文章或创建帖子并直接上传。同时呢,我们也可以使用最近比较火的 skills 以确保精准操作,简直是牛马人的福音。 mini max agent 的 资料我已经整理好了,评论领取,欢迎点赞、关注收藏,我们下期视频再见!

你在用 cloud code 做一个大项目的时候,是不是经常觉得一个 session 不 够用? 改前端的时候,后端在 id 写测试的时候,主逻辑停了, review 代码的时候,只能从一个角度看,你想让 cloud 同时干好几件事,但一个 session 只有一个脑子干完一个才能干下一个。现在 cloud code 支持了 agent teams, 你 可以同时跑多个 cloud 的 实力,让它们像一个真正的开发团队一样写作。今天这期视频看完,你就能在自己的项目中把 agent teams 用起来了。 大家好,这里是 l l m x factors, 一个专注于拆解大语言模型时代底层逻辑的频道。 今天我会从四个层面帮你完整理解 agent teams。 首先是它到底是什么,我会用一张架构图帮你建立全景认知。然后是核心机制,从起用配置到任务系统到通信方式六个步骤逐一拆解。 接着是三个实战场景,并行 code review、 竞争假设、 debug 以及跨层并行开发。最后是决策框架,帮你判断什么时候该用 agent teams, 什么时候用 subteams 或者 denunciation 就 够了。 好,既然知道了为什么需要它?我们来看看 agent teams 到底是什么?我先给你一张全景图。 agent teams 的 整体架构有四个核心组建我一个一个讲。最上面的 team lead 就是 你当前的 cloud code session, 它的职责是创建团队, 给每个 teammate 分 配任务,最后综合所有人的工作结果,你可以理解成项目经理。下面这些是 team mates, 每个都是一个独立的 cloud code, 实力关键词是独立。每个 team mate 有 自己的 context window, 互相之间不共享上下文,这意味着 team mate a 不知道 team mate b 在 做什么, 除非通过消息系统沟通,然后是两个共享资源。 tasklist 是 所有人都能看到的任务看板 lid 在 上面创建任务, teammates 可以 认领和更新状态。 mailbox 是 消息系统,支持两种模式,点对点发给特定 teammate 或者广播给所有人。 打个类比帮你理解。 agent teams 就 像一个项目经理带几个工程师 pm 在 giro 上创建 ticket, 工程师认领后在 slack 里沟通, team lead 就是 pm, task list 就是 giro, mailbox 就是 slack, 每个 teammate 就是 一个工程师。但这个类比有一个重要区别, 真实的人类团队,工程师可以走到对方工位看代码,或者共享同一个知识库。 agent teams 不 行,每个 team mate 有 自己独立的大脑,也就是独立的 context window, 不 能直接看到其他人在做什么, 所有信息交换都必须通过 mailbox 显示通信。这个区别很重要。后面讲到最佳实践的时候会用到 很多人会把 agent teams 和 subteams 搞混,我们来看看它们的核心区别。从 context 来说, subteams 是 在主 agent 的 session 内运行的,结果返回到主 agent 的 context 里,而 agent teams 的 每个 teammate 有 完全独立的 context window。 通信方式上, subservants 只能向主 agent 汇报,最终结果是上下级关系。 agent teams 的 kinmates 可以 直接互相发消息,是平级协助关系。任务协调方面, subservants 有 主 agent 全权管理, agent teams 有 共享的 task list, team mates 可以 自己认领任务,不用等力的一个一个分配。适用场景上, sub agents 适合聚焦型任务,你只需要最终结果。 agent teams 适合探索型任务,需要团队成员之间的讨论和挑战。最后是成本, agent teams, 因为每个 team mate 都是独立实力, token 消耗会明显更高。一句话总结, sub agents 是 派出去办事,然后汇报。 agent teams 是 组建一个真正的协助团队, 给你一个快速判断逻辑。你的任务需要多个沃克同时工作吗?如果是下一个问题,这些沃克之间需要互相沟通吗?如果不需要,每个人独立完成任务,然后汇报结果就够了, 那用 subordinates, 清亮又慎重肯。如果需要,比如一个人发现了什么,要告诉另一个人,或者需要互相挑战对方的方案,那就用 agent teams。 还有一种情况是任务之间有依赖关系。 agent teams 的 task list 原生支持依赖管理 任务 a 没完成任务 b 就 不会被认领。 sub agents 做不到这种级别的协调。记住这个判断标准,需要沟通。用 teams 不 需要沟通,用 sub agents 有 复杂依赖也优先考虑 teams 概念清楚了,我们来拆解 agent teams 的 核心机制,一共六个步骤,先减后烦,一步一步来。 第一步,奇用功能, agent teams 目前是实验性功能,默认关闭。你需要在 settings 权限里加一个环境变量,把 cloud code experimental agent teams 设成一这个文件在你的后目录下的 cloud 文件夹里。同时你可以设置显示模式。 teammate mode 有 三个选项, auto 是 自动检测, in process 是 所有 team mate 跑在主终端里, timax 是 每个 team mate 一个独立的终端分屏。 auto 模式下,如果你已经在 timax 里,就自动用分屏,否则用 in process。 建议刚开始用 in process 最简单,不需要额外安装任何东西。 第二步,创建团队你不需要写任何配置文件或调用 a p i, 直接用自然语言告诉 crotd 你 想要什么样的团队,多少个成员,每个人负责什么。比如你说帮我创建一个团队来 review p i, 一 百四十二三个人分别看安全、性能和测试覆盖。 crotd 会自动创建团队 深沉共享的 task list spawn, 三个 teammate 给每个人分配对应的任务。你还可以指定具体用什么模型,比如让每个 teammate 都用 sonnet cloud 也可能主动建议创建团队,如果他判断你的任务是合并型处理,他会问你要不要组团,但最终决定权在你, cloud 不 会未经确认就创建团队。 第三步,理解任务系统。 tasklist 是 agent teams 的 核心协调机制。每个任务有三个状态, pending, in progress, completed。 流程是这样的, lead 创建任务后,状态是 pending teammate, 认领任务后,状态变成 in progress。 工作完成后, teammate 把状态改成 completed。 lead 有 两种方式分配任务,一种是显示分配,直接告诉某个 teammate 去做某个任务。另一种是让 teammates 自己认领,完成一个任务后自动去 tasklist 上找下一个没人做的任务。 这里有个细节,任务认领用了文件所机制,防止多个 teammate 同时抢同一个任务。 任务系统还支持依赖关系,比如测试任务依赖于功能实现,任务实现没完成,测试就不能开始。 你可以在创建任务时声明依赖系统会自动管理。当一个任务被标记 completed 后,依赖它的任务会自动解锁,变成可认领状态。 这个设计很重要,它保证了有先后顺序的工作,不会乱套,同时不需要人工去盯着解锁力的,只需要在创建任务时把依赖关系说清楚,后面的调度全是自动的。 到这里,你已经知道怎么起用 agent teams 怎么创建团队以及任务系统是怎么运作的了。 回顾一下,起用只需要在 settings justin 里加一行环境变量,创建团队用自然语言描述就行。任务系统有三个状态支持依赖管理, team mates 可以 自己认领任务, 这三步是基础,掌握了就能跑起来了。接下来是更有意思的部分, team mate 之间怎么沟通,以及几个让你精细控制团队的高级功能。 第四步,通信机制。 teammates 之间通过 mailbox 通信,有两种模式,第一种是 message 点对点发送,你给特定的某个 teammate 发消息,只有他能收到。适合针对性的协调,比如 lead 通知,安全 reviewer, 重点关注某个文件。第二种是 broadcast 广播,一条消息同时发给所有 teammates, 适合全员通知。 比如某个 teammate 发现了一个关键 bug, 需要所有人都知道,但要注意广播的成本,每个 teammate 都会把这条消息写入自己的 context window, 所以 广播用得越多, token 消耗越大。还有一个设计细节, 消息到达后是自动投递的 le 的, 不需要主动轮询, teammate 完成任务后也会自动通知 le 的。 第五步,显示模式。 agent teams 支持两种显示方式, in process 模式,所有 teammates 跑在你的主终端里,用 shift 加上下箭头切换不同的 teammate, 按 enter 查看某个 teammate 的 完整输出, 按 escape 可以 打断它当前的工作。这个模式不需要任何额外安装,任何终端都能用 splitpence 模式,每个 teammate 有 自己独立的终端分屏,你可以同时看到所有人在做什么,点击某个面板就能直接和那个 teammate 对 话, 但这个模式需要 tmax 或者 itm。 二、我的建议是先用 in process 入门,等你熟悉了 agent teams 的 工作方式之后,再切到 splitpence, 获得更好的个性化体验。 第六步,高级控制这里讲三个重要功能。第一个是 delegate mode, 默认情况下, lead 有 时候会忍不住自己动手写代码,而不是等 team mates 完成。你可能已经分配好了任务,结果 lead 自己先做了一半,搞得和 teammate 的 工作重复甚至冲突。 delegate mode 解决这个问题,它限制力的只能做协调工作。 spawn teammate 发消息管理任务,不允许直接修改文件或写代码,所有实际的代码修改都必须交给 teammates, 按 shift 加 tab 就 能激活。这个模式在任务比较复杂, teammates 比较多的时候特别有用。 你希望 lead 专注于总控和综合,而不是分心去做执行。第二个高级功能是计划审批。对于复杂或有风险的任务,你可以要求 teammate 先做计划再实现。 具体流程是, lead 在 spawn teammate 的 时候声明需要 plan approval, teammate 会进入止读模式,只分析问题和制定方案, 不做任何修改。方案完成后提交给力的审批,力的可以通过,也可以拒绝。如果拒绝了,会附上反馈 teammate, 根据反馈修改计划重新提交。只有审批通过后, teammate 才能退出计划模式,开始实际编码。 你还可以给力的设定审批标准,比如只批准包含测试覆盖的方案,或者拒绝修改数据库 schema 的 方案。 第三个是 hooks, 可以 理解成质量文 code code 的 hooks 系统支持两个和 agent teams 相关的钩子, teammate idol。 当一个 teammate 即将进入空闲状态时出发,如果你的 hook 脚本返回 exit code 二,就会把反馈发给 teammate, 让他继续工作,而不是停下来。 task completed, 当一个任务即将被标记完成时,触发同样, exit code 二可以阻止任务完成并发送反馈要求改进。这样你就可以用自动化脚本来做质量检查,比如跑一遍 link, 跑一遍测试不通过就不让 tmit 收工, 机制都清楚了。接下来我给你三个真实的使用场景,让你看到 agent teams 在 实际项目中怎么用。 第一个场景并行 cold review, 传统的 cold review 一个人看往往会偏向某一类问题,比如你可能先看到了安全问题,然后就一直在安全的角度上深挖性能问题,就容易漏掉。用 agent teams, 你 可以同时 spawn 三个 reviewer, 一个专看安全,一个专看性能,一个专看测试覆盖。每个 reviewer 只关注自己的维度,不会互相干扰。看完之后,力的综合三份报告,给你一个全面的 review 结果,这比一个人创新 review 三遍要高效得多。 而且因为每个 reviewer 是 独立的 context, 不 会因为先看了安全问题就对性能问题产生认知偏见。 第二个场景,竞争假设 debug, 这是 agent teams 最有趣的用法。当一个 bug 的 根音不明确时,一个人调试容易陷入铆钉效应,找到一个看起来合理的解释就停了, 其实可能不是真正的原应用 agent teams, 你 可以 spawn 五个 teammate, 每个人负责验证一个不同的假设。关键是这里用了一个对抗式设计。 每个 team mate 不 只是验证自己的理论,还要试图推翻其他人的理论,就像科学辩论一样,最终经受住所有挑战的假设,才更可能是真正的更硬。 这个 prompt 里有一个细节很重要,让他们互相 talk, 互相 disprove, 这正是 agn team's 比 sub agn 强的地方。 sub agn 做不到这种横向讨论。 第三个场景,跨层并行开发。比如你要做一个新功能,涉及前端组建,后端 a p r 和测试。传统做法是串行,先写后端,再写前端,最后写测试。用 agent teams, 你 可以三个 team mate 并行, 一个负责前端,一个负责后端,一个负责测试, lead 负责协调,比如确保前后端的接口齐员一致。当后端 team mate 修改了 api 的 参数格式,它可以通过 mailbox 同之前端 team mate 同步调整。 这里有个重要原则,三个 team mate 要操作不同的文件,如果两个人同时改同一个文件,会导致覆盖冲突,所以在分工的时候要把文件边界划清楚。 场景看完了,最后帮你做一个决策框架,什么时候选 agent teams, 什么时候不需要,先看,什么时候适合研究和 review 任务。多个 team mate 可以 同时从不同角度调查同一个问题。 比如刚才说的并行 code review 新模块开发,每个 team mate 负责一个独立的模块,互不干扰竞争假设 debug 并行测试,多个假设用对抗式辩论收敛。 跨层修改,前端后端测试各一个人,再看什么时候不适合。顺序依赖的任务,后一步必须等前一步完成。并行没有意义。同文件编辑,两个 teammate 改同一个文件会互相覆盖。 简单,任务协调本身就有开销,任务太小的话开销大于收益。 token 敏感的场景, agent teams 的 token 消耗是倍数级的。核心判断标准就一个,你的任务能不能拆成独立的并行单元,能拆就适合,不能拆就不适合。 aging teams 目前还是实验性功能,有一些限制,要了解。第一,不支持 session 恢复。如果你 resume 一个 session 之前的 in process, teammates 不 会恢复, lead 可能会尝试给不存在的 teammate 发消息,这时候你需要告诉他重新 sport。 第二,一个 session 只能管一个厅,想建新团队必须先清理旧的。第三,不能欠套。 teammates 不 能创建自己的子团队,只有力的能管理团队。第四,力的固定,谁创建的团队谁就是力的,不能转让。 第五,任务状态有时会滞后, timet 可能忘了把任务标记成 completed, 导致依赖他的任务一直堵塞,遇到这种情况手动提醒一下就好。第六, splitpence 模式需要 tux 或 iterm。 二 vs code 集成终端和 windows terminal 目前不支持。 最后,给你一个最佳实践速查表。第一,给 timet 足够的上下文, timet 不 继承立德的对话历史, 所以 spawn 的 时候要在 prompt 里把项目背景、文件路径、技术栈关注重点都写清楚。第二,合理拆分任务力度。太小的任务协调开销大于收益,太大的任务, teammate 可能跑偏了你都不知道。 经验值是每个 teammate 分 配五到六个任务,既保证持续生产力,也给力的足够的机会调整方向。第三,避免文件冲突。两个 teammate 改同一个文件会覆盖, 所以分工的时候一定要把文件边界划清楚。第四,定期检查进度,不要让团队 unattended 跑太久。第五,如果你是第一次用,从 review 和 research 类任务开始,这类任务边界清晰,风险低,是最好的练手场景。 我们来回顾一下今天的内容。 agent teams 由四个组建构成, team lead 负责协调。 team mates 独立执行 task list, 管理任务状态和依赖。 mailbox 提供点对点和广播通行。它的核心价值是并行探索和多角度协助,特别是 teammates 之间可以互相挑战对方的方案。 和 substance 相比,如果你的 walker 之间需要沟通,就用 teams, 只需要最终结果就用 substance。 最适合的场景是 code review 竞争,假设 debug 和跨层并行开发, 使用时注意避免文件冲突,保持合理的任务力度。给 teammates 足够的上下文,如果你想试试的话,建议从你下一个 pr 的 code review 开始。 spawn 三个 reviewer 分 别看安全性能和测试,感受一下并行 review 的 效果。 如果这期视频对你有帮助,记得点个关注,这里是 l l m x factor, 我 们下期见。

今天我很开心啊,前几天我不是分享了很多关于 agent teams 的 相关洞察,我看到评论区好多朋友都实践起来了,尤其是不少非技术背景的朋友,用 agent teams 打开了普通人用 ai 的 大门。 我觉得呢,其实获取信息啊,并不太能改变自己,但信息如果让我们行动了起来,实践了,产生了结果, 那么一个小的正反馈循环就形成了,持之以恒,这些收益就会递增。在你的 ai 之路上,我前面有好几个视频,应该都能让人动起来,比如说如何获取信息源, 如何点亮我们造工具链的天赋,如何做好一个 skill, 如何用好 agent teams。 那 么今天我要分享的,刚好是把这所有的内容都串起来了。如果你们刚好看过我前面的内容,你们就能理解我平时解决一个问题的小闭环是什么样子。 我们先回到我上一个视频遇到的痛点, agent teams 是 个黑盒呀,还是需要尝试很多编排的组合来实践它效果的。 但是有一个问题啊,我发现 team 成员之间的通信并不透明,我们能看到的只有一个标题,而且通信信息都混杂在了 cloud code 的 消息里,如果被压缩了,就完全看不到了。前几天啊,我在 x 上看到一位大佬发了一个帖子, 劳资寇的逆向了,他自己发现 agent 之间靠读写 jason 文件聊天。这个文章呢,应该是 defy 团队的大佬。这个帖子主要讲了大佬发现的一些关于 agent teams 的 技术细节,但简单来说, 其实就是 agent teams 的 详细都存在这个目录底下。我不得不说啊,现在推上这样的干货也越来越少了,而且越来越出现一种新的趋势,就是用 ai 不 断地放大情绪的那种 正确但是又忽悠傻子的文章。所以我补充信息员筛选的一个原则,也就是什么样的内容能让你立即行动起来,那就是有意义的内容。我把大佬的帖子喂给 ai, 我 问他,你给我验证一下他说的是不是真的。 我用的是 kimi k 二点五,它没有花很长时间,很快就验证成功了,它的验证结果就堆在了这个上下文里,而这个上下文变成了我们第二步的一个基础,我们需要把它做成一个工具。 我问他能不能够做一个 gmail 的 基础站,带前后端漂亮的网页面板,让我可以随时监控这些 agent teams 产生的日历文件,而且要用 agent teams 来做。 k 二点五很快就完成了, 当然这不是 oneshot 完成的,来来回回改了大概两个上下文窗口吧,最终做出来一个我比较满意的样子。我之前也分享过如何用 chrome devtools 配合 k 二点五的多模态,基本上实现,我只需要说哪里不满意,它就能朝着我的方向来优化。 那么第三步,也就是我常用的 skill creator。 我 用 skill creator 把这个前后端项目封装成了一个技能,下次直接输入技能 slash team dashboard 就 可以启动前后端,打开网页看,是不是很方便,给大家演示一下啊。 我现在有这样 team dashboard, 大家看,这就是它打开之后的效果。这里面左边的这列是你曾经创建过的团队,右边是团队的成员的收件箱, 比如说 leader, 它的一些状态,更新发送的任务日制,当然可能还有一些 bug, 但是我觉得已经大差不差了,已经可以用了。 到此为止,我只花了半个小时,就把一个帖子变成了我生产力工具链的一环。这整个流程其实只是我日常工作中的一个小片段。我想给大家分享的是,这是一个复利的世界, 当你花了时间去读一个信息,如果你能行动起来,把一些信息消化掉,无论是学会了知识,还是变成了自己的工具链,这些都成为了可以产生复利的资产。所以你们要是问我什么是好的信息员, 那能不能复利就是一个很好的标准。如果大家经常看我的视频,会发现我分享的内容其实都是体系化的,都是技能组。 所以如果本期的内容也让你产生了行动的动力,不妨再翻翻往期,真正动手去实践一下,一定会更好。另外,我觉得只是伸手可能无法成长的,所以我没有未泛级的代码和文档,得全靠大家自己了。 最后啊,我在写这篇稿子的时候,又发现了一个痛点,我想用 cloud code 的 resume 命令去恢复 session, 然后录屏给大家分享之前的对话。 但是发现一旦被压缩了上下文之后, session 也不全了。所以我就趁着写稿的时间,就让 ai 参考 team dashboard, 给我搓了一个 session dashboard, 这样我就可以更方便的追溯过去的聊天记录了。怎么样,你们学会了吗?好了,以上就是本期全部内容了,谢谢大家!

今天我们来快速的过一下 opencloud 的 下载安装以及原理解读。那么首先是怎么样去安全的安装 opencloud, 就 像工信工信部警告的,如果直接把它装在电脑的操作系统上,这会是一个非常危险的事情,那么我们应该怎么做呢?我们首先可以如果想体验一下 opencloud, 我 们可以云 docker 这个方案 相当于在电脑上做一个虚拟的操作系统,然后把这个龙虾纸装在这个虚拟电脑里边,对,然后我现在已经有的中文文档,不过还是有一些 technical 的 部分在,我就带大家快速过一下啊。那么首先是我们确保我们找得到这个 gitlab 的 openclaw, 其实也很简单,在 openclaw 这个页面里点点 gitlab, 然后就能找到它的仓库位置, 然后 docker 呢?呃,就是正常下载即可,比如简单的话下载一个 docker task, 选择操作系统版本,我们下载好安装即可。然后我们怎么样去装 opencloud 呢?就是用 git bash 来,那么首先大家也需要确保我们的 git bash 是 装好的, 那么 git bash 怎么下载呢? git bash 是 一个帮助我们在 windows 上使用 linux 操作习惯以及 git 命令的这样的一个工具。然后我们可以直接在 git 官网上,然后在 git 官网上点击下载,然后下载安装即可。 然后打开 gitlab。 之后呢我们选择一个我们想安装的路径,比如说我想安装到 e 盘上,那我就先切到 e 盘上,然后在 git clone 这里我们等待它下载完成 好,完成之后呢,我们切到我们下载的地址就是 e 盘,然后我们去找这个 opencll 的 这个项目,然后我们就找到了这个就是我们刚下好的 opencll 的 这个项目了。呃,那么接下来呢,我们就切到 opencll 的 这个项目, 然后呢我们就开始 docker 的 安装,那大家只要访问这个文档里的这个网站,选择安装,然后选择我们的 docker 安装方式, 呃,然后在快速开始这里复制这行命令,粘贴到我们的 git bash 里就好了。这里可以看到我们因为网呃网络的问题没有下载成功,这也非常的常见,那么需要怎么做呢?我们就需要输入一个这样的 proxy 啊,当然前提是大家自己是有 proxy 的, 然后我们把它粘上, 然后再重再来一次这个 proxy, 这里边我们可以在在这里,在这里的复制环境变量里选择 bash, 然后点击这个复制,我们返回我们的记事本里粘贴即可。 对,这里边如果我们显已经显示,如果这三个都显示的是勾的话,说明我们的 docker 这部分已经运行完成,然后这里会问我们是不是个人使用,那我们就选是,然后 click start, 这里边如果我们第一次进来的话,比如说我们 reset 起来, 呃,会让我们来选择一个模型提供商,那么这里边我们就按大陆可以正常使用的这个 kimi 二点五来选这个 kimi 二点五 c n n k, 然后呢这个 k 呢?就是当然如果有别的大模型提供商的 api key 也可以直接放到这儿了。呃,然后这里边呢就是我们搜索这个 moonshoot 或者说 kimi 的 api key, 然后选择新建 新新建一个 key, 然后比如我们选一个 key 的 名称以及一个所属项目,它就会新建一个密钥,然后我们只需要把这个密钥复制粘贴, 然后我们只要把这个密钥复制粘贴到下一步即可。这里边我们会选择选哪一个这个渠道来去快速开始?呃,那么的话国内支持的呢?其实就只有飞书了啊,不过这里我们可以用这个 escape for now search provider okay。 呃,然后 skill 也可以先 skip 掉。对, 我们先把这个系统装起来,然后这里边如果显示这样子的话,就说明它在我们的 docker 内已经安装完成了,然后我们可以再打开我们的 docker。 呃, docker, 现在我们的 open cloud 运行的地方就在 docker 里边了。 open cloud get 位的概念,这概念在我后面会在讲原理的部分会给大家聊一下, 那么这里呢,我们就能看到这里就是实际的我们创建的这样的一个隔离的容器,那么我们的所有的 opencll 的 运行就发生在这个容器里边,这样的话我们就做好了隔离, opencll 就 没法来影响我们外部的操作系统和我们电脑的任何文件了。 那么这个时候有朋友可能会问,那如果说我想让 opencll 去读取某个文件怎么办呢?接下来我给大家演示一下怎么样在这个情况下做文件的管理。 那么大家看到这个返回的时候,就说明我们已经成功地在 docker 里开始运行 opencl 了,那我们也可以在 docker 的 这个界面里,呃,在 container 里找到正在运行的 opencl, 然后这个呢就是在 docker 里的终端了,然后我们去打开 opencl 的 这样的一个网页,对,呃,如果不确定呢,我们还可以用这个命令,对 对,说明它是正常运行的。然后呢我们进入这,呃,然后呢我们输入这个网址,在浏览器里就进入了 opencloud 的 操作界面了,比如这里呢,我们就可以给他打个招呼。 好,呃,那么具体呢,我们怎么去访问它的这个文件目录呢?首先在 docker 里边其实可以配置,我们让它呃去把哪一个目录去挂载给 docker, 也就是让它有权限查看哪个目录。那么默认的位置呢?一般呢?是是这里, 呃,就是 c 盘用户的这个 workspace 里,大家可以复制一下这个呃命令,然后粘贴下这里呢,就是呃他可以看到的文件的目录呢? 呃,也就是说在这个模式下,他只能看到我们给他指定好的工作区以及虚拟容器内的部分,是他可以看到以及操控的部分,那么在外边呢?他是不知道的。呃,我们可以怎么验证一下呢?比如说我们来验证一个,我们来新建一个 t x t 吧,名字就叫小猫的秘密。 好,然后我们呃这里可以说小猫的秘密等于一个乱码。对,比如说我们可以先不把它放到这儿,我们可以先把它放到呃这里,先把它放到用户的外边,然后我问他小猫的秘密是什么? 然后我们可以看到他找不到小猫的秘密这个文件,然后我们把它移到我们的工作区里,对,然后再询问他, 他又正确的找到了我们刚刚创建的这个小闹咪咪,然后我让他跟生成一个可爱的, 哎,好,我们可以看到这个时候他成功的给我们生成了一个 html, 我 们也同样在刚刚的这个工作区里就可以打开 啊,这里边就我们给他的秘密代码。那么恭喜你,在这里就成功的通过 dok 安装并开正确运行了 opencloud。 那 么第二部分呢,我们可以来看一下 opencloud 的 功能以及抽箱系统。我做了中英两版的图,我们就用中文版的来看吧。 呃,那么最开始呢,最上层呢,是用户,用户可以用任何有 api 的 对话渠道来和小龙虾进行交互。那么接下来呢,这些交互呢,会标准化到我们的对话入口层, 这里边就有,比如说像 c i a 的 命令行控制,或者说像刚刚我们网页里的这些呃对话的命令。 open call 会把所有的这些绘画统一翻译到网关层, 网关层呢则是由绘画管理、消息路由、事件总线,也就是 eventbus 和智能体编排来组成的。那么这里呢,其实 open call 对 智能体编排本身并不是特别重的一个编排, 它更多的强调了一个 react 的 框架,呃,也就是不停的去做这个规划和推理,直到任务完成这样的一个框架了。呃,那么里边的工作流编排其实并没有特别复杂,就没有像 long graph 或者说我做的 wtv 这种 很重的工作流编排了。呃,更多的呢,是强调于就像我们现在会用的一些,比如像 skill, md 啊之类的,以及一些对浏览器和消息啊文件区包装好的操作的接口。呃,那么这两部分呢,是它智能体编排的部分了。 呃,那么在上下文解锁呢,是用了长期记忆和短期记忆两个部分吧,其实,呃,主要还是通过 jectic search 和 rag 两个部分来做构成的吧。那么具体 openclaw 是 怎么使用 rag 的, 我会单独的出一个视频和大家分享一下。 呃,那么这个智能体验新层呢?最终会访问的资源呢?是 lm, lm 提供商提供的 api, 然后以及外部的 mcp api 以及互联网的资源,本地的操作系统以及文件区可以提供的文件。呃,总的来说,呃, openclaw 的 抽象功能就是这些了, 那么后续也会持续更新,去带大家深入的了解 open call 架构以及。呃,代理搭建一个 open call, 那 么后面两期会更应和更偏 agent 工程师呃, 这个方向一些了。呃,那么这个账号呢?我后续也会分享一些在 p h d 视脚下有价值的。呃,这种 max 啊,多智能体领域的最新的论文以及项目。呃,并且也会分享一些自己的开源项目和论文。呃,最后感谢大家的三连以及关注,谢谢!

早上好,家人们,我是鬼子,昨天上午 opus 四点六发了,还发了一个 team agent teams, 我 早上用它做了个视频,说我一小时写了一个 cloud 的 桌面端, 当时我确实很震惊,因为这个事情就是 cloud 的 ui 和 cloud 的 core 的 本身其实连接这块儿很不好做,所以来介绍一下。 我昨天用了一天时间,我给 op 四点六,他给我做成一个客户端了,而且颜值高了非常多,所有的功能全部都齐全。来介绍一下 code palette, 昨天 op 四点六一天做的 cloud code 客户端,目前已经开源。这个客户端主要的能力,它几乎支持 code 的 所有的功能,你的 选择,选择文件夹,切换模型,我们的斜杠命令,你的 skills, 什么调用 skills 都可以。而且它有很多易用性的设置,比如说你可以可生化的去控制你的 cloud code 的 配置文件,你在这儿配置完直接就保存就可以,没有问题。它还支持第三方的 a p i 去配置,比如说这儿 你就可以配置你常用的第三方的 colocode, a p i 也可以。呃,当然,如果你 colocode 本身是授权安装的,或者是你已经改了环境变量,你不需要在这设置,它直接就能提取到。你不用管这个事,格式化的管理你的 skills 和 mcp 文件,还有你的 plugin 直接预览, skills 也可以直接新建,这儿可以新建,你也可以改以编辑和改 skills, 点 m g 可以 直接在这儿修改和预览,还有编辑删除都可以。然后在这里边你可以去 你所有的聊天记录都在可乐扣的最大的一个问题,对于很多小白最大一个问题,我找不着我聊天记录,很多人觉得我的聊天记录其实很有价值,但是我找不着,你用这个就可以找到你所有的聊天记录都保存这样,而且他跟你的文件夹是绑定的, 而右边的话你可以预览你文件夹里所有的内容,这就是你文件夹里所有的东西,它如果是竖的话,它会支持可以预览,但是可以预览, 然后目前只支持了那个文本。哈,后面我兼容一下这个多模态的这个,如果他遇到这个视频和图片的话,就让他打开玉兰,然后你可以改你这个标题,然后也可以去,然后我们这这里边的聊天里边,你看会有会有玉,就是这个你这句话说了多少钱的玉兰? 然后这边新版本可以快速复制,现在我这个是旧一点的版本,新版本可以快速复制,然后你可以在这里快速的查看你的 cologoldoc 的 连接状态,他会告诉你连接还是未连接,如果没有连接的话,你应该怎么去安装 cologoldoc 的? 都是有的, 包括说我们这个删除搜索,基本上跟你看到的市面上的所有的 agent 软件都一样,就等于我实现了一个 co worker, 但是呢比 co worker 更强大,因为它支持 cologoldoc 的 所有的功能, 而且它还是开源的,你可以随便的改。对,这就是昨天用 oppo 四点六和 agent tims 做的可乐扣的桌面端,叫 code palette, 当然我们也可以切换这个明暗模式,都非常漂亮,主要是都非常漂亮,昨天有人喷这个也叫 u i 喷我的人,看看现在这个算不算 u i 朋友们,这个算不算?然后你这个模式切换,这会有 左边会有显示,他会显示当前是什么模式,当前是什么文件夹,什么时候聊的天,同时如果这个聊天这个文件夹正在工作,你看这个文件夹如果正在工作,他会有个红点,你切到其他文件夹再回来,他也会告诉你,他会告诉你哪个文件夹正在工作,就是哪个聊天记录正在工作,这个也是非常好的。 好,就是这些,我们来看一下这个 agent teams 到底是什么东西,就是它可以将一个主的 master 智能体委派给你多个队友,就它会有一个主的智能体控制你多个角色的 agent, 然后让他们相互协助,然后展开调研、调试和构建工作, 然后他们之间是可以互相通信的。每个 a 阵的主 a 阵呢,可以实时的知道子 a 阵的进度,子 a 阵也可以主动汇报给主 a 阵的,所以他们的写作是非常顺畅的。如何起用?其实非常简单,你就找到这个官方文档,然后把官方文档的 扔给他,官方文档直接扔给可乐扣子,让他帮你起用就行,其实就改个参数,他直接就能可以帮你改,然后有一些使用技巧哈, 你可以看到官方文档里有那个使用建议的提示词,就说你要给每个 a 阵子设置角色,每个 a 阵子在干嘛?你可能很头疼,我就是一个任务,怎么我,我还得想这些,你,你还是老问题,你把官方文档扔给他,你就说我要实现一个什么什么任务,你帮我构建一个 a 阵的 teams, 然后你也可以说直接让他帮你去写提示词,写 a 阵的 team 提示词,然后写完以后你审核,也可以说直接让他帮你构建一个 team 词, 让他直接执行就可以了。第二个是前期调研是比较重要的,就是我在昨天写这个客户端的时候,发现前期调研非常重要,在一些客户端选型,在一些架构上,其实你的选错一步,后面就会非常难受。 这里建议就是你要增加一个调研的角色,无论哪个需求都要增加一个调研的角色,让他去查看目前可付用的市面上最好的东西的架构选型应该怎么去结合,要不要去切架构,这些都需要。 哪怕你,哪怕你是说你要去优化 ui, 你 都要去让他找市面上说最好的图标库是什么,然后组建库是什么,这些都要去做。 然后第二个是第三个是 team 的 角色,不要用原来的软件工程去设计,就是我们实际上人是没法变的,你知道就是你,你给你配了什么队伍,你很难配,除非说你开了重新招人干嘛的。但是这里边 team 不是, 就是你可以针对性的设置每一个软件工程的角色,甚至让他有特长。就比如说同样是 qa, 在 去测评逻辑的时候,它就是 code review, 然后去测评那个测评的那那个功能啊,功能逻辑,实现逻辑,然后如果是体验优化,那你这个就可以去搜查视觉,搜查体验就是它,它的长度可能在体验那边同时监 qa 和代码,这个都是可以设置的, 所以不要让自己原有的这个工程能力和工程思路固化。好,这个就是今天发的内容,主要给大家介绍一下昨天发的 logo 的 桌面端 code palette 和我昨天用 op 四点六和 ai team 四的一些感受。 这个时代确实不太一样,就是我发现真的只要你敢给 ai 花钱和敢给 ai 权限,他能做到非常厉害的事情。 你像写个 ios, 写个 macos 客户端,然后非常好用,没有 bug, 所有的功能都能用一天产出来。我以前是根本不敢想的,我觉得很多程序员以前也不敢想。最后说一下这个图标,图标很有意思,为了避免这个 cologne, 我 按所 pick 去,就是即使开源它也有,它也会说你侵权嘛。 所以我做了一个这样的图标,就是从它原始的那个图标的发放射性的那个菊花形状,变成了一个体束的放射性的形状, 你猛的一看有点像,但是他又是一个立体的提速的形状,也很漂亮。你看放在这一堆非常放在这一堆非常著名的工具里边,一点也不违和,而且非常漂亮。好,这就是藏师傅今天的分享,我们明天见。

兄弟们,酷的是,增强版现在太猛了,一次性启动九个镜头来进行更新,快来用起来,快来用起来。

别在此刻 openclaw 了,你安装的再熟练,也只是在给 tucker 打工。跟风追热门 ai 工具的人,正在错过普通人逆袭 ai 时代的最佳机会。你以为装对软件就是跟上风口, 其实那将是连 ai 工具的底层逻辑都没摸透。这条视频会向你重塑对 ai 的 认知误区,让你明白普通人应该塑造的核心能力到底是什么。 最近全网爆火的 openclaw, 成为无数 ai 初学者的拦路虎,安装报错、界面看不懂、功能摸不透,折腾大半天终于装完,却不知道该用它做什么。这种无效努力,正在消耗你对 ai 的 热情和信心。其实不管是 openclaw 还是市面上各类热门的 ai 应用,智能体 决定你能不能用好它的,从来不是安装步骤有多熟练,也不是界面功能有多花哨,而是你有没有理解它底层的运行机制和原理。如果你只停留在安装、打开、随便点击的层面,哪怕把所有的 ai 工具都下载一遍,也只是在做无用功, 根本无法发挥 ai 的 真正价值,更别说用它去实现工作提效、创业增收了。 open call 之所以能在短时间内引发热议,其核心的价值是在于它整合了当前 ai 智能体体系中最关键的运行逻辑, 是 ai 工具从单一功能转向系统化运行的典型代表。它的底层并非是凭空创造出了新技术,而是集合了长期记忆、 m c p 技能模块这些现有的成熟机制,再额外增加了定时任务功能,形成了一套相对完整的自动运行体系。 而大家觉得惊艳的 ai 自动操控电脑的功能,本质上只是 m c p 机制或者 skill 模块的基础能力, 并非独一无二的创新技术。结合当前 ai 工具市场发展的现状,我将主流的 ai 智能体工具分为三大类,分别是基础交互型、集成功能型、自定义流程型。这三类工具从简单到复杂,覆盖了普通人从入门到精通 ai 工具的全部阶段。 一类是基础交互型,这类工具是绝大多数初学者接触 ai 的 起点,以简单的对话交互为核心,不具备复杂的扩展功能和自定义逻辑,只需要输入指令就能获得基础的反馈,上手门槛低,适合用来熟悉 ai 的 基本使用方式。 第二类是集成功能型,这类工具在基础交互逻辑上整合了固定的扩展模块,比如记忆功能或者是预设技能,用户可以通过直接使用现成的功能组合,无需自行搭建底层逻辑。 openclaw 就 属于这一类型,也是目前市面上最容易引发跟风热潮的工具类型。 第三类是自定义流程型,这类工具保留了核心技术模块的同时,开放了极高的自定义权限, 允许用户根据自身的需求去编辑自己的工作流程来实现接入各种有个性化、专属机制的自动化运行方式,是普通人用 ai 打造专属竞争力的核心工具。绝大多数刚接触 ai 的 初学者都停留在使用基础交互型 ai 工具的阶段,少部分人跟风使用集成功能型 ai 工具, 而那些能够真正解决自身问题的,往往是那些精通自定义流程型 ai 工具的人。以文案生成的全流程为例,我搭建全自动化的流程是这样的, 第一步,整理整个任务的执行和步骤,也就是整个任务执行中的重点,也是人类需要介入的核心板块。你要整理的就是如何让智能体看懂它接下来要做的内容和流程,也就是要整理一份逻辑清晰的说明书,这个说明书也就是我们俗称的 skill skill 模块,你可以把它看成是一份工作手册,只有先梳理清楚手册内容,才知道接下来的任务要怎么做,从哪做,验收标准是什么,这与现实世界中人类的工作逻辑并无差别。第二步,设计好单条 skill 后,要搭建可赋用的模板, 这是提升效率的关键,也是普通人用 ai 规模化提效的核心。针对文案生成,我搭建的赋用模板包含固定板块和可变变量。固定板块包括执行步骤、反攻规则、输出格式, 这些是所有文案生成 skill 通用的,你不需要重复修改。而可变变量的是 skill 的 名称,它调用的关键词是什么?核心约束有哪些? 比如你所在的领域,你对视频时长的要求、风格以及关键词等等。每次只用替换这些变量,就能快速生成新的文案。第三步,给 ai 装上脚手架,也就是他的手和脚,把需要的行业知识点和你的数据进行解锁,让 ai 自己改造为 m c p 的 形式,接入到自己的系统中。 m c p 就是 可以真正执行的工具,方便快捷而且不复杂。这点事情让 ai 自己给自己完善,在当下已经不是一件复杂的事情。 ai 会通过 m c p 接入实时数据,你的资料库、知识库等等,它会去自动解锁当前同赛道的最新热点、热门话题、流量、关键词等等。同时在准备好的内置自媒体 知识库里筛选出高价值的文案创作知识点,确保生成的文案能够紧跟流量的趋势,具备爆款的潜质。第四步,优质模板库中筛选出评分最高、适合当前需求的优质文案框架, 同时抓取近期同赛道数据表现最好的对标作品,他的文案以及他的结构、逻辑、亮点等等,为后续的文案创作提供参考,保证文案的质量和竞争力。第五步,自动化文案生成与优化。 ai 汇总所有收集到的信息,结合你账号的画像和热点数据,自动生成两篇差异比较大的文案。同时按照平台的推荐规则, 优化文案的开头钩子、中间节奏以及结尾引导,来提升文案的流量潜力。第六步,效果反馈和迭代机制。 ai 生成文案后,会主动询问你对文案的满意度,你的评分会被记录为长期记忆, ai 会根据你的反馈自动优化后续的文案生成逻辑,让文案产出的内容越来越符合你的需求, 越来越像你自己。第七步,定时任务与自动推送。借助定时任务机制,你可以设定好文案生成的执行时间。 ai 会在指定时间自动完成全套流程,最终把写好的文案推送到你的微信上, 你不需要每天守在电脑前操作,真正实现全自动化流程。这套完整的工作流程就是自定义流程型 ai 工具的核心价值所在,它模拟了专业自媒体人从选题、创作到优化的全流程, 不需要你懂复杂的代码,也不需要你去折腾繁琐的安装,只需要编辑好适合自己的流程,接入你的核心机制,就能让 ai 七成二十四小时为你工作。 而这也印证了一个道理,当所有 ai 工具的技术都趋于同质化时,工具本身已经不再重要,重要的是你能不能编辑出适合自己的工作流程, 把 ai 的 核心机制为你所用。当别人还在熬夜折腾 open call 安装报错的时候,聪明人已经用自定义流程让 ai 为自己创造价值了。现在你有两个选择,继续盲目跟风追热门。 ai 工具天天被安装报错,功能复杂,搞得焦头烂额, 始终在 ai 门外徘徊,还是选择来找我领取这份 ai 成长路径指南。从 ai 的 搭建到实现自动化流程,再到商业化变现,全部踩坑经验浓缩成万字干货,帮你在 ai 方面建立真正的竞争壁垒,实现从使用者到设计者的关键跨越。

colocode 二点一点三四版本更新了 agent teams 功能,昨天用了一下,感觉还挺有意思的,给大家分享一下。 嗯, colocode 其实一直都有 sub agent 的 功能,那 sub agent 呢?和这次新出的 agent teams 有 什么区别呢? sub agent 呢,是你可以在一个独立的窗口里面搜索文件,读代码或者跑命令,把结果汇报回来,但它有个限制,就是它只能跟主 agent 单线汇报,然后如果有多个 sub agent, 它们是多个独立的窗口, 他们也不可能互相讨论。 sub agent 呢,主要解决的问题是过早的上下文爆满,然后以及能够节省一些投看成本, 尤其是一些相对独立的任务,可以交给 sub agent 去做。一句话就是当你需要一个小助手去跑腿拿一个独立的结果的时候,你可以用 sub agent agent teams。 其实最主要解决的问题就是 sub agent 之间是没有办法去互相讨论直接对话的。 在 agent teams 里面,主 agent 会创建一个共享的任务列表,同时呢,它们之间是可以互相对话的,每 一个 sub agent 都可以向主 agent 去汇报任务进展,并且完成任务列。但先生的带来的问题是 sub agent 之间要互相沟通,所以图腾的成本也比较高。那么总结下来就是略比现实世界中需要多人开会讨论的这样的一些任务,适合去创建一个 agent teams。 那举个例子吧,我用 sub agent 帮我去检查代码库中重复的文件记录,我的这个主 agent 呢,就创建了一个 sub agent 阅读文档去查虫。那整个这个阅读查虫的记录其实是不会出现在我当前的上下文中的, 而是它会直接把结果给到我们的主 agent, 那 主 agent 呢,就可以在当前的窗口里面完成接下来的合并的工作,否则的话可能把整个的代码库读完,这个上下文可能就满了。 然后下一个例子是 agent teams 的 例子,这个例子里面我的主 agent 按照他的需求帮我创建了大概有六个词 agent, 然后并且主 agent 创建了一个一个共享任务列表,可以看到每一个词 agent 都在进行他自己的工作,那这里面有做动画转换器的,有做固件的,有做后端服务的,然后每一个人都有他自己的工作, 那我也可以去观察某一个子 agent 的 工作进展。比方说当前这个 server mid 的 一个子 agent, 那 可以看到他自己一直在自言自语在做事情,然后当他做好了以后,他告诉 team leader 去更新任务状态,那这就是是 seven agent 之间互相协助的一个例子。 那 agent team leader 核心架构其实挺清楚了,那我们当前三任中的这个 agent 就是 我们的 team leader, 它创建了若干个 team mates, 也建立了一个 共享的任务列表。那这些 team mates 也就是 sub agent 之间呢,可以去互相协助的,然后他们同时又各自认领了任务列表中的工作,然后有各自的上下文。那 team leader 是 可以全局去调度这些 sub agent, 去做拆分分配汇总,然后中间沟通的环节就是消息系统, 当整个的共享任务列表全做完了以后, team 力的回来收尾会帮你把这些 sub agency 的 给减散掉,因为它们都是有独立的这个护发窗口的嘛,是需要有一个减散的过程,一次 agent teams 的 工作就完成了。 那什么场景适合 agent teams 呢?它适合高效并行协助的一个场景。那比方说可以分配多个 sub agent 去研究和 review 同一个课题,那多方调查可以做交叉验证。再比方说针对一些新模块和新功能的开发或涉及到多端的,他们是可以各负其责,病情推进一个项目, 然后还可以去做竞争假设的调试。比方说我们出了个 bug, 到底是前端渲染的问题还是服务端接口的问题,可以分别派两个 agent 从各自的立场去反推问题, 然后他们可以互相去讨论,最终给出一个结论。因为 ai 现在有些问题就是当你提了一个 bug, 有 可能它会朝某一个方向死命地去推断到底,但是可能能解决问题,但实际上最根本的问题可能在另一个方向上。但是现在的 ai 几乎不太会多种假设,然后综合性的分析一个问题的,所以这种所以这个场景是非常有价值的。 呃,最后呢,就是可能会有跨层级的变更,比方说我调一个前端组件,会影响到后端接口,会影响到测试用力,那这种情况下其实是有一个调整的主线在的,但是需要并行的去调三个不同的层级的代码,那这种情况下去建立一个 teams, 就 能够协通去做这些变更。 那不适合的场景呢?就是比方说串行依赖性特别强的任务,比如做完你的做你的,做完你的做你的,就是我们的卡点并不再多,任务并发,那这种情况下如果建一个 teams 其实就很浪费时间。 另外呢,就是反复修改同一个文件的场景,其实不太适合,因为会导致文件的冲突。最后是如果任务非常简单,比方说一句话,需求,那建一个 teams 完全是增加了投屏的消耗,完全没必要。这三种情况下比较适合在当天的 session 或者用 java agent 去解决,并不适合建一个 teams。 那 接下来我会用 agent teams 来把我的一个十三代码的项目去做一个重构。这个项目其实是一个 monitor, 它能够实时地去捕捉 cloud hold 的 工作流的细节, 去掌握多 agent 的 工作进度。那比方说我一个在跑前端,一个在跑后端,我现在在看电影,我又不想想去看这密密麻麻的文字来去判断它是不是要我去执行下一步了。那我就可以去把这个 monitor 放在我的另一个屏幕上,我就可以随时 通过非常简单的一些状态,我就能判断出来它当前是需要我确认还是需要我置换新的工作,那这个项目完全没有需求,文档就是想到什么就加什么。所以整个的项目 现在是一个石山,我打算用这样的一种方式来去做一个重构,包括把服务端去做标准化和一个服务端的管理入口。我又买了一个小的开发板,我希望能够在这个小的开发板上实时的展现出来这个 cologne 的 状态。所以,呃,我现在除了外部端以外,我需要去兼容多端,那么我们下面来开干。

手把手带你安装 openclaw 龙虾必备的 skills。 之前我出过一期 openclaw 保姆级安装教程,但装完之后你会发现它其实还只是一只裸龙虾。你让它查看文件,它说没权限,你让它算下天线,它说没联网,属于一同操作猛如虎,另近一看原地图,所以这个视频带你正确配置龙虾,补齐必备技能, 让它真正从能聊天进化成能干活。但在开始之前,我们先熟悉几个会频繁用到的命令,如果你是 windows 系统,就在 power 里输入这些命令,如 mini 是 micro, 二,系统就在终端 terminal 里输入。要开始用 openclaw, 第一步是先把网关启动起来,对应的命令是 openclaw gateway start。 启动后,我们可以打开 openclaw 控制台,也就是它的可式化操作键。面对的命令是 openclaw dashboard。 如果你暂时不用 openclaw 了,也可以把网关停掉。对应的命令是 openclaw gateway stop。 技巧一,本地文件读写从二零二六点三点二版本开始啊。 opencl 默认对本地文件访问权限做了限制,所以如果你想让它读取甚至进一步操作你电脑里的文件,要先把对应权限打开。操作也很简单,打开 opencl 或终端,输入 opencl config set tools, 点 profile for 命令回车执行。 把 opencl 的 工具权限切换成完整版,运行后还需要重启网关,让配置生效。对应的命令是 opencl gateway restart。 搞定以后,你就可以让 opcode 做各种文件提取和修改的操作了,比如批量重命名、文件整理、桌面分析、磁盘空间占用等等。 技巧二,联网搜索 opcode 默认情况下是无法获取网上信息的,所以你问天气、问资讯、问股价,他通通不知道,但我们可以安装一个负责联网搜索的 skill。 skill 可以 理解成是 opcode 的 技能包,本质上是一套针对某类任务的说明和流程, 用来教他在特定场景下该怎么做。比如这就是一个简单的 skill 的 例子, openclaw 有 个官方技能市场 clawhot, 你 能在上面看到很多别人做好的 skill, 可以 直接拿来安装使用。要事先联网搜索,可以搜一个叫 tablie search 的 skill, 这个 scheme 要求从 tiffany 点 com 获取 api 密钥,我们可以稍后设置。安装方法也很简单,我们可以直接复制 call hop 上 tiffany search 的 页面链接,粘贴到和 opcode 的 聊天里,无论是控制台还是飞书这类通讯渠道聊天窗口都行,然后让 opcode 自己帮你安装。 tiffany search 还会用到 api 密钥,所以我们来到 tiffany search 官网 注册登录后啊,就可以直接得到一个密钥,他每个月呢都有免费额度,而且不需要绑卡。拿到之后,我们可以把 api 密钥一起发给 opencall, 让他安装后自行完成配置。 装好之后,我们可以简单测试一下,比如在飞书里问他茅台目前的股票价格是多少,这时候啊, opencall 就 能顺利返回来自互联网的实时信息了。 技巧三,定时任务欧姆克劳支持通过 com 创建定时任务,不需要额外安装 sku。 比如你可以直接对欧姆克劳说,每隔五分钟汇报某只股票当前的价格,他就会创建一个定时任务, 然后按设定的间隔自动运行,帮我们实现对股价的监控。所以啊,不管是每天早上七点发资讯,每周一九点写周报,还是二十分钟后提醒浇花这类定时任务,你都可以直接交给他。 小四,浏览器操作 opcode 本身自带 browser 工具,不需要额外安装 skill, 就 可以读取网页内容。比如可以对他说,帮我看看知乎上现在有什么热点网址是这个,它会自动用浏览器打开网页,读取页面内容,把上面的信息整理出来。而且不只是读网页, 像点击输入之类的基础操作啊,它也能完成。比如让它去 github 上搜索 linux, 然后把排在前三的搜索结果给你, opcode 也能直接搞定。不过它的缺点啊也很明显,第一是比较稍 token, 因为网页内容因为状态,还有每一次工具调用的结果啊,都会不断进入模型的上下文。 第二是执行速度比较慢,因为 opcode 的 工作方式不像程序脚本或 rpa 那 样,流程确定后一次跑完。而 每做一步,都要先看当前页面,理解页面内容,探讨下一步该点哪里,再执行操作,然后再读取结果,继续推理下一步。所以它更像是一个会操作网页的 ai 助手,而不是一个高效率的自动化程序。另外,如果遇到强制登录、扫码、验证码校验,或者比较严格的反爬机制啊,我不靠也容易翻车。 技巧五技能查找 opcode 的 skills 很多,但真正麻烦的是不知道该装哪个。这里推荐两个实用 skill, 一个负责找 skill, 一个负责审 skill。 第一个是 find skills, 它的作用就是根据你的需求去查找合适的 skills。 安装方法和前面一样,直接把链接发给 opcode, 让他自己安装就行。 装好之后,我们可以对 okl 说帮我查找邮件自动化相关的 skills, 他 就会推荐合适的 skill, 这样你就不用自己去技能市场里一个个翻了。但接下来还有一个问题是,他推荐给你的 skill 真的 安全吗?那么我们可以再安装一个 skill better, 它的作用啊,就是在安装前先帮你做一层安全审查, 重点看看有没有权限问题、可疑行为,平常窃取回销代码或者数据外传之类的风险。我们可以再提醒一下 oppo, 安装每个 skill 前用 skillbetter 检查一下,这样后面啊,他在安装新 skill 的 时候就会先审一遍,再决定要不要装 技巧六,既能创建与改进除乱中别人已经写好的 skill, 我 们也可以直接通过自然语言让 opcode 创建新的 skill。 比如可以直接告诉他帮我创建一个 skill, 把新收到的邮件内容提炼成三句话总结。这样一来, opcode 就 能根据你的描述自动创建一个 skill, 让这套流程可以长期服用, 以后再遇到类似任务啊,他就不用每次从零开始了。如果你还想让他越学越聪明,可以再装一个 skill, 叫 self improving agent。 这个 skill 的 作用就是帮 opcode 把错误纠正和新学到的方法都记下来,慢慢沉淀成经验。 具体来说就是有失败的操作时,他会自动记录到 error state, md, 你 纠正他了,或者他学到了更好的方法,会记录到 learning state, md, 你 提了他一个还不会的功能, 会记录到 feature request, 点 md 一 些真正有价值的内容啊,后面还会进一步沉淀到 memory, 点 md 这种长期记忆文件里。那么安装之后, okl 不 止完成当前任务,还会把每次失误和改进建议啊,沉淀下来,自动应用过往经验,变成一个会复盘的助手。那希望以上这些技能补齐之后,你的龙虾能真正下场干活了。如果这个视频对你有帮助,也欢迎点赞和关注,我们下个视频见。

新手小白如何去安装 open top? 马上把这事给我办了,大家好啊,我是伟奇,然后今天呢全家出动,然后带孩子到迪士尼来玩,然后依依依旧跟大家分享一下这个 open top 养龙虾的一些小技巧或者趣事。那么今天要分享的是我前几期提到的新手小白如何去安装这个 open top, 只要你成功的安装第一只龙虾,那么你下面的这个养 多智障小智障一个这个 a 阵的集群就是很容易做得到。这个新手小白如何零基础的来安装呢?很简单,首先呢, 你打开一个大模型,我这里建议的是 kimi 的 k 二点五, k 二点五这个模型,为什么它比较好呢?是因为在它在处理代码和 bug 这一块,我觉得是在国产模型里面最棒的。打开它之后输入, 我是新手小白啊,就是下面这句话,打开他输入这,打开他输入这个这个提示词,然后呢他就会一步一步的告诉你说这个怎么安装啊,是针对新手小白,是非常友好的一个方式。 你安装好了之后呢,就会出现一个设置界面啊,你可以直接给把截图发给 kimi 来,让他来看一下到底是怎么怎么处理 好。这里呢?依旧推荐是呃, kimi, 因为 kimi 在 这方面呢,他能直接的告诉你该怎么处理。处理好了之后呢,就是如果说你在这个设置以及在 model 的 一些这个东西上的设置呢,出现问题了之后, 有两个文件你要发给 kimi 来处理。第一个文件呢,就是 open kyle 的 日制,一般它存储在你的 c 盘的这个 tab 文件夹里啊,看一下截图,第二个,第二个文件呢,就是在 open kyle 的 这个文件文件目录基础上 有一个 open to 点 jason 这个文件,这个文件呢就相当于是你的电脑的一些最基础的一些配置,也就是说这个你的电脑在在运行楼下的时候,首先会动起了一批文件里面的一个 啊,如果说你的 open to 在 按照这个刚才的步骤安装好了之后,还有这个一些一系列的问题,那么你就会把这两文件发给你的 kimi 来处理,按照他的指示和他提供给你的代码以处理方式来处理完了之后基本上就没有问题了。好,如果大家对这个还有什么疑问的话,在评论区告诉我,谢谢。

我今天再修一个 bug, 就是 我发现有个功能,就是你真的一定要去用,就是呃团队模式,让 clark 去启动一个团队模式,然后你要这样子你就可以不断地去问这个主模型,就这个对话 问他有没有在做任务,然后他会去查,然后让他去帮我们做监工,这样我就不用去做监工了,好吧?然后最后呢?比如说我们去让他干嘛, 呃,就让他做一个循环汇报进度,让他会执行汇报,每一分钟汇报一次,然后这是他下面的一些进度汇报, 这是我今天才发现这个真的很好用,我之前一直自己去看,但我发现现在我直接让他去看就好了,让他去创建几个团队队友这个 agent agent 一 起去搞。后面我再把它这个关于团队模式的这个进度的更新再集成起来, 因为它现在显示的像这些消息,消息显示的还不是很好,这些全都是它自己的。 这个这这一个应该是他自己发的消息,不是我发的这个是团队成员给他汇报的消息,还有什么让他就一直的给你汇报进度,这样子会好一点,就 ok, 最终完成。

悟空的软件怎么下载?昨天有个粉丝在评论区问我怎么样一步一步教他,那我今天呢,就手把手如何把你的悟空智能体安装起来。首先打开钉钉,里面的话有钉钉服务, 那这个工作人员呢?他发了一份文件,叫悟空 opt, 一 人电商,打开之后呢,好,我们看一下,往下拉,去悟空官网下载 app。 好, 我们进入他的官网。 呃,如果说你是苹果的,在这里下载 windows 的,是在这里下载,下载完毕之后呢,就在桌面上打开 这里的话就是有无空出事, ai 办公时代由此开始。呃,但是他有个邀请码,邀请码就去无空官网获得啊,又回到这个官网,你看 这个就是他的一个邀请码,这个邀请码输之后呢,就立即体验,但是呢,他每天的话整点领取,现在已经被领取完了,你要等下一个时间,比如说实 物等等,你要多尝试,因为现在下载的人太火爆了,如果说你觉得有用,记得收藏点赞哦。