最近的 open clock 很 火啊,外号龙虾 ai, 它是能自动操作电脑浏览器后台系统的数字员工。那我也去思考了一下啊,它的出现对于 tk 卖家来说价值在哪里?以下我说的可能还需要时间验证啊各位。第一个,它应该会具有这个二十四小时自动人工智能客服啊,非常智能, 美国客户半夜问物流退换货价格,这个是可以做到秒回的。第二个就是物流跟订单的自动化,它可以监控所有订单,漏扫,超时怠速就立刻提醒你。同时呢,自动补扫, 重打免单,同步 t k 后台,把 l d r 压到百分之四以内。第三个呢,在运营方面啊,可以自动监控竞品价格, t k 流量,差评,退货,每天出爆表。所以各位 ai 在 未来它会改变每个行业的势态。
粉丝320获赞577

我用 openclaw 实现了电商的自动上品流程,我从原来每天需要四个小时的上货流程,现在只需要五分钟,现在看到这个窗口是我日常上品的一个流程,找品、存图,新建商品,填入信息,然后一个品一个品,这样去操作。那我是怎么把这个步骤自动化的呢?先来看一下结果, 我现在的执行流程只需要打开飞书,因为我对接的是飞书这个通道,我只需要给龙虾发一句,开始执行自动上货流程,然后龙虾就会自动开始干活,他先会梳理一下这个干活的整个流程,大概分几个步骤,然后他就按步去执行,一直执行一个流程大概只需要三分钟不到,而且我的文件夹里面应该是有十三个商品的。 这个工作平时我们人工去做可能要花两个小时左右,现在就相当于无论我在哪里,只要我的电脑开着,我只需要跟我的飞叔说一句,开始执行自动上货流程,他就会自动跑完,然后告诉我已经 ok 了,所有的结果会放在我的桌面上,智能分组结果就是他帮我执行好的结果,所有的商品他帮我分好了组, 然后他又帮我把所有分好组的结果进行了一个压缩。那我最后上面的操作就是把这些压缩文件一键拖动到数据包导入就可以了。我从原来每天需要四个小时的上货流程,现在只需要五分钟。 那具体整个流程是怎么实现的呢?首先我需要做的工作是打开某多多的 app, 把我选中的商品去把这个商品的图片全部保存下来, 然后以及说这个商品的信息截图和价格尺码截图全部通过截图的形式和下载好的商品信息,这些图片混合起来,直接放到我电脑的这个桌面的文件夹就可以了。文件夹就是我保存下来所有我要上的商品,这里边会包含很多商品信息图, 然后还会包含很多的一个商品的价格和尺码图,因为这些我都是要一比一录入我的信息里边的。那可以看到我的这个大文件夹里面其实是不止一个商品,是很多组很多组商品。那么龙虾下一步就需要基于我这一个大文件夹去帮我进行智能的商品分组, 所以我把这些图片放到文件夹以后,下一步就看龙虾的操作了,那么它的执行步骤是什么呢?首先 第一步他需要打开我给他的这个文件夹,首先他需要基于我给他的一个大文件夹进行所有的图像识别,进行一些 使用一些算法将描述为同一个商品的图片归为一组,并且自动帮我分好组,可以看一下大概的结果是这样,所有相同的衣服会分为一个文件夹, 那么他帮我进行图片识别以后,非常精准的把所有描述同一个商品的图片都归为了一组。 第二步,它需要基于我提供给他的截图的那些信息,去提取对应的每一个商品的标题,价格、尺码和颜色,然后去自动录入表格。那最后一步,它会把它在过程中处理过的所有数据帮我生成一个校验表格, 方便我检查执行过程中是否出错,那整个环节就是龙虾帮我去做的,那这个质检验表格是什么意思呢?他会把他执行过程中所有处理过的数据信息帮我汇总到一个表格,这样我就很方便的去进行一个统一的预览,看一下哪个环节识别的信息,或者他执行的步骤有问题, 那我一眼就可以在这里看到。这个工作我只需要在飞书给他发一句指令,然后等他执行完之后,我打开这个教样表格,在表格里面快速去预览一下他所有的执行过程,有哪些数据错误了,或者分组错误了,我在这里可以快速的看到,然后再告诉他进行什么样的修正,这个工这个工作就完成了,是非常的方便。

openclose 有 什么实际的使用场景?感觉对工作没有帮助?这是最近很多学员问我的一个问题,那这个视频给大家聊聊,我一般用 openclose 来做哪些事情。大家都知道我有很多账号,我每天要录将近十个视频, 所以第一点,我习惯在前天的晚上,我在手机上去给他发一个关键词,让他在某音和某红书平台去找到最火的十到二十个视频,然后就提取相应的脚本,相应的标题,给它保存到飞书链接里面再发给我,这样我一早上起来就能够看到现成的脚本,实话实说,这真的太方便了。我要做的第二件事情 是找到我认为 ok 的 脚本,让 open colo 来给我去做一个二次的润色和修改,它润色完了之后也会以飞速链接的形式直接发给我,然后我直接去审核就好了,我上午大概一个人就能拍十几条视频。第三个用处呢,就是给我的口播视频去做一个相应的粗剪,我录好之后,用 open colo 的 自动去把我的气口给它剪掉,就相当于先粗剪一下, 再把这个视频直接打包发给剪辑老师,这样的话他们的剪辑效率就大大提高了。然后就是第四点,因为我们这两个月在铺一个小铺的项目,所以需要大量的笔记,我们就用 openclot 去搜集了很多同行的笔记, 就找到了很多优质的同行发的素材和帖子,我们会让龙虾采集好,然后去检测哪一些帖子是跑的最好的,我们再把这个帖子定时的发送给我们运营,所以他每天都可以蹭到最近的热点,哦,对了,我们还在研究用 openclot 去实时监控一些评论区的数据,因为有一些品牌方想要去知道你的评论区里面的鱼情,对吧?就是有好评有差评,然后怎么去做一些相应的回复,这些也可以用 openlog 去解决。还有最后的第五点,也是我觉得很方便的一点,我之前约会的话,我还需要手动操作,然后还需要去打开一个录制,以及 我还需要去手动的去记一些相应的会议重点。那现在我可以直接用 openlog 我 给他发一个,说你给我预定一个今天下午三点钟的会议, 然后记得开会的时候给我定时打开那个屏幕的录制,他就会全部给你做到,而且可以把你的音频翻译成文字来提取重点,这样的话你就不用怕会有一些核心的东西丢失了,我还是蛮喜欢这个功能的。所以 photoshop 的 其实可以做的事情有很多,你要把它和你的业务连接在一起,怎么样去做一个降本增效的操作,这个才是重点。

最近 open call 这么火,到底有谁真的赚到钱了呢?我觉得这个可能是大家最关心的问题,绝大部分是靠卖铲子赚到了第一桶金,那么我可能也是这一批里面通过 open call 真正赚到钱的人。 一周之前,我和我的龙虾,我们所谓的是一人公司从零搭建了一个能够卖货的独立站,总共花费了不到四十八个小时,真正的去工作写代码的时间可能不超过两个小时。那截止到目前,我们这个独立站的收入呢?是四百澳币。 虽然听起来这个事情可能有点夸张啊,但是如果你想靠 ai 搞钱,我保证这个视频对你来说一定会有一些大的帮助。 那说起来这么早,我能够接触到 oppo pro 去使用啊,在一月底的时候,也是得益于叉七 d 刚出来的时候我就已经在玩了,而且,并且,呃,我第一波 ai 创业的时候,我就靠卖这个算力投肯赚了一桶金。 所以将这个第一次我用上 open call 的 时候,我脑子里念头,念头就是啊,这个事情是可能是 算力的需求,第一次从 b 端到了 c 端,普通人他不再是满足于一个订阅式的服务,还要像交电费一样。可能以后这个事情你不只是狡辩电费,你还有一个 token 的 一个事,还是按 token 的 数量去做结算。 那我对这个趋势和风口就非常感兴趣,但是最开始的时候呢,这个龙虾只是帮我做一些比较基础的事情,比如说,呃,我做投机投研的时候, 这个信息的收集就完全自动化,每天的研报啊,信息的总结,我只需要早起打开手机看一眼就好,那仅限于还是一个工具的状态,只不过是一个比较智能的工具人。但是在这个做研报的过程中,我发现了一个 很大的一个 jim, 一个大宝贝,就叫做内特,一个老外。那么他是什么样的?他做了一个智能体,做 felix, 他 声称说一周就赚了六千美金。那起初很多人都不是不知道,就说啊,你只是说出来而已,你始终是一个黑客的状态。直到他有一天去做了一个 podcast, 他 把这个所有的事情都透明化。那我也是看完了之后发现,哦,原来这个事情他是可以这样子去真的实操去做的,而且我觉得我也可以去尝试。 那么我第一时间首先是去了他的他这个官网 comot, 我 去购买了这个产品,我觉得必须要去做知识付费, 我去挖掘了他的产品,并且在这个过程当中呢,我把 ai 当成一个杠杆,我不仅让他去爬了这个 podcast 的 所有内容,然后也去看了这个 comot 的 这个呃,商业模型啊,他在做的卖的产品到底是什么?和我们有什么差别?我们怎么样才能做到和他一样? 那实际上拆开来看之后发现他就是在卖自己的分身而已,但只不过,呃他的想法和执行力比较比较快而已。那我我就讲为什么 我不能去试一试呢?所以说在有了目标之后,我就开始执行市场调研,产品分析啊,商业模式,这个过程里面我只是一个下达命令的一个 ceo, 所有的这些呃,分析啊,产品啊这些想法都是我让龙虾去自由发挥的,这是第一步我就对他的放权,让他去给我做输入,我只做个下命令的人, 到后面之后呢,下一步就是要去做落地。第一个我们首先要个网站,在这个时候我就已经彻底放手了,我给了他很多很多的权限,我说我第一时间跟他说的是我能做什么,让你之后不要再问我这个问题,不要把球抛回给我。那第一个就是网站, 这个网站呢,一共是可能花了差不多半个小时的时间,我中间只提了一次对设计风格的需求,接下来都是他去做 网站。大完之后呢,下一步是我比较镇定的,就是我没有给他任何的东西,他就直接通过了我一条命令,我说你去帮我把这个文档部署上线,他就通过了调用这个浏览器的 c i, 然后直接告诉我,哦,部署完成了,我当时很惊呆,我不知道你是通过什么去登录我这个 version 啊,后来知道肯定用了 bha 的 一些这些东西去去啊,有 gucci 啊,所以他可以直接登上去,总之这个过程是比较震惊的。那这个时候我们有了网站,并且上线了这个,到了部署,到了后端,这个之后呢, 我们就需要产品,那整个产品呢,我也是打算全部放给他去做,他调研完菲力克斯产品之后呢,自己设计,自己打包,自己定了价,甚至自己调用了这个 script api, 当然 script api 是 我给他的,他把产品上架了,到这个后端支付的功能全都给我接好, 所以到到这一步的时候,他他给我去展示的时候,我是我是抱着怀疑的心态,因为我总觉得啊,你可能给我一个,又给我一个什么,就是 ppt 啊等等,结果呢?一次跑通非常震惊, 整个链路从购买支付到自动交付,发送邮件,让用户查收下载,已经没有任何的问题了,当然这个也得益于,呃,我使用的模型用的是 oppo 四点六 这个东西做完之后呢?那我当然想去要做推广营销分享,那我希望你把我们的这些过程,他的上下文记忆,他是有记忆功能,我说你把这个事情写成一个文章, 我们去做分享,这个事情只有这个一段,我口述之后,他就生成了一个文章,那这个文章呢?二十四小时内获得了 六万的浏览量,我们的一个社群呢,也从啊十二人扩张到了两百人,所以其实客观上来说,这整一个这个养虾户的这个独立站, 不光是从前端后端啊,网站设计、产品调研,连推广营销都是他的输出的 id, 我 只是负责点了个 post, 甚至这个发布的功能我也可以教给他,但是我没有去这么去做,这个事情 在当时对我来说是很镇定的。这种降本增效已经是我觉得,至少在电商啊,或者说这种独立站,我们已经可以先让 a d i。 发声了。 这个过程我是想分享给你,把我的一些对于 ai 看法,后面的一些我们该怎么去自动化的降本增效。如果你想了解,我们可以去聊聊,如果你想试试,或者有什么 ai 的 搞钱的好的玩法,我们可以分享一下。 如果你觉得这篇短视频对你有帮助,记得关注我一下,我后面会持续在这个号说出一些观点和内容,和我在做一些事情。

这是我用 openclaw 搭建的 ai 团队,他们各司其职,不用睡觉,能节省下非常多的时间,同时也做很多我一个人做不过来的事情。这期视频我想带你看一下我的 ai 团队到底长什么样,然后我们再一步一步搭建出属于你的 ai 团队。我们会讲如何创建一个 agent, 我们在 open cloud 里面,一个 agent 到底指的是什么? agent 之间如何相互协助,以及什么时候需要多个 agent 和最佳实践。好的,废话不多说,我们开始吧。我的团队里面一共六个选项题,其中四个是有定时任务的,就是每天的某个时刻都会触发他的任务,让他执行直到完毕,当然也可以随时跟他对话。 还有一个是几乎二十四小时期不间断工作的,还有一个最后一个,那就是你给他任务,他才会执行。第一个 agent 呢,是攻击 galk 啊,他每天负责给我情报工作,具体来说就是每天早上九点会提前搜寻 关于 ai agent 相关的技术的进展,产品进展以及用户的痛点。然后呢,把在网上搜寻的信息汇报给我。那么如果我不回答他,那就是明天继续给我相关的信息。如果我回答他,希望他对某一个话题进行深挖,那么他再去根据某一个话题再去搜索相关的信息为我展开。 那我的第二个 ai agent 是 auto 合理,它是我的私人助理和提醒助手,怎么用呢?我一般都是通过 diagram 跟它对话,这里我就不展示我跟它具体对话了,要涉及我的个人隐私。 一般来说,有任何的待做事项或者事情有着进展,我一般都会语音留给他,或者是打字告诉他,他都会记下来,某一单有问题就会问他,他都会翻出来告诉我待做事项是什么,事情到哪一步了, 同一次。同时呢,每天早上七点半,他都会告诉我今天的天气,然后今天要做什么,一步一步按重要性排序。它的作用就是完全替代笔记软件在我这里的作用。现在呢,我已经不用 notion 来记我事情,要做的事情,以及事情的进展了。 我的第三个团队成员,也是最重要的团队成员,就是 man, 一个狮子的形象。他呢,有最好的模型,有最高的权限,我主要用它来做两个功能,第一个就是日常的对话,我所有重要的对话,长期的计划都是跟他讨论的。 第二个就是一个视频流水线,帮助我制作视频。那么这个想法来自于一个叫做 alex finn 的 博主,本质上就是每隔几个小时,比方说我是每隔三个小时,他会去 x 上搜索我感兴趣的话题,比方说 ai 阵,比方说 open call, 比方说 ai 模型等等等等。有系列的话题。 他呢,就会看看哪些帖子现在比较火,或者是正在受到关注。然后呢,把整个的中文翻译和相关的数据都发到我这里来,包括原文的链接。如果我更感兴趣,希望用这个题材做一个视频,或者是有可能做一个视频呢,我只会点一个大拇指, 他就会进到我们的流程的。下一步就是他去研究这个帖子相关的背景信息,补充相关的背景信息给我,确保我了解这个事情的来龙去脉。那么如果这时候我再相关,我还觉得还是感兴趣,我再点一个拇指,他就会往下走,去研究怎么做这个封面图,或者给我一些脚本大纲的一些建议。 那么除此之外呢,如果我对一个帖子我不想做成视频,但它对我是有用的信息,我的时候可以点一下这个眼睛,它呢就会到我的收藏家里面去,可以看到。哎,这个帖子现在到我的收藏家里面去了,这里面就是我认为收集的比较重要的信息。除了 x 之外呢,它也会去搜索 youtube 和 hacker news, 看看每天大家都在讨论什么。这是我这样一个视频的辅助系统。我的第四个团队成员是潘大熊猫,他负责开发,他呢算是唯一一个几乎不休息的智能体。现在他有开发任务,但是当他没有开发任务的时候,他会增加测试,或者是自己去测试边缘情况,找 bug。 那 么关于二十四小时期,我特地特别想说明一下,想有好的效果,往往你需要用好的模型,如用云端的模型消耗 top, 二十四小时期会非常的贵。如果你用本地的模型呢,你大概需要买 max 九九,那么 也会造成非常贵。所以二十四小时成绩一定得是高价值的工作。对于我来说,开发是高价值的工作。除此之外,正在我现在正在做的还是有销售相关的,比方说做 seo, 或者是给我自己的产品做销售线索,找潜在客户。 我的第五个团队成员是 monkey 猴子,他只有一个作用,就是我丢给他一个视频链接,他把这个视频变成一个带截图的文章,因为我自己做视频,我希望重复利用自己的资源,这时候我给他我做过的视频,你可以看到他啊把相关的进行了截图,并且把整个视频脚本重写为可以发表的文章。 我的第六个团队成员,也是最后一个是 tiger 老虎,他负责安全和更新,他呢每天都会定期扫描一下有没有安全问题,然后有新的可以更新的版本也会通知我,我们一起讨论如果更新的话,会不会造成性能的退化和影响当前的任务。 那么如何创建一个新的 agent 呢?其实非常的简单,我们后来会看到整个 agent 的 结构,但是你完全不需要自己创立文件夹,最简单的方式就是跟你的主要的 agent 的 对话,让他帮你去创建。这里我们以 diagram 为例, 你通过 diagram 与你新的这个 agent 进行对话,这时候你可以告诉你主要的 agent, 你 跟他说,哎,新建一个 agent, 他 叫什么?他要做什么啊?有什么呢?任务最后呢,告诉他你新建的这个 diagram boat 这个 diagram 机器人的 token, 这 token 怎么获得呢?我们找到 boat father, 点击这个打开 boat father 的 app, 然后这里我们点击 create a new boat, 新建一个新的,然后这时候我们给他一个名字,比方说我们叫做 fox, 然后我们点击 create boot, 你 就会得到这个 tokin, 然后这里我们点击复制,然后我们回到这里来, 把我们的 tokin 复制上去,告诉我们的主要 agent, 那 它呢,就会自动帮你创建这样一个新的 agent, 新的智能体了。那么什么是 agent? opencloud 里面如何定义 agent? 它又是如何工作的呢? 其实啊,一共就分为三层,分别是全局层, agent 层以及 session, 也是对话现成层。我们首先看第一层,就是全局层, 它呢并不是一个 agent 独有的,而是所有 agent 共用的,可以理解为是公共设施。这一层最典型的文件就是点 opencloud 我 们的总文件夹下面的 opencloud 点这次文件,也就是总配置文件,大家可以打开看一下,里面有非常多重要的参数,包括 os, 也就是定义哪个大模型厂商,还有就是你的登录身份是什么? agents 定义有哪些 agent? 它的默认模型是什么?工作目录和运行参数是什么? tools 定义局的工具权限以及 agent 之间的调用规则。 bundings 定义什么来源的消息调用到哪一个 agent, 浏览器定义浏览器信息, chanel 定义 telegram, discord, 飞书等外部的渠道连接, gateway 定义网关, memory 定义记忆等等等等。可以看到 openclaw 点 json 文件,里面包含着 openclaw 最重要的参数配置。 其实啊,大部分情况下我们出现崩溃对话没有反应的情况,也是因为我们的 ai 去改 opencll 点 json 这个文件夹里的参数的时候改崩了,所以一个建议就是,哎,你告诉你的 opencll, 在 他改这个文件之前一定要提前通知你,而且改的时候一定要谨慎。 第二层是 agent 层,这才是每个 agent 自己的领地,每个 agent 啊都有自己的工作空间,系统数据会话记录。那么 workspace 里面每个 agent 文件夹下面的这些文件,在每个对话开始的时候都会被加载进去来作为这个 agent 的 上下文。 由于呢,不同 agent 这些文件有所不同,这也就决定了啊,这些被文件被加载进去的时候,里面携带的信息,包括啊,他的身份,他是谁,他的性格,他的对话方式,他的任务的不同。 那么这些文件呢,包括 agent 点 m d, 也就是这个 agent 的 工作说明书,它决定这个 agent 的 做事规则,优先级,边界,还有如何使用记忆。 so 点 m d, 就是 这个 agent 的 性格和说话方式,与其是什么风格,是什么,边界在哪里,由它来决定。 user 点 md 就是 这个 agent 对 用户的理解就是他在帮谁,对方是什么风格,应该怎么称呼,有什么偏好,要注意 identity 点 md 就是 这个 agent 的 身份卡,解决的是这个 agent 叫什么,是谁的问题。 to 点 md 是 工具说明书,告诉 agent 啊,本地有哪些工具命令,怎么约定项目里面有什么习惯? memory md 是 长期精华记忆,它不是流水上,而是提炼之后的长期信息。这个文件很重要,而 scales 里面就是这个 agent 专属的 scale, 如果和局的 scale 同名的呢,这里的优先级更高, 会覆盖大局。那么这些呢,都属于 agent 层,也就是说啊,不同的 agent 默认不共享这些文件,但是同一个 agent, 不 同的对话,不同的对话线程之间是共享这一套文件的。第三层是 session 层,这个层级啊,不是这个 agent 是 谁,而是这个 agent 当前在哪个窗口里面工作。 session 是 对话县城,怎么理解呢?比方说,当你在同一个 agent 和他对话,但是在不同 discord 里面的频道对话,或者是你先跟他在 telegram, 后跟他在 discord 对 话,这就是属于不同的县城,因为它们的渠道不同, 或者是就是你当前的对话,但是你打了命令 slash new 或者是 slash reset, 就 会开启这样一个新的县城,区别是 slash new 旧的对话还在,但是 slash reset 会清空上下文,重新开始这样一个对话界面。那么这一层最典型的文件就是在我们每一个 agent 的 下面 sessions 文件夹里面不同的 session 文件了, 也就是每个对话都有自己独立的这样一个文件来记录啊,不同的对话历史。也就是说同一个 agent 不 同 session 会共享 agent 层那一套的。我刚才说的 saw 点 md, 我 刚才说的 agent 点 md 等等那些 workspace 的 文件,但是不会共享竹字的聊天记录。 讲完三层结构,了解 agent 工作原理之后,下一个很重要的问题就是,哎,多个 agent 之间是如何协作的呢?在 open call 里面, agent 协作大体有两种方式,第一种就是固定分工,也就是我们刚才说到的多个独立的 agent, 各自有各自自己的 workspace, 有 自己的 session, 也是对话现场。 固定分工就是像搭一个长期团队,就像我展示的我的 agent 一 样,一个负责找资料,另一个负责写脚本,一个负责写代码,还有一个负责日常对话和汇总等等等等。他们每个人啊,都长期干自己的事情, 他们之间的工作啊,写作的方式可以通过触发的串联或者是并行,比如啊, agent a 搜完信息这里我在 disco 里面点个赞,后面的 agent b 就 会根据我点赞的这个内容去调研资料,去补充材料。 那么第二种就是临时拉 sub agent, 也就是子代理。子 agent 去干活,也就是 open club 的 sessions prom, 它呢会拉起一个隔离的啊。 sub agent prom, 也就是子代理的这样一个运行在独立的 session 对 话现场里面工作, 工作完之后再把结果传到我们当前的对话里面来,相当于临时叫了一个实习生或者是外包去隔壁的办公室工作,干完工作回来汇报。这样的好处就是当我们的子代理在独立的赛程里面工作的时候,他不影响我们当前对话的这个主位阵子,我们可以继续给他提问,继续跟他对话,两边同时进行。 那么官方文档对他的定位也很明确,就是他适合做研究,慢任务、重任务、病情任务,而且不会阻塞我们主对话。 比方说这里啊,我让他去用 sessions born 去开一个子任务,研究 open call 智能体最近最受欢迎的三个讨论点,要求每个讨论点的热度、原因,代表观点,以及我可以做视频用的切入角度,然后让他开始在后台启动,完成之后主动汇报结果, 好的,他已经启动了这个任务。其实这时候我们可以去跟他对话,比方说我问他今天天气怎么样, 他呢,还是会回答我们这个今天天气怎么样的任务,因为刚才我们也说了,子任务是在另外一个县城完成的,不耽误我们跟我们的主要的智能体之间的对话。可以看到他就是继续的跟着我们进行对话,他回答了我刚才的问题,然后我们可以继续提问,我说, 哎,可以看到我们等了一会之后,他终于是把这个任务完成,然后自己主动地把任务的结果发回到了我们的主要的频道。哎呀,没有影响我们刚才跟他这个主要频道主要的智能体之间的。对,不是所有任务都适合上多 agent, 如果只是一个短问题,那么一个 agent 往往更加有效,硬拆呢,只会让系统更重更慢。那么真正适合做 agent 的 场景啊,一般有这么几种,第一种就是你的任务天然就能拆开,比如啊,研究,写作,审核,发布,本来就是不同的角色,这时候拆 agent 有 不同的工作区的这种不同的文件边界会更加清楚。 第二个就是任务可以并行,有些事情呢,不需要排队,一个 agent 可以 查资料,另外一个可以同时整理结构。如果你用 sub agent 这种并行就很合适,那么刚才我们也说了,它很适合做这种比较重的或者重复性的工作。 第三个多 agent 呢,不只是为了分工,也是为了避免污染。因为啊,如果你用单 agent 做太多不同类型的任务,都会出现相互污染的情况,长期记忆呢,会把不该混的东西混在一起。因为我们也说了,工作区那些啊, markdown 文件是同一个 agent 在 不同聊天窗口里面共享的, 那么什么时候没必要用多个 agent 呢?那么很简单,要么就是你的任务很短,要么就是上下文高度连续,你不想打破,要么就是你角色的边界根本猜不清,就没必要拆。还有就是避免为了做 agent 而做 agent, 只是为了看起来很高级而已, 能一个做好的事情就一个做,就相当于是一个队伍,当一个任务需要一个团队来做的时候,那自然值得用团队。 那么关于多 agent, 为了达到好的效果,我想分享一下我自己得出的一些实践。第一个就是不要一上来,对于很多的 agent 可以 从一个开始,有必要就加第二个,比方说你第一个 主要的 agent 也是默认的 agent, 基础上你加一个研究 agent, 每天去搜索啊有价值的信息,定期汇报给你,那么先把这个逻辑跑顺出来,然后再根据你自己的业务再加一个,同样每加一个呢,都先跑顺功能验收效果。 第二个就是工作区的文件要尽量的短,尤其是 agent 点 m d, soft 点 m d, user 点 m d, 也就是心跳文件, 而因为这些文件都会进入 agent 的 运行上下文,如果太长的话会增加效果。考虑到你有多个 agent, 如果你不注意的话,那你的成本可能会成倍的增加。好的,以上就是今天的视频了,希望你也能开始搭建属于自己的 ai 团队,不要忘记点赞和关注,我们下期再见。