基于 oppo 的 多 a 卷斜坐框架终于跑通了,而为了理顺这里面的逻辑,我花了很多钱。但是当这一切真正运转起来的时候,我知道 ai 真正进入生产领域。这套多 a 卷斜坐框架是我设想中的具备生产力智能体的最终形态。 你可以基于这个框架定制属于自己的生产力团队,不是一问一答的聊天机器人,而是几十甚至上百个的 a 卷军队。那么,为什么需要多 a 卷的呢?新原因是上下文。 ai 起作用的方式本质上是上下文构建 a 卷的越多,分工越细,意味着每个环节上的上下文就越清晰、越专业。问题来了, 人是管不来这么多 a 卷的,所以我的核心思路是卷的去管 a 卷,由一个主 a 卷的去统计底下几十上百个子 a 卷,而我只需要和这个主卷沟通任务,验收结果。而一套框架中, open core 的 核心作用是网关和协调者, 它负责分发指令、监控状态,让盘闸的协助变得井然有序。你可以看我贴在屏幕上的这张图,中间的是主 a 杆,它是由 open curl 提供的,然后它是网关和协调者。 而底下非常多、密密麻麻的则是主 a 杆,它一直存在,只能由主 a 杆跟主 a 杆进行通信,我们只能跟主 a 杆进行通信。呈是这样子的, 这是我的项目经理,我只跟项目经理对接。项目经理负责统治大局,他下面主要有三种类型的纸 a 卷,产品经理、开发和测试。比如在这个对话中,我让项目经理去找 pm, 让 pm 给项目经理最近写完的需求文档的地址, 他找到了,发在这里,然后项目经理把需求文档给到开发,让开发完成编码,开发卷的开始转写代码,码完成后由测试人员接手,同样对接 code, 完成复杂任务的测试工作。那么这里其实有一个关键点是,为什么我给开发和测试对接了专门的 codex ai 编程工具。这些任务属于极度复杂的长任务,而 open core 作为协调网关,但是在专业编程领域, 我们还是要接入最强的外部生产工具,这样才能保证这些长任务能被顺利执行。我最近将尝试一个更具挑战性的场景,开发一个全自动剪口播视频的网站。 很多朋友都是基于这个项目才认识并关注我的。一次我将不再守在电脑面前深度参与,我更多只是在 telegram 上发送信息,与 applecare 完成必要信息的确认,其余的让它独立去完成所有的工作。 从调研到代码,从测试到上线,我认为这才是真正的生产级 ai, 不 需要你时时看护它,能独立对话,独立思考,独立借助工具解决问题。那么视频的主要内容是这些。 最后说一下,是,我相信很多人装入 open core 之后,觉得这是一个简单的聊天工具,或者只能跑几个定时任务, 出不了生产级的内容。如果你也有这种疑问,我建议你可以关注下我接下来的更新,带你看看当 ai 真正动起手来,到底能产出什么样的生产力。
粉丝287获赞919

这是我用 openclaw 搭建的 ai 团队,他们各司其职,不用睡觉,能节省下非常多的时间,同时也做很多我一个人做不过来的事情。这期视频我想带你看一下我的 ai 团队到底长什么样,然后我们再一步一步搭建出属于你的 ai 团队。我们会讲如何创建一个 agent, 我们在 open cloud 里面,一个 agent 到底指的是什么? agent 之间如何相互协助,以及什么时候需要多个 agent 和最佳实践。好的,废话不多说,我们开始吧。我的团队里面一共六个选项题,其中四个是有定时任务的,就是每天的某个时刻都会触发他的任务,让他执行直到完毕,当然也可以随时跟他对话。 还有一个是几乎二十四小时期不间断工作的,还有一个最后一个,那就是你给他任务,他才会执行。第一个 agent 呢,是攻击 galk 啊,他每天负责给我情报工作,具体来说就是每天早上九点会提前搜寻 关于 ai agent 相关的技术的进展,产品进展以及用户的痛点。然后呢,把在网上搜寻的信息汇报给我。那么如果我不回答他,那就是明天继续给我相关的信息。如果我回答他,希望他对某一个话题进行深挖,那么他再去根据某一个话题再去搜索相关的信息为我展开。 那我的第二个 ai agent 是 auto 合理,它是我的私人助理和提醒助手,怎么用呢?我一般都是通过 diagram 跟它对话,这里我就不展示我跟它具体对话了,要涉及我的个人隐私。 一般来说,有任何的待做事项或者事情有着进展,我一般都会语音留给他,或者是打字告诉他,他都会记下来,某一单有问题就会问他,他都会翻出来告诉我待做事项是什么,事情到哪一步了, 同一次。同时呢,每天早上七点半,他都会告诉我今天的天气,然后今天要做什么,一步一步按重要性排序。它的作用就是完全替代笔记软件在我这里的作用。现在呢,我已经不用 notion 来记我事情,要做的事情,以及事情的进展了。 我的第三个团队成员,也是最重要的团队成员,就是 man, 一个狮子的形象。他呢,有最好的模型,有最高的权限,我主要用它来做两个功能,第一个就是日常的对话,我所有重要的对话,长期的计划都是跟他讨论的。 第二个就是一个视频流水线,帮助我制作视频。那么这个想法来自于一个叫做 alex finn 的 博主,本质上就是每隔几个小时,比方说我是每隔三个小时,他会去 x 上搜索我感兴趣的话题,比方说 ai 阵,比方说 open call, 比方说 ai 模型等等等等。有系列的话题。 他呢,就会看看哪些帖子现在比较火,或者是正在受到关注。然后呢,把整个的中文翻译和相关的数据都发到我这里来,包括原文的链接。如果我更感兴趣,希望用这个题材做一个视频,或者是有可能做一个视频呢,我只会点一个大拇指, 他就会进到我们的流程的。下一步就是他去研究这个帖子相关的背景信息,补充相关的背景信息给我,确保我了解这个事情的来龙去脉。那么如果这时候我再相关,我还觉得还是感兴趣,我再点一个拇指,他就会往下走,去研究怎么做这个封面图,或者给我一些脚本大纲的一些建议。 那么除此之外呢,如果我对一个帖子我不想做成视频,但它对我是有用的信息,我的时候可以点一下这个眼睛,它呢就会到我的收藏家里面去,可以看到。哎,这个帖子现在到我的收藏家里面去了,这里面就是我认为收集的比较重要的信息。除了 x 之外呢,它也会去搜索 youtube 和 hacker news, 看看每天大家都在讨论什么。这是我这样一个视频的辅助系统。我的第四个团队成员是潘大熊猫,他负责开发,他呢算是唯一一个几乎不休息的智能体。现在他有开发任务,但是当他没有开发任务的时候,他会增加测试,或者是自己去测试边缘情况,找 bug。 那 么关于二十四小时期,我特地特别想说明一下,想有好的效果,往往你需要用好的模型,如用云端的模型消耗 top, 二十四小时期会非常的贵。如果你用本地的模型呢,你大概需要买 max 九九,那么 也会造成非常贵。所以二十四小时成绩一定得是高价值的工作。对于我来说,开发是高价值的工作。除此之外,正在我现在正在做的还是有销售相关的,比方说做 seo, 或者是给我自己的产品做销售线索,找潜在客户。 我的第五个团队成员是 monkey 猴子,他只有一个作用,就是我丢给他一个视频链接,他把这个视频变成一个带截图的文章,因为我自己做视频,我希望重复利用自己的资源,这时候我给他我做过的视频,你可以看到他啊把相关的进行了截图,并且把整个视频脚本重写为可以发表的文章。 我的第六个团队成员,也是最后一个是 tiger 老虎,他负责安全和更新,他呢每天都会定期扫描一下有没有安全问题,然后有新的可以更新的版本也会通知我,我们一起讨论如果更新的话,会不会造成性能的退化和影响当前的任务。 那么如何创建一个新的 agent 呢?其实非常的简单,我们后来会看到整个 agent 的 结构,但是你完全不需要自己创立文件夹,最简单的方式就是跟你的主要的 agent 的 对话,让他帮你去创建。这里我们以 diagram 为例, 你通过 diagram 与你新的这个 agent 进行对话,这时候你可以告诉你主要的 agent, 你 跟他说,哎,新建一个 agent, 他 叫什么?他要做什么啊?有什么呢?任务最后呢,告诉他你新建的这个 diagram boat 这个 diagram 机器人的 token, 这 token 怎么获得呢?我们找到 boat father, 点击这个打开 boat father 的 app, 然后这里我们点击 create a new boat, 新建一个新的,然后这时候我们给他一个名字,比方说我们叫做 fox, 然后我们点击 create boot, 你 就会得到这个 tokin, 然后这里我们点击复制,然后我们回到这里来, 把我们的 tokin 复制上去,告诉我们的主要 agent, 那 它呢,就会自动帮你创建这样一个新的 agent, 新的智能体了。那么什么是 agent? opencloud 里面如何定义 agent? 它又是如何工作的呢? 其实啊,一共就分为三层,分别是全局层, agent 层以及 session, 也是对话现成层。我们首先看第一层,就是全局层, 它呢并不是一个 agent 独有的,而是所有 agent 共用的,可以理解为是公共设施。这一层最典型的文件就是点 opencloud 我 们的总文件夹下面的 opencloud 点这次文件,也就是总配置文件,大家可以打开看一下,里面有非常多重要的参数,包括 os, 也就是定义哪个大模型厂商,还有就是你的登录身份是什么? agents 定义有哪些 agent? 它的默认模型是什么?工作目录和运行参数是什么? tools 定义局的工具权限以及 agent 之间的调用规则。 bundings 定义什么来源的消息调用到哪一个 agent, 浏览器定义浏览器信息, chanel 定义 telegram, discord, 飞书等外部的渠道连接, gateway 定义网关, memory 定义记忆等等等等。可以看到 openclaw 点 json 文件,里面包含着 openclaw 最重要的参数配置。 其实啊,大部分情况下我们出现崩溃对话没有反应的情况,也是因为我们的 ai 去改 opencll 点 json 这个文件夹里的参数的时候改崩了,所以一个建议就是,哎,你告诉你的 opencll, 在 他改这个文件之前一定要提前通知你,而且改的时候一定要谨慎。 第二层是 agent 层,这才是每个 agent 自己的领地,每个 agent 啊都有自己的工作空间,系统数据会话记录。那么 workspace 里面每个 agent 文件夹下面的这些文件,在每个对话开始的时候都会被加载进去来作为这个 agent 的 上下文。 由于呢,不同 agent 这些文件有所不同,这也就决定了啊,这些被文件被加载进去的时候,里面携带的信息,包括啊,他的身份,他是谁,他的性格,他的对话方式,他的任务的不同。 那么这些文件呢,包括 agent 点 m d, 也就是这个 agent 的 工作说明书,它决定这个 agent 的 做事规则,优先级,边界,还有如何使用记忆。 so 点 m d, 就是 这个 agent 的 性格和说话方式,与其是什么风格,是什么,边界在哪里,由它来决定。 user 点 md 就是 这个 agent 对 用户的理解就是他在帮谁,对方是什么风格,应该怎么称呼,有什么偏好,要注意 identity 点 md 就是 这个 agent 的 身份卡,解决的是这个 agent 叫什么,是谁的问题。 to 点 md 是 工具说明书,告诉 agent 啊,本地有哪些工具命令,怎么约定项目里面有什么习惯? memory md 是 长期精华记忆,它不是流水上,而是提炼之后的长期信息。这个文件很重要,而 scales 里面就是这个 agent 专属的 scale, 如果和局的 scale 同名的呢,这里的优先级更高, 会覆盖大局。那么这些呢,都属于 agent 层,也就是说啊,不同的 agent 默认不共享这些文件,但是同一个 agent, 不 同的对话,不同的对话线程之间是共享这一套文件的。第三层是 session 层,这个层级啊,不是这个 agent 是 谁,而是这个 agent 当前在哪个窗口里面工作。 session 是 对话县城,怎么理解呢?比方说,当你在同一个 agent 和他对话,但是在不同 discord 里面的频道对话,或者是你先跟他在 telegram, 后跟他在 discord 对 话,这就是属于不同的县城,因为它们的渠道不同, 或者是就是你当前的对话,但是你打了命令 slash new 或者是 slash reset, 就 会开启这样一个新的县城,区别是 slash new 旧的对话还在,但是 slash reset 会清空上下文,重新开始这样一个对话界面。那么这一层最典型的文件就是在我们每一个 agent 的 下面 sessions 文件夹里面不同的 session 文件了, 也就是每个对话都有自己独立的这样一个文件来记录啊,不同的对话历史。也就是说同一个 agent 不 同 session 会共享 agent 层那一套的。我刚才说的 saw 点 md, 我 刚才说的 agent 点 md 等等那些 workspace 的 文件,但是不会共享竹字的聊天记录。 讲完三层结构,了解 agent 工作原理之后,下一个很重要的问题就是,哎,多个 agent 之间是如何协作的呢?在 open call 里面, agent 协作大体有两种方式,第一种就是固定分工,也就是我们刚才说到的多个独立的 agent, 各自有各自自己的 workspace, 有 自己的 session, 也是对话现场。 固定分工就是像搭一个长期团队,就像我展示的我的 agent 一 样,一个负责找资料,另一个负责写脚本,一个负责写代码,还有一个负责日常对话和汇总等等等等。他们每个人啊,都长期干自己的事情, 他们之间的工作啊,写作的方式可以通过触发的串联或者是并行,比如啊, agent a 搜完信息这里我在 disco 里面点个赞,后面的 agent b 就 会根据我点赞的这个内容去调研资料,去补充材料。 那么第二种就是临时拉 sub agent, 也就是子代理。子 agent 去干活,也就是 open club 的 sessions prom, 它呢会拉起一个隔离的啊。 sub agent prom, 也就是子代理的这样一个运行在独立的 session 对 话现场里面工作, 工作完之后再把结果传到我们当前的对话里面来,相当于临时叫了一个实习生或者是外包去隔壁的办公室工作,干完工作回来汇报。这样的好处就是当我们的子代理在独立的赛程里面工作的时候,他不影响我们当前对话的这个主位阵子,我们可以继续给他提问,继续跟他对话,两边同时进行。 那么官方文档对他的定位也很明确,就是他适合做研究,慢任务、重任务、病情任务,而且不会阻塞我们主对话。 比方说这里啊,我让他去用 sessions born 去开一个子任务,研究 open call 智能体最近最受欢迎的三个讨论点,要求每个讨论点的热度、原因,代表观点,以及我可以做视频用的切入角度,然后让他开始在后台启动,完成之后主动汇报结果, 好的,他已经启动了这个任务。其实这时候我们可以去跟他对话,比方说我问他今天天气怎么样, 他呢,还是会回答我们这个今天天气怎么样的任务,因为刚才我们也说了,子任务是在另外一个县城完成的,不耽误我们跟我们的主要的智能体之间的对话。可以看到他就是继续的跟着我们进行对话,他回答了我刚才的问题,然后我们可以继续提问,我说, 哎,可以看到我们等了一会之后,他终于是把这个任务完成,然后自己主动地把任务的结果发回到了我们的主要的频道。哎呀,没有影响我们刚才跟他这个主要频道主要的智能体之间的。对,不是所有任务都适合上多 agent, 如果只是一个短问题,那么一个 agent 往往更加有效,硬拆呢,只会让系统更重更慢。那么真正适合做 agent 的 场景啊,一般有这么几种,第一种就是你的任务天然就能拆开,比如啊,研究,写作,审核,发布,本来就是不同的角色,这时候拆 agent 有 不同的工作区的这种不同的文件边界会更加清楚。 第二个就是任务可以并行,有些事情呢,不需要排队,一个 agent 可以 查资料,另外一个可以同时整理结构。如果你用 sub agent 这种并行就很合适,那么刚才我们也说了,它很适合做这种比较重的或者重复性的工作。 第三个多 agent 呢,不只是为了分工,也是为了避免污染。因为啊,如果你用单 agent 做太多不同类型的任务,都会出现相互污染的情况,长期记忆呢,会把不该混的东西混在一起。因为我们也说了,工作区那些啊, markdown 文件是同一个 agent 在 不同聊天窗口里面共享的, 那么什么时候没必要用多个 agent 呢?那么很简单,要么就是你的任务很短,要么就是上下文高度连续,你不想打破,要么就是你角色的边界根本猜不清,就没必要拆。还有就是避免为了做 agent 而做 agent, 只是为了看起来很高级而已, 能一个做好的事情就一个做,就相当于是一个队伍,当一个任务需要一个团队来做的时候,那自然值得用团队。 那么关于多 agent, 为了达到好的效果,我想分享一下我自己得出的一些实践。第一个就是不要一上来,对于很多的 agent 可以 从一个开始,有必要就加第二个,比方说你第一个 主要的 agent 也是默认的 agent, 基础上你加一个研究 agent, 每天去搜索啊有价值的信息,定期汇报给你,那么先把这个逻辑跑顺出来,然后再根据你自己的业务再加一个,同样每加一个呢,都先跑顺功能验收效果。 第二个就是工作区的文件要尽量的短,尤其是 agent 点 m d, soft 点 m d, user 点 m d, 也就是心跳文件, 而因为这些文件都会进入 agent 的 运行上下文,如果太长的话会增加效果。考虑到你有多个 agent, 如果你不注意的话,那你的成本可能会成倍的增加。好的,以上就是今天的视频了,希望你也能开始搭建属于自己的 ai 团队,不要忘记点赞和关注,我们下期再见。

我研究了三天三夜,终于把 opencloud agent 的 团队搭建彻底跑通了。七个 agent, 一个群聊,自动写作,我只说做什么。 ceo 自动拆解任务,协调各部门,各部门做完自动汇报, 这可能是目前最接近一人公司的玩法。今天我把所有步骤一次性讲清楚,先给大家看看最终效果。这是我搭好的一个七人 agent 的 团队。在飞书同一个群聊里, ceo 负责理解我的需求拆解任务分配给各部门。 产品部负责需求分析和 prd 输出。开发部负责技术方案和代码实现,设计部负责 ui 方案,市场部负责推广策略。 数据库负责数据分析和效果追踪,运维部负责部署和监控。上周,我想做一个 ai 每日早报的自动推送工具。我在群里跟 ceo 说,我想做一个工具,每天早上八点自动抓取 ai 领域的新闻,生成一篇早报,推送到我的社交媒体。 然后 ceo 就 把这个需求拆分成了四个子,人物,产品部定义早报的内容结构和信息源。开发部写下载脚本和推送接口。市场部确定标题风格和受众定位,数据库设计阅读量追踪方案。每个部门各自输出了方案, ceo 汇总之后,给我一份完整的执行计划。 整个过程我只发了一句话,这就是今天我要教大家搭建的东西。在动手之前,先花三十秒了解一下原理,这样后面的操作你才不会懵。 opencloud 的 多 agent 的 机制本质上是这样的,一个 get 位实力多个工作区,每个工作区就是一个独立的 agent, 它们共享一套基础设施,但各自有独立的角色设定模型配置聊天渠道绑定。 理解了这个搭建就变得很简单,总共两个步骤,第一步,在 opencloud 中创建多个 agent。 搭建方式有两种,第一种,通过命令行交互式创建,一行命令搞定,打开终端,运行下面这行命令。这种方式的好处是不用修改配置文件,跟着提示一步步选就行。 第二种方式,直接修改配置文件,适合一次性创建多个 a 键的。打开你的 opencloud 点 json 配置文件,需要修改三个地方 室内配置文件,如图。第二步,配置聊天渠道。很多朋友卡在这一步,不知道怎么在飞书上创建机器人,步骤如下,我知道重复建七个很枯燥,所以我做了一个创建飞书机器人的 skill, 你 把这个 skill 安装给你的 open log, 然后告诉他帮我创建一个飞书机器人,他会自动打开浏览器,自动填写表单,自动完成创建。搭好之后,最有意思的玩法是建立指挥链。 我给 ceo 的 设定是,当用户提出需求时,你需要一、分析需求的本质目的。二、将需求拆解为产品、技术、设计、市场等维度的子任务。三、将子任务分别艾特对应部门,下达清晰的任务指令。四、在所有部门回复后,汇总结果向我汇报。 这样一来,我的工作流就变成了我指挥 ceo, ceo 指挥各部门,我验收最终结果。我只需要跟一个人说话,剩下的全部自动流转。未来的工作可能不需要那么多人了,需要的是一支听话、高效、二十四小时在线的 hr 团队。

兄弟们,我们今天来聊一下多 agent 打开方式,那很多人以为多 agent 就是 把模型给堆上去,结果跑起来还是不稳,那邪道一复杂就会崩。 其实问题不在模型的大小,而在有没有组织结构。那单 agent 在 复杂的任务里为什么会失效呢?首先信息断层,运行不足,风险集中,那一个 agent 呢?他要扛全部的链路,所以说会导致出错不可控,交付也不可追溯的情况。 真正能跑起来的呢,是结构化的编排,那就需要先拆任务,再调流程,退后做闭环拆解,让目标能执行。那调度呢?让斜坐有秩序,闭环的话可以让整个结果都可控。那这里我们看一个典型的流程入口,拆解,斜坐、审计、 交付,每一步都能追溯责任,清楚流程才敢规模化。那所以说多 a 阵的本质不是多几个模型,而是搭一套完善的系统,那需要结构化,可编排,可调度,这才是真正的壁垒。 一句话总结, ai 的 未来不是单点能力更强,而是系统能力的更稳,这个其实就是多 a 阵的正确打开方式。

我今天一直在研究这个多 a 键的模式啊,现在主流的就分两种,第一种就是你直接在你这个飞速里面配置好的这个 bug 里面,你就直接说麻烦你帮我分身啊,他可以好像最多可以支持八个,他就相当于可以同时处理八个任务,但是本质上还是一个机器人, 这样的好处在于什么呢?就是相当于是说简单吗?第一个你只需要一句指令就可以了,然后如果说是处理这种收集这种信息的这种问题的话,他可以其实多个 a 键就相当于一个葫芦长了个七个葫芦娃出来啊,这个葫芦娃一起帮你去做这个事其实也是好的, 但是呢,刚才我也试了一下,但是你让他处理一个比较复杂的问题,如果他们要真的要协助的话,他很容易就把自己的身份搞混啊,当然我也不知道是不是我设置有问题啊, 而且你配置他这种消息传递的路径,我觉得是非常的麻烦的。我说实在话,因为他相当于就像一个人,他有七个脑子,七个脑子给你处理问题,让他他信息在七个脑子里面互传, 我觉得这个其实难度还是蛮大。然后最重要的问题就是因为你本来就只有一个机器人,但凡这个一个机器人他出了点问题,相当于是就相当于就没有你,就没有人可以用了。 所以我更推荐的是什么呢?就是说你正儿八经的去一个 agent 搭配一个 bot, 然后呢把他拉到群里面去聊,当然这个确实很复杂,我作为一个新学者,我也是搜这个教程走了半天, 但是他这个确实,如果说你是一个 agent 搭配一个 bot 的 话,就是我们传统意义上理解的多跟 agent 配合合作。但是同样这个问题最大的是什么呢?是它太贵了, 它太贵了啊。你不同的 a 检测之间,你这个不同的 a p i 配置确实又贵又麻烦,但是它好用呢?它一直好用,它这反应速度什么的肯定比你一个单 a 检测这快多了。 如果说大家像我一样是初学者的话,两个方式都可以尝试一下啊,大家确实有这种需求的话,对不对?你搞个多 a 检测去试一试啊?

大家好,本期给大家带来的是我们的软件的一个高级功能,名字叫做 superviso 啊,其实是一个指挥官的模式,它的一个主要功能就是它可以就是说自动拆解任务,并且把任务平台给 进行,然后这里的话我们可以勾选一下 就可以开始。然后这上面的话是主绘画的一个啊,就是孩子你之前选的主绘画用什么? 你可以给他一个简单的功能,比如说啊,请调用这个, 然后可以看到一个他会去 分析当前的一个项目,然后分析完之后呢就调用四个不同的 表格啊,如果你等待他执行完成, 然后记住我们刚刚不是勾选的模型对不对?我们可以看到它这里其实已经在调用啊 jamie 奶,但是我们实际上可能没有勾选它,我们等等看一下它是怎么处理的好,这里其实已经返回回来了, 说他不允许这个时候他会换一个模型来替代,换成了千万扣的好。其实上面我们看到他已经就是说四个不同的 a 级呢,已经开始干活了。我们右边也可以看到四个 a 级的是并行开始工作的, 如果有任务完成,他这边就会有 啊,我,我这粉丝也是做一个简单的一个代码分析的一个模式,说实话 lotto 的 包括不再是已经实现了他们自己的内部,但是他们能做的就是他们不会去进行用很多的模型去呃, 去做协同工作,他们只是对他们的一个,那我们这个软件的优点就是在于我们可以利用不同的一个模型来协助协同的一个任务 啊,这里我们可以看到啊,我们的 一个,这里我们就不详细看了, 介绍一下我们这个啊, super mario 指挥官模式,他的一个 感谢大家对软件的支持,然后 下一期给大家带来一个团队模式的一个介绍,本期就到。

workbody 具备多 agent 并发任务处理能力。我们先开发一个势力网站, 然后新建多个任务,同时对该网站进行改版。如我们连续增加了色调风格转变中英文切换内容新增这三个任务。 在运行过程中,我们可以看到各个任务的进度以及 diff 信息。 网页改版完成,来看看最终的效果吧,所有的变更需求都完成得非常不错。 使用 workbody 发送小红书图文,首先提出参照爆款图文生成类似的内容, workbody 开始自动调研和仿照编辑。 第二步,要求 workbody 发布到小红书, 等待片刻就完成了。 外语音视频转成中文速记、一句话提需求,剩下的交给 work body markdown, pdf, word 等均可生成。

是不是还在这样,在给欧盟科奥发出一个命令后,等着他处理这个命令,而不能下发新的一个任务?那我今天讲的多 ag 字就可以帮大家解决这个问题。 大家在网上经常会看到博主发的龙虾军团是怎么实现的呢?今天我们就带大家完整的走完,走一下这个流程。为什么需要多个 ag 字来干活?因为 opencloud 的 对话是单线成的,你下发一个指令之后,他没有做完之前,你是看不到他在工作的一个进度的,而且你也没办法帮他兴起一个任务,我们再给他下发一个任务,去处理我们的视频之后,然后想让他帮我 处理一下文件,那就需要多 a 键词来处理了。还有两个 a 键词,一个是巴巴塔,巴巴塔是我的日常工作的一个助手,他主要负责编程呢,做一些科学比较严谨的事情。一个 a 键词是音乐,音乐现在主要是我的私人助理,主要是未来为我提供情绪价值的,可以看一下, 它是以音乐的角色的语音给我发消息的。哎呀,不要这样嘛,人家会不好意思的。添加 agent 的 方法也很简单,比如说我们现在需要添加一个 agent, 名字就叫慕佩宁,我们把它的工作区也定义好,就这样。 ok, 我 们现在就已经创建好了慕佩宁的这个 agent, 我 们可以在界面上看一下, 看到没?木佩林,这是新建的一个 agent, 新的 agent 木佩林已经创建好了,然后我们就开始对接飞书,我们在这个地方创建企业,自建应用,为木佩林准备一个机器人。然后我已经创建好了这个木佩林,在 opencloud 的 界面频道飞书 这个地方添加一个目配零的配配置,把这个 a p i d o a p a secret 填进去,新建一个目配零的渠道,然后回到目配零这个地方,在订阅方式这个地方选用长链接点确定,然后添加事件, 然后把配对码进行一个授权, 现在我们就可以跟它进行对话了,让它自我介绍一下它是目配零。

大家好,我是老吴,在前面的视频中,我们主要和大家介绍了去怎么安装一个 open cloud, 以及呢怎么为这个 open cloud 去安装一些技能包。 当时呢我们主要呃安装了一个 agent, 是 一个我们当时叫做一个主的 agent, 这个 agent 呢也就是所有的事情他都做,随着用的越来越多,他会出现一些混乱, 那么怎么去解决这个问题呢?我们今天就给大家推荐一个方案叫多 agent, 他 每个 agent 他 主要去干一些他自己特定的事情, 也就是他自己擅长的事情,然后呢还有一个主的 agent 呢,他主要去做一个指挥者,他指挥下面的这些 agent 去做分配给他们任务,让他们去做事情,然后自己主要去负责调度。 大概的架构是这样子,然后呢?呃,每个 agent 呢,它会对接一个呃飞速的机器人, 我们一起来看一下。然后呢之前呢我们是用的呃飞速的插件是,嗯社区的,然后今天呢我们把它呃替换成飞速官方的一个插件, 这个插件,嗯,对飞书来,嗯,它集成飞书。今天主要的一个架构呢,大概是这样的,它主的一个叫主的 agent 叫,我们叫做 a main agent, 然后呢其他的我们叫创建了四个,其他的一个 agent, 一个是主要负责开发的,我们叫做 develop developer agent, 一个呢主要就负责 写写作的,就是写一些文档之类的,我们叫做 right agent。 还有一个 agent 叫做呃,它主要负责一些数据的分析,我们叫做分析的 agent, 然后再来一个叫做运维助手,我们叫做 ops agent。 这四这四个 agent 他 嗯主要是做自己一些擅长的事情,然后呢这个 main agent 呢他主要去负责调度, 然后它下面是呃对接着一个 get 位,负责通信,然后对接着的飞速的一个插件,它的整个一个核心的思路呢,就是在一个 飞速的企业下面,我们创建一个多的,创建多个飞速的机器人,它每个机器人呢就作为一个独立的 account, 然后对应着不同的 agent, 这样的话就是每个 agent 它会拥有一个独立的一个工作空间,所有的一些数据都存在它的工作空间里面,和我们之前的这个 main agent 它是完全独立开来的。 这样做的好处呢就是呃不会,会不再会引起一些记忆的错乱, 它的架构主要是这样的,我们再看看就是每个机器人它有一个通道,对应着它对应的一个 agent, 这样 它嗯这几个 agent 之间它还可以互相的通信交流,这样呢就可以在一个群里面它进行一个写作。 这里讲的是怎么去安装它,然后呢去配置一个 模型,我们这里主要配了两个模型,一个是 deepsafe 的 这个呃 api, 我 们主要是让它呃放在一些比较简单的任务, main agent 我 们就用它。然后还有一些我们我们要配一个 openroot 这 这个聚合的模型,然后一些呃特定的事情,我们用特定的模型来做,比如说 coding, 写代码的,我们主要是用一些 coding 的 一些模型,这个是它的一些一个配置的方法。 然后下面是它去,我们要在嗯,飞速的这个开放平台上去创建一个创建一些机器人, 这里的飞速它已经做的比较简单了,在这里呢它是有一个界面,你直接点开,直接就能登到飞速这个页面,直接点开这里它你直接创建就输入机机器人的名称,直接创建就可以了, 创建完了以后,它,呃需要的一些权限它会都帮你设置好了,就是我们不需要再一个一个去配置, 这样的话比之前我们,嗯,上节给大家说的要方便方便了很多。我们还可以,我们也可以呢,把这个一些权限,然后把它导进去, 以节省的形式把它导进去它的一个位置,大概是在我们看一下,看一下 权限管理,那这里有一个批量导入导出权限,把这个接收,把它拷贝过来,然后把它导进去就可以了, 然后我们还需要配置一个四 g 的 点,之前我们都和大家讲过了,然后 这呃这里呢我们主要去获得获得它的一个 app id 和 app secret, 这两个拿到 我们后面会有呢,就是我们要创建五个机器人,每个机器人都要拿到一个嗯, ipid 和 secret。 然后紧接着我们需要安装一个飞速的插件,用这条这个命令直接装就可以了, 这样大概我们就装好了,后面我们就需要做一些相关的配置,首先呢我们要做一些一个 channel, 飞速的一个频道 主账户,我们把它拎出来拎到外面来,然后呢一些其他的一些账号,我们放在 account 里,大概是这样子, 然后群聊的信息呢,我们放在这里 groups, 这个是群的 id, 群聊的 id, 群聊 id 就是 我们建好建,建好群以后,然后它有个 id, 我 们给大家看一下,这个是我们建的群,然后这样子设置 这个 id, 把它拷过来就可以了。 好,然后呢我们在嗯 channel 配置好了以后,然后我们要配置我们的 agent agent, 这里需要注意的就是我们每个 agent 然后都需要它一个独立的一个 workspace, 然后它 agent 一个目录 独立的这个模型我们可以自己去选择自己配,就是哪个 agent 它需要一些特,它需要用到一些特定的模型,我们直接给它配死,也可以,像这样子我们让它自动选择也是可以的。 接下来呢是有一个非常重要的事情,就是我们去怎么把 agent 和那个 channel 进行绑定,这里 是这么设置的,就是电脑 ipad id, 然后和电脑绑定,然后这个 developer, 然后和这个 dev 绑定 write 和 write, ops 和 ops, 然后这个是群和群群进行绑定, 然后这里我们需要去做一些 tools, 这边需要有重要的,需要重要的需要注意的一个事情呢? profile 我 们需要设置成 four, 然后呢 agent to agent 我 们需要设置成 to, 这样的话就是它可以允许 agent 之间互相调用,然后呢我们嗯 may agent 也可以把任务分配给一些专业的一些 agent, 然后这个筛选我们设置成 all。 这里有一点需要注意的是,这个绘画我们需要设置成这个 per count channel peer, 这样的话就是按照账号和通道它进行隔离,然后呢保证了不同的机器人的你和不同的机器人私聊它互不干扰。这里呢我们设置了 session memory 会,就是设置绘绘画的一些持久性, 前面我们主要讲了它的一些配置,其实配置还是比较多的,然后呢我们其实可以就是把我们的一些想法,把它设置好,然后就直接交给 open color, 让它把我们自己直接生成好就可以了,然后我们自己做,我们后面我们做,我们自己做一些 check。 然后第六部分呢,我们就做一些准备的事情,就是我们前面说的,然后 workspace 和一些 agent, 我 们需要把它 make, 把它放到一个单独的一个目录里面, 然后呢还有一些一个每个 workspace 里面有个 so so 的 md, 就是 它的人格,它的主要作用就是,嗯,这个 agent 的 主要的一些任务是什么?这个我们也可以让 ar 给我们写, 然后我们启动就可以了,然后做一些测试,大概就是,呃,这样子,我们和给大家看一下,我这边已经配好了, 这个是给主的 agent, 然后这个是 developops write, 然后写数据分析的,这是在群里面, 那么给大家。嗯,稍等一下吧。我们先给大家看一下, 这个是它的主要的一个配置文件,就是我刚才我们给大家看了,我们就不打不展开和大家讲。然后呢它的这个 workspace 里面它有一个 so, 等一下 等一下我们再和大家看。然后呢我们主要是先看一下它,我们配置好了以后,它主要有这些 agent, 就是 open cloud config get agents agents, 点 list 我 们可以看到我们建了有五个 agent, 然后呢看它怎么绑定的,就是 main agent, 然后绑定到 default, 就是 和我们刚才配置的是一样的,然后它的 channels 怎么和账号进行绑定?好,我们我们找一个给大家看一下,这里是我们一个主的 agent, 然后呢我们打开它的锁空间给大家看一下它,这里主要强调了它是一个呃指挥者资源的一个协调者, 它不是普通的助手,它是相当于多位镜头的一个中控神经,这样的话,呃, 它就可以给其他 agent 去下一个指令。我们再看一个其他的,比如说我们看到一个开发的这样的一个 agent, 我 们打开它的 so, 然后他的身份就是他是一个代码的姑娘,他主要负责技术的架构和问题的终结,然后这是他的一些一些像提示词一样的东西,我们把它写好。 ok, 我 们再给大家看一下, 这里面有个 skills, skills 就是 我们之前前面我们装的一些技能包, 如果比如说你 developer, 你 要装一些技能包的话,你可以把那个拷过来应该就可以了。 好,我们给大家演示一下啊, 让他写一篇关于春天 五百字的小学生作文, 你看这个 writer, 他 写了,那个 anise 他 已经写了。然后这边呢,他是做一个总结, 我们现在让他把他这篇作文翻译成英文。 ok, 大家已经翻译好了, 那么今天这个视频我们就和大家演示到这里。嗯,主要就是演示,嗯, 嗯,通过飞书自带的一个插件,我们把嗯, open, open cloud, 然后嗯装上了一个多的 agent, 每个 agent 呢,它对应着一个飞速机制,这样的话每个 agent 就 可以它干它自己擅长的一个事情。 好,今天这个视频就和大家讲到这里,再见。

好,今天我们来看一下如何在 open core 中实现多 a 卷的相互协助,那么这个其实是对应真实公司中员工相互协助的流程。我举一个大家很熟悉的场景,当有一个项目被立案的时候,一般会配备一个项目经理和 多个研发,以及测试和产品经理等这些经典的角色。那么在真实世界中的工作流程是,产品经理去出需求文档,去完成市场调研等相关的内容, 研发根据产品经理的文档去完成开发,开发完成之后则由测试介入,测试完成之后上线我们这次要分享的多 agent 相互协助的流程,模拟这种真实世界中的经典流程。你可以看到我在这里画出来了,当一个用户驾发一个附加任务的时候, 它首先是由一个 master agent 接收,这里 master agent 就 相当于之前提到的项目经理。 然后 master agent 会将复杂任务拆解成多个子任务,分别发给 sub agent, 子 agent 执行完成之后,将执行结果返回给 master agent, master agent 确认无误之后,再将下一步的任务发送给下一个 agent。 说到这里,大家应该很清晰的知道多 agent 的 相互协作用在什么场景中了,那我们来看看它是怎么实现的。这很简单,你只需要在 coco 的 配置文件中添加三个节点, 首先是 agent to agent 节点,那么添加这个节点之后,所有 agent 就 能有通信能力。但是如果所有的 agent 都有通信能力,它们之间可以相互通信交流, 那么就会造成一定程度上的混乱。所以我们是要给子 agent 添加 deny 的 节点,禁用子 agent 的 通信能力。最后我们要给主 agent 添加 allowed agent 的 节点,让主 agent 可以 看到所有的 agent 啊, 这样子主 agent 就 可以给他看到的子 agent 发送信息,而子 agent 不 能看到其他节点,也无法 给其他 send 发送信息,这样整个就实现了相互通信,相互协助的目的。以上就是今天分享的内容,如果对你有帮助的话,欢迎点赞收藏!

真正有效使用 photoshop 的 第一步呢,就是告别愚蠢的 web ui, 然后搭建一个属于自己的任务控制面板,这样你就可以一个人管理整千上万只的龙虾。这就是我的任务控制面板,它可以管理不同的工作区域,就类似于公司的不同部门。让我们打开 ai 应用部, 你只需要给组织者发布任务,它就会组织一群 agent 来协助拆解任务。只需要把复杂任务丢进队列,你的龙虾大军就会在流水线上自动的去接力, 等你醒来,你的任务就执行到位了,你可以直接来验收成果。这里面有一个最大亮点,就是他会主动的去提问,如果有我们没交代清楚的,他不会去猜, 而是会一步步的引导式的提问,让我们告诉他真正的需求,他才会去干活,这样可以把返佣率降到最低。在右边还有各个 agent 的 信息流,可以看到每个 agent 在 做什么事情,在调用什么工具。我们可以看到现在我的龙虾公司有一百一十五个 agent, 有八十二个在工作,有十六个在休息,正在进行一百三十四个任务。这是我的不同 agent 的 角色,你可以看它都是有非常细分的任务的,类似于公司的某一个专员。用这一套控制系统,我们就可以分部门定义 sop, 把自己的项目,自己的公司的效率提升一百倍。

在我有二十多家公司作为 ai 框架的选型之后呢,我总结出了六个多 a 键斜坐的框架,每一种呢都适合不同形制的业务。那今天呢,就一个视频和大家讲清楚,在上两期视频里呢,关于我说 a 键 pad 的 视频,就有很多小伙伴提问,就问我,我说 为什么我们不让一个大模型去分批次的处理问题呢?那其实咱们搞一个数学就能想明白哈,如果 ai 去做单次任务的准确率是百分之九十,那在五次之后,我们的准确率就会降到百分之五十九,这是一个非常大的降幅。 所以说咱们去设计一个多个大模型共同协助的框架,其实呢,本质上就是让 ai 去上一个轨道,防止它去跑偏。 那到底什么样的任务类型,该怎么去分我们的协助框架呢?就问自己一个问题就可以了,你这个任务的步骤能不能够提前写清楚, 你如果能够写清楚了,它就属于叫做静态业务,它如果写不清楚,你要做一步看一步,做一步看一步的,它就是属于我们的动态业务。好,那我们先从静态业务的 bat 模型开始讲起。 w a t 模型泛指的是 work, flow agent and tools, 核心思路呢就是说你用一个 md 文档把你的整个工作步骤给写好,然后呢让你的 a 键让你的 ai 去读这个工作步骤,然后根据工作步骤里的指示呢,去调用不同的工具帮你完成任务。 w a t 模型呢,特别去适合那些重复性特别强的固定任务,比如说每周我要爬十个竞品网站的数据,整理进表格,并且发报告,这个的好处呢,就是非开发者也能够轻易地维护,不过如果你要去做每次任务都不一样的场景,你千万不要去用它,因为 那样的话你去写这个呃规范文档的成本会比你的产出还要高很多。那么第二个适合静态业务的 整个框架呢?就叫 linchang 或者是 lingr, 其实 linchang 呢跟 lingr 就是 咱们平时经常说的链式思考,那它的核心逻辑呢?其实就是开发者用代码把每个步骤串成流水线,或者是串成一个个的循环, 在你去给客户去定制 ai 应用的时候,它特别特别的好用,就比如说一个基于知识库的 rack 搜索的 回答机器人,这个东西就特别特别的好用,我的每一步都是代码写死的,遇到这个问题该怎么办?遇到下个问题该怎么办?整个流程呢?非常的稳定,非常的好测试。但是如果你并不是一个非常熟悉开发的人,千万不要去碰它,而且如果你的任务逻辑经常变的,也不要去碰,你每次要改代码的话,成本太高了。 那么因为视频的长度关系啊,这期视频咱们就讲静态业务的两个框架,那关于动态业务的下面的 react plan, execute, auto gen 和 crew ai 的 这四个框架呢?我们下期视频再聊。好吧,我先听,我是一个大家一起学习 ai, 一 起进步的普通人,我们下期视频再见。

你配置好了 open pro, 是 不是所有的活都让他在同一个 agent 里面干了?其实这样是不对的,完全没有发挥他的最大威力。我们先来了解一下什么是当 agent 模式和多 agent 模式。当 agent 模式就是一个人干所有的活, 用户问啥他都得答,累死累活还容易出错。而多 agent 的 模式呢,就是一个团队啊,他会分工协助。 呃,首先,用户会先找总监, agent 总监根据任务分配给不同专业的 agent, 写代码的,做测试的,写文档的,做客服的,各各按各的专长。最后,总监汇总给你的答案。 这就不是向公司里面项目经理带着开发、测试、运营一起干活吗?效率翻倍,而且啊,质量还高。那当 agent 的 模式有什么问题呢?第一,上下文会过载, 啥东西都往里面塞,模型记不住,细节回复越来越笼统。第二呢,提示词污染,通用指令没办法适配所有场景,每次新任务都得重新交一遍。第三,零变形就是想干,想同时干三件事,只能一件一件排队。 第四,权限风险也很难把控,一个全权限的,一个 a 卷的万一被恶意利用,那你的电脑分分钟被盗。那到底什么时候该把一个智能题拆成多个呢?记住,这三个信号必须拆。 第一,上下文会持续累积,且互不干扰,比如调研 a 卷的积累的积累,文风 混在一起就乱套了。第二,需要不同专业的记忆,技术调研和市场调研完全是两个大脑。第三,工作流完全独立,写代码和写文案 能一样吗?但注意别瞎拆啊,如果只是工具不同,输出格式不同,或者任务频繁共享信息,强行拆反而会添乱。来看一看一个团队真实配置表,一个总监 agent 组协调模型,用 opus, 权限全开,下面工程师 a 选择专门写代码模型,用 sonet, 工作空间,在 qa 目录下面,只能读和操作,不给浏览器权限,安全第一。 qa 呢,负责测试,只能读和执行,不能写,防止它乱改代码 文档呢,用 grm 五飞书渠道读写,权限编辑全搞定。客服呢,用 jammer, 只能读和发消息,不能执行任何操作。看到了吗?每个 agent 都有自己的模型, 全线工作空间,像一只特种部队,各司其职,高效又安全。所以你的 agent 也应该这么配。那么应该怎么配呢?其实啊,就是让主 agent 分 别创建,呃,你创建那个子 agent, 然后把子 agent 绑定到不同的群聊上面 就是这么简单,下面我们一步一步来操作一下,我们先到 opencloud 的 后台点击代理,然后我们可以看到现在只有一个主 agent, 然后我们现在创建一个 sub agent, 然后给他取个名字叫,嗯, 产品经理吧,产品经理, 然后给他机器人,给他拉到这个群组里面,对不对? 然后拉进来之后,然后复制一下他他的群绘画 id, 也就是他的群聊 id, 然后放到这一个 提示词里面,然后这个提示词也很简单,就是让他帮我创建 agent, 名字叫产品经理,然后下面这一大段是他的一个呃角色定位, 然后下面这一段的话,是他的一个自我持续优化的一些能力,一般都不会变,要变的话主要是上面他的一个角色定位,然后我们给他复制一下,然后直接发给他。 呃,等一会的话他应该就会创建好了,我们可以看到产品经理这一个 agent 已经创建好了,然后我又问了一下他是主 agent 还是 sub agent, 然后他现在就是产品 agent, 我 们到后台可以看一下,他现在 有两个 agent, 一个是主,一个是 sub。 呃,他 sub 他 有自己的独立的上下文,有自己独立的灵魂啊,呃,他的角色啊这些, 所以后续我们有关于产品相关的一些需要问他的,需要他帮忙处理的事情,都可以在这个群里去做。

来展示一下我做的这个四点两格六部的连空,还有四点两个九千制,然后这个的话是总仪表盘,这里的话是我的四个电,每一个电其实都是单独独立能调起一个端口,就是形成并行的, 然后这边的话就是对应的一些官员,也就是所有的那个爱敬特智能体啊,都在这里面,然后可以调用,然后这是文员格,这里其实做的, 因为还没有完成啊,这里其实是做数据监控的,然后这里是做容灾的,这要等所有的东西都做完之后再去优化这两个地方,然后这里是大部分所有人员正常的管理,然后这里是单聊的,然后 这里的话是主控的所有的配置啊,我所有的这个地方都是做了强隔离的啊,然后这边是任务中心,任务中心的话是到时候在后面会演示一下我任务中心怎么执行啊。这边是智能体的对话, 然后这里是我的 skills, 所有 skills 我 都已经做了一个中文的翻译啊,然后以及一个这种能够看得懂的这种剪辑啊,然后这里的话是 mcp, mcp 就 装的挺少的。 好,这边是休息室啊,然后数据报表什么的,这些都是最后再去优化,目前大概就是做到了这个程度啊,很好啊,这么多天呢,我的这个 多端口多 agent 系统啊,也是成功的见到了曙光啊。这里先来展示一下我这其中任务中心的这一部分啊,其他的也做了, 然后这里呢就是输入这个标题和输入任务所需啊,它会怎么样呢?就是啊,我当前是属于呃四电两格九氪制啊,以前的那个三省六部制呢?已经 废弃不用了,我感觉那个思路其实只是说当玩具是可以的,但是真正项目落地的话还是, 嗯不是很好用,我根据自己的项目的想法,根据自己的项目重新做了一套这个四电两隔九轻质啊,然后四电的话是四个端口啊,处理四个并行的流程, 然后两格的话是做了容灾和备份,然后数据的监控,九情的话里面就是不同的官员,你看这里也是选择然后点一下之后呢任务就开始智能执行,由当前的店主进行智能调度, 然后他会开始进行一个智能的分配,然后这是我们向下拉看一下, 那么所有的子任务,子任务的话也有他自己的一个进行程序啊,这样的话就避免了那个龙虾自己的黑河,你看这里也是完成了,然后他任务就开始了推进啊,各种推进一直到 最后的深沉,这样我们就能实时的看到子任务到底有没有在执行啊,执行的进度怎么样,然后聊天的这个过程怎么样啊?一直到这个项目推进完成哦, 就再也不是那种黑河形式了,对于个人理解以及破壁的话非常的有好处啊。然后这里的话呢,我也是做了一个再次的优化, 这里的话就是对于那种小的任务比较简单一点的任务,而且我是有这个单方面培养过的这方面的人才的话,直不直接让他智能的就分配到这个人,让这一个智能提取 完成这个任务就可以了,不再用多人协同的方式啊,因为简单任务多人协同反而是个累赘啊,反而很麻烦啊。嗯,这样子的话就让他一个一个人去理解,去执行,然后看一下他整个 理解的过程和流程,然后一直到最后拿到最终的结果,这样的话他也是名牌,他不是黑箱。

你是如何从零到一的去设计一个 a 检测,一般就从六步走。第一个先明确核心,解决的问题,不会上来就做全能助手,先锁定具体清晰的场景,比如自动处理客服工单,按需生成周报,只有问题聚焦,后续的设计才不会跑偏。 第二个就是拆解 a 检测要具备的核心能力,按感知决策执行的闭环来思考,感知是理解用户输入,确定是存文本还是多模态能力决策是任务规划 选 react 模式还是规划式执行,是确定可调用的工具和 api, 比如能不能搜索、调数据库,生成文件,这三个环节缺一不可。 第三个就是做分层的架构设计,最底层是大模型作为核心大脑,往上是工具层,封装之后让 a 镜头能和外部交互。再往上就是记忆层,短期记忆存上下文,长期记忆用向量数据库存知识。 最上层是编排层,把控整个任务流程。分层设计的好处就是各层职责清晰,后续迭代调整更方便。 第四个就是考虑关键的设计细节,比如决策逻辑简单的任务用 workflow 就 可以。需要灵活应变的就设计 react 循环,能根据反馈调整策略。工具设计要标准化,每个工具的入仓、出仓和描述都要清晰,让模型能够正确调用。还要做好融错机制, 针对调用失败、决策错误的情况,设置从事机制和人工接入点。第五个做 mvp 最小可用版本验证, 不会一开始就追求完美,先搭建基础版本,用真实数据跑通,重点关注任务完成率、平均轮次、工具调用准确率、用户满意度这些核心指标,根据数据反馈迭代优化,比如调整工具、设计、优化提示词、 增加逻辑判断等。第六个就是做好上线后的闭环和持续优化。 agent 上线之后持续收集数据,分析失败案例,整理用户的反馈,再针对性优化,比如微调模型、调整提示,扩充工具级,这是一个长期迭代的过程, 综合下来,从零到一。设计 a 型的关键就是先明确问题,再拆核心能力,做分层架构,接着打磨设计细节,然后快速做 mvp 的 效果。最后就是根据实际数据持续优化, 不用追求一步到位,核心是带着产品思维小步快跑,让数据驱动每一次的优化调整。我已经把二零二六年大模型进阶的最新路线整理好了,如果你也想进阶大模型,我可以给你一份大厂内部必读的文档, 里边包含模型原理、产品落地、思维框架,内容非常全面,需要的话我直接安排。

三点五小时练完这三十六页,你的 a 件 t 搭建就很牛了。很早就想搭建自己的 a 件了,一直没空。这两天抽空搭了个多 a 件的写作系统, 还整理了一套文字加视频的入门教程,从需求分析、工作流搭建到智能体设计,对接、外部生态,每个步骤都拆解清晰。 教程内容专为新手打造,就算是没接触过 agent 的 小白,跟着也能搭出自己的智能体。我们内部整编了四百集 ai, 从零到进阶实战教程,现在开放共享,希望能让你少走弯路。

今天呢我把视频分成了四个机器人,运营、编导、剪辑文案,然后这里我还给他们拉了一个组,这是我给这几个机器人创建的一个群聊。然后首先我是让运营使用他这个技能,然后开始今天这个任务,那他就开始了, 我现在给运营机器人设置了一个专有的技能,这个技能呢就是让他每天去帮我去爬热点数据,然后把对应的这个素材和选题找到。 那我后面我让他去做事情的时候,我就不用再重复的去说这些内容,我直接让他使用这个技能就可以了。那后面我也会把这个技能在做不断的完善,比方说我会指定一些网址啊,然后或者说添加一些更多更明确的这个信息进去,这样子他执行的这个动作可能就会越来越准确。 看这个运营机器人,他执行这个技能的时候,他会把选择题放到对应的这个目录,因为我在那个技能里面把目录都已经写好了,然后他就会放到对应的这个目录里面去,然后选择题素材他会,你可以来看一下这个新闻是什么。 然后我这里是给编导机器人给了他一个技能,让他去把对应目录下面的这个内容选择题给读取出来,然后我是在群里面艾特编导机器人,让他使用这个技能来策划今天的视频。