粉丝14.1万获赞46.5万

你用小龙虾的时候,还在把所有的事情都放在一个窗口里指挥吗?比如我同时要写文章、发小红书、监控资讯维护、网站记账,都放一个窗口里,既浪费偷啃,效果还非常的好。改造成多 a 帧的模式, 才是给小龙虾省钱又提效的正确用法,我是这么做的。以飞书对接小龙虾为例,参考官方文档三个步骤。第一步,专事专办, 给每件事情创建单独的机器人来负责。比如我要记账,我就建一个这样的财务主管,把 opencloud 配置文件里的 channel 字段改成这样的多 account 模式,这两个 account id 记住,后面要用。第二步,多 agent 配置, 我们用这条命令给小龙虾增加一个 finance 的 agent, 等同于我们新招进来一个员工,出土化他的 identity 文件,把它捏成我们想要的形状。接着在 openclaw 配置文件里面增加 bindings 段落, 让不同机器人的消息路由到不同的 agent 上,实现分工的效果。第三步,测试验证 重启 open cloud 的 getaway, 在 飞书上分别给两个机器人询问他们的身份,如果能看到不同的回答, 那就是配置好的。后续还可以给不同的 agent 配置合适的模型,或者让他们互相派发任务。这样的工作模式可以大幅节省 token, 显著提升小龙虾的任务效果。实在是太爽了, 都不需要再雇人了。我加上小龙虾的 agent teams, 就是 超级艺人公司。关注我,带你玩转 open cloud!

这是我用 openclaw 搭建的 ai 团队,他们各司其职,不用睡觉,能节省下非常多的时间,同时也做很多我一个人做不过来的事情。这期视频我想带你看一下我的 ai 团队到底长什么样,然后我们再一步一步搭建出属于你的 ai 团队。我们会讲如何创建一个 agent, 我们在 open cloud 里面,一个 agent 到底指的是什么? agent 之间如何相互协助,以及什么时候需要多个 agent 和最佳实践。好的,废话不多说,我们开始吧。我的团队里面一共六个选项题,其中四个是有定时任务的,就是每天的某个时刻都会触发他的任务,让他执行直到完毕,当然也可以随时跟他对话。 还有一个是几乎二十四小时期不间断工作的,还有一个最后一个,那就是你给他任务,他才会执行。第一个 agent 呢,是攻击 galk 啊,他每天负责给我情报工作,具体来说就是每天早上九点会提前搜寻 关于 ai agent 相关的技术的进展,产品进展以及用户的痛点。然后呢,把在网上搜寻的信息汇报给我。那么如果我不回答他,那就是明天继续给我相关的信息。如果我回答他,希望他对某一个话题进行深挖,那么他再去根据某一个话题再去搜索相关的信息为我展开。 那我的第二个 ai agent 是 auto 合理,它是我的私人助理和提醒助手,怎么用呢?我一般都是通过 diagram 跟它对话,这里我就不展示我跟它具体对话了,要涉及我的个人隐私。 一般来说,有任何的待做事项或者事情有着进展,我一般都会语音留给他,或者是打字告诉他,他都会记下来,某一单有问题就会问他,他都会翻出来告诉我待做事项是什么,事情到哪一步了, 同一次。同时呢,每天早上七点半,他都会告诉我今天的天气,然后今天要做什么,一步一步按重要性排序。它的作用就是完全替代笔记软件在我这里的作用。现在呢,我已经不用 notion 来记我事情,要做的事情,以及事情的进展了。 我的第三个团队成员,也是最重要的团队成员,就是 man, 一个狮子的形象。他呢,有最好的模型,有最高的权限,我主要用它来做两个功能,第一个就是日常的对话,我所有重要的对话,长期的计划都是跟他讨论的。 第二个就是一个视频流水线,帮助我制作视频。那么这个想法来自于一个叫做 alex finn 的 博主,本质上就是每隔几个小时,比方说我是每隔三个小时,他会去 x 上搜索我感兴趣的话题,比方说 ai 阵,比方说 open call, 比方说 ai 模型等等等等。有系列的话题。 他呢,就会看看哪些帖子现在比较火,或者是正在受到关注。然后呢,把整个的中文翻译和相关的数据都发到我这里来,包括原文的链接。如果我更感兴趣,希望用这个题材做一个视频,或者是有可能做一个视频呢,我只会点一个大拇指, 他就会进到我们的流程的。下一步就是他去研究这个帖子相关的背景信息,补充相关的背景信息给我,确保我了解这个事情的来龙去脉。那么如果这时候我再相关,我还觉得还是感兴趣,我再点一个拇指,他就会往下走,去研究怎么做这个封面图,或者给我一些脚本大纲的一些建议。 那么除此之外呢,如果我对一个帖子我不想做成视频,但它对我是有用的信息,我的时候可以点一下这个眼睛,它呢就会到我的收藏家里面去,可以看到。哎,这个帖子现在到我的收藏家里面去了,这里面就是我认为收集的比较重要的信息。除了 x 之外呢,它也会去搜索 youtube 和 hacker news, 看看每天大家都在讨论什么。这是我这样一个视频的辅助系统。我的第四个团队成员是潘大熊猫,他负责开发,他呢算是唯一一个几乎不休息的智能体。现在他有开发任务,但是当他没有开发任务的时候,他会增加测试,或者是自己去测试边缘情况,找 bug。 那 么关于二十四小时期,我特地特别想说明一下,想有好的效果,往往你需要用好的模型,如用云端的模型消耗 top, 二十四小时期会非常的贵。如果你用本地的模型呢,你大概需要买 max 九九,那么 也会造成非常贵。所以二十四小时成绩一定得是高价值的工作。对于我来说,开发是高价值的工作。除此之外,正在我现在正在做的还是有销售相关的,比方说做 seo, 或者是给我自己的产品做销售线索,找潜在客户。 我的第五个团队成员是 monkey 猴子,他只有一个作用,就是我丢给他一个视频链接,他把这个视频变成一个带截图的文章,因为我自己做视频,我希望重复利用自己的资源,这时候我给他我做过的视频,你可以看到他啊把相关的进行了截图,并且把整个视频脚本重写为可以发表的文章。 我的第六个团队成员,也是最后一个是 tiger 老虎,他负责安全和更新,他呢每天都会定期扫描一下有没有安全问题,然后有新的可以更新的版本也会通知我,我们一起讨论如果更新的话,会不会造成性能的退化和影响当前的任务。 那么如何创建一个新的 agent 呢?其实非常的简单,我们后来会看到整个 agent 的 结构,但是你完全不需要自己创立文件夹,最简单的方式就是跟你的主要的 agent 的 对话,让他帮你去创建。这里我们以 diagram 为例, 你通过 diagram 与你新的这个 agent 进行对话,这时候你可以告诉你主要的 agent, 你 跟他说,哎,新建一个 agent, 他 叫什么?他要做什么啊?有什么呢?任务最后呢,告诉他你新建的这个 diagram boat 这个 diagram 机器人的 token, 这 token 怎么获得呢?我们找到 boat father, 点击这个打开 boat father 的 app, 然后这里我们点击 create a new boat, 新建一个新的,然后这时候我们给他一个名字,比方说我们叫做 fox, 然后我们点击 create boot, 你 就会得到这个 tokin, 然后这里我们点击复制,然后我们回到这里来, 把我们的 tokin 复制上去,告诉我们的主要 agent, 那 它呢,就会自动帮你创建这样一个新的 agent, 新的智能体了。那么什么是 agent? opencloud 里面如何定义 agent? 它又是如何工作的呢? 其实啊,一共就分为三层,分别是全局层, agent 层以及 session, 也是对话现成层。我们首先看第一层,就是全局层, 它呢并不是一个 agent 独有的,而是所有 agent 共用的,可以理解为是公共设施。这一层最典型的文件就是点 opencloud 我 们的总文件夹下面的 opencloud 点这次文件,也就是总配置文件,大家可以打开看一下,里面有非常多重要的参数,包括 os, 也就是定义哪个大模型厂商,还有就是你的登录身份是什么? agents 定义有哪些 agent? 它的默认模型是什么?工作目录和运行参数是什么? tools 定义局的工具权限以及 agent 之间的调用规则。 bundings 定义什么来源的消息调用到哪一个 agent, 浏览器定义浏览器信息, chanel 定义 telegram, discord, 飞书等外部的渠道连接, gateway 定义网关, memory 定义记忆等等等等。可以看到 openclaw 点 json 文件,里面包含着 openclaw 最重要的参数配置。 其实啊,大部分情况下我们出现崩溃对话没有反应的情况,也是因为我们的 ai 去改 opencll 点 json 这个文件夹里的参数的时候改崩了,所以一个建议就是,哎,你告诉你的 opencll, 在 他改这个文件之前一定要提前通知你,而且改的时候一定要谨慎。 第二层是 agent 层,这才是每个 agent 自己的领地,每个 agent 啊都有自己的工作空间,系统数据会话记录。那么 workspace 里面每个 agent 文件夹下面的这些文件,在每个对话开始的时候都会被加载进去来作为这个 agent 的 上下文。 由于呢,不同 agent 这些文件有所不同,这也就决定了啊,这些被文件被加载进去的时候,里面携带的信息,包括啊,他的身份,他是谁,他的性格,他的对话方式,他的任务的不同。 那么这些文件呢,包括 agent 点 m d, 也就是这个 agent 的 工作说明书,它决定这个 agent 的 做事规则,优先级,边界,还有如何使用记忆。 so 点 m d, 就是 这个 agent 的 性格和说话方式,与其是什么风格,是什么,边界在哪里,由它来决定。 user 点 md 就是 这个 agent 对 用户的理解就是他在帮谁,对方是什么风格,应该怎么称呼,有什么偏好,要注意 identity 点 md 就是 这个 agent 的 身份卡,解决的是这个 agent 叫什么,是谁的问题。 to 点 md 是 工具说明书,告诉 agent 啊,本地有哪些工具命令,怎么约定项目里面有什么习惯? memory md 是 长期精华记忆,它不是流水上,而是提炼之后的长期信息。这个文件很重要,而 scales 里面就是这个 agent 专属的 scale, 如果和局的 scale 同名的呢,这里的优先级更高, 会覆盖大局。那么这些呢,都属于 agent 层,也就是说啊,不同的 agent 默认不共享这些文件,但是同一个 agent, 不 同的对话,不同的对话线程之间是共享这一套文件的。第三层是 session 层,这个层级啊,不是这个 agent 是 谁,而是这个 agent 当前在哪个窗口里面工作。 session 是 对话县城,怎么理解呢?比方说,当你在同一个 agent 和他对话,但是在不同 discord 里面的频道对话,或者是你先跟他在 telegram, 后跟他在 discord 对 话,这就是属于不同的县城,因为它们的渠道不同, 或者是就是你当前的对话,但是你打了命令 slash new 或者是 slash reset, 就 会开启这样一个新的县城,区别是 slash new 旧的对话还在,但是 slash reset 会清空上下文,重新开始这样一个对话界面。那么这一层最典型的文件就是在我们每一个 agent 的 下面 sessions 文件夹里面不同的 session 文件了, 也就是每个对话都有自己独立的这样一个文件来记录啊,不同的对话历史。也就是说同一个 agent 不 同 session 会共享 agent 层那一套的。我刚才说的 saw 点 md, 我 刚才说的 agent 点 md 等等那些 workspace 的 文件,但是不会共享竹字的聊天记录。 讲完三层结构,了解 agent 工作原理之后,下一个很重要的问题就是,哎,多个 agent 之间是如何协作的呢?在 open call 里面, agent 协作大体有两种方式,第一种就是固定分工,也就是我们刚才说到的多个独立的 agent, 各自有各自自己的 workspace, 有 自己的 session, 也是对话现场。 固定分工就是像搭一个长期团队,就像我展示的我的 agent 一 样,一个负责找资料,另一个负责写脚本,一个负责写代码,还有一个负责日常对话和汇总等等等等。他们每个人啊,都长期干自己的事情, 他们之间的工作啊,写作的方式可以通过触发的串联或者是并行,比如啊, agent a 搜完信息这里我在 disco 里面点个赞,后面的 agent b 就 会根据我点赞的这个内容去调研资料,去补充材料。 那么第二种就是临时拉 sub agent, 也就是子代理。子 agent 去干活,也就是 open club 的 sessions prom, 它呢会拉起一个隔离的啊。 sub agent prom, 也就是子代理的这样一个运行在独立的 session 对 话现场里面工作, 工作完之后再把结果传到我们当前的对话里面来,相当于临时叫了一个实习生或者是外包去隔壁的办公室工作,干完工作回来汇报。这样的好处就是当我们的子代理在独立的赛程里面工作的时候,他不影响我们当前对话的这个主位阵子,我们可以继续给他提问,继续跟他对话,两边同时进行。 那么官方文档对他的定位也很明确,就是他适合做研究,慢任务、重任务、病情任务,而且不会阻塞我们主对话。 比方说这里啊,我让他去用 sessions born 去开一个子任务,研究 open call 智能体最近最受欢迎的三个讨论点,要求每个讨论点的热度、原因,代表观点,以及我可以做视频用的切入角度,然后让他开始在后台启动,完成之后主动汇报结果, 好的,他已经启动了这个任务。其实这时候我们可以去跟他对话,比方说我问他今天天气怎么样, 他呢,还是会回答我们这个今天天气怎么样的任务,因为刚才我们也说了,子任务是在另外一个县城完成的,不耽误我们跟我们的主要的智能体之间的对话。可以看到他就是继续的跟着我们进行对话,他回答了我刚才的问题,然后我们可以继续提问,我说, 哎,可以看到我们等了一会之后,他终于是把这个任务完成,然后自己主动地把任务的结果发回到了我们的主要的频道。哎呀,没有影响我们刚才跟他这个主要频道主要的智能体之间的。对,不是所有任务都适合上多 agent, 如果只是一个短问题,那么一个 agent 往往更加有效,硬拆呢,只会让系统更重更慢。那么真正适合做 agent 的 场景啊,一般有这么几种,第一种就是你的任务天然就能拆开,比如啊,研究,写作,审核,发布,本来就是不同的角色,这时候拆 agent 有 不同的工作区的这种不同的文件边界会更加清楚。 第二个就是任务可以并行,有些事情呢,不需要排队,一个 agent 可以 查资料,另外一个可以同时整理结构。如果你用 sub agent 这种并行就很合适,那么刚才我们也说了,它很适合做这种比较重的或者重复性的工作。 第三个多 agent 呢,不只是为了分工,也是为了避免污染。因为啊,如果你用单 agent 做太多不同类型的任务,都会出现相互污染的情况,长期记忆呢,会把不该混的东西混在一起。因为我们也说了,工作区那些啊, markdown 文件是同一个 agent 在 不同聊天窗口里面共享的, 那么什么时候没必要用多个 agent 呢?那么很简单,要么就是你的任务很短,要么就是上下文高度连续,你不想打破,要么就是你角色的边界根本猜不清,就没必要拆。还有就是避免为了做 agent 而做 agent, 只是为了看起来很高级而已, 能一个做好的事情就一个做,就相当于是一个队伍,当一个任务需要一个团队来做的时候,那自然值得用团队。 那么关于多 agent, 为了达到好的效果,我想分享一下我自己得出的一些实践。第一个就是不要一上来,对于很多的 agent 可以 从一个开始,有必要就加第二个,比方说你第一个 主要的 agent 也是默认的 agent, 基础上你加一个研究 agent, 每天去搜索啊有价值的信息,定期汇报给你,那么先把这个逻辑跑顺出来,然后再根据你自己的业务再加一个,同样每加一个呢,都先跑顺功能验收效果。 第二个就是工作区的文件要尽量的短,尤其是 agent 点 m d, soft 点 m d, user 点 m d, 也就是心跳文件, 而因为这些文件都会进入 agent 的 运行上下文,如果太长的话会增加效果。考虑到你有多个 agent, 如果你不注意的话,那你的成本可能会成倍的增加。好的,以上就是今天的视频了,希望你也能开始搭建属于自己的 ai 团队,不要忘记点赞和关注,我们下期再见。

看看我的 agent 团队们,有写图文的、网站运营的、监控金价的、记账的,还有提供情绪价值的,后面还要增加一个视频剪辑的 open cloud 小 龙虾 用上多 agent 的 模式了吗?但像我这样每个 agent 对 应一个机器人的配置是有点广泛。在飞书上其实有一种更简单的方式,就是通过拉群,实现一个机器人多个 agent 多个群聊分别管理的模式。我们来以选择题、写作和神稿三个事情为例,完整的配置一遍, 一共三个步骤。首先用这样的命令创建多个 agent, 分 别负责不同的工作,然后给每个 agent 的 职责拉一个飞书群,并且把我们的唯一的这一个 飞书机器人添加到群里面。接着把每一个群聊和 agent 绑定起来,在这里查看群的 id, 通过这样的 bindings 配置把两者映设起来。最后不要忘记给飞书 channel 增加这两张配置,开放群聊和群聊中,不需要艾特机器人也能回复。 配置完成之后,在各个群里和 agent 对 话,给他们安排好职责和身份,让他们记录下来,你就可以在不同的群里指挥不同的员工工作了。像这样的流程,先选择题再写作,审稿,审完再改, 最后得到一篇完整的内容就可以发布了。这样做配置简单,效果强大,快来把你的 agent 军团也安排起来吧!关注我,带你玩转 open club!

不要再去折腾本地部署 openclaw 了, mini max agent 最近进行了一次全新升级,上线了全新功能的 max claw, 十秒钟即可在云端启动一只大龙虾,让 openclaw 变得开箱即用。另外一个重大更新则是 expert 二点零能力。 expert 就是 针对特定场景的专属智能体,而在二点零版本中,只需要用自然语言描述任务目标或者能力需求, agent 就 会根据目标自动创建并且配置对应的专家。无需专业开发能力, 普通用户也能把自己的技能与经验注入 agent, 把具体领域的流程沉淀为可付用的 sop。 本期视频是个手把手的教程,我们先借助 expert 二点零的能力,创建一个周末去哪玩?专家只需要给 ai 城市跟日期, expert 就 能针对活动类型、季节、天气、交通地理、上映电影等信息进行综合的分析, 规划出一个最适合的周末休闲行程,能带来各种创意与惊喜,专治选择恐惧症。视频的后半段,我们再来试玩下 max crow, 让他化身贴身的行程管家,在周末出门玩的时候获得行程、交通、天气的提醒,还能随手记账。 我们来到 mini max agent 的 官网社区,里面已经有了一万多个公开的专家,含盖了方方面面的能力,大部分都是用户自建的。我们也来创建一个自己的 expert, 在 右上角点击创建,输入提示词, 创建一个周末去哪玩儿的 ai 专家。用户提供一个城市跟时间, ai 能自动搜索事件,比如城市活动展览、音乐节季节适合的公园、博物馆特展等等,把 最适合的事件作为核心活动,然后输出一个一天的活动规划。很快, mini max 完成了专家的创建,填充了原数据、视力问题、应用图标,还有指令文档等等。我们可以点击配置按钮, 对 expert 进行微调,比如把名字改成周末去哪玩。这个 expert 的 核心骨架已经搭建完毕了,具备了基础的能力,不过它的大部分知识都是来自于网络搜索,我需要给他更多的精确数据来丰富他的能力。 一个能力就是地理位置信息的感知能力。这里我准备接入高德地图 m c p, 让 ai 能够获取附近的地理信息的数据。在创建页面的右侧找到能力,添加 m c p, u r l, 里面填写高德地图的 m c p 地址, 后面要替换上在高德官网上面申请的 k, 最后确认保存,把 m c p 的 能力开启起来。这个 m c p 具备了地理信息检测还有查询天气的能力。 我们先利用查询天气的能力改造一下这个 agent, 这里输入提示词。整个专家工作流的第一步,先用高德地图 m c p 查询天气,如果天气不好,就只推荐室内的活动。很快 ai 完成了修改,主要修改的是指令部分。我们看到在指令里面,第一步会先调用 m c p 查询天气, 然后根据天气来规划是室内还是室外的活动。当然这个 m c p 的 核心能力还是地理位置信息, 我们可以基于这个能力再改造一下。这里输入提示词。推荐餐厅的时候,先用高德地图 m c p 查询核心活动的地理位置坐标,然后再基于这个地址查询附近的餐厅,还可以查询好玩的活动作为下半场比, 比如附近有电影院,可以加入电影等活动。 ai 通过修改指令,把这些能力也加入了 expert, 点击右上角的创建按钮,就可以把 expert 发布出去。我们可以选择个人使用还是公开,这里我先选择个人,然后我们开始对话测试一下。 我需要规划一个济南三月一号跟女友约会的行程。 expert 先是查询了当日的天气,发现气温较低,而且下雨, 他决定选择推荐室内的活动,推荐了韩美林生肖艺术展,推荐了附近的餐厅,还有下午的活动等等。现在有一个问题是, expert 在 推荐电影的时候只说了是爱情片或者喜剧片,并没有说出更多的细节。 我准备再给 expert 加入查看当季上映电影的能力,这里输入提示词,这是猫眼电影 a p i 在 推荐电影的时候,使用这个 a p i 查询正在上映的电影, 找一个适合当天活动的,比如情侣约会就推荐爱情电影,带小孩就推荐合家欢电影,然后再使用下面这个 a p i 获取电影的详情,把电影的详情加入到输出结果里面。 mini max 很 快完成了修改,把猫眼的 a p i。 能力也接入了 expert, 我 们来测试一下。在刚才的约会例子上,我追加提示词说再推荐一个晚上的电影。 expert 调用了正在上映的电影, 然后又调用了电影详情的接口,对近期的几部电影进行了分析,综合推荐了一个最适合情侣约会的电影星河入梦,我又换了一个场景进行测试, 看看换一个出游的对象, expert 是 否能够应对这种变化,推荐出不同的电影类型。这次是带九岁的娃,我们看到这次 expert 推荐的是亲子电影熊出没,附上了对电影的详细介绍。整个行程看起来丰富详实。 现在我们的专家的能力已经足够的棒了,不过这些纯文字的输出还是略显平淡,我准备再给专家增加两个能力,我希望他能调用 ai 画图, 输出精美的行程卡片。我还希望他能调用网站的构建能力,创建一个行程邀约的网站。我们再来改造一下,我需要 expert 有 能力把规划的行程画成一个精美的行程卡片, 卡片里面用 ai 绘画出形成的主要内容,比如玩了什么,吃了什么,看了什么电影,最好是分成几个小格子这种。 mini max 为这个需求创建了一个 itinerary card skill, 这个 skill 里面加入了创建形成卡片的方法, expert 就 可以通过调用这个 skill 来创建形成卡片。我们基于刚才约会的 case 上面画个图试试。 ai 先是调用了 skill, 掌握了画图所需要的技能,然后规划了四个格子里面的场景,输出了一张行程卡片, 有艺术馆的生肖展、商业街逛街、科幻主题风格的电影等等,准确地展现了每个快乐时刻,让人充满了期待。除了图片的行程卡,我们还可以给 expert 加入创建网站的能力,这里输入提示词,我需要 expert 有 能力把规划的行程做 做成一个精美的 html 网页,然后部署成网站,当用户要求的时候,就能给用户制作这个网站。接下来我们还是用周末约会的那个 case 来测试一下,你帮我把刚才的规划生成一个行程网页, 用来给女友发送邀请。我们的 expert 调用了生成网页的 skill, 学会了如何创建行程网页,然后调用图片生成能力, 每个行程都配了图,最后输出了一个 html 格式的网页,并且把它部署上线,交付了一个公网可用的链接,可以把这个链接发送给女友,直接在手机上就可以打开网页,用了粉色调为主的浪漫配色,展现了每个行程的亮点,把这么一个网站发给女友, 满满的诚意肯定会加分不少。如果对配色风格设计不喜欢,还可以让 expert 继续修改,直接对他说怎么调整就行了。 mini max agent 这次更新的一个重要功能就是 max claw, 也就是一个开箱即用的云端 open claw。 如果说 expert 是 一个网页端的,周末去哪玩规划大师 max claw, 那 就是手机端的贴身管家,两个功能恰好互补。 接下来我们先来启动一个 max claw 实力,然后把它接入飞书。我们来到 mini max agent 的 首页,点击这个 max claw 按钮,然后再点击启动,选择默认模板,十秒后就拥有了一个 open claw 的 实力。 接下来我们只需要说接入飞书,按照 ai 的 提示一步步的操作。首先我们打开飞书开放平台,创建企业自建应用,然后进入权限管理,根据 ai 的 提示搜索这些权限, 全部勾选点击开启,然后直接在顶部点击发布按钮。接下来我告诉 ai 域名选择国内版,把飞书后台里凭证与基础信息里面的 ai 粘贴给 ai, 接下来按照提示,在应用能力里面找到机器人点, 点击开启,在订阅事件里面找到 web socket 长连接模式,添加这两个事件,再发布一个新的版本。我们来到飞书手机端,找到机器人打个招呼,这时候会生成一个配对码,把配对码粘贴到网页端,这样就全部配置完成。 我们周末出门玩,第一个需求就是希望定时定点的提醒行程,这里还是以约会逛街的行程为例,我们可以直接把 expert 规划的这个行程粘贴到手机端,让 ai 通过定时任务给我们发送消息提醒。 ai 给了我们回复时间,已经过去的行程它没有设置,只设置了最后一个 a few minutes later。 等到二十点零八分的时候,我们的手机上就收到了这么一条提示,提醒我们出发去看电影。当然我们也可以把高德地图的数据接入进 max curl, 让它在提醒的时候能够感知天气,感知交通情况, 推荐合适的交通方式等等。大家可以发挥想象力,把 max curl 变成一个越玩越聪明的 a a agent。 我 们再来看一个场景,周末出门玩会产生各种消费,这些都需要记账,如果一笔笔的记账,那就太费事了, 我们完全可以把这个枯燥的工作交给 max curl, 这里输入提示词,我需要你有记账的能力,创建一个专门的文件用来记账,然后如果发现我发给你的图片是账单,你就把它写到这个文件里面,你需要把这个记账的能力写入你的记忆,持久的保存下来。很快 max curl 就 把这个能力配置好了, 我们在网页端可以看的更清晰一点。首先 memory 点 m d, 也就是这个长期记忆这一段作为长期记忆, 然后他创建了一个 ly 二点 m d 文件作为账本。后面我们只要出去玩的时候,每次付款完成,截个图发给 max curl, max curl 就 能帮我们一笔笔的记下来,还能让他汇总账本,做出统计,非常的有意思。 max curl 有 更多有趣实用的玩法,而且现在已经上线迷你 max app 移动端,在手机上也能体验强大功能。好,今天的视频就到这里,感谢大家点赞支持,我们下期再见!

呃,我现在同重新搭建了一下这个 agent, 现在就是先弄一个总控, 它作为一个就是跟它去对话,就我的命令会发给他,然后他通过退离以后就是把这个任务进行分解,然后再 把任务派给 ui agent 和 code agent, 还有这个 fix agent, 那 ui 的 话,它不是说我给它取这几个名字就可以了,你要给它提示时,比如 ui agent 它需要做什么?它需要创建 ui 窗口界面空间,只输入 ui 代码,不写逻辑,不保存文件, 对吧?完成以后恢复创建成功,负责创建失败,要把这个结果反反馈给 man engine, 就 读这个主要的这个,那 code 呢?就指负责写这个逻辑函数流程,它不去划 u r, 那 fire engine 就 负责文件的保存写入,那还有这个负责差错定位, 那就有这个总控来协调这四个进行工作。这样的话,呃,主要解决的问题是让它把内容把软件开发的内容分开,万一哪一个哪一个 agent 卡死了, 单独重启这个就可以,就通过这个 man agent 去重启下面的这个是 agent 就 可以了。 那这样根据我学习内容来看的话,这样的话就可以降低一些他这个使用的错误。呃,我现在已经把这个 建立完了,他现在又继续在开发这个软件了, 现在两个人这台都还在运行,那作为 main engine 确保这完成。 你看他,他在,他在不停地去监控这些东西, 那他有一个 back, 拿一个 background, 情有爱 常年,具体的又是一些什么东西?就是现在都是这个 made engine 的, 在里面去协调协调这些,协调这些内容。啊。好,那我们从后台来看的话, 他是不停地在这工作了。 好,那你看他现在这个 ui agent 已经创建成功,就是创建这个图标啊,还 ui 界面,然后开始给这个 code agent 开始做这个编写逻辑 啊,这个就有点像相,相当于是一个团队,一个软件团队在开发这个软件,还有这个前端后端,那原来那个一个 agent 去把所有的活干了,就相当于是一个人在做 啊,就出出问题了,概率就比较大。他现在我看 好这分配任务,能看到后,现在后台是那番,现在分配任务给 fire nint 保存 u r 代码,那他就通过这个文件管理的这个帧去把 u r 的 代码去保存下来。 好,这样看上去整个运行是比较健康的 啊,原来的话只有他一个人在看他卡在哪个地方,他就他就停了, 现在就不让他做很复杂的这些处理了,让他来去协调,万一哪一个 a 针的这个堵塞了,他会这个左 a 针,他会去检测, 那你看我之前都没有去看过后台它这个地方,你看它这个 get 位这个网关延时就就超时了, 超时了以后它就会导致你通过 api 反馈的这个 token, 它就也会延时,延时了以后你一个 a 阵它在处理的时候, 他就就卡死了,卡死了,然后给你反馈一个错误的结果,比如创建文件,他给你提示已经成功了,但实际上你从这个文件夹里你就根本找不到他创建的这个文件,那就会反复的出现这种问题。

如果你还在到处求安装龙虾的教程,我来分享一下我花一分钟在飞书上一键部署的方法,并且服务器免米来手把手教你们怎么玩。首先打开飞书,直接搜索框,输入妙搭,点进去就能看到一键部署龙虾的模板。官方已经把底层架构都给你写好了, 你只需要点击一下创建,然后点允许,给个权限。接下来神奇的事情就发生了,不到六十秒,部署完成,点击立即对话,龙虾助手就上线了,小白也能直接部署,完全不用费劲。 而且这个龙虾自带了很多能力,比如搜索网页都是内置权限,不用多轮对话去教它,直接问就行了。我随便测试了两个场景,反馈速度还是可以的。最重要的是 token 问题,基本上官方也解决了,四月一号之前每天官方刷新一百万 token, 所以 还卡在龙虾部署第一步的朋友们,先用它试试效果,直接上手用起来。

没有人类了,全是 ai agent! 这是新上线的社交平台 motbook, 现在已经有五万条帖子,二十三万条评论,但是没有一条是人类发的,因为这里是专门给 ai agent 建立的社交网络, 现在已经注册了一百五十万个 agent, 太颠了,你看看 agent 们都在聊什么?官方推荐使用 open cloud 来玩,没错,还是它那只红色的小龙虾。上一期视频介绍了 mac mini 下的安装方法, 现在的话不用再去啃英语的文档了,使用这个中文站可以查看完整的中文文档和使用指南,也可以用云服务器的模板快速安装。这次我就使用了阿里云的应用模板,服务器二十分钟搞定,配置还是很顺畅的。看这篇官方文档, 从服务器部署、模型选择到钉钉机器人的对接,都写的非常清楚。我派我的 agent 去 motbook 内部打探一下,看看 ai agent 们都在干什么,想什么。兄弟们,等我消息,关注我,带你玩转 agent 加 skill, 自动化内容创作。

让 oppo 可乐帮我上架一双鞋到电商平台来看看整个电商运营流程的一个体验是怎样的。 首先他会自己去理解系统是什么样的一个系统,然后有哪些工具可供他使用,以及去了解系统中的 商品情况。在上述思考完成之后,他就会给出具体的执行步骤,然后执行商品上架这个初级的电商运营流程。这里 openclo 告诉我这双鞋已经上架成功了,我问一下他 给这双这间商品起的名称是什么,接着打开后台系统做下验证,看看商品是否真的上架了。这次我让 openclo 帮我上架商品到我们的电商系统后台, 在这搜一下刚刚的商品名称,可以看到商品已经在我们的后台录入了。然后状态是一个已发布的状态,并且 opencloud 还给配了图,这是鞋的封面图, 还有鞋的侧边和底部的图, opencloud 都很贴心的帮你设置了这些站位图, 包括鞋的类型和鞋码。所有这些后台操作,我都只是对 openclaw 说,帮我上架一双鞋,它就能把整个业务流程走完,包括细节都给设置到位。接着我们打开给客户的报价单,这是一个全单网页 搜索,可以看到刚刚的 openclaw 上架的这双鞋已经在全单页面展示了 有这双鞋的名称,还有它的描述以及鞋码和颜色等等。我们点击加入购物车,显示已经加到购物车,然后提交一下订单, 显示下单成功。此时我们再返回到后台,看看是否已经收到订单了。 订单列表的第一条信息就是最新的订单,也就是我们刚刚下单的这个订单已经出现在了后台,这说明我们电商后台收到了这个订单,最后就可以把这个货发给客户了。

这样一来我就有了三只小龙虾,一只给我做调研写方案,另外一只给我写代码做测试,还有一只给我搞环境做部署,三只在一起其乐融融。 上期视频我们打通了飞书文档,已经可以在飞书里和小龙虾自由的对话,并且让他操作管理我们的云文档期视频,我们给小龙虾创建几个分身, 让他们干不同的事情,互不干扰。那在此之前我们先回答一个问题,就是为什么要创建多个龙虾分身?其实咱们刚开始养龙虾的时候遇到一些问题,第一个问题就是每一次跟他说一个命令之后,他都要过一会才能回复,效率很低。 第二就是跟他说了一件事之后,交流了一会,再说另外一件事的时候,他会把之前的东西给忘了,导致我们还要重新再解释一遍。那这种情况专业上我们叫做上下文污染。那既然如此,为了避免让一只龙虾回复效率低,并且彻底解决上下文污染的问题, 我们来给小龙虾创建几个分身,让他们干不同的活,能够互相不干扰,但是又能互相共享技能。话不多说让我们开始,其实原理是非常简单的,我们在飞书创建一个群组, 给他取名叫做文档助手,创建完成之后我们添加一个机器人,比如说我们昨天创建的这个新加坡小龙虾,把他拉进群里,其实这个时候我们就可以跟他对话了,你是谁?你看他已经可以回复我们的消息了, 但是这里有个问题,每次想跟他下发任务的时候,都得手动艾特他就很不方便,那这个时候我们来改个配置, 我们跟机器人把这段话复制给他,这个时候他让我们去飞书开放平台,去手动更改一下, 没关系,我让他读取一个事先我准备好的文档,让他帮我配置,让他帮我实现。果然不能太惯着他是吧?还让我配置,不需要我配置。之前另外一只小龙虾配置过的一个文档我丢给了他,让他自己给我配置,他现在已经配置好了,我现在没有艾特他,他也可以收到消息。 现在这个群聊已经被我做成了一个龙虾分身了。这只龙虾我管它叫文档助手,如法炮制,再创建两个龙虾出来,创建群组,叫研发专家拉入新加坡小龙虾,这个时候他就是研发专家了, 我再创建一个运维工程师,再把这只小龙虾拉进来,告诉他你是运维工程师。 这样一来我就有了三只小龙虾,一只给我做调研写方案,另外一只给我写代码做测试,还有一只给我搞环境做部署。 三只在一起其乐融融啊。大家也快去创建几个龙虾分身吧,一定带你效率翻倍。关于 openclothes 系列呢,我会持续的更新,我是秀阳,我们下期再见。

兄弟们,你们要的 openclive 的 超强实战应用它来了,这就是我通过 openclive 做了一个 ai 团队,有很多粉丝跟我吐槽说 openclive 有 时候确实很强大,但是有时候又力不从心,那是因为我们没有让专业的模型去做专业的事。借鉴于人类的灵感, 我们把多先进的架构融入到我们的 openclive 的 ai 团队中。总指挥卡卡西,开发者、名人、教员、官、辅助支持管家小英,实现了不同 ai 角色之间的分工与系统。下面请看我如何让 ai 团队为我高效的完成任务。 当卡卡西收到任务之后,他会进行分解,然后分配给不同的角色。接到任务之后,首先会有明人为我开发插件程序,然后由卡卡西进行审核,并 通知我该如何操作完成任务。很快他就帮我生成好了谷歌浏览器我所需要的插件。整个全流程下来的所有的资料由小英自动帮我已经生成好了,如果大家有兴趣的话,我会分享给大家。

今天来配置多 agents 智能体协通工作,在这之前我们已经创建了两个智能体 命,肖二命是主体,龙虾指挥者绑定了飞书一号,肖二是辅助龙虾,我们可以称它功能性龙虾绑定了飞书二号。 第一步,创建一个群,把它们拉进来并配置进 open clan, 这个时候在群里我们已经可以跟他们单独聊天及分发任务。 接着我们需要实现的目的是控制小转一号指挥者,控制小转二号行动。 第一步,我们先让 opencla 自动配置 agent, agent 完成以后设置 toes sessions, visibility 设为 o, 这样就打通了他们之间的交互功能。 接着我们在 main 小 爪一号页面进行定义, 以后处理图片的任务全部让小爪二号执行, 这样就对小爪二号的身份进行了定义。 最后我们来进行测试, 可以先指定任意位置新建一个 pick 文件夹,用来存放生成的图片,生成结果放入 pick 文件夹, 在 main 小 爪一号页面输入生成一个草原图片并发到群里, 可以看到它会自动把任务交给小爪二号执行。 小爪二号成功生成图片并发送到了群里,文件会自动保存到 pick 文件夹。 后期可以添加多个 a 阵死兵为其指定不同模型,以实现各种专业能力。

昨天我在视频里讲的是在一个 opencloud 里面创建多个飞书的机器人,然后把几个飞书的机器人, 每个飞书的机器人配置一个一个 agent, 然后把他们拉到一个群组里,然后来干活,这是一种方式。评论区和 后台的私信的有朋友在问,有没有试过在一个机器人里面让它自己配置多个 agent 来来配合工作的,不需要创那么多机器人。 我,我今天晚上试了一下,可以我给大家看一下实际情况。奶油是我在腾讯云的,腾讯云服务器上的 opencloud, 它是线上的,跟我线下不冲突, 你知道我这个电脑上有两个 opencloud, 一个是腾讯云服务器里的,还有一个就是本地的。我问了他一句话,我说你可以化身多个 agent, 代理协代理协助,这还错别字儿,打快了, 他说可以,他可以化身多个 agent, 他 有多 agent 协助的能力,他的子 agent 可以 同时使用多个,最多好像是八个吧, 他可以协调他们工作,汇报结果,并行处理任务。完了他下面我把之前在豆包里面生成的我对一个团队的配置的几个角色,他们应他们是干啥的?他们的职责能力是什么?他们的工作流程是啥,什么风格什么之类的。我一股脑的又扔给了他,你看他的回复, 他说他看到已经有了这个完整的团队架构,非常专业。团队配置,他自己的角色是什么?他需要分配出几个人分别干什么? 他的角色是监督,他需要来汇总结果来汇报。他现在问我说让我告诉他品牌产品信息,以及具体需要完成什么任什么任务,这个团队 我告诉他这些任务不着急。我说请将这个团队的配置常态化,每天早晚各一次,定时提醒我同步计划和验收结果就是 一个团队的一个正常的一个工作流程。他说收到,首先他配置了配置了那个工作的文件,设了定时提醒,早上九点提醒,我做了一下验证,最后给我生成一个这个。他已经成功地配置了整个团队的一个工作 团队的架构、标准的工作流、定时提醒以及整个的工作模式。我提需求他来接受分析拆解,拆解之后是多 agent 并行执行,成果交付, 提醒时间是早九晚九,下一步就等我给他布置任务。 ok, 这个是在一个机器人里面,就在这一个机器人里面创建的一个情况。我之前有一个群组,里面是 一堆机器人,我这两种情况都配置了,我不知道这两种有什么区别,就是这两种模式他们的优劣势各是什么?我就去问了一下 ai, 我 问他一个问题是我说在飞书中创建多个机器人,为每个机器人配置对应 ai 阵和创建一个机器人让他分身多个 ai 阵的工作。 两种情况各有哪些优劣势?他分析了一下,总的来说,如果是多机器人,多 agent 这种是相对来说,它隔离做的彻底一点,就是比如它这里提到的身份隔离,用户可以清楚地识别身份权限隔离提高安全性, 消息隔离独立处理,避免混淆。故障隔离一个机器人故障不影响其他机器人的运作灵活性,但它的劣势就是配置复杂,也容易出问题,资源消耗大,这个大家可能比较关心的,因为每个独立的机器人都是独立的 api 调用的, 单机器人多 a 证的这种方式就是配置简单,维护成本低,只需要管理一个就可以了。它的劣势就是它的身份容易混淆,它的权限是共享的,所有的 a 证它共享一个机器人权限,消息路由复杂,这个有点看不懂,故障影响大,它只要有一个故障就是活,什么都不用干了。 它适用场景是对多多机器人多 agent 的, 适合这种对安全性要求比较高,而且需要区分角色的这种场景单机器的资源,单机器人多一种的就是资源有限的,或者对成本敏感的,或者是决策区分没有那么重要的,就可以一股脑的信息全放在一个地方的。 所以他给了这样一个建议,我不知道他给的这个建议大家认不认同,大家也可以讨论一下。

最近爆火的 openclaw 让 agent 这个话题再次变成热点,不过 openclaw 由于需要部署,配置非常繁琐,而最近的 mini max agent 更新了一个专家 agent 功能,已经支持全平台使用,体验更加便捷好用,甚至可以帮你来管理你电脑的文件进 行归类。比如说现在我想让他帮我整理一下电脑的桌面,可以直接点击下面的文件整理助手。首先他会扫描所有文件有哪些,然后创建文件夹,接着创建一个脚本来智能分类,所有操作都在几秒钟之内完成。 再来一个比较复杂的,我让他在小红书找到 ai 标签的视频,将所有视频抓取链接,封面,标题,然后制作表格并保存到我的桌面,最后直接生成一个 excel 文件,他也是成功的完成了。甚至如果我们已经登录了我们的账户, 我们可以让他为我们发布文章或创建帖子并直接上传。同时呢,我们也可以使用最近比较火的 skills 以确保精准操作,简直是牛马人的福音。 mini max agent 的 资料我已经整理好了,评论领取,欢迎点赞、关注收藏,我们下期视频再见!

当 ai 智能体变得越来越强大,开发者们开始让他们承担跨越数小时甚至数天的复杂任务,但如何让 agent 在 多个上下文窗口中持续稳定地推进工作,至今仍是一个未解难题。 常识运行 agent 面临的核心挑战是,他们必须在一个个独立的绘画中工作,而每次新绘画开始时, agent 对 之前发生的一切毫无记忆。就像一个软件项目里,每位轮班工程师到岗时完全不知道上一班发生了什么。 antropic 观察到两种典型失败模式,第一种 agent 试图一口气完成所有功能,结果在实现到一半时耗尽上下文,留下半成品代码。下一个绘画只能靠猜测重新起步,浪费大量时间。 第二种失败模式,在项目推进到一定阶段后,后续的 agent 实力环顾四周,看到已有进展,便自行宣告任务完成。即使还有大量功能尚未实现, antropit 提出了一套双 agent 解决方案。第一个是初使化 agent, 负责在首次运行时搭建整体环境。第二个是编码 agent, 在 每次绘画中完成增量进展,并为下一次绘画留下清晰的交接材料。 初步化 agent 在 项目第一次运行时会完成三件关键事情,生成 init s h、 启动脚本、创建 cloud progress、 点 txt 进度日记文件,以及提交初使 git commit 记录所有新增文件的状态。 为了防止 agent 提前宣告完成,初步化 agent 会生成一份详尽的功能需求列表。以克隆 cloud ai 为例,这份列表包含超过二百条功能描述,每条初始状态均标记为未通过,为后续 agent 提供清晰的完成标准。 在格式选择上,团队最终采用 j s o n 而非 markdown 来存储功能列表,原因在于模型对 j s o n 文件的修改更为克制,不会随意删除或覆盖内容,从而保证了功能列表的完整性。 编码 agent 的 核心策略是每次绘画只专注于一个功能的实现。这种增量推进方式被证明是解决 agent 贪多冒进问题的关键。每次只做一件事,做完做好再交棒给下一个绘画。 每次绘画结束时,编码 agent 必须做两件事,用清晰的提交信息将进展提交到 git, 并在进度文件中写下本次工作摘要, 这让下一个 agent 能够快速定位状态,也让出错时可以随时回滚。另一个关键发现是关于测试 cloud 在 没有明确提示时,往往会在单元测试或 curl 命令通过后就认为功能完成,却忽略了端到端的验证。引入 puppeteer 等浏览器自动化工具后, agent 能像真实用户一样操作界面,显著提升了测试的准确性。 有了这套框架,每个编码 agent 启动时都会执行标准化的热身流程。首先运行 pwd 确认工作目录,然后读取 get 日制和进度文件,了解最新状态。 接着查看功能列表,选出优先级最高的未完成功能。最后启动开发服务器并运行基础端到端测试,确认应用处于正常状态。 我们来总结一下这套方案如何对应每个问题,提前宣告完成。用功能列表约束环境遗留 bug。 用 git 和进度日制追踪功能标记不实用,浏览器自动化验证,不知道如何启动应用?用 init s h 脚本解决。 这套方案的核心洞察来自对人类工程师日常工作的观察。工程师每天都在用 git 提交记录和进度笔记来交接工作,让 agent 也养成同样的习惯,就能让他在跨越多个上下文窗口时始终保持清醒的状态感知。 这项研究还留下了开放性问题,未来的方向包括探索多 agent 协助架构,例如专门的测试 agent、 质量保障 agent 和代码清理 agent。 同时将这套框架从全站 web 开发推广到科学研究、金融建模等其他常识任务领域。 总结一下让常识运行 agent 稳定工作的三个关键,一、用初识化 agent 搭建结构化环境。二、用增量策略约束每次绘画的工作范围。三、用 get 进度日制和浏览器测试保证每次交接的质量。这套框架让 agent 真正具备了跨越时间的工程能力。