我一个完全不懂代码的人,今天呢,在可靠的帮助下搭建了一套多 agent 的 系统,不是那种 ai, 一个 ai 假装很多 agent 的 那种 水货 agent 是 真的 agent 系统是基于 python, 基于那个一个黑的窗口的一个真正的系统。 agent 系统就是。我之前不是说呃,我等那个 cloud 出了文稿之后,我会一遍又一遍用,用五六个窗口一遍又一遍的来修修修改这个文本的质量吗?太麻烦了, 我一直要操作。然后我就跟可乐说,你能不能教教我,这就是这个可乐和 gpt, 好 的地方就是那些复杂的技术,他能你,你跟着他一步做就能学会,但是国产的 ai 就 不行,国产 ai 很多技术细节的地方他注意不到, 还是说智能上的差差异,因为小米给了我七七个亿的 top, 我 用不完吗?我,他说那个你要用五个 a 跟他搭,这种修改文本的 top 量会用的很多,我说没事就用。 然后这五个五步骤呢?第一步就是删除多余的四,然后改变对话句式,然后改改标点符号,然后把那个 呃破折号和省略号都删除。一共五个 a 阵的,他们一步一步的在做,全都是调用的小米的 api, 小 米的 tucker, 虽然小米给了我那么多 tucker, 但是我想说的是,小米的 tucker 的 智能程度也只能干这种重复性的工作了, 因为别的让他写文本,让他进行创意性工作,他做不了,他的智能程度全都是像石块一样硬拼拼凑出来的, 跟 cloud 的 智能,跟 g p c 的 智能,跟 deepsea v 四 pro 的 智能都比不了,跟 kimi 的 智能也比不了我,他在呃 cloud 在 教我的时候呢,有有几个坑啊?第一个坑呢,我以为这个 agent 要用不同的模型, 其实不用一个模型就行了,一个模型多次调用就是 agent agent 集群,而且那个任务呢,必须要拆分,要不然呢,模型就算你偷很多,模型也会偷懒。 后面呢,那个 windows 那 个黑窗口叫啥我都不知道, python 也不知道是啥, cmd 也不知道是啥, cd 也不知道是啥可乐,就一个个给我解释 他这个智能的,为什么说他智能程度高呢?因为你在做每一步的时候,他都给你列出来你有可能在哪一步犯错,这就很大的减缓了你这个学习的时间,让你快速的能学会。 因为我之前调一些 api, 之后调 kimi 的 api 或者啥,常常填错那些关键的信息,比方 kimi 的 api, 我 用了三天才真正的把它填进了 kimi 的 桌面端,但是我用 kimi 的 教我 第一次也是填小米的 api, 也是填错了,但是呢,他教我,他把我犯的那个错各种错的一步步都说出来了,然后很很快就完成了。 完成之后呢,我以为就结束了,我以为在那黑框里交互就能直接跟大模型说话,想跟他说话他就他就会工作了,我就打我说兄弟你是什么模型,结果那个那个窗口都不回答我,因为他是个命令行,然后可恶的告诉我说,你得输入什么 python 啊,这这些东西之后再输入你的命令,然后弄了一大圈之后 终于弄成了,他现在正在已经把我最新的一张文本整理完了。第一步, 删除主语,净化缀词。第二步,重构对话,第三步,去 ai 位,第四步去 ai 排比与省略和折号。第五步就是改标点,把碎片的好多 句号他好多用好多句号都删除,这是咱们从一个技术小白向技术即刻迈出的重大一步,值得庆祝。
粉丝1.2万获赞5.4万

如何在 hermes 当中配置多 agent, 实现不同能力的 agent 讨论同一件事情或执行同一件事情,类似于这个样子,比方我建立一个产品方案讨论时,我在里面创建了四类角色,当我去发布一个事情的时候,我可以艾特指定角色进行回复, 也可以让其中有一个角色调动其他人,这样就很具想象力的。那怎么设置?总共分为三步,第一步,在这个页面里面我们去创建用户,相当于就创建一个 agent, 点击这个地方, 你只要去定义他的名称就好了。第二步,很关键的事情,你需要去定义他能做什么,比方说我定义第一个产品经理,他的身份是什么样子,他能做什么已经不能做什么。 第三步,我们就只要在这个群聊里面去建立这样一个场景,把不同角色的人去拉进来,类似于这个样子,你把刚才创建好的这个身份去把它添加进来,这样一个群就创建好了,很简单,对了。

兄弟们,这是一个在 github 上热度很高的多 agent 调度框架,通过它可以把 cloud code 武装成一个超级开发团队。它内置了九十八个专家 agent, 覆盖从架构设计、文档拷写、研发、测试到运维的全链路。 并且这些 agent 不是 孤立运行,它会通过一套类似女王领导蜂群的机制,由核心 agent 整合分工,让所有 agent 共享集体记忆,然后通过共识算法达成一致,有序稳定地完成复杂任务。 在性能方面,它集成了基于 h n s w 所隐的向量记忆,能在亚毫秒级完成记忆解锁。配合其自主学习机制,系统会自动从历史任务中提取成功模式,沉淀为可附用的经验,应用到未来的工作中,持续提升任务处理的准确率。 另外,它还支持 a 阵联邦,可以把不同机器上的 a 阵连在一起,让它们在确保各自数据不泄露的前提下,远程协助,共同完成一项大工程的开发。 具体怎么使用呢?你可以以插件的形式把它安装到 cloud code 中,然后你正常使用 cloud code 就 行, 它会在底层默默起作用,根据任务类型智能调度各个 agent 完成工作。你也可以直接用它提供的 web ui, 以对话聊天的方式启动 agent 蜂群,帮你干活。这个项目采用 mit 协议,完全开源,免费。

这节我们从零开始搭建一下 ic 的 工具所需要的一代环境。首先我们需要配置的是 shell 的 一个环境,也就是 ic 的 工具执行命令的环境。 在开始之前我们需要知道 ic 的 工具最兼容的 shell 是 bash, 然后 ic 的 工具在工作的时候有的会使用默认的 shell, 带来的问题就是如果你使用的是 fish 或者 not shell 之类的现代化一点的 shell, 那 么在它执行命令的时候就会有一些因为 shell 环境引起的问题。 windows 对 于 ai 编辑工具的兼容性很差,很多问题也都是自带的 power shell 和 bash 不 兼容引起的。这时候我们其实就应该知道 ai 环境下的 shell 应该怎么选,最优解其实就是 bash, 其次是大部分兼容 bash 的 z shell, 那么 bash 和 shell 应该怎么去选?如果说你现在使用的就是 shell, 那 么就不用去动,否则就选 bash, 因为 bash 提供的自动补全。高亮显示,我们可以使用 resh 进行一个支持啊。主题的话可以使用 slash shift 配置,让我们开始安装这个 bash, 我 们打开这个官方的一个文档, 根据官方的文档进行一个安装, 让我们扫它一下。 ok, 这个时候可以看到自动补全和这个高亮显示已经是有的了,看起来没有问题,然后这个临时目录就可以删掉, 下面让我们来去把这个效果美化一下。我们使用这个 snapchat, 我 想打开它的这个官方网站,换成中文, 然后使用它默认的这个安装命令安装一下。 这边它的配置方式的话,是在这个八十二 c 最后添加一行内容的话,已经把这个命令写好了, 同样扫死一下,这时候可以看到我们这个炫耀的这个呃显示效果已经变了。然后我们可以去社区配置分享里面找一个这个好看一点的主题,把它替换一下, 可以看到实际上呃已经变了,这边显示的乱码实际上是因为我们没有 note 字体。 然后我们去安装一下袋子的一个字体,这边的话有一个 get 仓库,嗯,正常情况下的话,你可以根据你的一个呃需求,然后找一下你自己想用的一个字体, 它的字体和咱们普通字体的差别的,就就是说它把这个呃图标也加入到了这个字体里面。然后这边我们呃继续使用这个 get brands 的 一个字体, 用这个仓库拉一下, 创建一个本地的字体目录,把这个下载的字体文件夹到对应的目录里,然后这个下载的压缩包就可以删掉了。我们刷新一下字体, 这个时候把这个终端关掉,打开一下,然后去这个首选项里面把这个字体配置一下, 可以看到实际上嗯已经变了。这里还有一个问题,是啊,如果你选择的这个主题是在是带这种 powerline 的 主题,光图默认的这个特密欧有一点兼容性的问题,就是这个地方会有一点错位,你可以安装 kitty 或者 icloud 之类的特密欧进行一个使用,我这边就懒得去装了, 然后把它这个主题换成一个呃简洁的一个主题, 这边使用这个 java 吧。 然后第二步的话是我们需要配置 node js 的 一个环境,很多 agent 自己是就是使用这个 node js 进行一个实现的,还有很多技能中使用的这个脚本也是用 node js 去写的,因此我们需要安装 node js 的 一个环境,这里我们先去装 nvm。 n m 是 node js 的 一个版本管理工具,我们不同的项目可能是呃,需要使用不同的 node js 一个版本,这个时候就不能简单地安装一个 node js 到全屏目录下面了,因此这个呃标准的解决方案的话是使用这个 n m 进行一个管理, ok, 然后按照它这个提示来搜索一下我们的八十八 c, 然后 n m 和看一下,实际上 n m 我 们已经安装上了, 这时候我们安装一个 l t s 的 一个 note g s 的 版本, 用的杠微测试一下, ok, 已经安装完了。然后我们需要安装的是这个 p n p m 和这个自带的这个 n p m 相比, p n p m 更快,然后也更省这个磁通空间。因此我们这个 note g s 的 一个包管理可以选择这个 p n p m, 然后我们这边用这个 n p m 安装到全聚 安装完成,同样去验证一下, ok, 没问题。 这里需要注意的一点的话是这个呃,回头我们安装完 agent 的 这个客户端工具之后啊,需要给他的这个全局的规则文件添加一行,告诉他我们这个 nojs 的 环境用的是这个 n m, 然后我们的报管理器使用的是这个 p n p m。 接下来我们需要安装这个 python 的 一个环境, python 也是必须要装的环境很多的,这个技能的脚本里面使用的是 python, 然后 python 的 包管理器和工具我们就选择 u v 就 可以, u v 的 话是用 rest 去编写的,然后它呃又快又好,就等于之前讲了 node js 中的这个 n m 加 p n p m 该干的活它都干了。 ok, 安装完了,这边按照它的这个命令,我们需要去执行一下这个, 然后让我们来 u v 试一下。 ok, 这个命令已经装上了。 ok, 我 们终于可以开始安装爱奇艺的工具了。这里的话根据我们自己的需求进行一个安装。我这边的话会把 colotodog 的 布袋子,欧根扣的都安装一下, 让我们从 colotodog 的 开始,因为咱们这个频道目前的定位是省钱,所以说咱们用不起 colotodog 的 套餐。这里我们安装一下 cc switch 下一个第一批的包 来,完成之后直接执行命令安装一下, 然后我们打开 cc switch, 然后我们添加一个供应商,这时候根据你自己有的 callin 去选。然后我这边的话是 mini max, 我 复制一下我的 tokyo 的。 ok, 这时候让我们开始安装 kol 的 code。 对, 安装完了,我们执行一下 kol 的 命令。 这个界面其实我们已经可以看到我们的模型已经变成了 mini max。 二点七,说明咱们刚刚在 c c 四位置里面的配置是生效的。那 hello, 测试一下 啊,没有什么问题。然后这个时候我们可以让模型自己把这个啊,我们 node 还有咱们 python 的 这个缓存说明给加到全屏的一个内存文件里。 原格式的话,我们使用 p n p m 安装, p n p m 的 话需要 tab 一下才能安装到全屏。 这里我的一个安装命令写错了,打一下 扣代码的话,因为我们还是一个省钱打法,我们没有 g p t 的 一个套餐。然后我们使用这个,使用这个 openroot 可以 到这边找一下这个, 然后选择我们行的模型,然后我们使用这个模型 同样去打开这个 cc switch 里面加一个。然后我们使用的是 openroot 模型的话换成这个。 然后我们需要回到这边创建一个 i p i k 然后我们使用 ctrl s 命令,这个时候可以看到实际上这边模型已经变成我们切换的这个模型了。然后让我们 hello 测试 一下这边,因为我们实际上没有用 t p t 官方那个模型,这边提示的是原数据未找到,但是没有什么太大的影响, ok, 也没有什么问题。然后我们直接安装勾勾的, 官方扣的默认有免费的模型可以用,嗯,擦一下, 嗯,没毛病。 到此我们就把 iint 的 运营环境搭建好了,在开始实操项目之前,我们还需要补充一下前置的相关的一些实用知识,我这边不会给大家去做 iint 的 相关的一些实用知识,我这边不会给大家去做 i ppt 这东西还是得自己上手看一万遍,不使劲练一下其实就等于没看。因此下一节我会给大家分享如何使用 colode code 学习 colode。

hermes agent 多 agent 实战创建、部署与配置完整指南今天我们来学习如何用 hermes agent 创建和部署多 agent 系统。 先了解三个核心概念, profile 是 独立的 agent 主目录,拥有自己的配置、绘画、记忆和技能。同一机器可运行多个互不干扰的 agent sub agent 通过 delegate 下划线 test 派生的独立实力,拥有隔离上下文和受限工具级,仅返回摘药给主。 agent。 orchestrator 是 可继续委托的编排器类型,可以生成多层树状结构。 安装非常简便,一键安装命令,自动处理所有依赖项,包括 uv 包管理器, python, 三点一一, note js, rip, grab 和 fu pack。 安装后用 hermes 命令开始聊天,可以用 model tools, gateway, setup 等命令进行配置。 hermes 支持二十多个 l l m provider, 包括 open router, entropix, google gemini, x, a i, hugging face, minimax 等认证方式,支持 a, p, i, t 和 off。 用 hermes model 命令可以交互式选择 provider 和模型。创建 agent 就是 创建 profile, 可以 创建空白 profile, 也可以克隆现有配置 profile 数据目录包含 config, ml, soul, md, sessions, memories, skills, crown 和 locks 等。目录创建后会获得命令别名,比如 c i, l i。 用 hermes 命令单次查询用 hermes chat q 加查询内容,恢复会话用 hermes resetq 加查询内容。 gateway 后台服务,支持十五多个消息平台,包括 telegram, discord, slack、 whatsapp 和 email 等。推荐一个容器对应一个 profile, 完全隔离 生产环境。推荐 docker 部署一个容器运行一个 profile, 通过 volume 挂在数据目录后台运行。命令设置自动重启资源限制,建议内存二到四 g cpu 二核显卡两 g 以上 升级只需拉取新镜像,然后重建容器。 delegation 配置是核心参数, max 下划线 iterations 控制每个子 agent 的 最大调用轮次默认五十。 max 下划线 concurrent 下划线 children 设置并行字 agent 数量默认三。 max 下划线 spawn 下划线 dex 控制委托层级深度设为二,才能支持嵌套的编排器。 注意, max 下划线 spawn 下划线 dax 为三,且并行数为三十,最多可达到二十七个并发叶子 agent, 成本会成倍增加。 来看一个完整实战案例, gighub p 二自动审查系统架构式 cron 定时触发 hermes agent 调用 gighub c l a 获取 p 二和代码差异,然后使用 call review 技能进行审查,最后发送结果到消息平台。 调度策略可以是每两小时工作日、每天特定时间或每周一汇总。什么时候用 delegate 下划线 test, 什么时候用 execute 下划线 code, 需要推理判断的复杂任务用 delegate 下划线 test, 它有完整 l l m 推理循环和隔离对话上下文机械性数据处理用 execute 下划线 code, 只有 python 代码执行 token 成本较低, 经验法则需要判断力就用 delegate 下划线 test, 机械性处理就用 execute 下划线 code, 最后是最佳实践。上下文传递要完整,不要只说修复错误,要告诉子 agent 文件路径错误信息和关注点。 工具集要根据场景选择代码工作用 terminal 和 file 研究用 web 全站任务用全部。还要注意同一 profile 不要同时运行两个 gateway, 避免并发写入问题。 总结一下, profile 实现多身份隔离, subagent 提供独立推理能力, orchestrator 支持多层树状,委托 docker 部署确保生产环境隔离。 crown 加 walk, hook 加 skills 构成自动化工作流。

当被面试官问到如何去使用当前 gs 来实现一个多工具 agent, 多工具 agent 包含哪些工具呢?比如说多 agent 包含,呃,天气查询计算器,还有呢搜索等等啊,并且还要你能够保证返回最终整合的结果,看你有没有清晰设计这个 agent 的 框架的思路。 遇到这个问题呢,不要慌啊,先分析它的考察点。第一点呢,其实就是我们前面就跟大家强调过智能体,智能体其实就是一个循环调用,不同模型匹配出来的一些工具,就是一个智能体,对吧,可以这样去简单理解。那么所以对于考察点来说,第一个点,这个问题考察的其实就是 agent 的 架构设计, 包含什么呢?从模型到规划,再到记记忆存储啊,就是上下文存储,再然后到工具调用,叫 tools calling, 这就是标准的 agent 架构设计的要点,分为这样几部,再然后考察一个点是什么呢? react 模式, react 思考,行动观察,循环 思考,行动观察,循环啊,那有了这些基础以后,你就能够自定义工具, 自定义啊,自定义工具了,自定义一些什么工具呢?天气查询工具,计算器工具,搜索工具等等等等,只要你想到的那些工具,你都可以去自己去定义啊,自定义工具, 再然后呢,多个工具能够协调,并且呢并且结果整合,这些都是由智能体来做的哈,好,这是考察要点,先掌握 agent 架构设计,再掌握 react 模式,再掌握如何去自定义工具,最后掌握多个工具之间的协调,并且呢,结果整合如何去做 好?那我们现在来看到具体的具体思路,先理解 agent 的 核心架构, agent 的 核心架构呢,围绕这样几个点啊,第一个最核心的部分就是 智能体所对应的模型,核心是模型啊,然后呢三个支撑点,规划、记忆和工具调用。 所以说其实 agent 它的整体的执行的过程和架构的话,我们可以总结为这样几步。然后呢,在 long chain js 里面, agent 的 执行循环 react 框架呢,它遵循的是思考行动,观察整个循环机制,这就是大家在回答面试官这个问题的时候重点梳理啊,给大家放在这了, 一个核心,三个支撑什么呢? agent 等于大模型加规划加记忆加工具调用,那你就记住它就完了个那个不管是像 codex 还是 cloud, 它其实都是在这个基础上去做的调优和优化,包括大家现在听说的什么 harness engineering, 它其实也是在这个基础上去做的改造和优化 啊。好,那么首先呢,我们在设计这个 agent 的 出场流程的时候,我们先要知道,比如说用户输入问题以后, agent 呢,会将这个问题拆解成 不同的这个小的子问题。然后呢,包括你目前已经有的那些工具列表有哪些?这时候基于 react 的 指令模板呢,来组合并且完成出实化发送给大模型,模型会根据当前的信息进行思考。最后呢,输出下一步的行动计划,比如说要去调什么工具啊,要观察什么样的结果等等。 当然在我们的 note 键里面呢,它其实已经内置封装了工具调用啊,所以我们不需要去额外还要给到它什么我有什么工具什么处理不需要这个我待会给大家去看最终的演示代码,演示代码看完之后大家就知道了啊, 用户输入问题后,等到最终模型一步一步的把答案输出来,这是整个结论,大家要需要掌握的它的整个过程啊, react 模式整个过程是什么样子的? 这部分掌握以后呢?在工具设计层面,你需要去自定义工具,比如说你可以先做一个基础工具,在基础工具上你实现了 run 方法,什么 a run 方法就是异步执行方法啊,然后呢,给每个工具呢定义一个基础的数据,比如说他必须要有名称,必须要有描述等等这些信息, 这些信息呢可以基于大模型来去做决策啊,比如说我现在要查询天气的话,那么我就可以去直接调我封装好的天气的工具,而这个天气的工具呢,他又 本地啊,在本地其实又是调的远程天气的 api, 这样呢就能够在我们的智能体中间来访问明天或者未来天气数据了。 这是工具的设计层面,那多个工具的协调呢?我们需要设计合理的工具选择策略,让大模型啊来根据你的输入,根据你的工具工具列表来选择应该得到什么样的工具来执行。那这个呢,其实在 nink 那 一层啊, nink 它已经帮我们屏蔽掉了这个复杂度了啊, nanq 其实屏蔽了 什么复杂度呢?它不需要你去给大模型指定说你有什么样的工具列表,然后呢怎么去执行它?没有,它自己去内部已经帮你做了,而它做的处理的是什么呢?它能够去建立一套完整的工具的分类体系,然后呢再根据你的提问 能够自动的去适配来选择合适的工具,等到后续再来执行这个工具,当欠中间他帮我们一起解决的问题啊。好,那么结合这整个机制呢,就能够去回答这个问题,怎么样去实现一个多工具的智能体, 怎么样去封装自定义的工具来实现一套清晰的 agent 架构?当然如果说后续啊,我们还要去设计不同的整合策略啊,比如说你的这个拼接的话,不是简单拼接,而是要通过有这种对应的工具优先级来去拼接。 还呢,比如说我们可以通过内容摘要来拼接,这些都是需要在 agent 中来实现相应的处理逻辑的啊,这是多工具的 agent 执行的话,它需要留这个处理的一些具体的细节。呃,同学们也可以呢,基于 codex 或者是 cloud code, 或者是呢基于 open cloud 来去了解一下它们这种通用型智能体在执行的过程中代码是怎么样的。 那在这个里面主要是的话,其实就是考察大家在 agent 的 核心架构层和 react 循环机制层的积累啊。另外呢,自定义工具会不会定义,再就是工多工具的整合方法,以及在链签里面来实现一个 agent 整个流程是什么样子的? 好,我们把它整合的知识点给大家梳理一下,最终呢我们来看对应的代码施力,这个代码施力呢,会详细给大家去说明如何去自定义 工具,如何去构建 react agent, 然后呢如何去使用这些工具,如何去调用这些工具好这份代码呢,我们可以一步一点一点的来看,先看到自定义工具,这部分我们可以基于当前提供给我们的 tool 来定义一个,比如说计算器工具,那这个计算器工具呢,对应的 名称描述和入参都需要有啊,有了这个入参以后,接下来在这个 expression 里面呢,就能够拿到这个 需要去被执行的计算的表达式,然后我们就可以去计算这个表达式,得到这种效果啊,得到这种效果,好,那我还可以呢,查天气,假设我们现在有一个假的天气预报啊,就是假的,我们其实可以在这里呢调用真实的,因为这本身其实就是一个异步的。 那么我们在这呢可以定义一个 getweather 的 工具,来查询城市的天气信息。这个 schema 呢,就是来给到你一个 city 的 入餐和 date 的 入餐,就比如说北京,然后呢今天的天气或者明天的天气,或者后天的天气啊,有了这些入餐进来模型呢,会去识别你的一个提示词,看你的 城市在哪,看你的日期是多少啊,最后把城市和日期 c 到你的日期是多少就可以了。 好,这是天气的工具。然后呢还有 rag 的 工具, rag 工具呢,其实就是去读取你的 rag 里面的信息,当然我们这里是默克的啊,这里按理说应该要去知,真正去匹配你的 向量检测和你的知识库,在这儿来生成数据信息得到之后呢,再返回,回去那 query and topkey 默认返回多少条获得,获得以后把工具呢集成进来,这就是一个工具集,多工具工具集以后我们接下来就可以基于 non graph 呢,来构建基于 react 模式的智能体,它是基于编和节点来组织的,那刚好呢,其实对应到我们这一套,呃,这个 non graph 和我们这里的内低费 ai 应用引擎编排的实战很类似,很接近啊。那大家如果说学习这部分的话呢,能够掌握的点学下来以后,不仅能够去用 nunchin, 你 还会自己去写一个类似于 nunchin 的 工具啊,你还能自己去写一个类似于 nunchin 的 工具,这就是价值点。 好,那我们定义好了这些方法以后,包括呢?节点,那这就是智能体节点,叫 agent node 节点,然后呢,我们再把这个节点加入进去,那我们前面一直在说调用循环,调用循环,到底什么是调用循环呢?这里就是一个调用循环, 调用循环来看是否还有下一个工具要调用,有的话继续调,没有的话就终止了,那 return 一个 end 就 表示在这儿终止,否则如果你的调用的工具还有,那就会一直调用,一直调用,一直调用,直到把你所有的工具调用为止才结束,这就是叫循环调用 好,循环调用完以后,最后构建完整的一个状态图,这就是一个调用状态图,从节点到边,大家从这里可以看得出来啊,从那里开始 start 到 agent, 也是从开始节点到 agent 的 节点, agent 节点,再到循环节点,循环节点,再到工具节点,工具节点再完完成最终的这个 return 啊,在这里 return 好, 那如果说我们在执行过程中需要有记忆功能,那我们就需要设置一个叫 memory server, 专门来去记忆 记记忆的内容,把它存进去。最后我们在用的话呢,就可以这样来用,比如说我们要计算一个表达式,我们就可以问请问计算它等于多少?那这个时候呢?其实这一部分内容就接下来会归我的工具来执行,计算出来结果。 天气问题的话可以基于我的天气工具,知识库问题可以基于我的知识库的那个工具来完成。那如果我们要去做多人对话,并且呢自动去记住上下文的话,我们可以基于 run agent, 那 上海呢?这个时候他其实就知知道你在问天气,问上海的天气,因为你看北京天气怎么样,再然后 他说那上海呢?他就会自动去看你的上下文,看他之前说过北京今天天气怎么样,那自然而然他会联想到是上海的天气怎么样,他自动去 推导出来,你问的是上海天气怎么样,然后呢执行给出你最终的结果,这就是一个标准的多工具 agents 开发的流程,市力代码以及完整的考察点和解析思路分析。

这几天做了一个多维建的协助的系统 demo, 方便我把之前实现的多维建的协助的脚本代码可以应用在这样一个系统当中,方便日常使用和观察发现问题。 同时在反复的优化过程中,可以切身的体会多维建的协助的一些难点。然后本期视频主要简单过一下这个系统的运行流程。第二就是关于实现这些多维建的协助所会遇到的一些挑战。 使用时我们需要先创建角色编辑的,再创建写作方案,去关联我们需要的编辑,最后再和我们的方案进行交互。 这里我已经创建好的几个典型的角色编辑的,比如设计师、产品工程师,他们每一个都有自己的职责及系统体式词,然后工具这一块内置了一些工具,还没有完善这一块的体系,然后进一步我们就可以去关联这些编辑进行写作。 然后我们在这里进行创建方案写作模式。这里实现了四种,第一种简单路由,他会把用户的问题转交给一个微简的全权处理。第二种静态计划,他会事先将用户问题拆分成一个计划表, 依次安排 a 检测去执行表里面的内容,直到表里面内容全部完成。动态监督和同伴交接是更依赖于大模型的一种灵活结构,可以在后面使用时再进行介绍。那我们先来创建一个静态执行,去勾选我们的 a 检测 nice, 测试一下它的一个执行过程。 这一块左边呢就是我们的一个写作的内部的一个图结构,在运行过程中可以看到他的一个流转情况,最右边呢,他是运行过程中的一些事件都会在旁边显示,我们可以帮他去帮我们完成一个简单的任务。首先呢,他帮我们去做了一个计划, 然后他后面逐步会按照这个计划表安排不同的文件的去执行。 ok, 他 现在完成了,然后我们可以去桌面上看一看,看这应该是正常完成了, 还有音效呢,再来尝试一下。第二种模式呢,就是动态监督,动态监督呢,他会由这个管理者去判断是否执行完毕,他会依次的去思考下一步该做什么, 安排围警的去行动,行动拿到结果之后,他再去思考下一步在该干什么。那现在就来试一下,也是用同样的任务来看他的一个执行情况。嗯, 他也是先把任务拍给产品的,但是他也有可能直接拍给工程师,这个取决于他自己的一个判断,只是我给他偏向于是尽量能用到更多的角色失败。 ok, 我 们来看一下效果,也是可以用我们来看下一个,我们来创建一个。同样我们也是用 之前一样的任务来测试,他呢是首先会把任务先下发给团队里面的一个角色,然后呢由这些角色相互去委派,最终共同去完成任务。和动态监督相比,他摆脱了中心化的控制,每每个人都可以相互去委托, 然后我们也来用同样的任务来测试一下,看他的执行情况,他也是第一个传给了产品,然后他又传给了设计,这次和之前不太一样,现在开始到工程师了,他这里还比较讲究,他在写来的密文档出错了 哦,头肯用完了,不过他刚刚好像已经完成了,我们来看一下。嗯,也是没什么问题,正常完成了。那最后就来聊一下关于多危险的写作,可能会遇到了一些挑战。第一呢就是上下文太多可能会导致核心指令的失效,可以从四个方面来去优化。 第一呢就是关于任务的一个准确性和具体性,可以按每个微检的去派发子任务时,要求对于子任务的一些属性,比如需要有操作对象,具体内容,是否需要产物或者验收文。 第二呢就是关于体字词的位置,我们可以将当前任务放在最终体字词的下方,确认我们的指令是在整个上下文当中是最新鲜的存在。 第三呢就是我们需要做好提示词管理,方便发现提示词的问题,比如说各个视力的一个一致性,避免某个视力误导,导致该状态的输出异常。 第二呢就是工具的误按问题,很多时候我们装的一些 scale, 它可能在关键字上有某种匹配,但是在业务上实际上是完全无关的,这会影响大模型的选择。那么尽量我们遵循最小的原则, 给每个 a 键的只安装当前职责所需要的 scale, 避免技能误按。第二呢就是提升模型工具的选择能力,当然这是一个长期优化的一个问题。第三个问题就是他只分析不执行, 这可能由于我们过度强调了关于他的一个输出格式,所以导致他的注意力丢失。同伴交接的模式当中,由于每一个 a 键的都要向 中央 a 检测一样,它可以去派发任务,所以它的输出一定是要满足某种格式,但是此时我们又要求它去完成事情, 这个时候两个注意力是没有办法同时存在的。如果我们需要在一个任务当中有两种注意力,那么我们需要把它拆分成两次交互,这样可以保证每一次的准确性。最后一个问题就是任务终止异常, 他可能输出了任务终止,但是呢,实际上任务并没有完成,或者说他任务终止之后他表达的内容是下一步该做什么,但是他却没有把这个下一步在刚刚的执行中去完成。 那么需要我们在指令生成的过程中可以给他加一个继续的指令类型,这样在 agent 生成指令的过程中 就可以看到有继续的选择,这样就不会产生异常终止。就目前来说,多 a 剪的写作确实还存在一些问题,在实用性方面还有待提升,需要等待后续大模型能力的一些发展。

如何把多个 agent 直接塞进飞书群聊?你发个消息,一堆机器人自动跳出来帮你干活。今天咱们搞定多个 agent 和多个飞书机器人,这是飞书开放平台,我们要点击开发者后台创建企业自建应用,我这里有非常详细的步骤,我给大家再演示一遍应用名称,比如情报采集小助手, 我们描述一下,这是 open cloud 情报采集机器人,给他选一个图标,比如紫色,好,这样的,你也可以自定义一个图标,比如你给豆包说我要做情报采集的飞书机器人,帮我生成一个图标, 比如你相中了这个,你就可以下载它,我们点击创建,点击凭证与基础信息,你就可以看到自己的 app id 跟 app secret, 这后边和 opencolor 关联的时候要用到。我们给应用添加机器人,选择添加应用能力,这里有机器人,你选添加, 你发现这边多了一个机器人,就在添加应用能力下面。然后选择权限管理,我们给这个应用配权限,点击开通权限,把即时通讯相关的权限全部打开,这里搜索 i m 冒号, 我们全部选中,点击确认开通权限,这时创建版本才能配置生效。我们点击创建版本一点零,点零,我们这里给个说明,创建机器人开通权限,下面点击保存确认发布。 来到飞书端,这里有一个提示,自动应用发布申请自动审核通过。情报采集小助手,选择左侧通讯录,我们在左侧通讯录这里的搜索框输入情报采集小助手,他就出现在这个聊天框中,但是你现在还不能给他对话, 我们要修改配置文件,这个配置文件是 opencloudingjackson v i opencloudingjackson 我 们这里主要做两件事情,创建新的 channel, 将这个 channel 绑定到特定的智能体,详细步骤贴在这里了,你要找到 channels, 找到它之后,我们看到下边有一个 accounts, accounts 下边 如果你要新增一个通道,新增一个 channel, 哎,比如说我原来有一个 support 口令,你现在又多了一个 collector, 你 要新增一个, 后边呢?还要绑定,我们先新增,找到 channels, 找到 accounts, 大家一定要对照这里,不能出错,出错网管程序会报错的。我们找到了 channels, 也找到了 accounts, 大家看清楚 default, 这是你主 agent 对 应的那个 channel, 它这个括号之后有个逗号,然后这边呢?这是那个扣的这一对,我们这要给他加一个逗号。 我在这里新增通道,大家模仿上面的格式,你要怕自己名字记错,你就 open color agent list。 我 们这有一个 collector, 我 现在就是要给他做配置,所以这里我就写 collector, 注意拼写要对,然后冒号,右划括号, 左划括号。剩下咱们就照抄,这个 app id 一定是你的飞书机器人的 app id, 这个一定要对情报采集小助手 app id 复制粘贴, app secret 也是复制后边机器人的名字 bot name, 我 就直接写 情报采集小助手,剩下的照抄就行,可以中英文我们保存一下,重启一下 get 位,如果成功,就证明配置文件写的是对的,没有问题。我们看一下状态 好,显示 running, ok, 接下来继续配置我们的飞出机器人,包括他的事件回调也是照着我们手册来就可以走一遍啊。点击事件与回调订阅方式长连接保存, 现在使用长连接接收事件,点击右下角的添加事件,然后我们输入接收消息,大家要打这个勾,这样我们才能够收到消息啊。打勾之后点添加,然后权限管理,开通权限,输入通讯录基本信息,这个都给大家写好了,详细的步骤,勾选, 确认开通权限好,再确认重新发布版本配置才会生效。这里是一点零点一,已经给了一些说明,我们加上情报采集小助手, 点击保存确认发布。看到我们的飞书当中有了一个提示,说应用发布成功,接下来要把特定的 agent 绑定到特定的通道上, 继续看刚才的配置文件。 open colordician, 找一个 bandits 通道和 agent 的 绑定就是在这里我们看到这一段花括号是描述 man 的, 就是主 agent 和它的通道, 这个是描述 code。 那 我们现在需要增加 collector, 我 的教程当中都给大家写好了,我们再做一遍,先写一段画括号,注意中间的是逗号,隔开最后一个,这没有逗号。配置文件的格式还是比较细的,大家耐心一点。下边 我们 agent id, 我 这是 collector, 拼写一定要对,然后逗号,然后 match channel, 非输逗号 account id collector, 我 故意名字起的一致,这样不容易出错。网关重启,配置生效,我们可能 get rid of restart。 我 们给新的智能体通话已经回复了,他说开启了一个新的 session, 我 用的是贴着暗面的 kimi。 二点五,那我说你介绍一下自己,大家看到没有,因为我之前配过一些模式,它默认也是运行在贾菲斯模式, 非常好用,这就是数字化办公,以后让机器人帮你打工,你负责更多有创新的一些工作。下次我们分享多 agent 的 之间如何通行和协同。对于智能体开发来说,是二零二六年最热的 am 热点,我建议你一推一款具体的智能体,比如说 open color, 一 推一,它 来了解如何创建智能体验,智能体验之间如何学通,如何做经典的这种落地的案例,这是最快的方式了。那么我们的 open cloud 开发与实战教程当中,给大家梳理了安装配置,怎么创建自己的 skill 啊,怎么安装一些必备的 skill, 包括它的一些心跳机制啊, 定时任务啊,各种各样 o p c 的 案例啊,是可以从入门到落地的。如果你觉得还不过瘾,清华大学的一百八十九页蓝皮书,你作为一个查漏补缺更多的在各个场景当中的落地方案,各行各业还有多 a 证的一些玩法, open club 跟 club code 的 黄金工作流,他们两个如何去互补?有需要的小伙伴可以预约领取,练起来,加油!

大家好,今天我们聊一个非常实际的话题,如何使用 agent 去接管你的电商店铺,真正实现自动化。很多人一听到电商自动化,第一反应可能是,是不是自动回复消息,是不是自动改价格,是不是自动生成广告关键词?这些当然都算,但还不够真正有价值的。自动化,不是让一个工具帮你做某一个动作,而是让 agent 理解你的店铺数据, 理解你的运营目标,然后持续帮你分析、判断、执行,甚至在必要的时候提醒你做决策。以亚马逊店铺为例,我们可以把自动化分成三层。 第一层是日常运营管理自动化,这部分主要通过亚马逊 a p i 把店铺里的核心数据接入给 agent, 比如订单数据、 f b a 库存、 sku 信息、商品价格、配送状态、退货情况、库存周转天数等等。 过去运营人员每天要打开后台看订单有没有异常,库存,有没有断货风险,哪些 sku 最近销量下滑,哪些商品需要补货,哪些商品利润变薄了。但是如果这些数据都能通过 a p i 给到 agent, 它就可以每天自动帮你检查一遍。 比如,他可以告诉你某个 sku 最近七天销量突然上涨,但是 fba 库存只够卖九天,建议马上补货。或者某个商品销量下降了百分之三十,但是广告花费没有下降,说明这个商品可能正在亏钱。再比如,某些订单出现异常退款, agent 可以 把这些异常单独列出来,让你优先处理。 这时候 agent 扮演的不是一个简单的报表工具,而是一个全天候运营助理,它不只是展示数据,而是帮你发现问题,提出建议,并且在你授权之后执行操作。第二层是广告分析和优化自动化。 广告是亚马逊运营里最消耗精力的部分,每天要看曝光点击 c p c c t r c v o o a s。 还要看搜索词、关键词、广告活动、广告组和 asim 维度的数据。如果只是靠人工看表格,其实很容易漏掉机会,也容易被短期波动误导。 所以我们可以通过亚马逊广告 m c p 把广告数据直接给到 agent, 这样 agent 就 可以读取广告活动数据,分析哪些广告组正在浪费预算,哪些关键词转化好但预算不够,哪些搜索词值得加入精准匹配,哪些词应该否定。 举个例子, agent 可以 每天分析过去七天和过去三十天的数据,然后告诉你这个广告活动 a k o s。 高于目标值。主要原因是三个搜索词点击很多,但没有转化,建议加入否定关键词。另一个广告活动虽然 a k o s。 很 低,但预算经常跑满,建议提高率预算。 还有一些关键词转化稳定,可以单独拆出来做精准投放。更进一步,如果你给 agent 设定规则,比如目标 a k o s 最低转化次数最高 c p c。 预算上线,它就可以根据规则自动生成优化方案。这就是从人看数据变成 agent 看数据,人做确认,甚至在成熟之后变成 agent 自动优化人做监督。 第三层是半自动化广告分析。有些卖家暂时还没有完整接入 a p i 或 m c p 也没关系,可以先用更轻量的方式开始。 如在亚马逊广告后台设置每日定时发送广告报告,把广告报表自动发送到 gmail 邮箱。然后 agent 每天去 gmail 获取最新的广告报表,读取里面的数据,完成分析,并把分析报告存入本地电脑文件。这个流程非常适合刚开始做自动化的人,他不需要一开始就搭建复杂系统,也不需要马上开放全部权限, 你只需要让广告后台每天把数据发到邮箱。 agent 定时获取附件,比如 excel 或 c s b 文件,然后自动分析。分析完成后,它可以在本地生成一份日报,比如今天哪些广告表现异常,哪些关键词需要调整,哪些广告预算不足,哪些 sku 的 广告投入产出变差了。 这个报告可以按日期保存到本地文件夹里,这样你每天打开电脑,就能看到一份已经整理好的广告分析,而不是自己再去下载报表,筛选数据做透视表。这就是半自动化的价值。它先帮你整理数据,变成只看结论和建议。 总结一下,使用 agent 接管电商店铺,可以分成三步走,第一步,通过亚马逊 api 接入订单、库存、 sku 等运营数据,让 agent 负责日常运营监控。第二步,通过亚马逊广告 mcp 接入广告数据,让 agent 做广告分析、优化建议,甚至自动调整。 第三步,如果暂时没有完整接口,就先用 gmail 定时接收广告报告,让 agent 读邮件附件分析之后把报告保存到本地电脑。真正的自动化,不是把人完全替代掉,而是把人从重复琐碎、低价值的工作里解放出来。运营人员应该把时间花在选品策略、供应链、品牌和增长上,而不是每天机械地下载表格、复制数据、筛选异常。 未来的电商运营,很可能不是一个人管理一个店铺,而是一个人带着多个 agent 管理多个店铺。 agent 负责看数据、找问题、生成方案、执行规则,人负责设定目标、判断方向、控制风险。这才是电商自动化真正有想象力的地方。

大家好,这个视频我们一起来看一看 hermis agent 有 多智能体的几种用法。嗯,首先是在默认的 agent 的 基础上,因为默认只有一个 agent, 在 它的基础上我们可以创建多个 hermis agent, 也就是创建它的分身。 呃,用于不同的场景,你像如果你也是学习上有的,生活上有的,工作上有的,就是你要你想给他分开的话,这样做的话就能够让各个不同场景下没有独自的 a 诊断去辅助我们是这样。呃,第二个是多智能体一起工作。嗯,这里的话主要是 我们如果有一个复杂的任务,这个复杂的任务的话就跟前面似的,可能他有点混乱, 我们想给它分开,那我们怎么去分开?然后这个分开的话,它又不是像全面前面一样完全的分开,而是在前面的基础上它有一些呃一起工作协同的一个机制在里头,然后这块的话多说一句,现在多说一句。这块的话,我个人的感觉有点儿鸡肋。嗯,就是随着现在 a to a 机制, agent to agent 这样一个机制慢慢成熟之后的话,这块我觉得以后来说还是非常重要它。 最后我们来说一下,嗯, sub agent 协同工作的这样一个机制,这个机制的话我觉得有点可惜,这是一个非常好的机制,但是可能对大多数人来说,它属于一个相对隐藏的比较深的一个能力。哈。现在来说我最喜欢的是这个机制,就是一会介绍的时候,可以大家可以重点关注一下这个吧。 呃,前面的话相对常规一些,或者说能力还没达到吧。呃,最后的话会对这三个机制,三个不同的机制,因为他三个都存在,他都有他自己存在的道理吗?然后做一个对比,就是看看什么样的情况下用用什么样的东西会比较好。 呃,那我们开始正式的讲解,首先是多个 hermes agent, 我 们在安装配置好了 hermes agent 之后,我们就可以开始用了哈,然后,嗯,多个 agent, 可能新手来说大部分也都没有试过哈。然后这个的话针对的就是这一群人哈。 hermes profile create, 然后这个是你的新的 a, 任何名字,你给他起任意名字都行哈,当然也不是那么的任意,就最好是全英文,全英文小写的这种模式是最好的。然后 如果有数字的话,数字放在结尾,放在中间,就是不要放在开头,就是创建分身,然后这种创建分身的模式是完全是只是有一个分身配置的话是需要我们另外配置的, 包括配大模型,然后配,嗯,飞书也好,微信也好,这个是另外配置的。呃,说到这的话就先把这个补充的大概说一说,这个补充的话就是说你可以创建分身,分身出来都是空的,所有东西都开始配, 相应的你也可以创建一些分身,然后这个分身是带着配置信息的哈,像这个就是带着配置信息的,这个的话就多了一个克隆的一个命令,然后像这个的话,这个又多了克隆,然后杠二的这个命令是不但带着配置信息,而且把一些 更多的信息都他都带过来,就是这些东西是层层深入的哈,然后这个的话是从配,呃,从特定的配置文件去克隆,然后这个配置文件的话,一定是你前面已经 back up 备份的这些信息哈。嗯,这个的话 在这因为不是我大概讲解这个的一个重点哈,所以大概一说,嗯,感兴趣的话,后续我把相关的东西资料放上哈,感兴趣的话大家可以查资料去看。 呃,这个的话就是多说一句,说到了它的那个,呃,创建分身的各个不同的方式,然后我们回到它的配置,呃,配置的话就是 这样哈。嗯,因为现在 wsl 版的话,它的那个配置在那个文档里面是有明确写的,这个的话反而是没有的。 大部分人可能现在开始用的是 windows 版的,然后 wsl 版的话,因为安装过程当中比较麻烦一点,可能不太用哈,所以这两个我都都说一下吧,因为这个的话文档里面你好找,但是你找的话你可能是这版的,你又不会用。 就是就是,大概都说一说,呃,也没有太多的过多的一一些点哈,就是主要是面临前面多了这一句话而已,多了这个 hermes 杠杠 profile 多多了这些而已。然后关于它的配置,配置这个模型也好,然后配置通讯终端,就是微信飞书也好, 这些配置的话跟我们第一次安装的时候的那个配置是一样的哈,就是包括后面的那个怎么去激活,呃,有那个 dm code 就是 dm 码去激活的这样一个过程,这个都是一样的哈。 嗯,这里写出来的话,主要就是大家注意一下这个命令的这个写法,这个我也是研究了好久才弄通的这样一个, 呃,这个配置大概就是这样,安装和配置大概就这样,然后安装配置,配置完了之后的话,你使用的话启动启动的话也是差不多情况哈。 像 wsl 的 话,你直接启动,你就根据你起的名字,你你取的名字,你直接去启动它就行。如果是 windows 的 话,就是多了前面这些给它启动就行,然后启动之后用的话是一样的哈,就是跟你,呃,跟你正常用 harmus 也好,用各种 ai 工具也好,就是一样的使用哈,只不过它 也就是多了一个分身,如果理解不了分身也没有关系,就是多了一个聊天对话一个地方而已。 嗯,这是这个多个 hermes agent 这个场景,然后这个的它的那个使用的话,就是像前面说的你, 呃,学习相关的,你跟一个 a 正的聊,然后他能够比较好的把握你的学习的情况,然后工作的你跟另外一个聊,然后你的家庭生活方面的,你再找一个跟他聊,然后他单独的去管理这些东西,他不至于乱, 就说像这样个人用就是显得还好。如果你的工作用的话,那工作你可能有一些新媒体相关的工作,呃, 然后你有扣点相相关的工作,你有数据分析相关的工作,这些工作的话也是单独管会比较好。播个 hermes agent, 像这样一个简单的一个配置,然后现在分身的场景更多的适用在这样的情况下,呃,那这个就说完了,这个地方是 多智能体一起工作,就是我觉得他有点鸡肋,是因为他现在多个智能体工作真的到 a to v 那 种,就是说我们想象的那种,他们能够相互很自主的遇到问题之后跟谁跟谁说一声,然后大概大概怎么去交接工作,这个他是做不到的哈。现在的话, 嗯,就目前来看,大家能用到的那个情况的话,更多的是一个算是一个调用的一个功能吧。 呃,但是他有他存在的一个必要哈,你比如说你在公司里面,如果你是个中层领导的话,就说每一个员工他自己有他自己的能力,他自己能力如果在工作过程当中磨合的很强,是不是也比较也比较好?然后这种多智能体的场景适合的 就说大概的话就是这样一个场景,虽然他们自己自身能力可能不太够,就是说员工之间交互交流没有那么好,需要你去管理去协调的话,但是他们整个他们自己单独的能力很强,也是能够帮你在团队当中完成很好的去完成工作的哈,大概是这样。呃, 这个我这个的话我是做了一个 skill 去帮忙完成这个工作哈,就是说怎么组队?因为大部分人现在用 ai 的 话,可能还有一块能力是考验大家的那个 组织领导能力。呃,大部分人这块能力是欠缺的哈,我,我这块能力也是欠缺的,然后 skill 能够帮我们补上这一块哈,就是说我们要构建一个 a 站的团队,我们怎么做呢? 嗯,大概原理就是这样哈,就是你的 skill 帮你去组建一个团队,然后这个团队里面有一个算是 主 agent, 这个主 agent 负责跟你交流,就说你把活派给他,他把这个工作分配给他下面的那个子 agent 去完成工作,完成工作之后的话,他们的那个工作成果在主 agent 那 儿汇总,汇总完了之后再把这个结果给到你,就是这么一个过程哈, 呃,然后这个过程当中的话,大概的原理是这样哈,就是告诉主 agent, 然后其他子 agent 的 那个存在,然后把名字呀,然后主要能力这样方式给到他。呃,还有就是主 agent 只和你交流, 然后主 agent 把工作去分配出去,主 agent 也不参与具体的工作,它相当于是你的一个助理,然后真正干活的是那些子 agent, 然后你也不用干活,你是,呃,通过主 agent 把工作交接出去,然后再把工作结果回收回来,是大概这样一个过程, 并且呢子 agent 之间他也不知道其他 agent 的 存在,然后他们之间也没有一个调用的关系哈,就是 agent 之间的话,就是主 agent 可以 调用子 agent, 然后主 agent 可以 收回子 agent 的 一些工作成果,他们之间就是积累的点就在于他们不是真的血统。 我们关注的重点就说它这个队组队它是怎么去完成的,然后组队完了之后,完成了之后有了工作之后,这个主 a 证和子 a 证的之间,它们的那个交互去是怎么去发生的哈,然后这个的话就是我这个 构建 a 证的团队,这里面呢有个 a 证的 team design, 就是 a 证的团队设计的这样一个 skill, 它要去完成的一个工作哈,这个的话给大家看看,是这么一个 skill, 然后我们主要看这个 skill 点 md 就 可以了。 嗯,这个的话我会放在文档里头,名字叫什么,然后大概是怎么去协商方式,然后主 a 证的子 a 证的调度机制,这些各种各样的文件,各种各样的说明哈,它这里面都有的。 嗯,就是有这个之后的话,基本上你希望去构建一个团队去完成一个工作的话,你把这个想法给到这个 skill 就 可以了, skill 会帮你完成的。 特别注意一下,因为组队这个事情的话,你是交给一个 agent, 然后这个 agent 用 skill 去完成的嘛?然后注意下这个 agent 跟我们要创建的 agent 团队就说没有直接的关系啊, 这个的话只是说你去早期去组队的这样一个过程中要用到的,然后其实后期到使用的话,后期如果这个团队已经构建好了,你最后 主要跟那个构建好的那个团队里面的主 a 阵的交流哈,也不是我们现在用 skill 的 这个 a 阵的去交流,他是他是这个意思啊,可能有点绕,就是大家可以理解一下这个事情。 嗯,这个就是构建 agent 的 团队,嗯,这个的话,其实词的话大概是这样就行哈。做什么什么的团队,这个根据你的, 根据你要干的工作去做一个设计,就是跟他说就行,跟他说,然后让他用用这个去帮你组队,然后这整个过程的话,它是有一个 舞步的,一个交流的一个过程哈。我这么设计主要是因为组队这个事情本身来说并不是一个很简单就能去完成的一个事情,所以他有这么讨论跟你确认的过程,然后讨论完了生成出稿,然后他有一个评选机制,然后再有修正,再有交付, 交付的话最后他交付的是这些东西,就这个过程的话,在这个 skill 里面都有体现,大家如果想做相应的修改的话,可以根据我这个 skill 文件去做更正就可以了, 就是按你的需求你去改,没有问题的。嗯,整个这个过程的话我就不再去细看了哈,就是文档给到大家,大家可以自己去看看大概是什么样的过程。 然后这个过程的话,他最后就是我们这一步是构建 a 证的团队嘛?然后构建团队的话,他把团队的构成会给到我们,就是这些文件哈,给到我们,然后主 a 证的是谁?就这个团队他的领导是谁,然后团队的成员是谁? 呃,这个的话,更核心的并不是说他有这么一个人员配备的一个设计就够了哈,不是这样的,就说他人员具有什么样的能力的话,是在这个搜文件里头的, 是在这这些文件里头他们怎么去协同,是在这个写作流程里头,还有就是这个完整的规格说明,这个的话,呃,是给你看的哈,就是这个的话它对 agent 怎么使用 可能没有那么重要,重要的是就是说你得知道这个组队是什么样的,然后这样的话你后期它有什么问题的话,你再去修改是可以的。 嗯,这是这个,然后我这就有一个视力的那个文件哈,就是前面的,前面的视力不是说是做一个数据分析的团队吗?然后这个团队到底是什么样的?就是在这个文件里头大家可以看一看。然后整个团队的构成的话,前面也这有提的话,是三个人, 三个人,然后一个组长,然后后面两个组员,大概是这样,嗯,这个是就说文文件就形成了哈,形成了这些是核心,然后我们自己手动总是要完成一些工作的。 这个不是说不能自动哈,是自动的话它可能会有一些问题,你把太多太多的东西交给它这种去完成了, 就是说你自己参与度不高的话,你后续哪有问题的话,你自己去把控,可能都不太好弄哈,就是为了这个后续的话,当然如果在优化把这个组队的那个东西优化好的话,让他自己完全自主的去做是没有问题。 呃,这第一步,这一步构建 a 证的团队,我们是有了这样一些文件,然后在这些文件的基础上,我们就是真正去做这个成员 a 证的一个构建哈,然后这个构建的基础的话,其实 是这个哈,就说是前面是前面我们第一步的这个基础,因为在第一步里面我们构建团队的话,我们只是有了团队的一些相关的文件,我们并没有真的 agent, 然后在这的话我们是要做真的做 agent, 这样的话就是在这步基础上去完成的。就说到这的话,我们要我,我们要再重复一下这个操作,就是 去创建一个分身,然后创建分身完了之后,前面这些的话,第一步创建多个 hermes a 阵头,我们创建创建好的分身,只是他 分身各自是各自的,因为他们不涉及协统,所以好多文件的话,你不他用去专门的去配置,你通过跟他的交流他自己就去改了。呃,这个的话,为了组队的话,我们是要在创建好了之后,我们要去做一些修正的,就是前面第一步里面出来的这些文件,我们要去给他改,改一改的 是这个意思哈,这里的话涉及到的改的话是它的这个 so m d 文件,也就是前面 这个地方哈,这个地方这些这些文件,这些文件的话改个名字,然后在创建好了 hermes agent 的 分身之后, 包括你这个配置之后,配置完成之后,这个配置的话大模型是需要配的,但是那个通讯终端的话,你配不配都行哈,你交互的只是跟主 a 阵的交互,你把主 a 阵的给他配了就行,后面那些东西不需要配,就是岁数微信的配置不配也没有关系,但是大模型是必须要配的, 就是这个是涉及到他的配置,呃,把那个配完之后的话,然后把他的那个搜文件改一下,这个文件要怎么改的话, 就是这样哈,就是我这个给了一个视力,因为每个电脑他可能情况不一样,但是大概的话按照我这个格式去解锁是没有问题的。就是你的分身文件叫什么?分身的那个 a 神的叫什么,然后这个是他的名字,然后你电脑是啥情况?这是这个,然后在 windows 版的话,基本上这种地址就不会错了, 就是找在这个文件路文件加路径下,就是就是注意下有一个重要的点,就是这个哈 profiles, 就是 它先分身都在这里头,然后找到你对应的分身哈。 嗯,这个的话 c 盘 user, 然后你的电脑是什么?然后 app data, 然后 local, 然后这个 hermes 的 分身文件,然后在这个 the agent 就是 分身 agent 下面哈,这个是我的 analyze 的,是我的那个 windows 上面的 hermes, 它的分身一个子 agent 的 它的名字,然后在这个笔架下就是这个, 然后找到在这里面找到这个 so 点 m d 文件,然后你像你这个是 analyze 的,是数据分分析的那个嘛?然后就找到前面这个 分析的这个分析的这个,把它的文件名字给改掉,改成 so, 然后把这个文件复制, 复制进这个目录给它替换掉就可以了。这个意思,呃,像前面这没有太说哈,没有说。然后这个生成好了之后的话,就是通过这个 skill 组队完成生成的这些文件之后,它会把路径给到你,你按照它的路径把这个文件找出来就行,然后找好的话, 把找好的话找好这个文件之后,然后再去找这个 harmis 分 身它的那个原始的这个所有文件,找它的位置,然后这两个 都确认好了之后,把他的名字改掉,然后把文件复制进这个文件夹里面就 ok 了哈,就这样成员 agent 就是 这么简单哈。然后主 agent 的 话需要注意的是他这个 so 文件只是这个 so, 然后要把这个文件, 把他的那个写作流程的这个文件哈也给复制进来,呃,就是把他们两个这个跟这个合并一下,合并的意思是这样哈,看我下面这个 合并的意思是这样,就是说打开编辑,编辑的话,然后把嗯改了名字之后,然后打开编辑,编辑的话,把后面的这个写作流程的东西给他复制到后面就行了哈, 就只是复制一下,复制到后面就行,像是这个文件的话,大家可以对照着参考。所以最后的话,我们是我们是把 这些文件改了个名字,然后把这两个文件做了个合并,然后完了之后把这个文件又放到了它各自的 the agent 的 那个 文件夹里头,就是做了一个替换,哈,就是做了这么个事。这个这个过程的话大家理解一下吧,好好体会一下。因为对于这个 agent, 不 管是是子 agent、 主 agent, 各种 agent, 就是 对 agent 来说,它的这个 so 点 md 文件,这个文件对法来说是最重要的,所以我的这个 skill 就 比较重要了,是不是?大家能理解吗?就是这个 skill 主要完成了这个工作,这个是个核心的工作,嗯,然后这个里头 主 agent 哈,主 agent 里头要严格地把这些事情说清楚,就是如果它做不好的话,可能存在的问题就是说它没有真的去调用它的主 agent 这个 so 点 m d 文件里头的话要说清楚,这个工作做了分配,然后在哪个 子公司里面去执行,去调用命令行执行,执行什么任务,就是这些是职管重要的,因为他是真的去会执行,不是说是做一个委执行,通过主 agent 然后 调用命令行,然后在命令行执行的是调用子公司的这样一个命令,呃,包括子公司的名字,然后任务是什么 是真的去执行哈,然后这个执行的话,我们在子 agent 的 那个筛选里头,就是他的那个对话记录里面是可以查到这个任务的, 这个过程的话就是说他不是那么直接,可能有点绕,就是需要你去理解一下,然后,嗯,按照我的这个大概这个讲解,然后这个 skill 去真的去执行一下看看吧。 呃,这一步的话是这个工作的算是这个工作的核心了,然后完了之后的话, 就是到了在主 a 阵的这儿,我们就可以给他安排任务了,这个怎么去启动哈?前面也有提及到启动的话,在 windows 里面的话需要把这个加上,然后在 wsl 里头的话,只需要你直接启动这个就可以了。 然后完了之后的话,在那个对话里头把这个任务给到他哈,就是他是一个什么样的任务,然后有一个数据分析的工作,就是说清楚哈是什么工作需要成员完成,然后把那个表给他,他就去做了。呃,这个是我自己做的一个视力的一个结果哈,就是这样 我其实又做了一些优化了,然后他自己会把 a 证的调用的情况,哪些 a 证参与了这个工作,然后大概工作结果是什么样?然后这个只是简单的展示一下工作结果哈, 他会把那个工作结果包括谁完,谁参与,完成了这个工作,他都会给你做一个交互的。呃,这个的话我需要演示一下这个的话,这个命令是查看我有多少个 profile, 也就是有多少个分身,这个是默认的哈,然后后面有五个分身 是这样。然后如果我要进到一个具体的分身里头的话,在 wsl 里头的话,我只要出这个名字就可以了。 进来之后的话我们能看见他的那个历史记录哈,历史记录的话就是斜杠命令三十三十 s, 就 会把具体的这个他的那个之前的绘画记录说出来,然后我们要接着某一个绘画记录的话,我们把这个绘画的这个 id 拿过来就行了。 sessions, 然后后面把它的 id 拿过来,这样的话它就进入了这个之前的那个聊天记录哈,就跟我们之前用 ai 的 话,像左边会有一个历史聊天记录,然后你点哪个的话,就可以接着 哪个绘画往下走,是不是?是这样一个意思,然后这个的话就是我要看这个,我要接着走这样一个绘画记录。嗯, 说这个的话有点有点扯远了哈,说这个的话是为了说明一下,就是我们主 agent 通过主 agent 分 配了任务给子 agent 嘛?然后子 agent 它是真的去完成工作了, 你怎么去验证它真的去完成工作?你比如说如果我这个 data analyze 的 这个,这是我昨天的这个记录还在哈,就是说这个是被分配工作了之后, 然后你看不见他正在执行工作什么之类的,然后你只能看见主 a 证给他的一个工作反馈,但是在这的话你就能够回来哈,你就回到这的话就能够调出来他的那个 工作记录,我是能够看见他真的工作了的,那这个有什么好处哈?就说他真的执行的这个工作为什么重要?他那次 a 证的话,他有一个自动化能力,如果他自己真的执行这个工作,同时你也可以用这个 a 证的话,那他的能力是会慢慢变强的,就是整个团队,然后团队成员他 会变强,然后也是一个越来越强的一个个体,它是这样一个意思,这个的话我认为相比于后面的这个 sub agent 协同工作这个来说的话是更好的,就是单从这方面的话是更好的。因为这个 sub agent 的 话,后面我们可以提到它是有一个回收机制, 就说干完活之后它那个子 a 呢?就消失了哈,就是这个你不好去积累。呃,那这个的话解释就解释到这,呃,这两个命令的话也都给大家贴出来了。 呃,像这个的话,他的适用场景就是复呃重复性的复杂的工作,一个 agent 作为你的助理帮你拆解工作,分配给其他的 agent, 这个助理的话就是那个主 agent, 然后其他的 agent 的 话就是那些子 agent, 这个是到了用的这个场景哈,真的用的这个场景。前面这三步哈,第一步,第二步的话,我们可能第一次用的时候我们要这样,像第一次用我们要组队,要去拆分,要去组队,然后最后后续的话你还有别的数据分析的任务 来的话,你直接找这个主 agent 就 行,前面两步你就不需要了呢,这是这个多智能体一起工作,这个的话,我个人觉得就今天这个讲解里面它算是最复杂的一部分哈,因为我自己的话也尝试了一段时间,就是看看大家如果有反馈,有 希望更深入了解,或者说哪有问题的话,也欢迎大家多多的留言提建议吧。第三个哈是 sub agent 的 话是做一些稍微复杂一点的任务哈,我们知道那个 agent 的 话, 他使用的话依赖上下轮,是不是上下轮如果太长的话,一个任务就是说你一个稍微复杂一点的任务的话,他上下轮太长的话,他可能爆了,然后最开始看着还行,后面就崩了,那前面的工作就白做了是不是?呃, sub agent 大 概处理了就是这样的一个事情哈, 把任务交给他,然后让他自己去组建团队,然后组建完了之后的话,他自己完成工作之后又回收, 回收,然后给你一个交互。其实就是前面这个多智能体去工作这个这个事情的一个简约版哈,简约的话是因为他的那个机制, 呃,他那个机制的话,支持他这么简约的去完成。你用户这端的话,你不需要配这么多东西,然后甚至甚至还要自己去写 skill 去组队,就是不需要这样。 然后它的那个劣势也是在这哈,就说它用完之后,它就在这一个绘画的过程当中出现,然后用完之后就没了。嗯,这块的话不去多讲,大家看看这个提示词就行。就是根据这个提示词, 现在的话几乎是每一个 agent, 就是 我们现在用的 openclarkhermes, 就是 各种 agent 的 平台的话,它几乎都是支持这种 sub agent 的 机制的哈, 就是就是这个提示词是通用的,然后这个提示词的话是一个组队的一个让他自主去根据任务去组队的一个模式。 我们要做的就是把你的任务贴在这,就是把这个提示词拿过去,然后把任务贴在这,然后把整个的这个大段的提示词交给你的 agent, 他 就能够去帮你完成工作哈,他是这样。 嗯,这个的话,嗯,可能那就是因为内容比较相对比较复杂哈,就是比较长,就没有太去演示,大家可以拿着演示去看,一看,就强烈建议大家第二个可能复杂一点,但是第一个、第三个真的是强烈建议大家多用它,多感受感受 a 阵它的强大。 然后这第三个 sub agent 的 它的场景哈,是和需求不是那么清晰,然后稍微复杂一点儿的任务,你可能不太知道你是不是要组队去完成,因为组队的话它它有保留嘛?它 agent 的 话你总是存在的,然后你后续重复的任务的话, 同样的场景你还可以交给他们,虽然写作模式可能不是那么好,但是它能写作起来,然后能慢慢进化成一个比较强的能力,这个是很好的,这是这个,然后这个适用场景的话就是说不不太确定是不是需要 agent team 的 场景的话,你用这个比较好, 嗯,最开始我们用这个,可能用着用着的话,你觉得它组队比较好,你可以换这个都 ok 的。 最后的话说一下三种不同方式的一个对比,这个的话大家看情况去理解吧。这个有一个 ppt 的, 像多个 hermes agent 这样一个场景的话,它的那个 profile 它是它是有独自的,然后也不共享上下轮儿。多个 agent 就是 独立,就是各自是各自的,相当于张三用他的,李四用他的,就是那样一个状态。然后这些 a 政的话,他是一直存在的,也是在各自积累,各自学习,然后这个多智能体团队这个的哈,他是那个调度和被调度的一个关系, 也是不会共享上下文,但是主 a 政的话是能够知道能向子 a 政发命令,然后子 a 政也能够把结果传给主 a 政的,是这样, 这个的话试用场景就是重复性的,复杂的工作他也是永久存在的哈,然后他的学习能力也是在的,然后难度的话是最难的,第一个其实是最简单的,最后一个的话是需要提示词,然后我们就是积累一下这样的提示词,对你后续能够快速开展工作是有好处的。 嗯,第三个 sub agent 的 话,他是那种动态的子 agent 处理任务哈,然后结果是汇总到主 agent 然后交给你的。这种的话适合做的是那种稍微复杂一点,但是又 不太常做的。你像如果像是这个多智能体团队这块的话,这块我们做什么工作会用到它呢?就是周报,有一些周报呀,上什么日报呀,像什么周总结呀,然后周例会呀,那种那种东西的处理就是重复性的工作,要做的话,你是希望它一直存在,但是它 一个 a 证又处理不了的这类任务给他,那这个的话就是那种不常用的任务,就是今天要搞一个 什么团建的一个计划之类的,就是这种的,可能一年到头也就一回两回的,这种用它我觉得比较合适哈, 是这样。然后还有前面我们说到的,你不太确定是不是适合这种组队模式的话,你也可以拿它试一试,因为它的适用成本相对比较低嘛。三种方式的对比大概就是这样哈,各有长短。反正我自己现在的话是这些东西的话我都在用,你用完之后你会发现这些东西它 并不是说就是说有的,用了这个就不用那个,哪个绝对好,哪个绝对不好的,各有所长,然后都值得我们去试一试。这个对比大概就说完了,多 a 政策的话,现在我觉得还差点意思,就是等着 a to a 模式慢慢的好起来,然后我们希望能够拿它做更多的事情吧。 然后预告一下我下一个视频啊,如果是我们大部分人只有一个 agent, 那 这一个 agent 我 们怎么去用好?它就是可探索的比较好玩那些点还是蛮多的,就是下一个视频会涉及到怎么把这个 agent 和大家一起用起来。 然后包括我们前面也有讲到知识库,把知识库怎么用起来,就是把知识库给到 agent, 让 agent 的 话基于知识库去做伟大回复。这个的话我们肯定都用过那种,嗯,文字交流的那类智能客服,像群里也好,像什么,嗯, 电商平台也好,它的那些东西,那些的使用,大概是这方面的一个零成本的一个实现吧。这个事情我们就说这么多,我们下个视频见。

探索型的工作会污染上下文,随着 agent 越来越有用,每多一样新的东西,系统的提示就会放大一倍。上下文窗口的填满是不可避免的, 我们来设想一个场景,你让 agent 检查账目里面用了什么测试的光卡。为了回答这个问题,他可能要读五个配置文件,每一个文件有几百行,这些文件的内容会留在消息的历史之中,永久地占据上下文空间。但实际上,这个问题只需要一个词来回答, pytest, 这就是上下文污染的问题。为了完成一个子任务呢,积累了大量对于主任务的无用的信息,所以就引入了我们第四节课程的概念,子智能体,让子智能体拥有干净的上下文,然后去做干净的事情。 子智能体叫 sub agent, 是 一个独立的 agent 的 实力,它有自己全新的消息的历史,那做完一件事情,把结论告诉副 agent, 然后整个历史直接去丢弃。 那副 agent 和子 agent 到底是一个什么样的关系呢?它其实特别像公司里面,比如说主管是副 agent, 它负责整个任务,把具体的调查的工作分配给专员,也就是子智能体。那专员其实是在独立工作的,得出结论之后,只要把结论汇报给主管就可以了,它不需要把所 所有的工作过程的细节都摊在主管的办公室里面,那主管的办公桌,也就是上下文是保持整洁的。而子智能体呢,他可能执行了三十次的工具调用,读了大量的文件。但是对于负 a 症特来说,他收到的只是一句简短的摘药,这就是用计算代价换上下文清洁度的一个权衡, 而且往往是非常值得的。那第四节课子智能体解决了探索性的工作污染上下文的问题,让子智能体去干脏活累活,主 a 症,拿结论保持整体的清洁。但是随 一个 agent 才越来越有用,那另一个问题就是,你希望它懂得东西越来越多,但是每多一样新的东西,系统的提示就会放大一倍。那我们现在来到第五节按需知识,也就是技能加载 skill。 那 一个全能的 agent, 它可能要懂 get 的 工作流,以及代码的审查的规范,或者是测试的最佳时间,以及项目特定的一些约定等等。但如果把这些全部的都塞到我们的系统提示词里面,会消耗大量的 token, 而且大部分内容跟当前的任务是毫无关系的。 假设我们每一个技能或者是每一个功能要两千个 token, 那 有十个技能的话,那就是有两万个 token。 而这些内容在模型处理每一次请求的时候,它都需要重新计算一遍。所以这里设计了一个很好的技能加载机制。 按需加载什么意思呢?就是每次给 ai 发请求的时候,不是把所有技能的所有信息都给 ai, 而是让它根据任务的需求先判断是否需要某个技能,确认之后再去实时读取这个技能的详细说明。技能的加载机制我们分成两层, 第一层,系统提示始终是存在的。系统提示呢,是在对话开始之前就给 ai 的 一段角色设定和行为的规则,你可以把它理解为上岗的培训资料。 在 ai 开始工作之前,你要告诉他你是谁,你能做什么?你应该怎么做?那系统提示呢?它会占用上下文窗口的空间,而且是从第一条消息开始就存在的,永远占据着那块位置。 所以系统提示里面放的东西要非常的精挑细选,会只放技能的名称和简介,大约每个技能有一百个头看。那第二层呢,是工具的调用结果,也就是叫按需加载, 当模型决定需要某个技能的时候,才去调用这个技能,完整的内容才会出现在上下文窗口之中。这是一种很聪明的设计,也是模型知道有哪些工具同时呢,在需要的时候 才打开。那这一套技能加载流程,把知识预加载变成了按需加载,也就是对于上下文的起点来说,它更干净了。但是呢,这个流程也会有一个问题,你会发现所有的优化,比如说此智能体技能加载专用工具,都只是在延续一个根本性的问题的到来, 就是上下文窗口的填满是不可避免的,比如说让他读一个一千行的文件就要四千个 token, 跑一条命令可能就反悔几百行的日制,那做一个稍微复杂的任务,二三十四的工具的调用,轻松就会超过十万 token。 这是物理限制,不是设计的缺陷。 所以我们需要来到第六节课上下文压缩,也就是绕开记忆上线的工程解决方案。 我们刚才提到,上下文最终还是会被耗尽的,无论你怎么设计,随着 hr 工作的时间增长,消息历史会越来越长,这是一个无法回避的物理限制, 现在呢,处理它的方式不是说假装它不存在,而是设计了三层的压缩机制。这个压缩机制也是我认为 cloud code 跟其他的编程工具来说整体效果更好的地方。我们看第一层微压缩,也就是每轮禁默执行, 每一次大模型调用之前,都把三轮以前的工具返回,结果替换成一行占位符。这样做的好处是把原来几 千 token 的 文件内容变成了一行五个词,而且模型还能够看到它做过什么,但是呢,就不再去重复处理那些文件的具体的内容。这一层压缩本质上是无感的, agent 其实也并不知道发生了什么,但是它确实是在持续的节省着空间。接着我们进入到第二层自动压缩, 当 token 超域值时会触发,也就是当 token 数量超过设定的域值的时候,系统会把完整的对话历史保存到 磁盘,防止信息真正的丢失。然后呢,让另外一个大模型把这一段历史摘要成一段简短的文字,接着把这一段摘要替换为全部的历史,然后重新开始。这相当于给 a 层一个记忆的摘要,他知道发生过什么,但是他不再记住每一个细节。第三层主动压缩, 就是模型按需调用,那模型可以自己根据 compact 工具,在感觉上下文快要满之前,主动去触发这个压缩,在 cloud code 里面执行的时候,直接斜杠 compact 就 可以去操作。这里有一个提示啊,这三层压缩都是有代价的, 因为信息会损失。压缩完之后, a 证他可能不记得某一个细节,可能会忘记自己做过什么,这个本质上也不是一个 bug, 而是权衡的结果。一个设计良好的 a 证,他会把关键的状态写到磁盘上,包括任务的文件代码,而不是说去依赖上下文的记忆。 第六节课的上下文压缩让 a 证能够持续的工作了,但是呢,压缩本质上是一种选择性的遗忘,它保留了摘药,但丢失了细节。 这里就带来了一个新的问题,如果目标本身也在上下纹理压缩之后, agent 可能就忘记了他的目标,也就是他连他自己在做什么都不清楚了。那我们应该怎么解决呢?现在让我们来到第七节,让 agent 记住要做什么。

哈喽,大家好,我是面包先生 alan, 今天我们这个视频详细的跟大家去分享为什么 openclaw 需要多 agent 协助?我们现在很多的小伙伴,可能我们要把 呃 openclaw 用到我们的业务里面,落到这种真实的业务场景里面,大家都会有一些误区,就是呃多 agent 是 不是就是在我的 openclaw 里面多建几个 agent, 让每个 agent 来去做不同的任务?大概理解是这样,但实际上呢?呃多 agent 的 协助它不是 多建几个 agent 就 可以,而是我们要让这些 agent 它像我们人类团队一样去基于目标去做配合,它们之间可以有能力的互补和协调,同时它又有这个啊角色的明确的分工,还有就是呃它有这种呃 对于这个呃每一个任务之间的流程的衔接,还有这种任务的并行的处理等等等等,其实这些才是啊多 agent 协助的一个核心。那 我们来说一个典型的复复杂任务,像我们现在很多人在做这个,嗯, open call 这种应用场景的时候,大部分的都是属于 单场景,就单业务场景,比如说我只是让他去做呃发文章,或者是我只是让他去写文章,对吧?让他自动化的去发文章或者写文章,这种是属于场景比较单一,就当业务内容或者业务任务比较单一的。那如果 去到一些比较复杂的这种业务逻辑里面,比如说像我们之前分享的,如果我用它来做客户开发的这个动作,那他可能最少有三个步骤,对吧?第一个是找客户,第二是呃解析,我们叫分析公司嘛。然后第三就是写开发信,那 比如说我们找客户,那你这里面会有很多的呃维度,比如说找不同的国家,你有个客户的画像,你要通过什么渠道,因为在不同的渠道找他的方式方法也不一样。不像比如说你在 google 里面搜索,或者是你在这个社交名平台,或者是在这个海关数据库里面搜,不同的渠道 啊,他是不一样的,那你单 agent 去做这个事情,其实是呃,他就会有很复杂的这个内容在里面,让他执行起来会出问题,这是一个。第二就是呃做这种数据的分析,就公式的解析,比如说你可以去挖掘这种目标公司的一些 数据,对吧?供应链数据,过往的采购记录,还有一些他们的设备里面的一些啊信息,以及他其他的这种相关的信息,这个也是需要去做很重要的分析的。然后第三就是写开发信,比如说我要去联系这个客户,那我要去 根据我前面的分析来写个性化的邮件。所以说我们说这种这种业务,它实际上它的复杂程度是比较高的。那我们现在很多用 open cloud 的 时候呢啊,大部分都是属于单一的这种业务,那如果一旦啊就是涉及到这种复杂的业务,就会产生很多的问题,非常非常多的问题。那 我们在之前我有给大家去分享过,就是我们自己,我在最开始的时候我用 open cloud, 我 针对我们自己有一个 showify 的 嗯, app, 就是 我推我的这个 app 啊,我最开始我的想法很简单,就是我希望呃让我的这个 open cloud 他 每天自动去运运行, 他怎么去做的?就是他每天去发现这个线索,就是他每天去发现线索,发现线索以后呢?他还会去做这个分析,对吧?他会针对这些线索去做分析,分析完过后呢?然后比如说由这个信息的,呃,这个负责人,他 也也不叫负责人,就是负责的 agent, 他 来负责内容的创作,对吧?内容写作,写作完过后,这个他是负责这个触达,就他去给这个客户发邮件啊等等等等,就是我给他去做了一个流程,然后这个这个流程里面呢,又有一个这个专门负责 整个 agent 的, 呃,同领的这个角色,他来去,呃,比如说他来去协同每个 agent, 他 之间去是应该怎么去做?比如他每次每天的会,对吧?是干嘛?第二他每天要做哪些事情?就这个任务流程我把它写的很细了。 呃,是它写的很细,但实际上在执行过程中呢?其实他又又有非常多的问题。这个问题是什么?就是,嗯, 跑起来不太稳定。不太稳定是什么?就是经常出现。我我已经遇到了好几次了,就是说经常发的邮件啊,是乱七八糟的,就他有分。可能你今天给他说重新定目标,对吧?你跟他说重新定目标啊?他跟你说目标 ok 了,那过两天, 嗯,他的写那个,他那个发晨报的时候他也跟你说啊,这个目标又是什么事?他可能又是用的老的数据,你要明确他强调,呃,我们的目标有有改变。那同时呢?这里面比如说他要去审核。举个例子哈,他要去审核这个类邮件的内容,我们比如说我要去发邮件, 他要去审核这个邮件的内容,同时他要去审核这个呃写的文章,我们这有个内容,那个运营的,运营的 idea, 他 要去审核这个文章,对吧?他每天都得干这些事。但实际上你看我这个地方遇到一个很重要的问题,就是他知道每天他要去做的 啊,在他的那个 kpi 的 这个记忆里面,他知道要干这些事情,但是他每天跑起来的时候就会出现千奇百怪的问题,为什么呢?就是他在去挖掘,像这个 客户线索挖掘的时候,最开始他就是关键词挖掘,那我跟他说我要去多多几个渠道去挖, ok, 他 一旦你跟他提要求,他挖掘的情况就会有问题,而且出现幻觉。他每天给我的呃发的邮件, 呃就是反复的,我最开始遇到一个问题,他反复把之前的邮件重复发,这是一个第二个他写的那个邮件内容,我还那个 呃叫什么呢?他的邮件内容里面还包含了他们内部就 agent 内部去讨论的这个中文的这种,这种内容在里面还有些 杂七杂八的内容在里面。所以呢,我这个 agent 他 跑起来过后就遇到这个问题,就是我的,因为我的任务他分为好几个步骤,就是从找客户、找商家、找完过分析,分析完过后再去写内容,写完内容再发布。还有就他有一个专门写博客, 就是内容 edit, 它是写播课,就它的任任务的符合比较多,就场景比较多,同时呢每一个场景里面用的 edit 的 对于能能力又不一样。还有就是一旦呃,比如说举例子哈,我,我经常遇到一个痛点,就是像我在我的这个呃 里面去对话的时候,我可能聊一会,他就会出现什么,我的这个聊天的叫啥呢?呃,上下文满了。好,那我没办法,我又得重新去新建一个窗口,一旦新建窗口呢,我之前的对话的记录就没了, 然后呢?我我后面没办法,就是让他去新建记,把他写成文档,写成文档以后呢,新建对话的时候,我又又让他去读了个文档,但是他一旦读这个文档呢,又会出现千奇百怪的这种问题出来。那在这个时候我就发现一个问题,就是什么呢?就是这个这个项目,呃,单一点,就是你让他去挖掘客户 啊,或者是挖,呃,或者是单点去做这个分析,或者是单点写邮件, ok, 没问题。但你一旦我要让他串联起来吧,从客户的挖掘到写邮件全部给他做完,其实他就会出现很多很多的这个问题,就是我刚才我们这个地方写的就是他的输出非常不稳定,就是你可以看到我的这个后台还有什么呢? 就他他知道他要去审核这个文档,但是一直是处于待审核状态。然后呢他知道他去看审核这个邮件 例子,结果呢?他有一件例子,呃,有效无效,他可能审核一遍,第二天又又又是那个出问题了。那,那说你跟他说让他去看记忆,我给他记忆里面他知道,但是实际上他执行过程中还是有很多很多的问题,这就是我们说这个呃 ide 里面常见的这种呃问题,那这个地方是属于关于 ide 常见的误区。我们也我们现在有很多的小伙伴说,哎,是不是我可以直接在那个写几个 prompt, 呃,就是 呃 angel 的 那种标准,然后呢?呃,去到 open open 里面去创建几个 angel 就 可以了。实际上这种方法有很多问题,就他跑起业务来很难。那 我最近不是在我们做我们那个外贸的获客系统吗?我又陆陆续续有不少的这个卖家小伙伴在加我,他们有的团,有的那个小伙伴他们自己有团队在做,他们也反馈回来一个问题,就是 用 open class 做单单一的点的时候没问题,但一旦你要让它串联两三个任务的时候,就是千奇百怪的问题,你就跑不通,就跑不通。所以说这里面其实它不是我们传统理解,就是 呃叠加这个 i 键的,其实我们其实缺乏的是这种全剧的调动,还有就是边界任务边界,像我之前讲的就是你怎么去界定 定你的边界,让 agent 哪些事情可以干,哪些事不事情不能干?所以说在这个时候,嗯,如果我们要用 open cloud 去做这个事呢?就是做你的业务啊,我们需要有一个统一的 啊协调,对吧?这是一个,第二个你要有明确的任务的拆分,还有第三就是数据的交接,可能这个我们讲起来比较呃空哈,就是如果你们真实没有去做这种业务场景,你其实是很难很难去理解的,那我先把这个多 agent 把它 啊协调起来,我要让他解决什么问题?第一个就是我要让他去识别任务,第二就是拆解,第三个是角色分工,第四是协调,然后数据的交接,最后才是结果的汇集,然后呢?还有得有一个协调者,我们叫 boss 的 这个助手,对吧?他统一对外,统一任务调度,统一的这个结果的输出。呃, 这个可能你理解起来比较比较吃力,让我们来,呃,基于我们现在真实的一个应用场景来给大家分析哈。就是我们自己,我之前有视频发过,就是我们自己做了一个, 呃,做了一个系统,就是我们我们可以把理解为叫,呃,国内他他们可以理解为叫什么 ai 的 创业导师,对吧?创业的辅导辅导专家。那我们主要是面向海外,面向海外呢?我这个系统呢就是帮那种创业者去做这个信息的 想法的验证,比如说你有什么想法的时候,你就可以在这个快速输入,他来,他来帮你去做呃,验证,验证完过后他知道你怎么去进行下一步。那我这个系统我们现在做完了,做完过后呢? 嗯,按照我们现在人力来说,如果让我自己去推这个事儿,推这个产品呢?我们其实是比较吃力的。那我当时就在想有没有可能我们用 opencloud 来做一个?嗯,配合啊,我的一个系统来做一个自动的运营工作,自动运营工作我们主要针对那个 twitter is x 和 reddit。 那 针对这两个平台呢?我们现在重点是做的是这个 x, 就是 那个叫 twitter。 好, twitter 呢?我要做的事情是什么?就是我在我的系统里面,我加了这个模块,我们没办法把这些东西全部交给那个 opencloud 里面去做,如果 opencloud 里做,做完这些事情,我估计这个系统就崩掉了。还有就是,呃,你的那个 talking 也受不了,所以说我们直接把这个, 把它做成了一个独立的模块,放在我的系统里面了。放在系统里面我们是怎么做呢?我想要做的事情就是,呃,我的这些系统功能已经有了,我想要让什么呢?我要让 open color 来接手我的这个运营,就接手接手我这个 啊, x 和 reddit 的 运营啊,怎么运营?就它每天去生成内容,比如它生成这种,呃,内容, 就是这个时候我们为了我这个系统的自动运营,我要让它自动运营,我做的是什么?就是就是多 i 键协调。那首先我要完成我这个项目的推广呢?它是分为了我总共要建几个,我要建六个 i 键, 一个总控 i 键,第二是有四个专业的 i 键,然后有一个复盘的 i 键,那你可以看到这里面第一个总控我们叫 group 什么什么增长,对吧?然后内容生成的,还有锐利的草稿生成的,然后内容风控的,还有数据复盘的, 那它总共加起来,我们需要在我的这个 opencloud 里面创建六个 index 出来,然后我这个地方写了。就是为什么, 嗯,不建议只用一个 index 呢?如果只有一个 index, 它同时要负责,比如说你读上你这个上下文,还要选定一下写 x 的 内容,对吧?还有风控,还有发布数据库排,这样的话就会导致它什么呢? 它的 prompt 会越来越复杂,同时它的执执着不清晰,封控很容易失败。然后呢?呃,后续不太好扩展,所以说我们要做的就是我要让他用多个 id 来做这个事情,然后呢?在这个过程中也不建议说呃把它拆的太多,比如说干个十多块的,十多个这个 id 出来,这样的话你你的 呃样,你的那个过程就会很复杂,就很那个任务拆的太细,其实任务越细对你的 i 键的协调要求就会越高,同时你的调试成本也很高。所以说我们初期就定下来要把我这个系统推出去的话呢,他只需要六个 i 键就好了。六个 i 键的分别是干嘛呢?就是内我们要写的内容,对吧? 它是负责,呃内容,呃总一个总的负责。第二是选择题生成,然后风控还有这个呃数据的复盘,然后呢?再看一下。啊, 好,那这个是我们那个架构,呃我的这个主 agent 的 价格,这是第一个主 agent 的 价格,它是干嘛呢?它每天负责启动每日的运营流程,它每天负责这个事情。第二个调用 oppo 的 这个 tool, 什么网关,这个是什么?就是这个是我系统里面,我们系统也会给它提供一个接口,呃, 因为它我,我是不会,为了安全起见哈,我不会让 open call 直接到我的系统里面来操作这个事,操作这个系统,因为这样的话不安全,会把我的这些有些数据暴露掉。那我们是通过 api 的 方式,通过这种呃端口的方式,然后传递传递内容,那这个时候它干嘛呢?就是它这个主 ip 呢,它是负责启动呃流程,同时它调用 关端口,然后获取这个内容,获取这个种子。这个种子是哪里?就是也是我这个后台生成的啊,这个后台可以生成。然,然后呢他去调用这个呃内容文件来生成草稿,我们上面有嘛?哈?呃内容文件来生成草稿,然后同时调用这个,呃风控,然后呢? 完成过后呢?它请求我们系统做这个任务的创建,然后再发布,最后再调用这个复盘的 agent 来分析,就是它的作用是什么?就它的作用就是它负责调度每一个 agent 干什么事情,对吧?它说这个同时它不负责什么,它不写内容,同时它也不发布,它 也不访问数据库,它也不持有这个 token, 对 吧? x 的 token 它也不去读取原始数据,所以说这就是它主 agent 的 一个啊,我给他一个 定义,我给他的边界,然后呢?这个内容策略的 i 键,他其实也比较简单,就是负责内容生成这个代码款,也不用管哈。他其实他他的 他的干嘛呢?他主要是今天讲什么?在哪个平台讲,用什么角度讲,内容优先级是什么?好,这就是他的,他的准则就是这个 i 键我给他定好,他是干这个事,然后第三个呢?那个内容 i 键他就是负责写的,对吧?他是负责写内容的, 负责写内容他干嘛?就是他写 s 和 x 的 短贴纸,还有这个什么长贴纸,对吧?还有还有等等等等。然后呢?他这里面他又不负责风控。下面就是,哎,那个 reddit 的 这个草稿 啊,比如说他不带链,我跟他要求就是不带链接,不自动发布,不硬堆,这个不硬推,就是不要广告,性质太太明显,对吧?好,那这个是风控的,呃,他要去检测的是什么?就是你广告是否过度啊,有没有虚假呀,造假呀等等等等的这些信息,就是 这个,就是我每还有这个是增长,哈,增长他就是干嘛呢?他主要是看我们的数据,比如说每天发布的数据,增长的这些数据,这些 就是我们现在我这个系统,我要让他去做自动化的运营的时候,我要去创建这些,那在创建的时候我给他指定的标准的,或者我给他指定的他的他本身的职责,还有我给他一个边界,哪些事情可以干,哪些事不能干,同时呢我要去考虑第四点,就是他们之间怎么去协调。 那我这里面采用的是主 agent 调度主 agent 的 方式,就是不要让 agent 之间任意调动。就是,呃,比如说我们说这里面有六个 agent, 那 六个 agent 他 们之间,比如说二三四五六他们之间我们是不愿,我是不会让他随意去调动的。统一的是由第一个就是主 主 editor 他 他来负责,调用他来负责,比如说就是中心化的编排,我们上面讲了吗?你这个事情我们什么时候发,发什么的,对吧?这些全部是用来编排。然后呢?呃,每个 editor 他 是基于主 editor 的 啊要求来做事情,他们自己不要去发挥,就他不要去自己发挥。但同时你可以看到下面就是啊每日的写作流程,就是这个是写作流程,是主 editor 他 每天要干嘛,对吧?第一个是调用,然后第二步、第三步,直到第十步,他 做很多事情,他每天就是,呃,我给他列好了第一步干什么,第二步干什么,第三步干什么,对吧?等等等,全部给它确定好,那在这里面呢?呃 呃,像我的 open call, 它是不直接发布这个 x 的, 它只是请求,因为在我的系统里面,在我的系统里面我是做了那个 x 的 接口的,我是做 app 接口的、 api 接口的发布,其实在我的这个系统里面,它是可以直接去完成发布的。 这个 agent 它的作用是什么?就它不会让 open call 自己去发,同时它只是请求我的系统来发布,真正的发布是由我的系统来发布的。 agent 它不能直接发,它只是做协调和调度的作用。好,完了过后呢,你可以看到这是我的 agent 的 协助图,比如说,呃,第一步它要干嘛?第二步,第三步它是 你可以看到这这个地方每一个它的步骤是什么样的,这个是一个协助图,完了过后呢?我这个地方还给他一个明确的,就是哪些 agent 是 可以调用我的 那个 oppo 的, 呃,助手就是我的工具的,那这里面我只是建议只有主 agent 是 可以调用的,其他的 agent 都不能调用,为什么?就你一旦调用太多,呃可可能会出现一些问题,这些问题就 就会导致你的这个任务执行过程中出现一些莫名其妙的这个错误出来。所以说我这个是给他严格的要求,就是你不能去调我的这些工具, 那这个就是他的一个标准。然后还有一个更安全的方式,就是我们所有的工具, oppo 的 这个工具都都是用主硬件来吊起,只硬件只是处理这个主硬件给他的这个,呃任务, 这就是他的一个标准。然后下面就是我的这个,呃,我的系统里面,我我给他的一个权限,就是我给主硬件这个权限,呃,这个地方可能代码大家看,嗯,不太清晰,无所谓啊,这个不用管,其实本质就是,呃,让 你的这个大家看一下这一个什么内容的,呃,获取内容草稿,然后内容草稿发布,发布的状态,获取这个数据,然后每周的报告哈,简要的哈,这就是他的一个权限,他可以从我的系统里获取这些,然后其他的这些 agent, 大家看到我的其他的这些 agent, 他 都是没有权限去读取我的这个我的这个呃呃那个系统的权那个 接口的,然后我在后台,呃,我在 opencloud 的 后台是怎么创建的呢?第一步就是我要去让他去给我的这个呃工具去获得这一个代码款哈,这是我自己写的哈,就是他要去获得认证,呃,获得我的这个系统认证,他给我这边有,我是做了接口的,他需要呃 opencloud 把那个链接放进来,然后自动来调好,调完过后呢?呃,下一步他就需要去注册这些工具,注册完过后他要我要让他干。第三步就是创建主 agent, 创建主 agent 呢?我下面给了他有这个呃这个 agent 的 prompt, 大家看看哈,呃,我这个地方有一个这样的,就是呃 agent 之间不要怎么做哈,大家看一下 agent 它只干自己的事情,然后呢?这下面是指 agent 的 这些 prompt 就是 他的,大家看一下我给他写这个规则的时候就想的很清楚他是干嘛的,对吧?他可他是只能做哪些事情,然后哪些事情是不能做的这些事。我,我可以直接把我的这个 permit 直接丢给那个,呃,丢给这个,呃 open cloud, 然后呢?让他来去创建,那如果我最开始我要想把它应用起来,系统给我的建议就是最开始 用四个 id 就 可以了,第一个主 id, 第二内容内容,第三个是 delete, 第四个是分控好,那这些东西全部放到这个 open color 里面,它最终给我生成这个 id。 其实我想要实现的就是 不会像我原来最开始推我的 app 这种方式了,这个是全部是自己他们自己的配合,这种配合就跑简单的,你跑几个任务没问题,但我一旦跑量,我最近又遇到这个问题,就是让他跑量,每天跑,最开始每天跑二十个油箱,油箱没问题,他爬数据是 ok 的, 跑起来也没问题,但我有一天突然给他提了三百, 每天三百的时候他就会报错,拿一堆的问题出来,搞得我每天都去修复他。所以说我现在就是我在调用 agent, 我 要让他去多 agent 协调的时候,我就是不,不是单纯的是给他一个那个 prompt, 让他去生成 agent 就 去做,那样的话你每天都在去解决 agent 的 之间的问题,所以说 这就是大家看一下,我这个是在我后台创建的顺序,我要把这个事情做成我的创建顺序是这样的,然后下面你可以看到就是,呃, 最终我在 open call 后台我创建多 agent, 然后呢?就是一个总的,然后多个无止无权限的止 agent, 然后所有的集中,所有的那个工具的调度都在总啊主 agent 里面,是最终的执行动作。像这个地方啊,最终的这个,呃,这个叫啥? 呃系统的,呃内容的发布啊,内容的创作,这些全部是在我的这个系统里面来完成啊, open 它本身不完成,它只是负责调度的这个动作就 ok 了。所以说这块就是呃,我现在在做的这个事情就是,呃, 包括我们最近自己在做这个外贸获客那个数字员工系统的时候,其实也是按照这个逻辑在做,为什么这样讲?就是我们自己陆陆续续在跑一些任务的时候就发现如果单纯的靠 agent 去, 你不给他太好的,就是不给他做好定义,不给他做边界或者是权限的控制的话,他会出很多问题,可能你一天你可能就是不断的去修复,突然哪一天他哪个环节出了问题,我还得挨个挨个去找,这样的话做起来你的这个效率会低很多很多,所以说这就是 我说的。然后还有就是大家看到我这个屏幕上面就是 agent 之间的数据交换啊,比如说 a 到 b, b 到 c 等等的这些交换,其实,呃我最终我们落实下来就是它的数据交换等等,全部还是通过主 agent 来把控,那 就现在是一个团队的一个小组长,对吧?小组长来统一负责所有的小组成员之间的这种协调,那这样的话呢?效率会高很多,而不是让他们每一个之间每一个去各自为战,对吧?不让他让他去各自为战,这就是呃我们关于这个 呃 do agent 协助的一个内容分享哈。呃,如果大家有关于 do agent 的 一些想法呀,或者是一些思路都可以在评论区留言。

各位朋友你们好, winz agent 已经开源通过阿帕奇啊协议进行一个开源,也就是说你们可以将这个项目进行商业化的一个二次开发或者说部署 啊。 y z a 教授的话呢,是一个传大学语言实现的一个 ai 管理框架,也就是说它可以在局域网中部署多个设备啊,在多个设备上部署这个 ai, 这个一个呃一个代理,也就是说我们可以在局域网中通过 一个手机或者说一个电脑去控制局域网的多个啊这样的一个 ai, 然后让他们协调起来,然后可以不断的切换设备啊,光说不练假把式。我带大家演示一下这个多 a 键的是什么一个意思啊? 也就说我们多 a 键的话呢,就是说我们在局域网启动这个 a 键的之后的话呢,我们可以在我们自己的一个开发的一个客户当中啊,接入这个系统之后的话呢,我们可以在这个 切换这个设备,比如说这个设备在这里,然后这个设备在这里啊启动一个,这样我命名为这样一个设备,然后进行一个啊自己的一个任务。大家也可以看到我每次切换的话呢,它的消息是在不同的设备中啊传输的,也就是说我切换到这个 kimi test 的 话呢,就是说它就 啊切换到这个对话,然后切换到另外一个对话的话呢,就是为空的啊,可以发送消息啊,然后我们这个多设备的话呢,有什么作用呢?多设备的话呢,也就说我们其中最重要的一个功能就是我们可以在手机上啊进行 控制,我们另外一个电脑上的一个啊工作,也就是说我可以将这个部署到服务器上的话呢,那就可以在远程控制了。 ok, 那 么接下来的话呢,我来带大家啊,去使用一下这个 windows a 键的, windows a 键的话呢,我发布了第一个历史版本啊,也就是说你们可以直接在这里面下载这个命令行工具啊, 它在命令行工具的话呢,是支持 linux 还有 mac os 还有 windows 三个系统。我们现在的话呢,是在啊 windows 上进行一个运行啊,所以我带大家在 windows 上演示一下,下载 windows 一个程序啊,下载下来的话呢,我们可以解压出来, 那么解压到哪里呢?我们可以解压到自己的一个工作路径啊,随便取一个比较记得到的一个路径就 ok 了。那么我呢是将这个解压到这里啊,我给大家演示一下,也就是说我们从这里解压出来, 然后他应该是需要替换,替换掉,然后的话呢,我将这个配置删除掉啊,带大家从零到一去搞一个 它。这里的话呢,有个默认配置,解压之后的话呢,在这个 config 文件夹的话呢,有一个这个一个 jump 的 一个文件,那么我们给它复制出来,然后将这个改一下啊,这个特别是这个 client 还有这个 server 都要去改一下,然后去配置一下。 ok, 首先的话呢,我们配置一下这个 server 啊, server 的 话呢,我们将这个这个 word 加 server 这些名字改一下,端口改一下,这 ds id 不 需要,然后直接启动 server。 ok, 它启动了一个搜索程序啊,在九六九年端口 ip 的 话是这个局域网的 ip。 ok, 那 么我们再配置一下这个 client, client 的 话呢,我们可以在一个命令好中去启动一个 client, 这样一个作用的话呢,就是我们将这个这个这个 ip 改成七啊, house ip 改成七,然后 device id 的 话,我们 test device 九五二七,我们给一个这样的一个 id 啊,然后我们在这个数据库存储路径的话也是给到这里,然后的话呢,呃, topic 的 话呢,就不需要这样方便我们后续去连接它。 ok, 我 们改完之后的话呢,双击启动或者用命令行工具启动都是 ok 的 啊你们, 呃直接应该是启动了吧,在这里启动了一个这样的一个 ok, 然后我们打开我们这个 windows pdf 工具啊, 然后现在的话呢,因为我们接入的是旧系统,现在的话我想要接入一个新系统的话呢,我们就需要在这个局管中啊加入这个先离开一下子, 然后这里改成九零九零,改成我们这个刚刚的启动的这个端口。 ok, 加入之后的话呢,我们就可以在里面看到一个啊,这个设备的话呢,这其他的都离线了,那么我们可以切换到这个 my lab top test d y 是 九五二七,看到吧,我们可以在这里面这进行一个兑换,但是在这里切换之后的话呢, 这个数据已经切换过去了,但是我们这个项目也是自动化同步到这个设备上去了啊,就可以打开它 log 就 行了, 这样的话呢,他就会开始我们的一个工作,也就是说呢,他会在这个设备上进行一个工作,他已经标记设备对员工这一大堆日记啊,然后他自己会调用这个工具闲话,然后看看他回复了什么, 他回复了一个 hello, ok, 那 么这个就是我们的一个啊, windows a 降头工具的一个演示啊啊,这个工具使用非常简单,只需要配置一下,然后启动一下就 ok 了,然后通过我们 官网的这个 windows pdf 工具进行一个连接啊,当然大家后续的话呢,我希望你们每个人都可以啊,自己去开发一个这样的一个工具啊,去连接到这个系统, 然后也可以自己去 diy 一 些自己的一些功能到这里面啊,或者说先 fok 一下这个项目,然后啊去改一下,然后去去学习一下。后面的话呢,我也会做一些相关的一些教程视频啊,希望大家可以点个关注,感谢各位。

大家好,我是大叔,只说真话,只做实在事,只给干货。大家好,昨晚本来想着早点睡觉了,结果看到后台多了几十条私信,大家都在问同一个问题,就是怎么在同一台电脑上运行多个独立的 hermes agent。 如果用同一个配置,很容易搞 appme, 互相干扰,记忆和绘画历史也混在一起。 hermes agent 提供了 profiles 功能,可以完美解决这个问题。认真看完这篇教程,你将学会创建和管理多个 profile。 三种克隆方式,命令一 p 标志年性默认值的用法, 配置独立网关和机器人令牌,还有更新、导出、导入和删除操作。咱们直接看内容来。先了解一下什么是 profiles。 简单来说,就是一个独立的 hermes 主目录,每个 profile 都拥有独立的配置文件,包括 config 点 emo 点 inviso 点 md, 还有独立的记忆数据库、绘画历史 技能库和状态数据库,这样就能为不同目的运行独立的 agent, 比如变成助手、个人、机器人、研究 agent, 它们互不干扰,完全隔离。最方便的是创建一个叫 code 的 profile, 马上就能用 code chat、 code setup、 code gateway start 这些命令。好了解了概念,咱们看看怎么用。快速开始非常简单,只需要三步。第一步,执行命令 hermes profile create code, 这会创建一个名为 code 的 profile, 同时自动生成命令别名。 第二步,执行命令 coder setup, 按提示配置 api 密钥,选择模型提供商,设置默认模型。第三步,执行命令 coder chat, 就 可以与 coder 这个独立的 a 键开始聊天了,就这么简单,一共有三种,满足不同场景需求。第一种,空白 profile, 执行命令 hermes profile create my bot, 这会创建带有捆绑技能的全新 profile, 然后运行 my bot setup, 配置 a p i 密钥模型和网关令牌。第二种,紧克隆配置,执行命令 hermes profile create work 加 clone 参数, 这会复制当前 profile 的 config 点 emo 点 n v 和搜点 m d 共享相同的 api 秘钥和模型,但拥有全新的绘画和记忆。第三种,克隆全部内容执行命令 hermes pay profile create backup 加 cloneout 参数, 这会复制所有内容,包括配置, api 秘钥、个性、所有记忆、完整绘画、历史技能、定时任务插件、相当一个完整的快照备份。你还可以从特定 profile 克隆,比如, 比如执行命令 hermes profile create work 加 clone 参数,再加 clone from code, 这样就能从 code 克隆配置到 work。 创建好 profile 后有三种使用方式,第一种,命令别名,这是最方便的,每个 profile 在 波浪线斜杠点 local 斜杠被斜杠名称目录下,自动获得命令别名。 比如你可以直接用 code chat 与 code agent 聊天,用 code setup 配置 code 的 设置,用 code gateway start 启动 code 的 网关,用 code doctor 检查 code 的 健康台,用 code skills list 列出 code 的 技能。第二种,使用 p 标志,这是最灵活的执行命令 hermes 加 p code 再加 chat, 或者执行命令 hermes 加 profile 等于 code 再加 doctor, 甚至可以在查询时指定 hermes chat 加 pcode 加 q。 后面跟 hello。 这种方式适用于任何命令。第三种,粘性默认值,最适合长期使用。执行命令 hermes profile use code 之后执行 hermes chat 就 默认针对 code 执行。 hermes tool 也是配置 code 的 工具,如果想切换回默认执行命令 hermes profile use default 这类似于 quebeco configuruse context 的 使用方式。另外, client 会实时显示哪个 profile 处于活动状态, 提示符会显示 code 加右键头符号,启动时会显示 banner。 执行 hermes profile 命令会显示详细信息。 接下来讲讲如何运行 gateways。 每个 profile 可以 作为独立进程运行。自己的网关拥有独立的机器人令牌,每个 profile 都有自己的点音频文件,可以配置不同的电报 discord slack 机器人令牌最棒的是安全令牌所机制。如果两个 profile 要意外使用相同的机器人令牌,第二个网关将被阻止,并显示清晰的错误信息, 这样可以避免冲突。启动不同 profile 的 网关很简单,执行命令 coder gateway start 启动 coder 的 网关。执行命令 assistant activate taway start 启动 assistant 的 网关,它们是独立进程,互不干扰。如果需要持久化服务,可以执行安装命令。执行命令 coder gateway install, 这会创建 hermes gateway system d 或 launched 的 服务。 同样,执行命令 assistant gateway install 创建 hermes gateway assistant 服务。支持的平台包括电报、 discord, slack, whatsapp 和 signal 都支持令牌锁定机制。 每个 profile 都有自己的配置文件,主要包括三个文件,第一个是 config 点 emo, 这里配置模型提供商,工具级以及所有设置。第二个是点硬币文件,存放 api, 密钥和机器人令牌。第三个是 c o 点 md 文件定义个性和指令。配置模型很简单,执行命令 code config set model, 点 default antropics 斜杠 close on the four。 设置个性的话,可以用 e q 命令。执行命令 echo 后面跟双引号 u r a focus coding assistant 点双引号, 然后从定向到波浪线点 hermes profiles coder 目录下的搜点 md。 如果需要设置工作目录,执行命令 coder config set terminal, 点 cwd, 后面跟上项目的绝对路径。这里有个重要提示,搜点 md 可以 指导模型,但不强制执行工作区边界, 如果需要可预测的起始目录,请显示设置 terminal 点 cwd。 最后讲讲如何更新和管理 profiles 更新非常简单,执行命令 hermes update 这会拉取一次共享代码,然后自动同同步新捆绑技能到所有 profile, 用户修改的技能永远不会被覆盖。管理命令也很丰富。执行命令 hermes profile list 执 行命令 hermes profile coder devbot 显示一个 profile 的 详细信息。执行命令 hermes profile rename coder devbot 可以 从命名 执行命令 hermes profile export code 导出为 c, 点 t r, 点击 z。 执行命令 hermes profile import code 点 t r, 点击 z, 从规章导入。 如果需要删除 profile, 执行命令 hermes profile。 delete code 需要输入 profile 名称确认,也可以使用加 yes 参数跳过确认。删除操作会停止网关移除 systemd 或 launch 的 服务, 移除命令别名,并删除所有 profile 数据。另外还支持 tab 补全。对于 bash, 执行命令 evo 后面跟双引号,美元符号 hermes completion bash 双引号。 对于 zsh, 执行命令 evo 后面跟双引号,美元符号 hermes completion zsh 双引号。好了,今天的分享就到这里,咱们回顾一下核心功能。第一,独立运行在同一台机器上运行多个独立 agent, 每个都有独立的配置 api 秘要记忆绘画技能和网关状态。第二,灵活创建,支持空白创建,仅克隆配置克隆全部内容三种方式满足不同场景需求。第三,便捷使用,提供命令别名、 b p 标志、年性默认值三种使用方式,克莱实时显示活动 profile 状态。 第四,安全管理,每个 profile 独立运行网关,支持令牌锁定机制,防止冲突。提供完整的更新管理和删除功能。如 你需要在同一台机器上运行多个不同用途的 groupon agent, 比如编程助手、个人机器人研究 agent。 强烈建议使用 profiles 功能实现完全隔离,这样可以避免配置和状态混乱。我是大叔大实测验证并整理,后续会持续革命性 session 的 相关内容,感谢观看,咱们下期再见!

如果你想拥有一个熟人的团队,但是又觉得搭建 ide 很 难,那么有没有想过让 ide 帮助你搭建 ide? 第一步,新建一个智能体,点击 ios 里面的新建智能体,然后创建一个空白的智能体,点击下一步给它起一个名字,比如说 a i 智能体,搭建助手,然后就点击下一步就可以了,这些都不用管他技能的话,也不用给他装 就可以。第二步也是最重要的一步,就是点开你新建的智能体的聊天框,然后把这一个提示词给还有这七份协议,这七个协议是数字人团队的灵魂,但这不是我写的,是我一个阿里的朋友分享给我的, 我可以免费的给大家私信我就好。如果不感兴趣的情况下啊,这两个协议呢,给整个团队的角色进行了一个定位,后面呢还有一些各种各样,我也不懂这个东西,其实说 后面这五个协议就是每一个角色的身份定位。比如总经理,你是一个外贸总经理,负责群居操盘,采用捷克威尔骑士的管理,我后面的每一个角色,他的设定都在这里面。 当你把这些发给 ai 之后, ai 就 可以经过一系列的处理,然后搭建出你的外贸团队。 点击右上角的智能体,可以看到每一个 ai 的 配置和设定。比如说这个总经理希尔,可以看到这是 ai 自己编辑的这个智能体是做什么的,然后 他的这个技能可以看下这个技能,这是 ai 自己添加的,包括他的各种设定。其实我们真正来写一个,这个 ai 会帮他给配置清楚。那么最后一步,点击这里有一个加号,新建一个群聊,在创建团队里面,把你已经搭建好的团队成员配置进去, 那么恭喜你终于拥有了一个负责人团队,但是不要忘记两件事情,第一把你的总经理设置为团队的负责人,第二把你的这套话术发给就这个提示词发给 ai, 然后你的 ai 的 智能体的助手就会实时的更新其他智能体的技能。然后这边呢,其实这个文件这个区域呢,就会产出他们做的所有的内容,你可以去看一下这个 ai 的 进度啊,还有他们做的流程。 然后在最后想和把这个视频看到结尾的各位聊一下,因为我也是第一次做自媒体,第一次想把自己在创业路上找到的东西分享给大家。我的第二条视频就是我用 ai 在 国际站上发品的那个视频,没想到会有几百人点赞,有很多创业者联系我,和我聊了很多,这也算是给了我很大的信心。所以在这里呢,我就厚着脸皮给各位 要一个关注和点赞,但是关注我肯定不亏,因为我肯定会继续在这个账号上分享我的 内容。然后我目前的想法是两块,第一呢是互联网的运营,第二呢是 ai 的 使用,如果,如果说你和这两个点切入的话,那我们可以聊上很多,然后 关于我这个账号后面的发展方向,各位也可以帮我支支招。然后最后呢,我想到了一个结尾,叫越分享越成长,我是春秋,想和各位共同成长。