今天我想聊一篇关于 hermes agent 的 技术分析文章。 hermes agent 是 liu research 开发的自改进 ai agent, 寄予 python 构建。 它最让人印象深刻的是一个核心类 ai agent, 支持四种大模型 api 模式,集成七十多个工具,还能跑在二十多个消息平台上。 这篇文章从源码级别完整剖析了它的实现细节,从架构到循环,从工具到记忆,非常硬核。先看整体架构,最上层是用户接入层,包括命令型工具、网关服务和编辑器,集成覆盖二十多个消息平台。 中间是核心的 a i a 阵类,它管理着三个关键模块,系统提示词构建器、 a 键、多轮循环引擎和工具执行器。底层则是一系列支撑组件,提示词缓存降低百分之七十五的输入成本。上下文压缩器,防止对话溢出, 记忆管理器,维护长期知识,还有 l l m 适配器,支持 answape、 gemla、 bedrog 等多种模型。 这种分层设计让每个模块都可以独立演进。整个 a 阵的灵魂是 run 下划线 conversation 方法, 这个方法足足有三千两百行,本质上是一个精密的状态机。它的流程是这样的,先车令环境构建七层系统提示词,预压缩历史消息,然后进入主循环,每一轮都构建 api, 请求发起流式调用,处理响应。 如果模型返回了工具调用,就执行工具追加结果继续循环。如果没有工具调用,就提取最终响应退出 错误恢复也做得很完善。 api 连接失败会重试三次加指数退币,上下文过长会自动压缩,速律限制会自动轮转平距。 工具系统采用了优雅的自注册模式,每个工具文件在模块级调用 register 点 register 启动时,通过 a s t 扫描自动发现所有工具无需中央配置文件。 工具执行支持条件并行,只读工具,如搜索和文件读取可以同时运行,最大并行度八个,但交互式工具永远不会并行。 还有一个亮点是子 a 镇委派机制,副 a 镇可以把子任务交给子 a 镇处理,深度最多两层,每个子 a 镇有独立预算,并且子 a 镇不能再创建子 a 镇,防止地规爆炸胀陷了。温缩是整个项目最复杂的部分, 它采用多阶段策略,先用 md 五去创旧的工具,结果保留最新的,再用一行摘药替换永长的历史工具输出,然后保护最近二十条消息不被压缩。 对中间部分用大模型生成结构化摘药,包括活跃任务目标、已完成事项、关键决策等。 还有个反抖动机制,延续两次压缩,节省不到百分之十就暂停,避免无意义的压缩循环。压缩域值默认是上下文窗口的百分之五十,即系统支持内置记忆加外部插件记忆, 记忆内容通过后台现成预取注入到用户消息的临时前缀中, api 调用完成后就移除,不污染历史记录。 终端机制设计得非常细致,采用现成既中断而非全举标志,因为网关可能同时运行几十个 a 帧,实力全剧中断会导致跨绘画干扰。 还有一个引导功能也很巧妙,它不中断当前正在执行的工具,而是把用户注记追加到下一个工具结果里,让模型在下一轮自然看到引导信息。最后说说几个关键设计决策, 为什么乱下划线。 conversation 有 三千多行,因为它要处理四种 api 模式下的各种边界情况,这是复杂度的必然结果,不是设计缺陷。 为什么用自注册模式?因为工具文件完全独立,插件和 mcp 工具通过同一个注册表统一管理,扩展性极强。 整个 hermes agent 的 设计哲学是,复杂度放在该放的地方,核心循环处理,所有边界工具保持独立和可扩展。如果你正在构建自己的 agent 子框架,这份原码分析非常值得仔细研究。我是林申健 ai, 我 们下期再见。
粉丝163获赞1197

ai 玩的妙,生活不枯燥。大家好,这里是新 gpt, 带你爽用 ai。 春节的时候啊,我发了一篇爆款的长文,讲我是怎么用金融 agent 来做交易的,全网阅读呢,也超过了两百多万。但是当时呢,我是用龙虾 openclaw 来举例的 实际实践,实践的过程中呢,至少有一半时间在改 bug, 可谓是安装龙虾一时爽,改 bug 流泪火葬场。这龙虾热归热呀, 但是用上了之后呢,要调整东西是非常多的,最近有一个礼拜已经没动过了,你的龙虾是不是也很久没更新过了呢?不过接下来啊,我要介绍的这一款产品,绝对可以替代龙虾,叫做 hermes agent。 这个 hermes agent 呀,是 nas research 这个团队开发的开源自动化 ai agent, 它的核心理念是越用越聪明,每完成一个任务,就自动将成功经验沉淀为可付用的 skills, 无需人工编辑。相比之下, opencloud skills 呢,是静态文件,需要手动去维护。 那么关于 hermes 的 开发团队 niles research, 我 多说两句,这个团队在开源的模型圈子里呢,有一定的知名度,它的核心产出呢,是 hermes 系列的微调,然后让模型的表现更好,那么显示团队呢,也只有十九个人。 好,我们现在进入正题,首先我们看看 hermes 怎么安装,其实安装非常简单,我们到官网上把这个安装链接复制到自己的终端,然后输入它就会自动运行去安装了。 那么我们可能要稍作等待一段时间,让这个软件去安装一些依赖。那么经过一些等待之后呢, 有一个关键的地方,它会弹出来一个对话,问你是否迁移 openclock, 也就是说你如果选择夜色的话,你之前对龙虾的配置就可以一键迁移到这个 hermes 里面,那么我也是进行了一个迁移,也非常的方便。 之后呢,我们就可以进行一个 quick setup, 然后去选择我们要用的模型的 a p i, 然后一路点击下去,就可以完成整个的安装过程,整个的安装过程还是非常丝滑,然后也是非常快速方便的。当然和龙虾一样呢, hermes 也支持我们链接各种的社交软件的前端,比如说飞书,我们这里 以飞书举例,其实有安装龙虾经验的话应该不难,只要先去飞书开放平台申请一个机器人,然后去 hermes, 告诉他这个机器人的 app id, app secret 等等,以及根据他的提示给机器人一些权限,那我们就可以按部就班的完成整个的安装。 这里可以看到我们的飞书机器人在完成安装之后呢,就可以在飞书上与 hermes 进行一个对话。 好,下面我们讲解一些今天有趣的内容。我觉得 hermes agent 其实内部集成了很多的 skills, 非常有趣。第一个我们要介绍 skills 叫做 money video, 这个技能呢专门用于创建教学和技术视频,我最喜欢的一个课频道叫做 three blue one brown, 就 可以制作出非常相似的视频。 比如说我们今天想制作一段一分钟的视频来解释统计学著名的贝尔斯定律,我们只需要输入指令,他就会自动的开始执行,开始头脑风暴,钻研脚本,设计分镜等等,便可以得到一个质量非常不错的科普视频, 这里我们也可以看到我们生成的科普视频成果。当然呢,呃,有一些可以改进的地方,但整体质量呢,已经非常非常的超出我的预期了。 第二个我觉得最值得提的也是我觉得 hermes, 目前我用下来最有用的技能叫做 l l m wiki, 是 著名的 ai 大 神 karti 最近提出的一个大模型啊 knowledge base 架构。那么这个 wiki 的 想法非常简单,就是以一种 ai 生成的个人知识库,让大语言模型帮你把所有资料 翻译成一个互相连接的知识网络,并且可以按照主题分类,互相交叉引用。那么当这个 wiki 回答问题的时候呢,它会先读 index, 然后定位到相关的页面,再去读具体的内容。相比你自己去读报告呢,它解锁的效率和知识整理的这个呃结构化呢,都要强得很多。那最厉害的是呢,这个 wiki 是 活的,也就是每次你扔新的资料进去, hermes agent 呢,就会去学习这类知识,并且把它放到对应的位置, 然后如果你连接了 obsidian 的 话,它就可以做成一个知识缩影,管理起来非常方便。那么 hermes agent 呢,目前内置了这个 lm wiki, 不 用安装,直接使用, 只要你在新的讯息或者对话里输入啊 lm wiki 帮我研究这个项目,它就会帮你去整理这个知识网络,去进行一个研究。举个例子,我是把 呃,我最近比较关注的半导体行业知名媒体叫做 semi analysis 的 报告都扔到里面,让这个 lm wiki 去研究。那么 hermes 呢,直接开始 去读取每一个 pdf 的 这个重点章节进行分析加工,最后形成了一个非常完整的半导体行业的知识图谱, 并且我可以根据这个主题啊,行业概念啊,以及一些这个公司去查找。哎,你有没有发现,其实在使用 hermes 的 过程中呢, 有几个很有趣的点。一是它的自我进化功能啊,其实是潜移默化的,当它完成一个复杂任务之后呢,会把整个过程自动地沉淀成一份结构化的技能文档,存成 markdown, 然后下次遇到类似任务的时候呢,直接加载技能,不用再从头解决。比如说, 我在给这个 lm wiki 喂资料的过程中,大概喂了三次资料,然后 hermes 的 记忆系统呢,就自动帮我生成了一个叫做 lm wiki ingest skill, 用来帮我把类似的这个 pdf 文档整合进 wiki 以后呢,我只要给他发 pdf, 他 就会自动调用这个 skills, 帮我把这个资料喂到这个 wiki 的 系统里。因此呢,有 agent 用户说, kremis 在 两个小时自动生成了三份技能文档之后,重复性的研究任务速度提高了百分之四十之多, 这也就是它自动化的意义。另外有一点啊,除了上面的使用技巧,我觉得最值得关心的就是它 token 的 使用量。龙虾用户呢,用两三个小时的 opus 有 可能烧了超过两百美金。那 hermes 呢?我用下来啊,感觉它真的省 token。 第一呢,之前说过,它 skills 会自我保存和改善,这也代表着往往很多 prompt 不 需要再输。同样一件事,第一次 你可能跑十轮对话,第三次你直接调 skill, 三轮就搞定了,这样 token 的 使用量就自然减少了,你也省钱了。第二呢, skill 是 按需加载的,不管你装了多少,成百上千的 skill 也好,它的上下文成本几乎一样的,所以你不用再考虑所有 skill 塞进上下文,这样呢,也会 极大的省你的 token。 ok 讲了这些通用的 skill 玩法呢,老粉都知道,我们的优势在于金融领域对于 agent 的 运用,那么 hermes 的 表现呢,也是令人非常满意的。 hermes 装上对应的 skills 和金融数据库之后呢,我发现完全可以当做一个初级的量化分析师或者金融研究助理来使用。比如说,我直接问我的 hermes 怎么看半导体产业的强势板块儿,它根据这个 l m wiki 我 刚才建的数据库 得出了一个结论,就是 ai 加速器的产能, hbm 的 内存瓶颈等等。最后呢,我也发现,相关公司最近公布的业绩也显示出这些行业板块的警惕度的确在提升,我们通过分析就可以提前判断公司的业绩,从而提高投资决策的信心和准确度。 另外一个原因呢,也是我给 hermes 的 输入呢,是根据 simon analysis 报告,这个结论呢,也相当准确地反映出了产业端的一些看法。 当然,我们也可以在飞书上去问 hermes 某个公司的具体信息, hermes 就 会同时解锁本地的数据库 以及网络上他进行搜索的信息,综合给出一个我认为相当专业的回答。我们也可以看出啊, hermes 的 能力边界取决于你给他的数据来源够不够强大,他其实就像一个金铲子,只有在金矿上呢,才能挖出金子来。 ai 帮你赚钱的理念从来不是从零到一的 真空生妙有,而是帮你能从赚一块钱到赚两块钱的提效和升级。 hermes 呢最近也更新了两个非常重要的进展, 一个是它支持官方的微信连接,微信扫码即可支持,只要你升级到 hermes 的 最新版即可。另外一个呢,它对小米的大模型 memo 有 两周的免费调用,在配置 hermes 模型的时候,选择小米的 memo agent 即可免费使用小米的模型,限免两周。 这就是本期内容,赶紧用起你的 hermes 吧!感谢收看新 g p g 频道,有任何问题欢迎评论区评论交流,谢谢大家!

我们在上一集讲解了多平台接入,在哪都能找到它。本集我们讲解自定义 skill, 教 hermes 新技能。 hermes 的 学习循环会自动创建 skill, 但你也可以手动教它。这一集会讲 skill 是 什么,怎么写,怎么测,以及怎么把 cloud code 的 skill 迁到 hermes。 在 hermes 里,一个 skill 本质上就是 markdown 文件,你用自然语言定义行为,告诉它在特定场景下该怎么做。 而且所有平台共享的还是同一个 hermes 实力,所以你教会他一次,不管从 c l i, telegram 还是 discord 进入,他都会按同样的方法工作。背后共享的仍然是同一套记忆、同一组 skill, 以及连续的跨平台对话能力。手动写 skill 最直接的办法就是从一个具体任务开始。 这里的例子是统一 git commit message 的 写法。一个 skill 至少要写清标题、出发条件、行为规则和事例。 标题的作用是让 hermes 快 速识别用途。触发条件决定什么时候激活,行为规则决定怎么做,包括步骤约束和格式视力能把输入到输出的样子讲完整。如果还想减少漂移,可以再补一句,不要做什么明确边界。 像这个提交规范里,提交标题采用类型加范围再加减速的格式,长度控制在五十之内。标题后空一行论文重点解释为什么改,而不只是写,改了什么。触发条件也要尽量具体, 比起笼统地说代码太模糊,像提交代码写 commit message review, 提交历史这样的说法命中率会更高。 保存之后,下次你只要说帮我提交这些改动, hermes 就 会自动按这个格式执行。如果不想从零开始写,也可以先用社区里已经沉淀好的 skill。 hermes 自带 skill tab, 你 可以先问有哪些可用的社区 skill, 它会按类别列出可安装条目,也可以继续按方向筛选。确认之后直接让 hermes 安装, 他会把对应的 markdown 文件下载到 hermes skills, 然后立刻生效。安装完成之后, skill 仍然只是普通 markdown 文件,所以你可以继续开箱,即改,把它调成更适合自己的版本。 hermes 还内置了四十多个班斗的 skills, 覆盖 m lops、 github、 工作流、研究助理这些常见场景。这套体系真正实用的地方就是先附用社区经验,再叠加自己的工作方法,写好 skill 之后下一步。不是用社区经验,再叠加自己的工作方法。写好 skill 之后,下一步它已经可用,而是先确认它有没有正确命中,正确执行。 最简单的办法是直接问 hermes 现在加载了哪些 skill, 它会告诉你当前激活的 skill 列表。如果还想继续往下查,就去看日制。日制会记录每次请求匹配了哪些 skill, 为什么命中,或者为什么没有命中日制路径。就在 hermes logs 测试时,最好从最简单的真实请求开始,先确认出发和基本行为,再逐步叠加更复杂的场景。如果结果看起来不对,优先检查是不是有多个 skill 的 出发条件覆盖了同一请求。很多异常本质上都是 skill 冲突造成的。 skill 的 另一个价值是,它不必绑死在某一个 agent 里。这里的例子就是把 cloud code 里的 skill markdown 签到 hermes, 像公众号省校这种 skill, 只要格式和语义保持一致,复制过去通常就能直接识别,触发条件可以原样保留。像提到省校占领 ai 位,到 ait 了润色时激活这类规则本身不需要改, 省效流程也可以直接继承,比如先做事实省效,再做风格省效,最后做细节打磨。真正需要调整的,通常是那些和平台强相关的工具依赖。如果原文引用了 cloud code 特有的命令,或者某个专属的 m c p 服务,再改成 hermes 对 应工具就可以。 这就是 agent skills i o。 标准的意义。 skill 不 再是某个平台的专属资产,而是你自己的可迁移能力库。 skill 并不只服务于一个入口。 除了 telegram、 discord 和 slack, hermes 还支持 whatsapp、 signal、 钉钉、飞书、企业微信甚至 home assistant。 大 多数平台只需要在 config ymail 里配置对应 token 就 能接进来。如果把整套系统部署在五美元级别的 vps 上, hermes 核心 messaging gateway 和各平台入口就能一起长驻在线部署结构也很清楚, state dot db 负责保存所有对话历史, skills 目录负责保存自动积累出来的能力, config emo 负责集中管理参数。整套成本通常就是 vps 每月五美元,再加上模型调用费,换来的是一个有记忆、可迁移,还能二十四小时在线的 ai 助手。这一集解决的是怎样把经验写成 skill, 让 hermes 学会按你的方法做事。 下一集是 mcp 集成连接你的工具站,我们会看看怎样把 hermes 接到 git 数据库、 slack 和更多服务。下集见。

是选择 opencloud 还是选择 hermes? 这是最近 ai 圈里问的最多的问题,小孩子才做选择,成年人当然是我都要。今天我就带大家一起来安装一下 hermes, 来感受一下这个会自主干活的 ai 智能体。这里是 hermes 的 官方网站, 我们往下看如何安装 hermes。 什么是 hermes? 它是一个开源自组的 ai 智能体,我们来看这一句,支持 linux、 macos 和 wsl 二,所以我们要在 windows 上安装这个 wsl。 二、来安装 hermes agent。 首先我们来看如何安装 wsl。 wsl 是 微软自带的虚拟机系统,如果你使用微软推荐的安装方法,大概率下载不下来,因为它的速度非常的慢,所以我教大家一个方法,就是使用 get 号吧来下载,我把网址放到这里,大家进来后 点击这个 releases, 我 们可以看到最新的版本是二点六点三点进去这里就可以下载二点六点三的版本,选择这个二点六点三点零 x 六四下载这个版本, 它就会弹出下载地址,我们点击另存为就可以了。 wsl 安装好之后,我们还需要来下载它的乌班图的子系统的镜像文件。 wsl 它有在线下载 镜像的模式,但是这种模式太慢了,根本下载不完,基本上都会卡死,所以我们要自己来下载乌班图的镜像。打开这个乌班图的官方网址,乌班图点 com, 点击这个 down load for free 这个绿色的按钮,这就到了下载页面。下载页面这里我们要点击这个 选择 wsl 这一项,这个就是我们要下载的镜像文件,点击这个绿色的 down load 按钮,跳到这个页面,没有立即下载,不要着急,等一会儿 就会弹出下载的这个提示,我们点击另存为,选好保存的文件夹,然后下载,我已经下载过了,我不保存了。下载完之后,我们来安装 wsl, 这是下载的文件,我们来双击这个下载文件,它就开始自动安装了, 很顺利就安装完了。安装完了之后,我们可以看到下载好的 wsl 文件也有了图标,也就是说他已经有了默认的打开方式。我们双击这个文件,弹出的窗口,提示我们有错误,好吧,我们来想办法修复这个错误。复制错误信息,我们来查一下。点击,开始在搜索栏里输入这个命令, 点击左侧的更改或关闭 windows 功能这个按钮,找到这个适用于 linux 的 windows 子系统,确认它处于选中状态。还有这个 windows 虚拟机监控程序平台也要选中,点击确定, 于是我们重新启动。重启之后我们再来安装这个乌班图的子系统,这回可以正常安装了。 无斑图已经安装成功,并且正式启动了,提示我们第一次安装需要设置默认的用户名和密码,这个是询问我们是否同意收集个人信息,这个我们选择 n, 不 同意收集。 我们已经进入无斑图,注入一个命令,试一下,命令已经运行成功了,下面我们来正式的安装 hermes。 安装 hermes 其实就是一条命令,我们复制这个命令,切换到无斑图,粘贴命令回车运行。 到了这里问我们是否要为 t t s 也就是语音合成来安装 f f m p e g 这个我们选择 y, 提示我们要超管密码, 这个就是我们要来安装设置一下 permes, 这里我们选择 quick setup, 这个是让我们选择大模型的服务商,我选择一下国内的智普,因为它有免费的这个模型 复制了之后,在这点一下右键,一定要注意这里密码是隐藏的,不显示,然后回车运行,然后我们看这个 base url, 这是国际版的 base url, 我 们要把它改成国内版的, 复制这个 base url, 然后粘贴过来。在这里是让我们选择模型免费,模型有四点七 flash 和四点五 flash 两个,先选四点五 flash, 现在我们要来 选择我们的通讯的渠道,这里我们还是选择飞书,按空格选择打回车确认,这个是让我们选择扫码,或者填写 app id, 我 们选择第一个扫码, 打开手机飞书,点击加号扫一扫,我们来扫一下这个二维码,修改一下名称,二妹斯小助理立即创建 这里,让我们选择授权方式,选择第一个对对码,群里必须要艾特才能回复,这个可以直接回车跳过。这个是把 getaway 添加成系统服务,这个选择 y, 这个我们选择 user service, 提示我们安装成功,是否现在打开服务器,我们选择 y, 这个是询问我们是否马上查看 hermes 的 聊天界面,这个选 yes, 在 这里我们输入一句你好, 他已经回复了,你好,我是 hermes, 很 高兴为你服务,我们在上手机上试一下。你好,写一个 python 版的九九乘法表 给我们发过来了配对码,我们先 ctrl c 退出 for ms, 就 用输入命令重新加载一下环境变量,然后我们把配对码输入在这里,已经配对成功了,我们再来看一下手机配书,把刚才这一句重新复制粘贴一下。好的,他给我们回复了。 python 的 九九乘法表是这样写的, 会输出什么样的格式?好的,今天就到这里安装资料会同步发送到群里,感谢大家的观看,再见。

大家好,我是麦东,今天我们来聊一个很多朋友可能会感兴趣的东西, hermes desktop。 之前我给大家分享过 hermes 网页 ui 的 使用,最近社区又推出了一个桌面版的客户端,提供了一个原声的图形化界面,让我们在使用 hermes 的 时候可以更加的直观和方便。这边有个点先跟大家讲一下, 如果你本地已经有了 hermes, 那 么你再去使用这个桌面端的时候,它会直接连接到你本地的 hermes。 而如果你本地之前没有装过 hermes, 那 么你在安装这个客户端的时候,它也会自动帮你完成 hermes 的 安装。好,下面我们来看看实际的使用体验。 大家可以看到我的桌面打开 hermes desktop 之后,界面就是这样一个比较干净的窗口,左侧可以切换菜单,右侧则是我们主要的聊天窗口。大家如果不习惯看英文呢,可以点到 settings 里面,在这边下拉找到语言,将其切换为中文, 这样看起来可能就会好很多了。 hermes 的 桌面客户端所提供的功能其实跟之前介绍过的一些网页 ui 是 相似的。首先就是一个聊天窗口,我们可以在这边直接跟 hermes 进行对话, 然后接下来是会画列表,这边它会加载你当前 hermes 里面默认所有的聊天记录。我的 hermes 里面聊天记录比较多,所以它这边加载的时间也会比较长,我们就不等它加载了,继续往后看。第三个是答案, 答案其实就是我们所说的 harmus profile, 也就是 harmus 的 多智能体。在这边我们除了管理已有的智能体之外,还能直接新建智能体。第四个菜单,工作区,工作区是客户端提供的一个三 d 格式 y 的 看板,在这边你可以看到当前 agent 的 一些活动,说白了就是给你解个闷,但它并没有什么实际上的作用。 第五个看板,这就是 hermes 的 看板功能,之前我也有出过一期视频做详细的介绍,大家感兴趣的可以去看一下那期视频。而接下来的两个菜单,模型与供应商都是用来配置我们本地的 hermes 可以 使用的模型的,这个就不做详细讲解了,配置也比较简单。 接下来的技能菜单可以管理我们本地已经安装好的一些 skill 人格跟记忆。两个菜单则是直接编辑 hermes 的 source md 以及 memory md 这边涉及到我个人的一些隐私数据,我们就不点开给大家展示了。工具菜单我们可以在这边定义 hermes 在 运行的时候可以使用那些工具, 比如网络搜索、浏览器终端等等。再往下的计划任务以及网关则分别对应了 harmis 的 电视任务以及消息网关,我们在本期视频里也不做详细讲解了。整体来说, harmis desktop 给 harmis 用户提供了一个原生的图形化选择,让日常的使用过程变得轻松了不少。 当然了,他本身也是一个由社区开发的开源项目,功能也还在持续完善中,可能也会有些小问题,但整体来说已经可以正常使用了。他比较适合那些希望用更直观的方式来操作 hermes 的 朋友,并且呢,和命令行网页也完全不冲突,你可以根据自己的习惯随时切换, 感兴趣的朋友可以自行的去了解一下这个项目。好了,本期视频到这边就结束了,工具会变,但方法更重要,我是麦冬,下条继续。

你装好了 hermes agent, 感觉很酷,但用了一段时间后发现他还是经常听不懂你的意思。同一个事情要反复说好几遍,交给他的任务经常跑偏,代码质量也不稳定。他有潜力,但离真正能帮你扛活、帮你做决策的高智商智能体还差很远。问题到底出在哪里? 问题不在 hermes 本身,而在于它缺了六块关键拼图。它记不住你是谁,你的项目是什么?它缺乏结构化的执行流程,它生成的代码缺少工程化验证,它学到的知识转眼就忘。它只能跑在终端里,外出时根本用不上。 最关键的是,它不会自己变强,用一年还是老样子。今天这期内容,帮你一次性补齐这六块拼图。 我给你筛选出了六款必装的技能,它们来自全球开发者的实战验证,每一款都能让 hermes 产生质的飞跃。装完这六款,你的 hermes 将从能跑几步的助手,进化成真正能独当一面的数字分身。 第一个技能, awesome hermes, 它是社区维护的精品技能,所以有了它,你不再需要自己大喊捞针。生产级技能有哪些?哪个标签最稳定?搜索框一秒定位,开箱即用。装上它,帮你省下十几小时的试错时间,让你的每一步都踩在正确的方向上。 第二个技能, stack 五二七 ceo gary tan 维护的二十六人虚拟专家团队 ceo 帮你把控战略方向。架构师锁定数据流风险,产品经理追问需求细节、安全观扫描隐患。模糊的想法进去,结构化的方案出来。 装上它, hermes 不 再是单打独斗,而是背后有一整个智囊团。第三个技能, superpowers, 它给 hermes 装上了极致执行的四步闭环,澄清需求、制定计划、测试先行验证,交付代码跑通不算交付测试全率,才放心 装上它。 hermes 生成的代码从能跑进化到工程化交付质量有保障,反功率大幅下降。第四个技能, brain, 它是 hermes 的 知识大脑, 你和他聊过的每一段关键信息,他都会自动整理成结构化知识图谱。 minions 不 存在后台经过运行,你离线时,他也在梳理。下一个问题来临时,他已经记得你是谁,你在做什么项目。装上它, hermes 彻底告别禁于记忆。 装完这六款技能,你的 hermes 将彻底蜕变。它有进化地图指引方向,有虚拟团队帮你决策,有极致执行保障质量,有知识大脑。记住一切,它不再是那个时灵时不灵的聊天助手,而是一个真正能帮你扛活、帮你思考、帮你进化的数字分身。


哎,我跟你说啊,你手里的那个标准版 hermes 和装满各种神器的 hermes, 根本就是两个物种,真的一个在地上爬,一个在天上飞。所以今天咱们就来个大揭秘, 看看怎么通过五步,把你的 ai 智能体直接报改成究极完全体。 你看看这个对比,简直了!左边这个裸装版,说白了就是个小玩具,记性差还不能上网,能干的活特别有限。但右边这个满配班呢, 那可就厉害了,不仅有长期记忆,还能随时上网,会说话会画画,最关键的是用起来还超级省 toc, 这差距根本就是降维打击啊! 所以你是不是也好奇,这中间到底差了点啥?能有这么大的区别?答案其实很简单,就在这五大升级模块里,第一,给他灵魂和记忆。第二,让他联网。第三,解放他的表达能力。第四,把成本和效率拿捏的死死的。 最后一步,带你进入他背后强大的生态系统。来,咱们就跟着这份暴改指南一步步来好了,废话不多说,我们直接开干!第一步,给他注入灵魂,再安上一个超级大脑。 怎么给他灵魂?很简单,想让你的 hermes 马上变成某个领域的专家吗?用这个叫 agency agents gh 的 宝藏库就对了,里面有两百多个写好的中文角色,甚至还有专门给抖音呐、微信这些平台定制的智能体, 都给你分好类了,什么市场部、技术部,每个角色都是一个现成的文件,拿来就能用,即插即用,你说方不方便? 好,现在他有身份了,接下来咱们得解决那个记性差的问题,给他装个完美的记忆系统。 你看啊,他自带的那个记忆系统,说实话,又小又笨,你得手动往里写东西,还写不了多少字。但是这个叫 high inside 的 工具,那可就完全不一样了, 他能自动帮你把对话里的关键信息给抽出来,自己建成一个知识网络,等下次聊天需要的时候,他就把最相关的记忆精准的塞回到提示里,这才叫真正的过目不忘。 好,第一步搞定。接下来第二步,咱们要给他装上五官,让他能看见,能读懂整个互联网。 想让他看见,就得用这些网页抓取工具。你看 gina reader, 能快速看懂一个网页, curl4ai 呢,能做深度挖掘,把整个网站都给扒下来。 要是遇到那种不让看的网站怎么办呢?没事儿,还有 scraping grid 和 camouflfox, 就 像给他穿上了隐身衣,轻松绕过反爬虫。 有了这些,网上就没什么秘密是他看不见的了。当然,光有眼睛还不够,还得有个聪明的大脑来处理信息。所以你看,我们给他配上 tivoli, 这是专门给 ai 用的 soso 引擎,非常强大, duckgoon 可以 当个免费的备用。还不止这些,有了 panda 和 marker, 它连各种奇奇怪怪的文档都能读,就算是复杂的 pdf 也能给你整得明明白白。这么一套下来,它的信息处理能力直接就拉满了。 ok, 现在它能看能懂了,那么第三步就该轮到说和话了,我们要彻底解放它的表达能力, 装备上这些工具,你的呵 max 就 算是真的活过来了。用 whisper, 它能听懂快一百种语言,你说啥它都明白,用 h t t s 呢,它就能开口说话,而且还是免费的。那画画怎么办?简单, file ai 和 flx skill 就是 它的画笔,能画出质量超高的图片。你想想,能听能说,还能画一个全能型的 ai 助手,这不就诞生了吗? 好功能是越来越强了,但咱们的钱包也得顾着点,对吧?所以,这第四步就是高阶玩家的玩法了,把成本和效率控制到极致。 你先看这个数字惊不惊喜?用上这个叫 r t k, 全称 rust token killer 的 工具,跑那些端端命令的 token, 消耗直接给你砍掉百分之九十。这是什么概念?就是你的运行成本直接打一折,你说香不香? 那怎么知道钱具体花在哪儿了呢?很简单,如果你想快速看个大概,就用 talk scale, 它能在命令行里实时告诉你总共花了多少 toc。 如果你想看更详细的账单,那就用 hems 哈读 e。 它有个网页界面,能把每个零件花了多少钱都给你列得清清楚楚。一个看总览,一个看明细,总有一个能帮到你。 不过要说最酷的,还得是这个,它能自己净化。没错,你没听错, 背后用的是一种叫遗传算法的技术,说白了就是让赫姆斯自己去试,错了就改,对了就保留,慢慢的,它就能自动找到最好的工作方法和提示词。也就是说,它会在使用中自己变得越来越聪明,越来越强。 好了,到这儿你的智能体已经非常强大了,但别急,还有最后一步,我们要为你打开一扇大门,带你进入一个更广阔的世界。赫摩斯生态, 你可以从这两个地方开始探索。第一个叫 awesome hermes agent, 这基本上是一个一站式的资源库,你想要的各种工具资料里面几乎全都有。 第二个叫 hermes ecosystem, 它更像是一张地图,用可识画的方式给你展示了八十多种相关的工具。记住,给你的 agent, 它升级这条路是没有终点的。 好了,经过这五步爆改,一个真正强大的超级智能体现在就在你手上了。那么最后的问题留给你,你打算让它为你做点什么呢?

兄弟们,怎么让大模型记住关键记忆呢?上期说上向文压缩啊,会导致 ai 失忆,那把重要内容写下来,让 ai 去看备忘录,不就不会失忆了吗?比如呢,给在滤镜大师里面部署的 openclaw 或者 hemes 建一个 memo 文件, 把关键的设定、操作规则、用户偏好全记进去。每次他执行任务前呢,不是靠上向文硬记,而是先翻这个记忆本,这样 无论上下文窗口多小, ai 都能随时查到重点信息,不会再忘了之前说过的事。但是呢,时间久了呀,只有一个秘密文件的话呢,内容就太多,很容易一开始就把魔性上下文给撑爆。嗯,怎么解决这个问题呢?

当 ai 掀桌时,没人会等你学完 hello, world 如果你不知道从哪里开始,接下来请和我速通八个 ai 必学的顶级知识点,掌握四种以上的人可以胜任百分之八十的 ai 岗位。呃,这段时间这个黑妹子的这个 agent 非常呃受关注, 核心原因呢,不是因为他能够聊天,而是他越来越像一个会自我成长的 agent, 用的越多呢,你会发现他能力呢就在不断成长啊,智能库也在持续的进化,更多大模型资料可在这主页群领取。呃, 好,大家好,我是金哲。那今天呢,我就用这七步带大家来看一看他是如何从这个毛坯版啊变成真正能干活的专属智能体。 首先呢,我们第一步先不要着急装功能啊,你要先去确定他的身份角色啊,你可以先建一个瘦点 md 把他是谁对吧?哎,他的角色定位,说话什么风格啊,做什么事情用什么办法啊,哪些边界不能碰,全部写清楚。说白了,这一步呢,不是在给他 那做工具,而是在给他立什么,立这个人设对不对?好,如果你不想从零线呢,也可以直接去参考一些其他的这种职业模板啊,先去套一个这种现成的框架,再慢慢去改成你自己的风格,因为没有这一步,你后面装再多的能力啊,他也是一个只会说话的 好。第二步,我们要去给他换一个什么呢? a 键它呢, 不是每次都会重头认识你,而是越用他能够越懂你,越知道你的喜好。这个地方呢,我们就可以用他的这个呃,记忆的一个配置啊,去连接,让他自动的提取实体事实、时间信息、人物关系,然后慢慢的 搭配长期的这个记忆跟知识关联。这样一来呢,你之前聊过的这些项目偏好,目标进度,他都能够记住,这个时候呢,智能体就不再是临时聊天,而是开始进入持续写作了。第三步呢,我们给他啊 安装一个全网抓取的能力,这个部分呢,因为你光想不够,你还得去连接外部,对吧?你得会去看世界。那比如说像这个 gina 的 这种工具呢,我们就非常适合去做一个什么呢? 哎,单页内容读取,包括啊其他的这些抓取的工具呢,我们啊分别有这种批量抓取的,自动化采集的 啊,那所以呢,这里呢,触杂复处理这个更加复杂的页面访问场景。这一步的意义呢,就是你让他不只是听你讲,而是真正能够呢,去网上帮你找,帮你去读,帮你收集相关的资料。好,第四步,我们给他转一个什么呢?专业的研究工具。 这个部分呢,因为我们抓取回来的内容只是啊原始的这样的一个数据格式,那真正难的是呢,怎么把它变成能够用的知识。那这个地方呢,我们像这个啊, 可以负责万能的这个格式转换,对吧?那我们这个 mark, 它可以把 pdf 转成 markdown, 对 吧?那这样呢,我们适合把长文档研究资料扫描件呢这类的,这个内容整理的更加干净啊,结构化,你可以把它理解成是什么呢?做了一个数据的清洗, 把这个资料呢洗的更加干净,你后面呢,读起来才会更加顺利。好,第五步,我们要去做一个什么,做一个多模态的升级, 这个部分呢?哎,我们就不是让他从以前只会打字,对吧?我们是让他可以做什么呢?语音识别啊,哎,还可以负责什么呢?语音的合成,甚至可以做高质量的图像生成, 那这些配置呢?大家可以看一下啊,那这样一来呢,他就不只是能够读文本,写文本,而是能够听懂你说什么,也能够开口说出来,甚至能够把视觉内容一起生成出来,那这个时候他就会你发现他更渣啊,像一个完整的生产工具了。 好,第六步,我们要去做的是控成本,提效率。那在这个部分呢,因为,呃,这个特别重要,因为很多系统不是做不出来,而是因为呢,你跑起来发现,哎,不怎么好用,对不对? 那这个时候呢,我们可以配置这几个工具,那分别呢?让他们去啊,看到托管的消耗以及成本啊,也可以去看到运行的状态跟整体的过程,包括我们这个 r t、 k, 对 吧?更加偏向于什么能力的扩展 跟这个效率的优化。这层的核心呢,不是能不能做,而是我们要啊,长期稳定的去做,不然你前面做的再好,对吧?后面你一看,哎,成本承受不住,输出流程都很复杂,那就不行。好,第七步呢,我们要去统一配一个什么呢?总的一个入口,那在这个部分呢,因为工具一多, 哎,我们最害怕的就是什么呢?哎,就是散,那这个时候呢,我们就可以用这个二十万啊, emsi 进程的这种生态入口,把前面的能力呢给他统一梳理起来。哎,我们哪个工具负责记忆,哪个工具负责抓取,哪个工具负责研究,哪个负责多媒体,哪个负责成本治理。那这个时候呢?哎,我们把所有的能力给它收了, 那做一个系统化,那这样呢?他才不是一个工具堆,而是一个什么真真正正的智能体工作台,所以我们可以看到,对吧?最终我们,哎 安装完成的不是一个只会聊天的这个助手,而是一个什么呢?有身份、有记忆啊,能抓取、会研究,还能自动进化的一个专属智能体。

挑战,每天讲透一个 ai 知识点,今天是哈密斯技术经验与自我修正, open cloud、 cloud code 里面用这些文件去管理的,它是用 memory 这里做了区分啊,然后包括这个 cloud hub install, 它是用了这个,这对比啊,这两个组建啊,它们这管理方式是不太一样的, 你看这里面涉及到一些纠正啊,这个知识更新、最佳实践,等等,是吧?那我们可以来测试一下,比如说我是湖南人,喜欢吃辣, 来这个就是做一个记录,是吧?让它记住我是一个什么样的一个定位,哎,我的一个个人一个习惯啊,你看已更新,那这个大家可以在哪里看呢?就是你可以打开这个 web ui 啊, 这个地方有一个叫做记啊记,这里有个用户画像,你看用户画像里面就会记录你是湖南人,喜欢吃辣,对吧?然后他就偏好香菜香香辣风格,是给你记住了,然后你再可以跟他说啊,纠正纠正一下啊。 呃,我不不喜欢吃辣啊,因为容易上火啊,就是你可以不断地去纠正啊,纠正的话,然后它这个里就会触发这个 scale 的 一个调用,是吧?它就会不断地给你去记忆你当前的一个用户的一个实际情况 啊,这个就是纠正啊,自我发现问题,但这个过程是没有感知的。就是,呃,就是你,你在使用过程中是感受不到的,这个是 ai 啊,它自动会去处理这个事情啊,它会调用 skill 帮你去处理,然后大家看啊,你看我现在是喜欢吃辣,我刷新一下,我再去看一下这个对话, 我们来看一下这个记忆,大家看啊,会让人怕上火,不喜欢吃辣是吧?然后整个的一个逻辑是不是就变了,是吧? 所以这个就是叫做自我认知啊,自我记忆啊,自我修正啊,他就会记住你这一个使用习惯,这样你是不是就更加智能化了,是吧? 呃,那么这个用的一个场景,就是比如说我们要适合长期使用啊,就是你使用时间越长,效果就越明显啊,因为你跟他聊的越多, ai 就 认识你的一个情况就会越多,那这样的话他就会越聪明,是吧?在你看来就更懂你。 所以这里面啊,我们当 ai 理解偏杀的时候,你要直接指出偏好,有助于后续的一个记忆啊,就明显你会发现它理解出问题了,你就赶紧修正它,这样的话可以避免后面错的越多啊。所以这个是比较适合于沉淀个人习惯的, 比如说像一些写作风格、内容偏好、固定流程之类的,大家有这方面的一个场景需求的话,你可以考虑装一下这个技能啊,还挺实用的。

hermes 的 自我反思进化学习能力能不能移植到龙虾, open club 或者是其他智能体上呢?如果你已经习惯了龙虾,但是又想用 hermes 的 自我反思进化学习能力,那么这个视频值得你收藏。 我们今天学习 hermes 的 思路,让任何智能体都轻松具备自我反思进化学习的能力啊。那 hermes 是 如何反思的呢? 简单来说啊,就是经过观察、执行、反思、沉淀、复用的闭环学习系统,自动分析哪些错误是经常犯的,哪些规则还不够完善,哪些功能老是重复,可以提炼封装成 skill, 对 吧?那我们可以很容易的把这个核心思想移植到其他的智能体工具里啊。 我以 tree 为例,我们先打开点 tree 目录, roots 下的 project roots 点 md 这个文件,如果没有这个文件的话,可以手动创建一个。我们先增加一条指令规则, 当用户输入以斜杠开头时,你需要检查是否命中 command 点 md 中的命令,如果命中必须执行, 我们创建一个 command 点 md 来添加指令啊。当用户输入了斜杠, finish 表示用户确认完成了当前的任务,你需要根据 finish 点 md 的 文档执行任务。 然后我们创建 finish 点 md 这个文档,在文档中规定,请判断当前的任务是否完成,如果完成,请标记为已完成,并把完成的过程持久化总结在 memory 的 文件夹下,并且以日期格式归等。 当然,我还写了很多其他规则,那是其他用途就不多说了。那这个规则的主要目的呢?就是保存每次对话的记录,方便 ai 以后进行总结反思。 当然,除了这个 finish 指令以外,我还添加了室外的指令啊,如果用户输入了斜杠 f 指令,需要让 ai 持久化存储这次任务的上下文,说明任务的情况,尝试过哪些方式,有没有进一步的思路,方便以后继续处理,并且需要更新反思文档,如果反思文档不存在,需要创建一个, 然后总结一下哪些地方是将来需要避免的。那绕了这么多弯啊,创建了这么多的文件,为什么不直接在 project roots 里把所有的规则都列出来呢?这不多此一举吗? 这里是有讲究的啊。首先啊,官方建议这个文件是不要超过一千个字符。另外呢,如果把所有的规则都放在这里,这个规则文件会非常大,每次和 ai 对 话的时候都会全量加载,很占用上下文资源。 那我们按照渐进式譬如的思想, project rules 里只做简要的说明,具体需要执行的时候呢,再让 ai 去查找更详细的文档,这样可以非常有效地减少上下文,避免上下文爆炸。 好,那规则设置完了啊,那我们每次对话都养成一个好的习惯,就是在完成任务以后啊,输入一个斜杠 finish, 如果任务反反复复的没有完成,那就输入一个斜杠 fail, 然后啊,就不要在这个对话中继续了,那这样的话, ai 就 会持续的进行反思。那我们看一下这个反思文档啊,这是 ai 总结了很多问题啊,我们挑几个看看。 比如 ai 总结了一些可以避免的问题,规则不够具体啊,导致智能体绕过,缺少违规场景,举例,规则预期不够强烈?好家伙,这还怪上我了,还总结了一些好的地方,这就不看了啊。 然后还有需要改进的地方,比如性能优化啊,方法重构啊,路径判断封装啊,配置化等等等等啊, 那现在有了总结文档,我们就可以让 ai 进行自我反思了,避免下次继续犯错,对吧?那我们可以在每十轮左右的时候啊,让 ai 反思一次。 熊爷说啊,请根据历史反思的文档,分析是否需要更新当前项目的文档,是否有经常犯的错误,需要总结成规则,避免下次再犯错。有哪些可以提炼成 skill, 用于下次复用? 反思分析完成后,把当前的反思文档归档为已反思,避免下次重复分析并清空当前文档。 当然啊,这么多字儿,其实我们也可以做成一个命令,对吧?只要输入斜杠反思,就让它自动做上面的动作也是可以的。那我们看一下执行结果啊,它先是增加了五大规则类别,一会儿具体看一下,我们继续看。它还分析出了什么提炼成 skill 的, 评估 本次反思中的问题,不需要提炼成 skill。 那 有必要的时候啊,它是会创建 skill 的 啊。那我们具体看一下规则文档,看看它改了些什么。增加了代码修改的规范,增加了规则制定规范。 规则必须具体说明,不仅要说明不能做什么,还要明确应该怎么做,包括替代方案。然后啊,还需要举例典型违规场景。 然后啊,需要强烈措辞。这也是前面反思的啊,说规则预期不够强烈,对吧?这些反思还是非常有效的是吧? 当然啊,很多智能体是可以设置定时任务的,其实你也不用手动执行,可以定时让他每天自动反思。 那这个思路啊,是可以应用在所有的智能体上的,你可以收藏起来,赶紧试试看。那好,希望这个视频对你能有所帮助。如果你觉得有用,希望你能点赞关注收藏。我是斐哥,咱们下期见。

想让你的 hermes 能力再升一级吗?那你一定要掌握 hermes 的 skill 技能系统。今天这个视频我手把手的教大家如何安装、管理、更新和卸载技能。首先给大家科普一下什么是 skill 六,其实就是一段提示词,它用来教会大模型如何来完成特定的任务,装上不同的技能,你就能解锁、调研、编程、文档拷写、数据解析等等这些专属的能力。我们来看一下都可以如何地使用 hermes 的 skill 功能。首先它提供了命令行,就是 hermes skills 这个命令,我们可以使用 help 参数来看一下它都有哪些命令,这里就是它可以使用的命令的列表,主要常用的呢,就有这么几个命令。我们可以使用 hermes skills list 来查看我们现在已经安装了哪些技能, 这些是我们目前已经安装的技能,还可以使用 hermes skills search 来查找相关的技能。比如说我们要搜索一个文案,那就是 search corporating 来搜索文案相关的技能,这里就是文案相关的技能,这里有名称介绍、来源等等信息来供大家参考安装。那么该如何安装呢?可以使用 hermes skills install 来安装这个 copywriting, 可以 看到这里提示我们发现了多个相同名称的技能,需要我们使用完整的标识符来指定安装哪一个技能。那么我们就运行 premise skills install 这个短一些的。这个 copying 正在下载,这里是询问我们是否确认要安装 copying 这个技能,我们输入 y, 这里提示我们已经安装成功了。我们来使用 hermes skills list 来查看一下是否有这个技能,我们来找一下 copying, 在 这里已经安装了, 那么我们下一步再来把它卸载,卸载的命令是 premise skills on in store, 然后加上 copying 提示我们是否要卸载这个 copying, 输入该提示我们已经卸载成功了。这个时候我们再来运行一下 premise skills list 啊, 我们再来找 copyright 已经没有了,那么我们再重新把 copyright 装上之后,进入 hermes 之后该如何使用这个 copyright 的 技能? hermes 中调用一个技能非常的简单,只要打一下斜杠,然后输入技能的名称,也就是 copywriting。 然后我们再接着输入我们的要求,写一个 hermes 的 介绍文案,这里就显示出来已经调用了技能 copywriting, 非常好,他已经把文案写出来了。这就是 hermes 的 skills 技能的介绍,今天就讲到这里了,感谢大家的观看,再见!

兄弟们,哈莫斯这波升级呢,简直是神级更新,直接宣告了 ai 正式从好用的工具进化成了夺权的基础设施。很多人呢,根本看不懂这背后的信号呢,有多么恐怖。以前我们吹捧的 ai a g 呢,是个啥?自动写两行代码, 或者呢,像高级按键精灵一样帮你点点网页,充其量呢,也就是个实习生。但现在呢,对 windows 系统呢,更好的支持了,彻底砸烂了系统的壁垒, 浏览器自动化呢,直接提升了整整一百八十倍,这是什么概念?这抓取操作呢,比人手快了几十个身位,更绝的是他接入了一百万上下文的 rock, 连 tim 和推特都无缝对接进去。看懂了吗?这已经不是一个工具了, 这是一个有着超强记忆,甚至能直接操控所有软件的完美数字员工。而且他现在已经原生支持外部 u i 了,不用再去单独的去配置第三方了, 非常哇塞,看懂了吗?这已经不是一个工具了,它是一个有个超强记忆,能直接操控所有软件的完美数字员工。很多人呢,严重低估了运行层的价值。你以为未来的 ai 天下拼的是谁的模型参数大吗? 大错特错,未来真正垄断市场的是谁能掌握 ai 的 工具链?谁能支配多个 ai 的 协助工作流。 hermes 现在做的就是成为 ai 时代的刀客, 加上 vsco 的, 再加上 zippo 的 终极结合体。当所有人都在沉迷于 ai 聊天的时候呢,真正的高手已经悄悄地不是 ai 时代的水电煤了。 如果你还没有升级的,或者说你还没用上这么好的工具的,说一下啊,我总结了一套 hermes agen 的 从零到一的详细操作指南,说一下,直接拿去。

大家好,这个视频我们一起来看一看 hermis agent 有 多智能体的几种用法。嗯,首先是在默认的 agent 的 基础上,因为默认只有一个 agent, 在 它的基础上我们可以创建多个 hermis agent, 也就是创建它的分身。 呃,用于不同的场景,你像如果你也是学习上有的,生活上有的,工作上有的,就是你要你想给他分开的话,这样做的话就能够让各个不同场景下没有独自的 a 诊断去辅助我们是这样。呃,第二个是多智能体一起工作。嗯,这里的话主要是 我们如果有一个复杂的任务,这个复杂的任务的话就跟前面似的,可能他有点混乱, 我们想给它分开,那我们怎么去分开?然后这个分开的话,它又不是像全面前面一样完全的分开,而是在前面的基础上它有一些呃一起工作协同的一个机制在里头,然后这块的话多说一句,现在多说一句。这块的话,我个人的感觉有点儿鸡肋。嗯,就是随着现在 a to a 机制, agent to agent 这样一个机制慢慢成熟之后的话,这块我觉得以后来说还是非常重要它。 最后我们来说一下,嗯, sub agent 协同工作的这样一个机制,这个机制的话我觉得有点可惜,这是一个非常好的机制,但是可能对大多数人来说,它属于一个相对隐藏的比较深的一个能力。哈。现在来说我最喜欢的是这个机制,就是一会介绍的时候,可以大家可以重点关注一下这个吧。 呃,前面的话相对常规一些,或者说能力还没达到吧。呃,最后的话会对这三个机制,三个不同的机制,因为他三个都存在,他都有他自己存在的道理吗?然后做一个对比,就是看看什么样的情况下用用什么样的东西会比较好。 呃,那我们开始正式的讲解,首先是多个 hermes agent, 我 们在安装配置好了 hermes agent 之后,我们就可以开始用了哈,然后,嗯,多个 agent, 可能新手来说大部分也都没有试过哈。然后这个的话针对的就是这一群人哈。 hermes profile create, 然后这个是你的新的 a, 任何名字,你给他起任意名字都行哈,当然也不是那么的任意,就最好是全英文,全英文小写的这种模式是最好的。然后 如果有数字的话,数字放在结尾,放在中间,就是不要放在开头,就是创建分身,然后这种创建分身的模式是完全是只是有一个分身配置的话是需要我们另外配置的, 包括配大模型,然后配,嗯,飞书也好,微信也好,这个是另外配置的。呃,说到这的话就先把这个补充的大概说一说,这个补充的话就是说你可以创建分身,分身出来都是空的,所有东西都开始配, 相应的你也可以创建一些分身,然后这个分身是带着配置信息的哈,像这个就是带着配置信息的,这个的话就多了一个克隆的一个命令,然后像这个的话,这个又多了克隆,然后杠二的这个命令是不但带着配置信息,而且把一些 更多的信息都他都带过来,就是这些东西是层层深入的哈,然后这个的话是从配,呃,从特定的配置文件去克隆,然后这个配置文件的话,一定是你前面已经 back up 备份的这些信息哈。嗯,这个的话 在这因为不是我大概讲解这个的一个重点哈,所以大概一说,嗯,感兴趣的话,后续我把相关的东西资料放上哈,感兴趣的话大家可以查资料去看。 呃,这个的话就是多说一句,说到了它的那个,呃,创建分身的各个不同的方式,然后我们回到它的配置,呃,配置的话就是 这样哈。嗯,因为现在 wsl 版的话,它的那个配置在那个文档里面是有明确写的,这个的话反而是没有的。 大部分人可能现在开始用的是 windows 版的,然后 wsl 版的话,因为安装过程当中比较麻烦一点,可能不太用哈,所以这两个我都都说一下吧,因为这个的话文档里面你好找,但是你找的话你可能是这版的,你又不会用。 就是就是,大概都说一说,呃,也没有太多的过多的一一些点哈,就是主要是面临前面多了这一句话而已,多了这个 hermes 杠杠 profile 多多了这些而已。然后关于它的配置,配置这个模型也好,然后配置通讯终端,就是微信飞书也好, 这些配置的话跟我们第一次安装的时候的那个配置是一样的哈,就是包括后面的那个怎么去激活,呃,有那个 dm code 就是 dm 码去激活的这样一个过程,这个都是一样的哈。 嗯,这里写出来的话,主要就是大家注意一下这个命令的这个写法,这个我也是研究了好久才弄通的这样一个, 呃,这个配置大概就是这样,安装和配置大概就这样,然后安装配置,配置完了之后的话,你使用的话启动启动的话也是差不多情况哈。 像 wsl 的 话,你直接启动,你就根据你起的名字,你你取的名字,你直接去启动它就行。如果是 windows 的 话,就是多了前面这些给它启动就行,然后启动之后用的话是一样的哈,就是跟你,呃,跟你正常用 harmus 也好,用各种 ai 工具也好,就是一样的使用哈,只不过它 也就是多了一个分身,如果理解不了分身也没有关系,就是多了一个聊天对话一个地方而已。 嗯,这是这个多个 hermes agent 这个场景,然后这个的它的那个使用的话,就是像前面说的你, 呃,学习相关的,你跟一个 a 正的聊,然后他能够比较好的把握你的学习的情况,然后工作的你跟另外一个聊,然后你的家庭生活方面的,你再找一个跟他聊,然后他单独的去管理这些东西,他不至于乱, 就说像这样个人用就是显得还好。如果你的工作用的话,那工作你可能有一些新媒体相关的工作,呃, 然后你有扣点相相关的工作,你有数据分析相关的工作,这些工作的话也是单独管会比较好。播个 hermes agent, 像这样一个简单的一个配置,然后现在分身的场景更多的适用在这样的情况下,呃,那这个就说完了,这个地方是 多智能体一起工作,就是我觉得他有点鸡肋,是因为他现在多个智能体工作真的到 a to v 那 种,就是说我们想象的那种,他们能够相互很自主的遇到问题之后跟谁跟谁说一声,然后大概大概怎么去交接工作,这个他是做不到的哈。现在的话, 嗯,就目前来看,大家能用到的那个情况的话,更多的是一个算是一个调用的一个功能吧。 呃,但是他有他存在的一个必要哈,你比如说你在公司里面,如果你是个中层领导的话,就说每一个员工他自己有他自己的能力,他自己能力如果在工作过程当中磨合的很强,是不是也比较也比较好?然后这种多智能体的场景适合的 就说大概的话就是这样一个场景,虽然他们自己自身能力可能不太够,就是说员工之间交互交流没有那么好,需要你去管理去协调的话,但是他们整个他们自己单独的能力很强,也是能够帮你在团队当中完成很好的去完成工作的哈,大概是这样。呃, 这个我这个的话我是做了一个 skill 去帮忙完成这个工作哈,就是说怎么组队?因为大部分人现在用 ai 的 话,可能还有一块能力是考验大家的那个 组织领导能力。呃,大部分人这块能力是欠缺的哈,我,我这块能力也是欠缺的,然后 skill 能够帮我们补上这一块哈,就是说我们要构建一个 a 站的团队,我们怎么做呢? 嗯,大概原理就是这样哈,就是你的 skill 帮你去组建一个团队,然后这个团队里面有一个算是 主 agent, 这个主 agent 负责跟你交流,就说你把活派给他,他把这个工作分配给他下面的那个子 agent 去完成工作,完成工作之后的话,他们的那个工作成果在主 agent 那 儿汇总,汇总完了之后再把这个结果给到你,就是这么一个过程哈, 呃,然后这个过程当中的话,大概的原理是这样哈,就是告诉主 agent, 然后其他子 agent 的 那个存在,然后把名字呀,然后主要能力这样方式给到他。呃,还有就是主 agent 只和你交流, 然后主 agent 把工作去分配出去,主 agent 也不参与具体的工作,它相当于是你的一个助理,然后真正干活的是那些子 agent, 然后你也不用干活,你是,呃,通过主 agent 把工作交接出去,然后再把工作结果回收回来,是大概这样一个过程, 并且呢子 agent 之间他也不知道其他 agent 的 存在,然后他们之间也没有一个调用的关系哈,就是 agent 之间的话,就是主 agent 可以 调用子 agent, 然后主 agent 可以 收回子 agent 的 一些工作成果,他们之间就是积累的点就在于他们不是真的血统。 我们关注的重点就说它这个队组队它是怎么去完成的,然后组队完了之后,完成了之后有了工作之后,这个主 a 证和子 a 证的之间,它们的那个交互去是怎么去发生的哈,然后这个的话就是我这个 构建 a 证的团队,这里面呢有个 a 证的 team design, 就是 a 证的团队设计的这样一个 skill, 它要去完成的一个工作哈,这个的话给大家看看,是这么一个 skill, 然后我们主要看这个 skill 点 md 就 可以了。 嗯,这个的话我会放在文档里头,名字叫什么,然后大概是怎么去协商方式,然后主 a 证的子 a 证的调度机制,这些各种各样的文件,各种各样的说明哈,它这里面都有的。 嗯,就是有这个之后的话,基本上你希望去构建一个团队去完成一个工作的话,你把这个想法给到这个 skill 就 可以了, skill 会帮你完成的。 特别注意一下,因为组队这个事情的话,你是交给一个 agent, 然后这个 agent 用 skill 去完成的嘛?然后注意下这个 agent 跟我们要创建的 agent 团队就说没有直接的关系啊, 这个的话只是说你去早期去组队的这样一个过程中要用到的,然后其实后期到使用的话,后期如果这个团队已经构建好了,你最后 主要跟那个构建好的那个团队里面的主 a 阵的交流哈,也不是我们现在用 skill 的 这个 a 阵的去交流,他是他是这个意思啊,可能有点绕,就是大家可以理解一下这个事情。 嗯,这个就是构建 agent 的 团队,嗯,这个的话,其实词的话大概是这样就行哈。做什么什么的团队,这个根据你的, 根据你要干的工作去做一个设计,就是跟他说就行,跟他说,然后让他用用这个去帮你组队,然后这整个过程的话,它是有一个 舞步的,一个交流的一个过程哈。我这么设计主要是因为组队这个事情本身来说并不是一个很简单就能去完成的一个事情,所以他有这么讨论跟你确认的过程,然后讨论完了生成出稿,然后他有一个评选机制,然后再有修正,再有交付, 交付的话最后他交付的是这些东西,就这个过程的话,在这个 skill 里面都有体现,大家如果想做相应的修改的话,可以根据我这个 skill 文件去做更正就可以了, 就是按你的需求你去改,没有问题的。嗯,整个这个过程的话我就不再去细看了哈,就是文档给到大家,大家可以自己去看看大概是什么样的过程。 然后这个过程的话,他最后就是我们这一步是构建 a 证的团队嘛?然后构建团队的话,他把团队的构成会给到我们,就是这些文件哈,给到我们,然后主 a 证的是谁?就这个团队他的领导是谁,然后团队的成员是谁? 呃,这个的话,更核心的并不是说他有这么一个人员配备的一个设计就够了哈,不是这样的,就说他人员具有什么样的能力的话,是在这个搜文件里头的, 是在这这些文件里头他们怎么去协同,是在这个写作流程里头,还有就是这个完整的规格说明,这个的话,呃,是给你看的哈,就是这个的话它对 agent 怎么使用 可能没有那么重要,重要的是就是说你得知道这个组队是什么样的,然后这样的话你后期它有什么问题的话,你再去修改是可以的。 嗯,这是这个,然后我这就有一个视力的那个文件哈,就是前面的,前面的视力不是说是做一个数据分析的团队吗?然后这个团队到底是什么样的?就是在这个文件里头大家可以看一看。然后整个团队的构成的话,前面也这有提的话,是三个人, 三个人,然后一个组长,然后后面两个组员,大概是这样,嗯,这个是就说文文件就形成了哈,形成了这些是核心,然后我们自己手动总是要完成一些工作的。 这个不是说不能自动哈,是自动的话它可能会有一些问题,你把太多太多的东西交给它这种去完成了, 就是说你自己参与度不高的话,你后续哪有问题的话,你自己去把控,可能都不太好弄哈,就是为了这个后续的话,当然如果在优化把这个组队的那个东西优化好的话,让他自己完全自主的去做是没有问题。 呃,这第一步,这一步构建 a 证的团队,我们是有了这样一些文件,然后在这些文件的基础上,我们就是真正去做这个成员 a 证的一个构建哈,然后这个构建的基础的话,其实 是这个哈,就说是前面是前面我们第一步的这个基础,因为在第一步里面我们构建团队的话,我们只是有了团队的一些相关的文件,我们并没有真的 agent, 然后在这的话我们是要做真的做 agent, 这样的话就是在这步基础上去完成的。就说到这的话,我们要我,我们要再重复一下这个操作,就是 去创建一个分身,然后创建分身完了之后,前面这些的话,第一步创建多个 hermes a 阵头,我们创建创建好的分身,只是他 分身各自是各自的,因为他们不涉及协统,所以好多文件的话,你不他用去专门的去配置,你通过跟他的交流他自己就去改了。呃,这个的话,为了组队的话,我们是要在创建好了之后,我们要去做一些修正的,就是前面第一步里面出来的这些文件,我们要去给他改,改一改的 是这个意思哈,这里的话涉及到的改的话是它的这个 so m d 文件,也就是前面 这个地方哈,这个地方这些这些文件,这些文件的话改个名字,然后在创建好了 hermes agent 的 分身之后, 包括你这个配置之后,配置完成之后,这个配置的话大模型是需要配的,但是那个通讯终端的话,你配不配都行哈,你交互的只是跟主 a 阵的交互,你把主 a 阵的给他配了就行,后面那些东西不需要配,就是岁数微信的配置不配也没有关系,但是大模型是必须要配的, 就是这个是涉及到他的配置,呃,把那个配完之后的话,然后把他的那个搜文件改一下,这个文件要怎么改的话, 就是这样哈,就是我这个给了一个视力,因为每个电脑他可能情况不一样,但是大概的话按照我这个格式去解锁是没有问题的。就是你的分身文件叫什么?分身的那个 a 神的叫什么,然后这个是他的名字,然后你电脑是啥情况?这是这个,然后在 windows 版的话,基本上这种地址就不会错了, 就是找在这个文件路文件加路径下,就是就是注意下有一个重要的点,就是这个哈 profiles, 就是 它先分身都在这里头,然后找到你对应的分身哈。 嗯,这个的话 c 盘 user, 然后你的电脑是什么?然后 app data, 然后 local, 然后这个 hermes 的 分身文件,然后在这个 the agent 就是 分身 agent 下面哈,这个是我的 analyze 的,是我的那个 windows 上面的 hermes, 它的分身一个子 agent 的 它的名字,然后在这个笔架下就是这个, 然后找到在这里面找到这个 so 点 m d 文件,然后你像你这个是 analyze 的,是数据分分析的那个嘛?然后就找到前面这个 分析的这个分析的这个,把它的文件名字给改掉,改成 so, 然后把这个文件复制, 复制进这个目录给它替换掉就可以了。这个意思,呃,像前面这没有太说哈,没有说。然后这个生成好了之后的话,就是通过这个 skill 组队完成生成的这些文件之后,它会把路径给到你,你按照它的路径把这个文件找出来就行,然后找好的话, 把找好的话找好这个文件之后,然后再去找这个 harmis 分 身它的那个原始的这个所有文件,找它的位置,然后这两个 都确认好了之后,把他的名字改掉,然后把文件复制进这个文件夹里面就 ok 了哈,就这样成员 agent 就是 这么简单哈。然后主 agent 的 话需要注意的是他这个 so 文件只是这个 so, 然后要把这个文件, 把他的那个写作流程的这个文件哈也给复制进来,呃,就是把他们两个这个跟这个合并一下,合并的意思是这样哈,看我下面这个 合并的意思是这样,就是说打开编辑,编辑的话,然后把嗯改了名字之后,然后打开编辑,编辑的话,把后面的这个写作流程的东西给他复制到后面就行了哈, 就只是复制一下,复制到后面就行,像是这个文件的话,大家可以对照着参考。所以最后的话,我们是我们是把 这些文件改了个名字,然后把这两个文件做了个合并,然后完了之后把这个文件又放到了它各自的 the agent 的 那个 文件夹里头,就是做了一个替换,哈,就是做了这么个事。这个这个过程的话大家理解一下吧,好好体会一下。因为对于这个 agent, 不 管是是子 agent、 主 agent, 各种 agent, 就是 对 agent 来说,它的这个 so 点 md 文件,这个文件对法来说是最重要的,所以我的这个 skill 就 比较重要了,是不是?大家能理解吗?就是这个 skill 主要完成了这个工作,这个是个核心的工作,嗯,然后这个里头 主 agent 哈,主 agent 里头要严格地把这些事情说清楚,就是如果它做不好的话,可能存在的问题就是说它没有真的去调用它的主 agent 这个 so 点 m d 文件里头的话要说清楚,这个工作做了分配,然后在哪个 子公司里面去执行,去调用命令行执行,执行什么任务,就是这些是职管重要的,因为他是真的去会执行,不是说是做一个委执行,通过主 agent 然后 调用命令行,然后在命令行执行的是调用子公司的这样一个命令,呃,包括子公司的名字,然后任务是什么 是真的去执行哈,然后这个执行的话,我们在子 agent 的 那个筛选里头,就是他的那个对话记录里面是可以查到这个任务的, 这个过程的话就是说他不是那么直接,可能有点绕,就是需要你去理解一下,然后,嗯,按照我的这个大概这个讲解,然后这个 skill 去真的去执行一下看看吧。 呃,这一步的话是这个工作的算是这个工作的核心了,然后完了之后的话, 就是到了在主 a 阵的这儿,我们就可以给他安排任务了,这个怎么去启动哈?前面也有提及到启动的话,在 windows 里面的话需要把这个加上,然后在 wsl 里头的话,只需要你直接启动这个就可以了。 然后完了之后的话,在那个对话里头把这个任务给到他哈,就是他是一个什么样的任务,然后有一个数据分析的工作,就是说清楚哈是什么工作需要成员完成,然后把那个表给他,他就去做了。呃,这个是我自己做的一个视力的一个结果哈,就是这样 我其实又做了一些优化了,然后他自己会把 a 证的调用的情况,哪些 a 证参与了这个工作,然后大概工作结果是什么样?然后这个只是简单的展示一下工作结果哈, 他会把那个工作结果包括谁完,谁参与,完成了这个工作,他都会给你做一个交互的。呃,这个的话我需要演示一下这个的话,这个命令是查看我有多少个 profile, 也就是有多少个分身,这个是默认的哈,然后后面有五个分身 是这样。然后如果我要进到一个具体的分身里头的话,在 wsl 里头的话,我只要出这个名字就可以了。 进来之后的话我们能看见他的那个历史记录哈,历史记录的话就是斜杠命令三十三十 s, 就 会把具体的这个他的那个之前的绘画记录说出来,然后我们要接着某一个绘画记录的话,我们把这个绘画的这个 id 拿过来就行了。 sessions, 然后后面把它的 id 拿过来,这样的话它就进入了这个之前的那个聊天记录哈,就跟我们之前用 ai 的 话,像左边会有一个历史聊天记录,然后你点哪个的话,就可以接着 哪个绘画往下走,是不是?是这样一个意思,然后这个的话就是我要看这个,我要接着走这样一个绘画记录。嗯, 说这个的话有点有点扯远了哈,说这个的话是为了说明一下,就是我们主 agent 通过主 agent 分 配了任务给子 agent 嘛?然后子 agent 它是真的去完成工作了, 你怎么去验证它真的去完成工作?你比如说如果我这个 data analyze 的 这个,这是我昨天的这个记录还在哈,就是说这个是被分配工作了之后, 然后你看不见他正在执行工作什么之类的,然后你只能看见主 a 证给他的一个工作反馈,但是在这的话你就能够回来哈,你就回到这的话就能够调出来他的那个 工作记录,我是能够看见他真的工作了的,那这个有什么好处哈?就说他真的执行的这个工作为什么重要?他那次 a 证的话,他有一个自动化能力,如果他自己真的执行这个工作,同时你也可以用这个 a 证的话,那他的能力是会慢慢变强的,就是整个团队,然后团队成员他 会变强,然后也是一个越来越强的一个个体,它是这样一个意思,这个的话我认为相比于后面的这个 sub agent 协同工作这个来说的话是更好的,就是单从这方面的话是更好的。因为这个 sub agent 的 话,后面我们可以提到它是有一个回收机制, 就说干完活之后它那个子 a 呢?就消失了哈,就是这个你不好去积累。呃,那这个的话解释就解释到这,呃,这两个命令的话也都给大家贴出来了。 呃,像这个的话,他的适用场景就是复呃重复性的复杂的工作,一个 agent 作为你的助理帮你拆解工作,分配给其他的 agent, 这个助理的话就是那个主 agent, 然后其他的 agent 的 话就是那些子 agent, 这个是到了用的这个场景哈,真的用的这个场景。前面这三步哈,第一步,第二步的话,我们可能第一次用的时候我们要这样,像第一次用我们要组队,要去拆分,要去组队,然后最后后续的话你还有别的数据分析的任务 来的话,你直接找这个主 agent 就 行,前面两步你就不需要了呢,这是这个多智能体一起工作,这个的话,我个人觉得就今天这个讲解里面它算是最复杂的一部分哈,因为我自己的话也尝试了一段时间,就是看看大家如果有反馈,有 希望更深入了解,或者说哪有问题的话,也欢迎大家多多的留言提建议吧。第三个哈是 sub agent 的 话是做一些稍微复杂一点的任务哈,我们知道那个 agent 的 话, 他使用的话依赖上下轮,是不是上下轮如果太长的话,一个任务就是说你一个稍微复杂一点的任务的话,他上下轮太长的话,他可能爆了,然后最开始看着还行,后面就崩了,那前面的工作就白做了是不是?呃, sub agent 大 概处理了就是这样的一个事情哈, 把任务交给他,然后让他自己去组建团队,然后组建完了之后的话,他自己完成工作之后又回收, 回收,然后给你一个交互。其实就是前面这个多智能体去工作这个这个事情的一个简约版哈,简约的话是因为他的那个机制, 呃,他那个机制的话,支持他这么简约的去完成。你用户这端的话,你不需要配这么多东西,然后甚至甚至还要自己去写 skill 去组队,就是不需要这样。 然后它的那个劣势也是在这哈,就说它用完之后,它就在这一个绘画的过程当中出现,然后用完之后就没了。嗯,这块的话不去多讲,大家看看这个提示词就行。就是根据这个提示词, 现在的话几乎是每一个 agent, 就是 我们现在用的 openclarkhermes, 就是 各种 agent 的 平台的话,它几乎都是支持这种 sub agent 的 机制的哈, 就是就是这个提示词是通用的,然后这个提示词的话是一个组队的一个让他自主去根据任务去组队的一个模式。 我们要做的就是把你的任务贴在这,就是把这个提示词拿过去,然后把任务贴在这,然后把整个的这个大段的提示词交给你的 agent, 他 就能够去帮你完成工作哈,他是这样。 嗯,这个的话,嗯,可能那就是因为内容比较相对比较复杂哈,就是比较长,就没有太去演示,大家可以拿着演示去看,一看,就强烈建议大家第二个可能复杂一点,但是第一个、第三个真的是强烈建议大家多用它,多感受感受 a 阵它的强大。 然后这第三个 sub agent 的 它的场景哈,是和需求不是那么清晰,然后稍微复杂一点儿的任务,你可能不太知道你是不是要组队去完成,因为组队的话它它有保留嘛?它 agent 的 话你总是存在的,然后你后续重复的任务的话, 同样的场景你还可以交给他们,虽然写作模式可能不是那么好,但是它能写作起来,然后能慢慢进化成一个比较强的能力,这个是很好的,这是这个,然后这个适用场景的话就是说不不太确定是不是需要 agent team 的 场景的话,你用这个比较好, 嗯,最开始我们用这个,可能用着用着的话,你觉得它组队比较好,你可以换这个都 ok 的。 最后的话说一下三种不同方式的一个对比,这个的话大家看情况去理解吧。这个有一个 ppt 的, 像多个 hermes agent 这样一个场景的话,它的那个 profile 它是它是有独自的,然后也不共享上下轮儿。多个 agent 就是 独立,就是各自是各自的,相当于张三用他的,李四用他的,就是那样一个状态。然后这些 a 政的话,他是一直存在的,也是在各自积累,各自学习,然后这个多智能体团队这个的哈,他是那个调度和被调度的一个关系, 也是不会共享上下文,但是主 a 政的话是能够知道能向子 a 政发命令,然后子 a 政也能够把结果传给主 a 政的,是这样, 这个的话试用场景就是重复性的,复杂的工作他也是永久存在的哈,然后他的学习能力也是在的,然后难度的话是最难的,第一个其实是最简单的,最后一个的话是需要提示词,然后我们就是积累一下这样的提示词,对你后续能够快速开展工作是有好处的。 嗯,第三个 sub agent 的 话,他是那种动态的子 agent 处理任务哈,然后结果是汇总到主 agent 然后交给你的。这种的话适合做的是那种稍微复杂一点,但是又 不太常做的。你像如果像是这个多智能体团队这块的话,这块我们做什么工作会用到它呢?就是周报,有一些周报呀,上什么日报呀,像什么周总结呀,然后周例会呀,那种那种东西的处理就是重复性的工作,要做的话,你是希望它一直存在,但是它 一个 a 证又处理不了的这类任务给他,那这个的话就是那种不常用的任务,就是今天要搞一个 什么团建的一个计划之类的,就是这种的,可能一年到头也就一回两回的,这种用它我觉得比较合适哈, 是这样。然后还有前面我们说到的,你不太确定是不是适合这种组队模式的话,你也可以拿它试一试,因为它的适用成本相对比较低嘛。三种方式的对比大概就是这样哈,各有长短。反正我自己现在的话是这些东西的话我都在用,你用完之后你会发现这些东西它 并不是说就是说有的,用了这个就不用那个,哪个绝对好,哪个绝对不好的,各有所长,然后都值得我们去试一试。这个对比大概就说完了,多 a 政策的话,现在我觉得还差点意思,就是等着 a to a 模式慢慢的好起来,然后我们希望能够拿它做更多的事情吧。 然后预告一下我下一个视频啊,如果是我们大部分人只有一个 agent, 那 这一个 agent 我 们怎么去用好?它就是可探索的比较好玩那些点还是蛮多的,就是下一个视频会涉及到怎么把这个 agent 和大家一起用起来。 然后包括我们前面也有讲到知识库,把知识库怎么用起来,就是把知识库给到 agent, 让 agent 的 话基于知识库去做伟大回复。这个的话我们肯定都用过那种,嗯,文字交流的那类智能客服,像群里也好,像什么,嗯, 电商平台也好,它的那些东西,那些的使用,大概是这方面的一个零成本的一个实现吧。这个事情我们就说这么多,我们下个视频见。

好了,这期我们来从零基础搭建 hermes 智能体机器人。首先我们打开我们的一个安装的教程文章,第一个是安装 git 的 工具,也就是安装它的前景环境,这官方地址是这个, 我们拷贝一下,复制在编辑这里粘贴, 然后是来到 git 的 官网,然后 click here to 登录的点,点击这里进行下载, 这个安装包就是下载过后的一个安装包,这是第一种方法,然后我们进第二种方法,第二种方法是个华为的网盘,我们输入进去 啊,在这网盘里面我们随便找一个版本,类似 windows 版本,然后找一个六十四位的你,如果你电脑是六十四的,你找六十四位的一个版本,那大部分是六十四,我们找六十四,然后点击这个进行一个下载, 同样我们也会得到这个安装文件,然后双击运行,点击两次,然后选择安装的 与我们把它放到,不要放到 c 盘,放到你自己的一个软件安装盘,然后直接确定,确定确定,一直确定就 ok。 好, 现在这个情况也就是我们安装成功了, 然后我们再看的安装教程。然后第二步安装 ws l 环境, ws l 大家记不住就可以记住汪苏泷首字母 ws l。 首先我们运行 pos, 点点击这个开始菜单这个搜索命令,搜索 pos, 输入 p o w e r, 那 这样也就是按这个,但是我们要以管理员身份运行,选点击这个选项 啊,出现这个对话框,然后输入这个命令,点击复制, 然后点击这个 posl 对 话框,在这里它的是点击右键是粘贴的快捷键,我们直接点击右键,然后点击 enter 确认变化,它就会自动安装这个 wsl 这个环境, 我们继续等待就 ok 了。安装成功后,然后我们要重启,就是重启不是关机,重启后然后他才可以生效。 好的,安装好 ws l 之后,我们来到第三步安装文本图系统,然后打开 pos, 然后复制这行代码,点击复制,在这边点击右键粘贴,然后回车让他自己跑起来。 等到这个地方的时候,它是需要我们自己输入一个用户名,这个用户名它默认是 administrator, 我 们可以换成我们自己喜欢的名字,然后这里我选择 oa, 创建一个 oa 用户名, 然后下点击 enter 之后,下面让我们创建一个密码,然后我们输入密码,但是大家注意这里密码它是隐藏式的,也就是你输入进去它不会显示出来,也就避免被盗的风险,然后点击过之后,然后确认,然后再重新确认,重新输入,再点 enter 确认, 这样的话我们的文本图系统就安装成功了。就是当这个绿色的代码出现的时候,我们的文本图系统就安装成功了,然后是大家重启就 ok 了。

用 armes agent 还把所有需求塞给单个智能体的朋友。注意了,你很快就会遇到两个大问题。 第一个问题就是上下文和记忆越聊越乱,研究、写代码、查资料、回消息,所有内容全混在一起。第二个问题是他一次只能处理一个任务,跑研究的时候,别的事你就只能干等着。真正把和 miss agent 用顺的人,从来不是把单个智能体调得更厉害,而是把它组织成有分工的团队。 你可以把这个智能体团队理解成小型数字工作室,不同角色各管一块,分工非常清晰。有的智能体专门做规划,有的负责研究,有的负责执行,还有的只做复合和最终交付。每一个角色只处理自己负责的那一段内容,上下文就能干净很多,不会出现内容混淆的情况。 而且团队化之后,你再也不用等单个绘画慢慢排队,而是可以把任务拆开,同时分别推进。如果你已经有一个能跑通的 airmail agent, 只要四步就能把这个团队的股价搭起来。 第一步是克隆 profile, 直接继承你之前已经调试好的所有基础配置,不用重新设置。第二步,给每个 profile 写清晰的定位,把它视随,擅长什么不该碰什么全部讲清楚。第三步,在项目根目录放共享配置文件,让整个团队共享项目结构、协助规则和当前进度。 第四步,按 profile 单独调用,让每个智能体只处理自己该做的任务,不用兼顾其他内容。真正上手的时候,命令并不复杂,先执行 profile, 把调好的基础配置复制出来就行, 然后进入不同的头发单独工作,重点不是命令有多花哨,而是每个智能体的记忆和绘画都独立了,后面你再做研究、规划、执行和复合,就不会全部记在同一个上下文里,效率高很多。这里最容易被忽略的反而不是操作命令,而是两个关键的配置。文件作用非常核心, 第一个文件负责定义单个智能体的人格和边界,明确告诉他该做什么,不该做什么。第二个文件负责定义团队共享背景,把项目结构、协助规则和当前进度全部统一下来。 一个管单个智能体是什么角色,一个管整个团队正在做什么项目分工非常明确,这两个文件分开设置之后,整个智能体团队的协助才会更加稳定,不容易出乱子。 所以这套方法真正的价值不是让 hms agent 看起来更高级,而是让他能像真实团队一样稳定,工作任务拆的更细,上下文更干净。每个智能体都有自己的角色边界,你也能同时推进多件事。 如果你现在已经有一个跑通的 ms agent, 下一步别再往单绘画里塞更多需求了。最值得做的事就是尽快把你的智能体团队搭建起来,使用体验会提升很多。

大家好,我是麦东。 hermes 零点一四版本终于带来了一个大家期待了很久的更新, hermes engine 终于原生支持在 windows 上安装了。 之前想在 windows 上用 hermes, 我 们必须先通过 wsl 搞一个 linux 子系统,对于很多技术小白来说,这个门槛儿就把它们给挡住了。 现在零点一四版本开始,我们通过 cmd 或者是 power xl 运行一条命令就可以直接安装 harms 了,不再需要 wsl 了。而且这次还多了一个更简单的安装方式,通过 pip 命令即可安装,对于本地已经有拍摄环境的朋友来说还是非常友好的好。下面我们来看一下具体怎么安装。 首先第一种方式,通过 power 线安装脚板,我们只需要打开 power 线,运行如下这条命令即可,这个脚板会自动帮你装好所有的依赖,包括 uv 包管理器, python, node js, rip group, ffm pack 等等。如果你电脑上没有 get, 它还会自动去下载一个。 这是第一种方式,通过一键脚本进行安装。第二种方式,我们还可以通过 p i p 安装,如果你电脑上已经有拍摄环境,那么我们直接运行 p i p install harmony engine 即可完成安装。 安装完成之后,所有的 harmony meaning 跟之前都是一样的,这个方式呢,更加简洁,适合本地已经有拍摄开发环境的同学。好,下面我们打开发校给大家演示一下完整流程。 我们还是使用官方的一键安装脚板进行安装,直接将一键安装脚板粘贴至发光效果,按下回车可以看到它在检测系统环境,然后依次安装各个依赖。这边需要注意的是,如果你的网络环境不太好,可能需要稍微多等一会, 只要安装脚板没有报错结束,那么就不用管它,耐心等待即可。 安装脚本自动帮我们启动了触式外的配置。首先第一步依然还是会检测你当前电脑上有没有装过 openclaw, 如果有,它会提示你是否需要导入 openclaw 相关的配置, 我们可以输入 y 确定导入。 ok, 接下来开始配置 harmony, 这边我们直接按下回车,选择 quick setup, 到了选择模型这一步了, 本次演示我们就以大家用的比较多的 dsp 为例,这边需要注意一下,之前我们无论是在 wsl、 macos 或者是 linux 安装在这一步配置模型的时候,我们都是可以通过方向键上下切换模型进行选择的,但是 windows 原声安装的时候目前是不支持这样设置的, 我们需要手动输入模型供应商前面的编号,再按下回车。可以看到 dsp 这边前面的编号是十七,我们输入十七 按下回车。接下来输入 deepsea 的 api key, 这边要注意一下,之前很多朋友在配置 api key 的 时候都会搞错,在 power 七二里面粘贴的动作不是通过 ctrl 加 v 完成的,而是通过鼠标右键, 鼠标右键一定也不要多点,点一下就行了,然后按下回车。接下来第二步配置 v c u r l 这个一般是不需要改的,直接按下回车。第三步就会让你选择默认模型了,我们这边选择 deepsea vs flush, 按下回车 ok, 模型就配置完成了。这一步是让你选择在哪里执行,后端我们直接默认回车即可在本地执行。 下一步就是配置消息对接平台了,这一步我们在本次视频里面就不做演示了,国内主流的消息平台对接我们在之前的视频里都有讲过,大家可以回过头去翻一下我前面的视频,我们选择二,暂时不配置消息平台,按下回车, ok, 配置完成。下面我们最好关闭当前的 power 界面,重新开启一个新的 power, 输入 harmony, 按下回车,打开对话界面,下面我们跟 harmony 打个招呼, ok, 可以 看到 harmony 已经给我们响应了,到这边我们的基础配置就已经完成了。需要注意的是,目前 harmony 的 原声 windows 安装还是处在早期 beta 阶段,可能还是会遇到一些小问题。官方在这个版本里面也修了四十多个 windows 相关的 bug, 但是呢,毕竟是第一个正式支持的版本, 遇到一些问题我们也可以去 github 上给官方提一些英雄。好了,本期视频到这边就要结束了,最后总结一下,如果你之前因为 wsl 的 门槛没用上哈密斯,那么现在可以去试一试了, 只需要通过一条命令即可完成安装。如果你本地有派生开发环境的话,通过 p i p 的 方式安装会更加的方便,不需要你再去折腾 linux 环境了。大家如果有在 windows 上已经安装了的,可以在评论区反馈一下体验怎么样?工具会变,但方法更重要,我是麦冬,下一条继续。