粉丝269获赞732

大家好,我是麦东。很多朋友吐槽 hermes 自带的网页界面没有对话功能,界面也不好看。我去 github 上翻了一圈,找到一个大佬写的第三方面板,叫 hermes web ui, 实测下来确实比官方自带的 ui 要好用一些。 这个面板基本上把 hermes 的 所有功能都搬到了网页上,像模型配置、定时任务、渠道管理,全部都能在浏览器里操作,不用再去改配置文件了。安装非常简单,只需要在命令行执行 npm store 杠 g hermes web ui 就 可以了。 安装完成后,只需要运行 hermes web ui start 就 跑起, 服务启动完成后会自动打开网页界面。下面我们就来看最基础的聊天功能,这个就是非常多的朋友想要的,能够在网页上和 hermes 直接进行聊天。而且你的 hermes 本身通过 profile 创建了多个智能体,我们还可以直接在左下角进行智能体的切换,切换完成之后,相应的绘画界面也会随之刷新。 除了切换用户之外,你在系统里面配置的模型也可以在这边自主进行切换。另外, hermes web ui 还有一个比较有意思的群聊功能,我们可以通过创建群聊,把多个 agent 拉到一个房间里面,在群聊里面可以通过艾特方式指定某个智能题给你回复。下面我们演示一下这个比较有意思的功能, 点击新建群聊,输入你的群聊昵称以及房间名称, 点击创建房间。创建完成之后,在右上角我们可以点击加号添加智能体,在这边可以选择不同的 profile, 将它们加入群聊。我们首先将 default 加入群聊,再添加一个 coder 或者编程助手, 下面我们来尝试一下在群聊里面艾特它们,跟它们进行对话。我们同时艾特两个智能体,让它们介绍一下自己, 可以看到两个智能体分别都给了我回复,这个还是比我们在命令行里面操作要方便很多。当我们想跟不同职责的智能体进行对话的时候,我们不需要去不停地切换 profile 了,直接在这个网页群聊里面去艾特它们就可以了。 当然了,如果你已经将这些智能体接入到了实时通讯工具里面去,那么也是一样的体验效果。下面我们接着往下看。 搜索功能就是对绘画的解锁,解锁到相应绘画之后,我们可以直接点击进入当前绘画,接着跟智能体继续往下聊。任务功能则是管理我们 hermes 里面的定时任务,我们可以在这边去创建定时任务,也可以对已有的定时任务进行管理。 频道功能则是用来对接各个实时通讯平台的,目前内置了八个平台,我们国内常用的通讯工具在这边也进行了集成。他这边比较方便的一个点是每个平台相关的配置参数都可以直接在网页上配,改完他会自动重启消息。网关 技能菜单可以查看你当前智能底下所有的 skills, 并且可以对这些技能进行开关。记忆菜单则是对你当前用户的所有点 md 以及 memory md 的 一些管理,我们可以在页面上直接对这些文件进行编辑。 模型管理也做得比较完善,我们可以直接在页面上去添加相应的模型,配置模型的时候,也可以在页面上看到相应的 api key, 这个对很多新手朋友来讲还是非常友好的。之前我们讲 hermes 模型配置的时候,很多朋友在配置完模型之后去跟 hermes 进行对话,都提示四零幺,基本上都是因为 api 可以 配置错误了。 除此之外,我们还可以在页面上看到 hermes 的 一些日制,看到你当前 token 的 一些使用情况。工具这边还提供了终端功能,你可以在这边直接输入相应的命令,跟你打开命令行输入是一样的。 除此之外还有文件管理功能,你可以在页面上直接对文件进行编辑查看,或者是下载上传都是可以的。再往下看网关这边则是管理我们的消息网关的,也就是管 harmis 跟外部的一些通讯平台通讯的。这边提供的功能比较简单,我们可以对某个 profile 的 网关做停止开启操作, 不需要再去命令行里面敲命令执行了。再往下是用户菜单,用户其实就是我们讲的智能题,看过我前两期视频的朋友应该知道,当时的这几个智能题都是我使用在命令行通过敲命令的方式去创建的。而现在我们可以直接在页面上点击创建配置, 就可以非常快速的去创建新的智能体了,并且创建智能体的时候同样可以使用克隆功能,还是非常非常方便的。最后一个菜单设置,设置里面我们可以给当前的 hermes 网页设置一个密码登录,可以配置当前网页的一些显示主题 配置我们跟 ai 对 话时候的一些显示信息,比如流质响应、推理过程、显示费用等等。除此之外,还有对智能体记忆、绘画、隐私的一些设置,这些配置都比较好理解,我们就不一一去讲了。不过最后这个模型我们还是要跟大家去说一下, 这个地方我们可以修改当前已经添加进来的模型的 api key。 大家应该有注意到,刚刚在配置模型的时候,对于已经存在的模型,我们是没有办法对它进行编辑的,那么如果你模型的 api key 发生了变更,我们就可以在设置这边对其进行调整 好了。 hermes web ui 完整的功能介绍到这边就差不多了,关于 hermes web ui 的 一些基础英文命令,我这边整理了一个手册分享给大家,希望对大家有帮助。总的来说,如果你觉得 hermes 原声界面不够用, hermes web ui 是 我目前找到的最完整的第三方面板, 像渠道管理、模型配置、使用统计这些高频操作全部搬到了网页上,对于新手小白来讲还是非常友好的。大家目前都在使用什么 hermes 的 面板呢? 体验怎么样?欢迎大家在评论区聊聊。工具会变,但方法更重要,我是麦冬,下条继续。

大家好, hermes agent 都用上了吗?觉得怎么样呢?那今天来分享一下我最近使用的十个技巧,比较适配新手。 那第一个就是我们去安装 hermes 的 时候,只要执行这一条命令就行了,但是呢, windows 用户一定要特别注意啊,必须得安装这个 wcl 这个环境,那其实安装也非常方便啊,只要打开你的这个 pro shell, 那输入这个 install 命令就可以了。安装完之后输入这个 wc 要启动,然后再去执行这条命令,那么就 ok 了。那第二个就配置这个主模型啊,那么在 hermes 里面是其实是有主模型和辅助模型的,那我们怎么去配置这个主模型呢?那配置也是非常简单,只要执行 hermes, 然后 model 模型,那么你就可以选择,那第一个是它自己自家这个订阅,第二个是 open rotter, open rotter 非常建议大家使用,这个 open rotter 里面其实有非常多免费的模型,然后的话你就可以等它出来,就是它会先加载一些。就是啊,模型 我们可以拉到最下面啊,就是你可能这个模型不在这里的,你可以拉到最下面,然后对话输入模型的名称啊,输入模型名称点确定, ok, 这样的话你的模型就变成这个应用达这个模型呢,因为我之前已经输入过密钥了,所以他没有提示我输入密钥,比如说我们再看一下他是不是变了, ok, 你 看这个名字是不变了,我问一下, ok 啊,它这个模型是这个,那我们在设置模型的时候有一个小小的问题,比如说我们如果说设置的模型需要输入这个 key, 但是这个 key 其实在它这个终端输入里面我们是看不到的,经常我们复制过去之后看不到这个字母出来, 那你不知道,你可能又复制,导致可能这个命要输错了,那怎么办呢? 那么在这个 hermes 这个啊,目录里面有一个环境的这个配置的文件叫这个点 e n v, 那 么在这个文件里面是保存了所有你配的这个模型的密钥。所如如果说你这个模型调不通,那么你建议你去这个文件里面看一下你的密钥是不是配置的,对不对?那第三个就是啊,配置这个辅助模型,那为什么它会有辅助模型呢? 因为它设置了不同的任务模块啊,比如说这个第一个任务模块叫啊试图就是说啊,你如果发了这个截图啊,给这个 homeys 发了截图,不管你是通过什么聊天工具发了截图的话,如果你专门给它适配了模型,它就会调用这个专门的模型, 那比如说这个外部网页的搜索也是一样的,那么他这边有八个任务都可以去配置不同的模型啊,那这里就会有一个这样的事情呢,就是可能像有一些他是高频的,但是我们不需要那么好的模型去处理,比如说像搜索网页,其实这是这是一个可能是一个 m c p 的 活, 并不需要你这个模型有多厉害,那么你就可以选用一个便宜的模型,那比如说像这种啊,比如说这种记忆类的啊,他要去 总结记忆的,那非常重要,因为记忆和这个技能的这个深层非常依赖于这个模型的能力,不然的话他的这个效果就很差,那么这种时候你就可以去选一个比较好的模型, 还有说这种搜索类的,那么都是比较好的模型,选好一点的模型,所以你可以去根据这个去配置不同的模型,那么你也可以不配置啊,如果不配置的话都会使用默认模型,也就是你配置的那个默认模型,那如果你想配置的话,你可以这么来配置,只要进入对话,然后你告诉他是哪一个任务,比如说请你 这个压缩的啊,辅助模型, 你复制给它就行,就首先你得知道自己这个模型已经配置好了,在我们前面这一步,他这边啊,看到没有,他把 auto 能换成这个,就是我们的这个模型。 第四个就是写好这个 sword, md 啊,就是这个是个灵魂的文件,那这个文件是写什么字呢?就是定义你这个后面字的这个风格 应该写什么呢?比如说你这个性格说话的方式啊,做事的风格,价值观和边界,所以呢这个是非常适合你去定义好,这样的话你的这个后面字就比较有人味了,那么格式你可以这样按这种格式啊,比如说你是谁,你怎么说话,你做事的风格是什么样子的?你遇到问题优先怎么处理 啊?比如说举个例子啊,比如说你现在要做一个这种研究型的 ai 助手,你就把后面字定义成这种助手,那么你可以按这种方式去让它给你去对话,那么你也可以让 ai 去帮你走。比如说你跟后面字已经对话了一段时间了,那么你就可以让它根据我们的对话技术风格 让它去重新设置啊,你的这个灵魂文件,或者说你自己知道叫 so d m d, 那 么直接叫 so d m d, 或者重新设置我的灵魂,它是能识别出来 啊,你这个设置灵魂就是去修改这个 so md, 它会去根据你的对话就去总结你要求的这种风格,因为你跟它对话,你会不断去纠正它的问题嘛,那么它就知道你喜欢什么样的风格啊,就是这个样子,所以这个文件是非常适合大家在刚开始使用时去定义的。去定义好的, 那第五个就要搞懂这个 home md, 这个就是定义了 home md, 这个就是定义了 home md, 就是他是怎么跟你说话,是定义他那 user 点 m d 是 他对你的了解,就是你是用的人,他对你的长期观察,会把这些你的画像,你的习惯,你的偏好,然后落入,然后总结到这个文件里面,所以这个是会被被动形容的,那么你自己也可以去编辑啊。 那 memory md 就是 通过我们长期的对话,他会把这个一些事情总结,就针对事情来总结到这个 md memory md 里面,然后呢,每一次对话都会把这个文件的内容注入到上下文里面去,这样的话他就会记住啊,你曾经喜欢这个,喜欢那个,喜欢,喜欢做什么?喜欢这个事的流程是什么样子的, 那 skill 就 更具体了,就是他对你的对话进行总结之后,发现有些事情是可以啊用流程固化下来的,那么他就他就会固化到这个 skill 的 文这个文件夹里面去形成技能,那么这你的方法就可以被附用,流程就可以被附用了, 那么这种你也可以自己去安装,那么后面字也是可以被动去创建去啊,进行一个修改的。 那 state db 呢?就是你跟它的所有的对话记录全部都保存在这里面,那其实最重要的是这个所有的 md 啊,是去定义你这个 home 字是什么样的人格,那这个文件是我们主动要去维护的,那其他的文件都是 home 字可以自动去处理的,可以不用管。 那第六个就是我们配置这个聊天通道,那么也是非常简单,那我们配置这个聊天通道也是非常简单,只要执行这个 homeis getway setup 就 可以了,那进来之后我们可以看到它支持非常多这样的聊天的通道, 然后的话这边也是飞书钉钉还有企业微信,然后这边的话是可以去配置的,比如说配置这个飞书的话,你可以进来,进来之后,比如说我这边已经配置过了,那我就让他重写。 那这句话是要输入这个 app id, 那 么你如果之前用过 open core 对 接过飞书,那么你肯定创建了很多这样的飞书的应用啊,比如说我们打开这个飞书的应用,就可以看到这样的 app id, 那 我们只要复制过去啊,输进去,然后再把这个密钥 再输过去, 然后再选择飞书啊,我们用的是国内版飞书, 然后就确定,然后不管,那这样就配置好了,那这边的话他有一个这样的一个配对的这个命令,配对的这个码 你可以选择选择之后你你如果说是第一次的话,他是会啊,你跟他对话的话会输,会生成一个这样的配对的密钥啊,你输进去就行了, 那这样就配置就完成了,你就可以去对话了,然后你可以选择,然后让它重启。它目前的话支持基本上主流的这个聊天工具啊,而且飞书的话它支持的这个维度能力的维度都是非常全的,所以说还是比较推荐使用飞书。 那第七个就是我们可以使用这个 homeis doctor 这个功能啊,去做一个全面的检查,看一下我们到底配置上有什么问题,我们可以输入这个,然后它就会去 如果没有问题的他就会打勾,如果有有问题他就会打叉,然后告诉你这个哪一个是啊?有什么具体的问题,那比如说这有个警告,这个有一个 browse 插件没有装好, 就是如果你这边遇到什么问题,你可以先执行这个,然后让他去看一下,检查一下有没有什么问题。那第八个就是 ui, 就 说它本身是有一个这样 ui 的 管理界面,那官方没有做啊,但是社区已经做了一个非常不错的这个 ui 的 界面啊, 然后的话你可以把这个项目 clone 下来,然后去执行这个,然后就可以启动一个这样的 ui 的 这个,呃, homeys 的 这个 ui 的 管理界面,那这边是我启动之后啊,我们可以看到你可以配置很多东西,比如说对话,然后的话配置这个任务, 还有这个搜索这个技能。然后的话这边是啊,一个就是四二点 m d 的 配置,比如说我这个配置就是这样子的,那么你可以直接修改, 然后这边的话是这样的,文件就基本上管理的东西都有,然后这边可以选择模型,所以说是不错的。你如果说不太习惯用终端命令行 t u i 这种方式来管理的话, 你可以把它下载下来,然后部署一下。那第九个是如果你想把 open core 的 东西迁移过来,你可以执行这个命令,执行这个命令的话,可以把 open core 的 一些技能啊,一些记忆啊,这些东西都都带过来,比如说像这个 点 open 空的所有的文件,他都会转移到这边去啊,你可以选择 yes 呢,他就会把它全部转过去了,非常方便的迁移啊。那第十个就是怎么去安装记呢?那么第一种方式就自己去创建,那通过聊天的方式创建,我相信大家这个都已经非常熟悉了。那第二个是在社区里面搜索,那么 homeys 也有自己的这个技能的社区啊,然后它这边也是有非常多这样技能的,大概有四呃,四百多个吧,六百多个,现在已经六百多个了。然后我们可以打开这个技能列表,里面是有这个 build in, 就 说明是它本身就自带了这个技能,那么不是这个标记的,那你就需要去安装了。那安装方式也非常简单, 那只要把链接发送给他,在对话框里面告诉他,让他去安装这个技能就可以了。你也可以去安装 opencircle 里面这个技能啊,也是一样的,复制链接发给他,他就会自动去安装。还有 github 的 技能也是这么安装的, 那这样有了技能之后,那你就能够去用很多这样的,做很多这样的事情了,那么以上十个呢,是我自己总结的一些这些经验啊,希望能够帮助到你,能够更快更好地去使用这个 hems agent。

如果你现在用 hermes, 还是把所有需求都塞给一个 agent, 那 你很快就会遇到两个问题,第一,上下文和记忆越聊越乱,研究、写代码、查资料、回消息全混在一起。第二,一次只能处理一个任务,你让他跑研究的时候,别的事只能干等着。 真正把 hermes 用顺的人,往往不是把单个 agent 掉得更猛,而是尽快把它组织成一个有分工的团队。你可以把 hermes 团队理解成一个小型数字工作室, 有的 agent 专门做规划,有的 agent 负责研究,有的 agent 负责执行,还有的 agent 只做复合和交付。每个角色只处理自己那一段,上下文就会干净很多。而且团队化以后,你终于不用再等单个绘画慢慢排队, 而是可以把任务拆开分别推进。如果你已经有一个能跑通的 hermes, 四步就能把团队骨架搭起来。第一步,克隆 profile, 继承你已经调好的基础配置。第二步,给每个 profile 写思路, 把它是谁、擅长什么、不该碰什么讲清楚。第三步,在项目根目录放 a j s, 让整个团队共享项目结构、协助规则和当前进度。 第四步, and profile 单独调用,让每个 agent 只处理自己该处理的任务。真正上手时,命令并不复杂。先执行 profile clone, 把你已经调好的基础配置复制出来,然后进入不同 profile 单独工作。重点不是命令有多花, 而是每个 agent 的 记忆和绘画都已经独立了。后面你再做研究、规划、执行和复合,就不会全部挤在同一个上下文里。这里最容易被忽略的反而不是命令,而是两个文件。 so 负责定义单个 agent 的 人格和边界, 告诉他该做什么,不该做什么。 agents 负责定义团队共享背景,把项目结构、协助规则和当前进度统一下来。一个管我是哪个角色, 一个管我们正在做什么项目。这两个文件分开以后,团队合作才会稳定。所以这套方法真正的价值不是让 hermes 看起来更高级,而是让他终于能像团队一样稳定,工作 任务拆得更细,上下文更干净。每个 agent 都有自己的角色边界,你也终于可以同时推进多件事。如果你现在已经有一个跑通的 hermes, 下一步最值得做的不是继续往单绘画里塞更多需求,而是尽快把它团队化。

大家好,我是麦冬。今天我们来聊一聊 hermes engine 的 记忆系统。这次我会讲得比较深入一些,除了告诉你怎么用,还会告诉你它的底层到底是怎么运作的。搞懂这些之后,你就能真正理解 hermes 为什么记得住,为什么会忘,以及怎么让它记得更好。先给大家一个全景图, hermes 的 记忆其实是一个分层系统,从上到下一共有四层,第一层是 sort md 身份层,第二层是 memory md 和 user md 持久记忆层。第三层是当前绘画的上下文, 第四层是历史绘画的存储和剪索。每一层的作用都不一样。我们一层一层来看。先说第一层, sort md 这个文件决定了 hermes 是 谁,你可以把它理解成 hermes 的 人格底座。每次绘画开始的时候,素尔点 m d 的 内容会被第一个注入到系统提喻词里面,优先级最高,比记忆文件还要高。 它的上限是两万个字母,非常够用了。你可以在里面定义 hermes 的 身份、说话风格、行为准则。比如你可以写你是一个专注于数据分析的助手, 回复风格简洁专业,优先用 python 解决问题。这样不管你后面聊什么话题, hermes 都会带着这个底层人格来回应你。 接下来看第二层持久记忆。这一层有两个文件, memory 点 m d 和 user 点 m d 都存放在点 hermes memories 目录下。 memory 点 m d 可以 用来存环境信息和工作约定,比如你在做什么项目,有哪些固定规则,常用的基础站等等。上线是两千两百个字幅,大概能存放八到十五条。 user 点 md 用来存你的个人偏好,比如回复语言输出风格,你的专业背景等等,它的上限是一千三百七十五个字母,大概能放五到十条。 这边要讲一个很重要的设计,叫做冻结快照。这个是什么意思呢?就是 hermes 在 每次新开对话的时候,会把 memory md 以及 user md 的 内容拍一个快照, 然后整个绘画过程都用这个快照。如果你在聊天中途让 hermes 修改了记忆,他确实会立刻把改动写入文件,但是当前这轮绘画用的还是旧版本, 要到下一次新绘画才会加载新的内容。为什么要这样设计呢?因为这样可以保证系统指示词在整个绘画中保持稳定,更有利于模型的缓存命中。 简单说就是跑得更快,更省钱。所以如果你改完记忆发现没生效,不要慌,看一个新绘画就可以了。记忆的操作也很简单,就三个动作, add 就是 添加新条目。 replace 就是 替换已有的内容,它会按关键词去匹配。 remove 就是 删除。 我们只需要直接在对话里用自然语言跟 hermes 说就可以了,比如把这条加到记忆里面,或者把记忆里关于某某的内容更新一下。这边要注意,记忆条目之间是用一个特殊的符号来分割的,每条记忆就是一个独立的段落。 hermes 在 加载的时候会自动驱虫,如果有完全一样的条目,只保留第一条。另外还有一个安全机制, hermes 会扫描你写入的内容,如果检测到疑似提示输入或者恶意指令,会直接拒绝写入。接下来看第三层当前绘画的上下文, 这个其实就是你跟 hermes 正在进行的对话,所有的消息都存在内存里面, hermes 每次回复都会把完整的对话历史发给模型,但是上下文窗口是有限的,当对话越来越长,占到模型上下文窗口的百分之五十的时候, hermes 就 会触发上下文压缩。 这个百分之五十是默认值,你可以通过 hermis config setting 来进行调整,比如改成零点七五,就是用到百分之七十五在压缩。如果你完全不想让它自动压缩,也可以用 hermis config setting 将其关掉。 压缩的过程是这样的,首先它会保护最近的二十条消息不动,然后把中间那些比较早的对话交给一个辅助模型去做。摘药, 摘药会保留关键信息,比如已经解决了什么问题,还有什么代办当前在做什么,但是早期的工具调用输出就会被清掉了。压缩完之后, hermes 会创建一个新的绘画,并且呢,用一个 parent session id 把新旧绘画串起来,这样即使压缩了你的完整对话,历史还是可以追溯的。 所以压缩并不是说你的历史绘画内容就丢失了,它是对你的历史绘画做了一个摘耀,但是呢,摘耀是一定会有信息损耗的。如果你发现聊到后面 hermes 对 前面的细节记不清了,大概率就是压缩导致的。 这个时候你就可以把关键信息让它给你写进 memory 点 m d 里面,这样就不会因为压缩而丢失了。最后看第四层历史绘画的存储和解锁。 hermes 的 所有对话都存储在一个 circle light 的 数据库里面,文件叫 stat 点 db, 它就在你的点 hermes 目录下面, 每条消息都会被缩影到一个叫 f t s 五的全文解锁引擎里面。当你需要回忆之前聊过什么的时候, hermes 会用关键词去搜索历史绘画,找到最相关的几个绘画, 然后把每个绘画截取大概十万字幅左右的上下文,再交给辅助模型做摘要,最后把摘要返回给你。这边需要注意,这个搜索是基于关键词匹配的,不是语义搜索,也就是说他不会理解你的意思去寻找相关内容,而是直接匹配你的用词,所以搜索的时候尽量用具体的关键词,效果会更好。 这边还有个小 tips, f t s 五还专门做了一个三元组缩影,用来支持中日韩文字的子串搜索,所以中文搜索也是没有问题的。 好,四层讲完了,最后分享一下我的触手话,建议 ser 点 m d, 我 建议你写清楚三件事,第一是身份定位,你希望 hermes 扮演什么角色, 比如你是开发者,就写你是一个专注于某某领域的编程助手。第二是行为准则,比如回复要简洁,代码加注示,遇到不确定的要先问。第三呢,是输出风格,比如默认用中文,记住术语,保留英文 store 点 m d, 有 两万字幅的空间,完全不需要你省着写,把你对 ai 助手最核心的期望都放进去就行。 memory 点 m d。 我 建议写这些,第一是当前主要项目和背景,第二是项目的固定规则和约定,第三是常用的工具链和环境信息。第四是一些经过验证的工作流程,记住只放长期稳定的信息,临时任务不要往里面塞,因为两千两百个字幅很快就会满了。 user 点 m d 我 建议写这些, 第一是你的专业背景和技术水平,这样 hermes 就 知道该用什么深度跟你沟通。第二是回复语言和格式篇号。第三是你特别在意或者特别不喜欢的交互方式, 一千三百七十五个字幕也不多,所以你需要尽量把每一条写得精炼一点。最后,我们再提一个进阶玩法,如果你觉得自带的记忆容量不够, hermes 也支持接入一个外部记忆插件。注意,同一时间只能接一个。可选的有 honda em, 零 head side 这些。后面我也会专门出一期视频来介绍外部记忆插件。 但是呢,对大多数人来说,把 source md 加上 memory md, 再加上 user md 这三个文件用好,就已经能覆盖绝大部分场景了。 好了,本期视频到这边就结束了,你平时都怎么管理 ai 的 记忆呢?有没有什么 do more 技巧?欢迎在评论区聊聊,工具会变,但方法更重要,我是麦冬,下条继续。

大家好,前几期大家对 hermes agent 已经基本入门了,今天要跟大家讲解一下系统性的东西,也是它的核心点。内容包含主配置的关键配置,从 hermes slash 目录结构到 config org org md 的 核心设置, 一次性给大家讲透,咱们直接进入正题,先看看 hermes 的 配置目录结构,所有配置都存在波浪线斜钢 hermes 斜钢目录里,方便访问、管理和备份。这个目录下有几个核心文件,第一个是 config dot emo, 主配置文件管模型、终端 t t s 这些设置。 第二个是 ib 文件,存 a 片密钥和敏感信息。第三个是 author jon o o 凭证,比如 news portal 的 认证。第四个是 so dot md a 键的身份定义占系统提示的第一位。第五个是 memories 文件加持久化记忆,有 memory dot md 和 user dot md。 第六个是 skills 文件加管,定时任务 sessions 文件加管,网关绘画 logs 文件加存,自动脱敏的日制。 记住一点,所有配置都在波浪线斜杠 hermes 斜杠目录里,方便统一管理和备份。目录结构清楚了,那具体怎么管理这些配置? 接着看 hermes 的 配置管理命令,很方便。想看配置,在终端输入 hermes config 就 能看到当前所有配置。想编辑的话,输入 hermes config editor。 想设置配置,用 hermes config set kz 为 vl, 比如设模行为 anthropic 斜杠 cloudops 是。或者设中后端为 docker, 检查配置有没有缺失,跑一下 hermes config check, 想交互是添加缺失选项,用 hermes config me great。 设 api 密钥时,输入 hermes config set open router api k y k r 会自动存到 in v 文件里,这里有个很实用的特性叫智能路由。 hermes config set 命令 会自动把值存到正确的文件 a p i 密钥存到因微其他设置存到 config 的 emo, 这样就不用担心把密钥物写到配置文件里了。配置管理命令讲完了,那这些配置的优先级是怎样的?往下看。 hermes 的 配置优先级从高到低分四层, 第一层, client 参数优先,即最高,比如跑 hermes chat model enterprise, 斜杠 cloud sonit 四,这次调用会覆盖其他所有配置。第二层, config 到 emo 文件组,配置文件管所有非秘密设置。第三层, indiv 文件环境变量回退存必须的秘密信息向 api 密钥,令牌密码。第四层,内置默认值,啥都没设的时候会用硬编码的安全默认值。有个经验法则要记住秘密信息,比如 api 密钥, 机器人令牌密码放 indiv 文件,其它设置像模型终端后端压缩设置内存限制,工具级放 config 到 emo 文件,两者都设了的话,非秘密设置以 config 到 emo 为准。 另外, config edu 里可以用美元符号大括号 var name 引用环境变量。比如 auxiliary 的 vision 配置里 api key 设成美元符号 google api key base url 设成美元符号 custom vision url。 注意,只支持美元符号大括号 var 的 语法,不支持裸美元符号 var 优先即清楚了。接下来看看终端后端的配置。 hermes 支持七种终端后端决定 a 阵的需要,命令在哪执行。 第一种是 local, 直接在你机器上跑,没隔离,适合开发和个人用。第二种是兜客,在兜客容器里跑,完全隔离安全。沙乡环境。第三种是 s s 区,通过 s s h 连远程服务器, 跨网络边界,适合远程开发。第四种是 model model 云,沙乡云端虚拟机,适合临时计算。第五种是 dayton 的 dayton 的 工作区托管的云环境。第六种是 versa sandbox versa 沙乡云微虚拟机,支持快造词久化。第七种是 singularity 容器,适合高性能计算集群和共享机器。拿 docker 后端举例,你可以在 config dot emo 里配 docker image, 指定用 nicole 斜杠 python node js 冒号 python 三点一一 node js 二零镜像,还能配 docker forward env 转发还变量像 gitupoken 配 docker volumes, 把本地目录挂到容器里,还能设 container cpu, container memory 以及 container persistent, 要不要持久化?容器终端后端选好了,接下来看看记忆系统怎么配。 hermes 的 记忆系统得先分清记忆和技能这两个概念。 记忆存的是事实,向你的环境偏好项目位置, it 学到的关于你的事。技能存的是过程向多步骤工作流工具、特定指令可附用的配方。 简单说,记忆管是记忆性能或者什么。记忆系统有两个核心文件,第一个是 memory dot md 持久化记忆文件, memory enable 设为 true memory char limit, 设呃两千二百字,大概八百个 token。 第三是两千 dot md 用户档案文件 user profile enable 设为 true user char limit, 设一千三百七十五字符,大概五百个 token。 有 几个记忆管理技巧要知道,第一 记忆容量有限,大概两千两百字,幅满了 agent 会自动整合。第二,你可以跟 agent 说清理你的记忆或者替换旧的 python 三点九笔记,我们现在用三点一二。第三, productive session 结束后跟 agent 说,记住这个已被下次使用。第四记忆是冻结快照, session 里的改动要到下一个 session 才会在系统提示里出现 记忆。系统讲完了,接下来看看最重要的 so dot md 文件。 so dot md 是 agent 的 主要身份定义,占系统提示第一位,完全替换内置默认身份文件,位置在波浪线斜杠 hermit 斜杠 so dot md 或者美元符号 hermit home 斜杠 so dot md。 如果 so dot md 没了,空的货架再不了, hermes 会退回内置默认身份, hermes 会在文件不存在十自动生成默认的 so dot md。 你 可以编辑 so dot md 来自定义 a 键的身份。比如,你是个专业的 ai 助手,专注软件开发和技术咨询。性格特点包括耐心细致, 善于解释复杂概念,注重代码质量和使用实践,乐于学习和改进。专场领域包括 python、 javascript、 type script 开发、 devops 和云计算系统架构设计。 hermes 用两种不同的上下文范围,第一种是 soul md, agent 的 主要身份始终独立加载。第二种是项目上下文文件,像 hermes md 或 hermes md。 项目特定指令优先级最高。还有 agent start md 也是项目特定指令和编码约定,会递归便利目录以及 cloud dot md clock 的 上下文文件只在工作目录生效。注意,项目上下文文件用优先级,系统只加载一种类型,首 次匹配获胜。 so dot md 讲完了,最后看看技能系统,技能系统用来存过程性知识,什么时候该建技能,如果你发现一个要五步以上还会再做的任务,就让 agent 给他建个技能。比如你可以跟 agent 说,把你刚才做的纯成名叫 deploy staging 的 技能, 下次只要输入斜杠 deploy staging, agent 就 会夹在完整流程技能的位置。在波浪线斜杠、 hermes 斜杠、 skill 斜杠目录下,每个技能是个文件夹,里面有 skill dot md 文件和 scripts 子文件夹 技能。用 skill manage 工具管理, agent 创建的技能会自动存在 skills 目录里。技能有四个好处,第一,程序性记忆, agent 创建并附用的流程。第二,跨 session 持久化,所有 session 都能用。第三,自我改进, agent 用着用着会优化技能,一键调用书写纲, skill name 就 能快速执行。 核心内容讲完了,最后总结一下,回顾一下 harmony agent 配置的核心要点。第一,目录结构,所有配置存在波浪线斜杠、 harmonies 斜杠目录里包括 config comfy 等文件。第二,配置管理,用 hermes comfy 命令查看编辑和设置配置智能路由到正确文件。第三,优先级规则, client 参数优先级最高, 然后是 config comfy, 再是 in v, 最后室内自默认值。第四,七种终端后端按需选合适的。第五,记忆系统, memory dot md 存时是 user dot md 存用户档案,容量有限,但能管理。第六, stored md 定义, a 证的身份,占系统提示第一位,可完全自定义。 第七,技能系统纯过程性,支持五步以上任务键,一键技能支持一键调用。如果你再用 hermes agent 或打算部署 ai 助手,建议仔细看看官方文档,合理配置各个模块, 用起来会更稳定、更个性化。我是大叔,大实测验证并整理。如果你觉得这个配置指南有帮助有用,请点赞收藏,后续会持续更新 hermes agent 的 相关内容,感谢观看,咱们下期再见!

hello 宝子们,在 windows 上面安装 hermes agent 成功不了啊,终于放弃了,这个周末白搭进去了,别再熬夜踩坑了,我劝大家直接放弃吧。我为什么要在 windows 上 安装 hermes 呢?因为啊,我在它的 install 点 s h 安装文件里边儿发现了一个 windows 一 键安装的脚本,一个 install 点 ps 一 的安装文件。 我看了一下,里边大部分的功能都已经实现了,我说这不都已经写完了吗?怎么还还还藏着掖着? 我决定这么搞一下试一试,结果不搞不知道,一搞,哎呀,周末两天全搭进去了。首先要使用安装这个脚本,要解决一个网络的问题啊,为了我想搞完以后 分享给大家,让大家也可以使用。我就把 git hub 上面的这个项目除了呃 hermes agent, 还有它的子项目移植到了开源中国,就是 et com 上面里边的内容,里边的有一些代码依赖,还要修改, 比如说像 uv 的 安装脚板,你要改成是国内的安装员,然后 note gs 的。 呃,镜像,你要安装国内的镜像员?我在周六晚上的时候 就发现,哎,传不上去了,怎么办?他想需要实名认证,把我的身份证照片儿传到了 get 上面儿,结果到周日也没有审核通过。 没办法,今天我又尝试了一下,在本地搭建一个 get bear 仓库。嗯,终于在 windows 上面安装成功了啊,只支持打开命令行的界面,没办法安装网关,绑定 qq 的 时候也报错。我也没有尝试去安装这个图形界面,我想也是没办法使用的,因为网关都起不来嘛, 我决定放弃了。命令行的界面已经有了,能够连接到大模型,我用的是 mini max。 我 测试一下,没有办法使用 qq 聊天工具啊。来控制 hermes, 不要在 windows 原声上面安装 hermes 了,最起码在一个 wsl 下面来安装吧。

大家好,我是科技小白,你装了 hermes 之后,是不是对着他说了句你好,他也回了一句你好,然后就不知道该干嘛了。别急,问题不在 hermes, 在 于你只装了个壳,里面的工具链一个都没配。 hermes 就 像一块主板,五个插槽,插对了才算一台机器, 插错了就是一堆零件。第一个身份系统,装完第一件事不是用它,是写 so memo and d, 告诉他你是谁。它自带两百一十一套中文角色模板,选个骨架,直接用。第二个记忆系统接入 hanseid 引擎,它会在每次对话后自动提取关键信息,存进知识图谱。 下次你说上次那个项目,他真的知道你在说哪个。第三个,感知能力,网页抓取、搜索、文档处理、 gina reader, curl for ai tablet, 这些工具配齐互联网上公开的东西,他基本都能读。 第四个,表达能力, whisper 语音转文字,支持九十九种语言。 tts 文字转语音,图片生成,接了三家引擎, 读写说话都有工具接。第五个,效率与进化, r t k 能把 token 消耗砍掉八到九成。最狠的是遗传算法,用的越久,他越懂你的套路,这是自己进化出来的 配置顺序,记住先身份再记忆,然后感知表达,最后才开效率进化。别上来就装一堆 skill, 连 s o u l 点 m d 都没写。配对了的 agent 是 你的超级员工,裸装的只是聊天窗口。

很多人以为装了 hermes 就 等于给 ai 装上了长期记忆,这个想法很正常,毕竟官方文档写的太漂亮了。什么全生命周期记忆,什么越用越懂?你听起来就像 ai 终于有了一个长期大脑。 但我实际倒腾一圈发现,如果你只是从网上克隆下来裸装,那你可能只是装上了外壳,还没跑通真正的长期记忆管道。 说句大白话,裸装版 hermes 不是 没用,但它很可能还没有发挥出 hermes 最关键的能力。没有配置外部记忆 provider, 它大概率只能停留在本地文件记忆,做不到稳定召回、自动沉淀、跨绘画、持续迭代。这俩有什么区别? 裸装 hermes 看起来也能用,甚至你会觉得它比以前更清爽。但这种清爽很多时候只是因为预装技能少,上下文更干净。这和真正的长期记忆不是一回事儿。 那真正的记忆管道是怎么跑通的?我把它拆成三个核心节点,召回、同步域取。 一、召回。在你发消息后, ai 回答前,系统会先把你过去相关的偏好、踩过的坑、常用的技术站找出来。打个比方,这就像大管家开会前先去翻你的历史会议纪要。没有这一步, ai 每次跟你聊都像一个刚入职的临时工。 第二,同步,一轮对话结束后,系统会把这次新产生的偏好、习惯和上下轮变化继续沉淀到记忆系统里。第三,域曲,系统会在后台提前把下一轮可能用到的记忆准备好。 召回、同步域取。这不是存一段文字那么简单,而是一条持续运转的记忆流水线。那遇到这个问题怎么办?核心就一句话,要跑通外部记忆 provider 没有这条管道,所谓跨绘画迭代就很容易停留在概念上。那这套方案怎么落地? 如果真要落地,我会按三种场景来选。如果你只是想省事尝鲜,迈默灵更像拎包入住的快捷酒店,接入简单,但额度和边界要提前看清楚。 如果你是团队场景,要做复杂用户画像 control 更像标准化的云端办公室,能力更完整,但成本也更高。 如果你是个人高频使用,我更倾向于本地跑一个 han sight 记忆底座,它更像给自己搭了一座私人图书馆, 数据尽量留在自己手里,成本可控,隐私边界也更清楚。但我也得客观说,这套方案不是没有门槛,纯手工配置会比较折腾,环境依赖配置文件,日制报错,任何一个环节都可能卡住。那这种脏活累活怎么办? 我的做法是直接甩给 codex 自动化处理,你只要告诉他你的目标,让他去改配置,看日制体验瞬间降维。所以你看,真正有价值的不是电脑里多装了一个 hermes, 而是你能不能把自己的偏好、经验和工作方法固化成一个随时可调用的数字资产。 如果你是单兵作战搞研发,本地 hanset 方案更适合做个人长期记忆底座,放大你的单点效能。如果你要接入团队协助,再考虑 onchat 这类企业级记忆节点。基于长期记忆这个痛点,你最希望 ai 帮你记住哪类工作习惯?是写作风格、项目经验?还是你反复踩 过的技术坑?大家在评论区聊聊,我是 cici, 分享那些不吹牛的 ai 实战经验,还是你反复踩过的技术坑?大家在评论区聊聊。我是 cici, 分享那些不吹牛的 ai 实战经验,还是你反复踩过的?

大家好,我是麦冬。今天我们来聊一个很多人问过的问题, promise 能不能对接 obsidian? 答案是可以的,而且配置非常简单。在正式开始之前,我们先简单介绍一下 obsidian。 obsidian 是 一个本地流行的 markdown 笔记软件, 所有笔记都是以 dmd 文件的形式存在你的电脑上,不依赖云端。它最大的特点呢是双向链接,你可以把笔记之间相互关联起来,形成自己的知识网络。很多人用它来做读书笔记、项目管理以及个人的知识库。 因为数据全在本地,所以天然适合跟 harmless 这种本地 a 境的进行对接。并且呢, harmless 安装好了之后,自带了 obsidian 的 skill, 你 不需要装任何 obsidian 的 插件,你只需要告诉 harmless 你 的 void 在 哪,它就能直接读写你的笔记,读笔记,搜笔记,建笔记,改笔记,它全部都能做。 那么具体怎么配呢?首先第一步,你需要找到你的 obsidian void 的 路径, void 就是 obsidian 里面笔记库的意思, 其实它就是你电脑上的一个文件夹,所有笔记都存在里面。在你第一次安装 obsidian 的 时候,它会让你配置这么一个文件夹作为它的笔记库。如果你不确定你的 word 在 哪也没关系,我们打开 obsidian, 将鼠标移动到左下角,稍等片刻,它就会悬浮显示出你当前的笔记库路径。比如我的就是在 d 盘下的 obsidian 文件夹。好,下面我们打开 hermes, 给大家演示一下如何让 hermes 连接上你本地的 obsidian。 我们打开 harmony 的 聊天界面,只需要跟他说一句话,帮我把 opposite void pass 设置成杠 m n t 杠 d 杠 abc, 写到你的点音频文件里面。这边有一点需要注意,因为今天演示是以 windows 电脑为例给大家做讲解的。 windows 电脑上有一点需要注意一下,大多数情况下,我们的 harmony 是 跑在 w s l 里面的,它是没有办法直接识别 windows 的 路径的,所以我们需要将 windows 的 路径转换成 w s l 的 格式, 就是把盘符改成斜杠 m n t 斜杠盘符的小写,比如说我的地盘 obsidian, 对 应过来就是斜杠 m n t 斜杠 d, 再斜杠 obsidian, 好, 直接按下回车, hermes 会自动打开它的环境变量文件,并且把这行配置加进去,你不需要自己去找文件,手动编辑让它自己去搞定就可以了。配置完成之后, ctrl 加 c, 关闭当前绘画,然后重新运行。 hermes 打开一个新绘画就可以测试了。 我们先来试一下,我们跟 hermes 说帮我搜一下 word 里面关于 document 的 笔记, 可以看到它直接列出了所有包含 docker 关键词的笔记、文件名和匹配内容。这个搜索是基于文件内容的权威搜索,并不仅仅是文件名,所以搜索还是相对比较准确的。下面我们再试一个帮我写一篇 docker fire 编辑指南的笔记,存到 void 里面 好了, hermes 跟我们说已经写好了,下面我们打开 ocd 看一下, 可以看到这边已经多了一篇 docker fire 编辑指南,并且 hermes 自动帮我们将它跟之前的两篇笔记关联到了一起,点开关系图谱也可以看到。 好了,今天的演示到这边就要结束了,最后还有一个小 tips 要提醒一下大家, hermes 操作 obsidian, 它是不需要 obsidian 本身在运行的,因为它是直接读写文件系统的,跟 obsidian 的 app 是 没有关系的,所以你关注 obsidian 也完全没有任何问题。 大家平时都在用什么工具管理自己的知识体系呢?欢迎在评论区聊聊。工具会变,但方法更重要。我是麦冬,下期继续。

用 hems 也有一段时间了,总的来说还是有一定的实用性,但这个 ai 工具也不是说傻瓜相机一样拿过来就能用,还是需要一定的时间去研究才能驾驭。 就我研究的几个工具,在这里给大家做一个简单展示,中间也倒腾了不少次,尤其是模型的设置,包括不同 profile 的 配置,还有就是 swarm 蜂群的工作原理, 这些基本内容还是需要倒腾几次才能弄明白这里边的逻辑,用起来也才能更顺手。经过三个周的摸索,总算搭建起自己的一个虚拟工作台了,接下来开始展示我的 hermes 征歌团队。第一个就是这个 hermes word ui, 那 它在这里可以直接跟 hermes 进行对话,而且它也有卡哇伊的一个界面,可以看到会反应很快。这是第一个,那它也有可以看历史对话, 历史对话里边我连飞书还有迷信也是都是连接的,所以说在历史对话里边,最新版的这个是需要在历史对话里边看 新功能。新版的还加了一个功能,就是一个 e p i k 的 一个中转站,我们可以去进行充值,充完值以后是可以使用一些原本在等使用的一些模型的,那还有在这里可以看到你的任务。 喏,又一个新的功能,也是看碗功能,你技能目前来说我也是创了非常多的技能记忆,随着我的使用,也越来越多地帮利透进行了补充。模型目前我是配置了轨迹流动还有 open rota, 而日制也是可以看到所有的记录网关 用户,这是第一个共聚。那么还有一个比较重要的是有一个电视爆的,新版的电视爆的里边儿 功能跟刚才的那个握部 u i 比较得类似,那么它这里其实是把多一点特的配置也是开放出来,这里还很好的可以管理我的有密钥,某不同平台的不同大摩弦密钥都可以在这里统一做管理, 嗯,当然它也是有一个看板,这个看板可以新建看板,每一个任务嗯都是可以这样比较直宽的,我看到它的状态。第三个工具是现在比特上星还不是很多的,这个 harms work space, 它其实也是一个比较好的 u i 工具,有了它的最强。强在什么强?在它的这三个光道上, conductor, operations 还有 swarm, 这个 conductor 就 相当是可以看到有多少个子 a 着的,目前正在工作, 你是可以看到可以切换不同的这个模式, great 圆的网格,还有就是 want table, 还有就是我入作战式的模式。第二个就是 operation 系, operation 也是沙滩式,可以多个而添加多个智能体,那么每个智能体你可以给它定义一个不同的角色, 让它承接不同的工作。还有一个就是这个 spa, 它这里更多的子质网体,而在这里可以输入你的工作任务,它会自动地分配给不同的子智能体去执行任务。

上一期视频我们详细介绍了 homeis nintent 的 相关内容,它能够自动化学习,根据经验来创建新的 skill 四层记忆系统,能够记住用户的聊天记录,并且支持多个消息平台,能够自动化工作。但是还存在一些问题, 比如官方版本不适配 windows 这个环境问题导致安装容易失败,以及本地电脑的限制,没有办法进行二十四小时的工作。 那我之前使用 aia 旗舰都是用的 mini max 投可 plan, 正好在官网看到了他们推出了 hermes nectar 的 云端托管版,叫做 maxhermes, 正好可以解决这一部分的用户痛点,不需要本地安装,部署更简单,并且内置了 m 二点七模型,实际体验之后感觉还不错。那今天这期视频就来分享一下 maxhermes 这款 ai 工具的使用教程,并演示实际的工作案例。在 minimax agent 的 这个官网侧边栏有 minimax 的 实验室,第一个就是 maxhermes 的 选项, 关于 maxhermes 是 由 m 二点五模型驱动的共同成长的智能体,能够自我进化使用,在线直接点击立即开始。需要说明目前这个功能是付费的,但是它解决的是本地部署以及购买 talk 计划的问题。 我自己已经使用了一段时间,实际部署其实很快,几秒钟就可以了,它可以连接自己的社交账号,步骤也很简单。以飞书为例,手机端配对之后点击立即创建,然后点击继续,大概只需要几秒钟就设置好了,不需要去飞书开发平台,自己花时间去配置应用, 并且这里的对话响应速度也是比较快的,在飞书这里它也能够处理很多事情,比如信息处理、内容创作、定时任务等等。接下来演示三个真实的工作场景,来体验一下 maxhermes 到底怎么样。 我在对话框中输入提示词,你是一个知识整理专家,任务是把输入的信息整理成可附用的结构化知识文档,并给出了具体的任务要求以及处理步骤。主题是关于 hermes nint 的, 然后添加附件,选中我的本地文件,这个是我自己搜集到的资料,点击打开任务发送之后,他会立即展开侧边栏,在当前进展的这个栏目下面,会具体展示当前执行任务的一个进展,以及执行的命令,还有系统的响应结果。 在中间的对话区域也有当前的工作进展,等待的时间不长,任务就完成了。对话框中也完整的展示了本次任务的交付文档,包括一个 markdown 文件和一张知识读谱, 并且告诉我文档的具体位置和名称。同时还有具体内容的一个简报,内容包括定位于本质、三层架构,四层记忆系统等等,还是比较详细的, 还给了一些知识标签以及和我之前任务的一个对比。点击右上角这个按钮,然后点击文件,这里就相当于我们的工作空间, max 和 miss 产生的文档都在这里 找到。 hermes engine 知识体系这篇文档。 markdown 文件在这里是支持直接预览的,内容包括产品的具体介绍,三层架构、记忆系统等等,内容还是非常详细的,一共罗列了十三点内容。 在文件管理这里,这些文档都是可以直接编辑的,点击编辑按钮就可以直接修改文档的内容,修改之后点击保存即可,它也能够直接进行下载到本地还是比较方便的。 接下来给他下达第二个任务,以我的工作需求出发,让他生成一个可直接拍摄的视频脚本以及口播词,要求内容必须适合视频表达,并且逻辑清晰有节奏。给了一个具体的输出结构,包括三个备选标题,完整的脚本,口播稿以及十个标签, 完整的提示词可以参考屏幕。这一次他也很快就完成了任务,一共输出了三份文档,分别是含主播搞的主角本、封面与分镜以及拍摄的注意事项,内容也是比较完整的,主角本的结构按照具体多少秒的标准来告诉我主要内容是什么。我们来看一下具体的输出文档。 第一个文档是封面与分镜,给了三种风格的封面文档和代选标签,下面是具体的分镜表,包括时间轴、时长、画面内容、口播和 bgm 风格等等。最下面是素材清单。 第二个文档是拍摄注意事项,包括常见问题 checklist 以及给的一些后续的选题推荐。第三个文档就是最具体的脚本了,我个人觉得非常好的一点是每一段脚本都会结合具体的关键点、时长画面来一起呈现,并且内容还是比较专业的。 下面有一个精简版的口播稿,说实话这个效果还是非常不错的。 hermes engine 的 最主要特性就是能够自动进化,头一项任务执行次数大于五次就会自动生成 skill, 比如视频脚本以后可能会给它不同的主题,但是要求和交互标准都是一样的, 我这里让它根据我刚刚的过程和要求生成一个 skill, 这样后续有其他题材的制作需求时,就不需要给出长长的提示词了。 创作新 skill 的 过程还是比较快的,中间这部分就是输出结果,告诉我这个新 skill 的 基本信息,包括名称、路径以及触发词。然后就是 skill 的 内容了,包含输出文件结构、主脚本格式、创作规范、分镜表模板等等,内容还是比较详细的。 最后给出了一个使用案例,只需要一句话,帮我写一个某某主题的脚本就行,不需要我们前面输入的那一长串的提示词。 ok, 这里就来测试一下新 skill 的 能力怎么样。回复他,帮我写一个关于 cloud code 测评的视频脚本,右侧的执行过程能够看到,即使没有给他任何的输入材料, 它也能够直接联网来搜索获取相关的内容,具体执行的过程加快处理。我们直接来看一下最终的输出结果,中间是输出清单和脚本结构,和刚刚的 hermes 的 结构保持一致。 在工作空间这里专门的 code code 文件夹有三个 markdown 文件,分别是封面与封境、拍摄注意事项和脚本,具体的格式和内容规范也完整保留了之前的风格,能够看出这个新 skill 的 执行能力还是挺强的。 以上就是关于 max hymes 这款 ai agent 的 使用过程和体验,整体的流程还是比较流畅的,不用耗费时间来折腾本地部署和环境配置,也不用额外的订阅 tokpline 对 于一些工作场景的适配也很好, 并且 hymes agent 的 最大特性,自动化提炼 skill 也完整地继承了下来。如果你感兴趣的话可以体验一下这款产品,那我们下期视频再见。拜拜。

大家知道吗? hermes 还能通过 qq 给你传文件呢?下面我就给大家演示一下具体操作。首先,你得先装好 hermes, 并且把 qq 通道配置好之后,你只需要通过 qq 给他发一条指令就行,不管是语音还是文字都可以。 比如你可以说帮我把 f 盘文档里的包夹文件目录打个包,通过 qq 发给我。没过一会儿, hermes 就 会把打包好的文件发过来了,你直接在手机上就能查看。那它到底是怎么实现这个功能的呢?我来采访一下它, 我发一条语音指令,问你是怎么实现的,把详细步骤说一下。如果有朋友装了 hermes, 也配置了 qq 通道,但不知道怎么让他发文件,你可以把刚才这些内容截个屏发给你的 hermes, 让他自动学习进化。好啦,今天的分享就到这里,我以后会持续更新更多实用的案例,大家可以持续关注哦。

一个视频带你看懂最近爆火的小龙虾杀手 hermes agent, 它是一个可以自己进化的 ai 助手。首先我们来对比一下 hermes cloud 还有 opencloud cloud 呢?它如果嵌在 v i store 里面,所有文件都是透明方便查找的,但目前无法直接通过一个通讯软件跟它交互。记忆呢,主要靠手动维护。 cloud md 内置的 skill 本身会比较少,但是生态非常的丰富,上限很高,稳定性也很高。 opencloud 它可以集成到通讯软件里面,本身内置了很多 skill, 适合呃纯粹的技术。小白有一些记忆文件,而且可以定时的自动触发任务。 hermes 呢,我们 call 有 的它都有,但体量更小,而且它有自我净化反思的能力,对国内生态的集成也很不错,飞书还有微信都是可以连的。 hermes agent 有 五大核心的模块,这五个模块形成闭环, memory 用来积累上下文, skill 用来模板化重复的操作, so 保持风格的一致。 craw 用来实现自动化, self improving 持续优化前面所有模块的质量。实际使用上呢,你不需要每次对话都重新描述项目的背景,可以直接调用之前已经跑通过的技能,它对话风格也完全遵循你的旨意。 它有一个三层的记忆系统,第一层是关于用户的记忆,写在 user 点 m d 里面,里面有用户的长期偏好语言,在做项目界面信息等等。第二层是关于项目的记忆, 写在 memory 点 m d 里面,里面主要是一些实时性的信息,比如说部署脚本在什么什么什么目录里面。第三层是历史对话搜索,它能在几个月的聊天记录里面搜到某次讨论的具体的内容, 也就是说过去聊过的方案随时都可以翻出来。 hermes 也支持 skill, 很 适合做重复执行的知识类工作, 但它和 cloud 的 有两个主要的不同。首先就是当你连续两至三次执行相似的操作序列的时候,它会主动的去问你要不要附装成一个 skill。 其次,它内置的技能会更丰富,同时也像 cloud 的 一样,可以从社区官方那里面继续下载好用的 skill。 它的定时任务要比 windows 更完善,它可以把任务串联成一个流水线, a 的 输出自动传给 b, 数据采集、分析、推送, 很适合多步骤的这样的工作。同时简单的日常监控不会消耗他的 token, 只要在智能判断的时候才会介入消耗 token。 而人们最特别的是他的自我进化机制,他会主动进行反思,查找之前的规律,然后将这些高价值的反思提炼成规则。 每次提炼的时候他都会经过你的允许,而且每次重大改进都会生成一个可生化的版本,就像一个人格的进化报告一样。 那有没有必要用呢?其实之前 opencloud 刚出来的时候,我也觉得这样的工具是给一些技术水平比较低的人用的,更像是一个营销的噱头。但我一直在思考啊,就这么一个框架,有革命性的工具,它到底能在什么场景中使用?或者说真正阻碍我从 cloud 换到 hermes 或者是 opencloud 的 原因是什么? 我觉得更换成本是一个非常重要的一点,因为要把我现有的工作流完整的搬在 hermes 上,需要进行很多的重新培养和配置,这会让 hermes 前期的使用变得非常麻烦,效果可能没有可拉的那么顺手。但对于我大部分的创作内容来说,长线来看, hermes 很 可能是要优于可拉的。 比如说定时任务数点、 m d 自动化机制,这些都属于长线复利型的机制,你用的时间越长,他就越能解放你的生产力。 所以我现在正在把整个工作流尝试搬到 hermes, 你 可以把它理解成一个在旁边看着你干活的实习生。一开始他可能确实没有看到这样的强能工具好用,但是一旦掌握了完整的工作流程,掌握了你那些可能写不在 skill 里面的个人使用习惯,他就可以爆发出惊人的战斗力。

兄弟们,你们要的在 hermes engine 中用网页大模型代替我们 api 的 解决方法来了,下面我们用一分钟的时间来实操一下 windows 用户的话,得到这个 excel 的 文件安装包,直接安装好的话,主界面就这样了, 我们在设置里面把它的文字改为简体中文,然后再点击供应商,这里我们添加一个单元格型,这里我就以字谱为例,选择之后直接点下一步,然后点击 os 登录方式,打开 os 登录,然后我们就像以前登录字谱的官网一样去登录它就完了。登录好了之后,我们就点击添加账号,相当于现在已经有一个 字谱的账号在这里了。然后点击左侧菜单栏,点击代理设置里绑定地址的话,如果是自己用,那就按着这个上面默认的就可以更改。然后点左侧菜单栏的 api key, 我们打开认证,新建一个 api king, 这里的名称和 king 可以 自动生成就可以,然后我们接入 api 的 base url 的 话就填上面那个, 然后模型名称填下面那个,那么这里面的所有的操作我这里都已经整理成了一份指南,如果大家有需要的话可以在评论区留言。接着我们打开我们的 harmony, 然后这里面输入 harmony 默认,接着我们往下翻一翻,找到自定义接入 api 的 方式,然后点击进去,然后我们把我们刚才的 s、 u、 r、 l 复制过来,然后下面把 api king 也给复制过来,然后这里点击回车,然后我们查看一下所有的可用 api 列表,好,这里发现智普的 g、 r、 m 这里都有了。

哎,我跟你说啊,你手里的那个标准版 hermes 和装满各种神器的 hermes, 根本就是两个物种,真的一个在地上爬,一个在天上飞。所以今天咱们就来个大揭秘, 看看怎么通过五步,把你的 ai 智能体直接报改成究极完全体。 你看看这个对比,简直了!左边这个裸装版,说白了就是个小玩具,记性差还不能上网,能干的活特别有限。但右边这个满配班呢, 那可就厉害了,不仅有长期记忆,还能随时上网,会说话会画画,最关键的是用起来还超级省 toc, 这差距根本就是降维打击啊! 所以你是不是也好奇,这中间到底差了点啥?能有这么大的区别?答案其实很简单,就在这五大升级模块里,第一,给他灵魂和记忆。第二,让他联网。第三,解放他的表达能力。第四,把成本和效率拿捏的死死的。 最后一步,带你进入他背后强大的生态系统。来,咱们就跟着这份暴改指南一步步来好了,废话不多说,我们直接开干!第一步,给他注入灵魂,再安上一个超级大脑。 怎么给他灵魂?很简单,想让你的 hermes 马上变成某个领域的专家吗?用这个叫 agency agents gh 的 宝藏库就对了,里面有两百多个写好的中文角色,甚至还有专门给抖音呐、微信这些平台定制的智能体, 都给你分好类了,什么市场部、技术部,每个角色都是一个现成的文件,拿来就能用,即插即用,你说方不方便? 好,现在他有身份了,接下来咱们得解决那个记性差的问题,给他装个完美的记忆系统。 你看啊,他自带的那个记忆系统,说实话,又小又笨,你得手动往里写东西,还写不了多少字。但是这个叫 high inside 的 工具,那可就完全不一样了, 他能自动帮你把对话里的关键信息给抽出来,自己建成一个知识网络,等下次聊天需要的时候,他就把最相关的记忆精准的塞回到提示里,这才叫真正的过目不忘。 好,第一步搞定。接下来第二步,咱们要给他装上五官,让他能看见,能读懂整个互联网。 想让他看见,就得用这些网页抓取工具。你看 gina reader, 能快速看懂一个网页, curl4ai 呢,能做深度挖掘,把整个网站都给扒下来。 要是遇到那种不让看的网站怎么办呢?没事儿,还有 scraping grid 和 camouflfox, 就 像给他穿上了隐身衣,轻松绕过反爬虫。 有了这些,网上就没什么秘密是他看不见的了。当然,光有眼睛还不够,还得有个聪明的大脑来处理信息。所以你看,我们给他配上 tivoli, 这是专门给 ai 用的 soso 引擎,非常强大, duckgoon 可以 当个免费的备用。还不止这些,有了 panda 和 marker, 它连各种奇奇怪怪的文档都能读,就算是复杂的 pdf 也能给你整得明明白白。这么一套下来,它的信息处理能力直接就拉满了。 ok, 现在它能看能懂了,那么第三步就该轮到说和话了,我们要彻底解放它的表达能力, 装备上这些工具,你的呵 max 就 算是真的活过来了。用 whisper, 它能听懂快一百种语言,你说啥它都明白,用 h t t s 呢,它就能开口说话,而且还是免费的。那画画怎么办?简单, file ai 和 flx skill 就是 它的画笔,能画出质量超高的图片。你想想,能听能说,还能画一个全能型的 ai 助手,这不就诞生了吗? 好功能是越来越强了,但咱们的钱包也得顾着点,对吧?所以,这第四步就是高阶玩家的玩法了,把成本和效率控制到极致。 你先看这个数字惊不惊喜?用上这个叫 r t k, 全称 rust token killer 的 工具,跑那些端端命令的 token, 消耗直接给你砍掉百分之九十。这是什么概念?就是你的运行成本直接打一折,你说香不香? 那怎么知道钱具体花在哪儿了呢?很简单,如果你想快速看个大概,就用 talk scale, 它能在命令行里实时告诉你总共花了多少 toc。 如果你想看更详细的账单,那就用 hems 哈读 e。 它有个网页界面,能把每个零件花了多少钱都给你列得清清楚楚。一个看总览,一个看明细,总有一个能帮到你。 不过要说最酷的,还得是这个,它能自己净化。没错,你没听错, 背后用的是一种叫遗传算法的技术,说白了就是让赫姆斯自己去试,错了就改,对了就保留,慢慢的,它就能自动找到最好的工作方法和提示词。也就是说,它会在使用中自己变得越来越聪明,越来越强。 好了,到这儿你的智能体已经非常强大了,但别急,还有最后一步,我们要为你打开一扇大门,带你进入一个更广阔的世界。赫摩斯生态, 你可以从这两个地方开始探索。第一个叫 awesome hermes agent, 这基本上是一个一站式的资源库,你想要的各种工具资料里面几乎全都有。 第二个叫 hermes ecosystem, 它更像是一张地图,用可识画的方式给你展示了八十多种相关的工具。记住,给你的 agent, 它升级这条路是没有终点的。 好了,经过这五步爆改,一个真正强大的超级智能体现在就在你手上了。那么最后的问题留给你,你打算让它为你做点什么呢?

在上一集讲解了 hermes desktop 的 桌面工作台体验。本集进入一个更关键的能力, profile profile 不是 多开几个聊天窗口,而是给 hermes 创建长期稳定的 ai 角色。 每个 profile 都可以拥有自己的 soul 记忆技能、工作目录和模型偏好。比如要做一个 ai 会议纪要助手的发布页,就会同时出现产品策划、前端工程增长文案和审核要求。 这种复杂任务最容易出问题的地方就是不同角色的判断混在一起。 profile 的 作用就是把这些角色边界固定下来,减少上下文串台。 这里把原来的单人做页面,改造成一个产品发布小队。 product planner 负责用户画像、价值主张和页面模块。 frontend maker 负责把结构落成可运行页面。 growth editor 负责标题描述和转化文案。 review guard 负责事实检查、风险提示和表达边界。主 agent 都不亲自做完所有事,而是拆任务收结果做最终判断。创建 profiler 的 思路很简单,先命名角色,再写清职责 命令。上方的中文注示就是每个角色的用途,先创建 product planner, 再创建 frontend maker, 然后创建 graph editor 和 review guard, 最后用 hermes profile lists 检查角色列表。这里最重要的不是命令本身,而是明知要表达职责。 创建完角色以后,不要急着马上开聊,先确定他负责什么,不负责什么,输出什么格式,以及遇到冲突时按什么原则取舍。 solo 是 profile 的 角色说明书, 第一写身份,这个角色到底是谁,服务什么场景?第二写职责,他负责哪些结果,不负责哪些判断。 第三写原则,遇到冲突时怎么取舍?第四写交付标准,最后必须给什么格式文件或检查清单。第五写禁区,哪些判断不能做,哪些能力不能碰,哪些信息必须标记待确认。 so 写得越清楚, profile 的 行为就越稳定。 product planner 的 so 要把它定义成产品发布策划,他负责把模糊想法收敛成目标用户核心卖点、页面模块和开发。 brief 原则写成先清楚再好看,先验证用户价值,再扩展创意表达。禁区也要写明不编造市场数据,不替工程角色决定实现细节,这样他输出的不是一堆灵感,而是可以交给下一棒的结构化 brief friendmaker 的 so 要把它限定在前端工程角色, 他接收 product planner 的 brief, 然后输出文件结构、组建、拆分状态流、交互逻辑和必要代码。原则是优先附用现有项目风格,少做无关重构。禁区是不要改产品定位,也不要替文案角色写夸张营销语。它的交付标准应该很工程化, 能运行、能检查、能说明缺口。 growth editor 负责表达,而不是负责实现它的 so 笔要写清楚输出标题、复标题、卖点按钮、文案发布描述和 ab 版本。原则是表达可以锋利,但必须保留事实边界。禁区是不能承诺无法验证的效果, 也不能修改工程代码。这个角色适合在产品结构出来以后专门提升信息密度和转化表达。 review guard 是 最后的审核首位, 他的 so 要写成检查事实风险和权限边界,而不是继续创作内容。职责包括标记夸张、表达、缺失证据、高风险能力以及需要人工确认的点,原则是先保护可信度,再追求转化率。 禁区也要明确,不直接改最终产物,只输出问题清单和修改建议。运行时可以先进入 product planner, 比如让他为 ai 会议机要助手设计发布页方案,要求他输出目标用户三条核心卖点,页面结构,以及给 fronten maker 的 开发。 brief。 这个输出不是最终成品,而是下一棒的清晰输入。主 agent 收到 brief 后再分发给 frontend maker 和 growth editor, 最后让 review guard 检查事实风险和表达边界。 profile 还可以做配置隔离。 比如 frontend maker 可以 使用更偏代码的模型,它自己的环境,文件里放密钥,自己的 config 里指定 provider 和 model。 技能也按职责选择。策划角色可以偏调研和结构化输出,前端角色可以偏代码调试和文件操作, 不要把所有技能默认塞给每个角色,多角色不是越多越好。真正稳定的做法是,主 agents 负责拆任务和汇总, profile 负责局部专业输出,每个 profile 只给当前任务需要的工具, 尤其不要默认打开。高风险能力,刚开始三到四个角色就够了,等职责稳定,产出可预测,再继续扩展新的 profile。 这一集我们把 hermes profile 了,角色隔离 so 写法,命令势力和多角色写作讲完了, 如果你想继续看 hermes agent 的 完整系列,可以关注我,我会继续分享更多 agent 的 工具和工作流内容,我们下集见。

这期用几分钟带你入门 hermes agent, 我 们会从核心优点、模型选择、配置文件到自动化落地流程,一次讲清楚怎么从配置走向真正可用。 hermes agent 可以 理解为一套具备技能系统、持久记忆和长任务稳定执行能力的智能体框架。它不是简单聊天机器人,而是面向真实自动化任务的执行框架。 第一个重点是 skills 技能系统,你可以像安装插件一样给 agent 的 添加能力,把网页抓取、 api 调用脚本执行数据库操作都封装成可复用技能,并按场景起用。 第二个重点是自进化记忆。 homeworks 会通过 user md 记录你的偏好和工作方式,通过 memory md 记录跨规划关键决策,用得好它会越来越懂你,用不好也可能积累错误记忆。 第三个重点是长任务稳定性。 getaway service 负责消息路由状态保持和断线重连,即使绘画中断任务上下文也能保留,适合多步骤自动化流程。 模型选择会直接决定 homies 的 天花板,优先选择推理稳定、上下文窗口大指令跟随。好的模型文档里建议先看 deepsea v 四 flash 和 kimi k 二六,再按预算考虑高成本模型。 配置文件是 hermes 的 股价 so m d 定义 agent 呢,是谁服务谁,主要做什么?它决定角色定位、核心使命、行为风格和约束边界,是最重要的灵魂文件。 configem 呢,是控制面板,重点关注上下文压缩技能,按入口起用平台工具及开关、超时重置和日制等级,不要把所有能力默认打开,按场景最小化起用。 user md 和 memory md 是 双刃剑,初次部署时建议先手动写入准确的用户画像、项目背景和关键规则,同时要定期清理低质量记忆,避免附像进化 落地。自动化时不要让 ai 猜需求。 harmless 最适合流程固定的流水线工作,你需要提前说明环境、时间、目的、产出和边界,让 agent 在 清晰约束下执行。 推荐流程是五步,先澄清需求,再让 agent 出详细方案,然后人工评审确认后再执行落地。最后让 agent 自查和演练一遍,这个顺序不能法 出街,跑通后可以继续做高阶能力锁定、 skills 与记忆文件设计、 get 门禁集成、自主进化治理以及多 agent 协助。先把一个真实流程跑稳,再进入下一阶段。 总结一下, hermes 的 关键不是堆工具,而是把模型配置、技能记忆和执行流程组合成稳定系统。先小范围验证,再逐步扩展才是最稳的落地方式。

大家好,我是阿里厂长,今天这期劝你先想清楚再决定要不要签 hermes, 翻了 hermes 那 个仓库的一售区,挑出四个最让我倒吸冷气的迁移事故, 一行命令能让 openclaw 完整安装变空,股价能让一点二 g 长上下文数据库归零能让五十五个 session memory 文件永远找不回来。写出来不是教你怎么签, 是劝你先想清楚要不要签。我自己手上那个 openclaw 也用了几个月, so 改过上百遍, memory 里塞了好几本关于我的私货,几个 channel 的 token 也都配好了。如果没看到这四个 issue, 下周大概率自己就那么裸跑了。第一个一数八五零二。这是最经典的一条 openclaw 的 gateway, 一 般跑在 system 的 用户服务里,你跑 claw migrate 命令的第一秒, 他会把 openclaw 的 配置目录重命名归档,听起来挺干净,问题是那个 gateway 一 秒钟都没停过,他发现自己的工作目录没了,立刻在原地址重建一个空目录。迁移命令以为自己安全规章了, gateway 以为自己丢了配置在自救,两边都没人通知对方,等你回来打开终端, openclaw 还在跑,里面什么都没了。 p r 八六六三合并了,对这个 case 的 进程检测,但同样的逻辑漏洞在收尾命令 claw clean up 上还在吃。 第二个一数七八四七是 hermes 官方自己开的 tracking issue, 里面收了七个迁移 bug, 大 多是 p 零 p 一 级,都是同一类。问题叫做 schema drift。 听起来挺学术,其实就是 openclaw 自己的配置文件格式,过去几个月改了不少迁移工具,有些字段没跟上。举几个真的会让你丢东西的例子, workspace 目录改名了,旧版工具只查旧路径,你那一堆 memory personal skill 直接静默跳过,连个 warning 都没有。 再比如 apikey 存在 openclaw 配置文件的 emv 子对象里,旧版工具压根读不到 channel, 凭证嵌套在新路径下也会被漏掉模型 provider 的 api 从老版的 openai 改成新版的 openai completion, 旧版本不识别,就当默认直处理。这些字段漂移已经合并了修复,但你装的 hermes 版本如果太老拿不到。第三个 issue 五一九一目前还没修。那位作者跑完迁移之后 gateway 没起来, 查了半天发现 openclaw 配置文件进了 archive 没复制回新位置, slack 那 两个 token 也没提出来,写进 harmless 的 环境变量文件,整个过程没有一条 warning, silent failure 无声失败, 你说气不气?第四个 issue 八五九六这条最让我倒吸冷气,那位作者签完之后顺手跑了 claw clean up 加 open claw doctor 这两条命令。 clean up 听名字像是签完帮你打扫一下干的事,其实是把整个 openclaw 目录重命名规章问题在哪儿? 它跟一数八五零二一样,不会检查 openclaw 服务在不在。跑 openclaw doctor 这条更要小心,它本来是检查 openclaw 装的对不对的诊断工具,会扫一下配置文件看缺什么, 然后自动把缺失的 plugging 配置和默认字断静默剥掉,重新生成一份最小化配置。两条连着跑了一次的结果是一点二 g 长上下文数据库变成零字节,五十五个 session memory 文件没了, hindsight recall 和 lossless claw 两个 context engine plugging 也全被剥掉,系统看起来还在跑,但已经不是几个月调出来那个 agent 了。四个现场看完了,先别急着想怎么避坑,我个人的建议是,先停下来问自己一个问题, 你为什么要签 openclaw 和 homos 不是 同一个东西,签过去不是无损升级,判断要不要签,至少先想清楚这三件事。第一件,你现在的 openclaw 有 没有不可替代的依赖? so 改过上百遍 memory, 慢慢累积几个月的 session 历史,这些东西 get 里 commit 不 到, 写进文档也是干的。如果你的 agent 已经长出关于我的人格,签过去就是赌运气,这种东西丢了找不回来,没必要为了听说新的更好去赌。 第二件,你要的 hermes 那 几个能力, openclaw 真的 没有吗? hermes 多出来的 channel, plugin, 跨平台路由这些功能, openclaw 用插件其实也能搭出来。先列出来你具体想要 homeworks 哪几个功能,再看 openclaw 是 不是真的搞不定, 很多时候你只是想要其中一个,结果连带签了一大堆。第三件,能不能不签,或者起一个新 hermes 实力和老 openclaw 并行跑, 很多人签的真正原因是听说新的更好,但具体好在哪儿没想清楚。如果你只是要试试 hymes, 最稳的做法是双开,保留老 open claw, 新装一个干净的 hymes 玩儿一段时间,等你确认新工具确实能替代老的,再考虑签数据, 这是最安全的路径。这三个问题想清楚以后再决定要不要签。最后想问问你,你现在的 open claw 用多久了?你打算签吗?为什么签?为什么不签?评论区告诉我。好,这一期就到这里,觉得这一期有用记得点个关注收藏一下。我是阿里厂长,下一期喜欢听什么,欢迎评论区告诉我。