harmos skills 系统在我深入分析之后,我认为它是一个灾难性的设计,里面的问题不是某个具体的问题导致的,那是一个严重的系统性问题,这个问题会导致 harmos 越来越笨。前两天我准备做一期内容,讲一讲 do ajax 写作的工作流需要配图,我就让我的 harmos 给我生成了八张图, 结果做出来的八张图风格完全不一致,它并不是工具的原因。在我深入研究之后,我发现了一个更严重的问题。我的四个绘图 skills 之间互相踩对方, 有些是从其他地方引入进来的,有些是我自己画的,他们甚至在 skill md 直接写了 complex with, 互相诋毁对方。趁着这个问题,我和我的 agent 深入分析了一下 hermes skills 的 源码,越分析越不对劲,我本来只想解决一个配图的问题,结果我发现了一个系统级的问题。虽然最开始使用 hermes 这两天我一直在吹捧 hermes 自动创建 skills 的 这个设计, 但是我现在的观点变了,只管生不管养,比不自动创建这个问题更加严重。来说说第一个问题,经验并不等于技能 house 的 设计是什么,当你完成一个复杂任务的时候,它会自动把你的经验创建为 skills。 这个设计本身没有问题,但是我们来看看它的触发条件。五个 to use core 问题是五个 two course 就 能代表这个技能真的值得被附用吗?一个一次性调试经历可能触发这个条件,一个偶然成功的 walkout 也可能触发结果是大量临时工 skills 被创建出来,但是你真正需要的反而被淹没了, 这对应到自然系统里面是什么?人类的经验记忆里有一个概念叫做工作记忆和常识记忆。工作记忆容量有限,短时保使用,忘就忘。常识记忆需要巩固过程才能真正的值得被长期保留。但是赫默斯呢?五个突破就直接创建 skill, 等于工作记忆直接变成了程序性记忆,没有巩固,没有验证,没有筛选临时工, skill 泛滥,生态污染。 第二个问题,没有任何富商机制。富商这个词我之前深入学习过,系统之美梅森说过,一个系统要保持稳定性,一定需要调节回路,一定需要引入补偿机制。 但是亨姆斯, skill 只能增不能减。对比到自然界,为什么自然界不会崩溃?因为有死亡生物会死,死了会分解养分,回归土壤,新的生物生长,这是一个新陈代谢的循环。但是亨姆斯 skill 死了, skill 一 段创建永远存活,没有任何 still less 机制, 没有任何自动禁用的逻辑,你只能手动一个个去删,但你怎么知道该删哪一个呢? skills 越多,反而越是一个灾难。 第三个问题,没有任何组合机制。做过软件开发的同学应该都知道,有一个概念叫做组合大于继承。但是 house skills 不 光没有组合,也没有任何继承的逻辑。自 然界里面也有一个规律,叫做组合优于堆叠在一片森林中,树和树之间通过根系共享养分,协调进化。但是 house skills 呢?每一个 skill 都是一座孤岛, 你想让两个 skill 共享一段共同内容,做不到,只能复制粘贴。这里不是做不到,是 house 自己的创建 skills 不 会使用这个手段。当然,如果我们自己手动编辑的 skills, 是 可以通过用引用组合的方式去做的,但是没有人工干预,你的 skills 系统会变成什么样子? 一个 t d d 工作流,在 writing place 里面有一份,在 test driver development 里面有一份,在 sub agent driver development 里面又有一份,更新了一次迭改三处地方官方 skill 点。 m d 里面有 related skills 这个词段,但是它根本不起任何作用,它只是被解析了,放在 jason 里返回给调用者,根本没有任何代码去引用它。 这四个问题没有任何的冲突。检测回答我遇到的问题,四个 skill 互相冲突,你知道赫姆斯在创建 skills 里面会检测什么冲突吗?只检测名字冲突。如果里面有一个叫做 excel 做的 skill, 你 就不能再创建第二个同名了。但如果两个 skill 几乎做的一样的事情,只是名字不同, 它完全不会提醒你功能重叠,不管关键词重叠,更不管。四个词格可以在你的环境里面和谐共处,互相踩对方,而你对此一无所知。第五个问题,这个是让我觉得最镇静的地方,没有任何追踪的机制,上游赫默斯的源码里面根本没有任何调用次数的追踪。 skill 无穷, 哪个还说被调用了多少次?不知道哪个 skills 最高频的使用,不知道哪个 skill 从创建到现在一次都没加载过。不知道 这些问题在官方代码里面全部都没有答案。其实上面这些系统性问题我前两天画图的时候就发现了。我当时做了一个 skill 去优化,它们叫做 skills 加急 ment。 它的判断逻辑是 定期扫描你的 skills 生态系统,检测重复、冲突、孤立、过时的情况,然后给你一个判断报告。但是实际用下来效果很差。为什么?因为赫默斯没有统计任何 skills 的 调用次数, 我们的系统在没有这些数据支撑的情况下去分析就是空中罗格。于是我提了一个 pr, 但是这个 pr 目前还没有被合入。这五个问题并不是独立存在的,他们反而会互相强化,没有使用追踪,你不知道该删哪一个。没有组合机制,重复的 skills 越来越多,没有附上机制,删一个多出来十个。 没有冲突检测,互相踩对方的 skill 共存经验并不等于技能临时工。 skills 会污染整个生态,结果会是什么?系统必然走向最大的伤,就像一间房子,只往里面堆东西,但是却从来不打扫,最后堆到连门都进不去了。 这还不考虑 skill 本身对上下文的影响? skill 越多, a 进程越慢,这是另外一个问题。问题讲完了,那有没有解法?其实我刚才讲到那个 skills 加技能是其中一个解法,但它现在还不完全纯熟,我们要完全开源出来。 它的逻辑是能够定期去扫描你的 skill 生态系统,但是我想把它做成一个纯自动化的,而纯自动依赖于对 hummus 原码的改造。我已经提了一个 pr, 但是官方有几千个 pr 都没有合进来,如果 hummus 官方很难加上这个功能的话,我只能通过打补丁的方式去给我的 skill 系统建立维护机制的,但它的质量完全受制于数据的质量。 最后劝告一下大家, hymas 确实很好用,但它也有不少问题。在使用时我们要把它当成一个有机的系统去培养。自然界的生态系统里面之所以能够持续运行,不是因为没有死亡,而是因为死亡被设计到了系统里。你的 sky 系统有没有这个设计呢?也欢迎大家集思广益,我们一起来思考一下怎么解决这个问题。
粉丝2402获赞1.0万

大家好,我是科技小白,你装了 hermes 之后,是不是对着他说了句你好,他也回了一句你好,然后就不知道该干嘛了。别急,问题不在 hermes, 在 于你只装了个壳,里面的工具链一个都没配。 hermes 就 像一块主板,五个插槽,插对了才算一台机器, 插错了就是一堆零件。第一个身份系统,装完第一件事不是用它,是写 so memo and d, 告诉他你是谁。它自带两百一十一套中文角色模板,选个骨架,直接用。第二个记忆系统接入 hanseid 引擎,它会在每次对话后自动提取关键信息,存进知识图谱。 下次你说上次那个项目,他真的知道你在说哪个。第三个,感知能力,网页抓取、搜索、文档处理、 gina reader, curl for ai tablet, 这些工具配齐互联网上公开的东西,他基本都能读。 第四个,表达能力, whisper 语音转文字,支持九十九种语言。 tts 文字转语音,图片生成,接了三家引擎, 读写说话都有工具接。第五个,效率与进化, r t k 能把 token 消耗砍掉八到九成。最狠的是遗传算法,用的越久,他越懂你的套路,这是自己进化出来的 配置顺序,记住先身份再记忆,然后感知表达,最后才开效率进化。别上来就装一堆 skill, 连 s o u l 点 m d 都没写。配对了的 agent 是 你的超级员工,裸装的只是聊天窗口。

强烈建议啊,大家不要再用什么 oppo cola 的, 如果说你的需求跟我一样是那种,就是主要是当一个个人助理,就是我们需要一个自己的 ai 个人助理, 听我的安装那个黑就就这个吧,这个叫什么黑黑 max 啊,他真的比 oppo cola 聪明多了,还记得之前我说过了吗?我有一个特别大的需求,就是登记我们这个彩票店每天顾客 有多少人,那个下单,下单的金额是多少啊?我希望他能够帮我登记一个表格。我用那个 oppo cola 的 啊,折腾了我多少天都没搞定,但是用这个黑马士一次性就能搞定,而且几乎是不出错的, 而且他还很聪明,他真的很聪明,就是他是真正的能够理解我们在说什么,而且他上下文的记忆功能也比那个 oppo cola 会好很多。我现在的问题就是 我打算配置那个 door engine 啊,然后我现在正在给他下达这个指令,看一下他晚上能不能配置好啊,我觉得真的用起来太爽了这个。

hermes agent 到底强在哪里?和 oppo cloud 又有什么区别?没有废话,从安装使用技巧对比测试,系统增长一次全部降为一百,走,我们出发! hermes agent 原声安装啊,仅支持 mac os 和 linux 系统,相对呢比较容易呃,这样一条指令就可以了。 但是呢, mac 啊,记得要先装 git 啊,都是高手,不多说了啊。所以呢,我们就直接用 windows 来演示 mac 呢,直接从 set up 这一步看是一样的,零基础零踩坑,手把手交换部署,一步不露。 windows 上啊,必须要用 wsl 的 子系统,意思啊,就是让你在 windows 系统多一个 linux 的 子系统。我们首先用 porsche 来执行这样一行指令, 那如果这一步提示报错呢?大概率是你电脑里的虚拟设置没开英特尔平台呢,虚拟设置一般是叫这个,然后 amd 平台的话呢,它里面的指令是这个, 打开虚拟化以后啊,再回 windows 继续安装就可以了。大家手里的虚拟化具体要怎么设置啊,可以咨询一下豆包,我就不浪费时间解释名词了。第二步,进入阿布图,这是 linux 的 系统环境,不用管它叫什么啊。呃,我们同样在 power 里面输入这样的指令, 第一次进入啊,它会让你创建用户名和密码。呃,这里给大家说明一下,它并不是说替代了 windows 系统啊,只是跑在 windows 里面的。 linux 的 环境也不会是双系统,就当成是一个应用就可以了,大家放心用。第三步,处理网络环境问题。呃,这是 windows 用户最容易卡住的地方, windows 本地的网络配置啊,当你正在使用魔法的时候, wsl 是 无法直接附用的,因为两者的网络环境呢,是相互独立的, 这时候呢,我们就可以输入这行指令来适配网络地址,如果输出你的网络地址是这个,那就执行网络配置,把你的网络地址替换到代码块中央就可以了。 第四步是安装依赖啊,赫曼斯安装前有一些必备的依赖啊,这也是推荐大家手动安装齐全,稳定性的话会高一点,可以直接输入以下这个指令完成安装。我这边呢是提前装过了,就不演示了,大家可以自取参考。 第五步啊,完成上面的步骤以后呢,就可以正式安装包我们直接输入这行指令 啊,如果过程中出现传输失败,报错中断,通常呢是由于你的网络不稳定导致的啊,别紧张,这个时候呢,我们按 ctrl 加 c, 中断当前的任务,执行这两行优化命令,切换一下网络,再重新用上面的指令继续安装即可。 第六步,创建虚拟环境并安装 home, 我 们直接输这个指令。 好,这里如果你们下载速度很慢的话,可以切换国内镜像员来提速啊,用这个指令就可以了。然后呢,我们重新安装命令即可。第七步,启动 hermes, 我们用这两个启动代码 ok, 那 到这个界面呢,就恭喜你配置成功了, purpose setup 会让你配置模型、服务商和接口凭证,比如说 mini, max, open two, norse 等,选择自己常用的就可以。 注意啊,在这里输入凭证时啊,界面呢是不会显示字体的啊,直接粘贴回车就可以了,后续的步骤啊,全部默认按回车,一键完成配置。好,现在我们来和他对话一次看看,收到回复就说明你的 hermes 已经成功部署上线了。 最后总结一下, windows 安装 hermes agent 真正的流程不是一行命令结束,而是先开虚拟化,再装 wsl, 再装 unboot, 再配置网络,再准备依赖。最后才是安装 hermes。 装 hermes 啊,前半场都是在调试系统环境和网络,后半场呢,才是部署工具本身。好,接下来让我们看一下 hermes agent 的 三个实用小技巧。

termus 怎么样来进行安装和使用? termus agent 跟早期的 open class 是 一样的,主要是在 mac 和 linux 系统上来进行操作,如果是 windows, 你 需要先安装 linux 内部的虚拟机才能够来进行运行。打开命令行,直接输入这个 c u r l 来进行一个安装就可以了。它内部呢,其实有一个这 install 点 s h 这样的脚本,我们其实重要的是直接运行它的脚本,当然上面这两行是一行命令,我们之前经常有同学问到, 我们这换行了之后是不是两行命令,不是,是一行命令,一行命令它要复制进来来进行运行一行命令它的这个目标呢就是去找到 install 点 s h, 直接呢一步到位来进行安装, 安装过程当中差不多就长这样,会有巨大的这个横幅。现在呢,我们进入到 rumors agent install 了,整个安装过程其实非常简单哈,你会看到它会不断不断的蹦各式各样的这个提示当前这样的系统,找到对应的这个包来进行安装,检测当前这样的环境有没有 get, 有 没有 node js, 因为它还有就会去查看有, 有没有一些多模态的一些这库等等等,稍等一下他就会完成这个安装。这个过程当中他呢会全自动的安装很多很多的脚本,他会一行一行来跟你进行运行,这个是你不需要做任何事情来等着就行了。 那么一起玩了之后再来你就可以直接 hermes 啊杠 version 看一下你现在安装了这个版本,当然它现在更新的很快。安装完了之后,首先这里有一个小的非常实用的命令叫这个 hermes doctor the doctor 呢,大家用过 openclaw 或者用过 cloud code, 应该非常熟悉对不对?哪儿哪儿都有这个 doctor, 它是来进行当前的它内部项目的这样的个复查的这样的工作才会去看 什么这个 python environment, 什么依赖库啊,什么这个配置什么的东西有没有都做好对不对?这个 provider 有 没有提供等等,它会进行一轮内置的内部的这样的检测。当然如果你后面加两个横杠 fix, 它还能够自己来进行一些修复,这个也都是没有问题的。接下来我们就需要来进行模型的这个配置, 由于我们说对于当前的这个 hermes agent 来说啊,它实际上还是一个相对来说比较专业的一个 agent, 所有的工作都需要在命令行里面来进行完成,所以你要去 配置底层这样的这个模型,那么你就需要使用这 config 这样的命令来进行一个这个模型的配置。当然这里面配置什么模型其实都可以好,只不过我们这里配置的是这个 deepsafe, 那 如果是配置 deepsafe, 需要 set or 点 default, 它实际上是一个 config 文件里面的一个配置选项,把它配置成的 deepsafe 杠 chat 模型提供商配置为 deepsafe 官方就可以了。那么接下来同时你还需要在你的 herms 里边的这个文件里边给它写入你当前的 deepsafe 的 api key, 差不多就这么三行来进行配置就可以了。 当然关于 hermes agent, 它内部其实有非常详细的配置文档的说明,大家不同的这个模型呢,就需要输入不同的模型的名字,不同的 provider, 需要输入不同的 api key 就 可以了。 当然我们之后还会说怎么样去进行一个模型内部的这个切换都是可以的,它是支持不同任务去匹配不同模型来进行运行的。设置完了之后,接下来你在命令行里就能看到现在都已经完成配置了。好了, 完成配置之后,接下来你就可以来进行这个运行了,对不对?那么怎么样来进行运行?对于 hermes 来说,它实际上默认的一种调用的方式就是使用这个 chat 杠 q 来进行一个任务的运行。 所谓的杠 q 就 指的是我现在给他发布一个任务,让他全自动的来进行运行,甭管现在你运行多少步,总之它就是全自动的来进行运行。运行完了之后呢,给你一个结论,中间你是不可来进行干预,同时也是不可 交互的这样的过程。但如果你不是杠 q 直接输入了 hermes chat, 就 可以进入到这个对话这个页面,就像这 cloud code 一 样,或者像 opencloud 的 这个 t y 这样的对话模式一样,就可以在命令行里面进行对话了,这种都是可以的,那比如说我们现在给它发布了一个任务,就会有个巨大的标志性的 hermes agent, 哈哈,在这个启动的发面对不对?下面的什么什么东西, 大家可以看一下一连串的这个启动,它启动的时候还附带诊断了一下对不对。运行过程当中,其实它的命令行交互的效果还不错,哈哈哈,怎么说至少比 opencloud 的 这个命令行交互的效果要好很多, 比如说现在我们就开始问他,分析一下按照当前的环境装什么语言,包括一起一般还剩多少空间。我们之所以问这样的一个问题啊,实际上是需要去测试一下当前这个 a 档,他有没有一些基本的工具可以去操作你当前的这个计算机,很简单的一个小测试,看看他能不能顺利的调用当前的这样的工具。 紧接着他就开始来运行了,每一个回复是他运行的一个步骤,下面有对应的他现在是使用什么样的工具,执行了什么样的这个操作。 里面 preparing 代表含义,它现在是准备使用什么样的工具来进行运行。下面 e x e c 代表的是 execution, 那 指的是我现在带入什么样参数去运行当前这样的工具,那下面就会有完整的分析报告出来了。这个呢就是一次运行之后的回复,运行完了之后,下面它还会跟你说,如果你想 继续这样的一个这个 session, 你 可以通过 resume 这样的方式直接进入当前对话,继续来进行对话。下面还有各式各样的信息,那么到这儿 commerce agent 的 一个入门级的安装部署就全部结束了。

直接跟你说最真实最扎心但唯一正确的结论,你现在这套组合等于根本跑不起来。本地文件读写模型,大象模型 elephant alpha 客户端, hermes 零点九环境 ufo 二 wslr 他 现在的回复已经说得很明白了,配置写了也没用,模型不支持 hermes 的 工具调用,永远读不了本地文件。为什么小龙虾能用 hermes? 不 能?因为 orphan 小龙虾是自己封装了一套工具调用,哪怕模型不支持,它也能强行本地执行。 hermes 是 纯靠模型原声 function calling, 模型不支持,直接废。 而你用的大象模型,刚好就不支持 hermes 格式的工具调用。所以小龙虾加大象能读写 d 盘, hermes 加大象永远读不了。你现在只有两条路,方案一,最简单,马上能用,回到小龙虾,继续用大象模型 读写 d 盘,自动生成文件,改小程序,全都正常。方案二,想应用 hermes 必须换模型,只能用这些款系列,通用千问 deepseek lma 三,三点一 g l m 系列, 这些才支持 hermes 的 工具调用,才能真正读写本地。最终一句话, hermes 加大象模型等于只能聊天,不能碰本地文件。不是你配置错了,是它俩天生不兼容。 你要是愿意,我可以直接给你一套 hermes 家能读写本地的免费模型配置,换上就能用。

大家好,我是麦东,今天给大家分享一个超级实用的 ai 办公小技巧,让 amazon 智能联动你电脑上日常使用的浏览器。不管你是 macos 安装还是 windows 搭配 wsl 使用, 都能简单几步快速配置完成。下面我们一起来看一下详细的配置操作步骤。首先我们来看一下 macos 用户的设置方法,整体流程非常简单,第一步,打开电脑终端,复制下方配置指令,粘贴到终端窗口内,按下回车执行运行, 系统会自动启动专属调试浏览窗口,同时我们在启动指令中添加了独立目录配置参数,会以独立配置环境启动浏览工具,完全不会影响你日常正常上网使用。调试浏览窗口弹出,第一步就完成了,接下来打开 ems 工具,继续完成关联配置, 重新开启一个新的终端窗口,输入启动指令,进入智能对话界面。 接下来在 arms 内输入对应的关联指令,完成设备连接。 大家可以看到工具提示已经成功和本地浏览工具打通联动。下面我们简单实测一下,验证整体配置是否生效。我们直接让它打开百度首页,查询一下南京当日天气,查看一下智能联动的效果。 可以看到浏览器窗口自动跳转百度界面,自动完成关键词解锁查询,同时 emos 会自动整理读取结果,全程流程流畅,就像手动操作一样自然。以上就是 macos 系统的完整配置演示, 接下来我们讲解 windows 设备搭配 wsl 环境的设置方法。如何让 wsl 里面的 emos 适配本地电脑的浏览工具?我们切换到 windows 界面 win 四端,第一步,操作一致,我们需要打开系统啪啪响,开启浏览工具专属调试模式。这里有个小细节,需要提前确认自己电脑浏览器的安装路径。右击点击浏览器图标,选择属性选项,在弹出的属性面板中找到快捷方式栏目,下方会显示目标位置一栏,这个就是软件的本地安装目录, 把这段路径完整复制粘贴过来即可。这一步大家一定要留意,每台电脑的软件安装、存放位置都各不相同,除此之外还有一点需要注意,同样搭配独立文件夹,运行浏览器的专属调试模式。接下来复制准备好的运行指令,打开电脑啪啪笑, 右键粘贴复制好的指令,按下回车直行启动,可以看到专属浏览窗口已经成功打开。接下来进行第二步,配置 wsl 镜像网络, 该配置只需要设置一次,永久生效。我们需要进入 windows 用户的根目录,找到点 wsl config 配置文件, 将设备内容填写添加进去,如果你的电脑没有该文件,直接动手新建文件即可。下面跟着镜头一步步操作, 打开电脑文件资源管理器,点击进入此电脑,选择 c 盘目录,打开用户文件夹,选中当前电脑用户目录。进入目录后先完成一个设置,点击上方查看选项,点开显示栏目,勾选显示隐藏的项目,不然无法查看系统隐藏配置文件。设置完成后,我们先来查找一下, 可以看到在当前目录下没有对应的备注文件,那我们就在当前位置手动新建鼠标右键选择新建文本文档,复制文件名称,对新建文档进行重命名修改,确保文件名称完全一致, 再复制提前准备好的配置内容。右键点击新建的配置文件,选择用记事本的方式打开,将配置内容粘贴到文档内,保存文档即可完成编辑。配置完成后,我们需要重启一下 wsl 服务,复制对应的重启指令,打开包包键, 粘贴指令内容,按下回车即可。服务程序完毕。接下来我们进入 wsr 环境,启动 ems 工具,尝试关联本地 windows 浏览器, 输入 wsr 启动指令,进入无奔图系统环境,输入 ems 启动指令,进入智能对话界面,接着复制本地浏览器的关联指令,粘贴至输入光,按下回车确认, 可以看到联通绑定成功。最后,同样发起简单需求,让工具打开百度首页,快速查询南京实时天气情况, 可以看到运行效果同样流畅稳定,完美覆盖 mac 端的全部功能体验。所以无论你使用哪种部署方式,这套 ai 智能联动浏览工具的配置方案都可以通用, 或许你都可以直接通过和 emulus 自然对话,快速完成资料查询、内容演示,大幅提升了日常电脑使用效率。工具会变,但方法更重要,我是麦冬,下条继续!

hermes 的 自我反思进化学习能力能不能移植到龙虾, open club 或者是其他智能体上呢?如果你已经习惯了龙虾,但是又想用 hermes 的 自我反思进化学习能力,那么这个视频值得你收藏。 我们今天学习 hermes 的 思路,让任何智能体都轻松具备自我反思进化学习的能力啊。那 hermes 是 如何反思的呢? 简单来说啊,就是经过观察、执行、反思、沉淀、复用的闭环学习系统,自动分析哪些错误是经常犯的,哪些规则还不够完善,哪些功能老是重复,可以提炼封装成 skill, 对 吧?那我们可以很容易的把这个核心思想移植到其他的智能体工具里啊。 我以 tree 为例,我们先打开点 tree 目录, roots 下的 project roots 点 md 这个文件,如果没有这个文件的话,可以手动创建一个。我们先增加一条指令规则, 当用户输入以斜杠开头时,你需要检查是否命中 command 点 md 中的命令,如果命中必须执行, 我们创建一个 command 点 md 来添加指令啊。当用户输入了斜杠, finish 表示用户确认完成了当前的任务,你需要根据 finish 点 md 的 文档执行任务。 然后我们创建 finish 点 md 这个文档,在文档中规定,请判断当前的任务是否完成,如果完成,请标记为已完成,并把完成的过程持久化总结在 memory 的 文件夹下,并且以日期格式归等。 当然,我还写了很多其他规则,那是其他用途就不多说了。那这个规则的主要目的呢?就是保存每次对话的记录,方便 ai 以后进行总结反思。 当然,除了这个 finish 指令以外,我还添加了室外的指令啊,如果用户输入了斜杠 f 指令,需要让 ai 持久化存储这次任务的上下文,说明任务的情况,尝试过哪些方式,有没有进一步的思路,方便以后继续处理,并且需要更新反思文档,如果反思文档不存在,需要创建一个, 然后总结一下哪些地方是将来需要避免的。那绕了这么多弯啊,创建了这么多的文件,为什么不直接在 project roots 里把所有的规则都列出来呢?这不多此一举吗? 这里是有讲究的啊。首先啊,官方建议这个文件是不要超过一千个字符。另外呢,如果把所有的规则都放在这里,这个规则文件会非常大,每次和 ai 对 话的时候都会全量加载,很占用上下文资源。 那我们按照渐进式譬如的思想, project rules 里只做简要的说明,具体需要执行的时候呢,再让 ai 去查找更详细的文档,这样可以非常有效地减少上下文,避免上下文爆炸。 好,那规则设置完了啊,那我们每次对话都养成一个好的习惯,就是在完成任务以后啊,输入一个斜杠 finish, 如果任务反反复复的没有完成,那就输入一个斜杠 fail, 然后啊,就不要在这个对话中继续了,那这样的话, ai 就 会持续的进行反思。那我们看一下这个反思文档啊,这是 ai 总结了很多问题啊,我们挑几个看看。 比如 ai 总结了一些可以避免的问题,规则不够具体啊,导致智能体绕过,缺少违规场景,举例,规则预期不够强烈?好家伙,这还怪上我了,还总结了一些好的地方,这就不看了啊。 然后还有需要改进的地方,比如性能优化啊,方法重构啊,路径判断封装啊,配置化等等等等啊, 那现在有了总结文档,我们就可以让 ai 进行自我反思了,避免下次继续犯错,对吧?那我们可以在每十轮左右的时候啊,让 ai 反思一次。 熊爷说啊,请根据历史反思的文档,分析是否需要更新当前项目的文档,是否有经常犯的错误,需要总结成规则,避免下次再犯错。有哪些可以提炼成 skill, 用于下次复用? 反思分析完成后,把当前的反思文档归档为已反思,避免下次重复分析并清空当前文档。 当然啊,这么多字儿,其实我们也可以做成一个命令,对吧?只要输入斜杠反思,就让它自动做上面的动作也是可以的。那我们看一下执行结果啊,它先是增加了五大规则类别,一会儿具体看一下,我们继续看。它还分析出了什么提炼成 skill 的, 评估 本次反思中的问题,不需要提炼成 skill。 那 有必要的时候啊,它是会创建 skill 的 啊。那我们具体看一下规则文档,看看它改了些什么。增加了代码修改的规范,增加了规则制定规范。 规则必须具体说明,不仅要说明不能做什么,还要明确应该怎么做,包括替代方案。然后啊,还需要举例典型违规场景。 然后啊,需要强烈措辞。这也是前面反思的啊,说规则预期不够强烈,对吧?这些反思还是非常有效的是吧? 当然啊,很多智能体是可以设置定时任务的,其实你也不用手动执行,可以定时让他每天自动反思。 那这个思路啊,是可以应用在所有的智能体上的,你可以收藏起来,赶紧试试看。那好,希望这个视频对你能有所帮助。如果你觉得有用,希望你能点赞关注收藏。我是斐哥,咱们下期见。

大家好,我是轩哥,只聊能用的 ai 技术,不聊虚的概念。今天给大家看一个我刚开发完的 skill, 发票行程单自动整理助手,用的是 mateu, 作为本地的 ocr 识别,数据不出镜,支持从邮箱自动搜索电子发票,下载附件,智能匹配发票和行程单,最后生成带截图的 excel, 还能一键上传腾讯文档,全程自动化,报销的事就再也不用愁了,给你看看从零到一这个 free 的 开发全过程。 nice, 先说说痛点,报销这个事相信大家都懂,一堆发票要手动下载, pdf 要一个一个打开,行程单和发票要对应起来,还要贴图粘到 excel 里,一个月报销三十张发票的话,大半天就没了啊。所以我做了一个电子发票整理的助手, 本地 ocr 用 mateu 作为引擎,所有数据在本地跑,安全邮件集成,可以自动搜索邮箱里的发票,下载附件, zip 也能自动解压缩。然后是智能匹配,是通过金额把发票和行程单自动对应起来,格式化的输出 excel 里面直接把发票的截图嵌进去, 不和的话一目了然。还可以一键上传腾讯文档,方便写作,目标很明确,从收票到入账,全程自动化。 nice, 看看整体架构,这次是五个模块, email、 feature, 从邮箱里搜索发票,下载附件。第二个是 invoice password, 用 minor u 在 本地解析 pdf 和图片。第三个是智能匹配,通过金额和行程单 进行配对。第四个是 excel generator, 输出 excel, 把截图也放到 excel 的 表格里面。第四部分是集成腾讯文档,一键上传到腾讯文档,支持的类型有电子发票、行程单、高速票、纸质 拍照,这是执行的结果,它最后会保存到一个 excel 文档中。第一步数据输入,你可以用本地文件,也可以让它自己去邮箱里面接收邮件。我封装了一个 email feature 的 类,去 定义了发票的关键字类型,这个是主要的函数,这个是解锁收件箱,下载附件,解压缩 zip 文件, zip 附件会自动解压,直取里面的 pdf 和图片。第二步是核心解析, 用 manu 本地 ocr 支持 pdf 和图片。我定义了一个 invoice recorder 数据类,这里面的数据资产都有金额。提取的优先级是先找价税合计,然后再找通用金额,最后是找以原结尾的 日期,支持多种格式,中文也能识别。本地 ocr 的 好处就是数据完全在你自己的手里。这个是提取价税合计的 类,这个是提取时间的发票号码。解析表格,这个是解析行程单的,这个是将 pdf 转换为整页图片。第三步是智能匹配发票和行程单,怎么配对?主要是看金额,通过金额去匹配发票和行程单。最后是 excel 的 生成,这是 excel 的 头部,然后蓝色 表头,然后插入截图,自适应列宽。这是最后一步生成的 excel, 可以 上传到腾讯文档 later。 最后看一下这个生成的 excel, 然后把金额都提取出来了,有截图, nice! 有 了这个技能,以前需要好几个小时,整理了发票的时间,一下就压缩到了五分钟,这才是 ai 真正的价值,把你从那些机械的重复的事情里释放出来,做你需要 有创造力,需要思考的事情。回顾一下这个 skill, 我 不是从零开始写的 ocr 引擎,是把 myru, 邮箱工具还有腾讯文档, excel 这些能力 串起来,解决自己遇到的问题。我只是把这些工具组合起来,让它串成一个工作流。这个发票整理的 skill 的 文档还有代码,我到时候会整理出来, 你也可以想想有有什么重复劳动需要自动化的评论区告诉我。关注加收藏,下一期我们继续做更有意思的 skill, 今天就这样了。

最近 ermis agent 很 火,火到已经有人开始卖袋装服务了。但普通人真正需要搞清楚的不是他有多火,而是他到底和 openclaw 差在哪儿, 以及你到底有没有必要再装一个 agent, 还是只是在追一个新的热词。所以今天这期我不吹概念,直接把它拆成一个新手也能照着走的完整安装指南。我们就只讲三件事,它是什么,它和 open cut 的 区别,以及怎样用 ws 二二最稳的把它装起来。 hermes agent 本质上不是一个聊天 app, 而是一个常驻运行、会自己积累经验的 agent。 它最特别的点不是会调工具,而是会在执行任务后沉淀技能,把成功过的方法总结成可附用的工作流。所以你可以把它理解成一个带学习循环的个人智能体,而不只是一个能回消息的 ai 机器人。 如果你已经用过 open call, 那 最直观的区别不是功能菜单,而是学习方式。 open call 更像消息中加个人工作台, hermes 则更强调把经验沉淀成技能,让他以后越来越像你的做事助手。 说白了, openclaw 解决的是连接和调用, hermes 更往前走一步开始解决。记住和成长, 不是每个人都需要再装一个 hermes, 关键看你想解决的是连接问题还是长期复用问题。如果你只是想把消息工具和模型接起来,现有 openclaw 够用。但如果你想要技能沉淀、迁移和长期自动化, hermes 才真正有意义。 所以别把它当成必须换代,而是把它当成一个更偏长期复利的 a 振的选项。如果你是 windows 新手,最稳的路线不是折腾原生环境,而是先把 ws 二跑通。 先在管理员 power shell 里执行 wsl install, 进到 linux 环境后再跑官方安装脚本,这样依赖和命令链路最稳定。对新手来说,安装主线就记住两个阶段,先把 wsl 二装好,再在 linux 里装 hermes, 别一上来就被环境问题绕晕。 装完 hermes 之后,别急着先折腾花活,先把模型迁移和诊断这三件事走通。 你可以先跑 hermes setup 走向导,再用 hermes cloud migrate 导入 opencloud 的 关键配置,最后再用 hermes doctor 做一次诊断。把这几步走通,你就不只是装好了,而是真正能用起来了。 hermes 真正有价值的,不是让你多一个聊天窗口,而是让重复工作开始自动积累方法。像每日简报、网站监控、自动研究、长期知识整理这类本来就需要反复执行的活,正适合教给它慢慢学会。 所以你装它不是为了今天多省一分钟,而是为了把以后反复做的事,交给一个越用越顺手的 agent 去接管。 hermes agent 不是 人人都必须装,但如果你已经开始认真搭自己的 agent 工作流,它确实值得研究。 尤其是已经用过 openclaw 的 人,更应该把它当成一次判断题,看看你要的是消息中书,还是一个会持续沉淀技能的系统。而对新手来说,别怕,先按 wsl 这条最稳的路线装起来,真正跑通一次,你自然就知道它值不值。

是不用养虾了,直接养马吧。这个爱马仕真的是太强了,搞了四台 max 六的做本地大模型的部署嘛,四个机器人,四个 a 剑客,四个本地大模型,后期我会搞这个五零九零去做这个本地大模型,这些本地大模型本身算力是有限的啊,所以说他对于 a 剑客的平台 最关重要。在这个 open kala 下面,比如说我问他的知识库有啥,我这个本地模型就在疯狂的运转,但是也可以看到他这个思考的过程是非常的慢的。 因为什么?因为这个 open color 太重了,它的上下文吞吐默认情况下就有两万到三万左右,加上我装的各种企业管理的 skill, 它就变得更加的慢。我运营短视频呐,因为我是个做短视频的公司嘛,可以看到它的一个表格,我的知识库非常的全, 它输出的格式虽然说比这个爱马仕看得更牛逼,它架不住啊,我有这么多 a 型的同时,开始工作的时候,它的这个性能就会非常的差,而且经常去锻炼, 所以说我这段时间用这个纤维,三点五 a 三 b 刚好跑在这个六十四 gb 现存的这个甜点位,他基本上跑企业的绝大多数运营效果明显是这个爱马仕比他更强。看一下我真实的这个指示库,特别多的东西, 然后这么多东西我用爱马仕去找,平均它的速度比这个 open 科洛要快一半左右,可以看到这个信息,它的整理速度 是非常的快的,虽然说现在看着没有什么外观界面哪一个终端在跑,但是他可以直接对接微信呐,企业微信呐、背书啊,各种平台,所以说用起来丝滑度跟 oppo kod 没有任何影响,他可以支持无限记忆。 就是 oppo kod 经常我们在用的时候就忘事,今天你跟他说这个,明天他又忘了。比如说你现在帮我把这个合同改了之后,但第二天他不知道你改了这个合同,那这个操作空间,我觉得这个 a 镜头就非常的不好用。但是你用了爱马仕之后,你只要今天跟他对接完,比如说我现在按这个键把它退出他的聊天, 发现没退出聊天的瞬间,其实刚刚他他操作了,他把现在目前我们聊天的这个所有东西直接下到数据库存到我本地了。那就说下次我问这个合同,他可以直接找到,然后对比现在的这个差异化, 如果有差异化他会告诉我没有差异化他直接给你出结果。所以说这就是现在 a 镜头的一个集合,我觉得这个东西一定以后比这个 oppo 壳会更火,现在他的绝大部分我已经转移过来了,用起来非常的方便。

操作过一段时间之后,你会发现他比刚装好内嵌的速度快出一半,因为他每干完一件复杂的活,都会给自己写一份新技能,留着怎么做到的。 你让他干一件没干过的活,比如完整的项目安全审计,他会一步步摸索着干完,然后回头问你一句,这是我刚学会了要不要存下来当一项技能,你点确认,他自动把这次的经验写成一份 excel 文档,下次再做同类任务,原本六分钟的活,五分钟就能收工, 这期就把这事完整跑给你看,丢一个安全审计任务给哈密斯,看他第一次怎么从零啃下来,怎么主动提存技能,第二次再跑的时候,工具调用怎么变少,时间怎么压下去。更狠的是,技能不光从零写,哈密斯内部还有一个叫 gpa 的 净化引擎,每跑一次活就回头改一刀,旧技能也越用越顺。 所以这一期看完,你就明白用过 hermes 的 人为什么越用越顺手,你不是在用一个工具,是在养一个会自己长本事的徒弟。关于他的这个 skill 自主进化,这个其实是整个 hermes 啊最精彩的啊一部分,我们来看一下啊,他是如何去做的。 首先哈我们啊这里面啊,有一段是带大家去回顾到底什么是大模型的这个 skills 啊,当然大模型的这个 skills 的 本质呢,实际上就是一个提示增强这样的这个技术啊,他呢,其实也属于 这个 harness engineering 里面的一个所谓渐进式,譬如的啊,这样的一个这个原则下的一个,你可以把它理解成啊,是符合这条原则的一个这个技术的一个产物, 那么所谓这个 skills 啊,它那些最简单的这个情况下啊,可能就是一个 markdown 这个文档,对不对啊?教你呃,在什么情况下应该怎么去做这样的这个事情啊?可能就是一段提示,那么这个提示呢,会在当前这个 agent 正好去做这个事情的时候呢?哎,给他加载进来啊,差不多就这样的一个这个过程啊,这个呢是所谓的这个 skill, 当然这个所谓的这个 skill 啊,它呢?其实,呃,总的来说啊,现在的这个 agent 的 这个 skill, 其实这个技术系统会比较复杂啊,这个严格来说我们这个 skill 呢,实际上应该算是整个啊,有通用智能体的这个数字资产包啊,对不对?除了有 mac 文档之外,它等可能还会有这个 scripts 啊,还会有这个 references 啊,等等等等一些拓展的一些这个设置啊,这呢我们就,呃不展开讲啊,因为今天我们不是核心来讲这个 skill 啊,但总之呢,大家需要知道的是 这个 skill 哈,它的本质呢,实际上是啊,会严格的去按照啊这个 function calling 这样的一个这个流程,然后呢实时的啊,来去加载到某一些 agent 在 执行具体任务的这个时候的上下文里边儿去啊,就比如说假设哈,假设啊,我现在需要查询天气,那我正好有一个 skill 就是教当前 agent 如何查询天气的啊,那这个时候呢,当用户问到要查询天气的话,诶,那现在大模型哈,他就会去解锁一下啊,看看我现在总共有多少个这个 skill 啊,然后呢会去看每一个 skill 的 这个 description, 然后找到了,诶,这个这个 skill 啊,能够帮我查询天气啊,那么他就会读取你当前这个 skill 的 这个 markdown 这个文档, 然后这个 bug 文档就专门教你这个 agent 啊,怎么查询天气的,那这个过程当中,如果啊会涉及到一些脚本的运行啊,那他就跟你说,哎,你看我们这个 skill 文件夹里面有专门查询天气这个脚本, 你想查什么天气?哎,你把这个名,你把地名带到这个这个脚本里面来进行运行一下就能够查到,那这个时候呢,这个脚本就当前这个 skill 里面的一个 description 啊, sorry, 一个 script 啊,这个文件夹里面的一个脚本,你可以这么来进行理解。 而如果我们说现在啊,这个 skill 非常非常长啊,我一个 skill 包含了十几种不同类型的这样的这个情况啊,都可以用于给你更加细节的这样的指导,那这个时候呢,你可能就需要有一个 references 的 这个文件夹,里面保存着各个不同类型的你的 skill 的 一些 子规则都保存在这里边儿,哎,那这个时候呢,我们说你原始的这个 skill 的 markdown 这个文档相当于是一个总览,对不对啊?相当于是一个这个字典啊,然后呢大魔镜就会知道啊,原来 咱们要实现这个功能这么的这个复杂啊,然后呢就去看看,哎,我现在呢对应需要查哪一个条目,然后呢再到 references 里面去读对应的啊,他那样的一个这个文档,这个呢,就是能看出来啊,他是个渐进式的,譬如哈,对不对?哈这样的一个过程, 但这段啊,大家理解也可以,不理解问题也不大啊,总之呢,其实就是一个关于 skill 的 啊,一个入门的一个这个回复, 那么这个 skill 哈,其实对于现在的啊这个 agent 来说,它当然是一个非常重要的一项这个技能啊,或者说是一项非常非常核心的一个上下文增强的一个这个技术啊,因为它呢,实际上就是能够哎帮当前的 agent 在 很多场景下给它做得更好啊,有了指导跟没有指导啊,当然是不一样的啊,对不对? 好,那这里面我们就举一个很明显的一个,呃,就举一个这个小例子啊,大家去看一下 hermes 啊,它的这个 skill 这个体系,不仅仅是像 open code 呀,像 cloud code 呀,它的这个 skill 能够自己来进行加载,同时呢,它可以自己生成自己进化,什么意思啊?举个例子,比如说,哎,我们现在呢,让它做一个事情哈,对不对? 呃,我们下面呃会啊,让他去呃做一个这个,呃,做一个这个事情啊,这里面呢,我们让啊,他呢对当前这样的项目呢,做一次完整的安全审计, 那么这里啊,提出了一二三四五六七八九啊,提出了九项这样的一个要求,跟他说,哎,你必须得啊,这么这么这么去做啊,对不对啊?这个是对我们当前的 hermes 提出的这样的一个基本要求。 那么现在哈,对于 hermes 来说呢,它呢在一个原生的这个状态下,它肯定是没有一个专门用于去做什么项目的安全审计方面的这个 skill 啊,对不对?但是呢,它接到了用户的需求,它肯定就会按部就班的去做, 这里面我们提前做了一个这个统计哈,就看了一下它现在内置呢,总共呢是这个二十五个目录,也就总共呢是呃,有这个二十五个这个 skill 啊,这个呃 啊 sorry 啊,总共是七十七个,不好意思,上面写错了啊,总共是七十七个这个 skill 啊,但是你这里总共几个?不一定啊,因为我们这边的哈姆斯其实运行了很长时间,这里面你可以先运行一个统计哈,看一看你当前的这个哈姆斯的这个 skill 总共有多少啊?然后一会呢,你运行完了之后,你发现你这个 skill 就 会变多哈是什么样的这个情况? 好的,不管怎么样,我们现在呢没有啊,这个对应的这个死 q, 然后呢让他进行运行啊,这个时候他运行可费劲了啊,对不对?他呢就会一个一步一步一步哎,来进行运行,想想办法啊,我们这个怎么怎么来进行运行啊,因为这是个非常复杂的一个需求嘛,所以你会发现他运行的这个流程期非常非常长,对不对?一开始啊使用这个 terminal 啊,然后输入 find 的 这个命令啊,运行了一下啊,怎么得的什么什么? 然后又使用这个 terminal 啊这样的一个工具,然后呢啊使用着 graph 啊这样的命令啊,来进行一个匹配啊,然后又使用 terminal 命令啊,这个是使用 graph 然后呢使用的 read file 这样的工具, 然后呢啊来去怎么怎么样怎么怎么样啊,它呢?总之呢是有很多很多个步骤,这里面它总共哈差不多是运行了将近六分钟这样的个时间啊,这里你可以看下你自己的这个项目运行多长时间,但是我们是让它围绕当前的这个项目进行 一个安全审计方面的项目统计哈,这是个比较复杂这样的工作,你可以自己来看看啊,你大概运行了多长时间啊?总之呢,我们这边这个 deepsea 呢,是运行了六分钟啊,然后呢啊调用了很多各式各样的工具啊,大家可以进去看一下。 那么最后的运行完了之后呢?哎,他给了我们一个完整的一个安全总安全审计的啊,一个这个内容啊,包括安全优势啊,包括需要改进啊,包括这个什么修复建议啊,反正就是按照我们刚才的这一套的这个内容啊,来进行的这个提示。那么这上面的这些东西呢,其实 都不是很重要啊,是他最后给你返回这样这个结果最好,我们现在运行六分钟,然后呢下面啊,他会有一个非常精彩的一段话啊,叫做 skill, 什么什么什么什么 created, 哎,你会发现啊,当你在运行的时候,他是他他他在创建之前会给你有个提示哈,我会问你会要不要去创建这个 skill 啊,然后你要去回复确认,然后他就会给你返回一个叫 skill。 什么什么什么已经创建了 啊,你会发现原来他刚才执行这样的这个任务啊,他他呢其实是会自己去考虑哎,这个任务呢,现在我在现场,我现在是不是要创建对应的这个 skill, 哈哈,对不对?那么对应的这个 skill 呢?他呢,实际上是会啊,呃,这个,呃,邀请你啊,来进行这个开启的,换言之就是 他会给你一个这个提示啊,问你,哎,我们现在是不是要创建这样的这个 skill 啊?然后呢,如果你跟他回复,是啊,那么接下来呢,他就会自动的啊,去创建好这样的这个 skill, 那 么这个 skill 创建的过程是全自动的哈,当然你的这个 skill 的 名字可能跟我的 skill 名字不会不太一样,那么由于当前这个 humus agent 它的这个, 呃本身的代码主要是以 python 为主,所以呢,它这里显示的这样的这个运行啊,是怎么样的一个这个情况, ok, 好 啊,那么这个呢,实际上啊,当然,当然他背后其实有一个非常复杂的一个创建 skill 的 这个触发机制哈,比如说他现在这个工作任务比较复杂,运行了五次以上的工具调用,然后同时呢又遇到了报错, 然后同或者是有用户的这个纠正啊,或者是他发现了啊,这工作流呢,这个非常复杂呢,这个时候他他就会主动的提出,哎,我现在是不是要创建一个这个 skill 啊?你呢,可以选择创建也可以不创建啊,只不过我们这里给大家演示一下,接下来我们是可以进行创建的。 好,这些,现在如果你选择让它进行创建的话,那么紧接着接下来如果你再去看你当前的这个 skill 这个目录的话,那么你会发现,哎,刚才的这样的一个啊,我要 python 的 这个项目代码来进行安全审计的这个 skill 呢,就已经创建好了啊,这个呢是它全自动的来创建的一个这个 skill, 那 它全自动创建这个 skill 是 什么呢啊?大家如果懂这个 skill 的 这个编辑方法的话,你可以点进去啊,看一下当前的这个 skill 这样的内容。总之呢这个 skill 啊,它呢是把 刚才用户的这个需求或者他执行的这样的链路是来进行一个规范的一个这个梳理和保存。然后呢接下来这个就相当于是一个他自己提醒自己未来遇到这样的一个问题的一个规范的一个操作文档。 那么有了这个文档之后,那么紧接着我们说他在进行运行的时候,身上就会效率高很多啊,当然下面有一些关于当前这个 skill 编辑这样的原则呀,什么什么的啊,大家回头这个这个可以自己去看一下, 总之呢就是他有了 skill 之后,那么接下来我们说如果你再围绕类似这样的项目啊来进行执行的话,你不管啊是对当前的这个项目,还是对别的这个 python 项目来进行执行的话,那么你会发现啊,他呢其实就会自动的去加载当前这样的这个 skill 啊,然后呢非常高效,非常快速的去完成当前这样的这个任务, 那么第二次我们进运行的时候哈,呃,基本上他的这个运行的这个时间啊,大家可以去呃看一下啊,他的运行时间呢,就减少了很多啊,差不多就压缩到了这个三百秒以内哈, 这个速度呢,其实快了很多啊,然后呢之前啊他通过什么暴力扫描这个方式,现在也是没有了啊,然后呢现在他表现出了各式各样的啊,更好的这样的这个性能等等等等啊,这个呢,实际上是有这个 skill 和没有这个 skill 之间的一个,这个之间的这样的一个对比,你能够发现哈,有了这个 skill 之后呢,他之前踩的很多坑啊,这次呢其实就不会再踩了啊, 看这个表可能看的更加清楚一些。然后同时呢有了这个 skill 之后啊,那么那么他呢之前啊可能没有发现的一些工具啊,可以更好解决当前这样的问题,哎,他现在也会 对不对啊,调用这样的工具啊,来去解决当前这样的这个问题,然后最后啊,他呢不仅仅啊是完成了这个报告,他还直接呢上手来进行了啊,相关的安全代码,这样的这个修复的工作等等等等, 这个呢也就说明,哎,它呢相当于是这个有了啊,这个 skill 之后啊,对不对啊?它的性能呢是提升了很多啊,这个呢其实是我们最开始使用它的这个 skill 能够发现啊,我它呢是存在这样的这个情况的,那么有了 skill 作为这样的这个酶剂哈,能发现它当然就是会越用越聪明的,对不对啊?这个其实毫无疑问, 那么同时呢,我们会发现它除了啊会从零到一去创建这个 skill 之后啊之外,其实它呢也是会不断地去积累当前的一些这个经验啊,积累到这个 skill 里面来,也就说伴随着我们不断地进行运行,它呢会根据每次运行的这个反馈,还会返回来去修改你当前这个 skill 啊,然后从而啊让你当前这个 skill 呢,可以说啊是运行的越来越快,越来越好。这里面我们可以看到啊,它在运行了几次之后呢,是额外新增了一些这个新增了一些这个区块啊,因为它可能会发现,我们现在总是 这个围绕着当前的这 hernes engineering 来进行一个这个审查啊, sorry, 总是围绕当前这个 hernes agent 来进行一个这个审查,所以呢,它接下来啊会固定很多这样的模式,就是固定围绕当前这个项目来进行审查, 自己呢会找规律,哈哈,然后这里面对不对啊,他接下来效率还会越来越快啊,这个大家可以多去来进行一些这个试验啊,总之呢,其实伴随着我们不断不断不断来进行运行啊,他的这个实际运行的这个时间啊,甚至可以压缩到百分之五十以下啊,这个呢其实是一个非常好的一个特性哈,啊,这个呢也是呃,这个 hermes agent 啊,他在实际进行运行的过程当中啊,给所有开发者提供的一个非常便捷的一个功能。 当然既然谈到它自主进化的这样的这个能力啊,那么除了刚才的这个 skill 之外啊,其实哈,对于整个 hems a 智能来说,它呢是提出了一个叫做 e g p a 的 一个进化引擎啊,那么这个 e g p a 这个进化引擎指的是什么东西? 它的全称是啊,这个哈哈哈,大家可以自己看一下啊,总之它是一种将遗传算法和多目标优化应用于提示提示词进化的一个这个框架,它的原论文的这个名字呢,就叫做这个 e g p a, 所以 它呢也叫 e g p a 啊,是这样的一个情况, 那么这个啊,这个所谓的啊,什么这个遗传算法什么的这个多目标优化应用啊,这个大家可以不用去考虑啊,总啊不用去理解太多啊,总之呢你需要知道的是 它呢实际上啊是会学习总结当前任务的这样的这个模式,然后呢去生成数据,然后呢来进行反思,然后呢来进行啊多目标选择和平衡,然后最后呢来进行一个这个合并,然后最后呢去修改当前的这个 skill 啊,就是这么样的这个情况,这个 过程啊其实非常非常复杂,不仅仅是我们实际上进行使用的时候,它呢会自主来进行一个这个啊,自主来进行一个 skill 的 生成,然后同时它也会生成一些这个评估的一些这个数据啊,然后呢 可以啊使用真实的历史对话记录,他也有的时候你有必要你也可以引导他去是合成一些这个数据,然后呢来去呃这个净化当前这个 skill 啊,这个呢也是可以的,也是没有什么问题的。而他最所谓这个遗传算法啊,就指的是他每次呢是会去考虑啊增加某一些这个维度,或者修改 固定的某一些这个方向,然后去测试一下他能不能够有性能这样的一些这个方向,然后去测试一下他能不能够有性能这样的提升,而不会全部来进行重写啊,什么样的这个情况? 当然啊他也是这个会啊,这个要求人工的来进行这个合并的啊,这个呢我们在实际使用过程当中,你也会发现啊,他呢会要求人工的来进行合并啊,然后最后呢来去完成你当前的这个 skill 的 啊,这样的这个优化等等等等, 当然好。对于 hermes agent 来说,我们现在看到这个,呃,看到这个 g e p a 好 像还是一个非常非常简单的一个这个模式,我们只是通过让他去反复的执行一些工作,能够看得出来他的这个 skill 是 不断的发生变化,但是实际上啊,对于整个的这个 hermes agent 来说,他呢, 呃,其实整个的 e g p a 不 仅仅是啊可以用于啊这个 skill 的 优化,还可以用于它其他的整个 a 智能系统里面其他的一些提示词的一些这个优化,甚至内置的一些 skill 的 这个提示词的优化,甚至它这 e g p a 的 e g p a 呢,还可以用于引导,如果你使用开源大模型的话,它还可以围绕开源大模型来进行强化学习的后续面, 哈哈,所以它这个 h p a 这个系统实际上是一个非常复杂的一个这个系统哈,我们这里只是讲了一个这个大概啊,只是跟大家说啊,它呢,哎,有这么样的一个这个成长的这样的一个机制啊,仅此而已啊。当然这个也是因为户外课时间有限啊,可能我们没有办法啊,更多的展开啊其他的这个内容来进行一个这个说明。 当然我们说到这啊,关于 e g p a 的 这部分内容哈,实际上是整个的哈,呃,整个的这个,呃, hummer's agent 最为复杂的一部分的这个内容啊,大家如果感兴趣的话啊,也可以去看看它的这个源码啊,也可以再看看课间里面的一些文字的这样的这个内容,也可以多去进行一些这个尝试啊,相信呢,你会有不一样的这个理解。 那么在本期观课的这个最后哈,我们这还有一些这个内容,可能是刚才用户啊,刚才咱们的同学会非常关注的一些问题啊,比如说什么这个模型怎么切换呢?对不对? 还有啊,比如说像这个他还哪有哪一些啊,前沿的一些这个特性,像这样的一些这个内容啊,我们这里面有一些这个文字的这个补充内容啊,大家回头可以自己去 看一下啊,自己去了解一下啊,但总之啊,我们说这四个项目运行完毕啊,我们大家对于当前的啊, hummus agent, 以及啊对于你的这个 harness engineering 啊,它背后的这样的一套技术理论体系哎,相当于是有一个入门级的这样的个理解了啊,对不对? 好,那么到这,哎,我们的公开课的内容呢,差不多也就全部结束了,好,接下来啊,我们就打一波广告,哈哈哈,也欢迎大家啊,报名,有我和木鱼老师啊,还有志杰老师,我们共同开设的 大模型 a 政策啊,智能体开发实战课这样的一门付费课程。那么我们今天啊来讨论的啊,关于 harness engineering 啊,相关的这样的一些这个内容啊,以及 business agent 啊,也是像也是 harness engineering 这样的一套技术体系啊,它的一个落地的这样的框架,那么这个内容啊,实际上是节选资,我们的二零二五啊,大号模型 agent 正在开发十三克这样的一门付费课程, 那么这本课程啊,是由我们三位老师共同来主讲的一个一百个小时以上的完整体系大课啊,然后呢,这本课程从今年的这个三月份啊开始新增 open club 开始啊,到我们今年四月份啊,新增 harness engineering 啊,以及像 harness agent 相关内容的讲解介绍啊,那么这本课程呢,到呃我们今年啊的 最新的啊春季班是已经是开设了二十三期了哈,那么这门课程呢,是帮的,是能够帮大家零基础入门,然后直达目前顶尖大厂的中高级岗位能力要求的一门一百个小时以上的完整体系大课。 那么这门课程啊,其实是可以完全零基础啊,来进行的一个这个学习,并且这门课程呢,是一个硬核的啊,这个大模型开发的技术教学的啊,这样的课程,那么这门课程啊,是 这个对标目前的大模型开发工程师啊,大模型的这个应用开发工程师这样的岗位能力要求啊,这么可能,如果完整学完,肯定是啊,这个拿下五十万年薪的大模型开发岗位啊,的这样的一个这个 offer 肯定是不在话下, 这本书总共呢啊是六个技术模块啊,首先第一个模块呢是关于大模型技术入门啊,在这里面我们会详细来介绍关于目前顶尖的啊,这些大模型的 api 的 接入啊,本地大模型的这样的部署啊,然后呢,智能体 a 智能开发的这样的入门啊,还有锐角增强技术的系统开发入门等等等等啊,这个呢,是一个 入门的啊,这样的一个阶段,然后同时紧接着第二个阶段,我们会进一步来介绍关于热门的 a 智能开发框架的上手实战。那么主要啊,是会包括一些 d 代码呀,还有 n 八 n 啊,以及 这个顶尖的 rack 的 框架啊,拉马 index 啊,这样的一个框架以及啊,对不对啊?新兴的一些 agent 开发框架, 像 agent sdk 啊,还有 agent school, 还有 adk 等等,当然也包括啊,工业级的 agent 呃,框架啊,像 long chain 啊,还有 long graph 等等等等啊,那么这些呢,是都是能够帮助我们啊,从零到一呢来完成 agent 的 开发的啊,一些非常核心这样的工具, 当然有了工具还不够啊,我们还需要去讨论一些,还需要跟大家详细介绍跟讲解一些工业级的 agent 的 开发的一些进阶的一些这个技术,对不对?就比如说啊,这个智能体的工具管理呀,包括智能体的这个 agent skills 的 这开发的管理呀,以及啊,像这个 agent reg 一些进阶的一些这个技术啊,包括啊,如何来进行这个剪辑的一些这个优化,多模态的这个实战, graph re 制图和剪辑优化啊,还有这个什么视频信息剪啊,图文和牌 pdf 剪辑啊等等等等啊,这样的一些啊, rek 的 这个进阶优化这样的这个内容。 当然啊,上面大家可以看,可以看到哈,我们其实每个模块里面都有非常非常多的一些实操的一些这个小案例哈,当然这个实操案例其实并不属于我们后面要谈到这个大型案例啊,总之呢,其实我们所有的课程啊,每个模块都有非常丰富的啊,实操的这样的内容。 那么再往下啊,还会来讲解关于智能关于智能体的,对吧?啊,长短期的这个记忆管理啊,这个其实就会涉及到,比如说我们现在讲的啊,一些 这个智能体的啊,记忆的优化啊,安全防护措施啊等等等等啊,当然也会来讲解啊,关于智能体上下文的一些优化的这样的这个策略啊, harness engineering 相关的这个内容,以及多智能体啊,系统开发相关的这样的内容啊,当然在我们课程里面还会介绍啊,关于大模型高效微调和强化学习微调啊,相关的一些 能够定制化啊,你开源大模型的啊,能力的相关的这样的内容。那么同时紧接着第四个模块,我们就会进来探讨关于工业级的 a 证的部署上线啊相关的这个内容了 啊,那么你 a 证的开发完了之后,对不对啊,肯定还是要考虑怎么样呢,来进行部署上线。这里面我们会既来介绍啊,关于智能体项目部署上线的这个基础的理论啊,同时也会来讲解啊,关于智能体开发部署的上线的全部的这样的流程。一会来介绍啊,关于两大容器化交付工具的这样的流程。一会来介绍啊,关于两大容器化交付工具的之后啊,长期的 追踪和运维如何来进行处理啊,当然我们会来介绍关于智能体的这个性能评估和如何来进行优化。那么同时我们现在啊,我们还这这门课程里面还包含十大项啊,这个工业级智能体的开发项目实战啊,包括像长文档啊,编辑 agent, 文档审核 agent 啊,图文视频多模态 agent, 语音交互 agent, 然后 deep research agent 啊,数据分析 agent 啊,数据分析可级化 agent, 然后呢,垂玉的精确 graph, 高精度的啊,机制图谱的解锁增强系统, 然后啊,像多摩泰的这个 rek 本地致富问答,还有 nintendo 啊,像这个 ppt 的 这个 agent 生成等等等等啊,这一期的 agent 啊,是我们会有,总共呢会有十个啊,工业级的项目实战,那么除了这十个项目之外呢,我们还有四大项啊,百万用户级别的智能体项目开发啊,这个呢,相当于是商业化的这个智能体, 包括啊,像多模态的这个 rec 智库检测问答,包括啊,全新一代的啊,智能客服 agent 的 项目开发啊,以及呢,包括啊,这个通用智能体的这个开发,以及啊,还有这个数据分析和 ai 呃编程的 agent 开发项目等等等等啊,总共呢是有这四大项的, 这个商业的商业级的啊,这个呃智能体的开发项目啊,总共呢是这么十四项啊,大型的 agent 项目开发 ok, 那 么所有这个项目呢啊,实际上是会覆盖目前我们说比较主流的,也是比较热门的这样的一系列的 agent 开发的 agent 应用,这样的主流方向啊,包括啊,对吧啊,这个整个的这个八大类三十家场景的 ai 落地解决方案啊,咱们课程里面都会有对应的落地实操性质的这样的这个内容。 然后同时呢啊,对我们课程来说啊,我们在今年的这个啊,今年的春季我们还新增了很多啊,关于 openclaw, harness engineering 相关的这样的一个技术内容啊,当然同时我们也新增了一个大型的项目啊,就是从零到一呢,带大家去搭建啊这个 harness engineering 啊,对不对啊?从 openclaw 啊 开始来进行个搭建啊,我们会从里呢来教大家如何呢去,呃从零到一来完成这样的一些 agent 开发啊,因为本身呢,咱们这门课程就是在讲解啊,关于现在的 agent 开发的核心这样的一个技术,那么当然对于大家刚刚啊所看到的这样的一个 harness engineering 啊,这样的一些这个内容,我们肯定呢也是会啊,来进行一个 啊详细的呃讲解和这个开啊详细的这个开发和实战啊这样的一些这个内容的。 当然我们是除了啊大家刚刚我们所看到的这个大冒险 a 正正的开发实战课程之外呢,还有两门课程啊,是呃也是啊,现在正在进行这个招生啊,我们正在进行授课,正在进行连带更新两门课程,一门课程呢是 open club 智能应用实战课啊,那么这门课程呢,是由我来主讲的一门体系课程, 但这门课程啊,其实和我们刚才所看到这个硬核的这个技术的这个课程啊,会有非常本质的一个区别啊,在这门课程它主要是在讲解 open club 如何进行使用啊,是覆盖基本上所有的 一些应用场景下啊,如何使用这通用智能体啊,用的更好啊,然后呢来完成各式各样啊,不同类型的一些自动化的啊,工作流的这样的这个搭建去提升啊,目前我们实际去啊,这个工作过程当中,各式各样的不同场景下的工作效率啊,这个呢,是 open club 啊,这样的一门可用的这样的一个 课程啊,这门课程是由我来主讲,那么除此之外,我们还有门课程,是啊,沐雨老师在进行主讲的 web coding 啊,这个编程实战课,当然 web coding 啊,这门课程就不用说了,对不对啊,现在基本上是所有的咱们这一个 啊编程的这个同学啊,都需要掌握这样的像这个技能,然后刚刚啊,咱们档案上还有同学在问到说,哎,我们公司团队内部的这样的 web coding 流程是什么样的啊,等等等等,那基本上就是像这个情况, 然后啊,这么课程啊,会有沐雨老师来主讲啊,会大家好好来讲解啊,关于 web coding 呢,如何从零到一呢,来进行一个这个上手跟使用,以及各个不同不同场景下有哪一些啊, web coding 这样的工具啊,是非常的这个适用,以及呢,像 cloud code 啊,还有这 codex 啊,这样的一些顶尖的 web coding 这样的工具, 它的一些具体的这个使用和进阶技巧,然后也会从零到一呢,带大家去完成啊,很多的一些 web coding 的 啊,一些这个项目的实战的这个开发,从零到一呢,帮大家啊定定完整的啊, web coding 这样的技能体系 啊,那么现在呢,大家啊,不管是对哪门课程感兴趣啊,我们现在总共呢是有三门课程啊,分别是 open club, 智能体应用课啊,主要是讲 open club 这样的智能体开发实战课啊,这门课程是一个更加硬核的来讲解大模型底层的 这个 agent 如何来进行开发的啊?这样的一门课程,以及啊适用于现在所有程序员的啊,这个 web coding ai 编程实战课。

hermes 终于出了 windows 原声安装的方式了,比起 wsl 的 安装方式呢,真的是方便太多了,今天我们就分别用 windows 原声和 wsl 两种方式分享一个从零开始,搭建一个非常舒服的 hermes agent 养马环境, 几乎呢可以告别指令,而且各个方面呢都能做到可适化的操作了。具体效果呢,包括使用 t u i 来操作 hemi 以及通过飞书来进行交互,还搭建了可以汇总各个通道并且直接发消息的可适化。外部 u i 对 不熟悉 linux 的 也安装了宝塔面板来进行可适化的文件修改。 然后还给 hymes 安装了一个每天自动更新的可视化净化面板,可以方便看到每一天净化的技能记忆以及做过的哪些工作。最后还给 sl 提供了一个 dashboard, 可以 方便备份还原你的整个 hymes 环境,让你可以踏踏实实的去养马了。 这套整完你的养马环境真的就非常舒服了。首先我们来看一下方法一, windows 原生安装的方式这个 windows 原生安装的方式呢,是最近刚更新的,现在还处于早期的测试阶段,并没有像 wsl 的 方式进入过了广泛的测试。 这个阶段呢,也可以去安装体验一下。安装方式呢,也是非常简单,把这预指令贴到 power shell 里边去,然后去运行,整个过程它都会自动去完成的, 大概整个过程呢需要十分钟左右。这个过程执行完之后,它首先会去检测你的 opencloal, 如果你安装过 opencloal 的 话,它可以选择将 opencloal 的 记忆,然后 skill 导入到 hermes 里边来,然后确定之后呢,我们就可以进入 hermes 的 抽象了,包括配大模型,包括 配飞书等各种基础配置。这个呢,一会我们再看这个过程呢,我们就可以跳到文档的黑米斯安装和使用啊,就是说第四部分的这个四点二配置大户型前面的过程啊,这个方案的前面的过程都不用去执行了啊,确实是方便了很多。 好,然后呢,这个完了之后,接下来就是正常使用,是都一样的,都是打开这么一个命令行,可以去输入飞书,当然也是同样的使用方式。 好,接下来我们再来看一下方法二, wsl 的 安装。这种方式呢,虽然说比起 windows 原声安装要复杂一些,但是现在已经是相对比较稳定的一种状态了。 另外呢,它是单独装在你的一个虚拟系统里边,它跟你的 windows 的 环境还不会产生任何的冲突,所以说这种这种方式也是也是不错的,特别是在 windows 的 这个原声版本还没有进行到一个非常稳定的状态下。 好,第一步呢,是原式启动并安装这个 wsl。 这个 wsl 是 个什么呢?它的全称是 windows system, 然后 for linux, 就是 说它是一个让你在 windows 的 环境下也能去装上一个 linux, 它这个相当于是一个监控层,不用去装那种特别笨重的 虚拟机去装 linux 了,就这个 wsl 可以 看成是专门为 linux 准备的一个监控层。好,首先打开 bios 输入 wsl, 输入之后呢,如如果你没有装过 wsl 的 话,它就会直接自动触发这个安装 linux windows 系统, 当然如果没有触发的话,你就手动再去输入一下这个 ws l 点 e s e 啊,刚刚一次到这,这个非常快,大概一会就做完了,做完之后呢,就是这个子系统是需要去重启你的电脑啊,重启你的 windows 电脑才能生效的, 所以这步完了之后,首先启动重启一下你的电脑,重启完了之后重新回到终端里边去, 然后在终端里边呢输入 wsl 杠杠 install 啊,然后 usb 二十二点零四,这个版本是目前稳定性最好的,对赫米斯来说, 他就开始进行下载安装了,然后安装这段是需要一点时间的,安装完了之后呢,它会提示一个 create 啊, default user account, 就 输入用户名和密码啊,用户名的话就是在这里你输一个比较熟悉的,比如说我们这个本来就是为赫米斯 专门去配置的嘛,你可以输入赫米斯啊,密码的话,比如说输入一个赫米斯一二三,这里它的密码是不显示的啊,所以说你只要那个算好了,输好了,然后回车就可以了。 当你的用户名和密码输完之后,它就会进入 linux 的 命令行了啊,特别是这个绿色和蓝色的这个字啊,这就是那个用户是赫米斯嘛,啊,这说明你的 ump 啊已经装好了。 好,接下来进入这个第三步,第三步主要是为赫密斯的基础环境做一些准备,这里主要是这么两步吧, 一步是把安装的这个源换成是国内的啊,换成这个阿里阿里云的啊,这一步就是 复制一下啊,复制一下,然后也是复制到命令行里面,也是执行一下啊,分别这两句执行一下就可以了,这个过程中呢,可能会需要你输入这个密码啊,就刚才我们设置的,比如说 hello 四一二三,输入完之后呢,再进入下一步,下一步就是把你整个 a, 整个你的那个锁影更新一下,因为是我们欢乐园嘛, 更新一下就是在这个紧紧跟着把这个指令贴过来,然后它整整个 update 一 遍,然后是接下来去在画过圆的环境里边去分别要装上 get, g, t, 然后 ker, 然后 node js 和 npm 啊,把这把这四个给装好, 一句指令就能搞定啊,点一下这个复制,复制到命令行里边就可以了啊,整个过程也很快就可以执行完。完了之后呢,然后再给 m 五单独换一下原也是执行命令,行执行下就完事了。好,这是第三步,然后接下来我们来来到第四步啊,前面的其实都是准备第四步就是在 u 盘吐下去安装这个黑米斯了, 也是依据指令点一下这个复制,然后贴到这个,贴到这个,贴到这个 uman 二的命行里边来啊,然后整个过程呢,也是需要一些时间啊,大家需要时间, 这一步完成之后,它就会跳到这个出水化的过程了啊,出水化过程跟跟刚才那个 windows 原声安装方式一样的,进入我们选择那个 quick setup 之后,然后去选择大模型啊,我这里就选择的是这个 mini max 啊,大家根据自己的那个大模型的那个你购买的大模型来进行选择。 好,然后我这里选的就是 mini max 啊,这个我觉得还是很不错的啊,这个就是它是呃,四十九,四十九是一个月啊,每五小时一万一千五百次模型调用啊,非常效果非常不错,而且基本上是够用的。然后你选择 mini max 之后呢,它会弹出一个让你去输入这个 api k 的 一个地方啊,这个地方跟那个输入密码是一样的,它不会,你输入是不会显示的,所以说你输入完一遍直接回车就可以了。好,然后它会进入这个 base url, base url 它默认的这个就是对的,所以说我们也是直接回车就可以了。 然后进入一个模型的选择这里我们选择这个,选择这个 mini max m 二点七就可以,因为这个 high speed 控制 plan 是 不能选的,这二点七也已经非常不错了。 然后这个地方选择 keep current。 好, 这步完成之后呢,我们可以先选择这个第二步啊,就先不去配配置那些消息通道,也就说先不去配置退出,我们可以先进一下 hermis, 看看它有没有那个 可以正常使用啊,所以说我们选择第二项之后呢,它就会提示你是否要启动这个 hermischat。 好, 我们输入 y, 输入 y 之后呢, 它就会打开这个赫米斯的一个撩人窗口了,然后你可以在这里边,你在在这里边输入一个信息,它如果能正常回复的话,就说明已经配配置好了,你的赫米斯也没有问题。然后呢,你的 a b r k 大 模型也是配置好了的。 好,我这里呢比较喜欢使用的就是你可以问他一下,你好,请问你是什么大模型,因为这样的话既能看到 hermes 能不能恢复,另外一看你的大模型有没有生效嘛?啊,你看这个地方,他说的就是 mini max m 二点七,好,到这步就完事了,这样的话你整个 hermes 的 技术环境已经没有问题了。 好,接下来我们再给它补充一个啊,毕竟用命行还是比较麻烦。我们再补充一个这个配置非输的一个环节,我们在那个命行里边输入 hermes set up, 它会进入这样一个界面,然后我们选择第一个啊, quick setup。 好, 然后这个地方呢就选择这个 setup messaging 呢,这个地方呢我们选择这一项啊,非输 lock, 然后这个地方就选择的是第一个就可以啊,第一个就是说我通过那个手机扫码的方式来创建一个机器人。好,这个地方你选择下一步之后,它会出来一个二维码啊,我这里 往下拉了一下,大家去打开你的飞书,然后去扫一下码啊,扫下码了之后,它会在手机端会出现一个你给你的那个飞书机器人起名字,起名字之后你点击创建,创建完了之后呢,这个机器人就已经成功了。 好,接下来我们再回到这个这个终端啊,回到这个电脑的命令行,然后这里边就选择第一个。这学这个是这个的意思是说他要去做一个配对的一个协议,你才能是那个那个飞书,才能跟 hems 进行通讯啊,刚才只是配完机器人还不够啊。 好,这一步我们选择第一项就可以了。好,这一步完成之后,它就会有个提示,这就是刚才我们在手机上创建的这个飞猪机器人,然后这里呢就是它说的是是否把这个作为一个系统级的服务啊,你作为系统级的服务,它是第一,它是运行在后台,运行在后台就是 你不需要有一个黑窗,黑窗口在这,另外就是它可以以这个随着你的启动来自动啊,这个是也是我们需要的,我们输入 r 就 可以了。 好,这个地方呢,选择是 system service 啊,就是根据这个随着启动来开启啊,当你启动 homebase 的 时候,你这个飞书的这个网关就启动了。 好,然后我们回到这个飞书,然后你可以给给你的那个智能体发起信息,它第一次回复的时候呢,它会出现一个, 就是因为刚才我们选的是配对模式嘛,它会把那个配对码显示在这啊,它这个地方就是什么,你要把这句给它复制过去啊,就 hermes pairing, 什么东西呢啊?这一段复制过去,然后复制到你的那个 union two 里边去啊, 然后如果成功的话啊,它就会提示 approve 啊,已经允许了,就是跟你的飞书已经建立起这个链接通道了。 那这个时候呢,你再去飞书里边发一句信息,你好,哎,他就可以正常来回复了。这句话就是是否将这个通道作为一个主通道啊? home 全网啊,这个地方如果你不写的话,他每次如果说每次你的 home 是 重启了之后,他都会有这这提示,所以说你这个地方可以在 在那个聊天里边你打一句斜杠, set set home 啊,以后就不会再出现了。好,到这一步呢,整个这个飞书啊就已经配置完了,从理论上来说的话,做到这一步,你的整个使用已经没有任何问题了啊,但是我们 再给大家补充一些提升这个使用体验的几个工具啊和方法,当然这个本来这个这些内容也是上一期的,上一期视频的内容啊,这这一期呢,我们就简单说一下,顺着整个我们从零开始安装啊,然后把这个优化提升的部分也再说一下。 首先是这个我们刚在视频开头的时候说过,就是整个过程其实他会 使用很多命令行去操作这些事情啊,包括 linux 我 们不太熟悉的,所以这个地方我们大部分做的操作都是一些格式化,把各个方面进行格式化的一些操作啊。首先是这个 官方也提供了一个格式化的网页,也提供了这么一个 dashboard 吧,然后它去能看到这个,比如说绘画分析模型这个技能插件啊,这些东西都能看得到,而且能做一些技术的管理,这个还是挺方便的啊。这个也很简单,就是你在那个代码里边,在那个命令行里边输入 hermes dashboard 啊, 它就它就可以来启动这个这个内置的一个外部 y 内置的这个 dashboard, 这应该是 dashboard 好, 然后它的端口呢,它会给你显示出来啊,就是这个幺二七点零点零点一九幺幺九,然后你可以在浏览器里边直接打开这个 就是这个界面了,然后这个如果说你在安装过程中,你输入这句指令它不生效,你就在 hemi 里边去输入这句啊,它就会给你安装 做一些配置和。说实话,虽然说官方的这个功能也比较全,但是它的绘画部分是能看的,无法进行,直接进行一个 chat, 所以 说接下来我们再去安装一个能够汇总所有这个通道的啊,包括飞书,包括 tui 通道所有的聊天消息, 然后这么一个第三方的一个 y v y 啊,这个就这么一个开源的项目嘛。啊,这个安装也很简单,你在命令行里边儿之后,把这句话贴到 home 里边儿去执行一下啊,就可以了。等它安装成功之后呢,然后你再让它运行一下,就会打开这么一个界面儿 啊,然后它的端口呢,就是这个啊,八七八七,嗯,这个具体的这个这块细节的东西,大家可以看我上一期的视频啊,讲的会更仔细一些。 它这个地方是你进来之后呢,首先是要先设置把这个显示外部会把打开,这样话它会把飞书把 d u i 的 东西都会拉过来, 好,这是这个。然后呢就是官方有的他都有,而且他还多了这个所有通道的绘画。第三个呢就是宝塔面板,这是一个专门用在 linus 的 一个可说话的一个工具吧,这个安装也很简单,就是依据在后面的运行,依据指令啊就可以了。最后完了之后呢,他会生成一个网址,那个网址呢?你要记得把那个 把它里边不管给你的是幺九二的 ip 还是一个外网的 ip, 把它把这段换掉啊,把这段换成幺二七点零点零点一,然后空格号和后边这一串啊,就是你的那个,他给你的是什么,你就写什么就行了,只是把钱包给换掉就行了, 然后它就会登录,登录之后就进来就会进到这么一个界面,这里边最有用的就是它,这个相当于是对整个 linux 有 一个可以用一个通过界面的操作了,对一些命令行不太熟悉的就可以去直接用这个,操作起来会比较方便。另外呢就是最常用的就是这个文件的 编辑啊,你可以直接找到他,直接双击进行修改,完了之后会有这么一个编辑器,而且还可以直接保存啊,这个是非常方便的。好,那第四个呢,就是和米斯都说是能自净化吗?非常想了解他的每都净化了什么内容啊,所以说我就给他做了这么一个东西,一个净化档案,会不会他每天净化的内容, 然后他的记忆的更新,他的做的动作,都会给他每天定时式执行执行一下啊,这个我觉得用起来还是比较不错的。然后呢,这个也很简单,你只要把这个 这么一句话给到他就行了啊,我有个想法就是能把你的进化记录,进化成果专门做成一个 atm 来展示,是吧?每天去更新一下,到底进化在哪,主要是想了解你的进化历程到底进化在哪,比如说进化 skill、 记忆这些啊。 好,这个做完之后呢,你就能看到一个,他就会给你生成一个 h t m 啊,大概就这个可能类似这个样子,如果说他做的不太好的话,你还可以跟他继续的去把这个风格和细节去做些调整啊,那我这里把我的这一份也总结了这么一个 t s t 啊,如果 你想直接参考我这个样式的话,你就把这段贴过去啊,再去执行一下,他大概就得到像我这个类似的这么一种进化档案, 这个 tst 其实是就是把里边的一些,比如头部啊,包括这个背景什么的东西啊,这些元素都明确了一下,然后还给了一个日系天猫的样板,这是第四个啊,第五个的话就是 wsl, 其实因为毕竟也是只停过命这行的东西啊,然后所以说这里给大家找了一个 电视报的啊,这个东西它这个操作起来确实比较方便啊,你这个 umi 兔可以直接去启动啊,不用再去打开设置三三去启动了,然后它这里边呢,包括这个直接点开命令行,直接打开这个文件管理器他们, 当然这个文件管理器是只能去看的,然后包括重启啊,包括这个导出啊,克隆啊,都是可以在这做的。这个导出是,嗯,如果说你做了一段时间已经养的标 比较多东西了啊,又怕他丢啊,你就可以给他做一下导出,镜像导出,然后你在天涯实地的时候呢,就是你再把你导出的那个文件啊,选一下啊,一般是这个 t a r 点七 z, 然后再去创建一个就可以了,这样的话就是万一你的这个养的辛辛苦苦养的成果啊,也不至于 就是。当然其他的一些方式,上次视频大家又提到,比如说用 git 去做这种版本的备份啊,这也是一种方式。另外呢就是 hermes 本身也有 bug up 的 一个指令啊,也可以去用。当然这个方式我觉得可能相对比较简单粗暴,因为它对你整个环映进行了一个保留,不仅仅是你的 q 和你的文件, 所以说这种方式呢,你也可以把你的导出这个文件也可以用到其他电脑上啊,也是比较方便的。好,整个这个过程就完事了啊。所以说 因为 windows 现在目前不太成熟嘛,当然大家尝鲜的话可以去体验体验。现在还是比较推荐啊,用这个 wsl 的 方式啊,虽然说稍微麻烦点,但是稳定性是更好一些。另外就是它毕竟跟你的 windows 环境不冲突啊,这个也是比较好的。 最后我再说一下啊,现在其实是说到这个养虾养马很多大部分都听的更多是一个自动化的操作嘛,比如一键完成赚钱文案,到到发布,到做封面做配图之类的啊,当然这是其中一种。另外的话,其实我觉得能带来更大价值的,其实是像这种做这个 ai 加上数据产生的这种 反应啊,这种比如我叫顶级情报员啊,这种东西呢,你可以让 ai 可以 定时的给你去做件事啊,比如说 我们说一个积分爆款啊,大家应该很多都知道这个事了,就是我们去选择题的话,最好的方式去找一些粉丝数比较低,但是他的效果也比较好的那个内容啊,你按他的这个选举再去做一篇,一般效果都比较不错啊,这个就是我做的一个积分爆款,找选找选找选题的, 对吧?那能找到比如说粉丝数比较低,但是播放量也比较高的一些视频,当然你可以跟他提具体的要求,比如说投币数什么的都可以提的。再一个比如说像评论区晚安选举啊,也是就是特别是一些大博主的下边,我们以 ai 为例, 比如说像求知啊,像像玄象这些,他们这些大博主每个新技术出来之后,他们都会做一期视频嘛,所以说他们的视频下边的那些评论问的问题,如果问的比较多了,那都是非常有价值的选题,对吧?那这个我就是让他做的一个这么一个事啊,当然这里边你可以去优化,把一些水词啊去掉,对吧?剩下一些关键词, 对吧?你看这总总结起来这个几个核心话题啊,成为他的 qq 乱创建,还有行业八卦啊,然后真实的需求, 对吧?然后这个里边的高赞的评论,他也给你给你找出来啊,高频词,然后他会给你一些选选期的机会清单啊,给你包括原因啊,他也会给你列一些。 所以说这个当然不仅仅这些啊,包括我现在用的,现在在用的,比如说这个 ai 搜索讯,他会给我做成这么每天的会做成一个网页,而且会带这个语音给我推送过来,然后我只需要这个,呃, 各位听众早上好,就是我只需要这个 ai 早资讯,这个在路上啊,或者是开车的时候你也可以去听。 嗯,然后比如说还有像同行的直播间的这个监控啊,这个是做个什么呢?就是,嗯,你比如说我现在想去做直播,我想看看同行的现在大家都在做什么样的直播啊?哪些直播的效果比较好一些,比如说在线的人数多一些啊?然后那我就可以去考虑这个他直播效果比较好,我去看 他的的形式啊,还是什么他的切入点啊,还是比较好啊,那,那我就可以借鉴。那如果有些做的不好的,同样也是对你来说我们被坑了,他的形式可能我本来也想过,那我就可能干脆就不是了,对吧? 包括在这个直播间里边会产生很多的有价值的弹幕,对吧?把这个弹幕再总结一下啊,这也是弹幕,也是很真实的一些需求。所以说不管你是做选题,或者你在做直播的时候去说的这些东西,可能也是赢,会赢得大家的一些信任吧。 至于我现在在做的一些事情吗?好吧,那今天我们的分享就到这里了,我们下期视频见。

装完 hems 别急着用,先配齐这五套系统。大多数人装完 hems 就 直接开聊,结果发现他记不住事,读不了网页,生成不了图片。问题不在 hems 本身,而在于你没给他配齐工具链。 裸装和满配是两个完全不同的物种。完整的 hems 高阶配置分五大模块,身份与记忆、感知能力、表达能力、效率与成本。生态导航,每个模块都有对应的工具链,我们逐个拆解第一个模块,身份系统。 装完 hems 第一件事不是用它,是写嗽点 md, 这是它的人格文件,推荐用 agency agents zh, 角色库里面有二百一十一个中文角色模板,直接搜你要的领域,然后跟 hems 说激活对应模式就行。记忆系统是第二个关键。 hems 内置的 memory 点 md 只记模型,主动写下来的东西非常有限。换成 handset 之后,它会自动从每次对话中提取实体和关系。 你周一提了一个截止日期,周五新绘画里它自动记的,不需要重复。感知能力是让 agent 真正有用的关键。 内容抓取用两个工具组合,单页抓取用 gina reader u i l 前加 r 点 g i 点 ai 就 出干净的 markdown。 批量深度抓取用 cross。 四、 ai 开源,本地运行完全免费。绕反爬用 hems 自带的 scrabbling 隐身浏览器用 camel fox, 搜索引擎用 tabiv, 每月一千次免费,专为 ai region 设计返回待引用的结构化结果,再配 doc doc go 做零成本兜底。文档处理用 python 做格式转换, pdf 转 markdown, 效果差就换 marker。 表达能力分两块, 语音识别用 whisper 本地模式,支持九十九种语言, telegram 语音消息自动转,文字语音合成用 h t t s 微软免费方案,质量够用图片生成接 fall 点 ai 也可以用 mid journey 或到减一两套语音方案加起来零成本。效率与成本是很多人忽略的模块。 token 监控用 tok scale 一 条命令看大局消耗,深度分析用和面 stashble 按组建拆解 token 去向,想压缩开销, r t k 能把终端命令的 token 消耗压掉百分之八十到九十。 自我进化是 hermes 的 杀手锏, hermes argent self evolution 用遗传算法自动优化 agent 的 提示词和行为,但建议等系统稳定两周后再开搭配验证任务,防止优化跑偏。 scale 扩展一次性装 wantata 的 三百八十个跨平台 scale, 再按需从 awesome agent skills 的 一千多个里面挑 生态导航只需要收藏一个入口。 isam hems agent, 所有工具 skill 插件教程都在这里。配套的 hems co system 格式化地图收入了八十多个工具,官方文档在 hems agent 点 news research 点 com。 配置顺序很重要,第一步,写好 saw 点 m d 定义身份。第二步,接入 handset, 搞定记忆。第三步,配齐抓取和搜索,让它能看见世界。第四步,开语音和图片。最后才是装 talk skill 监控成本开自我进化顺序错了,后面全是在补前面的债。 核心原则就一句话,先定义身份,再扩展能力,最后才优化效率。别上来就装一堆 skill, 连 saw 点 m d 都没写。 从 openclaw 参议过来的人会发现, hermes 在 记忆系统和自我进化这两块做了质的飞跃。 openclaw 的 记忆是手动维护, hermes 加上 handside 是 全自动提取。 openclaw 没有自我进化机制, hermes 可以 用遗传算法持续优化自己,迁移成本不高,但收益巨大。 agent 的 竞争已经不是模型之间的竞争了,是工具链配置的竞争。同一个 hermes 配齐了是你的超级员工, 裸装的只是一个聊天窗口。这五套系统配完,你就拥有了一个有身份有记忆,能感知会表达还能自我进化的 ai 整。

大家好,我是轩哥,只聊能用的 ai 技术,不讲虚的概念。 hermes 装好了, webui 也配上了,然后装什么技能?今天直接给你答案,五个让 hermes 开挂的神级 skill, 装上它们,你的 ai 助手直接从能跑变能干,闭眼装不后悔! 先来个最实用的协警是日报、周报、双周报、月报、季报年报头疼吗?读政策文件合同要翻半天,以前咋办的? 自己竹字写竹叶翻效率低,还容易漏。重点装了 document writer 加 pdf reader 这俩 skill, document writer 帮你一键生成规范公文请示,周报各种报告都能干。 pdf reader 帮你快速解读 pdf 内容,划重点,合同条款自动提炼。 你跟他说帮我写一份项目立向申请,或者解读这份合同里的付款条款,他直接给你。结果这俩组合是打工人刚需,装上办公效率翻倍。 第二个记笔记的朋友听好了,你是不是 c d 里写了一堆?想找某条信息的时候标题记不住,全书搜又慢? 装知识库读写 skill, 让 hermes 直接操作你的笔记库。你跟他说帮我整理一下上周关于 ai 自动化的笔记,他自动见目录,挪文件,补标签。我用三个月了,笔记再也没乱过。 第一次用记的授权文件加路径,别让 ai 把你重要笔记删了。第三个也是打工人刚需, 老板说明天交个 ppt, 你 是不是得从头调格式,找模板排版一个晚上没了 ppt 一 键生成 skill, 你 给它一个大纲或者几段文字,它自动生成可编辑的点 pptx 文件风格模板随便选,你只管改几个字完事,但记住,它生成的只是草稿,关键数据自己核对一遍,别直接拿去讲第四个,这是 hermes 的 王牌 飞书邮箱代办清单资料库,你每天切来切去,脑子够用吗? m c p scale 让你一次对话驱动所有工具。你跟他说,把邮箱里未读的合同附件存到飞书文档,再再代办里加一条审合同,他全给你干了。 飞书钉钉,企业微信都适配,授权的时候看清楚权限范围,别把公司核心数据敞开了。给最后一个,也是底座级别的。想让 ai 帮你改代码,整理文件夹,跑脚本, 没这俩技能,他就是个残废。 bash 执行命令 f s 读写文件,你跟他说帮我把 download 里所有 pdf 按日期归档,他自己写脚本运行整理好。 这两个是 hermes 内置的,装机率百分之一百,但权限要关小一点,别把 r m r f 这种命令随便丢给 ai, 让它先预览一下,你确认再执行。 最后多嘴一句, skill 不是 装越多越好,有些你试了一次就再也没用过的,留着干嘛?占用上下文费你的 token 去 hermes web ui 的 技能管理页面,把不用的 skill 禁用或者删掉。 原则就是只装你每天用得上的,定期清理吃灰的,省下来的 token 够你跑好几回定时任务了。好了,五个 skill 盘点完,最后说句掏心窝子的话, skill 不是 装的越多越好,而是装对你最有用的那几个。 这五个是我每天在用的公文写作和 pdf 解读处理文档 of ceiling 管知识, ppt 救急 mcp 打通全生态 bash 加 f s 兜底,你装完这五个, hermes 才算真正毕业。现在你已经从拥有了一个完整的私有 ai 助手, 后面的路就是用它偷更多的懒,干更多的活。评论区告诉我,这五个里,你最想先装哪个,或者你有啥更骚的 skill 推荐关注轩哥,只聊能用的,今天就这样吧,拜。

hi, 大家好,欢迎来到今天的技术解析。今天咱们要聊点硬核的,我们将从开发者和工程师的视角来深度拆解一下由 news research 推出的开源多智能企框架 hermes agent。 咱们直接进入正题,来看看这个被圈内称为 ai agent 通用后端的技术到底有何魔力,能重塑咱们和 ai 的 协调方式。 咱们先设想一个极其现实的场景,试想一下,如果你的 i i 助手不仅能老老实实待在 i d e 里,还能无缝穿梭在 telegram、 discord、 微信,甚至是你黑乎乎的终端命令行里。而且在所有这些平台上,它共享着同一个绘画、同一份记忆,以及完全相同的工具访问权限。 是不是想想就很爽?因为说实话,咱们早就受够了现在那些碎的一地鸡毛的 ai 工具了,对吧?而这恰恰就是 hermes 想要干掉的核心痛点。 今天咱们的路线图非常直接,第一,什么是 hermes agent? 第二,扒一扒它的底层架构。第三,企业及特性和安全性。第四,成本控制,毕竟谁也不想跑破产,对吧?第五,和同类工具的硬核对比。最后,咱们总结一下为什么说它是多智能体的控制平面。 好,咱们先从最基本的问题开始。第一部分,什么是 hermes agent? 简单说,它是 non research 开远了一个 ai agent 框架,你可能会觉得这不就是个跑在端端的工具吗? 嗯,它是 cifirst 没错,但它的野心大得多。它其实是一个能直连十四种以上消息平台的通用网关服务。 咱们可以把它看作是 ai agent 的 通用后端,它是完全提供商中立的,也就是你可以无缝接入十八种以上的 llm 供应商。不仅如此,它的工具链极其丰富,从 web terminal 到最近大火的 mpvip 协议,全都能轻松搞定。 那么第二部分,咱们就来扒一扒它的架构,做个深度解析。要搞懂 hermes, 咱们得先看它精妙的三层命令系统,最底层是二进制的 c l i, 中间封装了子命令,最上层则是大家极其熟悉的 slash commands, 也就是斜杠命令。 这个设计绝了,因为它完美的统一了你的操作体验。不管是你在终端窗口里,还是在 telegram 的 聊天框里敲命令,它底层的调度和响应逻辑是完全一致的。 而真正在幕后驱动一切的,是极其严谨的 agent loop 智能体循环。你看,从 inference, 也就是推理,到托 call 工具调用,再到 observation 观察反馈, hermes 就是 靠着这个闭环不断地去执行任务,拿到反馈,然后持续推动它的推理引擎向前跑。 所以请注意,这绝对不是在简单的套壳儿聊间,这是一个真正意义上的自治运行式。说到企业即落地,我绝对要吹爆它的多族虎隔离能力。 为了解决资源互踩的坑, hermes 拿出了 profiles 机制来保证绝对的隔离。这意味着什么呢?每个 profile 都有它自己独立的配置文件,独立的 dot e n v 密钥文件 memory skills, 还有独立的绘画,互不干扰。 同时,它还自带了 delegation, 也就是委派系统,你可以直接拉起并行的子 agent, 精细地去配置委派的深度,甚至还能强制给子 agent 覆盖一个更轻量级的模型,简直不要太灵活,公口无凭,咱们直接看两行极其硬核的命令行。比如你敲 hermes backup quick label pre upgrade, 这就触发了它的 checkpoints 检查点系统。非常有意思的是,它底层竟然是用了一个共享的裸 git 仓库来处理状态回滚,极其可靠。再看另一个 hermes p alice gateway, 这就是利用咱们刚才说的 profile 机制,直接在不同端口上同时抛弃多个相互独立的 api 网管死污剂,这就是它的工程化实力。 好,这就顺理成章来到了我们的第三部分,企业级特性与安全。说实话, hermes 简直是自带了一整套企业级基础建设的重型武器, 多用户 profiles 和带 h m a c 验证的 webhook, 这些标配咱们就不废话了,我必须得提一下它的看板 boards 看板功能。大家如果玩过多 agent 的 血统,肯定遇到过一种致命的崩溃,叫死去交接,也就是某个 agent 的 中途挂了整个任务链儿,直接卡死。 hermes 怎么解的呢?它用看板机制配合心跳检测、僵尸程序识别去自动回收任务,完美填上了这个大坑。再加上绑定了特定 skill 的 chrome 定时任务,还有支持 docker、 ssh 甚至是 teton 的 端端护端,这些加起来才叫真正的生产机工具。 当然了,能力越大,这安全护城河就得挖得越深。在生产环境里,咱们可不敢让 agent 随心所欲地去执行命令,对吧?看看 hermes 的 微操,你在配置文件里加上 approvalsd mode smart, 它就会起用极其聪明的批流,再结合底层的 tyrust 策略骚扰做安全拦截。 另外通过 delegation 点 max、 concurrent children 三这种极其细力度的配置,你可以死死按住此 agent 的 病发数量,防止资源爆炸,稳如老狗。 那么既然要在生产环境跑重度任务,咱们就不得不谈谈钱的问题了。第四部分,成本控制与辅助模型。 各位如果跑过 agent 工作流,肯定对那个蹭蹭上涨的云账单心有余悸。为了省钱, hummus 搞了一套非常绝的降本架构,叫 auxiliary model routing 辅助模型路由。 简单来说就是像生成个标题了,上下文压缩视觉处理,或者刚才说的安全审批。这类杂货流水线大概占了总任务量的八十倍儿,他统统甩给那些极快极便宜的 flash 模型去干,只有剩下那二十倍儿,真正需要深度思考的硬骨头,才去调用昂贵的推理模型,这就叫好钢用在刀刃上。 此外,为了保命和省钱, hermes 还有两招必杀技。第一是 credentials pools 凭证池,它可以跨多个相同供应商的 apikey 进行无缝轮换,彻底告别恶性的速律限制报错。 第二招是 forback provider chains 回退提供商链。这玩意儿太有用了,万一主力模型突然宕机,系统完全不需要人工干预,直接顺着链条秒切到备用提供商,死死保障你的业务,高可用绝对不断断。咱们讲了这么多好话,接下来第五部分,对比与权衡。 是骡子是马,咱们拉出来溜溜。现在市面上的 ai c l y 工具简直多如牛毛,咱们先拿 hermes 和当红榨汁机 clode 碰一碰 cloud code 因为是官方亲自下场,那开箱即用的体验确实叫一个丝滑。但是 hermes 的 营面在哪呢?在于它强大的多平台网关,绝对的提供商中利性,还有深得多的企业级隔离。 这里的权衡点就很明显了, hermes 初期的配置门槛确实偏高一点,但你熬过去之后,换来的就是生产环境中碾压级别的灵活性。 那再跟 codex c l i 比比呢? codex c l i 这哥们儿很硬核,优势在于云端沙盒里的 os 内核级强制执行隔离,安全性极高。但如果拉回到生态位, hermes 在 m c p 协议的支持度上,在 chrome 调度、 webhook 触发器以及整个 skill 技能生态的丰富度上,可以说是压倒性胜出的。 如果你是奔着搭复杂的自动化基建区的,选 hermes 绝对错不了。哦对了,顺便提一嘴,如果你现在手里正用着 openclaw, 也完全不用担心沉没沉稳, hermes 官方直接给你留了条退入一条原生的迁移路径,只需要敲一行命令 hermesclaw migrate, 你 现有的工作流和状态就能被一键导入到 hermes 里丝般顺发。 好了,干货拆解的差不多了,咱们来到最后一部分,第六部分,总结一下多智能体控制平面。 各位同行,咱们其实正在经历一场范式转换,从单一的 ai 助理全面走向多智能体团结协助的工作流。回过头来看 hermes, 当他把看板、看板、 profiles、 资源隔离、 crown 定时任务还有 webhook 这些技术站全部融合在一起的时候,他就已经产生质变了。他不再是一个只会听你口令干活的端程序,而是一个真正意义上的 control plan 控制平面,用来掌控你手底下的整个 ai 员工团队。 今天整场解析听下来我最想给大家留下的一句话其实是,关键真的不在于你现在用的是哪个最牛的模型,而在于支撑这个模型的底层基础建设框架。 不管你接的是 gbt 四 cloud、 ops, 还是你本地的一头开源巨兽,模型本身的能力总归是有天花板的,真正能让 ai 深入生产业务并创造价值的,是它周围的工程生态、工具链和调度逻辑。而我想, hermes 显然是把这一点给彻底玩明白了。 所以在今天的最后,我想把这个问题抛给各位,你现在的日常是不是还停留在对话框里跟你的 ai 闲扯淡? 还是说你已经准备好去卷起袖子,搭建一套真正的底层基建,让 ai 去为你整个团队全天候地跑自动化了?希望今天的这期解析能给你一点启发,咱们下期解析不见不散!

前两天我把主力 ai 助手换成了 house agent 版本零点九,结果两天踩了四个坑,差点卸载了。但是踩完之后,我反而越觉得这个工具太厉害了。我们先来说一说我遇到的坑。 第一个坑其实是审批安全模式。这个模式是干什么呢?它控制的是当你的 house 执行一条危险的命令的时候,要不要先弹出窗口整理确认是成 off, 也就是大家常说的优乐模式,不确认就直接跑配置,里面写的是 oppo s 连 mod auto 字面意思是自动脱过对吧? 我以为射了就万事大吉了,结果每次执行危险命令,它还是弹出审批窗口。我查了一圈才知道 auto 这个模式更根本就不认识代码,直接把它当成了最严格的命令模式,每次都卡里。解决方法巨简单,把 auto 改成 off 就 好了。 所以这里有个坑,它的配置值不是自由填写的有效值,实际是 mana、 smart、 off、 force 四种。 off 和 force 效果一样,不谈审批, auto 是 无效值,设了等于没设。所以说大家在配置 house 的 一些配置项的时候,最好是从 ai 深入分析啊。 house 支持的一些配置项, 让它写成一个文档或者说架构图以后,在配置的时候先参考这个文档,再来去改它的配置。 ok, 收到文档,在开始之前,我先快速给大家过一下赫姆斯零点九的一个整体架构,方便理解后面的内容。左边的话其实就是入口,你可以从命令行飞输 api 或者说装插件来接入赫姆斯, 中间是核心, get away 是 它的中输,负责接收任务,分发给各个模块, skills 系统让你也给 agent 写进了说明书 记忆模块,从绘画、历史。 mcp 插件协议让赫默斯能连接外部工具,底下内置的四十七个工具,覆盖文件、浏览器、消息等常见操作。右边的话是输出,包括读写文件、发消息、响应。 ipi 这个架构能帮你理解赫默斯能做的事其实很多,但是每一条路径都有它的规则,你了解它越多的话,用起来就会越顺。我们来说一下第二个,其实是 obsidian 的 一个远程同步,我平常会在用手机指挥赫默斯去给我做一些 文件的整理啊,写一些文章之类的,会让它写到我的知识库里面去,也就是 obsidian 用来记笔记。其实我的笔记的 云备份是用的是腾讯云的 code 对 象存储同步插件的话,用的是云 mail 的 save 里。它的好处是能够保留每篇笔记的真实修改时间,很方便的能够让我在手机以及我的两台电脑上无缝地去同步我的数据。我最早想的是让 home 死定时把笔记同步上去,不就可以 实现我在另一台电脑能看到最新的内容了吗?结果笔记是同步上去了,但是每天笔记的修改时间全部被覆盖成了同步时间,真正的更新时间全部丢了,这个影响其实是很大的 哦。我们整理的笔记有一部分是靠 opc 点今天修改过的内容去排序时间,一覆盖全部就乱了。根源其实在于是由于我在使用 hms 的 时候,直接通过一个 close client 去 上传的整个文件,没有通过与 modsafe 里的一个同步机制,而 cosplay 不 管文件原来什么时候改的,它只管上传,就是当前版本与 modsafe 里呢,会保留原始的时间戳,但是 cosplay 不 会。最后改用赫默斯调用 以 modsafe 里的一个 client 接口,让插件自己同步逻辑就好了。其实这里有些配置需要打开,比如说我们的 obsidian 的 client 模式,以及个坑,给我的教训就是用工具原声的接口集成的时候,不要绕过它操作底层数据。 好,我们来说一下第三个坑,其实是飞书的一个语音消息,我想让赫默斯完成任务之后给我发一条语音通知,听起来很简单,但是调了半天才通, 主要是有三个小坑叠在一起,让人怀疑人生。首先第一个我自己是用的是 mini max 的 一个订阅扩展,它里面有个 tts 接口,实际上它是有两个域名的,一个是国内版,还有一个是海外版,这两个根本不是一回事, 用错了就完全调不通了。第二个是飞书上传音频的时候, file type 必须填 o p u s, 不是 mp 三,也不是 o d o, 文件能上传,但是飞书上点不了,播放不了, 我不知道大家有没有踩过这个坑。第三个是文件时长参数,必须传毫秒,而不是秒,我传了十秒,它当成十毫秒来处理,飞出显示语音只有零点零一秒,根本没办法 播放。所以说真正的问题不是能不能做,而是路径对不对。其实知道路径比真正的答案更重要。好,我们再来说一下第四个,顺便来提一下,其实不算真正的坑,有一天下午黑夜突然断联了,我以为是黑幕软件的问题,查了半天,其实是电脑进入了一个睡眠睡眠模式, 这里我也推荐一个小工具的,我自己会用这个工具来让电脑不会真正的睡眠。前面四个坑说完了,我还要补一个让我彻底回不去的理由。这是赫默斯最让我惊讶的一个设计思路,它其实不单纯是一个工具,而是一个能够自我净化的一个工具。赫 默斯有一个 skills 系统,你可以给 a 键的写技能说明书,叫 skill 点 m d, 告诉他遇到什么情况该怎么处理,比如用户让我发飞出消息,就调一下。这个 skill 真正厉害的在于它不只是让你手松血,还支持自动诊断和优化,那这个特性大家应该都听说过,我再给大家分享一个插一个能够更加增强它的插件。阿尔文 skill 我 自己用下来推荐给大家的一个工具,它会类似于卡帕西实 实验带的一个思路,给你的 skill 评分跑对比实验,然后自动提出改进方案,你确认它改,改完再验证一等。完整的闭环是评估,改进,实测,确认,保留或者回滚, 这一切都在用户目录下运行,不碰赫默斯原码升级。赫默斯版本里的 skills 和进化记录全部的保留。说白了,赫默斯会随着你的使用不断变得更懂你, 不是一个人在优化,而是和你一起进化。好了, skills 优化说完了,接下来说一说零点九新加的一个外部控制台,就是在浏览器里面打开 logos 的 三千端口,能够看到赫默斯所有的状态,会话记录。 skills 配置, getaway 的 专线全部的格式化 之前其实我们大家在使用赫本斯的时候可能只能靠命令,命令行,或者说配置文件状态不是很透明,你不知道他 自己有没有在跑,以及他之前的 session 存了哪些数据,其实用了它是 bot 之后,打开浏览器一切就一目了然了,而且它是 bot, 是 本地运行的,不走任何的外部服务器,你的隐私数据进不过第三方,让本地部署这件事从技术活变成了可自动化操作 工具进化的方向最终是让复杂的东西看着简单。之后我说一下我用了两天黑慕斯之后的核心感受。其实我们在跟 ai agent 写作的时候,很多人关心的是 agent 能做什么,他能写代码,能发消息,能搜索, 但是我觉得我们更应该关心我自己知不知道我要什么,并且我们能不能把这个路径准确的传达给 agent。 工具是的,越来越强大了,但是工具永远需要一个人来掌握。 赫默斯零零九让我觉得他在这方面做的很对,他的设计逻辑是让你来主导,让 a 箭头来执行,并且在这个过程中他能自己优化,这就是我觉得他和其他 ai 工具最本质的区别。好的,今天的分享就到这里,有什么问题也欢迎评论区来聊,我们下期来电来见。