粉丝1556获赞5241

如果你还在折腾龙虾,还没学会,可以先停一下了。最近有个叫 hermes 的 新项目,一上线就杀疯了,狂揽六万星标。他能接各家厂商的模型,随便切,具备自学习循环, 越用越懂。你做过一次的活,还可以自动沉淀为 skill。 我 朋友为了装它,甚至在海鲜市场花了四十九,结果装完了,自己都不知道怎么配。其实自己学会安装并不难,别被那些复杂的代码吓到了。 今天全部交给你。开始之前看看你需要准备什么,只需要一样东西, git 终端输入 git version, 能看到版本号就行。其他的 python, node 全都不用管。安装脚本自动帮你搞定。先讲 windows 怎么装,右键 windows 图标选中端管理员, 打开 power shell, 点开 hermes 的 官方文档,复制安装命令,粘贴进去,回车,然后等着全部绿色打勾就装好了。 mac 也不复杂, command 加空格, so terminal, 打开终端,同样去官方文档,复制安装命令,粘贴回车,等它跑完,输入 source, 重载 shell, 然后输入 hermes, 看到欢迎界面就成功了。安装脚本帮你装了一堆东西,简单了解一下。 python 和 node 是 运行环境, 没这俩跑不起来。 ripgrab 做搜索, ffmpeg 处理音视频,你不用管,知道有就行。装好了,问题来了, hermes 需要一个 ai 模型才能干活, open router, 两百多个模型随便选,有试用额度,但注册稍微麻烦。欧拉玛本地免费跑,不需要联网。新手选这个就对了。第三种,自定义 api, 接任何兼容接口,适合进阶玩家。选好方案,进配置,向导选 quick setup, 新手直接回车,然后选提供商,我们选欧拉玛配置自动保存,输入 hermes 就 能用了。选了欧拉玛还需要几步配置,先去欧拉玛官网下载安装 模型,大概十二个 g, 注意硬盘空间。输入 hermes model, 选自定义 open ai 兼容 ul 照屏幕填就行。 api key 直接跳过 模型,选 gptos 二十 b 免费的上下文十二万八千 token 够用了。输入 her miss chat 杠 q 你 好,能收到回复就全搞定了。一般用户跳过这段想手动装的,接着看 git clone 克隆项目 cd 记目录 peep install 装依赖 python, 简莓 miss 启动,适合想改原码的人。装好之后记几个常用命令, her miss model 和 tools 切模型管工具 her miss update 更新, set up, 重新配置 her miss doctor, 诊断问题, 用过龙虾的话, claw migrate 一 键迁移。最后讲几个容易踩的坑, her miss 提示找不到命令 source, 波浪线 bashc 重载 shell 就 好。 samsung 构建失败,改成 pp install 简易引号,点引号最小,安装报四零一,错误 检查 api key 或者固定 provider, 上下文不够换十二万八以上的模型。到这 hermes 安装全讲完了,一行命令,装好,选欧拉玛免费跑,就这么简单。我是曲奇,一个 ai 练习生,让我们一起记录 ai 时代的个人进化。

这是 hems agent, 然后这个界面是它现在命令,命令运行的一个界面正常流转。但是我昨天让它给我做了一个新的 u i, 看一下 hems o s 版本的, 这是完全可以接入 apa 之后直接可以运行的。刚做完一会试一试。

今天我想聊一篇关于 hermes agent 的 技术分析文章。 hermes agent 是 liu research 开发的自改进 ai agent, 寄予 python 构建。 它最让人印象深刻的是一个核心类 ai agent, 支持四种大模型 api 模式,集成七十多个工具,还能跑在二十多个消息平台上。 这篇文章从源码级别完整剖析了它的实现细节,从架构到循环,从工具到记忆,非常硬核。先看整体架构,最上层是用户接入层,包括命令型工具、网关服务和编辑器,集成覆盖二十多个消息平台。 中间是核心的 a i a 阵类,它管理着三个关键模块,系统提示词构建器、 a 键、多轮循环引擎和工具执行器。底层则是一系列支撑组件,提示词缓存降低百分之七十五的输入成本。上下文压缩器,防止对话溢出, 记忆管理器,维护长期知识,还有 l l m 适配器,支持 answape、 gemla、 bedrog 等多种模型。 这种分层设计让每个模块都可以独立演进。整个 a 阵的灵魂是 run 下划线 conversation 方法, 这个方法足足有三千两百行,本质上是一个精密的状态机。它的流程是这样的,先车令环境构建七层系统提示词,预压缩历史消息,然后进入主循环,每一轮都构建 api, 请求发起流式调用,处理响应。 如果模型返回了工具调用,就执行工具追加结果继续循环。如果没有工具调用,就提取最终响应退出 错误恢复也做得很完善。 api 连接失败会重试三次加指数退币,上下文过长会自动压缩,速律限制会自动轮转平距。 工具系统采用了优雅的自注册模式,每个工具文件在模块级调用 register 点 register 启动时,通过 a s t 扫描自动发现所有工具无需中央配置文件。 工具执行支持条件并行,只读工具,如搜索和文件读取可以同时运行,最大并行度八个,但交互式工具永远不会并行。 还有一个亮点是子 a 镇委派机制,副 a 镇可以把子任务交给子 a 镇处理,深度最多两层,每个子 a 镇有独立预算,并且子 a 镇不能再创建子 a 镇,防止地规爆炸胀陷了。温缩是整个项目最复杂的部分, 它采用多阶段策略,先用 md 五去创旧的工具,结果保留最新的,再用一行摘药替换永长的历史工具输出,然后保护最近二十条消息不被压缩。 对中间部分用大模型生成结构化摘药,包括活跃任务目标、已完成事项、关键决策等。 还有个反抖动机制,延续两次压缩,节省不到百分之十就暂停,避免无意义的压缩循环。压缩域值默认是上下文窗口的百分之五十,即系统支持内置记忆加外部插件记忆, 记忆内容通过后台现成预取注入到用户消息的临时前缀中, api 调用完成后就移除,不污染历史记录。 终端机制设计得非常细致,采用现成既中断而非全举标志,因为网关可能同时运行几十个 a 帧,实力全剧中断会导致跨绘画干扰。 还有一个引导功能也很巧妙,它不中断当前正在执行的工具,而是把用户注记追加到下一个工具结果里,让模型在下一轮自然看到引导信息。最后说说几个关键设计决策, 为什么乱下划线。 conversation 有 三千多行,因为它要处理四种 api 模式下的各种边界情况,这是复杂度的必然结果,不是设计缺陷。 为什么用自注册模式?因为工具文件完全独立,插件和 mcp 工具通过同一个注册表统一管理,扩展性极强。 整个 hermes agent 的 设计哲学是,复杂度放在该放的地方,核心循环处理,所有边界工具保持独立和可扩展。如果你正在构建自己的 agent 子框架,这份原码分析非常值得仔细研究。我是林申健 ai, 我 们下期再见。

兄弟们,哈莫斯这波升级呢,简直是神级更新,直接宣告了 ai 正式从好用的工具进化成了夺权的基础设施。很多人呢,根本看不懂这背后的信号呢,有多么恐怖。以前我们吹捧的 ai a g 呢,是个啥?自动写两行代码, 或者呢,像高级按键精灵一样帮你点点网页,充其量呢,也就是个实习生。但现在呢,对 windows 系统呢,更好的支持了,彻底砸烂了系统的壁垒, 浏览器自动化呢,直接提升了整整一百八十倍,这是什么概念?这抓取操作呢,比人手快了几十个身位,更绝的是他接入了一百万上下文的 rock, 连 tim 和推特都无缝对接进去。看懂了吗?这已经不是一个工具了, 这是一个有着超强记忆,甚至能直接操控所有软件的完美数字员工。而且他现在已经原生支持外部 u i 了,不用再去单独的去配置第三方了, 非常哇塞,看懂了吗?这已经不是一个工具了,它是一个有个超强记忆,能直接操控所有软件的完美数字员工。很多人呢,严重低估了运行层的价值。你以为未来的 ai 天下拼的是谁的模型参数大吗? 大错特错,未来真正垄断市场的是谁能掌握 ai 的 工具链?谁能支配多个 ai 的 协助工作流。 hermes 现在做的就是成为 ai 时代的刀客, 加上 vsco 的, 再加上 zippo 的 终极结合体。当所有人都在沉迷于 ai 聊天的时候呢,真正的高手已经悄悄地不是 ai 时代的水电煤了。 如果你还没有升级的,或者说你还没用上这么好的工具的,说一下啊,我总结了一套 hermes agen 的 从零到一的详细操作指南,说一下,直接拿去。

如果你现在还在问 agent 接外部系统到底该压 c l i m c p 还是 api, 那 你可能已经问错问题了。 anthropic 这次真正改写的不是协议优劣,而是 agent 的 接入架构。过去关于 n c p 的 争论其实很集中,贵慢 占上下文。社区拿 github mcp 和 cli 做 benchmark, 结论也很直接。传统 mcp 方案在 token 成本和可信上确实输给 cli, 所以 很多人顺势得出一个判断, cli 加 skills 才是正道, mcp 太重了。 但 encyclopedia 这次最新这篇 building agents that reach production systems with mcp, 真正做的不是替 mcp 方案,而是把这个问题重新放回系统设计里。 他先明确了一件事, agent 接外部系统其实有三条路, direct api、 c l i mcp。 这一步非常关键,因为它等于直接否定了一个旧问题,不是以后只剩一种连接方式, 而是不同场景本来就该用不同的连接层。 direct api 适合简单一对一固定流程,问题是规模一上来就会掉进典型的 m 乘 n integration 问题。 cli 在 本地开发和沙乡环境里依然最强,因为命令行天然适合, agent 可发现、可组合、可管道化。在代码执行、本地文件、系统、终端、工具链这些场景里, c l i 加 skills 依然是高效路线。但一旦 agent 跑到云端,情况就变了,比如 call work manage agents, web 端、移动端, 这些环境里没有本地终端,也没有稳定文件系统,这时候 m c p 的 位置才真正成立,它不是 coi 的 替代品,而是云端 agent 的 标准化接入层。这就是第一层变化, 不是协议之争,而是接入架构开始分层。第二层变化是 antropic 这次开始正面处理 m c p 最大的工程问题,上下文膨胀。他给出的第一个答案是 to search, 以前是把所有工具定义直接塞进上下文,还没开始执行窗口先被工具说明书占满了。 现在是按需发现,按需加载, agent 先表达目标,系统运行时再搜索相关工具,只把匹配的几个拉进来,本质上就是把域加载工具改成,运行时发现工具。第二个答案是,工具不要按 api 颗粒度暴露,而要按意图分组, 不要给模型一堆碎动作,而要给他能完成完整任务的高层能力。第三个答案是程序化工具调用,别让模型一轮轮调工具看结果再继续,而是给他一个执行环境, 让他在中间层完成过滤聚合、编排,只把最终结果回送上下文。 cloudflair 的 案例就很典型, 不是暴露两千五百个 api 端点,而是只暴露 search 和 execute 两个工具,先搜索再执行,中间的代码编排,在服务端沙箱里完成。这其实是在把 c i 的 方法论搬进 m c p, 最后再加一层就是 skills inter topic。 这次把分工讲得很清楚, m c p 管能力, skills 管编排, m c p 负责把外部系统接进来, skills 负责告诉 agent 这些能力该怎么组合,怎么调用,怎么完成任务。 所以如果只留一句结论,我会说, antropic 这次真正重新定义的不是 m c p 本身,而是 agent 接外部系统已经从单一协议选择进入了分层。架构设计,简单场景 direct api 本地开发环境, c l i 加 skills 云端生产环境, m c p 加 skills m c p 没死,它只是从万能答案变成了云端 agent 的 标准化接入层。 你更认同这种分层架构吗?还是你觉得最后还是会收敛成一种统一接入方式?评论区聊聊,关注我,下期继续带你拆。

hermes agent 佳英伟达免费调用模型 hermes 就是 最近大家常说的养马,这期教大家如何安装。首先打开终端, 输入这条安装命令,安装 wsl。 wsl 是 在 windows 电脑上直接运行原声 linux 的 终端环境,无需安装虚拟机或配置双系统的兼容层, 安装完成会提示设置用户名及密码,我上次已经安装过了,所以这里没有显示终端输入 wsl 进入 linux 系统, 进入 linux 后会显示你的电脑主机以及用户名等信息。 escape 命令退出 linux 设置用户名的时候要注意不能使用阿拉伯数字或者大写字母密码,需要输入两次,且输入时在终端是看不见的。 现在我们需要安装 git。 git 是 一个开源的分布式版本控制系统,用于敏捷高效的处理从很小到非常大的项目版本管理,能让你随时记录并回退代码的每一次修改。进入 linux 输入命令安装 git, 这里输入刚刚设置的密码,一定要注意, linux 输入密码是不显示的,输入完点击回车。 hermes 在 代码编辑器使用比较友好,可根据个人习惯选择终端。首先进入 linux 输入安装 hermes 的 命令。由于我之前安装过 hermes, 大家的界面会和我不一样,安装完之后会显示 hermes 的 主页,直接 ctrl 加 c 退出,返回 输入命令,随便设置一个模型提供商,之后会修改 设置 nvidia api 的 face ui。 二、 设置调用模型的 api 我 们到 nvidia 的 ai 开发者平台登录 nvidia 账号, 点击右上角获取 apikey, 点击创建 apikey, 给 apikey 设置名字 选择,有效实现。选择 never expire 永不过期。扣屁一下 apikey 友情提醒,一定不要将自己的 apikey 分享给别人。视频中的测试 apikey 已删除,这里粘贴刚刚复制的 apikey 设置调用的模型,启动 hermes, 给 hermes 发一条消息,测试一下 大模型调用失败,输入 model, 手动选择模型, 给 hermes 再发一条消息到这里。恭喜你, hermes 已经可以给你打工了。这期视频就到这里,感谢大家!

口袋终于实现国产模型自由了, dc 切问质谱随便切,重点是绘画记录还能够完整保留,这下真的不用再整天盯着额度了。这次使用的工具是 echo ball, 你 可以理解成 给口袋加了一个模型切换器,上次我们连接 dc 的 时候还要配 cc 叉和 cc switch, 这次更加的简单,模型都放在同一个面板里面,想用哪个直接切?安装包我都已经整理好了,下载之后直接运行就行。 我们先来打开这个 echo board, 左边点击我们的模型中心,这些模型呢都是可以直接链接的,只要符合 open a 的 协议就没有问题。点 击模型,然后添加我们的模型 id 还有 api key。 接下来我们再点击右边的应用管理,这里可以看到有很多的 ai 工具,但这期我们主要讲的是 code, 所以 我们先找到 code, 点击我们已经配置好的 d c 模型,点击启动就会自动弹出我们的 code, 看已经切过来了,我来测试一下,让他解析一下 echo ball 这个项目。 ok, 没有问题。重点来了,直接回到我们的 echo ball, 切换千问,点击启动就会自动重启我们的 codex, 看刚才的聊天记录都还在继续追问,刚才那个项目他也能够接的上。模型都放在同一个面板里面管理,不用反复去配置,这可比以前舒服多了。最后再给大家补三个坑,第一个我测试的时候发现先换回默认的 open ai 反而会丢失他的绘画记录,检查后发现原来是工具里面的一个小 bug, 不过包里面的版本已经是修复好的。第二点是部分的绘画可能会出现模型切换之后不能继续对话的情况,因为不同的模型对话里加密信息和工具调用状态他不一定能够兼容的。建议切换模型之前呢,先总结一下上下文,然后新建对话,再继续项目。 第三点,很多朋友也反馈过, a p i 模式下没有办法正常的去使用插件,但是我最近看到一些解决方案,这两天我会再去实测一波,到时候再给大家分享,不过目前又是不影响的,是可以正常使用的。今天的分享就到这了,我是木马,每天一起玩 a 的 赛博大志,咱们下期见,拜拜!

兄弟们,你们要的在 hermes engine 中用网页大模型代替我们 api 的 解决方法来了,下面我们用一分钟的时间来实操一下 windows 用户的话,得到这个 excel 的 文件安装包,直接安装好的话,主界面就这样了, 我们在设置里面把它的文字改为简体中文,然后再点击供应商,这里我们添加一个单元格型,这里我就以字谱为例,选择之后直接点下一步,然后点击 os 登录方式,打开 os 登录,然后我们就像以前登录字谱的官网一样去登录它就完了。登录好了之后,我们就点击添加账号,相当于现在已经有一个 字谱的账号在这里了。然后点击左侧菜单栏,点击代理设置里绑定地址的话,如果是自己用,那就按着这个上面默认的就可以更改。然后点左侧菜单栏的 api key, 我们打开认证,新建一个 api king, 这里的名称和 king 可以 自动生成就可以,然后我们接入 api 的 base url 的 话就填上面那个, 然后模型名称填下面那个,那么这里面的所有的操作我这里都已经整理成了一份指南,如果大家有需要的话可以在评论区留言。接着我们打开我们的 harmony, 然后这里面输入 harmony 默认,接着我们往下翻一翻,找到自定义接入 api 的 方式,然后点击进去,然后我们把我们刚才的 s、 u、 r、 l 复制过来,然后下面把 api king 也给复制过来,然后这里点击回车,然后我们查看一下所有的可用 api 列表,好,这里发现智普的 g、 r、 m 这里都有了。

这个就是今天下午刚装好的一套 ai 的 服务器,用的显卡,用的是五零九零的一套显卡,然后像我们的 ai 服务器呢,都会装几个不同的 agent, 比如说千元炮,然后还有爱马仕,然后再又是 opencl 这几种,然后还会内置,我们会内置三个非常好用的 skill 啊。比如说第一个 skill 就是 我们这种 erp 的 erp, 可以 直接对接你的 ai 服务器,然后如果你的 erp 开放 api 的 话,那就可以直接对接,如果不行的话,就可以列成表格,是没有问题的。那么你可以看这里是 erp 给我一些建议,然后你看它会分析你所有的 erp 数据, 因为我的数据非常多啊,这个是个演示数据,并非真实的啊,可以看到他要根据你的所有,然后给你列出来一些他觉得比较重点的地方,然后给你一些分析,然后给你列出来一个很详细的表格,包括给一些建议,这都是 ai 会直接会做给你的,然后包括他说完之后还会再去问你 需要针对某个具体方面具体分析吗?然后这时候你可以根据你想要再问他的问题啊,去问这个是非常方便的。那么其次呢,就是我们的呃一个支付的一个功能,比如说 这就是我刚才去问他的薪酬提升方案是怎么样的,那么这就属于公司的一些内部问题了,比如说你的财务啊,或者怎么样啊,可能有时候需要知道一些事情,那么也可以直接去问 ai, 那 么他也会直接去给你一个很详细的一个表格,然后让你去了解并且使用, 这个比你一个一个人去问,这样的效率要高非常多啊。然后还有个非常好用的 agent 呢,就是关于 wps 的 啊,我就是比如说我们在外谈客户的时候,那么我们可以直接拿出来跟你的 agent 直接说啊,我要做一个合同啊,里面什么 我要做,比如说配置一的合同,那么 ai 会直接帮你把合同做好,放你的手机上,就可以直接跟客户签单了,那么这样是不是非常方便呢?

这个最近这个方面是爱马仕这个项目真的有点火啊,然后我这几天也是上手真正的用了几轮啊,我的感受就是确实还不错, 他火不是没有原因的,很多博主也在聊这个点啊,就是很多意见的问题,不是不能用,而是你用起来总感觉他不够熟,他不够顺手啊。今天啊,你教他一遍,明天可能换个任务,换个场景,他又想重新再开始一遍啊,你很难有一种感觉,这个东西在慢慢的懂我,慢慢的适应我做事情的一个方式,而且啊,这个东西没办法越用越顺手 啊。但是 hermes 这个比较有意思的地方就是啊,它是能够慢慢养熟的啊,就像你的一个电子宠物一样啊,如果非要打个比方,我觉得它可能就像一个菜园啊, 你每次跟它去进行对话啊,不只是进行下一个任务,它更像是在去浇水,去施肥,很多 agent 啊,可能这样这次干完就结束了。但是 hermes 不 一样, 它会把对话里面真正有价值的东西沉淀下来,慢慢的成长成你的 skills, 然后你在用的时候,它就不会是再从一个荒地再开始,你能够直接栽来栽来就用的一个能力。所以说这里就是它最核心啊,最让人上头的一个地方 啊,因为它不是单词执行,它更强调了就是你的学习壁环。官方的说法也非常的直接啊,它会从经验里面创建 skills, 而且 skill 在 后面用的时候会被继续的改进,所以它更像是一个你越用越顺手的一个助理啊。第二点就是它不是一个无脑记忆很多一些的,一说记忆好像很高级,但真正的问题就是它什么都记,最后上下文越读越多,然后你每次会把一大包,然后通过你的一篇发送过去的 top 就 越烧越快。 而每一次比较有意思的就是它不是背的所有东西一起跑,它更强调的是保留关键的信息,就像它的这个长期记忆,还有它的一些用户习惯的一部分, 它本身是有限制的啊,抄了以后它就会重新整理,把真正重要的内容留下来,不是把所有的这种上下纹一起塞进去什么东西是真的有用,它就会尽量可以留下来什么东西,它只是一些噪音,是一些杂物,它就不会让这些东西一直占在地方,这件事情非常重要啊,所以说我在用它的时候,就会让我感觉这几天越用它就会变得越聪明。 第三个点就是他和很多传统的 agent 不 一样的地方,他不是只是这种对话看起来聪明,他不是在当前窗口向很懂你,而是在用久了以后,他慢慢就知道你喜欢怎么做,平时怎么判断事情。所以说这一次我会觉得后面是这波热度啊,不是白来的,因为他讲的不再是一个做 agent 的 壳子,而是在尝试把 a 键的虫能跑,能长期养熟,长期协助这些事情上面推。如果你之前玩过 oppo klo, 你 应该更容易理解这个差别。 oppo klo 的 优点就是灵活自由啊,它它能折腾,就适合这种比较喜欢自己大系统的人,它的开放性会比较好。而后面是让我觉得很有意思的,就是它不是不能折腾,而是它能强调你的这种长期使用的体验。 然后说安装啊,就是这个官方啊,也提供了你的这种长期使用的体验啊,然后说安装啊,就是这个官方啊,也提供了一键安装的方式,如果你是 mac 用户或者 linux 的 用户, 你在官方的这个 gitlab 上就可以直接安装了,直接通过你的命令行安装了啊。如果是你是 windows 用户,你还得准备一个 wsl 这样的一个东西,这个门槛就会劝退一些人,如果 你的这个 windows 系统没有这样的一个环境的话,嗯,就会比较麻烦啊。当然这里我也为大家做了一个 windows 的 适配,我放到了我自己的 gitlab 上,然后我这个会发在评论区,如果你不想自己去配这个环境,你用的是 windows 系统,可以看看啊,我教下大家这个是怎么用的 啊?大家通过评论区打开我的这个连接以后,可以看到我的 get up 的 仓库,我把所有的代码也放上去了,所有都记他原来的,然后复制这串代码,然后打开你的命令。行啊,一定是 bug 秀,在这个里面把这个代码输入进去,然后他就会进入一个安装的界面,他就在逐步安装 好,然后到这个地方他就安装完成了。然后这个时候你需要输入这个 huawei s vien 这个段命令,然后这个命令就是查看你的 huawei s 的 版本。然后如果像我这样啊,在你原来这个对话框里面直接输入的话,他可能会报错,因为他还存留在这个旧的进程里面,所以你这个时候就需要去新建一个进程好, 然后打打开这个新的新的进程输入以后,然后它会显示你这个 herrice 的 一个版本号。嗯,这个时候你其实你整体的这个 herrice 就 已经安装成功了,然后这个时候就要进入到我们的这个配置界面了啊,就输入我们的 herrice 的 setup, 然后这个这个地方有一个比较有意思的,就是官方也是把,就知道很多玩这个的可能都已经也配置好了,所以它就不会再给你重建一个 workbench 或者 啊这种工作区,或者说是你的所有的这个模型让你重新配,然后这里选第一项,你就直接回车,然后他其实就可以直接让你去把所有的 open color 原有的一些配置直接给你接过来。 好,然后这个地方到第二步选择你的这个大模型。啊,我这里用的是 open ai 的 codex 的, 我这里接好以后,好,我们看看后面。好,然后这里就是已经配置完成了,然后就会进到我们这个啊 greece 的 主键面对话界面,好,现在我们发送一个,你好试一下啊,他刚刚开始识别模型会稍微有点慢,识别到我的模型了。

hello, 这一期我们来安装爱马仕 a 准,这是一个跟 opencloud 小 龙虾差不多的一个 a 准, 嗯,区别最大的我觉得不是功能,功能上我觉得没多大区别,最大的区别就是小龙虾它一轮对话必须要完成了,它才能接受你下一轮的对话,然后爱马仕 a 准呢,它就可以 在对话任务过程中呢,你可以中间打断它,插入消息,然后它继续去任务,觉得这是最大的区别所在。 好,废话不多说,我们安装,因为最近爱马仕它已经放出了那个 windows 的 windows 版本,就咆哮版本的一个安装方式就是体验版,但是功能也基本上也比较完善了。那我们先打开项目地址, 我们搜索爱马仕 a 准 h e r m e s 杠 a g e n t 啊,第一个就是 我们往下拉,拉到项目说明,可以看到这边已经有了 windows 版本的一个测试版, 这是早期的一个测试版,那么我们可以直接复制这一行命令,因为因为我这一台主机已经安装过了,所以我们我就换一台主机去进行安装 好,打开另外另外一台主机,打开咆哮,咆哮,我们可以在开始菜单里右键终端管理员,然后打开咆哮,然后把刚才的那一那一串命令 就是这个项目的那,那这一串 windows 的 这一串,如果你不是 windows, 是 linux 或者或者苹果系统的话,你就复制上面这一段, 那我这个 windows 的 话,直接复制这一段,然后再回到你的那个 pro x 上面,把它复制下来,然后直接回车, 回车它就会进入到一个自动安装的一个 过程,我们不需要管它,任何都不需要管它,你只需要保持你的网络畅通就行。这种 a 准,你只需要有网络,它就能避免百分之九十九的问题。好,我们等待它安装完成。 好,到这一步的话,看到已经是安装完成了,他说检测到我的那个有安装 openclock 小 龙虾,问我需不需要从小龙虾来导入数据? 我个人是不建议去从小龙虾来导入数据的,因为容易造成他们两个之间的混乱。 n 是 no, 然后跳过这一步之后呢?我们来到这里,他说这个配置是快速配置还是全配置,那我们只需要快速配置就可以了,先初步跟他对话,后面的功能可以一步一步去添加,然后回车, 回车的话我们那个这边问是否需要设定那个模型的,那个 这边有很多选项,我们直接输入一二三四五,在这边输那个 number 就 行了,那英伟达的话就是八,那我们直接默认就是八, 然后他应该是有检测到我有,就是我的网络环境,我的环境里面有英伟达的 api, 那他的意思问我是不是使用这个自带环境,因为我前面那个 open core 应该有在配置这个 api 的 环境, 如果没有配置没有那个的话,我们就直接选择八,选择八输入你的 api key 就 行了,那默认的话是保持,然后另外的话我重新输入的话,我们直接输输 r 就 行了。 replay, 然后它就教你输入英伟达的 api key, 那 我们把它复制一个进来。 好,我们直接右键,注意只输一次就可以了,因为它是看不见的,那输完右键之后它就粘贴上去了,直接回车,然后这个默认默认回车, 然后它会跳自动的那个检查模型,那我们输入你想要的模型数字,然后我们选择第一个 stefan, 然后直接回车, 这边就是默认使用的工具,保持默认就可以了, 然后消失。这边就是接入飞速啊什么的,我们先不接入,我们选择二跳过回车,然后他问你是不是现在就对话了? yes, 这样就完成了一个初步的安装和配置, 可以看到已经安装完成了它这里会有一个更新,有更新呢,或者说有需要刷新的项目,它会教你运行这个爱马仕 update to to update, 那 我们可以,其实可以不先不管它,先测试一下,看看它整个运行状况通不通。好,可以看到它已经运行跑起来了。 好,我们按照那个设置一下它的那个初尺属性,就你叫什么我我叫什么,然后初尺画就记,可以直接拷贝给它 回车, 做完之后还要让他做做一次传传测试,没要没有问题的话就基本上 ok 了。 好,这到这一步的话,爱马仕的一个 windows 版本的一个搭建就完成了。啊,到这里我忘了补充一下怎么去退出这个爱马仕 a, 准,那我们直接按住 ctrl 加 c 按两,连续按两下, 连续按两下就可以直接退出一个对话。那么我们重新进入呢,就是可以再次打开 call, 然后我们直接在上面输入爱马仕 h e r m e s 然后回车就重新进入到爱马仕的一个对话对话中。 好,基本上使用的话就是这样使用退出,那如果要更新的话,就是刚刚 h e r m e s 要 update, 它就会自动地帮你更新到最新版本。 ok, 这期就到这里吧。

大家好,我是大叔,只说真话,只做实在事,只给干货。大家好,昨晚本来想着早点睡觉了,结果看到后台多了几十条私信,大家都在问同一个问题,就是怎么在同一台电脑上运行多个独立的 hermes agent。 如果用同一个配置,很容易搞 appme, 互相干扰,记忆和绘画历史也混在一起。 hermes agent 提供了 profiles 功能,可以完美解决这个问题。认真看完这篇教程,你将学会创建和管理多个 profile。 三种克隆方式,命令一 p 标志年性默认值的用法, 配置独立网关和机器人令牌,还有更新、导出、导入和删除操作。咱们直接看内容来。先了解一下什么是 profiles。 简单来说,就是一个独立的 hermes 主目录,每个 profile 都拥有独立的配置文件,包括 config 点 emo 点 inviso 点 md, 还有独立的记忆数据库、绘画历史 技能库和状态数据库,这样就能为不同目的运行独立的 agent, 比如变成助手、个人、机器人、研究 agent, 它们互不干扰,完全隔离。最方便的是创建一个叫 code 的 profile, 马上就能用 code chat、 code setup、 code gateway start 这些命令。好了解了概念,咱们看看怎么用。快速开始非常简单,只需要三步。第一步,执行命令 hermes profile create code, 这会创建一个名为 code 的 profile, 同时自动生成命令别名。 第二步,执行命令 coder setup, 按提示配置 api 密钥,选择模型提供商,设置默认模型。第三步,执行命令 coder chat, 就 可以与 coder 这个独立的 a 键开始聊天了,就这么简单,一共有三种,满足不同场景需求。第一种,空白 profile, 执行命令 hermes profile create my bot, 这会创建带有捆绑技能的全新 profile, 然后运行 my bot setup, 配置 a p i 密钥模型和网关令牌。第二种,紧克隆配置,执行命令 hermes profile create work 加 clone 参数, 这会复制当前 profile 的 config 点 emo 点 n v 和搜点 m d 共享相同的 api 秘钥和模型,但拥有全新的绘画和记忆。第三种,克隆全部内容执行命令 hermes pay profile create backup 加 cloneout 参数, 这会复制所有内容,包括配置, api 秘钥、个性、所有记忆、完整绘画、历史技能、定时任务插件、相当一个完整的快照备份。你还可以从特定 profile 克隆,比如, 比如执行命令 hermes profile create work 加 clone 参数,再加 clone from code, 这样就能从 code 克隆配置到 work。 创建好 profile 后有三种使用方式,第一种,命令别名,这是最方便的,每个 profile 在 波浪线斜杠点 local 斜杠被斜杠名称目录下,自动获得命令别名。 比如你可以直接用 code chat 与 code agent 聊天,用 code setup 配置 code 的 设置,用 code gateway start 启动 code 的 网关,用 code doctor 检查 code 的 健康台,用 code skills list 列出 code 的 技能。第二种,使用 p 标志,这是最灵活的执行命令 hermes 加 p code 再加 chat, 或者执行命令 hermes 加 profile 等于 code 再加 doctor, 甚至可以在查询时指定 hermes chat 加 pcode 加 q。 后面跟 hello。 这种方式适用于任何命令。第三种,粘性默认值,最适合长期使用。执行命令 hermes profile use code 之后执行 hermes chat 就 默认针对 code 执行。 hermes tool 也是配置 code 的 工具,如果想切换回默认执行命令 hermes profile use default 这类似于 quebeco configuruse context 的 使用方式。另外, client 会实时显示哪个 profile 处于活动状态, 提示符会显示 code 加右键头符号,启动时会显示 banner。 执行 hermes profile 命令会显示详细信息。 接下来讲讲如何运行 gateways。 每个 profile 可以 作为独立进程运行。自己的网关拥有独立的机器人令牌,每个 profile 都有自己的点音频文件,可以配置不同的电报 discord slack 机器人令牌最棒的是安全令牌所机制。如果两个 profile 要意外使用相同的机器人令牌,第二个网关将被阻止,并显示清晰的错误信息, 这样可以避免冲突。启动不同 profile 的 网关很简单,执行命令 coder gateway start 启动 coder 的 网关。执行命令 assistant activate taway start 启动 assistant 的 网关,它们是独立进程,互不干扰。如果需要持久化服务,可以执行安装命令。执行命令 coder gateway install, 这会创建 hermes gateway system d 或 launched 的 服务。 同样,执行命令 assistant gateway install 创建 hermes gateway assistant 服务。支持的平台包括电报、 discord, slack, whatsapp 和 signal 都支持令牌锁定机制。 每个 profile 都有自己的配置文件,主要包括三个文件,第一个是 config 点 emo, 这里配置模型提供商,工具级以及所有设置。第二个是点硬币文件,存放 api, 密钥和机器人令牌。第三个是 c o 点 md 文件定义个性和指令。配置模型很简单,执行命令 code config set model, 点 default antropics 斜杠 close on the four。 设置个性的话,可以用 e q 命令。执行命令 echo 后面跟双引号 u r a focus coding assistant 点双引号, 然后从定向到波浪线点 hermes profiles coder 目录下的搜点 md。 如果需要设置工作目录,执行命令 coder config set terminal, 点 cwd, 后面跟上项目的绝对路径。这里有个重要提示,搜点 md 可以 指导模型,但不强制执行工作区边界, 如果需要可预测的起始目录,请显示设置 terminal 点 cwd。 最后讲讲如何更新和管理 profiles 更新非常简单,执行命令 hermes update 这会拉取一次共享代码,然后自动同同步新捆绑技能到所有 profile, 用户修改的技能永远不会被覆盖。管理命令也很丰富。执行命令 hermes profile list 执 行命令 hermes profile coder devbot 显示一个 profile 的 详细信息。执行命令 hermes profile rename coder devbot 可以 从命名 执行命令 hermes profile export code 导出为 c, 点 t r, 点击 z。 执行命令 hermes profile import code 点 t r, 点击 z, 从规章导入。 如果需要删除 profile, 执行命令 hermes profile。 delete code 需要输入 profile 名称确认,也可以使用加 yes 参数跳过确认。删除操作会停止网关移除 systemd 或 launch 的 服务, 移除命令别名,并删除所有 profile 数据。另外还支持 tab 补全。对于 bash, 执行命令 evo 后面跟双引号,美元符号 hermes completion bash 双引号。 对于 zsh, 执行命令 evo 后面跟双引号,美元符号 hermes completion zsh 双引号。好了,今天的分享就到这里,咱们回顾一下核心功能。第一,独立运行在同一台机器上运行多个独立 agent, 每个都有独立的配置 api 秘要记忆绘画技能和网关状态。第二,灵活创建,支持空白创建,仅克隆配置克隆全部内容三种方式满足不同场景需求。第三,便捷使用,提供命令别名、 b p 标志、年性默认值三种使用方式,克莱实时显示活动 profile 状态。 第四,安全管理,每个 profile 独立运行网关,支持令牌锁定机制,防止冲突。提供完整的更新管理和删除功能。如 你需要在同一台机器上运行多个不同用途的 groupon agent, 比如编程助手、个人机器人研究 agent。 强烈建议使用 profiles 功能实现完全隔离,这样可以避免配置和状态混乱。我是大叔大实测验证并整理,后续会持续革命性 session 的 相关内容,感谢观看,咱们下期再见!

如何在 hermes 当中配置多 agent, 实现不同能力的 agent 讨论同一件事情或执行同一件事情,类似于这个样子,比方我建立一个产品方案讨论时,我在里面创建了四类角色,当我去发布一个事情的时候,我可以艾特指定角色进行回复, 也可以让其中有一个角色调动其他人,这样就很具想象力的。那怎么设置?总共分为三步,第一步,在这个页面里面我们去创建用户,相当于就创建一个 agent, 点击这个地方, 你只要去定义他的名称就好了。第二步,很关键的事情,你需要去定义他能做什么,比方说我定义第一个产品经理,他的身份是什么样子,他能做什么已经不能做什么。 第三步,我们就只要在这个群聊里面去建立这样一个场景,把不同角色的人去拉进来,类似于这个样子,你把刚才创建好的这个身份去把它添加进来,这样一个群就创建好了,很简单,对了。

今天我想聊一篇关于 harmis agent 多入口架构的文章。一个 agent 的 项目做到后期,核心能力已经不只是命令型问答了。 用户希望他能跑在终端里,也能接 telegram, discord slack, 还希望有更现代的 t u i, 甚至能被编辑器或 api 调用。这时候最容易走错的一步是给每个入口都写一套 agent。 hermes 没这么做,它的核心思路是 a 键 loop, 尽量统一入口层,各自处理交互形态。 我们先看 hermes 的 核心拆分, ai ai 证负责构建 system prompt, 管理对话历史调用模型,执行工具处理上下文压缩,还有 memory to do、 session 等状态管理。 但用户如何输入,如何展示,如何审批危险命令,如何恢复绘画,这些并不属于 ai agent。 t i 点 p y 面向交互终端处理 prompt 下划线、 toki 输入和 rich 展示 getway, 面向消息平台处理平台 adapter 和异步消息。 t u i 面向液体界面, tapisk 负责渲染, python 负责 agent 逻辑。这个拆分很关键,如果把所有 u i 逻辑都塞进 ai agent agent loop 会变得无法维护。 classic c l i 是 最后的本地入堂,赫尔氏科一管的事情非常多,加载配置你人情 睡至完啦,贵惯的数据太特别,自带太特别,这种对网关的酒肯定非常的追震。 输入历史与使命 ai agent 维护对话历史处理各种 slash commands 处理图片附件和剪贴板处理审批和密码输入,退出时清理资源,写入 siit 三审。 它承担的是完整的本地产品体验,而不是 agent 推理本身。 c l i 的 一个重要特征是它和用户在同一个 terminal 里实时交互。危险命令审批、 soluto 密码、 secret 输入都可以通过 prompt 下划线。 tokyo 在 本地阻塞等待、 德瑞面向 charlie、 greg、 discord、 slack、 whatsapp 等平台。它和 c l i 最大的不同是长期运行的后台服务, 这带来很多问题。多个平台同时连接,多个聊天同时发消息,同一个 session 可能跨很长时间继续,用户可能在 a 阵正忙时继续发消息。危险,命令不能用 terminal point, 要通过消息平台审批。 其中最值得注意的是 agent cache 机制, data 会按 session 缓存 ai agent 时利用来保留 point caching。 如果每条消息都创建新的 ai agent, 就 会重建 system prompt, 破坏 provider 的 prefix cache, 成本会大幅上升。 所以 data 不是 每条消息新建一个 agent, 而是用 session key 映射到缓存的 agent 时,历 该会下。不能只用一个 session 下划线 id, 因为消息平台里同一个用户可能在不同群、不同 thread、 不 同平台里和 agent 对 话。 comis 用 session 下划线 key 作为核心,抽象格式是 agent main 平台聊天类型聊天 id session store 会根据来源生成 session key, 再映射到真实的 session 下划线 id。 这个设计的好处是,平台路由使用稳定的 session key 数据库存储,使用 session id resume 可以 把某个 session key 切到已有 session id reset policy 可以 按平台和聊天类型生效。 session key 不是 装饰质段,而是 getaway 运行时的主键。 多路口系统很容易出现命令漂移的问题。 c l i 有 某个命令,挑了官,帮主里没有 slack 支持某个命令。 c l i auto complete 又忘了别名 hermes 用 c o m m a n d 下划线 r e g i s t r y 解决这个问题, 每条命令是一个 command def, 包含名称描述,分类,别名,参数提示,还有 k i i 下划线 only 和 getaway 下划线 only 等标志。 然后所有下游都从这里派生。 c l i help getaway help telegram 命令菜单 select 命令映设,自动补全命令解析, 新增命令的主要动作是先加 command def, 再在对应入口接 handle, 这就是中央注册表的价值定义,统一暴露可控。 hanis t u i 拆成了 node 和 python 两个进程,域态是 increact, 负责终端 ui 渲染。 t 太下划线,该位是 python j s o n r p c backend, 负责 agent 逻辑和工具调用,这不是多此一举,而是非常务实。 ink 更是合作复杂终端 ui。 python 进程已经拥有 hems 的 agent 和工具生态, 强行把 agent 移植到 node 代价太大,强行用 python 复刻现代 tui 体验又很难做好。 还有一个重要细节, python stodo 被重定向到 stare, 保留真实。 stodo 专门写 j s o n r p c 防止普通 print 污染协议通道。 t u i 里还有个 slash worker, 是 一个持久的 c l i support, 专门执行 slash command, 最大限度附用 c l i 逻辑。 horis 多入口架构的启发很实际,不要把 agent 做成 u i, 也不要把每个 u i 做成一个 agent。 更好的方式是, agent 是 能力内核工具系统是统一执行层, session, db 是 历史事实层, command register 是 控制面。 c i gateway t u i 是 不同交互外壳 入口可以继续增加,但核心能力不需要复制。代价是入口层会变厚,但这是合理复杂度, 真正应该避免的是把交互复杂度推回 ai agent, 或者在每个入口层会变厚,但这是合理复杂度,真正应该避免的是把交互复杂度推回 ai agent loop, 用统一内核承载能力,用入口适配器承载体验,这就是一个 agent 从 demo 走向产品时必须跨过的架构分界线。我是林深健, ai 我 们下期再。

帮朋友们在 get up 上挖了一个宝藏级的相貌,养龙虾或者用哈姆斯的朋友都知道,我们要让他们搜一些专业的数据或者资料,用 web search 基本是拿不到专业数据的。但如果我们介绍这个 scar 拿到的数据会让我们眼前一亮,他几乎支持市面上所有主力的 agent。 先给朋友们看看哦,用他和不用他拿到的数据有什么不同?我先让我的 harmes 不用 any sorch, 全网搜索二零二五年选科委历史化学生物科目推荐的五十个专业,并给出未来的就业方向。他开始了哦,我们等他出结果 来了,这是他没用 any search 给的数据。现在呢,我用同样的提示词让他使用 any search, 我们等他出结果啊来了。后面我们看到他给的建议,因为呢,数据太多,所以呢,我直接让 harmers 把这两板数据做一次颗粒级的比对,用表格呈现出 对比结果。这是最终的结论啊,在十个对比维度中,报告二胜出六个,持平四个,并且呢,他有四个核心差异。 其实啊,如果朋友们也想用上这个项目,安装呢,非常简单,我以 hammers 为例,手把手带朋友们走一遍。我们在他的 redmi 文件中呢,找到这个 for hammers, 然后按照指引拿到他的文件包。我把我的 hammers 的模型先切换到 dipsec vs pro。 现在呢,我们复制我们包文件的绝对路径,直接丢给 hammers, 给他说这句话啊, 看,他开始了。在他执行任务的过程中呢,我们去拿一下他的 a p r k。 我们进到这里啊,点击一下,快速集成,点击获取 a p r k 新建密奥,我们开一个新的中段,写入环境变量,我们回到 hammers, 告诉他已经写入环境变量,让他读取看。这样呢,就全部配置结束了。是不是很简单?我现在让 hammers 帮我制定一份计划,探索一下他的能力边界 来了。它的重点呢,在于垂直领域的覆盖和垂直搜索。所以呢,以后我们要想拿到更加专业,更垂直的搜索结果,那爱丽丝是一个非常不错的选择。

大家好,前几期大家对 hermes agent 已经基本入门了,今天要跟大家讲解一下系统性的东西,也是它的核心点。内容包含主配置的关键配置,从 hermes slash 目录结构到 config org org md 的 核心设置, 一次性给大家讲透,咱们直接进入正题,先看看 hermes 的 配置目录结构,所有配置都存在波浪线斜钢 hermes 斜钢目录里,方便访问、管理和备份。这个目录下有几个核心文件,第一个是 config dot emo, 主配置文件管模型、终端 t t s 这些设置。 第二个是 ib 文件,存 a 片密钥和敏感信息。第三个是 author jon o o 凭证,比如 news portal 的 认证。第四个是 so dot md a 键的身份定义占系统提示的第一位。第五个是 memories 文件加持久化记忆,有 memory dot md 和 user dot md。 第六个是 skills 文件加管,定时任务 sessions 文件加管,网关绘画 logs 文件加存,自动脱敏的日制。 记住一点,所有配置都在波浪线斜杠 hermes 斜杠目录里,方便统一管理和备份。目录结构清楚了,那具体怎么管理这些配置? 接着看 hermes 的 配置管理命令,很方便。想看配置,在终端输入 hermes config 就 能看到当前所有配置。想编辑的话,输入 hermes config editor。 想设置配置,用 hermes config set kz 为 vl, 比如设模行为 anthropic 斜杠 cloudops 是。或者设中后端为 docker, 检查配置有没有缺失,跑一下 hermes config check, 想交互是添加缺失选项,用 hermes config me great。 设 api 密钥时,输入 hermes config set open router api k y k r 会自动存到 in v 文件里,这里有个很实用的特性叫智能路由。 hermes config set 命令 会自动把值存到正确的文件 a p i 密钥存到因微其他设置存到 config 的 emo, 这样就不用担心把密钥物写到配置文件里了。配置管理命令讲完了,那这些配置的优先级是怎样的?往下看。 hermes 的 配置优先级从高到低分四层, 第一层, client 参数优先,即最高,比如跑 hermes chat model enterprise, 斜杠 cloud sonit 四,这次调用会覆盖其他所有配置。第二层, config 到 emo 文件组,配置文件管所有非秘密设置。第三层, indiv 文件环境变量回退存必须的秘密信息向 api 密钥,令牌密码。第四层,内置默认值,啥都没设的时候会用硬编码的安全默认值。有个经验法则要记住秘密信息,比如 api 密钥, 机器人令牌密码放 indiv 文件,其它设置像模型终端后端压缩设置内存限制,工具级放 config 到 emo 文件,两者都设了的话,非秘密设置以 config 到 emo 为准。 另外, config edu 里可以用美元符号大括号 var name 引用环境变量。比如 auxiliary 的 vision 配置里 api key 设成美元符号 google api key base url 设成美元符号 custom vision url。 注意,只支持美元符号大括号 var 的 语法,不支持裸美元符号 var 优先即清楚了。接下来看看终端后端的配置。 hermes 支持七种终端后端决定 a 阵的需要,命令在哪执行。 第一种是 local, 直接在你机器上跑,没隔离,适合开发和个人用。第二种是兜客,在兜客容器里跑,完全隔离安全。沙乡环境。第三种是 s s 区,通过 s s h 连远程服务器, 跨网络边界,适合远程开发。第四种是 model model 云,沙乡云端虚拟机,适合临时计算。第五种是 dayton 的 dayton 的 工作区托管的云环境。第六种是 versa sandbox versa 沙乡云微虚拟机,支持快造词久化。第七种是 singularity 容器,适合高性能计算集群和共享机器。拿 docker 后端举例,你可以在 config dot emo 里配 docker image, 指定用 nicole 斜杠 python node js 冒号 python 三点一一 node js 二零镜像,还能配 docker forward env 转发还变量像 gitupoken 配 docker volumes, 把本地目录挂到容器里,还能设 container cpu, container memory 以及 container persistent, 要不要持久化?容器终端后端选好了,接下来看看记忆系统怎么配。 hermes 的 记忆系统得先分清记忆和技能这两个概念。 记忆存的是事实,向你的环境偏好项目位置, it 学到的关于你的事。技能存的是过程向多步骤工作流工具、特定指令可附用的配方。 简单说,记忆管是记忆性能或者什么。记忆系统有两个核心文件,第一个是 memory dot md 持久化记忆文件, memory enable 设为 true memory char limit, 设呃两千二百字,大概八百个 token。 第三是两千 dot md 用户档案文件 user profile enable 设为 true user char limit, 设一千三百七十五字符,大概五百个 token。 有 几个记忆管理技巧要知道,第一 记忆容量有限,大概两千两百字,幅满了 agent 会自动整合。第二,你可以跟 agent 说清理你的记忆或者替换旧的 python 三点九笔记,我们现在用三点一二。第三, productive session 结束后跟 agent 说,记住这个已被下次使用。第四记忆是冻结快照, session 里的改动要到下一个 session 才会在系统提示里出现 记忆。系统讲完了,接下来看看最重要的 so dot md 文件。 so dot md 是 agent 的 主要身份定义,占系统提示第一位,完全替换内置默认身份文件,位置在波浪线斜杠 hermit 斜杠 so dot md 或者美元符号 hermit home 斜杠 so dot md。 如果 so dot md 没了,空的货架再不了, hermes 会退回内置默认身份, hermes 会在文件不存在十自动生成默认的 so dot md。 你 可以编辑 so dot md 来自定义 a 键的身份。比如,你是个专业的 ai 助手,专注软件开发和技术咨询。性格特点包括耐心细致, 善于解释复杂概念,注重代码质量和使用实践,乐于学习和改进。专场领域包括 python、 javascript、 type script 开发、 devops 和云计算系统架构设计。 hermes 用两种不同的上下文范围,第一种是 soul md, agent 的 主要身份始终独立加载。第二种是项目上下文文件,像 hermes md 或 hermes md。 项目特定指令优先级最高。还有 agent start md 也是项目特定指令和编码约定,会递归便利目录以及 cloud dot md clock 的 上下文文件只在工作目录生效。注意,项目上下文文件用优先级,系统只加载一种类型,首 次匹配获胜。 so dot md 讲完了,最后看看技能系统,技能系统用来存过程性知识,什么时候该建技能,如果你发现一个要五步以上还会再做的任务,就让 agent 给他建个技能。比如你可以跟 agent 说,把你刚才做的纯成名叫 deploy staging 的 技能, 下次只要输入斜杠 deploy staging, agent 就 会夹在完整流程技能的位置。在波浪线斜杠、 hermes 斜杠、 skill 斜杠目录下,每个技能是个文件夹,里面有 skill dot md 文件和 scripts 子文件夹 技能。用 skill manage 工具管理, agent 创建的技能会自动存在 skills 目录里。技能有四个好处,第一,程序性记忆, agent 创建并附用的流程。第二,跨 session 持久化,所有 session 都能用。第三,自我改进, agent 用着用着会优化技能,一键调用书写纲, skill name 就 能快速执行。 核心内容讲完了,最后总结一下,回顾一下 harmony agent 配置的核心要点。第一,目录结构,所有配置存在波浪线斜杠、 harmonies 斜杠目录里包括 config comfy 等文件。第二,配置管理,用 hermes comfy 命令查看编辑和设置配置智能路由到正确文件。第三,优先级规则, client 参数优先级最高, 然后是 config comfy, 再是 in v, 最后室内自默认值。第四,七种终端后端按需选合适的。第五,记忆系统, memory dot md 存时是 user dot md 存用户档案,容量有限,但能管理。第六, stored md 定义, a 证的身份,占系统提示第一位,可完全自定义。 第七,技能系统纯过程性,支持五步以上任务键,一键技能支持一键调用。如果你再用 hermes agent 或打算部署 ai 助手,建议仔细看看官方文档,合理配置各个模块, 用起来会更稳定、更个性化。我是大叔,大实测验证并整理。如果你觉得这个配置指南有帮助有用,请点赞收藏,后续会持续更新 hermes agent 的 相关内容,感谢观看,咱们下期再见!

面试官问你 agent 和 workflow 的 区别,如果你脱口而出说只要系统调用了外部 a p i, 或者用了搜索工具,就是 agent。 恭喜你,这场面试基本凉了。 如果这层底层的核心逻辑没理清,哪怕你后面的思路全对,也会被当场刷掉。嗨,大家好,我是小哲,关注、点赞加收藏,我们马上开始今天的讲解。很多同学在做大模型项目的时候,脑子里的第一反应就是写个程序,先去调个搜索接口拿数据,然后再把这些数据丢给大模型去声称回答。 大家往往觉得,既然大模型都用上工具了,那这恰恰是被面试官嫌弃的致命死穴。大家想想为什么? 因为你写的这个系统本质上还是个按部就班的流水线。虽然他干了活,但第一步干啥,第二步干啥,全是你提前在代码里定死的,只要碰到一丁点超出预设的意外情况,他直接就报错崩溃了。 那咱们的破局点到底在哪里呢?其实你只需要向面试官抛出一个超级惊艳的核心概念,就能瞬间拿捏全场,那就是到底是谁在握着方向盘。 workflow 就是 程序员提前画好的死板导航路线,而 agent 则是给了大模型一个终极目的地,让他自己当老司机,边开边看动态决策。 那咱们在脑海里跑一个极其简单的例子,假设现在咱们要设计一个系统,去帮老板买杯咖啡。 如果是 workflow 工作流模式,系统的脑子里就是一张死板的任务表。大家想,第一步走到楼下咖啡店,第二步,点一杯冰美式,第三步,付钱拿走。 听起来非常丝滑对不对?但如果今天这家咖啡店突然关门了呢? workflow 就 傻眼了,直接报错,卡死在那,因为它的预设步骤里没有应对关门的方法。那如果是 agent 模式呢?大模型接到的只有一个目标,也就是老板必须喝到咖啡。 第一步,他跑到楼下,发现店关门了。这时候大模型开始自己动脑子了,他观察到当前的状态是原定计划行不通。第二步,他自主决定,掏出手机打开外卖软件。第三步,他开始搜索附近其他的咖啡店,还对比了一下送达时间,最后挑了一家半小时内能送到的店,直接下单。 大家看画面出来了没有?在这个过程中,没有任何人提前教大模型遇到关门该怎么处理它,完全是根据当下的环境,反馈自己,一步步想出的破局对策。 所以咱们一句话总结这道题,判断一个系统是不是 agent, 根本不是看它有没有用工具,而是看大模型有没有对下一步行动的绝对决策权。 在真正的大厂工程实践里,最成熟的做法从来不是二选一,而是混合双打,用 workflow 去管住主流程的底线,保证可控和安全。然后在那些需要灵活探索的局部节点放手,让 agent 去尽情发挥。只要你能把这个核心思想拔高出来,这道题你绝对能拿满分。 最后留一个简单的课后思考题给大家,你们觉得咱们平时在网上购物遇到的那些自动回复机器人,他们到底是 workflow 还是 agent 呢?欢迎在评论区打出你的答案,一起互动交流。今天的视频就到这里,我们下期见,拜了个拜。