当 ai 工具还在比拼单次调用多聪明时,一个更值得关注的变化正在发生。有人用五美元在自己的服务器上养了个会跟着你成长的 ai 助手,他叫 hermes agent。 今年二月开源后, get up 新标数狂标至四万两百四十多名开发者疯狂贡献代码,平均不到一周迭代一个大版本。与依赖云端的 open cloud 不 同,他像个常驻员工, 记住你的工作习惯,把重复任务写成 s o p, 甚至能把经验反哺模型训练。这场从即用即走到私有进化的转向,或许正在重新定义我们与 ai 的 关系。当 ai 真正住进你的终端,数据主权和长期价值终于回到用户手中。 一开源 agent 的 逆袭从工具钓用到员工式陪伴在 ai agent 赛道, open club 曾是许多人的首选。云端托管即开即用,像个随叫随到的实习生。但用户渐渐发现问题,每次对话像重新认识复杂任务,需要反复解释 数据存在、平台、服务器隐私和所有权都是未知数,按调用次数付费,长期使用成本堪比雇个兼职。 hermes agent 的 出现恰好戳中了这些痛点。作为 news research 推出的开源项目,它最核心的定位是运行在你服务器上的自主 agent, 这意味着你的数据、记忆、技能沉淀全在自己手里。 从二月底上线到现在,他在 get up 收获四万星,合并一千四百个 p r, 贡献者超两百四十人, 这样的社区活跃度甚至超过了许多商业产品。切到 hermes 太爽了,比 openclaw 响应快太多。有开发者在 reddit 感慨,更让非技术用户惊喜的是, v 零点四点零版本无需代码,毫无麻烦。 这种低门槛加高自主性的组合,让它迅速成为替代 openclaw 的 热门选择。但真正让行业关注的不是替代,而是它开创的新范式。 ai 不 再是工具,而是能积累经验、持续进化的数字同事。二三层闭环,让 ai 从单次聪明到持续成长。 hermis agent 的 成长能力藏在它的内置学习闭环里。 简单说,它能从经验中提炼技能,用技能优化行为,再把行为数据反哺模型。这套逻辑像极了人类员工的复盘,改进成长路径。第一层,记忆层,让 ai 永不失忆。 传统 agent 对 对画像鱼的记忆,下次调用就得重新交代。背景 hermes agent 通过 memory md 和 user dir md 两个核心文件解决这个问题。 前者记录环境信息、历史教训,后者存储用户偏好,配合 f t s 五跨绘画剪辑,它能随时调取几周前的对话, 就像老同事记得你的所有习惯。第二层,技能层,自动把经验写成操作手册。当 agent 完成五次以上工具调用的复杂任务,会自动把过程提炼成结构化 skill 文件包含操作步骤、常见陷阱、验证方法, 下次遇到类似任务直接调用 skill, 不 用从头推理。更绝的是,它会在使用中迭代技能,如果发现更优解乏, skill 文件会自动更新。有用户反馈 agent 两小时内生成三个 skill 后,重复性任务效率提升百分之四十。 第三层,训练数据层,让经验反哺模型。最具野心的是第三环 agent 日常的工具调用记录会通过批量轨迹生成和 atropose 强化学习环境变成训练数据记忆沉淀为技能,技能使用产生数据数据再训练模型。 这条记忆技能数据模型的炼录,让 ai 的 进化不再依赖厂商更新,而是用户自己喂出来的。 nose research 联合创始人 jeffrey cossnell 曾演示用 hermes agent 自主完成七九万字小说,跨多个绘画,全程无人工干预。 这背后正是三层闭环在起作用,记忆、记住写作风格,既能沉淀蓄势结构数据反哺模型、优化表达, ai 真的 在边做边学。 三五美元的赛博员工,从技术玩具到生产力工具,五美元就能养,是 hermes agent 最打动人的标签之一。一台每月五美元的 vps 服务器就能跑起来,闲置时几乎不花钱。 如果你有 gpu 集群,性能还能拉满。更灵活的是多端互通,通过 telegram、 discord、 飞书等平台, 你在手机上发段语音,电脑终端能无缝接着聊,出门前让它监控数据,回家打开浏览器就能看结果。目前最火的应用场景是自动化情报监控, 有用户用它搭了套开源 ai 趋势日报,每天自动抓取 reddit 和 x 上的热点,生成结构化报告,推到手机,相当于雇了个二十四小时值班的情报员。 对开发者来说,它更像带记忆的编程搭档,记得你的代码库结构、命名习惯,甚至部署流程。配合六种终端后端,你可以把它丢在云端 v m 上持续干活儿,自己去处理更复杂的问题。 但真正让社区兴奋的是 agent 联邦通信,不同框架的 agent 能互相委派任务,比如让 hermes agent 处理数据爬取,再把结果交给 openclaw 做深度分析,未来多个专业化 agent 组队分工,可能会像数字团队一样写作。 四、训模型的人做 agent 技术基因决定的降维打击 hermes agent 的 爆发并非偶然开发他的 news research 二零二三年成立团队二十人,累计融资六千五百万美元,创世人均来自大模型研究一线。他们此前的作品是下载量超五千万次的 hermes gnomes、 psychik 开源模型家族。 这群训模型的人做 agent 有 个天然优势,太懂大模型的脾气。他们知道模型在工具调用时容易犯什么错,也清楚如何用工程手段弥补。 这解释了为什么 hermes agent 的 版本演技如此务实。 v 零点五点零聚焦安全加固 v 零点七点零提升长期运行能力 v 零点八点零才推进智能化。一个要二十四小时驻留服务器的 agent, 最大的敌人不是不够聪明,而是跑着跑着崩了。 news 团队的判断戳中了本质, 稳定性、安全性才是私有 agent 的 生命线。五、私有 ai 的 自进化时刻数据主权与个体生产力的觉醒当云端 agent 还在比拼单次调用成本时, hermes agent 已经指向了更根本的问题, ai 的 所有权。 传统模式下,用户的数据、记忆、技能沉淀都留在平台,相当于给别人打工,还帮着攒经验。而私有 agent 让这一切回归用户,你的 ai 用你的数据位大,只服务你一个人。这种转变的意义远超工具本身, 它意味着个体生产力的解放,不再依赖厂商更新,不再担心数据泄露,甚至可以用自己的 ai 反哺模型进化。有网友调侃,以前是我用 ai, 现在是我养 ai, 这感觉像养了个会赚钱的数字宠物。 当然,它目前还不是通用 ai 成长陷于技能和记忆层,模型本身的天花板仍取决于接入的大模型,但开源社区的力量正在加速突破。围绕 agent skills i o 开放标准,第三方已经长出技能市场多 agent 管理面板, 当越来越多开发者参与进来,这条私有 ai 自进化的路只会越走越宽。结语,五美元的服务器,四万星的开源项目,两百四十人的协助社区, hermis agent 的 故事, 本质上是一场技术民主化的实践,把 ai 的 进化权从大厂手里夺回来,交到每个用户手中。当你能用一顿早餐钱养一个记得你懂你,为你持续成长的 ai 助手, 或许我们终于可以说,私有 ai 的 时代真的来了,而这可能只是开始。
粉丝7294获赞29.0万

听说爱马仕也出 agent 了,而且还要跟 open core 正面硬刚?你别误会啊,我说的这个爱马仕不是卖包的那个,是最近 ai 圈的当红榨汁机 hermes agent, 它是 news research 做的一款会自己净化的 ai agent 系统, 上线 qq 号没多久就直接冲到了四万多, stars 这两天的趋势榜还拿到了第一名。今天这条视频呢,我分两部分给你讲。第一部分呢,我帮你讲明白它是何方神圣。第二部分呢,我带你把这个 agent 装到你的电脑上。我们先来搞清楚一件事情, 现在都在说它能够代替 open core, 是 真的吗?那它到底厉害在哪里呢?我们说你现在用的这些 ai, 不 管是 touchp t, jama 的 豆包,还是 dipshit, 它们都有一个共同点,就是你给他指令,他 帮你做了,做完呢,这一轮就结束了,下一次再来。本质上呢,是从头开始,但 hermes 不是 这个逻辑,他每次帮你做完一件事,他不会直接就停了,他会复盘一下刚才这件事我是怎么做到的,哪里做得好,哪 哪里还需要改进。然后他会把这一整套做法整理成一个 skill, 下次再遇到同类的事情的时候,他不会从零开始,而是直接调用这个 skill 来做。而且不止这样,如果你中间改了他的结果,或者呢,他发现有更好的方式,他会把这套 skill 再点。 别带一个版本,你用久了就会发现一件事情,它不是在重复干活,它是在不断的进化,这就是它最核心的地方,内循环学习系统,也就是 build learning loop。 那 这个时候你再看 open crawl, 它们的差别就出来了, open crawl 更像一个你自己搭出来的系统,你可以往里面装工具,接平台,然后 通过配置让它变成你想要的样子。但这里有个前提啊,这些 skills 基本都要你自己去弄,要么你自己写,要么你用别人做好的。换句话说,你是在一点点把它训练出来,所以我们才说养龙 虾嘛。 the hermes 是 反过来的,他很多的能力是你用着用着他就自己学习出来了。但说句实话,我们真没必要二选一,他们各自的侧重点不一样, open call 负责把能力搭起来,把系统接好, m s 负责在后方呢,慢慢把这件事情越做越顺,你如果把它们组合起来用,可能才是更好的选择。好了,讲到这里,如果你已经有点感觉了,那我们直接来点实在的, 把它装到你的电脑上。那在安装前,我们先看一下它的官网,还蛮好看的,很最终幻想的感觉。我们再看一下它给哈的爵乐现在是多少星了哇,现在已经差不多五万星了,真的升的很快啊。 我们再看一下它官方的指导文档。那这边就介绍一下这款 agent building learning roof, 就是 那个内置循环学习系统,它一个很便宜的几十块的 vbs 就 能够装上了。然后这边有一些指导是怎么装的, 六十秒就能够搞定,我们来试一下。那我们现在来到官方的安装命令行这边,无论是 linux、 mac 还是 windows, 只要用这一条命令行就行了。 是值得注意的是,如果你是 windows, 你 记得在 wsl 这个环境下去安装,那我复制了以后呢?打开我的终端,然后直接在终端上粘贴这一行那一行,然后直接回车, 你就可以等待它安装了。 ok, 它已经开始安装了,它验证到我是 mac 系统。然后呢,现在在查找这个 uv package, 就是他会看一下我电脑中有没有他需要的依赖环境,没有的话呢,就会帮我安装。他已经在安装的过程中了,在这个过程中呢,他会不断检查我的依赖,然后帮我安装。你看打了勾的就是已经安装好的,那这些箭头呢?就是正在 check in, 再查一下,然后等一下帮我安装, 只需要耐心的等待就行了。他现在又安装了其他东西,反正你不用理他,也不用看懂他,他会自动帮你搞定的,然后他继续在安装当中。很快啊,就是刚刚卡了一下网络,调整了一下, 现在快了很多了。那官方说的六十秒到底是怎么个六十秒法呢?然后他在一步步的安装,后面就快很多了。第一次安装呢,他肯定要有很多的依赖需要去部署一下的, 如果你后面需要重新安装或者怎么样,他可能就快很多了。好了,在这一步我们看到就是他的室内环境已经准备好了,然后呢,他就安装了所有的依赖,这些依赖包已经 ok 了。现在安装的是 noj s 的 依赖,那其实他这个 hermes agent 还蛮多东西要安装的。 no j s 的 全部依赖安装完以后,他现在帮我安装的是这个自动化的浏览器引擎,那我们会看到它这个浏览器的安装是失败,但没关系,它不会影响它的核心呢,我们现在已经进入了下一步了, 那我们来到这一步呢,其实证明你的 amis agent 呢已经安装成功了,现在呢只是一些配置的引导。那这里他其实说的就是他看到我的电脑当中呢,已经有 open call 了,问我要不要呢,导入一些 open call 的 配置,他现在问我就是你要不要看一下可以导入什么?那我就看一下吧, 那我们浏览一下到底它可以导入什么? what import, 就是 这些 so 啊, memory 啊,这些 and 文件,还有你装的这些 skills 就 可以导入,然后这个会跳过的就是这些可能是它不兼容或者我没有的东西,它就会跳过,然后它就说就是,呃, 这些设置它不会说一比一的。来到这个 hermes 的 这个环境,我觉得我并不需要这些配置,我想搞一个新的来玩一下,那我直接用 no 吧,然后来到这个界面,他就问我要不要快速的安装,我觉得快速的安装就 ok 了, 直接就选择第一个,然后回车。那来到这个界面,他是让你选择哪个 ai 的 供应商。那我今天看到了一个新闻呐,就是说小米呢,已经接入了 hermes agent, 就 可以免费用两周,那怎么使用呢?就是通过这个 newspot 就 可以了。那我们回到这个终端,这里看到了第一个就是了,确定一下,那来到这个界面就是你可以通过这些跟他就是进行对话,这个界面就是选择你跟他的通信工具。我看一下有没有飞书, 微信都有,居然没有飞速,那我先不搞了,我先回到上一步, ok, 来到这一步,我直接按 y 通过终端来跟它兑换一下。噔噔,我们已经安装成功了,这个界面真的挺帅的。 hermes agent, welcome to hermes agent。 可以在这边输入你的一些命令。那我在这里输入你是谁?那我发现他就说我还没有配置,就是那个 ai 的 供应商。那我刚刚不是配置了小米那个免费的吗?那经过我的测试发现一个问题,这个免费呢?其实它不是真的免费的, 所以说小米官方说能够限免两周,然后我确实在这个 model 收到的小米确实是零元的,但有一个问题,你要添加这个 api key, 它会显示一句话,意思就是说必须先买它这个订阅, 然后才能够使用免费。就是小米它本身确实是免费两周,但你得订阅它这个 news portal, 然后才能够使用小米,所以就是不免费。用它干嘛呢? 我们用自己的 api key 就 好了。那解决方法也很简单,那我们输入这个 mini, 然后进入这个模型的选择,我们 箭头选一下,更多更多,这边有很多的供应商,我选择我有的 mini max, 然后来到这边复制一下,粘贴上来,按回车 api key c, 然后继续按回车,我们现在就选择它的模型,选个二点七就好了。 好,我们现在重新进入 hermes, ok, 来到这个界面,看到是 minnesus 二点七,我们问一下他,你是谁? 那我发现我刚刚选择的这个 minnesus 的 国际版本,所以就搞不定。那记得要选这个 china 的 版本。然后呢?就是粘贴,粘贴以后,他这边其实那个密钥是看不到的,但其实已经粘贴了, 回车就好了,他已经 safe, 就是 说已经 ok 了,然后直接再回车, ok, 然后我再选择这个二点七,现在就已经选择成功了,我再进入这个 hermes, ok, 我 们再来测试一下, 这次应该就有反应了, ok, 他 已经回复我了,他说我是 croco。 真的 假的?他已经产生幻觉了,会不会就是因为 mini max 叉?就是这个二点七?有 一些真牛的事情我也不知道,但我不知道为什么他会回复我,他说 gopro, 这个还是蛮惊讶的,不管他了,我派一些任务给他了,搜索今天五条热门的 ai 新闻给我, 正在进行当中,就他会自己去解决,反正如果遇到什么问题,我给他已经找到了。根据 google news 的 搜索结果,今天是十号的 热门的新闻,你看他是帮我找到了,还蛮好的。那今天的测试就到这里了,其实你每次要安装这种新的 ai agent, 你 都需要去折腾一下的,这个很正常。 那我后面进行更深入的测试以后再给大家汇报吧,今天就到此为止。那通过我刚刚演示的安装方法,我想你也很容易把它装到你的电脑上,赶紧玩起来吧。 最后我想讲一个很多人关心的问题,就是你到底要不要装 hermes agent 呢?我先给你一个很实在的答案,并不是所有人都需要装新的 agent 的。 如果你现在已经在用 open core, 并且还用的挺顺手的,那你真的没必要因为它火就去换这个,因为这些工具本质是在帮你的工作降本增效。既然你现在用这套东西已经能把你手头上的工作处理的很好了,那你再去换一个新的,其实没有多大的意义。 很多人现在有个问题啊,就是看到新的 ai 就 焦虑,觉得不学就落后了。但 ai 这个发展的速度,你越追反而越容易乱,你今天学这个,明天学那个,到最后什么都没有沉淀下来,这才是最大的问题。 所以我反而更建议你把你手上现在用的这个工具玩到极致,等你哪一天真的遇到瓶颈了,才考虑换其他的。所以你记住一句话就够了,不是你学了多少 ai, 而是你有没有真正玩 全明白 ai。 只要用好一个 ai, 你 已经超越了百分之九十九的人了。 ok, 以上就是今天的所有分享,你有安装 helmes agent 吗?把你的使用感受打在评论区,我们下期再见!

啊,大家好,这两天呢,有一个新的 agent 啊,跟这个 open call 类似的 agent 叫做 ermis agent 横空出世啊,它其实不是一个新的 agent, 它大概是一个呃,出来有两个多月的一个 agent, 二月底啊,有一个专门以前做大模型的 team 去做这个智能体 啊,据说这个它能够非常稳定地去完成长时间的工作,具体的这个介绍大家可以去翻这些公众媒体,那我就下下来随便试验了一下啊 啊,这很简单,就是说你如果是 windows 的 话,你在那个 wsl 里面就可以去用这个,我呢是 wsl 装了一个无光图,然后用这条命令刻命令,直接去啊,下下来,然后你还要把网络环境准备好,要不然中间可能会很慢, 他会去检测你当前的环境是不是满足的,然后给你创建一个虚拟环境啊,一个 uv 的 虚拟 ipad 的 环境,这些去 装一些依赖,可能还有一些 rewrite 之类的。这个啊,浏览器自动化的一些工具 啊,然后呢,装好以后他可能还会问你一些事情,就是说我发现你装了 opencl, 你 要不要把里面的一些设置导入,导入以后呢,最后再把这个 a p i t 啊这些东西把它导入,然后设置这个通道就可以了,完了就直接进去 这个他的 t u i 的 一个界面,我觉得他这个做的漂亮啊,这个像蛇一样的一个东西,我问他问题,然后他自动出事了啊,随便乱聊聊天了一下,然后呢? 呃,我让他把这个淘宝打开,他其实用这种导入浏览器啊,配 wifi 去打开,但是他碰到了一些这个反扒机制,后面我就不管了, 然后呢,我让他啊,就就是试了很多次啊,我就不管了,我说那好吧,我告诉我你的能力吧,然后他就把这个能力列出来,我说我对这个 ai coding 和这个娱乐这块,就是创意媒体这块比较感兴趣,然后 他就给我做了一个 ask 阿 ask 图案的一个生成器,我把我的公司名字叫 jelly act 啊,杰里奥特输进去,他生成一些字幕,我觉得还蛮好的,然后我让他生成一个走马灯效果生成以后呢,我看了一下乱七八糟的, 我觉得还好,就是多多多试几次就好。就这个短的一段代码,结果出来以后不是走马灯啊,是一大串字符从下往上在在滚动啊。 然后呢,我给他塞了一个啊 youtube 的 一个这个视频链接,让他帮我总结,看这看这搞了很久大概这个这个这个这个图案啊,这个这个 youtube, 他 最后获取到这个字幕, 总结啊总结看了一下就说 jama 四本地运行的真真相,他是通过这个字幕来把这字幕搞下来,然后做了一个 jama 四的一个真实的一个,这个 叫做批录吧。啊,我觉得还还是挺呵挺挺客观的,跟我自己用 jfk 四呃,去作为智能体的 agent 的 激素还这个还是比较相符的,所以我整整个用下来这个 aramis agent 呢,它感觉比这个嗯, open cloud 看上去稳重的多啊,一个感觉 就他每一步很清晰的在给你去做,然后装什么东西都给你弄,然后我在别的自媒体上看到他可以把这个每天要自己总结,把这个用过的这些记忆啊,可以挑选出优质的,自动变成 a, 变成 skill, 我 觉得这个这点特别好。好,那么我们就聊到这,以后更多的用法会慢慢探索,谢谢大家。

大家好, hermes agent 都用上了吗?觉得怎么样呢?那今天来分享一下我最近使用的十个技巧,比较适配新手。 那第一个就是我们去安装 hermes 的 时候,只要执行这一条命令就行了,但是呢, windows 用户一定要特别注意啊,必须得安装这个 wcl 这个环境,那其实安装也非常方便啊,只要打开你的这个 pro shell, 那输入这个 install 命令就可以了。安装完之后输入这个 wc 要启动,然后再去执行这条命令,那么就 ok 了。那第二个就配置这个主模型啊,那么在 hermes 里面是其实是有主模型和辅助模型的,那我们怎么去配置这个主模型呢?那配置也是非常简单,只要执行 hermes, 然后 model 模型,那么你就可以选择,那第一个是它自己自家这个订阅,第二个是 open rotter, open rotter 非常建议大家使用,这个 open rotter 里面其实有非常多免费的模型,然后的话你就可以等它出来,就是它会先加载一些。就是啊,模型 我们可以拉到最下面啊,就是你可能这个模型不在这里的,你可以拉到最下面,然后对话输入模型的名称啊,输入模型名称点确定, ok, 这样的话你的模型就变成这个应用达这个模型呢,因为我之前已经输入过密钥了,所以他没有提示我输入密钥,比如说我们再看一下他是不是变了, ok, 你 看这个名字是不变了,我问一下, ok 啊,它这个模型是这个,那我们在设置模型的时候有一个小小的问题,比如说我们如果说设置的模型需要输入这个 key, 但是这个 key 其实在它这个终端输入里面我们是看不到的,经常我们复制过去之后看不到这个字母出来, 那你不知道,你可能又复制,导致可能这个命要输错了,那怎么办呢? 那么在这个 hermes 这个啊,目录里面有一个环境的这个配置的文件叫这个点 e n v, 那 么在这个文件里面是保存了所有你配的这个模型的密钥。所如如果说你这个模型调不通,那么你建议你去这个文件里面看一下你的密钥是不是配置的,对不对?那第三个就是啊,配置这个辅助模型,那为什么它会有辅助模型呢? 因为它设置了不同的任务模块啊,比如说这个第一个任务模块叫啊试图就是说啊,你如果发了这个截图啊,给这个 homeys 发了截图,不管你是通过什么聊天工具发了截图的话,如果你专门给它适配了模型,它就会调用这个专门的模型, 那比如说这个外部网页的搜索也是一样的,那么他这边有八个任务都可以去配置不同的模型啊,那这里就会有一个这样的事情呢,就是可能像有一些他是高频的,但是我们不需要那么好的模型去处理,比如说像搜索网页,其实这是这是一个可能是一个 m c p 的 活, 并不需要你这个模型有多厉害,那么你就可以选用一个便宜的模型,那比如说像这种啊,比如说这种记忆类的啊,他要去 总结记忆的,那非常重要,因为记忆和这个技能的这个深层非常依赖于这个模型的能力,不然的话他的这个效果就很差,那么这种时候你就可以去选一个比较好的模型, 还有说这种搜索类的,那么都是比较好的模型,选好一点的模型,所以你可以去根据这个去配置不同的模型,那么你也可以不配置啊,如果不配置的话都会使用默认模型,也就是你配置的那个默认模型,那如果你想配置的话,你可以这么来配置,只要进入对话,然后你告诉他是哪一个任务,比如说请你 这个压缩的啊,辅助模型, 你复制给它就行,就首先你得知道自己这个模型已经配置好了,在我们前面这一步,他这边啊,看到没有,他把 auto 能换成这个,就是我们的这个模型。 第四个就是写好这个 sword, md 啊,就是这个是个灵魂的文件,那这个文件是写什么字呢?就是定义你这个后面字的这个风格 应该写什么呢?比如说你这个性格说话的方式啊,做事的风格,价值观和边界,所以呢这个是非常适合你去定义好,这样的话你的这个后面字就比较有人味了,那么格式你可以这样按这种格式啊,比如说你是谁,你怎么说话,你做事的风格是什么样子的?你遇到问题优先怎么处理 啊?比如说举个例子啊,比如说你现在要做一个这种研究型的 ai 助手,你就把后面字定义成这种助手,那么你可以按这种方式去让它给你去对话,那么你也可以让 ai 去帮你走。比如说你跟后面字已经对话了一段时间了,那么你就可以让它根据我们的对话技术风格 让它去重新设置啊,你的这个灵魂文件,或者说你自己知道叫 so d m d, 那 么直接叫 so d m d, 或者重新设置我的灵魂,它是能识别出来 啊,你这个设置灵魂就是去修改这个 so md, 它会去根据你的对话就去总结你要求的这种风格,因为你跟它对话,你会不断去纠正它的问题嘛,那么它就知道你喜欢什么样的风格啊,就是这个样子,所以这个文件是非常适合大家在刚开始使用时去定义的。去定义好的, 那第五个就要搞懂这个 home md, 这个就是定义了 home md, 这个就是定义了 home md, 就是他是怎么跟你说话,是定义他那 user 点 m d 是 他对你的了解,就是你是用的人,他对你的长期观察,会把这些你的画像,你的习惯,你的偏好,然后落入,然后总结到这个文件里面,所以这个是会被被动形容的,那么你自己也可以去编辑啊。 那 memory md 就是 通过我们长期的对话,他会把这个一些事情总结,就针对事情来总结到这个 md memory md 里面,然后呢,每一次对话都会把这个文件的内容注入到上下文里面去,这样的话他就会记住啊,你曾经喜欢这个,喜欢那个,喜欢,喜欢做什么?喜欢这个事的流程是什么样子的, 那 skill 就 更具体了,就是他对你的对话进行总结之后,发现有些事情是可以啊用流程固化下来的,那么他就他就会固化到这个 skill 的 文这个文件夹里面去形成技能,那么这你的方法就可以被附用,流程就可以被附用了, 那么这种你也可以自己去安装,那么后面字也是可以被动去创建去啊,进行一个修改的。 那 state db 呢?就是你跟它的所有的对话记录全部都保存在这里面,那其实最重要的是这个所有的 md 啊,是去定义你这个 home 字是什么样的人格,那这个文件是我们主动要去维护的,那其他的文件都是 home 字可以自动去处理的,可以不用管。 那第六个就是我们配置这个聊天通道,那么也是非常简单,那我们配置这个聊天通道也是非常简单,只要执行这个 homeis getway setup 就 可以了,那进来之后我们可以看到它支持非常多这样的聊天的通道, 然后的话这边也是飞书钉钉还有企业微信,然后这边的话是可以去配置的,比如说配置这个飞书的话,你可以进来,进来之后,比如说我这边已经配置过了,那我就让他重写。 那这句话是要输入这个 app id, 那 么你如果之前用过 open core 对 接过飞书,那么你肯定创建了很多这样的飞书的应用啊,比如说我们打开这个飞书的应用,就可以看到这样的 app id, 那 我们只要复制过去啊,输进去,然后再把这个密钥 再输过去, 然后再选择飞书啊,我们用的是国内版飞书, 然后就确定,然后不管,那这样就配置好了,那这边的话他有一个这样的一个配对的这个命令,配对的这个码 你可以选择选择之后你你如果说是第一次的话,他是会啊,你跟他对话的话会输,会生成一个这样的配对的密钥啊,你输进去就行了, 那这样就配置就完成了,你就可以去对话了,然后你可以选择,然后让它重启。它目前的话支持基本上主流的这个聊天工具啊,而且飞书的话它支持的这个维度能力的维度都是非常全的,所以说还是比较推荐使用飞书。 那第七个就是我们可以使用这个 homeis doctor 这个功能啊,去做一个全面的检查,看一下我们到底配置上有什么问题,我们可以输入这个,然后它就会去 如果没有问题的他就会打勾,如果有有问题他就会打叉,然后告诉你这个哪一个是啊?有什么具体的问题,那比如说这有个警告,这个有一个 browse 插件没有装好, 就是如果你这边遇到什么问题,你可以先执行这个,然后让他去看一下,检查一下有没有什么问题。那第八个就是 ui, 就 说它本身是有一个这样 ui 的 管理界面,那官方没有做啊,但是社区已经做了一个非常不错的这个 ui 的 界面啊, 然后的话你可以把这个项目 clone 下来,然后去执行这个,然后就可以启动一个这样的 ui 的 这个,呃, homeys 的 这个 ui 的 管理界面,那这边是我启动之后啊,我们可以看到你可以配置很多东西,比如说对话,然后的话配置这个任务, 还有这个搜索这个技能。然后的话这边是啊,一个就是四二点 m d 的 配置,比如说我这个配置就是这样子的,那么你可以直接修改, 然后这边的话是这样的,文件就基本上管理的东西都有,然后这边可以选择模型,所以说是不错的。你如果说不太习惯用终端命令行 t u i 这种方式来管理的话, 你可以把它下载下来,然后部署一下。那第九个是如果你想把 open core 的 东西迁移过来,你可以执行这个命令,执行这个命令的话,可以把 open core 的 一些技能啊,一些记忆啊,这些东西都都带过来,比如说像这个 点 open 空的所有的文件,他都会转移到这边去啊,你可以选择 yes 呢,他就会把它全部转过去了,非常方便的迁移啊。那第十个就是怎么去安装记呢?那么第一种方式就自己去创建,那通过聊天的方式创建,我相信大家这个都已经非常熟悉了。那第二个是在社区里面搜索,那么 homeys 也有自己的这个技能的社区啊,然后它这边也是有非常多这样技能的,大概有四呃,四百多个吧,六百多个,现在已经六百多个了。然后我们可以打开这个技能列表,里面是有这个 build in, 就 说明是它本身就自带了这个技能,那么不是这个标记的,那你就需要去安装了。那安装方式也非常简单, 那只要把链接发送给他,在对话框里面告诉他,让他去安装这个技能就可以了。你也可以去安装 opencircle 里面这个技能啊,也是一样的,复制链接发给他,他就会自动去安装。还有 github 的 技能也是这么安装的, 那这样有了技能之后,那你就能够去用很多这样的,做很多这样的事情了,那么以上十个呢,是我自己总结的一些这些经验啊,希望能够帮助到你,能够更快更好地去使用这个 hems agent。

如果你还在折腾 openclaw, 先停一下。最近 github 上有个叫 hermes agent 的 项目彻底杀疯了,不到两个月狂揽五点二万颗星,甚至引发了抛弃龙虾换爱马仕的迁移潮,它是第一个真正意义上越用越像你的自进化 ai。 今天我们就来拆解一下这个引爆全网的赛博分身神器,到底凭什么取代 openclaw 的 王者地位。 过去的 agent 患有严重的赛博失忆症,你今天花了一个小时教会他怎么处理你的表格,明天重开一个对话,他又是一脸懵。像 open cloud 这类框架,他的记忆是静态的,本质上是把你写进配置文件的信息拿去读。 而 hermes 的 记忆是动态的,他会在跨绘画中主动理解你的偏好。用传统 agent, 你 是在用工具。用 hermes, 你 是在养助手。 hermes agent 的 口号是, the agent that grows with you。 与你共同成长的 agent, 它最大的创新点就是自生长 skill 闭环。 传统的 agent 是 你给他写好规则,他去执行。而 hermes 是 在干活的过程中自己总结经验,当他帮你解决了一个复杂的问题,它会自动把这个过程提炼成一个 skill, 甚至还会自己给自己打补丁优化。这是一个能自我进化的赛博学徒。 记这么多东西,消耗的 token 岂不是要爆炸?这就要说到 hermes 的 四层记忆架构了,他没有把聊天记录一股脑塞给模型,而是像人类大脑一样分层,每次对话只加载最核心的偏好,历史记录存在本地,需要时才去解锁 技能文件,平时只看个名字,用到了才读全书。他甚至会暗中观察你的工作习惯,默默在后台给你建个画像, 这才是真正的懂你。很多人觉得 agent 能调用的工具越多越好,但 hermes 的 设计哲学恰恰相反,它极其克制。虽然它内置了几十种工具,但它绝对不会把这些工具全开着让大模型去拆,而是采用 two set 按需激活机制。 这种克制的调用机制极大降低了 ai 的 选择困难症,不仅速度更快,还从根本上减少了 ai 的 幻觉。 那么,老牌王者 openclaw 和新晋顶流 hermes 到底怎么选?龙虾是一个灵活的通用工具箱,靠多 agent 协同,适合做一次性任务或明确的工作流。而 hermes 是 一个单一 agent 的 深度循环,适合长期深度的项目执行。 现在的流行玩法是用龙虾做手脚去执行杂活,用 hermes 做大脑来沉淀经验,两者配合简直无敌。 那么, hermes 适合哪些人?如果你是自媒体创作者,他能潜移默化地学会你的写作风格和排版偏好。 如果你是运维工程师,凌晨爬起来修好的 bug, 他 会自动写成运维 skill, 下次直接调用。如果你是数据分析师,你的数据清洗以及分析套路,他用一次就学会,这已经不是在用工具了,这是在打造你个人的数字大脑。 别小看这个开源项目,这个背后拿了七千万美元融资的团队有着更大的野心。他们做 hermes 的 真正目的是打通一条数据闭环。你平时用 ai 攒下的技能,都会变成极佳的训练数据, 他们想让每一个普通人的电脑都成为未来训练更强大开源模型的节点,打破科技巨头的算力垄断。 最后我想说,我们正在经历从工具思维到伙伴思维的范式转变。传统的 ai 就 像一把锤子换一把没区别,但 hermes 揭示了 ai 的 未来,它应该是一种可以长期积累的数字资产, 谁能在时间里攒下更多的专属技能和记忆,谁就能享受到 ai 效率的指数级复利。

大家好,最近有一款 ai 神器呢,非常火,它的功能跟 openclaw 是 非常像的,但是呢某些功能是超过了这个 openclaw, 在 github 上的这个 sars 已经超过了三十二 k 了,虽然说比 openclaw 还差一些,但是呢目前是受到了非常多的关注啊。那这款 ai 神器呢,叫 homeis 神器, 那本期视频就来介绍一下这款 agent 的 到底是什么,以及如何安装,然后来讲解一下它的一些特色点。那首先我们来看一下 hymis agent 到底是什么?我觉得它有一个非常两个非常大的个特点,就是可以自净化, 也就是可以自主去学习,加强自己。然后呢就是还可以有一个内置的一个学习壁画,那它这两个部分是怎么做成的? 那就依赖于这最重要是依赖于这两个特点,一个是持久多层的记忆,它是使用这个 light 加 f t s 五的方式来保存我们的历史的对话,也就说你跟 ai 进行的每一个对话它都保存下来了, 而且能够去根据你的对话去总结。那第二个就是他的自动技能进化,这个是非常有意思的,他去通过你的对话,他会把你的对话流程沉淀成技能,也就说在他这里面你是不需要去创建技能的,他会根据你的对话来去总结出来技能,当然你也可以去安装别的技能, 所以就有这两个东西来促成了它有这种自主进化的一个能力啊。那么在 open core 里面我们是要自己去安装技能的,那么它的记忆的方式跟它也有区别,那接下来我们会详细讲解它的记记忆, 那其他的比如说自主执行能力啊,它是能调用各种各样的工具浏览器,那么我觉得这是一个通用的 a 点的必须具备的能力啊。那模型的话,它也是支持常见的模型,比如说我们国内的 mini, max, kimi 啊,全部都支持,然后也是免费开源,免费的, 那么目前它的这个 stars 已经有三十二点八 k 了,增长的非常快啊,那关注的人也非常多,然后我也试用了一下,的确是有点不一样的感觉,但我们来对,先来对比一下这个哈密斯跟 open coil 的 区别。 那么首先是核心价格的维度, openclaw 是 什么?是它是个 getaway, 它通过 getaway 路由到不同的 agent, 然后不同的 agent 可以 对接不同的这种 message, 比如说微信啊,或者说飞书啊,然后设置不同的角色,它更像是个中央控制器,控中央路由器。但是 后面这个的特点就是什么呢?它更像是个人助手,专为你服务的,它的特点就是说我能在给你的服务过程中去成长。所以说 open core 更像是一个商业的东西,你可以去对接很多客客户,别人的老板啊,同事啊,去设置不同的角色,不同的 server, d, m d, 然后去跟他们去对话,那后面一次呢,就是更像是你自己,你就给自己玩就行了。所以我认为的区别是在使用上的区别,有这么个区别,那学习能力, 那 open core 呢?是需要你去安装这个技能,去找一些技能,它是不会去沉淀你的对话记录来自主去创建技能的。 那么 homeis 呢?是可以去提炼你的对话,然后生成这样的技能,那这个是非常有意思,也是可以去啊,我觉得 openclip 是 可以去借鉴,然后去后面可能会去增加这样的功能了,那记忆系统,那么我们会详细再讲到这个记忆系统,那技能的生态 都是一样的,包后面是也有这样的社区啊,然后也可以去安装开源的这些技能,完全没有问题。那消息平台的话,那 open call 这边是可以对接了,五十加集成,那对接的那种渠道还是非常多的。 那后面是这边的话,是对接了七到十个主流的,那国内的飞书啊,微信啊都对接了都,他这边都是可以完全去对接的模型啊,都是,我觉得都差不多, 那其实就是最重要就是这个记忆系统和这个啊学习能力,我觉得是最重要是这两个区别啊。接下来我们就来详细的看一下他这个记忆到底是怎么来存储,怎么来去来实现这种啊自进化,或者说能够更好的去给你去回忆你具体的内容的。那首先你发出一个信息, 那后面一次 a 型的时候开始就推理,然后他会把常驻记忆,就是他会把上一次或者之前的对话中值得记下来的记忆啊,会放到这个 memory 点 md 文档里面去。然后呢,那你的每次对话,他都会把这个 memory 点 md 放入到上下文里面去,那么这个跟 openclose 是 一样的,这种就叫做常驻的记忆啊,就是你可能是你的个人的设定啊,你的一些习惯啊,那么这个就会放到上下文,每一次对话都有用,那如果你的对话中需要更深的记忆, 就比如说你要回忆在上周二我给你对话的内容是什么,我是不是说过一个什么事情,那么 home 子就会去 搜索这个 solide, 就是 你之前的对话记录,它会把每一条对话记录都保存起来,那么我这边就是把这个 solide 数据库展示出来了,你看它把我的每一个对话都保存起来了, 那么他要搜索的话,通过这种缩影的方式把这个数据就拉出来,然后去做摘药,就会回答你,哦,你让我回忆的东西在这里面有,那 open colo 在 这里是没有的,他是把你的对话会总结成文档,放到这个 memory 的 md 里面 啊,日期这种方式来存储,所以他是想不起来上周二我具体跟你聊了什么,他是记不起来的。最后呢,就是你对话完成之后,他有一个专门的 啊,异步的这种 review, 这个 review 是 干什么呢?它会 review 你 这个这段时间对话,那这段时间对话有没有值得可以存入到我们这个 memory 的 md 的? 也就说我们刚开始开始发送对话的这个长注记忆, 它可不可以把这个对话内容值不值得长期保存?如果值得,那就它就会更新这个 memory md。 然后呢,在你的这个对话过程中,有没有一些流程我能沉淀起来, 把它做成技能啊?如果有,他就会写出来技能,所以你跟他对话的越多,那么你保留的这些技能就会越多,他就越来越会越了解。我们知道技能就是一个人的一个流程化的一个沉淀,对吧?你的做事的习惯,你的所有的这个, 呃,你的方法论,所有的东西他都帮你总结出来,放到这个保存起来了,他就会越来越像你,越来越理解你,越来越懂你。所以这个东西是为什么说他?我觉得他是一个非常 大的一个进步,为了让大家更加的明白这个记忆的区别,这两个记忆的区别让我来更详细的来演示一下。那后面是存储存的是发生的过程,也就是他会把每次对话存起来,像聊天记录一样 存到他的数据库里面去。但 open core 是 什么呢?他提炼的是知识,就是会把你的对话中可能需要注意的点,对吧?偏好规则设定结论给保存起来,像个就像你做会议闭会议记要一样, 那么后面是保存的是会议里面每一个人说的话,但是呢, open core 保存的是我整场会议里面要记的点, 所以这两个是非常大的区别的。我们来举个例子,比如说你现在跟 agent 对 话啊,你发送的时候以后要帮我整理周会记,要先把代办列出来再写总结,那 agent 说, ok, 我 记住了, 记住了啊,这是一个非常重要的一个顺序。然后呢,他说,哎,用户又提了个要求,他又 ok, 接下来了,那上面的对话其实里面就包含了什么呢?就是 过程,就他要怎么做,一个结论就是他不要怎么做,或者是建议他怎么做,这个一定是会被保存成记忆文档的。好,对于这,对于这段对话,那么 holdem 子会把他所有的这个聊天记录啊,就这个聊天记录保存在 sql 数据库里面去,然后也会 把这个里面提炼出来,把那一个结果就说你的设定,你要的要求,把这个每次要开会记会议要的要求把它保存到这个 memory 里面去, 然后如果涉及到流程,把它保存着技能。所以呢,你下次如果再问同样的问题,他就会知道哦,我先要干什么后要干什么,我,你不喜欢什么样子的,他就会去调用这个记忆和这个技能, 那么 open core 也是一样的,在这里是一样的,根据上面对话也是会把这个结论会记下来, member 在 这,在这个,在这里的时候,在这个阶段的时候,大家都是一样的,当你问到同样的事情,他们的回答结果一定是一样的,在这一步两个人的记忆都是一样,因为都是总结, 都是对对话内容的总结。但是当你要问这个时候,比如说你问为什么 要把这个周会改成这个样子,问到细节的时候,就是我们要深入的去问的时候,那 open coil 他 是没办法去回忆,哦,我为什么要改成这样?他只知道结果是要改成这样,他不知道过程。 所以在第一步的时候,如果大家都是啊,重新去做一个事情,就是我要建议要开一个新的会议,那么大家都会按照这个结果,就是已经设定好了规则 去执行。但是当你去问我之前要为什么会这样子的时候,你来帮我回忆一下,我上着奥为什么要让你去改的时候,那后面一次的话就是可以去回忆你们之间的过程,然后去提出摘药回复给你,但是 open close 我 没有的。所以呢,时间一长,差别就体现在 宏米思更强调的是陪伴感,哇,它真的像一个你的一个影子一样,能知道你们的所有的对话记录。那奥文科尔是个管理感,因为他注重结果, 所以这是一个很大的区别,这也是我在看他的技术代码里面一个感想,就是就是宏米思可能是会更偏向于个人意见的,就是陪伴式的, 很知心的一个伙伴。那 open core 呢?可能是更像是支付管理助手,所以呢, home 更容易把精力继续转成方法,因为他拥有你所有的精力,他会把你的精力转成技能 沉淀下来,那么这个就是非常非常重要的。好吧,我们最后再来总结一下,那 home core 记住了是发生过什么? open core 记住了,是 我最后应该记住什么啊?这个是两个非常大的一个区别, home 和 open color 应该怎么选择呢?如果你更想要长期的相处感,回忆过程,经验沉淀,那么 home 则会更适合你。 如果你想要文件化,记忆清晰,治理规则型知识库,还有还有就是你想要去路由更多这样的通道去对接这样更多 agent 内部的 agent, 那 么 open color 可能会比较适合你。那我们来安装一下来体验一下。 安装也很简单,就只要有这样一个命令,那么你可以选择你的 windows 电脑,或者说你的这个另一个服务器啊, mac 电脑都可以安装。对呢, 那当你安装完之后啊,你可以使用 home 键进行启动了,启动完之后,它就会进入一个终端命令行的界面啊,比如说这样子,它会看到,你会看到它那个工具以及它现在的技能。 如果你安装这个 openclip 啊,它会把 openclip 里面的东西都同步过来,但是你在安装过程中去选择,让它把 openclip 里面的,比如说这个,呃, user 的 md, 就 它记忆文件以及它的技能都可以同步过来。然后的话你第一步是要去设置啊,你想要用什么模型?那怎么设置呢?你可以在这边 homeys, 然后 set up, 这里的话是可以选择,就是 你是不是要同步这个 open core 里面的配置,那比如说我现在选择不要,那么你这边的话它会选择一个 quick set up, 就是 可以去设置模型消息,那么你可以选择这个。好,这边就就是你们常用的模型了, 国内的模型的话,我建议用这个 more providers, 然后呢去选择这个,呃,自定义,因为它有些端点是有问题的,就是你可以自己去设置这个,比如这个 base url 啊,你自己可以设置这个端端点的地址,因为他有些地址他错,比如说我选择 kimi 时,他那个地址是错的,但是大部分地址都可以用,你设置完之后他就会要求你设置 key 啊,那就 ok 就 结束了,模型就设置成功了,结束之后呢,你就可以去启动, 这是会进入它的一个聊天界面,它自带的聊天界面,那么你就能看到你现在这个模型,比如说我配的是这个 timmy 的 这个模型,那么你就可以在这里对话,然后非输这个对接的话是需要单独去这么去配置的,那么就是 hoe, 它有个专门的 get away 啊,能 set up, 然后这边的话是可以选择看到没有,可以选择飞书,然后就是选择飞书这个啊,选择这个飞书,然后的话选择 y, 那 就是你飞书创建的一个应用 a p p id 和这个 a p p secret, 就 a p p 密钥,你把它输进去之后,那么你就可以去对接去用了。 但是目前来说用其他的,我用飞书的话好像有时不太稳定,所以我现在用的是他自带的这个聊天框,可能后面会有很多这种插件出来,因为毕竟他也是刚出来,但是他这个记忆和这个技能自动创业技能,这个是太爽了。所以你如果没有这种需求的话,你直接可以用这个 自带的这个聊天框,就它这个终端跟 qq 的 一样去对话也可以,也是非常舒服的,非常爽的,它也可以去操作很多事情。 ok, 那 本视频就到这,希望这个视频对你有所帮助。

它这里是让你再确认一遍,要不要把它所有的内容都导入进来。好,那么现在它就已经是一个正常运行的状态了。 今天详细的教大家如何安装部署 hermes agent。 那 首先我们先了解一下 hermes 是 什么,就是它跟小龙虾有什么区别? 我们就用他自己做的这个演示动画来大概过一下。我用下来感觉他跟小龙虾最大的区别其实就是稳定,就是他比小龙虾要稳定很多,这个非常非常重要。在我看来一个工具最重要的就是稳定 可靠,那我平时给他布置任何长任务,他都没有崩溃过,没有中断过,这一点很重要啊。 呃,小龙虾的话,之前做那种长任务经常会停掉,要么就卡住,反正就会出一些问题。这几天我用 hermes 用下来,感觉非常的稳定可靠。而且他现在这个版本最新版本要比我刚开始安装他的时候好太多了, 就进步非常非常大。最开始我安装他的时候呢,他的权限很小,就是让他做什么东西他都需要申请权限,很麻烦。那现在的话很接近小龙虾了,这个可能是他在底层设计上出于安全方面的考量, 其他的他跟小龙虾没什么区别,最大的区别也就是他的记忆系统自我学习的能力,就是每次他完成一个长任务,他就会写成一个 skill。 那你现在看到的这个演示动画就是他做的,这是第五版,就修改了五次,我认为效果也还行,效果也不错。另外就是他这个创始人团队啊,这是一个做开源模型的团队,他们发布过一系列 hermes 模型,开源模型。 好,那么接下来就教大家如何在本地部署,如果你们自己在安装的过程中遇到什么问题,可以在评论区留言,我看到就会解答一下。首先我们打开这个项目的开源地址,或者打开他的官网也可以, 然后找到这个下载的命令复制下来。他目前不支持 windows 系统啊,如果你是 windows 系统的话,你需要装一个紫系统,然后打开终端 粘贴进去,按回车,然后等几分钟,他会自行下载,下载好以后会进入交互界面。 ok, 这里他是识别到了我电脑上安装了小龙虾,然后他问我要不要先导入, 这里我们可以选择导入,也可以选择不导入。我先演示一下不导入,如果要导入的话,你就输入 yes 就是 y, 如果不导入你就输入 n, 那 么我们先输入 n, 这里我们就可以选择快速设置啊,没必要完整的全设置,因为你只要快速设置能让他先跑通就可以了,后面需要什么配置,只需要和他说,他自己就会去配置。好。好,这里我们选择要接入的模型, 比方说我用 mini max, 你在粘贴 a p i k 的 时候,它不会显示出来啊。然后这里按回车, 好让我们选择模型。你如果定的是极速套餐,你就可以选这个 high speed 的, 这里是要接入通讯软件,选择不接入,后面再去配置, 这里输入 y 就 可以了。 然后再输入 hermes, 这里就可以进行交流了。 先跟他打个招呼, 好,我们看到它这里已经回复了,但是因为这个字体的颜色呀,看不清,那么我们就可以给它换成高对比度的,清晰一点的输入 skin 空格 model。 好, 这里我们已经换了,刚才我以为没换成功,这里已经能看清了。那么你如果要接入飞书的话, 你就去飞书创建一个频道,然后把 id 和密码发给他就可以了。好,下面演示一下如何一键导入小龙虾相关的配置啊。我们输入 permiss 空格 set up, 然后这里我们选择 yes, 它这里是让你再确认一遍要不要把它所有的内容都导入进来,然后会带来一些兼容性的问题,但是它自己会判断会弄好,我们选择 yes, 然后再次进入配置项。 ok, 那 么现在呢,他就已经拿到了你所有的 opencloud 的 相关配置,然后我们测试一下, 你看啊,他现在已经知道了,我叫戴哥,这个就说明他已经拿到了之前小龙虾里面的记忆文件。好,那么现在他就已经是一个正常运行的状态了。但是这个软件它目前没有 web ui 啊,就是浏览器里面没有控制台, 只有在终端里面运行。还有如果给他接入通讯软件的话,在通讯软件上面与他交流, 配置起来还是很简单的啊,要比小龙虾要简单很多。后续如果你还需要再让他去配置,其他的都可以和他讲,他自己就能去完成。好,这期教程就到这里。

体验了一天新 agent 框架,踩了好几个坑。我是清澈君,今天就说说 hermes agent 到底值不值得从 open claw 切过来 飞书。体验这块 hermes 太难配了,要自己建机器人加事件订阅配权限,一堆流程搞不定。 open claw 的 飞书插件,一行命令扫码就行,轻松搞定。聊天体验也差很多。 hermes 是 消息编辑,显示 open claw 是 卡片流逝,一个字一个字往外蹦,根本不是一个感觉, 最硬的一个商不支持微信,官方列表里根本没有,只有一些小众 i m。 微信是打开频率最高的平台,计时性没法替代。 opencloud 一 行扫码就配好微信通道,带娃发消息非常顺手。这个对比太明显了, 还有个很隐蔽的坑要注意,而密斯设计默认跑在沙河里,但你实际部署在 vps 宿主机上,他会反复跟你确认沙河权限,其实你早就给了完整访问权,该做的事情反而被自己限制住。 说说 hermes 真正的亮点, skill 字进化是真的厉害,任务做完自动把流程凝结成 skill, 下次直接复用,不用重新教,记忆分层也做得好。 memory 到 md, 加 state 到 db, 分 开管,避免塞满上下文,长期跑 tog 消耗更稳, 工作认知透明,每步思考都输出出来,不会让你猜他在干嘛。所以我暂时不换。 openclaw 已经跑的很好,没精力再调一个新的 hermes 只支持单 agent, 我 的场景需要多个协助,这是硬伤,生态也还不够成熟,可以晚点再观望。你现在用的哪个评论区?说说,我看到就回。

openclo 真正的杀手啊,赫姆斯 agent, 我 没有夸大其词,一会我给你们展示一下,为什么他比 openclo 牛逼。你们一定要去安,特别是小白。我跟你说, openclo 的 痛点,我先讲几个,你们,我,我玩了小龙虾玩了三个月啊,痛点是什么?第一个, 忘记事情,然后你今天跟他讲,明天可能就忘了。然后第二个,你要做一个任务,你得安装各种 ceo, 你 要让他去登个网页,你给他接各种 a p i。 你 们有玩小龙虾的都知道我在说什么,他到底有多屌,一定要认真看完这个视频,你们看一下啊,因为这个是我新买的这个 mac 电脑,我刚安装的,看一下啊。 呃,我安装完以后我就问了,他就告诉我是谁,你听我,他先介绍一下我,然后我马上告诉他用中文跟我沟通,你看一下,他说他记住了,但是过了两天他又忘记了。 好吧,他已经是直接就写入他的记忆里面。 ok, 这只是第一步啊,这只是最最简单的一步。 ok, 我 这个从来我没有给他安装过任何一个 skill, 很好看啊, 给我介绍一个,做一个网页啊,很好很牛逼啊,什么都没有安装哦,他直接掉入了哪些什么东西?我给你看一下啊。 他直接调用了我这电脑里面有的终端,直接做了,给我做了一个 html, 那 么它的效果是什么样的?我给你们看一下,虽然说比较简单,因为我没有给他安装任何的设计的 skyo, 所以 我只是一句话,他就能生成一个这样子的 h html 的。 这个前端的页面已经很屌了。 ok, 这还没有什么牛逼的,再给你们看一下更牛逼的东西, 看一下啊,继续看。那我我为了去挑战他的能力,我又给他说一下啊,我,我让他看清楚啊,我 让他给我写一首歌,只怪随便写了一个啊,我只要成品,然后我给他的 mini max, 因为 mini max 是 有这个语呃语语音的这个 api 的, 我直接给了他 ok, 然后他马上就问,他就问了我三个问题,我就把我就把他我的密钥这些全给他了, 告诉他模型看到没有,他又是调用我的这个配色,直接去开始就干,干完了以后就做完了。那么做完以后呢?哎,我找不到这个文件夹,我只能放在桌面上,那么大家去听一下他到底有多牛逼啊,这个就一句话就能帮你解决这么多的问题,我给你们看一下他的成品啊,成品大家听一下。 直接听歌词 牛逼吗?赶紧去玩啊,如果大家有什么想想想知道的新玩法来找我。

ok, 朋友们,那最近有个新的 agent 叫做 hermes agent, 在 外网非常的火热,他说你的第一个爱马仕,何必是爱马仕,那么他被人叫做小龙虾的进化版本, 那他跟小龙虾有什么区别呢?今天这个视频我就会讲清楚 hermes agent, 并且会手把手的带你从安装到设置,然后再到使用。那么这次我会使用这个谷歌最新的开源大模型 java, 然后我会把它部署在本地,并且会教会你,然后接入到 hermes 来使用,这样就可以实现 fork 自由。 那我们首先先来讲讲 hermeshermes, 它跟小龙虾的第一个区别就是它能够自我进化,自我学习,会自动生成 skill, 就是 不需要我们去手动创建这个工作流,那么只要你用的越久,它就可以越来越懂你,用起来越来越顺手。那么它具体是怎么实现这个自我进化的呢?这里有两个数字,一个是五,一个是十五。那么首先我们来说一下这个五, 那 hermes 在 完成一个复杂的任务,通常指的是它要进行五次以上的工具调用,它就会自动地把整个工作流沉淀成一个 md 技能文件,之后它下次再遇到类似的任务的时候,它就会直接加载这个 skill, 跳过摸索阶段。 那么如果它在执行过程中发现有更好的方法,它也会自动更新 skill 文件,那么上述这个过程是使用一个叫做 skill manager 的 工具来完成的。 那十五次是什么意思?也就是说他每进行十五次的工具调用,系统会自动停下来回顾刚才发生了什么,找出哪里失败了,然后立即更新自己,这个就是他的闭环自省功能,也就是他越用越强的秘密。所以说五次就是他什么时候记,什么时候创建自己的技能,十五次就是他什么时候反思。这两个是不同的处罚机制, 这就跟我们传统的 skill 编写方式是很不一样的,因为我们知道无论是小龙虾,或者说是 cloud code 或者说 code, 他 们的 skill 都是由人工来编写的,或者说从这个 cloud hub 这种 市场上面下载下来的,他们没有自我生成,也没有自我迭代。那很多人使用小龙虾的时候,还有一个问题,就是觉得他特别笨,比如说今天说的事情,明天就忘了,然后他告诉你我一定会记住,结果第二天他又忘了,那原因就是因为小龙虾的记忆系统不够完善,他只是简单的压缩了上下文。所以说我们会看到很多团队也在做 agent memory 这件事情就是想解决持久化记忆的问题,让 agent 能够永远记住你的信息, 比如说密木林,比如说国内盛大网络的 evermind 等等等等。那 hermes 和 openclaw 它的记忆系统之间有什么区别呢?其实最大的区别就是它们在容量管理上面是完全不一样的。那我们来看一下 hermes 的 三层记忆系统。那第一层叫做绘画记忆, 也就是实时的大拇指的上下文窗口,比如说一百二十八 k, 二百五十六 k, 那 它在绘画结束的时候就会消失,跟我们正常在聊天框使用豆包 deepsea 是 一样的。 那第二层叫做持久化记忆,那这层有两个文件,分别是 memory md 和 user md, 顾名思义和小龙虾的作用是一样的, user md 呢,就是用来收集用户的画像和偏好的,那 memory md 则是用来长期记忆和经验沉淀的。 但是在小龙虾里面,这两个文件的容量默认是两万个字符,那么超出之后它就靠上下文压缩,把旧的对话内容给压短。但是问题就是说压缩之后会导致信息丢失或者变形。 而 hermes 的 memory dmd 里面只有两千两百个字母, user dmd 里面只有一千三百七十五个字母,它的容量是小下的十分之一,那它为什么要设计的这么短呢?其实这是一个团队的设计哲学,就说团队他故意把容量做的非常小,迫使这个 agent 主动去提炼,去重合。并 不够用了的话,那就必须先整理旧的才能添加新的,那容量满了的话,不是压缩,而是主动侧展。那 creation 也是刚才说的主动侧展,和我们之前说的压缩 compression 有 什么区别呢?压缩是把所有的东西硬塞进去,然后变短,变紧凑,但是内容它会变形,会丢失,会失帧。而侧展它是主动的去筛选, 判断什么重要,什么不重要,什么可以合并,什么该删除掉。那么 hermes 他 走的就是这条路线,所以说虽然他的记忆非常的小,但是他每一句话都是有用的。那 hermes 的 记忆系统第三层就是全量历史解锁,他会把所有的历史对话放在 s q l lite 数据库里面,如果说他需要查找历史数据的时候,他就会使用关键词查找匹配,然后 找到这个片段之后再使用大模型整理材料,最后返回给我们,而不是说跟小龙虾一样使用向量解锁。那我们先说说关键词查找匹配,那这个就很简单,就类似我们的 ctrl 加 f 搜索什么关键字,它就匹配什么。 那在 hermes 里面,它就会根据关键字去搜索相关的段落,然后让大模型去整体的理解这段话什么意思,理解完之后再返回一段材料给到你。 那我们举个例子,比如说现在我给这个 agent 说,之前上周我们讨论过一个三个月的学习计划,来提高我的这个英语口语和表达能力,你去帮我找找那个计划具体是怎么样的,然后再给我说一下,那他就会执行下面这几个操作。首先他会去搜索关键词学习计划,三个月提升英语表达,然后找到这些文本片段之后,大模型会整体的理解上下文,然后再返回一段摘要给到我们。 那什么是向量解锁呢?向量解锁它就是把文字转换成数字,我们知道计算机它存储的是零一系列,对吧?它是存储不了文字的,所以说在存储的过程中, 它会把文字转换成像量,那向量解锁就是通过比较数字间的距离来找相似的内容。比如说现在有句话叫做猫在沙发上睡觉,转换成像量可能就是零点八二、零点一五、零点三三。 那还有另外一句话,就说一只猫咪握在沙发上转换成向量,可能就变成了零点八一、零点一六、零点三四。虽然说这两句话的字是不一样的,但是它们的语义是非常类似,都是猫在沙发上,对吧?那所以说它们在向量空间上面的距离是十分接近的,那 ai 就 能够理解它们是同一个东西。 向量接收的好处就是能够理解语义,但代价是需要你额外的向向量数据库来存在,向量存储成本会更高,并且还需要一个迭代模型。 那我们还知道养小龙虾呀,是一个非常烧 token 的 事情,因为它真的太耗钱了,那 hermes 就 能很好的解决这个问题。那为什么养小龙虾非常的浪费?这个 token 就是 在于这个系统提示词的加载方式。那首先我们说一下什么是系统提示词, 我们知道当我们和 agent 对 话的时候, agent 收到的并不仅仅是你的问题,而是系统提示词加上记文件,加上当前的对话,就等于 agent 看到的完整上下文。 那系统提示词里面包含了什么呢?比如说 agent 是 谁?他应该怎么工作,记住什么信息,也就是我们理解的 so 点 md, user 点 md, 正题题点 md 这些文件。那对于小龙虾来说,他每次会画会重新加载这些上下文,然后对话开始的时候,他读去所有的记忆文件,然后拼接之后注入上下文。那么 lama 在 处理上下文的时候,他会把之前遇到的内容缓存起来,然后来加速处理这个缓存,命中 token 的 价格是最便宜的,那如果说上下文内容在一直改变,对吧?那我们前面的缓存就会失效, 因为缓存是按照顺序来存取的,你前面如果变了,后面存的再多的缓存都没用了,接下来全部从头来过,它不是增量改变的,而是全部推倒重来。 而且还有个现象就是我们知道现在市面上很多中转站,对吧?那你会看到很多这种垃圾中转站为什么都可以用的这么快?原因之一就是因为它不让你去命中缓存,全部给你用最贵的消耗方式。那我们看 hermes 它是怎么做的? hermes 它完全不一样,它会在绘画开始的时候执行一个操作,叫做 frozen snapshot 冻结快照,他会把当前所有的记忆文件等等等等上下文全部读起之后锁定,然后注入到上下文里面去。那在绘画进行的过程中呢?如果说这些文件被修改了,他直接不管, 他继续使用锁定的版本,等这次绘画结束之后,他才会把这个修改写入文件,然后在下一个绘画开始的时候,他会读取最新的版本。那这样做有什么好处呢?首先第一点,最显而易见的就是可以保持前缀的缓存命中性能更好,并且更节约前。第二点,他可以避免 a 键在绘画中途修改记忆导致人格飘逸的问题。 那什么是人格漂移问题呢?打个比方,就像现在我们正在写一篇论文,那假如说我们现在写第一章,并且已经把所有的参考论文文献全部找好了,那我们在写的过程中,我们就一边看一边写,对吧?那现在这时候有个人跑过来跟你说,参考文献更新了,你需要加一篇新的,然后再删除一篇旧的, 那你是不是想把这个给红出去?因为你论文写到一半,参考文献给我改了,那这不是捣乱吗?所以说如果说你修改的话,你的逻辑就已经不值价了,这个论证链条就会受到影响。那 herb 的 说法就是你不用管,你就用旧的参考文献来完成第一章的章节,然后在进入第二章之前,你再去拿最新版本的参考文献。这样的好处就是第一章的论证逻辑是稳定一致的,不会因为中途文献的增加修改而改变。 那上面我说的这几点呢?就是 hermes 和小龙虾的最主要的差别。那简单来说,小龙虾就像是一本人工维护的笔记本,你说什么,然后就记什么,满了之后我们就压缩。但是 hermes 呢?它更像是一个自动整理的一个档案系统, 它自己会判断价值不够了,会主动合并,并且会把做过的事情变成一个可以用的技能,这也是它为什么越用越聪明的原因。现在我们就开始安装设置这个 hermes, 然后本地部署 java 这个大模型,并且把两者打通。 那现在我们来安装欧拉玛。欧拉玛是什么东西呢?简单来说,欧拉玛它是一个本地的大圆模型运行器,我们知道所有的大圆模型,它可能参数不同,启动方式不同,那是不是很不方便我们去使用,因为他们没有一个统一的标准。那欧拉玛就做了一件事情,他把常见的这些模型全部包装成了统一的重格,使得我们去很方便的调用切换,所以说它是一个统一的包装层。 那如何安装欧拉曼呢?也非常简单,我们只需要打开他的官网,那么来到他的首页,我们点击 download, ok, 那 可以看到这里,他让我们选择三个系统,我们选择我们的 micros, enix 和 windows, 那 这里我是 micros, 那 我就选择 micros。 那 大家如果是 windows, 我 们就点一下, 然后把这个命令复制终端里面去运行就好了。那,那如果说你发现你在终端运行这个命令是失败的,那我们也可以选择下载它的这个 app 形式,那这里我就选择在终端安装,那我复制这条命令, 打开 terminal, 然后粘贴上去,然后回车。那大家注意,如果说你使用终端安装的话,你最好把你的这个魔法开成 t u n 全剧模式, ok, 那 安装好了之后,它就是这样一个界面,那现在我们来继续安装 java for, 然后把它部署到我们的本地上面。那很简单,我们点击这个 models, 然后这里我们就选择我们的贾玛 four, 然后点进来之后,我们可以看到它这里给了模型的好几个版本,一二币、一四币、二十六币、三十一币和三十一币 cloud。 ok, 那 现在你可能会问,那我怎么知道我该下载哪一个模型呢?那这里给大家推荐一个网站,叫做 what models。 打开这个网站呢,我们只用在这里选择我们的这个 gpu 是 什么, 比如说你是英伟达的,你是 amd 的, 或者你是苹果的,好吧,选择你的 gpu, 这里有五零七零,五零六零,然后比如说你是英伟达的 四零九零,你就可以看到你能跑的很好的模型有哪些,对吧?然后你一直往下拉,基本上可以升了很多模型了,那就是说你跑的有点吃力的啊,这个就是你完全跑不了的, 所以说大家可以根据自己这个显卡的配置去选择,那我们回来安装,那我在这里的话就选择安装这个一四 b 的 版本就好了,然后因为一二 b 确实太蠢了,二十六 b 的 话,我目前这个笔记本是有点吃力,所以说我选择这个一四 b 的 版本就好了。 那安装这个模型非常简单,我们把它的名字复制一下,然后我们打开终端,我们输入欧拉玛库,然后粘贴它的模型名字,然后回车等等,等待它安装就好了。 ok, 那 可以看到现在我们就安装好了,那我们输入欧拉玛 list, 就 会看到我们现在本地安装了哪些模型。 可以看到我们这里本地安装了一个 java 一 四 b 的 版本,然后这个 size 的 话是九点六。那现在我们来测试一下 java 的 多模态信息处理能力,我们可以看到我给了他一张图片和一段文字,可以看到他思考了三十一秒时间, 那现在我们看看他在处理开放问题的时候表现怎么样。现在我给了他一个问题,现在 ai 什么都会做了,那我们普通人应该怎么做?普通人该怎么才能保证自己不会被 ai 淘汰?给我详细分析一下, 可以看到他思考了四十五秒钟时间,然后生成了这么长的回答,并且说的还是挺有道理的。那现在我们来安装一下 hermes agent, 那 安装也非常简单,我们打开它官网,然后复制一下这个命令, 我们打开终端粘贴回车,等待它安装就好了。可以看到他先会看我们一些必要的包有没有,没有的话就给你安装,有的话就直接跳过, ok, 那 现在我们看到他已经把所有的依赖全部安装完成了,然后的话他开始了这个安装向导,然后他检测到了我们已经安装到了 open class 小 龙虾,然后他开始问说你是否想看看有没有什么可以导入的?那我们选择 yes, ok, 那 现在我们看到他在问我们要不要把 open class 的 这个配置牵引过来,然后他给出了一个预览界面, 那如果说你觉得你的这个小龙虾调教的非常好,你可以直接把它牵引过来,那这里我有了演示,我就直接选择 no, 不 牵引过来。 然后现在我们来到了配置界面,那这里我们直接选择快速配置就好,然后这里它就让我们选择你要使用哪个大模型呢?那我们可以看到你可以使用 gemine, 可以 使用 srappik, 可以 使用 openend codex, 可以 使用千万,对吧?可以使用 gitopilot, 也可以使用 hackbase 上面自己下载的这个大模型。 那刚才因为我们已经在本地上面部署了 java for, 所以 说这里我们选择 modividers, 然后进来之后我们可以观察到它多出了更多选项,比如说有智普的,有 kimi 的, 有 mini max 的, 有 kilo, 有 open code 的 等等等等。 那因为我们要选择本地部署大模型,所以说这里我们选择 custom endpoint 就 好,那在这里我们填写我们的 base url, 默认就是这个,大家记住就好,然后复制粘贴,然后这里他们选择填写这个 a j i key, 那 我们直接跳过就好,然后这里他们填写模型的名称,那我们就用填写刚才下载好的模型名称就好了。那这里是加码 four, 那 是 e c b 的 版本,这里他们选择上下文的长度,那我们直接回车默认检测就好。然后现在他们选择是否要进入聊天平台,那我们选择设置就好。 大家可以选择我们要接触聊天平台,比如说飞书,微信, telegraph, discord 都可以,那这里我们选一个菜单,那我们选微信,然后我们回车。先第一步它让我们设置我们的 telegraph, 那 我们只用找到这个 boat father, 创建一个新的 boat, 然后把 token 复制过来就好。 然后这里咱们选择谁能给这个 bug 发消息,那这里大家一定要好好选择,因为说如果你什么都不捡的话,那他就会默认所有人都给他发消息,并且他会回复。那这里我们只用填写我们自己的 user id, 如何获取你的 user id 呢?大家关注这个 bug, 然后给他发一条消息,他就会把你的信息返回过来。这里上我们选择是否要把我们的 user id 作为默认频道,那我们选择 yes, 然后现在他开始让我们选择登录微信了,那我们选择 yes, 把这个链接复制浏览器打开,扫描二维码登录 这里他让我们配置谁可以给这个 boss 发消息就私发消息。那第一个选项就是手动批准,第二个选项就是允许所有的私发消息,第三个选项就是只允许白名单,第四个选项就是谁都不能给我发,那我选择第一个选项就好。 然后这里他让我们配置谁可以建立群聊,然后发消息,他怎么处理群里面的消息?那有三个选项,第一个就是不允许群聊,第二个是允许所有的群聊,第三个就是只允许白名单里面的群聊,那选推荐选项就好, 然后这里他们选择是否要把我们的微信平台作为默认屏,那我们选择 yes, 现在我们已经全部配置好了,然后他问我们是否需要重启网关,那我们选择 yes。 现在配置完成后,他问我们是否需要立即启动,那我们选择 yes, 那 现在我们来接入微信使用,那我们可以看到因为它需要手动授权,所以说那我们在终端运行下这个命令就好。 ok, 那 这里显示已经授权成功了,我们再给他发消息试一下,我们可以看到它这里显示对方正在输入中给出了回复,那我们可以成功使用了。那刚才我们是使用本地部署的模型,那大家如果想切换和云端的话,那也非常简单,我们只用在终端输入这行命令。 hermes model, 然后在这里大家就可以自由切换了。那如果说这里找不到你想要的模型,那大家就可以自由切换了。 那在这里我选择 mini max china, 然后配置一下我们的 api key, 那 接下来配置我们的 base layer, 我 们把它复制过来,然后粘贴。那大家注意一个点,就说如果这里你不是点 com 结尾,而是点 i o 结尾,那就是配置到海外去了,所以说要保证你是点 com 结尾。 然后大家选择自己想要的模型,那我就选择二点七,那现在我们来测试一下。那如果说我们想要启动终端的聊天界面也很简单,我们输入 hermes chat, 我们给他打个招呼, 可以看到我们已经成功替换好的模型。朋友们,那这就是本期视频的全部内容,我是 jerry, 我 们下次再见。

大家好,今天是玩小龙虾的一天,最近爱马仕 agent 也比较火,今天就让他们自己和对方做一个比较,嗯?有什么优势?首先问小龙虾,最近有个 agent 很 火,它的特点是可以自我净化, 和我们有什么区别?哪个比较好?小龙虾就告诉我说,爱马仕 agent 主要注重于自主技能生成, 当 a 键为主,实现路径是将任务路径直接抽象为 scale。 小 龙虾侧重于哈尼斯基础工程加团队写作,就是多 a 键实现的路径是反思加更新配置文档 实现路径优化,也就说 opencloud 更新的是 markdown 文件,类似 a 键更新的是 scale。 然后小龙虾说,不要羡慕爱马仕, 我们的价格完全可以兼容他的理念,可以把壁环学习当做一个插件,直接集成到现有的逻辑中。我就跟他说,好吧,请你学习一下,更新到我们的配置中, 然后他就学会了可远近的 harness, 不 仅在改参数,还在动态地构建自己的 skill level。 然后我这边问一下爱马仕,你的前辈,小龙虾很火,它也具备自我进化的和记忆、做梦等功能。 这个和我们的自主优化 skill 有 什么区别呢?哪个比较好?爱马仕强调决策的内化与自主行动,不只是调用工具本身在参与决策。 但是我觉得小龙虾也在进行决策呀,建议是 openclaw 作为系统骨架,然后它作为这个大脑。然后我就问他为什么不让 openclaw 做大脑, 然后你作为执行呢?毕竟你可以自我进化, sky 准确率会越来越高。嗯,我觉得他的回答就不是很好,就到这里吧。嗯,对,两个 a j 接的都是揭秘模型,所以模型的智能程度是一样的。

ai agent 领域出了一个现象级的新项目,叫 hermes agent。 一 开始很多人不以为然,觉得这不就是又一个能调工具的聊天壳子吗?没什么新鲜的,但很快,几乎所有人都被打脸了。因为 hermes agent 压根就不是一个聊天壳子,它更像是一个自带净化能力、拥有超强记忆,而且还能全天候稳定运行的 ai 操作系统。 今天我们就来拆解一下,这个项目到底凭什么在短短两个月内就火遍了全网,甚至被认为有能力挑战之前的霸主 open call。 首先得搞明白这波热度的本质是什么。过去大家评判一个 agent, 主要看他聪明不聪明,能不能听懂人话、调工具。但现在风向变了,开发者们发现,一个 agent 就 算再聪明,如果跑几个小时就崩溃,或者换个平台就没法用,那他永远只能是个玩具。 大家开始集体下沉,关注更底层的工程问题。 hermes agent 正式抓住了这个转变。他在 get up 上的 star 数从一万飙升到快三万,靠的不是模型本身,而是他提供了一套完整的运行时设计,把工具都打包成系统。统一系统 就是他把命令行、消息网关,像 chrome 那 样的定时任务,还有安全沙箱,所有这些都打包成了一个统一的系统。换句话说, hermes 不 仅仅能陪你聊天,它更像一个可以七乘二十四小时在后台稳定运行的数字员工。 这解决的是 ai 从 demo 走向实际生产的最后一公里。所以说,到了二零二四年,我们可能已经不太关心 ai 聊得好不好,我们更关心的是它能不能像一个操作系统一样稳定地挂机干活。当然,如果一个 agent 只是稳定运行,那它本质上还是个高级脚本。 hermes 真正的杀手锏在于它能像人一样复盘,然后自我净化。 这就不得不提它内置的一套叫 k e p a 的 自我净化闭环系统。传统的 agent 要想学新技能,得靠开发者手动给他写 插件。但 hermes 不 一样,当他遇到一个没见过的复杂任务,哪怕失败了,他也不会简单地结束对话。他会启动一个反思,体验再深层的流程,一旦最后成功解决了问题,他会自动把这次的操作路径总结成一个结构化的技能文档,存进自己的技能库里。下次再遇到类似的问题, 它就不用从零开始推理了,直接加载这个经验包就行。这是一个从授人以鱼到授人以渔的根本转变。开发者不再需要像保姆一样提前预测 agent 会遇到什么坑,然后给他准备好所有工具, agent 自己就成了自己的架构师。这种能力生产的迁移,意味着企业如果想构建自己的私有化 agent, 成本会大大降低。 因为这个 agent 在 被使用的过程中,它的技能库是会自动扩容的。可以说, hermes 不 只是在使用工具,它是在通过卷自己来发明新工具。 而这种自我进化的能力,也直接导致了他和他的主要竞争对手 open club 在 底层逻辑上走向了完全不同的道路。这就引出了 agent 的 设计的另一个核心痛点,健忘和越权。记不住 n 胡乱操作等于可怕 一个 agent 如果记不住之前的对话,或者拿到权限后胡乱操作,那是非常可怕的。针对这点, henry 做了两手准备。首先是他的记忆系统,被很多人称为搜索引擎式大脑, 它用 sqlite 的 全网解锁功能,可以秒级调用几周前的对话记录,解决了 ai 短暂记忆的问题。而且它的记忆接口还是可插拔的,你可以接入像 hongq、 密姆林这些主流的记忆框架,非常灵活。 其次是安全,它设计了一套五层纵深防御体系,任何高风险的操作,比如删除文件、执行终端命令默认,都需要人工审批才能执行,这就给 a 政的行为上了一道锁。 这种设计其实就反映了专业级 a 证和玩具级 a 证的分水岭。对于企业用户来说,安全和持久记忆是绝对的刚需。你看 open klo 的 路线,更像是搞一个庞大的插件大杂烩,生态什么都有,但质量和安全参差不齐。而 hermes 选择了另一条路,它追求极致的架构、透明度和安全可控性。 也正因为如此,很多在金融、运维这些对稳定性要求极高的领域的团队,已经开始把系统从 open klo 迁移到 hermes。 毕竟一个好的 agent 应该像一个有记性而且守规矩的管家,而不是一个随时可能把房子烧掉的天才。好了,聊到这,我们来总结一下今天关于 hermes agent 的 几个核心要点。首先是定义上的眼镜,标志着 ai agent 正在进入操作系统阶段, 它的核心竞争力不再是单一的模型能力,而是通过命令行、消息网关和定时任务,构建了一套完整的工程化运行环境。 第二是它的核心竞争力,也就是 k e p a 系统,它具备自动生成技能的能力,通过反思生成存储的闭环, a 诊能把成功经验沉淀下来,实现能力的自我迭代,大大降低了人工维护成本。第三是记忆与安全,它引入了基于权威权威锁的记忆系统和五层安全防御, 解决了 a 诊健忘和跃权两大痛点,让它成为目前最适合企业自托管的智能体方案之一。最后一点是它的数据战略价值,它能和强化学习框架集成自动记录任务执行的完整轨迹, 这些包含了真实业务场景的数据是训练下一代更强大的工具。调用模型的宝贵原材料对于想自研模型的团队来说,这具有重要的战略意义。

二零二六年, ai agent 圈出了两个狠角色,一个叫 openclaw, 一个叫 hermes agent。 今天就客观聊聊,这两个框架到底谁更强。先说 openclaw, 它在 github 上拿了三十五万颗星,超越了 linux, 成为史上最受欢迎的开源项目。 它的核心卖点是本地优先 ai 直接操作你的文件、系统、浏览器和终端,所有数据都不离开你的电脑,隐私这块确实拉满了。 再说 hermes agent 出自 mouse research, 虽然只有五点四万颗星,但长得很快。他的杀手锏是自我进化,每次完成任务后,会自动生成可附用的技能,你用的越多,他就越懂你。 enchan 做过一组对照实验,光是优化外围的约束规则,任务准确率就从百分之五十二点八直接飙到百分之六十六点五。那到底谁更强呢?说实话,这俩不是取代关系,而是完全不同的路线。 openclaw 更像一个数字员工,执行力强,但不会自我学习。 hermes 更像一个会成长的助手,越用越聪明,但需要时间积累。如果你特别在意隐私和可控性,选 openclaw 准没错。 如果你希望 ai 越用越懂你,那 hermes 更适合你。搞不好未来这两条路线会融合。关注我,带你持续追踪 ai 前沿。

你有没有感觉到,现在的 agent 虽然好用,但它像是一个静态的脚本,换个环境就失忆了。我们要聊的 hermes agent, 它不是又一个聊天机器人,而是一个能在云端长驻,从经验中自我进化,随时间变得越来越懂你的个人 ai 代理操作系统。 目前该项目已经在 tiktok 上获得了三十四点四 k 的 star。 我 们首先来看它到底是什么。在理解 hermes 之前,先忘掉你对 ai 聊天的所有印象。市面上的 ai 聊天就像一个计算器,你问他答官创级归零。但 hermes agent 像一台虚拟计算机, 它拥有长期记忆,有持续进化的闭环,由 news research 那 个打造了顶级开源大模型的团队专门为执行任务而设计。 下面我们来看一下它能帮你做什么。这个场景比你想象的更硬核,比如它能定时自动备份数据库,它能在三个月后通过 f t s 五数据库精准定位你当时讨论的技术细节。它能通过子代理自动拆解重构代码的任务。 最重要的是,它能操控网页操作终端,无论你在哪儿,都能在 telegram 上随时唤醒它。但 hermes 最独特的地方在于自我进化,每一次任务执行,它都会评估是否具有可附用性。如果可以,它会自动生成四 q 技能包。下次遇到同样的问题,它不再思考,直接执行。 比如,你让 hermes 第一次部署一个都可容器,它可能需要五个步骤,完成后,它自动将这个过程封装为 sq。 当你下次继续让它部署 daker 时,它直接调用这个 sq。 这时可能它只需要一步就可以完成容器的部署,而且如果在这个过程中或者以后发现更好的做法, 它会自动更新这个 skill。 hermes 的 记忆不是简单的保存聊天记录,它是一个多层的知识管理体系,可以将重要的信息主动存储为永久笔记跨绘画保留在羽翼搜索上。拥有 f t s 五权威锁影加 l l m 加样, 而且它可以更好地理解用户的身份偏好以及沟通风格。这样配合 m c p 协议,它拥有了类似插槽一样的无限扩展性,不管是数据库、 github 还是 i o t 设备,插上就能用,无需改动一行代码。 很多人可能会好奇它和 openclaw 的 关系。 openclaw 是 开元界的一个标杆,它曾定义了个人 ai 代理的品类。而 hermes agent 则是 news research 为了走向工业级生产力进行的架构重构。 他舍弃了碎片化的脚本管理,转向了协议驱动的操作系统模式。这就像是从手动改装车进化到了标准化生产线。 社区的主流共识是 open core 擅长多渠道运营,团队工作,流合即是生态广度。 hermes 擅长自我进化、长进记忆、模型推理和长城自治任务。 如果你是 open 跨的老用户,并且想尝试 hermes 的 话,这里以 hermes 贴心地提供了一键迁移命令,可以自动导入你的人格文件、记忆技能、 api 密钥和平台配置。 下面说下如何对 hermesign 进行本地部署,在该项目的路径终端下,直接一键运行这个自动安装脚本。 yes! 继续。 现在在问,我们是否要把之前在 opencloud 中积累的资产和配置直接搬运到当前的 hermes 中,这里选择 yes, 确定导入,点击回车,这里配置模型。我以中转平台为例,选择更多提供商。按回车 选择,这里输入中转平台的 u r o, 在 这里填入 u i, 然后输入 api, 这里显示着这个中转平台所支持的全部模型。 我打算使用 mini max。 二点五,在这里填入该模型的名称或者序号,然后按回车即可。配置好模型, 这里问我们需要多少的上下文长度,一般选择默认直接回车就可以,这里按回车,这里呢,可以在相关的 app 上配置机器人,以方便操控 hermes。 配置机器人很简单,按照流程走即可,这里就不过多注数了。 yes 开始, 我们现在已经成功进入了 hermes 的 交互页面了,现在我让他去介绍一下自己的能力, 可以看到他是一个终端 ai 助手。下面是他的核心能力,他拥有对话与推理、调用工具、 任务编排、记忆与持久化,以及多平台操控的能力。这里显示着当前模型的上下文长度,一共是一百二十八 k, 我 们本轮对话使用了十六点二 k, 也就是占了全部上下文的百分之十三。输入命令,看一下他现在所拥有的技能, 这里应该是一个应用商店的设置页面,让它去展示一下已经安装好的技能。可以看到这里面有很多技能是已经安装好的。注意看,这里的两个技能是从 opencloud 中导入过来的,这也说明了从 opencloud 中的迁移是成功的。什么时候想退出程序,直接按 ctrl c 即可。 然后这里有个提示,让我们重新加载终端,这里重新加载一下,如果我们仅仅只是想在终端进行使用它,这样直接输入这个 hermes 即可。 如果我们想要它在后台持续运行的话,直接运行这条命令便可启动网关。以上就是 hermes 在 linux 系统上的部署过程,当然它也支持 mocs 以及 wsl 二部署。在使用 hermes 的 过程中,遇到问任何问题都可以使用 doctor 命令自动诊断 编辑点搜为文件,可以自定义 agent 的 人格,你可以为不同项目创建不同的人格,并通过 personality 命令动态切换。 好了,以上就是本期关于 hermes 的 介绍,如果你觉得这个数字员工对你的工作留有启发,记得点赞关注,那么现在去 get up, 把他拉下来吧,别让他在你的终端里吃灰,去指挥他,让他成为你最得力的那一位同事。


龙虾过时,爱马仕来了,这款随你成长的智能体 hermes agent 已经彻底赢麻了,自主净化加安全防御加无缝迁移,无痛继承小龙虾的全部资产,完美取代 open club。 话不多说,试过才知道。首先点我视频右下角分享复制链接,接着返回手机桌面,打开这个蓝色的工具箱,没有的在应用商店安装,打开后在这里搜索隐身资源,会弹出一个资源包,打开找到软件右下角保存,就可以去安装体验了。