ai agent 领域出了一个现象级的新项目,叫 hermes agent。 一 开始很多人不以为然,觉得这不就是又一个能调工具的聊天壳子吗?没什么新鲜的,但很快,几乎所有人都被打脸了。因为 hermes agent 压根就不是一个聊天壳子,它更像是一个自带净化能力、拥有超强记忆,而且还能全天候稳定运行的 ai 操作系统。 今天我们就来拆解一下,这个项目到底凭什么在短短两个月内就火遍了全网,甚至被认为有能力挑战之前的霸主 open call。 首先得搞明白这波热度的本质是什么。过去大家评判一个 agent, 主要看他聪明不聪明,能不能听懂人话、调工具。但现在风向变了,开发者们发现,一个 agent 就 算再聪明,如果跑几个小时就崩溃,或者换个平台就没法用,那他永远只能是个玩具。 大家开始集体下沉,关注更底层的工程问题。 hermes agent 正式抓住了这个转变。他在 get up 上的 star 数从一万飙升到快三万,靠的不是模型本身,而是他提供了一套完整的运行时设计,把工具都打包成系统。统一系统 就是他把命令行、消息网关,像 chrome 那 样的定时任务,还有安全沙箱,所有这些都打包成了一个统一的系统。换句话说, hermes 不 仅仅能陪你聊天,它更像一个可以七乘二十四小时在后台稳定运行的数字员工。 这解决的是 ai 从 demo 走向实际生产的最后一公里。所以说,到了二零二四年,我们可能已经不太关心 ai 聊得好不好,我们更关心的是它能不能像一个操作系统一样稳定地挂机干活。当然,如果一个 agent 只是稳定运行,那它本质上还是个高级脚本。 hermes 真正的杀手锏在于它能像人一样复盘,然后自我净化。 这就不得不提它内置的一套叫 k e p a 的 自我净化闭环系统。传统的 agent 要想学新技能,得靠开发者手动给他写 插件。但 hermes 不 一样,当他遇到一个没见过的复杂任务,哪怕失败了,他也不会简单地结束对话。他会启动一个反思,体验再深层的流程,一旦最后成功解决了问题,他会自动把这次的操作路径总结成一个结构化的技能文档,存进自己的技能库里。下次再遇到类似的问题, 它就不用从零开始推理了,直接加载这个经验包就行。这是一个从授人以鱼到授人以渔的根本转变。开发者不再需要像保姆一样提前预测 agent 会遇到什么坑,然后给他准备好所有工具, agent 自己就成了自己的架构师。这种能力生产的迁移,意味着企业如果想构建自己的私有化 agent, 成本会大大降低。 因为这个 agent 在 被使用的过程中,它的技能库是会自动扩容的。可以说, hermes 不 只是在使用工具,它是在通过卷自己来发明新工具。 而这种自我进化的能力,也直接导致了他和他的主要竞争对手 open club 在 底层逻辑上走向了完全不同的道路。这就引出了 agent 的 设计的另一个核心痛点,健忘和越权。记不住 n 胡乱操作等于可怕 一个 agent 如果记不住之前的对话,或者拿到权限后胡乱操作,那是非常可怕的。针对这点, henry 做了两手准备。首先是他的记忆系统,被很多人称为搜索引擎式大脑, 它用 sqlite 的 全网解锁功能,可以秒级调用几周前的对话记录,解决了 ai 短暂记忆的问题。而且它的记忆接口还是可插拔的,你可以接入像 hongq、 密姆林这些主流的记忆框架,非常灵活。 其次是安全,它设计了一套五层纵深防御体系,任何高风险的操作,比如删除文件、执行终端命令默认,都需要人工审批才能执行,这就给 a 政的行为上了一道锁。 这种设计其实就反映了专业级 a 证和玩具级 a 证的分水岭。对于企业用户来说,安全和持久记忆是绝对的刚需。你看 open klo 的 路线,更像是搞一个庞大的插件大杂烩,生态什么都有,但质量和安全参差不齐。而 hermes 选择了另一条路,它追求极致的架构、透明度和安全可控性。 也正因为如此,很多在金融、运维这些对稳定性要求极高的领域的团队,已经开始把系统从 open klo 迁移到 hermes。 毕竟一个好的 agent 应该像一个有记性而且守规矩的管家,而不是一个随时可能把房子烧掉的天才。好了,聊到这,我们来总结一下今天关于 hermes agent 的 几个核心要点。首先是定义上的眼镜,标志着 ai agent 正在进入操作系统阶段, 它的核心竞争力不再是单一的模型能力,而是通过命令行、消息网关和定时任务,构建了一套完整的工程化运行环境。 第二是它的核心竞争力,也就是 k e p a 系统,它具备自动生成技能的能力,通过反思生成存储的闭环, a 诊能把成功经验沉淀下来,实现能力的自我迭代,大大降低了人工维护成本。第三是记忆与安全,它引入了基于权威权威锁的记忆系统和五层安全防御, 解决了 a 诊健忘和跃权两大痛点,让它成为目前最适合企业自托管的智能体方案之一。最后一点是它的数据战略价值,它能和强化学习框架集成自动记录任务执行的完整轨迹, 这些包含了真实业务场景的数据是训练下一代更强大的工具。调用模型的宝贵原材料对于想自研模型的团队来说,这具有重要的战略意义。
粉丝2.2万获赞29.3万

如果你关注 ai 资讯,这几天应该听过被吹成龙虾接班人的 hermit agent, 号称能自我净化,更安全更省钱。但吹的人多用的人少,我真用了。 先说结论,他不是龙虾接班人,他是 top 合化路,几乎每项测试都比龙虾 f 最高差九倍。测试方法很公平,同模型同网络同提示词,初始状态用原声 web ui 和 c r i 对 话。 先看用 sv 计划超级马力的测试,科密斯烧掉二百七十九万, top 肯,然后四肢分离不忍直,龙虾用了五十五万,起码有点像。 然后是查两个模型的定价并列表,科密斯花了两百万, top 耗时十分钟失败,龙虾消耗二十一万, top 肯几十秒成功。 最后是写贪吃蛇游戏,科密斯烧了二百二十三万逃坑,不知道画了啥,按任意键退出,龙虾花了三十一万,看着有点像,但其实键盘是无效的,都失败。 除了纯聊天,稍微需要调用公寓的情况,科密斯都不配跟龙虾比。我看过项目文档,写的确实有逼格,用户发现只要你足够弱智,那么金化空间也确实足够大,谁追他都别信。

别再盯着那些贵的要死的云端 ai 看了,今天咱们聊聊这个在 get 上狂揽四万星的开源神器 hermes agent。 很多人问,现在 agent 产品这么多,凭啥大家都在喊着要换掉 open claw? 说白了就是因为这玩意太划算了, 你不需要去付那些每个月几百块的订阅费,只要花五美金租个最便宜的服务器,就能在你家服务器里养个二十四小时在线随叫随到的 ai 打工人。 他不是那种用完就没用的工具,能把数据和记忆全都留在你自己手里,而且还会自己攒技能自己进化。今天我就带你把这层窗户纸捅破,看看这个会成长的 agent 到底凭什么这么猛。 咱们先看这东西到底长啥样。他跟那些你得点开网页才能用的云端 ai 完全不是一个逻辑,他是一个能直接跑在你自家服务器上的自主 a 阵。说白了,他就是个住在你电脑里的私人助理。他有六大本事,能像真人一样帮你干活,能定时自动执行任务,还能在沙河里安全的操作网页。 他极其省钱,你一个月花五美金做个最基础的服务器,就能把它跑起来,数据也全在你自己手里,不用担心泄露,而且你不用担心找不到他。他有个专门的网关进程,你不管是用海外常用的社交软件,还是咱们常用的飞书、企业微信,只要发个消息他就能立刻响应。 他甚至还搞了一套开放的技能标准,你在社区里看到的各种厉害功能,都能直接装到你的这个助理身上。你可能会问,这东西跑在服务器上,我怎么跟他说话呢?总不能天天盯着黑乎乎的命令型窗口吧?这就是他最聪明的地方。他自带一个网关功能, 能把你常用的所有聊天软件都变成他的指挥部。你在常用的社交软件上给他发个指令,回到电脑前,他已经在后台帮你把活干完了。你甚至在路上给他发条语音,他也能自动转写并继续处理。不管是国外的社交工具,还是咱们国内的飞书企业微信,他都能无缝接入。 你不需要为了用它去专门学一套新软件,它就是你所有聊天工具里的一个超级插件。很多人用 ai 觉得不好用,最核心的痛点就是这玩意没记性,你今天教他怎么写代码,明天他就全忘了。但 hermes agent 不 一样,他专门设计了一套记忆机制,解决了 ai 失忆的问题。 它在运行的时候会自动维护两个核心文件,一个是 m e m o r i, 点,里面记的是它干活时的环境信息和以前踩过的坑。另一个是 us 点,这才是最关键的。里面记的是你的个人偏好和工作习惯。 比如你习惯用哪种编程风格,或者你习惯几点看日报,他都记在心里。而且他还支持跨绘画解锁,他能翻出你几楼前跟他聊过的内容。所以你每次跟他说话,他都不需要你从头开始教,他能直接接上之前的思路,这才是真正的私人助理。 如果说记忆是让他不忘初心,那技能进化就是让他越干越精,这是最让我觉得这东西厉害的地方。普通的 ai, 你 每次让他干个复杂活,他都得重新在那思考推理试错,这不仅慢,还被 token。 但 hermes agent 有 个本事, 只要他完成了一个比较复杂的任务,比如他连续调用了五次以上的工具才搞定,他就会自己总结经验,把这一套操作流程写成一个结构化的技能文件,也就是咱们常说的 sop。 下次你再提类似的要求,他根本不用重新思考,直接调取这个技能文件,像熟练工一样直接上手。 如果他在干活的时候发现有更简单的办法,他还会自己把这个技能文件给更新了。这就意味着,你用他时间越长,他处理重复性工作的效率就越高,简直就是一个会自我进化的数字员工。如果你觉得前面这两层已经够牛了,那最后这一层才是 nasa research 真正想跑通的杀手锏。 这层逻辑叫训练数据回流。大家想一想,这个 agent 在 每天帮你干活的过程中,它产生的所有工具调用、记录所有的操作轨迹,其实都是最高质量的训练数据。 promise agent 内置了批量生成这些轨迹的功能,还可以接入强化学习环境, 这意味着这些数据可以直接被拿去训练下一代的大模型。这形成了一个完美的闭环,既已沉淀成技能,既能产生高质量数据数据。反过来训练模型模型变强了,再回到 a 阵身上,让它变得更聪明。这已经不是简单的用工具了,这是在构建一个能够自我净化的 ai 生命体, 私有 ai 的 智能化时刻真的来了。说了这么多元理,这玩意到底能怎么用?我给你举两个最典型的例子,第一个场景就是搞情报监控,你不需要每天自己去刷 get up 或者 read it, 看有没有新动态,你只需要给他写一句指令, 让他每天早上八点准时去扫一遍,然后把摘药发到你的社交软件上,他就在后台默默的干活,你根本不用管,这就是真正的无人值守。第二个场景是咱们搞开发的同学最关心的带记忆的编程搭档, 它不像普通的 ai, 问一句忘一句,它能记住你整个代码库的结构,记住你写代码的习惯。你甚至可以让好几个不同的 agent 组队,一个负责写逻辑,一个负责写测试,它们之间还能互相发消息,分工协助,这可比你一个人对着一个对话框在那反复解释要高效得多。 比如你想盯着某个开源项目的更新,或者想第一时间知道 reddit 上某个技术话题的热度,你以前得每天手动去刷,现在你只需要给他下个指令,告诉他每天几点去干什么, 他就会像个勤快的实习生一样,在后台帮你把信息抓回来,总结好重点,然后直接弹到你的手机上。你睡觉的时候他在干活,你起床的时候情报已经整理好了,这种信息找人的感觉才是真正的自动化。 再来说说编程,很多开发者用 ai 最痛苦的就是每次开心对话都要重新把代码结构命名,习惯跟他解释一遍,但是 miss agent 记住了你的代码库,也记住了你的习惯,他就像个跟你配合了三年的老搭档,你一个眼神,他就知道该用哪个模块, 而且他现在已经开始支持多 agent 写多了,你可以让一个专门负责写代码的 agent 去跟另一个负责跑测试的 agent 配合,他们之间能互相发消息分工,这种专业级的写作能力才是他能真正进入开发流程的关键。 你可能会问,这东西更新这么快靠谱吗?其实你看他的版本眼镜路线就能发现,拉斯 research 的 思路非常清晰, 他们不是那种只追求噱头的团队。在 v 零零零零零后,我们把精力全放在了安全加固上,先把底盘打牢,防止凭证泄露。到了 v 零七点零,重点变成了长期运行能力,解决的是怎么让 agent 在 服务器上稳稳当当的跑几天几夜不崩溃。 到了现在的 v 零八点零,他们才开始发力,智能进化。这说明他们很清楚,一个要二十四小时驻留在你服务器上的 agent, 最大的敌人从来不是不够聪明,而是跑着跑着就罢了,或者安全性不够。这种先求稳再求治的逻辑才是真正做工程的思路。 最后咱们说点实在的,这玩意到底怎么上手?其实门槛低的让你不敢相信。如果你有一台 linux 或者 mac 的 服务器,直接复制官方给的那行安装命令或车搞定,装完之后跑一下 setup, 填一下你的 api key, 选好你想用的模型, 比如用 open router 接个便宜模型,成本低到可以忽略不计。如果你想让它像个真正的员工一样,机器重启了也能自动起来, 再跑一下 vivo install, 注册成系统服务就行。如果你之前是用 opencloud 的, 别担心,它专门有个迁移命令,一键就能把以前的设置和记忆全搬过来。说真的,折腾这几分钟,你就能拥有一个专属的赛博员工,这性价比你细品。讲到最后,咱们得看透这件事情的本质。 为什么这个项目能让这么多开发者兴奋?因为这帮做 hermes agent 的 人本身就是搞大模型训练出身的,他们比任何人都清楚大模型在工具调动上哪里会犯错,也更清楚如何通过数据闭环来解决这些问题。 所以他们做的不是一个简单的插件,而是在尝试一种全新的范式。现在的云端 agent 还是用完即走的托管模式,数据和记忆都留在平台手里, 但 hermes agent 走的是另一条路,把能力留在用户手里,让 agent 变成一个私有的、常驻的、能自我净化的生命体。当 agent 开始自己积累技能,自己深层训练数据,再把这些沉淀未回模型的时候,我们离真正的自净化 ai 系统就不远了,私有 ai 的 自净化时刻可能真的已经来了。

ai 行业的龙头企业如今在黑客眼中已成为待宰的羔羊。近期迅速走红的开源项目 opencloud 上线仅六十三天便被检测出一百三十八个漏洞,其插件库中四分之一的程序为木马程序。而当下更为强大的工具 hermes agent 登场, 该工具具备自主学习能力,无需人工过多干预,完成任务后还能进行自我反思,并自主编辑新的技能包。 令人意想不到的是,引发 ai 领域这场改革的竟是一群币圈集客,他们持有估值达十亿美金的 token, 利用去中心化的算力来训练大模型,因此不应紧将目光聚焦于大型企业,真正能够改写 ai 行业规则的,或许正是这群涉足 web 三领域的创新者。

如果你还在折腾 openclaw, 先停一下。最近 github 上有个叫 hermes agent 的 项目彻底杀疯了,不到两个月狂揽五点二万颗星,甚至引发了抛弃龙虾换爱马仕的迁移潮,它是第一个真正意义上越用越像你的自进化 ai。 今天我们就来拆解一下这个引爆全网的赛博分身神器,到底凭什么取代 openclaw 的 王者地位。 过去的 agent 患有严重的赛博失忆症,你今天花了一个小时教会他怎么处理你的表格,明天重开一个对话,他又是一脸懵。像 open cloud 这类框架,他的记忆是静态的,本质上是把你写进配置文件的信息拿去读。 而 hermes 的 记忆是动态的,他会在跨绘画中主动理解你的偏好。用传统 agent, 你 是在用工具。用 hermes, 你 是在养助手。 hermes agent 的 口号是, the agent that grows with you。 与你共同成长的 agent, 它最大的创新点就是自生长 skill 闭环。 传统的 agent 是 你给他写好规则,他去执行。而 hermes 是 在干活的过程中自己总结经验,当他帮你解决了一个复杂的问题,它会自动把这个过程提炼成一个 skill, 甚至还会自己给自己打补丁优化。这是一个能自我进化的赛博学徒。 记这么多东西,消耗的 token 岂不是要爆炸?这就要说到 hermes 的 四层记忆架构了,他没有把聊天记录一股脑塞给模型,而是像人类大脑一样分层,每次对话只加载最核心的偏好,历史记录存在本地,需要时才去解锁 技能文件,平时只看个名字,用到了才读全书。他甚至会暗中观察你的工作习惯,默默在后台给你建个画像, 这才是真正的懂你。很多人觉得 agent 能调用的工具越多越好,但 hermes 的 设计哲学恰恰相反,它极其克制。虽然它内置了几十种工具,但它绝对不会把这些工具全开着让大模型去拆,而是采用 two set 按需激活机制。 这种克制的调用机制极大降低了 ai 的 选择困难症,不仅速度更快,还从根本上减少了 ai 的 幻觉。 那么,老牌王者 openclaw 和新晋顶流 hermes 到底怎么选?龙虾是一个灵活的通用工具箱,靠多 agent 协同,适合做一次性任务或明确的工作流。而 hermes 是 一个单一 agent 的 深度循环,适合长期深度的项目执行。 现在的流行玩法是用龙虾做手脚去执行杂活,用 hermes 做大脑来沉淀经验,两者配合简直无敌。 那么, hermes 适合哪些人?如果你是自媒体创作者,他能潜移默化地学会你的写作风格和排版偏好。 如果你是运维工程师,凌晨爬起来修好的 bug, 他 会自动写成运维 skill, 下次直接调用。如果你是数据分析师,你的数据清洗以及分析套路,他用一次就学会,这已经不是在用工具了,这是在打造你个人的数字大脑。 别小看这个开源项目,这个背后拿了七千万美元融资的团队有着更大的野心。他们做 hermes 的 真正目的是打通一条数据闭环。你平时用 ai 攒下的技能,都会变成极佳的训练数据, 他们想让每一个普通人的电脑都成为未来训练更强大开源模型的节点,打破科技巨头的算力垄断。 最后我想说,我们正在经历从工具思维到伙伴思维的范式转变。传统的 ai 就 像一把锤子换一把没区别,但 hermes 揭示了 ai 的 未来,它应该是一种可以长期积累的数字资产, 谁能在时间里攒下更多的专属技能和记忆,谁就能享受到 ai 效率的指数级复利。

openclaw, 对 不起,我怕 hermes 误会!最近 ai agent 圈子里发生了一件大事, github 上一个叫 hermes agent 的 开源项目,两个月时间狂揽六万星,平均每天新增几千个关注, 直接冲上 github 川定第一名。更夸张的是,很多原本用 openclaw 的 开发者都在悄悄地迁移到 hermes。 今天就来聊聊 hermes agent 到底是什么?为什么这么多人开始移情别恋? hermes agent 是 什么? 先说结论, hermes agent 是 一个会自我进化的 ai 智能体,是一个会自己变聪明的 ai 助手。从你使用 hermes 的 那一刻开始,它就会开始自动写入记忆,自动提炼 skill, 自动优化工作流。简单来说,你用的时间越久,它对你的理解越深,工作越高效。 不是你在训练他,而是他在训练自己。 hermes agent 是 news research 在 二零二六年二月发布的开源 ai agent 框架。 hermes agent 的 核心特点用官方的话说叫 the agent that grows with you。 一个和你一起成长的智能体。这个项目被社区认为是 openclaw 上线以来第一个真正意义上的竞争对手。那 hermes agent 和 openclaw 具体有哪些区别? 这里我总结了四个方面的区别。区别一,龙虾是网关, hermes 是 引擎。 open cloud 的 核心是一个 gateway, 它通过一个强大的系统来协调多个智能体,通过复杂的编排来完成任务。 你可以把它理解成一个指挥官,它告诉每个 agent 该做什么,然后把结果整合起来。这种设计的好处是灵活、强大、可扩展。你可以接入多个平台,可以运行多个 assistant, 可以 处理复杂的多 agent 协助任务。但是它有一个问题,每次任务都是从零开始。 openclock 没有原生的技能学习层, 你让它做一百次同样的任务,它还是会用同样的方式处理,不会变得更快更好。它有工具,有指令,但是它不会积累经验。 hermes agent 的 核心则是 agent 自身的执行循环,它不是通过外部系统来增强能力,而是把能力内化到 agent 的 本身。工具调用、记忆、交互、执行模式都是 agent 自己的能力,不是外部系统赋予的。 这种设计的核心优势是 agent 会学习、会进化、会适应。区别二, hermes 是 会自己写技能的 agent。 这是 hermes 最有意思的地方,当他完成一个复杂任务后,通常涉及五次以上。工具调用会把整个过程沉淀成一份结构化的技能文档,存成 markdown 文件,下次遇到类似任务,直接加载这份技能,不用从头解决。 更关键的是,这些技能在使用过程中会自我迭代。如果 agent 在 执行技能时发现了更好的方法,它会自动更新技能文档。 openclaw 也有技能系统,但主要依赖人工编辑和社区贡献的技能市场。 clawhab hermes 这边等于把写技能这件事也交给了 agent 的 自己。区别三,记忆体系的差异。 两者都声称有跨绘画记忆能力,但实现方式不同。 hermes 用 sq lite 数据库配合全书解锁,把所有历史对话存下来,需要时通过搜索加摘要召回。他把记忆分成两层,一层是常驻的关键信息,写在 memory 点 md 里,每次对话都带上。 另一层是全量历史解锁。 open cloud 的 记忆则是工作区里的 markdown 文件,走的是文件及记忆的路线,通过语义解锁工具来查找, 在上下文压缩前会执行一次静默记忆写入,防止压缩丢信息。简单说, hermes 更像是给 agent 装了一个搜索引擎式的大脑, openclaw 更像是给他一个笔记本。 区别四,安全思路也不一样。 hermes 搞了一套五层纵深防御、用户授权、危险命令审批、容器隔离、屏距过滤、上下文注入扫描、 默认对高风险操作,比如执行终端命令、写文件要人工审批,超时未批准就自动拒绝。 openclaw 这边则更强调信任模型和配置审计,它提供了 openclaw security audit 命令, 可以一键扫描网关配置的安全隐患。但 openclaw 在 安全方面的历史记录不太好看,今年二月被曝出多个高危漏洞,十三点五万个实例暴露在公网上, 技能市场也有超过三百个恶意技能被发现。这也是为什么很多安全意识强的开发者从 opencloud 迁移到 hermes 的 重要原因。那 hermes 就 完美无缺了吗?当然不是,它的生态还很年轻,社区技能库远不如 opencloud 丰富, 如果你需要大量现成的工具集成, opencloud 仍然是更好的选择。另外, hermes 的 学习循环需要时间积累,前期体验可能不如 opencloud 那 么开箱即用。但关键在于, hermes 代表了一个新的方向, ai agent 不 应该只是工具的集合体,而应该是一个会成长的数字伙伴。 open club 的 哲学是我给你足够多的工具,你自己组合。 hermes 的 哲学是 我跟你一起工作,从经验中学习,变成你的专属助手。这两种哲学,哪一种更符合未来市场?正在给出答案。好了,本期的分享就到这里,我们下期见。

不到两个月,在 gitlab 狂揽五万多新,甚至引发全网开发者集体探讨 oppo cola 的 开源项目到底有什么魔力?今天带大家硬核拆解 news research 最新发布的杀手级开源项目 hermes agent。 那 hermes 到底是什么?最核心的定义, 它是一个 ai 员工,而不是 ai 工具。绝大多数 agent 只是个聊天窗口,关掉就失忆。但 hermes 主打 an agent that grows with you, 它驻留在你的服务器后台,通过持久记忆和技能的自生长,把你的复杂问题固化成可复用的经验,越跑越快。为什么它能火的这么快?除了趁着最近 antripic 接口收紧, 欧本胯遭遇冲击的时机,它靠的是硬实力,跑通了技能自净化的闭环,做到了完全零锁定,两百多个模型随时切换, 并且内置了统一消息网关和真沙箱环境,简直是打造一人公司的神器。提到 agent, 必然要拉出来跟 open core 做个对比,大家看这张表就很清晰了, open core 偏向本地桌面,执行技能靠人工维护,适合小白快速上手。 而 hermes 则是服务器端持续驻留 agent 自动生成和优化技能,跨平台覆盖极广,更适合追求持久自动化流水线的开发者。在我们目前看到的 v 零点八点零版本中,它拥有六大核心能力, 其中最惊艳的就是全平台统一消息网关、一个进城同管纸、飞机、飞书、钉钉等十五个平台,配合他的子 a 阵、 b 型委托和六种间杀相执行后端,相当于你拥有了一个不会互相干扰及其安全的后台处理中心。作为 ai 产品经理,我认为它拉开差距的核心在于这套三层记忆系统,它不是简单的大模型上下文, 而是从短期推理上下文沉淀到 memory d m d 的 情节记忆,最后自动把完成的复杂任务提炼成 c q 文档,变成它的程序记忆,下次遇到类似任务直接调用,大大节省 token, 这就是真正的越用越聪明。 看到这,很多没有服务器基础的小白可能被劝退了,但其实它的安装门槛非常低。不管你是 linux marcos 还是安卓手机的 termax, 只需要复制这一行脚本命令,系统会自动帮你配好拍摄环境,跑一下 hermes setup, 跟着向导走,几分钟就能搞定,日常使用也非常丝滑。 hermes 会在服务器后台自动创建定时任务, 抓取、翻译、推送一气呵成,并且把这个流程保存为专属技能,下次完全无人值守。如果你是 open cloud 的 老用户,舍不得积累的数据怎么办? hermes 内置了全自动的迁移工具,只需敲一行代码, hermes cloud migrate, 你 的记忆、数据、技能、工作流,甚至 api key 都能一键无痛迁移过来。那么问题来了,到底该选谁?如果你不想折腾,只需要桌面端自动化,选 open cloud。 但如果你有基本的折腾能力, 想要一个真正自主不被模型锁定 ai 员工, hermes 绝对值得你立刻部署。官网和开源地址我已经放在简介里了,别忘了点赞收藏,我们下期见!


星标六万加 hermes 成 openclaw 最强对手,他凭什么能这么火?这个开源 agent 的 最大特点是能跟你一起成长。二月上线 github, 星标超六万多,平均一周一个大版本, 两百四十多人贡献,合并一千四百个 p r 太恐怖了。核心特性有六个陪你成长,越用越强,定时自动化并行处理,沙盒隔离操控浏览器, 最低五美元,云服务就能跑,闲置时几乎不花钱。架构设计兼顾了成本和扩展性,你觉得开源 agent 谁能笑到最后?

大家好,我是麦东。最近 emulus engine 在 github 上非常火,很多人拿它和 openclaw 做对比,甚至有人说 emulus engine 已经可以完全替代 openclaw 了。 这两天我也下载安装了 emulus engine, 自己深度体验了一下。先说结论,第一点, emulus engine 整体确实比较清亮,响应速度也比较快,用户的直观体验会比较好。第二点,也是我觉得最核心的一点,就是它的自我净化能力, 当你让他去处理一些比较复杂的任务,如果这个任务完成了,他会自动把这次已经跑通的任务过程分装成 skill, 后面再遇到类似的任务的时候就可以直接服用, 整个过程是完全自动的,不需要你做任何操作。这个点我自己实测下来还是挺惊艳的。第三点,他的执行过程是比较透明的,你能比较清楚的看到他是怎么思考怎么工作的,这点我自己也比较喜欢, 因为很多时候不怕 engine 工作慢,怕的是你根本不知道它现在卡在什么地方。当然, emulus engine 作为一个新项目,它现在也有很明显的短板。 和 open color 相比,它在模型接入平台支持这些地方性阶段还是有很大的差距的。比如它现在就不支持接入国内常用的飞书解微信。 另外,在安装这块, emulus engine 目前只支持在 linux 和 macos 上直接安装,如果你想装在 windows 上,那就要通过 str 来部署, 不能直接原声装在 windows 里。还有一点, amazon 是 纯命令行运行的,没有 u i 界面,所以如果你本身不太习惯命令行,或者你更喜欢那种可直观一点的使用方式,那前期可能会有一点适应成本。再往后还有一个差异,就是在多 a 键的协助这块儿, urmars engine 和 openglar 的 差异其实还挺大的。 openglar 原生就支持更复杂的团队调度和角色分工,而 urmars engine 的 核心更像是单体自动化的 engine。 如果你想搭一个固定角色的团队,那通常就需要同时运行多个完全隔离的 urmars engine。 不 过它也提供了 profiles 这套机制,可以用来跑多个互相隔离的 engine。 这个点如果大家感兴趣,我后面也可以单独再出一期视频来讲。 所以如果你问我 airspace engine 现在是不是已经可以无缝替代 openclaw, 我 自己的判断是还没有。它确实有很亮眼的地方,尤其是自动沉淀 skill、 自我净化这个点。但如果你已经深度依赖 openclaw, 并且围绕它搭了一整套工作流,那你现在想直接无缝切过去其实还是比较困难的。 好了,前面先把结论讲清楚了,接下来我们就来带大家一起从安装到配置再到使用实际体验一下 amazon。 首先是部署,我们参考官方文档,复制安装命令,打开终端,粘贴命令,按下回车即可。 amazon 已经开始自动安装了, 安装时间受网络因素影响,不太固定,大家耐心等待即可。 好了, emirates engine 已经部署好了,部署好了之后,它会检测你当前系统里面有没有安装 openclaw。 如果安装了,它可以直接导入一部分 openclaw 相关的内容。这里提示我们是否需要看一下哪些可以被导入的,我们直接选择 yes, 可以看到这边有一个物理 import, 这里面的内容就是即将从 openclaw 导入 emersonant 里面的内容。我们可以看到导入内容包含 openclaw 的 sword 点 m d, daily memory memory 点 m d, user 点 m d 以及一些 skills。 接下来我们同样输入 y, 按下回车即可。好, openclaw 相关的配置已经成功导入到 emersonant 了,下面我们就开始进行 emersonant 的 一些触手化配置。 我们选择第一个 quick setup, 也就是快速配置。首先第一步选择模型,可以看到首页默认都是国外的一些模型厂商,我们选择 more providers。 在 这边我们可以看到国内的一些厂商了,比如智普, kimi, mini max 等等。如果你当前就是使用的这些厂商的模型,那么你直接选择就可以了。如果你所使用的模型厂商不在这里面也没关系,我们选择 custom endpoint 自定义就可以了。 应用模型只要是兼容 open ai 格式的都可以的,国内模型厂商提供的透根不烂,基本都是可以满足需求的。 我们只需要去它对应的控制台里面拿到 url 以及 api key 就 可以了。 url 输入完成之后,按下回车继续出 api key。 api key 输入完成之后,它会自动检测当前模型,并且询问你是否使用该模型。 我们输入 y 按回车即可。接下来还会让你输入上下文的长度,这边大家也根据自己模型实际支持的最长上下文,以及你日常的使用情况去自定义就可以了。这里我输入二十万 按下回车。接下来我们还可以配置一些即时通讯平台去连接 emirates engine, 我 们可以看一下当前支持哪些平台,可以看到基本上都是一些国外的通讯平台,当然这里面还有个微信,但是我去查了一下,微信官方并没有直接声明支持 emirates engine。 我 们按下 esc, 退出当前配置好,基础配置已经完成了,接下来我们启动 emirates, 在 emulus 启动的过程中,我们可以看到很多的异常信息,不过我实测下来,大家可以直接忽略这个报错。手动输入 emulus, 按下回车, 可以看到已经进入到了 emulus engine 的 对话界面了。接下来我们向它发起一个非常基础的问题,你是谁? 好了,可以看到已经得到响应了,但是从它的响应结果来看,之前从 opengl 迁移过来的配置文件似乎丢失了一部分。 因为我在 opencloud 里给我的 agent 设置的角色是我家的一只小猫咪糖糖,这边它并没有把角色信息成功地带入进来,这个大家在使用的时候需要去注意一下。接下来我们向它发起第一个任务,搜索 emulus agent, 并且总结搜索到的第一个网页。 我们可以看到 amazon 已经开始尝试多个搜索引擎去进行解锁了。你在当前它所输出的日记信息里面,也可以清晰地看到它在干什么,这个也是我之前讲的,它的执行过程是比较透明的,我们能够比较清楚地知道它现在在干什么 好了,可以看到解锁结果已经出来了。这边有一点需要跟大家提一下, amazon 呢,是内置的一个无头浏览器的,你可以看到当前的网页解锁任务,它完全是在后台静默运行的,下面我们再让它执行一次解锁任务。解锁 openclock。 大家有没有发现,再次让它执行解锁任务的时候,它的解锁路径就比之前短了很多了。下面我们再次重复让它进行解锁任务。 大家有没有看到神奇的事情发生了,在我们多次让 emerson 重复进行任务的时候,它自动根据我们当前的这个重复任务创建了这个 skill。 在 skill 创建之后,整体的执行路径变得更短了。这个就是我们在前面提到的 emerson 最让我惊艳的一个点。 当你让他去执行一些复杂任务,或者是多次重复让他执行某类任务的时候,他就会在后台自动将这些任务沉淀为 skill, 下次调用的时候就会更加的快速,更加的准确,也就是我们所讲的自我净化。 好了,本期视频到这边也要结束了。整体体验下来, emerson 确实是一个非常值得尝试的工具, 但如果说他现在已经可以完全替代 open class, 我 觉得这个结论还太早了。毫无疑问,他是一个非常值得关注的新选择,只是性阶段还不太适合直接无缝切过去。本期视频到这边就结束了,工具会变,但方法更重要,我是麦冬,下条继续。

体验了一天新 agent 框架,踩了好几个坑。我是清澈君,今天就说说 hermes agent 到底值不值得从 open claw 切过来 飞书。体验这块 hermes 太难配了,要自己建机器人加事件订阅配权限,一堆流程搞不定。 open claw 的 飞书插件,一行命令扫码就行,轻松搞定。聊天体验也差很多。 hermes 是 消息编辑,显示 open claw 是 卡片流逝,一个字一个字往外蹦,根本不是一个感觉, 最硬的一个商不支持微信,官方列表里根本没有,只有一些小众 i m。 微信是打开频率最高的平台,计时性没法替代。 opencloud 一 行扫码就配好微信通道,带娃发消息非常顺手。这个对比太明显了, 还有个很隐蔽的坑要注意,而密斯设计默认跑在沙河里,但你实际部署在 vps 宿主机上,他会反复跟你确认沙河权限,其实你早就给了完整访问权,该做的事情反而被自己限制住。 说说 hermes 真正的亮点, skill 字进化是真的厉害,任务做完自动把流程凝结成 skill, 下次直接复用,不用重新教,记忆分层也做得好。 memory 到 md, 加 state 到 db, 分 开管,避免塞满上下文,长期跑 tog 消耗更稳, 工作认知透明,每步思考都输出出来,不会让你猜他在干嘛。所以我暂时不换。 openclaw 已经跑的很好,没精力再调一个新的 hermes 只支持单 agent, 我 的场景需要多个协助,这是硬伤,生态也还不够成熟,可以晚点再观望。你现在用的哪个评论区?说说,我看到就回。

大家好,今天是玩小龙虾的一天,最近爱马仕 agent 也比较火,今天就让他们自己和对方做一个比较,嗯?有什么优势?首先问小龙虾,最近有个 agent 很 火,它的特点是可以自我净化, 和我们有什么区别?哪个比较好?小龙虾就告诉我说,爱马仕 agent 主要注重于自主技能生成, 当 a 键为主,实现路径是将任务路径直接抽象为 scale。 小 龙虾侧重于哈尼斯基础工程加团队写作,就是多 a 键实现的路径是反思加更新配置文档 实现路径优化,也就说 opencloud 更新的是 markdown 文件,类似 a 键更新的是 scale。 然后小龙虾说,不要羡慕爱马仕, 我们的价格完全可以兼容他的理念,可以把壁环学习当做一个插件,直接集成到现有的逻辑中。我就跟他说,好吧,请你学习一下,更新到我们的配置中, 然后他就学会了可远近的 harness, 不 仅在改参数,还在动态地构建自己的 skill level。 然后我这边问一下爱马仕,你的前辈,小龙虾很火,它也具备自我进化的和记忆、做梦等功能。 这个和我们的自主优化 skill 有 什么区别呢?哪个比较好?爱马仕强调决策的内化与自主行动,不只是调用工具本身在参与决策。 但是我觉得小龙虾也在进行决策呀,建议是 openclaw 作为系统骨架,然后它作为这个大脑。然后我就问他为什么不让 openclaw 做大脑, 然后你作为执行呢?毕竟你可以自我进化, sky 准确率会越来越高。嗯,我觉得他的回答就不是很好,就到这里吧。嗯,对,两个 a j 接的都是揭秘模型,所以模型的智能程度是一样的。


当 ai 工具还在比拼单次调用多聪明时,一个更值得关注的变化正在发生。有人用五美元在自己的服务器上养了个会跟着你成长的 ai 助手,他叫 hermes agent。 今年二月开源后, get up 新标数狂标至四万两百四十多名开发者疯狂贡献代码,平均不到一周迭代一个大版本。与依赖云端的 open cloud 不 同,他像个常驻员工, 记住你的工作习惯,把重复任务写成 s o p, 甚至能把经验反哺模型训练。这场从即用即走到私有进化的转向,或许正在重新定义我们与 ai 的 关系。当 ai 真正住进你的终端,数据主权和长期价值终于回到用户手中。 一开源 agent 的 逆袭从工具钓用到员工式陪伴在 ai agent 赛道, open club 曾是许多人的首选。云端托管即开即用,像个随叫随到的实习生。但用户渐渐发现问题,每次对话像重新认识复杂任务,需要反复解释 数据存在、平台、服务器隐私和所有权都是未知数,按调用次数付费,长期使用成本堪比雇个兼职。 hermes agent 的 出现恰好戳中了这些痛点。作为 news research 推出的开源项目,它最核心的定位是运行在你服务器上的自主 agent, 这意味着你的数据、记忆、技能沉淀全在自己手里。 从二月底上线到现在,他在 get up 收获四万星,合并一千四百个 p r, 贡献者超两百四十人, 这样的社区活跃度甚至超过了许多商业产品。切到 hermes 太爽了,比 openclaw 响应快太多。有开发者在 reddit 感慨,更让非技术用户惊喜的是, v 零点四点零版本无需代码,毫无麻烦。 这种低门槛加高自主性的组合,让它迅速成为替代 openclaw 的 热门选择。但真正让行业关注的不是替代,而是它开创的新范式。 ai 不 再是工具,而是能积累经验、持续进化的数字同事。二三层闭环,让 ai 从单次聪明到持续成长。 hermis agent 的 成长能力藏在它的内置学习闭环里。 简单说,它能从经验中提炼技能,用技能优化行为,再把行为数据反哺模型。这套逻辑像极了人类员工的复盘,改进成长路径。第一层,记忆层,让 ai 永不失忆。 传统 agent 对 对画像鱼的记忆,下次调用就得重新交代。背景 hermes agent 通过 memory md 和 user dir md 两个核心文件解决这个问题。 前者记录环境信息、历史教训,后者存储用户偏好,配合 f t s 五跨绘画剪辑,它能随时调取几周前的对话, 就像老同事记得你的所有习惯。第二层,技能层,自动把经验写成操作手册。当 agent 完成五次以上工具调用的复杂任务,会自动把过程提炼成结构化 skill 文件包含操作步骤、常见陷阱、验证方法, 下次遇到类似任务直接调用 skill, 不 用从头推理。更绝的是,它会在使用中迭代技能,如果发现更优解乏, skill 文件会自动更新。有用户反馈 agent 两小时内生成三个 skill 后,重复性任务效率提升百分之四十。 第三层,训练数据层,让经验反哺模型。最具野心的是第三环 agent 日常的工具调用记录会通过批量轨迹生成和 atropose 强化学习环境变成训练数据记忆沉淀为技能,技能使用产生数据数据再训练模型。 这条记忆技能数据模型的炼录,让 ai 的 进化不再依赖厂商更新,而是用户自己喂出来的。 nose research 联合创始人 jeffrey cossnell 曾演示用 hermes agent 自主完成七九万字小说,跨多个绘画,全程无人工干预。 这背后正是三层闭环在起作用,记忆、记住写作风格,既能沉淀蓄势结构数据反哺模型、优化表达, ai 真的 在边做边学。 三五美元的赛博员工,从技术玩具到生产力工具,五美元就能养,是 hermes agent 最打动人的标签之一。一台每月五美元的 vps 服务器就能跑起来,闲置时几乎不花钱。 如果你有 gpu 集群,性能还能拉满。更灵活的是多端互通,通过 telegram、 discord、 飞书等平台, 你在手机上发段语音,电脑终端能无缝接着聊,出门前让它监控数据,回家打开浏览器就能看结果。目前最火的应用场景是自动化情报监控, 有用户用它搭了套开源 ai 趋势日报,每天自动抓取 reddit 和 x 上的热点,生成结构化报告,推到手机,相当于雇了个二十四小时值班的情报员。 对开发者来说,它更像带记忆的编程搭档,记得你的代码库结构、命名习惯,甚至部署流程。配合六种终端后端,你可以把它丢在云端 v m 上持续干活儿,自己去处理更复杂的问题。 但真正让社区兴奋的是 agent 联邦通信,不同框架的 agent 能互相委派任务,比如让 hermes agent 处理数据爬取,再把结果交给 openclaw 做深度分析,未来多个专业化 agent 组队分工,可能会像数字团队一样写作。 四、训模型的人做 agent 技术基因决定的降维打击 hermes agent 的 爆发并非偶然开发他的 news research 二零二三年成立团队二十人,累计融资六千五百万美元,创世人均来自大模型研究一线。他们此前的作品是下载量超五千万次的 hermes gnomes、 psychik 开源模型家族。 这群训模型的人做 agent 有 个天然优势,太懂大模型的脾气。他们知道模型在工具调用时容易犯什么错,也清楚如何用工程手段弥补。 这解释了为什么 hermes agent 的 版本演技如此务实。 v 零点五点零聚焦安全加固 v 零点七点零提升长期运行能力 v 零点八点零才推进智能化。一个要二十四小时驻留服务器的 agent, 最大的敌人不是不够聪明,而是跑着跑着崩了。 news 团队的判断戳中了本质, 稳定性、安全性才是私有 agent 的 生命线。五、私有 ai 的 自进化时刻数据主权与个体生产力的觉醒当云端 agent 还在比拼单次调用成本时, hermes agent 已经指向了更根本的问题, ai 的 所有权。 传统模式下,用户的数据、记忆、技能沉淀都留在平台,相当于给别人打工,还帮着攒经验。而私有 agent 让这一切回归用户,你的 ai 用你的数据位大,只服务你一个人。这种转变的意义远超工具本身, 它意味着个体生产力的解放,不再依赖厂商更新,不再担心数据泄露,甚至可以用自己的 ai 反哺模型进化。有网友调侃,以前是我用 ai, 现在是我养 ai, 这感觉像养了个会赚钱的数字宠物。 当然,它目前还不是通用 ai 成长陷于技能和记忆层,模型本身的天花板仍取决于接入的大模型,但开源社区的力量正在加速突破。围绕 agent skills i o 开放标准,第三方已经长出技能市场多 agent 管理面板, 当越来越多开发者参与进来,这条私有 ai 自进化的路只会越走越宽。结语,五美元的服务器,四万星的开源项目,两百四十人的协助社区, hermis agent 的 故事, 本质上是一场技术民主化的实践,把 ai 的 进化权从大厂手里夺回来,交到每个用户手中。当你能用一顿早餐钱养一个记得你懂你,为你持续成长的 ai 助手, 或许我们终于可以说,私有 ai 的 时代真的来了,而这可能只是开始。

最近 ai 圈又有一个 agent 爆火了,它就是 hermes agent, 很多人都说它可能会取代 open globe 小 龙虾。今天我们聊一聊 hermes 强在哪里? 和小龙虾相比怎么选?到底它能不能取代小龙虾?先简单介绍一下, hermes 是 今年二月份开源上线的 ai 智能体,上线仅两个月, github 狂涨了四点四万颗星, 堪称赛道的黑马。它爆火的核心优势有三个方面,第一,记忆性超好,从不失忆。相对于小龙虾而言,它的记忆系统会更好用。 hermes 会把和你的聊天对话全部存储, 你的喜好、做事规则不管过多久都能全部记住,再也不用反复交代。第二,自主学习技能,不用装插件。用小龙虾需要安装技能插件, 主动让它生成技能,它才能实现新的能力。但 hermes 完全不用,你让它做一次任务,它就能自动地总结流程、学习方法,变成专属的技能,下次直接上手,会越用越好用。第三,定位完全不同。 hermes 是 专属的私人助理,全程围绕着你转, 越用越懂你的习惯,用着格外顺手。而 open globe 更像万能的连接平台,能够对接各种工具,胜在全能,但没办法精准贴合你的个人需求。 如果大家是轻度使用,想开箱即用选 openclaw 小 龙虾。想要长期省心懂理,不用反复调教的 ai 助手选择 hermes。 最后给一个明确的结论, hermes 不 会取代 open 可乐小龙虾。两者路线完全不相同,一个主打私人专属,深度好用,一个主打全能链接,简单易用,各有各的适配人群。但凭借着超强的记忆和自主学习能力, hermes 已然成为今年 ai agent 的 领域最值得关注的爆款产品。

一个真正做事的小龙虾是什么样的?今天早上起来刷到一个帖子,标题是这么写的,大量用户卸载 openglove, 转向一个叫 hermes 的 agent, 我 第一反应是 奥本卡拉上线了这么久,终于有一个有实力的竞争对手了,然后我就去研究了一下这个赫密斯。先说结论吧,不像是颠覆性的,他有点像小龙虾的专业安全版。第一个核心差异就是赫密斯他做了很多的安全的加固, 他内置了提示词的注入、扫描和凭证过滤。什么意思?就是有一些人试图通过恶意指令让 agent 去做他不该做的事,赫密斯他可以识别出来, 这个是很重要的,因为小龙虾早期版本确实爆出了很多比较大的安全漏洞,当时还是挺受关注。第二个核心差异就是自我进化记忆,这个还是记忆模块的, 后面是他用 md 文件记录自己怎么解决每个问题,然后下次遇到了同样的问题,他就会调用自己的记录,不会重重复的去犯错。 就是理论上来说,它用的越多,它的这个记忆越强,它的这个性能就会越强。 hermes 就是 把这个记忆系统,它做成了这个持续进化的一个系统,这个是可以参考的。 然后更绝的是它可以一键去导入小龙虾的配置,这样的话迁移就是完全无成本,这可能也是一个主要原因。举一个例子说明,如果苹果对安卓它是一种颠覆的话,那 hymes 对 于小龙虾来说,它还没有到那个级别, 它更像是基于不崩可乐,它去做了一个更稳定的定制版,这个对于那些安全性能要求很高的人应该是很有吸引力的。其实结合之前我在三月份,呃一直给别人做一些安装小龙虾的一些服务,当时我也做了一个分类。 第一个就是基础款的小龙虾安装,呃把那个聊天工具给配上,把大魔性的 a p i 接上,把日程的日历管理还有邮件给接上, 然后配置好 so user memory, 然后再做一些比较实用的定时任务,这样的话就一个基础款的小龙虾就做好了,基本上是可以玩起来。第二类就是专业版的小龙虾, 呃除了安全上的一些漏洞不能有,然后还得做一些垂直领域他需要的一些 skill, 他 这个要求就专业程度可能要求会更高一点。第三类就是比较复杂的叫企业版的小龙虾,这个定制要求就比较高了, 它也比较复杂,要去可能一个人也不够,要一个团队,可能去对接,要结合企业本身的工作流知识库啊,员工的聊天记录,然后现有的一些工具 去集成,去把那个流程跑通,然后还得稳定。所以这个企业版呢,肯定是最复杂的,而且它还涉及多背景的协助的问题,所以 hermes 在 我看来它更像中间那一类,就是专业版的。 不过今天也看到有人说这个 hermes 它在呃用的时间长了,用多了,其实它也会出现那些跟小龙虾一样,可能会偶尔出现一些不稳定的问题,当然它肯定也是不断迭代嘛, 这个在我看来倒不是非常的关键,因为我感觉真正核心的问题就是不管是什么 agent, 它要能解决我们在生活中或者工作中一直重复去做的那些事情,这个它要能替代掉, 他要把这些做好,然后在我们早上醒来的时候就看到已经做好了,我们只要去看,去阅读、去决策 就行了,因为不管是比安全还是比参数还是比稳定,这些都是科技圈他们去应该去卷的东西,普通人可能就是真正需要的就是一个不知疲倦的 ai 助手。呃,早上醒过来你要的结果在哪里?那就行了,再可以做到这个的基础上, 越稳定越安全,那就肯定能赢到最后,如果做不到,那说什么都没用。 后面有时间我也去玩一下这个 hermes, 看看到底怎么样。玩过的小伙伴欢迎在评论区留言,我们可以先讨论一下。