龙虾辅助科研,很多人还没整明白是什么内容,现在又出现了爱马仕辅助科研,两者的最大区别呢?其实就是在于爱马仕它拥有自主学习的一个能力,听到这个内容的话,你是不是想赶紧试一下,但是我告诉你, 先不要着急,这个内容的使用也是有门槛的,你对代码是否了解呢?如果不了解的话,我建议大家不要着急,再等一等,我们要明白一个底层的逻辑, 首先这些龙虾和爱马仕它们底层都是智能体,既然是智能体,那么它的底层就是调用 ai 大 模型去处理任务,它们可以简化很多操作的流程,帮我们去提高科研的效率。在这里面,我们既然明白了它的底层是调用 ai 大 模型,那么换句话说,如果你把 ai 大 模型用好,是不是也可以达到同样效果呢?当然是可以的,所以我们当下要做的就是赶紧把 ai 用好用精,让它用到我们科研的方方面面,让它帮助我们提高整体科研的效率,赶快去用 ai 大 模型吧,我是张老师,关注我,学习更多 ai 工具使用技巧!
粉丝3.6万获赞8.0万

openclaw, 对 不起,我怕 hermes 误会!最近 ai agent 圈子里发生了一件大事, github 上一个叫 hermes agent 的 开源项目,两个月时间狂揽六万星,平均每天新增几千个关注, 直接冲上 github 川定第一名。更夸张的是,很多原本用 openclaw 的 开发者都在悄悄地迁移到 hermes。 今天就来聊聊 hermes agent 到底是什么?为什么这么多人开始移情别恋? hermes agent 是 什么? 先说结论, hermes agent 是 一个会自我进化的 ai 智能体,是一个会自己变聪明的 ai 助手。从你使用 hermes 的 那一刻开始,它就会开始自动写入记忆,自动提炼 skill, 自动优化工作流。简单来说,你用的时间越久,它对你的理解越深,工作越高效。 不是你在训练他,而是他在训练自己。 hermes agent 是 news research 在 二零二六年二月发布的开源 ai agent 框架。 hermes agent 的 核心特点用官方的话说叫 the agent that grows with you。 一个和你一起成长的智能体。这个项目被社区认为是 openclaw 上线以来第一个真正意义上的竞争对手。那 hermes agent 和 openclaw 具体有哪些区别? 这里我总结了四个方面的区别。区别一,龙虾是网关, hermes 是 引擎。 open cloud 的 核心是一个 gateway, 它通过一个强大的系统来协调多个智能体,通过复杂的编排来完成任务。 你可以把它理解成一个指挥官,它告诉每个 agent 该做什么,然后把结果整合起来。这种设计的好处是灵活、强大、可扩展。你可以接入多个平台,可以运行多个 assistant, 可以 处理复杂的多 agent 协助任务。但是它有一个问题,每次任务都是从零开始。 openclock 没有原生的技能学习层, 你让它做一百次同样的任务,它还是会用同样的方式处理,不会变得更快更好。它有工具,有指令,但是它不会积累经验。 hermes agent 的 核心则是 agent 自身的执行循环,它不是通过外部系统来增强能力,而是把能力内化到 agent 的 本身。工具调用、记忆、交互、执行模式都是 agent 自己的能力,不是外部系统赋予的。 这种设计的核心优势是 agent 会学习、会进化、会适应。区别二, hermes 是 会自己写技能的 agent。 这是 hermes 最有意思的地方,当他完成一个复杂任务后,通常涉及五次以上。工具调用会把整个过程沉淀成一份结构化的技能文档,存成 markdown 文件,下次遇到类似任务,直接加载这份技能,不用从头解决。 更关键的是,这些技能在使用过程中会自我迭代。如果 agent 在 执行技能时发现了更好的方法,它会自动更新技能文档。 openclaw 也有技能系统,但主要依赖人工编辑和社区贡献的技能市场。 clawhab hermes 这边等于把写技能这件事也交给了 agent 的 自己。区别三,记忆体系的差异。 两者都声称有跨绘画记忆能力,但实现方式不同。 hermes 用 sq lite 数据库配合全书解锁,把所有历史对话存下来,需要时通过搜索加摘要召回。他把记忆分成两层,一层是常驻的关键信息,写在 memory 点 md 里,每次对话都带上。 另一层是全量历史解锁。 open cloud 的 记忆则是工作区里的 markdown 文件,走的是文件及记忆的路线,通过语义解锁工具来查找, 在上下文压缩前会执行一次静默记忆写入,防止压缩丢信息。简单说, hermes 更像是给 agent 装了一个搜索引擎式的大脑, openclaw 更像是给他一个笔记本。 区别四,安全思路也不一样。 hermes 搞了一套五层纵深防御、用户授权、危险命令审批、容器隔离、屏距过滤、上下文注入扫描、 默认对高风险操作,比如执行终端命令、写文件要人工审批,超时未批准就自动拒绝。 openclaw 这边则更强调信任模型和配置审计,它提供了 openclaw security audit 命令, 可以一键扫描网关配置的安全隐患。但 openclaw 在 安全方面的历史记录不太好看,今年二月被曝出多个高危漏洞,十三点五万个实例暴露在公网上, 技能市场也有超过三百个恶意技能被发现。这也是为什么很多安全意识强的开发者从 opencloud 迁移到 hermes 的 重要原因。那 hermes 就 完美无缺了吗?当然不是,它的生态还很年轻,社区技能库远不如 opencloud 丰富, 如果你需要大量现成的工具集成, opencloud 仍然是更好的选择。另外, hermes 的 学习循环需要时间积累,前期体验可能不如 opencloud 那 么开箱即用。但关键在于, hermes 代表了一个新的方向, ai agent 不 应该只是工具的集合体,而应该是一个会成长的数字伙伴。 open club 的 哲学是我给你足够多的工具,你自己组合。 hermes 的 哲学是 我跟你一起工作,从经验中学习,变成你的专属助手。这两种哲学,哪一种更符合未来市场?正在给出答案。好了,本期的分享就到这里,我们下期见。

好了,今天我们来聊点真正让人兴奋的东西,人工智能感觉每天都在进步,但今天我们要说的这个可能是一个真正的黎明, 它叫 hermes agent。 记住这个名字,因为它可能不只是一个新工具,更像是一个怎么说呢,一个能自己学习,自己进化,跟我们一起成长的智能伙伴。 哎,你有没有过这种感觉?就是你花了好大功夫教你那个 ai 助手做一件事,结果呢?下次再让他做,他好像全忘了,跟得了失忆症一样,你又得从头教一遍, 真的是让人有点抓狂对吧?这个 ai 失忆症啊,其实就是现在很多 ai 技术的一个大瓶颈,不过今天我们就要来看看怎么彻底解决问题。 所以你看问题的根源其实就出在一个词儿上,叫状态。传统的 ai, 我 们叫它无状态的,什么意思呢?就是它没有记忆,你每次跟它说话,对它来说都是第一次。 这就像你交了个朋友,但他每天早上起来都把你忘得一干二净,你得重新自我介绍,这多累呀。但呵米贼准就不一样了,他有自己的记忆,核心,是有状态的,他记得之前做过什么,学过什么,每一次互动都不是白费的,而是为他下一次变得更强打下基础。 那么, hermes agent 是 怎么打破这个失忆魔咒的呢?它的秘密武器,也就是它的核心突破就在于一个听起来就特别厉害的机制,叫做技能的自我进化。对,你没听错,是它自己进化,不需要我们手把手地去改代码。 在我们深入之前,得先搞清楚一个概念,在 hermes agent 的 世界里,技能到底是个什么东西? 嗯,它可不是一个简单的命令,也不是一行代码,你可以把它想象成一套完整的武功秘籍。 就是说,当 ai 成功完成一件事之后,它会自己把整个过程从头到尾总结成一套可以重复使用的流程,然后记在脑子里,这就是它自己学会的本事,是它关于怎么办的智慧。 说真的,这绝对不只是个小功能优化,这是一种全新的玩法,它的开发者给它起了个特别酷的名字,叫本地演化复利系统。听得有点复杂,但你把它想象成理财里的复利就懂了。 传统的 ai 像花钱,用一次少一次,而 hems agent 就 像一项投资,你用的越多,它积累的经验和技能就越多,它就变得越聪明,越值钱,这就是知识的复利效应。 好,那这个听起来这么神奇的进化能力,他到底是怎么实现的呢?其实啊,他的核心就在于一个设计的非常巧妙的四步闭环,正是这个循环,让他的智能像飞轮一样越转越快。 我们来看一下这个循环是怎么跑起来的。第一步,创建。当一整的成功搞定一个福达任务,他就会自动把这个过程变成一个可重复使用的技能。好,有了技能,下一步就简单了,就是使用,再碰到类似的活,他直接调用这个技能就行,效率大大提高。 但关键的来了,第三步,发现如果任务失败了或者情况变了,他不会傻等着,而是能自己发现。哎,我这个技能有漏洞。然后就是最牛的一步。第四步,更新, 他会自己动手修改升级这个技能来解决新问题。你看创建、使用、发现、更新,这个圈一转,他就完成了一次自我迭代,这就是他不断变强的引擎。 行理论听起来是那么回事,但光说不练假把式对吧?他在真实世界里到底行不行?咱们来看一个特别有意思的实战案例,让 hermes agents 自己去搞一个全自动的 ai 新闻简报机器人。 这个任务可不简单哪,你看它得分好几步。首先要去网上抓取最新的十条 ai 新闻,然后把这些新闻整合成一个网页简报,最后还得打这个网页发布出去。 抓取、生成、发布。三步走,每一步都挺复杂的,这绝对是检验它技能机制好不好用的完美测试。 好,我们来看看第一次运行的结果。第一步,抓新闻没问题,成功了。第二步,生成简报也很顺利,但是到了第三步,也就是最后发布的环节失败了,系统超时了,就像跑到了终点线前,一头撞在了墙上。 但是请记住,对普通的 ai 来说,这可能就是终点了。但对于 harmis agent 来说,这堵墙恰恰是它进化的起点。 你想想,要是换了别的 ai, 这时候估计就是给你报个错,然后就没然后了,等着你去修。但 hermes agent 的 厉害处就在这儿,失败对他来说不是一个 bug, 而是一个学习的机会。这次失败正好触发了他的自我进化机制。 你看,这里说的就是整个过程最关键的地方,他自己走完了,创建技能、使用技能,然后发现技能的缺口,最后更新技能的完整循环。 最重要的是,整个过程是自主完成的,他没等任何人来告诉他该怎么做,自己就把问题给分析了,还把方案给执行了。 那结果呢?结果就是当他下一次再跑这个任务的时候,因为技能已经被他自己更新了,整个流程一次性就跑通了,完全成功。 所以你看,这可不仅仅是修复了一个 bug 那 么简单,这是这个 ai 从自己的失败里学到了东西,并且把这个经验固化下来,让自己永久性的变强了。 所以说,这个案例的意义远远不只是解决了一个技术问题,它向我们展示了一种全新的可能线,一种 ai 和我们互动的新方式。这就是我们前面提到的,知识复利的力量开始真正显现出来了。 咱们再来对比一下,这样就更清楚了。传统的 ai 就 像个每次考试都得把整本书从头看一遍的学生,效率很低,因为学过的东西记不住。 而 hermes agent 呢?他更像一个学者,他会不断地整理和扩充自己的知识库,每一次解决问题都像是往他的图书馆里增加了一本新书,让整个知识体系变得越来越丰富,越来越强大。这就形成了一个真正的数据飞轮。 你知道飞轮效应吧,一开始推可能有点费劲,但一旦转起来就会越转越快。赫马斯 agent 就是 这样,每一次你跟他互动,不管成功还是失败,都像是在给这个飞轮加一百力,他的能力不是陷阱增长,而是指数级的,会进入一个加速进化的快车道。 所以最后让我们来思考一个问题,当我们的 ai 工具,它不再只是个冰冷的程序,而是拥有了记忆、经验,甚至能够自我进化的时候,我们和它们之间的合作会进入一个怎样全新的时代? 我想我们可能真的要从使用工具的时代跨入到与伙伴共事的时代了,一个能和我们一起学习、一起成长的伙伴,这背后隐藏了潜力,真的可能超出了我们现在所有人的想象。

好,这里我再分享一下我最近学习 cloud code, 其实我也是一直和大家分享的一种自上而下的学习的方法,我这里介绍的还是借助我的 cloud code, 关于 cloud code, 我 觉得应该是可以让我们快速的去学习的一种方法,就是一种自上而学习的快速的方法,它能快速的帮我们收集到我们想要整理的资讯,然后提升我们的学习效率。这一块我就不详细的说了,具体的我们就可以参考我前几期分享的视频和我对应的非书的文档。 果你对应的访问不了,我这也有对应的中转站的 a p r, 有 g, b t 五点和那个 c c 的 那种 cloud ops 的 那些对应的模型。 我说一下我们为什么要关注这个哈密斯 a 阵,首先这个哈密斯 a 阵在 openroot 中,它实际上它最近的托肯的消耗量是比较大的, 因为它 openclo 它是在二五年的十二月多份出来的,哈尼斯是在二月多份出来的,相当说它从二月多份到四月多份两个月就已经达到了这个 top 的 前榜二了,就说明它未来的趋势还是很明朗的。所以我是推荐大家尽早去学习哈尼斯安杰,也可以说让你去更好地去提升自己。具体的学习文档我也会, 我也是继续分享在我的飞书里面,如果你有需要的,你也可以私聊我或者之类的。接下来我聊一下我是如何去学习哈密斯这个 agent 的 一些体验,这里我也相对应写了我对应的介绍的内容。 看一下我这里,你看一下我这里。首先我们学拿到一个知识,我现在习惯习使用一斯大,帮我去分析一下哈密斯内容, 就说这个 gc, gc stack 我 前面也分享了,其实它是一个 yc 的 一个投资平台,做的一些沉淀了二十年的经验,我希望它快速的帮我去产出我的分析文稿,当然在初稿的时候我也找了一下,找了一下, 在 tiktok 找了一个大黑哥,他分享的就是他是如何学习 amys 的 agent 的 一些相关的一些知识,为什么?毕竟我们从零开始学习一个知识毕竟是很复杂的,我,所以我一直推荐大家会要使用这种自上而上的方法来学习, 就说先建立整体的认知,然后我们再学习具体的框架,学习具体的核心的框架,然后梳理本地的知识,再再延伸到各种 pdf 官方的一些资料。我一直主张大家去学习一手的资料,整个学习的过程会同步开放到我的 pdf 中, 这里是我的 notebook 中的整理的,这里我也前不久也和大家分享过,说我们通过这种哈尼斯的官方的学习文档,我们通过 notebook lm 做一种 简单的知识的问答机,其实这也是我上一期视频分享卡吧七,他说卡吧七分享的就是原始资料的收集,然后我们通过简单的对话,然来对我们整个东西去有一个大概的理解,我们看一下我这里写的,看一下我的, 这是我在 chloe 的 中,我和 c c 就是 chloe 的 学习哈密斯这个整个框架,所以我们要,我们要去, 首先我们推荐,我是推荐你提前把对应的源码下下来,首先我们推荐你把对应的源码下下来,这是我开源的那个 github, 我 整理的哈密斯的一些我学习到的一些知识,我做了一个简单的笔记的摘药放在那里, 这是官方的文档,里面可以详细的介绍我们如何去安装的。比如说我们去对应的去安装哈密斯整的这个东西,我们可以通过这个 url 去安装, 如果你本地相对缩死的,这里是 mac 的 设置,你的 mod dos 使用 set up hymes 这个 set up 里面,它就可以帮我们去快速的去建立我本地和他的一些交互的联系方式,这里实际上我本地已经安分装好了。我直接比如说我再问一下你是 你又拿这个手机和 opencloud 的 区别是什么?因为这里我是已经配置了我的模型,我的模型用的是 gpt 五点四的相对应的,如果你是使用不了,你可以这里显示了,比如说这里它是选用了一百二十八 k 的, 这是它记录的就说 comtex 的 上下文的总数。我们看一下这个东西,等一下 我们就拿这个简单的例子,我们去简单的去交互一下这里它应该是已经调用了 colorm 的 浏览器了,它去通过本地的,它应该安装了 colorm 的 一些东西上来去调用了。 具体的是我们可看一下这里,这是我生成的一些一些文档。首先我这里介绍的是哈密斯的 angelina 的 一些,就是说他的如何把 cloud m agent agents, 库克斯 sub agent, mcp 这一套整整套的认知的框架如何去学习的,这个框架直接对应的。 当然这个网上也有个哈密斯 i o 这个平台,其实这个并不是一个,只是别人已经注册了这个网址了。哈密斯这里是什么?具体他是他,他的核心的闭环是什么?和可拉克的的生态是如何分层的相对应的,我这里都已经详细的介绍了, 关于第二个我们就可以去看一下,关于我们这我是如何去学习哈密斯的,当然这是我一直推荐大家使用,是自上而下,我这里生产了我的学习的主线, 有很多人现在我觉得他学习知识,如果些人可能他没有这方面的经验,他可能有自己的学习的一些习惯,所以这是我的一种学习的习惯,当然也并不说你可以参考,也不一定说一定要参考我这里的学习的习惯来。 首先我学习我是要先成立一种自上而下的学习地图,我们要对这个东西有一个整体的认知和概念,关于一些核心的概念,我们可以看一下本地的资料, 下一步的实习 get 哈普的上面的扩展的一些外部的研究,比如说 get 哈普的上的一些,比如说他这些动态,还有别的一些分享你整理的网站术语表,基础分层我们可以看一下具体的,当然基础分层我们这里也有,对应的 就是你尽量因为可能你说说一千个字,还不如看一张图来的直观明了,所以我这里都是采用说这种图的方式来加速我们去学习新的知识。关于安装介绍,我这里也详细的给大家分享了一下,我们看一下我这里配置的。 首先我们看一下哈密斯斯大这个东西,我们就可以看一下,这里是安装的目录对应的版本 python, 所以 前不久我要大家推荐大伙安装 python, 后面我们有很多应用可能就会涉及到 python, 像你学习在可拉扣的时候,你提前把 python 安装的,你这一相对就是说他的问题,就不需要你再找对应的知识。 我配置的模型我现在是用的 oppo ai 的, 它这里它支持 oppo 路由,比如说我们国内的 kimi max 的 这一些东西的,像还有和托比公司的, 有个注册的一些授权认证的一些 a p r key, 这里是我们关注的一些通道,比如说这是 tonygride, 我 们可以用对应的飞书微信, 还有这只企业微信,这是微信的,他起用的时候,他的 getaway 是 不是起来之后我们就可以借助我们的,其实他使用的方式和我们的小龙虾是一样的,这里他就完成了,你看一下就是他和 opencode 的 区别,你看一下, 首先他这里告诉我们,他是说首先他们的定位不同。哈密斯这个框架是个通用的 ai 助手,而这个 opencloud 它是一个个人的 ai 助手,它主打的是你的个人跨平台自己掌控的数据。 然后当前运行的是哈密 agent 的 s, 它有一套明确的文件终端、浏览器、记忆计划、定时任务、子代理,是说它是一套完整的体系,他这里说了他的一般人就是更偏,比如说个人产品自托管,个人数据的,围绕他自己做的生态, 它更像是一个通用的 a 阵的,它的就说更加显适合开发调试之类的,它 c u i 有 有 session memory skills, 一 些定时任务,有些 task, 一 些任务的更工程化的东西, 其实它也更擅长说本地的读写代码,然后跑中把工作拆给子 a 阵头一些强调的一些东西。你可以把 open code 更偏向于个人助手,它可能偏向于可靠可操作性的工程代理模式。 我们可以继续的去给他去技术的选型,去探讨一下。我现在是我在我的命令行操作,当然我们不需要,我们也可以在我的 graph 上面去直接光介绍的是我们可以直接 把 open curl 的 中的一些记忆。 skills 可以 直接迁移下来。下一期我再继续分享一下我在哈密斯做的一些简单的应用吧,谢谢大家,我是风信子。

大家好,我是麦东。最近 emulus engine 在 github 上非常火,很多人拿它和 openclaw 做对比,甚至有人说 emulus engine 已经可以完全替代 openclaw 了。 这两天我也下载安装了 emulus engine, 自己深度体验了一下。先说结论,第一点, emulus engine 整体确实比较清亮,响应速度也比较快,用户的直观体验会比较好。第二点,也是我觉得最核心的一点,就是它的自我净化能力, 当你让他去处理一些比较复杂的任务,如果这个任务完成了,他会自动把这次已经跑通的任务过程分装成 skill, 后面再遇到类似的任务的时候就可以直接服用, 整个过程是完全自动的,不需要你做任何操作。这个点我自己实测下来还是挺惊艳的。第三点,他的执行过程是比较透明的,你能比较清楚的看到他是怎么思考怎么工作的,这点我自己也比较喜欢, 因为很多时候不怕 engine 工作慢,怕的是你根本不知道它现在卡在什么地方。当然, emulus engine 作为一个新项目,它现在也有很明显的短板。 和 open color 相比,它在模型接入平台支持这些地方性阶段还是有很大的差距的。比如它现在就不支持接入国内常用的飞书解微信。 另外,在安装这块, emulus engine 目前只支持在 linux 和 macos 上直接安装,如果你想装在 windows 上,那就要通过 str 来部署, 不能直接原声装在 windows 里。还有一点, amazon 是 纯命令行运行的,没有 u i 界面,所以如果你本身不太习惯命令行,或者你更喜欢那种可直观一点的使用方式,那前期可能会有一点适应成本。再往后还有一个差异,就是在多 a 键的协助这块儿, urmars engine 和 openglar 的 差异其实还挺大的。 openglar 原生就支持更复杂的团队调度和角色分工,而 urmars engine 的 核心更像是单体自动化的 engine。 如果你想搭一个固定角色的团队,那通常就需要同时运行多个完全隔离的 urmars engine。 不 过它也提供了 profiles 这套机制,可以用来跑多个互相隔离的 engine。 这个点如果大家感兴趣,我后面也可以单独再出一期视频来讲。 所以如果你问我 airspace engine 现在是不是已经可以无缝替代 openclaw, 我 自己的判断是还没有。它确实有很亮眼的地方,尤其是自动沉淀 skill、 自我净化这个点。但如果你已经深度依赖 openclaw, 并且围绕它搭了一整套工作流,那你现在想直接无缝切过去其实还是比较困难的。 好了,前面先把结论讲清楚了,接下来我们就来带大家一起从安装到配置再到使用实际体验一下 amazon。 首先是部署,我们参考官方文档,复制安装命令,打开终端,粘贴命令,按下回车即可。 amazon 已经开始自动安装了, 安装时间受网络因素影响,不太固定,大家耐心等待即可。 好了, emirates engine 已经部署好了,部署好了之后,它会检测你当前系统里面有没有安装 openclaw。 如果安装了,它可以直接导入一部分 openclaw 相关的内容。这里提示我们是否需要看一下哪些可以被导入的,我们直接选择 yes, 可以看到这边有一个物理 import, 这里面的内容就是即将从 openclaw 导入 emersonant 里面的内容。我们可以看到导入内容包含 openclaw 的 sword 点 m d, daily memory memory 点 m d, user 点 m d 以及一些 skills。 接下来我们同样输入 y, 按下回车即可。好, openclaw 相关的配置已经成功导入到 emersonant 了,下面我们就开始进行 emersonant 的 一些触手化配置。 我们选择第一个 quick setup, 也就是快速配置。首先第一步选择模型,可以看到首页默认都是国外的一些模型厂商,我们选择 more providers。 在 这边我们可以看到国内的一些厂商了,比如智普, kimi, mini max 等等。如果你当前就是使用的这些厂商的模型,那么你直接选择就可以了。如果你所使用的模型厂商不在这里面也没关系,我们选择 custom endpoint 自定义就可以了。 应用模型只要是兼容 open ai 格式的都可以的,国内模型厂商提供的透根不烂,基本都是可以满足需求的。 我们只需要去它对应的控制台里面拿到 url 以及 api key 就 可以了。 url 输入完成之后,按下回车继续出 api key。 api key 输入完成之后,它会自动检测当前模型,并且询问你是否使用该模型。 我们输入 y 按回车即可。接下来还会让你输入上下文的长度,这边大家也根据自己模型实际支持的最长上下文,以及你日常的使用情况去自定义就可以了。这里我输入二十万 按下回车。接下来我们还可以配置一些即时通讯平台去连接 emirates engine, 我 们可以看一下当前支持哪些平台,可以看到基本上都是一些国外的通讯平台,当然这里面还有个微信,但是我去查了一下,微信官方并没有直接声明支持 emirates engine。 我 们按下 esc, 退出当前配置好,基础配置已经完成了,接下来我们启动 emirates, 在 emulus 启动的过程中,我们可以看到很多的异常信息,不过我实测下来,大家可以直接忽略这个报错。手动输入 emulus, 按下回车, 可以看到已经进入到了 emulus engine 的 对话界面了。接下来我们向它发起一个非常基础的问题,你是谁? 好了,可以看到已经得到响应了,但是从它的响应结果来看,之前从 opengl 迁移过来的配置文件似乎丢失了一部分。 因为我在 opencloud 里给我的 agent 设置的角色是我家的一只小猫咪糖糖,这边它并没有把角色信息成功地带入进来,这个大家在使用的时候需要去注意一下。接下来我们向它发起第一个任务,搜索 emulus agent, 并且总结搜索到的第一个网页。 我们可以看到 amazon 已经开始尝试多个搜索引擎去进行解锁了。你在当前它所输出的日记信息里面,也可以清晰地看到它在干什么,这个也是我之前讲的,它的执行过程是比较透明的,我们能够比较清楚地知道它现在在干什么 好了,可以看到解锁结果已经出来了。这边有一点需要跟大家提一下, amazon 呢,是内置的一个无头浏览器的,你可以看到当前的网页解锁任务,它完全是在后台静默运行的,下面我们再让它执行一次解锁任务。解锁 openclock。 大家有没有发现,再次让它执行解锁任务的时候,它的解锁路径就比之前短了很多了。下面我们再次重复让它进行解锁任务。 大家有没有看到神奇的事情发生了,在我们多次让 emerson 重复进行任务的时候,它自动根据我们当前的这个重复任务创建了这个 skill。 在 skill 创建之后,整体的执行路径变得更短了。这个就是我们在前面提到的 emerson 最让我惊艳的一个点。 当你让他去执行一些复杂任务,或者是多次重复让他执行某类任务的时候,他就会在后台自动将这些任务沉淀为 skill, 下次调用的时候就会更加的快速,更加的准确,也就是我们所讲的自我净化。 好了,本期视频到这边也要结束了。整体体验下来, emerson 确实是一个非常值得尝试的工具, 但如果说他现在已经可以完全替代 open class, 我 觉得这个结论还太早了。毫无疑问,他是一个非常值得关注的新选择,只是性阶段还不太适合直接无缝切过去。本期视频到这边就结束了,工具会变,但方法更重要,我是麦冬,下条继续。

最近 ai 圈有个很有意思的现象,技术更强的东西反而没有引起应有的轰动。二零二六年一月,一个奥地利开发者用一个小时做的小工具,在三周内 狂揽二十五万 github stars, 连 jason 黄都亲自站出来说,这是他有史以来见过最重要的软件发布。同一个月,另一个开源 a 阵的项目也悄悄上线了,它支持两百多个模型,有真正的自旋 a 阵的多。结果呢?四个月过去了,它的 stars 还不到前者的六分之一。 这就是 hermes agent 和 openclaw 的 故事。今天这期,我们来好好儿拆解一下,为什么技术更扎实的东西反而没有火。先说 openclaw, 因为它太特殊 了。它的创始人 peter steinberger 是 个传奇人物,花了十三年做出 ps pdf, kate 卖了一亿美元,然后 burnt out 消失了三年。二零二五年底,它回归 ai 领域, 做的第一个项目就是 opencloud。 一 开始它叫 cloud bot, 因为太像 cloud, 被 ansorepic 发了商标投诉改名 modbot, 三天后又改名 opencloud, 然后就爆炸了。它发布的时机特别好。二零二六年一月, 整个 ai 圈都在找一个真正能帮用户做事,而不是只聊天的 agent。 opencloud 刚好填了这个空,而且当时还延伸了 modbook, 一个社交网络只允许 ai agents 发帖, 一条新闻在全球媒体刷屏了。创始人本身呢? steinberger 卖掉公司 burnout, 回归做出世界最快的开源项目,被 open ai 招聘。这个趋势好到连编剧都编不出来。 然后是 hermes agent, 他 二零二六年二月底发布来自 north research, 一 家融了七千万美元,专注去中心化 ai 的 实验室。技术层面,他几乎在每一个维度都 都比 o p p 可靠强。它有自改进循环,每完成十五个任务会自动复盘,把成功的模式写成可复用的技能,下次遇到类似问题直接调用。它有四层记忆系统,热数据长柱、上下文、冷数据走向量解锁,还能自己保存重要信息。它支持两百多个模型,不绑定任何提供商,而且它是零遥测的,数据永远不会离开你的服。 那为什么没有人那么热烈地讨论它呢?首先,它没有 modbook 等价的引爆事件。 hermes 的 自改进需要几周才能感知到价值。 opencloud 安装后五分钟你就知道它能干什么,而且它缺少故事。 stevenberger 有 卖掉公司 burnout 回归改变世界的完整故事。 north research 只是一个公司背后没有引发共鸣的个人趣事,再加上它推出的时候不太好, openclaw 已经吸走了所有注意力。 hermes 发布时,整个社区已经在讨论下一个 openclaw 是 什么,而不是 openclaw 的 挑战者来了。但我真正想说的是, hermes 的 故事 其实是一个关于技术价值和传播能力的经典案例。技术更强,不等于一定会赢。 openclaw 证明,能在客厅里讲清楚的产品,就是比需要看文档才能理解的产品更容易传播。如果你看过他的原码,就会发现 peter 没说错,他 从来不亲自 review 代码。 hermes 证明了在特定场景下真正有价值的技术创新可以安静地存在,不需要 viral。 对 于真正需要他的人来说,在乎隐私的开发者,需 要本地运行的团队,想要 agent 真正学会自己工作流的人, hermes 可能才是答案。但是如果你已经不是一个新手,并且工作流也稳定了,或许并不需要再安装一个 hermes 来消耗你的 token。 这期的本质上是一个选择题, 你是要一个五分钟内让你惊叹的工具,还是一个六个月后让你离不开的系统?没有标准答案取决于你要什么。千万别没需求,创造需求。

大家有没有关注到最近又新出了一个 hermes agent agent 真是又卷起来了。一个月前我记得大家还在疯狂的养龙虾,然后最近 hermes 又火了,那 hermes 到底比龙虾有哪些进步?今天这一条来讲讲我自己的真实体验。大家有没有发现现在很多 ai 工具好用呢?是很好用, 但是他的记性不太好,就像你之前已经跟他说过的一些事情,或者是提过的要求,他转头就又忘了。这就好像你在带一个非常聪明但是记性很不好的助理,他有能力反应也很快,但是你总是得反反复复去提醒他和修整他, 在这个过程里其实就是会增加很多很多的无形沟通成本。那我最近在体验呵沫子的时候,我就发现他有真正的在解决和关心这个问题。我们不说那些非常复杂的技术的用语,我就分享两个我最深的体会。第一个,他已经从会干活 变成了会长经验。之前龙虾那一波最让大家兴奋的就是 ai, 它终于开始能够帮你干活了,能够自己去执行任务。那 hermes 更进一步的地方是它不光能执行任务,还能在执行的过程当中自我改进。举个例子,比如你要让它执行一个任务, 然后他执行的你不是那么满意,你就给他一些修正反馈的建议,在这个过程当中,他就会把你给过他的反馈,以及你用过的这种复杂流程自动提炼成他的 feel, 下次再遇到同样的情况时候,他就能够直接调用。 第二个感受就是他的记忆能力真的被放到一个很核心的位置,不会让你觉得每一次都是要从头开始,因为他会去搜索你过去的对话,保留那些持续的记忆,然后慢慢形成对你的了解,这就会让你在体验上面感觉很轻松, 减少了很多的沟通成本。我觉得这个变化对律师其实会很有共鸣,就像我们平时在带律师助理的时候,很多时候我们并不怕助理他们犯错,但我们最怕的是他在同一个地方反复犯错,以及他没有自我复盘和迁移的能力。 就是你已经讲过了,也给过反馈,教过方法了,结果下一次还是一样。那么这种时候让人最焦虑和最头疼的就并不是那个事情做得好不好的本身,而是你不知道你到底还要再教多少次才能够做好。我觉得之前的 ai 就 有点像这样子, 那哈姆斯相比之前的龙虾就更像那种,只要你给过它反馈,它就能够从这些反馈当中去沉淀,去总结经验,然后下一次再遇到同样的情况,它就不会再犯错,它就会有迁移的能力。 这样的 a 卷的用起来是不是就会觉得顺手轻松多了?哈姆斯的这一个进步,其实也跟最近大家热议的哈尼斯驾驭工程非常有关, 就是现在的 ai 工具,它比拼的已经并不只是某个单一的你说模型能力强不强,聪不聪明,而是要考虑 一个整体的能力,整套的系统工程,比如说像它的记忆,它的反馈,它的环境这些等等。我觉得律师们还是可以去体验一下 hermes, 并不是为了去追热点,而是我们越早去了解一个新的工具,你就能够越快的判断他适不适合进入到你的法律业务的场景,以及在法律业务场景我们有没有什么可以去学习和融合的,这才是我们看新工具真正的意义。

今天我用了一阵子的 amos 啊,最大的体悟就是简单省事啊,像龙虾对接欧拉玛 lm studio 这样的本地模型啊,需要手工配置啊, amos 真的 是非常简单啊。 大家好,我是根谷啊,今天是 amos agent 系列课程的第二堂课,很多人的虾还没养好啊,现在又开始养马了。首先给大家看一下效果吧,我打开这个 amos 啊 amos, 比如说我做几道题目啊。先来一道简单的吧, 小明现在有十二个苹果,吃掉了三个,又买了五个,现在有多少个?我首先看一下欧拉玛这个,这一枚的四二十六币啊。好,他已经装载进去了。装载进去的话以后你看啊,一辆车 每小时六十公里,二点五小时能走多少公里数?那第二次就会快很多,因为刚刚我很久没用它休眠了哈。我们再做一道比较难的题目吧,一道概率论的题目。这道题目是比较难的,一个盒子有三个红球,五个篮球不放回抽两次 啊,就是这个球第二次抽到红球的概率,他给了两种方法对吧?嗯,那再给两个这个脑筋急转弯,这个小时候经常经常被坑啊。小明的妈妈有三个儿子,大儿子叫大毛,二儿子叫二毛。小儿子叫什么?小儿子是叫小毛吗?不对,是叫小明对吧?来一个这种吧 那来一个这种。呃,他这个记忆体没有的,比如说,呃,美国的现任总统。总统是谁呢?他应该要去网上去找,哎, 或者是美国的第一任总统是谁,我看看他能不能知道叫 music music music 啊。 这个 ems 最大的特点就是它,如果是啊,如果是它没有的功能,它一定会去网上找,比如说,比如说北京今天的天气如何,这对它来说应该是有难度的,它应该没有这个技能才对的,是吧? 那它你看它要去这个叫酷 google 去搜寻这个北京的天气,它要去 bing 里面去试了,是吧? 大概是搞不定的,我觉得它应该需要做一个这个天气的一个 api 的 接口去访问,它自己要去写这样一个技能, 然后我讲一下怎么样去快速的让这个爱马仕对接你本地的模型,因为你的电脑足够强大的话,我建议你还是用本地的模型啊,因为非常省钱啊,非常省钱啊。第一步就是进入这个欧拉玛,对吧?我用的是欧拉玛的当当 low 的 欧拉玛,是吧?我用的是苹果的, 自动的,就下载,下载完了以后这个没有什么可讲的,就是一个应用程序打开,打开它的话,这里面有很多模型啊,如果你电脑配置比较好的,就去下这个二十六 b 的 啊,二十六 b 或者是 三十一 b 的 都是没问题的,我的成,我的电脑下三十一 b 是 没任何问题的,当然我的电脑也是跑不起一百二十 b 的。 下完了以后,下完了以后你测一下就好了,比如说我下了这个这个这个 这个,这个我是有的,对吧?这 gpt 的 你,你是什么模型啊?对吧?它就是 gpt 的 这个这个单元模型,是吧?下完了以后,这个就挂在这里就不用管了,就是好通了,它出现了 cking thinking 啊,就 ok 了啊,你就不用管了,你可以把它擦掉。那第二步要要你知道这欧拉玛用的是什么端口?那欧拉玛端口的话是幺幺四三四,那这个端口是怎么知道的呢?很多人他在问这个端口怎么知道呢?其实是靠那个 l i s f 这个,你去看它的监听端口, 欧拉玛这个监听端口就是幺幺四三,是默认的,这个东西大家记住就好了,他不是八千是吧?也不是八千,也不是幺幺四三五,就是这个就就用这个命令,命令行啊,这是教大家一个小技巧,然后怎么把它配置上去呢?也是非常的简单的,是爱马仕,爱马仕这个名字我觉得取得特别棒啊, model 就就一个命令。然后呢?你翻到下面了,如果你用了龙虾的话,这些都是他把龙虾的配置倒过来了。假设你第一次配,第一次配是没有这些的,但是这个这个选项是有的,叫那个卡斯特吗?卡斯特吗?在哪里啊?自定义的端点,这个这个 这个这个 http 冒号双写,这个幺幺四三四回车,这里的 api 你 们不需要,不需要,因为不需要 api, 来这里面就选择模型了,对吧?这里面你选择一二三四,我应该是默认的是二二,是我最喜欢的模型啊,这是目前为止 最强大的模型啊。这个上下文这个窗口最好设置为非常大,七万 七万是没问题的啊。好了,以后就是 amos, amos, amos, amos, 哎,它总会出中文, amos, 哎,这就好了,最好是你先杀一遍进程,然后呢取一个新的回放框,因为它毕竟不是在浏览器里面,它全是这个命令行,所以说开始用起来可能不会那么习惯,但是用着用着应该就比较顺手了。比较顺手了啊?

还在死磕大模型卷到崩溃?告诉你个没人抢的发愣门神坑具类算法加智能体冷门好做,审稿人巨爱做事发核心,博士重顶会都相当棒。 别觉得这俩不搭边,现在这方向又新又空白,根本不内卷,只要你不瞎拼乱凑,随便找个小痛点做,扎实一点,路用率直接拉满。第一,传统剧类全是坑,参数难调,数据太散,高危跑不动,刚好 a 阵才能解决, 让智能体自己协助,自己调餐自己分布式跑剧类解决真问题,审稿人一眼就爱。第二,创新点随手抓,多智能体剧类, l l m agent, 语义剧类、动态剧类、隐私保护剧类,方向多到选不过来,算力要求低,普通电脑就能跑实验。 但记住,一个死坑千万别只简单拼接,光把剧类塞给 agent 调用,没提升没优化,投一篇剧一篇 一定要聚焦一个点,提精度,降通信,抗噪声,自适应参数,随便一个挖深就够发。找对创新点,做好实验,顶会录用不是梦。还准备了一份论文写作攻略包,需要攻略包还有专业导师指导,评论区可以私我, 这是部分导师可以指导的区位,可以暂停观看。

是不用养虾了,直接养马吧。这个爱马仕真的是太强了,搞了四台 max 六的做本地大模型的部署嘛,四个机器人,四个 a 剑客,四个本地大模型,后期我会搞这个五零九零去做这个本地大模型,这些本地大模型本身算力是有限的啊,所以说他对于 a 剑客的平台 最关重要。在这个 open kala 下面,比如说我问他的知识库有啥,我这个本地模型就在疯狂的运转,但是也可以看到他这个思考的过程是非常的慢的。 因为什么?因为这个 open color 太重了,它的上下文吞吐默认情况下就有两万到三万左右,加上我装的各种企业管理的 skill, 它就变得更加的慢。我运营短视频呐,因为我是个做短视频的公司嘛,可以看到它的一个表格,我的知识库非常的全, 它输出的格式虽然说比这个爱马仕看得更牛逼,它架不住啊,我有这么多 a 型的同时,开始工作的时候,它的这个性能就会非常的差,而且经常去锻炼, 所以说我这段时间用这个纤维,三点五 a 三 b 刚好跑在这个六十四 gb 现存的这个甜点位,他基本上跑企业的绝大多数运营效果明显是这个爱马仕比他更强。看一下我真实的这个指示库,特别多的东西, 然后这么多东西我用爱马仕去找,平均它的速度比这个 open 科洛要快一半左右,可以看到这个信息,它的整理速度 是非常的快的,虽然说现在看着没有什么外观界面哪一个终端在跑,但是他可以直接对接微信呐,企业微信呐、背书啊,各种平台,所以说用起来丝滑度跟 oppo kod 没有任何影响,他可以支持无限记忆。 就是 oppo kod 经常我们在用的时候就忘事,今天你跟他说这个,明天他又忘了。比如说你现在帮我把这个合同改了之后,但第二天他不知道你改了这个合同,那这个操作空间,我觉得这个 a 镜头就非常的不好用。但是你用了爱马仕之后,你只要今天跟他对接完,比如说我现在按这个键把它退出他的聊天, 发现没退出聊天的瞬间,其实刚刚他他操作了,他把现在目前我们聊天的这个所有东西直接下到数据库存到我本地了。那就说下次我问这个合同,他可以直接找到,然后对比现在的这个差异化, 如果有差异化他会告诉我没有差异化他直接给你出结果。所以说这就是现在 a 镜头的一个集合,我觉得这个东西一定以后比这个 oppo 壳会更火,现在他的绝大部分我已经转移过来了,用起来非常的方便。

大家好, hermes agent 都用上了吗?觉得怎么样呢?那今天来分享一下我最近使用的十个技巧,比较适配新手。 那第一个就是我们去安装 hermes 的 时候,只要执行这一条命令就行了,但是呢, windows 用户一定要特别注意啊,必须得安装这个 wcl 这个环境,那其实安装也非常方便啊,只要打开你的这个 pro shell, 那输入这个 install 命令就可以了。安装完之后输入这个 wc 要启动,然后再去执行这条命令,那么就 ok 了。那第二个就配置这个主模型啊,那么在 hermes 里面是其实是有主模型和辅助模型的,那我们怎么去配置这个主模型呢?那配置也是非常简单,只要执行 hermes, 然后 model 模型,那么你就可以选择,那第一个是它自己自家这个订阅,第二个是 open rotter, open rotter 非常建议大家使用,这个 open rotter 里面其实有非常多免费的模型,然后的话你就可以等它出来,就是它会先加载一些。就是啊,模型 我们可以拉到最下面啊,就是你可能这个模型不在这里的,你可以拉到最下面,然后对话输入模型的名称啊,输入模型名称点确定, ok, 这样的话你的模型就变成这个应用达这个模型呢,因为我之前已经输入过密钥了,所以他没有提示我输入密钥,比如说我们再看一下他是不是变了, ok, 你 看这个名字是不变了,我问一下, ok 啊,它这个模型是这个,那我们在设置模型的时候有一个小小的问题,比如说我们如果说设置的模型需要输入这个 key, 但是这个 key 其实在它这个终端输入里面我们是看不到的,经常我们复制过去之后看不到这个字母出来, 那你不知道,你可能又复制,导致可能这个命要输错了,那怎么办呢? 那么在这个 hermes 这个啊,目录里面有一个环境的这个配置的文件叫这个点 e n v, 那 么在这个文件里面是保存了所有你配的这个模型的密钥。所如如果说你这个模型调不通,那么你建议你去这个文件里面看一下你的密钥是不是配置的,对不对?那第三个就是啊,配置这个辅助模型,那为什么它会有辅助模型呢? 因为它设置了不同的任务模块啊,比如说这个第一个任务模块叫啊试图就是说啊,你如果发了这个截图啊,给这个 homeys 发了截图,不管你是通过什么聊天工具发了截图的话,如果你专门给它适配了模型,它就会调用这个专门的模型, 那比如说这个外部网页的搜索也是一样的,那么他这边有八个任务都可以去配置不同的模型啊,那这里就会有一个这样的事情呢,就是可能像有一些他是高频的,但是我们不需要那么好的模型去处理,比如说像搜索网页,其实这是这是一个可能是一个 m c p 的 活, 并不需要你这个模型有多厉害,那么你就可以选用一个便宜的模型,那比如说像这种啊,比如说这种记忆类的啊,他要去 总结记忆的,那非常重要,因为记忆和这个技能的这个深层非常依赖于这个模型的能力,不然的话他的这个效果就很差,那么这种时候你就可以去选一个比较好的模型, 还有说这种搜索类的,那么都是比较好的模型,选好一点的模型,所以你可以去根据这个去配置不同的模型,那么你也可以不配置啊,如果不配置的话都会使用默认模型,也就是你配置的那个默认模型,那如果你想配置的话,你可以这么来配置,只要进入对话,然后你告诉他是哪一个任务,比如说请你 这个压缩的啊,辅助模型, 你复制给它就行,就首先你得知道自己这个模型已经配置好了,在我们前面这一步,他这边啊,看到没有,他把 auto 能换成这个,就是我们的这个模型。 第四个就是写好这个 sword, md 啊,就是这个是个灵魂的文件,那这个文件是写什么字呢?就是定义你这个后面字的这个风格 应该写什么呢?比如说你这个性格说话的方式啊,做事的风格,价值观和边界,所以呢这个是非常适合你去定义好,这样的话你的这个后面字就比较有人味了,那么格式你可以这样按这种格式啊,比如说你是谁,你怎么说话,你做事的风格是什么样子的?你遇到问题优先怎么处理 啊?比如说举个例子啊,比如说你现在要做一个这种研究型的 ai 助手,你就把后面字定义成这种助手,那么你可以按这种方式去让它给你去对话,那么你也可以让 ai 去帮你走。比如说你跟后面字已经对话了一段时间了,那么你就可以让它根据我们的对话技术风格 让它去重新设置啊,你的这个灵魂文件,或者说你自己知道叫 so d m d, 那 么直接叫 so d m d, 或者重新设置我的灵魂,它是能识别出来 啊,你这个设置灵魂就是去修改这个 so md, 它会去根据你的对话就去总结你要求的这种风格,因为你跟它对话,你会不断去纠正它的问题嘛,那么它就知道你喜欢什么样的风格啊,就是这个样子,所以这个文件是非常适合大家在刚开始使用时去定义的。去定义好的, 那第五个就要搞懂这个 home md, 这个就是定义了 home md, 这个就是定义了 home md, 就是他是怎么跟你说话,是定义他那 user 点 m d 是 他对你的了解,就是你是用的人,他对你的长期观察,会把这些你的画像,你的习惯,你的偏好,然后落入,然后总结到这个文件里面,所以这个是会被被动形容的,那么你自己也可以去编辑啊。 那 memory md 就是 通过我们长期的对话,他会把这个一些事情总结,就针对事情来总结到这个 md memory md 里面,然后呢,每一次对话都会把这个文件的内容注入到上下文里面去,这样的话他就会记住啊,你曾经喜欢这个,喜欢那个,喜欢,喜欢做什么?喜欢这个事的流程是什么样子的, 那 skill 就 更具体了,就是他对你的对话进行总结之后,发现有些事情是可以啊用流程固化下来的,那么他就他就会固化到这个 skill 的 文这个文件夹里面去形成技能,那么这你的方法就可以被附用,流程就可以被附用了, 那么这种你也可以自己去安装,那么后面字也是可以被动去创建去啊,进行一个修改的。 那 state db 呢?就是你跟它的所有的对话记录全部都保存在这里面,那其实最重要的是这个所有的 md 啊,是去定义你这个 home 字是什么样的人格,那这个文件是我们主动要去维护的,那其他的文件都是 home 字可以自动去处理的,可以不用管。 那第六个就是我们配置这个聊天通道,那么也是非常简单,那我们配置这个聊天通道也是非常简单,只要执行这个 homeis getway setup 就 可以了,那进来之后我们可以看到它支持非常多这样的聊天的通道, 然后的话这边也是飞书钉钉还有企业微信,然后这边的话是可以去配置的,比如说配置这个飞书的话,你可以进来,进来之后,比如说我这边已经配置过了,那我就让他重写。 那这句话是要输入这个 app id, 那 么你如果之前用过 open core 对 接过飞书,那么你肯定创建了很多这样的飞书的应用啊,比如说我们打开这个飞书的应用,就可以看到这样的 app id, 那 我们只要复制过去啊,输进去,然后再把这个密钥 再输过去, 然后再选择飞书啊,我们用的是国内版飞书, 然后就确定,然后不管,那这样就配置好了,那这边的话他有一个这样的一个配对的这个命令,配对的这个码 你可以选择选择之后你你如果说是第一次的话,他是会啊,你跟他对话的话会输,会生成一个这样的配对的密钥啊,你输进去就行了, 那这样就配置就完成了,你就可以去对话了,然后你可以选择,然后让它重启。它目前的话支持基本上主流的这个聊天工具啊,而且飞书的话它支持的这个维度能力的维度都是非常全的,所以说还是比较推荐使用飞书。 那第七个就是我们可以使用这个 homeis doctor 这个功能啊,去做一个全面的检查,看一下我们到底配置上有什么问题,我们可以输入这个,然后它就会去 如果没有问题的他就会打勾,如果有有问题他就会打叉,然后告诉你这个哪一个是啊?有什么具体的问题,那比如说这有个警告,这个有一个 browse 插件没有装好, 就是如果你这边遇到什么问题,你可以先执行这个,然后让他去看一下,检查一下有没有什么问题。那第八个就是 ui, 就 说它本身是有一个这样 ui 的 管理界面,那官方没有做啊,但是社区已经做了一个非常不错的这个 ui 的 界面啊, 然后的话你可以把这个项目 clone 下来,然后去执行这个,然后就可以启动一个这样的 ui 的 这个,呃, homeys 的 这个 ui 的 管理界面,那这边是我启动之后啊,我们可以看到你可以配置很多东西,比如说对话,然后的话配置这个任务, 还有这个搜索这个技能。然后的话这边是啊,一个就是四二点 m d 的 配置,比如说我这个配置就是这样子的,那么你可以直接修改, 然后这边的话是这样的,文件就基本上管理的东西都有,然后这边可以选择模型,所以说是不错的。你如果说不太习惯用终端命令行 t u i 这种方式来管理的话, 你可以把它下载下来,然后部署一下。那第九个是如果你想把 open core 的 东西迁移过来,你可以执行这个命令,执行这个命令的话,可以把 open core 的 一些技能啊,一些记忆啊,这些东西都都带过来,比如说像这个 点 open 空的所有的文件,他都会转移到这边去啊,你可以选择 yes 呢,他就会把它全部转过去了,非常方便的迁移啊。那第十个就是怎么去安装记呢?那么第一种方式就自己去创建,那通过聊天的方式创建,我相信大家这个都已经非常熟悉了。那第二个是在社区里面搜索,那么 homeys 也有自己的这个技能的社区啊,然后它这边也是有非常多这样技能的,大概有四呃,四百多个吧,六百多个,现在已经六百多个了。然后我们可以打开这个技能列表,里面是有这个 build in, 就 说明是它本身就自带了这个技能,那么不是这个标记的,那你就需要去安装了。那安装方式也非常简单, 那只要把链接发送给他,在对话框里面告诉他,让他去安装这个技能就可以了。你也可以去安装 opencircle 里面这个技能啊,也是一样的,复制链接发给他,他就会自动去安装。还有 github 的 技能也是这么安装的, 那这样有了技能之后,那你就能够去用很多这样的,做很多这样的事情了,那么以上十个呢,是我自己总结的一些这些经验啊,希望能够帮助到你,能够更快更好地去使用这个 hems agent。

最近 ermis agent 很 火,火到已经有人开始卖袋装服务了。但普通人真正需要搞清楚的不是他有多火,而是他到底和 openclaw 差在哪儿, 以及你到底有没有必要再装一个 agent, 还是只是在追一个新的热词。所以今天这期我不吹概念,直接把它拆成一个新手也能照着走的完整安装指南。我们就只讲三件事,它是什么,它和 open cut 的 区别,以及怎样用 ws 二二最稳的把它装起来。 hermes agent 本质上不是一个聊天 app, 而是一个常驻运行、会自己积累经验的 agent。 它最特别的点不是会调工具,而是会在执行任务后沉淀技能,把成功过的方法总结成可附用的工作流。所以你可以把它理解成一个带学习循环的个人智能体,而不只是一个能回消息的 ai 机器人。 如果你已经用过 open call, 那 最直观的区别不是功能菜单,而是学习方式。 open call 更像消息中加个人工作台, hermes 则更强调把经验沉淀成技能,让他以后越来越像你的做事助手。 说白了, openclaw 解决的是连接和调用, hermes 更往前走一步开始解决。记住和成长, 不是每个人都需要再装一个 hermes, 关键看你想解决的是连接问题还是长期复用问题。如果你只是想把消息工具和模型接起来,现有 openclaw 够用。但如果你想要技能沉淀、迁移和长期自动化, hermes 才真正有意义。 所以别把它当成必须换代,而是把它当成一个更偏长期复利的 a 振的选项。如果你是 windows 新手,最稳的路线不是折腾原生环境,而是先把 ws 二跑通。 先在管理员 power shell 里执行 wsl install, 进到 linux 环境后再跑官方安装脚本,这样依赖和命令链路最稳定。对新手来说,安装主线就记住两个阶段,先把 wsl 二装好,再在 linux 里装 hermes, 别一上来就被环境问题绕晕。 装完 hermes 之后,别急着先折腾花活,先把模型迁移和诊断这三件事走通。 你可以先跑 hermes setup 走向导,再用 hermes cloud migrate 导入 opencloud 的 关键配置,最后再用 hermes doctor 做一次诊断。把这几步走通,你就不只是装好了,而是真正能用起来了。 hermes 真正有价值的,不是让你多一个聊天窗口,而是让重复工作开始自动积累方法。像每日简报、网站监控、自动研究、长期知识整理这类本来就需要反复执行的活,正适合教给它慢慢学会。 所以你装它不是为了今天多省一分钟,而是为了把以后反复做的事,交给一个越用越顺手的 agent 去接管。 hermes agent 不是 人人都必须装,但如果你已经开始认真搭自己的 agent 工作流,它确实值得研究。 尤其是已经用过 openclaw 的 人,更应该把它当成一次判断题,看看你要的是消息中书,还是一个会持续沉淀技能的系统。而对新手来说,别怕,先按 wsl 这条最稳的路线装起来,真正跑通一次,你自然就知道它值不值。

我们可以一个命令就可以实现从原始数据到投稿全流程,全过程。很多粉丝问我,龙博,你的 ai 是 如何配置的? 今天配置教程它来了。大家好,我是龙博,今天我给大家讲一讲如何配置 ai 和 skills。 首先给新来的观众讲一下基本的概念,我们这里所说的 ai agent, 它区别于我们传统的聊天机器人,它是执行任务的智能体,它可以直接操作你本地电脑的文件和应用程序。 而 skills 呢,指的是封装好的固定的工作流,可以让 ai 自动调用并完成复杂任务。今天我们主要讲的就是如何配置更好的 skills, 来指导我们的 ai agent 完成我们本地的任务。 我常用的 ai agent 是 codex, 安装好之后,我们可以在你工作的目录点开终端,打开终端后输入 codex, 我 们就可以在工作区看到你刚才的文件夹。 我们今天的任务很简单,我们需要统计每个省份的人均生产产值,但是在原始的城市数据库里面,我们只有地区层面的生产产值和户籍人口信息。我们先测试一种不使用 skills 的 情况,我们把提示词拷贝给 a i a 人的, 我们把它需要处理的数据文件放在我们的提示词里面。同时我们跟他说,请统计二零二二年每个省份的人均生产产值,并且制成图表。为了节省时间,我们要求直接执行,不要问我任何问题。我们可以看到我们的 ai agent 已经开始工作了, 他正在读取当前的工作簿,并且定位了文件当中有哪些字段。耗时三分钟,我们已经得到了结果的图标,我们来看看他处理的怎么样。在 output 文件夹里面呀,有一个 svg 图像, 我们这里已经有了完整的数据结果,我们三十一个省,每一个地区的人均生产产值已经有了。 这个时候问题就来了,之前粉丝群里有人问我龙伯,龙伯用 codex 能产生中间结果吗?我们这里看到确实并没有产生中间结果,但是我们可以通过配置 skills 来实现。 我们可以这样说,我现在要写一个大局的 skills, 我 们要求对任何 excel 文件处理的时候都不得修改原文件。同时我们要求在 program 当中存档我们的处理代码,同时在 result 文件夹下输入结果。啊,它在我们的大局技能目录里面要创建一个 excel analysis 的 技能, 大家这个时候可以点开旁边栏的技能,我们就能找到。他说当我们处理任何 excel 的 时候,我们都要使用这一技能。下面就是一些关于这个技能的具体说明。诶,那 skills 是 如何发挥作用的呢? 我们可以把 skills 看做成一段长期维护的提示词,我们可以通过美元符号显示的调用。我们仍然把刚才的问题发送给 codex, 我 们可以看到他说,先定位工作区中的 excel 文件, 确定好之后,哎,脚本写到 program 里面,输出的表格存储到 result 里面。我们来看看使用了 skills 的 codex, 它执行任务的效果怎么样。 我们可以看见 codex 除了给出我们最终的结果文件,它还在我们指定的 program 文件夹下生成了中间的处理结果。 啊,我们点开当前的这个处理结果文件夹,我们可以看到啊, codex 处理刚才任务所产生的排放代码已经生成在我们指定的路径之下了,我们可以根据中间处理的脚本哎来判断它任务执行的正确与否。 我们会发现,在刚才的任务当中,如果不使用 skills, 它会导致缺乏中间过程,难以核对我们处理的准确性。同时啊,这个文件的管理是非常混乱的,很容易污染本地的文件夹。但是一旦使用了我们的 skills, 我 们的 codex 就 可以按照合理的方式来管理文件留存中间的结果,它是非常非常适合科研当中使用的。 好,今天重要的重点来了,龙伯来分享一下自己的 ai 学术工作流。我们做实证研究啊,一般往往是从 data 文件夹下的 raw 原始数据出发,我们可以使用在 program 文件夹下的清洗脚本对原始数据进行加工,我们可以得到 final 分 析数据。 分析数据一般都是已经整理好的面板数据,有了面板数据之后呢,我们就可以使用 stata 来写作 analysis 分 析脚本对分析数据进行加工。 加工之后呢,我们一般容易得到两类结果,一类是表格,另一类是图片。如果你已经熟悉了 la tech 的 使用啊,你可以使用这个 la tech 的 input 命令,把图片和表格直接插入到主文档当中。 需要注意的一点是啊,在龙薄的工作流当中,是有非常多明确的工作规则,尤其是你要告诉你的 ai agent 不 得跨级提取结果文件啊,就比如你的分析脚本,你不能直接提取原始数据啊,你需要提取这个分析数据。 还比如说,你的清洗脚本必须保留明确的摘要说明。同时呢,你的分析脚本在运行过程中,需要对 state 的 运行结果进行存档。 除了基本的工作流之外啊,我们还可以使用更精细的 rules 对 不同类型的文件进行约束。 就比如我们这里 clean rules 可以 限制我们清洗脚本所使用的函数类型。再比如说,我们可以把我们经常使用的表格格式,表格模板放到我们的 result rules 当中。我们可以说,哎,我输出的表格必须是三线表,我输出的图片啊,必须是某种模板,我们可以实现对每一种类型文件的精细约束。 好,有了我刚才所说的工作原则,还有各种各样的 rules, 我 们就已经能得到排版非常美观的主文稿了。 我们就可以告诉我们的 agent 进行投稿打包啊,打包里面其实很简单嘛,就是我们的主文稿, cover, letter, title, page 等等等等。大家会发现,如果我们使用管理科学的 skills, 我 们可以一个命令 就可以实现从原始数据到投稿全流程全过程。 好,有了刚才的介绍呀,大家就可以比较容易的理解龙博的工作流了。龙博自己写了一套 skills, 里面包括了整个科研的全壁画,包括各种各样的文件管理啊,每一种类别的文件啊,应该遵循何种规则呀?啊,在龙博这一套 skills 里面都包括了,可以供大家参考。 好,我们接下来试试龙博的 skills 啊,跟我们上期视频一样,我们整个项目文件夹里面只有 data 文件夹下的 raw 原始数据文件。好,我们这期的学术题目也很简单啊,是区域公共品牌建设能否促进企业采取绿色食品认证。 我们可以这样说,我们打算以区域公共品牌建设为解释变量,绿色食品认证为被解释变量研究的层级啊,是地方杠,年份层面哎,这里有个小技巧,我们可以这样告诉 agent, 我们预期得到正向显著的结果,如果不显著,请调整模型,调整到正向显著为止啊。同时生成中英文两版文稿,将结果插入到文稿当中,并在文稿当中补充上下文,以及对于结果的解读。 我们来看看 codex 的 执行效果。我们把刚才的提示词输入到 codex 当中,大家可以看到啊,在我们输入提示词之后,我们 codex 首先读取了我所提供的 skills, 它会按照我 skills 里面提到的 工作流进行处理。比如他会首先遵循从 program 到 results 到 manuscript 全链路的执行,对于其中不完整的文件夹,他可以自行补充。这个任务比较长啊,整个过程,整个链路耗时都非常长,我们可以稍事休息一下。 好啊,整个项目历时十六分钟啊,已经完成了。中间过程中是他的一些思考呀,他执行一些命令呀,等等等等。 a 阵的说已经完成了结果,主结果是正向且显著的。在主规格里面啊,认证显著水平为正,且在百分之一水平显著。中间呢,生成了一系列的分析脚本,中英文 pdf 文档,我们来看看它结果到底怎么样呀? 我们可以看到,在刚才空白的文件夹里面,已经多出了各种各样的分析文件,由我们开始的 raw 文件, 还有处理好的面板数据, final 文件中间呢,还有刚才我提到的 clean 清洗脚本,使用的是 python analysis 分 析脚本,它使用的是 stat 度文件。同时呢,表格输出到了 result 下面,形成了一个点 tech 文件,它又把点 tech 文件输入到了 我们的分析脚本当中。来,我们来看看写的怎么样吧。题目是区域公共品牌建设与绿色食品认证采纳啊,这里面谈到了他研究的背景数据变量的构造哦,注意看,这里还给出了具体的模型设置,被解释变量取了对数,解释变量也取了对数。 同时呢,回归结果也有了啊,回归结果果然是正向显著的,这里面给出了具体的控制变量控制与否,省份固定效应、年份固定效应、观测值等等等等都给了。 这样子我们就完成了一篇完完整整的结构规范的小文章啊。不过大家这个时候肯定会觉得我目前的研究比较简陋, 以目前的这个我的水平,包括这个 ai 的 水平啊,我觉得还不足以一件完成一篇完整的可以投稿的研究,但是它对于我们的日常研究还是有价值有意义的。比如我们可能对某些话题啊比较感兴趣,我想看看基于我已有的数据,能不能深入的推进这个研究呀,哎,我们就可以使用这一套工作流, 一键耗时十六分钟,我们就可以得到分析结果。哎,如果是正向显著确实符合预期,那我们就可以进一步的深入推进这项研究了。朋友们, 原来我们用代码操作机器,今天我们可以用 skills 来操纵机器。未来是 ai 的 时代,在我看来啊, skills 是 ai 时代的核心竞争力,朋友们,打不过就加入 ai 吧。

大家好,最近 hermes agent 又爆火了,好多人都说我 opencloud 还没有玩明白,怎么又出了个 hermes agent, 这又是啥?今天就给大家聊一聊 hermes agent 到底是啥?你不用会写代码,听过豆包儿叉的 gpt 就 行,它跟普通的网页聊天儿不太一样,关了网页对话就没有了的那种。它更像一种能够长期跑在云服务器上的那种东西, 他会带着工具,他能够记东西啊,干过的漂亮的活儿呢,还能够留下步骤,下次接着用。 get up 上有一句原文, the agent that grows with you, 意思呢就是会跟着你一起变得熟练,他不只是会回答,他还会把该记的都记下来。 下来我会分四块说,技能、记忆、轻推,也就是 note, 还有消息网关,搞懂这四块你就能够明白它到底在干什么。我们平时用的很多的 ai 是 不是聊完就忘页面一关,上次说了啥好像就都没有发生过。还有一种就是绑定在写代码软件里的助手,写程序特别强,但主要就是待在编辑器里干活。 这两种都很好用,但都不是扔在服务器上,一直开着替你干活的那种 agent。 hermes 他 想说的就是他既不是那种纯网页聊天的呃,聊天工具,也不是只给写代码用的 一个编辑器。左边可以理解为常见的短聊天,说完就走。右边呢是指长期开着的工具,越用越多,接下来的东西也会越来越多的。这个 agent 我们讲的就是后面这一种。一句话概括呢, hermes agent 就是 把大模型放进了一整套能够长期跑的系统里,工具记忆啊,还有技能,还有跟各种聊天软件对接的网关,它们是一起工作的,它可以跑在自己的电脑上,也可以跑在租的服务器上。 文档里还提到一些语音上按用量计费的那种跑法,总之,它不绑死在某一台开发机器上。 打个比方,呃,光有一匹好马是不够的,得给他配上呃缰绳啊,还有对应的马具才能够呃走远路。那光有一个好的模型也不够,他也得配上这套东西,才能够稳定地跨很多次对话干活。 名字呢,很容易混 hermes, 它其实模型名也是今天说的这套软件的名字,很多人第一次听就会绕进去。开发这个 hermes agent 的是 north research, 自己做开源模型,也做 hermes agent 这种让模型跑起来的软件。 hermes agent 讲的是权重。 hermes agent, 它是一个跑模型的软件框架,换模型它不等于换框架,这是两回事。 agent 呢,它是把模型装进去,接上工具和记忆的那套软件。先说技能,你可以把它想象成写在硬盘上的一份菜谱, 每件事情特别折腾,模型用了好多部工具,终于跑通了,系统允许他把步骤写进一个叫 scale 点 markdown 的 文件里边。一般在用户目录下的 hermes 呃的 scale 目录呃的这个文件夹下,那下次同样的事情来了之后呢,就不用从头去想,照着这个 scales 这个规范去做就可以了。不对,那就再改几行,不用整份都重写。系统里有个功能叫 scale manage, 就是 管这些说明书的,说白了就是在这里啊 ai, 它可以给自己写操作步骤,以后呢,它还能够自己改。 不是跟网上说的 scales, 其实说的是一回事儿,别人做好的 scales 在 这里也能够装上使用。配置里边呢,还有一个叫 creation node interview。 呃,隔一阵子呢,它会提醒模型要不要把刚才的做法给它。呃,沉淀成为一个 skill, 不 想用的你也可以把它关掉。记忆分三层,这层比较容易误会,我慢慢地说,头一层就是两份很短的文件, memory 既环境,机器项目里踩过的坑, user 是 既,你是谁,以及你的喜好都比较短,有自述的上限, 由 memory 这个功能去改。中间一层是聊天记录,进数据库要找上周某句原话,用 session search 去搜啊。这跟那两页的短文它不是一回事,一个是摘药,一个是原始聊天。再往上可以运行 hermes memory setup, 接一个像 home 这样的外挂,把长期印象做得更重。 那接了外挂,那两页的短文也还在,它是叠在一起用的,它不是二选一。宏光这里很重要。每次开聊模型先看到的是开聊的那一瞬间。 嗯, memory 和 user 这两个文件里边的东西,就像拍了一张快照一样。那聊着聊着,私版上的文件可能已经更新了,但是这一轮对话里,他脑子里的那份 java 他 不一定马上变,往往到下一轮新的聊天才会更新。所以说这个就是他的一个设计的机制。第三块叫 nerg, 英文原意呢就是轻推一下,这里就可以理解成系统帮你设置的一个闹钟 模型,他不会自己想起来我该记笔记了。所以说,框架会按照固定的节奏在内部提醒了。所以说,框架会按照固定的节奏在 user 上, 要不要把刚才跑通的一个任务给它沉淀成为技能配置?里面常见两个参数, memory layer interview 数,你发了多少轮对话, scales layer creation layer interview 数,工具跑了多少轮?不用呢,就给它设置成零就可以关闭了。 另外在聊天的时候要压缩,要结束,或者说网关要清。绘画之前呢,它也会找机会先把该存的都存上,说白了都是一回事,就是别聊了半天啥也没有留下。大家常问,能不能在飞书叮叮 telegram 里跟它说话? 可以, hermes 他 带消息,网关官方列了十几个平台,国内常用的钉钉、飞书企业微信也在里面,具体的名单呢,可以访问这个链接去查看一下。 常见的用法是云服务器上后台一直开着,你在手机里发一条消息,他就开始干活,不用每次自己登录服务器敲命令网关。他干的事情就是把各种聊天软件接到同一个长期跑着的助手身上。他不只是聊天文档里说内置了很大的一堆工具 啊,搜网页啊,抓页面,看图文字转语音之类的都有,具体多少叫什么名字呢啊,大家还是要去官网上和你自己装的这个版本为准拍, 能够 g m c p 把外面的工具再接下来,也能够设定时任务到点跑完把结果发回聊天里,也能够拆成几个字, a 阵台并行的去做一件事情。跑的地方也不限于本机啊,像云端服务器啊,或者刀客里边也可以跑。 另外呢,还有说话风格、文件、项目上下文,安全审批。你需要记住的是,它是一整套能够干活的系统,不只是有一个聊天窗口, 网上总是把 hermes 和 openclaw 放在一起,它俩都能够让你在聊天软件里和这个助手聊天对话,完成任务,操作文件。但是侧重点不一样, hermes 它更强调整件事情串在一起,怎么学怎么记 openclaw 呢?更强调先把各个聊天入口绘画管起来,再接到别的运行时上。 个人设备上的体验也谈的比较多。技术上, hermes 这边常见的是 python 一 条命令安装 openclaw 那 边更多是 node 细节呢?具体呢,要看他们的文档, 不是谁一定要替代谁,而是两种做法。如果说大家安装了 opencloud, 想要迁移到 hermes agent, 也可以通过官网的这个指令进行一个迁移。手动安装的话,官方推荐在 mac, linux 或者说 windows 的 wsl 二里跑屏幕上的这样一条命令,就可以下载这个命令,并且进行执行, 就一路装下去了。装完之后呢,输入 hermes 进行交互, hermes model 是 选接入你家模型, hermes tool 是 设置一些工具,还有设置网关的命令,以及检查 hermes 状态的命令。 hermes daughter。 这里需要特别提醒一下,普通的 windows 操作系统直接装是不行的,要用 wsl 二,不然的话就白折腾。最后查资料,核对命令要以这四个为准。 文档的总入口在这里,安装说明在这里,源码仓库在这里,社区做的网页界面在这里。呃,这个它不是官方出的,这是社区开发的。最后再补充说几句吧, skill 呢,就像菜谱 记呢,有那个 user 点 macdunk 和 memory 点 macdunk 那 两个文件,再加上聊天记录那儿指的是轻推,它是系统提醒,该记的时候就要记。网关呢,是把各种聊天软件接进来,如果这期视频对你有用,记得点赞关注,我们下期再见。

最近有款新的 a 型的火速圈了,叫 hermes, 相信关注 ai 资讯的应该都已经知道了,甚至已经部署好开始利用了,对不对?那我们没有部署好 hermes 的 不用慌,今天我给你们带来全网最简单、最好用、最容易的部署教学,保证没有手你也会,要是看完搞不定你来找我, 那在教育之前的话,先给大家打个定心记。我知道你们现在心里在想什么,哎,我 open color 都还没跑通呢,现在又冒出来一个 hermes, 这个 ai 圈的更新 ai 速度好像也太快了一点哦,感觉都跟不上了。不要这么想兄弟。首先 hermes 也是一个 ac 的, 诚恳的来说,它会不会比 open color 好 用?现在也不好说, 它的核心特点什么自主学习、闭环、持久、分身记忆、 open color 它现在装了 skill, 不是 也有这些特点吗?所以我觉得你即使不装这个什么 hermes, 倒也问题不大, 但是装了有什么好处呢?这个就是我要跟大家介绍的一个模式, open color 当工头, hermes 当工人,让 ai 去管理 ai, 打造一个工作流的效率进化。说的简单一点,即使你现在只有一台电脑,那你最起码也可以有两个超级 ai 助理,难道不好吗? 现在这是一个我已经不锁好的界面啊,一个 open color, 一个 hermes, 那 就让某个二十分钟前,在我刚准备装 hermes 的 时候,我灵光乍现了一下,我为什么要自己动手啊?我已经不是有一个全能的 ai 助理了吗?我们得利用起来。 那么一开始呢, open 哥是拒绝安装 hermes 的 理由非常扯淡。这个就是一个很经典问题,也就是我在前几期视频中跟大家提到的 ai 幻觉引发欺骗效应,不过不要紧,我现在已经有了拿捏他的手段, later, ok, 他 现在已经开始给我安装了。如果你的 open 哥也会存在这种情况,你可以来找我,我给你一个一招制服他的办法,然后接下来操作,我们只需要买杯咖啡刷抖音就可以了 啊,对,有一个操作是要我们自己动手,就是配置一个 apikey, 然后把这个秘钥给我们的 openkey。 你 直接啊复制下来,然后发给我们的 openkey 就 可以了啊,就在这个聊天界面里,这个还是也很容易的。 ok, 那 我们现在到这一步为止,我们的 homebrew 就 已经安装好了啊。有时候我真的是不理解,网上那么多教程,然后弄的乱七八糟的,直接让 homebrew 装不就好了,搞那么复杂干嘛啊我,兄弟们,我们不需要搞那么复杂的, 然后我刚我也试一下,他只能在终端里面聊天啊,这个看着我不是蛮舒服。 他的回信息速度呢,是感觉用的同样都是 mini max 的 密钥。嗯,但是好像比那个 open color 回信息速度要稍微快一些。然后别的话呢,倒也还没感觉出来啊,反正如果大家想去试一试的话,我马上去安装一个吧。

玩 openclaw 到底花了多少投更费?现在省钱买省投更版的 openclaw 来了。赫曼斯艾金,这两天我已经试用了我第一个电子爱马仕,我已经把它安装起来了,大家看一下 赫曼斯艾金,这里面我直接问他,你是谁啊?你能帮我干啥?这是我刚安装的赫曼斯,然后 使用的是 gpt 五点四,然后里面呢一个 sky 都没有,但是默认了有二十八个 toos, 然后我们看了一下,它是一个 ar 助手,然后它能问答制作内容啊,然后技术支援帮我处理电脑上的事,网页,哎,这个怎么是繁体字呢啊? 然后直接问他,你跟 open club 是 什么关系啊?是什么区别? ok, 好, 出来了啊,我看一下,如果你收到某一个 open club, 比如产品,我不管,假装知道名字不同的地方,准确的大家不知道是哪一个是吗?那我直接把 open club 的 地址啊, 是这个啊,我直接发给他,好吧,这就是咱们智能体的作用,兄弟们,用 ai 去学习 ai 永远是最对的啊。你不知道他与欧本克勒的区别,那直接问他,你跟欧本克勒是啥区别? 有任何问题都可以问。哎,用 ai 去学习 ai, 这是学习效率最高的途径。他已经开始看给他发的海报内容, 但这有点慢,因为他之前不知道 open code, 他的知识库里面没有 open code。 就 跟我之前说的一样,他的模型本身是不具备模型训练之前的所有的内容的,他必须配置一些工具啊,一些外部的能力,他才能实时的跟上所有的信息,能够并且能够操作的 ok, 出来了, 他已经说了啊, hermes, 区别很明显,基于你的这个 readme, 然后给一个实用版的结论,我现在更像一个托管型啊,助手 owen koala 更像部部署在本地的个人系统啊。听起来好像也是一样的,部署方式不同, owen koala 主打的什么?控制权不同,奔克劳又怎么样啊,产品形态不同, ok, 总结都在这里了,兄弟们,奔克劳大家使用的时候是不是使用了大量头肯?其中哈莫斯一个最大区别就是它可以省非常多的头肯 啊,跑过稍微复杂的案件呢,就是遇到一个大概率同一个问题,任务越长,账单越高啊,偷客越多,很离谱。为什么?因为欧盟那台逻辑,他的所有的提示词都是系统提示词,加上历史对话,再加上历史对话,加上再加上当前输出, 那你几十轮,上百轮上千轮,他的提示词一次,就是每一次对话后面的偷客就越来越小,越来越小。那这个啊,太恐太恐怖了啊。但是奥马斯是怎么做的呢? 譬如它的 context 等于 system prompt, 加上 for history, 加上 current input, 然后 for history 它会集成成一个 skill, 在 后面会讲到, 然后 hermes 的 三层记忆, hermes 最核心的能力就是将记忆分成了三层,并且记忆管理的很好,对 token 的 管理非常的棒。对,是哈里斯架构的核心之一啊。 说一下记忆情节,他是怎么去把他的记忆做成呃,向量数据库的,他把每次历史的一些对话都做成向量的数据库啊,存放在本地,然后把语义记忆呢?自进化成 scale, 哎,这里面就有沉淀 scale 的 功能,这些 scale 是 他自净化的, 所以说他适合做个人助手兄弟们,因为他可以真留你自己啊,真留你自己的。而镜头出来了,这里面的樱花像底下的执行终端我就不说了啊,还有一个特性,他是安全体系,安全体系他首先是防止是要注入的, 譬如说有些黑客他可以注入一些 r m 杠 r f 这个语句是什么意思呢?把你文件所有永久性删除啊,这些注入是可以防住的,然后符号连接绕过防护啊, aprk 的 隔离,然后危险指令的检测 都做了,这是基于欧本科的区别,还有模型的厂商我们可以支持很多,然后每个每个模型厂商不同的 pro y 的 有多个 api 可以 都是可以做到的,然后可以设置的兄弟们,我都写的清清楚楚啊, 然后安装就不大家说了,这里面我觉得跟大家可以聊的就是与主流框架,就赫默斯与克拉扣的和 open 克拉的区别是什么?这里面我也做了一些维度,是记忆机制,这这里面记忆机制是赫默斯做的非常的好啊,把他的历史对话项链化和 啊他的技能,他的历史对话变形变成 skill, 把他你的能力变成 skill, 这一个自动化的功能,如果作为个人助手的话,把你个人给蒸流出来啊, 哎,这里说到这里,我觉得公司也是可以适合每个员工做这种啊,等他离职了,自动蒸馏出来他的记忆和 skill 啊,太棒了,老板们一定要关注一下。然后 token 啊,说到啊 token, 它的本身效率就跟它的记忆层是有关系的啊,所以说 token 的 效率节省非常的明显 啊,模型绑定啊,基本上可用的,最大的问题就可用的只能用自己的,但可用的的确强啊,小雨平台也有, 然后这任务是内置的,这两个需要去调这任务的 m c p, 对 吧? ok, scale 是 生态啊, hermes, 它内置了很多 scale, 然后并且它能够自沉淀。 scale 这个很核心,降低了用户的门槛,和克拉蔻的关系是互补啊,这里面我写了啊,兄弟们, 这里面可大家可以感兴趣可以自己去看了。科目四的确更向个人助手面向于个人,因为他的门槛再进一次降低,说白了,他的上层建设,比如说,呃,历史记忆啊,记忆层和 啊, scale 城和 m c p 和 twos, 它已经大量的自带一些系统,并且它可以自建设。然后 open cloud 呢,更类似于工程化的,规模化的工程框架,它需要一些建筑门槛,然后面向企业可能更合适。兄弟们啊,感兴趣的可以看一下。

前天我不是说这个 hermes 适合做主脑,然后 open claw 是 天生的打工人,然后我今天就把这个架构实现了,看现在的架构三 a 准,我还中间把它添加了一个叫做 cloud desk, cloud desk, cloud desk, cloud desk 可以 算是你懂的。哎,这个不要不要,不要详细说啊,它现在的架构是什么呢? hummus 就是 它作为一个联络窗口,我不需要跟那个 open crawl, 跟那个 cloud desk, cloud desk 去对话,然后我就直接跟 兰花,也就是说这个号码对话,我给他任务,然后他拆解任务,然后有必要的话,他会调用这个 clouddesk 做一个 outro plan 的 一个解释,然后返程计划步骤。之后呢,再重新分派任务给到 opencore, 即执行,或者给到 clouddesk 去编码, 然后呢再返回给到 hermes, 然后 hermes 得到了最终的结果,在教验过之后再把它返回到给我。就说整个过程呢,他 hermes 他 是不不干活的, 他只需要做做一些决策类的事情,这样的话他就不会像以前那样子 hems, 他 在处理事情的时候很容易卡死他,现在这种结构呢,下来呢,他的卡死几率很小。 然后他们之间呢,蓝就是 hems 跟 opencry, 还有跟这个 cloud dash 是 通过一个叫做 mcp 协议层去调度的, 就说他们自之间的沟通是通过 m c p 的 一个协议层去沟通,然后这两个完全我不需要管他就是我不需要管他里面是怎么实现 就可以了,非常的。怎么说呢,整个整个提升是很明显的,我给到他的任务的话,他很多时候他派发下去很快就完成, 跟以前不一样,以前他自处理一些代码类的东西,可能是新手,或者说是他,实际上他的主要作用还真不是代码类, 所以这样分派下去之后,你得到的一个非常完整的一个小团队,大家也可以尝试一下。我说一下我的 我的步骤,我的步骤是先安装的是 hermes, 然后用了一一两天之后呢就叫 hermes 帮我安装了一个 open core, 安装了一个 open core, 部署完可以看一下, 可以看一下今天早上,就今天早上的时候我问他,你知道 open core 吗?他说知道,然后我就叫他部署了一个 open core, 好 部署完 open core 之后呢, 就他就利用 open pro 做,做成一个执行层,部署完成,你看部署完成状态,然后做成了一个执行层,整个过程呢都不需要我去插手, 整个过程都不需要我去。然后 open pro, open pro 的 这个协助测试成功,测试完之后我又有了一个新的想法, 但是这个中间肯定是去进行了很多的一个调试,比如说他的这个协助方式我觉得不对,然后我要重新指定说你要作为一个主脑 只是决策、规划、拆任务,然后用户交互,但是其他执行呢就不要去执行,你要去叫人家去帮你干活,是这样的,然后呢?你有没有防备? 我发现他很聪明哦,他自从我跟他说了作为一个主脑存在之后,他自己又分析了一下,然后又加入了一个叫做卡拉库,但是卡拉库这个你要知道 卡拉库这个这个东西是一个就不算开源吗?然后我就我就跟他说卡拉库是不是开源的给你,然后我就找了一个叫做 也是卡拉库,也是卡拉库,但是不是这个卡拉,是那个卡拉库,是这个韩国韩国人重新编写的这个卡拉库,然后他就把这个卡拉库部署,但是部署完之后就发现一个问题,卡拉库他也只能使用 这个艾斯洛匹的这个这个 a p i, 没法,没法去使用第三方的一个 a p i, 这就有点限制。我现在用的是英伟达的一个免费的一个 api and so on p 的 这个 api key 呢?我就没有没有没有去订阅,所以后来就发现还有一个类似的东西,但是它可以支,很好的支持一个英伟达的一个方案, 然后就是这个叫做 cloud desk, cloud desk 的 这个它的功能实际上是类似的,就是没有太大的区别,都是可以用的,所以我就叫他搭建了这个 cloud desk, 然后最终就得到了这个三 a 准的这个架构, 三一整的这个架构实际测试下来是非很稳定,我觉得大家可以实实验一下,好了就到这里吧。

嘿,朋友们,最近外网已经被这个 hermes agent 刷屏了,那国内讨论的声音好像并没有很多,那有人就拿它跟 openclaw 小 龙虾比,说它比 openclaw 要智能多了,那这到底是一个什么东西呢?我们普通人能用吗? 今天我就先用大白话给大家讲清楚,然后再跟着我一起来安装一下,因为我暂时也还没有安装,你也可以跟着我的步骤一步一步大家一起安装一下。 首先 hermes agent 是 什么呢? hermes agent 是 一个会自己进化的一个 ai 助手,你用它呢,它就在学你,它学会了呢,你下次用就省事多了。那我们普通的 ai, 比如说我们的这个跟 ai 对 话的聊天窗口,比如说在 gpt 啊,或者 deepsea 了,你每次跟它对话呢,你都要重新跟它解释一下你的背景, 它每次都会忘。虽然说现在的 ai 它基本上都有了一个记忆的功能,但是你也要手动地去进行一个填写。那 hermes 它是这样的,就是你第一次用它的时候,比如说你让它帮你把一篇文章转化成微信公众号的一个格式。那第三次,第四次之后呢,它自动就会把这个任务记录成一个 skill 文件,就是一个技能文件。那之后呢,你只要跟它说帮我转化格式,它直接就帮你搞定了。你不是在教它,而是它在学你, 它靠的是什么做到的?这件事情呢?其实就是三层记忆。首先第一步呢,就是它的一个绘画记忆,就是你每次跟它聊天,聊了什么,它会记住。那第二点呢,就是持久的记忆, 它会记住你是谁,你的偏好。第三个就是 skill 记忆,就是记住它学会了哪些技能,那每次对话结束之后呢?它会把重复出现的一些任务模式呢,提炼成为一个 skill 文件,你不用手动去操作,它自己就做成了。比如说如果我们有用过 cloud code 或者是其他一些啊 agent 工具的话,应该都有这个感觉,就是 当你给他编写了一系列的规则之后,你需要主动去告诉他,帮我把上面的这些规则做成一个 skill 文件,放在本地的文件夹里。但是 hermes 你 不用说这些话,它自动就会进行一个更新迭代,自己就会学会去把这些技能做成一个 skill。 那 除了记忆方面呢,它还能通过 m c p 协议连接六千多个外部的应用,比如说 github 或者 notion 或者 gmail 等等,让它真正能去做事,而不仅仅是聊天。这一点呢,就是比 openclo 可能做得好很多,因为 openclo 很多的这个外部 协议呢,需要我们自己去手动连接的,那它和其他的 ai 工具有什么区别呢?这里我就把它跟 cloud code 跟 openclaw 进行一个对比。那起部门坎呢,就是 cloud code 跟 openclaw 它都是要写一个配置文件的, cloud code 这边就是 cloud 点 md, openclaw 这边是 so 点 md, 你 要在这个文件里面告诉你是谁,你的一些背景,你的具体的一些情况,那 hermes 这边呢?装完就可以直接用了。 那记忆更新方面呢? cloudcode 跟 openclaw 都需要你手动去进行一个更新的,比如说你觉得这一点很重要,或者这一个规矩需要它长期记忆的话,你需要主动去告诉它,那 hermes 呢?它会自动进化。另外呢, cloudcode 它可以实现实时编码,那 openclaw 它就是可以进行一些个性化的一些配置。而且 openclaw 这边有一个优点,它可以进行一些 群聊的一些设置,比如说你们一个小团体,大家可以一起来用这个 openclaw, 然后大家可以一起来用它。 那 hermes 这边呢?它就主张的是一个长期的一个自主运行,而且它比较偏向于你个人在用,然后它会学会你个人的一些习惯。 那简单来说呢, hermes 它更像是一个朋友,你越用它就会越了解你,然后你就会越离不开它。那 opencloud 更像是一个员工,你让它干啥它就干啥,你如果指令不清楚呢,它可能就会做的不是很好了。那到底要怎么用呢?首先它的安装方式跟小龙虾类似,都是在终端用这行代码进行一个安装, 在终端都是需要配置 ai 的 api key 的。 那这次呢,我就不想花钱了,我就打算接入本地的大模型用,通过欧拉玛去下载一些 本地的大模型。那现在主流的开源的模型呢?已经很多了,而且非常的强大,免费的跑起来也完全够用了。比如说最近很火的这个 zara 四,就是 google 旗下的这个开源大模型,那我今天就打算试用一下这个。 ok, 那 首先就跟我一起来安装一下吧。 ok, 我 们在开始安装之前,我要特别提醒一下,就是 homeys, 它跟小龙虾一样,它的权限也很高,所以部署在本地电脑的话,它是有一定风险的。最好是你要部署的这台电脑呢,不要存放太多重要的资料,比如说银行卡密钥,或者是各种的密码,各种的重要的一些资料。 其实我更推荐的是部署在云端,但是现在基本上所有的云端的服务器它都是会收费的,可能就是一个月几十块钱的一个费用。那如果你要部署在本地的这台电脑上,让它更好的帮你去工作呢?那你最好是做一个重要的资料的一个隔离。 ok, 那 我们就开始进入这个安装的过程吧。首先先来到官网,然后我们可以看到这里有两行代码,第一个 install 就是 安装,只要你复制这行代码呢,打开你的电脑的终端,然后复制这行代码就可以了,因为我昨天是已经 安装过了,你可以看到我今天跟昨天不太一样了,所以稍后我也会跟大家讲一下我的一个使用的感受。那如果说你也是安装完之后一不小心关掉了这个终端,然后想要重新设置里面的一些内容的话,那可以就用第二个命令 hermes set up, 我 们就可以重新 set up 一下,那 ok, 那 可以今天根据我的这个步骤,大家可以一起来看一下如何 set up, 那 就是在终端运直接运行 set up, 那 这里第一个问题呢,我们直接选 yes, 他 这里问你要不要把你之前的比如说 opencloud 的 东西 移植过来,如果你电脑上以前有安装过 openclaw 的 话,那这里如果选 yes, 就 直接一键把 openclaw 的 所有的使用规则,或者你 openclaw 呃,一些内容全部就一键移植过来了。那我们这边也选 yes, 这里有两个选择,一个是 quick setup, 还有一个 full setup, 其实它这里推荐我们直接用这个 quick setup, 那 么就直接选 quick setup, 然后第一个就是,呃,选你的 provider, 就是 你的 ai 你 要用哪一个大模型?在这里我可以给大大家提供一下我的个人的经验。其实最一开始我视频前面也说了,我这次本打算 不花钱的,就是用一些本地大模型,但是我昨天安装了这个欧拉玛的本地大模型 german 四,就是 google german 四,之前说它很智能很好,但是,呃,很遗憾我的电脑它实在是带不起来,可以给大家看一下。我安装完之后呢,就是随便提了一个问题,它的回答就要花费 差不多十四分钟回答了一个问题,大家可以看一下我这个截图,就是昨天我是试用了这个四,但是我问了一个问题,就说一切都正常嘛,结果他用了十四分钟才回答完这一个问题,所以实在是受不了这个速度了,所以我果断后来就选择了别的模型。 我这里最终是选择了 kimi, 因为我在 openclaw 的 时候,我有试过 dipsic mini max 跟 kimi, kimi 跟 mini max 它们两个的能力其实是差不多的,但是 mini max 它 回答的响应的这个速度比起 kimi 来讲的话会差那么一点点。 deepsea 它是最便宜的,如果你非常的在乎这个性价比的话,我首先推荐你用 deepsea, 但是 deepsea 它有一个缺点,就是它没有图像识别的,呃,这个能力,它没有 vision 的 这个能力,但是 kimi 它是可以的,就是你给它截图,它是可以识别的,所以我最终对 比之下还是选择了 kimi, 它是会比 deepsea 和那个 mini max 稍微贵一点点的,但是也没有贵到像 cloud 那 么贵那么夸张,所以我这里就暂时选了 kimi, 我 也是选了 kimi 的 二点五,我用下来,我感觉 kimi 二点五真的是非常智能,我电脑是有安装 cloud code, cloud code 现在用的是呃四点六的那个版本,我觉得四点六的版本跟 kimi 的 二点五 其实它们两个是不相上下的,因为我也没有处理特别复杂的问题,只要是处理一些呃读取文件这一方面的能力的话, kimi 二点五是完全够用了的。那至于编程方面的话,可能还是 colloud 会稍微强一点,那我们这边还是 kimi 二点五。 如果说你是第一次设置的话,你选择之后它可能会让你提供 apikey, 那 么 apikey 呢?就是去这个 kimi 的 开放平台。呃,我这里有特别强调一下,就是 kimi 它的这个开放平台呢,是分两个的,一个是点 c n, 这个就是咱们国内用的。另外一个呢是点 a i, 它是国际用的,然后在 hermes 它的这个设置当中呢,它是默认用的点 a i, 也就是国际版。所以如果大家给它提供的是这个点 c n a p i 的 话,它虽然可以设置,但是它可能最后 响应的时候会会报错,但这个也没关系,你直接把它报错的这个内容呃,截图发给任何一个在线的 ai, 让它告诉你在哪里哪里去修改,只要修改一个文件里面的一行代码就可以了。然后这边设置好之后呢,我们 进入下一个,就是设置你的 message 的 通道,你要用哪一个平台跟你的这个 hermes 进行一个对话?那我们来看一下,这里的话可以设置 discord slack, 还有前两天它刚刚可以连接微信了,所以如果国内的朋友的话,可以直接在这里连接上你的微信。因为我这边也是之前已经设置过了,所以我这边就先跳过了。 最后呢就是让 restart 的 getaway 重开这个 getaway, ok, 那 我们就重开一下, ok, launch hermes chat now。 如果你在这里点 yes 的 话,你就可以直接在终端里和你的 hermes 进行一个对话了,那么就直接点 yes, ok, 现在我们可以看到这是 hermes 的 终端, 我们看到这个 logo 就 基本上表示你已经设置成功了。好,那我这里的呃 ai 就是 kimi, 二点五,我可以跟他对话,你在吗?你是谁?如果这里出现了问题呢?也不用怕,你可以把这个问题呢直接复制粘贴给任何一个 ai 或者 jpg 或者 deepsafe 等等,都可以让他来帮你解决这个问题。那我这边是有这个 呃 cloud 的, 那我直接用让 cloud 帮我去检查一下这里是什么问题。对,我这里就是出现了每次都同样出现的一个问题,就是因为我的 api key 是 拿的点 c n 的, 然后它这里又识别了点 ai, 所以 又需要我们去手动改一个代码, 这里我的 cloud 已经帮我改了。如果说你没有 cloud 的 话,你可以直接问你的任何一个 ai, 它会告诉你在哪一个文件夹里去改这个代码,那我们就重新再开一下 hermes, 在 这里直接你点开中专直接打输入 hermes, 它就成功了。然后我们在这里问一下,你在吗?你是谁? ok, 可以 看到它现在已经在 回答了,已经在思考了。好了,他已经回答了,他说,在,我是 hermes agent, 你 的 ai 助手啊,这个女王陛下是我之前给这个 openclaw 设置的,然后他这里也也已经记住了。下面我就跟大家聊一下我的一个呃使用感受吧, 我是从昨天安装好的,然后今天整个也用了一天的时间。然后我最大的感受就是,呃,首先呢,第一就是你在设置它的时候,它就可以自动把 openclaw 那 边的内容全部迁移过来,不用你手动再去进行重新设置一遍了。第二点呢,就是它的设置 比 openclaw 要简单很多,如果大家想要了解 openclaw 的 一个安装的话,可以回顾我之前过发布过的一期视频。那这边对比起来的话,你看,我们刚才只是设置了这个,嗯,提供了一个 ai 的 apikey, 然后设置了我们的聊天通道,包括那些网络什么的,这个连接你你 都没有设置,它都已经自动设置好了。那第三点呢,就是不用你手动去配置太多的内容,比如说网页搜索的这个能力。之前我们不是在 openclaw 的 时候还要 手动去给它配置一个这个功能嘛,所以这边的话,因为它内部已经自带了很多的 m c p 的 这个一些协议的一些功能,所以我们就暂时不需要再给它 搞了。那第四点呢,就是它能全部的读取我已经安装过的呃 skill, 因为我之前安装过很多奇奇怪怪好玩的一些 skill, 它全部都可以读取出来。嗯,那第五点呢,就是在使用过程中 要用 skill 的 话,你不用再去提醒他,比如说我让他帮我改稿,因为我自己之前是设置过一个呃让 ai 帮我改稿的一个 skill。 然后呢,每次比如说我用 cloud code 让他帮我改稿的时候,我要提醒他一下,你用我的改稿的 skill 去帮我 改稿。但是在 hermes 这边我不用做特别的提醒我这稿把文章发给他,让他直接帮我改稿,然后他就会自动去识别,去查找我的相应的 skill, 然后这点真的是使用起来 真的是方便很多。第六点呢,也就是 hermes 它宣传的一个优势就是它有这个长期记忆的一个功能,它可以把你每次对话的这个内容进行一个打包,然后重要的呃内容它会写写入它的这个长期的记忆里面,所以你下次再调用它的时候,它会对你记有一个记忆。不是所有的任务都是从从头开始的, 因为我使用了 openclaw 也一段时间了,然后电脑上也有配置 cloud code, 然后现在又安装了这个 hermes。 我 来跟大家讲。呃,这三个的最大的一个感受就是如果它跟 openclaw 比起来的话,它的故障率真的是少了很多,就是呃遇到了一些问题呢,它其实可以进行一些自我修复的。 那个 openclaw 大家使用过的人都知道,就是它经常就会没有响应了,或者就是没有反应了,然后它的版本也是经常会更新,然后你基本上每天打开第一件事就是先去更新一下你的 openclaw, 呃,然后有的时候更新着更新着它就掉线了,就是它的这个 get 位重启之后,不知道为什么那个 telegram 就是 经常连接不上, 然后总是会有一些这些小小的问题了。然后呢,它比起 cloud code 就是 多了这个自我更新的这个能力,也多了这个自我调取 skill 的 这个能力的确是强了很多,省事了很多,就是让我跟他布置任务的时候就少打了很多字,少少费了很多心。 那我接下来的一个打算就是,首先我要放弃我的小龙虾了,因为之前正好我给小龙虾配置的那个 ai p i k 也快要用完了,差了 不到一美金。然后 hermes 这边呢?好,正好接上了。然后 cloud code 我 这边是已经买了一个它的。嗯, pro 的 会员就是一个月二十美金。那接下来我就是打算一些编程的。呃,任务,呃,像 web coding 啊,或者是写脚本这样的任务呢?交给 cloud code, 然后 hermes 这边就帮我处理一些我工作当中的一些任务,比如说帮我去整理文档啊,去帮我管理我的个人知识库啊等等这一系列的任务。那 ok, 总体使用下来,的确感觉 hermes 比 openclaw 要强很多,如果大家感兴趣的话,你也可以自己上手去试一下。 ok, 那 我们本期的视频就到这里,如果你有任何的想要聊的,想要说的啊,有遇到任何问题都可以在我的评论区留言啊,我看到的话都会积极的回复大家,如果你也对 ai 相关的话题感兴趣的话,可以关注我。然后我是非技术背景出身的,用通俗的语言带你玩转 ai 的 玛提娜,那我们下期见,拜拜。

兄弟们, hermes agent 最近实在太火了,满大街都在传它是年轻人的第一只爱马仕。这几天我实测了一轮,今天就用一分钟,给你看一下爱马仕到底打不打得过龙虾。 先说安装,在国内安装爱马仕是超难的,因为它的安装脚本会克隆外网 get 仓库,几乎不能成功,这一分龙虾赢。 再看记忆,爱马仕不只是写个文件,他还上了本地数据库和跨绘画的权威解锁引擎这块我投爱马仕一票。 然后是技能,爱马仕有个很猛的点,就是他会在使用中自己生成 skill, 后面还会继续迭代龙虾,还是传统的手搓或者下载 skill。 爱马仕又下一程。 平台接入这块,虽然爱马仕现在接了十七个平台,最近连微信都接上了,但跟龙虾的全平台接入还是很难比。 自我迭代是爱马仕主打的,号称越用越会越跑越懂你。龙虾这边得靠社区 skill 来补,所以在自己变强这件事上,爱马仕更突出一点。 安全这块,我个人会更偏爱爱马仕,它默认就更谨慎,审批、审计、隔离这些都更完整。反过来看龙虾,我对它的安全性一直有点担心,尤其是 skill 这块,随手就能拉别人代码下来跑,这个口子我觉得还是开的太大了。 对比下来, hermes agent 拿了四颗星,而龙虾只有两颗,这是不是说明爱马仕完胜龙虾呢?并不是,因为爱马仕第一步的安装就已经劝退了大部分人,而爱马仕比龙虾强的地方,又都建立在你多少懂一点编程这件事上。 说到底,爱马仕和龙虾适合的并不是一类人,你更想养哪一只?评论区告诉我,下期见。

楼下有 memory cloud code, 有 cloud md, 现在主流的 aint 都在解决记住的问题, 但最近有个叫 hermes 的 aint 火了 github 四万多 star。 他 说他做的不仅是记住,他能从经验中学习自己创建和改进技能,这个说法比记住大了一个量级。我挺好奇的,就去研究了一下。 先说清楚 hermes 到底是什么。 news research 今年二月发布的一个开源的 agent 框架,跟龙虾和 cloud code 都不太一样。 cloud code 是 坐在你爱的旁边的搭档,你说一句,他做一句,非常同步。 hermes 呢,更像住在你服务器向的旧里, 能借 telegram discord 的 消息,能定期帮你跑猎物,你不在的时候,他自己也能干活,五块钱一个月的服务器就能跑,集齐两百多个模型,不绑定任何一家。但说实话,这些都不系他火的原因,他火是因为两个字, 进化。 hermes 的 进化核心是一套 skill 系统,你可以把 skill 理解成笔记,但不是你记的,是 a j 的 自己记的。 比如你让它部署一个服务,过程中掉了七八个工具,踩了两个坑,最后搞定了。搞定之后,它会自动把这个过程提炼成一个文件,不就容易出错的地方,怎么验证成功全写下来, 下次再碰到类似的事呢?直接调这个 skill, 跳过试错。而且这些 skill 遵循 aj skill 点 i o 的 开放标准,你写的,别人能用,别人的你也能拿来。干得越多,积累越多,越来越强。 理论上确实是越来越强。对,理论上是这样,但有个问题,这些 skill 是 谁决定要存的? aj 的 自己是这样,但有个问题,这些 skill 是 谁来把关,也是 aj 的 自己 这就有意思了。 lolm 评价自己的时候几乎总觉得自己做得不错,这不是 hermes 的 问题,是所有 lolm 的 通病。你让他自己打分,他给自己打八十五,每次都是 你用了三个月积累了两百个 skill, 但这里面有多少是真的好用的?有多少是碰巧管用了一次就被存下来的?有多少其实现在已经过时了,就像一个人写日记,从来不回头看,写了一年,觉得自己成长了很多,但其实本子里什么都有。 但 hermes 团队显然也想到了这一点,他们做了一个单独的项目,叫 hermes agent self evolution, 用了 d s p i 加 g e p a, 一 种遗传算法式的优化技术, icl 二二零二六的 auto paper, 学速像是实打实的。 这层的思路就不一样了,不是让 a 键的自己说自己好不好,他读机心嫉妒。分析失败的具体原因,不是简单的成功失败,爱分法是搞清楚为什么失败的, 然后形成好几个 skill 的 变体版本,每个都要过五道关,测系必须全过,文件大小有象限与一不能偏。最后输出的是一个 p r, 还是得人来看一眼才能合进去。 一次跑下来两到十美元,不需要 gpu 自动化做粗筛,应约束兜底原作最终判断。这个设计我觉得是对的, 不过休息化大部分用户可能不会去跑这个流程,一墙用的还是下面那层自动积累效果到底好不好就不太确定了。 其实退一步想,自我进化都会照向同一堵墙, 他能感激的细节太窄了,他看得到自己的即兴记录对话 skill, 但看不到你没说出口的需求变了,看不到外面世界的规则更新了。 比如团队三个月前用 docker compose, 现在签到 cubanet s 了。 agent 不知道,因为没人告诉他 skill 库里那条旧的规则还在被一块地调用着。 没有外部信号的话,进化就容易变成在回音系里转圈。不一定是在退步,但你很难确定它真的在进步。所以以后看到任何 agent 跟你说我能自我进化,我自己会想三个问题, 第一,反馈从哪来?是自己给自己打分,还是有外部信号测试结果,用户的纠正,真实的成功率?这些才算数? 第二,有没有计量兜底烂的经验,能不能被发现,被淘汰,还是存进去就永远在那越攒越多?第三,能不能处理过时?半年前存的经验现在还对吗?有没有机器能检测到环境变了? 这既是我自己的思考角度,也不一定对。欢迎在评论区讨论。说回 hermes, 我 研究完机厚结的这个项目是认真在做戏的。 q, 系统离线进化的方案 g e p a 的 论文质量都是实实在在的,越用越聪明。这个方向我觉得是对的,只是今天完全放小,让 a 键自己进化可能还早了一点。 你不需要盯着他的每一步,但隔一段时间回来看看,给他一些他自己拿不到的反馈,连和 a 键一起进化,可能比让 a 键自己进化走得更远。