当 ai 掀桌时,没人会等你学完 hello, world 如果你不知道从哪里开始,接下来请和我速通八个 ai 必学的顶级知识点,掌握四种以上的人可以胜任百分之八十的 ai 岗位。呃,这段时间这个黑妹子的这个 agent 非常呃受关注, 核心原因呢,不是因为他能够聊天,而是他越来越像一个会自我成长的 agent, 用的越多呢,你会发现他能力呢就在不断成长啊,智能库也在持续的进化,更多大模型资料可在这主页群领取。呃, 好,大家好,我是金哲。那今天呢,我就用这七步带大家来看一看他是如何从这个毛坯版啊变成真正能干活的专属智能体。 首先呢,我们第一步先不要着急装功能啊,你要先去确定他的身份角色啊,你可以先建一个瘦点 md 把他是谁对吧?哎,他的角色定位,说话什么风格啊,做什么事情用什么办法啊,哪些边界不能碰,全部写清楚。说白了,这一步呢,不是在给他 那做工具,而是在给他立什么,立这个人设对不对?好,如果你不想从零线呢,也可以直接去参考一些其他的这种职业模板啊,先去套一个这种现成的框架,再慢慢去改成你自己的风格,因为没有这一步,你后面装再多的能力啊,他也是一个只会说话的 好。第二步,我们要去给他换一个什么呢? a 键它呢, 不是每次都会重头认识你,而是越用他能够越懂你,越知道你的喜好。这个地方呢,我们就可以用他的这个呃,记忆的一个配置啊,去连接,让他自动的提取实体事实、时间信息、人物关系,然后慢慢的 搭配长期的这个记忆跟知识关联。这样一来呢,你之前聊过的这些项目偏好,目标进度,他都能够记住,这个时候呢,智能体就不再是临时聊天,而是开始进入持续写作了。第三步呢,我们给他啊 安装一个全网抓取的能力,这个部分呢,因为你光想不够,你还得去连接外部,对吧?你得会去看世界。那比如说像这个 gina 的 这种工具呢,我们就非常适合去做一个什么呢? 哎,单页内容读取,包括啊其他的这些抓取的工具呢,我们啊分别有这种批量抓取的,自动化采集的 啊,那所以呢,这里呢,触杂复处理这个更加复杂的页面访问场景。这一步的意义呢,就是你让他不只是听你讲,而是真正能够呢,去网上帮你找,帮你去读,帮你收集相关的资料。好,第四步,我们给他转一个什么呢?专业的研究工具。 这个部分呢,因为我们抓取回来的内容只是啊原始的这样的一个数据格式,那真正难的是呢,怎么把它变成能够用的知识。那这个地方呢,我们像这个啊, 可以负责万能的这个格式转换,对吧?那我们这个 mark, 它可以把 pdf 转成 markdown, 对 吧?那这样呢,我们适合把长文档研究资料扫描件呢这类的,这个内容整理的更加干净啊,结构化,你可以把它理解成是什么呢?做了一个数据的清洗, 把这个资料呢洗的更加干净,你后面呢,读起来才会更加顺利。好,第五步,我们要去做一个什么,做一个多模态的升级, 这个部分呢?哎,我们就不是让他从以前只会打字,对吧?我们是让他可以做什么呢?语音识别啊,哎,还可以负责什么呢?语音的合成,甚至可以做高质量的图像生成, 那这些配置呢?大家可以看一下啊,那这样一来呢,他就不只是能够读文本,写文本,而是能够听懂你说什么,也能够开口说出来,甚至能够把视觉内容一起生成出来,那这个时候他就会你发现他更渣啊,像一个完整的生产工具了。 好,第六步,我们要去做的是控成本,提效率。那在这个部分呢,因为,呃,这个特别重要,因为很多系统不是做不出来,而是因为呢,你跑起来发现,哎,不怎么好用,对不对? 那这个时候呢,我们可以配置这几个工具,那分别呢?让他们去啊,看到托管的消耗以及成本啊,也可以去看到运行的状态跟整体的过程,包括我们这个 r t、 k, 对 吧?更加偏向于什么能力的扩展 跟这个效率的优化。这层的核心呢,不是能不能做,而是我们要啊,长期稳定的去做,不然你前面做的再好,对吧?后面你一看,哎,成本承受不住,输出流程都很复杂,那就不行。好,第七步呢,我们要去统一配一个什么呢?总的一个入口,那在这个部分呢,因为工具一多, 哎,我们最害怕的就是什么呢?哎,就是散,那这个时候呢,我们就可以用这个二十万啊, emsi 进程的这种生态入口,把前面的能力呢给他统一梳理起来。哎,我们哪个工具负责记忆,哪个工具负责抓取,哪个工具负责研究,哪个负责多媒体,哪个负责成本治理。那这个时候呢?哎,我们把所有的能力给它收了, 那做一个系统化,那这样呢?他才不是一个工具堆,而是一个什么真真正正的智能体工作台,所以我们可以看到,对吧?最终我们,哎 安装完成的不是一个只会聊天的这个助手,而是一个什么呢?有身份、有记忆啊,能抓取、会研究,还能自动进化的一个专属智能体。
粉丝3064获赞1.4万

最近爆火的爱马仕智能体 hermes agent, 它并非完全开箱即用,你需要学习一些进阶配置才能让它达到完美状态。 本视频会带你完成五大维度的配置,从身份、人格、感知能力、表达能力、到头肯成本管控和生态资源入口,我们直接开始。第一步,编辑,搜点 md 来定义人格。 你可以直接用 agency agents, 这个库里面有两百一十一个中文角色模板,还有四十六个针对中国市场开发的原创智能体。这些角色按工程、设计、金融等十八个部门分类,每个都是独立的 m b 文件, 你只需要在对话时告诉 christmas 要激活哪个角色,就能直接上手,后续还能根据需求随时优化。第二步,把内置的 m e m o i 换成 hindsight。 内置记忆有个硬伤,它只有在 ai 觉得重要时才会写,而且有两千两百字幅的上线,很难实现真正的长期记忆。 而 hindsight 会自动从每轮对话里提取实体事实关系和时间戳,构建成知识图谱。最关键的是,它会在每次调用模型前自动把相关的记忆注入到 system prompt 里,实现真正的跨绘画长期记忆。 具体操作很简单,首先运行官方的安装向导,输入 set up 命令并选择 hindsight, 它会自动帮你搞定依赖。接着去 hindsight 的 官网页面注册并生成一个 api key, 免费额度完全够用。 最后,通过 status 命令检查状态,只要看到 bank id 和 auto recall 这些状态显示正常,就说明 handset 已经激活成功了。 第三步,配置内容抓取工具。我们要实现对互联网信息的深度感知,对于单页抓取,推荐用 genome reader。 如果是大规模的批量抓取,用 cross 四 ai 这两个工具建议通过 skill 方式集成。而对于反爬绕过和隐身浏览器需求,可以直接通过 p p 安装 scrambling 和 camel fox, 这两个是官方原生支持的技能。第四步,配置搜索与文档处理工具。 安装完这些, hermes 的 搜索能力会直接升级。我们把 tiffany 作为主力,他每月提供一千次免费的 ai 专用搜索,再用 dark dark go 做,零成本都抵。同时配合 panda 和 mark, hermes 的 文档处理能力也会起飞,支持任意格式互转,尤其是 pdf 转 markdown, 精度非常高。 第五步,配置表达能力工具链。我们要让 hermes 从只能读文字变成能说能话。语音方面,集成 whisper, 实现九十九多种语言的识别,配合 h t t s 搞定免费的语音合成。视觉方面,通过 files ai 和 l l u x skill, 直接给 hermes 加上高质量的出图能力。 第六步的第一项是实现 token 的 精细管控。首先是 talk scale, 这是一个专门为 ai 助手设计的监控工具,你可以直接用 npx 命令快速启动。通过它的交互界面,你可以实时看到局域的 token 消耗,也可以专门过滤出 hermes 的 数据, 甚至能查看过去一周的消耗趋势,或者把数据导出成 json 控脚本使用。如果你需要更专业的成本分析,就用 home studio, 它比官方的 dashboard 强大得多。通过 git clone 并运行安装脚本,你就能在浏览器里打开一个实时监控面板, 它能把多肯消耗细化到每一个模型、每一个组件,甚至是每一次工具调用。它提供了十四个不同的监控维度,能让你彻底看清钱都花在哪了。 接下来是真正的干货, r t k。 这是用 r s。 写的工具,专门用来解决 ai 调用终端命令时 token 爆炸的问题。通过全局集成命令,它会自动重写所有的设备调用。 比如你让 ai 看目录或者看 get 状态, r t k 会自动精简掉那些没用的信息,直接把 token 消耗压掉百分之六十到百分之九十。对于 coco test 的 这种输出极长的命令,它甚至能帮你省掉百分之九十的 token。 最后,如果你想让你的 agent 具备自我净化能力,可以配置这个 self evolution 工具。它利用了 dsp 和遗传算法,能自动去优化你的 skill system prompt 以及工具描述。 你只需要克隆仓库并配置好 hermes 的 原马路景,它就能通过遗传算法自动寻找最优的提示词和行为模式,让 agent 越用越聪明。 按照这个顺序配置完你的 hermes 就 真正满配了。如果你还需要更多资源,可以去查看 awesome hermes agent 汇总,或者通过 hermes ecosystem 查看那八十多个工具的格式化地图。配置完成,现在就开始享受满配版 hermes 的 强大能力吧!

如何在 hermes 当中配置多 agent, 实现不同能力的 agent 讨论同一件事情或执行同一件事情,类似于这个样子,比方我建立一个产品方案讨论时,我在里面创建了四类角色,当我去发布一个事情的时候,我可以艾特指定角色进行回复, 也可以让其中有一个角色调动其他人,这样就很具想象力的。那怎么设置?总共分为三步,第一步,在这个页面里面我们去创建用户,相当于就创建一个 agent, 点击这个地方, 你只要去定义他的名称就好了。第二步,很关键的事情,你需要去定义他能做什么,比方说我定义第一个产品经理,他的身份是什么样子,他能做什么已经不能做什么。 第三步,我们就只要在这个群聊里面去建立这样一个场景,把不同角色的人去拉进来,类似于这个样子,你把刚才创建好的这个身份去把它添加进来,这样一个群就创建好了,很简单,对了。

大家好,我是麦东,今天来聊 hermes 零点一三版本的一个重磅新功能叫看版,对的,你没有看错,就是看版的中文拼音。这个功能简单来讲就是你可以让多个 engineer 像一个团队一样协助干活。你只需要说一句话, hermes 自动拆任务分配角色,设置好先后顺序, 剩下的全自动调度,干完一个自动启动下一个,他的核心思路是异步协助。你把任务丢到看板上,多个 agent 各自领取各自干,互不阻涩,就像你把活贴到白板上,团队成员自己认领一样。 这个功能适合什么场景呢?第一个场景,你有多个不同角色的 agent, 比如研究员携手,程序员需要流水线协助。第二,任务之间有依赖关系, a 做完了, b 才能开始。 第三,你希望任务是持久化的,哪怕 hermes 重启了,任务还在,不会丢。好,下面我们来实操一下。本次演示,我们还是以之前讲解多智能地协助的时候创建了三个 an 键的角色为例,给大家做演示。三个角色大家还记得不? code 负责写代码, writer 负责写文章, analyst 负责做需求调研分析,每个 agent 都有自己的能力范围,负责做好自己的那部分事情。好,下面我们就正式开始。首先第一步,我们需要部署化看板,打开终端三条命令就可以搞定。首先第一条命令, hermis 看板 innit 创建看板数据库。 接下来第二步, hermes getaway start, 启动消息网关。接下来第三步, hermes dashboard, 打开 hermes 自带的可伸弯面板, 面板打开后,在左侧的菜单栏我们往下滚动,可以看到插件这边有一个看板菜单,点击看板菜单,你会看到这边有六种状态的任务,分别是待分类、待办、就绪、进行中、阻滞以及已完成。这个就是你的任务看板了。 好, command 完成之后,后面的操作你就不需要记任何命令了,我们直接在 hermes 里面给它下达任务就可以了。 下面我们回到 hermis 的 对话界面,我们跟 hermis 说帮我在看板上创建一个任务,让 analyst 调研一下二零二六年主流的 ai 编程工具有哪些,并且给我做个横向对比。 可以看到 hermis 已经自动帮我创建了一个任务,指定 analyst 来执行。下面我们回到 dashboard, dashboard 上已经能够看到这个任务了,在就绪列, 现在我手动点一下这个触发调度器按钮,手动触发一次调度,正常情况下这个调度器是每六十秒自动扫一次的。在演示的时候我们就不等了, endless 已经被启动了,任务移到了进行中, 他现在在后台自动干活,搜索信息,整理数据。干完之后呢会自动提交总结,任务也会移到当那边去。我们点击这条任务,也可以看到他当前的执行情况。 ok, 这个任务就放在这边,让他自己跑着。我们接下来给大家演示一个一句话,搭建安静的流水线的场景,这个是看板最强的地方,假设我现在要做一个完整的内容生产流水线,我需要把调研、写文章、验证数据三步都串起来。下面我们来给大家做一个演示。回到 hermes 的 对话界面, 我们跟 hermes 说,帮我安排一个内容流水线,先让 analyst 调研目前主流的 ai 编程工具有哪些,调研完了,让 writer 根据结果写一篇对比评测文章。最后让 coach 写个脚本,把文章里提到的工具信息整理成一张表格。 可以看到 hermes 已经自动帮我拆成了三个任务,并且设置好了依赖关系。我们回到 dashboard 看一下, 可以看到除了调研任务在进行中,写文章和验证都在代办理。这个意思就是只有调研做完了,写文章才会自动启动,而当文章做完了验证才会启动全自动流转。并且当 analyst 完成任务的时候,他提交的总结和关键数据会自动传递给下游的 writer, writer 启动后就能直接看到 any list 的 产出,不需要自己再去翻文件,这个信息传递是系统自动完成的,也不会丢失。如果你不想使用对话方式,我们也可以直接在 dashboard 上通过点击面板这边的加号, 手动创建任务。比如我现在想让 writer 帮我写一篇周报标题,填写一篇本周工作周报, 规范制定者填 writer, 优先级填零就可以了,其他都不用动点 create 搞定,就是这么简单。这个创建面板从上到下我们快速过一下。首先第一行是任务标题,就是你要让 it 干什么,这个比较简单。 第二行左边呢是规范制定者,这个中文翻译过来比较怪哈,其实就是指定哪个 profile 来执行这个任务。右边呢是优先级,数字越大越优先。 第三行是技能可选的,如果这个任务需要 a wide skill, 比如翻译、代码审查等,在这里可以用逗号分隔填进去。 第四行是 workspace 工作空间,也就是这个任务启动后在哪个文件夹里面干活。这里有三个选项。第一个 scratch 是 系统自动创建一个临时目录,任务之间互相看不到对方的文件,适合一次性的调研或者写作。第二个 work tree worktree 呢,是自动创建一个 git 分 支副本,它比较适合那种写代码的任务,修改完成之后呢,可以通过提交 pr 的 方式合并过来。第三个 dr, 这个是你指定一个已经有的文件夹,多个任务如果指向同一个路径,它们就能读写同一批文件, 比如 endless 写的报告 writer 在 同一个目录里面就能直接打开。而最后一行呢,是副任务,选了之后就意味着副任务完成了,这个任务才会启动。这就是我们前面讲的依赖关系。 大部分情况下,你只需要填写标题以及规范制定者就可以了,其他都用默认值就行。这边需要注意一下,如果你是从待分类创建的任务,会先停在待分类状态,你需要点开这个任务, 点击一下,这边的 specify hermes 会自动帮你把一句话的想法扩展成完整的任务规格。可以看到这边已经做了扩充,在扩充完的基础上,我们可以对当前任务进行编辑及评论, 扩充完后它就会自动晋级到代办,接下来就会被智能体自己去认领了。而如果你是从旧序列直接创建的,那么任务会直接进入等待派发的状态,就没有我们刚刚的 ai 扩充这一个环节了,通过 dartboard 就是 一种纯图形化的操作,不需要你记任何参数,这个就看大家各自的使用习惯了。 下面再给大家介绍一个多看板的场景,如果你同时在搞好几个项目,我们可以在 display board 上创建多个看板,点击新建看板,输入看板标识,点击创建看板。 ok, 一个全新的看板就创建完成了,不同看板之间是完全隔离的,我们也可以通过这边的下拉选项切换不同的任务看板。另外再跟大家讲一个看板比较好的一个点,如果你的某一个任务进程崩溃了,比如说内存溢出被强制 care 掉了, 调度器会检测到这个任务已经不存在了,自动把任务回收,重新发回到 ready 里面,等待下一次的执行。好了,这边可以看到我们已经有一个任务完成了,我们点击一下已完成的任务,点开任务, 我们在这边可以看到 hermes 的 一些工作日期以及任务的产出。在这边我们还可以对当前任务进行评论, 在任务的最上方还可以对其进行归导,真的就像一个可直观的任务看板一样。最后我们总结一下看板的几个核心优势,第一个,看板的数据是持久化的,它的任务存在数据库里面,重启之后也不会丢失。 第二个,它可以进行异步,协助多个硬件的并行干活,不互相堵塞。第三个,它有医疗管理功能,可以自动处理任务的流转。 第四个,它有崩溃恢复的机制,任务挂了之后还可以自动进行重试。第五个就是可说话的功能,我们可以在 dashboard 上实时查看任务的进度。这个功能实测下来比较适合的场景就是你有一套固定的工作流, 比如每天的内容生产代码审查流水线、数据处理管道等等。就像我刚刚跟大家演示的,只需要跟 hermes 说一句话就可以了,它会自动的去做任务拆分,分配角色,并且设置好任务的依赖, 剩下的就是全自动调度了,我们只需要在 despot 上看进度就可以了。大家平时如果有一些重复性的工作,想让 ai 自动去跑的,可以去试一试这个新增的看板功能,本期视频就到这边,工具会变,但方法更重要,我是麦冬,下条继续。

hermes 内置了四层记忆,这一期就让你亲眼试一遍,在一个对话里告诉他,你养了一只叫像素的猫,关掉,换个新对话,再问我养的猫叫什么,他依然知道。更省事的是,这套从头到尾不用你动一行字。 hermes 真正需要你改的只有一个文件,搜到 md, 给他起个魂,定个边界,定他怎么跟你说话,剩下的他自己来。所以这一期看完,你给 hermes 起个魂,跟他聊几天,他就慢慢长成你专属的那一只。实际上哈,对于 hermes 来说,他需要我们人工去修改,东西并不多啊,作为核心的些,主要就是这个哨点 md 啊,人格配置, 那么像其他的我们上一期所谈到的啊,关于说这个尤瑟呀,像这样的一些 md 文件,实际上他背后他日后呢,在实际运行过程当中自己 会去进行修改啊,这个不重要啊,那么这是最为核心的,给开发者们来进行修改的,实际上是只有一个啊,就是三点 m d 哎,你会发现比 openclaw 实际上是这个简单的很多,对不对啊? openclaw 呢,是一上来就需要设置很多很多啊,一连串的一些这个 markdown 这样的这个文档啊, ok, 好, 这里面啊,我们就可以去来进行一个这个设置,这个三点 m d 哈,它呢,实际上也是一样的啊,是在点 hermos 啊,这样的项目主目录下啊,会有一个这个三点 m d 啊,然后呢,直接对它来进行修改就可以了啊,当然这 这个哨点 md, 他的这个修改哈,其实一般来说,我们是需要确认他目前的一个说话风格和行事方式啊,如果你想说的更细一点的话,你还可以确认当前的这个 agent 啊,他的 核心的工作目标和他的职责边界啊,像这四方面内容都是可以写到这个哨点 md 里边去的啊,然后呢,这个写的这个方式啊,就是像现在这样啊,就是用非常非常明确,非常简单的一种书写这样的一个方法啊,就是这个三级标题啊,就是一类的这样的功能,然后你给它写进去就可以了, 这个搜点 md 哈,你在命令行里面修改也可以,你直接打开来啊,使用这个 md 马当工具来进行修改也可以啊,这个呢,其实没有任何问题啊,总之呢,就是你需要来进行修改啊,比如说我们这里呢,给他设置了一下啊,这里我们设置了一个九天 ai 助手啊,设置给我的一个小分身,然后稍微跟他说了一下啊,他的一个这个灵魂啊是什么啊,对吧?然后, 然后那么接下来啊,你发现在进行对话的时候呢,他呢就会啊,跟你啊,来进行这个,就会套用这样的身份来跟你进行对话啊, 这个呢,其实哨点 m d 它呢,是在所有的这个呃呃,未来在 hermes 运行的过程当中啊,它作为一个非常核心的一个消息队列拼接的,这样的话看文档啊,肯定是会每次运行的过程当中都会把它读取成 system prompt 里面的一部分的这样的一个内容啊, 这个呢,其实是留给用户来进行自定义的啊,一个非常便捷的一个这个文档啊,当然你想让当前的这个 hermes 啊做什么样这个事情啊?想给他什么样的身份,想给他什么样的边界,都可以通过修改啊,这个 so 点 m d 这样的方式呢,来去完成啊,这个呢,实际上是一个入门级的啊,一个这个修改的一个这个点啊, 当然其实从这点来看啊,这哥姆斯 a 阵呢,确实很多时候和这个 open clone 呢会有点像,哈哈,对吧?啊,这个文件呢,是一定需要来进行这个修改的,当然我们刚刚才竟然是看到了你项目的主目录的文件夹,对不对?项目主目录的文件夹长成这个样子, 那我们就可以进来看一下,哎呀,这个项目项目的这个主目录文件夹里边啊,好多好多文件啊,那么哪一些这个文件接下来是我们经常需要来进行一个这个使用的呢,对不对?好,我们可以看一下,下面呢,其实有一个列表, 下面这个列表里边啊,实际上就是代表着我们接下来呢啊,就是如果你想进一步的啊,来进行一些修改,或者进一步的来进行一些这个深度功能这个探索的话,那么 在项目主目录下啊,会有以下这么些个功能,接下来可能是需要来进行一个这个使用的,对不对啊?比如说我们平时哈我们之前使用着 hermes config set 这个命令,还记不记得我们之前去设置啊,什么大模型啊?设置大模型提供商啊,那么实际上它最后读取到的这个内容 啊,他最后这个,呃写到的这个内容啊,都是在这个样这个文件文件里边啊,这个文件大家感兴趣的话也可以自己去看一下啊,就在项目主目录下,然后同时呢还有这个 so 点 m d, 就 我们刚改,对不对?还有点 e n v 啊,这个就我们刚改过的,然后除此之外呢,还有这个 memories 里边有这个 memory 点 m d 和 us 点 m d 两个都是 agent 自动维护的啊,不需要我们手动来进行一个编辑,我们手动来编辑顶多就是去写它这个骚点 md, ok, 还有再往下啊,这个 skills 和这个 plug ins 哎,这个东西大家一看就非常熟悉了,对不对啊?所有的目前通用 agent 都有啊,这样的一些这个 啊,都有这样的一些这个内容啊,然后 skills 就是 技能,对不对?然后呢,这个 plug ins 啊,就是它的这个插件,还有它的钩子,那么再 往下啊,还有 state 点 db 啊,这个呢是,呃,我们啊,它内置的一个这个 circle light 啊,这样的一个这个 circle 数据库啊,用来去存储它的历史对话消息。那么再往下还有这个 logs 啊,它这个日期啊,大家就是这样的一些非常核心的这个文件啊,这个文件大家感兴趣的话,可以自己去来进行一个查看啊,包括上面的 config 点 yam 这个文件, 这个文件呢,我们一般来说啊,我们是可以通过这 herms configset 这样的命令去给它手动输入一些这个配置啊,数字外,你也可以直接去改啊,改着 config 点 yam 文件也是一样的啊,都是可以的。 好,那么接下来我们还有一个功能啊,也是属于它入门级的功能啊,就是 cron 啊,这功能啊,这功能属于这个定时的哈,这样的一个这个啊,定时巡检啊,这样的这功能啊,比如说我们下面啊,创建了一个这个定时的这个任务啊,对不对啊? hermes cron create, 那 所有的我们说 hermes 的 这样的一个它的这个啊 cron 定时任务呢,基本上都是采用啊这个 cron create 这样的命令来进行创建,那么后面接的这个参数啊,大家也大概能够看得明白,对不对啊?这个 create every, 呃,这个每三十分钟啊,然后呢做一个这样的一个这个事情啊,当前 chrome 这个任务的名字呢,叫做系统巡检,然后总共巡复啊,总共能循环三次, 那么通过这样的一个这个命令,大家也会发现哈,在 hermes 里边,它的实际上是不像 open chrome 那 样会去区分啊。关于 chrome 命令和这 heartbeat 啊这两种不同这样的一个模式,对于 hermes 来说,它只有一个啊,就是 create 啊,那如果你希望每隔两分钟,每隔五分钟,每隔半小时,每隔一小时的话,那么你可以通过 这个 every, 呃, thirty minutes 这样的一个方式啊,来去进行设置,对不对啊?它呢?它呢?如果你是设置了这个每隔多少分钟这样的模式的话,那么像你就相当于是 open curl 里面的 heartbeat 这样的个模式了啊,所以呢,这也是 promise, 我 们是在进行使用的过程中会发现它的这个用法更加简洁的一个非常重要的一个这个点哈, 那么接下来啊,他就开始巡查了,对不对啊?这个这个开始来进行巡检了啊,这个开始来进行运行啊,这个大家可以继续看一下,然后同时你还可以通过这个类似的方式看到,现在所有定时任务还可以通过这个 states 的 方式呢,看到啊,现在所有定时任务是否还在继续来进行运行啊?这个呢,其实都没有什么问题啊,当然你也可以通过这个 remove 的 方式来进行删除 啊,还有 res 啊,这个 resume 啊,来进行恢复等等等等。然后除此之外呢,还可以啊,来进行删除啊等等来进行创建啊。这我们刚都说了, 然后具体的这个语法啊,比如说 every 就是 每隔多长时间来进行运行啊,那如果呢,你是这么样来进行设置的话,代表的是他每天什么什么时候啊,来进行一个运行啊。这个语法大家如果不知道的话,可以自己去问下大模型啊,大家都会这个告诉你一个非常清晰啊,总之呢,其实 cron 啊,对于 现在的这个,呃呃, hermes 来说也是啊,一项非常实用,然后呢,也是能够非常快速来进行实现的啊,这样的功能啊,看到这你会发现跟 oppo pro 很 像,对吧?哈哈,那么再往下啊,就比如说它呢啊,其实还能够啊,持续持续不断的来进行一个这个记忆啊,这个呢,相当于是一个进阶的一个这个小小的小功能了。 我们这里面啊,其实哈,你是可以通过对话呢,让它全自动的来进行一个记忆的,那或者说我们现在啊,只要你是可以通过对话呢,让它全自动的来进行一个记忆的,那或者说我们现在啊,只要你是会有这样的跨县城的 这个记忆的系统来进行全送的。这个运行啊,这个过程呢,对用户来说完全无感,你也不需要来进行任何的这个操作,你只需要跟他来进行对话就可以了啊,那么在这个过程当中,他自然而然就会啊,这个很好的去记住你当前的很多的这样的这个信息 啊,比如说跟他说了一句话啊,当然这里面我们是提示他请帮我记住哈,当然如果你不说题,请帮我记住的话,很多他自己也会判断关键信息,他也会记住的啊,这其实没有什么问题, 我跟他说啊,我养了一只猫,名字叫像素啊这样的一个猫,然后你发现哎,他就记住了,哈哈,对不对?那这里面呢,其实我们跟他对话的过程当中哈,你可以观察当前这个命令,行啊,他呢,如果触发他内置的啊,这样的一个这个记忆的记录,这样的这个流程的话,那么他下面其实会有一个关于当前的这个 啊,当前的工具调用这样的个信息,比如上面有这个 factrest or fact store 啊,这样的一个这个工具,那这个工具呢,实际上就它内置的专门用于来进行它它的核心信息的这样的一个记录的这样的一个工具,对不对?然后下面它还有啊,这个 一段的这个回复等等等等。那总之呢,像这样的些这个对话哈,就是它的这个记忆的这个触发啊,它其实会有自主来进行判断,然后同时呢它也会啊,这个根据,如果你强调了它是要记住了,它也会记住啊,这个东西其实你完全不 不用去管他啊,他呢会自主的去记录在这个 memory 或者 usb 里边,然后同时呢这两个文件他也会自主来进压缩和维护啊,这个我们一会看到,那么 接下来你再去问他啊,你不管在哪个县城里面去问他,你都会,他都会跟你说啊,现在他记住了这样的这个信息啊,你跟他说这个,哈哈哈。啊,你养了一只这个像素的这样的这个橘猫,对不对啊?问他啊,我们养的虫叫什么名字?几岁了啊?他就会这样的啊,来进行对话,那大家需要知道的时候,这里面我们的上面这个对话 和下面这个对话,实际上呢是两个不同的 session 啊,上面对话你会发现它的 session 的 这个 id 呢是八幺四 e 五,然后呢下面这个 session 的 这个 id 呢是 呃这个零七 f 幺九零,对吧?啊?所以呢这两个其实是两个不同的这个对话啊,但是呢它的这个 memory md 和 user md 实际上是跨县城的啊,这样的这个记忆,它会从所有县城里面来进行一个这个统一的这个记录, 或者说它这样的这个记忆哈,其实最后是沉淀在你当前的一个又一个的 agent 身上的。而我们现在只设置了一个 agent 啊,就当前的这个主 agent 啊,所以呢它所有的这个记忆呢都会沉淀在当前的这个主 agent 里边啊,那么接下来它就可以 啊跨县城的啊,来进行这个绘画了啊,那个身上这个问题呃,就可以来进行这个聊天,就可以来进行对话了啊,这个呢是它的一个啊记忆系统的一个 这个功能了, 当然谈到刚才的这个记忆啊,那么我们其实还有很多可以深挖的这个地方,因为毕竟哈对于当前这个 hermes 来说啊,它的这个记忆系统,其实我们刚刚只看到了很浅的一层啊,就是第一层哈,就是 这个核心的这个记忆啊,它呢实际上是会自主的来进行一个这个记录,然后它同时有个最大的这个 token 的 这样的一个这个限制, 它呢其实会不断不断的去压缩你当前这样的个记忆啊,就如果你当前记忆超标了啊,它呢就会自主的来进行一个这个压缩,来进行一个这个 summary 啊,来去来去这控制你的这个 memory d m d 和 user d m d 啊,这两个 d m d 文档的这样的长度。 那么除此之外呢,我们说它的这个记忆呢,其实还有啊,以下至少这么几层。然后第一个呢是使用 sqlite 啊,然后呢来进行全文的这个解锁, 那么这个 sql log 啊来进行权威检测。指的是啊,我们现在其实可以把历史的所有的这个对话全部都存储到关系数据库里面啊,你这个对话其实还有多少对不对?对关系数据库里面啊,这个存储的功能来说啊,那当然是这个小菜一碟啊,所以呢,你其实可以完完全全把你所有的历史对话那些都存储到这个 sql log 这个数据库里面啊,那么这个 sql log 数据库呢,之后呢,就可以根据需求,然后呢从你历史对话里面来进行一个这个解锁, 这个呢也是一种非常便捷的一种啊,历史绘画信息高效解锁的这样的这个方式哈,那么再往下啊,下面还支持很多的一些外外部的这个 provider 的 一些插件,然后呢这些插件呢,它基本上都是各式各样的文本存储 存储的这样的一些这工具,然后呢是可以直接接入到你当前的 a 阵子里面来啊,迅速的来去保存一下你当前的历史绘画,或者是读取它上面已经有的历史画等等。然后同时啊它还会有着安全防护,在它的记忆层也是它的 这个每次运行的过程中,在拼接它的 system prompts 的 时候,它都会啊有一个安全扫描啊,去看,哎,你现在的这个 memory, 你 现在这个 skill 里面会不会有一些恶意注入的一些这个指令等等等等啊?现在这些所谓的恶意的这个指令或者恶意的这个 skill 实际上非常非常多啊,各式各样都有啊,这个属于这个防 防不胜防啊,不胜美举的这样的这个类型,那么其实啊他这个每次 memory 在 你组建的时候,他都会来进行安全的这个扫描,好像都是这样的这个情况啊,这个其实还是他完整的这样的一个记忆的这个系统。那么首先哈关于这个 memory 和这个 us 点 md 啊,这两个其实 啊问题,呃,这两个其实我们刚刚都看过,对吧?哈,是都是在这 hermes 啊,然后这个 memories 这样文件夹里边儿,那么它呢,其实是一个全自动的来进行记录和来进行优化的啊,这样的一个内容,然后最多呢是八百个 token 啊,这是 memory, 然后 user 最多呢是五百个这个 token 啊,以防它这个 这个过大了啊,对不对啊?然后呢这里面啊他其实还会有全自动的啊,这样的一个维护的这个行为,他维护的过程其实就是简单的这个 summer 啊,来进行一个压缩,我们稍后能看到啊,他是如何来进行压缩的? 这呢是第一个啊,第二个呢,他的历史绘画啊,我们也是可以在某一些这个设置的这个时候呢,设置的里面直接给他存储到这个 circle light 啊里边去,他呢最多啊,他的这个 circle light 这个解锁的这个效率其实非常非常高的,对不对? 什么十毫秒就能解锁啊,这什么一万多条的这个历史对话信息啊,这个其实还是非常非常快的,那么这个历史对话哈,相比用 memory 来说, memory 其实相当于是一个高度零面或者概括啊,或者是说一些核心的当前 age 呢,不知道的一些这个内容存储的这个地方。而啊这个 circle light 就 相当于是全量的一个这个解锁,你可以这么来进行理解, 当然它这里面使用 circle light, 没有使用这个 red, 它可能会有点过重了啊,这样的一个这个情况, 那么同时啊,还有什么外部插拔的这个 provider 啊,它呢实际上,呃,这个怎么说呢啊,它是一个记忆生命周期的这管理器啊,现在 sqlite 主要啊,它的这个外部的 provide 主要是有这么几种啊,但这么几种大家可能之前 呃没有见没有见到过啊,这会我们列出来给大家大概看一下啊,我们这里呢之后呢会举个例子啊,这个来进行讲解啊,就关于说它外部的这些插件呢,怎么样去加载记忆啊,以及呢去移植这样的这个记忆等等等等, 然后最后啊他还有安全扫描,他在这安全扫描其实非常完善哈,大家感兴趣的话可以自己去看一下啊,包括什么这个什么后门检测,不可见的 unico unico 字母检测啊,这个其实之前非常一段时间非常火的一个这个漏洞了, 然后什么呃防止他的这个泄露啊,他防止他的这个凭证的这个泄露,还有什么什么去虫检查等等等等啊,这个呢是他的安全扫描啊,这样的这个措施, 那这个呢啊是它的这个整个 g 系统啊的一个基本的入门级的这样的这个这个介绍啊,那么接下来我们就可以进一步的啊,来进行一些这个实操了。那么刚才哈,其实我们是简单看了一下它的这个 memory 啊,实际上是会自动来进行写入,对不对啊?可以自动来进行解锁。那么除此之外,我们也可以啊去考虑一下啊,使用它的这个 provider 里边的啊一类 来进行一个记忆的这个加载。那么这里面啊,我们说它外部的这个 provider 呢,实际上,呃,你看理解成啊,是个 circle light 这个数据库,然后加上权威解锁啊,加上这个信任评分的这样的这个系统,它呢是会全自动的把当前用户的这个对话呢给它存储到啊,以这个 circle light 里面去来进行运行啊,就这么来进行理解就可以了。 好,那这里面我们直接呢 to set 一下啊,然后呢让它去配置一下我们现在外部的一个这个 provider, 然后呢那么接下来我们就可以自由的啊来进行这个对话了, 那么呃,这里面哈,我们在进行这个配置的时候呢,实际上你会发现它下面这个 memory 就 会有多的这一行,就跟我们说,哎,我们现在呢是使用它这样的个插件啊,来进行全量的 circle light 啊的所有的历史对话信息,这样的个信息的这样的个存储啊,差不多就这样的这个情况。好, 那么紧接着我们就开始啊跟他对话了,对不对啊?就可以各式各样的这个信息来跟他进行对话了,那么你只要是开启了这个 provider, 那 么接下来它就会事无巨细的把你所有对话全部都来进行了记录。 是这样的,这个情况通过他啊,他其实你可以理解成是一种似和 light 一 种纯属和这个解锁这样的一个方式,他是一个完善的一个功能脚本,你可以这么来进行理解。 好,那么接下来啊,我们在听对话的时候啊,你不管跟他说什么对不对啊?我们还是一样的使用杠 q 这样的模式啊,当然你直接这个 check 也是可以的,那么你接下来你不管跟他说什么啊,他接下来都会来进行一个记录等等等等,那么接下来啊,就可以各式各样的啊来进行这个记录啊,什么什么什么什么的啊, 当然其实啊,它各式各样不同类型的这个信息,实际上会记在不记在不记在不同的地方啊,比如说你如果是说一些比较重要这个信息的话,那么它会自己啊同步在这个 memory 里边儿,那么接下来就可以直接呢来问它啊,它的一些这个内容,它呢是可以很好的来进行这个回复的, 那么同时呢,你也可以啊,直接使用这个 sqlite 啊,去搜索一下啊,我们现在呢,当前的啊,这个在当前的这个绘画里边总共存储了多少条的这个记录啊?你会发现它的每一条 user message 都 都会来进行一个这个存储啊,当然你还可以继续来进行对话啊,跟他这个这个各式各样来进行对话,然后你会发现所有内容其实都会啊,来进行这样的 sql lite 这样这样的一个存储。 那么默认情况下哈,他是只会存储啊,但是不会来进行解锁啊。那么如果我们说你有需要的话,你可以啊,直接通过自然元提示这样的方法跟他说,哎,我需要从我的历史的数据库里面检测某一些这样的东西, 那么这个时候他就会调用自己的这个命令行去执行,类似于像我们上面看到的啊,这一系列的这个你可以把理解成就是 n l to n l to circle 这样的一些这个语句,全自动去编辑这样的语句,然后呢来围绕当当时的一些内容来进行解说,那么 解说完了之后啊,他就会来进行回答啊,就这么一回事,相当于是他的这 provide 呢,是不同类型的,给你外挂了一些这个,呃,外挂了一些这个知乎搜索这样的这工具啊,然后呢方便你更高更便捷的围绕着广泛的历史数据来进行一个这个解锁。但 当然好,我们说这两层的啊,这个记忆对不对啊?上面这个 memory 呢,是自动来进行记录啊,然后呢后面的 provider 啊,是这个有针对性的啊,来进行记录是需要主动触发的啊,然后这个 memory 是 是会进行自动拼接的啊,这个呢,其实是两种啊,核心的这样的记忆模式, 当然我们现在啊这里没有提到的是它,其实对于我们的 hermes 来说,它的这个 g 系统啊,其实也是有上下文这个压缩的啊,包括它的这个 memory 也是会有上下文压缩的。而现在整个的这 hermes 的 这个上下文压缩哈,和 open curl 和 curl code 基本上完全一样的啊,就是三轮过后, 先删除工具,调用这样的这个信息啊,然后呢,如果你的历史对话信息加上你的这个 system prompt 啊,超过了百分之八十的这个模型最大上下文的这个长度的话,那么它就会触发 compact 的 这样的机制啊,来围绕 你之前的这一问一答所有这样的信息啊,来进行一个 summary 啊,然后呢,用这个 summary 啊,代替掉你原来的这一问一答啊,这样的内容,从而去完成你上下文压缩的这样的一个流程。 像这种类型的压缩号是基本上所有的现在的这些智能企业都是这样的个模式啊,你,你这个 hermes 也不例外哈,但但是呢, hermes 与众不同的地方在于说它呢有一个自 自主的这个 memory 啊,和 user 这样的一个自主记忆的这样的方式啊,然后同时呢,还可以通过 provider 对 不对来进行持久化的,哎,你当前的这些这个啊,用户消息的啊,永久性的这样的这个记录啊,这个呢,是没有什么问题的 啊,当然下面还有一段啊,关于他的这个记忆安全啊,怎么样来进行记忆安全的这个防护的这段可能就涉及到呃非常多的一些这个防护的这个小技巧小策略了啊,当然对于我们初学者来说可能并不会自己去查看一下啊,这个呢, 大家可以自己啊来进行一个这个阅读啊,但总之呢,像这安全防护这个策略,对于 aramis 来说,他呢也是呃自己就会呃自己就会这个展开的啊,就他自己就是天然就会来进行运行的啊,也是不需要我们手动来进行操作的啊,这个呢是关于他的这个记忆系统 好,他还哪有哪一些啊,前沿的一些这个特性,像这样的一些这个内容啊,我们这里面有一些这个文字的这个补充内容啊,大家回头可以自己去看一下啊,自己去了解一下啊,接下来啊我们就打一波广告,哈哈哈,也欢迎大家啊,报名,有我和木鱼老师啊,还有志杰老师,我们共同开设的 大模型 agent 啊,智能体开发实战课这样的一门付费课程。那么我们今天啊来讨论的啊,关于 harness engineering 啊相关的这样的一些这个内容啊,以及 harness agent 啊,也是像也是 harness engineering 这样的一套技术体系啊,它的一个落地的这样的框架,那么这个内容啊,实际上是节选字,我们的二零二五啊,大模型 agent, 智能体开发实战课这样的一门付费课程, 那么这本课程啊,是由我们三位老师共同来主讲的一个一百个小时以上的完整体系大课啊,然后呢,这本课程从今年的这个三月份啊,开始新增 open club 开始啊,到我们今年四月份啊,新增 harness engineering 啊,以及像 harness agent 相关内容的讲解介绍啊,那么这本课程呢,到,呃,我们今年啊的 最新的啊春季班是已经是开设了二十三期了哈,那么这门课程呢,是帮的,是能够帮大家零基础入门,然后直达目前顶尖大厂的中高级岗位能力要求的一门一百个小时以上的完整体系大课。 那么这门课程啊,其实是可以完全零基础啊,来进行的一个这个学习,并且这门课程呢,是一个硬核的啊,这个大模型开发的技术教学的啊,这样的课程,那么这门课程啊,是 这个对标目前的大模型开发工程师啊,大模型的这个应用开发工程师这样的岗位能力要求啊,这么可能,如果完整学完,肯定是啊,这个拿下五十万年薪的大模型开发岗位啊,的这样的一个这个 offer 肯定是不在话下。这么 多人,总共呢啊是六个技术模块啊。首先第一个模块呢,是关于大模型技术入门啊,在这里面我们会详细来介绍关于目前顶尖的啊,这些大 大模型的 a p i 的 接入啊,本地大模型的这样的部署啊,然后呢,智能企业智能开发的这个样的入门呐,还有 rex 的 增强技术的系统开发入门等等等等啊,这个呢,是一个入门的啊,这样的一个阶段, 然后同时紧接着第二个阶段,我们会进一步来介绍关于热门的 a 智能开发框架的上手实战,那么主要啊,是会包括一些低代码的框架啊,像 cos 啊, def 啊,还有 nba 啊,以及啊,对不对啊?新兴的一些 a 智能开发框架, 像 agent sdk 啊,还有 agent school, 还有 adk 等等,当然也包括啊,工业级的 agent, 呃,框架啊,像 long chain 啊,还有 long graph 等等等等啊,那么这些呢,实际上都是能够帮助我们啊,从零到一呢来完成 agent 的 开发的啊,一些非常核心这样的工具, 当然有了工具还不够啊,我们还需要去讨论一些,还需要跟大家详细介绍跟讲解一些工业级的 agent 的 开发的一些进阶的一些这个技术,对不对? 就比如说啊,这个智能体的,这个 agent 的 开发的一些进阶的一些这个技术,对不对?就比如说啊,像这个 agentrek 一些进阶的一些这个技术啊,包括啊,如何来进行这个剪辑的一些这个优化啊,多模态的这个实战 graph rek 之图和剪辑优化啊,还有这个什么视频信息剪啊,图用混排 pdf 剪辑啊等等等等啊,这样的一些啊, rek 的 这个进阶优化这样的这个内容。 当然啊,上面大家可以看,可以看得好,我们其实每个模块里面都有非常非常多的一些实操的一些这个小案例哈,当然这个实操案例其实并不属于我们后面要谈到这个大型案例啊,总之呢,其实我们所有的课程啊,每个模块都有非常丰富的啊,实操的这样的内容, 那么再往下啊,还会讲解关于智能,关于智能体的,对吧?啊,长短期的这个记忆管理啊,这个其实就会涉及到,比如说我们现在讲的啊,一些这个 智能体的啊,记忆的优化啊,安全防护措施啊等等等等啊,当然也会来讲解啊,关于智能体上下文的一些优化的这样的这个策略啊, harness engineering 相关的这个内容,以及多智能体啊,系统开发相关的这样的内容啊,当然在我们课程里面还会介绍啊,关于大模型高校微调 和强化学习微调啊,相关的一些能够定制化啊,你开源大模型的啊,能力的相关的这样的内容。那么同时紧接着第四个模块,我们就会进来探讨关于工业级的 a 证的部署上线啊相关的这个内容了, 那么你 a 证的开发完了之后,对不对啊?肯定还是要考虑怎么样呢?来进行部署上线,这里面我们会来介绍啊,关于智能体项目部署上线的这个基础的理论啊,同时也会来讲解啊,关于智能体开发部署的上线的全部的这样的流程一块介绍啊,关于两大容积化交付工具的这样的实战,以及 体上线之后啊长期的追踪和运维如何来进行处理啊,当然我们会来介绍关于智能体的这个性能评估和如何来进行优化, 那么同时我们现在啊,我们还这这本课程里面还包含十大项啊,这个工业级智能体的开发项目实战啊,包括像常温档啊,编辑 agent, 文档审核 agent 啊,图文视频多模态 agent, 语音交互 agent, 然后 deep research agent 啊,然后数据分析 agent 啊,说一遍你可行话 agent, 然后呢?垂欲的呃, greg graph 高精度的啊,机制图谱的解锁增强系统,然后啊,像多模态的这个 app 本地支付问答,还有 nintendo 啊,像这个 ppt 的 这个 agent 生成等等等等啊,这一期的 agent 啊,是我们会有,总共呢会有十个啊,工业级的项目实战。 那么除了这十个项目之外呢,我们还有四大项啊,百万用户级别的智能体项目开发啊,这个呢,相当于是商业化的这个智能体,包括啊,像多模态的这个 app 支付解锁问答, 包括啊,全新一代的啊,智能客服 a 证的项目开发啊,以及呢,包括啊,这个通用智能体的这开发以及啊,还有这个数据分析和 ai 呃编程的啊, agent 开发项目等等等等啊,总共呢是有这四大项的,这个商业的商业级的啊,这个,呃智能体的开发项目啊,总共呢是这么十四项啊,大型的 agent 项目开发, ok, 那 么所有这个项目呢啊,实际上是会覆盖目前我们说比较主流的,也是比较热门的这样的一系列的 agent 开发的 agent 应用,这样的主流方向啊,包括啊,对吧啊,这个整个的这个八大类三十家场景的 ai 落地解决方案啊,咱们课程里面都会有对应的落地实操性质的这样的这个内容。 然后同时呢啊,对我们的课程来说啊,我们在今年的这个啊,今年的春季我们还新增了很多啊,关于 openclaw, harness engineering 相关的这样的一个技术内容啊,当然同时我们也新增了一个大型的项目啊,就是从零到一呢,带大家去搭建啊,这个 harness engineering 啊,对不对啊?从 openclaw 啊 开始来进行的搭建啊,我们会从零呢来教大家如何呢?去,呃,从零到一来完成这样的一些 agent 开发啊,因为本身呢,咱们这门课程就是来讲解啊,关于现在的 agent 开发的核心这样的个技术。那么当然对于大家刚刚啊,所看到的这样的一个 harness engineering 啊,这样的一些这个内容,我们肯定呢也是会啊,来进行一个 详细的呃讲解和这个开呃详细的这个开发和实战啊,这样的一些这个内容的。 当然我们说除了啊,大家刚刚我们所看到的这个大冒险 a 正正地开发实战课程之外呢,还有两门课程啊,是呃,也是啊,现在正在进行这个招生啊,我们正在进行授课,正在进行连带更新。两门课程,一门课程呢是 open club 智能体应用实战课啊,那么这门课程呢,是由我来主讲的一门体系课程 啊,这门课程啊,其实和我们刚才所看到这个硬核的这个技术的这个课程啊,会有非常本质的一个区别啊,在这门课程它主要是在讲解 open club 如何进行使用啊,是覆盖基本上所有的 一些应用场景下啊,如何使用这通用智能体啊,用的更好啊,然后呢来完成各式各样啊,不同类型的一些自动化的啊,工作流的这样的这个搭建去提升啊,目前我们实际去啊,这个工作过程当中各式各样的不同场景下的工作效率啊,这个呢是 open 可乐啊,这样的一门课应用的这样的一个课程啊,这门课程是由我来主讲,那么除此之外我们还有一门课程,是啊,沐雨老师在今天主讲的 web coding 啊,这个编程实战课,当然 web coding 啊,这门课程就不用说了,对不对啊,现在基本上是所有的咱们这一个 啊编程的这个同学啊,都需要掌握这样的像这个技能,然后刚刚啊,咱们班上还有同学在问到说,哎,我们公司团队内部的这样的 web coding 流程是什么样的啊,等等等等,那是不是很多项目已经是这个零代码啊,在这个情况下,在进行这个纯粹是 web coding 来进行开发。是的啊,基本上就是这样这个情况, 然后啊,这门课程啊,会有慕玉老师来主讲啊,为大家好好的讲解啊,关于 web coding 呢,如何从零到一呢,来进行一个这个上手跟使用,以及各个不同不同场景下 有哪一些啊, web coding 这样的工具啊,是非常的这个适用以及呢,像 cloud code 啊,还有这 codex 啊,这样的一些顶尖的 web coding 这样的工具, 它的一些具体的这个使用和进阶技巧,然后也会从零到一呢,带大家去完成啊,很多的一些 web coding 的 啊,一些这个项目的实战的这个开发,从零到一呢,帮大家啊定定完整的啊 web coding 这样的技能体系。 那么现在呢,大家啊,不管是对哪门课程感兴趣啊,我们现在总共呢是有三门课程啊,分别是 open club 智能体应用课啊,主要是讲 open club 这样的智能体如何来进行一个使用。然后呢,还有啊,大冒险 a 证智能体开发实战课啊,这门课程是一个更加硬核的来讲解大冒险底层的 这个 a 证如何来进行开发的啊?这样的一门课程以及适用于现在所有程序员的啊?这个 web coding ai 编程实战课,这么三门课程。

hello, 大家好呀,这里是吉克魔导师。上节课我们讲完了 hermes agent 的 安装,我们今天开始讲 hermes 的 进阶篇。开始之前,我想问大家一个问题,你使用 hermes agent 或者 openclaw 的 时候有没有过这种感觉?用一个 ai 助手做所有事情, 一开始好像还挺顺的,但用到后面就开始不对劲了。 ai 的 性格变得乱七八糟,记忆越来越嘈杂,工作流程也没那么有条理了。为什么会出现这类问题呢? 说实话,这不是你的问题,这是方法的问题。好,那今天这节课我们就来聊聊 hermes profiles。 这是一个被很多人遗忘但是又直观重要的一个功能,它能帮你把 ai 从一个包办一切,直接跃升到真正的多代理团队协助。听起来有点夸张,但它真的可以做到。 咱们继续往下看,我们先来聊一个核心观点。大多数人使用 ai 的 方式是找一个助手,然后试图让他扮演所有角色。这种方式短期内确实能跑通,但是呢,随着任务复杂度增加,问题就暴露了。 ai 的 人格开始混杂,上下文变得混乱,记忆变得嘈杂,工作流也没条理了。 hermes 给了一条更好的路,构建一个团队,而不是让一个通才超载。说到这,可能有同学要问了, profs 我 用过啊,不就是给 ai 换个名字,加个头像吗? hermes 的 profiles 远比你想象的强大,它实际上是隔离的代理环境,每个 profile 可以 独立拥有自己的记忆、绘画技能、人格配置、 crown 状态和网观行为。 这意味着什么呢?你不是在简单的把同一个助手改个名字,而是在创建真正有清晰边界,能够持续专业化的角色型代理。举个例子,你的研究专家代理不会继承工程师代理的技术黑化, 你的作家代理也不会被调湿器的日制信息污染。每个角色都保持自己的专业性和一致性。 具体来说,一个 profile 像战略家一样思考,负责整体规划。一个保持研究优先,专注信息收集和验证。一个优化沟通表达,负责把信息转化成清晰的内容。还有一个生活在实现和调试模式中,专注技术落地。 因为他们的记忆、绘画和身份是分离的,每个代理都能随着时间变得更加一致和稳定,而不是变成一团混乱的混合体。理论讲完了,我们来看看 profiles 具体把什么东西隔离开了。 这才是 hermes 比普通助手设置更严肃的地方。一个 profile 可以 隔离配置、绘画、记忆、技能、人格、 chrono 状态以及网关状态 七个维度。为什么隔离如此重要呢?我这样说你就懂了。当所有东西共享同一份记忆和语气的时候,多代理系统就会失败。你不希望你的编码代理继承研究代理的习惯用语, 也不希望写作代理被调试代理的技术黑化污染。每个角色都需要有清晰的界限,才能保持自己的专业性和一致性。这就像真实办公室里财务和营销不会共用同一个邮箱一样。 听起来是常识,但在 ai 的 世界里,很多人恰恰忘了这一点。只有当状态保持分离时,专业化才能持久。概念都清楚了,那具体怎么搭建呢?咱们今天不聊那些复杂的大团队配置,就聊一个最简单的四角色模型。 这是我认为新手上路最容易上手也最实用的起点。这个结构之所以强大,是因为它映射了真实的工作流程。一、协调者先定义目标和拆分任务。 二、研究专家收集和验证信息。三、作家把验证过的信息写成清晰的内容。 四、工程师把计划变成可运行的系统。每个角色都对应一个真实的功能岗位,而不是随意设定的人格。协调者是整个团队的门面,他负责接收用户需求拆解、任务分配工作、汇总成果。你可以理解为团队的项目经理,他的核心能力是任务拆解和判断力。 当用户说帮我做一个 app, 它能拆解出需要市场调研、技术选型、 ui 设计、编码、实现测试上线等环节, 并分配给对应的代理。它不需要深入执行任何一个环节,但它必须非常清楚大局。研究专家是团队的信息守门人,它的核心职责是搜索和验证。当团队需要做决策或者需要某个垂直领域的知识时,研究专家就上场了。 它可以帮助查找技术文档、验证某个方案是否可行、收集竞争对手信息等。它的特点是好奇、严谨、深入。它不会浅尝辄止,而是会追根究底,找到最可靠的答案。一个好的研究代理人能显著降低整个系统中的幻觉自信, 也就是 ai 对 错误信息表现出的过度自信。作家是内容的雕琢者,他的核心能力是蓄势和表达。研究专家给你的是信息。 作家负责把信息转化成用户能理解、愿意看、觉得有价值的内容。他擅长口语化表达、逻辑组织、情绪把控。 你可以理解为研究专家给你原材料,作家负责把这些原材料烹饪成一道菜。当作家不用同时兼任研究员和调试器时,他可以全身心投入写作,输出质量自然更高。构建者是团队的技术执行者, 他的核心能力是实现和调试。作家给你的是方案工程师,负责把方案变成真实可运行的代码。 他处理技术实现细节,包括代码编辑、 bug 修复、性能优化技术、债务清理等。他非常务实、精确、严谨, 一行代码就是一行代码,不会模棱两可。当一个 profile 被允许保持深度技术性,不用操心怎么把话说好听时,它的实现质量会显著提高。总的来说就是协调者接受任务、拆解、分配研究专家收集信息,作家组织内容, 工程师实现方案、协调者汇总、交付。讲完了四角色,我们来聊一个让这些角色真正火起来的东西。 so 点 md 到这里你已经知道了要建四个角色,每个角色干什么,但有一个容易踩的坑。如果你只是创建了四个 profile, 改了名字, 但每个 profile 的 说话风格、优先级、操作方式都一模一样,那你拥有的就不是真正的团队, 而只是贴了标签的克隆体。如果说 profile 是 角色的身体,那 so 点 md 就是 角色的灵魂。它是一个 markdown 文件,位于你的 profile 目录下,里面定义了这个代理的核心特质,它的价值观、沟通风格、行为禁忌、专长领域等。一个完整的 so 点 md 通常包含以下要素, 除了 so 点 md, 还有一个配套文件叫 agents 点 md, 两者的分工很重要。简单来说, so 点 md 创造不同的代理 agent, 点 md 给他们共享的任务上下文。有了 so 点 md, 你 的代理就不再是一个冷冰冰的工具,而是一个有个性的角色。研究专家不会用工程师的口吻说话,作家不会像工程师那样思考。每个角色都有自己清晰的边界和风格, 这才是真正的多代理团队,而不只是同一个 ai。 换了四套皮肤。好了,理论讲完了,下面我们来手把手实战搭建你的第一个多代理团队。在开始之前,确保你的 hermes 已经正确安装并可以正常运行。 使用 call 参数寄予现有配置。创建新的 profile, 使用 hermes profile list 确认所有 profile 已正确创建。在编辑某个 profile 的 配置之前,建议先切换到该 profile。 使用命令 hermes profile use 加名称进入对应的 profile。 我 这里进入 island, 进入后使用 hermes profile 确认一下是否进入。在编辑配置文件之前,你需要知道 hermes config path, 查看 hermes 配置目录位置。 hermes 的 配置目录结构如下,现在我们来为每个角色编辑完整的 so 点 md 配置。我这里以研究者为例,其他 profile 的 配置步骤相同。编辑 so 点 md, 将文档中对应的内容复制进去。 好的,所有的代理的 profile 都编辑好后,我们编辑 agent 字典 md 前面说过, agent 字典 md 是 所有 profile 共享的项目,上下文文件 用于存放团队级别的规则和共享信息。最后编辑点 hermes 下的 team agents 点 md 这个文件,这个文件是团队架构说明文件,记录团队的整体架构以及各角色的职责边界和写作流程。 到现在为止,所有的准备工作就结束了,我们现在开始实战,给这个团队一个任务,让他们来帮我们完成。这个任务是让 hermes 帮我们总结一篇二零二六年人工智能发展趋势的深度分析文章,以及给他目标读者以及我们的基本要求。 输入命令 hermes profile use default, 切换到 hermes 协调者 profile, 输入 hermes, 启动 agent, 直接输入任务。我需要一篇关于二零二六年人工智能发展趋势的深度分析文章, 目标读者是技术决策者,要求内容准确,有数据支撑,结构清晰。我已经将我执行过程于 hermes 的 输出内容粘贴到文案中了,有兴趣的朋友可以看看。 好了,到这里,我们这个系列的课程就全部结束了。这是我的第一个系列,对我来说意义非凡。虽然在制作上还有很多不完美的地方, 但你们的每一次观看和反馈都是我前进的最大动力。我会继续努力,争取在下个系列里成为一个更棒的模导师。如果这个系列能帮你推开 ai 世界的大门,还请动动小手,用一键三连支持我一下,这对我真的非常重要。我是即刻模导师,我们下个系列代码见,拜拜!

如果你现在用 hermes, 还是把所有需求都塞给一个 agent, 那 你很快就会遇到两个问题,第一,上下文和记忆越聊越乱,研究、写代码、查资料、回消息全混在一起。第二,一次只能处理一个任务,你让他跑研究的时候,别的事只能干等着。 真正把 hermes 用顺的人,往往不是把单个 agent 掉得更猛,而是尽快把它组织成一个有分工的团队。你可以把 hermes 团队理解成一个小型数字工作室, 有的 agent 专门做规划,有的 agent 负责研究,有的 agent 负责执行,还有的 agent 只做复合和交付。每个角色只处理自己那一段,上下文就会干净很多。而且团队化以后,你终于不用再等单个绘画慢慢排队, 而是可以把任务拆开分别推进。如果你已经有一个能跑通的 hermes, 四步就能把团队骨架搭起来。第一步,克隆 profile, 继承你已经调好的基础配置。第二步,给每个 profile 写思路, 把它是谁、擅长什么、不该碰什么讲清楚。第三步,在项目根目录放 a j s, 让整个团队共享项目结构、协助规则和当前进度。 第四步, and profile 单独调用,让每个 agent 只处理自己该处理的任务。真正上手时,命令并不复杂。先执行 profile clone, 把你已经调好的基础配置复制出来,然后进入不同 profile 单独工作。重点不是命令有多花, 而是每个 agent 的 记忆和绘画都已经独立了。后面你再做研究、规划、执行和复合,就不会全部挤在同一个上下文里。这里最容易被忽略的反而不是命令,而是两个文件。 so 负责定义单个 agent 的 人格和边界, 告诉他该做什么,不该做什么。 agents 负责定义团队共享背景,把项目结构、协助规则和当前进度统一下来。一个管我是哪个角色, 一个管我们正在做什么项目。这两个文件分开以后,团队合作才会稳定。所以这套方法真正的价值不是让 hermes 看起来更高级,而是让他终于能像团队一样稳定,工作 任务拆得更细,上下文更干净。每个 agent 都有自己的角色边界,你也终于可以同时推进多件事。如果你现在已经有一个跑通的 hermes, 下一步最值得做的不是继续往单绘画里塞更多需求,而是尽快把它团队化。

欢迎来到本期解析,咱们今天直接切入正题,从 ai 中台视角,彻底搞定多智能体管理的那些烂摊子。说实话,在统一资源广场里做精准编排,这绝对是现在包级 ai 架构师最头疼的痛点,对吧?部署、监控、调试,再到维护,拿捏着十个核心 c l i 命令,整个生命周期你就能完全掌控。 先看部署, start 命令一键告别,冷启动瞬间就能把所有节点和调度中心通通唤醒。看到全率就说明集群稳了,要是报错,那你得赶紧去查调度中心的底层网络通不通了。 接下来是监控,用 status 命令,别再靠猜了,直接透视整个集群真实的负荷均衡水位。听着,别光盯着那些平稳的负荷率。一定要警惕超时节点,那可是系统崩溃的红色警报, 你得死死盯住系统的核心体征,尤其是每分钟偷啃消耗峰值,还有动态的内存附带,想要动态更新 reload 直令箭子是神器,零屏机无缝热加载模型配置非常丝滑。 当然,我们都希望看到成功的率子,千万别搞个语法错误,直接把线上服务给炸了啊!验证新能力,敲一下 plug in list, 一 秒钟快速校验所有挂载的 m c p 插件状态。 但要注意了,一旦蹦出端口冲突的报错,就意味着你的新工具被系统无情拦截了。咱们进入深度调试,遇到跨智能体通信瓶颈怎么办? trace 指令绝对是你的系统极透视镜, 它太强了,能以微秒级精度实时追踪对话在资源广场里的完整流转路径。不管是丝滑的交接,还是那种要命的智能提死锁,数据流向在这一刻绝对一览无遗。为了保证数据一致性,我们用 dispatch 命令手动模拟极端的外部任务,并发来做测试。 这招能让你以极高的颗粒度去硬核,拆解并验证复杂交接过程中的数据一致性。警告一下,一旦在这儿捕捉到数据架构不匹配,那就说明你的生态系统要彻底崩盘了。最后来看看日常维护。 lux 指令能让你在海量数据里瞬间锁定那些致命的线上故障。 它可以帮你直接跳过噪音,精准提取出导致节点的僵尸节点,保证你的服务发现永远快如闪电。 顺利清理能大幅释放压力。要是爆超十座,那就危险了。说明你的核心著作表被死锁了,万一遇到大崩溃怎么办? rowback 就是 你的终极救命按钮,瞬间重置回上个稳定版本。 这可不光是个撤销动作,它更是给你的系统直接兜了一张绝对安全的底线防空网。这十个命令构成了完整的生命周期套件。现在工具都起了,你的编排逻辑准备好大干一场了吗?

大家好,我是麦东,前几天我做了一期 hermes 子任务并行的视频教程,很多朋友私信我能不能出一期 hermes 多智能体实力的教程, 那么今天它就来了。本期视频我们来讲解 hermes 的 provides 多实力机制。 hermes provides 的 核心就是在同一台电脑上跑多个完全独立的 hermes 实力, 每个实体都有自己的配置,记忆、绘画以及 skills 完全隔离,不会互相干扰。这个有什么作用呢?比如你可以创建一个专门写代码的 engine, 再创建一个专门写文案的 engine, 每个 engine 都可以使用不同的模型,不同的人设,不同的 skills, 各司其职,互不干扰。甚至你还可以让一个 engine 去调度另外一个 engine 干活儿。这个我们在下期会专门演示,下面我们先来看怎么操作。我们首先回到命令行界面,运行 hermes profile creator 指令,创建独立的 hermes 指令。 在 create 后面我们需要加上你给这个新的智能体取的名字,比如我这边叫 work, 按下回车, 回车之后 hermes 就 自动创建了一个叫 work 的 独立实体,并且这边也提示了你下一步应该进行的一些操作,配置模型以及 api key 配置消息网关。 我们先暂时不进行配置,先给大家讲一下创建完成之后通过什么方式来使用它。我们可以运行 hermes profile use 指令,切换到指定实体下面去,切换完成之后,所有的 hermes profile use 在 us 后面加上你创建好的实体名称。按下回车,下面我们再次运行 hermes 命令,打开对话界面, 这边会提醒我们当前的 hermes 没有进行任何配置,是否运行配置命令?我们输入 y 看一下。如果是一路看我视频的朋友们,对这个界面应该不陌生,这个就跟初次安装完 hermes 之后弹出来的配置界面是一模一样的。 首先会让你确认是否需要导入 open color 相关的配置,接下来会让你选择配置方式,一般我们都是默认选择快捷设置,下一步就到了配置模型, 再下一步就到了配置消息网关,这边我们就不再进行重复设置了,新来的朋友可以去翻看一下我当前合集的其他视频,里面都有介绍过。 当你将模型以及消息网关全部配置完成之后,我们就可以在当前界面输入 hermes 指令,跟你创建好了智能体进行对话了。那么有些朋友在这时候就会有疑问了,我现在输入的所有 hermes 指令都是针对我新建的这个 work 智能体的,那么我原来的智能体去哪儿了呢?我怎么切换回我原来的智能体呢? 不用担心,下面我们就来跟大家进一步讲解 profiles, 查看当前一共有哪些 profiles, 可以看到我当前环境一共有四个 profile, 在 work 这个 profile 的 前面有一个小的菱形标志,这就代表着我们当前处于选中这个实力的状态。大家可以看到这边还有一个 default profile, default profile 就是 我们一直默认使用的那个 engine, 这个在大家环境也都是一样的,没有区别。 我们想要切换回去,只需要运行 hermes profile use default 就 可以了。 ok, 已经切换回来了,这时候我再去运行 hermes 指令,使用的就是我默认的 engine 了, ok, 也是正常。进入到的对话界面就说明我们已经成功切换回来了。那么有些朋友就会讲,这种切换的方式太繁琐了,并且一不小心还容易搞混。 接下来我就给大家介绍一种更简单的方式,直接把命令里的 hermes 替换成你当前新的智能体的名字就可以了。比如我们正常配置模型时,我们是运行的 hermes model, 这个命令大家应该比较熟悉,插下去之后就进入到了模型的设置界面,那么在这边我们就可以将 hermes 替换成新创建的智能体的名字, 同样进入到了模型的设置界面,当前设置的就是我们新建了这个 work 智能体的模型了。下面再给大家讲一个小的 tips, 如果你新建 profile 的 时候,想把当前时域的配置复制过去,不想从零开始配,我们可以在后面加上 clone 参数。 比如我们再新建一个时域 work 一, 我们可以运行 hermes profile create work 一, 带上 clone 参数, 按下回车。使用这条命令创建 profile 的 时候,它会把你当前的配置文件一起复制过来, 配置文件里包含 config 的 ym, 二点 e v 文件以及四二点 m d。 也就是说你不再需要进行模型的输入 y 配置了,开箱就可以用了。你只需要再去调整一下当前智能体的四二点 m d, 调整一下它的人格,修改一下它的消息网关配置就可以了,我们可以来试一下输入 work 一, 可以看到就直接进入到了 hermes 的 对话界面了,没有再去要求我们配置相应的模型。好了,今天这期到这边就要结束了, 我这边也整理了一个 hermes 多实体 perise 常用命令速查的文档,分享给大家。下一期我会带大家玩一个。更有意思的就是让多个 agent 之间互相调度写作干活儿,一个 agent 只会另外一个 agent 做事儿, 搭一个本地的多智能体协助系统,感兴趣的可以先点关注,下期不要错过。工具会变,但方法更重要,我是麦冬,下条继续。

hello, 大家好,我是阿亮。最近 hermes agent 特别火,不少人问我它和 openclaw 有 什么区别,我实测下来最明显的是两点, openclaw 的 技能要靠我们手动的编辑调优,而 hermes 可以 自我进化,越用越懂你, 可以说是更适合我们人类的使用习惯。其次是 hermes 比 open call 记得更准更详细的区别。大家可以看我上一期的视频,本期呢,教大家如何安装 hermes agent, 如何接入个人的微信以及如何配置模型, 整个过程呢?我也整理到了这份中文的操作手册里,如果你需要呢,我也可以发给你。模型的话,我们选的是 kimi 刚出的 k 二点六,因为 k 二点六的工具调用能力,长时间任务的执行能力呢,都很优秀。 hermes 搭配 k 二点六,整体体验非常的丝滑。先介绍 windows 的 安装,然后呢再介绍苹果的安装。 windows 安装分两步,第一步是安装 wsl, 第二步是安装 hermes 复制这行代码到终端,安装的过程比较久,耐心等一下。安装好之后提示呢,设置用户名和密码,用户名呢就使用默认回车输入密码, 注意界面呢,是不会显示这个密码的,设置完之后呢,二次确认即可。接下来复制这个代码呢,安装无伴兔,输入刚才设置的密码回车,安装好之后再复制这行代码,回车 到这里环境就配置好了,接下来我们安装 hermes 复制这个命令到终端,等待一段时间,画面是这样的,回车开始。下一步到了配置模型阶段,选择更多供应商,选择 kimi, 然后来到 kimi 的 官网,点击控制台,新建 api k, 输入名称,新建复制 api k, 再回到终端粘贴回车,选择这个自定义,输入 kimi 二点六。 所以我们打开 hermes, 看到这里显示 kimi 二点六的模型,给他发一条消息,有回复就证明安装好了。 苹果电脑的安装更简单,把这行代码复制到终端回车,然后等几分钟就搞定了。模型的配置呢,和 windows 的 一样,大家可以调到 windows 后面那部分去看如何配置模型。同样是选择 kimi 的 二点六,按照文档一步一步就能安装完成。 安装了 hermes 之后呢,很多人关心 oppo 的 那些配置,以及他的记忆 skill 能不能迁移到 hermes, 接下来我教大家如何迁移。 首先直接在 hermes 的 聊天框输入这个代码,这个是 hermes 内置的迁移龙虾的代码。但如果是 windows 电脑呢, hermes 可能会提示没有找到龙虾的文件啊,这是因为 windows 系统,它的 hermes 呢,其实是装到了虚拟机里面,我们需要让 hermes 跳出虚拟环境 啊,到本地电脑里去找龙虾的记忆,可以这样处理,让龙虾把它的记忆和它的 style 的 地址呢告诉我们,然后让 hermes 复制一份并迁移过来。稍等一会儿,迁移完成了,我们来测试一下,问一下它叫什么,可以看见它正在读取龙虾的记忆 出来的名字呢,和龙虾那边配置的一样,就证明迁移成功了。接下来教大家把 hermes 接入到个人的微信, 我就以 windows 为例演示,不想看视频的大家可以按照文档一步一步接入,打开一个终端,输入 wsl, 然后输入这个代码, 选择微信输入外进行下一步。然后呢,出现了一个链接,复制到浏览器打开。我们用微信呢扫一下出现的这个二维码,然后都选择默认的配置输入外,选择默认设置再输入外,然后分别输入这个和这个。 接下来先打开一个终端,打开 hermes, 然后微信给他发一条消息,把这个代码在旧的终端那里呢发给他,然后再发一条消息,有回复就代表呢微信已经接入成功了。 再来看一个实用的场景,我直接在微信里给 hermes 下达指令,让他围绕新能源这个主题,先搭建一版七页 ppt 的 完整骨架,把需求文件发过去,他很快就给出了清晰的框架摘要。 接着我再上传页面的内容补充文件,让他基于股价股旗副标题核心的内容。他不仅准确的提取了文件的关键数据,还主动给出了下一步的执行方向。我选定方向后,他直接在微信里回传了 ppt 的 出稿基本信息,排版分区全部呢都到位。 最后呢,我给到视觉的优化要求,他立刻说出了更精致的中版,有柱状图、折线图,排版布局和色彩搭配都有了明显的提升。 不过这个也是因为呢, k 二点六模型有着较强的上下文理解和比较优秀的审美能力。 ppt 做完,重点来了,我让 hermes 把整套流程分装成可附用的技能,之后只需要输入主题资料,就能一键生成 ppt。 哎,很快他就提示呢,技能呢分装完成了,接下来我们直接的测一下这个技能,看看他到底能不能工作。我就给他一份连锁咖啡门店的复盘报告, 他自动读取了文件,调用了技能,完全复刻了之前的三步运行逻辑出来的成果。结构呢,很完整,逻辑也很清晰。最后来看一个更进阶的玩法,我给他一份社区图书馆空间使用指南的知识库,让他调用这个技能回答我这个问题。 一开始呢,他的回答很基础,我立马给了他优化的意见,明确要求固定结构,合并需求的判断更贴合助手身份。你们看啊,他很快就迭代了回复结构,统一精准,抓学习讨论核心需求,还补充了注意事项和替代方案, 关键是自动更新了技能文件和知识库。我再跑一遍同样的问题,他全程的按照优化后的逻辑,然后再跑出来的。整体看下来, k 二点六的听话纠错能力强,审美能力好,再加上 hermes 的 自我迭代进化的能力,整体配合度直接就是拉满的状态。 hermes 加 k 二点六模型是我目前的首选,搭配手机微信遥控指挥 hermes 的 三层记忆系统加自我净化能力,然后搭配 k 二点六这样的前沿优秀模型,让我的效率呢大大的提升。好了,本期视频我们就到这里,下期视频呢,继续带大家讲解 hermes 的 进阶玩法,大家点点关注哈,跟着阿亮学英 i。

i l 的 一个训练 flow, 比如说数据集,可能是这次的一些文件加载进去,获取一个任务或者清除去。那我们其实知道 i l 的 训练主要是为了训练一个模型,它 改变模型的权重主要是为这个事情做的,他这个可以支持这个功能, a c p 的 dapper 啊,这是他一些核心模块。另外呢,我写哈问他什么问题呢?就是说 因为 burmer's agent 的 自我升级特性和 i l 的 一个 training 一个特性之间,他们的关系啊,说其实两个是独立的,不是有任何关系的,它附于不同的目的。可以看到自我升级,这个系统就是运行时自我改进,也就是自我宣传的一个自我升级。 通过 memory 系统啊,比如说 memory, md, user, md 绘画的一些持久,还有 skill 系统,语音搜索,还有一些问答用户建模,它的特点是不会改变模型的权重,比如说你后台需要的是什么?一个模型它不会去改变,它只会改进 agent 的 一个行为,就是通过其实改变 软件的一个行为。另外模型运行时的一个改进就是这个的一个集成。还有这些功能, g r p o 的 训练, logo 的 微调。另外还有一些这个最重要就是它会改变模型的一个权重,改进模型的能力, 其实两者结合起来会修改模型的一些能力,另外可以去根据用户一些数据去训练改变它模型的一些能力来 适配用户啊,就使用这个模型,一个是基层的一个模型,对大语言模型它能力另外通过 a 层的改进,两者其实协调起来是更合适的,但目前来说,其实他说了他一个结论还没有 达到,他们能够互相去升级,两者是一个非常独立的功能,那潜在关系有可能用户的一些轨迹数据可以作为 r 训练的一个输入,从行为的改进到能力的提升那个闭环。 但目前这两个系统其实是独立运行的,没有自动化的闭环,也就是说运行时自我改进是让 agent 积累经验,运用越聪明,而要训练是让底层模型越训练越强大,提升能力,两者结合 其实才能够真正的实现自我的一个进化。但需要人工干预来连接两个系统,那未来如果说不需要人工干预,这两个就给用户一个使用,感觉他非常适配用户,独立性是降相当猛的。好,本期就讲到这。

每天泡在终端八小时,今天咱不玩虚的,全是 hermes agent 保姆级避坑干货,这八小时可不是白花的,它到底藏了多少暗坑,我比谁都清楚,官方文档绝对不会教你这些,记住这五个保命命令,能让你少走几个月弯路。上来第一步, hermes setup, 这是你的三分钟生存套件,但小白极其容易在这翻车。血泪教训,千万别把 apikey 铭文写在 config 里,老鸟永远只用隐藏的大言文件 初始化的时候图模型多就选 open router, 想用靠谱免费额度的话,闭眼选 d c。 第二门令,直接敲 hermes 进终端,别傻乎乎,直接用它带的隐藏参数才是王炸。看好了,用杠 c 瞬间恢复对话加杠幺喽,直接跳过凡人的审批杠 w 用来隔离安全环境。 但等等,要是在查网页这种基础任务上, hermes 疯狂死循环,卡住了怎么办?论坛老哥的绝招,果断关掉 q 三点五的思考功能,不然他调工具绝对会崩溃死循环。 要是动不动跳出版权警告拒绝干活。别废话,直接切到本地解除限制的 q n 模型。这就引出第三个神仙命令, hermes model 摇到一半想换大模型,用它直接秒切,根本不用重启。 记住这张表,全球模型酷照 openroute, 国内求文选,阿里云想要绝对隐私,老老实实搞本地部署。第四个, hermes config, 听我的,以后别去翻文本编辑器了,直接在命令行里光速改配置。 比如敲个 cosine, 你 能瞬间开启长期记忆,或者一秒换上超酷的黑客帝国皮肤。最后啊,压轴的和 mass doctor 智能体早晚有崩溃的一天,真遇上了别慌,跑一下这位赛博医生,他会像急救包一样全自动跑一遍你的密钥、网络端点和依赖包直接定位并造。 新手遇到报错只会傻乎乎重装,老鸟呢?一个 doctor 命令下去哪行权限出错了立刻现原形。 要知道很迷思,一直在后台默默自学习,把繁琐的日常操作抽象成了能无限附用的神仙技能。所以准备好告别跟终端死磕的日子,让 ai 接管这些脏活累活了吗?咱们就这动手实操!


最近 ai 圈又火了一个新东西 hermes agent, 它和前段时间爆火的 opencla 到底有什么区别呢? opencla 本质上是一个帮你操作电脑的 ai, 会点鼠标,会打开网页,会模拟人类一步步操作,你可以理解为它在替你动手。而 hermes agent 更像是一个真正的执行型 ai, 会思考,会拆任务,还能调用各种工具。那问题来了, 这种东西普通人能不能跑?好消息是腾讯云已经把这件事做得非常简单了。 hermes agent 支持云端一键部署。 首先我们需要新建或重装一台服务器来运行 hermes agent 应用模板,这里选择 hermes agent, 不 想动手的朋友也可以通过一句话让 kiki 帮你去操作。完成后, 我们需要为 hermes agent 配置两个核心部分,模型和聊天通道。第一步,我们需要登录刚刚创建好的服务器,登录方式选择免密登录,用户名修改为 lighthouse。 在 配置模型之前,需要先在 minimax 平台获取一个 api 密钥。 接下来回到服务器终端,运行这条命令,启动 hermes agent 的 交互配置。执行后选择快速配置,然后会显示模型提供商列表, 这里我们来选择 minimax china, 选择完毕后会提示你输入 api 密钥,我们将刚刚创建好的密钥复制过来粘贴在终端,然后回车。接下来选择 minimax china 支持的模型列表。 模型配置完成后会询问你是否要连接聊天平台,可以选择稍后再配置。按回车键跳过,这里会显示配置完成的信息摘要,然后提示是否需要立刻连接 hermis 对 话 选择 yes 即可。如果模型配置没有问题,你会看到 hermes agent 的 欢迎界面,也可以输入一条简单的消息来测试一下。 hermes agent 会在终端内生成一段回复给你, 验证成功后输入 quit 按回车,退出 t u i 界面,回到命令行。模型验证通过后,接下来我们来配置企业微信作为聊天通道和 hermes agent 进行对话。登录企业微信管理后台,打开管理工具, 在智能专区中选择智能机器人创建,机器人选择手动创建,然后单机编辑按钮,设置机器人的头像名称和简介,按需配置可见范围。接下来滑动至页面右侧底部,选择 a p i 模式创建,找到 secret 单机后面的点击获取按钮, 在可使用权限中选择相应的授权,授权完毕后单机保存。创建完成后,进入机器人的详情页面, 你会看到 bot id 与 secret。 回到终端后输入以上命令,写入 bot id 与 secret。 你 可以通过设置 wacom dm policy 来限制,可以私聊 hermes agent 的 用户范围,此处设置为 pairing。 配置完成后,我们可以将网关安装为系统服务,安装完成后启动服务。 你也可以通过以上命令检查网关的运行状态。此时我们回到企微后台,可以通过获取并扫描机器人二维码来将它添加到对话框。在企微发送一条信息后,它会返回给你一条配对信息。 复制配对信息中的最后一条命令,粘贴到终端,看到如下信息后表示配对完成,然后回到企微界面,即可开始与 hermes agent 对 话。

一个 agent 为什么总是做完就算了,下一次还是老样子?为什么他能把任务完成,却很难把这次经验留下来,变成下次能直接服用的能力? 今天我们就顺着这个问题来看一下 hermes agent 到底解决了什么。本视频的代码笔记我整理进了一百万字的 ai 大 模型学习笔记里了,里面包含了传感器架构、 lincoln reeg 模型训练与微调、 agent 的 智能体开发等二十多个技术站,与一百多个 ai 大 模型企业落地项目实战笔记。 大家好,我是彭宇。 hermes agent 让 agent 学会成长,它的重点其实不是会不会做任务,而是把记忆、技能、审查、附用,串成一个完整的工程闭环, 也就是大家常说的闭环学习机制。这个思路很关键,因为很多 agent 的 记忆只是停留在聊天记录、上下文、日制这些层面。而 hermes agent 更进一步,它会把一次任务中的有效经验抽出来,整理成可以再次调用的技能, 而且这个过程不是临时的,是可以持续积累的。那我们先看整条核心链路。第一步是任务进入,也就是说用户给他一个目标,带着上下文约束条件,系统先把这个请求接住。接下来第二步是规划与执行, 这里他会把任务拆开,选择合适的工具去完成代码、文档、搜索、自动化这些操作。第三步是经验提炼,也就是从刚才这次执行过程中,把真正有价值的东西抽出来,比如成功路径、关键参数、容易踩坑的地方。 最后第四步是技能沉淀,把这些经验保存成结构化技能,下次再遇到相似任务的时候,就可以按需加载,而不是从头再来。如果你把这四步连起来看,其实他已经不是传统意义上的做完任务, 而是做完任务以后还能留下些什么。他把一次执行变成了一个可积累的学习过程。接着往下看这个闭环学习循环。这里有四个动作、观察、规范、审查、附用。我们一个一个说, 先是观察,系统会记录任务过程和有效操作,看看这次到底是怎么做成的。然后是规范,把这些经验压缩成操作模式,不是原封不动的存下来,而是提炼成更通用的做法。第三步是审查,这一步非常重要, 因为不是所有经验都值得直接变成技能,有些可能只是偶然成功,有些可能带着噪声,甚至可能有风险。最后一步就是复用,当下一次遇到相似场景时,系统直接调用这些技能,少走很多弯路。 你可以把这理解成一种自我积累的机制。很多 agent 做的是推理, harmless agent 做的是推理加沉淀,他不只是把答案给你,还会想一想这次的做法能不能变成以后也能用的方法,这一点才是真正的学习闭环。 然后我们看中间这块触发机制, hermes 的 学习不是一直开着无脑自动跑,他是有触发条件的。第一个是显示触发,也就是用户直接要求调用某类技能,或者沿用已有方法。 这个很好理解,用户知道自己要什么,系统就直接用。第二个是任务后触发,也就是任务完成以后,系统判断这次结果值不值得沉淀成新技能。这个很像我们上完一节课以后,会不会把这节课的内容整理成笔记。 第三个是计划出发,比如周期性任务、自动化流程、后台作业、定时执行,这种就适合按固定节奏去附用技能。第四个是改进出发,也就是旧技能在新任务中暴露出不足时,系统会对它进行补充和修正。 hermes 的 学习不是训练一次就结束,而是在不同出发条件下,持续把经验变成能力。这和传统 agent 最大的差别就在这里。传统 agent 更像临时工,干完就散。 hermes 更像会自己整理工具箱的人,干完以后还会把工具分类放好,下一次拿起来就能用。再往下是技能附用。这一部分其实就是 hermes agent 跨越的关键鸿沟,因为以前很多系统的记忆,说白了就是资料库,里面有很多信息,但并不等于会做事儿。 hermes 的 技能不是简单的文本记录,而是结构化经验,它里面会包含适用场景、操作步骤、工具调用方式、注意事项、结果、较验方法。你看,这就不只是记住了,而是知道怎么做。 第二个点是按需加载,降低上下文成本。这个设计很重要,因为如果你把所有历史都塞进上下文,成本会很高,而且容易把注意力冲散。 hermes 的 做法是只有当相关任务出现时,才加载对应技能,这样 token 用在关键位置,系统更轻更准。 第三个点是组合成更复杂的流程。多个小技能不是骨里存在的,它们可以串联起来形成工作流,比如调研、分析、生成、验证、规范,这一串流程就可以靠不同技能组合起来,这样一来, agent 就 不只是单点会做, 而是能拼起来做,这就非常接近真正的工程自动化了。然后我们看后台审查这一块,它决定了 hermes agent 不是 一个随便自动写技能,它的流程是先生成后选技能, 再做后台审查,最后持久化和调用。先说后选技能生成,系统会从任务执行轨迹中提炼后选技能,把高价值步骤保留下来,同时去掉临时性的、偶然性的造声内容,然后进入后台审查。 这一步是核心,它要检查这个技能是不是重复,是不是过度泛化,是不是包含敏感信息,是不是有危险操作或者错误。假设,也就是说 hermes 不 允许生成器上线,它中间有一道筛子,这一点其实和它的自我改进机制是配套的。 资料里也能看到 hermes agent 的 闭环,学习里经验会转成 memory 和 skills, 但新生成的技能并不会不加控制地直接安装,而是要经过 curator 这样的审查角色来把关。 最后通过审查之后,技能才会进入持久化阶段,放入技能库之后,再通过语义匹配显示指令或者自动化流程出发调用。这就很像一个小型的技能生产线,不是说 ai 想写什么就写什么,而是先生成再审查,再入库再复用。这个工程炼录是很完整的。 接下来我们看现存局限。第一技能质量不稳定,因为如果原始任务执行路径本身有问题,那最后沉淀出来的技能也可能会继承错误。也就是说,系统会记住做对了的经验, 但也可能会记住看起来对其实不稳的做法。第二,它不是模型训练, hermes 提升的是任务经验附用能力,不等于底层模型通用能力被永久增强。这个区别一定要讲明白, 不然容易把它理解成某种自动提升大模型智商的东西。第三,管理复杂度增加,技能越多去重版本冲突,权限过期处理就越重要,不然技能库会越来越乱。第四,安全边界必须存在, 因为一旦系统可以自动执行、自动沉淀,就必须配合权限隔离、命令确认和风险审查,不然工程上很难长期稳定运行。 所以你看, hermes agent 的 价值不在于他会不会做任务,而在于他把 agent 从一次性推理系统推进成了一个持续积累系统,他不是做完就结束, 而是做完之后还能把经验留下来,整理成技能,再经过审查,下一次继续用。这个变化听起来很简单,但从架构上看,其实跨过的是记忆和技能之间的鸿沟。 最后我们收个尾, hermes agent 最值得关注的地方就是它把学习变成了架构核心,它不是把学习当成附加功能,而是把学习做成了一个完整闭环,任务进入规划执行、经验提炼、技能沉淀、触发复用,再到后台审查,形成持续引进的系统。 也正因为这样,它才会让我们看到 agent 真正的未来。也许不是单次回答,而是一次次积累,一次次变强。那么下次再见了。

最近 o p c 很 火,很多人的第一反应是,那不就是多开几个 agent 吗?研究一个写作一个,写代码一个协调一个 听起来像是在扩编团队,但如果只是这样做,系统很快就会乱。这篇要讲的核心判断是, hermes 的 高级用法,不是把一个人变成十个聊天窗口,而是用多 profile 做角色分工,再用 wiki 做共享记忆。 一个人管理一支 agent 团队,关键在组织结构。为什么不能让一个 agent 全包?因为长期任务里,研究写作实现审查复盘会不断挤进同一段上下文,短期看很方便, 长期看会形成三个问题,幻觉、记忆污染、角色混乱。第一个问题是,幻觉一个 agent 自己查,自己写、自己审,最后还自己觉得没问题。 这不是模型笨,而是缺少交叉视角。真实团队会让研究表达实现和审查分开, agent 团队也应该一样。第二个问题是记忆污染。 内容创作、工程实现、产品判断、研究验证都会积累经验,但这些经验属于不同环节。如果全部混进一个长期 memory, 最后写代码会带着内容表达习惯,写文章又带着工程收敛思维。第三个问题是角色混乱。 一个 agent 同时承担研究规划、写作、执行审查,很容易在错误的时机做错误的事,该研究时下结论,该写作时重新查资料,该审查时替自己辩护。所以在搭系统之前,先把四个概念拆开, profile、 sub agent、 project, wiki。 很多 o p c 系统之所以乱,是因为把长期角色、临时任务、项目空间和共享记忆混成了一件事。 profile 和 sub agent 的 区别非常关键, profile 是 长期员工,要有稳定身份和长期记忆。 subagent 是 临时外包,只解决局部问题,比如查一个方向,验证一段逻辑,检查某个模块,完成以后就结束。 project 和 wiki 也要拆开。 project 是 某个长期任务的办公室,比如 twitter, growth、 hive coding 内容增长系统。 wiki 是 公司资料库,让不同 profile 可以 通过同一套文档同步状态。多 profile 不 建议一开始开十几个角色, 更稳的是从四角色模型开始。 coordinator, researcher, writer、 builder, 他 们分别对应项目经理、研究员、作家和工程师。 coordinator 是 项目经理,他定义目标,拆分任务路由、任务、汇总结果、检查边界。 他最重要的职责不是亲自干所有活,而是让整个系统有序运行。 researcher 是 研究员,他负责收集证据,对比来源,标记不确定性,提炼事实。一个好的 researcher 可以 显著降低整个系统的幻觉,因为他不急着写结论。 writer 是 作家, 他负责把原材料转化成清晰内容,搭建文章结构,提炼主线,优化表达,适配读者。 当 writer 不 需要同时负责规划和查资料,他就能专注于把内容讲清楚。 builder 是 工程师,他负责实现调试、测试和交付。 他不负责讲故事,不负责从名作研究,也不负责替项目定方向。这样 builder 才能专注于让结果真正可运行完整。工作流很像真实团队。 coiner 先拆解并规划任务, researcher 收集来源和验证主张。 later 把研究结果转化成清晰内容, builder 负责实现或交付。最后, coinager 检查、汇总规章。角色确定以后,就要开始构建每个 profile。 一个 profile 通常包含 so dot md, user dot md、 memory dot md, c o n f i g dot y m l skills 和 d n d 看起来多, 但每一层都负责不同问题。以 coordinator 为例, so 点 md, 只回答一个问题,这个 agent 是 谁? 他可以写。协调员负责拆任务规划、项目汇总结果维护 diceboard 和 agent lock 也要明确,他不直接研究,不写最终稿,不实现代码。这里有一个重要边界,如果你同时推进多个项目,不要把具体项目内容写进 so 点 md, so 点 md, 写的是这个 agent 是 谁,不是这个项目现在在做什么,否则角色身份会被项目状态污染。 user 点 md, 记录的是这个 profile 对 用户的理解, 比如用户偏好中文,喜欢结构清晰的 markdown, 不 喜欢空泛概念,希望内容适合复制到 obsidian, 但它不是全系统唯一用户画像。 memory 点 md, 记录角色长期学到的通用经验,比如复杂任务,先拆解中间材料,先进入 inbox, 最终产出,再进入 outputs。 不要把某个项目今天做到哪一步写进去,那是项目状态,不是角色经验。 skills 是 可附用任务流程 code liter 可以 有任务拆解、项目优先级判断、交接单生成、 dashboard 更新 weekly review memory audit。 关键是不要把所有技能都转给所有 profile。 config em 和 emvine 也要分开。 config 点 em, 规定 profile 怎么运行,比如模型、目录、权限和禁区,点 emvine 指放密钥,比如 a t i key token 和外部服务凭证。 任务内容和用户偏好都不该写进这里,到这里多 profile 只是团队层,一个团队要长期运行,光有员工不够,还需要共享文档、项目空间、任务看板、角色记录和复盘机制, 也就是 wiki 共享记忆层。在这套系统里, wiki 不是 普通笔记库,它同时是共享知识库、项目管理层和长期记忆层。 它记录项目背景、任务状态、推进日制重要决策、中间材料、最终产出和跨项目方法论。一个完整 wiki 建议包含八个部分, index 带 md、 schema、 md system、 projects、 pages、 raw assets、 archive 看起来多,但每一层都在回答同一个问题,信息到底应该放在哪里?为什么要分层?因为不分层信息会互相污染,项目状态会污染用户画像、临时想法会污染,长期知识、 角色经验会污染项目规则、原始资料会和最终结论混在一起。 index, md 是 wiki 首页, 它不存大量具体内容,只做导航。它告诉人和 agent 系统区在哪里,当前有哪些项目, 通用知识在哪里,原始资料在哪里,最近重点是什么?它是地图,不是仓库。 schema dot, md 是 wiki 的 宪法,它规定文件怎么命名,内容写到哪里,哪些文件只读哪些文件能改,什么信息不能乱写,页面状态如何标记 没有四连满,多个 profile 会按各自理解写乱。整个 wiki system 是 wiki 的 全局管理区,不属于某个具体项目。它建议先放六个核心文件, dashboard、 agent log、 weekly review、 memory routing、 skill、 registry、 seal、 profile、 dashboard 和 agent log 很 容易混。 dashboard 记录项目当前状态,回答现在有哪些项目,进展如何,下一步做什么谁负责,有没有阻涩? agent 杠? log 记录所有 profile, 做过什么,让写作过程可追踪? memory routing md 是 整套 wiki 里最关键的防污染文件,它规定角色身份写 soul md, 用户偏好写 user 点 md 或 user profile。 项目规则写 agents 点 md, 临时材料写 inbox, 正式产出写 pages, scale registry dot md 管技能分配, 它防止所有 profile 都装一堆 skills, 最后角色边界重新混乱。比如 dashboard update 只给 coordinator source validation 给 researcher article structure get writer code builders get builders projects 是 长期项目层, 每个长期任务都应该有自己的项目空间,比如 twitter, groove vcodeing content system product demo。 关键不是为每个项目复制一套 profile, 而是同一套 profile 团队服务多个 project agent dot md 是 项目级工作规则,他回答的是这个项目应该怎么做。比如 researcher 的 材料先写入 inbox, writer 的 结构方案也先进入 inbox builder 的 正式交付进入 articles, coordinator 负责更新 tasks and log, decisions 也要分清。 context 是 项目说明书, tasks 是 任务池, log 是 推进记录, decisions 是 已确定方向。 长期项目最怕每次进来都重新讨论。 decisions 就是 为了防止反复摇摆。 inbox 和 outputs 是 项目空间里非常重要的一组边界。 inbox 放半成品草稿,研究材料未确认结论和 subagent 输出。 output 放已经确认可以交付或使用的内容,不要让未验证材料直接进入正式产出。 pages 是 通用知识层,只放跨项目可附用的方法论, 它不是临时笔记层一个结论。要进入 pages 必须满足三个条件,跨项目可附用,不是临时判断, 经过验证或抽象 row 和 assets 也要分开。 row 放原始资料,比如论文、文章、网页、快照、数据表和会议记录,原则是只读不改。 assets 放非文本素材,比如图片截图、架构图和图标。 archive 放不活跃、过期或废弃的内容。 长期系统不要靠删干净维持秩序,而是靠分层和归党维持秩序。旧项目、旧草稿、废弃方案、过期资料都应该先归党。现在可以清楚看到 profile 层和 wiki 层的边界。 profile 负责 agent 是 谁,怎么运行,有什么经验,有什么技能。 wiki 负责项目共享知识、原始资料、任务状态、决策记录和最终产出。实际使用时,很多人担心多 profile 会不会需要频繁切换。判断标准其实很简单, 换项目不一定换 profile, 换角色才需要换 profile。 researcher 从一个项目切到另一个项目,通常只需要切换 project context 终端。 web ui。 wiki 也要分工,终端适合搭系统,改配置,调试路径 向施工现场。 web ui 适合日常写作,切换 profile, 继续绘画向办公室。 vicky 负责长期上下文,向公司文档。最后一个现实问题是 token 成本,多 profile 一定比单 agent 更好 token, 因为每个 profile 都要读取身份、项目上下文和 wiki 资料。解决方式不是放弃多 profile, 而是做模型、分层和上下文路由。总结一下 hermes 的 高级用法,不是多开几个 agent, 而是用多 profile 做决策分工,用 wiki 做共享记忆。目标不是把系统做复杂,而是让一个人也能管理一支稳定协助的 agent 团队。

最适合小白部署 hermes 的 方式非常简单,如果你想选择一个二十四小时在线的私人助理,并且随问随答,那么得益于阿里云的轻量服务器模型,通过阿里云来部署 hermes 一定是你最佳的一个选择。 首先进入阿里云,自己解锁进去,右边可以通过支付宝扫码登录,扫码登录之后,鼠标悬停在产品这个界面,悬停在计算这个界面,然后点击清亮应用服务器, 在清亮应用服务器的界面点击立即购买,立即购买有系统镜像,应用镜像这里,大家在应用镜像这里直接选用 hermes 的 agent。 目前 hermes agent 相比于 opencloe 的 话,它的整个的 tokens 消耗量下降在百分之五十以下,而且带有自学习的这个功能,更新迭代很快,更加的聪明灵活,所以说这是最近的一个热点的 agent。 在地域选择上的话,可以选择香港及海外以及内地,他的区别在于香港及海外一些应用服务,对外的话他是不需要备案的,在咱们内地受限于一些法律的条款,他需要对外服务的时候进行备案, 因为这里我们是用做自己的私人 agent, 所以 说不用选择海外,就哪里离你最近,你就选哪里就行了。那么我这里选的是成都,还有一个就是内地的话会比香港海外他的价格更便宜, 我选择成都之后,然后直接选择一年,这里可以看到他的价格目前是四百五十九元,但是当你第一次购买的时候,他是一折或者是两折的这样一个价格,就是当时我买的话大概就是六七十块钱一年, 这样试一试,点击立即购买就可以了,那么我这里已经买了,我就不再继续点击了。 点击立即购买之后,他就会翻转到现在这个界面,这里是已经给你部署好的 hermes 的 服务器,这里直接点击应用详情,在应用详情里面就有 hermes 的 agent 使用步骤。第一步,点击出场, 呃,目前的话,他只支持阿里的云百链,所以说你要在云百链注册一个账号,如果大家不知道云百链是什么东西,下一次课程里会进行一个扫盲,自己也可以去百度搜索进去注册一个账号,然后这里选择北京,根据自己的服务器地址,哪个地方最近就选哪里, 然后阿里云百链的 api key 自己粘贴复制一下,生成了之后,这里点击下一步, 点击下一步之后等个几分钟,然后的话右边就可以点击这个安全代理访问了,点击下安全代理访问,它是最新的 hermes, 已经给你有一个成熟的关于 hermes 的 ui 服务, 直接点击确定。如果不想了解那么多的话,这里就进入到这个 hermes agent 的 服务器端它的后台了, 他的后台的话,这里需要点击的就是这个配置,配置的话这里有目前你现在部署的模型,比如说现在是这个千万三点五 plus, 如果你有其他的模型,你就直接把这个剪切 剪切掉,然后把你想要布的模型从那个阿里云百链的模型名称给它粘贴进去就可以了。因为之前你是输过 api key 的, 所以说这里你输模型直接输入它就默认去消耗你 api key 这个账户里面的这个托尔斯的数量, 点击右上角的保存,点击保存之后,咱们回到这个清凉应用服务器啊,然后我们看一下刚才部署的怎么样了,是不是我们部署的这个千万三点五的这个模型,点击连接,远程连接,直接点登录, 这样的话就登进了我们的一个服务器里面,就是我们买的服务器里面 啊,直接输入 hermes 回车, 稍等片刻进入了 hermes 里面,你看到就已经提供服务了,然后这里有千万三点五 plus, 就 说明刚才你部署的是对了,那么在这个页面的话,我们的 hermes 的 部署就已经完成了,并且你可以在这里和它进行对话, 他的中文也是识别的,你可以直接打中文,他就回你中文了。如果你希望他以后一直给你回中文,你就说,呃,我希望你记住以后一直给我回中文,然后再打个回车,他就会记住你的编号, 支持的话 hermes 就 不锁完成了。那是不是这样 hermes 就 可以完全在线使用呢?是的,但是它目前还不好用,因为这个界面你和它的登进来进行呃访问,那么咱们下节课再讲怎么把它连接进入我们的微信, 进行远程访问,以及给它安装一些 python 的 库,让它去帮助我们进行具体的工作,谢谢大家。

挑战,每天讲透一个大模型实战知识点。今天讲二米 c 着那核心架构,不知道大家有没有过这种感觉啊?现在的各种 ai agent 虽然看着很牛,但其实骨子里还是个提现木偶。 你今天教他一套流程,他干的不错,明天你换个电脑,或者关掉对话框,重新打开,完蛋,他啥都忘了,还得重新教。这种一次性的工具究竟能不能进化成真正的数字员工呢? 大家好,我是彭宇。今天咱们就来拆解一下最近在开发者圈子里霸榜的 hermes agent。 很多人拿它跟之前的 open clock 比,说 hermes 才是未来,那它到底凭什么敢自称是能与你共同成长的数字生命?来,咱们对着架构图,一点点把底层的皮扒开。 大家先看屏幕最上方的这套核心架构图,咱们从左往右看,最左侧是它的持久化记忆层。 以前用 openclaw 网页一关,上下文清空像金鱼一样的记忆。但是 hermes 呢?它自带了本地硬盘,它能像真人同事一样记住你这个项目的业务背景是什么,你习惯用什么格式输出?这叫什么?这叫有了职业生涯的连贯性。接着咱们往中间走, 中间这个蓝紫色的引擎是整个 hermes 最暴力的部分,它里面有个词叫 inner monologue 内部独白啥意思呢?就是它在执行你的命令前,不会傻乎乎地直接动手, 而是先在脑子里自己跟自己对话。哎,这事我分几步走最稳?第一步干嘛?第二步遇到报错了怎么补救?但是刚才说的这些还不够震撼,真正让它跟 openclaw 产生代差的是中间下面这个紫色的部分, skill factory 技能、梦工厂以及它连接出来的下面这条紫色的学习闭环线。大家肯定很好奇, ai 到底是怎么自己给自己造工具的呢?来,咱们往下滚动页面看第二部分动作是如何变成技能的。 我给大家拆解了他背后的四个硬核步骤,这可是纯干货啊!第一步,意图解析,比如你让他帮我去抢个票,他大脑会先把这个模糊的指令用思维链拆解的明明白白。第二步,动态试错, 他会在反检测的环境里疯狂尝试,点错了没关系,查日记退回上一步,修改代码继续跑,直到走通为止。第三步,醉绝了,叫逻辑题,练很多简单的 rpa 录制完脚本就结束了,但 hermes 会在跑通后 把里面的具体参数剥离掉,他会把买一张明天去北京的票这种具体行为抽象成一套万能购票逻辑。最后第四步,技能固化,他会自己写一段带有标准化 jason 描述的 python 代码,然后啪的一下 拍进系统管理局的 skill register 技能库里。下次你再让他买票,他不再去网页上像个无头苍蝇一样现找了,直接调取他自己写的技能包秒杀。这就是越用越聪明。讲到这里,有同学可能会问了,这么逆天的功能,底下到底是啥神仙技术站在撑着?咱们再往下看。 第三个模块,底层技术透视。在模型层,它是基于 northhermes 三来的,底层是 lama 三点一的架构。之所以内部独白这么强,是因为人家用了专门的 a tropos 配方去调优。在环境控制层,它是直接基于 c d p 协议,就是 chromedaptos protocol, 通过 c d p 协议去操纵浏览器的,多配合 jason 的 结构化输出,又快又准。 在存储层,它用了 circle light, 加上向量数据库的双引擎组合,专门用来存这些复杂的长城记忆。好,扒完了底层架构,咱们把视野拉长,来看看最后这组直观的对比, openclaw 强不强?强!在自动化抓取和固定工作流里,它是个顶级的超级遥控器,这叫 gateway first。 但它的命门在于没有代码写好的预设流程,它遇到新情况就容易蒙。而 harness 的 理念变了,它叫 agent first, 大家看它最核心的壁垒,自生产工具能力。 我们以前的思维定式是程序员给 ai 写工具, ai 负责调用,但 harness 告诉你,不遇到没见过的业务,我自己去试错, 试通了,我自己写个工具保存下来。这就是我想跟大家分享的范氏月签。以前我们是在把 ai 当消耗品用,用完集坟。现在我们是在培养资产。你部署的 hermes, 跟你相处的越久,他积累的专属技能就越多, 他就越值钱。所以想要体验下一代 ai 开发逻辑的兄弟们,强烈建议去搞个开源版折腾一下,让他自己写代码来伺候你。这就是今天分享的全部内容,咱们下期见。