给大家看一下这个 hermes 镜的滤镜的这个 ai 工具,目前是最新的版本零点九零,然后也有了这个 dsp 的 界面,然后这是我连接的两个平台,一个飞速,一个 tagram, tagram 连接超时了, 然后这个是和他的对话,然后这个消耗的 token, 然后这个是 q, 然后这个就 current, 就是 定时生活。目前有三个,一个是天气提醒的,还有一个是新闻的,还有一个是这个是我刚刚加的,让他爬一些免费的模型。 那目前我找到了两个免费的模型,给大家看一下我这个任务执行的结果看,我让他设置一个定时任务,然后每隔四小时爬取一下互联网上的免费模型,包括 oppo ranger 上面的这两个模型,因为这两个模型目前是免费的,然后我现在在用这个模型, 对,因为他目前是免费的。对,你看他已经创建好了任务,然后现在开始爬,他爬的结果也是这两个,然后我问他除了这两个之外还有没有免费的? 对,然后它现在还在爬,还在搜索,然后它的使用和龙虾差不多,然后这是最新的九点零的这个这个版本才才加的这个 大西 bug, 也就是这个 web ui 的 界面,然后之前是没有的,然后它的进入方式也很简单,你就执行这个 hermes 大 西 bug 就 可以了,和龙虾差不多一样的, 然后他的界面我觉得比龙虾要直观很多。说实话,龙虾我第一次用的时候我就 搞不找不着他那些配置的东西在哪也可,不过也可能是我已经用过龙虾了,再用这个就上手比较快,然后他现现在觉得还是挺不错的。
粉丝113获赞349

今天我用了一阵子的 amos 啊,最大的体悟就是简单省事啊,像龙虾对接欧拉玛 lm studio 这样的本地模型啊,需要手工配置啊, amos 真的 是非常简单啊。 大家好,我是根谷啊,今天是 amos agent 系列课程的第二堂课,很多人的虾还没养好啊,现在又开始养马了。首先给大家看一下效果吧,我打开这个 amos 啊 amos, 比如说我做几道题目啊。先来一道简单的吧, 小明现在有十二个苹果,吃掉了三个,又买了五个,现在有多少个?我首先看一下欧拉玛这个,这一枚的四二十六币啊。好,他已经装载进去了。装载进去的话以后你看啊,一辆车 每小时六十公里,二点五小时能走多少公里数?那第二次就会快很多,因为刚刚我很久没用它休眠了哈。我们再做一道比较难的题目吧,一道概率论的题目。这道题目是比较难的,一个盒子有三个红球,五个篮球不放回抽两次 啊,就是这个球第二次抽到红球的概率,他给了两种方法对吧?嗯,那再给两个这个脑筋急转弯,这个小时候经常经常被坑啊。小明的妈妈有三个儿子,大儿子叫大毛,二儿子叫二毛。小儿子叫什么?小儿子是叫小毛吗?不对,是叫小明对吧?来一个这种吧 那来一个这种。呃,他这个记忆体没有的,比如说,呃,美国的现任总统。总统是谁呢?他应该要去网上去找,哎, 或者是美国的第一任总统是谁,我看看他能不能知道叫 music music music 啊。 这个 ems 最大的特点就是它,如果是啊,如果是它没有的功能,它一定会去网上找,比如说,比如说北京今天的天气如何,这对它来说应该是有难度的,它应该没有这个技能才对的,是吧? 那它你看它要去这个叫酷 google 去搜寻这个北京的天气,它要去 bing 里面去试了,是吧? 大概是搞不定的,我觉得它应该需要做一个这个天气的一个 api 的 接口去访问,它自己要去写这样一个技能, 然后我讲一下怎么样去快速的让这个爱马仕对接你本地的模型,因为你的电脑足够强大的话,我建议你还是用本地的模型啊,因为非常省钱啊,非常省钱啊。第一步就是进入这个欧拉玛,对吧?我用的是欧拉玛的当当 low 的 欧拉玛,是吧?我用的是苹果的, 自动的,就下载,下载完了以后这个没有什么可讲的,就是一个应用程序打开,打开它的话,这里面有很多模型啊,如果你电脑配置比较好的,就去下这个二十六 b 的 啊,二十六 b 或者是 三十一 b 的 都是没问题的,我的成,我的电脑下三十一 b 是 没任何问题的,当然我的电脑也是跑不起一百二十 b 的。 下完了以后,下完了以后你测一下就好了,比如说我下了这个这个这个 这个,这个我是有的,对吧?这 gpt 的 你,你是什么模型啊?对吧?它就是 gpt 的 这个这个单元模型,是吧?下完了以后,这个就挂在这里就不用管了,就是好通了,它出现了 cking thinking 啊,就 ok 了啊,你就不用管了,你可以把它擦掉。那第二步要要你知道这欧拉玛用的是什么端口?那欧拉玛端口的话是幺幺四三四,那这个端口是怎么知道的呢?很多人他在问这个端口怎么知道呢?其实是靠那个 l i s f 这个,你去看它的监听端口, 欧拉玛这个监听端口就是幺幺四三,是默认的,这个东西大家记住就好了,他不是八千是吧?也不是八千,也不是幺幺四三五,就是这个就就用这个命令,命令行啊,这是教大家一个小技巧,然后怎么把它配置上去呢?也是非常的简单的,是爱马仕,爱马仕这个名字我觉得取得特别棒啊, model 就就一个命令。然后呢?你翻到下面了,如果你用了龙虾的话,这些都是他把龙虾的配置倒过来了。假设你第一次配,第一次配是没有这些的,但是这个这个选项是有的,叫那个卡斯特吗?卡斯特吗?在哪里啊?自定义的端点,这个这个 这个这个 http 冒号双写,这个幺幺四三四回车,这里的 api 你 们不需要,不需要,因为不需要 api, 来这里面就选择模型了,对吧?这里面你选择一二三四,我应该是默认的是二二,是我最喜欢的模型啊,这是目前为止 最强大的模型啊。这个上下文这个窗口最好设置为非常大,七万 七万是没问题的啊。好了,以后就是 amos, amos, amos, amos, 哎,它总会出中文, amos, 哎,这就好了,最好是你先杀一遍进程,然后呢取一个新的回放框,因为它毕竟不是在浏览器里面,它全是这个命令行,所以说开始用起来可能不会那么习惯,但是用着用着应该就比较顺手了。比较顺手了啊?

是不用养虾了,直接养马吧。这个爱马仕真的是太强了,搞了四台 max 六的做本地大模型的部署嘛,四个机器人,四个 a 剑客,四个本地大模型,后期我会搞这个五零九零去做这个本地大模型,这些本地大模型本身算力是有限的啊,所以说他对于 a 剑客的平台 最关重要。在这个 open kala 下面,比如说我问他的知识库有啥,我这个本地模型就在疯狂的运转,但是也可以看到他这个思考的过程是非常的慢的。 因为什么?因为这个 open color 太重了,它的上下文吞吐默认情况下就有两万到三万左右,加上我装的各种企业管理的 skill, 它就变得更加的慢。我运营短视频呐,因为我是个做短视频的公司嘛,可以看到它的一个表格,我的知识库非常的全, 它输出的格式虽然说比这个爱马仕看得更牛逼,它架不住啊,我有这么多 a 型的同时,开始工作的时候,它的这个性能就会非常的差,而且经常去锻炼, 所以说我这段时间用这个纤维,三点五 a 三 b 刚好跑在这个六十四 gb 现存的这个甜点位,他基本上跑企业的绝大多数运营效果明显是这个爱马仕比他更强。看一下我真实的这个指示库,特别多的东西, 然后这么多东西我用爱马仕去找,平均它的速度比这个 open 科洛要快一半左右,可以看到这个信息,它的整理速度 是非常的快的,虽然说现在看着没有什么外观界面哪一个终端在跑,但是他可以直接对接微信呐,企业微信呐、背书啊,各种平台,所以说用起来丝滑度跟 oppo kod 没有任何影响,他可以支持无限记忆。 就是 oppo kod 经常我们在用的时候就忘事,今天你跟他说这个,明天他又忘了。比如说你现在帮我把这个合同改了之后,但第二天他不知道你改了这个合同,那这个操作空间,我觉得这个 a 镜头就非常的不好用。但是你用了爱马仕之后,你只要今天跟他对接完,比如说我现在按这个键把它退出他的聊天, 发现没退出聊天的瞬间,其实刚刚他他操作了,他把现在目前我们聊天的这个所有东西直接下到数据库存到我本地了。那就说下次我问这个合同,他可以直接找到,然后对比现在的这个差异化, 如果有差异化他会告诉我没有差异化他直接给你出结果。所以说这就是现在 a 镜头的一个集合,我觉得这个东西一定以后比这个 oppo 壳会更火,现在他的绝大部分我已经转移过来了,用起来非常的方便。

hermes 这个 agent 都说比 openclaw 强了不少,但国内怎么用一直是问题。小米这次出手相当于给你搭了个桥,给你免费试两周的机会。下面我教大家如何操作。准备工作,首先你得在电脑上安装 hermes agent 这个软件,去 get up 异形命令安装。第一步,升级,打开终端,电脑里的小黑框, 输入 hermes update, 它会自动更新到最新版本,进入配置。继续在终端输入 hermes model, 终端会让你选一个服务商,按提示选 news portal, 然后复制屏幕上显示的网址,在浏览器打开。第三步,白嫖免费套餐打开的网页会让你选订阅方案,认准 free 免费那个选项,点 subscribe, 虽然写要绑卡,但实测国内信用卡也能绑,别被吓到。 第四步,授权确认网页会跳出一个验证码,看看和终端显示的是否一样,一样的话点 i approve 就 通过了。选香蜜蜜,某杠 v 二 pro 搞定,想体验的赶紧!

现在我们来开始讲一下 mac os 上面如何安装 homes agent。 首先我们来打开这个 github 项目链接,地址,我等一下,我会放到我们的评论区中,我们向下滑 找到这条命令,点击右边的复制之后,我们在终端中打开,然后把这条命令给粘贴进去,点击回车,这里的话我已经提前安装过了,所以说我这里就不 给大家展示我一个完整的一个安装过程,安装完成之后他就会跳出这个配置界面,然后在这里的话我们首先选择大模型服务商, 再用我们的一个键盘的上下按钮,他就可以进行一个上下滑动的选择。然后我这边的话首先来选择阿里人,只要点击回车, 然后呢这里把你家里云上面的 ipad 来去粘贴到这里之后,这里这个 u l 地址的话就选择默认就行了,然后直接点击回车, 回到之后他这里有很多一个大模型来选啊,我首先推荐的呢是 iphone 三点六 plus, 因为这是阿里云最近新出的一个大模型,然后这里的话直接选择 no, 最后这里的话只选配置的是一个 tds, 嗯,这里的话直接选择一个第一个就行了,这里的话就选择一个第一个在本地环境中运行,我们直接回车,这里的话直接选 no, 我 们直接回车,这里一直回车就行了。然后这里的话就选择一个绘画重置模式啊,我们直接选择第一个就行了,这里的话我们也是直接回车,一路回车下去,然后我们直接选输入 no, 这里也输入 no, 对, 这里也是,这里也是,这里的话是在询问我们配置哪个社交媒体或者哪个平台来去做我们的一个 连接方式,我们最开始的话都不用理会这些,我们直接一直输入 no, 然后一路回车下去, 这里的话就选择一个操作界面,我们直接选出,我们目前是最开始阶段,我们直接选择在终端就好了, 这也是选择一些配置的工具,我们现在都不用管,直接返回回车,然后退出去。好了,现在我们就配置完毕了,我们直接在终端中输入 home, 但是第一个单词不要用大写,否则它启动不了,我们直接点击回车 好了。大家可以看到我们一个 home 十就已经启动起来了,有的话可以跟它这里进行一个普通的沟沟通交流。 home 十 agent 已经回复我们了,就是它是有一个阿里巴巴天问三点六 plus 大 魔性驱动的 ai agent 正在运行在 home 十 clean 的 一个环境中。

不是吧,你还在用你的 openclaw 呢?和妹子了解一下啊? nice! 有 一个 ai agent, 你 用它的次数越多,它就越聪明,不是因为模型升级了,是因为它在自动给自己写技能。这个东西叫 hermes agent, 今年二月开源的。它不是一个聊天机器人,而是一套完整的 agent 框架,核心逻辑是四步循环,观察、规划、执行、学习, 每完成大概十五个任务,他就自动评估自己,把有效的做法提炼成技能文件存下来,下次直接调用,速度提升百分之四十。 hermes 的 存在完全弥补了之前 open class 时常失忆且越用越笨的缺点, 并且在 openclaw 被 anselpik 封杀了以后,从 openclaw 转为哈密斯的用户越来越多了。哈密斯仅用了两个月的时间就在 github 上面掌握四万个 star, 那 这么全面的一个 agent 到底该怎么安装呢?跟小凯一起来看看吧。我们首先复制官网上的这段安装代码,让它自动下载需要的内容。 这里值得注意的有两点,第一,哈密斯暂时只支持 mac 和 linux 系统, windows 系统的观众老爷需要先下载 wsl 二才可以安装。第二点就是屏幕上显示的 mac 安装的时候会出现权限问题,这个时候不懂技术的观众老爷可以求助 cloud code, 或者跟着小卡一起来更改一下权限,就可以继续安装了。 安装好后,我们输入 hermes desktop, 按照他给出的设置步骤来一步步完成就好了。这里可以注意到, hermes 是 允许导入之前各位观众老爷电脑上的 open cloud 配置的, 也就是可以一键迁移,不需要重新配置,非常方便,剩下的选项各位观众老爷就按自己的喜好来就可以了,然后到这一步配置就完成了。后续想要跟哈密斯对话,只需要在终端里面打入哈密斯就会激活对话框了,然后就可以和哈密斯开始一起干活了。 这里的操作就很简单了,各位观众老爷用自然语言对话就好了,和其他 a i a 证特一模一样。好啦,就是这么简单,快去试试吧!


大家好,今天讲一个很多 mac 用户关心的话题,怎么在 mac 本地跑 ai agent 并使用本地六大模型。然后先说一下结论,我最终选择的是 o m l x 加千万三点五九 b 的 一个模型,然后我的配置是 m 二 pro 三十二 b 的 一个内存,目前来说的话还是可以使用。 整体上来说的话啊,千万这个模型比较适合在麦克上跑,中间踩了不少坑。我先来说一下啊,为什么其他的我不太推荐?首先我来说一下欧拉玛,这个其实是目前最流行的本地模型工具,但是我放弃了。 第一个问题是协议不太兼容,首先我们 hms 协进的需要 open a 一个标准协议,但是欧拉玛的话需要 let l l m 做一个中转,中转的时候还得注意我们的工具调用需要单独开一个非流式的一个经用才能正常的调用函数, windows 的 用户可以参考一下,这个是整体的架构,然后这个流程的话是能够完全跑通的。第二个来说一下 lm studio, 这个其实也是 mac 原声的一个工具,也挺好的。但是它发现我发现它没有 so endpoint, 赫默斯无法调用,只能本地自己用,无法作为服务来跑,并且它的内存占用是很高的。 说完刚才那些踩坑的经验,来说说我为什么选择 o m l x 以及 o m l x 对 mac 的 一个底层优化。很多人觉得用 mac 跑 a 帧的会很卡,其实问题是出在 prefix feel 这个东西啊,每次 ai 回复都要重新计算你的系统提示词, 系统提示词不短,它有工具描述, m c p 配置大概加起来有二十 k token, 传统框架每次都靠 cpu 重新计算,等半天才能出第一个字 o m l x。 怎么解决呢?其实是靠的四项核心技术,第一个前缀缓存,第二个分页式共享 k v, 第三个冷热分层,第四个高泵发调度。最后总结一下, mac 用户如果也想在本地跑 agent 以及大模型的话,建议使用欧美 mlx 这套方案。以上是 github 的 一个链接,大致现在的话只有一万个 star, 感谢大家的观看。

大家好,最近 hermes agent 又爆火了,好多人都说我 opencloud 还没有玩明白,怎么又出了个 hermes agent, 这又是啥?今天就给大家聊一聊 hermes agent 到底是啥?你不用会写代码,听过豆包儿叉的 gpt 就 行,它跟普通的网页聊天儿不太一样,关了网页对话就没有了的那种。它更像一种能够长期跑在云服务器上的那种东西, 他会带着工具,他能够记东西啊,干过的漂亮的活儿呢,还能够留下步骤,下次接着用。 get up 上有一句原文, the agent that grows with you, 意思呢就是会跟着你一起变得熟练,他不只是会回答,他还会把该记的都记下来。 下来我会分四块说,技能、记忆、轻推,也就是 note, 还有消息网关,搞懂这四块你就能够明白它到底在干什么。我们平时用的很多的 ai 是 不是聊完就忘页面一关,上次说了啥好像就都没有发生过。还有一种就是绑定在写代码软件里的助手,写程序特别强,但主要就是待在编辑器里干活。 这两种都很好用,但都不是扔在服务器上,一直开着替你干活的那种 agent。 hermes 他 想说的就是他既不是那种纯网页聊天的呃,聊天工具,也不是只给写代码用的 一个编辑器。左边可以理解为常见的短聊天,说完就走。右边呢是指长期开着的工具,越用越多,接下来的东西也会越来越多的。这个 agent 我们讲的就是后面这一种。一句话概括呢, hermes agent 就是 把大模型放进了一整套能够长期跑的系统里,工具记忆啊,还有技能,还有跟各种聊天软件对接的网关,它们是一起工作的,它可以跑在自己的电脑上,也可以跑在租的服务器上。 文档里还提到一些语音上按用量计费的那种跑法,总之,它不绑死在某一台开发机器上。 打个比方,呃,光有一匹好马是不够的,得给他配上呃缰绳啊,还有对应的马具才能够呃走远路。那光有一个好的模型也不够,他也得配上这套东西,才能够稳定地跨很多次对话干活。 名字呢,很容易混 hermes, 它其实模型名也是今天说的这套软件的名字,很多人第一次听就会绕进去。开发这个 hermes agent 的是 north research, 自己做开源模型,也做 hermes agent 这种让模型跑起来的软件。 hermes agent 讲的是权重。 hermes agent, 它是一个跑模型的软件框架,换模型它不等于换框架,这是两回事。 agent 呢,它是把模型装进去,接上工具和记忆的那套软件。先说技能,你可以把它想象成写在硬盘上的一份菜谱, 每件事情特别折腾,模型用了好多部工具,终于跑通了,系统允许他把步骤写进一个叫 scale 点 markdown 的 文件里边。一般在用户目录下的 hermes 呃的 scale 目录呃的这个文件夹下,那下次同样的事情来了之后呢,就不用从头去想,照着这个 scales 这个规范去做就可以了。不对,那就再改几行,不用整份都重写。系统里有个功能叫 scale manage, 就是 管这些说明书的,说白了就是在这里啊 ai, 它可以给自己写操作步骤,以后呢,它还能够自己改。 不是跟网上说的 scales, 其实说的是一回事儿,别人做好的 scales 在 这里也能够装上使用。配置里边呢,还有一个叫 creation node interview。 呃,隔一阵子呢,它会提醒模型要不要把刚才的做法给它。呃,沉淀成为一个 skill, 不 想用的你也可以把它关掉。记忆分三层,这层比较容易误会,我慢慢地说,头一层就是两份很短的文件, memory 既环境,机器项目里踩过的坑, user 是 既,你是谁,以及你的喜好都比较短,有自述的上限, 由 memory 这个功能去改。中间一层是聊天记录,进数据库要找上周某句原话,用 session search 去搜啊。这跟那两页的短文它不是一回事,一个是摘药,一个是原始聊天。再往上可以运行 hermes memory setup, 接一个像 home 这样的外挂,把长期印象做得更重。 那接了外挂,那两页的短文也还在,它是叠在一起用的,它不是二选一。宏光这里很重要。每次开聊模型先看到的是开聊的那一瞬间。 嗯, memory 和 user 这两个文件里边的东西,就像拍了一张快照一样。那聊着聊着,私版上的文件可能已经更新了,但是这一轮对话里,他脑子里的那份 java 他 不一定马上变,往往到下一轮新的聊天才会更新。所以说这个就是他的一个设计的机制。第三块叫 nerg, 英文原意呢就是轻推一下,这里就可以理解成系统帮你设置的一个闹钟 模型,他不会自己想起来我该记笔记了。所以说,框架会按照固定的节奏在内部提醒了。所以说,框架会按照固定的节奏在 user 上, 要不要把刚才跑通的一个任务给它沉淀成为技能配置?里面常见两个参数, memory layer interview 数,你发了多少轮对话, scales layer creation layer interview 数,工具跑了多少轮?不用呢,就给它设置成零就可以关闭了。 另外在聊天的时候要压缩,要结束,或者说网关要清。绘画之前呢,它也会找机会先把该存的都存上,说白了都是一回事,就是别聊了半天啥也没有留下。大家常问,能不能在飞书叮叮 telegram 里跟它说话? 可以, hermes 他 带消息,网关官方列了十几个平台,国内常用的钉钉、飞书企业微信也在里面,具体的名单呢,可以访问这个链接去查看一下。 常见的用法是云服务器上后台一直开着,你在手机里发一条消息,他就开始干活,不用每次自己登录服务器敲命令网关。他干的事情就是把各种聊天软件接到同一个长期跑着的助手身上。他不只是聊天文档里说内置了很大的一堆工具 啊,搜网页啊,抓页面,看图文字转语音之类的都有,具体多少叫什么名字呢啊,大家还是要去官网上和你自己装的这个版本为准拍, 能够 g m c p 把外面的工具再接下来,也能够设定时任务到点跑完把结果发回聊天里,也能够拆成几个字, a 阵台并行的去做一件事情。跑的地方也不限于本机啊,像云端服务器啊,或者刀客里边也可以跑。 另外呢,还有说话风格、文件、项目上下文,安全审批。你需要记住的是,它是一整套能够干活的系统,不只是有一个聊天窗口, 网上总是把 hermes 和 openclaw 放在一起,它俩都能够让你在聊天软件里和这个助手聊天对话,完成任务,操作文件。但是侧重点不一样, hermes 它更强调整件事情串在一起,怎么学怎么记 openclaw 呢?更强调先把各个聊天入口绘画管起来,再接到别的运行时上。 个人设备上的体验也谈的比较多。技术上, hermes 这边常见的是 python 一 条命令安装 openclaw 那 边更多是 node 细节呢?具体呢,要看他们的文档, 不是谁一定要替代谁,而是两种做法。如果说大家安装了 opencloud, 想要迁移到 hermes agent, 也可以通过官网的这个指令进行一个迁移。手动安装的话,官方推荐在 mac, linux 或者说 windows 的 wsl 二里跑屏幕上的这样一条命令,就可以下载这个命令,并且进行执行, 就一路装下去了。装完之后呢,输入 hermes 进行交互, hermes model 是 选接入你家模型, hermes tool 是 设置一些工具,还有设置网关的命令,以及检查 hermes 状态的命令。 hermes daughter。 这里需要特别提醒一下,普通的 windows 操作系统直接装是不行的,要用 wsl 二,不然的话就白折腾。最后查资料,核对命令要以这四个为准。 文档的总入口在这里,安装说明在这里,源码仓库在这里,社区做的网页界面在这里。呃,这个它不是官方出的,这是社区开发的。最后再补充说几句吧, skill 呢,就像菜谱 记呢,有那个 user 点 macdunk 和 memory 点 macdunk 那 两个文件,再加上聊天记录那儿指的是轻推,它是系统提醒,该记的时候就要记。网关呢,是把各种聊天软件接进来,如果这期视频对你有用,记得点赞关注,我们下期再见。

如果你还在折腾龙虾,还没学会,可以先停一下了。最近有个叫 hermes 的 新项目,一上线就杀疯了,狂揽六万星标。他能接各家厂商的模型,随便切,具备自学习循环, 越用越懂。你做过一次的活,还可以自动沉淀为 skill。 我 朋友为了装它,甚至在海鲜市场花了四十九,结果装完了,自己都不知道怎么配。其实自己学会安装并不难,别被那些复杂的代码吓到了。 今天全部交给你。开始之前看看你需要准备什么,只需要一样东西, git 终端输入 git version, 能看到版本号就行。其他的 python, node 全都不用管。安装脚本自动帮你搞定。先讲 windows 怎么装,右键 windows 图标选中端管理员, 打开 power shell, 点开 hermes 的 官方文档,复制安装命令,粘贴进去,回车,然后等着全部绿色打勾就装好了。 mac 也不复杂, command 加空格, so terminal, 打开终端,同样去官方文档,复制安装命令,粘贴回车,等它跑完,输入 source, 重载 shell, 然后输入 hermes, 看到欢迎界面就成功了。安装脚本帮你装了一堆东西,简单了解一下。 python 和 node 是 运行环境, 没这俩跑不起来。 ripgrab 做搜索, ffmpeg 处理音视频,你不用管,知道有就行。装好了,问题来了, hermes 需要一个 ai 模型才能干活, open router, 两百多个模型随便选,有试用额度,但注册稍微麻烦。欧拉玛本地免费跑,不需要联网。新手选这个就对了。第三种,自定义 api, 接任何兼容接口,适合进阶玩家。选好方案,进配置,向导选 quick setup, 新手直接回车,然后选提供商,我们选欧拉玛配置自动保存,输入 hermes 就 能用了。选了欧拉玛还需要几步配置,先去欧拉玛官网下载安装 模型,大概十二个 g, 注意硬盘空间。输入 hermes model, 选自定义 open ai 兼容 ul 照屏幕填就行。 api key 直接跳过 模型,选 gptos 二十 b 免费的上下文十二万八千 token 够用了。输入 her miss chat 杠 q 你 好,能收到回复就全搞定了。一般用户跳过这段想手动装的,接着看 git clone 克隆项目 cd 记目录 peep install 装依赖 python, 简莓 miss 启动,适合想改原码的人。装好之后记几个常用命令, her miss model 和 tools 切模型管工具 her miss update 更新, set up, 重新配置 her miss doctor, 诊断问题, 用过龙虾的话, claw migrate 一 键迁移。最后讲几个容易踩的坑, her miss 提示找不到命令 source, 波浪线 bashc 重载 shell 就 好。 samsung 构建失败,改成 pp install 简易引号,点引号最小,安装报四零一,错误 检查 api key 或者固定 provider, 上下文不够换十二万八以上的模型。到这 hermes 安装全讲完了,一行命令,装好,选欧拉玛免费跑,就这么简单。我是曲奇,一个 ai 练习生,让我们一起记录 ai 时代的个人进化。

最近呢,在 github 上两个月拿了六十九点三个 star 的 开源项目 harmors agent 非常火,在此之前呢,你可能听过 cloud code, open cloud 小 龙虾,但今天呢,这个不太一样,它不是一个 agent 的 工具,它是第一个出场就带着江绳的 ai agent。 什么意思呢?就说你不用自己去写配置,不用自己去维护规则,它自己呢,就说咋又来一个,我理解大家的疲惫。 opencloud 呢,在二零二五年呢,掀起了龙虾热,目前为止已经有了两千六百万用户,有人呢,甚至花一千块钱在你的电脑上部署小龙虾。 龙虾热还没散呢,又冒出来一个新东西,二零二六年二月呢,就这个人, north research, 他 发布了 harness agent, 两个月呢, 它这个星已经到了六十九点三子弹。你第一反应可能是龙虾,但是呢,我明白告诉你,这个绝对不是龙虾,它是一个颠覆级的 a 级的。花了一周时间呢,把哈姆斯从头到尾拆了一遍,发现呢,它和 open club 呢,走的是完全不同的路, 你看,这哈姆斯就是俗称的,我们国内呢,叫爱马仕,你看这是小龙虾。这两个呢,我都已经给大家测试好了,各有各的优点,谁也不能说是谁取代谁,看自己的需求吧, harms 不是 又一个龙虾,它是在做一件我们一直在讨论,但是没人能做成的事。要理解 harms 呢,这个 north research 开发的这个自学习的 ai 技能,它是唯一一款内置学习循环的智能体,它能从经验中积累技能,在使用过程中呢,不断地改进,持续学习并巩固知识。 还能搜索过往对话记录,并在不同的绘画中呢,逐步的构建更深的自我认知模型。而 open cloud 呢,它需要你自己去给它填充,不断地给它去升级规则限制。 harms 呢,它是通过你不断的跟它对话,它会自己二十四小时自动升级优化,甚至它的技能,它也不是一成不变的,它会根据你跟它的交互不断的去优化结果。像小龙虾呢,你需要你自己去告诉它,让它去优化,它才能优化,这是它两个本质的区别。 从二零二六年年初呢, ai 编程圈呢,又出现了一个共识,国外的 let 团队呢,做了一个实验, 它用同一个模型,只调整周围的配置,就是那些规则约束啊,记忆系统成绩从百分之五十二点八直接涨到了百分之六十六点五,排名呢,从前三十直接跳到了前五。注意,这里的模型呢,一行都没改变,改变的就是它这个架构, 就是它的规则限制。它第一个给这件事命名为哈尼斯。这个本质呢,也很朴素,就是每次 ai 犯错误,就给 ai 加一条规则, 让他永远不再犯同一个错误。 harnes 讲的就是方法论,但执行呢,全靠人觉得自己写 cloud 的 文件,自己配 hux, 还要自己搭机器。系统做的事情呢,就是把这五个组建全部给内建了, 那 opencloud 呢?小龙虾给你一套配置及行为的系统,江神呢,全得自己去造。 harmans 呢,他把五个维度全部内建了,而且呢,让他们自己呢去运转。 从你给 ai 造江绳,变成 ai 自己给自己去造江绳。很容易犯的一个错误是什么?现在就是 cloud code, opencloud, 小 龙虾,还有 harness 这三个工具呢,解决的是不同层面的问题,不是谁取代谁。 cloud code 呢,是专门针对工程师的。 openclaw 呢,做的是配置及行为,你写的嗽文件,让它变成你想要的样子。 openclaw 呢,生态成熟,有四万四千个 skill, 而 harness 呢,它自主后台加自我改进它,你不需要坐在它旁边,它自己跑,自己学, 甚至呢,自我净化,能够做到七乘二十四小时在线。在这里呢,有一个很有意思的点,就是这三个工具呢,都采用 agent 的 skills 标准, skill 呢,可以互通使用,也就是说你在 opencloud 键的 skill 呢,你可以直接一键平移到 commerce, 它更像是一个生态里分工不同的三个角色。那讲了这么多呢,其实我就是想给大家分享一下,就是这个 commerce agent 呢,不是另外一个小龙虾,它两个是不同维度的智能体, 用起来呢,可能会越用呢,更懂你,它真正呢做到了自我进化,自我升级,进化的这个基因写到基因库里面呢,你看这个原文件呢,我已经给大家找到了, 我已经把它这个安装包呢和使用方法呢,全部总结放到这个非输文档了。你看就是 harman's agent, 零基础保姆级,不属于实操 s o p 包括里边,你看 open kloo 和 harms agent 的 核心差异对比呢,我详细的这个对比表格,你看不同维度,学习进化、工作主动性、多线程处理,使用场景、大模型切换技术底座。其实一句话总结呢,就是 open kloo 呢,是你养出来的小龙虾,而 harms 呢,是自己会长大的龙虾, 一个靠你用心去喂养,一个是靠他自己从经验中学习。如果你只想要一个简单的聊天机器人呢,两者都能胜任。但是如果你想要一个能自己定闹钟, 能不断学习你的工作流,还能分身干活的全自动数字员工,那必须是 harmless agent。 而且呢,你看这里,你可以直接呢 harmless claw 这个指令,你直接就可以把 open claw 的 数据呢全部无损的翻译到你这个 harmless 上面,非常方便。你看 这里的安装配置,不管是 windows 系统还是苹果系统,每一步详细的操作步骤呢,我都给大家写好了,都在这个飞书文档,包括你看下面还有十个高频应用场景也全部在这里了,需要这个飞书文档的说一下,免费分享给大家。

听说爱马仕也出 agent 了,而且还要跟 open core 正面硬刚?你别误会啊,我说的这个爱马仕不是卖包的那个,是最近 ai 圈的当红榨汁机 hermes agent, 它是 news research 做的一款会自己净化的 ai agent 系统, 上线 qq 号没多久就直接冲到了四万多, stars 这两天的趋势榜还拿到了第一名。今天这条视频呢,我分两部分给你讲。第一部分呢,我帮你讲明白它是何方神圣。第二部分呢,我带你把这个 agent 装到你的电脑上。我们先来搞清楚一件事情, 现在都在说它能够代替 open core, 是 真的吗?那它到底厉害在哪里呢?我们说你现在用的这些 ai, 不 管是 touchp t, jama 的 豆包,还是 dipshit, 它们都有一个共同点,就是你给他指令,他 帮你做了,做完呢,这一轮就结束了,下一次再来。本质上呢,是从头开始,但 hermes 不是 这个逻辑,他每次帮你做完一件事,他不会直接就停了,他会复盘一下刚才这件事我是怎么做到的,哪里做得好,哪 哪里还需要改进。然后他会把这一整套做法整理成一个 skill, 下次再遇到同类的事情的时候,他不会从零开始,而是直接调用这个 skill 来做。而且不止这样,如果你中间改了他的结果,或者呢,他发现有更好的方式,他会把这套 skill 再点。 别带一个版本,你用久了就会发现一件事情,它不是在重复干活,它是在不断的进化,这就是它最核心的地方,内循环学习系统,也就是 build learning loop。 那 这个时候你再看 open crawl, 它们的差别就出来了, open crawl 更像一个你自己搭出来的系统,你可以往里面装工具,接平台,然后 通过配置让它变成你想要的样子。但这里有个前提啊,这些 skills 基本都要你自己去弄,要么你自己写,要么你用别人做好的。换句话说,你是在一点点把它训练出来,所以我们才说养龙 虾嘛。 the hermes 是 反过来的,他很多的能力是你用着用着他就自己学习出来了。但说句实话,我们真没必要二选一,他们各自的侧重点不一样, open call 负责把能力搭起来,把系统接好, m s 负责在后方呢,慢慢把这件事情越做越顺,你如果把它们组合起来用,可能才是更好的选择。好了,讲到这里,如果你已经有点感觉了,那我们直接来点实在的, 把它装到你的电脑上。那在安装前,我们先看一下它的官网,还蛮好看的,很最终幻想的感觉。我们再看一下它给哈的爵乐现在是多少星了哇,现在已经差不多五万星了,真的升的很快啊。 我们再看一下它官方的指导文档。那这边就介绍一下这款 agent building learning roof, 就是 那个内置循环学习系统,它一个很便宜的几十块的 vbs 就 能够装上了。然后这边有一些指导是怎么装的, 六十秒就能够搞定,我们来试一下。那我们现在来到官方的安装命令行这边,无论是 linux、 mac 还是 windows, 只要用这一条命令行就行了。 是值得注意的是,如果你是 windows, 你 记得在 wsl 这个环境下去安装,那我复制了以后呢?打开我的终端,然后直接在终端上粘贴这一行那一行,然后直接回车, 你就可以等待它安装了。 ok, 它已经开始安装了,它验证到我是 mac 系统。然后呢,现在在查找这个 uv package, 就是他会看一下我电脑中有没有他需要的依赖环境,没有的话呢,就会帮我安装。他已经在安装的过程中了,在这个过程中呢,他会不断检查我的依赖,然后帮我安装。你看打了勾的就是已经安装好的,那这些箭头呢?就是正在 check in, 再查一下,然后等一下帮我安装, 只需要耐心的等待就行了。他现在又安装了其他东西,反正你不用理他,也不用看懂他,他会自动帮你搞定的,然后他继续在安装当中。很快啊,就是刚刚卡了一下网络,调整了一下, 现在快了很多了。那官方说的六十秒到底是怎么个六十秒法呢?然后他在一步步的安装,后面就快很多了。第一次安装呢,他肯定要有很多的依赖需要去部署一下的, 如果你后面需要重新安装或者怎么样,他可能就快很多了。好了,在这一步我们看到就是他的室内环境已经准备好了,然后呢,他就安装了所有的依赖,这些依赖包已经 ok 了。现在安装的是 noj s 的 依赖,那其实他这个 hermes agent 还蛮多东西要安装的。 no j s 的 全部依赖安装完以后,他现在帮我安装的是这个自动化的浏览器引擎,那我们会看到它这个浏览器的安装是失败,但没关系,它不会影响它的核心呢,我们现在已经进入了下一步了, 那我们来到这一步呢,其实证明你的 amis agent 呢已经安装成功了,现在呢只是一些配置的引导。那这里他其实说的就是他看到我的电脑当中呢,已经有 open call 了,问我要不要呢,导入一些 open call 的 配置,他现在问我就是你要不要看一下可以导入什么?那我就看一下吧, 那我们浏览一下到底它可以导入什么? what import, 就是 这些 so 啊, memory 啊,这些 and 文件,还有你装的这些 skills 就 可以导入,然后这个会跳过的就是这些可能是它不兼容或者我没有的东西,它就会跳过,然后它就说就是,呃, 这些设置它不会说一比一的。来到这个 hermes 的 这个环境,我觉得我并不需要这些配置,我想搞一个新的来玩一下,那我直接用 no 吧,然后来到这个界面,他就问我要不要快速的安装,我觉得快速的安装就 ok 了, 直接就选择第一个,然后回车。那来到这个界面,他是让你选择哪个 ai 的 供应商。那我今天看到了一个新闻呐,就是说小米呢,已经接入了 hermes agent, 就 可以免费用两周,那怎么使用呢?就是通过这个 newspot 就 可以了。那我们回到这个终端,这里看到了第一个就是了,确定一下,那来到这个界面就是你可以通过这些跟他就是进行对话,这个界面就是选择你跟他的通信工具。我看一下有没有飞书, 微信都有,居然没有飞速,那我先不搞了,我先回到上一步, ok, 来到这一步,我直接按 y 通过终端来跟它兑换一下。噔噔,我们已经安装成功了,这个界面真的挺帅的。 hermes agent, welcome to hermes agent。 可以在这边输入你的一些命令。那我在这里输入你是谁?那我发现他就说我还没有配置,就是那个 ai 的 供应商。那我刚刚不是配置了小米那个免费的吗?那经过我的测试发现一个问题,这个免费呢?其实它不是真的免费的, 所以说小米官方说能够限免两周,然后我确实在这个 model 收到的小米确实是零元的,但有一个问题,你要添加这个 api key, 它会显示一句话,意思就是说必须先买它这个订阅, 然后才能够使用免费。就是小米它本身确实是免费两周,但你得订阅它这个 news portal, 然后才能够使用小米,所以就是不免费。用它干嘛呢? 我们用自己的 api key 就 好了。那解决方法也很简单,那我们输入这个 mini, 然后进入这个模型的选择,我们 箭头选一下,更多更多,这边有很多的供应商,我选择我有的 mini max, 然后来到这边复制一下,粘贴上来,按回车 api key c, 然后继续按回车,我们现在就选择它的模型,选个二点七就好了。 好,我们现在重新进入 hermes, ok, 来到这个界面,看到是 minnesus 二点七,我们问一下他,你是谁? 那我发现我刚刚选择的这个 minnesus 的 国际版本,所以就搞不定。那记得要选这个 china 的 版本。然后呢?就是粘贴,粘贴以后,他这边其实那个密钥是看不到的,但其实已经粘贴了, 回车就好了,他已经 safe, 就是 说已经 ok 了,然后直接再回车, ok, 然后我再选择这个二点七,现在就已经选择成功了,我再进入这个 hermes, ok, 我 们再来测试一下, 这次应该就有反应了, ok, 他 已经回复我了,他说我是 croco。 真的 假的?他已经产生幻觉了,会不会就是因为 mini max 叉?就是这个二点七?有 一些真牛的事情我也不知道,但我不知道为什么他会回复我,他说 gopro, 这个还是蛮惊讶的,不管他了,我派一些任务给他了,搜索今天五条热门的 ai 新闻给我, 正在进行当中,就他会自己去解决,反正如果遇到什么问题,我给他已经找到了。根据 google news 的 搜索结果,今天是十号的 热门的新闻,你看他是帮我找到了,还蛮好的。那今天的测试就到这里了,其实你每次要安装这种新的 ai agent, 你 都需要去折腾一下的,这个很正常。 那我后面进行更深入的测试以后再给大家汇报吧,今天就到此为止。那通过我刚刚演示的安装方法,我想你也很容易把它装到你的电脑上,赶紧玩起来吧。 最后我想讲一个很多人关心的问题,就是你到底要不要装 hermes agent 呢?我先给你一个很实在的答案,并不是所有人都需要装新的 agent 的。 如果你现在已经在用 open core, 并且还用的挺顺手的,那你真的没必要因为它火就去换这个,因为这些工具本质是在帮你的工作降本增效。既然你现在用这套东西已经能把你手头上的工作处理的很好了,那你再去换一个新的,其实没有多大的意义。 很多人现在有个问题啊,就是看到新的 ai 就 焦虑,觉得不学就落后了。但 ai 这个发展的速度,你越追反而越容易乱,你今天学这个,明天学那个,到最后什么都没有沉淀下来,这才是最大的问题。 所以我反而更建议你把你手上现在用的这个工具玩到极致,等你哪一天真的遇到瓶颈了,才考虑换其他的。所以你记住一句话就够了,不是你学了多少 ai, 而是你有没有真正玩 全明白 ai。 只要用好一个 ai, 你 已经超越了百分之九十九的人了。 ok, 以上就是今天的所有分享,你有安装 helmes agent 吗?把你的使用感受打在评论区,我们下期再见!

hermes 安装图形启动器又更新了一版,给大家演示下怎么操作。这里点击下载会得到一个安装包,双击这个文件,点击运行,它会检测一下你的电脑适不适合装。这个 hermes agent 会帮你解决环境问题,确认没问题,点击继续确定安装路径也没有问题,再点击一下确认。 点击开始安装,他会告诉你你要做什么,点击确认,继续往下走就可以了。这里就开运行起来了,不可能需要个一两分钟,大家稍等一下,当他安装完毕之后就会到这个界面,或者可以告诉你下一步该怎么做。点击开始对话, 他会让你先去配置一个模型那么一下,比如后点他会告诉你就可以进行对话了,我们打一个,你好看他已经在工作了,就这样安装好了。

这样的时代,其实判断力比选协议更加重要。我们团队用 open globe 用了很久,今天也是全部切换到 hermes agent。 hermes agent 刚上线的几天, itapp 已经六万 star, 它到底火在哪里?首先它的切换非常的简单, hermes 原声支持 openclip 一 键迁移,你不需要自己手动装什么东西,你打开 cloud code 或者是 codex 啊,或者是你本地任意一个 agent 的 工具,你跟他说一句,阅读 hermes 的 官方文档这个 gitap 地址,然后按照步骤安装,并且呢,把我本地的 openclip 迁移过来。 那就这一句,自己去读文档,自己把你的龙虾的工作空间,定时任务、记忆、 skill 全部翻过来,你中间也不用管发生了什么。不过不仅仅是切换简单, 我们之前在非洲上跑的一个内容自动化场景,有一部分会涉及到图片的上传,到指定的群聊和归档啊,用 open globe 携带了好几轮,改来改去的总是不对,而且呢,你只能干等着他回消息,等半天挂掉了,你也不知道死在哪里。那换到了 harmas 之后, 首先他执行的每一步,你都能够快速的看到,把哪一步卡住了,你马上就能够知道,而且他自己找到之前那个问题,直接沉淀成了一个 skill, 那 下次再跑的时候呢,就可以一次性过了。那 同样的任务, harvest 消耗的 token 就 比 open globe 要少了很多,两边都是用同一个模型, harmis 它更轻啊,更聪明,也会自己进化。像我说的这些,不是让你去追新的工具啊,业务流程,你的 sop, 你 沉淀下来的这些 skill 啊,才是你真正的资产工具,怎么变都没有关系。今天是 omg, 明天是 harmis, 后天又出一个新的。什么无所谓,你随时都可以迁移,真正值钱的不是你用的哪一工具,而是你很快的判断这个东西对你有没有用。

hello, 大家好呀,我是即刻模导师。上节课我们讲完了 hermes 的 核心概念,今天我们开始教你手把手安装 hermes agent。 话不多说,我们开始吧。 安装之前我们确认一下系统配置,这是安装 hermes 的 系统要求, hermes 要求不算高,大多数电脑都能满足。课间里面包含了 windows、 mac os、 linux 的 安装教程。本次我是以 windows 时安装 harmony 进行演示。这里要特别提醒一下 windows 用户, harmony agent 不 支持原声 windows, 你 不能直接在 cmd 或者 power shell 里跑它,你需要装一个 wsl, 就是 windows 上的 linux 子系统。好了,这次我们是真的开始了。首先 windows 用户打开 power shell 执行命令,你也可以直接使用 windows 自带的终端,这个无所谓。 然后输入这个命令 wsl install, 这个命令执行完成,系统会自动给你装上 wun2。 二十二点零四,装完之后一定要重启电脑。 重启完成,我们使用命令 wsl 杠杠 version 查看是否安装成功。看到 wsl 已经安装成功,我们再使用命令 wsl 杠 l 杠 v 查看 wun2 系统是否安装成功。 这里报错了,原因是 linux 系统安装失败,我们需要进行手动安装,我们可以通过执行 wsl list online 这个命令,查看所有可以安装的 linux 系统, 再通过执行 wsl install 加上 wboot 的 版本名称进行安装。 这里可能是因为我的网络原因,系统下载的实在是太慢了,所以我这里换了一个安装方式,在官网上下载 wsl 格式的乌崩特系统,搜索乌崩特二十二点零四系统,进入官网找到 wsl image, 点击右边的 pcwsl image, 下载完成后直接双击安装就可以了。安装完成,按照提示输入密码, 在吹里面验证一下,看到 wubongtwo 系统已经安装成功。使用 wsl 命令进入 wubongtwo 系统, 使用 sudaapiti update 更新包,并使用 atp install git 下载 git 软件。后面我们需要通过 git 命令来下载 harmas 的 原文件, 到此为止,我们的环境就全部安装完了。接下来就是使用这个命令安装 hermes agent。 安装完成,开始进行初步配置,我们选择 quick setup 快 速配置 hermes, 我 们先随便选择一个模型,但是不配置,后面使用英伟达免费的 minimax 二点七模型进行配置, 消息渠道也默认选择第一个 telegram 也先不配置,后面再进行配置。 看到这个界面,我们的 hermes 就 安装成功了。接下来就是获取英伟达的 key。 首先打开浏览器访问 build, 点 nvidia, 点 comixplorer discover, 这个网址呢?用你的 nvi d i a 账号登录,没有的话注册一个,有些地区可能需要手机验证,按提示来就好。 登录之后找到 api keys 区域,点击创建,输入 key 的 名称,并且选择过期时间, 点击创建 key, 创建好了之后立刻复制你的 key 格式是 nypi 开头的一串字母,记住这个 key 只显示这一次,复制好了之后妥善保存,不要告诉别人 key 有 了。现在我们来告诉 harmass, 用这个 key 使用 wsl 进入乌帮徒系统,并分别复制下面五条命令到命令行中, 最后使用 harmass config 来验证一下配置有没有生效。使用命令 harmass 进入 agent, 输入对话,验证是否成功。 看到 hermes 返回内容,我们的 hermes agent 就 初步搭建成功了。初步搭建 hermes 的 教程就结束了。有需要安装资料或者有任何疑问可以留言或者私信我,我是即刻模导师,我们下次代码见,拜拜。

最近 ermis agent 很 火,火到已经有人开始卖袋装服务了。但普通人真正需要搞清楚的不是他有多火,而是他到底和 openclaw 差在哪儿, 以及你到底有没有必要再装一个 agent, 还是只是在追一个新的热词。所以今天这期我不吹概念,直接把它拆成一个新手也能照着走的完整安装指南。我们就只讲三件事,它是什么,它和 open cut 的 区别,以及怎样用 ws 二二最稳的把它装起来。 hermes agent 本质上不是一个聊天 app, 而是一个常驻运行、会自己积累经验的 agent。 它最特别的点不是会调工具,而是会在执行任务后沉淀技能,把成功过的方法总结成可附用的工作流。所以你可以把它理解成一个带学习循环的个人智能体,而不只是一个能回消息的 ai 机器人。 如果你已经用过 open call, 那 最直观的区别不是功能菜单,而是学习方式。 open call 更像消息中加个人工作台, hermes 则更强调把经验沉淀成技能,让他以后越来越像你的做事助手。 说白了, openclaw 解决的是连接和调用, hermes 更往前走一步开始解决。记住和成长, 不是每个人都需要再装一个 hermes, 关键看你想解决的是连接问题还是长期复用问题。如果你只是想把消息工具和模型接起来,现有 openclaw 够用。但如果你想要技能沉淀、迁移和长期自动化, hermes 才真正有意义。 所以别把它当成必须换代,而是把它当成一个更偏长期复利的 a 振的选项。如果你是 windows 新手,最稳的路线不是折腾原生环境,而是先把 ws 二跑通。 先在管理员 power shell 里执行 wsl install, 进到 linux 环境后再跑官方安装脚本,这样依赖和命令链路最稳定。对新手来说,安装主线就记住两个阶段,先把 wsl 二装好,再在 linux 里装 hermes, 别一上来就被环境问题绕晕。 装完 hermes 之后,别急着先折腾花活,先把模型迁移和诊断这三件事走通。 你可以先跑 hermes setup 走向导,再用 hermes cloud migrate 导入 opencloud 的 关键配置,最后再用 hermes doctor 做一次诊断。把这几步走通,你就不只是装好了,而是真正能用起来了。 hermes 真正有价值的,不是让你多一个聊天窗口,而是让重复工作开始自动积累方法。像每日简报、网站监控、自动研究、长期知识整理这类本来就需要反复执行的活,正适合教给它慢慢学会。 所以你装它不是为了今天多省一分钟,而是为了把以后反复做的事,交给一个越用越顺手的 agent 去接管。 hermes agent 不是 人人都必须装,但如果你已经开始认真搭自己的 agent 工作流,它确实值得研究。 尤其是已经用过 openclaw 的 人,更应该把它当成一次判断题,看看你要的是消息中书,还是一个会持续沉淀技能的系统。而对新手来说,别怕,先按 wsl 这条最稳的路线装起来,真正跑通一次,你自然就知道它值不值。

大家好, hermes agent 都用上了吗?觉得怎么样呢?那今天来分享一下我最近使用的十个技巧,比较适配新手。 那第一个就是我们去安装 hermes 的 时候,只要执行这一条命令就行了,但是呢, windows 用户一定要特别注意啊,必须得安装这个 wcl 这个环境,那其实安装也非常方便啊,只要打开你的这个 pro shell, 那输入这个 install 命令就可以了。安装完之后输入这个 wc 要启动,然后再去执行这条命令,那么就 ok 了。那第二个就配置这个主模型啊,那么在 hermes 里面是其实是有主模型和辅助模型的,那我们怎么去配置这个主模型呢?那配置也是非常简单,只要执行 hermes, 然后 model 模型,那么你就可以选择,那第一个是它自己自家这个订阅,第二个是 open rotter, open rotter 非常建议大家使用,这个 open rotter 里面其实有非常多免费的模型,然后的话你就可以等它出来,就是它会先加载一些。就是啊,模型 我们可以拉到最下面啊,就是你可能这个模型不在这里的,你可以拉到最下面,然后对话输入模型的名称啊,输入模型名称点确定, ok, 这样的话你的模型就变成这个应用达这个模型呢,因为我之前已经输入过密钥了,所以他没有提示我输入密钥,比如说我们再看一下他是不是变了, ok, 你 看这个名字是不变了,我问一下, ok 啊,它这个模型是这个,那我们在设置模型的时候有一个小小的问题,比如说我们如果说设置的模型需要输入这个 key, 但是这个 key 其实在它这个终端输入里面我们是看不到的,经常我们复制过去之后看不到这个字母出来, 那你不知道,你可能又复制,导致可能这个命要输错了,那怎么办呢? 那么在这个 hermes 这个啊,目录里面有一个环境的这个配置的文件叫这个点 e n v, 那 么在这个文件里面是保存了所有你配的这个模型的密钥。所如如果说你这个模型调不通,那么你建议你去这个文件里面看一下你的密钥是不是配置的,对不对?那第三个就是啊,配置这个辅助模型,那为什么它会有辅助模型呢? 因为它设置了不同的任务模块啊,比如说这个第一个任务模块叫啊试图就是说啊,你如果发了这个截图啊,给这个 homeys 发了截图,不管你是通过什么聊天工具发了截图的话,如果你专门给它适配了模型,它就会调用这个专门的模型, 那比如说这个外部网页的搜索也是一样的,那么他这边有八个任务都可以去配置不同的模型啊,那这里就会有一个这样的事情呢,就是可能像有一些他是高频的,但是我们不需要那么好的模型去处理,比如说像搜索网页,其实这是这是一个可能是一个 m c p 的 活, 并不需要你这个模型有多厉害,那么你就可以选用一个便宜的模型,那比如说像这种啊,比如说这种记忆类的啊,他要去 总结记忆的,那非常重要,因为记忆和这个技能的这个深层非常依赖于这个模型的能力,不然的话他的这个效果就很差,那么这种时候你就可以去选一个比较好的模型, 还有说这种搜索类的,那么都是比较好的模型,选好一点的模型,所以你可以去根据这个去配置不同的模型,那么你也可以不配置啊,如果不配置的话都会使用默认模型,也就是你配置的那个默认模型,那如果你想配置的话,你可以这么来配置,只要进入对话,然后你告诉他是哪一个任务,比如说请你 这个压缩的啊,辅助模型, 你复制给它就行,就首先你得知道自己这个模型已经配置好了,在我们前面这一步,他这边啊,看到没有,他把 auto 能换成这个,就是我们的这个模型。 第四个就是写好这个 sword, md 啊,就是这个是个灵魂的文件,那这个文件是写什么字呢?就是定义你这个后面字的这个风格 应该写什么呢?比如说你这个性格说话的方式啊,做事的风格,价值观和边界,所以呢这个是非常适合你去定义好,这样的话你的这个后面字就比较有人味了,那么格式你可以这样按这种格式啊,比如说你是谁,你怎么说话,你做事的风格是什么样子的?你遇到问题优先怎么处理 啊?比如说举个例子啊,比如说你现在要做一个这种研究型的 ai 助手,你就把后面字定义成这种助手,那么你可以按这种方式去让它给你去对话,那么你也可以让 ai 去帮你走。比如说你跟后面字已经对话了一段时间了,那么你就可以让它根据我们的对话技术风格 让它去重新设置啊,你的这个灵魂文件,或者说你自己知道叫 so d m d, 那 么直接叫 so d m d, 或者重新设置我的灵魂,它是能识别出来 啊,你这个设置灵魂就是去修改这个 so md, 它会去根据你的对话就去总结你要求的这种风格,因为你跟它对话,你会不断去纠正它的问题嘛,那么它就知道你喜欢什么样的风格啊,就是这个样子,所以这个文件是非常适合大家在刚开始使用时去定义的。去定义好的, 那第五个就要搞懂这个 home md, 这个就是定义了 home md, 这个就是定义了 home md, 就是他是怎么跟你说话,是定义他那 user 点 m d 是 他对你的了解,就是你是用的人,他对你的长期观察,会把这些你的画像,你的习惯,你的偏好,然后落入,然后总结到这个文件里面,所以这个是会被被动形容的,那么你自己也可以去编辑啊。 那 memory md 就是 通过我们长期的对话,他会把这个一些事情总结,就针对事情来总结到这个 md memory md 里面,然后呢,每一次对话都会把这个文件的内容注入到上下文里面去,这样的话他就会记住啊,你曾经喜欢这个,喜欢那个,喜欢,喜欢做什么?喜欢这个事的流程是什么样子的, 那 skill 就 更具体了,就是他对你的对话进行总结之后,发现有些事情是可以啊用流程固化下来的,那么他就他就会固化到这个 skill 的 文这个文件夹里面去形成技能,那么这你的方法就可以被附用,流程就可以被附用了, 那么这种你也可以自己去安装,那么后面字也是可以被动去创建去啊,进行一个修改的。 那 state db 呢?就是你跟它的所有的对话记录全部都保存在这里面,那其实最重要的是这个所有的 md 啊,是去定义你这个 home 字是什么样的人格,那这个文件是我们主动要去维护的,那其他的文件都是 home 字可以自动去处理的,可以不用管。 那第六个就是我们配置这个聊天通道,那么也是非常简单,那我们配置这个聊天通道也是非常简单,只要执行这个 homeis getway setup 就 可以了,那进来之后我们可以看到它支持非常多这样的聊天的通道, 然后的话这边也是飞书钉钉还有企业微信,然后这边的话是可以去配置的,比如说配置这个飞书的话,你可以进来,进来之后,比如说我这边已经配置过了,那我就让他重写。 那这句话是要输入这个 app id, 那 么你如果之前用过 open core 对 接过飞书,那么你肯定创建了很多这样的飞书的应用啊,比如说我们打开这个飞书的应用,就可以看到这样的 app id, 那 我们只要复制过去啊,输进去,然后再把这个密钥 再输过去, 然后再选择飞书啊,我们用的是国内版飞书, 然后就确定,然后不管,那这样就配置好了,那这边的话他有一个这样的一个配对的这个命令,配对的这个码 你可以选择选择之后你你如果说是第一次的话,他是会啊,你跟他对话的话会输,会生成一个这样的配对的密钥啊,你输进去就行了, 那这样就配置就完成了,你就可以去对话了,然后你可以选择,然后让它重启。它目前的话支持基本上主流的这个聊天工具啊,而且飞书的话它支持的这个维度能力的维度都是非常全的,所以说还是比较推荐使用飞书。 那第七个就是我们可以使用这个 homeis doctor 这个功能啊,去做一个全面的检查,看一下我们到底配置上有什么问题,我们可以输入这个,然后它就会去 如果没有问题的他就会打勾,如果有有问题他就会打叉,然后告诉你这个哪一个是啊?有什么具体的问题,那比如说这有个警告,这个有一个 browse 插件没有装好, 就是如果你这边遇到什么问题,你可以先执行这个,然后让他去看一下,检查一下有没有什么问题。那第八个就是 ui, 就 说它本身是有一个这样 ui 的 管理界面,那官方没有做啊,但是社区已经做了一个非常不错的这个 ui 的 界面啊, 然后的话你可以把这个项目 clone 下来,然后去执行这个,然后就可以启动一个这样的 ui 的 这个,呃, homeys 的 这个 ui 的 管理界面,那这边是我启动之后啊,我们可以看到你可以配置很多东西,比如说对话,然后的话配置这个任务, 还有这个搜索这个技能。然后的话这边是啊,一个就是四二点 m d 的 配置,比如说我这个配置就是这样子的,那么你可以直接修改, 然后这边的话是这样的,文件就基本上管理的东西都有,然后这边可以选择模型,所以说是不错的。你如果说不太习惯用终端命令行 t u i 这种方式来管理的话, 你可以把它下载下来,然后部署一下。那第九个是如果你想把 open core 的 东西迁移过来,你可以执行这个命令,执行这个命令的话,可以把 open core 的 一些技能啊,一些记忆啊,这些东西都都带过来,比如说像这个 点 open 空的所有的文件,他都会转移到这边去啊,你可以选择 yes 呢,他就会把它全部转过去了,非常方便的迁移啊。那第十个就是怎么去安装记呢?那么第一种方式就自己去创建,那通过聊天的方式创建,我相信大家这个都已经非常熟悉了。那第二个是在社区里面搜索,那么 homeys 也有自己的这个技能的社区啊,然后它这边也是有非常多这样技能的,大概有四呃,四百多个吧,六百多个,现在已经六百多个了。然后我们可以打开这个技能列表,里面是有这个 build in, 就 说明是它本身就自带了这个技能,那么不是这个标记的,那你就需要去安装了。那安装方式也非常简单, 那只要把链接发送给他,在对话框里面告诉他,让他去安装这个技能就可以了。你也可以去安装 opencircle 里面这个技能啊,也是一样的,复制链接发给他,他就会自动去安装。还有 github 的 技能也是这么安装的, 那这样有了技能之后,那你就能够去用很多这样的,做很多这样的事情了,那么以上十个呢,是我自己总结的一些这些经验啊,希望能够帮助到你,能够更快更好地去使用这个 hems agent。

ok, 朋友们,那最近有个新的 agent 叫做 hermes agent, 在 外网非常的火热,他说你的第一个爱马仕,何必是爱马仕,那么他被人叫做小龙虾的进化版本, 那他跟小龙虾有什么区别呢?今天这个视频我就会讲清楚 hermes agent, 并且会手把手的带你从安装到设置,然后再到使用。那么这次我会使用这个谷歌最新的开源大模型 java, 然后我会把它部署在本地,并且会教会你,然后接入到 hermes 来使用,这样就可以实现 fork 自由。 那我们首先先来讲讲 hermeshermes, 它跟小龙虾的第一个区别就是它能够自我进化,自我学习,会自动生成 skill, 就是 不需要我们去手动创建这个工作流,那么只要你用的越久,它就可以越来越懂你,用起来越来越顺手。那么它具体是怎么实现这个自我进化的呢?这里有两个数字,一个是五,一个是十五。那么首先我们来说一下这个五, 那 hermes 在 完成一个复杂的任务,通常指的是它要进行五次以上的工具调用,它就会自动地把整个工作流沉淀成一个 md 技能文件,之后它下次再遇到类似的任务的时候,它就会直接加载这个 skill, 跳过摸索阶段。 那么如果它在执行过程中发现有更好的方法,它也会自动更新 skill 文件,那么上述这个过程是使用一个叫做 skill manager 的 工具来完成的。 那十五次是什么意思?也就是说他每进行十五次的工具调用,系统会自动停下来回顾刚才发生了什么,找出哪里失败了,然后立即更新自己,这个就是他的闭环自省功能,也就是他越用越强的秘密。所以说五次就是他什么时候记,什么时候创建自己的技能,十五次就是他什么时候反思。这两个是不同的处罚机制, 这就跟我们传统的 skill 编写方式是很不一样的,因为我们知道无论是小龙虾,或者说是 cloud code 或者说 code, 他 们的 skill 都是由人工来编写的,或者说从这个 cloud hub 这种 市场上面下载下来的,他们没有自我生成,也没有自我迭代。那很多人使用小龙虾的时候,还有一个问题,就是觉得他特别笨,比如说今天说的事情,明天就忘了,然后他告诉你我一定会记住,结果第二天他又忘了,那原因就是因为小龙虾的记忆系统不够完善,他只是简单的压缩了上下文。所以说我们会看到很多团队也在做 agent memory 这件事情就是想解决持久化记忆的问题,让 agent 能够永远记住你的信息, 比如说密木林,比如说国内盛大网络的 evermind 等等等等。那 hermes 和 openclaw 它的记忆系统之间有什么区别呢?其实最大的区别就是它们在容量管理上面是完全不一样的。那我们来看一下 hermes 的 三层记忆系统。那第一层叫做绘画记忆, 也就是实时的大拇指的上下文窗口,比如说一百二十八 k, 二百五十六 k, 那 它在绘画结束的时候就会消失,跟我们正常在聊天框使用豆包 deepsea 是 一样的。 那第二层叫做持久化记忆,那这层有两个文件,分别是 memory md 和 user md, 顾名思义和小龙虾的作用是一样的, user md 呢,就是用来收集用户的画像和偏好的,那 memory md 则是用来长期记忆和经验沉淀的。 但是在小龙虾里面,这两个文件的容量默认是两万个字符,那么超出之后它就靠上下文压缩,把旧的对话内容给压短。但是问题就是说压缩之后会导致信息丢失或者变形。 而 hermes 的 memory dmd 里面只有两千两百个字母, user dmd 里面只有一千三百七十五个字母,它的容量是小下的十分之一,那它为什么要设计的这么短呢?其实这是一个团队的设计哲学,就说团队他故意把容量做的非常小,迫使这个 agent 主动去提炼,去重合。并 不够用了的话,那就必须先整理旧的才能添加新的,那容量满了的话,不是压缩,而是主动侧展。那 creation 也是刚才说的主动侧展,和我们之前说的压缩 compression 有 什么区别呢?压缩是把所有的东西硬塞进去,然后变短,变紧凑,但是内容它会变形,会丢失,会失帧。而侧展它是主动的去筛选, 判断什么重要,什么不重要,什么可以合并,什么该删除掉。那么 hermes 他 走的就是这条路线,所以说虽然他的记忆非常的小,但是他每一句话都是有用的。那 hermes 的 记忆系统第三层就是全量历史解锁,他会把所有的历史对话放在 s q l lite 数据库里面,如果说他需要查找历史数据的时候,他就会使用关键词查找匹配,然后 找到这个片段之后再使用大模型整理材料,最后返回给我们,而不是说跟小龙虾一样使用向量解锁。那我们先说说关键词查找匹配,那这个就很简单,就类似我们的 ctrl 加 f 搜索什么关键字,它就匹配什么。 那在 hermes 里面,它就会根据关键字去搜索相关的段落,然后让大模型去整体的理解这段话什么意思,理解完之后再返回一段材料给到你。 那我们举个例子,比如说现在我给这个 agent 说,之前上周我们讨论过一个三个月的学习计划,来提高我的这个英语口语和表达能力,你去帮我找找那个计划具体是怎么样的,然后再给我说一下,那他就会执行下面这几个操作。首先他会去搜索关键词学习计划,三个月提升英语表达,然后找到这些文本片段之后,大模型会整体的理解上下文,然后再返回一段摘要给到我们。 那什么是向量解锁呢?向量解锁它就是把文字转换成数字,我们知道计算机它存储的是零一系列,对吧?它是存储不了文字的,所以说在存储的过程中, 它会把文字转换成像量,那向量解锁就是通过比较数字间的距离来找相似的内容。比如说现在有句话叫做猫在沙发上睡觉,转换成像量可能就是零点八二、零点一五、零点三三。 那还有另外一句话,就说一只猫咪握在沙发上转换成向量,可能就变成了零点八一、零点一六、零点三四。虽然说这两句话的字是不一样的,但是它们的语义是非常类似,都是猫在沙发上,对吧?那所以说它们在向量空间上面的距离是十分接近的,那 ai 就 能够理解它们是同一个东西。 向量接收的好处就是能够理解语义,但代价是需要你额外的向向量数据库来存在,向量存储成本会更高,并且还需要一个迭代模型。 那我们还知道养小龙虾呀,是一个非常烧 token 的 事情,因为它真的太耗钱了,那 hermes 就 能很好的解决这个问题。那为什么养小龙虾非常的浪费?这个 token 就是 在于这个系统提示词的加载方式。那首先我们说一下什么是系统提示词, 我们知道当我们和 agent 对 话的时候, agent 收到的并不仅仅是你的问题,而是系统提示词加上记文件,加上当前的对话,就等于 agent 看到的完整上下文。 那系统提示词里面包含了什么呢?比如说 agent 是 谁?他应该怎么工作,记住什么信息,也就是我们理解的 so 点 md, user 点 md, 正题题点 md 这些文件。那对于小龙虾来说,他每次会画会重新加载这些上下文,然后对话开始的时候,他读去所有的记忆文件,然后拼接之后注入上下文。那么 lama 在 处理上下文的时候,他会把之前遇到的内容缓存起来,然后来加速处理这个缓存,命中 token 的 价格是最便宜的,那如果说上下文内容在一直改变,对吧?那我们前面的缓存就会失效, 因为缓存是按照顺序来存取的,你前面如果变了,后面存的再多的缓存都没用了,接下来全部从头来过,它不是增量改变的,而是全部推倒重来。 而且还有个现象就是我们知道现在市面上很多中转站,对吧?那你会看到很多这种垃圾中转站为什么都可以用的这么快?原因之一就是因为它不让你去命中缓存,全部给你用最贵的消耗方式。那我们看 hermes 它是怎么做的? hermes 它完全不一样,它会在绘画开始的时候执行一个操作,叫做 frozen snapshot 冻结快照,他会把当前所有的记忆文件等等等等上下文全部读起之后锁定,然后注入到上下文里面去。那在绘画进行的过程中呢?如果说这些文件被修改了,他直接不管, 他继续使用锁定的版本,等这次绘画结束之后,他才会把这个修改写入文件,然后在下一个绘画开始的时候,他会读取最新的版本。那这样做有什么好处呢?首先第一点,最显而易见的就是可以保持前缀的缓存命中性能更好,并且更节约前。第二点,他可以避免 a 键在绘画中途修改记忆导致人格飘逸的问题。 那什么是人格漂移问题呢?打个比方,就像现在我们正在写一篇论文,那假如说我们现在写第一章,并且已经把所有的参考论文文献全部找好了,那我们在写的过程中,我们就一边看一边写,对吧?那现在这时候有个人跑过来跟你说,参考文献更新了,你需要加一篇新的,然后再删除一篇旧的, 那你是不是想把这个给红出去?因为你论文写到一半,参考文献给我改了,那这不是捣乱吗?所以说如果说你修改的话,你的逻辑就已经不值价了,这个论证链条就会受到影响。那 herb 的 说法就是你不用管,你就用旧的参考文献来完成第一章的章节,然后在进入第二章之前,你再去拿最新版本的参考文献。这样的好处就是第一章的论证逻辑是稳定一致的,不会因为中途文献的增加修改而改变。 那上面我说的这几点呢?就是 hermes 和小龙虾的最主要的差别。那简单来说,小龙虾就像是一本人工维护的笔记本,你说什么,然后就记什么,满了之后我们就压缩。但是 hermes 呢?它更像是一个自动整理的一个档案系统, 它自己会判断价值不够了,会主动合并,并且会把做过的事情变成一个可以用的技能,这也是它为什么越用越聪明的原因。现在我们就开始安装设置这个 hermes, 然后本地部署 java 这个大模型,并且把两者打通。 那现在我们来安装欧拉玛。欧拉玛是什么东西呢?简单来说,欧拉玛它是一个本地的大圆模型运行器,我们知道所有的大圆模型,它可能参数不同,启动方式不同,那是不是很不方便我们去使用,因为他们没有一个统一的标准。那欧拉玛就做了一件事情,他把常见的这些模型全部包装成了统一的重格,使得我们去很方便的调用切换,所以说它是一个统一的包装层。 那如何安装欧拉曼呢?也非常简单,我们只需要打开他的官网,那么来到他的首页,我们点击 download, ok, 那 可以看到这里,他让我们选择三个系统,我们选择我们的 micros, enix 和 windows, 那 这里我是 micros, 那 我就选择 micros。 那 大家如果是 windows, 我 们就点一下, 然后把这个命令复制终端里面去运行就好了。那,那如果说你发现你在终端运行这个命令是失败的,那我们也可以选择下载它的这个 app 形式,那这里我就选择在终端安装,那我复制这条命令, 打开 terminal, 然后粘贴上去,然后回车。那大家注意,如果说你使用终端安装的话,你最好把你的这个魔法开成 t u n 全剧模式, ok, 那 安装好了之后,它就是这样一个界面,那现在我们来继续安装 java for, 然后把它部署到我们的本地上面。那很简单,我们点击这个 models, 然后这里我们就选择我们的贾玛 four, 然后点进来之后,我们可以看到它这里给了模型的好几个版本,一二币、一四币、二十六币、三十一币和三十一币 cloud。 ok, 那 现在你可能会问,那我怎么知道我该下载哪一个模型呢?那这里给大家推荐一个网站,叫做 what models。 打开这个网站呢,我们只用在这里选择我们的这个 gpu 是 什么, 比如说你是英伟达的,你是 amd 的, 或者你是苹果的,好吧,选择你的 gpu, 这里有五零七零,五零六零,然后比如说你是英伟达的 四零九零,你就可以看到你能跑的很好的模型有哪些,对吧?然后你一直往下拉,基本上可以升了很多模型了,那就是说你跑的有点吃力的啊,这个就是你完全跑不了的, 所以说大家可以根据自己这个显卡的配置去选择,那我们回来安装,那我在这里的话就选择安装这个一四 b 的 版本就好了,然后因为一二 b 确实太蠢了,二十六 b 的 话,我目前这个笔记本是有点吃力,所以说我选择这个一四 b 的 版本就好了。 那安装这个模型非常简单,我们把它的名字复制一下,然后我们打开终端,我们输入欧拉玛库,然后粘贴它的模型名字,然后回车等等,等待它安装就好了。 ok, 那 可以看到现在我们就安装好了,那我们输入欧拉玛 list, 就 会看到我们现在本地安装了哪些模型。 可以看到我们这里本地安装了一个 java 一 四 b 的 版本,然后这个 size 的 话是九点六。那现在我们来测试一下 java 的 多模态信息处理能力,我们可以看到我给了他一张图片和一段文字,可以看到他思考了三十一秒时间, 那现在我们看看他在处理开放问题的时候表现怎么样。现在我给了他一个问题,现在 ai 什么都会做了,那我们普通人应该怎么做?普通人该怎么才能保证自己不会被 ai 淘汰?给我详细分析一下, 可以看到他思考了四十五秒钟时间,然后生成了这么长的回答,并且说的还是挺有道理的。那现在我们来安装一下 hermes agent, 那 安装也非常简单,我们打开它官网,然后复制一下这个命令, 我们打开终端粘贴回车,等待它安装就好了。可以看到他先会看我们一些必要的包有没有,没有的话就给你安装,有的话就直接跳过, ok, 那 现在我们看到他已经把所有的依赖全部安装完成了,然后的话他开始了这个安装向导,然后他检测到了我们已经安装到了 open class 小 龙虾,然后他开始问说你是否想看看有没有什么可以导入的?那我们选择 yes, ok, 那 现在我们看到他在问我们要不要把 open class 的 这个配置牵引过来,然后他给出了一个预览界面, 那如果说你觉得你的这个小龙虾调教的非常好,你可以直接把它牵引过来,那这里我有了演示,我就直接选择 no, 不 牵引过来。 然后现在我们来到了配置界面,那这里我们直接选择快速配置就好,然后这里它就让我们选择你要使用哪个大模型呢?那我们可以看到你可以使用 gemine, 可以 使用 srappik, 可以 使用 openend codex, 可以 使用千万,对吧?可以使用 gitopilot, 也可以使用 hackbase 上面自己下载的这个大模型。 那刚才因为我们已经在本地上面部署了 java for, 所以 说这里我们选择 modividers, 然后进来之后我们可以观察到它多出了更多选项,比如说有智普的,有 kimi 的, 有 mini max 的, 有 kilo, 有 open code 的 等等等等。 那因为我们要选择本地部署大模型,所以说这里我们选择 custom endpoint 就 好,那在这里我们填写我们的 base url, 默认就是这个,大家记住就好,然后复制粘贴,然后这里他们选择填写这个 a j i key, 那 我们直接跳过就好,然后这里他们填写模型的名称,那我们就用填写刚才下载好的模型名称就好了。那这里是加码 four, 那 是 e c b 的 版本,这里他们选择上下文的长度,那我们直接回车默认检测就好。然后现在他们选择是否要进入聊天平台,那我们选择设置就好。 大家可以选择我们要接触聊天平台,比如说飞书,微信, telegraph, discord 都可以,那这里我们选一个菜单,那我们选微信,然后我们回车。先第一步它让我们设置我们的 telegraph, 那 我们只用找到这个 boat father, 创建一个新的 boat, 然后把 token 复制过来就好。 然后这里咱们选择谁能给这个 bug 发消息,那这里大家一定要好好选择,因为说如果你什么都不捡的话,那他就会默认所有人都给他发消息,并且他会回复。那这里我们只用填写我们自己的 user id, 如何获取你的 user id 呢?大家关注这个 bug, 然后给他发一条消息,他就会把你的信息返回过来。这里上我们选择是否要把我们的 user id 作为默认频道,那我们选择 yes, 然后现在他开始让我们选择登录微信了,那我们选择 yes, 把这个链接复制浏览器打开,扫描二维码登录 这里他让我们配置谁可以给这个 boss 发消息就私发消息。那第一个选项就是手动批准,第二个选项就是允许所有的私发消息,第三个选项就是只允许白名单,第四个选项就是谁都不能给我发,那我选择第一个选项就好。 然后这里他让我们配置谁可以建立群聊,然后发消息,他怎么处理群里面的消息?那有三个选项,第一个就是不允许群聊,第二个是允许所有的群聊,第三个就是只允许白名单里面的群聊,那选推荐选项就好, 然后这里他们选择是否要把我们的微信平台作为默认屏,那我们选择 yes, 现在我们已经全部配置好了,然后他问我们是否需要重启网关,那我们选择 yes。 现在配置完成后,他问我们是否需要立即启动,那我们选择 yes, 那 现在我们来接入微信使用,那我们可以看到因为它需要手动授权,所以说那我们在终端运行下这个命令就好。 ok, 那 这里显示已经授权成功了,我们再给他发消息试一下,我们可以看到它这里显示对方正在输入中给出了回复,那我们可以成功使用了。那刚才我们是使用本地部署的模型,那大家如果想切换和云端的话,那也非常简单,我们只用在终端输入这行命令。 hermes model, 然后在这里大家就可以自由切换了。那如果说这里找不到你想要的模型,那大家就可以自由切换了。 那在这里我选择 mini max china, 然后配置一下我们的 api key, 那 接下来配置我们的 base layer, 我 们把它复制过来,然后粘贴。那大家注意一个点,就说如果这里你不是点 com 结尾,而是点 i o 结尾,那就是配置到海外去了,所以说要保证你是点 com 结尾。 然后大家选择自己想要的模型,那我就选择二点七,那现在我们来测试一下。那如果说我们想要启动终端的聊天界面也很简单,我们输入 hermes chat, 我们给他打个招呼, 可以看到我们已经成功替换好的模型。朋友们,那这就是本期视频的全部内容,我是 jerry, 我 们下次再见。