a 针的模型建议先用 openroute 一 p i key。 第二步,选一个默认模型,先不要同时改太多参数。第三步,配置 provider, 让 harms a 卷的请求能稳定发出去,跑通以后再考虑速度成本质量 及 provider routing。 关键不是一开始选最强模型,而是先让链路稳定输出。整理了 openroute 配置教程,可以按清单走。
粉丝4510获赞14.3万

哈哈哈,你知道 hermes 切换模型有多容易吗?在咱们网页端的右上角,我才发现这里你之前安装过的所有模型都在里面,像小米、百联、英伟达、 deepsea, 英伟达里面的一个 api 可以 使用快七十个模型, 真是牛啊,点击一键切换,记得一定要点击大局持久化,否则的话就只会应用在一次对话里面。

大家好,我是麦东。很多朋友吐槽 hermes 自带的网页界面没有对话功能,界面也不好看。我去 github 上翻了一圈,找到一个大佬写的第三方面板,叫 hermes web ui, 实测下来确实比官方自带的 ui 要好用一些。 这个面板基本上把 hermes 的 所有功能都搬到了网页上,像模型配置、定时任务、渠道管理,全部都能在浏览器里操作,不用再去改配置文件了。安装非常简单,只需要在命令行执行 npm store 杠 g hermes web ui 就 可以了。 安装完成后,只需要运行 hermes web ui start 就 跑起, 服务启动完成后会自动打开网页界面。下面我们就来看最基础的聊天功能,这个就是非常多的朋友想要的,能够在网页上和 hermes 直接进行聊天。而且你的 hermes 本身通过 profile 创建了多个智能体,我们还可以直接在左下角进行智能体的切换,切换完成之后,相应的绘画界面也会随之刷新。 除了切换用户之外,你在系统里面配置的模型也可以在这边自主进行切换。另外, hermes web ui 还有一个比较有意思的群聊功能,我们可以通过创建群聊,把多个 agent 拉到一个房间里面,在群聊里面可以通过艾特方式指定某个智能题给你回复。下面我们演示一下这个比较有意思的功能, 点击新建群聊,输入你的群聊昵称以及房间名称, 点击创建房间。创建完成之后,在右上角我们可以点击加号添加智能体,在这边可以选择不同的 profile, 将它们加入群聊。我们首先将 default 加入群聊,再添加一个 coder 或者编程助手, 下面我们来尝试一下在群聊里面艾特它们,跟它们进行对话。我们同时艾特两个智能体,让它们介绍一下自己, 可以看到两个智能体分别都给了我回复,这个还是比我们在命令行里面操作要方便很多。当我们想跟不同职责的智能体进行对话的时候,我们不需要去不停地切换 profile 了,直接在这个网页群聊里面去艾特它们就可以了。 当然了,如果你已经将这些智能体接入到了实时通讯工具里面去,那么也是一样的体验效果。下面我们接着往下看。 搜索功能就是对绘画的解锁,解锁到相应绘画之后,我们可以直接点击进入当前绘画,接着跟智能体继续往下聊。任务功能则是管理我们 hermes 里面的定时任务,我们可以在这边去创建定时任务,也可以对已有的定时任务进行管理。 频道功能则是用来对接各个实时通讯平台的,目前内置了八个平台,我们国内常用的通讯工具在这边也进行了集成。他这边比较方便的一个点是每个平台相关的配置参数都可以直接在网页上配,改完他会自动重启消息。网关 技能菜单可以查看你当前智能底下所有的 skills, 并且可以对这些技能进行开关。记忆菜单则是对你当前用户的所有点 md 以及 memory md 的 一些管理,我们可以在页面上直接对这些文件进行编辑。 模型管理也做得比较完善,我们可以直接在页面上去添加相应的模型,配置模型的时候,也可以在页面上看到相应的 api key, 这个对很多新手朋友来讲还是非常友好的。之前我们讲 hermes 模型配置的时候,很多朋友在配置完模型之后去跟 hermes 进行对话,都提示四零幺,基本上都是因为 api 可以 配置错误了。 除此之外,我们还可以在页面上看到 hermes 的 一些日制,看到你当前 token 的 一些使用情况。工具这边还提供了终端功能,你可以在这边直接输入相应的命令,跟你打开命令行输入是一样的。 除此之外还有文件管理功能,你可以在页面上直接对文件进行编辑查看,或者是下载上传都是可以的。再往下看网关这边则是管理我们的消息网关的,也就是管 harmis 跟外部的一些通讯平台通讯的。这边提供的功能比较简单,我们可以对某个 profile 的 网关做停止开启操作, 不需要再去命令行里面敲命令执行了。再往下是用户菜单,用户其实就是我们讲的智能题,看过我前两期视频的朋友应该知道,当时的这几个智能题都是我使用在命令行通过敲命令的方式去创建的。而现在我们可以直接在页面上点击创建配置, 就可以非常快速的去创建新的智能体了,并且创建智能体的时候同样可以使用克隆功能,还是非常非常方便的。最后一个菜单设置,设置里面我们可以给当前的 hermes 网页设置一个密码登录,可以配置当前网页的一些显示主题 配置我们跟 ai 对 话时候的一些显示信息,比如流质响应、推理过程、显示费用等等。除此之外,还有对智能体记忆、绘画、隐私的一些设置,这些配置都比较好理解,我们就不一一去讲了。不过最后这个模型我们还是要跟大家去说一下, 这个地方我们可以修改当前已经添加进来的模型的 api key。 大家应该有注意到,刚刚在配置模型的时候,对于已经存在的模型,我们是没有办法对它进行编辑的,那么如果你模型的 api key 发生了变更,我们就可以在设置这边对其进行调整 好了。 hermes web ui 完整的功能介绍到这边就差不多了,关于 hermes web ui 的 一些基础英文命令,我这边整理了一个手册分享给大家,希望对大家有帮助。总的来说,如果你觉得 hermes 原声界面不够用, hermes web ui 是 我目前找到的最完整的第三方面板, 像渠道管理、模型配置、使用统计这些高频操作全部搬到了网页上,对于新手小白来讲还是非常友好的。大家目前都在使用什么 hermes 的 面板呢? 体验怎么样?欢迎大家在评论区聊聊。工具会变,但方法更重要,我是麦冬,下条继续。

今天这款 home 软件,小白也能一分钟极速搞定,没错,不用手动改代码,不用反复调参数,还在为复杂的软件安装步骤头大,双击安装包,跟着提示点下一步,全程傻瓜式操作, 眨眼功夫就能完成安装。焊配置安装完成直接用 正面简洁明的功能一目了然,新手也能秒上手,告别繁琐,拒绝折腾,一分钟拥有高效办公神器,还等什么,赶紧跟着视频试试吧! 这里就是开始配置参数,都是图形好设计,直接点继续大模型配置界面可以接入本地大模型,也可以是 pi 形式,如果列表没有,就选择 custom open ai compatible 自定义模型,输入了 pikey 还访问地址。我用的是小米大模型,直接粘贴复制了 工作区,可以修改或者默认都可,但是默认模型必须修改为你自己厂商的模型名称, 根据自己需要一般跳过即可。这就完成了所有参数设置,接下来就可以尽情享用吧! 演示一个连接微信教程,点击连接找到连接微信,点击配置, 再点击获取二维码,然后用手机扫码即可。 再点击测试连接即可。用微信发消息回复一个验证码,直接发给大模型即可。配对成功或者告诉黑莓所不需要验证码验证配置,直接修改为不需要验证码验证即可。连接 小伙伴们赶紧入群下载安装包吧!群里有下载链接地址。

兄弟们,这个 hammer's agent 安装,然后就是这条命令安装,安装完之后,如果你以后有更新的话,输这条命令进行更新,然后配置模型,选择 hammer's mode, 然后选择最后一个自定义, 哎,最后一个好,这个 custom endpoint, 然后拍回车,这个时候输入你的 bios 一 二 l。 bios 一 二 l 是 哪个呢? 是这个,我是本地部属的,所以呢,我就是复制这个地址,复制一下 过来粘贴, come on the v 回车,然后我的 k, k 是 sk 杠,一二三四五六,这个 k 就是 全局设置这个地方设置的 k 或者是这个, 然后你要加载你的模型啊,你看我这边已经加载了, ok, 我 就选择第三个灰灰,输入三回车上下文大小回车, 然后名字叫灰灰灰车, ok, 然后在这个微信 bot 里面,我说你现在是什么模型,他就回答我了,是这个模型, ok。

今天是我们小龙虾养成日记的赫默斯安装和本地欧拉玛部署的配置,赫默斯大家现在称他为爱马仕,和小龙虾一样是一个智能体,作为智能体的大脑,他可以连接我们本地的欧拉玛,实现指令接收,思考决策工具,调用 最后一个结果输出的全连录本地化壁环,完美解决头肯网络以及隐私的问题。我们今天直接演示一下如何安装以及配置,进行一个实操演练。首先我们准备的环境,我们今天使用马克来进行安装, 当然 windows 和 linux 也是支持的欧拉玛本地部署,这个其实我们前面讲过,已经是比较基础的内容了,我们可以直接到欧拉玛的官网, 这就是欧拉玛的官网,点击这个下载,我们就可以直接选择自己的系统进行下载完之后就可以了,在 mark 上下载。欧拉玛安装完成之后 是带一个终端的,就是我们可以直接使用,比如我们这里有个本地的已经部署的千万三四 b 的 一个小模型, 我们直接可以问大家,比如说你好,他很快就会给我们一个回复,因为我刚才发过你好了,他这个是有记忆功能的,这就是欧莱玛的一个安装。 当然如果安装完之后呢,我们我们可以通过命令行来看到我们的欧拉曼的版本,我们现在装的是零点二零的版本,零点十九之后的版本是进行优化过的。面对 mark 系统运行的更快,我们再回到我们这个文文章中, 这就是我们欧拉玛的安装,安装完成之后,我们可以本地的拉取我们一些模型,这是我平常拉取过的,有的也没有删除,这个我们可以在欧拉玛的命令行中直接可以看到,直接拎死他一下就可以看到我们已经安装过的 所有的这些模型。欧拉玛的安装我们其实是相对比较简单的一个,我们下面可以看一下我们赫默斯爱马仕的安装,这个安装其实现在也是非常容易,就这么一条质量就可以了, 我们可以看到这是爱马仕的一个其他的网站,在这上面有详细的介绍,其他的源码,他是开源的,这里我们可以看到他同样是一条指令安装也可以,我们下面进入安装过程。 好,现在我们已经安装完成了,我们安装完成之后可以通过赫默斯沃审看到我们当前的版本,我们当前是零点九点零的版本,四月十三号的 python 是 三点十二,这些都是自动安装的,其实我们的这个赫默斯爱马仕已经安装完成了,你们可以看到我们这个是版本已经安装完成了, 下面我们要进行一个模型的一个配置,我们这个配置我们刚才安装的欧拉玛的模型在进行配置上,我们可以演示一下配置的过程,直接就是 hermes mod, hermes mod 之后呢我们可以看到这里面有一个列表, 我们可以用上下键选选择,我们这选到 custom, 我 们点击回车,这个时候需要我们输入一个地址,这个地址我们就输入我们奥拉玛的地址,奥拉玛的地址就这个默认的这个地址和端口,我们不需要改它,我们直接给它复制过来, 这个后边加一个 v e, 因为是聊天的,这个时候我们要说 k, 这个 k 我 们随机的就可以,没有关系。 这个时候他会列出我们欧拉玛里面已经拉取过的这些模型,我们这里面选一个我们使用的就行,比如我们的千万三四 b, 在 这里它是一个六, 我们直接输一个数字六就行了。我们选择完模型之后是一个上下文的长度,这个长度我们就要手动输一个,输个六十五 k, 大家记住这个地方长度,他的爱马仕的要求最少是六十四 k, 我们可以稍微输大一点,没有关系,如果我们不输,默认可能是一个四 k, 我 们就没有办法去使用,调用的时候就有问题,这个地方记住我们输比这个四 k 大 一些,这个时候我们再输一个显示的名字,我们就叫前文三,嗯,三 四 b, 这时候我们这个模型就就已经配置完成了。回到这个文章里边,就 当我们的模型配置完成之后,我们就可以启动我们的核模式了,就是我们一个 ai 的 本地运行,我们验收一下看它怎么样,我们直接启动我们输入核模式,哎,我们可以看到这个时候已经启动了核模式, 这是一个界面,我们当前的模型是千万三四 b, 就 我们刚才创建的这里有一个基本的介绍,他的一个吐司, 他的一个 skills 都在这里,现在有二十八个图纸,有七十九个 skills 是 可以使用的。 我们先先运行一下,看这个模型有没有成功,我们给他一条指令,那用 python 写一个代码,看看这个函数的运行情况,看一看我们这个爱马仕的运行情况,我们把这个指令贴在这里,直接回车,我们现在等一等, 我们看到现在我们这个爱马仕已经运行完了,我们给他一个指令,让他写一个函数,并且解释这个函数的代码逻辑,这里写了一个函数,有一个逻辑的介绍,你们可以看他运行的还是非常好的。 好了,这就是今天给大家介绍的爱马仕赫曼斯的安装以及欧拉玛的配置,更多内容我们下一期再见。

大家好,我是麦东。前面几期我们讲了 hermes 的 子任务,多平台接入这些功能。这期来解决一个很多人遇到的问题, 就是给 hermes 发图片,他看不懂。在讲怎么配置之前,我们先来说一个技术概念, ai 模型能处理的内容类型决定了他能干什么。有些模型只能处理文字,叫纯文本模型。有些模型能同时处理文字、图片甚至语音视频,这类就叫多模态模型。 国内主流模型里支持多模态的有千问、 kimi、 豆包、 mini max 等等。如果你使用的是这些模型,大概率你的 hermes 理解图片是没有任何问题的。当然这里面 mini max 比较特殊,在 hermes 里使用它的图片理解能力需要单独进行配置。这个我们放在本期视频的后半部分来讲, 当然也有一些纯文本模型,比如最新发布的 deepsea v 四,当前版本就仅支持文本输入。搞清楚这个之后,就应该能理解为什么 hermes 看不懂图片了,因为它的大脑,也就是模型本身就不具备读取图片的能力。那么有没有办法在使用纯文本模型的同时,也让 hermes 看懂图片呢? 当然有, hermes 针对图片理解有一个单独的配置,可以把看图这件事情交给一个专门的辅助模型处理,跟你的主模型是分开的。下面我们来看一下这个配置应该怎么开启。大家可以看到我现在使用的主模型是 deepsea v 四 flash, 它当前是一个纯文本模型,本身不支持看图,我们可以来试一下,将这张小猫的图片发给他,问问他图片里面是什么, 可以看到它只能分析出我当前这张图片的一些属性,但是完全不知道图片里面是什么。好,现在我们再来配置一个支持看图的辅助模型。 我们需要提前准备三个东西,第一个是 bash url, 第二个是 api key, 第三个是 model。 相应的三个参数大家可以去对应的模型厂商控制台里面寻找即可。 这边有一点需要提醒一下, hermes 单独配置的图片理解模型必须是要能够支持 open ai 格式的,所以在填写 base u r 二的时候大家要格外注意。下面我们按 ctrl c 退出对话界面,将我们准备好的三条命令输入按下回车。好了,设置完成。下面我们重新打开 hermes 的 对话界面, 使用 hermes 杠 c 恢复上一次的绘画。下面我们再次将同样的图片发给 hermes, 这次他就能够看懂我们的图片了。接下来再来说一下 mini max 的 情况, mini max 比较特殊,它使用图片理解需要单独调用 m c p, 或者是通过命令行工具来实现。我们在 mini max 的 官方文档也可以看到相应的介绍。 mini max 的 token plan 提供了一个 understand image 的 m c p, 支持对图片进行理解和分析,同时支持多种图片输入方式。此外,官方文档还推荐使用 mini max 的 c l i 来代替 m c p, 配置更简单,使用也更高效。 下面我们就来跟大家一起配置 hermes 使用 mini max, 并且将 mini max c l i 也装上,测试一下它的图片理解能力。我们先回到命令行,将刚刚配置好的辅助模型全部清掉。 ok, 接下来输入 hermes model 配置,接入 minimax。 minimax 的 provider 有 两个,我们选择敲 in 的 这个按下回车。接下来输入 minimax api key, 大家自行在 minimax 控制台获取即可。 输入完成,按下回车。第二步输入 bios u r l, 这边不需要修改任何内容,直接按回车。第三步就开始让我们选择模型了,这边我们选一个 mini max, 二点七按下回车, ok, mini max 模型配置好了,我们进入 hermes 的 对话界面, 在这边也可以看到我们当前使用的模型已经由 dbix 切换为了 mini max。 下面我们同样先测试一下当前状态下它的图片理解能力, 可以看到它尝试了很多种方式去读取我们的图片,但是最终都没有成功。下面我们先给它装上 minimax c l i, 然后再来测试一下。我们回到 minimax 的 官网,点击 minimax c l i, 在 这边可以看到安装方式,直接复制该提示词并替换里面的密钥,将其发送给 hermes, 它就会自动进行安装了。下面我们来尝试一下, ok, 已经安装好了,我们再来试一下。好了,结果出来了,可以看到 hermes 在 经过一番尝试之后,识别到了 mini max c l i 工具,它有微信功能,使用这个工具识别了该图片。到这一步,我们 mini max 的 图片理解功能就已经算是搞定了, 当然不要忘记跟你的 hermes 说,以后涉及到图片理解的场景,一律使用 mini max c l i 的 微型功能,并且将这件事情放到它的 memory 点 m d 里面。好了,本期视频到这边就结束了,工具会变,但方法更重要,我是麦冬,下条继续。

hello, 大家好,我是阿亮。最近 hermes agent 特别火,不少人问我它和 openclaw 有 什么区别,我实测下来最明显的是两点, openclaw 的 技能要靠我们手动的编辑调优,而 hermes 可以 自我进化,越用越懂你, 可以说是更适合我们人类的使用习惯。其次是 hermes 比 open call 记得更准更详细的区别。大家可以看我上一期的视频,本期呢,教大家如何安装 hermes agent, 如何接入个人的微信以及如何配置模型, 整个过程呢?我也整理到了这份中文的操作手册里,如果你需要呢,我也可以发给你。模型的话,我们选的是 kimi 刚出的 k 二点六,因为 k 二点六的工具调用能力,长时间任务的执行能力呢,都很优秀。 hermes 搭配 k 二点六,整体体验非常的丝滑。先介绍 windows 的 安装,然后呢再介绍苹果的安装。 windows 安装分两步,第一步是安装 wsl, 第二步是安装 hermes 复制这行代码到终端,安装的过程比较久,耐心等一下。安装好之后提示呢,设置用户名和密码,用户名呢就使用默认回车输入密码, 注意界面呢,是不会显示这个密码的,设置完之后呢,二次确认即可。接下来复制这个代码呢,安装无伴兔,输入刚才设置的密码回车,安装好之后再复制这行代码,回车 到这里环境就配置好了,接下来我们安装 hermes 复制这个命令到终端,等待一段时间,画面是这样的,回车开始。下一步到了配置模型阶段,选择更多供应商,选择 kimi, 然后来到 kimi 的 官网,点击控制台,新建 api k, 输入名称,新建复制 api k, 再回到终端粘贴回车,选择这个自定义,输入 kimi 二点六。 所以我们打开 hermes, 看到这里显示 kimi 二点六的模型,给他发一条消息,有回复就证明安装好了。 苹果电脑的安装更简单,把这行代码复制到终端回车,然后等几分钟就搞定了。模型的配置呢,和 windows 的 一样,大家可以调到 windows 后面那部分去看如何配置模型。同样是选择 kimi 的 二点六,按照文档一步一步就能安装完成。 安装了 hermes 之后呢,很多人关心 oppo 的 那些配置,以及他的记忆 skill 能不能迁移到 hermes, 接下来我教大家如何迁移。 首先直接在 hermes 的 聊天框输入这个代码,这个是 hermes 内置的迁移龙虾的代码。但如果是 windows 电脑呢, hermes 可能会提示没有找到龙虾的文件啊,这是因为 windows 系统,它的 hermes 呢,其实是装到了虚拟机里面,我们需要让 hermes 跳出虚拟环境 啊,到本地电脑里去找龙虾的记忆,可以这样处理,让龙虾把它的记忆和它的 style 的 地址呢告诉我们,然后让 hermes 复制一份并迁移过来。稍等一会儿,迁移完成了,我们来测试一下,问一下它叫什么,可以看见它正在读取龙虾的记忆 出来的名字呢,和龙虾那边配置的一样,就证明迁移成功了。接下来教大家把 hermes 接入到个人的微信, 我就以 windows 为例演示,不想看视频的大家可以按照文档一步一步接入,打开一个终端,输入 wsl, 然后输入这个代码, 选择微信输入外进行下一步。然后呢,出现了一个链接,复制到浏览器打开。我们用微信呢扫一下出现的这个二维码,然后都选择默认的配置输入外,选择默认设置再输入外,然后分别输入这个和这个。 接下来先打开一个终端,打开 hermes, 然后微信给他发一条消息,把这个代码在旧的终端那里呢发给他,然后再发一条消息,有回复就代表呢微信已经接入成功了。 再来看一个实用的场景,我直接在微信里给 hermes 下达指令,让他围绕新能源这个主题,先搭建一版七页 ppt 的 完整骨架,把需求文件发过去,他很快就给出了清晰的框架摘要。 接着我再上传页面的内容补充文件,让他基于股价股旗副标题核心的内容。他不仅准确的提取了文件的关键数据,还主动给出了下一步的执行方向。我选定方向后,他直接在微信里回传了 ppt 的 出稿基本信息,排版分区全部呢都到位。 最后呢,我给到视觉的优化要求,他立刻说出了更精致的中版,有柱状图、折线图,排版布局和色彩搭配都有了明显的提升。 不过这个也是因为呢, k 二点六模型有着较强的上下文理解和比较优秀的审美能力。 ppt 做完,重点来了,我让 hermes 把整套流程分装成可附用的技能,之后只需要输入主题资料,就能一键生成 ppt。 哎,很快他就提示呢,技能呢分装完成了,接下来我们直接的测一下这个技能,看看他到底能不能工作。我就给他一份连锁咖啡门店的复盘报告, 他自动读取了文件,调用了技能,完全复刻了之前的三步运行逻辑出来的成果。结构呢,很完整,逻辑也很清晰。最后来看一个更进阶的玩法,我给他一份社区图书馆空间使用指南的知识库,让他调用这个技能回答我这个问题。 一开始呢,他的回答很基础,我立马给了他优化的意见,明确要求固定结构,合并需求的判断更贴合助手身份。你们看啊,他很快就迭代了回复结构,统一精准,抓学习讨论核心需求,还补充了注意事项和替代方案, 关键是自动更新了技能文件和知识库。我再跑一遍同样的问题,他全程的按照优化后的逻辑,然后再跑出来的。整体看下来, k 二点六的听话纠错能力强,审美能力好,再加上 hermes 的 自我迭代进化的能力,整体配合度直接就是拉满的状态。 hermes 加 k 二点六模型是我目前的首选,搭配手机微信遥控指挥 hermes 的 三层记忆系统加自我净化能力,然后搭配 k 二点六这样的前沿优秀模型,让我的效率呢大大的提升。好了,本期视频我们就到这里,下期视频呢,继续带大家讲解 hermes 的 进阶玩法,大家点点关注哈,跟着阿亮学英 i。

今天我们来学习一下 hermes agent 的 安装方法,包括 windows 和 mac 两个系统,并且我会为大家介绍九个 hermes agent 的 核心使用技巧,包括常用命令消息软件的联通记忆机制、主题压缩辅助模型的配置, 以及 hermes 官方发布的卡帕西的 l l m wiki skill。 有 关卡帕西的理念我在上一期的视频中有讲过,大家可以结合学习视频的。最后我还会为大家介绍几个免费的 ai 大 模型供应商,比如英伟达提供的 mini max m 二点七模型。 那本期视频中用到的安装代码以及我整理的文档资料。视频的最后会分享给大家,那我们就正式开始。 hermes agent 是 opencloud 之后的下一代智能体,它具备自我学习,自我进化的功能,你使用的越久,它就越懂你。大家不要因为智能体工具太多而觉得烦,因为你使用网页版 ai, 比如 gpt, 你 也不会只使用一个,那多尝试不同的工具会为你解决不同场景上的问题。 首先我们来快速安装这个智能体,本质上只需要执行一条安装命令即可。那这里要注意两个问题,首先就是 windows 用户需要安装 wsl 二,也就是 linux 虚拟机,因为 hermes 不 支持在 windows 原声系统中安装。那第二个问题就是如果你所在的地区有网络限制, 比如中国大陆,那么你就需要解决网络问题。那我们先来看 mac 的 安装方法,我们打开 terminal, 那 如果你本机使用了网络工具访问代码,那么假设你的端口是七八九七,那么直接执行这四行命令,就可以让 terminal 命令行走你的网络代理, 因为命令行默认是不走系统代理的。那设置完成后,重启 terminal, 然后执行官方安装命令,就可以安装 hermes 了。整个过程没有任何难点,安装之后便会进入驶驶化界面。而在 windows 系统中,我们首先需要安装 wsl 二, 我们点击开始搜索 powershell, 然后打开,只需要执行一条命令即可安装 powershell, 也就是 wsl 空格横线,横线 insert。 等待安装完毕后,设置用户名和密码,即可进入 wsl 系统。那这里我们同样需要解决网络问题。那确表你的网络工具开启了局域网连接和 dns 复写功能, 然后在 wsl 命令行里直接把我这段代码复制过去,然后回车就可以让 wsl 的 网络走系统代理了。那你还可以输入下面这一行代码来输出一下你当前 wsl 的 ip 地址信息,来看一下是否生效。那我这里已经生效了, 然后我们直接执行 hermes 的 官方安装命令即可。那刚才这段代码实际的作用就是让 wsl 走你的 windows 系统代理, 你也可以直接让网页版 ai 帮你写这样的命令,那直接告诉 gpt, 你 需要让你的 ws 二使用 windows 的 系统代理,那 gpt 就 会直接给你命令行命令了。那我不建议大家通过转接国内的 npm 镜像的方式来安装,因为 hermes 的 安装脚本里 会安装来自多个来源的文件,那包括 github, npm 派送库。那单纯配置 npm 镜像并不能解决所有问题, 所以使用网络工具是最方便的方法。那如果你没有网络工具,那么只能通过替换 npm 镜像和 npt 语言的方式来安装, 那有可能有少部分组件会安装不上啊,但整体不影响使用。这是一个退而求其次的方法,你可以执行屏幕上的这段命令来转接国内镜像,然后再使用官方脚本来安装就可以了。那当然,如果你所在的地区是海外,那直接执行官方脚本就可以安装了,那非常简单。 安装命令完成之后,自动就会进入到出场界面,我们直接选择快速设置,然后设置一个 ai 大 模型就可以了。那其他的设置可以以后再做, 那输入你的 api key, 然后选择一个模型名称,然后跳过消息软件的连接,那它会询问你是否开始运行 hermes。 我 们输入 y, 然后就可以进入 hermes 页面了。那在 ai 对 话框中输入你好,那智能体进行了回复,那么安装就成功了。 最近的一次更新中, hermes 增加了 web ui 界面,我们输入 hermes 空格 dashboard, 然后回车就可以打开网页 ui。 嗯,但是呢,当前这个版本网页端还不能进行 ai 对 话啊,只能进行系统设置,那未来应该会加入 ai 对 话功能。 那接下来我们就来看一下 hermes 的 使用技巧。那首先就是常用命令和导入 opencloud 配置文件, 常用命令里比较有用的就是 hermes setup, 那 这个是进行抽象设置的,你可以重新进行相关选项的设置。那另外 hermes update 命令是更新 hermes 版本的,那 hermes 的 版本更新的还是比较频繁的,大家要及时的更新新版本。 那当你在使用智能体的时候,避免不了出现一些问题,那这个时候我们要使用官方的诊断工具,也就是避免不了出现一些问题,那这个时候我们要使用 hermes 空格 doctor 命令, 就能诊断当前系统有哪些问题,那执行 hermes 空格 doctor 空格横线横线 fix 就 可以修复这些问题,那这个命令要善于使用, 那如果你想要从 openclaw 大 龙虾里导入你的系统配置,那包括 memory, so 这些文件,那在命令行里运行 hermes 空格 claw 空格 magrit 就 可以了,那这个方法是官方提供的导入 openclaw 配置文件的功能。 opencloud 最大的特点就是可以通过手机通信软件远程操控整体干活,而 hermes 也支持这个功能。我们来到命令行,输入 hermes 空格 getaway 空格 set up, 然后回车进入 getaway 配置向导, 那虽然 hermes 支持的通信工具并没有 opencloud 那 么多,但是主流的软件都支持,就比如飞书、 qq、 微信, 那并且配置方法更简单,那比如飞书,你可以直接选择扫描二维码,然后打开你手机上的飞书 app, 直接扫码即可自动创建机器人,那不需要像之前那样手动设置权限,那扫描之后,我们在设置里选择一个权限, 那这里第一个选项是第一次联通需要配对码,那第二个是允许所有链接,那下一步就是选择在群聊里的唤醒方式,我们选择 mansion in groups, 然后我们输入 y, 它就会安装 getaway service, 然后启动了。 那我们再来说一下微信,那微信就更简单了,那直接扫码就可以,但是这里要注意啊,微信使用的是 cloud bot, 也就是之前微信支持 openclaw 大 龙虾的那个机器人,那新的 channel 就 会覆盖掉之前的,那扫码之后直接就可以连接了,那非常方便,我们现在就在微信的机器人里向 hermes 发送指令。你好,记住以后都称呼我为杰森啊。然后他回复消息说他记住了, 那这个时候我们回到 hermes 的 网页 u i 上,那刷新一下,进入 session 这个选项卡,那就能看到我们刚才的对话记录了。那这个时候我们回到命令行里,那发送文字,你好,你还记得我是谁吗?那 ai 进行了回复,说,你好,杰森,我记得你,你之前告诉我要称呼你为杰森。 那这个时候我们来到 hermes 的 配置文件目录,也就是你用户主目录下的,点 hermes 文件夹下,找到 memories 文件夹,然后点开选择 user, 点 md, 打开就可以看到有一行记录, user prefers to be called jason, 那这就是 hermes 的 记忆系统的一个简单展示。那接下来我们就来看一下 hermes 的 记忆机制以及配置文件,那其实非常简单,我们只需要记住两个关键点就可以了。那第一就是手动修改 so, 点 md 这个配置文件, 这个文件是系统身份与权限约束,你需要在这里写入你对智能子的要求,比如输出要保持简洁啊,针对技术术语要进行解释等等,那这个文件相当于系统提示词。 那第二个要注意的问题就是你如果有个人的偏好,要直接告诉智能体,那就比如刚才我告诉智能体啊,要记住我的名字叫杰森。那你还可以告诉智能体,你喜欢以思维导图的方式来研究问题,那让智能体在做相关研究的时候,优先使用 mermaid 的 思维导图方式来展示知识概念, 那么剩下的就全部交给智能体了,那 hermes 会在日常的任务中主动地保存项目经验和用户偏好, 它会自行决定保存到 memory user 还是 skill, 那 同时所有的历史对话都会保存在 circular 数据库中,那智能体会自动调用 session search 工具解锁历史对话,并寻找相应的对话信息,那通过这样的方式,智能体就会实现长期的自我成长,那变成越来越懂你的智能体 那所以总结一下,作为用户,我们需要做的就是手动修改四点 m d 来保存你的规则,然后在与 ai 的 对话中主动告诉 ai 你 的偏好,那就可以了。那剩下的都交给 hermes, 让他自己来发现你的偏好,自己去成长, 那 hermes 内置了多个任务功能,那刚才我们说到它会自动调用 session search 工具去解锁历史对话,那这个 session search 就是 内置的功能之一,那目前一共有八个任务,那这里有一个技巧,就是分别为这八个任务分配不同的模型,那可以实现更好的成本控制以及性能优化, 那就比如威震是视觉与多模态解析图片的,那我们可以配置一个视觉能力比较强的 ai, 比如 jimmy 或者是 kimi, 那而我们刚才说的 session 搜索历史对话任务,那本质上是一个典型的 r a g 文本组装任务,那这里选择一个速度快的推理模型,比如 java 三 flash 或者 deepsea v 三,那 web extract 这个任务 是网页内容的提取,清除掉 html 标签,提炼为马克文案,非常类似 web cleeper 这个工具。 这个任务属于典型的重复性体力活,我们配置一个高吞吐量的零成本模型,比如本地部署的千问,或者是 g l m 的 免费模型就可以了。 那这里我们要重点介绍 compression 这个任务。上下文压缩,那当你与 ai 进行了好多轮的对话之后,上下文窗口已经接近上限,那这个时候你需要压缩上下文内容,让 ai 专注于对话主题, 以便于继续对话。那具体的命令就是斜杠 compress 空格聚焦的主题名称,那这会让 ai 对 绘画进行摘要压缩,清除勇于的信息,保留与主题相关的核心内容。那如果你经常会使用智能体执行很长的任务,那这个功能一定要掌握。 那这个任务我们可以单独配置一个模型,但是要注意啊,我们一定要配置一个长上下文的模型,比如 java, 那 我们要注意的是,如果你的主模型的上下文窗口比 compression 任务的模型上下文窗口还要大, 那么就会导致上下文长度崩溃。那比如你的主模型是一百万上下文,而 compression 任务配的模型是二十万上下文,你把一百万塞给二十万,那肯定就崩溃了。 那这个时候 hermes 为了防止系统出错,会直接跳过总结,默认丢弃掉你中间的所有对话记录,那所以最适合 compression 这个任务的模型就是 java 三 flash。 一 百万的上下文足够了。 那么如何给这八个任务分配不同的模型呢?你可以直接与智能体对话,告诉他某一个任务指定哪个模型,那也可以通过命令行来设置, 那命令呢?就是 hermes 空格 config 空格 set 空格 auxiliary 点儿 compression 点儿 model 模型名称。那这里你需要注意一点,如果你配置了多个供应商,比如你使用了 openroot, 同时还配置了 ospec 的 cloud, 那 么你就需要先指定 provider, 再指定模型名。那具体的命令我已经展示在屏幕上,那么以上这两个技巧是非常有用的技巧,大家一定要善于使用。 那同样, hermes 内置了很多的工具和 skills, 我 们可以在网页 ai 上看到它自带的工具和 skill, 那 同样我们也可以自己安装 skill, 那 安装的方法也很简单,直接把 skill 名称发给 ai, 让 ai 自己装,那或者在命令行里运行命令, hermes 空格 skill 空格 install 空格技能名就可以安装了。那你也可以手动复制 skill, 在 你的用户主目录下的点 hermes 文件夹下 找到 skills 文件夹,点进去之后,你就可以把你的其他智能体,比如 cloud code 的 skill 全部复制过来了。而 hermes 官方也有 skill 市场,名字叫 skill hub, 那 从 hermes 官网就可以进入,那截止到目前已经有六七百个 skill 了。 我在上一期视频中讲解了硅谷 ai 大 神卡帕西的 l l m v k。 理念,而 hermes 官方也非常的与时俱进,已经把卡帕西的 l l m v k。 理念整理制作成了 skill, 那 集成到了 hermes 里了,名字就叫 l l m v k, 大家可以在 hermes 的 官方 github 仓库中的 skills 文件夹内找到。那如果你想要使用这个 skill, 需要在你的点 e n v 文件中配置 wiki 目录地址,指向你的 obsidian 知识库路径,然后就可以使用 skill 了。 skill 里一共有三个功能,分别是 ingest, query 和 link。 那 如果你还不了解卡帕西的 l l m wiki 理念,可以回看我的上一期视频,你可以直接向智能体发送自然语言来触发 skill。 呃,但我更推荐你使用斜杠命令,也就是斜杠 l r m v key 空格, ingest 加文件名或者 query 加你的问题。那具体的命令我已经展示在屏幕上了。那同时我也把最终生成的目录结构展示给大家。那大家可以结合我的上一期视频学习卡帕西的理念,然后使用 hermes 来管理自己的 ai 知识库, 学习如何在智能体时代构建并维护自己的知识库,并进行知识的深度学习。那 hermes 的 团队对于 obsidian 还是非常友好的。那不像 openclaw, 我 之前视频讲过, openclaw 官方 github 仓库中的 obsidian skill 比较过时,很久没有维护。那如果你是 obsidian 用户, hermes 是 非常适合你的。 虽然现在 hermes 还无法在 obsidian agency 的 刊物的插件中集成,但影响不大,那我最近的 obsidian 就 已经完全的交给 hermes 来管理了。那最后我来给大家介绍几个当前时间点下提供免费 ai 大 模型的供应商。那首先就是谷歌的 ai studio, 默认是有不少免费额度的,我们主要关注 java 四,这个新发布的开源模型比较实用,那虽然你可以部署在本地, 那这需要一定的电脑显卡性能,那除非你对隐私有非常高的要求,那否则直接使用谷歌 a s studio 提供的展览四免费额度就可以了, 那二十六币和三十一币都有,每分钟十五次,每天总计一千五百次的免费额度。那模型名称和 u i l 我 也展示在屏幕上了,大家可以在 a s studio 中创建一个 api 来使用。那第二个就是英伟达的 ai 服务,那最近 mini max 开源了自家的 m 二点七模型, 英伟达直接部署了这个开源模型,然后免费提供给我们使用,每分钟四十次,那直接搜索 nvidia name api, 然后注册一个账号就可以创建 api key 了。那具体的模型名称和 url 我 也展示在屏幕上。英伟达的这个网站还提供了很多其他的免费模型,大家可以自行选择。 那第三个就是 openroot, 在 openroot 官网模型页面搜索 free 就 能看到当前的免费模型。那很多 ai 大 模型在发布前都会在 openroot 上进行测试,那比如之前的小米的大模型和千万三点六就在 openroot 上免费试用了好几周, 那大家可以时常关注一下是否有新的免费模型可用。那以上就是目前可用的免费模型的供应商, 那么到这就是今天视频的全部内容了,那 hermes agent 的 自我进化理念是目前智能体工具的主流发展方向,非常推荐大家进行尝试。那大家在使用过程中如果有什么问题, 欢迎随时给我留言,那视频中的笔记和代码可以在我的个人网站中下载,也可以在我的频道信息中找到我的个人网站,记得点赞关注,谢谢大家。

看这个 hermes 能干什么?这里面我问了一下它,它能干啥?从这个内容里面可以看得出来哈,它跟 openclo 会跟这个 lm 最大的区别是,当然它跟 lml 不是 一个东西啊,这是一个 agent, 它跟 openclo 最大的区别是它的记忆系统会更好。另外一个就是它可以把 openclo 的 很多技能全部都可以共用,这是它最大的区别和跟 openclo 的 不一样的地方 啊。今天给大家分享一下 harmony 的 这个安装教程。然后,呃,大概会出现两个错误啊。第一个错误是我们去执行安装命令的时候,会跳出一个你的 host 指向的问题,就找不到你的这个机器地址, 所以这个时候需要把这个下载这个地址的 host 要直接去指定这个,改这个,加这么一行命令去指定 这个域名的 host, 大家可以在这去下载。第二个问题是配置 model 的 时候会出问题,我配置的是 kimi, 它的那个默认 base url 是 有问题的, 所以我就,呃通过修改这个配置文件,通过这一行命令去把我们的把我的那个 base url 给改过来。改对,第二个呢?嗯,粘贴密码的时候有,有时候会容易出错,因为这个密码是一个钥匙, 呃,你可能粘贴两次或者没没有粘贴上,所以这个时候需要通过这这一行命令去看一下你的那个密码对不对,如果不对的话就你的 key 对 不对,如果不对的话,你就需要啊去去改, 你看这个是,嗯,输入 nano 这个 harmis 点 ev, 这个命令说完了之后可以看到打开它会打开这个文本,你可以看你的这个 key 对 不对,如果不对的话你就把它改了, 对的话你可以把它忽略,这是第一个,第二个的话你的这个用这个行命令去改你的 config 文件,你要确保你的这个 model 的 这个 base url 是 对的,如果这个不对的话就会出问题, 所以这是两个错误。先给大家分享,然后接下来给大家分享安装步骤。这有一个下载地址,是官方的下载地址,官方的这个文档啊,这里面有包含地址,包含这个下载地址,通过这么一行命令就可以去安装你的这个 open core 啊,不是 open core 去安装你的这个 呃 harmony, 然后等它去下载大概三五分钟之后,它会开始安装了,下载好了会按开始安装,我这个是装的龙虾, 当你如果你机器上装了龙虾的话,它会识别出来,并且问你,你要不要去看一下你的哪些配置,要不要导到这个 harmony 里面去?因为它很多东西是通用的,特别是 skills, 我 这里选的是 yes, 然后你看 进到这个界面之后,他会发现我很多这个,要不要把这些技能 skills 复制过去,我选的也是 yes, 也就是我继承了我龙虾里面所有的东西, 然后再会跳到这个是快速安装还是全面安装这个呢?嗯,如果你没有本地没有龙虾的话,它就会直接是这一步,所以我这里就大家选这个快速安装就行了,然后他会跳出让你选择你要的是 kimi, 然后我选择这个,我用的是 channel 的 这个, 然后面呢?这里面要输密码,这个地方就容易出错,一个是你没有粘贴上,第二个你可粘贴了两次,所以需要去查看一下你的命令对不对,你的密码对不对, t 对 不对?所以呃后面两个就直接跳过就行了, 然后他就会问你要不要呃 chat, 也就是开始跟他对话,呃,你如果选 yes 的 话,他会出这么一个错, 这个信息你可以忽略掉,应该是这个版本的 bug, 你 不管它,然后你再次输入 harmischat 就 行了,它就会就会打开你的第一个爱模式,然后今天就分享到这,谢谢大家。

今天我用了一阵子的 amos 啊,最大的体悟就是简单省事啊,像龙虾对接欧拉玛 lm studio 这样的本地模型啊,需要手工配置啊, amos 真的 是非常简单啊。 大家好,我是根谷啊,今天是 amos agent 系列课程的第二堂课,很多人的虾还没养好啊,现在又开始养马了。首先给大家看一下效果吧,我打开这个 amos 啊 amos, 比如说我做几道题目啊。先来一道简单的吧, 小明现在有十二个苹果,吃掉了三个,又买了五个,现在有多少个?我首先看一下欧拉玛这个,这一枚的四二十六币啊。好,他已经装载进去了。装载进去的话以后你看啊,一辆车 每小时六十公里,二点五小时能走多少公里数?那第二次就会快很多,因为刚刚我很久没用它休眠了哈。我们再做一道比较难的题目吧,一道概率论的题目。这道题目是比较难的,一个盒子有三个红球,五个篮球不放回抽两次 啊,就是这个球第二次抽到红球的概率,他给了两种方法对吧?嗯,那再给两个这个脑筋急转弯,这个小时候经常经常被坑啊。小明的妈妈有三个儿子,大儿子叫大毛,二儿子叫二毛。小儿子叫什么?小儿子是叫小毛吗?不对,是叫小明对吧?来一个这种吧 那来一个这种。呃,他这个记忆体没有的,比如说,呃,美国的现任总统。总统是谁呢?他应该要去网上去找,哎, 或者是美国的第一任总统是谁,我看看他能不能知道叫 music music music 啊。 这个 ems 最大的特点就是它,如果是啊,如果是它没有的功能,它一定会去网上找,比如说,比如说北京今天的天气如何,这对它来说应该是有难度的,它应该没有这个技能才对的,是吧? 那它你看它要去这个叫酷 google 去搜寻这个北京的天气,它要去 bing 里面去试了,是吧? 大概是搞不定的,我觉得它应该需要做一个这个天气的一个 api 的 接口去访问,它自己要去写这样一个技能, 然后我讲一下怎么样去快速的让这个爱马仕对接你本地的模型,因为你的电脑足够强大的话,我建议你还是用本地的模型啊,因为非常省钱啊,非常省钱啊。第一步就是进入这个欧拉玛,对吧?我用的是欧拉玛的当当 low 的 欧拉玛,是吧?我用的是苹果的, 自动的,就下载,下载完了以后这个没有什么可讲的,就是一个应用程序打开,打开它的话,这里面有很多模型啊,如果你电脑配置比较好的,就去下这个二十六 b 的 啊,二十六 b 或者是 三十一 b 的 都是没问题的,我的成,我的电脑下三十一 b 是 没任何问题的,当然我的电脑也是跑不起一百二十 b 的。 下完了以后,下完了以后你测一下就好了,比如说我下了这个这个这个 这个,这个我是有的,对吧?这 gpt 的 你,你是什么模型啊?对吧?它就是 gpt 的 这个这个单元模型,是吧?下完了以后,这个就挂在这里就不用管了,就是好通了,它出现了 cking thinking 啊,就 ok 了啊,你就不用管了,你可以把它擦掉。那第二步要要你知道这欧拉玛用的是什么端口?那欧拉玛端口的话是幺幺四三四,那这个端口是怎么知道的呢?很多人他在问这个端口怎么知道呢?其实是靠那个 l i s f 这个,你去看它的监听端口, 欧拉玛这个监听端口就是幺幺四三,是默认的,这个东西大家记住就好了,他不是八千是吧?也不是八千,也不是幺幺四三五,就是这个就就用这个命令,命令行啊,这是教大家一个小技巧,然后怎么把它配置上去呢?也是非常的简单的,是爱马仕,爱马仕这个名字我觉得取得特别棒啊, model 就就一个命令。然后呢?你翻到下面了,如果你用了龙虾的话,这些都是他把龙虾的配置倒过来了。假设你第一次配,第一次配是没有这些的,但是这个这个选项是有的,叫那个卡斯特吗?卡斯特吗?在哪里啊?自定义的端点,这个这个 这个这个 http 冒号双写,这个幺幺四三四回车,这里的 api 你 们不需要,不需要,因为不需要 api, 来这里面就选择模型了,对吧?这里面你选择一二三四,我应该是默认的是二二,是我最喜欢的模型啊,这是目前为止 最强大的模型啊。这个上下文这个窗口最好设置为非常大,七万 七万是没问题的啊。好了,以后就是 amos, amos, amos, amos, 哎,它总会出中文, amos, 哎,这就好了,最好是你先杀一遍进程,然后呢取一个新的回放框,因为它毕竟不是在浏览器里面,它全是这个命令行,所以说开始用起来可能不会那么习惯,但是用着用着应该就比较顺手了。比较顺手了啊?

哈喽大家好,欢迎来到新一期的视频。那今天给大家聊一个也是近期被问到比较多的一个话题,就是 openclaw 大 模型选择的一个问题。那这个大模型选择其实包含很多方面,第一个就是大模型服务, 因为说到底 open color 它是一个具备 a 制能力的一个外壳,它要完全发挥能力,是需要依靠背后的这个大模型服务来给它做最核心的支撑。如果你背后的这个大模型服务选的不好,那后续所有大家在网上看到的各种华丽的场景, 各种牛逼闪光的 skill, 他 可能最后你自己实际用起来都完全不是那么回事。那今天这期视频就是为大家解决这个问题,我会从付费的大模型服务到免费的粉地大模型,一个视频给大家聊清楚到底怎么选, 什么样的情况下,用哪一种订阅方式去选择哪一个模型最合适。而且这期视频我不想聊一些特别复杂学术的这种模型能力平底而之类的, 就简单直接给大家一套可以照着抄作业的模型选型的体系架构。好,那今天我们来看一下今天同场竞技的选手们都有哪些。 首先我把它们分成了三个梯队,那第一个梯队呢,就是当前的这个顶级模型战队,包括大家熟悉的这个 antropica 的 claw, optus, sonnet, 还有 gpt 五点四,还有 google 的 这个 geminis 三 pro, 那他们这三家呢,基本上代表了当前大模型的一个顶级的水平,那在最近这半年的版本迭代里面呢,这三家也是交替的领先啊,但是这三家的模型呢,从本质上来说各有各的优势,他们的专场其实非常的明显, 虽然说基础的模型都已经占上了顶尖模型的阶层,但是各自有一些优化方向的一些差,这个其实也是各家模型厂商为了能够实现 足够的用户粘性,它必须要做的一个全卷积模的基础实力,大家其实已经很难去做到绝对的这个待机领先了,那剩下的就只能在一些具体的细分场景去做叉用。比如,呃,我给大家举个例子,以这个 astropic 为例,它的 cloud 模型其实从始至终在 编程代码编辑的这个维度都是一迹绝尘。从 astropic 一 出现,然后,呃,我之前就关注他几次在这个 prompt engineering 的 啊,这种线下交流里面,很多开发者的朋友对他的这个反馈都非常的不错。当 openai 还没有出这个 function calling, 那 cloud 就 已经把相关的这个大模型函数调用的这一块已经处理的非常 和谐了,包括这个 m c p 和 skill 的 定义,早期的一些提出者呢,也都是 esplo 工程师,所以如果有开发者的朋友,那你也是一些非常硬核的需要去做应用啊, 去做项目这样的产出,那其实真的就是可以无脑去冲 astropics。 那 gpt 这边呢,就不用说了,因为它最初那这一轮 ai 热潮整个就是被叉 gpt 带起来的,但是在最近这 一年半年的这个迭代里面,叉 gpt 呢,开始慢慢地去转向一些低延迟高速推理的这样的一个场景, 它这背后呢,其实是拆批地点,想要去布局人形机器人呐啊,还有一些这个智能设备的语音和视觉的能力,直接接入大模型 啊,它因为它需要和人进行及时互动,所以最近这一两年里面对于整个模型响应的一个延迟做了非常深入的优化。那 jammer 这边呢?它的优势主要就是在长上下文这个地方。如果最近大家有关注那个 dickman 的 创始人的一些访谈的话,它其实是有提到的啊,因为 deepmind 在 模型常上要玩的这个处理上,一直是有比较深的这个研究的积累。那聊完了能力了之后,我们再来看一下付费的这个模式,那有很多小白用户呢?如果你刚刚开始接触大模型相关的产品的话,那你可能只知道 api token 这一种付费模式,就是 我输入了多少 token, 我 输出了多少 token, 它按照 token 的 一个每百万的一个单价来给你结账。那其实除此之外呢,还有一种付费模式呢,就是固定费用的一个订阅。那我给大家举个例子啊,那我以叉 g p d 为例,它有 plus, business 和 pro 三档订阅, 那每一档订阅呢,都包含一定的这个 codex 的 用量。大家如果之前买过这个套餐订阅的话呢,你可能只知道我能够在它的 web 和客户端 app 里面去跟它进行聊天对话,使用那里面的功能。 但其实有一个非常重要的使用方式,就是用这个 codex, 虽然它官方这里说呢, codex 是 一个 coding agent 啊,你是拿它来写代码,但是你完全可以用 和 codex 相同的这个权限认证的方式,把 open i 的 gpt 五点四模型接入到 opencloud 里面,然后使用 codex 的 订阅额度来调用 gpt 五点四这个模型。那再有一个,我以 谷歌为例,那 google 有 一个 ai agent 的 一个平台产品叫 anti gravity, 然后在这里面呢,它其实提供了这几档订阅的模式,那其中的每一档订阅呢,几乎都包含一定量的 呃大模型服务。而且谷歌的这个 antigravity 的 平台有一个好处,就是它除了能够提供谷歌自身的 gemini 模型的一个使用之外,你还能去掉 astropica 的 模型,相当于我用同一份订阅可以同时访问谷歌家的 gemini 和 astropica 的 flow 模型 都可以。 anthropomorphic 呢,也是一样的道理,它也提供了这三档订阅,和刚才提到的那个 openid cortex。 谷歌的那个 antigravity, 它其实都是同样的计费逻辑,每月的费用是固定,但是问题是呢,它的调用量也会给你有相应的限制,这三家的这个限制逻辑也各自不同。 等一下我会展开给大家去讲一下具体怎么选。当然详细的这个限制逻辑我就不在这里面去一一解释了,因为会导致这期视频会非常的长。那这期视频呢,我就简单直接给大家推荐一种我个人觉得性价比比较高的一种选型和订阅的模式。好,那刚才讲到的就是第一梯队的这个模型, 那接下来就是第二梯队。是啊,中国的这个国产模型,那我自己最近呢,其实有在密集的去测试国产的这些模型的一些各方面的能力表现, 那目前我试下来的感受呢? kimi 的 k 二点五其实表现是相当不错的。然后接下来呢,就是 mini max 的 m 二点五,然后再往下呢,其实就是 g o m 的 那个智谱的那个 g o m 五 千问的三点五其实也也 ok。 那 国内的这第二梯队模型呢?他们也都提供了 api token 计费和固定费用订阅这两种模式,当然整体的这个订阅的价格以及背后的这个用量的限制,相比于第一梯队的模型呢,相对来说都会更划算一点。 当然你忽略模型的能力不谈啊,我单纯的只是去看他,比如每百万 token 的 一个成本,你花多少钱,获得多少个用量,从这个维度上讲是划算,但是它整体的模型能力呢,和第一梯队呢,还是有一定的 差距。那最后第三梯队呢,就是欧拉玛的一个本地模型,你会看到网上有大量的博主在讲说怎么样在全本地的一个本地的模型, 那这种方式呢?不是不可以,我只是我完全不建议小白用户去碰这条路径。不光是因为他的技术门槛比较高,这个技术门槛本身不光是模型的安装和部署,因为 大家如果了解过欧拉玛的话,应该都知道他的安装和部署的成本其实并不高。他背后真正复杂的是如何找到每一个本地模型 适合他的使用场景,然后把你日常生活中遇到各种各样的场景用不止一个是一堆模型 去组合,覆盖什么样的模型,应该覆盖什么样的场景,然后彼此之间如何去做选型,提示词怎么优化等等等等一系列的这个日常优化的这种难题,都会让小白和新手会觉得这个完全 无法处理。当然你会看到那个 oppo pro 的 创始人,他其实也都在尝试本地去部署一个满血的大模型, 但是如果大家真的深入了解了一下,你就知道,如果你要本地去部署一个这个千亿甚至万亿参数的一个满血版大模型的话,那你光硬件成本其实就已经让很多 新手用户无法承受。就给大家举个例子,如果大家想去布那个 deepsea 的 那个满血版的模型本地部署,那基本上如果你不做量化的话, 至少四到五台 max studio, 你 要把它通过雷电五连起来,然后还要做非常复杂的这个定型度的优化,然后才能够正常的去跑起来,所以这东西真的不是一般小白用户能够 handle 得完。当然欧拉玛的模型呢,并不是说一无是处, 哪怕是非常专业的用户,他也是有适合用欧拉玛的一个场景。比如说我之前上一期视频有提到的,用本地的这个 inviting 模型,那你其实完全可以用欧拉玛去布一些开源的本地的 inviting 模型。第二个就是 openclaw 的 这个心跳模型, 那你完全可以把一些心跳的请求去转发给欧拉玛。那关于这一点呢,我们等一下会专门展开来讲欧拉玛这种模式,它最明显的好处当然就是免费,我完全本地, 我不需要再为模型去付出这个账单的成本。当然他的劣势也是非常明显,第一个就是你前期的这个设备采购的成本,第二个就是你为了把本地的这个模型布起来,你需要投入大量的部署、技术优化和问题处理的这个成本。 好,那讲完了三个模型的梯队了之后呢,再给大家来看一下,那我们究竟要怎么去做选择?那我这里呢,就抛开那些复杂的技术评估和一些学术上的那种 benchmark 不 谈啊,因为这个会太枯燥了,大家可能无法接受。 直接给大家一个我个人比较推荐的一个结论,首先如果大家是小白用户的话,那小白用户我背后的假设是什么呢?就是啊,你只是想看看 ai 能做什么, open cloud 到底能够实现什么样的功能,能帮我解决什么样的问题。你没有一个非常固定的商业目标,我这里的商业目标呢是你有盈利的目的, 比如说我要做一个产品,做一个软件服务,我要优化我的这个生意的成本,做降本增效,我希望,比如说我做电商的,我希望提升提升我的这个商品转化率,降低我的投放成本等等吧。你有一个非常明确的商业目标,你需要去啊,针对它去做推进的, 然后你不想被这个账单的这个爆炸给干崩的,那同时你的用量又啊相对来说比较小,你只是想来尝试一下,看看这东西到底是怎么个事。如果你是抱着这种心态啊进来的话呢?那我建议大家去选择 openai 的 这个 codex 的 这种订阅模式,大家可以先从这个 openai 的 这个 plus 会员开始,它每个月只需要二十美金,那这二十美金其实是一个固定的成本了,它不会随着你用量的增长而有什么变化,不管你用少还是用多啊,它都是这二十美金啊, 当然你不可能用的过多啊,因为他有一个这个用量的一个硬的限制。那这一点呢,其实也是非常适合新手的这种场景,因为大家一旦使用不当,有一些涉及比较大用量的这个需求,大家可能想都没想,一个请求就直接发下去了, 那一旦碰到它这个用量的限制, open 直接就给你咔掉,而不至于说啊,如果你用 api token 这种订阅方式啊,一下子把一个复杂的问题丢给他,那你有可能第二天早上一起来两三百美金的这个账单就出来了 啊。如果大家喜欢做一些这个应用啊,编程类的这种尝试啊,同时你的使用场景可能经常需要比如 成百万的这个上下文整本书丢进去,让它做一些复杂的分析或者说写作。那 google 的 这个 astropac 就 比较适合你,因为它同时包含了 gemini 三 pro 和 astropac 的 那个 cloud 模型都在这里。 那小白用户可以从它的这个 ai pro 的 这一档先开始,它默认就带了一定量的这个 anti gravity 的 额度在里面。当然这两家不管哪一家,最入门的那一档的订阅,如果大家做复杂的项目肯定是不够的, 但是如果小白用户只想来试试水,然后看一看这个他到底能做什么,做一些简单那种 demo case 啊,完全是足够的。 好,接下来给大家简单演示一下这个固定费用订阅到底怎么配置啊,如果你只是在控制台完成固定费用的订阅,配置的这边一旦你还是在用 api key 来配,相当于你钱是花了,但是那个订阅其实根本就用错了。 目前主流模型供应商的固定费用订阅基本上都是通过这个 os 的 这种认证方式来认证的,它基本上在全程不涉及 api key。 如果大家在用 open ai, 用 cloud 模型,用 google 的 那个 anti gravity 过程当中去使用了 api key, 那其实你大概率用的不是固定费用的订阅,还是那种基于 api token 的 这种计费模式。好,那接下来给大家演示一下具体的这个配置过程到底是怎么样的啊?首先大家打开这个 opencloud 的 配置的向导, 然后接下来去进入到那个模型配置的界面里去啊,进来了之后呢,我以 openai 为例,大家选 openai, 然后这里面大家会看到两个选项,一个是 api key 啊,一个就是这个 openai codex, 大家千万记得一定要选 codex 的 这一项啊,只有这一项会用到你的那个固定费用的订阅,你一旦选了一台 key, 再去把 key 一 填的,相当于你钱花了,但是那边 token 的 记费又单独收你一份钱。 好选择这个 codex, 订阅了之后,就会跳转到你的这个 opencloud 的 这个认证窗口。 然后在选择模型的时候,大家一定要记得去选 open i 的 模型的时候,一定要选择这个 open i codex 为前缀的这个模型,千万不要选这几个,如果你选这个 open i 为前缀的,相当于你又在用同款来计算啊, 一定要选这下面的模型。大家看到这里面其实就包含了那个五点四和五点三 codex 的 等等一些这个顶级的模型都在了。 那另外一边呢,针对于这个专业的玩家啊,这里面包括企业级的客户,或者说你是技术的那种,即刻你是资深的开发者,你有一个比较明确的这个商业的盈利目标,希望去做优化,希望能够以最低的成本去最大化你的产出。 同时呢你也愿意花时间去做一些种研究试错,去做这个问题的这种调试配置的优化。那 如果是抱着这样的心态的话呢,我这里有一套更成熟的模型架构的这个方案来推荐给大家,我自己把它叫做三轨制的一个模型架构,它基本上结合了刚才给大家提到的那个第一、第二、第三梯队三组模型啊, 做一个有机的一个组合,大家彼此发挥各自的优势,形成一个有机的整体,既能够保证你能力的这个最大化,然后同时呢费用上也相对来说比较客观。当然这个缺点就非常明显啊,因为你架构比较复杂,所以你 从搭建到优化到整体的这个磨合期的这个成本都比这个小白的路线要复杂不少,大家要有充足的这个心理预期。 好,那接下来给大家看一下我刚才提到这个三轨制的模型架构到底长什么样子,那我这里呢是成本从低到高,模型能力从弱到强这样去排序的啊。第一层呢,就是你的这个本地模型, 那本地模型呢,它当然是无法去处理一些复杂任务的,那基本上它的使用场景非常的有针对性,比如说第一个就是 openclaw 的 朋友应该知道 openclaw 它其实有一个心跳的机制,那 如果你在跟 openclaw 进行对话的过程当中呢,告诉他了一些啊需要执行的任务,如果他一次执行不完,他判断需要周期性的这个执行,或者说跟你检查这个任务的执行状态,他会不断地有一个心跳 啊,去加载你当前 session 和记忆里面的一些待执行的这个任务去判断说 ok, 这个任务需不需要再继续执行,不断地去做这个判断。 大家可以想象一下这个场景它的频次其实是非常高的,那基本上每过几分钟就需要把你的这个啊赛圣绘画以及记忆里面的这种信息组合成一个上下文,然后传给模型去做一些这个判断。那这种请求它的上下文的占用不小,而且它的调用的频次呢也不低。 如果在这种调用场景下,每次大家都去用那个顶级模型的话,那你的费用是膨胀的非常快。如果你用固定费用的订阅的话,那你其实相当一部分的这个订阅的额度都会被消耗在心跳检查里。那记忆解锁这个地方也是一样的, 在记忆解锁的过程当中呢,你需要这个 inviting 模型,那这一部分呢,也建议大家去使用本地模型。关于这一块呢,我之前其实有录过一个专门的 openclaw 的 一个 记忆系统的一个视频,那大家可以翻出来看一下。那再一个呢,就是轻度的任务,你可以直接用本地模型进行处理啊,我这里的轻度任务指的是什么?比如你要对一个文本去打一些标签, 我举一个实际的场景吧,比如说我用 open call 把我的信用卡账单给收集过来,把它整理成一个表格,然后我希望这个模型检查我账单的每一条记录,基于记录的这个商户的名称,来帮我自动识别我这一条记录到底是食品消费, 还是我在加油,还是我在啊这个付手机的话费,那这些东西你完全可以通过商户的这个名称就能够做出啊这样的判断,那这种判断相对来说比较轻,它其实完全只是一个简单的文本的语义理解和识别,它非常适合用本地的模型去进行处理。 当然类似的场景还有很多啊,如果大家有兴趣的话,我可以专门出一期视频来给大家讲一下本地模型到底适合哪些各种各样的场景。 最后一个就是非常明显的优势啊,就是他的这个隐私特性,如果你有一些啊非常个人非常隐私的这种信息,比如说我 希望对照片去做一些这种描述和达标啊,我私人的照片,包括我的日记,我希望对它进行标签和整理,那我其实都不希望把它去发到远程去处理,然后再往下的话呢,就是用国内的第二梯队的这个模型, 那他们的主要的适用场景,第一呢就是日常简单的一个沟通绘画,比如说我只是加一个日历的任务啊,简单的处理一些这个文档的这种编辑创建代办事项,然后检查我的一些这种配置信息,这种日常的高频的对话 以及用量的这种兜底啊,这个兜底的这个逻辑,我等一下再讲这个弹性层的时候给大家讲。那最后一个的话呢,就是顶级模型的一个弹性层, 这里面涉及到的就是刚才提到的这个第一梯队的模型,那他们主要就是用来处理复杂的推理深度调研,高难度的这个编程 超长上下文的这个处理问题。那基本上这一层级的模型呢,需要大家啊做相对来说比较好的任务选择和路由,尽量把刚才提到的这些真正有价值的任务场景交给这些顶级的模型,而不要就说,哎,我,我日常跟这个 open pore 打个招呼, 问个天气,设这个定时任务啊,都都要去问这种顶级模型的,那完全就是这个杀鸡用牛刀了。那这里弹性层的这个意思其实也就体现在这里,就你只有在复杂任务出现的时候才需要用到这些顶级模型,这是第一, 日常的沟通不要用。第二呢,就是你当你这些顶级的这个模型的固定费用订阅出现了额度限制的时候,那我至少在国内的这个模型的固定费用订阅出现了质量可能不行, 或者说我需要达到同样的质量,我需要烧更多的 token, 但是至少啊,我的这个任务不会中断,因为有的时候根据大家的实际场景,任务中断它所带来的损失比这个任务达成不了。 有的时候还要打这一点的话,如果大家做过企业或者做过项目的朋友,一定知道我在说什么。然后我这里再次强调一下,这里不管是国内的这个第二梯队模型,还是海外的这个顶级模型,它我建议大家默认都去选择那个固定费用的 订阅,然后只有在固定费用的订阅额度全部用尽的情况下,再去 fall back 到 api token 的 这个调用,而且大家要结合任务的实际价值去做一个选,如果你这个任务非常紧急啊,价值又足够大,那么你可以在 顶级模型的固定费用的订阅用尽了之后,直接使用顶级模型的 a api token 啊,因为它值得你这样的投入,如果本身任务的价值没有那么大,那你就 fall back 到这个第二梯队的这个模型,然后同时呢,大家要做好自己的用量监控,然后按周和按月去统计一下你 固定费用的那个额度,触发额度上限的这个频次啊。如果你经常触发某一个模型订阅的 这个额度限制,然后经常需要强制的去使用一个 api token 的 用量,那么过了一段时间,你就要考虑是否要切换到这个更高一档这个固定费用订阅, 它本质上是一个权衡,就是你需要结合任务本身的价值,它的复杂度,模型的能力,还有你当前的这个付费模式的一个成本去做一个平衡。

大家好,我是麦东,今天这一期视频,我想跟大家聊一聊 amazon 里面最常用的一些命令。很多人抓好 amazon 之后,打开终端就不知道该怎么用了,今天我就结合实际场景带大家把最核心的命令过一遍。 第一次启动 amazon 的 时候,最重要的一步就是跑一下 amazon setup。 这个命令会启动一个交互式的配置向导,带你完成模型的选择、平台接入这些基础配置。如果你之前看过我的安装教程,这一步应该已经做过了, 如果有新来的朋友还不了解这块内容的,也可以回过头去看一下我前几期的安装教程。触指画配置完成之后,如果你想切换模型,这时候不需要重新跑 set up, 我 们直接运行 ems model 就 可以了, 它会弹出一个选择界面,让你重新选择模型的提供商和模型。除此之外,还有一个命令也非常实用,就是 emulus doctor。 当你发现 emulus 运行不正常,或者是某个功能突然失效的时候,我们可以先跑一下这个命令,它会自动帮你检测配置和依赖有没有问题。如果你在命令后面加上 fix 参数,它还会尝试自动帮你进行修复。 还有一个很多朋友会遇到的问题,就是模型的 api key 配错了或者是过期了,怎么重新修改?这个时候我们可以使用 amazon config edit 命令, 它会直接打开配置文件,只需要找到对应的 api key 子段,修改掉保存就可以了。修改完成之后,根据提示输入命令退出编辑,按 y 确认保存即可 日常使用。最简单的方式就是直接在终端输入 emirates, 按下回车就进入对话界面了。 但有时候你只是想快速问一个问题,不想进入交互模式。这时候我们可以用 emirates chat 杠 q, 带上你的问题,快速进行提问。比如我们想快速询问今天南京天气如何, 它会直接返回结果,然后退出,非常适合在脚本里面去调用 emulus。 另外一个很常用的场景就是接着上次的对话继续聊。这个时候我们可以用 continue 参数输入 emulus continue, 按下回车, 它会自动恢复你最近的一次对话。比如我刚刚询问了今天南京天气如何,就被恢复过来了。如果你想找更早的某次对话,可以先用 emulus sessions browse。 在交互界面里,你可以浏览到所有的历史记录,找到你想要的那条,直接按下回车即可恢复到那次的绘画。 emulus 最让我惊艳的一个点就是它的 skills 系统,当你让它重复执行某类任务的时候,它会自动把这个任务流程沉淀成一个 skill, 下次遇到类似任务就直接附用,整个过程完全自动。你可以用 emulus 的 skill list 查看当前已经有哪些 skills。 如果你想从社区安装别人分享的 skills, 我 们可以使用 emulus skills search 进行搜索。比如我想找一个翻译 skill, 我 们可以输入 emulus skills search translation, 按下回车, emulus 就 会去自动进行解锁。找到之后,我们可以使用 emulus skills install 安装该 skill。 比如我们安装这个中文翻译的 skill。 安装 skill 过程中会有一些交互提示,你是否确认安装,我们输入 y, 按下回车即可。今天这期视频就到这边了,把这几个场景的命令掌握了,基本上日常使用 emulus 就 没什么问题了。工具会变,但方法更重要。我是麦冬,下条继续。

刚刚我在群里面看到有小伙伴问我啊,就是为什么我的爱马仕他不快啊?核心原因有就有两个,第一是你的模型不匹配,第二是你的配置没有调教好。大家好,我是根骨,那今天是爱马仕 a 阶的系列课程的第三堂课, 这样配置你的模型才能提速。大家跟我一起来玩转爱马仕吧,给大家演示一下效果啊,我自己准备了一些数学题目啊,这个是 初中的一个数学题啊,小明有三十二块钱啊,花掉了四分之一又得到了十五,现在有多少钱?第一话,如果你是笔记本电脑一定要保证你的这个电量是百分之八十以上了,如果他低于百分之二十的话他自动会降频你你这个大模型就乱都乱不起来了,直接就把它 kill 掉了,这是一个小小常识了。然后再搞一个比较 比较难一点啊,概率论的题目啊概率论的题目,感觉它会慢一些哎。袋中有四个球是吧?四红五白不抽回两次球,第二次抽到红球的概率。那其实这一百四它还是比较比较快的,它还是比较快的。嗯, 好。嗯,这个概率论它其实开始在在做推理是吧?然后它给了两种方法啊,不一定想得出来哦。 一间屋子全是窗户,它是什么好让他去想吧。那怎么配置啊怎么配置啊?第一的话你要打开这个欧拉玛,欧拉玛的话这有个 setting, setting, setting 的 话它其实已经出来了啊,温室或者是玻璃房是吧?理由,那它可能想了很久是吧。我这个电脑它已经呼呼的在在转个风扇说明它说明它在那个占用资源,应该是占用比较高了,可以看这个活动监视器是吧?可以看下这个 cpu 的 资源,可以看下它这个这个内存嘛,显存欧拉玛是 接近三十个 g 是 吧?接近三十个 g 好, 然后这个地方三个都要打开啊,最重要的就是这个,把这个奥拉玛暴露到网络接口去,让他可以爱马仕进行调调用啊,这个是一定要打开的,这两个建议大家都打开啊,建议大家打开这第一个配置,第二的话看你的电脑的配置,像去下载 匹配的你的大模型,举个例子啊,你如果是八 g 的 显存,那你大概就只能下四 b 啊,看看八 b 的 都不一定能起得来,对吧。如果你是十六 b 的 话,你可以去下载八 b 的 这样一个 八 b 这样一个模型,是吧?或者九 b 都没问题。千万千万,三点五九 b 啊,如果像我啊,跟过老师的这个电脑,我可以下到三十一 b 啊,三十一 b 都是没问题的啊。这是第二个选,选对模型 最好啊,最好是选择新的模型,因为新的模型它会支持很多苹果的加速像,然后是推理框架啊,是吧?还有那个叫 metal 的 这个技术啊,就可以翻翻我前几次课程。这这第二个选对模型,第三的话配置项配置,配置错了它也会出问题的,比如说啊,你可以从这里去找口和那个 toc 数,必须得去设置啊, 这一个是一个是输出啊,一个是 context 对 文文本,对吧?你可以设大一些,其实在这个地方可以设设置啊,就是你在这个把它看这个,有个叫那个 叫 hammers, hammers, 模模型里面,对吧?有个叫模 model model 里面,你我告诉大家怎么设设置啊?在这里啊,我们第一次设置这个制定端点的时候,对吧?然后抓它的进程出来啊,这里因为你没有密码的,对吧?我假设设置是二, 哎,这个地方啊,最大的 token 数量,你一定要设置六万四千以上啊,我一般是八万或者十万都是可以的,因为我这个电脑非常强劲,如果你电脑不太好,只能是六万四,如果你少于六万四,它就会报错, 哎,回车,这就好了,最后一个配置项也是最最关键的,你看到了吗? customer 欧拉玛,这个地方我应该这么去改它哈, 为什么是这么改?这个是有逻辑有套路的啊。首先我刚刚说了温度啊,我把它设置为零点一,让它能够尽可能的发挥,是吧?这个你快速的看的,已经有了零啊,就不用管了。这个是 number, 是 c t x, 设置为一万六啊,最大的 g p u 是 九十九啊,它能够最大的去压榨我的 g p u, 我 这个 g p u 四十盒啊,其实你可以写四十都没问题的,这现成数量十六, top top p 的 话零点九,如果你的机器没这么强劲的话,你这个现成数啊,不要设置基数知道吗? 啊,还有这个 repeat last 的 n 就是 重复次数六六十四啊,把这个保存一下,最后重启啊,把它这个杀了,因为它不像龙虾,它有重启网关,它这个没有重启网关这个概念,你把它杀了重启就好了。

玩 hermes 的 朋友们举手,我看看你们平时是不是都在终端里敲命令,配个插件要改配置文件查个问题要翻日记,想看个对话记录得去翻目录,不是说不方便,是真的有点累。今天给你们看个好东西, hermes 杠 web 杠 y, 专门给 hermes 做的格式化管理面板,用了之后我只能说一句话, hermes 官方怎么还没把它收入进去? 咱们先看它到底能干啥?打开面板,一眼望去,八大功能模块整整齐齐排在那,每一个都对应 hermes 的 一项能力。第一个对话管理, hermes 的 多绘画流式对话,在这里直接用输出带高量体验,比终端强太多。第二个定时任务, hermes 的 crown 调度在这里变成了图形化编辑器,设个时间,选个参数点一下就行。第三个,多平台接入 hermes 支持的微信,钉钉、飞书、 discord, 在 这里统一管理和查看状态。第四个,模型管理, 你接的所有大模型, api key 自动扫描,分组展示,切换模型就是点一下。第五个技能插件,给 hermes 装新技能,不再需要手动编辑,配置在面板里可式化操作。第六个,记忆系统, hermes 的 绘画记忆、长期记忆、角色人设,这些概念全部变成可调节的界面控件。 第七个,成本监控,每次对话消耗了多少头,肯花了多少钱,折现图清清楚楚。第八个,日制和终端实时日制滚动显示,甚至还内置了个网页版终端,八块拼图凑在一起,就是一个完整的 hermes 控制台。来看看数据部署,只要两行命令,八个核心功能模块用量数据支持三十天趋势图表,简单到离谱。 部署就两步,第一步, npm install 一下,第二步, start 启动,然后浏览器打开就能用了,就这么简单。 你看这对比啊,传统命令行呢,配置文件手动改,出错了还不好排查,可示画面板呢,网页上点点就行,所见即所得。就这两行代码, npm 全局安装一下,然后 start 启动。当然也支持 docker 部署开源,免费的可以二次开发。 功能清单过一遍啊,流势对话、定时任务、多平台接入、模型管理、技能、插件成本、监控、日制终端全部都有,而且全是图形化操作,不用敲命令了。 再看看运维体验,左边呢,手动改配置,翻日制多平台,分别弄,新手上手挺难的。右边呢,网页上点点就行,日制时时看,多平台统一管理,零门槛。 好啦,今天就聊到这吧,这种格式化管理面板呢,确实让 ai 代理的运维省了不少事,快去试试吧!

最适合小白部署 hermes 的 方式非常简单,如果你想选择一个二十四小时在线的私人助理,并且随问随答,那么得益于阿里云的轻量服务器模型,通过阿里云来部署 hermes 一定是你最佳的一个选择。 首先进入阿里云,自己解锁进去,右边可以通过支付宝扫码登录,扫码登录之后,鼠标悬停在产品这个界面,悬停在计算这个界面,然后点击清亮应用服务器, 在清亮应用服务器的界面点击立即购买,立即购买有系统镜像,应用镜像这里,大家在应用镜像这里直接选用 hermes 的 agent。 目前 hermes agent 相比于 opencloe 的 话,它的整个的 tokens 消耗量下降在百分之五十以下,而且带有自学习的这个功能,更新迭代很快,更加的聪明灵活,所以说这是最近的一个热点的 agent。 在地域选择上的话,可以选择香港及海外以及内地,他的区别在于香港及海外一些应用服务,对外的话他是不需要备案的,在咱们内地受限于一些法律的条款,他需要对外服务的时候进行备案, 因为这里我们是用做自己的私人 agent, 所以 说不用选择海外,就哪里离你最近,你就选哪里就行了。那么我这里选的是成都,还有一个就是内地的话会比香港海外他的价格更便宜, 我选择成都之后,然后直接选择一年,这里可以看到他的价格目前是四百五十九元,但是当你第一次购买的时候,他是一折或者是两折的这样一个价格,就是当时我买的话大概就是六七十块钱一年, 这样试一试,点击立即购买就可以了,那么我这里已经买了,我就不再继续点击了。 点击立即购买之后,他就会翻转到现在这个界面,这里是已经给你部署好的 hermes 的 服务器,这里直接点击应用详情,在应用详情里面就有 hermes 的 agent 使用步骤。第一步,点击出场, 呃,目前的话,他只支持阿里的云百链,所以说你要在云百链注册一个账号,如果大家不知道云百链是什么东西,下一次课程里会进行一个扫盲,自己也可以去百度搜索进去注册一个账号,然后这里选择北京,根据自己的服务器地址,哪个地方最近就选哪里, 然后阿里云百链的 api key 自己粘贴复制一下,生成了之后,这里点击下一步, 点击下一步之后等个几分钟,然后的话右边就可以点击这个安全代理访问了,点击下安全代理访问,它是最新的 hermes, 已经给你有一个成熟的关于 hermes 的 ui 服务, 直接点击确定。如果不想了解那么多的话,这里就进入到这个 hermes agent 的 服务器端它的后台了, 他的后台的话,这里需要点击的就是这个配置,配置的话这里有目前你现在部署的模型,比如说现在是这个千万三点五 plus, 如果你有其他的模型,你就直接把这个剪切 剪切掉,然后把你想要布的模型从那个阿里云百链的模型名称给它粘贴进去就可以了。因为之前你是输过 api key 的, 所以说这里你输模型直接输入它就默认去消耗你 api key 这个账户里面的这个托尔斯的数量, 点击右上角的保存,点击保存之后,咱们回到这个清凉应用服务器啊,然后我们看一下刚才部署的怎么样了,是不是我们部署的这个千万三点五的这个模型,点击连接,远程连接,直接点登录, 这样的话就登进了我们的一个服务器里面,就是我们买的服务器里面 啊,直接输入 hermes 回车, 稍等片刻进入了 hermes 里面,你看到就已经提供服务了,然后这里有千万三点五 plus, 就 说明刚才你部署的是对了,那么在这个页面的话,我们的 hermes 的 部署就已经完成了,并且你可以在这里和它进行对话, 他的中文也是识别的,你可以直接打中文,他就回你中文了。如果你希望他以后一直给你回中文,你就说,呃,我希望你记住以后一直给我回中文,然后再打个回车,他就会记住你的编号, 支持的话 hermes 就 不锁完成了。那是不是这样 hermes 就 可以完全在线使用呢?是的,但是它目前还不好用,因为这个界面你和它的登进来进行呃访问,那么咱们下节课再讲怎么把它连接进入我们的微信, 进行远程访问,以及给它安装一些 python 的 库,让它去帮助我们进行具体的工作,谢谢大家。

现在我们来开始讲一下 mac os 上面如何安装 homes agent。 首先我们来打开这个 github 项目链接,地址,我等一下,我会放到我们的评论区中,我们向下滑 找到这条命令,点击右边的复制之后,我们在终端中打开,然后把这条命令给粘贴进去,点击回车,这里的话我已经提前安装过了,所以说我这里就不 给大家展示我一个完整的一个安装过程,安装完成之后他就会跳出这个配置界面,然后在这里的话我们首先选择大模型服务商, 再用我们的一个键盘的上下按钮,他就可以进行一个上下滑动的选择。然后我这边的话首先来选择阿里人,只要点击回车, 然后呢这里把你家里云上面的 ipad 来去粘贴到这里之后,这里这个 u l 地址的话就选择默认就行了,然后直接点击回车, 回到之后他这里有很多一个大模型来选啊,我首先推荐的呢是 iphone 三点六 plus, 因为这是阿里云最近新出的一个大模型,然后这里的话直接选择 no, 最后这里的话只选配置的是一个 tds, 嗯,这里的话直接选择一个第一个就行了,这里的话就选择一个第一个在本地环境中运行,我们直接回车,这里的话直接选 no, 我 们直接回车,这里一直回车就行了。然后这里的话就选择一个绘画重置模式啊,我们直接选择第一个就行了,这里的话我们也是直接回车,一路回车下去,然后我们直接选输入 no, 这里也输入 no, 对, 这里也是,这里也是,这里的话是在询问我们配置哪个社交媒体或者哪个平台来去做我们的一个 连接方式,我们最开始的话都不用理会这些,我们直接一直输入 no, 然后一路回车下去, 这里的话就选择一个操作界面,我们直接选出,我们目前是最开始阶段,我们直接选择在终端就好了, 这也是选择一些配置的工具,我们现在都不用管,直接返回回车,然后退出去。好了,现在我们就配置完毕了,我们直接在终端中输入 home, 但是第一个单词不要用大写,否则它启动不了,我们直接点击回车 好了。大家可以看到我们一个 home 十就已经启动起来了,有的话可以跟它这里进行一个普通的沟沟通交流。 home 十 agent 已经回复我们了,就是它是有一个阿里巴巴天问三点六 plus 大 魔性驱动的 ai agent 正在运行在 home 十 clean 的 一个环境中。

每天获得一款高质量开源项目第六十八期 hermes workspace 是 一个专为 hermes agent 设计的原声 web 工作区,具体的界面就是这样的,我这边内置使用的是 deep sec v 四的两个模型,因为 d p c k 的 活动优惠力度很大,用起来也不错。 这里一百万 token 差不多四元左右。下面显示一些任务详情和技能使用等等。这里还有一个联机聊天平台,点击就可以直接进入了, 里面都是一些真人。 welcome to the training grounds this is where every hermes agent begins you will。 然后就是主要的聊天区,通过聊天控制 hermes agent memory 帮你直接操作你的电脑。我使用的是威 no d 的 wsl 安装的 ubntu, 这样就与其他的 web coding 类似了, 但是多了一个自我净化的能力。这边是定时作业,每天会进行一次内容挖矿,花费就零点二左右。其余的功能我就不一一介绍了, 大家可以自己去探索。 hermes agent 主要的就是这个记忆和净化的功能,这边自己安装好了很多技能,还能将你的喜爱也写成 m d 后做成一个技能,这就是 hermes agent 净化的基础,原理大致就这样。