大家好,我把 hermes 桌面版做了国内适配,然后源代码已经开源到 git 上了,然后这里我会把链接放到这里,放到那个放到评论区啊,然后我们现在测试一下, 接入的是 minimax token plan, 然后这个软件呢,他们做的是比较好的,功能也比较多,比如说绘画,它会保存我们的聊天记录啊 啊,然后档案,档案就是智能题嘛,你可以创建多个智能题,然后看版,就是在这里我们新建任务,说干什么,做点什么事情,然后他就会自呃,智能题会去领取任务去完成啊。 模型这里的话,就我们写过的 api k 的 模型啊,都会显示在这里啊,这两这,这个是这个 tocom plan, 这个 呃,官网直接认证的,这个是写这个 api k 的, 然后提供商啊提供商,我现在加了好多个啊,去掉了这个 原有的一些啊, d p c cream, 然后智浦的, kimi 的 啊,差不多都有啊,然后 这个也是,这个也是本来是它国际版的,然后我改成国内版的,然后这些,呃,比较小众的,但是呢,它们在 他们这个比较熟悉的领域还是表现的比较好,也有这个需求,所以说我把他们加上了,哎,然后 mimo 也加上了 mimo token plan, 然后可以直接在这里可以直接登录啊, 然后技能呢?技能就他安装的技能原来就是英文的,这个 markdown 写的嘛,然后我们要是安装的话,他会显示中文的,这之前做过的已经就是没法改了啊啊,这就是我们也可以让他删掉啊, 可以保留一些好的,其他都删掉。而人格的话,我建议其实不用改的,人格就这样子,如果改的话他可能会去 丢失了原版那种感觉,就会去,可能会不听你的话呀,这样子,所以我不建议改这个人格 重置,可以重置就还原成这个。然后记忆的话,他现在是代理记忆是啥呢?代理记忆就是他,我们让他记住的时候记住我是我叫什么,然后记住我喜欢什么,这样子的啊?代理记这里没有,然后用户画像是 他就自己写的嘛,一般情况下我们也可以手动改,但是我不建议手动改,没必要。然后 用户发现他会应该会实时更新啊,他现在他现在已经百分之三十几了,虽然我我没有跟他聊太多,然后记忆提供上来,这里面就是 我也没没去删掉这些,但本地 s q l 这个我建议这个可以试一下这个可以试一下这个激活这个吧, 然后这些都是有的。这个这个是好像是中国的一个团队,还是反正有一个人就他做出来,大家可以用这个,我推荐这个。然后工具的话啊,这里边就是我们可以开着它的这个 skill 不 一样的工具是专门写这个 agent, 就是 写到 a 阵里头让它去原声调用的,所以说我我建议都开着,然后如果说 当然就说这些功能有些是需要配置 api k 的, 到时候大家配置一下,就可以在这个聊天里面配置一下,在这边是工具,这个没有说,没有做一个界面去给工具配置 api k, 这样子 让他自己配置一下。这个啊,计划任务呢?就是定时任务嘛,我们可以搞一个定时物啊,每天按小时按周,这个这个功能还是非常方便的, 如果说我们要跟这个 openclock 或者说之前呢,之前没有桌面软件的时候要交互的话,就跟他说计划任务,这样就比较麻烦的,这样就比较快,也可以可时化,我们也不会忘掉。 然后网关呢?我把我去掉了一部分啊,就保留了这个国内这些啊,我建议飞书啊,或者说这个企呃,企业微信,企业微信不是微信和飞书啊,微信和飞书都比较好,我建议这两个 如果后期支持的人多了的话,那就改一下,就改成这个直接可以扫一下二维码就可以配置这个渠道网关的,然后设置页面我也稍微改动了一下。啊,这里没改动,这里就是这里,就是在后台就改成我自己这个。 呃,开源的这个是吧?开源的这个这个这个项目他是我这个开源的是什么?我这个开源的是这个 我已经改过的啊我已经改过的,我已经改过的源代码啊,如果说大家会自己翻译的话,那就拿过去自己翻译就可以了,如果不会的话可以在我这购买嘛,那这个桌面版的话我会把源代码和这个安装包给你, 价格的话就二十九块九。因为我要去一直更新这个智能体本身的软件,本身他们更新的可能慢一点,但是智能体本身他们是每天可能是每天都会改吗? 然后我会在一周一次,每周末去更新一下这个智能体,然后大家可以在这个设置页面去更新呢。啊,已经是更最新版本的,是这个是我昨天搞的吗? 啊?这个是我昨天更新的,所以说啊,我建议大家就是如果说你可以自己变异的话直接在这拿,如果说你不会变异的话,那就 需要花点钱,我去还去一对一帮你去,这个也可以帮你部署或者说给这个使用方法什么的。然后是这里面,就是 啊,跟以前一样,就是这是是这些东西不用管的这远程啊,这些不需要,就本地嘛,主要在本地用嘛,然后如果说你电脑上安装了 openclaw, 它可以迁移到这里头,看它就发现了这个 openclaw 了,当然我这个 openclaw 也没用太多啊,它自己迁移了 啊,没关系,签吧签吧。 嗯,他应该迁移完了啊,然后主题啊这些 啊这些都不用管,总之就是已经成功了啊,欢迎有需要的大家去自己去拿元代码变异,或者说啊过来找我去 拿到这个元旦码和安装包,然后后续我会提供这个更新以及这个辅导这个使用。啊啊,谢谢大家。
粉丝242获赞7531

现在给大家完整演示一下,我先从另一台电脑把打包的压缩包发送过来, 我们先解压。然后这里我准备了 windows、 macos、 linux 系统的一键运行脚本和一键停止脚本,帮助不熟悉命令型的小伙伴更便捷。这里因为我之前已经有勾环境,所以脚本运行中没有去安装依赖。 这里自动打开 web 页面,我们输入默认密码,幺二三四五六进入管理台。在配置页面,我们可以自己去修改管理密码和 api 密钥,这里我修改一下, 然后我们点击保存。 ai 提供商,这里是正常 gemine、 opennine、 cloud 等供应商的 a p i。 添加 os 登录才是我们的重头戏。可以看到支持 codex、 anthrax、 gemini、 kimi、 quin 等授权登录, 这里就是可以把它们赠送的免费额度统一封装成 a p i。 我 来演示一下 quin, 点击登录,打开链接 这里。我之前登录过,就直接登录了,没有账户的小伙伴自己注册,就是不需要下载客户端 可以看见。现在认证成功,我们再测试一下 codex 支持的登录方式,很多,方便演示,我就选择 google 登录, 可以看到很简单就认证成功了。 认证文件这里,点击刷新就可以看见额度还剩多少 g p t。 五点四还是太香了,有 pos 会员的用户可以用这个管理账号轮询这里我批量添加了很多 codex 的 账号 功能,很实用,怎么使用?我们进入中心信息页面,可以看见目前添加账号支持的模型,这也是我们配置给 open core 和 hermes 等 ai 工具填写的模型名字。这里演示一下我新安装的 hermes, 打开配置文件, bios u r l 地址就是我们本地端口模型复制中心信息的模型名称密钥。在 f 文件中不会配置的小伙伴直接把 bios 密钥和模型名称给 ai, 让他帮你配置 好了。现在我们测试一下, 可以看到已经成功了, 我们可以去看看可选模型中添加的模型,可以看到 gptf 五点四 基本演示,就这样,我一下午都是跑,目前非常顺畅,然后想结束进程,点击 saf 脚本就一键结束了。需要便捷安装的小伙伴到文章底部用领取口令 自行领取吧。记得点赞关注。至于说如何批量注册账号,看情况反应,我看看下一篇要不要写。

你的 openclaw 和 hermes 还在花钱调用大模型的 a p i 吗?今天我教你用零成本本地部署奥拉玛,在你的电脑上直接跑大模型,还能无缝对接 openclaw 和 hermes, 实现免费玩 ai 智能题工具。首先介绍一下欧拉玛,什么是欧拉玛呢?欧拉玛是目前最简单的本地模型工具,在 windows、 mac 和 linux 上都支持,几分钟就能装好,八 g 内存就能跑。当然了,还是建议最少要安装十六 g 内存, 这样体验起来更加流畅。如果有英伟达的显卡,还能够使用 g p u 加速。了解完了欧拉玛是什么之后,我们来看一下欧拉玛如何安装。首先我们要访问欧拉玛的官网欧拉玛点 com, 它的首页是 一个羊驼抱着一个龙虾,下面的英文是 power open claw with ollama, 中文的意思就是使用 ollama 为龙虾赋能,从这一点我们就能看出它是全面的拥抱和支持 open claw 了。这也是为什么今天我要在 open claw 的 专栏里专门做一期 ollama 视频的原因。 废话不多说了,首先要下载欧拉玛,点击右上角的 download, 这里我们可以看到它有 mac os、 linux, windows 的 下载方式自动已经给我们定位到了 windows, 点击这个黑色的 download for windows 按钮, 就会弹出下载框,点击另存为保存,有点大,两个 g, 这个网速非常感人,所以我建议大家用迅雷来下载。 我们已经下载完了欧拉玛的这个安装包,下面我们就开始安装欧拉玛的安装有一个问题,就是它没有让你选择 需要安装的文件夹这个选项,它默认是安装到我们的 c 盘 user 底下的,如果你想安装到指定的文件夹,那你需要换一种方式,我们先把这个安装过程停止。 我们找到拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇拇 斜杠 d i r 等于这里写上我们的安装地址,也就是记盘的欧拉玛文件夹。打回车就跳出来安装界面,我们点击安装,大家可以看这里已经安装到记盘的欧拉玛这个文件夹下面。 进了这个界面,就代表着欧拉玛已经成功安装并且启动了。安装好了欧拉玛,我们再来看如何下载模型。在欧拉玛的网站上点击这个 models, 就 可以进入模型列表,这里都是可以使用欧拉玛直接下载使用的模型。我们来找一下 谷歌的 jam 四,这个是最近小模型中比较好的,可以通过这一句欧拉玛 ram 四来进行下载。 输入奥拉玛 ram 捷摩斯回车运行。安装完了,我们来跟他说一句话试试。我们在这里输入一个,你好打个回车。 好的,扎马四已经回复了我们,虽然有点慢,但那是我电脑性能的问题。大家可以看到现在已经成功地让大模型在我们的电脑上运行起来了。再下一步我们就来看如何把欧拉玛接入到 open cloud 中。 ctrl d, 我 们来退出欧拉玛,然后输入 openclaw config, 进入 openclaw 的 设置,这个我们直接选择本地运行,这个我们选择第二个 model, 打回车进入,然后我们要在这里找欧拉玛, 这个就是欧拉玛提示我们欧拉玛不可用。我们来重新编辑一下 openclaw 的 配置文件。 openclaw 的 jason, 这个就是 openclaw 的 配置文件。我们来找一下 allow 这一项,这里就是扩展的 allow 这一项,我们要在这里添加上 alama。 我 们来运行 openclaw config 来设置 openclaw 的 大模型。 选择默认的本地模式,这个我们选择第二项 model, 就是 设置模型,这个是选择模型的提供商,我们来找一下 alama, 这个是询问我们选择云服务还是本地模式。我们选择最后一个本地模式,这个是欧拉玛默认的 b、 c、 l。 回车,这个是有哪些可用的模型?只有一个,我们按空格选中回车确认 提示,我们已经把模型信息写入了配置文件,我们退出。我们回到 open 可乐,这里是我们 问了 openclaw 一 句你使用的什么模型,他们回,他回答,我使用的是谷歌的伽马四。我们这次的 olamata 下载安装以及安装模型,以及如何在 openclaw 中使用 olamata 模型。到这里就结束了,关注,我每次 都给大家带来一个 ai 的 新知识,感谢大家的观看,再见。

兄弟们,上期说了 a p a 就是 软件调用大模型的点单窗口,那在给预年纳什上部署的 opencloud hammers 配置 a p s 为什么要填一堆东西呢? base, url, api, key, modisk, token 什么的 密密麻麻,看着就头大,其实很简单啊,还是拿点奶茶来举例。 su 幺幺呢,就是店铺地址,你要先告诉软件,我要去哪家模型厂商点单,是 dsp 还是豆包。 a p i k 呢,就相当于你的支付密码,输入支付密码才能付钱,就是利用这个模型,所以这个东西如果你给别人了,他拿到你的 k 去点单钱,算你头上目的 id 就是 你具体要点什么奶茶。同一家厂商呢,有很多的模型,有的便宜,有的聪明,有的能看图,有的呢 适合写代码。具体的呢,可以去模型厂商的官网 a p i 文档里去查,也可以去问 deepsea 或者是豆包配置到模型 a p i 核心呢,就是这三样。这三个填好之后呢,其他的选项都可以让它帮你设置,学会点赞。

hermes agent 佳英伟达免费调用模型 hermes 就是 最近大家常说的养马,这期教大家如何安装。首先打开终端, 输入这条安装命令,安装 wsl。 wsl 是 在 windows 电脑上直接运行原声 linux 的 终端环境,无需安装虚拟机或配置双系统的兼容层, 安装完成会提示设置用户名及密码,我上次已经安装过了,所以这里没有显示终端输入 wsl 进入 linux 系统, 进入 linux 后会显示你的电脑主机以及用户名等信息。 escape 命令退出 linux 设置用户名的时候要注意不能使用阿拉伯数字或者大写字母密码,需要输入两次,且输入时在终端是看不见的。 现在我们需要安装 git。 git 是 一个开源的分布式版本控制系统,用于敏捷高效的处理从很小到非常大的项目版本管理,能让你随时记录并回退代码的每一次修改。进入 linux 输入命令安装 git, 这里输入刚刚设置的密码,一定要注意, linux 输入密码是不显示的,输入完点击回车。 hermes 在 代码编辑器使用比较友好,可根据个人习惯选择终端。首先进入 linux 输入安装 hermes 的 命令。由于我之前安装过 hermes, 大家的界面会和我不一样,安装完之后会显示 hermes 的 主页,直接 ctrl 加 c 退出,返回 输入命令,随便设置一个模型提供商,之后会修改 设置 nvidia api 的 face ui。 二、 设置调用模型的 api 我 们到 nvidia 的 ai 开发者平台登录 nvidia 账号, 点击右上角获取 apikey, 点击创建 apikey, 给 apikey 设置名字 选择,有效实现。选择 never expire 永不过期。扣屁一下 apikey 友情提醒,一定不要将自己的 apikey 分享给别人。视频中的测试 apikey 已删除,这里粘贴刚刚复制的 apikey 设置调用的模型,启动 hermes, 给 hermes 发一条消息,测试一下 大模型调用失败,输入 model, 手动选择模型, 给 hermes 再发一条消息到这里。恭喜你, hermes 已经可以给你打工了。这期视频就到这里,感谢大家!

这是我是第一次安装这个和 miss, 然后前面的硬件安装都还没有什么大问题,还是很低啥的,根据豆包的指示一步一步操作就好了。 然后是这样的,我就是在基础环境都装好的情况下,就进入了那个 api 调用的环节了,然后呢,这个豆包给的 api 调用指示总是错的,还一个劲的绕圈子,搞得我就有点急了,我想这边走不通,就去千问那边问一问, 结果他这边显示的结果比这包好不到哪去,没办法就去各个视频平台去搜相关的安装教程。但是其实我的核心问题就是就是 api 调用总是显示出错,然后就收到一些视频,最直接的说是显示错误的有几种,包括四零零、四零一,四零三,就是说四百零一是认证错误, 四百是请求错误,四零四是 u l 错误。然后我对照了一下,我这边先是四百零一出了问题,然后按照豆包的操作解决了,后面就是四百的错误,按照豆包的操作一直就是显示有问题, 说我的亏单是不是不对,但是按照豆包的要求改又不对,最后也是迷迷糊糊的碰到一个关键点,就是所有的 home 是 安装 都可以直接在 word 里面输入 home inspector 指令,它就会自动检查哪地方的安装出了问题,最后显示我的 a、 p、 i、 o、 k 输入不对,问了豆包之后就明白怎么改了,结果就搞好了,还是很开心的,希望分享给大家。

哈喽,同学们大家好,我是木贤,本期视频为同学们分享 harmony 的 computer user 的 使用教程,我们来了解一下背景, harmony 的 它通过去集成了一个叫 c u v driver 的 库,它就可以去操作 mac 电脑了。这个是 harmony 的 官方文档的说明,就是本次它支持的这个 computer user 仅限于 macos, 如果你是其他的操作系统暂时还不支持 好,然后他怎么去实现的呢?其实他就是通过这个 c u v driver 他 去提供的 m c p 来让这个哈密斯的对应的大模型能够去调用对应的 m c p 工具,从而去实现操作我们的电脑。然后我们来看一下这个 c u v driver 这个库, 这个目前是在 google 上面开源的, store 有 十七 k。 这个 cuv 给同学们解释一下为什么叫 cuv, c 的 话对的就是 computer u 就是 user a, 自然就是 agent, 就是 给 agent 提供了 computer user 的 这个能力 好,然后在文档里面其实我们可以看到就是这个 c u v driver, 它就是提供给 mac os 去用的,所以说自然 port 这边它就仅限于去支持 mac os 好。 然后本次给朋友们重点要去分享的就是它这个 工作原理,就是这个 cv driver 它的工作原理,以及我们使用 harp 机的去操作电脑时的一些实战的技巧。我们现在了解一下这个工作原理,其实这个工作原理它是比较简单的, 我们知道 harp 处理器它是集成了 mcp 的 功能的,所以它自然就能够去操作 mcp, 而这个 cv driver 它就提供了对应的 mcp, 所以 说 harp 处理器和 cv driver 就 通过 mcp 就 给建立起来联系了。然后就是 cv driver 它凭什么能够操作电脑来? 其实这个 cv driver 它不是因为它绕过了 macos, 而是它把 macos 开发出来的能力都给集成进来了,来去操作这个电脑 就包含了 icc b l t a p i, 对 应的就是 macos 提供的这个辅助功能,我们来看可以看一下,比如说我们在我们的设置里面,我们来搜索隐私和安全,我们就可以看到对应的有辅助功能,然后我这边的话已经把这个 cv driver 已经给它开启起来了。 这个辅助功能开启之后,对应的其实在 windows 上面也有类似的功能, windows 上类似的叫讲述人,就是他会把你的这个电脑,你当前打开这个界面,他长什么样,比如说我当前这个界面 在两边是空白的,中间有文字的描述,我的文档就类似这样子,通过语言的描述把你当前这个 ui 给你描述出来。 仅仅通过文字的描述,你担心这个屏幕长什么样?肯定还是不够的,因为很多时候很多 ui 它是文字描述是不够的,比如说一些视频剪辑软件,或者一些比较复杂的这个表格操作啊,这些就是通过 ui 的 描述是不够的。所以说还有一个 就是 macos 暴露出来的录屏的这样一个功能,我们同样的可以在这个里面看到,我们来搜索这个隐私和安全。这个下面 你可以看到有录屏和系统录音,就是比如说我们去用一些远程软件,比如说像向日葵啊,或者说 two disc 的 一些软件,它就会要求我们把这个功能给打开,其实本质也是把我们这个屏幕给录下之后,然后我们就可以去点击屏幕对应的位置去操作我们的电脑, 所以说借助于它重点就是这两个功能。但还有一些比如说窗口进程的投递,这些系统能力它全部给整合起来了,所以说这个 c u v driver 它就能够去操作我们的电脑,并且它还做了一个事情,就是把这些操作能力都封装成了 a t 的 能够使用的就是这样的一个步骤, 就是我们可以通过去截屏,然后截屏之后找到元素的这个位置,比如说这个元素它可以去点击,或者这个元素它是一个输入框,可以去输入文字就等等的这些操作,然后找到这个元素的,所以之后我们就可以去执行对应的操作,比如说去 鼠标点击或者敲回车啊这些,然后最后就会去验证这个操作,就整理下来就是 a 镜头的这个工作流,就查找我们店了这个工作流, 然后这样的话 ai 它既可以去读取 ui 的 数,并且可以去调用这个控件的动作,本质就是这两个能力, ui 数通过 x c b 二 t a p i 提供,然后调用控件就是结合 screen recording, 因为它读到屏幕之后,它可以去点击对应的所有的位置, 然后也可以借助于截图做视觉定位,做结果的验证。从前半部分来看,我们可以知道就是因为他要进行视觉的定位,还有就是结果的验证,所以他就肯定要这个大模型能够去理解视觉, 因此 computer user 如果要做通用的 computer user, 最好接入支持图像理解的多模态大模型,其实也不是说最好,就是应该是必须要接入, 必须要借助支持图像的一个大模型,它才能去做世界定位和结果验证。成人本的模型可以做辅助规划和分析,但是单独使用就会受到限制,那这个是它的工作原理, 那下面呢?我们来开始进入到实战环节来去实际看一下。首先的话我们需要升级哈密斯的版本,这个我们可以跳到哈密斯的 get 哈卜这边,它的描述 就是你得升级到大于等于这个版本的 harryson 的 就是零点一四这个版本,它对应的发布日期是二零二六年五月十六号这个版本在这个下面的描述里面,我们这里可以看到它就支持了 computer user 的 这个能力。 好,这是第一步升级,然后之前我给同学们分享过了 hermes 的 安装以及升级的教程,然后所以说这边如何去升级 hermes, 我 就不展开讲解了,我们可以打开我们的终端,通过 hermes 干大 v 可以 看到我当前这个版本就是满足条件的,现在我们继续来回到文档, 就是我们 hermes 满足之后,下面我们就可以去安装 cpu driver, 直接执行 hermes 提供的这样一个 computer user 的 命令,直接去执行 好,因为我这边已经安装过,所以说比较快,并且他提示我已经安装了,然后他就会提示我们需要去保证,就打开我们的系统设置,然后个人和隐私去把 cpu driver 对 应的这两个权限给打开,那同学们看到这个不要着急啊,就说你会觉得这个操作比较复杂,其实没有关系, 因为你再去使用这个 cpu 抓板,他只要触发了这个操作的时候,他就会弹出这个弹簧出来,那你去给他设置对应的权限就可以。好,然后下面是我们可以去查看我们安装的这个状态。 好,这个 status 这边我们可以看到已经处于 excel 的 状态,就我们就安装好了。安装好了之后,下面我们就可以通过 c u driver status, 你 可以检查你的 c u driver 是 否已经处于 running 的 状态,如果说它不是 running 的 状态,那么去执行这个 service, 把它给启动起来就可以了。我们看到我这边已经启动起来了,所以说 就重新再启动,就不会再发生任何的变化了。这个是安装仪检查我们的 c u driver, 那下面我们就可以来开始使用 computer user 了,使用之前要给同学们多讲一些东西了,就是我们使用 computer user 就 也也不是说那么多 简单,就是需要给同学们去讲一些技巧,这个技巧我把它沉淀为了一个 scale, 并且这个 scale 我 已经提前安装好了啊,这个 scale 也会直接给到同学们,我们通过 scale sniff grape computer 给同学们来看一下,对应的就是我去写了一个 computer user helper 的 这样的一个 skill, 我 已经把它安装到我的 harness 这个 default 这样一个镜头下面了。好,那么这个 skill 讲了什么呢?这边给同学们来看一下。 这个十六的核心就是我们用来限定和指导马克威斯的操作,根据操作类型去选择最合适的技术再执行啊。这边有很多内容,我就不带同学们一个一个看了,我们直接拿到下面这个表格,这边给同学们来看一下。 就是举个例子,比如说我们去打开一个应用,这个打开应用通过 c u driver 能不能实现呢?是能实现的,怎么实现?就是它会去读到你这个电脑的 u i, 然后比如说你要打开 wps, 那 么就点击这个 wps 就 去打开了,但是 有没有更快的方式来?其实有的,我们直接通过 open 干 a 指定我们用的名字,这个反倒是比 c u java 还要更快的,因为你没有去执行视觉的这个识别,以及去点击这个操作,这个直接通过 open 命令一含就可以实现,所以说我们就不需要通过 java 去 执行那其他的类似的,比如说我们要激活一个应用,我们要让应用去全屏,这些我们都不建议 去执行 c u a driver, 而是直接用最快的这种方式去操作。那什么情况下我们要使用 c u a driver 来,比如说我们要读起 u i 数,要点击按钮,菜单输入框这些,那么我们就要用到 c u a driver, 所以 说我的这个 skill 呢,就是 会分析用户的这个操作的诉求,然后给它执行对应的动作的时候,就会优先去选择最合适的操作的时候就说没有安装。我的 这个看屁了,用着黑粉的话,他就一味的去盲目的使用各种技术,这个我也是在这个地方踩了很多坑,就是执行了一个操作,执行了很多秒,最后还没有去完成啊。这个这个朋友们可以看到,我这边的就是这个操作花了很久的时间,但是没有完成, 然后就是建议直接通过聊天通道来去管理 computer user, 这样它不会导致光标输入、聚焦位置这些发生变化。因为如果说我们直接在这个终端里面去操作 hermes, 比如说来给同学们演示一下哈,好,我们直接终端里面输入 hermes, 那这个时候,比如说我们直接让他帮我们打开浏览器,帮我打开谷歌浏览器,然后在浏览器输入框 里面输入 b 站链接,好,就是这个操作,那这个操作因为我本身是在当前的这个 harmless ui 里面去操作的, 那这个时候因为你要操作浏览器,所以说这个时候他又跳到了其他的这个界面上,比如说我们可以了,刚刚我没有操作这个是他自动跳转过来的,跳到浏览器这边,然后下面就我们在这个时候你看,比如说我们通过这个终端里面又跳回来,并且他会询问我们各种权限,好,这个权限我给同学们来截个图啊,这里 再截个图给他定到这里啊,因为这个地方如果说我们六十秒不去允许这个操作,他就会超时了,所以说我先把这个图定下来, 然后给他们最大的这边我已经把对应的这几个权限什么意思给他们来梳理了一下。首先第一个就是允许一次,就是允许这个 come on l, 那 下一次执行 come on l 他 还会继续去问。第二个就是允许在这个绘画里面去操作,比如说我们这个地方后面再来一个 come on l, 他 一般就不会再问了。不像第一个每次都还要去问, 那对于其他的动作,比如说点击啊,输入啊滚的这些动作,那肯定是还会问的,只是说这个 come on l 他 不会再问了, 那 come on l 是 什么意思啊?其实就是比如说刚刚我们可以看到让他帮我们打开浏览器,如果在浏览器里面我们输入 come on l, 我 们我们可以发现就是把这个光标直接聚焦到这个浏览器的输入框里面去输入,所以它会提示我们需要这个权限。好,然后第三个就是 我们直接就永久的去加入白名单,这个是我比较推荐同学们去设置的,就如果说你在 通过终端里面去操作哈密斯的时候,他寻觅你这个权限,你就直接选择第三个,他这个的字面意思是永久加入白名单。在这个 computer user 的 场景里面,我分析了它的原码,它的实际的效果更接近一点就是你在本次运行哈密斯的期间,你后面任何的这个操作, 就包括你的这个 key, 就是 键盘嘛,然后点击 click, 然后这个 type type 就 type script, 就 打字去输入,它就是滚动,这些操作它都不会再问了,就说你就直接去允许一次,那后面就都不用允许了,这个是要同学们,同学们去做这个操作了。 第四个单就是去否定你的权限单,就是不不让他允许执行这个操作,这就是我们在这个中单里面去执行这个 哈密,随机的就插上电脑就有很多的这些材料框框的一些限制没有那么方便,所以我就比较推荐同学们直接就是我们通过聊天通道的方式去操作。好,那下面呢?我现在把这个截图给删掉了, 下面我们就来通过聊天通告的方式来去管理 computer user, 好, 我直接在手机上面进行操作。好,这边我就比如说我这边就直接进入到牛魔王的这样一个对话里面,因为这个就是我绑定的 default harness 的 这个 agent。 好, 然后我来给他说 帮我打开我电脑上的谷歌浏览器,好,直接来发送给他。 好,我们可以看到这边有对应的返回消息,这个时候你可以看到我这边手势没有做任何的操作的,我们等他去操作我的电脑。 好,这里我们可以看到就是已经触发了两个 skill, 一个是 computer user 的 skill, 一个是我们自己实现的, ok, 我 们可以把这个电脑它已经帮我们打开了,还是比较快的哈。然后现在我们再给他下载一个任务,就是在浏览器里面输入 b 站的链接,然后打开 b 站的网页, 在浏览器的链接输入里面输入 b 站的链接,打开 b 站。 好,其实这个其实它属于浏览器自动化的一个操作,但是我们可以通过 computer user 的 方式,同样的是能够实现的。 好,我们等待一会儿啊,等它去执行。好,这个其实同学们可以看到就是这边操作一步,它就会把这个日字给打出来,就这个也是我们 computer user helper 这个 skill 里面给写进去的,就操作一步就要把单行的 操作的信息给输入出来,这样方便我们用户看到他当前执行的是哪个操作。 好,我们稍等一会儿啊。 ok, 我 们可以看到这个 b 站也已经成功的去打开了。好,这个时候比如说我们再来给他下载一个任务,关于视觉的, 在 b 站里面搜索程序员儿目前查看他最新的五条视频,并且把他最新的,并且把他最新的这五条视频的名称发给我。好,然后我们再来发送。 ok, 我 们来看一下这个效果啊,这个时候其实我们可以看到它有点偷懒了,它就并没有去直接在这个页面里面去操作,而是直接走它内置的这个浏览器里面直接去搜索了。啊,我们那这个操作我们先给它结束一下, 那我们直接给它结束, 直接执行这个 stop 就 可以结束。 然后我们现在让他做另外一个事情,帮我打开电脑上的 wps 软件,来这里走一个。 好,我们可以看到他很快就帮我们把这个 wps 软件给打开了, 这边它也提示了它去已经找到最新的五条视频的标题,因为它这个地方它是直接走它内置的浏览器跳转过去,没有直接走我们操作电脑这种方式,所以我们直接给它停了,现在我们给它下到了另外一个任务。好,然后现在我们让它帮我们创建一个 excel, 点击新建按钮,帮我创建一个 wps 的 空白的 excel。 好, 直接走一个。好,它这边提示它会通过 g u i 帮我们在 wps 里面点击新建,创建一个空白的 excel。 好,这个时候我全程这个手是没有去操作的。好,注意,我们其实看这个里面就是我们要把应用置到最前面,这个是非常关键的,因为他去截图的时候,你要把你的应用放到最前面,这样才能更方便他去截到图, 我们可以让它找到了新建按钮,现在它点进去这个步骤啊,你可以看到其实对于人来说是很简单一个操作,但是对于 wps 它就没有那么的方便了。好,它找到了表格了,现在它要继续点击创建表格, 好定位到空白表格这个地方,一个日期里面可以看到它是在分析这个页面它是什么页面,然后再用,然后它再根据这个判断决定走什么操作。 ok, 我 们可以看最终它完成了把我们新建的一个空白的表格好,然后这就是 computer user 的 演示,就整体而言它是能做到 computer user 这个操作的, 但是就是每一个步骤其实并不是那么的快,有一部分原因就是我当前录制是用这个四 k 画质的,同给同学们去录制,所以说这个 他再去结合到我这个画面去识别画面的时候,这个图片比较大,就导致他推你的速度比较慢,所以就会整体而言执行的速度会慢一些。 然后另外的话就是目前就 computer 这一块我觉得还有很长的路要走,就是稍微一些复杂的画面,一个就是要么执行失败,要么就需要等很久, 后面 computer 又有一些更新的操作,也会及时给同学们更新上来,然后同学们有关于自己的一些想法,也非常欢迎在评论区留言讨论。好,我们本期视频就到这里,我们下期视频再见。

大家好,前几期大家对 hermes agent 已经基本入门了,今天要跟大家讲解一下系统性的东西,也是它的核心点。内容包含主配置的关键配置,从 hermes slash 目录结构到 config org org md 的 核心设置, 一次性给大家讲透,咱们直接进入正题,先看看 hermes 的 配置目录结构,所有配置都存在波浪线斜钢 hermes 斜钢目录里,方便访问、管理和备份。这个目录下有几个核心文件,第一个是 config dot emo, 主配置文件管模型、终端 t t s 这些设置。 第二个是 ib 文件,存 a 片密钥和敏感信息。第三个是 author jon o o 凭证,比如 news portal 的 认证。第四个是 so dot md a 键的身份定义占系统提示的第一位。第五个是 memories 文件加持久化记忆,有 memory dot md 和 user dot md。 第六个是 skills 文件加管,定时任务 sessions 文件加管,网关绘画 logs 文件加存,自动脱敏的日制。 记住一点,所有配置都在波浪线斜杠 hermes 斜杠目录里,方便统一管理和备份。目录结构清楚了,那具体怎么管理这些配置? 接着看 hermes 的 配置管理命令,很方便。想看配置,在终端输入 hermes config 就 能看到当前所有配置。想编辑的话,输入 hermes config editor。 想设置配置,用 hermes config set kz 为 vl, 比如设模行为 anthropic 斜杠 cloudops 是。或者设中后端为 docker, 检查配置有没有缺失,跑一下 hermes config check, 想交互是添加缺失选项,用 hermes config me great。 设 api 密钥时,输入 hermes config set open router api k y k r 会自动存到 in v 文件里,这里有个很实用的特性叫智能路由。 hermes config set 命令 会自动把值存到正确的文件 a p i 密钥存到因微其他设置存到 config 的 emo, 这样就不用担心把密钥物写到配置文件里了。配置管理命令讲完了,那这些配置的优先级是怎样的?往下看。 hermes 的 配置优先级从高到低分四层, 第一层, client 参数优先,即最高,比如跑 hermes chat model enterprise, 斜杠 cloud sonit 四,这次调用会覆盖其他所有配置。第二层, config 到 emo 文件组,配置文件管所有非秘密设置。第三层, indiv 文件环境变量回退存必须的秘密信息向 api 密钥,令牌密码。第四层,内置默认值,啥都没设的时候会用硬编码的安全默认值。有个经验法则要记住秘密信息,比如 api 密钥, 机器人令牌密码放 indiv 文件,其它设置像模型终端后端压缩设置内存限制,工具级放 config 到 emo 文件,两者都设了的话,非秘密设置以 config 到 emo 为准。 另外, config edu 里可以用美元符号大括号 var name 引用环境变量。比如 auxiliary 的 vision 配置里 api key 设成美元符号 google api key base url 设成美元符号 custom vision url。 注意,只支持美元符号大括号 var 的 语法,不支持裸美元符号 var 优先即清楚了。接下来看看终端后端的配置。 hermes 支持七种终端后端决定 a 阵的需要,命令在哪执行。 第一种是 local, 直接在你机器上跑,没隔离,适合开发和个人用。第二种是兜客,在兜客容器里跑,完全隔离安全。沙乡环境。第三种是 s s 区,通过 s s h 连远程服务器, 跨网络边界,适合远程开发。第四种是 model model 云,沙乡云端虚拟机,适合临时计算。第五种是 dayton 的 dayton 的 工作区托管的云环境。第六种是 versa sandbox versa 沙乡云微虚拟机,支持快造词久化。第七种是 singularity 容器,适合高性能计算集群和共享机器。拿 docker 后端举例,你可以在 config dot emo 里配 docker image, 指定用 nicole 斜杠 python node js 冒号 python 三点一一 node js 二零镜像,还能配 docker forward env 转发还变量像 gitupoken 配 docker volumes, 把本地目录挂到容器里,还能设 container cpu, container memory 以及 container persistent, 要不要持久化?容器终端后端选好了,接下来看看记忆系统怎么配。 hermes 的 记忆系统得先分清记忆和技能这两个概念。 记忆存的是事实,向你的环境偏好项目位置, it 学到的关于你的事。技能存的是过程向多步骤工作流工具、特定指令可附用的配方。 简单说,记忆管是记忆性能或者什么。记忆系统有两个核心文件,第一个是 memory dot md 持久化记忆文件, memory enable 设为 true memory char limit, 设呃两千二百字,大概八百个 token。 第三是两千 dot md 用户档案文件 user profile enable 设为 true user char limit, 设一千三百七十五字符,大概五百个 token。 有 几个记忆管理技巧要知道,第一 记忆容量有限,大概两千两百字,幅满了 agent 会自动整合。第二,你可以跟 agent 说清理你的记忆或者替换旧的 python 三点九笔记,我们现在用三点一二。第三, productive session 结束后跟 agent 说,记住这个已被下次使用。第四记忆是冻结快照, session 里的改动要到下一个 session 才会在系统提示里出现 记忆。系统讲完了,接下来看看最重要的 so dot md 文件。 so dot md 是 agent 的 主要身份定义,占系统提示第一位,完全替换内置默认身份文件,位置在波浪线斜杠 hermit 斜杠 so dot md 或者美元符号 hermit home 斜杠 so dot md。 如果 so dot md 没了,空的货架再不了, hermes 会退回内置默认身份, hermes 会在文件不存在十自动生成默认的 so dot md。 你 可以编辑 so dot md 来自定义 a 键的身份。比如,你是个专业的 ai 助手,专注软件开发和技术咨询。性格特点包括耐心细致, 善于解释复杂概念,注重代码质量和使用实践,乐于学习和改进。专场领域包括 python、 javascript、 type script 开发、 devops 和云计算系统架构设计。 hermes 用两种不同的上下文范围,第一种是 soul md, agent 的 主要身份始终独立加载。第二种是项目上下文文件,像 hermes md 或 hermes md。 项目特定指令优先级最高。还有 agent start md 也是项目特定指令和编码约定,会递归便利目录以及 cloud dot md clock 的 上下文文件只在工作目录生效。注意,项目上下文文件用优先级,系统只加载一种类型,首 次匹配获胜。 so dot md 讲完了,最后看看技能系统,技能系统用来存过程性知识,什么时候该建技能,如果你发现一个要五步以上还会再做的任务,就让 agent 给他建个技能。比如你可以跟 agent 说,把你刚才做的纯成名叫 deploy staging 的 技能, 下次只要输入斜杠 deploy staging, agent 就 会夹在完整流程技能的位置。在波浪线斜杠、 hermes 斜杠、 skill 斜杠目录下,每个技能是个文件夹,里面有 skill dot md 文件和 scripts 子文件夹 技能。用 skill manage 工具管理, agent 创建的技能会自动存在 skills 目录里。技能有四个好处,第一,程序性记忆, agent 创建并附用的流程。第二,跨 session 持久化,所有 session 都能用。第三,自我改进, agent 用着用着会优化技能,一键调用书写纲, skill name 就 能快速执行。 核心内容讲完了,最后总结一下,回顾一下 harmony agent 配置的核心要点。第一,目录结构,所有配置存在波浪线斜杠、 harmonies 斜杠目录里包括 config comfy 等文件。第二,配置管理,用 hermes comfy 命令查看编辑和设置配置智能路由到正确文件。第三,优先级规则, client 参数优先级最高, 然后是 config comfy, 再是 in v, 最后室内自默认值。第四,七种终端后端按需选合适的。第五,记忆系统, memory dot md 存时是 user dot md 存用户档案,容量有限,但能管理。第六, stored md 定义, a 证的身份,占系统提示第一位,可完全自定义。 第七,技能系统纯过程性,支持五步以上任务键,一键技能支持一键调用。如果你再用 hermes agent 或打算部署 ai 助手,建议仔细看看官方文档,合理配置各个模块, 用起来会更稳定、更个性化。我是大叔,大实测验证并整理。如果你觉得这个配置指南有帮助有用,请点赞收藏,后续会持续更新 hermes agent 的 相关内容,感谢观看,咱们下期再见!

兄弟们,你们要的在 hermes engine 中用网页大模型代替我们 api 的 解决方法来了,下面我们用一分钟的时间来实操一下 windows 用户的话,得到这个 excel 的 文件安装包,直接安装好的话,主界面就这样了, 我们在设置里面把它的文字改为简体中文,然后再点击供应商,这里我们添加一个单元格型,这里我就以字谱为例,选择之后直接点下一步,然后点击 os 登录方式,打开 os 登录,然后我们就像以前登录字谱的官网一样去登录它就完了。登录好了之后,我们就点击添加账号,相当于现在已经有一个 字谱的账号在这里了。然后点击左侧菜单栏,点击代理设置里绑定地址的话,如果是自己用,那就按着这个上面默认的就可以更改。然后点左侧菜单栏的 api key, 我们打开认证,新建一个 api king, 这里的名称和 king 可以 自动生成就可以,然后我们接入 api 的 base url 的 话就填上面那个, 然后模型名称填下面那个,那么这里面的所有的操作我这里都已经整理成了一份指南,如果大家有需要的话可以在评论区留言。接着我们打开我们的 harmony, 然后这里面输入 harmony 默认,接着我们往下翻一翻,找到自定义接入 api 的 方式,然后点击进去,然后我们把我们刚才的 s、 u、 r、 l 复制过来,然后下面把 api king 也给复制过来,然后这里点击回车,然后我们查看一下所有的可用 api 列表,好,这里发现智普的 g、 r、 m 这里都有了。

今天我想聊一篇关于 harmis agent 多入口架构的文章。一个 agent 的 项目做到后期,核心能力已经不只是命令型问答了。 用户希望他能跑在终端里,也能接 telegram, discord slack, 还希望有更现代的 t u i, 甚至能被编辑器或 api 调用。这时候最容易走错的一步是给每个入口都写一套 agent。 hermes 没这么做,它的核心思路是 a 键 loop, 尽量统一入口层,各自处理交互形态。 我们先看 hermes 的 核心拆分, ai ai 证负责构建 system prompt, 管理对话历史调用模型,执行工具处理上下文压缩,还有 memory to do、 session 等状态管理。 但用户如何输入,如何展示,如何审批危险命令,如何恢复绘画,这些并不属于 ai agent。 t i 点 p y 面向交互终端处理 prompt 下划线、 toki 输入和 rich 展示 getway, 面向消息平台处理平台 adapter 和异步消息。 t u i 面向液体界面, tapisk 负责渲染, python 负责 agent 逻辑。这个拆分很关键,如果把所有 u i 逻辑都塞进 ai agent agent loop 会变得无法维护。 classic c l i 是 最后的本地入堂,赫尔氏科一管的事情非常多,加载配置你人情 睡至完啦,贵惯的数据太特别,自带太特别,这种对网关的酒肯定非常的追震。 输入历史与使命 ai agent 维护对话历史处理各种 slash commands 处理图片附件和剪贴板处理审批和密码输入,退出时清理资源,写入 siit 三审。 它承担的是完整的本地产品体验,而不是 agent 推理本身。 c l i 的 一个重要特征是它和用户在同一个 terminal 里实时交互。危险命令审批、 soluto 密码、 secret 输入都可以通过 prompt 下划线。 tokyo 在 本地阻塞等待、 德瑞面向 charlie、 greg、 discord、 slack、 whatsapp 等平台。它和 c l i 最大的不同是长期运行的后台服务, 这带来很多问题。多个平台同时连接,多个聊天同时发消息,同一个 session 可能跨很长时间继续,用户可能在 a 阵正忙时继续发消息。危险,命令不能用 terminal point, 要通过消息平台审批。 其中最值得注意的是 agent cache 机制, data 会按 session 缓存 ai agent 时利用来保留 point caching。 如果每条消息都创建新的 ai agent, 就 会重建 system prompt, 破坏 provider 的 prefix cache, 成本会大幅上升。 所以 data 不是 每条消息新建一个 agent, 而是用 session key 映射到缓存的 agent 时,历 该会下。不能只用一个 session 下划线 id, 因为消息平台里同一个用户可能在不同群、不同 thread、 不 同平台里和 agent 对 话。 comis 用 session 下划线 key 作为核心,抽象格式是 agent main 平台聊天类型聊天 id session store 会根据来源生成 session key, 再映射到真实的 session 下划线 id。 这个设计的好处是,平台路由使用稳定的 session key 数据库存储,使用 session id resume 可以 把某个 session key 切到已有 session id reset policy 可以 按平台和聊天类型生效。 session key 不是 装饰质段,而是 getaway 运行时的主键。 多路口系统很容易出现命令漂移的问题。 c l i 有 某个命令,挑了官,帮主里没有 slack 支持某个命令。 c l i auto complete 又忘了别名 hermes 用 c o m m a n d 下划线 r e g i s t r y 解决这个问题, 每条命令是一个 command def, 包含名称描述,分类,别名,参数提示,还有 k i i 下划线 only 和 getaway 下划线 only 等标志。 然后所有下游都从这里派生。 c l i help getaway help telegram 命令菜单 select 命令映设,自动补全命令解析, 新增命令的主要动作是先加 command def, 再在对应入口接 handle, 这就是中央注册表的价值定义,统一暴露可控。 hanis t u i 拆成了 node 和 python 两个进程,域态是 increact, 负责终端 ui 渲染。 t 太下划线,该位是 python j s o n r p c backend, 负责 agent 逻辑和工具调用,这不是多此一举,而是非常务实。 ink 更是合作复杂终端 ui。 python 进程已经拥有 hems 的 agent 和工具生态, 强行把 agent 移植到 node 代价太大,强行用 python 复刻现代 tui 体验又很难做好。 还有一个重要细节, python stodo 被重定向到 stare, 保留真实。 stodo 专门写 j s o n r p c 防止普通 print 污染协议通道。 t u i 里还有个 slash worker, 是 一个持久的 c l i support, 专门执行 slash command, 最大限度附用 c l i 逻辑。 horis 多入口架构的启发很实际,不要把 agent 做成 u i, 也不要把每个 u i 做成一个 agent。 更好的方式是, agent 是 能力内核工具系统是统一执行层, session, db 是 历史事实层, command register 是 控制面。 c i gateway t u i 是 不同交互外壳 入口可以继续增加,但核心能力不需要复制。代价是入口层会变厚,但这是合理复杂度, 真正应该避免的是把交互复杂度推回 ai agent, 或者在每个入口层会变厚,但这是合理复杂度,真正应该避免的是把交互复杂度推回 ai agent loop, 用统一内核承载能力,用入口适配器承载体验,这就是一个 agent 从 demo 走向产品时必须跨过的架构分界线。我是林深健, ai 我 们下期再。

curser 一个月二十美金, github co pilot 一个月十美金,你算过没有,光 ai 写代码一年就要烧掉两三千。今天我给你找到一个开源平替,零成本,效果不输 sonit, 这就是 hermes agent。 hermes 是 一个开源的 ai agent 智能体,它能写代码,能跑终端命令,能读取文件,能联网搜索,就像一个长在大模型脑子上的全能秘书。 最关键的是,它完全免费开源。你可以接通一千问 deep seek、 智普等任何国内大模型的 api 来用。 开始之前先确认环境。 windows 用户去微软商店搜 opentwo, 一 键安装 wslr, mac 和 linux 用户直接打开终端就行。 确保装了 curl 没有的话,用包管理器装一下。都准备好了吗?那我们开始安装 一行命令,安装 hermes, 复制这项命令,粘贴到终端里,回车它会自动检测系统,创建虚拟环境,下载依赖全程,不需要你点任何下一步,装完之后直接用。 注意,如果 curl 报错,先运行 suido app install curl。 安装好之后,配置 api 密钥, 推荐用通一千问,国内稳定,有免费额度。去阿里云 dashgo 平台注册新用户,送一千万 tokens, 把 api key 复制到配置文件 config eml 里,保存退出。你也可以用 deep seek 智谱或者归机流动配置文件里改一下就行。 配置好之后,终端输入 hermes 启动等几秒钟加载配置,看到提示符就成功了,随便问他一句,他就能正常回复。全程不到三分钟,零成本, 光会聊天没意思,让他干点正事。我让他分析当前目录所有排放文件的功能和行数, 它会自动搜索文件,逐一读取分析理解,然后输出结构化的分析报告。这还只是冰山一角,它能写周报,批量处理文档,自动部署代码。这种自动化干活的能力,普通 check gpt 网页版做不到。 总结这七三个重点,第一, hermes 是 开源免费的 ai agent, 能做实事,能落地。第二,国内用户用通一千问 api, 完全免费,不折腾。第三, wslr 一 行命令安装,全程不超三分钟。 下一期教你让 hermes 接入你的私人知识库,让你的几百个技术文档、项目笔记、客户资料全部能管起来。有问必答,我是老胡,关注我,下期见!

大家好,我是大叔,只说真话,只做实在事,只给干货。大家好,昨晚本来想着早点睡觉了,结果看到后台多了几十条私信,大家都在问同一个问题,就是怎么在同一台电脑上运行多个独立的 hermes agent。 如果用同一个配置,很容易搞 appme, 互相干扰,记忆和绘画历史也混在一起。 hermes agent 提供了 profiles 功能,可以完美解决这个问题。认真看完这篇教程,你将学会创建和管理多个 profile。 三种克隆方式,命令一 p 标志年性默认值的用法, 配置独立网关和机器人令牌,还有更新、导出、导入和删除操作。咱们直接看内容来。先了解一下什么是 profiles。 简单来说,就是一个独立的 hermes 主目录,每个 profile 都拥有独立的配置文件,包括 config 点 emo 点 inviso 点 md, 还有独立的记忆数据库、绘画历史 技能库和状态数据库,这样就能为不同目的运行独立的 agent, 比如变成助手、个人、机器人、研究 agent, 它们互不干扰,完全隔离。最方便的是创建一个叫 code 的 profile, 马上就能用 code chat、 code setup、 code gateway start 这些命令。好了解了概念,咱们看看怎么用。快速开始非常简单,只需要三步。第一步,执行命令 hermes profile create code, 这会创建一个名为 code 的 profile, 同时自动生成命令别名。 第二步,执行命令 coder setup, 按提示配置 api 密钥,选择模型提供商,设置默认模型。第三步,执行命令 coder chat, 就 可以与 coder 这个独立的 a 键开始聊天了,就这么简单,一共有三种,满足不同场景需求。第一种,空白 profile, 执行命令 hermes profile create my bot, 这会创建带有捆绑技能的全新 profile, 然后运行 my bot setup, 配置 a p i 密钥模型和网关令牌。第二种,紧克隆配置,执行命令 hermes profile create work 加 clone 参数, 这会复制当前 profile 的 config 点 emo 点 n v 和搜点 m d 共享相同的 api 秘钥和模型,但拥有全新的绘画和记忆。第三种,克隆全部内容执行命令 hermes pay profile create backup 加 cloneout 参数, 这会复制所有内容,包括配置, api 秘钥、个性、所有记忆、完整绘画、历史技能、定时任务插件、相当一个完整的快照备份。你还可以从特定 profile 克隆,比如, 比如执行命令 hermes profile create work 加 clone 参数,再加 clone from code, 这样就能从 code 克隆配置到 work。 创建好 profile 后有三种使用方式,第一种,命令别名,这是最方便的,每个 profile 在 波浪线斜杠点 local 斜杠被斜杠名称目录下,自动获得命令别名。 比如你可以直接用 code chat 与 code agent 聊天,用 code setup 配置 code 的 设置,用 code gateway start 启动 code 的 网关,用 code doctor 检查 code 的 健康台,用 code skills list 列出 code 的 技能。第二种,使用 p 标志,这是最灵活的执行命令 hermes 加 p code 再加 chat, 或者执行命令 hermes 加 profile 等于 code 再加 doctor, 甚至可以在查询时指定 hermes chat 加 pcode 加 q。 后面跟 hello。 这种方式适用于任何命令。第三种,粘性默认值,最适合长期使用。执行命令 hermes profile use code 之后执行 hermes chat 就 默认针对 code 执行。 hermes tool 也是配置 code 的 工具,如果想切换回默认执行命令 hermes profile use default 这类似于 quebeco configuruse context 的 使用方式。另外, client 会实时显示哪个 profile 处于活动状态, 提示符会显示 code 加右键头符号,启动时会显示 banner。 执行 hermes profile 命令会显示详细信息。 接下来讲讲如何运行 gateways。 每个 profile 可以 作为独立进程运行。自己的网关拥有独立的机器人令牌,每个 profile 都有自己的点音频文件,可以配置不同的电报 discord slack 机器人令牌最棒的是安全令牌所机制。如果两个 profile 要意外使用相同的机器人令牌,第二个网关将被阻止,并显示清晰的错误信息, 这样可以避免冲突。启动不同 profile 的 网关很简单,执行命令 coder gateway start 启动 coder 的 网关。执行命令 assistant activate taway start 启动 assistant 的 网关,它们是独立进程,互不干扰。如果需要持久化服务,可以执行安装命令。执行命令 coder gateway install, 这会创建 hermes gateway system d 或 launched 的 服务。 同样,执行命令 assistant gateway install 创建 hermes gateway assistant 服务。支持的平台包括电报、 discord, slack, whatsapp 和 signal 都支持令牌锁定机制。 每个 profile 都有自己的配置文件,主要包括三个文件,第一个是 config 点 emo, 这里配置模型提供商,工具级以及所有设置。第二个是点硬币文件,存放 api, 密钥和机器人令牌。第三个是 c o 点 md 文件定义个性和指令。配置模型很简单,执行命令 code config set model, 点 default antropics 斜杠 close on the four。 设置个性的话,可以用 e q 命令。执行命令 echo 后面跟双引号 u r a focus coding assistant 点双引号, 然后从定向到波浪线点 hermes profiles coder 目录下的搜点 md。 如果需要设置工作目录,执行命令 coder config set terminal, 点 cwd, 后面跟上项目的绝对路径。这里有个重要提示,搜点 md 可以 指导模型,但不强制执行工作区边界, 如果需要可预测的起始目录,请显示设置 terminal 点 cwd。 最后讲讲如何更新和管理 profiles 更新非常简单,执行命令 hermes update 这会拉取一次共享代码,然后自动同同步新捆绑技能到所有 profile, 用户修改的技能永远不会被覆盖。管理命令也很丰富。执行命令 hermes profile list 执 行命令 hermes profile coder devbot 显示一个 profile 的 详细信息。执行命令 hermes profile rename coder devbot 可以 从命名 执行命令 hermes profile export code 导出为 c, 点 t r, 点击 z。 执行命令 hermes profile import code 点 t r, 点击 z, 从规章导入。 如果需要删除 profile, 执行命令 hermes profile。 delete code 需要输入 profile 名称确认,也可以使用加 yes 参数跳过确认。删除操作会停止网关移除 systemd 或 launch 的 服务, 移除命令别名,并删除所有 profile 数据。另外还支持 tab 补全。对于 bash, 执行命令 evo 后面跟双引号,美元符号 hermes completion bash 双引号。 对于 zsh, 执行命令 evo 后面跟双引号,美元符号 hermes completion zsh 双引号。好了,今天的分享就到这里,咱们回顾一下核心功能。第一,独立运行在同一台机器上运行多个独立 agent, 每个都有独立的配置 api 秘要记忆绘画技能和网关状态。第二,灵活创建,支持空白创建,仅克隆配置克隆全部内容三种方式满足不同场景需求。第三,便捷使用,提供命令别名、 b p 标志、年性默认值三种使用方式,克莱实时显示活动 profile 状态。 第四,安全管理,每个 profile 独立运行网关,支持令牌锁定机制,防止冲突。提供完整的更新管理和删除功能。如 你需要在同一台机器上运行多个不同用途的 groupon agent, 比如编程助手、个人机器人研究 agent。 强烈建议使用 profiles 功能实现完全隔离,这样可以避免配置和状态混乱。我是大叔大实测验证并整理,后续会持续革命性 session 的 相关内容,感谢观看,咱们下期再见!

让你的 ai 自动回复微信消息!上期跟大家分享了如何让 ai 通过视觉分析自动操作你的微信发送消息。但要让 ai 真正实现自动回复, 还差最关键的一步,让 ai 能读懂你的微信聊天内容。今天就给大家介绍一个神器, wechat decrypt。 先跟大家讲清楚原理,微信没有公开的官方 a p i, 没法像飞叔那样直接调用接口受发消息,那我们怎么读取消息呢?答案很直接,读取微信存在你电脑本地的数据库文件。微信的所有聊天记录都存在一个 sq lite 数据库文件里,但这个文件是用 sql cipher 加密的, 直接打开只会看到一堆乱码。而 wechat decrypt 这个工具最厉害的地方就在于,它完全不需要你手动提供任何解密密钥,它会自动扫描微信的进程内存,直接从内存中提取出解密密钥。道理很简单,微信运行时自己也要读写数据库, 所以密钥必然会加载在内存里。拿到密钥后就能完整解密整个数据库,并导出成 ai 可以 直接读取的 json 格式。 基于这个思路,完整的 ai 自动回复流程就很清晰了。第一步,定时扫描,比如每五分钟出发一次,自动运行 wechat decrypt 解密数据库,导出最新的聊天记录。第二步, 筛选新消息,对比上次检查的时间戳,筛选出新增的未读消息,同时可以按需求过滤掉群聊公众号和黑名单消息。第三步, ai 生成回复, 将筛选后的新消息发送给大模型,根据你提前设定好的语气、身份和回复规则,生成合适的回复内容。第四步,桌面自动化发送。这一步就用到了上期讲的 视觉分析技术,自动截图定位微信窗口搜索对应联系人,粘贴回复内容,按下回车发送。整个方案最大的优势就是完全不需要微信 a p i, 也不用登录网页版微信,所有操作都在你的本地电脑上完成,本地数据库解密,本地 ai 生成回复, 本地窗口自动化操作,数据安全有保障。当然,这个方案也有它的局限性,因为每次都是全量解密导出数据库,单次操作大概需要五到六秒,做不到毫秒即实时响应。另外,微信必须保持登录并在后台运行, 否则无法从内存中提取解密密钥。不过对于个人日常使用的自动回复场景来说,这些局限性完全可以接受,已经足够好用了。本期视频里,我给大家演示的是让 ai 帮我梳理最近的微信消息, 分析哪些需要优先回复,并给出具体的回复建议,大家可以参考这个思路,拓展更多玩法。好了,以上就是本期的全部内容,关注我,后续会持续分享更多实用的 ai 实战技巧。

这个就是今天下午刚装好的一套 ai 的 服务器,用的显卡,用的是五零九零的一套显卡,然后像我们的 ai 服务器呢,都会装几个不同的 agent, 比如说千元炮,然后还有爱马仕,然后再又是 opencl 这几种,然后还会内置,我们会内置三个非常好用的 skill 啊。比如说第一个 skill 就是 我们这种 erp 的 erp, 可以 直接对接你的 ai 服务器,然后如果你的 erp 开放 api 的 话,那就可以直接对接,如果不行的话,就可以列成表格,是没有问题的。那么你可以看这里是 erp 给我一些建议,然后你看它会分析你所有的 erp 数据, 因为我的数据非常多啊,这个是个演示数据,并非真实的啊,可以看到他要根据你的所有,然后给你列出来一些他觉得比较重点的地方,然后给你一些分析,然后给你列出来一个很详细的表格,包括给一些建议,这都是 ai 会直接会做给你的,然后包括他说完之后还会再去问你 需要针对某个具体方面具体分析吗?然后这时候你可以根据你想要再问他的问题啊,去问这个是非常方便的。那么其次呢,就是我们的呃一个支付的一个功能,比如说 这就是我刚才去问他的薪酬提升方案是怎么样的,那么这就属于公司的一些内部问题了,比如说你的财务啊,或者怎么样啊,可能有时候需要知道一些事情,那么也可以直接去问 ai, 那 么他也会直接去给你一个很详细的一个表格,然后让你去了解并且使用, 这个比你一个一个人去问,这样的效率要高非常多啊。然后还有个非常好用的 agent 呢,就是关于 wps 的 啊,我就是比如说我们在外谈客户的时候,那么我们可以直接拿出来跟你的 agent 直接说啊,我要做一个合同啊,里面什么 我要做,比如说配置一的合同,那么 ai 会直接帮你把合同做好,放你的手机上,就可以直接跟客户签单了,那么这样是不是非常方便呢?

你们是不是也拍上了,一句话就能把比 openclaw 龙虾更懂你的 hermas 给安装上,而且紧接着一句话就能把微信接上,然后咱们就可以用微信,就用 hermas 帮咱们干活了。这是怎么回事呢?也就前两天,有些伙伴就问我说怎么安装 hermas, 当时我还有点蒙圈,就抱着试试看的态度,直接在 vip 的 a p i key 帮我接入 deepsea。 结果神奇的事情发生了, 也就分分钟,考帕萨特就自己把 hermas 安装上了,还把其他配置也配置好了,打开后直接就会基于 d v c v 四进行对话。然后我就跟伙伴们说一句话,就能把 hermas 给安装上,但他们却问我微信怎么接入呢? 说实话,确实这个我也没接过,我就尝试在 hermas 里让他接入微信,结果中间我就配合扫码确认了一下,剩下全程都是他自动安装的,太省心了。觉得这玩意有点意思,我就把整个过程写成了详细的教程,如果你们感兴趣可以关注我,我也可以分享给大家。

因为他赚了这么多钱,可算良心发现,阿布顿地区开放了可以免费使用大模型一年的 a p i, 让你零成本就可以使用 g m 五点一、 t m 二点七等六十多种顶级大模型滤是每分钟四十次调用,平时使用完全够用。我已经用国内手机号注册拿到了 a p i k, 千万不要错过。

对龙虾炒股这个话题非常感兴趣,今天我们就来分享一下如何让你的龙虾接入 a 股的数据,实现二十四小时的分析。当然策略得你自己定哦,简单的只需要两步,第一步,登录 qrus 的 官网 来粘贴它官网的一句话就好了,把这句话丢给你的龙虾,第二步就完成了,你的龙虾就可以接入全球的金融数据了。是不是很简单?那我带大家走一遍。这个是 qrusai 的 官网, 当下还可以邀请奖励,我们只需要复制官网这句话,复制之后打开你的龙虾,我们丢给他就好了,这是我丢给他的这句话,你可以看到它安装完成就是安好了 q r s ai 的 skill, 那 这个 skill 能帮你干啥呢?它可以帮你接入全球的金融数据。 给大家简单看一下效果吧,这里有两千多位群友已经在体验了,你不仅可以做个股的一些分析,你还可以分析板块轮动,大盘走势,资金流向等等的,而且不仅支持 a 股,还有美股、港股等等的信息。 对,然后最好你自己体验一下,安装方法也非常简单,我们下期再会。

大家好,我是大叔,只说真话,只做实在事,只给干货。上期视频大家已经学会安装 hermes agent 了,但是装好了之后还需要对接通信渠道才能真正用起来。 今天这期我们先介绍一个比较简单的微信接入,也是大家日常使用场景里最容易上手的。后续如果大家有需要,我们可以再出一期接入飞书或者 qq bot, 看情况。先说清楚这个是什么? hermes 信件的微信接入是通过腾讯官方的 iink bot api 来实现的,专门针对个人微信账号 划个重点。企业微信要去找 wecom, 那 个是配器,这个是专门给个人微信用的,别搞混了。简单说就是通过 iink bot 接口,把你的微信账号变成一个可以接收发送消息的 bot, 不 需要你有服务器,不需要开端口,也不需要配置 webbook。 整个接入过程只需要三步安装,依赖扫码登录、启动网关,没有复杂的配置,没有坑。不过在开始之前有个重要限制,必须先说清楚, 这个搞不清楚后面功能用不了,别怪 hermes。 扫码登录之后,你的微信账号会绑定到一个 i link bot 的 身份,不是你原来的微信号本身。这个区别非常重要,直接关系到你能用哪些功能。 i link bot 无法像普通联系人一样被拉进微信群, ilink 通常也不推送普通微信群的消息给 hermes。 即使你在群里提及你扫码的那个微信账号,也不等于提及 ilinkbot, 它们是两个独立的身份群,相关的配置只有在 ilink 真正推送群事件时才生效。如果 ilink 本身不推送,设置什么都没用。说白了,微信群消息这设不是 hermes 的 问题,是 ilink 本身有限制。根据官方文档和社区反馈,个人微信账号接入后私信对话是最稳的 群消息。如果 i link 不 推事件过来,那就真收不到。所以如果主要想在一堆聊天,完全没问题。想玩群聊机器人,要先测试 i link 是 否给你推群事件。 git 会启动时,如果 waxing group policy 不是 disabled 的 日子里会打 warning, 提醒你注意这个限制。 如果设置了策略蛋,群里完全收不到消息,就是 i link 那 边的限制。别死磕配置了。好了,限制说完了,开始。第一步,安装依赖。开始之前确保你有一个个人微信账号,然后安装两个 python 包, 就这些,第一个是 a i o p, 用于网,网络通信。第二个是 cryptography, 用于微信媒体文件的解密。微信的文件传输走的是 a s one twenty a d c p c 加密。这个包必须装,命令行 跑一下 piping store, aotp cryptography 两个一起装。如果想在终端里直接看到二维码渲染,可以额外装 hermesign messaging, 这个是可选的,不想装也行。扫码链接会打印出来。 aotp 和 cryptography 这两个包,微信和 telegram 这类平台基本都要用到,装一次以后都省事。 依赖装好了,现在第二步,扫码连接最简单的方式是用官方提供的交互式向导,全部流程自动化,你只需要拿手机扫个码,运行 hermes gateway setup, 向导会提示你选择平台,选择 wixin, 然后向导会自动请求 i link bot api 的 二维码,二维码显示在你的终端里,或者打印一个 url 给你。用微信手机端扫这个二维码,手机端确认登录凭证自动保存到指定目录,扫码并确认之后,终端会显示 account id, 这个 account id 后面配置环境变量要用,记不住也没关系, 已经存在文件里了。在 hermes slash dot f 文件里加上 waxen account id, 等于你的 account id, 如果想限制谁,可以私聊 bot 加上 waxen allowed users 群策略默认式 disabled, 保持默认就好。三步都走完了,来看看微信接入具体支持哪些能力?第一个,长轮询接入消息,通过 http 长轮询拉取,不需要服务器开放端口, 不需要配 web 家秘。微信媒体文件走 cdn 加密传输,自动加解密,全程透明,不需要你手动处理。 第三个,完整媒体,支持图片、视频文件,语音消息全支持语音,有文字稿的直接拿文字,没有的保留音频。第四个, markdown, 保留发出去的 markdown 消息,微信里能原声渲染,标题、表格、代码块都能正常显示。 第五个,智能消息,拆分消息,超过四千字的才会拆分,没抄的保持一条发出,不破坏阅读体验。第六个,输入状态只是 ai 处理消息时,微信里会显示对方正在输入,体验更自然。 第七个,自动重试,遇到临时的 a p i 错误会自动退币,重试偶发的网络抖动,不会丢消息。第八个,上下文词久化对话,上下文 token 存在词盘上,重启网关后对话连续不丢上下文。第九个,去从机至五分钟滑动窗口内相同消息 id 不 会重复处理,防止网络抖动导致双头。不知道你最感兴趣哪个功能?我 个人最关注媒体加密和上下文词九画这两个最实用功能。看完了,现在看第三步,启动网关。配置好了之后,一行命令启动网关,微信接入就完成了,跑 hermes get 为网关,会读取保存的凭证,恢复微信连接,连接 l p i 开始涨轮询,拉取消息并发分发给 ai 处理。最后来说说常见问题, 列了十个最常见的,对号入座就行。第一个,运行 hermes get 为启动报,缺少 a o, t p 和 cryptography, 解决方法是 pip install aop cryptography。 第二个启动报, token is required。 解决方法是重新运行 hermes gateway setup, 完成扫码登录。 第三个启动报, account id is required。 在 一点一 n v 里加上 waxing account id, 等于你的 account id。 第四个提示另一个网关正在使用此 token, 先停掉另一个 hermes 网关,十例同意, token 只能同时被一个,十例使用。第五个 session expire 错误码负。十四,登录太过期,重新 hermes gateway setup, 再扫一次码。第六个二维码过期,二维码会自动刷新,最多三次, 如果持续过期,检查网络连接。第七个 bot 不 回私聊消息,检查 vaxindian policy。 如果设置的是 allowist 确认发送者在允许列表里。第八个 bot 完全收不到群消息,见第二页的限制说明。 ilink bot 身份本身不支持普通微信群消息,这是 ilink 测的限制,不是 hermis 的 问题。 第九个,媒体文件上传下载失败。确保 cryptoography 包以安装,检查网络能否访问微信 c d n 域名。第十个终端二维码不显示,从新安装 hermes agent messaging, 主键 十个问题基本覆盖了。如果还有其他的评论区留言,遇到问题先看 get 位日制。如果设置了群策略弹,日制里完全没有收到过群消息的,原始事件基本就是 i link 这边没推过来,可以排除 hermes 策的配置问题了。日制会告诉你一切排错的。第一步永远是看日制,不是反复改配置, 配置改来改去,日治里末收到消息就是平台测问题,改配置没用。好了,本期内容就到这里来,快速回顾一下今天学的三步。第一,第一步,安装依赖运行 pip install aotp cryptography, 把两个包装好。第二步,扫码连接,运行 hemi skytwo setup, 选择 vixen, 用手机扫码确认。 第三步,启动网关,配置好 wixin account id, 然后运行 hermes gateway。 整个过程没有复杂的配置,记不住命令没关系,用到的时候回来翻就行。如果对你有帮助,欢迎点赞转发收藏,你们的支持是我持续更新的最大动力,有问题欢迎在评论区留言,看到会尽量回复,我是大叔大,我们下期见!

免费给你的 hermes 装上眼睛! mini cpm v 四点六开源视觉大模型,跑在自己电脑上,不用 api 数据,完全不出门。第一步,装 alama, 一行命令搞定。第二步,拉模型,等两分钟下完就能用。第三步,配置 hermes, 把视觉模型指向本地欧拉玛,三行命令完事。 现在发张图片给 hermes, 他 就能看懂了!关注我,了解更多 ai 硬核玩法!