在上一集讲解了自定义 skill 教 hermes 新技能。本集我们讲解 mcp 集成连接你的工具站。 hermes 内置四十多个工具已经很能打, 但真实工作场景远不止这些。 mcp 全称 model context protocol, 可以 把 github, slack、 gera、 数据库、文件存储这些外部服务接进来,你可以把它理解成 ai 工具世界里的 usb 接口。 谁实现了这个协议, hermes 就 能直接调用谁提供的工具,这样你不需要再为每个外部服务单独开发师配成。常见的连接方式有两种, standardio 适合本机子进程, 适合本地工具、文件、系统和数据库,性能快,也没有网络开销。 h t t p 或者 s s e 更适合远程服务器或者团队共享的 server, 但性能会受网络影响。判断标准也很简单,如果 hermes 已经内置了这个能力,就优先用原生工具。如果需要和外部服务交互,再交给 m c p。 最常见的第一个 m c p 场景就是把 gitup 接进来。第一步,先准备 gitup token, 可以 去 gitup settings, 再到 developer settings 你 的 personal access tokens 生成一个 token 权限,至少勾选 repo 和 read org。 如果要操作 issue 或者 pull request, 再补对应的写权限。 第二步是在 config emo 里添加 gitap mcp server 通常会用 npx 启动 model context protocol 的 server。 gitap botoken 最好放进环境变量,而不是直接写进配置文件。第三步是重启 hermes 定验证,比如让它列出 gitap 上的仓库,或者查看某个仓库最近的 issue。 联通之后就可以直接用自然语言创建 issue, 审查 pr 分 类汇总最近一周的新问题,重点不是记住底层工具名,而是把需求说清楚。 hermes 会自动选对 gitap 工具调用。第二类很实用的连接是数据库 mcp。 以 postgrads ql 为例,只要把连接字幕串写进对应的 server 配置里, hermes 就 能直接查询、汇总和解释业务数据。 接上之后,提问方式会非常自然。比如查一下这个月注册用户有多少,或者看看最近三十天每天的订单金额趋势。 数据库连通以后, hermes 不 只是执行查询,还能把结果整理成更容易理解的业务结论。这里要特别注意安全。数据库 m c p。 默认可能带读协权限,如果你只想让 hermes 查数据而不修改数据, 最好用自读账号连接,尤其是生产环境数据库,更要先把写权限收住。 sq lite 和 mysql 也有对应的 mcp server, 整体思路都差不多,换一个包名和连接支付串就能跑通。当接入的 mcp server 越来越多,真正需要担心的不是能不能连上,而是工具会不会给的太多。 per server 工具过滤,解决的就是最小权限原则。比如 github server 明明提供了很多高权限能力,但你完全可以只暴露 list issues、 create issue get pull request, create pull request review 这些必要工具。这样做有四个直接好处,第一,减少工具列表噪音。 第二,提升 hermes 的 决策质量。第三,防止高风险操作。第四,真正落实最小权限原则。就算 server 还提供删除仓库、修改设置,这些高权限能力, hermes 也根本看不见,更用不到。 所以联通只是第一步,收权限同样重要, m c p 单独看解决的是能联什么 skill, 解决的是接上之后该怎么用。比如 pikachu, m c p 负责提供仓库和 pull request 的 操作。代码审查 skill 负责定义你的审查标准,比如命名规范、错误处理、测试覆盖率和安全检查。 两者一组合, hermes 就 不只是会访问 tiktok, 而是会按你的方式去做代码审查。同样的思路也能放到数据库周报模板、 chrome 定时任务和 slack 上,每周五自动查数据,套用周报模板生成内容,再主动推送到 slack, 就是 一个很典型的组合链路。 这时候 hermes 才真正从工具调用器变成完整工作流理的执行节点。真正落地时,最好的顺序不是一口气接很多服务,而是先跑通一到两个最常用的链路,比如先从 tiktok 和数据库开始, 用熟了再继续扩展。连接方式上优先选 standard io, 因为它本地运行,配置简单,性能更好,除非确实需要远程部署或团队共享再考虑 h t t p。 安全上要记住三件事, token 放环境变量,数据库尽量用只读账号 per server 工具过滤,默认开启。如果效果不对就去看日制,日制会记录这次调用了哪些工具,为什么选中是否成功,位置就在波浪线斜杠、 hermes 斜杠、 log 斜杠, 最后把已经跑顺的流程继续沉淀成 skill, 下次 hermes 就 能按你的标准附用同一条链路。这一集解决的是怎样把 hermes 接近外部工具站。 下一集是记忆实战跨绘画记忆的威力,我们会看看 hermes 怎样跨过一次对话,继续记住你的项目编号和上下文,下集见。
粉丝1362获赞5271

大家好,我是麦东,今天我们来聊一个很多朋友可能会感兴趣的东西, hermes desktop。 之前我给大家分享过 hermes 网页 ui 的 使用,最近社区又推出了一个桌面版的客户端,提供了一个原声的图形化界面,让我们在使用 hermes 的 时候可以更加的直观和方便。这边有个点先跟大家讲一下, 如果你本地已经有了 hermes, 那 么你再去使用这个桌面端的时候,它会直接连接到你本地的 hermes。 而如果你本地之前没有装过 hermes, 那 么你在安装这个客户端的时候,它也会自动帮你完成 hermes 的 安装。好,下面我们来看看实际的使用体验。 大家可以看到我的桌面打开 hermes desktop 之后,界面就是这样一个比较干净的窗口,左侧可以切换菜单,右侧则是我们主要的聊天窗口。大家如果不习惯看英文呢,可以点到 settings 里面,在这边下拉找到语言,将其切换为中文, 这样看起来可能就会好很多了。 hermes 的 桌面客户端所提供的功能其实跟之前介绍过的一些网页 ui 是 相似的。首先就是一个聊天窗口,我们可以在这边直接跟 hermes 进行对话, 然后接下来是会画列表,这边它会加载你当前 hermes 里面默认所有的聊天记录。我的 hermes 里面聊天记录比较多,所以它这边加载的时间也会比较长,我们就不等它加载了,继续往后看。第三个是答案, 答案其实就是我们所说的 harmus profile, 也就是 harmus 的 多智能体。在这边我们除了管理已有的智能体之外,还能直接新建智能体。第四个菜单,工作区,工作区是客户端提供的一个三 d 格式 y 的 看板,在这边你可以看到当前 agent 的 一些活动,说白了就是给你解个闷,但它并没有什么实际上的作用。 第五个看板,这就是 hermes 的 看板功能,之前我也有出过一期视频做详细的介绍,大家感兴趣的可以去看一下那期视频。而接下来的两个菜单,模型与供应商都是用来配置我们本地的 hermes 可以 使用的模型的,这个就不做详细讲解了,配置也比较简单。 接下来的技能菜单可以管理我们本地已经安装好的一些 skill 人格跟记忆。两个菜单则是直接编辑 hermes 的 source md 以及 memory md 这边涉及到我个人的一些隐私数据,我们就不点开给大家展示了。工具菜单我们可以在这边定义 hermes 在 运行的时候可以使用那些工具, 比如网络搜索、浏览器终端等等。再往下的计划任务以及网关则分别对应了 harmis 的 电视任务以及消息网关,我们在本期视频里也不做详细讲解了。整体来说, harmis desktop 给 harmis 用户提供了一个原生的图形化选择,让日常的使用过程变得轻松了不少。 当然了,他本身也是一个由社区开发的开源项目,功能也还在持续完善中,可能也会有些小问题,但整体来说已经可以正常使用了。他比较适合那些希望用更直观的方式来操作 hermes 的 朋友,并且呢,和命令行网页也完全不冲突,你可以根据自己的习惯随时切换, 感兴趣的朋友可以自行的去了解一下这个项目。好了,本期视频到这边就结束了,工具会变,但方法更重要,我是麦冬,下条继续。

大家好,我是麦东。上期我们解析了 hermes 自带的记忆系统,说实话还是比较基础的,这是两个 macdunk 文件,加起来不到四千字幅, 聊多了之前的内容他可能就会忘,画绘画的信息基本也全靠你自己重复。今天我们介绍一个专门解决这个问题的工具叫 hideside, 它是一个开源的 nint 的 记忆系统,装上之后 hermes 就 有了真正的长期记忆,能记住你画绘画的所有信息, 还能 sim 的。 这个开源硬件的记忆系统不是简单的对你的聊天记录做文本存储,它会做实体提取、关系追踪以及多策略的解锁。转完之后体验提升感还是非常明显的,你不需要每次开新绘画都重复一遍自己的偏好和项目背景了, 下面我们来进行实际操作。首先你需要确保你的机器上有 docker, windows 用户使用 docker desktop 就 可以了, macos 用户跟 linux 用户也是同理。 好,下面我们带大家一起来操作一下。镜像文件准备好了之后,我们在当前文件夹右击打开 power shell, 在 power shell 中输入如下命令,加载镜像。 在按下回车之前,大家一定要确认一下你当前系统里面的 dog 服务是否正常运行。 ok, 按下回车加载镜像, 镜像加载完成,下面我们需要运行一条命令,启动 handset。 在 运行这条命令之前,我们先来给大家讲解一下这条命令里面各个参数的含义。首先第一个是八八八八端口, 这个是浏览器 api 的 端口, hermes 就是 通过这个端口跟浏览器进行通信的。第二是九九九九端口,这个是管理界面的端口,启动之后我们使用浏览器打开本地的九九九九端口,就可以看到记忆管理界面, 然后是三个大模型相关的配置,这个模型是给 handset 的 内部做实体提取用的,它不是和 miss 的 对话模型,这 handset 自己拿来处理记忆的。这里我用的是 deepsea 原声支持,并且 deepsea v 四 flash 的 价格也比较低, 你也可以换成其他支持结构化输出的模型,一般来说只要接入 open ai 格式的都是可以的,大家根据自己的实际情况去选择就可以了。再往后的两个参数则是用来配置 handset 的 向量模型的。 handset 通过 doper 启动的时候,默认的向量模型是英文的,它对于中文的向量化以及解锁的效果会比较差,所以我这边挑了一个比较清亮的适配中文的向量模型。 并且呢,由于国内直接日下下载下来模型也会比较慢,因此我们在这边还给它加上了一个镜像源,这样首次启动的时候模型下载就会走国内镜像了,会快很多。好,下面我们复制该命令,打开 power star 粘贴命令, 按下回车执行即可。执行完成之后,我们打开 docker, 点击 containers, 在 这边就可以看到我们启动的 handset 容器了,点击容器名称就可以看到当前的启动位置了。 第一次启动的时候会去下载向量模型,所以这一步会花费一点时间,大家耐心等待即可。 当我们看到预制中出现 handset is running 的 时候,就意味着服务已经启动完成了。后面我们对于 handset 容器的启停就可以在 docker 里面进行了, 在这个地方可以对容器进行停止,停止之后也可以重新对容器进行开启,开启之后想要观测容器是否正常启动,同样也只需要点击一下就可以看到当前的预制。除此之外,我们还可以通过命令行的方式对 docker 容器进行管理, 常用的管理命令就这几个,停止是 docker stop, 启动是 docker start, 开瑞智是 docker logs, 大家可以根据自己的喜好选择合适的方式。 on set 跑起来之后,下面我们开始进行 hermes 的 配置,我们先开一个窗口,输入 wsl, 进入此系统之后,我们输入 hermes memory setup, 开始进行记忆系统的配置。 摁下回车,在这边我们选择 handset, 摁下回车, handset 配置会给我们三个选项,第一个是用云端的 handset, 这个是需要收费的。第二个是使用 hermes 自带的 handset, 选择这个的时候, hermes 会自动去下载一个 handset, 并且把它启动起来。 不过我实测下来并不是特别方便,而且还有一些环境问题需要去解决,因此我这边还是推荐大家使用多款的方式,所以我们这边也是直接选择。第三个,按下回车,接下来输入 api 地址默认就是本地的八八八八端口,这边我们可以手工输入一下。 输入完成,按下回车,第二步会让我们填写一个 api key, 因为我们是本地部署的,所以不存在 api key 相关的配置,直接按回车 ok, 这样就已经配置好了,还是非常简单的。下面我们可以运行 harmis memory status, 看一下记忆系统的状态, 好了可以看到这边 provider 为 headset, 并且呢状态也是处于可用状态,这就说明我们已经成功对接了。下面我们来测试一下相应的效果。我们先打开一个 hermis 对 话, 先跟 hermes 随便说一些内容,让他存一些信息到 hackathon 里面去。我们就简单一些,告诉 hermes 一 些基本信息。我养了一只银渐层,叫糖糖,今年五岁,别人都叫我麦冬,每天早上我都要来一杯冰美式。摁下回车。 好,它确认记住了,现在我们关掉这个规划,重新开一个。再次输入 hermes, 下面我们让 hermes 根据它的记忆回忆一下我的猫叫什么名字,我每天早上要干什么。 可以看到他回答出了我的猫叫糖糖,并且我每天早上都要喝冰美式。这边还有两只猫,是我之前跟他对话的时候测试录入的,大家可以忽略。好,下面我们再来打开一下 hannenset 的 管理界面,看一下后台发生了什么。管理界面的地址大家应该还记得吧, 打开浏览器,输入本地的九九九端口即可。 ok, 我 们现在已经打开了 hannenset 的 后台了。 首先我们需要在这边切换一下基金银行,也就是我们的 hermes。 其实打开这个页面,大家就已经能够看到我刚刚跟 hermes 的 对话已经被它存进了 hano site 里面去了。我们可以在左侧先点击 documents, document 里面存储的是我们跟 hermes 每次的对话记录,我们可以点开任意一个查看一下。点击 content, 大家应该可以看到这边就是我跟 hermes 的 对话,而这就是 hermes 给我的相应回复。每次我们跟 hermes 聊完之后,它都会把我们相应的聊天记录同步过来, 我们再点击 trunks, 点击展开。在这边我们就可以看到一些结构化的事实, 比如这边用户养了一只银渐层,叫糖糖五岁,他并不是把我们的原文死记硬背了下来,而是真正的去理解了我们说的内容,并且把它存储了下来。下面我们再点击 antisp 来看一下。 这边是我们的实体关系图,可以看到这边会有一些实体的关联列录,比如银渐层就关联了用户,麦冬同样也关联了用户,冰美式同样也关联了用户, 这些关系链路就是 huntsite 做记忆召回的依据。随着你跟 hermes 的 聊天内容越来越多,这边的关系图谱也必然会越来越丰富,而且 huntsite 也没有任何的记忆数量限制,再搭配上 hermes 的 自动化机制, 他真的会成为一个越来越懂你的 ai 助手。好了,本期视频到这边就要结束了,这次我们采用 docker 的 方式去部署 handset, 相较于其他的部署方式来说,还是要省心很多的,你不需要再去操心一些环境信息了,而且基于 docker desktop 的 管理面板启停服务也比较方便。 本地化部署 handset 唯一的开销就是可能会用到少量的 api 调用费用。当然了,如果你本地资源足够的情况下,我们还可以在本地直接部署大模型, 让 handset 去连接本地的模型,这样就省去了这一笔头更的开销。大家平时都在用什么方式去管理 ai 的 记忆呢?欢迎在评论区聊聊,工具会变,但方法更重要。我是麦冬,下条继续。

还在使用命令行来玩 hermes 吗?对于新手小白来讲,命令行确实是一个非常不友好的工具,今天这条视频我就来教你如何安装 hermes 的 官方的 web ui。 使用这个工具,你可以查看智能体状态管理任务,查看日期,调整配置,鼠标点一点就能使用, 界面干净功能一目了然,比存命令行简单好用。下面我们就来学习一下如何安装使用 hermes 的 官方 web ui。 首先我们来看一下如何进入帮助文档,这是 hermes 的 官方文档,虽然显示有简体中文的选项,但是进入之后其实还是英文, 所以我们只能选择国内的 hermes 的 中文社区,点击这个文档,然后我们找核心能力,这里的管理 里边有 web 仪表盘,在这里我们就能找到启动 web 仪表盘的命令,就是这个 mister dartboard, 点击复制,把这个命令复制到我们的剪贴板里, 然后我们打开 wsl 的 命令行儿,粘贴这个命令,打回车,提示我们需要安装如下的主键,包括 fast api 和 uic, 同时也给出了安装方法在这里,那么我们就按照他说的这个进入这个文件夹儿, 再来运行这个命令,系统提示我们已经安装成功了,下面我们再来复制一遍 permes dashboard, 这个命令钻到命令行里运行 还是不行。相同的提示,先来检查一下当前的版本号 permes vincent, 看看它的版本号零点幺三,最新的版本号是零点一四,我们来升级下版本试试, 我们看到已经升级完毕了,这里显示 unico 也已经成功的安装了。这回我们再复制一遍这个 hermes dashboard, 再来运行一下看看 它。这里提示给我们了一个网址,幺二七点零点零点幺九幺幺九,我们来访问一下试试, 已经可以访问了,这个就是 hermes 的 官方 web ui, 默认它是英文版,我们先把它调成中文版,点击左下角这个 e n 按钮,在这里 点击简体中文就可以切换到中文版了。我们来看一下它都有哪些功能。首先看第一个功能绘画,绘画就是你跟 hermes 的 聊天记录,包括你在命令行里和通过聊天软件进行的聊天 模型,就是你目前正在使用的大模型都有哪些?在我这里有两个模型, glm 四点五、 flash 和 minimax 二点七。 第三个是日制功能,这个是运行的日制。第四个是定时任务,这个是目前有哪些计划任务,可以点击右上角这个创建按钮,手工创建计划任务。 下一个是技能,这些就是目前系统内可以使用的技能 skill, 包括系统自带的和我们安装的,这是全部的技能,这是工具级。下一个栏目是插件管理,在这里我们可以对我们已经安装的插件进行查看和管理。 下一个是 doident 配置,这里是目前我已经设置好的 ident, 也可以点击右上角的创建按钮,添加新的 ident。 下一个栏目是配置,在这里可以查看 hermes 的 各种详细配置。 下一个栏目是密钥,这里可以查看系统内正在使用的密钥,我现在使用的密钥包括智普 这两个大模型的密钥。文档就是跳到官方的文档,这里由于是国外的网站,有点慢, 我们这个就不看了。然后这是它的插件看版,这个是很重要的功能,以后我们会讲到的。下一个 example 实力连不上,这个我们不看了。最后一个 achievement 成就好像跟我们也没有什么太大的关系,这 就是 hermes 的 官方 web ui, 今天就讲到这里了,谢谢大家的观看,再见。

欢迎大家今天我们一起继续闯 ai。 上一期我们搞了一场赛搏斗蛐蛐,本期我们换个话题,让两位选手休息一下。大家可能都见过这个与 hermes 聊天的界面,说不上好看, 更谈不上好用。也可能见过 hermes 带 check 功能的 dashboard 界面,而 opencloud 的 dashboard 在 拉跟 hermes 的 一比,竟然眉清目秀了许多。 hermes 自然不愿意被小龙虾比下去,所以 hermes desktop 它来了。今天我们就来介绍一下如何安装和出场配置这个工具,帮大家避避坑。 hermes desktop 在 github 上目前接近八 k 星标的太原工具,可以从 github 页面上点击下载按钮或跳转到 hermes agent 四 cc 来下载,也可以免魔法直接到这个网站来下载,双击即可安装,然后自动进入欢迎界面。如果选择 get started, 则程序会问你是自动安装一套 全新的 windows 原声版 hermes, 还是选择使用在 windows 中已安装好的原声版 hermes? 它是无法直接识别在 wsl 中安装的 hermes 的。 因此,如果你的 hermes 是 已经在 wsl 中安装好并运行的,那么大坑就已挖好。一、 wsl 上没有 ssh 服务。 二、 windows 没有配置免密码 ssh 登录 wsl。 三、 hermes 一 般不会自行开启 api server, 那 么 开始动手填坑吧。先去 wsl 中把 api server 打开,方法是 hermes 服务器文件中设置四个参数,然后重启 gateway 端口被检测,说明 api server 已开启。再去 windows 中生成密钥对比,复制 idezer tag 到 wsl 的 指定目录中。 在 wsl 中先安装试服务检查状态,并设置开机自启动,然后把 windows 上传的 id the pop 文件内容写入 authorized keys, 这样 windows 就 能免密码 s s h 登录 wsl 了。 此时再回到 hermes desktop, 点击 connect y s s h 并填入信息,即可全功能连接到 wsl 中的 hermes。 为什么强调这个选项可以全功能连接?因为选择 connect to remote hermes 的 话,就只能聊天、查看 skills 等功能都会提示在远程模式下不可用。现在可以把每个功能都查看一下是不是完整,然后安装 call 三 d, 这个能帮我们给 hermes 安排个办公室的功能。点击 install 按钮后,由于是从 github 上下载代码,所以有概率失败。按照前几期我们提到的办法,可以手动从 github 上下载代码,放入指定目录,然 然后再次点击 install 按钮,程序会自动探测到以克隆的代码,并自动安装依赖。等待一段时间后, hermes 的 卡通办公室就出现了。 hermes desktop 的 安装和出场配置也基本完成,需要视频力命令和文档的朋友可以点个赞和关注,然后私信我。 下一期 hermes 选手将再次登场,但交给他的将是一个不一样的挑战。如果你也在用 ai 搞事情,点个关注,欢迎交流,我们下期见!

大家好,我是麦东。 hermes 零点一四版本终于带来了一个大家期待了很久的更新, hermes engine 终于原生支持在 windows 上安装了。 之前想在 windows 上用 hermes, 我 们必须先通过 wsl 搞一个 linux 子系统,对于很多技术小白来说,这个门槛儿就把它们给挡住了。 现在零点一四版本开始,我们通过 cmd 或者是 power xl 运行一条命令就可以直接安装 harms 了,不再需要 wsl 了。而且这次还多了一个更简单的安装方式,通过 pip 命令即可安装,对于本地已经有拍摄环境的朋友来说还是非常友好的好。下面我们来看一下具体怎么安装。 首先第一种方式,通过 power 线安装脚板,我们只需要打开 power 线,运行如下这条命令即可,这个脚板会自动帮你装好所有的依赖,包括 uv 包管理器, python, node js, rip group, ffm pack 等等。如果你电脑上没有 get, 它还会自动去下载一个。 这是第一种方式,通过一键脚本进行安装。第二种方式,我们还可以通过 p i p 安装,如果你电脑上已经有拍摄环境,那么我们直接运行 p i p install harmony engine 即可完成安装。 安装完成之后,所有的 harmony meaning 跟之前都是一样的,这个方式呢,更加简洁,适合本地已经有拍摄开发环境的同学。好,下面我们打开发校给大家演示一下完整流程。 我们还是使用官方的一键安装脚板进行安装,直接将一键安装脚板粘贴至发光效果,按下回车可以看到它在检测系统环境,然后依次安装各个依赖。这边需要注意的是,如果你的网络环境不太好,可能需要稍微多等一会, 只要安装脚板没有报错结束,那么就不用管它,耐心等待即可。 安装脚本自动帮我们启动了触式外的配置。首先第一步依然还是会检测你当前电脑上有没有装过 openclaw, 如果有,它会提示你是否需要导入 openclaw 相关的配置, 我们可以输入 y 确定导入。 ok, 接下来开始配置 harmony, 这边我们直接按下回车,选择 quick setup, 到了选择模型这一步了, 本次演示我们就以大家用的比较多的 dsp 为例,这边需要注意一下,之前我们无论是在 wsl、 macos 或者是 linux 安装在这一步配置模型的时候,我们都是可以通过方向键上下切换模型进行选择的,但是 windows 原声安装的时候目前是不支持这样设置的, 我们需要手动输入模型供应商前面的编号,再按下回车。可以看到 dsp 这边前面的编号是十七,我们输入十七 按下回车。接下来输入 deepsea 的 api key, 这边要注意一下,之前很多朋友在配置 api key 的 时候都会搞错,在 power 七二里面粘贴的动作不是通过 ctrl 加 v 完成的,而是通过鼠标右键, 鼠标右键一定也不要多点,点一下就行了,然后按下回车。接下来第二步配置 v c u r l 这个一般是不需要改的,直接按下回车。第三步就会让你选择默认模型了,我们这边选择 deepsea vs flush, 按下回车 ok, 模型就配置完成了。这一步是让你选择在哪里执行,后端我们直接默认回车即可在本地执行。 下一步就是配置消息对接平台了,这一步我们在本次视频里面就不做演示了,国内主流的消息平台对接我们在之前的视频里都有讲过,大家可以回过头去翻一下我前面的视频,我们选择二,暂时不配置消息平台,按下回车, ok, 配置完成。下面我们最好关闭当前的 power 界面,重新开启一个新的 power, 输入 harmony, 按下回车,打开对话界面,下面我们跟 harmony 打个招呼, ok, 可以 看到 harmony 已经给我们响应了,到这边我们的基础配置就已经完成了。需要注意的是,目前 harmony 的 原声 windows 安装还是处在早期 beta 阶段,可能还是会遇到一些小问题。官方在这个版本里面也修了四十多个 windows 相关的 bug, 但是呢,毕竟是第一个正式支持的版本, 遇到一些问题我们也可以去 github 上给官方提一些英雄。好了,本期视频到这边就要结束了,最后总结一下,如果你之前因为 wsl 的 门槛没用上哈密斯,那么现在可以去试一试了, 只需要通过一条命令即可完成安装。如果你本地有派生开发环境的话,通过 p i p 的 方式安装会更加的方便,不需要你再去折腾 linux 环境了。大家如果有在 windows 上已经安装了的,可以在评论区反馈一下体验怎么样?工具会变,但方法更重要,我是麦冬,下一条继续。

这个最近这个方面是爱马仕这个项目真的有点火啊,然后我这几天也是上手真正的用了几轮啊,我的感受就是确实还不错, 他火不是没有原因的,很多博主也在聊这个点啊,就是很多意见的问题,不是不能用,而是你用起来总感觉他不够熟,他不够顺手啊。今天啊,你教他一遍,明天可能换个任务,换个场景,他又想重新再开始一遍啊,你很难有一种感觉,这个东西在慢慢的懂我,慢慢的适应我做事情的一个方式,而且啊,这个东西没办法越用越顺手 啊。但是 hermes 这个比较有意思的地方就是啊,它是能够慢慢养熟的啊,就像你的一个电子宠物一样啊,如果非要打个比方,我觉得它可能就像一个菜园啊, 你每次跟它去进行对话啊,不只是进行下一个任务,它更像是在去浇水,去施肥,很多 agent 啊,可能这样这次干完就结束了。但是 hermes 不 一样, 它会把对话里面真正有价值的东西沉淀下来,慢慢的成长成你的 skills, 然后你在用的时候,它就不会是再从一个荒地再开始,你能够直接栽来栽来就用的一个能力。所以说这里就是它最核心啊,最让人上头的一个地方 啊,因为它不是单词执行,它更强调了就是你的学习壁环。官方的说法也非常的直接啊,它会从经验里面创建 skills, 而且 skill 在 后面用的时候会被继续的改进,所以它更像是一个你越用越顺手的一个助理啊。第二点就是它不是一个无脑记忆很多一些的,一说记忆好像很高级,但真正的问题就是它什么都记,最后上下文越读越多,然后你每次会把一大包,然后通过你的一篇发送过去的 top 就 越烧越快。 而每一次比较有意思的就是它不是背的所有东西一起跑,它更强调的是保留关键的信息,就像它的这个长期记忆,还有它的一些用户习惯的一部分, 它本身是有限制的啊,抄了以后它就会重新整理,把真正重要的内容留下来,不是把所有的这种上下纹一起塞进去什么东西是真的有用,它就会尽量可以留下来什么东西,它只是一些噪音,是一些杂物,它就不会让这些东西一直占在地方,这件事情非常重要啊,所以说我在用它的时候,就会让我感觉这几天越用它就会变得越聪明。 第三个点就是他和很多传统的 agent 不 一样的地方,他不是只是这种对话看起来聪明,他不是在当前窗口向很懂你,而是在用久了以后,他慢慢就知道你喜欢怎么做,平时怎么判断事情。所以说这一次我会觉得后面是这波热度啊,不是白来的,因为他讲的不再是一个做 agent 的 壳子,而是在尝试把 a 键的虫能跑,能长期养熟,长期协助这些事情上面推。如果你之前玩过 oppo klo, 你 应该更容易理解这个差别。 oppo klo 的 优点就是灵活自由啊,它它能折腾,就适合这种比较喜欢自己大系统的人,它的开放性会比较好。而后面是让我觉得很有意思的,就是它不是不能折腾,而是它能强调你的这种长期使用的体验。 然后说安装啊,就是这个官方啊,也提供了你的这种长期使用的体验啊,然后说安装啊,就是这个官方啊,也提供了一键安装的方式,如果你是 mac 用户或者 linux 的 用户, 你在官方的这个 gitlab 上就可以直接安装了,直接通过你的命令行安装了啊。如果是你是 windows 用户,你还得准备一个 wsl 这样的一个东西,这个门槛就会劝退一些人,如果 你的这个 windows 系统没有这样的一个环境的话,嗯,就会比较麻烦啊。当然这里我也为大家做了一个 windows 的 适配,我放到了我自己的 gitlab 上,然后我这个会发在评论区,如果你不想自己去配这个环境,你用的是 windows 系统,可以看看啊,我教下大家这个是怎么用的 啊?大家通过评论区打开我的这个连接以后,可以看到我的 get up 的 仓库,我把所有的代码也放上去了,所有都记他原来的,然后复制这串代码,然后打开你的命令。行啊,一定是 bug 秀,在这个里面把这个代码输入进去,然后他就会进入一个安装的界面,他就在逐步安装 好,然后到这个地方他就安装完成了。然后这个时候你需要输入这个 huawei s vien 这个段命令,然后这个命令就是查看你的 huawei s 的 版本。然后如果像我这样啊,在你原来这个对话框里面直接输入的话,他可能会报错,因为他还存留在这个旧的进程里面,所以你这个时候就需要去新建一个进程好, 然后打打开这个新的新的进程输入以后,然后它会显示你这个 herrice 的 一个版本号。嗯,这个时候你其实你整体的这个 herrice 就 已经安装成功了,然后这个时候就要进入到我们的这个配置界面了啊,就输入我们的 herrice 的 setup, 然后这个这个地方有一个比较有意思的,就是官方也是把,就知道很多玩这个的可能都已经也配置好了,所以它就不会再给你重建一个 workbench 或者 啊这种工作区,或者说是你的所有的这个模型让你重新配,然后这里选第一项,你就直接回车,然后他其实就可以直接让你去把所有的 open color 原有的一些配置直接给你接过来。 好,然后这个地方到第二步选择你的这个大模型。啊,我这里用的是 open ai 的 codex 的, 我这里接好以后,好,我们看看后面。好,然后这里就是已经配置完成了,然后就会进到我们这个啊 greece 的 主键面对话界面,好,现在我们发送一个,你好试一下啊,他刚刚开始识别模型会稍微有点慢,识别到我的模型了。

想实现 harmless 与 openclaw 强强联合,只需按下面的架构思路,把提示词输入 code body, 即可自动生成整合方案。核心设计, 将 openclaw 作为统一网关,负责接收请求、路由调度、协议转换。 harmless 作为深度执行引擎,专注本地高性能计算与任务处理两者。通过 openclaw 原生的 skill 机制, 触发 hermes 的 本地 api 服务,实现网关层加执行层的清晰分层。架构优势,网关层管理流量与权限,执行层保障算力与稳定性, 既降低藕合又提升扩展性。使用 codebody, 你 无需手写胶水代码,只需输入上述提示词, codebody 就 能自动解析架构意图,生成 skill 配置、 api 调用视力与部署能力与 hermes 的 执行效率为你所用。

最近好多朋友问我这码是啥玩意,其实就是个能回微信,能写代码的智能帮手,安装特别简单。前提是你装了 python, 三点一以上,打开终端,一行命令搞定。装完跑下 hermes, 看到版本号就是成功了。 装它真不麻烦,只要电脑有 python 三十一一行命令,敲完就完事。再输个 hermes 命令,看见版本号出来就算成了。 重点来了,连 vx 跑 hermes gateway setup, 在 平台列表里选 vx, 然后终端会弹出一个二维码, 掏出手机打开 vx, 扫一扫,滴一声就绑上了。整个过程不到一分钟, 连上之后,你在微信给机器人发消息,他就直接干活了。查资料、写代码、看服务器,全在微信里搞定,不用切应用,不用开终端。 hermes 能做的事远不止聊天、 定时任务、挂技能、记忆学习,多平台转发,你让他每天早八点给你推 ai 日报,他自己就能跑。 部署过程中有啥问题,评论区留言, hermes 的 玩法后面我会慢慢出定时任务,接企业微信飞书配置,想看的扣一!我是 ai 小 白,日常关注我,带你用 ai 省时间不踩坑!

五月第二周,大家早上中午晚上好。上期反馈说字幕挡住了内容,这会稍加修改。下面是这周国内十一家厂商的 golden plan 更新汇总, 自解放周上线了 agent plan, 计费规则是按 tokens 计费, token plan 新增支持了 hermes agent 工具。 百度千帆的 deepsea v 三点二模型更换成了 visa flash kimi 增加了 kimi club 群聊仅两个高等级订阅可用腾讯云通用 tokamplin 增加了会员老模型下架时间。

第一步,在 turnx 终端中配置 hermes agent, 设置 digic api 密钥后启动网关服务,看到各平台和定时任务调度器成功加载,这是整个部署的第一步。第二步,通过企业微信与机器人进行首次对话,机器人告诉我们它运行在 android 十二的 turnx 环境中,使用 digic v 四 flash 模型首次连接成功,对话功能正常。 第三步,用户尝试让机器人打开微信查看消息,机器人清晰解释了它的能力边界,它运行在命令行终端环境中,没有 android ui 操作权限,无法打开或控制其他应用。第四步,虽然不能操作手机应用,但 hermes agent 具备强大的联网搜索能力, 搜索 ai 关键词,并搜索引擎及时返回了十大热门 ai 平台榜单,展示了实时信息获取能力。第五步, hermes agent 拥有强大的 skill 系统,用户可以从 coha 等市场安装技能来扩展功能, agent 会智能分析兼容性,给出迁移建议。 第六步,最后是任务管理功能创建周五演讲代办事项,系统自动生成编号 t o 零零幺,还能智能追问优先级,一个完整的 ai 助手就这样在手机上运行起来了。

嘿,今天跟你们聊聊 hermes 的 精装攻略啊,工欲善其事必先利其器嘛,对吧?百分之九十的人其实都没把 hermes 的 真正潜力给挖掘出来。精装后的 hermes 和默认版那完全是两个概念,毛坯版就是个临时聪明助手。精装版呢,是有记忆、有工具、多感官、会进化的专属数字分身。今天手把手教大家从零开始精装,希望能帮到你们哈! 第一步,先定身份,告别鲸鱼记忆。别急着装工具。第一步,得先给 ai 补上身份灵魂先建个 so 点 m d 文件,定义好 ai 的 角色风格、工作方法,要是懒得手写,直接抄 agency 杠。 agency 杠这个中文角色库,工程设计、营销、金融这些职业模板全都有,直接给 ai 装个职业大脑就完事了。 第二步,换记忆系统,这是核心升级点,默认记忆太积累了,得换成 hindsight, 自动提取实体事实时间,搭建知识图谱,对话的时候自动关联长期记忆,再也不用一遍遍重复交代了。配置命令很简单, hermes memory setup, 注册个 api 秘钥,一键激活常效记忆。 第三步,装上网眼睛,让 ai 能读懂互联网,不只是会搜索就行,还得会抓取。 gina reader 能单页快速抓取 cross。 四、 ai 能批量深度爬取, scraping 能破解反爬页面。 camera fox 能模拟真实浏览器,这样 ai 才能真正看懂全网内容。 第四步,变身专业研究工具,让信息秒变可用素材,效率直接拉满 tab tab go 是 零成本的兜底搜索。 pen doc 是 万能的文档格式转换工具, marker 更是 pdf 转 markdown 的 神器。 第五步,多模态升级,让 ai 不 只会打字,解锁听说话的全能能力。 whisper 能做多语言语音识别, h t t s 是 低成本的语音合成 fail 点 ai 加 f l u x 能生成高质量图像内容创作者,直接打通全生产链路。 第六步,控成本,提效率,长期必学 token 消耗要是失控了怎么办?这几步必须做! talk scale 能格式化 token, 能精细化拆解成本。 r t k 能压缩终端无效输出 skill 生态,能避免重复造轮子。还有自我进化工具,让 ai 自主优化。 第七步,配总入口,让工具不混乱,别装一堆工具乱成麻。用 awesome 杠、 hermes 杠 agent、 hermes ecosystem 一 键梳理,全生态精准选工具。 真正的差距在哪里呢?不是你会不会写 prompt, 而是你有没有把聊天 ai 改成专属智能 agent。 精装 hermes 等于长期写作的数字搭子,记忆抓取、表达净化、全拉满,赶紧照着配置解锁 ai 的 真正实力吧!

有朋友问能不能让 ai 自动操作浏览器,答案是肯定的,我下面就给大家简单演示一下。打开吹 solo 这个工具,先切换到 work 模式,我们 在输入框里用自然语言告诉他你的需求就行。比如自动操作浏览器,打开百度,输入最新 ai 消息并搜索发送之后, ai 会自动帮你完成三个步骤,第一步,打开百度首页。第二步,在搜索框里输入你要搜的内容。第三步,按回车键执行搜索, 整个过程完全不需要你手动操作,而且它还有自动重试和容错机制,遇到页面加载慢或者元素找不到的情况会自己调整。 你看任务完成后,它会给你列出一份详细的执行清单,每一步是成功还是失败,用了多长时间都标的清清楚楚,出了问题也能一眼看到哪里出错了。自动操作浏览器可以应用在很多日常和工作场景里, 比方说商城自动上货、批量填写表单、定时查询数据、跨页面信息采集。还有一些公司需要在浏览器里操作的业务系统,都能用它来解放双手,不用再每天重复做那些机械的工作。最后提醒大家一句,给 ai 发指令的时候,尽量写的清晰,具体一点, 这样执行成功率会更高。好了,今天的分享就简单到这了,关注我,持续分享更多 ai 实战技巧!

今天给大家看一下我是如何用 codex 去安装哈密斯的,我直接在 codex 里面给了一个指令,让他去给我安装哈密斯,后面他会给我一个选择,是安装这个哈密斯背景,还是说一个是个包。这里呢我们直接选择去安装这个哈密斯背景的本底, 后面我们就不用管了,这个这个 codex 他 会去直接帮我们安装,然后呢后面安装好过后,我们直接在这个哈密斯去运行就可以了。 这里呢有一点需要大家注意,就是我们这个 a 件呢,它是需要去调用模型的,这里就建议大家直接可以去在那个 deepsea 里面去 注册一个账号充值。我们在后续配置这个阿米斯调用模型的时候呢,直接去配置这个 deepsea 模型,那对于我们来说相对来说会比较友好, 因为我们如果去用国外的模型的话,就是配置起来或者其他方面会比较的复杂和麻烦。但是这个 deepsea 呢,因为直接是我们国产的这个大模型,大家无论是注册啊还是都是比较经济实惠的,而且它效果也不错。那现在我们用的话,建议大家 直接用那个 usb 微四 pro 版啊,不要去用那个呃,微四的卡顿版,因为卡顿版它上下文太短了,就是你在执行和处理一些复杂的这个任务的时候,它会导致这个上下文太短而被切断,所以直接用那个微四 pro, 我 这几天使用下来效果还是不错的。 好,我们回到这个发明这里啊,就我安装好过后,我问了他一句最擅长做什么事情,他告诉我他最擅长的是写代码,控制 mac, 然后搜索研究文件处理,对吧?然后这里我用了他一个功能,就是看板功能,这功能呢其实相当于多个 app 的 去相互协助,他们可以按照一个流水线的方式去工作。那其实在我看来呢,就是我让这个 哈密斯给我创建了几个数字员工,每个员工负责做什么,他们的分工很明确,包括他们输出内容是什么样的,我也都给了指令。那举个例子啊,我可以让他帮我创建一个研究员,让他帮我创建一个协手,让他帮我创建一个编辑员来做文档的一个叫验。接下来呢,我们我带大家一起看一下。好,这里我问了一下他,这个让他打开这个看板键面,对吧? 好,然后在这里我给他输入了指令,让他去粗俗化。后面呢我作为一个小白,我问了一下,我说怎么好,怎么样才能使用好这个看板呢?就详细介绍一下使用方法,因为我是一个自媒体工作者,就是我需要去做一些内容的产出。好,这个时候呢他就给我了,他说那我先看看系统上的 profile, profile 就是 角色啊,就是角色,大家可以捏成就是一个 agent 的 角色, 这是一个数字员工,那他这里看到了我只有一个默认的 profile, 那 看板最大的威力在于多 profile 定型工作,这个其实就是说的看板,它就是一个多员工的定型工作,就是相当于是一个团队协助,对吧?我们如果说单个 profile 的 话,是发挥不出它的一个威力的, 那这里他告诉我看板是什么?一个持久化的任务队列加依赖管理系统,我可以把任务写进看板,它会帮我记住排队,追踪,然后多个 profile, 并且干活,一个写稿,一个收资料,一个做图,对吧? 那这就相当于我们一个一个团队了啊,一个团队,一个部门的这样一个角色,所以说这个就是其实我一开始没太理解的这种数字员工的概念。那在哈密斯这里呢,我得到了一个很具象化的一个知识的一个收获。第一步呢就是创建专用的 profile, 就是 我们要创建数字员工,然后这里呢,我创建了三个,一个是研究员的 profile, 然后一个写手,一个 editor 编辑的一个 profile。 啊, 我们接着往下看一下,那这里呢,他给了一个实力,那刚好和我目前在做的事情是很匹配的,因为我现在在做自媒体方向,包括一些 ai 自媒体啊,包括一些求助辅导的这样一些自媒体。好,那么他会帮我创建任务,对吧?我们可以看一下,在下面直接去看一下, 而且呢,他默认我刚安装这个 uh hamis, 我是 一个小白,所以说他给了很多的工作建议,我觉得和我目前也是比较匹配的,你看在这里有 research, writer, 对 吧?这三个就是我的数字员工,后续他们就按照 那个 researcher, 他 去搜索材料, writer 他 去写稿,然后 editor 他 去帮我校对这个稿子的真实性。啊,这个完善的一个程度。 好,下面就是这个。然后其实我最开始用的,我也不知道去怎么创建这个 profile, 那 我就问他,我说如何去创建 profile 呢?他也很简单,他说 profile, 一 条命令就搞定了,他给我演示了一下三种创建方式,他也告诉我了,然后每一个 profile 它的这个工作职责,对吧?工作标准,他也告诉我了, 这个时候他就说他要主动帮我创建三个 profile, 那 好,我就需要了,下面四个 profile 就 绪了,包括一个默认 profile。 后面呢?他觉得创建了这个角色还不够,他说建议我要去做一个后续的配置,就是给每个 profile 设置不同的这种 show, 就是 人格,也就是我们的灵魂价值观,对吧? 这个我觉得真的是太强大了,我从来没有想想到一个哈密斯,他可以帮我做这么多的事情,一个是帮我创建数字员工,另外一个他能够想到我没有想到的事情,以便于他能够去更好的工作,所以大家会看到呢?这个研究员他擅长做什么,对吧?你是一个专业的研究员,那就是给了一个角色职责,就是擅长搜索信息,整理资料,做竞品回复, 回复简洁有结构,用数据和事实说话,那这个其实就是三个。第一个是给他角色定义职责输出要求,那这个他就是像我们平常大家用这个 ai 的 时候,我们有提示词,那这个提示词就要完全遵循这样一个结构,他才能给出很好的一个回复,所以这是这一块我觉得很专业。然后还有这个写手,还有编辑都给他给了不同的这个人格。 好,那么下面呢?他说配置好了,让我,让我,让他帮我跑一个这种任务,那这里呢?好,这里我又问他了,我说我怎么给,怎么给这个 profile 设置上 solo 呢?两种方式最简单,直接写文件, 然后呢他现在呢直接帮我把这三个 profile 都配置好了。好,大家可以看到下面这是他配置的一个内容,好,他就搞定了,这个 profile 已经写好了,对吧?然后他每个 profile 做什么,然后他都已经给我弄好了, 下面呢我就跟他说了一件事情,我说你去用这个三三个 profile 帮我做一件事情,因为我下午要拍一个求助招聘的一个投稿稿啊,你现在帮我在小红书或者抖音去搜索热门话题,然后呢帮我交对话题的真实性,三个三个 profile 相互协助,这个时候他就去帮我自动的去跑这个流程了, 这过程呢我们就不看了,就给大家看一下他输出的内容真的是很惊艳啊,我觉得他说的内容比我自己写的稿子要好很多,而且呢非常的专业,他也是完全按照现在那种我们做自媒体和抖音自媒体包括小红书这种热点的一个要求 去写的,这里他已经把这个任务处理完了,然后会一个一个的帮我去交。对啊,好,那我们直接往下看,这里整个处理的时间,他也会动态的在这里去更新啊,动态去更新, 这里脚跟质量很高,携手抓住研究员中的三个问题,结构清晰,数据扎实,可以到到位。这是我们的 ad 头呢,他要去检查这个鞋手的内容符不符合要求,好了就是好,完成过后呢,他这里会有一个最终产出文件,这个产出文件呢, 他最开始是用这个 markdown 的 形式放到我的这个桌面上的,但是呢我因为要用的话,我觉得这个 markdown 不是 很符合我的要求, 所以呢,我就让他直接给我放到桌面,而且呢,以后输出内容形式都用 word 形式,看到没,这个时候呢,他就说啊, memory 呢,他有记忆功能嘛,他就记住了,他就先把这份文脚本转 word 吧,以后不用哦,这个格式输出。 好,这这里是这个好,这就是他有很强大的记忆和自动净化的功能,就是你会越用越聪明。就是,但是呢,我们最开始用的时候呢,一定要给他一些高质量的问题,高质量的方式,他才会去自我的净化,这个也是我们作为初学者在最开始的时候要去注意一些事情。 好,那么坐到这里呢,呃,我觉得在这个从 harvis 他的安装,他的这个呃任务执行,包括他看板功能就给大家讲到这里了,还有一点呢,我觉得 很好的一个方式,就是什么呢?我觉得就是他这个电脑在家里,可能我有时候在外面,那我想通过其他的命令终端给他发一些任务,发一些指令,让他来帮我执行,所以说呢,我也问了一下他, 好,那这个呢,是我给他给了一个定时账户,让他每天早上帮我输出我的需要的这样一个文件,那他就帮我设置完成了,比如说桌面,就是口播稿,然后每天早上八点,对吧?然后按照什么样的流水线来执行,格式是什么?每天开始,对吧?这个就是这个, 还有第二个呢,就是我觉得太麻烦,就是我想我通过微信来控制他,所以呢,我就问他,我说,呃,我想能不能用微信控制,然后他说关于微信直接发送,哈密斯确实支持微信作为通道,但配置面比较麻烦,那这里呢?呃,他建议是用公众号,但是后面呢,我自己试了一下,因为公众号的话它叫 f id 和 f secret, 然后我们可以把这个数据给他,他会帮我们配置。那后面呢,我问了一下, 他其实是可以通过那个微信的聊天入口,我们去直接这个使用的。好,大家可以看到这里啊,就是我跟他说,他给我给了两个方案,就是我想用手机端来控制他帮我去干活。第一个就是呢,用个人微信扫码接入是比较推荐的,那直接在这个 终端里面输入这个迷你行,然后第二种方式呢,就是用公众号接入,我们要给他这个 app id 和 app secret, 那 他推荐的是用这个微信扫码,所以呢大家也可以看到。 好,我这里呢,我选的是方案一,然后他让我按照他的这样一个指令去执行。用手机扫码啊,然后先输入命令行,然后去手机扫码。这里呢可以给大家看一下,就是 输入这个命令行过后,它会出现一些基本的信息。然后呢我们在这个地方去选择什么呢?选择这个微信,选择微信这里呢,大家只要按照他给你的指令去一步一步操作就可以了,一步一步操作,然后最终你都会去把这个 微信和 harmis 去打通的。大家可以看到,在这里你处理完过后,它会有一个二维码,如果你这个界面没有出现二维码,你可以复制这个链接,在浏览器打开,然后去扫码就可以了,这个配置真的是很简单,嗯,很简单。 好,然后这里呢,大家可以看到如何打开终端,对吧?其实还有很多,因为我第一次用这个 harmis 嘛,我很多还不知道,我说啊如何打开终端,它会告诉我怎么去打开,然后呢?后面, 好,这里他告诉我微信连接成功,然后让我去直接发送。所以大家会发现这个哈密斯真的是很好用的一个 ai agent, 也推荐大家去下载安装使用,因为这个对于我们普通人来说没有太高的一个安装的门槛,大家直接用这个已有的 ai 镜头,比如说你如果没有 codex, 你 也可以用 workbody 让它去帮你安装,而且呢它调的模型是直接可以使用我们的这个呃 deepsea 的, 然后你直接去用它微视模型就可以了,这个去注册 deepsea 微视也很简单。 那本期的视频呢?就先到这里,大家可以点赞关注加收藏,后续我会输出更多对大家在工作上有用的一些 ai 小 技巧。

就在昨天, kimi 正式发布并开源了自家的 k 二点六模型,我做的第一件事呢,不是打开 kimi 的 app, 而是打开了 hermes。 最近大家应该都发现了,画风变了,这两周呢,开始养马了, hermes 爱马仕呢,彻底出圈。简单说啊, hermes 呢,用着用着自己就能记住你的某些习惯。 这次 k 二点六发布了,有个细节,官方适配名单里, k 二点六呢,就在上面。而且 hermes 团队呢,给出了很高的评价,工具调用和 a 阵的循环明显更紧致了,编程水平肉眼可见的提升。之前 hermes 我 一直用的是 k 二点五,二点六一出来呢,我第一时间就做了切换。 这两波升级叠加在一起啊,差距比我预期要大得多。安装和搬家的过程呢,我就不展开了,一行命令呢,就可以安装好,它会自己扫描目录,如果发现你本地有龙虾配置呢,它就会提示问你要不要做迁移选择。 yes, 三分钟配置,记忆 skill 呢,就全搬过来用上。 hermes 最直观的感受就是响应利索,而且记忆上呢,没有乱七八糟的问题, 就光这两点呢,他就值得搬这个家。接下来才是重点啊。切到 k 二点六以后,给你们看看日常使用场景上会有什么差异。我让他帮我整理一份 a a 阵的框架现状的资料摘要。来源呢,我指定了几个网站,其中有一个呢,因为一些不可控的力量是访问不了的。 k 二点五的执行日制呢,是这样,三个网站访问失败,然后开始自己想办法装浏览器,跑脚本,换接口,不停的重试。我去倒了杯水回来呢,他还在转,浪费了大量图片,换成不了他直接换了来源继续跑。 最后报告出来了,底部还标注了 ready 的 访问受限,已由 get up 替代。这就说明现在 k 二点六呢,卡住了,是会自己想办法的。官方说法呢,管这个叫做自主化的执行能力,翻译过来就是他会自己处理这些事。再看第二个二十多条的用户反馈,让他按问题类型呢分类,输出一个可以直接发给老板的表格。 k 二点五呢,给了我一张二十行的表,每条反馈单独一行,条数呢,全是一,你要拿这个去找老板呢,已经合并好了,优先级呢,一眼就能看出来。底部一句话还点出了最需要解决的问题是什么? 这张表呢,打开就可以直接发送,当然单次测试呢,说明不了全部问题,但目前用下来呢,感受还是比较稳定的,属于润物细无声那种。 这些年我们衡量一个模型好不好,其实就是看这些任务里面他卡住了,能不能自己绕出来,结果呢,是不是给到我们想要的。这半年呢,你能看到一个明显的趋势,就是框架和模型呢,开始真正配对了,框架是把路修好,但最后跑在路上呢,还得是模型。 最近我也会在实际项目中继续使用 k 六来做些开发,大家可以去聊聊看。

哈喽,同学们大家好,我是木贤,本期视频为同学们分享 harmony 的 computer user 的 使用教程,我们来了解一下背景, harmony 的 它通过去集成了一个叫 c u v driver 的 库,它就可以去操作 mac 电脑了。这个是 harmony 的 官方文档的说明,就是本次它支持的这个 computer user 仅限于 macos, 如果你是其他的操作系统暂时还不支持 好,然后他怎么去实现的呢?其实他就是通过这个 c u v driver 他 去提供的 m c p 来让这个哈密斯的对应的大模型能够去调用对应的 m c p 工具,从而去实现操作我们的电脑。然后我们来看一下这个 c u v driver 这个库, 这个目前是在 google 上面开源的, store 有 十七 k。 这个 cuv 给同学们解释一下为什么叫 cuv, c 的 话对的就是 computer u 就是 user a, 自然就是 agent, 就是 给 agent 提供了 computer user 的 这个能力 好,然后在文档里面其实我们可以看到就是这个 c u v driver, 它就是提供给 mac os 去用的,所以说自然 port 这边它就仅限于去支持 mac os 好。 然后本次给朋友们重点要去分享的就是它这个 工作原理,就是这个 cv driver 它的工作原理,以及我们使用 harp 机的去操作电脑时的一些实战的技巧。我们现在了解一下这个工作原理,其实这个工作原理它是比较简单的, 我们知道 harp 处理器它是集成了 mcp 的 功能的,所以它自然就能够去操作 mcp, 而这个 cv driver 它就提供了对应的 mcp, 所以 说 harp 处理器和 cv driver 就 通过 mcp 就 给建立起来联系了。然后就是 cv driver 它凭什么能够操作电脑来? 其实这个 cv driver 它不是因为它绕过了 macos, 而是它把 macos 开发出来的能力都给集成进来了,来去操作这个电脑 就包含了 icc b l t a p i, 对 应的就是 macos 提供的这个辅助功能,我们来看可以看一下,比如说我们在我们的设置里面,我们来搜索隐私和安全,我们就可以看到对应的有辅助功能,然后我这边的话已经把这个 cv driver 已经给它开启起来了。 这个辅助功能开启之后,对应的其实在 windows 上面也有类似的功能, windows 上类似的叫讲述人,就是他会把你的这个电脑,你当前打开这个界面,他长什么样,比如说我当前这个界面 在两边是空白的,中间有文字的描述,我的文档就类似这样子,通过语言的描述把你当前这个 ui 给你描述出来。 仅仅通过文字的描述,你担心这个屏幕长什么样?肯定还是不够的,因为很多时候很多 ui 它是文字描述是不够的,比如说一些视频剪辑软件,或者一些比较复杂的这个表格操作啊,这些就是通过 ui 的 描述是不够的。所以说还有一个 就是 macos 暴露出来的录屏的这样一个功能,我们同样的可以在这个里面看到,我们来搜索这个隐私和安全。这个下面 你可以看到有录屏和系统录音,就是比如说我们去用一些远程软件,比如说像向日葵啊,或者说 two disc 的 一些软件,它就会要求我们把这个功能给打开,其实本质也是把我们这个屏幕给录下之后,然后我们就可以去点击屏幕对应的位置去操作我们的电脑, 所以说借助于它重点就是这两个功能。但还有一些比如说窗口进程的投递,这些系统能力它全部给整合起来了,所以说这个 c u v driver 它就能够去操作我们的电脑,并且它还做了一个事情,就是把这些操作能力都封装成了 a t 的 能够使用的就是这样的一个步骤, 就是我们可以通过去截屏,然后截屏之后找到元素的这个位置,比如说这个元素它可以去点击,或者这个元素它是一个输入框,可以去输入文字就等等的这些操作,然后找到这个元素的,所以之后我们就可以去执行对应的操作,比如说去 鼠标点击或者敲回车啊这些,然后最后就会去验证这个操作,就整理下来就是 a 镜头的这个工作流,就查找我们店了这个工作流, 然后这样的话 ai 它既可以去读取 ui 的 数,并且可以去调用这个控件的动作,本质就是这两个能力, ui 数通过 x c b 二 t a p i 提供,然后调用控件就是结合 screen recording, 因为它读到屏幕之后,它可以去点击对应的所有的位置, 然后也可以借助于截图做视觉定位,做结果的验证。从前半部分来看,我们可以知道就是因为他要进行视觉的定位,还有就是结果的验证,所以他就肯定要这个大模型能够去理解视觉, 因此 computer user 如果要做通用的 computer user, 最好接入支持图像理解的多模态大模型,其实也不是说最好,就是应该是必须要接入, 必须要借助支持图像的一个大模型,它才能去做世界定位和结果验证。成人本的模型可以做辅助规划和分析,但是单独使用就会受到限制,那这个是它的工作原理, 那下面呢?我们来开始进入到实战环节来去实际看一下。首先的话我们需要升级哈密斯的版本,这个我们可以跳到哈密斯的 get 哈卜这边,它的描述 就是你得升级到大于等于这个版本的 harryson 的 就是零点一四这个版本,它对应的发布日期是二零二六年五月十六号这个版本在这个下面的描述里面,我们这里可以看到它就支持了 computer user 的 这个能力。 好,这是第一步升级,然后之前我给同学们分享过了 hermes 的 安装以及升级的教程,然后所以说这边如何去升级 hermes, 我 就不展开讲解了,我们可以打开我们的终端,通过 hermes 干大 v 可以 看到我当前这个版本就是满足条件的,现在我们继续来回到文档, 就是我们 hermes 满足之后,下面我们就可以去安装 cpu driver, 直接执行 hermes 提供的这样一个 computer user 的 命令,直接去执行 好,因为我这边已经安装过,所以说比较快,并且他提示我已经安装了,然后他就会提示我们需要去保证,就打开我们的系统设置,然后个人和隐私去把 cpu driver 对 应的这两个权限给打开,那同学们看到这个不要着急啊,就说你会觉得这个操作比较复杂,其实没有关系, 因为你再去使用这个 cpu 抓板,他只要触发了这个操作的时候,他就会弹出这个弹簧出来,那你去给他设置对应的权限就可以。好,然后下面是我们可以去查看我们安装的这个状态。 好,这个 status 这边我们可以看到已经处于 excel 的 状态,就我们就安装好了。安装好了之后,下面我们就可以通过 c u driver status, 你 可以检查你的 c u driver 是 否已经处于 running 的 状态,如果说它不是 running 的 状态,那么去执行这个 service, 把它给启动起来就可以了。我们看到我这边已经启动起来了,所以说 就重新再启动,就不会再发生任何的变化了。这个是安装仪检查我们的 c u driver, 那下面我们就可以来开始使用 computer user 了,使用之前要给同学们多讲一些东西了,就是我们使用 computer user 就 也也不是说那么多 简单,就是需要给同学们去讲一些技巧,这个技巧我把它沉淀为了一个 scale, 并且这个 scale 我 已经提前安装好了啊,这个 scale 也会直接给到同学们,我们通过 scale sniff grape computer 给同学们来看一下,对应的就是我去写了一个 computer user helper 的 这样的一个 skill, 我 已经把它安装到我的 harness 这个 default 这样一个镜头下面了。好,那么这个 skill 讲了什么呢?这边给同学们来看一下。 这个十六的核心就是我们用来限定和指导马克威斯的操作,根据操作类型去选择最合适的技术再执行啊。这边有很多内容,我就不带同学们一个一个看了,我们直接拿到下面这个表格,这边给同学们来看一下。 就是举个例子,比如说我们去打开一个应用,这个打开应用通过 c u driver 能不能实现呢?是能实现的,怎么实现?就是它会去读到你这个电脑的 u i, 然后比如说你要打开 wps, 那 么就点击这个 wps 就 去打开了,但是 有没有更快的方式来?其实有的,我们直接通过 open 干 a 指定我们用的名字,这个反倒是比 c u java 还要更快的,因为你没有去执行视觉的这个识别,以及去点击这个操作,这个直接通过 open 命令一含就可以实现,所以说我们就不需要通过 java 去 执行那其他的类似的,比如说我们要激活一个应用,我们要让应用去全屏,这些我们都不建议 去执行 c u a driver, 而是直接用最快的这种方式去操作。那什么情况下我们要使用 c u a driver 来,比如说我们要读起 u i 数,要点击按钮,菜单输入框这些,那么我们就要用到 c u a driver, 所以 说我的这个 skill 呢,就是 会分析用户的这个操作的诉求,然后给它执行对应的动作的时候,就会优先去选择最合适的操作的时候就说没有安装。我的 这个看屁了,用着黑粉的话,他就一味的去盲目的使用各种技术,这个我也是在这个地方踩了很多坑,就是执行了一个操作,执行了很多秒,最后还没有去完成啊。这个这个朋友们可以看到,我这边的就是这个操作花了很久的时间,但是没有完成, 然后就是建议直接通过聊天通道来去管理 computer user, 这样它不会导致光标输入、聚焦位置这些发生变化。因为如果说我们直接在这个终端里面去操作 hermes, 比如说来给同学们演示一下哈,好,我们直接终端里面输入 hermes, 那这个时候,比如说我们直接让他帮我们打开浏览器,帮我打开谷歌浏览器,然后在浏览器输入框 里面输入 b 站链接,好,就是这个操作,那这个操作因为我本身是在当前的这个 harmless ui 里面去操作的, 那这个时候因为你要操作浏览器,所以说这个时候他又跳到了其他的这个界面上,比如说我们可以了,刚刚我没有操作这个是他自动跳转过来的,跳到浏览器这边,然后下面就我们在这个时候你看,比如说我们通过这个终端里面又跳回来,并且他会询问我们各种权限,好,这个权限我给同学们来截个图啊,这里 再截个图给他定到这里啊,因为这个地方如果说我们六十秒不去允许这个操作,他就会超时了,所以说我先把这个图定下来, 然后给他们最大的这边我已经把对应的这几个权限什么意思给他们来梳理了一下。首先第一个就是允许一次,就是允许这个 come on l, 那 下一次执行 come on l 他 还会继续去问。第二个就是允许在这个绘画里面去操作,比如说我们这个地方后面再来一个 come on l, 他 一般就不会再问了。不像第一个每次都还要去问, 那对于其他的动作,比如说点击啊,输入啊滚的这些动作,那肯定是还会问的,只是说这个 come on l 他 不会再问了, 那 come on l 是 什么意思啊?其实就是比如说刚刚我们可以看到让他帮我们打开浏览器,如果在浏览器里面我们输入 come on l, 我 们我们可以发现就是把这个光标直接聚焦到这个浏览器的输入框里面去输入,所以它会提示我们需要这个权限。好,然后第三个就是 我们直接就永久的去加入白名单,这个是我比较推荐同学们去设置的,就如果说你在 通过终端里面去操作哈密斯的时候,他寻觅你这个权限,你就直接选择第三个,他这个的字面意思是永久加入白名单。在这个 computer user 的 场景里面,我分析了它的原码,它的实际的效果更接近一点就是你在本次运行哈密斯的期间,你后面任何的这个操作, 就包括你的这个 key, 就是 键盘嘛,然后点击 click, 然后这个 type type 就 type script, 就 打字去输入,它就是滚动,这些操作它都不会再问了,就说你就直接去允许一次,那后面就都不用允许了,这个是要同学们,同学们去做这个操作了。 第四个单就是去否定你的权限单,就是不不让他允许执行这个操作,这就是我们在这个中单里面去执行这个 哈密,随机的就插上电脑就有很多的这些材料框框的一些限制没有那么方便,所以我就比较推荐同学们直接就是我们通过聊天通道的方式去操作。好,那下面呢?我现在把这个截图给删掉了, 下面我们就来通过聊天通告的方式来去管理 computer user, 好, 我直接在手机上面进行操作。好,这边我就比如说我这边就直接进入到牛魔王的这样一个对话里面,因为这个就是我绑定的 default harness 的 这个 agent。 好, 然后我来给他说 帮我打开我电脑上的谷歌浏览器,好,直接来发送给他。 好,我们可以看到这边有对应的返回消息,这个时候你可以看到我这边手势没有做任何的操作的,我们等他去操作我的电脑。 好,这里我们可以看到就是已经触发了两个 skill, 一个是 computer user 的 skill, 一个是我们自己实现的, ok, 我 们可以把这个电脑它已经帮我们打开了,还是比较快的哈。然后现在我们再给他下载一个任务,就是在浏览器里面输入 b 站的链接,然后打开 b 站的网页, 在浏览器的链接输入里面输入 b 站的链接,打开 b 站。 好,其实这个其实它属于浏览器自动化的一个操作,但是我们可以通过 computer user 的 方式,同样的是能够实现的。 好,我们等待一会儿啊,等它去执行。好,这个其实同学们可以看到就是这边操作一步,它就会把这个日字给打出来,就这个也是我们 computer user helper 这个 skill 里面给写进去的,就操作一步就要把单行的 操作的信息给输入出来,这样方便我们用户看到他当前执行的是哪个操作。 好,我们稍等一会儿啊。 ok, 我 们可以看到这个 b 站也已经成功的去打开了。好,这个时候比如说我们再来给他下载一个任务,关于视觉的, 在 b 站里面搜索程序员儿目前查看他最新的五条视频,并且把他最新的,并且把他最新的这五条视频的名称发给我。好,然后我们再来发送。 ok, 我 们来看一下这个效果啊,这个时候其实我们可以看到它有点偷懒了,它就并没有去直接在这个页面里面去操作,而是直接走它内置的这个浏览器里面直接去搜索了。啊,我们那这个操作我们先给它结束一下, 那我们直接给它结束, 直接执行这个 stop 就 可以结束。 然后我们现在让他做另外一个事情,帮我打开电脑上的 wps 软件,来这里走一个。 好,我们可以看到他很快就帮我们把这个 wps 软件给打开了, 这边它也提示了它去已经找到最新的五条视频的标题,因为它这个地方它是直接走它内置的浏览器跳转过去,没有直接走我们操作电脑这种方式,所以我们直接给它停了,现在我们给它下到了另外一个任务。好,然后现在我们让它帮我们创建一个 excel, 点击新建按钮,帮我创建一个 wps 的 空白的 excel。 好, 直接走一个。好,它这边提示它会通过 g u i 帮我们在 wps 里面点击新建,创建一个空白的 excel。 好,这个时候我全程这个手是没有去操作的。好,注意,我们其实看这个里面就是我们要把应用置到最前面,这个是非常关键的,因为他去截图的时候,你要把你的应用放到最前面,这样才能更方便他去截到图, 我们可以让它找到了新建按钮,现在它点进去这个步骤啊,你可以看到其实对于人来说是很简单一个操作,但是对于 wps 它就没有那么的方便了。好,它找到了表格了,现在它要继续点击创建表格, 好定位到空白表格这个地方,一个日期里面可以看到它是在分析这个页面它是什么页面,然后再用,然后它再根据这个判断决定走什么操作。 ok, 我 们可以看最终它完成了把我们新建的一个空白的表格好,然后这就是 computer user 的 演示,就整体而言它是能做到 computer user 这个操作的, 但是就是每一个步骤其实并不是那么的快,有一部分原因就是我当前录制是用这个四 k 画质的,同给同学们去录制,所以说这个 他再去结合到我这个画面去识别画面的时候,这个图片比较大,就导致他推你的速度比较慢,所以就会整体而言执行的速度会慢一些。 然后另外的话就是目前就 computer 这一块我觉得还有很长的路要走,就是稍微一些复杂的画面,一个就是要么执行失败,要么就需要等很久, 后面 computer 又有一些更新的操作,也会及时给同学们更新上来,然后同学们有关于自己的一些想法,也非常欢迎在评论区留言讨论。好,我们本期视频就到这里,我们下期视频再见。

一定要用 ai, 我 也是听了万粉丝博主的话呢,用智能体 ai 体验了一周啊,就是这个三件套,那结果是什么呢?我的效率提高了三倍,而且呢,很多人来找我装这个爱马仕,那这个组合呢,你也可以用,它的厉害之处在于什么呢?你你不用去问豆包或者 gpt, 让他们不断的去了解你, 每一次呢,你还要去给他新的提示。结果就是你用了这个三件套以后,再也不用来回的去切换 ai 工具了。 比如说我之前呢,写公众号文章呢,得三个小时才能写一篇啊,现在呢,只需要十八分钟,我只需要把一个想法丢给他, 我说请帮我写一个公众号通推文,对吧?关键是什么呢?他懂我的风格啊,深蓝色卡牌的这种封面,职业痛点的开篇,还有数据结果的对比,初稿呢,就基本能用,我只需要呢在做略微的修改。 呃,然后呢,他就会直接帮我推送到草稿箱啊,省了两个小时四十分钟啊。第二个呢就是知识卡片,不用来回的去切工具出图了。之前呢,我想把我的内容呢做成这种卡片啊,传播出去要调用其他的 ai 工具, 现在呢,我直接告诉他把这段做成 svg 的, 呃,知识卡片啊,黑底,呃。然后呢,总共分为三步啊,金句收尾就行,风格要统一,想发朋友圈了,或者是发在其他的自媒体平台上都是可以的,一张 svg 就 够了。 第三个呢就是信息处理,以前的我半个小时啊,现在呢,我只需要说一句话,比如说我以前干了啥以后我晚上得费力的去想,或者呢是翻看自己的那个笔记, 但是有了智能题以后呢,比如说我今天做了什么事情,有哪些是可以附用的,有哪些是对别人有用的?那对我可以附用的,我就按照知识卡片的标准去沉淀下来,对吧?对别人有用的部分呢?那就是我明天短视频的选择题, 那这样的话呢,就极大地节省我的时时,我的时间,对吧?省下它的时间我要干啥呢?哎,我们可以算笔账嘛,每天大概能省下两个小时,一周呢就是十个小时。那十个小时呢,够我做三件事情,比如说读一本两百页的书,学一个呃,新的 ai 工具的基础一些操作, 或者是呢,再拍三条短视频,它没有变出更多的时间,只是呢更高效了。说实话,这个 ai 这个东西啊,你不去用啊?就是呢,和别人在拉开差距。兄弟们,一定要学习 ai 工具,不是让你呃失业,而是让你一个人能干三个人的活。 你省下的每一分钟都不是送给老板的,而是留给自己的。你解决的每一分钟呢,都是来自救的本钱。

给大家分享一下我实测的 code graph 以及 jibble, 我 们可以看一下它的这两个插件,它是属于 graph rag 领域的知识库。我们首先看一下它的 主页,它们完全是开源的,然后我们可以看一下怎么使用,我们首先介绍一下它是做什么的,它可以使用在 cloud, code, cursor 等等的编码工具以及 open cloud harmless agent。 然后它可以使用什么呢?我们可以看到它可以进行一个减少我们 查询时候的一个工具的调用,比如说我们在运行一个代码,需要了解这个代码的架构的时候,我们需要执行,比如说反复的执行 grab read find, 然后进行了解这个代码的结构,我们这个库可以进行一个 减少这个时间以及它的一个我们模型的消耗,降本增效。然后接下来我们看一下它的 jibri, jibri, jibri 是 什么?我们看一下它的一个界面,它是为了 openclaw 以及 harms agent 进行打造的一个数据库,进行记录它的一个对话等信息。我们首先看一下它的一个 刚才实测的一个数据,我们介绍一下这个实验是怎么做的,比如说我们看一下左侧,左侧这个是没有安装这个插件,我们让他分析一下,分析一下这个 j b r 的 项目的完整架构,然后 这是他的一个分别的要求,我们通过这个提示词,然后进行一个执行,我们可以看到他有很多的工具调用,比如说读写等等等,他会消耗很多的 token, 然后我们进行获取他最后的一个时间以及他的一个 token 的 消耗量,然后我们 看一下右侧,右侧的话我们进行第二个实验,就是把它的一个缓存给删掉,然后进行安装,首先安装下这个命令,然后我们进行一个构建它的一个锁影,我们构建这个 jb 的 一个锁影,可以看到已经导航到这里面,然后进行一个 index, 然后我们可以看到这个项目花了二十五秒,还是非常快的。然后我们继续运行 color code, 然后使用同一款模型,然后进行一个测试,同一个提示词,发现它最终 达到了现在我们展示的这个效果,从原来的六分钟到现在的不到两分钟, 然后实际的消耗,我们可以看到这个表现还是非常的亮眼的。对于我们在重复的一个工程,比如说很多的代码中需要很多很多词读取,这也就是一个 red 的 流程,通过这个库可以很明显地减少这个损耗。然后接下来我们介绍一下为什么 george 是 可以进行一个 减少的,看一看它的原理。通过我们对于它的源码的一个分析,我们可以看到它们构建的是一个数据库,并且使用的是一个算法的构建。我们看一下为什么可以不用 ai 就 可以构建, 因为我们代码本来就是结构化的,我们通过这个直接建图就行。我们看一下它的一个图解,比如说 这个就是我们的一个图解,然后我们通过自动解析,然后通过 a、 s、 d 的 语法术进行自动生成的一个知识读谱,这是完全不需要 ai 进行参与的,非常的高效。然后我们进行解释一下为什么不需要 模型就可以见图,因为我们使用的是代码,是结构化的,我们使用 a s t, 这就是一个抽象化的语法术。在我们运行代码的时候,比如说变异器,解释器这些东西都是可以一个很成熟的一个流程,因此我们可以直接进行复印它就可以了。然后接下来我们看一下 code graph 的 一个构建流程,我们首先进行一个源代码,然后进行一个解析,然后进行引映,它的这个解析最后储存在 circle light 里面,然后构建一个全局的缩影,这就是提供的一个工具自动进行, 它是一个基于 graphreg 的 一个知识图谱的知识库,它是一个知识库,我们由此可见这个基本的知识库是 ai 的 一个基础见识。然后我们看一下 openclaw 以及 harms 的 这些记忆,也就是之前的一个记忆体。我们首先看一下它的一个 开源的作者,它是在互联网上有很多的一个 start, 来到它们的界面可以看一下, 然后回到这里,我们看一下它是怎么监图的。我们可以看到用户进行提出问题,然后进行一个毁调,用了这个 skills, 然后进行把它格式化出来,格式化成 markdown, 然后通过 markdown 之后,然后通过一个正则化的进行提取一个知识库的建立, 我们可以看到虽然说它宣称的是零调用,但是在我们的一个格式化 markdown 的 时候,就是需要一个 ai 的 调用的, 然后进行一个向量化,以及我们图的一个增量更新,这就建立完了。然后接下来来到这个 核心的 skills, 这个就是他暴露的一个 m c p, 他的一个解锁的一个特征。首先是关键词的解锁,然后是一个混合解锁,混合解锁的是什么?比如比如说向量处理不好的编号等等的东西,交给我们全体的缩影,以及他的一个 r f 一个融合。什么是 r f? r f 就是 进行的一个召回的一个算法,比如说这里面就是一个余弦的一打分零点七的权重,再加上它的一个余弦相似度,这是它的一个特权。 然后接下来进行的是一个图的便利,我们可以看到它提升了百分之三十一个哦。 然后接下来我们分析一下 jeffrey 和他的一个 r m 的 viki 的 一个区别。可以看到 openai 的 创始人进行 一个想法,这是维护的是一个个人的知识库,而这个是进行的一个比较成熟的一个解锁了。然后接下来这就是他的一个独立使用,然后这是他的一个安装。

一百八十四个角色,这个项目啊,评论区很多朋友们说自己不会玩,也有些朋友们呢,说担心烧头肯厉害,这条视频啊,我就从零开始带着朋友们完整的走一遍,头肯的使用情况后面我也会发出来啊。首先呢,这个项目是 get 上的一个开源项目, 我们进到项目主页以后啊,直接点击这个绿色的按钮,复制项目的仓库地址。那接下来我们要把它丢给我们部署或者安装好的工具,那工具呢,可以是 op, curl, 可以 是 tree, walk body, cutwork, 悟空或者 hammers, 随便哪个都可以。但我建议啊,最好是我们本地部署的 hammers 或者是 op, 这样呢,自由度会更高一些,如果只是想先体验体验,那就无所谓了。我这里就拿我部署好的 hammers 给朋友们做演示啊。模型呢,我用的是 deepsea v 四 pro, 我 们把复制好的项目地址直接丢给 hammers, 然后给他说,请你深入分析这个项目,我需要你完整的部署它, 我们所用。其实啊,现在我们和 ai 沟通,完全没有必要说你是一位什么什么资深的专家。啪啪啪啪啪,我们只要把我们有什么,我们需要他做什么,需要达到什么样的目标给他说清楚就可以看, 这不就开始了吗?结果他一通搞啊,这就部署完成了,其实很简单,所以朋友们,我以前呢,和你们也一样,也是磕磕绊绊一步一步踩坑过来的。但是当初啊,我发了视频后,朋友们就不用踩我踩过的坑了。 部署完成后啊,因为角色太多,所以说我们也记不住,那我要让他把角色清单存一份到我的 office 的 仓库中,这样呢,我们以后要使用哪个角色的能力,就直接告诉他用哪个角色做哪个任务就可以了。他保存完以后啊,正式的任务就开始了,这是我第一次给他布置任务,让他调用这个, 然后呢进行一个多 action 的 指挥, 这是我 dsp 的 消耗,总共消耗四块五毛七。

这段视频记录了我用 codex 安装 hermes agent 并调试网页 ui 的 全过程。先在 codex 里确认安装路径, hermes 运行在 wsl 二的 umber 环境。打开 dashboard 后,可以看到技能、绘画、模型、日制等模块已经接入。 接着从 windows 启动终端进入 hermes 的 命令行界面,终端启动成功后会显示当前模型绘画 id, 可用工具和一百多个技能 网页端同步展示绘画列表,方便回看历史任务和重新进入 tool。 技能页是核心能力库,所有工具按分类管理开关状态也能直接看到。 切到插件视力液时,界面提示脚本路径问题,这正是调 ui 时要检查的地方。模型液展示主模型 dixon v 四 pro 也保留了 quan 和 coder 模型的切换入口。 回到对话页, hermes 把终端能力包装成网页交互,右侧还能看到模型和工作流状态。我输入一句简单的中文问候,用来验证模型前端和消息流程是否联通。 最后打开模型切换面板,从安装配置到 ui 体验,整个闭环就跑通了。