粉丝7.0万获赞45.7万

大家好,我是麦东。上期我们解析了 hermes 自带的记忆系统,说实话还是比较基础的,这是两个 macdunk 文件,加起来不到四千字幅, 聊多了之前的内容他可能就会忘,画绘画的信息基本也全靠你自己重复。今天我们介绍一个专门解决这个问题的工具叫 hideside, 它是一个开源的 nint 的 记忆系统,装上之后 hermes 就 有了真正的长期记忆,能记住你画绘画的所有信息, 还能 sim 的。 这个开源硬件的记忆系统不是简单的对你的聊天记录做文本存储,它会做实体提取、关系追踪以及多策略的解锁。转完之后体验提升感还是非常明显的,你不需要每次开新绘画都重复一遍自己的偏好和项目背景了, 下面我们来进行实际操作。首先你需要确保你的机器上有 docker, windows 用户使用 docker desktop 就 可以了, macos 用户跟 linux 用户也是同理。 好,下面我们带大家一起来操作一下。镜像文件准备好了之后,我们在当前文件夹右击打开 power shell, 在 power shell 中输入如下命令,加载镜像。 在按下回车之前,大家一定要确认一下你当前系统里面的 dog 服务是否正常运行。 ok, 按下回车加载镜像, 镜像加载完成,下面我们需要运行一条命令,启动 handset。 在 运行这条命令之前,我们先来给大家讲解一下这条命令里面各个参数的含义。首先第一个是八八八八端口, 这个是浏览器 api 的 端口, hermes 就是 通过这个端口跟浏览器进行通信的。第二是九九九九端口,这个是管理界面的端口,启动之后我们使用浏览器打开本地的九九九九端口,就可以看到记忆管理界面, 然后是三个大模型相关的配置,这个模型是给 handset 的 内部做实体提取用的,它不是和 miss 的 对话模型,这 handset 自己拿来处理记忆的。这里我用的是 deepsea 原声支持,并且 deepsea v 四 flash 的 价格也比较低, 你也可以换成其他支持结构化输出的模型,一般来说只要接入 open ai 格式的都是可以的,大家根据自己的实际情况去选择就可以了。再往后的两个参数则是用来配置 handset 的 向量模型的。 handset 通过 doper 启动的时候,默认的向量模型是英文的,它对于中文的向量化以及解锁的效果会比较差,所以我这边挑了一个比较清亮的适配中文的向量模型。 并且呢,由于国内直接日下下载下来模型也会比较慢,因此我们在这边还给它加上了一个镜像源,这样首次启动的时候模型下载就会走国内镜像了,会快很多。好,下面我们复制该命令,打开 power star 粘贴命令, 按下回车执行即可。执行完成之后,我们打开 docker, 点击 containers, 在 这边就可以看到我们启动的 handset 容器了,点击容器名称就可以看到当前的启动位置了。 第一次启动的时候会去下载向量模型,所以这一步会花费一点时间,大家耐心等待即可。 当我们看到预制中出现 handset is running 的 时候,就意味着服务已经启动完成了。后面我们对于 handset 容器的启停就可以在 docker 里面进行了, 在这个地方可以对容器进行停止,停止之后也可以重新对容器进行开启,开启之后想要观测容器是否正常启动,同样也只需要点击一下就可以看到当前的预制。除此之外,我们还可以通过命令行的方式对 docker 容器进行管理, 常用的管理命令就这几个,停止是 docker stop, 启动是 docker start, 开瑞智是 docker logs, 大家可以根据自己的喜好选择合适的方式。 on set 跑起来之后,下面我们开始进行 hermes 的 配置,我们先开一个窗口,输入 wsl, 进入此系统之后,我们输入 hermes memory setup, 开始进行记忆系统的配置。 摁下回车,在这边我们选择 handset, 摁下回车, handset 配置会给我们三个选项,第一个是用云端的 handset, 这个是需要收费的。第二个是使用 hermes 自带的 handset, 选择这个的时候, hermes 会自动去下载一个 handset, 并且把它启动起来。 不过我实测下来并不是特别方便,而且还有一些环境问题需要去解决,因此我这边还是推荐大家使用多款的方式,所以我们这边也是直接选择。第三个,按下回车,接下来输入 api 地址默认就是本地的八八八八端口,这边我们可以手工输入一下。 输入完成,按下回车,第二步会让我们填写一个 api key, 因为我们是本地部署的,所以不存在 api key 相关的配置,直接按回车 ok, 这样就已经配置好了,还是非常简单的。下面我们可以运行 harmis memory status, 看一下记忆系统的状态, 好了可以看到这边 provider 为 headset, 并且呢状态也是处于可用状态,这就说明我们已经成功对接了。下面我们来测试一下相应的效果。我们先打开一个 hermis 对 话, 先跟 hermes 随便说一些内容,让他存一些信息到 hackathon 里面去。我们就简单一些,告诉 hermes 一 些基本信息。我养了一只银渐层,叫糖糖,今年五岁,别人都叫我麦冬,每天早上我都要来一杯冰美式。摁下回车。 好,它确认记住了,现在我们关掉这个规划,重新开一个。再次输入 hermes, 下面我们让 hermes 根据它的记忆回忆一下我的猫叫什么名字,我每天早上要干什么。 可以看到他回答出了我的猫叫糖糖,并且我每天早上都要喝冰美式。这边还有两只猫,是我之前跟他对话的时候测试录入的,大家可以忽略。好,下面我们再来打开一下 hannenset 的 管理界面,看一下后台发生了什么。管理界面的地址大家应该还记得吧, 打开浏览器,输入本地的九九九端口即可。 ok, 我 们现在已经打开了 hannenset 的 后台了。 首先我们需要在这边切换一下基金银行,也就是我们的 hermes。 其实打开这个页面,大家就已经能够看到我刚刚跟 hermes 的 对话已经被它存进了 hano site 里面去了。我们可以在左侧先点击 documents, document 里面存储的是我们跟 hermes 每次的对话记录,我们可以点开任意一个查看一下。点击 content, 大家应该可以看到这边就是我跟 hermes 的 对话,而这就是 hermes 给我的相应回复。每次我们跟 hermes 聊完之后,它都会把我们相应的聊天记录同步过来, 我们再点击 trunks, 点击展开。在这边我们就可以看到一些结构化的事实, 比如这边用户养了一只银渐层,叫糖糖五岁,他并不是把我们的原文死记硬背了下来,而是真正的去理解了我们说的内容,并且把它存储了下来。下面我们再点击 antisp 来看一下。 这边是我们的实体关系图,可以看到这边会有一些实体的关联列录,比如银渐层就关联了用户,麦冬同样也关联了用户,冰美式同样也关联了用户, 这些关系链路就是 huntsite 做记忆召回的依据。随着你跟 hermes 的 聊天内容越来越多,这边的关系图谱也必然会越来越丰富,而且 huntsite 也没有任何的记忆数量限制,再搭配上 hermes 的 自动化机制, 他真的会成为一个越来越懂你的 ai 助手。好了,本期视频到这边就要结束了,这次我们采用 docker 的 方式去部署 handset, 相较于其他的部署方式来说,还是要省心很多的,你不需要再去操心一些环境信息了,而且基于 docker desktop 的 管理面板启停服务也比较方便。 本地化部署 handset 唯一的开销就是可能会用到少量的 api 调用费用。当然了,如果你本地资源足够的情况下,我们还可以在本地直接部署大模型, 让 handset 去连接本地的模型,这样就省去了这一笔头更的开销。大家平时都在用什么方式去管理 ai 的 记忆呢?欢迎在评论区聊聊,工具会变,但方法更重要。我是麦冬,下条继续。

在复盘总结时,这个词一定用到 high insight 来。注意听 in hindsight perhaps i might have been a bit more sensitive。 他 说事后来看呢,我当然可能稍微有一点敏感了看这个词啊, high insight 这个 h i n d 像不像 behind 去掉 b e 没错,它的意思是后面的加上 sight 表示看,往后面看,往过去看,那就是事后诸葛马后炮,前面常接 in in high insight blah blah blah 一个事没做事,后来看它损失巨大。你就可以说 in high insight i should have done it 哦。想跟我系统看电影学一万词,进来先感受一下三天。

最近爆火的爱马仕智能体 hermes agent, 它并非完全开箱即用,你需要学习一些进阶配置才能让它达到完美状态。 本视频会带你完成五大维度的配置,从身份、人格、感知能力、表达能力、到头肯成本管控和生态资源入口,我们直接开始。第一步,编辑,搜点 md 来定义人格。 你可以直接用 agency agents, 这个库里面有两百一十一个中文角色模板,还有四十六个针对中国市场开发的原创智能体。这些角色按工程、设计、金融等十八个部门分类,每个都是独立的 m b 文件, 你只需要在对话时告诉 christmas 要激活哪个角色,就能直接上手,后续还能根据需求随时优化。第二步,把内置的 m e m o i 换成 hindsight。 内置记忆有个硬伤,它只有在 ai 觉得重要时才会写,而且有两千两百字幅的上线,很难实现真正的长期记忆。 而 hindsight 会自动从每轮对话里提取实体事实关系和时间戳,构建成知识图谱。最关键的是,它会在每次调用模型前自动把相关的记忆注入到 system prompt 里,实现真正的跨绘画长期记忆。 具体操作很简单,首先运行官方的安装向导,输入 set up 命令并选择 hindsight, 它会自动帮你搞定依赖。接着去 hindsight 的 官网页面注册并生成一个 api key, 免费额度完全够用。 最后,通过 status 命令检查状态,只要看到 bank id 和 auto recall 这些状态显示正常,就说明 handset 已经激活成功了。 第三步,配置内容抓取工具。我们要实现对互联网信息的深度感知,对于单页抓取,推荐用 genome reader。 如果是大规模的批量抓取,用 cross 四 ai 这两个工具建议通过 skill 方式集成。而对于反爬绕过和隐身浏览器需求,可以直接通过 p p 安装 scrambling 和 camel fox, 这两个是官方原生支持的技能。第四步,配置搜索与文档处理工具。 安装完这些, hermes 的 搜索能力会直接升级。我们把 tiffany 作为主力,他每月提供一千次免费的 ai 专用搜索,再用 dark dark go 做,零成本都抵。同时配合 panda 和 mark, hermes 的 文档处理能力也会起飞,支持任意格式互转,尤其是 pdf 转 markdown, 精度非常高。 第五步,配置表达能力工具链。我们要让 hermes 从只能读文字变成能说能话。语音方面,集成 whisper, 实现九十九多种语言的识别,配合 h t t s 搞定免费的语音合成。视觉方面,通过 files ai 和 l l u x skill, 直接给 hermes 加上高质量的出图能力。 第六步的第一项是实现 token 的 精细管控。首先是 talk scale, 这是一个专门为 ai 助手设计的监控工具,你可以直接用 npx 命令快速启动。通过它的交互界面,你可以实时看到局域的 token 消耗,也可以专门过滤出 hermes 的 数据, 甚至能查看过去一周的消耗趋势,或者把数据导出成 json 控脚本使用。如果你需要更专业的成本分析,就用 home studio, 它比官方的 dashboard 强大得多。通过 git clone 并运行安装脚本,你就能在浏览器里打开一个实时监控面板, 它能把多肯消耗细化到每一个模型、每一个组件,甚至是每一次工具调用。它提供了十四个不同的监控维度,能让你彻底看清钱都花在哪了。 接下来是真正的干货, r t k。 这是用 r s。 写的工具,专门用来解决 ai 调用终端命令时 token 爆炸的问题。通过全局集成命令,它会自动重写所有的设备调用。 比如你让 ai 看目录或者看 get 状态, r t k 会自动精简掉那些没用的信息,直接把 token 消耗压掉百分之六十到百分之九十。对于 coco test 的 这种输出极长的命令,它甚至能帮你省掉百分之九十的 token。 最后,如果你想让你的 agent 具备自我净化能力,可以配置这个 self evolution 工具。它利用了 dsp 和遗传算法,能自动去优化你的 skill system prompt 以及工具描述。 你只需要克隆仓库并配置好 hermes 的 原马路景,它就能通过遗传算法自动寻找最优的提示词和行为模式,让 agent 越用越聪明。 按照这个顺序配置完你的 hermes 就 真正满配了。如果你还需要更多资源,可以去查看 awesome hermes agent 汇总,或者通过 hermes ecosystem 查看那八十多个工具的格式化地图。配置完成,现在就开始享受满配版 hermes 的 强大能力吧!

哎,我跟你说啊,你手里的那个标准版 hermes 和装满各种神器的 hermes, 根本就是两个物种,真的一个在地上爬,一个在天上飞。所以今天咱们就来个大揭秘, 看看怎么通过五步,把你的 ai 智能体直接报改成究极完全体。 你看看这个对比,简直了!左边这个裸装版,说白了就是个小玩具,记性差还不能上网,能干的活特别有限。但右边这个满配班呢, 那可就厉害了,不仅有长期记忆,还能随时上网,会说话会画画,最关键的是用起来还超级省 toc, 这差距根本就是降维打击啊! 所以你是不是也好奇,这中间到底差了点啥?能有这么大的区别?答案其实很简单,就在这五大升级模块里,第一,给他灵魂和记忆。第二,让他联网。第三,解放他的表达能力。第四,把成本和效率拿捏的死死的。 最后一步,带你进入他背后强大的生态系统。来,咱们就跟着这份暴改指南一步步来好了,废话不多说,我们直接开干!第一步,给他注入灵魂,再安上一个超级大脑。 怎么给他灵魂?很简单,想让你的 hermes 马上变成某个领域的专家吗?用这个叫 agency agents gh 的 宝藏库就对了,里面有两百多个写好的中文角色,甚至还有专门给抖音呐、微信这些平台定制的智能体, 都给你分好类了,什么市场部、技术部,每个角色都是一个现成的文件,拿来就能用,即插即用,你说方不方便? 好,现在他有身份了,接下来咱们得解决那个记性差的问题,给他装个完美的记忆系统。 你看啊,他自带的那个记忆系统,说实话,又小又笨,你得手动往里写东西,还写不了多少字。但是这个叫 high inside 的 工具,那可就完全不一样了, 他能自动帮你把对话里的关键信息给抽出来,自己建成一个知识网络,等下次聊天需要的时候,他就把最相关的记忆精准的塞回到提示里,这才叫真正的过目不忘。 好,第一步搞定。接下来第二步,咱们要给他装上五官,让他能看见,能读懂整个互联网。 想让他看见,就得用这些网页抓取工具。你看 gina reader, 能快速看懂一个网页, curl4ai 呢,能做深度挖掘,把整个网站都给扒下来。 要是遇到那种不让看的网站怎么办呢?没事儿,还有 scraping grid 和 camouflfox, 就 像给他穿上了隐身衣,轻松绕过反爬虫。 有了这些,网上就没什么秘密是他看不见的了。当然,光有眼睛还不够,还得有个聪明的大脑来处理信息。所以你看,我们给他配上 tivoli, 这是专门给 ai 用的 soso 引擎,非常强大, duckgoon 可以 当个免费的备用。还不止这些,有了 panda 和 marker, 它连各种奇奇怪怪的文档都能读,就算是复杂的 pdf 也能给你整得明明白白。这么一套下来,它的信息处理能力直接就拉满了。 ok, 现在它能看能懂了,那么第三步就该轮到说和话了,我们要彻底解放它的表达能力, 装备上这些工具,你的呵 max 就 算是真的活过来了。用 whisper, 它能听懂快一百种语言,你说啥它都明白,用 h t t s 呢,它就能开口说话,而且还是免费的。那画画怎么办?简单, file ai 和 flx skill 就是 它的画笔,能画出质量超高的图片。你想想,能听能说,还能画一个全能型的 ai 助手,这不就诞生了吗? 好功能是越来越强了,但咱们的钱包也得顾着点,对吧?所以,这第四步就是高阶玩家的玩法了,把成本和效率控制到极致。 你先看这个数字惊不惊喜?用上这个叫 r t k, 全称 rust token killer 的 工具,跑那些端端命令的 token, 消耗直接给你砍掉百分之九十。这是什么概念?就是你的运行成本直接打一折,你说香不香? 那怎么知道钱具体花在哪儿了呢?很简单,如果你想快速看个大概,就用 talk scale, 它能在命令行里实时告诉你总共花了多少 toc。 如果你想看更详细的账单,那就用 hems 哈读 e。 它有个网页界面,能把每个零件花了多少钱都给你列得清清楚楚。一个看总览,一个看明细,总有一个能帮到你。 不过要说最酷的,还得是这个,它能自己净化。没错,你没听错, 背后用的是一种叫遗传算法的技术,说白了就是让赫姆斯自己去试,错了就改,对了就保留,慢慢的,它就能自动找到最好的工作方法和提示词。也就是说,它会在使用中自己变得越来越聪明,越来越强。 好了,到这儿你的智能体已经非常强大了,但别急,还有最后一步,我们要为你打开一扇大门,带你进入一个更广阔的世界。赫摩斯生态, 你可以从这两个地方开始探索。第一个叫 awesome hermes agent, 这基本上是一个一站式的资源库,你想要的各种工具资料里面几乎全都有。 第二个叫 hermes ecosystem, 它更像是一张地图,用可识画的方式给你展示了八十多种相关的工具。记住,给你的 agent, 它升级这条路是没有终点的。 好了,经过这五步爆改,一个真正强大的超级智能体现在就在你手上了。那么最后的问题留给你,你打算让它为你做点什么呢?


同学们,你们身边有没有这样的大聪明?就是发生了什么不寻常的事件以后,大家都在震惊当中的时候,他会跳出来说 icod, iccome, tom maov。 我早就料到这事会发生。你嘴上说 ready, 其实心里的歪词是切鬼才信呢。 这种事后聪明的现象,在心理学里面有一个专用名词,叫做 hit 八 s hick。 八 s hi 呢,就是后面大家知道 behand 这个词就是在什么东西的后面,而且这个动物的后腿啊,叫做 hanglax。 而八 s 呢,就是偏见的意思。对,在八 s 在中文里有一个非常精妙的翻译,叫做后见之明。偏误,或者叫做后视偏差,其实就是事后诸葛。就好比这两天有一位钢琴家翻车了啊,大家都知道。这事我就不赘述了。在这个群众们的首轮震惊之余,就有很多人跳出来说这事。不奇怪, 我给你们分析分析为什么这是偶然中的必然。嘿,我就想送给他四个字后见之明。所以下次你再听见有人说 imux 或者艾斯奥达尔 come fmmlv, 你可以回怼他 happy tis to me tony hizh s 托尼托尼托尼托尼是什么东西?这也不是二零二零年啊,而是这个西方国家,他们在验光的时候,对于这个 perfiv 人, 他们的定义就是托尼托尼二十,斜杠二十。我知道在中国当时我们小时候体检的时候都是视力一点二是最好的吧,那托尼托尼就相当于两只眼睛都是一点二的视力。意思就是你往后看,你当然知道了事后诸葛亮啊, hangy 这次啊,还可以这么用,就是因 hangy 回头看事后看来给你举个例子。 vinhishanda 我是 macdak nhiz i i readys 事后看来,现在看来,我当初真不应该跟他分手,扎心了。好,说到这里,是时候反转了。因为 happy 这个东西啊,是一个心理学当中的现象, 每个人都不能幸免。大家或多或少都会有一些后视偏差。而且这是一个 rnkaxs 八 s 无意当中产生的一种偏差。 我们人类啊,通常会在事后对我们的记忆进行歪曲的修改,为的是保持我们对事情判断正确这件事的信念。 咱们这个白眼啊,还是要悠着点。翻。今天讲到索老师的本行了,所以有一点激动啊。因为有一些朋友知道,索老师其实是学心理专业的。 咱们人在思考问题和认识事物的时候啊,经常会出现偏差,就是这个八 s。 在心理学上有很多的塞口拉车八 s。 比如说有一个我非常喜欢的,叫做 nbayld 八 s。 一、 易得性偏差或者可得性偏差。这个现象咱们今天先不讲啊,我先问大家一个问题,就是你觉得啊,每年死鱼鲨鱼袭击十二个太死的人数,相较于死鱼从天空掉落的飞机零件的人数,哪一个更多? 如果你的答案是前者,也就是鲨鱼袭击,那你就是中了 vlbay 八 s 的标了。如果你有兴趣啊,可以自己去查易得性偏差。希望希望大家今天不止学到了英语啊,也对我们的认知有了更多一点的了解。周末快乐!我要去看上汽了。