这是瞎搞啊,这个装了一个 cloud code, 然后给他配的是国内的 kimi 的 大模型,然后用的这个过程中呢,其实 体验不是太好,就是感觉好像虽然没用过真正的 cloud code 加 cloud 的 大模型,不知道是什么感受,但是给我的感觉这玩意跟爱马仕跟小龙虾差不多,尤其是当你看到这句话的时候, 修复完成,这次真的找到根音了。就当你看到这句话的时候,我就感觉心里没底了,这是国内的大模型惯用的,这叫话术,太恐怖了。我现在已经 算了,我再给他次机会让我再去试一下,如果还是不行的话,就直接给他上 cloud。
粉丝1484获赞4743

这是瞎搞啊,我真的太震撼了,太震撼了,无以复加,这种心情真的是。呃,具体是什么情况,大家可以翻到上一条视频看一下啊,然后我现在呢,就给大家说一下我为什么震惊啊?就是我给他 我现在用的是 cloudco 的 啊,然后搭载的是 k 米 k 二点六的大模型,然后我给他提了一个理发店会员系统的一个需求,我说你帮我写一个应用 啊,然后从这里开始,呃,我确认了他给我发的一些问题,我确认了以后,然后他就开始做,嗯,大概写了这么多,从这里开始算是代码吧,对吧?写这么多绿色部分就是他最后输出的,对吧?这么多,还挺多啊还挺多,确实挺多的,然后用时 四十四分钟,我想着十几分钟,二十分钟就做好了,没想到用了四十四分钟,没关系啊,可以等,这已经已经很颠覆了啊,这已经很颠覆了。来,我让你们再看一下他做出来的东西是什么? 这是他做好了啊,密码不用输,直接默认就在上面好了。来吧,看一下这个界面,来,横过来大家看一下啊,看一下这个界面 好看吗?有没有 a i 感?然后来我们看一下它的功能, 然后这里是仪表盘,仪表盘其实没什么功能,它就是展示你当前的一些情况嘛。今日营收,因为这里是一个系统,还没有用嘛。然后收银台,来,点开收银台,你可以输入会员手机号,然后搜索,然后就是各种操作,对吧? 然后这里有项目,对吧?这个人做了什么项目,完了你给他添加进去,最终结算,结算,对吧?啪,点结算就行了,然后会员管理 啊,在这个都是虚拟的,这是 ai 给你演示的虚拟的,对吧?这里背后还有充值,有编辑,有充值,我点一下,编辑看出来是什么 啊?就是会员的资料嘛,编辑会员资料,然后他还给你分了等级,你看到没有?钻石卡,黑卡,金卡,对吧?还给你分了等级啊?到店次数对吧?然后积分是多少?余额是多少?很详细啊。然后这个是你的 店,店里的一些项目都有哪些项目你可以自己添加啊。这里有添加,看到没有?太震惊了,我真的是太一次都没有修改过啊,这个直接输出就是这样子的,然后我们再看一下他这个财务报表,对吧?你,你后台有什么报表,有什么情况,然后还可以导出,对吧? 然后员工管理,你有多少员工啊?是谁这样?王店长,李总监,哼,刘,刘首席,张总监,陈首席,这也可以添加员工,点一下看,你可以编辑你的员工资料 啊。我觉得我今天,我明天可以拿着这个东西去找理发店的老板,我说你给我一百块钱就行了,我把这个东西交给你,让你用。 太震惊了, ai 怎么可以这么强大?程序员,我不知道看到这个视频心里会有作何感想,我是一个代码都不会,一个代码都看不懂的人只认得二十六个英文字母, 做出来了,一次都没有改过啊,直接直接出来,天呐。

这是我使用小米 miimo pro 模型编辑的 hermes agent 控制面板程序。作为近期热度较高、被称为新一代龙虾机器人的 ai agent 工具, hermes 官方安装默认依赖 wsl 虚拟机环境,对 windows 用户来说不太友好,因此我改用了 uv 虚拟环境的方式进行安装,大幅降低了新手的使用门槛, 用户只需点击开始安装,即可自动完成依赖安装以及相关底层组建的配置。在此基础上,我还增加了一个可适化控制面板,支持用户自由配置任意第三方大语言模型,并将其设置为 hermes 的 主模型。同时,像搜索工具、浏览器自动化等功能所需的 api key 也都可以在面板中统一管理。 此外,还集成了与实时通讯软件的对接能力,方便后续扩展自动化场景。在开发过程中,我是通过 cursor 手动接入小米 mini 模型来完成程序编辑的。 cursor pro 版本支持自定义 api key 和 base url, 因此可以灵活接入各类第三方大语言模型。目前给我的整体编程体验还不错,任务一次性完成度较高。虽然存在一些细节上的小问题,但核心功能基本可用,在多轮调试和修正过程中也没有出现明显偏差。 后续我会继续进行更多编程测试,以进一步验证其性能与稳定性。此次测试我使用的是小米 coding plan 的 lightroom 门套餐,官网价格为三十九元每月。

操作过一段时间之后,你会发现他比刚装好内嵌的速度快出一半,因为他每干完一件复杂的活,都会给自己写一份新技能,留着怎么做到的。 你让他干一件没干过的活,比如完整的项目安全审计,他会一步步摸索着干完,然后回头问你一句,这是我刚学会了要不要存下来当一项技能,你点确认,他自动把这次的经验写成一份 excel 文档,下次再做同类任务,原本六分钟的活,五分钟就能收工, 这期就把这事完整跑给你看,丢一个安全审计任务给哈密斯,看他第一次怎么从零啃下来,怎么主动提存技能,第二次再跑的时候,工具调用怎么变少,时间怎么压下去。更狠的是,技能不光从零写,哈密斯内部还有一个叫 gpa 的 净化引擎,每跑一次活就回头改一刀,旧技能也越用越顺。 所以这一期看完,你就明白用过 hermes 的 人为什么越用越顺手,你不是在用一个工具,是在养一个会自己长本事的徒弟。关于他的这个 skill 自主进化,这个其实是整个 hermes 啊最精彩的啊一部分,我们来看一下啊,他是如何去做的。 首先哈我们啊这里面啊,有一段是带大家去回顾到底什么是大模型的这个 skills 啊,当然大模型的这个 skills 的 本质呢,实际上就是一个提示增强这样的这个技术啊,他呢,其实也属于 这个 harness engineering 里面的一个所谓渐进式,譬如的啊,这样的一个这个原则下的一个,你可以把它理解成啊,是符合这条原则的一个这个技术的一个产物, 那么所谓这个 skills 啊,它那些最简单的这个情况下啊,可能就是一个 markdown 这个文档,对不对啊?教你呃,在什么情况下应该怎么去做这样的这个事情啊?可能就是一段提示,那么这个提示呢,会在当前这个 agent 正好去做这个事情的时候呢?哎,给他加载进来啊,差不多就这样的一个这个过程啊,这个呢是所谓的这个 skill, 当然这个所谓的这个 skill 啊,它呢?其实,呃,总的来说啊,现在的这个 agent 的 这个 skill, 其实这个技术系统会比较复杂啊,这个严格来说我们这个 skill 呢,实际上应该算是整个啊,有通用智能体的这个数字资产包啊,对不对?除了有 mac 文档之外,它等可能还会有这个 scripts 啊,还会有这个 references 啊,等等等等一些拓展的一些这个设置啊,这呢我们就,呃不展开讲啊,因为今天我们不是核心来讲这个 skill 啊,但总之呢,大家需要知道的是 这个 skill 哈,它的本质呢,实际上是啊,会严格的去按照啊这个 function calling 这样的一个这个流程,然后呢实时的啊,来去加载到某一些 agent 在 执行具体任务的这个时候的上下文里边儿去啊,就比如说假设哈,假设啊,我现在需要查询天气,那我正好有一个 skill 就是教当前 agent 如何查询天气的啊,那这个时候呢,当用户问到要查询天气的话,诶,那现在大模型哈,他就会去解锁一下啊,看看我现在总共有多少个这个 skill 啊,然后呢会去看每一个 skill 的 这个 description, 然后找到了,诶,这个这个 skill 啊,能够帮我查询天气啊,那么他就会读取你当前这个 skill 的 这个 markdown 这个文档, 然后这个 bug 文档就专门教你这个 agent 啊,怎么查询天气的,那这个过程当中,如果啊会涉及到一些脚本的运行啊,那他就跟你说,哎,你看我们这个 skill 文件夹里面有专门查询天气这个脚本, 你想查什么天气?哎,你把这个名,你把地名带到这个这个脚本里面来进行运行一下就能够查到,那这个时候呢,这个脚本就当前这个 skill 里面的一个 description 啊, sorry, 一个 script 啊,这个文件夹里面的一个脚本,你可以这么来进行理解。 而如果我们说现在啊,这个 skill 非常非常长啊,我一个 skill 包含了十几种不同类型的这样的这个情况啊,都可以用于给你更加细节的这样的指导,那这个时候呢,你可能就需要有一个 references 的 这个文件夹,里面保存着各个不同类型的你的 skill 的 一些 子规则都保存在这里边儿,哎,那这个时候呢,我们说你原始的这个 skill 的 markdown 这个文档相当于是一个总览,对不对啊?相当于是一个这个字典啊,然后呢大魔镜就会知道啊,原来 咱们要实现这个功能这么的这个复杂啊,然后呢就去看看,哎,我现在呢对应需要查哪一个条目,然后呢再到 references 里面去读对应的啊,他那样的一个这个文档,这个呢,就是能看出来啊,他是个渐进式的,譬如哈,对不对?哈这样的一个过程, 但这段啊,大家理解也可以,不理解问题也不大啊,总之呢,其实就是一个关于 skill 的 啊,一个入门的一个这个回复, 那么这个 skill 哈,其实对于现在的啊这个 agent 来说,它当然是一个非常重要的一项这个技能啊,或者说是一项非常非常核心的一个上下文增强的一个这个技术啊,因为它呢,实际上就是能够哎帮当前的 agent 在 很多场景下给它做得更好啊,有了指导跟没有指导啊,当然是不一样的啊,对不对? 好,那这里面我们就举一个很明显的一个,呃,就举一个这个小例子啊,大家去看一下 hermes 啊,它的这个 skill 这个体系,不仅仅是像 open code 呀,像 cloud code 呀,它的这个 skill 能够自己来进行加载,同时呢,它可以自己生成自己进化,什么意思啊?举个例子,比如说,哎,我们现在呢,让它做一个事情哈,对不对? 呃,我们下面呃会啊,让他去呃做一个这个,呃,做一个这个事情啊,这里面呢,我们让啊,他呢对当前这样的项目呢,做一次完整的安全审计, 那么这里啊,提出了一二三四五六七八九啊,提出了九项这样的一个要求,跟他说,哎,你必须得啊,这么这么这么去做啊,对不对啊?这个是对我们当前的 hermes 提出的这样的一个基本要求。 那么现在哈,对于 hermes 来说呢,它呢在一个原生的这个状态下,它肯定是没有一个专门用于去做什么项目的安全审计方面的这个 skill 啊,对不对?但是呢,它接到了用户的需求,它肯定就会按部就班的去做, 这里面我们提前做了一个这个统计哈,就看了一下它现在内置呢,总共呢是这个二十五个目录,也就总共呢是呃,有这个二十五个这个 skill 啊,这个呃 啊 sorry 啊,总共是七十七个,不好意思,上面写错了啊,总共是七十七个这个 skill 啊,但是你这里总共几个?不一定啊,因为我们这边的哈姆斯其实运行了很长时间,这里面你可以先运行一个统计哈,看一看你当前的这个哈姆斯的这个 skill 总共有多少啊?然后一会呢,你运行完了之后,你发现你这个 skill 就 会变多哈是什么样的这个情况? 好的,不管怎么样,我们现在呢没有啊,这个对应的这个死 q, 然后呢让他进行运行啊,这个时候他运行可费劲了啊,对不对?他呢就会一个一步一步一步哎,来进行运行,想想办法啊,我们这个怎么怎么来进行运行啊,因为这是个非常复杂的一个需求嘛,所以你会发现他运行的这个流程期非常非常长,对不对?一开始啊使用这个 terminal 啊,然后输入 find 的 这个命令啊,运行了一下啊,怎么得的什么什么? 然后又使用这个 terminal 啊这样的一个工具,然后呢啊使用着 graph 啊这样的命令啊,来进行一个匹配啊,然后又使用 terminal 命令啊,这个是使用 graph 然后呢使用的 read file 这样的工具, 然后呢啊来去怎么怎么样怎么怎么样啊,它呢?总之呢是有很多很多个步骤,这里面它总共哈差不多是运行了将近六分钟这样的个时间啊,这里你可以看下你自己的这个项目运行多长时间,但是我们是让它围绕当前的这个项目进行 一个安全审计方面的项目统计哈,这是个比较复杂这样的工作,你可以自己来看看啊,你大概运行了多长时间啊?总之呢,我们这边这个 deepsea 呢,是运行了六分钟啊,然后呢啊调用了很多各式各样的工具啊,大家可以进去看一下。 那么最后的运行完了之后呢?哎,他给了我们一个完整的一个安全总安全审计的啊,一个这个内容啊,包括安全优势啊,包括需要改进啊,包括这个什么修复建议啊,反正就是按照我们刚才的这一套的这个内容啊,来进行的这个提示。那么这上面的这些东西呢,其实 都不是很重要啊,是他最后给你返回这样这个结果最好,我们现在运行六分钟,然后呢下面啊,他会有一个非常精彩的一段话啊,叫做 skill, 什么什么什么什么 created, 哎,你会发现啊,当你在运行的时候,他是他他他在创建之前会给你有个提示哈,我会问你会要不要去创建这个 skill 啊,然后你要去回复确认,然后他就会给你返回一个叫 skill。 什么什么什么已经创建了 啊,你会发现原来他刚才执行这样的这个任务啊,他他呢其实是会自己去考虑哎,这个任务呢,现在我在现场,我现在是不是要创建对应的这个 skill, 哈哈,对不对?那么对应的这个 skill 呢?他呢,实际上是会啊,呃,这个,呃,邀请你啊,来进行这个开启的,换言之就是 他会给你一个这个提示啊,问你,哎,我们现在是不是要创建这样的这个 skill 啊?然后呢,如果你跟他回复,是啊,那么接下来呢,他就会自动的啊,去创建好这样的这个 skill, 那 么这个 skill 创建的过程是全自动的哈,当然你的这个 skill 的 名字可能跟我的 skill 名字不会不太一样,那么由于当前这个 humus agent 它的这个, 呃本身的代码主要是以 python 为主,所以呢,它这里显示的这样的这个运行啊,是怎么样的一个这个情况, ok, 好 啊,那么这个呢,实际上啊,当然,当然他背后其实有一个非常复杂的一个创建 skill 的 这个触发机制哈,比如说他现在这个工作任务比较复杂,运行了五次以上的工具调用,然后同时呢又遇到了报错, 然后同或者是有用户的这个纠正啊,或者是他发现了啊,这工作流呢,这个非常复杂呢,这个时候他他就会主动的提出,哎,我现在是不是要创建一个这个 skill 啊?你呢,可以选择创建也可以不创建啊,只不过我们这里给大家演示一下,接下来我们是可以进行创建的。 好,这些,现在如果你选择让它进行创建的话,那么紧接着接下来如果你再去看你当前的这个 skill 这个目录的话,那么你会发现,哎,刚才的这样的一个啊,我要 python 的 这个项目代码来进行安全审计的这个 skill 呢,就已经创建好了啊,这个呢是它全自动的来创建的一个这个 skill, 那 它全自动创建这个 skill 是 什么呢啊?大家如果懂这个 skill 的 这个编辑方法的话,你可以点进去啊,看一下当前的这个 skill 这样的内容。总之呢这个 skill 啊,它呢是把 刚才用户的这个需求或者他执行的这样的链路是来进行一个规范的一个这个梳理和保存。然后呢接下来这个就相当于是一个他自己提醒自己未来遇到这样的一个问题的一个规范的一个操作文档。 那么有了这个文档之后,那么紧接着我们说他在进行运行的时候,身上就会效率高很多啊,当然下面有一些关于当前这个 skill 编辑这样的原则呀,什么什么的啊,大家回头这个这个可以自己去看一下, 总之呢就是他有了 skill 之后,那么接下来我们说如果你再围绕类似这样的项目啊来进行执行的话,你不管啊是对当前的这个项目,还是对别的这个 python 项目来进行执行的话,那么你会发现啊,他呢其实就会自动的去加载当前这样的这个 skill 啊,然后呢非常高效,非常快速的去完成当前这样的这个任务, 那么第二次我们进运行的时候哈,呃,基本上他的这个运行的这个时间啊,大家可以去呃看一下啊,他的运行时间呢,就减少了很多啊,差不多就压缩到了这个三百秒以内哈, 这个速度呢,其实快了很多啊,然后呢之前啊他通过什么暴力扫描这个方式,现在也是没有了啊,然后呢现在他表现出了各式各样的啊,更好的这样的这个性能等等等等啊,这个呢,实际上是有这个 skill 和没有这个 skill 之间的一个,这个之间的这样的一个对比,你能够发现哈,有了这个 skill 之后呢,他之前踩的很多坑啊,这次呢其实就不会再踩了啊, 看这个表可能看的更加清楚一些。然后同时呢有了这个 skill 之后啊,那么那么他呢之前啊可能没有发现的一些工具啊,可以更好解决当前这样的问题,哎,他现在也会 对不对啊,调用这样的工具啊,来去解决当前这样的这个问题,然后最后啊,他呢不仅仅啊是完成了这个报告,他还直接呢上手来进行了啊,相关的安全代码,这样的这个修复的工作等等等等, 这个呢也就说明,哎,它呢相当于是这个有了啊,这个 skill 之后啊,对不对啊?它的性能呢是提升了很多啊,这个呢其实是我们最开始使用它的这个 skill 能够发现啊,我它呢是存在这样的这个情况的,那么有了 skill 作为这样的这个酶剂哈,能发现它当然就是会越用越聪明的,对不对啊?这个其实毫无疑问, 那么同时呢,我们会发现它除了啊会从零到一去创建这个 skill 之后啊之外,其实它呢也是会不断地去积累当前的一些这个经验啊,积累到这个 skill 里面来,也就说伴随着我们不断地进行运行,它呢会根据每次运行的这个反馈,还会返回来去修改你当前这个 skill 啊,然后从而啊让你当前这个 skill 呢,可以说啊是运行的越来越快,越来越好。这里面我们可以看到啊,它在运行了几次之后呢,是额外新增了一些这个新增了一些这个区块啊,因为它可能会发现,我们现在总是 这个围绕着当前的这 hernes engineering 来进行一个这个审查啊, sorry, 总是围绕当前这个 hernes agent 来进行一个这个审查,所以呢,它接下来啊会固定很多这样的模式,就是固定围绕当前这个项目来进行审查, 自己呢会找规律,哈哈,然后这里面对不对啊,他接下来效率还会越来越快啊,这个大家可以多去来进行一些这个试验啊,总之呢,其实伴随着我们不断不断不断来进行运行啊,他的这个实际运行的这个时间啊,甚至可以压缩到百分之五十以下啊,这个呢其实是一个非常好的一个特性哈,啊,这个呢也是呃,这个 hermes agent 啊,他在实际进行运行的过程当中啊,给所有开发者提供的一个非常便捷的一个功能。 当然既然谈到它自主进化的这样的这个能力啊,那么除了刚才的这个 skill 之外啊,其实哈,对于整个 hems a 智能来说,它呢是提出了一个叫做 e g p a 的 一个进化引擎啊,那么这个 e g p a 这个进化引擎指的是什么东西? 它的全称是啊,这个哈哈哈,大家可以自己看一下啊,总之它是一种将遗传算法和多目标优化应用于提示提示词进化的一个这个框架,它的原论文的这个名字呢,就叫做这个 e g p a, 所以 它呢也叫 e g p a 啊,是这样的一个情况, 那么这个啊,这个所谓的啊,什么这个遗传算法什么的这个多目标优化应用啊,这个大家可以不用去考虑啊,总啊不用去理解太多啊,总之呢你需要知道的是 它呢实际上啊是会学习总结当前任务的这样的这个模式,然后呢去生成数据,然后呢来进行反思,然后呢来进行啊多目标选择和平衡,然后最后呢来进行一个这个合并,然后最后呢去修改当前的这个 skill 啊,就是这么样的这个情况,这个 过程啊其实非常非常复杂,不仅仅是我们实际上进行使用的时候,它呢会自主来进行一个这个啊,自主来进行一个 skill 的 生成,然后同时它也会生成一些这个评估的一些这个数据啊,然后呢 可以啊使用真实的历史对话记录,他也有的时候你有必要你也可以引导他去是合成一些这个数据,然后呢来去呃这个净化当前这个 skill 啊,这个呢也是可以的,也是没有什么问题的。而他最所谓这个遗传算法啊,就指的是他每次呢是会去考虑啊增加某一些这个维度,或者修改 固定的某一些这个方向,然后去测试一下他能不能够有性能这样的一些这个方向,然后去测试一下他能不能够有性能这样的提升,而不会全部来进行重写啊,什么样的这个情况? 当然啊他也是这个会啊,这个要求人工的来进行这个合并的啊,这个呢我们在实际使用过程当中,你也会发现啊,他呢会要求人工的来进行合并啊,然后最后呢来去完成你当前的这个 skill 的 啊,这样的这个优化等等等等, 当然好。对于 hermes agent 来说,我们现在看到这个,呃,看到这个 g e p a 好 像还是一个非常非常简单的一个这个模式,我们只是通过让他去反复的执行一些工作,能够看得出来他的这个 skill 是 不断的发生变化,但是实际上啊,对于整个的这个 hermes agent 来说,他呢, 呃,其实整个的 e g p a 不 仅仅是啊可以用于啊这个 skill 的 优化,还可以用于它其他的整个 a 智能系统里面其他的一些提示词的一些这个优化,甚至内置的一些 skill 的 这个提示词的优化,甚至它这 e g p a 的 e g p a 呢,还可以用于引导,如果你使用开源大模型的话,它还可以围绕开源大模型来进行强化学习的后续面, 哈哈,所以它这个 h p a 这个系统实际上是一个非常复杂的一个这个系统哈,我们这里只是讲了一个这个大概啊,只是跟大家说啊,它呢,哎,有这么样的一个这个成长的这样的一个机制啊,仅此而已啊。当然这个也是因为户外课时间有限啊,可能我们没有办法啊,更多的展开啊其他的这个内容来进行一个这个说明。 当然我们说到这啊,关于 e g p a 的 这部分内容哈,实际上是整个的哈,呃,整个的这个,呃, hummer's agent 最为复杂的一部分的这个内容啊,大家如果感兴趣的话啊,也可以去看看它的这个源码啊,也可以再看看课间里面的一些文字的这样的这个内容,也可以多去进行一些这个尝试啊,相信呢,你会有不一样的这个理解。 那么在本期观课的这个最后哈,我们这还有一些这个内容,可能是刚才用户啊,刚才咱们的同学会非常关注的一些问题啊,比如说什么这个模型怎么切换呢?对不对? 还有啊,比如说像这个他还哪有哪一些啊,前沿的一些这个特性,像这样的一些这个内容啊,我们这里面有一些这个文字的这个补充内容啊,大家回头可以自己去 看一下啊,自己去了解一下啊,但总之啊,我们说这四个项目运行完毕啊,我们大家对于当前的啊, hummus agent, 以及啊对于你的这个 harness engineering 啊,它背后的这样的一套技术理论体系哎,相当于是有一个入门级的这样的个理解了啊,对不对? 好,那么到这,哎,我们的公开课的内容呢,差不多也就全部结束了,好,接下来啊,我们就打一波广告,哈哈哈,也欢迎大家啊,报名,有我和木鱼老师啊,还有志杰老师,我们共同开设的 大模型 a 政策啊,智能体开发实战课这样的一门付费课程。那么我们今天啊来讨论的啊,关于 harness engineering 啊,相关的这样的一些这个内容啊,以及 business agent 啊,也是像也是 harness engineering 这样的一套技术体系啊,它的一个落地的这样的框架,那么这个内容啊,实际上是节选资,我们的二零二五啊,大号模型 agent 正在开发十三克这样的一门付费课程, 那么这本课程啊,是由我们三位老师共同来主讲的一个一百个小时以上的完整体系大课啊,然后呢,这本课程从今年的这个三月份啊开始新增 open club 开始啊,到我们今年四月份啊,新增 harness engineering 啊,以及像 harness agent 相关内容的讲解介绍啊,那么这本课程呢,到呃我们今年啊的 最新的啊春季班是已经是开设了二十三期了哈,那么这门课程呢,是帮的,是能够帮大家零基础入门,然后直达目前顶尖大厂的中高级岗位能力要求的一门一百个小时以上的完整体系大课。 那么这门课程啊,其实是可以完全零基础啊,来进行的一个这个学习,并且这门课程呢,是一个硬核的啊,这个大模型开发的技术教学的啊,这样的课程,那么这门课程啊,是 这个对标目前的大模型开发工程师啊,大模型的这个应用开发工程师这样的岗位能力要求啊,这么可能,如果完整学完,肯定是啊,这个拿下五十万年薪的大模型开发岗位啊,的这样的一个这个 offer 肯定是不在话下, 这本书总共呢啊是六个技术模块啊,首先第一个模块呢是关于大模型技术入门啊,在这里面我们会详细来介绍关于目前顶尖的啊,这些大模型的 api 的 接入啊,本地大模型的这样的部署啊,然后呢,智能体 a 智能开发的这样的入门啊,还有锐角增强技术的系统开发入门等等等等啊,这个呢,是一个 入门的啊,这样的一个阶段,然后同时紧接着第二个阶段,我们会进一步来介绍关于热门的 a 智能开发框架的上手实战。那么主要啊,是会包括一些 d 代码呀,还有 n 八 n 啊,以及 这个顶尖的 rack 的 框架啊,拉马 index 啊,这样的一个框架以及啊,对不对啊?新兴的一些 agent 开发框架, 像 agent sdk 啊,还有 agent school, 还有 adk 等等,当然也包括啊,工业级的 agent 呃,框架啊,像 long chain 啊,还有 long graph 等等等等啊,那么这些呢,是都是能够帮助我们啊,从零到一呢来完成 agent 的 开发的啊,一些非常核心这样的工具, 当然有了工具还不够啊,我们还需要去讨论一些,还需要跟大家详细介绍跟讲解一些工业级的 agent 的 开发的一些进阶的一些这个技术,对不对?就比如说啊,这个智能体的工具管理呀,包括智能体的这个 agent skills 的 这开发的管理呀,以及啊,像这个 agent reg 一些进阶的一些这个技术啊,包括啊,如何来进行这个剪辑的一些这个优化,多模态的这个实战, graph re 制图和剪辑优化啊,还有这个什么视频信息剪啊,图文和牌 pdf 剪辑啊等等等等啊,这样的一些啊, rek 的 这个进阶优化这样的这个内容。 当然啊,上面大家可以看,可以看到哈,我们其实每个模块里面都有非常非常多的一些实操的一些这个小案例哈,当然这个实操案例其实并不属于我们后面要谈到这个大型案例啊,总之呢,其实我们所有的课程啊,每个模块都有非常丰富的啊,实操的这样的内容。 那么再往下啊,还会来讲解关于智能关于智能体的,对吧?啊,长短期的这个记忆管理啊,这个其实就会涉及到,比如说我们现在讲的啊,一些 这个智能体的啊,记忆的优化啊,安全防护措施啊等等等等啊,当然也会来讲解啊,关于智能体上下文的一些优化的这样的这个策略啊, harness engineering 相关的这个内容,以及多智能体啊,系统开发相关的这样的内容啊,当然在我们课程里面还会介绍啊,关于大模型高效微调和强化学习微调啊,相关的一些 能够定制化啊,你开源大模型的啊,能力的相关的这样的内容。那么同时紧接着第四个模块,我们就会进来探讨关于工业级的 a 证的部署上线啊相关的这个内容了 啊,那么你 a 证的开发完了之后,对不对啊,肯定还是要考虑怎么样呢,来进行部署上线。这里面我们会既来介绍啊,关于智能体项目部署上线的这个基础的理论啊,同时也会来讲解啊,关于智能体开发部署的上线的全部的这样的流程。一会来介绍啊,关于两大容器化交付工具的这样的流程。一会来介绍啊,关于两大容器化交付工具的之后啊,长期的 追踪和运维如何来进行处理啊,当然我们会来介绍关于智能体的这个性能评估和如何来进行优化。那么同时我们现在啊,我们还这这门课程里面还包含十大项啊,这个工业级智能体的开发项目实战啊,包括像长文档啊,编辑 agent, 文档审核 agent 啊,图文视频多模态 agent, 语音交互 agent, 然后 deep research agent 啊,数据分析 agent 啊,数据分析可级化 agent, 然后呢,垂玉的精确 graph, 高精度的啊,机制图谱的解锁增强系统, 然后啊,像多摩泰的这个 rek 本地致富问答,还有 nintendo 啊,像这个 ppt 的 这个 agent 生成等等等等啊,这一期的 agent 啊,是我们会有,总共呢会有十个啊,工业级的项目实战,那么除了这十个项目之外呢,我们还有四大项啊,百万用户级别的智能体项目开发啊,这个呢,相当于是商业化的这个智能体, 包括啊,像多模态的这个 rec 智库检测问答,包括啊,全新一代的啊,智能客服 agent 的 项目开发啊,以及呢,包括啊,这个通用智能体的这个开发,以及啊,还有这个数据分析和 ai 呃编程的 agent 开发项目等等等等啊,总共呢是有这四大项的, 这个商业的商业级的啊,这个呃智能体的开发项目啊,总共呢是这么十四项啊,大型的 agent 项目开发 ok, 那 么所有这个项目呢啊,实际上是会覆盖目前我们说比较主流的,也是比较热门的这样的一系列的 agent 开发的 agent 应用,这样的主流方向啊,包括啊,对吧啊,这个整个的这个八大类三十家场景的 ai 落地解决方案啊,咱们课程里面都会有对应的落地实操性质的这样的这个内容。 然后同时呢啊,对我们课程来说啊,我们在今年的这个啊,今年的春季我们还新增了很多啊,关于 openclaw, harness engineering 相关的这样的一个技术内容啊,当然同时我们也新增了一个大型的项目啊,就是从零到一呢,带大家去搭建啊这个 harness engineering 啊,对不对啊?从 openclaw 啊 开始来进行个搭建啊,我们会从里呢来教大家如何呢去,呃从零到一来完成这样的一些 agent 开发啊,因为本身呢,咱们这门课程就是在讲解啊,关于现在的 agent 开发的核心这样的一个技术,那么当然对于大家刚刚啊所看到的这样的一个 harness engineering 啊,这样的一些这个内容,我们肯定呢也是会啊,来进行一个 啊详细的呃讲解和这个开啊详细的这个开发和实战啊这样的一些这个内容的。 当然我们是除了啊大家刚刚我们所看到的这个大冒险 a 正正的开发实战课程之外呢,还有两门课程啊,是呃也是啊,现在正在进行这个招生啊,我们正在进行授课,正在进行连带更新两门课程,一门课程呢是 open club 智能应用实战课啊,那么这门课程呢,是由我来主讲的一门体系课程, 但这门课程啊,其实和我们刚才所看到这个硬核的这个技术的这个课程啊,会有非常本质的一个区别啊,在这门课程它主要是在讲解 open club 如何进行使用啊,是覆盖基本上所有的 一些应用场景下啊,如何使用这通用智能体啊,用的更好啊,然后呢来完成各式各样啊,不同类型的一些自动化的啊,工作流的这样的这个搭建去提升啊,目前我们实际去啊,这个工作过程当中,各式各样的不同场景下的工作效率啊,这个呢,是 open club 啊,这样的一门可用的这样的一个 课程啊,这门课程是由我来主讲,那么除此之外,我们还有门课程,是啊,沐雨老师在进行主讲的 web coding 啊,这个编程实战课,当然 web coding 啊,这门课程就不用说了,对不对啊,现在基本上是所有的咱们这一个 啊编程的这个同学啊,都需要掌握这样的像这个技能,然后刚刚啊,咱们档案上还有同学在问到说,哎,我们公司团队内部的这样的 web coding 流程是什么样的啊,等等等等,那基本上就是像这个情况, 然后啊,这么课程啊,会有沐雨老师来主讲啊,会大家好好来讲解啊,关于 web coding 呢,如何从零到一呢,来进行一个这个上手跟使用,以及各个不同不同场景下有哪一些啊, web coding 这样的工具啊,是非常的这个适用,以及呢,像 cloud code 啊,还有这 codex 啊,这样的一些顶尖的 web coding 这样的工具, 它的一些具体的这个使用和进阶技巧,然后也会从零到一呢,带大家去完成啊,很多的一些 web coding 的 啊,一些这个项目的实战的这个开发,从零到一呢,帮大家啊定定完整的啊, web coding 这样的技能体系 啊,那么现在呢,大家啊,不管是对哪门课程感兴趣啊,我们现在总共呢是有三门课程啊,分别是 open club, 智能体应用课啊,主要是讲 open club 这样的智能体开发实战课啊,这门课程是一个更加硬核的来讲解大模型底层的 这个 agent 如何来进行开发的啊?这样的一门课程,以及啊适用于现在所有程序员的啊,这个 web coding ai 编程实战课。

最近好多朋友问我这码是啥玩意,其实就是个能回微信,能写代码的智能帮手,安装特别简单。前提是你装了 python, 三点一以上,打开终端,一行命令搞定。装完跑下 hermes, 看到版本号就是成功了。 装它真不麻烦,只要电脑有 python 三十一一行命令,敲完就完事。再输个 hermes 命令,看见版本号出来就算成了。 重点来了,连 vx 跑 hermes gateway setup, 在 平台列表里选 vx, 然后终端会弹出一个二维码, 掏出手机打开 vx, 扫一扫,滴一声就绑上了。整个过程不到一分钟, 连上之后,你在微信给机器人发消息,他就直接干活了。查资料、写代码、看服务器,全在微信里搞定,不用切应用,不用开终端。 hermes 能做的事远不止聊天、 定时任务、挂技能、记忆学习,多平台转发,你让他每天早八点给你推 ai 日报,他自己就能跑。 部署过程中有啥问题,评论区留言, hermes 的 玩法后面我会慢慢出定时任务,接企业微信飞书配置,想看的扣一!我是 ai 小 白,日常关注我,带你用 ai 省时间不踩坑!

今天实操在 windows 上安装 hermes, 并接入飞出机器人。先说我为什么会从 open color 换到 hermes, open color 对 小白更友好,但我用下来发现主要有三个问题,第一是经常要重复提醒,很多任务它不会持续执行。 第二是网关不够稳定。我发的最多的一句话就是,你在吗?第三个就是 token 消耗比较快,长任务多人对话下来成本会明显上升。那 hermes 的 优势就在于它更像一个真正的 a 准系统,它可以自动地写入记忆,把任务过程沉淀成 n d 文档,稳定性更强,也不用频繁地重启网关, 那也更像一个长期运行的工作流系统。我印象最深的一次是某一天我的模型 token 用完了,但是 hermes 依旧可以稳定地给我推送定时提醒。 原因是 hermes 的 内部分了很多模块,像 schedule、 定时任务、 memo 与记忆 work flow。 工作流大模型只是其中的一层,所以你没有 token 的 时候,它一些固定的工作流啊,定时任务啊,飞速推送依旧可以运行。 当然, hermes 也会有门槛,它的本质更像开发者工具,默认运行在 linux 或是 mac os 环境。如果你是 windows, 就 需要先配置 wsl 和 open two。 接下来我会带大家实操怎么在 windows 系统使用 hermes, 主要是以下四个步骤,第一个是安装 wsl, 第二个是安装 open two, 第三个是安装 hermes, 第四个是配置飞速机器人。首先我们打开终端,输入 wsl install, 安装成功之后第二步是输入安装 open two 的 命令。下载成功之后,它会让你设置账户和密码, 账户名称记住要小写密码,输入之后他会不显示,我们要记住输入后的密码。第三步就是我们去复制 hermes 的 官网名下载 hermes, 下载完成之后,他会问你是不是要安装文件搜索器和语音功能。我输入 y, yes, 再输入刚刚设置的 open to 密码,这里可能要等久一点,等它安装完毕。 那安装完毕之后,他会问你是否安装拍成的编辑工具,就是这样,某一些拍成插件能够正常的编辑和运行。输入 y, 然后再次输入密码, 到这一步的安装时间会比较长,同时在这里我还卡住了,我就用了 ctrl 加 c 终端任务,这里终端的其实是浏览器自动化组建的下载,那我的后面主程序本身其实是下载好了,因为我有开心的一个窗口问他说我的后面下载的进度和我的 cpu 的 一些进度。 那我们重新打开新窗口,重新进入 home, 输入第一串命令,我们先进入虚拟环境,然后再输入第二串命令,进入 home 四的安装目录。第三串命令是启动 home 四专用的拍摄虚拟环境。 最后我们输入这串命令去设置相关配置,那这里输入 y, 下一步的话我们选择快速设置,选择大模型,我是 kimi, 那 这里就输入我的 api key。 要注意的是这里输入是不显示的,不要误以为说没有输入成功。接下来输入 url, 可以 直接复制他这里显示的网站。 这里对应的模型,我应该选择的是 kimi, 二点六,应该输入的是数字五,但是我输错了,大家按照自己的模型输入对应的数字就行,然后按照我的选择操作,来到消息配置,选择非输,记得这里要用空格选中,然后进入扫码配置,他会给你一个网站, 你打开这个网站,就会自动配置到飞书机器人的页面。我们新建一个飞书机器人应用, 找到刚刚创建的机器人,发一条消息,你就会发现 home 是 没有反应,那我们就再回到终端,在这里选择群主中被艾特成为响应,这里会有一个 homechat id, 我 们回到飞书开发者后台,复制这个 id, 下一步输入 y, 这里选择的是第一个。配置完之后,我们可以尝试输入 hermes, 会弹出我们的 logo, 然后发送消息,就可以正常回复了。最后回到飞出,开启机器人的相关权限,就可以正常使用 hermes, 到这一步就成功了。 那以下这些命令是重启电脑之后开启和美相关设置的命令以及部署的过程中,其实因为系统的不同,也会出现很多问题,那如果有出现问题,我们就直接问 ai 就 好了,一步一步操作,总会成功的。好啦,有任何问题可以在评论区讨论,点赞、收藏加关注,我们下期见!

很多人把 funx 当成一个聊天壳子,这就是第一层误解。你问一句,他答一句,看起来挺聪明,但这根本不是它最值钱的地方。 funx 真正狠的地方是,它能把 codex 这种写代码模型 变成一个真正在后台持续干活的员工。什么意思?比如你接手一个本地项目,要排查 bug、 补文档、改配置、跑测试。普通玩法是,你自己盯着一个窗口里问,一个窗口里看一个命令,一个命令确认表面上你用了 ai, 其实你还是那个最累的调度员, 和那斯不一样。第一步,你先把目标给清楚,比如修什么问题,改哪块逻辑,最后要验什么结果。第二步,他会先去读项目结构,再拆任务,再决定哪些步骤交给 codax, 哪些步骤自己查文件跑命令,做汇总。 第三步,危险动作和关键节点,再回到你这里,确认其他能自动推进的,就继续往前推。这样一来, ai 不 再只是陪你聊天,而是真的开始接活,甚至开始替你做项目协同。你不用一直守在终端前,不用每改一处就来回切窗口, 也不用反复追问他现在做到哪一步。对我来说,最明显的变化不是他写代码更快了,而是我终于不用一直盯着他干活,整个人的注意力都被解放出来了。如果你想看我这套 hans 加 kodaks 的 后台带管流程,评论区打后台,我下一条直接拆给你看。

嘿,如果你是个重度 ai 玩家,应该知道 hermes agent 吧?那个能在手机上帮你跑推理、写代码、处理任务的家伙,现在它真的长在手机里了。 今天早上, hermes 官方宣布移动端 test flight 正式上线。别急,我知道你在想什么,又是什么手机端?套壳?不?这次不太一样,先帮没跟上的同学快速补个课。 hermes agent 不是 一个普通的聊天机器人, 他是一个手机原声 agent。 你 可以理解成你给他一个任务,他能自己拆解、规划、调用工具,然后完成。比如你让他查一下这个邮件里的竞品公司,整理成表格,他能自己打开网页搜索、提取信息、排版,然后丢给你一个完整结果。之前他只能在 mac 上跑,你办公的时候还好, 但你一离开电脑凉了。现在 ios 移动端来了官方说法挺简洁的,一款用于在手机上运行 hermes 的 原声 ios 应用, 翻译成人话,连上你自己搭建的 y b y, 重新打开之前没聊完的绘画,流势传输回复,你不卡住,它在打字你也看得见,可以附加文件,也可以切换模型。关键是,你再也不用一趟趟跑回 mac 跟前了,沙发里、地铁上、咖啡馆,有手机就行。 想象一下,你在开会的时候突然记起要查一个数据,打开 hermes, 让他在后台跑,开完会,结果已经好了。这种同步感才是 agent 真正的价值。目前只有 ios 申请流程就两步,第一步,打开官方申请网站。第二步,点击 join the beta list, 填完信息提交,他会通过 test flight 发邀请,需要自托管的 web ui。 所以, 如果你还没有搭过 hermes 的 服务端,这不是一个打开即用的东西,但如果你已经是 hermes 用户,不用犹豫,这就是你一直在等的。说实话, hermes 不是 今年 第一个做移动 agent 的 团队,也不会是最后一个,但他释放了一个信号, ai agent 正在从桌面工具走向随身助手。二零二三年,我们在聊对话模型。二零二四年,我们在聊 agent 框架,而二零二六年 是 agent 真正装进口袋的一年。过去几个月有太多例子了。克拉的移动端, chat gpt 语音模式兼备耐深度集成安卓,但真正把 agent 坐进手机,能听懂指令自己干活的产品,还远没到爆发期。 terme 移动端的推出,是在这个方向上又往前走了一小步。如果你还没接触过 agent, 现在就是入坑的最好时间。申请链接,我放简介了,申请完去搭个 v i, 然后等 test flight 邀请就行。我是谁不重要,重要的是你的 mac 终于可以放假了,下期见。

看一下在这个 hermes 当中啊,这个前文三点五,这个小模九 b 的 模型啊,它这个我们第第三个测试,让它编写一个俄罗斯方块的小游戏,并把它封装成一个啊, mac 系统可以直接使用的 app 文件放在桌面上, 他就开始工作啊,确实可以看到他写了很多很多东西,大概写了有十五分钟啊,然后这个就写完了,这里他提示游戏已经创建完成,代码放到了这里啊,但是呢,他没有给我封装成 app 放在桌面上,他说他遇到了问题,让我这个手动去操作, 然后我说我运行了,他告诉我这个命令手动操作,但是创建不了文件啊,然后他就说我遇到了什么转移的问题,然后他自己又去重新打包了一遍啊,打包了一遍之后呢,确实他在我桌面上放了一个呃文件,但是呢打不开,运行不了,我告诉他,我说这文件打不开 啊,他自己就把这文件又给删除了,删除之后啊,这呢删除了旧的,然后又准备创建新的,创建了三十分钟也没有任何的这个 结果,我就把他停掉了,总共加起来大概他花费了一个小时左右,所以我把他停掉了,这个任务啊宣告失败,下面我们再来看看他能不能给我们整理本地文件,这个任务他能不能够成功的挑战成功。

兄弟们,哈莫斯这波升级呢,简直是神级更新,直接宣告了 ai 正式从好用的工具进化成了夺权的基础设施。很多人呢,根本看不懂这背后的信号呢,有多么恐怖。以前我们吹捧的 ai a g 呢,是个啥?自动写两行代码, 或者呢,像高级按键精灵一样帮你点点网页,充其量呢,也就是个实习生。但现在呢,对 windows 系统呢,更好的支持了,彻底砸烂了系统的壁垒, 浏览器自动化呢,直接提升了整整一百八十倍,这是什么概念?这抓取操作呢,比人手快了几十个身位,更绝的是他接入了一百万上下文的 rock, 连 tim 和推特都无缝对接进去。看懂了吗?这已经不是一个工具了, 这是一个有着超强记忆,甚至能直接操控所有软件的完美数字员工。而且他现在已经原生支持外部 u i 了,不用再去单独的去配置第三方了, 非常哇塞,看懂了吗?这已经不是一个工具了,它是一个有个超强记忆,能直接操控所有软件的完美数字员工。很多人呢,严重低估了运行层的价值。你以为未来的 ai 天下拼的是谁的模型参数大吗? 大错特错,未来真正垄断市场的是谁能掌握 ai 的 工具链?谁能支配多个 ai 的 协助工作流。 hermes 现在做的就是成为 ai 时代的刀客, 加上 vsco 的, 再加上 zippo 的 终极结合体。当所有人都在沉迷于 ai 聊天的时候呢,真正的高手已经悄悄地不是 ai 时代的水电煤了。 如果你还没有升级的,或者说你还没用上这么好的工具的,说一下啊,我总结了一套 hermes agen 的 从零到一的详细操作指南,说一下,直接拿去。

谁敢信州负责人还在手动装插件,我反手一个 hermes agent 开启自我进化,结果这 ai 现在比他更懂业务逻辑。咱们程序员圈子里有个老梗,说最好的代码是不用写的代码,最省心的员工是那种会自己找活干的数字打工人。 今天咱就聊聊这个叫 hermes agent 的 家伙,你把它装进电脑,就等于给你的系统请了个拥有读心术的私人管家。 你以前用 ai 得像哄孩子一样为他提示词,还要盯着他别胡言乱语。现在有了这个项目,他直接跳过你的废话,自己去 github 找工具,自己调试环境,甚至连报错信息他都能自己看懂并修复。 说白了,这玩意就像是那种从不午休不喝咖啡,更不会找你报销加班费的顶级架构师。你以为他只是个能自动运行的脚本,其实他骨子里是个有社交牛逼症的净化框。 我刚把他部署到服务器上时,那场面简直离谱。他在后台疯狂调用各种接口,就像个刚进自助餐厅的饿汉,看到什么吃什么,把原本需要我手动配置三小时的依赖环境,五分钟就给整的明明白白。当然了,这货也有脾气, 有时候他觉得你的代码写的太烂,甚至会直接给你抛出一个异常,那感觉就像是你家猫主子看着你乱丢的袜子一脸嫌弃。 这就是典型的技术圈反转,你本来想用它来偷懒,结果最后为了伺候好这个大爷,你反而被迫去学习了他那套逻辑。别以为这只是个只会跑程序的机器, 他在处理那些繁琐的重复性工作时,那种精准度,简直让人怀疑他是不是在背后偷偷学了什么读心术。以前我们做异地组网, 调试网络参数,能把人折腾到怀疑人生。现在交给他,他甚至会贴心的帮你避开那些因为运营商线路抖动导致的断连坑。说到底,我们折腾这些开源工具,图的不就是那点能让自己从繁琐日常理解脱出来的快感吗? 当你看着屏幕上那一串串自动跳动的日志,看着那些本来需要你熬夜修补的,被被他瞬间抹平,那种炉内高潮的感觉,真的比喝了一桶冰可乐还爽。所以啊,别再纠结什么技术门槛了,这东西就是给懒人准备的救命稻草。 开源精神的本质是什么?就是把那些折磨人的苦力活通通甩给机器去处理。毕竟在这个连闹钟都要联网的时代,如果你的程序还不能自我进化,那你的电脑真的就只配用来盖泡面了。 总之, hermes agent 这玩意儿用一次你就回不去了。因为它会让你深刻意识到,真正的高手,从来都是那个最会偷懒的人。 如果 ai 真的 能全自动写代码,你觉得程序员未来还会失业吗?在评论区聊聊你的看法。

大家好,欢迎来到我的频道,今天给大家分享一个小技巧。用爱马仕写代码或者跑任务的朋友, 可能会遇到这样一种情况,这个情况是什么呢?就是你给他装了一堆 skill, 好 几百个,然后你给他一个任务呢,他直接就开始写,比如这里,呃,我之前给他一个任务,让他去帮我抓取博克,做成 pdf, 当时我认为呢,凭借 skill 库这些工具完全没有问题,结果任务就直接中断了,我去看任务日记的时候,我就看到了这些类似的内容,嗯,大家可以看一下啊。 他去跑的,我看起来他并没有去调用 skill 库里面的 skill, 而是自己去写了一个 http 客户端,这里面就有一个很大的问题, 不知道问题出在哪个地方,所以我又尝试给了他几个任务,都是一样的结局,然后我就上网去搜,我发现,呃,这不是一个个别的现象,很多朋友都在这个地方踩坑了。 最初呢,呃,我当时装爱马仕,我是想用它学着去做开发,跑自动化流程,所以我的技能库装的很全, 大家看可以看到我这里有三百多个 skill, 呃,网页抓取、反爬文档转换、 pdf 生成这些技能都是有的,但是当时他没有去成功的去完成这个任务。 呃,我就去翻了一下这个执行的日制,所有的日制都指向了一个原因,就是你每次给他布置任务的时候,他的行为模式都非常固定,他收到需求之后,直接想方案写代码,在他的逻辑里,这个才是最短的执行电路 技能库,他不会主动去翻搜索已有的工具的这个动作呢?呃,对于他来讲,他是一条分支路径,他并不会主动去走。 打个比方,你给实习生一个工具间,里面什么都有,但你每次让他去修东西,他都还是从兜里掏一把瑞士军刀,从头开始。这个其实不是一个态度的问题,而是他脑子里面没有去先去看看工具箱这样一个步骤。 呃,这个可能对于我们来说确实是非常的反直觉的一个事情啊。所以呢,我们要去解决的就一个事情,就是说在系统的提示词里面,在他收到任务和开始写代码的中间, 我们去给他插入一个检查点,我们给他呃取了一个名字叫做思维的中间层。 这个插入这个思维中间层呢?他分五步,第一步就是我们要去让他理解我们的真实意图,要让他搞清楚我们真正要什么。第二步就是把任务拆开, 一个复杂问题拆成几个独立的小问题啊,一个任务他把它拆解一下啊,然后每一个子任务子问题去对应一个具体的操作。这个第三步就是我们做这个事内容就是他 每一个需求,每一个小问题,他先去技能库里面去搜,命中了技能 有现成的他就用,没有命中搜不到,他才允许自己去写代码去跳过这一步的话,他就算执行失败了,这是一个咱们的一个固定的一个规则。 好,到了第四步,呃,收到了也不盲目用再一次的去判断一下这个 skill 是 不是真的适合当前的场景。 第五步才是最后的执行交付成品。也就说在这样一个炼炉当中,他最重要的,他不是最后的执行,而是就是说让他先去思考的这么这样一个过程。那么我们给他的一个 硬标准就是说他跳过二三步的话,这个任务就算执行失败了。 咱们在插入这个四四维中间层的这个过程当中,我们没有去编排框架,也没有去做多 agent, 就 多了这么一个检查点而已。咱们再再来拿一个实际项目来举例,比如说,呃,我们再次给他一个任务,说把三篇技术博克抓下来清洗排版,做成一本 pdf, 他就会按照我们的流程去把任务拆成四个字,问题啊,怎么去抓取博客页面?怎么把 html 转成 markdown? 怎么排版成可打印格式?怎么合并成一本 pdf? 每个子问题先去搜一下技能库,但是如果说咱们没有给他添加这样一个中间思维中间层的话,他就不会去先去找技能,而是第一时间就去手写方案。那对于现在网站的反爬技术来说呢? 他自己去写这样一个方案是很难绕过人家的反爬限制的好。然后这个任务他去执行的时候,他去走我们的这个思维中间层的时候,他第一步他去抓取反爬的时候,他会命中一个啊,叫做 scrabbling 的 一个开源的这样一个工具, 它就是专门去绕过 cloud flyer 的 保护的好。第二步,它去提取航命力,对吧?它在我们的技能库里面也命中了一个工具啊,这个 extract 它命中了这样一个工具。到第三步它需要排版 pdf 了,再次命中一个工具 pandoc, 最后是执行交付合并,对吧?这个 nano pdf 工具命中了,它就用这个工具来执行最后的任务。咱们反过来看呢,如果说不,不走前面这套流程,这个 agent 它会自己爬出框架, 一套 html 级引擎,自己封装 subsystems 去调调 panda, 七个文件,两百多行,大部分是用不上的。也就说如果说按照他以前的这种工作逻辑的话, 呃,是非常的,不仅去消耗我们的时间,它也消耗很多的算力和 token。 那用了咱们的这一套流程呢啊,四个模块,每一个都去掉一个现成的 skill, 一个 skill 脚本编排,三十行,两百行变成三十行,全是现成的。这套流程跑了一下, 我最近跑了一下,它有几个变化,第一个就是说 api 的 这个命中率, 缓存命中率啊,大家都在用 api, 都知道这个缓存命中率如果明显上升的话,你的 token 消耗和你的费用消耗是会明显下降的。 这个还有一个附带的好处,就是说呢,因为本身爱马仕他带有这样的一个机制,就说 agent 他 收到有根的 skill 之后,他顺手他就把它修了好。重点来了,怎么给你的 agent 加上这个呢?方法 很简单,你先看一个没有思维中间层的配置,就这个一个技能列表,几个技能列表,几个服务配置, a g 的 收,收到任务之后,跳过一切直接写代码,这就是没有 咱们这个思维中间层的配置的时候,他就是这样一个情况。那么再来看一下,加了思维中间层的配置的时候,他就是这样一个情况。那么再来看一下,加了思维中间层之后呢?在最前面的五行 啊,这个大家可以重点看一下,可以截图保存一下啊。加了思维中间层之后呢,在最前面加入五步流程,加一句跳过,即思维执行失败。就这么一段,没有额外的框架,也没有多 agent, 就是一个检查点,三步,打开系统提示词,把五步流程粘贴到最前面,保存重启,不需要装任何东西,你现在就可以去试一下,现在就可以去试一下,给你的 agent 装上这个检查点,装上这个刹车,他会从一个闷头写代码的实习生 变成知道先翻工具箱的人。有用的话请回来点赞收藏、关注,谢谢大家的观看!

ai 行业的龙头企业如今在黑客眼中已成为待宰的羔羊。近期迅速走红的开源项目 opencloud 上线仅六十三天便被检测出一百三十八个漏洞,其插件库中四分之一的程序为木马程序。而当下更为强大的工具 hermes agent 登场, 该工具具备自主学习能力,无需人工过多干预,完成任务后还能进行自我反思,并自主编辑新的技能包。 令人意想不到的是,引发 ai 领域这场改革的竟是一群币圈集客,他们持有估值达十亿美金的 token, 利用去中心化的算力来训练大模型,因此不应紧将目光聚焦于大型企业,真正能够改写 ai 行业规则的,或许正是这群涉足 web 三领域的创新者。

你电脑里装了多少 ai 工具?用过两个月之后,真正每天打开的可能就剩两个。 cloud code 负责写代码, hermes agent 负责剩下的事儿。 这不是哪家公司亲定的,是社区跑了三个月跑出来的搭配,圈内认可度比较高。为什么是这俩?先说 cloud code。 astropic 自家产品 opus 缩点器驱动, 在 ai 编码评测里表现靠前,在编码工具圈里口碑也比较稳。 cloud code 是 写代码专用你的日程邮件快,平台提醒定时任务,多平台消息协助生态上的消息,它管不了。 finance agent 这边 nasa research 二月份开园, gtahab 短时间内收获高人气, 圈内活跃度也不错。他做的是另一类活,持久化记忆,跨绘画,不失意,自动生成技能。做过的事下次直接附用一个进程,同时接多平台消息协助生态邮件,以及国内主流办公协助工具。 你在外面用手机发一句话,他在你自己机器上把活干完,本地能跑模型,随便接两个工具不抢饭碗。可多的是你坐在电脑前写代码的那个搭档。 hermes, 是 你不在电脑前也一直在干活的那个。全天候自动化助手,一人公司想自动化,这是不少开发者愿意尝试的。双站组合,一份订阅加一个本地跑的开源 agent, 装一次够用很久。

一个 ai agent 能自己改自己的提示词,自己优化自己的技能,这不是科幻,这是 news research 开源的 hermes agent, github 上超过十万颗星。今天来讲它的自净化机制,以及你怎么用它来调诱。 hermes agent 是 news research 开发的 ai 智能体框架, m i t 协议完全开源。它跟普通 agent 的 区别在于内置了学习闭环, 每次执行任务后,自动从成功和失败案例中提取经验,生成技能文件,下次遇到类似任务直接调用它。模型无关底层,可以接 gpt cloud lama 任何 api, 自托管,数据不外泄。打个比方,普通 agent 向照手册办事的实习生 hermes, 像会自己写笔记、复盘错误,不断更新工作方法的老手,当前版本零点一四还在快速迭代 hermes agent self evolution 这个仓库做了一件事,让 hermes 的 技能不再靠人手写,而是自动进化。背后是两个关键技术的组合。 先说 d s pi, stanford 开发的声明是编程框架,核心理念是把提示词当成可编程对象,不是手工调餐的文本。 你定义输入、输出和度量标准, d s pi 自动在提示词空间里搜索最优解。再说 g e p a。 全称 genetic pareto prompt evolution, 遗传帕累托提示词进化,一篇 icl 二二零二六 oral 论文。 g e p a。 跟传统提示词优化方法差别很大,它读执行轨迹不止看成功失败的标签,而是读 agent 完整的执行过程,哪一步走了弯路,工具调用返回了什么,推理链在哪段的, 然后根据轨迹里的具体失败点提出针对性修改,不是随机改,优化的时候同时看准确率,偷啃消耗延迟,找平衡点,而不是只追一个指标, 整个流程是循环的。现有技能跑测试级收集执行轨迹, g e p a 分 析失败模式,生成变异版本,跑分对比保留更优版本进入下一轮。 实际怎么用?分两步,第一步,准备评估数据,两种来源, synthetic 是 l l m 自动生成的,测试用力,适合快速起步。 session 是 从 hermes 实际运行日记中提取的真实任务结果队,质量更高。建议先用 synthetic 跑通流程,再切到 session 做精细优化。 第二步,运行进化命令, python m evolution skills evolve 下划线 skill 指定技能名称、迭代轮数和评估数据来源, 每次迭代自动完成跑分分析、变异对比和保留。仓库规划了五个递进阶段,第一阶段优化技能文件已完成。 第二到五阶段分别是工具描述、系统提示词、工具代码持续自动循环,都还在开发中。第四阶段最激进, agent 不 止改自己的提示词,还能改自己的工具代码。 自动净化最怕的是改着改着改坏了。仓库设计了五层保护机制,测试套件全通过才保留净化后的提示词大小,不能无限膨胀,不能破坏已有的缓存机制,不能改变技能的核心意图。 净化结果以 pr 形式提交人类审查后才合并。成本方面不需要 gpu, 所有净化操作通过 api 调用完成。每次优化运行大约二到十美元,取决于迭代轮数和模型选择, 用小模型跑,进化过程本身用目标模型跑,评估成本可控。 hermes 的 自进化就是达尔文那一套变异靠 g e p a 读执行轨迹提出修改,选择靠测试及跑分淘汰插件,好的变异变成下一代的基础, 每个技能独立进化,互不干扰。跟传统提示词工程比,传统方式是人坐在那里反复改,看效果再改 hermes 把这个过程自动化了,而且改的依据不是感觉,是执行轨迹。 如果你在做 agent 开发,这个是目前开源社区最完整的自进化方案。代码仓库链接在简介里,有用的话点个赞。

你有没有想过,在微信里发一条消息, ai 就 能帮你剪视频、做 ppt、 写文档?今天带你认识 hermes, 你 的二十四小时 ai 打工人! hermes 是 一个 ai 超级助手,最牛的地方是你可以直接在微信里跟他聊天,就像跟朋友发消息一样,不用打开任何软件,不用学任何命令 安装超简单,三步搞定!第一步,打开终端,输入 winet install hermes 第二步,输入 hermes setup, 自动配置第三步,扫码登录微信搞定,可以开始聊天了! 装好之后,微信就是你的 ai 终端。想剪视频,直接发一句,帮我剪一段口播视频要做 ppt, 说一句,帮我做个零零后风格的 ppt, 就 像这样,就这么简单, 用熟了之后你会发现他简直无所不能!自动给视频加字幕和特效,三十六种主题的 ppt 一 键生成,企业情报自动搜集整理,还能设定时任务开机自动报道。你说一句话,他干一整天! 最厉害的是 skills 技能系统,每装一个 skill, 就 等于获得一项新能力, ppt 视频剪辑、 excel 制表、 k 转换、 ai 资讯快报、产品介绍、音效制作,全部免费开源社区每天都在更新,装了就不会想回去, 去 hermes 点 i o 下载微信扫码登录,马上开始体验你的第一个 ai 员工从今天开始上班!

真是瞎搞啊,今天又验证了一个事情,就是省 token 是 怎么省的?如果说大家用 hermes agent 或者是 openclaw 去做自动化任务的话,那这个就不说了。如果说你是用它去写代码的话,我的建议是还是要用,不管是什么 code, 不 管是 cloud code 还是 kimi code 还是 cortex 啊,一定要用上这种专业的写代码的这种工具,它真的是很省。为什么呢?你看啊,这里 如果是我在用 promise 完成,我现在正在做这个任务的话,这早都撑满了。早都满了,你看它是每五小时刷新一次,你看这只剩三十三分钟了,我只用,只用了百分之十三,但是你看一下我做了多少任务了,看往上翻 能看到吗? 上下纹都已经撑满三次了,我都已经手动压缩上下纹三次了,恐怖吧。所以如果写代码的情况下,不要用那些龙虾呀,爱马仕呀这些东西了。

在上一集讲解了个人知识助手跨绘画记忆的威力。本集我们讲解开发自动化代码审查到部署 cloud code 的 写代码 hermes 看守流水线。两个工具不是二选一,而是各管一段。假设你早上九点打开电脑, telegram 先弹出三条消息, 不是同事发的,是 hermes 发的。第一条说,昨晚二十三点十七分, main 分 支有一个 pr 合并,新增三百八十七行代码, os 模块的 token 过期逻辑没处理,边界测试覆盖率从百分之八十二掉到百分之七十六。 第二条说,凌晨两点四十, ci 流水线跑了一轮回归测试,三个用力失败,其中两个是昨天那个 pr 引入的,一个是已知的 flaky test。 第三条说,今天的日报出稿已经生成,其余昨天四个 commit 和两个 pr 需要你确认后发送。 这不是假想场景。 hermes 的 crown 调度、 github, mcp 和记忆系统可以让它在你睡觉时持续工作。传统代码审查有两个痛点,一个是延迟提了 pr 等 reviewer 有 空。另一个是一次性,不同 reviewer 的 关注点可能完全不同。用 hermes 做自动代码审查, 第一步是接入 datap mcp, 让它能读取仓库的 pr、 diff 和 issue。 第二步是设置 cron 调度,你直接告诉 hermes 每六小时检查一次媒体分支的新 pr, 做代码审查,它就会自动创建任务。 第三步是定义审查标准,把代码规范写成 skill, 比如函数不超过五十行,错误处理必须用自定义类型,所有 api 端点必须有测试关键就在第三步,审查标准是 skill, 它会随着你的反馈自动引进。你标记了某个 hermes 没发现的问题,下次它就会注意同类模式。 传统 link 规则是静态的, hermes 的 审查标准是活的。 hermes 做测试和 code code 做测试有个根本区别, code code 更像,你告诉他给这个函数写测试, 他写完你验收。 hermes 是 自己发现哪些函数没测试,自己写,自己跑,跑不过自己修。最后给你一份报告。这个能力来自几个工具的组合。 file 负责扫描代码目录,找到缺少测试的模块。 codex key, user 在 沙箱中运行测试。 terminal, 负责执行覆盖率报告,生成 memory, 记住哪些模块已经审查,哪些测试是 flaky 的。 这套能力还可以配合 crown 做周度覆盖率检查, 每周一早上自动扫描覆盖率,低于预值就发通知提醒。测试就从一次性动作变成持续机制。日报和周报这个功能听起来简单,但用起来会上瘾。 hermes 通过 guitar m c p 拿到当天的 commit 记录 pr 状态和艺术变化,在结合绘画记忆里你讨论过的内容, 生成一份你几乎不用回忆就能确认的日报。周报更有意思,因为有跨绘画记忆, hermes 能看到整周的脉络。周一修了什么 bug, 周三为什么改了架构方案,周五的 pr 为什么被打回?它都能串起来? 所以周报不是简单的 commit 列表,而是有因果关系的叙述。一个很实用的建议是,让 hermes 在 生成日报时同时更新一个项目 skill, 记录本周的技术决策。这样下周做周报时,它能直接引用决策记录,不用再从 commit message 里猜你当时在想什么。 cloud code 和 hermes 不是 竞争关系,它们擅长的东西完全不同。 cloud code 是 你在旁边实时对话的搭档。 hermes 是 后台运行定时汇报的执行者,前者擅长写代码重构和调试,很多事在一个 session 里就能完成。 后者更擅长巡检、监控、汇总和调度,而且能跨天跨周持续运行。触发方式也不一样, cloud code 更多靠你主动发起, hermes 更适合由 chrome 自动触发或者事件驱动。一句话总结, cloud code 是 工匠, hermes 是 管家, 工匠负责做东西,管家负责确保一切都在正轨上。把这两个工具放进一条流水线里,就是 cloud code 写代码提 pr, hermes 自动审查, pr, hermes 跑测试验证,再由 hermes 生成日报汇总。 这条流水线跑起来之后,工作中心会从写代码看代码跑测试,写日报变成写代码加确认结果。但有一点要记住, hermes 的 代码审查是辅助,而不是替代。 他擅长发现模式化的问题,比如命名不规范,缺少测试边界条件遗漏。可到了架构层面的判断,仍然需要人工,别因为自动化了就跳过人工 review, 至少核心模块要保留人工环节。下一集是内容创作,从调研到成稿, 我们会从开发流程切到内容工作流,看看 hermes 怎样把调研、写作风格和自动成稿串成一条线。下集见。

兄弟们经历了多少个日日夜夜,我终于把这个 u 盘码一键启动版给它搞定了,然后给大家看一下,然后正常情况的话我们就是下载以后就是一个这样的包,然后里边有个程序,然后完了你双击运行,然后它就 一下他就会把这个服务拉起来啊,进来以后他就是这种样子的,然后在这里的话我是做了很多内置的功能,在里面也很方便的啊,这里可以去看一下运行日制啊,这个运行日制的话就是判断我这个项目就是这个 u 盘码它到底有没有启动起来,然后完了的话这里还做了这个 模型更换,他这边支持就是可以在这里去换,然后你这边配置好的模型,然后这里还可以去进行一个新增模型啊,这些都是有坐在里边的 啊,主要的话在这里的话就是往下的话就是做了这个呃,微信的一键接入跟飞书的一键接入都很方便,就比如像飞书这里,他因为我已经配过了,然后他这边就会提示现在已经配置了,如果是你要新配的话,你就可以在这里填写你飞书的一个这些信息, 然后填好了之后的话啊,然后你这边就是可以去看一下我们的一个这个技能市场,然后这边我是内置了一个四点六万个的技能的一个技能市场在里边,然后安装技能这一块也是非常的方便啊 啊,反正整体的这个项目他已经是写完了,然后有没有就是想要去测试的,有的话到时候可以找一下我。

大家好,我是根谷,今天教大家用龙虾和 hymas 打通 n 八 n, 让你的这个自动化流程一句话搞定啊,怎么做到的呢?第一的话需要 你在你的工作流程编排里面加一个 webhook 这样的一个钩子程序啊,拿到这个钩子程序以后的话,你再调用根谷老师已经写好的这样一个 skills 啊,然后第三步让龙虾 hymas 学习这个 skills。 好, 我给大家演示一下, 这个就是我的一个这个流程编排,是吧?这边右边是我的嗨马斯吧,龙虾都可以啊,无所谓的是吧?这里是我的一个这个 webhook 这个程序啊,你看看这个 webhook 程序,我已经在这个监听端口上,就这个,是吧?他已经在监听端口上,是吧?我这个鼠标 没有点他,对吧?然后说我在用嗨马斯说,哎,这样一个是处罚这个 n 八 n 执行的技能,是吧?或者你随便叫他一个名字,我这个就是叫 n 八 n 的 技能是吧?哎,他,他已经处罚了这个这个这个新闻抓取工具他已经跑了,处罚成功了,哎,这个正在正在去, 呃,在群里面去找我的这个网网页是吧?找的网页里面有个什么衣服啊,旅游对吧?旅游是吧?然后去找到这个旅游的信息, 把这个旅游的一些文章啊,热点啊,你可以看一下,把它热点把它抓出来,是吧?最后最后做一个标题的筛选啊,就在一个最简单的工作流,你后面还有啊,你拿到这个筛选的新闻,你后面是发 e mail 也好存本地啊,或者我打通那个 opc 点是吧?然后存在我 opc 点数据库里面去,然后,哎,我再去把它粘贴到我这个抖音的这个这个 这个这个这个这个这个图文的这样一个编排流程里面来,对不对?好,这已经完成了,其实非常简单的哈。哎,样式是这个样式,我给大家演示一下这个样式啊,这个就是一个样式, n 八 n 的 这样一个 这个处罚器,是吧?就是控制这个 n 八 n 的,是吧?哎,你是这个这个这个玩意,是吧?监听这个这个端口,你要用户说处罚,他就执行,是吧?那不要怎么做,对吧?怎么怎么弄?怎么怎么怎么怎么怎么怎么怎么怎么怎么怎么怎么怎么怎么怎么弄,对吧?这就好了,对吧?这堂课就分享到这里,你学会了吗?