粉丝61获赞380

大家好,最近有一款 ai 神器呢,非常火,它的功能跟 openclaw 是 非常像的,但是呢某些功能是超过了这个 openclaw, 在 github 上的这个 sars 已经超过了三十二 k 了,虽然说比 openclaw 还差一些,但是呢目前是受到了非常多的关注啊。那这款 ai 神器呢,叫 homeis 神器, 那本期视频就来介绍一下这款 agent 的 到底是什么,以及如何安装,然后来讲解一下它的一些特色点。那首先我们来看一下 hymis agent 到底是什么?我觉得它有一个非常两个非常大的个特点,就是可以自净化, 也就是可以自主去学习,加强自己。然后呢就是还可以有一个内置的一个学习壁画,那它这两个部分是怎么做成的? 那就依赖于这最重要是依赖于这两个特点,一个是持久多层的记忆,它是使用这个 light 加 f t s 五的方式来保存我们的历史的对话,也就说你跟 ai 进行的每一个对话它都保存下来了, 而且能够去根据你的对话去总结。那第二个就是他的自动技能进化,这个是非常有意思的,他去通过你的对话,他会把你的对话流程沉淀成技能,也就说在他这里面你是不需要去创建技能的,他会根据你的对话来去总结出来技能,当然你也可以去安装别的技能, 所以就有这两个东西来促成了它有这种自主进化的一个能力啊。那么在 open core 里面我们是要自己去安装技能的,那么它的记忆的方式跟它也有区别,那接下来我们会详细讲解它的记记忆, 那其他的比如说自主执行能力啊,它是能调用各种各样的工具浏览器,那么我觉得这是一个通用的 a 点的必须具备的能力啊。那模型的话,它也是支持常见的模型,比如说我们国内的 mini, max, kimi 啊,全部都支持,然后也是免费开源,免费的, 那么目前它的这个 stars 已经有三十二点八 k 了,增长的非常快啊,那关注的人也非常多,然后我也试用了一下,的确是有点不一样的感觉,但我们来对,先来对比一下这个哈密斯跟 open coil 的 区别。 那么首先是核心价格的维度, openclaw 是 什么?是它是个 getaway, 它通过 getaway 路由到不同的 agent, 然后不同的 agent 可以 对接不同的这种 message, 比如说微信啊,或者说飞书啊,然后设置不同的角色,它更像是个中央控制器,控中央路由器。但是 后面这个的特点就是什么呢?它更像是个人助手,专为你服务的,它的特点就是说我能在给你的服务过程中去成长。所以说 open core 更像是一个商业的东西,你可以去对接很多客客户,别人的老板啊,同事啊,去设置不同的角色,不同的 server, d, m d, 然后去跟他们去对话,那后面一次呢,就是更像是你自己,你就给自己玩就行了。所以我认为的区别是在使用上的区别,有这么个区别,那学习能力, 那 open core 呢?是需要你去安装这个技能,去找一些技能,它是不会去沉淀你的对话记录来自主去创建技能的。 那么 homeis 呢?是可以去提炼你的对话,然后生成这样的技能,那这个是非常有意思,也是可以去啊,我觉得 openclip 是 可以去借鉴,然后去后面可能会去增加这样的功能了,那记忆系统,那么我们会详细再讲到这个记忆系统,那技能的生态 都是一样的,包后面是也有这样的社区啊,然后也可以去安装开源的这些技能,完全没有问题。那消息平台的话,那 open call 这边是可以对接了,五十加集成,那对接的那种渠道还是非常多的。 那后面是这边的话,是对接了七到十个主流的,那国内的飞书啊,微信啊都对接了都,他这边都是可以完全去对接的模型啊,都是,我觉得都差不多, 那其实就是最重要就是这个记忆系统和这个啊学习能力,我觉得是最重要是这两个区别啊。接下来我们就来详细的看一下他这个记忆到底是怎么来存储,怎么来去来实现这种啊自进化,或者说能够更好的去给你去回忆你具体的内容的。那首先你发出一个信息, 那后面一次 a 型的时候开始就推理,然后他会把常驻记忆,就是他会把上一次或者之前的对话中值得记下来的记忆啊,会放到这个 memory 点 md 文档里面去。然后呢,那你的每次对话,他都会把这个 memory 点 md 放入到上下文里面去,那么这个跟 openclose 是 一样的,这种就叫做常驻的记忆啊,就是你可能是你的个人的设定啊,你的一些习惯啊,那么这个就会放到上下文,每一次对话都有用,那如果你的对话中需要更深的记忆, 就比如说你要回忆在上周二我给你对话的内容是什么,我是不是说过一个什么事情,那么 home 子就会去 搜索这个 solide, 就是 你之前的对话记录,它会把每一条对话记录都保存起来,那么我这边就是把这个 solide 数据库展示出来了,你看它把我的每一个对话都保存起来了, 那么他要搜索的话,通过这种缩影的方式把这个数据就拉出来,然后去做摘药,就会回答你,哦,你让我回忆的东西在这里面有,那 open colo 在 这里是没有的,他是把你的对话会总结成文档,放到这个 memory 的 md 里面 啊,日期这种方式来存储,所以他是想不起来上周二我具体跟你聊了什么,他是记不起来的。最后呢,就是你对话完成之后,他有一个专门的 啊,异步的这种 review, 这个 review 是 干什么呢?它会 review 你 这个这段时间对话,那这段时间对话有没有值得可以存入到我们这个 memory 的 md 的? 也就说我们刚开始开始发送对话的这个长注记忆, 它可不可以把这个对话内容值不值得长期保存?如果值得,那就它就会更新这个 memory md。 然后呢,在你的这个对话过程中,有没有一些流程我能沉淀起来, 把它做成技能啊?如果有,他就会写出来技能,所以你跟他对话的越多,那么你保留的这些技能就会越多,他就越来越会越了解。我们知道技能就是一个人的一个流程化的一个沉淀,对吧?你的做事的习惯,你的所有的这个, 呃,你的方法论,所有的东西他都帮你总结出来,放到这个保存起来了,他就会越来越像你,越来越理解你,越来越懂你。所以这个东西是为什么说他?我觉得他是一个非常 大的一个进步,为了让大家更加的明白这个记忆的区别,这两个记忆的区别让我来更详细的来演示一下。那后面是存储存的是发生的过程,也就是他会把每次对话存起来,像聊天记录一样 存到他的数据库里面去。但 open core 是 什么呢?他提炼的是知识,就是会把你的对话中可能需要注意的点,对吧?偏好规则设定结论给保存起来,像个就像你做会议闭会议记要一样, 那么后面是保存的是会议里面每一个人说的话,但是呢, open core 保存的是我整场会议里面要记的点, 所以这两个是非常大的区别的。我们来举个例子,比如说你现在跟 agent 对 话啊,你发送的时候以后要帮我整理周会记,要先把代办列出来再写总结,那 agent 说, ok, 我 记住了, 记住了啊,这是一个非常重要的一个顺序。然后呢,他说,哎,用户又提了个要求,他又 ok, 接下来了,那上面的对话其实里面就包含了什么呢?就是 过程,就他要怎么做,一个结论就是他不要怎么做,或者是建议他怎么做,这个一定是会被保存成记忆文档的。好,对于这,对于这段对话,那么 holdem 子会把他所有的这个聊天记录啊,就这个聊天记录保存在 sql 数据库里面去,然后也会 把这个里面提炼出来,把那一个结果就说你的设定,你要的要求,把这个每次要开会记会议要的要求把它保存到这个 memory 里面去, 然后如果涉及到流程,把它保存着技能。所以呢,你下次如果再问同样的问题,他就会知道哦,我先要干什么后要干什么,我,你不喜欢什么样子的,他就会去调用这个记忆和这个技能, 那么 open core 也是一样的,在这里是一样的,根据上面对话也是会把这个结论会记下来, member 在 这,在这个,在这里的时候,在这个阶段的时候,大家都是一样的,当你问到同样的事情,他们的回答结果一定是一样的,在这一步两个人的记忆都是一样,因为都是总结, 都是对对话内容的总结。但是当你要问这个时候,比如说你问为什么 要把这个周会改成这个样子,问到细节的时候,就是我们要深入的去问的时候,那 open coil 他 是没办法去回忆,哦,我为什么要改成这样?他只知道结果是要改成这样,他不知道过程。 所以在第一步的时候,如果大家都是啊,重新去做一个事情,就是我要建议要开一个新的会议,那么大家都会按照这个结果,就是已经设定好了规则 去执行。但是当你去问我之前要为什么会这样子的时候,你来帮我回忆一下,我上着奥为什么要让你去改的时候,那后面一次的话就是可以去回忆你们之间的过程,然后去提出摘药回复给你,但是 open close 我 没有的。所以呢,时间一长,差别就体现在 宏米思更强调的是陪伴感,哇,它真的像一个你的一个影子一样,能知道你们的所有的对话记录。那奥文科尔是个管理感,因为他注重结果, 所以这是一个很大的区别,这也是我在看他的技术代码里面一个感想,就是就是宏米思可能是会更偏向于个人意见的,就是陪伴式的, 很知心的一个伙伴。那 open core 呢?可能是更像是支付管理助手,所以呢, home 更容易把精力继续转成方法,因为他拥有你所有的精力,他会把你的精力转成技能 沉淀下来,那么这个就是非常非常重要的。好吧,我们最后再来总结一下,那 home core 记住了是发生过什么? open core 记住了,是 我最后应该记住什么啊?这个是两个非常大的一个区别, home 和 open color 应该怎么选择呢?如果你更想要长期的相处感,回忆过程,经验沉淀,那么 home 则会更适合你。 如果你想要文件化,记忆清晰,治理规则型知识库,还有还有就是你想要去路由更多这样的通道去对接这样更多 agent 内部的 agent, 那 么 open color 可能会比较适合你。那我们来安装一下来体验一下。 安装也很简单,就只要有这样一个命令,那么你可以选择你的 windows 电脑,或者说你的这个另一个服务器啊, mac 电脑都可以安装。对呢, 那当你安装完之后啊,你可以使用 home 键进行启动了,启动完之后,它就会进入一个终端命令行的界面啊,比如说这样子,它会看到,你会看到它那个工具以及它现在的技能。 如果你安装这个 openclip 啊,它会把 openclip 里面的东西都同步过来,但是你在安装过程中去选择,让它把 openclip 里面的,比如说这个,呃, user 的 md, 就 它记忆文件以及它的技能都可以同步过来。然后的话你第一步是要去设置啊,你想要用什么模型?那怎么设置呢?你可以在这边 homeys, 然后 set up, 这里的话是可以选择,就是 你是不是要同步这个 open core 里面的配置,那比如说我现在选择不要,那么你这边的话它会选择一个 quick set up, 就是 可以去设置模型消息,那么你可以选择这个。好,这边就就是你们常用的模型了, 国内的模型的话,我建议用这个 more providers, 然后呢去选择这个,呃,自定义,因为它有些端点是有问题的,就是你可以自己去设置这个,比如这个 base url 啊,你自己可以设置这个端端点的地址,因为他有些地址他错,比如说我选择 kimi 时,他那个地址是错的,但是大部分地址都可以用,你设置完之后他就会要求你设置 key 啊,那就 ok 就 结束了,模型就设置成功了,结束之后呢,你就可以去启动, 这是会进入它的一个聊天界面,它自带的聊天界面,那么你就能看到你现在这个模型,比如说我配的是这个 timmy 的 这个模型,那么你就可以在这里对话,然后非输这个对接的话是需要单独去这么去配置的,那么就是 hoe, 它有个专门的 get away 啊,能 set up, 然后这边的话是可以选择看到没有,可以选择飞书,然后就是选择飞书这个啊,选择这个飞书,然后的话选择 y, 那 就是你飞书创建的一个应用 a p p id 和这个 a p p secret, 就 a p p 密钥,你把它输进去之后,那么你就可以去对接去用了。 但是目前来说用其他的,我用飞书的话好像有时不太稳定,所以我现在用的是他自带的这个聊天框,可能后面会有很多这种插件出来,因为毕竟他也是刚出来,但是他这个记忆和这个技能自动创业技能,这个是太爽了。所以你如果没有这种需求的话,你直接可以用这个 自带的这个聊天框,就它这个终端跟 qq 的 一样去对话也可以,也是非常舒服的,非常爽的,它也可以去操作很多事情。 ok, 那 本视频就到这,希望这个视频对你有所帮助。

一句话总结, hermes 强大的记忆能力加个性化 open cool 强大的多智能体加可适化随着我们上一期发布的 hermes 编辑详细视频介绍,很多朋友找我聊 hermes 和 open cool 的, 它们的区别在哪? 又该如何选择?那么今天他来了,这可能是全网最全的和 miss 以 openclo 的 详细对比,两大 ai 肩巅峰对决,从核心架构到功能特性,从用户体验到试用场景, 用最直观的方式让你彻底弄懂它们的区别。 hermes agent, 这位天生就带有主角光环的 a a a 键,由大名鼎鼎的 now research 出品, 它具有持久化记忆技能系统消息网关, 他的一个编程语言是由开审开发,所以他天生对 ai 的 支持比较友好。核心优势, 持久化记忆系统,让你每次对话都像老朋友,熟悉你的习惯、项目结构,甚至个人偏好。 opencloud 多智能体架构实时画布插近生态加语音通话,它是由 timescore 编写,开源社区活跃核心优势,多智能体路由加 live cover 实时协助,强大的插件系统,让 ai 真正成为你数字分身。核心差异 记忆系统,这是 promise 专属文件,即持久化 mary 点 md 文件加 user 点 md 文件画绘画记忆 多智能题,这是 open club 专属技能,运行任务处理多代理路由系统皮肤, hermes 高度制定 ui 实时画布 open club 的 专属 lamp cover htm 二 c s g s 格式化写作插件生态 open core 有 成熟的插件生态圈定时任务奥密斯比较成熟的定时任务系统特性,详细对比, 持久化记忆,奥密斯比较卓越多智能体 open core 更强大 皮肤置垫 promise 更完善实时画布 opencloud 天生支持 mcloud 插件系统, opencloud 有 强大的 cloud have 加 mpm 市场,安装插件更简单,更方便 语音通话, opencloud 可以 通过插件支持定时任务。 premise 比较完善消息平台 opencloser 支持的消息平台更多媒体理解。 opencloser 更强浏览器控制,自动化页面操作 opencloser 支持更好多租户 profile, 多配置支持。 premise 更完善编程代理,代码编辑测试 open club 更强大架构设计对比 amiss agent client 交互程 agent 核心 memory system 持久化 time skill get away 网关 open club 多端接入多智能体,智能路由 limcar 的 支持,实时可式化写作 package system 强大的插件市场以及 m p m 兼容 getaway hub 能力、雷达 promise 分 布能力,它更强的是它的记忆系统和它的定时任务。 而 opencode 的 一个能力,它最强大的是它的多智能体 以及它的插件生态。核心功能深度解析 hermes 记忆系统 hermes 记忆系统是最大的亮点,它使用两个 markdown 文件来持久化信息。 memory 点 md 文件存储环境事实项目结构工具偏好 右侧点 md 文件存储个人信息,沟通习惯偏好设置。每次对话开始时,这些信息会被注入到系统提示中,让 ai 像老朋友一样了解你。 支持真声改查 open 可乐的多智能体 open 可乐支持同时运行多个 ai 代理, 通过智能路由将任务分配到最合适的代理。 max agent, 主代理处理日常对话, delegate agent, 委托代理 职责处理特定任务,可以按渠道划分。 find 皮肤系统可以通过配置不同的皮肤信息,或通过自定义皮肤。 open cloud lamp cover enclair 是 oppo 可乐专属的利器,提供实时可缩画写作空间。 hermes 定时任务 hermes 的 定时任务非常成熟,支持自然语言的调度。 oppo 可乐插件生态 oppo 可乐采用现代插件架构,以 mpm 生态完全兼容优缺点分析 hermes agent 记忆系统卓越,真正画、绘画记住一切,适合长期项目。 profile 多配置,轻松切换不同的项目角色,配置 scan 高度制定,打造品牌化的 ai 形象。定时任务成熟,适合自动化运维场景,原同步 记忆,可跨设备同步,无多智能体,单机代理定型任务处理受限,无实时画布,无法可式化展示内容。 open cloud 多智能体架构, 运行,处理复杂,任务分工明确。 live cover 实时可塑化,协助展示效果一流。插件生态丰富, fold have 加 mpm, 扩展性强,编程能力强大,内置 code 叉, code code 集成媒体理解,全面图片、音频、视频分析。一体化记忆系统若需要额外的插件, ui 定制有限画面使丰富,那么我们应该如何选择它们呢? 选择 hermes agent, 你 获得的是一个有记忆的私人助手,他了解你的一切,记住你的项目偏好习惯,适合需要长期合作,重视个性化体验的用户。 选择 opencloud, 你 获得一个强大的 ai 工作站,多智能体分工编程代理, 适合需要处理复杂任务,重视可塑化展示的开发者和技术团队。一句话总结, hymes, 强大的记忆能力加个性化。 open club 强大的多智能体加可塑化那么你现在了解他们了吗? 请在评论区聊聊你的看法,说说你是如何选择的?如果视频对你有用,请点赞关注我们下期再见!

五十二天狂发七十三个产品的 cloud, 最近又上新 computer use 功能,不到一天,近千万人围观。而国内这边,小马哥那张鹅场塞虾图,前段时间引爆网络,今天新虾出炉, qq 浏览器上线智能助手 qbot cloud, 直接把让电脑听懂人话这门技术端到了我们中文用户的桌上。你动动嘴,它就能帮你把电脑上的脏活累活全干了。 比如自动打开网页查资料,跨网站抓取信息,甚至处理本地文件。关键是你不用装任何插件,在 qq 浏览器里就能一键开启它,还能绿泡泡原声远程操控,绑定绿泡泡的 cloud 号。你在地铁上、咖啡厅里发条语音,让家里的电脑帮你查资料、写文案、处理文件。 真正的人在外面做活,从家里来。比如最近大火的 o p c。 如果你是一人开发者,最头疼的就是 d bug。 现在你只需要对 q bugle 说,帮我搜一下这个报错代码的解决方案,它就能自动打开多个技术论坛标签页搜索,滚动查看 api 文档, 对比信息,最后给你一个综合回答。如果你是自媒体创作者,选择题和文案是每天都要面对的灵魂拷问。现在直接一句话,帮我做一期 ai 科技领域的公众号选择题,要热点话题加图文排版。 cubicle 会自己访问三十六课、 hackler news 等,抓取信息,自动下载配图素材,最 后生成一个本地 html 文件,直接在浏览器预览,从信息收集到成品交付,一站式闭环。这背后是鹅肠把大模型自研的视觉识别算法和浏览器深度结合了,简单说就是给你的浏览器装了个眼睛和大脑, 让它不仅能听懂人话,还能精准看到并点击网页上的每一个按钮,告别过去自动化工具动不动就找不到北的尴尬。相比于 cloud 的 computer use 更懂中文,更安全,体验无缝。它依靠 qq 浏览器这个国民级应用,在账号打通、绿泡泡联动和安全管控上 有着天然的优势。当 ai 不 仅能回答你,还能替你操作整个电脑时,一个真正能动口就不动手的效率时代已经来了。

目前全网最火的 skill 你 还不会用吗?今天我教你一个最简单最直观的方法,看完你还不会用,你来打我!这个方法就是使用扣子,扣子前段时间做了一次重磅的升级,推出了 agent skills、 agent plan、 agent office 和 agent coding 等等重磅功能, 其中让我觉得最有趣的无疑是对目前全网最火的 skills 的 支持。我体验了一下,我觉得对于没有技术背景的朋友来说,如果你想要用上 skill, 这个应该是我目前找到的最简单最直接的方法。不过在开始之前呢,我想要先简单的介绍一下什么是 skill, 因为我发现很多朋友还不知道 skill 到底是个什么东西, 在这里呢,我觉得最重要的是要从概念和定位上面去理解它,而不是去纠结说它到底是由什么组成的。那么在概念上呢,其实也很简单,那就是 skills 这个英文单词的中文意思,技能,就跟我们平时说一个人有弹钢琴的技能,有游泳的技能,有说服别人的技能,对吧, 其实就是这里的技能的意思。只不过我们今天要聊的这个 skill 呢,它不是人的技能,而是 ai 工具的技能。 当目前来说,并不是所有的 ai 工具都有技能这个东西啊,但是对于这些有这个东西的这些 ai 工具,你就可以给它们来增加一些技能啊,比如说增加一个做 ppt 的 技能,增加一个数据分析的技能,对吧? 那什么样的事情适合用 skill 来做呢?在这里就说到为什么要用 skill 这个东西了,那么简单说呢, skill 的 意义就在于它们能够让我们刚刚提到的这些 ai 工具能够更好地去完成一些任务, 比如说数据分析,对吧?你可以把一堆数据直接扔给 ar, 让他来给你做一个数据分析,那么大概率他也能做。但是呢,如果你给这个 ar 工具安装了一个专门的做数据分析的 skill, 那 么大概率他做出来的数据分析会更加的专业,同时更加符合你自己想要的一个结果。 其实跟我们日常生活中也是差不多的啊,比如说一个没有做饭技能,比如说我,对吧?我去做一餐饭,跟一个有多年经验的大厨,他做出来的一顿饭,味道应该是完全不一样的啊。这个就是因为有技能的这个差别,所以什么样事情适合用 skill 来做,那其实答案就很明显了, 基本上就是所有的这种技术活就是有一定技术成分的,这些工作以及一些流程化的事情,都适合用 skill 来让这些 ai 工具能够更好的去完成。当然每种 ai 工具它创建和使用 skill 的 方法是不一样的,像 coco 的 这种可能就需要一定的技术背景,对于不懂编程的朋友来说,可能会有一定的上手难度。 所以接下来我就介绍一下如何在扣子里面来轻松方便的创建和使用一个 skill。 ok, 我 们打开扣子首页,然后点击这里的扣子编程,再点击这里的技能,在这里我们就可以通过对话的方式来生成一个 skill 了。 这里呢,结合我自己的需要,我们让它来生成一个小红书爆款标题的 skill, 我 们直接跟他说帮我开发一个 skill, 根据我提供的视频脚本或主题生成十个小红书爆款标题。好, enter, ok, 可以 看到它这边就开始在帮我创建这个 skill 了。 ok, 它现在就帮我们生成了这个 skill 啊,然后可以看到它这边有一些简单的介绍。好,我们来试一下。这边我们上传一个脚本文件,然后跟他说生成十个标题。 enter, 可以看到他这边在读取我的脚本文件,然后根据这些内容来生成小红书爆款标题。好,这边就已经生成好了。然后这边呢还有一些简单的解析,他到底是怎么生成的?那对于标题的生成呢?我其实是有一些自己的一些方法论的,所以在这里我们也可以让他来根据这些方法论来帮我们生成标题, 那我们就可以继续完善这个 skill, 我 们跟他说这里有一些起标题的方法论,你参考一下。那下面这些就是我比较喜欢的一些起标题的方法论。我们提交 ok, 可以 看到现在蔻子就在根据我们的要求来更新这个技能了。好,很快蔻子就帮我们升级好了这个技能, 可以看到它这边增加了这样的一些起标题的一些理论。那为了更加清楚地看到它生成的这些标题有没有按照我们这些理论来生成,我们可以进一步升级这个 skill, 让它在输出这些标题的时候呢,简单地解释一下这个标题是怎么生成的。好,我们跟他说对于每一个标题简单解释一下它的原理,为什么这样设计 好。提交 ok, 扣字,又在帮我们升级这个 skill 了, ok, 升级完毕,然后我们再来试一下上传脚本,然后跟他说生成标题。 ok, 我 们再来看一下这一次它生成的这些标题。好,可以看到这一边每个标题后面都有一些简单的解释啊,它设置的原理是什么? 所以它的输出结果还是符合我们刚刚给它这些要求的。然后整体来说,我觉得这些标题的效果还是蛮不错的啊,像这个标题我觉得是可以直接拿来用的, 那到这里这个技能就差不多已经做好了,当然你可以根据你的要求去进一步的对他进行一些优化。比如说我之前在 dunk 上面学到的一个点,就是你可以把你之前 表现最好的一些作品的标题喂给他,让他来去参考,这样的话他取出来的标题会更加符合你自己的这个风格。再比如说你可以让他同时生成封面文字和标题这样的一个组合,因为像我这样的话,封面文字跟标题之间其实是一起思考的,然后他们俩之间会有一个相互配合的关系。 ok, 这个技能创建好了以后呢,我们需要部署一下啊,点击右上角的这里的部署,再点击下方的这个开始部署。 ok, 很 快它就部署好了,然后我们点击这里的立即体验, 就可以在扣子的这个对话框里面来使用这个技能了啊,在这边可以看到由我们刚刚生成的这个爆款标题生成技能啊,选中,然后呢上传一个脚本,我们选一个别的,然后跟它说生成标题。 enter。 好,可以看到这边就在开始利用这个技能来帮助我们生成标题了,那输出的这个格式可以看到跟刚刚呢也是差不多的。 ok, 以上就是在 code 里面创建和使用一个 skill 的 方法,整个过程直接对话就行啊,简单到不能再简单,呵呵。 而且除此之外呢,在这里的 code 技能商店里面还有大量的现成的 skill, 都是一些经验丰富的专家和开发者创建的 skill, 你 可以直接拿来用的,使用这些 skill 基本上做任何事情都能够得到一个更好的结果, 所以如果你还不会用 skill 去试试扣子 skill 的 功能,相信你会有完全不一样的感觉。 ok, 这个视频就到这里,大家想要创业什么样的 skill 呢?欢迎在评论区留言,最后别忘了点赞关注我是昌哥,我们下期见,拜拜!

发现 ace 更新了一个非常重磅的功能,我来赶紧体验一下。一个能够跟随着我们的视频画面去进行配乐以及配音效的一个功能, crazy, 哈哈,我,我无法无话可说,这里的话,我放了一段我的视频素材啊, 然后里面包含了很多的切换的一个镜头,这边它是一个相当于有一个 agent 的 一个模式, 那例如说它就是我们可以看到整个页面,我们可以把视频给扔进去,然后框选其中某一段,然后我们去描述,可以根据你的描述去生成对应的一个音乐,相当于去人机共创的一个模式。因为我们知道我们需要去比较精准的卡点的话, 那其实现在 ai 还是比较有困难的,因为它需要大量的 token 去理解你的画面才可以。但是这里的话我们用了一个比较讨巧的一个方式,就是说我们可以用 人工的去定义,就是我不是把它完全的交给 ai, 有 点像人机共创一样,或者配乐老师的这个思路来去用导演思维去创作一条片子, 所以说 not bad right, 那 我们回到 a c e, 我 们来试试看好了。好,那我想说这里从睁眼开始这一近我们去进行一个 age 的 一个创作,觉得我想做一个 soft chew deep house, 就是 现在看起来还是一个偏 beta 的 一个阶段呢。 可以看到右上角它其实接入了一个 a 帧的一个大语言模型,感觉它是可以去根据我的简短描述帮我去进行扩展。然后你看这里还有一个 finalizing video analyze, 所以 说它其实也有对于画面的一个思考的一个能力,好,我们可以看到它的整体一个流程,然后就是提交了一个生成的一个任务。 哦,那我基本上感觉到它应该是有一个画面的一些固定的点位的分析的一个功能,以及 对于我们的音乐的任务相对性的一个优化的一个 prom 的 一个优化的一个方式,然后再调用它自己的一个 api 去进行一个生成,可以说整个的逻辑链路非常的完整。 对, ok, 经过一段时间的小小等待, a c e 已经帮我们去生成了一段音乐,我们可以听听看啊。 ok, 我 会觉得整体的氛围还是挺到位的,而且它整体给我的反馈 也是按照我的一个要求,一个 deep house, 还有一个偏呃 q 一 点的那种的偏 zara 的 感觉的东西都是能给到的, 那我会觉得这方面的任务它是完成的不错的。其他的类似于 a c e 自带的一个功能,呃,比如说转 media 也好,或者说分离 stem 也好,去测速也好,都是能够去调用的。比如说我们来测试一下生成音效的一个能力。好了, 我想说是测试一个鱼游泳的一个声音,它能做到吗?还是一样我框选一段生成音效 sound effects for a video fish swim。 哈哈,鱼游泳不知道行不行啊?测试一下发送一下。 好,在等待的同时我们来继续阅读一下其他独特的魅力,比如说它给了我们一些提示,它是当然是可以生成音乐以及声效的描述词,里面要带好情绪。还有呃,参鸣,哇, 我是可以输入参鸣的对不对?真的假的?那我一会试试试看好了,然后还有呃去 style, 还有 event, 然后如果说我什么也不选择的话,它是可以一口气地去生成整个视频的, 然后呃 review, edit, 还有它,其实那其实还是一个 d a w 一个思路,让我们可以去整在整个时间线上去进行一个编辑,据它说是如果说我们都在同样一个 session 里面去跟它聊天的话,整体会更加精准。 wait what? 哎,它给我增加了一个水流的一个声音,你看这里的话,这里的话本来是没有的哟, 而且它这里还给我增加了一个切画面的一个一个一个声效, ok, 哇, 已经变得有点意思了,我,我觉得已经变得有点意思了,天呐,这些音效点位它是能读懂画面的对不对?它在这个睁眼的一瞬间给我增加了一个 transition, ok, 有 意思,有意思哦,这里的话我可以直接的框选,之后这里会有一个小弹窗,比如说我要什么添加什么层,当然我也可以去直接的去定义,比如说你看这里的话,我可以去加伴奏,加歌曲,加鼓组,加贝斯,加这 ra, ra, ra, 以及说什么呢?我可以跟原始的 ace 的 功能去进行一个联动,我可以去接入 ai 人声 crazy, 以及说去进行一些音效的一些转换。啊,真的给我们特别特别多的一个想象力 哎,他后面又读懂了这个画面,你看他又读了一下画面,这里的话,他还给我增加了一个鱼的一个游泳的一个声音,我输入中文行不行?看起来是可以的,慢慢的 往上冒的气泡, ok, 我 觉得还可以,还可以,真的还可以,滴滴答答的水滴 crazy, 哈哈哈,太快了,真的生成非常非常快。哦,我知道了。是不是说 我只要没有匡选,我没有匡选的话,就其实还是原始的生成?但如果我匡选了视频的时候,这样的话,让 a 准去帮忙去读懂我们的画面,去调用它的一个大一个一个视觉模型去理解画面,这样的话 可能更好地去配合我们的一些音效。然后你看这里底下是我直接生成的音效轨道的话,就是还是原始的那种 cell effects, 就 会比较的不精准,正好也对比一下。好,你看这里的话,你它是自动地帮我去 map 到我的时间轴上,我听听看。它生成呢? 哎,你,你看到没有,像这里的话,它这里的话就非常精准, 它跟着画面来动的。我的理解是它会去读一遍我们的画面,然后把音效给贴到一些关键帧上,它会有一个识别关键帧的一个动作,这样就有点意思了,非常非常有意思。 刚才整个的体验下来,我会觉得它在音效层面上已经是一个非常非常可用做 foley 的 老师,他的工作效率的一个工具, 非常的高效,非常的牛,很兴奋啊,很兴奋。我觉得 ace 现在走在一个一条非常非常正确的一个道路上,期待后续产品的一个迭代,然后这两天我会继续的好好的体验,好好的再分享给大家。 ok, just right, 拜拜。

在很早之前我就看到过 ai agent, 它的五个功能模块的划分的一个公式就是感知、认知、决策、记忆、执行。但是在我动手实践的时候就会很懵,这五个模块代码到底怎么去实现呢?怎么去写一个 agent 呢? 直到我看到这样一个公式,这个公式由三部分组成,第一部分就是大模型,第二部分是工具, 第三部分是第一。看到这个三要素的组成的形式,我一下就感觉特别通畅了,相信大家很多时候都有同感,在看不少理论之后呢,在实践的时候还是同样很懵。后来我在工作的时候也经常回顾这个三要素公式, 在实践的过程中去不断的对照这个不同代码模块跟三要素的关系,他都是能够对应过去的。说实话,我觉得五模块的划分这个太学术化了,听起来很完整,但落地的时候呢,没有具体的抓手,全都是抽象的能力。 就像我们在写这个技术方案的时候,我们会把 spring boot 它的自动输入,还有自动配置,或者是 will 的 一些显示的能力,全都写进这个技术文档里边,把这个技术文档包装的特别的专业,特别的深奥,不知道有没有同感的朋友,大家可以留言一下。 其实并不是说模块的错,而是在这个五个模块定义的时候,他会把大模型的能力也放到这个定义里边去。现在我们可以用工程的视角 看三要素和五个模块他的对应关系,首先就是大模型,大模型其实他包括感知、认知还有决策这三个部分都有,这三个能力其实都是大模型来做的。 第二个要素就是工具,工具就是负责执行和一部分的感知的能力。最后一部分就是记忆 memory, memory 能够记住上下文,跟五模块中的记忆模块相对应的还有学习经验的一些能力。所以我觉得复杂是理解的敌人,简单是实践的开始。

好的,大家好,今天我来给大家介绍一下谷歌浏览器更新幺四六这个版本之后,它可以做到的一个非常好的事,就是可以直接用我们的 ai agent, 非常方便快速的就可以去直接操作我们的浏览器。这次更新它主要是更新了这个 remote debugging 这个功能,你现在可以直接在谷歌浏览器通过一个网址,然后一键打开这个开关,打开之后你就可以用之前传统的 谷歌发布的这个 live tools mcp, 或者说其他的一些操作浏览器的工具,你就可以直接用你的 ai agent cloud 或者 codex 这些直接去非常方便的操作你的浏览器。 它这一次的优点主要是这几个,第一个它解决了登录墙 cookie 的 这种问题,我们知道之前如果我们想用我们的 agent 去操作浏览器的时候,老是会遇到登要需要我们登录账号需要粘贴我们的 cookie 给他,他每次的操作浏览器都是去开一个全新的一个浏览器,这个浏览器没有保存你的任何信息,这个就很烦。 第二个是之前的那种传统的无头浏览器,很容易被检测到网站会被拦截,那现在这种直接去操控相当于是浏览器它在底层上直接把它的网页,它的这些结构直接暴露给了 agent, 然后这个数据它就是一个非常结构化的一个数据 agent 看起来非常方便,也会更加的节省 token。 其次是这一次更新之后,整个的操作难度会非常低,我等下演示一下大家就知道了。好的,首先第一点你需要知道你的谷歌浏览器是否更新到了幺四六这个版本?你可以直接在你的谷歌浏览器输入 chrome version 这个网址,然后你就可以看到第二点,我们怎么打开我们的这个 remote debugging 的 这个开关?这个也很简单, 直接在谷歌浏览器的网址输入这个网址,到时候我会放在评论区,打开之后这里有一个 allow remote debugging for this browser instance, 你 就勾上之后这里你会看到你的这个服务就已经跑在你的本地的窗口了, 现在你就已经把你的浏览器给暴露出来,下一步你就可以用装了 m c p 或者 skill 的 agent 直接去操控你现在的谷歌浏览器。 推荐的两个,一个是谷歌这个官方的控制浏览器的 m c p 工具。第二个推荐的是第三方的一个大神,他开发的一个 c d p 的 技能,他比谷歌官方的 m c p 那 个工具好在他好像少了很多的验证环节,会用起来更加的方便和快速,我现在用的就是这个。好的,接下来我们都准备好之后,我就给大家演示一下,不是现在怎么用我的 agent 直接去操作我现在的浏览器。现在我这边已经打开了一个 open code 的, 我现在直接给他说用这个 cdp 这个技能,看到我现在的 x 的 网页的最新的五条推文是什么,我现在来运行好,运行的时候他会这里突然弹出一个 allow remote debugging, 就是 是否我们允许我们 agent 远程操控 我们点 allow。 好, 我们继续。现在可以看到在这个思考过程中已经找到了我现在首页的这五条推文。好的,现在他已经看到了结果,我们可以看到他现在已经把我首页的这五条推文找出来了。第一个是 gtc 大 会的雪宝登场, 这个没问题。第二个是一个 microsoft 的 一个广告,他也看到了,后面的这些内容他都找了出来,这个是一个非常简单的用力,我刚才演示的过程中,他没有要求我去登录 x 或者说去给他任何 cookie, 他 直接通过我现有的这个浏览器状态就直接去得到了这些数据,而且非常的快,也不是通过任何截图,就是直接通过浏览器暴露给他的结构化数据。

大家好啊,我今天给大家演示一下这个 gamest, 然后它的一个动画生成哈,然后它这里有一个叫叫 menu, 有 这么一个技能,它就是这个系统自带的一个技能,然后这不我告诉他,我说桌面生成勾股敬礼视频配上字幕和解说,我说好啊,然后就就就开始干活了, 干干干,看看啊,最后完成视频生成,视频位置在这儿十七秒, 嗯,然后这个已用默认播放器打开视频,嗯,打开之后我发现他是个中文,他是英文解说啊,我说 找到了,但是配音解说得中文啊,我让他用中文啊,就抱歉,确实是英文的,让我重新生成中文解说,我说以后都要用中文解说,别让我每次都提醒明白了以后默认用中文,然后又又生成了,我一看还是英文啊,然后这个 我说你要,你自己要查验符合我要求的在平面图,你说的对,哈哈哈啊,然后这个他又又做了一遍,问我是中文还是英文,我说还是英文,他后来又去做了, 我说好了,现在是中文了,以后都要这样,你能配上字幕吗?他说好,先后就时间轴,我另外说文件以后都要保存桌面, 然后他这个桌面路径是这样,生成带时间戳音频的字母文件字幕文件生成成功啊,然后需要这个合并语音,这个合并到视频稍录字幕,然后一会告诉我完成,然后这是视频啊,这是时长四十多秒,然后包含了中文配音,这个全程解说中文字幕同步显示, 然后这个以后视频默认保存桌面,中文这个配音加字幕,最后这个生成了这么一个东西, 勾股定律是平面几何中非常重要的定律,它指出在任意一个直角三角形中,两条直角边的平方和等于斜边的平方。让我们用边长为三四五的直角三角形来验证,公式是 a 平方加 b 平方等于 c 平方。较短的直角边长度是三,它的平方是九较长的直角边。它大概就是这样的。我之前没给他提要求的时候,他给我生成了一个讲解,圆的啊, 看看咱这个圆面积,这个就是很简单的一个,不要给他设成这个,我给他一个指令,我说你分析一下国内的模型,然后分析出来,结果呢?在桌面上建一个 word 文件,这个文件的命名叫模型分析,然后这个保存一下,他一会就做完了。做成了这个, 打开看一下哈,整体来说还不错。你看他不单是做完了,而且还带着这个分析的相对客观啊,而且还得带着格式。我是没要求格式的,看看我的电脑屏,还带着格式。嗯,给我感觉还真是挺聪明的。好,下课。

你想过吗?你的 ai 助手不光是个工具,还能变成一个跟你一块学习,一块成长的伙伴?听着是不是有点科幻?但今天咱们要聊的这个 harmos agent, 就是 奔着这个目标去的。它的核心卖点就是你跟他互动越多,他就越懂你。 一个能自我净化的 ai 代理,这是官方的说法。哎,你别小看自我净化这四个字儿,这可不是随便吹的牛,这恰恰是 hermes 设计的灵魂所在,也是咱们这次要把它掰开揉碎了看的重点。 好,那咱们今天就分几步走,首先,快速带你认识一下 hermes agent, 然后呢,咱们得钻到它肚子里,看看它的架构是怎么搭的,这可是关键。 接着,咱们看看他到底能干啥,有多厉害。然后重头戏来了,揭秘一下他那个自我学习到底是怎么回事儿。最后,如果你是 open call 的 老用户,别挤,我也会告诉你怎么平滑地升级过来。 ok, 那 咱们就开始第一部分。记住啊, hermes agent 可不是一个简单的工具,它的目标是成为你的一个动态的、有智慧的伙伴。 他的核心啊,就像装了个大脑,有一个内置的学习循管,啥意思呢?就是说,你每次跟他打交道,他不只是在傻乎乎的执行命令, 他在偷偷的学习给你建一个模型,或者说用户画像,他能嫉妒你的写作风格,你最爱用的那些代码函数,甚至你讲的冷笑话。这么一来,时间长了,他就不再是个大众脸的通用助手,而是变成了只属于你的特别定制的伙伴。 行,那接下来咱们就打开它的引擎盖,看看里面到底是怎么个构造,把这个架构搞明白了,你就能真正理解它凭什么能这么灵活,这么强大。 你看这张图,这就是 hermes 的 核心架构了,咱们可以把它想象成一个高效的团队。中间这个代理循环呢,就是它的耳朵和嘴巴,管着跟 telegram、 discord 这些地方的沟通。 右上角的多层端后端就是他的手和脚,让他能在你本地电脑、云服务器,甚至任何地方跑起来。 最关键的左下角这个持久化记忆与技能系统,这就相当于他的大脑海马体,负责寄东西,学新本事,你看这几块一合剁,一个完整的智能体就活了。 这么一套灵活的架构,带来最大的好处是啥呢?就是解放你的 ai 助手,再也不用被囚禁在你的 note book 电脑里了。 你可以把它扔在一个一个月才五美元的小云服务器上,七十二小时跑着,当然也能让它在顶配的 gpu 集群上干重活儿。这就意味着,不管你在哪儿用手机还是电脑,你那个专属的 ai 伙伴儿随时都在线,随时等着你召唤。 好,理论讲的差不多了,咱们来看点实在的,有了这么牛的架构,这个 hermes 到底能帮咱们干点啥?来看看他的武器库里都有什么?哎,我个人特别喜欢他这个设计哲学,你看就是俩字,统一。 不管你是在那个黑乎乎的命令行里,还是在咱们常用的聊天软件里,核心指令全都是一样的。想开个新对话就打杠 new, 想换个大模型就打杠 model, 你 完全不用为每个平台去学一套新的咒语,这个体验就非常舒服。 当然了, hermes 的 本事可不止这些啊。你琢磨一下,你可以直接跟他说人话,哎,每天早上九点帮我把行业新闻总结一下,他就自己定时去干了。要是碰到特别复杂的任务, 他还能摇身一变当个项目经理,把活儿分给好几个小弟,也就是紫代理一块儿干。 如果你是终端的中毒用户,那它的那个 t o i 界面儿带自动补全的,绝对让你感觉回到了家。哦,对了,还有一个特方便的功能,你随时发一段音过去,它能直接给你转成文字。这简直就是开会摸语记笔记的神器啊! 好了,各位,接下来咱们要来揭晓 hermes 真正的秘密武器了。还记得咱们开头说的吗?就是那个能让他自我净化的核心机制,封闭式学习循环。 这个学习循环啊,分四步走,咱们用个例子来说就特别清楚了。你看啊,假设你第一次让他帮你把一篇文章翻译成英文,再总结出三个要点。 第一步叫经验。他干完这个活,就会琢磨翻译再总结,这事你好像经常干,于是他就把这套流程打包,变成一个新技能。 第二步叫精炼。下次你再让他干同样的事,他就直接调用这个技能了,而且他可能会问你,哎,这次的总结要正式一点,还是口语化一点?你给了反馈,他就把这个机能给优化了。 第三步是回忆,过几篇,你跟他说帮我总结一下上次那篇关于 ai 的 文章,他就能通过回忆翻出之前的聊天记录,准确地帮你搞定。最后一步,也是最牛的一步,叫成长。 通过这么一次次的经验、经验回忆,他不光是学会了新技能,更重要的是他摸透了你的工作习惯和偏好,这才是与你共同成长的真正意义。好,最后咱们来聊聊一个老用户们特别关心的问题,如果你之前用的是他的前身 open claw, 那怎么才能升级到更强大的 hermes 平台呢?你现在就在用 openclaw 吗?哎,别担心,开发团队早就替你想好了,整个迁移过程可以说是无痛衔接,非常顺滑。 可能你最担心的就是换个平台,我之前调教那么久的东西是不是都白费了?哎,完全不用担心, 你看,从你给他设定的那个独特的灵魂和个性,到他慢慢积累下来的所有记忆,再到你自己创建的那些技能和配置好的各种 api 密钥、迁移工具,就像一个专业的搬家公司,全给你原封不动地搬到新家, 你之前投入的所有心血一点都不会浪费,全都无缝继承了。所以啊,重点来了,这次迁移,它不仅仅是搬个家那么简单,它是一次彻彻底底的升级, 一旦牵过来,你就立刻拥有了完整的 hymos 生态系统,特别是咱们刚才花了半天讲的那个最核心的功能,那个超强的自我进化学习循环。 那么在咱们今天讲解的最后,也留给大家一个问题,你可以好好想一想,如果你的 ai 助手真的能像个伙伴一样不断学习,和你一起成长,那么你们俩会一起创造出什么样了不起的东西呢? 这可能就是 hermes agent 这个项目带给我们最大的想象空间吧!

一觉醒来,三百万人围观,靠着龙虾年化收入飙到四点五亿美元。从 ai 搜索进化到 agent 的 perplexity 刚刚发布新工具,网友直呼,这是要干掉 cfo 啊!没错, perplexity 正式杀进个人财务管理了,他直接连音 pad, 让你能安全连接自己的财务账号。换句话说,你所有的财务碎片被一个 ai 瞬间拼成全景图。 但这不是简单的数据聚合,你可以直接用自然语言驱动分析。比如根据我的收入和账单,预测未来三个月哪几周我的账户会低于安全线。 ai 会实时生成净值计算器、自定义预算追踪器、 债务偿还计划,甚至完整的财务 app。 每个图表、每个模型、每个交互界面,都是根据你的具体数据现场手搓出来的,而不是套用固定模板。 过去一个财务顾问或初级会计师要花几小时整理对账分析的工作,现在你只需要用平常说话的方式问他,然后一个实时更新、随时可交互的财务方案就已经呈现在你眼前。

tikub 上有个项目火了, hermes agent, 五十四万 star 的 开源 ai 智能体框架,它到底是什么?简单说就是一个开源的 ai 助手框架,能帮你写代码、查资料、操作文件、管理任务,甚至接入你的聊天软件,完全免费。 mit 协议开源。 tikup 上有五十四万 star, 很多人会拿它跟 openclaw 比较简单,说 openclaw 是 接入一切,什么都能连,而 hermes agent 是 记住一切核心杀手锏,是自我进化能力,用的越多越懂,你能自动创建新技能,记住你的习惯。 如果你已经在用 openclaw 也没关系, hermes 支持一键迁移,你的人格配置、记忆、数据、 api、 密钥都能直接搬过来。那怎么安装?只需要两步。 第一步,打开终端,粘贴这条安装命令,它会自动下载并装好所有依赖,不用操心任何环境配置。第二步,输入 hermes 回车就启动了,从开始到能用不到一分钟。启动后你可以选择模型, hermes 不 绑定任何一家厂商,国产的 kimi、 智普、 glm、 minimax 都能用, openai 和 cloud 也支持随时切换。除了终端对话,它还能接入 telegram、 discord、 slack 这些平台,手机发消息也能用它。 但这个框架最厉害的地方是它会自己学习进化,用得越多越懂。你能自动创建新技能,记住你的习惯和偏好,时间长了就像一个专门为你定制的 ai 助手。以上就是 hermes agent 的 完整安装教程,关注临近未来,每天了解一个实用的 ai 工具。

最近没有开直播,也很少发视频,因为正在专心致志的开发一款独立的叫螃蟹也叫蟹爪的一个独立的智能体。 然后呢,把一些比较复杂的配置,全部符合我们国人的一些操作习惯,给他做了深度的改造。当然了,这些代码跟 呃 open 可乐也完全不同了啊,架构也有点区别。然后呢,该有的功能都有,但是我把这些任务执行啊,包括技能的这个配置啊,甚至包括工作流的一些搭建呢,包括模型的配置啊,全部给他做了 呃界面的一个格式化的一个配置,也吸收了别的原码的一些优秀的功能,比如说这个 宠物的一个陪伴的功能,也就是我跟这个主智能体在聊天的过程当中呢,他会时不时的插话啊,你比如说我叫一下这个螃蟹啊,他就会回复一下,那么我们聊天过程当中呢,他也会给一些建议和意见。 在开发这个智能体的过程当中呢,除了像飞书的对接啊,包括呃一些安全的控制啊,甚至包括技能的一些调用的准确性啊, 以及任务执行的自动化之外,最重要最重要的还是记忆的一个问题。所以呢,我也参考了像克拉蔻的所谓三层记忆,或者是 open cloud 的 记忆体系 啊,然后呢,也参考了他们的 out dream 或者叫梦境的一个工程逻辑概念。那现在的智能体跟我沟通交流过程当中基本不会忘事,比如说我问他昨天跟我聊了啥,他会准确的做一次复盘和回复, 为了保障我这套智能体系统的一个安全性和它的运行效率,也包括了它的记忆啊,任务啊,技能等整个组织体系执行的一个高效。 呃,我在 github 上下载了很多源码,包括最近热火的 dfo 啊,也包括大家都在讨论的这个 hermes agent 啊,也包括了这个被泄露的哈。这个东西 我是用 ar 编程工具啊,一个目录,一个文件的去拆解的,最后呢,都会生成一个拆解的一个结论性报告。然后呢,我再把这些报告呢发给另外一个 ar 编程工具,让他们相互的看对方的报告啊,并打出分数。 呃,然后我再把这些报告汇总起来,得到了一个比较完整的,或者说比较严谨的啊,没有猫腻的一个报告。 看完这些报告之后呢,我得到了三个小小的结论。第一个呢,他们这些开源项目的确有很多非常优秀的工程逻辑,是可以 应用到我的智能体项目上的。那么第二个呢,就是很多项目并非是很多博主讲的那样比较适合大家,其实没有必要浪费花费这么多的精力和时间去研究它,除非你是技术人员。 最重要的就是第三个观点,几乎所有的 ai 编程工具得到了一个统一的结论,就是 open class 非常强大,已经很完美了,然后随着它的不断升级,很多不足的地方也被也会被完善掉。 核心的意思就是,对于大部分非技术性的小白来说,把精力都放在 open class 上,专注一点,聚焦一点,比什么都好。 当然了,如果你是一名工程师,你可以多花一点时间去研究这些源代码啊,多获得一些 比较优秀的工程逻辑。但是如果我们都不是搞技术的,或者说我们就是些小白,连 open cloud 都没整明白呢?真的有必要花时间去研究这些第三方的源码吗?那研究的目的是什么呢? 然后研究完了你真的要再花时间去部署他吗?他部署之后真的能够替代你的龙虾吗?我是打大大的问号的,有不同观点的朋友呢,可以关注我,我们深度的交流。

前面有条视频提到了实现老板功能的 skill, 很多人都在问怎么去实现的,其实这就是一个蒸馏方法的问题。今天教你一个三步极简蒸馏法,可以把任何人变成 skill 存在你的电脑。 第一步,复制我的这段提示词到任何一个大模型,然后附上这个人的所有资料,相关的 pdf, 聊天记录, ppt, word 什么都行。传上去之后,稍等片刻, 他就会蒸馏出这个人的克隆体。这里呢,我就蒸馏了卡兹克,能够看到他把卡兹克的性格特点和说话的风格,潜意识里的逻辑都蒸馏出来了,而且你会发现他会用非常卡兹克的语气来跟我去交流,你学会了吗?

在人工智能代理领域, harmis agent 是 一颗冉冉升起的星星,它不仅仅是一个简单的自动化脚本, 更是一个只在与你共同成长的智能代理框架。由 news research 开发,该项目致力于通过高度灵活的架构,让 ai 能够随着用户需求的变化 不断进化,并提升其解决复杂任务的能力。动态学习机制 hermes agent 能够根据交互过程中的反馈,自动优化其决策路径。多任务处理能力,支持并行处理、复杂的开发研究及数据分析任务。高扩展性插件系统, 开发者可以轻松集成自定义工具,扩展代理的功能。边界。上下文感知,具备强大的长短期记忆管理,确保在长时间任务中保持逻辑一致性。模块化设计,采用高度结偶的模块架构,使得核心引擎与工具层分离, 极大地降低了二次开发的门槛。自适应推理引擎内置先进的推理模型,能够根据任务难度自动调整计算资源的分配。轻量级部署虽然功能强大, 但其运行环境要求极低。支持在各种主流操作系统中快速启动复杂代码重构,减少人工介入。自动化科研辅助, 自动抓取、筛选并汇总特定领域的研究论文,为科研人员提供决策支持。个性化助手定制,根据个人工作流 定制专属的自动化执行逻辑,实现工作效率的指数级提升。 hermes agent 的 出现标志着 ai 代理从工具型向伙伴型的转变,它最吸引人的地方在于其成长性,你使用的越多, 他就越懂你的习惯。对于追求极致效率的开发者与技术爱好者来说,这是一个不可多得的开源宝藏。未来随着社区的不断壮大,我们有理由期待他在更多生产力场景中大放异彩。

最近赫尔默兹这个 ai 框架特别火,很多人说它是下一代替代品,它最大的优势是什么?跨绘画记忆, 普通 ai 助手,聊完就忘,下次问完全不记得。但赫尔默兹把每次对话都存到数据库,见了权威,你问他上周讨论那个板块的结论,他能直接调出来,这个能力确实很强,我们以前没有, 我们分析了源码,核心是文本存数据库加权威溯隐,但我们发现了更聪明的方案,赫尔默兹需要额外捕获实时对话,我们不需要。 系统运行四十多天,积累了近一千条知识,飞书聊天开发日记、设计文档、交易笔记都是现成的。 分书对话三百零五条,开发对话五十五条,交易认知十七篇,每日总结五十六篇,设计文档四十七篇,代码提交五百六十六条,九种数据源,合计九百八十九条。 怎么实现的?分两层,第一层,锁瘾器扫描九种数据源,解析非书对话,记录文件,提取每条消息的内容和时间,存入数据库,建权威锁瘾表。 第二层,搜索器,接收关键词,匹配锁瘾,按相关度排序,返回标题类型、日期和内容摘要,全量锁瘾,不到五秒,支持增量更新, 看效果。搜光通信十二条,结果按类型过滤,只看飞书对话,按日期过滤,只看四月以后,每条带摘药,一眼定位, 从没有记忆到全量可搜索一天追评,赫尔默兹,有的我们也有了,有问题评论区留言关注一掌,下期见!

openclaw 最大的对手来了,最近有个新项目叫 hermes agent github 已经拿了三万 star。 很多人跟我说这是 openclaw 的 平替,但我扒完它的原码后,发现这两条路根本不是一个方向。今天我把它们的底层架构拆开给你看,看完你就知道该选谁了。 先说 open cloud, 它的核心叫 harness 策略,简单说就是工具编排,你给他一个任务,他去规划要用哪些工具,然后一步步执行。这套系统的强项是工程化,四十多个内置工具, mixp 协议扩展审批流审计、日制多 agent 协助,全是生产级功能。 但 harness 有 个前提,工具得你先写好,策略得你先定好。 agent 本身不会创造新能力,它只会调用你准备好的东西。 所以, open club 的 终极是什么?是成为最强的工具调度器。但 hermit's agent 走了一条完全不同的路,他搞了个叫 k e p a 的 系统,全称是 knowledge evolution through prompt adjustment, 通过提示调整实现知识进化。说人话就是,他会让 agent 自己写 skill, 自己优化 skill, 而且越用越强。我拆他的原码看了 k p a 有 三个核心循环,第一,经验收集, agent 每次执行任务,会把成功和失败的经验存下来。第二,技能生成, 基于这些经验,它会自动写新的 skill 文件,不是调用现成的,是创造新的。第三,自我验证,生成的新 skill 会经过测试,有效的保留,无效的淘汰。这套机制最狠的地方在于 agent 的 能力边界不再由开发者决定, 而是由它自己的学习过程决定。现在你看清楚了吗? openclaw 是 我给你工具,你帮我调度。 hermes 是 我自己造工具,自己进化。一个是外部扩展,一个是内部进化。 harness 策略的优势是可控、稳定,适合企业落地。 k e p a。 自学习的优势是潜力无限,理论上可以突破人类预设的能力边界,但代价也很明显。 openclaw 的 harness 是 经过大量工程打磨的, hermes 的 k e p a 还在早期,自学习的效果能不能稳定还需要时间验证。听到这里,你可能要问了,那到底该选谁?我的判断是,这不是二选一的问题, 这是两个阶段的答案。阶阶段,如果你要做生产环境团队协助企业落地, opencloud 的 harness 策略更成熟。 但如果你想赌未来,赌 agent 真的 能自我进化到超越人类预设的能力, hermes agent 的 k e p a 路线值得密切关注。而且我怀疑 open claw 团队已经在研究怎么把 k e p a。 的 思想融进 harness 了。中局可能不是谁取代谁,是两者融合。 最后留一个问题,如果你现在选型,你会压 open claw 还是 hermes agent? 评论区聊聊?关注我,下期继续带你拆!