hello, 我是 ai, 普通话,用通俗易懂的语言讲解 ai 方案,既讲优点也讲缺点。今天咱们来聊聊怎么给 open curl 开发一个对接内部信息系统的 skill。 大家都知道 open curl 很 厉害,但是怎么自定义扩展技能 是陪自己企业的系统,这就是问题了。接下来我就一步步给大家讲讲怎么开发这个自定义技能。咱们就以查询内部员工信息系统为例。第一步,得给这个技能创建一个家。 open call 的 自定义技能一般都放在工作群里, 咱们就给内部系统技能专门建个文件夹,就像给一件宝贝找个专属的盒子一样,这样管理起来更方便。具体操作就是在命令行里输入一些指令,创建好对应的文件夹,一个用来放调用内部系统的代码,另一个可以放一些相关的文档资料。 第二步,要写一个核心的配置文件,这就好比给这个技能制定一套规则,这个文件会告诉大模型什么时候该用这个技能 以及怎么用。比如说当用混公司内部人员信息的时候,就可以调用这个技能。同时还规定了只能进行精确查询,不能大批量查询,这也是为了保证系统的安全和稳定。第三步, 要编辑具体的业务逻辑脚本,这就像是给技能装上一个大脑,让他能真正的干活。脚本会根据用户输入的信息去内部系统里查询相关的数据。这里要注意, 千万不要把系统的健全信息直接写在脚本里,要通过环境变量的方式来设置,这样能保证信息的安全。第四步,这一步是可选的,如果内部系统的业务逻辑比较复杂,咱们可以写一些文档资料,帮助大模型更好的理解系统的规则和操作, 就像给大模型一本说明书,让他能更准确的工作。最后一步就是测试和部署,先重启一下网关或者重载配置, 然后在聊天工具里和 open core 对 话,比如让他查一下某个员工的联系方式, open core 就 会按照咱们之前设置的规则 去查询数据,然后把结果整理成大家能看懂的话反馈给我们。这里我要给大家提几个安全方面的建议。在给 open core 对 接内部系统的时候,要遵循最小权限原则, 只给他必要的权限,别给太大的权限,不然可能会有安全风险,还要明确约束他的行为,比如在进行一些重要操作之前,要先和我们确认。另外 一定要把系统的密钥通过环境变量的方式来设置,别直接写在配置文件或者脚本里。你们在实际应用 open call 的 时候有没有遇到什么难题呢?可以在评论区和我交流交流。
粉丝849获赞2393

大家好,在 ai 编程的时候,原型设计是一个非常麻烦的事情,特别是对于非专业的人来说,一些设计的专业型的概念啊,怎么去调整页面啊,这的确是一个老大难的事情。那么 cloud 和 google 分 别出了专业的这种 ai 设计工具,比如说 cloud design 或者 google switch 啊,都是通过提示词能够生成漂亮的网页。但是呢,这两款工具要么是收费,要么是指定的模型。那最近呢,社区就出了一款非常火的开源的免费的 ai 源型设计啊,叫 open design, 那 么它就是可以自己去换模型,然后也降低了很多门槛,非常有意思。那本期视频就跟大家一起来探讨一下, open design 如何使用, 和它有什么样的特点。我们先来看一下在 ai 时代的设计应该是什么样子的,那比如说你要用 ai 去设计一套网页或者一套原型的 app, 那 么你需要一段提示词,有可能是你的产品 p r d 文档。然后呢,你要选择一些专用的 skills, 因为你如果不使用专用的这种技能呢,突出的这个原型界面啊,这种美观度啊,可能是比较差的,可能需要一些参考的样式或一些图片比比如说你让他模仿已经现有的什么样的风格。 那么这三个呢,作为一组输入来发给大模型,那大模型收到这样的输入之后,你要生成外部这原件设计或者 app 的 原件设计都可以,那么你也可以去生成这样的落地页,或者说啊专题页。 那么好一点的这个工具呢,会提供这种页面的局部调整,那选择某个页面之后,哪页面的哪一块问有问题,你是可以去通过提示词去调整的,那么也可以把你现在已有的模型产生出来的这些原型局设计规范导出来, 那放到你的 ai 编程工具里面去,那么你后面可以在自己的这个编程工具里面根据你的大局的设计规范去生成新的页面,或者新的这种组建啊,弹窗啊,那这样的话就 非常的完美的解决这个圆形设计的问题,然后把大这个设计的门槛给进一步降低了,所以呢一个好的 ai 时代的设计工具,我认为是大概是符合这个样子。那 google stitch 和这个 cloud design 其实都是有这些功能的,那么 open design 有 没有这些功能呢?我们来看一下。那么我们可以来到 open design 的 这个 github 的 这个介介绍页面啊,这边有中文的,我们可以看一下中文的介绍, 那么它的特点是什么呢?细节就是这个就是会使用你本地已经装的这个终端命令行工具,比如说像 cloud code 或者 codex 或者 costo 都可以,只要你有终端命令行工具,那么它就可以去调用这样的能力,那么它自己是不会去部署这样的 ai 的 一个 ai 的 平台的,它需要的是你本地的这种 ai 的 编程工具能力。比如说我们使用了 cloud code 进行编程,那么它就可以调用 cloud code 去执行这样的一个设计的一个产出, 那么你 cloud code 就 可以觉得很方便的,很自由的去对接各种各样的模型了。所以这是它的一个一大个特点,就是不绑定 ai 的 ai 的 的平台, 也不绑定使用任何模型。第二个呢就是它内置了很多设计的系统,那什么意思?就比如说你很喜欢苹果的风格,那么它这边就集成了苹果的统一的风格,那么你就可以 直接引用这个风格,拿去去设计类似的这种网页,所以这边是有七十二套,它内置了很多这样的专门的设计的 skills, 比如说像这种啊萨斯这个落地页啊,或者这种呃 app 的 页面啊,非常的非常多, 那这边肯定后面有可能会开放出来,让大家自己去上传上去,然后共享到社区去使用,那这是一个非常强大的一个能力。除了去生成原型呢,这边也去可以生成图像视频、音频,它这边是内置的这个 jpt image 二的这种集成啊,也还有这个 c n s 这个二点零都是可以的。 ok, 那 我们就来体验一下。 那首先呢这边的话你要去下载这个源码,然后进行一个翻译,然后再启动,那这边的话它的启动是非常的简单的,我们把这个命令复制一下,我们来到这个目录,然后我们执行这个启动命令,如果你第一次的话,你还要起安装这个,还要去输入这个安装的命令,然后再去启动 好,把这个地址啊复制过来,打开之后就能看到。那么你如果默认是一个英文的,你在这边点击设置,然后呢这边可以选择语言,然后的话把它改成中文, 这边选择中文啊就 ok。 那 么在这边你也可以去设置你要用的这个本机的这个编程工具啊,那这个比如说这个我默认的使用 kimi c i, 那 么我也可以使用 cloud code, 那 这边有好多,它也会检测到有没有安装 这些安装的话去官网上安装也是非常方便的。那安装完之后你去保存,那我们就可以去进行一个这样的圆形设计了, 那这边的话是他可以做的这个目前可以做设计的各种量,比如说圆形设计换个面,或者说从现有的模板啊选择这样的模板,比如说这个, 那这边就是统一这种设计规范,比如说 cloud 的 这种,官网的这种这种风格,或者说啊 apple 或者说特斯拉都有,你都可以选择一种设计的这种规范,然后套到自己的网页里面去。我们来做一种设计的这种规范,然后套到自己的网页里面去。我们可以输入 test, 然后我们选择一个设计的体系吧,如果你有自己的这个的话,你就不要选择就行了, 我们可以选择一个好,我们就选择 cloud, 然后这边的话是线宽图和高保帧,如果你是做圆形的话,非常建议用高保帧了,线宽图是比较粗,就比较比高保帧还粗糙一点的。这个项目已经创建好了,那接下来我们就要去输入这个提示词啊,创建好好, ok, 那我们就可以去啊,让他去来帮我们去生成这样的一个网页。那我们大概做一个还是这样做一个电商网站吧。 ok, 我 们就来个简单的,就是让他设计一个类似淘宝这样电商网站, 然后只需要首页秒杀活动页、商品列表页和商品详情页,因为电商是一个比较常见的这个场景啊,模型是大概能理解首页是什么样子的, 当然你也可以说的更详细一点,你的首页是什么样,要有哪些元素,对吧?然后你的活动要有哪些元素是可以去更加详细去描述的?你可以提供一个 p r d 文档,或者说你提供一个专门的页面设计,文档包含了哪些页面啊?页面里面有什么样的功能,是怎么排版的? 然后的话它的风格是什么样子,都可以在这边去提示,去输入这个提示啊,能得到更好的效果,那我这边就来跑一个平均的一个效果吧,然后点击发送, 然后大家可以看到它这边调用的就是我的这个 cloud code 的 本地的终端啊,那相当于是它跟我们的这个 cloud code 进行通讯,比如说我这个 cloud code 用的是智普的五点一的模型,那么它是直接调用这个模型的。好, 我们选择的是 cloud 官方的这种设计的规范,所以都是以橙色为主。 ok, 他 这边的话会给我们提供一个这样的问题啊,让我们来回答,那我们就选择桌面端吧,那视视觉风格啊,他这边的话让我们选风格,他其实是跟我们刚刚第一步选的这个设计规范是进行一个融合的,比如说我们就接近淘宝吧, 进淘宝主营品类,我们选一个电脑数,品牌方向就是你如果你有的话,你可以提供一个这样的品牌规范,他等会在提问中会给到你,如果没有的话,你就让他自己随机生成就行,你也可以截图让他去给你生成,那我们就选择来让他自己帮你选 首页包括哪些模块啊?我们可以这些是多选的,我们都可以加上。 ok, 好, ok, 他 这边也是制定一个这样的计划,来一个一个页面来生成好,他这边开始去搭建这样的首页了。 ok, 他 这边任务已经完成了,那做完了这四个页面,首页、产品页面页、活动页和这个商品的详情页面,我们来看下效果 哦。嗯,我觉得还行,我们用浏览器来打开看一下,那这个就是他的页面首页,然后有个这样的图,有个这样的分类, 点进来是一个商品的列表页面,然后可以点击商品的详情页,然后这是促销,这是规格,这个是切换的图片,那是一个中规中矩的这个商品的页面啊。然后我们看一下秒杀页面 啊,秒杀,然后的话有个这样的倒计时,我觉得已经非常不错了,因为这个前提是我们是没有任何的这个要求的,只是让他一个平均值。比如说你如果 更懂一些设计的一些规范的话,你可以描述一下你这个页面到底大概是什么样子,你可以输入更多的这个参考,然后你可以让这个页面变得更好。他除了可以做这种网页的这个原型的话,你也可以去设计这样的 app 的 原型啊。比如说我今天拿它做了一个这样的小的这个测试, 比如说我现在生成一个修复老照片的这个一个这样的 app, 一个大概有六个页面啊,这边的话也是可以去自己去调整的, 有很多这样的页面啊,很多这样的效果也是做出来了啊,非常的不错啊,我是属于没有任何的这种设计的经验的,那除了去设计外部网页,还有这个 app 之外,你也可以去设计啊,比如说像啊、落地页啊,或者说换灯片啊 啊,比如说这也是可以去做晃动篇,也是非常不错的。那如果你想看一下别人是怎么做的,那这边有一个视例,这里面有很多这样的例子,有网页、有图片,也有这样的移动端、桌面端、晃动篇都有。那么你也可以去看一下别人的这个提示词是怎么写的啊?我们可以打开一个预览, 那么他这个就是一个页面啊,就设计设计这一个页面很多都是单页的设计比较少,这里面还有很多故事是在叠代中的,比如说我们刚刚设计的这个 官网,那这边的话其实还可以去导入这样的设计文件啊,或者说一些代码的目录啊,或者技能体系啊,那这些功能都是马上要上线了。 还有呢,比如说我现在要去调整这个页面的一些局部的一些设计的规范,那这边的话也有会制这个功能,也是要买还没有上的。那么还有一个我觉得可能会上的一个功能,就是 要导出这样的大局的设计规范,因为不可能我所有的页面都在这个设计工具里面去设计嘛,可能是要在我自己的这个编程体系里面,用这个统一的设计规范来生成。比如说在 google stitch 里面,你可以打开这个按钮,然后的话能看到你用过的这个设计规范, 然后这个设计规范是可以导出来放到你的这个项目里面,比如这个 design, md, 那 就是你用到的这个设计规范了,那这个就很方便我们在编程工具里面去使用这个规范来设计新的网页。那么你把这个原先设计出来之后, 那你需要去把它变成实际的产品,那这个时候你就可以去把它导出来,这边的话是可以导出为 html, 或者说导出其他的。但是对于我们来去变产品的话,目前是只能导出这个 html, 不 能导出图片。它这个元代码有个特色,就是它的样式都是 内联的,也就说它样式都写在页面上的,这对于我们进行一个转换,比如说我们要把 html 语言转换成 react, 或者是转换成 app, 那 么这个还原度是比较高的,因为它没有使用第三方的这种样式的框架,那这种转换是比较高效,比较 保真的,所以这是一个不错的点。 ok, 那 以上就是 open design 的 一个简单的一个感觉啊,我觉得它在原型设计阶段已经是一个非常有潜力的 ai 圆形设计工具,虽然说他现在缺少了很多功能,但是我觉得他很快就会更新上这些功能,而且能够集思广益,然后能产出更多更有意思的效果。 ok, 那 本期视频就到这,希望这个视频对你有所帮助。

大家好,今天给大家带来一份非常干的内容, skills 搭建超详细教程。不管你是测试工程师、开发还是 ai 应用爱好者,只要你希望在 ai agent 里真正跑起来,用起来,那 skill 这个东西你迟早得会。今天我用三种方式带你从头把 skill 搭明白,文章最后会附 md 文件,记得先点个收藏。 先说第一种方式,手写 skills, 这是最基础也是最扎实的方法。你需要自己创建目录,手写 skill md 文件,然后放到对应的位置去实测。手写又分为两种,一种是全局 skill, 适合放测试通用工具库,比如接口、测试模板、照数据脚本。 另一种是项目 skill, 针对你当前测试的项目,放专属的业务逻辑和用力手写的优点是可控、可定制,不依赖 ai。 你 对 skill 的 行为有绝对把控,适合核心敏感或者公司内部不能外传的测试能力, 对测试工作的帮助也很直接。你可以把重复性的测试步骤、常见的断言逻辑,甚至是环境配置全部封装成一个 skill, 随时调用,效率直接起飞。 第二种方式, ai 自动生成 skills, 这里会用到一个叫 skill creator 的 工具,你先安装好,然后告诉 ai 你 的需求,它就会自动帮你创建 skill 生成目录和 skill 到 md 文件。你只需要检查一下结果,再做个实测就行。这里有四个经验值得记住,需求描述尽量具体,提前设计出发场景。一个任务 skill skill 可以 持续迭代。 ai 生成的优点是快,你不需要记语法,不需要背模板,只要你会说人话, ai 就 能帮你搭出一个能跑的 skill。 对 测试工作来说,这个特别适合快速验证想法。比如你想测一个登录场景的异常流程,跟 ai 说清楚,几分钟就能得到一个 skill, 改一改就能用第三种方式直接使用开源 skill。 现在社区里已经有很多现成的 skill, 比如文档处理类之类等等。你可以在 cloud code 里安装 skill 插件,也可以手动安装,或者直接安装官方 skill 包。 skills 的 调用方式有两种,显示调用和影视调用,按需选择就行。开源 skill 最大的优点是不用从零开始,你站在别人搭好的地基上,改改参数,调调逻辑,就能适配自己的测试任务。 对测试工作的帮助是,你能快速引入成熟的测试能力,比如 pdf 解析、 excel 比对、日式分析这类常用场景。开源 skill 往往已经做好了,拿来就能用。最后给大家做个简单小节手写,适合深度定制,掌控力最强。 ai 生成,适合快速起步,门槛最低。开源 skill 是 适合站在巨人肩膀上,效率最。

在之前视频中我已经介绍了什么是 scales, 并且通过命令行界面演示了它的基本使用方法。很多朋友反馈说,虽然 c l i 命令行模式很强大,但有没有更直观、更容易上手的方式?本期我将带大家使用 open code 桌面板,用格式化的方式来创建和使用 scales。 这种方式不仅界面友好,操作也更加清晰,特别适合刚入门或者是喜欢图形化操作的朋友。我们先来看一下我们本期的主要内容。第一部分就是桌面端的安装与出体验,我会带大家一步一步地去安装并使用,熟悉界面。 第二步就是深入理解 scales。 在 这里以天气查询为例,我将通过一个实际的例子天气查询 scales, 带大家直观地感受 scales 的 作用。 三部分就是动手创建属于你的第一个 scales。 在 这里我们以写作助手为例,带大家一起体验中文提示词,创建自己的专属 scales。 第四部分就是目录的结构与命名规范讲解, 会分享一些其他工具的命名规则。好,现在我们先来看。第一部分就是安装与出体验,在这里仅需三步就可以搞定。下面我们来到官网,然后选择这里, 这时候我们就看到了它有终端,有桌面板,还有这个拓展,在这里我们选择桌面板,这里选择自己的系统去下载就可以。这里我们以 windows 为例,我们直接选择,我们保存到本地之后,就会有一个这样的安装包,然后我们双击打开,然后我们直接选择下一步。 这里大家可以设置一下安装路径,我这里就默认安装到了 c 盘,然后直接选择下一步,然后我们再选择下一步, 这时候就安装好了,然后我们直接选择完成,这时候就会自己打开初步化界面,然后我们在桌面上新建一个文件夹,直接命名为 file 好 了,然后我们再回到 open code, 然后我们选择打开项目,我们选择桌面上的 file 文件夹,然后选择文件夹。 现在我们来认识一下这个界面,它的界面也是非常简洁的,左侧就是我们的绘画记录,就是我们每次绘画在这里都会显示绘画列表,然后中间这一栏就是我们 ai 对 话的区域, 然后指定框下面这里我们可以去选择模型,它有一些免费的模型去供我们去选择。然后第三列,这里就是如果我们创建 g i t 仓库之后,就可以实时的看到文件的一些修改变动。 然后第四部分,这里就是显示我们的文件列表,就是我们打开项目之后,我们项目里面有哪些文件,都是在最右侧这里显示,这就是它的界面功能的一个导览。 然后我们再看下一章节,就是深入理解 skills, 在 这里我演示一下天气查询的 skills, 在 没有配置 skills 之前,我们先来尝试一下,比如我们问他北京天气,然后我们直接发送 好,这时候回答我们了,可以看一下它的获取方式,是通过网络搜索添加一个 scales, 我 们再来看它的变化。现在我们来到刚刚创建的这个文件夹里面,我们来创建放置 scales 的 目录,我们第一层就是要输入点 open code, 然后 open code 里面再新建一个文件夹,这时候我们命名为 scales, 然后这个 scales 里面我们要放置查询天气的技能,可以看一下,我已经粘贴了过来, 然后我们再回到 opencode, 这时候我们再回到 opencode, 把刚刚第一次的对话删除掉了,担心它有缓存,在这里我们再问它北京 天气,然后我们直接发送,可以看一下它这里已经调用了我们刚刚放入的 scales, 就是 查询天气的 好了,这时候它就查询出来了,可以看一下。一开始我们第一次查询,它显示的是通过网络搜索,这时候我们放入 skills 之后,它直接就会调用我们这个 skills 技能,然后帮我们去查询天气,这次就不是通过网络搜索了,而是通过 skills 查询。 好,下面我们进入第三小节,下面我将实操分享,就是创建一个邮件写作的 skills, 在 这里有一个重要的前提,就是我们需要先将创建 skills 的 技能放到我们的 skills 目录里面, 放入之后它就可以像查询天气一样去调用创建的技能,自动去创建。下面我们直接进入实操环节,我们一起来看一下, 在这里我们还是打开这个 file 文件,然后点 open code, 然后 skills 里面,然后我们把创建 skills 的 技能粘贴过来,像这些技能大家都可以去搜索去找到。我们放到这个 skills 目录之后,然后我们再回到 open code。 在创建之前,为了让大家更清楚的了解,我们先来看一个案例,我们以这个为例,就是我们在平时让 ai 帮我们创作的时候,就是每次创作我们都要给他特别长的提示词,而且每次都要把要求重新告诉他, 然后我们这次就是要把我们经常用的这个题日词给它创建一个 scales, 后面我们就可以重复使用,不用再去输入特别长的题日词。下面我们直接把这段内容复制一下,就是这段题日词, 然后我们回到 open code 这里,然后我们选择粘贴,再给它提示词,帮我把以上提示词做一个 scales, 每次当我给你产品名称和 写邮件内容的时候,你就调用这个 skills, 然后我们就直接发送 好,这时候就帮我们创建完成了,就是我们使用的时候仅需提供给它产品名称,目标用户群体,还有产品核心卖点,还有公司名称,在这里我们新建一个绘画窗口,然后我们把它需要的内容提供给它,我们直接粘贴过来, 在这里我们给他产品名称,目标用户群体,产品核心卖点,还有公司名称,然后我们告诉他帮我写营销邮件,然后直接发送 好了,这时候就帮我们生成了。之前我们要实现同样的内容创作,我们需要输入一大长串的提示词,在这里我们仅提供我们主要的内容,然后告诉他帮我写营销邮件,他就可以帮我们去生成, 然后写完之后带上公司名称,它是严格遵守我们的提示词要求的,这时候就是这个 scale 的 一个作用,它是可以附用的,还有可以告别重复输入一长串的提示词, 在这里还有一个注意事项,就是大家创建好了这个 scales, 一定要重启一下这个 open code, 它才能去识别我们已经创建好的技能,到这里就是利用 open code 的 使用和创建 skills 的 全流程, 下面我们再来看一下第四部分,就是项目结构与命名规范,只有正确的创建目录层级才能识别到我们的 skills, 在 这里我们可以看一下第一个 open code, 第一级目录就是点 open code 命名,然后第二级目录就是 scales, 然后第三级目录就是 scales, 里面放的就是 scales 名称,比如 ai news, 然后这个文件夹里面放的就是 scale, 点 md 就是 scale 的 内容。如果大家用的是 ai 编程工具这个 tree, 第一级目录就是点 tree, 像这个其他的二级、三级还有一些目录层级都是一样的, 那么我们如果使用的是 colode code, 那 么第一集目录命名就是点 colode code, 像这些目录命名只有第一集它是有区别的,其他的都完全一样,这是关于这个目录的命名规范。 好了,这就是我们本期的所有内容,现在大家就可以去动手把自己经常使用的一长串的题日词封装成自己的可附用的技能,可附用的数字资产,下期我还会分享更简便的使用 skills 的 方法。好了,本期内容分享就到这里,我们下期再见。

大家好啊,我是小陈。那本期视频我们分享 hermes 的 一些使用教程,包括如何快速安装配置网页 ui, 讲解它的核心文件如何配置,微信以及了解大家说的 hermes 能够自动净化是什么意思。最后再来聊一聊 opencloud 还是 hermes, 我 的个人看法, 那本期视频比较长,建议点赞收藏。话不多说,我们现在开始,首先是快速安装,我们来到他的项目官网的内容其实很简单,只有一个安装命令和配置命令。 复制安装命令,打开终端,按回车就能够执行安装了。不过在执行之前,我们先来看一下他的官方文档, 点击快速开始。那这里提示, linux、 mac os 和 wsl 都可以通过这一条命令来一键安装,但是呢,它是不支持原生的 windows 系统的,需要先安装 wsl, 然后从这个软件中运行 hermes agent。 那它唯一的一个依赖条件就是需要先安装一下 get, 其他的依赖比如像 node js, python 等等,它会自动检查版本,并且自动安装依赖。如果你的系统之前没有下载过 get 的 话,可以直接通过 get 的 官网下载一个安装包进行安装。 另外一种更简单的安装方式就是如果你之前有安装过 open cloud, cloud code 或者 code text 等其他的 ai 文件的,直接把这个官方地址丢给他,让他帮你去安装和配置,出现了问题也能够自动地检查,自动地调试。 安装的过程我这里就不展示了,需要你添加一下大模型的 api, 然后快速设置一下。安装好了之后,在命令行输入命令,和 miss 进入对话窗口, 那我这里已经进入了和 miss 的 对话框,那上面的话显示的是内置的工具包和 skills, 但是呢,看不太清楚,那默认的字体颜色和我的这个白色背景的终端有点冲突, 所以会导致这样的一个问题,如果你的终端和我一样都是默认的白色的话,可以输入斜杠 s k i n skin 命令,它有一些皮肤可以选择,比如像 daylight 和 warm 都是适配浅色模式的, 我们输入命令斜杠 skin 加皮肤名称,然后回车直行就可以了,按 ctrl 加 c 退出,然后重新进入一次, ok, 那 这里就没有问题了。 第二个我让他改的就是让他把 hermes 这个启动命令改成 her。 看过 her 这部电影呢,可以扣一个一,它有一个比 open color 好 的地方,就是它会在终端展示工具的调用步骤,进行了哪些操作,能看出它在干啥,进入到什么阶段了。 那这里展示的呢,就是当前的一个模型,以及使用的 talk 树上下文的上线,以及当前的绘画时间。 任务执行结束,他这里告诉我把 hermes 的 这个命令调用给删除了,保留了 her。 但是我实际希望的是两个都要,需要再把 hermes 给加回来,等它完成之后,我们再次按 ctrl 加 c 退出,尝试使用 her 命令,看看有没有生效。 退出绘画的时候,他的结尾会展示一个命令,他是告诉我们如何回到这个绘画。那后面接着呢,是塞上 id 这里输入赫,然后复制后半段,这样的话,那前面的绘画就还在,就可以继续之前的对话了。 第二步,配置网页 ui, 在 官方的项目仓库里面只有 t o i 对 话这一种方式,它还有一个命令,叫做 hermes dashboard。 opencloud 也有一个 dashboard, 但是这个不太一样,我们运行之后会自动打开这个地址。 它更像是一个管理面板,展示当前的一些状态,比如当前的版本,网关以及最近绘画等等。它的默认语言是英语,可以在右上角点击进行中文切换, 这里可以查看所有的历史对话记录,每一个对话都是比较详细的,包括 hermes 在 运行过程中的思考以及使用的工具等等 分析,这里可以查看一共产生了多少 token, 还有日历记录,技能和配置等等信息非常全面,而且很清晰,比 opencloud 的 面板要清晰很多。但是呢,它不是一个对话的页面, 我们可以去安装一个社区的第三方外部 ui, 它就会有一个比较好看且方便的对话界面。大概是这个样子, 我们来到这个项目的该他不页面那往下滑会有一个快速启动,我们需要克隆这个仓库地址,然后启动这个拍摄程序。我推荐直接复制这个仓库的链接,让和米斯直接运行,然后告诉你打开哪个地址就可以了。 那我这里已经安装好了,我们直接来设置一下。点击左下角的 web ui, 这里面有一个批号设置, 可以选择默认的对话模型。发送快捷键,这里强烈建议改成 ctrl 加 alt 才发送,那 mac 上对应的就是 command 加 alt, 如果不改的话,那在输入框使用中文输入法下输入英文字母,那按回车确认的时候,它就会直接发送出去。 点击主题,可以切换不同的样式,那下面的几个框框我建议全部都勾选上,比如通知声音、显示图片数量以及显示 ci 对 话等等,这些都是我觉得比较实用的设置,但是他在初设设置中都没有选,那改完之后,我们需要在最下面点击一下保存 下方的对话框,可以上传附件语音输入以及选择工作区空间。那默认的呢?是单独的 workspace, 并不是 hermes 的 workspace, 点一下可以选择工作区路径,但这里呢又看不太清楚。可以点击管理特别栏呢,这里能够输入 hermes 的 整个项目目录,就是用户名下的点 hermes 的 文件夹,然后就是模型选择,它可以检测你本地的其他 aia 检测。那我这里面有 codex, 它这里就可以直接调用 左上角的其他设置,比如对话、定时任务、 skill、 个人记忆,那这个记忆呢,是它根据对话自动生成的,你也可以在这里面直接编辑加一些画像或者要求。右边的这个 workspace 映射的是本地的工作目录,我觉得这个是很方便的,可以直接找到一些 markdown 文件,比如 so, 点 md 等等,直接看可以直接改,非常方便,不需要你本地再安装一些比如 vs code 这样的代码。编辑器 中间呢就是对话区域,可以直接编辑问题并且发送,那他在回答的时候会展示思考过程,并且响应也是比较快的,回答完毕之后会有一个提示音。 在发送框的这里,他是展示了当前的一个上下文使用量,并且是达到百分之五十。 talk 的 时候呢,会进行一个自动压缩,这一点也是比 open class 好 的地方。 接下来我们来配置一下社交渠道, hermes 呢,接入的社交渠道也是比较多的,虽然比不上 openclaw, 但是常规的都支持,比如飞书、 tg, 以及最近刚刚支持了微信 所有的配置都可以通过自然语言对话的方式和 hermes 提要求。我这里来演示一下微信的接入,关于 tg 和飞书,大家可以去看我之前关于 openclaw 的 配置,有非常详细的介绍。打开终端,使用命令 hermes getaway setup, 那它会出来很多的渠道选项,键盘的上下可以选择空格键和回车键。是确认,那我们选中倒数第四个微信,然后摁回车。是否开启二维码登录,输入 y 代表 yes。 我 们需要把这个链接放在浏览器中,用手机微信扫描这个二维码, 扫完之后就会进入到下一步。那这些呢?都选择它推荐的就可以了。是否使用这个微信账号作为 home channel? 选择 y, 这里直接回车确认 down, 然后是否安装 get 位网关,输入 y 是 否现在启动服务,选择 y, 微信扫码之后的第一句对话,他会要求你输入一个配对码和命令。那我们需要复制一下,在终端执行,那直接复制过来,左右两边都会有这个单引号,需要删除, 那正常情况下面令执行完就配对成功了。那我这里可能是之前配对过,又删除又重新配对,所以有这个 bug, 但实际上是已经可以通话了的,可以问一些简单的问题。那他的回复也是支持马克纳确认的, 我让他写一篇笔记到 obsidian 中,内容是关于 hermes 如何接入微信的,上面显示输入中,就说明他一直在工作。那等待了一段时间之后,他看到我 obsidian 数据库里面有关于 ai 输出内容的要求, 所以他了解了这个信息后,移动了文件的位置,那这点还是挺不错的。最后他输出了一个汇总,汇报任务已经完成了,以及主要的内容是什么。他这里应该是用到了 web search 的 内置工具以及 obsidian 的 skill。 我 们打开电脑的 obsidian 来看一下,内容还是比较详细的,包括原理、操作步骤和功能特性等等。 接下来我们了解一下 hermes 的 核心文件,那用过 opcode 的 都知道,它有一大堆的 markdown 文件管理配置,在新对话的时候全部都注入进来。那 hermes 也有四五点 md, memory 点 md, 它们的区别是什么呢? opcode 的 markdown 文件很多,比如四五点 md, user 点 md, nj 点 md, memory 点 md, 还有每日的日制管理的非常细,所以每次对话都会加载很多的上下文出来,并且时间一长,上下文就越来越多。 我之前说过一期关于 opencloud 的 踩空问题,就吐槽过 opencloud 的 记忆问题,要么记不住,要么就记乱了。 hermes 的 方案则更简洁,它也有受点 md、 user md 和 memory。 md 也放在 memories 里面, 内存启动时也会直接注入,但是它的记忆是有容量上限的,上限是三千二百七十五个字符。在 config 配置文件里边能够看到,它的目的就是为了控制上下文的长度。那它这个记忆配置到底是什么意思呢?可以让 hermes 自己来回答。 二二零零是长期记忆的总字符上线超出后他会自动清点,那一三七五就是用户画像的字符上线,并且每十轮对话就会强制的沉淀一次,所以有两个很明显的好处,第一个就是记忆是有上限的,不会无限膨胀, 第二的话就是会不断进步,每十轮对话就会强制呈现一次,所以 n 键头会越用越了解你,并且不会浪费很多的 token 在 上下文中。 另外呢, hermes 用 circlelight 数据库配合权威解锁,它会把所有的历史对话记录都存下来,需要使用的时候直接通过搜索来召回。所以你可以在管理面板里面能够看到所有的历史对话记录,并且能够具体看到当时 agent 调用了什么工具, 那在 opencloud 里面绘画丢失了就很难找回来,所以 hermes 在 这方面我觉得是做的比较好的。 hermes 在 启动的时候就会展示它有非常多的内置工具和 skills, 一 共大概有二十七个工具和七十九个 skills, 所以 基本上能够做到开箱即用,不需要你再去安装额外的工具。 它有一个官方的 skills 网页,介绍了所有的内建 skills 和其他可选的 skill。 左侧这里做了分类,比如和编程相关的,研究相关的,还有很多和游戏相关的 skill。 如果你想安装的话,那点击每个卡片就会有一个一键安装的指令,可以直接复制到终端执行。 不过这些 skill 是 没有下载量和安装量这些数据的,以及有没有安全审查也不知道,但是对于 nint 来说, skill 都是通用的 open cloud cloud code 的 skill, 那 hermes 也能够直接拿来用。比如就找到 skill 的 github 仓库, 用 npx 命令直接安装。如果你安装的是全局的 skill, 那 电脑上所有的 int 它都能用。最简单的安装方式依旧是通过自然语言对话的方式复制这个仓库地址,让 hermes 来自己安装。 hermes 的 一个亮点不是 skills 的 安装和使用,而是它可以自动进化,并且能够根据使用经验和使用次数来自动生成需要的 skill。 什么是自动进化?依旧是让 hermes 来根据自己的文档来告诉我答案。第一就是可以自主地创建 skill, 当它发现一个复杂任务,并且之前没有现成的 skill 能用的时候,它就会把本地经验自动封装成一个 skill, 下次再执行类似任务的时候就能够开箱即用。 第二, skill 在 使用中自我改进。如果现存的 skill 执行效果不好或者失败了,那它就会自动修复步骤,补充坑点以及更新命令。 第三是记忆系统的周期性自我提醒。第四是用户模型的持续加深。第五是行为精准测试加自我优化。我们来体验第一个自主创建 skill, 我 这里直接给了他一个任务,让他写一个 python 脚本来监控 hermes 的 官方 github 仓库的 pr 变动情况。当有新的 pr 提交时,检查内容,并且用中文输出到 obsidian 指定的文件目录,因为是让他使用了计划方案的 markdown 文件, 那有一些需要我确认的地方,也会停下来和我提问,确认没有问题之后,就会开始编辑脚本,编辑之后它会自动执行一遍,并且告诉我执行的结果。那下面会有一个提示,这是一个全新的场景,是否需要创建一个新的 skill? 那 这样下次就能够直接使用和迭代了。 在创建新的 skill 之前,需要先来检查一下它的任务完成到底怎么样。在指定的本地目录确实有了这么一篇 pr 更新网址,内容还是比较详细的,但是它没有遵循我们使用中文输出的约定。 那所以在对话框中要说明一下当前的情况,第一需要创建一个 skill, 第二它没有使用中文翻译过来,需要优化一下 它。这里是先是给了翻译的方案,直接调用接入的大模型进行翻译,直接集成在脚本里面。那具体的步骤我这里快进一下,主要就是自己去验证 api 是 否接通,自己测试,自己去写 skill。 最后的结果就是 skill 创建完了,翻译的 api 也接入了,并且实际的投款其实消耗没有很多,我们还是先检查一下作业那文档这里改用了中文的描述, 然后到工作目录这里,它应该是生成了一个 python 的 脚本文件和一个 skill, python 脚本没有问题,备注也是比较详细的。那其实我自己不懂带吧,只看得懂备注。第二个就是刚刚生成了这个 skill, 叫做 github pr monitor, 使用场景就是监控指定的 get up 仓库的新 pr 自动翻译和描述内容,写入 obsidian 的 知识库,内容是比较详细的,遇到哪些问题,怎么解决的以及注意事项都有,那我们这里其实就验证了,它确实拥有可以自动生成 skill 的 能力。 如何把 openclaw 迁移到 hermeshermes? 其实很鸡贼,只需要一行命令就能够迁移你在 openclaw 里面安装的 so skill, 以及整合 so dmd 和 memory 这种核心文件,直接在终端输入命令 hermesclaw migrate。 那 这条命令执行之后呢?就会直接地执行迁移,但是先在执行之前,在命令后面加上 drive run 这个参数。 我们先来看一下哪些可以迁移,哪些不需要迁移。如果想要包括 api k 的 完整迁移,可以在后面加上参数 preset for 就 行了。 那它的迁移也不是简单的复制粘贴,而是会阅读理解你在 openclip 中的所有文件, memory 文件重新解析,然后整合在一起,那这个过程大家可以自己去试一下。 最后一个问题是关于 openclaw 还是 hermes 的, 其实我的 openclaw 已经歇很长时间了,因为它最近的几次版本更新,每一次都有新的问题出现, 很多经历都在处理新问题上,而不是处理我的工作。还有一些老生常谈的问题,比如网关断联,写入了规则不执行,或者上下文压缩等等问题, 那 hermes 好 像是把这些问题解决了一些。那从上面的内容也能够看出,它的逻辑就和 openclaw 不 太一样, 它的记忆文档只有三千多个字体,那剩下的呢?全部都用数据库保存,它能够自主创建 skill, 并且每一次根据执行的效果来优化和迭代 skill。 那 上下文的压缩之后,也能够找得到原始的对话,还有一些功能视频没有演示到,比如赫密斯的安全性应该是要比可口可乐强的。 openclaw 的 权限管理一直是一个大问题,那 hermes 它会审查高风险的操作并让人工审批,并且支持刀客 ssh 远程占用的内存其实也是比较小的。如果你的 openclaw 使用是很顺手,那我觉得没有必要迁移。 但是如果你也遇到了很多问题和我一样,那其实是可以尝试使用一下 hermes, 说不定它能够给你一些惊喜。 好了,那以上就是本期视频的全部内容,我会把本期的内容整理成一篇文档,如果你需要的话,一键三连,记得私信我 her miss, 我 会自动给你发送。那我们下期再见,拜拜!

为什么很多团队把 skill 写的很长,效果还是不稳?问题往往不在于模型,而在于写法。一上来就把事情拆成第一步、第二步、第三步,恨不得把每个动作都提前规定死。这种写法看上去很完整,但是其实用起来很脆弱。任务一旦复杂起来,用户只要一变着法说,或者说中间多了几个约束,它就很容易乱掉。 所以说,今天我画的这张图呢,想讲的重点不是怎么把 scale 写的更长,而是先把边界写清楚。最容易出现问题的地方就是把 scale 写成一张固定的流程单。总觉得只要你的步骤列的足够的细,模型就会听话。 但是开放任务它不是流水线,真正该先定的是任务的边界,什么情况该接,什么情况下不要碰,做到什么程度才算结束。这三件事情清楚了,中间怎么走,可以让模型自己根据上下文去安排。再往下呢,就是工具的边界, 不是说工具越多越厉害,而是工具之间别打架,名字也别太像,职责别重叠,让模型在关键的节点尽量不要猜。很多时候系统不稳,不是因为能力不够,而是因为工具太乱了。 第三层呢,就是事实边界,这里也不是往里塞一堆背景知识就行了,而是要告诉他遇到关键的事实,该去哪里查,查不到应该怎么办,哪些动作不能够自己往下做,必须要等人去确认。说白了,好的 skill, 它不是把路径全都斜死,而是把边界立住。 最后总结了一个在设计 skills 的 时候的自查表,每次你要想写 skills 的 时候,你就先查一下这五条,第一个什么时候出发,什么时候结束,最小的工具级是什么? 真相要去哪里合验哪一步必须等人拍板才行。把这几件事想稳了,你所做的这个 skill, 它才会稳定的运行。如果这期视频你有用,记得点赞关注,我们下期再见。

大家好,今天给大家带来一份非常干的内容, skills 搭建超详细教程。不管你是测试工程师、开发还是 ai 应用爱好者,只要你希望在 ai agent 里真正跑起来,用起来,那 skill 这个东西你迟早得会。今天我用三种方式带你从头把 skill 搭明白。文章最后会附 md 文件,记得先点个收藏。 先说第一种方式,手写 skills, 这是最基础也是最扎实的方法。你需要自己创建目录,手写 skill md 文件,然后放到对应的位置去实测。手写又分为两种,一种是全局 skill, 适合放测试通用工具库,比如接口、测试模板、 照数据脚本。另一种是项目 skill, 针对你当前测试的项目,放专属的业务逻辑和用力手写的优点是可控、可定制,不依赖 ai。 你 对 skill 的 行为有绝对把控,适合核心敏感或者公司内部不能外传的测试能力, 对测试工作的帮助也很直接。你可以把重复性的测试步骤、常见的断言逻辑,甚至是环境配置全部封装成一个 skill, 随时调用,效率直接起飞。 第二种方式, ai 自动生成 skills, 这里会用到一个叫 skill creator 的 工具,你先安装好,然后告诉 ai 你 的需求,它就会自动帮你创建 skill 生成目录和 skill 到 m d 文件。你只需要检查一下结果,再做个实测就行。这里有四个经验值得记住,需求描述尽量具体,提前设计出发场景,一个任务尽量只用一个 skill, skill 可以 持续迭代。 ai 生成的优点是快,你不需要记语法,不需要背模板,只要你会说人话, ai 就 能帮你搭出一个能跑的 skill。 对 测试工作来说,这个特别适合快速验证想法。比如你想测一个登录场景的异常流程,跟 ai 说清楚,几分钟就能得到一个 skill, 改一改就能用第三种方式直接使用开源 skill。 现在社区里已经有很多现成的 skill, 比如文档处理类等等,你可以在 cloud code 里安装 skill 插件,也可以手动安装,或者直接安装官方 skill 包。 skills 的 调用方式有两种,显示调用和影视调用,按需选择就行。开源 skill 最大的优点是不用从零开始,你站在别人搭好的地基上,改改参数,调调逻辑,就能适配自己的测试任务。 对于测试工作的帮助是,你能快速引入成熟的测试能力,比如 pdf 解析、 excel 比对、日式分析这类常用场景。开源 skill 往往已经做好了,拿来就能用。最后给大家做个简单小节手写。适合深度定制,掌控力最强。 ai 生存适合快速起部,门槛最低。开源 skills 适合站在巨人肩膀上,效率最高, nice。

剪映 skills, 你 现在呢说一句话就可以自动的去剪视频了,我们这个文档呢,今天呢给大家做了一个更新,包括这里的安装教程,环境配置如何使用,案例的展示,最主要的呢就是这个如何去使用 好,咱们来看一下,当你安装好这个 skills 之后,如何去用呢?对吧?怎么让它去剪视频呢?主要分为两步,第一步呢就是让 ai 了解这个 skills 的 底层原理,下面呢有一段题词,你直接把这个题词呢给到你的 ai 工具,比如说小龙虾,对吧?都是可以的。 然后呢把这句的这个位置给他改一下,改成你自己的 skills 的 存放位置,学习之后呢再让他去生成具体的剪辑任务的 skills, 然后呢下面这段题词直接给到他,然后呢把这里的基础信息这里修改一下,然后素材的信息改一下,改成你自己的素材文件夹的一个位置啊, 然后呢这里的剪辑逻辑改一下,也就是你想让他如何去剪辑视频,对吧?这一点也是很重要的。另外呢就是样式的设计,比如说你的字幕 对吧?你的标题的这个字体颜色这里啊你需要去修改一下,其他的呢基本上就不用去动了。下面呢具体的剪辑效果呢,给大家列了几个案例啊,比如说有产品的婚检,把所有的素材都放在文件夹里面,让他去按顺序或者说随机去抽取,都是可以的。 然后具体的这个剪辑逻辑这边呢有视频的这个案例,另外呢就是这个片段的提取也是可以的,比如说两个小时的视频,你让他提取里面的特定的内容,这个都是可以实现的。包括这个视频的这个口播视频去口误和停顿, 大家就使用这个这个剪辑的逻辑。然后这边呢有案例这个文档呢,现在去剪辑一些特定这个固定流程的,或者说比较简单的这种视频的形式还是非常好用的。好需要这个文档呢?直接说一下。

在上一集讲解了三层记忆,从鲸鱼到老友。本集我们讲解 skill 系统会自我进化的能力,如果记忆解决的事,知道什么 skill 解决的就是怎么做。 openclaw 的 skill 更像手工维护的说明书。 hermes 的 skill 则会自己长出来,自己用起来,还会在使用中继续变好。它会在完成任务后自动提炼经验,在跨绘画的问题里积累做法,再根据反馈持续优化。 这个差异决定了两者完全不同的使用体验。先看定义,在 hermes 里,每个 skill 都是一个独立的 markdown 文件,保存在 hermes skills 目录里,记录的是 agent 做事的方法, 你可以把它理解成教同事做周报,第一次要手把手说明,第二次还得提醒细节。到了第三次,它基本就知道该怎么做了。 skill 有 三种来源, 第一种是安装时自带的 bundled skills, 覆盖 m lops、 地摊 up、 工作流、调研,这类常见场景现在已经有四十多个。第二种是 skills hub, 也就是社区贡献的能力包,可以一键安装,持续增长。第三种是 a, 整治,自主创建,它会在复杂任务结束后自动把解决方案提炼成 skill, 而且会随着使用继续积累。斑驳的 skills 解决的是起步, skills hub 解决的是加速,而真正最有杀伤力的,是从你的任务里自然闯出来的自主 skill。 hermes 的 skill 不是 封闭生态,而是采用 agent skill stop i o 这个通用标准。这套标准已经能被三十多种工具识别, 包括 cloud code, cursor co, pilot 和 gemini c i。 所以 skill 不是 绑死在某一个工具上的私有资产,而是可以迁移附用继续演化的能力资产。 这更像 usb 接口,而不是每个平台都要重写一套的 app store。 如果你已经在 cloud code 里积累了某个 skill, 可以 直接带到 hermes 里继续用。反过来也一样。 hermes 和其他 skill 系统最大的区别不是有没有 skill 文件,而是 skill 会不会继续进化。 传统 skill 写完之后效果不好,就得人工回去改,所以它本质上还是静态说明书。 hermes 把 skill 放进学习循环里, 先按照 skill 执行任务,再把用户反馈记录到绘画记忆里,然后分析反馈,自动修改 skill 文件里的相关步骤,下一次直接用新版本继续执行。所以它不是静态模板, 而是一个会根据实际结果不断调整的活能力。这有点像 mitchell hasimoto 用 code code rules 和 code nd 不 断打磨工作方式。只不过 hermes 把这件事自动化了。 open claw 和 hermes 的 差别首先体现在创建方式上, 前者更依赖人工编写 solo mb, 后者既能人工写,也能让 a 整自治主。创建维护方式也不同, openclo 主要靠人手更新, hermes 则是在自动进化的基础上,在允许你随时人工干预,个性化能力更是两条路线。 openclo 更像通用模板, 用户 fork 之后再次定义 hermes, 则会从你的使用习惯里自然生长。两者在标准上是互通的,都走 agent skill stop io。 但生态规模暂时不同, cloughhub 已经有四万四千多个 skill, hermes 现在是四十多个预值 skill, 再加持续增长的社区生态。 openclaw 的 优势是规模大、透明度高, hermes 的 优势是适应性强。同一个编码 skill 给 python 开发者和 rust 开发者各用三周,最后长出来的版本很可能完全不同。所以这不是替代关系, 你完全可以把 curl up 里的 skill 安到 hermes 里,再让 hermes 继续把它打磨得越来越像你自己的做事方式。真正能看出差异的是这个日常场景。你每天都让 hermes 帮你整理昨天的 get up 通知,按重要程度排序,把 pr、 issue 和 discussion 分 开,还要忽略 bot 的 自动提醒。 如果这个需求稳定出现几次, hermes 就 会意识到这不是一次性请求,而是一套可以附用的方法。于是他会在后台生成一个新的 skill, 比如 get up daily digest。 这个 skill 会知道什么时候该被调用。比如用户提到 gitap 通知,每日总结这类关键词,也会记录具体步骤。比如调用 gitap mcp, 获取过去二十四小时的通知,过滤 bot, 按类型分组,再按重要程度排序,最后用简洁列表呈现。 这样以后你只要随口说一句,看看 gitap hermes 就 知道该做什么,而且会越来越贴合你的偏好。 skill 不 只是被创建出来,然后静止不动,它也有自己的生命周期。 最开始是油芽阶段,从一次复杂任务里被提炼出来,接着进入成长阶段,在重复调用里逐渐稳定。在往后式进化阶段,它会不断吸收、反馈、修正细节,最后进入成熟阶段,变成稳定可靠的核心。能力。 周期越长, skill 越强,这就是 hermes 飞轮效应在能力层面的体现。当然,自改进不是魔法,它有前提, 明确的反馈、持续的使用、一致的偏好、建设性的修改,都会帮助 skill 沿着正确方向变强。反过来,模糊的反馈,使用频率太低、偏好反复变化,长期不审查都会让他学偏,甚至越学越乱。所以好的反馈本质上就是好的进化方向, 只有你把需求和偏好说清楚,他才有可能真正变得懂你。这一集想说明的不是谁替代谁,而是能力是怎么形成的。 open crawl 更像人造能力,你来设计、编辑、维护。 hermes 更像自我进化能力,他会观察、学习、进化。 而 agent skills、 dot io 这套标准,又让这两条路线能够互通共享。 skill 本质上就是 hermes agent 的 程序性记忆,记住了怎么做,他才有可能把一件事重复做好。这一集先把 skill 系统拆开了, 下一集继续看 hermes 靠什么真正把事情做成。四十多个内置工具, m c p 扩展则 agent 并行,还有工具权限与沙箱约束会一起把能力借到真实世界,当会学、会记、会做,再加上会执行, hermes 的 完整形态才真正拼起来。

hello, 大家好,最近很流行把自己的同事、老板、前任,甚至是一些名人真留成 skill 来提取他们的技能和经验。然后我发现卡姿克老师把他自己写公众号的 风格和要求真留成了一个开源的 skill, 叫做卡姿克风格 d s。 我 很好奇,就去下载了这个 skill, 这就是卡兹克老师的公众号长文写作 skill, 叫做数字生命。卡兹克的公众号长文写作 skill, 他 把他写公众号,写长文的一些核心价值观要求,写公众号的一些步骤,以及他对公众号要求的一些 语言风格和公众号里面绝对禁区的要求全部都梳理出来,形成这个 skill。 这它这里面还有一个自检体系,就是对它写的这个文章公众号有一个自我检测的体系。 当然看了这个 skill 以后,我就下载了这个 skill, 并且让我的龙虾用这个 skill 给我生成了一篇我想写作的公众号文章。 但是写完以后,我发现它的这个公众号文章生成实在是太卡兹克了, 完全跟我之前的写公众号的风格非常不一样,所以我就想着能不能把它这个 skill 变成属于我的 zero 写作风格。卡兹克老师的这个写作 skill 喂给了 cloud code, 那 cloud code 在 读完这个 skill 以后, 把这个 skill 分 成了框架层和表达层,告诉他在表达层这一块,把它一个类似于跟程序员聊天的这种语言风格来变成像一个研究者、思考者,甚至是一个咨询顾问的这么一个相对严谨、克制一点的这个咨询风格。 他保留了他整个写作的框架,在语言风格上进行了修改,过后呢,他给我生成了一版按照我的语言风格要求来写的一篇公众号。在这个过程中呢,我会把我的语言风格,把我的要求不断地跟 cloud 去沟通, 让他去理解我的语言风格,理解我的表达习惯,最终把我的语言风格和表达习惯融入到这个 skill 里面。修改过后的这个 skill 进行重新命名,那我把它命名成 zero right skill。 当然这个是在卡兹克老师常温写作的 skill 的 基础上修改的,只用于我自己使用。所以今天想跟大家分享的一个一个核心就是我们在看到自己比较喜欢的一个 skill, 但是对 skill 中的某一点或者是某一方面 呃有自己的想法以后,其实是可以根据自己的想法来修改,让这个 skill 我 们用起来更顺畅,更符合自己的要求。好了,这就是今天要跟大家分享的内容,就到这里啦,拜拜。

兄弟们,发现一个非常好用的 skills manager, 这个呢就是专门管理电脑上的所有的技能的,不论是你的小龙虾, oppo 可乐,还是现在的爱马仕,他们的技能呢,现在非常多,你电脑里面越用越多,积累的越多,到时候呢,你不知道如何管理呢?现在呢这个小工具呢,非常方便, 所有的技能全部在这个框里面一键管理,非常非常哇塞,你看还包括这些编程类的,这 ai, 不 管是 cloud code 还是 code desk 还是 tree, 还有这种龙虾类的产品,所有的只要你电脑上安装的技能,他都能一键拉取,并且统一管理,非常方便。那这个技能呢,其实非常简单,我已经把它打包到这个文档里面了,你看有 windows 版的,有这个苹果版的,全部都给你下载好了,需要的说一下,免费分享给你。

一个文件让 ai 少写百分之八十的无用代码,已经在 github 上拿下五十五 k 星标。有人把 ai 大 神卡帕西的编程哲学直接封装成技能,你不需要重新训练模型。这个 skill 文件能改变 ai 的 做事方式。卡帕西用四条原则解决 ai 失控问题。 think before coding, 让 ai 不 确定就问,不要猜,不要默认用户想要什么。这里从源头上打断 ai 幻觉链条。 simplicity first, 让 ai 用最少代码解决问题,不写未来功能,不做假装高级的抽象。让 ai 能五十行解决,就别写两百行。 surical changes, 让 ai 只改必须改的地方,不碰无关代码,不顺手优化,让 ai 做到每一行改动都必须能解释为什么改。 goal driven execution, 让 ai 把任务转成可验证结果,用结果判断而不是感觉。本质上让 ai 从写代码变成完成验证目标。

我太激动了,刚看到国外大神开源的 agent skill 和演讲视频,就迫不及待地给大家做出视频分享,因为这实在太强了,我想让更多的人看到。 我简单给大家捋一下核心干货。大神点出了 ai 写代码时普遍遇到的四大核心问题,并且配套给了对应的战术 skill 技能,完美对症下药,全部开源可直接拿去用。 问题一, ai 没有按照我的意愿去做。问题二, ai 说话太啰嗦。问题三,申请的代码无法运行。问题四,代码是一团乱麻,大家可按照自己的需求选择对应曲线观看接下来进行实际内容。 第一个问题, ai 没有按照我的意愿去做。当我觉得我有个好主意去和 ai 沟通,此时其实在做需求收集,他从你这里论清楚你的想法。 然而我和 ai 之间并没有混响一个设计概念,于是做出了我不想要的东西。 于是这位大神想出了一个技能。这个技能非常简单,过程就是不断采访,确认计划细节,直到达成共识。 这个过程中, ai 大 概会问你大约四十个、六十个问题,深入涉及的每个分支足以解决角色之间的依赖关系。此时 ai 是 你的对手,不断的向你抛出想法,努力达成共同理解。 还有一个好处,之后生成的对话可以拿来变成产品需求文档,这比 c c 或者其他 a 帧的工具里的计划模式要好。计划模式非常急于创建一个计划并开始执行一个想法,不会被几个问题就解释清楚。 第二个问题, ai 说话太啰嗦。 ai 在 说话时总是用太多的词语表达他在做什么,人与 ai 之间并不是在用同一种语言交流, 所以大神做了一个技能,这个技能就是通用语言技能,他的基本原理就是扫描你的代码库,查找术语,然后生成一个马克档文件。他会创建一个通用语言的马克档文件,里面包含一堆所有术语的马克档表格, 然后把这个文件转给 ai, 当然自己也能阅读它。领域驱动设计,简称 d d d 有 一个通用语言的概念技能类似通过通用语言,人与 ai 之间的交流全部源自同一个领域模型。这就是第二个小技巧, 和 ai 创建一套通用语言。第三个问题,假设你已经和 ai 达成了一致,你很清楚你要构建的是什么。 ai 也确实构建出了正确的东西,但是不能正常运行。我们就可以利用反反馈循环。 ai 往往是一次性做太多事情,生成大量代码,然后才可能做一下类型检测 或者跑一下测试,这导致速度太快。反馈的速度决定了速度上限,应该边走边测试,采取小而谨慎的步骤,而不是超过这个速度,而 ai 默认情况下在这方面做的并不好。 所以第三个技能就是 tdd, 使用测试驱动改法,因为 tdd 会迫使大语言模型真正采取小步前进的方式。先写一个测试,让这个测试通过,然后再重构代码,让它更优雅并考虑设计。 第四个问题,代码是一团乱码。简单说一下,代码库中浅层模块功能不多,但接口却很复杂。如所图,你会看到有大量不同的小块 ai 在 其中穿梭和导航,实际上这让 ai 很 难进行探索,而 ai 其实很擅长生存这这种代码库,于是 ai 根本不理解代码在做什么。他会尝试去探索代码,但由于结构混乱且充满了浅层模块, 可能无法及时找到正确的模块,或者无法理解所有的依赖关系。他无法理解代码。代码库中的深层模块,如右图,代码本身没变,只是被组织在了边界内,边界外有接口。 那么如何把浅层模块的代码变成深层模块的代码?于是第一次想进,人就来了,也就是探索一下代码库,寻找那些彼此相关的代码,把这些代码都分进一个深层模块里。 你在进行接口测试,通过这个接口来验证。这其实也解决了另一个难题,当你的反馈循环已经正常运行,假设一切都开始步入正轨,那么你现在能交付的代码比任何以往都多的多, 但你的大脑却跟不上。在开发过程中,你可能会感觉比任何时候都更疲惫,而且浅层模块的代码库实际上让你的大脑更加吃力,因此深层模块更有必要。这种方式不仅让你更容易理解和阅读,还可以把这些模块当回合来对待。 而你设计接口,把实线交给 ai。 最后接出大神的话,希望这次的分享能让你在这个新的 ai 时代充满信心,这样你就能产生积极的影响。开源库放在评论区了,大家自取。
![Skills 到底怎么用?纯小白怎么安装? 上一期讲了 AI Skills 是什么,这一期直接跑一遍实操。
我的理解很简单:Prompt 更像一次性的说明,Skills 更像给 AI 的 SOP。只要某件事你反复做、反复解释格式、标准和步骤,就可以考虑把它沉淀成一个 Skill。
这期主要演示几件事:
1. 怎么找到和安装一个合适的 Skill。
2. 怎么在对话里调用它,让 AI 按既定流程工作。
3. 怎么判断一件事适不适合做成 Skill。
4. 怎么从自己的重复工作里提炼出第一版流程。
我比较建议先从小流程开始:比如固定格式的周报、视频发布素材、数据整理、文档检查、项目复盘。先让它跑稳定,再慢慢补规则。
这期最想表达的是:AI 工作流不一定要一开始就很复杂。真正有价值的地方,是把你每周都会重复说明的东西,变成下次还能稳定复用的流程。
评论交流你现在最想标准化的 AI 使用场景,后续继续拆更多实操流程。
#codex #skills #claudecode #vibecoding #ai
#RED新生代创作大赛[话题]# #极客创造[话题]#](https://p3-pc-sign.douyinpic.com/image-cut-tos-priv/a4a186fc6155ef97334f8501ec098fe4~tplv-dy-resize-origshort-autoq-75:330.jpeg?lk3s=138a59ce&x-expires=2094415200&x-signature=w0m6KtXZc%2F1R2ZrBFvH%2BGmux3KQ%3D&from=327834062&s=PackSourceEnum_AWEME_DETAIL&se=false&sc=cover&biz_tag=pcweb_cover&l=2026051806205198F0C3CC37F94C376014)
你有没有发现,当你每次想让 ai 做一些重复的事情的时候,前面都要重新去解释一遍你要做的背景,输出的质量啊,包括结构等等。说少的呢, ai 输出的内容不对,说多了呢,又想重新做了一遍工作的说明, 这一期我想解决的就是这样的一个问题,把一次你已经调整到满意的工作流程,做成一个可以反复调用的 skill。 ok, 大家好,我是 fred, 我 不是程序员,专注从普通小白的视角分享怎么从零开始用 ai 和 web coding 去提升自己的生活和工作的效率。本期呢,我就会注重两个大的板块,第一个就是如何搜索调用和安装全网这种最火的一些 skills。 第二是怎么生成一个适合自己的 skills, 我 们可以打开呃,我的 codex, 然后,嗯,大家应该从社交媒体上面经常去看到一些说,哎,推荐一些 skills, 这个很厉害很屌,但是我觉得那部分都不太适合自己。所以说我的做法呢,是一般是会让 codex 去 tiktok 上面去搜索一些高薪的 skills, 看哪些会比较适合我。 因为本身 codex 日常在跟我沟通的过程中知道我在做哪些事情,所以它会评估我做过的项目,来评估现在有哪些现成的 skills 适合我。 比如说呢,最近我在做 free talk 的 这个账号,所以说他会觉得说我的视频剪辑字幕的生成,包括这种重复句的呃,识别这个 skills 会非常的适合我。当然也给我推荐了一些其他的,比如说一些做脚本的生成或者搜索的 skills, 那 这样子他就能够基于你自己的项目去生成一些最适合你的 skills, 然后推荐给你。那我们可能会问到说,那我怎么去安装以及调用这个 skills 呢? 那安装其实很简单,你只需要告诉他,请你帮我安装啊,第一个 skills 给到我,他就会正常的安装到项目里面啊,当然这是他人体的处理过程,我们不用 care。 最终大家可以看到他已经把 skills 安装到我的电脑里面,那无非就是啊,这个其实是四个 skills 啊,剪剪口波,然后 识别视频,生成字幕和最终的一个输出,那这个 skills 就 已经安装在我电脑里面了,那我后面怎么去调用这个 skills 呢?其实也很简单,大家只需要去斜杠,然后比如说我安装的 skills 名字叫 videocut, 所以 大家可以看到这里面有 五个对应的 skills, 比如说我想要让它生成字幕,我就只需要点出这个字幕啊,把我基于我第七 这样的视频进行字幕的输出,先发给他,就可以正常的使用了。 ok, 这个就是 怎么安装和调用 skills, 那 我们可能想要知道说,比如说我想看到这个是否用 skills, 它的一些差距是怎么样的呢?那我就用一个全网现在最火的一个 skills, 就是 using superpowers 来进行演示, 比如说我想让他帮我生成一个呃计划的 m d 文档啊,然后想要生成一个代办清单,我让他先不用调用任何 skills, 大家可以看一看他输出的一个工作计划,虽然说结构清晰,一二三四五六,但是内容相对而言还是会 比较少一些啊,然后也比较通俗一些。那我第二部分就是让他调用这个 skills 去重新生成一个代码清单,但让他不要作弊啊,参考项目里面任何材料重新去生成,大家就会发现 它生成的逻辑就是完全是按照 using superpose 的 结构,它的背景、目标,然后任务是怎么样的, 然后以及它的优先级和每一步的详细的步骤。所以大家可以明显地感觉到,是否用 skills 对 于你的整个执行的落地效果会有非常非常大的差异。 ok, 这个就是怎么去搜索安装和调用啊,全网的一些 skills。 第二部分我想去讲怎么去基于自己特定的场景去量身定制一个适合自己的 skills 呢? ok, 我 们也回到我们的 codex, 这个呢,我是之前先让他帮我 mock 的 一个啊,销售的工作的内容啊,生成了两个工作的明细。 那我觉得大家很多时候会出现一个情况,就是我每周要写周报,但是又呃不想让他呃花我那么多时间,对吧?然后我很多时候大家可能是帮我生成一个周报总结,大家可以看到 他生成周报总结也挺也蛮好的,对不对啊?一二三四五。但是比如说我不喜欢他的第四部分的这个结构啊,我想让他变,比如说变成一个表格形式的给我。 ok, 我 让它生成一个更清晰的表格给我。那没问题,你看它就给我生成了一个 markdown 的 这种表格的形式。哎,我觉得非常清晰,一二三四,也没有那么多步骤。 ok, 那 我就把这第四这个部分 怎么去生成 excuse 呢?直接让它告诉啊,帮我生成 excuse 啊?比如命名为 test 周报生成, 那它这样子就是按照你刚刚的要求去输出呢?一个 skills。 那 怎么调用?也很简单,比如说我就继续调用它,帮我把 mock 的 另外一个内容 vr 生成一个报告给我,大家就可以看到, 我不需要说更多的一些内容,也不需要让它帮我去呃输出一个,然后再修改,而是直接按照刚刚我已经满足我需求的这样的一个结构和内容输出给我就 ok 了。 大家可以看到,这就是 skills 的 一个效果。所以说呢,这一期呢,你不需要去记住所有的细节,只需要记住一个判断,就是如果你一件事情每周都要重复做,而且每次都要重新告诉 ai 你 的格式、逻辑和标准, 它就很适合做成 skills 啊,因为普普通的 prompt 解决的是一次的任务,而 skills 解决的是下一次,下下次还能不能稳定地复用? ok, 我是 fred。 后面我会继续用真实的案例告诉大家怎么把 ai 用进自己的工作流,我们下期再见。

这期讲 um hermes 的 记忆锁和 skill 锁,目标很简单,防止 agent 乱改 u c r m d memory, 让记忆系统干净可控,最后接入 handstate 做第二大脑。 先看 memory chain 杠 proofgate skill, 它分两层写,一层负责提醒和流程约束文件。系统层负责硬锁,防止绕过规则直接写文件。 协议层会写进嗽 md、 memory md、 user md 和 skill 本身意思是记忆变更要先申请再确认再执行,不能让 agent 想写就写, 软约束还不够。所以第二层用 linux 权限做硬锁,把 skills 目录 memory md, user md 锁住,普通写入覆盖和重命名都过不了。 这里让 hermes 自己总结锁定状态,重点看三项 skills 是 否只读 memory memory 是 否锁住 user csa user md 是 否锁住,三项都对递环才成立。 接下来是 hindsight, 它不是替代本地记忆文件,而是作为第二个 prior 大 脑,给 hermes 提供长期记忆观察回忆和经验沉淀。 看 quickstart 时,先准备 open a i 下括,如果用 deep seek 或 kimi 这类兼容接口, private 仍按 open a 兼容模式接入 部署演示用非牛 nars 的 docker 平台。第一步,确认镜像已下载,容器列表里能看到 vectorize 啊 hoise 啊 high sight 相关镜像 叫呃 docker 管理界面,进入容器详情和设置页,这里真正要看的是环境变量配置,不是容器名字或镜像版本。 l l m 配置要和画面对上。 hest 上海就 l l l 还洗黑色穿好。填 open night 就 好,模型填 deep seek, 菲斯 flash api key 填你的兼容接口密钥 base url 也要单独确认,因为走 openai 兼容模式地址。最后必须带 v e, 比如 app deep seek com v e 啊,少了就容易请求失败。 然后看存储挂载 docker ui 里把本地目录挂到 home com 的 home site 啊 p g 零,这就是 hand site 的 数据库目录必须持久化 配置完成后启动容器再观察资源占用。 handset 比普通插件更吃 cpu 和内存,建议四 g 以上设备再部署,否则 a s 容易卡住。 最后打开 handset 页面,看到 memories 和图谱,试图就说明服务已经起来了。到这里 doc 部署和服务验证才算完成。 部署后回到 hermes 底层系统做关联配置。重点不是命令多复杂,而是确认 hermes 能连上 high stat, 并把它识别成可用 provide。 最后检查三个状态, built in 代表本地记忆文件 profiles, 那 里要出现 high sight installed portings 里的 high sight。 要是 active。 总结一下,记忆系统不能只追求汇集,还要可控。先用软协议管流程,再用 linux 权限兜底,最后用 handsight 扩展第二大脑,避免复向进化。

今天咱们来聊一个事儿, cloud code 的 skills 技能系统。欢迎来到 cloud code 全站观察。这是第三集,前两集咱们聊了 cloud 点 md 和 hooks。 有 朋友问我, 这些配置和自动化挺好,但我有好几个项目,难道每个项目都要重新教 cloud 一 遍吗?那么问题就来了,有没有办法把经验打包一次,编辑到处附用?还真有,就是今天咱们要说的 skills。 说到这儿,可能有朋友要问了, skills 是 啥? 我打个比方你就明白了,你装浏览器的时候会装各种插件对吧?广告拦截、翻译工具、密码管理,这些插件一次安装所有网页都能用。 skills 就是 cloud code 的 插件系统, 它是一个预定义的 prompt 加配置加工作流的组合,你可以把它想象成一个功能包,装上了 cloud, 就 学会了这个技能。比如你可以创建一个代码审查 skill, 定义好审查标准和输出格式,然后所有项目都能调用这个 skill, 不 用每次重新描述。 简单说, skill 就是 把你的经验打包成武器,随拿随用。说到这儿,可能有朋友要问了, 这玩意儿怎么写?咱们来说说。创建 skill 非常简单,就是一个 s k i l l 点 m d 文件, 文件结构分几个部分,首先是头部信息,包括 name 名称、 description 描述、 version, 版本、 author 作者这些原数据,让 skill 可被识别和管理。 然后是核心部分, prompt 定义,这里写清楚这个 skill 是 干嘛的,输入是什么,输出应该是什么格式。比如代码审查 skill, 你 可以定义输入是一段代码 输出,要包含问题等级,具体问题修改建议三个部分说到这儿,这就很关键了,好的 skill 要有清晰的输入输出定义,这样 closed 才知道怎么用。 再来是参数化,你可以让 skill 接受自定义输入。比如审查 skill, 可以 接收一个严格程度的参数,严格模式查得细,宽松模式只查大问题。实战演示一下, 咱们创建一个简单的代办事项管理 skill, 首先定义功能,添加代办标记,完成列出所有事项。然后定义输出格式必须是 j s o n, 方便后续处理。最后加上错误处理,输入不合法时要给出提示。就这么一个文件, 放到项目的 cloud 目录下, skills 文件夹里 cloud 就 能识别和使用了。基础 skill 会写了,咱们来聊聊高级玩法。第一个是参数化,刚才提到了 让 skill 接受输入参数,这样同一个 skill 可以 适应不同场景,比如代码审查,你可以传语言参数, typescript 和 javascript 的 检查标准不一样。第二个是组合使用,多个 skill 可以 串联起来, 比如先用代码生成 skill, 生成代码,再用代码审查 skill, 检查质量。最后用测试生成 skill, 生成测试用力。一条命令,三个 skill 自动串联。 说到这儿,这就很关键了, skill 组合是提升效率的关键,单个 skill 解决单点问题,组合起来解决完整 workflow。 第三个是条件逻辑 skill 可以 根据项目类型调整行为,比如检测到是 react 项目,就使用 react 特定的规范, 检测到是 node 点 js, 后端项目就切换成后端规范。第四个是版本管理 skill 也要迭代更新, 你可以给 skill 加版本号,项目里锁定用某个版本,避免升级导致行为变化。最后是文档要求,好的 skill 必须有清晰的文档说明、功能、用法、视力,不然别人看不懂也没法用。除了自己写 skill, cloud code 还有丰富的生态 内置。 skills 方面,官方提供了一些常用 skill, 比如代码解释、重构、建议、测试生成等,这些开箱即用。社区 skills 方面, github 上有开发者分享的各种 skill, 包含了不同语言、框架、场景,你可以搜索、试用,贡献自己的 skill。 分享 skill 也很简单,把 s k l l 点 md 文件发到 github, 别人下载放到自己项目的 cloud 目录下, skills 文件夹里就能用到,这你就明白 skills 的 完整玩法了。好了,今天咱们就聊到这,回顾一下重点。 第一, skills 是 把经验打包成可附用的功能单元,一次编辑到处附用。第二,创建 skill, 就是 写一个 s k i l l 点 md 文件,定义、输入、输出和行为。第三,高级玩法包括参数化组合、使用条件、逻辑、版本管理。 下一集咱们要聊的是 m c p server 实战给 ai 装外挂。如果说 skills 是 让 cloud 学会套路, m c p 就是 让 cloud 连接外部世界。下集咱们详细说,别忘了点赞、收藏、关注,系列持续更新,咱们下期再见!

大家好,欢迎来到 skill 推荐第一期第七集,本期给大家带来 cloud 开发团队 anthropic 官方原声出品的工具 skill creator, 专门教大家 零基础封装自己的专属自定义 skill, 彻底解决每次给 ai 提重复要求、团队开发规范不统一的核心痛点。它的核心能力完全贴合官方标准,每一点都有实锤支撑。 第一,百分之一百对其官方 skill 格式规范,自动生成合规文件,不会有任何兼容问题。第二,覆盖 skill 创建、编辑、校验、分发全流程,官方配套工具一应俱全。 第三,零基础也能上手,不用肯复杂的开发文档,自然语言就能生成专属 skill。 第四,生成的 skill 全平台通用,一次创建所有主流 ai 编辑器都能用。来自 anthropec 官方 github 开源项目 anthropics skills, 在 仓库的 skills skill creator 路径下就能找到,可直接在 cloud code 里原声调用,也能一键导入到其他 ai 编辑器中使用。核心避坑点我也整理好了, 照着做就能保证 skill 的 效果和兼容性。不用懂复杂的开发逻辑,用这个工具,你也能把自己的开发经验、团队规范变成一键出发的专属 ai 工具。 下一期我们带来源自 android corporate 大 神的顶级 ai 编码规范 skill, 教大家零基础,让 ai 稳定输出高质量工程化代码,我们下期再见!