粉丝3976获赞7820

我有个搞开发的朋友昨天跑来问我,你能帮我配一下 a p i 吗?我说可以,但要收费,他说行。我很惊奇,就是一个写代码的居然不会配自己的 a p i, 然后我发现,其实真的没有多少人真正知道 a p i 是 什么, 其实这个东西当普通人掌握之后,真的像是打开了新世界的大门一样。 a p i 也很好理解啊,你把它理解成是一根水管就好, a p i 公司就是自来水厂,它生产水, a p i 就是 接到你家的那根水管,水接进来之后,你不管是想接洗衣机,接洗碗机还是花洒,都是由你自己决定的。就给大家看一下我现在的套餐,我买的是阿里的 cooling plan, 每周大概用掉 十几个亿的头衔,他给了我一个 a p i key, 就是 这么长一串字母。然后我拿这一串字母做了几件事。第一个就是 open call, 这就是那个在 github 上成功登顶的龙虾机器人,他虽然很强,但也需要你自己接入大模型才能够活过来,也就是需要接入 a p i 才能够进行正常的聊天使用。第二个就是 cloud code, 是 一个非常好用的 ai 编程工具,我之前也有推荐过,我把我的 a p i 接进去以后,他跑的就是 mini max 的 旗舰模型, 比直接订阅 cloud 会便宜非常多。第三个就是这个沉浸式翻译的开源项目,很多人都在用它那个浏览器的翻译插件,它有免费版,但是翻译的质量很一般。接上你自己的 api key 以后,它调用的就是你买的大模型,翻译的质量就直接上了一个档次,而且文本处理的 token 几乎不怎么花钱。一根水管接了三种工具, 一个编程工具,一个 ai 助手,一个翻译插件。这就是 a p i 的 使用逻辑,一次购买用在所有地方。现在网上有大量免费的开源工具,但他们需要你自己接水管,也就是提供 a p i。 但如果你不会使用 a p i, 你 就只能用别人帮你套好壳的版本,还要多付一层壳的费用。懂 a p i 的 人,用同样的预算,能用到的工具是你的好几倍。你现在可以取走一件事,就是去估 go, as studio 或者是 kimi 火山引擎,它们都有一定的免费额度。找到 a p i key 这个按钮,先生成一个放在那儿。下次遇到需要接入大模型的工具,你就直接有了评论区,告诉我你第一个想接入的工具是什么。

如果你也在用 openclo, 先别急着装 skill, 一定要把 so 点 md、 user 点 md, agent 点 md 这三个文件配置好。很多人装完就研究 skill, 但想让龙虾真正帮你干活,关键不是 skill 多, 而是写好这三个配置。 so 点 md 定义龙虾的价值观,别写空话,要具体,比如简单问题直接给结论,不确定就说不知道,避免 ai 胡编。 user 点 md, 告诉龙虾你是谁,你的名字、时区、工作内容、输出偏好, 没有它,龙虾就像跟陌生人说话, a 键点 m d, 工作手册,任务先做什么,标准是什么,哪些操作必须跟你确认。决定了龙虾会不会按你的方式做事。认真写好这三个文件,可能比你装一百个 skill 更有用。 skill 解决会什么?这三个文件解决怎么做事,怎么理解你。

大家好啊,不知道大家最近的股市赚钱没有, 今天也是想给大家推荐一个关于金融板块的 skill, 可以 统计 a 股的数据,像这个界面就是这个 skill 做出来的。今天 a 股收盘的点评里面有一些大盘的指数以及金融的流入,金额的流入跟流出,下面我们来介绍一下这个 skill。 首先呢我们任何的金融 skill, 它底层支持一定要有靠谱的这个金融数据,大部分金融 skill 他 们都是从网上利用爬虫去向新浪,还有这个东方财富同花顺这些地儿爬取的数据,然后这个 skill 叫妙想,它是直接东方财富旗下的 一个金融 skill, 所以 它是直接调用的东方财富的金融接口,所以说数据来源还是很靠谱的。我们现在进入这个大模型界面,你在这里就可以直接跟它对话去查询数据了。但是我们今天是要装这个 skill, 然后大家可以点击这边的妙想 close, 这有一个妙想 flow 调用,然后大家点击这个妙想 flow 调用,然后会给到你一个 api key, 然后以及开始下载,开始下载就是下载这个 skill, 我 们先直接看一眼它的文档, 然后这个妙想金融 skill 它推荐了两种安装方式,一个是一句话安装,就是大家把这段内容复制下来,然后把这个 api key 然后粘贴成刚才 这个界面的,这个 key 粘完了以后给到咱们的龙虾就可以。然后这种方式我也是做了尝试啊,然后把我的 key 给到他,然后这些技能安装包,然后他也是经历了这个漫长的时间,最后也报了这个错啊,说上下文已经填满了,最后也没有安装成功, 最后应该是只安装成功了三个 skill, 然后我让他停了下来,看,他给我提示就是一安装了三个,剩下六个没有安装完,所以这种这种方式可能还是不太推荐的。那我推荐的是另外一种方式,就是我们直接下载它的 skill 文件夹, 然后这里我也是提前下好了,下完了以后我们把这个 skill 放到我们 agent 的 workbase 目录下,我目前使用的是这个 stoked agent, 然后我把这个下载好的文件夹就是这个妙想 skill, 然后直接给它拷贝到这个 workspace 的 目录下,然后我们就可以跟龙虾对话, 我们先问了他一下,看这个 stock agent 下的 open space 有 没有这个妙想 ski 文件夹,他是跟我说找到了,那找到了以后,那我们就直接跟他说安装这个 ski 到这个 stock agent 呃 a 阵特下,然后我也不想这个 skill 全区使用,因为我怕会乱,这样的话我们的安装就会很快,这都是我之前已经安装好的,然后我们它会提示我们这个 skill 已经安装完成了,然后它也会分析到上下文之前有这个 api 的 key, 然后需要配置,然后我跟他说配置吧, 他也就完成了这九个 skill 的 配置。那完成配置以后呢,我又去让他介绍了一下我们这些 skill 到底有什么作用,然后我问他一下介绍这九个 skill 都是做什么的, 他通过读这个 skill 有 readme 的 文件啊,给我们展示了一下,有金融数据查询,宏观经济数据查询资讯,包括这些智能选股,那这些接口就足以支撑各位对于 a 股想要的一些数据查询。当然我们也可以给他一些综合性的命令, 比如啊,今天我就直接给他发了一个命令,说今日 a 股收盘点评并生成可式化报告。 那么我们的 sook 龙虾那也就直接去调用了这个妙想的 skill, 然后帮我生成了最终的一个报告。你看他帮我生成了一个 html 的 报告,以及把今天 a 股的 嗯信息也展示出来,这个报告就是刚才我打开的那个收盘点名报告,这里有这个大盘指数,还有一些热门板块。 当然这个信息对于各位股神来说肯定是不够的,我们更多关注的是一个个股要有哪些合理的这个投资建议。 所以呢,我又去问了他一些问题,我说这个分析一下个股给我明天的投资建议, 他会问我想分析哪些股票,那所以我还是问了他一下,总结一下今天的热门股票,热门板块,然后给出明天的股票关注点,还有这个热门股票的购买建议。然后他也是理解了我要的说法,然后他也告诉我今天热门的股票确实也是这些啊, 这个五连版,包括这个中立的反包涨停。然后他把这个购买建议也给我生成一个报告文件,你要不想看文字,咱们就直接看这个网页的报告文件, 看,这里就有今天的热门板块,医药油气,油气是因为早上那个特朗普的发言,然后他要继续战斗嘛,所以这个油气要上涨,同时油气上涨就代表着科技要这个下跌,所以今天跌最狠的是算力租赁 这边人气的个股,也是最近走妖的这个五板的个股。各位股神关注股市的应该也都知道 下面有这个明天的关注方向,其实也就是一要是否继续延续这个强势,主要还是看这个连板高标明天会不会断板。 好,那这是我们一个热门股票的一个建议,这是根据我的想法要求生成的,我们也可以问他一下具体个股的一个 情况,然后我们就去问了他一下今天的这个反包版嘛,中某集团,中某集团怎么样?明天买卖点是怎么样?然后他也去给我们分析了一下这只股票的一个基本面啊,这种小票基本面积蓄很基本是很差的。 然后他主要是炒一个这个短线的情绪,他主要是通过技术分析来说了一下这只股票的一个买入点跟这个卖出点,可以作为大家的一个参考,当然不能作为最终的投资决策,投资决策还是要由各位做这个 最终的决策呢。好,他也把这个中立集团的这个情况给我们生成了一个报告,他这个集团整个这个营收也是很差的, 明天的买入近一点,他也是说要回调至一个四块三四块五,我们看一眼实际数据, 四块三、四块五,那就是他说要到前期这个 相当于价格的低点吧,他认为这里是一个支撑,我觉得更多的可能是走这个技术分析的这个流派啊。他卖出止盈这边也说了,基本是希望咱们亏损百分之五就赶紧割肉离场啊,这个明天也可以看一眼他这个的推荐准不准啊? 嗯,那我就给大家演示这几个 skill 的 基本的一些使用功能, 后续的话怎么来用这些接口数据还是要靠各位股神去这个尝试探索,主要还有结合自身的一些策略,谢谢大家。

上期视频发出去之后,很多人在评论区说想要看一个更加入门的 skill 的 教程,所以今天我就用一个具体的例子给大家演示一下我是怎么从零去创建一个 skill 的 完整流程。在开始之前,先讲一下 skill 到底是什么。 我觉得 skill 的 本质就是一句话,当你面对一个具体任务的时候,你希望 ai 能够稳定复现你想要的一个 结果的一套工作方法。那我们创建 skill 其实就是去创建这样一套工作方法,然后把这套工作方法交给 ai, 让它记住。那它具体是怎么工作的呢? skill 的 核心其实就是 skill 点 m d 这个文件,它是用纯自然语言去描述的,这个文件里面和 核心定义了四件事情,这个 skill 是 什么,解决了什么问题,在什么场景下触发,以及具体的工作流程是什么。 skill 创建好之后,它的名称和描述会被自动加载到 agent 的 上下文里面,你每次跟 ai 对 话,它初识话的时候都会自动的读到这些信息。 这样的话,当 agent 遇到那个特定任务的时候,他就知道自己有一套现成的工作方法,能够给你交付一个预期之中的结果。 ok, 那 我把创建 skill 的 完整流程总结成四个阶段。第一个阶段是创建前我们先不用去想我的 skill 是 什么,怎么创建的问题, 而是你只需要跟 ai 去对话,反复的讨论,把你想要的这个结果让 ai 帮你产出一次。 然后就到第二个阶段创建中,当 ai 在 一个绘画里面已经成功产出了你要的结果之后,你需要在同一个画里面现场让 ai 去总结经验,然后把它封装成一个 skill。 然后就是第三个阶段,创建后我们需要新开一个甚至多个全新的绘画,去验证 skill 它能不能被正确的触发。 ai 用这个 skill 产出的结果是不是符合我们的预期的,以及它是不是可以被稳定重现的。最后就是第四个阶段,我们在日常的使用和迭代, 当你需要 ai 帮你去做这个特定的具体任务的时候,你直接的去调用这个 skill, 用的过程中如果有新的需求,或者啊有一些你不满意的地方, 就不断地改进它,这样的话这个 skill 就 会变得越来越好用。接下来我就用一个具体的例子演示一遍完整的流程。这个 skill 是 我想让 ai 帮我把我 notebook lm 笔 里面的数据抓取下来,保存到我的本地文件夹,成为我的知识库的一部分。然后第一阶段就是创建前我并没有跟 ai 提到任何跟 skill 相关的事情,而是直接描述我的需求,因为这个功能我一开始也并不知道要怎么去实现,所以我让 ai 先帮我去调研有什么样的一些解决方案,然后 然后他做了各种各样的网络搜索,去 github 上面找了各种各样的项目,然后给我输出了一份调研的结果,包括官方的 a p i 以及社区开源项目有哪些它们各自支持的数据类型,支持的功能, 以及它们的一些限制和风险等等。然后我就在这些方案里面选择了一个开源项目的方案,然后让他帮我去实现,他就会去帮我去安装依赖,然后这里他弹出了一个浏览器窗口,让我去登录我的酷狗账号, 这样的话他才能够获取我这个账号下面的笔记本的数据。我就去登录了,他就成功的查询到了我有五个笔记本,然后把我这个每个笔记本里面的各种数据源数据,以及啊在 notebook l m 上生成的各种多模态的数据都导出了出来,并且运行了测试。这个测试 过程中我就发现缺少了一种输出形式,就是 data table, 所以 就让他去排查了一下啊,排查完之后很快就解决了 ok, 然后这里其实第一步就已经完成了,就是我已经让 ai 在 一个绘画里面产出了一次我想要的结果, 那么这里的话我就直接进入到第二阶段,就是让他现场在这个绘同一个绘画里面去总结经验,把刚刚的这个流程封装成一个 skill, 并且调用了 skill creator 这个 cloud code 的 内置的一个命令, 这个命令的话就会按照 skill 的 标准格式和规范帮我们去创建和注册 skill。 ok, 然后他这里问了我一些问题,我明确了我的需求之后,他就开始去创建了,然后他这里就会说已经创建成功,并且注册到了我的可用 skill 列表里面,名字叫做 notebook l m export, 它还会进行一次测试。 ok, 然后这里的话其实第二步就已经创建完成了,我们可以看一下它创建的这个 skill 的 一个结构,就是一个 skill 点 md 文件以及一个抓取的脚本嘛, 然后这个 skill 点 n d 文件,它是用英文写的,不过我们主要了解一下它的结构就行,这里就是它的名称和描述,描述里面就是在什么场景下触发,解决什么问题,然后下面就是它详细的一个工作流,这里有 walkthrough, 第一步,第二步,第三步,第四步, 然后第五步,这就是它的这个 skill 的 一个描述,就是它的核心文件。那么如果你不放心的话呢,可以新开一个绘画,然后直接输入斜杠 contest 命令,你就可以查看 一个新的 cloud code 的 绘画,它会加载什么样的上下文,然后你这里就可以在 skill 列表里面看到,嘿,这个 notebook l m xport 这个命令已经被自动加载到 cloud 的 上下文里面了,那这样的话就证明它已经注册成功, 并且每次你跟 cloud code 的 对话的时候,它都会自动出现在你的上下文里面。 ok, 但是到目前为止,我们还没有在一个全新的绘画里面去验证这个 skill 的 一个效果,所以我们需要进入到第三阶段,就是我们必须要新开一个绘画,做一次 skill 的 验证。 这里的话,我直接用自然语言描述跟他说帮我抓取一下 notebook lm 的 笔记,然后这个这里我们就可以看到它成功的 自动地加载了刚刚我们创建的这个 skill notebook lm export。 然后它就正常地按照 skill 的 工作流程去抓取了这个 notebook lm 笔记本里面的数据,并且把笔记本里面的数据都输出到我的一个工作目录下面。这里就包括四十三篇 原文件的笔记,以及我在 notebook lm 笔记本上生成的各种多模态的数据,比如说像 ppt 啊,还有这个脑图啊等等, 然后我也检查过这个数据是符合我的预期的,那到这里一个 skill 的 创建完成就算真正的完成了, 那么在后续使用以及你在验证的过程中,可能都会发现一些你不符合你预期或者需要迭代的地方。比如说我发现 他导出的这个原文件里面会包含一些网页导航栏以及一些外链的一些信息,所以我就让 ai 帮我去优化了一下,然后他就直接的去 改了这个 skill 点 and d 文件,优化了它的描述。那么核心思路都是一样的,你需要先让 ai 把你想要的这个改进的结果产出一次,然后在同一个规划里面让它去更新和优化 skill, 优化完之后,可能你需要再开一个新的窗口去再做一遍验证,直到 直到它产出的结果是完全符合你的预期的,这样的话你的 skill 创建流程就真正完成了。 ok, 以上就是从零创建一个 skill 的 完整流程,大家可以按照这个流程去试一下。创建过程中如果你有遇到任何的问题,也欢迎在评论区我们一起交流和讨论。


最近 skills 非常的火,分享一个我在用 skills 的 一个痛点,比如说今天我在用这个 skills, 它呢就是可以一键生成各种各样的小红书封面,不同的风格,拍板什么都非常的好。但是我在用的过程中就会发现, 以往经常存在的痛点就是我要对接各种各样的接口,比如说刚才的那个 skills, 我 要对接生图的接口,那这里面我就要去选择找一个 api 的 一个平台,生图的一个平台,这时候我就找到了这样的一个平台 a p m art, 这个专门呢提供了各种各样的 ai 视频的 ai 接口和 ai 图像的。今天呢我就用到了 banana, banana 的 二 ai 的 一个接口啊,但是这样的一个平台的话,它是需要人类进去注册,然后再进行充值的,所以这时候我的一个痛点就是为什么不能让 agent 他 或者让我的 cloud code 他 自己去注册,然后自己去充值,然后自己去帮我对接这样的一个接口呢? 我突然会发现了现在有这样的一个平台做的非常的好,我就发现了 skill boost 这样一个平台,它专门就是针对于 a 政策的所有 a p i 的 接口, 这个平台呢也就是相当于我只需要一个 a p i k 就 可以满足,目前是针对于十五个以上的 a p i 的 一个密钥就已经足够了,不至于我刚才生图用一个 a p i 接口,视频我用 a p i 接口, 然后还有各种各样的大模型,我都用不同的 a p i 的 接口啊,就会觉得很复杂,我每天都会再去测更重要的 a p i 接口,那这个平台的话,你需要用一个 a p i k 就 可以去满足,所以我觉得这个平台应该接下来会爆吧?就专门为 agent 去准备给他储存一个账户,让他自主地去对接他所需要的所有的 a p i 接口,就不要问我了,你自己去。但是针对于这样的一个平台,他们的一个, 嗯,责任和风险和风控其实要求是蛮高的,所以我觉得感觉接下来这个平台要大爆呀。

今天给大家分享一下 skill 的 一些高阶用法啊,包括 skill 的 组合,也就是套娃,还有 skill 的 一个 agent 的 分配。 首先第一个就是 skill 的 组合和套娃是什么意思呢?其实我们日常生活工作中的很多工作流,它都是由小到大的,就是小的工作流组成, 组成大的工作流,大的工作流组合,再变成更大的工作流。我这里举一下我实际在做的这个知识库搭建的一个项目,那我的 我的这个知识库的这些知识的采集,它是有不同的 skill 构成的。比如说这里有 notebook l m l l m 的 这个知识库,然后有 比如说我跟 cloud 对 话的过程中,让他去调研某一个主题,这里我在做的去调研一个主题,他在调研的过程中收集到的有价值的信息,会自动的通过这个 skill 落到我的本地的知识库里面。然后比如说有 twitter 的 文章,或者是 twitter 我 主动收藏的一些 啊这个帖子或者是信息。那这里我有不同的渠道去构成我的知识库。那 skill 的 组合是什么意思呢?这些都是某一个渠道的 skill, 那 其实它就可以构成一个 知识库采集的 skill, 在 这个 skill 里面主要就是做一个编排啊,比如说第一步我去去去取这个 notbook lm 的 这个知识,然后第二步去取这个 cloud 的 对话过程中产生的有价值的一些信息的知识, 然后第三步去取 twitter 的 知识,第四步去取 reddit 的 知识等等,那它就可以通过一个 skill 去把这些 skill 给它包进来, 然后在网上包。其实思路也是一样的,你有了采集,那你比如说你还需要分类,对吧?分类也是一个大流程,它里面可能也分成不同的小的 q, 小 的 q 通过组合或者是套娃便,然后给它套到这个分类的 q 里面,然后比如说 这个产输出,这个输出的话可能有图文形式的,有视频形式的,那它其实也是一个大流,大的工作流,这个大的工作流可能也可以通过小的工作流变成 skill, 然后再包到这个 输出的这样一个 skill 里面就层层套娃。这样做有什么好处呢?就是 你不用一步步的去自己去做操作,而是它类似于一个 pipeline, 这个 pipeline 你 只要让 agent 直接去执行这个 pipeline, 它就会自动的一二三四五步去把所有的渠道的知识库都刷新一遍采集过来, 这样的话你就不用说人工的去让 cloud code 帮你去执行四五次,五六次啊,不同渠道每个渠道去执行一次。然后第二个高级用法呢?就是这个 skill 的 agent 的 分配。 就是正常来说,我们会把 skill 放在主目录下面的点 cloud 的 文件里面,对吧?那你的 skill 可能会非常多,它的用途又不一样, 那 skill 的 分配是什么意思呢?比如说我的知识库采集是在这个文件夹里面进行的,对吧?那我其实就可以在点 cloud 的 里面把我的采集 skill 分 配给这个 分配给这个知识库采集的这样一个目录,那这样,那这个目录我同一同样也可以在点 cloud 的 文件里面去通过 cloud 点 md 去定义它,比如说你就是负责采集的, 对吧?去定义它的身份,或者是定义它的一些啊角色,那就会让这个 其实这个就是一个 agent 了,然后你每次都在这个目录下去启动它,它自动就会读到你的 cloud md 以及它所拥有的这些技能,那相对来说它去执行采集任务就会更聚焦一些,因为它不会受到其他 skill 的 一些上下文的 一些污染嘛。那而且它有自己的 cloud 点 md 的 一些约束,那它执行任务的过程中也会啊更聚焦,那它交付的结果也会更好。 对,这个就是我前面几个视频有一直在讲的,就是把 skill 和 cloud 点 md 赋予给某一个目录下的子目录,让这个子目录成为一个新的 agent, 成为一个,成为一个独立的 agent, 那 这样的话他的工作效率会更高,他做的事情也会更聚焦,并且我们去管理这些文件也会更加的清晰, 而不是所有不同的流程的 skill 都堆在这个主目录下的点 cloud 下面的 skill 文件里面,那很多时候你自己都管理不好,你如果把它分配到 啊对应的一些节点,然后这些节点啊各自有自己的目录,这些目录能够啊给它分配 skill, 那 其实它就变成一个独立 agent, 它的分工也会更加明确,然后执行的效果也会更好,你去管理它也会更加的清晰。

一个 ai 自己生成图片,自己写文案,自己排版,自己上传 tiktok, 结果五天播放量破了五十万,单条呢最高二十三万,其中有四条直接破十万啊,人家呢,只花了六十秒,自己加个音乐,然后就点发布就可以了。 马上过年了,很多人都在想明年该怎么搞钱,怎么搞流量。那今天呢,我就给大家讲一个可能改变二零二六年你一整年效率的 ai 新玩法。但是先别着急啊,这个故事最精彩的部分并不是它的结果有多烂啊。 这个故事啊,是来源于硅谷的一个程序员,他想用 ai 来帮他去做自媒体。但是啊,这个 ai 刚开始生成的图片尺寸是错的,横屏的,而且发到 tiktok 上面全是黑边,文字叠加太小,被 tiktok 的 状态来挡住,用户根本就看不见,写的标题呢,全是自嗨型的 什么?看看 ai 觉得你的房间能变成什么样,结果就有八百多个播放。所以一开始啊,这个 ai 就是 个废物,哎,是不是跟你的感觉差不多啊?我们有多少人都觉得 ai 现在连个 ppt 都做不好,连个视频都做不出来,对吧?但是为什么它现在能从一个废物变成一个比人还强的 ai 呢?答案呢,就是一个东西叫 skill, 中文呢,可以翻译成叫技能, 那 skill 是 什么呢?其实就是一份文档,用来教 ai 怎么来做这样具体的事。你可以把它理解成一份超级详细的员工手册,不是那种好好干活的废话手册啊,是精确到每一个细节的操作手册, 它不是代码,它就是自然语言,中文、英文都可以用。比如说,这个程序员啊,它的 tiktok skill 呢,它就超过五百行。那它里面写的什么东西呢?比如说啊, 图片必须是幺零二四乘幺五三六的,竖屏不能用横屏。比如说啊,文字大小必须是图片高度的百分之六点五,不能是百分之五, 文字位置不能太靠上,否则呢,就会被 tiktok 的 状态栏给遮挡。每条内容呢,必须六张图,不多不少。 标题呢,必须用某个人加冲突加展示,加 ai, 结果加对方改变想法的这个公式,甚至连生成图片的提示模版都写死了, 房间的尺寸,窗户的位置,门的方向,天花板的高度,地板的材质,全部锁定。六张图,只改风格,不改结构。那为什么要这么写呢?其实因为 ai 每一次启动的记忆都是空的,他根本就不记得上次犯了什么错,他不记得哪一个标题爆了,哪一个文案拉了。而 skill 呢,就是他的记忆,就是他的经验,就是他越来越强的原因。 而且这个 ai 甚至自己都说了这么一句话,我觉得呢,非常到位。他说每一次失败都变成了一条规则,而每一次成功都变成了一个公式。这就是 skill 的 本质,它让 ai 有 了复利效应。你想想,一个新员工入职,你要花多长时间去培训他? 三个月,半年,甚至是一年?而且呢,它还会离职,经验直接给你带走。但是 skill 不 会,它呢,永远在那里,每一次的迭代啊,都在原来的基础上叠加。 ai 坏了, skill 还在,而模型升级了, skill 照样用。所以呢,这个程序员的 skill 啊,从第一周 skill 就 改了二十多次,从 图片尺寸的错误,到文字被遮挡,再到标题没人点,每踩一个坑就往 circle 里面去加条规则。那到了后面呢?他写的标题呢,比人写的还好。比如说,我房东说不能装修,我就给他看了 ai 觉得能改成什么样,直接二十三万播放。 我给我妈看了, ai 觉得客厅能改成什么样,十六万播放。我房东不让我装修,直到我给他看的这些十四万播放,全是 ai 自己写出来的, 人只是挑了一下,然后点一下发布。所以你看啊,真正厉害的不是这个 ai 模型本身, gpt 也好啊, cloud 也好,豆包也好,千文也好,模型大家都能用,真正拉开差距的是你给 ai pay 的 skill, 那 同样的模型没有 skill, 它就是一个只会聊天的机器人,而有了 skill, 它就是一个能帮你赚钱的数字员工。而且 skill 的 应用啊,远不止发 tiktok, 也不只是用在某一个平台。你是做电商的,写一个 skill, ai 帮你全自动分析你店铺的差评,提炼出产品的感情方向,还能自动生成客服的话术。 你是做自媒体的,写一个 skill, ai 帮你追热点,写脚本,选择题,甚至自动生成封面。你是做外贸的,写一个 skill, ai 自动监测海外社媒上用户的提问,用当地语言秒回, 二十四小时不停。你是做投资的,写一个 skill, ai 每天早上自动帮你整理行业的资讯,财务的招标,疫情的变化,发到你的微信上面。甚至啊, 你是学生,你可以写一个 skill, 让 ai 自动帮你整理课堂笔记,生成思维导图,并且按照你的薄弱点来出练习题,这都是 skill 已经在做的事情。 而 skill 的 威力就在于它把你的经验,你的判断,你的方法论全部沉淀成了一个可反复执行的文件,那你就不再是一个人在战斗,你有了一个永远不会累,永远不会忘,而且越来越强的搭档。 这就是为什么最近爆火的 openclaw 能帮你干活,因为它有一个庞大的 skill 市场,它可以随时加载你自己的 skill。 当然了,不止于此啊,只要你有了一个 skill, 你 就可以把它上传到 openclaw tree、 扣子,甚至是你公司的每一个虚拟工会上面。 新的一年马上开始,当别人还在手动搬砖的时候,你可能已经有了一个能自我进化的 ai 员工,这才是 ai 智能体。真正的玩法 不是跟 ai 聊天,而是教 ai 干活,而教 ai 干活的核心工具就是 skill。 那 skill 到底怎么写?怎么样才能让 ai 真正的变强?这里面有非常多的细节和技巧,想深入了解的可以预约我春节期间的直播,我会把 skill 的 设计思路,还有实战案例全部拆解给你。我是 c 哥,点赞关注,咱们明年见!

大家新年好,今天是一个重磅的分享,经常看我视频的伙伴都知道,我在过去的时间里,用不读一行代码的方式,一种黑盒编程的方式,已经把一个项目做出了一个雏形。在这个过程中,我也积攒了一些经验,会陆续做成视频分享给大家。 去年 cloud 推出了这个 agent skills 这个功能之后,我也做了一些视频。现在 skills 的 使用价值已经完全的超越 mcp 了,而且我认为它的使用门槛是相当的低, 但是可能很多朋友还没有学会怎么用,今天我就教你们一个使用 skill 做自动化流程,给自己提效的一个万能公式。所谓的万能公式就是所有人都可以不用写代码就可以用。 那首先提到这个万能公式,我先介绍一个工具啊。这个经验来自于我之前用黑河编程做的项目,我经常让 ai 去做后端测试,他特别喜欢用这个命令, 我根据这条命令就构建了一套它用于测后端的一个脚本,所以我的项目开发的也比较顺。但这个命令我觉得我们不用去学习,你只需要知道,它可以模拟我们所有操作网页的方式。 如果你常用的 web 服务器是支持 api 访问的,那么你只需要让 ai 读一下 api 的 文档,它就可以构建出一套纯自动化的流程。当然这么听可能有点抽象,我会用了这个命令,跟我的这个 万能公式又有什么关系呢?我来举一个例子你们就懂了。我的女儿前几天考这个 g s p 的 五级 c y y 的 一个考试,她没考好,我分析了一下,其实是刷题刷的不够,虽然我给他做了一个 ai 工具,新奥制题助手,这个我之前分享过, 但是这个工具有一个问题,就是他没有自己的题库,这些所有的题其实还是我自己在网上找的,我要通过这个工具的内置功能给它加入进去。 但是这个怎么说也比较麻烦,你得录入题目,你得用 ai 分 析测试点,还得找答案。虽然我也在工具上做了一个类似 a 证的抓网页的功能,但我觉得不好用,而且它只能抓题目,它的测试点和答案你还得另找这个软件,它已经完全落后于这个时代了,我也懒得再去狗尾续貂, 但是我想了另外一个招,这招是什么呢?就是因为我的信号制题助手,它启动之后就会有一个后端服务器, 当初我觉得在这个 electron 里运行一个 python 服务器,这种设计还挺奇葩的,但是现在想想还是挺明智的。我把后端的 api 的 代码喂给这个 cloud code 之后,他竟然就把这个 skill 做出来了。 我只需要打开这个应用,然后让 ai 分 析我孩子的代码,让他有针对性的推荐题目,然后调用我的后端 api 加入我的提库。 所以说如果你有一个学习系统,他也是有后端的, ai 就 可以完全实现。他作为一个可以操作你后端的一个机器人,根据你的要求来操作你的后端,比如说给你出题,或者是帮你分析,可以把所有人需要去做的 任务一下一下点击做的任务,变成一个让 ai 去做的一个工作流,而且实现这个工作流,你不需要干任何事,你只要一句话,他就可以去执行很长时间。 给大家看一下我这个技能,做了两个技能,一个是一个叫 csp, 一个叫对拍。能不能看一下这个 csp 的 这个技能,这个技能 总体来说它就只有一个文档,它就是描述我这个信号制题助手的后端的 api, 它描述了一些场景,比如说它的基础的 url, 它怎么样去管理题库,应该怎么获取编程题,它的这个格式是什么? 给了一些例子,怎么样去获取答题记录,是用什么样的格式?如果你要验证代码,用沙盒验证沙盒的 api 是 什么, 包括你可以 c 加加,也可以用 python, 它描述了一些场景,场景一是怎么样添加新题目,怎么样看学生的答题记录,怎么用沙盒快速验证, 还给了一个文档,这个文档是一个完整的一个 api 参考,我只是把我的这个 api doc 给 ai, 通过这个 sql creator, 它就自己给我全部创建了。我给大家演示一下啊。首先这是这次我女儿没做的这道题,五级的一个题,她没做出来,我就说我就用通过这一个 prompt, 让她来分析她的算法和考点,然后在立扣上帮我找类似的题, 然后制度相关的要求,难度中等,把题单抓下来,放到我的题库里,在入库之后,用对拍这个技能来求解,让他一步一步执行。你看他先做了个计划,他知识点,他分析出来了, 好去立扣抓题,他用了很多的任务,子任务,最后抓到了五道题,这入库的结果,他现在做了五道题,他能获取我们这个资料库,然后找到资料库,把题目放进去,然后就开始就要用对拍工具做对拍来求解了。 当然这个对拍工具我觉得还需要优化,他用的时间巨长无比,他现在已经跑了四十分钟还没有做完。 当然一次搞五道题可能是有点贪心了,但是它还在积极的运行中,如果我们正常的使用来说,其实就可以把它扔这,让它自己去搞就行。好吧,只是给大家演示一下这个 skill 运行好了是什么结果,基本上我到目前为止, 我除了输入那个 prompt 之后,我还没有管过,所以其实基本上就是 one side, 你 可以让它自己一直搞下去。那我们如果再把脑洞开大一点, 比如公司的系统是用来查数据库而做分析的,你也完全可以让 ai 去调用一个 skill 去查,直接做分析。现在的外部架构基本上都是有为 api 的 设计的,所以任何带有后端的服务,我们都可以通过 api 把它做成 skill, 然后让 cloud code 成为它的外挂,而你不需要做任何的开发, 这就是我称之为任何人都可以使用 skill 提效的万能公式。可能有朋友问了,那如果我有一个服务器,但是我不知道 api, 我 没有它的文档,或者说我不会做 skill, 那 该怎么办? ok, 我 今天推荐两个工具啊,第一个就是 chrome devtools 这个工具,它简单来说就是给你的 cloud code 的 一个浏览器,我们来看一下,你看,我现在是让它用 chrome devtools 启动一个浏览器,访问落谷点 com, 它会打开这样一个浏览器,我在这上面做一个操作,接着我让它读一下它网络请求的这个日记。我刚做了个搜索,能不能分析下格式 ai, 它会自动从这个工具里把这个 network 的 请求全部列表出来,然后分析出来这个格式, 它会总结成一个文档,这个 json 格式。刚才我搜索了其实有一个是标签,这里要选标签的标签,标签其实它也是有一个 api 的, 所以我就问他有没有获取标签列表以及标签意义的处理啊?他发现找到了之后,他就给我去列举,他能把所有的标签列举出来,我让他去用这个方法去测试一下 五级减的二分题目,他很快就给我找到了一些这么多题目,五十三道题。有了这样一个东西, 我就可以让他帮我去找题目了。当然并不鼓励大家用这种方式对任何网站做这样的分析。你首先要看这网站允许不允许你这样做,如果他要求必须登录才能用的话,我建议还是不要做,这样 不太好。你们如果说你们自己的系统,比如说你公司内部的一个数据库,那你就完全随便了, 即使你没有这个文档,你也可以用我这种方法来获取。获取完了之后你会发现这整个的上下文就会充斥着这些关于结构的一些知识。我们该怎么做呢?我把以上获取的这个技巧放到一个新的技能,我让它创建技能了。最重要你要提到这个 skill creator, 这个 skill crit 是 一个 osophic 推出 skills 时的一个默认的一个基础技能,但是你需要去安装它, 我等一下说怎么安装?如果你安装好了之后,你在做任何技能的时候,你不需要自己去做,你直接告诉 cloud 用 skill crit 把以上的经验做成 skill 就 好了,就这么简单, 它会放到这样一个结构底下,就是放 skill 点 m d, 然后它会给你创建一堆脚本,当然这个脚本是什么样你们不用管,就反正它做好了,你直接用就行了。那么 skill crate 在 哪里找呢?在这个 repo 里头,这是一个 safari 推出的, 它也提供了一些安装手法, plug in, 通过 marketplace 方式,用 plug in 把这个 skill 安装进去,安装好了之后,它这个文档里头就会有所有的这个技能,其中你们看,这有一个 skill creator, 就是 这个 skill creator。 我 们再总结一下,如果你没有 api 的 文档,你不会做 skill 怎么办?首先你先操作一遍,让它抓取,然后给你生成一个文档, 接下来直接告诉他,用 skill creator 来做一个 skill, 就 这么简单。经常看我视频的朋友知道,我过去还分享过千万三 omni 的 语音互助,还有我的监工 agent 的 项目,还有我的 finnus 上的一些场景。 我相信呢,在今年就一定会实现一个场景,就是我们再也不需要使用 cloud code, 而是直接通过语音发出一个命令,然后我们的 worker 就 会在 boss 上给我们完成一个长线的任务,最后把结果给我们呈现出来。 所以我想说的是呢,我分享的这些内容并不是零散的,他们都是在为了实现这样一个目的,这样一个场景的技术战之一,所以我做的内容并不是为了做内容而找主题,而是为了实现我理想中的 agi 的 场景, 然后把我过程中的一些发现分享给大家,这是一个真实的长线的 ai 的 学习和成长,所以关注我,你们也可以获得同样的成长。 ok, 以上就是今天所有的内容了,谢谢大家。

人是离职了,灵魂被锁在这公司继续当流氓,你的公司在用 skill 的 方式窃取你的所有技能。但事实真的是这样吗? 前段时间啊,全网都在刷屏的同事, skill 说是把这个临时工的聊天记录啊,文档不给 ai, 哎,他就能给你蒸出一个数字,分身七成二十四小时给你干活,还有永生 skill 啊,说,与其等着被别人蒸,不如先蒸了自己。是我蒸了,我回答正确, 作为 ai 重度用户啊,我看完就一个感觉,又好笑又离谱。今天呢,我就把这个底层逻辑讲头,告诉你三件事,所谓的赛博永生到底是啥,能不能真替代你,以及你到底该不该换。视频有点长啊,建议你先点赞收藏, 先澄清一个最大的误区,很多人都以为这些 skill 背后有什么高深的 ai 训练技术,什么模型微调,什么知识蒸馏? 醒醒,在这个 collex 文件夹里呢,其实每一个数字,同事就是一个子,目录,里面呢,就放了几类文件, work, md 写工作内容, persona, md 描述人设性格,再配上一个 meta, jason 存 pick 信息, 就这么简单。这玩意的底层原理呢,其实就三句话说完你就懂了。首先呢,先是扒走你飞书钉钉邮件里的所有文字,然后让 ai 来总结一下你的说话风格,工作套路是什么。最后,让大模型照着眼装成你本人。这里面没有什么训练,没有项链裤,甚至连 rap 都没有。 打个比方,这就像是你给一个演员递了张纸条,上面写着,你现在给我演一个爱说法论剧,经常把锅甩给测试部门的产品经理, 演员照着眼就行了,你告诉我这叫蒸馏?真正的蒸馏,是拿大模型的输出去训练小模型,那是要 gpu 机群跑好几天的事。如果说写几个 markdown 文件就叫蒸馏了,那我每天拍视频写脚本,是不是也在蒸馏自己啊? 但是技术再烂,很多人还是怕他到底会不会替代我。我先问你一个扎心的问题,让你把这辈子的工作经验一字不差全写下来,你写的完吗? 当然,如果你几页纸就写完了,那你确实该慌,但要是写了半天,你发现越写越多,根本收不住,那你大可以放一万个心。 为什么?因为人的知识天然的就分成两层,在表面的那层呢?是你能清楚写出来的,手把手能教给别人的。比方说什么文档模板怎么用,代码规范是什么周报的格式长啥样,这些东西确实可以被总结,被复制,但是底下的那层, 是你自己都说不清楚的东西。比方说一个干了十几年的工程师,他看一眼图纸,他就知道哪是错的,但是你让他讲一讲,到底不对劲在哪,他可能自己也描述不出来。 一个资深运营,扫一眼数据,他就能嗅到风险在哪,但是那个嗅觉是怎么来的,他写不成 s o p。 而咱们说那什么同事 skill, 能唠叨的只有那些最上层的,什么你说话的习惯,你爱用的词,你处理常规事物的套路, 这些,他也许能模仿个流计算。有人作为一个估算,说人脑存储信息量大概是在二点五 pb 左右,就算跟工作相关的只占百分之一,那也是二十五 pb。 你 用几十个 kb 的 文件来浓缩这二十五 kb 的 内容,这不叫蒸馏啊,这叫蒸发,蒸发的 只剩渣了,哈哈哈哈。而且这个东西技术上还有一堆硬伤。首先,他没有记忆,其实你每次打开他的对话呢,他都是从零开始读那几个固定的文件,上回聊了什么,其实他完全都不知道。其次呢,聊久了之后,他会串戏,对话轮流一多呢,其实上下文窗口里塞满了新的内容, 最开始那段人设描述的影响力,他就越来越弱。结果就是你那个本来应该惜字如金,从不闲聊的同事,聊着聊着就突然开始跟你唠家常了。还有一个特别反直觉的问题啊,就是你越让他去扮演某个领域的专家吧,他在那个领域反而越容易出错, 因为他的注意力全花在模仿那个人的说话方式和行为习惯上了,对问题本身的思考反而被干扰了。真正的记忆是什么样的,是你人脑袋里的这个海马体, 他会把这个信息加工、压缩,筛选该记住的,沉淀下来,不重要的,慢慢淡化。这是写进神经连接里的东西,不是靠一个越塞越满的文本框撑着。 然而现在的这个 transformer 架构的模型,一旦训练完,部署上线了,参数就冻结在那。之后呢,不管你跟他聊多少轮,他自己不会成长,不会因为跟你的互动变得更懂你。 想更新。哎,那你就回炉重造,重新训练吧。但这其实呢,是整个行业都在面对的问题。如果 kia 的 严架构,核心就是在解决这两件事,一个呢,是让模型具备原生记忆,推理的过程中记忆模块哎,会跟着变化, 不是靠上下文应承,而是真的把信息沉淀进参数里。另一个呢,是训练和推理同步进行,模型部署之后呢,还能再继续学习。不是说一上线就变成一个固定不变的函数了,说直白点就是让模型从一个死的工具变成一个活的东西。 所以总结一下,这些 skill 啊,他只能学你同事的语气,但是学不了你同事那脑子,这两个东西之间隔着一条银河。最后,我想聊点更深的,这件事真正有意思的地方,其实不在技术本身,而在人心。你想过没有,一旦公司开始偷员工的工作痕迹做 skill, 大家会怎么干?没有人想被蒸馏,所有的人都会开始主动注水。专业内容换成正确废话,逻辑完美,信息为零, ai 根本看不穿。哎,咱能当面说的绝对不打字,能口头聊的绝不写文档。最后公司呢,费了半天劲拿到的全是垃圾知识资产。 更可怕的是什么?是团队愿意分享的氛围彻底没了。所以,这件事的真相到底是什么?一个开源社区的整活项目,经过了一轮又一轮传播,被包装成了什么?赛博永盛、职场末日,每传一次,技术细节就模糊一层,恐慌情绪就放大一倍。 波兰尼的辩论就告诉我们说,自动化只能替代那些可以被完整描述的工作,越是说不清楚自己怎么做到的那部分,越难被替代。所以说,与其担心自己到底会不会被做成一个 sketch 文件,不如想想你每天在干的事情里,有多少是只能你干,别人学不会的? 如果够多,那这个就是你的护城河,如果不够,那需要警惕的也不是什么 ai 提升,而是任何一个比你更努力的新人。 最后呢,想问大家一句,如果未来真的有这么一个 skill 能完美复制你的能力,你会欣然接受还是坚决抵制?感谢大家收看本期节目,我是王瑞,我们下期再见!

哈喽,朋友们,我是阿水, a 正的 skill 最近真的太火了,但是很多朋友肯定想知道到底啥是个 skill, 凭什么这么火?那朋友们莫慌莫慌, 我呢已经为大家整理好了一套小白必读的 skill 大 全,今天的内容呢,我们将从简单到困难,一路升级打怪。首先呢,我们来看 skill 的 结构和它的原理, 然后呢,我们通过学习来定制自己的 skill。 这个 skill 呢,我们只需要简单的一句话,帮我根据这篇文章生成 ppt 分 析和内容规划,那它就会自动去执行和生成我想要的资料。 另外呢,我还会给大家推荐一些好用而且必用的 skill, 比如说帮你的文章配图,把杂乱的知识变成一个教学网页, 一句话处理表格等等等等等等。这期所有的资料我都已经整理成了文档,只需要一步一步跟着做,跟着看,就一定可以学会。那还在等什么呢?赶快点赞收藏关注呀! ok, 那 我们就 let's go! 那说了这么半天,到底什么是 agent skill 呢?直译过来呢,其实就是技能呗,比如可以把它看成一只小狗,这只小狗呢,它会记路线,听指令,使用工具,能听懂你的语气。那 agent 呢,也是同理,它要和你和平相处,也是要会这些东西的。 所以在 a 证的 skill 的 术语里面呢,它最最最核心的文件就是 skill 点 m d ai 的 工作手册,当然呢,还会有其他的文件,最后将这些文件集合在一起,打包成一个文件夹,这就是一个技能,一个 skill 了。 那有同学就要问了,阿水看着挺复杂的呀,这么做的好处是什么?本质上来说, skill 对 不懂代码和不懂怎么去创建软件的小白群体来说, 是大大降低了门槛的来,如果还是不懂,我们做一个超级简单的 skill 就 好了。这里呢,我用到的是谷歌的反重力工具 模型呢,因为可多扣的真的封号太严重了,我就用 jimna。 那 这个软件的下载方式呢?我已经放进了文档里面,可以说是非常的 perfect, 比如说我们打开反重力,在这里呢,选择模型 jimna pro 就 可以, ok, 我 们就可以开始创建了。那我们就先创建一个可以制作 ppt 的 skill 吧,可以根据我输入的文章链接或者文字帮我生成一个 ppt 内容规划。那按照反重力的创建规范呢?局 skill 必须在这个目录下面, 那我们先用最基础的方式手动创建这些文件夹,这个文件夹的名字呢,就是我们的 skill, 名字就叫做阿水 ppt 吧。这里的文件夹里面呢,必须有一个核心的文件,就是 skill 点 md, 文件 内容我已经创建好了,我们只需要把它粘贴过来就可以了。好了,这就是一个 skill 了啊啊, 有同学就会问了,这么多内容代表什么呀?别着急,我们一个一个来看。那这个文件里面呢,上面两条横线里面的内容,它叫做原信息,里边呢,有两个信息,一个是 skill 的 名字,一个是描述,就是它用来干嘛的,什么时候可以用它? 那我这里呢,直接写的,用 ppt 的 时候可以用。下面这一大段信息呢,就叫做指令,其实这里就是告诉 skill 它应该怎么做。那这里呢,我就直接写到怎么用,输出的格式是什么?那这个时候呢,就有同学又要问了,你这和自己写提示词有什么区别呢?嗯, 其实呢,还是稍微有点区别的,比如我们之前在用 jimmy 里面去生成,每次都是需要去重复输入提示词, 那如果现在去用 ide 文件,那我们只需要去输入需求就可以了。当然上面这个案例呢,是最最最初级的创建方法,简单的 skill 完全可以这么实现。那在做这个的时候,我就在想,有没有创建 skill 的 skill 呢? 果然不出我所料呀,可罗得克的官方出了一个创建 skill 的 skill, 它可以通过你的自然语言描述帮你创建一个 skill。 那 这个 skill 的 安装方法呢?大家可以去看我上期视频,巨简单。 当然这期的文档中呢,我也整理了安装方法。安装好了之后呢,我们只需要在这里用大白话描述帮我创建一个可以根据我提供的文章链接 pdf word 帮我生成 ppt 图片。这里呢,因为我们需要用到 nintendo 的 模型 api, 我 们就直接将 api 输入进去就好了。那通过我们这么一番描述,可以看到 ppt scale 就 创建好了,现在的 scale 就是 一个完整的 scale, 可以看到有说明文档,有脚本,还有输出文件夹。嗯,奇怪,我怎么感觉高级版创建起来怎么还比初级版创建起来更快更方便,更简单呢?对,主要是我们使用了创建 skill 的 skill 工具, 那我们来试试效果,出来的效果图呢,都是很不错的。那其实这个案例看下来呢,我们更多的是在用自然语言去写程序的一个功能,降低了代码的难度,而且拉近了普通人和创建软件的距离。所以只要你有明确的输入要求,或者有明确的方法 规范流程知识,创建 skill 工具呢,都会帮你创建出来一个定制的 skill 文档,里面呢,我整理了一些收集 skill 的 网站,里面有成千上万的 skill, 并且呢,我也给大家搜罗了一些普通人常用必备的 skill 工具,比如做 ppt 处理,文档表格处理,我们可以直接拖进文件夹就可以使用了。还有这个就是前端设计的 skill, 还有这个动画生成 skill, 可以 帮你做一些数学上难懂的演示动画。 当然大家也不用太焦虑怎么去把所有的东西都创建一个 skill, 我 们每个人呢,都不是必须成为技能开发者, 我们只需要把自己已经掌握的小技能或者已经沉淀出来的一些方法,重复性的事情交给让他去帮你做一些重复性的劳动力就可以了。那最后呢,资料链接我都放在了评论区, 大家快去手动创建试试吧。这个时候呢,大家就不要吝啬自己的点赞收藏关注技能了,我们下期再见,拜拜!

今天学习 skill 怎么安装和使用,重点不是被概念,而是先装进去再分清,直接点名和关键词命中,最后再用 slash skills 和 slash context 检查它到底有没有真的加载 安装。最简单的路径是把 skill 放到项目的 dot cloud slash skills 或者局的波浪线 slash dot cloud slash skills 每个 skill 至少有一个 skill, md cloud code 会把它当成可附用能力读取。装好之后先输 slash skills, 看它有没有出现在可用列表里。 直接点名适合你已经知道要用哪个 skill 的 时候,比如你就是要监控 github 提交,那就直接输入 slash github commit monitor, 再交代任务,这种方式最稳, cloud 的 行为会更可控,风格也更一致。 关键词命中适合你只想描述目标,不想自己挑 skill。 比如你直接说帮我盯一下这个 gitlab 项目的提交更新, cloud 就 可能根据关键词命中 gitlab commit monitor。 这时关键不是说 skill 名,而是把场景、目标和输出说,具体 怎么判断它到底有没有生效。先看 slash skills, 它告诉你现在有哪些 skill 可用。再看 slash context 里面能看到这一轮上下纹理到底加载了哪些 skill。 如果没命中,就改写任务或者直接点名,不要靠猜。 所以真正好用的顺序只有三步,先装进去,再按情况选择直接点名或者关键词命中,最后用 slash context 复查一次,你就知道 skill 是 不是真的在帮你干活。

被一百一十万人看过的前任 skill 该如何使用呢?首先需要准备这些,我已经配置好了,像这样的可以使用就可以了。然后 skill 库需要复制到这个目录没有,需要创建一个,这里我已经创建完成了。回到刚才的 open cool 界面, 输入命令斜杠 create 杠 e x, 然后发送给 ai, 让它反应一会,这里加速一下,时间长短取决于网络和性能。 这里就生成出来了一张信息表,大家可以按照上面的信息去填写。这里我为了演示,就直接让 deep c k 生成了我复制的这样一段提示词,可以让 deep c 虚构一个前任,交给 deep c 填写一下。 deepsea 给了这样的回复,然后就可以把 open 框了里的消息复制给他,让他填写,这样让他写出来了之后就可以发送给 ai 了。 复制发送给 open 框 信息发送给他后,让他阅读一下信息,然后继续提问。 接下来他会给你下面几种方式,导入聊天记录什么的。这里我仍然是复制发给 deepseek。 其他方式按照 openclaw 里说的去做就好。这里我让 deepseek 选择一方式, 他输出了这样的内容,如果是你也可以参考这个格式。 仍然复制粘贴给 openclaw, 再让他反应一会儿, 这里我加一下素。 openclaw 会问你需要补充信息吗?这里可选。 这里我还是复制发给 deepseek, 这里它补充了一些内容,然后就复制粘贴发给 openclaw 了。 这里再加一下素。需要等很久时间,会创建很多文件在工作区, 这样这个前任就创建成功了。然后就可以输入他给的命令来对话,这里我演示一下, 复制这个 openclock 给的启动命令发给他,等待一会儿就会给你发一条消息,这样就配置好了, 他给你发送了一条聊天消息,这样你的前任就成功机械飞升了, 给他发送消息后马上就会回答你,这样就完全 ok 了。我这边又发了几条。 另外就是这个 open 跨是比较费 token 的, 我建议用国产的大模型去聊天,像 gpt 跨的会比较贵,我这边也只是一小会儿就消耗了一百万的 token。 另外说一下,你的前任是一个真实的人,他有自己的人生,这个 skill 只是你记忆中的他。那最后就用开发者的一段话结束吧。

今天来学习一个内容,叫做 skill, 就是 ai 的 这个 agent skill, 那 么到底这是什么东西呢?啊?很多人误解,就是说它 skill 就是 教 ai 去做某件事, to do, 做某件事情。那么其实呢,我们拿一个东西来举例,比如说 cloud, 他会什么?他会什么?他会代码,他会写代码,他会 pdf, 是 什么东西啊?他会写文章啊?他知道 api 这些东西的概念,但是呢, 他不知道有一些东西要怎么做,怎么做,具体怎么做啊,这就是我们要教他的 skill, 这些东西它本来就会啊,对啊,都不需要我们来教,是不是这些它本来就会,等等等等等,它本来就会,那么我们来看一下传统的,呃, ai, 传统的 ai 跟 skill 的 一个区别。传统 ai 它是怎么走的呢?传统 ai 它首先要收集数据, 收集数据之后,然后搞一个集群,弄完集群之后进行一个参数的训练, 训练完之后啊,那就是一个新版新的版本了, 我先把控制啊,新版本,这是一个新版本,那我们来再讲。接下来讲一下那个 skill, 它一个呈现的形式是什么? skill 啊?它其实是一个压缩包, 压缩包,那么它里面有什么呢?首先一个大的文件夹嘛,啊,它有个一个名字,那那下面它有个主要的一个核心文件,它叫做 skill 点 n d 后缀的一个核心文件。这个核心文件它的目的是什么呢?用来定义名称、描述和使用规则啊。接下来还有一个, 呃,可选的一个样本叫做 script 描述 p t s。 啊,这个文件夹它主要是放脚本的, 接下来一个参考我就不写了,参考 reference, 参考参考资料,再接下来就一个素材库, a s 素材库。素材库的话里面放的是什么呢?一些图片呢?文字啊?哦,但是一般大部分没有用的 skill 为什么没有用?因为它没有下面那些东西,而且它这个写的也非常的烂,这就为什么大部分是没有用的。 如果以前有了解过 ai 绘画的同学的话,他应该是会有了解过一个东西,叫做 laura, 这玩意,它就是一个微调模型,跟这玩意其实是一样的道理啊,我突然反应过来,这其实是一样的道理,它就在原有的基础上进行一个微调。以前像我们绘画的时候,我们想让,比如说一幅一个人嘛,一个女孩子, 一个女孩,是吧?我们接一个提示词,那么他生成就是一个女孩,如果我们有加了一个 lora, 一个这样的微调模型的话,他就会变成什么。我们这个模型里面的 描述核心要求是对方,对方什么梳着梳着双马尾 啊,然后蹦起来, 蹦起来啊,蹦起来。那么我们用了这个之后,它输出的内容都会具备这两个属性,都会有双马人和蹦起来,并且我们当时到里面会有给他的一些参考啊,素材之类的,那么他就会按照这两个走, 就是你一个东西完成之后,它会再完成这一步,然后最后输出一个最终结果,如果没有这个,它就会输出一个女孩,个千千奇百怪的女孩子 啊,就是这样子,这个就是一个 skill 的 一个呃,类,形容类比吧啊 laura。 然后我们最后来讲一个核心的公式啊,公式 叫做什么呢?通用 agent 加加什么优秀的 优秀 skill, 那 么就会变成了一个特定领域的专家 agent 啊,这就是智能体专家 agent 啊,这就是一个核心公式啊。现在从市面上呈现了非常多的 skill, 这玩意就是微调模型了,也是可以练出来的啊。我们,你看我们从提示词 promise 啊,提示词 到 agent 再到 skill, 其实这一个跟当时 ai 绘画的一个路径非常像啊,非常像啊,当时 ai 绘画也是这样的一个路径走的, ai 绘画的的那个前度还比现在主流的 ai 对 话还要靠前一点,更早。

你是不是也受够了你的 ai 总是忘事,每次都得重新交一遍。今天我们就来聊聊怎么彻底解决这个问题,让一次性的指令变成永久的超能力。 好,咱们先来聊一个我敢说几乎每一个人都碰到过的烦心事,没错,就是 ai 的 失忆症。 你有没有这种感觉,每次跟 ai 开个新窗口,就好像,嗯,你们是第一天认识,你得把你的背景、你的要求,你喜欢什么风格,全都再说一遍。这简直就是 ai 版的土拨鼠之嘛,天天都在重复昨天的话,太累了。 你看,我们现在跟 ai 聊天,其实大部分时候就像是在下口头命令,说完了 ai 立马就忘了。 但我们真正想要的,其实更像是一份白纸黑字的书面合同,对吧?一次定好规矩,后面每次都照章办事,精准又可靠。 那问题来了,这份儿书面合同到底要怎么写呢?答案嘛,就是一个特别酷的概念,叫做 open call skill。 简单来说,一个 skill 是 什么呢?你可以把它想象成一个给 ai 用的独立小 app, 它不是那种说一次就忘的指令,而是装在 ai 工具箱里,一个可以永久附用、随时拿出来用的专属工具。 你看这个表就一目了然了。 prompt 呢,就是咱们平时聊天说的话,说完就忘,下次还得重说。但 skill 就 不一样了,它是一个打包好的结构化的文件,能长期有效。 而且最关键的是, prompt 只能靠你手动输入,而一个强大的 skill 甚至可以自动识别你的意图,自己就跑起来干活了,这差别可太大了。所以总结起来就一句话特别精辟, prompt 只是在说话,而 skill 才是真正在做事。 这就是普通聊天和真正实现自动化之间的那道分水岭。听起来很神奇,对吧?那它到底是怎么做到的呢?别急,我们现在就来拆开看看一个 skill 的 内部到底长什么样。 每个 skill 啊,它都有一个核心,就是这个叫做 skl 点 m d 的 文件,你可以把它想成是这个 skill 的 大脑,或者说是一份个人简历,它清清楚楚地告诉 ai, 我是 谁,我能干什么?你该怎么用我 这个架构啊?用一个比喻你就瞬间明白了。你看, skill 点 m d 就是 大脑负责思考和指挥。然后呢, scripts 目录里的代码就是它的手和脚,专门用来执行具体的动作。 最后, references 目录就像一本随身携带的百科全书,需要什么专业知识随时可以查。你想想,一个有大脑有手脚,还带着百科全书的工具,它能不强大吗?好理论我们都明白了,但说一千道一万,这东西在现实中到底有多大用呢? 接下来这个例子绝对会让你大吃一惊。我们来看一个真实的例子啊,由于产品经理,他每周都有一个超级头层的任务,就是要手动去各个系统里扒数据,然后整理汇总,最后写成一份详细的进度周报,听着就很烦,对吧? 你猜这么一套流程下来,每周要花他多长时间?不多不少,整整两个小时去做这种重复劳动。 但是有了自动化工具,情况就完全不同了,他给自己定制了一个 skill 之后,你猜发生了什么? 整个流程从两个小时直接被压缩到了你没听错,仅仅两分钟,就是说以前要吭哧吭哧干两个小时的活,现在只需要跟 ai 说一句话,泡杯咖啡的功夫,一份完美的报告就自动生成了。这个效率提升简直是指数级的。 当然了,这不只是学周报这点事,你想想看,所有那些重复性的工作,比如录入数据啊,或者那些需要点专业知识才能干的活,像是查数据库啊,调 api 接口啊,还有那种需要跨平台操作的,比如把数据同步到飞书 slack 上, 所有这些 skill 都能帮你搞定。讲到这里,我猜你肯定心动了,是不是已经迫不及待想试试这个 skill 了?那到底该从哪开始呢? 很简单啊,记住这个名字, claw hub。 这就是官方的 skill 生态系统,你就把它当成一个 skill 的 应用商店就行了,上面有各种各样别人已经开发好的 skill, 你 可以直接下载来用。当然,如果你自己做出了好东西,也可以分享上去。 我们随便看几个现在 cloud hub 上特别火的 skill 啊,比如说这个 wechat article pro, 顾名思义,帮你写出专业级的公众号儿文章。还有 modguard, 这个是搞 ai 安全的,能防止你的 ai 被恶意指令攻击。 还有像 github 这种能直接帮你自动化开发流程 summarize 呢,你丢给他一个文件或者文字,他能立刻给你总结出核心内容, 这些都只是冰山一角,可能性是无限的。好了,说了这么多,最后让我们一起思考一个问题,现在就现在,你想一想,在你每天的工作里,有没有那么一件,就一件让你觉得特别烦、特别重复、特别浪费时间的任务? 找到它?因为这个问题的答案很可能就是你开启 ai 自动化之旅,解放自己生产力的第一步。

这套流程可以让 ai 自动操作浏览器,代替你完成一切机械重复性的工作,而且特别的省 toc 很多工作流甚至全程不需要 ai 参与,零 toc 就 能把自动化任务跑起来。比如可以零 toc 抓取电商网站评论,导出成 csv 文件,自动把 markdown 文章发布到 x。 还有对自己开发的 web a p p 进行 ai 自动化测试。我们并不需要懂浏览器的相关知识,只用自然语言就能完成这些任务。本期视频我们使用的 agent 的 框架是 cloud code 或者 codex。 浏览器自动化方案是 playwrite c l i 搭配配套的 skill。 playrite c l i 是 二六年初微软开源的全新浏览器自动化工具。根据官方的精准测试, playrite c l i 比起传统的 playrite m c p 方案,差不多能够减少四倍的 token 消耗。工具搭建好以后,我们可以把很多固定的工作流程沉淀成 skills, 让 ai 能够又快又省的完成任务。甚至熟练后你会发现很多固定流程甚至不需要 ai 参与,只需要让 ai 编辑好一个固定的脚本,就可以零偷看全自动完成工作。好,废话不多说,我们直接开始。 在开始之前,我们需要先确保电脑上安装了 node js, 如果没有安装过,可以来到 node js 的 官网,根据自己的操作系统下载对应的安装包。然后我们打开一个命令行终端,输入这个命令,安装 playwrite c l i。 安装完成。下一步我们要确保电脑上安装了 chrome 浏览器, 如果是 edge 浏览器也可以,不过最好还是推荐使用 chrome 好, 这样准备工作就完成了,我们来测试一下,我们可以使用这个命令,使用 playwrite c l i 操作 chrome 浏览器, 打开谷歌的官网。最后一个参数 hide 的 表示使用的是有头浏览器,如果不加这个参数, playrite 默认使用的是无头浏览器,无头浏览器会在后台静默运行,虽然比较省内存,但是我们看不到浏览器的页面,所以为了方便调试,我们一般加上这个参数。杠杠 hide 的 回车, playwrite c l i 自动操作 chrome 打开了我们要的网页。我们在控制台这边可以看到, playwrite c l i 只是输出了一个简洁的网页摘要,而没有返回整个网页的全部 dom 结构,下面附带了一个网页结构的文件地址, ai agent 如果需要更详细的网页结构信息,就可以选择读取这个快照文件,获取更详细的信息,如果不需要,就可以选择不读取。这也就是为什么 playwrite c l i 比起 m c p 更节省上下文的秘密所在。因为 m c p 是 把网页内容全部塞进上下文, 而 playwrite c l i 可以 由 ai 按需加载的思路。 screenshot 是 给浏览器截图,我们看到截屏的时候,它还是以一个 p n g 的 文件的形式 存放在了电脑的本地硬盘上,由 ai 决定是否来读取,而不是像 m c p 那 样直接把图片塞入 ai 的 上下文。我们再介绍一个重要的参数,就是杠杠 persistent, persistent 表示把 cookie、 登录状态、本地存储之类的数据写到硬盘里面,下次使用的时候继续拿出来用, 这样就不需要每次都重新登录了,比如我之前登录过,我们打开的谷歌首页就变成了已经登录过的状态了。 到这里我们就介绍完了 playwrite c l i 的 基础使用,下一步我们就把它接入 ai agent。 本期视频主要使用的 agent 的 框架是 cloud code 和 codex。 爬爬虾之前有很多期视频介绍 codex 或者 cloud code 了,这里我就不赘述了。 playwrite c l i 是 一个新诞生的命令行工具, ai 并不知道该如何使用这些命令,所以我们需要给 ai 搭配 skills 来一起使用 playwrite c l i 作为技术底座,而 而 skills 作为说明文档, c l i 加 skills 搭配起来使用,就可以取代传统的 m c p 方式,这也是最近的一个技术发展趋势。我们先新建一个项目文件夹,打开这个文件夹,打开命令行终端,我们直接输入这个命令,给文件夹里面安装 skills, 这样 skills 就 安装完成了, 它放到了我们新建的项目文件夹的这个目录下面。然后我们就可以启动 cloud code, 我 来询问它你有哪些 skills 可以成功地读取到 playwrite c l i 技能,这样我们就成功地把它接入了 cloud code。 接下来我们来看另外一个 agent 的 框架,就是 codex, 我 们只需要在项目目录里面把存放 skills 文件夹的名字从点 cloud 改成点 codex 来适配 codex 就 完成了。 然后我们还是在这个目录里面打开 codex, 在 codex 里面可以输入命令斜线 skills。 我 们看到这里列出了 playwrite c l i, 在 codex 里面也配置完成了,我们在 codex 里面测试一下基础用法, 我让他使用 playwrite c l i 加上这两个参数,打开 guirk, 问问今天青岛的天气怎么样。 ai 成功的打开了浏览器,来到了 guirk 的 首页,帮我们自动输入了问题,自动点击了回车,拿到了结果,最终成功打印到了控制台上,任务就完成了。 我们来看一个复杂一些的例子,使用 playwrite c l i 查看这个商品前一百条评论,然后保存到一个 c s v 文件里面。 我们看到 ai 还是先学习 playrite c l i 技能,然后打开了商品页。第一次运行总是磕磕绊绊的,不过没关系,我们让他自己探索, 自己寻找解决思路。 ai 尝试了很多方案,也浪费了不少头肯,我们看到这里显示用掉了百分之四十一的上下文窗口,最后成功完成了任务,帮我们获取到了这个 c s v 文件,成功抓取到了这么一百条数据。我 我们有两种方式可以把这个流程总结并且保存下来,让它下一次执行变得更加丝滑,更加省 token。 我 们先来看第一个方式,就是把这个过程保存成一个 skill 里,输入提示词,创建一个新的 skill, 把刚才打开网站查看评论,并且保存评论的全过程,还有遇到的坑都提炼出来,保存到这个 skills 里面,后面我只要让你保存评论,你就能调用这个 skill 完成任务。 ai 帮我们创建了 skill, 把这个任务里面可以附用的内容都固化进了知识 这里,我让他修改一下,把 skill 放到项目目录里面, skill 成功放到了项目目录下面,现在我们有两个 skill 了,一个是 playwrite c l i, 还有一个就是刚才保存评论那个流程的 skill。 这里我先清理一下上下文,我们再用相同的任务来测试一下。 有了 skills 的 指导以后,效果就不一样了。 ai 充分吸取了之前的经验,没有再出现多余的动作,也没有报错,用最低的 token 消耗完美的完成了任务。 我们第一次让 ai 自己摸索,自己试错,用了百分之四十一的上下文才完成了任务。第二次,有了 skills 的 指导,只用了百分之五的上下文就完成了任务。通过把过程提炼总结成 skills, 获得了将近十倍的效率提升。抓取评论是一个固定流程,其实并不需要 ai 进行智能化的控制, 我们可以直接把它编写成一个固定的脚本,这里输入提示词,你把刚才所有的 playwrite c l i 命令汇总成一个脚本,执行脚本就能获取商品的前一百条评论,并且保存到一个 c s v 文件里面。注意,每一步都要有合理的延时与等待,确保任务成功。 脚本写完,你先测试一轮,很快 codex 为我们编辑完成了脚本,他已经自己测试通过了。我们来看一下这个脚本长什么样。在我这个 windows 电脑上就是这么一个 power shell 的 脚本。 a a 以编程的方式把刚才的步骤都固定下来了。 比如第一步,打开商品页面。第二步,确认浏览器里打开的是正确的 u r l。 第四步,点击查看全部评价按钮。最后一步,把刚才的 json 数据保存成一个 csv 文件, 我们也来测试一下,我们打开一个命令行终端,输入这个 power shell 脚本的路径回车执行。这是一个固定的流程,中间没有 ai 的 参与。我们看到这次不再依赖 codex 了,直接执行这个 power shell 脚本,零偷坑,零成本就完成了任务, 还取得了相同的效果。好,我们来总结一下这套浏览器自动化的流程。在准备阶段,我们先安装 note js, playwrite c l i 还有 chrome 浏览器。第二步,选择你喜爱的 a i a 阵的工具,把 playwrite c l i 的 skill 安装进去。第三步,给 a a 一个复杂的任务, 让他自己摸索并且执行完。第四步,让 ai 把刚才的执行结果提炼,总结成 skill, 之前遇到的坑就不要再踩了。第五步,重试相同的任务, ai 在 skills 的 指导下,可以把 token 的 消耗降低十倍, 如果是完全固定化的流程,还可以继续进行。第六步,让 ai 把这个过程直接编写成一个脚本,有了脚本以后,我们甚至可以直接执行这个脚本完成任务,完全不需要 ai 参与,把 token 消耗直接降低到了零。 我们再来看一个实战案例,最近扒扒虾,把自己的视频用 ai 转成图文教程,然后发到各个平台上面。大部分平台发文章都比较简单,唯独有一个平台 x 发文章的步骤非常的繁琐,这是我的一个文章,是不能直接以 markdown 格式粘贴过来的。首先这个格式会错乱,第二个问题是图片都展示不出来。然后我又测试了一下,如果使用 html 格式 是可以粘贴的,但是又出现了一个新的问题,图片是粘贴不过来的,图片都变成了这么一个照相机的小符号,我们只能手动先把小照相机删除,然后把图片复制一下,一张张的手动粘贴过来, 非常的麻烦。接下来我们就使用前面介绍的自动化流程,把这个发文章的全过程进行 ai 自动化。这里我还是使用 codex 帮我编辑一个 python 脚本, 把文章里的图片下载到本地,从零零一开始编号,放到这个文件夹里面,先转换成一个只使用本地图片的 markdown 文章,然后运行 python 把本地图片的 markdown 文章转换成 html 格式,注意 html 格式里面每张图都应该是独立段落。 开始 ai 帮我们编辑好了脚本,并且为我们转换好了文章。我们来看一下,图片都放到了这个 image 文件夹下面,而且已经把文章转换成了 html 格式的。好,下一步我们就可以让 ai 来帮我们自动发文了,我们输入提示词,使用 playwrite c l i 先打开这个网站,创建一个新的文章, 然后把这个 html 的 内容粘贴进去,找到所有的这种照相机的这种小图标的位置,先按退格键删除掉小图标,然后在图片文件夹里面找到图片,先复制出来,按 ctrl v 再粘贴进去。这个小 icon 的 数量跟图片的数量是相等的,我需要他按顺序替换好。我们开始 ai 为我们打开了浏览器,创建了一个新的草稿,把 html 格式的文章粘贴进去了,然后他开始为我们一张张的上传图片, 把原来的站位符删除掉,然后一张张的替换成真正的图片,我们看到他正在一张张的帮我们自动化的替换。整个过程非常的顺利,我让 ai 把从头开始的全流程整理成一个 skill, 然后放到项目目录, 以后我只要给你一个文章就能自动发布。 ai 帮我们固化了一个 skill, ai 为我们编辑好了技能,生成了这些配套的脚本,然后这个 skills 就 可以覆盖自动发稿的全流程。以后我只要给他一个文章路径,告诉他使用这个 skill 自动发布, 就能自动地帮我把这个文章发布上去,非常的棒。这个 skills 的 源代码我已经上传到了 github 的 这个仓库下面,感兴趣的观众朋友们可以来参考试一下,不过我这个是 windows 电脑的,如果是其他操作系统,可以让 ai 参考这个 skill 来改一下。相信按照我这套流程,大家都可以编写出属于自己的 skill。 我 们这套浏览器自动化流程一个重要的应用就是对自己写的 web app 进行自动化测试。 比如这里我开发了一个简历润色美化的网页 app。 接下来我输入指令阅读代码,把从注册开始的主体流程写一个中文的测试文档,然后再用 playwrite c l i 打开网页,根据你的测试用力完成测试。 开始 ai 通过阅读代码学习到了这个项目的功能,然后确认了主体流程,接下来他开始编辑测试文档。测试文档编辑好了,这里包含第一步做什么,第二步做什么,第三步做什么。 然后 ai 使用 playwrite c l i 打开了浏览器,它自动点击了注册按钮,创建了测试账号,完成了登录。它创建了一份测试简历,并且上传上来了,完成了主体流程的测试。测试结论是通过。我们也可以要求 ai 编辑更多的测试,用力使 用 playwrite c l i 进行全自动的测试。还可以使用 openclaw 这种带定任务的 agent 框架,让它定时对我们的系统进行测试。一旦我们修改出来了 bug, ai 就 能全自动的发现,并且告诉我们省去了很多的人工测试成本,对我们开发网页 app 会很有帮助。好,这就是本期视频全部内容了,感谢大家点赞支持,我们下期再见!

ai 对 话助手终于上线了啊,终于上线了。然后我们来先说一下这个 ai 助手有什么功能?首先它可以进行一个聊天对话,然后可以进行一个图片生成,下面我说一下它该如何去使用啊? 呃,我们这里面呢,可以选择我们的一些 api 的 一个接口,比如说 gemini 啊,然后 gpt, 当然这个 gpt 的 这个 api 我 在网上没有找到啊。 然后这个还有 dsp 管,咱们就以这个 dsp 为例啊,你这边需要配置什么?你只需要得到一个 api 啊,你去他那官网啊,去这个 dsp 的 官网去获得他这个这个 api, 然后你把这个 api 粘贴到这个地方之后呢,把这个模式改成这个,选成这个聊天模式之后呢,我们只需要点击这个启用调节, 它会蹦出这么一个窗口,这个窗口的作用是什么呢?就是说让我们的对话呢,能以这个流的形式,就是呃进行一个反馈,如果我们不开启这个东西呢, 它给我们的对话呢,就是会把你的对话返回这个对话所有的内容都已经返回完之后,它会统一发你。如果你开启了这个东西啊,开启了这个本地调节服务,它会以那个,就像咱们用那个正常网页版的 delete 的 时候,它会生成多少,它就往上反应多少啊,然后我们这边试验一下啊,我这边已经添起了这个呃, 这个 api k 了,然后我们跟它比如说打个招呼,你好,哎,它这边就开始说话了。之后呢,这个东西呢,还可以记录一个上下文功能啊, 这个记录上下文功能呢,其实就是为了节省 token, 正常像我们使用那个 deepsafe 的 话,它会默认开启这个上下上下文记忆的,然后呢它就会比较浪费 token。 那 么我们这里边呢,就是说你需要几轮的话,你就勾几轮,比如现在我们跟他说话说了一轮,然后我们只需要打了打了个一轮,然后问他,我们说,呃,刚才我问了你什么, 然后他他就返回了这些东西,对吧?然后下面呢我们再试一下这个千问的啊,千问的一个 api, 他 这里边千问呢,我这里边设置了一个千问实图跟千问生图的,然后我们可以先试下这个实图啊,我们给他发一张图片, 比如说我发这个,我问问他图片里有什么,然后把这个上下文关掉,关掉啊, 它这边呢就会详细的给你列出来。那么像 deepsafe 的 话,它为什么我不用它不用 deepsafe 去识图,因为 deepsafe 只能识别图片中的文字。之后我们再看一下它还有什么功能啊?比如说我这边调用一下这个 gemini, 这个 gemini 呢是我自己找的那个 api, 然后接的个接口啊, 然后我们把一张图片传给他,比如说这个图片我们打开看一下,他有一定的尺寸,然后呢我们就对他说装成图片中的架子的模型,呃, 根据图片中的啊,根据图片中的尺寸生成图片中的架子模型,未标注的未标注的尺寸自行推演啊推导。 然后呢我们这边开启一下这个 i c u 专用回答啊,它会给我们直接返回那个生成这个模型的。呃,一个命令,我们试一下啊, 因为我们接的是这个国外的这个 api, 所以 它这个速度呢,相对来说可能会慢一些。 ok, 它这边已经开始返回这个命令了啊。 ok, 然后我们这边呢只需要把它提取至控制台,然后执行一下,看一下啊,有可能会报错啊,哎,没有报错。好,这个架子升成了之后呢,我们去验证一下它的一个尺寸啊,它的一个长是一千啊,一米八,宽是四百。 对于这种普通的模型啊,它升起来会比较,呃准确一点,快一点,但是那种复杂的异形的他们来说就比较麻烦一点。然后呢我们再来看一下还能干什么啊?比如说我给他发一个 一个方案啊,然后呢把这个先取消掉,告诉他这是一个景观设计的方案。嗯,我想对其进行更深化, 你有什么意见?呃,建议,然后后续我会根据你的建议 发给图升图 ai 模型,所以将你的建议改成 ai 提示词。呃,像这个 jimmy 呢,它就可以,它也可以识图,而且它的识图的一个效果呢,可能会好一点啊。发送一下。 好,他这边已经说完了,我看看啊。嗯, 我们一会随便选一个吧,然后正好我们试一下它的一个图声图的一个功能,那么我们现在呢就把它切换成 nasa banana, 这个 nasa banana 呢是我在别的那个,呃,一个小的供应商那找的这个 api, 所以 它这个网站之类的会有一些问题,这个我们后续再讲啊,然后还有这些参数啊,我只是现在给大家先举个例子啊,后面我们讲下它这个这个东西如何配啊? 首先我们这肯定是要选择一个图片生成这个功能,对吧?然后呢我们把这个模板选成这个,这个是我给大家配的啊,给大家配置的。之后呢,我们先复制一个吧,把这个,把这个 ctrl c 复制一下,然后把我们的图片给它上传一下, 之后呢我们在这里边要进行一个设置啊,你,你上传了几张几张这个参考图呢?你就要开启几个对应的参考图的这个这个勾选啊,像我这边只有一个参考图,那么我们这边就只勾选一个,然后呢你们这个地方啊, 呃,我给你们默认的他应该是,呃,叫这个首章这个,你们给他调成所选的所选图片的这个 b 贝斯六十四,然后下面这个对应的也要给他改成所选图片的 m i m e 啊这个东西,然后呢他就会就可以了,然后我们下一步看一下啊,给他发送一下, 先保存下配置吧,然后我们发送看一下啊, 我们点一下这个放大看一下这个效果,对比一下, 还可以吧?它这篇直接出了一个效果图啊,也还可以啊,然后我们下面呢说什么呢?就要说一下它的一个像我们之前这个 deepsea 这种, 呃,它这边这个接口适配器只需要点这个自动兼容标准逻辑就可以了。但是像我们这种 banana 以及这种千问生图的话,你这边除了要改成图片生成状态之后呢,还要选择对应的这个一个参数, 然后我为什么要把这个弄出这么多这个参数来给大家弄呢?是因为啊,这个不是我的原因,是因为每个啊,每个服务商呢,他们可能有自己的 api 以及这个 api 地址啊,都是不一样的,所以这个相对来说是麻烦一点。你就比如说像我这个,呃,拿拿拿拿,这个 我这里边呢就直接把它的所有的链接啊,它的一个 api 地址的链接,我跟它要过来之后呢,设置好了之后,我就要把这个,因为我这个链接里边它包含了这个什么所谓的这个 none of none 的 这个模型名称,所以我这里边就不能勾选这个生图模型这个名称了啊,如果勾选的话就会报错啊。 然后呢你们最好啊像我在那个使用说明里边给大家提了一些那个建议,就是你跟那个服务商那边要一些我们需要的东西去进行一个配置。但是如果你只使用这个 none of none 啊,我这里边基本上的一个配置就够用了啊,基本上的配置就够用了。当然你那边有什么报错的话,你们可以啊, 在这个,呃,本地桥接服务这个运行日期里边,如果报错这边会有报错的,然后你们把这个报错可以发给我,我帮你们去想办法解决一下啊。还有什么东西要讲呢?嗯, 基本上就没什么东西要讲了,这些比如说图片比例之类的,大家都应该能够看到啊。你看我这边,我这边虽然设置的是十六比九的横版模式,但是他给我生成的是这样的模式,是为什么?是因为我上传了我们的这个附件了,所以他会按照我们这个附件的一个比例去进行一个调整。那么如果我们不用这个参考图,把参考图关掉,然后呢 把这个十六比九,你看这个,我这个不太确定,我把这个复制一下,我看他能得到什么东西啊?哎, 复制一下,然后呢图片生成,这些东西生成配置两 k, ok, 我 看一下啊, 好看,这回就是十六比九了,对吧?没有毛病。然后还有一些什么呢?我们再试一下我们千问的这个生图啊,然后我们可以看到这个 api 地址,这个地方呢,我这边勾选了一个完使用完整的 api 地址,为什么这样做啊?因为像我们比如说 deepsafe, 它呢会给你一个短的一个 链接地址,然后他内植的这些都不用配置的,然后内植你就是他已经已经设置好了,但是像我这个千问生图,这个我没有设置,就是,呃, 把它写到这个插件里面,然后呢我们就需要根据他给的一个完整地址啊,直接粘贴过来,然后使用它好了。然后我们下面呢要选择我们对应的一个动态啊参数列表,我们比如说最开始的时候它是这个自动啊,兼容标准,这个不太好使,然后呢我们就要选这个自定义动态参数构建,然后我们选择这个千问图生图这个你如果你是 想要纹身图,那你就把这个纹身图这个勾选上,比如说我这边啊,输入海边沙滩啊,然后你看我这里边这个生成数量写的是二,那么他就会给你生成两张,生成两张, 你看,嗯,这是一张,这是一张,总共两张,对吧?然后呢我们把它再调回一啊, 如果你想要用参考图的形式,那么我们就把纹身图给它关掉,然后呢比如说我上传一张参考图一,然后呢我们上传一下我们这个图片, 然后看看啊,所选图片。之后呢,我们跟他说啊,给我 get 生成图中做一个正视图,我发下试下啊 啊,它生成的理解能力我我觉得不太行啊。然后我们再换一下,试一下它这个两张参考图。如果我们需要使用两张参考图,那么我们就把这个一张参考图的题词给它关掉,然后选择这个啊,两张参考图,当然你这边可以新增啊,比如说增加第三个参考图,然后这个地方呢,你就把它选择这个,呃,所选图片的 dl, 然后这边你可以选择上传第三张的时候,你就选择第三张啊,这个我就可以擦掉它,然后同样的你还得配置一下三张啊,三张提示词,就比如说你得把这个地方改成三啊,给大家对比一下啊,如果是一张参考图的话,这块就是一,然后两张参考图呢?这块就是二啊,相对来说比较麻烦啊。 剩下两张相册,把它第一张再上传第二张,然后我看看啊,这边第二张,第一张,然后呢我跟他说扔,扔成一张图片, 包含图,上传图片一一二 中的座椅发送。好,我们看一下,哎,看它就包含了这两张座椅了,对吧?然后我们还可以干什么?比如说,嗯,我把它切换回我那个 nano banana, 然后 nano banana 我 看看啊,这边我选择参考图,把这两张参考图给它选上啊,这是一张参考图,然后呢我们这边对这个场景, 对这个场景进行一个截图, 截图,然后我们就可以看到这个图片啊,然后呢我跟他说什么呢?嗯, 将图片中的点影点影人物转换成 真人效果,并边加户外空间环境, 让他动作保持一致,看一下啊,放松一下, 哎,卡住了,别崩啊兄弟。 理论上来说啊,你们配备足够多的这个 api 的 话,你就能呃在这个里边实现很多功能,比如说让他给你出方案呢,呃,方案设计,然后比如说是呃方案介绍,然后模型空间的一些布局之类的都可以实现啊, 我觉得还是比较好用的。然后看到这的小伙伴给学长点点关注,点点赞,好吧,然后你们还有什么不懂的地方,可以随时跟学长进行一个交流,好吧, 生成完了我们看下效果,哎,可以吧。好,那么以上呢,就是关于这个插件的一个所有内容吧,然后大家要注意一点啊,这插件它的一个功能的强弱完全取决于你们接入的 api, 这个 这个大模型的一个 api 啊,最后强调一点啊,这个插件没办法白调啊, 如果真的觉得特别有用的话,并且感兴趣,你们可以跟我说啊,我们再谈其他的,好吧,那么这期内容呢,我们就到这,我们下期再见,拜了个拜。

大家好,我看很多人说香蕉不知道该怎么用,当然我们最简单的方法肯定就是去谷歌官方网站去用,但是很多人一个是没有会员,二个是可能网络问题连不上。那今天就讲一下怎么在国内用 api 的 方式 加 comui 的 方式用香蕉模型。那首先看我这一个效果,我们在这里输入提示词, 这里是我们的 api 的 密密钥,这里是调用什么模型,把它简单连好之后提交就可以得到一张图,这就是一个完整的图。那怎么用?那首先我们要有一个 api 的 密钥, 我们可以到这里去申请这个网站,你首先要注册,注册之后你会看到这里有一个模型的价格,我们可以看一下模型的一个价格,看选酷狗,选绘图。那你看他这里有很多分类,那我比较推荐呢,因为现在算力不足。那比较推荐一个是这个性价比挺高,你看叫三点一弗兰西 prefer 两 k。 那 我是建议,虽然这个默认的分组最便宜,它只要一毛钱一张,但是这个比较不稳定,所以我是建议用这个优质,它只需要 两毛一张,但如果觉得贵了,你可以选这个试一下,但是两毛一张是比较稳定的,那如果这个经常都可能有问题,那你可以选这个, 这个优质,这个就是四毛二一张,这个更贵,但是这个最稳定的,基本上每次都能出图,这是一个价格,当然也有一毛一张的,这是最便宜的,一毛钱一张,因为现在用人太多了,算你经常不足,所以最便宜应该是两毛一张,或者一毛五一张, 最贵可能其实就是四毛一张,其实也不算太贵了,如果你用的不多,我觉得已经很便宜,那这就是一个价格,那怎么用呢?首先我们他这里,我们注册好之后, 首先你要充钱,大家也可以用我这个邀请码,这样我可以得到一点奖励。那充充完钱之后,你在这里用密钥,那我这里已经建好了一堆,你可以在这里点这个添加密钥,你随便输入什么名字,这里分组,你最好把这个删掉, 选上下面有一个叫界面的优字,比如说我现在随便输一个 vip, 就 这样就 ok 了。点提交, 提交之后,你看这里有一个,那你在这里把这个密钥,你这个密钥你把它搞不下来,我们到康复 u i 这里 康复 u i 这这些节点要怎么装?这些节点,我们有一个网站把这个节点安装下来,这个安装就不用说了,我们以前有教程,安装好之后再打开康复 u i, 你 就会把这几个节点给它连出来,这个节点是在这里的,在这个 google, 你 看这有一个 二二的优质这个节点,把这个节点拿过来,这些是图片编辑,你有图,你有脸。图片,如果是纹身图,选纹身图或者选图片,如果你选择图片 到图片,你就要加一个你想编辑的图或者参考图像。如果你选择纹身图,那就不需要了,只需要在这里,因为他默认是有些逻辑的,但这个模型不全,经常遇到网络的问题,算力的问题, 嗯,升不了图,所以我们可以最好就自己定义模型,我们在这里把它连过来,你可以在这里去找各种模,找模型,把它连过来,这里就是刚才我们的密钥,把它填进来之后也是连到这里,连到 a、 p、 i、 k 这里,那这里输入你的提示词, 这样就可以了。这里我加了一个可以显示一些输出的信息,你要愿意加就加,这里是一个保存图像的节点,连到这里就可以输入你的提示,然后运行就可以了。这就是我们在本地怎么用调用 apa, 用香蕉模型一个非常快的方法。