今天咱们聊个特别技术的词, a p i 和 skills, 别走别走,我保证不用代码,只用你每天都在做的事。扫码买水,两分钟给你讲明白。先问大家,你渴了想买瓶水,走到自动贩卖机前,你会干啥?掏出手机扫个码,弹出来一个小程序界面,上面有可乐、矿泉水、绿茶, 你点一下可乐付钱,哐当一声,饮料出来了。好,记住这个场景,那个等你扫码的贩卖机就是 a p i, 它就是个工具,安安静静待在那儿, 它屏幕上的二维码和弹出来的界面就是它的说明书。告诉你我这有啥,多少钱,怎么买,你点哪个按钮,它就给你啥东西,你压根不用管它里面怎么制冷,怎么找零,对吧? 而扫码买水这一整个事就是 skills, 你 从渴了到喝上水,中间经历了啥感觉?渴了眼睛找贩卖机,走过去扫码点单,最后弯腰拿饮料, 这是一连串动作,最终解决的是你口渴这个问题。所以你看 api 是 那个工具, skills 是 用工具办成一件事的能力,你不是为了扫码而扫码,你是为了喝水才去扫码,放到智能音箱上也一样, 你问今天热吗?音箱先听懂你是在问天气,然后去调天气, a p i。 拿到数据再告诉你,今天三十度,挺热的。总结一句话, a p i 是 那台贩卖机, skills 是 你买水喝的全过程。 以后再听到这两个词,就想想你扫码买水的样子,是不是一下就通了? ok, 今天就是这些,觉得有用,点个赞,咱们下期见!
粉丝218获赞1828

软件不要钱 solo 二,它是免费的,如果你需要批量生产的话,可以用它的 a p i a p i 的 话大概是九分钱到一块二一个。好吧,这是按条数收费的,国内有很多的第三方平台,你们可以自己去筛选一下。好吧,你们在国内 如果想用的话是需要第三方平台的。我的那个公开课录播课里面有推荐,你们可以听一下。好吧?或者去我的评论区下面去找,有很多人在打广告。

挑战,用三分钟带你理解什么是 skill。 大家好,我是程序员牛肉。最近 skill 这个词在计算机圈子真的越来越火了,所以我们今天出一期视频,聊一聊什么是 skill。 看完本期视频,你将会学会什么是 skill, 它和 m c p v flow 有 什么区别?那什么是 skill 呢?如果我想让大模型把一个英文 pdf 的 内容提取出来之后翻译成为中文,并且最终保存为 mock 格式,那在这个流程中, 其实最大的问题来自于 ai 生成 python 脚本的不稳定性。比如说 ai 生成的 python 脚本可能提取的 pdf 不 符合预期经常性的小提取内容。又或者是保存为 markdown 的 时候不符合我的预期各级标题直接随意发挥了,那这个时候就是纯纯的抽奖了。这种任由 ai 随意发挥的代价是可能会消耗大量的 token。 等你看到欠费信息的时候, 你就知道什么叫做被资本做局了。其实从一整个工作角度看,可能就是两个部分最费力,而且是完全可以附用的经验,分别是提取英文 pdf 以及将其保存为 markdown 格式文档。聪明的你想到了一个办法,我在下一次做这个需求的时候, 直接把这两个部分内容涉及到的 python 脚本固定下来发送给 ai, 让它们不用再重新生成,而是直接附用之前的落地经验不就完事了?那为了让 ai 更好地理解我的要求,我可能要对我发送给他的这两个 python 脚本做简单的说明。 比如下面,我会发送给你两个 python 脚本,当我需要你完成提取英文 pdf, 并且翻译成为中文,最终保存为 markdown 格式的时候,你可以使用这两个脚本。其中脚本一是当你提取英文 pdf 的 时候可以使用的脚本脚本,二是当你将中文内容保存为 markdown 格式的时候可以使用的脚本。 并且我要求你强制优先使用我发给你的这两个脚本来完成操作,不允许自己私自生成脚本来完成这两部分逻辑。当你曾经有过这种操作的时候,那就说明你简单的发明了一个 skill。 所以 什么叫做 skill? 其实就是一个标准的 sop, 让 ai 可以 依照这个 sop 的 流程和工具进行工作,尝试复用已经成功的经验,它把执行方法,工具调用方式以及相关知识材料封装为一个完整的能力扩展包 a 阵的具备稳定可附用的做事方法。但是这个时候你发明的 skill 虽然能用,但是忽略了一个很重要的问题,当你积累了越来越多的 skill 的 时候,你要怎么高效的使用这些 skill 呢?这个时候你有两个选择,要么在问问题的时候一口气把所有的 skill 全部发送给 ai, 要么每一次你手动找一下你需要的 skill 然 发送给 ai。 这两个其实都有一定的缺点,第一个是太消耗偷看了,第二个是太麻烦了,还需要自己手动找。这个时候又有大聪明想到方法,我能不能把所有的 skill 都保存在 ai 的 客户端网站上,然后给每一个 skill 都起一个简短的介绍,之后在每一次提问的时候,我们的客户端会把所有 skill 的 介绍发送给 ai, ai 通过语音识别之后,判断他自己需要使用哪个 skill, 当他需要使用某个 skill 的 时候,就 在向客户端发送请求,让客户端把这个 skill 的 完整内容发送给他,这样他就可以基于这个 skill 来更好地完成任务。这种方式最大的优点就是节省偷看,其 其实就是把找四 kill 的 这个动作交给了 ai, 并且它有一个听着很炫酷的名称,叫做渐近式路由。想到这里其实你就可以发现它和 workflow 的 区别了,虽然它们两个本质上都是逻辑编排,但是 workflow 的 逻辑编排在设计阶段就已经决定好了,而 skill 主要是由大模型驱动,灵活性可以说碾压 workflow。 所以其实不太严谨的讲,我们可以认为 skill 就是 大模型驱动的 workflow。 而 skill 跟 mcp 呢?这两个其实本质上解决的就不是一个问题, mcp 的 主要目的是提供工具,而 skill 的 主要目的是提供使用工具的经验。 ok, 那 今天就介绍到这里了,如果觉得视频有用,不要忘记给小牛点个关注哦,我们下期视频见。

很多人觉得写一个给 ai 的 skills 很 难,其实 skills 你 一行字儿都不用写。今天给大家分享一下我去用 ai 写 skills 的 技巧。这是一个给博克配封面图的一个 skills, 就 拿这个来举例, 这个 skills 的 主要功能就是我把我的内容给了它,它就帮我使用 nano banana two 配一个动漫风格的封面图。这个 skills 看着非常复杂,但是整个 skills 我 没有写一行字儿都是 ai 帮我写的。第一步,我会同时打开 jimmy 和下的 gpt, 告诉他我的需求。其实这个任务的核心就是根据博客内容去生成身图的提日词。第二步就是自己反复地确认 ai 惨作是否满足我的需求。我会让他尝试给我不同风格的提日词,然后到 navata 里面去使用 banana 三层, 这是 jimmy 三层的,这是 java gpt 生成的。第三步呢,我会挑选几个我觉得最满意的提日词,告诉 ai, 这是我认为最好的方案,请你帮我封装出一套 skills。 这一步呢,需要把 agent 要完成的工作理由给它说明白,包括一些边界的情况之后, gmail 和其他 gpt 就 会分别给到我 skills。 最后,我会同时在 umind 里面创建两个 skill, 分 别测试它们 有点像员工之间的赛马,等跑一段时间之后再决定保留哪一个。那最终胜出的 skills 呢?就可以交给 open cloud, 用多个 skills 组合的方式,自动地去跑完整的一个泊客通道任务了。所以 skills 看着很难写,但人真正做的事情只有三件,提需求、 做实验和拍板。 a s 呢?我真心建议大家都应该养成在工作中封装 skills, 迭代自己 skills 的 习惯,然后努力地让 agent 把自己的工作给替代掉。

一说到 open crowds, 好 多人就出来说,你知道这个 a p i 有 多贵多贵吗?虽然我之前也说过这样子的话,但是 是因为我自己能够订阅最聪明的 ai, 我是 烧不起海外那些最高级的 ai, 但是国内那些 ai 也不见得什么都做不了呀。那些只会说,你知道多贵吗?你知道它有多笨, 你真的觉得他有用吗?这些人你们真真正正的部署过吗?有用过吗?如果没有的话,你可以看一下我这个套餐签声明,全程无网, 反正也不会有人找我打广告。你看这个是千万的 colin plan, 他 有一个套餐基础版本,这个他刚开始用第一个月七点九,这个是 pro, 是三十九点九这两个优惠的,七点九跟三十九点九是只有第一个月可以的,后面是二十跟一百。当时为了测试,我就直接买了 pro, 在 我本机的电脑以及服务器三台电脑上部署了, 但是我们用的都不是很多,我会经常让他下任务,但是没有很多,这是我让他做最多的工作,就是帮我去挖掘我所关注的几个领域的 a k f 论文,每天定时早中晚给我推送,这是我在服务器上的管家,他的只能是这些, 这是我在本机上的管家,他能执行的任务有这些。这是我之前在网上看到一个关于 web 四点零的信息,我就让他帮我去挖掘,他找到了一手的消息,还给我整理了很多内容, 比如说这些信息,这是一个他自己生成的深度调研报告,而且我还让他搜索了更多的相关的核心链接,让他把每一篇的内容整理推送给我, 帮我挖掘到了一个有争议的事件,把每篇帖子的原文都发给我,然后他的逻辑是什么,原文是什么样子的,全都告诉我。 我想说的是,面对一个新的东西,你不要着急的去否定,你先自己去做,自己去感受,你不要老听别人说什么就是什么,就那些任务,我们三台电脑现在使用量才不到百分之五, 我就想说真的,绝大部分人你真的消耗量有那么的大吗?如果你怕没有上限的 a p i 会把你的钱包烧空,那你直接用套餐呗。 如果不是做某一个很深入的方向,它需要超级聪明的大脑的话,其实千万三点五真的很不错, 至少可以让你无痛的就把这个东西给部署起来,用起来,等你发现。哎,我的各种使用场景都都不错,搭建了一些个自己想要的自动流,但是发现现在的这个模型没有办法很好的帮我去执行这个任务, 这个时候你再去想着怎么去换模型,而且真正到那个时候你已经能够用它做一些真真正正的事情了,给他花点钱这都不舍得吗?如果你不舍得,那就说明他不是真真正正的能够帮到你, 那你就用最低的成本已经帮你排除了这个工具不适合你了,不是吗?所以说不要老在那里看听,而是真真正正的去做自己的事情。 我也不知道怎么说,反正很多人还没有开始做呢,就畏头畏尾说头说脑,哎,他能不能给我赚钱啊?他能不能怎么?你先做呗。

梅猴王朋友们, agent skill 最近真的太火了,但很多朋友肯定还是很困惑, skill 到底是啥?有什么牛的?没关系,草旅从 skill 大 全它来了。 今天呢,我们会通过一个逐步升级的案例来理解 skill 的 结构和原理,然后我们还会学会定制自己的 skill 这个 skill 呢,只需要我们说帮我做一个促销海报啊,优惠券,员工服装,它就会生成符合我们品牌风格,带 logo 的 物料图片。 另外,我也会推荐给大家一些好用的必用的 skill, 比如说帮你的文章配图,把杂乱的知识变成教学网页,一句话处理表格等等等等。 我还做了个秋之技能生成器,大家只要回答一下 ai 给的选择题,为你量身定制的技能就轻松完成了。并且今天所有的资料链接以及补充资料我都做成了一个网页,大家只需要一步步的跟着做,跟着看,就一定能搞定, 非常值得一个点赞收藏关注哦!来吧,准备好我们 go go! go! 首先,到底什么是 skill skill 呢?翻译过来就是技能呗, 它其实和人类的技能是类似的,比如说你是一个厨师,那你就有炒菜的技能,处理食材的技能,摆盘的技能等等等等。那每个技能里面,比如说炒菜技能,这里面就包含了你的流程,你要先炒什么,后放什么, 还有你的配方,你的油温多高,盐放多少。有了流程和配方呢,你可能还会需要一些工具,需要煤气灶什么的, 甚至你可能还会有一些独家的材料,有一勺秘制辣椒酱什么的。那 agent 的 技能也是同理,它要来做菜,它也得有流程、配方、工具和材料。 所以在 agent skill 的 术语里面呢,它就是 skill 点 md, references, scripts 和 assets 这些东西打包成一个文件夹,这就是一个技能,一个 skill 了。我们先来个简单的, 比如说我们要做一个写作 skill, 那 我们就在 skill 里面可以要求他先去啊这些网站去搜集信息,然后再按这个爆款原则去写个大纲,然后再参考这个语气来写稿啊,最后按照平台要求来审稿等等等等。那有朋友就很疑惑, 那这不就是写提示词吗?哎,本质上还真是的,毕竟啊,我们跟大模型的交互其实都离不开提示词, 但是呢,这并不是 agent skill 的 全部,它在工程上是有很多优势的,能做的肯定比我们拷贝粘贴提示词要多很多。好处我们后面都会说到,那先让我们通过创建一个 skill 来理解它的结构和原理, 我这里用的是谷歌反重力来做编辑器来看文件,然后呢,用的是 cloud code 来做 agent 来处理任务。这俩东西的下载方式呢,我也都放在资料里了,非常清晰简单,大家一步步跟着做就行了。 接着你只要在反重力的这里创建一个项目,比如说我的就叫丘之 project 吧,然后呢,我们调出终端, 输入 cloud cloud code 就 调用出来了,这个界面大家看着会有点复杂,但是不要怕,跟着我一步步来就可以了,之后我们跟 agent 的 对话都会在这里进行。 ok, 那 我们开始创建, 那我们先要做的是一个最简单版本的 skill, 后面呢,我们会逐步升级的哈, 那现在假设我是一家轻食店的老板,那这是我们秋之餐厅的一个品牌 logo, 那 我希望做一个 skill 呢,能够按照我的品牌调性和视觉规范,帮我们去想各种物料的创意,做一个创意生成器。 那按照 cloud 的 规定,我们创建一个 skill, 得在规定的点儿 cloud skills 文件夹里面去创一个 skill 文件,那我们用最原始的方式,直接手动的来创建这些文件夹哈,点儿 cloud skills, 然后我们再创建一个文件夹,这个文件夹的名字呢,就是我们 skill 的 名字,我们叫它秋之创意吧。那这个 skills 的 文件夹里面呢,必须规定有一个 skill 点 md 的 文件,这个大写的文件,那文件里面放啥呢?我已经写好了, 粘贴进来,那就是这么些文字。好了,这就是一个 skill 了,大家先压住脑子里面的问号,我们再来细看一下,那这个文件里呢,上面这两个横线里面的它叫做元信息 matlab, 写着两个东西啊,一个呢是 skill 的 名字,一个呢是 skill 的 描述,这两个东西专门用来告诉 ai 这个 skill 叫什么名字,是干嘛用的,什么时候可以用它,那我这就写着是做创意物料用的啊,当用户说要做个海报什么的物料,他就自己触发它了。 而下面这些信息呢,叫做指令 instruction, 其实就是具体告诉 ai 怎么样做的一些提示词喽。 ok, 那 我这写了我们的餐厅叫做秋之餐厅,品牌的风格有这么些要求,输出的格式让他是这样等等等等,非常的简单哈,那我们保存好一个 skill, 真的 就创建完了?来,我们启动 cloud code 来问问他,你有哪些 skill? ok, 你 看,他现在就已经识别到了我们的秋之创意 skill 了。 ok, 我 们直接问他,我要做一个秋之餐厅的春节促销海报,让他给个创意 好,他这里就开始提示我们,他正在加载这个 skill 了,我们同意 ok, 他 就输出了创意,并且是按照我们的要求和格式来的。 那有朋友就受不了了,哎呀,这一通操作不还是提示词吗?跟我自己写一段这个提示词存着给 cloud code 看有什么区别呢?最大的区别之一在于它是按需加载的, 什么意思呢?其实啊,当我们正常的这样跟 cloud 去聊天的时候,大模型它只会看到我们这个 skill 里面这两行短短的圆信息。 只有当我们说我们要做一个秋之物料的时候,他才意识到,哦,该看具体的指令了,他才会去加载这下面这部分的完整指令,否则这些他都不会看到。 这样的好处就是方便我们可以同时拥有很多个 skill。 每次 a 正的都会看一遍所有 skill 的 简短的原信息,但是只有当 a 正的意识到他要去具体调用一个技能了,他才会去看下面的一大堆指令,而且 ai 的 回答也会更精准, 因为他没有了其他提示词的干扰,那 ai 加载的少了, open 自然也就省了一堆。那这是他按需加载的第一层。 当然了,刚刚这个 skill 实在是太基础了啊,就算一口气把它下面的指令都加载完,好像 token 也不多哈。 但是如果我们的要求变得复杂了呢,比如说我们秋之餐厅的物料其实分很多种, 常规的呢,有海报、菜单,也有比较特别的一些实体物料要设计,比如说餐盒、杯子,员工服装,还有一些社交媒体的物料,比如说公众号封面,微博配图等等等等,他们的尺寸都不一样,配色要求也不一样, 还得符合各平台的一个规范。每一个物料呢,我们都假设它有详细的长长的说明,那这时候我们如果把所有物料的要求都写进 skill 点 m d 里面,那这个文件就会变得巨长。 但是很多时候呢,我只是想做一个,比方说实体餐盒的设计大模型,根本就不需要知道公众号封面的规格,但是 ai 还是得把整个文件都读一遍,那这就造成了 token 的 浪费,也可能会造成一些信息干扰。那怎么办呢? isopec 就 又规定了一个文件夹叫做 references, 我 们呢可以把实体的物料和社交媒体的物料这个两个规格单独拆出来,单独的给它放到这个 reference 文件夹里面去。 那这个实体物料规格点 md, 我 们就写一些线下的工服呀,餐盒之类的要求, 那这个社交媒体物料规格呢,我们就去写公众号封面呀,微博配图这些的尺寸和要求,甚至我们都可以拆得更细。 然后呢,我们只需要在 skill 点 m d 这个总指令里面只留下那几个常见的物料要求,并且我们还需要写上一个指引 啊,告诉他如果用户要做线下物料的话,那就要去读这个实体物料规格点 m d。 如果要做社交媒体类的图,那就要去读社交媒体规格点 m d, 那 现在同样的一句话, 他给出的方案就更精准了。这样当我们只做常规物料的时候,这两个 reference 的 文件大模型压根就不会看。然而当我们说做实体参合的时候,他也会通过 skill 点 md 的 指引,只去看 reference 里面的这个实体规格文件, 那这就是它的进一步按需加载了。那我们可以想象,我们可以有好多种不同情况的 reference, 反正它只会在需要的时候自己去看指定的文件。 但是现在我们的秋之创意 skill 呢,只能输出创意,还得我们自己去做图,所以呢,我就还想让它可以按照我们的品牌规格,直接帮我们把图做出来, 也没有问题。那这就要用到 skill 的 另一种文件夹了,叫做 scripts, 那 这个 scripts 里面呢,一般放的是一些可执行的脚本, 那我这里呢,实际上也就放了一个非常短非常简单的脚本,其实就是在调用 nano banana 的 api 来生图的一个脚本。那有了这个脚本之后呢,我们还得去 skill md 里面在指令里说一声,告诉他,如果用户要求直接生成图片, 那他就得把之前我们想的这个创意转化成生图的提示词,然后按照这个命令去调用这个生图脚本,这样他就能一句话自动去生成精准的图片了。 不然我们还得自己去拷贝提示词,打开软件再粘贴,再生成,再下载保存,现在我们一句话就搞定了。 另外我还有个需求,我希望深层物料的图片能保持秋之餐厅的 logo 不 变, 所以我们还得给他几张 logo 图作为深图的这个参考。那我们就可以再建一个 最新规定的一个 s s 文件夹,我们把两张的 logo 图片放到这个文件夹里,当然我们还要回到 skill 的 md 里面,告诉他参考图在这个 s s 文件夹里面,如果要深图的话,需要把这个图片当做参数给脚本传进去来执行。 好朋友们,现在这个 skill 就是 一个完整的官方完全形态了,其实有点像我们在用自然语言写程序,对吧?那我们先来试试效果,来帮我做一张周六饮料免费的一个实体海报, 你看它发生了什么?它先是加载了这个 skill, 然后它内部可能发现啊,要做的是这种实体物料,它就要去看另一个解说,于是它去检查了这个实体物料的规范。那并且它意识到我们需要的是直接生成图片, 所以呢,它又生成了提示词,把这个提示词和 logo 图片一起给到,并且运行了这个脚本。那最后它输出的图片告诉我们,在这里我们看看结果, 你瞧瞧它这个尺寸,配色 logo 是 完全符合我们这个品牌规范的啊。那为了防止这个是一次性的结果,我还多试了几次,它这个深层的效果都很不错。 然而如果我们的要求还跟之前一样,我们只要创意并不要直接深图的话,那他的这个脚本他也不会被执行。 而且呢,刚才我们说到这个 scripts 脚本,这里面其实还有一个重点,这个脚本里的代码它是写好了的, agent 根本就不需要去看里面写了什么,它只要知道我们在 skill 点 m d 里面写的那些指引,告诉它传什么参数,会输出什么,它只管运行脚本就行了。 所以不管我们在 scripts 里面写了多少行代码,大模型它都不会去读取,一点 token 都不占。 当然了,如果我们在 skill 点 md 里面的那个指引写得不够清楚,大模型不知道怎么用这个脚本,那他有可能也会不得不自己去看一下这个脚本,但他的机智和园艺是不需要去读这些脚本的。 好,那我们来回顾一下,其实创建 skill 就是 在指定的文件夹下去创建一些文件,那最简单的 skill 呢?只要一个 skill 点 m d 就 够了,里面有这个原信息和指令,而完整形态的 skill 可以 加上 references, script s s 这些可选的文件,那这些东西是怎么配合工作的呢?这就是 skill 最重要的设计。按需加载的三层结构,第一层,源信息。 这一层呢,是始终加载的, ai 的 每一次对话都会看一眼所有的 skill 的 源信息,它去看到自己有哪些技能,就像一个目录。那第二层,指令层, 这层是只有当 ai 判断并且决定我要用这个 skill 的 时候,它才会去加载完整的 skill 点 m d 文件。第三层,资源层, 这层包括了 reference 里面的参考资料, scripts 里的脚本, assets 里的资源。只有当 ai 进一步判断任务需要更详细的信息,或者它需要执行某个脚本的时候,它才会去按需加载,并且脚本它是只执行不读取的,完全不占用托克。 好了,这下我们完全理解 skill 的 按需加载,也就是官方定义的渐进式批漏机制和三层结构了。可是对于普通人来讲,这又是写 markdown 又是脚本的,好像创建一个 skill 还是挺复杂的。 no no, no, 现在谁会用手写呢?我是用这个创建 skill 的 skill 啊,秋之 skill creator 创建的。 那这个呢,是我基于很火的 skill 创建器改良的一个更加互动式,更加小白的一个 skill 创建器。那大家把它下载下了以后,放到这个点儿 cloud skills 文件夹里面就好了。那下好之后,我们想要创建什么 skill, 直接打开 cloud 直接跟它说就行, 或者我们也可以斜杠来调用他,那他呢,会开始一步步的引导和追问我们,来帮我们梳理这个需求。而且我特意设计的是这种用选择题的方式来追问我们整个过程,我们就只需要用大白话回复他的问题,以及按一按上下键做一做选择题就好了。 他这个追问的过程啊,到时候大家问题可能和我现在这个不一样,因为他会根据你的需求去做灵活的调整啊,他都是现编的。 然后呢,这个过程中因为我们要做图片,所以我们还需要给他提供 logo 图的参考,以及那个 nano 不 nana 的 a p i 和文档。那我也给他直接拖到了这个项目文件里,然后告诉他了一下这个文件的路径, 他就会自己去参考和把它们放到 excel 文件夹里面。那这两个素材我也都已经放在了我们的课后网页上了,大家可以去用做练习来试试复现它。 那问完这些问题之后呢,他还会给我们核对一下方案,如果我们看着方案没问题,那他就会自动帮我们生成所有的 skill 文件了。 那做好 skill 之后呢,他还会帮你想几个例子来跑一下测试。我们这里其实测了好几个,风格都很一致,很好看。大家在这个调整的过程中,也可以去点开他写的这些 skill 文档来手动的修改一些,反正都是提示词嘛。 所以总之只要你有明确的输出要求,或者有明确的方法规范流程知识,创建器就会指引你帮你来写出一个定制的 skill。 而且除了自己创建,网上也有很多现成的 skill 资料里,我也整理了一些集合网站和 skill 仓库,成千上万的 skill, 大家可以去逛逛。并且我也给大家打包了几个普通人常用的必备 skill, 比如做 ppt, 处理文档, excel, pdf 这些基础的,我们直接把它拖进 skill 文件夹就可以,一句话让它帮你把乱糟糟的表格梳理得整整齐齐。 还有这个官方的前端设计 skill, 这是直接让 cloud code 生成的前端网页,而这个是挂载了这个前端 skill, 做出来的网页,效果明显大幅提升。还有这个动画生成的 skill, 用这么一段提示词就可以做出这样一段演示动画。 当然大家也不用去装一堆自己根本用不上的技能,一个游戏英雄也只需要四个技能 q w e r 就 能杀遍全场。所以最有效的还是把你最最高频做的几件事,打磨成一个你独家的稳定产出的 skill。 尤其是你对结果有明确的要求,你有经验和方法,你验证过的事情。 比如说打工人,你的周报每周都要写,那就做一个让 ai 来主动采访你,然后出周报的一个 skill。 比如说老师每节课都要背课,那就做一个你只要给出课题,就能给你一整套课件习题和 ppt 的 skill。 又比如说,你总是要给你的文章配图,那就做一个给他一篇文章,他就按你的风格做配图的 skill。 又比如说,你总是在审核,那就做一个按照你的规矩自动批阅合同来写备注的 skill。 因为大多数的人都不需要成为一个技能开发者, 我们只要先把自己掌握的小技能交给 ai, 让他替你重复劳动。好了,资料链接都在评论区了,大家动手试试吧!这个时候呢,点赞、收藏、关注的技能就该出发了,我们下次见了!

哈喽,朋友们,我是阿水, a 正的 skill 最近真的太火了,但是很多朋友肯定想知道到底啥是个 skill, 凭什么这么火?那朋友们莫慌莫慌, 我呢已经为大家整理好了一套小白必读的 skill 大 全,今天的内容呢,我们将从简单到困难,一路升级打怪。首先呢,我们来看 skill 的 结构和它的原理, 然后呢,我们通过学习来定制自己的 skill。 这个 skill 呢,我们只需要简单的一句话,帮我根据这篇文章生成 ppt 分 析和内容规划,那它就会自动去执行和生成我想要的资料。 另外呢,我还会给大家推荐一些好用而且必用的 skill, 比如说帮你的文章配图,把杂乱的知识变成一个教学网页, 一句话处理表格等等等等等等。这期所有的资料我都已经整理成了文档,只需要一步一步跟着做,跟着看,就一定可以学会。那还在等什么呢?赶快点赞收藏关注呀! ok, 那 我们就 let's go! 那说了这么半天,到底什么是 agent skill 呢?直译过来呢,其实就是技能呗,比如可以把它看成一只小狗,这只小狗呢,它会记路线,听指令,使用工具,能听懂你的语气。那 agent 呢,也是同理,它要和你和平相处,也是要会这些东西的。 所以在 a 证的 skill 的 术语里面呢,它最最最核心的文件就是 skill 点 m d ai 的 工作手册,当然呢,还会有其他的文件,最后将这些文件集合在一起,打包成一个文件夹,这就是一个技能,一个 skill 了。 那有同学就要问了,阿水看着挺复杂的呀,这么做的好处是什么?本质上来说, skill 对 不懂代码和不懂怎么去创建软件的小白群体来说, 是大大降低了门槛的来,如果还是不懂,我们做一个超级简单的 skill 就 好了。这里呢,我用到的是谷歌的反重力工具 模型呢,因为可多扣的真的封号太严重了,我就用 jimna。 那 这个软件的下载方式呢?我已经放进了文档里面,可以说是非常的 perfect, 比如说我们打开反重力,在这里呢,选择模型 jimna pro 就 可以, ok, 我 们就可以开始创建了。那我们就先创建一个可以制作 ppt 的 skill 吧,可以根据我输入的文章链接或者文字帮我生成一个 ppt 内容规划。那按照反重力的创建规范呢?局 skill 必须在这个目录下面, 那我们先用最基础的方式手动创建这些文件夹,这个文件夹的名字呢,就是我们的 skill, 名字就叫做阿水 ppt 吧。这里的文件夹里面呢,必须有一个核心的文件,就是 skill 点 md, 文件 内容我已经创建好了,我们只需要把它粘贴过来就可以了。好了,这就是一个 skill 了啊啊, 有同学就会问了,这么多内容代表什么呀?别着急,我们一个一个来看。那这个文件里面呢,上面两条横线里面的内容,它叫做原信息,里边呢,有两个信息,一个是 skill 的 名字,一个是描述,就是它用来干嘛的,什么时候可以用它? 那我这里呢,直接写的,用 ppt 的 时候可以用。下面这一大段信息呢,就叫做指令,其实这里就是告诉 skill 它应该怎么做。那这里呢,我就直接写到怎么用,输出的格式是什么?那这个时候呢,就有同学又要问了,你这和自己写提示词有什么区别呢?嗯, 其实呢,还是稍微有点区别的,比如我们之前在用 jimmy 里面去生成,每次都是需要去重复输入提示词, 那如果现在去用 ide 文件,那我们只需要去输入需求就可以了。当然上面这个案例呢,是最最最初级的创建方法,简单的 skill 完全可以这么实现。那在做这个的时候,我就在想,有没有创建 skill 的 skill 呢? 果然不出我所料呀,可罗得克的官方出了一个创建 skill 的 skill, 它可以通过你的自然语言描述帮你创建一个 skill。 那 这个 skill 的 安装方法呢?大家可以去看我上期视频,巨简单。 当然这期的文档中呢,我也整理了安装方法。安装好了之后呢,我们只需要在这里用大白话描述帮我创建一个可以根据我提供的文章链接 pdf word 帮我生成 ppt 图片。这里呢,因为我们需要用到 nintendo 的 模型 api, 我 们就直接将 api 输入进去就好了。那通过我们这么一番描述,可以看到 ppt scale 就 创建好了,现在的 scale 就是 一个完整的 scale, 可以看到有说明文档,有脚本,还有输出文件夹。嗯,奇怪,我怎么感觉高级版创建起来怎么还比初级版创建起来更快更方便,更简单呢?对,主要是我们使用了创建 skill 的 skill 工具, 那我们来试试效果,出来的效果图呢,都是很不错的。那其实这个案例看下来呢,我们更多的是在用自然语言去写程序的一个功能,降低了代码的难度,而且拉近了普通人和创建软件的距离。所以只要你有明确的输入要求,或者有明确的方法 规范流程知识,创建 skill 工具呢,都会帮你创建出来一个定制的 skill 文档,里面呢,我整理了一些收集 skill 的 网站,里面有成千上万的 skill, 并且呢,我也给大家搜罗了一些普通人常用必备的 skill 工具,比如做 ppt 处理,文档表格处理,我们可以直接拖进文件夹就可以使用了。还有这个就是前端设计的 skill, 还有这个动画生成 skill, 可以 帮你做一些数学上难懂的演示动画。 当然大家也不用太焦虑怎么去把所有的东西都创建一个 skill, 我 们每个人呢,都不是必须成为技能开发者, 我们只需要把自己已经掌握的小技能或者已经沉淀出来的一些方法,重复性的事情交给让他去帮你做一些重复性的劳动力就可以了。那最后呢,资料链接我都放在了评论区, 大家快去手动创建试试吧。这个时候呢,大家就不要吝啬自己的点赞收藏关注技能了,我们下期再见,拜拜!

大家新年好,今天是一个重磅的分享,经常看我视频的伙伴都知道,我在过去的时间里,用不读一行代码的方式,一种黑盒编程的方式,已经把一个项目做出了一个雏形。在这个过程中,我也积攒了一些经验,会陆续做成视频分享给大家。 去年 cloud 推出了这个 agent skills 这个功能之后,我也做了一些视频。现在 skills 的 使用价值已经完全的超越 mcp 了,而且我认为它的使用门槛是相当的低, 但是可能很多朋友还没有学会怎么用,今天我就教你们一个使用 skill 做自动化流程,给自己提效的一个万能公式。所谓的万能公式就是所有人都可以不用写代码就可以用。 那首先提到这个万能公式,我先介绍一个工具啊。这个经验来自于我之前用黑河编程做的项目,我经常让 ai 去做后端测试,他特别喜欢用这个命令, 我根据这条命令就构建了一套它用于测后端的一个脚本,所以我的项目开发的也比较顺。但这个命令我觉得我们不用去学习,你只需要知道,它可以模拟我们所有操作网页的方式。 如果你常用的 web 服务器是支持 api 访问的,那么你只需要让 ai 读一下 api 的 文档,它就可以构建出一套纯自动化的流程。当然这么听可能有点抽象,我会用了这个命令,跟我的这个 万能公式又有什么关系呢?我来举一个例子你们就懂了。我的女儿前几天考这个 g s p 的 五级 c y y 的 一个考试,她没考好,我分析了一下,其实是刷题刷的不够,虽然我给他做了一个 ai 工具,新奥制题助手,这个我之前分享过, 但是这个工具有一个问题,就是他没有自己的题库,这些所有的题其实还是我自己在网上找的,我要通过这个工具的内置功能给它加入进去。 但是这个怎么说也比较麻烦,你得录入题目,你得用 ai 分 析测试点,还得找答案。虽然我也在工具上做了一个类似 a 证的抓网页的功能,但我觉得不好用,而且它只能抓题目,它的测试点和答案你还得另找这个软件,它已经完全落后于这个时代了,我也懒得再去狗尾续貂, 但是我想了另外一个招,这招是什么呢?就是因为我的信号制题助手,它启动之后就会有一个后端服务器, 当初我觉得在这个 electron 里运行一个 python 服务器,这种设计还挺奇葩的,但是现在想想还是挺明智的。我把后端的 api 的 代码喂给这个 cloud code 之后,他竟然就把这个 skill 做出来了。 我只需要打开这个应用,然后让 ai 分 析我孩子的代码,让他有针对性的推荐题目,然后调用我的后端 api 加入我的提库。 所以说如果你有一个学习系统,他也是有后端的, ai 就 可以完全实现。他作为一个可以操作你后端的一个机器人,根据你的要求来操作你的后端,比如说给你出题,或者是帮你分析,可以把所有人需要去做的 任务一下一下点击做的任务,变成一个让 ai 去做的一个工作流,而且实现这个工作流,你不需要干任何事,你只要一句话,他就可以去执行很长时间。 给大家看一下我这个技能,做了两个技能,一个是一个叫 csp, 一个叫对拍。能不能看一下这个 csp 的 这个技能,这个技能 总体来说它就只有一个文档,它就是描述我这个信号制题助手的后端的 api, 它描述了一些场景,比如说它的基础的 url, 它怎么样去管理题库,应该怎么获取编程题,它的这个格式是什么? 给了一些例子,怎么样去获取答题记录,是用什么样的格式?如果你要验证代码,用沙盒验证沙盒的 api 是 什么, 包括你可以 c 加加,也可以用 python, 它描述了一些场景,场景一是怎么样添加新题目,怎么样看学生的答题记录,怎么用沙盒快速验证, 还给了一个文档,这个文档是一个完整的一个 api 参考,我只是把我的这个 api doc 给 ai, 通过这个 sql creator, 它就自己给我全部创建了。我给大家演示一下啊。首先这是这次我女儿没做的这道题,五级的一个题,她没做出来,我就说我就用通过这一个 prompt, 让她来分析她的算法和考点,然后在立扣上帮我找类似的题, 然后制度相关的要求,难度中等,把题单抓下来,放到我的题库里,在入库之后,用对拍这个技能来求解,让他一步一步执行。你看他先做了个计划,他知识点,他分析出来了, 好去立扣抓题,他用了很多的任务,子任务,最后抓到了五道题,这入库的结果,他现在做了五道题,他能获取我们这个资料库,然后找到资料库,把题目放进去,然后就开始就要用对拍工具做对拍来求解了。 当然这个对拍工具我觉得还需要优化,他用的时间巨长无比,他现在已经跑了四十分钟还没有做完。 当然一次搞五道题可能是有点贪心了,但是它还在积极的运行中,如果我们正常的使用来说,其实就可以把它扔这,让它自己去搞就行。好吧,只是给大家演示一下这个 skill 运行好了是什么结果,基本上我到目前为止, 我除了输入那个 prompt 之后,我还没有管过,所以其实基本上就是 one side, 你 可以让它自己一直搞下去。那我们如果再把脑洞开大一点, 比如公司的系统是用来查数据库而做分析的,你也完全可以让 ai 去调用一个 skill 去查,直接做分析。现在的外部架构基本上都是有为 api 的 设计的,所以任何带有后端的服务,我们都可以通过 api 把它做成 skill, 然后让 cloud code 成为它的外挂,而你不需要做任何的开发, 这就是我称之为任何人都可以使用 skill 提效的万能公式。可能有朋友问了,那如果我有一个服务器,但是我不知道 api, 我 没有它的文档,或者说我不会做 skill, 那 该怎么办? ok, 我 今天推荐两个工具啊,第一个就是 chrome devtools 这个工具,它简单来说就是给你的 cloud code 的 一个浏览器,我们来看一下,你看,我现在是让它用 chrome devtools 启动一个浏览器,访问落谷点 com, 它会打开这样一个浏览器,我在这上面做一个操作,接着我让它读一下它网络请求的这个日记。我刚做了个搜索,能不能分析下格式 ai, 它会自动从这个工具里把这个 network 的 请求全部列表出来,然后分析出来这个格式, 它会总结成一个文档,这个 json 格式。刚才我搜索了其实有一个是标签,这里要选标签的标签,标签其实它也是有一个 api 的, 所以我就问他有没有获取标签列表以及标签意义的处理啊?他发现找到了之后,他就给我去列举,他能把所有的标签列举出来,我让他去用这个方法去测试一下 五级减的二分题目,他很快就给我找到了一些这么多题目,五十三道题。有了这样一个东西, 我就可以让他帮我去找题目了。当然并不鼓励大家用这种方式对任何网站做这样的分析。你首先要看这网站允许不允许你这样做,如果他要求必须登录才能用的话,我建议还是不要做,这样 不太好。你们如果说你们自己的系统,比如说你公司内部的一个数据库,那你就完全随便了, 即使你没有这个文档,你也可以用我这种方法来获取。获取完了之后你会发现这整个的上下文就会充斥着这些关于结构的一些知识。我们该怎么做呢?我把以上获取的这个技巧放到一个新的技能,我让它创建技能了。最重要你要提到这个 skill creator, 这个 skill crit 是 一个 osophic 推出 skills 时的一个默认的一个基础技能,但是你需要去安装它, 我等一下说怎么安装?如果你安装好了之后,你在做任何技能的时候,你不需要自己去做,你直接告诉 cloud 用 skill crit 把以上的经验做成 skill 就 好了,就这么简单, 它会放到这样一个结构底下,就是放 skill 点 m d, 然后它会给你创建一堆脚本,当然这个脚本是什么样你们不用管,就反正它做好了,你直接用就行了。那么 skill crate 在 哪里找呢?在这个 repo 里头,这是一个 safari 推出的, 它也提供了一些安装手法, plug in, 通过 marketplace 方式,用 plug in 把这个 skill 安装进去,安装好了之后,它这个文档里头就会有所有的这个技能,其中你们看,这有一个 skill creator, 就是 这个 skill creator。 我 们再总结一下,如果你没有 api 的 文档,你不会做 skill 怎么办?首先你先操作一遍,让它抓取,然后给你生成一个文档, 接下来直接告诉他,用 skill creator 来做一个 skill, 就 这么简单。经常看我视频的朋友知道,我过去还分享过千万三 omni 的 语音互助,还有我的监工 agent 的 项目,还有我的 finnus 上的一些场景。 我相信呢,在今年就一定会实现一个场景,就是我们再也不需要使用 cloud code, 而是直接通过语音发出一个命令,然后我们的 worker 就 会在 boss 上给我们完成一个长线的任务,最后把结果给我们呈现出来。 所以我想说的是呢,我分享的这些内容并不是零散的,他们都是在为了实现这样一个目的,这样一个场景的技术战之一,所以我做的内容并不是为了做内容而找主题,而是为了实现我理想中的 agi 的 场景, 然后把我过程中的一些发现分享给大家,这是一个真实的长线的 ai 的 学习和成长,所以关注我,你们也可以获得同样的成长。 ok, 以上就是今天所有的内容了,谢谢大家。

ai 文章当中能看到 tooling skills, api, 那 我就汇总十个最常见的 ai 的 一些词汇,后来他们讲的是什么东西?第二句话就 alm 就 属于大语言模型,像是我们的豆包啊,俏皮皮啊,都属于什么呢?都属于一种大语言模型,那它是什么呢?就像个超级学霸,你问什么问题呢?他都知道 啊,但是答案呢,取决于呢问问题的人啊。如果说我们本身来说就是你问的问题的话呢,就是一个小学生的问题,那得到答案的话就是小学生的一个回答,那这这也是为什么我强调一定要自己的专业知识要过硬。如果你问问题的话,比较深度的话,得到答案就是有非常有深度,非常专业性的。一个答案二的话是 tok, tok 呢就是 ai 的 计算单位, 我们再用 open 的 话呢,你去接一些 api 的 话呢,它本身是消耗,你托管就是按这个来去算钱的,因为 ai 的 话呢,也要吃饭,对吧?这饭钱是你出的,那你取决于你要干什么样的活,比如说呢,一千个托管的话呢,相当于七百个英文, 相当于四百到五百个汉字,那你跟 ai 聊天越多,那消耗的托管就会越多,那你的费用就越高,这样的话就像你去吃饭,对吧?你干嘛呢?你要叫服务员, 然后服务员呢?再跑到厨房就是 lm 大 一点,对吧?然后叫服务员给你做菜,然后再上上菜给你,你不能干嘛呢?你不能自己冲到那个呃,厨,厨房里面叫厨师给你做菜,对吧?你 需要什么呢?哎,你需要叫服务员,哎,我需要点菜,对吧?那服务员,服务员的话呢,就给你去点好菜,然后呢再端上什么呢?就像你在 loft 或者 livelabinet 啊,对吧?哎,为什么你在 loft 可以 是用用 banana 呢?为什么你可以用积木呢?你用可以用可怜呢,对吧?就是 loft 它本身就是这么接了 克林积木的 a p i 然后那个吊堂啊,是这么过程。第四个话就爱建腾,他是什么呢?他就是一个带脑子的全能助理,那普通爱的话就是你问几他答几对吧, 比如说什么呢?比如说,呃,我要去做去日本的一个旅游攻略,那他会指定好文字版一个去日本的旅游攻略,但是爱建腾的话,他会怎样呢?你给他个目标对吧?你要去日本旅行,他会呢,帮你定好机票,定好就那个酒店, 就是你给他一个目标,他帮你去执行调研工具,相当于我们的全能助理。第五呢是 plunk 的 提示词。提示的话呢,这款我们应该是很熟悉的,我们在用编辑生成图片的时候呢,对吧,都是需要一大堆的那个提示词,对吧,才能生成我们符合我们需求的一个内容。那提示呢,也说呢,就是你要 指定的话越明确,那深层的图片的话就会越符合你想的一个需求。但现在的话呢,可能说提词没有以前,没有像是前两年那么重要了,你是可以用自然语言的话来去跟他沟通,也能得到一个非常好的结果。 第六个的话呢, context 就是 上下文记忆。我们跟大家聊天的话呢,哎,你就聊一聊子,他突然不认识你了,为什么?他记忆量不够,对吧?就 context, 当你的 context 就 记上下记忆文的话,足够长的话,容量足够多的话呢,就是你跟他去聊天的话呢?你昨天聊什么话题?是不是啊?上礼拜上个月聊什么话题他都知道, 哎,这就是上下文。第七个呢是 skill, 我 们再用 open color 的 话呢,就是预设好的小技能,比如说你去画图,对吧?那你可以记个 skill, 然后呢你去搜索信息啊,就是你要是说嗯什么写脚本啊,对吧?都会有相当于个就专业的技能。那第八个呢, open colo 相当什么呢?相当于是说它是一个开源本地运行的智能体, 它可以什么呢?它可以像是我们人一样,可以自动的操控在电脑,然后帮你是发邮件啊,整理信息啊,对吧?然后帮你审图啊,等等等等,就像你能在电脑上面干什么事,他都可以,而且可以借用各种模型,然后各种技能 skill。 第九个核磁共振就是 ai 幻觉,因为 ai 的 话呢,他他来说他也会瞎编,比如说呢,会瞎编一些不存在的历史,会瞎编一些不存在的事实,比如 ai 的 话,他本身呢就是大研,模型的话,就是概率学吧,就靠猜对吧,有些东西他不知道的话,他会瞎说的,就是 ai 幻觉, 但是呢, ai 现在准确率的话,肯定是大于百分之九十九以上的,就有些东西的话呢,就是你要自己还是要去分辨,不能是百分百的信赖。最后一个呢,就 r a g 就 解锁生成。 那普通 ai 的 话呢,我们去问豆包也好啊,或者说叫 gp 也好的话,有时候呢他会下边,对吧?你要是说呢,要根据什么呢?根据你的信息去回答,那他就是会检测出你的信息,就准确的去回答你的问题。就是呢,我们丢他一些文件这个资料,对吧?根据这个文件资料呢?哎,来回答你的问题, 这样就更加靠谱,更加准确。从今天开始的话呢,你就不要把自己当作是一个做土的人了,只当成设计师。而是呢,你可以做互联网,你看到的任何东西你都可以去做,用 ai 去放大自己能力,而不是单纯干嘛用 ai 提高效率,这才是用 ai 的 正确方法。

各位小伙伴大家好,今天带来的是教你自己做一个 skill, 那 么 skill 是 什么呢? skill 是 一个用于为 ai 智能体扩展专门能力的开放标准,它其实是一个标准,而 skill 的 作用是它将特定领域的知识和工作流封装起来,智能体可以通过这些 skills 来执行特定的任务。 skill 从出现到现在已经有一段时间了, 而我对于 skill 的 理解是,它既是一个一个技能或者工作流的实体,而实体就以 skill 来进行命名。 举一个比较简单的例子,上一个视频里面我们介绍了源码学习的新范式,但是有一个问题, 咱们不能每次都复制那么多的提示词,然后给到 ai, 让 ai 帮我们去分析生成我们想要的东西,那有没有更好的方法方便我们做这个事情呢?那显然 skill 是 一个比较好的一个解决方案,我们可以把做这一个事情封装成一个技能, 而这个技能可以在我们的 project 里面去使用,也可以打包给到别的项目或者别人去使用。而这里面 skill 我 认为最核心的点其实无外乎使用了工程化思维的方式,也就是封装和复用。我们把重复的 工作或者流程封装成一个一个 skill 文件,而这些文件其实就是技能的具象化表现,而把这一些文件封装好一个整体给到别人,那其实就是附用。而我今天就是给大家实操一下怎么做一个自己的 skill。 那 首先 skill 的 生成方式,目前我总结下来或者使用的无外乎几种,第一种,如果你使用 ai 编程工具 ok, 那 你是幸运的,你使用的方式其实会比较简单。 那么第二种是用 scale 做 scale, 那 这里面跟为什么再讲一下呢?是因为 ai 工具它使用的方式其实就是用 scale 做 scale, 就是 有网上有一个技能可以下载到,而史劳克他也公布出来了, 就是你可以可以使用这个技能去做你的技能。之前我们说过, scale 也是一个开放的标准,既然是标准,它必然有相应的一个文件结构和文件内容的格式,那既然是这种形式,那必然会有一个工具可以帮助你或者辅助你完成这一个的编辑, 而有一个技能叫做 create skill, 也就是可以用这个 skill 去生成你要的 skill。 而第三点就是如果你懂了原理, 因为它是一个开放的标准,它有自己的结构,你完全可以自己去做一个 skill。 如果你使用的是 ai 的 编程工具,那有两种方式可以唤起这样的技能,斜杠命令和自然语言的唤起。那比方说 call 手这里 我打一个斜杠,我们可以看到这里面是有一个 skills 这样的技能库,我可以去选择它,那比如说我选择的是 create create skill, ok, 那 我如果是斜杠加上技能名称,那会自这个 call 手会自动调用这个技能去帮我们去创建创建我们想要的技能。 那如果是斜杠 create skill 之后,我要需要告诉 skill 说我要去生成一个什么样什么样的技能,它会自动调取 create skill 这一个 skill 的 技能去创建我们想要的技能。那说话说起来其实有点绕,但是确实是这么一回事儿, 但是 coco 有 斜杠,斜杠的一个方式唤起,但是 char 其实是没有的,那所以说 char 这里呢,就只能使用 第二种方式,自然语言的唤起,就告诉他我想创造创造一个技能,然后呢跟 ai, 也就是 char 或者 cos 这样的 ai 的 编程工具,会去调用 create skill 这样的技能,去帮你创建你要的技能。 ok, 我 们接下来进入实操阶段, 我们打开我们自己的 ai 的 编程工具,那我这边今天演示就是使用 char, 因为很多我发现很多的小伙伴使用的都是 char, 而并不像 cloud, cos 这样的。呃,国外的产品,那 char 因为免费,那其实另外一个原因呢,确实也挺好用。 ok, 我 打开的这一个 pro 九的是之前 github 上下载的 openspec 的 源码。那上一节呢,其实是教大家怎么去分析这么一个源码,快速的进入研研究的节奏。 当时是我们输入了一段提示词,就告诉他是一个高级架构师,让他帮我们去分析项目的结构,目录的结构,使用的基础站及如何使用。那如果说我们研究的项目过多,那每次都贴这么一段提示词,其实是挺烦的,所以说我们可以把这一个工作变成一个新的 skill 这样的一个技能, 下次呢直接调用这个技能,就能帮我去分析这一个项目的内容。我们新开一个绘画,告诉 ai 说我想新建一个技能, ok, 我 们看一下它的一个思考过程,其实就能理理解它的一个原理。我们输入的是我想新建一个技能,然后劝他会理解成,呃,他会去根据语义去分析说其实是创建或者添加任何技能时,然后呢需要去调用 skill creator 这样的一个技能,也就是说 我通过自然语言的方式去唤醒了 skill creator 这样的一个技能,而这个技能的目的是帮助我们去创建一个新的一个技能, 所以呢他会去调用技能这一个技能,去接下来去一步一步的完成我们自己想要开发的技能。然后呢,我们可以通过对话的方式告诉 说技能的名称是什么,技能的用途是什么,然后他会自动的去创建我们想要的 skill。 在 这里呢,我给大家介绍一种可塑化的方式去创建,不通过绘画的方式 打开设置,这里有个规则和技能,那这里面会有一个技能的一个功能,而这个功能其实是就前不久券发布的新版才出现的,之前券里面只有 solo 模式下才会有。 那这里面的技能其实分为全局和项目,什么概念呢?就全局的话是我创建的这个技能是以后所有通过券生成的。呃, project 都能适用,那项目级呢?也就说这个项目里面才会适用,那我们这边随便都一样,后面的逻辑都是一样,我点创建, 那他支持几种方式,一种是上传进行智能解析,也就是说我可以从网上下载一个这样的技能包,直接拖拽线进来之后他进行分析,然后构建出我这边的技能名称,描述和指令,这样的话就是自动变成了一个技能,加载到你的 try 这个 id 里面, 然后下次通过跟 ai 进行对话的时候,通过语义去分析的时候,会发现关联到这个 scale 进行调用。呃,那我们这边会去做一个技能名称的一个制定,技能名称我们这边填,随便填。呃, create d o c, 然后指令其实就是我们之前的一个提示词,但这个是比较简单啊,这个,这个写的比较简单,可以后面大家有兴趣的话可以看研究一下其他的 skill, 他 们写的会更专业些。而我们这边是做一个粗俗化的一个呃,技能包, 比如说描述是这一段 ok 确定,然后它会自动去加载好这一个技能库供我们去使用。 我们创建了这个技能之后,我们我们其实可以发现其实这里面会有一个文件夹,而这个文件夹的目录其实是很有意思的。 呃, char 是 代表了我们的 ai 编辑器叫 char, 然后 skills 是 一个标准的一个目录,然后下面就是技能的一个名称,然后这个 skill 是 我们刚才生成的,它会有个名称描述,再加上刚才说的一个提示词,就是刚才一个格式化的一个展示。我们创建了技能之后,我们如何使用它呢?我们先看一个绘画,比如说使用 这个技能主动唤起,精确唤起。但如果说我们在嗯提字词,也就是我们的 skill 里面的描述的提示词里面写的比较 ok 的 话,那它会通过各种语音分析去调用。 a few, moments, later, ok, 我 们来看一下整体的一个过程,我们输入了使用分析这个项目整体架构的这个技能,也就是我们刚才生成这个技能,然后呢,因为是精确的匹配,所以说他会主动去唤起这一个 skill, 那 思考的过程是我会,也就是去他会是使用 collect d o c 的 技能来分析这个项目的整体架构。 呃,然后呢,一步一步他会去做我们刚才让他要去做的这个事情。最终呢,我们后面有一个叫保,把最终的文件是保存到 alt 这个文件目录下, 而且这里其实已经有一个这样的项目架构的文件夹了,也就是说它其实是完全调用了这一个刚才我描述的这个过程,产生了我们这个项目架构的马克当的一个文件,完成了我们一个技能的一个调用和文档的一个输出。 然后这里补充一点,除了这种方式的换取。呃,使用这一个技能的方式的话,还有另外一种方式是我直接拖一个这样的一个文件告诉我应该说使用这个技能 也是进行精确匹配,精确匹配到我使用这个技能,那还有一种方式就是刚才我们演示的,比如说 chart 的 那个 cosuo 这样的 id, 它是支持斜杠进行,也是精确匹配到这个 skill。 而这种方式其实是在整体的你有一堆 skill 的 过程中,或者说我创建了很多的 skill, 而每个 skill 是 专业的去干自己的任务的时候,我们使用的方式是我们会把这一个技能放在相应 id 下指定的目录下,那这样的方式的话, 这个 id 会主动去加载这个 skills 的 技能库,通过这个描述,如果匹配出来,语义分析出来说,发现这一个我用户正在想干的这个事跟这个技能的描述相匹配,他会主动去调用这一个技能,然后再去具体的加载 下面这一段的文案或者叫提示词去完成像类似于专业的技能的工作或者工作流的 工作。而 ai 智能体通过渐进式批录的方式加载这一些 skills 的 技能库,可以有效地降低我 token 的 使用,因为它一开始是加载我整一个 name 和描述,那这样的话它的一个提整个的 token 的 消耗其实是有限的。 然后呢,如果是命中了我这一个 skill, 也就这个技能,它会再去加载我下面的内容,所以整体的设计是还是属于提示词的进阶,进阶的玩法,那我们再回到 我们的内容页,当我们通过 ai 编程工具去生成了我们的 skill, 而且它的原理其实是调用了 skill creator 这样的技能去创建我们这个 skill, 那 也完成了这么一个 skill 的 生成,那这个原理其实大家都已经明白了。之后下一步 各个不同的 id 的 一个目录的一个结构,之前我们选用的是 chart, 那 如果是 coos 或者 code code 其实都一样,也就说它在它的一个目录下,我会有一个 scales 这样的一个标准的一个目录结构,然后再下面才是真正的技能的一个名称 目录,那如果说是放在点下面,也就项目级,那如果是用户级,也就是之前也说过它分为全局和项目级 啊。 scale 的 结构,其实刚才我们只有一个 markdown 这样的一个 markdown 的 一个文件,但实际上它还会有其他的一些文件去辅助完成这个技能,呃,一个是它的脚本,我们可以把一些长的脚本放进去呃 scale 去调用这些脚本还会有一些依赖,比如说一些文档的依赖,然后一些静态资源。 因为我们呃官方也是建议 scale 它最好不要超过五百行,因为这样的话一个文件其实是就非常大了,它可以支持我分分文件夹,然后按照不同的呃文件的类型,分目录的存储, 而 scale 可以 去调用这些不同的文件,而这里的话是运行的一些脚本,而这一个的依赖的文档,比方说我现在要生成一个 ppt, 或者生成一个网页,而网页的格式的一些标准的内容就可以放在这个依赖里面,然后包括一些静态的资源。 而一个完整的一个 markdown 的 一个文件的格式是刚才我们其实已经看到过了,就是头部是一个 name, 也就是我 skills 的 名称,然后是一个描述,描述是它的一个 skill 的 功能,即什么时候会使用它, 然后下面是我的技能的一些描述,使用的一些时机。那所以说标准的一个 skill, 它其实还会有一些,我什么时候会去使用它,然后这个技能会适用于什么?再一次的明确我这一个 skill 的 一个能力。然后再下面是我的一个具体的一些内容,需要让我这一个调用这个 skill 时的时候去做什么事情, 我可以是干一个生成网页的一个一个,一个一个内容,也可以是我几个步骤或者工作流的方式去呈现我的一个能力。 那除了刚才的内容之外,头部信息也就说在这里还会有很多的其他的属性,我认为比较关注的除了最上面这两个之外还有一个,而这一个参数如果设为 q 的 时候,该技能仅会通过斜杠 skill name 的 显示的方式进行调用,而不会说自动根据上下文去调用它 什么概念。如果我这一个设置了 q, 那 刚才的方式自然语义的方式去调用已经不不可能了,只能通过斜杠的方式精确的匹配到这个技能才会被调用。那这个是刚才我们提说的一个提示词,也就说生成技能里面的一个内容, 然后呃,完成了我们这个 skill 的 一个基本的一个概念,再加上实操了一次如何去创建一个 skill, 那 我提问说一声,就是这一个页面的生成,你们看到这一个体系的生成,其实是我也是因为之前做很多的解释用的是纯文本, 那这样的话整体的视觉效果并不炫酷。那我自己也做了一个 skill, 是 专门去做做这一个页面的 skill, 它根据我的一个文案去生成了我这一个演示的 ppt 效果的。呃,网页,那有兴趣的小伙伴的话,下一次我可以专门介绍一下怎么去创建这么一个 skill。

吃晚饭的时候闲聊,聊到下周我们产品要在德国某大学办黑客生活动,让那些不会写代码的科学家们做 skill。 堂妹突然积极发言,我知道 skill 啊,姐最近老刷到 skill, 就是 你之前给我讲的知识库,可以缩短上下文,提高精度啊。我一整个亚麻呆住了,理解不到位啊,老妹儿,等我吃完饭了再教育你。说到 skill, 就 不得不提 m c p, 全名叫 model context protocol 模型上下文协议。 虽然名字挺唬人,但你把它想象成电脑的 usb 接口就明白了。以前的 ai 模型就像个被关在小黑屋里的天才,脑子特好使,但没手没脚,碰不到外面的东西。而 m c p 就是 给这个 ai 装上了一套标准的接口,让它不仅能响,还能真正动手去干活。 比如去读你电脑里的文件,去访问公司的数据库,或者通过 api 去别的软件里查数据。在 mcp 出现之前,每当我们想让 ai 去连接一个新软件,比如连接飞书或者 google drive, 程序员都需要专门为这个连接修一条独一无二的路,费时费力。而且每换一个 ai 模型,这路还得重修。 而 m c p 就是 大家坐下来商量出的一套通用标准,它就像是给那个小黑屋装了一个标准化的 usb 接口,只要大家都遵守这个协议,无论是谁家的数据或工具,只要为 m c p 开发一次,就都能像插 u 盘一样即插即用,不用再为了连接而反复造轮子。那 skills 又是什么呢? 如果说 m c p 是 那个标准化的接口协议,那 skills 就是 我们通过这个接口赋予 ai 的 具体能力。当作为产品经理的我们,在设计一个 ai agent 时,我们不需要去写底层的接口代码,我们的工作重点是定义这个能力长什么样。 比如,你需要一个查询库存的 skill, 你 需要告诉工程师,这个 skill 的 目的是帮用户查仓库里还剩多少货,它需要输入商品名称,输出剩余数量。有了 m c p 这个标准协议,在底层做支撑,工程师实现这个 skill 会变得非常快,甚至可以附用别人写好的连接器。 对咱们文科生来说,理解到这一成就够了,这意味着未来的工作方式变了。以前读研究生可能还需要学统计学,大把时间都在做洗漱具、查资料这种重复性的苦力活。而有了这套 m c p 加 skills 的 体系, ai 就 成了你的专属研究助理。 你不需要自己去搬砖,而是要学会怎么给 ai 下达精准的指令,制定 sop。 从某种意义上说,我们正在从干活的人变成管理 ai 的 人,这恰恰是我们擅长的领域。 所以,当你看到 j d 里写着这些词的时候,面试官其实不是在考你会不会写协议代码,而是在看你懂不懂得利用这些现成的标准化技术,去低成本的搭建出能解决用户实际问题的 ai 产品。 堂妹听好像有点荡激了,过了半个小时突然跑过来跟我说,好比我不用懂 usb 的 电路原理,只需要知道插上 u 盘能存照片,插上键盘能打字就行了。 我说差不多就是这个意思,姐姐讲的还容易理解吗?如果你也听懂了,请在评论区扣一,没听懂的地方也可以留言,其实道理就是这么简单, ai 领域的专业术语和知识也没那么多,如果你感兴趣,可以跟着我和堂妹一起学起,也欢迎进群激情交流这个系列我会继续更新下去的。

大家好,欢迎来到安提格拉微体 agent skill 编辑指南,今天我们将深入探讨如何为杰米奈三十代的 ai 代理人打造专家级技能。 在安提格拉微体中, skill 不 仅仅是 api 调用,它是一个包含核心指令文件。 skill 扩展名 md 的 轻量级包,本质上是将人类的专家逻辑注入给 ai。 一个标准的技能结构非常清晰,关键在于代理人目录下的 skill 扩展名 m d 文件,它是技能的灵魂。此外,你还可以根据需要包含自动执行脚本、参考资源和视力 编辑。高质量技能有三个核心要点,首先,描述必须具备语义触发性,确保代理人能按需加载。其次,遵循原子化原则,一个技能只专注一个领域。最后,利用渐进式批录机制, 通过层级标题引导模型高效推理进阶。 best practices 包括使用决策树风格编辑指令,以便模型判断,提供高质量视力对其输出。将复杂脚本黑盒化以简化模型调用,并合理区分项目特定的 工作空间作用域与通用的局作用域。这是一个典型的 skill 扩展名 m d 视力 通过 y a m l 元素据定义源信息,使用 markdown 明确目标和执行步骤。最后通过具体的事例来约束输出风格。这种结构能显著提升代理人的可信。 掌握了这些要点,你就可以开始构建属于你的强大 ai 技能了。感谢观看,我们下期再见!

绝大多数人使用 gmail 三的方式,其实依然停留在两年前使用豆包的那个时代。今天我想结合谷歌的官方文档和我的实战经验,给大家分享三个 gmail 三点零的进阶的使用技巧。第一招是能帮你把它训练成你的专属顾问,第二招能够让你更高效地去创建你的 agent skill。 第三招甚至能让你无 现白嫖。顶级算力过程中会有一些提示词的模板,我都会在片尾告诉大家获取方式。我们现在看第一招吧。系统指令。很多人都知道要给 ai 写人设提示词,但是其实大家都没有用。对,如果你只是给 ai 对 话框里发一提示词,它其实只有临时记忆, 你会发现聊着聊着就变味了。而这个系统指令其实是给这个 ai 对 话框写入一个基因代码,它是一个永久的人设或者是思考框架。现在你在这个 google ai studio 里面, 在右侧就可以去写出你的这个系统指令。在 gmail 官网有一个叫 jim 的 地方,也是大家去设置系统指令的地方。那这个系统指令怎么写才让它成为你的专属的战略级顾问呢?我参考了 google 的 官方文档,还有我自己的一些用法,给大家总结了五个模块的万能公式。第一个模块其实就是用户画像,简单说就是亮出你自己, 把你的这个底牌和限制告诉 ai。 举个例子,你像我没有任何的海外公司,那当我想做一个出海的 ai 产品的时候,涉及到支付模块,我的 ai 就 不会给我推荐像 stripe 这样我不具备任何资格的一个方案,而是直接给我能用的平替。再比如像我告诉 ai 说我的电脑是 macbook, 以及我不懂 c 加加,我就是一个 webco 的 用户,那他给我代码的时候就会给我直接能在 mac 终端去运行的命令,而不会给我一些看不懂的 windows 指令。 那第二块其实是关于行为和语气,其就是你和 ai 的 沟通方式。其实 gmail 三有一个特别容易犯错的地方,就是他特别爱讨好人,他训练的时候就默认是一个顺从的助理角色,那你像我这种 i n t b 性格,我一般会给他下个死命,就是你不要谴责我,你也不要附和我, 而且我告诉他就我是 ceo, 你 是执行层,但是你在给我建议之前,你必须像苏格拉底一样去反问我,这样呢?时间长了,他现在给我口头禅就是 ceo, 你 百分百是对的,但是有三个风险在落地的时候要考虑等等,这 就是我觉得 ok 的 沟通方式,当然你也可以找你喜欢的有效沟通。第三个是关于时效性啊,因为 gmail 三的这个模型内置的训练数据都是二五年一月份的,所以我会强制告诉他涉及到一些行业动态,你 必须给我开启 google search, 不要拿这个一年前的这个旧新闻来骗我,在 studio 里面的话,它现在也默认会开启 groundwave。 google search 在 底部大家应该能看到第四和第五个模块是关于逻辑推理、输出规范的,优先评估风险是个永远正确的事情,不确定的给我 ai 幻觉, 并且因为我平时经常整理提示词,所以我会要求他给我输出格式基本是 markdown, 如果有一些专业名词的话,对中文给我参照一下,然后你把这五个模块的这个提示词都填进去的话,你的 jimmy 瞬间从一个只会讲片儿脏话的网友变成一个最懂你的专属顾问。 不过各位注意啊,如果你像我一样经常用 google s studio 的 话,你千万不要放任何的真实的姓名、电话等隐私信息,因为这些会被拿去平台做模型的训练数据的。 那第一招说完,我们再说第二点,建立你的 agent skill 的 实验室。现在 agent skill 这个概念其实真的挺火的,但本质就是用提示词 去封装一套工作流。那你现在已经会了这个系统指令了吧?那其实你就可以在任意一个对话框去创造一个工作流提示词的测试环境。简单说其实就是让 ai 自己卷自己。比如我就会告诉 jimmy 三,你有两个活儿,第一个活儿就是按照我的这个流程写文案生成内容。那还有一个角色是你要站在旁观者的角度去 去记录我的评论,去找茬,去想你刚才哪一轮工作做得不够好,去底层去修改和完善。基本上当我每一轮的任务结束之后,我就会输入复盘这个指令,它就会生成一个升级版优化过的提示词, 以此循环往复,不断的去完善这个核心的一些算法,提示词等等。这个可以给大家看一下,我基本上在我很多的提示词测试的时候,都会在开头加上这样的一些规定,其实比我们自己去复盘在那瞎琢磨效率高了不止十倍。 你在这些实验室里面测试好了,直接搬到 course deal 或者是 webcointing 里面,效率大大的。那还有一个进阶用法,其实是白嫖免费额度。大家都知道免费的 gmail 用多了都会被限制额度,那怎么榨干它的价值呢?我自己平时是用三个策略哈。第一招就是 多个账号, google a s studio 和 gmail 的 官网,它其实是两套额度系统,所以如果你有两套谷歌账号的话,那你每天相当有四波免费额度,可以疯狂白嫖,轮着造。那如果你没有的话,有更好的法,比如说模型混用,简单说就是一些普通的追问或者查资料,你直接让 gmail 三六零 flash 去做,一点不比 pro 差,而且速度快,占用的额度也非常的少。只有你做一些核心的复杂决策,需要回顾上下文,包括第八个的时候,你再找 pro 模型去做好纲要,用在刀刃上。 第三招其实我觉得反而更重要,一定要紧盯着 token 的 使用进度条。免费额度其实它不是看你问了几个问题,它其实看的是你整体的算力消耗,对话越长,上下文越多,哪怕你只发个嗯嗯, 你的消耗也是翻倍的。根据我的经验哈,五万是个小卡,十二点九是个大卡,这个数在哪看呢?在 google a s 六里面,在每个对话框上面能看到这个对话框已经 累积的这些算力。我这个对话框已经快要废弃了,因为一旦它超过了这个预值之后,你会发现它的反应变慢,幻觉增加非额度,用不了几次它就会告诉你到顶了。所以如果你发现已经到这些极限的时候,你就千万不要犹豫,直接开个新对话框,这就叫卡 bug 级的省流。 当然啊,如果大家对这个上下文无损迁移感兴趣的话,我也可以专门出一个视频讲一讲我天天干这个事。最后多一嘴很多官方的一些参数,选用默认值就好了,不需要多刻意的调整,够用的。 其实 ai 好 不好用,强不强就关键看你怎么用,你有这些进阶的方式的话,你就可以在免费的额度情况下发挥它最大的潜能, 这其实就是最大利好于我们普通人的一个时候。今天视频里面提到这些提示词模板,老规矩我都会整理在我的 ai 同款笔记里面,大家去一小说幺零幺回复关键词自助拿走就行。好吧,那我继续去开发我的 ai 产品了,咱们下期再聊吧,拜拜。

程序员都不写爬虫了, l l m 加 api 才是王道! 这一百张配图我只用了一点五小时全自动生成,做内容最头疼的是什么?找配图啊,一百条内容要配一百张图,每次翻半小时太累了。解析, html 复杂,易崩溃,反爬虫频繁,随时失效, 网站要重写。现在用 l l m 加 api, 稳定可靠, l l m 理解语义,关键词提取超准,五分钟搞定逻辑简单 来看它怎么工作的。一、读取鸡汤文二、 l l m 提取关键词展示 l l m 返回的程序。三、调用 paxos on splash api。 四、自动下载并命名,配合屏幕录制终端运行脚本实时输出 传统爬虫关键词匹配,贵人可能搜到奇怪的东西, n r n 语义理解,贵人相助 helping hands support 完美温暖的手团队支持 成果怎么样?幺二八条鸡汤文,一二五条成功匹配,百分之九十七点七,全程自动,不用手动找, 这就是 ai 时代的效率,不用写爬虫,不用维护反爬虫。 api 加 l l m 稳定可靠,语义理解更准,工具选对了,效率提升十倍!关注我,分享更多 ai 效率工具!

api 就是 直接调用的官方的接口,简单点来说就是在官网上面又套了一层壳子,它用的和官网的其实是一模一样的,没有任何的区别。但是现在的 api 的 网站基本上都是按条收费的,它每条的价格一般是在零点零八到一块五的样子, 你们其实都能想得到零点零八就是免费版本的,它生成的就是直接去水印的,就不需要我们再去去水印了。那这一块 api 确实做的还是比较好的,所以大家要官网和 api 结合着使用,因为 都是因为我们如果要达到企业生产的这个目的,我们要做批量化,要做高清的视频,而且我们还需要性价比,这一些只有 api 能给我们。但是现在 api 它不能创建角色,我们就需要用官网来创建角色,官网上创建好的角色,我们可以直接艾特,然后复制到这个 api 的 网站上面,我们就可以去保持这个人物的一致性。 所以大家不要再跟我说什么 solo 是 免费的,为什么还要花钱这种事情,因为我们做企业的生产是有很多的限制的,而解决这些限制最好的方式就是用官网加 api 的 形式。好了,今天就到这里。

expert ai 正式引入 skill 功能,实现在智能体基础上的使用升级。 简单来说, skill 是 一种基于 markdown 格式的标准化文档,它将复杂的技能、逻辑、知识库和 api 调用,封装成易读、易维护的文档。 灵活性与渐进式路由是它的核心。 agent 不 再一次性加载所有荣誉信息,而是根据你的需求动态激活 skill。 这种模式不仅避免了信息过载,还支持用户深度自定义,你的 agent 现在可以真正因地制宜。 spirit ai 平台内置了官方 skill 中间键,适应从开发到办公的各个高频场景。 你也可以上传自定义 skill 包,打造独属于你的私有专家库。接下来开始一个简单的实操,这里以上传 skill 包为例。首先在 github 上获取一份 skills, 下载成功后是压缩包形式, 打开 expert ai 平台官网,点击开始就会进入对话首页,点击新建数字专家,找到技能选项,选择上传技能, 把之前下载好的压缩包上传进去就可以了,这些都是可以使用的技能包。接下来选择创建数字专家,给智能提起个名字, 选择一个模型,画面中这个就是主智能题,我们给他一个系统提示词。 接下来不使用 skill 包的情况下进行测试, 我们等待一会 好执行完成。 我们看一下输出成果, 部分功能不是很全,现在为智能体增加 skill。 右键选择添加工作流,选择技能中间键勾选前端设计技能,可以添加一下技能描述, 把智能体和技能连接起来,对话框输入相同任务要求,等待运行结果,可以看到左侧技能中间键出现绿色圆点,说明技能已经被加载执行。 我们来看一下输出结果,可以看到画面更清晰,数据展示效果表现不错。 我们再来看一下使用技能前后页面对比,添加技能后,页面布局层次更分明,界面更友好。 测试完成,点击发布,填写一下发布说明,返回对话界面,就可以使用你的专属智能体了,在这开启你的新任务吧!