太炸裂了!兄弟们!在 skill 这个词后面悄悄加两个字母, s h, 往下翻一翻,你就会看到整整九万多个 agent! skills, 网站开发、视觉设计、数据库搭建、内容创作、 ppt 制作、 seo 优化,想要什么类型几乎都能找到,而且全部零门槛使用。 然后你又误打误撞发现了最近讨论度很高的一个 skill emotion best practice。 把它的链接复制下来,在电脑上随手建一个文件夹,打开任意一款 ai 工具,只说一句话, 帮我把这个 skill 装进这个文件夹。就这一步,你手里面就多了一个专门做动画的利器,从此你可以直接开口指挥它,帮我做这种效果,帮我做那种风格,它都能给你跑出来。更绝的是,你把一张 excel 表拖进去,它就直接能根据数据生成动画,看完你不觉得有点上头吗?
粉丝9799获赞8.5万

如果你不知道去哪里找 skill, 这七个 skill 网站一定要收藏。第一个, skill map 可以 理解成 skill 界的淘宝,它最大的特点就是大而全,你想找 pdf 处理、公众号写作、数据分析、前端开发,直接搜关键词就行。如果你刚接触 skill, 可以 先在这个网站上看看它的生态到底都有什么。第二个 skills skill, 二十四小时的趋势正在涨,如果你想追热门的 skill, 看它是最直观的 四个 cloud hub 是 open cloud 生态的官方入口,它不只有 skill, 还有 plugins、 publishers, 你 不只能找技能,还能顺便看插件,看见发布者评分、下载量、 安全扫描等等。想追原生态的可以先看这个。第五个 agent skill 适合装之前做安全检查。有些 skill 看起来很像,但是到底靠不靠谱,这个网站就会展示它的质量评分还有安全评分。如果你装 skill 比较谨慎,可以先来这里筛一遍,比如编程开发、文档处理、市场营销,它 都帮你把分类做好了,你只要按需求去做筛选就可以了,效率高很多。第七个, cloud skill, 这是 cloud 的 官方出品,走的是精品路线,数量不一定最多,但是都是官方筛选过的,维纳也更清楚,新手也非常容易上手。如果你也有好的 skill 网站,欢迎评论区分享。

现在啊, agent 的 skill 已经多到失控了, skill s m b 上面有十一万个 skill, s h 上面啊有三万多个。问题已经不是有没有 skill, 而是你该怎么选。那为什么我们不让 open code 帮我们找呢? 在 skill s h 上面啊,有一个官方的 skill 叫 find skills, 专门帮你找现场的 skill, 比如我直接说我要做 seo 的 优化,有没有好用的 skill, 你 看它会自动调用 find skills 在整个 skill 的 生态里。帮我搜列出来之后啊,再问我要不要装。我们还可以继续让 opencode 帮我们判断哪个更合适 find skill 啊,解决的是有没有更成熟的现成方案, skill 太多不是问题,不会选才是问题。

二零二五年十月十六号, anthropic 正式推出了 agent skill。 起初官方对它的定位相当克制,只是希望用它来提升 cloud 在 某些特定任务上的表现。但大家很快发现,这套设计实在是太好用了,因此行业里很快就跟上了节奏,包括 vs code、 codex、 curser 等工具都陆续加入了对 agent skill 的 支持。在这样的背景下,十二月十八日, anastropics 做出了一个重要决定,正式将 agent skill 发布为开放标准,支持跨平台、跨产品服用。 这意味着 agent skill 已经超越了 cloud 单一产品的范畴,正在演变为 ai agent 的 领域的一个通用的设计模式。那么这个让大厂纷纷跟进的 agent skill 到底是解决了什么核心痛点?它和我们所熟悉的 mcp 又有着怎样的区别和联系呢? 今天这期视频我们就分几个部分彻底讲清楚这个 agent skill。 我 们首先从 agent skill 的 概念出发,也就是给大家讲明白 agent skill 到底是个什么东西。然后我来给大家演示一下它的基本使用方法。 在了解了基本用法之后,我们再来看看它的高级用法。高级用法一共是包含两块,分别是 reference 和 script。 最后,我会把 agent skill 和 mcp 做个比较,告诉你到底应该选哪一个。 好了,话不多说,让我们直接开始哦,不好意思,只是想证明自己不是 ai, 那 我们现在真的要开始喽。 那什么是 agent skill 呢?用最通俗的话来讲, agent skill 其实就是一个大模型,可以随时翻阅的说明文档。 举个例子,比如你想要做一个智能客服,你可以在 skill 里面明确交代,遇到投诉得先安抚用户的情绪,而且不得随意承诺。 再比如,你想要做会议总结,你可以直接在 skill 里面规定,必须要按照参会人员一提决定这个格式来输出总结的内容。这样一来,你就不用每次对话都去重复粘贴那一长串的要求了。大模型自己翻翻这个说明文档就知道该怎么干活了。 当然,说明文档只是一个为了方便理解的简化说法,实际上 agent skill 能做的事情要远比这个强大,它的高级功能我们待会儿就会讲到,不过在目前的起步阶段,你就把它当成是一个说明文档就行。下面我就用会议总结这个实际的场景,带大家看看它到底是怎么使用的。 这里我们使用 cloud code 来演示如何使用 agent skill。 要想使用 agent skill, 那 当然是要先创建一个了。 根据 cloud code 的 要求,我们需要在用户目录下的 dot cloud skill 文件夹创建我们的 agent skill。 所以呢,就让我们先进入到这个文件夹中,然后执行 maker 会议总结助手来创建一个文件夹,这个文件夹的名字就代表了我们 agent skill 的 名字,然后再使用 vs code 来打开这个文件夹,这样的话我们编辑文件会更方便一些。打开这个文件后,我们在里面创建一个叫做 skill 点 md 的 文件, 然后填好这个文件的具体内容就是这样了,每一个 agent skill 都需要有这么一个文件,它用来描述这个 agent skill 的 名称,能干什么事以及怎么干这个事情的。比如我们这里要创建的 agent skill 就是 用于总结会议目录内容的, 它的 skill 点 m d 一 共分为两部分,头部的这几行被两段短横线包起来的是叫做原数据,英文叫做 matte data, 这一层就只写了 name 和 description 这两个属性。 name 呢是 agent skill 的 名称,必须与文件夹的名字相同。 name 的 下面呢是 description, 它代表这个 agent skill 的 描述,主要是向大模型说明这个 agent skill 是 用来干什么的。然后再看下面剩余的部分,这个呢就是具体的 agent skill 的 说明了, 官方把这一部分呢是叫做指令,对应的英文是 instruction, 这一部分就是在详细描述模型需要遵循的规则。比如说你看这里,我规定了它必须要总结参会人员议题和决定这几个方面的内容, 然后为了确保他真的理解了,我这里还举了一个例子,输入的是会议的录音内容,然后输出的呢就是我们所需要的格式了。好,现在我们的 agent skill 应该是做好了。对,就是这么简单,就是一个说明文档, 下面我们打开 cloud code 来验货,首先随便找一个空目录,打开 cloud code, 然后输入下面这个问题,你有哪些 agent skill? cloud code 给我们回答了,可以看出他已经发现了我们写好的 agent skill。 然后我们来看看 cloud code 是 怎么使用这个 agent skill 的。 我们输入请求总结以下会的内容,然后粘贴一段会议录英文本回车,让我们看看 cloud code 会如何应付我们这个问题。 好, cloud code 有 反应了,大家注意看屏幕,这里 cloud code 并没有直接开始下编,他根据我的指令意识到了这事归我们刚才上传的那个 agent skill 管,所以呢,他是在向我询问能不能使用这个 agent skill, 那 我们当然是同意了。同意之后,他就开始读取我们写的那个会议总结助手了,主要就是读取其中的那个 skill 点 m d 文件,让我们稍作等待 好,结果出来了,参会人员议题决定三点都清清楚楚,这完全符合我们在 skill 里面定的规矩。这个呢,就是 agent skill 的 基础用法了,是不是很简单?现在你知道了如何创建和使用 agent skill, 那 不妨让我们想想刚才到底发生了什么。 首先,整个流程中一共有三个角色,用户 cloud code 以及 cloud code 的 背后所使用的大模型。在我们的例子里,这个就是 cloud 模型 流程一开始的时候,用户会输入请求,此时 cloud code 会把用户的请求连同所有 skill 的 名称和描述一起发给大模型。注意,这里只带了名称和描述, 也就是我们前面所说的 skill 原数据层。虽然说我们之前只演示了一个 skill, 但是你可以想象一下,哪怕你装了十几个 skill, 此时的大模型呢,也只是在看一份轻量级的目录, 因为毕竟只有名称和描述嘛。在接到了用户请求和每一个 skill 的 名称描述后,大模型会发现用户的请求呢,可以使用会议总结助手这个 agent skill 来解决, 此时呢,他就会把这个信息告诉 cloud code。 cloud code 接到大模型的响应之后,会去会议总结助手那个目录里面读取完整的 skill。 md 正文儿对,这个时候读取的呢,才是 skill md 的 全部内容,之前就只是名称和描述, 而且要注意,他只读取了会议总结助手这一个 agent skill 的 内容哦。在拿到了会议总结助手的 skill md 内容后, cloud code 会把用户的请求和完整的 skill md 内容发给大模型, 大模型会根据 skill 点 m d 的 要求来生成响应,并且把响应发给 cloud code, cloud code 进而呢,会把这个响应发挥给用户,这样呢,用户就会看到结果了。 这就引出了 agent skill 的 第一个核心机制,按需加载。虽然 skill 的 名字和描述是始终对模型可见的,但具体的指令内容只有在这个 skill 被选中之后才会被加载进来给模型看,这个呢,就节省了很多的 token 了。 前面我们讲了,一开始 cloud code 会把所有 agent skill 的 名称和描述都给到模型,比如说什么爆款文案 skill、 会议总结 skill、 数据分析 skill 等等, 模型呢,会从中选择一个,之后只有选中了那个 skill 的 skill 的 md 文件才会给到模型。说白了呢,就是按需加载, 这个呢,已经很省 token 了,但是它还不够极致。大家试想一下,我们的会议总结助手可能会越来越高级,我们希望它不仅仅是简单复述,而是能够提供更有价值的补充说明。 比如说,当会议决定要花钱时,它能直接在总结里标注是否符合财务合规,当涉及到合同时,它能够提示法务风险。这样大家在看会议总结的时候,就不需要再去翻规章制度,一眼就能够看到这些关键的补充信息,这就非常方便了。 但问题在于, skill 能做这些事情的前提是它要把相关的财务规定和法律条文都写入到 skill 点 m d 文件里,这些文件可能会非常长,都写进去的话, skill 点 m d 文件就会变得无比的臃肿, 哪怕只是开个简单的早会,都要被迫加载一堆根本用不上的财务和法律。废话,浪费模型资源。 那能不能做到暗虚中的暗虚呢?比如说,只有当会议内容真的聊到了钱, cloud code 才会把财务规定加载给模型看。 其实这个呢,也是可以的, agent skill 呢,提供了 reference 的 概念,干的就是这个活,让我们来试一下。首先我们来给它加一个文件,也就是 agent skill 术语里面的 reference。 我们把这个文件叫做集团财务手册,里面写明了各种费用的报销标准,比如说是住宿补贴五百一晚,餐饮费人均三百一晚之类的。然后我们在原来的 skill 点 m d 文件里面新增一个财务提醒规则,里面写明仅在提到钱预算采购费用的时候出发。 出发的时候呢,需要读取集团财务手册,点 m d 这个文件,根据文件内容指出会议决定中的金额是否超标,并明确审批人,这就可以了。我们回到 cloud code 这里再试一下。 这次我们的请求仍然是总结下这个会议的内容,不过呢,这次使用的会议内容稍微换了一下, 这段对话呢,我们就不细看了,你只需要知道,在这段对话里面,老陈让小李订一千二百一晚的酒店,这涉及到了钱。按道理来说, cloud code 应该触发我们刚才新增的财务提醒规则,让我们看看 cloud code 能不能意识到这一点。 首先, cloud code 意识到了这个请求跟我们的会议总结助手相关联,请求使用这个 agent skill, 我 们同意。 然后他意识到了这个会议跟钱相关,根据 skilled md 文件的指示,他请求读取集团财务手册,这个文件用于查看里面的财务合规信息,这个呢,我们也同意。 最后,他根据实际的会议内容生成了总结,可以看出,总结中不仅包含参会人员、议题、决定等基本信息,还包含了财务提醒,这完美符合我们的需求。 这个呢,就是 reference 的 核心逻辑了。在 agent skill 的 体系里面,集团财务手册点 m d 这个文件就是一个典型的 reference, 请大家记住它的特性,它呢是条件触发的。 在刚才的例子里面,只有当 cloud code 读取完 skill 的 md 文件,判断出需要查账时,才会去加载这个文件。反过来说,如果这是一个跟钱无关的技术复盘会,那么这个财务文件就只会躺在硬盘里面,绝不会占用哪怕一个 token 的 上下文。 好,讲完了 reference, 接下来我们来讲讲如何让 agent skill 跑代码,毕竟查资料只是第一步,能直接动手运行代码,帮我们把活干了,这才是真正的自动化。这个呢,就用到了 agent skill 的 另一大能力, script 让我们在文件夹里面创建一个 python 脚本,文件名就叫做 upload 点 pi, 用于上传文件。之后我们填好这个代码文件的内容,然后我们来到 skill 点 m d 这个文件里再加上一段关于上传规则的描述, 如果用户提到了上传同步或者是发送到服务器这样的字眼,你必须运行 uploader pi 脚本,将总结内容上传到服务器。然后呢,我们来到 cloud code 这边,输入请求,总结下这个会议的内容,并把它上传到服务器中,然后我们粘贴会内容。 跟之前一样, cloud code 意识到了这个请求与我们的会议总结助手相关,所以呢,他请求使用这个 agent skill, 我 们同意,然后他把会议的总结内容输出了出来,并准备上传到服务器中,他请求执行 up 六点 pi 文件来实现这个功能,我们也同意 好,上传成功。而且 cloud code 还把上传相关的一些信息也展示了出来,非常棒。 这里面呢,有个小插曲,大家注意一下,我这次所使用的会议内容跟钱其实没什么关系,所以 cloud code 呢,也并没有去读取集团财务手册那个文件, 结果中呢,也没有财务提醒相关的内容。这正好印证了我前面所说的观点, reference 是 按需加载的,如果用户没有提到与 reference 相关的内容,那 cloud code 是 不会去读取它的,这样就达到了节省上下文 token 的 目的。 好让我们再回到代码执行部分,注意看这里, cloud code 申请执行这个 uploader pie 文件,它并没有去读取这个文件。没错, agent skill 里面的代码只会被执行,不会被读取。 这就意味着,哪怕你的脚本写了一万行复杂的业务逻辑,它消耗的模型上下文呢,也几乎是零。 cloud code 只关心脚本的运行方法和运行结果,至于这个脚本的内容,它可以说是毫不在意。 所以呢,虽然 reference 和 script 都属于 agent skill 的 高级功能,但是呢,它们对于模型上下文的影响其实是截然不同的。 reference 是 读,它会把内容加载到上下文里面,所以呢,是会消耗 token 的。 script 呢,是跑,它只会被执行,不会占用模型的上下文。讲到这里,我们需要停下来稍微做个总结,聊一聊 agent skill 的 渐进式批漏机制。 agent skill 的 设计其实是一个精密的渐进式批漏结构,这个结构里面一共有三层,每一层的加载机制都不太一样。 第一层是原数据层,这里有所有的 agent skill 的 名称和描述,它们是始终加载的,相当于大模型里面的目录。大模型每次回答前都会看一下这一层的信息,然后决定用户的问题是否与某个 agent skill 相匹配。 第二层是指令层,对应 skill 的 md 文件里面除了名称和描述之外,其余的部分,只有当大模型发现用户的问题与某个 agent skill 相匹配的时候,它才会去加载这一层的内容。所以呢,我们称这一层为按需加载。 第三层是资源层,这个呢,是最深的一层,它一共是包含 reference 和 script 两方面的内容。其实按照官方最新的规范,应该还有一个组成部分叫做 assets, 不 过我看了一下,它跟 reference 的 定义似乎有部分重叠,因此我们这里先忽略它。 好,我们刚才例子里面的集团财务手册和 uploader pie 脚本就属于这一层,只有当模型发现用户问题与财务或者上传相关的时候,它才会去加载这一层的内容, 这就相当于是在按需加载的指令层基础上又做了一次按需加载,所以我们可以称它为按需中的按需加载, 当然这是我起的名字啊。 reference 和 script 的 加载方式其实不太一样, reference 是 被读取的, cloud code 会把对应文件的内容放到模型的上下文中,一共回答式参考。而 script 是 被执行的, cloud code 根本就不会去看代码的内容,它只关心代码的执行结果。 当然这个也不是铁律啊,如果你没有把代码的执行方法说清楚, cloud code 还是有可能会去看一下代码的,毕竟跑不下去了嘛,这样的话呢,就会占用模型的上下文了。所以还是请大家写 skill 的 时候尽可能的把一切都解释清楚。 那聊完了 agent skill 的 用法,很多朋友可能会有种似曾相识的感觉, agent skill 好 像是跟 m c p 有 点像啊,本质上都是让模型去连接和操作外部世界。既然功能重叠,那我们到底应该用哪一个呢? 关于这个问题,按 serapic 官方写过一篇相关的文章来解释,核心观点就一句话就在这里, mcp connects cloud data skills teach cloud what to do with that data。 这句话可以说是直接点明了 mcp 与 agent skill 的 区别,它其实就是在说 mcp 给大模型供给数据,比如说查询昨天的销售记录,获取订单的物流状态等等。 而 skill 是 教会大模型如何处理这些数据的,比如说是会议总结必须要有个议题啊,汇报文档必须要包含具体的数据啊等等。到这里,有些同学可能就会问了, 不对啊, agent skill 里面也能写代码?我直接在 agent skill 里面写连接数据的逻辑不就好了吗?这样呢,就不需要 mcp 了, agent skill 就 直接把这两个活都给干了。 确实啊, agent skill 也能连数据,功能上与 mcp 有 所重叠,但是能干并不代表适合干, 这就好像是瑞士军刀也能切菜,但没有人会这么干。我们这个场景呢,其实也是这样, m c p 本质上是一个独立运行的程序,而 agent skill 本质上是一段说明文档,它们的本质不同决定了适合的场景也是不同的。 agent skill 更适合跑一些轻量的脚本,处理简单的逻辑。在代码执行方面, agent skill 的 安全性和稳定性都不及 mcp, 所以 大家还是要根据场景选择合适的工具。甚至在很多的场景下,我们需要把 agent skill 和 mcp 结合起来一起使用,以便尽可能的满足我们的需求。 好,今天的视频呢,就到此结束了,我是马克,用最通俗的语言讲最硬核的技术。如果我的视频对你有帮助,欢迎点赞订阅,我们下次再见,拜拜!

如果你不知道去哪里找 skill, 这七个 skill 网站一定要收藏。第一个 skill map 可以 理解成 skill 界的,它最大的特点就是大而全,你想找 pdf 处理、公众号写作、数据分析、前端开发,直接搜关键词就行。如果你刚接触 skill, 可以 先在这个网站上看看它的生态到底都有什么。第二个 skill 是 skill, 二十四小时的趋势正在涨,如果你想追热门的 skill, 看它是最直观的 四个 cloud hub 是 open cloud 生态的官方入口,它不只有 skill, 还有 plugins、 publishers, 你 不只能找技能,还能顺便看插件,看看发布者评分、下载量、 安全扫描等等。想追原生态的可以先看这个。第五个 agent skill 适合装之前做安全检查,有些 skill 看起来很像,但是到底靠不靠谱,这个网站就会展示它的质量评分,还有安全评分。如果你装 skill 比较谨慎,可以先来这里筛一遍,比如编程开发、文档处理、市场营销,它 都帮你把分类做好了,你只要按需求去做筛选就可以了,效率高很多。第七个, cloud skill, 这是 cloud 的 官方出品,走的是精品路线,数量不一定最多,但是都是官方筛选过的,维纳也更清楚,新手也非常容易上手。如果你也有好的 skill 网站,欢迎评论区分享。

跟大家分享一个 ai 圈的秘密,其实很多效果特别好的 skill 底层都是需要调用 api 的, 但是呢,可能很多朋友对 api 还是比较模糊的,那我今天就准备用谁听了都能懂的大白话,给大家讲一讲到底什么是 api。 而且呢,我还会手把手的带大家走一遍,具体怎么接通,怎么用到我们自己的 skill 里面。看完之后呢,你就会发现这个事儿它非常的简单,完全不需要什么技术,并且呢,一旦我们学会,收益是非常非常大的,因为呢,它可以把我们的 skill 效果直接拉到顶级。 那作为一个实用主义的 ai 创业者,我先跟大家说一说,什么情况下需要去用这个 a p i? 我 其实呢是非技术背景,所以呢,以前我对 a p i 其实是一知半解,也没有自己动手去接过那。但是在今年开始,我去做 skill 嘛,比如说自动剪辑啊,自动生成封面啊等等, 我就会发现这个 skill 的 效果它其实总是不理想。那仔细研究下来,我发现这个中间很多关键的点就在于 api, 我 们要想这个 skill 的 效果非常好,还真就得学会去接 api。 那 究竟什么是 api 呢?我给大家打一个比方啊,就比如说我们刚刚想做这个自动剪辑的 skill, 那 第一步呢,我们肯定得有一个技术,这个技术得帮我们把我视频里面说的话变成文字,这样后面才能方便剪辑。 那正常来讲呢,我们肯定是需要自己去研发一个这样的技术,但这太难了,也太慢了,那有没有什么捷径呢?哎,有,那我们直接买别人研发好的技术不就得了吗? 但是这个太贵了,一般人也买不起啊,那有没有便宜点的方案呢?哎,也有,就是我们不买他们的技术,但是我们可以租他们的技术。那你说租个房子,租个相机,我们都能理解,因为有实物嘛,你一手交钱一手交货。但是在虚拟世界租个技术要怎么租呢? 哎,我们也可以想象一下,他们其实在虚拟世界也把技术放在一个房间里,这个房间外面有一道门,这个门呢就叫做 api, 然后我们想要去租它这个技术,他们就会发给我们一个钥匙, 这个钥匙呢就叫做 api key, 这个钥匙就可以打开门,我们直接去用他们的技术了。那每开一次门都得给他们交一次租赁费,但不过不用担心啊,这个费用不是很贵,通常也就是几分钱到几毛钱不等。 那我们刚刚说这个自动剪辑的 skill, 我 们就可以先去租一个把我们声音转换成文字的技术。那具体要怎么操作? 第一步我们先让我们的 a i a 枕头帮我们调研一下,我一般呢会用 cologold 或 codex 嘛,让他帮我们去调研。目前把口播声音转化成文字效果比较好的 a p i 有 哪些? 很快呢? ai 就 会把调研结果给我们了。我们这里可以看到国外效果比较好的是这个 eleven lab, 那 国内呢?是火山引擎,就是豆包背后的同款技术,是不是还挺香的?我们花几毛钱就可以用上字节跳动,花几个亿研发的同款技术。 那接下来呢?我们就是去到它的官网,哎,我们把它官网打开一看,我晕了,因为发现根本看不懂,信息太多太杂了,看的我就是脑袋疼。但是没关系,这个时候我们可以再次请出我们的 agent, 直接把这个链接丢给他,让他帮我们分析到底我们这个声音转文字应该去申请什么样的 api, 那 他就会把调研结果按照收费的高低给我们列出来,然后我们就选一个自己合适的,然后让 agent 把申请 api 的 界面给我们找到, 哎,我们顺着这链接点进去,自己手动新建一个 api 就 可以了。那到这呢,我们就相当于拿着这把租技术的钥匙了。那接下来呢,我们转手把这个 api key 发给我们的 agent, 让他帮忙我们接通,那基本上要不了十来分钟吧就好了。到这啊,这个技术已经接通了,我们就直接可以用了, 但是谨慎如我呢,还会给自己加一层防护措施,因为 ai 有 可能会泄露我们的 api key, 那 如果别人盗用了,那我们的钱包不就遭殃了吗?所以说呢,我会再来一步,就是在手动新建一个全新的 key, 然后这次呢,我们不发给 ai 了,我们要手动去替换,这样就安全多了。听到这呢,基本上国内很多顶尖的技术,我们都可以通过 api 去调用上了。 但是有的朋友会想说,那国外的一些顶尖技术怎么办呢?比如说我们很想去体验一下最近很火的 chat gpt 的 image 生图功能,有没有什么办法呢?哎,这里面还有一个信息差,叫做中转站,就是会有一些人专门把国外的 api 卖到国内,但是这个领域目前是比较混乱,也有点灰,所以说用的时候大家千万要万分小心,最好找一个大一点的靠谱的。 但是无论多靠谱啊,咱们最好一次只充一点点钱,比如说五块十块的,这样就算有损失我们也能承担得起。然后 呢,通过接中转站的 a p i, 我 们就可以去用到很多国外的技术能力了,然后再把这些能力按照我们的 skill 需求按需调用就可以了。当然呢,很多朋友也会吐槽说,哎呀,这个接 a p i 要花钱不划算, 但是我觉得对很多企业来讲,或者是对很多时间宝贵的朋友来讲,花点儿小钱就可以用上全世界最顶级的模型和服务,快速走通我们想要的 ai 流程,我觉得还是非常值得的。

你敢信吗?我用 open 可乐再加一个 skill, 就 实现了跨境电商全流程,从市场调研,选品、竞品挖掘,再到专利合规检测,幺六八八找货源,最后文案断写,产品图片素材,六大环节全部搞定。最牛的是 全流程,跑完只需要十几分钟,如果你自己做的话,少说也得一个周吧。大家看一下演示过程,我让龙虾帮我查一下项链这个品类好,他开始按照 opencloud, 再加上 linkfox agent 一 人跨境电商的流程开始跑,总共六大步, 好,跑了大约十几分钟,出结果了。他跑完了,上来给结论,项链啊,这个类大类能做,但不能犯错,必须细分领域,好往下一直分析,从价格到评价,痛点还有差评。 最后建议给出的切入方向,十四 k, 十八 k, 这个项链还找到了幺六八八相关的货源价格,还有近几天的销量, 最后还有专利筛选,发现有的可能会涉及到,还有给了这次的草稿,这个标题,还有五大描述方向主图的建议。 这个是他的一个执行过程啊,先去查选品,一步一步筛查,看一下这些报告,这个报告就是跨境市场分析报告,这边是所有的项链,还有他的一些发现。看一下这个报告啊, 这个报告是什么?也是幺六八八优质货源推荐,看看批发价,还有销量,供应商是不是非常全面,他会把所有的数据全部存到本地。

这才是真正好用的 skill, 已经斩获了十七点八 k star, 让你的 ai 智能体拥有洞察整个互联网的双眼。这个项目补齐了 agent 的 联网搜索和内容读取短板,像 youtube、 twitter, 还有小红书、微博等主流平台信息,它都能更方便地搜索读取。更省心的是无需手动配置运行环境, 这些不难实现,但是需要自己折腾配置。 agent to reach, 将这件事浓缩成一句话,只需上传安装文档,就能自动完成全套工具链部署。最后,我把视频中提到的知识,总共一百八十九级的大模型核心知识都对应拆解成系统的教程,并且还可以提供一对一专业辅导,需要的留下九五二七。

这才是真正好用的 skill, 已经斩获了十七点八 k star, 让你的 ai 智能体拥有洞察整个互联网的双眼。这个项目普及了 agenche 的 联网搜索和内容读取短板,像 youtube、 twitter, 还有小红书、微博等主流平台信息,它都能更方便的搜索读取。 更省心的是无需手动配置运行环境,这些不难实现,但是需要自己折腾配置 agent to reach, 将这件事浓缩成一句话,只需上传安装文档,就能自动完成全套工具链部署。最后,我把视频超好用,视频又分享出来。教程怎么学,做什么项目可以留下学习,我来安排。

我的电脑装了上百个 skill, 但其实每天真正在用的就只有这八个,那我把它分成两组,一个是做产品写代码的,一边是搞自媒体的。那我们先说做产品的这一组, 当你想要做点工具啊,网站啊,我都是从 superpowers 这个技能组开始的。那其中有两个 skill, 我 最常用 wordstorming。 那 帮你把想法聊清楚, writing plan 呢?把你的想法拆成可以执行的步骤,那很多时候脑子里面只有一个模糊的想法,一个方向的时候啊, 跟这两个 skill 聊一圈,那思路就会慢慢的顺了。当代码跑起来的时候啊,页面通常不是很好看,那我就会把它丢给 fronten 的 design, 还有 u x or max。 那 让 cloud 重新过一遍排版,配色,交互细节,那就算你不懂设计也没有关系啊,它会自己去判断,最终帮你做出比较好看的页面。那然后呢,我就会用 a v t m c p 来去做自动化测试,那去帮我修改一些细节,它会让 cloud 装成真实的用户,去点你的页面,那看哪里会有问题,那自动的帮你去改。 以前这一步都是我手工在测啊,现在我是直接用这个 m c p 在 跑另一条线啊,是做自媒体,那我查资料的时候,就会用 agent rich 让 carol 的 联网搜索直接整理成我想要的格式。那当稿子写出来之后啊,我几乎避过回门 neither zh 这个 skill, 那 ai 写的句子啊,通顺归通顺啊,那读起来就是没有人味。那这个 skill 专门治这个问题,那过完之后啊,就会自然很多。 那下一步呢?就是 content risk detector, 这是我自己写的一个 skill。 那 在平台发布内容的时候,最怕踩到敏感词被限流,所以我发布前都会用这个 skill 扫一遍,那这样才放心。 最后一个 skill 是 我觉得最有价值 skill creator, 那 它可以把多个 skill 串成一个自定义的工作流。比如我刚才查资料啊,写稿啊, qq 啊检测的这一条内容线,那现在我把它封装成一个 skill, 就 能把整个流程抛起来,你不需要每次一步一步地去调,那你可以让 cloud 按你的方式来工作。 那这八个 skill 两条线基本上覆盖了我百分之九十的日常场景。那你们都在用什么 skill? 欢迎在评论区分享。

一个视频带你看懂最近爆火的小龙虾杀手 hermes agent, 它是一个可以自己进化的 ai 助手。首先我们来对比一下 hermes cloud 还有 opencloud cloud 呢?它如果嵌在 v i store 里面,所有文件都是透明方便查找的,但目前无法直接通过一个通讯软件跟它交互。记忆呢,主要靠手动维护。 cloud md 内置的 skill 本身会比较少,但是生态非常的丰富,上限很高,稳定性也很高。 opencloud 它可以集成到通讯软件里面,本身内置了很多 skill, 适合呃纯粹的技术。小白有一些记忆文件,而且可以定时的自动触发任务。 hermes 呢,我们 call 有 的它都有,但体量更小,而且它有自我净化反思的能力,对国内生态的集成也很不错,飞书还有微信都是可以连的。 hermes agent 有 五大核心的模块,这五个模块形成闭环, memory 用来积累上下文, skill 用来模板化重复的操作, so 保持风格的一致。 craw 用来实现自动化, self improving 持续优化前面所有模块的质量。实际使用上呢,你不需要每次对话都重新描述项目的背景,可以直接调用之前已经跑通过的技能,它对话风格也完全遵循你的旨意。 它有一个三层的记忆系统,第一层是关于用户的记忆,写在 user 点 m d 里面,里面有用户的长期偏好语言,在做项目界面信息等等。第二层是关于项目的记忆, 写在 memory 点 m d 里面,里面主要是一些实时性的信息,比如说部署脚本在什么什么什么目录里面。第三层是历史对话搜索,它能在几个月的聊天记录里面搜到某次讨论的具体的内容, 也就是说过去聊过的方案随时都可以翻出来。 hermes 也支持 skill, 很 适合做重复执行的知识类工作, 但它和 cloud 的 有两个主要的不同。首先就是当你连续两至三次执行相似的操作序列的时候,它会主动的去问你要不要附装成一个 skill。 其次,它内置的技能会更丰富,同时也像 cloud 的 一样,可以从社区官方那里面继续下载好用的 skill。 它的定时任务要比 windows 更完善,它可以把任务串联成一个流水线, a 的 输出自动传给 b, 数据采集、分析、推送, 很适合多步骤的这样的工作。同时简单的日常监控不会消耗他的 token, 只要在智能判断的时候才会介入消耗 token。 而人们最特别的是他的自我进化机制,他会主动进行反思,查找之前的规律,然后将这些高价值的反思提炼成规则。 每次提炼的时候他都会经过你的允许,而且每次重大改进都会生成一个可生化的版本,就像一个人格的进化报告一样。 那有没有必要用呢?其实之前 opencloud 刚出来的时候,我也觉得这样的工具是给一些技术水平比较低的人用的,更像是一个营销的噱头。但我一直在思考啊,就这么一个框架,有革命性的工具,它到底能在什么场景中使用?或者说真正阻碍我从 cloud 换到 hermes 或者是 opencloud 的 原因是什么? 我觉得更换成本是一个非常重要的一点,因为要把我现有的工作流完整的搬在 hermes 上,需要进行很多的重新培养和配置,这会让 hermes 前期的使用变得非常麻烦,效果可能没有可拉的那么顺手。但对于我大部分的创作内容来说,长线来看, hermes 很 可能是要优于可拉的。 比如说定时任务数点、 m d 自动化机制,这些都属于长线复利型的机制,你用的时间越长,他就越能解放你的生产力。 所以我现在正在把整个工作流尝试搬到 hermes, 你 可以把它理解成一个在旁边看着你干活的实习生。一开始他可能确实没有看到这样的强能工具好用,但是一旦掌握了完整的工作流程,掌握了你那些可能写不在 skill 里面的个人使用习惯,他就可以爆发出惊人的战斗力。

别再纠结是 codex 还是 cloud code 了,我在实测了数十个 agent 之后,发现真正决定生产力上限的不仅仅是 agent 工具,还有你手里的 skill 配置。如果你的 skill 没配对,换再强的 agent 也是在浪费时间。 所以我根据实际开发场景和我的日常使用,筛选出了这四组最核心的顶级 skill, 包含了原能力扩展、工程化开发、前端设计和内容创作。 它们完全不挑平台,不管你以后切换到哪个 agent 装上都能用。先讲最根本的两把钥匙,我称为原 skill。 你 可以把它理解成让 ai 自我进化的能力,它不负责具体的活,而是专门用来扩展 agent 的 能力边界的。不管你用 ai 做什么,这都是你第一天就应该打好的地基。 第一个是 skill creator, 来自 antropic 官方。如果你想把一套成熟的工作流变成一个新的 skill, 便于后续调用,那么选它就对了。 以前想自己做个 skill 特别麻烦,得先去研究半天复杂的格式,不然可能写出来的 skill 还会报错。就算写出来了,使用效果也不一定尽如人意。但现在有了它,你不需要去研究什么复杂的格式,也不用手动改文件, 你只需要像给同事交代工作一样,用大白话把你的流程说一遍,或者直接把你的操作手册丢给他,他就会自动帮你起草、测试、反复迭代。在你自己完全不用看开发文档的情况下,一分钟就能写出一个既标准又好用的 skill。 安装和使用方式也很简单,在安装完成后, 只需要在 agent 里选中 skill creator, 然后输入你的需求,和它一步步地进行沟通就好。建议直接局安装,这样无论你在哪个项目里,都可以随时进行调用。第二个是 find skills, 大家千万别把它当成一个普通的搜索插件, 觉得还得自己手动去查。真正的用法是你直接给 agent 派任务就行了。比如你让他帮你做个 ui 设计,要是他发现自己不会,他就会自动把你的需求拆解成 ui 抵赞你这种关键词,然后自己去全网搬救兵。他在后台连接的是 skill 点 s h 这个平台,他会自己查看哪个 skill 安装量大,哪个作者靠谱, 然后挑出最好的那个供你进行选择。在你选择好之后,它还能直接一行命令帮你安装上 skill。 creator 是 让它能自己造工具,而 find skills 是 让它能去外面找现成的,这两个配合使用,一定能大大提升你的 agent 的 工作效率。接下来是针对具体场景的 skill。 先说软件开发, 我选了这三个, superpowers, j stack 和一个前端大神的 skill, 它们针对的场景略有区别,但核心都在解决同一个问题,就是终结那种看似逻辑闭环,实则无法落地的代码幻觉,帮你守住工程底线。第一个 superpowers, 他的杀手锏在于他把测试驱动开发这套严苛的工程标准,直接变成了 agent 必须遵守的硬规则。其实很多人刚开始用 ai 编程,最容易上手的场景就是让他写测试,而 superpowers 顺着这个逻辑直接把开发流程给正规化了,他 会强制 agent 进入一套标准的红绿重构循环,先写一个必然失败的测试,证明功能还没实现,然后写最少量的代码,让它变绿,最后再进行优化, 而且它非常稳。 agent 写完之后,它会自动开启两轮内部审计,一轮看代码,实现跟你的需求对不对的上。另一轮则专门盯着代码的质量挑毛病。这种慢思考的模式能帮你抓出很多隐藏的边界问题。 虽然看起来多花了一点点时间,但因为它第一遍就能把代码写到八十分以上,省掉了后面无数次反复抵 bug 的 时间,长期来看反而更省头肯也更省钱。它的整个工作流程大致如下, 首先他会拉着你做头脑风暴,把需求细节彻底磨清楚,先出一份整体的设计文档。然后他会把大任务拆成一个个几分钟就能搞定的小碎活儿,每个活儿都有明确的验证标准。接着就是让紫 a j 特自己去跑, 他自己写,自己查,严禁跳步,你只要在旁边关键节点确认一下就行。最后等测试全部通过了,他会把选项丢给你,是直接合并代码,还是先留着分支,或者觉得不行直接丢掉?第二个是 j stack, 作者是 y c 的 总裁 gary 谭。如果你还不知道 y c 是 什么,简单说,它就是全球最牛的创业孵化器,像 airbnb、 dropbox 这种巨头都是它孵化出来的。所以这位大佬出的工具,骨子里带的就是那种硅谷创业者的实战基因。这个工具有一点不同, 它不是那种功能单一的 skill, 而是在 agent 里内置了二十三个不同的专家角色,从 ceo、 设计师到发布工程师,你都可以通过斜杠命令直接调用,这相当于给 agent 配齐了一整支团队,让他不再是单兵作战。为什么要搞这么多角色? 因为真正做商业系统,代码行数不值钱,能跑通才值钱。有了这群专家帮你交叉审计, agent 就 能在不同的专业视角下, 把你揪出那些隐藏极深的问题。我来向你介绍一下它的实战流程。首先,在你动手写第一行代码之前,先跑一下 office hours 命令。这就是 yc 最出名的灵魂拷问。 ai 不 会立刻写代码,而是像个严厉导师一样, 反问你六个最尖锐的问题,把不靠谱的假设先掐死。接着可以用 plan ceo review 命令,让 agent 站在 ceo 的 高度审视计划,看看有没有更优解。到了代码复合阶段, review 命令就是你的资深工程师,他不光找小 bug, 更盯着那些 c i 能过,但一上线就可能爆炸的工程隐患。另一个具有实战特色的是 q a 命令,以前 a 阵呢,只能在代码里纸上谈兵,但这个命令是真的,会打开浏览器,像真人测试员一样去点击验证, 直接把 bug 抓出来修掉。最后活干完了,直接执行 shift 命令,它会自动同步跑测试、推代码、开 pr。 整套发布动作一气呵成。该瑞坦统计过,二零二六年,它的代码产出是二零一三年的二百四十倍。这不是说 ai 写的代码行数多就是厉害,而是同样的需求, 他一个人现在能顶一支小团队在干活,这就是角色分工带来的本质变化。第三个是一套前端大神 mod, 自己日常工作用的 skill, 作者是 typescript 的 布道者,如果你平时前端开发比较多,那么可以试试这个。 这套工具重点解决的是人与 agent 之间沟通对不起的问题。 mark 总结过,如果没有好的引导规则, agent 写代码很容易陷入几种困境。首先是理解偏差, agent 可能根本没听懂你需要什么,或者写得太啰嗦,废话很多。然后是执行失败,好不容易写出来的代码,结果发现根本跑不通。最后是架构隐患, 虽然代码能跑,但因为缺乏整体规划,后期维护起来会非常痛苦。所以他的这套 skill 核心逻辑很简单,宁可在前期多花几分钟对其需求, 也不要在后期花几个小时去处理这套低质量的代码。具体到这套 skill 里面的指令,我建议你重点关注这几个。首先是 graeme 系列的命令,这就是刚才提到的拷问模式,当你提了一个模糊的需求,比如说想加个登录功能,他不会马上动手,而 是会回过头来不停地拷问你细节。可能问完之后,他发现你真正想要的是 sso 环境下的多租户登录,这就把隐患消灭在开工之前了。接着是 tree 命令,也就是 aure 分 诊,他会帮你把所有的任务都过一遍, 分清楚轻重缓急,确保你不是在修一些细枝末节的小 bug, 而忽视了真正堵塞进度的核心问题。最后还有一个 improve 命令,这是代码库的架构急救包, 你可以每隔几天就跑一次,让 agent 站在大局的视角审视你的代码库,找出那些以后可能会越来越难改的地方,并给出重构的建议。接下来是前端页面设计,这是最开始编程 agent 出来时,他做的最差的一个领域之一。 agent 化 u i 出来的永远都是那些固定的套路, 固定的字体,蓝紫色的渐变背景、圆角卡片、特定的按钮样式。你在网上看到的那些 ai 生成的界面,十个里面有十二个长的都一样。解决这个问题的 skill 有 两个,第一个是 frontend design, afropic 官方出品。如果你受够了那种千篇一律的 ai 审美, 那它就是你的救星。以前的 ai 画 ui, 一 眼看过去全是圆角卡片加紫色渐变,就像是在共用一套廉价的模板。 而 front and design 的 核心是帮你洗掉这些 ai 位。它不是机械的套用组建,而是根据你的产品调性去推敲更有质感的纹理,或者尝试那种更有呼吸感的非对称布局。比如你给他提一个具体的风格要求,想要一个杂志感带点硬核感的页面,他给出的方案里, 字体的比例和模块间的留白都会处理的很到位。有了这种对视觉细节的把控,你的 ui 就 从一眼 ai 变成了真正意义上的耐看。 第二个是 u i u x pro max。 如果说前面的工具是帮你找灵感,那这个就是直接帮你配了一个设计总监。它的特点在于,它不是在靠直觉画图,而是把专业设计的那些条条框框全部变成了底层的逻辑。比如你要做一个金融或者医疗类的界面,它会非常明确地告诉你 什么样的配色能体现安全感,什么样的字体更显专业。他甚至还会给你列出一份避坑指南,直接点出哪些设计在商业场景里是绝对不能碰的。之所以能这么专业,是因为他后台内置了一百六十多个行业的深度规则, 不管你遇到多冷门的业务,他都能拿出一套成体系的方案,从交互细节到动效走位,都给你安排的明明白白。 而且它有一个很实在的功能,就是能帮你生成一套可以持久化附用的设计系统。有了这套规范,你下次再开发新项目, 直接把文件丢给 agent 就 能用,不用每次都从零开始打磨风格。而且它的上手门槛很低,无论是装插件还是用命令行,都能快速跑起来。 这两款工具的分工也很明确, front and 底钻负责把画面画得出彩,而 u i u x pro max 负责把产品做的更专业。有了它们, ai 的 输出就再也不会有那种廉价感了。最后一类,内容创作。如果你用 agent 做内容创作,那这组宝玉老师的 skill 我 一定要强力推荐给你。 它首先解决的就是内容本身的高质量产出,比如它能帮你生成一张极具审美,完全不输专业设计师的封面图,或者把一大段枯燥的文字直接变成一张高信息密度的格式化信息图。 在内容做漂亮之后,他还会顺手帮你搞定后面那些讨厌的碎活,比如说转格式、做排版,最后还能直接一键发布到各个平台,他把从生产到发布的全流程都打通了,有了它,你就能真正实现生产和发布一体化,把所有的精力都集中在打磨好内容上。 宝玉老师的这套工具箱里包含了十几个好用的 skill, 我 这里简单带大家看几个。首先是用于生成封面图的 cover image skill, 它最强的地方在于有一套五维控制系统,从构图类型、色调方案、渲染风格到文字排版和情绪基调, 全都能精准调优。这七十七种预设组合,能让封面彻底告别开盲盒的随机感,每一张出来的效果都像是为你的文章量身定制的专业设计。 如果你平时觉得画逻辑图、架构图很头疼,那这个信息图相关的 skill 绝对是神器。它内置了二十一种专业的信息布局,像分析原因的鱼骨图、做转化的漏斗图、梳理层级的金字塔图应有尽有。更聪明的是, 它能自动读懂你文案里的逻辑结构,直接推荐最合适的布局方案。以前要在设计软件里磨半天的信息大图, 现在只需要几秒钟就能产出出版级的可量化成果。如果你经营小红书,那么可以使用小红书 image skill, 它能将长文章自动拆解为一到十张卡通风格的轮播卡片。通过内置的十一种视觉风格和八种排版模式, 如对比、清单、流程等,可以快速生成符合平台排版习惯的图文内容。针对排版环节, 这个 markdown to html 的 skill 解决的是一个非常具体的痛点,那就是在微信公众号这种不支持 markdown 的 平台上,如何保留精致的排版。它内置了多套公众号主题,能自动处理代码、高量和数学公式。 最实用的一点是,它能把文中的普通外链自动转为文末的底部引用,彻底解决了公众号里链接打不开或者被截断的尴尬。如果你平时还有翻译文章或者精读外文资料的需求,那这个翻译 skill 就 派上用场了。 他最强的地方在于提供了一个正式出版级的模式,这个模式不是直接进行翻译,而是会走分析、翻译、校正再到润色这整整四步的流程。 而且他有一个非常人性化的功能,就是能让你指定你的读者是谁。比如你告诉他你的读者是资深开发者,他就会自动省略掉那些庸愚的解释, 翻译出来的语气读起来就像是真正的圈内人写的。最后,当你把内容全部准备妥当,可以通过发布微信或者发布微博这两个 skill 来实现一键跨平台分发。 它区分了不同的分发逻辑,你可以发长文形式的文章,也可以选择只发几张图片配一段摘药的贴图模式。它把那些复杂的后台操作全都变成了 agent 里面的一行指令, 从本地草稿到最终发布,整套流程都可以在 agent 里面直接闭环完成。今天分享的这些 skill 只是个开始,其实最关键的是大家要根据自己的工作流程和使用场景,去打磨出真正适合自己的 skill。 如果觉得视频对你有帮助,别忘了点赞和订阅,我是俊旺,我们下期再见!

来给你们看一下我一共玩了十二天,我花了多少钱啊?呃,总积分是二十九万八,这个是订阅积分,就是一个个人高阶一个旗舰, 然后呢,我又有增购的积分,增购的积分给你们看一下啊,五十块钱,五十块钱,五十块钱啊,一共是一百五十块钱,也就是说相当于是十二天我开发了六七个 skill, 然后我花了 四百多块钱,所以扣子吧,你说他便宜吗?他也其实也没有便宜到哪里去。让我给大家看一下我的这个我的技能啊。呃,我的技能,现在我的技能是直接是装载到里面了,你看啊。 呃。视频图片生成,女装图片生成,贴纸词批量技能,或者抓取女装带货视频制作啊,这个是还是半成品?但是我不想在扣子上开发这个实在是太熬人了。 呃,产品提示词提取,这个是根据图片和画面啊,这个反推提示词的,然后搜索器呢?我这里绑了一个 gpt 五点五在这啊,这个你们对这方面有需求啊,到时候我们再聊。 对,因为扣子自带的豆包大屏实在是太蠢了,所以我专门去绑了个 gpt 五点五在上面。然后呢,我正常用用这个,这个有一些特别复杂的。呃,信息搜索时候我用它,然后抖音的口播就是什么,这里边包含了单条和 多条批量的这种,这个口播视频的竹子稿子抓取。好吧,这就是很多人一直在琢磨的这个技能啊,这块我把它直接是技能包给分装了。然后呢,女包生成技能啊,这个是女包图片哎,就是针对不同的电商场景的快速的深图。 好,这些呢,我还都没发布啊。为什么没发布呢?有一个很重要的原因就是它的稳定性实在是太差了,就算是我把它打包成这样子, 我告诉你豆姐会干一件什么事情,他不会去按照你 skill 的 流程去做,这是他妈最头疼的我,我明明写了叫他一二三四五六七好,他非要去按照二三四给跳过了,然后自己去写代码然后自己去执行 好,我为什么要一二三四五六七?因为我之前拿来开发的时候对吧,我就已经试出来他就是个蠢蛋,他这就肯定会出错,所以我才一二三四五六七他就按照之前的错误的东西又来了一遍。所以我这十二天的时间基本上有有一半的时间以上啊,都在去帮豆姐去纠错。 不是我给你纠错了,你倒是改呀,关键他不改他记忆力有限他他的伤害我一结束好,你发现那豆姐又变成蠢蛋了 啊,这个是很头疼的问题,他解决不了这个事。所以,呃,我觉得啊,扣子是个好东西,但是啊,豆姐的这个模型真的太恶心了啊。所以所以 现在我是什么呢?就是如果说你们要玩一玩,简单的玩一玩啊,用这个扣子完全没有问题,实现一些我们日常的这种这各种各样类型的小 skill, 但是兄弟们如果说你想要去把它做做商业化的推广,比如说我现在已经做出来八个 skill 用的老六了,我能不能去卖啊?不好意思我不敢, 我不敢在扣子上卖,为什么?因为它不稳定啊,你拿到这个 skill 以后你部署到你的你自己的这个新的这个扣子上面,你会发现他妈跑不通。 我昨天去给我的这个客户去现场部署,我亲自现场部署一个已经打包封装好的,在我的手机上面,在我的扣子上跑,一点问题都没有的。然后一个 skill 我 给他布了四个小时没出来,就反复报错,反复报错 里边的原因是什么?有两个,第一个是扣子本身啊,扣子本身他豆姐去写代码的精准度你敢相信他?我告诉你,我的所有的代码全部都是在扣子里边用 g p t 五点五专门去跑,是五点五啊,哎,不是五点四啊,最贵的那个啊,当然现在也很便宜。然后跑完了以后 出现了第二个问题,扣子他会私自的去改你的 skill, 私自改你的 part 就是 你的提示词, 你这让我咋去卖吗?咋去商业化吗?对吧?所以我现在放弃了啊,放弃了,我不用扣子了啊,我不用扣子开发了,呃,我转 cody, cody 开发,但是呢,我的目标还是纯手机,直接就可以执行这个操作啊,这扣子跟逗你玩真的在逗你玩一样。 嗯,你们如果想玩一玩,然后自己有时间有这个耐心去跟他去豆姐去 pk, 跟豆姐一起成长的话,我觉得扣子非常棒啊。然后以上的所有的这个,呃, skill 我 全部打包了啊,这个群里面见。

之前六叔分享了一个 skill 的 管理工具,统一管理的,很多人想要发现啊,这个需求很有代表性,我又找了一个更好用的,就这个 cc switch 啊,之前有介绍过,它是作为 第三方各种主流模型的 a p i 统一接入统一管理,然后你在用的时候在这里统一的去启动切换,非常非常的方便。各大编程智能帖都支持啊,包括龙虾的 code x, c c 的 都可以支持。除了这些,它里面也有统一管理 skill 的 功能,大家看这个扳手 点击啊,这里面就是六叔所有已经安装的 skill, 然后你会发现啊,我有些 skill 全部装的是 c c 里面的,如果你想在 code x 里面去使用呢,直接点一下, 再点一下,你看这些点一下全部同步过去了,包括 open code, 其他的平台,相当于一处安装,直接同步就都可以共享使用了,删除就可以全部删除了。然后安装有几种方式啊,一种就是直接把 skill 下载成 zip 包, 通过这个包去安装。还有呢,你看这里面,它也自带一个 skill 的 应用商店,你需要什么 skill, 只要知道名字就可以在在这里面去搜索啊,欢迎 skill 我 已经装好了,然后添加过的 skill 的 仓库呢,在这里都会有记录, 可以删除,可以一键链接过去啊,新的仓库进的仓库,可以在这里做添加。在身份上面去管理 skill 啊,集中管理你的模型的 a p i, 包括模型的切换,就非常方便了啊,真正的 all in one。 好, 大家可以把这个 skill 管理的工具啊,在这个上面用起来,关注我,持续丰富你来进了库,拜了个拜。

我的天呢,我的 a 阵呢学会了设计,大家都知道编码的 a 阵呢,其实它的设计能力是非常差的,前两天我在做自己的项目,他给我做的那个东西真的是非常非常的难看,就跟像呃, 上个世纪做的设计一样。然后后来我就跟朋友聊了一下,我说有没有一个比较好用的 skylake 推荐一下。他给我推了一个东西,是他一直在用的叫做 u i u x pro max 这个 skill, 它有个好处是它里面内置了大量的配色方案,设计方案和字体方案,大概有个几百种,应该有了七十七 k 的 star 的 一个星星,我觉得大家可以去试一下,就是它不会做的非常非常的牛,但是它起码做出的东西能看了,而不像一开始我们做的那些产品出来说真的是不能看。 这个项目我认为是一个大家可以去避装的一个项目,因为无论如何你做产品一定会需要设计,去给你展现,去给你展示出来,去给你做规划,去做一些嗯,初期你能看得懂的东西。

我们常说 agent, 但它并不只是一个更会聊天的大模型。更准确地说, agent 是 一个会循环工作的系统,它先理解目标,再选择下一步行动。 agent 执行之后观察结果,然后根据新的反馈继续修正。 一个 agent 的 底层通常有五块拼起来,第一块是模型,负责理解、推理和生成方案。第二块是工具,比如搜索、读取文件、写代码和调用接口。第三块是上下文,也就是当前任务现场。 第四块是记忆,用来保留长期篇好和经验。第五块是反馈,让系统知道刚才那一步到底有没有用。所以, agent 的 核心不是一次性给出答案,而是一轮一轮地推进。他观察当前状态,思考可能原因,制定短期计划, 调用工具去行动,最后再叫验,结果叫验,之后得到的新信息又会回到下一轮思考里。 举个例子,你让 agent 修一个漏洞,他会先读报错日制,判断失败发生在哪里。 然后定位相关文件,提出修改方案,编辑代码,再运行测试。如果测试失败,他不会停在原地,而是把失败日制当做新的反馈,进入下一轮排查。因此, agent 的 能力边界来自四件事的质量。 首先就是模型是否可靠,工具是否真的可用,还有上下文是否完整,反馈是否真实。 理解 agni 就是 理解一个由模型、工具和反馈组成的闭环系统。

这个工具把世界上几乎所有工作的 skills 都收集起来了,一天一个神奇的工具。第九十一期今天要讲的是本 站收入了二十多种分类的五千多条精选 skills。 无论是办公用的表格管理、 ppt 制作、自媒体用到的文生图、语音转文案,还是开发用的各种技能,这里全都有,而且每个技能都经过了 cls 安全检查,无恶意代码,无隐私泄露风险,就很省心。

腾讯的 workbody, 字节的扣子越至暗面的 kimi, astropik 的 cloud code 到底哪个更适合打工人?上一期我们已经测评了 workbody 跟 code, 那 么这一期我们继续测评 kimi 跟 cloud code。 我 们先来回顾一下测试案例啊,大家在工作过程当中经常会写各种报告,各种方案啊,这类报告方案的格式啊,风格呀,排版啊,数据表格呀,分析方法等等都是固定模板。 所以今天我就用这四个工具,生成同样的这样一个可以随时附用的 skill 技能,不管多么复杂的拍板和框架,只需要生成一次,以后遇到同类工作,让 ai 直接调用这个 skill, 就 可以一键为你生成同等水平的内容 啊,提高你的写报告呀,做拍板啊,做设计啊,或者说做 ppt 的 质量和水准。好,接下来我们挨个测试,我们再来看一下最近旋转很厉害的 kimi 啊,到处都是软广。我觉得啊, kimi 是 一个很套路的产品, 你想用它来做 skill, 必须先充值会员,然后你想用更厉害的功能,或者说匹配啊,更强大的模型的时候,哎,你必须继续升级。这其实就是国内一众产品啊,典型的 vip vvip 的 套路模式,并且它的收费是非常高的, 并不是说你充值了会员,这个月就可以随便用,它是限制次数的,我后面给大家看花费情况的时候,大家就能够一目了然了。 那么今天呢,我们不过多的去吐槽这个产品啊,我们只做测试。我们来到 kimi 首页,在哪里创建技能呢?在这个输入框下面有一个加号, 大家点击加号,里面有一个技能啊,有一个技能,这个列表就是我们已经有的技能,那我们刚刚给的那个测试用力,其实 kimi 是 有一个专门的技能的,就是 office 文档转技能,我们点这一个,然后把我们那个样例啊,同样的样例传给他, 然后给他同样的指令。好,这个时候我们点创建技能, 大家可以看到啊,这个是需要二十到三十分钟的,我们耐心去等待 later, 那 这里会有疑问啊,那如果我想去做别的事情,我这个页面能关掉吗?是可以关掉的啊,大家直接关掉,那我怎么看他有没有完成了呢? 还是从同样的入口技能,然后这里有一个管理技能,点进来之后你就可以看到了啊,我们这里就不等待了啊,为什么呢?因为我之前已经给大家生成这样一个技能了, 这个技能花费时间是三十八分钟啊,生成这样一个技能三十八分钟,那么我们来测试一下 kimi 自己生成的这样一个技能,它的效果。好,我们选择技能啊,选中我们刚刚生成的那样一个技能,然后给他一个指令。 好,整个过程呢,大约五分钟左右啊,五分钟左右,它帮我们生成了这样一个 pdf 文档 啊。我们首先来看封面啊,封面的风格也好,拍版也好,都是比较符合我们的要求的。然后整个目录啊,结构也是没有任何问题啊,和我们原先那个模板是一致的 啊,论文的内容也没有非常明显的这种错别字啊,或是排版错乱的啊。然后呢,图标大家也可以看到,图标的数据,包括格式也是没有问题的, 整个这个文档的话,我觉得是基本上可以拿过来直接用的。最后我们来看一下成本啊,这个成本的确是震惊我了, 嗯,怎么看呢?在用户这里设置啊,里面有一个订阅和发票,大家可以看到啊,有一个使用量,还有一个账单的概念,两个概念账单是什么意思呢?就是我昨天啊,花四十九块钱充了一个月的会员, 然后今天我就已经用了百分之十三点二了,按照常理来讲,我充了一个月的会员,应该是这一个月都可以用的,对吧?但是当我用量达到百分之百之后,我就不能够再使用了。那这百分之十三点二是怎么来的呢?我们看一下, 我是用了百分之五点四啊,其中是做了一个 office 文档转技能,就是刚刚啊,然后呢用这个技能去生成了这样一个文档,用了百分之零点九七,也就是说我用这一个 office 文档转技能生成这样一个 skill, 用了百分之五点四,那我后面 每次去用调用这个技能的时候都需要百分之一,这是这样一个消耗的百分比。 这还是一个最简单的一个技能,就是他自带的一个技能,如果你要用一个全新的技能, 并不是他本身自带的,那么他消耗的百分比是更多的,所以说这个成本是非常高的啊,并不是说你一个月都可以用,你这里满了,你这个四十九就相当于用完了,这是一个点。第二个点是什么呢?就是我们来看一下啊,在他订阅的这些呃,套餐里面, 我当前定位的是这个啊,四十九一个月的,那这这两个啊,这两个还有包年的,这两个是和我我们这一个是有什么区别呢?区别在于它可以调用的模型不一样,我给大家看一下, 在这里我们可以选模型啊,我们现在这个套餐只能用前三个,不能用集群,你必须得升级套餐。 所以这个我感觉是有点套路的啊,虽然说它生成的质量比较高,但是这个套路我感觉不是很喜欢。最后呢我们再来看一下 cloud code, 我 们在这个文件夹下面打开我们的 cloud code, 然后给它复制同样的指令 回车,那它就会帮我们生成这样一个 skill。 那 我为什么把 cloud code 放在最后呢?啊?是因为它有一个行为让我非常的舒服啊,就是前面三个工具我们给指定之后,它们就会自己去干, 中间会遇到各种卡点,比如说安装什么插件啊,升级什么功能啊,会各种各样的问题,他们自己会处理,对吧?我们不知道到底处理了什么。而 cloud code 在 遇到这类问题的时候,它会给某我们很多提示 啊,就是他会告诉我们遇到什么问题了,然后他下一步要怎么解决,然后询问我们是否要按照这个执行,那我们同意之后他才会继续执行,不同意的话他会继续找别的方案,然后呢再来询问我们,如果是同类的问题,他还会增加一个选项,就是后面这类问题都可以按照本次选择去执行。 那你看这就是一个非常人性化的设计逻辑,我觉得国内的产品啊都应该学习一下。 好,一共是用了五分二十三秒, cloud code 帮我们把这个技能给做出来了,并且它还给我们补充了一个报告风格分析的 md 文件, 也说后面我们再调用这个技能的时候,它帮我们生成的文档是继续,还会继续参考这个报告风格分析的这样一个文档的啊,保证我们的文档是更符合我们的要求。那我们在 cloud code 里面怎么去测试这个技能的效果呢? 和前面三个是有点区别的啊,我们需要先在对话框里输入一个斜杠,然后输入斜杠之后,下面出现的这些都是我们已经安装的技能啊。第一个其实就是我们刚刚创建的技能,那我们先回车选中他,他会先去读取这样一个技能。 ok, 他 现在已经加载了这个技能了啊。然后我要告诉他接下来让他干什么 好的,整个过程的十二分钟啊,他帮我生成了这样一个报告,那我们来看一下这个报告的效果。呃,文字内容没有什么错误啊,然后表格也是挺符合需求的, 可能有一些变形的啊,圆形是有点变形的,总体而言的话其实还是挺不错的,这个也基本上可以拿过来用啊,我们如果要改的话,就让它生成 word 文档就可以了。 最后我们来看一下成本啊,创建这个 skill 一 共花了不到五块钱,但执行这个工作居然没有花钱,这点我有点震惊啊。嗯,我不太清楚为什么会有这种情况,因为我测试了好几遍,的确是创建 skill 花钱,然后执行这个 skill 去做任务的时候没有花钱。 呃,难道是因为这个任务太简单吗?我也没太搞明白啊,如果有懂的朋友可以在评论区里告诉我一下。最后我们来看一下总结。其实啊,每个工具都有自己擅长的不擅长的领域,呃,我建议大家还是要多用多体验,才能找到最适合自己工作的工具。