这是我最近开发了一个 skills 的 一个啊聚合平台,你可以把它理解成一个 npm 包平台吧,就是它是 skill 版的 npm 包平台啊,当然最近的这个 skills 非常的非常火的,我最近也用了一下,确实非常好用 啊,我呢就索性了就开发了一个这么一个聚合平台吧。 ok, 它是怎么使用的呢?其实非常简单,我给他开发了一个 命令行工具,比如说如果说你想创建一个 skills, 只需要执行呢?之前已经执行过这个命令了, npx skills 啊, c l。 这是我开发的一个命令行工具,然后执行 create, 然后呢你就开始就可以创建自己的命令了,比如说我随便写一个叫 view 吧。 ok, 这里呢就创建成功了一个 vivo 里边有啊,有那个我给做好的一个基础的模板, 然后你呢可以往上面写一些工具,写一些东西,就像这样一样,就像这样一样。然后假如说这个我已经创建完了,创建完之后我想发布到这个平台也很简单,直接执行这个 push 命令, 然后呢输入你的 skills 的 名字,然后呢这里就输入你的远程仓库的地址就 ok 了,就是我的这个远程仓库的地址是这个, 然后回车确认一下, ok 啊,这里有一个问题,就是啥呢?就是这个我的这个 api k 啊,已经过期了。 api k 呢就是在这里生成的,然后重置,重置一下, 重置完成之后呢,我们回来在这里呢配一下 api k 就 ok 了, 然后重新部署一下, ok, 已经发布成功了。发布成功之后呢啊,回到我们的这个来看一下, ok, 我 刷新一下,哎,已经出来了,对吧?这个就是咱们刚刚发布的那个日期呢,是二零二六年二月二月十四号,就这个这些都是我之前往上推的一些这个 skills, 如果说你想使用的话呢,也很简单,直接拷贝这条指令,然后呢在下面执行一下, ok, 这样就已经创建成功了,你会发现里面的多了一个 p n 的 这个 skills。 如果说我想再添加一个,呃,如果再添加一个的话呢,就添加这个 v test 吧,然后在这里添加 v test, ok, 已经添加成功了,对吧?这个 vtest 呢也添加进来了, ok, 就是 这么一样的一个平台,我呢使用的是 next 的 gs 是 那个,呃, react, 那 个 next 的 不是 nice 的 一个,这是是这个,它是一个全站的框架,对吧?我为什么选择它呢?因为用它来开发呢,就效率很高,对吗? 再一个呢就是 ai, 它对 react 呢?它就是吃 react 长大的,对吧?它对 vivo 的 这个呃,了解的比较少一点, 我之前有一个课程是教这个 nice 的 js, 对 吧?这个 nice 的 js 是 一个纯后端的一个框架, next 呢是一个权杖的框架。 ok, 大家可以来体验一下,就是我这个网站呢,其实还没有开发完成,呃,就是基本的功能已经实现了,这个大家可以帮我测试访问一下这个网站的地址,就就是就是这个 点 c n 这个地址, ok, 没,应该没有错啊, skill 杠 hap 啊,没有 s skill 杠 hap, 点 c n ok, 就 说这么多吧。
粉丝4785获赞12.4万

卧槽!这个 awesome cloud skills 一 份精选的 cloud skills 工作流程工具列表, github 中二十二 k 的 stop cloud 只会生成文本编辑代码。这个开源仓库直接拉满,覆盖文档、开发生产力等全场景技能,还能跨应用操作,让 cloud 从聊天助手变全能生产力工具文档与生产力技能拉满 word xl p d f p p t 全格式处理开发者专属技能拉满跨应用对接一千家核心开发技能全覆盖,少踩坑,数据创意安全加商业营销全覆盖,实用技能拉满,工作营销全搞定, cloud 等用户必备!开源仓库全场景技能全覆盖,提效又实用,感兴趣的赶紧收藏,防止找不到!

上个月,我受自己的邀请去上海参加了 cos 的 创作者闭门会,人生第一次签保密协议,对我这种表达欲望很强的人来说简直就是折磨。今天终于解禁了我的大叔特殊一番。 首先说明一下,扣子是字节的 ai 智能开发平台,也可以说是 ai 应用商业化的桥头堡。这也是为什么在闭门会上,扣子的产品经理一直在向我们这些开发者强调,他们的目标是让大家能赚到钱,因为只有开发者能用 ai 赚到钱,消费者愿意为 ai 应用付钱,我们才能说 ai 形成了一个生态。 所以 code 比我们还急,想方设法的丰富平台的功能,优化 ai 应用的开发流程,包括这次闭幕会的主角 code skill skill 技能这个概念其实很好理解,就是在原本 agent 能力的基础上,更加详细的去描述一些具体的任务,让他执行起来更精准,更专业。比如说我们有一个数据分析专家,他的工作理由自然就是读取数据,分析数据,生成统计报表和统计报告。 那么在读取数据时,他就会面对各种的数据源,比如一些特定格式的文件。如果你让一个通用 ai 去读取一个 pdf 文件里的数据表格,你完全无法保证最后拿到的是什么,因为你控制不了通用 ai 会用什么样的方式去读取文件,怎么去处理文件,最后怎么生成结果。 在复杂的工作流里,输出不可控是最致命的,因为这会导致滚雪球的效应越来越偏移,越错越离谱。 现在我们就可以把处理 pdf 这个工作定义为一个技能,在这个技能里,我们可以明确的告诉 ai, 用哪个 python 的 工具库来打开 pdf 文件,头长成什么样,就用哪个 python 脚本去处理,在每一步都给到充足的指示和丰富的样板案例,那 ai 有 一个明确的执行方针, 这样每次用户咨询这个数据分析专家,每次遇到一个 pdf 文件的时候,他都会导入这个处理 pdf 的 技能,按照技能的指示进行处理,这样就能够保证非常稳定、专业、标准的数据读取效果。 从程序员的角度去考虑,这就是一种动态构建提示词的手法。在对话初识话时,先把所有技能的 meta data 加载在系统提示词里,然后随着用户指定的输入捕捉到匹配的关键词,根据 meta data 找到那个对应的技能,把技能的描述并入到提示词里, 而在技能里提到那些指令和脚本,也是在用到的时候才导入。这种暗区导入的方法可以让技能做得非常大,非常详细,也不用担心会影响到 agent 的 一些效率,你也就不用怕它会瞬间吃光你的 token 额度了。 从 chat 到 agent 到如今的 skill, 还可以很明显的感觉到, ai 应用的开发越来越像传统软件开发扣笼。在刚才的描述中,你能够体会到 oop 式的封装、 f 式的函数定义以及 javascript 风格的 tree shaking, 只是换了一套专业术语,本质上还是老祖宗的智慧,这说明了什么呢?这说明了在 ai 应用落地的过程中,大家开始变得更加脚踏实地,不再幻想着上帝一句话就能够创造出整个世界。 去年年底,我连着发了三期视频,解读了当时震惊整个计算机行业的三次大型故障。很多观众都说我的分析是全网最专业、最详细的,以至于出现了内部员工在评论区团建的奇观。 而我作为一个外部人士,仅凭公开的信息就能做出这么有深度的视频,其实没有什么投机取巧的窍门,我唯一做的就是对官方发布的故障报告进行严谨的拆解而分析在扣子的并谋会上,我把这一套分析流程写成了 costco, 今天他终于可以公之于众了。 在这里简单的带大家过一遍这个技能的设计。第一步也就是最重要的一步就是获取官方的故障信息。 这里分成两种模式,分别是有 c v e 编号的安全漏洞事故和非安全漏洞的服务瘫痪事故。因为这两者的官方信息来源不一样,前者有统一的 c v e 数据库,可以通过编号直接获取详细的 mate data, 而后者只能通过官方网站找到相对应的技术文章。 这里能看到,根据不同的模式,我会调用不同的 python 脚本,以求达到最准确的数据获取。而接着就是根据官方信息,把整个事故的时间线和重要节点串联起来。有了一个清晰的时间线,我们就能从源头开始找到导火索事件,从技术上判断它的触发条件, 然后再沿着传播路径一点一点的往下推理,从而最终还原整个故障的扩散过程。有了这些,我们就可以回过头来找背锅侠,哪个节点是谁的责任,是人还是规则,又或是组织架构的问题, 最后有针对的提出改进意见。整个就是一个完整的具有深度、广度和专业度的分析报告了。每一步其实都有很多细节,感兴趣的可以直接去看。我的源码链接发到了评论区置顶, 接下来可以看看这个技能的实战效果,我们直接让他去分析去年的三大故障,六月份的 google cloud 瘫痪,十月份的 adobe flash 瘫痪。 这三个分析报告我都仔细阅读了,可以说甚至比我去年做的还要详细。就拿 adobe flash 故障来说,看过视频的都知道,我只是对主故障链进行了复盘,其他都一笔带过。而这个报告则是把所有依赖的所有连锁故障链条都找了出来。 别看这里都只是聊聊几句,实际上要梳理这些信息,你得把整个 a to s 的 系统日记都看一遍,然后再进行梳理和拼接,又耗时又烧脑,这也是我当时跳过的原因,实在是没有时间去处理。 还有 clubfire 报告里关于导火索的分析,这里和我在视频里的解读几乎一致,如果不是 ai 爬不了视频内容,我都差点以为他是直接把我的话复制过来用了 以后再出现什么大规模故障,大家就不要催更视频了,因为我已经把这个计算机故障分析师上架了 cos 的 技能商店,你们自己去找他要分析就得了,而且本着开源精神,我这个技能是完全免费开源的,所以大家有什么想要优化的地方,也欢迎提出修改。 在 cos 的 技能商店,还有着来自各行各业的专家技能可以一键调用,大部分都是免费的,也有个别收费的, 每个都有精选案例,可以直接体验一下效果。我也体验了几个,别的不谈,这画面效果确实秒杀我这种没有艺术细胞的理工男。你就说这么专业的 ai 算命要是普及开来,哪还有那些路边算命先生的出场机会? 看了这么多大家发布的技能,我的感想是,一个成功的技能必须同时具备专业的工作流和专业的知识积累。因为如果你的产出核心是来自于通用 ai 的 能力,那你这个技能就没有什么存在价值了。人家直接用通用 ai 可以 顺手解决的问题,为啥要千里迢迢来找你帮忙呢?更别说付你钱了对吧? 有些人想着可以蹭大模型的能力去赚快钱,那就是俗话说的错,把平台当本事。所以归根到底, ai 生态能不能够生根发芽,扣子能不能让开发者赚到钱,最后的决定权其实还是在开发者自己身上。 那么最后实践是检验真理的唯一标准。如果想要验证一下自己的专业能力能不能够让人买单,你现在就可以去扣子上创建自己的技能,上架技能商店,接受全国用户的检验,欢迎大家来挑战!

别再瞎找了,这是你唯一需要的一个 skill。 find skills 就是 帮你找 skills 的 skill。 比方如我想找一个 ios 开发的 skill, 那 就跟 ai 说,用找 skill 的 skill 帮我找一个开发 ios app 的 skill, 它就会自动调用 find skill 找到符合你描述的 skill。 当然,描述的越精确,找的就越精确。安装方法也非常简单,只需要官方的这行命令就可以。 这里需要注意的两个点是,第一是最好选择全局安装,第二个选择复制到所有的 a 阵,否则可能找不到这个 skill。 好 了,如果不会安装,可以在评论区留言关注我,了解更多 ai 干货,感谢大家观看!

你是小阿八,正在用 ai 开发网站,为了让 ai 生成的效果更好,你告诉 ai 界面不要使用蓝紫渐变色,不要生成一大堆没用的文档,你要遵循公司的代码规范。阿八阿八,洋洋洒洒几百字 之后,每次开发网站时,你都要写这么一段又臭又长的提示词,太麻烦了。于是聪明的你开始想办法, 先把常用的提示词保存到单独的文件,每次手动投喂给 ai。 然后创建了资源文件夹,把公司的代码、规范、设计素材都塞进去,告诉 ai 参考这些去写。 接着你还写了一些脚本,让 ai 生成代码后自动执行格式化运行测试,提交代码到 get 仓库。最后再写着 agent 点 m d 文件,把所有规范和工作流程都写进去,让 ai 自动读取,你沾沾自喜, 嘿嘿,俺这套工作流堪称完美。但很快你发现了问题,随着规范越写越多,文档越来越臃肿,每次对话都要占用很多 ai 上下文空间,浪费 tokens。 于是你找到号称没有人比他更不懂 ai 的 鱼皮,求助阿爸阿爸,俺还能咋办啊?不是有 agent skills 吗?为啥不直接用呢? 呃,啥玩意儿?这可是最近 a h r 爆火的技术,下面我来带你玩转 agent skills, 让你知道它是什么,怎么用,有什么魔力,怎么自己开发。点着收藏,我们开始。 agent skills 是 astropic 推出的一套开放标准,目的是让 ai 能够学习使用各种专业技能,而不用每次都重复输入提示词。简单来说,它就是给 ai 装备的技能包,技能包里有精心设计的提示词、代码、脚本,还有各种资源文件, 把 ai 想象成一个职场小白,给他装上文档处理技能,他就立刻知道怎么生成 ppt 处理 excel 表格。装上代码规范技能,他就知道怎么按照公司的标准写代码。 你挠挠头,呃,等等,这不就是俺在做的事吗?把教 ai 做事的文档和 ai 要用到的文件打包成文件夹差不多,但 osropet 把它做成了一个通用标准,而且在实现原理上有一些新花样。 可恶啊,俺差点就改变世界了,这能有什么新花样?下面我先来带你用一下 agent skills, 再跟你说说其中的奥秘。 目前对 agent skills 支持最完善的工具是 asteroid 官方的 cloud code, 我 们就以此为例,安装并使用 skills, 先打开 cloud code, 并输入命令,添加官方技能市场。这就像是在你的 ai 助手里开通了一个技能商店,接下来你就可以从商店中获取技能了。 然后在 toloud code 中输入命令,安装官方提供的技能包。这着 example skills 包含了一堆官方势力技能,包括前端设计、网页测试、动图制作等等。 装完之后,你就可以直接让 ai 使用这些技能了。比如你要做一个网站,以前没装技能的时候, ai 生成的代码又是那个熟悉的蓝紫渐变色,千篇一律的 ai 审美。 现在安装了 front design 这个教 ai 生成专业设计版网站的技能后,你输入提示词,帮我开发个人作品及网站。 ai 会主动问你,我发现你安装了前端设计技能,需要用它来生成证据设计版的页面吗? 确认之后, ai 会利用技能生成代码,告别篮子渐变,生成独特风格的精美页面。我们不用每次都给 ai 输入一大堆相同的提示词,装一次技能就行了。 除了代码相关的技能,官方还提供了文档处理技能包,同样在 cmd code 中输入一行命令安装。 这只技能包里有 ppt 制作、 word 文档生成、 excel 数据分析、 pdf 解析等技能。接下来,如果你让 ai 做着 ppt, 它会自动调用 ppt 制作技能,直接生成排版好的 ppt 文件,帮你节省几个小时。 你好奇道,咦,为什么 stills 能做到安装即用?技能包里面到底有啥? ai 又是怎么知道该用哪个技能的? 好问题技能其实就是一个包含 still 点 m d 技能说明文件的文件夹,还可以包含可执行脚本资源和参考文档。 由于每个技能的复杂度不同,结构也会存在区别,我们可以在本地目录中找到已安装的技能文件夹。以官方的 ppt 制作技能为例,它的结构是这样的,包含一个核心的技能说明文档, still 点 m d, 还有脚本参考文档和各种资源文件。 而 front and design 前端设计技能只有一个, still 点 m d 文件。 still 点 m d 文件是每个技能的核心,它包含两个关键部分,第一部分是原数据,用 yam 格式写在文档开头, 其中 name 是 技能的名字, description 是 技能的描述,告诉 ai 什么时候应该使用这个技能。 描述写得越清晰, ai 就 越容易在合适的时机调用它。第二部分是指令内容,就是一套经过精心设计的提示词,指导 ai 具体怎么做。以前端设计技能为例,它的指令内容包括设计思考、前端美学指南和必称指南。 你挠了挠头,如果有多着 stux, ai 怎么知道该用哪个技能呢?如果把每个技能说明文的都塞给 ai, 不是 很占用上下文吗? 这就要说到渐进式批漏这个核心机制了。当你让 ai 执行任务时,它会先扫描技能目录,但不会把所有内容都加载到上下文中,而是只读取每个技能的原数据, 发现描述和任务相关,就知道该用这个技能了。然后才把完整的技能说明文档读进来,按照里面的指令执行,并根据需要加载技能包中的其他资源,用到哪个查哪个,既精准匹配又节省上下文,这就是渐进式纰漏的精髓。 所以 agent skills 的 本质就是把专业知识打包成一个文件夹,让 ai 按需读取并使用。呃,那除了 cloud code 之外,其他 ai 工具支持 agent skills 吗?俺平时用 curser 比较多, 当然能, agent skills 已经成为通用标准, curser、 west code code、 dex 等工具都支持。 skills 的 社区也非常活跃,你可以在 cloud skills、 hub 市场开源的 awesome、 cloud skills 等地方找到很多现成的技能, 比如有着叫 uiu 叉 pro max 的 技能特别火,专门用于提升 ai 的 设计能力。用法很简单,首先按照开源仓库文档的指引,安装官方提供的命令行工具, 然后进入到你的项目目录下,根据使用的 ai 工具执行对应的命令。比如我这里用 cursor, 它会自动把技能安装到 cursor 的 配置目录里,安装完成后,可以看到它的文件结构。接下来当你让 ai 开发一个网站时,可以使用斜杠命令手动触发技能,或者让 ai 自动识别技能。 ai 会根据你的需求识别出产品类型和需要的页面类型,然后调用设置点 p y 搜索脚本,在 data 目录里进行多维度搜索,找到适合的配色、字体、布局风格。接下来综合搜索结果,生成完整的设计方案。最后 ai 再按照设计方案生成代码, 这样一来,生成的界面既专业又有设计感。 ai 不 需要把所有规则都背下来,而是用到哪个查哪个,这就是 agent skills 的 精髓。 用了很多别人的技能后,你产生了一个大胆的想法,哎,能不能把公司的周报折式封装成一个技能,以后推荐给新来的同事,还能卖几个钱,嘿嘿嘿。嗯,有点东西,那你打算怎么做呢?当然是发挥程序员最擅长的事情。复制粘贴。 俺先复制一个官方的技能包,修改目录名称为自己的,然后修改技能说明文的 still, 点 m d 的 原数据指令内容这些关键部分。最后把公司的 logo、 ppt 模板爆照样例放在子文件夹里就行了。妈妈再也不用担心我的周报了。 不错不错,但其实有更简单规范的方法。在前面安装的 example stills 官方势力技能包里有一个叫 still creator 的 技能,专门用来帮你创建新技能。你只需要跟 ai 说,帮我创建一个专门生成公司周报的技能。接下来 ai 会问你几个问题, 你希望周报包含哪些主要部分,以什么格式输出?你通常会如何使用这个周报技能?希望周报的语言风格是什么?很快,一个完整的技能包就生成了,你会看到一个点 scale 为后缀的文件,本质上是一个压缩包,你可以把它解压到你的个人技能目录下,你的所有项目都能用。 如果你想让技能只在某个项目生效,可以把它放到项目的 cloud, 同步给项目组其他成员 测试。没问题后,你还可以把它开源到 github, 或者上传到 chaleo 的 stokes hub 这样的社区平台,让所有用户都能用,你开心极了。原来开发一个 stokes 这么简单,但是这玩意儿跟之前火爆的 mcp 和邪道命令有啥区别? 好问题, m c p 就 像给 ai 装上了手和眼睛,让 ai 能够连接外部工具和数据源,比如搜索网页、读取代码、仓库、查询数据库,适合需要获取数据或操作外部系统的场景。 而 agent skills 正像是给 ai 发了一本工作手册,把专业知识和工作流程打包起来,教 ai 在 特定领域该怎么做。 至于斜杠命令,它就像是快捷键,是需要你手动输入常按的命令来触发的固定操作。而 steils 的 特点是, ai 可以 自动识别该用什么技能,不需要你显示调用。对了,其实 mcp 和 steils 是 可以结合起来的。 举个例子,如果你想让 ai 帮你发周报, m c p 负责获取数据,从任务管理数据库拉取这周的任务列表。 skills 负责加工数据,把获取到的原始数据整理成老板爱看的格式,一个提供食材,一个提供配方, 你看这技能文件夹的结构,突然怪叫一声,阿爸,哈!等等,俺突然意识到一个问题,这不就是我们程序员玩烂的封装附用、模块化懒加载那一套吗?写几个代码文件,打着包发到网上,让其他程序员下载下来用 不是一回事吗?为什么 agent stux 能突然让整个 ai 圈为之疯狂?好问题,从技术的角度来看,它并没有发明什么惊天动地的算法。在我看来,它能火主要是两个原因。第一,它是开放标准,封装一次技能包后就能在各种 ai 工具里附用,还能通过社区共享。 更重要的是, stux 能立刻让 ai 的 工作更专业可靠,让普通人无感地享受到技术带来的价值。以前想让 ai 变聪明,你得学提示词、工程配置各种工具链。现在只需要像装 app 一 样安装技能包, ai 就 立刻变专业了。 一项技术的成功不在于它有多复杂,而在于它能让普通用户在不关注技术细节的情况下感受到技术的价值。 你点点头,学会了,学废了。降低门槛才是技术走向大众的钥匙。没错, agent skills 不 仅仅是个技术概念,更是一种新的工作方式。 你可以把它融入到自己的日常工作中,比如把重复的任务封装成技能,把团队的最佳实践固化成技能,让 ai 真正成为你的得力助手。 在这个 webtopod 盛行的年代,技术的门槛正在崩塌,而想象力的边界正在无限扩张。你可以在我免费开源的 ai 编程零基础入门教程中学到更多 ai 编程技巧,也欢迎关注鱼皮,学习更多 ai 和编程的技巧。那么问题来了,你最想让 ai 学会什么技能呢?

最近看了 astropica 官方的一个演讲,主题很炸裂,别再构建 agent 了,开始构建 skills 吧。看完有点震撼,不是那种新技术发布的震撼, 而是他们对 ai 落地的思考已经升到了另一个层次。今天就来好好聊聊这个话题。先说说 agent 现在的问题。去年这个时候,大家还在争论 agent 到底是什么, 今年呢?好多人已经在用了,但问题依然存在。 agent 有 智能,但没有专业度。 演讲者打了个特别妙的比喻,你报税的时候会找谁?是找 mahesh? 那 个三百 iq 的 数学天才,还是找 barry? 一个有经验的税务专业人士? 我想每次你都会选 barry, 对 吧?因为你不会想让 mahesh 从第一性原理去推导二零二五年的税法。你需要的是一致的专业执行。 现在的 a i a 整的就像 mahash, 聪明绝顶,能做很厉害的事,但缺少领域专业知识, 需要你给大量指导,而且它不能很好地吸收你的专业知识,也不会从经验中学习。什么是 skills? 那 astropic 的 解决方案是什么呢?是 skills。 那 skills 是 什么?就是有组织的文件夹,听起来很简单,对吧?这个简单是刻意为指导。 他们希望任何人、任何 agent, 只要有一台电脑,就能创建和使用 skills, 可以 用 git 做版本控制,可以放 google drive, 可以 压缩后分享给团队。 文件是人类用了几十年的原始格式,为什么要改变?更重要的是, skills 还能包含脚本。作为工具,传统工具有很多问题,指令写的模糊,模型卡住了,没法自己改,而且工具永远站着上下文窗口代码解决了这些问题, 自带文档可以修改,存在文件系统里用的时候才加载。举个例子,他们发现 cloud 总是重复写同一个 python 脚本,用来给 ppt 应用样式, 于是就让 cloud 把这个脚本保存到 skill 里,以后直接运行脚本,一致性更高,效率也更高。 skills 如何保护上下文?随着信息量越来越大,需要保护上下文窗口,这样才能加载成百上千个 skills, 让它们真正能组合使用。 skills 采用的是渐进批录的方式,运行时只显示原数据,告诉模型。嘿,我有这个技能,当 agent 需要用这个技能的时候,才会读取完整内容。这个设计很聪明,用最小的开销实现了最大的灵活性。 skills 生态长什么样? skills 推出才五周,但生态已经快速增长到数千个了,主要分成三类。第一类,基础型 skills, 给 agent 全新的通用能力或者领域能力。 astropic 自己做了 document skills, 让 cloud 能创建和编辑专业质量的办公文档。还有 settings 做的科学研究。 skills 让 cloud 更好地分析电子病例数据, 更好地使用生物信息学 python 库。第二类,生态伙伴 skills, 帮助 cloud 更好地配合特定软件, 比如 browserbase 为他们的浏览器自动化工具做了 skill。 notion 也发布了一堆 skills, 帮 cloud 深度理解你的 notion 工作区。第三类,企业内部 skills, 这是最让我兴奋的部分财富一百强企业在用 skills 教 agent 了解他们的组织最佳实践。还有那些奇葩的内部软件使用方式,大型开发者团队也在用,给成千上万的开发者部署 agent, 用 skills 教会 agent 代码风格、最佳实践内部工作方式。 所有这些 skills 有 个共同点,任何人都能创建他们给 agent 全新的能力,而这些能力是 agent 之前没有的。三大趋势是什么? 随着生态增长, ansorepic 观察到了几个有趣的趋势。趋势一, skills 变复杂了。最基础的 skill 可以 只是一个文件加上一些提示词,但现在看到的 skills 包含软件包、可执行文件、代码、脚本、资产等等。 很多 skills 需要几小时甚至几天来构建。 anthropic 认为未来某些 skills 可能需要几周、几个月来构建和维护,就像我们今天用的软件一样。趋势二, skills 与 mcp 互补 mcp 提供外部连接 skills 提供领域专业度开发者构建 skills 来编排多个 mcp 工具,完成更复杂的任务,处理外部数据和连接。 趋势三,非技术人员在构建 skills, 这验证了他们最初的想法, skills 让不写代码的人也能扩展这些通用 agent。 金融、招聘、会计、法律这些领域的人都在构建 skills。 新架构是什么? 把这一切串起来就是正在涌现的通用 agent 架构。第一层, agent loop 管理模型的内部上下文,管理 token 的 进出。第二层,运行时环境,提供文件、系统和代码能力。第三层, m c p 服务器, 外部工具和数据让 agent 更相关,更有效。第四层, skills 库,成百上千个 skills agent 按需拉入,给 agent 增加一个新领域能力。现在可能只需要配上合适的 m c p 服务器,配上合适的 skills 库, 这个模式已经在帮 astropic 把 cloud 部署到新的垂直领域。 skills 推出五周后,立马推出了金融服务和生命科学领域的新产品,每个都有一套 m c p 服务器和 skills, 让 cloud 对 这些领域的专业人士更有效。 skills 的 未来是什么? astropic 在 思考几个方向,一、把 skills 当软件对待, 探索、测试和评估的方法,确保 agent 在 正确的时间出发,正确的 skills 测量输出质量。二、版本控制 skill 在 演化, agent 行为也在演化,都要能清晰追踪。 三、依赖管理 skills 可以 明确依赖其他 skills。 mcp 服务器环境中的依赖包,让 agent 在 不同运行环境里更可预测。 skills 的 价值来自于共享和分发。 barry 和 mahesh 在 思考大规模部署 agent 的 公司的未来,最让他们兴奋的愿景是一个集体进化的知识库,有组织内的人和 agent 共同策划和改进 skills 是 这个愿景的重要一步。他们提供程序性知识,让 agent 做有用的事。当你与 agent 交互,给他反馈更多组织知识,他会变得更好, 你团队和组织里的所有 agent 也会变得更好。想象一下,当有人加入你的团队,第一次使用 cloud, 他 已经知道团队关心什么, 知道日常工作怎么做,知道怎样对你的工作最有帮助。这种价值会复合增长,最终超越你的组织,延伸到更广泛的社区。就像别人构建的 m c p 服务器,能让你的 agent 更有用。 社区里别人构建的 skills 也会让你的 agent 更强大、更可靠、更有用。 ai 自己能创建 skills 吗? 这个愿景最强大的部分,当 cloud 自己开始创建 skills, skills 被专门设计为连续学习的具体步骤。这个标准化格式给了一个重要保证, cloud 写下的任何东西都能被未来的自己高效使用, 这让学习真正能够转移。随着你积累上下文。 skills 让记忆这个概念更具体,它们不是捕获所有信息,而是只捕获 cloud 在 特定任务上能用到的程序性知识。 当你和 cloud 工作了很久, cloud 可以 及时获得新能力,按需演化,丢掉过时的能力。它们的目标是, cloud 在 第三十天工作的时候比第一天好很多。 cloud 今天已经能用 skill creator skill 来创建 skills 了。 agent 站的类比是什么?最后用个类比来总结, 把 agent 站和我们熟悉的计算做个对比模型约等于处理器都需要大规模投资,蕴涵巨大潜力, 但单独用起来没那么有用。 agent 运行时,约等于操作系统,操作系统通过编排进程、资源、数据,让处理器更有价值。在 ai 里, agent 运行时正在扮演这个角色,但一旦有了平台,真正的价值来自应用。 只有少数公司在构建处理器和操作系统,但有数百万开发者在构建软件。把领域专业知识编码进去,把独特观点编码进去。 ansaurpic 希望 skills 能帮大家打开这一层,这是我们发挥创意的地方,解决具体问题,为自己,为彼此,为世界解决问题。 只要把东西放进文件夹, skills 只是起点。我们现在正在收敛到通用 agent 的 通用架构, skills 作为新范式,用来分享和分发新能力。 是时候停止重建 agent 了,开始构建 skills 吧。这篇内容写完,我对 ai 的 理解又上了一个层次。 之前一直在想怎么让 agent 的 更聪明,但 anastropy 的 思路是让 agent 更专业,聪明是模型的,是专业,是我们的知识。 skills 就是 把我们的专业知识打包成 agent 能理解和使用的格式。 这个方向很对,期待看到更多 skills 的 出现,也期待自己能构建一些有用的 skill。

现在我们正站在一个转折点上, ai agent 正从会聊天转向能做事,但在执行真实世界任务时,依然存在很多瓶颈。今年十月十六日, anthropic 发布了官方文档 equipping agents for the real world with agent skills, 提出了解决方案 skills 机制。这篇文章为 agent 进入真实世界任务做好了准备。原文首先肯定了 cloud 的 强大,但也指出在现实工作中,他缺少两样关键能力,第一,缺乏过程知识,即不知道事情该怎么做。第二, 缺乏组织背景,既不知道东西在哪里。我们可以把一个 agent 想象成一个聪明但没经验的新员工。这个新员工虽然很聪明,但入职第一天什么都做不了。 为什么?因为他面临两个巨大的能力差距。第一,他不知道公司如何做事,他会问我们的报销流程是什么?我该如何提交代码,这就是过程知识的缺失。第二,他不知道公司的资料放在哪,他会问我们的项目 api 密钥在哪里? t t t 模板在哪? 这就是组织背景的缺失。没有这两样东西, agent 就 无法处理真实世界中的具体工作。要解决这两个问题,我们通常会给新员工一本标准化的 s o p 入职指南或岗位手册。而在 on traffic 的 设计中,这本手册就是 skill。 skill 的 核心定义是由指令、脚本和资源组成的结构化文件夹。智能体能够动态发现并加载这些内容,以提升特定任务的表现。我们来拆解 skill 的 三要素, instructions 相当于手册中的 s o p 文字,告诉他如何一步步完成任务。 scripts 需要执行的 python 文件 resources, 执行过程中用到的配置文件或模板,如 json 或 d o c x 文件。这三要素正好对应我们开头提到的两个痛点,过程,知识的缺失由指令和脚本解决。 组织背景的缺失由资源解决。定义的后半句同样非常关键,智能体能够动态发现并加载这些内容,以提升特定任务的表现。这句话意味着 skill 不 再被固定在系统提示中, 而是可以被动态检测、挂载和使用。当 cloud 面对不同任务时,比如分析财报、提取合同字段或生成合规文档,它会主动发现最相关的 skill, 加载其中的 s o p 脚本和模板, 使输出更精准、更一致,也更可复现。这就是提升特定任务表现的真正含义。 skill 不 只是知识的存储单元, 而是让 agent 在 特定场景下变得更专业的能力模块。换句话说,它赋予了 cloud 在 需要时加载能力模块的心智模式,让智能边界不再受上下文窗口限制,而是能随任务实时扩展。 也正因为如此, cloud 才能实现近似无限上下文的工作流。这一机制在原文中被称为渐近式。譬如,下期我们将精读这一部分,看看 unstrapix 是 如何通过这套机制让大模型的思考空间实现逻辑上的无限扩展。总结这一部分, agent 就 像一个聪明但没经验的新员工, skill 就是 给他的一本标准化 s o p 入职指南。那么,这个 skill 在 系统架构里是如何体现的呢?这张图展示了配置和实现之间的联系。 一、右侧 agent 虚拟机从右侧开始看更容易理解它是 agent 的 电脑和双手,是真正执行任务的地方。在顶部,我们可以看到 bash、 python 等图标。 python 表示这台电脑安装了 python 引擎,当 skill 文件夹中包含脚本时, l l m 就 能调用它执行。 bash 表示系统具有命令行终端, agent 可以 通过它操作文件,比如使用 l s 列出文件或 cut 提取文件内容。这说明 agent 不 仅能聊天,还能真正动手做事。文件系统中存放着所有 skill 的 实体。二、 左侧 agent 配置左侧的 l l m 是 大脑,是决策中心。 agent 的 配置更像是 l l m 可访问的 s o p 锁影,其中包含核心系统提示,以及一份以装备技能的清单。列出了技能名称和简介,如 pdf, d o x s 等。 当 cloud 想使用某个 skill, 比如 pdf 时,它会通过 tool 操作虚拟机执行命令。 run bash commandant, 这意味着 cloud 指挥虚拟机打开并获取一个 s o p 文件,获取到的内容会返回给 l l m 的 相关公口, cloud 便能学习并决定下一步该怎么做。总结来看,这个架构展示了 l l m 提取 agent 配置并调用虚拟机来执行 skill。 到这里,很多人会问,既然 skill 也能触发执行, 那它和 tool 有 什么区别?两者看起来相似,但角色完全不同。 skill 最终会调用 tool, 但它们的架构地位不同。可以这样理解, tool 像一台烤箱,是底层的执行能力。 它功能强大,但需要精确指令才能工作。 skill 则像一份妈妈的烤鸡食谱,它本身不烤鸡,但封装了全部过程知识烤多久,温度多少,需要哪些原料甚至经验性的诀窍?我们从几个维度来区分它们? two 回答的是 what 我 能做什么?技术上,它执行代码。 skill 回答的是 how 我 该如何做好这件事?技术上,他指导如何完成任务。 tool 是 原子化能力,一个 api 或函数。 skill 是 完整的 sop, 包含指令、脚本和资源。 tool 是 执行器 被动等待调用。 skill 是 流程编排者主动指导 l l m 调用 tool 完成任务。 tool 的 目标是提供原子能力。 skill 的 目标是封装、可移植、可附用的过程知识。总结下, skill 不是 tool 的 替代品, 而是调用 tool 的 sop, 它封装了可组合的过程知识,让 agent 真正具备会做事的能力。好了,第一期内容就到这里,我们搞清楚了 agent skills 是 什么,它的系统架构 以及它和 to 的 核心区别。下一期我们讲详细讲述 skill 如何通过渐进式批录实现近似无限上下文。

我今天在读那个 superpower 的 redmi 文档的时候,发现这位大神在里面写了一段话,看完有一种自己被指着鼻子骂的感觉,真的很好玩。等你在设计稿上面大笔一挥的签完字,你的对接人就会甩出一份具体的实施方案。这个方案写的那叫一个通俗易懂, 就算是一个审美掉线脑袋空空对项目一窍不通还打死不肯做测试的愣头青热血初级工程师也能够照着扒拉玩,大神真的还是太懂我们了。

最近跟着教程上守 skills 的 人越来越多了,从最初的编程任务一路扩展到办公、 ppt 创作等各种场景。今天我们通过一个视频理解 skills 的 核心,避免让 skills 和 mcp 一 样成为摆设。 skills 的 出现源于 entropic 团队在开发 cloud code 的 这类 agenetic 系统时察觉到的一个核心痛点。 agent 虽然具备很强的自主执行能力,但面对特定的专业领域时,缺乏必要的经验和标准化流程。单纯靠 prompt 工程针对每个领域调整提示词,或者依赖昂贵的模型微调,都无法很好地满足实际需求。于是他们推出了可扩展、可移植的 skills, 把领域专业知识封装成技能包,让 agent 能够快速获得专业能力。 它的核心就是一个 skill m 文件,哪怕没有其他脚本和资源,仅靠这一个文件也能驱动整个技能流程运转。它相当于一份给 agent 看的标准化技能说明书。 咱们来看它的结构。最上方是一段简短的原数据,用来定义技能的核心信息,比如技能用途、出发条件、适用场景。 agent 在 出场阶段会将这部分原数据全量加载到系统提示中, 当用户需求匹配到原数据里的描述或关键词时,才会进一步加载下方的具体指令模块。这部分指令包含了完整的执行规则、操作流程、领域专业知识以及输出格式规范。这样一来, agent 就 能照着 skill 的 指令调用工具运行脚本,稳稳生成符合规范的输出。 那么同样是 anthropomorphic 出品, skill 和 m c p 有 什么联系呢?我认为两者更像是互补关系。 m c p 更专注于连接,提供了实时数据和工具相,而 skill 则保证能够正确地去使用它们。两者共同解决了 ai 从 chatbox 到 agent 转变过程的难题,希望对你有帮助。那今天就到这啦,感谢大家。

卧槽! gitlab 中最高收藏的 skills? 这个全网最高收藏的 cloud skills 仓库直接封神! andefropic 官方出品,一站式搞定技能使用与开发,它可以带你了解什么是 skills, 如何在 cloud 中使用 skills, 如何搭建自己的 skills。 文字内容非常详细,比 如什么是 skills? skills 文件包含指令,脚本和资源, cloud 的 动态加载这些,提高执行效率,讲解 skills 如何运作的,而 skills 的 类型还可以分字定义。 skills 这个开源仓库还教你如何搭建符合自己需求的 skills, 感兴趣的赶紧收藏,防止找不到。


都知道 skills, 但是好用的 skills 在 哪里找到?这个开源 skills 集合,专为收集好用的 skills, 就是 大家常说的 skills, 后面加上 s h 收集好用的 skills 已经五万多。 skills 都是精品,按照使用人最多的进行排序,都包含了各行各业的专业 skills, 太多 skills 不知道怎么找自己需要的。最底部直接点开搜索,比如输入 v o e, 搜索出来的都是相关,按照使用最多的进行排, 随便点击一个复制上面指令,直接安装,简直快人一步。每一个 skills 都会详细介绍它的作用信息,能帮我们做哪些工作,比如这个网站设计指南,帮我们审核文件是否符合外部页面要求。最后感兴趣的小伙伴们赶紧收藏,防止找不到。

scares 的 潜力还在被挖掘,你现在所看到的这些丝滑的动画就是 cloud code 用代码做出来的。大佬开发的这个动画的 scares 叫做 remotion, 不 需要你敲代码打打字,就可以做出像果味十足一样的动画了。简单示范一下,输入你想做的动画需求,点击发送, 它就开始自动编程写代码了。它还会自动选择动画的风格,比如这个就是模仿了 max 的 系统的动画风格,不到一分钟的时间,一个完整的展示动画就搞定了,效果真的非常不错,完全都能当做一个产品发布会了。我们再复盘一下它的操作逻辑,简单给大家概括一下,就是从动画的 底层,本质上就是数学公式,这比数值有趣很多,比如我们常见的关键帧,而这套的逻辑就是根据你的需求去计算出合适的动画,是不是很通俗易懂。 复制这份代码,输入你的终端,你也能够轻松地做动画了。还有更多 ai 工具已经来整理好了,关注我,一生带你探索 ai 世界!

a 圈集体播放 agent 的 智能体开发,将不再是博士生才能玩的高端局。起因是文达大佬最新发布的 agent skills 课程在 youtube 上火得一塌糊涂,简直吊打市面上百分之九十九的教程,瞬间引爆全球技术宅的学习热情。这课的厉害之处就在于把复杂的 agent skills 设计与封装拆成简单五个板块儿, 关键时候手把手教你从零创建和管理自定义技能,绝对的实战王炸!靠着这一刻就能搭出专业化可附用、能组合的专家级 agent, 让大模型变成小白都能玩的技能组装入门运动配套的大模型学习路线和配套视频教程我都打包好了,留学习带走。

兄弟们,这个 skills 集合收集了八万七千多 skills, 目前最大的 skills 网站,包含了各行各业的内容,今天我们就用你们的 skills 教大家如何使用 skills, 这里面有超多类型的 skills, 咱们先选内容和媒体类型的,这个就是内容和媒体类的 skills, 咱们用 x l s x 的 skills 测试,教大家怎么用怎么装,一进来就详细介绍,咱们只需要下载压缩包,下载完要放到对应的目录下,我用的是 cloud play, 要放 cloud 文件里的 skills 文件夹解压出来,这样 cloud 就 有 x l s x 的 skills 了,其他 ai 的 存放位置我放粉丝群里了, 安装完压缩包就能删了。接下来打开 cloud, 在 终端检查装备装成,只需要输入斜杠就能椒盐是否安装成功。 前面这三个就是我装的 skills, 直接选咱们刚装的,回车,他就会返回介绍内容,我们来演示一下这个 skills, 这里我准备了一些 x l s x 文件数据进行测试,主要就是财务记账和支出和收入的,我们让他分析利润和生成数据报表信息,来增加我们的工作效率。这里我们已经打开了 cloud, 拖着文件到输入框,主要就是分析这些数据表,统计利润和支出。总数据输入完成直接回车提交选 全程加速,中途会有需要配合回车,默认选 yes, 只需回车,这个就是统计出来的效果,输出在控制台了,但我们还需要 x l s x 文件效果,继续输入提示词计算来的数据,帮我做成 x l s x 文件有数据图效果更好,最后回车就完事,这一次咱直接看结果,兄弟们帮我们做成了文件,文件夹多了个财务分析报告,还有数据表。接下来打开能看 x l s x 的 软件查看,这里就是总信息,所有财务分析信息全给咱处理好了,我们快速查看其他内容,最后的数据图表也完全没问题, 只是摆放位置需要咱们手动处理,我们快速处理一下啊,查看完整的信息效果,这效果一看就非常不错,恭喜你学会如何使用别人的 skills 了,感兴趣的小伙伴赶紧收藏,防止找不到!

最近的 skills 非常的火,给大家分享一个 skills 市场,这个里面有七万多个技能 skills, 可以 看到其实也就是一月份半个月不到的时间,大家对这个 skills 的 热情是不断地突飞猛进,在这也再次印证了 skills 会复现去年的 m c p 工具火爆的程度, 可以看到这个量非常的大,从五号开始,每天增加的量就非常的恐怖了,这里增加了三万多个,总的达到了七万多个。因为这个 skills 它开发起来的成本比较低,它就两个东西,一个是一个 markdown 的 文件,一个就是一些脚本内容 进行执行,所以说它开发起来成本非常的低,随便一个人都能去做开发,甚至一篇这种论文里面的一些思想,也可以开发成一个 markdown 的 文件,也可以叫做是一个 skills。 我 们来看一下它这个分了非常多的部分啊,分了这种按照明星进行排行,按照最新进行排行,还分成了不同类别。 我们可以看一下它随便一个 skills, 专门去搜索它的提示词的一个 skills, 你 看到去下载这个压缩包,把它解压到你的 skills 的 文件中,就你就拥有了这样的一个 skills, 而且它还有一些解释,也可以直接一键下载,也可以到 gitlab 中进行浏览, 这个还是非常好的一个工具,因为大家也可以借鉴一下它这些 skills。 但是这个 skills 还是有一些缺点,比如说有一个比较重大的缺点,就是它里面的一些脚本, 通常都是你本地这些人创建者,他本地已经测试好的一些脚本,可能在不同环境下他的脚本就不一样了,所以说这个脚本还是需要进行一些处理的, 至少他应该打个 docker 环境,如果有一些轻便的 docker 环境可以执行脚本,这是不是会更好呢?这就是另外一回事了。

大家好啊,今天呢,我们要深度拆解一下近期在 ai 开发者圈子里面备受瞩目的 agent skills。 这个 agent skills 呢,是继 mcp 之后,由 anastropic 公司发布的又一项重磅的智能体开发标准。 那之所以它比之前的协议呢反响更加的热烈,是因为 agent skills 呢,它提供了一套成本极低并且高度合理的技能包构建方案, 让这个 ai 能够像人类学习技能一样按需挑选并且加载这个技能的能力。由于它极强的通用性和跨平台的迁移能力,在短短的数月中间, 主流的 ai 编程工具都已经纷纷地跟进支持了,比如说像这个 viscoop 等等。啊,那么到底什么是 skill? 如果用一句话来总结的话,那这个 skill 就是 专门用来定义可赋用能力的标准化模板和工程规范。 他要求我们必须向智能体解释清楚两件事情,第一,什么时候去动用这个技能,那第二个就是具体怎么去执行这个技能。那为了实现这种标准化呢, isropic 定义了一套精准的目录结构和文件规范。 那首先每一个技能都必须拥有一个独立的命名文件夹,那其次,有一个必须要有一个核心的文件 skill 点 md 也是一个 markdown 文件,这是整个技能包的。什么技能包的一个灵魂, 它的一个灵魂在这个文件夹下面必须存有一个,并且这个 skill 它是要大写的,大家务必要注意这一点,这是协议中间必须去遵守的。 那智能体正是通过识别这个大写的文件名来定位这个技能的入口,那在这个 markdown 文件里面,我们需要摺写一份详细的智能说明书。这份说明书被严谨的划分成两个核心模块。第一个就是原数据和指令, 那元素通常就是在这个文件的顶部,它包含了技能的名称,核心的功能描述以及适用的触发条件。它的本质的意义就在于告诉大模型我是谁,我能解决什么问题,你在处理什么任务的时候应该来想到我。这就像这个技能的一个名片,像人的名片一样, 那指令就是更深层次的一个描述内容,它详细介绍了这个技能的具体操作流程,执行步骤,以及需要规避的一些坑,甚至可以包含大量的这个 prompt 技巧和参考的事例。如果说 原数据是一个名片,那么指令就相当于是一份手把手的这种 s o p 的 标准作业流程。那除此之外还有外部的资源。因为一个强大的技能往往不能只靠一段文字来进行描述,它可能需要依赖外部的支撑, 比如说它可能需要一段复杂的 python 脚本来处理数据,或者需要一些 pdf 节省格式的这种本地的参考资料。 那这个 a g 的 skill 就 允许我们在技能文件夹下面设立专门的子文件夹来存放这些资源。 那值得一提的是,这些资源文件夹并非是必要的。如果你开发的技能仅仅是一个调用源端接口的这个简单功能,那么你就完全可以只保留一个 skill 的 任务,复杂的任务也能够去快速适应那些轻量级的应用,所以它是一个非常灵活的一种 机制。那了解了这个 skill 的 结构之后,我们必须要思考一个深层次的问题,当我们已经拥有了 function quality 和 m c p 的 这个标准它的开发机制的时候,那为什么我们还需要这个 agent skills 呢?它的这个机制的核心竞争力到底体现在哪里? 那首先,第一个核心优势在于它解决了一个长期困扰开发者的痛点,也就是推理成本和决策精度的博弈问题。 在传统的 agent 构建模式中间,为了让大模型去面对复杂任务时能够做出正确的决策,我们通常都需要把系统中间所有可用工具的描述信息一股脑的塞进系统提示词里面去, 这就形成了一个极其庞大的工具清单,带来的严重后果有两个,第一个推理的成本飙升, 大模型每进行一次推理都要读取一遍长的离谱的工具描述,耗费了非常海量的托管。 那其次就是决策大模型的正确干扰,过长的上下文会导致模型注意力分散,也就是我们所常说的迷失在长文本中间无法自拔,导致你的决策出现失误。 而 agent's skills 呢?引入了一种非常人性化的机制,叫渐进式 prompt 纰漏机制,它将技能的信息进行了科学的分层。 当这个 agent 处于决策初期的时候,试图判断我该用哪个工具的时候,系统只会向它提供一些轻量级的原数据, 那大模型只需要扫一眼这些原数据,也就相当于是摘药,就能够判断出当前这个任务是否匹配,是不是要采用技能?只有当模型明确决定好,我就需要用这个技能的时候, 系统才会把详细的指令和相关的资源,当然是独属于这个技能的,这个详细的指令和相关资源传递给大模型, 这才符合我们人类的决策逻辑。就像我们要去查阅学术资料,我们不可能把图书馆里的所有书都精读一遍之后再决定去哪边对不对?我们一定是先看书名和这个书的摘要, 锁定目标之后再打开这本书去翻看他的正文和进行深度的研究。那这种分层机制就极大的压缩了每次大模型决策时候需要输入的上下文的长度, 直接降低了脱困的消耗量,并且显著提升了这个推理的速度和决策的一个准确率,这是它的一个第一个优势。 那第二个优势也是最具革命性的一点,就是这个 agent skills 让智能体真正具备了理解业务逻辑的一个能力。在 agent 落地行业的过程中间啊,开发者经常会 这个发出无奈的感叹,这个模型很聪明,但他就是不懂业务。虽然我们可以通过像这个函数调用方克星 callin 给大模型接上各种接口,让他去能查数据,能改状态,但他往往不知道如何专业的完成一件事情。 举个例子,比如说你让大模型去写一份二零二五年国产芯片或者说半导体行业的发展分析报告,那在以往的这个运行模式下面,大模型会先去搜索,会去汇总, 但他写出来的这个东西往往是泛泛而谈的,按照他自己的通俗理解去进行梳理的,因为他不知道你这家公司对于这个专业的行业报告有什么样的一个要求。 比如说我们可能要求第一张必须先去谈谈国产化的概率几率,覆盖率是多少,第二张必须有竞品的财务的对比。第三张必须使用某个行业的行业模型去进行一些数据分析,并且每一个数据点必须标注出来他是来自于哪里等等,这才是我们符合我们的行业的规范的。 但是这些其实一开始的时候让我们这个模型来做,它都做不到。这些复杂的带有行业 no 号的业务逻辑,很难通过简单的接口定义来传递给它模型,这就是面临的一个问题。那这个 agent 的 skill, 它就可以把这些外部的能力从 工具定义升级成 skill, 因为工具只定义了功能,而技能定义了逻辑,也就是从 what 转变成了号。 在 skill 迭 md 文件中间,我们可以把一套成熟的通过验证的业务逻辑,可以通过验证的业务逻辑完整地写到我们的这个 skill 迭 md 里面去。它包含执行的先后顺序,必须遵守的标准,容易犯错的细节提醒, 甚至你可以直接为他几个完美的这种模板案例。那通过这种方式,我们直接可以把人类专家的经验以一种技能包的形式直接注入到大模型的思考链路中间去 啊,这样生成的智能体输出的结果的稳定性和一致性就会得到质的飞跃,我们就不再需要去反复调试 prompt, 祈祷这个大模型能够碰运气,运气比较好得出相关的正确结果。因为技能本身就是一套非常高标准的引导规范, 这就是它的一个差异。我们把原来的功能转化成了规范,转化成了执行的标准,这就是它的一个最最大的一个亮点,让这个智能厅更懂这个业务逻辑。 好,那为了让大家更有体感,我们来介绍一个真实的业务场景。假设我们开发了一套名为合规审计的 ai 系统,那某一天公司就发现 一家重要的欧洲供应商,他可能涉及到了欧盟通用数据保护条例的新规变动,由于法律风险就增大了,我们就需要立刻对于现有的几百份合作合同来进行深度的审查。 那在不同的这个技术架构下面, ai 的 产生出来的差异就非常明显了。那首先,如果你直接用最原始的 prompt 工程模式,那为了让这个大模型懂 g d p r 这么一个新规,那你就不得不把长达几万字的这种法律条纹,或者说非常长的公司的管控的规章全部塞到提示词里面去。 这就像让一个律师在进考场之前,先去把整个图书馆的信息都把它印背下来,那在这个分析和归信的时候呢,大模型反而会因为这个信息量过载而产生严重的幻觉,往往给出这个模棱两可的建议,根本就没有办法落地。 那其次,你也可以用这个 m c p 或者说是函数调用的这个方式。在这种模式下面,大模型就变成了一个比较高端的搬运工,当他遇到问题的时候,他就会去通过接口去查询数据库里面有没有最新的法条,把这个法条背给你听,读给你听。 但是他其实背后并不能够真正理解这些业务之间的复杂性。比如说当这个 a 条款和 b 条款产生实际冲突的时候,在合规的制度里面到底应该优先执行哪一个他不知道的,那最终 ai 只会把这个信息堆积在那里,还是需要人类律师去耗费巨大的精力去进行填坑。 那最后我们如果是接入了这个 agent 的 skills, 就 像是给 ai 加载了一个专业的技能插件,那一旦这个智能体识别到这个任务关键词,比如说包含欧盟 g d p r, 它就会自动地去加载那个名为 g d p r 专项和归审计的技能包。 这个技能包里不仅有法条,还有一套成熟的专家逻辑。比如说我应该先去引导模型提取数据跨境条款,再去对比最新的标准合同条款,接着再去解锁违约责任上限等等一系列的连续操作。也就是说他把一套标准的 sop 执行流程注入到了目前的推理过程中间。 那最后呢,大模型不仅仅能够列出风险,它也会像一个资深律师一样告诉你应该怎么样去修改合同。那这种深度专业的表现呢?正是 agent skills 它的一个魅力所在了。 好,那讲了这么多,大家我觉得应该有跃跃欲试了,那下面我带大家快速的去上手,看看如何从零搭建一个符合标准的 agent skill。 首先你需要一个支持 agent skill 标准的执行引擎,那目前最推荐的无疑就是 sropik 官方推出的 cloud code, 那 作为自家的亲儿子呢,他对于这个最新的协议的支持力度肯定是最大的,最完善的。那当然你也可以完全 去用另外的生态里面的一些工具,比如说像 openai 生态下的这个 code 叉,当然就目前的成熟度而言, cloud code 肯定是首选。那假设我们要开发一个文本 英文文本转大写的一个技能,我们首先去构建文件夹路径,在你的根部路下面构建一个隐藏文件夹点 cloud, 然后在这个文件夹下面创建一个名为 skills 的 子文件夹,这是用来存放所有的项目里面所有这种开发的技能包的一个基地。最后在这个 skills 下面去创建一个针对性的技能包的文件夹,这个文字名字可以非常的直观,比如说我们用中文来命名是英文文本转大写这么一个名字, 在这个文件夹下面我们继续来创建 skill 点 md 这么一个存储指令和这个原数据的一个文件 markdown 格式格式的文件。那这里有一个细节,虽然我们的这个文件夹下面这我们的这个文件夹叫英文文本转大写,用中文的方式去写的,但是我们在 markdown 文件里面的技能名称可以用英文来定义, 在指定部分显清楚操作流程,并且也给出这个相关的示意。为了掩饰外部资源的调用了,我们在同一目录下面创建了一个 python 的 脚本,那这个脚本非常的简单,就是实现文本的大写转化。至于如何调用这个脚本,刚才已经在指定中间告诉大模型了, 这体现了这个 agent skills 的 一个非常强大的地方,就是它不仅能够理解 prompt, 也能够去快速地调动大模型的技能的一个资源。那一切就绪之后,我们在 根目录下面去运行命令 cloud, 启动这个引擎,输入这个命令杠 skills, 你 就会看到系统成功的扫描并加载了我们刚写的技能。请注意这里它显示的是我们在 macdunk 文件里面定义的英文的技能技能名称,这就证明了引擎它是深入这个 macdunk 文件内部去读取逻辑的,和你到底在外面怎么样去命名这个文件夹是没有关系的。那 最后我们再来测一下这个运行的一个效果,你会发现 ai 没有简单的用自己的深层能力去回答,而是忠实地执行了我们第一的 s o p, 它启动了 python 的 这个环境,并且真实地去运行了那个脚本,最终把这个结果打印了出来啊。

ai 编程领域, skills 彻底爆了,浓眉大眼的扣子也冲进来参战了。我用新版扣子的 skill 功能给自己做了一个文字转小红书图片的功能,效果是这样的,还不错吧。制作方法,在技能这个 type 里就写一句话, 输入 markdown 格式的文字,生成用于在小红书分享的图片扣子。忙活了十三分钟,全部完成。 看右侧,确实生成了一个符合 skills 规范的文件夹。当 skills 的 制作成本越来越低的时候,它真正的威力才会显现出来。你看到的所有成品 skill 都只是参考, 把你自己的工作流和最佳实践用 skill 的 方式记录下来,固化下来,让 ai 帮你去完成你的工作,再根据实际效果微调改进你自己的 skill, 这就是你获得十倍生产效率的新法。关注我,带你玩转 agent 加 skill!