大家好,我是来自 nux ai 的 产品负责人。在过去的一年里,我们一直在向着通往 a g i 的 道路上前进。今天我们怀着非常激动的心情向大家介绍我们在 a g i 方面的研究成果。 全球首个产品级开源通用智能的 os nux agent os。 我 们的研发重点始终着眼于如何让 ai 真正能够在企业中实现规模化落地, 所以我们采用了岗位 agent 加标准作业程序 skills 加独立执行 sandbox 的 组合。这套组合的核心理念是以具备自主规划和与执行能力的 agent 为主体, 渐进式的调用,将岗位 s o p 封装成标准化的 skills, 整个作业过程在一个独立的 sandbox, 也就是一台智能体电脑中安全执行 new x, 可以 让智能体像资深员工一样,在自主可控的环境中自主执行完整的岗位流程。我们认为这种组合方式即将成为下一代人机协同的标准范式之一。 那么接下来我们一起来看三个案例演示。第一个案例是日常企业中最常见的招聘流程,我们预先编辑好招聘岗位需要的 skills, 分 别是用来发布简历和筛选简历,给 hr agent 配置上我们的 skills, 然后请看执行过程。 hr agent 收到发布前端工程师岗位的指令后, sandbox 立即分配独立智能体电脑,渐进式加载 hr 智联招聘岗位发布技能,自动登录智联后台,按预设要求填写岗位信息并叫验提交, 两分钟内完成传统 hr 半小时的工作量,随后下达筛选指令。 agent 加载 hr 智联筛选岗位技能, 抓取投递简历,并按要求校验匹配度,标注获奖的亮点,最终生成含排名对比分析的 h t m l 筛选报告,实现招聘全自动化闭环。 第二个案例,我们聚焦企业高频的财务报销场景,我刚刚将包含员工报销凭证的压缩包发送给了财务 agent, 它自动调用整理账单 skill。 在 sandbox 安全环境中, agent 加载工具,解压文件,快速识别发票费用明细等各类文件,提取发票关键信息,并关联员工姓名,按员工维度分类归档。 原本数小时的工作仅用十分钟就完成,且操作全程隔离,避免数据交叉污染,保障数据安全合规。 第三个案例,我们来看软件测试领域的自动化落地。我们将测试的企业官网链接发送给软件测试 agent, 它搭载标准化测试、用力编辑和外部网页自动化测试。 skill agent 先调用前者按 sop 编辑多维度标准化测试,用力生成 excel 用力清单与自动化脚本, 再调用后者执行测试,模拟用户操作并记录结果,最终生成格式化 h t m l 报告与 pdf 文档报告,全程无需手动编辑代码,大幅提升测试效率与准确性。 这三个用力只是 new x agent os 强大能力的冰山一角。作为全球首个产品级开源通用智能体 os, 我 们的核心优势远不止于此。 skills 的 渐进式批录设计,让 agent 高效管理海量技能,无需担心上下文过载,将企业复杂业务应用的开发周期从天级缩减至小时级。 sandbox 所提供的虚拟机级别的强隔离环境,确保所有操作都在安全边界内执行,完美满足金融、政务等高危敏感场景的合规要求。 而标准化的 style 生态更让企业能够将宝贵的 s o p 和岗位经验沉淀为可赋用、可共享的数字资产, 既降低了对稀缺 ai 研发人才的依赖,又能实现行业最佳实践的快速赋用。目前, new x agent o s 已在多个行业的实际场景中得到验证,无论是 hr 招聘、财务核算还是软件测试,都展现出了革命性的效率提升与成本控制能力。 我们坚信,真正的 ai 民主化,不仅是让每个企业都能低成本拥有智能工具,更是让 ai 能精准匹配每个岗位的需求,成为每个员工的专属数字专家。 接下来,我们将持续开源更多的专用模型与 skills 模板,邀请全球开发者与企业共建开放、进化的智能体生态。 new x 源自女娲补天的传说,我们秉持着补全企业智能化短板、构筑数字劳动力基石的信念,致力于让每一个岗位都能拥有高效、安全、可信的专属数字专家。 我们已经迫不及待地想看到,你将用 new x agentos 打造怎样的智能化未来,让我们一起开启企业人机同的全新篇章。
粉丝319获赞1980

tiktok 上最近出现了一个非常火的项目, agent skills for contest engineering, 发布不到一周就斩获了二点三 k stars。 为什么它能瞬间引爆社区?今天我们深入来聊聊这个项目。你可能有过这样的经历,用 ai 编程时,明明给了足够的上下文,可 ai 要么答非所问,要么被永长的历史信息绕晕。最近 github 上的一个项目或许能解决这个痛点。 这个叫用于上下文工程的智能体技能的项目,发布不到一周就拿下了二点三 k 星。为什么他能这么火?我们从二零二五年末的技术背景说起, 这些年大厂白皮书里反复提到上下文工程,但对每天敲代码的开发者来说,那些理论太飘了。 我们需要的不是什么是上下文的论文,而是能直接用到 cloud code 里的工具。这个项目恰恰填补了这个空白,它把灰色的上下文管理策略打包成十个即插即用的智能体技能,借助 cloud 的 自动加载和触发机制, 让 ai 终于能像资深工程师一样自己管理内存。这就是一套上下文工程的最佳实践工具库。怎么理解它的核心逻辑?项目把上下文拆解成五个部分, 系统指令、工具定义、查找文档、消息、历史和工具输出。其中工具输出是最拖后腿的。研究显示,原始工具返回结果往往占了上下文百分之八十以上的体积,就像你电脑开了太多网页导致卡顿。 ai 的 上下文也有注意力,预算 一旦超支,性能就会下降。项目提出的渐进式路由策略就是解决这个问题的关键。初始状态下,智能体只读取所有技能的名称和简短描述,就像你手机桌面只显示常用 app 图标。 当你输入 prompt 后,智能体会自动进行语义匹配,找到相关能力,再加载详细内容。这跟操作系统的液交换机制很像,确保模型始终处理最相关的高信号信息。 你可能听说过 ai 的 迷失在中间现象,当信息放在上下文中间位置时,召回准确率比两端低百分之十到百分之四十。 除了这个,长对话里还会出现上下文中毒、干扰、混淆、冲突等问题。比如你先问 ai 怎么写 python 爬虫,再问怎么优化 java 性能。旧的爬虫信息可能干扰 ai 对 java 问题的回答。项目里提到的压缩优化技术能帮我们解决这些问题。 比如观察掩码技术,读取原文后提取核心结论,把原文从上下文里替换成引用 id, 这样上下文体积能骤降百分之九十。就像你把厚厚的参考手册换成一张锁影卡,需要时再去查详情。还有铆钉、叠带、摘药技术, 维护结构化的状态快,包括绘画意图、状态清单、决策记录和下一步行动向,让 ai 始终记得对话的核心目标。在多智能体协助场景里,上下文隔离很重要。比如一个项目分三个智能体, 写前端的,写后端的,做测试的。如果写前端的智能体看到后端的代码细节,可能反而会影响它的工作效率。 项目建议,每个子智能体只关心自己的任务,拥有专用工具,减少后选工具数量,实现故障阻断。 就像工厂里的流水线,每个工位只做自己的事,互不干扰。记忆系统也是上下文工程的重要部分。传统的向量检索有个时态盲区,它能找到相关的知识,但不知道这些知识的时间顺序。比如, ai 可能会把二零二三年的旧技术和二零二五年的新技术混在一起。 项目里提到的时态知识图谱就是给知识加上时间戳,让 ai 能区分旧方法和新进展。在工具设计方面,项目提出了一个反直觉的建议, 不要为每个细小功能写一个工具,而是把高度藕合的步骤合并。比如,你要做读取文件加分析代码加生成报告,与其写三个工具,不如合并成一个,这样能减少工具调用次数,提升效率。 项目还建立了完整的评估体系。智能体性能的百分之九十五变异由三个因素决定, token 使用量占百分之八十,工具调用次数占百分之十,模型本身选择占百分之五。这意味着优化上下文比换模型更能提升性能。 最后,项目给出了从 demo 到生产环境的五阶段流水线方法论。第一阶段,先用人肉方式跑通流程,再写代码。第二阶段,利用文件系统作为状态机,管理任务进度。这跟软件开发的最小可行产品思路类似,先验证流程可行,再投入开发。 通过这个项目,我们能看到,智能体开发已经进入了系统工程时代。以前我们可能只关注模型本身,现在发现,上下文工程才是构建确定性系统的关键。就像造房子,模型是地基,上下文工程就是框架, 没有好的框架,再好的地基也建不起高楼。这个项目的意义在于,它把抽象的上下文工程理论变成了开发者能直接用的工具,让更多人能用上高质量的智能体。说到这里,你可能会想, 以后 ai 会不会自己变得越来越会管理自己?我们会不会不再需要花太多时间调整 prompt? 这些问题或许会在未来的技术发展中找到答案。好了,今天的内容就聊到这里了,如果你有什么想法,欢迎在评论区交流,我们下期再见。

什么是 agent skill? 你 有没有遇到过这种情况?同样的提示, ai 每次给的结果都不一样,有时候好用,有时候完全跑偏。今天教你一个方法,让 ai 像专家一样稳定输出,而且还能跨平台复用。我们先来看一个真实的场景, 假设你录了一个视频,用 ai 自动生成了字幕,但字幕里有一些错别字,比如 cloud code 被识别成了克劳德 code, skill 被识别成了死狗。那怎么办呢?你有一份原始讲稿,想让 ai 对 照着讲稿,把字幕里的错别字修正过来,听起来很简单,对吧?我们来试试。 第一次,我给 ai 发送提示词,请根据这份讲稿处理这个字幕文件。 ai 回答了,改了一些地方。第二次,同样的提示词,同样的文件,结果呢? ai 这次改的地方不一样了,有些该改的没改,不该改的反而改了。第三次,每次结果都不同。这就是 ai 生成的不确定性问题。 同样的输入,每次输出都可能不一样。你可能会说,那我把提示词写得更详细一点不就行了?确实,详细的提示词能提高准确率。但问题是,第一,每次都要复制粘贴一大段提示词,很麻烦。 第二,提示词太长,消耗的 token 也多,成本高。第三,即便提示词很详细, a 的 随机性还是存在。那有没有一种方法能让 ai 在 执行特定任务时,始终遵循同样的规则,给出一致的结果呢?有,这就是 skill 技能。 skill 全称 agent skills, 最早是 antropica 在 二零二五年十月为 cloud code 推出的功能。 简单来说, skill 就 像是给 ai 写的一本操作手册,当你需要 ai 完成某个特定任务时, ai 会先翻阅这本手册,了解任务应该怎么做,有哪些规则必须遵守,需要调用哪些工具和资源, 然后严格按照手册来执行。这样一来,无论你执行多少次, ai 都会遵循同样的流程,结果自然就一致了。 回到刚刚的例子,如果使用了 skill 功能,同样的字幕校对任务重复多次,每次输出的结果都是稳定且符合需要的。那哪些 ide 支持 skill 呢?二零二五年十二月正式将 agent skill 发布为开放标准, 截止二零二六年一月。原声支持 skill 的 ide 有 cloud code、 cursor、 萃死、 anti gravity 等,但像 wind of kiro 这些主流 ai 编程工具并没有原声支持 skill 功能。这就要引出我们今天的主角 open skills。 open skills 是 一个开源项目,就像一个万能适配器,让所有 ai 编程工具都能使用跟 cloud code 一 模一样的 skill 技能。今天我们就以 qio 为例,演示如何通过 open skills 使用 skill。 open skills 的 安装非常简单,只需要一行命令,首先确保你的电脑上已经安装了 node js。 打开终端,输入 npm install gopen skills 安装完成后,可以批量下载 ansorex 港 skills。 然后在项目文件夹新建 agents md 文件,输入 open skill sync, 通过键盘上下键和空格选择要加载的 skill, 回车后即可加载到 agents md 文件中。 open skills 的 工作原理很巧妙,第一, skill 文件存放在 c 盘用户目录下的点 cloud 杠 skills 文件夹里。第二,在项目文件夹中生成 agents md 文件,记录要使用的 skill。 第三, ai, 读取 agents md, 了解有哪些 skill 可用。第四, ai 通过 open skills read 命令,按需加载完整的 skill 内容。这个设计的优势是 ai 不 需要一次性加载所有 skill, 节省 token。 skill 格式与 cloud code 的 完全兼容,任何能读取 agents md 的 ai ide 都能使用。 agents md 文件里会列出所有可用的 skill, 包括名称、描述和位置。 ai 只需要读取这个轻量级的目录,就知道有哪些 skill 可用。当 ai 决定使用某个 skill 时,才会去加载完整内容。回到开头提到的场景,我有一个字幕文件,里面有错别字,还有一份正确的讲稿。在 kiro 中我输入,请根据这份讲稿 处理这个字幕文件。 ai 会读 subtitle proof free 的 详细指令。了解,必须保持时间戳和换行格式对照讲稿只修正错别字,直接保存到原文件。 执行完成后,字幕文件中的错别字都被修正了,但时间戳和换行完全没变,而且无论执行多少次,结果都是一致的。这就是 skill 解决不确定性的实际效果。 来看第二个更实用的案例,从零开始创建一个视频讲稿生成 skill。 很多内容创作者都有这样的痛点,每次写视频讲稿都要反复调整提示词,才能让 ai 生成符合自己风格的内容,而 且下次换个主题又得重新调整一遍。如果我们能创建一个专属的 skill, 把自己的写作风格和要求固化下来,那就能一劳永逸了。第一步,加载 skill creator 到项目。 open skills 生态里有一个特殊的 skill 叫 skill creator, 它的作用就是帮你快速创建规范的 skill。 首先在终端输入 open skill sync, 在 弹出的 skill 列表中用上下键找到 skill creator, 按空格勾选,然后回车 终端显示 ad 的 skill creator to agents md current skills 一, 这样, skill creator 就 加载到当前项目的 agents md 中了。 第二步,使用 skill creator 创建 skill。 现在在 hero 中输入以下提示词,这份提示词既有这个 skill 的 作用说明,又有什么时候调用这个 skill。 同时还有对应的 skill 规则要求。 ai 开始工作几秒钟后,生成了完整的 skill 文件结构,包括 skill md 文件、 references 文件夹、 scripts 文件夹、 assets 文件夹。现在我们来看看这个 skill md 文件的结构,这是 skill 最核心的文件,它决定了 ai 如何工作。 打开 skill md, 你 会看到它分为两个部分,第一部分是原数据,文件开头用三个横杠包裹的部分就是原数据。这里有两个关键字段, name 是 skill 的 名称,必须与文件夹名称完全一致。 description 是 skill 的 描述,这是最重要的部分。 description 的 作用是告诉 ai 什么时候应该调用这个 skill, 写得越清楚, ai 的 判断就越准确。比如这里写了,当用户需要转载视频讲稿、口播文案、教学视频脚本时调用, ai 看到用户说帮我写个视频讲稿,就知道该用这个 skill 了。 第二部分是指令源数据,下面的所有内容就是详细的指令。这部分可以写得很详细,因为它只在 skill 被调用时才会加载。 指令部分,通常包括工作流程、 ai 应该按什么步骤执行规则要求必须遵守的规则、输出格式、结果应该是什么样子?注意事项,特殊情况的处一。比如我们这个 video script writer 的 指令部分就规定了,第一步,必须读取 references 文件夹里的参考文档, 开头钩子必须在二十秒以内。语言要口语化,适合口播,结尾要总结三个核心要点。这就是为什么使用 skill 后, ai 的 输出会如此稳定,因为所有规则都写在这里了。 skill 的 三层结构在文件中的体现是原数据层,包括 name 和 description。 始终加载 指令层是原数据,下面的内容按需加载。资源层是 references, scripts, assets 文件夹按需加载。 ai 看到提示词时,只会先读取原数据层,判断是否需要这个 skill。 如果需要,才会加载指令层,了解具体怎么做。如果指令里提到了要读取某个文件,才会加载资源层,这就是渐性式,譬如的设计, 既节省 token, 又保持灵活。第三步,添加参考文档到 resources 层。现在 skill 的 框架有了,但还缺少最关键的参考风格。我把之前写过的几份优质讲稿放到 references 文件夹里,这些参考文档就是 skill 的 资源层。 ai 在 生成讲稿时,会先读取这些文档,学习我的写作风格。关于资源层,除了 references 文件夹,还可以包含 scripts 文件夹和 assets 文件夹。 scripts 文件夹存放可执行脚本,比如 python shell 脚本 i 可以 调用这些脚本来执行具体任务。 脚本的代码不会加载到 ai 上下文,只会被执行适合处理文件操作、数据处理等自动化任务。 assets 文件夹存放其他资源文件,比如图片模板等,可以是代码模板、配置文件等。 ai 可以 提取这些文件作为参考。比如如果你的 skill 需要批量处理 excel 文件,就可以在 scripts 文件夹里放一个数据处理脚本, i 在 指令中会调用这个脚本,但脚本代码本身不占用 token, 这就是 skill 设计的巧妙之处。 references 是 独取的, scripts 是 执行的,各司其职。第四步,复制到局 skills 文件夹。现在 skill 创建好了,我需要把它放到局的 skills 目录, 让所有项目都能使用在 windows 系统上。全局 skills 目录是 c 盘用户目录下的点 cloud 杠 skills 文件夹,我把刚才生成的 video script writer 文件夹整个复制到这个目录下。第五步,使用 open skill sync 加载到项目。回到我的项目文件夹, 现在需要把这个 skill 加载到当前项目的 agents md 中。在终端输入 open skills sync, 这个命令会扫描全区 skills 目录,列出所有可用的 skill, 让你选择要加载哪些 skill。 我用键盘上下键选择 video script writer, 按空格勾选,然后回车终端显示 a, d, d video script writer to agents md current skills 二、现在打开 agents md 文件,可以看到新增了一条记录。 第六步,执行 skill 生成讲稿。在 kiro 中,我输入阅读这几个参考文件内容,帮我写一个关于 skill 技能的视频讲稿介绍,然后再提供我自己的讲稿思路。几分钟后,一份完整的视频讲稿出来了,开头有吸引人的钩子, 语言口语化,用了类比,结构清晰,完全符合参考文档里的风格。然后我们可以重复几次看,每次生成的结果,都是按照同样的流程进行执行, 从阅读搜索到参考 references 中固定文档,再最后生成文稿,按照一套我们规范好的流程执行。最关键的是,下次写其他主题的讲稿,只需要一句话,写一份关于什么什么的讲稿,那也就会按照同样的标准和风格生成。 你可能会问,这个流程看起来挺复杂的,值得吗?答案是,非常值得。第一次创建 skill 时,使用 skill creator 五分钟创建标准结构,添加参考文档 十分钟,复制到大局目录 sync 加载一分钟,总共十五到二十分钟。之后,每次使用一句话,调用 skill, 按一自动按照标准生成,不需要反复调整提示词,每次节省三十到六十分钟。而且这个 skill 可以 在所有项目中附用,分享给团队成员,持续优化和改进。 这就是 skill 的 第二个优势,一次投入,长期受益。讲到这里,你可能会想, skill 不 就是把提示词固定下来吗?表面上看是这样,但 skill 的 价值远不止于此。 第一,渐近式。譬如传统的提示词,无论多长,都会一次性加载到 ai 的 上下文中。这里有个关键问题, ai 的 上下文窗口是有限的,就像人的短期记忆一样, ai 一 次能记住的信息量是有上限的。比如,如果你同时给 ai 发送十个详细的提示词,每个都有几千字, ai 的 上下文窗口很快就会被占满,这时候要么 ai 会忘记前面的内容,要么你就无法再添加新的 skill 或信息。 而且 token 消耗越多,成本也越高。但 skill 采用了三层结构,原数据层只包含名称和描述,始终加载只占用很少的 token。 指令层是详细的执行规则,按需加载,只有被选中才加载。资源层包括参考文档、脚本等,按需加载,只有需要时才读取。这样设计的好处是节省 token, 降低成本。不用的 skill 不 会占用上下文, ai 的 上下文更清晰,不会被无关信息干扰,可以使用多个 skill。 即使有十个、二十个 skill, ai 一 开始只看到他们的名称和描述,不会爆掉上下文。举个例子,传统方式是十个详细提示词乘以两千字等于两万字,全部占用上下文。 skill 方式是十个 skill 的 原数据乘以五十字等于五百字。只占用这么多,当 ai 需要使用某个 skill 时,才会加载那一个 skill 的 详细内容,这就是按需加载的威力。第二,知识沉淀和团队协助。 skill 可以 把你的经验和最佳实践固化下来。 比如你摸索出了一套高效的代码审查流程,可以做成 skill。 你 总结了一套写作风格指南,可以做成 skill。 你 的团队有特定的工作规范,可以做成 skill。 这样,新人加入团队时,不需要花时间学习,直接使用 skill 就 能按照团队标准工作。 同时,网上有很多大神制作好的 skill 技能,大家也可以直接下载到本地进行附用,简直就是工作效率提升利器。第三,与 mcp 的 互补。很多人会问, skill 和 mcp 有 什么区别?简单来说, mcp 是 连接外部工具和数据,比如查询数据库,调用 api。 skill 是 教 ai 如何处理这些数据,比如如何分析,如何输出,它们是互补的关系。举个例子, mcp 可以 让 ai 连接你的日历,获取今天的日程。 skill 可以 教 ai 如何根据日程生成一份工作计划,两者结合, ai 才能真正成为你的智能助手。好了,今天我们深入讲解了 ai skill 技能,记住三个核心要点,第一, skill 解决了 ai 生成的不确定性问题,让结果稳定一致。 第二, open skills 让任何 ide 都能使用 skill, 包括 kiro 这样不原生支持的工具。第三, skill 的 价值在于知识沉淀和赋用,而不仅仅是固定提示词。如果你觉得这期内容有用,记得点赞、收藏、关注,我们下次见!

每天认识一款高质量开源项目第二百一十八期,最近 skills 特别火,但很多人搞不清楚它到底能干啥。给你举个例子, 做 ppt 的 时候,你可以把公司 logo、 品牌色、设计模板、产品图这些东西放进一个文件夹。然后呢,以后 cloud 做 ppt 时,可以自动使用你的 logo, 自动按你的配色来,模板也会参考你提供的图片,也会自动插入, 这就是 ansorepic 官方 skills 能做的事。问题来了,这些素材具体怎么配,自己的技能又该怎么写?今天就给大家分享三个开源项目, 帮你把 skills 这个东西搞明白。第一个项目,全中文的学习指南,把 skills 是 啥,怎么用,跟提示词有啥区别,讲得挺清楚,还把 ansorepic 官方那些英文博课整理成中文了,看着不累。 第二个更实用,四十来个真实案例,文档处理、数据分析多, ai 写作,这些场景基本都有 代码和注示比较清楚,我就是从里头找了几个例子改的。第三个 skillkit, 解决重复写的问题。 claude, cursor, copilot, 每个格式不太一样,同一个技能可能得写好几遍。 skillkit 写一次能转三十二种格式,我在用,挺省事。 学习路线可以这样,先看中文指南,了解个大概,再找几个案例,动手跑一跑,实践出真知。 skill kit 看情况,用多个工具的话可以试试,能省不少时间。

你是小阿八,正在用 ai 开发网站,为了让 ai 生成的效果更好,你告诉 ai 界面不要使用蓝紫渐变色,不要生成一大堆没用的文档,你要遵循公司的代码规范。阿八阿八,洋洋洒洒几百字 之后,每次开发网站时,你都要写这么一段又臭又长的提示词,太麻烦了。于是聪明的你开始想办法, 先把常用的提示词保存到单独的文件,每次手动投喂给 ai。 然后创建了资源文件夹,把公司的代码、规范、设计素材都塞进去,告诉 ai 参考这些去写。 接着你还写了一些脚本,让 ai 生成代码后自动执行格式化运行测试,提交代码到 get 仓库。最后再写着 agent 点 m d 文件,把所有规范和工作流程都写进去,让 ai 自动读取,你沾沾自喜, 嘿嘿,俺这套工作流堪称完美。但很快你发现了问题,随着规范越写越多,文档越来越臃肿,每次对话都要占用很多 ai 上下文空间,浪费 tokens。 于是你找到号称没有人比他更不懂 ai 的 鱼皮,求助阿爸阿爸,俺还能咋办啊?不是有 agent skills 吗?为啥不直接用呢? 呃,啥玩意儿?这可是最近 a h r 爆火的技术,下面我来带你玩转 agent skills, 让你知道它是什么,怎么用,有什么魔力,怎么自己开发。点着收藏,我们开始。 agent skills 是 astropic 推出的一套开放标准,目的是让 ai 能够学习使用各种专业技能,而不用每次都重复输入提示词。简单来说,它就是给 ai 装备的技能包,技能包里有精心设计的提示词、代码、脚本,还有各种资源文件, 把 ai 想象成一个职场小白,给他装上文档处理技能,他就立刻知道怎么生成 ppt 处理 excel 表格。装上代码规范技能,他就知道怎么按照公司的标准写代码。 你挠挠头,呃,等等,这不就是俺在做的事吗?把教 ai 做事的文档和 ai 要用到的文件打包成文件夹差不多,但 osropet 把它做成了一个通用标准,而且在实现原理上有一些新花样。 可恶啊,俺差点就改变世界了,这能有什么新花样?下面我先来带你用一下 agent skills, 再跟你说说其中的奥秘。 目前对 agent skills 支持最完善的工具是 asteroid 官方的 cloud code, 我 们就以此为例,安装并使用 skills, 先打开 cloud code, 并输入命令,添加官方技能市场。这就像是在你的 ai 助手里开通了一个技能商店,接下来你就可以从商店中获取技能了。 然后在 toloud code 中输入命令,安装官方提供的技能包。这着 example skills 包含了一堆官方势力技能,包括前端设计、网页测试、动图制作等等。 装完之后,你就可以直接让 ai 使用这些技能了。比如你要做一个网站,以前没装技能的时候, ai 生成的代码又是那个熟悉的蓝紫渐变色,千篇一律的 ai 审美。 现在安装了 front design 这个教 ai 生成专业设计版网站的技能后,你输入提示词,帮我开发个人作品及网站。 ai 会主动问你,我发现你安装了前端设计技能,需要用它来生成证据设计版的页面吗? 确认之后, ai 会利用技能生成代码,告别篮子渐变,生成独特风格的精美页面。我们不用每次都给 ai 输入一大堆相同的提示词,装一次技能就行了。 除了代码相关的技能,官方还提供了文档处理技能包,同样在 cmd code 中输入一行命令安装。 这只技能包里有 ppt 制作、 word 文档生成、 excel 数据分析、 pdf 解析等技能。接下来,如果你让 ai 做着 ppt, 它会自动调用 ppt 制作技能,直接生成排版好的 ppt 文件,帮你节省几个小时。 你好奇道,咦,为什么 stills 能做到安装即用?技能包里面到底有啥? ai 又是怎么知道该用哪个技能的? 好问题技能其实就是一个包含 still 点 m d 技能说明文件的文件夹,还可以包含可执行脚本资源和参考文档。 由于每个技能的复杂度不同,结构也会存在区别,我们可以在本地目录中找到已安装的技能文件夹。以官方的 ppt 制作技能为例,它的结构是这样的,包含一个核心的技能说明文档, still 点 m d, 还有脚本参考文档和各种资源文件。 而 front and design 前端设计技能只有一个, still 点 m d 文件。 still 点 m d 文件是每个技能的核心,它包含两个关键部分,第一部分是原数据,用 yam 格式写在文档开头, 其中 name 是 技能的名字, description 是 技能的描述,告诉 ai 什么时候应该使用这个技能。 描述写得越清晰, ai 就 越容易在合适的时机调用它。第二部分是指令内容,就是一套经过精心设计的提示词,指导 ai 具体怎么做。以前端设计技能为例,它的指令内容包括设计思考、前端美学指南和必称指南。 你挠了挠头,如果有多着 stux, ai 怎么知道该用哪个技能呢?如果把每个技能说明文的都塞给 ai, 不是 很占用上下文吗? 这就要说到渐进式批漏这个核心机制了。当你让 ai 执行任务时,它会先扫描技能目录,但不会把所有内容都加载到上下文中,而是只读取每个技能的原数据, 发现描述和任务相关,就知道该用这个技能了。然后才把完整的技能说明文档读进来,按照里面的指令执行,并根据需要加载技能包中的其他资源,用到哪个查哪个,既精准匹配又节省上下文,这就是渐进式纰漏的精髓。 所以 agent skills 的 本质就是把专业知识打包成一个文件夹,让 ai 按需读取并使用。呃,那除了 cloud code 之外,其他 ai 工具支持 agent skills 吗?俺平时用 curser 比较多, 当然能, agent skills 已经成为通用标准, curser、 west code code、 dex 等工具都支持。 skills 的 社区也非常活跃,你可以在 cloud skills、 hub 市场开源的 awesome、 cloud skills 等地方找到很多现成的技能, 比如有着叫 uiu 叉 pro max 的 技能特别火,专门用于提升 ai 的 设计能力。用法很简单,首先按照开源仓库文档的指引,安装官方提供的命令行工具, 然后进入到你的项目目录下,根据使用的 ai 工具执行对应的命令。比如我这里用 cursor, 它会自动把技能安装到 cursor 的 配置目录里,安装完成后,可以看到它的文件结构。接下来当你让 ai 开发一个网站时,可以使用斜杠命令手动触发技能,或者让 ai 自动识别技能。 ai 会根据你的需求识别出产品类型和需要的页面类型,然后调用设置点 p y 搜索脚本,在 data 目录里进行多维度搜索,找到适合的配色、字体、布局风格。接下来综合搜索结果,生成完整的设计方案。最后 ai 再按照设计方案生成代码, 这样一来,生成的界面既专业又有设计感。 ai 不 需要把所有规则都背下来,而是用到哪个查哪个,这就是 agent skills 的 精髓。 用了很多别人的技能后,你产生了一个大胆的想法,哎,能不能把公司的周报折式封装成一个技能,以后推荐给新来的同事,还能卖几个钱,嘿嘿嘿。嗯,有点东西,那你打算怎么做呢?当然是发挥程序员最擅长的事情。复制粘贴。 俺先复制一个官方的技能包,修改目录名称为自己的,然后修改技能说明文的 still, 点 m d 的 原数据指令内容这些关键部分。最后把公司的 logo、 ppt 模板爆照样例放在子文件夹里就行了。妈妈再也不用担心我的周报了。 不错不错,但其实有更简单规范的方法。在前面安装的 example stills 官方势力技能包里有一个叫 still creator 的 技能,专门用来帮你创建新技能。你只需要跟 ai 说,帮我创建一个专门生成公司周报的技能。接下来 ai 会问你几个问题, 你希望周报包含哪些主要部分,以什么格式输出?你通常会如何使用这个周报技能?希望周报的语言风格是什么?很快,一个完整的技能包就生成了,你会看到一个点 scale 为后缀的文件,本质上是一个压缩包,你可以把它解压到你的个人技能目录下,你的所有项目都能用。 如果你想让技能只在某个项目生效,可以把它放到项目的 cloud, 同步给项目组其他成员 测试。没问题后,你还可以把它开源到 github, 或者上传到 chaleo 的 stokes hub 这样的社区平台,让所有用户都能用,你开心极了。原来开发一个 stokes 这么简单,但是这玩意儿跟之前火爆的 mcp 和邪道命令有啥区别? 好问题, m c p 就 像给 ai 装上了手和眼睛,让 ai 能够连接外部工具和数据源,比如搜索网页、读取代码、仓库、查询数据库,适合需要获取数据或操作外部系统的场景。 而 agent skills 正像是给 ai 发了一本工作手册,把专业知识和工作流程打包起来,教 ai 在 特定领域该怎么做。 至于斜杠命令,它就像是快捷键,是需要你手动输入常按的命令来触发的固定操作。而 steils 的 特点是, ai 可以 自动识别该用什么技能,不需要你显示调用。对了,其实 mcp 和 steils 是 可以结合起来的。 举个例子,如果你想让 ai 帮你发周报, m c p 负责获取数据,从任务管理数据库拉取这周的任务列表。 skills 负责加工数据,把获取到的原始数据整理成老板爱看的格式,一个提供食材,一个提供配方, 你看这技能文件夹的结构,突然怪叫一声,阿爸,哈!等等,俺突然意识到一个问题,这不就是我们程序员玩烂的封装附用、模块化懒加载那一套吗?写几个代码文件,打着包发到网上,让其他程序员下载下来用 不是一回事吗?为什么 agent stux 能突然让整个 ai 圈为之疯狂?好问题,从技术的角度来看,它并没有发明什么惊天动地的算法。在我看来,它能火主要是两个原因。第一,它是开放标准,封装一次技能包后就能在各种 ai 工具里附用,还能通过社区共享。 更重要的是, stux 能立刻让 ai 的 工作更专业可靠,让普通人无感地享受到技术带来的价值。以前想让 ai 变聪明,你得学提示词、工程配置各种工具链。现在只需要像装 app 一 样安装技能包, ai 就 立刻变专业了。 一项技术的成功不在于它有多复杂,而在于它能让普通用户在不关注技术细节的情况下感受到技术的价值。 你点点头,学会了,学废了。降低门槛才是技术走向大众的钥匙。没错, agent skills 不 仅仅是个技术概念,更是一种新的工作方式。 你可以把它融入到自己的日常工作中,比如把重复的任务封装成技能,把团队的最佳实践固化成技能,让 ai 真正成为你的得力助手。 在这个 webtopod 盛行的年代,技术的门槛正在崩塌,而想象力的边界正在无限扩张。你可以在我免费开源的 ai 编程零基础入门教程中学到更多 ai 编程技巧,也欢迎关注鱼皮,学习更多 ai 和编程的技巧。那么问题来了,你最想让 ai 学会什么技能呢?

这是你朋友给你发的神秘工具,有的能生成好看的照片,有的能让 ai 越狱,还有的能一键复活。老大,离谱的 ai 用法总是离不开离谱的提示词和工具,渴望学习的你是在评论区找大佬分享,还是晚上偷偷来我家让我教你呢?其实这些都不用,因为这个 game 上爆火的 skills 项目可以解决一切问题。 不过在说它之前,我们首先要知道,最近全网吹爆的 skills 真的 那么万能吗?它背后的原理又是什么呢?小白又要如何用它?本期视频将带你一探究竟,同时也会分享几种离谱的玩法,建议各位在父母的陪同下使用。在使用之前,我们先来诉通一下 skills 究竟是什么。 二零二五年十月份的时候,一家叫 ansopik 的 公司先提出了名为 cloud skill 的 技术,然后基于这个技术又推出了 agent skill 开放标准,让起初只能在自家软件上使用的 skill 也可以在其他软件上使用。不 过即便这么良心,这个标准制作完成后,它还是不温不火。但是随着时间的流逝,它的好处也在慢慢显现,因为 skill 可以 很方便地分享给别人使用。于是有不少人自发的将自制的 skill 上传到 github 上,吸引网友下载, 结果好评如潮。有人夸他的功能非常离谱,有人夸他非常节省偷啃。这是因为他用了一种叫做渐进式批漏的技术, 也就像洋葱一样,一层一层一层的把提示词给 ai 看。例如,这是一个 pdf 处理技能,可以分为三层,第一层叫做原数据,包含技能的名字和描述。第二层叫做指令,这里写着给 ai 看的工作流,比如让他用什么工具从 pdf 中提取文本。 第三层是参考资料和代码,让 ai 在 执行工作流的时候按需阅读。所以相较于传统提示词按需加载的特性,让它不仅能实现复杂的功能,而且占用上下文的长度会更小,也就更节省。头等, 如果你没有听懂的话也没有关系,会用就可以,除非你对 skos 的 底层细节非常感兴趣。那么你可以看看这篇官方文档和架构图, 我在这里只讲它最核心的几点。那么接下来呢?我们讲讲 skills 有 哪些离谱的用法和技巧。我们先来看几个案例,例如你想做一个产品动画,只需要像这样抒你的需求,完全不需要你懂剪辑就可以达到很好的效果,还可以拿来做软件宣传片, 或者那种高大上的数据动态演示,是不是非常香?再看这个剪辑技能,它能帮你下载播客这类长视频,再剪辑出其中的精华,然后生成带双语字幕的短视频,还能配上发布文案,非常适合做切片。另外还有这个漫画技能,想要批量生成漫画,只需要输入一个编好的故事, skill 就 会将 ai 加载特定的提示词,让 ai 一 连串的执行操作,生成这样的效果,看起来是不是画面非常精美,还有分镜和对白。 最后再推荐一个去 ai 味的技能,要比我之前推荐的提示词会智能不少。这里还有一个技能,下载的排行,热门的 skill 都可以在这里找到。以上提到的技能链接以及安装教程我也都整理好了,放在了视频的下方,你可以自取。 看到这里,想必你对 skyo 有 了一定的了解,但我还想提醒的一点是, skyo 并非适用于任何场景,因为简单的任务提示词就够了,复杂的系统需要写代码才行。而 skyo 适合处理中等难度的任务, 当流程繁琐但又不值得为它开发一个 app, 使用它就好了。好了,以上就是本期视频的全部内容了,如果你觉得有所收获的话,不要忘记点赞收藏。最后,我是元宝,一台 ai 和黑科技的挖掘机,我们下期见!

兄弟们,这个项目真的太牛了, auto read book skills, 这是一个可以帮助你自动转写小红书笔记的 skills, 并且可以帮助你去自动转写,自动发布,还可以设置多种不同的主题,比如说你现在看到这些主题都是它自动生成的, 我们只需要通过一条命令去将这个 skills 安装到我们的 cloud code 当中,这时候呢,你就可以自动地去实现发布小红书,并且呢自动地去转写内容。这是一个我觉得很优秀点,就是你甚至都不需要自己登浏览器,因为你在这里面可以直接设置 你的 cookie, 哦,对吧?当我设置好 token 之后呢,实际上就会调小红书的接口,然后完成整个笔记的发布,包括笔记的内容,那当然你也可以选择手动的方式去调整, 那它的原理也非常简单,实际上就是通过 html 的 方式去组装出这种样式,最后通过 python 去渲染成图片,那通过这样的图片去展示,比如说像自动分页,包括我们指定尺寸,对吧?或者是说切换主题, 都可以通过这些脚板进行调整。那整个 skills 呢?目前都非常清晰的一个结构,大家可以看到,对吧?好吧,那就本期视频的全部内容,那我是小刘,我们下期再见。

最近 ai 圈爆火的 agent skills 到底是个啥?今天用三分钟给你讲,看完直接上手用。我们先上结论, agent skills 呢,就是给 ai agent 配了一个工具箱,里面呢全是你常用的工具和操作流程, 关键是这个工具箱它是你自己设计的。我们先来看一下这张图,以前呢, agent 它只有单技能的这个 mcp 可以用,它没有操作手册,我们呢,就只能自己手把手地去指挥 ai, 去调工具干活。在这种情况下呢,遇见相同的任务,就会经常地给 ai 发送重复的指令, 你说一句他动一下,而且每次都得重复说。现在呢,我们有了 agent skills 这样一个组合技能以后,我们就可以直接把那些常用的重复的操作写进这个 skills 里面,我们就像给 ai 做 sop 的 手册一样,下次呢,再遇到同样的活, ai 呢,它就会自动帮你干了, 你也就再也不用重复的折腾了。比如我这里列了三个技能,第一个技能,你看我们每日的热点筛选, 以前呢,我们都是逐个的让 ai 去做,或者自己搭一个工作流去弄,那这样的话门槛就高了。现在呢,直接可以把搜索分析、写报告、发邮件这样的步骤给他按照步骤执行就搞定了。 还有第二个技能,财报分析,找数据分析,评估预判风险,用代码生成报表。还有第三个技能,海报设计,你把你的公司的品牌规范设计要求都放进去,然后让 ai 按照要求去设计海报,我们呢,就可以把这些常规的动作都给他 打包进这个 skills 里面。如果这个不太好理解呢,我这里再举了一个游戏的例子,这张图呢,玩过王者荣耀的应该都比较熟悉了,你看王者呢,每一个英雄都会给他三到四个技能, skills 呢,相当于就是把这些技能给他配了一个固定的连招,比如三一二 a。 编好以后呢,我们再给他绑定一个咒语,下次呢,只要你一念这个咒语,他就会自动释放这个技能的。当然啊,现在的王者是没有这个功能的,我这里呢,就举个例子,方便大家理解。接下来呢,我们再来看一下这个 skills 他 具体长什么样子。 一个完整的 skills 呢,它主要包含以上四个文件,其中它的核心文件就是这个 skill md 了,我们来看一下它具体长什么样。那一个 skill md 呢,它主要有两部分构成,这个以上部分呢,是它的第一部分,也就是它的核心,然后第二部分呢,就是这一块, 就是他的内容。像第一部分这里呢,主要我们就要描述他的技能名称,还有这个技能的功能有哪些,以及什么时候去调用他。那下面这个部分呢,我们就描述指令使用场景,具体执行步骤,还有以什么格式输出,然后给他一个 demo 例子作为参考。 这里呢,我们就不详细的去聊了,感兴趣的小伙伴可以截个图。这里呢,我再补充一点,看,我这里提到了热点,需要根据我的人设进行匹配分析,那这个人设呢,我们就可以把它写进这个参考文档当中,那 ai 呢,就会从这个参考文档去读取人设内容去进行分析了。 如果你想对 skill 进行深入的了解,我们还可以打开这个 cloud 官方开源的 skill 的 仓库,自己进去看一下,它提供了很多模板,大家可以看一下它具体是怎么写的。那最后呢,我们说一下如何使用啊? 像现在除了 cloud code 以外呢,像 coser 去 open code 还有 codebody, 它们都已经把 skill 集成进去了,而且呢官方都有说这个东西具体怎么用,今天呢,你就可以把这个工具下载下来, 然后把你反复使用的那些操作写进 skills 里面来解放你的生产力。如果你用的是确的话,你看用这个就很简单了,你可以直接通过提示词告诉他,帮我去创建一份能审查我的代码效果问题的 skills, 然后呢 他就会去给你生成一个 skills 的 模板文件,看这里面的内容都写了,你遇到不符合的你自己修改就可以了。如果你觉得用代码来处理比较麻烦呢?他也提供了这种直接新建文件的方式, 就按照他的要求去填写就 ok 了。好了,我们今天的分享就到这里了,你也可以在评论区把你想写进 sketch 的 东西在这里分享出来,我们大家一起讨论,我们下期再见,拜拜。

谷歌 antigravity ide 现在终于支持 agent skills 了, 这是 open ai codex 支持 agent skills 之后,又一个 ai 巨头的编程之手,加入了 agent skills 阵营。所以说二零二六年正式成为 skills 元年。 ai 编程从传统的给 ai 编程工具一句提示词,让 ai 临时发挥, 升级为给 ai 编程工具装一套技能,让 ai 按照技能稳定产出代码。 agent skills 是 osopik 最初开发现已成为开放标准的智能体能力扩展格式。 它解决了一个核心问题, ai 虽然越来越聪明,但它缺乏你的领域知识,你的工作流程,你的最佳实践。 而 skills 的 作用就是把公司、团队甚至个人的工作流以及最佳实践,还有脚本等工具像模块一样打包进去,让 ai 编程助手等智能体按需加载,反复复用。所以我特别喜欢用一句话来区分 agent skills 和 prompt, prompt 是 临时指令,而 agent skills 才是长期资产。这次 anti gravity 支持 agent skills 的 意义非凡,尤其是对于非专业开发者,福利最大。 哪怕你完全不懂编程,不会写代码,也可以通过安装现成的 skills, 打造一个真正懂你业务的专属 ai 编程助手。 aging skills 的 本质就是 ai 专用业务手册,通过文件夹和 markdown 文件来打包知识工作流,最佳实践还有脚本、 ai 编程助手等 ai 智能体会,自动发现并且按需加载特定的 skills 来实现能力赋用,还有标准化, 而且是渐进式加载,从而避免上下文爆炸。好,本期视频教大家详显式我们如何在 anti gravity 中使用 agent skills 以及如何创建 agent skills? 并且我选择了一个最具代表性的 agent skills uix pro max。 我们将借助这个 skills 让 anti gravity 创建最为现代化,最为美观的 ui。 这个 skills 能让你在做界面时自动获得专业的配色,排版,布局,还有交互建议,来解决很多开发者做出的产品能用但不美观的难题。 好,想在 anti gravity 中使用 agent skills 非常简单。首先我们要确保我们已经将 anti gravity 升级到了最新版。 好,下面我们可以先测试一下在 antigraph 中使用 anselpic 官方发布的 skills。 anselpic 官方发布了多个 agent skills, 在 官方给出的这些 skills 中包含前端设计的 skill, 还有创建 ppt 的 skill。 下面我们只需要将这个项目克隆到本地。下面我们打开终端命令行,直接用 get 克隆的命令将这个项目克隆到我们本地。好,这里克隆完成,我们直接用 cd 命令进入到这个项目的路径。 根据 anti gravity 提供的官方文档,我们可以将 agent skills 放在这两个路径下,其中这一个就是我们当前的项目路径。如果只允许 agent skills 在 当前项目路径下加载,那么我们就可以放在我们当前的项目路径下。 如果希望 agent skills 在 所有项目中都能调用,那么我们就可以放在这个大局路径下。好,下面我们回到终端命令行,我这里直接用这条命令将 agent skills 放在官方推荐的这个大局路径下,我们直接运行就可以。 然后我们用 cd 命令进入到这个大局路径,然后用 l s 列出这些 skills。 好, 可以看到这里成功将这些 skills 都放在了这个大局路径下。 然后大家如果不习惯执行命令,也可以直接将这些 skills 文件夹全选复制,然后粘贴到 antigravity 存放 skills 的 这个路径下。像这样的话,在 antigravity 中,我们只要创建了新项目, 它都能调用到这个大局路径下存放的这一些 agent skills。 好, 下面我们就测试一下 ansopek 这一些 skills 中的前端设计 skill。 我们回到 anti gravity。 好, 下面我们就可以输入提示词,这里我输入的提示词是创建一个咖啡店的落地页,并且使用这个前端设计的 skill。 在 模型这里,我选的是 gemini pro 模型,因为这个模型非常适合用于前端 u i u x 设计。然后我们直接点击发送, 可以看到这里它正在搜索 skill。 这里它需要运行命令,我们允许它执行。好。非常神奇的是,它这里自动调用了 nano banana 模型来生成了这个网站所需要的这些图像。 然后我们点击打开,这是它生成的第一张咖啡馆内的这个景象的图像,这里放着一杯冒着热气的咖啡。这里它生成了第二张图像,这张图像是咖啡豆的图像,我们可以放大看一下。 anti gravity 自动调用 nano banana 模型来生成图像。这个功能是其他 ai 编程助手所不具备的,因为无论我们在使用 codex 还是使用 cloud code, 它们都不会自动来生成图像,而 anti gravity 它为我们开发这种前端 ui 的 时候,它能自动生成最为适配的图像。 好,这里提示这个咖啡馆落地页,这里已经创建成功,并且使用的是 next j s 还有 telenovela css。 然后下面我们就可以根据他给出的命令来运行一下,看一下效果。我们直接复制他给的命令, 然后打开 anti gravity 的 终端,粘贴这条命令,并且运行好,运行成功。我们直接打开这个链接,打开之后我们就看到了他为我们创建的这个咖啡馆的落地页面,然后这个页面的背景图像就是他刚才调用 nano banana 来生成的这个图像。 这里是这个页面的导航栏,可以看到设计的非常不错。然后我们继续往下拉,在这里他还将刚才生成了这个咖啡豆的图像 也加入到了这个页面中。可以看到它设计的这个咖啡馆的落地页非常精美,而且它用 nano banana 生成的这种配图效果也非常不错,这可以说是 anti gravity 独有的技能。 这样的话我们测试的是在 antigravity 中来加载已有的这一些 skills 项目。好,下面我们还可以测试一下手动创建这些 skill。 在 antigravity 官方文档这里,它给出了手动创建 skill 的 这些步骤,而且这里还给出了一个用于代码审查的最简单的 skill。 下面我们就可以使用官方给出的这个例子,在我们当前的项目路径下来创建这个 skill。 在 当前项目中,创建 skills 非常简单,我们只需要按照官方他给出的这个文件路径进行创建就可以 在 anti gravity 的 终端命令行,我们直接执行这条命令来创建用于存放 agent skills 的 路径。 好,这里创建成功,下面我们就可以将官方给出的这个案例放入到刚才我们创建的路径中,然后我们直接复制这个内容回到 anti gravity。 在 anti gravity 中我们就看到了刚才我们创建的这个路径,然后这里我们新建一个文件 昵名为 skill 点 md, 然后将刚才复制的内容直接粘贴并且保存就可以了。下面我们就可以测试一下调用这个 skill 进行代码审查,输入梯式词,使用 code review 审查当前项目的代码,然后我们运行可以看到这里它正在读 skill md 这个文件,正在分析这个项目的代码。 好,这里完成了代码审查,这里输出了代码审查的这个结果,这里还给出了用于优化这个项目性能的这些建议。这就是我们在 anti gravity 中通过手动创建 skill 并且调用 skill 的 方式。如果想创建更加复杂的 skill, 然后我们可以使用这个开源的项目 skillseeker, 我 在之前的视频中为大家详细演示过,然后如果不熟悉的话,可以查看我之前发布的这一期视频, 它可以一键将任何开源项目或者网站转为 agent skill。 好, 下面为大家演示这一款最强大的用于 u i u x 设计的 agent skill u i u x pro max, 而且它支持多种技术站,包括默认的 html 加 tailwind, 还支持 react next js, 甚至还支持 swift, react native, 还有 flutter。 想在 antigravity 中使用 ui ux pro max 非常简单,然后我们只需要按照官方给出的命令去执行就可以。我们直接先复制这条 npm 命令用于安装这个项目, 然后汇到 antigravity 中。我们直接在 antigravity 的 终端命令行粘贴这条命令并且运行就可以。好,这里安装成功。 下面我们就可以运行这条命令,针对 anti gravity 的 命令进行安装,然后在 anti gravity 的 终端直接粘贴这条命令并且运行就可以。好,这里提示已经安装成功。 在 anti gravity 中,我们只需要用斜杠命令就可以调出 u i u x pro max。 下面我们就可以来输入一个提示词。我这里输入的提示词是让它使用 react 构建一个 to do list, 要求使用拟物化的风格, 包括添加任务,完成任务,删除任务,而且还要具有柔和的阴影和微妙的紧身效果。然后这里我还是使用 jimmy 三 pro 模型,我们直接点击发送。像这样的话,在 anti gravity 中它就能够使用 u iux pro max 这个 agent skills 来获得 u iux 设计的经验还有最佳实践,从而为我们生成更加美观,更加现代化的 u i。 好 在等待了几分钟之后,这里完成了这个项目的创建,然后我们运行一下,查看一下效果。 可以看到这里他成功为我们开发出了这个你物的 to do list 的。 然后我们可以测试一下添加任务。注入这个任务之后,这里就会出现这个按钮,然后我们点击添加好,这里添加成功。然后下面的任务当完成之后,我们就可以点击完成,我们再添加一个任务测试一下。 好,这里添加成功,当完成之后,我们就点击完成。可以看到他设计的这个你物化的 u i 效果确实非常不错。 这样的话我们就实现了在 antigravity 中使用 u i u x pro max 这个 agent skills 项目实现 ui 设计。 agent skills 还有更多更实用的应用场景。 由于时间有限,本期视频只为大家演示了用于 ui 设计的 agent skills。 后续的视频中,我将为大家演示更多更实用的 agent skills 以及 agent skills 的 使用技巧和最佳实践。

我们来看一下我们自己写的 a 警的代码,它是如何去加载 skill, 简单的演示,我们来跑一下,是以交互的模式去跑的。哈,那我这边就拿这个来去做演示,我们给他一个啊链接,让他帮我们去总结这个平台的一个信息内容,开始 好,他开始总结了,总结的话,他这儿开始是 thinking, thinking 的 时候他会发现他需要用这一个技能,他就去加载了,把那个 bug down 加载到这一个上线文中嘛,加载完之后他会发现啊,他需要 去用脚本,他这个时候就执行脚本了,然后去爬虫嘛,爬虫完了之后把这个数据存成 markdown 或者 json, 存完了之后他再把这个 markdown 读,读到,读到之后放到上下文里面,这个时候他就开始总结了。最近 skill 真的 特别火,它是真的能够让 ai 变成专家,但是我看了十几个教程啊,全部都在教你怎么用, 有没有人想过他到底是怎么实现的?今天我不光要告诉你原理,我还要带你看一下一个能跑 skill 的 agent 是 怎么写出来的。好,下面我们看一下 skill 它到底是什么?我用一句话总结啊,他就是给 agent 装备了超级多的一个技能包, 那这个技能包它长什么样子?本质上啊,它是一个文件的结合,包含了一些啊说明书,依赖资源可以执行的脚本没有特别神奇的东西,就是一个固定的流程,能够去解决某一类业务问题,并且它不需要 ai 现场去写代码,也不会占用过多的一个上下文。 我们来看一下 skill 它的一个核心的一个原理。我们先来看一下 android 官方的一个 agent, 待会我们自己写的这个 agent 就是 按照这种设计来的, 从图的左边可以看见 agent 配置着各种各样的 skills, m, c, p, 核心的提示词等等。那图的右边就是这个 agent 本身是跑在我们的电脑上嘛,那 skill 又是存在文件系统中的,我们有各种各样的工具,比如说 bashpass 或者 json, 那 这就天然的给 agent 带来了一个环境,它就可以利用 skills 中的一个指令和外部环境去做很多编程类的一个任务。那我对这个 skill 的 核心原理的一个指令和外部环境去做很多编程类的一层,第一层 启动时,第二层,那触发时,第三层执行时。好,我们现在来看一下启动时它做了一个什么样的一个事情。 ok, agent 启动的时候,它会去扫描我们整个的一个 skill 的 安装目录嘛,去看一下它到底有哪些 skill, 把它们全部找出来,读取每一个 skill 的 原信息,也就是名字跟简介嘛,然后注入到整个系统的一个提示之中,那后续 agent 它就可以去按需加载 skill 了。 那这玩意儿啊,它是真的省托管啊,我们即使装一百个 skills, 按照一个 skills 一 百托管算的话,启动成本也才一万托管,这就是为什么这个 skills 它几乎可以无限的拓展。 好,我们下面看一下第二层啊,它这个触发时,那触发的话,它分为两种情况,第一种自动, 因为在 agent 启动阶段,我们不是已经把所有的 skill 全部注入到系统提示里面了吗?当我们让 agent 去干活的时候啊,他在推理阶段,他就发现啊,我需要这一个 skill, 他 就会自动去加载这一个 skill 更加详细的说明书,也就是那个 bugdown 文档啊。那第二种手动, 其实你也可以在提示时中手动去啊,让它啊,我要让你使用某一个 skill, 你 去帮我做这个事情, ok, 另外最近最新版的一个 curl code, 它已经支持了通过一个斜杠主动调起一个 skill 了,直接就可以出发了。 skill 加载了之后啊,它其实本质上就是把 skill 的 整个的一个说明书包含的一个指令内容,它全部放到了这个 a 阶的路谱的一个上下文中了,那进到了上下文中之后,它这就跟普通的提示词没什么区别了。 ok, 那 下面到第三个阶段,就是执行时,如果 agent 它加载了 skill 之后,发现当前的业务需求,它需要 skill 额外的能力,比如说有一些参考的文档,或者要执行一些捆绑的代码, 这个时候它就会按照 skill 的 markdown 的 说明书文档去做。你看这个图片里面哈,它就有 skill skill 的 markdown 的 说明,然后有一些脚本文件以及一些资源。 但是这个阶段哈,它不是一定会发生的,因为有的 skill 本身它可能就只有一个 markdown 文档嘛,不一定有其他的资源或者脚本。那下面就到了今天的一个重头戏,就是我们的 agent 代码的一个演示环节啊,主要分为两个部分,第一个部分 agent 代码加载 skill 的 一个运行演示,第二个就我们自己实现的这个 agent 代码到底是怎么写的? 好,我们来看一下我们自己写的 a 警的代码,它是如何去加载 skill? 简单的演示,我们来跑一下,是以交互的模式去跑的哈,跑完之后可以看到它这里有一些简单的输入信息以及一些命令嘛。那这个时候我们先看我们上面有其实有提到 他的分为三个阶段吗?第一个阶段是把 skills 全部拿出来去注入到系统提示词里面,我们来看一下我们的系统提示词是不是有这些信息。 ok, 可以 看到我们的系统提示词里面除了他本身那些能力以外,他帮我们把这个 skills 全部加载进来了,就是我这一个里面已经安装的。好,下面我们看一下他具体的 skills 哈, 可以看到他有这一些,那我这边就拿这个来去做演示,我们给他一个啊链接,让他帮我们去总结这一个平台的一个信息内容,开始 好,他开始总结了,总结的话他这开始是 thinking, thinking 的 时候他会发现他需要用这一个技能,他就去加载了,把那个 markdown 加载到这一个上下文中嘛,加载完之后他会发现啊,他需要 去用脚本,他这个时候就执行脚本了,然后去爬虫嘛,爬虫完了之后把这个数据存成 markdown 或者 json 存完了之后他再把这个 markdown 读,读到,读到之后放到上下文里面,这个时候他就开始总结了。整个过程就是这样子的,就这个接收到一个业务,然后由这个 agent 他 自主去判断 他需要哪些技能,然后这个技能他具体的指令是怎么样子的? skill 里面我们可以看一下这个 skill markdown 哈,这个里面其实有告诉我们的 a 技能他要去做哪些事情,他支持的平台是什么啊?他的一些依赖你要怎么去运行他这里面对应的脚本,那刚刚我们看到了这一个 a 技能里面的话,他就做了这个事情, 那我们自己写的这个 ac 呢?其实看起来也像那么回事,他也能去做到把 skill 把它注入到系统提示词,并且啊根据一个业务需求自己去匹配相关的技能,然后去做后续的一个动作嘛。 那下面的一个流程的话,就是带着大家一步一步的把我们这个项目跑起来,以及带着大家去理解这个代码是怎么写出来的,拿到这个代码之后,跟着我这个一步一步的操作就 ok 了。 好,下面我们开始吧,大家拿到我给你的整个 a 镜的元代码之后,进入我们对应的这个目录哈,然后去把相关的 pass 一 来安装一下,我这边是使用 uv 管理的,大家也用这个吧,我们来开始, 我们进入到工作目录之后,你直接 uv 信可一下把相关的一来安装了,那因为我这里已经安装过了,你到时候安装了会看到他安装很多包。 那第二步的话,我们需要配置一个啊, asp 的 一个 cloud 的 一个模型,因为这个 agent 我 还是跑在 cloud 官方的一个模型上的。我们先把这一个 环境变量这个复制一下,你选中复制,然后把它重命名一下,重命名成点 e n v, 因为这个是没有被 get 管理的,所以说你就可以大胆的在这边去写。那 这里的话我用的是一个呃,国内接口 i 的 中转啊,他们对标 open lut 的, 之前我的视频也有推荐过,他是国内只连的,你不需要模仿那 cloud 官方的模型的话, 你还可以打九折。为什么要用官方的模型呢?因为你如果用逆向的,他的那个 thinking 跟工具调用不一定支持,而且不一定是满血版的。我最近做的 agent 的 项目哈,如果需要用到国外的 cloud 呀, gpt 模型全部是用的他家的, 就你用多少算多少嘛,按量付费就还好,目前测试下来挺稳定的,可以到这个页面的上方有个 api key 管理,大家直接添加一个,然后你随便取一个名称,我就取一个 skill 吧, 点击确定,然后我们把这个复制直接粘回我们的代码里面, 按着我这个流程就可以了。其他的你不需要动啊,因为模型也放在这一块的,你不需要动就可以了。这个时候我们就开始来跑一下 uv run, 我 们看一下它可不可以。好,我们来看一下我们的配置有没有生效。哈喽,你有哪些能力 看一下它这一块是不是可以的?可以看到它已经开始回复了哈,到这个时候其实就已经配置成功了,因为我这个项目里面还把我们这一个新闻 t 区的这个 skill 也给你了,也给到你了,你可以直接去测试, 你给他一个这个平台的一个链接,你让他帮你总结一下,你看一下它能不能做到从加载这个技能,然后去发现里面的指令,以及去运行 这个目录下面对应的脚本,那你就会对整个的一个 skill 完全的去理解它整个的一个交互的一个过程了。那下面我们来看一下,就是这个代码是怎么写的。好,我们来看一下文档,其实这个代码也不难, 是基于 nink 去写的, nink 的 一个 agent 代码是用 react 去写的,然后我们定义了一些工具,这工具里面比较核心的两三个吧。第一个是 他呀,他得知道去加载技能嘛,你得给他一个技能名称,他要去加载模型,在内部去调这个工具,然后传一个呃 skill 的 名称过去。第二个就是 bash, 因为我们这一个 skill 里面他需要去运行一个 python 脚本嘛,去爬虫嘛,所以说这个命令需要。那第三个的话,就是你爬虫得到的结果是放在 skill 的 某一个目录下面,比如输出 markdown 或者输出 jason, 那 他需要这样的一个工具,那其他的话可以先不考虑。 那还有一个比较关键的是这一个 skill 的 一个加载器,因为你要让 agent 能够去发现你的所有的技能,这第一点,第二点你得让它去加载技能嘛,那第三点就是你如何把你的系统提示词注入进去,就把我们的 skill 注入进去嘛,那我们现在一步一步去看我们的代码哈, 好,我们来看一下我们核心的一个 agent, 代码入口的话就是这个 create skills 这个 agent 哈,它返回的这个类,那这个类的话,我们把代码折叠一下, 我们只需要去关注其中比较关键的几个哈,我们创建这个 agent 之后哈,你就可以去调用这个 agent 了,它背后就会去处理你的请求,然后去自动去推你做工具调用,就典型的 react 那 一套。 那我们比较关键看的就是两个部分,第一个这个工具的一个定义,第二个部分这个系统提示词,我们先来看系统提示词吧,系统提示词的话,这块它是掉了这个方法嘛?这个方法的话是先有了一个基本的呃, ai 工具的一个能力嘛,它是一个帮助助手, 紧接着它再返回了这一个我们的一个 skill 的 一个加载器,这个内里面的话就把我们的基本的提示词给它,给它完了之后呢,它帮助我们去扫描了所有的就是 skill, 就 包括你工作目录以及项目目录下面的 skill, 扫描完了之后把这个提子追加过去,也就是我们在前面实战,实战演示那个环节中,我们通过 prompt 看到它下面追加那部分信息, ok, 我 们继续返回。 好,对于这一个提子这块就很简单。那我们来看工具调用,工具调用的话,你先得定义工具吗?定义工具啊,这边定义了有这几个工具啊,主要看这两个吧。 那这个的话也是比较简单的,就是你传,因为这个是大拇指去调用的,对不对?大拇指调用了,它会传一个它需要知道的一个 skill, 它要去加载嘛?所以第一个参数自然而来就是你这个 skill name, 核心就是你传一个 skill 的 name 过来,我要保证 我能把这个 skill 的 这个 markdown 哈,把这个 markdown 给你读出来,然后返回就完事了,那这个工具就做这个事情,那下面呢?就是一个普通的一个命令行的一个工具了,命令行工具也不带着大家去过了,都比较简单,是用了一些传统的一个手法去运行命令啊,然后再返回结果。好,我们来看这个 skill 的 一个 核心的加载器这个类吧。这个类的话前面部分就定义了我们有哪些目录嘛?我这边定义了两个层级哈,一个是啊,我们的一个用户层级,就是你如果装了 curl code, 在 这个目录下面是会把所有的 skill 放到这下面去。第二个的话就是 有很多 skill, 它可能是针对项目而言的,你就放到项目下面去,就像我这个一样啊,我这个里不是有一个啊,新闻提取器吗?会给到大家用,所以我就把它放到了我们这个 get 项目下面去跟踪。那看一下这个类的话,其实 它的核心职责就比较简单,第一个先去扫描,就去发现这个目录里面所有的一个啊 skill 目录,然后去读它的那个 markdown 文档,把它原型记拿出来。第二个就是去加载,你给他一个名称,他帮你加载。第三个就提示词整体的实现其实 非常的简单,让 ai 去做一下就做完了。 ok, 那 这就是这一期视频的全部内容了,谢谢大家,拜拜拜拜拜。

这个社区两个月前每周新增的开源 agent skills 只有一千一百个,现在一周产生了接近五万个 skills, 并且开源 agent skills 的 数量已经来到了十万多个,难怪现在会有这样的梗图出现, skills 的 构建者可能比用户还多。 之前评论区有小伙伴问怎么找好用的 skills, 本期视频就分享一下我自己用于找 agent skills 的 工具 skill np。 这是一个独立的社区项目, 功能就是每周整合开源的 agent skills, 并将这个 skills 是 干什么的,有多少 stars of fox 以及压缩包提供出来,对 于 skills 的 使用者来说就很方便。如果想知道 skills 是 什么的小伙伴,可以看我的这期视频。这个社区默认会按 star 进行排序,也可以直接在分类中寻找自己感兴趣的 skill, 对 开发比较感兴趣的,就可以在开发的分类中找有意思的 skill。 ai 本身是没有创建文档的能力的,那我就可以找一个可以创建 word 文档的 skill。 这个 d o c x 看着就比较像,那就直接下下来,放到对应工具的 skills 目录下,用 code 的 话,这个目录在点 code 杠 skills 下,如果用的是 cloud code, 就 在点 cloud 杠 skills 下,然后你的 ai 工具就有 word 文档的创建更新能力了。 比如我让他帮我写好年终总结报告,同时生成 word 文档, ai 就 会先生成内容,然后调用 d o c x 这个 skill, 最后文档就生成好了, 也可以直接通过杠指定 skill 再让这个 skill 帮你干活。最近刚好还有个很热门的开源项目 cloud bot, 现在被要求改名为 mot bot, 这个智能体还能自己写 skills, 自己干活, ai 的 发展真的太快了。以上就是本期视频的全部内容了,我是鱼仔,我们下期再见。

大家好,我是小木头。如果你是一个开发者,你可能遇到过这样的场景, 花了几个月时间开发了一个很棒的开源项目,或者一个有意思的 sas 产品。代码写得很优雅,功能也很实用,但是没有人知道。 或许此时你需要一个推广视频,那传统的做法是什么呢?第一种,找设计师或者视频制作的外包, 但问题是他们不懂你的技术栈,不理解你的产品特色,你需要写很长的文档解释,沟通成本也非常的高。最后做出来的视频很有可能还达不到你的预期。 第二种,自己学习 after effects 或者 premium, 但是这类产品的学习曲线很陡峭,而且改一次要重新渲染,等半天。你是个开发者,不是设计师,为什么要花这么多时间在非核心的技能上呢? 第三种,用模板工具,比如 camera, 剪映。这些确实很方便,但太通用了,没办法体现你产品的技术特色。 或许这些都不是最要命的,最要命的是,你的产品会迭代,功能会更新,每次迭代视频就意味着要重新做一遍,这完全无法规模化。那有没有更好的方式呢? 今天我想和你分享一个全新的视频制作范式。开发者用 agent skills 生态来轻松地完成视频的制作,这不仅仅是一个新的工具,而且是一种思维方式的转变。 在视频分享中,我会用一个真实的项目来演示如何快速地基于代码仓库直接生成一个专业的推广视频。那现在我们就开始吧。 在近期的视频分享中,我们介绍了许多 agent skills 方面的内容,那它是什么呢?简单来说就是给 ai 助手预装的技能包, 就像 npm 之于 javascript。 agent skills 是 ai 助手的包管理器,你可以安装不同的技能包,让 ai 在 特定的领域拥有专业知识。 remotion 是 一款非常流行的视频制作工具,可以使用 react 来创建真实的 mp4 视频,非常非常的强大。感兴趣的朋友可以来到官方网站了解一下究竟它有哪些优秀的应用场景。 在一月二十号,他们就发布了自己的 agent skills, 使得开发者能够在 ai 场景中轻松地利用 remote 来制作视频,不需要了解 remote 的 技术细节,通过自然语言交互,就可以轻松生成非常精彩的视频片段。 那本期视频我们来寻找一个项目,看看它生成的视频效果究竟如何。我们就利用 session 这个产品来做演示,为它生成一份推广视频。 session 是 我最近开源的一款浏览本地 clockcode 绘画的桌面应用,希望能够以一种非常优雅方便的方式帮助大家浏览在本地众多的 clockcode 绘画。它会以项目为单元,组织过去所有的历史绘画, 在绘画中能看到所有的交流信息,不仅仅是 ai 的 响应,还包含了工具的调用,思考的过程。 大家也可以来到官方网站点击下载尝试,也欢迎大家来到代码仓库提意见,提合并请求。 作为一个新上线的项目,我希望呢能够为他做一款推广视频。咱们现在就来到 session 代码仓库,给他这么一个需求,我期望他阅读当前的代码仓库,了解这个项目的本质,抓住他的亮点和主要的功能和特性, 然后使用 remote skill 来生成一款推广视频。我们呢给他一些时间,看看他的生成效果。 到现在, remote 技能包完成了他的视频准备工作,现在呢,会启动一个开发服务器,我们可以在本地预览生成的视频效果。 在这个网页环境中,我们可以预览这个效果,如果没有问题呢,再在本地通过命令的执行来生成 mp 四版本的视频。我们先来看看它的效果吧, 大家觉得这个效果怎么样呢?我个人还是非常满意的,它已经抓住了 session 这个桌面应用主要的功能特点。对于目前这个项目来讲呢,这个推广视频应该足够了。当前呢, cloud 还在利用 chrome 开发者工具来测试推广视频的开发环境,我觉得已经很不错了,就让它终止了。 如果需要,大家还可以引入在过去视频分享中我们介绍的 ui ux pro max 这类技能包,对当前生成的这个视频的效果风格样式呢进行自定义, 尝试使用一些更加不同的风格来生成不同的推广视频版本,从而选择最符合自己需求,最满意的一款来推广。 我告诉他这个视频已经足够好了。接下来我想要生成 mp 四的版本该怎么做? 很简单,来到对应的目录,运行 mpm run build 就 可以生成 mp 四版本。在底下,它还给到了我们一些满足我们不同需求的视频规格,比如更高质量的,四 k 的 等等。我们就生成一个标准版的吧,大家来看看效果。 好了,视频生成,打开看看效果吧, 大家觉得怎么样呢?这跟刚才我们阅览的是一样的,如果期望更高清分辨率的呢,我们可以选择添加参数,在这里呢咱们就不再演示了,接下来我们或许可以再配上一些精彩的背景音乐,这样就有了一个非常非常完善的推广视频。 好了,今天的视频分享呢就先到这里,感兴趣的朋友一定要来尝试一下,特别是个人创业者,你的产品是否需要一款精彩的推广视频呢?除了找人帮你完成, 你还可以使用 remote agent skills, 非常方便的就能够帮助作为开发者朋友的你做出一款完美的视频哦。那大家在使用中有什么心得和体会,也欢迎在评论区给我留言。那今天的分享就先到这里,我们下次视频分享再见同学们,拜拜!

兄弟们,一分钟让你生成 ai skills, skill six 开源神器,能把技术文档 get up, 代码 pdf 自动转成 agent skills, 并且自动化检查冲突,使用场景非常多,根据对应的网站识别内容生成可以给 ai 使用的 skills。 接下来我们就实际操作一下,首先它需要拍摄环境才能使用,目前比较推荐的方式 使用 python 三点一版本。首先复制下面的指令,打开终端,复制粘贴安装 skillseekers, 返回,这样的结果就安装成功了,这里官方推荐也是使用 paper 进行安装,如何使用,这里也有详细的教程,感兴趣的可以学习一下。接下来我们就来实际操作。在我们开发中,比如要使用这个 tailwindx, 我 们想给我们 ai 有 它的 skills 就 可以使用这个开源项目。这个开源项目主要就是帮我们自动生成 skills, 我 首先准备好了 tailwindx 一 些获取的配置信息, jen 文件, 准备好这些信息是因为需要它会根据提供的这些信息自动化识别页面内容,然后生成 agent skills, 能让我们后续提高开发效率。然后复制粘贴这个指令,根据我们的 config 文件夹下的配置文件去生成识别 skills, 这样它就会去根据我们给的配置文件去自动获取内容生成, 最后生成完成,左边会多一个文件夹 skill 点 m d 文件是主进的文件, references 文件夹下的都是详细内容文档,这样你就生成了 tailwinds 的 skills, 你 也可以运用在比如识别 pdf 或者其他的技术文档中生成 skills, 感兴趣的赶紧收藏,防止找不到!

今天我来教你一个职场外挂,简单三步就可以让你把 github 上所有的开源项目变成你的专属的 skill 技能库。这些开源项目能帮你去做非常多的网页解锁,能帮你去下载视频,你能看到现在各种各样的格式工厂 其实都是拿这样的开源项目来去做包装的。但是有一个问题就是我们普通用户如果想用这样的 github 项目来去做包装的,但是有一个问题,就是我们普通用户如果想用这样的脚本,依赖用法等等等等,需要你在本地去部署,真的非常困难。 但现在我们有了一个神器叫做 skin, 它就可以帮你去解决这样的问题,它能把你的所有的脚本,你的用法,甚至的 prompt, 就 把它打包在一起,变成你的 a data 里面的一个技能。而现在这些东西你几乎可以用说人话的方式去用那些开源项目了。具体的流程呢,就非常简单,就三步,第一步就是用 ai 来帮助你找项目,比如说你有一个需求,但是你不知道有什么样的开源项目能满足你的需求,你就直接用嘴说就可以了。 第二步就是把这个项目一键进行 scar 化,比如说我们可以把 gitlab 链接丢给我们支持 scar 的 工具,然后让它帮你把这个 gitlab 变成一个 scar, 让你未来可以一键调用。 第三步呢,就一个小小的技巧,就是当你第一次跑完以后,一定会有非常多的 bug 和它的经验,又可以把这些经验直接更新进你的 scar 里,之后就不用再折腾了。 我拿最常见的需求来举个例子,比如说下载视频,你可以问 ai 有 没有那种能下 youtube、 b 站之类视频的这些开源项目,它大概率会给你一个风神级别的项目,叫 y t d r p, 这是十几万字的那种。接下来呢,你要做的事情就非常简单了,复制它的 github 链接,然后对着你的这些 agent 做一句,帮我把这些仓库打包成一个 ck 二,以后我只需 需要给你视频链接,他就能帮我下载。那我呢,一般会让他先做一些规划,比如说默认下载什么清晰度,存到哪里,文件怎么命名,失败了怎么重试,他会问你几个问题,你随便回答一下, 然后他就可以来开始生成 skill 了,等他生成完,你就试一次。第一次跑肯定会遇到各种各样的小麻烦,比如说网站风控很强,那需要你的 cookie, 比如说缺一些依赖,需要安装等等。别慌,这个时候就可以让 agent 直接代你搞定,跟着做就行了。然后呢,关键就来了,第一次折腾完,你别就完事了啊,因为这些经验都是非常宝贵的经验。你要对 ai 再说一句,把我刚才为了下载视频做的这些步骤和经验都写进这个 skinning, 下次就别再让我慢慢配了。 这一步做完,你的体验呢?它就真的完全变了。第一次可能需要几分钟的时间才能把一切搞定,把这个视频下载下来,后面再下视频,可能就只有十几秒钟的时间了,打开就能用,随开随下。而且这套玩法呢,根本就不只是下载视频啊。你想把网页项目一键打包成桌面的 app, 你 还想做一个究极万能的格式转换工厂,你就可以把这些真神级的 github 上面的项目全部封装进去, excel 就 能搞定你所有格式的转化。 你慢慢的就会意识到一件事啊,过去呢,我们要学很多很多复杂的工具才能把这些项目用上,而现在你是把全人类几十年的开源积累塞进你的技能库里面,从这个开始,你的能力边界就真的不再是你会不会,而是你真的想不想去做。

ai agent skills 的 数量爆炸式的增长到了十三万个主流的 ai 平台都支持了,包括最火的 open cloud。 作为程序员,我们首先是要去用 skills, 第二呢, 我们所有的软件项目可能都需要开发一个 skill, skill 甚至可以理解成是一个 ai 的 app 的 标准。在 skill 中呢,你其实可以去调用其他的程序,然后还有 m c p, 然后完成一个工作流这么重要的技术。我们通过对 skill 标准的分析,然后我们手写一个 skills, 并最终呢在 cloud open code cache 这里面运行。你只有写过和跑过,你才能真正理解一个技术,就是理解 skill。 作为 cgi 开发者呢,我是希望用 skill 去生成符合我要求的 cgi 代码, 并且呢用 skill 去实现我的代码的自动化构建和测试,这个在我的 cgi 大 项目课程当中准备体现出来。我们先看 skill 标准啊,它就是一个目录,其实也可以像我们 app 一 样以 压缩包的形式去安装。里面呢主要包含四块内容, skill d, m d 这个是必须的,而且名字是固定的,可以只有它,所以我们待会也是重点分析,还有三个可选项,这也没有固定的格式要求。 scripts 里面存放的是脚本,目前呢支持 python 和 bash, 我 们如果是用 c d i 写的程序呢,我们就用 python 的 脚本 来运行它。 reference 里面是渐近式的,譬如内容,这也是为了节省 token, 当满足一些条件时候再去读取。比如说我们让 ar 写 c 加代码用到现成词的时候,我们可以让它读取 reference 里面的一个规则, asset 里面就是一般是,还有就是资源文件,比如说一些图片,也可以是一些参考模板,比如说我们 cmake 的 标准写法。 ai 编程时代,我感觉项目可能还是尽量用 cmake 来管理比较方便。那我们重点来分析 skill 点 md, 它的内容呢?主要分为三层, 第一层是 y a m l 格式的,这部分其实就是 skill 高效的核心,在 skill 没有被调用的时候,我们是只加载这部分内容, 其他内容是在用的时候再加载,这样也是减少 token 的 使用。它里面有多个字典,而且这些字典可能后期会调整。我们说两个最核心的字典是必填的,一个是 name, 也就 skill 的 名字, 名字我之前看的要求是和 skill 的 目录一致,现在好像也不是必须,我们还是把它写成一致。下面就是 description, 它限定在一零二四个字节, ai 呢,再会根据你的描述 判断什么情况下触发你的 skill。 所以 说在这个描述当中呢,我们一般要包含三块内容,这也不是必须,第一个就是你的作用,这个 skill 是 用来做什么的,然后第二个是什么时间触发,第三个是关键词,就是在一些特定关键词的情况,下面我们去触发调用这个 skill, 我们做一个视例啊,手写一个 skill, 当然了这个 skill 本身也可以直接用 ai 生成,很多细节操作我们就不演示了, ai 时代呢,要学习它的根本操作方法,会不但变化,但原理不变。理解了 skill 的 本质,你就可以考虑怎么把它应用到你的项目当中。下次我们再演示一下 skill 和 mcp 的 交互, 我们先用 clode 来演示,后面呢我们再用 opcode、 coser 和确能演示。首先第一个在 clode 当中, 我们 cloud 目录下面有个点, cloud 在 里面,我们创建一个 skills 啊,这里面是 ai 可以 自动去生成的,你比方说你可以让它去生成一个 skills, 我 们在里面手写一下。好,这时候我们可以在里面建立一个目录,就是待会我们要做的这个 skill, 比方说我们这边是 现代 c 加加 modding cpp, 在 这个目录下面呢,我们创建一个文件,这个文件的名字是固定的啊,这个是必须要满足协议的,那我们就是 skill, 大 写的 skill, 而且也是区分大小写的 md markdown 的 格式啊,这样的话我们就是在这个位置创建的一个 skill, 具体怎么安装的,各个平台不一样,而且它一直在变化,有时候可能会自动安装一般,呃,自动安装它其实是有一定风险的,就是说你如果说在里面写了更太多的权限,其实会造成一些问题的。我们打开这个 skill, 好,三个横线中间我们就写它的关键字 name, 跟我们的目录名称一样,然后下面是描述,你在写完之后也可以让 ai 来帮你改,我们在描述中只要包含三块内容, 然后第一个做什么的,然后什么时候调用,使用新特性的时候,然后还有触发条件,一些关键字的触发条件,这个添加完之后我们就可以 cloud 当中去安装,我们直接用语义告诉他要安装这个 skill, 那这时候我们再来列出所有的 skill。 好, 可以看到这就是刚刚我们手写的一个 skill, 下面我们要测试这个 skill 里面的内容,而且我们要确保这个 skill 能被调用到。 所以说我们在这里面加入一段描述,其实就用自然语言描述就行了。比如说我先加一个步骤,让它所有在所有代码前加一个注示啊,这个主要是为了测试一下我的这个 skill 调用了,其实在这里面你应该是写一些规则和一些代码的势力,让 ai 按照你的规则来去写入啊。测试前我们再给一下这个 skill, 在这里面我们除了正常流程之外,我们再加入一个现成词的流程,也就是说如果说你要让它生成代码里面包含现成词,我们就让它去渐近式的批露 swift pool md 里面的内容,同样呢,在这个 swift pool 里面呢,我们也只是放在同一个目录下面 reference 里面, 在这个里面我们也不加入任何的代码,我们只是说明一下,在代码前加入这样一个注示,这里面用指令让它生成 c d r 十四的包含现成池的代码。可以看到在这一步的话,它就已经进行了 sql 的 加载,然后读了一个文件,这个文件其实就读的我们现成池的代码, 这是我们看它最终生成的代码是否包含了我们加的两行注示。 好,可以看到我们两行注是夹在了它的生成的代码前面,就是我,也就是我们 script 的 执行成功了,我们再来准备一个 python 的 代码,这个 python 代码当中调用的一个执行程序,这个执行程序就可能是我们 c 加加或者是其他语言写的程序, 然后我们在 skill 点 m d 当中,我们把流程里面增加两项运行这个 python 脚本,并且输出控制台的内容就是我们再来测试一下,这里我们直接通过杠命令直接运行 skill, 可以 看到它是完成了任务, 并且打开了我们这个执行程序,我们再把这个做好的模型到 open code 当中去运行。在 open code 呢,它的兼容性比较强,我们可以直接把 cloud 里面的 skill 直接复制过去,甚至不用复制,你告诉他在哪边,让 open code 再进行一下安装。 我们安装完成,我们在 open code 当中再去执行这个 skill 去生成代码, 可以看到代码生成呢,它也调用了相应的说明文件,并最终执行了这个执行程序。 我们再到 cursor 当中, cursor 呢,目前它是 skill 安装在当前目录的点 cursor, 然后 skills 目录下面,然后我们可以手动复制过去,也可以就直接用让它去自己去安装,把文件复制过去,所以在这里面我们选择了让它自己安装, 安装完成之后我们确认,然后这时候我们来测一下这个 skill 输入生成代码的指令, 我打开了执行程序,在 ctrl 当中呢也完成了我们 skill 的 执行。最后到确当中,我们同样执行一遍流程,先是安装,然后执行, 安装过程基本上是一致,我就发现很多功能体到最后的所有的工具都趋同了,现在哪个工具好用不好用,其实我们都可以去试一下。然后一些使用的方法其实我们是可以同步过去的,然后可以看到这个安装好之后我们同样去执行这个指令, 可以看到执行的执行代码生成的,然后我们的执行程序调用需要我们确认一下,确认完之后 它也完成了调用。我们现在开发出的应用除了要提供 skill 之外,也要考虑支持 m、 c p。 以后所有应用的入口都是 ai, 你 的程序是一定要给 ai 调用的。最后记得点赞关注夏老师, ai 快 速发展时代还是要打好根基,想要学习 c 加加的同学可以看一下评论区。


今天带大家学习 agent skill。 什么是 agent skills? agent skill 是 一个标准,是可以让 ai 按照约定的规则进行工作,说白了就是给 ai 出了一份规章制度和岗位要求, 甚至给了工具箱,也相当于一个较为灵活的工作流势令。和系统提示词不一样的地方是,对于 skill, ai 是 按需加载的,大大减少 toc 的 消耗,让 ai 保证一次性和 open code 等都支持了 agent skills。 asian skill 能做什么?那我们先直接看 cloudy 开源的 skill 仓库有哪些 skill 的 例子。打开官方仓库链接,点击 skills, 可以 看出它里面已经实现了很多常用的 skill, 比如创建新 skill 的 功能, skill creator, 还有前端设计,可以让 ai 设计创建指定风格的前端界面,可以避免千篇一律。带 ai 位的颜色界面, 还有 ppt 文档、 excel 的 创建、编辑和分析功能。 agent skills 如何使用?由于 cloud 扣对大多数国内使用者都有限制,所以我这里选择用 coder 来演示。来看看 coder 对 agent skills 的 文档说明。打开文档链接, 首先 coder 在 启动的时候就会自动加载 skills, 而且还支持项目级和权限的格式。 在项目里新建点 close 斜杠 skills 或者点 cloudy 斜杠 skills 文件夹,后续所有技能都放在这里了。一个 skills 就是 一个单独的文件夹,用 skill 的 名称命名,里面必须有一个 skill, 点猫当的文件用来说明这个 skill 的 功能和调用方式。 这里 cos 对 agent skill 没有细说,其实单独的 skill 文件夹里面还包含 script, reference, accessed 这些可用的功能,具体的说明可以看 agent skill 的 官方文档, 这里我就简单说一说。 script 存储 a 准可执行的代码,比如一个提取音频或文字的工具。 reference, 存储根据情况或场景需要时可以供 a 准查找的文档资料。 x x 一 些静态文件,包括模板、图片和数据文件。 现在我们来手动创建我们的第一个 skills, 打开 ctrl, 创建一个叫 learn new skill 的 skill, 是 用来给我制定学习某一领域知识的执行计划。先创建点 cloudy 斜杠 skill, 再创建 learn new skill, 最后创建 skill 点冒单的文件。 每个 skill 都需要有自己的 skill 点 mod 文件,这里让 ai 理解这个 skill 的 作用。 skill 点 mod 的 模板参考这里 开头的 name 和 description, 这里是必须要的。 name 是 skill 的 名称,只能使用小写字母或者中划线命名,而且必须要和所在的 skill 文件夹同名。 description 是 对该技能的描述,包括技能的作用以及何时使用。 而之后的正文内容并没有格式限制,只需要编辑有助于 a 准有效完成任务的内容即可。 这样我们就搜索好一个 skill。 那 现在我们怎么看 skill 能否被 cos 识别到?可以直接和 ai 沟通一下,探探他能看到的 skills, 能看到 ai 是 谁能识别到的。然后我们来试试这个 skill, 看效果还是能达到我的预期的。然后回答一下他的提问。 可以看到 a 准帮我生成的执行计划还是挺蛮详细的。 让 ai 做一个 skill 开源的 skill 仓库里有一个 skill creator 的 skill, 这里就是协助创建新 skill 的, 我们来看看如何使用,我们先从 skill 仓库克隆下来,把里面的 skill creator 拷贝到自己的项目里面, 现在尝试用这个 skill 帮我们创建一个识别文档错字的 skill。 好,根据 a 准的提问回答一下,明确我的需求。 好,现在 a 准就给我生成这个 skill 的 执行计划,也是蛮详细的。好,最后点击 build 生成这个 skill 免费的 skill 市场其实现在已经有很多各式各样的 skill 了,比如说看一下这个网站,这里面有包含了很多各各种的 skill, 然后找到你自己觉得合适的 skill 或者模改成自己的也可以的。我的分享完了,谢谢大家。我是阿瑶,一名尝试成长的独立开发。

这是一个从零到一构建 skills 的 完整方法和操作的流程,它可以让你彻底搞懂什么是 skills, 以及如何去使用。不管你是新手小白,还是说有一定的经验啊,我觉得它都有很大的一个价值。 视频最后呢你可以直接拿走,下面呢我们来看一下这个文档的主要内容。这个文档呢主要分为六个部分,第一部分呢是 skills 的 方法论好,也就是说我们在学习它之前呢,一定要了解一下它的一个定义, 以及它的一个优势,它能做哪些事情,它的一个使用场景是什么好在这个里面呢就有这个模型的架构,对应的呢就是 skills 的 一个文件的系统,打开这个文件夹就可以看到它的一个层级,包括下面呢有生态位的一个对比,跟它跟这个 mcp 跟工作流啊,到底有什么区别 啊?何时去使用啊?如果你是高频,每天高频重复的这个应用的场景就可以去使用, 包括有固定的这个题词,多步骤的操作。下面呢有给出的一个具体的案例,比如说场景一,你是代码开发中,你在代码开发里面可以去用它, 包括电商运营的批量生产线,这个呢就是说有固定的一个格式,包括我们的文案,我们的视频,这个呢就属于说批量生产这个内容好,本地支库。下面我们来看第二部分, 第二部分是什么呢?就是如何去使用了啊?从这一部分就开始如何去使用,那么这个使用呢,我们分了几个部分,那么现在第二个部分呢,就是标准的使用方法,也就是说什么意思啊?在 cloud code 里面 去使用,这个呢,也是当前来说,这个呃相当于满血版的这个使用的方式可以使用国际上顶尖的大模型,比如说 cloud 使用 gpt 的 大模型,而且呢,而且呢这个 skills 的 标准就是 cloud 的 公司他们去开发的,所以说咱们就使用它的 这个标准的,就是最完整的这个使用的方式,但是呢,他使用是有一定的门槛的,大家看这里对你的网络呢是有一定是有一定的要求。 第三部分就是在国内的这个编辑器,比如说吹编辑器去使用,那么这个呢门槛就相对就更低一点了,他对你的网络呢没有要求,而且他是可以去免费使用的,他使用的呢就是国内的大模型,然后怎么去使用呢?下面都有这个完整的流程。 好,如果你还想要再简单一点,那当然方法也是有的,直接在线版的使用扣子,直接去在线版使用,不用你去布置环境,也对你的机器没有任何的要求,只要你能上网就可以使用。而且呢他的一个使用的方式啊,其实是完全相同的,跟你在本地的,只不过呢,他是在云端的, 而且呢他也是只能使用国内的大模型,那么如何去使用呢?我们只要需要打开这个扣字编程,对吧?第一个阶段使用完全使用自然语言去生成你想要的这个 skills 的 他的一个技能,阶段二呢去修改,阶段三呢直接去发布,阶段四,然后就开始去使用。 好,这个呢就非常简单,我推荐大家啊,可以去试一下。好,第五个部分呢,就不是关于使用方面的一个介绍了,是关于我们 使用这个 skills, 或者说使用这个 ai 如何去落地的方面的一个介绍。你像我们平时啊,我们只会用这个提词词,对吧?包括我们大部分人,百分之九十的人都是使用提词词的方式去这个跟大模型去交流,那么这样呢,就缺少了中间知识库的一个层面, 这个知识库是什么意思?就是我们自己的一个资料,你自己行业的,包括你自己业务的方面的一个标准,还有你自己包括多少年的工作的一个经验,我们都需要打包成知识库,然后发给这个大模型呢,让他去学习。如果你没有这个呢,他就只能使用互联网上公开的 啊,比较普通的一些经验去给你去工作,那么这个效果就肯定会更差一点。如何打造呢?我们这边也有完整的视频的教程,大家直接可以去看一下。那么第六部分就是属于更高级的用法,就是如何去开发这个插件,对吧?这个呢就是如果你前面都学习过之后再去看这个。 好,最后呢就是这个最后总结就是我们如何去选择 skills, 还是就是我们在什么情况下去使用这个 skills, 还是在使用提词词加向量知识库的方式,那么这两种方式我们如何去选择, 对吧?中小企业,中小企业该怎么去选择?大家这个文档呢?给这个最后的这一部分,大家也要去看一下。好,这个呢就是完整的一个呃,文档,文档的流程,这个 skill 也是最新呢,最近呢刚出的一个 ai 的 技能,大家呢学习 ai 啊,一定要了解这个最新的技术,它的发展的方向, 那么了解这个方向之后呢,你看你自己行业适合不适合好,这个文档呢,也是我们经过这个几天的时间来打造的,而且所有的流程呢,大家看到这里边所有的文字都是我们经过实际的验证的,他确实是可以跑的通的好需要这个文档的呢,其实没有任何的套路,直接在视频下方说一下,直接就给你了。