当你不小心在 ps 后面加上个 s h, 进去后往下看,你就发现这里面藏着两万七千多种 agent, 全都是免费使用的 网页开发设计 agent, 还有自媒体的,甚至还有工作流的 ppt 的, 就没有你找不到的。我们找一个最近很火的 remotion best products, 然后我们直接复制它的地址,然后随便找一个 ai 编程工具帮你下载安装到本地, 从此你就本地部署了一个 ai 做动画的神器,以后你想做动画只需要动动嘴就可以搞定了。还有更牛的,给他一个 excel 表格,他还能根据你的表格帮你做一个动画,出来效果真的非常强,赶紧动手去用上它吧!还有更多 ai 工具也给大家整理好了,关注我,一起带你探索 ai 世界!
粉丝1.2万获赞7.4万

太炸裂了!创业居然跟玩游戏一样简单!这个工具可以把你所有的 skills 转化为格式化的三 d 地图。就像游戏界面一样,每个 agent 都是一个独立的小人,你喝着咖啡,这些小人就帮你把活干了。 拖拽就能分派任务,执行过程中,谁在干活,谁在待命也看得清清楚楚。你可以缩小查看大局进度,也可以放大聚焦每个细节。而且你想调整组织架构,只需要几秒钟的点击。拖拽可以遇见的是,以后你只需要选定了一批 skills 丢给他,立即开工,一个人就能支撑起一个庞大的公司。

这是你朋友给你发的神秘工具,有的能生成好看的照片,有的能让 ai 越狱,还有的能一键复活。老大,离谱的 ai 用法总是离不开离谱的提示词和工具,渴望学习的你是在评论区找大佬分享,还是晚上偷偷来我家让我教你呢?其实这些都不用,因为这个 game 上爆火的 skills 项目可以解决一切问题。 不过在说它之前,我们首先要知道,最近全网吹爆的 skills 真的 那么万能吗?它背后的原理又是什么呢?小白又要如何用它?本期视频将带你一探究竟,同时也会分享几种离谱的玩法,建议各位在父母的陪同下使用。在使用之前,我们先来诉通一下 skills 究竟是什么。 二零二五年十月份的时候,一家叫 ansopik 的 公司先提出了名为 cloud skill 的 技术,然后基于这个技术又推出了 agent skill 开放标准,让起初只能在自家软件上使用的 skill 也可以在其他软件上使用。不 过即便这么良心,这个标准制作完成后,它还是不温不火。但是随着时间的流逝,它的好处也在慢慢显现,因为 skill 可以 很方便地分享给别人使用。于是有不少人自发的将自制的 skill 上传到 github 上,吸引网友下载, 结果好评如潮。有人夸他的功能非常离谱,有人夸他非常节省偷啃。这是因为他用了一种叫做渐进式批漏的技术, 也就像洋葱一样,一层一层一层的把提示词给 ai 看。例如,这是一个 pdf 处理技能,可以分为三层,第一层叫做原数据,包含技能的名字和描述。第二层叫做指令,这里写着给 ai 看的工作流,比如让他用什么工具从 pdf 中提取文本。 第三层是参考资料和代码,让 ai 在 执行工作流的时候按需阅读。所以相较于传统提示词按需加载的特性,让它不仅能实现复杂的功能,而且占用上下文的长度会更小,也就更节省。头等, 如果你没有听懂的话也没有关系,会用就可以,除非你对 skos 的 底层细节非常感兴趣。那么你可以看看这篇官方文档和架构图, 我在这里只讲它最核心的几点。那么接下来呢?我们讲讲 skills 有 哪些离谱的用法和技巧。我们先来看几个案例,例如你想做一个产品动画,只需要像这样抒你的需求,完全不需要你懂剪辑就可以达到很好的效果,还可以拿来做软件宣传片, 或者那种高大上的数据动态演示,是不是非常香?再看这个剪辑技能,它能帮你下载播客这类长视频,再剪辑出其中的精华,然后生成带双语字幕的短视频,还能配上发布文案,非常适合做切片。另外还有这个漫画技能,想要批量生成漫画,只需要输入一个编好的故事, skill 就 会将 ai 加载特定的提示词,让 ai 一 连串的执行操作,生成这样的效果,看起来是不是画面非常精美,还有分镜和对白。 最后再推荐一个去 ai 味的技能,要比我之前推荐的提示词会智能不少。这里还有一个技能,下载的排行,热门的 skill 都可以在这里找到。以上提到的技能链接以及安装教程我也都整理好了,放在了视频的下方,你可以自取。 看到这里,想必你对 skyo 有 了一定的了解,但我还想提醒的一点是, skyo 并非适用于任何场景,因为简单的任务提示词就够了,复杂的系统需要写代码才行。而 skyo 适合处理中等难度的任务, 当流程繁琐但又不值得为它开发一个 app, 使用它就好了。好了,以上就是本期视频的全部内容了,如果你觉得有所收获的话,不要忘记点赞收藏。最后,我是元宝,一台 ai 和黑科技的挖掘机,我们下期见!

一句话讲透什么是 scale, 以及你为什么需要它。 scale 是 ai agent 的 外挂工具箱,让它能完成单靠模型本身无法做到的事。它将提示词与可执行代码封装成一个标准化的安装包。但 scale 的 最大的价值远不止好用两个字,它 实现了知识的资产化。它能将垂直领域的专家经验固化为可复用、可流通的代码技能,不仅实现了知识复利,更能让你的 agent 像拥有十年经验的行业老兵一样,精准拆解复杂问题, 而且越用越强。在聊具体的神级 skill 之前,必须先谈一个东西, skill 的 s h 它是 worso 官方推出的全球最大 skill 仓库,超过四万五千个 skill。 按下载量和热度实时排名,它解决了一个致命问题,重复造轮子。你不需要在本地攒几百个零散的 skill 文件, 你只需要像装 app 一 样一行命令就能把全球顶级开发者的 skill 推荐原 skill skill 的 skill 一、 skill creator astropica 官方出品创建 scale 的 scale 当你想把自己的独门知识、工作流程、行业经验写成一个专属的 scale, 就 用它。 使用方法极其简单。我想创建一个某某 scale, 它的工作流程是一二三。你只需要描述一个大概的想法,它就会自动帮你把临散的经验生成一个符合 agent 的 标准的完整 scale。 同时,你的知识不再是一次性消耗品,而是可以反复调用的数字资产。二、 find scales windows 官方出品寻找 scale 的 scale scale 的 s h 上有上万个技能,一个浏览器翻找对比下载太痛苦了。有了翻的 scales, 你 只需要说一句话, 帮我找一个写 ppt 的 scale, 帮我找一个能爬取视频的 scale, 它就会自动在 scale 的 s h 里精准匹配,列出最优选项,一键安装。下面我列出了全球下载量最高的前十个 scale, 覆盖前端、共生化、设计、美学、浏览器自动化、垂直领域开发四大方向,根据你的业务需求,按需安装即可。除了 cloud code, 还有哪些工具支持 scale 呢? scale 技术虽好,生态才是关键。目前主流厂商支持情况如下, asterisk cloud code 替零替对,目前对 scale 支持最好、最原生的工具体验最丝滑。 codex gemini cursor tree open code 也是支持的,为什么它比单纯的 prom 强得多?核心就八个字,动态加载、渐进、批漏。 整个过程是这样的,当你安装 scale 时, agent 并没有把几万字的说明书塞进上下文,它只记录了 scale 的 名称和简介。当你问帮我查一下数据库时, code code 路由器发现这匹配了 data bit scale 的 简介。此时系统才会动态提取该 scale 的 详细操作手册和脚本, 执行脚本,获取真实反馈,最后将执行结果返回给你。这套机制的精妙之处在于, agent 拥有了无限扩展的技能数,但平时又保持极度清亮的运行状态,用不到的知识不占资源,用到时瞬间满血加载。

hello 朋友们, cloud 十月份重磅发布了 skill 功能,已经过去了一个多月,我发现还是有很多朋友不太理解,甚至没有用过这个功能,所以本期视频会帮助大家彻底理解 skill 功能到底是什么,它有什么作用和玩法,以及它跟 m c p server sub agent command 的 区别以及优劣。那由于 skill 功能新出不久,除了 cloud code 之外,绝大多数 ai 编程产品还没有跟进, 为了让朋友们更好的上手,更好的去玩这个功能,本期视频使用的是国内唯一一家上了 skill 功能的 ai ide, 没错,是 ide, 没想到吧,它就是腾讯的 code body。 所以 大家并不需要非得使用 cloud code 才能玩 skill。 那 其实 skill 这个功能非常好的全释了我之前一直在说的 ai 编程工具并不是非要有编程基础,也不是必须得编程才能使用,它还可以做很多事情。 那本期视频也会从零到一的使用 code body 加 skill 功能,不写一行代码,使用自然语言交互,按照非技术人员的角度一步步做一个自动化流程的场景,朋友们无论是文科生还是技术小白都可以跟着思路去做一遍,相信你会发现新大陆 ok skill 到底是个什么东西呢?大家如果去翻看 cloud 的 官方文档,或者看很多博主对 skill 功能的介绍,你会发现大部分内容都在讲这是一个什么功能,以及它该怎么配置,怎么使用。但是我觉得如果想要真正把 skill 功能用好,不能只看操作手册, 我们需要从概念层面去理解这个功能到底是为了解决什么问题而诞生的 skill, 这个单词直译过来就是技能的意思。我们可以把触手状态的 ai 工具,比如 code body 或者是 color code, 想象成一个什么都不懂,赤手空拳的小孩子。 他很聪明,但他手里边没有工具,也没学过什么招式。这个时候所谓的配置 skill, 其实就是给这个孩子加点,给他加一个飞天的 skill, 他 就能上天。给他加一个遁地的 skill, 他 就能入地。 对应到编程工具里,这到底意味着什么呢?举个最痛点的例子,绝大多数的 ai 编程工具在处理文件时其实是文盲,特别是面对 excel 这种二进制或者是特定格式的文件时,直接甩给他一个 excel 文件, ai 通常是读不了内容的,这个时候 skill 就 派上用场了。我们可以做一个 excel 解析的 skill, 装进工具里。 当你再次选中 excel 文件发送时, ai 的 逻辑就变了。它会先调用这个 skill, 把 excel 里面的数据翻译成 ai 能看懂的文本格式,然后再去执行你的指令。 一旦理解了这个逻辑,朋友们的想象力就可以打开了。 skill 不 仅仅是读文件,它还可以是自动化脚本,比如生成一段爆款风格的视频脚本,也可以是工作流闭环,比如自动生成 ppt, 并保存到指定的路径。 所以 skill 的 本质其实就是让 ai 拥有了它原本不具备的手和脚,并且这个权限是给到用户的。也就是说,我们用户自己就可以给 ai 变成工具,增加更多的技能,让它可以做更多的事情。 我们直接进入实战演示环节,今天我们要完成的演示任务是在不写一行代码的前提下,委托 codebody 和 skill 做一个自动化任务的场景。我们希望当给出了一个主题以及参考文件后, ai 可以 调用相关的 skill 来帮我们自主调研解析文件,最终生成 ppt。 ok, 那 在开始之前,我们还是要先安装 codebodyid, 有 海外版和国内版,这里我们安装海外版,访问 codebody 官网,点击右上方的 log in, 直接使用 google 或者是 github 授权注册并登录。登录成功之后,我们再回到首页这里点击下载,然后我们根据自己的电脑处理器选择对应的版本进行下载安装就好了。安装完成之后,打开应用,选择中文。 酷狗也是基于开源 ide vs code 之上构建的,所以如果朋友们有在使用 vs code 或者是 cursor 的, 可以一键导入它们的配置,然后就是一路 nice, 最后点击登录会跳到网页授权登录,我们点击确认就登录完成了。 登录完成之后,我们直接点击 new folder, 创建一个空白的文件夹作为工作区。到这里我们的准备工作就做好了。 ok, 我 们简单介绍一下酷狗八 d 的 功能,相信大家或多或少都有接触过 ai ide, 那 酷狗八 d ide 也是类似的。右侧会有一个 ai 聊天窗口,它有两种模式,分别是 craft 和 ask 模式。 craft 模式用于自动帮助我们完成复杂的编码任务,类似 cursor agent 模式。 ask 模式用于帮助我们解答代码库以及其他编码问题。类似 cursor 的 ask 模式,它不会主动帮我们修改代码,我们有什么不懂的,可以在 ask 模式下问,然后在 craft 模式下让 ai 完成编程任务。 同时库拉巴蒂也支持计划模式。当我们在 craft 模式下打开计划模式开关后,发送问题, ai 会先帮我们列一个计划,我们也可以补充修改,最终确认了才会去执行任务。 模型选择的话,我们选择 default 就 可以,因为这个默认模型下支持的能力比较多。虽然不知道底层到底是用的什么模型,不过效果还不错。 ok, 我 们暂时先了解这么多,后面做任务时有涉及到,我们再介绍。大家可以思考一下,让 ai 去完成一个任务的核心是什么?没错,是 prompt 提示词。很多朋友觉得提示词设计是一个技术活,其实不是这样的。如果朋友们在二四年就开始用 ai 编程工具,你会发现最开始的提示词慢慢变得可以越来越像一个人的表达。 虽然目前达不到完全你和人的表达,但是现在的提式词设计也没有那么专业且复杂了。那我们就以一个技术小白的视角来帮助大家理解提式词设计的思路。首先,我们可以用一句话来描述我们的核心诉求, 我想做一个能够自动生成 ppt 的 cloud skill, 请帮我实现它。注意,这里描述 cloud skill, 而不是单纯的 skill, 是 为了让 ai 能够清楚地知道我们要做的是一个基于 cloud skill 规范的 skill。 其次,我们还需要交代任务背景。我经常要做 ppt, 有 时候是一个想法,比如分析一下新能源汽车市场,有时候手头有一些现成的资料,比如 pdf 文档或者 excel 数据表,那我需要基于这些资料产出 ppt。 我 希望这个工具能帮我一键搞定,这就是它的背景。然后我们还需要给出一些具体的要求。 第一,要能懂我的输入。如果我只给了一个主题,你要能自己去网上搜集资料,整理出内容。那如果我给你传了文件,比如 pdf 报告,或者是 word 文档,再或者是 excel 表格,你要能看懂里面的内容。 第二点就是内容要丰富,不能只有字,你要把搜到或读到的内容整理成 ppt 的 页面。最重要的是,如果你搜到或读到的内容里有规则数据,你要能把它变成图标,比如柱状图、饼图、折线图、流程图这些。 三、生成的 ppt 要好看。因为我不喜欢 ppt 自带那种丑陋的默认配色。我希望生成的 ppt 是 莫兰迪色系的,颜色要柔和,高级、低饱和度。每一页的背景不要是白板,要有一些简单的设计感,比如用两种柔和的颜色,渐变磨砂、毛玻璃这种背景特效,但不要太花哨,不能影响我看字。 最后,我们还需要描述出需要 ai 做什么,也就是给他的任务。那请根据我上面的描述,告诉我该怎么做这个 skill。 请用通俗易懂的语言列出会包含哪些功能,如果确认没问题,再帮我生成第一版的代码。请不要试图在一个 skill 中完成所有的工作,采用关注点分离的原则,每个 skill 只做一件事。 那最后这句话来源于 cloud 官网针对 skill 教程中的建议,这样一份简单基础的题词就做好了,我们只需要在其中清晰地表达出自己的想法,不需要太细致。大家要注意的是,这并不是一份最优的完善的题词词,但一定是一份还可以的基础题词。所以没关系,因为我们还需要让 ai 来完善一下。 ok, 回到 control 模式,发送基础提示词,等待 ai 的 回复。可以看到 ai 将我们的需求梳理了一下。那由于我们之前的基础提示词细节是不太够的,所以我们需要过一轮 ask 来让 ai 梳理。 那基于 ai 的 回复,我们可以再进行补充。这个补充可能是 ai 忽略掉的点,也可能是新补充的需求。那比如这里我们可以补充两条。 第一条,当深度搜索或读到的内容里面有规则数据,需要能把它变成图标,包括它不仅限于柱状图、饼图、折线图等等。第二条,用户输入可以只有主题,也可以只有附属文件,同时也可以两者都包含。你可以使用不同的 skill 来并发处理这些任务。 ok, 我 们需要等待一下 ai 的 生成。 ok, 我 们可以看一下整体的工作流程。 当确认无误之后,我们就可以切换到 craft 模式来让它帮我们逐步去生成。 这里由于任务量不小,所以我们需要等待一会儿。我们可以看到, codebody 在 创建 skill 时,其实也调用了一个叫 skill 杠 creator 的 skill, 这个 skill 是 用来帮助用户创建一个合格的 skill 的。 这说明库德巴蒂内部的工作流中也集成了一些 skill 作为扩展。这在 skill 没有出现之前还是比较麻烦的,因为之前想要扩展功能,大部分是靠方式拷令或者是 mcp 来实现,那有了 skill 之后,扩展一些能力就比较方便了。 ok, 执行完成之后,我们来看一下生成的这些文件内容。 可以看到点儿 code 八 d 文件夹下面有一个 skills 文件夹,这个目录其实就是 skill 的 配置文件。 cloud code 中是在点儿 cloud 文件夹下面,虽然配置文件夹名不一样,但是 skill 是 通用的,也就说这里生成的 skill 在 cloud code 中依然是适用的。 可以看到它帮我们生成了五个 skill, 每个 skill 只处理一种任务,组合起来就可以完成我们这个自动化的任务。 第一个是深度搜索的一个 skill, 它是用来帮助我们联网搜索并整理主题相关的资料。那第二个是莫兰迪美学的一个 skill, 用来提供莫兰迪配色和美学设计。那第三个是文档解析的 skill, 用来解析 pdf、 word、 excel 文件。 那第四个是 ppt 生成的 skill, 它是用来整合所有的输入,生成最终的 ppt 文件。那最后一个,也就是第五个是图标生成的 skill, 用于分析数据,并且推荐最优的图标类型,并生成。 下面的这些文件是它帮我们生成的相关文档。我们来看一下 skill 的 文件结构。 skill 点 m d, 这个是 skill 的 核心,也是必要文件,那除了这个文件,其他都不是必须的。那这个文件的组成是 skill 的 一个最小单元, 它定义了 skill 的 名称、用途说明,以及具体应该如何操作或执行。至于这个文件的内部结构以及内容该怎么写,我不建议大家记,也不建议大家自己去写这个文件。 a 生成它不香吗? access 通常放一些静态文件,比如图片,字体等等。 reference 通常放一些附加的参考文件。 script 用来放一些可执行的脚本,它还是蛮重要的,因为想要给 a 阵的扩展一些能力,大多都需要通过脚本来完成。那这三个文件夹都是可选的, 它们都是官方推荐的文件夹,命名分类我们也可以不遵守,因为所有的文件或者是脚本的调用以及执行,都需要直接或者是间接的在 skill 的 md 文件中写明。 ok, 那 接下来我们就来测试一下生成的这个 skill 的 效果。 我们直接拖进来一个 pdf, 然后选中这个 pdf 输入,请你调研 ai coding 行业现状,结合资料帮我生成一份 ai coding 行业报告研究的 ppt。 那这个文件是前段时间腾讯研究院出的一个 ai coding 的 非共识报告 pdf。 ok, 我 们输入完了之后,回车 可以看到 ai 帮我按流程调用 skill 来完成这件事情。这里需要注意的是,由于这里面涉及到脚本的执行,比如 skill 有 一个 python 脚本,那我们本地就得安装了 python 环境才可以执行成功。那如果大家没有装脚本的执行环境不成功的话, ai 会有提示, 我们可以根据提示去安装即可。当然我们也可以提前安装好环境,如果不会安装的话也非常简单。右上角先打开一个聊天框,使用 ask 模式去问 ai 应该怎么样安装,然后按步骤安装就可以了。 ok, 生成好之后,我们来看一下最终的 ppt, 目前还是有点问题的,我们可以基于现行 ppt 的 问题,然后再补充一下, 第一条是让 ppt 图标支持中文,第二条是让 ppt 里面的图标按比例缩放到合适的大小,那第三条是调研和解析 skill, 可以 并发执行。第四条是生成 ppt 之后移除掉多余的文件。 ok, 我 们等待一下生成结果。 生成好了之后,我们先把之前测试生成的这些文件删掉, 然后我们再次跑一下测试任务。生成好 ppt 之后,我们打开来看一下效果,哎,这次的效果还可以,比上次要好很多。 效果还行,但是整体的 ppt 结构不是很完善,所以还需要补充优化一下。那优化的思路也很简单,比如这里我们需要强化 ppt 的 结构,如果我们不知道怎么表达,可以直接先打开一个聊天框,选中 ask 模式,然后输入一个完整的 ppt 应该包含哪些模块。回车, 可以看到 ai 帮我们列出了 ppt 的 组成模块,哎,我们就可以切换为 craft 模式,让 ai 基于它说的去优化。我们还是要等待一下 ai 的 生成结果, 那生成完了之后,还是要重复之前的步骤,把之前测试生成的一些文件先删掉,然后再重新执行一下测试, 把文件拖进来,还是原来那个问题。回车, ok, 生成完了之后,我们再次打开看看效果,那这次生成的 ppt 内容也符合常规的 ppt 结构,还可以,那整体也还行, 那整个 ppt 生成的思路大概就这样,我们还可以继续迭代优化,比如扩展一个专门用于 ppt 背景生成的 skill 来制作好看的 ppt 背景,渐变背景、抽象艺术风格背景等等等等。那无论使用脚本生成,还是直接使用用户给定的背景图都行。 也可以梳理一个 ppt 的 文本排版结构,让 ppt 的 内容结构更规范,看上去更统一一点。 呃,同时,我们还可以约束 ppt 生成的内容,根据不同的 ppt 主题使用不同的字体。甚至也可以结合图像生成的 mcp server, 按照 ppt 主题动态生成一些图片,插入到 ppt 中。甚至,如果你不知道怎么优化,可以让 ai 读一下当前的 skill, 给出一些业务上的优化建议,再根据他的建议去问 ai 要方案,最终再让 ai 去生成。我们只做一个无形的打字机器,然后等待 ai 生成内容,然后不停地去 review 就 可以了。大致思路就是这样。 其实很多人会问, skill 和 m c p server, sub agent, command 到底有什么区别?这几个概念确实容易混淆。为了直观区分,我们用钢铁侠做比喻,把 ai 工具中的 agent 理解为托尼的贾维斯战甲系统。 某天,托尼给战甲装上了一个掌心炮。当托尼说贾维斯解决前面那个敌人,贾维斯通过分析知道老板想干架了,于是自主决定调用掌心炮去射击。这里的掌心炮就是 skill, 它是战甲的一个具体能力。 那托尼心血来潮了,还可以给战甲增加镭射炮、电磁脉冲等等,这些都是 skill。 用不用 skill, 怎么用,通常是 ai 思考用户指令后决定的。 ok, 接下来,托尼给贾维斯写死了一条设定,当自己明确喊出自毁程序启动时, 贾维斯不需要思考,也不允许反驳,必须立刻锁死盔甲,销毁数据,然后自爆。这就是 command 自定义指令。甚至托尼还可以设置一个快捷指令,比如大喊发射,就直接触发掌心炮。跳过贾维斯的思考过程, command 和 skill 的 功能区别就在这儿。 command 是 人类的强制命令,它是为了快捷执行一组写死的动作, 那这组动作里当然也可以包含 skill。 后来,托尼觉得贾维斯要干的事情太多了,又要管飞行,又要管能量,脑子不够用。为了给贾维斯减负,他制造了一个独立的卫星系统维罗尼卡,也就是复联二的反好客装甲。这个系统有独立的判断力,当好客发疯时,贾维斯只需要发个信号,维罗尼卡,该你上场了。 然后维罗尼卡就会全权接管。他怎么组装零件,怎么锁住好客,怎么修补战损,全是维罗尼卡自己在算。贾维斯不需要操心,这个专门用来处理好客发疯问题的独立系统,就是 cyber agent 自智能体。 最后,托尼想让贾维斯变得更强大,但他发现,想连接神盾局的数据库需要破解密码。想要控制银河护卫队的飞船,还得重新学习外星语言,而且还得有这个权限,太麻烦了。 于是,托尼和神盾局、银河护卫队坐下来,商定了一个全宇宙统一的接口标准。那神盾局说,我按照这个标准开放数据。银河护卫队说,我按照这个标准开放飞船的控制权。而贾维斯只需要装上这个 m c e 接口,就能读取神盾局的机密,或者是驾驶外星飞船。 当然,托尼自己也遵循 m c p 规范开放了接口,神盾局的电脑也能反过来读取贾维斯的数据,这就是 m c p。 它是一个开放的万能协议,可以让不同的系统、不同的公司之间能够像叉 usb 一 样共享数据,共享能力。 听完这个类比,我相信大家在打开 ai 工具的配置页面时,脑海里就有画面了。 skill 是 贾维斯的工具库,它决定了 agent 可以 干什么事情。 command 是 贾维斯的快捷指令,它可以强制 agent 不 经思考的干一些事情。 sub agent 是 贾维斯的帮手,它可以帮助 agent 分 担一些特定任务。 m c p 是 贾维斯的万能插头,它可以帮助 agent 连接外部世界。 ok? 为什么大家会混淆这几个概念?因为它们在功能上有重叠,甚至我们可以用四种方式来达成同一个目的。 那就以解析 excel 表格为例,你会发现四条路都能走通。我们可以给 agent 做一个 skill, 这个 skill 会执行 python 脚本解析 excel agent 想看 excel 数据时,直接调用这个解析的 skill 就 可以了。 我们也可以给 agent 连接一个解析 excel 的 mcp server, agent 通过标准接口把文件发过去,对方解析完再把数据传回来。当然,我们也可以写死一个指令,比如斜杠 pass excel, 当输入一个流程,直接运行脚本,把表格转成文本。 我们甚至还可以做一个专门做数据分析的 sub agent, 当选中 excel 文件时, agent 就 会把它交给 sub agent。 sub agent 可能自己写了段代码,或者是调用了些工具来把数据搞定。 这四个功能都可以做到这件事,那既然都能干,它们的本质区别到底在哪里?这就要聊到它们是为了解决什么问题而诞生的。 command 是 为了确定性。虽然我们喜欢用自然语言跟 ai 聊天,但是在某些时刻,自然语言是低效而且危险的。比如你想重置对话,你总不能说请帮我把之前的记忆都忘掉。你肯定想更简单一点。 诸如此类需要的系统级操作,比如保存、退出、格式化,我们需要百分百的确定性。 command 的 诞生就是为了绕过 ai 的 思考过程,它是一种上帝模式的介入,为了保证关键操作绝对准确,绝对快速,必须由硬代码直接接管,而不是让大模型去猜要不要调用。 m c p 是 为了互操作性。它是 ai 时代的 usb 协议,只在终结各自为战的局面,因为只要大家都遵循这个协议,一次开发就可以处处运行。它可以让 ai 的 跨系统操作不再有壁垒。 skill 是 为了扩展能力,它的诞生是为了给 ai 这个大脑装上手和脚,让它能够联网获取最新信息,能调用代码精准计算,能读取文件,获取事实。它的核心目的是让 ai 做一些现实的操作。在这之前的一些 ai 产品可能会使用 function calling 扩大大模型的能力,但 skill 不 同, 它可以让用户自己去定义技能,扩展 agent 的 能力,这点 mcp 也可以做到。但是相比之下, mcp 太复杂了,那有了 skill, mcp 只需要专注于外部互联这一件事情上。 最后的 sub agent 是 为了分工协助。当我们只有一个主 agent, 会存在两个非常严重的问题,第一个是角色冲突。当我们让 agent 既做产品经理又做程序员,在同一个对话框里,一会聊这个,一会聊那个, ai 很 容易精神分裂。 第二个是记忆混乱,当一个上下文窗口过大时,就会出现长上下文的注意力衰减的问题。之前聊得记不住了, sabotage 的 诞生就是为了效仿人类的分工,协助每个 sabotage 只做某种类型的任务,并且每个 sabotage 都有单独的上下文,那现在你清晰了吗? ok, 朋友们,回顾一下本期视频的内容,我们介绍了 cloud skill 的 概念以及 skill 和 mcp、 sabotage、 command 的 区别。 同时我们实战了一个小伎俩,没有去肯福达的 api 文档,也没有写一行代码,只是动了动嘴,告诉 codebody 我 们想要什么,然后做成了 skill, 让 ai 真正拥有了自动做 ppt 的 手脚。这就印证了我在视频开头说的那句话,在 ai 时代,编程工具不再是程序员的专属, 是每一个有想法人的魔法杖。当你学会了 skill, 就 等于学会了怎么给你的贾维斯制造掌心炮,你还可以给他接上不同的 m c p server, 或者是直接组一个 safari agent。 这一切的起点都从你亲手定义的第一个 skill 提示词开始。所以别光看着了,赶紧去试试吧。那如果大家不习惯, cloud code codebody 是 目前国内唯一一家能够体验 skill 功能的 ai ide, 大家也可以自行下载体验。无论你是想做自动周报生成器、小红书爆款文案生成,还是股票数据分析等等等等的 skill, 请打开你的脑洞。 如果你做出了好玩的 skill, 欢迎在评论区分享你的创意,这里是不正经的前端,如果你觉得这期视频对你有帮助,请务必一键三连,我们下期再见,拜拜!

tiktok 上最近出现了一个非常火的项目, agent skills for contest engineering, 发布不到一周就斩获了二点三 k stars。 为什么它能瞬间引爆社区?今天我们深入来聊聊这个项目。你可能有过这样的经历,用 ai 编程时,明明给了足够的上下文,可 ai 要么答非所问,要么被永长的历史信息绕晕。最近 github 上的一个项目或许能解决这个痛点。 这个叫用于上下文工程的智能体技能的项目,发布不到一周就拿下了二点三 k 星。为什么他能这么火?我们从二零二五年末的技术背景说起, 这些年大厂白皮书里反复提到上下文工程,但对每天敲代码的开发者来说,那些理论太飘了。 我们需要的不是什么是上下文的论文,而是能直接用到 cloud code 里的工具。这个项目恰恰填补了这个空白,它把灰色的上下文管理策略打包成十个即插即用的智能体技能,借助 cloud 的 自动加载和触发机制, 让 ai 终于能像资深工程师一样自己管理内存。这就是一套上下文工程的最佳实践工具库。怎么理解它的核心逻辑?项目把上下文拆解成五个部分, 系统指令、工具定义、查找文档、消息、历史和工具输出。其中工具输出是最拖后腿的。研究显示,原始工具返回结果往往占了上下文百分之八十以上的体积,就像你电脑开了太多网页导致卡顿。 ai 的 上下文也有注意力,预算 一旦超支,性能就会下降。项目提出的渐进式路由策略就是解决这个问题的关键。初始状态下,智能体只读取所有技能的名称和简短描述,就像你手机桌面只显示常用 app 图标。 当你输入 prompt 后,智能体会自动进行语义匹配,找到相关能力,再加载详细内容。这跟操作系统的液交换机制很像,确保模型始终处理最相关的高信号信息。 你可能听说过 ai 的 迷失在中间现象,当信息放在上下文中间位置时,召回准确率比两端低百分之十到百分之四十。 除了这个,长对话里还会出现上下文中毒、干扰、混淆、冲突等问题。比如你先问 ai 怎么写 python 爬虫,再问怎么优化 java 性能。旧的爬虫信息可能干扰 ai 对 java 问题的回答。项目里提到的压缩优化技术能帮我们解决这些问题。 比如观察掩码技术,读取原文后提取核心结论,把原文从上下文里替换成引用 id, 这样上下文体积能骤降百分之九十。就像你把厚厚的参考手册换成一张锁影卡,需要时再去查详情。还有铆钉、叠带、摘药技术, 维护结构化的状态快,包括绘画意图、状态清单、决策记录和下一步行动向,让 ai 始终记得对话的核心目标。在多智能体协助场景里,上下文隔离很重要。比如一个项目分三个智能体, 写前端的,写后端的,做测试的。如果写前端的智能体看到后端的代码细节,可能反而会影响它的工作效率。 项目建议,每个子智能体只关心自己的任务,拥有专用工具,减少后选工具数量,实现故障阻断。 就像工厂里的流水线,每个工位只做自己的事,互不干扰。记忆系统也是上下文工程的重要部分。传统的向量检索有个时态盲区,它能找到相关的知识,但不知道这些知识的时间顺序。比如, ai 可能会把二零二三年的旧技术和二零二五年的新技术混在一起。 项目里提到的时态知识图谱就是给知识加上时间戳,让 ai 能区分旧方法和新进展。在工具设计方面,项目提出了一个反直觉的建议, 不要为每个细小功能写一个工具,而是把高度藕合的步骤合并。比如,你要做读取文件加分析代码加生成报告,与其写三个工具,不如合并成一个,这样能减少工具调用次数,提升效率。 项目还建立了完整的评估体系。智能体性能的百分之九十五变异由三个因素决定, token 使用量占百分之八十,工具调用次数占百分之十,模型本身选择占百分之五。这意味着优化上下文比换模型更能提升性能。 最后,项目给出了从 demo 到生产环境的五阶段流水线方法论。第一阶段,先用人肉方式跑通流程,再写代码。第二阶段,利用文件系统作为状态机,管理任务进度。这跟软件开发的最小可行产品思路类似,先验证流程可行,再投入开发。 通过这个项目,我们能看到,智能体开发已经进入了系统工程时代。以前我们可能只关注模型本身,现在发现,上下文工程才是构建确定性系统的关键。就像造房子,模型是地基,上下文工程就是框架, 没有好的框架,再好的地基也建不起高楼。这个项目的意义在于,它把抽象的上下文工程理论变成了开发者能直接用的工具,让更多人能用上高质量的智能体。说到这里,你可能会想, 以后 ai 会不会自己变得越来越会管理自己?我们会不会不再需要花太多时间调整 prompt? 这些问题或许会在未来的技术发展中找到答案。好了,今天的内容就聊到这里了,如果你有什么想法,欢迎在评论区交流,我们下期再见。

最近 ai 圈爆火的 agent skills 到底是个啥?今天用三分钟给你讲,看完直接上手用。我们先上结论, agent skills 呢,就是给 ai agent 配了一个工具箱,里面呢全是你常用的工具和操作流程, 关键是这个工具箱它是你自己设计的。我们先来看一下这张图,以前呢, agent 它只有单技能的这个 mcp 可以用,它没有操作手册,我们呢,就只能自己手把手地去指挥 ai, 去调工具干活。在这种情况下呢,遇见相同的任务,就会经常地给 ai 发送重复的指令, 你说一句他动一下,而且每次都得重复说。现在呢,我们有了 agent skills 这样一个组合技能以后,我们就可以直接把那些常用的重复的操作写进这个 skills 里面,我们就像给 ai 做 sop 的 手册一样,下次呢,再遇到同样的活, ai 呢,它就会自动帮你干了, 你也就再也不用重复的折腾了。比如我这里列了三个技能,第一个技能,你看我们每日的热点筛选, 以前呢,我们都是逐个的让 ai 去做,或者自己搭一个工作流去弄,那这样的话门槛就高了。现在呢,直接可以把搜索分析、写报告、发邮件这样的步骤给他按照步骤执行就搞定了。 还有第二个技能,财报分析,找数据分析,评估预判风险,用代码生成报表。还有第三个技能,海报设计,你把你的公司的品牌规范设计要求都放进去,然后让 ai 按照要求去设计海报,我们呢,就可以把这些常规的动作都给他 打包进这个 skills 里面。如果这个不太好理解呢,我这里再举了一个游戏的例子,这张图呢,玩过王者荣耀的应该都比较熟悉了,你看王者呢,每一个英雄都会给他三到四个技能, skills 呢,相当于就是把这些技能给他配了一个固定的连招,比如三一二 a。 编好以后呢,我们再给他绑定一个咒语,下次呢,只要你一念这个咒语,他就会自动释放这个技能的。当然啊,现在的王者是没有这个功能的,我这里呢,就举个例子,方便大家理解。接下来呢,我们再来看一下这个 skills 他 具体长什么样子。 一个完整的 skills 呢,它主要包含以上四个文件,其中它的核心文件就是这个 skill md 了,我们来看一下它具体长什么样。那一个 skill md 呢,它主要有两部分构成,这个以上部分呢,是它的第一部分,也就是它的核心,然后第二部分呢,就是这一块, 就是他的内容。像第一部分这里呢,主要我们就要描述他的技能名称,还有这个技能的功能有哪些,以及什么时候去调用他。那下面这个部分呢,我们就描述指令使用场景,具体执行步骤,还有以什么格式输出,然后给他一个 demo 例子作为参考。 这里呢,我们就不详细的去聊了,感兴趣的小伙伴可以截个图。这里呢,我再补充一点,看,我这里提到了热点,需要根据我的人设进行匹配分析,那这个人设呢,我们就可以把它写进这个参考文档当中,那 ai 呢,就会从这个参考文档去读取人设内容去进行分析了。 如果你想对 skill 进行深入的了解,我们还可以打开这个 cloud 官方开源的 skill 的 仓库,自己进去看一下,它提供了很多模板,大家可以看一下它具体是怎么写的。那最后呢,我们说一下如何使用啊? 像现在除了 cloud code 以外呢,像 coser 去 open code 还有 codebody, 它们都已经把 skill 集成进去了,而且呢官方都有说这个东西具体怎么用,今天呢,你就可以把这个工具下载下来, 然后把你反复使用的那些操作写进 skills 里面来解放你的生产力。如果你用的是确的话,你看用这个就很简单了,你可以直接通过提示词告诉他,帮我去创建一份能审查我的代码效果问题的 skills, 然后呢 他就会去给你生成一个 skills 的 模板文件,看这里面的内容都写了,你遇到不符合的你自己修改就可以了。如果你觉得用代码来处理比较麻烦呢?他也提供了这种直接新建文件的方式, 就按照他的要求去填写就 ok 了。好了,我们今天的分享就到这里了,你也可以在评论区把你想写进 sketch 的 东西在这里分享出来,我们大家一起讨论,我们下期再见,拜拜。

在 oslopec 发布 agent skills 两个月之后, openai 现在终于支持 agent skills 了, 现在我们就可以在 codex 的 最新版中使用 agent skills。 同时 openai 官方还发布了 gpt 五点二 codex 模型, 我们只需要确保 codex 已经升级到最新版,然后用斜杠命令加 model 就 可以查看。 g p t 五点二 codex 模型我这里选择的它的推理级别,选的是 high, 这里也支持 extra high。 通过我一上午的使用发现 g p t 五点二 codex 模型它最大的缺点就是速度太慢了,像一个简单的任务,它可能需要耗费五分钟甚至更长时间。 本期视频我们将在 codex 中测试一下 agent skills 的 使用方式以及效果,并且在 codex 中重点测试 gpt 五点二 codex 模型的编程能力。 好视频呢,开始我们可以先简单回顾一下 agent skills。 对 于不了解 agent skills 的 用户来说,我们可以先通俗地讲解一下什么是 skills。 aging skills 的 本质就是把人类的专业知识还有工作流程用机器可以理解的方式固化下来,让 ai agent 呢能够稳定可控可附用的来执行任务, 这样的话就能将 ai 从聊天助手变成了可控的工程工具。我们可以将没有使用 skills 的 ai 或者 ai agent 呢理解为一个非常聪明但没有经过培训的员工, 每次布置任务都需要口头讲一遍规范。有了 skills 就 相当于给员工配备了工作手册,所有流程和规范都写在 skills 里面, ai agent 就 可以随时翻阅。比如说我们在让 ai 写测试的时候,如果没有 skills, 每次我们都要告诉 ai 帮我写测试,要使用 test 覆盖率达到多少以上,命名规范是怎样的,每个测试都要怎样怎样,然后 ai 就 会按照我们的提示词来写测试。 当后续我们再要求 ai 来写测试的时候,我们还需要重复一遍之前所用到的提示词,像这样的话非常浪费时间。但是有了 skills 之后,我们可以将测试做成 skills, 也就是将所有的测试规范脚本还有模板都放入 skills 文件中。当给 ai 配置好这个 skills 之后, 我们再需要测试的话,直接告诉他帮我写测试,那么 ai 就 会完全按照这个 skills 里的这些测试规范脚本还有代码自动为我们执行测试。相比 mcp agent, skills 非常节省。 token, 当启动时只加载 skill 的 名称和描述,而且可以根据任务自动匹配。 而且 skills 在 执行时才会完整地加载 skills 里的所有内容还有附属资源。所以有了 skills 的 支持,我们就可以为 codex 增加各种技能以及增加各种知识。在 codex 中使用 agent's skills 非常简单。 首先我们要确保将 codex 升级到了最新版本,然后我们再用命令打开 codex 的 配置文件。 在 features 这里我们要将 skills 设为 true, 下面这里还给它设置了权限,这些设置好之后,我们直接保存并且关闭就可以。然后我们再启动 codex, 再使用斜杠命令来查看 skills。 这里有自带的三个 skills, 这个 pptx, 还有这一个都是我手动安装的。 想安装 skills 非常简单,我们只需要选择这一个 skills, 在 后面我们就可以输入 skills 的 仓库链接,比如说我这里使用 oslopec 的 skills 仓库,我们可以进入这个文件的路径,这里面就列出了非常多的 skills, 比如说我这里找一个前端设计的 skills, 然后直接完整地复制它的链接,再回到 codex, 我 们直接粘贴这个链接,直接运行就可以,它就会为我们安装我们刚才选择的这个 skills。 这里安装成功,我们只需要重新启动一下 codex, 就 可以看到我们刚才安装的这个前端设计的 skills, 然后我们就可以选择这个 skills。 在 后面我输入了提示词,开发一个登录页的 ui, 可以 看到这里它读取了 skill 点 md 文件,这里提示它使用前端设计的 skill 完成了登录页的 ui, 然后我们打开这个页面看一下效果, 打开之后我们就可以看到这个登录页设计的非常不错,非常美观。下面我们还可以测试一下,让它为我们制作 ppt, 然后我们输入命令,找到做 ppt 的 这个 skill。 我 输入的提示词是把这篇关于介绍 agent skills 的 文章做成十页的 ppt。 受众是开发者,风格是极简,深色,语言是中文,这里是要输出的文件名, 这里就是介绍 agent skills 的 文章链接,也就是这一篇文章,然后我们直接发送,好在等待了几分钟之后,它终于制作完成,然后我们打开这个 ppt 看一下效果,它确实制作了十页 ppt, 可以 看到它制作的这个 ppt 效果还是比较不错的,完全符合我们要求的深色极简风格,并且用中文介绍了 agent skills。 下面我们就可以在 codex 中测试 gpt 五点二 codex 模型的编码能力。 在测试之前,我们可以先看一下官方给出的 gpt 五点二 codex 模型的基准测试。在 swebench pro 这个基准测试中, gpt 五点二 codex 达到了百分之五十六点四,超过了 gpt 五点二以及 gpt 五点一。在另一个基准测试中, gpt 五点二 codex 也超过了 gpt 五点二以及 gpt 五点一 codex max。 好, 下面我们开始在 codex 中通过几个案例测试一下 gpt 五点二 codex 模型它的真实能力到底怎样。 好,下面我们准备一张 ui 截图,然后让 codex 为我们复刻这个 ui, 然后我们看一下它复刻的 ui 效果怎么样, 然后我们就可以输入提示词,用最适合的前端技术复刻这个 ui 页面后面我们就跟上这个图像,然后直接运行。在这里可以看到它调用了前端设计的 skill, 在 等待了十九分四十五秒之后,它终于为我们完成了这个 ui 的 复刻。 复刻这个 ui 的 耗时真的太久了,我们如果用 cloud code 的 话,基本上不到一分钟就能复刻完成。然后我们打开看一下它复刻的效果, 可以看到它复刻的这个 ui 总体还算可以,然后这些表格内容跟原图相比效果还算可以。它复刻的第二个表格跟原图相比的话,确实非常不错, 它基本保持了原图中的这些布局,还有样式。好,接下来我们再用一个非常简单的智能体框架转换题来测试,让它将微软的智能体框架 out 站编写了一个旅游智能体的简单代码, 重构为谷歌的 adk 智能体框架。可以看到这个旅游规划的智能体代码非常少,甚至不到一百行,但是我们上次在测试 gpd 五点二的时候,它没有实现将这个智能体代码非常少,甚至不到一百行,但是我们上次在测试 gpd 五点二的代码非常少,甚至不到一百行,但是我们上次在测试 gpd 五点二的代码非常少,甚至不到一百行,但是我们上次在测试 gpd 五点二的代码。 好,下面我们可以看一下这个提示词,先让他阅读谷歌 adk 的 官方文档,然后告诉他将这个旅游规划的智能体代码重构为谷歌 adk 框架的智能体代码, 要求保持原有智能体的逻辑和功能,并未重构后的智能体加入 ui 操作界面。然后下面这里就是刚才我们查看的不到一百行的旅游规划的智能体代码。我们直接完整地复制这个提示词,然后粘贴到 codex 并且执行。 像这个简单的任务,我们就直接用 web 扣领的方式让它直接阅读文档和代码,并且直接进行改写。 像这个测试题可以测试 gpd 五点二 codex 模型的信息解锁与文档理解能力,还有代码理解与分析能力,以及跨框架迁移,还有重构能力,还能测试多任务协调能力。所以这个题目用来测试 gpd 五点二 codex 模型还是非常适合的。在等待了九分五十三秒之后, 他终于完成了将旅游规划智能体的框架重构为谷歌 adk 框架。下面我们就按照他给的步骤运行一下这个项目,打开之后我们看到了这个 ui 界面,然后再输入框,我们就可以输入任务,让他规划三天的尼泊尔旅行,我们直接发送。 下面我们看一下这个智能体的执行步骤,还有结果是否正确。首先是输出的三天的尼泊尔旅行的一个简单计划,第二部分是当地特色,还有深度体验, 这个是没问题的。然后第三部分,它给出了一个最终的旅行规划,在微软智能体代码中,这里还包含这个当地的语言专家会给出当地的这些常用语, 但 gpt 五点二 codex 它改写后的这个代码就缺少了语言专家这个智能体。所以这个测试题虽然它耗时将近十分钟,但它并没有复刻微软的这个旅行规划智能体所有的执行流程还有逻辑。 好,下面我们准备一个更加复杂的开发项目,让他开发一个 ios 原声背单词应用,这里给出了应用名称,目标用户。这里是具体的技术要求,而且要遵循 mvvm 架构模式,并且使用 swift data 进行数据持有化,还要实现单词发音功能, 还支持深色浅色模式。这里是具体的界面结构,包括首页练习,还有进度还有设置。下面这里就是核心的功能,包括单词卡片, 还有发音功能,还有收藏等。这个测试题我用来测试 cloud code, cloud code 能一次给出完全可以正确运行,而且包含所有功能的代码。在开发之前,我们先用 x code 初步化一个项目,这里我们就选择 ios, 选择 app, 下一步这里我们就输入项目名称,然后我们选择一个文件夹, 然后我们打开终端命令行,切换到刚才的路径,再打开 codex, 我 们先用 edit 命令让它来创建 agent 文件,这样的话它就能学到我们部署化后的这个项目的这些内容。好,这里运行完成耗时将近两分钟。 由于这个测试题目比较复杂,所以在 codex 中我们可以先让它为这个开发任务制定计划,我们直接调出它的计划模式,然后粘贴这个提示词直接运行,先让它根据我们的开发需求来制定一个完整的计划。 好,可以看到这里它调用了制定计划的 skills, 它这里只耗时四十八秒就完成了计划的制定,这个速度还是非常快的,然后这里它询问是否需要调整细节,第二个就是直接实现,第三个就是保存到这个目录,然后我们这里就让它根据计划直接实现。 由于这个项目比较复杂,它开发估计需要非常长的时间,我们直接略过这个开发步骤,直接跳到它开发完成的步骤,这里耗时将近三十三分钟,终于完成了这个项目的开发。下面我们在 xcode 中测试一下这个项目能否正常运行, 我们先点击运行,看一下能否正常的翻译好,这里提示报错,然后我们直接先复制一些报错发给他,让他来修复,这里修复完成,我们再测试一下。好,这里提示翻译成功。 好,这里又出现了报错,然后我们将报错发送给 codex, 这里提示修复完成,然后我们再运行一下,看一下这次能否正常的执行,然后还是出现了报错,我们还是让他来修复 好,这里提示修复完成,我们再运行这里,还是报错,我们还是发送错误给他,然后我们再运行, 还是出现报错,我们还是让他继续修复好,这里修复完成,我们按照他的提示清空一下模拟器,然后我们重新运行好,这里终于能正常打开这个 app, 但是这个界面竟然是英文的,他没有用中文的,可以看到这里可以正常做练习,这里终于加载出了单词, 可以正常翻转 line, 可以 听到能够正常播放声音。下面我们让 cloud code 分 析一下他开发的这个项目是否遵循了我们提示词中的 mvvm 架构模式, 然后我输入提示词,检查这个项目是否符合 mvvm 架构模式,直接发送 cloud code 很 快输出了回答,我们看一下他说这个项目部分符合 mvvm, 然后这里提到了所有代码都在这个文件中,约两千多行。然后我们在 xcode 中查看一下,可以看到这个文件中的这些代码真的达到了两千多行。然后这里就是需要改进的地方,应该拆分为多个文件,并且这里给出了典型的 mvvm 势利。 通过 cloud code 的 分析,我们就发现了这个非常不应该存在的问题,它将两千多行代码都放在了这个文件中,这是非常不应该的。好,通过测试可以发现 g p t 五点二 codex 它确实相比之前的 g p t 五点一有了一些提升。


这是我用 agent skills 做的一整套品牌全案设计,耗时不到一小时,从品牌 logo 设计、品牌视觉系统、 ip 周边延展、包装设计、 电商详情页、宣传、三折页设美、品牌节日素材、产品海报,再到门店空间设计,全在一个画布搞定。首先新建一个项目,这里有五条 skills, 将锤类设计师长期积累的 经验、审美和实战方法做成了直接就能用的设计工作流。做 logo 和品牌延展就选第二条,根据需要修改 skill 后面的提示词模型可以勾选 banana pro 得到品牌 logo。 继续调用品牌设计 skill, 让它基于品牌 logo 进行视觉系统物料周边的设计,全程不动脑,一句话指出品牌系列视觉。选中图片,点击编辑元素,还可以对图片进行分层编辑。 点击这里新开一个对话,做电商产品详情页就选第一个。比如为这个品牌的咖啡豆做一套某宝的详情页,就得到了一套符合电商平台的的主图 banner 详情,甚至可以看到详情出了英文和中文两个版本的,整体来说视觉效果还是不错的,文字也没有出错。 如果对某张图的文本不满意,比如我要这张图的,把步骤改为中文,点击编辑文字,输入内容修改即可继续重开一个绘画。选择第三条四 q, 将提示词进行替换,让它基于品牌 logo 和咖啡豆产品设计一套宣传手册。这里的参考图也可以替换成你喜欢的 品牌宣传三折页就做好了。选择第四条四 q, 基于品牌 logo 得到社媒帖子,比如新春品牌海报。这一套四 q 下来,真的让创作者从第一步就站在专业设计的起点上,而不是从一张白图开始试错。

今天给大家推荐两个东西,来帮助我们发现 skill 和管理 skill。 为什么发一期视频来推荐呢?因为我写了文章,好像没有人看。 呃,这两个东西都是 versal lab 发布的。我们先看它的这个簿课,这一篇簿课,这个簿课发布于一月二十号,它这里写我们发布了 skills。 这个 skills 呢, 就是一个呃, c l i 工具,帮助我们来安装和管理 skill 的。 嗯,这个我们待会具体看,我们先把扑克看完。这里说一个 c l i 用于安装和管理 skill 包 agent 的 包,安装 skill 包,通过这个命令。 呃,到目前为止,这个 skill 已经被使用安装技能,像 a m p。 呃,这些什么 cloud code 呀, cloud bot 呀, code 叉呀, cursor 啊,啊, gmail 啊这种等等,它已经被这些使用了。 今天我们也来介绍一个网站,就是这个 skills, 点 s h, 我 们点开看看, 它这里说是一个目录和一个排行榜, skill 包的排行榜,通过它呢,我们可以发现一些新的 skill, 呃,为我们的 agent。 然后就是浏览 skill, 通过分类和流行这个程度, 呃,这段话的意思是说通过这个东西来安装哦,在整个生态系统中跟踪使用,统计和安装情况。 这里说有一个简单的命令,并且去探索。他说让我们来添加一个 versa lab 的 官方 skill 吧。首先我们说一下 versa 的 这个官方 skill 吧, 他自己出了一套 skill, 呃,只不过的话,这个是偏向前端嘛,然后也是偏向 react 的。 他这里说最最好的实践构建就是 react, 它里面包含的东西, 呃,也挺好的,就是一些 react 的 规范,还有 cloud ai 的 使用,当然还有 web web 设计指指南。 呃,另外的话,关于 vivo 方面,呃,安森富前几天发布了它的一个 skill, 当然它也是有一部分是自己的,它这里有安装使用说明, 它这里有一部分是自己的。像这个 skill, 呃,它以自己的名字来命名它的一些喜好和最佳实践,像一次 link, p n p m 这些, 当然还有一些官方的 skill, 像 v o e n s t p n 这种 v o e 方向的一些生态库的 skill, 当然还有一些非官方的,像,呃, sladeep, 这个是安斯尼夫开发的一个东西,然后 t s down 啊, turbo ripper 啊,还有 vivo use 这些。 vivo use 当然也算是官方的,因为那个创作者 刚发布没几天,就被安斯尼夫给收入给官方的 skill 了。呃,接下来我们讲这个网站, 首先这个网站的话就是一个统计收集 skill 的, 然后它这里有,呃, over time, 就是 说全部使用累积起来的这个使用量排第一的是 find skill, 呃,待会儿我们可以看一下这个, 它这里还有就是说二十四小时内最火的,也可以看到这个 find skill 是 非常火。还有这个 heart, 就是 说当前热度最高的 skill。 然后我们可以点进去一个看,比如说看这个 find skill, 它的话就是 通过这个 skill 来帮助我们发现 skill。 什么意思呢?就是通过我们人类的自然语言,比如说我该怎么做,怎么做,需要一个什么样的 skill, 帮我找一个 skill 之类的这些词, 呃,来帮助我们寻找一个合适的 skill 并安装和使用。当然我们看它这个详细界面啊,这里有基本的安装命令,然后 skill 点 md, 就是 介绍它是干什么用的一些指令啊这些之类的。 当然这里有它的周的使用量、下载量,当然这里有它的使用分布,比如说在 cloud code 里面啊, open code 里面啊,使用了多少? 还有就是第一次,呃,可以说是发布,或者说第一次看到它是在九天之前,然后这里有它的仓库, 对,对应的就是我们刚才的那个 skill c o i, 因为它不仅仅是一个管理的,并且是一个能帮我们发现它有一些命令,比如说基本的添加, 还有像查找我们当前安装了哪些 skill, 这个 find 就是 我们的 find skill, 来寻找一些 skill, 通过一些关键词,呃删除 skill, 然后检查它的更新状态。更新 skill 这个的话检查的话就是看他可不可以更新,这个的话就是直接去更新,这里的话是创建一个新的 skill md 模板,这个的话应该就是我们自己去创建 skill 的 话,可以通过这个来快速生成一个模板。 呃,现在我们来试一下吧。呃,比如说我们来安装安森尼夫的这套 skill, 我 们复制然后粘贴进来安装它,这里就去安装这些 skill。 呃,这里我们可以选择,我选择全部安装,然后它这里让我选择平台,我直接只使用 open code 吧, 找一下 open code, 嗯, 别的没有选择,直接安装,然后这里的话他有软链接,然后这个也容易更新,所以我们选第一个 啊,确定安装,然后这里提示安装完成,然后我们就可以来用他这个来测试一下了。 呃,比如说我们通过 npx skills list 来查看一下我们安装了什么, ok, 它这里把刚才安装的给我列出来了。当然我们一般查看局都需要用到缸机去查看局的安装,比如说我把这些, 呃,我先别删了,我先检查一下 scuse check 这里,它就在检查它们的更新状态,好,所有都是最新的。比如说我执行一下 update, 这里就开始检查,然后如果它可以更新,它就去更新到最后一个版本。比如说我去把它们都删掉,瑞幕, 我直接全部删掉,它这里显示删除完成,然后我们再查看一下 就没有了。他说,你看,他这里说如果要看大局的 skill, 加个杠 g, 然后我们来找一个 skill 吧。 n p x skills find, 比如说 will 一 三, 哦,他这里给了我们一个这个列表,然后给了我们一个指令,那我们可以去添加,我这里,呃,复制一下吧。 比如说,嗯,我来安装这个, ok, 他 就去安装了, 啊,它这里让我选择平台,然后默认选择 open code, 我 就随便选选一下, 然后等它安装完成就行了,然后我们再删掉, 然后我们来试着创建一个吧,比如说我到我的项目下,然后 n g x give it, 再有 v o e 吧。 ok, 然后它这里就创建了我们 ls。 来看一下,这里有一个,我们 cd 进去 用 v s code 打开看一下,它这里就给我出示化了一个 skill 模板,嗯,这期视频就到这里。

哈喽啊, chu 友们,这个和这个是我用 solo 加同一段 prom 做出的头像生成器网页,我们对比一下,看一看是不是右边的这个整个 ui 上看着更精致更高级。其实做它俩时的唯一区别就是我在开发右边这个网页的时候加了 skills。 是 的, chu 现在已经支持 skills 了。 skills 是 基于高标准的重复工作沉淀的可复用技能包,可以持续稳定地按照你的要求输出高质量的产物。 那么如何在 tree 里创建 skills 呢?有两种方式,第一种,直接在对话中描述你的需求,比如我这里对 ai 说创建一份能审查我的代码效果问题的 skill, 你 看 ai 会直接帮我写一个 markdown 文档,然后放在 tree skills 下面的对应文件夹中。第二种,从设置中创建, 点击设置按钮,进入规则和技能页面,在技能模块处点击创建。这里你可以直接导入现成的 skill 文件进行智能解析。因为 tree skills 是 基于开放的 agent skills 标准构建的,完全兼容社区生态。 当然,你也可以手动输入技能名称描述和指令,添加更符合你需求的工作流及工具调用。现在我添加好了一个前端设计的 skill, 我们在做图像生成器的时候就可以用到它了。你看在 ai 对 话流中可以看到它自动调用了这个前端设计 skill。 如果你的任务比较复杂或者需要持续稳定输出的时候,你也可以在 prompt 中明确告诉 ai 要用哪个 skill, 这样你就可以更精准的控制输出结果了。就像这个网页前端设计的优化一样, 使用 skills 是 可以帮你稳定地按照你的标准输出高质量结果的。除此之外呢,还可以自动化你的重复性工作流,甚至成为专业能力规范知识进行沉淀和分享的方式。所以快去吹 solo 中试试吧!中国版和国际版都有哦!

hello, 大家好呀,今天给大家带来一期关于 gemini c o i 重磅更新的精华帖,那么我们首先来看一下近期 gemini 有 哪些重要的更新。 第一个的话呢是 gemini 现在支持了 agent skills, agent skills 如果熟悉 cloud code 的 朋友呢,应该都已经用过了。 现在呢,不管是 cursor 还是 open i 的 code x 以及谷歌的 gmail c o i 都已经支持了 skills 这个 skills 呢,它其实会像 m c p 一 样,成为一个所有的 ai 编程工具都通用的一个功能。那么现在呢, gmail c o i 也支持了一个功能。 第二部分的话呢, gmail c o i 呢,现在可以记住咱们的大模型选择了。之前的话呢,每次在绘画里面选择大模型,重启界面之后呢,它又会恢复到一个自动模型的状态。现在呢,这个问题总算是解决了。 第三个功能点呢,是加密的 c o i 优化了关于发图的一个体验,以前我们发图呢,把图片贴到输入框里面会占据很大的一个空间,现在呢,他会以一个非常简约的方式来呈现这个图片。 第四个功能呢,开启了一个省钱的功能,这个功能的开启呢,它能够大幅的降低关于托管的消耗。第五个功能是关于隐私自动打码的一个功能,这个功能呢,是针对大模型,在输出的时候呢,会把我们的密码包括密钥,然后自动给盖住。 第六个功能呢,是 gemini c o i 呢,对很多的秘密做了一个更新。最后呢,给大家介绍一个非常有意思的功能,我们通过一条秘密,然后可以让 gemini c o i 帮我们去生成一个年度的使用回顾。 ok, 那 我们接下来一个一个的给大家做一个演示。 好,首先第一个的话呢,我们来看一下 eighteen skills, 可以看到就是我现在直接在 gemini c u i 的 窗口里面去输入 skills 这个命令呢,发现是没有的,那我们先要在 gemini c u i 里面去开启这个功能,我们先打开 ct 输入 agent, 我 们可以看到这个功能目前的话呢是没有打开的,我们现在回车 把它改成处,然后再按键盘上的 r 键重启一下界面的 c u i。 重启之后呢,我们就可以使用刚才的这个 skills 命令了,我们来试一下。 哎,我们发现现在这个命令已经是可以使用状态,下面呢有几个不同的功能。第一个 list 呢是可以列出我们当前已经安装的 skills, 第二个呢是我们可以关闭某一个 skills。 第三个呢是针对已经关闭的 skills, 然后重新启用。 最后一个功能的话呢,是可以重新读取加载 skills 技能包。好,那我们先来看一下 list, 大家可以看到呢,我在演示之前呢已经安装了几个 skills 了,这里包括 前端设计,提示词工程,还有 skills 的 一个创建。那第一个前端设计和第三个 skills 创建,这两个技能包其实都是来自于 cloud code 的 官方的一个技能包啊,我直接把它给安装到了 demo 上面。好当我们来演示一下, 我们先复制一下这个技能包的名字,当然我呃不直接险性的去调用它也是可以的啊,因为它是一个按需加载的方式,那我们现在就 先险性的去去调用它,就是明确的指定让它去使用这个技能, 帮我设计一个现代化的网页。好, 这个时候呢就是 jamming cui 呢,它会去调用这个技能包去完成这个任务,我们可以来看,从这里呢我们可以看到它已经激活了这个技能包,技能包的名称是前端设计, 那我们现在只需要允许它去调用这个外部设计的技能包。 ok, 那 这里的话我就不去去调用这个外部设计的技能包。 ok, 那 这里的话我就不去调用这个技能包。 好,第二个呢除了技能包之外呢啊, jimmy 的 cy 呢,它有一个官方的网站,这个官方网站里面呢,它现在有很多扩展的插件,这里面呢就是也已经包含了一部分的这个技能包,我们也可以在这里去搜索浏览安装。那安装的方式呢也非常的简单,比如说我们来装一下这个, 这里呢可以直接去复制这条命令,然后呢我们在本地呢打开一个终端窗口,将这条命令贴进来,我们可以看到这条命令其实也很简单,首先呢它指明的是 gemini 这个应用,然后呢是扩扩展的一个插件, 一个安装的命令。最后呢跟上呢其实是一个 github 的 一个地址,这个时候我们直接回车,它就会安装完相关的一个技能包。装完之后呢,我们在哪里来查看呢?你会发现呢,在 demo 里面呢,它除了 skills 技能包之外呢,它还有一个扩展, 扩展插件,装完之后呢,我们在这里就可以看到我们所安装的不同的一些扩展,我这里装的比较多啊,然后呢包括我装了 chrome 的 一个浏览器的扩展,然后还有 context 七,然后以及还有这个 代码安全和代码扫描,还有 github 还有提示时工程等等。那么大家呢,可以在这个官方网站上面去浏览, 然后选择你想要去安装的这个技能。包装好之后呢,在加密奶 c o i 里面呢,就可以直接去使用了。好的,那我们接着继续往下 第二个功能呢,是现在 gemini 呢,它可以记住咱们的模型片号了,我们可以看到我这边现在的话呢是 gemini 二点五 flash。 我 们来先看一下当前的模型是怎么配置的啊?我现在是我现在是手动选择的 gemini 二点五 flash 这个模型,那我先把它改成 改成自动,我先用 tab 键把这个选项修改一下,这是关于记住模型选择的,现在目前呢是 force, 我 先给它改成 to ok, 然后呢把它改回 自动,我们可以看到当前这个模型呢已经变成自动的 jamming 三的这个模型配置了。那我们现在再回去 啊,可以看到现在的话是已经生效了,我先退出一下,退出 gmail, 然后重新启动一下, 好,启动成功。好,那我们如果说想要改成手动模型的话呢,第一步还是刚才的操作,我们先把记住模型选择改为簇,然后在手动模型选择里面,比如我们选择 gmail 二点五 flash 这个模型。 好,我们看到在当前绘画里面他已经生效了,那其实重点是想看我们重启界面以后,他能不能记住我们的模型选择,那我们刚才我们现在退出界面点,然后再重新启动一次, 好,现在正在启动。好,启动完之后我们可以看到在这里, 在这里啊,是我们刚才上一次所选择的。那这个功能的主要的一个价值就在于说,如果我们有些特定的模型偏好,那在这里的话,我们是可以进行一个配置的,但在 gemini v 零点二四版本之前,这个功能是 没办法支持的,也就说即便我们在当时绘画里面进行了一个模型的手动选择,那么我们在退出界面内重启的时候呢,他依然会再次回到自动模型这个状态。好的,那我们接着往下看 啊,关于发图的这个部分,我现在截一个图, 我们把这个图片贴进来呢,这个图会直接占到很大的一个窗口,现在呢,他会以一个缩略的形式去显示这个在显示部分的一个小优化呢,其实对,我们比如说查看信息了,包括输入后续的一些提示词,会方便很多。 好,那这个功能没有太多可以给大家演示的啊,我们继续往下看,那第四个功能是关于省钱省油模式, 这个省钱省力模式呢,其实呢,他是针对希尔的输出,希尔输出里面呢,他现在目前在后台已经默认的启动了这个功能,也就说在希尔输出的时候呢,他不会把所有的这些绘画全部读完。 那这个功能的优化呢,它能够帮我们省下一个大量的托管,而且整体的这个输出包括反应也都更快了。还有呢,就这个功能呢,它是一个在后台的优化,我们是不需要在啊 ct 里面去做配置的,默认情况下呢,它就是一个开启的状态,我们只需要确保说我们的 gemini c u i 的 版本 是 v 零点二四就好了。那怎么去查看这个版本呢啊?有一个 about mini, 打开这个 about mini 之后呢,我们可以看到当前的 c o i 的 版本呢是零点二四点五,如果说想要有这个功能的话呢,你只需要确保你的版本在零点二四就 ok 了。好的,那我们继续往下啊。第五个部分呢,是关于隐私打码的一个功能,这个功能的话呢,他其实核心的价值就是 在界面进行输出的时候呢,他会把密码必要这些重要的信息呢,给他打上这个马赛克。 那我们在公开场合去使用 jamming, 或者说我们去录视频直播的时候呢,其实有时候会比较担心这个密码包括一些重要的 api key 给漏出来了。那有了这个功能之后呢,其实我觉得对咱们特别是录视频或者直播这种场景是非常有用的一个功能。那怎么开启这个功能呢?也是在 city 里面去进行一个配置, 我们现在先打开 c a t, 然后在这里去搜索一下,那可以看到我现在目前这个功能我已经是开启了一个状态了,那大家就是搜索这个关键词,然后呢把它的状状态从 false 改为 true, 那 这个功能就已经开启了。 好的,那我们继续往下看。那么加密的 c y 呢?这次还对很多命令做了一些优化,就是刚才我们一直在使用的这个 ct 命令。我们来看一下,打开这个 ct 之后呢,大家看到每一个设置选项的下面呢,它都添加了一个描述, 这个描述呢在之前的加密的 c y 里面是没有的,那有了这个描述之后呢,对我们去理解这个功能是什么作用?是有一个比较大的一个帮助啊,这是一个小的变化。然后第二个命令的优化, 大家之前有没有用过这个 d i r a t d 这个命令,这个命令呢,就是早期我们在使用的时候呢,比如说我现在想添加一个目录到我的界面里面来, 这个整个这个目录的这个路径呢,是需要自己一个一个去手敲的。现在的话呢,有了这个功能之后 呢,我们还可以通过鼠标的方式去做选择。 ok, 比如说我现在 执行将要命令好,执行完成之后呢,我们可以看到它现在已经把这一题的路径添加到我们的这个 jimmy c o i 的 工作区里面来了。那我们怎么查看呢?我们可以再次看一下它是不是添加成功了 啊?有个 d i r show 的 一个功能,我们可以看到这个是这个路径,是我启动 gemini c u i 的 一个路径。那么下面的这个路径呢,是我刚刚添加的目录,也就说 gemini c u i 是 可以在使用的过程中去添加一些其他路径,这个的话呢,我觉得还是一个非常方便的一个功能。 好的,那我们继续往下看啊,下一个小的优化呢,是关于 stats 这个命令的一个优化,这个 stats 命令呢,它其实核心的优化点就在于 给我们提供了大模型的一个用量的查看,我们可以看到这里列出了我们当前所有在使用的 gemini 的 大模型,包括从二点五的 flash, 然后二点五 pro 再到 gemini 三 pro, 那 每一个这个模型呢,这边有个百分比, 这个百分比的话呢,代表着说当前模型我们还剩余多少的可使用量。像后面呢,还有一个时间,这是一个刷新时间,也就说在四小时十六分钟以后呢,这个模型用量会再次刷新到百分之百。 那这个功能的话呢,相当是让我们更加清楚的了解我们当前的模型的用量,以及下一次的这个刷新时间,我觉得这是一个非常非常实用的一个功能啊。好的,那关于它的 最近的重要的更新功能就给大家介绍这么多,那么大家如果之前没有接触过加密的 cui 呢,想要安装它呢,也是非常简单的 啊,加密的 cui 呢,它本身的话是一个开源工具,那这个开源工具的话呢,在 github 上面我们可以直接搜索找到,那这里呢也它也提供了相应的一个命令,那安装过程呢,只要我们有了这个 npm 包,我们直接复制一下这条命令,在本地呢,打开一个新窗口, 打开一个新的窗口,把这个命令给复制进来,复制完之后回车执行就好了。整个安装过程呢,大概就几秒钟的时间,因为我已经装过了,所以呢我就不带给大家去演示这个安装过程 啊。那安装完之后呢,有一个很重要的功能,大家记得要看一下,就在默认的情况下呢, gemini 的 设置里面呢,有一个叫做预览功能,这个功能默认情况下呢是 false 没有开启的,那这个功能开与不开有什么差别呢?就如果说我现在把它改成关闭啊,关闭之后呢,我们会发现在 在模型里面呢,我们就没有 gemini 三的模型了,我们就只剩下 gemini 二点五了, 对吧?那这个功能的核心价值就是开启这个功能之后,我们才可以使用到最新的 gmail 三模型。好,我现在把它改成竖的一个状态,我们再回到这个模型里面, 大家可以看到现在呢已经有了 gmail 三这个模型,所以这个呢,大家在新装完 gmail 三的时候呢,注意打开一下这个预览功能。 好的,我们继续往下看啊。最后呢,给大家介绍一个比较有意思的小功能,这个小功能呢,它其实是一条命令,这条命令的作用呢,就是可以帮我们去生成一个关于我们使用 gemine 的 一个年度的精简报告。那我们现在来执行一下这个命令啊, 好, ok, 这个命令执行速度非常快啊, 大概一两秒,对吧?然后呢,它的作用是首先它创建了一张图片,那这张图片的话呢,它包含了,比如说我现在使用 gmail 有 一百二十三天了,然后呢,我主要使用的模型有哪些? 然后创建了哪些哪些内容?比如说 markdown 的 文件啊, html 的 代码哈,然后一共输入了多少 token, 输出了多少 token 啊?然后总的这个 访问量是多少?还有多少次的绘画?好的,然后下面呢有几个选项,第一个选项是说询问咱们要不要把这个图片啊保存到咱们的一个根目录下面啊,那我们就选择 yes。 然后第二个呢是说要不要发一个 x twitter, 那 我们选择是不要好的,那么这个命令就执行完成了,那这个图片是存到了我们的根目录下面,我们现在打开这个文件啊,在这 好,现在呢就是就可以看到我们详细的一些信息,比如说我们的模型的用量啊,可以看我其实用 gmail 三, gmail 三 pro 比较多啊,百分之四十九的时间都在用 gmail 三啊,百分之二十六的时间用 gmail 三, flash 啊,还有百分之十五的时间在用 gmail 二点五。 好,然后呢,这里的话呢,有我们总共消耗的这个 token, 还有呢就是一共价值多少钱啊?那些呢?看来我其实用的不多啊, 一共的价值是九十一美金啊,不到不到一百美金啊,这个的话其实是挺有意思的一个小功能,大家呢也可以回去试一试,看一下自己在 gemini 使用上面整体的一些数据表现。 好的,那今天要给大家介绍的全部的功能就到这里了啊,我是 ai 编程瓜哥,如果大家对 ai 编程包括对谷歌的 demo c o i 比较有兴趣的话呢,欢迎大家关注我, 同时呢,如果觉得视频的内容对你有用,也欢迎大家点赞转发。好的,今天内容就到这里,再见。

他真的把 agent 搭建讲得太清晰了!最近 agent skills 可谓是全网爆火,直接在 github 上拿下三十六点四 k 星标。很多同学想搭建,但是看到满屏幕代码瞬间蒙了。 所以我特意花了两天时间整理出这份从零到一,手把手搭建企业级多 agent 协助系统,包括从环境准备到运行智能体的全部实现过程,新手小白都能看懂。学会这些不仅可以打造商用智能体, 甚至还可以应聘大模型工程师。如果你也想学好智能铁,就不知如何下手。留下学习,双手奉上。


ai agent skills 的 数量爆炸式的增长到了十三万个主流的 ai 平台都支持了,包括最火的 open cloud。 作为程序员,我们首先是要去用 skills, 第二呢, 我们所有的软件项目可能都需要开发一个 skill, skill 甚至可以理解成是一个 ai 的 app 的 标准。在 skill 中呢,你其实可以去调用其他的程序,然后还有 m c p, 然后完成一个工作流这么重要的技术。我们通过对 skill 标准的分析,然后我们手写一个 skills, 并最终呢在 cloud open code cache 这里面运行。你只有写过和跑过,你才能真正理解一个技术,就是理解 skill。 作为 cgi 开发者呢,我是希望用 skill 去生成符合我要求的 cgi 代码, 并且呢用 skill 去实现我的代码的自动化构建和测试,这个在我的 cgi 大 项目课程当中准备体现出来。我们先看 skill 标准啊,它就是一个目录,其实也可以像我们 app 一 样以 压缩包的形式去安装。里面呢主要包含四块内容, skill d, m d 这个是必须的,而且名字是固定的,可以只有它,所以我们待会也是重点分析,还有三个可选项,这也没有固定的格式要求。 scripts 里面存放的是脚本,目前呢支持 python 和 bash, 我 们如果是用 c d i 写的程序呢,我们就用 python 的 脚本 来运行它。 reference 里面是渐近式的,譬如内容,这也是为了节省 token, 当满足一些条件时候再去读取。比如说我们让 ar 写 c 加代码用到现成词的时候,我们可以让它读取 reference 里面的一个规则, asset 里面就是一般是,还有就是资源文件,比如说一些图片,也可以是一些参考模板,比如说我们 cmake 的 标准写法。 ai 编程时代,我感觉项目可能还是尽量用 cmake 来管理比较方便。那我们重点来分析 skill 点 md, 它的内容呢?主要分为三层, 第一层是 y a m l 格式的,这部分其实就是 skill 高效的核心,在 skill 没有被调用的时候,我们是只加载这部分内容, 其他内容是在用的时候再加载,这样也是减少 token 的 使用。它里面有多个字典,而且这些字典可能后期会调整。我们说两个最核心的字典是必填的,一个是 name, 也就 skill 的 名字, 名字我之前看的要求是和 skill 的 目录一致,现在好像也不是必须,我们还是把它写成一致。下面就是 description, 它限定在一零二四个字节, ai 呢,再会根据你的描述 判断什么情况下触发你的 skill。 所以 说在这个描述当中呢,我们一般要包含三块内容,这也不是必须,第一个就是你的作用,这个 skill 是 用来做什么的,然后第二个是什么时间触发,第三个是关键词,就是在一些特定关键词的情况,下面我们去触发调用这个 skill, 我们做一个视例啊,手写一个 skill, 当然了这个 skill 本身也可以直接用 ai 生成,很多细节操作我们就不演示了, ai 时代呢,要学习它的根本操作方法,会不但变化,但原理不变。理解了 skill 的 本质,你就可以考虑怎么把它应用到你的项目当中。下次我们再演示一下 skill 和 mcp 的 交互, 我们先用 clode 来演示,后面呢我们再用 opcode、 coser 和确能演示。首先第一个在 clode 当中, 我们 cloud 目录下面有个点, cloud 在 里面,我们创建一个 skills 啊,这里面是 ai 可以 自动去生成的,你比方说你可以让它去生成一个 skills, 我 们在里面手写一下。好,这时候我们可以在里面建立一个目录,就是待会我们要做的这个 skill, 比方说我们这边是 现代 c 加加 modding cpp, 在 这个目录下面呢,我们创建一个文件,这个文件的名字是固定的啊,这个是必须要满足协议的,那我们就是 skill, 大 写的 skill, 而且也是区分大小写的 md markdown 的 格式啊,这样的话我们就是在这个位置创建的一个 skill, 具体怎么安装的,各个平台不一样,而且它一直在变化,有时候可能会自动安装一般,呃,自动安装它其实是有一定风险的,就是说你如果说在里面写了更太多的权限,其实会造成一些问题的。我们打开这个 skill, 好,三个横线中间我们就写它的关键字 name, 跟我们的目录名称一样,然后下面是描述,你在写完之后也可以让 ai 来帮你改,我们在描述中只要包含三块内容, 然后第一个做什么的,然后什么时候调用,使用新特性的时候,然后还有触发条件,一些关键字的触发条件,这个添加完之后我们就可以 cloud 当中去安装,我们直接用语义告诉他要安装这个 skill, 那这时候我们再来列出所有的 skill。 好, 可以看到这就是刚刚我们手写的一个 skill, 下面我们要测试这个 skill 里面的内容,而且我们要确保这个 skill 能被调用到。 所以说我们在这里面加入一段描述,其实就用自然语言描述就行了。比如说我先加一个步骤,让它所有在所有代码前加一个注示啊,这个主要是为了测试一下我的这个 skill 调用了,其实在这里面你应该是写一些规则和一些代码的势力,让 ai 按照你的规则来去写入啊。测试前我们再给一下这个 skill, 在这里面我们除了正常流程之外,我们再加入一个现成词的流程,也就是说如果说你要让它生成代码里面包含现成词,我们就让它去渐近式的批露 swift pool md 里面的内容,同样呢,在这个 swift pool 里面呢,我们也只是放在同一个目录下面 reference 里面, 在这个里面我们也不加入任何的代码,我们只是说明一下,在代码前加入这样一个注示,这里面用指令让它生成 c d r 十四的包含现成池的代码。可以看到在这一步的话,它就已经进行了 sql 的 加载,然后读了一个文件,这个文件其实就读的我们现成池的代码, 这是我们看它最终生成的代码是否包含了我们加的两行注示。 好,可以看到我们两行注是夹在了它的生成的代码前面,就是我,也就是我们 script 的 执行成功了,我们再来准备一个 python 的 代码,这个 python 代码当中调用的一个执行程序,这个执行程序就可能是我们 c 加加或者是其他语言写的程序, 然后我们在 skill 点 m d 当中,我们把流程里面增加两项运行这个 python 脚本,并且输出控制台的内容就是我们再来测试一下,这里我们直接通过杠命令直接运行 skill, 可以 看到它是完成了任务, 并且打开了我们这个执行程序,我们再把这个做好的模型到 open code 当中去运行。在 open code 呢,它的兼容性比较强,我们可以直接把 cloud 里面的 skill 直接复制过去,甚至不用复制,你告诉他在哪边,让 open code 再进行一下安装。 我们安装完成,我们在 open code 当中再去执行这个 skill 去生成代码, 可以看到代码生成呢,它也调用了相应的说明文件,并最终执行了这个执行程序。 我们再到 cursor 当中, cursor 呢,目前它是 skill 安装在当前目录的点 cursor, 然后 skills 目录下面,然后我们可以手动复制过去,也可以就直接用让它去自己去安装,把文件复制过去,所以在这里面我们选择了让它自己安装, 安装完成之后我们确认,然后这时候我们来测一下这个 skill 输入生成代码的指令, 我打开了执行程序,在 ctrl 当中呢也完成了我们 skill 的 执行。最后到确当中,我们同样执行一遍流程,先是安装,然后执行, 安装过程基本上是一致,我就发现很多功能体到最后的所有的工具都趋同了,现在哪个工具好用不好用,其实我们都可以去试一下。然后一些使用的方法其实我们是可以同步过去的,然后可以看到这个安装好之后我们同样去执行这个指令, 可以看到执行的执行代码生成的,然后我们的执行程序调用需要我们确认一下,确认完之后 它也完成了调用。我们现在开发出的应用除了要提供 skill 之外,也要考虑支持 m、 c p。 以后所有应用的入口都是 ai, 你 的程序是一定要给 ai 调用的。最后记得点赞关注夏老师, ai 快 速发展时代还是要打好根基,想要学习 c 加加的同学可以看一下评论区。
