上期视频给大家展示的用 cloud agent skills 全自动化了,帮我们整理社群日报,我快速的给大家演示一下,比如说这是黄书志的一个网站啊,把每一天社群的群聊快速的做一个整理 啊,并且生成这样非常好看的一个样式,方便于社群的用户快速的浏览。昨天两个群里面发生了什么? 另外一个 skill 呢,是黄树自己监控了七个群,然后让 ai 全自动的帮我去提取这些群聊里面的共同的洞察,这些洞察里面呢,可以看到原始的对话信息。那刚这两个网站呢,其实就是我在谷歌的反重力 ide 里面呢,调用这两个命令,它就会全自动化的帮我完成。 当然也有很多朋友说啊,那黄叔你能不能讲一讲理论啊,跟我们说一下这一整套是怎么实现的,那黄叔在这里快速的用一两分钟的时间给他快速演示一下。首先我们来讲一下原理啊,那 我们自己的微信聊天数据库呢,是放在我们电脑上面的,但是呢,呃,官方会给他加一把锁, 如果我们想读取到里面的内容,我们就需要有一个钥匙,那这个钥匙呢,就是一个插件,叫做 chat log, 你 可认为它是打开下面锁头的一个钥匙, 如果它打开之后呢,它就相当于会形成一个通道,那我们的 colocole 就 能够通过锁头打开的这个通道读取到微信里面的聊天的数据。那这就是整个 colocole skills 的 包含的一整套自动化的东西, 我们会利用它这个 skills 批量的执行读取分析,生成网页的一个操作,所以这里面呢有几个核心的要素。第一个呢,我们要下载一个微信的低版本,当然在 windows 版本里面呢,我们其实最高只到了四点一点五。 然后第二个呢,下载一个对应的工具叫 chat log, 但这个 chat log 呢,全网其实已经下掉了,只在我们这里有啊。然后第三个呢,就是要执行一下解密的动作啊,这个是比较简单的, 然后呢就可以连接到 cloud go 啊,包括预装上这些对应的 chat log 啊,然后我们的题词也非常清晰,会给到大家。 那这样之后呢,你就可以去生成一个你专属的 skills, 因为我们这题词,你就能够让 ai 通过 chat log 提取到微信的各种维度的信息,它其实除了群聊信息之外呢,还有很多信息,比如说联系人的信息,所以你其实可以分析多个维度的,比如说我就分析了 我跟我媳妇聊天,最近九十天啊,她的心情分布是什么样的,对吧?很多很好玩的玩法啊,这里面都可以把它包装成 skills, 所以 你明白了吗?如果需要的话呢,也可以购买皇叔的社团,我们在社团里面见。
粉丝7781获赞3.5万

cloud agent skill 是 一个特别强大的能力,但市面上大多数人都在讲理论,没有人真的用它来讲实操。黄书接下来会用各种各样的 case 来给大家展示用 skills 实现的自动化工作。 今天给大家演示的是黄书自己运营的两个社群,每个社群呢,每天都会有大量聊天信息,那能不能用 skills 全自动化了,把它整理并且放到网上呢?哎,完全可以的,我们来看一下,比如说昨天的话,这个群里面聊了什么。第一个群 我们可以看到他有个非常清晰的一个结构,昨天的信息数据来源是群聊记录,可以看到有多少条信息,参与的人数啊,然后包括卷王的榜单,包括核心的一些议题。 这个是过两周皇叔要去杭州,然后很多同学就报名说啊,我们也要在线下举行一些活动来交流交流,包括这个京剧啊,包括资源的一些分享。我们的申请的朋友已经使用皇叔的 skills 呢去申请了自己的网站,那这里呢,皇叔是使用谷歌的反重力 ide, 用它的 workflow 来执行 cloud 的 skills 啊,然后呢,我只输入了一个它的命令,它就全自动化的帮我去进行运行,并且把日报生成,完成之后呢,自动的同步到 github 上面,大家在前端的页面上面就能看到刚才的样式了。 那这整个 workflow 或 skills 怎么调用呢?其实我在它的输入行里面只需要一个斜杠啊,那你看这斜杠里面呢,就有两个 workflow 啊,其中刚才的 daily report 就是 我们看到的群聊日报总结。另外这个 skills 呢,我们可以看一下它的 workflow, 它其实是我指定的若干个群聊,然后呢它统一的去这些群聊的信息里面去做收集,收集完之后整理成一份 html 的 文件报告直接给到我, 我们来看一下他的执行过程。看这个时候我只是在一开始输入个命令,然后呢他就全自动化的运行,他在这里面呢会逐个群聊的去进行数据的提取和洞察的分析,而我们要做的一切呢,其实就是等在这里,等了他的工作完成。 好的,大概等了三分钟左右,你看他的每一个群聊的消息数以及洞察数全部提取出来了,然后呢他输出在了这个文件里面,我们可以直接打开看一下。 好,这个网页呢,就能看到所有的洞察,包括这里面原始的对话,你都可以点开来看,比如说这个 cloud code skills 的 资源集合与自动化应用,我们可以看一下, 哎,你看这里面有些资源信息,我们都可以随时方便的去查查看。好,所以有了这么一个网页呢,你就相当于每天就有一个命令运行,就可以自动的帮你整理和汇总昨天你所关注的群聊里面的所有关键信息。 怎么样,这个 skills 是 不是非常方便?就是一个斜杠命令全自动化给你运行,你有什么想做的 skills 呢?欢迎在评论区留言。

hello 朋友们, cloud 十月份重磅发布了 skill 功能,已经过去了一个多月,我发现还是有很多朋友不太理解,甚至没有用过这个功能,所以本期视频会帮助大家彻底理解 skill 功能到底是什么,它有什么作用和玩法,以及它跟 m c p server sub agent command 的 区别以及优劣。那由于 skill 功能新出不久,除了 cloud code 之外,绝大多数 ai 编程产品还没有跟进, 为了让朋友们更好的上手,更好的去玩这个功能,本期视频使用的是国内唯一一家上了 skill 功能的 ai ide, 没错,是 ide, 没想到吧,它就是腾讯的 code body。 所以 大家并不需要非得使用 cloud code 才能玩 skill。 那 其实 skill 这个功能非常好的全释了我之前一直在说的 ai 编程工具并不是非要有编程基础,也不是必须得编程才能使用,它还可以做很多事情。 那本期视频也会从零到一的使用 code body 加 skill 功能,不写一行代码,使用自然语言交互,按照非技术人员的角度一步步做一个自动化流程的场景,朋友们无论是文科生还是技术小白都可以跟着思路去做一遍,相信你会发现新大陆 ok skill 到底是个什么东西呢?大家如果去翻看 cloud 的 官方文档,或者看很多博主对 skill 功能的介绍,你会发现大部分内容都在讲这是一个什么功能,以及它该怎么配置,怎么使用。但是我觉得如果想要真正把 skill 功能用好,不能只看操作手册, 我们需要从概念层面去理解这个功能到底是为了解决什么问题而诞生的 skill, 这个单词直译过来就是技能的意思。我们可以把触手状态的 ai 工具,比如 code body 或者是 color code, 想象成一个什么都不懂,赤手空拳的小孩子。 他很聪明,但他手里边没有工具,也没学过什么招式。这个时候所谓的配置 skill, 其实就是给这个孩子加点,给他加一个飞天的 skill, 他 就能上天。给他加一个遁地的 skill, 他 就能入地。 对应到编程工具里,这到底意味着什么呢?举个最痛点的例子,绝大多数的 ai 编程工具在处理文件时其实是文盲,特别是面对 excel 这种二进制或者是特定格式的文件时,直接甩给他一个 excel 文件, ai 通常是读不了内容的,这个时候 skill 就 派上用场了。我们可以做一个 excel 解析的 skill, 装进工具里。 当你再次选中 excel 文件发送时, ai 的 逻辑就变了。它会先调用这个 skill, 把 excel 里面的数据翻译成 ai 能看懂的文本格式,然后再去执行你的指令。 一旦理解了这个逻辑,朋友们的想象力就可以打开了。 skill 不 仅仅是读文件,它还可以是自动化脚本,比如生成一段爆款风格的视频脚本,也可以是工作流闭环,比如自动生成 ppt, 并保存到指定的路径。 所以 skill 的 本质其实就是让 ai 拥有了它原本不具备的手和脚,并且这个权限是给到用户的。也就是说,我们用户自己就可以给 ai 变成工具,增加更多的技能,让它可以做更多的事情。 我们直接进入实战演示环节,今天我们要完成的演示任务是在不写一行代码的前提下,委托 codebody 和 skill 做一个自动化任务的场景。我们希望当给出了一个主题以及参考文件后, ai 可以 调用相关的 skill 来帮我们自主调研解析文件,最终生成 ppt。 ok, 那 在开始之前,我们还是要先安装 codebodyid, 有 海外版和国内版,这里我们安装海外版,访问 codebody 官网,点击右上方的 log in, 直接使用 google 或者是 github 授权注册并登录。登录成功之后,我们再回到首页这里点击下载,然后我们根据自己的电脑处理器选择对应的版本进行下载安装就好了。安装完成之后,打开应用,选择中文。 酷狗也是基于开源 ide vs code 之上构建的,所以如果朋友们有在使用 vs code 或者是 cursor 的, 可以一键导入它们的配置,然后就是一路 nice, 最后点击登录会跳到网页授权登录,我们点击确认就登录完成了。 登录完成之后,我们直接点击 new folder, 创建一个空白的文件夹作为工作区。到这里我们的准备工作就做好了。 ok, 我 们简单介绍一下酷狗八 d 的 功能,相信大家或多或少都有接触过 ai ide, 那 酷狗八 d ide 也是类似的。右侧会有一个 ai 聊天窗口,它有两种模式,分别是 craft 和 ask 模式。 craft 模式用于自动帮助我们完成复杂的编码任务,类似 cursor agent 模式。 ask 模式用于帮助我们解答代码库以及其他编码问题。类似 cursor 的 ask 模式,它不会主动帮我们修改代码,我们有什么不懂的,可以在 ask 模式下问,然后在 craft 模式下让 ai 完成编程任务。 同时库拉巴蒂也支持计划模式。当我们在 craft 模式下打开计划模式开关后,发送问题, ai 会先帮我们列一个计划,我们也可以补充修改,最终确认了才会去执行任务。 模型选择的话,我们选择 default 就 可以,因为这个默认模型下支持的能力比较多。虽然不知道底层到底是用的什么模型,不过效果还不错。 ok, 我 们暂时先了解这么多,后面做任务时有涉及到,我们再介绍。大家可以思考一下,让 ai 去完成一个任务的核心是什么?没错,是 prompt 提示词。很多朋友觉得提示词设计是一个技术活,其实不是这样的。如果朋友们在二四年就开始用 ai 编程工具,你会发现最开始的提示词慢慢变得可以越来越像一个人的表达。 虽然目前达不到完全你和人的表达,但是现在的提式词设计也没有那么专业且复杂了。那我们就以一个技术小白的视角来帮助大家理解提式词设计的思路。首先,我们可以用一句话来描述我们的核心诉求, 我想做一个能够自动生成 ppt 的 cloud skill, 请帮我实现它。注意,这里描述 cloud skill, 而不是单纯的 skill, 是 为了让 ai 能够清楚地知道我们要做的是一个基于 cloud skill 规范的 skill。 其次,我们还需要交代任务背景。我经常要做 ppt, 有 时候是一个想法,比如分析一下新能源汽车市场,有时候手头有一些现成的资料,比如 pdf 文档或者 excel 数据表,那我需要基于这些资料产出 ppt。 我 希望这个工具能帮我一键搞定,这就是它的背景。然后我们还需要给出一些具体的要求。 第一,要能懂我的输入。如果我只给了一个主题,你要能自己去网上搜集资料,整理出内容。那如果我给你传了文件,比如 pdf 报告,或者是 word 文档,再或者是 excel 表格,你要能看懂里面的内容。 第二点就是内容要丰富,不能只有字,你要把搜到或读到的内容整理成 ppt 的 页面。最重要的是,如果你搜到或读到的内容里有规则数据,你要能把它变成图标,比如柱状图、饼图、折线图、流程图这些。 三、生成的 ppt 要好看。因为我不喜欢 ppt 自带那种丑陋的默认配色。我希望生成的 ppt 是 莫兰迪色系的,颜色要柔和,高级、低饱和度。每一页的背景不要是白板,要有一些简单的设计感,比如用两种柔和的颜色,渐变磨砂、毛玻璃这种背景特效,但不要太花哨,不能影响我看字。 最后,我们还需要描述出需要 ai 做什么,也就是给他的任务。那请根据我上面的描述,告诉我该怎么做这个 skill。 请用通俗易懂的语言列出会包含哪些功能,如果确认没问题,再帮我生成第一版的代码。请不要试图在一个 skill 中完成所有的工作,采用关注点分离的原则,每个 skill 只做一件事。 那最后这句话来源于 cloud 官网针对 skill 教程中的建议,这样一份简单基础的题词就做好了,我们只需要在其中清晰地表达出自己的想法,不需要太细致。大家要注意的是,这并不是一份最优的完善的题词词,但一定是一份还可以的基础题词。所以没关系,因为我们还需要让 ai 来完善一下。 ok, 回到 control 模式,发送基础提示词,等待 ai 的 回复。可以看到 ai 将我们的需求梳理了一下。那由于我们之前的基础提示词细节是不太够的,所以我们需要过一轮 ask 来让 ai 梳理。 那基于 ai 的 回复,我们可以再进行补充。这个补充可能是 ai 忽略掉的点,也可能是新补充的需求。那比如这里我们可以补充两条。 第一条,当深度搜索或读到的内容里面有规则数据,需要能把它变成图标,包括它不仅限于柱状图、饼图、折线图等等。第二条,用户输入可以只有主题,也可以只有附属文件,同时也可以两者都包含。你可以使用不同的 skill 来并发处理这些任务。 ok, 我 们需要等待一下 ai 的 生成。 ok, 我 们可以看一下整体的工作流程。 当确认无误之后,我们就可以切换到 craft 模式来让它帮我们逐步去生成。 这里由于任务量不小,所以我们需要等待一会儿。我们可以看到, codebody 在 创建 skill 时,其实也调用了一个叫 skill 杠 creator 的 skill, 这个 skill 是 用来帮助用户创建一个合格的 skill 的。 这说明库德巴蒂内部的工作流中也集成了一些 skill 作为扩展。这在 skill 没有出现之前还是比较麻烦的,因为之前想要扩展功能,大部分是靠方式拷令或者是 mcp 来实现,那有了 skill 之后,扩展一些能力就比较方便了。 ok, 执行完成之后,我们来看一下生成的这些文件内容。 可以看到点儿 code 八 d 文件夹下面有一个 skills 文件夹,这个目录其实就是 skill 的 配置文件。 cloud code 中是在点儿 cloud 文件夹下面,虽然配置文件夹名不一样,但是 skill 是 通用的,也就说这里生成的 skill 在 cloud code 中依然是适用的。 可以看到它帮我们生成了五个 skill, 每个 skill 只处理一种任务,组合起来就可以完成我们这个自动化的任务。 第一个是深度搜索的一个 skill, 它是用来帮助我们联网搜索并整理主题相关的资料。那第二个是莫兰迪美学的一个 skill, 用来提供莫兰迪配色和美学设计。那第三个是文档解析的 skill, 用来解析 pdf、 word、 excel 文件。 那第四个是 ppt 生成的 skill, 它是用来整合所有的输入,生成最终的 ppt 文件。那最后一个,也就是第五个是图标生成的 skill, 用于分析数据,并且推荐最优的图标类型,并生成。 下面的这些文件是它帮我们生成的相关文档。我们来看一下 skill 的 文件结构。 skill 点 m d, 这个是 skill 的 核心,也是必要文件,那除了这个文件,其他都不是必须的。那这个文件的组成是 skill 的 一个最小单元, 它定义了 skill 的 名称、用途说明,以及具体应该如何操作或执行。至于这个文件的内部结构以及内容该怎么写,我不建议大家记,也不建议大家自己去写这个文件。 a 生成它不香吗? access 通常放一些静态文件,比如图片,字体等等。 reference 通常放一些附加的参考文件。 script 用来放一些可执行的脚本,它还是蛮重要的,因为想要给 a 阵的扩展一些能力,大多都需要通过脚本来完成。那这三个文件夹都是可选的, 它们都是官方推荐的文件夹,命名分类我们也可以不遵守,因为所有的文件或者是脚本的调用以及执行,都需要直接或者是间接的在 skill 的 md 文件中写明。 ok, 那 接下来我们就来测试一下生成的这个 skill 的 效果。 我们直接拖进来一个 pdf, 然后选中这个 pdf 输入,请你调研 ai coding 行业现状,结合资料帮我生成一份 ai coding 行业报告研究的 ppt。 那这个文件是前段时间腾讯研究院出的一个 ai coding 的 非共识报告 pdf。 ok, 我 们输入完了之后,回车 可以看到 ai 帮我按流程调用 skill 来完成这件事情。这里需要注意的是,由于这里面涉及到脚本的执行,比如 skill 有 一个 python 脚本,那我们本地就得安装了 python 环境才可以执行成功。那如果大家没有装脚本的执行环境不成功的话, ai 会有提示, 我们可以根据提示去安装即可。当然我们也可以提前安装好环境,如果不会安装的话也非常简单。右上角先打开一个聊天框,使用 ask 模式去问 ai 应该怎么样安装,然后按步骤安装就可以了。 ok, 生成好之后,我们来看一下最终的 ppt, 目前还是有点问题的,我们可以基于现行 ppt 的 问题,然后再补充一下, 第一条是让 ppt 图标支持中文,第二条是让 ppt 里面的图标按比例缩放到合适的大小,那第三条是调研和解析 skill, 可以 并发执行。第四条是生成 ppt 之后移除掉多余的文件。 ok, 我 们等待一下生成结果。 生成好了之后,我们先把之前测试生成的这些文件删掉, 然后我们再次跑一下测试任务。生成好 ppt 之后,我们打开来看一下效果,哎,这次的效果还可以,比上次要好很多。 效果还行,但是整体的 ppt 结构不是很完善,所以还需要补充优化一下。那优化的思路也很简单,比如这里我们需要强化 ppt 的 结构,如果我们不知道怎么表达,可以直接先打开一个聊天框,选中 ask 模式,然后输入一个完整的 ppt 应该包含哪些模块。回车, 可以看到 ai 帮我们列出了 ppt 的 组成模块,哎,我们就可以切换为 craft 模式,让 ai 基于它说的去优化。我们还是要等待一下 ai 的 生成结果, 那生成完了之后,还是要重复之前的步骤,把之前测试生成的一些文件先删掉,然后再重新执行一下测试, 把文件拖进来,还是原来那个问题。回车, ok, 生成完了之后,我们再次打开看看效果,那这次生成的 ppt 内容也符合常规的 ppt 结构,还可以,那整体也还行, 那整个 ppt 生成的思路大概就这样,我们还可以继续迭代优化,比如扩展一个专门用于 ppt 背景生成的 skill 来制作好看的 ppt 背景,渐变背景、抽象艺术风格背景等等等等。那无论使用脚本生成,还是直接使用用户给定的背景图都行。 也可以梳理一个 ppt 的 文本排版结构,让 ppt 的 内容结构更规范,看上去更统一一点。 呃,同时,我们还可以约束 ppt 生成的内容,根据不同的 ppt 主题使用不同的字体。甚至也可以结合图像生成的 mcp server, 按照 ppt 主题动态生成一些图片,插入到 ppt 中。甚至,如果你不知道怎么优化,可以让 ai 读一下当前的 skill, 给出一些业务上的优化建议,再根据他的建议去问 ai 要方案,最终再让 ai 去生成。我们只做一个无形的打字机器,然后等待 ai 生成内容,然后不停地去 review 就 可以了。大致思路就是这样。 其实很多人会问, skill 和 m c p server, sub agent, command 到底有什么区别?这几个概念确实容易混淆。为了直观区分,我们用钢铁侠做比喻,把 ai 工具中的 agent 理解为托尼的贾维斯战甲系统。 某天,托尼给战甲装上了一个掌心炮。当托尼说贾维斯解决前面那个敌人,贾维斯通过分析知道老板想干架了,于是自主决定调用掌心炮去射击。这里的掌心炮就是 skill, 它是战甲的一个具体能力。 那托尼心血来潮了,还可以给战甲增加镭射炮、电磁脉冲等等,这些都是 skill。 用不用 skill, 怎么用,通常是 ai 思考用户指令后决定的。 ok, 接下来,托尼给贾维斯写死了一条设定,当自己明确喊出自毁程序启动时, 贾维斯不需要思考,也不允许反驳,必须立刻锁死盔甲,销毁数据,然后自爆。这就是 command 自定义指令。甚至托尼还可以设置一个快捷指令,比如大喊发射,就直接触发掌心炮。跳过贾维斯的思考过程, command 和 skill 的 功能区别就在这儿。 command 是 人类的强制命令,它是为了快捷执行一组写死的动作, 那这组动作里当然也可以包含 skill。 后来,托尼觉得贾维斯要干的事情太多了,又要管飞行,又要管能量,脑子不够用。为了给贾维斯减负,他制造了一个独立的卫星系统维罗尼卡,也就是复联二的反好客装甲。这个系统有独立的判断力,当好客发疯时,贾维斯只需要发个信号,维罗尼卡,该你上场了。 然后维罗尼卡就会全权接管。他怎么组装零件,怎么锁住好客,怎么修补战损,全是维罗尼卡自己在算。贾维斯不需要操心,这个专门用来处理好客发疯问题的独立系统,就是 cyber agent 自智能体。 最后,托尼想让贾维斯变得更强大,但他发现,想连接神盾局的数据库需要破解密码。想要控制银河护卫队的飞船,还得重新学习外星语言,而且还得有这个权限,太麻烦了。 于是,托尼和神盾局、银河护卫队坐下来,商定了一个全宇宙统一的接口标准。那神盾局说,我按照这个标准开放数据。银河护卫队说,我按照这个标准开放飞船的控制权。而贾维斯只需要装上这个 m c e 接口,就能读取神盾局的机密,或者是驾驶外星飞船。 当然,托尼自己也遵循 m c p 规范开放了接口,神盾局的电脑也能反过来读取贾维斯的数据,这就是 m c p。 它是一个开放的万能协议,可以让不同的系统、不同的公司之间能够像叉 usb 一 样共享数据,共享能力。 听完这个类比,我相信大家在打开 ai 工具的配置页面时,脑海里就有画面了。 skill 是 贾维斯的工具库,它决定了 agent 可以 干什么事情。 command 是 贾维斯的快捷指令,它可以强制 agent 不 经思考的干一些事情。 sub agent 是 贾维斯的帮手,它可以帮助 agent 分 担一些特定任务。 m c p 是 贾维斯的万能插头,它可以帮助 agent 连接外部世界。 ok? 为什么大家会混淆这几个概念?因为它们在功能上有重叠,甚至我们可以用四种方式来达成同一个目的。 那就以解析 excel 表格为例,你会发现四条路都能走通。我们可以给 agent 做一个 skill, 这个 skill 会执行 python 脚本解析 excel agent 想看 excel 数据时,直接调用这个解析的 skill 就 可以了。 我们也可以给 agent 连接一个解析 excel 的 mcp server, agent 通过标准接口把文件发过去,对方解析完再把数据传回来。当然,我们也可以写死一个指令,比如斜杠 pass excel, 当输入一个流程,直接运行脚本,把表格转成文本。 我们甚至还可以做一个专门做数据分析的 sub agent, 当选中 excel 文件时, agent 就 会把它交给 sub agent。 sub agent 可能自己写了段代码,或者是调用了些工具来把数据搞定。 这四个功能都可以做到这件事,那既然都能干,它们的本质区别到底在哪里?这就要聊到它们是为了解决什么问题而诞生的。 command 是 为了确定性。虽然我们喜欢用自然语言跟 ai 聊天,但是在某些时刻,自然语言是低效而且危险的。比如你想重置对话,你总不能说请帮我把之前的记忆都忘掉。你肯定想更简单一点。 诸如此类需要的系统级操作,比如保存、退出、格式化,我们需要百分百的确定性。 command 的 诞生就是为了绕过 ai 的 思考过程,它是一种上帝模式的介入,为了保证关键操作绝对准确,绝对快速,必须由硬代码直接接管,而不是让大模型去猜要不要调用。 m c p 是 为了互操作性。它是 ai 时代的 usb 协议,只在终结各自为战的局面,因为只要大家都遵循这个协议,一次开发就可以处处运行。它可以让 ai 的 跨系统操作不再有壁垒。 skill 是 为了扩展能力,它的诞生是为了给 ai 这个大脑装上手和脚,让它能够联网获取最新信息,能调用代码精准计算,能读取文件,获取事实。它的核心目的是让 ai 做一些现实的操作。在这之前的一些 ai 产品可能会使用 function calling 扩大大模型的能力,但 skill 不 同, 它可以让用户自己去定义技能,扩展 agent 的 能力,这点 mcp 也可以做到。但是相比之下, mcp 太复杂了,那有了 skill, mcp 只需要专注于外部互联这一件事情上。 最后的 sub agent 是 为了分工协助。当我们只有一个主 agent, 会存在两个非常严重的问题,第一个是角色冲突。当我们让 agent 既做产品经理又做程序员,在同一个对话框里,一会聊这个,一会聊那个, ai 很 容易精神分裂。 第二个是记忆混乱,当一个上下文窗口过大时,就会出现长上下文的注意力衰减的问题。之前聊得记不住了, sabotage 的 诞生就是为了效仿人类的分工,协助每个 sabotage 只做某种类型的任务,并且每个 sabotage 都有单独的上下文,那现在你清晰了吗? ok, 朋友们,回顾一下本期视频的内容,我们介绍了 cloud skill 的 概念以及 skill 和 mcp、 sabotage、 command 的 区别。 同时我们实战了一个小伎俩,没有去肯福达的 api 文档,也没有写一行代码,只是动了动嘴,告诉 codebody 我 们想要什么,然后做成了 skill, 让 ai 真正拥有了自动做 ppt 的 手脚。这就印证了我在视频开头说的那句话,在 ai 时代,编程工具不再是程序员的专属, 是每一个有想法人的魔法杖。当你学会了 skill, 就 等于学会了怎么给你的贾维斯制造掌心炮,你还可以给他接上不同的 m c p server, 或者是直接组一个 safari agent。 这一切的起点都从你亲手定义的第一个 skill 提示词开始。所以别光看着了,赶紧去试试吧。那如果大家不习惯, cloud code codebody 是 目前国内唯一一家能够体验 skill 功能的 ai ide, 大家也可以自行下载体验。无论你是想做自动周报生成器、小红书爆款文案生成,还是股票数据分析等等等等的 skill, 请打开你的脑洞。 如果你做出了好玩的 skill, 欢迎在评论区分享你的创意,这里是不正经的前端,如果你觉得这期视频对你有帮助,请务必一键三连,我们下期再见,拜拜!

今天皇叔做了一个 skills 啊,我觉得 nba 真的 肯定死了。来,我们先来看一看这个 skills 是 干嘛的,以及为什么皇叔觉得他完全替代了 nba。 我 们来看这个 ai 生成的他选定报告啊,他总共抓了一百一十八篇的文章,然后呢,从里面根据热度分析出了 top 十的热门文章内容。 那这些文章内容呢,其实就意味着说当下这篇文章的内容质量、热度,包括用户的认可度都是非常高的, 也就是给我们提供了一些选择题的参考建议。那在他的背后呢,其实是这个多维表格,他把一百一十八篇所有文章内容的标题链接和所有的数据都抓了下来, 然后他是通过订阅逻辑,把这三十七个黄书关注的公众号全部对应的内容抓取。 ok, 那 这个 skills 牛就牛呗,为什么你说它要替代 n 八呢?因为这个 skills 呢,其实它是完全模仿之前饼干哥哥做的,用 n 八加菲舒做一个 ai 公众号自动化小题的 a 卷工作流, 你看啊,完全一模一样,它是给了一个小题策略的分析报告,然后,对呢,它也是这么一个流程,以及说做了一个还挺复杂的 n 八 n 工作流。 那这个工作流呢?皇叔之前薅着饼干哥哥给我好好的讲了大半天,才把整个工作流打出来,那现在我用 skills 非常快的用一个小时就完全复刻出来了,你说夸不夸张? 来,我们来仔细看一下这个 skills 它到底做了什么?它总共分为六个模块,订阅管理、自动采集、数据存储、数据分析啊,包括我自己家的 skills 潜力评估,以及最后的报告生成。 然后呢,你只要运行这个 sql 呢,它先会去读取整个定位列表,就是这张表,你总共关注的哪一些公众号?接着第二步呢,去便利这里面的每一个公众号,使用一个 api 来读取这公众号里面的所有的最新文章,它会做一个驱虫的处理。 第三步呢,会去处理每一篇新文章,会去拿它的正本,然后包括打标签或去对应的数据。 然后第四个呢,哎,把它批量的写入到飞书存进去啊。第五步呢,输出最后的采集报告, 那整个这个 skills 啊,包括它的工作流啊,其实非常有价值。为什么呢?因为皇书现在不断的要找什么样的 skills, 是 做出来之后大家觉得好用享用的,所以呢,我把它整个公众号的订阅的机制就非常快的加了一个。什么呢? 加了一个转为 skills 的 可能性,对于每一个可能性进行推荐,星级哎,所以你都可以看到,我能够很快的就知道说什么样的好内容是别人需要的,以及说它可以转为 skills。 所以 大家可以期待啊,黄书后面会持续的产出更多优质的好的, 大家喜欢的 skills, 如果你希望黄书产出更多高质量的 skills 的 话,请你一定要点赞收藏,关注,我是爱产品黄书,我们下期见。

朋友们,用 cloud skills 做你的 ai 牛马,替你打工真的特别爽!今天分享的是我怎么用 skills 帮我自动校对字幕。 如果你剪过视频,给视频配过字幕,你肯定经常遇到一个问题,剪辑软件自动识别出来的字幕有很多的问题,你经常需要一个个去修改,这会浪费你很多时间。 我们来看一下,这是我昨天录制的视频剪映给我自动生成的字幕稿,这里面有几处明显的错误,第一个,他把 damco 这个人名识别成了 damco。 第二个,他把 seo 文章识别成了 seo 文章。第三个,他把 alpha fold 分 开写了。 除了这些拼写问题之外,还有一些书写规范的问题。如果把这些问题全都改完,我至少需要花十到二十分钟的时间。但现在我完全把教授的工作交给了 skills。 我 们先把文件导出,点击文件导出, 把字幕文件导出到指定的文件夹。接下来,我们在 b s code 里打开 call code 的 对话页面,我只需要在输入框里输入叫对字幕,点击发送, cloud 就 会调用对应的 skills 帮我进行字幕的叫对。 一分钟后,我们就可以看到 cloud 完成了叫对任务,它给出了字幕叫对报告以及每一条修正详情。 那这个 skills 是 如何执行任务的?第一步,他会根据我们指定的文件夹去定位文件,然后读取其中的字幕。接下来他会逐条进行校对,最后把校对修改完之后的文件保存起来,替换原文件,最终输出给我们一个详细的修改报告。 在这个 skill 里,我规定了两部分规则,一部分叫严格规则,就是那些绝对不能违反的规则,比如不允许改我的时间错,不允许合并或拆分字幕的条目,以及不允许改变视频的原意。我还定义了几条非常重要的叫对规则,比如术语必须准确, 英文首字母必须大写,以及新概念和会色的术语必须要加双引号。通过这些规则,它就能严格按照我的要求完成字幕校对。 有了这个 skill 之后,你再也不用苦哈哈的一行行修改字幕了,真的特别方便。 cloud skills 真的 是当前最强的效率魔法,建议你立即使用。今天的分享就到这里了,你还想用 skills 帮你解决什么样的问题?欢迎在评论区跟我留言,我们下期继续。

大家新年好,这篇黄书有一期视频是让 ai 访堂里,然后自动出文章,那它出来的呢?就是这样一个 md 格式文章,这样的文章 ai 写完之后,能不能自动的让它发到公众号里面呢? 哎,今天我们就来教教大家怎么实现它。看黄书操作第一个斜杠,然后呢,选择第一个命令, 接着我把这篇文章拉过来,直接回车,接着我们等待他魔法的执行,看他接下来就会执行这若干个步骤。第一个他获取到说我的公众号之前已经绑定好了,然后他会来问我,我想要的什么样的主题的风格,比如这次我要蓝色专业的, 然后发普通的公众号文章,直接提交看刚才整个过程我就会去掉 none 去生成一张封面,图, 完之后呢,他会把这张图片传到一个图层上面,获得一个在线链接,接着把本地的文档做一个格式的处理,最后通过 api 推到公众号的草稿箱,我们接下来看一下公众号好看,刚才这篇文章就出来了,看这个封面, 阿宝姐瞪大眼睛,那一刻我知道这是能成,你看,哈哈哈。然后他的整个格式都是按照刚才指定的那个要求去生成的。好,那他整个步骤怎么实现呢?皇叔这里快速给大家讲一下。 它其实核心的逻辑是输入内容是一个 md 文档,然后中间经过了那 nobel 生成封面图,然后把图片转为在线链接, 再把整个文档转为适配公众号的一个格式,最后通过 api 发布到公众号,那里面用到了所有的模型和图层,这里面黄书都有了介绍, 当然如果你还是不清楚的话呢,可以加入皇叔的 ai 编程社团来好好的学一学,里面呢有国内最全最新的最实操的 colorado skills 的 教程。怎么样把文档一键发布到公众号草稿箱,你学废了吗?欢迎点赞、收藏、转发,我们明天再见!

二零二五年十月十六号, anthropic 正式推出了 agent skill。 起初官方对它的定位相当克制,只是希望用它来提升 cloud 在 某些特定任务上的表现。但大家很快发现,这套设计实在是太好用了,因此行业里很快就跟上了节奏,包括 vs code、 codex、 curser 等工具都陆续加入了对 agent skill 的 支持。在这样的背景下,十二月十八日, anastropics 做出了一个重要决定,正式将 agent skill 发布为开放标准,支持跨平台、跨产品服用。 这意味着 agent skill 已经超越了 cloud 单一产品的范畴,正在演变为 ai agent 的 领域的一个通用的设计模式。那么这个让大厂纷纷跟进的 agent skill 到底是解决了什么核心痛点?它和我们所熟悉的 mcp 又有着怎样的区别和联系呢? 今天这期视频我们就分几个部分彻底讲清楚这个 agent skill。 我 们首先从 agent skill 的 概念出发,也就是给大家讲明白 agent skill 到底是个什么东西。然后我来给大家演示一下它的基本使用方法。 在了解了基本用法之后,我们再来看看它的高级用法。高级用法一共是包含两块,分别是 reference 和 script。 最后,我会把 agent skill 和 mcp 做个比较,告诉你到底应该选哪一个。 好了,话不多说,让我们直接开始哦,不好意思,只是想证明自己不是 ai, 那 我们现在真的要开始喽。 那什么是 agent skill 呢?用最通俗的话来讲, agent skill 其实就是一个大模型,可以随时翻阅的说明文档。 举个例子,比如你想要做一个智能客服,你可以在 skill 里面明确交代,遇到投诉得先安抚用户的情绪,而且不得随意承诺。 再比如,你想要做会议总结,你可以直接在 skill 里面规定,必须要按照参会人员一提决定这个格式来输出总结的内容。这样一来,你就不用每次对话都去重复粘贴那一长串的要求了。大模型自己翻翻这个说明文档就知道该怎么干活了。 当然,说明文档只是一个为了方便理解的简化说法,实际上 agent skill 能做的事情要远比这个强大,它的高级功能我们待会儿就会讲到,不过在目前的起步阶段,你就把它当成是一个说明文档就行。下面我就用会议总结这个实际的场景,带大家看看它到底是怎么使用的。 这里我们使用 cloud code 来演示如何使用 agent skill。 要想使用 agent skill, 那 当然是要先创建一个了。 根据 cloud code 的 要求,我们需要在用户目录下的 dot cloud skill 文件夹创建我们的 agent skill。 所以呢,就让我们先进入到这个文件夹中,然后执行 maker 会议总结助手来创建一个文件夹,这个文件夹的名字就代表了我们 agent skill 的 名字,然后再使用 vs code 来打开这个文件夹,这样的话我们编辑文件会更方便一些。打开这个文件后,我们在里面创建一个叫做 skill 点 md 的 文件, 然后填好这个文件的具体内容就是这样了,每一个 agent skill 都需要有这么一个文件,它用来描述这个 agent skill 的 名称,能干什么事以及怎么干这个事情的。比如我们这里要创建的 agent skill 就是 用于总结会议目录内容的, 它的 skill 点 m d 一 共分为两部分,头部的这几行被两段短横线包起来的是叫做原数据,英文叫做 matte data, 这一层就只写了 name 和 description 这两个属性。 name 呢是 agent skill 的 名称,必须与文件夹的名字相同。 name 的 下面呢是 description, 它代表这个 agent skill 的 描述,主要是向大模型说明这个 agent skill 是 用来干什么的。然后再看下面剩余的部分,这个呢就是具体的 agent skill 的 说明了, 官方把这一部分呢是叫做指令,对应的英文是 instruction, 这一部分就是在详细描述模型需要遵循的规则。比如说你看这里,我规定了它必须要总结参会人员议题和决定这几个方面的内容, 然后为了确保他真的理解了,我这里还举了一个例子,输入的是会议的录音内容,然后输出的呢就是我们所需要的格式了。好,现在我们的 agent skill 应该是做好了。对,就是这么简单,就是一个说明文档, 下面我们打开 cloud code 来验货,首先随便找一个空目录,打开 cloud code, 然后输入下面这个问题,你有哪些 agent skill? cloud code 给我们回答了,可以看出他已经发现了我们写好的 agent skill。 然后我们来看看 cloud code 是 怎么使用这个 agent skill 的。 我们输入请求总结以下会的内容,然后粘贴一段会议录英文本回车,让我们看看 cloud code 会如何应付我们这个问题。 好, cloud code 有 反应了,大家注意看屏幕,这里 cloud code 并没有直接开始下编,他根据我的指令意识到了这事归我们刚才上传的那个 agent skill 管,所以呢,他是在向我询问能不能使用这个 agent skill, 那 我们当然是同意了。同意之后,他就开始读取我们写的那个会议总结助手了,主要就是读取其中的那个 skill 点 m d 文件,让我们稍作等待 好,结果出来了,参会人员议题决定三点都清清楚楚,这完全符合我们在 skill 里面定的规矩。这个呢,就是 agent skill 的 基础用法了,是不是很简单?现在你知道了如何创建和使用 agent skill, 那 不妨让我们想想刚才到底发生了什么。 首先,整个流程中一共有三个角色,用户 cloud code 以及 cloud code 的 背后所使用的大模型。在我们的例子里,这个就是 cloud 模型 流程一开始的时候,用户会输入请求,此时 cloud code 会把用户的请求连同所有 skill 的 名称和描述一起发给大模型。注意,这里只带了名称和描述, 也就是我们前面所说的 skill 原数据层。虽然说我们之前只演示了一个 skill, 但是你可以想象一下,哪怕你装了十几个 skill, 此时的大模型呢,也只是在看一份轻量级的目录, 因为毕竟只有名称和描述嘛。在接到了用户请求和每一个 skill 的 名称描述后,大模型会发现用户的请求呢,可以使用会议总结助手这个 agent skill 来解决, 此时呢,他就会把这个信息告诉 cloud code。 cloud code 接到大模型的响应之后,会去会议总结助手那个目录里面读取完整的 skill。 md 正文儿对,这个时候读取的呢,才是 skill md 的 全部内容,之前就只是名称和描述, 而且要注意,他只读取了会议总结助手这一个 agent skill 的 内容哦。在拿到了会议总结助手的 skill md 内容后, cloud code 会把用户的请求和完整的 skill md 内容发给大模型, 大模型会根据 skill 点 m d 的 要求来生成响应,并且把响应发给 cloud code, cloud code 进而呢,会把这个响应发挥给用户,这样呢,用户就会看到结果了。 这就引出了 agent skill 的 第一个核心机制,按需加载。虽然 skill 的 名字和描述是始终对模型可见的,但具体的指令内容只有在这个 skill 被选中之后才会被加载进来给模型看,这个呢,就节省了很多的 token 了。 前面我们讲了,一开始 cloud code 会把所有 agent skill 的 名称和描述都给到模型,比如说什么爆款文案 skill、 会议总结 skill、 数据分析 skill 等等, 模型呢,会从中选择一个,之后只有选中了那个 skill 的 skill 的 md 文件才会给到模型。说白了呢,就是按需加载, 这个呢,已经很省 token 了,但是它还不够极致。大家试想一下,我们的会议总结助手可能会越来越高级,我们希望它不仅仅是简单复述,而是能够提供更有价值的补充说明。 比如说,当会议决定要花钱时,它能直接在总结里标注是否符合财务合规,当涉及到合同时,它能够提示法务风险。这样大家在看会议总结的时候,就不需要再去翻规章制度,一眼就能够看到这些关键的补充信息,这就非常方便了。 但问题在于, skill 能做这些事情的前提是它要把相关的财务规定和法律条文都写入到 skill 点 m d 文件里,这些文件可能会非常长,都写进去的话, skill 点 m d 文件就会变得无比的臃肿, 哪怕只是开个简单的早会,都要被迫加载一堆根本用不上的财务和法律。废话,浪费模型资源。 那能不能做到暗虚中的暗虚呢?比如说,只有当会议内容真的聊到了钱, cloud code 才会把财务规定加载给模型看。 其实这个呢,也是可以的, agent skill 呢,提供了 reference 的 概念,干的就是这个活,让我们来试一下。首先我们来给它加一个文件,也就是 agent skill 术语里面的 reference。 我们把这个文件叫做集团财务手册,里面写明了各种费用的报销标准,比如说是住宿补贴五百一晚,餐饮费人均三百一晚之类的。然后我们在原来的 skill 点 m d 文件里面新增一个财务提醒规则,里面写明仅在提到钱预算采购费用的时候出发。 出发的时候呢,需要读取集团财务手册,点 m d 这个文件,根据文件内容指出会议决定中的金额是否超标,并明确审批人,这就可以了。我们回到 cloud code 这里再试一下。 这次我们的请求仍然是总结下这个会议的内容,不过呢,这次使用的会议内容稍微换了一下, 这段对话呢,我们就不细看了,你只需要知道,在这段对话里面,老陈让小李订一千二百一晚的酒店,这涉及到了钱。按道理来说, cloud code 应该触发我们刚才新增的财务提醒规则,让我们看看 cloud code 能不能意识到这一点。 首先, cloud code 意识到了这个请求跟我们的会议总结助手相关联,请求使用这个 agent skill, 我 们同意。 然后他意识到了这个会议跟钱相关,根据 skilled md 文件的指示,他请求读取集团财务手册,这个文件用于查看里面的财务合规信息,这个呢,我们也同意。 最后,他根据实际的会议内容生成了总结,可以看出,总结中不仅包含参会人员、议题、决定等基本信息,还包含了财务提醒,这完美符合我们的需求。 这个呢,就是 reference 的 核心逻辑了。在 agent skill 的 体系里面,集团财务手册点 m d 这个文件就是一个典型的 reference, 请大家记住它的特性,它呢是条件触发的。 在刚才的例子里面,只有当 cloud code 读取完 skill 的 md 文件,判断出需要查账时,才会去加载这个文件。反过来说,如果这是一个跟钱无关的技术复盘会,那么这个财务文件就只会躺在硬盘里面,绝不会占用哪怕一个 token 的 上下文。 好,讲完了 reference, 接下来我们来讲讲如何让 agent skill 跑代码,毕竟查资料只是第一步,能直接动手运行代码,帮我们把活干了,这才是真正的自动化。这个呢,就用到了 agent skill 的 另一大能力, script 让我们在文件夹里面创建一个 python 脚本,文件名就叫做 upload 点 pi, 用于上传文件。之后我们填好这个代码文件的内容,然后我们来到 skill 点 m d 这个文件里再加上一段关于上传规则的描述, 如果用户提到了上传同步或者是发送到服务器这样的字眼,你必须运行 uploader pi 脚本,将总结内容上传到服务器。然后呢,我们来到 cloud code 这边,输入请求,总结下这个会议的内容,并把它上传到服务器中,然后我们粘贴会内容。 跟之前一样, cloud code 意识到了这个请求与我们的会议总结助手相关,所以呢,他请求使用这个 agent skill, 我 们同意,然后他把会议的总结内容输出了出来,并准备上传到服务器中,他请求执行 up 六点 pi 文件来实现这个功能,我们也同意 好,上传成功。而且 cloud code 还把上传相关的一些信息也展示了出来,非常棒。 这里面呢,有个小插曲,大家注意一下,我这次所使用的会议内容跟钱其实没什么关系,所以 cloud code 呢,也并没有去读取集团财务手册那个文件, 结果中呢,也没有财务提醒相关的内容。这正好印证了我前面所说的观点, reference 是 按需加载的,如果用户没有提到与 reference 相关的内容,那 cloud code 是 不会去读取它的,这样就达到了节省上下文 token 的 目的。 好让我们再回到代码执行部分,注意看这里, cloud code 申请执行这个 uploader pie 文件,它并没有去读取这个文件。没错, agent skill 里面的代码只会被执行,不会被读取。 这就意味着,哪怕你的脚本写了一万行复杂的业务逻辑,它消耗的模型上下文呢,也几乎是零。 cloud code 只关心脚本的运行方法和运行结果,至于这个脚本的内容,它可以说是毫不在意。 所以呢,虽然 reference 和 script 都属于 agent skill 的 高级功能,但是呢,它们对于模型上下文的影响其实是截然不同的。 reference 是 读,它会把内容加载到上下文里面,所以呢,是会消耗 token 的。 script 呢,是跑,它只会被执行,不会占用模型的上下文。讲到这里,我们需要停下来稍微做个总结,聊一聊 agent skill 的 渐进式批漏机制。 agent skill 的 设计其实是一个精密的渐进式批漏结构,这个结构里面一共有三层,每一层的加载机制都不太一样。 第一层是原数据层,这里有所有的 agent skill 的 名称和描述,它们是始终加载的,相当于大模型里面的目录。大模型每次回答前都会看一下这一层的信息,然后决定用户的问题是否与某个 agent skill 相匹配。 第二层是指令层,对应 skill 的 md 文件里面除了名称和描述之外,其余的部分,只有当大模型发现用户的问题与某个 agent skill 相匹配的时候,它才会去加载这一层的内容。所以呢,我们称这一层为按需加载。 第三层是资源层,这个呢,是最深的一层,它一共是包含 reference 和 script 两方面的内容。其实按照官方最新的规范,应该还有一个组成部分叫做 assets, 不 过我看了一下,它跟 reference 的 定义似乎有部分重叠,因此我们这里先忽略它。 好,我们刚才例子里面的集团财务手册和 uploader pie 脚本就属于这一层,只有当模型发现用户问题与财务或者上传相关的时候,它才会去加载这一层的内容, 这就相当于是在按需加载的指令层基础上又做了一次按需加载,所以我们可以称它为按需中的按需加载, 当然这是我起的名字啊。 reference 和 script 的 加载方式其实不太一样, reference 是 被读取的, cloud code 会把对应文件的内容放到模型的上下文中,一共回答式参考。而 script 是 被执行的, cloud code 根本就不会去看代码的内容,它只关心代码的执行结果。 当然这个也不是铁律啊,如果你没有把代码的执行方法说清楚, cloud code 还是有可能会去看一下代码的,毕竟跑不下去了嘛,这样的话呢,就会占用模型的上下文了。所以还是请大家写 skill 的 时候尽可能的把一切都解释清楚。 那聊完了 agent skill 的 用法,很多朋友可能会有种似曾相识的感觉, agent skill 好 像是跟 m c p 有 点像啊,本质上都是让模型去连接和操作外部世界。既然功能重叠,那我们到底应该用哪一个呢? 关于这个问题,按 serapic 官方写过一篇相关的文章来解释,核心观点就一句话就在这里, mcp connects cloud data skills teach cloud what to do with that data。 这句话可以说是直接点明了 mcp 与 agent skill 的 区别,它其实就是在说 mcp 给大模型供给数据,比如说查询昨天的销售记录,获取订单的物流状态等等。 而 skill 是 教会大模型如何处理这些数据的,比如说是会议总结必须要有个议题啊,汇报文档必须要包含具体的数据啊等等。到这里,有些同学可能就会问了, 不对啊, agent skill 里面也能写代码?我直接在 agent skill 里面写连接数据的逻辑不就好了吗?这样呢,就不需要 mcp 了, agent skill 就 直接把这两个活都给干了。 确实啊, agent skill 也能连数据,功能上与 mcp 有 所重叠,但是能干并不代表适合干, 这就好像是瑞士军刀也能切菜,但没有人会这么干。我们这个场景呢,其实也是这样, m c p 本质上是一个独立运行的程序,而 agent skill 本质上是一段说明文档,它们的本质不同决定了适合的场景也是不同的。 agent skill 更适合跑一些轻量的脚本,处理简单的逻辑。在代码执行方面, agent skill 的 安全性和稳定性都不及 mcp, 所以 大家还是要根据场景选择合适的工具。甚至在很多的场景下,我们需要把 agent skill 和 mcp 结合起来一起使用,以便尽可能的满足我们的需求。 好,今天的视频呢,就到此结束了,我是马克,用最通俗的语言讲最硬核的技术。如果我的视频对你有帮助,欢迎点赞订阅,我们下次再见,拜拜!

今天 manas 被 mate 收购的消息呢,刷屏了啊,然后早上起来之后,我看这个新闻,我想赶紧写一篇,于是我就呼唤出了我的访谈写作 skills, 他 大概花了十几分钟就帮我把这篇爆款文章给写出来了,大家可以看,这是今早九点钟发布,到现在阅读量已经接近一万了, 从标题到开篇都非常的吸睛,然后包括里面有很多的京剧,包括到最后整个文章都很自然的切入到卖皇书自己的社群上面去。 这一整篇文章是怎么写出来呢?其实非常的简单,可以看到皇叔是打开了 cloud code 终端,然后输入了一个 interview, 这就是我说的访谈写作的 skills, 然后呢,我就大概讲了一下一个基础的内容,接着他就来问我说,哎,这个故事非常好啊,所以我想问你一个细节,你听到第一反应是担心这个,然后呢,你说你会怎么想?这个背后隐藏了什么?那追问我了之后呢?那我就想到什么回答什么就行了, 包括如果我发现他跑偏了,我会说,啊,其实这件事情的重点是呢,我想表达说 manus 被收购给我带来了一个很大的冲击,并且鼓励自己,鼓励大家在 ai 时代要抓住机会,他就把焦点又拿回到了核心,继续在这个核心方向上面去问我一些问题,然后巴拉巴拉,你看 问了几轮之后呢?他说,哎呀,其实故事素材已经足够丰满了,他自己就判断说,好,这个时候我们不用再聊了,我接下来来给你讲一下整个故事的弧线是什么, 是从三千万到数十亿的一百倍的跃迁,我的第一反应和自我质疑。 madison 做减法的勇气给了我力量,然后我自己的收敛之路放弃做产品,反而产品长出来了,然后和阿宝姐 啊研究,然后希望和坚定的一起前行,你看他的弧线,马上给你一个轮廓。接着呢,他就开始进入到写作的阶段, 先去读我的风格参考,因为我会给他五篇过去我爆款文章的一个风格,他会先去阅读,参考完之后呢,接着同时去联网去剪辑相关素材, 你看他自己会去剪辑这些事实是什么,然后他就收集完素材之后呢,就开始写作。写作完你看他就直接出来一篇文章,那这篇文章呢, 包含了标题,包含了开头三行金句的密度,引经据典,对吧?震撼的数据。你看这里面他全部都给我讲的非常清楚,所以整篇文章出来之后呢,我几乎是非常快的一个调整就能直接去发布了。 所以我们详细来看一下他整个 skills 运行机制是什么样的。他首先有两个阶段,第一个阶段呢,就是访谈阶段,只要通过输入这个主题呢,他就会激发。然后呢,我给他定位是说他要帮我找到让人想转发这种核心冲突,然后他是一个故事的,是一个情绪的捕手。 然后呢,他就会来追问,追问,比如说转折点,这岸时刻那些戏,对吧?你其实想想,这非常像那种故事性的描述,包括他自己也有一个结束访谈那个条件啊,他会基于这些事情去判断说,哎,是不是 ok 了? 进入到第二阶段就是开始写作,写作呢?哎,他是不会中断,他完全自动化执行,会去读我的风格,参考,对吧?然后呢,参考我的这种语气特征啊,句子节奏,排版习惯等等。然后他会去联网搜索,然后写作 输出符合我要求的一些内容,包括他下面也讲他的核心的设计理念。啊啊,好故事是聊出来的,不是写出来的,你看这一点,我相信这个访谈写作师给我会对大家有很大的帮助,包括他也能够保持我的个人风格,对吧?而不是完全的 a r v。 因为他是参考我过去的文风去写作的, 不是直接让 ai 去生成。所以他最后总结了一下,他说这个 skills 本质上是把专业访谈记者的工作流固化成了一个可附用的 problem 结构,怎么样?你学会了没?如果你想学会更多这样的 skill 技巧,欢迎点赞转发,然后关注黄叔,我们明天见!

大家新年好,今天是一个重磅的分享,经常看我视频的伙伴都知道,我在过去的时间里,用不读一行代码的方式,一种黑盒编程的方式,已经把一个项目做出了一个雏形。在这个过程中,我也积攒了一些经验,会陆续做成视频分享给大家。 去年 cloud 推出了这个 agent skills 这个功能之后,我也做了一些视频。现在 skills 的 使用价值已经完全的超越 mcp 了,而且我认为它的使用门槛是相当的低, 但是可能很多朋友还没有学会怎么用,今天我就教你们一个使用 skill 做自动化流程,给自己提效的一个万能公式。所谓的万能公式就是所有人都可以不用写代码就可以用。 那首先提到这个万能公式,我先介绍一个工具啊。这个经验来自于我之前用黑河编程做的项目,我经常让 ai 去做后端测试,他特别喜欢用这个命令, 我根据这条命令就构建了一套它用于测后端的一个脚本,所以我的项目开发的也比较顺。但这个命令我觉得我们不用去学习,你只需要知道,它可以模拟我们所有操作网页的方式。 如果你常用的 web 服务器是支持 api 访问的,那么你只需要让 ai 读一下 api 的 文档,它就可以构建出一套纯自动化的流程。当然这么听可能有点抽象,我会用了这个命令,跟我的这个 万能公式又有什么关系呢?我来举一个例子你们就懂了。我的女儿前几天考这个 g s p 的 五级 c y y 的 一个考试,她没考好,我分析了一下,其实是刷题刷的不够,虽然我给他做了一个 ai 工具,新奥制题助手,这个我之前分享过, 但是这个工具有一个问题,就是他没有自己的题库,这些所有的题其实还是我自己在网上找的,我要通过这个工具的内置功能给它加入进去。 但是这个怎么说也比较麻烦,你得录入题目,你得用 ai 分 析测试点,还得找答案。虽然我也在工具上做了一个类似 a 证的抓网页的功能,但我觉得不好用,而且它只能抓题目,它的测试点和答案你还得另找这个软件,它已经完全落后于这个时代了,我也懒得再去狗尾续貂, 但是我想了另外一个招,这招是什么呢?就是因为我的信号制题助手,它启动之后就会有一个后端服务器, 当初我觉得在这个 electron 里运行一个 python 服务器,这种设计还挺奇葩的,但是现在想想还是挺明智的。我把后端的 api 的 代码喂给这个 cloud code 之后,他竟然就把这个 skill 做出来了。 我只需要打开这个应用,然后让 ai 分 析我孩子的代码,让他有针对性的推荐题目,然后调用我的后端 api 加入我的提库。 所以说如果你有一个学习系统,他也是有后端的, ai 就 可以完全实现。他作为一个可以操作你后端的一个机器人,根据你的要求来操作你的后端,比如说给你出题,或者是帮你分析,可以把所有人需要去做的 任务一下一下点击做的任务,变成一个让 ai 去做的一个工作流,而且实现这个工作流,你不需要干任何事,你只要一句话,他就可以去执行很长时间。 给大家看一下我这个技能,做了两个技能,一个是一个叫 csp, 一个叫对拍。能不能看一下这个 csp 的 这个技能,这个技能 总体来说它就只有一个文档,它就是描述我这个信号制题助手的后端的 api, 它描述了一些场景,比如说它的基础的 url, 它怎么样去管理题库,应该怎么获取编程题,它的这个格式是什么? 给了一些例子,怎么样去获取答题记录,是用什么样的格式?如果你要验证代码,用沙盒验证沙盒的 api 是 什么, 包括你可以 c 加加,也可以用 python, 它描述了一些场景,场景一是怎么样添加新题目,怎么样看学生的答题记录,怎么用沙盒快速验证, 还给了一个文档,这个文档是一个完整的一个 api 参考,我只是把我的这个 api doc 给 ai, 通过这个 sql creator, 它就自己给我全部创建了。我给大家演示一下啊。首先这是这次我女儿没做的这道题,五级的一个题,她没做出来,我就说我就用通过这一个 prompt, 让她来分析她的算法和考点,然后在立扣上帮我找类似的题, 然后制度相关的要求,难度中等,把题单抓下来,放到我的题库里,在入库之后,用对拍这个技能来求解,让他一步一步执行。你看他先做了个计划,他知识点,他分析出来了, 好去立扣抓题,他用了很多的任务,子任务,最后抓到了五道题,这入库的结果,他现在做了五道题,他能获取我们这个资料库,然后找到资料库,把题目放进去,然后就开始就要用对拍工具做对拍来求解了。 当然这个对拍工具我觉得还需要优化,他用的时间巨长无比,他现在已经跑了四十分钟还没有做完。 当然一次搞五道题可能是有点贪心了,但是它还在积极的运行中,如果我们正常的使用来说,其实就可以把它扔这,让它自己去搞就行。好吧,只是给大家演示一下这个 skill 运行好了是什么结果,基本上我到目前为止, 我除了输入那个 prompt 之后,我还没有管过,所以其实基本上就是 one side, 你 可以让它自己一直搞下去。那我们如果再把脑洞开大一点, 比如公司的系统是用来查数据库而做分析的,你也完全可以让 ai 去调用一个 skill 去查,直接做分析。现在的外部架构基本上都是有为 api 的 设计的,所以任何带有后端的服务,我们都可以通过 api 把它做成 skill, 然后让 cloud code 成为它的外挂,而你不需要做任何的开发, 这就是我称之为任何人都可以使用 skill 提效的万能公式。可能有朋友问了,那如果我有一个服务器,但是我不知道 api, 我 没有它的文档,或者说我不会做 skill, 那 该怎么办? ok, 我 今天推荐两个工具啊,第一个就是 chrome devtools 这个工具,它简单来说就是给你的 cloud code 的 一个浏览器,我们来看一下,你看,我现在是让它用 chrome devtools 启动一个浏览器,访问落谷点 com, 它会打开这样一个浏览器,我在这上面做一个操作,接着我让它读一下它网络请求的这个日记。我刚做了个搜索,能不能分析下格式 ai, 它会自动从这个工具里把这个 network 的 请求全部列表出来,然后分析出来这个格式, 它会总结成一个文档,这个 json 格式。刚才我搜索了其实有一个是标签,这里要选标签的标签,标签其实它也是有一个 api 的, 所以我就问他有没有获取标签列表以及标签意义的处理啊?他发现找到了之后,他就给我去列举,他能把所有的标签列举出来,我让他去用这个方法去测试一下 五级减的二分题目,他很快就给我找到了一些这么多题目,五十三道题。有了这样一个东西, 我就可以让他帮我去找题目了。当然并不鼓励大家用这种方式对任何网站做这样的分析。你首先要看这网站允许不允许你这样做,如果他要求必须登录才能用的话,我建议还是不要做,这样 不太好。你们如果说你们自己的系统,比如说你公司内部的一个数据库,那你就完全随便了, 即使你没有这个文档,你也可以用我这种方法来获取。获取完了之后你会发现这整个的上下文就会充斥着这些关于结构的一些知识。我们该怎么做呢?我把以上获取的这个技巧放到一个新的技能,我让它创建技能了。最重要你要提到这个 skill creator, 这个 skill crit 是 一个 osophic 推出 skills 时的一个默认的一个基础技能,但是你需要去安装它, 我等一下说怎么安装?如果你安装好了之后,你在做任何技能的时候,你不需要自己去做,你直接告诉 cloud 用 skill crit 把以上的经验做成 skill 就 好了,就这么简单, 它会放到这样一个结构底下,就是放 skill 点 m d, 然后它会给你创建一堆脚本,当然这个脚本是什么样你们不用管,就反正它做好了,你直接用就行了。那么 skill crate 在 哪里找呢?在这个 repo 里头,这是一个 safari 推出的, 它也提供了一些安装手法, plug in, 通过 marketplace 方式,用 plug in 把这个 skill 安装进去,安装好了之后,它这个文档里头就会有所有的这个技能,其中你们看,这有一个 skill creator, 就是 这个 skill creator。 我 们再总结一下,如果你没有 api 的 文档,你不会做 skill 怎么办?首先你先操作一遍,让它抓取,然后给你生成一个文档, 接下来直接告诉他,用 skill creator 来做一个 skill, 就 这么简单。经常看我视频的朋友知道,我过去还分享过千万三 omni 的 语音互助,还有我的监工 agent 的 项目,还有我的 finnus 上的一些场景。 我相信呢,在今年就一定会实现一个场景,就是我们再也不需要使用 cloud code, 而是直接通过语音发出一个命令,然后我们的 worker 就 会在 boss 上给我们完成一个长线的任务,最后把结果给我们呈现出来。 所以我想说的是呢,我分享的这些内容并不是零散的,他们都是在为了实现这样一个目的,这样一个场景的技术战之一,所以我做的内容并不是为了做内容而找主题,而是为了实现我理想中的 agi 的 场景, 然后把我过程中的一些发现分享给大家,这是一个真实的长线的 ai 的 学习和成长,所以关注我,你们也可以获得同样的成长。 ok, 以上就是今天所有的内容了,谢谢大家。

很多人以为 cloud code 只是一个编程工具,其实它是一个 ai agent, 用好它,一个人就能干一个团队的活。那昨天我和 plow 中国去的 ceo 聊天,很惊讶,他说了一句话,我们公司内部都在大量的试用 skills, 这是个啥?这些内容非常干啊,大家赶紧先点赞收藏关注!王叔先跟大家说一下我自己用 skills 最近做了什么案例。 第一个社群日报的自动化,一个命令,两个群自动总结,生成 html 上传,然后网站就自动更新了, 以前需要一个运营干半个小时的活,我现在只需要喝水的功夫。第二个是京东好评的分析,我给他一个京东商品链接, ai 就 会自动打开浏览器,找到评论区,抓取分析,产出产品亮点报告。我甚都没动手,就是坐在那里看他表演。 第三个是微博热搜找产品创意,一个命令自动抓热搜,收集信息,整理创意,按照有优和有趣两个维度来进行打分排序,产品经理看了都沉默。 还有目前我正在调试的监控,指定的 youtube 频道和小宇宙播客,自动抓内容,自动改写,自动保存二十四小时运行的情报系统。那如果你看到这里啊,恭喜你已经打败了百分之九十的人,可以在弹幕打个二。 那 skills 到底是什么呢?最近 cloud 官方有个视频非常的火,叫做 don't build agents, build skills instead, 翻译过来就是别造 agent 了,先造 skills。 所以 cloud 官方的核心意思是什么呢?就现在的 agent 呢?它是一个高智商的定脑儿,就是说智商已经够了,但是干具体的活还不太行。为什么不太行呢?是因为他们没有经验,所以我们需要用 skills 把我们的经验喂给 agent。 你想啊,一个清华毕业的高材生,刚进公司,聪明,他是很聪明,但是你不告诉他公司的流程,不给他培训,他其实也不知道怎么干活,对吧?所以 skills 就是 那个培训手册。朋友们,现在每个人都应该开始构建自己的 agent skills, 学会用 skills 的 人呐,相当于提前进入了异能公司的时代。你知道吗?最近上海浦东,包括苏州啊,都在扶持 opc, 就是 one person company, ai 时代的异能公司。这说明什么呢?说明趋势已经来了。 所以我就想问你个问题,你每天有多少时间花在重复性的工作上面?比如说整理会议资料,汇总销售数据,监控竞品的动态,回复客户的问题。所有这些呢,其实都可以变成一个个的 skill, 你 在睡觉的时候,他在帮你干活,你起床的时候,成果就已经躺在那里了。 所以现在真的可以动手起来,从你日常最烦的那件重复性的工作开始,把它变成你的第一个 ai 分 身。我们这期就到这了,如果你对 agent skill 感兴趣的话,点个赞,点个关注,我们下期继续来更新。


嘿,大家好,今天咱们来聊一个特别火的话题,它正在悄悄地改变整个软件开发行业。没错,就是 ai。 协同编程 这东西催生了一种全新的玩法,叫做 web coding, 或者说氛围编程。我跟你说,这可不只是换个新工具那么简单,这简直就是一场思维上的大革命, 你敢信吗?这一切的开端源自一个听起来有点夸张的说法。很多创业公司的老板都说,用了 ai 之后,他们写代码的速度快了十倍,有的甚至说快了一百倍。 哇,一百倍!这听起来跟科幻片似的对吧?但它正在真实的发生。今天我们就来一探究竟 好,为了搞明白这到底是怎么回事,我们今天的路线图是这样的,首先看看那个百倍速度的承诺到底靠不靠谱,然后咱们去解锁一下 ai 背后的独门秘籍,当然,我们也要聊聊他带来的大麻烦,烂代码问题。 最后也是最重要的,看看在新时代,程序员们要怎么调整姿势,玩转这个氛围编程。 那么这个听起来神乎其神的氛围编程到底是个什么东西?它凭什么能带来这么大的效率提升? 氛围编程这个词最早是由一位叫安德烈卡帕西的计算机科学家带火的,说白了,它的核心就是,你作为开发者,别再一行一行吭哧吭哧的敲代码了,把这些脏活儿、累活儿都交给 ai 去干, 那你干嘛呢?你的决策升级了,从一个代码工人变成了一个产品设计师和总导演,你的重心完全从怎么实现转移到了要做什么上,这个理念啊,可以说有点颠覆三观, 他要求你首先要信任 ai 写的代码,然后要拥抱那种快到飞起的迭代速度。你的眼睛里应该只有产品,而不是那些乱七八糟的代码细节,甚至最极致的状态是,你要努力忘记代码的存在,你只管提需求,剩下的交给 ai。 那么问题来了,这么快的速度,背后到底有啥黑科技呢?总不能是凭空变出来的吧?答案就在一个叫技能,也就是 skills 的 新概念里。 你可以把这个技能想象成是给 ai 准备的一个个技能包或者工具箱,每个技能包里都装着特定领域的知识说明书,甚至是能直接运行的脚本。当 ai 接到一个任务,它就会自动去工具箱里翻找,拿出最合适的那个技能包,咔嚓一下,它就瞬间变成了这个领域的专家。 而这个技能包系统能高效运转,背后藏着一个特别聪明的点子,叫渐进式信息路由。这套机制能让 ai 既博学多才,又不会被信息撑爆大脑。 这个流程分三步走,非常巧妙。第一步, ai 启动的时候,他只看一眼所有技能包的封面,也就是名字和一句话简介。第二步,当你的要求和某个简介对上了,他才会打开那个技能包,把核心的说明书读一遍。 第三步,只有当任务真的需要更多细节了,他才会去翻阅那些厚厚的参考资料,比如 api 文档什么的。你想想,这就好比你大脑里有个智能锁瘾,需要什么才调取什么,绝不浪费宝贵的内存,也就是我们常说的上下文框。 这种方法带来的好处是实实在在的,你看这张图,效果一目了然。用了技能之后,系统每次启动需要加载的信息量,也就是 token 使用量直接砍掉了三分之二。 这意味着什么?省钱、省时,效率暴增,整个过程都变得又快又便宜。不过,咱们都知道,天下没有免费的午餐。这种狂飙突进的速度也带来了一个很棘手的问题。 当你的搭档是一个只追求速度,不太在乎质量的 ai 时,你很快就会遇到程序员们私下吐槽的烂代码问题, 风险真的不小, ai 生成的代码可能结构一团糟,维护起来跟噩梦一样。而且现在的 ai 在 调试复杂问题时,说实话水平还很菜。 更可怕的是,如果你事事都依赖他,你自己的真本事可能就慢慢退化了。这种先跑起来再说的模式,会飞快地堆积技术债,今天图省事儿,明天就得加倍还。 于是呢,这就催生了两种截然不同的门派,一边是完全拥抱 ai、 依赖网络的氛围派,而另一边是主张断网修行的飞行模式派。 他们认为你应该关掉网络,关掉 ai, 强迫自己从第一性原理出发进行深度思考,而不是被 ai 给出的第一个答案牵着鼻子走。那难道我们只能二选一吗?要么快但乱,要么慢但精。 其实不是,真正的答案是咱们程序员的人,而是变成了指挥 ai 这个演员的导演。 没错,在 ai 写代码的时代,你敲键盘的速度不再是核心竞争力什么,最重要是你的品味。 这个品味指的是你的判断力,你的技术审美,还有你对产品的远见,正是这种品味,能让你指导 ai 写出优秀的代码,塑造出伟大的产品。 所以,一套全新的工作手册就诞生了。你看,这完完全全就是个导演的工作手册吗?第一步,写好详细的剧本,也就是需求文档。 第二步,定好规矩,告诉 ai 演员哪些能做,哪些不能做。第三步,别一口气让他演完一整部戏,把他拆成一小段一小段的请求。第四步,随时喊卡,频繁地测试,确保演得没问题。最后和你的 ai 演员一起不断打磨,直到作品完美。 好了,我们来总结一下。所以你看氛围城边人这玩意儿,它不是来取代传统编镇的,它是一个完全不同的工具,一个强大的放大器,它要求我们用一种全新的视角去思考和工作。 这张表总结的特别好,你看这个角色的转变,任务从写代码变成了提需求、审代码,核心价值也变了,从追求速度变成了追求品味和架构能力。 你的瓶颈不再是打字慢,而是你提问的水平和错事的质量。甚至以后公司招人面试,可能考算法题的会变少,考系统设计考你怎么跟 ai 打交道的会变。 那么要想玩转这个新时代,有几个新法?你得记住,需求要写得越具体越好,用规则来保证代码质量,多测试,多提交代码,方便随时反悔。 但最最重要的一点,永远别忘了,你依然需要扎实的技术功底,因为你才是那个导演,你得有能力判断 ai 这个演员演的到底好不好。这就把我们带到了最后一个,也是最根本的一个问题上, 当繁琐的代码编辑工作可以交给 ai 的 时候,那你作为一名创造者、工程师、梦想家,你将去创造些什么呢?这可能才是这场技术革命给我们带来的最大的机遇和最激动人心的挑战。

兄弟们今天就手把手教你们如何开发高颜值网站,我们使用 u i u x pro max skill 开发,只需一句话就能搭建出来精美的页面。首先打开终端,输入 n p m install 杠 g u i pro 里回车,再输入 u i pro versions, 查看版本是否安装成功,这样返回恭喜你就安装成功。 我这里使用的是 hero, 只需要输入 u i pro innitai hero, 这里可以按照你们对应的需求进行安装。如果没有对应的 ai 指令,就 在项目目录中输入 u i pro init a i o 这个是通用的规则。输入完成这里我们会多出 key 文件夹和 share 的 文件夹,这两个文件夹非常重要,就是控制我们页面风格和样式的,我们可以打开查看一下,里面有非常多的内容信息, 这些我们可以不管,可以直接开发了。如何使用,只需在输入框中带入 u i u x pro max 即可。剩下的按照你自己的需求搭建的是一个 sas 的 数据分析系统,使用的是 spec 模式作为演示,在 spec 模式中它会自动帮我们编辑详细需求。第一步出现 requirements md 文件,只需要我们确定是符合我们需求即可 到深层完成,聊天框中会出现两个按钮,修改和需求不错,继续设计。查看完需求文件没有问题就点击继续设计,在真实开发中一定要认真查看。 点击完成,他会再次设计细节部分,第二次设计完成的需求部分,他帮我们自动整理好了。这两步完成了,就是最后一步,帮我们搭建任务。此时聊天框中会出现两个按钮,一个需要修改,一个做任务阶段,我们选择做任务阶段直接生成开发任务,在这个阶段中处理的就非常快了,在这一步他会按照开发任务给我们进 行自动拆分,每一个步骤,也就是我们最开始的按照任务进行提示词拆分的道理一样的,这里最后会出现两个按钮, 第一个是保留可选任务,写完了不会代码测试,第二个是所有任务必须完成,最后还需要进行测试,这里我们不用想都知道怎么选生成完成。打开我们的 tasks, 点 md 文件,我们只需按照 tencent md 文件中的任务一个一个执行就能开发。完成 执行只需要点击 star task, 即刻这里它会自动帮我们去按照步骤开发。最后开发阶段我们就跳了,兄弟们,后面呢就是点击 star task, 即刻这个就是开发出来的最终效果,从零到一区使用,没有对页面任何要求,开发出来的效果确实比我们传统的渐变色好太多了,现在也标准化了,感兴趣的小伙伴们赶紧收藏,防止找不到。

二零二六年了,如果你用 cloud, 但是你不用 skill, 你 就是在浪费时间。今天手把手教大家如何 做一个属于自己工作流的 skill。 手把手教学非常适合小白朋友们,如果你有需要这个文档,你可以告诉我,已经给大家准备好了。