粉丝91获赞800

codex 是 我过去几个月高频使用的 ai 助手之一,我用它做研究,写文档、做 ppt, 整理内容灵感,做网页原型。上个视频讲了 codex 基础,这期视频讲一个今年很值得先搞懂的 ai 概念 skill, 因为它决定了 codex 到底只是陪你聊天,还是能按你的工作方式反复干活。简单理解一份可以重复使用的工作说明书, 你可以把某类任务的流程规则、检查标准提前写进去,下次再让 codex 做类似的事,他就不用每次重新听你解释一遍。比如你经常让 codex 做网页,你不想每次都重复说页面不要太 ai 味,不要蓝紫配色, 这些都可以写进一个设计类 skill 里。以后你只要让 codex 用这个 skill 检查页面,他就会按那套规则去看代码、改样式,再告诉你改了哪里。 这就是 skill 最实用的地方。把你反复说的要求变成一套固定流程,那么在哪里看和怎么用 skill, 可以 去 codex 的 侧边栏这个入口里看,里面会有一个 skill 子页面, 已经添加或创建过的 skill 会出现在这个列表里。使用的时候,通常可以在聊天里输入 skill 名称,或者用斜杠跳出来。比如你有一个 find skill, 就 可以直接斜杠选中,帮我找一个适合做 ppt 的 skill, codex 就 会按 skill 里的流程去跑。那怎么创建 skill? 有 两种方法, 第一种最简单直接这样说,请创建一个 skill 以后,我给你一个网页项目时,你要先检查移动端排版按钮样式、文字层级、颜色是否太乱,最后输出修改文件和检查结果。这种叫 prompt skill, 但我更推荐第二种,先把流程跑通,再把流程固化成 skill。 举个我刚实测的例子,我想做一种白板手绘风讲解图,我先给他一个参考图,让 codex 按我的要求生成讲解图 第一版如果不满意我就继续改,比如少一点黄色纸张质感画面更像课堂白板。等到有一版我觉得可以附用,我再说。把它固化成一个 skill, 这时候 codex 会反推刚才的流程,它会把这次反复调整出来的规则写进一个 skill。 md, 这样下次我再用白板手绘讲解图, 就不用重新解释一遍审美和结构,直接调用这个 skill 就 行。如果你想让 codex 使用 skill creator, 它会按更标准的格式帮你生成可附用 skill。 我是 ai 知识派,我们下期见。

每一个刚开始学 scale 的 人,都应该先安装这两个 scale, find scale 和 scale creator, 有 了这两个技能,可以让你少走很多弯路,我给大家详细拆解一下原理。 第一个, find scale, 这是一个找 scale 的 scale。 你 想想, scale 这个生态已经有了上百万个 scale 了,全世界有大量人为 各种各样的工作场景做好了四个样,视频制作、股票研究、文案生成等等,各个行业的人都在贡献。在你自己动手之前,第一步应该是先搜一搜你想做的事情,有没有人已经做好了。 the scale 就是 帮你做这件事的,告诉他你的使用场景,他帮你在社区里搜出已有的相关 scale, 让你直接拿来用,或者说在别人的基础上改一改,不要重复造轮子,别人已经造好了,先拿来用。 第二个, scale creator, 这是一个造 scale 的 scale。 当你用 find scale 搜过了,发现没有完全适合你的,这个时候就需要自己做一个 skill creator 的 核心逻辑是,把你想要 ai 执行的工作流程像教新人一样描述清楚,第一步做什么,第二步做什么,遇到什么情况该怎么判断,输出什么格式。它会引导你把这些内容整理成一个标准的 skill 文件。之后你每次需要用,喊一声就行, 他还会帮你做测试。你教完之后,让 ai 模拟执行一遍,看哪里有漏洞,哪里说的不清楚,反复打磨,直到稳定可靠。说了这么多, sky 能给普通人带来什么?三个层次, 第一层省时间,以前重重复三十分钟的事,现在一分钟搞定一个 sky 花一个小时学会用三次就回本。第二层质量稳定,不会因为你今天累了烦了,输出就变差。 ai 按照你教的标准来,每次都一样。第三层也是最重要的一层,你第一次拥有了造工具的能力。 以前把一套工作流程变成自动化工具,你需要找程序员,需要找开发、排气,甚至需要花钱。你有再好的经验和方法论,也只能锁在自己的脑子里,一遍一遍手动执行。现在不用了, 你自己就能把经验变成工具。你干了十年攒下来的判断力、流程标准, 以前只能靠你自己一遍一遍重复,现在它可以脱离你独立运行,甚至可以分享给别人用,可以二十四小时不间断工作,你的经验终于不只是属于你的脑子了。

如果你在使用 codex 一 段时间后,感觉它越来越慢,那么我推荐大家安装这个 skill keep codex fast, 直接复制这个命令行,丢给 codex, 让它自行安装。安装好后,第一步可以将这行命令丢给 codex, 让它先扫描,告诉你哪些对话该归档,哪些 word tree 残留以及日期有多大等等。 第二步进行交接,直接将这行命令丢到你比较重要的项目中,它会针对旧项目生成交接文档, 记录你这个项目改了什么,跑了什么命令,以及下一步应该怎么做。第三步就是归档模式,它会备份移除旧的 word tree, 清理日期等等。关键是它不是自动执行,它主要是每周或者是每半个月来自动提醒你该做这个事情了,这样会更安全。

一句话让 codas 证明你自己。那很多人用 codas 还停留在命令它完成任务,但有一个更有效的用法,让 codas 反过来研究你你每天反复做的那些事情,整理资料,写日报,同步笔记,复盘项目。你以为这是琐事,但在 codas 眼里,这些都是可以被提炼的工作流。那方法很简单,打开 codas 记忆功能,从设置个性化开启记忆, 然后直接把这段提示词丢给他。那请回顾我最近的工作记录和历史。绘画,识别我反复执行的任务类型,提炼其中稳定的步骤,判断标准和输出格式,并把它们设计成为可长期服用的 skill。 那 它就会把你平时怎么做事,怎么判断,怎么输出,整理成一套可调用的 skill。 以后碰到同类的任务就不用再从头解释了。 那 code 会按照你过去的习惯直接进入一个流程,并且这个 skill 还会持续进化。那如果流程变了,去更新旧的 skill, 如果场景变了,可以拆除新的 skill。 那 我自己尝试了一下,瞬间生成了五个新 skill, 快 去试试吧。

我刚刚又去生成了一个这样的一个图,根据上一个视频呢,我们在这里的时候,我输入了个请把它变成一个 skill, 它就可以生成这样一个 skill。 呃,它的目录呢?就在这里面啊,这个点 codex skill 里面当然也可以通过 下面的这个打开方式打开它,这样我们就能打开, 你可以看到它在这个点 codex skill 里面有一个 visual com 啊,这个一一个 skill, 这里是新的项目,然后在这个界面呢,它去调用这个 skill 去设计一个架构图, 因为这个 skill 是 刚刚写的,所以它啊这里面还是会存在一些问题 啊,其实可以看到他这边调试过程非常长。呃,这边他做一些修修,改改,最后呢会生成现在这样的一个效果, 现在是没有背诵播放的,这是他画图的一个速度,就是刚刚他可能去调研整个项目,而且是第一次使用这个 skill, 可能会有点问题,然后他会做一些修改。 嗯,这个图呢基本上就画好了,对于我这个项目的图来说,他就画好了,画了一个系统加入图, 我正在做最后的思维工作,正在思考。 嗯,整个视频我现在到现在其实是这个三十二分钟,他这边已经画好了,然后打开方式的话,你就能够看到这个是 png 和这个是 png 图片,然后这个是这个微设格式的图片, 然后呢我说请你,呃,在刚刚的过程中,你觉得是否需要更新这个 skill 啊?他就说需要更新,但不用大改,第一个怎么办?第二个,第三个,第四个价格图的箭头,这个箭头的策略, 然后我就说,呃,让它更新 skill, 我 就去更新了。那么这个呢?还是在我们之前那个,呃,就是 codex 的 目录,那个目录下面在这里啊。 然后同时呢,我又想用这个切克笔记本的 image 二模型,让它去画一遍这个架构图,哦,就调用了这个 image 镜,然后它去画, 这个画出来和刚刚画的是差不太多的,我觉得他们的 skill 应该就是这么去调试出来的,不是人为去写的啊。这个呢,就是他刚就是呃一米七二点零模型画出来的深图模型画出来的。 这个是刚刚的 viso 画出来的。这个呢是 viso 的 导出版的 png 格式。

hello, 今天一分钟时候用 codex 帮我们开发电商 skill, 让 ai 自动我们干活来看效果,操作非常简单,只需要在多框输入,让 ai 帮我们开发一个本地可运行的拆帧 skill, 去批量提取视频,然后开始执行。那么整个 skill 的 开发其实非常简单,不管是用 codex 还是其他模型都可以,核心不在于 工具,而是清除进开发 skill 的 目的。我们来看一下执行的结果,这里显示只用了三分三十六秒就开发了一个 视频 skill, 那 现在我们可以直接上传视频来测试一下拆帧的效果。在执行完后,在这里打开输出的文件夹目录, 可以看到基础的视频拆帧功能已经实现了。接着后续我们就可以对这个 skill 继续调优,比如如果需要对视频拆解的更细致一些,又或者对视频拆解有自己的方法论,都可以告诉 ai, 让 skill 根据我们的需求来执行。我们来看一下第二版的执行结果, 可以看到对比第一版拆解的更细致了,但是不同的业务场景拆帧的逻辑完全不同,有的拆帧是为了参考框架后期实拍,有的是为了后续让 ai 生成需求。不同 skill 的 执行流程也不一样,那么我们就需要根据自己的需求来完善这个 skill。 如果我的需求是让 ai 后续生成分镜,那么我就可以让 ai 继续根据拆帧的画面进行拼接生成。总的来说,我们需要从结果反推,我们要实现什么样的效果,中间刷哪些流程 和 skill 只是作为整个工作流的加速器,用来提高我们的内容存储效率。最终通过几轮简单的对话, ai 就 帮我们开发出了一个可以直接落地使用的 skill。 最后我们就可以直接让 codas 把开发好的 skill 打包成压缩文件,同时生成一份详细的使用文档,不管是自己长期使 使用还是分享给团队都非常方便。有需要这一个 skill 的 可以分享,大家也可以根据自己的需求来调哟。操作也很简单,只需要把压缩包解压到对应的 skill 文件目录下,在执行的时候打开项目文件,在段落发送这一段指令,就可以 截掉这一个 skill 来执行。当我们学会开发一个简单的 skill, 后续如果需要其他的功能也可以尝试自己开发,基本的思路就讲好赖上本期内容,觉得有用的话不用点赞关注,咱们下期见,拜拜!

是不是常因写公众号时排版、配图、上传这些琐碎的事情搞得头大?我太懂这种感觉了,所以特意做了这个微信公众号排版 skill, 这期视频你一定要认真观看。现在这篇文章是全程使用 codex 自动做出来的公众号图文草稿,自主完成文章正文、配图、排版, 最后自动上传到了微信公众号草稿箱,全程不用你动手。更实用的是,看到别人排版好看的文章, 发个链接过去,他就能把风格存成模板,还打上标签,教程类、工具类、清单类都能慢慢攒成自己的排版库。下次写类似内容,他直接根据类型选合适的模板,省超多时间。 如果你经常写公众号文章,尤其是教程工具介绍方法论、产品说明,这个流程会很省时间。 接下来主要跟大家去介绍一下怎么去配置和安装它。然后首先可能就是如果采用 codex, 那 么就很方便,直接把它交给 codex 就 可以。呃,如果是用别的呃别的的话,大家,呃首先得保证就是咱们得有一个 python 的 一个环境。 呃,然后会安装一些 python 的 一些标准的库,这些都需要是安装的。然后下来就是不使用 codex 的 话,那么去就按照方式二,把这个 skill 复制到你自己相册目录。 然后最后为了完成我们的上传,上传功能后,我们需要去配置一下它那个 cost 格式文件,然后去里边去配置自己的一个 app id 和一个 app c code, 然后作者名字都是可写可不写,但是这两个是一定要有的。然后接下来从哪找呢?大家可以去微信公众号的那个平台, 就是开发者平台,然后登录之后大家就可以看到自己的基本信息中就有这个 app id 和 app c code, 然后下最重要的一个就是那个 api 排名单, 然后这个如果是在自己电脑上使用的话,呃,每次就得去搜一下自己的那 ip 是 多少,然后点击编辑,然后把自己的 ip 里边输到白名单里边,然后这样之后就可以去成功的上传了。然后下来给大家看一下就是今天做的一些文章吧,就是今天刚刚生成的, 然后我可以看它的,嗯,排版还是相对比较比较好看,好看一点的。然后它把之前我链接中的那个标题的样式,然后它也还原了,就用小圆弧,然后还有所有图片的插入,还有一些文本块的一些背景,然后它都有一个很好的实现。 然后还有包括它这个封面的配图啊,都是自动用 codex 去生成的。然后接着这上面的四个都是我用 codex 生成的,然后下面这两个是用电脑上自带的一个绘图工具, 呃,也是用 python 写的,然后他是去完成了这种绘图,但这种绘图有一个问题,就是他的那个对于排版其实是不是很好的,包括字体间的间距啊?然后但是对于文章内容的编辑是没有问题的,大家可以看一下 对于文章内容的编辑,排版也是相对于比较清晰的,就是他对于里边的那些图片他可能不太好,这个相对于还行,他做出来的,然后大家看这个就是不太好了, 呃,之前是用自己的那个电脑自带的图片,大家可以看到它其实是对于文字它是有一点不好的, 所以建议还是大家可以使用快捷的深图功能去完成它,然后它出来的这个效果还是蛮惊艳的。

给你们看一个恶心的东西,我用 codex 加一个 skill, 花十分钟搞定了跨境电商全流程,包括市场调研、选品、货源、关键词、 listing、 生图六大环节。直接看我操作。一、我先告诉他,帮我调查下亚马逊欧洲站的玄学饰品市场,能不能做核心品类,品牌格局甚至机会点一目了然。二、 接着再让他帮我选品,不仅返回了详细的报告,还附带了国内货源。三、最后就是上架,让他抓 b s r 前十竞品的关键词,帮我重新做 list 并生成图片,再一起看下所有的结果。我就问,还有谁?再见了运营,再见了美工!整套工具和操作流程我都准备好了,你也去试试吧!

好了,各位朋友呢,相信刚刚的视频已经非常清晰了,那这一期我向大家推荐的项目依然是在 github 上有着九点二 k 星标的一个开源项目,它的名字叫做归藏 ppt skill。 归藏 ppt skill 是 一个能够帮助我们制作网页 ppt 的 这么一个 skill 技能,它可以快速的导入到我们 ai 界面当中,不管是 open code 还是 cloud code, 或者是说我自己在使用的 codex, 它的字数文件,它的 redmi 文档当中已经是闪烁的非常清晰了,我希望大家能够在这个网站中把这个 redmi 文档从头到尾读一遍,那这就可以非常快的上手这个 skill 了。 那我简单跟大家讲一讲呢。首先就是安装,安装很简单,如果你跟我一样使用的是 codex, 那 我们直接在对话框中 输入帮我安装这个归藏 ppt skill, 它就会快速的定位帮你安装,就把这个复制进来就可以, 就是他的一个基本的情况。我向大家简单介绍一下,你可以自己来看这个字数文件。那首先有两条视觉系统,一套是电子杂志风,另一套是瑞士国际主义。整体来说,我觉得瑞士国际主义比较的约简单,适合这种会议上的汇报,嬉皮的展示,或是呆萌的一个汇报。 那这个电子杂志风我觉得更多的可能就是一些内部的会议会更多地使用到它,或者说一些小型的培训。如果说你有条件的话,我会推荐大家使用 codex 来进行 这个 scale 的 运行,为什么?因为它有 codex 的 配图功能,也就是说如果你在生成的过程当中,它会给你自动地去给你的 内容进行配图,在某种程度上会方便很多。比如说我给大家看一看我之前生成的,那就是这个,那我打开来看一下,我这个背景图实际上是在创作的过程当中,是由我的 box 给我生成的, 像这个图片,那像这个背和背景图都是他帮我生成的,然后这里的背景图,这个背景图都是他帮我生成的, 他直接给我生成的,又不是我自己去找的,这是一方面,所以说我会推荐大家使用 context。 还有一方面就是如果说你有自己的文件,像我生成的关于鸦片战争的,他是没有相关的文档和教案给到他的。如果是你是一名历史老师,那你肯定会有这节课的相关的教案或者说一些。嗯, 你自己收集到内容要加进去,如果这样的话是最好的,因为这样他的内容就会更丰富一些,信息信息就会更足,他生成的内容就会更加的严谨。如果说你的内容很少像我这样只是给的一段话能生成,那它总体的效果就没有那么的好。我后边加了一个, 这样这个已经有这个 markdown 文档,我给到他之后,他给我的一个新的,我们来一起看一看,对比一下。那像这个内容我觉得 就会更多一点,虽然说它的页数更少,但是它这个内容更加的严谨一些,前后关联性更强一些。对,虽然这是两个不同的领域,但是如果说你有更多的 microsoft 文件,你自己去比较一下,就会发现你生成出来的内容实际上是有差别的。 这是第二点,我们在制作 ppt 的 时候,如果你有事先准备好的 txt 文档或者 markdown 文档是最好的,你直接投喂给他,告诉他你想要什么样的风格,你应该给我配什么样的图片,都可以直接告诉他,只 要他安装这个技能之后,你都可以直接告诉他,这样其实能够帮助我们节省很多的 ppt 制作时间。你比如说像后面的我就 markdown 文件的,我给到他之后,他只用了四分钟就帮我把整个 ppt 做完了, 这个是不是帮我们省去很多的时间?如果说你有这种回报,或者说需要去培训的这样的一个场合,我觉得非常方便的,我希望大家都能够用起来。好,本期内容就是这些,谢谢大家。

想不想让你的 codex 越用越聪明,越用越懂?你把这段提示词发给你的 codex, 它的效果啊,是经过 openid 总裁认证的,算是官方认可的优化方式。它的核心的优势是让你从给一个任务,让它帮你完成这个阶段,变成让它自主的去进化。这个提示词可以让 codex 回过头来去看你这段时间的一个工作记录,你最近让他干什么活, 哪些事情是反复出现的,哪些流程每次都差不多,哪些任务明明是可以不用手动重复。结合这个提示词,它自动可以把这个工作分类,有适合它自动帮你做成 still 的, 比如说你固定的内容创作流程,资料的整理流程, ppt 的 生成流程。还有一些适合做自动化的任务, 比如每天定时收集些信息,整理日报,生成代办。所以这个提示词真正有价值的地方,它不是让 callles 再帮你完成某一次任务,而是让它反过来去分析你的工作方式,帮你发现哪些事情以后可以流程化、标准化、自动化,相当于针对你这个助手完成一次整体的系统升级。

如果你在用 codex 却还没装这个 skill, 就 别怪你的额度总是不够用了,因为在你使用 codex 的 时候啊,它不可避免的要去网上搜索各种信息,比如查找文档,做用户调研、爬 github 仓库,甚至我之前的 ai 捡爆系统, 也是需要 codex 去帮我搜索搜集 ai 资讯的。但搜索其实非常消耗头肯,因为 agent 每打开一个网页,都可能把大量的皱纹、无关的网页代码、广告信息都带进上下文里搜索,轮次一多呀,你的额度就吃不消了。 agent 这个 skill 就是 专门用来解决这个问题的, 因为 agent 在 使用这个 skill 的 时候,会自动调用 agent 的 a p i, 所有搜索工作搞定后,再通过 markdown 的 格式传回给 agent。 这样一来,最重的那些活全部交给 any search 了,我们自己的 agent 就 轻松很多,使用方法也非常的 ai 原声, 我们在它的官网上复制这个 skill 的 命令,粘贴发给 codex, 它自动就会安装好了。我们只需要在对话中调用它, codex 就 能自动使用。我们立刻来测试一下,首先引用 any search 这个 skill, 然后让 codex 帮我们对比下过去一周 cloud code 和 anti gravity 这三款主流的 ai 开发工具,在国内的社媒和论坛中哪个更受欢迎。 最后用一个简洁美观的 html 网页呈现给我们,我们先看一下额度啊,现在是百分之九十八,点击发送 any search 收到请求后,会从海量的信息渠道中精准路由到最相关的数据源。 我们来看看结果。首先他给出了结论, codex 综合第一,下面有一个评分表,然后就是比较重要的量化样本表, any search 追踪了 npm 下载量、 reddit 评论和 hacker news 的 帖子, 下面还有一些基于搜索结果定性的分析。从样本来源我们看到他搜索了非常多的网站,从安装源到国内的社区、论坛到官网都涉及到了, 搜索质量很高,整体消耗了我 codex 五小时额度的十八个点。同时我还让 codex 在 不使用 any search 这个 skill 的 条件下,用同样的 prompt 跑了一次,这是最终的结果。 整体呈现上信息简略了一些,搜索员也大幅减少消耗的额度,还比之前多出了五个点,这就是低效搜索带来的隐性成本。 所以 any search 的 价值呢,就是把这类重活儿专门交给搜索技术设施来完成。当然它也可以直接在网上进行初步体验,从专业维度到普通生活的各个领域都能覆盖,非常推荐。好了,我是阿朱,关注我,让我们一起在 ai 潮头冲浪!

今天我们学用扣带斯制作 ai 爆款带货视频,一张产品白底图,用 qq 直接生成脚本达人类型,分镜头和视频提示词,做跨境都知道产品图好找,视频难做,尤其是开头的钩子怎么抓人,达人怎么设定,镜头怎么拍?英文口播文案怎么写?废话不多说,先看案例。 今天我拿一张粉底液的产品图,用抠蛋斯加 skill 加 c 蛋斯二点零这套组合拳,从零到一,做一条完整的美区 ugc 带货视频,废话不多说,上实操一共分为三个步骤。第一步,制作 skill。 我 们打开抠蛋斯,复制这段制作 skill 的 提示词, 它会根据我们的需求生成对应的 sku 压缩包,并保存到本地。这一步只需要做一次,后期再做其他产品,直接调用这个 sku, 不 用每次重新造轮子。第二步,生成 ugc 包,新建对话,再抠弹死聊天框,输入斜杠, 找到 c, 弹死 ugc 杠 c n 这个 sku, 再把产品图丢进去这里千万不要跟 ai 说帮我做一个爆款视频, 太虚了, ai 听完都想报警。我们就 sku 加产品图直接发送,然后抠蛋死会先跳出制作前的六件事。这一步不是废话,是保险,它会先确认投放地区、发布平台、成片语言、视频形式、达人类型、 视频时长与产品卖点。我们按需求填写美国 tiktok 美式英语真人口播,没有固定达人十五秒产品卖点可以让他先根据白底图去判断,再人工微调确认方向。之后扣单词会生成完整的 ugc 包,里面包括制作参数、产品与受众人物设定、图片提示词、 视频提示词, poke 钩子口播脚本和镜头清单。注意,它不是只给一段文案,它是把策划、编剧、导演、提示词工程师全部塞进一个窗口。第三步,视频生成。先纹身图,在 u g c 包里找到人物图片生成提示词, 附知道引迷局。二、点击图片生成。这一步生成的是 ai 人物手持产品。这里有个重点,人物一定要向真实的 tiktok 达人,不要精修,不要广告,不要一眼 ai 位,最好是在卧室梳妆台自然光前置手机这种感觉, 然后涂层视频,返回扣带斯,在 ug 包里找到英文视频提示词,这里我会再丢回扣带斯,让他帮我修饰一遍。重点是需要把人物和产品都标记好,并艾特出来,保持人物和产品的一致性。其实是我英文不好,怕找不到人物和产品的 位置,但不管怎样,这一步很有用,这样导入 c 单词时,就不会一句一句找谁是人物谁是产品。修饰完之后,把提示词复制到 c 单词,再加上产品图 和人物图,最后看成品。 i'm picky about base makeup because i hate when foundation feels heavy。 从产品白底图到人物出镜,英文口播镜头清单、视频提示词,再到 ai 带货视频,整套流程就好了。以前做一条跨境带货视频,要想交本,找达人拍素材,剪节奏,现在用扣袋子,至少先把百分之八十的方案跑出来, 小白也能从完全不会变成视频大神。需要这个 skill 的 评论区猪脚饭整理好了直接抄作业。最后点个关注点个赞,祝大家爆单!

今天想给大家分享一个我用了这么久 skill 总结下来最有用的一个设计原则,就是原子化加编排 啊,我们先不讲概念,直接看它最终的效果会长什么样子。我这里做的一个 agent 的 工作流是我输入一个抖音博主的主页链接, agent 的 就会一步步的帮我把这个作者的信息数据,以及他历史发布的所有作品的内容和数据全部采集下来, 最后还会给每一个作品打好内容标签,然后汇总一份报告给我。我们看一下这个项目的 skill 目录,就能很直观的感受到 原子化和编排到底是什么意思。这里有十来个原子化的 skill, 他 们每个 skill 都只负责一件很小的事情, 比如说这个就是解析抖音博主的作者信息的一个 skill, 然后这个就是采集这个作者历史的每一条作品的数据,还有一些音视频封面文件的一个 skill, 这个就是如果是图文作品的话,那会对图片进行一个 理解,然后提取图片上的文本的 skill。 这个呢就是如果是视频的作品的话,就会去抽取视频的音频,然后把音频转写成文字的一个 skill。 在 这个转写 skill 里面,因为我是通过远程连接我的 windows 电脑,帮我去做 gpu cuda 加速转写的,所以这里会有一个远程 cuda 转写的这样一个 skill。 这个就是转写完之后,再用大语言模型做一遍润色,因为有一些专业术语之类的需要 啊,经过大语言模型做进一步的润色和处理的。最后就是两个给博主和他的作品打内容标签的 skill, 这里面每一步都是一个独立的原子化的 skill, 它们每一个 skill 都只处理一个 很小的原子化的任务,做完他就直接吐,结果他也不管上下游是谁。那说完了原子化编排是什么意思呢?编排 skill 的 唯一作用就是把这些原子化的 skill 串成一个完整的工作流, 我们可以打开这个编排 skill, 看一下它长什么样子。首先就是它会解析我给出的指令,就是抓取哪一个博主的 数据,然后抓取的作品有多少条。然后我们主要看一下它的工作流程。第零步,它会去调用一个 skill 去做健康检查,看一下我远程的那个 windows 电脑是不是可连接的,然后 c u d a 啊,还有一些依赖项是不是可用的。 然后第一步就是去调用解析作者的这个 skill, 拿到博主的一个概括和信息。第二步就是 采集作品的 skill, 把这个博主的所有作品都抓取下来,包括作品的一个基础信息数据,还有音视频和图片的原文件。然后第三步和第四步就是作品拿到之后分成两种 作品类型,如果是图片的话,走 ocr 提取文字的 skill, 如果是视频的话,那么就走视频音视频转写的一个 skill。 第五步就是用认色 skill 优化一下一些专业术语, 因为 whisper 转写对中文还有一些专业术语,它处理的是不够准的,所以这里需要用大圆模型做一个润色处理。第六步就是基于抓取到的所有作品的内容,跟我协商出 几个作者级别的标签,然后第七步就是为每一个作品打上这些标签,最后就是给我输出一份总结报告,那这里我们可以注意到,就是编排 q, 它自己是没有任何新的逻辑的,它 整个 skill 点 m d 里面就只做一件事情,就是声明工作流总共分为哪几步,但是每一步具体要怎么实现,其实是写在被调用的这个原子化的 skill 里面的,它并不在编排的逻辑里面。那么为什么要这样做呢?我觉得这么做是有三个好处的。 第一个就是让我们去设计工作流,还有设计 skill 变得非常简单,如果你要做的一个工作流或者是一条流水线,它的链条是比较长的, 一上来我们就想把它写成一个可以用的 skill, 让它能跑通,会发现是寸步难行的,很多时候边界划不清楚,流程理不顺,调试起来也很痛苦。但你拆成一个一个原子化的 skill 之后,会发现每个 skill 其实它的实现都是比较简单的, 可能几分钟就能跑通一个,这样的话我们一个一个 skill 去搭建起来,去验证起来就会非常简单了。 第二个好处就是这么做它的可叠代性会非常强。如果我们把所有的业务逻辑都放在一个大的 skill 里面,那么跑起来之后我们去想要单独去优化某一个环节, 我们需要在几百行的 skill 点 md, 还有一堆 reference 文件或者是 scripts 脚本文件里面去找到 某一段或者某一行,改完之后你还担心破坏别的步骤,我相信做过大 skill 的 朋友应该都能懂这种感觉,那么原子化之后我哪一步效果不好,需要优化,我只需要去改那一个小的 skill 编排很多时候根本都是不需要动的, 这么优化起来的话,我们的目标和方法都是非常明确的,根本不用担心破坏整个工作流。第三个好处,也是我觉得最重要的一个好处,就是原子化的 skill 是 可以被附用的。你看刚刚那十个 skill 里面,像图文、 ocr、 音频转写、润色、打标 这些其实都是跟抖音这个平台无关的一个通用能力,所以我现在做的是抖音这个平台的工作流,那后面我要再去做小红书,做 b 站 或者做视频号的类似的工作流,那这些 skill 其实一行都不用改,我只需要再去写一个新的编排 skill, 按同样的格式把它们串起来就可以了。 所以原子化的 skill 攒的越多,我们下一个新的工作流的搭建成本就会越低。而如果我们把整个流程都做在一个大的 skill 里面的话,那我们想要再附用到别的平台上,可能就没有那么简单那么清晰了。 最后我们可以看一下这个 skill 实际跑起来的一个表现啊,我只需要在绘画里面调用这个 skill, 然后丢给他一个抖音博主的主页链接,然后跟他说要采集他的所有作品, 我们就可以看到他一步步的去调用我们刚刚在那个工作流编排那个 skill 里面串的那个流程。第一步去检查我的 windows 是 否可连接,依赖是否都已经安装好,第二步就去解析这个作者, 第三步就去拿到这个作者所有的作品,第四步就去把他的视频进行了转写, 会推送到我的 windows 电脑上,然后一个个去做转写,转写完成之后,他会自动去做一个 l l m 的 大圆润色,转写完成之后就自动进入下一步,根据这个博主的历史的所有作品内容去归纳他的一个内容标签,然后跟我协商确认, 我确认完之后,它就自动地去为它抓取到的每一条作品去做达标,最终就给我生成了一个总结汇报。 整个流程除了我在它提取作者标签那一步参与了一下确认,其他全部都是由 agent 自己一步一步调用各种 skill 去完成的,我觉得整个流程真的是非常清晰的。那最后我们也可以看一下最后最终它产出的一个结果。第一个是这个数据库 啊,我们可以看到每一个作品就是一行数据,它有标题,有正文,有标签,然后是什么时间发布的,以及各种点赞、评论、转发收藏的数据,包括说各种原文件、音视频 封面的原文件的这个文件路径也都采集进来了。然后第二个输出的话,就是每一个作品的音视频, 还有封面的原文件,还有转写完之后的这个文字稿,都非常格式化地落在了我的本地的文件夹里面, 那么这期就到这里,如果你也在做页尾整的,需要搭很多可附用的工作流,可以尝试一下用这个思路去做你的 skill 的 设计。如果大家觉得对你有帮助的话,可以帮我点个赞,点个关注,我们下期再见!

很多人用 codex 做复杂任务时,都会先说一句,你先帮我做个计划。这个习惯当然是对的,但问题是,很多计划最后只留在对话里。一开始, ai 可能会规划得很清楚,第一步做什么,第二步做什么,风险在哪里,测试怎么跑?但等你中间补了几次测试, 测试失败了几轮对话越来越长之后,经常会出现一个问题, ai 好 像又偏离了最初的计划。所以这一期我想聊一个非常实用的思路,别把复杂任务的计划只留在对话里。 对话里的计划本质上还是上下文,上下文很适合保存当前这次交流的信息,但它不一定适合保存一个复杂任务的完整状态,尤其是这些任务。比如一次比较大的重构, 比如跨多个文件的功能开发,比如需要先读代码,再设计方案,再分阶段执行。再比如测试失败后需要反复修复。这时候,计划如果只存在聊天记录里,就很容易出现三个问题, 第一,早期计划被后续对话冲淡。第二,关键发现散落在聊天记录里。第三,如果任务跨绘画继续, ai 不 一定还能完 完整知道之前做到哪一步。所以我越来越觉得,如果计划只留在对话框里,它不是项目资产,它只是临时上下文。复杂任务的计划最好能进项目文件系统,这就是 planning wins files 这个 skill 想解决的问题,它解决的不是 ai 会不会做计划的问题。 cortex 本来就可以, plan 科室也有自己的 计划模式,很多 ai 编程工具也都可以先规划再执行。但普通 plan 最大的问题是,它通常还停留在当前工具、当前绘画、当前上下纹理。而 planning with files 的 思路不一样,它会为一次复 杂的任务在项目组里面生成一组 planning 文件,包括 task plan, confidings, progress。 task plan 用来记录任务目标、阶段拆分 执行计划。 firing plans 用来记录调研过程中的发现,比如关键代码位置、项目结构、分线点和设计判断。 progress 用来记录当前做到哪一步, 哪些已经完成,哪些测试已经通过,还有哪些问题没有解决。所以它不是简单地让 ai 写一个计划,它更像是给这次复杂任务创建一个小型任务工作区。我个人觉得, planning with files 和普通 plan 模式最大的区别就在这里。普通 plan 模式是让 ai 在 这次对话里想清楚, planning with files 是 让项目把这次记录任务记下来, 这意味着什么?假设我今天用 cortex 做了一个重构任务, cortex 生成了这些文件,明 我不想继续用 context 换成 ctrl 或者其他 ai 编程工具。他只要读取这些文件,他就可以知道这次任务的目标是什么,之前做过哪些判断,哪些文件已经读过,哪些代码已经改过,哪些测试已经通过,还有哪些问题没有解决?这点很关键, 因为复杂任务的状态不再被锁在某一个 agent 的 上下文里,而是沉淀到项目文件系统里。当计划进入文件系统,任务状态就不再属于某一个 agent, 而是属于这个项目。 不过这里也要注意,不是所有任务都需要这个 planning with files 这个 skill。 如果只改一个变量名,补一个小函数,做一个简单的功能,那完全没必要,小任务直接做效率更高。 planning with files 这个 skill 更适合快 多个文件的修改,比较大的重构,需要先调研再开发,需要多轮测试和修复,或者是今天可能做不完,后续还要继续,甚至中途换不同 agent 来接手。简单地说就是小任务靠对话,复杂任务靠文件。 实际使用的时候,我因为还装了别的 skill, 我 会明确告诉 codex 我 大概是这么做的, 然后再加上需求,我将是显示地告诉那个 cortex, 我 要调用这个 skill。 它会为呃任务创建 task, plan, findings, progress 这些文件,这组文件就变成这次任务的入口。下次继续做的时候,不管你用 cortex, cursor 还是其他的 ai agent, 都可以先让它 读取这几个文件再继续执行。这和普通 plan 的 模式的区别就很明显了,普通 plan 更像是一次对话里的临时计划, planning with files 更像项目里的任务状态文件所。 所以这一期我想表达的是,复杂任务不要只留在聊天里,要变成项目里面的任务资产。 planning with files 的 价值不只是让 cortex 写计划,更重要的是它把计划发现进度都放到项目文件系统里,这样复杂任务就有一个可恢复,可以追踪,甚至可以被其他 ai agent 继续接手的工作区。不过这也会引出下一个问题,如果我同时安装了 planning with files, superpowers, 甚至还有自己写的 planning skill, cortex 到底应该听谁的?同类 skill 装太多会不会冲突?会不会增加 token 消耗?这个问题我们下期继续聊,这里是 cortex 共创实践,下期我们继续。

接下来我会直接用一些案例来展示它的能力。第一个案例是本地文件的处理,那为什么我第一个案例要说本地文件处理呢?是因为大家之前常用的对话的 ai 产品其实是没有这个能力了, 也导致了我们经常需要复制、粘贴、上传、下载文件,其实是很浪费时间,那 agent 的 本地文件处理能力就会大大提升我们的效率。那比如说我这里有一堆视频素材,文件名全是乱的,以前呢,我只能一个个打开看,然后再手动改名,其实是非常浪费时间的。 现在呢,我直接把这个文件夹丢给 codex, 然后跟他说请读取这个文件夹中的视频及图片素材,然后根据画面内容给我重新整理命名发给他。 ok, 我 们可以看到 codex 已经把我们的素材都整理好,他给我们根据画面内容分成了五类,并完成了重新的命名,并且给了我一个整理清单,包含了原本的文件名,还有新的文件名, 还有内容的说明。那我们现在也回到刚刚的文件夹看一下,看他改的怎么样。这是原本的文件夹,可以看到他根据不同的类型建了不同的文件夹,并且给我们一个整理清单, 我觉得这个任务完成的是相当不错。那当然,第一次做这种批量操作呢,我建议大家可以让他们先生成预览的清单, 不要马上重命名,你确认命名风格没有问题,再让他真正的去执行。那第二个案例,我们来讲一个更贴近内容创作者的能力,用插件和 skill 把口播稿变成视频, 我想把一段口播稿做成一个有节奏的视频片段,通常我会用到两个东西,第一个是插件, 比如 hyperframes 插件,你可以把它理解成给 codex 装了一个能力包装上。以后呢, codex 就 知道 hyperframes 是 用来做 html 视频片头,动画字幕视觉化和动态图纹的。那第二个 skill skill 其实更像是我们自己的工作方法说明书, 那比如说我这里有一个自己的 video skill, 它规定了做口播的节奏,然后再做 time map, 屏幕上呢,只能放关键词,动画呢要跟着旁白重点走,最后呢,还要检查文字有没有重叠,有没有太小,有没有画面太空。那所以这个案例完整的跑起来,就是我给 codex 一 段口播稿,然后告诉他,请使用我的 video skill 的 方式,把这段口播做成一个视频片段。 然后呢,他会开始跑关键帧的预览,主要看三段的版式,有没有文字的溢出啊,层级是否清楚啊,然后再决定调整之后要不要渲染完整段视频。 ok, 这里他根据我们的需求,将文章分成了三段,然后做好了视频,并且渲染好了。这里我给大家看一下,如果之前看过我视频的,应该有看到过这些片段, 那这里呢,他会根据口播的速度,对画面的一些重点部分进行高亮,或者是增加一些动画的特效等等。 这个案例呢,其实想跟大家分享的是插件和 skill 的 使用,插件解决的是 codex 会不会用这个工具,以及是否具备这个能力。那 skill 呢,其实就是我们自己的工作流, 每当你完成一个任务,如果你觉得 codex 最终出来的结果是 ok 的, 那你就可以让 codex 把这个工作流总结成一个 skill, 下次遇到类似的问题,你就可以直接调用这个 skill 了。 前面给大家讲的都是比较基础的功能,接下来我们用一个案例讲一个稍微高级一点点的功能,命令行的使用,也就是 c l i, 那 c l i 的 意义就是让 codex 能够通过命令行直接操作其他的程序。这里呢,我们可以以非输的 c l i 为例, 你可以直接去复制提示词,然后在这里聊天框里面,你可以选择一个文件夹啊,就像我之前说的,我可能一般这种任务会把它放在这个文件夹, 那直接把我们刚刚复制到的 c l i 的 提示词发给 codex。 那 我们可以看到,在安装过程中其实会遇到各种各样的问题,但是 codex 一 般呢,都会自己解决,如果实在解决不了,需要权限的,他才会再来找你。 ok, 那 现在 c l i 就 已经配置好了, 装好之后呢,你就可以在 codex 里面让他去操作文件了。比如说你可以直接跟 codex 说,帮我整理一下这个文章,优化一下内容, 那它就会自己去操作啦。那这里我想说一下, c l i 呢,不只是给程序员用的那个黑框命令行,对 codex 来说, c l i 是 很多软件对外开放的一个操作按钮,当一个工具有了 c l i, codex 就 更容易替你去调用它。 c l i 也是 codex 从聊天变成执行的一个关键。 最后,如果你实在搞不懂这些名词,什么 c l i m c p 啊?因为我经常也搞不懂。那其实也有一个非常简单可行的方式,有什么问题直接问 codex。 这其实也是我经常用的方式, 就是哪里不会点哪里哪里不懂就直接问。在跟它的一轮轮的对话和操作过程中,可能你就已经搞定了这件事情了。

ok, 欢迎大家收看锐 t e s studio, 今天为大家分享四个 codex 里面的 skill 啊。说实话,新手刚开始用 codex 的 时候,都会面临很多的情况,比如装 skill 啊,今天我推荐这四个 skill, 你 装好它之后,它就能直接变成一个帮你干活的工作台,非常的方便。你们可以暂停截图, excel 呢,它们更像是一种固定的工种,可以帮我先问需求,再出方案,再整理文件,最后检查交付。 我个人的 codex 里面呢,也装了几个比较好亮的 excel, 有 个人的,有系统的,大家可以简单的浏览一下。我个人还非常推荐 spring 这个 excel, 当你提供需求的时候,它会帮你整理的非常的好。 这里呢,我用 bruce o'ne 处理一个接单的需求,就比如客户是一家本地的美甲店,想让我在小屋售楼引流,往往他想要多来点客户,然后咱们就可以用 bruce o'ne 先问清需求,然后让他给咱们两到三个可执行的方案。 那我这里只做一个演示,不给大家做安利的输出了,就是教大家怎么样调用一个 skill。 我发现很多新手一上来学 ai 就 开始研究模型了,由此,但其实真正能让你少返工,能交付的往往是这些固定的工作流。 如果你想要打造一套自己的低车门跌单工作流,那么就关注我或者 tony stu, 下一条我会出一条视频,教你怎么安装。