大家好,我是欧哥,今天我想给大家推荐一个我认为阶阶段 ai 做 ppt 最强的一个实践方式,就是用 codex 再加它里面内置的 image generation 的 这个 skill, 也就是去调用它背后的 image 二模型,再加上 codex 里面的一个 presentation 的 插件,这三者的一个组合,我认为是当下 ai 做 ppt 的 最强的一个组合和实践。 为什么我会这么说呢?我给大家拆解一下。首先第一点, codex 它是作为一个总导演,一个项目经理的一个角色,它负责去理解你要做什么样的 ppt, 然后它去拆解任务,去决定什么时候用 image 二,什么时候用 presentation, 它也负责整个的文件的管理,素材的管理。第二个 image 二呢,我们都知道它是现在最好的闭源的一个深图大模型,而且它对中文的一个支持非常的厉害, 所以它承担的自然是最核心的一个视觉素材的一个生产,包括图片背景以及里面的一些 png 的 素材。但是它产出的只是一个图片的一个素材,并不是一个完整的一个演示文稿。 很多人可能单独用一,每个二它也能生成连续的很多页的一个图片的一个 ppt, 但是这并不是我们真正想要的,所以我们就会引出最后一个 presentation 插件, 他负责做版式放置、文字、图片、图表渲染、预览,检查页面的效果,然后最终导出一个可编辑的 ppt x 的 一个 ppt 文件, 所以他们三者连在一起,一个完整的一个制作 ppt 的 一个系统。好的,接下来我就简单的演示一下,其实非常简单,我就以我正在做的这个视频为例,我们想要介绍 codex 做 ppt 的 这一套系统,让他去做一个 ppt, 我 首先跟他说, 请按照这个内容做一个八页左右的 ppt, 你 可以先去生成每一页的一个大纲和内容,然后给我预览,预览完成之后,等我提示下一步,你再进行下一步的执行。好的这一步, 为什么我们不直接让他去做一个完整的 ppt? 虽然他也可以直接去做,但是我想展示的是,其实中间的这些环节, 我们也可以通过人为的去把控和一些调整,来达到我们最终想要的一个效果。因为如果你直接让他去跑,能得到的效果不一定是是你想要的。好的,现在让我们来看一下,他已经设计好了整个 ppt 的 一个框架大纲和里面的内容, 这里我们大致看了一下,我觉得是没有问题的。好,接下来我们第二步,我们确认好这个内容和大纲之后,如果你觉得这里有问题,你可以跟他说,让他帮你改,改到满意之后,我们这里就可以跟他说, 现在可以调用 emoji generate 选这个 skill 去生产实际的图片的视觉效果。你可以给我三套的视觉风格,每一张图片就浓缩了这八张图片,然后一张图片里面代表一个视觉风格。 好的,接下来这一步,我不是让他给我一张图,一张 ppt 这样输出,因为这样浪费时间也很慢, 而且可能只是一个单一的视觉风格,万一得到这个风格不是我们想要的,就比较浪费时间。所以我这里采用的一个步骤就是让他把八页 ppt 全部浓缩在一张图里面, mag 二模型完全有能力做到这一点的,就是一张图里面包含这么多的信息量, 然后我可以一次性让他给我三张,且三张的视觉风格不一样,这样我就可以去挑选出一个我认为适合的视觉风格。好的,这边我们看到他已经生成好了,一共给了我们三种不同风格的一个 ppt 缩略图, 第一个是一个比较科幻的,第二种是一个比较常规,第三个其实都不错,这个时候就看你喜欢哪一种, 这里我就选择第三种,简单干净的,这里我们检查好里面的一个大概内容,以及确定好我们的视觉风格之后,接下来有两种路径可以选择。第一种比较简单的,如果你不需要编辑这里面的元素文字, 你觉得它生成的这个已经够好,你已经可以用了。那么很简单,你直接让 emag 二把这里面的这八张图直接按照图片的格式去生成出来,最多你可以让它帮你转成一个 pdf, 这样就很快,相当于直接是八个图片去展示 好,这是第一种,这种比较简单也很快,但是这不是我今天想真正介绍的, 因为这样就没有用上我们刚刚说的 presentation 的 那个插件。我们如果想要得到真正的可编辑的,可拖动每一个元素的这个 ppt x 的 文档,接下来我们就需要调用 amg 二去生成这个 ppt 里面所需要的所有的元素素材图片,然后把它们以 png 的 格式生成, 然后再由 presentation 插件去排版排布,然后导出成一个 pptx 文档。 好,接下来让我们就告诉他,请按第三种风格去生成 ppt, 我 需要你把里面的每一个视觉元素,图片、文字都按照 png 的 格式去生成。然后第二用 presentation 插件去制作成一个真正的 pptx 文档。 好的,就这么简单的一句话,这一步可能需要花费的时间会久一点,因为 img 它要去生成里面的各种各样不同的元素。好的,这里跑了十分钟,它也是跑完了。我们这边来看一下, 可以看到它现在已经生成了一个完整的八页的 ppt 的 内容。我们先简单看一下,内容基本上都是正确的,它按照这种模式输出出来的。这是一个 ppt x 的 文档,它的每一个元素都是可以去进行编辑的。 好的,那么这个就是一个完整的一套用 ai 去生成一个可编辑元素的这么一个 ppt 文件的最佳实践。如果大家有认为更好的一些方法,也可以在评论区分享。
粉丝362获赞6693

我刚刚又去生成了一个这样的一个图,根据上一个视频呢,我们在这里的时候,我输入了个请把它变成一个 skill, 它就可以生成这样一个 skill。 呃,它的目录呢?就在这里面啊,这个点 codex skill 里面当然也可以通过 下面的这个打开方式打开它,这样我们就能打开, 你可以看到它在这个点 codex skill 里面有一个 visual com 啊,这个一一个 skill, 这里是新的项目,然后在这个界面呢,它去调用这个 skill 去设计一个架构图, 因为这个 skill 是 刚刚写的,所以它啊这里面还是会存在一些问题 啊,其实可以看到他这边调试过程非常长。呃,这边他做一些修修,改改,最后呢会生成现在这样的一个效果, 现在是没有背诵播放的,这是他画图的一个速度,就是刚刚他可能去调研整个项目,而且是第一次使用这个 skill, 可能会有点问题,然后他会做一些修改。 嗯,这个图呢基本上就画好了,对于我这个项目的图来说,他就画好了,画了一个系统加入图, 我正在做最后的思维工作,正在思考。 嗯,整个视频我现在到现在其实是这个三十二分钟,他这边已经画好了,然后打开方式的话,你就能够看到这个是 png 和这个是 png 图片,然后这个是这个微设格式的图片, 然后呢我说请你,呃,在刚刚的过程中,你觉得是否需要更新这个 skill 啊?他就说需要更新,但不用大改,第一个怎么办?第二个,第三个,第四个价格图的箭头,这个箭头的策略, 然后我就说,呃,让它更新 skill, 我 就去更新了。那么这个呢?还是在我们之前那个,呃,就是 codex 的 目录,那个目录下面在这里啊。 然后同时呢,我又想用这个切克笔记本的 image 二模型,让它去画一遍这个架构图,哦,就调用了这个 image 镜,然后它去画, 这个画出来和刚刚画的是差不太多的,我觉得他们的 skill 应该就是这么去调试出来的,不是人为去写的啊。这个呢,就是他刚就是呃一米七二点零模型画出来的深图模型画出来的。 这个是刚刚的 viso 画出来的。这个呢是 viso 的 导出版的 png 格式。

codex 太厉害了,给你们看一下啊,就是我跟他说我的需求啊,就是自动化生成图片,然后对应的 cds 二点零的分镜提示词,然后直接生成视频,你看这个流程,直接他就能帮我做了啊, 他先让我啊,登录授权我们这个呃节目的账号啊, 然后我登上去之后啊,他说让我确认,我说我的意思是用 image 二模型生成图片啊, 就是目前来说最强的生图模型,然后好,他用了 gpt 的 生成了这四张啊图片看,然后他就写好了这个完整的分镜提示词, 点进来看一下啊,我对他这一版其实是不是很满意啊,我就又上传了我的塑身形象和这个音频音色一起给他生产啊,他就直接啊添加进去后啊,升级后的,其实是看见没有啊, 他的运镜啊,他的音频音色,还有啊他的模型啊,比例, 分辨率描述,他都会一并成交,让我确认,确认之后,好,你看八分钟之后生成完成, 虽说非常的厉害。你看到这边我自己来剪一下。看这套新中式 主楼加旁边小院房,一进门就是双层挑空门厅气场一下就出来了,面宽十三米,进深十一米五,屋檐声带一亮,晚上比白天还好看。细节看这里,门厅线条,灯光,院子比例,这房子盖的讲究,老家准备建房的评论区打别墅,我把这套思路讲给你听, 怎么样,是不是非常的厉害,就是现在哦,如果说你还没有体验过这种 and just give 就是 这种自动化的啊, 模型就真的是,呃,你现在所有的工作方式都可以通过它给你复制出来了,不信你你问一问他,他都能给你复制出来, 真的。所以如果你还没有体验过的可以好在评论区啊,打个一啊,或者说想体验我会教你怎么去做。我真的想在 ai 时代啊他们大家一起无限进步啊。

codex 加 html 才是做 ppt 的 王炸组合,今天教你用 codex, 只要四步就能做出可以编辑修改的精美 ppt。 第一步,上传你的文档,让 codex 根据你的文档生成 ppt 大 纲和主页内容,这里的大纲就是后续 ppt 的 内容框架。第二步,让 codex 调用 html 这个 style, 根据刚才的大纲生成三版不同视觉风格的 ppt 预览,以拼图形式输出。 这一步我们是为了快速选择合适的视觉风格,我更喜欢这一张。第三步,让 codex 寄予我刚才喜欢的视觉方案,继续调用 image 帧这个 skill, 将拼图中的每一页依次生成高清单页视觉稿图片。 和直接生成 ppt 相比,先生成视觉稿能更好地利用 m h two 模型的构图设计能力,露出的 ppt 会更有设计感。第四步,也是最重要的一步,复制我这段已经调教好的提示词,让 codex 把单页视觉稿图片还原成可以编辑修改的 ppt 文件。 这里我建议每次单独还原一页视觉稿,如果效果不满意,重新生成会更方便。我这里先还原第五页视觉稿,看下效果。可以直接用 wps 打开,我们可以看到这页的还原效果很好,而且可以随便编辑修改 ppt 内容。 接下来我们对剩余每一页视觉稿图片都执行刚才的操作,最后把得到的多个 ppt 文件合并起来,一份充满设计感并且可以编辑修改的 ppt 文件就生成好了。

今天教大家用 ai 的 skills 功能,快速生成风格统一的 ui 页面,同时搭建可直接编辑的组建库和变量库,步骤很简单,跟着做就行。 首先打开我们的老朋友,选中上期视频生成的设计规范,点亮思考模式,输入这段提示词,稍作等待对应的 skill 就 生成完成了。点击保存即可。保存后,点击页面上的书本图标,就能找到刚保存的 skill。 接下来我们选中首页,让它用这个 skill 来继续生成其他关联页面。 一会儿,一整套风格统一的 app 页面就生成好了,大家可以看一下这套 ui 的 风格高度统一,用 image 二生成的界面,质感果然很出色。接下来重点来了,我们用 ai 在 figma 里搭建这套 ai 的 组建库,切换到 codex 界面,承接上期视频的任务,继续输入指令。 建议大家把 figma 文件地址一起粘贴进去,能大幅提升效率。输入完成后,让 ai 自动执行任务,过程中遇到弹窗提示,全部点击允许就好。 稍等片刻,组建就会自动搭建完成,并且被分类放在不同的分页中。同时 ai 还会自动创建对应的样式和变量,操作起来特别省心。好了,赶快去试试吧!

每一个刚开始学 scale 的 人,都应该先安装这两个 scale, find scale 和 scale creator, 有 了这两个技能,可以让你少走很多弯路,我给大家详细拆解一下原理。 第一个, find scale, 这是一个找 scale 的 scale。 你 想想, scale 这个生态已经有了上百万个 scale 了,全世界有大量人为 各种各样的工作场景做好了四个样,视频制作、股票研究、文案生成等等,各个行业的人都在贡献。在你自己动手之前,第一步应该是先搜一搜你想做的事情,有没有人已经做好了。 the scale 就是 帮你做这件事的,告诉他你的使用场景,他帮你在社区里搜出已有的相关 scale, 让你直接拿来用,或者说在别人的基础上改一改,不要重复造轮子,别人已经造好了,先拿来用。 第二个, scale creator, 这是一个造 scale 的 scale。 当你用 find scale 搜过了,发现没有完全适合你的,这个时候就需要自己做一个 skill creator 的 核心逻辑是,把你想要 ai 执行的工作流程像教新人一样描述清楚,第一步做什么,第二步做什么,遇到什么情况该怎么判断,输出什么格式。它会引导你把这些内容整理成一个标准的 skill 文件。之后你每次需要用,喊一声就行, 他还会帮你做测试。你教完之后,让 ai 模拟执行一遍,看哪里有漏洞,哪里说的不清楚,反复打磨,直到稳定可靠。说了这么多, sky 能给普通人带来什么?三个层次, 第一层省时间,以前重重复三十分钟的事,现在一分钟搞定一个 sky 花一个小时学会用三次就回本。第二层质量稳定,不会因为你今天累了烦了,输出就变差。 ai 按照你教的标准来,每次都一样。第三层也是最重要的一层,你第一次拥有了造工具的能力。 以前把一套工作流程变成自动化工具,你需要找程序员,需要找开发、排气,甚至需要花钱。你有再好的经验和方法论,也只能锁在自己的脑子里,一遍一遍手动执行。现在不用了, 你自己就能把经验变成工具。你干了十年攒下来的判断力、流程标准, 以前只能靠你自己一遍一遍重复,现在它可以脱离你独立运行,甚至可以分享给别人用,可以二十四小时不间断工作,你的经验终于不只是属于你的脑子了。

今天分享 codex 如何安装技能,通过斜杠加名称,可直接调用技能斜杠,找到官方 skill 英斯操乐技能,选择输入,帮我添加这个技能,粘贴技能 发送执行即可。技能添加成功,出现斜杠库里面,这样就可以指定技能干活。这是我让技能生成的 p r d 文档,这是让技能生成的交互原型,大家若想要这个需求文档及原型技能,可在评论区留言想要。

现在用 codex 也能做出这样这样甚至这种带转场动效的产品宣传视频。重点是你不需要会 ae, 也不用重新学一套复杂的剪辑软件,它背后用的就是 remotion 官方开源的 skill。 现在 getup 上已经有了三点二 k 的 style, 它不是那种像抽盲盒一样的纹身视频工具,它本质上是用代码渲染视频,所以画面、节奏、字幕、转场都可以精准控制。 比如你可以直接跟 codex 说,帮我做一个八秒的 codex 产品发布视频,开头放产品名,中间展示三个卖点,最后加一个行动按钮。 如果对动画效果不满意,也不用重新剪,直接文字描述要改哪里?比如截图出现太早,标题动效弱一点。如果你平时手里有素材,但就是不会做动态包装,这个神器绝对是你的救星,安装也非常简单,只有一条命令,感兴趣的朋友快去试试吧!

今天教大家用 codex 一 分钟做出精美的 ppt 文档,上传你的文章后啊,复制这段提示词,就会生成 md 大 纲,大纲标题、目录这些都没有问题之后啊, 然后复制这段提示词, codex 就 会生成一整套的 ppt 视觉方案,方案也敲定了。最后我们粘贴这段提示词到指令框中,记住要调用 emoji 这个功能, 稍等片刻就会生成完整的 ppt 文件。这个文件是可以下载的,不管你是学术答辩还是工作汇报,都可以用这一套提示词。提示词我放评论区点赞收藏!

我敢说现在 codex 加 image 二加 presentation 这个 skill 就是 当前 ai 做 ppt 的 最佳解。 以前我对于 ai 做 ppt 是 很不屑的,就因为我自己对于 ppt 的 要求很高,排版格式、字体间距以及整体的审美。我觉得 ai 之前做了很多时候就非常的怎么说 ai, 尤其是中文的内容,就特别像那种二十年前的排版。 但是我最近用下来啊,我觉得像 codex 做 app 已经能够符合我当前的一个预期了。今天我就跟大家分享一下实操到底怎么做。哈喽,大家好,我是 fred, 专注从普通小白的视角分享怎么从零到一,学习 ai 和 web coding 来提升自己的工作和生活效率。 我觉得这套组合啊,强的地方啊,就不是说帮你去生成几页 ppt 这么简单。它强在可以通过 codex 把整个流程串起来。第一步就是 codex 可以 把大纲定清楚,比如说它的主题,受众页数,每页讲什么,整体确认下来。 第二步可以用 image 二去生成一整套整套的一个页面的总览图,不是只生成一个封面,而是把每个页面大概长什么样子,放什么内容,整体的风格是什么都合在一张图里面去看清楚。 第三步的话,就可以通过啊这种 presentation skills, 然后去把它编成一个整个可编辑的 ppt, 能打开,能改造、能换图,才适合我们真正工作。里面的演示和交付我给大家实际演示一下哈, 我们打开我们的 codex 这个呃对话,比如说我就先让他帮我生成一个介绍 codex 这个实业的 ppt, 然后让他帮我生成一个大纲和内容,不用做 ppt 的 直接执行,那他就会花这个时间去,比如说生成十一页,每一页的内容是什么,讲解要点是什么 啊?然后这个时候我就会让他调用 image 进这个 skills, 它背后的底层其实就是 image 二啊这个模型, 然后帮我输出三个不同的风格的 ppt 图片,包含这十页 ppt 的 实际内容,我们就可以看到啊,它能够输出三个不同风格的,白色的、黑色的,然后还有一个是相对 p l 卡通的。 那下一步你应该做什么呢?很简单,就是帮我把这个第,比如说我就选第三个方案,帮我把这个第三个方案生成一个 ppt 文件,然后去调用 presentations 这个 skills, 那 ok, 很 快它就能够直接输出一个可编辑的这个完整的 skills, 我 们把它整个打开, 虽然说他长得跟刚刚那张图没有特别像,但是我觉得现在已经完完全全符合我的要求的,就是他整个的排版,包括他的这里格标题的整个的,呃, 字体大小排版啊,主见啊,包括这些内容我觉得已经非常非常成熟了, 就基于这个 codex 加 image 二,加上 skills 呃, presentation 这个 skills 三句话深层的这样一个内容,我就已经完全符合当前。我觉得对于普通学生而言也好,或者说普通打工人而言也好,完全可以呃,满足大家工作和生活的需求。 ok, 我是 fred, 呃,下一期我会持续给大家分享更多 ai 实操的工作流,我们下期再见。

想不想让你的 codex 越用越聪明,越用越懂?你把这段提示词发给你的 codex, 它的效果啊,是经过 openid 总裁认证的,算是官方认可的优化方式。它的核心的优势是让你从给一个任务,让它帮你完成这个阶段,变成让它自主的去进化。这个提示词可以让 codex 回过头来去看你这段时间的一个工作记录,你最近让他干什么活, 哪些事情是反复出现的,哪些流程每次都差不多,哪些任务明明是可以不用手动重复。结合这个提示词,它自动可以把这个工作分类,有适合它自动帮你做成 still 的, 比如说你固定的内容创作流程,资料的整理流程, ppt 的 生成流程。还有一些适合做自动化的任务, 比如每天定时收集些信息,整理日报,生成代办。所以这个提示词真正有价值的地方,它不是让 callles 再帮你完成某一次任务,而是让它反过来去分析你的工作方式,帮你发现哪些事情以后可以流程化、标准化、自动化,相当于针对你这个助手完成一次整体的系统升级。

用 codex 做内容,一定要装这三个 skill, 否则它只会一直停在写代码。它们不是让 codex 继续改页面,而是让它直接生成图片、视频和数字人素材。 这三个 skill 来自模型调用技能库,让 codex 把内容模型接近工作流。离谱的是,很多人用 codex 做产品,最后还要手动去别的平台找素材。最关键的问题是,代码都写好了,封面演示视频和口播人像为什么还要重做呢? 第一个 ai 生图 skill, 能把文字需求直接变成可用图片素材现出来,比如封面主、视觉产品图、角色图、场景图,不需要再让 codex 只写占位图,它解决的是 codex 会搭页面,没有真正视觉资产这个问题。第二个 ai 视频 skill, 负责把脚本或画面需求变成可用视频素材,产品演示、开场镜头、转场、氛围画面,不用每次都手动去素材库里面反复找, 它解决的是 codex 会搭页面,但不会帮你把展示内容做出来的问题。第三个数字人 skill, 负责生成口播视频,适合教程讲解和产品介绍。以前你要录屏、配音、剪辑,现在可以让 codex 把人物讲解也接近流程里。 这三个 skill 合在一起,不是炫技,而是把内容生产变成视频片段。最后用数字人把核心卖点直接讲出来。 codex 真正变强不是只会写代码,而是能把项目包装成别人愿意看的内容。所以这期讲的不是 ai 生图,而是让 codex 从开发助手变成内容制作助手。

今天我们学用扣带斯制作 ai 爆款带货视频,一张产品白底图,用 qq 直接生成脚本达人类型,分镜头和视频提示词,做跨境都知道产品图好找,视频难做,尤其是开头的钩子怎么抓人,达人怎么设定,镜头怎么拍?英文口播文案怎么写?废话不多说,先看案例。 今天我拿一张粉底液的产品图,用抠蛋斯加 skill 加 c 蛋斯二点零这套组合拳,从零到一,做一条完整的美区 ugc 带货视频,废话不多说,上实操一共分为三个步骤。第一步,制作 skill。 我 们打开抠蛋斯,复制这段制作 skill 的 提示词, 它会根据我们的需求生成对应的 sku 压缩包,并保存到本地。这一步只需要做一次,后期再做其他产品,直接调用这个 sku, 不 用每次重新造轮子。第二步,生成 ugc 包,新建对话,再抠弹死聊天框,输入斜杠, 找到 c, 弹死 ugc 杠 c n 这个 sku, 再把产品图丢进去这里千万不要跟 ai 说帮我做一个爆款视频, 太虚了, ai 听完都想报警。我们就 sku 加产品图直接发送,然后抠蛋死会先跳出制作前的六件事。这一步不是废话,是保险,它会先确认投放地区、发布平台、成片语言、视频形式、达人类型、 视频时长与产品卖点。我们按需求填写美国 tiktok 美式英语真人口播,没有固定达人十五秒产品卖点可以让他先根据白底图去判断,再人工微调确认方向。之后扣单词会生成完整的 ugc 包,里面包括制作参数、产品与受众人物设定、图片提示词、 视频提示词, poke 钩子口播脚本和镜头清单。注意,它不是只给一段文案,它是把策划、编剧、导演、提示词工程师全部塞进一个窗口。第三步,视频生成。先纹身图,在 u g c 包里找到人物图片生成提示词, 附知道引迷局。二、点击图片生成。这一步生成的是 ai 人物手持产品。这里有个重点,人物一定要向真实的 tiktok 达人,不要精修,不要广告,不要一眼 ai 位,最好是在卧室梳妆台自然光前置手机这种感觉, 然后涂层视频,返回扣带斯,在 ug 包里找到英文视频提示词,这里我会再丢回扣带斯,让他帮我修饰一遍。重点是需要把人物和产品都标记好,并艾特出来,保持人物和产品的一致性。其实是我英文不好,怕找不到人物和产品的 位置,但不管怎样,这一步很有用,这样导入 c 单词时,就不会一句一句找谁是人物谁是产品。修饰完之后,把提示词复制到 c 单词,再加上产品图 和人物图,最后看成品。 i'm picky about base makeup because i hate when foundation feels heavy。 从产品白底图到人物出镜,英文口播镜头清单、视频提示词,再到 ai 带货视频,整套流程就好了。以前做一条跨境带货视频,要想交本,找达人拍素材,剪节奏,现在用扣袋子,至少先把百分之八十的方案跑出来, 小白也能从完全不会变成视频大神。需要这个 skill 的 评论区猪脚饭整理好了直接抄作业。最后点个关注点个赞,祝大家爆单!

真的是太强大了啊,太强大了啊,因为看到这个。是啊,手动的,这是可黛克斯来亲自操作我的这个微秀,就是我给他说一句话啊,就是让可黛克斯来帮我绘制一个流程图, 你看他就立马就开始在我们就控制我的这个微秀在进行相应的生成啊,质量非常的好啊,真的太恐怖了啊,惊呆我了,真的很厉害, 有需要的可以大家私聊一下我啊。啊,非常的厉害,你看他现在就是他已经做到了是吧,然后还有原文件,还有 png 的 这个预览图,哎,都给你了 啊,可以看到就是重新观看了这个 cadence 控制我们这个微球的这个过程都可以进行实现。哎,有需要的可以私我一下啊,谢谢谢谢。

用 ai 剪视频,真正花时间的不是剪辑。过去半个月,我深入的研究了 hyperframes, 得出了一个结论,大多数人出片效果差,不是因为工具不行,而是因为跳过了最关键的前期准备工作,脚本怎么写,素材怎么准备,节奏怎么定,这些都是要提前想清楚的,不然后面全是反光。 所以这一期我把我的整套方案拆解一遍,从 ai 剪视频的原理到成片走一遍完整的流程,里面涉及到的所有的内容都已经开源了,你可以装上直接跟我一起操作。所以这一期又是一期非常干的视频,希望对你有所帮助。那我们现在开始 ai 剪辑到底在干什么? 其实就是让 ai 写代码, ai 用 html、 css 和 javascript 在 网页里面搭画面,动画、字幕、转场,全都靠代码, 然后浏览器一帧帧截图拼成 mp 四。所以你听到的 html 渲染成视频,说白了就是先在浏览器里把画面跑出来,再一帧帧录下来, 那代码能做到什么程度?网页上你见过的所有的交互效果、动效、转场、字幕、动画、三 d 适量图,它全都能做,但它也有做不到的,比如说实拍视频、图片这些它就不能实现,所以必须靠提前准备好素材,或者让它上网帮你来搜索。 hyperframes 就是 这种工作原理,从 html 渲染成视频,它能做的事情非常多, 画面可以分层叠加,视频文字图形往上垒就可以了。它内置了 coco 语音模型来帮你合成配音,还内置了 whisper 语音模型,帮你生成带时间戳的字幕,还能合成背景音乐和音效,甚至能一键扣掉人像背景。 功效方面,三 d、 a e 动画、 gpu 特效这些都支持生成完成后,它还会自动做一轮质量检查,扫代码结构、跑浏览器测试、抽关键帧截图,确保画面没有明显的问题。 hyperframes 的 完整的工作流大概就是这样的,先出使画一个项目,然后一个镜头一个镜头的去搭载画面,搭载完成后,检查和焦验 没有问题就预览,预览通过后输出渲染。我们在这个流程里其实就做两件事,告诉 ai 我 们需要什么样的视频,以及提供 ai 自己造不出来的素材,比如配音图片、视频设计文件等等。 但有个问题,你直接跟 hyperframes 说,帮我剪一条 spacex 的 视频,他大概率做不好,因为什么主线、什么风格、什么节奏、什么素材,他完全不知道,只能靠瞎猜。所以我写了 video spike builder, 加在了 hyperframes 前面,他专门干一件事情,通过追问,逼你动手之前,把所有的决策都想清楚。怎么追问呢?分五个阶段。 第一个阶段是锁定视频的基本盘,他会问你几个问题,包括视频的目的是什么,给谁看,发在什么平台,时常是多少核心,想传递什么信息,以及品牌的调性是什么样的。 第二个阶段是盘点素材,把你可能需要的素材分成六类,逐项跟你确认文案有没有配音,用真人还是 ai 有 没有实拍画面, logo 有 没有高清透明底,需不需要三 d 模型,还缺什么素材要去找等等这些事情。 第三个阶段是我觉得整个 skill 里最有意思的一步叫做激发表达手段,大多数人根本不知道自己想要什么效果,那他就会主动的告诉你 html 可以 实现哪些效果让你来选。 第四个阶段是定视觉主题,你可以从 hyperframes 里面预设的八个主题你选一个,也可以描述你想要的风格,让他来帮你生成一套。 第五个阶段是收集参考和返利,让 ai 有 一个具体的参考,或者明确说你不希望视频里出现什么内容,让 ai 知道哪些原则是不可以违反的。 五个阶段走完,所有的决策都会落到一份叫 video spike 的 markdown 文档里,等到 hyperframes 接手的时候,它只需要照着这份文档执行即可。 这个 skill 里还内置了六十九个预设的画面组建,包含了数据图表、流程图、思维导图、 ui 模拟、大字海报和各种场景,也不需要自己去想这一境用什么形式来表达,它会根据你的内容自动去匹配。 说白了, video spike builder 就 干一件事情逼你想清楚,你前期想得越透,后期出片的质量就会越高,返工就会越少。好,那知道了原理和流程之后,接下来我们来安装 hyperframes。 打开 codex, 点击左上角的 plugins, 在 搜索框里输入 hyperframes, 找到之后点一下右边的加号,弹出窗口后点击下方的安装就可以了。装好了之后,你可以再点进 hyperframes 的 插件页面,看看它的详细介绍。 这里有一点要注意, hyperframes 不是 一个单独的 skill, 它其实包含了十五个 skill, 但在这个页面里,你可以自由地管理这些 skill。 装好了怎么用呢?点击右上角的 tryinchat, 系统就会帮你新开一个聊天窗口, 里面已经预设了一段生成视频的提示词,示意跟着它就能快速上手。接下来我们还要装我专门为 hyperframes 写的一个 skill, 它的作用就是在生成视频之前,帮你先把脚本和分镜梳理清楚。在 github 上面搜索 video spike builder, 找到这个开源项目。 往下滑到安装部分,你会看到两条命令,第一条是安装 hyperframes, 我 们刚才已经装过了,所以跳过。第二条是安装 video spike builder, 复制这条命令, 然后回到 codex, 把命令贴进去。稍等片刻,它就会从 github 上面把项目拉下来进行安装。装好了之后,可以看到它默认安装到了 project level, 也就是项目级, 只在当前这个项目下才能使用。如果你希望在任何项目里都能调用这个 skill, 那 就需要把它装到大局。操作其实很简单,你只需要跟 codex 说一句,帮我把它装到 user level 就 可以了。 hyperframes 和 video spec builder 都已经装好了,不过在开始生成视频之前,我想先让你看一下 video spec builder 里面到底写了些什么。在 cursor 里打开项目左侧,可以看到 video spec builder 这个 skill 的 所有文档已经从 github 上面拉下来了。 我们先打开 skill 的 md 看一下介绍。当用户想制作视频、宣传片、产品演示或者动画的时候,这个 skill 就 会自动启动。它一共有两种模式,第一种是零到一模式,第二种是迭代模式, 启动的时候, skill 会自动检查项目文件,家里有没有现成的 video spike 文档,如果没有或者是空的,那就走零到一模式,如果已经有了,那就进入到迭代模式,让你通过对话反复的打磨视频脚本, 再往下看文档结构,整个 skill 的 文件组织一目了然。其中最重要的是 reference 文件夹里面我准备了几份核心文档, 包括沟通风格、零到一工作流、迭代工作流、视频组建的使用方式、节奏设计指南,以及最关键的一份 question bank, 也就是问题库。我们打开问题库看一下, codex 在 使用这个 skill 时,就是按照前面讲的五个阶段来追问你,一步步逼你把需求想清楚, 每个阶段该问什么,追问的逻辑是什么,什么样的回答可以接受,什么样的回答必须打回去重答,全部都写在了 question bank 里, 可以说 question bank 就是 整个 skill 的 灵魂。看完了 skill 的 内部结构,接下来我们就要开始做视频了,不过在正式开始之前,还有一步准备工作一定要做。 前面我们讲到 hyperframes 里面有八个主题,那如果你想用自己的自定义主题该怎么办?所以这次实操我就带你走一遍。比如我提前整理了 spacex 和 grog 的 设计语言, 纯黑白的硬科技风格,然后提炼成了地址按点 md 设计文档和 tokens 点 css 这样的样式代码,把它们一起复制到了项目文件夹里。 hyposhop 检查自定义主题的逻辑是,如果项目文件夹里已经有了 design, 点 m d 就 会问你要不要使用这份自定义的设计风格。准备工作做好了,接下来我们开始第一条视频。 在聊天框里面输入 slash video spike builder。 使用这个 skill, codex 做的第一件事就是扫描项目目录,他发现里面没有现成的 video spike, 于是就进入到了零到一模式,从零开始引导我们。 他先抛出来两个问题,这条视频讲什么?投放在哪个平台?横屏还是竖屏?那我告诉他,我想做一条关于 spacex 发展历程的视频, 时长大约是一分钟左右,横屏格式 codex 收到了之后,并没有急着往下走,而是上网搜索了一圈 spacex 的 资料,然后又追问了两个问题。第一个是时长,他觉得一分钟,这个回答太模糊了,因为七十五秒、九十秒、一百一十秒的视频节奏是不同的, 所以希望我给一个精确的。第二个呢,是受众,这个片子到底是给谁看的?这决定了内容的深度。那我回答他,时长就一分半左右。受众是普通的知识区观众,核心内容讲的是 spacex 如何通过复用来改变航天行业的发射成本。 拿到这些信息后, codex 给出了初步的方案,九十秒大约可以插入十二到十六个镜头。时长有限,所以没有办法做完整的传记,只能走一条主线,从早期的失败,到 fokken 九的实现复用,再到成本逻辑的改变。他问我这条主线行不行, 另外他还问我有没有竹子稿。那在这一步,我把自己提前准备好的但时间错的配音文件都一起发给了他。 codex 收到字幕和配音之后,先检查了两者在时长的节奏是否对齐,然后仔细的过了一遍字幕内容,帮我做了事实核查,看看这里面有没有表达的错误,或者是事实偏差或者不准确的地方。 查完之后,他问了我一个关键的问题,音频已经准备好了,要不要根据核查的结果重新做一版,把发现的问题都改掉?因为我想快点看一下效果,所以就告诉他不用改了,直接用现成的音频就好了。 紧接着 codex 问了两个关键的画面问题,比如说发射回收筷子夹火箭之类的真实视频或者照片,画面路线是走真实的摄影为主,还是走动态的图形为主?那我告诉他,我目前还没有任何的素材需要他来帮我搜集。 视频的风格以真实的摄影摄像为主,版权先不用担心,因为我们只是测试,不会真的去发出去。现在 codex 开始工作,从竹子稿里面分析出素材的需求,整理成清单,然后去搜索。 搜索完成后,他把视频划分成段落,每个段落该配哪些画面素材都一一对应好呢?给我确认没问题的话,他就会把素材清单写进 video spike 里,然后继续追问。我看了一下没有什么要改的,所以就确认通过。 接下来 callix 问我要不要背景音乐和音效镜头节奏,他给了我一个镜头的节奏建议, 我没有太多的反馈,就让他先按照这个建议去往下执行。那字幕他也问了,是像纪录片那样的整句长注,还是整句加关键词高亮,那我选择的是字幕,需要整句长注。在字体和主题方面, codex 看到我已经有了一套黑白工业风的自定义主题, 不过他还是告诉我, hyperframes 内置的八个预设主题里, data shift 和 shadowcut 这两个也很适合这条片子,但我决定还是不换了,就用我自定义的就好了。最 后 codex 问了装饰和组建的想法,问要不要加时间码,任务编码或者是线框十字定位这些元素, 有没有参考的案例或者是反例?那我确实没有什么特别的参考和反例,就让他按照他自己的建议来设计。以上就是 codex 追问的所有的问题,问题答完之后,他就已经有足够的信息来帮我写视频的脚本了, 那这里我们稍等一下。好,写完了。现在点击右上角的 video spike, 打开它帮我们生成的视频脚本。 这份脚本里面包含了视频的整体基本盘,视频的目的、受众、画面规格、语气基调、修饰结构、表达的手段,还有素材清单,十九个分镜以及每个镜头的具体内容,还有音频的时间轴以及参考范例。最后还有一些留给 codex 自己决定的开放性问题, 所有这些都已经完整的写进这份脚本里了。你刚才看到的这个过程包括内容的主线、受众定位、画风风格、镜头节奏、字幕样式、 bgm 的 氛围、素材清单。所有这些决策在前期全部敲定了,等到 hyperframes 接手的时候,它只需要做执行就行。 如果我跳过了这一步,那直接跟 hyperframes 说,帮我剪一条 spacex 的 片子,相信我,它出来的东西根本就没法用。这就是我开头说的那句,工作量要在前期准备好的意思。 ok, 那 脚本已经准备好了,接下来就是交给 hyperframes 开始干活。在聊天框里输入 slash hyperframes, 让 codex 调用 hyperframes skill。 这个时候 codex 会接上 hyperframes 的 制作流程,根据我们刚才写好的 video spike 开始生成视频。 它会按照我们的设计规范处理字幕、旁白和音频,按照素材清单上网搜索画面素材,还会帮我们合成背景音乐和音效, 这些几乎都不用我们再干预了。因为所有的决策在前期编辑 video spike 的 时候已经全部做完了。 hyperframes 只是在这个环节负责搜集素材、剪辑画面以及最后渲染成视频。 渲染完成后,他还会自动做一轮审核,通过抽取关键帧的方式来检查画面的布局以及素材是否合适。整个过程大概需要四十多分钟,所以这里我先跳过好视频渲染完了,我们来看一下成片效果。二零二四年十月十三号, 一枚七十米高的火箭从太空飞回来,被发射塔上两条机械臂在半空中夹住了。全世界都疯了,但二十二年前造它的这家公司连火箭都飞不起来。二零零二年,马斯克拿卖 paypal 的 钱创办了 spacex, 就 一个目标,让火箭能重复使用。所有人都觉得它疯了。 火箭这东西从来都是用一次就扔了。二零零六年,第一枚炸了。二零零七年,第二枚又炸了。二零零八年,第三枚还是炸了,钱烧完了,特斯拉也在崩盘边缘, 马斯克把最后的钱全压上去。第四枚飞进了轨道。接下来, spacex 做了一件从没人做过的事,让火箭自己飞回来。二零一五年, falcon 九的一级助推器稳稳落回地面。 二零一七年,一枚用过的火箭再次升空,发射成功,火箭不再是一次性的了。今天 spacex 一 年发射超过一百三十次,比全世界其他所有国家加起来还多。一枚助推器最多已经负用超过三十次,发射成本从过去每公斤上万美元降到了两千多。 而开头那一幕,筷子加火箭,就是在这条路上。再往前走一步,火箭连着陆腿都不需要了,直接飞回发射塔,被空中接住翻新再飞。 从什么都炸到徒手接住火箭,再到每一枚都能反复再飞。这条路 spacex 走了二十二年。 刚刚播放的就是一次成片的效果,我没有做任何的干预和调整,从完成度上来说其实还可以,但是你仔细看,里面有不少可以优化的地方。 比如说片子中提到了三次发射失败的场景,其实每一次都可以用一张当时真实的照片来替换,也可以加入更多的视频素材,比如说火箭返回到着陆的画面,但是可能 codex 在 上网搜索的时候就没有找到,那这个时候就需要你来提供了。 而且说到我们自己提供素材,其实主题风格也是一样的。前面这条视频我用的是一套自定义的黑白硬科技风格,那这套主题我是怎么设计的呢?接下来我来带你看一下, 其实很简单,你可以在 cloud design 里面进行设计,输入屏幕上这段提示词,他就会帮你生成一套主题,然后你再跟他多聊几轮,不断的调整细节,基本上各种需求就已经能搞定了。比如我这条 spacex 视频,用的黑白硬科技风格就是这么设计出来的, 它包含了一整套的设计语言,视觉的底座、中英文字体、装饰元素, a 肉出镜使用到的各种贴纸卡片,还有 b 肉讲解概念或流程时候需要用的图标、思维导图以及数据格式化,这些都已经帮你设计好了。 设计完成之后怎么导出呢?有两种方式,第一种是点右上角的 share, 然后选择 download project as a zip 下载成压缩包。那第二种是可以直接点 handoff to cloud code, 这样就可以在 cloud code 里面进行二次的开发和调整 好。实操部分就到这里,最后我来跟你聊一聊我用下来的心得,还有几个实操上的建议。 hyperframes 目前还不是很成熟,所以你千万不要指望它一次就能出成品,除非你的视频本身就很简单,只有字幕和简单的动效,不然你大概率是要调整几轮的。 问题在于,每一轮的调整其实时间成本都非常的高,赶完之后必须重新渲染,一轮就需要半个小时到一个小时的渲染时间,那大概三次也就是三个小时,这个时间成本非常的大。 所以你在使用它之前,一定要先判断一下你这条视频到底适不适合用它来做。像概念的讲解,流程演示、数据图标这类的视频, hyperframes 完全够用。 如果你的视频依赖大量的真实素材,复杂的剪辑节奏,那目前它还搞不定。还有一个问题就是它的效果不太稳定,有点像开盲盒。 虽然看起来它什么都能剪,但是实际体验下来,我觉得它的效果是时好时坏的。如果你真的想把它用起来,比如说批量的去做视频,或者是做讲解类的科普视频, 我建议你要固定一套视觉风格,几个转场和字幕样式以及贴片的动效,做成一条固定的工作流程,不然每次他都从零开始发挥这样的效果,非常不稳定。 然后是关于素材脚本里列的素材清单,不管是图片、视频、音效,我都建议你自己去准备,不要指望扣代斯可以上,我帮你搜索。找回来的素材经常和你的画面对不上,而且现在基本都有反爬 a 阵呢,是没有法下载的, 再加上搜索的过程又慢又耗 tokens, 算下来非常不划算。那我们应该去哪里找素材呢?接下来是我经常使用的素材网站,图片和视频我会常用 pixabay, 最综合 ansplash 和 paxos 的 图片资源,更多一些 bgm 和音效我推荐你用 solno ai 来合成,那这些工具都是支持 api 接入的。如果你有工程能力的话,完全可以自己搭一条自动的流水线, 配音也是一样的。 hyperframes 虽然内置了一个声音合成模型,但是它的效果其实非常的差,声音很机械,在正式的作品里根本没法用。如果你想快速的看效果,那没有问题,但是如果你想把它变成正式能用的视频, 我建议你去使用 mini max 的 speech 二点八 hd 这个模型,或者干脆自己去录好,那我的素材库差不多也就是这些了。那最后呢?我把 ai 剪辑视频这件事情拆成四层来做个收尾。最底层是大模型,模型的能力是地基, 分镜拆的好不好,素材理解的对不对,动效配的准不准全看模型。所以我这里首选 opus 四点七或者是 gpt 五点五。 第二层是脚手架 hyperframes remote, 或者你自己写的任何视频剪辑的 skill 都是脚手架,脚手架决定了你能实现什么样的效果。第三层是脚本书里怎么拆分镜,每个分镜的内容,文案转场以及整体的节奏的设计。 第四层是素材整理,你准备的素材的质量直接决定了最终画面的质量,这四层合在一起,共同决定了 ai 剪辑视频的最终效果。 以上就是本期的全部内容,如果你觉得对你有所帮助,别忘了点赞以及加入废材俱乐部,我们可以一起探索更多实操的玩法,那我们下期见了。

挑战,每天讲透一个 ai 知识点,今天是 codex scale 搭建, 首先啊,使用方式的话非常简单啊,就是大家首先在我们的当前项目文件夹下面建一个什么呢? 建一个叫做 codex 的 一个目录啊,就是官方的一个规范啊,这个不是我自己定的规范,这个是官方的一个规范,就是我们要首先创建一个点 codex 的 一个文件夹啊,这个很多大模型厂商都是这么来定规范的啊,比如说 cloud, 就是 它会建一个点 cloud 的 这么一个目录 啊。 cloud, cloudbody 的 话就是建点 cloudbody 是 吧?就是每每个场上的规范它都是这么来的啊。 tree 的 话就是 tree 点 tree 啊, 好,然后在 context 下面有一个 scales 的 一个文件夹啊,再建一个 scales 的 一个文件夹,在这个 scales 文件夹下面建一个什么呢?就是一个 scales 的 一个文件的目录啊,文件就是你的 scale 叫什么名字,你就建这个一个目录啊,比如说我们这个叫 meeting 的 一个 scale, 这个就是我的一个什么呢? skills 整个的一个名称啊,大家在这个里面可以建各种 skill 啊,比如说我们可以建那个什么呢?你想建什么就什么,比如说叫 image skill, 图像的 skill 啊,或者我们想建一个自媒体自动化剪辑的视频的 skill, 是 吧? video skill 啊,直接大家根据自己的需求去建就可以了啊,那我这里的话就举的是一个会议记要的这么一个 skill 啊,好在这个 skills 下面的话有几个目录跟文件啊,那其实这个最核心的话就是这个 skill 点 md, 这个 skill 点 md 是 干嘛的呢?打开给大家看一下, 呃,这个 skill 在 这个里面,大家看这个 skill 里面会声明什么呢?就是一个是我们 skills 它的一个名称啊,就是这个它是用来干嘛的?然后是描述, 这个是用来做会基,要智能生成和文档自动同步的啊,这个就基本的一个情况。然后下面就是它这个 skill 具体要干的一个事情,比如说它作为一个会议总结助手, 首先他要做一个总结规则的一个技能,是吧?他要要干这个事情,然后他要按照以下维度对会议内容进行一个提炼,比如说参会人员一提就是你给他丢了一堆会议的一个对话啊,比如说,比如说我们输入这么一段内容啊,什么 经理啊、主管啊,都在开会,每个人开会的话都要说一句话吧,是吧?每个人都有自己的一个想法,那么这个就是会议的一个输入, 那我现在把把这个会议的输入丢给这个 scale, 那 这个 scale 帮我们去干嘛呢?哎,把这些个内容给提炼出来,比如说参会人员有哪些议题是什么?决定是什么?当涉及到资金,还有一些成本采购的一些关键的财务相关的关键词的时候, 自动地去触发一个什么呢?叫做参考啊,参考的话就是我们这个里面要讲到的这个 reference, 这个参考就相当于 skill 里面的一个知识库啊,这,这是一个知识库,这个知识库是用来干嘛的呢?就相当于大家是这个公司的财务经理,是吧?或者说是你假设是一个财务的新人, 你进公司第一件事情是不是先要学习一下公司的财务报销制度啊?这些个规范你得学习一下吧?你不能是吧?一天刚上手的话,你就去做一。

上期我们讲了,我用 codex 这个 ai 工具啊,通过两分钟不到就帮我生成了这样一个网页端的一个简易进销存管理系统,我试用了一下是可行的啊,目前我有一个需求,因为心情它帮我生成的这个, 这个数据保存,它是保存在网页端的,它是没有保存在数据库里的,所以我又跟 ai 对 话,帮我生成 一个本地短的 ai, 就 马上帮我改了一个方案,他说把我数据保存在 clikeline, clikeline 他 说是可以,只要 python 加 clikeline 就 可以把我的数据保存起来,我也根据他的提示,我也安装了 python 拍摄,安装好以后,他说这样就直接可以运行了,他帮我已经生成好了,他给我一个命令符,我直接打开。好,这样打开以后我就直接可以执行了啊,执行以后,比如我现在数据,现在这里呢?有单勤数据,有 有两个商品,我,比如我现在再添加一个商品,比如我再入库一个,呃,那叫什么?好了,百事可乐,好了, 好了,好,随便录一下。好,四块钱啊,好,新增商品啊,好,然后我再入库,然后呢?比如出库。好,它这样就会帮我所有的数据都记录起来,然后这些数据呢,都会保存在我的这个 sql link 数据,而不是保存这个网页端。 我根据它的提示,它说可以把我的数据库都保存在这个文件,其实是个数据库,文件是 second link, 根据它的提示 weather 这个 circulate 这个查看器。好,这样我就可以直接可以打开我这个数据库,可以进行查看。好,你看我现在数据库,比如我现在有产品,我在本地我都可以浏览,这样就非常方便。我们管理数据库也有了,本地的数据库查询也有像这样一个系统, 还算是比较简陋,但是他直接可以在我的本地端就直接可以运行了,开发速度非常快,效果也特别好, 我后期再进一步优化,这样就可以做出一个能用的一个进销存管理系统了。好了,谢谢大家。

比起 opencloudex 可能才更适合普通人使用,能操作电脑做文档、表格、 ppt, 还能生成图片,执行自动化任务,逐渐从编程 agent 走向桌面 ai 助手。那今天这个视频我就给大家带来 codex 保姆级教程。先到 codex 的 下载页点击下载 macos, 下载好后打开安装包, 直接把文件拖进去就可以了。打开 codex, 它的界面很像网页版的 ai 聊天界面,主要可以分为三块,右边这里就是和 ai 对 话的地方。左上角的四个功能,第一个就是开启一个新的 ai 对 话搜索,可以通过标题来找到之前的对话内容, 剩下的插件和自动化功能我会在后面详细讲解。左下角这里是两种和 ai 写作的方式,一种是项目方式,一种是对话方式。 项目方式更适合去做一些长期积累的任务,比如沉淀知识库、做工作流、写代码。有两种方式使用项目,一个是创建新项目,默认会在文稿目录下创建一个项目文件夹,也可以使用你现有的文件夹作为项目, 所有后续的 a 阵子操作都会默认在项目文件夹下进行。第二种对话方式,就像我们平常使用网页版 ai, 可以 临时去做一些任务,比如偶尔查一查信息什么的, 那我们这里就可以新建一个项目,我们也可以在三个点这里给项目改名,在聊天框左下角就可以看到他已经进入了刚才新建的项目文件夹。下聊天框这里的加号, 我们就可以上传图片或者文件给 ai 这里我们还可以开启计划模式,这个模式是不让 ai 直接改动文件,而是先生成一份计划,我们看完没有问题以后才会执行。 权限,这里 codex 有 三种权限,第一种默认权限,就是只能访问项目文件夹下的文件,如果涉及到其他文件或者网络访问,就会弹出审核框让我们去批准。第二种是自动审查,就是 codex 会自动放行低风险操作,高风险操作才会需要人工审核。 最后一种就是给 codex 所有的电脑权限,很方便使用。右边这里我们可以选择模型的推理强度,复杂人物可以选择更高的推理强度。 模型这里我们可以切换多个叉 t b t 模型最后的速度就是可以加快模型的输出速度,不过会消耗更多的 token。 这里直接让 ai 写一个单 html 的 个人播客网站,但我们可能有新的想法,想要加进去就可以直接进行引导, 比如我这里补充整体色彩风格要用孟菲斯风格,还可以继续补充,要用一个板块式,个人作品展示用滑动式般的呈现。我们直接点击这里的引导, codex 就 会在下次执行工具调用后 插入我们新的要求,很适合补充提示词或者纠正方向,不用中断对话,让他帮我们再写一个手工艺的电商网站。使用 react, 那可以看到两个任务就并行执行了,属于转圈的状态, codex 当前步骤完成后就会显示为一个小蓝点。 看完基本使用,我们来看一看一些好用的特性。先来看一下插件功能,插件就是用来帮助 codex 操作各种工具的, 比如 computer use 和 browser use 就是 让 codex 操作你的电脑和它的内置浏览器,下面这两个就可以操作表格和 ppt, 那 往下翻我们还可以看到操作邮箱 canvas 设计软件的,我们点开一个就可以看到。这个插件其实由外部服务调用和技能组成, 那有的插件本身也是一个技能,后面也会给大家演示怎么使用插件。技能这里大家应该就不陌生了,技能就是工作流程的一个分装,如果有不懂的朋友可以看一下我之前讲 agent skill 的 视频, 如果你是以现有文件夹的方式创建项目的,也会把里面的技能同步过来。接下来我们就来看一下 computer use 这个插件, 它是利用 macos 的 屏幕录制和无障碍辅助数,让 codex 既能看到画面,又能精准点击。 这里我让他打开扫雷通关简单模式,这个半透明小光标就是 codex 操作所使用的,不会占用你的鼠标。一开始他尝试标记地雷的时候,发现标记失败了,很有意思的是,他换了一种玩法, 直接打开安全格,然后就是一路门店,推理出所有可能的安全位,直接通关。我就在想,如果以后模型的推理速度和输出速度再快一点,那我们干游戏就只需要用 ai 就 可以了。 下面我们看一下办公三件套和作图插件,这里我让他调研一下英伟达显卡的发布和价格信息,并让他制作成 word 文档, 然后配图。这里他很快先把配图制作出来了,整个过程一共用了十六分钟,第一次用的时候他会自动安装相关运行环境,制作完成后,他还会截图进行复查,发现可以打磨的地方还会进行二次修改。我们打开文档来看一下 发布信息和价格表都出来了,而且还贴心的配了图,最后还有产品线解读和购买建议。然后我让他在这个基础上把价格表整理成 excel, 同样的他在处理过程也会不断修正错误,花了五分钟时间做好。 来看一下表格,所有信息都正确写进来了,唯一有个瑕疵是溢价,这一栏应该是百分比,它这里用的是小数,不过这些都可以通过细化提示词去解决。下面继续让它根据文档做 ppt 分 格,参考苹果信息层级不超过三层。 他做完第一版以后,又对我的信息层级这个要求进行复查。我们来看一下 ppt 整体布局还是很舒服的,满足了我对信息层级的要求,没有堆满字,而且风格也是沿用了英伟达的配色。最后我们来说一下自动化功能, 它就相当于一个定时任务。右上角这里我们可以新建任务模板里有一些关于代码的任务模板。下面这里你可以选择在哪个项目文件夹下进行, 并且设定定时时间,有每小时、每天、每个工作日或者每周。也可以自定义规则,我们可以直接粘贴这个规则,让 ai 帮我们改成任意时间,比如这里就让它改成每周二和每周四的十三点执行。那 那我们在这里也可以让它执行已有的工作流程,比如这里,我之前是用 cloud code 做的,在 cloud 点 md 里已经写好了完整的自动拉取推文的流程,那直接让 codex 执行就可以了,很顺利地帮我完成了定时任务。那以上就是全部教程了,如果对你有帮助的话,记得一键三连。

我给 callix 发了一条命令啊,生成我这篇文章需要的全部图片。不到十分钟,这个文件夹里就已经装满了深深好的图片了。如果说你也需要给文章配图的话,那今天的内容就赶紧的要放进你的收藏夹了。 你写公众号发小红书吗?插图你是怎么做的呢?打开某个生图平台的网页,发送这样的一条提示词,等上几十秒,他吐出来四张照片。小姐姐,挺好看的哈,不过四张图根本他不是一个人本。 那你想的是早上画面呢?明显就是傍晚。今天呢,我们就从零开始,全程都用 callix, 你 用别的大模型也可以哈,配合 obsidian 这个笔记软件,让你的文章配图变成一个固定的工作流。以前两个小时的工作量,以后呢,就是一句话的事,准备好了没?那咱们就直接发车。 今天的工作流呢,主要用到两个工具, callix 和 obsidian。 不要划走啊,不需要懂编程,全程都是说人话,真的是 有手就行。总的逻辑呢是,在 obsidian 里面,你已经写好了一篇 markdown 格式的文章,这个格式呢,是目前公认的 与大模型沟通最好的。我们要做的呢,就是让 codex 来帮你读取文章的内容,分析配合文章需要哪些场景,再让它自己来生成提示词,自己生图,一条龙服务。等你用顺了这套工作流之后呢,麻麻再也不用担心你的出图了。实现这一套流程呢,拢共就是四步,阅读、理解、场景、设计其 词、出图。那咱们就从第一步开始配图。最烦的事呢,就是大模型出图啊,老是抽卡,你要的是早上,出来的是下午,你讲的是夏天,出来的是冬装。花了大力气去改提示词啊,这一轮 ok 了,那下一篇呢,又得重新搞这个呢,是因为你没有积累 图片呢,是要服务于内容的哈,所以说,第一步呢,要从文章开始。这篇文章是讲啥的呀?我们的林芝夏小姐姐五一去了成都见老朋友,这是他的一篇心情日记,自然呢,会有很多的自拍照,美食照,风景照。所以说呢,第一件事是要让大模型 读懂这篇文章。我的提示词是这么写的,注意看哈,提示词里的第一行呢,是把这篇邮寄按给 context, 先体会下文章的内容,人物的关系,时间线和情绪节奏,然后帮我来判断哈,这篇文章如果要配插图的话,需要哪些画面,每张图大概放在什么位置, 要解决什么问题?有没有人物一致性的要求?在同一个文件夹里面新建一份配图项目总控笔记,把你的判断整理进去,并作为我们接下来沟通的参考哈,他仔细的阅读理解了这篇文章,他发现呢,这篇文章是 篇生活化篇心情记录的邮寄。他给我的第一轮判断呢,就是说这篇文章要体现整个旅途的过程,比如说呢,出发前的行李箱,机场,成都接机,景点,餐厅,酒店等等这么一些画面。同时呢,他还提醒我哈, 这种游记里面的人物会多次的出现,所以说人物一致性的问题要考虑到。而且他认为啊,我说的建一份项目总控笔记是很有必要的,这份笔记呢,会作为整套配图工作的说明书,当然哈, 你自己甚至啊都不需要读,这本来也是给大模型看的。这个呢,就是我喜欢用 codex 配合 obsidian 的 原因了哈,它不是只在对话框里给你一段回答, 他会真的进入你的笔记库,把这些判断写成一份可以持续迭代的文件。当然呢,第一轮哈,往往不会特别的满意。那我会继续的追问他了, 你刚才的这些场景是不是有点像旅行相册了呀?公众号里面真的需要这么多的图吗?他会重新的收敛一遍,把那些指示好看但不服务于正文的画面给删掉。而且呢,还让他加上了一些画面中不要出现的东西, 比如说不要冬装,不要过度精修,不要把串串化成了高档火锅等等吧。这几轮来回之后啊,项目总共笔记才算是能用了。 这个过程呢,重点不是哪一句提示词最重要,重点呢,是要让你让大模型先读懂文章,再让他给你一个判断,然后呢,继续追问,收敛不约束,这个呢,才像是真的在干活。大模型读懂了你的文章,我们的总控笔记就写好了,现在就到了第二步了。场景设计 这里要包括两块了,一个是人物,一个是场景。人物当然很重要哈,你成都你就玩一天,逛街的时候你不可能换几套衣服几套发型吧,场景呢,也是一样的哈,必须得符合实际的情况。 五一是夏天吗?你就不能穿着羽绒服吧,吃的是串串,你画面就不能搞成了川菜?而我们先说人物,如果是一个正规的作品啊,人物会非常的讲究,需要在开始之前呢,就要确认全部的人设,包括年龄、发型、穿搭、脸部气质、拍摄风格、常见表情,不要出现的画面 等等等等。比如说,我就不希望主角变成网红锥子脸或者是广告模特的样子,他应该就像你身边的一个真实的人。照片呢,像是手机随手拍出来的。 我就这么跟 callix 讲了哈。读取这篇邮寄和项目总共这两份笔记。这个时候你先不要写具体的场景题词,新建一份人物一致性备忘录,用来约束后续所有的人物出镜图片。这份备忘录要包括 主角灵芝下的人物特征、穿搭、发型、拍摄风格、禁止出现的风格,以及配角阿乔的基础特征。请特别注意,这个不是人物小传,不要给我搞什么文学化的描述, 我要的是直接可以给深图模型使用的视觉信息。最后呢,请给出主角和配角的标准照,三式图,深沉建议,方便后面做图深图的参考。很快啊, codex 生成了这一篇备忘录。这份笔记啊,清楚的写到了主角大概二十八岁,黑色中长发, 米白色轻薄外套,浅蓝牛仔裤,真实手机摄影,自然光,生活化构图,不要澎湃,不要商业广告感。更重要的是啊,他会写清楚后面凡是林芝下本人出镜的图片,都要参考这张标准图。由于文章里还有一位配角阿乔哈, codex 还很贴心的把 阿乔的特征也写到了这一份备忘录里。注意哈,不要让大模型写什么美女啊,氛围感呐,高级感啊,这样的一些词,听起来高大上,但是对生图模型来说呀,非常容易跑偏, 他可能就会把人物往什么影楼大片的方向去带。显然呢,不符合邻家小姐姐的人设了。咱们要的是能执行的信息,能量化的信息才是稳定性的来源。 人设定了,咱们就要考虑场景了,与人物设计类似哈,还是跟 context 先沟通,确认这篇文章需要多少个关键画面,每个画面放在哪里?每个画面服务正文的哪一个段落 的提示词是这么写的,请继续的读这么一篇邮寄和总控笔记和人物一致性备忘录。现在需要你帮我新建一份配图场景清单,不要写生图提示词。这一步呢,咱们只做场景设计,每个场景要包含编号、对应正文的位置、 图片的用途,是否有人物出镜、生成方式,必须出现的元素,禁止出现的元素,建议的文件名等等等等。请控制图片数量,不要每一段都给我配图公众号,它不是相册啊。图片是要服务于阅读节奏的,很快啊。 copy 生成了一份配图场景清单 笔记清单会很细,像图的编号,正文的位置、画面用途、生成方式,必须出现什么建议文件名等等。 比如说机场图要体现出发和疲惫。茶馆图呢,要体现成都的小巷和下午的自然。光吃串串的时候呢,就要像玉林路边的小店,你不能搞成什么高级餐厅了,我们来简单的盘点一下哈。到这呢,除了刚才林志祥的邮寄之外啊, 我们一共有了三份笔记了,分别用来让大模型知道文章讲什么,主角长什么样,每张图应该怎么服务于正文?你看哈,我说不难吧,全程呢,没有一点需要,你在 obsidian 里面写东西的时候更没有什么编程,都是自然语言,跟 context 讲就行了。对了哈,如果你不喜欢打字的话呢, 试试 typeface, 谁用谁知道。 ok, 到这呢,咱们才可以开始准备正式的写题词了。 虽然还没有开始写提示词啊,但是我们出图的工作已经完成了一大部分了,上面的所有一切是写好提示词的。提示词 如果一开始就用大模型来写二十条提示词哈,他会写的很热闹,但是大概率啊,伸出来图片你都用不了,因为他并没有想清楚一样的办法。我在 callix 的 对括号里头按他的那几份刚才的笔记,我让他根据要求准备开始生成正式的提示词。我是这么说的, 请读取配图项目总控、人物一致性备忘录和场景清单。现在呢,你 需要新建一份提示词物料包。注意哈,这份笔记不是直接拿去批量出图的正式版,它是一个准备稿结构呢,分成三个部分。第一个部分是写全区,要求包括画面风格、照片质感、比例、色彩真实、手机摄影不要澎湃不, 不要商业广告感,不要过度磨皮,不要让人物换衣服。第二个部分呢,写人物的原型提示词主角长什么样,生成一个标准照和三式图。这一步呢,只做人,不做场景, 因为后面所有的人物出境图都要参考这些原型。第三部分呢,是每个具体场景的提示词,每个场景必须保留编号正文的提示词和输出文件名等等。如果是图生图的话呢, 而且场景变化和动作就不需要在每一条里面反复的长篇描述人物是谁了,人物信息呢,是会放在局要求里,通过标准照路径来引用。你看哈,这些提示词咱们讲的非常的详细啊,你不把任务拆清楚, 大模型就会把所有东西混在一起,越写上下文越乱。所以说呢,提示词物料包必须要包括两层,上层呢是大局要求管统一风格的,下层呢是具体的要求人物原型,管一致性,具体场景呢,管每一张图该干什么, 两层三个东西不要搅到了一起来。我们先看人物原型图哈,如果有问题呢,你就持续让他改 定下来之后啊,咱们就应该先生成主角和配角的人物原型图了,这些是一会正式的图生图的参考物料,很简单哈,你让 codex 按照人物原型的要求 生成两个人物的三式图,就这么一句话。这个呢,就是林芝夏和阿乔的原型图了,人物的发型、衣服、年龄感基本上比较稳定,这个角度来看呢, 认得出是同一个人。等到主角配角的原型图都定稿之后啊,咱们提示词的部分就可以进入最后一步了,我要让 codex 生成一份提示词正视版。这一份正视版呢,要非常的干净,不要保留前面那些讨论的过程, 只保留全剧要求和每一个场景的具体提示词。说白了哈,这份东西呢,才是最终给 image 二点零看的,他就会直接照着他出图了,他读到的是执行文件, 是一份聊天记录。恭喜哈,提示词咱们终于写完了,有没有发现大模型有时候是很笨的哈,他不是一句话就能拿到结果,没有关系啊,他又不会累,又不会生气,达不到要求的时候呢,咱们就跟他多拉扯几轮,总会得到你想要的结果。 到这哈,我们已经完成了百分之九十五以上的工作了。 codex 现在本来就可以直接驱动 emoji 二点零这个最近特别火的 open 的 香蕉刚出道的时候啊, 还要火爆。只要你的提示词写的足够的好,出图就不用操心了。这条视频呢,是我们专门对他做过的一个测评,有兴趣的小伙伴呢可以去看一看哈。 磨刀不误砍柴工,平时出图不满意啊,就是没有花什么心思磨刀。好了,我把提示词的正式版笔记艾特给了高黛斯,来帮我按照这条笔记中的提示词,用你的 emg 二点零大模型生成全部场景的图片。就是这么简单,你的大局要求里面有整体风格的要求, 有人物原型图的存放路径,不管是图身图还是纹身图,每一个画面都有非常详细的要求,这样的话,大模型就不会出错了。图片不少,可以伸个懒腰,咱休息一下哈。不一会呢,你在聊天记录里面和出图的文件夹里头就可以看到这些深沉的图片了,有没有成就感啊? 检查一下哈,大部分的图片都是可用的,偶尔呢可能出现几张不太满意的。没关系啊,咱笔记里不是有编号吗?还是很简单,你就这么说哈, a 零三, a 零九 b 幺五,咱不满意重 新生成。这个时候呢,不用你重新描述一遍那张插管图,还是那张机场图,直接讲编号就完事了。 gmail 会回到那份提示词笔记,按照原来的要求重新来跑对应的图片。这个就是为什么前面要把任务拆清楚,你前面拆的越清楚,后面的反攻呢,就会越轻松。 感谢你能看到这里啊,真的很简单哈,只要你的逻辑清晰一点,完全可以自己来搭这套系统。只要把文章准备好,他就可以帮你拆场景,写题词, 生成图片,按编号返工。公众号配图啊,小红书图文呢,产品体验文章啊,都用得上。或者是做 ppt 封面,课程配图,视频分镜等等啊,都可以。当你能够把你的全部的任务拆解清楚,用一种管件式的方式来跟大模型来写作。把你的判断放进笔记, 大模型就能沿着你的判断来干活。它不再是临时给你一个结果了,而是参与了一整条的生产线。当然哈,可以把这些流程整理成可以附用的 skill, 不知道你有没有兴趣哈。好了,希望今天内容呢,能够真正的帮到你。这期里面所有的提示词文档,我都会打包好,评论区自取。

这是一篇人类研究员正常需要花费两到三个工作日才能完成的深度圈商研究报告。这篇报告是我让 codex 模仿前面那篇报告的图文排版结构以及表述方式而一道一复刻的一份关于英伟达的深度研究报告。这整篇报告里面当中的文字、图片、图文排版以及数据完全都是 codex 自主运行并且自主生成排版,并且经过检查产出的一份可交付的产物。那如果单从任务的可交付性来说, codex 的 生成速度以及效率相较于人类研究员来说提升了起码十几倍。 那么你会不会好奇这样一篇报告到底是如何让 codex 帮忙协助进行生成的呢?研究员正常生成一份报告通常需要五个步骤,先确定好整篇报告的内容框架,然后去公开信息,找关于公司或者行业的一些年报以及公开的数据, 然后再把这些数据整合成相关的图标,并且生成文本,然后再进行内容的校印和排版,最后把这篇报告给发出来。 但如果我把整体的流程交给 codex, 那 流程就会变得非常简单了,我只需要把过往的研究报告给到 codex, 让他模仿这篇报告的结构,排版、图文,然后以及表头的展示和信息的展示,然后以此生成一份关于英文版的生物研究报告,并且告诉他需要调用 documents 进行文档内部的图片生成, 同时还需要调用一下它内部的一些浏览器工具,进行公开的关于公司信息以及其他财经信息的一些搜集,它就会自动的从公司的官网、年报以及财经官网当中去搜集关于这家公司的一些信息,并且自动整合到 这个研究报告当中去。然后只需要点击发送, codex 就 会自动帮我进行整个文本的生成。当我把这样的一个输入发给 codex 之后,我们可以看一下它到底现在哪些步骤。那第一步可以看到它是先读取了参考文档 word 结构当中的一些段落图片章节,他发现这边报告采用的是典型的非常简报的一个结构 啊。这边报告前面是一些投资要点,中间是目录和论文,论文里面有关于公司行业竞争格局和盈利预测以及风险提示方面的介方面的一些介绍。第二步可以看到他意识到自己需要从英伟达的官网当中获取到关于这家公司的数据, 所以看到他右侧就忽然展开了一个跳转到英伟达官网的这样一个界面,我们可以直接看到这样这是一个浏览器的界面,整个过程都非常的丝滑,既让我们能够看到 excel 他 自己在做什么,他也直接能从这个页面当中获取到一些他自己想要的信息, 这整个流程真的是体验非常棒。 portax 可以 自己从右侧的这个浏览网页中获取信息,我们也可以自己实时的从右侧的浏览器网页当中获取一些内容。第三步我们看到 ai 开始生成了研报当中的一些视觉内容,那我其实觉得研报当中的视觉内容特别适合用 ai 来进行完成,因为 ai 本身就非常擅长做图, 同时研报当中的图片其实既讲究美观,也需要讲究精确,最好那所有带数字的图片,其实 ai 是 非常擅长进行直接代码生成的, 可以非常有效的去降低我们人工成本的投入。我们看到 codex 开始进行整个文档内容的生成,包括他意识到他需要生成标题、投资要点目录里面的一些小节图片和一些表格。同时他也意识到了需要模仿原先的文档做一些来源的注示后,还会有一个风险提示的部分,都需要把它放到一个可编辑的耳温, 都需要把它放到一个可编辑的文档当中过去。然后看到这一步还是挺震惊的,因为他自己意识到他需要进行一些结构的校验,包括知道当前的报告有多少个段落,多少个表格,也知道需要进行逐页的一个检查, 说明他其实对于整个任务是有一个自主调研的步骤的,那这对于研究工作来说就是比较要求严谨的,这些研究工作来说其实是非常重要的。 最后我等了差不多二十分钟的时间,看到 ai 把这一整篇报告真的是在右侧从零到一进行生成了,那我点击它提供给我这样一个链接,右侧完全展开了一个 word 文档, 因为我看到这个整个 word 文档当中存在着一些图片,我觉得不是特别美观的,那我需要让它进行进一步的优化,那我就在这个输入框里面又输入了需要把那其中两张图片进行重新生成,并且插入到这个文档当中过去, 那就等了一两分钟,我发现他非常好的执行了我这个任务,把两张我觉得比较符合我审美的图片又放到这篇文档当中去,那我觉得这是一个已经非常好,具有可强阅读性,并且可以交付的一个研究报告的一个产物了。 其实整个流程体验下来还是非常丝滑的,那在这个任务的最后,我觉得这样一整个流程它是可敷用的。那等之后我想研究其他的公司,除了因为打之外的其他的一些上下产业链的一些公司,那我也可以用同样的一个工作链路进行跑通。所以我最后让 ai 把这样一整个链路打包成一个 scale, 就这个动作相当于把一个比较复杂的工作流沉淀为一套后续我也可以赋用的能力。那我以后只需要告诉 ai 去换一家公司,并且参考这样一篇报告的形式,那一整套流程还能跑得通,还可以继续这样一个流程,花大概二十分钟的时间帮我生成一篇更加完整的报告。 所以通过这样的一次实践,我是觉得 ai 不 仅能帮你完成一个写报告的任务,它更能帮你把一些比较复杂的篇知识导向型的工作流进行一个流程化、工具化,后续沉淀出一套属于你自己的可赋用的方法。 所以我觉得可能未来真是有价值的,不光是 ai 的 应用,而是能不能通过像 codex 这类的工具,把自己的一些工作方法沉淀出一条比较稳定,既能够稳定生产内容的这样的一个 ai 生产线。真的非常建议大家都去用 codex 完成自己工作的一个可复用性。

这是我刚用 codex 做出来的 ppt, 提示词只有一句简短的话, ppt 中的每一个字都可以被你编辑。这同样是我刚用 codex 做出来的 ppt 目录,下面只放了 attentions all you need 的 论文 pdf, 加上我告诉他我是大学老师,帮我做一堂课间, 中间的每一个字一样也可以被你编辑。前两天发了一个图文,讲了讲我用 codex 做 ppt 的 大致的一个思路,背景是用以妹纸先生成好图片,然后加 html 和 canvas 的 相关的代码叠在上面写文字。这篇图文引起了大家非常强烈的一个兴趣,于是我就编排了这个思路。 今天的两份 ppt 就是 这个 skill 对 应的一个成果,我们通过录屏带你们来完整的再走一遍对应的这个 skill, 这个 skill 完全免费,各无非资的美术馆的介绍,大家可以看到我的提示词非常简短,基本指定的 skill 启动之后,它就开始完成后续的整体的一个工作了。 因为这个 skill 我 相对编的还是比较厚的,中间有非常多的环节,包括 ppt 的 策划,还有就是调度与 make 的 prompt 的 生成。因为也要考虑到,如果你不是用 kolex, 是 用别的没有升图能力的智能体的情况下,这份 prompt 可以 放到豆包里面,让它来帮你生成对应的一个地图作为背景,然后你再给回你的主智能体, 下面呢,就是他一步一步把整个活干完。可以看到这么简短的一个一句话,加上这个 skill, 就 能做出这一份完整的乌斯菲兹美术馆介绍的这样的一个 ppt, 而且你也能看到柯黛斯中间的思维过程,它是顺着乌菲兹最经典的观看逻辑去设计整个 ppt 的 一个延展,这也就是现在智能体的强大之处。 第二个 ppt 的 演示呢?虽然 ppt 最终的审美可能还差一点,但是我觉得它更贴合大部分人使用的一个场景,尤其是像老师这样的一个职业。 呃,我们面对一个复杂的论文,想要去设计它整个的一个框架的情况下,你可以让智能体帮你完成大部分的结构性的一个动作。现在往后再接一步,就是这个 ppt 的 对应的一个生成。 这里呢,我其实还内嵌了一些巧思,我可以支持你把你们学校,比如啊,讲个讲个例子,比如你自己之前的学校,它有一定的 ppt 的 风格的情况下,可以把之前的 ppt 作为素材,这个 skill 也会去阅读你之前所有的传入的这个 ppt 的 素材的风格,去做对应的一个设计。 当然因为演示我不太方便去找一些现成的那个样式,可能会涉及到侵权,所以今天这个剧还是用了这样的一句话的提示词,我是一名大学老师,想给我的学生讲解传送门架构目录,下面是原文论文,请你帮我完成 ppt, 然后做的对应的这个演示。 两份 ppt 就 这样大概花了二十多分钟生成,然后消耗的 token, 我是 一百刀的 pro 会员,大概消耗了我的周限额百分之二左右,如果换算成 plus 的 话,可能就是周限额的百分之二十就能做两份 ppt。 整体的 token 消耗其实还可以。升图的话,因为用的是 codex 自己内置的 emoji, 如果你们遇到了非 context 的 使用的智能题,我还可以。我这个 skill 是 支持把对应的提示词输出出来,然后可以用豆包这样去完成对应的一个生图。今天的分享就这么多。