哈喽啊,我是老王,今天给大家展示一下我如何用扣袋子做了一份完整的市场调研分析报告,从数据里去反推产品机会。大家都知道,我们卖家在选品的时候,最大的问题不是没有 数据,而是看完了一堆评论和竞品,最后还是不知道这个品可不可以做,能不能去做。今天我用 codex 只输入了一个 asian, 他 就直接给我跑出了一份全面的选品决策分析报告。这个结论可不是我拍脑袋想的, 他最核心的设计是不忙干,那启动前扣贷会先跟我确认业务三件套,这次调研到底解决什么决策?他的数据是跑 amazon 还是 reddit 还是 youtube? 最后我是要 stm 文件还是放进备注文档? 哎,这一步就叫做对齐目标。他给我的每一步的确认,其实都是为了保证最后的输出 能直接用在我们的业务上。整个流程我拆成五步,输入 asion 或者是品类词,然后确认我要调研的目标,以及抓真实的数据,做 voc 的 句类和价格,带切分,最后输出 go no go。 建议来,咱来看个耳机的深度案例啊。 他这也不是简单给我做了一个总结的评论,而是把上万条的评论做了语义的巨类,挖出了感官过载 h d h g 人群和测税通勤两个吸分场景。 关键的是它还会做需求分层,哪些是 masterup, 哪些只是 nice top。 它最后直接给出了一个建议,哪些的方向我们是可以的 ok 的, 哪一些只能是 watch 一下,哪些是低价卷王? no, 我 们不要去碰。我再给大家换一个衣柜品类去做快扫, 效率同样惊人,它第一件事情是做了市场证明,它这里给我指出了 pro tab 这个词太泛了,真正的高转化词是 pro tab close it。 这里的痛点洞察更是一针见血。这里显示啊,用户怕的不是容量不够,而是怕这些结构坍塌导致的信任崩盘。所以差异化的定位他直接给到了,我们要主打 这个防坍塌衣柜来强化金属连接件和加厚罩布的显示,你看到了没有?这些句句都打在了竞品差评的死穴上。 整个来说,从数据清洗、 o u c 的 挖掘价格在七分到最终的逆向决策,它整个 codex, 它是把一周的整个的流程压缩到了十多分钟,大家可以赶紧去试试啊,一箭三连,我也把我跑的分析的 skill 发给大家,我是老王,和大家一起进入,一起爆单。
粉丝118获赞861

codex 在 a p i t 模式下功能受限,插件用不了,绘画删不掉。开源社区提出外部增强方案,不修改 codex 原文件,通过 c d p 注入增强脚本。 codex 本质纯净,更新不受影响, 中反模式保持官方登录插件可用模型请求重定向倒置定义 api 端点增强功能,插件入口解锁,绘画删除,导出移动用户脚本自定义,非侵入式设计,无需等待官方更新即可扩展能力。 外部注入增强是开源社区常用模式,提升工具灵活性。欢迎在评论区聊聊你使用 codex 时遇到过哪些限制,感谢观看,下期再见!

好,这节我们一起来看一下 codex 怎样接入 deepstack。 因为有时候我们的默认的模型其实并不够用,所以我们会去接入外部的模型,像 deepstack 这样的模型,那我们来讲一下整体的流程,那首先最后实现的效果就是这样子的,我们可以通过在 codex 里面去调用 deepstack 的 模型。 好,那我们来看一下整体的步操作步骤。首先我会给大家推荐啊,就是我这里呢啊编辑了一个启动的脚本,那这个脚本的作用就是可以帮助我们直接将这个 codex 的 底层模型切换成 deepstack 模型。那我们先来看实际效果,再讲实际的原理。那通过这个 start 模型,如果第一次使用的话,建议大家去加入一个授权的操作, 然后去欸把这个授权授权完之后,我们再启动这一个脚本。好,启动的时候它会去修改我们当前的 codex 的 啊配置,将它转发成 github 的 本地的啊 api key, 然后我们来试一下。 好,可以看到重启完成了,那我们再打开我们的 despic, 那 这时候我的新 despic, 我 们就可以看到在我们的这个右下角变成了 despic 模型,对吧?那我们还可以把它回滚成原来的配置。有时候我们可能我们的额度恢复了,对吧?那这时候我们可能需要哎,变回原来的模型,所以就使用另外一个脚本 notebook, 对 吧?我们就直接使用 notebook 也是一样的,我们把整个流程跑通啊回滚,那回滚的话相当于重置嘛,重置成我们最早之前的,那我觉得这种方式是最好的,最友好的,对于我们来说是白盒的脚本代码都在我们手上,我们并不需要去关心它是一个黑盒的操作,然后有人去获取我们的 api key, 你 看是吧?恢复了一模一样,对吧?好, 我们来讲下核心的原理啊,其实核心的原理非常简单,我们来看一下,那这两个脚本的作用,主要就是修改了 codex 的 config 的 这么一个文件,建立了这么一个啊, deepspec 的 本地 property, 然后接收到了我们的这 codex 的 请求之后,自动呢将它转发成 deepspec 的 api, 然后最后呢再把 deepspec 的 结果进行返回, 返回的过程当中呢,我们可以看到整个流程是非常流畅的,并且呢我们通过 deep stack 去管理了我们整个的这个上下文,对吧?嗯,就通过这个 codex 去管理了我们整个 deep stack 的 上下文啊。最后呢再给大家,嗯, 讲一个风险啊,就是很多时候我们通过这种 c c x 和 c c c 外驱的方式也可以建立这个啊 deep cache 的 连接。但还有一个问题就是它的流程是怎样子呢?就我们启动一个 c c x, 就是 这个代理中转,比如说我们开启一个 c c x, 对 吧?它配置一个 api key, 但这个时候我们有时候可能从外部的渠道拿到这个 c c x 的 包, 有时候他会存在一些这个上传的风险,比如说你在这里填一个 key, 那 我可以把你的 key 呢直接获取到你,比如说这里,对不对?你获取到这里是给大家演示啊,这是一个风险站点的演示啊,确实可以拿到这个 key, 而且并且还会有通知,那 为什么呢?因为这个时候我们在这里形成一个 key 呢,实际上他会发一个请求 pos, 请求上升到别人的这个网站上,所以大家可以通过抓包工具可以去看一下,对吧? 或者说我们再通过这个 c c c 外旋, c c c 外旋,有时候我们也会有一些不法分子去打一些包,对吧?这个包对我们来说是黑盒的,那我们直接使用这个包呢,往往会出现一个情况,也会上传你的 key, 所以 会存在一个风险的啊, key 的 暴露对不对? 是吧?那这时候呢,黑客的这个黑盒的组建就带来了比较大的隐患,那如果说大家使用啊,像我这种脚板的形式呢,是属于白盒的,大家你可以看到,对吧?所有的代码这里都可以看得到,是不是所有的流程都可以看的到?你直接问一下 q 代码这个道理是不是存在上传 key 的 操作,那就可以看出,哎,他是一个白盒的操作, 黑盒打包好的,你是不是就没办法判断对不对?所以呢我建议大家使用这种方式啊,那这个方式呢?嗯,首先大家会得到一个这样的一个 呃,这样的一个文件夹,对吧?这样一个文件夹,然后呢执行第一个脚本啊,就是这个 start, 它会帮助我们去安装好配置的 python 环境,那因为本质来说,这个脚本呢,是通过一些 python 环境去操作的,对吧?那你切换完之后呢,就直接变成了 python 模型,但是呢,你使用的时候有两个步骤,第一步呢是把它 下载好这个啊切换包,然后呢这个时候我们干嘛呢?我们会得到一个什么?得到一个这样一个文件,这个 type c 的 key, 所以 我们就把这个东西呢给它复制一份,对吧? ctrl c, 对 吧? ctrl 加 v, 那 把这个后面的这个啊后缀给它去掉,你看会去掉这个音,这个点 copy 的 后缀。 好,这就给大家的一键打包包好,然后这时候我们在这里呢改成我们自己的 key, 然后再去执行我们刚刚前面说的这么几个脚本,比如第一个是吗? start 对 吧?回滚呢?就执行这个 rebook, 对 吧?那通过这样的方式呢?那就,哎,直接完成了我们整个的这个 deptych 的 切换。好吧, 原理也给大家讲清楚了,其实我觉得,呃,这两个脚本呢,主要就是这两个功能,第一个是一键切换 desac, 第二个是一键回滚默认配置,那帮助我们去切换,当然这个脚本还有很多优化的点,我觉得主要就是,哎,我们可以切换成这个小米的 mini 模型,对吧?还有我们的 kimi 模型,对吧? 那主要就是这些点。好了,那以上就是本期视频的全部内容了,我是小刘,我们下期再见。

哈喽,大家好,这是我自己在 codex 里面做出来的一个宠物服装网站,从市场的调研、产品定位、产品图到最后完整的 html 网页,整个过程中我没有手动写代码,也没有来回切换工具,都在 codex 里面完成。 那今天我就用这个真实的案例,想明白普通人到底怎么把 codex 用到自己的创意想法落地当中。一开始我只是给了 codex 一个很粗的需求,我想做一款面向稀泥市场的宠物服装。 他没有直接开始瞎做图,而是先帮我做了非常清晰的执行规划,包括先找到市场依据,定产品的方向,再设计系列以及生成产品图。 这里就涉及 codex 第一个很关键的能力, plan mode, 也叫规划模式,如果要生成同款的计划,你就要把这个规划模式打开。这个模式很适合新手,因为你不是一上来就让 ai 去乱做,而是先让它把任务拆开,告诉你每一步要做什么,为什么这样做,以及最后会交付什么, 你确认方向没有问题之后,再让它开始执行。第二个能力是它可以在项目过程中持续地帮你检查问题,也就是要开启 auto review。 比如网页做完之后,他会检查图片有没有加载成功,按钮有没有溢出,表单字段有没有写进去。那遇到权限和需要选择的操作,比如三种执行方案中,你想选择哪一种,以及需要启动的本地服务访问某些文件之类的风险性操作,他都会弹出弹窗确认。 接下来就开始自动批量生产产品视觉了,通过调用 gpt 的 image 去生产产品图,并存储在本地的文件夹里面,方便我们去找原始的素材。 但是这里我也想说一句实话, ai 第一次做出来不一定完全对,比如他最开始给我的风格就比较普通,我觉得不适合当地市场的审美。 这个时候就用到了 codex 里面很重要的一个能力, steer 也叫做中途接管,可以在对话框中输入你不满意的理由,告诉他这个方向是不对的。比如我要更鲜艳的花朵,更适合女生,更有悉尼精品宠物品牌的感觉。然后点击 steer 去接管方向盘, 他按照我新的反馈去重新调研,重新调整产品系列,重新生成图片。这个过程就好像是你在和一个设计助理协助他负责执行,但是方向盘一直在你的手里。最后,我让柯黛斯给这个宠物服装的项目呢,做出了六个设计系列,每个系列三张图,佩戴的生活方式图, 一张产品的细节,一套平铺图。也就是说,不同于 j b t image 的 单张出图功能,它一次帮我规划并生成了十八张用于落地页的产品测试概念图。 那对于普通人来说呢,这一步就非常省时间了。图片定下来之后, codex 就 把所有的内容整合成了一个静态的落地页, 这个页面里面有品牌管理、产品系列卖点说明、尺寸指南。如果我觉得某个地方不顺眼,也不用自己去改代码,可以直接在预览页面里面指出问题,点击驱动批注,英文是 annotation。 比如标题太大,图片间距不对,或者是按钮的颜色不够明显, 那 codex 会定位到对应的代码并进行修改。这对零基础的人很关键,因为你不需要懂 html, javascript 也能把一个网页打磨到可以测试市场的程度。完成好之后就是这样一个页面了, 最后所有的东西都会留在本地项目的文件夹里,图片、网页、代码、素材文件都在里面,你可以直接在本地打开,也可以部署测试,用来收集用户的邮箱和偏好反馈。所以,如果你想测试一个产品的想法, 一个小众的品牌,一个服务的页面,一个预售的活动。以前你可能要找设计,找前端,找运营,找人写文案, 那现在呢?你可以用 codex 做出一个最小的可行版本,拿去测试真实的用户反应。如果你是 gpt 的 plus pro 或者是 business 的 团队账号,通常会有更完整的 codex 的 使用权限。 所以,如果你已经是 gpt 的 plus 会员,这个功能对于你来说是完全可以去免费尝试的。对普通人来说,它最有价值的地方是, 你不需要在一开始就花钱去找团队,也不需要把想法都停留在脑子里。你可以先用 codex 做出一个真实的页面,跑一轮反馈,再决定这个项目是否值得继续投入。谢谢大家。

我用了 superpowers 一 段时间之后,最大的感受它不是让 cortex 更快写代码,恰恰相反,它是在让 cortex 不要太快写代码。因为现在 ai coding 里一个常见的问题是,需求还没有澄清,边界还没有确认, 测试还没有想好, cortex 已经开始改文件了。小任务这样做还行,但一旦任务变复杂,这种直接开写的方式很容易出问题。所以这一期我们聊聊 superpowers 到底解决了什么问题。 先简单说一下 superpowers 是 什么,它不是一个单独的 skill, 而是一套给 coding agent 使用的软件开发方法论。在 codex 里面安装很简单,如果 是 codex c r i, 打开 plug ins, 搜索 superpowers, 选择安装就可以了。如果是桌面版的 app, 在 侧边栏 plug ins 或者是那个插件里面找到 superpowers, 点加号安装就可以了。 插件我找到 superpowers 点安装就可以了,因为我已经装过了,所以这边不是加号了。装好之后,它就会作为一组 skills 在 cortex 里面使用。这也是我觉得它很适合 cortex 的 地方。它不是让你每次手动复制一堆 prompt, 而是把一套软件工程流程变成 cortex 可以 按需使用的 skills。 我 理解 superpowers 的 核心就是把 ai coding 拆成 七个顺序执行的步骤。第一步就是头脑风暴,在写代码之前先澄清需求,探索方案,确认边界。第二步就是创建独立工作区,不要直接在当前工作区里乱改, 而是创造一个更安全的独立开发环境。第三步是写实施计划,把任务拆成小步骤,明确要改哪些文件,怎么实现,怎么验证。第四步是指代理开发, 把具体任务交给 subdivision 去执行,让主流程可以更清楚的组织和检查。第五步是 tdd 测试,驱动开发,先考虑怎么证明它是对的,再写实现,而不是先写一堆代码再说。第六步是代码审查,改完不是马上说完成,而是让另一个审查视角检查问题。 第七步是完成分支,最后做验证,收尾、合并或保留分支。所以它的流程不是需求到写代码,而是这一套头脑风暴,到独立工作区域,到实施计划,到代理开发,到 t d d, 到代码审查,再到完成分支,每一步都是一个独立的 skill。 这就是 superpowers 最核心的地方,它把软件工程流程拆成了 ai 可以 执行的一组 skills。 我在 codex 里用下来,感觉它是比较无缝的,尤其是装成插件之后,它不像一个你每次都需要手动调用的命令集合, 更像是给 codex 加了一套开发习惯。比如需求不清楚的时候, codex 会先倾向进头脑风暴,先问问题,探讨边界,确认需求,而不是直接开始改代码。准备实现之前,它会更容易进 writing plans, 设计代码质量时,它会提醒 pdd review 和验证。这就是我觉得就 pos 很 有价值的地方,不是每次靠你提醒 cortex 守流程,而是让 cortex 默认更容易按照工程流程工作。这里也放一个 sdd 的 背景在里面, s d d, 也就是 spec driven development。 规范驱动开发,它的核心思想是不要一上来就写代码,而是先把要做什么说清楚,比如 open spec, 它更偏规范管理,它关注的是把需求变更约定整理成可维护的规范。 spec kit 更偏规范驱动开发流程,它通常会通过一组命令模板,引导 ai 从 需求深层规范计划任务再去实现。而 superpowers 更偏工程纪律和 skills 集合。所以我会这样理解, s d d 解决的是先要把做什么想清楚, superpowers 解决的是做的过程中怎么守流程。最后说一个大家可能关心的问题, token 消耗,而我自己用下来。 superpowers 在 cortex 里的题感是比较轻的,因为它不是每次 都把一大堆规范文档塞进上下文,而是通过一个个 skill 在 需要的时候触发对应流程。当然,它也会消耗 token 头脑风暴,它要讨论需求, writing plans 要写生成计划 review 要读取代码和分析问题, 都不是免费的,但它的消耗更像是按阶段按 skill 触发。而 openstack 和 stackkit 这类的 sdd 工具通常会生成更多的规范计划任务文档,好处呢是结构更完整,坏处是文档越多,后续带入上下文的 token 压力也可能更大。我 之前看到 speckey 的 社区里面有人反馈过类似的问题,有依据里估算,在 cloud code 里,一组 speckey 个 months 可能占用大约十八点六 k 的 tokens, 在 codex c i 的 上下文窗口里面大概占百分之七到百分之十。这个不是官方的 benchmark, 但它说明一件事,流程工具本身也有上下文成本。所以我的判断是, opens back backit 更适合强规范、强文档、强交付约束的任务。 superpowers 更适合日常 ai coding, 因为它更像一层工程流程约束 动成本更低,体感也更自然。所以这一期的结论是, superpowers 不是 给 ai 加超能力,而是给 ai 加工程纪律。它解决的不是 ai 不 会写代码,而是 ai 太容易跳过软件工程流程模型提供能力, superpowers 提供纪律。 下来几期我们会继续拆开看。为什么先要头脑风暴?为什么要写 plans? 为什么 ai 写代码需要 pdd? 以及为什么 ai 也需要 code review? 下一期我们继续。

给大家看一下我们这个浏览器的效果,看到没?他直接去在网站里面去操作了就然后刚刚他是直接去在里面搜,你看他现在贼快,上面 ui 一 直在变,看到没?我去 codex 刚刚出了一个可以控制浏览器的插件,我现在刚安装,我给大家看一下是如何安装的。首先你一定要呃搜 codex, 然后一定要搜这个呃, open i 提供的,然后呢把它添加到 chrome 上面, 对,添加完之后呢,这里面就它就在这里面,我们把它这个勾选一下,然后这个 codex 它提示它没有这个连接,我们点击这个小齿轮让它连接一下,然后这个桌面端的 codex 一定要去升级到最新版本,然后点击这个安装,然后点击安装, 然后我让 codex 去帮我搜索论文。啊,一开始呢,他是,呃先去尝试用浏览器搜,但是他没有成功,然后他就开始用这个搜索指令了。呃,我说你不要用搜索技能,你直接用我浏览器搜好了,他第二次就直接开始用浏览器了,我给大家看一下我们这个浏览器的效果, 看到没?他直接去在网站里面去操作了就然后刚刚他是直接去在里面搜索,你看他现在贼快,上面 u i o 一 直在变了,看到没? 所以说呢,就是说他的好处,就是说他把所有东西呢他都会整理好,然后我们就不需要我们去手动去搜了。还有一点,就假如说你是在学校里面,你有一些对一些论文库的一些访问权限,那你可以把这个权限授权给他,对吧?然后他这个搜索范围就更广了。 ok, 谢谢大家。 最终结果大家看一眼他把优先读啊,哪些方向都列出来了,然后我们也可以让他把具体内容去总结,也都没问题的。

美好啊,朋友们,这是一期 codex 奶妈级的零基础系统教程,这期视频我会从安装开始,手把手地把 codex 的 基础能力到高级功能的组合,以及最新的手机端操作,用十个实战场景来带大家彻底拉通 以后这一类的 ai 产品,出一个算一个,你都会触类旁通,游刃有余。我也把这期的文字课间整理成了文档,那这期的含金量可谓是 biu biu biu biu biu, 一个点赞收藏关注是最起码的。好了,不多说,学费都交了吧,我们上课, 那在开始之前,我先说一下 codex 和 cloud code 的 区别。从本质上来说,它俩都是由编程 agent 逐步转向了通用 agent, 分 别是 ansapi 和 open ai。 这两家出的 cloud code 呢,默认使用 cloud 模型,但是我们可以自行替换成任意其他的模型,那在易用程度上, codex 桌面端的产品设计是会更友好的, 更适合零基础的白领工作者,而 cloud code 有 更高的自由度。在功能上, cloud code 原本是最齐全的,什么 skill、 mcp、 斜杠命令、 hock、 远程操控,这都是人家先发明的。但是呢,最近的 c c 更新稍微不如 codex 那 么快了,会更加偏向专业开发者一点。 而 codex 发了非常强的浏览器操控和 computer use, 还内置了最近的 image 二深图模型, 而且昨天还刚刚发布了手机端和 hock, 可以 直接用你的手机 check gpt 来控制电脑上的 codex 干 活。那价格和额度方面呢? codex 的 会员额度非常大方,二十到的会员就很够用,而且还不封号。 而 cloudpod 呢,大多数人可能都没法用它的官方账号基本上都得自行调用 api 的 费用属于是花多少用多少,风险由人。那在使用场景上,我个人喜欢用 cloudpod 搭配 cloud 模型来写作,因为 ops 四点六的写作和规划能力真的很强, 那 codex 的 执行和解决问题的能力也很强。日常的办公场景,我会选择用 codex, 那 在编程的时候嘛,我就两个都用上,所以结论是,入门的朋友用 codex 就 很强了,有条件的朋友呢,两个都来是最完美的, 不过两者的逻辑其实都是一样的,我们学一个,另一个也就会用了。那 cloud code 我 也做了一期系统教程,想拥有左膀右臂的朋友可以去看看。 ok, 正式开始 使用 codex, 我 们唯一需要准备的就是一个叉 gpt 账号,免费的也行,只是会额度稍微少一点。那有了账号之后,我们就直接去它的官网双击安装, 然后安装好之后登录我们的叉 gpt 账号,然后这些设置我们可以先随便选一点啊,选个日常工作,反正后续呢,我们都是可以改的。那搞定了, 那进来之后呢,大家会看到这个对话窗口,好像跟 chat gpt 是 很类似的。那我们打开两边的侧边栏也蛮眼熟的,左边呢,可以管理对话和任务的列表, 那中间就是聊天,右边大概是结果之类的吧,大家应该都能猜个七七八八,所以我们先不深究它的页面,我们直接开用,这其实也是我探索所有的 ai 工具的独门秘方。 我打开一个陌生界面呢,我先不管别的,我先找到我能对话的框,我先聊,先找到我能看得懂的按钮,先按,按着按着你就会了。你看看,独门秘籍都教给大家了,以后你们就是为师的弟子了。 ok, 众弟子不必拘礼,我们还是以学业为重啊。那我们第一个要了解的 codex 能力呢,就是本地文件操作, 也是这一类桌面端的 agent 跟对话 ai 最显著的区别和能力。因为过去我们用叉 gpt, 如果说我们要让它看到我们本地的内容,我们只有两种方式,一个呢就是复制粘贴到这个对话里,另一种就是以它允许的格式和数量把文件给上传上去。 但是 codex 不 一样,它可以自主地读取和操作我们的本地文件,而且不限数量。比如说我作为一个剪辑,我的本地里面存了八十多条视频素材,这都是我剪辑要用的, 但是呢,这个命名全都是乱的,完全看不懂,所以我想以这些视频的内容来命名,到时候我们看见文件名的时候,我们就知道这个素材是什么。那这事 check gpt 肯定是做不了的,但是 codex 可以 我们来看这两个地方,它都显示了一个概念,叫做项目, 我们选择一下,哎,一选择项目,他就让我们选择本地的文件夹了,那我们只要选中这个文件夹,那这个文件就是我们的项目了,里面所有的文件 codex 都可以自由的读取和操作, 当然这需要我们给他权限。大家看这里的权限选择啊,目前呢,我们是一个默认的权限,我们再点开,他有三种权限模式, 那默认权限的意思呢?就是在我们当前的文件夹内,他可以自由的去读写这些文件,但是如果他想要联网呀,或者是帮我们下载一点东西啊, 或者是碰这个文件夹之外的其他文件,那他是不行的,如果他必须要做,就会要向我们提出提高权限的请求,我们点同意才能继续。 那自动审查呢?顾名思义就是有个 ai 自动帮我们审查,由 ai 来判断这个操作危不危险,如果危险呢,就来问我们不危险的,比如说他去下一个知名的这种官方软件什么的,他就直接开干了。 自动审查比默认模式要更宽松和智能,建议大家选这个就完了。那最后呢,是完全访问权限,这意味着 codex 可以 在你的电脑上几乎什么都能干,它可以修改删除任何文件,它可以在任何位置执行命令,例如说它可能会去把你的 cloud code 给删了。 开玩笑啊,它一般情况下是不会这样抽风的。 ai 呢?也没有嫉妒情绪吗? 大家尤其是新手朋友就选择自动审查模式,相信 ai 就 完了,毕竟咱又能审的比 ai 好 多少呢啊,对吧? ok, 那 我们选中了刚刚的这个视频的文件夹,继续来提出我们无理的要求,让他帮我们把这个文件夹里的所有视频素材都按他们的实际画面来重新命名。哎,他就开始做了, 而且大家看他非常的聪明,他先看了看我们到底有多少个视频,然后他选择用抽帧的方式抽取关键画面来判断内容是什么,而且他还知道他不要一张一张图去看,他给拼成了缩略图的形式,一组一组的去看。 ok, 很 快啊,这个文件夹里面的文件名就全改变了。过程中呢, codex 也是没有向我们提全的,因为他都是在这个文件夹内去操作的。那我们也可以检查一下他都对应好了没有。 ok, 钢琴家音乐演奏厅,没错, 雪山近身格斗,没错,旗袍女人夜巷卖热饮哇!而且他的这个命名还遵循着一个序号,任务、场景、行动的一个清晰的命名格式。 ai 做事的这个细心程度啊,人类你不服不行。那另外呢,我们其实也可以在同一个项目里面去开多个不同的对话,它们的上下文都是不一样的,但是同样都可以随时的访问我们这个文件这个项目。 比如说,我们在另外一条对话,我们又给他一个不同的任务,让他想办法把所有关于风景的视频都剪成一整条。 哎,没想到吧,他真的能剪,他自己想办法,用了一些工具问我们要了一些权限,用这个 ffmpeg 给它拼在了一起,效果的确是关于风景的都剪成了一条。 ok, 那 如果我们要创建一个新的任务,我们其实也可以手动的在这边创建,他也会自动的在我们本地创建一个文件夹。 然后呢,我们跟 codex 对 话的整个过程, agent 产生出来的任何文件啊, pdf 啊,什么 markdown, ppt, 它都会直接存在我们本地的电脑上。 ok, 到这里,大家应该 get 了 codex 呢,可以随时地访问我们的本地文件,去读取内容,写文件,删文件,移动文件,文件夹里的内容也就成了我们的 codex 随时可以获取的上下文,那这里的项目也就对应着我们在本地的一个文件夹, 哎,那刚刚这么个任务会花我们多少上下文呢?我们只要看这里就能看到了。 那这个小圈代表的是我们现在的这个对话和里面的操作,一共使用了 gpt 五点五的多少上下文窗口。 如果我们把鼠标悬上去呢,它还会有更详细的一个信息,当上下文快满的时候, codex 会自动地帮我们压缩上下文。不过其实当我们一个任务告一段落之后,不用等它快满了,让它自动压缩,我们也可以自己通过斜杠压缩这个命令 来手动的去压缩上下文,这样呢,可以让模型更聚焦在我们的新任务上,也省一点上下文的额度。那当然大家除了这个对话的上下文余量,其实我们还想知道我作为一个免费用户,或者是我作为一个 pro 用户, plus 会员,我还有多少总共的额度可以用,对吧? 这个呢,有两个方式查看,一个呢是左边的设置,这里我们点开剩余额度,就能看到你五小时内还剩下多少,那本周内又还剩下多少, 甚至呢,也有什么时候到期会刷新的一个提示,这个产品的设计还是比 cloud 的 友好很多的。那另一种方式呢,就是我们可以直接在对话框里输入斜杠,然后找到这个状态, 那打开这个状态之后,它的绘画这里就会持续的显示我们的上下文余量,这个五小时和一周的限额。但再次说实话,这个 codex 的 额度还是非常大方的,二十到的额度我认为是可以满足大多数白领工作的高频使用的。 ok, 那 顺便呢,我们也介绍一下这里的模型选择, 那点开之后,我们可以选择速度,快速呢,就相当于加急通道,会消耗我们更多的额度。那这里呢可以选择其他模型,但是大家都选五点五,因为它确实更好用。然后呢,这里可以选择智能程度,其实呢一般中度智能就够了, 所以我们选高。 ok, 那 这个小麦克风呢,肯定就是语音输入功能了,比手打字还是要快很多的,但是呢,它的转录速度远不如大家去下载一个语音输入法,还是非常推荐大家用语音输入的 好。那现在我们通过一个本地文件处理的案例,也了解了 codex 上常用的一些功能。那 codex 的 第二大能力就是命令行工具使用。 其实刚才我们说到权限的时候就有提到,在默认权限下,它可以读写文件,但是却不能执行一些命令,一些联网的操作。那这些命令是什么意思呢? 刚刚的案例其实也已经用到过了,比如说它把视频抽帧出来,还把几个视频拼接到一起,它用到的 ffmpeg 就是 命令行工具。 还有一些我们熟悉的命令,比如说我们在终端里面来克隆一个 gitup 仓库,或者是大家近期比较熟悉的,我们在命令行里面输入一些命令来下载龙虾和各种依赖。那 codex 的 第二大能力就是在我们授权的情况下,可以使用我们的终端来替我们做这些事。 那我们就来让 codex 帮我们来安装一些平时对于小白来说非常复杂的东西吧。第一类,常用依赖,比如说什么 node gs 啊, git 什么的, 也是大家以后使用各种 agent 或者是做其他项目必备的一些工具啊,那之前大家要装这依赖都得去看一个手把手教程,然后照着命令抄,挨个装。那现在我们就直接跟 codex 说帮我安装个 node js 给他发过去, 也是因为这些东西呢,其实都是比较常见的东西了,所以在我们的自动审核的权限模式下,你看他基本上都不问我们要提权,就熟门熟路的帮我们装好了。 那第二类,就是那些爆火的但是有上手门槛的一些新的 agent, 比如说龙虾,爱马仕,甚至还有这个 codex 的 竞品 cloud code, 我 们都可以让 codex 帮我们装完了呢,它还能教我们该怎么用。那我们装一个 hermes 吧, 我其实都不需要给它官网和仓库链接,我就说最近有一个叫 hermes 的 agent 很 火,你帮我安装一个吧。 哎,他就会自己去搜索,然后帮我们判断到底是哪一个。然后呢,他根据官方的文档帮我们陆续的装好了,还帮我们验证过已经装好了,你瞧瞧,那我们照着他说的来启动一下试试。 哎,真的帮我们装好了,那往后的配置我们就不在这里继续了,但是大家应该 get, 有 了 codex 以后,那些复杂的要收你五九九的部署,你都可以直接让 codex 帮你做了,怒省五九九。而且我们在使用的过程中遇到任何问题,还可以截图去问 codex, 什么瞎死了马挂了,升级出现了问题都可以让 codex 直接帮你修,是不是很方便? 那第三类有点没那么必要,但它其实也可以,就是像 cursor integrity 这种软件应用, 平时都是我们去手动在网页上下载的,它也可以帮你下载和卸载。那大家用 codex, 我 其实也建议大家去下载一个 agent 的 ide 啊,因为现在 codex 有 个缺点是它没有办法打开我们的文件内容,直接去手动编辑。 虽然这个侧边栏呢,是可以看到一些文件结构和内容的,但是我们都没法编辑,所以大家可以让 codex 下载一个自己喜欢的,比如说我们就这样下载。那下好之后呢,我们再执行一个 git i n i t 一个初步化, 那右上角就会出现这个东西,随时可以把我们的项目在编辑器中打开,我们来手动编辑。 那第四类就比较重要了,就是 agent 本身会常用到的那些 skills 啊, mcp 啊和 selli。 那 skill 和 mcp 本身 codex 也是支持的,我们后面会详细讲到, 我先挑两个大家安装一下,方便我们后面综合起来来做案例。那这些 skill 和 c i 呢?通常来讲不像那些 get 那 种大项目那么著名,所以我们最好是找到它的具体仓库,或者是明确的官网地址。比如说我们下载一个专门找 skill 的 这个 find skill 哦,方式就是直接把链接拷贝给 codex, 然后跟他说帮我装一下这个 skill。 那 在他装的期间,我们也说一下 codex 的 另一大好处,并行任务处理, 我们完全可以在他做这个事情的时候再开一个对话,让他去下载一个别的。那我们下载一个飞书 c l i 吧。飞书 c l i 其实非常的典型, 因为现在呢,有一些积极 ai 化的软件,把几乎所有他在软件里能做的操作都做成了命令,让 agent 能够方便的去操作,我们把这个链接发过去,让他开始下载, 那这边呢,其实会显示每一个正在处理当中任务的情况,这个在转呢,就说明它正在执行中,那这个蓝色的点呢,就说明已经完成了,有时候还可能会出现一个需要你申请权限的一个标识。 ok, 那 这里 fan skill 呢?它是已经装好了,我们再看飞书 c l i 这边,它会引导我们去做一些授权, 我们就跟着它的引导去完成就好了。 ok, 那 装好飞书 c l i, 那 codex 就 能帮我们去做飞书里的各种操作了,比如说写文档,发消息,见日历,做表格什么的了,我几乎每天都在用, 好大功告成。我们就这么一个小章节,我们就用自然语言的方式让 codex 帮我们装上了 hermes node, 飞书 c l i 一 大堆东西,这就是 codex 作为 agent 的 第二大常用能力,命令行使用。 那这个能力和这个章节的演示也是希望大家能够 get 到一点,就是我们现在在电脑上想去做的很多很多事情,都可以让 codex 这样的桌面 agent 去做了。那 codex 的 第三大能力是持久记忆。 看过我那篇 cloud code 的 朋友应该都知道, c c 呢,有一个手动的持久记忆, cloud 点 md, 还有一个自动的记忆系统, 都是把我们希望 agent 能够长期记住的,比如规则、篇号和我们的信息之类的东西,以本地文件的方式存在我们的电脑上,然后事实的时候把这些记忆以上下文的方式注入到 agent 里去。那 codex 也是类似的,它也有这两套持久的记忆系统 在 codex 里面呢,手动的持久记忆文件叫做 agents 点 m d, 而且它也有一个自动的记忆机制,来我们打开设置,找到个性化, 那在这里的这个自定义指令实际上就是一个全局生效的 agent state md, 它会在我们任意的项目跟 codex 对 话的时候,它都第一时间作为上下文发给大模型,那我们可以手动地自己在这里写,不过我更喜欢呢,直接在对话中去跟 codex 说, 比如说我说一个,我希望你以后对非书文档里的任何修改都使用一个专属的你的文字颜色和用删除线的方式来修改,不要直接的修改。然后这个帮我寄到局的 a 正 c m d 里。 ok, 那 它这里呢,告诉我们已经写好了,我们再打开个性化这一块,就的确是多出来了这么一套规则,那实际在使用当中,它就会去遵循我们这个规则了。 比如说我这里已经有一篇非输文档了,我在侧面呢也评论了几个我想修改的地方,我直接可以把这个链接发给 codex, 我 让他根据我侧面的评论帮我修改一下。 那因为我们刚才确实已经装好了这个非输的 c r i 也都给他配置好了权限,所以 codex 是 直接可以操作我们的文档的。 ok, 看看它完成之后的效果。 果然他用了紫色的字和删除线的方式来帮我们做的文档修改,那这个呢,是局的 agent md, 适合记一些适用于所有任务的一些大原则,比如说我们的工作习惯,我们要说中文,我们的工作偏好修改文档,要留下这种修改痕迹等等等等。 那另一种呢,就是项目级的 agent md, 这个长期记忆呢,只在这个项目当中生效,我们可以选择一个项目的对话,然后打开编辑器, 自己在这里手动的创建一个 agent 的 md 的 文件,然后我们去写一些针对我们这个项目的一些规则, 当然也可以让 codex 来帮我们写。我个人的建议呢,是在这个项目文件里面有了一些内容之后,让 codex 根据他对我们项目的了解来自己帮我们写。那自动记忆怎么回事呢? 其实我们刚才在这个个性化这个下面我们也看到了,我们需要手动打开这个自动记忆功能, 它的机制是我们打开这个功能之后, codex 会在我们结束对话或者是结束任务,这个对话闲置一段时间之后,它帮我们把那段对话总结成记忆,然后记在一个地方。但是它有几个原则,第一太短的对话它就不记了, 那第二这个对话的总结它一样会消耗我们的额度,所以当我们的额度太低的时候,它也就不记了。 并且这个自动记忆文件呢, open ai 官方是不建议我们去手动修改的,顶多我们可能删一删有些没必要的信息,那这个文件大概是长这样 的,是一个任务,一个任务在记录的,主要呢会写上这个记忆的来源是哪段对话呀?以及它的工作目录是什么,那以及以后触发了什么关键词的时候,它会去召回这段记忆, 再往下呢,是用户在这件事情上的偏好大概是什么样的?那第五段呢,是一些可附用的一些知识,一些踩坑的记录,那这些内容都是 codex 自己记录的,并且以后也是会它自动的招回去使用的,我们就先不修改它, 它这个格式确实也不太方便修改,更多的时候我们对于明确的规则和要求,我们还是通过组织 agent md 来实现。那大家学完这些视频之后呢,我也想给大家再做一期, 通过组织不同层级的这种 agency md 给自己做一个非常懂你的,可以做不同类型事情的超级助手的视频,感兴趣的朋友可以扣个一。 ok, 那 第四大能力就是 codex 可以 直接用到 image, 二来生成图片。不过呢,深图功能其实是一个小功能, 所以这一章节呢,我们不只会用它的图片生成,我们会带大家做一个完整的个人主页的开发项目,并且在了解一些 codex 在 小白开发中的一些用法和功能。那我们再来开一个项目,叫做个人主页, 然后我们点开这个加号,我们把计划模式打开,因为我们要做一个网站嘛,任务会复杂一点,所以打开这个计划模式呢,他会先帮我们列出一个详细的计划,我们确认之后他再开始行动。 计划模式呢,比较适合我们的任务有一定复杂性,或者我们自己还没想清楚,可以跟 ai 讨论出一个计划。那假设我们现在就是第二种情况,我们其实没想清楚,我们直接跟他说我想做一个个人主页, 那你看他看到我们的项目中是没有内容的,所以他以这种选择框的方式来询问我们的细节,这些选项呢,大家可以按照自己的要求去选择,那我就选这个个人品牌吧。 然后如果说这些选项中没有我们满意的呢?我们也可以选到最后一个来填写我们详细的要求,比如说我要他修饰感,也要高级感,然后我选针对合作伙伴,不要个人照 中英双语,巴拉巴拉巴拉。这里真的是问了我们相当多的问题啊,那最后呢,他给到我们出了一个详尽的计划,问我们是否实施此计划,那其实基本的计划我们看着没有什么问题,但我们也可以补充一些调整方案。 比如说我们刚才就要说到了要用它的 image 二的生成能力,我们这里没有体现,我们加一句网页上要多用一些图片,使用 image 二来生成一些高级感的图片,然后我们一起提交。 哎,那他又问我们要走哪种高级感呢?我们如果点开这个小叹号的话,还能看到他说的这个风格到底意味着什么意思,这个产品的小细节真的是我很喜欢,那我们就选他推荐的吧。然后他出了一版新的计划,我瞧着没什么问题, 去吧。 ok, 他 就开始初识化这个项目来逐步帮我们生成了。那这个过程呢,肯定会需要一定的时间,在这个期间我再给大家补充一点点知识点。呦,他的第一张图出来了,不错,挺有艺术感的,果然是最强的 emoji 二,那我要补充的这个知识点呢,叫做引导。 如果说大家在 codex 执行一个很长的任务的过程当中,你觉得他有点跑偏了,我们是可以随时给他补充纠偏的,比如说我们补充一下图片的人味要更强一点,而且不要这么冷的色调。我是一个 ai 博主,然后我们发送出去, 哎,大家会看到他没有立刻打断我们的任务,没有发出去,实际上他在这里排队呢。那我们看到右边的这个引导按钮,他写着我们不打断模型运行,会在下次调用工具后发送过去。这个是非常好的一个功能啊,我们点一下, 哎,他就可以发出去了。这个功能呢,可以让 codex 不 用在错误的道路上一路狂飙,把我们额度都花光,也不会让它重新再跑一轮任务。那另外一个小功能点,我们找到一个已经结束的任务, 我们看一下这个 ai 的 回复,每个 ai 回复的下面都有一个这个按钮,叫做分叉 fork, 这个的意思是我们可以随时从这里开始去开一个新对话,非常适合那种前面聊的还好好的,上下文也非常有价值,但是我们再往下聊,就聊的有点叉劈了的时候。哦,还有个小功能,宠物, 我们点开设置外观,然后这下面就有一小对小宠物可以选,甚至呢,我们还可以点击创建,让 codex 根据对我们的了解来生成一个定制化宠物。那我们先点击唤醒宠物, 哎,就会在桌面上有常驻这么一个小桌宠,脑袋上会冒出来 codex 正在做什么的一个提示,别的呢?好像也没什么用。 ok, 终于在他跑了七七四十九分钟之后,网页完成了, 我们来看看效果,因为 codex 呢,有一个内置的预览浏览器,我们可以直接打开右边的侧边栏啊,我们还给它放大一点。 嗯,这个网页的效果确实是不错啊,不过呢,现在的 a 证呢,其实都有这么一手了,那它这个预览浏览器呢,还有一个好处,我们点击右上方这里的一个批注按钮, 我们就可以在这个页面上选中这里的具体元素去写修改意见,包括重新生成图片,比如说我们要这个 logo 放大一点, 然后 p 住这里这张图加上一个人物,好把这个删掉, 那然后对话框里呢,就会加上我们这几条批注,然后我们点击发送,它就会针对我们的意见进行修改了,是不是挺方便的?那我们现在项目有了雏形之后,我们再 call back 一下刚才说的 agent md, 其实现在呢,就是一个让 codex 帮我们生成项目级 agent md 的 好时候了,因为我们也有了一定的内容,我们就让它自己生成一下,我们打开编辑器看看, 不错,项目的背景,各种信息,各种规则,各种文件路径都已经写好了。那以后呢,无论我们在新开对话,还是我们的聊天记录都已经被清空了, codex 都可以通过这个项目级的 a 证书 md, 立马的了解我们的项目基本情况。 ok, 那 我们先保持这样,先不做精修了,我们直接准备部署上线,当然大家自己做的时候完全可以去打磨的更好,那网页上的这些信息也换成更真实的信息就好。 那我们现在要部署呢,就得要说到 codex 的 第五大能力插件。在现在的 codex 当中,插件大多数是让我们的 agent 跟外部平台、外部工具、外部服务连接的一个作用,它实际上就是我们所说的 skill, mcp, c l i 这一类东西的一个完整集合包,比如说操作邮箱、操作日历、操作 excel 啥的。那我们来点开左边的这个插件栏,我们看这里呢,已经默认帮我们打开了好几个内置插件了,比如说浏览器操作,还有 mac 专有的屏幕操作,还有 excel 表格, ppt 等等。 那他的插件页面没有中文翻译,所以我给大家把这些插件的具体中文意思,分别能干什么也都列出来了,大家课后可以按需装上,点这个加号就好了。那我们先翻到这个 coding 板块,因为我们想要部署上线嘛,通过插件会非常方便。 其实呢,这个 vassel 和 netify 都可以,我们点一个加号给它装上,那如果大家给它没有选上的,也记得要选上。然后我们再回到对话当中,告诉他们,我们想用这个 netify 把这个网站给我们部署上去, 我们大家也不用管他咋部署的,反正他需要干什么呢,他都会告诉我们的。 ok, 他 发现我们没有登录授权,然后主动弹出了这个登录的链接,那这里呢,建议大家用 tapp 账号登录是最方便的, 那登录完之后,他自己就知道我们已经登录好了,然后继续的帮我们部署,这就搞定了。这个链接呢,就是我们最后的网站了, 只要把这个发出去,别人就能访问你的个人主页了。 ai 是 不是个好东西,你说就这么两下子就干了,原来普通人花钱都不一定能干成 o k。 先压抑住我的这个老灯感叹。我们回到刚才我们已经装好的插件, 那其实这里呢,还有两个非常重要的内置插件,就是 browser use 和 computer use, 还有这个 chrome 浏览器, 那这些有什么用呢? browser use 顾名思义呢,就是 codex 可以 直接帮你操控浏览器,比如说它自己点击翻页截图,填写表单等等。通常呢适用于自动化测试前端, 当然也有比较无聊的用途,比如我们可以让 codex 打开这个 m b t i 做个测试试试, 嘿嘿,这样大家能够比较直观的看到它的一个效果吧。那这个鼠标呢,是它自己在移动,然后它是自己看了上面的答案在自己填写,然后填完这一页,它也会自动的翻页, 那随着它的一通操作,结果出来了,原来 gpt 五是 i n t j 啊,我说怎么跟我这么聊得来呢? ok, 那 这个 chrome 的 插件呢,也是控制浏览器,但是它控制的是我们自己已登录的自己的浏览器,它不会再新开浏览器, 那我们如果把它给勾选上之后,它会引导我们去 chrome 里面装一个插件,那装好之后呢,它就可以操作我们自己的浏览器了, 而且它有个好处,它是可以直接在后台执行多个页面的浏览器操作的,就是并不会占用我们的整个浏览器,我们不用真等着看它这些操作,我们该用浏览器干,别的我们可以接着干。 ok, 那 computer use 就 更厉害了, 它不只能够操控浏览器,连你电脑上的这些 app 它都可以操作,只不过呢,暂时只有 mac 有 这个功能。比如说我们新开一个对话,我们在加号,这里来看最下面的这个插件选项,我们手动地把电脑插件选上, 我们再来几个没什么用的奇迹引巧吧,帮我放一首九九年最火的歌,然后用我的微信给 qq 发条微信,说,请收下我一个点赞、收藏、关注,懂了吧? ok, 他 陷入了思考,然后他看到我们的应用都正在运行中,并且向我们使用了这个音乐软件。我们点同意看,这个就是 codex 自己干的啊。他帮我们搜索歌曲, ok, 音乐响起了, 但是他还有活,他还在问我们要微信的权限,我们也给他允许一下。 ok, 看他这个小鼠标,他正在犹豫着准备搜索点击,好朋友们失败了, 因为我上次都成功了,但是我估计现在微信已经开始严防这种 a 证的操作了,直接给我退出去了。 但是呢,他的确成功操作了这个音乐软件。其实我还让他操作了剪映,并且给我们的最新的项目加上了音乐。 那总之呢,意思大家都懂了吧,就是它可以操作浏览器,并且可以操作我们的电脑。当然,实际上我觉得它的操作效率目前来说还是稍微有点低的,我不太喜欢用这两个强大的功能。不过后面我要说的这个 skill 就是 我每天都会用的东西了。 那 skills 我 的确也已经跟大家说过很多次了,好学的朋友一定要去补补课。那 skill 本质上呢,是我们人为沉淀的一些可附用的方法、流程和工具的组合, 相当于给 agent 做某些具体任务的一些行动指南。那因为之前我们已经让这个 codex 帮我们装过一个叫做 find skill 的 一个原 skill 了, 所以后续如果大家想要去装,或者是找一些社区上的 skill, 都可以直接用 codex 拿语言直接让它下载。比如说我们下载一个必备的 ansapic, 那 个前端设计的 skill, 还有一个去 ai 位的,那我们这两个都发给他,等会儿都会刚好有用 欸,很快他就帮我们装好了。那以后大家想要下载 skill 呢?如果说遇到这个 find skill, 他 找不到的东西,也可以直接把链接发给 codex, 让他帮你下载就好了。不过我在 c c 那 期也说过,最好用的 skill 还是自己创建的,符合自己工作的专属 skill。 那 创建 skill 呢,也有两种方式,第一呢,就是直接告诉 codex 你 想要创建一个什么样的 skill, 通过跟他讨论打磨得出来一个 skill。 那另一种呢,就是我们接下来要演示的,先跑通流程,然后让它形成 skill, 这也是一种更推荐的做法。那比如说我们想做一个自动化写这类文章,并且帮它配图的 skill, 这种大家应该都看过吧, 那我们就得先通过一步步的引导 codex, 让它真正实现一个我们满意的文章。来我们新开一个对话。那正好呢,我们刚才不是装过这个 github 插件吗?我们可以直接先问它最新的 github 流行项目,热门项目都有哪些? ok, 它的确帮我们找到了一些,那我们再让它清晰地解释一下这些项目都分别是干嘛的。嗯, 那我们再让他挑其中新星数量最多的,来帮我们写一篇本周 get up 热门项目推荐这样的一篇文章。 好,那他写好了这一篇之后,我觉得稍微有点太人机了,我希望可以更口语化一点,并且我只想要五个精选的,那我们就告诉他,然后还要覆盖到这几个层面,那我们这里就可以用到刚刚我们下载的那个去 ai word 的 那个 skill 了,我们斜杠给它调出来。 好,那看到他的结果稍微优化了一点,但是我们还希望加一个我们固定的开头,我们的结尾,并且还要让他用上 image 二来帮我们生成一些配图。最后呢,我还希望他不要是这个格式,他要是一篇非输文档的格式,然后图文并茂的。 ok, 结果来了,他确实是有了,但是呢,我觉得这个配图不够丰富,于是我又经过几轮调整才觉得差不多满意。并且我还给他最后加了一步,要让他把这个飞书文档发送到指定的群里,让大家都来看看。 那最终呢,他的效果是这样的,果然发出去了。其实啊,如果想更加一步到位的朋友,也可以结合刚才我们说的这个浏览器操控,让他直接打开那个发布页面,直接就帮你发布出去。 那总之,我们对他这一套结果满意了之后,我们就可以直接让他把这一整套的标准和动作做成一个 skill 搞定了。那我们再输入斜杠,再往下找,我们就发现就有了这个 skill, 我 们可以直接这样手动地调用这个 skill, 也可以直接说生成一篇热门项目推荐图文这一类的触发词,也会让 codex 自动调用。 不过因为现在 github 上面实时的热门项目肯定是没有更新的,所以我们再调用一次呢,它大概率会写出差不多的文章,所以我们就不试了。但是大家都理解了吧, skills 呢,可以把我们经过验证调好一次的一整套流程和方法给它固定下来。 下次做这件事情呢, codex 就 可以按照这个方式稳定的输出。 ok, 那 下一个能力则是 mcp。 其实 mcp 现在已经用的不太多了,所以我只简单的示范一下那 codex 的 mcp 藏在设置里面的 mcp 服务器。 只不过小白看这个肯定是有点不太知道怎么填的,所以跟我们之前说的一样,我们最好的方式还是把你想装的那个 skill 的 链接拷贝给 codex, 让他自己装就完了。比如说我们来装一个 notebook lm 的 一个 mcp 发给他, 他就会引导我们来做授权登录,登录完就搞定了。那我们再试一个我存了非常多访谈视频的一个笔记本,我们来问一下他。 欸,那这样呢, codex 也就可以直接获取我们 notebook lm 上面的这些外挂知识点了。 ok, 最后一个 codex 能力是自动化定时任务。 其实定时任务本身并不稀奇啊,比如什么每天早上提醒我吃药,提醒我喝水这一类的事情,普通的软件也能做,但是我们把它放到最后一个说呢,就是因为它可以结合我们之前学到的各种能力,把一整套组合起来的任务,让 agent 定点执行 自动化,加上智能化和定制化方显美妙。比如说刚才我们做的这个热门项目图文的这个 skill, 我 们就可以把它设成每三天或者是每周,让它定时定点的产出一篇 dapp 热门项目推荐发出来。 那我们要创建自动化任务呢,其实也分两种方式,第一种就是选到这边的自动化面板,那它这里呢,有一些官方的参考视例了,不过大多数是跟开发相关,那我们选择新建一个自动化, 其实你看要填写的东西也非常简单,其实就是用提示词写好这些自动化是要做什么,然后我们可以在这里选好什么时候出发,我们也是可以自定义一个出发时间的, 然后这边就可以选择执行的模型和思考强度,最后点击创建即可。不过呢,我也还是倾向于让大家用第二种更简单的方式,就是直接在对话里跟 codex 说,那我们直接跟他说 帮我创建一个自动化任务,每周一早上九点自动化执行热门项目推荐的这个 skill, 产出一篇图文发到群里, ok, 那 我们在看自动化这里,它就已经帮我们设好了这个任务,我们随时也可以去改变它的时间。 再比如当你的这个邮箱插件 github 飞书都已经连上了 codex, 那 么你也可以让他每天下午六点帮我汇总日历上完成的会议, github 上面的提交记录和我的邮箱回复记录,生成一份全面的工作日报。 最后手机操控 codex 设置方法非常简单,手机上的 check gpt 和电脑上的 codex 都把它更新到最新版。之后打开手机上的 check gpt, 然后点击侧边栏的那个 codex, 它就会提示你允许这台手机控制你的电脑,直接就搞定了。如果你有多台电脑的话,也可以给它分别连上。这就等于你不管在大街上、地铁上还是朋友聚会,都可以随时随地地用手机下发一个任务,让 codex 在 你的电脑上干完一个活, 它就更像一个可以跟你远程协助的同事了。这个功能呢,目前免费版也可以用,但是主要能连的是 mac 系统的 codex。 好, 那到这里 codex 的 所有核心能力我们就全部过完了。来我们回顾一下。 codex 呢,可以操作我们的本地文件,可以使用我们电脑上的终端命令行工具。它还有两种构建持久记忆的方式,它还可以生成图片,而且它可以通过计划模式来做一个完整的项目开发。 那它有丰富的插件,可以操控浏览器和电脑,还可以把知识和流程沉淀成可附用的 skill 技能, 它可以使用 m c p 连接,外部它还可以设置自动化的定时任务。不过其实比起这些功能本身,我也希望大家记住两件事,第一就是我们真的有很多事情是已经可以交给 agent 做了。 那第二呢,就是我们已经从问 ai 的 阶段走向了管理 ai 的 阶段,因为过去我们使用 chat gpt 就是 有问题了,我们问一下,然后得到答案我们就走了。 那现在使用 codex 这类的 agent 呢?每个人都得像领导一样,帮他准备他所需要的上下文和工作环境,给他指明一些任务目标,然后来检查他的计划,监督他的过程,验收他的结果。 那同时领导还要负责把好的方法和流程沉淀成可付用的技能,把反复要做的事情设成自动化执行的规矩。好了,恭喜大家今天都升职了,记得点赞收藏关注我们下次见了。

我用 callix 加 gpt 五点五,只花了五分钟就做了一个自媒体选择题工具,不仅可以一键给选择题打分,分析流量潜力,还能自动生成封面图,效率直接翻三倍。这就是今天要给大家分享的 gpt 五点五加 callix 氛围感编程工作流。它解决了 ai 开发两大痛点,单轮生成无法叠代,优化 没法同时推进多个项目搭配 callix 桌面应用,你不用写复杂代码,可以直接像搭积木一样能做出能用的产品, 使用方法超级简单。第一步,新建项目文件夹,给出基础提示词,搭核心框架。第二步,边跑边叠带,在终端实时修改,不用重来。第三步,跨项目无缝切换,还能调用 cloud 的 优化前端样式。下面给大家分享三个实战场景。场景一, 自媒体博主开头给大家展示的这个工具,高智能筛选、高潜力选择题,自动配图,帮你少走弯路,快速解号,节省大量创作时间。场景二,副业创业者,十几分钟搭建 size 创业验证器,前后端一次性配齐,快速验证商业模式。场景三, 自由职业者不用每次手写题案,直接一键生成专业客户方案,自带报价交付系统和服务流程, 专业度拉满,省时又专业。如果你在做副业自媒体,或者是觉得自己的 ai 产出又丑又难用这个玩法,一定要试试!我是天眼锁,关注我,解锁更多 ai 落地实操技巧,记得点赞关注哦!

哈喽啊,我是老王,今天给大家展示一下我如何用拖带子做了一份完整的市场调研分析报告,从数据里去反推产品机会。大家都知道,我们卖家在选品的时候,最大的问题不是 没有数据,而是看完了一堆评论和竞品,最后还是不知道这个品可不可以做,能不能去做。今天我用 cold desk 只输入了一个 asian, 他 就直接给我跑出了一份全面的选品决策分析报告。这个结论可不是我拍脑袋想的, 他最核心的设计是不忙干,那启动前 codex 会先跟我确认业务三件套,这次调研到底解决什么决策?他的数据是跑 amazon 还是 reddit 还是 youtube? 最后我是要 stm 文件还是放进备注文档? 哎,这一步就叫做对齐目标。他给我的每一步的确认,其实都是为了保证最后的输出 能直接用在我们的业务上。整个流程我拆成五步,输入 asion 或者是品类词,然后确认我要调研的目标,以及抓真实的数据,做 voc 的 句类和价格,带切分,最后输出 go no go! 建议来,咱来看个耳机的深度案例啊。 他这里不是简单给我做了一个总结的评论,而是把上万条的评论做了语义的巨类,挖出了感官过载、 h d h g 人群和测税通勤两个区分场景。 关键的是他还会做需求分层,哪些是 master, 哪些只是 nice。 他 最后直接给出了一个建议,哪些的方向我们是可以的, ok 的, 哪一些只能是 watch 一下,哪些是低价卷王? no, 我 们不要去碰。我再给大家换一个衣柜品类去做快扫, 效率同样惊人。他第一件事情是做了市场证明,他这里给我指出了 pro table 这个词太泛了,真正的高转化词是 pro table close it。 这里的痛点洞察更是一针见血。这里显示啊,用户怕的不是容量不够,而是怕这些结构坍塌导致的信任崩盘。所以差异化的定位他直接给到了,我们要主打 这个防坍塌衣柜来强化金属连接件和加厚罩布的显示,你看到了没有?这些句句都打在了竞品差评的死穴上。 整个来说,从数据清洗、 v o c 的 挖掘、价格带切分到最终的逆向决策,它整个 colddes, 它是把一周的整个的流程压缩到了十多分钟,大家可以赶紧去试试啊,一箭三连,我也把我跑的分析的 skill 发给大家,我是老王,和大家一起进屋,一起爆单。

codex 真的 很好用,但是 g p t 五的模型太贵了,再用下去我的钱包要顶不住了, 所以呢,今天呢,我就给大家分享两个 codex 很 实用的插件。呃,第一个插件呢,可以接入我们国内的一些大模型,比如说 deepsafe 啊,字谱啊。好,第一个呢,就这个这个插件 打开之后呢,我们可以先点击模型中心,然后这里可以选择我们这些国内很优质的大模型。然后呢我们点击加号,复制好之后呢保存,保存之后我们再点击应用管理,选到我们的 codex, 选择其中应用 就可以了,而且如果你有多个国内的大模型的话,你切换模型的话,它对话是不会清除的,我觉得这个就很好用。好,现在通过这个插件打开的话,那就是使用的就是我们的这个 啊质朴的模型了。那如果我们是通过 api 的 方式登录的这个 codex 的 桌面版的,那它这个插件是灰色的啊,那我们也可以通过一个插件来把它解锁,就是这个插件 好,把它部署。安装好之后呢,我们先退出我们的 codex。 好 的,然后通过这个插件启动之后呢,就可以看见我们的插件已经解锁了,快去试试吧,让你的 codex 更好用。

跑通了 codex 的 y research 蛮有意义的。它挺有意思的,因为我终于可以用 trevor 这个工具搜索工具做事情了。嗯,现在 codex 就 可以帮你一步步的弄。是这样子的,我之前也是用 codex 做了一些调研,我发现做出来的质量不是我想要的。 通过,哎。这里有一个浏览器的插件,它可以用 chrome 和浏览器的插件来做。呃,检测出来表报告还能看。后面我一顿搜索,找到了 codex y research 这一个东西,觉得确实编排的很不错,希望对你有帮助。

很多人第一次看到 codex, 以为它只是一个会写代码的聊天框,错了。对小白来说, codex 真正重要的地方是它能进入项目文件夹,围绕一个目标持续推进,把结果落到文件里。 普通 ai 更像顾问,你问一句,他答一句。 codex 更像同事,你给他一个项目,一个目标,一个权限边界,他可以把任务拆开,然后一步步推进。 新手第一步不是追模型民,也不是找神提示词。先认识 codex 的 工作台,左边是项目和 thread, 中间是任务推进过程,结果会落在你的项目里。 小白上手路线可以压成五步,先安装登录,再添加项目文件夹,然后新建 thread, 用一句话说清楚目标,最后让它先列计划,不要一上来就直接改。 下载安装本身不难,真正要记住的是入口、账号、模型、权限都会随时间变化,教程只能帮你建立路径感,最终要以你账号里真实能看到的页面为准。 很多小白越用越乱,不是 codex 不 行,而是文件夹一开始就乱。建议先把学习资料、真实项目、沙盒、测试、通用工具分开,添加项目文件夹后,再在里面开 thread。 你可以把文件夹理解成项目群,把 thread 理解成群里的一个具体话题贴。黄金法则只有一句,同一个文件夹里做同一个大方向,同一个 thread 里只推进一件具体的事。不要上午改网页,下午算表格,晚上写文案,全塞进同一条任务线。 设置部分,先抓三件事, generally, 允许后台运行。 personalization 里写清协助规则,权限模式按风险选择,别为了快,把重要目录随便交给全权限。 personalization 本质上就是图形界面的项目规则。你要告诉 codex 改动要小,动手前先说计划,不要胡编路径,不要泄露密,要改完要告诉你最小检查命令。 skills 是 小白最容易低估的部分,它不是炫技插件,而是把固定做事方法沉淀下来。比如写作、调研、生成图文代码检查,都可以变成可附用能力。 定时任务、 m c p。 记忆系统、电脑自动化都很强,但新手不要第一天全开。正确顺序是先会文件夹和 thread, 再会规则和 diff, 最后再接工具和自动化。 如果这个视频只让你记住一个按钮,那就是 plan mode。 它的价值是先让 codex 只规划不动代码, 等你确认计划合理,再允许它执行斜杠命令 status。 推理深度是你日常控制 codex 的 三个入口,简单任务用低一点的推理深度,大任务再切到 high 或 extra high。 真正开始 web coding 后,门槛会从会不会写代码变成会不会描述需求。 你可以开麦说目标,但目标必须具体做什么给谁用,改哪里,怎么验收。也要诚实一点, codex 不是 所有领域都一次做到最好,前端效果不好就换更适合前端的组合,或者明确给它设计规范和截图反馈。 不要跟工具硬较劲。多个 threat 可以 并行推进,但前提是目标拆得清楚。比如一个 threat 改首页,一个 threat 写文档,一个 threat 做数据脚本,不要让他们抢同一批文件。 最后也是最重要的代码管理习惯让 codex 改代码,但不要让项目失控,每次任务都看改动范围,看 diff 跑最小检查确认没问题再提交。 总结一下,小白用 codex 的 最小路线不是学完所有技术,而是先做到三件事,会描述目标,会拆分任务,会检查结果。做到这三件事,你就不是在学一个工具,而是在学一种新的做事方式。

上一条我们看了 feature, 这一条来看 golden 分 类。这一类插件可以先按开发流程来选,你先看项目类型,再看当前最需要哪一步能力,可以按这条线记写代码前规划,写代码中构建和调试,写完后审查发布监控。第一类是开发与构建, 比如 build web apps, 适合做前端页面和网页应用。 game studio 更偏浏览器,游戏从玩法、原型到素材流程都能帮上忙。 如果你做移动端,就看 build ios x, build macos x, android x 还有 excel 这一组。第二类是代码写作与质量。 github 适合处理 pr issue c i 和发布流程。 code rabbit 更像一个代码审查助手,可以帮你看改动里有没有风险。 superpowers 适合规划 ddd, 调试和交付,重点是让 codex 按更稳定的方法工作。 codex security 则偏安全扫描,适合项目变大以后补上安全检查。第三类是部署和线上服务, virtual magnify render, cloud flayer 主要解决部署和托管。 superbase 和 neon post grass 更偏数据库和后端数据服务。 century vintage static 这一组适合项目上邂逅,看问题,看成本,做实验。所以新手可以先从项目类型出发, 做网页先看 build web apps, github。 做游戏先看 game studio 和 github, 做全站先看 build web apps superbase 或 neon, 再配 versa。 如果你最担心代码质量,就优先看 code rabbit、 codex security 和 sentry, 按项目类型选两三个就已经够用了。

兄弟们, codex 也算是用上了啊,我做了两个事例,第一个呢是把我平常拍视频这个脚本,比如这个 cds 视频,学会这三步,让它用这个插件呢,用这个插件呢,帮我来生成一段视频,它自动地去读,然后去区分画面,帮我生成这样一个视频啊,大家看下效果。 呃,我电脑没有连音箱啊,但它本身这个也没带音乐,可以自己去配啊,可以生成这种,就是比如说知识博主平常用的这种动效动画,这个还是非常有意思的。 这还没有过,没有调过啊,只是一遍生成的啊,我觉得这个画面美感是有的。那么第二个我做了个测试呢,是让他去读我们流量股所有的公众号,公众号的写法,然后格式、内容等等,然后把它打包总结成一个 skill。 然后呢,我做了个测试,我说假设某某领导来调研,你帮我来这个写一篇公众号文章,可以看到啊,写出来的效果我觉得和我们平常发公众号的效果是大差不差的, 这个是非常有价值的。目前我现在是 windows 系统啊,我如果是 ios 系统的话,它可以代替我的电脑去登录我的这种公众号后台去操作去写,这就非常有意思了。好吧,想了解更多 codex 这种内容和 ai 最新知识的,点个关注私信我。

今天我们会完成桌面板打开之后的第一次设置,那么我们就开始吧。第一次打开 codex 桌面板,我们要先把界面分成三块来看,左侧是项目和一些插件的入口,中间就是我们的一个对话框了,最下面有一个设置面 板管理。对,那么我们新手进来要先处理几件事情,第一个工作模式,第二个选举指令,第三个批准策略,第四个沙盒,第五个插件入口。 ok, 那 我们先进到设置里面看, 在设置里面左侧有十二个分类,包括常规、外观配置等等。第一次使用我们重点来看这几个,我们先点开常规,常规的第一项就是一个工作模作,开发项目的时候,我们一般选择适用于编程, 你选择了这个模式,那么 codex 会更愿意指示文件命令验证方式。如果你平时是以日常工作居多,比如说是以文字创意等等,那你可以选择用日常工作。在下面的权限区域,我们要来看一个重点是完全访问权限,这里记得是关闭的状态,如果这个开关打开之后, codex 可以 直接编辑更大范围的本机文件,运行网络命令,它的风险会明显变高,所以作为新手阶段而言,我们默认把它关闭掉就可以了。这里的速度可以选择是标准还是快速, codex 会基于跟你的一个整体对话,给到你一个相应的建议,当然如果用快速的话,它的套餐用量也是会增加的,那么我们平时用标准就可以。 那接下去我们来看第二个重点是个性化的,这个选项里面有两个,一个是个性,主要是选择 codex 回复的默认语气, 我这里选择的是务实,希望它能够简洁、专注和直接。第二个我们要去关注的是自定义的指令,这里的自定义指令要知道它是局工作规则,所有的项目都会读到它。所以新手我建议你们只要写八行内容就可以,这八行内容我会放在评论区,当然我自己的会 更完整更长一些。我的结构大概是包括使用范围与优先级通用的一个工作流,安全与合规,通用代码规则,验证与测试提交的规范,常见的项目命令工具,然后输出的一个文本规则。还有一些个人偏好,对, 我觉得大家一开始就用前面的这个八行就足够了,后面当你越用越多。你可以跟 codex 去总结你们经常碰到的一些问题,或者是你自己觉得 codex 经常会犯的一些错误,你把它整理成对应的规则放进去就可以了好吗?它有一个记忆的选项,目前是实验阶段,大家可以把起用记忆这个给开启就可以, ok。 第三个重点是配置,我们来看一下配置的页面配置我们来关注两个内容,第一个是批准策略,第二个是杀核设置。批准策略一般我们都会默认的是 on request, 它的意思就是说当 codex 遇到高风险动作的时候,就会停下来让你确认。当然这里如果说你是用 never, 那 就相当于一次执行到底了,不需要你的任何的批准,所以我建议新手都是用 on request 吧。沙盒设置这里它的默认是 workspace right, 它主要在当前项目里改文件,允许网络访问,这里就是默认开启,你可以把这里的批准策略理解成为它是一个确认按钮,哪些时候需要你来确认?把沙盒设置理解成为 codex 的 活动范围, 你给它框定了一个能够编辑文件和改文件的一个范围,它就只能在这个范围里去进行一个行动。我们再来看一个大家比较容易忽略的一个点,或者是比较容易混淆的一个点, 就是在桌面面板的左侧有一个插件,这里的插件它其实包含了 skill, mcp 和 connect。 skill 是 工作流,是我们的一个技能文件,它里面包括一些代码审查、做表格、生成 ppt 等等。同时像 mcp 就是 codex, code 等等。 connect 呢,是第三方账号的一个连接, 比如说像这 eraser, git, a lotion 都会有,所以这里的插件其实它就是一个能力包的一个合集,像 m, c, p, skill, connect 这些都是它里面的具体的能力,大家根据需要去进行一个安装就可以。 ok, 那 我们再回到设置里面剩下的几个,我们只是来做一个印象, 比如说像外观,你可以基于自己的系统去定义主题色,浅色或者是深色,当然这里有一个隐藏选项,它有一个宠物,看到了吗?这个就跟 cloud code 是 一样的,就是最近出了一个宠物,当你选择唤醒它的时候, 你看它的右下角就会出现这样的很可爱的一个宠物形象来陪伴你头顶。 it 主要是来管理分支的,像浏览器使用和电脑操控,主要针对的就是 browser use 和 computer use, 在 我们后面也会去讲到像以规章和使用情况,就是你本地的一个任务的一个管理和一个用量的展示,平时经常的去看就可以了。

codex 里有哪些好用的插件?别从名字开始,按任务来选。做网页验证,用 browser 和 chrome, 一个看本地页面,一个接真实登录态 做文件交付,看文档表格演示和 canva, 它们能把想法变成可检查的文件。 做视频和创意,用 react 写视频,一个适合 html 动效和字幕 做沟通和工程流程。看 gmail 和 superpowers 邮件代办调试测试都能接近同一个工作台。 最后的原则很简单,看你卡在哪一步,让插件承担最耗时,最容易出错的那一步。

大家好,今天我给大家介绍一下如何用 codex 做一个 ppt。 ok, 我 们打开 codex 以后,在里面输入提示词,点击发送,我这个网有点慢。 ok, 可以 看到它在思考,从这个提示可以看到它并没有直接开始干,而是先去调研现在这个 codex 啊,有哪些功能啊,再去做 ppt。 并且它图片这块也说了会按照我的流程,通常可以看到它用了一个 skill, 然后你看这一点,它说 了它会把这个能力拆成功能和岗位价值两条线,避免只适合工程师看,可以看到它还是挺产品思维的。 ok, 可以 看到他说了他并没有在环境里没有找,没有找 open api 的 key, 因为我这边我并没有购买付费,所以没有配这个东西,大家如果买了可以配一下,效果会更好一点。然后你可以看到他并没有说就直接糊弄,而是自己去找现有的限制下面最好的一个方案。他说了会用这个官方截图,要清爽业务视觉来做这个 ppt, 他 又说他缺 ppt 的 一个 ppt 的 库,然后又下载好的官方截图和配置的内存元素来去做。 ok, 可以 看到他的自主性还是挺强的,他并没有说遇到问题就直接嗯趴下直接去糊弄,而是说自己去主动的去寻找这个解决方案。而且他的一个思路是超出我预期的,因为我之前只会想到说 要么就是网上下载图片,要么就是说用麦二去生成图片,但是我并没想到说去官网截图这个思路,但是这个 quick 他 就主动帮我想到了这样一个思路,这点还是挺值得夸奖的。好的,可以看到他已经安装好了这个 k p t 的 脚本文件,已经开始生成这个 ppt 了, 而且可以看到它这个利用这个脚本升直 b t 的 一个进度。你看它还会说把这样一个现在不能实现的一个方案,就是用 image two 生成图片这样一个方案,单独把提示给我存起来放一页,这点还是挺贴心的,我让我自己去做,我肯定想不到这么细致。有一点可能需要注意一下, 在扩展里面调用这个 m g two, 是 不是需要你这个 m g two 的 这个的 open api, 这个需要开通这个复配是不是有免费额度现这块我不确定的,大家可以去摸索一下,有可能免费账号也会有一些额度。 ok, 可以 看到他告诉我这个 ppt 已经生成了,已经放到桌面了,他还挺认真的,挺负责,他说他会再做 一把 ppt 的 一个体检,也就是说再去检查一下这个 ppt, 看这个有没有什么问题。 ok, 他 告诉我这个体检通过了。嗯,为了就更稳一点,他还会再导出几个预览图,看一下是不是有空白或者图片丢失。 ok, 可以 看到它最终已经做完了,然后还还告诉我们这个来源,并且贴心的在这里面给了一个打开的出口。那我们在这个文件夹里面,我可以看到它是在桌面上的, 然后我们双击打开,看这里面效果怎么样,我们看一下大家感觉这个效果怎么样呢?我感觉还是挺好的, 那年你看他标注了,这是截止到五月十九号的官方资料整理。 ok, 今天的视频就到这里,谢谢大家。

我今天用 codex 加 remotion 这个插件跟风去做了一个视频,然后我的文案是之前小红书的一篇文案,呃,提示词没有过多的一些修饰,就是让它根据这个文案去生成五分钟的视频,呃,视频已经做出来了,大家先看一下, 没有统一模板,我行如果没有拿到这些真实内容,就只能靠语言习惯去补全答案。第一个坑是数据根本没位进去,我行查不到财务制度,就会捏造制度条款查, 然后我们其实能感受到他的整个动画效果其实没有那么的漂亮,但是这也是他的一个非常大的优点和特点。 其次呢,这个语音好像也非常的僵硬啊,倒着说哈,这个语音其实它是调用的 mac 里面的一个本地 tts, 然后大家知道苹果本来做这些都,嗯,现在就那个样子,所以确实效果也就那样。但是我想说的是,不管是这个动画还是苹果自带的这个语音,恰恰是在 remotion 这个工作环境里面,它是一个非常大的一个优势。为什么呢?比如说我刚才这个 视频做出来之后,我想去啊替换掉他的这个麦克自带的 tts, 然后我就非常简单的去和 codex 告诉他,我说这个声音听起来非常的下头好,然后我现在有一个啊纤维的模型想用,然后 api 的 啊密奥,我告诉了他,他就直接通过我这句话把刚刚看到的这个视频替换成了一个新的有配音的这个视频效果,大家来感受一下,差异非常大, 真正麻烦的是半级固化数据,比如用户上传的私有知识库、公司规章、经营总账,各种制度文件格式各异,没有统一模板模型,如果没有拿到这些真实内容,就只 好这个是新的视频配音,那么其实在这个视频和这个视频去做对比的话,这两个视频除了配音不一样之外,其他的动画其实都是一模一样的。但也这也是为什么我觉得非常非常棒的地方,因为大家不知道发现没有,不管是这个视频里面的 这种文呃,图案文字,还是说我们刚刚去啊生成的新的 t t s 去给他当配音,他把每一个视频里的要素都变成了一个组建,这个其实也是 motion 工作的底层, 它其实并不是像传统的纹身视频、图身视频的这种软件,也不是说用的这种啊,更传统的一些生成视频的方式, remotion, 它本质上生成视频的逻辑,它就是去调用 ts、 react 这种前端的组建进行拼接, 那么就意味着我对于某一个组建如果说不喜欢不满意的话,我是可以换掉它的。如果我们再往后面去学习,其实我们是可以发现, 比如说在这些时间点上面,它生成之后哈我就可以告诉他我在啊,几分几秒啊,或者说在某一个固定的位置,我想去插插入进去什么样的文字,然后插入什么样的 react 组件,然后想去插入什么样一些模板,甚至于把我预先设置好的 转场的图片呀,视频啊都放进去,而且我直接可以通过语言告诉我需要在哪个时间点去做什么,它其实整个运行逻辑 其实是有点像 skill, 就是 把它工程化、参数化啊,但是呢,就是它比 skill 更强的点是什么呢?就是你可以在一个自然语言交互的过程当中,基于一个现成的视频去告诉他一二三四五六七八九五要去改什么, 而不是每一次就要去写一个新的 skill, 你 直接可以用语言去进行主键的替换,所以这个我认为是 codex 加 remote 有 非常棒的一点,因为 他把这个视频的所有的要素都变成了主键,不管是你看到的文字、图片、视频、配音都可以替换掉,真的非常赞。