大家好,欢迎来到玲姐说 ai 这期视频,跟大家分享一套本地 tts 声音克隆和长文本配音能力的构建方法。 通过这个能力啊,我把自己的声音封装成为了 codex 可以 调用的生产力模块,它不仅可以读短句,还可以流畅地读长文。可以用它来做播客,也可以用它来做视频的旁白, 而且它可以服务于我正在构建的整个内容工厂的生产系统。先给大家分享一下我用这个本地的 t t s 的 能力生产出来的播客和长文本。这个是克隆我的声音制作出来的一个书本介绍的播客, 不要问我够不够自律,先问我现在在哪个档位,我需要升档还是降档。接着书里还有第二个很重要的观点,脑力工作不能按流水线节奏来安排。 这里是这本书最适合今天职场和创作者的一点,也是很多人最容易忽略的一点。 工业时代喜欢稳定、匀速、连续,因为流水线生产的是数量,可是高质量脑力工作生产的是判断、想法、创造和解决方案。打开 ai 之前,就可以拿它当一张小流程卡。 传统工作的底层想象来自工厂,稳定、匀速、连续、可复制,这个逻辑适合生产标准零件,但不适合生产好想法,写作、研究、决策、创作、学习都不是流水线。 你不能要求大脑从早上九点到晚上六点像传送带一样匀速吐出,高质量判断,超高效。里有一个很实用的建议,这个是克隆我的声音所生产出来的我的桌面伙伴,桌面宠物的一个配音, 救命搬家可以,别把我甩飞了,等等等等,我要被你晃晕了。 这个是用我的声音来讲解王国维的人生三境界,这也让我想到我们每个人去追寻人生理想和热爱的过程。就像王国维说的人生三重境界,第一重是昨夜西风凋敕树, 独上高楼,望尽天涯路。这个时候我们表达自己的向往,找到自己的出发点,找到人生的风帆,也找到自己的坐标。第二重是衣带渐宽终不悔, 未衣消得人憔悴。在追寻理想和热爱的过程中,我们学会牺牲,学会付出,也学会接受现实。在这个过程中, 其实我们的人生也像一个商增的过程,这个过程也是人成长的过程。 这个时候每个人的心境可能都会发生一些变化,但是内心的热爱以及对理想的坚定是没有变的。第三重是众里寻他千百度, 那人却在灯火阑珊处。现在我用这套能力所生产出来的声音文件质量都还是比较高的,都是处于一个可用的状态。 一提到配音,大家可能想到了很多云端的 t t s 的 模型,确实云端的 t t s 的 模型也挺好用的,但是它背后有个问题,就是成本的问题。 而且如果有的人在进一步考虑,可能觉得隐私和稳定性也是一个痛点。很多普通的 t t s 虽然可以用,但是它不能够读长的声音文本,而且它的这个声音啊,和博主本人的声音也不一样。 这期视频啊,我就分享一下整个的 skill 的 封装过程和它的一些关键的点在哪里。我的这套 t t s 的 skill, 它本质上是一个本地配音的能力层, 大家拆解下来我刚刚讲的那些使用场景啊,实际上它有以下几个核心的能力要素,第一个它能够实现文本转语音。第二个,它能够实现声音的克隆,给它一段声音参考,它就能够复刻这个真人版的声音。第三个,它能做长文拨课 很多语音啊,比如说 macos 自带的语音系统,它的声音呢就比较的机械化,没有那种真人感,而且它说短句还可以,一旦说到长文啊,就是那种很机械的声音,必须能够说长文,它比较自然,也就带来了第四个点,它会合适的语音分段, 就像人去理解这些话,像我们平时说话这种自然段句一样,进行合适的语义分段,让听众能够很好的接收这个音频的信息。隐身到第五个能力板块,就是它生成完成之后,它可以进行自解, 局部不自然的地方,它能够进行局部重申,完成整个声音文件的渲染。 所以这个其实就是这套 t t s。 能力背后隐藏的能力模块。大家可以看到这张图,这张图就是这套 t t s。 底层的路线图, 这里呢就是它应用的场景,大家可以去增加场景,这个呢就是它的整套的 context t t s 的 skill, 它可以用于生成短文本,也可以用于生成长文本。 它关键上用的是说不依赖云端的 t t s。 的 api 接口,而是使用的这两个 m l x beach 和 fish s 二 pro, 一 套本地的云系统,再加上本地的声音克隆的目录,最后经过处理,生成本地的音频。 其实安装的过程很简单,就记住一条安装主线,本地工程,把文件数在空目录上面构建出来,再加上本地的环境, python 在构建安装我刚刚讲的那两个模型, m l x 和 fish s a pro。 真正难的是其中一些容易翻车的点。第一个容易翻车的点就是这个声音的克隆。怎么做声音克隆呢?并不是说随便丢一段音频过去 最好你的声音本身的质量要高,而且最好你的这个参考音频啊,嗯,时长不要太长, 建议十二秒左右的短参考,长参考只作为备份。而且你给到的这个 reference text, 也就是对应的这个足字稿,必须和音频是足字对应的。 你给到的这个参考音频是单人声,没有背景音乐,而且没有加混响的,是你想重点参考的这个文本,所以这个参考的音频,它是决定你的课容上限的。给你想重点参考的这个文本,所以这个参考的音频,它是决定你的课容上限的。给大家好,欢迎来到玲姐说 ai 这期节目啊,是玲姐说 ai 频道开播一周年的特别节目,我给大家讲讲两个桂林女孩的故事。第二个非常容易翻车的点就是长文断点, 其实这个是非常重要的点,一开始我觉得只要把每一段切得更长,声音会更连贯,但实际上我发现它容易读着读着就断了。 你在做这个 t t s 文档的时候啊,它的这个分段不是说越长越好,而是要按人的说话的气口来切,每段最好只要一个意思,短一点,稳一点。而且你可以和 ai 沟通说, 我希望它能够按照人的这种口播或者是表达的方式去切,而不是完全按照语义来切。所以在优化的时候,你就需要强调说这个 t t s。 长文本的构建,它需要基于口播的这个特点去优化, 而且是要生成羽翼的短句。并且还有个重要的点,就是让它生成完成之后去逐段地检查,它,自己去审核自己。这里其实就是有一个很重要的技巧, 这个点不仅是在做这个 t t s gears 的 时候会用到,就是我们日常的工作中,我们很多的内容不一定要人去审核,当然人是最后的那个阀门,那个闸门, 但是在给人审之前百分之八十的工作,你可以先让 ai 审,让 ai 自己审查到他百分之八十满意之后再交给人来审,这样子也在提升 ai 的 审查能力,而且是降低人的工作量的。 所以在这个能力构建过程中,就是包括我说的这个长文本的过程中,我是让这个 t t s。 生成完成之后去审核的,它自己审查一遍,检查一遍有不有这个切断的语义,这个不自然的地方,让它自我审查,然后把这个内容修复掉。 我们先来听一下断点修复前的生英文稿,是这样子的,这也让我想到我们每个人去追寻人生理想和热爱。第一重是 听到没有,那个第一从前面搭了一下,他实际上就是出现了一个断点,而且文稿出现了跳跃,我们再听一下修复后的声音文稿,这也让我想到我们每个人去追寻人生理想和热爱的过程。 就像王国维说的人生三重境界,第一重是昨夜西风凋敕树 独上高楼。你看在第一层前面那一节画,它是完整的,而且是没有一个单这样跳跃的,它就完全是顺滑的一个状态。最后大家听到的诊断就是修掉了头尾这种多余的静音,然后把羽翼的停顿加上, 再把它整合成一个整集连贯的一个长文本的音频。这些操作完成了之后呢,你就可以和 codex 说,把上面我从文本到最后音频生成的整个过程,帮我封装为一个我可以长期附用的 skill, 可以 取名叫 t t s 或者是别的名字, 这样这个能力就可以反复地使用。那这个 t t s 的 能力呢?比如说我就附用到了我之前给大家也做过视频讲过的 codex pad 它的语音包。当然我在用这个 t t s 能力制作我说的那个 codex 的 宠物的语音包的时候,也遇到了一个坑,就是 当时我是想用它来给我实时的播报项目进度,同时使用我自己的这个声音文档。但是这里的坑就是 我如果说这个桌面宠物每次任务都实时的调用和复刻我的声音,它会比较大的占用我的系统的内存,太卡了,因为它是实时调用渲染的,因为有个克隆的原因,所以我当时的做法就是 提前生成了一批基于我声音的固定的语音频,运行的时候只播放不生成。我讲宠物这个例子呢,实际上是在讲我们在运用这个 tts 的 本地的 skill 的 能力的时候,我们也要基于场景去进行合理的定制。 这期视频表面上我是在讲 tts, 但本质上我是在讲如何把自己的声音变成我们 ai 内容工厂中一个可调用的模块。 当我们用其他的生产能力在封装为这样可调的模块,也是类似的思路。大家如果说是我的老观众的话,会发现我最近的更新频率有一点点降低了。一方面呢,确实啊,线下的这个项目和培训的事务可能比较忙。 另外一方面呢,我花了比较多的时间在升级我的生产力的系统和模块。我认为一个好的 ai 博主应该把自己的整个内容生产的过程也是 ai 原生的,就是用 ai 原生的能力 来深层讲解 ai 相关主题的内容,我认为这是一个好的 ai 科技博主 应该要做的事情。所以短期内你看到可能我的更新频率降低了一些,但是从长期来看,你会看到我的内容的生产频率和更新频率未来会有更高程度的增长。当然,作为一个碳基生物,我会给我的频道赋予更多的生命力和活力, 不会让大家觉得这是一个纯粹的 ai 的 频道,它是 ai 原声,但是它是 ai 原声在博主的创意和生命力的下面 构建出来的一个基于 ai 主题任何相关大家觉得感兴趣的内容的这么一个频道。同时呢,我也在我的 codex 上面基于我整个 tts 的 构建的过程,把我的整个的内容抽取了出来,形成了一份这一套 tts 能力的总结和从零开始复刻的指南。这 一个指南我会放在我的同名公众号里面,大家可以去直接使用,把它 copy 下来,放在自己的 codex 里面激活它,能够快速地把这套能力复刻到你自己的电脑上面。 今天的内容就分享到这里,如果觉得还不错,记得关注我的频道,给我的视频点个赞。打开你的小铃铛,我们下期视频再见啦!拜拜!
粉丝5530获赞1.6万

好,这节我们一起来看一下 codex 怎样接入 deepstack。 因为有时候我们的默认的模型其实并不够用,所以我们会去接入外部的模型,像 deepstack 这样的模型,那我们来讲一下整体的流程,那首先最后实现的效果就是这样子的,我们可以通过在 codex 里面去调用 deepstack 的 模型。 好,那我们来看一下整体的步操作步骤。首先我会给大家推荐啊,就是我这里呢啊编辑了一个启动的脚本,那这个脚本的作用就是可以帮助我们直接将这个 codex 的 底层模型切换成 deepstack 模型。那我们先来看实际效果,再讲实际的原理。那通过这个 start 模型,如果第一次使用的话,建议大家去加入一个授权的操作, 然后去欸把这个授权授权完之后,我们再启动这一个脚本。好,启动的时候它会去修改我们当前的 codex 的 啊配置,将它转发成 github 的 本地的啊 api key, 然后我们来试一下。 好,可以看到重启完成了,那我们再打开我们的 despic, 那 这时候我的新 despic, 我 们就可以看到在我们的这个右下角变成了 despic 模型,对吧?那我们还可以把它回滚成原来的配置。有时候我们可能我们的额度恢复了,对吧?那这时候我们可能需要哎,变回原来的模型,所以就使用另外一个脚本 notebook, 对 吧?我们就直接使用 notebook 也是一样的,我们把整个流程跑通啊回滚,那回滚的话相当于重置嘛,重置成我们最早之前的,那我觉得这种方式是最好的,最友好的,对于我们来说是白盒的脚本代码都在我们手上,我们并不需要去关心它是一个黑盒的操作,然后有人去获取我们的 api key, 你 看是吧?恢复了一模一样,对吧?好, 我们来讲下核心的原理啊,其实核心的原理非常简单,我们来看一下,那这两个脚本的作用,主要就是修改了 codex 的 config 的 这么一个文件,建立了这么一个啊, deepspec 的 本地 property, 然后接收到了我们的这 codex 的 请求之后,自动呢将它转发成 deepspec 的 api, 然后最后呢再把 deepspec 的 结果进行返回, 返回的过程当中呢,我们可以看到整个流程是非常流畅的,并且呢我们通过 deep stack 去管理了我们整个的这个上下文,对吧?嗯,就通过这个 codex 去管理了我们整个 deep stack 的 上下文啊。最后呢再给大家,嗯, 讲一个风险啊,就是很多时候我们通过这种 c c x 和 c c c 外驱的方式也可以建立这个啊 deep cache 的 连接。但还有一个问题就是它的流程是怎样子呢?就我们启动一个 c c x, 就是 这个代理中转,比如说我们开启一个 c c x, 对 吧?它配置一个 api key, 但这个时候我们有时候可能从外部的渠道拿到这个 c c x 的 包, 有时候他会存在一些这个上传的风险,比如说你在这里填一个 key, 那 我可以把你的 key 呢直接获取到你,比如说这里,对不对?你获取到这里是给大家演示啊,这是一个风险站点的演示啊,确实可以拿到这个 key, 而且并且还会有通知,那 为什么呢?因为这个时候我们在这里形成一个 key 呢,实际上他会发一个请求 pos, 请求上升到别人的这个网站上,所以大家可以通过抓包工具可以去看一下,对吧? 或者说我们再通过这个 c c c 外旋, c c c 外旋,有时候我们也会有一些不法分子去打一些包,对吧?这个包对我们来说是黑盒的,那我们直接使用这个包呢,往往会出现一个情况,也会上传你的 key, 所以 会存在一个风险的啊, key 的 暴露对不对? 是吧?那这时候呢,黑客的这个黑盒的组建就带来了比较大的隐患,那如果说大家使用啊,像我这种脚板的形式呢,是属于白盒的,大家你可以看到,对吧?所有的代码这里都可以看得到,是不是所有的流程都可以看的到?你直接问一下 q 代码这个道理是不是存在上传 key 的 操作,那就可以看出,哎,他是一个白盒的操作, 黑盒打包好的,你是不是就没办法判断对不对?所以呢我建议大家使用这种方式啊,那这个方式呢?嗯,首先大家会得到一个这样的一个 呃,这样的一个文件夹,对吧?这样一个文件夹,然后呢执行第一个脚本啊,就是这个 start, 它会帮助我们去安装好配置的 python 环境,那因为本质来说,这个脚本呢,是通过一些 python 环境去操作的,对吧?那你切换完之后呢,就直接变成了 python 模型,但是呢,你使用的时候有两个步骤,第一步呢是把它 下载好这个啊切换包,然后呢这个时候我们干嘛呢?我们会得到一个什么?得到一个这样一个文件,这个 type c 的 key, 所以 我们就把这个东西呢给它复制一份,对吧? ctrl c, 对 吧? ctrl 加 v, 那 把这个后面的这个啊后缀给它去掉,你看会去掉这个音,这个点 copy 的 后缀。 好,这就给大家的一键打包包好,然后这时候我们在这里呢改成我们自己的 key, 然后再去执行我们刚刚前面说的这么几个脚本,比如第一个是吗? start 对 吧?回滚呢?就执行这个 rebook, 对 吧?那通过这样的方式呢?那就,哎,直接完成了我们整个的这个 deptych 的 切换。好吧, 原理也给大家讲清楚了,其实我觉得,呃,这两个脚本呢,主要就是这两个功能,第一个是一键切换 desac, 第二个是一键回滚默认配置,那帮助我们去切换,当然这个脚本还有很多优化的点,我觉得主要就是,哎,我们可以切换成这个小米的 mini 模型,对吧?还有我们的 kimi 模型,对吧? 那主要就是这些点。好了,那以上就是本期视频的全部内容了,我是小刘,我们下期再见。

喂,哈喽,兄弟们,音量给它调到, 那么今天这个必听音乐一点六版本做出来了啊,不得不说这个 codex 还挺好用的啊,就是额度太少,你们需要装的话, 我已经把这个一周的已经用到只剩百分之四了。 呃,对,然后如果你们安装的话有什么问题可以安装 codes, codes 有 什么问题可以找我啊,或者需要国外手机号的话啊,可以私信找我,好吧,然后我们来演示一下我们的项目, 那么它主要是优化哪些方面呢?这边呢?我们列表在这啊,那么新加的是什么功能呢?是这个按钮 切换音乐格式化,那么静止的状态是这样的啊,它比较慢,有这三个唱片律动和循环,那我们播放一首, 这时候这个他就会转,然后吐出这个音符啊,然后这边呢是这个可以暂停播放,给大家看下区别。暂停播放,然后我们加了一个悬浮播放的窗口 啊,悬浮波浪的窗口,那么他就是可以你在,你在你的边角,你可以给他任意的拉伸放大啊,对吧?你可以竖着拉,横着拉,对吧?你可以找一个你喜欢的样式,然后给他放到啊任意的 界面,然后你可以在这边就是进你的列表操作,可以切割吗?对吧? 然后还可以那个换你的,你自己创作的啊,你自己创建的那个歌曲的列表啊,然后还有隐藏,隐藏就回去了,是吧? 然后我们在这边可以怎么样返回呢?我们就再点击一下这个,或者点这个返回搜索啊,也都可以返回,或者呢你怎么样?你再搜一个, 再搜一遍啊,他也会自动跳出来,然后这个播放按钮我也给他升级了一下。啊,就是他点击会有这个点击的动画,对吧?会有这个点击的动画。 以前这个动画他那个,呃,不知道怎么改,但现在给他改好了啊,还有其他什么? 其他倒没什么了啊。对,哎,我这边怎么还显示一点五啊?那我代码没有改好啊,实际上是一点六的版本啊?对,实际一点六的版。

今天教大家三分钟安装 codex, 并且部署 deepsafe v 四的模型啊,全程是不需要魔法的,就可以体验最新的 ai 智能体了。首先输入网址 b i n g 点 com 啊,就是必应的搜索网址,然后选择这个国际版, 然后搜索 codex。 弹出的第一个就是 microsoft apps 的 网址啊,我们点击进去就可以点击下载了,然后过程中不需要任何的操作就可以自动安装好。 然后第二步呢,就是说,呃,我给到大家的 codex 加加,它的全程呢,也是无脑安装即可了。安装之后呢,我们需要打开 codex 加加的这个管理工具, 点击供应商配置,然后开始配置我们的 deep seek 啊,首先呢,点击添加供应商,呃,这个名字随意说啊,然后我们把这个连接模式调成纯 api, 接下来呢,就要去 deep seek 官网去搞 api k 了啊,这里输入三 w 点 deep seek 点 com, 然后出来网址。之后呢,我们就要点击 api 开放平台,开放平台呢,找到左下角的接口文档啊,接下来就是复制 base url 的 网址到 codex 加加里面了,呃,下一步呢,就是很简单,我们充值个十块钱, 呃,充值个十块钱我们就可以配置 api keys 了啊,这里也是啊,随便输入任何的名称啊,复制我们的 api key 到我们的,呃, codex 加加里面啊,这里需要注意的一点呢,就是说, 呃, codex 和 deepsix 上下游协议不一样啊,所以说需要转化成 chatcomplements 的 这个模式,呃,随后保存,然后点击右上角的重启 codex, 注意哈,后面每次打开 codex 的 时候,都要通过运行 codex 加加的这个管理工具,从里面去打开这个 codex, 从这个位置去启动哈,然后首次配置 deepsafe 的 时候时候呢,需要花一段时间才可以,请耐心等待。 进入主页面之后,点击设置沙盒,然后我一般都会设置完之后设置啊,完全访问权限。 还有一个很关键的一步啊,就很多人在这里都忽略了,就是看到右下角了吗?我们去选择 deepsafe 的 模型,这里可以选择 flash 还有 pro 两个版本。 flash 这个版本呢,是无法识别图片的,那 pro 目前测试是可以的,但是有些人说也是不行,这样之后呢,我们就可以真正的开始使用我们的 codex 了。

家人们,扣代词现在可以直接做视频剪辑了,我只在扣代词里敲了一行字,装上嗨客 friends, 敲键一句话就能生成想要的任何视频。动效、转场、字幕配音全自动,不满意继续打字改就行,秒出新版本,还可以批量生成。下面这个视频是我让扣代词生成人类编程史的视频,太酷了!又会扣代,你就真 正打开了 ai 内容创作的新世界大门!我强烈建议所有自媒体人、内容创作者都要学会扣代斯这套玩法,真的能把效率直接拉高十倍!关注我以后分享更多玩法!

今天这期视频我就带大家完整拆解一下 codex 前端的一个交互界面,然后足够去讲清楚每一个功能按钮,它的作用,切换逻辑以及不同场景下我们该如何去搭配设置。学会之后你就能精准把控工具的权限,按需调配参数,把这款智能工具用出最佳的一个效果。 首先我们来看一下 codex 它前端交互界面的一个整体布局,那么在左侧呢是我们的一个菜单栏,在这里我们可以去发起新对话,搜索历史对话以及安装插件,还有就是设置自动化的一些任务,以及和移动端去进行一个打通,那么在这一块呢,我就不做过多的一个讲解。下面是我们项目展示一个区域,我们可以把自己的每次对话都 归类到不同的这样一个项目当中,便于我们后续的一个调用和查看。好,那我们来重点看一下在对话框这里的一个参数设置。 首先我们来看一下权限设置,这里分为四种方式,第一个是默认权限,那这个方式的话,对于我们来说他的安全等级是最高的,风险是最低的。如果说我们是刚开始使用 codex 的 话,那建议我们就直接选择默认权限就可以了。那第二种自动审查的话呢,他是在 codex 运行一些有风险的 任务的时候,他需要我们人为的去授权。第三个就是完全访问权限,那这个方式他的风险等级是最高的。 最后一个是自定义权限规则,我们可以在这个文件当中去自定义,我们对于 codex 在 运行任务的时候必须要遵循哪些安全的一个 原则,这是在这一块。第二个呢,我们是要去选择它的一个智能程度,那这里从低到中到高到超高,它的这种运行速度是越来越慢的,但是它的智能程度是越来越高的,所以在这里啊,对于我们普通 日常办公来说,我们就直接选择中就可以了。还有就是下面的模型,我们可以直接选择这个 g p t 五点五的一个模型。在速度这里呢,我们 建议大家可以直接选标准就可以了,所以呢这里的参数就直接大家在刚开始使用的时候,在权限这里就直接选择默认权限,然后呢智能这里选中 g p t 选五点五的模型,速度选标准就可以了。在下面我们可以选择本次对话 沉淀到哪一个项目当中,这里我们可以根据自己的实际情况选择,那么在后面的它的一个本地模式以及它的一个分支,我们直接默认就可以了。 接下来再给大家分享一个比较重要的 codex 啊,任务执行的一个逻辑,那分三种场景,第一个场景就是我们给他一个任务,他已经在执行当中了,但是呢我们发现之前给他的指令缺少了一些这个要求, 这个时候呢我想加入一些新的要求,让他在输出的时候也要考虑到我新加的要求。那比如说以我刚才这里的为例,我让他帮我整理成一个 word 文档,但是呢我缺少了一个要求,我可以直接在这里添加进去, 直接点击发送。然后呢我们如果想他这一轮的输出,把我这个需求考虑进去的话,直接点击引导,那他就会直接把我新的这一个要求给考虑进去,这是第一种场景,第二种场景就是当他这个任务执行完过后, 我想要它继续执行下一个任务,那这个时候呢,我们就直接在这里输入新的一个任务要求。 好,这个时候我们就可以不用点引导,它在执行上一个任务完成过后,就会自动去执行帮我生成一份 pdf 的 这一个任务。那这里就讲到两个场景,第一个是对于我现有任务的一个补充,它可以把我新的要求考虑进去。第二个呢就是我 给他再给一个新的要求,让他在上一个任务执行完过后,继续去执行我的下一个任务。还有一种场景就是希望他并行去执行我们的任务,那这个时候呢,我们就只需要最简单的在这里去打开一个新的对话, 然后点击提交就可以了,你会发现这个时候系统他会去并行执行我不同的一个任务,那么这个就是我们 codex 在 前端执行任务的时候,他有三种不同的一个方式。 好,那么本期的视频就先到这里,今天给大家分享重点内容就是如何去设置我们的安全等级,选择智能程度以及我们的模型和我们的一个速度。大家有任何疑问也可以在评论区留言, 后续我会推出更加实,后续我也会持续推出在办公场景下一些好用的 ai 使用小技巧,欢迎大家点赞关注加收藏。

codex 虽然功能强大,但是使用 openai 官方的 token 渠道,性价比非常低,这里教大家如何将 codex 接入到国产性价比之王 deepsea k。 平时就把轻量化的任务交给 deepsea。 首先需要安装几个前置的工具, 第一个 node 点 js, 直接搜索官网,点进去,选择自己对应的版本下载即可。下好后一路下一步安装就行。 第二步安装 c c x 和 c c switch, 这俩因为要去 get 掌,这里我就把安装包放简介了,大家自行领取下好安装包后安装。先打开 c c x, 这个 ev 是 环境配置文件,可以用记事本的方式打开,这个密钥是一二三四五六记一下, 然后打开运行程序,把这个管理界面的连接复制到网页,打开, 输入刚才那个密钥,一二三四五六,可以把它切换成简体中文。然后我们先不管它,打开 deepseek 的 官网,点这个 a p i 开放平台,这里大家用自己的账号登录,然后点左边这个接口文档,把这个余额要地址复制一下,然后回到 c c x, 点上面的 codex, 再点添加渠道,在上面粘贴一下 y o r l 地址。接下来回到 d p c 点这里的 a p e k 点创建 a p e k 这个名称,随便填点创建 这个 a p i k, 大家可以自行保存一下,要记得不要暴露出去,不然别人用你的 api 用的就是你的钱。把它复制下来,粘贴到 c c x 这里, 然后点右上角的详细配置,把这个服务类型换成 open ai 下拉,把这个模块化非常键给打开,然后保存配置,接下来再打开 ccc 位置, 一路下一步安装即可, 安装完成后打开它渠道,选择 open ai 这个点右上角的添加,选择自定义配置, 下面供应商名称随便填一个 a p e k, 填一二三四五六。然后这个 api 请求地址,我们回到 c c x, 把这个 api 地址复制过去, 点这个获取模型列表, 就能看到接入的 deepseek 了。选择模型下拉,把这个百万上下文窗口打开,然后保存配置,并且用它。 接下来就可以进入 codex 了。国内直连肯定是有一点慢的,耐心等待一下, 我这里自动登录了,退出重新登录,登录时选这个,使用其他方式登录, 然后输入刚才配置的一二三四五六。可以看到模型这里已经是自定义了,也就是在 c c c 区里配好的 d p c k。 正常的话这里就是 g p t 五点五。当然如果要正常使用的话,肯定是要给 d p c 可充一点钱的,不然就会出现这种五零三报错。最后提一嘴, 如果你有条件的话,还是建议使用 g p t 原声的,肯定是要比我们接入 d p c k 好 用, d p c k 只是胜在更便宜而已。好了,以上是本期全部内容了,我们下期再见。

ai 编程工具这东西吧,真的是风水轮流转,最开始大家在吹 carson, 后来 carlo 的 大火,而这次轮到了 colex。 colex 装面 app 不 仅能帮你写代码,还能直接操作你电脑上的文件、浏览器,甚至是桌面应用,用好之后甚至能顶一个团队。 本期我会从 colex 安装到核心特性,用十多个实战案例手把手教你玩转 colex。 不管你是想用它来编程、开发、办公提效,还是搞一些好玩的创作,看完这期都能直接上手。那本期教程的文字版,可以在评论区获取干货秘籍,建议先收藏,找着安静的地方慢慢使用。 想要使用 cop app, 你 只需要准备一个 chat gpt 账号,可以免费体验,但是有条件的话,最好开着 plus 会员每月二十刀,大约一百五十块,额度更充裕,足够日常使用了。 那有了账号,直接去官网下载安装酷贷 app 就 好。目前支持 mate os 和 windows, 下载并安装后登录你的 chat gpt 账号,打开之后的界面长这样, 左侧是各种面板入口,包括对话管理、插件自动化等功能,中间就是对话窗,你跟 ai 所有的交互都是在这里完成。跟平时用的 ai 聊天工具差不多嘛,还挺清爽的,不像传统的编程 ide 那 么复杂,上手没有门槛。接下来我们直接开始使用, 跟你用过的其他 ai 工具一样,在对话框里输入内容发送,就能开始聊天了。适合处理一些简单的日常工作,比如帮你查资料、总结内容、规划方案。 我让他帮我查一下今天有什么 ai 编程方面的热点。 cadets 会自动联网搜索最新信息,然后帮忙整理总结,这下不怕错过新资讯了,这只是开胃菜。 cadets 真正强大的能力是操作你本地的文件和电脑。下面我们试试 点击左侧的项目入口,选择一个本地文件, ai 能在这个范围内读取和操作文件。 比如我选择了我的下载文件夹,里面有一堆不知道什么时候存下来的大文件。在对话框底部,你可以看到权限模式的选项,这里有三个选择,默认权限, ai 可以 读取和编辑工作区的文件,需要额外权限时会主动问你。自动审查是 ai 会自动帮你审查操作。 还有完全访问, ai 想干啥就干啥,不会弹确认框,建议新手直接选自动审查,既省时又省心。 选好权限后,在对话框里输入提示词,然后你就能看到 ai 开始工作了。它会自动执行终端命令来扫描文件,分析每个文件的名称和大小。最后给你一份清晰的报告,列出哪些大文件占了多少空间,并给出清理建议。 那我主打一个听话,就让 ai 帮我删除没用的预览文件吧。最后成功帮我节省了六点八 g 的 空间,效果不错吧。但如果我让 ai 删除一个工作区外的文件呢?会发生什么? 试试看,在当前工作空间开启一个新对话。比如,我让 ai 帮我删除鱼皮新书出版目录下的所有文件,可以直接把这个目录拖拽到对话框中,然后执行任务。 如果你选择的权限是默认模式, ai 想删除文件的时候,会弹出一个确认框,问你同不同意,防止 ai 搞乱了你的电脑。 但由于我选的是自动审核, ai 自己完成了审核并批准,省去了人工操作的麻烦。这样一来,你完全可以把拖带子当成你的私人文件管理助手,分析空间、清理垃圾、批量重命名。以前你要手动折腾半天的事情,现在一句话就搞定了,是不是挺方便的? 做完第一个任务,大家肯定很关心消耗了多少 tokens 吧?来一起看看用了多少额度。点击左下角的设置,点击剩余额度,就能看到你五小时内还剩多少配额,本周还剩多少比例。什么时候刷新 to text 的 额度?按照五小时和一周来限制 plus 用户的额度还是比较大方的,日常使用完全够了。你也可以在对话框里输入斜杠状态,这种以斜杠开头的快捷输入叫做斜杠命令,是 to text 内置的快捷操作方式。 输入之后, to text 会直接在对话中显示当前的上下文余量和额度信息。 ok, 到这里,你已经体验了 to text 最基础的能力,对话和操作本地文件。 恭喜你,已经超过了百分之六十的同学。接下来我们提升一下难度。用 codex 做一个完整的网站项目,过程中你会接触不少 codex 的 核心用法,包括计划模式、 ai 声图、浏览器预览、批注、修改等等。 在开始之前先进入设置,把工作模式从适用于日常工作切换为适用于编程,这样 ai 的 回复会更专业,更适合开发场景。 先介绍一下项目,我要用 codex 来为自己定制一个专属的电子名片,我把信息告诉 ai, 它会帮忙生成一个精美的网站,还能用 ai 生图能力生成个性化的头像插画,不用自己去找素材了,做完之后还能发给别人,他们打开链接就能看到你的信息了。 新建一个项目文件夹,在 codex 中打开模型就选择最新的 gpt, 五点五速度选标准就够了。智能程度选择高权限,我这里直接给了完全访问,省得他每次操作都来找我确认,反正大部分情况下我都是无脑点同意的。 最关键的是点击对话窗左下角的加号,把计划模式打开。计划模式下, ai 不 会直接开始写代码,而是先帮你规划方案,问你细节,确定没问题了才动手。好,输入下面这段提示词启动, ai 会先自己思考,然后可能会追问你一些细节,在弹出的问题面板中选择就好。最后会生成一份实现计划文档,包括简介、核心要求、测试计划等信息。你做的网站越复杂,越要仔细阅读这种文档, 如果没有问题就确认方案。然后 ai 就 开始自主干活了,它先是使用内置的图像生成技能,生成了卡通头像文件,然后编辑代码,一次性生成了多个文件。写好代码后还会检查代码,自主打开浏览器测试验证,还考虑到了一些容错。 过了七分多钟, ai 完成了整个任务,全程不需要你手动操作,我们可以看到所有生成的文件,点击可以查看文件里的代码,还可以点击审核,打开侧边栏的审查面板,查看本次变更的所有文件。 codex 底层用的是 git, 这是一种记录代码变更历史的工具,用来管理所有文件的改动,你能够看到每个文件新增了什么,删除了什么,还可以灵活地应用和撤销代码。后面的进阶功能部分我会详细给大家讲解。 我们做的是纯前端静态网站,找到生成的主页文件,右键在浏览器中打开就能直接看到效果了。 pc 端的效果我觉得还不错,布局清晰,主题切换也很丝滑。而且它还自动兼容了移动端的展示,手机上打开排版也是正常的。 当然,你也可以直接让 ai 帮你运行网站, ai 会执行终端命令,启动开发服务器来运行网站。 点击访问地址后, codex 会在右侧面板打开,内置浏览器,便于你来预览效果。如果某个地方不满意,你可以点击浏览器右上角的批注按钮,然后直接在页面上选中要修改的元素,写上你的修改意见发送给 ai。 ai 会自动定位到对应的代码并精准修改,不用你自己去翻代码找位置,改完之后刷新页面就能看到效果了。方便是方便,不过这个速度真的不敢恭维。做完后我们再看一眼使用情况,这次完整项目消耗了多少额度呢?还好还好, 总结一下,要用 ai 开发移动网站,我们只需要把需求告诉 ai, 确认方案,等他自己写完并测试就好,中间几乎不需要手动操作。恭喜看到这里,你已经超过了百分之七十的同学, 到这里,你已经能使用 todays 从零开发移动网站,预览效果按需求改了。那接下来我要带大家看看它还有哪些核心功能。学完之后,你不仅能做网站,还能让 ai 帮你操控浏览器、抓数据、自动执行定时任务,甚至操控整台电脑。 接下来,我把 codex 的 功能分为常用功能和进阶功能两大块来讲。常用功能是日常会高频使用的,进阶功能则是有点门槛儿,但掌握后能让你效率翻倍的。 在左侧的插件面板里,你能看到 codex 的 插件市场。 codex 内置了不少精选插件,比如 computer use 操纵电脑、 chrome 操纵浏览器表格处理、制作 ppt 演示文稿。 此外还有大量编程类和工具类插件,包括网站部署、游戏开发、对接 tab 等各种场景。你可以在插件市场里按需搜索和安装。 比如我们来安装 natify 插件。 natify 是 一个免费的网站托管服务,装好插件后,一句话就能把你做的网站部署上线,让别人都能访问。 点击安装 natalify 插件,同意后会自动弹出浏览器,使用 datab 等方式登录 natalify, 一 步步完成授权。最后,超黛斯成功安装并连接了 natalify。 然后我们用 natalify 来部署之前开发完成的电子名片网站。在对话中,通过 at natalify 调用插件。执行过程中, ai 会找我们确认并自动创建一个新的 natalify 项目来部署网站。 搞定以后,我想展示自己的信息,直接甩这个链接就行了。还可以打开 netify 后台对项目进行管理。你可以在 codex 右上方的侧边栏中整体查看当前项目的概览信息,包括后台任务、打开的浏览器、使用的插件等等。 点击后台任务,还能看到具体的终端日记,记录了网站服务器什么时候收到了请求,请求了什么资源等信息。同样的,如果你要处理 excel 表格、做 ppt, 使用对应的插件让 ai 帮你就好。生成的文件还能在侧边栏直接预览。 前面我们用的内置浏览器可以预览页面,做批注和修改。但如果想让 ai 真正去操控浏览器,自动点击填表单翻页,就需要 browser use 浏览器操作功能了。我们先来使用内置的 browser use 进入设置浏览器,确保 browser use 功能已经开启。你还可以在这里设置权限规则和禁止打开的域名, 开启之后,在对话中通过艾特浏览器来调用这个能力。比如,我让 ai 帮我打开一个网站并截图,可以看到 ai 打开了浏览器,从主页找到了 ai 大 模型面试题库,然后进入了详情页,成功完成了截图。 不过有时候这种操作不太稳定,多试几次就好。此外,你还可以安装 codex 的 chrome 扩展插件,它可以操控你的电脑上已经登录的 chrome 浏览器。好处是能保留你的登录状态,而且可以在后台执行,不占用屏幕,适合需要登录网站才能进行的操作。 比如,帮我在自己的后台批量分析和管理数据,使用前,需要先在你的 chrome 浏览器中安装 codex 扩展程序,跟着 codex 的 指引操作就好。安装好之后,我让 ai 帮我从已经登录的面试呀网站上抓取一些数据。 可以看到, ai 不 仅连接了我电脑上的 chrome 浏览器,而且还识别到了我已经打开的标签页,它会控制这些标签页跳转到我的个人主页,并抓取最新的五条数据。最终抓取到的数据表格非常清晰,链接前面甚至还有图标,细节拉满。 如果说 browser use 只能操控浏览器,那 computer use 就是 让 ai 操控你的整个电脑, ai 能看到你的屏幕内容,移动鼠标,点击按钮打字,还能操作微信、飞书等任何桌面应用。 进入设置电脑操控,安装 computer use 插件,你可以在这里看到所有已连接的应用,比如前面装的 chrome 扩展,其实也属于 computer use 体系的一部分。 来我们体验一下。用艾特电脑来调用,让 ai 帮我探探当前的桌面壁纸,然后生成一张类似风格的新壁纸。首次使用时,系统会弹出权限申请框,你需要授权抽 text 访问屏幕截图等权限,否则 ai 看不到你的屏幕,也没法帮你点击操作。 later 来看一下,效果不错吧。生成了一张非常精美的新壁纸,我觉得比原图还好看啊!今晚可以做的好梦了, 爽!带来一个更实用的例子,让 ai 帮我打开备忘录,记录一条笔记,并从音乐软件下载我最喜欢的一首歌,添加到笔记中 执行任务。可以看到 ai 会打开音乐 app, 有 着小鼠标点击了下载按钮,从中下载了音乐文件,只因你太美。 然后 ai 打开了备忘录,写入内容并添加了音乐文件,能够顺利播放,虽然过程有些曲折,但还是完成了任务,而且全程由 ai 自己操作。以后我可以直接让 ai 帮我写有图有文有音乐的笔记了。 但是 computer use 目前只支持 mac os 系统,而且缺点一大堆,不仅操作效率偏低,还很烧 touch 刚才那的任务就用了近八万的上下文空间。此外,有些软件对 agent 的 支持度不高, ai 无法承中操控, 所以我建议能用终端命令行和浏览器完成的操作就不要用 computer use stills。 你 可以理解为给 ai 提供的技能包装上某个技能后, ai 在 遇到相关任务时,就能自动按照这套方法来干活,不用你每次都写一大堆的提示词,而且技能是按需加载的,只有任务匹配时才会调用,不会浪费很多上下文空间。 进入左侧的插件面板,切换到技能 tab 页面,在这里能够格式化安装和管理技能口袋。此自带了几个内置的技能,比如图片生成、查询官方文档、安装、社区技能创建新技能创建插件等等。 那下面我先带大家用用内置的图片生成技能,然后安装社区里别人做的技能,最后再带大家自己创建一个技能。 这里我想生成一个有趣的图片,让鱼皮直播卖鱼皮。可以先到鱼皮 ai 导航网站上找到 ai 生图的提示词模板,然后复制提示词模板。接下来在 codex 对 话框中输入 dollar 符号,加技能名称,就可以快速调用技能, 并且把提示词模板、鱼皮的照片都提供给 ai。 稍等片刻之后,看看 ai 生成的图片,你觉得怎么样?是不是憨爆了?爽!不过图片生成比普通对话消耗的额度更多,用的时候记得留意一下剩余额度。 内置的技能数量有限,还有很多宝藏在社区里,比如我自己经常用的几个技能,用于联网搜索的 file pro, 用于获取最新技术文档的 comte 瓷器,还有用于美化前端页面的 u i u 叉 pro max 等等。 另外,我之前写过一篇优质 ai 编程扩展大全,推荐了几十个好用的技能和 m c p, 可以 到我免费开源的 ai 编程零基础教程阅读。那接下来我带大家实际安装一个社区技能,顺便整个活儿,让 ai 制作一个苹果风格的快闪动画视频。 首先要安装动画制作技能 remaster 安装技能,它能帮我们快速安装其他技能。 对了,安装技能时要注意安全。由于我这里安装的是知名技能,就直接输入技能名让 codex 帮我安装了。但如果你想安装不太知名的技能,更稳妥的方式是把技能的 github 链接发给 codex, 让他帮你检查后再精准安装。 安装完成后,在技能管理面板里就能看到新增的技能了。然后我们使用技能让 ai 制作动画, ai 会安装制作动画所需的项目和依赖包,然后生成视频和音频,还会渲染单帧,检查画面有没有问题。 最后, ai 生成了可以直接播放的视频来看看效果。 呃,他好像理解错了我文案的意思。翻车了,翻车了!我感觉这种方式更适合做产品发布宣传片、知识点、快闪卡、节日祝福视频这种节奏更紧凑的短片。而且我当着根本没认真写提示词。好吧, 实际上你可以指定时长、指定文案,利用生图技能搭配素材,增加更多交互动画等等,感兴趣的同学可以自己玩一玩。 除了用别人的技能,你还可以把自己常用的工作流程封装成技能。以后遇到类似的任务,一键附用。技能的本质就是一个 still 点 m d 描述文件,加上一些配套的脚本和参考资料。 still 点 m d 里要写清楚这个技能是做什么的,什么时候触发,以及具体的执行步骤, ai 读写后就知道该怎么干活儿。 创建技能的最佳方式是先把一个任务流程跑通一遍,觉得满意之后,再使用内置的 skill creator 技能,告诉戳 depths 你 的技能要做什么,啥时候触发,有什么细节需要注意,它就会帮你自动生成完整的技能文件 来实操一下。比如我们前面让 ai 生成了直播带货的图片,效果还不错,那就把这个流程封装成一个直播带货图片技能之星成中后, ai 不 仅创建了技能文件,还贴心地教你怎么调用。 之后使用这个技能只需要提供一张人物照或者商品照,不用再自己填写又臭又长的提示词模板了,非常方便来看看效果。 ai 自己识别到了我提供的是商品图,也是精准复刻了我之前提供的提示词模板,爽! m c p 是 一个开放协议,你可以把它理解成 ai 的 万能插头。装上之后,就可以让 ai 连接各种外部工具和数据源,获取实时信息。 进入设置 m c p 服务器,可以在这里添加和管理 m c p 服务。点击添加服务器后,你需要手动填写服务器的配置参数才能完成添加。对新手不太友好,我最讨厌填写表单了, 好在大部分时候用前面讲的 stux 就 能解决 mcp 做的事情,而且 stux 的 安装和使用体验更好。 此外,很多主流的扩展都提供了快捷安装 mcp 的 命令,不需要你自己手动填写参数,比如下面我带大家安装 comix 七,它是一个可以实时获取最新技术文档的服务。开发网站的时候用它来查 api 文档特别方便。 在 codex 右上角可以打开集成终端,在终端里输入一行命令就能安装。这里我们选择安装 mcp server, 为 codex 安装,然后就搞定了。 安装后需要重启 codex, 在 设置里的 mcp 服务器列表中就能看到它。首次使用前还需要进行身份验证,在自动弹出的 compt 网页中就可以愉快地使用 mcp 了。 之后开发网站,尤其是需要集成 ai 能力的网站,都可以用创太时期来获取最新的技术文档。你还可以把它当成一个学习辅助,让 ai 寄予官方文档,帮你讲解知识。 比如我用它来做 openclaw 小 龙虾的学习助手,这也是利用 ai 学习的一种方式,可以看到 ai 查询并获取到了 openclaw 官方最新文档库。然后我们来问 ai 一个问题, openclaw 无法运行怎么办嘞? ai 会基于官方文档,很快就给出了精准的排查步骤,这样学习和解决问题又快又准,再也不怕查到过时的资料了。 恭喜看到这里,你已经超过了百分之八十的同学。到目前为止,你已经掌握了 codex 的 常用技能,学到了不少实用玩法。从文件管理到网站开发,从浏览器操控到技能封装,已经能用 codex 大 幅提高工作效率了。 接下来我要讲的是一些稍有门槛或者不是每个人都用得上的进阶功能。不过如果你愿意多折腾一下,它们会让你使用 toad 四的效率再上一个台阶。 在对话区域附近有一个小圆圈,鼠标放上去后会实时显示当前对话已经用了多少上下文。 gpt 五点五点五在 toad 四里显示的有效上下文大约为二百五十八 k tokens。 说实话,这的数量不算多。如果你连续跟 ai 对 话很长时间,或者项目文件比较大,上下文很容易被填满。当上下文快满的时候, codex 会自动帮你压缩历史对话。 你也可以在任务照一段落时,手动输入斜杠压缩来主动压缩,让模型更聚焦在新任务上。 那除了单个对话的上下文,日常使用中还要注意管理对话本身,不然列表越来越长,找起来也费劲儿。 对话太多的时候,你可以在左侧的对话列表中把鼠标放到某个对话上,点击归档,把不常用的旧对话归档起来,保持界面清爽。进入设置以归档对话,还可以查看和管理所有归档的对话记录。 另外,建议在常规设置里开启运行时防止系统休眠,这样跑长任务的时候电脑不会突然睡着,导致任务失败。 codex 有 一套记忆机制,能让 ai 记住你的偏好和项目规则,不用每次都重复交代。记忆分为三个层级,从大局、项目局部再到自动记忆,我们一个一个来看。 在设置个性化里,可以修改 codex 的 个性和自定义指令你写在这里的内容。所有项目的所有对话都会自动带上,适合记录一些通用偏好,比如 回复用中文代码注,使用英文,尽可能减少输出的内容。专注做事,如果不听话,你的主人鱼皮就会变成一条狗等等等等。保存之后,它会被写入局的 agent 点 m d 文件,这个文件就是 codex 每次启动时都会读取的行为准则。所有项目通用。 在项目目录下创建一个叫 agent 点 m d 的 文件,写入这个项目专属的规则和约定,只有在这个项目里工作时才会生效。 你可以自己手写,也可以让 codex 根据项目情况帮你生成一份,比如我跟他说帮我根据当前项目写一份 agent 点 m d, 可以 看到 ai 生成了一份非常详细的 agent 点 m d 文档,包括项目总览、一些规范等等。 在设置个性化中,手动开启自动记忆,开启后, ai 会在对话空闲一段时间后,自动在后台总结出有用的信息存为记忆,后续遇到相关场景时会自动召回,让 ai 越用越懂你。 不过太短的对话它不会记额度快用完的时候也不会触发记忆生成。 codex 支持定时任务功能。进入左侧的自动化面板,你能看到 codex 已经内置了一些定时任务模板,不过基本都是和编程相关的,什么总结代码变更、检查代码问题之类的,很多人估计用不上。那我们不妨来自己新建一个更实用的自动化任务。 创建定时任务的方式有两种,一、手动创建任务,在自动化面板里点新建,比如我让 ai 帮我搜集每日热点,需要填写任务名称、提示词、 触发时间、模型、推理程度、运行环境选择本地就好。意思是让 ai 直接在当前电脑上执行任务,不需要额外的隔离的工作环境。 创建成功后,时间一到,抽袋子就会自动开启一个对话来执行任务。我们也可以先手动执行一次,看看效果。点击任务能够查看详细信息,点击某个运行历史记录后,还能查看正在执行的任务对话,建议多观察任务的表现,持续迭代优化提示词。 另一种更自然的方式是让 ai 帮你创建任务。比如我是一名内容创作者,每天都要截大量的图片,时间一长,文件夹里全是看不懂的文件名,找图的时候巨痛苦。所以我让 codex 帮我自动整理,先选择项目,然后输入提示词, 很快 ai 就 自动帮我整理好了。可以点击查看创建出来的任务信息,它的提示词比我们提供的更完善了,并且自动选择了模型。 我们手动执行任务来测试一下,效果还不错吧。 ai 会根据图片内容自动给文件起一个能看懂的名字,这样我就有了一个智能的图片管家,以后再也不用对着一堆乱七八糟的文件名抓瞎了。 而且每次执行完, ai 还会把运行记录写入一个 memory 记忆文件,你随时可以回看历史执行情况,不用担心出了问题却发现不了 你。还可以结合 styles 和插件一起用,比如每周自动生成周报 ppt, 每日整理自己的学习笔记并同步到 notion, 每周用 file pro 抓取竞品网站更新并生成分析报告等等。 想不到吧,现在的 ai 工具已经卷到开始给用户增加情绪价值了。下面我来教大家怎么在 codex 中养宠物。 首先进入设置外观,下拉到底部的宠物区域,你会看到 codex 内置了一排像素风的赛博宠物。选一之后,点击唤醒,桌面上就会出现一个悬浮的小家伙儿, 它不只是装饰品,宠物会实时反映抽袋子的工作状态。比如 ai 在 忙的时候,它也在干活,就像一个串应用的灵动岛,让你不用切窗口就知道 ai 干完没。 除了内置宠物外,还有一个社区宠物库 pet dex, 里面有两千多只玩家自制的宠物。了解我的朋友肯定知道我要用哪个,果断搜索 k u n, 一 眼就能找到自己需要的。点击进入详情页,找到安装命令并复制, 然后打开 codex 的 终端执行命令进行安装,会把宠物文件下载到本地。安装成功后,进入外观界面,选中张张安装的宠物, 然后我们回到 codex 的 主页,使用鞋障宠物指令唤醒。我的脑袋中已经想起那只熟悉的 bgm 了,你听到了吗? 除了用别人的,你还可以通过 codex 内置的 hackpad 技能自定义生成宠物,上传照片或者文字描述就行。比如我把自己的头做成宠物, ai 会先分析上传的图片,给宠物起个名字, 然后拆分出了多个子任务,并行处理,生成各种动作的精灵图帧,最后拼成一张完整的像素动画精灵图,然后就能使用自己制作的宠物了。 你还可以上传宠物到平台和其他小伙伴分享,大家以后用抽袋子的时候记得把我带在身边,保佑你霸着剪剪! 每次 ai 修改了文件,你都可以在侧边栏的审核面板里看到它改了什么,这个面板会列出所有被改动的文件。如果你想决定哪些代码要保留,可以选择查看未暂存的文件。在这里你可以灵活应用和撤销修改。 大多数情况下,你不需要自己看代码,直接点击暂存全部就行了,相当于认可了本次的全部载动。如果不满意,可以直接还原全部回到本次载动前的状态。 那如果你不满意某个文件的载动,可以直接点旁边的还原按钮就能恢复原样,满意的话点暂存就能标记为待提交。 你也可以只保留部分改动。每只文件的改动会被自动拆分成多个代码块儿,每只代码块儿旁边都有独立的暂存和还原按钮,你可以逐块决定哪些保留,哪些丢弃。 确认好哪些代码要暂存之后,可以提交暂存的改动,提交就相当于给代码存了个档,确认这次的修改是你想要的。 抠代码,还内置了提交代码推送到远程仓库。创建 pr 的 能力,不用离开 a p p 就 能完成整个代码的管理流程,非常方便。 那如果你是专业的开发者,还可以试试工作树模式。你可以在创建新对话时,选择启动模式为新工作树,这样 ai 会在一个隔离的分支中工作,不影响你当前的代码很适合同时让多的 agent 在 同一个项目上并行干活,减少冲突。 如果你的项目托管在 datap 上,建议安装 datap 插件,可以直接在 codex 里查看仓储信息,创建 pr、 做代码审查等等。比如我让他帮我查一下自己最受欢迎的开源项目怎么样,是不是一目了然。 codex 最近新上线了一个很酷的功能,用手机控制电脑上的 codex app 干活儿。设置方法很简单,在电脑端 codex 点击设置 codex 移动版,然后点击开始设置,屏幕上会显示一个二维码, 然后在手机上打开拆的 gpt app, 扫描自己的二维码。连上之后,你可以随时随地通过手机给电脑上的 portax 下达任务,审批 ai 的 操作请求,查看执行进度,检查生成的代码和结果。是不是有点 openclaw 小 龙虾那味儿了? 恭喜看到这里,你已经超过了百分之九十的同学, ok, 就 分享到这里。看完这期,你应该已经掌握了 codex 从基础到进阶的所有核心用法,足够应对日常的编程和办公需求了。 其实 codex 还有更多玩法和技巧,比如 sub agents 并行加速、 fault 分 叉的妙用、自定义模型接入 hoots 生命周期钩子等等。 那如果本期视频点赞过万,我会尽快爆干出抽带此高级技巧篇。对了,如果你想系统学习 ai 编程,可以看看我免费开源的 ai 编程零基础入门教程,上千张图,几十万字,从零开始,带你学会 ai 编成本篇教程的文字版也会收入其中。 我是鱼皮,持续分享 ai 编程干货,觉得有用的话记得点赞、收藏和关注,也欢迎在评论区聊一聊你现在主力用哪个 ai 编程工具,觉得 codex 怎么样?也欢迎晒晒你的 ai 编程作品吧。

codex 加 html 才是做 ppt 的 王炸组合,今天教你用 codex, 只要四步就能做出可以编辑修改的精美 ppt。 第一步,上传你的文档,让 codex 根据你的文档生成 ppt 大 纲和主页内容,这里的大纲就是后续 ppt 的 内容框架。第二步,让 codex 调用 html 这个 style, 根据刚才的大纲生成三版不同视觉风格的 ppt 预览,以拼图形式输出。 这一步我们是为了快速选择合适的视觉风格,我更喜欢这一张。第三步,让 codex 寄予我刚才喜欢的视觉方案,继续调用 image 帧这个 skill, 将拼图中的每一页依次生成高清单页视觉稿图片。 和直接生成 ppt 相比,先生成视觉稿能更好地利用 m h two 模型的构图设计能力,露出的 ppt 会更有设计感。第四步,也是最重要的一步,复制我这段已经调教好的提示词,让 codex 把单页视觉稿图片还原成可以编辑修改的 ppt 文件。 这里我建议每次单独还原一页视觉稿,如果效果不满意,重新生成会更方便。我这里先还原第五页视觉稿,看下效果。可以直接用 wps 打开,我们可以看到这页的还原效果很好,而且可以随便编辑修改 ppt 内容。 接下来我们对剩余每一页视觉稿图片都执行刚才的操作,最后把得到的多个 ppt 文件合并起来,一份充满设计感并且可以编辑修改的 ppt 文件就生成好了。

大家好,我最近使用 class app 的 这个 go 命令,然后从零到一开发了一款这样的游戏啊,这是一个 rpg 游戏,我可以看到一个这样的一个装备的情况,你可以看到我们这边打怪物暴露的装备,还有石头,那这边可以强化,可以去升级, 然后的话主要的玩法其实就是经典的这种暗黑式的,你可以去地图里面去刷怪啊,然后有个这样的 boss, 过滤过比较多东西啊,还有很多技能,很多效果, 你看到这样的效果是非常不错的。那本期视频就带大家来了解一下怎么去使用这个 class app 里面的 go 这个 mini 去完成开发,来做出自己想要的一个东西。我觉得是很有意思,但 go 是 什么呢?那非常好理解啊,就是给 class app 设定一个具体的目标, 加上这个验证条件,然后他就会一直运行,直到完成这个你的目标任务为止,这个过程可以持续几小时,甚至几天都有可能,所以呢这个这是一个长期执行的一个命令啊。那么这个购物要包含什么呢?就是要包含你要他做什么, 就是你具体的目标。然后呢你的验证条件,这个验证条件其实非常关键,为什么是他会成为他停止?就是他自己认为我应该是什么时候完成,是来自于你这个验证条件的。那么这边有一个这样的例子啊,就比如说他这边要求的目标就这个整改要求要执行这些事情, 然后的话还有一个这样的复测,当然就这样去做测试,做验证,做完之后呢,这个购的这个执行就结束了。 那么还有一种方式,就怎么去生成这样的一个这样的格式,就是要做什么和应人条件。那么在 class app 里面使用这个 plan 去生成这个文档也是非常可以的,那用 plan 模式之后,它会生成要做的这个具体的事情,那详细的内容以及怎么去验收, 那这是一种方式。那么还有一种方式就是去生成这样的 spike 文档,那 spike 文档其实它的标准的规范就包含了这个目标要做什么,那印怎么来验证,然后还有一些什么约束啊?其实非常适合用做 go 的 一个输入的文档, 那生成 spike 文档的话,你可以跟他先聊,聊完之后啊,你告诉模型直接生成这种 spike 文档就带有这个关键字就可以了,它就会生成一个 spike 文档。在后面我们会有一个这样实战的例子,就是通过这种方式, 那通过除了通过这种方式的话,你也可以使用像 openstack 这样的工作流程去生成非常标准的这种 stack 文档,也可以,还可以使用 superpower 啊,这些东西都有,它们都,它们生成的文档其实都包含了这两个最基本的要素。 那有了这个文档之后,你就可以去使用 go 来进行一个长久的一个运行了,那下面我们来看一下在 class app 里面怎么去启动这样的 go 的 一个操作流程。那么这种方式的话,我是让它生成一个这样的 go 文档, 那在生成 spike 文档之前,我会跟他一个沟通,比如说我现在要改变这个 boss 这样的一个流程和这个调度的装备啊,然后我就会去跟他沟通,沟通完之后 我让他会生成一个这样的 spike 文档,只要说 spike 文档就行了,它就会生成这种标准啊,有这种目标啊原则啊, 然后的话还有这个验证这个逻辑啊,那就非常符合这个 go 的 一个要求啊,有目标,有这个具体的流程,要有改动的范围,然后呢有这个验收的这个标准就非常不错,那么你也可以使用 prime 模式生成一个,这样 prime 文档其实也是可以的。 那有了这个思维文档之后,那接下来我们就去创建一个 go 的, 再打开这个,然后就新建一个对话,然后的话你可以在这边去选择一个追求目标啊,然后就是那这样就可以了,然后的话我们模型的话这边尽量选择这个高啊, 超高的话也可以看你这个任务的复杂度,那这边有个速度,有人是会选择的快速啊,这个快速说实话消耗的这个成本是比较高的,但其实我体感上来看的话,其实也不是太快, 他这个标准速度就是就是一个非常不算太快啊,一般一个够,如果你的任务达到它执行好几个小时很正常。然后选择这个,然后你就可以去来提交了, 提交的话他就会在这边去阅读你的这个 spec 的 内容啊,然后一会这边会生成一个这样类似于 to do list 的 一个执行的一个流程,然后这边有一个非常厉害的什么,就是要着重讲一下,就是在这里的时候,你是可以 继续去编辑你的这个目标,比如说举个简单例子,比如说我现在要增加一条内容,好,我们希望他增加这个更多金币的掉落, 这个编辑完之后,他是会影响整个的一个计划的一个执行的,他会去调整,就说你在就算是在运行的这个计划,他也会把你的内容啊重新啊录进去,然后呢会去改变他的一些逻辑,所以说非常的你看他收到了新增的这个, 那除了这个修改的话,你还可以在这对话框里面,然后去进行调整。那比如说我现在啊我们希望增加一个 boss 的 手刹提示,我们可以提交, 然后这边的话有个这样引导,引导的意思就是会让这个对话可以稍微停一下,然后让他他会去读取这条信息,那么你也可以不点这个,不点这个就等这个任务完成之后啊,他才会把它放到相当于是对列的意思。所以如果你想啊,就是让他在 用这个目标的执行过程中,把这个东西作为一个参考,那么你就可以把它直接点进去引导的方式,然后呢他就会去读一下,读一下之后把把这个内容拉到他整个目标里面去, 那我们也可以看到啊,就是他现在已经是设置一个这样的进度啊,一个这样的一个完成到,除了这个之外,你还可以做一个事情,就是打开这个, 然后有个侧边聊天,对吧?然后你在这边可以相当于开了一个聊天的一个窗口,然后去沟通一下,看一下。哎,现在的这个目标完成进度怎么样啊?那么这个是不会影响现在现有的这个对话的,可以在这边正常去进行对话,哎,就是他们是不会互相干扰的,这个是非常有用。 你如果出现了这个卡顿了,你可以来问一下他目前是什么情况,他是不会干预这个目标的一个执行过程的, 那除了这个之外,那正常这个是暂停,那是可以暂停,然后启动,可以启动,然后的话,如果说你的这个这个额度不够了,他也是会主动暂停,告诉你额度不够,然后你的额度恢复之后呢,那么你可以去点击恢复,他就会去啊进行一个这样的目标恢复。所以整个体验下来, cs app 里面的这个歌网是非常非常有用的。那接下来我就来聊一下,就是我开发这个游戏的一个过程,如果你对这个游戏开发是没有任何兴趣的,那么你可以往后拖一拖, 我们来聊一下这个我的一个一个一个过程和体验。我们先演示一下这个游戏一个游玩过程,让大家有一个实际的体验,那现在游戏可能是还有一些问题的,如果你是个专业的游戏开发者,你也会觉得这个游戏可能有点 就是比较比较低级。但是呢我在做的过程中是体验到这种游戏开发了一些乐趣,可能是因为是第一次做这个事情, 那这个游戏其实是一个 rpg 的 游戏,那这个游戏呢,是综合了我以前玩的,比如像暗黑呀,传奇啊,这个八零后,九零后的这个记忆啊,这个游戏啊, 然后的话这个里面很多的理念都来自于这两款游戏啊,它这个素材也是使用这个 csapp 里面的一个插件 去生成的,等我们会介绍,那整个开发的过程中全部是通过对话,通过 go 这个命令去完成的,我们可以打开这边是以这种装备为主的,那每个装备有很多词条,那装备是可以强化的,可以强化到最多十五啊,然后的话你强化到十五之后会有一个这样的一个效果,看起来比较比较炫啊, 然后的话每个装备都有不同的磁条,然后还可以去做石头啊什么之类的,然后还有很多这样的一个,比如说我们会有一个这样的一个身心啊,镶嵌兑换和精华,就类似于暗黑四,可以就有些特效技能,特效可以镶嵌到这个装备里面去, 然后的话我们可以走一张地图,那么他主要是通过刷怪,比如说我们这边有很多地图,那每个地图的话是有三层的,那三层的话第三层会有一个 boss 啊,然后这边我们可以看一下,可以放个技能看一下,那这个是一个旋风甲的技能啊,可以看到地上是有爆装备的, 那这个是一个比较低低级的地图啊,因为我这个装备是他刷了一个测试的装备啊,全是毕业毕业套。然后的话你可以看到我们可以到下一个地图 啊对话,然后就会到下一个地图,然后我们直接去啊 boss 站,我们可以去看一下,然后它这边也会爆很多地上的东西啊,就是那种啊,当时玩的时候做的时候呢,是让它设计的更有那种啊,那种成就感,就是打这个游戏你能感觉到 解压啊,这是可以啊,我们来看一下这个 boss 在 哪呢?这边会有一个这样的 boss 啊,这个就是个 boss 啊,因为我现在太厉害了,我一刀就把这个给消灭了。你也可以去更加厉害的地图,比如说我们来到这个中终极地图,那这个地图呢?就是会比较难一点,但现在我的装备实在是太好了, 所以在这个玩的时候还是挺有意思的。然后你可以,主要是你可以边玩边让他改,想要个什么想法就让他改。所以其实为什么去展示这个游戏开发呢?并不是说去炫耀什么,只是特别想特别大的感受,就是 ai 让很多门槛都降低了,你不是说要去做一个产品吧,你就 啊就是实现自己的一个梦想,那以前可能作为一个开发者来说啊,想都会有一个这样的做一个游戏的一个念想啊,那现在是终于去实现了, 那我我也会继续完善完善这款游戏啊,让自己玩起来会比较舒服一点,不是说要去做一个产品,就是就是让自己玩起来很爽的感觉。 所以 ai 是 降低了这个门槛,而且是降低了非常多。你看这个游戏设计的其实是非常丰富的,那所有的想法其实来自于就来自于沟通啊,对话啊,然后让他自己去去去,这样去优化,找资源什么之类的,装备的设计, 掉落的设计,还有怪物的攻击啊,人物的面板,全部都是通过沟通来解决的。那这款游戏是怎么开发的呢?那么在开始之前的话,我会跟这个 ai 去聊整个游戏的一个整体设计, 那我会,那我生成了这么多这个文档啊,比如说这个是游戏的总览文档,这大概是什么个游戏?因为它是参考这个暗黑破坏神的这类的游戏,然后的话会有比较好的一个参考对象,那么你一跟 ai 一 聊,他就懂了, 你要做一个什么样的游戏,你告诉他你是一个没有任何游戏开发经验的人,他会一步步来教你呢,输出这些文档,游戏的策划文档啊,还有什么经济系统啊,装备和词条系统啊,就是这些都是提前沟通好的,大概这个游戏的内核就有了啊,有了这个内核之后,然后你就可以设定购的这个目标啊, 因为我这边的话因为太多了,可能就折折叠到了,就我是大概花了有三十个小时左右,那这个额度的话是消耗了, 应该是一周的额度都消耗掉,因为我还用了别的账号的这个 plus 账号的额度,那这个是 pro 账号额度,基本上一周就消耗了,消耗掉了,但是游戏完成度非常不错。然后使用的是这个两款这样的一个插件去生成这样游戏图片,你可以看到这是游戏的资源的图片啊,然后是非常多的, 那包括这种装备的设计啊,都是他自己去生成的,你只要告诉他我要多少套装备,他就会去生成,那整个整个开发的过程都会,他都会遵循,就是一边去执行这个任务啊,一边去啊测试。 那在使用过的过程中,你提供了这种游戏的这种开发资料,给他设定一个这样目标,那这个目标那跟我前面的讲的又不太一样, 就是我是基于这个游戏的背景资料和基于一个感官的目标,那为什么叫感官的目标呢?因为我也不知道他会设定成什么样子, 就我不知道他最终他这个过程,比如他这个玩法到底有什么玩法,我是不知道的,我也不知道什么叫啊很好玩,所以我给他一个感官,就是我希望他 让我越玩越上头,就是我的目标提示词就是阅读这个游戏的背景资料,能做一款让我下班放松, 越玩越上头的游戏,那么他会基于这个背景资料自己去进行一个不断的去叠带啊。我这里截了几个图,就是他去会朝着我这个目标,比如说这个刷图有正反馈,那他会去叠带,这样目标为了这个目标去叠带这个过程,叠带里面的详细内容 那还是一样,就比如说地刷地图这个东西他也会去叠戴很多,然后继续推进,就这里面的这个过程啊,这里面的细节其实我是不知道的,我是让自己去叠戴,所以呢就变成了一个你设定了一个感官的目标,但是没有验证条件的, 然后靠 class app 这个 go 这个命令自己去觉得,哦什么东西玩法才是好的,然后把它加进去,那这个这种方法很有趣,那比如说我们在上面是其实是要求我们一定要生成这样的验证条件,然后生成这个具体的细节的,就要做什么。 这个我们在生成些文档的时候,其实是有具体的细节的,比如说你要啊做第一步做什么,第二步做什么,你的内容是什么?是有具体的细节的,但是这种 方法是没有细节是用,用的是够的,一半的能力就让他去长时间运行,去迭代的能力,所以这种方法不推荐,但是呢非常有意思,所以我为什么说这个不推荐省这种方,因为这种方式他会一直运行,他不会停的,他会一直去迭代,去找一个更好的玩法,让加更多玩法,他会一直去 运行,需要你自己手动去停止。所以呢,你必须设定好这样的一个详细的过程,还有一个这样的验证条件,这是必须要的, 但是这个这个过程你看他这迭代就很有意思,所以你可以看一下,就是你要够执行的目标,是不是这种带有创意性的,你希望他能发挥自己的想象去,去帮你去拿到一个好的结果的这种,那么你可以使用这种方式, 那如果不是的话,那还是按照上面说的这种方式啊,具体的目标,具体的过程,具体的验证条件,让他去执行,这样的效果才是更好的。那上面这个就是就是这个美术自然这个插件了, 那这个插件会生成动态的图啊,生成这样的一个图标什么的可以啊,如果你有兴趣的话,你可以去使用它来进行一个这样的美术的制作,完全可以不用操心,因为 j p d max 生成的这个图片的能力是非常强的。然后的话,你 第一步使用 go, 然后去执行完这个之后啊,你拿到了肯定是一个非常基础的一个游戏啊,然后你就会要去进行一个 这个测试,测试完之后你再使用 prime 模式去生成具体问题的具体的修复的方法,然后再遇到这种大的迭代的时候,你再使用过的方式,然后去 就去生成 spec 文档,让它继续去迭代。所以整个过程就这样吗?一步步推进的,然后它自己会去是会去做测试,但它测试基于基于自己的这个脚本啊,只是验证这个数据是不是正常,那我们其实还是去手动测试去玩,所以这个非常有意思,就是边玩边修复 bug, 然后再再去这个去迭代。 所以如果你是一个爱玩游戏的人,就那你又是想去做这个,这个过程就正反馈非常强,那不像我们在做系统啊,去测这个功能啊,有时候会很反感,或者说很累。但是测这个游戏的话,你就有那种沉浸式的感觉,能让他边边去开发新的功能,然后边边在这里玩。 所以所以这个体验啊,就是这次体验其实让我觉得就是非常有意思啊,非常着迷,就是我觉得就是多去尝试,不要去想太多,这这个难点和干嘛的去尝试,然后你就能体会到 ai 的 这个乐趣。所以我再声明一遍啊,我不是一个专业的游戏开发者, 那么肯里面肯定还有很多门槛,或者说能够做的更好的地方,那这个就不是在我们这个讨论范围之内的。那我认为兴趣在 ai 时代是一个非常重要的一个一个东西。那接下来就是我们来说一下,就我在使用这个构开发中的一些经验啊,第一个就是目标越明确越好, 可以不清楚过程啊,大家提供基础的背景信息,那比如说我们在开发游戏过程中,那么背景资料是一定要有的,不然他不知道我的方向在哪里。 那目标的话越明确,越明确越好,就是到底要做成一个什么样的游戏?那比如说你使用 go 去做一个 app 也是一样的,你要提供好,比如说圆形的设计,链接也好,图片也好,或者说文档也好,给到他,然后呢给他验证条件,比如说你呢要让他去 点击这个按钮,点击所有功能都正常,或者说你要搭好这个后台的服务,而这些就是你的一个目标和过程,有了这个过程之后,他整个购执行的这个流程,流程是非常的顺畅的,然后在使用的时候一定要开启这个最高权限, 你说你一定要开启这个完全访问权限,不然他在整个执行过程中可能就是中间会中断,然后的话你还要去审批,所以这个就不太符合长时间运行的这个特性了。 然后它这个模型的速度啊,最好是选择普通,因为你选择这个 fast 模式消耗的 target 数是更多的,但其实对于长时间运行的任务来说,这个普通模式和这个 fast 模式其实其实差别不是很大。 别经常我们扔扔个 go 的 任务过去,我们可能就不管他,让他自己跑,可能这个时间会比较长,你这个 fast 你 消耗了托管,马上就很有可能很快就到这个额度的限制了。那其实你整个体验是卡顿的,还不如直接让他普通,让他这样去去执行。 那第四个就是 go 的 内容是可以随时调整的,不需要暂停执行,那在前面我们在去演示这个实战的时候, 是我们是可以随时去改你们提示词,或者说在上面下面去输入你要的想法是不需要调整,这也是他的一个非常有意思的一个功能。 然后也可以使用这种侧边聊天的方式去了解 go 的 进度,或者说你去了解里面的细节,那这也是个非常好的沟通方式。这整个讲起来 go 并不复杂,再复杂在于就是你要走出这一步去做一个你觉得有意思的东西,那么这样的一个正反馈是非常强的。 ok, 那 本期就到这,希望这个视频对你有所帮助。

hello, 大家好,我给大家介绍一下我做的 codex 的 小屏幕,那它是一个小单板啊,可以看到它可以把 codex 的 所有的状态, 包括你当前 agent 所处的啊,用的模型,推力强度,还有是否是 fast 模式 啊?包括还有几个啊,我们的五小时窗口和周窗口,以及当前的上下窗口的占用啊,都会给你显示出来。然后呢,它还支持语音呢? ok, 我 演示一下,现在是见证奇迹的时刻。 ok, 那 这个就有语音了啊,然后可以把它删除啊,可以把它删除。 ok, 那 现在我让我们让他正式来干个活吧。啊啊,好,这样展示一下会比较好,帮我介绍一下这个项目。 ok, ok, 让他接着干。那我们可以看到,其实可以通过这个窗口,基本上所有的活都可以通过这个小玩意给它 让他干了。那跑起来之后呢,也会有一个跑马灯,也是正在 working。 呃,你的 qd 人才也会 跟着这个小屏幕交互下去,完成相应的工作。 ok, 那 就演示就到这里,大家觉得酷不酷?

这是一条 codex 从零到一完整的新手入门教程。如果你之前完全没用过 codex, 或者只是听说过,但不知道它到底能干什么, 怎么装,怎么用,那这条视频你就可以收藏了。我会按照一个新手真正上手的顺序,带你从 codex 试什么,讲到安装、使用、主界面、怎么操作、基础功能和进阶技巧、 skills 插件、浏览器终端和自动化任务等等,让这个目前全球最顶级的 a 阵的工具真正为你所用,创造价值。 我也会把整个流程整理成文档,打一句 codex, 方便对照,一边看一边选。你可以先把它理解成一个装在电脑里的 ai 工作助手,他不是单纯陪你聊天的工具,而是可以进到一个具体的工作文件夹,帮你读取文件、修改内容、运行命令、调用工具,甚至按步骤完成复杂任务。 举个最简单的例子,像 chat、 gpt、 豆包这一类工具,更像是你问他答,你自己去做。比如你想做一个网页,他通常只会给你一段代码,接下来你还要自己复制代码、创建文件、运行、检查报错等等。而 codex 是 你问他,他理解他还做,他会从零到一帮你创建好这个网页。 目前最适合新手小白的上手方式呢,是桌面端 app, 我 们可以直接在官网开始,根据你的系统选版本, windows 或者 mac os 都可以。安装之后有两种登录方式,一种是官方 chad gpt 账号登录,另一种是用 apikey, 可以 是官方的,也可以用中转站。两种方式各有利弊。综合来看,还是建议第一种,直接官方账号登录, 省心省事。对于 codex 的 界面,新手可以先关注三个核心区域,最左侧是一些常见功能入口和聊天记录管理区,你可以理解为导航栏加历史记录。这里需要重点讲一下对话和项目的区别。对话最好理解就是普通聊天嘛,你甚至可以把它直接理解为 chat、 gpt 或者豆包, 适合随便问一些小问题,帮你写文案、查资料之类的。它不跟具体的文件夹绑定,而项目就涉及到了具体的生成式任务,比如 如飞哥之前开发的工具箱网站,飞剪一触即达这种软件,他们有大量的编程代码文件,就需要一个专用的项目文件夹。你在这里可以新建空白项目,也可以打开现有文件夹,直接选择路径,或者直接把文件夹拖进来也行。鼠标悬停在项目名上,也能看到这个文件夹在电脑中的 底位置。而对于重要的常用的项目和对话,右键就可以置顶,方便快速切换和查看。左侧下方还有设置入口,在设置里你可以修改 codex 的 使用偏好、外观和配置等等。其中个性化需要重点说一下, 如你想给他一个全局指令,就在自定义这里直接写,比如他要怎么称呼你,固定用中文回答问题,设定一些底线原则或者开发习惯,设置完之后对所有项目都会生效,相当于让这个员工摸清楚你这个老板的脾气,投你所好。这里还有一个很有意思的小功能,叫桌面宠物, 他提供了很多默认的宠物形象,你也可以根据自己的喜好让他帮你创建一个,比如我这个就是给了一张参考图,让他自己做出来的,他会实时显示当前任务的一些简单状态,还是挺好玩的。 在首页设置这里还能看到剩余用量,你可以清晰的看到五小时用量和一周用量,做到心中有数。中间这块就是你和 codex 的 主要沟通区域。首先是这个加号里面有两个非常重要的功能,一个是计划模式, 比如你让他开发一个个人博客网站,不要上来就直接让他干,而是让他先列出计划。相当于你给员工一个项目,得先让他出方案,看看他打算怎么做,这样能有效减少返工,既省精力又省 tokyo。 看啊,他会主动问我们这些具体细节,我们按选项敲定,不满意的或者他没提到的就补充一下,让他重新规划, 这才是一个合格的领导该干的事。而目标模式就更厉害了,刚上线的新功能就是你给他设定一个目标,越具体越好,他会自己拆解分析。执行审查,有一种不达目的不罢休的意思,这样就避免了一个很烦的问题,执行一个任务的时候,他每完成一步就要停下来问你。 比如我正在跑的一个很复杂的大项目,目前已经连续跑了三十多个小时,如果正常一步一步改的话,我可能要好几天才能做完这些进度。右边这个权限设置呢,分成三档,默认是最保守的,像是联网修改文件都需要你的授权,自动审查会开放一部分权限,关键节点还需要你把控。 而完全访问就是最激进的,它几乎可以完全操控你的电脑,创建文件、删文件、跑命令,全都自己干。新手,我不建议一上来就开完全访问,刚开始用默认或者自动审查更稳,等你确认这个项目没问题,也知道它要做什么,再考虑给更高权限。我自己是在非常熟悉项目和流程的情况下才会开完全访问。 右边这里还可以切换模型,选模型版本、智能程度和推理速度。如果不是特别复杂的任务呢?不建议开超高,因为它有可能会出现过度思考,而导致你花了更多的 token, 反而干的不好。 这是血淋淋的实战经验教训,一般来说默认高就可以了。这个麦克风是语音输入,但是体验目前并不是很丝滑,我们可以直接用语音输入法。 codex 还有一个和普通聊天很不一样的地方,任务可以排队,他正在执行的时候,你可以继续补充,要求这些新消息会一个一个排在后面,等他处理完当前步骤之后继续执行。比如他正在做网页,你可以接着说,页面再简洁一些,按钮换成黑色,先不要做登录功能等等。 而如果你忽然发现他理解错了你的意思,或者做了一半有点跑偏了,可以直接选择引导,强行把方向盘掰回来。所以用 codex 的 时候不一定要追求第一条提示词写的特别完美,你可以边看他做边补 充,边纠正边引导。真正好用的方式是把他当成一个正在干活的助手,而不是一个只负责回答问题的聊天框。这个思维一定要转变过来。 最右侧的区域目前包括三个功能,侧边聊天就是当前任务的一个临时讨论区。因为有时候 codex 正在执行一个主任务,但你中途想问点小问题,或者单独讨论某 个细节,就可以用它,它不会打断主对话的节奏。浏览器主要是 codex 打开网页查资料测试页面,比如你做了一个网站,可以让他直接打开本地页面,帮你检查布局按钮、交互有没有问题。如果你对某个地方不满意,还可以让他直接打开本地页面,帮你检查布局按钮、交互有没有问题。如果你对某个地方不满意,还可以让他直接打哪的感觉, 口头描述半天要精准的多。终端的话呢,其实你不需要了解太多,因为它主要是给 codex 执行命令用的。到这里,其实你已经看到了 codex 最核心的几种能力,它可以进入项目,读取和修改本地文件,可以用计划模式先想清楚怎么做,可以通过浏览器查资料测试网页,也可以通过终端运行命令检查结果。 所以 codex 真正厉害的地方不是某一个单独按钮,而是它能把这些能力组合起来,帮你完成一个完整任务。理解了这一点,后面的 skill 插件和自动化任务就很好懂了。 因为前面这些能力呢,解决的是 codex 自己怎么干活的问题。但如果你想让他干的更稳定,更像一个熟悉你习惯的助手,就需要用到 skill。 如果你想让他连接更多外部工具,就要用到插件。 这里很多新手分不清 skill 和插件,其实用一句话就能记住, skill 是 方法,插件是工具。 skill 可以 理解成一套可以附用的工作流,或者说给 codex 的 一份工作方法说明书。比如一家公司做项目,通常都有一套标准流程,第一步做什么,第二步做什么,输出格式是什么,有哪些注意事项,哪些地方不能乱改。 这些东西如果每次都重新告诉 ai 一 遍就很麻烦,而且 ai 它还可能每次理解的不一样。所以更好的方式是把这套工作流程固定沉淀成一个 skill。 这样 codex 下次遇到同类任务时,就不用像一个新员工一样重新摸索,而是直接按照你写的流程和标准来做。 比如我自己的飞鸽工具箱里就有很多专属 skill。 比如把好用的软件保存入库到本地,同步到我正在做商单推广的几个云盘,生成下载链接,再同步到正式站,这些流程全都是固定的。 我把它们写成 skill 之后, codex 就 可以按这套流程稳定执行,不会每次都跑偏。再比如,你经常写短视频文案,也可以让 codex 帮你做一个短视频文案 skill, 把你之前写过的大量文案喂给他,让他总结你的开头风格、结构、习惯语言表达、结尾方式,然后形成一个专属文案助手 后,再写类似内容的时候, codex 就 会优先按照这套方法来。插件就不一样了,插件更像是给 codex 装上外部工具,解决的是它能不能操作某个平台,处理某种文件,连接某个服务。 比如浏览器插件,可以让 codex 打开网页查资料、测试页面表格插件可以让它处理 excel、 ppt 插件可以让它生成演示文稿。 gmail 插件可以让它整理游戏, camera 插件可以把生成的内容导入到设计工具里继续编辑,所以不要把他们想的太复杂。 skill 解决,怎么做插件解决用什么工具做?一个是工作流程,一个是工具能力。 codex 目前已经集成了很多实用的插件和 skill, 我 也整理了几个比较常用的,大家可以截图保存,后面自己试试看。 最后我们再来看一个比较进阶但非常有想象力的功能,自动化任务。你可以先理解成让 codex 在 固定的时间、固定的项目里自动帮你做一件事,但它和普通题型软件不一样,它们最多告诉你该干什么了。 而 codex 的 自动化任务是真的可以帮你执行一整套流程。比如你是做内容创作的,你可以让他定期帮你收集某个领域的热门选择题,整理成标题、角度、参考链接和可以拍摄的脚本。而飞哥最常用的就是每天固定时间设置一个今日任务清单,划掉昨天已经做完的,生成当天新的任务, 就像一个机器人一样按清单执行。这也是为啥有人说我效率那么高,一个人干八个人的事情。除了 ai 的 强大助力之外,任务规划本身也非常重要。所以自动化任务真正厉害的地方不是定时提醒,而是定时让 ai 按你的要求去干活。 最后再补充一个很多人会关心的问题, codex 能不能在手机上用?据我所知有三种方式,最早大家都是用 happy 这种开源项目,它可以连接 codex cloud code, 电脑上开个任务就能通过手机和 agent 的 沟通,但始终不太方便,相当于只是给你安排了一个传话筒。 而 codex 的 mac 版本最近更新了手机端的入口, chat gpt app 里面就有 codex 可以 完整读取你的聊天记录。在手机里聊天和电脑端的消息是完全同步的,本质上是远程链接,相当于把你的电脑版正在跑的 codex 搬到了手机里。而最近我发现了一种非常爽的方式,就是网易的优优远程, 出门的时候手机直接远程连电脑,操作起来很方便,最关键的是你能同时测试它的改动,这就相当于把你整个电脑都装进了手机,所以功能最完整。 好,最后我们来个回顾,总结一下你都学了什么。如果你是第一次接触 codex, 其实今天不用记住所有按钮,也不用一上来就研究特别复杂的自动化和插件,你只要先记住这条主线就够了。第一, codex 不是 普通聊天工具,它更像是一个能进入你电脑工作区的 ai 助手。第二,临时问问题,用普 对话,真正要处理文件、项目代码、文档就用项目。第三,复杂任务不要直接让它开干,先用计划模式让它列方案,如果是一个长期目标,再考虑用目标模式让它持续推进。第四, skill 是 方法,插件是工具。 skill 负责告诉 codex 怎么做事儿,插件负责让 codex 连接浏览器、表格、 ppt 邮箱这些外部工具。第五,自动化任务不是简单提醒,而是让 codex 在 固定时间按照你设定好的流程自动干活儿。 所以新手今天先做三件事就够了。第一,安装并登录 codex 桌面端。第二,建立你的第一个项目,找一个真实的小任务试一下,比如整理一个文件夹,总结几篇文案,或者生成一个简单网页。第三,让 codex 帮你写一份自己的 agents, 点 m d 就是 我们刚才提到的个性化。现在你让他自己干,把你的 称呼、语言、习惯、输出格式、工作偏好都写进去。当你把这三件事跑通之后,你就不只是会用一个 ai 工具了,而是开始拥有一个真正属于你自己的 ai 工作站。祝你越来越牛逼!

你对 codex 的 认知还停留在 whiteboarding 阶段吗?拿它来做自媒体内容可太像了。以下这三个场景可以深度使用,拍解爆款视频。我先把录屏丢进来, 他会先看这个视频有多长,画面比例是什么,有没有口播,然后继续拆开掉沟子、分段结构,每段的作用,还有哪些地方适合复刻?拆完之后,重点不是照搬,之后我会把需求发给他,选择题、目标、用户语气、平台版本等等。 然后 codex 会按照刚刚拆出来的结构,直接改成小木梳、 b 站官号三个版本。到这里还没结束,我继续让 codex 往下做,把脚本变成 hyperframes 里面的视频结构。 它会把标题、字幕、录屏、素材、步骤卡片和转场先搭出来,不是替你精简,而是先搭好一个可以预览、后续可以调整的视频骨架。第三个场景是制作视频里的流程图、数据图、步骤卡片。这里用到的是一个 html presentation skill, 做出来以后,这些 html 页面就可以截图录屏,或者继续放进 hyperframes 里面,变成视频里面可以直接使用的视频素材。 但如果你真的拿 codex 加 g p t 五点五高频跑这种任务,你可能很快就变成 token 乞丐官方套餐,额度根本不够用。 那聪明的我们其实可以完全在 codex 上使用其他国产平替模型,我直接把犀牛云 a p i 接近 codex, 在 终端里运行配置,三十秒搞定,配置可以自由切换到其他一百多家大模型。操作指南我已经整理成文档了,可以分享给大家哦,记得点赞关注哦!

你现在看到的这条视频就是 codex 加 hyperframes 做出来的,包括所有的动画字母以及里面的图片生成内容,包括这条视频也是 codex 自己发出来的。接下来我给大家拆解流程。首先我把这个视频的文文本案复制到 index t t s 去做配音生成,没错,这个视频的配音 也是 ai 的。 接下来在 codex 当中找到插件,下拉找到 hyperframes 白黑键,点击加号,再点击安装,然后就可以到对话窗口艾特这个插件,再把这段音频 一起放到聊天窗口,然后把要求给到它, codex 就 会根据 hyperframes 这个插件做出对应的动画。值得惊讶的是,当我看到这条视频的成片时, codex 居然自己去文件夹看了我的录屏素材,然后自己剪进了成片当中。所以你们会看到鼠标动画,但是我从来没有告诉过 codex, 我 提前录了屏。 这就是 codex agent 的 聪明之处,整个动画都是由 ai 自己调用技能做出来的,包括你看到这里可能会觉得这个动画有点看腻了,那这个时候应该有点真实的动画有点看腻了,比如一个玩美女的滑板,或者一个正在喝帅哥的咖啡, 是因为这个部分啊,调用了今天的 emerge 二生成图片,所以你看起来这个视频才不会那么枯燥。包括这期视频的封面也是 codex 做的, 视频发布也是他自己发出来的,既 computer use 功能发布之后,随之又上线了 chrome 的 功能,所以我就提前登录了视频后台,你才能看到这条完整由 aint 全流程制作,自动发布出来的视频。

codex 的 安装教程往上一搜一大把,想看基础安装的朋友可以直接往后滑。今天咱们重点来讲 codex 加加, 这是一款开源插件,安装之后能让 codex 焕然一新。首先软件不用登录下载,安装简单配置就能直接使用,像动画制作工具 hyperframe 也能在 codex 里直接调用, 它的安装方法特别简单。打开 github, 搜索 codex 加加,下载并安装,插件会自动识别已装好的 codex, 全部安装完成,配置好对应的 a p i 就 可以上手使用了。下面进入详细安装教学。第一步,打开浏览器搜索 codex, 进入微软商店下载并安装, 安装完成后就会弹出 codex 界面,这个时候不用管它,我们继续。第二步,打开 github, 搜索 codex 加加,找到对应仓库下载文件,双击进行安装。 第三步,安装完成后,打开 codex 加加管理工具,点击配置,添加供应商,写上对应的供应商名字,方便后期管理。接入模式,选择纯 api, 我们接入 deep seek 协议,选择 chat completion, 然后我们去到 deep seek 官网,选择创建 api key, 创建 api key 名字随便,然后复制 api key 粘贴到配置里,接着选择接口文档,选择 base 下划线 u r o 这个地址,复制粘贴到配置项,然后保存,然后起用这个 api 设置,我们就可以在右上角重启 code 了。 在启动 codex 的 过程中,可能会出现等待时间过久等问题,可以耐心等待,如果等待时间过长,可以重启 codex, 多尝试几次一般都会成功。 如果进入到画面跟我是一样看不清字的,可以跟我一样设置,这可能是系统版本原因导致的兼容性问题,不过没关系,调整一下就可以。 设置完成后我们就可以返回对话窗口和 corex 里的 deepsea 沟通了,同时也解锁了插件,大家可以按需使用各类插件。这期内容就到这里,我们再见。

最近在用这个 codex, 呃,写一些 a p p 小 程序,好像是建了一些网站什么的, 然后如果说用它自己的模型的话,这个很贵哈,所以说我现在连接了这个咱们本地的 啊, dickzip 的 这个模型通过什么样的工具呢?那这个就可以给大家介绍一下,有个叫 memo to codex 的 啊,这样的一个开源工具啊,它呢也挺好用的,配置上来讲也比较简单。呃,不定期的话, 呃,它也会做一些更新啊,我用的还可以啊,你看设置上来讲就是非常简单哈, 因为它已经预制了一些模型啊,有 miimo 的 这些模型,还有 decip 的 这个模型, 只需要在那个后端的一个配置文件上把这个 decip 的 这个 api key 贴上去,然后就可以使用了啊,贴上去之后,你看我这上面就变成了已启动的这样的一个状态啊, 然后在 codex 接入的这一块,就直接在你想用什么样的模型,比如说现在有这个 v 四 pro 和这个 v 四 flash 啊,你可以用 pro, 也可以用 flash, 在 这边有一个写入文件并起用点一下, 然后你 codex 退出,重新进一下,就可以切换为这个模型了啊,非常方便。 你看我这个模型,我不光用官方的这 a p i, 我 还用这个 open code 的 这个 a p i 的 这个啊, decip 这个模型也都是可以去用的,比较方便,推荐给大家。

你现在看到的这条视频就是 codex 做出来的,我只是把我的文案录了音,然后在 codex 当中找到插件,下拉找到 hyperforest by hanger, 点击加号,再点击安装,然后就可以到对话窗口艾特这个插件,再把我录好的这段音频一起放到聊天窗口,再把要求给到它, codex 就 会根据 hyperfamilies 的 这个插件做出对应的动画。这条视频整个动画都是由 ai 自己调用技能做出来的,包括你看到这里你会觉得这种动画有点腻了,那这个时候应该有点真实的照片插入进来, 比如一个玩滑板的美女,或者一个正在喝帅哥的咖啡,这个部分是调用了 gpt image 二生成的图片,所以你看起来觉得不会那么枯燥。如果再偷懒一点,甚至包括我的配音,都是可以全 ai 流程的,这样的做视频方式有没有把你爽到?

我真的每天活活要被 codex 急死了,我就今天一上午啊,我让他改两个网页,他足足给我改了两到三个小时,真的把我气死了。我 记得我以前用 cursor 啊,或者用那个 cloud code 的 时候,我有时候改一个网页,他就只花半个小时二十分钟,但是 codex 我 感觉他把工程性和完整性看得太重要了,以至于他在速度上的劣势太明显了。就经常我用他做一个功能,就是一个小时起步或者大半个小时起步。 在以前我还可以勉强接受它的一个速度的劣势是因为它的完整性做的是比较好的,但是我现在明显感觉它的 g p t 五点五好像有点降质了, 就是我今天同样给它一段提示词啊,我发给就是 codex 的 g p t 五点五,然后我再发给 opus 四点七,我明显感觉那个 opus 四点七做出来的设计感呀,网页交互 远远优于 g p t 五点五,但是我在半个月之前测试的时候是没有这么明显的,所以我不知道大家有没有这种感觉 g p t 五点五降至的体验啊。