粉丝46获赞378

你可以不去学其他 ai, 但一定要想办法学会 codex。 codex 可能是目前普通人最值得学习的 agent, 这期视频我会手把手带你从入门到实操,全流程了解 codex 是 什么,它能干什么, 并且跟我一起实操,从安装到操作的使用,个人的网站搭建、文档制作、视频制作、自动化的工具开发以及办公和编程场景的真实使用。如果你是在校学生或者是白领工作者,看完这期视频,有可能会改变你对 ai agent 的 认知。 就连英伟达的老总黄仁勋,世界首富,他都已经让他的员工用上扣贷了。这期的含金量可谓是看完这期视频,你就能够真正上手你自己的 ai 员工扣贷。我也把这一期的文字课件整理成文档。好了,话不多说,点好收藏、关注、赞,我们现在出发! go! go! go! 那首先你要明白 codex 它到底是什么?很多人第一次接触 codex, 就 会以为它是另一个拆开 gpt, 其实不是普通聊天应用呢,它更像一个机器,你问个问题,它给你答案,它能教你写代码,做表格,写报告,但最后动手的还是你自己。而 codex 它就不一样了,它属于 agent, 也就是智能体,除了能够思考,还能直接帮你把任务完成。 举个例子你就明白了,假设你要给家里做一次彻底的大扫除,第一个人呢,就是拆个 t p t, 你 把客厅、厨房、卧室的照片都发给他了,他会告诉你先擦窗户,哎,最后再拖地。厨房的油污呢,要用某某某清洁剂,分析的是头头是道,那说完就结束了,最后留下干活的还是你自己, 而第二个人呢,就扣袋子,你只需要给他说一句,帮我把家里大扫除一遍,他呢,就会自己动手帮你擦窗户,拖地、洗窗帘、清洁油污, 干完了还得把结果拿给你验收一遍。甚至还能同时安排专业的扫地机器人、洗地机、擦窗户机器人一起工作,客厅、卧室、卫生间同时处理,它们之间呢,还互不影响。这就是 agent 和传统聊天 ai 机器人的最大区别, 一个给建议,一个从给建议到事情一起给你做完。而放到工作里也是一样的。传统 ai 呢,只会告诉你下一步我应该怎么做,而扣 test, 它就会帮你创建文档,整理资料、运行程序到操作浏览器, 一步步的把结果给你执行出来。 ok, 我 们在使用 koata 前唯一要准备的就是一个叉七 ppt 账号。没有同学也不要慌张, koata 现在已经可以完美的接入国产模型了,快,而且还便宜。后面呢,我也会单独注一期如何把国产模型 deepsea 接入到里面。 这一次咱们主要讲讲 koata 从安装到实操的主要步骤。如果你是重度用户或者是公司来说的话,可以考虑一下 pro, 它的额度呢,会高很多,需求没有那么高的话, plus 就 够了。我现在就是 基本每天我自己使用是够了的,大概每五小时可以发三十到一百五十条给扣贷,正常使用的话,一天肯定是够了的,免费的也行,只是额度呢,会少一点。那我们安装好扣贷之后,登录你的 g p p 账号,有个同学下载之后呢,发现是英文界面,莫慌,我们改语言就好了,设置语言呢,在左下角的设置里选择设置,然后再默认的 常规选项里面这里有一个语言,那我们在这里选择中文,这个时候他就会变成我们自己人了,如果你打开直接就是中文,那就恭喜你直接可以跳过这个步骤了。那进来之后呢,大家可以看到这个对话框和侧边栏还是蛮眼熟的,那左侧栏从上到下分成这几个部分,那最上面是四个功能按键, 第一个叫新对话,给扣带斯布置新任务的。第二个叫搜索,用来在你历史对话里来搜索关键词的。第三个叫插件和技能,用来给扣带斯加装备的。 第四个叫自动化,这个真是我们懒人的福音了,为什么会这么说呢?视频的后面我会详细给你讲讲,而这中间会有两个特别重要的列表,一个是项目,一个呢就是这个对话了,这两个东西可不一样,对话相当于你在给 ai 对 话,和你在网页端和 ai 聊天差不多,适合一些比较琐碎的工作, 帮我查资料或者是回答一些我的问题。项目呢是一个比较强大的东西,每个项目呢都对应着你电脑上的一个文件夹,你在这个项目里做的所有事情,生成代码、文件、 ppt 都会保存在你这个文件夹里,不会丢失。而每个项目下面又可以有很多对话,一个对话呢去处理一件事情,你可以理解为项目就是一个大的文件夹, 而对话呢就是这个文件夹里一个个的工作现场。最下面是设置按钮,点进去呢就能管理我们各种的配置,那右侧这一大片区域就是和扣代码的主要工作地方了, 下方呢就是输入框,你可以在里面直接输入中文,告诉他你想做什么,而这里的功能和旁边权限呢,如何使用,我们在后续的实操案例里也会慢慢的给大家讲解透彻,这样呢会更好理解一些。那么下面我们就用扣袋子来创建第一个项目, 首先看左上角,然后我们点击这里,他就创建了一个新的对话,你也可以在项目里去创建对话,项目就相当于大文件夹嘛,里面呢就可以放很多你给他不同内容的对话,当需要处理复杂内容的时候,我们就可以先去创建项目,在创建项目中再去创建对话,这个时候下面的这些对话呢,就相当于我们项目的一个个的工作现场。 创建好之后,我们在右侧工具的输入框里面直接输入中文,告诉他我们到底想要什么,此时需要注意,我们在输入框下方,这里显示的就是我们当前使用的 ai 模型和思考强度了,目前 g b d 五点五呢,算是比较强的模型了,所以他默认的呢也是这个模型,那选好模型之后,我们可以直接看思考强度,这里也有显示为 一中高和超高这四档,而这个参数呢就决定了 ai 在 回答你问题前想多久,想多深。一般处理日常任务的时候中档就可以了,如果你处理比较复杂任务可以调高一档。除了思考强度和模型之外呢,这里还有速度,有两个档位的选项, 标准和快速,而我们处理日常任务的时候,使用标准模式就可以了,赶时间的时候呢,我们可以直接切到快速。在旁边就是一个麦克风的图标了, 嫌打字麻烦,你就可以用语音去输入需求,这样呢也会方便很多。输入框的左侧呢会有一个加号按钮,点开之后可以上传本地的个人文件夹。 那还有一个就是计划模式的选项,开启后呢,扣在此只会给我们讨论方案,不会直接更改任何文件。当我们确定方案之后,他呢才会去动工。 加号旁边呢显示的就是你当前的权限模式,这里呢会有三个模式,默认权限,自动审查,还有完全访问权限。打比方,你用扣袋子到你家里来做家政清洁,在默认权限下呢,他只会在你指定的房间里面去打扫,如果涉及到其他的房间区域,他呢就会来询问你了。那在自动审查下,他呢就会有自己判断,哎,这个东西我可不可以做? 如果他判断为危险,他呢就会来询问你,如果他判断为不危险,他呢就会自己去操作。我个人觉得这个模式下呢会比较省心一点。而完全访问呢,就是扣代斯把你家当成他家了,此时在你的电脑上,他几乎什么都可以干。而在这个模式下呢,扣代斯在做什么,他呢就不会再来询问你了, 可能会搞一些你不想要的操作。所以如果你是新手的话,不建议你一上来就开这个权限,保持默认和自动审查模式。等你非常熟悉扣贷行为了,并且你的项目有 get 备份的情况下,再去考虑放权的问题,接下来我们看一下输入框的左下方, 这里的按钮是选择扣贷死干活的场景的。总共呢会有三个模式,本地、工作处,还有云端。那首选呢,就是这个本地模式。 这个呢,也是比较简单直接的模式, co ds 呢,它就会在你的电脑上的文件夹去直接修改,那它改了什么呢?你也能在这个文件夹里面去马上看到。这个模式下呢,就比较适合小手术,比如给我改个样式,整理个文件,加几行代码等等, 如果它改坏了的话,你需要手动撤回。所以用本地模式钱最好,养成随时备份的好习惯。而这个工作数模式呢,是 co ds 一个比较核心的功能。什么叫工作数呢?假设你有三个员工, 同时让他们去修改一个总结报告,他们三个人同时在一份 word 里面去打字,瞬间就乱套了,他们之间呢,还会互相的去覆盖内容。而工作数模式就像你给每个人单独的去分配一份任务,最后再自动合并成一份完美的中稿。 云端模式,它会把你的任务发到 open ai 的 服务器上,哪怕你已经关了电脑任务呢,它也会在云端自己跑起来。最后我输出结果了,它会放在那里等我们来验收。但你要使用云端模式,你就要连接一下,给它仓库关联扣在 smart, 所以 配置呢,会复杂一点,大多数情况下呢,它不会用到这个模式,我们初次体验的新手呢,就不用管了,知道有什么概念就可以了, 平时使用本地模式和工作数模式就足够了。这里插个小提醒,如果你的扣带子把代码改坏了,这个时候你正好用的是工作数模式,不用担心,这个模式下它具备独立副本,直接扔掉就行。如果你用的是本地模式,那就需要在叉一面板里面去点击全部撤销,或者在终端里面去输入 get checkout, 它呢就能回档了。 所以说让扣代词去改什么东西之前,我们先要提交,这样即使它改成什么样,我们都可以给它退回来。那下面第二个功能搜索,就是帮你在扣代词所有的历史对话里面快速的找到之前的对话信息。假设你要找到之前的项目和对话,但是你这段时间操作项目和对话太多了, 那我们就可以点击这里,然后通过搜索关键词,它呢就可以搜索出项目和对话,甚至还有文本记录,这个搜索功能可谓是真的方便。 介绍完了新对话搜索,那我们就来聊聊右侧的这个扣带斯聊天框,我先给大家演示一下聊天框具体能让扣带斯干什么, 你想装一个 node js 或者是其他的 a 帧的,以及做其他项目一些必备的工具都不再像过去的时代那么麻烦繁琐了。现在呢,有了扣带斯,我们直接截图扔给他就可以了,怒声一顿火锅钱。而且呢,我们在使用过程中遇到任何问题,我们都可以去问扣带斯, 什么瞎死了,马挂了,升级又翻车了,都可以让科特斯直接帮你修,是不是很方便?现在呢,我就直接在输入框里给科特斯说,帮我安装一个可牢扣的,好给他发过去,他现在开始来检查运行环境, 不去执行了,以前呢需要看各种的教程资料,现在呢,都不需要我们来操作,真省心啊。包括我们有任何想法,不管是让他去执行项目或者查资料问问题,我们都可以直接和他对话。扣贷 s 呢,他的回答也会非常清晰,一步步的来引导你把你的想法执行和展示出来。 ok, 我 们现在已经基本上掌握了功能区的前两项, 现在开始进入扣贷 s 核心,也是最有意思的部分,插件和技能。点击左上角的插件按钮之后,进去之后会有两个页面,插件和技能 这两个概念会有很多人搞混,其实区分他们还是很简单的,那插件呢?大多数是让 a 智能跟外部平台工具服务器连接的作用,装上插件之后,你的 ai 智能体就有了操作软件或者是服务器的功能。那 skyo 它的底层逻辑是我们在使用抠袋子过程中来回复用的方法是流程和工具的组合, 用于做某些具体任务的时候抠袋子的行动指南。那咱们又如何能调用这些插件和技能呢?别担心,咱们不需要提前去部署一些复杂的依赖 抠代码,它会根据你的任务自主来判断用不用调用这个插件或者是技能。但如果你就想点名用这个插件的话,那我们就可以在输入框里输入 at, 然后呢它就会弹出这样的一个插件列表,选择你想用的,到时候手动触发就可以了。 那我们接下来点开左边的这个插件栏,这里呢已经默认帮我们打开了好几个内置的插件了,比如说操作浏览器的,还是给它表格的 ppt 这些,有需要其他插件的话,那我们也可以点击这里的加号来进行安装。那重点呢是这两个插件,这两个功能呢,分别是操作你的浏览器,操作你电脑上的软件或者是网站, 相当于我们雇了一个手替。好,那接下来我给大家操作一下,我是如何用插件来做一个有声音有动效的高质量视频的。那首先呢,我们先安装插件,然后在这里直接搜索 app friends, 那 我这里是已经安装好了,然后再继续搜索一个 remote, 哎,这里也已经安装好了,那我安装好之后,我就返回到这个对话框中,然后我们在这里调用第二个插件。扣带子呢,它也会调用一米尺二来生成图片,那我让它生成几个人类进化史的图片,再使用 have friends, 然后生成对应的视频。那我们再用 remotion 生成一个动效,以及再用一个音频插件生成一段舒缓的音乐,然后呢我们就可以开始生成了。那我大概是等了有个音频插件生成一段舒缓的音乐,然后呢我们就可以开始生成了。那我看一下效果怎么样, 效果是不是还可以?如果我们不满意的话,我们还可以跟 ai 持续的对话来完善我们的细节,每一帧,每一个画面呢,都可以自定义的。我这里呢是让它自己生成了几张图片,也没有给它更多的指令了。 这里我只是做了一个简单眼上,虽然效果不是那么的惊艳。如果你有自己的一个素材或者是内容的一个阴鬼,我们都可以告诉 ai, 让它直接对接上去, 是不是很简单?这只是一个指令,给到 ai 生成的一个视频效果,当你有更好的想法或者是详细的思路,那你做出来视频肯定会更好,包括你自己喜欢的一些专场特效,我们呢都可以告诉 ai, 它呢也可以来实现。如果你想生成 excel 表格,那用的呢就是这个插件,那接下来输入框里我们就发送这一段指令, 然后我就可以得到一份详细完整的 excel 文件了。看这效果真是相当不错了。原来我做一个这样的文件,又是查资料又是核对信息的,估计几个小时也是做不出来这样的一个效果。另外,我还想生成一个 word 文档的话,那输入框里面我发送这段指令, 那生成完成之后呢,我就可以直接在 code 里面点击文件名,然后我们打开预览一下,这个效果相当 ok 啊。那如果我不满意的话,我还可以在预览键的下方这里输入框里继续让它更改好插件。说完了,我们再聊聊 skill。 举个例子,生成一张图片的流程呢,是要先确定好画面的描述风格,再去调用生图模型去输出图片,把这一套流程的注意事项打包写成一个 macdunk 文档,它呢就是一个 skill。 那 在此之前呢,还需要在你项目里的根木下去创建一个文件,叫 agents 点 md, 那为什么我们要创建这么一个文档呢?主要是因为我们在一个项目里新开一个对话的时候, codex 呢,它是没有其他窗口记的很多注意事项,我们在其他对话窗口里面呢说过一遍,但是返回到这个对话窗口里,它是不记得的,所以我们还是要再说一遍。但如果你想做的项目比较复杂,需要开很多个窗口定型的去执行任务, 那就会很麻烦。所以我们新建这个文档呢,就是来解决这个问题的,你把规则写到这个文档里,他呢就不会再忘了。就像我们给新来的同事一份入职手册一样,我们这个部门的规矩,第一条是什么,第二条是什么,一次性的全给他写清楚, 以后他的做事呢就会按照这个手册来,这样 codex 在 每次起送的时候呢,他呢就会按照这个手册来干活了,把里面写的规则当做工作手册来执行,那么这就是一个长期记忆的 skill, 这是 skill 里面具体怎么写的话,我们之前呢也有详细聊过,感兴趣的同学可以去复习一下。 codex 最后一个功能呢,就是自动化了, 可以说是扣代数自动化,定时做任务,假如你每天都需要执行整理数据或者写报告,那就一定会用到他这个能力了。自动化有个非常简单的用法,就直接在对话框里用自然语言告诉他,给我设置一个自动化的任务,比如每天九点帮我去搜集今天的热门话题或者是数据, 然后给我生成一份报告,再用表格的方式再返给我,那他呢就会帮我去创建这么个自动化的任务,那对于我来说,这个功能确实能省去我每天反复的工作了。 ok, 我 们再来看左上角的自动化,这里 他呢已经帮我设定好了这么个任务,在这里呢,我们可以随时让他更改自动化的任务时间,那改成早上十点去执行,那在这里改成什么时间都可以哈,看我们每个人的需求就可以了。 除此之外,还有个创建自动化的任务方式,那我们鼠标移动到共同区,然后这个自动化里这里有一些官方的参考案例。我们选择新建一个自动化之后呢,我们就可以用题旨词写好这些自动化到底是要做什么的,可以在这里选择什么时间执行这个自动化任务, 然后在这边选择模型和思考的强度,最后点击创建就 ok 了。在这个地方呢,你还可以看到你创建的所有自动化的任务列表,点击对应的任务呢,就可以进入到这个任务的详情页了。左边是这个自动化的详细描述,那右边呢就是各种的参数, 比如状态,下一次的运行时间,运行的环境,或者是具体在哪个项目文件夹里面去运行的,你也可以在右上角去选择暂停或是删除这个自动化的任务。如果你是初次使用这个功能的话, 我建议你在输入之前呢,提前自己试一遍,确定好这是我们想要的一个效果,那我们再去创业一个自动化的任务,不然到时候跑出来效果不符合我们的标准,这不纯纯浪费额度吗?说到使用额度,有的同学就要问了,你做了这么多案例,你到底消耗了多少额度? 又怎么查看我剩了多少额度可以用呢?这个呢有两个方法可以查看,一个呢是左下角设置,我们点开之后有一个剩余额度,那我们就可以看到五小时内我们还剩下多少,本周内又还剩多少, 这里呢还会有一个刷新时间的提醒。那另一种方式呢,我们就可以直接在对话框里输入斜杠,然后找到这个状态,然后打开之后,它呢就会在这里持续显示我们一个上下文的余量,同样有五小时和一周的限额。说实话这个扣贷四的额度呢,还是很大方的,二十刀的一个额度,我认为是可以满足我们大多数人日常工作的高频使用的, 但有的时候我们用着用着它就会提示已达到使用上限。不要慌,刚才也提到了 gpt 账号每五小时它是滚动刷新的,意思就是五小时前你发的信息,它呢就会过期,就会腾出来额度,所以不用着急,等几个小时呢,它的额度就会出来了,如果你觉得还是不够用的话,可以升级到 pro 版本。那我们还有什么方式可以进一步的节省我们宝贵的额度呢? 当然有,就是在我们的上下文上下功夫。那怎么去查看我们的上下文呢?在这里我们就能看到了这个小圈圈就代表我们现在这个对话框里里面所有的操作,一共使用 gpt 五点五多少上下文的窗口。 如果我们把鼠标悬上去之后,他呢还会有一个更详细的信息,当上下文快满的时候,扣袋子呢,他就会自动帮我们去压缩上下文。 其实当我们一个任务高于段落之后,不用等到他自动的压缩上下文,我们可以通过斜杠然后压缩这个命令去手动的压缩上下文, 这样呢就可以让模型专注到我们的新任务上,而且还省一点额度。看到这里的同学,那么恭喜你,你已经学会了如何使用扣贷。接下来我们直接上实战做一个网页的开发商,听起来是不是很难很复杂?那是在以前,我们现在有扣贷,那我们就可以直接在对话框里输入我想做一个 宠物猫咪的主页,然后我们把这个加号点开,点开我们的计划模式,因为做网站他还是会复杂一点的。那点开这个模式之后呢,他会帮我们出一个比较详细计划,我们确认之后他呢才会开始执行。所以打开这个计划模式呢,就比较适合我们做一些比较复杂,或者是连我们自己都没有想清楚的任务,这样呢我们就可以跟 ai 讨论出一个计划来。 ok, 因为我们提示词比较简单,所以他看到我们项目中是没有内容的,他呢就用这种选择框的方式来询问我们其中的细节,那有这些选项,大家可以按照自己需求去选择就 ok 了。那我就选一个温柔可爱吧。如果我们点开这个小叹号的话,还能看到他说的这个风格到底是个什么意思, 这种小细节还是我比较喜欢的点,那我就选一个他推荐的吧,主页的内容到底是按哪种资料来设计的?如果说这个选项里面没有我们满意的,我们就可以选择最后一个,在这里去填写我们的一个详细要求。那这些步骤都完成之后呢,他给了我一份详尽的计划单,问我们是否实施这个计划, 那我基本看了一下,其实没有太大的问题。 ok, 我 们看一下其实大差不差了,我们确认开干。 ok, 他 现在开始初步化项目了,一步步的帮我们生成里面的内容,那在这个过程中呢,肯定是需要一点点时间的。 ok, 他 终于在跑了七七四十九分钟之后,网页呢就完成了,我们来看一下效果,其实扣袋子他有个内置的预览浏览器,那我们可以直接打开右边的这个侧边栏。 哎,这个网戒效果确实是不错啊,不过现在的 a 政策呢,其实都有这么一手了,那他这个浏览器呢,还有一个独特的功能,我们点击右上方的这个批注按钮,然后呢他就可以实时的去修改,然后你刷新一下浏览器,那马上就能看到最新的效果了。我们可以在这个页面上,然后选中这些具体的元素去提出修改意见, 包括重新生成图片,比如说这个 logo 呢,就会加上我们想要改动的批注,我们点击发送,他呢就会针对我们的意见去进行修改, 是不是还挺方便的?你看啊,修改后的 logo 呢,也是对的,也没有过度修改,也严格遵循我的要求去修改了。这要是放在两年前,一句话,脑袋里一个简单的想法,几分钟就能做出这样好看的一个网页,前端页面还可以随时修改好,现在调整的是满意了,但这个网页只能在你的本地电脑里跑, 你把电脑一关,别人呢就看不见了。要让别人都能通过一个网址去进行,那就需要部署了,什么意思呢?就把你的电脑网站代码交给一个云平台,让他去帮你运行,然后再给你一个公开的网址, 任何人任何时间访问这个网址,就都能够看到你的网站了。那常用的云平台呢?有这几种,想要登录上云平台,你就需要安装这个插件,我们在插件页面搜索他,然后安装,安装时呢,他会让你登录这个账号进行授权,然后回到对话里面,直接艾特他, 让他把这个网站输入上线。那不一会呢,扣代码他就不是完成了,给了我一个公开的网址,现在任何人都可以通过这个网站来访问我的网站了,是不是很简单?当我们看到对话框中提示这个的话,他就是做好了,我们打开看一下效果, 你瞅瞅这效果,你敢相信是一句简单的指令, ai 几分钟给你生成出来的,而且还部署上线了。最后呢,给大家总结一下使用口袋思注意事项,如果涉及到文件操作,哪怕只是一个简单的文本文件,建议优先使用项目文件, 这样的话,你生成的文件它就会有一个固定的管理位置,就不会太乱了。一个任务只开一个对话,不要在一个对话里面去塞十几种不同的任务,因为每一个任务它都是独立的话, ai 表现呢,它会更好一些。遇到复杂任务,我们可以先点加号里面的计划模式,或者直接在对话框里说先给我制定一个计划, 暂时不要去执行,等它列出了打算干什么,分几步完成,有哪些文件,哎,你看了觉得没有问题,然后再让它按照这个计划去进行执行, 这样呢,会更稳妥一点。也要把完成的标准告诉清楚,不要只说给我修改这个 bug, 而是说帮我修改这个 bug。 做完的标准呢,是全部测试通过的,手动跑一遍也是正常的。当我们完成一个复杂的任务代码之后,可以新开一个对话框,请扣袋子再去帮我们审查一遍刚才我们修改的代码,重点要看一下安全性和性能,他呢,就能经常发现自己第一次没有注意到的一些小问题。 从今天开始呢,你就可以把自己当做一个项目负责人,而扣代词就是你招的第一个 agent 员工,他呢,就可以帮你拆解任务、执行任务、完成任务, 甚至去同时处理多个任务。很多过去我们必须亲自去做的事情,今天我们都可以交给 ai 去做。你不一定会写代码,也不一定要懂开发,你只需要把你自己的需求讲清楚就可以了,剩下的工作呢,就交给 agent 了。但这里呢,有一个非常重要的前提,就 agent 再强,他呢,也只是你的执行者, 而真正决定结果质量的呢,依然是你。所以未来呢,可能不需要我们去亲自完成所有的工作,而是学会如何指挥 ai 去完成工作,给目标定方向,做决策,最后检验你的成果。当你越了解自己的业务,越知道自己到底想要什么,就越能给出清晰的目标和上下文, 而他完成的任务质量呢,就会越高。因为我们已经从问 ai 时代走向了管理 ai 时代。如果这条视频对你有帮助,记得点赞、收藏、关注,我也会陆续更新 qts 的 相关内容。好了,我们下次见。

如何让 codex 像人一样操作电脑,自动帮你干活?比如让他帮你分析抖音数据,商品比价,或者取消那些讨厌的自动续费,只需三步,第一,更新 codex 到最新版本。 第二,装电脑操控插件。这里我们点击设置,找到电脑控制,点击安装插件,装上后, codex 就 具备操作电脑的能力。 第三,输入 at computer 命令,告诉他任务。比如打开抖音后台分析数据之后, codex 就 会自动操作浏览器处理。你只需要关注执行结果 之前需要自己操作的琐碎事项,现在只需说明目标, codex 就 可以帮你执行,省下的时间和精力可以去做更有价值的事情。关注我,持续分享 ai 提效工具!

靠代词非常好用,为什么大家现在不谈龙虾了?是因为靠代词太好用了,大家不需要买麦斯迷你养龙虾了。这也说明一个问题,如果我们觉得一项 ai 的 技术,大家用起来还是有点费劲,就像之前养龙虾一样,大家需要到企鹅厂的门口,让工程师帮你去安装, 那就说明他还是有门槛的。大家可以再等一下,一般两到三个月之后就会有替代的方案出现。现在靠在 s 的 易上手性就完全体现出来了,非常方便使用。靠在 s 号 tokin 吗?还是挺费 tokin 的, 尤其是年份,他直接做图和做视频,一般的控制浏览器执行固定化的流程任务。 tokin 的 消耗量还不算大,但是一旦涉及到图片和视频的处理, tokin 的 消耗量就会变大很多。 当然这也取决于你要用什么样的模型。你现在每天用 call 代斯吗?是的,我现在每天在用 call 代斯,像我现在每天做的麦兰 e a 跨境日报,就是全部由 call 代斯来取的,他会帮我按照我的要求定时自动的输出, 还是比较方便的。除此之外,我日常的阅读非书文档,生成 ppt, 做一些材料,还有我们简单功能的实现,也都是通过 call 代斯来完成的。 现在我们团队的技术开发,主要使用的也都是靠带 s, 我 建议每个人都用。靠带 s, 我是 建议的每个人都可以去安装一下。靠带 s, 你 可以使用网页版,也可以使用 app 版,里面有一个很大的前提,它可以帮助你去梳理你自己的流程, 将你自己的流程规范下来。另外还有很多 skill 可以 使用,但这里面有个非常关键点,有些 skill 是 有挖矿程序的,所以尽量自己去封装 skill。 有了 cosplay, 还需要去使用其他的 ai 的 视频创作、图片创作,还有发布数据分析相关的工具吗?还是需要的,因为 cosplay 相当于一只手,它能帮你去实现各种各样的功能,它本身是不具备各种各样技能的。比如你可以安排它去调用 珀莱娜去生成图片,它就去调用珀莱娜生成图片,但是实际生成图片还是在珀莱娜完成,你让它去调用 vivo 生成视频,它就去调用 vivo 生成视频。这个本身视频的生成还是在 vivo 完成, 或者你让它去调用麦兰 ai pk 官方发布接口去发布视频,它就去调用麦兰 ai 的 tiktok 挂车发布的 a p i 去发布挂车带货短视频。但 call the s 本身是不具备这个发布功能和官方审权限的,所以你可以把它理解成它是一双手,可以帮助你完成很多的事情。最后大家对于 call the s 有 什么的使用感受,欢迎交流。

不要太侮辱我粉丝智商了,什么用 codex 操控剪映剪视频,用 codex 操控 c 档四号生成视频,然后直接发布,或者是说用 codex 操回消息,这些目前通通都不太现实,但凡去跟你们讲这些的,都是没有在一线实际落地时操作的人。 codex 在 电商特别是服装行业怎么做落地? 我们一个一个来。首先我们说剪视频对吧?假设你的内容部门今天拍了两百条视频,然后你要让 codex 剪辑四十条出来, ok, 你 要怎么操作?你要先让 codex 去学习你要的视频是什么样子的,他的剪切点在哪里,他是什么风格,配什么 bgm, 怎么衔接内容。 ok, 他 学习好之后,你安装上这几个插件,然后开始训练他剪出来哪里不合适,一帧一帧的去扣细节,告诉他他错在哪里了,直接让他自我反省。 就比如说像他帮我自动剪辑出来的这种口播视频,你就只看到了啊,我把文案和口播视频丢给他,然后他自动剪辑出了成片,但是你没有看到这背后我的剪辑配置文件复杂到了什么程度,我属于是训练了他几天几夜,眼睛都熬红了,才把这个 md 文件给制作出来,然后他才能稳定的出到我想要的这种口播成片。 你也是一样,如果说你想要让他帮你大量的去剪辑出成片,那你也要去训练出属于自己的 md 配置文件。其次,怎么让 codex 去帮你生产 ai 视频?假设你现在看到同行的一条爆款视频,你想让 codex 啊帮你用 ai 复刻,那你要怎么操作?第一种方案, 直接上传对标视频,然后写上这个提示词,让 codex 分 析这个视频的风格,包括镜头节奏、画面氛围、拍摄角度、服装调型,滤镜的色彩以及场景的关键词。然后上传自己的产品, 让 codex 根据刚才分析出来的风格生成自己这个产品的视频分镜图。再拿这个生成出来的视频分镜图去生成视频,效果就 y y d s 比普通毛衣更有层次。第二种升级版的方案,直接安装这个 screen, 然后丢给它对标爆款视频的链接以及你的产品,然后它就直接出这个视频的分镜图,你就拿着这个分镜图丢给 zantar, 直接去生成视频就好了。 再比如说制作图片,假设你今天要上三十款衣服的一个链接,那你想让酷 max 帮忙,你要怎么做?先分别把每款衣服打包成一个文件夹,然后把所有的文件夹新建一个项目, 然后输入这个提示词,让它分别在每个文件夹中分析这款衣服,它的尺码款式,列出来它的卖点,它的主标题,副标题,它的一个详情页的风格,再输入这个提示词,让它直接生成每款衣服的一个白底图以及详情页,最后让它自动去上链接。 但是这个最后一步,我建议你目前还是考虑用人工的方式,不然的话你要训练非常久,而且它仍然非常容易报错。 再比如说你现在想要去做短视频带货,或者是说挂车,然后你觉得选品这件事情太消耗你的时间了,你想让 codex 去帮你选品,那你要怎么做?你直接告诉 codex, 记录你在选品平台里面的操作,比如说选择了类目输入的关键词,筛选销量翻页,然后以及提取商品链接和数据,录制完成之后把流程交给 codex 学习, 后续把它形成一个 skill, 只要你告诉他选品目标,比如说筛选高销量款、低竞争款,或者说适合短视频带货的款,他就能够按照你的逻辑和选品的流程 去执行操作。而且他在完成选品操作之后,你还可以让他直接去输出一个选品的分析文档,包括商品链接、价格、销量、推荐理由和这个风险提示,并且判断出哪些品适合优先去做测试。 还比如说你现在有一些新品要上新,但是你的主播不知道怎么去讲, ok, 那 这件事情交给 codex 要怎么办? 首先把你们行业的头部主播,比如说像女装的洛哥,男装的秦磊,童装的这个弱大王,或者千亿,把他们高光的一个奖品的内容,或者说他们的一个直播内容给整理出来,起码八个小时以上,然后把这些内容丢给 codex, 把他们的风格真留出来, 然后你把你的产品链接丢给 codex, 调用我这个 skir, 然后再加上你刚才蒸馏出来的风格,一个非常牛逼的,根据你这个产品的一个卖点,然后来形成的详细的一个讲解思路,以及详细的这个讲解话术就直接出来了,这样子的话,你还愁你的主播没有这个奖品思路吗? 最后一个加州玩法,比如说我想要知道我的同行每天到底有哪些数据好的视频,然后这些视频他的一个具体的一个销售数据是怎么样子的,以及这些视频做一个分析,再根据我的产品给出一些参考意见,甚至最后直接给出一个啊我的产品去复刻这个视频的一个 ai 分 镜图。 那像这个玩法我们要怎么操作呢?首先用这个 screen 新建一个定时任务,它会每天把你同行的爆款优质视频收集到非书多页表格上。其次再用这个 screen 和这个提示词,它会给出这些视频的详细分析,以及对你的产品要怎么拍的建议。最后再用这个 screen 和这个提示词,它会给出分镜图。 当然我这么拆分肯定就会有聪明的同学问了啊,老师,老师为什么要把这个链路分成三个 skr, 不 去做一个整合呢?因为它的整体的一个操作流程太长了,就是你中间环节很容易出现错误,所以说你必须要人为的去把控一下,看一下, 以及为了不浪费算力。以上就是 codex 部分啊落地的一些玩法,我是希望大家可以把目光更多的放在这些可以落地的方案上,而不是太过于去追求一些虚无缥缈的,比如说做成非常精美的内容啊,或者是说呃,让他去这个操控什么聊天软件去回消息啊,这些目前仍然是很难去落地的,就是他的能力确实很强,然后他也非常火爆,但是 啊,我们要更多的去关注到可以完成自己提升自己工作效率的一些地方,不然的话还是会跟那个小龙虾一样,这个大家都热潮,但是热潮一过去之后还是不知道怎么样去用,或者说没有去起到什么具体的效益,然后我是牧童,目前正专注于这个 ai 在 电商,特别是服装行业的一个落地,我们下期视频再见。

分享一个国内免费使用 codex 的 方法,我说的可不是只能用几天或者几周的短期薅羊毛方案,而是一个长期免费的稳定方案。本期视频是一个手把手的保姆级教程,我们把 codex 跟 hermes agent 的 模型替换成免费的 api, 零成本获得一线模型的 agent 体验, 足够覆盖日常任务。这次主要用到两个工具,一个是用于给 codex 换模型的开源软件 codex 加加,另外一个是大模型 api agnes。 agnes 是 全球权威榜单前十的 ai 模型公司, 开放了三款旗舰全模态模型的免费调用,分别覆盖了文本与 agent, 图片生成,还有视频生成三项核心能力。更棒的是这家头部模型公司的全模态模型可以长期免费使用。好,话不多说,我们直接开始。 我们来到 gitlab, 找到这个开源软件 codex 加加,这是一个可以给 codex 换模型的辅助工具。接下来我们来到 codex 加加管理控制台,在供应商配置这里,点击添加名称,填写 agnes 接入方式,选择纯 api 贝字 u r l 填写这一串。接下来是 api key, 我 们来到阿克尼斯的 api 平台,点击创建密钥,把创建的密钥复制一下,填写到 api key 这里。上游协议选择 chat 模型列表这里点击从上游获取,最后点击保存, 点击右上角的重启 codex。 然后我们进入到 codex 模型这里选择阿克尼斯二点零 flash, 打个招呼这里给到了回复就配置完成了。 arkness 二点零 flash 有 很不错的 agent 驱动能力,我准备用几个 skills 的 案例来实测一下。这里我想到一个需求,我们把 aknes 的 api 接入了 codex, 没有使用官网订阅,这样会有个小问题,就是不能使用 codex 内置的图像生成 skill。 所以 下一步我准备自制一个画图 skill 来代替内置的图像生成。 用好 agnes 的 a p i 覆盖全模态能力,提供图像生成模型 agnes image 二点一 flash 的 免费 a p i 调用。接下来我们就让 codex 先去官网学习一下怎么调用这个生图的 a p i。 在 之前的视频里面,我介绍过一个非常省 token 的 浏览器自动化方案, playrite c l i。 这里我新建了一个项目文件夹,然后进入文件夹右键,在终端打开, 依次执行这两个命令。配置好 playwrite c l i 还有对应的 skill。 这里有一点要注意,在 codex 里面使用 skill 还要做一个额外的配置,就是在项目文件夹里把存放 skill 的 文件夹的名字从点 cloud 修改成点 codex。 我们来到 codex, 点击进入项目工作,选择我们刚才创建的项目文件夹,输入斜线,拉起 playwrite c l i skill, 然后输入提示词,你用浏览器搜索,并且去官网学习一下 agnes image 二点一 flash 模型的调用文档,使用 hide 的 persistent 参数,这样我能看到你的学习过程。 ai 先读取了 playwrite c l i 技能来学习怎么驱动浏览器,然后打开了我电脑上的 chrome, 使用谷歌搜索到了 agnes 的 官网文档站,接下来他打开了文档站,定位到了模型的文档,说明 ai 学习并且总结了图像生成的调用方式。在这个例子里面可以看出 agnes 二点零 flash 有 着很不错的 agent 跟 skills 的 驱动能力,每一步都判断精准, 操作执行稳定,表现很不错。接下来我们来正式编辑 skill。 先斜线拉起 skill creator 这个编辑技能的技能,然后输入提示词,我要你编辑一个技能,这个技能可以调用二点一 flash 模型来生成图片。 apikey 可以 先硬编码,后续我会自己替换。 agnes 为我们编辑了 skill, 放到了项目目录下面,文件结构非常工整,他还不忘提醒我进入脚本第八行,替换 apikey。 我来到脚本里面,把站位符替换成了 agnes platform 申请的 api key。 我 说 api key 替换好了,你测一下。 a i 给我生成了一个云端金店,很有意思。我们再来看一个复杂一些的案例, 我想用 a i 给孩子批量生成故事绘本,这里输入提示词,开发一个 html 小 马过河的儿童绘本,然后输入斜线,找到我们刚才创建的 skill 来绘制插图,注意保持图片风格的一致性, 然后基于这些插图生成绘本。 agnes 先规划了插图跟段落划分,然后同时开启了多个生图 skill 来批量生成图片。很快完成了绘本编辑,交付了七张图片,还有一个 html 文件,我们打开看一下效果, 一个可爱清新的 h t 苗儿童绘本,这是我使用非常简单的提示词,一次就跑通的效果。 agnes 模型在编程跟 agent 能力上面已经具备了媲美一线模型的全模态实力,更棒的是完全免费,随便造随便玩。 hermes agent 是 前段时间爆火的龙虾 openclaw 的 上位替代,但不论是 hermes 还是 openclaw 都是 token 消耗大户。接下来我们就把 agnes 的 免费 api 接入 hermes, 再也不用担心偷篓的花费。这里我用的是 windows 上的 wsl, 作为 hermes agent 的 运行环境,在我之前的视频里,从零开始用国内网络跑通一切 ai agent, 里面有 wsl 部署 hermes agent 的 详细操作步骤。我们先打开 wsl, 输入 hermes agent 的 一句话命令,启动 hermes 配置模型。这一步是重点,我们选择 custom direct api, api 被字 u r l 填写 agnes 的 端点 api key 填写 agnes 官网申请的 key api 格式选择第二个 chat 模型选择四,也就是 agnes 二点零 flash。 后面的步骤一路点击回车就行了。然后我们输入命令, hermes 启动起来试一试。打个招呼,这里给到了回复就配置完成了。龙虾类 agent 最强的能力就是可以接入计时通信软件, 我们在 wsl 里面新开一个终端,然后输入命令来添加一个 i m 渠道,这里最简单易用的渠道就是微信,我们在 wechat 这一行点击回车,在浏览器里面打开链接,扫码完成配对,回到 hermes 都选择 y。 接下来我们可以在手机上测试一下了, 打个招呼,给到了回复就配置成功了,还可以问问他青岛的天气。 hermes 调用工具之前会先询问授权,这里我输入斜杠 approve 来同意,这样成功查找到了天气。使用 hermes 搭配 agnes 的 免费 api 就 可以覆盖大部分的 agent 工作场景, 关键是免费,你可以用它实现一切疯狂好玩的 agent 的 创意,完全不用担心偷看消耗好,感谢大家点赞支持,我们下期再见!

很多朋友都在问啊,到底怎么设置才能让 codex 变得更加灵敏顺手?如果你是刚安装上手 codex 的 新手,那大概率就会碰到这两个非常典型的难题,相信不少人都深有体会。 第一个问题特别磨人,工具总是反复出现相同的错误,每一次都需要我们人工反复调整,一次次纠正,整个过程就像耐心教小朋友做事一样,不停查漏补缺,耗费大量时间和精力,体验感大打折扣。 第二个问题就是文件管理乱,每次新建任务产生的各类文件资料没有固定存放位置,散落的到处都是,等到后面想要整理查找内容时格外麻烦。更影响效率的是,下次启动全新任务时, copy 往往需要便利整台电脑慢慢解锁,才能找到对应的核心项目文件,严重拖慢整体工作节奏。 其实在上一次视频里,我和大家分享过一套专属的框架管理思路,目的就是通过系统化的设置,让 codex 不 断成长,越用越聪明。今天我不讲理论,全程落地实操,详细拆解这套框架管理体系的完整搭建步骤。 首先大家记好,把 codex 安装完成之后,第一件事就是在电脑桌面上新建一个命名 workspace 的 文件夹,我们把它设定为 codex 的 专属核心工作区域,这个总文件夹里面必须提前打好三份起到关键作用的核心文档,整套体系的根基就在这里。第一份文档, 我们把它命名为局经验和踩坑记录日记。这份文档的作用十分明确,专门用来记录使用 codex 全过程里出现的各类问题,犯下的错误,只要工具输出的内容、执行的操作达不到你的预期,全部如实记录下来。 除此之外,那些操作效果出色、实用性强、可以反复套用的优质方法和经验,同样也要整理收入在这份文档中。讲到这里,估计有人会产生疑问,这份日子要记录的内容这么多,难道要我们一字一句全部手动录入吗?其实完全没必要这么繁琐啊。这就轮到第二份核心文档出场了,也就是全鱼操作指引手册。 这份手册是 codex 执行所有新项目、所有任务的硬性准则,我们要在里面明确规定好。当 codex 在 工作中出现失误,或者产生了让我们满意的成果,总结出好用的方法时,必须第一时间把相关内容规范整理,同步更新到刚刚说到的大局经验和踩坑记录日治理。 换句话来说,这份全局操作指引手册就是给 codex 最高执行指令,也就是它开展所有工作的核心准则。文件。手册当中会清晰标注每一份配套文档的定位、功能和使用要求,同时做出硬性规范。 往后每启动一个全新项目,都必须单独新建一个文件夹,文件夹统一采用 project 加数字编号加项目名称的格式命名 项目,所有相关的资料、文档代码以及各类附属文件,全部统一收纳进对应的专属文件夹内。大家可以看一下我这边最终搭建好的效果。我每开启一个新项目,都会按照规则创建独立文件夹,把该项目所有内容集中存放,这样规范管理的优势一目了然。第一点,彻底解决文件论存放的问题, 所有内容分类清晰,后期管理、查略调取都十分便捷。第二点,依靠编号加名称的标准化命名方式。日后 codex 进入 work space 工作目录之后,只需要浏览整体文件夹目录和名称,就能快速知晓过往完成的哪些项目也能精准定位本次新任务需要用到核心文件,相当于给工具装上了精准的导航定位系统。 将这三份核心文档全部搭建完成后获取。 codex 接手新任务时,只需要优先查略全区操作指引手册这一份文件,就 就能清晰掌握整套命名规则、执行标准,并且会主动按照要求复盘过往经验可附用的优质内容,沉淀到踩坑日记当中。这时又有一个关键问题来了,我们该如何保证 codex 每一次启动新项目都会主动查看这几份核心文档,不会自作主张直接跳过规则开始工作。 想要彻底解决这个问题,就要用到 codex 的 底层记忆核心 agent 点 md 文档正常安装完软件后,我这份文档会自动存放在 codex 的 根目录当中,它会永久留存你使用习惯、沟通风格以及你提出的各类硬性要求。 所以在搭建好前三份文档之后,最关键的一步就是在 a 卷十点 md 这份记忆中速文档新增一条优先级最高的规则,往后无论任务规模大小,执行任何新项目之前,都必须完整浏览全区操作指引手册、全区经验和踩坑记录日记, 严格遵守文档的各项要求,同时把工作中遇到的问题、总结的使用方法及时归档,务必读完三份核心文档,再正式启动工作。 看到这里,不少朋友会觉得整套流程步骤偏多,心里犯嘀咕,这么多文件夹和文档,难道都要我们手动一个个创建、逐字逐句编辑内容吗? 其实完全不用自己手动操作,创建目录、编辑文档这些基础工作全都可以交给 codex 自动完成。那具体该给他下达什么样的指令才能让他完成我们自动搭建整套体系呢?其实只需要一段清晰的指令就足够了,你可以直接复制这段话发给 codex。 请在 word space 文件夹内创建一份全区操作指引手册,用于统一规范 codex 的 所有行为规范与工作准则。再新建一份全区经验和踩坑记录入职 专门记录工作中的出现的错误、遇到的问题、总结的经验,以及所有能长期复用的实操方法。最后,再创建一份新项目执行 sop 文档。每承接一个新项目, 都要新建 project 加编号、加项目名称格式的独立文件夹。该项目所有相关文件仅存放在对应文件夹内,禁止随意存放在电脑其他位置。请将所有文档的作用统一命名,规范 整套目录结构以及使用规则全部整合汇总到全区操作指引手册当中。当以上所有设置全部完成之后,一定要再次打开 aj 十点 m d 的 文档。补充这条最高优先指令。后续执行任何新项目,务必先依次查略全区操作指引手册、全区经验和踩坑记录日志、 新项目执行 sop 三份文件,确认阅读完毕,理解所有规则后,再开始执行工作。到这里,整套完整的配置流程就全部结束了。你把这段指令发送给 codex, 它就会自动帮你完成所有文件夹 文档的创建与内容编排。从这之后, codex 每次执行新任务,都会严格按照我们设定的规则运转,主动复盘问题、沉淀问题、优化工作方式,几乎不需要我们在额外费心,社区管理还能在不断使用中持续迭代升级,变得越来越智能。 在如今的 ai 时代,我们不要总局限在自己动手一步步执行的固有思维里,真正高效的玩法是学会如何调教 ai, 让 ai 主动为我们分担工作。掌握这套方法,才能跟上 ai 工具的使用节奏,发挥出工具最大的作用。我是强哥,关注我,一起聊点能落地的干货!

大家好,今天我在家里面用我自己的电脑啊,把那个 codex 给它下载下来了, 如果有,如果有人想问这个软件是怎么下载的?其实比较简单,就是说我这个是不需要, 不需要花费一毛钱,怎么弄呢?首先点开他的官网啊,酷狗的官网,大家直接在网上搜就能搜的到,直接用他的官网下载就行了,下载过之后,然后会有一个 有安装嘛,然后就就给他安装,安上去的话就是说他有一个,我不知道你们电脑是什么样的,我的电脑是 windows 的, windows 的 话,因为他的话,呃 安装之前会有一个跳出一个弹窗,就是说是微软的商店,应用商店会把这个弹窗给弹出来,弹出来之后,然后他会有一个, 就是就像相当于咱们手机这种应用商店用应用商店这种形式一样,然后你就可以啊,直接在那边就点安装就行了。安装完成之后,然后他就会出现一个界面,这个界面是就登录的界面, 我因为我这个已经安装完成了。第一个的话,他是用那个切拉 g p t 那 个账号去登录, 这用这个账号登录的话呢,因为它这个是需要,需要你有这个的,需要你有这个 api 接口的,就是在那里面是需要有那个 token 的, 所以说,嗯,如果大家有一些, 就是你想用比较高端的这种,或者说是有一些比较复杂的任务啊,你可以去使用这个东西,但是这个东西的话,你用它去登录是需要验证的,因为之前的话是不需要验证,但是现在它是需要验证的, 验证的话就是说你用一个海外的手机啊,去搜,去搜他的验证码,只有有这个验证码之后你才能登录这个号,然后再把那个切 gpt 的 那个 api, 就是 创建一个新的 key, 到时候把那个 key 直接复制到这上面就行了。然后这是第一种登录方式,第二种登录方式呢,就是直接用 api 去接, 但是他这个官方的,呃,靠,这个是呢,他只能去接那个切 g p g 的 这个 i p i。 所以 说如果你有一些别的 大模型的一些啊 k 就 必须得用一个,用一个相当于一个转换插头一个东西,就是像很多他都有那个 c c h 嘛, 或者说是你直接在那个开源的 game 上面啊,直接搜 colex plus plus, 就 colex 加加,就这个这个工具。 管理工具,到时候你在那个开源项目上面下载过之后,然后给它安装完,你的桌面上会出现两个图标, 就这两个图标。 colex 加加还有一个管理工具这两个图标,然后你在那个管理工具里面, 嗯,刚才,刚才不是下了那个格式吗?然后你现在把这个管理工具给打开,然后在那个管理工具里面设置一下, 首先找到这个供应商,设置第二个,然后下面有一个 是新添加供应商这个按钮,点一下添加供应商之后,它会有一个新的供应商 啊,添加新的供应商之后,然后把这个名称写上,就是名称的话是随便写,因为我用的是 agnes 这个 ai 嘛,所以说我就把这个给它名字,给它设设置成这样的,然后接受模式是纯 api, 看是这个纯 api, 然后配置模型呢?嗯,我们一般用的是 agnes 二点零杠 flash 这个模型, 然后后面的话是有更多选项,更多选项的话这个测试模型,测试模型的话和配置模型一定要写的是一样的,看到没?这两个是一样的。 然后这个下面有那个贝斯 u i i u i l 是 给大家看一下具体的就是这个有需要的话就可以暂停,然后看一下子, 然后这个 k 就是 大家因为我不是要接这个 ig 呢,也是这个这个模型吗?因为这个模型它现在是完全免费的啊,所以说我就直接用这个 a p i 就 直接接上去,你在那边登录,我是直接用我的那个 呃,谷歌号,谷歌账号给登录的,那大家有别的号的话,你可以登录别的号。呃,登录进去之后,然后点击它的 a p i, 创建一个新的 a p i, 到时候把那个 a p i 的 key 就是 密码,因为它 生成出来之后,他只会出现一次,就是完整的展示一次。所以说大家把那个 api key 出来之后,你一定要点那个复制,把它复制到一个安全的地方, 然后到时候就直接复制到咱们这个框里面就行了 啊。然后我再点右边的这个上回协议,点这个 chat complaints compilations 这个 啊,然后就可以点这个保存了,那上面有一个保存按钮, 看到没有?这上面有个保存按钮,让它点点保存就行了。点保存之后,然后它下面就会有一个你自己创建的这个 api, 然后先别忘点使用,先点右边这个小笔这个, 这个就相当于测试的,然后你点一下测试,发送嗨测试, 然后他这上面就会出现一个电话框,除了两百以外的,其他所有的都是错的, 需要大家去仔细去看看。嗯,我这边的话就是给大家解释,就是那个如果说出现那个错误五零三的话,就是相当于你的那个配置的模型,和你测试的模型不是一个模型,你要仔细的看看他的拼写是不是一样,还有他的那个 如果是四零四错误啊,然后你就会就可以在那个上面 u l 上面你看看是不是写的对,那个一个就像一个网址嘛,然后你看看拼写是不是对的。弄完之后然后点这个,如果出现二百绿色的出现二百就相当于成功了,然后再点使用, 嗯嗯, 使用过之后,然后点上面有一个重启 codex, 加加这个按钮,然后点那个重启就行了,到时候这个 codex 会自动重启, 然后你就可以进去疯狂的照了,然后剩下的一些配置呀,设置呀,嗯,大家有兴趣可以去在网上去搜一下,或者是直接在那个呃抖音里面去看一下他们具体的是怎么设置的,根据你个人的习惯去设置, 设置完成之后你就可以啊用这个扩展了,而且是免费的,今天的分享呢就展示到这。

今天我们来讲讲大名鼎鼎的 codex, 相信大家都已经听说过这个软件了,这是 open nai 的 核心产品,对标 osarpic 的 cloud code。 codex 能做的事情非常多,它不仅能够帮你编辑代码、排查 bug、 执行测试,还能管理 gate、 操作浏览器,甚至能直接控制电脑完成各种任务,非常强大。不过功能越多,越容易让人抓不住重点,所以这期视频我会带大家系统性地过一遍。 codex 最核心的功能,帮大家建立起一套完整的使用思路。 整个视频一共分为三个部分,第一部分是基础篇,主要带大家快速上手 codex, 并讲解一些核心配置和使用过程中容易踩坑的地方。 第二部分是进阶篇,重点介绍版本控制、绘画管理,以及如何更高效的组织和推进开发任务。第三部分是扩展篇,我们会看看如何通过 plugin、 skill、 automation 和 mobile 等功能进一步扩展 codex 的 能力边界。 所有的功能点和对应的时间戳我都打到目录上了,大家可以按需跳转。好话不多说,我们现在开始。 首先我们要做的是把 codex 安装到电脑上面,我们可以打开这个页面,点击这里面的下载按钮,就可以下载 codex 了。下载好了之后,我们来打开它。安装过程呢,跟其他的普通软件一样,比如我用的是 micros, 那 直接把 codex 拖入到 applications 文件夹里面就可以完成安装了。 安装好了之后,我们来打开 codex。 打开 codex 之后呢,它首先会提示我们登录,它一共给了我们两个选项。 第一个呢是使用叉 gbt 账号登录,这需要你订阅叉 gbt 的 套餐。叉 gbt 呢,它提供了多种套餐,其中最常用的是我屏幕上面显示的这几个,主要是包括免费版 go 套餐、 plus 套餐和 pro 套餐。 你看屏幕上面的这几个套餐,从左到右价格越来越高,当然整体能用的 codax 额度也是越来越大的。 从目前来看,免费版和购套餐的 codax 额度应该差不多,但到了 plus 套餐,额度就会有着明显的上升, pro 套餐自然就更多了。 值得一提的是,即使你用的是免费版,系统也会给你一定的 codex 额度,只不过这个额度少的可怜,只能勉强够你施个水。所以如果你想真正上手体验一下它的能力,我建议你先订阅 plus 这个 plan, 它是二十美元一个月,可用量呢比较适中。 除了订阅套餐之外, openni 还提供了另外一个选项来使用 codex, 那 就是直接接入 api, 对 应的就是这里的 signing another way, 点击之后,它会提示你输入 openian 的 api key。 一 般来说,用 api 没有订阅套餐划算,而且呢,获取这个 api key 的 门槛也有点高,一般需要一张海外的信用卡,所以我建议大家还是订阅套餐来使用 codex。 具体的登录过程呢,我这里就不显示了,大家可以在这里选择适合自己的方式登录。登录好了之后,大家首先看到的就会是这样的一个界面, codex 首先会询问我们是干什么工作的,这里大家就按照实际情况来选就可以了。然后 codex 会提示把 cloud code 和 cloud co work 相关的配置都导到 codex 这里,我们先跳过,然后 codex 提示我们要不要试用 codex 手机版,我们点击这个 set up later, 待会儿呢,我会给大家演示这个功能,所以现在先不着急,现在呢,我们就算是正式的来到了 codex 操作界面,可以开始使用它了,我们来随便跟它打个招呼,看看能否正常使用, 可以看出 codex 已经可以正常使用了。下面我带大家做一个代办软件,并且在做这个代办软件的过程中为大家讲解 codex 的 各个功能点。首先我们要新建一个目录来存放我们的软件代码,让我们打开访答,在这里创建一个新的文件夹,就叫做马克笔记吧。 然后回到 codex 这里,点击 work in the project, 再点击 use an existing folder, 在弹出的对话框里面选择我们刚刚创建好的文件夹,然后再点击 open, 然后呢,你就会发现 codex 把项目目录改成马克笔记了, 这就代表 codex 后面会把代码放到这个文件夹里面。此时我们准备工作就已经是做完了,可以开始提需求了,比如说我们的需求就是使用 html 写一个笔记软件,软件界面分为左右两部分,左边是笔记列表,右边是笔记的内容, 最后我们提醒他注意做好测试,然后回车提交,这个时候呢, codex 就 会开始工作了,可以看出他在疯狂的给我们写代码,当然实际使用是没这么快的,因为为了节省大家时间,这里我做了加速,后面的问答流程呢,也都做了不同程度的加速处理,这个呢,大家知道就好了。 好, codex 暂停了,他提出他想要构建一个本地服务器来验证 html 笔记的效果。这里呢有三个选项,第一个选项是 yes, 这个呢很好理解,其实就是把这个本地服务器启动开就可以了,不过以后如果 codex 提出类似的请求,我们还得再授权一次。 第二个选项呢,是代表我们不仅同意,而且对于这种启动本地服务器的代码,以后呢也就直接执行就好了,不需要再经过我们授权了。第三个选项可以理解为不同意,它其实不是一个按钮,而是一个输入框, 我们点一下就能看出来了。在这里我们可以告诉 codex 自己希望的处理方式,比如只让它检查代码,不要启动本地服务器之类的。当然,如果你不同意,而且你懒得告诉 codex 原因的话,也可以直接点击这里面的 skip 按钮啊,这算是 codex 做了弱化的第四选项了。 好,所有的可选项我们都说完了,在这个地方我们就选择第一项 yes 就 好了。然后呢, codex 就 询问我们能不能访问这个新创建的本地服务器,这个地方呢,我们也同意, 呃,现在 codex 已经彻底完成它的工作了,可以看出这里面最重要的文件呢,就是这个 index html, 我 们可以点击来预览它的效果。 这个呢就是 codex 写的笔记软件了,看起来中规中矩,各种基本功能呢,在这里面都能找到。当然有些人可能觉得这个预览区太小了,想要放大一点,这当然是可以做到的,让我们来点击这个按钮, 这样左边的区域就被收起来了,可预览的空间就更大了,不过下面的这块区域看着也是有点碍事,能不能隐藏它呢?其实也是可以的,我们可以点击这里面的三个点, 然后选择其中的 hide composer 就 好了,你看这样呢就好多了。那假如说这个时候呢,你看着界面里面的这两条笔记,觉得非常碍事,你想把它们去掉, 呃,这个呢,其实也是很简单的,我们就继续追问就好了。既然要追问,我们就必须要把左侧栏再次显示出来,这个呢其实很简单,我们再点一下这个按钮,左侧栏就显示出来了。 然后呢,我们就可以在输入框里面输入我们的问题,把左上角的两条笔记去掉,这个呢肯定是可以的。 呃,不过我这里想给大家演示另外一个方法,另外一个更加准确,更加方便的方法,我们可以点击这个图标,它叫做 annotation, 然后我们就可以直接选中两条笔记这个区域,选中后,输入我们对这个区域的修改意见,很简单,我们的意见就是两个字,去掉, 然后我们提交请求。好,可以看出请求已经成功提交上去了,可以看到他一共是发了两块内容,一个呢是对应的截图,另外一个呢就是我们具体的要求了。 接到了这个请求之后, codex 就 开始工作了,他应该呢就会把这块区域给去掉,让我们稍微等待一下。 好, codex 已经完成了,我们再次打开这个阅览区,看一下效果, 可以看出之前的这块区域呢,确实是没有了, codex 已经帮我们解决问题了,看起来 entity 这个功能还是非常方便的, 那这个时候我们可以再随便点点这个笔记软件,看看有没有其他我们需要修复的问题。这里好像确实有个 bug, 我 点击这个加号按钮的时候,下面呢是要增加一个新的笔记的,但实际上点了之后并没有任何的 bug 呀。让我们跟 codex 说一下这个问题, 我们需要告诉 codex, 点击添加按钮之后,笔记列表区域没有任何的反应。呃,请排查下原因,我确定之后再进行修改 好。 codex 已经排查完了,按照我们的要求,他没有直接去改代码,而是先给出了诊断结果。他猜测呢,这个问题大概率是因为当前页面的 local storage, 也就是本地存储被禁用了。 没错,就是这个原因。说白了,就是 codex 的 右侧预览区有一些安全限制,导致某些功能无法正常使用。如果我们到独立的浏览器里面用一用,问题立马就消失了,不信我们试一试。 你看这个时候再点击添加按钮是不是就完全正常了?既然用户是在真实的浏览器里用我们的软件,而不是在 codex 的 预览区里用,那这根本就不算是个问题,自然也不需要修。 我不知道这算是 codex 的 一个 bug 还是一个 feature, 我 相信 openai 是 把它当成 feature 来做的,不过实际用下来确实有点像 bug。 如果你做的也是外部应用,那一定要额外留意这一点,别被预览区给骗了。既然弄清楚了原因,为了避免再受限制,我们后续就在独立的浏览器页面里面进行测试了。 到这里,这个最基本的笔记软件就算是成功跑通了。现在我想回头聊聊刚才遇到的一个细节,就是 codex 提出的那个请求。 呃,有些同学可能会想,如果我把任务交给 codex 之后去忙别的了,没注意到他在等我授权,那 codex 岂不会一直卡在那里等我回来一看啥也没干,白白浪费了大量时间。 那这有没有办法让他自己做决定,别总是来问我呢,毕竟谁也不想一直盯着他干活,那也太累了吧。没错,一直盯着看呢,确实是非常的麻烦。其实 codex 早就替我们想到了解决办法,就在输入框的下面,大家看这里面呢,一共是有三个全线选项。 第一种就是我们刚才用的 default permissions, 在 这种模式下,如果 codex 需要修改项目目录之外的文件,或者是需要执行一些带有安全风险的命令,它就会老老实实地弹出提醒,只有当你点头同意了,它才会继续接着往下干。 这种模式的优点呢是绝对安全,一切尽在掌握,但缺点也非常明显,就是根本离不开人,你得随时给他授权。 第二种呢是 auto review, 也就是自动审查。这个模式呢很聪明,它引入了一个专门负责安全审查的 agent, 当 codex 准备执行操作的时候,这个 agent 会首先替你把关,安全的直接放行,危险的直接拒绝,只有在极少数连 agent 也拿不定主意的情况下,才会弹窗让你来做决定。 第三种呢是 full access, 顾名思义,这个呢就是放飞自我模式,全部自动同意, codex 想干嘛就干嘛,完全不需要你插手。 这个模式确实是最省心的,但也伴随着风险,万一它误删了什么重要数据,你是拦也拦不住的。虽然 gpt 模型总体上还是非常靠谱的,基本上不太会乱来,但是作为一个负责任的 up 主,我还是要提醒大家,这个模式呢,没有任何的安全,交易开启前一定要三思啊。 所以综合看下来,在这三个模式里面, auto review 是 在效率和安全之间平衡的最好的。为了避免后面频繁弹窗,要我们点同意,接下来的演示呢,我们就统一的切换到 auto review 模式。 既然聊到了这里的权限配置,我们不妨顺便看一下输入框旁边还有哪一些配置。首先大家留意这里面显示的五点五 medium, 这代表我们当前使用的是 gbt 五点五模型,思考深度呢为 medium, 也就是中等。 我们点开它可以看到思考深度呢是可以自由调节的,分为 low、 medium high 和 extra high 四个级别。思考深度越高, codex 花费的时间也就越长,消耗的 token 呢也就越多,但通常给出来的代码质量也会更好一些。 除了调整思考深度,我们还可以在这里面切换模型下来。列表里面除了 gpt 五点五,还有 gpt 五点四等等一系列的模型,大家可以根据具体的任务难度来灵活选择。 最后啊,这里面还能设置模型的输出速度,目前是 standard, 也就是标准的速度。旁边呢还有一个 fast 选项,开启 fast 模式之后生成的速度呢会提升到原来的一点五倍,不过代价呢是 token 的 消耗量也会相应的增加,具体增加多少取决于你用的模型, 比如说在 gbt 五点五这个模型下开启 fast 模式的话, toc 的 消耗量就直接是标准模式的两倍了啊。如果你财大气粗, toc 管用,那你完全可以开启这个快速模式,这样 codex 干活就更快了。 输入框的配置我们就先研究到这里,现在我们的第一版笔记软件已经跑通了,实现了最基本的功能,不过为了防止后面新加功能的时候把代码搞乱,我们最好先用 get 把当前的版本保存一下,这样的话就算是后面出了什么叉子,也能够随时回滚到这个可用版本。心里有个底, 在 codex 里面调用终端非常的方便,我们不需要去点什么菜单,直接按下快捷键, command 加 j, 大家看右侧的终端面板就直接弹出来了。在这里面我们依次输入几条常规的 get 命令, 首先是要执行 get in it, 点把当前的项目目录出示,化为一个 get 仓库。然后呢我们要执行的是 get id, 点把相关的文件呢都添加到暂存区里面。最后呢再执行 get commit 提交我们的第一次修改 好这三步敲完之后,我们的代码就有了一个安全的备份版本,接下来我们就可以放心大胆地继续迭代我们的产品了。 终端用完之后,为了不挡着视线,我们只需要再次按下同样的快捷键, command 加 j 就 能够把它直接关掉。你看用快捷键来开关终端,双手完全不需要离开键盘,整个过程呢非常的丝滑,也是非常的方便。 那现在我们用 codex 做了一个基本可用的笔记软件,而且还用 get 提交了这个可用版本,下面呢,我们就来继续迭代这个笔记软件,让它变得更强大,更美观。 假设这个时候你看了看这个笔记软件,觉得它的色彩设计不是很好,这里面有很多的绿色元素,你不太喜欢绿色,你想试试蓝色怎么样?那这个时候该怎么处理呢?很简单,你就直接在这里面追问就好了,比如我们可以这么提要求, 不过我们先不发送这个请求了吧。啊?为什么呢?你仔细看看啊,我们上一个消息里面还让 codex 排查问题来着, 但说实话,这其实并不是一个问题,只是 codex 的 浏览区有些限制而已。如果我们继续追问的话,这个排查过程不仅会占用模型的上下文,而且可能还会对 codex 后续执行产生一些影响, 他没准会继续尝试修复这个问题,把原来没有问题的页面修出问题来。虽然这种情况发生的概率应该也不会很大,但是能规避的话就尽量规避吧,毕竟这个消息其实一点用也没有。 所以我们该怎么办呢?有一个办法,那就是直接修改上一个消息就可以了,你看这里面有一个编辑按钮,我们点一下就可以直接修改这个消息了,我们来试试 提交。你看原来的请求被替换成了我们的这个,这样的话,原来排查问题的那个消息呢,就消失了,既然消失了,它就不会再占用模型的上下文了,也不会对 codex 后续执行产生任何影响, 所以很多情况下,这个功能还是很实用的。不过要注意的是, codex 只支持编辑最后一条消息,至于更靠前的那消息,它实际上是不支持我们编辑的。 前面的那些消息呢,都是没有编辑按钮的,如果你要编辑更靠近的消息,可以考虑使用 fork 功能来间接实现这个功能。我们后面会讲到,暂时你不必过于关心好。 codex 已经完成任务了,我们来看看效果。 呃,还可以吧。下面呢,我们把这一部分的改动也加入到 get 里面。之前我们是用命令行来操作 get, 这种操作方式准确通用,不过其实 codex 也内置了一些 get 操作的功能来供我们使用。比如我们可以先点击这个图标, 这里面呢就有一个叫做 environments 的 区域,它呢就跟 get 的 使用密切相关。我们可以点击这里面的 changes 按钮,然后再在这个选择框里面选择 on stage 的 选项。这里显示的就是所有还没有提交到暂存区的代码了, 这基本上也就是 codex 刚才所做的改动。如果你觉得哪一行有问题,可以点击旁边的加号,输入你的要求。输入完要求之后,你可以点击这里面的 comment 按钮,让 codex 做出相应的改动。不过这里我们就不做任何修改了, codex 的 任务已经完成的很好了,所以我们取消这个注示, 直接使用 git commit 提交这次改动。那具体该怎么做呢?很简单,直接点击这里面的 commit 按钮,输入 commit 的 message 就 可以了。我们的 commit message 就是 将整体色调改为蓝色,然后呢,再点击 continue, 此时 codex 就 会提交当前所有没有提交的改动了。 好,执行成功了,我们来验证下。先按一下 command 加 j 来到终端,然后再执行 git log, 查询 git 的 commit 记录。 你看,我们的 commit 确实是生效了,确认好了之后,我们按 q 退出 get log, 然后呢,再按 command 加 j 来隐藏终端,到这里,这个需求就算是彻底完成了。那假设这个时候你感觉蓝色这个主题也不怎么好看了,越看越不顺眼,要不再换一个吧。 没问题,我们直接提交需求,将整体色调改为紫色。改完之后呢,再做一次 get commit。 对, 这次我们不自己操作 get 了,有点麻烦,直接让 codex 操作得了。提交之后, codex 就 开始干活了,我们稍微等待一下, 改好了,我们来看看最后的效果。不错,确实改成紫色了,不过怎么说呢,啊,你觉得还是不顺眼啊,你在想,算了,我要不还是改成一开始的那个绿色吧。那这当然是可以的, 照例啊,你可以直接在输入框里面输入,你的要求就是改回来的紫色。这个呢,肯定是行的,只不过这样的话,模型还得再跑一遍,有点浪费 token, 所以 我们就不用这个方法了。 其实我们原来就是绿色,所以用 get 把代码回滚到绿色的那个版本就可以了。只不过这种做法其实也是有点缺陷的, 代码确实是回滚了,但绘画内容还是停留在紫色这里。如果我们希望在当前这个绘画继续问的话, codex 可能会以为目前所用的色调是紫色,从而对后续的任务执行效果产生负面影响。 那我们能不能把绘画和代码同时回滚呢?我们就想回滚到改蓝色之前的那个版本,也就是这个版本,如果有回滚功能的话,那应该是在这个消息旁边有一些相对应的标识吧,我们找找。 哎,还真的有一个图标有点像,不过它不叫回滚,它叫做 fork。 fork 的 意思就是基于当前的这个绘画,再复制一个新的出来,这个新绘画就只到目前所选的这个消息为止,后面的消息全都不保留, 这个呢就非常符合我们的要求了,我们其实就希望绘画到当前的这个消息为止,那既然绘画变了,代码是不是也会自动回滚呢?没准也是可以的,我们来试试。 我们首先点击这个 fork 图标,这里弹出两个选项供我们选择,一个是 fork into local, 另外一个呢是 fork into new work tree。 这两个选项的最大区别在于新绘画的代码存放地址不同。 第一个选项会继续使用当前目录作为新绘画代码存放地址,第二个选项会创建一个新的目录来存放心绘画的代码。你可能现在听的还是有点懵啊,没关系,我来演示一下你就知道了。在演示之前,我们先把左侧栏打开,这样你就会看得更清楚一些。 好,左侧栏打开了,我们来重新点击一下这个 fork 图标,然后选择第一项 fork into local。 可以看出 codex 确实给我们创建了一个新的绘画,并且还在这里标识好了,这个绘画呢,就是从别的绘画那里复制出来的。下面我们来看看代码是否也会滚了, 这个很简单,我们不必看代码,我们直接看最终的效果就行了。让我们来看看页面的颜色有没有改变,可以看出页面的颜色仍然是紫色,所以呢,代码根本就没有回滚。没错,这呢就是 fork into local 这个选项的特点,它只会处理绘画内容,根本就不会对代码做任何修改。 不过还好,我们使用了 git, 我 们可以用 git 来回滚代码。我们先按快捷键 command j, 打开终端,然后执行命令 git log 确定我们想把代码回滚到哪个 commit 上,应该就是这个了。然后呢,我们复制这个 commit 的 哈希值, 最后执行这个命令。这样呢,就可以把代码回滚到绘画对应的那个版本了。让我们回到浏览器这里刷新一下页面, 没错,确实是一开始的绿色版本了,当然绿的也不是很明显啊,只有那么几个模块是绿的。我对这个色调的表述呢,稍微有点问题,但无论怎么样,肯定是回滚成功了,相信大家都能看得出来,这个呢就是 fork into local 了,我们配合着 git, 才能把绘画和代码都回滚到之前的那个状态。 那刚才还有一个选项叫做 fork into new work tree, 那 个选项是用来干什么的呢?我们不妨来试试。让我们回到之前的绘画里, 点击这个 fork 图标,然后再选择 fork into new work tree。 注意看, codex 依然给我们创建了一个新的绘画,而且跟 fork into local 很 像。这个新的绘画呢,也标识出来了,它就是从别的绘画里面复制过来的。 一切看起来似乎都跟那个 fork into local 差不多啊,那到底什么发生变化了呢?答案就是我们当前的这个绘画所对应的项目目录发生了变化,不信我们来打开终端,输入 pwd, 这个命令就是用来显示当前位置的,可以看出我们的当前位置呢,就是这个了,我一开始 fork 出来的那个绘画可不是在这个目录里面操作的,不信的话,我们回到一开始 fork 出来的那个绘画里,同样打开终端, 运行下 pwd, 你 看它俩的项目目录地址是不同的,我把这两个地址打在屏幕上,这样大家就可以看得更清楚一些。 这个呢,就是 fork into new worktree 的 一个特性,它会给 fork 出来的新绘画创建一个对应的新目录,这样新老绘画所处理的代码不是一份,彼此之间互不影响,非常适合在两个绘画分别处理两个不同的功能点,最后做完了再合并到一起就好了。那为什么叫做 worktree 呢? 是因为它是使用 gitworktree 来实现的,这个呢,是 git 的 一个特性。这个要展开讲的话呢,又得讲好几分钟。我们本期是来讲 codex 的, 不是来讲 git 的, 所以呢, gitworktree 在 此就跳过了,感兴趣的同学可以自己查下。 另外值得一提的是, fork into new worktree 同样不会回滚代码,它只是把当前项目目录里面的所有代码复制到一个新的目录里,仅此而已。 好,这个就是 fork 的 两种形式了。总结一下,这两个选项都会复制绘画到所选消息为止,也都不会帮你回滚代码, 它们唯一的区别仅仅是代码的位置, local 呢,是继续沿用原目录,而 new work tree 呢,则是开辟了一个全新的隔离目录。主要呢,就是这个区别了。所以呢,无论是哪一种 fork 形式,都不会更改代码。实际上 codex 在 界面里面也有显示, 我们可以回到一开始的那个绘画。然后呢,再点击一下这里面的 fork 图标。注意到这段话了吗? 其实它想表达的意思就是 fork 只负责对话,不回归代码。对,它说的有点绕,但其实就是这个意思。 好, fork 功能我们终于讲完了,我们目前只需要第一个 fork into local 的 这个绘画,另外一个 fork into work tree 我 们暂时不需要。那我们能把这个绘画删掉吗?能, 不过准确来说啊,我们可以把这个绘画规章,规章和删除稍微还是有些区别的,你可以把规章理解为暂时隐藏起来了,而删除呢,那就是删完就没了。我们来试一下, 我们直接点击绘画旁边的这个图标,然后再点击 confirm, 这个绘画就被规范了。你看这个绘画是不是没了。但跟删除不同的是,我们还可以找回这个绘画。 我们先按 command 加逗号,打开设置面板,再点击里面的 archives chats, 在 这里我们就可以看到所有被规章的绘画了。我们可以解除对应绘画的规章状态,也可以彻底删除对应的绘画。所以你看,删除和规章还是稍稍有些区别的。 那规章这个功能我们就讲到这里,从之前的操作过程中我们可以看出, get 真的 还是挺重要的。那既然这么重要,我们能不能让 codex 每次写完代码的时候都能自动提交一次 get commit 呢,这样的话就不用麻烦我们每次都操作一遍了。 这当然是可以的,其中一个方法就是我们可以直接在输入框里面告诉 codex, 每次完成代码修改之后,都需要提交一次 get commit, 然后提交这个请求就行了。这样在后续的操作里面, codex 肯定就会按照我们所说的,每写完一次代码都提交一次 get commit。 不 过这个方法有个很大的缺陷,那就是它只会在当前的绘画中生效,如果我们创建出一个新绘画的话,那 codex 就 会彻底忘掉这个事情, 所以我们需要一个能够跨绘画的解决方案,即使是在一个新绘画里, codex 也能帮我们做 get commit 这个事情,这能做到吗?当然是可以的,这个呢就是 agent 点 m d 这个文件发挥作用的地方了。 agent 点 m d 简单来说呢,就是一个放在项目根目录里面的配置文件,每当 codex 开始一个新绘画的时候,它都会自动读取这个文件,把里面内容当成对自己的指令来执行, 所以我们只需要在这个文件里面写上这个 git commit 的 要求,那无论我们开多少个新会话, codex 都会记住这件事情的。我们先把原来的这个请求删掉,我们不需要它了,然后我们点击这里使用 vs code 打开这个项目目录, 在根目录下创建一个新的文件,就叫做 agent 后台,然后在这个文件里面写,每次完成代码修改后,都需要提交一次 git commit, 这样 agent dmd 就 创建好了,让我们把 vs code 关掉,现在让我们来验证一下 agent dmd 是 否真的会生效。我们首先创建一个新的绘画, 然后提交需求,往左下角增加一个主题切换选项,支持用户在浅色模式和深色模式之间切换。回车提交,让 codex 开始工作。 好, codex 已经完成了,我们来看看效果。 你看,左下角确实是出现了一个主题切换按钮,我们点击对应的主题,就可以在浅色和深色两种模式之间切换,看起来非常完美。那我们现在最关心的是, codex 有 没有帮我们做 get commit 操作呢?我们按一下 command 加 g, 打开终端执行 get log 来看看。 你看,这里面确实是多了一个新的 commit message 呢,就是 codex 自己写的,这说明 agent 点 m d 确实生效了。即使是在一个全新的绘画里面, codex 也遵从了我们的要求,在完成了代码修改之后,自动提交了一次 git commit。 这个呢就是 agent d m d 的 基本用法了,当然他能做的事情远不止这一件,比如你可以在里面规定代码风格、命名规范、技术占要求,甚至是你的项目背景介绍等等。 codex 每次启动新会话的时候都会去读取这些文件,这样他对你的项目就会有非常好的理解,给出的结果呢也会更加准确。 可以说, agents dmd 写得越好, codex 就 会用起来越顺手。不过需要注意的是, codex 只会提交当前需求所对应的代码改动。我们一开始创建的 agents dmd 不 属于当前需求的范畴,所以呢,刚才 codex 并没有把它提交为一个 git commit, 我 们点击这个 changes, 再选择 on stage, 就 可以发现 agents d m d 的 内容呢?还没有提交上去。没事儿,我们这就提交。我们先来点一下这个 commit 按钮,然后在里面输入对应的 commit message, 再点击 continue, 这样这个改动就会被提交到 get 上面了。好,一切顺利,让我们新开一个绘画,继续迭代这个笔记软件。 现在这个软件本质上就是一个 html 文件,只能在浏览器里打开,不够方便。我们想把它改造成一个真正的桌面客户端,让用户可以直接双击图标打开,就像打开 vs code codex 一 样。 那要做桌面客户端的话, electron 是 非常主流的一个选择,我们可以顺便呢也引入 react 和 type script, 把项目结构整理一下,方便后续继续迭代。那我们就直接把需求发给 codex, 把这个网页应用改成桌面客户端,进入站使用 electron 加上 react, 再加上 type script。 注意做好测试,确保所有的核心功能运转正常 啊。不过要注意这可是一个大工程,所以呢,我们最好先让 codex 做一个规划,我们确认规划没有问题之后,再让它动工。为了实现这一点,我们可以点击这里面的加号,然后选择 plan mode, 这样 codex 就 进入了计划模式,从这个图标也可以看出这一点。 在这个模式下, codex 会先做计划,再写代码,让我们来提交试试。可以看出 codex 开始工作了,让我们稍微等待一会。 好,他现在要问我们几个问题,我们来做一下选择。首先是数据要放在哪里,我们就放到文件里面吧, 然后交付到可开发运行的程度就可以了。这之后呢, codex 就 会继续开始干活了。好,可以看出 codex 开始给我们写这个计划了, 我们再稍微等待一会,它还在这个转写的过程中。 好,写完了,我们来看一下,这个计划本身还是比较完善的。呃,包括各种测试方案呐,架构设计啊,都是写的比较详细的。然后 codex 问我们是不是要按照这个计划去实现代码。 呃,他一共是给了我们两个选项,第一个选项呢就是直接同意啊,开始实现这个计划就好了。第二个选项呢是如果你对这个计划不满意的话,你可以提出你的要求,在这个文本框里面告诉 codex 应该如何做修改,然后 codex 会根据这个修改呢,再出一份新的计划。 呃,这里面呢,我们就不对计划再做一些其他修改了,我们就直接同意好了,让 codex 就 按照这个计划给我们来写代码。 好,现在 codex 开始干活了,我们需要稍微等待一下,在等待的过程中呢,我们可以跟 codex 随便去聊点东西,我们可以在输入框 side 打开 side chat 啊,在这里面呢,我们就可以随便问 codex 点别的问题,这些问题呢不会去影响左侧 codex 的 任务执行。比如说我们可以问一下,你觉得这个笔记软件还需要什么基本功能呢?提交 好 codex 呢,给了我们一些可行的方案。你看在 side chat 的 过程中, codex 左侧的任务执行一点也没有被干扰到。对,这个呢就是 side chat 的 一个非常重要的特点了,它就是允许用户在 codex 执行任务的过程中问一些比较轻量级的问题, codex 在 回答这些轻量级问题的过程中不会影响到左侧主任务的执行。那这个就是 sign chat 这个功能的特性了。这个呢,我们就先讲到这里,这个架构改造的工作量还是挺大的, codex 依然没有完成,让我们再耐心等待一会儿。 好,看起来 codex 已经完成任务了,它提示我们使用 npm runtime 这个命令就可以启动这个 electron 应用啊,让我们来试一下。首先按 command 加 j 打开终端,然后执行命令 npm runtime 回车, 这样的话这个 electron 应用就启动开了,不过看起来好像是有点问题,基本上是一个白屏的状态。呃,我们打开控制台看一下有没有什么报错 啊,确实有报错,这个呢,我们需要让 codex 帮我们来修一下啊,让我们来回到 codex 这里, 先把这个进程关掉,然后呢再把终端关掉,然后我们提出我们的诉求,启动后白屏控制台报错了。看来你之前的测试不够彻底啊,请你修复并确保在修复之后测试好再交付给我。 codex 说,我说的对,哼。呃,让我们等 codex 把这个错误修复之后再试一次。 呃,看起来 codex 已经修复好了,我们来看一下它修复后的效果是怎么样的。呃,同样,我们打开终端,然后执行这个命令 啊,这次呢,看起来没问题了,添加笔记呢也是可以的,我们呢也可以在这里面随便输入的标题内容都可以啊,主题切换也是没有问题的。 那看起来已经很完美了,各项功能都运转正常。让我们再回到 codex 这边。 呃,我们先按一下 ctrl 加 c, 关掉这个进程,然后呢,再把终端收起。好,那改成了 electron 架构,我们就继续来提新的需求。我们的新需求是为这个笔记应用增加 markdown 支持,具体来说,需要在编辑器右上角提供两个模式切换按钮。 那假设这个时候我想换行,怎么做呢?直接按回车肯定是不行的,按回车就提交了,正确的做法是按 shift 加回车。你看这样呢,就可以回车了。我们继续输入任务内容, 首先是编辑模式,显示所有文本内容,并对其中的 markdown 语法进行高亮显示。然后还有一个是预览模式,它用于显示 markdown 的 渲染结果。现在再回车。 好,可以看到 codex 开始工作了,在它工作的间隙,我们再创建一个新的绘画,让它再处理另外一个关系不大的任务。 我们的新任务就是给这个笔记项目生成一个 logo, svg 格式。可以看出这两个绘画都在工作中了。假设这个时候你突然想到了我们的笔记软件有深浅两种模式,这个 logo 需要在任意一个模式下都清晰可见。我们最好提醒一下 codex, 以免它忘了, 好让我们发送请求。不过这个请求似乎没有发出去,它似乎卡在这里了。没错,在默认情况下,只有当上一个请求完成后, codex 才会继续处理下一个请求。 不过到那个时候就有点晚了吧,毕竟 logo 都生成好了。我们能不能现在就把这个信息发送给 codex, 让它在生成 logo 前就注意到这一点呢? 没问题,注意到这里的 steer 按钮了吗?点一下,我们的请求就会立即发送给 codex, 这样我们的目标就达到了。那 codex 现在还在运行中,我们稍稍等待一会儿。 好,可以看出 logo 已经生成完毕了。我们切回到原来的那个绘画,看看它的进度怎么样了,它还在运行中,所以我们可能还需要再稍微等那么一会儿。 好,这两个任务呢都完成了,我们来直接打开软件,看看最终效果。首先是要打开终端,然后呢,我们运行 n p m start, 打开这个 electron 应用。呃,看起来好像是有点问题啊。 logo 没有被成功地加载起来, 那我们需要跟 codex 说一下这个事情,让我们先关掉这个 electron 应用。 然后呢,我们关掉这个 electron 进程,先看看这个 logo 在 不在 啊?这个 logo 确实是在 public 文件夹里面的,那应该不是文件不存在导致的。那是不是这个 svg 文件的格式有问题呢?我们来到访达来验证一下。 打开这个 public 文件夹,看来这个 svg 文件的格式也是没有问题的,毕竟访达都正常渲染出来了。 那大概率是 electron 加载这个 svg 文件的方法有问题。让我们来让 codex 修一下。首先按 command 加 g, 我 们唤起这个绘画列表,然后选择生成 logo 的 那个绘画, 然后在这里面我们输入具体的问题, logo 没有显示出来。提交好,提交之后呢, codex 就 开始给我们排查原因了,我们再稍微等一会儿。 修复完毕,我们再次启动这个软件看看效果。 首先打开终端,运行 npm start 好, 这次看起来 logo 是 成功的显示出来了,我们还可以随便点一点其他的功能,看看整体是否运转正常。 那 markdown 呢?我们可以随便输入几个 markdown 的 关键词,看一看它的高亮显示是否正常。看起来似乎并没有什么太大问题,各种格式呢,都可以非常正常地显示出来, 可以看出预览也是没有问题的。那这次需求就到这里了,我们再次回到 codex 这里,继续迭代它。 前面我们讲的呢,都是 codex 的 基本能力,下面我们来讲讲 plugging。 你 可以把 plugging 想象成一个 codex 的 外挂,它会给 codex 相应的能力,帮助 codex 去做更多的事情。这么说呢,可能比较抽象,我们可以来实战一下。呃,我们首先可以打开侧边栏, 然后点击里面的 plugins, 在 这里我们就能够看到所有可用的 plugin 了,其中有能控制电脑的,有用于操作 chromed, 还有用于编辑 excel 的 啊,还有一些是用来制作 ppt 的。 如果 plugin 的 旁边打了勾,那代表这个 plugin 已经被安装好了。如果 plugin 没有安装的话,旁边会是一个加号,我们点击这个加号就可以正常安装了。我们来随便点几个 plug in, 看看它内部到底有什么。 比如我们可以点一下这个叫做 gmail 的 plug in, 可以 看到这个 plug in 内部有三个组成部分,其中一个是 app, 两个是 skill。 这个 app 呢,是用来把 codex 和 gmail 连接起来的, 它里面提供了很多的工具,当然 codex 没有叫它是工具, codex 叫它是 action, 但其实本质上啊,这里面就是一个一个的工具,跟 mcp 的 工具呢差不多。 比如 apply labels to emails 就是 用来给邮件打标签的 archive emails 就是 用来归档邮件的。这个 app 一 共是提供了二十四个这样的工具,除了 app 之外,这个 plugin 还提供了两个 skill, 呃,你基本上是可以把 skill 当成是给大模型看的一个说明文档, 比如说是这个 gmail skill, 它就写明了怎么总结邮件内容,怎么赚,写回复,以及什么时候该调用哪一些工具啊等等。 而这个叫做 inbox treeash 的 skill 呢,则是告诉大模型如何给邮件归类的,比如说哪一些邮件比较紧急,哪一些邮件需要回复等等。如果你对 skill 比较感兴趣,可以看一下我的这个视频,把 skill 的 使用方法和运行原理一次讲明白。 gmail 的 这个 app 所包含的内容呢,就只有这三个了,我们如果选择安装 gmail 这个插件,那其实就是选择安装了这三个组件。等到用户想要 codex 操作 gmail 的 时候, gpt 模型便会找到这三个组件,并用它们提供的能力和说明来完成。用户的要求 大致就是这个样子的。我们来看一个具体的例子,比如说是 presentations, 这个 plugging 呢,是用来写 ppt 的, 它只有一个组件,那就是这个叫做 presentations 的 skill。 这个 skill 详细说明了该怎么做才能做出一个高质量的 ppt。 下面呢,我们就尝试用这个叫做 presentations 的 plugging 来完成我们的需求,让我们来新建一个绘画,然后输入我们的要求,给这个笔记软件做一个 ppt, 介绍它的产品设计和技术架构。 提交之后, codex 就 会找到我们前面所说的那个叫做 presentations 的 plug in, 并使用那个 plug in 提供的能力来做 ppt。 当然,如果你担心 codex 找不到这个 plug in, 或者说是找错了的话,你可以明确要求 codex 使用这个叫做 presentations 的 plug in, 这只需要在任务的最前面输入一个 at 符号,然后敲入 presentations 回车,这样 codex 就 一定会使用 presentations 这个 plug in 来做 ppt 了。 不过不加也没关系, codex 会自动找到这个 plug in 的, 所以呢,我们暂时就把它给去掉吧。好,提交,可以看出 codex 开始工作了,我们稍微等待一会儿, codex 写好了,我们打开看看。 中规中矩吧,其中其实还有不少可以改进的地方,不过这已经是一个不错的起点了,我们可以在这个基础上做一些其他的改进。 这个叫做 presentations 的 plug in 并不能算上经验。下面呢,我给大家介绍 open ai 所提供的两个用来镇店的 plug in, 一个呢是叫做 computer use, 用来控制电脑。另一个呢是叫做 chrome, 用来操作 chrome 浏览器啊,我们先来试一试 chrome 这个插件, 让我们来到这个插件管理的地方,然后呢,点击 chrome 旁边的这个加号来安装这个插件, 点击 install 好, 安装好了。然后呢, codex 提示我们需要在 chrome 上面也安装对应的扩展也行。好,那我们就按照它的指示来安装这个扩展。 那一切准备就绪之后,我们就来尝试用用这个 chrome 插件,我们可以直接点击旁边的这个按钮,这样的话, codex 就 可以给我们出实化一个使用当前插件的这么一个请求。呃,我们可以把后面的这个部分给去掉,换成我们具体的请求, 那就是打开 product hunt 首页,然后再找出今天最热门的三个新发布的产品,总结它们各自的特点,并附上对应的访问链接好提交。 呃,为了让大家看得更清楚,让我来把 codex 缩小一点,把 chrome 浏览器放出来,这样的话呢,大家就可以更清楚地看到 codex 到底是如何干活的了。 可以看到 codex 创建了一个标签组,这个标签组呢,专门用于解决我们的问题,然后它在这个标签组里面访问了 product hunt 的 首页,今天最热门的三个新发布的产品就在这里了,相信 codex 也看到了。 可以看到,现在 codex 开始打开另外一个标签页了,这个呢,看起来是第一个产品 brew 的 一个相关网站,然后呢,它又打开了一个。 呃,接下来呢,我们就不管了, codex 估计还会查看更多的网页,我们就在这里稍微等待一会,相信他等会就可以查询全部的产品页面,然后给我们一个比较有效的反馈,让我们稍微等待一下。 好, codex 给我们总结了,这个呢,基本上也就是我们想要的结果了,这个呢,就是 chrome 这个插件的相关使用方法了,让我们把这个 codex 再次最大化。 然后下面呢,我们就来看一看 computer use 这个插件的使用方法,它是用来操作电脑的,同样,我们点击这个加号,然后进行安装, 安装成功,让我们来使用一下。跟 chrome 的 使用方法类似,我们也可以点击 computer use 旁边的这个小图标,这样直接就能开启一个相关的 computer use 绘画。我们先把后面这段文本删掉,因为它跟我们真实的请求没有什么关系。 然后呢,我们再稍微改一下这个请求所对应的目录,我们现在呢是放在马克笔记这个地方,但实际上我们要打的这个请求呢,跟这个项目其实没什么太大关系,所以呢,我们就选择 don't work in the project, 也就是说,这就是我们随便提出来的一个请求,不会去绑定某个具体的项目目录。之后,我们就可以正式输入自己的请求了,那就是请打开我电脑自带的日历应用,帮我新建一个五月二十八日十点的日程标题,叫做讨论马克笔记的后续设计。 没错,就是这样,我们让 codex 操作一下日历这个应用,然后同之前一样,我们把 codex 缩小,把日历这个软件漏出来。这样呢,大家就可以更清楚地看到 codex 是 怎么操作我们这个日历软件的。 好, codex 首先询问我们能不能使用日历这个应用,我们同意, 可以看出 codex 开始行动了,这个呢就是 codex 的 鼠标,它跟我们所使用的鼠标呢,根本是两套,彼此之间互不影响啊。然后 codex 呢就开始操作这个鼠标,去完成我们的需求, 它还需要我们确认一下是不是真的要创建这个日程,这个有点啰嗦,那当然是确认了,我们给它回复一下, 好,看起来 codex 已经完成了我们的要求了,我们来看一下, 看起来这个日程的标题和时间段都是满足我们要求的,那就没问题了,我们再把 codex 最大化。 这个呢,基本上就是 computer use 这个插件的使用方法了。值得一提的是, codex 使用独立的虚拟鼠标,与你的鼠标互不干扰。刚才把日历软件提到前台只是为了掩饰,实际上你完全可以让它在后台默默干活,自己该干嘛干嘛,上网看视频都可以,完全不会耽误。 好, computer use 讲完了,我们接下来就来看看 skill 是 如何使用的。想要浏览 skill, 我 们就必须要先打开 plugins, 然后再点击这里面的 skills, 就 可以看到可用的 skill 列表了。 其实我们之前用 plugin 的 时候已经间接的用过 skill 了,因为无论是 presentations, computer use 还是 chrome, 这几个 plugin 的 核心组建呢,都是 skill, 你 在这个 skill 标签下面都能找到。 当我们安装对应的 plugging 的 时候呢,我们都会把相关的 skill 一 块儿安装好,所以我们在这里都能找到这些 skill。 不 过有一个王牌级的 skill 是 单独列在 skill 这个标签下面的,它并没有一个对应的 plugging。 这个 skill 呢,就是 mhgen, 它是用来生成图片的, 相信大家对 g p t 的 生图能力早有耳闻,不仅美观,而且非常的真实。下面呢,我们就来使用这个 skill 来创建一个图片。我们在马克笔记这个项目下新建一个绘画,然后输入我们的要求,给这个笔记软件生成一个宣传海报图片,注意要使用我给你的真实的软件截图。 然后呢,我们需要给 codex 相应的软件截图,我们先按 command 加 j 打开终端, 然后执行 npm start 命令来打开我们的笔记软件, 然后我们回到 codex 这里,点击加号,再找到其中的 attach electron 这个选项,这里面的 electron 其实就是我们的马克笔记软件了, 我们的这个笔记软件就是用 electron 做的,所以呢,在 codex 里面看来,这个笔记软件就叫做 electron, 我 们来直接点击这个选项,点击之后呢, codex 询问我们是否要启用这个功能,我们点击 enable, 然后我们的马克笔记截图就到了聊天框里面了,这样 codex 在 做海报的时候就可以根据真实的软件截图来做了,是不是很方便呢?点一下按钮就可以把截图放进来了, 不过这个还不是最方便的, codex 还提供了一个快捷键,按一下就能够把截图传过来。我来给大家演示一下,我们之前给 codex 的是浅色模式的截图,我现在在给 codex 传一张深色模式的,我们回到马克笔记这里,调到深色模式, 然后重点来了,左右 command 键同时按下,这样深色模式的马克笔记截图也传给 codex 了,这个确实更加方便了吧。好,现在 codex 有 了浅色和深色两种模式的截图,我们可以让它开始做海报了。提交, 首先我们可以注意到 codex 会使用 image 这个我们之前提到的技能来做这张宣传海报,然后我们就再等等,看它能画出什么样子来。 画完了,我觉得还行吧,确实是基于我们的截图来做的,不知道你觉得怎么样呢? 除了使用 codex 给我们安装的 skill 外,我们也可以创建自己的 skill。 让我们按 command 加 n 新建一个绘画,然后输入我们的任务,写一个代码审核 skill, 专门给当前的项目使用。这个 skill 应该包含如下的规则。好,我们提交 可以看到这个 skill 已经做好了,它的名字就叫做 marknotes code review。 下面让我们按一下 command 加 n 新建一个绘画,试试这个 skill 的 效果。首先我们 at 这个 skill, 然后提出我们的请求,检查当前项目的代码是否有问题。好,可以了, 结果出来了,还可以,我们还可以让 codex 根据审查的结果来修改代码。这里呢,我就不再继续演示了, 我们的笔记软件每天都在迭代,每天都有代码更新,所以我们最好能每天定时检查一下代码,看看有没有什么问题。这种场景就很适合起一个定时任务来处理。 codex 也提供了这样的功能,让我们来点击这里面的三个点, 再点击 add automation。 呃,也就是添加一个定时任务。这里呢是定时任务的标题, codex 已经帮我们填好了。这里呢,填写发起定时任务的时候,我们需要发给 codex 的 要求,我们的要求呢就是检查当前项目的代码是否有问题。 然后下面呢是执行环境,一共是有三个选项,分别是 local, worktree 和 chat。 local 呢是在某个项目目录里面运行这个定时任务 worktree 是 基于某个项目目录创建一个新的 worktree, 这个定时任务就在这个新的 worktree 里面运行。 worktree 的 概念我们之前讲过,它是 get 的 一个概念,如果你还是一知半解的话,可以先不管,我们这里不用这个选项。 chat 呢是执行环境,不跟任何项目目录绑定,我们之前用 chrome plugin 搜索网络的时候,实际上是用过 chat 环境的, 这里最适合我们的是 local, 毕竟我们的定时任务就是要扫描马克笔记的项目代码,所以一定是要跟某个项目目录绑定起来的。让我们选择 local, 然后在这里面选择马克笔记,然后这边呢是运行频率,我们选择 daily, 具体的时间呢,我们就维持在九点钟,意思就是我们这个定时任务在每天九点钟的时候启动, 下面呢我们选择模型 g b t 五点五,推理强度呢,我们就维持目前的 medium 就 好了。然后我们点击 save, 再打开左边栏, 我们就可以看到 automations, 这里面多了一个一。点击之后就可以发现我们创建的定时任务了,它会每天十点开始运行,每次运行的时候都会创建一个新的绘画,我们可以点击这个按钮试运行这个定时任务, 可以看到一个绘画创建出来了,就是用来运行这个定时任务的,我们来打开看一下, 好,可以看到这个定时任务已经完成了,后面每天跑的也都是这个样子了,那这个就是定时任务了。最后我想给大家讲讲 codex 的 一个特别有用的功能,那就是 codex mobile, 具体来说就是我们可以在手机上操纵 codex 来给我们完成任务,让我们来点击这里面的 codex mobile, 再点击 allow 允许手机操纵这台电脑, 然后再点击弹,点击完弹了之后, codex 应该会给你显示出一个二维码来。 呃,如果你像我这样没有显示出二维码的话,可以点击这里的手机图标,这样二维码就出来了。随后我们需要打开手机摄像头扫描这个二维码。然后呢,我们就会被引导到叉 g b t 的 codex 页面。在这里我们就能向电脑端的 codex 发送指令了, 比如我们想让它操作一下日历。你还记不记得我们之前在日历上创建了一个日程标题,就叫做讨论马克笔记的后续设计。现在我们在手机上再发送一个指令,让它把这个日程去掉,我们点击聊天。 然后呢,我们再点击这里,呃,在里面找出 computer use 这个选项。 随后呢,我们需要输入我们的请求,我们的请求就是把日历中五月二十八号呃,讨论马克笔记的日程删掉, 写完之后先不要忙着提交,你看,我们现在在马克笔记这个项目目录下,但我们的请求其实跟这个项目的代码没什么关系,我们就想操作一下日历软件,所以我们需要再点一下这个设置按钮,然后选择不使用项目。好,这样呢就万事俱备了。我们提交请求, codex 首先询问我们是否同意使用 calendar 这个软件,我们批准。然后 codex 再次询问我们是否要真的删除掉这个日程,我们确认, 随后 codex 就 开始操纵电脑了,我来给大家看看电脑上是个什么样子,你看日历上面多了一个鼠标,它正在操纵电脑删除这个日程。 好,删除成功了。这样呢,我们就做到了用手机来操纵电脑了,是不是很方便呢? 这样大家在外面也可以使用 codex 来做各种各样的事情了。好到这里本期视频就结束了,我是马克,用最通俗的语言讲最硬核的技术,我们下期再见。拜拜。

最近 codex 啊很多朋友们不知道该如何选择,今天这一期就给大家分享详细的 codex 多端使用教程。 codex 实际上不止只有一个入口啊, ide、 插件、桌面 app、 c o i 和手机端每个入口有什么优劣势?新手小白到底该怎么选? 今天这期视频 frank 就 全部给你讲明白了,就是在 ide 插件里面去使用 codex 啊。常见的 ide 包括像 cursor vs code 或者 tree 这些, 它们的页面布局常为左边是文件管理,中间是预览,右边是 codex, 是 对画框 id 的 优势就是可以边看边改,你可以随时打开文件预览, 然后跟 codex 说这里改一下,那里重新生成。如果你在做前端的网页,它就会好用,因为你能够直接看到结果,包括像 mapdown、 文本、图片、代码、网页甚至视频。 第二个就是 codex 的 桌面 app, 如果你是纯新手小白,根本看不懂代码,但是又想做出自己的项目,这个入口就会更好。它的页面逻辑,左面是项目管理,中间是聊天框,右边可以看文件或者页面的预览。 桌面版最好用的地方就是任务比较好分开,比如说你可以同时开不同的项目,又可以在同一个项目下面去开多个对话,在不同的对话之间切换就非常的方便。但是有个需要注意的点就是不要太多县城同时跑任务, 如果你本身电脑内存就不太够,可能就会有卡顿。第三个入口就是 c o i, 也就是大家可能听过但是不敢碰的终端命令。行,你可以在终端里面去掉出 codex, 然后用自然语言去跟它沟通目标。 codex 优势就是内存占用小,并发跑任务压力也会更小。 另外 codex 一 些斜杠命令行也只能在终端使用,比如说你想调出某个历史对话,就可以用斜杠 resume 输 关键词,就可以很高效的找到你的历史对话。以及你觉得有一段对话已经聊得比较久呢?只要压缩上下文就可以用斜杠 compact 就 可以开启手动的上下文压缩。第四个入口就是最新发布的手机端, 它最适合的不是在手机上面完成做项目,而是移动去查看进度。我相信很多 qq 上瘾的朋友都会遇到一些情况,就是,哎,自己做项目很开心,但是就需要一直坐在电脑的面前,但是移动端就可以让你放心的出门,你可以给到指定之后,完成后再给到另外的需求。最后帮大家整体梳理一下, 如果你想要边做边看文件,边看边改,就可以用 ide 的 codex 插件。如果你是纯新手小白,想要开箱即用,完全不需用折腾就可以用桌面的 app。 如果你已经习惯了命令行,且比较关注内存的占用,就可以考虑用 c l i。 如果你想不在电脑面前也要跟进进度, 就可以用手机端跟其他入口一起来使用。希望听完这一期你已经知道自己该选什么,然后你可以跟 codex 开心的玩耍。 ok, 我是 fred, 专注从普通小白的视角分享,从零到一,学习 ai 和 vip coding, 我 们下期再见!

一定一定要想尽办法用上 codex, 至少我不允许我的粉丝没有用上 codex。 如果你跟你正在做互联网的朋友从来没有聊过 codex 或者是 cloud code, 那 恭喜你,你刷到这条视频一定是非常重要的一条信息差。 codex 到底是什么?其实官方给他的定义就是 gpt 下面的一个编程助手黄仁勋现在要求他的很多员工都在用 codex, 因为它不仅是一个工具,它更像是下一代的生产力。 你最近应该刷到很多新闻,什么纳斯达克来到了高新、 ai 芯片暴涨、储存芯片缺货,公司疯狂上涨等等等等,你以为大家是在炒芯片吗?其实本质上大家都在指向同一个方向,就是 ai 开始进入生产环节了。 而 codex、 cloud code 就是 普通人第一次真正地摸到了这个时代的红利入口。当然,像 cloud code 对 于普通人来说,门槛真的有点高,我被封了三个号,玩儿这玩意儿真的对新手来讲特别不友好。但是 codex 这两个月的变化太快了, 如果你两个月前问我,我可能还会犹豫,但是现在它几乎每天都在更新,每天都在迭代,有一段时间,它真的是天天,天天都在迭代。现在的 codex 已经越来越成熟了, 而且它有一个最大的价值在于普通人终于可以真正开始使用 ai 的 能力了。以前很多东西你不会写,不会写代码根本碰不到, 现在不一样了,如果你是一个大学生,或者是在职场当中的人,那么其实你很幸运,因为你刚进入社会,就碰上了一波非常大的技术切换, 他有点像什么呢?就像你在食堂排队打饭,结果旁边突然开了一个新的窗口,那这个时候最重要的不是站在原地研究,而是赶紧过去,因为很多机会本身就是属于第一批反应过来的人。

今天教大家 codex 另一种接入方式,首先还是先将安装好的 codex 关闭,先配置,打开安装好的 cc switch, 先添加一个,这里我们直接选接入对应的模型名字。今天我们是接入小米的 miimo 模型, 我们只需要添加迷模的 api, 这里我们再添加一个模型, 然后直接保存即可。记得起用一下删除原有的。打开设置,选到路由,这里可以设立本地地址和端口,已办默认即可。 将本地路由两个开关都打开, codex 这个也开,然后就完成了。重新启动一下 codex, 因为我已经使用过了,所以有对话记录,这里可以看到我们显示 mimo 的 模型了,来测试一下, 没啥问题。这种方法有个缺陷,就是你界面换成中文就不显示模型名字了,给大家演示一下,重启一下 codex, 其实这种就是使用了 cc switch 的 本地路由,如果你只使用单个模型,直接使用这个方法也可以, 可以看到我们界面换成了中文,但是模型名显示成自定义,没有名字了,但是也是可以正常使用的, 还是老样子。先把装好的 codex 关闭, 然后先启动 ccx, 这里要配置这个 f 文件,不知道的可以看我之前的视频, 访问一下本地的地址,进入配置页面,选到 codex 页面,把原有的先删除, 再重新添加新的渠道,切换详细配置,这就和接入 deepsafe 配置差不多了, 先去米某官网拿一下 a p y k 吧, 创建一个, 然后复制进来添加, 这里配置重定向模型,最好把列表有的都配了,加速一下, 把这开关打开, 再配置 c c switch, 这里我们先进入设置,把本地路由关闭,我们这个方法不需要打开本地路由的。 重新添加一个 这里的 api key 是 c 级 x 中安抚中配置的 key, 注意这个切记不要打开 启右,然后把旧的删除,确认一下配置没问题, 重新启动 codex, 这就进来了。可以看到我们是英文界面,也是有显示模型名字的,测试一下 没啥问题。我们再来验证一下,变成中文界面会不会模型名字消失,还是重启 codex。 可以 看到我们界面换成了中文模型名字也是正常显示的, 再来测试一下, 没问题。点个赞再走吧,谢谢了。

这是一条 codex 从零到一完整的新手入门教程。如果你之前完全没用过 codex, 或者只是听说过,但不知道它到底能干什么, 怎么装,怎么用,那这条视频你就可以收藏了。我会按照一个新手真正上手的顺序,带你从 codex 试什么,讲到安装、使用、主界面、怎么操作、基础功能和进阶技巧、 skills 插件、浏览器终端和自动化任务等等,让这个目前全球最顶级的 a 阵的工具真正为你所用,创造价值。 我也会把整个流程整理成文档,打一句 codex, 方便对照,一边看一边选。你可以先把它理解成一个装在电脑里的 ai 工作助手,他不是单纯陪你聊天的工具,而是可以进到一个具体的工作文件夹,帮你读取文件、修改内容、运行命令、调用工具,甚至按步骤完成复杂任务。 举个最简单的例子,像 chat、 gpt、 豆包这一类工具,更像是你问他答,你自己去做。比如你想做一个网页,他通常只会给你一段代码,接下来你还要自己复制代码、创建文件、运行、检查报错等等。而 codex 是 你问他,他理解他还做,他会从零到一帮你创建好这个网页。 目前最适合新手小白的上手方式呢,是桌面端 app, 我 们可以直接在官网开始,根据你的系统选版本, windows 或者 mac os 都可以。安装之后有两种登录方式,一种是官方 chad gpt 账号登录,另一种是用 apikey, 可以 是官方的,也可以用中转站。两种方式各有利弊。综合来看,还是建议第一种,直接官方账号登录, 省心省事。对于 codex 的 界面,新手可以先关注三个核心区域,最左侧是一些常见功能入口和聊天记录管理区,你可以理解为导航栏加历史记录。这里需要重点讲一下对话和项目的区别。对话最好理解就是普通聊天嘛,你甚至可以把它直接理解为 chat、 gpt 或者豆包, 适合随便问一些小问题,帮你写文案、查资料之类的。它不跟具体的文件夹绑定,而项目就涉及到了具体的生成式任务,比如 如飞哥之前开发的工具箱网站,飞剪一触即达这种软件,他们有大量的编程代码文件,就需要一个专用的项目文件夹。你在这里可以新建空白项目,也可以打开现有文件夹,直接选择路径,或者直接把文件夹拖进来也行。鼠标悬停在项目名上,也能看到这个文件夹在电脑中的 底位置。而对于重要的常用的项目和对话,右键就可以置顶,方便快速切换和查看。左侧下方还有设置入口,在设置里你可以修改 codex 的 使用偏好、外观和配置等等。其中个性化需要重点说一下, 如你想给他一个全局指令,就在自定义这里直接写,比如他要怎么称呼你,固定用中文回答问题,设定一些底线原则或者开发习惯,设置完之后对所有项目都会生效,相当于让这个员工摸清楚你这个老板的脾气,投你所好。这里还有一个很有意思的小功能,叫桌面宠物, 他提供了很多默认的宠物形象,你也可以根据自己的喜好让他帮你创建一个,比如我这个就是给了一张参考图,让他自己做出来的,他会实时显示当前任务的一些简单状态,还是挺好玩的。 在首页设置这里还能看到剩余用量,你可以清晰的看到五小时用量和一周用量,做到心中有数。中间这块就是你和 codex 的 主要沟通区域。首先是这个加号里面有两个非常重要的功能,一个是计划模式, 比如你让他开发一个个人博客网站,不要上来就直接让他干,而是让他先列出计划。相当于你给员工一个项目,得先让他出方案,看看他打算怎么做,这样能有效减少返工,既省精力又省 tokyo。 看啊,他会主动问我们这些具体细节,我们按选项敲定,不满意的或者他没提到的就补充一下,让他重新规划, 这才是一个合格的领导该干的事。而目标模式就更厉害了,刚上线的新功能就是你给他设定一个目标,越具体越好,他会自己拆解分析。执行审查,有一种不达目的不罢休的意思,这样就避免了一个很烦的问题,执行一个任务的时候,他每完成一步就要停下来问你。 比如我正在跑的一个很复杂的大项目,目前已经连续跑了三十多个小时,如果正常一步一步改的话,我可能要好几天才能做完这些进度。右边这个权限设置呢,分成三档,默认是最保守的,像是联网修改文件都需要你的授权,自动审查会开放一部分权限,关键节点还需要你把控。 而完全访问就是最激进的,它几乎可以完全操控你的电脑,创建文件、删文件、跑命令,全都自己干。新手,我不建议一上来就开完全访问,刚开始用默认或者自动审查更稳,等你确认这个项目没问题,也知道它要做什么,再考虑给更高权限。我自己是在非常熟悉项目和流程的情况下才会开完全访问。 右边这里还可以切换模型,选模型版本、智能程度和推理速度。如果不是特别复杂的任务呢?不建议开超高,因为它有可能会出现过度思考,而导致你花了更多的 token, 反而干的不好。 这是血淋淋的实战经验教训,一般来说默认高就可以了。这个麦克风是语音输入,但是体验目前并不是很丝滑,我们可以直接用语音输入法。 codex 还有一个和普通聊天很不一样的地方,任务可以排队,他正在执行的时候,你可以继续补充,要求这些新消息会一个一个排在后面,等他处理完当前步骤之后继续执行。比如他正在做网页,你可以接着说,页面再简洁一些,按钮换成黑色,先不要做登录功能等等。 而如果你忽然发现他理解错了你的意思,或者做了一半有点跑偏了,可以直接选择引导,强行把方向盘掰回来。所以用 codex 的 时候不一定要追求第一条提示词写的特别完美,你可以边看他做边补 充,边纠正边引导。真正好用的方式是把他当成一个正在干活的助手,而不是一个只负责回答问题的聊天框。这个思维一定要转变过来。 最右侧的区域目前包括三个功能,侧边聊天就是当前任务的一个临时讨论区。因为有时候 codex 正在执行一个主任务,但你中途想问点小问题,或者单独讨论某 个细节,就可以用它,它不会打断主对话的节奏。浏览器主要是 codex 打开网页查资料测试页面,比如你做了一个网站,可以让他直接打开本地页面,帮你检查布局按钮、交互有没有问题。如果你对某个地方不满意,还可以让他直接打开本地页面,帮你检查布局按钮、交互有没有问题。如果你对某个地方不满意,还可以让他直接打哪的感觉, 口头描述半天要精准的多。终端的话呢,其实你不需要了解太多,因为它主要是给 codex 执行命令用的。到这里,其实你已经看到了 codex 最核心的几种能力,它可以进入项目,读取和修改本地文件,可以用计划模式先想清楚怎么做,可以通过浏览器查资料测试网页,也可以通过终端运行命令检查结果。 所以 codex 真正厉害的地方不是某一个单独按钮,而是它能把这些能力组合起来,帮你完成一个完整任务。理解了这一点,后面的 skill 插件和自动化任务就很好懂了。 因为前面这些能力呢,解决的是 codex 自己怎么干活的问题。但如果你想让他干的更稳定,更像一个熟悉你习惯的助手,就需要用到 skill。 如果你想让他连接更多外部工具,就要用到插件。 这里很多新手分不清 skill 和插件,其实用一句话就能记住, skill 是 方法,插件是工具。 skill 可以 理解成一套可以附用的工作流,或者说给 codex 的 一份工作方法说明书。比如一家公司做项目,通常都有一套标准流程,第一步做什么,第二步做什么,输出格式是什么,有哪些注意事项,哪些地方不能乱改。 这些东西如果每次都重新告诉 ai 一 遍就很麻烦,而且 ai 它还可能每次理解的不一样。所以更好的方式是把这套工作流程固定沉淀成一个 skill。 这样 codex 下次遇到同类任务时,就不用像一个新员工一样重新摸索,而是直接按照你写的流程和标准来做。 比如我自己的飞鸽工具箱里就有很多专属 skill。 比如把好用的软件保存入库到本地,同步到我正在做商单推广的几个云盘,生成下载链接,再同步到正式站,这些流程全都是固定的。 我把它们写成 skill 之后, codex 就 可以按这套流程稳定执行,不会每次都跑偏。再比如,你经常写短视频文案,也可以让 codex 帮你做一个短视频文案 skill, 把你之前写过的大量文案喂给他,让他总结你的开头风格、结构、习惯语言表达、结尾方式,然后形成一个专属文案助手 后,再写类似内容的时候, codex 就 会优先按照这套方法来。插件就不一样了,插件更像是给 codex 装上外部工具,解决的是它能不能操作某个平台,处理某种文件,连接某个服务。 比如浏览器插件,可以让 codex 打开网页查资料、测试页面表格插件可以让它处理 excel、 ppt 插件可以让它生成演示文稿。 gmail 插件可以让它整理游戏, camera 插件可以把生成的内容导入到设计工具里继续编辑,所以不要把他们想的太复杂。 skill 解决,怎么做插件解决用什么工具做?一个是工作流程,一个是工具能力。 codex 目前已经集成了很多实用的插件和 skill, 我 也整理了几个比较常用的,大家可以截图保存,后面自己试试看。 最后我们再来看一个比较进阶但非常有想象力的功能,自动化任务。你可以先理解成让 codex 在 固定的时间、固定的项目里自动帮你做一件事,但它和普通题型软件不一样,它们最多告诉你该干什么了。 而 codex 的 自动化任务是真的可以帮你执行一整套流程。比如你是做内容创作的,你可以让他定期帮你收集某个领域的热门选择题,整理成标题、角度、参考链接和可以拍摄的脚本。而飞哥最常用的就是每天固定时间设置一个今日任务清单,划掉昨天已经做完的,生成当天新的任务, 就像一个机器人一样按清单执行。这也是为啥有人说我效率那么高,一个人干八个人的事情。除了 ai 的 强大助力之外,任务规划本身也非常重要。所以自动化任务真正厉害的地方不是定时提醒,而是定时让 ai 按你的要求去干活。 最后再补充一个很多人会关心的问题, codex 能不能在手机上用?据我所知有三种方式,最早大家都是用 happy 这种开源项目,它可以连接 codex cloud code, 电脑上开个任务就能通过手机和 agent 的 沟通,但始终不太方便,相当于只是给你安排了一个传话筒。 而 codex 的 mac 版本最近更新了手机端的入口, chat gpt app 里面就有 codex 可以 完整读取你的聊天记录。在手机里聊天和电脑端的消息是完全同步的,本质上是远程链接,相当于把你的电脑版正在跑的 codex 搬到了手机里。而最近我发现了一种非常爽的方式,就是网易的优优远程, 出门的时候手机直接远程连电脑,操作起来很方便,最关键的是你能同时测试它的改动,这就相当于把你整个电脑都装进了手机,所以功能最完整。 好,最后我们来个回顾,总结一下你都学了什么。如果你是第一次接触 codex, 其实今天不用记住所有按钮,也不用一上来就研究特别复杂的自动化和插件,你只要先记住这条主线就够了。第一, codex 不是 普通聊天工具,它更像是一个能进入你电脑工作区的 ai 助手。第二,临时问问题,用普 对话,真正要处理文件、项目代码、文档就用项目。第三,复杂任务不要直接让它开干,先用计划模式让它列方案,如果是一个长期目标,再考虑用目标模式让它持续推进。第四, skill 是 方法,插件是工具。 skill 负责告诉 codex 怎么做事儿,插件负责让 codex 连接浏览器、表格、 ppt 邮箱这些外部工具。第五,自动化任务不是简单提醒,而是让 codex 在 固定时间按照你设定好的流程自动干活儿。 所以新手今天先做三件事就够了。第一,安装并登录 codex 桌面端。第二,建立你的第一个项目,找一个真实的小任务试一下,比如整理一个文件夹,总结几篇文案,或者生成一个简单网页。第三,让 codex 帮你写一份自己的 agents, 点 m d 就是 我们刚才提到的个性化。现在你让他自己干,把你的 称呼、语言、习惯、输出格式、工作偏好都写进去。当你把这三件事跑通之后,你就不只是会用一个 ai 工具了,而是开始拥有一个真正属于你自己的 ai 工作站。祝你越来越牛逼!

好多人问我 codex 怎么变现,它其实就是一个超级的智能编程体,它能做的事情很多,能帮你写软件,嗯,写游戏,写论文,做图片,编辑视频, 基本虚拟的东西,你能想象的出来的他都能做,只要是操作电脑的事情,但是他就是唯独不能帮你赚钱。其实在我看来,用 code 变现无非就两条路,第一条呢,就是帮别人解决问题,你赚服务费。第二条呢,你帮你自己解决问题,你赚的是你自己业务的一个一个业务的利润。 但是第二条路的话呢,并不适合大多数人,因为第二条路本身他自己就是一个老板啊,或者说是一个项目负责人,他本身自己就有项目,或者说有工厂,或者说本身自己的业务,他就很需要这种 ai 智能体去完善或者说增强他自身的业务。所以这种人他是不会去问 codex 是 怎么变现的,因为他们早就已经跑起来了啊,就不会肯定是不会去问的。但是不论是第一种还是第二种,那他的一个需求其实也都是高度雷同相似的,因为 codex 的 一个能力边界其实也在那里嘛,他至少他不可能是从屏幕跳出来帮你换个灯泡是吧?他还是在虚拟世界里,他是一个几乎无所不能的这么一个超级编程智能体。 那这条视频的话就主要说一下如何帮助别人解决问题,你赚他服务费,那这个应该也是相对来说,就比比如说现在, 呃,图片生成模型最强的也是 gbt, 也就是 gbt 的 这个 image 二这个模型它是已经秒杀掉去年的那个谷歌 banana, banana 那 个那个图片模型,那如何 最初级的模式呢?就是你帮别人做电商图片,或者说做海报,或者说做肖像图,或者说做各种图片啊,这个就是人家给你需求,你完成这个图片,人家就给给你支付这个服务费,对吧?这个一对一的这个东西,这个就是比较初级,比较简单。 终极的呢,就是你开发一个软件啊,当然这个软件也是 codex, 可以 帮你写,你开发一个软件,你服务这一个需求范围的客户。比方说,呃,专门是做国内电商的产品图,你只要上传你的产品图,它就能够这个智能体,你设计的这个软件智能体它是内置这个 imh 二,这个图片模型,它就可以 点击一键生成图片啊,你等于就是说你把这个软件卖给他,或者说租给他,你点击就要收费啊。这个是终极的一个模式,那在高级的呢,就等于是说这个图片,这个图片的话,它是一整套智能执行、智能运行的一个智能体 啊。比方说一个图片,你只要上传过去,它能够出很多分镜图,它能够出很多,比方说故事模板或者整套详情页,它这个就更加高级的这么一个智能体。现在无非来看也就是这三个阶段。 那其他的,比方说做文案也好,做软件也好,其实也无非逃不掉,这这这初级、中级、高级可以举一反三。这么说。

扣代词出海赚美金,一二三四五六。我会从一个具体落马的项目过程来让大家体验说我从零去学习扣代词,在学的时候用一个具体的事物,一步一步的最终完成一个项目的落马,产生一些变现。 哎,这样的学习方式是不是更直观呢啊,更能去解决具体在用扣代词哪些功能,最终实现了你对它深度的一个用法,哎,这是非常有意思的啊。 其实呢,这这个方法我昨天啊讲了十分钟,然后发出去之后啊被限流了,可能讲太细了,所以这条视频我尽量再给大家讲一讲,包括我昨天有哪些遗漏的点子,再给他弥补进去,大家琢磨琢磨或者收藏起来,不懂来问我啊。 我们首先要明白,就是你现在关注的 ai 创业博主,以及说其他赛道的创业博主,他们最终交付的课程和交付的项目是什么呢?都是内容创业居多,内容创业呢,是我们每个人啊都可以加入进来的,我用 ai 创作, 短剧创作,小说创作,音乐创作,剪辑、视频创作,动漫创作等等的东西,那最终呢,就是我们要把它发出去, 然后曝光量有了啊,先赚到平台的工资,之后呢,有粉丝的价值,有带货的价值,有版权的价值,有等等的一系列广告的价值啊,这就是附加的产业的收入。 所以呢, ai 呢,它就是说让它量大管饱啊,就是我现在写一篇文章可能我要花两个小时,但有了 ai 呢,它可能两个小时产生了几百篇内容, 对吧?这就效率不一样了。那现在到了 a i 现在这个阶段,那随着像 codex 呀,大龙虾呀,它会变成一个更为效率的事情,以及 ai 的 这些插件,工作流的插件能让你创作的质量越来越高,就不光我要有数量了 啊,质量也在慢慢提升,所以这就是大量的人,我们要消耗 tiktok 啊,现在 tiktok 中转站去卖 tiktok, 对 吧?你消耗太多了呀,你需要你有了这么多的内容,你消耗这么多内容,对 不对?你测试了这么多内容就在消耗嘛。所以呢,我们让大管宝去发动,去博取那个啊内容创业赚来的这个钱。 那么至于 codex 而言呢,它是 ai 的 一个集成,这里面有很多很多的一些插件啊,这个插件可以去产生,做好 ppt, 这个插件可以做视频,这个插件可以整理文章,这个插件可以怎么怎么样, 所以你在质量上面就会提升,而且数量上呢,也会提升,所以我们就在这个基础之上想一想,我们要创作一个什么内容,那我为什么要去出海呢?其实出海啊,他跟我们国内的市场的消费呢,还有呢内卷程度他是不一样的。 我们就拿一个点来说吧,现在的这个短剧啊,你看早几年呢,我们就火成不像样了,包括现在的 ai 短剧也火的不像样了。其实在国外呢,也正正刚开始,国外大家不要把它想成啊,只有发达地区 你有美区,你有南亚、东东,南亚,包括啊,中东啊,包括欧洲,包括非洲,包括南美洲,你都要有区来划分的,那每个区都有语言种类,所以一件事情换个语言种类,可能呢,他就多点开花了,对吧? 那我们想一想,创意内容当中什么价值链会更值呢?你比如说这个,我们打开腾讯视频,有很多国漫,这个国漫的基础呢,就是这些玄幻小说,这些玄幻小说的作者现在都身价几千万啊, 涨上亿的都有,就是他们写了长篇的两三百万的作小说之后呢,去啊,最后变成现在的国漫吃到版权的一个收入,这是我们创作非常重要的一个点。但随着 ai 的 出现,我们能不能让它变成长篇性的内容来呢?这个是值得大家思考的。 那我们即便说 ai 效率很高,能够产生出来这些小短型的这些剧本,是吧?你看你不管短剧,怎么他都是一个几十万字的一个小说,短篇型的小说最后改编成了一个慢剧,这种慢剧他就是踩中了嗨点 啊,短剧就是嗨,嗨了就能爆,爆完之后就没有了,对不对?因为他太短了,他就赚了当下的钱。如果说你想做那种 稍微快频次点的,那你就多产生这种短剧,然后去做成电子书啊,或者说做成这个一些简易的视频啊,简易的图片图文视频。那可能有人去买你这个啊小说,以及说呢,我们去投稿啊,都可以买你这个剧本, 这是量大。但真正说我们以现在的 ai 水平来讲,你写一个一两百万的小说是没有问题的,绝对没有问题。为什么要写长内容的小说?长内容小说他会吃到后期版权的,效益会更大, 对吧?那我采用了一个什么策略呢?就是我昨天啊讲的一个内容,我今天给大家再重复一遍啊,我呢是采用的在小说类当中,其实我们 国内啊,已经很发达的市场,不管是玄幻的,穿越的,奇幻的,衍生人物的,还有宫斗的,种类特别多,几千万本了都,那优质的内容也非常的多,这叫什么呀?这叫 对标,就是你有对标的模型。那我昨天呢,就想写一个中东类型题材的穿越小说,比如说我穿越成为了某个部落的私生子,然后呢去写近代的这些穿越家空, 哎,那这也是踩到了一些爽点了,那这些爽点,如果说这个小说当中就提到了啊,各种人物,各种地方,他就有了当下,有现在的每一战争,是吧?还有这个石油战争,然后这都产生了很多矛盾,他又变成了热门的词,那么你的这个小说他还会有这样的一个热度, 那而且呢,我们搭这个穿越类型小说,架空类型的小说,他的爽点,他的管人群适用度是非常宽泛的。 那我昨天就试着写了这么一个大纲,我是怎么用这个提示词呢?我说我现在想写一本中东题材穿越架空类的小说,对标的是我们的那一本非常高赞的穿越类,以它的架构来进行改写。 然后呢,扣代词呢,就给我一个完整的一个路径啊,包括这本书用什么爽点,有什么悬疑有什么,最后我写了两张,写完两张之后呢,我又想了说,我要把这个小说转化成为阿拉伯语,这时候扣代词就给我提意见了, 提了个什么意见呢?说你以中国人的视角去教导啊,外国会产生一个高高的姿态,那你用阿拉伯的母语去翻译的时候就不应该是这样,你给我提了建议,其实我已经写了两张了,然后我说你在第三张以此角度来进行整改,方案就又出来了, 这就是啥呢?我们现在不管你会不会 ai, 你 都要想方设法的去把这个扣带子装在你的电脑里面去,有任何的想法,你就能够在扣带子里面去创作一个计划, 懂了吧?我刚刚说的就是我想做一个中东类的架空型的小说,以咱们国内的某个架空为参照,哎, 这个计划就出来了,然后我就一步步的去体验扣贷四,给我完成这些工作,很快很快这本书就全部做完了。 那出完了这本书我该怎么办呢?那这时候我们就要去用到出海的啊,变现的那些方式,你看这本书,我可以单独做一个网站,订阅式的网站是吧?在出海圈里面啊,网站赚钱也是一个非常大的阻力。 然后呢,我可以把这个书再用 colados 帮我转化成视频或者做成漫画,用一个 ai 的 叉, ai 漫画的插件,在 colados 里面安装一个插件啊,可以生成漫画或者 ppt 的 就可以了。 然后我再用 codex 呢去把我的小说图进行 ai 语音啊朗读,再加个插件就可以,所以把这一系列的插件全部都连在一块。那这时候呢,我可以回家了,我可以想玩去玩了,等我半天,一天回来之后,这个东西就全部出来了, 对吧?这就是 codex 的 强大,就会把我这本小说的计划就实现了一个产品好了,有的产品那我就开始去卖了啊,我先要去做网站,我可以用 codex 帮我做一个这样的网站,然后把我的这个小说上架了, 对吗?那这有了流网站,流量搜索,还有我可以做成视频合成的这个内容,放在油管,放在 tk 就 可以再再进行这样的一个二次的分发。 然后我这有了这个小说,我可以再去放到亚马逊的图书啊,然后这其他国外的图书啊,或者其他的有声读物的这些平台啊,哎,这样的,我小说就一本小说就全部留空开了,那你看我完整的去落地这个项目用了多长时间, 可能我只需要用了一到两天,就看你内容多少了啊,以及说呢,我如果可以远程也可以,首先远程只控 codex 去完成你的时刻审核它都可以, 那你一到两天就完成了整个产品,然后再把这个产品转化成多种方式,之后剩下你的工作就是上传是吧?啊?你在哪个地方去上传,然后去分发,他就完成了, 那以此来做这个工作。流,就这种落地的项目,你懂了,那剩下的事情你就可以无限的再去畅想,用什么题材去创作什么小说,创作什么内容 都可以。之后呢,扣袋子你可以自动去,晚上睡觉的时候他都在帮你干活,这就是 ai 的 玩法,体验扣袋子 ai 的 方式,包括出海赚钱等等一系列的这么一个 综合体吧,那大家就细品,然后不懂啊,咱们就去聊一聊啊,收藏起来反复琢磨。

还是那句话,不管你是职场人还是创业者,一定要想方设法用上 codex。 上条视频我们讲了怎么让 codex 像真人一样替自己工作,这期我就给大家讲讲安装好 codex 之后的一些基本设置。这些基本设置虽说有时候不算特别复杂,但设置得让能让我们的效率大幅提升。 今天咱们从最简单的菜单开始。常规设置有两项,主要是设置两个工作模式,大家看这里名称很清晰,要是编程编码情况多,就选择适用于编程的模式。要是日常办公串写文案或者使用办公软件较多,就选适用于日常工作的模式,其他的按默认选项即可。再看看外观设置, 这里就根据大家的喜好来,像字体、颜色、背景等都依据实际情况调整。这里有个特别有趣的功能,在 d n s 有 个宠物功能,挺好玩的,大家可以选择自己喜欢的宠物,也能按自己的喜好创建宠物。 还有个最新功能,应用快照功能,我觉得特别实用,比如看到一篇特别喜欢的文章,同时按下左右 ctrl 键就能直接截取文章。今天我就用到了这个使用功能,发现一个软件反馈给 call 代码时,它马上就能分析出并快速解决, 真的很实用,大家遇到问题或者看到好文章时,都可以用这功能。接下来看看配置,配置这里我主要说两项,一个是批准策略,默认选 on request, 这样遇到关键问题时,他会询问我们的意见, 确认没问题就可以批准。另一个是沙盒配置,默认选择 walk based rise, 它对沙盒空间有读写功能,遇到高危命令执行时也会询问。个性化设置里面有两个风格,亲和和务实。要是希望它表述简洁干练,就选务实风格。要是希望它说的详细且有亲和力,就选亲和风格。 还有个自定义指令,它能约束我们的 a g t, 也是,也就是 codex, 限制它不能做某些操作。我用的是卡帕西大神的开源项目, 这个项目目前大概有十五万颗星,我可以分享我的 aj 腾的 m d 文件。用上这个指令后, codex 的 效率、约束力和做事风格都会提升不少。 键盘快捷键方面一般默认就行,如果觉得某个快捷键用着不舒服,也可以自行修改。但我们得熟悉这些快捷键的用法,这样就能快捷调用功能。连接功能很简单却实用。开启这个功能点 采集,允许发现并控制此设备,这样就能通过手机连接 codex 躺在床上就能发送指令或编程。勾选,让 mac 保持唤醒状态,即便 mac 息屏或锁屏,也能用手机控制,既提升了效率,又保护了隐私。浏览器设置,这里勾选后,能让 codex 控制内置浏览器。 codex 自带的是无头浏览器,执行自动化脚本时勾选就行, 用处很大,电脑操控的几个按钮也要勾选。勾选任意应用后, codex 能控制电脑里的任意应用,可调取数据做数据分析。 登录时、开发小应用时,还能让它检测流程规范。 google cloud 功能是在谷歌浏览器里配置额外插件,能读起浏览器当前状态。比如登录知乎微信公众号后, 它能查看数据,帮助分析和选择题。锁屏操作就是在锁屏状态下可代替是人能操作电脑执行抢任务时很有用。规章绘画更简单,能查看已规章的绘画历史信息和聊天记录, 查找重要信息时很实用。主要就是这几个功能,大家要多使用 codex 才能发现它的价值,提升生产力。这期就到这里了,各位赶紧用起 codex, 有 问题集中反馈。我是强哥,关注我,一起聊点能落地的干货!