想用白菜价的 deepsafe 接入最新的 codex, 很多人配完 api k 一 跑就报四零四,死活连不上。不是你的 api k 错了,是 openai 悄悄建立了一道隐形壁垒。 为什么连不上?因为新版 codex 强制要求底层使用 openai 独家的 response api。 而国产模型 deepsafe, kimi 走的是通用的 tag completion 协议, 就像三角插头遇到了两孔插座,协议不同,强行阻断,怎么就必须在中间加个转换器?升级 cc switch 到三点一六版本。第一步,添加 dsp 预设,填入 k。 第二步,最关键的,打开设置,启动本地路由,并在路由里接管 call text。 这时候 c c 十位企会在本地幺五七二幺端口建一个代理,他会在底层把 response 强行改写成 chat 发给 devsy, 再把结果转换回来。协议转换,这才是高级的玩法。配置我放评论区了,赶紧去把你的 codex 盘活。
粉丝1983获赞1.9万

美好啊,朋友们,这是一期 codex 奶妈级的零基础系统教程,这期视频我会从安装开始,手把手地把 codex 的 基础能力到高级功能的组合,以及最新的手机端操作,用十个实战场景来带大家彻底拉通 以后这一类的 ai 产品,出一个算一个,你都会触类旁通,游刃有余。我也把这期的文字课间整理成了文档,那这期的含金量可谓是 biu biu biu biu biu, 一个点赞收藏关注是最起码的。好了,不多说,学费都交了吧,我们上课, 那在开始之前,我先说一下 codex 和 cloud code 的 区别。从本质上来说,它俩都是由编程 agent 逐步转向了通用 agent, 分 别是 ansapi 和 open ai。 这两家出的 cloud code 呢,默认使用 cloud 模型,但是我们可以自行替换成任意其他的模型,那在易用程度上, codex 桌面端的产品设计是会更友好的, 更适合零基础的白领工作者,而 cloud code 有 更高的自由度。在功能上, cloud code 原本是最齐全的,什么 skill、 mcp、 斜杠命令、 hock、 远程操控,这都是人家先发明的。但是呢,最近的 c c 更新稍微不如 codex 那 么快了,会更加偏向专业开发者一点。 而 codex 发了非常强的浏览器操控和 computer use, 还内置了最近的 image 二深图模型, 而且昨天还刚刚发布了手机端和 hock, 可以 直接用你的手机 check gpt 来控制电脑上的 codex 干 活。那价格和额度方面呢? codex 的 会员额度非常大方,二十到的会员就很够用,而且还不封号。 而 cloudpod 呢,大多数人可能都没法用它的官方账号基本上都得自行调用 api 的 费用属于是花多少用多少,风险由人。那在使用场景上,我个人喜欢用 cloudpod 搭配 cloud 模型来写作,因为 ops 四点六的写作和规划能力真的很强, 那 codex 的 执行和解决问题的能力也很强。日常的办公场景,我会选择用 codex, 那 在编程的时候嘛,我就两个都用上,所以结论是,入门的朋友用 codex 就 很强了,有条件的朋友呢,两个都来是最完美的, 不过两者的逻辑其实都是一样的,我们学一个,另一个也就会用了。那 cloud code 我 也做了一期系统教程,想拥有左膀右臂的朋友可以去看看。 ok, 正式开始 使用 codex, 我 们唯一需要准备的就是一个叉 gpt 账号,免费的也行,只是会额度稍微少一点。那有了账号之后,我们就直接去它的官网双击安装, 然后安装好之后登录我们的叉 gpt 账号,然后这些设置我们可以先随便选一点啊,选个日常工作,反正后续呢,我们都是可以改的。那搞定了, 那进来之后呢,大家会看到这个对话窗口,好像跟 chat gpt 是 很类似的。那我们打开两边的侧边栏也蛮眼熟的,左边呢,可以管理对话和任务的列表, 那中间就是聊天,右边大概是结果之类的吧,大家应该都能猜个七七八八,所以我们先不深究它的页面,我们直接开用,这其实也是我探索所有的 ai 工具的独门秘方。 我打开一个陌生界面呢,我先不管别的,我先找到我能对话的框,我先聊,先找到我能看得懂的按钮,先按,按着按着你就会了。你看看,独门秘籍都教给大家了,以后你们就是为师的弟子了。 ok, 众弟子不必拘礼,我们还是以学业为重啊。那我们第一个要了解的 codex 能力呢,就是本地文件操作, 也是这一类桌面端的 agent 跟对话 ai 最显著的区别和能力。因为过去我们用叉 gpt, 如果说我们要让它看到我们本地的内容,我们只有两种方式,一个呢就是复制粘贴到这个对话里,另一种就是以它允许的格式和数量把文件给上传上去。 但是 codex 不 一样,它可以自主地读取和操作我们的本地文件,而且不限数量。比如说我作为一个剪辑,我的本地里面存了八十多条视频素材,这都是我剪辑要用的, 但是呢,这个命名全都是乱的,完全看不懂,所以我想以这些视频的内容来命名,到时候我们看见文件名的时候,我们就知道这个素材是什么。那这事 check gpt 肯定是做不了的,但是 codex 可以 我们来看这两个地方,它都显示了一个概念,叫做项目, 我们选择一下,哎,一选择项目,他就让我们选择本地的文件夹了,那我们只要选中这个文件夹,那这个文件就是我们的项目了,里面所有的文件 codex 都可以自由的读取和操作, 当然这需要我们给他权限。大家看这里的权限选择啊,目前呢,我们是一个默认的权限,我们再点开,他有三种权限模式, 那默认权限的意思呢?就是在我们当前的文件夹内,他可以自由的去读写这些文件,但是如果他想要联网呀,或者是帮我们下载一点东西啊, 或者是碰这个文件夹之外的其他文件,那他是不行的,如果他必须要做,就会要向我们提出提高权限的请求,我们点同意才能继续。 那自动审查呢?顾名思义就是有个 ai 自动帮我们审查,由 ai 来判断这个操作危不危险,如果危险呢,就来问我们不危险的,比如说他去下一个知名的这种官方软件什么的,他就直接开干了。 自动审查比默认模式要更宽松和智能,建议大家选这个就完了。那最后呢,是完全访问权限,这意味着 codex 可以 在你的电脑上几乎什么都能干,它可以修改删除任何文件,它可以在任何位置执行命令,例如说它可能会去把你的 cloud code 给删了。 开玩笑啊,它一般情况下是不会这样抽风的。 ai 呢?也没有嫉妒情绪吗? 大家尤其是新手朋友就选择自动审查模式,相信 ai 就 完了,毕竟咱又能审的比 ai 好 多少呢啊,对吧? ok, 那 我们选中了刚刚的这个视频的文件夹,继续来提出我们无理的要求,让他帮我们把这个文件夹里的所有视频素材都按他们的实际画面来重新命名。哎,他就开始做了, 而且大家看他非常的聪明,他先看了看我们到底有多少个视频,然后他选择用抽帧的方式抽取关键画面来判断内容是什么,而且他还知道他不要一张一张图去看,他给拼成了缩略图的形式,一组一组的去看。 ok, 很 快啊,这个文件夹里面的文件名就全改变了。过程中呢, codex 也是没有向我们提全的,因为他都是在这个文件夹内去操作的。那我们也可以检查一下他都对应好了没有。 ok, 钢琴家音乐演奏厅,没错, 雪山近身格斗,没错,旗袍女人夜巷卖热饮哇!而且他的这个命名还遵循着一个序号,任务、场景、行动的一个清晰的命名格式。 ai 做事的这个细心程度啊,人类你不服不行。那另外呢,我们其实也可以在同一个项目里面去开多个不同的对话,它们的上下文都是不一样的,但是同样都可以随时的访问我们这个文件这个项目。 比如说,我们在另外一条对话,我们又给他一个不同的任务,让他想办法把所有关于风景的视频都剪成一整条。 哎,没想到吧,他真的能剪,他自己想办法,用了一些工具问我们要了一些权限,用这个 ffmpeg 给它拼在了一起,效果的确是关于风景的都剪成了一条。 ok, 那 如果我们要创建一个新的任务,我们其实也可以手动的在这边创建,他也会自动的在我们本地创建一个文件夹。 然后呢,我们跟 codex 对 话的整个过程, agent 产生出来的任何文件啊, pdf 啊,什么 markdown, ppt, 它都会直接存在我们本地的电脑上。 ok, 到这里,大家应该 get 了 codex 呢,可以随时地访问我们的本地文件,去读取内容,写文件,删文件,移动文件,文件夹里的内容也就成了我们的 codex 随时可以获取的上下文,那这里的项目也就对应着我们在本地的一个文件夹, 哎,那刚刚这么个任务会花我们多少上下文呢?我们只要看这里就能看到了。 那这个小圈代表的是我们现在的这个对话和里面的操作,一共使用了 gpt 五点五的多少上下文窗口。 如果我们把鼠标悬上去呢,它还会有更详细的一个信息,当上下文快满的时候, codex 会自动地帮我们压缩上下文。不过其实当我们一个任务告一段落之后,不用等它快满了,让它自动压缩,我们也可以自己通过斜杠压缩这个命令 来手动的去压缩上下文,这样呢,可以让模型更聚焦在我们的新任务上,也省一点上下文的额度。那当然大家除了这个对话的上下文余量,其实我们还想知道我作为一个免费用户,或者是我作为一个 pro 用户, plus 会员,我还有多少总共的额度可以用,对吧? 这个呢,有两个方式查看,一个呢是左边的设置,这里我们点开剩余额度,就能看到你五小时内还剩下多少,那本周内又还剩下多少, 甚至呢,也有什么时候到期会刷新的一个提示,这个产品的设计还是比 cloud 的 友好很多的。那另一种方式呢,就是我们可以直接在对话框里输入斜杠,然后找到这个状态, 那打开这个状态之后,它的绘画这里就会持续的显示我们的上下文余量,这个五小时和一周的限额。但再次说实话,这个 codex 的 额度还是非常大方的,二十到的额度我认为是可以满足大多数白领工作的高频使用的。 ok, 那 顺便呢,我们也介绍一下这里的模型选择, 那点开之后,我们可以选择速度,快速呢,就相当于加急通道,会消耗我们更多的额度。那这里呢可以选择其他模型,但是大家都选五点五,因为它确实更好用。然后呢,这里可以选择智能程度,其实呢一般中度智能就够了, 所以我们选高。 ok, 那 这个小麦克风呢,肯定就是语音输入功能了,比手打字还是要快很多的,但是呢,它的转录速度远不如大家去下载一个语音输入法,还是非常推荐大家用语音输入的 好。那现在我们通过一个本地文件处理的案例,也了解了 codex 上常用的一些功能。那 codex 的 第二大能力就是命令行工具使用。 其实刚才我们说到权限的时候就有提到,在默认权限下,它可以读写文件,但是却不能执行一些命令,一些联网的操作。那这些命令是什么意思呢? 刚刚的案例其实也已经用到过了,比如说它把视频抽帧出来,还把几个视频拼接到一起,它用到的 ffmpeg 就是 命令行工具。 还有一些我们熟悉的命令,比如说我们在终端里面来克隆一个 gitup 仓库,或者是大家近期比较熟悉的,我们在命令行里面输入一些命令来下载龙虾和各种依赖。那 codex 的 第二大能力就是在我们授权的情况下,可以使用我们的终端来替我们做这些事。 那我们就来让 codex 帮我们来安装一些平时对于小白来说非常复杂的东西吧。第一类,常用依赖,比如说什么 node gs 啊, git 什么的, 也是大家以后使用各种 agent 或者是做其他项目必备的一些工具啊,那之前大家要装这依赖都得去看一个手把手教程,然后照着命令抄,挨个装。那现在我们就直接跟 codex 说帮我安装个 node js 给他发过去, 也是因为这些东西呢,其实都是比较常见的东西了,所以在我们的自动审核的权限模式下,你看他基本上都不问我们要提权,就熟门熟路的帮我们装好了。 那第二类,就是那些爆火的但是有上手门槛的一些新的 agent, 比如说龙虾,爱马仕,甚至还有这个 codex 的 竞品 cloud code, 我 们都可以让 codex 帮我们装完了呢,它还能教我们该怎么用。那我们装一个 hermes 吧, 我其实都不需要给它官网和仓库链接,我就说最近有一个叫 hermes 的 agent 很 火,你帮我安装一个吧。 哎,他就会自己去搜索,然后帮我们判断到底是哪一个。然后呢,他根据官方的文档帮我们陆续的装好了,还帮我们验证过已经装好了,你瞧瞧,那我们照着他说的来启动一下试试。 哎,真的帮我们装好了,那往后的配置我们就不在这里继续了,但是大家应该 get, 有 了 codex 以后,那些复杂的要收你五九九的部署,你都可以直接让 codex 帮你做了,怒省五九九。而且我们在使用的过程中遇到任何问题,还可以截图去问 codex, 什么瞎死了马挂了,升级出现了问题都可以让 codex 直接帮你修,是不是很方便? 那第三类有点没那么必要,但它其实也可以,就是像 cursor integrity 这种软件应用, 平时都是我们去手动在网页上下载的,它也可以帮你下载和卸载。那大家用 codex, 我 其实也建议大家去下载一个 agent 的 ide 啊,因为现在 codex 有 个缺点是它没有办法打开我们的文件内容,直接去手动编辑。 虽然这个侧边栏呢,是可以看到一些文件结构和内容的,但是我们都没法编辑,所以大家可以让 codex 下载一个自己喜欢的,比如说我们就这样下载。那下好之后呢,我们再执行一个 git i n i t 一个初步化, 那右上角就会出现这个东西,随时可以把我们的项目在编辑器中打开,我们来手动编辑。 那第四类就比较重要了,就是 agent 本身会常用到的那些 skills 啊, mcp 啊和 selli。 那 skill 和 mcp 本身 codex 也是支持的,我们后面会详细讲到, 我先挑两个大家安装一下,方便我们后面综合起来来做案例。那这些 skill 和 c i 呢?通常来讲不像那些 get 那 种大项目那么著名,所以我们最好是找到它的具体仓库,或者是明确的官网地址。比如说我们下载一个专门找 skill 的 这个 find skill 哦,方式就是直接把链接拷贝给 codex, 然后跟他说帮我装一下这个 skill。 那 在他装的期间,我们也说一下 codex 的 另一大好处,并行任务处理, 我们完全可以在他做这个事情的时候再开一个对话,让他去下载一个别的。那我们下载一个飞书 c l i 吧。飞书 c l i 其实非常的典型, 因为现在呢,有一些积极 ai 化的软件,把几乎所有他在软件里能做的操作都做成了命令,让 agent 能够方便的去操作,我们把这个链接发过去,让他开始下载, 那这边呢,其实会显示每一个正在处理当中任务的情况,这个在转呢,就说明它正在执行中,那这个蓝色的点呢,就说明已经完成了,有时候还可能会出现一个需要你申请权限的一个标识。 ok, 那 这里 fan skill 呢?它是已经装好了,我们再看飞书 c l i 这边,它会引导我们去做一些授权, 我们就跟着它的引导去完成就好了。 ok, 那 装好飞书 c l i, 那 codex 就 能帮我们去做飞书里的各种操作了,比如说写文档,发消息,见日历,做表格什么的了,我几乎每天都在用, 好大功告成。我们就这么一个小章节,我们就用自然语言的方式让 codex 帮我们装上了 hermes node, 飞书 c l i 一 大堆东西,这就是 codex 作为 agent 的 第二大常用能力,命令行使用。 那这个能力和这个章节的演示也是希望大家能够 get 到一点,就是我们现在在电脑上想去做的很多很多事情,都可以让 codex 这样的桌面 agent 去做了。那 codex 的 第三大能力是持久记忆。 看过我那篇 cloud code 的 朋友应该都知道, c c 呢,有一个手动的持久记忆, cloud 点 md, 还有一个自动的记忆系统, 都是把我们希望 agent 能够长期记住的,比如规则、篇号和我们的信息之类的东西,以本地文件的方式存在我们的电脑上,然后事实的时候把这些记忆以上下文的方式注入到 agent 里去。那 codex 也是类似的,它也有这两套持久的记忆系统 在 codex 里面呢,手动的持久记忆文件叫做 agents 点 m d, 而且它也有一个自动的记忆机制,来我们打开设置,找到个性化, 那在这里的这个自定义指令实际上就是一个全局生效的 agent state md, 它会在我们任意的项目跟 codex 对 话的时候,它都第一时间作为上下文发给大模型,那我们可以手动地自己在这里写,不过我更喜欢呢,直接在对话中去跟 codex 说, 比如说我说一个,我希望你以后对非书文档里的任何修改都使用一个专属的你的文字颜色和用删除线的方式来修改,不要直接的修改。然后这个帮我寄到局的 a 正 c m d 里。 ok, 那 它这里呢,告诉我们已经写好了,我们再打开个性化这一块,就的确是多出来了这么一套规则,那实际在使用当中,它就会去遵循我们这个规则了。 比如说我这里已经有一篇非输文档了,我在侧面呢也评论了几个我想修改的地方,我直接可以把这个链接发给 codex, 我 让他根据我侧面的评论帮我修改一下。 那因为我们刚才确实已经装好了这个非输的 c r i 也都给他配置好了权限,所以 codex 是 直接可以操作我们的文档的。 ok, 看看它完成之后的效果。 果然他用了紫色的字和删除线的方式来帮我们做的文档修改,那这个呢,是局的 agent md, 适合记一些适用于所有任务的一些大原则,比如说我们的工作习惯,我们要说中文,我们的工作偏好修改文档,要留下这种修改痕迹等等等等。 那另一种呢,就是项目级的 agent md, 这个长期记忆呢,只在这个项目当中生效,我们可以选择一个项目的对话,然后打开编辑器, 自己在这里手动的创建一个 agent 的 md 的 文件,然后我们去写一些针对我们这个项目的一些规则, 当然也可以让 codex 来帮我们写。我个人的建议呢,是在这个项目文件里面有了一些内容之后,让 codex 根据他对我们项目的了解来自己帮我们写。那自动记忆怎么回事呢? 其实我们刚才在这个个性化这个下面我们也看到了,我们需要手动打开这个自动记忆功能, 它的机制是我们打开这个功能之后, codex 会在我们结束对话或者是结束任务,这个对话闲置一段时间之后,它帮我们把那段对话总结成记忆,然后记在一个地方。但是它有几个原则,第一太短的对话它就不记了, 那第二这个对话的总结它一样会消耗我们的额度,所以当我们的额度太低的时候,它也就不记了。 并且这个自动记忆文件呢, open ai 官方是不建议我们去手动修改的,顶多我们可能删一删有些没必要的信息,那这个文件大概是长这样 的,是一个任务,一个任务在记录的,主要呢会写上这个记忆的来源是哪段对话呀?以及它的工作目录是什么,那以及以后触发了什么关键词的时候,它会去召回这段记忆, 再往下呢,是用户在这件事情上的偏好大概是什么样的?那第五段呢,是一些可附用的一些知识,一些踩坑的记录,那这些内容都是 codex 自己记录的,并且以后也是会它自动的招回去使用的,我们就先不修改它, 它这个格式确实也不太方便修改,更多的时候我们对于明确的规则和要求,我们还是通过组织 agent md 来实现。那大家学完这些视频之后呢,我也想给大家再做一期, 通过组织不同层级的这种 agency md 给自己做一个非常懂你的,可以做不同类型事情的超级助手的视频,感兴趣的朋友可以扣个一。 ok, 那 第四大能力就是 codex 可以 直接用到 image, 二来生成图片。不过呢,深图功能其实是一个小功能, 所以这一章节呢,我们不只会用它的图片生成,我们会带大家做一个完整的个人主页的开发项目,并且在了解一些 codex 在 小白开发中的一些用法和功能。那我们再来开一个项目,叫做个人主页, 然后我们点开这个加号,我们把计划模式打开,因为我们要做一个网站嘛,任务会复杂一点,所以打开这个计划模式呢,他会先帮我们列出一个详细的计划,我们确认之后他再开始行动。 计划模式呢,比较适合我们的任务有一定复杂性,或者我们自己还没想清楚,可以跟 ai 讨论出一个计划。那假设我们现在就是第二种情况,我们其实没想清楚,我们直接跟他说我想做一个个人主页, 那你看他看到我们的项目中是没有内容的,所以他以这种选择框的方式来询问我们的细节,这些选项呢,大家可以按照自己的要求去选择,那我就选这个个人品牌吧。 然后如果说这些选项中没有我们满意的呢?我们也可以选到最后一个来填写我们详细的要求,比如说我要他修饰感,也要高级感,然后我选针对合作伙伴,不要个人照 中英双语,巴拉巴拉巴拉。这里真的是问了我们相当多的问题啊,那最后呢,他给到我们出了一个详尽的计划,问我们是否实施此计划,那其实基本的计划我们看着没有什么问题,但我们也可以补充一些调整方案。 比如说我们刚才就要说到了要用它的 image 二的生成能力,我们这里没有体现,我们加一句网页上要多用一些图片,使用 image 二来生成一些高级感的图片,然后我们一起提交。 哎,那他又问我们要走哪种高级感呢?我们如果点开这个小叹号的话,还能看到他说的这个风格到底意味着什么意思,这个产品的小细节真的是我很喜欢,那我们就选他推荐的吧。然后他出了一版新的计划,我瞧着没什么问题, 去吧。 ok, 他 就开始初识化这个项目来逐步帮我们生成了。那这个过程呢,肯定会需要一定的时间,在这个期间我再给大家补充一点点知识点。呦,他的第一张图出来了,不错,挺有艺术感的,果然是最强的 emoji 二,那我要补充的这个知识点呢,叫做引导。 如果说大家在 codex 执行一个很长的任务的过程当中,你觉得他有点跑偏了,我们是可以随时给他补充纠偏的,比如说我们补充一下图片的人味要更强一点,而且不要这么冷的色调。我是一个 ai 博主,然后我们发送出去, 哎,大家会看到他没有立刻打断我们的任务,没有发出去,实际上他在这里排队呢。那我们看到右边的这个引导按钮,他写着我们不打断模型运行,会在下次调用工具后发送过去。这个是非常好的一个功能啊,我们点一下, 哎,他就可以发出去了。这个功能呢,可以让 codex 不 用在错误的道路上一路狂飙,把我们额度都花光,也不会让它重新再跑一轮任务。那另外一个小功能点,我们找到一个已经结束的任务, 我们看一下这个 ai 的 回复,每个 ai 回复的下面都有一个这个按钮,叫做分叉 fork, 这个的意思是我们可以随时从这里开始去开一个新对话,非常适合那种前面聊的还好好的,上下文也非常有价值,但是我们再往下聊,就聊的有点叉劈了的时候。哦,还有个小功能,宠物, 我们点开设置外观,然后这下面就有一小对小宠物可以选,甚至呢,我们还可以点击创建,让 codex 根据对我们的了解来生成一个定制化宠物。那我们先点击唤醒宠物, 哎,就会在桌面上有常驻这么一个小桌宠,脑袋上会冒出来 codex 正在做什么的一个提示,别的呢?好像也没什么用。 ok, 终于在他跑了七七四十九分钟之后,网页完成了, 我们来看看效果,因为 codex 呢,有一个内置的预览浏览器,我们可以直接打开右边的侧边栏啊,我们还给它放大一点。 嗯,这个网页的效果确实是不错啊,不过呢,现在的 a 证呢,其实都有这么一手了,那它这个预览浏览器呢,还有一个好处,我们点击右上方这里的一个批注按钮, 我们就可以在这个页面上选中这里的具体元素去写修改意见,包括重新生成图片,比如说我们要这个 logo 放大一点, 然后 p 住这里这张图加上一个人物,好把这个删掉, 那然后对话框里呢,就会加上我们这几条批注,然后我们点击发送,它就会针对我们的意见进行修改了,是不是挺方便的?那我们现在项目有了雏形之后,我们再 call back 一下刚才说的 agent md, 其实现在呢,就是一个让 codex 帮我们生成项目级 agent md 的 好时候了,因为我们也有了一定的内容,我们就让它自己生成一下,我们打开编辑器看看, 不错,项目的背景,各种信息,各种规则,各种文件路径都已经写好了。那以后呢,无论我们在新开对话,还是我们的聊天记录都已经被清空了, codex 都可以通过这个项目级的 a 证书 md, 立马的了解我们的项目基本情况。 ok, 那 我们先保持这样,先不做精修了,我们直接准备部署上线,当然大家自己做的时候完全可以去打磨的更好,那网页上的这些信息也换成更真实的信息就好。 那我们现在要部署呢,就得要说到 codex 的 第五大能力插件。在现在的 codex 当中,插件大多数是让我们的 agent 跟外部平台、外部工具、外部服务连接的一个作用,它实际上就是我们所说的 skill, mcp, c l i 这一类东西的一个完整集合包,比如说操作邮箱、操作日历、操作 excel 啥的。那我们来点开左边的这个插件栏,我们看这里呢,已经默认帮我们打开了好几个内置插件了,比如说浏览器操作,还有 mac 专有的屏幕操作,还有 excel 表格, ppt 等等。 那他的插件页面没有中文翻译,所以我给大家把这些插件的具体中文意思,分别能干什么也都列出来了,大家课后可以按需装上,点这个加号就好了。那我们先翻到这个 coding 板块,因为我们想要部署上线嘛,通过插件会非常方便。 其实呢,这个 vassel 和 netify 都可以,我们点一个加号给它装上,那如果大家给它没有选上的,也记得要选上。然后我们再回到对话当中,告诉他们,我们想用这个 netify 把这个网站给我们部署上去, 我们大家也不用管他咋部署的,反正他需要干什么呢,他都会告诉我们的。 ok, 他 发现我们没有登录授权,然后主动弹出了这个登录的链接,那这里呢,建议大家用 tapp 账号登录是最方便的, 那登录完之后,他自己就知道我们已经登录好了,然后继续的帮我们部署,这就搞定了。这个链接呢,就是我们最后的网站了, 只要把这个发出去,别人就能访问你的个人主页了。 ai 是 不是个好东西,你说就这么两下子就干了,原来普通人花钱都不一定能干成 o k。 先压抑住我的这个老灯感叹。我们回到刚才我们已经装好的插件, 那其实这里呢,还有两个非常重要的内置插件,就是 browser use 和 computer use, 还有这个 chrome 浏览器, 那这些有什么用呢? browser use 顾名思义呢,就是 codex 可以 直接帮你操控浏览器,比如说它自己点击翻页截图,填写表单等等。通常呢适用于自动化测试前端, 当然也有比较无聊的用途,比如我们可以让 codex 打开这个 m b t i 做个测试试试, 嘿嘿,这样大家能够比较直观的看到它的一个效果吧。那这个鼠标呢,是它自己在移动,然后它是自己看了上面的答案在自己填写,然后填完这一页,它也会自动的翻页, 那随着它的一通操作,结果出来了,原来 gpt 五是 i n t j 啊,我说怎么跟我这么聊得来呢? ok, 那 这个 chrome 的 插件呢,也是控制浏览器,但是它控制的是我们自己已登录的自己的浏览器,它不会再新开浏览器, 那我们如果把它给勾选上之后,它会引导我们去 chrome 里面装一个插件,那装好之后呢,它就可以操作我们自己的浏览器了, 而且它有个好处,它是可以直接在后台执行多个页面的浏览器操作的,就是并不会占用我们的整个浏览器,我们不用真等着看它这些操作,我们该用浏览器干,别的我们可以接着干。 ok, 那 computer use 就 更厉害了, 它不只能够操控浏览器,连你电脑上的这些 app 它都可以操作,只不过呢,暂时只有 mac 有 这个功能。比如说我们新开一个对话,我们在加号,这里来看最下面的这个插件选项,我们手动地把电脑插件选上, 我们再来几个没什么用的奇迹引巧吧,帮我放一首九九年最火的歌,然后用我的微信给 qq 发条微信,说,请收下我一个点赞、收藏、关注,懂了吧? ok, 他 陷入了思考,然后他看到我们的应用都正在运行中,并且向我们使用了这个音乐软件。我们点同意看,这个就是 codex 自己干的啊。他帮我们搜索歌曲, ok, 音乐响起了, 但是他还有活,他还在问我们要微信的权限,我们也给他允许一下。 ok, 看他这个小鼠标,他正在犹豫着准备搜索点击,好朋友们失败了, 因为我上次都成功了,但是我估计现在微信已经开始严防这种 a 证的操作了,直接给我退出去了。 但是呢,他的确成功操作了这个音乐软件。其实我还让他操作了剪映,并且给我们的最新的项目加上了音乐。 那总之呢,意思大家都懂了吧,就是它可以操作浏览器,并且可以操作我们的电脑。当然,实际上我觉得它的操作效率目前来说还是稍微有点低的,我不太喜欢用这两个强大的功能。不过后面我要说的这个 skill 就是 我每天都会用的东西了。 那 skills 我 的确也已经跟大家说过很多次了,好学的朋友一定要去补补课。那 skill 本质上呢,是我们人为沉淀的一些可附用的方法、流程和工具的组合, 相当于给 agent 做某些具体任务的一些行动指南。那因为之前我们已经让这个 codex 帮我们装过一个叫做 find skill 的 一个原 skill 了, 所以后续如果大家想要去装,或者是找一些社区上的 skill, 都可以直接用 codex 拿语言直接让它下载。比如说我们下载一个必备的 ansapic, 那 个前端设计的 skill, 还有一个去 ai 位的,那我们这两个都发给他,等会儿都会刚好有用 欸,很快他就帮我们装好了。那以后大家想要下载 skill 呢?如果说遇到这个 find skill, 他 找不到的东西,也可以直接把链接发给 codex, 让他帮你下载就好了。不过我在 c c 那 期也说过,最好用的 skill 还是自己创建的,符合自己工作的专属 skill。 那 创建 skill 呢,也有两种方式,第一呢,就是直接告诉 codex 你 想要创建一个什么样的 skill, 通过跟他讨论打磨得出来一个 skill。 那另一种呢,就是我们接下来要演示的,先跑通流程,然后让它形成 skill, 这也是一种更推荐的做法。那比如说我们想做一个自动化写这类文章,并且帮它配图的 skill, 这种大家应该都看过吧, 那我们就得先通过一步步的引导 codex, 让它真正实现一个我们满意的文章。来我们新开一个对话。那正好呢,我们刚才不是装过这个 github 插件吗?我们可以直接先问它最新的 github 流行项目,热门项目都有哪些? ok, 它的确帮我们找到了一些,那我们再让它清晰地解释一下这些项目都分别是干嘛的。嗯, 那我们再让他挑其中新星数量最多的,来帮我们写一篇本周 get up 热门项目推荐这样的一篇文章。 好,那他写好了这一篇之后,我觉得稍微有点太人机了,我希望可以更口语化一点,并且我只想要五个精选的,那我们就告诉他,然后还要覆盖到这几个层面,那我们这里就可以用到刚刚我们下载的那个去 ai word 的 那个 skill 了,我们斜杠给它调出来。 好,那看到他的结果稍微优化了一点,但是我们还希望加一个我们固定的开头,我们的结尾,并且还要让他用上 image 二来帮我们生成一些配图。最后呢,我还希望他不要是这个格式,他要是一篇非输文档的格式,然后图文并茂的。 ok, 结果来了,他确实是有了,但是呢,我觉得这个配图不够丰富,于是我又经过几轮调整才觉得差不多满意。并且我还给他最后加了一步,要让他把这个飞书文档发送到指定的群里,让大家都来看看。 那最终呢,他的效果是这样的,果然发出去了。其实啊,如果想更加一步到位的朋友,也可以结合刚才我们说的这个浏览器操控,让他直接打开那个发布页面,直接就帮你发布出去。 那总之,我们对他这一套结果满意了之后,我们就可以直接让他把这一整套的标准和动作做成一个 skill 搞定了。那我们再输入斜杠,再往下找,我们就发现就有了这个 skill, 我 们可以直接这样手动地调用这个 skill, 也可以直接说生成一篇热门项目推荐图文这一类的触发词,也会让 codex 自动调用。 不过因为现在 github 上面实时的热门项目肯定是没有更新的,所以我们再调用一次呢,它大概率会写出差不多的文章,所以我们就不试了。但是大家都理解了吧, skills 呢,可以把我们经过验证调好一次的一整套流程和方法给它固定下来。 下次做这件事情呢, codex 就 可以按照这个方式稳定的输出。 ok, 那 下一个能力则是 mcp。 其实 mcp 现在已经用的不太多了,所以我只简单的示范一下那 codex 的 mcp 藏在设置里面的 mcp 服务器。 只不过小白看这个肯定是有点不太知道怎么填的,所以跟我们之前说的一样,我们最好的方式还是把你想装的那个 skill 的 链接拷贝给 codex, 让他自己装就完了。比如说我们来装一个 notebook lm 的 一个 mcp 发给他, 他就会引导我们来做授权登录,登录完就搞定了。那我们再试一个我存了非常多访谈视频的一个笔记本,我们来问一下他。 欸,那这样呢, codex 也就可以直接获取我们 notebook lm 上面的这些外挂知识点了。 ok, 最后一个 codex 能力是自动化定时任务。 其实定时任务本身并不稀奇啊,比如什么每天早上提醒我吃药,提醒我喝水这一类的事情,普通的软件也能做,但是我们把它放到最后一个说呢,就是因为它可以结合我们之前学到的各种能力,把一整套组合起来的任务,让 agent 定点执行 自动化,加上智能化和定制化方显美妙。比如说刚才我们做的这个热门项目图文的这个 skill, 我 们就可以把它设成每三天或者是每周,让它定时定点的产出一篇 dapp 热门项目推荐发出来。 那我们要创建自动化任务呢,其实也分两种方式,第一种就是选到这边的自动化面板,那它这里呢,有一些官方的参考视例了,不过大多数是跟开发相关,那我们选择新建一个自动化, 其实你看要填写的东西也非常简单,其实就是用提示词写好这些自动化是要做什么,然后我们可以在这里选好什么时候出发,我们也是可以自定义一个出发时间的, 然后这边就可以选择执行的模型和思考强度,最后点击创建即可。不过呢,我也还是倾向于让大家用第二种更简单的方式,就是直接在对话里跟 codex 说,那我们直接跟他说 帮我创建一个自动化任务,每周一早上九点自动化执行热门项目推荐的这个 skill, 产出一篇图文发到群里, ok, 那 我们在看自动化这里,它就已经帮我们设好了这个任务,我们随时也可以去改变它的时间。 再比如当你的这个邮箱插件 github 飞书都已经连上了 codex, 那 么你也可以让他每天下午六点帮我汇总日历上完成的会议, github 上面的提交记录和我的邮箱回复记录,生成一份全面的工作日报。 最后手机操控 codex 设置方法非常简单,手机上的 check gpt 和电脑上的 codex 都把它更新到最新版。之后打开手机上的 check gpt, 然后点击侧边栏的那个 codex, 它就会提示你允许这台手机控制你的电脑,直接就搞定了。如果你有多台电脑的话,也可以给它分别连上。这就等于你不管在大街上、地铁上还是朋友聚会,都可以随时随地地用手机下发一个任务,让 codex 在 你的电脑上干完一个活, 它就更像一个可以跟你远程协助的同事了。这个功能呢,目前免费版也可以用,但是主要能连的是 mac 系统的 codex。 好, 那到这里 codex 的 所有核心能力我们就全部过完了。来我们回顾一下。 codex 呢,可以操作我们的本地文件,可以使用我们电脑上的终端命令行工具。它还有两种构建持久记忆的方式,它还可以生成图片,而且它可以通过计划模式来做一个完整的项目开发。 那它有丰富的插件,可以操控浏览器和电脑,还可以把知识和流程沉淀成可附用的 skill 技能, 它可以使用 m c p 连接,外部它还可以设置自动化的定时任务。不过其实比起这些功能本身,我也希望大家记住两件事,第一就是我们真的有很多事情是已经可以交给 agent 做了。 那第二呢,就是我们已经从问 ai 的 阶段走向了管理 ai 的 阶段,因为过去我们使用 chat gpt 就是 有问题了,我们问一下,然后得到答案我们就走了。 那现在使用 codex 这类的 agent 呢?每个人都得像领导一样,帮他准备他所需要的上下文和工作环境,给他指明一些任务目标,然后来检查他的计划,监督他的过程,验收他的结果。 那同时领导还要负责把好的方法和流程沉淀成可付用的技能,把反复要做的事情设成自动化执行的规矩。好了,恭喜大家今天都升职了,记得点赞收藏关注我们下次见了。

好,今天这期视频呢,主要给大家讲一下我们安装好 codex 过后的一些基础设置,为了后续更好的帮助我们工作呢,有些基础设置我们是需要 提前去做的,那第一个就是在这里我们的常规,大家可以先去选择这些工作模式,如果你是用于编程的话,你可以选择第一种,如果你是用于日常工作的话,你可以选择第二种,这是工作模式的一个选择 好,后续的这些可以按照它默认的设置就可以。第二个就是外观,外观这里的话有一个比较好用的,就是因为现在 codex 它已经支持宠物了,大家也可以去养自己的宠物,创建自己的宠物都可以的, 这是第二个。第三个在配置这里啊,配置这里呢?用户配置这里大家可以去选一下,就是第一个批准策略就是 on request, 第二个就是杀和设置这里我们选择我们的工作区就是 workspace right 就 可以了,那这是用户配置的一个设置。 好。第三个个性化啊,个性化,这里就是他的一个回复的语气,呃,大家可以去进行一个选择,那我自己选的就是比较务实的,是简洁、专注和直接,如果你喜欢亲和的话,也可以自己去进行一个选择。好,那么这是我们的一个个性化, 后面这里就起用记忆这里大家记得勾选上,这里记得勾选上好了,那么这是这一个的还有就是浏览器啊,允许他去控制我们的这个内核浏览器,因为后续他可以去操作我们浏览器,去帮我们做一些数据分析啊,包括一些其他的一些操作, 下面就是一个电脑操控这里,呃,我们一般建议可以去共享上这个就是 computer use, 就是 呃, codex 直接可以用我们的电脑去做一些这个查看,那我经常用的就是我让这个 codex 去帮我 登录我的小红书的后台以及抖音的后台,去帮我做一些粉丝画像和我这个账号的一些数据的一个分析,从而给我输出一份分析报告,包括 有关浏览器的扩展应用,这是在电脑操作这一块的啊,那么最后一个就是,呃,可以查看自己的已归党对话 这一块呢,就是我们在安装好 codex 过后呢,建议大家首先要去做的一些基础设置。好,那我们这期的视频就讲到这里,大家可以点赞关注加收藏,后续我们也会讲更多关于 ai 进的一些应用。


今天我们会完成桌面板打开之后的第一次设置,那么我们就开始吧。第一次打开 codex 桌面板,我们要先把界面分成三块来看,左侧是项目和一些插件的入口,中间就是我们的一个对话框了,最下面有一个设置面 板管理。对,那么我们新手进来要先处理几件事情,第一个工作模式,第二个选举指令,第三个批准策略,第四个沙盒,第五个插件入口。 ok, 那 我们先进到设置里面看, 在设置里面左侧有十二个分类,包括常规、外观配置等等。第一次使用我们重点来看这几个,我们先点开常规,常规的第一项就是一个工作模作,开发项目的时候,我们一般选择适用于编程, 你选择了这个模式,那么 codex 会更愿意指示文件命令验证方式。如果你平时是以日常工作居多,比如说是以文字创意等等,那你可以选择用日常工作。在下面的权限区域,我们要来看一个重点是完全访问权限,这里记得是关闭的状态,如果这个开关打开之后, codex 可以 直接编辑更大范围的本机文件,运行网络命令,它的风险会明显变高,所以作为新手阶段而言,我们默认把它关闭掉就可以了。这里的速度可以选择是标准还是快速, codex 会基于跟你的一个整体对话,给到你一个相应的建议,当然如果用快速的话,它的套餐用量也是会增加的,那么我们平时用标准就可以。 那接下去我们来看第二个重点是个性化的,这个选项里面有两个,一个是个性,主要是选择 codex 回复的默认语气, 我这里选择的是务实,希望它能够简洁、专注和直接。第二个我们要去关注的是自定义的指令,这里的自定义指令要知道它是局工作规则,所有的项目都会读到它。所以新手我建议你们只要写八行内容就可以,这八行内容我会放在评论区,当然我自己的会 更完整更长一些。我的结构大概是包括使用范围与优先级通用的一个工作流,安全与合规,通用代码规则,验证与测试提交的规范,常见的项目命令工具,然后输出的一个文本规则。还有一些个人偏好,对, 我觉得大家一开始就用前面的这个八行就足够了,后面当你越用越多。你可以跟 codex 去总结你们经常碰到的一些问题,或者是你自己觉得 codex 经常会犯的一些错误,你把它整理成对应的规则放进去就可以了好吗?它有一个记忆的选项,目前是实验阶段,大家可以把起用记忆这个给开启就可以, ok。 第三个重点是配置,我们来看一下配置的页面配置我们来关注两个内容,第一个是批准策略,第二个是杀核设置。批准策略一般我们都会默认的是 on request, 它的意思就是说当 codex 遇到高风险动作的时候,就会停下来让你确认。当然这里如果说你是用 never, 那 就相当于一次执行到底了,不需要你的任何的批准,所以我建议新手都是用 on request 吧。沙盒设置这里它的默认是 workspace right, 它主要在当前项目里改文件,允许网络访问,这里就是默认开启,你可以把这里的批准策略理解成为它是一个确认按钮,哪些时候需要你来确认?把沙盒设置理解成为 codex 的 活动范围, 你给它框定了一个能够编辑文件和改文件的一个范围,它就只能在这个范围里去进行一个行动。我们再来看一个大家比较容易忽略的一个点,或者是比较容易混淆的一个点, 就是在桌面面板的左侧有一个插件,这里的插件它其实包含了 skill, mcp 和 connect。 skill 是 工作流,是我们的一个技能文件,它里面包括一些代码审查、做表格、生成 ppt 等等。同时像 mcp 就是 codex, code 等等。 connect 呢,是第三方账号的一个连接, 比如说像这 eraser, git, a lotion 都会有,所以这里的插件其实它就是一个能力包的一个合集,像 m, c, p, skill, connect 这些都是它里面的具体的能力,大家根据需要去进行一个安装就可以。 ok, 那 我们再回到设置里面剩下的几个,我们只是来做一个印象, 比如说像外观,你可以基于自己的系统去定义主题色,浅色或者是深色,当然这里有一个隐藏选项,它有一个宠物,看到了吗?这个就跟 cloud code 是 一样的,就是最近出了一个宠物,当你选择唤醒它的时候, 你看它的右下角就会出现这样的很可爱的一个宠物形象来陪伴你头顶。 it 主要是来管理分支的,像浏览器使用和电脑操控,主要针对的就是 browser use 和 computer use, 在 我们后面也会去讲到像以规章和使用情况,就是你本地的一个任务的一个管理和一个用量的展示,平时经常的去看就可以了。

最近是不是你也被一波普通人一定一定要用着 codex 的 视频疯狂洗脑?我跟你讲,我现在一刷到这种视频呢,我这个血压就上来了。 上个月喊的是一定一定要用上 openclaw, 这个月风口一转改成 codex 了,都感叹的多好多好多强多强,好像不用是他这辈子你就废了一样。我这又好气好笑。 好笑的什么?好笑的是这帮天天喊 codex 牛逼的博主。我赌一包辣条啊,一大半连 plus 都没充过,就算真的充了,我猜你拿这玩意干啥?写文案?对,你没听错,就是屠龙刀,到手拿去干嘛?切黄瓜。 那我问一句,你光喊用上用上,你倒是说说怎么用上?我给大伙数一数,一个普通人想要真正用上得过几关?第一关环境啊,大家很多都懂的。第二关注册,第三关是海外手机号验证, 你加八六的这个人压根不认。第四个,每月二十刀的充值,光这个怎么把钱充进去就能劝退一片人?四道鬼门关关都可以把普通人挡在门外,这些你怎么一字不提呢? 更扎心的来,你不拿它写个文案嘛,整个图文嘛。那我告诉你, deepsea v 四 pro 这边 api 刚永久降价了,百分之七十五 性价比性能直接拉满。日常文那点活他干的又快又好,说白了普通人那点需求啊,人家是价格对着 g p t, 五点五就是降维打击。这个你为什么又不说呢? 我算看明白了啊,一帮自己每个月一百万 tucker 都消耗不满的所谓博主,天天就知道吹,就知道蹭流量,就知道一定一定干货时一点都没有焦虑,给你直接拉满,这个我觉得有点恶心啊, 我不是说扣袋子不好啊,但是他很强,这个我是承认的。我气的什么呢?把工具的门槛给你藏起来,普通人不需要的功能给你吹上天,然后收割你的关注。今天这条我不说一定一定要用什么,我说一句,谁只会喊必须用,却不告诉你怎么用,值不值,适不适合你, 你直接划走,别让他赚这点流量啊。下一条我跟大家讲讲普通的人到底该不该花这个钱,花了钱能不能回本?咱说人话,聊聊干货。

啊,出一个 codex 如何进入 deepsea v 四 pro 的 最简单的教程啊?首先首先是在这个网上下载啊,下载自己电脑对应的版本就可以了,把这个下载下来之后,有一个这个,这个装上就可以了,然后需要第二个工具, 第二个就是需要下载一个这个 cc switch, 这个下载之后呢,还需要先把它下载下来啊,还需要另外一个东西,还有另外一个东西,主播写了一个中转的一个一个工具,因为这里面是不能 codex, 是 不能直接用, 不能直接接入 deepstack 的, 然后需要写一个中转的服务,然后在这写了个中转的服务,大家能看到这个地址吧? 这地址要说呢,这是 get 它的一个地址啊,然后就可以把这个把它克隆下来,克隆下来直接 n p m initial, 然后再 n p m 是 大,然后就运行起来了,运行起来之后,然后再回到这个 c c c 位区里边, c c c 位区里边,第一个是客户的,这个先不用管,然后进入这个,第二个,这个这个拆的 g p t 这个, 然后进去这个里边呢?然后点一定要先选中这个,然后再点这个加号,再点这个加号,你主播已经添加了,然后和这是一样的,然后这个里边这个自定义的名字啊,这个这个贴什么都可以,这都不贴,不贴这个屁,随便贴一个这个,这个没有什么用啊,然后然后就这这个地址,这这个地址 就是刚才刚才 github 上边这个项目,这个项目的里面运行起来的地址啊,就贴这个,因为它运行起来就是这个,就是个端口啊,就贴这个,然后这模型名字我们就写的这个 vise pro。 好, 下面把这个勾上, 然后然后这里边有一个内幕啊,往下滑,这有个内幕,内幕这个地方,这个地方的名字是可以自定义的啊,它显示的是在这显示出来的,你希望他让他显示 dsp 和 vga pro, 那 你就把它改一下,如果你这显示成 d s, 那 这个地方就会显示 d s, 那这就好了,把这个弄过去之后,然后点这儿让它启动,让它启动,这样就好了,这个这个它就把它可以关掉,它就常驻在后台就可以了。然后这个时候我们可以看一下啊,这手机这个,然后这儿我问他,你是什么模型, 对吧?他说他是 tiffany 版本,是 vsco 版本,是 vsco, 对 吧? 然后是什么什么什么他可以干什么,对吧?这个就是完全大好,大家可以点点关注啊,到主页加咱们的技术交流的粉丝群在里边,可以有什么问题啊?可以提出来,然后咱们可以一起交流讨论。

就在刚刚, codex 的 电脑操作功能终于官方登录 windows 了,你看,我现在调用这个 computer use 电脑操控的功能,让他给我的微信发一个文件。你看整个屏幕有一个蓝色的渐变框,然后显示 codex 正在使用你的电脑。他已经打开了我的微信,选中了文件传输助手, 把我需要的那个文件发送给我了,整个流程都是他自己完成的。还有一个更有意思的,我让他直接在画图软件中给我画一个皮卡丘啊,你看,他正在操控我的鼠标,按照他的指令快速的会制整个速度。很快啊,我这里并没有加速,全程都是他自己在画,我感觉画的还挺好的,至少比我画的好。 之前在 windows 电脑上, codex 只能在浏览器中实现自主操控,但现在整个电脑都是它的了,比如微信、 word 文档,各种软件,甚至还可以在电脑上帮你玩游戏。因为本质上你和电脑的交互无非就是鼠标和键盘, 现在它也可以用鼠标键盘了,所以你能操控的它都能操控。具体怎么使用呢?通常来说,如果你的 codex 更新了,今天第一次打开它,就会有一个弹窗出来, 你直接把 computer use 开启就可以了。如果没有弹窗呢?在设置中找到电脑操控这里,我们把任意应用这里打开,你在对话中调用 computer use codex 就 可以操控你的电脑了。但注意,我在 win 十的电脑上似乎运行不了,只有在 win 十一的电脑上才可以。好了,我是阿朱,关注我,让我们一起在 ai 潮头冲浪!

这是一条 codex 从零到一完整的新手入门教程。如果你之前完全没用过 codex, 或者只是听说过,但不知道它到底能干什么, 怎么装,怎么用,那这条视频你就可以收藏了。我会按照一个新手真正上手的顺序,带你从 codex 试什么,讲到安装、使用、主界面、怎么操作、基础功能和进阶技巧、 skills 插件、浏览器终端和自动化任务等等,让这个目前全球最顶级的 a 阵的工具真正为你所用,创造价值。 我也会把整个流程整理成文档,打一句 codex, 方便对照,一边看一边选。你可以先把它理解成一个装在电脑里的 ai 工作助手,他不是单纯陪你聊天的工具,而是可以进到一个具体的工作文件夹,帮你读取文件、修改内容、运行命令、调用工具,甚至按步骤完成复杂任务。 举个最简单的例子,像 chat、 gpt、 豆包这一类工具,更像是你问他答,你自己去做。比如你想做一个网页,他通常只会给你一段代码,接下来你还要自己复制代码、创建文件、运行、检查报错等等。而 codex 是 你问他,他理解他还做,他会从零到一帮你创建好这个网页。 目前最适合新手小白的上手方式呢,是桌面端 app, 我 们可以直接在官网开始,根据你的系统选版本, windows 或者 mac os 都可以。安装之后有两种登录方式,一种是官方 chad gpt 账号登录,另一种是用 apikey, 可以 是官方的,也可以用中转站。两种方式各有利弊。综合来看,还是建议第一种,直接官方账号登录, 省心省事。对于 codex 的 界面,新手可以先关注三个核心区域,最左侧是一些常见功能入口和聊天记录管理区,你可以理解为导航栏加历史记录。这里需要重点讲一下对话和项目的区别。对话最好理解就是普通聊天嘛,你甚至可以把它直接理解为 chat、 gpt 或者豆包, 适合随便问一些小问题,帮你写文案、查资料之类的。它不跟具体的文件夹绑定,而项目就涉及到了具体的生成式任务,比如 如飞哥之前开发的工具箱网站,飞剪一触即达这种软件,他们有大量的编程代码文件,就需要一个专用的项目文件夹。你在这里可以新建空白项目,也可以打开现有文件夹,直接选择路径,或者直接把文件夹拖进来也行。鼠标悬停在项目名上,也能看到这个文件夹在电脑中的 底位置。而对于重要的常用的项目和对话,右键就可以置顶,方便快速切换和查看。左侧下方还有设置入口,在设置里你可以修改 codex 的 使用偏好、外观和配置等等。其中个性化需要重点说一下, 如你想给他一个全局指令,就在自定义这里直接写,比如他要怎么称呼你,固定用中文回答问题,设定一些底线原则或者开发习惯,设置完之后对所有项目都会生效,相当于让这个员工摸清楚你这个老板的脾气,投你所好。这里还有一个很有意思的小功能,叫桌面宠物, 他提供了很多默认的宠物形象,你也可以根据自己的喜好让他帮你创建一个,比如我这个就是给了一张参考图,让他自己做出来的,他会实时显示当前任务的一些简单状态,还是挺好玩的。 在首页设置这里还能看到剩余用量,你可以清晰的看到五小时用量和一周用量,做到心中有数。中间这块就是你和 codex 的 主要沟通区域。首先是这个加号里面有两个非常重要的功能,一个是计划模式, 比如你让他开发一个个人博客网站,不要上来就直接让他干,而是让他先列出计划。相当于你给员工一个项目,得先让他出方案,看看他打算怎么做,这样能有效减少返工,既省精力又省 tokyo。 看啊,他会主动问我们这些具体细节,我们按选项敲定,不满意的或者他没提到的就补充一下,让他重新规划, 这才是一个合格的领导该干的事。而目标模式就更厉害了,刚上线的新功能就是你给他设定一个目标,越具体越好,他会自己拆解分析。执行审查,有一种不达目的不罢休的意思,这样就避免了一个很烦的问题,执行一个任务的时候,他每完成一步就要停下来问你。 比如我正在跑的一个很复杂的大项目,目前已经连续跑了三十多个小时,如果正常一步一步改的话,我可能要好几天才能做完这些进度。右边这个权限设置呢,分成三档,默认是最保守的,像是联网修改文件都需要你的授权,自动审查会开放一部分权限,关键节点还需要你把控。 而完全访问就是最激进的,它几乎可以完全操控你的电脑,创建文件、删文件、跑命令,全都自己干。新手,我不建议一上来就开完全访问,刚开始用默认或者自动审查更稳,等你确认这个项目没问题,也知道它要做什么,再考虑给更高权限。我自己是在非常熟悉项目和流程的情况下才会开完全访问。 右边这里还可以切换模型,选模型版本、智能程度和推理速度。如果不是特别复杂的任务呢?不建议开超高,因为它有可能会出现过度思考,而导致你花了更多的 token, 反而干的不好。 这是血淋淋的实战经验教训,一般来说默认高就可以了。这个麦克风是语音输入,但是体验目前并不是很丝滑,我们可以直接用语音输入法。 codex 还有一个和普通聊天很不一样的地方,任务可以排队,他正在执行的时候,你可以继续补充,要求这些新消息会一个一个排在后面,等他处理完当前步骤之后继续执行。比如他正在做网页,你可以接着说,页面再简洁一些,按钮换成黑色,先不要做登录功能等等。 而如果你忽然发现他理解错了你的意思,或者做了一半有点跑偏了,可以直接选择引导,强行把方向盘掰回来。所以用 codex 的 时候不一定要追求第一条提示词写的特别完美,你可以边看他做边补 充,边纠正边引导。真正好用的方式是把他当成一个正在干活的助手,而不是一个只负责回答问题的聊天框。这个思维一定要转变过来。 最右侧的区域目前包括三个功能,侧边聊天就是当前任务的一个临时讨论区。因为有时候 codex 正在执行一个主任务,但你中途想问点小问题,或者单独讨论某 个细节,就可以用它,它不会打断主对话的节奏。浏览器主要是 codex 打开网页查资料测试页面,比如你做了一个网站,可以让他直接打开本地页面,帮你检查布局按钮、交互有没有问题。如果你对某个地方不满意,还可以让他直接打开本地页面,帮你检查布局按钮、交互有没有问题。如果你对某个地方不满意,还可以让他直接打哪的感觉, 口头描述半天要精准的多。终端的话呢,其实你不需要了解太多,因为它主要是给 codex 执行命令用的。到这里,其实你已经看到了 codex 最核心的几种能力,它可以进入项目,读取和修改本地文件,可以用计划模式先想清楚怎么做,可以通过浏览器查资料测试网页,也可以通过终端运行命令检查结果。 所以 codex 真正厉害的地方不是某一个单独按钮,而是它能把这些能力组合起来,帮你完成一个完整任务。理解了这一点,后面的 skill 插件和自动化任务就很好懂了。 因为前面这些能力呢,解决的是 codex 自己怎么干活的问题。但如果你想让他干的更稳定,更像一个熟悉你习惯的助手,就需要用到 skill。 如果你想让他连接更多外部工具,就要用到插件。 这里很多新手分不清 skill 和插件,其实用一句话就能记住, skill 是 方法,插件是工具。 skill 可以 理解成一套可以附用的工作流,或者说给 codex 的 一份工作方法说明书。比如一家公司做项目,通常都有一套标准流程,第一步做什么,第二步做什么,输出格式是什么,有哪些注意事项,哪些地方不能乱改。 这些东西如果每次都重新告诉 ai 一 遍就很麻烦,而且 ai 它还可能每次理解的不一样。所以更好的方式是把这套工作流程固定沉淀成一个 skill。 这样 codex 下次遇到同类任务时,就不用像一个新员工一样重新摸索,而是直接按照你写的流程和标准来做。 比如我自己的飞鸽工具箱里就有很多专属 skill。 比如把好用的软件保存入库到本地,同步到我正在做商单推广的几个云盘,生成下载链接,再同步到正式站,这些流程全都是固定的。 我把它们写成 skill 之后, codex 就 可以按这套流程稳定执行,不会每次都跑偏。再比如,你经常写短视频文案,也可以让 codex 帮你做一个短视频文案 skill, 把你之前写过的大量文案喂给他,让他总结你的开头风格、结构、习惯语言表达、结尾方式,然后形成一个专属文案助手 后,再写类似内容的时候, codex 就 会优先按照这套方法来。插件就不一样了,插件更像是给 codex 装上外部工具,解决的是它能不能操作某个平台,处理某种文件,连接某个服务。 比如浏览器插件,可以让 codex 打开网页查资料、测试页面表格插件可以让它处理 excel、 ppt 插件可以让它生成演示文稿。 gmail 插件可以让它整理游戏, camera 插件可以把生成的内容导入到设计工具里继续编辑,所以不要把他们想的太复杂。 skill 解决,怎么做插件解决用什么工具做?一个是工作流程,一个是工具能力。 codex 目前已经集成了很多实用的插件和 skill, 我 也整理了几个比较常用的,大家可以截图保存,后面自己试试看。 最后我们再来看一个比较进阶但非常有想象力的功能,自动化任务。你可以先理解成让 codex 在 固定的时间、固定的项目里自动帮你做一件事,但它和普通题型软件不一样,它们最多告诉你该干什么了。 而 codex 的 自动化任务是真的可以帮你执行一整套流程。比如你是做内容创作的,你可以让他定期帮你收集某个领域的热门选择题,整理成标题、角度、参考链接和可以拍摄的脚本。而飞哥最常用的就是每天固定时间设置一个今日任务清单,划掉昨天已经做完的,生成当天新的任务, 就像一个机器人一样按清单执行。这也是为啥有人说我效率那么高,一个人干八个人的事情。除了 ai 的 强大助力之外,任务规划本身也非常重要。所以自动化任务真正厉害的地方不是定时提醒,而是定时让 ai 按你的要求去干活。 最后再补充一个很多人会关心的问题, codex 能不能在手机上用?据我所知有三种方式,最早大家都是用 happy 这种开源项目,它可以连接 codex cloud code, 电脑上开个任务就能通过手机和 agent 的 沟通,但始终不太方便,相当于只是给你安排了一个传话筒。 而 codex 的 mac 版本最近更新了手机端的入口, chat gpt app 里面就有 codex 可以 完整读取你的聊天记录。在手机里聊天和电脑端的消息是完全同步的,本质上是远程链接,相当于把你的电脑版正在跑的 codex 搬到了手机里。而最近我发现了一种非常爽的方式,就是网易的优优远程, 出门的时候手机直接远程连电脑,操作起来很方便,最关键的是你能同时测试它的改动,这就相当于把你整个电脑都装进了手机,所以功能最完整。 好,最后我们来个回顾,总结一下你都学了什么。如果你是第一次接触 codex, 其实今天不用记住所有按钮,也不用一上来就研究特别复杂的自动化和插件,你只要先记住这条主线就够了。第一, codex 不是 普通聊天工具,它更像是一个能进入你电脑工作区的 ai 助手。第二,临时问问题,用普 对话,真正要处理文件、项目代码、文档就用项目。第三,复杂任务不要直接让它开干,先用计划模式让它列方案,如果是一个长期目标,再考虑用目标模式让它持续推进。第四, skill 是 方法,插件是工具。 skill 负责告诉 codex 怎么做事儿,插件负责让 codex 连接浏览器、表格、 ppt 邮箱这些外部工具。第五,自动化任务不是简单提醒,而是让 codex 在 固定时间按照你设定好的流程自动干活儿。 所以新手今天先做三件事就够了。第一,安装并登录 codex 桌面端。第二,建立你的第一个项目,找一个真实的小任务试一下,比如整理一个文件夹,总结几篇文案,或者生成一个简单网页。第三,让 codex 帮你写一份自己的 agents, 点 m d 就是 我们刚才提到的个性化。现在你让他自己干,把你的 称呼、语言、习惯、输出格式、工作偏好都写进去。当你把这三件事跑通之后,你就不只是会用一个 ai 工具了,而是开始拥有一个真正属于你自己的 ai 工作站。祝你越来越牛逼!

小伙伴们又和大家见面了,相信大家一定都用上考勤了吧,还是那句话,一定要想办法用上考勤。 大家既然现在都用上考勤了,我这期给大家讲讲咱们安装好考勤以后一些基础设置,这些基础设置虽然有时候不是特别复杂,但是设置好了会让我们效率倍增 啊。今天咱们就开始从最简单的菜单开始,常规里头有两个,大概我们主要做两个设置工作模式,这里的你大家看一下这个名称应该都很清楚,适用编程,大家编码多一点的时候选择这种模式,比如说咱们日常办公写文案, 或者写弄一些办公软件多一点说我们用适用于日常工作这个模式,其他的咱们按默认选就行啊。 咱们看到外观,这里这里大家看一下外观,这里根据大家喜好来了啊,什么字体颜色啊,背景啊,这都根据实际状况来。但是这里它有一个特别有意思的功能啊,我给大家看一下 box 里头有一个宠物功能,这个功能挺有意思,大家可以选择自己喜欢的宠物进行跟他培养交互,同样也可以选择创建自己的宠物啊,根据自己喜好来 最新的一个功能,应用快照功能,这个功能我感觉特别好用啊,比如大家看见一个特别喜欢的文章,大家可以按左右的 command 键同时按一下,他就把这个 文章啊就直接截取出来了啊。今天我遇到一个特别实用的问题啊,实用的这个功能就是用这个应用快照功能,比如今天我发现一个软件出了故障,迅速我按一下这个按键给抛给这个 cadast, 他 马上就给我分析出问题迅速解决。 这个特别实用啊,大家遇到问题或者遇到好的这个文章的时候都可以用这个特别实用 啊。咱们看一下下面的配置啊。配置这里头我主要说两项啊,一个是批准策略,这里咱们默认就选这个 on request, 这是遇到关键问题的时候,他会询问我们的意见,我们看一下没问题可以批准。还有个沙盒配置,沙盒配置默认咱们选这个 work based write 就 行啊,他对沙盒空间里头有多些功能啊,遇到一些高危命令执行的时候,他也会询问我们, 咱们看一下个性化,这里头,这里头有两个风格啊,一个亲和,一个务实。 你希望他说的要简洁一点,简洁概念一点,就选务实派啊,希望他详细需要说的,希望他说的详细一点,说的有亲和力一点,可以选择亲和啊。 还有自定义指令,自定义指令这个是约束咱们的 agent, 约束咱们的 codex 不 允许他做什么操作,对他有约束力啊。 这里头我用的是卡帕西大神的他的一个开源项目,他现在这个项目大概有十五万颗星啊, 大家有需要的时候,我可以把我的这个 agent md, 我 可以分享给大家,大家可以用起来,因为把这个,把这个指令用上去啊,我们的 codex 它的效率啊,还是它的约束力,还有它这个呃做事的风格就就会提升很多啊, 这个有需要的我可以分享给大家。剩下的是啊,键盘快捷键这里大家可能不需要改啊,如果特别觉得哪个快捷键特别舒服,自己想改一下也行,但是这一般默认就行,但是我们得看熟悉这些快捷键的用法啊,到时候我们很快捷的调用一些功能啊。 咱们看一下这个连接功能,这个更简单了,这个功能特别实用啊,大家开启这个功能的时候,比如这几个按钮,咱们点开允许 发现控制此设备啊,这就是让我们用,通过我们的手机可以连接到 call 大 师,我们直接在床上就可以实现发送指令或编程, 还有让这让这台 mark 保持唤醒状态,这个也勾选上你的 mark 处于息屏或锁屏状态,我们依然能能用手机控制,这个大大提升我们的效率啊, 而且它在锁屏状态下,它是防止别人窥屏的,还保证我们的隐私。咱们看一下这个浏览器啊,浏览器,这里的浏览器勾选上,这里是让 call 大 师,他可以 控制我们内置浏览器,因为 call 大 师带了一个内置浏览器,它是一个无头浏览器,像我们执行一些自动化脚本的时候,在这里头执行 勾选上就行,这个勾选上还是有挺大用途的,现在电脑操控这个这几个按钮也要勾选上啊。首先第一个按钮,任意应用, 我们勾选这勾选上这个按钮以后,呃, codex 可以 控制我们电脑的任何一个应用,包括给我们调取一些数据,做一些数据分析,进行一些登录,都可以使用它非常方便,尤其是我们做开发的时候,比如开发了自己的小应用,可以让 codex 检查一些流程规则。 这个 google chrome 这个功能是在谷歌浏览器里配了一个额外的插件,它可以读取我们浏览器的当前状态, 比如,比如我们登录,登录到知乎啊,登录到微信啊,登录到我们的公众号,它可以进去看我们的一些数据,帮助我们进行分析啊,帮助我们进行一些选择题啊,这特别方便。 锁屏操作,这个顾名思义,大家都知道啊,就是锁屏状态下,这 call 大 师依然能操作我们电脑,比如我们执行一个长任务的时候,我们就可以用这种状态入党绘画。这里就更简单了,就是 我们可以查看我们已经入党的绘画啊,查看一些历史信息啊,包括一些我们以前入党的一些聊天记录啊这些,有时候我们查一些我们重要信息的时候,还是还是挺有用途的啊。 剩下的就是主要这几个功能啊,还是大家得多用 pods, 多用我们才能发现它的这个价值,提升我们的生产力。 好了,这期就录到这了,小伙伴们把这个 code 起来啊,用起来,有什么问题大家集中反馈吧,有需要我再录一期视频的大家就留言啊! ok, 关注宇哥,带你玩转 ai 时代,好,拜拜!

今天给大家讲一下 codex 接 deepseek 最新的方法,我们只需要一个最新版的 c c switch 就 行了,大家在这里把 c c switch 更新成最新的版本, 然后点击 p t 的 图标,点加号选择 deepseek。 大家在这里填入 deepseek 的 apikey, 然后点击创建就行。 这里我已经填好了接下来最关键的一步,点开设置路由,把这些选项都勾选上。 最后我们重启 codex, 这时候就会发现已经显示的是 deepseek 的 模型了, 正常对话也是可以的。

现在路由接 dc 不 用那么麻烦了,以前中间还要加一层 c c 叉,现在 c c switch 更新后可以直接在里面配置了,你按上下文也能够正常开启,额度不够用时可以试试让 dc 接上,毕竟真的大碗便宜。 下面一分钟带你配好。先打开 c c switch, 接到路由这一栏,点击右上角的加号,然后找到 dc, 选好后默认信息都会帮你填好,只需要填你自己的 api key 就 可以。再检查一下这两项有没有打开, 然后保存配置,回到首页,点击左上角的这个开关,最后重启一下 c c switch 还有 codex, 这样子 codex 就 可以成功的接上 d c 了。现在整个流程会简单很多,也少一些麻烦,还有不稳定。今天的分享就到这了,我是木马,陪您一起玩 a 的 赛博达子,咱们下期见,拜拜!

现在我让 codex 用今天新更新的电脑操作功能给我微信一个好友发一个,你好,然后现在我点允许就允许他呃,输入。你好,你看现在屏幕是蓝色的,现在是他在操作这个 codex, 哎,你好,输了好了。然后接下来发送还需要我来给他输了一个确认, 要输好确认给他发过去。 不知道为啥在这个奥迪 a 五 s 店上它会出现这种 bug, 刚才有个修了好久的节板,他能知道这个电脑操作原理, 发了誓,这他不代表自己,自己去好。

最近又有客户找我说 codex 装完后切换不了中文,对着英文界面完全没法用,这种语言设置的问题,我远程帮他调整一下环境,很快就搞定了。如果你也遇到了 codex 切换中文的问题,评论区打 codex, 我 帮你看看怎么解决。

第一次打开 codex, 很多人卡住的不是不会问,真正容易出问题的地方是项目选太大,权限给太满,第一句话又说的太急。这期我们按新手能跟做的方式来,中面段为主,命令行,只讲你真正会碰到的部分, 你不用先记一堆名词,也不用一上来就写代码。我们先把 codex 放到一个正确的位置,它不是普通聊天框,而是一个能进入项目里工作的助手。能进入项目,就意味着它能看文件,也可能会改文件,还可能会请求运行命令。 所以这期的重点不是炫功能,重点是让你知道什么时候可以放心交给他,什么时候必须停下来检查。视频会比较长,建议先收藏,然后跟着做,不要只听概念,最好在电脑上开一个干净文件夹,一步一步试。 接下来我们分四个阶段,先认识他,再安全上手,再让他处理项目。最后再讲扩展能力。先讲一句最简单的定义, codex 是 openai 做的编程助手,但如果你是新手,不要把它只理解成一个会回答问题的聊天框。更好理解的说法是,它是一个项目工作台,你给他一个文件夹,他就可以围绕这个文件夹帮你看资料、整理文件、写代码、查错误、跑,检查 普通聊天 ai, 通常等你把内容复制给他,你不给文件,他就看不到文件。 codex 的 思路不一样,你把一个项目交给他,他会在这个项目范围里工作,这个范围越清楚,他越不容易乱跑。 所以你以后用 codex, 第一件事不是想提示词有多漂亮,第一件事是想清楚这次我要让他在哪个项目里工作,很多人会问, codex 和 cloud code 到底选哪个? 这个不用争,也不需要站队,它们都是能进项目里处理任务的 agent, 区别主要在入口界面和手感。 cloud code 也有桌面和网页入口,但它最典型的使用习惯还是围绕终端、 ide 和开发者工作留展开。终端就是那个输入命令的窗口。程序员很熟,新手第一眼会紧张。 codex 桌面端更像一个工作台,你能看到项目对话任务结果,也更容易知道他现在在做什么。所以,如果你刚开始用这类工具,或者你不是每天写代码的人,我建议先从 codex 桌面端开始,先把项目权限、改动、命令这些基础动作,看明白 命令行入口,后面真正用到再讲,这样你不会被工具吓住,也不会因为给错权限把自己搞乱。 codex 不是 只有一种入口,你可以在桌面端用,也可以在 id 里用,也可以用命令行,还可能在网页或远程任务里继续。 但新手不要一开始就把这些入口全学一遍,这会让你只记住很多名字,却不知道什么时候该用哪个。我们这期的路线很简单,第一,住面端先用熟。第二, ide 和命令行,知道他们是干什么的。 第三,等你真的需要自动化远程任务持续运行,再去碰更高级的入口。 c i lie 是 command lie interface, 中文就是命令行界面, 它不是神秘东西,就是通过命令操作工具。这期会讲到 c i i, 但不会把它当主线。你先学会在可见的工作台里判断风险比被命令重要。接下来我们真的开始用。第一步,先建一个干净文件夹,比如叫 learning pack, 里面只放这次要处理的资料,可以有一份 notes, md 放你的笔记,可以有一份 links, md 放你收集的链接,标题,可以有一份 type, md 写你希望他帮你完成什么,也可以放几张截图,但不要一上来放几十个不相关文件, 更不要直接选桌面下载文件夹。整个文档目录范围太大, codex 会看见太多噪音, 噪音越多,他越容易猜错你的目的。新手第一条原则,小范围跑通比大范围混乱强。 你后面可能会看到几个工作范围。 logo、 word tree、 cloud 这些词先不用被定义, 你可以把它们理解成三种,房间。 local 就是 在你当前这个本地项目里工作,它最直接也最容易理解。 worktree 像是给项目开一个隔离副本,它可以让 codex 在 另一条工作线上试东西,不那么容易影响你当前主线。 cloud 是 把任务放到远程环境里跑,更适合长任务、后台任务,或者你不想一直盯着本机的时候。新手刚开始优先用 logo 或者界面推荐的保守选项,等你知道改动怎么检查再去用 worktree 和 cloud。 不要因为一个词看起来高级就直接选它。第二步,看权限。权限不是越大越好,对新手来说,权限越大,你越要知道自己在同意什么。 读取文件,意思是他可以看当前项目里的内容。修改文件,意思是他可以写入新文件或者改已有文件。运行命令,意思是他会让电脑执行某个操作 命令,可能只是查看版本,也可能会安装依赖,删除文件,启动服务。所以看到命令请求,不要直接闭眼点同意, 先看他要做什么。如果看不懂,就直接问这条命令会影响哪些文件,会不会联网,会不会删除东西。 codex 能解释清楚,你再考虑。同意,解释不清楚就让他换一个更安全的方案。正式开始时,第一句话,不要让他直接写东西。 我建议你先说,请先查看这个文件家有哪些文件,告诉我每个文件大概是什么,不要修改任何文件。最后这句很重要,他不是个性化,是边界。 你先让 codex 观察,等他把文件名和内容说对,再让他继续。这一步可以帮你判断他有没有真的读到项目。如果他一上来就说的很空,只说这里有一些资料,你就追问,请按文件名列出依据,能按文件名说清楚,才说明他进入了正确的项目, 这比写一个很长的提示词更重要。这里顺手讲一个小白,很容易踩的坑。很多人以为给 ai 的 资料越多,效果越好,其实不是,资料越多,上下文越乱,它越难判断重点。 codex 能读文件,但它不是你电脑里的管理员。 你要先把任务边界整理出来,这次要学一个工具,就放工具,说明你的问题,几张关键截图。这次要改一个小项目,就放这个小项目,不要把所有历史项目都塞进去。如果资料特别长,先让它只做摘要。比如让它把三份文档整理成一个 brief md, 然后后面的任务优先围绕 brief md 展开,这样它更稳,你也更容易检查。确认它读对以后,再让它做第一份输出, 不要一上来就让他完成一个复杂项目。先让他生成一份 study plan。 md, 这份文件可以很简单, 第一部分,当前资料讲了什么?第二部分,接下来按什么顺序去?第三部分,哪些内容还缺,需要你补充?为什么先做学习计划?因为计划能暴露他有没有理解错。 如果计划都跑偏了,后面让他写代码,整理资料,生成表格,只会偏得更远。先让他把理解摊开给你看,你确认方向没问题,再让他动手。只要 codex 开始改文件,你就会碰到一个词, diff, diff 就是 改动对比。你先不用懂 get 的 所有命令,你只要先会看三件事,第一看文件名, 他到底动了哪个文件?第二看红色,红色通常表示删掉或被替换的内容。第三看绿色,绿色通常表示新增或改后的内容。如果他改的是你预期中的文件,并且改动理由说得通再接受。 如果他突然动了不相关文件,就先停下来问原因。接下来讲命令行。命令行就是用文字命令操作电脑的窗口,新手不用害怕他也不用一开始就记很多命令。 你先认识几个。最常见的 pwd 是 看当前在哪个路径, ls 是 看当前目录有哪些文件。 get status 是 看这个项目有没有未保存的改动。 codex 请求运行命令时,你要看命令大概属于哪类, 只是查看信息风险通常低。安装依赖删除文件,移动目录上传推送风险就高一些。如果你看不懂就让他解释,不要为了显得自己懂就直接点。同意。看到命令请求,我建议你养成一个固定动作, 先问三件事,第一,为什么要跑这条命令?第二,他会改哪些文件,或者只是在读取信息。 第三,如果失败了怎么恢复?比如 a p m install 可能会改 package log 文件,比如 r m。 命令可能会删除东西,比如 git push 会把你的代码推到远程,这些不是不能做,但你要知道它们在做什么。 codex 不是 替你承担责任的人,他是帮你执行任务的人,最后确认的人仍然是你。现在讲 git, 如果你不是程序员,先不要被这个词吓倒。你可以把 git 理解成项目存档, 就像你玩游戏打到一个安全点,先存一下,后面试错失败还能退回去。 ai 做项目一定会有不确定性,他可能改的很好,也可能理解偏。所以每做完一个阶段,最好让 codex 帮你检查状态,然后存一个点, 提交前先看 def 确认这次改动只包含你想要的内容。这一步会让你改用 ai, 因为你知道坏了还有路回来。用久了以后你会发现 codex 好 像变慢,或者回答开始发散, 这不一定是它突然变笨,很多时候是上下文变满了,上下文可以理解成它这次任务里能同时记住的信息空间。 你说过的话,他读过的文件,命令输出错误,日制都会占空间,空间越满,他越难抓住当前重点。 所以长任务不要一直无限聊下去,每完成一个阶段,就让他做一次阶段总结,总结要写进文件,比如 progress, md, 这样后面就不用靠长对话应承,用文件接住上下文,比一直聊天稳的多。 codex 里还会看到模型、速度、努力程度这类设置。这几个词不用讲复杂,你先按任务轻重来选, 解释一个文件,整理一份笔记,改几句话。不需要让他用最重的方式思考。多文件修改架构,调整排查复杂错误,就要给他更多思考空间。配额也一样, 不要把宝贵额度都花在闲聊上,真正值钱的地方是让他读项目,做计划,改文件,跑检查,解释差异。 如果你发现额度紧张,就把任务拆小,一次只做一个明确目标。任务小,反馈快,也更容易发现错误。 新手最怕一口气让他做太多。接下来是 plan mode, 也就是计划模式,你可以不用记英文名,它的核心就一句话,复杂任务,先出计划,再动手。比如,你要让 codex 改一个项目, 不要直接说帮我优化一下这个太空。更好的说法是,先不要改文件,请先给我一个执行计划, 列出你会读哪些文件,准备改哪些文件,最后怎么验证。这样你在他动手之前就能看到他是不是理解对了,计划不对就先改计划,计划对了再让他执行,这一步能省掉很多返工。 codex 开始工作以后,不代表你只能等结果,中途你也可以继续给方向。比如,你发现他准备改一个不该动的文件, 你可以直接说这个文件不要动。比如,你发现他开始把界面改的太花,你可以说保持现有风格,只改按钮状态。比如,你不确定他下一步要做什么, 你可以让他先暂停汇报已经完成什么,接下来准备做什么,这不是打断他,这是管理他要从提问者慢慢变成任务负责人,这也是用 codex 最重要的心态变化。 codex 能同时处理多个任务时,新手也要注意,病情不是越多越好。 你要分清主线和支线,主线负责当前真正要完成的目标。支线可以查资料跑,检查比较方案,但支线不要随便改主线文件,最后把支线结论汇总回来就行。比如主线再改一个页面, 支线可以去查官方文档,或者跑一遍测试。支线完成以后只告诉主线哪些地方要注意, 这样上下文不会乱,也不容易出现多个任务互相改同一块的情况。接下来讲 agents md 这个文件,你可以理解成写给 codex 的 项目说明书,它不一定是给观众看的,它是告诉 codex 这个项目怎么运行,有什么规则,哪些地方不要乱碰。 比如项目启动命令是什么。比如改前端要遵守什么样式。比如生成视频时不要会用别的 episode 素材,比如字幕不要带框这些规则。如果你每次都在聊天里重复,很容易漏。写进 agents md, codex 之后进项目就能先看到, 这就是把经验沉淀成规则,做长期项目规则比临时提醒可靠。 codex 还会有 memory, 也就是记忆,记忆适合放偏好,比如你喜欢中文解释,比如你不喜欢界面太花。 比如你希望每次改完都说明验证方式,但项目硬规则我更建议写进文件,比如 agents md, read me md docs 里的规范,因为文件可以被你看见,可以进版本管理,也可以团队共享 记忆如果记错了,要及时删掉或更正,不要让它把一个临时偏好当成所有项目的永久规则。简单说,偏好可以交给 memory, 项目规则尽量写进项目文件再讲。 skill, skill 不要理解成神奇插件, 更准确地说,它是可附用流程。你有一件事经常做,比如写视频脚本,检查平台风险,生成素材清单,做字幕同步。你先和 codex 一 起把流程刨顺,确认每一步该输入什么,输出什么,怎么检查, 然后再把这套流程保存成 skill, 下次遇到类似任务就不用从零说一遍。所以 skill 的 核心不是多装,核心是把你已经验证过的流程固定下来,这也是我们做视频 agent 最需要的能力。 sap agent 可以 理解成分身或者小组成员,但它不是越多越好。适合拆给 sap agent 的 任务一般有几个特点,第一,可以并行, 第二,不需要立刻改同一批文件。第三,最后只需要结论。比如一个 sabotage 去查官方文档,一个 sabotage 去检查文案风险,一个 sabotage 去整理素材缺口、主线,最后拿到结论再决定怎么改。不要让很多 sabotage 同时改同一个文件, 那样你会很难判断到底是谁改坏的插件和 m c p 放在后面讲,因为新手一开始最容易被这些词带跑。插件可以理解成异包能力,里面可能包含 skill 工具配置或者某个服务的连接方式。 m c p 可以 理解成连接外部工具和数据的桥,比如让 codex 能读某个设计工具、某个文档系统、某个内部服务。 但新手不要一上来装一堆,装的越多,权限越复杂,上下文也更容易乱。正确顺序是先有任务再找能力,不是先装能力再想能干什么。每装一个外部工具,都要知道他能读什么,能写什么,怎么关掉,这才是安全的用法。 computer use 是 更高级的一类能力,简单说就是让 codex 能像人一样点击输入,切换窗口。这听起来很强,但也意味着风险更高。所以用它时一定要缩小范围,不要同时开私人资料支付页面。账号后台 只打开和任务有关的窗口,任务也要说清楚,比如只让他打开一个测试页面,点击三个按钮,记录哪里报错。不要说你随便看看电脑哪里有问题,范围越模糊,风险越大。我们做视频素材也是一样, 只录窗口,不录整个桌面,账号、路径、通知都要处理干净。自动化也放在后面,它适合重复任务,比如每天检查一批资料,比如每周整理一次问题列表, 比如每天根据固定规则生成一份代办。但不要把一个没想清楚的任务直接自动化,先手动跑通一次,确认输入是什么,输出是什么错误怎么处理,再让 codex 按固定时间或者固定条件去做自动化。最怕没有验收标准, 它每天都在跑,但你不知道跑的对不对,所以每个自动任务都要有可检查的结果。后面你还可能看到远程控制和手机入口, 这类功能很适合临时补充任务。比如你人在外面,突然想到一个需求,你可以从手机上把任务发给 codex, 但你要记住,入口换了,不代表检查可以省掉。电脑仍然是执行环境、项目、权限、文件命令,这些原则都还在 手机,更适合发起任务,查看进度,补充说明。真正关键的改动最好还是回到电脑上检查。新手不要追求哪里都能遥控, 先追求每一步都知道发生了什么,这才是长期稳定使用的基础。现在回到桌面端界面本身,新手第一次看,不要盯着每个按钮研究。你先看三块区域,第一块是项目和绘画, 他告诉你现在在哪个项目里,最近开过哪些任务。第二块是当前对话,你输入目标 codex 回复计划,问题和结果都在这里看。第三块是任务和文件变化, 他会告诉你 codex 正在做什么,做完了什么,哪些地方需要你确认。你只要先看懂这三块就不会慌,按钮以后慢慢熟,先知道信息应该在哪里出现。很多人用 codex 效果不好,不是工具不会干,是任务本身说的太散。 一个好任务至少要有三样东西,第一,目标你最终希望他交付什么。第二,材料,他可以看哪些文件,哪些文件是重点。第三,验收你准备怎么判断他做对了? 比如,不要只说帮我整理资料,你可以说,请根据 notes md 和 links md 生成一份 study plan md 要求分成三部分,主题摘要,学习顺序,逮捕问题。最后,请列出尼引用了哪些文件名,提示词,不是越长越好。新手更应该追求具体, 少写形容词,多写交付物。比如,不要只说帮我写的高级一点,高级是什么意思? codex 只能猜。你可以说,请把这段话改成小白能听懂的口播,每句话不要太长,术语第一次出现要解释,不要使用夸张承诺。 最后给我一版可以直接配音的文本。这样的指令不一定很长,但它有明确交付,也有明确限制。 codex 很 适合解释文件,但你要让它带着依据解释。 比如你可以说仅解释 notes md 的 主要内容,按标题分段说明,每一段都告诉我依据来自哪个文件。 如果有不确定的地方,不要猜,直接标出来。这句话非常重要。 ai 最麻烦的不是不会说,而是有时候不知道也会说的很像真的。所以你要养成一个习惯,让他把依据放出来,没有依据的结论就不要急着采用。 真正让 codex 改文件前,我建议多加一个步骤,让它先列改动清单,清单里至少写三列,第一,准备改哪些文件?第二,每个文件大概改什么?第三,为什么要这样改?这个动作会让 codex 自己先整理思路,也让你提前发现风险。 如果他准备动十几个文件,而你的需求只是改一段文案,那就明显不对。你应该让他缩小范围,范围清楚以后再让他执行。 codex 生成的东西,不要只看文字回复,能预览的一定要预览。做网页就打开页面看实际效果,做视频就看画面字幕声音有没有对上,做报告就看画面字幕声音有没有对上。做报告就看画面字幕声音有没有对。很多问题不会出现在对话里, 它会出现在结果里,比如按钮看着歪,比如标题太大,比如字幕挡住了画面。 所以验收不是问 codex 一 句完成了吗?验收是你真的打开结果看一遍,你给 codex 反馈时也要具体,不要只说不好看, 不好看对他来说太模糊。你要说位置,比如第三页右侧标题太大,你要说问题,比如压住了图片。你要说方向,比如把标题降一档红色,重点不变,这样 codex 才知道怎么改。 反馈越具体,返工越少,这也是人和 ai 写作最基本的方式。 codex 也可以处理图片和截图相关的任务,但你给截图前先处理干净,不要把整个桌面丢进去, 不要把账号路径、通知账户敏感信息一起放进去,只裁任务相关区域。如果截图里字很小,先放大或重新截,你让 codex 看不清,他就只能猜。 我们做视频素材也是同样规则,真实素材要清楚,如果素材太长,就切成几页讲。如果一个截图里有太多信息,就分成局部放大。不要让观众盯着一张小图猜里面写了什么。 ide 是 integrated development environment, 中文可以理解成开发环境。比如很多人写代码会用 cursor vs code jet brains 这类工具。 ide 的 好处是文件数、编辑器、终端都在一起, 你一边看项目结构,一边改文件,一边跑检查。如果你本来就在写代码, id 里的 codex 会很顺手。但如果你是新手,不建议第一分钟就钻进 ide。 你 先用桌面端理解项目和权限,等你知道 codex 在 做什么,再把它带到 ide 里,这样你不会被界面和代码同时淹没。 学习工具也要有顺序,先看得懂再追求效率。 cloud 和后台任务的价值是让 codex 可以 长时间做事,比如查资料、跑测试、整理报告、分析代码库。你不需要一直盯着屏幕,但后台不代表无人监管。 任务开始前边界要写清楚。任务结束后,先看他的汇报,看他做了哪些步骤,遇到什么问题,产出了哪些文件。如果有文件改动,再看 diff。 如果有命令执行,再看命令记录。后台任务最适合做低风险、可检查目标明确的事情。 不适合用来做你自己都没想清楚的事情。不适合用来做你自己都没想清楚的项目。新手第一个常见错误是一口气让 codex 改完整个项目, 比如你说帮我把这个项目优化一下,这句话听着省事。其实范围太大,它可能会改结构、改样式、改依赖、改文案。最后你根本不知道哪里变了。更好的方式是先改一小块,比如先检查登录页为什么报错。 比如先把首页的标题和按钮排版调好,比如先把 readme 整理清楚。小任务有两个好处,第一, codex 更容易作对。第二,你更容易检查, 等这一小块确认没问题,再继续下一块。第二个常见错误是指看 codex 的 回复,他说完成了,你就以为完成了,这不够。回复只是说明真正的结果在文件里,在页面里,在命令输出里。如果他说已经修好 bug, 你 要看测试有没有过。 如果他说已经生成页面,你要打开页面看。如果他说已经整理文档,你要点开文档读两段。 ai 的 自我汇报只能作为线索,不能代替验收。 你越早养成这个习惯,越不容易被漂亮回复骗过去。真正能交付的是能被你打开运行检查的结果。第三个错误和我们做视频也有关,不要把私人信息放进演示项目。 你录 codex 终端浏览器 ide 的 时候,画面里可能出现很多细节,比如真实用户名,比如本机路径,比如账号信息,比如接口密钥、账户状态、账单信息。 这些东西不应该出现在公开视频里。最好的办法是演示前就准备一个干净项目,只打开需要的窗口, 录完再检查一遍素材,该裁的裁,该遮的遮,不要指望后期临时补救。如果你暂时不知道怎么问,可以先套一个模板。第一句,请先查看,不要修改任何文件。第二句,请列出你理解的目标和执行计划。第三句,我确认后再按计划执行。 第四句,执行完请说明你改了什么,以及我怎么验证。这四句话很普通,但非常有用,它们分别解决四个问题,先查看,避免他一上来乱动。先计划,避免他理解篇, 确认后执行,让你保留控制权。说明验证方式,让结果可以检查。新手先把这套模板用熟,就已经超过很多人了。拿我们做视频这个项目举例, codex 也不能乱来。第一步一定是文案,文案没定,素材就没法准确分配。第二步是逐句素材表每一句话到底用真实录屏、截图、卡片还是动画元素,要先写清楚。第三步才是配音, 配音出来以后,时间轴必须跟真实音频对齐。第四步是渲染和 qa, 看有没有混错,素材,有没有字幕党,画面有没有旧元素残留。 这套流程写进项目规则以后, codex 下次就不会每次都换一种做法,这就是把工具变成流程的意义。用 codex 时也要知道什么时候停。第一种情况,他连续两三次理解错目标, 这时不要继续补一句改一句,你应该让他先复述目标。第二种情况,他开始动无关文件,这时不要急着接受改动,先让他解释为什么要动这些文件。第三种情况,你看不懂他要运行的命令,这时不要硬点同意 让他解释命令,或者换一个止读检查方案。会停是安全使用 ai 的 一部分,不是所有任务都要一路跑到底。如果一个对话越来越长,越来越乱,不要硬撑。 你可以让 codex 写一份 progress md, 里面写三件事,第一,已经完成什么。第二,当前做过哪些决定。 第三,下一步应该从哪里继续。然后你可以开一个新对话,新对话里先让它读 progress md, 这样比在一个很长的对话里不断翻旧消息,稳定。 很多长期项目都应该这样做,让文件承担记忆,让对话保持清爽。任务完成后,不要只说一句不错,你可以固定按一张验收清单过一遍。第一,看文件 他改动的文件是否在预期范围里。第二,看运行,能打开的打开,能测试的测试,能预览的预览。第三,看风险有没有暴露账号路径密钥,无关私人信息, 有没有运行你不理解的危险命令。第四,看下一步他有没有写清楚还剩什么问题。 最后再提醒一个学习顺序,不要一次学完所有高级功能。 第一层,先学项目权限文件,你要知道 codex 在 哪里工作,能看什么,能改什么。第二层在学 diff 命令 get, 你 要知道怎么检查改动,怎么理解命令,怎么给项目存档。 第三层,最后再学 style 插件、 m c p 自动化、远程控制。这些能力很有用,但前提是基础流程已经稳了,如果基础不稳,高级功能只会把混乱放大。所以这期你看完以后,先别急着把所有东西都装上, 先拿一个小项目完整跑一遍,跑通一次,比收藏十个功能您更有用。等你能自己判断它该看什么,该改什么,该怎么验收,再去扩展工具。那个时候 skill m c p 自动化才会真正提高效率, 否则你只是把一个不稳定的流程放大了。学习 codex, 顺序比速度更重要,先稳再快,先会检查再弹放手,先能复盘,再把流程固定下来,这样你之后遇到新的工具、新的界面、新的模型,也不会。每次从零开始, 你会知道自己要先看项目、看权限、看改动、看验证,而不是被新功能牵着走,这才是这期真正要教会你的东西。到这里,我们把 codex 的 核心用法串起来,新手先记住这条路线, 第一,选一个小而干净的项目。第二,权限先保守。第三,第一句话只让他观察,不让他改。第四,看他有没有按文件明说清楚。第五,再让他产出一个小文件。第六,所有改动都看 diff。 第七,重要节点用 get 存档。 第八,复杂任务先出计划。第九,规则沉淀到 agents md。 第十,重复流程再做成 skill 或自动化。最后总结一下,这期不是让你记住每一个按钮,工具界面以后还会变, 真正不容易过时的是这套工作方式,你给 codex 一个明确目标,给他一个干净项目,给他清楚边界, 让他先计划再执行。执行中看 deal, 看命令,看结果,完成后把经验写进规则和流程。你学的不是某个按钮在哪里,你学的是怎么管理一个会动手的 ai。

codex 总算更新 windows 版本了,手机可以远程控制,我电脑刚做了更新,来看看怎么样 打开 gpt, codex 移动版就上线了,接着点开始设置,点允许唤醒状态 使用电脑控制。怎么点不动呢?先不管了,看一下有没有控制到我电脑。 用安卓手机打开我手机看一下, 已经看到有电脑, 再按一下手机竟然连通了。接着测一下我最近的项目, 什么项目呢?就是能用企业微信自动发消息, 直接让他打开企业微信,然后去发消息 给我打开企业微信,去发个消息,给曹志强发一个消息,说在吗? 看一下现在能不能打开我的企业微信,帮我把消息发出去。 直接打开我企业微信,已经点过去了, 发消息成功了。这就是我远程让他给个人发一个消息,我再让他在群里发一个消息, 尤其是这种有外部客户的群。我让他在我的外部客服服务群里发消息,然后艾特两个人说提交周报。我先看一下 他已经正常打开我的群了,看一下能不能正常艾特人员, 他已经在 at 相关人员了, 已经点了发送。这是简单的个人群聊内信息发送,针对企业微信需要及时甚至上百个群的通知服务,也许可以用到这个工具。

九成的人都在裸用 codex, 难怪写出来的代码总是翻车。不是模型不行,是任务太乱,你让他同时读项目,找 bug, 写代码做审查补测试,他当然会乱想把 codex 用顺,先记住这六个真实能用的 skill, 别上来就咔咔开写。 第一个 open ai docs, 只要你接 open ai api, 换模型改参数,别凭记忆瞎写。先查官方文档,不然后面接口报错,你还以为是 codex 不 懂。第二个, friend and design, 做页面后台组建,别只说帮我美化一下,它管布局、交互、移动端和视觉质感,专治页面像模板按钮没状态,手机端挤成一坨。第三个 browser, browser 前端写完不进浏览器验收,基本就是闭眼交付,它能打开本地页面,点击截图看按钮能不能点弹窗,挡不挡页面是不是空白。 第四个 skill creator, 反复做代码审查、报错、排查,项目初步化,就别每次重写提示词,把流程沉淀成 skill, 让 codex 下次按你的标准干活。 第五个, plug in creator, 如果你不只是想写提示词,而是想把一整套工具、配置技能打包附用,就用它,适合进阶玩家,把零散能力封装成自己的插件。第六个, find skills, 别什么任务都让 codex 硬扛。做 ppt, 查文档,写前端,跑浏览器,先找有没有现成 skill, 很多人不是没有工具,是明明有工具箱,却只拿一句提示词硬拧拳项目。记住,高手用 codex 不是 从头忙到尾,而是把不同任务交给不同 skill, 查文档交给 open ai, 杠 d o c s 做前端交给 friend and design, 验页面交给 browser, browser 沉淀流程交给 skill creator, 封装能力交给 plugin creator, 找工具交给 find skills。 分 工清楚了, ai 才不是乱猜,而是在按流程干活。