我太激动了,我的扣代词已经连续工作了十三个小时了,然后他还在自己干活。扣代词他最近上线了一个新功能,叫 go, 那 这个 go 是 什么呢?简单来说就是你给他一个目标之后,扣代词会把后续的工作围绕这个目标持续的去推进,他还能跟踪状态,耗时跟投跟的使用。 以前我们做项目的时候,哪怕计划方案写的很清楚很详细, ai 也很难一次性的去做完,他会分很多个阶段去做,每次之前完一个阶段,你要去验收,有问题还要跟他多次的去沟通修改,然后再一次去推进。别的阶段,你就需要一直守在电脑前。 说实话,自从使用 ai 编程之后,我基本上很少有周末休息的时间了,不知道有没有相同感受的朋友。但是我今天第一次尝试购给扣代斯设定了一个目标之后他连续工作了十三个小时,我今天白天就出去玩了, 我真的可以不用一直在电脑前去守着了。虽然扣代斯之前也有 remote control, 可以 让我不用一直在电脑前守着,但是在验收某些需求的时候,用手机去调试查看,其实还是不是很方便。 那以前最痛苦的不是 ai 不 够聪明, ai 它会读代码,会写代码,查报错、跑测试,但问题就是它不够让人放心, 它很像一个能力很强,但需要你一直盯着的人。所以很多时候你以为自己在用 ai 干活,但实际上你是在给 ai 当主管,你不敢真的把一个复杂任务交给他,他随时都可能会停在半路。但扣代斯这次更新的这个 go 这功能让我第一次觉得这个状态改变了, 他不是回答完这一轮就结束了,他会一直记得自己要完成什么,会读代码,改文件,看失败日记,失败了再改,改完再测,测,试完再去判断这个目标到底完成没有,他知道自己这个目标没有闭环,就会继续接着往下做。 那怎么使用这功能呢?其实也很简单,你只需要打开勾带子,然后输入斜杠目标,然后选中之后就把你要让他做的事输入上去,他就会不达目的誓不罢休的给你干了。我觉得勾的价值就在于他开始让勾带子围绕一个结果持续推进,他改变的是你使用 ai 的 方式。
粉丝2112获赞1.3万

呃,最近这个 codex 的 这个 go 模式挺火的啊,今天给大家讲一下怎么打开 go 模式,这样点这个左下角设置, 呃,设置进来之后点这个配置,然后点这个 config, 点这个 进来之后呢搜索 f e a t u i future, 然后呢?这这这这里是这样的,然后你把这个 goes 等于处加进去就可以了, 把这个加进去,加到这个 future 下面就可以了,然后再重启一下 codex, 重启一下它,这个它就有 go 模式了。 然后 cloud code 的 话就是你直接更新就可以,更新的话你就你就发这个 cloud update, 更新到最新版本它就有了。我们试一下 go, 就是 这个 site go。

代码的目标功能怎么开?什么样的任务适合开?用第三方模型能不能用这个功能?怎么保证目标模式完成的任务的质量?怎么给他权限? 这是我上个视频评论区关注最多的一些问题。哈喽,大家好,上个视频我发了关于 codex 的 后功能的使用体验,收到了大家很多的关注。今天我会一个视频,讲清楚 codex 的 目标功能到底怎么用,什么时候用, 如何高质量的用。希望大家帮忙点赞评论关注。首先需要说明, codex 的 go 不是 让模型突然变聪明,也不是你丢一句话它就可以无限的自动驾驶 go, 它本身是和模型无关的,并不是模型的功能,而是 agent hines 同面实现的一个机制,是 codex 的 产品和运行环境这一层的能力。所以首先第一个问题, 用第三方模型到底能不能用这个功能?答案是可以的,只要你是通过扣代词使用这功能,再更新到最新版的 app 都是可以使用的,但是效果就不一定有 g p u 五点五那么好了。 官方对目标的定义是给扣代词一个持续存在的目标,这个目标既是他开始工作的指令,也是他判断到底做完没有的标准。所以 go 最重要的不是跑的久,而是有一个清楚完成的标准。所以第二个问题,什么样的任务适合开 go? 答案是,如果你只是改一个按钮的颜色,或者修一个很小的 bug, 实现一个很简单的需求,其实没必要上钩。当然,如果你是给他一个 ui, 让他完全对齐这个 ui 设计稿去实现你的 ui 页面,那还是可以的, 真正适合构的是那种多步骤会中途跑,测试会反复修,而且你不想一直在旁边盯着打 continue 的 任务,比如说迁移一个项目,重构一块模块,修一批测试,做性能优化这种任务,你可以给他一个明确的目标,他就可以围绕这个目标去持续的推进。 再比如前面讲的,你给他一个 ui 稿,我个人感觉扣代词在审美这块还是差点意思的,但是你给了他明确的标准,对其 ui 设计稿去实现 ui 页面,他就会一直修改,并且修改完之后去启动项目对比 ui 稿,做到像素级的还原。甚至你都可以用 gpt 一 米二去生成一个精美的页面, 毕竟 gpd 一 米二的生普能力大家是有目共睹的。评论区有人说只有十个小时,最后写出一坨,其实这个问题不是 go 本身能解决的,而是你给的 go 太空了。 go 的 核心是有一个明确的目标加验收标准,不要写帮我优化一下这个项目,优化这个动作本身是没有一个明确的验收标准的,也就不是一个明确的目标,优化哪个方向,功能交互还是性能优化到什么程度才算是完成?这些都没有一个明确的标准。那第三个问题,应该怎么使用 go 呢? 特别是你没办法明确说出你的目标和验收标准的时候。其实有两种办法,第一种是先 plan, 再去用 go 去执行, 提出你的需求,先让 codex 把任务拆清楚,你确认验收范围没有跑偏,再把这个 plan 去变成 go。 第二种,如果你的 codex 已安装上了 superpower 插件,那么你可以直接开启目标模式,你可以说出你模糊的目标,这个时候他前几步会主动的去跟你澄清,直到明确为止才真的去执行这个目标。 也有人问死停完怎么办?比如他用方法 a 跑不通过,一会又用方法 b。 也有人问做科研做复旦任务能不能一阶段一阶段的验收。这里就聊到了第四个问题,如何高质量的用目标功能去提高产物的质量。这里有几个技巧。 第一个就是构力最好加上停止条件,同一个方案失败两次就必须换方案,或者停下来报告原因,不要让他在错误的路径上你去预谋。注意,这里并不是停止你的目标, 在没有满足你的目标之前, codex 是 不会给这个目标去标记上已完成的标志的,它只是暂停了,等你澄清或者纠正之后,是可以点击继续目标去执行的。 第二个技巧, go 不是 让你完全不看了,而是让你不用每分钟问一句继续,不用中间持续的去给他解释上下文,但是中间你随时可以插话纠正。阶段性的去看 def, 看测试,看结果。你仔细观察就会发现, codex 的 go 并不是想象中的,你给他一个 query, 他 一直跑,中间不停止, 反而更像是他自己把围绕这个目标的实现拆解成了很多的小步骤,并且每实现一个小步骤,他都会做充分的测试和验收, 验收通过了这小步骤就会被提交。那他是怎么继续开始新的小步骤的呢?其实更像是完成一个小步骤之后,他自行判断这个目标是否完成了,然后判断下一步该做什么,给自己了一个下一步骤的新宽瑞。 只不过之前这个昆瑞是需要人觉得上一个步骤没问题了,人去判断下一步应该做什么。了解了这个机制,在他执行某个步骤的过程中,你就随时可以点击停止目标,并且对他进行纠错或者提问,确认没问题了,再点击继续目标即可。最后再说一个额外不算技巧的内容。 很多人对目标都是小心翼翼的,开了一个目标之后不敢随便乱点,不敢电脑合上,不敢重启 app, 会担心中间网断了怎么办?账号额度没了怎么办? 答案就是这些都不会影响目标。你的网断了,在网络恢复的时候,可以重新进到那个规划去点击恢复目标,你账号额度没了。一般情况下,在这个账号额度恢复的时候,目标都会自动的继续,但如果没有的话,你也可以手动点击继续。 像我的 pro 账号是五倍的订阅,经常会在五个小时额度重置之前额度消耗完。我这个时候就会用一个账号切换器去切换账号,切换完 app 是 要重启的,重启完之后我就会去点击这个规划里面去继续目标。最后,关于权限这个问题,官方确实支持减少 approval, 比如不想他每一步都问你。 首先说明一下我自己,其实是开的完全的权限,但是是建立在一个干净的分支可信项目的基础上,确保它有 get 记录。此外,再通过外的 hux 机制去保证不操作项目之外的内容上的。 最后总结一句, go 的 价值不是让 codex 永远跑下去,而是让 codex 不 在每一步等你。推一下智能用法,不是让它干活,认清楚什么叫干完。关注我,了解更多 ai 技巧。

hello, 大家好,下班了。呃,今天背景不是公司,是因为,呃,在公司的时候当然车来了,没有来得及录,然后最近一直在高新路的使用 codex, 想要说我们用 codex 尽可能的提高我们开发效率,一个人顶五个人,六个人,十个人,牛马。 呃,然后最近 q 代像现了一个新的功能,叫做 go 模, go 模式 g o a l 目标。然后首先需要你的 c o i q 代 c o i 得在零点一二八版本级以上才可以使用它,并且要在 config 点 t o m l 文件里面把 go 改成 true 才可以使用这项新功能,那这个功能还在实验阶段。然后我理解它特别像是一个升级版的 sub agent, 就是 我们之前。 呃,如果你有完,为了完成某一个目标,你需要开多个 a 阵去执行不同的任务模块,多个任务可以最终为这一个目标服务的话,我们会使用 sub a 阵的模式,但我一直感觉 sub a 阵的模式其实不是很好用。 然后我今天刚好又有一个新的需求,就比较适合,感觉比较适合使用 sub a 阵去进行,但是之前一直是 sub a 阵的效果不是很好,刚好上线了一个 go 模式,所以呢,我打算使用它。 然后我的这个任务背景是这样的,我为了实现一个目标是可以把我的 app 去的它的它的这个,呃, apk 发版去做一个自动流水线 pipeline 以及呢?呃,我的后端可以去管理。呃, 我发版的版本号,这样的话我的 app 是 可以知道我需不需要去 做本地的 apk 更新,然后去请求这个版本号做一个比较,就这个需求,然后 所以它基本上分为三个模块,第一个是 app 端要去做兼容,你得去能够自动的识别,我目前的版本是低于还是说最新的啊?然后呢去给出下载链接,然后去自己去更新下载更新,这是第一个 app 端,然后第二个呢是 后端,后端得去新增一些接口。那肯定是要啊更新我的 a p k 版本记录,然后呢去检查是否需要更新,以及我的后台界面,还需要去做一个发版记录的展示。 另外就是需要在我的云端仓库,我使用的是 git, 然后 git 有 一个 git go 功能,这个功能可以自动地去根据你啊你的,你可以在项目仓库里面去的 web flow 目录下写一个 webmail 文件,这个 webmail 文件里面就声明了你的 pipeline 是 怎么样子的, 然后基本上就是这这这三大块儿后端 app 端还有我的 pipeline 流水线的建立。然后这三个任务,我让抠带写了三份 prompt, 然后一次性发给一个 go 的 上下文,然后去执行,然后大概执行了七八分钟之后, 效果还是很好的,然后基本上就达到一个可用的状态,所以,呃,我觉得这个 go 模式大家可以多多用起来,虽然现在还是一个 experiment 的 状态。对,那今天就录到这里,拜拜。

我看完官方文档和不少博主分享后,最重要的一句话是, codex 里的 go 不是 更常提示词,也不是代办清单,它更像一个可验收的完成合同,什么结果算完成?靠什么证据证明哪些边界不能碰? 普通 prompt 是 你问一次 codex 做一次,然后等你下一步。 go 是 codex, 每做完一轮都会回头问,目标真的达成了吗?如果没有,它会继续围绕同一个验收条件推进, 而不是等你反复说继续。最适合用 go 的是路径不确定但终点能验证的任务,比如性能优化、迁移复杂重构复现、偶发 bug 跑精准测试,或者做一份证据充分的研究报告,小改动,小解释。一次性代码审查用普通 prompt 更快。我建议你按这个公式写, 完成什么结果,用什么证据验证,保持哪些约束,遇到什么情况要停下来问。比如不要写继续优化系统,而是写把视频系统补齐到严格审计通过,并给出通过命令和最终文件路径。 很多失败的 go, 不是 模型不行,而是目标本身没法验收,提高质量,继续研究做得更好。这些都太虚,你要把它改成检查多少个案例, 输出什么文件,通过哪条测试,或者什么条件算阻塞。实际使用时,先确认你的 codex 版本和当前界面支持 goes, 然后用斜杠 go 加目标启动,用 go 查看当前目标, 需要暂停恢复或清除时,用 pause resume clear。 重点不是被命令,而是知道自己随时能接管。最后记住一句话,先说结果,再说证据,再说边界, 最后说停机条件。目标越像一个可验证的交付合同, codex 越不容易跑偏。 go 不是 让你少思考,而是把你的判断写进执行循环里。

美好啊,朋友们,这是一期 codex 奶妈级的零基础系统教程,这期视频我会从安装开始,手把手地把 codex 的 基础能力到高级功能的组合,以及最新的手机端操作,用十个实战场景来带大家彻底拉通 以后这一类的 ai 产品,出一个算一个,你都会触类旁通,游刃有余。我也把这期的文字课间整理成了文档,那这期的含金量可谓是 biu biu biu biu biu, 一个点赞收藏关注是最起码的。好了,不多说,学费都交了吧,我们上课, 那在开始之前,我先说一下 codex 和 cloud code 的 区别。从本质上来说,它俩都是由编程 agent 逐步转向了通用 agent, 分 别是 ansapi 和 open ai。 这两家出的 cloud code 呢,默认使用 cloud 模型,但是我们可以自行替换成任意其他的模型,那在易用程度上, codex 桌面端的产品设计是会更友好的, 更适合零基础的白领工作者,而 cloud code 有 更高的自由度。在功能上, cloud code 原本是最齐全的,什么 skill、 mcp、 斜杠命令、 hock、 远程操控,这都是人家先发明的。但是呢,最近的 c c 更新稍微不如 codex 那 么快了,会更加偏向专业开发者一点。 而 codex 发了非常强的浏览器操控和 computer use, 还内置了最近的 image 二深图模型, 而且昨天还刚刚发布了手机端和 hock, 可以 直接用你的手机 check gpt 来控制电脑上的 codex 干 活。那价格和额度方面呢? codex 的 会员额度非常大方,二十到的会员就很够用,而且还不封号。 而 cloudpod 呢,大多数人可能都没法用它的官方账号基本上都得自行调用 api 的 费用属于是花多少用多少,风险由人。那在使用场景上,我个人喜欢用 cloudpod 搭配 cloud 模型来写作,因为 ops 四点六的写作和规划能力真的很强, 那 codex 的 执行和解决问题的能力也很强。日常的办公场景,我会选择用 codex, 那 在编程的时候嘛,我就两个都用上,所以结论是,入门的朋友用 codex 就 很强了,有条件的朋友呢,两个都来是最完美的, 不过两者的逻辑其实都是一样的,我们学一个,另一个也就会用了。那 cloud code 我 也做了一期系统教程,想拥有左膀右臂的朋友可以去看看。 ok, 正式开始 使用 codex, 我 们唯一需要准备的就是一个叉 gpt 账号,免费的也行,只是会额度稍微少一点。那有了账号之后,我们就直接去它的官网双击安装, 然后安装好之后登录我们的叉 gpt 账号,然后这些设置我们可以先随便选一点啊,选个日常工作,反正后续呢,我们都是可以改的。那搞定了, 那进来之后呢,大家会看到这个对话窗口,好像跟 chat gpt 是 很类似的。那我们打开两边的侧边栏也蛮眼熟的,左边呢,可以管理对话和任务的列表, 那中间就是聊天,右边大概是结果之类的吧,大家应该都能猜个七七八八,所以我们先不深究它的页面,我们直接开用,这其实也是我探索所有的 ai 工具的独门秘方。 我打开一个陌生界面呢,我先不管别的,我先找到我能对话的框,我先聊,先找到我能看得懂的按钮,先按,按着按着你就会了。你看看,独门秘籍都教给大家了,以后你们就是为师的弟子了。 ok, 众弟子不必拘礼,我们还是以学业为重啊。那我们第一个要了解的 codex 能力呢,就是本地文件操作, 也是这一类桌面端的 agent 跟对话 ai 最显著的区别和能力。因为过去我们用叉 gpt, 如果说我们要让它看到我们本地的内容,我们只有两种方式,一个呢就是复制粘贴到这个对话里,另一种就是以它允许的格式和数量把文件给上传上去。 但是 codex 不 一样,它可以自主地读取和操作我们的本地文件,而且不限数量。比如说我作为一个剪辑,我的本地里面存了八十多条视频素材,这都是我剪辑要用的, 但是呢,这个命名全都是乱的,完全看不懂,所以我想以这些视频的内容来命名,到时候我们看见文件名的时候,我们就知道这个素材是什么。那这事 check gpt 肯定是做不了的,但是 codex 可以 我们来看这两个地方,它都显示了一个概念,叫做项目, 我们选择一下,哎,一选择项目,他就让我们选择本地的文件夹了,那我们只要选中这个文件夹,那这个文件就是我们的项目了,里面所有的文件 codex 都可以自由的读取和操作, 当然这需要我们给他权限。大家看这里的权限选择啊,目前呢,我们是一个默认的权限,我们再点开,他有三种权限模式, 那默认权限的意思呢?就是在我们当前的文件夹内,他可以自由的去读写这些文件,但是如果他想要联网呀,或者是帮我们下载一点东西啊, 或者是碰这个文件夹之外的其他文件,那他是不行的,如果他必须要做,就会要向我们提出提高权限的请求,我们点同意才能继续。 那自动审查呢?顾名思义就是有个 ai 自动帮我们审查,由 ai 来判断这个操作危不危险,如果危险呢,就来问我们不危险的,比如说他去下一个知名的这种官方软件什么的,他就直接开干了。 自动审查比默认模式要更宽松和智能,建议大家选这个就完了。那最后呢,是完全访问权限,这意味着 codex 可以 在你的电脑上几乎什么都能干,它可以修改删除任何文件,它可以在任何位置执行命令,例如说它可能会去把你的 cloud code 给删了。 开玩笑啊,它一般情况下是不会这样抽风的。 ai 呢?也没有嫉妒情绪吗? 大家尤其是新手朋友就选择自动审查模式,相信 ai 就 完了,毕竟咱又能审的比 ai 好 多少呢啊,对吧? ok, 那 我们选中了刚刚的这个视频的文件夹,继续来提出我们无理的要求,让他帮我们把这个文件夹里的所有视频素材都按他们的实际画面来重新命名。哎,他就开始做了, 而且大家看他非常的聪明,他先看了看我们到底有多少个视频,然后他选择用抽帧的方式抽取关键画面来判断内容是什么,而且他还知道他不要一张一张图去看,他给拼成了缩略图的形式,一组一组的去看。 ok, 很 快啊,这个文件夹里面的文件名就全改变了。过程中呢, codex 也是没有向我们提全的,因为他都是在这个文件夹内去操作的。那我们也可以检查一下他都对应好了没有。 ok, 钢琴家音乐演奏厅,没错, 雪山近身格斗,没错,旗袍女人夜巷卖热饮哇!而且他的这个命名还遵循着一个序号,任务、场景、行动的一个清晰的命名格式。 ai 做事的这个细心程度啊,人类你不服不行。那另外呢,我们其实也可以在同一个项目里面去开多个不同的对话,它们的上下文都是不一样的,但是同样都可以随时的访问我们这个文件这个项目。 比如说,我们在另外一条对话,我们又给他一个不同的任务,让他想办法把所有关于风景的视频都剪成一整条。 哎,没想到吧,他真的能剪,他自己想办法,用了一些工具问我们要了一些权限,用这个 ffmpeg 给它拼在了一起,效果的确是关于风景的都剪成了一条。 ok, 那 如果我们要创建一个新的任务,我们其实也可以手动的在这边创建,他也会自动的在我们本地创建一个文件夹。 然后呢,我们跟 codex 对 话的整个过程, agent 产生出来的任何文件啊, pdf 啊,什么 markdown, ppt, 它都会直接存在我们本地的电脑上。 ok, 到这里,大家应该 get 了 codex 呢,可以随时地访问我们的本地文件,去读取内容,写文件,删文件,移动文件,文件夹里的内容也就成了我们的 codex 随时可以获取的上下文,那这里的项目也就对应着我们在本地的一个文件夹, 哎,那刚刚这么个任务会花我们多少上下文呢?我们只要看这里就能看到了。 那这个小圈代表的是我们现在的这个对话和里面的操作,一共使用了 gpt 五点五的多少上下文窗口。 如果我们把鼠标悬上去呢,它还会有更详细的一个信息,当上下文快满的时候, codex 会自动地帮我们压缩上下文。不过其实当我们一个任务告一段落之后,不用等它快满了,让它自动压缩,我们也可以自己通过斜杠压缩这个命令 来手动的去压缩上下文,这样呢,可以让模型更聚焦在我们的新任务上,也省一点上下文的额度。那当然大家除了这个对话的上下文余量,其实我们还想知道我作为一个免费用户,或者是我作为一个 pro 用户, plus 会员,我还有多少总共的额度可以用,对吧? 这个呢,有两个方式查看,一个呢是左边的设置,这里我们点开剩余额度,就能看到你五小时内还剩下多少,那本周内又还剩下多少, 甚至呢,也有什么时候到期会刷新的一个提示,这个产品的设计还是比 cloud 的 友好很多的。那另一种方式呢,就是我们可以直接在对话框里输入斜杠,然后找到这个状态, 那打开这个状态之后,它的绘画这里就会持续的显示我们的上下文余量,这个五小时和一周的限额。但再次说实话,这个 codex 的 额度还是非常大方的,二十到的额度我认为是可以满足大多数白领工作的高频使用的。 ok, 那 顺便呢,我们也介绍一下这里的模型选择, 那点开之后,我们可以选择速度,快速呢,就相当于加急通道,会消耗我们更多的额度。那这里呢可以选择其他模型,但是大家都选五点五,因为它确实更好用。然后呢,这里可以选择智能程度,其实呢一般中度智能就够了, 所以我们选高。 ok, 那 这个小麦克风呢,肯定就是语音输入功能了,比手打字还是要快很多的,但是呢,它的转录速度远不如大家去下载一个语音输入法,还是非常推荐大家用语音输入的 好。那现在我们通过一个本地文件处理的案例,也了解了 codex 上常用的一些功能。那 codex 的 第二大能力就是命令行工具使用。 其实刚才我们说到权限的时候就有提到,在默认权限下,它可以读写文件,但是却不能执行一些命令,一些联网的操作。那这些命令是什么意思呢? 刚刚的案例其实也已经用到过了,比如说它把视频抽帧出来,还把几个视频拼接到一起,它用到的 ffmpeg 就是 命令行工具。 还有一些我们熟悉的命令,比如说我们在终端里面来克隆一个 gitup 仓库,或者是大家近期比较熟悉的,我们在命令行里面输入一些命令来下载龙虾和各种依赖。那 codex 的 第二大能力就是在我们授权的情况下,可以使用我们的终端来替我们做这些事。 那我们就来让 codex 帮我们来安装一些平时对于小白来说非常复杂的东西吧。第一类,常用依赖,比如说什么 node gs 啊, git 什么的, 也是大家以后使用各种 agent 或者是做其他项目必备的一些工具啊,那之前大家要装这依赖都得去看一个手把手教程,然后照着命令抄,挨个装。那现在我们就直接跟 codex 说帮我安装个 node js 给他发过去, 也是因为这些东西呢,其实都是比较常见的东西了,所以在我们的自动审核的权限模式下,你看他基本上都不问我们要提权,就熟门熟路的帮我们装好了。 那第二类,就是那些爆火的但是有上手门槛的一些新的 agent, 比如说龙虾,爱马仕,甚至还有这个 codex 的 竞品 cloud code, 我 们都可以让 codex 帮我们装完了呢,它还能教我们该怎么用。那我们装一个 hermes 吧, 我其实都不需要给它官网和仓库链接,我就说最近有一个叫 hermes 的 agent 很 火,你帮我安装一个吧。 哎,他就会自己去搜索,然后帮我们判断到底是哪一个。然后呢,他根据官方的文档帮我们陆续的装好了,还帮我们验证过已经装好了,你瞧瞧,那我们照着他说的来启动一下试试。 哎,真的帮我们装好了,那往后的配置我们就不在这里继续了,但是大家应该 get, 有 了 codex 以后,那些复杂的要收你五九九的部署,你都可以直接让 codex 帮你做了,怒省五九九。而且我们在使用的过程中遇到任何问题,还可以截图去问 codex, 什么瞎死了马挂了,升级出现了问题都可以让 codex 直接帮你修,是不是很方便? 那第三类有点没那么必要,但它其实也可以,就是像 cursor integrity 这种软件应用, 平时都是我们去手动在网页上下载的,它也可以帮你下载和卸载。那大家用 codex, 我 其实也建议大家去下载一个 agent 的 ide 啊,因为现在 codex 有 个缺点是它没有办法打开我们的文件内容,直接去手动编辑。 虽然这个侧边栏呢,是可以看到一些文件结构和内容的,但是我们都没法编辑,所以大家可以让 codex 下载一个自己喜欢的,比如说我们就这样下载。那下好之后呢,我们再执行一个 git i n i t 一个初步化, 那右上角就会出现这个东西,随时可以把我们的项目在编辑器中打开,我们来手动编辑。 那第四类就比较重要了,就是 agent 本身会常用到的那些 skills 啊, mcp 啊和 selli。 那 skill 和 mcp 本身 codex 也是支持的,我们后面会详细讲到, 我先挑两个大家安装一下,方便我们后面综合起来来做案例。那这些 skill 和 c i 呢?通常来讲不像那些 get 那 种大项目那么著名,所以我们最好是找到它的具体仓库,或者是明确的官网地址。比如说我们下载一个专门找 skill 的 这个 find skill 哦,方式就是直接把链接拷贝给 codex, 然后跟他说帮我装一下这个 skill。 那 在他装的期间,我们也说一下 codex 的 另一大好处,并行任务处理, 我们完全可以在他做这个事情的时候再开一个对话,让他去下载一个别的。那我们下载一个飞书 c l i 吧。飞书 c l i 其实非常的典型, 因为现在呢,有一些积极 ai 化的软件,把几乎所有他在软件里能做的操作都做成了命令,让 agent 能够方便的去操作,我们把这个链接发过去,让他开始下载, 那这边呢,其实会显示每一个正在处理当中任务的情况,这个在转呢,就说明它正在执行中,那这个蓝色的点呢,就说明已经完成了,有时候还可能会出现一个需要你申请权限的一个标识。 ok, 那 这里 fan skill 呢?它是已经装好了,我们再看飞书 c l i 这边,它会引导我们去做一些授权, 我们就跟着它的引导去完成就好了。 ok, 那 装好飞书 c l i, 那 codex 就 能帮我们去做飞书里的各种操作了,比如说写文档,发消息,见日历,做表格什么的了,我几乎每天都在用, 好大功告成。我们就这么一个小章节,我们就用自然语言的方式让 codex 帮我们装上了 hermes node, 飞书 c l i 一 大堆东西,这就是 codex 作为 agent 的 第二大常用能力,命令行使用。 那这个能力和这个章节的演示也是希望大家能够 get 到一点,就是我们现在在电脑上想去做的很多很多事情,都可以让 codex 这样的桌面 agent 去做了。那 codex 的 第三大能力是持久记忆。 看过我那篇 cloud code 的 朋友应该都知道, c c 呢,有一个手动的持久记忆, cloud 点 md, 还有一个自动的记忆系统, 都是把我们希望 agent 能够长期记住的,比如规则、篇号和我们的信息之类的东西,以本地文件的方式存在我们的电脑上,然后事实的时候把这些记忆以上下文的方式注入到 agent 里去。那 codex 也是类似的,它也有这两套持久的记忆系统 在 codex 里面呢,手动的持久记忆文件叫做 agents 点 m d, 而且它也有一个自动的记忆机制,来我们打开设置,找到个性化, 那在这里的这个自定义指令实际上就是一个全局生效的 agent state md, 它会在我们任意的项目跟 codex 对 话的时候,它都第一时间作为上下文发给大模型,那我们可以手动地自己在这里写,不过我更喜欢呢,直接在对话中去跟 codex 说, 比如说我说一个,我希望你以后对非书文档里的任何修改都使用一个专属的你的文字颜色和用删除线的方式来修改,不要直接的修改。然后这个帮我寄到局的 a 正 c m d 里。 ok, 那 它这里呢,告诉我们已经写好了,我们再打开个性化这一块,就的确是多出来了这么一套规则,那实际在使用当中,它就会去遵循我们这个规则了。 比如说我这里已经有一篇非输文档了,我在侧面呢也评论了几个我想修改的地方,我直接可以把这个链接发给 codex, 我 让他根据我侧面的评论帮我修改一下。 那因为我们刚才确实已经装好了这个非输的 c r i 也都给他配置好了权限,所以 codex 是 直接可以操作我们的文档的。 ok, 看看它完成之后的效果。 果然他用了紫色的字和删除线的方式来帮我们做的文档修改,那这个呢,是局的 agent md, 适合记一些适用于所有任务的一些大原则,比如说我们的工作习惯,我们要说中文,我们的工作偏好修改文档,要留下这种修改痕迹等等等等。 那另一种呢,就是项目级的 agent md, 这个长期记忆呢,只在这个项目当中生效,我们可以选择一个项目的对话,然后打开编辑器, 自己在这里手动的创建一个 agent 的 md 的 文件,然后我们去写一些针对我们这个项目的一些规则, 当然也可以让 codex 来帮我们写。我个人的建议呢,是在这个项目文件里面有了一些内容之后,让 codex 根据他对我们项目的了解来自己帮我们写。那自动记忆怎么回事呢? 其实我们刚才在这个个性化这个下面我们也看到了,我们需要手动打开这个自动记忆功能, 它的机制是我们打开这个功能之后, codex 会在我们结束对话或者是结束任务,这个对话闲置一段时间之后,它帮我们把那段对话总结成记忆,然后记在一个地方。但是它有几个原则,第一太短的对话它就不记了, 那第二这个对话的总结它一样会消耗我们的额度,所以当我们的额度太低的时候,它也就不记了。 并且这个自动记忆文件呢, open ai 官方是不建议我们去手动修改的,顶多我们可能删一删有些没必要的信息,那这个文件大概是长这样 的,是一个任务,一个任务在记录的,主要呢会写上这个记忆的来源是哪段对话呀?以及它的工作目录是什么,那以及以后触发了什么关键词的时候,它会去召回这段记忆, 再往下呢,是用户在这件事情上的偏好大概是什么样的?那第五段呢,是一些可附用的一些知识,一些踩坑的记录,那这些内容都是 codex 自己记录的,并且以后也是会它自动的招回去使用的,我们就先不修改它, 它这个格式确实也不太方便修改,更多的时候我们对于明确的规则和要求,我们还是通过组织 agent md 来实现。那大家学完这些视频之后呢,我也想给大家再做一期, 通过组织不同层级的这种 agency md 给自己做一个非常懂你的,可以做不同类型事情的超级助手的视频,感兴趣的朋友可以扣个一。 ok, 那 第四大能力就是 codex 可以 直接用到 image, 二来生成图片。不过呢,深图功能其实是一个小功能, 所以这一章节呢,我们不只会用它的图片生成,我们会带大家做一个完整的个人主页的开发项目,并且在了解一些 codex 在 小白开发中的一些用法和功能。那我们再来开一个项目,叫做个人主页, 然后我们点开这个加号,我们把计划模式打开,因为我们要做一个网站嘛,任务会复杂一点,所以打开这个计划模式呢,他会先帮我们列出一个详细的计划,我们确认之后他再开始行动。 计划模式呢,比较适合我们的任务有一定复杂性,或者我们自己还没想清楚,可以跟 ai 讨论出一个计划。那假设我们现在就是第二种情况,我们其实没想清楚,我们直接跟他说我想做一个个人主页, 那你看他看到我们的项目中是没有内容的,所以他以这种选择框的方式来询问我们的细节,这些选项呢,大家可以按照自己的要求去选择,那我就选这个个人品牌吧。 然后如果说这些选项中没有我们满意的呢?我们也可以选到最后一个来填写我们详细的要求,比如说我要他修饰感,也要高级感,然后我选针对合作伙伴,不要个人照 中英双语,巴拉巴拉巴拉。这里真的是问了我们相当多的问题啊,那最后呢,他给到我们出了一个详尽的计划,问我们是否实施此计划,那其实基本的计划我们看着没有什么问题,但我们也可以补充一些调整方案。 比如说我们刚才就要说到了要用它的 image 二的生成能力,我们这里没有体现,我们加一句网页上要多用一些图片,使用 image 二来生成一些高级感的图片,然后我们一起提交。 哎,那他又问我们要走哪种高级感呢?我们如果点开这个小叹号的话,还能看到他说的这个风格到底意味着什么意思,这个产品的小细节真的是我很喜欢,那我们就选他推荐的吧。然后他出了一版新的计划,我瞧着没什么问题, 去吧。 ok, 他 就开始初识化这个项目来逐步帮我们生成了。那这个过程呢,肯定会需要一定的时间,在这个期间我再给大家补充一点点知识点。呦,他的第一张图出来了,不错,挺有艺术感的,果然是最强的 emoji 二,那我要补充的这个知识点呢,叫做引导。 如果说大家在 codex 执行一个很长的任务的过程当中,你觉得他有点跑偏了,我们是可以随时给他补充纠偏的,比如说我们补充一下图片的人味要更强一点,而且不要这么冷的色调。我是一个 ai 博主,然后我们发送出去, 哎,大家会看到他没有立刻打断我们的任务,没有发出去,实际上他在这里排队呢。那我们看到右边的这个引导按钮,他写着我们不打断模型运行,会在下次调用工具后发送过去。这个是非常好的一个功能啊,我们点一下, 哎,他就可以发出去了。这个功能呢,可以让 codex 不 用在错误的道路上一路狂飙,把我们额度都花光,也不会让它重新再跑一轮任务。那另外一个小功能点,我们找到一个已经结束的任务, 我们看一下这个 ai 的 回复,每个 ai 回复的下面都有一个这个按钮,叫做分叉 fork, 这个的意思是我们可以随时从这里开始去开一个新对话,非常适合那种前面聊的还好好的,上下文也非常有价值,但是我们再往下聊,就聊的有点叉劈了的时候。哦,还有个小功能,宠物, 我们点开设置外观,然后这下面就有一小对小宠物可以选,甚至呢,我们还可以点击创建,让 codex 根据对我们的了解来生成一个定制化宠物。那我们先点击唤醒宠物, 哎,就会在桌面上有常驻这么一个小桌宠,脑袋上会冒出来 codex 正在做什么的一个提示,别的呢?好像也没什么用。 ok, 终于在他跑了七七四十九分钟之后,网页完成了, 我们来看看效果,因为 codex 呢,有一个内置的预览浏览器,我们可以直接打开右边的侧边栏啊,我们还给它放大一点。 嗯,这个网页的效果确实是不错啊,不过呢,现在的 a 证呢,其实都有这么一手了,那它这个预览浏览器呢,还有一个好处,我们点击右上方这里的一个批注按钮, 我们就可以在这个页面上选中这里的具体元素去写修改意见,包括重新生成图片,比如说我们要这个 logo 放大一点, 然后 p 住这里这张图加上一个人物,好把这个删掉, 那然后对话框里呢,就会加上我们这几条批注,然后我们点击发送,它就会针对我们的意见进行修改了,是不是挺方便的?那我们现在项目有了雏形之后,我们再 call back 一下刚才说的 agent md, 其实现在呢,就是一个让 codex 帮我们生成项目级 agent md 的 好时候了,因为我们也有了一定的内容,我们就让它自己生成一下,我们打开编辑器看看, 不错,项目的背景,各种信息,各种规则,各种文件路径都已经写好了。那以后呢,无论我们在新开对话,还是我们的聊天记录都已经被清空了, codex 都可以通过这个项目级的 a 证书 md, 立马的了解我们的项目基本情况。 ok, 那 我们先保持这样,先不做精修了,我们直接准备部署上线,当然大家自己做的时候完全可以去打磨的更好,那网页上的这些信息也换成更真实的信息就好。 那我们现在要部署呢,就得要说到 codex 的 第五大能力插件。在现在的 codex 当中,插件大多数是让我们的 agent 跟外部平台、外部工具、外部服务连接的一个作用,它实际上就是我们所说的 skill, mcp, c l i 这一类东西的一个完整集合包,比如说操作邮箱、操作日历、操作 excel 啥的。那我们来点开左边的这个插件栏,我们看这里呢,已经默认帮我们打开了好几个内置插件了,比如说浏览器操作,还有 mac 专有的屏幕操作,还有 excel 表格, ppt 等等。 那他的插件页面没有中文翻译,所以我给大家把这些插件的具体中文意思,分别能干什么也都列出来了,大家课后可以按需装上,点这个加号就好了。那我们先翻到这个 coding 板块,因为我们想要部署上线嘛,通过插件会非常方便。 其实呢,这个 vassel 和 netify 都可以,我们点一个加号给它装上,那如果大家给它没有选上的,也记得要选上。然后我们再回到对话当中,告诉他们,我们想用这个 netify 把这个网站给我们部署上去, 我们大家也不用管他咋部署的,反正他需要干什么呢,他都会告诉我们的。 ok, 他 发现我们没有登录授权,然后主动弹出了这个登录的链接,那这里呢,建议大家用 tapp 账号登录是最方便的, 那登录完之后,他自己就知道我们已经登录好了,然后继续的帮我们部署,这就搞定了。这个链接呢,就是我们最后的网站了, 只要把这个发出去,别人就能访问你的个人主页了。 ai 是 不是个好东西,你说就这么两下子就干了,原来普通人花钱都不一定能干成 o k。 先压抑住我的这个老灯感叹。我们回到刚才我们已经装好的插件, 那其实这里呢,还有两个非常重要的内置插件,就是 browser use 和 computer use, 还有这个 chrome 浏览器, 那这些有什么用呢? browser use 顾名思义呢,就是 codex 可以 直接帮你操控浏览器,比如说它自己点击翻页截图,填写表单等等。通常呢适用于自动化测试前端, 当然也有比较无聊的用途,比如我们可以让 codex 打开这个 m b t i 做个测试试试, 嘿嘿,这样大家能够比较直观的看到它的一个效果吧。那这个鼠标呢,是它自己在移动,然后它是自己看了上面的答案在自己填写,然后填完这一页,它也会自动的翻页, 那随着它的一通操作,结果出来了,原来 gpt 五是 i n t j 啊,我说怎么跟我这么聊得来呢? ok, 那 这个 chrome 的 插件呢,也是控制浏览器,但是它控制的是我们自己已登录的自己的浏览器,它不会再新开浏览器, 那我们如果把它给勾选上之后,它会引导我们去 chrome 里面装一个插件,那装好之后呢,它就可以操作我们自己的浏览器了, 而且它有个好处,它是可以直接在后台执行多个页面的浏览器操作的,就是并不会占用我们的整个浏览器,我们不用真等着看它这些操作,我们该用浏览器干,别的我们可以接着干。 ok, 那 computer use 就 更厉害了, 它不只能够操控浏览器,连你电脑上的这些 app 它都可以操作,只不过呢,暂时只有 mac 有 这个功能。比如说我们新开一个对话,我们在加号,这里来看最下面的这个插件选项,我们手动地把电脑插件选上, 我们再来几个没什么用的奇迹引巧吧,帮我放一首九九年最火的歌,然后用我的微信给 qq 发条微信,说,请收下我一个点赞、收藏、关注,懂了吧? ok, 他 陷入了思考,然后他看到我们的应用都正在运行中,并且向我们使用了这个音乐软件。我们点同意看,这个就是 codex 自己干的啊。他帮我们搜索歌曲, ok, 音乐响起了, 但是他还有活,他还在问我们要微信的权限,我们也给他允许一下。 ok, 看他这个小鼠标,他正在犹豫着准备搜索点击,好朋友们失败了, 因为我上次都成功了,但是我估计现在微信已经开始严防这种 a 证的操作了,直接给我退出去了。 但是呢,他的确成功操作了这个音乐软件。其实我还让他操作了剪映,并且给我们的最新的项目加上了音乐。 那总之呢,意思大家都懂了吧,就是它可以操作浏览器,并且可以操作我们的电脑。当然,实际上我觉得它的操作效率目前来说还是稍微有点低的,我不太喜欢用这两个强大的功能。不过后面我要说的这个 skill 就是 我每天都会用的东西了。 那 skills 我 的确也已经跟大家说过很多次了,好学的朋友一定要去补补课。那 skill 本质上呢,是我们人为沉淀的一些可附用的方法、流程和工具的组合, 相当于给 agent 做某些具体任务的一些行动指南。那因为之前我们已经让这个 codex 帮我们装过一个叫做 find skill 的 一个原 skill 了, 所以后续如果大家想要去装,或者是找一些社区上的 skill, 都可以直接用 codex 拿语言直接让它下载。比如说我们下载一个必备的 ansapic, 那 个前端设计的 skill, 还有一个去 ai 位的,那我们这两个都发给他,等会儿都会刚好有用 欸,很快他就帮我们装好了。那以后大家想要下载 skill 呢?如果说遇到这个 find skill, 他 找不到的东西,也可以直接把链接发给 codex, 让他帮你下载就好了。不过我在 c c 那 期也说过,最好用的 skill 还是自己创建的,符合自己工作的专属 skill。 那 创建 skill 呢,也有两种方式,第一呢,就是直接告诉 codex 你 想要创建一个什么样的 skill, 通过跟他讨论打磨得出来一个 skill。 那另一种呢,就是我们接下来要演示的,先跑通流程,然后让它形成 skill, 这也是一种更推荐的做法。那比如说我们想做一个自动化写这类文章,并且帮它配图的 skill, 这种大家应该都看过吧, 那我们就得先通过一步步的引导 codex, 让它真正实现一个我们满意的文章。来我们新开一个对话。那正好呢,我们刚才不是装过这个 github 插件吗?我们可以直接先问它最新的 github 流行项目,热门项目都有哪些? ok, 它的确帮我们找到了一些,那我们再让它清晰地解释一下这些项目都分别是干嘛的。嗯, 那我们再让他挑其中新星数量最多的,来帮我们写一篇本周 get up 热门项目推荐这样的一篇文章。 好,那他写好了这一篇之后,我觉得稍微有点太人机了,我希望可以更口语化一点,并且我只想要五个精选的,那我们就告诉他,然后还要覆盖到这几个层面,那我们这里就可以用到刚刚我们下载的那个去 ai word 的 那个 skill 了,我们斜杠给它调出来。 好,那看到他的结果稍微优化了一点,但是我们还希望加一个我们固定的开头,我们的结尾,并且还要让他用上 image 二来帮我们生成一些配图。最后呢,我还希望他不要是这个格式,他要是一篇非输文档的格式,然后图文并茂的。 ok, 结果来了,他确实是有了,但是呢,我觉得这个配图不够丰富,于是我又经过几轮调整才觉得差不多满意。并且我还给他最后加了一步,要让他把这个飞书文档发送到指定的群里,让大家都来看看。 那最终呢,他的效果是这样的,果然发出去了。其实啊,如果想更加一步到位的朋友,也可以结合刚才我们说的这个浏览器操控,让他直接打开那个发布页面,直接就帮你发布出去。 那总之,我们对他这一套结果满意了之后,我们就可以直接让他把这一整套的标准和动作做成一个 skill 搞定了。那我们再输入斜杠,再往下找,我们就发现就有了这个 skill, 我 们可以直接这样手动地调用这个 skill, 也可以直接说生成一篇热门项目推荐图文这一类的触发词,也会让 codex 自动调用。 不过因为现在 github 上面实时的热门项目肯定是没有更新的,所以我们再调用一次呢,它大概率会写出差不多的文章,所以我们就不试了。但是大家都理解了吧, skills 呢,可以把我们经过验证调好一次的一整套流程和方法给它固定下来。 下次做这件事情呢, codex 就 可以按照这个方式稳定的输出。 ok, 那 下一个能力则是 mcp。 其实 mcp 现在已经用的不太多了,所以我只简单的示范一下那 codex 的 mcp 藏在设置里面的 mcp 服务器。 只不过小白看这个肯定是有点不太知道怎么填的,所以跟我们之前说的一样,我们最好的方式还是把你想装的那个 skill 的 链接拷贝给 codex, 让他自己装就完了。比如说我们来装一个 notebook lm 的 一个 mcp 发给他, 他就会引导我们来做授权登录,登录完就搞定了。那我们再试一个我存了非常多访谈视频的一个笔记本,我们来问一下他。 欸,那这样呢, codex 也就可以直接获取我们 notebook lm 上面的这些外挂知识点了。 ok, 最后一个 codex 能力是自动化定时任务。 其实定时任务本身并不稀奇啊,比如什么每天早上提醒我吃药,提醒我喝水这一类的事情,普通的软件也能做,但是我们把它放到最后一个说呢,就是因为它可以结合我们之前学到的各种能力,把一整套组合起来的任务,让 agent 定点执行 自动化,加上智能化和定制化方显美妙。比如说刚才我们做的这个热门项目图文的这个 skill, 我 们就可以把它设成每三天或者是每周,让它定时定点的产出一篇 dapp 热门项目推荐发出来。 那我们要创建自动化任务呢,其实也分两种方式,第一种就是选到这边的自动化面板,那它这里呢,有一些官方的参考视例了,不过大多数是跟开发相关,那我们选择新建一个自动化, 其实你看要填写的东西也非常简单,其实就是用提示词写好这些自动化是要做什么,然后我们可以在这里选好什么时候出发,我们也是可以自定义一个出发时间的, 然后这边就可以选择执行的模型和思考强度,最后点击创建即可。不过呢,我也还是倾向于让大家用第二种更简单的方式,就是直接在对话里跟 codex 说,那我们直接跟他说 帮我创建一个自动化任务,每周一早上九点自动化执行热门项目推荐的这个 skill, 产出一篇图文发到群里, ok, 那 我们在看自动化这里,它就已经帮我们设好了这个任务,我们随时也可以去改变它的时间。 再比如当你的这个邮箱插件 github 飞书都已经连上了 codex, 那 么你也可以让他每天下午六点帮我汇总日历上完成的会议, github 上面的提交记录和我的邮箱回复记录,生成一份全面的工作日报。 最后手机操控 codex 设置方法非常简单,手机上的 check gpt 和电脑上的 codex 都把它更新到最新版。之后打开手机上的 check gpt, 然后点击侧边栏的那个 codex, 它就会提示你允许这台手机控制你的电脑,直接就搞定了。如果你有多台电脑的话,也可以给它分别连上。这就等于你不管在大街上、地铁上还是朋友聚会,都可以随时随地地用手机下发一个任务,让 codex 在 你的电脑上干完一个活, 它就更像一个可以跟你远程协助的同事了。这个功能呢,目前免费版也可以用,但是主要能连的是 mac 系统的 codex。 好, 那到这里 codex 的 所有核心能力我们就全部过完了。来我们回顾一下。 codex 呢,可以操作我们的本地文件,可以使用我们电脑上的终端命令行工具。它还有两种构建持久记忆的方式,它还可以生成图片,而且它可以通过计划模式来做一个完整的项目开发。 那它有丰富的插件,可以操控浏览器和电脑,还可以把知识和流程沉淀成可附用的 skill 技能, 它可以使用 m c p 连接,外部它还可以设置自动化的定时任务。不过其实比起这些功能本身,我也希望大家记住两件事,第一就是我们真的有很多事情是已经可以交给 agent 做了。 那第二呢,就是我们已经从问 ai 的 阶段走向了管理 ai 的 阶段,因为过去我们使用 chat gpt 就是 有问题了,我们问一下,然后得到答案我们就走了。 那现在使用 codex 这类的 agent 呢?每个人都得像领导一样,帮他准备他所需要的上下文和工作环境,给他指明一些任务目标,然后来检查他的计划,监督他的过程,验收他的结果。 那同时领导还要负责把好的方法和流程沉淀成可付用的技能,把反复要做的事情设成自动化执行的规矩。好了,恭喜大家今天都升职了,记得点赞收藏关注我们下次见了。

昨晚 codex 来了一波大更新,这次是真挺猛的。首先说一下这个最实用的新功能, app shells, 以前那个 ai 描述问题要截图,要复制代码,最后还要手动解释半天。现在直接在 mac 上按住左右两个 command 键,当前窗口就直接传给 codex 了。这次不只是截图,是截图加文本一起打包进来, 重点在于它不只是读,你屏幕上的 vx 里只显示了五十行代码,没有问题。 codex 读的是完整的上下文,不是你肉眼看到的那一个页面。 整个生态也很丰富,比如说 figma 终端浏览器 notion 等等全部都支持,相当于把你的工作界面整个共享给了 codex, 效率直接拉满。第二个更新是 remote computer use, 手机上就能操控 mac 的 codex 任务,哪怕你的 mac 锁屏了都没有问题。 幻想一下未来的办公,电脑后台多个 a 程序在一起跑,你出门旅行没有带电脑,躺在床上也能指挥 mac 跑脚本发版本是不是方便多了?第三个是构模式正式上线扣代码了,现在 app id 插件 c l i 全线可用,你只需要给它个目标,它就可以自己保长线任务, 中间随时可以暂停或者改方向。我个人的小建议是,配合 plan, 请把方向锁定,加上 set, 随时开个临时对话窗口确认思路,再用 go 模式跑长线任务的时候会稳很多。最后是浏览器内置高级注视模式,可以直接在页面上标注修改甚至编辑元素, 比如说这个字太小,这个颜色不太对之类的视频的。最后我再补充一个细节,现在扣带才支持团队共享插件 team 版本的用户可以批量给其他成员分发插件包、技能、 m c p、 服务器等一起推,省去一个个配置的麻烦了。

你有没有遇到过那种要跑好几个小时的编码任务? get clone, 装依赖,改配置,跑测试。一套下来,半天过去了,你盯着终端干,等啥也干不了。 openai 的 code c l i 最近加了个 go 命令,专治这种烦恼。我直接说结论, go 就是 让 codex 进入自动驾驶模式,你给他定个目标,然后他自己干活,中间不用你盯着 怎么用?简单打开终端,输入 codex, 进了界面,直接打斜杠 go, 后面跟上你的目标描述。比如斜杠 go 打这个 react 项目,从 class 组建改成函数组建,然后它就开始自己干活了。 你随时可以用斜杠 go 查看当前目标状态,看看它做到哪一步了。想暂停就输入斜杠 go runs you, 要是中途思路变了,直接斜杠 go clear 清空目标,重新给一个新。 这功能我试过,特别适合那种步骤多,耗时长的大工程,比如重构一个老项目,批量迁移代码,写大量测试,用力。你不用一步一个回车,等着去做别的事就行。但是我要提醒一句,别什么事都用勾那种几分钟就能搞定的小改动,自己直接改反而更快。 总结一下,勾是 codex 的 长跑模式,适合大型人物自动化,你设目标,贪干活,你监工。有意思的功能,值得一。

兄弟们,我终于找到了 co ds 购的正确使用方式。自从 co ds 上线了购模式之后,我一直在做各种尝试购模式,对头肯的消耗确实很大,我花干了三个一百刀的 pro 五倍的订阅账号跟一个二百刀的 pro 二十倍订阅账号, 然后终于摸索出了 co ds 的 购到底应该怎么用了。刷到这个视频的朋友一定不要错过,我会把我的心得摸索出来的使用方案免费分享给大家。 首先给大家讲一下 go 模式跟普通模式的区别。在普通模式,你提出需求, koether 执行一轮任务结束,等你下次提出新的需求,再开启新轮的执行任务。一般来说,你会根据任务的执行情况,在下次对话去做不同的操作。如果你发现任务执行的有问题,你会在新库页里面去提出问题,让 koether 去修改。 如果你觉得任务没问题,就可以让 codex 去提交,然后思考下一步要去做什么。在 go 模式里面是完全不同的一个状态,你发送的快手会被设成一个目标,后续每一轮 codex 任务都不需要你去关注了 codex, 它会自动一轮轮的去执行任务。在每一轮里, codex 都会去看目标是什么,现状是什么,下一步做什么,然后真的去做这一步。 我把我们平时的任务划分为短任务跟长任务。所谓短任务,顾名思义就是比较简单,耗时比较少的任务。长任务则是比较复杂,可以拆解成多个短任务的任务。 其实没有 g 模式,我们在普通模式下也能做短任务和长任务。先看短任务,在普通模式下,提出任务之后,如果发出的 query 就 只说了任务描述,那 qsort 做完之后,我们还需要自己去验证,或者发验证任务让 qsort 去做。当然,我们也可以在最开始发短任务描述的时候,一次性说清楚怎么验证,发现问题要怎么做,但是否遵循其实还是取决于模型本身。 那在 go 模式下,其实就相当于把依靠模型本身的机制,用工程的手段固定下来,把不确定变成确定。 codeys 帮你做好了状态变更和管理机制,你只需要去提出你的任务,把任务设置成目标,因为它有严格的状态变更机制,不能随便的把目标修改为完成状态。你写进了标准,在没有符合标准之前他就会一直做。 所以目标模式对于短任务来说,会让任务完成的更加稳定。再看长任务,普通模式下,你不管是通过 play 模式规划好,还是通过 openstack 或者 superpower 这种插件去澄清需求细节,然后交给 koops 去做,他往往都会很难一次性完成。 计划会被划分成多个阶段,多一篇集,需要你跟 koops 去配合,逐个去验收推进。那在 go 模式下,你可以配合各种插件或者 play 模式,澄清一些你在意的核心关键细节, 你就可以设置你的目标了。这里 codeys 不 会把你的任务拆成一个个执行清单,而是每次都会基于总目标跟验收标准以及当前已经执行的一个状态去判断下次做什么。 这个机制看着不复杂,但其实有一些问题,特别是在常任务场景下,因为 codeys 的 构模式本身的机制并不是一个突突立色的机制,它不会在底层生成第一步做 a, 第二步做 b, 第三步做 c, 更不会有一个任务队列去管理每一步完成之后自动挑下一步。那长任务越走越久,背化跟工具结果会越来越多。模型不可能把所有的细节原封不动的背在身上,中间就会进行很多次的压缩,压缩天然的就会丢失一些信息细节。 call dice 的 go, 它会提醒模型以当前的状态为准,但是它没有一个内置机制,自动地把关键事实整理进文档里,也就是说, 把关键事实落在外部证据里,主要是靠用户在目标里明确要求,或者在过程中提醒模型去做,那这里就没有那么稳定了。一旦模型没这么做,每次完成一个小步骤,推动新步骤展开的时候, ko 代斯就要重新去分析代码,梳理状态,判断做了什么,做到什么程度了,就会出现长任务后期吞失都肯失控的问题。 这样看, codex 的 构里虽然有了严格的状态变更机制、神经机制、多轮驱跑机制,但在长任务里,由于本身没有工程的机制去做进度管理,就会确实出现一些任务偏离的风险,以及会消耗更多的 token。 所以我把这套使用方式整理成了一套 codex go workflow 的 方案,也推到了 github 上,它不是替代 go 模式,而是跟 go 模式去配合使用。 go 负责让 codex 持续往前推进,这套方案负责把目标验收、标准、阶段记录跟听的条件提前固定好,让长任务跑得更稳,不容易越跑越偏。 最后跟大家实际演示一下这套模式具体怎么用。我自己做了一个 codex 管理者的项目,因为我自己开了多个账号, codex 本身账号登录换号我感觉还挺麻烦的,这项目可以去管理我的这些账号,并且在某个账号的额度用完之后,让我手动切换到另外一个账号上,也支持智能的去切换到最佳账号, 还能把 codex 的 接口去接出来。这个项目整体功能我自己测试已经没什么问题了,但目前 ui 太丑了,我目前有了 ui 设计稿去重做,所以这次打算用 codex 的 go 模式去完成这个任务。 首先打开 codex, 选择这个项目,新开一个对话,然后输入斜杠目标,切换到目标模式,这时候输入框下方会出现目标模式的状态。 接着引入这个 codex go flow 这个 skill 直接用自然语言去描述我们的需求。参照页 ui 设计图,重新开发当前项目的 ui 页面,要求修改后的页面样式组建,配色、字体颜色和出细都对齐。设计图做到像素级还原,点击发送 会生成 go 点 m d 和 go progress 点 m d, 再按照这两个文档持续执行,后续每一轮它都会先看目标和进度,再继续推进,我们等它执行一段时间,最后看一下执行的一个结果,可以看到执行之后的 ui 页面跟原始 ui 页面差别还是蛮大的,整体效果还是比较满意的。

如果你还把 ai 编程当成聊天窗口,一句一句问它怎么写代码,那 codex 的 斜杠勾可能就是一个分水岭。它真正重要的地方不是多了一个命令,而是 ai 编程开始从回答问题变成推进任务。 官方文档里,斜杠 go 已经被列成 codex c l i 的 内置命令,它可以设置、查看、暂停、恢复、清除一个任务目标。关键句是给 codex 一个持久目标,让它在更大的任务运行时持续跟踪。 这句话很重,因为以前你给 ai 的 大多是一条 prompt, 现在你给他的是一个挂在县城上的目标状态。更明显的证据,在 app server 文档里,它已经有 thread、 go、 set、 get、 clear 这些接口, 所以任务能跑几小时甚至更久。重点不是玄学超频,而是工作流变了长任务终于有了一个可以被跟踪、恢复和管理的目标锚点。 ai 不 再只是回你一段代码,而是在围绕一个目标持续推进。 但这里有个坑,很多人会把 go 写成一句愿望,比如帮我优化这个项目。这个写法基本等于让 ai 猜谜。真正有效的 go, 应该向一份任务合同、目标背景范围、验收、交付都要写清楚。 比如不要写帮我把登录页优化一下,要写把登录页改成手机端优先布局,保持后端接口不变不改、健全逻辑,完成后验证登录、错误提示、退出登录三个流程, 最后汇总、改动、验证结果和剩余风险。最适合交给 go 的是目标明确、过程繁琐、风险可控的任务, 比如补测试、修炼、迁移 api、 整理文档、跑通一个明确功能,对其启动流程。这些事不一定难,但很耗耐心。 最不适合直接放手的是支付权限、生产数据密钥删除数据、跨仓库大重构。越是长时间自动推进,越要把边界写清楚。 ai 方向一旦错了,跑得越久,偏得越远。 我建议你以后写构时默认加五段目标、背景、范围、验收、交付。目标是完成什么,背景是为什么做? 范围是能改哪里,不能碰哪里,验收是必须跑什么?测试交付是改动招标,验证证据和风险清单。 这套模板的价值是把 ai 从会聊天的代码助手变成能被管理的任务执行者,而开发者的角色也会变化。以前你的价值是写代码,后来是会问 ai。 接下来更重要的是定义好任务,判断结果,控制风险。 所以斜杠 go 正式稳定我认为不是一个小功能更新,它是 ai 编程进入自动干活阶段的信号。 以后,真正拉开差距的可能不是谁打字更快,而是谁更会把复杂工作交给 ai, 谁更会验收 ai 的 交付。如果觉得对你有帮助,欢迎关注、点赞、转发!

大家好,今天我在家里面用我自己的电脑啊,把那个 codex 给它下载下来了, 如果有,如果有人想问这个软件是怎么下载的?其实比较简单,就是说我这个是不需要, 不需要花费一毛钱,怎么弄呢?首先点开他的官网啊,酷狗的官网,大家直接在网上搜就能搜的到,直接用他的官网下载就行了,下载过之后,然后会有一个 有安装嘛,然后就就给他安装,安上去的话就是说他有一个,我不知道你们电脑是什么样的,我的电脑是 windows 的, windows 的 话,因为他的话,呃 安装之前会有一个跳出一个弹窗,就是说是微软的商店,应用商店会把这个弹窗给弹出来,弹出来之后,然后他会有一个, 就是就像相当于咱们手机这种应用商店用应用商店这种形式一样,然后你就可以啊,直接在那边就点安装就行了。安装完成之后,然后他就会出现一个界面,这个界面是就登录的界面, 我因为我这个已经安装完成了。第一个的话,他是用那个切拉 g p t 那 个账号去登录, 这用这个账号登录的话呢,因为它这个是需要,需要你有这个的,需要你有这个 api 接口的,就是在那里面是需要有那个 token 的, 所以说,嗯,如果大家有一些, 就是你想用比较高端的这种,或者说是有一些比较复杂的任务啊,你可以去使用这个东西,但是这个东西的话,你用它去登录是需要验证的,因为之前的话是不需要验证,但是现在它是需要验证的, 验证的话就是说你用一个海外的手机啊,去搜,去搜他的验证码,只有有这个验证码之后你才能登录这个号,然后再把那个切 gpt 的 那个 api, 就是 创建一个新的 key, 到时候把那个 key 直接复制到这上面就行了。然后这是第一种登录方式,第二种登录方式呢,就是直接用 api 去接, 但是他这个官方的,呃,靠,这个是呢,他只能去接那个切 g p g 的 这个 i p i。 所以 说如果你有一些别的 大模型的一些啊 k 就 必须得用一个,用一个相当于一个转换插头一个东西,就是像很多他都有那个 c c h 嘛, 或者说是你直接在那个开源的 game 上面啊,直接搜 colex plus plus, 就 colex 加加,就这个这个工具。 管理工具,到时候你在那个开源项目上面下载过之后,然后给它安装完,你的桌面上会出现两个图标, 就这两个图标。 colex 加加还有一个管理工具这两个图标,然后你在那个管理工具里面, 嗯,刚才,刚才不是下了那个格式吗?然后你现在把这个管理工具给打开,然后在那个管理工具里面设置一下, 首先找到这个供应商,设置第二个,然后下面有一个 是新添加供应商这个按钮,点一下添加供应商之后,它会有一个新的供应商 啊,添加新的供应商之后,然后把这个名称写上,就是名称的话是随便写,因为我用的是 agnes 这个 ai 嘛,所以说我就把这个给它名字,给它设设置成这样的,然后接受模式是纯 api, 看是这个纯 api, 然后配置模型呢?嗯,我们一般用的是 agnes 二点零杠 flash 这个模型, 然后后面的话是有更多选项,更多选项的话这个测试模型,测试模型的话和配置模型一定要写的是一样的,看到没?这两个是一样的。 然后这个下面有那个贝斯 u i i u i l 是 给大家看一下具体的就是这个有需要的话就可以暂停,然后看一下子, 然后这个 k 就是 大家因为我不是要接这个 ig 呢,也是这个这个模型吗?因为这个模型它现在是完全免费的啊,所以说我就直接用这个 a p i 就 直接接上去,你在那边登录,我是直接用我的那个 呃,谷歌号,谷歌账号给登录的,那大家有别的号的话,你可以登录别的号。呃,登录进去之后,然后点击它的 a p i, 创建一个新的 a p i, 到时候把那个 a p i 的 key 就是 密码,因为它 生成出来之后,他只会出现一次,就是完整的展示一次。所以说大家把那个 api key 出来之后,你一定要点那个复制,把它复制到一个安全的地方, 然后到时候就直接复制到咱们这个框里面就行了 啊。然后我再点右边的这个上回协议,点这个 chat complaints compilations 这个 啊,然后就可以点这个保存了,那上面有一个保存按钮, 看到没有?这上面有个保存按钮,让它点点保存就行了。点保存之后,然后它下面就会有一个你自己创建的这个 api, 然后先别忘点使用,先点右边这个小笔这个, 这个就相当于测试的,然后你点一下测试,发送嗨测试, 然后他这上面就会出现一个电话框,除了两百以外的,其他所有的都是错的, 需要大家去仔细去看看。嗯,我这边的话就是给大家解释,就是那个如果说出现那个错误五零三的话,就是相当于你的那个配置的模型,和你测试的模型不是一个模型,你要仔细的看看他的拼写是不是一样,还有他的那个 如果是四零四错误啊,然后你就会就可以在那个上面 u l 上面你看看是不是写的对,那个一个就像一个网址嘛,然后你看看拼写是不是对的。弄完之后然后点这个,如果出现二百绿色的出现二百就相当于成功了,然后再点使用, 嗯嗯, 使用过之后,然后点上面有一个重启 codex, 加加这个按钮,然后点那个重启就行了,到时候这个 codex 会自动重启, 然后你就可以进去疯狂的照了,然后剩下的一些配置呀,设置呀,嗯,大家有兴趣可以去在网上去搜一下,或者是直接在那个呃抖音里面去看一下他们具体的是怎么设置的,根据你个人的习惯去设置, 设置完成之后你就可以啊用这个扩展了,而且是免费的,今天的分享呢就展示到这。

go 这条命令 cloud code 和 codex 都有,先搞清它干嘛,再看两家差在哪。勾是给 ai 设一个可验证的完成条件,让它跨多轮自己干,每轮判一次达标才收手,这点两家一致,目标都能写到四千字。 cloud code 这边, go 是 绘画级的,每轮结束默认用一个快模型读对话记录来判断它没有暂停恢复,关掉就清,重开绘画才接着干。 lex 这边, go 是 持久工作流,扛得住进程重启和崩溃,还能随时暂停恢复,而且它更认十句要对着测试日制产物来验收。 剩下就一句, go 加上你的完成条件,比如跑到测试全过, cloud code 达标自动清除, codex 还能暂停恢复。一句话,同一个把中了才收工。 cloud code 守着这一局射完 codex 能暂停,改天接着射。

codex 这个新功能, go x 平台上的程序员已经嗨疯了,几十个小时的烧头肯跑任务,但国内非程序员圈几乎没人知道他能干嘛。 我研究了几天,先用一个写文案的案例,让你看一下这个功能有多夯。使用方式很简单,你只需要在前面加一个斜杠目标,英文的话就是斜杠 go。 从纳瓦尔专访的文稿中 梳理关于赚钱认知的核心观点,挑三个能作为短视频的选择题,写成文案要用一个专业 skill 诊断并修改,然后用我自己的文案标准再优化,不合格自己打回去重写,最后输出给我三篇符合我要求的完整文案。你想想,这套活按传统方式要跟 ai 互动多少轮?这次十四分钟,而且全程不用我参与, 最后三个文档都按照我的要求出来了,我们随便点开一篇标题,有了开头有了文案,质量也不错,逻辑和观点都在线,也几乎没有那种 ai 味儿,因为它都是按照我的标准,已经反复检查改动过了。看明白了吗?这就是 go 跟传统方式的最大不同, 不用说过程怎么做,只要说达成什么效果。以前用 ai, 我 们是作为主管,安排一个事,他做一个事,你得一直守在电脑前,不停的说,继续再改再检查。而购需要我们做总监,只需要告诉他一件事做到什么程度才算完成。剩下的他自己拆,任务自己执行,自己检查自己改,直到达标,再把成品交给你, 他代表了你在监督自己。上面的例子,你完全可以把目标设定的更细,限制更多,让他调用的工具更多,检查的标准更多、更严,不管你提出多么苛刻的要求,他都会一项一项满足。 用起来其实不难,但需要一些思路的转变。我给大家准备了一套模板,拿去直接套用就可以。说白了,只要你身边有那种既要又要还要的领导,或者你自己就是这样的领导,那你自然就懂目标该怎么提。 所以真心建议你赶紧用起来,够!当你习惯了给目标定标准这种方式,你就会慢慢发现自己已经进入了用 ai 的 下一个层次。关注我,我是持续分享 ai 提效工具和方法的小伟。

过去三十天,我在 codex 里跑了差不多一百个 token, 但这期视频不是晒 token, 真正让我想录这期视频的是我用 codex 迁移了一个桌面端 app 的 开源项目, 这个开源项目叫 c c 杠,哈哈,我在 codex 里面使用了 go 指定目标的模式,使用 computer use 把它从 terry r rust 的 一个桌面端架构迁移到了 electron 加 type script。 他大概跑了二十多个小时,中间没停过,自己去理解项目,自己 build 这个桌面端的 app, 自己打开看界面发现问题再回来修。那这一次他重构的这一个开源项目 c c 杠,哈哈哈,零点四点零这个版本我们已经上线了。 我觉得这件事情真正有意思的地方不是 codex 他 帮我写了多少代码,而是他在这一个真实的工程里面啊,长城路表现真的非常不错, 虽然他不能百分之百的帮我们把这个功能迁移完成,但他把大部分的这一个迁移都推进过去了,那剩下的一小部分是需要我们人工配合整个外部环境去验证。 那最近网上也有很多博主都在分享如何安装和使用 codex 这些工具,所以我们本期视频就不再讲这些安装了。我相信在这个 ai 时代,大家稍微动一动,你就能调研出来怎么去注册这一个洽谈 gpt 的 账号,怎么去搞一个可以使用的手机号。 下面我们来讲讲整个的一个迁移过程和一个心得。我们这一个开源项目 c c 杠,哈哈,相信不少人已经在我之前的视频里面了解过,它是我基于一个 cloud code 的 原码改造出来,深根于外的一个开源桌面端,那里面有 session, 有 worktree, 有 权限管理,有 computer use, 还有 am 的 功能。 所以这一次迁移不是写一个简单的页面,也不是做一个玩具项目,它是一个真实桌面端的 app, 里面有很多历史代码状态管理 桌面的能力。这次迁移过程,我觉得最关键的是在 code 中使用 go, 我 不是一句一句的催他去写代码,我给他一个目标,把 c c 杠,哈哈,从 a 迁移到 b, 但是你只给目标是 go 的, 你还要告诉他怎么验收, 这个非常重要,一定要告诉他怎么验收,能不能 build, 能不能启动 app, 关键的页面能不能打开,哪些地方不能乱改, 哪些地方必须留给我自己来测。那整个制定目标的一个价值不是让 ai 瞬间变得聪明,它的价值是把一个复杂的任务变成一个可以执行,可以反馈,可以验收的一个工作流。这一点对普通人也非常的重要,因为你不一定要会所有的技术细节嘛,但你至少要学会我如何定义目标, 如何把这一个目标定义成它已经完成了,是不是?那这一次最关键的能力,除了刚刚我们说到的这个 computer use, 我觉得这是 codex 里面我最喜欢的功能之一,它给模型的不是更多的一个文字,而是给模型的一双眼睛和一双手。以前模型最多跑测试看日子,但桌面 app 有 没有真的打开,页面有没有白屏,整个按钮有没有错位, 这些以前都需要人去看去反馈,那完全可以通过 codex 的 computer, 让他自己去观察整个页面,然后去截图看对不对,再来回去改代码。那这就把很多原来必须要人工重复验证的东西 接走了一部分。注意我这里说的是只接走一部分,不是全部。这个边界要把握清楚,因为有的交互体验和功能必须要人来去做决策。当然我觉得真的也没必要去神话这个 codex, 它跟以前爆火的 cloud code 本质上就是一类工具,真正的核心点是如何去构建自己的一套工具链,让它能够在这个 agent 的 环境里面持续去干活。那我这里也分享一下我自己常用的一些插件和 skills。 天马阶段我用的最多的就是 superpowers, 那 如果需要设计 ui, 我 最近用的比较多的是 design test 这个 skills, 那剪辑视频,最近用 happy friends, 还有个 web video, 还有一些是我自己平时沉淀下的 skills。 另外现在获取信息真的非常的简单,大家可以根据自己所在的行业工种,利用 ai 找到很多适合自己的一些插电 skills。 相信我真的有很多很多热心人在 github 上 去开源他们的一些 skills 和经验,同时也欢迎大家来体验一下我这个开源项目 c c 杠。哈哈,那下面我们就聊一聊这个 codex, 它整个的一个使用成本情况如何?我三十天大概用了一百一托根, 那我现在订阅的话是 pro 二十 x 这个档位价格是两百刀,对于我来说这个价格也还行,不贵。那如果这个一百一托根,如果按照 api 计费,你得花一万多刀,如果觉得贵的朋友也没有关系, 你可以使用 codex 配合 cc switch, 你 可以使用各种国产的模型,比如说 deepsea 呀,字谱啊,千维啊, mini max 啊, kimi 这些都可以。那教程我就不在这里分享了,基本上就是开箱即用,你搞一个 cc switch, 它里面的指导文档写的非常的详细,最后我们收回来,那普通人该学的其实完全不是那一套 提示词,也不是追各种工具名。那就三件事情,我觉得第一个你要把目标讲清楚,就你要做的事情,你要至少要清楚,非常清楚。第二个,你得让 ai 如何知道,要把这个功能写清楚,就是验收。第三个,不要盲目的相信 ai 所说的完成, 你要看证据,比如说我比较喜欢用的开发桌面的话,我在远程的时候我会让他给我截各种图,我要看他到底是不是真的给我去做。这些事情的核心就是你能不能把你的任务讲清楚, 把如何完成定义清楚。那最后那就是最重要的,在这个 a s 来说,再多没用,即使我给你教再多,或者给你科普再多的工具都没用,大家一定要行动起来,就有太多太多的工具和资源都在等着我们去用。 ok, 那 这就是这期视频所有内容了,我撒娇,我们下期见。

一分钟教会你怎么用扣带子剪辑自己喜欢的风格视频看一下。你看,我直接的把内容丢给他,先让他去反推我的内容。 你也可以把别人的你喜欢的博主的剪辑风格的视频丢给他,然后输入这句话,反推一下这条视频怎么来的。 ok, 接,他就会自动的帮我们反推。结论,看到没有?全部全部全部好, 拆的不够细,让他拆的更细一点,他会自己又自动去学习。啵啵,全部就出来了,特别的多,我们根本就不用看懂这些东西,不用去管对的还是错的,什么都不用管他。 ok, 接下来他学习完了,只需要把我们准备好的素材告诉他地方和位置, 然后交给他,按照这个剪辑思路怎么怎么样,全部把无碍又丢给他。他花了十三分钟的时间就帮我们完整的 找出来了。你看,首先第一个,他会先看我们的主素材,再去看我们的素材的内容到底有哪一些,然后再进行啊一些配图,最终出来的效果。你看,他会给我们些样板, 所以真的太聪明了,就是 codex, 它可以自动的把我们想要的想法告诉他。现在你用 ai 就 跟他许愿一样的啊,你看,直接就给我们出来内容出出出出出,你看,剪辑了一版思路,推荐用这个看一下效果,直接打开看看, 哇,所有的全部都是他做的,我把所有的整个流程变成了一个完整的 skill。 如果你也想用这个 skill 的 话,评论区扣 skill。

今天我们来讲讲大名鼎鼎的 codex, 相信大家都已经听说过这个软件了,这是 open nai 的 核心产品,对标 osarpic 的 cloud code。 codex 能做的事情非常多,它不仅能够帮你编辑代码、排查 bug、 执行测试,还能管理 gate、 操作浏览器,甚至能直接控制电脑完成各种任务,非常强大。不过功能越多,越容易让人抓不住重点,所以这期视频我会带大家系统性地过一遍。 codex 最核心的功能,帮大家建立起一套完整的使用思路。 整个视频一共分为三个部分,第一部分是基础篇,主要带大家快速上手 codex, 并讲解一些核心配置和使用过程中容易踩坑的地方。 第二部分是进阶篇,重点介绍版本控制、绘画管理,以及如何更高效的组织和推进开发任务。第三部分是扩展篇,我们会看看如何通过 plugin、 skill、 automation 和 mobile 等功能进一步扩展 codex 的 能力边界。 所有的功能点和对应的时间戳我都打到目录上了,大家可以按需跳转。好话不多说,我们现在开始。 首先我们要做的是把 codex 安装到电脑上面,我们可以打开这个页面,点击这里面的下载按钮,就可以下载 codex 了。下载好了之后,我们来打开它。安装过程呢,跟其他的普通软件一样,比如我用的是 micros, 那 直接把 codex 拖入到 applications 文件夹里面就可以完成安装了。 安装好了之后,我们来打开 codex。 打开 codex 之后呢,它首先会提示我们登录,它一共给了我们两个选项。 第一个呢是使用叉 gbt 账号登录,这需要你订阅叉 gbt 的 套餐。叉 gbt 呢,它提供了多种套餐,其中最常用的是我屏幕上面显示的这几个,主要是包括免费版 go 套餐、 plus 套餐和 pro 套餐。 你看屏幕上面的这几个套餐,从左到右价格越来越高,当然整体能用的 codax 额度也是越来越大的。 从目前来看,免费版和购套餐的 codax 额度应该差不多,但到了 plus 套餐,额度就会有着明显的上升, pro 套餐自然就更多了。 值得一提的是,即使你用的是免费版,系统也会给你一定的 codex 额度,只不过这个额度少的可怜,只能勉强够你施个水。所以如果你想真正上手体验一下它的能力,我建议你先订阅 plus 这个 plan, 它是二十美元一个月,可用量呢比较适中。 除了订阅套餐之外, openni 还提供了另外一个选项来使用 codex, 那 就是直接接入 api, 对 应的就是这里的 signing another way, 点击之后,它会提示你输入 openian 的 api key。 一 般来说,用 api 没有订阅套餐划算,而且呢,获取这个 api key 的 门槛也有点高,一般需要一张海外的信用卡,所以我建议大家还是订阅套餐来使用 codex。 具体的登录过程呢,我这里就不显示了,大家可以在这里选择适合自己的方式登录。登录好了之后,大家首先看到的就会是这样的一个界面, codex 首先会询问我们是干什么工作的,这里大家就按照实际情况来选就可以了。然后 codex 会提示把 cloud code 和 cloud co work 相关的配置都导到 codex 这里,我们先跳过,然后 codex 提示我们要不要试用 codex 手机版,我们点击这个 set up later, 待会儿呢,我会给大家演示这个功能,所以现在先不着急,现在呢,我们就算是正式的来到了 codex 操作界面,可以开始使用它了,我们来随便跟它打个招呼,看看能否正常使用, 可以看出 codex 已经可以正常使用了。下面我带大家做一个代办软件,并且在做这个代办软件的过程中为大家讲解 codex 的 各个功能点。首先我们要新建一个目录来存放我们的软件代码,让我们打开访答,在这里创建一个新的文件夹,就叫做马克笔记吧。 然后回到 codex 这里,点击 work in the project, 再点击 use an existing folder, 在弹出的对话框里面选择我们刚刚创建好的文件夹,然后再点击 open, 然后呢,你就会发现 codex 把项目目录改成马克笔记了, 这就代表 codex 后面会把代码放到这个文件夹里面。此时我们准备工作就已经是做完了,可以开始提需求了,比如说我们的需求就是使用 html 写一个笔记软件,软件界面分为左右两部分,左边是笔记列表,右边是笔记的内容, 最后我们提醒他注意做好测试,然后回车提交,这个时候呢, codex 就 会开始工作了,可以看出他在疯狂的给我们写代码,当然实际使用是没这么快的,因为为了节省大家时间,这里我做了加速,后面的问答流程呢,也都做了不同程度的加速处理,这个呢,大家知道就好了。 好, codex 暂停了,他提出他想要构建一个本地服务器来验证 html 笔记的效果。这里呢有三个选项,第一个选项是 yes, 这个呢很好理解,其实就是把这个本地服务器启动开就可以了,不过以后如果 codex 提出类似的请求,我们还得再授权一次。 第二个选项呢,是代表我们不仅同意,而且对于这种启动本地服务器的代码,以后呢也就直接执行就好了,不需要再经过我们授权了。第三个选项可以理解为不同意,它其实不是一个按钮,而是一个输入框, 我们点一下就能看出来了。在这里我们可以告诉 codex 自己希望的处理方式,比如只让它检查代码,不要启动本地服务器之类的。当然,如果你不同意,而且你懒得告诉 codex 原因的话,也可以直接点击这里面的 skip 按钮啊,这算是 codex 做了弱化的第四选项了。 好,所有的可选项我们都说完了,在这个地方我们就选择第一项 yes 就 好了。然后呢, codex 就 询问我们能不能访问这个新创建的本地服务器,这个地方呢,我们也同意, 呃,现在 codex 已经彻底完成它的工作了,可以看出这里面最重要的文件呢,就是这个 index html, 我 们可以点击来预览它的效果。 这个呢就是 codex 写的笔记软件了,看起来中规中矩,各种基本功能呢,在这里面都能找到。当然有些人可能觉得这个预览区太小了,想要放大一点,这当然是可以做到的,让我们来点击这个按钮, 这样左边的区域就被收起来了,可预览的空间就更大了,不过下面的这块区域看着也是有点碍事,能不能隐藏它呢?其实也是可以的,我们可以点击这里面的三个点, 然后选择其中的 hide composer 就 好了,你看这样呢就好多了。那假如说这个时候呢,你看着界面里面的这两条笔记,觉得非常碍事,你想把它们去掉, 呃,这个呢,其实也是很简单的,我们就继续追问就好了。既然要追问,我们就必须要把左侧栏再次显示出来,这个呢其实很简单,我们再点一下这个按钮,左侧栏就显示出来了。 然后呢,我们就可以在输入框里面输入我们的问题,把左上角的两条笔记去掉,这个呢肯定是可以的。 呃,不过我这里想给大家演示另外一个方法,另外一个更加准确,更加方便的方法,我们可以点击这个图标,它叫做 annotation, 然后我们就可以直接选中两条笔记这个区域,选中后,输入我们对这个区域的修改意见,很简单,我们的意见就是两个字,去掉, 然后我们提交请求。好,可以看出请求已经成功提交上去了,可以看到他一共是发了两块内容,一个呢是对应的截图,另外一个呢就是我们具体的要求了。 接到了这个请求之后, codex 就 开始工作了,他应该呢就会把这块区域给去掉,让我们稍微等待一下。 好, codex 已经完成了,我们再次打开这个阅览区,看一下效果, 可以看出之前的这块区域呢,确实是没有了, codex 已经帮我们解决问题了,看起来 entity 这个功能还是非常方便的, 那这个时候我们可以再随便点点这个笔记软件,看看有没有其他我们需要修复的问题。这里好像确实有个 bug, 我 点击这个加号按钮的时候,下面呢是要增加一个新的笔记的,但实际上点了之后并没有任何的 bug 呀。让我们跟 codex 说一下这个问题, 我们需要告诉 codex, 点击添加按钮之后,笔记列表区域没有任何的反应。呃,请排查下原因,我确定之后再进行修改 好。 codex 已经排查完了,按照我们的要求,他没有直接去改代码,而是先给出了诊断结果。他猜测呢,这个问题大概率是因为当前页面的 local storage, 也就是本地存储被禁用了。 没错,就是这个原因。说白了,就是 codex 的 右侧预览区有一些安全限制,导致某些功能无法正常使用。如果我们到独立的浏览器里面用一用,问题立马就消失了,不信我们试一试。 你看这个时候再点击添加按钮是不是就完全正常了?既然用户是在真实的浏览器里用我们的软件,而不是在 codex 的 预览区里用,那这根本就不算是个问题,自然也不需要修。 我不知道这算是 codex 的 一个 bug 还是一个 feature, 我 相信 openai 是 把它当成 feature 来做的,不过实际用下来确实有点像 bug。 如果你做的也是外部应用,那一定要额外留意这一点,别被预览区给骗了。既然弄清楚了原因,为了避免再受限制,我们后续就在独立的浏览器页面里面进行测试了。 到这里,这个最基本的笔记软件就算是成功跑通了。现在我想回头聊聊刚才遇到的一个细节,就是 codex 提出的那个请求。 呃,有些同学可能会想,如果我把任务交给 codex 之后去忙别的了,没注意到他在等我授权,那 codex 岂不会一直卡在那里等我回来一看啥也没干,白白浪费了大量时间。 那这有没有办法让他自己做决定,别总是来问我呢,毕竟谁也不想一直盯着他干活,那也太累了吧。没错,一直盯着看呢,确实是非常的麻烦。其实 codex 早就替我们想到了解决办法,就在输入框的下面,大家看这里面呢,一共是有三个全线选项。 第一种就是我们刚才用的 default permissions, 在 这种模式下,如果 codex 需要修改项目目录之外的文件,或者是需要执行一些带有安全风险的命令,它就会老老实实地弹出提醒,只有当你点头同意了,它才会继续接着往下干。 这种模式的优点呢是绝对安全,一切尽在掌握,但缺点也非常明显,就是根本离不开人,你得随时给他授权。 第二种呢是 auto review, 也就是自动审查。这个模式呢很聪明,它引入了一个专门负责安全审查的 agent, 当 codex 准备执行操作的时候,这个 agent 会首先替你把关,安全的直接放行,危险的直接拒绝,只有在极少数连 agent 也拿不定主意的情况下,才会弹窗让你来做决定。 第三种呢是 full access, 顾名思义,这个呢就是放飞自我模式,全部自动同意, codex 想干嘛就干嘛,完全不需要你插手。 这个模式确实是最省心的,但也伴随着风险,万一它误删了什么重要数据,你是拦也拦不住的。虽然 gpt 模型总体上还是非常靠谱的,基本上不太会乱来,但是作为一个负责任的 up 主,我还是要提醒大家,这个模式呢,没有任何的安全,交易开启前一定要三思啊。 所以综合看下来,在这三个模式里面, auto review 是 在效率和安全之间平衡的最好的。为了避免后面频繁弹窗,要我们点同意,接下来的演示呢,我们就统一的切换到 auto review 模式。 既然聊到了这里的权限配置,我们不妨顺便看一下输入框旁边还有哪一些配置。首先大家留意这里面显示的五点五 medium, 这代表我们当前使用的是 gbt 五点五模型,思考深度呢为 medium, 也就是中等。 我们点开它可以看到思考深度呢是可以自由调节的,分为 low、 medium high 和 extra high 四个级别。思考深度越高, codex 花费的时间也就越长,消耗的 token 呢也就越多,但通常给出来的代码质量也会更好一些。 除了调整思考深度,我们还可以在这里面切换模型下来。列表里面除了 gpt 五点五,还有 gpt 五点四等等一系列的模型,大家可以根据具体的任务难度来灵活选择。 最后啊,这里面还能设置模型的输出速度,目前是 standard, 也就是标准的速度。旁边呢还有一个 fast 选项,开启 fast 模式之后生成的速度呢会提升到原来的一点五倍,不过代价呢是 token 的 消耗量也会相应的增加,具体增加多少取决于你用的模型, 比如说在 gbt 五点五这个模型下开启 fast 模式的话, toc 的 消耗量就直接是标准模式的两倍了啊。如果你财大气粗, toc 管用,那你完全可以开启这个快速模式,这样 codex 干活就更快了。 输入框的配置我们就先研究到这里,现在我们的第一版笔记软件已经跑通了,实现了最基本的功能,不过为了防止后面新加功能的时候把代码搞乱,我们最好先用 get 把当前的版本保存一下,这样的话就算是后面出了什么叉子,也能够随时回滚到这个可用版本。心里有个底, 在 codex 里面调用终端非常的方便,我们不需要去点什么菜单,直接按下快捷键, command 加 j, 大家看右侧的终端面板就直接弹出来了。在这里面我们依次输入几条常规的 get 命令, 首先是要执行 get in it, 点把当前的项目目录出示,化为一个 get 仓库。然后呢我们要执行的是 get id, 点把相关的文件呢都添加到暂存区里面。最后呢再执行 get commit 提交我们的第一次修改 好这三步敲完之后,我们的代码就有了一个安全的备份版本,接下来我们就可以放心大胆地继续迭代我们的产品了。 终端用完之后,为了不挡着视线,我们只需要再次按下同样的快捷键, command 加 j 就 能够把它直接关掉。你看用快捷键来开关终端,双手完全不需要离开键盘,整个过程呢非常的丝滑,也是非常的方便。 那现在我们用 codex 做了一个基本可用的笔记软件,而且还用 get 提交了这个可用版本,下面呢,我们就来继续迭代这个笔记软件,让它变得更强大,更美观。 假设这个时候你看了看这个笔记软件,觉得它的色彩设计不是很好,这里面有很多的绿色元素,你不太喜欢绿色,你想试试蓝色怎么样?那这个时候该怎么处理呢?很简单,你就直接在这里面追问就好了,比如我们可以这么提要求, 不过我们先不发送这个请求了吧。啊?为什么呢?你仔细看看啊,我们上一个消息里面还让 codex 排查问题来着, 但说实话,这其实并不是一个问题,只是 codex 的 浏览区有些限制而已。如果我们继续追问的话,这个排查过程不仅会占用模型的上下文,而且可能还会对 codex 后续执行产生一些影响, 他没准会继续尝试修复这个问题,把原来没有问题的页面修出问题来。虽然这种情况发生的概率应该也不会很大,但是能规避的话就尽量规避吧,毕竟这个消息其实一点用也没有。 所以我们该怎么办呢?有一个办法,那就是直接修改上一个消息就可以了,你看这里面有一个编辑按钮,我们点一下就可以直接修改这个消息了,我们来试试 提交。你看原来的请求被替换成了我们的这个,这样的话,原来排查问题的那个消息呢,就消失了,既然消失了,它就不会再占用模型的上下文了,也不会对 codex 后续执行产生任何影响, 所以很多情况下,这个功能还是很实用的。不过要注意的是, codex 只支持编辑最后一条消息,至于更靠前的那消息,它实际上是不支持我们编辑的。 前面的那些消息呢,都是没有编辑按钮的,如果你要编辑更靠近的消息,可以考虑使用 fork 功能来间接实现这个功能。我们后面会讲到,暂时你不必过于关心好。 codex 已经完成任务了,我们来看看效果。 呃,还可以吧。下面呢,我们把这一部分的改动也加入到 get 里面。之前我们是用命令行来操作 get, 这种操作方式准确通用,不过其实 codex 也内置了一些 get 操作的功能来供我们使用。比如我们可以先点击这个图标, 这里面呢就有一个叫做 environments 的 区域,它呢就跟 get 的 使用密切相关。我们可以点击这里面的 changes 按钮,然后再在这个选择框里面选择 on stage 的 选项。这里显示的就是所有还没有提交到暂存区的代码了, 这基本上也就是 codex 刚才所做的改动。如果你觉得哪一行有问题,可以点击旁边的加号,输入你的要求。输入完要求之后,你可以点击这里面的 comment 按钮,让 codex 做出相应的改动。不过这里我们就不做任何修改了, codex 的 任务已经完成的很好了,所以我们取消这个注示, 直接使用 git commit 提交这次改动。那具体该怎么做呢?很简单,直接点击这里面的 commit 按钮,输入 commit 的 message 就 可以了。我们的 commit message 就是 将整体色调改为蓝色,然后呢,再点击 continue, 此时 codex 就 会提交当前所有没有提交的改动了。 好,执行成功了,我们来验证下。先按一下 command 加 j 来到终端,然后再执行 git log, 查询 git 的 commit 记录。 你看,我们的 commit 确实是生效了,确认好了之后,我们按 q 退出 get log, 然后呢,再按 command 加 j 来隐藏终端,到这里,这个需求就算是彻底完成了。那假设这个时候你感觉蓝色这个主题也不怎么好看了,越看越不顺眼,要不再换一个吧。 没问题,我们直接提交需求,将整体色调改为紫色。改完之后呢,再做一次 get commit。 对, 这次我们不自己操作 get 了,有点麻烦,直接让 codex 操作得了。提交之后, codex 就 开始干活了,我们稍微等待一下, 改好了,我们来看看最后的效果。不错,确实改成紫色了,不过怎么说呢,啊,你觉得还是不顺眼啊,你在想,算了,我要不还是改成一开始的那个绿色吧。那这当然是可以的, 照例啊,你可以直接在输入框里面输入,你的要求就是改回来的紫色。这个呢,肯定是行的,只不过这样的话,模型还得再跑一遍,有点浪费 token, 所以 我们就不用这个方法了。 其实我们原来就是绿色,所以用 get 把代码回滚到绿色的那个版本就可以了。只不过这种做法其实也是有点缺陷的, 代码确实是回滚了,但绘画内容还是停留在紫色这里。如果我们希望在当前这个绘画继续问的话, codex 可能会以为目前所用的色调是紫色,从而对后续的任务执行效果产生负面影响。 那我们能不能把绘画和代码同时回滚呢?我们就想回滚到改蓝色之前的那个版本,也就是这个版本,如果有回滚功能的话,那应该是在这个消息旁边有一些相对应的标识吧,我们找找。 哎,还真的有一个图标有点像,不过它不叫回滚,它叫做 fork。 fork 的 意思就是基于当前的这个绘画,再复制一个新的出来,这个新绘画就只到目前所选的这个消息为止,后面的消息全都不保留, 这个呢就非常符合我们的要求了,我们其实就希望绘画到当前的这个消息为止,那既然绘画变了,代码是不是也会自动回滚呢?没准也是可以的,我们来试试。 我们首先点击这个 fork 图标,这里弹出两个选项供我们选择,一个是 fork into local, 另外一个呢是 fork into new work tree。 这两个选项的最大区别在于新绘画的代码存放地址不同。 第一个选项会继续使用当前目录作为新绘画代码存放地址,第二个选项会创建一个新的目录来存放心绘画的代码。你可能现在听的还是有点懵啊,没关系,我来演示一下你就知道了。在演示之前,我们先把左侧栏打开,这样你就会看得更清楚一些。 好,左侧栏打开了,我们来重新点击一下这个 fork 图标,然后选择第一项 fork into local。 可以看出 codex 确实给我们创建了一个新的绘画,并且还在这里标识好了,这个绘画呢,就是从别的绘画那里复制出来的。下面我们来看看代码是否也会滚了, 这个很简单,我们不必看代码,我们直接看最终的效果就行了。让我们来看看页面的颜色有没有改变,可以看出页面的颜色仍然是紫色,所以呢,代码根本就没有回滚。没错,这呢就是 fork into local 这个选项的特点,它只会处理绘画内容,根本就不会对代码做任何修改。 不过还好,我们使用了 git, 我 们可以用 git 来回滚代码。我们先按快捷键 command j, 打开终端,然后执行命令 git log 确定我们想把代码回滚到哪个 commit 上,应该就是这个了。然后呢,我们复制这个 commit 的 哈希值, 最后执行这个命令。这样呢,就可以把代码回滚到绘画对应的那个版本了。让我们回到浏览器这里刷新一下页面, 没错,确实是一开始的绿色版本了,当然绿的也不是很明显啊,只有那么几个模块是绿的。我对这个色调的表述呢,稍微有点问题,但无论怎么样,肯定是回滚成功了,相信大家都能看得出来,这个呢就是 fork into local 了,我们配合着 git, 才能把绘画和代码都回滚到之前的那个状态。 那刚才还有一个选项叫做 fork into new work tree, 那 个选项是用来干什么的呢?我们不妨来试试。让我们回到之前的绘画里, 点击这个 fork 图标,然后再选择 fork into new work tree。 注意看, codex 依然给我们创建了一个新的绘画,而且跟 fork into local 很 像。这个新的绘画呢,也标识出来了,它就是从别的绘画里面复制过来的。 一切看起来似乎都跟那个 fork into local 差不多啊,那到底什么发生变化了呢?答案就是我们当前的这个绘画所对应的项目目录发生了变化,不信我们来打开终端,输入 pwd, 这个命令就是用来显示当前位置的,可以看出我们的当前位置呢,就是这个了,我一开始 fork 出来的那个绘画可不是在这个目录里面操作的,不信的话,我们回到一开始 fork 出来的那个绘画里,同样打开终端, 运行下 pwd, 你 看它俩的项目目录地址是不同的,我把这两个地址打在屏幕上,这样大家就可以看得更清楚一些。 这个呢,就是 fork into new worktree 的 一个特性,它会给 fork 出来的新绘画创建一个对应的新目录,这样新老绘画所处理的代码不是一份,彼此之间互不影响,非常适合在两个绘画分别处理两个不同的功能点,最后做完了再合并到一起就好了。那为什么叫做 worktree 呢? 是因为它是使用 gitworktree 来实现的,这个呢,是 git 的 一个特性。这个要展开讲的话呢,又得讲好几分钟。我们本期是来讲 codex 的, 不是来讲 git 的, 所以呢, gitworktree 在 此就跳过了,感兴趣的同学可以自己查下。 另外值得一提的是, fork into new worktree 同样不会回滚代码,它只是把当前项目目录里面的所有代码复制到一个新的目录里,仅此而已。 好,这个就是 fork 的 两种形式了。总结一下,这两个选项都会复制绘画到所选消息为止,也都不会帮你回滚代码, 它们唯一的区别仅仅是代码的位置, local 呢,是继续沿用原目录,而 new work tree 呢,则是开辟了一个全新的隔离目录。主要呢,就是这个区别了。所以呢,无论是哪一种 fork 形式,都不会更改代码。实际上 codex 在 界面里面也有显示, 我们可以回到一开始的那个绘画。然后呢,再点击一下这里面的 fork 图标。注意到这段话了吗? 其实它想表达的意思就是 fork 只负责对话,不回归代码。对,它说的有点绕,但其实就是这个意思。 好, fork 功能我们终于讲完了,我们目前只需要第一个 fork into local 的 这个绘画,另外一个 fork into work tree 我 们暂时不需要。那我们能把这个绘画删掉吗?能, 不过准确来说啊,我们可以把这个绘画规章,规章和删除稍微还是有些区别的,你可以把规章理解为暂时隐藏起来了,而删除呢,那就是删完就没了。我们来试一下, 我们直接点击绘画旁边的这个图标,然后再点击 confirm, 这个绘画就被规范了。你看这个绘画是不是没了。但跟删除不同的是,我们还可以找回这个绘画。 我们先按 command 加逗号,打开设置面板,再点击里面的 archives chats, 在 这里我们就可以看到所有被规章的绘画了。我们可以解除对应绘画的规章状态,也可以彻底删除对应的绘画。所以你看,删除和规章还是稍稍有些区别的。 那规章这个功能我们就讲到这里,从之前的操作过程中我们可以看出, get 真的 还是挺重要的。那既然这么重要,我们能不能让 codex 每次写完代码的时候都能自动提交一次 get commit 呢,这样的话就不用麻烦我们每次都操作一遍了。 这当然是可以的,其中一个方法就是我们可以直接在输入框里面告诉 codex, 每次完成代码修改之后,都需要提交一次 get commit, 然后提交这个请求就行了。这样在后续的操作里面, codex 肯定就会按照我们所说的,每写完一次代码都提交一次 get commit。 不 过这个方法有个很大的缺陷,那就是它只会在当前的绘画中生效,如果我们创建出一个新绘画的话,那 codex 就 会彻底忘掉这个事情, 所以我们需要一个能够跨绘画的解决方案,即使是在一个新绘画里, codex 也能帮我们做 get commit 这个事情,这能做到吗?当然是可以的,这个呢就是 agent 点 m d 这个文件发挥作用的地方了。 agent 点 m d 简单来说呢,就是一个放在项目根目录里面的配置文件,每当 codex 开始一个新绘画的时候,它都会自动读取这个文件,把里面内容当成对自己的指令来执行, 所以我们只需要在这个文件里面写上这个 git commit 的 要求,那无论我们开多少个新会话, codex 都会记住这件事情的。我们先把原来的这个请求删掉,我们不需要它了,然后我们点击这里使用 vs code 打开这个项目目录, 在根目录下创建一个新的文件,就叫做 agent 后台,然后在这个文件里面写,每次完成代码修改后,都需要提交一次 git commit, 这样 agent dmd 就 创建好了,让我们把 vs code 关掉,现在让我们来验证一下 agent dmd 是 否真的会生效。我们首先创建一个新的绘画, 然后提交需求,往左下角增加一个主题切换选项,支持用户在浅色模式和深色模式之间切换。回车提交,让 codex 开始工作。 好, codex 已经完成了,我们来看看效果。 你看,左下角确实是出现了一个主题切换按钮,我们点击对应的主题,就可以在浅色和深色两种模式之间切换,看起来非常完美。那我们现在最关心的是, codex 有 没有帮我们做 get commit 操作呢?我们按一下 command 加 g, 打开终端执行 get log 来看看。 你看,这里面确实是多了一个新的 commit message 呢,就是 codex 自己写的,这说明 agent 点 m d 确实生效了。即使是在一个全新的绘画里面, codex 也遵从了我们的要求,在完成了代码修改之后,自动提交了一次 git commit。 这个呢就是 agent d m d 的 基本用法了,当然他能做的事情远不止这一件,比如你可以在里面规定代码风格、命名规范、技术占要求,甚至是你的项目背景介绍等等。 codex 每次启动新会话的时候都会去读取这些文件,这样他对你的项目就会有非常好的理解,给出的结果呢也会更加准确。 可以说, agents dmd 写得越好, codex 就 会用起来越顺手。不过需要注意的是, codex 只会提交当前需求所对应的代码改动。我们一开始创建的 agents dmd 不 属于当前需求的范畴,所以呢,刚才 codex 并没有把它提交为一个 git commit, 我 们点击这个 changes, 再选择 on stage, 就 可以发现 agents d m d 的 内容呢?还没有提交上去。没事儿,我们这就提交。我们先来点一下这个 commit 按钮,然后在里面输入对应的 commit message, 再点击 continue, 这样这个改动就会被提交到 get 上面了。好,一切顺利,让我们新开一个绘画,继续迭代这个笔记软件。 现在这个软件本质上就是一个 html 文件,只能在浏览器里打开,不够方便。我们想把它改造成一个真正的桌面客户端,让用户可以直接双击图标打开,就像打开 vs code codex 一 样。 那要做桌面客户端的话, electron 是 非常主流的一个选择,我们可以顺便呢也引入 react 和 type script, 把项目结构整理一下,方便后续继续迭代。那我们就直接把需求发给 codex, 把这个网页应用改成桌面客户端,进入站使用 electron 加上 react, 再加上 type script。 注意做好测试,确保所有的核心功能运转正常 啊。不过要注意这可是一个大工程,所以呢,我们最好先让 codex 做一个规划,我们确认规划没有问题之后,再让它动工。为了实现这一点,我们可以点击这里面的加号,然后选择 plan mode, 这样 codex 就 进入了计划模式,从这个图标也可以看出这一点。 在这个模式下, codex 会先做计划,再写代码,让我们来提交试试。可以看出 codex 开始工作了,让我们稍微等待一会。 好,他现在要问我们几个问题,我们来做一下选择。首先是数据要放在哪里,我们就放到文件里面吧, 然后交付到可开发运行的程度就可以了。这之后呢, codex 就 会继续开始干活了。好,可以看出 codex 开始给我们写这个计划了, 我们再稍微等待一会,它还在这个转写的过程中。 好,写完了,我们来看一下,这个计划本身还是比较完善的。呃,包括各种测试方案呐,架构设计啊,都是写的比较详细的。然后 codex 问我们是不是要按照这个计划去实现代码。 呃,他一共是给了我们两个选项,第一个选项呢就是直接同意啊,开始实现这个计划就好了。第二个选项呢是如果你对这个计划不满意的话,你可以提出你的要求,在这个文本框里面告诉 codex 应该如何做修改,然后 codex 会根据这个修改呢,再出一份新的计划。 呃,这里面呢,我们就不对计划再做一些其他修改了,我们就直接同意好了,让 codex 就 按照这个计划给我们来写代码。 好,现在 codex 开始干活了,我们需要稍微等待一下,在等待的过程中呢,我们可以跟 codex 随便去聊点东西,我们可以在输入框 side 打开 side chat 啊,在这里面呢,我们就可以随便问 codex 点别的问题,这些问题呢不会去影响左侧 codex 的 任务执行。比如说我们可以问一下,你觉得这个笔记软件还需要什么基本功能呢?提交 好 codex 呢,给了我们一些可行的方案。你看在 side chat 的 过程中, codex 左侧的任务执行一点也没有被干扰到。对,这个呢就是 side chat 的 一个非常重要的特点了,它就是允许用户在 codex 执行任务的过程中问一些比较轻量级的问题, codex 在 回答这些轻量级问题的过程中不会影响到左侧主任务的执行。那这个就是 sign chat 这个功能的特性了。这个呢,我们就先讲到这里,这个架构改造的工作量还是挺大的, codex 依然没有完成,让我们再耐心等待一会儿。 好,看起来 codex 已经完成任务了,它提示我们使用 npm runtime 这个命令就可以启动这个 electron 应用啊,让我们来试一下。首先按 command 加 j 打开终端,然后执行命令 npm runtime 回车, 这样的话这个 electron 应用就启动开了,不过看起来好像是有点问题,基本上是一个白屏的状态。呃,我们打开控制台看一下有没有什么报错 啊,确实有报错,这个呢,我们需要让 codex 帮我们来修一下啊,让我们来回到 codex 这里, 先把这个进程关掉,然后呢再把终端关掉,然后我们提出我们的诉求,启动后白屏控制台报错了。看来你之前的测试不够彻底啊,请你修复并确保在修复之后测试好再交付给我。 codex 说,我说的对,哼。呃,让我们等 codex 把这个错误修复之后再试一次。 呃,看起来 codex 已经修复好了,我们来看一下它修复后的效果是怎么样的。呃,同样,我们打开终端,然后执行这个命令 啊,这次呢,看起来没问题了,添加笔记呢也是可以的,我们呢也可以在这里面随便输入的标题内容都可以啊,主题切换也是没有问题的。 那看起来已经很完美了,各项功能都运转正常。让我们再回到 codex 这边。 呃,我们先按一下 ctrl 加 c, 关掉这个进程,然后呢,再把终端收起。好,那改成了 electron 架构,我们就继续来提新的需求。我们的新需求是为这个笔记应用增加 markdown 支持,具体来说,需要在编辑器右上角提供两个模式切换按钮。 那假设这个时候我想换行,怎么做呢?直接按回车肯定是不行的,按回车就提交了,正确的做法是按 shift 加回车。你看这样呢,就可以回车了。我们继续输入任务内容, 首先是编辑模式,显示所有文本内容,并对其中的 markdown 语法进行高亮显示。然后还有一个是预览模式,它用于显示 markdown 的 渲染结果。现在再回车。 好,可以看到 codex 开始工作了,在它工作的间隙,我们再创建一个新的绘画,让它再处理另外一个关系不大的任务。 我们的新任务就是给这个笔记项目生成一个 logo, svg 格式。可以看出这两个绘画都在工作中了。假设这个时候你突然想到了我们的笔记软件有深浅两种模式,这个 logo 需要在任意一个模式下都清晰可见。我们最好提醒一下 codex, 以免它忘了, 好让我们发送请求。不过这个请求似乎没有发出去,它似乎卡在这里了。没错,在默认情况下,只有当上一个请求完成后, codex 才会继续处理下一个请求。 不过到那个时候就有点晚了吧,毕竟 logo 都生成好了。我们能不能现在就把这个信息发送给 codex, 让它在生成 logo 前就注意到这一点呢? 没问题,注意到这里的 steer 按钮了吗?点一下,我们的请求就会立即发送给 codex, 这样我们的目标就达到了。那 codex 现在还在运行中,我们稍稍等待一会儿。 好,可以看出 logo 已经生成完毕了。我们切回到原来的那个绘画,看看它的进度怎么样了,它还在运行中,所以我们可能还需要再稍微等那么一会儿。 好,这两个任务呢都完成了,我们来直接打开软件,看看最终效果。首先是要打开终端,然后呢,我们运行 n p m start, 打开这个 electron 应用。呃,看起来好像是有点问题啊。 logo 没有被成功地加载起来, 那我们需要跟 codex 说一下这个事情,让我们先关掉这个 electron 应用。 然后呢,我们关掉这个 electron 进程,先看看这个 logo 在 不在 啊?这个 logo 确实是在 public 文件夹里面的,那应该不是文件不存在导致的。那是不是这个 svg 文件的格式有问题呢?我们来到访达来验证一下。 打开这个 public 文件夹,看来这个 svg 文件的格式也是没有问题的,毕竟访达都正常渲染出来了。 那大概率是 electron 加载这个 svg 文件的方法有问题。让我们来让 codex 修一下。首先按 command 加 g, 我 们唤起这个绘画列表,然后选择生成 logo 的 那个绘画, 然后在这里面我们输入具体的问题, logo 没有显示出来。提交好,提交之后呢, codex 就 开始给我们排查原因了,我们再稍微等一会儿。 修复完毕,我们再次启动这个软件看看效果。 首先打开终端,运行 npm start 好, 这次看起来 logo 是 成功的显示出来了,我们还可以随便点一点其他的功能,看看整体是否运转正常。 那 markdown 呢?我们可以随便输入几个 markdown 的 关键词,看一看它的高亮显示是否正常。看起来似乎并没有什么太大问题,各种格式呢,都可以非常正常地显示出来, 可以看出预览也是没有问题的。那这次需求就到这里了,我们再次回到 codex 这里,继续迭代它。 前面我们讲的呢,都是 codex 的 基本能力,下面我们来讲讲 plugging。 你 可以把 plugging 想象成一个 codex 的 外挂,它会给 codex 相应的能力,帮助 codex 去做更多的事情。这么说呢,可能比较抽象,我们可以来实战一下。呃,我们首先可以打开侧边栏, 然后点击里面的 plugins, 在 这里我们就能够看到所有可用的 plugin 了,其中有能控制电脑的,有用于操作 chromed, 还有用于编辑 excel 的 啊,还有一些是用来制作 ppt 的。 如果 plugin 的 旁边打了勾,那代表这个 plugin 已经被安装好了。如果 plugin 没有安装的话,旁边会是一个加号,我们点击这个加号就可以正常安装了。我们来随便点几个 plug in, 看看它内部到底有什么。 比如我们可以点一下这个叫做 gmail 的 plug in, 可以 看到这个 plug in 内部有三个组成部分,其中一个是 app, 两个是 skill。 这个 app 呢,是用来把 codex 和 gmail 连接起来的, 它里面提供了很多的工具,当然 codex 没有叫它是工具, codex 叫它是 action, 但其实本质上啊,这里面就是一个一个的工具,跟 mcp 的 工具呢差不多。 比如 apply labels to emails 就是 用来给邮件打标签的 archive emails 就是 用来归档邮件的。这个 app 一 共是提供了二十四个这样的工具,除了 app 之外,这个 plugin 还提供了两个 skill, 呃,你基本上是可以把 skill 当成是给大模型看的一个说明文档, 比如说是这个 gmail skill, 它就写明了怎么总结邮件内容,怎么赚,写回复,以及什么时候该调用哪一些工具啊等等。 而这个叫做 inbox treeash 的 skill 呢,则是告诉大模型如何给邮件归类的,比如说哪一些邮件比较紧急,哪一些邮件需要回复等等。如果你对 skill 比较感兴趣,可以看一下我的这个视频,把 skill 的 使用方法和运行原理一次讲明白。 gmail 的 这个 app 所包含的内容呢,就只有这三个了,我们如果选择安装 gmail 这个插件,那其实就是选择安装了这三个组件。等到用户想要 codex 操作 gmail 的 时候, gpt 模型便会找到这三个组件,并用它们提供的能力和说明来完成。用户的要求 大致就是这个样子的。我们来看一个具体的例子,比如说是 presentations, 这个 plugging 呢,是用来写 ppt 的, 它只有一个组件,那就是这个叫做 presentations 的 skill。 这个 skill 详细说明了该怎么做才能做出一个高质量的 ppt。 下面呢,我们就尝试用这个叫做 presentations 的 plugging 来完成我们的需求,让我们来新建一个绘画,然后输入我们的要求,给这个笔记软件做一个 ppt, 介绍它的产品设计和技术架构。 提交之后, codex 就 会找到我们前面所说的那个叫做 presentations 的 plug in, 并使用那个 plug in 提供的能力来做 ppt。 当然,如果你担心 codex 找不到这个 plug in, 或者说是找错了的话,你可以明确要求 codex 使用这个叫做 presentations 的 plug in, 这只需要在任务的最前面输入一个 at 符号,然后敲入 presentations 回车,这样 codex 就 一定会使用 presentations 这个 plug in 来做 ppt 了。 不过不加也没关系, codex 会自动找到这个 plug in 的, 所以呢,我们暂时就把它给去掉吧。好,提交,可以看出 codex 开始工作了,我们稍微等待一会儿, codex 写好了,我们打开看看。 中规中矩吧,其中其实还有不少可以改进的地方,不过这已经是一个不错的起点了,我们可以在这个基础上做一些其他的改进。 这个叫做 presentations 的 plug in 并不能算上经验。下面呢,我给大家介绍 open ai 所提供的两个用来镇店的 plug in, 一个呢是叫做 computer use, 用来控制电脑。另一个呢是叫做 chrome, 用来操作 chrome 浏览器啊,我们先来试一试 chrome 这个插件, 让我们来到这个插件管理的地方,然后呢,点击 chrome 旁边的这个加号来安装这个插件, 点击 install 好, 安装好了。然后呢, codex 提示我们需要在 chrome 上面也安装对应的扩展也行。好,那我们就按照它的指示来安装这个扩展。 那一切准备就绪之后,我们就来尝试用用这个 chrome 插件,我们可以直接点击旁边的这个按钮,这样的话, codex 就 可以给我们出实化一个使用当前插件的这么一个请求。呃,我们可以把后面的这个部分给去掉,换成我们具体的请求, 那就是打开 product hunt 首页,然后再找出今天最热门的三个新发布的产品,总结它们各自的特点,并附上对应的访问链接好提交。 呃,为了让大家看得更清楚,让我来把 codex 缩小一点,把 chrome 浏览器放出来,这样的话呢,大家就可以更清楚地看到 codex 到底是如何干活的了。 可以看到 codex 创建了一个标签组,这个标签组呢,专门用于解决我们的问题,然后它在这个标签组里面访问了 product hunt 的 首页,今天最热门的三个新发布的产品就在这里了,相信 codex 也看到了。 可以看到,现在 codex 开始打开另外一个标签页了,这个呢,看起来是第一个产品 brew 的 一个相关网站,然后呢,它又打开了一个。 呃,接下来呢,我们就不管了, codex 估计还会查看更多的网页,我们就在这里稍微等待一会,相信他等会就可以查询全部的产品页面,然后给我们一个比较有效的反馈,让我们稍微等待一下。 好, codex 给我们总结了,这个呢,基本上也就是我们想要的结果了,这个呢,就是 chrome 这个插件的相关使用方法了,让我们把这个 codex 再次最大化。 然后下面呢,我们就来看一看 computer use 这个插件的使用方法,它是用来操作电脑的,同样,我们点击这个加号,然后进行安装, 安装成功,让我们来使用一下。跟 chrome 的 使用方法类似,我们也可以点击 computer use 旁边的这个小图标,这样直接就能开启一个相关的 computer use 绘画。我们先把后面这段文本删掉,因为它跟我们真实的请求没有什么关系。 然后呢,我们再稍微改一下这个请求所对应的目录,我们现在呢是放在马克笔记这个地方,但实际上我们要打的这个请求呢,跟这个项目其实没什么太大关系,所以呢,我们就选择 don't work in the project, 也就是说,这就是我们随便提出来的一个请求,不会去绑定某个具体的项目目录。之后,我们就可以正式输入自己的请求了,那就是请打开我电脑自带的日历应用,帮我新建一个五月二十八日十点的日程标题,叫做讨论马克笔记的后续设计。 没错,就是这样,我们让 codex 操作一下日历这个应用,然后同之前一样,我们把 codex 缩小,把日历这个软件漏出来。这样呢,大家就可以更清楚地看到 codex 是 怎么操作我们这个日历软件的。 好, codex 首先询问我们能不能使用日历这个应用,我们同意, 可以看出 codex 开始行动了,这个呢就是 codex 的 鼠标,它跟我们所使用的鼠标呢,根本是两套,彼此之间互不影响啊。然后 codex 呢就开始操作这个鼠标,去完成我们的需求, 它还需要我们确认一下是不是真的要创建这个日程,这个有点啰嗦,那当然是确认了,我们给它回复一下, 好,看起来 codex 已经完成了我们的要求了,我们来看一下, 看起来这个日程的标题和时间段都是满足我们要求的,那就没问题了,我们再把 codex 最大化。 这个呢,基本上就是 computer use 这个插件的使用方法了。值得一提的是, codex 使用独立的虚拟鼠标,与你的鼠标互不干扰。刚才把日历软件提到前台只是为了掩饰,实际上你完全可以让它在后台默默干活,自己该干嘛干嘛,上网看视频都可以,完全不会耽误。 好, computer use 讲完了,我们接下来就来看看 skill 是 如何使用的。想要浏览 skill, 我 们就必须要先打开 plugins, 然后再点击这里面的 skills, 就 可以看到可用的 skill 列表了。 其实我们之前用 plugin 的 时候已经间接的用过 skill 了,因为无论是 presentations, computer use 还是 chrome, 这几个 plugin 的 核心组建呢,都是 skill, 你 在这个 skill 标签下面都能找到。 当我们安装对应的 plugging 的 时候呢,我们都会把相关的 skill 一 块儿安装好,所以我们在这里都能找到这些 skill。 不 过有一个王牌级的 skill 是 单独列在 skill 这个标签下面的,它并没有一个对应的 plugging。 这个 skill 呢,就是 mhgen, 它是用来生成图片的, 相信大家对 g p t 的 生图能力早有耳闻,不仅美观,而且非常的真实。下面呢,我们就来使用这个 skill 来创建一个图片。我们在马克笔记这个项目下新建一个绘画,然后输入我们的要求,给这个笔记软件生成一个宣传海报图片,注意要使用我给你的真实的软件截图。 然后呢,我们需要给 codex 相应的软件截图,我们先按 command 加 j 打开终端, 然后执行 npm start 命令来打开我们的笔记软件, 然后我们回到 codex 这里,点击加号,再找到其中的 attach electron 这个选项,这里面的 electron 其实就是我们的马克笔记软件了, 我们的这个笔记软件就是用 electron 做的,所以呢,在 codex 里面看来,这个笔记软件就叫做 electron, 我 们来直接点击这个选项,点击之后呢, codex 询问我们是否要启用这个功能,我们点击 enable, 然后我们的马克笔记截图就到了聊天框里面了,这样 codex 在 做海报的时候就可以根据真实的软件截图来做了,是不是很方便呢?点一下按钮就可以把截图放进来了, 不过这个还不是最方便的, codex 还提供了一个快捷键,按一下就能够把截图传过来。我来给大家演示一下,我们之前给 codex 的是浅色模式的截图,我现在在给 codex 传一张深色模式的,我们回到马克笔记这里,调到深色模式, 然后重点来了,左右 command 键同时按下,这样深色模式的马克笔记截图也传给 codex 了,这个确实更加方便了吧。好,现在 codex 有 了浅色和深色两种模式的截图,我们可以让它开始做海报了。提交, 首先我们可以注意到 codex 会使用 image 这个我们之前提到的技能来做这张宣传海报,然后我们就再等等,看它能画出什么样子来。 画完了,我觉得还行吧,确实是基于我们的截图来做的,不知道你觉得怎么样呢? 除了使用 codex 给我们安装的 skill 外,我们也可以创建自己的 skill。 让我们按 command 加 n 新建一个绘画,然后输入我们的任务,写一个代码审核 skill, 专门给当前的项目使用。这个 skill 应该包含如下的规则。好,我们提交 可以看到这个 skill 已经做好了,它的名字就叫做 marknotes code review。 下面让我们按一下 command 加 n 新建一个绘画,试试这个 skill 的 效果。首先我们 at 这个 skill, 然后提出我们的请求,检查当前项目的代码是否有问题。好,可以了, 结果出来了,还可以,我们还可以让 codex 根据审查的结果来修改代码。这里呢,我就不再继续演示了, 我们的笔记软件每天都在迭代,每天都有代码更新,所以我们最好能每天定时检查一下代码,看看有没有什么问题。这种场景就很适合起一个定时任务来处理。 codex 也提供了这样的功能,让我们来点击这里面的三个点, 再点击 add automation。 呃,也就是添加一个定时任务。这里呢是定时任务的标题, codex 已经帮我们填好了。这里呢,填写发起定时任务的时候,我们需要发给 codex 的 要求,我们的要求呢就是检查当前项目的代码是否有问题。 然后下面呢是执行环境,一共是有三个选项,分别是 local, worktree 和 chat。 local 呢是在某个项目目录里面运行这个定时任务 worktree 是 基于某个项目目录创建一个新的 worktree, 这个定时任务就在这个新的 worktree 里面运行。 worktree 的 概念我们之前讲过,它是 get 的 一个概念,如果你还是一知半解的话,可以先不管,我们这里不用这个选项。 chat 呢是执行环境,不跟任何项目目录绑定,我们之前用 chrome plugin 搜索网络的时候,实际上是用过 chat 环境的, 这里最适合我们的是 local, 毕竟我们的定时任务就是要扫描马克笔记的项目代码,所以一定是要跟某个项目目录绑定起来的。让我们选择 local, 然后在这里面选择马克笔记,然后这边呢是运行频率,我们选择 daily, 具体的时间呢,我们就维持在九点钟,意思就是我们这个定时任务在每天九点钟的时候启动, 下面呢我们选择模型 g b t 五点五,推理强度呢,我们就维持目前的 medium 就 好了。然后我们点击 save, 再打开左边栏, 我们就可以看到 automations, 这里面多了一个一。点击之后就可以发现我们创建的定时任务了,它会每天十点开始运行,每次运行的时候都会创建一个新的绘画,我们可以点击这个按钮试运行这个定时任务, 可以看到一个绘画创建出来了,就是用来运行这个定时任务的,我们来打开看一下, 好,可以看到这个定时任务已经完成了,后面每天跑的也都是这个样子了,那这个就是定时任务了。最后我想给大家讲讲 codex 的 一个特别有用的功能,那就是 codex mobile, 具体来说就是我们可以在手机上操纵 codex 来给我们完成任务,让我们来点击这里面的 codex mobile, 再点击 allow 允许手机操纵这台电脑, 然后再点击弹,点击完弹了之后, codex 应该会给你显示出一个二维码来。 呃,如果你像我这样没有显示出二维码的话,可以点击这里的手机图标,这样二维码就出来了。随后我们需要打开手机摄像头扫描这个二维码。然后呢,我们就会被引导到叉 g b t 的 codex 页面。在这里我们就能向电脑端的 codex 发送指令了, 比如我们想让它操作一下日历。你还记不记得我们之前在日历上创建了一个日程标题,就叫做讨论马克笔记的后续设计。现在我们在手机上再发送一个指令,让它把这个日程去掉,我们点击聊天。 然后呢,我们再点击这里,呃,在里面找出 computer use 这个选项。 随后呢,我们需要输入我们的请求,我们的请求就是把日历中五月二十八号呃,讨论马克笔记的日程删掉, 写完之后先不要忙着提交,你看,我们现在在马克笔记这个项目目录下,但我们的请求其实跟这个项目的代码没什么关系,我们就想操作一下日历软件,所以我们需要再点一下这个设置按钮,然后选择不使用项目。好,这样呢就万事俱备了。我们提交请求, codex 首先询问我们是否同意使用 calendar 这个软件,我们批准。然后 codex 再次询问我们是否要真的删除掉这个日程,我们确认, 随后 codex 就 开始操纵电脑了,我来给大家看看电脑上是个什么样子,你看日历上面多了一个鼠标,它正在操纵电脑删除这个日程。 好,删除成功了。这样呢,我们就做到了用手机来操纵电脑了,是不是很方便呢? 这样大家在外面也可以使用 codex 来做各种各样的事情了。好到这里本期视频就结束了,我是马克,用最通俗的语言讲最硬核的技术,我们下期再见。拜拜。