大家好,我是郑一环,今天我们看一下扣代词自动化任务,扣代词可以把重复工作封装成自动化任务,并且定时自动执行。 比如我每天早上都需要看 ai 热门资讯,用来做自媒体选择题,这件事每天都要做,并且流程完全一样,很适合做成自动化。具体步骤就是我先跟扣代词说, 帮我搜索今天全网关于 ai 方面最热门的资讯,挑选十条发给他。内容生成以后,我们先确认一下内容有没有问题, 没有问题的话我们再给 codex 下新的指令,就是把搜索当日最热门的十条 ai 资讯做成自动化任务,每天早上九点执行,然后发给他。 我们可以看到 codex 已经创建好了任务,后续的话我们可以在左上角的自动化这里查看和管理我们的自动化任务,可以修改自动化任务的内容,也能修改执行时间等等。
粉丝901获赞5891

美好啊,朋友们,这是一期 codex 奶妈级的零基础系统教程,这期视频我会从安装开始,手把手地把 codex 的 基础能力到高级功能的组合,以及最新的手机端操作,用十个实战场景来带大家彻底拉通 以后这一类的 ai 产品,出一个算一个,你都会触类旁通,游刃有余。我也把这期的文字课间整理成了文档,那这期的含金量可谓是 biu biu biu biu biu, 一个点赞收藏关注是最起码的。好了,不多说,学费都交了吧,我们上课, 那在开始之前,我先说一下 codex 和 cloud code 的 区别。从本质上来说,它俩都是由编程 agent 逐步转向了通用 agent, 分 别是 ansapi 和 open ai。 这两家出的 cloud code 呢,默认使用 cloud 模型,但是我们可以自行替换成任意其他的模型,那在易用程度上, codex 桌面端的产品设计是会更友好的, 更适合零基础的白领工作者,而 cloud code 有 更高的自由度。在功能上, cloud code 原本是最齐全的,什么 skill、 mcp、 斜杠命令、 hock、 远程操控,这都是人家先发明的。但是呢,最近的 c c 更新稍微不如 codex 那 么快了,会更加偏向专业开发者一点。 而 codex 发了非常强的浏览器操控和 computer use, 还内置了最近的 image 二深图模型, 而且昨天还刚刚发布了手机端和 hock, 可以 直接用你的手机 check gpt 来控制电脑上的 codex 干 活。那价格和额度方面呢? codex 的 会员额度非常大方,二十到的会员就很够用,而且还不封号。 而 cloudpod 呢,大多数人可能都没法用它的官方账号基本上都得自行调用 api 的 费用属于是花多少用多少,风险由人。那在使用场景上,我个人喜欢用 cloudpod 搭配 cloud 模型来写作,因为 ops 四点六的写作和规划能力真的很强, 那 codex 的 执行和解决问题的能力也很强。日常的办公场景,我会选择用 codex, 那 在编程的时候嘛,我就两个都用上,所以结论是,入门的朋友用 codex 就 很强了,有条件的朋友呢,两个都来是最完美的, 不过两者的逻辑其实都是一样的,我们学一个,另一个也就会用了。那 cloud code 我 也做了一期系统教程,想拥有左膀右臂的朋友可以去看看。 ok, 正式开始 使用 codex, 我 们唯一需要准备的就是一个叉 gpt 账号,免费的也行,只是会额度稍微少一点。那有了账号之后,我们就直接去它的官网双击安装, 然后安装好之后登录我们的叉 gpt 账号,然后这些设置我们可以先随便选一点啊,选个日常工作,反正后续呢,我们都是可以改的。那搞定了, 那进来之后呢,大家会看到这个对话窗口,好像跟 chat gpt 是 很类似的。那我们打开两边的侧边栏也蛮眼熟的,左边呢,可以管理对话和任务的列表, 那中间就是聊天,右边大概是结果之类的吧,大家应该都能猜个七七八八,所以我们先不深究它的页面,我们直接开用,这其实也是我探索所有的 ai 工具的独门秘方。 我打开一个陌生界面呢,我先不管别的,我先找到我能对话的框,我先聊,先找到我能看得懂的按钮,先按,按着按着你就会了。你看看,独门秘籍都教给大家了,以后你们就是为师的弟子了。 ok, 众弟子不必拘礼,我们还是以学业为重啊。那我们第一个要了解的 codex 能力呢,就是本地文件操作, 也是这一类桌面端的 agent 跟对话 ai 最显著的区别和能力。因为过去我们用叉 gpt, 如果说我们要让它看到我们本地的内容,我们只有两种方式,一个呢就是复制粘贴到这个对话里,另一种就是以它允许的格式和数量把文件给上传上去。 但是 codex 不 一样,它可以自主地读取和操作我们的本地文件,而且不限数量。比如说我作为一个剪辑,我的本地里面存了八十多条视频素材,这都是我剪辑要用的, 但是呢,这个命名全都是乱的,完全看不懂,所以我想以这些视频的内容来命名,到时候我们看见文件名的时候,我们就知道这个素材是什么。那这事 check gpt 肯定是做不了的,但是 codex 可以 我们来看这两个地方,它都显示了一个概念,叫做项目, 我们选择一下,哎,一选择项目,他就让我们选择本地的文件夹了,那我们只要选中这个文件夹,那这个文件就是我们的项目了,里面所有的文件 codex 都可以自由的读取和操作, 当然这需要我们给他权限。大家看这里的权限选择啊,目前呢,我们是一个默认的权限,我们再点开,他有三种权限模式, 那默认权限的意思呢?就是在我们当前的文件夹内,他可以自由的去读写这些文件,但是如果他想要联网呀,或者是帮我们下载一点东西啊, 或者是碰这个文件夹之外的其他文件,那他是不行的,如果他必须要做,就会要向我们提出提高权限的请求,我们点同意才能继续。 那自动审查呢?顾名思义就是有个 ai 自动帮我们审查,由 ai 来判断这个操作危不危险,如果危险呢,就来问我们不危险的,比如说他去下一个知名的这种官方软件什么的,他就直接开干了。 自动审查比默认模式要更宽松和智能,建议大家选这个就完了。那最后呢,是完全访问权限,这意味着 codex 可以 在你的电脑上几乎什么都能干,它可以修改删除任何文件,它可以在任何位置执行命令,例如说它可能会去把你的 cloud code 给删了。 开玩笑啊,它一般情况下是不会这样抽风的。 ai 呢?也没有嫉妒情绪吗? 大家尤其是新手朋友就选择自动审查模式,相信 ai 就 完了,毕竟咱又能审的比 ai 好 多少呢啊,对吧? ok, 那 我们选中了刚刚的这个视频的文件夹,继续来提出我们无理的要求,让他帮我们把这个文件夹里的所有视频素材都按他们的实际画面来重新命名。哎,他就开始做了, 而且大家看他非常的聪明,他先看了看我们到底有多少个视频,然后他选择用抽帧的方式抽取关键画面来判断内容是什么,而且他还知道他不要一张一张图去看,他给拼成了缩略图的形式,一组一组的去看。 ok, 很 快啊,这个文件夹里面的文件名就全改变了。过程中呢, codex 也是没有向我们提全的,因为他都是在这个文件夹内去操作的。那我们也可以检查一下他都对应好了没有。 ok, 钢琴家音乐演奏厅,没错, 雪山近身格斗,没错,旗袍女人夜巷卖热饮哇!而且他的这个命名还遵循着一个序号,任务、场景、行动的一个清晰的命名格式。 ai 做事的这个细心程度啊,人类你不服不行。那另外呢,我们其实也可以在同一个项目里面去开多个不同的对话,它们的上下文都是不一样的,但是同样都可以随时的访问我们这个文件这个项目。 比如说,我们在另外一条对话,我们又给他一个不同的任务,让他想办法把所有关于风景的视频都剪成一整条。 哎,没想到吧,他真的能剪,他自己想办法,用了一些工具问我们要了一些权限,用这个 ffmpeg 给它拼在了一起,效果的确是关于风景的都剪成了一条。 ok, 那 如果我们要创建一个新的任务,我们其实也可以手动的在这边创建,他也会自动的在我们本地创建一个文件夹。 然后呢,我们跟 codex 对 话的整个过程, agent 产生出来的任何文件啊, pdf 啊,什么 markdown, ppt, 它都会直接存在我们本地的电脑上。 ok, 到这里,大家应该 get 了 codex 呢,可以随时地访问我们的本地文件,去读取内容,写文件,删文件,移动文件,文件夹里的内容也就成了我们的 codex 随时可以获取的上下文,那这里的项目也就对应着我们在本地的一个文件夹, 哎,那刚刚这么个任务会花我们多少上下文呢?我们只要看这里就能看到了。 那这个小圈代表的是我们现在的这个对话和里面的操作,一共使用了 gpt 五点五的多少上下文窗口。 如果我们把鼠标悬上去呢,它还会有更详细的一个信息,当上下文快满的时候, codex 会自动地帮我们压缩上下文。不过其实当我们一个任务告一段落之后,不用等它快满了,让它自动压缩,我们也可以自己通过斜杠压缩这个命令 来手动的去压缩上下文,这样呢,可以让模型更聚焦在我们的新任务上,也省一点上下文的额度。那当然大家除了这个对话的上下文余量,其实我们还想知道我作为一个免费用户,或者是我作为一个 pro 用户, plus 会员,我还有多少总共的额度可以用,对吧? 这个呢,有两个方式查看,一个呢是左边的设置,这里我们点开剩余额度,就能看到你五小时内还剩下多少,那本周内又还剩下多少, 甚至呢,也有什么时候到期会刷新的一个提示,这个产品的设计还是比 cloud 的 友好很多的。那另一种方式呢,就是我们可以直接在对话框里输入斜杠,然后找到这个状态, 那打开这个状态之后,它的绘画这里就会持续的显示我们的上下文余量,这个五小时和一周的限额。但再次说实话,这个 codex 的 额度还是非常大方的,二十到的额度我认为是可以满足大多数白领工作的高频使用的。 ok, 那 顺便呢,我们也介绍一下这里的模型选择, 那点开之后,我们可以选择速度,快速呢,就相当于加急通道,会消耗我们更多的额度。那这里呢可以选择其他模型,但是大家都选五点五,因为它确实更好用。然后呢,这里可以选择智能程度,其实呢一般中度智能就够了, 所以我们选高。 ok, 那 这个小麦克风呢,肯定就是语音输入功能了,比手打字还是要快很多的,但是呢,它的转录速度远不如大家去下载一个语音输入法,还是非常推荐大家用语音输入的 好。那现在我们通过一个本地文件处理的案例,也了解了 codex 上常用的一些功能。那 codex 的 第二大能力就是命令行工具使用。 其实刚才我们说到权限的时候就有提到,在默认权限下,它可以读写文件,但是却不能执行一些命令,一些联网的操作。那这些命令是什么意思呢? 刚刚的案例其实也已经用到过了,比如说它把视频抽帧出来,还把几个视频拼接到一起,它用到的 ffmpeg 就是 命令行工具。 还有一些我们熟悉的命令,比如说我们在终端里面来克隆一个 gitup 仓库,或者是大家近期比较熟悉的,我们在命令行里面输入一些命令来下载龙虾和各种依赖。那 codex 的 第二大能力就是在我们授权的情况下,可以使用我们的终端来替我们做这些事。 那我们就来让 codex 帮我们来安装一些平时对于小白来说非常复杂的东西吧。第一类,常用依赖,比如说什么 node gs 啊, git 什么的, 也是大家以后使用各种 agent 或者是做其他项目必备的一些工具啊,那之前大家要装这依赖都得去看一个手把手教程,然后照着命令抄,挨个装。那现在我们就直接跟 codex 说帮我安装个 node js 给他发过去, 也是因为这些东西呢,其实都是比较常见的东西了,所以在我们的自动审核的权限模式下,你看他基本上都不问我们要提权,就熟门熟路的帮我们装好了。 那第二类,就是那些爆火的但是有上手门槛的一些新的 agent, 比如说龙虾,爱马仕,甚至还有这个 codex 的 竞品 cloud code, 我 们都可以让 codex 帮我们装完了呢,它还能教我们该怎么用。那我们装一个 hermes 吧, 我其实都不需要给它官网和仓库链接,我就说最近有一个叫 hermes 的 agent 很 火,你帮我安装一个吧。 哎,他就会自己去搜索,然后帮我们判断到底是哪一个。然后呢,他根据官方的文档帮我们陆续的装好了,还帮我们验证过已经装好了,你瞧瞧,那我们照着他说的来启动一下试试。 哎,真的帮我们装好了,那往后的配置我们就不在这里继续了,但是大家应该 get, 有 了 codex 以后,那些复杂的要收你五九九的部署,你都可以直接让 codex 帮你做了,怒省五九九。而且我们在使用的过程中遇到任何问题,还可以截图去问 codex, 什么瞎死了马挂了,升级出现了问题都可以让 codex 直接帮你修,是不是很方便? 那第三类有点没那么必要,但它其实也可以,就是像 cursor integrity 这种软件应用, 平时都是我们去手动在网页上下载的,它也可以帮你下载和卸载。那大家用 codex, 我 其实也建议大家去下载一个 agent 的 ide 啊,因为现在 codex 有 个缺点是它没有办法打开我们的文件内容,直接去手动编辑。 虽然这个侧边栏呢,是可以看到一些文件结构和内容的,但是我们都没法编辑,所以大家可以让 codex 下载一个自己喜欢的,比如说我们就这样下载。那下好之后呢,我们再执行一个 git i n i t 一个初步化, 那右上角就会出现这个东西,随时可以把我们的项目在编辑器中打开,我们来手动编辑。 那第四类就比较重要了,就是 agent 本身会常用到的那些 skills 啊, mcp 啊和 selli。 那 skill 和 mcp 本身 codex 也是支持的,我们后面会详细讲到, 我先挑两个大家安装一下,方便我们后面综合起来来做案例。那这些 skill 和 c i 呢?通常来讲不像那些 get 那 种大项目那么著名,所以我们最好是找到它的具体仓库,或者是明确的官网地址。比如说我们下载一个专门找 skill 的 这个 find skill 哦,方式就是直接把链接拷贝给 codex, 然后跟他说帮我装一下这个 skill。 那 在他装的期间,我们也说一下 codex 的 另一大好处,并行任务处理, 我们完全可以在他做这个事情的时候再开一个对话,让他去下载一个别的。那我们下载一个飞书 c l i 吧。飞书 c l i 其实非常的典型, 因为现在呢,有一些积极 ai 化的软件,把几乎所有他在软件里能做的操作都做成了命令,让 agent 能够方便的去操作,我们把这个链接发过去,让他开始下载, 那这边呢,其实会显示每一个正在处理当中任务的情况,这个在转呢,就说明它正在执行中,那这个蓝色的点呢,就说明已经完成了,有时候还可能会出现一个需要你申请权限的一个标识。 ok, 那 这里 fan skill 呢?它是已经装好了,我们再看飞书 c l i 这边,它会引导我们去做一些授权, 我们就跟着它的引导去完成就好了。 ok, 那 装好飞书 c l i, 那 codex 就 能帮我们去做飞书里的各种操作了,比如说写文档,发消息,见日历,做表格什么的了,我几乎每天都在用, 好大功告成。我们就这么一个小章节,我们就用自然语言的方式让 codex 帮我们装上了 hermes node, 飞书 c l i 一 大堆东西,这就是 codex 作为 agent 的 第二大常用能力,命令行使用。 那这个能力和这个章节的演示也是希望大家能够 get 到一点,就是我们现在在电脑上想去做的很多很多事情,都可以让 codex 这样的桌面 agent 去做了。那 codex 的 第三大能力是持久记忆。 看过我那篇 cloud code 的 朋友应该都知道, c c 呢,有一个手动的持久记忆, cloud 点 md, 还有一个自动的记忆系统, 都是把我们希望 agent 能够长期记住的,比如规则、篇号和我们的信息之类的东西,以本地文件的方式存在我们的电脑上,然后事实的时候把这些记忆以上下文的方式注入到 agent 里去。那 codex 也是类似的,它也有这两套持久的记忆系统 在 codex 里面呢,手动的持久记忆文件叫做 agents 点 m d, 而且它也有一个自动的记忆机制,来我们打开设置,找到个性化, 那在这里的这个自定义指令实际上就是一个全局生效的 agent state md, 它会在我们任意的项目跟 codex 对 话的时候,它都第一时间作为上下文发给大模型,那我们可以手动地自己在这里写,不过我更喜欢呢,直接在对话中去跟 codex 说, 比如说我说一个,我希望你以后对非书文档里的任何修改都使用一个专属的你的文字颜色和用删除线的方式来修改,不要直接的修改。然后这个帮我寄到局的 a 正 c m d 里。 ok, 那 它这里呢,告诉我们已经写好了,我们再打开个性化这一块,就的确是多出来了这么一套规则,那实际在使用当中,它就会去遵循我们这个规则了。 比如说我这里已经有一篇非输文档了,我在侧面呢也评论了几个我想修改的地方,我直接可以把这个链接发给 codex, 我 让他根据我侧面的评论帮我修改一下。 那因为我们刚才确实已经装好了这个非输的 c r i 也都给他配置好了权限,所以 codex 是 直接可以操作我们的文档的。 ok, 看看它完成之后的效果。 果然他用了紫色的字和删除线的方式来帮我们做的文档修改,那这个呢,是局的 agent md, 适合记一些适用于所有任务的一些大原则,比如说我们的工作习惯,我们要说中文,我们的工作偏好修改文档,要留下这种修改痕迹等等等等。 那另一种呢,就是项目级的 agent md, 这个长期记忆呢,只在这个项目当中生效,我们可以选择一个项目的对话,然后打开编辑器, 自己在这里手动的创建一个 agent 的 md 的 文件,然后我们去写一些针对我们这个项目的一些规则, 当然也可以让 codex 来帮我们写。我个人的建议呢,是在这个项目文件里面有了一些内容之后,让 codex 根据他对我们项目的了解来自己帮我们写。那自动记忆怎么回事呢? 其实我们刚才在这个个性化这个下面我们也看到了,我们需要手动打开这个自动记忆功能, 它的机制是我们打开这个功能之后, codex 会在我们结束对话或者是结束任务,这个对话闲置一段时间之后,它帮我们把那段对话总结成记忆,然后记在一个地方。但是它有几个原则,第一太短的对话它就不记了, 那第二这个对话的总结它一样会消耗我们的额度,所以当我们的额度太低的时候,它也就不记了。 并且这个自动记忆文件呢, open ai 官方是不建议我们去手动修改的,顶多我们可能删一删有些没必要的信息,那这个文件大概是长这样 的,是一个任务,一个任务在记录的,主要呢会写上这个记忆的来源是哪段对话呀?以及它的工作目录是什么,那以及以后触发了什么关键词的时候,它会去召回这段记忆, 再往下呢,是用户在这件事情上的偏好大概是什么样的?那第五段呢,是一些可附用的一些知识,一些踩坑的记录,那这些内容都是 codex 自己记录的,并且以后也是会它自动的招回去使用的,我们就先不修改它, 它这个格式确实也不太方便修改,更多的时候我们对于明确的规则和要求,我们还是通过组织 agent md 来实现。那大家学完这些视频之后呢,我也想给大家再做一期, 通过组织不同层级的这种 agency md 给自己做一个非常懂你的,可以做不同类型事情的超级助手的视频,感兴趣的朋友可以扣个一。 ok, 那 第四大能力就是 codex 可以 直接用到 image, 二来生成图片。不过呢,深图功能其实是一个小功能, 所以这一章节呢,我们不只会用它的图片生成,我们会带大家做一个完整的个人主页的开发项目,并且在了解一些 codex 在 小白开发中的一些用法和功能。那我们再来开一个项目,叫做个人主页, 然后我们点开这个加号,我们把计划模式打开,因为我们要做一个网站嘛,任务会复杂一点,所以打开这个计划模式呢,他会先帮我们列出一个详细的计划,我们确认之后他再开始行动。 计划模式呢,比较适合我们的任务有一定复杂性,或者我们自己还没想清楚,可以跟 ai 讨论出一个计划。那假设我们现在就是第二种情况,我们其实没想清楚,我们直接跟他说我想做一个个人主页, 那你看他看到我们的项目中是没有内容的,所以他以这种选择框的方式来询问我们的细节,这些选项呢,大家可以按照自己的要求去选择,那我就选这个个人品牌吧。 然后如果说这些选项中没有我们满意的呢?我们也可以选到最后一个来填写我们详细的要求,比如说我要他修饰感,也要高级感,然后我选针对合作伙伴,不要个人照 中英双语,巴拉巴拉巴拉。这里真的是问了我们相当多的问题啊,那最后呢,他给到我们出了一个详尽的计划,问我们是否实施此计划,那其实基本的计划我们看着没有什么问题,但我们也可以补充一些调整方案。 比如说我们刚才就要说到了要用它的 image 二的生成能力,我们这里没有体现,我们加一句网页上要多用一些图片,使用 image 二来生成一些高级感的图片,然后我们一起提交。 哎,那他又问我们要走哪种高级感呢?我们如果点开这个小叹号的话,还能看到他说的这个风格到底意味着什么意思,这个产品的小细节真的是我很喜欢,那我们就选他推荐的吧。然后他出了一版新的计划,我瞧着没什么问题, 去吧。 ok, 他 就开始初识化这个项目来逐步帮我们生成了。那这个过程呢,肯定会需要一定的时间,在这个期间我再给大家补充一点点知识点。呦,他的第一张图出来了,不错,挺有艺术感的,果然是最强的 emoji 二,那我要补充的这个知识点呢,叫做引导。 如果说大家在 codex 执行一个很长的任务的过程当中,你觉得他有点跑偏了,我们是可以随时给他补充纠偏的,比如说我们补充一下图片的人味要更强一点,而且不要这么冷的色调。我是一个 ai 博主,然后我们发送出去, 哎,大家会看到他没有立刻打断我们的任务,没有发出去,实际上他在这里排队呢。那我们看到右边的这个引导按钮,他写着我们不打断模型运行,会在下次调用工具后发送过去。这个是非常好的一个功能啊,我们点一下, 哎,他就可以发出去了。这个功能呢,可以让 codex 不 用在错误的道路上一路狂飙,把我们额度都花光,也不会让它重新再跑一轮任务。那另外一个小功能点,我们找到一个已经结束的任务, 我们看一下这个 ai 的 回复,每个 ai 回复的下面都有一个这个按钮,叫做分叉 fork, 这个的意思是我们可以随时从这里开始去开一个新对话,非常适合那种前面聊的还好好的,上下文也非常有价值,但是我们再往下聊,就聊的有点叉劈了的时候。哦,还有个小功能,宠物, 我们点开设置外观,然后这下面就有一小对小宠物可以选,甚至呢,我们还可以点击创建,让 codex 根据对我们的了解来生成一个定制化宠物。那我们先点击唤醒宠物, 哎,就会在桌面上有常驻这么一个小桌宠,脑袋上会冒出来 codex 正在做什么的一个提示,别的呢?好像也没什么用。 ok, 终于在他跑了七七四十九分钟之后,网页完成了, 我们来看看效果,因为 codex 呢,有一个内置的预览浏览器,我们可以直接打开右边的侧边栏啊,我们还给它放大一点。 嗯,这个网页的效果确实是不错啊,不过呢,现在的 a 证呢,其实都有这么一手了,那它这个预览浏览器呢,还有一个好处,我们点击右上方这里的一个批注按钮, 我们就可以在这个页面上选中这里的具体元素去写修改意见,包括重新生成图片,比如说我们要这个 logo 放大一点, 然后 p 住这里这张图加上一个人物,好把这个删掉, 那然后对话框里呢,就会加上我们这几条批注,然后我们点击发送,它就会针对我们的意见进行修改了,是不是挺方便的?那我们现在项目有了雏形之后,我们再 call back 一下刚才说的 agent md, 其实现在呢,就是一个让 codex 帮我们生成项目级 agent md 的 好时候了,因为我们也有了一定的内容,我们就让它自己生成一下,我们打开编辑器看看, 不错,项目的背景,各种信息,各种规则,各种文件路径都已经写好了。那以后呢,无论我们在新开对话,还是我们的聊天记录都已经被清空了, codex 都可以通过这个项目级的 a 证书 md, 立马的了解我们的项目基本情况。 ok, 那 我们先保持这样,先不做精修了,我们直接准备部署上线,当然大家自己做的时候完全可以去打磨的更好,那网页上的这些信息也换成更真实的信息就好。 那我们现在要部署呢,就得要说到 codex 的 第五大能力插件。在现在的 codex 当中,插件大多数是让我们的 agent 跟外部平台、外部工具、外部服务连接的一个作用,它实际上就是我们所说的 skill, mcp, c l i 这一类东西的一个完整集合包,比如说操作邮箱、操作日历、操作 excel 啥的。那我们来点开左边的这个插件栏,我们看这里呢,已经默认帮我们打开了好几个内置插件了,比如说浏览器操作,还有 mac 专有的屏幕操作,还有 excel 表格, ppt 等等。 那他的插件页面没有中文翻译,所以我给大家把这些插件的具体中文意思,分别能干什么也都列出来了,大家课后可以按需装上,点这个加号就好了。那我们先翻到这个 coding 板块,因为我们想要部署上线嘛,通过插件会非常方便。 其实呢,这个 vassel 和 netify 都可以,我们点一个加号给它装上,那如果大家给它没有选上的,也记得要选上。然后我们再回到对话当中,告诉他们,我们想用这个 netify 把这个网站给我们部署上去, 我们大家也不用管他咋部署的,反正他需要干什么呢,他都会告诉我们的。 ok, 他 发现我们没有登录授权,然后主动弹出了这个登录的链接,那这里呢,建议大家用 tapp 账号登录是最方便的, 那登录完之后,他自己就知道我们已经登录好了,然后继续的帮我们部署,这就搞定了。这个链接呢,就是我们最后的网站了, 只要把这个发出去,别人就能访问你的个人主页了。 ai 是 不是个好东西,你说就这么两下子就干了,原来普通人花钱都不一定能干成 o k。 先压抑住我的这个老灯感叹。我们回到刚才我们已经装好的插件, 那其实这里呢,还有两个非常重要的内置插件,就是 browser use 和 computer use, 还有这个 chrome 浏览器, 那这些有什么用呢? browser use 顾名思义呢,就是 codex 可以 直接帮你操控浏览器,比如说它自己点击翻页截图,填写表单等等。通常呢适用于自动化测试前端, 当然也有比较无聊的用途,比如我们可以让 codex 打开这个 m b t i 做个测试试试, 嘿嘿,这样大家能够比较直观的看到它的一个效果吧。那这个鼠标呢,是它自己在移动,然后它是自己看了上面的答案在自己填写,然后填完这一页,它也会自动的翻页, 那随着它的一通操作,结果出来了,原来 gpt 五是 i n t j 啊,我说怎么跟我这么聊得来呢? ok, 那 这个 chrome 的 插件呢,也是控制浏览器,但是它控制的是我们自己已登录的自己的浏览器,它不会再新开浏览器, 那我们如果把它给勾选上之后,它会引导我们去 chrome 里面装一个插件,那装好之后呢,它就可以操作我们自己的浏览器了, 而且它有个好处,它是可以直接在后台执行多个页面的浏览器操作的,就是并不会占用我们的整个浏览器,我们不用真等着看它这些操作,我们该用浏览器干,别的我们可以接着干。 ok, 那 computer use 就 更厉害了, 它不只能够操控浏览器,连你电脑上的这些 app 它都可以操作,只不过呢,暂时只有 mac 有 这个功能。比如说我们新开一个对话,我们在加号,这里来看最下面的这个插件选项,我们手动地把电脑插件选上, 我们再来几个没什么用的奇迹引巧吧,帮我放一首九九年最火的歌,然后用我的微信给 qq 发条微信,说,请收下我一个点赞、收藏、关注,懂了吧? ok, 他 陷入了思考,然后他看到我们的应用都正在运行中,并且向我们使用了这个音乐软件。我们点同意看,这个就是 codex 自己干的啊。他帮我们搜索歌曲, ok, 音乐响起了, 但是他还有活,他还在问我们要微信的权限,我们也给他允许一下。 ok, 看他这个小鼠标,他正在犹豫着准备搜索点击,好朋友们失败了, 因为我上次都成功了,但是我估计现在微信已经开始严防这种 a 证的操作了,直接给我退出去了。 但是呢,他的确成功操作了这个音乐软件。其实我还让他操作了剪映,并且给我们的最新的项目加上了音乐。 那总之呢,意思大家都懂了吧,就是它可以操作浏览器,并且可以操作我们的电脑。当然,实际上我觉得它的操作效率目前来说还是稍微有点低的,我不太喜欢用这两个强大的功能。不过后面我要说的这个 skill 就是 我每天都会用的东西了。 那 skills 我 的确也已经跟大家说过很多次了,好学的朋友一定要去补补课。那 skill 本质上呢,是我们人为沉淀的一些可附用的方法、流程和工具的组合, 相当于给 agent 做某些具体任务的一些行动指南。那因为之前我们已经让这个 codex 帮我们装过一个叫做 find skill 的 一个原 skill 了, 所以后续如果大家想要去装,或者是找一些社区上的 skill, 都可以直接用 codex 拿语言直接让它下载。比如说我们下载一个必备的 ansapic, 那 个前端设计的 skill, 还有一个去 ai 位的,那我们这两个都发给他,等会儿都会刚好有用 欸,很快他就帮我们装好了。那以后大家想要下载 skill 呢?如果说遇到这个 find skill, 他 找不到的东西,也可以直接把链接发给 codex, 让他帮你下载就好了。不过我在 c c 那 期也说过,最好用的 skill 还是自己创建的,符合自己工作的专属 skill。 那 创建 skill 呢,也有两种方式,第一呢,就是直接告诉 codex 你 想要创建一个什么样的 skill, 通过跟他讨论打磨得出来一个 skill。 那另一种呢,就是我们接下来要演示的,先跑通流程,然后让它形成 skill, 这也是一种更推荐的做法。那比如说我们想做一个自动化写这类文章,并且帮它配图的 skill, 这种大家应该都看过吧, 那我们就得先通过一步步的引导 codex, 让它真正实现一个我们满意的文章。来我们新开一个对话。那正好呢,我们刚才不是装过这个 github 插件吗?我们可以直接先问它最新的 github 流行项目,热门项目都有哪些? ok, 它的确帮我们找到了一些,那我们再让它清晰地解释一下这些项目都分别是干嘛的。嗯, 那我们再让他挑其中新星数量最多的,来帮我们写一篇本周 get up 热门项目推荐这样的一篇文章。 好,那他写好了这一篇之后,我觉得稍微有点太人机了,我希望可以更口语化一点,并且我只想要五个精选的,那我们就告诉他,然后还要覆盖到这几个层面,那我们这里就可以用到刚刚我们下载的那个去 ai word 的 那个 skill 了,我们斜杠给它调出来。 好,那看到他的结果稍微优化了一点,但是我们还希望加一个我们固定的开头,我们的结尾,并且还要让他用上 image 二来帮我们生成一些配图。最后呢,我还希望他不要是这个格式,他要是一篇非输文档的格式,然后图文并茂的。 ok, 结果来了,他确实是有了,但是呢,我觉得这个配图不够丰富,于是我又经过几轮调整才觉得差不多满意。并且我还给他最后加了一步,要让他把这个飞书文档发送到指定的群里,让大家都来看看。 那最终呢,他的效果是这样的,果然发出去了。其实啊,如果想更加一步到位的朋友,也可以结合刚才我们说的这个浏览器操控,让他直接打开那个发布页面,直接就帮你发布出去。 那总之,我们对他这一套结果满意了之后,我们就可以直接让他把这一整套的标准和动作做成一个 skill 搞定了。那我们再输入斜杠,再往下找,我们就发现就有了这个 skill, 我 们可以直接这样手动地调用这个 skill, 也可以直接说生成一篇热门项目推荐图文这一类的触发词,也会让 codex 自动调用。 不过因为现在 github 上面实时的热门项目肯定是没有更新的,所以我们再调用一次呢,它大概率会写出差不多的文章,所以我们就不试了。但是大家都理解了吧, skills 呢,可以把我们经过验证调好一次的一整套流程和方法给它固定下来。 下次做这件事情呢, codex 就 可以按照这个方式稳定的输出。 ok, 那 下一个能力则是 mcp。 其实 mcp 现在已经用的不太多了,所以我只简单的示范一下那 codex 的 mcp 藏在设置里面的 mcp 服务器。 只不过小白看这个肯定是有点不太知道怎么填的,所以跟我们之前说的一样,我们最好的方式还是把你想装的那个 skill 的 链接拷贝给 codex, 让他自己装就完了。比如说我们来装一个 notebook lm 的 一个 mcp 发给他, 他就会引导我们来做授权登录,登录完就搞定了。那我们再试一个我存了非常多访谈视频的一个笔记本,我们来问一下他。 欸,那这样呢, codex 也就可以直接获取我们 notebook lm 上面的这些外挂知识点了。 ok, 最后一个 codex 能力是自动化定时任务。 其实定时任务本身并不稀奇啊,比如什么每天早上提醒我吃药,提醒我喝水这一类的事情,普通的软件也能做,但是我们把它放到最后一个说呢,就是因为它可以结合我们之前学到的各种能力,把一整套组合起来的任务,让 agent 定点执行 自动化,加上智能化和定制化方显美妙。比如说刚才我们做的这个热门项目图文的这个 skill, 我 们就可以把它设成每三天或者是每周,让它定时定点的产出一篇 dapp 热门项目推荐发出来。 那我们要创建自动化任务呢,其实也分两种方式,第一种就是选到这边的自动化面板,那它这里呢,有一些官方的参考视例了,不过大多数是跟开发相关,那我们选择新建一个自动化, 其实你看要填写的东西也非常简单,其实就是用提示词写好这些自动化是要做什么,然后我们可以在这里选好什么时候出发,我们也是可以自定义一个出发时间的, 然后这边就可以选择执行的模型和思考强度,最后点击创建即可。不过呢,我也还是倾向于让大家用第二种更简单的方式,就是直接在对话里跟 codex 说,那我们直接跟他说 帮我创建一个自动化任务,每周一早上九点自动化执行热门项目推荐的这个 skill, 产出一篇图文发到群里, ok, 那 我们在看自动化这里,它就已经帮我们设好了这个任务,我们随时也可以去改变它的时间。 再比如当你的这个邮箱插件 github 飞书都已经连上了 codex, 那 么你也可以让他每天下午六点帮我汇总日历上完成的会议, github 上面的提交记录和我的邮箱回复记录,生成一份全面的工作日报。 最后手机操控 codex 设置方法非常简单,手机上的 check gpt 和电脑上的 codex 都把它更新到最新版。之后打开手机上的 check gpt, 然后点击侧边栏的那个 codex, 它就会提示你允许这台手机控制你的电脑,直接就搞定了。如果你有多台电脑的话,也可以给它分别连上。这就等于你不管在大街上、地铁上还是朋友聚会,都可以随时随地地用手机下发一个任务,让 codex 在 你的电脑上干完一个活, 它就更像一个可以跟你远程协助的同事了。这个功能呢,目前免费版也可以用,但是主要能连的是 mac 系统的 codex。 好, 那到这里 codex 的 所有核心能力我们就全部过完了。来我们回顾一下。 codex 呢,可以操作我们的本地文件,可以使用我们电脑上的终端命令行工具。它还有两种构建持久记忆的方式,它还可以生成图片,而且它可以通过计划模式来做一个完整的项目开发。 那它有丰富的插件,可以操控浏览器和电脑,还可以把知识和流程沉淀成可附用的 skill 技能, 它可以使用 m c p 连接,外部它还可以设置自动化的定时任务。不过其实比起这些功能本身,我也希望大家记住两件事,第一就是我们真的有很多事情是已经可以交给 agent 做了。 那第二呢,就是我们已经从问 ai 的 阶段走向了管理 ai 的 阶段,因为过去我们使用 chat gpt 就是 有问题了,我们问一下,然后得到答案我们就走了。 那现在使用 codex 这类的 agent 呢?每个人都得像领导一样,帮他准备他所需要的上下文和工作环境,给他指明一些任务目标,然后来检查他的计划,监督他的过程,验收他的结果。 那同时领导还要负责把好的方法和流程沉淀成可付用的技能,把反复要做的事情设成自动化执行的规矩。好了,恭喜大家今天都升职了,记得点赞收藏关注我们下次见了。

openai 这次更新 codex, 我 觉得最关键的一点是,它终于进 chrome 浏览器了。以前我们让 ai 帮忙,大多是让它写代码给建议,告诉你怎么操作。但现在不一样了,它可以直接在浏览器里帮你干活。比如你已经登录好的后台表格、 crm 网页工具,它都可以在里面处理任务。 而且他不是抢你的鼠标,你还能继续正常用电脑,他自己在后台开环境,自己执行。简单说, codex 不 只是会写代码了,他开始进入真实工作场景了。 codex 不是 只能打开一个网页,慢慢点,他可以自己开一组标签页,同时处理多个任务。比如你让他整理用户反馈,他可以打开多个页面看内容,走流程,找问题。这种感觉就很像你旁边多了一个实习生, 你把任务交代清楚,他自己去跑,最后把结果拿回来给你看。 codex 不是 简单模拟人类点鼠标, 他背后是会写代码跑代码的。这意味着他处理网页任务时,不一定要像人一样,一个按钮一个按钮慢慢点, 像批量填表、提取页面信息、检查多个页面测试流程这些重复活,他可以用更快更稳定的方式完成。 这次升级的核心不是 ai 又变聪明了,而是 codex 真的 开始从写代码助手变成能在浏览器里干活的 ai 代理了。浏览器里的重复工作可能要正式交给 ai 了。

这两年大家都说扣带子很牛,然后我今天就给它装了试一下。呃,我在网上看了很多人安装扣带子都有一个问题,就是号码,号码怎么解决?号码解决其实很简单,就像我现在对着屏幕一样的,你把豆包不是有一个开视频的功能吗? 你就对着上面,你就跟他讲,你就说我现在这个号码解决不了,能不能帮我想个办法,他就会给你很多网址,然后那个网址有一个五什么来着的,忘记了,你们就可以去那个网址弄。 其实豆包他开视频功能是很强的,就是这种就像类似于我现在这样跟你们聊天一样的。我我经常跟豆包这样开视频,然后跟他聊天,然后跟他说啊,我现在这个问题出了问题怎么解决,他就会跟你讲,你们可以去试一下,很快十分钟搞定。 至于有没有大家说的那么牛逼,我先试一试。这个网址我不太好分享,我每次只要分享那些东西稍微什么一点,他就直接把我提示封控,提示封控,所以我只能教你们方法。我跟你们讲,你们安装软件用 ai 就用豆包去给他开视频,有很多问题都可以解决的,哪里需要去找人呢?不需要的他就可以帮你解决,他解决不了的,基本上我感觉好多都解决不了。好,就这样。

一句话让 codas 证明你自己。那很多人用 codas 还停留在命令它完成任务,但有一个更有效的用法,让 codas 反过来研究你你每天反复做的那些事情,整理资料,写日报,同步笔记,复盘项目。你以为这是琐事,但在 codas 眼里,这些都是可以被提炼的工作流。那方法很简单,打开 codas 记忆功能,从设置个性化开启记忆, 然后直接把这段提示词丢给他。那请回顾我最近的工作记录和历史。绘画,识别我反复执行的任务类型,提炼其中稳定的步骤,判断标准和输出格式,并把它们设计成为可长期服用的 skill。 那 它就会把你平时怎么做事,怎么判断,怎么输出,整理成一套可调用的 skill。 以后碰到同类的任务就不用再从头解释了。 那 code 会按照你过去的习惯直接进入一个流程,并且这个 skill 还会持续进化。那如果流程变了,去更新旧的 skill, 如果场景变了,可以拆除新的 skill。 那 我自己尝试了一下,瞬间生成了五个新 skill, 快 去试试吧。

跑一整页 gpt 五点五加 codex 如何跑一整页?我这两天有一个感觉, ai 编程的下一步不是辅助编程,而是可托管的执行单元。 gpt 五点五真正的红利不是少写几行代码,而是把一个人能托管的工作块变大。有人给 gpt 五点五 codex 一 份新项目 prd 只说了一个 go, 他 就跑了几个小时,从 bill 到 visual review, 再继续补功能。 gpt 五点五的变化从更聪明改写成更能被托管。 g p t。 五点五不像以前的模型,需要你一步步指导,它更能理解你的意图后自己把活干完,包括构建、调试、跨文件修改。 g p t。 五点五在 codex 里强化了闭环自主性。 g p t。 五点五在 codex 里对高层次指令响应极强。 openai 的 norm brown 说自己明明是 manager, 但用了 g p t。 五点五以后,比过去任何时候都更像一个有效 i c。 他作为经理,却觉得自己在技术产出上达到了新高峰。 ai 编程这件事,好像开始从你在旁边指挥他写,变成你能不能把一块工作托管给他。这就不像传统意义上的在旁盯着一次次交互改的 ai 辅助编程了。代理式编程越来越关乎时间跨度,而不仅仅是单次智能。 当 codex 这种 agent 可以 连续跑几个小时,十几个小时,甚至官方展示到二十五小时以后,未来我们该怎么把它从辅助编程当成可托管执行单元来管理?这我觉得很重要。 这里面会有一种更大的变化,高级人类会越来越像经理加架构师加验收者的混合体。 大家应该有好奇怎么跑长任务,我时常的提示也喜欢让它跑得久一点,把时间跨度拉长的端到端的来验收。 许多人知道它能写代码,但不知道怎么让它把一个大任务跑完。早在 cloud code 泄露的时候,有人用 oh my codex 赶在天亮之前把它用 python 重构了一遍。据它所述,全程都是 codex 自主执行。 o max 系列还有 cloud code 属于是同一作者所做。 o m x 是 在给 codex 包一层长跑工作流和团队运行时,一句话丢给你的 ai 它自己装完。还有一个可能很多人听过的 superpowers, 它长跑不是靠模型硬扛,是靠方法论,把人类判断外质成流程。回到官方材料里,这件事其实更清楚。 open ai 今年二月发过一篇文章,叫 run long horizon tasks with codex, 里面有一个很夸张的实验, 他们给 codex 一个空 report, 一个任务,让他从零构建一个 design tool。 codex 用 gpt 五点三, codex 在 extra high reasoning 下连续跑了大概二十五个小时,大概十三米 tokens, 大 概三十 k 行代码。 这组数字很容易被拿来当标题党,二十五小时十三密 tokens 三十 k 行代码,一看就很爽。但我觉得这篇官方文章最重要的地方,反而不是这些数字。最重要的是, openai 把它为什么没跑丢 拆给你看了。它不是靠一句神奇 prompt, 它靠的是一套很土但是很工程化的东西。四个 markdown 文件,你得给它项目记忆, 你得给他计划,你得给他验收标准,你得让他在跑的过程中持续写状态,像是在给一个会干活但会忘事的人建工位、排日程,留工单做验收一位 gpt 五点二。早期实践者说 codex 诺任长跑会 do outcome, 需要 continuity guidance, 它的连续运行三小时且思路连贯的方法是下面这个提示词。另外我翻了一下 codex chain log, childgo 中出现 memory extensions、 window 等等相关变更。这些不是宣传剧,但它们说明底层工程也在补。状态恢复、审批上下文本事 越长跑越不像单纯模型,能力越像状态机。权限恢复和审计系统状态机有点不一样,它植入硬编码程序来支撑长跑,在一定时间还能清空上下文。这个值得聊,以后再论。 我看到 reddit 上有人问怎么让 codex autonomous 地跑几个小时,它的痛点很直白,它不想把 codex 当 chat assistant, 它想让它像 autonomous agent 一 样连续做 feature 或 refactor, 但现实是它坐一轮就停,等你继续说 continue。 还有人想让 codex cloud 并行处理四到五个任务,自己只 review code, 每个 runner 大 约每小时仍要人工 approval 一 轮,步骤有限,做完就 summary, 然后等确认 步骤塞多了又容易碰 context limit 或 compression。 cloud 有 时像黑盒任务卡住,但不知道为什么。 github issue 里也有类似的具体症状,用户想形成 continuous loop, 但 codex 每做一个小块就 report back 打断连续执行,最后用户只能 q 多条 continue。 跑 codex 的 关键矛盾不是模型能不能连续工作,而是人能不能在他连续工作的时候保留控制权、证据链和恢复能力。这就是为什么最近很多相关东西都在往智力层长。接着这里还有一些内容,你可以在原文这里阅读。 g p t 五点五是入口, codex 二十五小时是证据,但下一个问题不是它还能跑多久。下一个问题是,跑完以后你凭什么相信它? 如果没有状态机,长跑只是一次更贵的走神。如果没有证据链,睡醒验收就会变成开盲盒。如果没有熔断器,它可能会在错误方向上越跑越勤奋。 如果没有恢复包,你中途打断一次,下一轮就要重新考古好了。这里是 ai 进修生,持续分享前沿 ai 实践,如果不错,点个赞,关注一下,我们下期不见不散!

国内用户如何使用 codex? 这个视频我将教大家不需要解决网络问题的情况下完美使用 codex 软件, 避免使用 codex 时提示输入手机验证。我们需要准备两个软件和一个网站,那两个软件呢?分别是 codex 和 cc switch, 一个网站就是我们要选择接入哪个模型,或者是我们使用的 api 中转站。首先我们可以到 codex 官网来下载,我们可以直接打开这个网址,国内用户是不需要上网环境就可以打开的, 打开后我们可以直接下载,如果你是 windows 电脑,这里会出现 windows 的 版本, 我们直接点击下载就可以。第二步,我们打开这个 cc switch 的 github 仓库,我们可以直接输入这个网址来打开,在这里我们选择下载它的对应版本,点击后我们向下滑动, 在这里我们可以找到不同的客户端,我的电脑是 mac, 所以 我选择 mac 版本,点击后直接会下载 这里你如果没有配置好上网环境的话,下载这个客户端会比较慢,那我在这里已经帮大家下载好了,并且已经上传到了云盘,如果需要的话,你可以在评论区留言,下载好后我们正常安装就可以。 现在我们打开 codex, 现在我们可以看到它,让我们选择登录,这时如果你没有上网环境的话是无法使用的, 那现在我们就用到了第二个软件 cc switch, 我 们正常安装 cc switch 后,我们选择打开它。 打开这个 cc switch 后,我们看最上方的这一栏,我们选择 codex, 在 首次配置时默认是只有最上方的这一个官方 api 的, 下面这三个都是我自己配置的,那如何配置自己的模型或者 api 呢?我们点击这个加号, 在这里我们可以选择不同的供应商,也可以自己填写供应商的名称。那我这里以这个 ai go code 的 这个 api 网站为例,点击后我们看到这里的参数,它已经帮我们设置好了, 我们现在只需要填写一个 api k, 那 我们可以打开它的官网,在这里我们点击登录或者注册,如果首次使用的话, 它是需要充值额度的,充值好后我们可以点这个 api k, 然后在这里我们可以看到这个 codex 有 不同的两个分组,我们可以选择这个速度更快一些的,或者性价比更高一些的。 我们点击这个创建,可以给这个密钥起一个名称,然后点击创建,这时它会生成一个密钥,我们选择复制,然后把这个密钥粘贴到 cc switch 中, 我们选择添加,添加好后我们在这里点击起用,这时我们再将 codex 重启一下, 这时我们就可以看到他现在可以正常使用了。这里我全程都是使用正常的上网环境,我们来测试一下,帮我生成一张,欢迎大家点赞收藏。评论的图片要求十六比九的比例, 它现在已经按我的要求可以正常对话,并且可以生成图片了,而且调用的还是最新的 emoji 二模型, 并且全程不需要登录,不需要其他的上网环境。我们接入第三方 api 的 话,也是用多少花多少。这个方法主要是针对那些没有上网环境的同学, 如果你在安装过程中出现了任何问题,都可以在评论区留言,我会给大家逐一回复, 下个视频我将教大家如何具体使用这个 codex, 它和 cloud code 有 什么区别?我们下个视频见,欢迎大家点赞收藏评论。

小白也能一键安装的 codeast, 它终于来了,比起来 openclo, 它更适合普通人,它能够操控电脑做 ppt, 调用 emoji 二拓图,还能自动执行你每天的任务。今天就手把手教你安装 codeast, 五点五 再带你使用四个能够真正提高工作效率的用法,记得点赞收藏。第一个就是内容自动化,在左侧点击自动化, 新建自动化功能。其实自动化就相当于定时任务,可以帮你自动执行很多重复的工作,你也可以在这里面选你想用的一个项目自动化的一个时间段,比如在这里,我就让他每一天发给我前一天的 ai 资讯后,点击这里的立即执行,就可以使用了。 同理,不管是日报、周报还是一些重复性的工作,比如签到都可以交给他,这样就可以省下非常多的时间。第二个就是办公软件的调用,你只需要告诉他,比如我想让他收集一下近两个月的金价波动,他就可以自己联网帮我搜集资料,整理成 word, 还帮我编辑了一个表格, 像栽秧的部分,甚至关键的一些节点,也帮我标明了图标,整个都非常的详细。接下来我们可以让它把这个 word 变成一个清晰可见的一个 excel, 分了不同类型,有价格节点、政策节点阶段,一个解读获取,一个观察,还是比较清晰的。可以把一个 sale 内容让它再帮我做成 ppt, 以及调用它的 emoji 二的升图功能。第三个就是 skill, 我 觉得 call this 的 在这一点上非常的友好,因为它安装 skill 过程非常简单, 几乎是我用过最省时的,你只需要给他一句话,或者是发一张截图,他就可以直接帮你安好 skill。 另外呢,你也可以点击左侧的技能,在里面选择你觉得比较好用的一些技能。这里给大家推荐几个我常用的 skill, 能够大大的提升工作的效率,操作电脑和浏览器,这也是 codex 的 非常好用的一个功能。 比如我现在可以让它帮我打开 b 站,替我搜索一下 codex 相关的搜索词,并帮我整理成 word 文档,你就可以看到它可以直接操控我的电脑使用,真正实现了电脑替我打工的美梦。现在你就会发现, codex 它不仅是一个聊天工具,还是一个可以直接帮你干活的 ai 助手。

今天 codex 发新版本了啊,就是这个版本有几个功能更新特别好用,我挨个挨个的给大家演示一下。第一个就是它可以自动截图了,比如我们在抠屏的时候,这是一个页面里面有些 bug 要修改,以前可能我们需要手动截图,然后把图片传上去,现在很 简单,两个 cmd 键啊,还是在 mac 电脑上面看,没有就直接截图,我们看一下自动截图,而且它不仅仅是截图啊,不仅仅是你看到的东西。看这个查看文本,还可以把这个页面背后的参数,组建的属性尺寸, 就这个页面背后的信息都可以给你捕捉下来。基于这个你再让它去修改一个什么 bug, 它的理解能力就会非常强,就除了页面展现的问题之外,背后的逻辑都可以给你读出来。基于这个再给你去修改好。这个是截图的功能,两个 command 键一起按自动截图, 然后直接发送你的需求。第二个很好用功能呢,就是前端编辑功能,正好最近六叔用他在写一个封面生成器,直接点击这个前端的页面,在他自带的浏览器里面做一个预览啊。比如这个页面我要修改一些布局文字或者一些排版,以前是靠对话跟他说清楚,现在直接选中好点评论,选择 直接在上面改,看到没有,改完之后,所见即所得,直接在上面生效,我们再来改这个按钮,把这个颜色我们改成一个绿色,选中,你看直接生效,然后在这个对话框里面就可以看到刚刚的一些改动,然后你主动输入,完成这些改动发送啊,最终他就会很精准的按照你的方式做一个修改,包括你的评论,你的批注, 你的团队成员都能够看到,也起到一个协助的功能。用这种方式去修改一些页面,那些 bug 是 不是纯靠口喷,要方便多的多好。这第二个功能所见即所得的 去修改你的网页的任何的问题。格式化的方式。第三个优化的功能啊,大家还记得之前它升级了一个什么版本?移动版本,你可以通过手机端去连接到电脑端,那有个问题,当你的电脑,比如说我的 mac 电脑,我锁屏了啊,这个时候我在外面我就连不上了。 为了解决大家这个问题呢,我们点击设置,这里有个电脑操控,把这个点开,输入你的电脑密码之后,你的 mac 锁屏的状态下,你也可以远程通过你的客户端去连接你的 codex。 我 觉得这个是非常好用的。最后一个功能啊,也非常好用,点这个加号,追求目标,选中适合这种连续性的、复杂性的任务,让它去跑。 比如帮我写一个用户注册的功能,并完成用力测试,在这个功能完成之前,用力测试完成之前,它是不会停的,它会一直的帮你去执行,哪怕一个小时,两个小时,中间你可以随时打开去查看它的一个进度,而且你还可以在这个过程当中不断的去加入你新的指令。如果你的任务比较长,需要多轮的迭代啊,步骤比较多, 耗时也比较长,建议大家可以开启这个购物模式,就是追求目标的模式。好了,以上这几个功能大家赶紧试一试,我持续丰富,你来体验过,拜了个拜。

哈喽,大家好,这是我自己在 codex 里面做出来的一个宠物服装网站,从市场的调研、产品定位、产品图到最后完整的 html 网页,整个过程中我没有手动写代码,也没有来回切换工具,都在 codex 里面完成。 那今天我就用这个真实的案例,想明白普通人到底怎么把 codex 用到自己的创意想法落地当中。一开始我只是给了 codex 一个很粗的需求,我想做一款面向稀泥市场的宠物服装。 他没有直接开始瞎做图,而是先帮我做了非常清晰的执行规划,包括先找到市场依据,定产品的方向,再设计系列以及生成产品图。 这里就涉及 codex 第一个很关键的能力, plan mode, 也叫规划模式,如果要生成同款的计划,你就要把这个规划模式打开。这个模式很适合新手,因为你不是一上来就让 ai 去乱做,而是先让它把任务拆开,告诉你每一步要做什么,为什么这样做,以及最后会交付什么, 你确认方向没有问题之后,再让它开始执行。第二个能力是它可以在项目过程中持续地帮你检查问题,也就是要开启 auto review。 比如网页做完之后,他会检查图片有没有加载成功,按钮有没有溢出,表单字段有没有写进去。那遇到权限和需要选择的操作,比如三种执行方案中,你想选择哪一种,以及需要启动的本地服务访问某些文件之类的风险性操作,他都会弹出弹窗确认。 接下来就开始自动批量生产产品视觉了,通过调用 gpt 的 image 去生产产品图,并存储在本地的文件夹里面,方便我们去找原始的素材。 但是这里我也想说一句实话, ai 第一次做出来不一定完全对,比如他最开始给我的风格就比较普通,我觉得不适合当地市场的审美。 这个时候就用到了 codex 里面很重要的一个能力, steer 也叫做中途接管,可以在对话框中输入你不满意的理由,告诉他这个方向是不对的。比如我要更鲜艳的花朵,更适合女生,更有悉尼精品宠物品牌的感觉。然后点击 steer 去接管方向盘, 他按照我新的反馈去重新调研,重新调整产品系列,重新生成图片。这个过程就好像是你在和一个设计助理协助他负责执行,但是方向盘一直在你的手里。最后,我让柯黛斯给这个宠物服装的项目呢,做出了六个设计系列,每个系列三张图,佩戴的生活方式图, 一张产品的细节,一套平铺图。也就是说,不同于 j b t image 的 单张出图功能,它一次帮我规划并生成了十八张用于落地页的产品测试概念图。 那对于普通人来说呢,这一步就非常省时间了。图片定下来之后, codex 就 把所有的内容整合成了一个静态的落地页, 这个页面里面有品牌管理、产品系列卖点说明、尺寸指南。如果我觉得某个地方不顺眼,也不用自己去改代码,可以直接在预览页面里面指出问题,点击驱动批注,英文是 annotation。 比如标题太大,图片间距不对,或者是按钮的颜色不够明显, 那 codex 会定位到对应的代码并进行修改。这对零基础的人很关键,因为你不需要懂 html, javascript 也能把一个网页打磨到可以测试市场的程度。完成好之后就是这样一个页面了, 最后所有的东西都会留在本地项目的文件夹里,图片、网页、代码、素材文件都在里面,你可以直接在本地打开,也可以部署测试,用来收集用户的邮箱和偏好反馈。所以,如果你想测试一个产品的想法, 一个小众的品牌,一个服务的页面,一个预售的活动。以前你可能要找设计,找前端,找运营,找人写文案, 那现在呢?你可以用 codex 做出一个最小的可行版本,拿去测试真实的用户反应。如果你是 gpt 的 plus pro 或者是 business 的 团队账号,通常会有更完整的 codex 的 使用权限。 所以,如果你已经是 gpt 的 plus 会员,这个功能对于你来说是完全可以去免费尝试的。对普通人来说,它最有价值的地方是, 你不需要在一开始就花钱去找团队,也不需要把想法都停留在脑子里。你可以先用 codex 做出一个真实的页面,跑一轮反馈,再决定这个项目是否值得继续投入。谢谢大家。

程序员注意,现在手机也支持 codex 了,但重点不是让你在手机上写代码,真正重要的是,你可以随时随地控制电脑上的 codex。 以前 codex 跑到一半问你要不要继续,要不要执行命令,你人不在任务就停住。 现在你在手机上就能看进度,批操作、改方向。过去的 ai 编程工作流有一个很大的问题,人必须跟着 agent 的 节奏走。 他问你要不要继续,你不在,他停,他问方案选 a 还是 b, 你 不回,他停,他要执行测试或者高风险命令,你没批准,他还是停, 这不是能力问题,是协助半径太短。 agent 很 强,但他被锁在电脑前。 openai, 把 codex 放进 chat gpt 手机 app, 但重点不是在手机上跑代码, 真正干活的还是你的 mac、 mac mini、 devbox 或者远程开发机。手机只负责看批改方向,文件、凭证、权限都还留在原来的机器上。这件事真正改变的是 agent 工作方式。 以前你在陪 agent 跑,现在是 agent 跟着你的节奏跑。你在地铁上可以看他跑到哪一步,你在开会时可以审一眼 diff, 你 在吃饭时可以批准他继续测试。你在路上发现方向错了,可以直接打一行字让他改。 你看官方信息里真正关键的表述,在 chat gpt 移动应用中开始新工作,查看输出结果,控制执行进度并批准后续步骤。 这句话的重点不是移动端,而是控制执行进度和批准后续步骤。也就是说,手机端承担的是 agent 工作流理的控制面,而不是代码运行面。具体怎么用?第一步,电脑上先跑 codex, 目前主要支持 macos、 windows, 还要等。 第二步,手机更新 chat gpt app, ios 和安卓都已经有 preview。 第三步,在 chat gpt 里打开 codex, 你 就能看到正在跑的任务线程。 第四步,在手机上看 beef, 看测试结果,回复新指令,批准高风险操作,甚至新建任务,继续跑。 这次更新不是让程序员在手机上写完整项目,他更像是给你的 ai 程序员加了一个随身遥控器,你不用把文件凭证、开发环境搬到手机上,你只需要在他需要判断、批准和纠篇的时候能立刻出现。 所以这次更新不是 codex 多了个手机版,而是你的 ai 程序员终于有了一个随身遥控器。对程序员来说,这比手机写代码重要得多。因为真正的效率提升不是你在哪里敲字,而是 agent 卡住的时候,你能不能立刻让他继续往前跑。

今天我们会完成桌面板打开之后的第一次设置,那么我们就开始吧。第一次打开 codex 桌面板,我们要先把界面分成三块来看,左侧是项目和一些插件的入口,中间就是我们的一个对话框了,最下面有一个设置面 板管理。对,那么我们新手进来要先处理几件事情,第一个工作模式,第二个选举指令,第三个批准策略,第四个沙盒,第五个插件入口。 ok, 那 我们先进到设置里面看, 在设置里面左侧有十二个分类,包括常规、外观配置等等。第一次使用我们重点来看这几个,我们先点开常规,常规的第一项就是一个工作模作,开发项目的时候,我们一般选择适用于编程, 你选择了这个模式,那么 codex 会更愿意指示文件命令验证方式。如果你平时是以日常工作居多,比如说是以文字创意等等,那你可以选择用日常工作。在下面的权限区域,我们要来看一个重点是完全访问权限,这里记得是关闭的状态,如果这个开关打开之后, codex 可以 直接编辑更大范围的本机文件,运行网络命令,它的风险会明显变高,所以作为新手阶段而言,我们默认把它关闭掉就可以了。这里的速度可以选择是标准还是快速, codex 会基于跟你的一个整体对话,给到你一个相应的建议,当然如果用快速的话,它的套餐用量也是会增加的,那么我们平时用标准就可以。 那接下去我们来看第二个重点是个性化的,这个选项里面有两个,一个是个性,主要是选择 codex 回复的默认语气, 我这里选择的是务实,希望它能够简洁、专注和直接。第二个我们要去关注的是自定义的指令,这里的自定义指令要知道它是局工作规则,所有的项目都会读到它。所以新手我建议你们只要写八行内容就可以,这八行内容我会放在评论区,当然我自己的会 更完整更长一些。我的结构大概是包括使用范围与优先级通用的一个工作流,安全与合规,通用代码规则,验证与测试提交的规范,常见的项目命令工具,然后输出的一个文本规则。还有一些个人偏好,对, 我觉得大家一开始就用前面的这个八行就足够了,后面当你越用越多。你可以跟 codex 去总结你们经常碰到的一些问题,或者是你自己觉得 codex 经常会犯的一些错误,你把它整理成对应的规则放进去就可以了好吗?它有一个记忆的选项,目前是实验阶段,大家可以把起用记忆这个给开启就可以, ok。 第三个重点是配置,我们来看一下配置的页面配置我们来关注两个内容,第一个是批准策略,第二个是杀核设置。批准策略一般我们都会默认的是 on request, 它的意思就是说当 codex 遇到高风险动作的时候,就会停下来让你确认。当然这里如果说你是用 never, 那 就相当于一次执行到底了,不需要你的任何的批准,所以我建议新手都是用 on request 吧。沙盒设置这里它的默认是 workspace right, 它主要在当前项目里改文件,允许网络访问,这里就是默认开启,你可以把这里的批准策略理解成为它是一个确认按钮,哪些时候需要你来确认?把沙盒设置理解成为 codex 的 活动范围, 你给它框定了一个能够编辑文件和改文件的一个范围,它就只能在这个范围里去进行一个行动。我们再来看一个大家比较容易忽略的一个点,或者是比较容易混淆的一个点, 就是在桌面面板的左侧有一个插件,这里的插件它其实包含了 skill, mcp 和 connect。 skill 是 工作流,是我们的一个技能文件,它里面包括一些代码审查、做表格、生成 ppt 等等。同时像 mcp 就是 codex, code 等等。 connect 呢,是第三方账号的一个连接, 比如说像这 eraser, git, a lotion 都会有,所以这里的插件其实它就是一个能力包的一个合集,像 m, c, p, skill, connect 这些都是它里面的具体的能力,大家根据需要去进行一个安装就可以。 ok, 那 我们再回到设置里面剩下的几个,我们只是来做一个印象, 比如说像外观,你可以基于自己的系统去定义主题色,浅色或者是深色,当然这里有一个隐藏选项,它有一个宠物,看到了吗?这个就跟 cloud code 是 一样的,就是最近出了一个宠物,当你选择唤醒它的时候, 你看它的右下角就会出现这样的很可爱的一个宠物形象来陪伴你头顶。 it 主要是来管理分支的,像浏览器使用和电脑操控,主要针对的就是 browser use 和 computer use, 在 我们后面也会去讲到像以规章和使用情况,就是你本地的一个任务的一个管理和一个用量的展示,平时经常的去看就可以了。

今天我们来聊一聊如何让 codex 的 go 命令能够做到完全不需要人工干预的自主开发。是的, 然后我们会聊到像 real loop plan 模式,还有 spec driven 这些高级的技巧,是怎么帮助我们突破传统的对话模式的限制,做到常识的任务执行和复杂的任务执行呢?这个话题很有意思,那我们就直接开始吧。咱们先来说说传统的对话模式到底有哪些问题, 为什么呢?没有办法支持这种长时间运行的复杂的任务,就是在传统的对话模式下面,一旦这个 token 的 数量达到了上限,系统就会强行的压缩历史记录。嗯,那这个时候就会导致一些比较重要的关于目标的描述就会丢失掉, 然后 ai 就 会出现跑偏,或者说直接卡死,对,这是一个非常影响体验的事情。确实,那有没有什么技术可以让这个任务状态能够跳出这个上下文窗口,做到即使重启终端也不会丢失呢?当然有了, 现在的技术,可以把任务的状态保存在上下文窗口之外的一个地方哦,这样的话,不管终端重启多少次,或者说运行多长时间,这个状态都是一直存在的。没错,就真正的实现了无人值守的连续运行。 那这种 agent loop 的 机制和我们传统的这种 chat ui 相比,它到底在哪些地方做了改进? 最明显的改进就是状态管理这方面,传统的 chat ui, 它的状态是跟着这个上下文走的,嗯,你稍微一滑动可能就找不到了,然后很容易就会断掉,需要手动地去触发,或者说写一些外部的脚本来维持。对,但是 agent loop, 它把这个状态单独地存在了外面, 所以它是支持断点续传的,也不怕重启,直接就可以恢复现场。听起来确实省心了不少。那在执行时长和开发者的操作方式上面,这两者差别大吗?差别很大,传统的 chat ui 一 般都是几分钟,然后就局限于一个短的文本的交互。对,而 agent loop 它是受限于这个 token 的 预算, 所以它可以运行很长时间。那开发者的角色也从这种不断地去发指令变成了一个监督者。 ok, 只需要在必要的时候去做一些干预就可以了。 我想知道到底在哪些场景下面是完全不需要使用这个 go 命令的?比如说我现在有一个特别小的任务,是不是就没有必要用它? 对,如果是一个非常简单的单轮的任务,比如说你就是让他用 python 写一个冒泡排序,那你直接问就好了。没错,不需要用 agent, 用 agent 反而增加了系统的负担。那如果说我这个需求本身就特别模糊,是不是也不适合?是的,如果说你提的需求是那种极度模糊的,比如说你让他去开发一个背单词的 app, 嗯, 那这个时候 ai 就 会不断地去自询问,自扩展,然后很快就会耗尽你的预算。对,而且它的方向也很难去控制。明白了,那要是这个任务在执行的过程当中,经常需要人来做决定, 比如说涉及到一些商业策略或者用户体验的选择,是不是也不能用这个高密令?没错没错,这种需要高频的人类的输入,或者说涉及到一些商业判断交互设计的这种,嗯,那还是建议手动去做,因为他这个 agent 是 静默的执行的,没有办法实时的去跟你确认。对,可能就会导致决策失误。 如果我现在要操作一些非常危险的,比如说删除文件或者清空数据库,这种操作是不是也不能交给这个自动的系统去做?千万不要因为这种涉及到一些不可逆的操作, 或者说你在 plan 模式里面又错误的欠套了调用,嗯,就很有可能会造成数据的丢失或者说系统的崩溃,对, 这种灾难级的风险是一定要避免的。我们接下来就说一说掌控这个引擎的配置和它的生命周期的控制, 就是我们到底怎么才能通过配置文件或者自然语言的指令来开启这个 go 命令?其实很简单,你只要在这个配置文件的 features 字段里面新增一个开启的指令,或者你直接用自然语言说帮我开启 codex 新增的 go 命令,嗯,就可以了, 但是你改完之后必须要重启 cadx 引擎才会生效。哦,了解了,那如果我在运行这个 go 命令的过程当中,我想要暂停,想要恢复,或者说我想要知道它到底用了多少资源, 有没有什么简单的命令可以直接操作?有啊,你要启动的话就直接输入 go, 加上你的提示词就可以了。嗯,然后它会有一个实时的监控面板跳出来,告诉你它已经跑了多久了,用了多少 token。 对, 那如果你想要暂停的话,你就输入 go pause, 想要恢复的话,你就输入 go resume, 就 算你把这个 ide 关了,或者说你重启了电脑,它也可以从你上次断掉的地方继续跑,没错,非常的方便。 那我们再来讨论一下这个完美自制的 prompt, 它的结构。为什么我们要特别的去关注这个范围边界和严格约束这两个模块?是这样的,范围边界其实就是用来限定它的这个操作区域。嗯,比如说你可以规定它只许动某一个文件,其他的文件一个都不许碰。对, 这样的话哪怕它出了问题也不会影响到整个项目。然后严格约束,就是说你可以规定它必须要用什么版本的库, 或者说明确地写清楚他的代码风格。没错,这样的话就可以最大程度地保证他跑出来的东西是你想要的。能不能举一个例子,就是说这几个模块范围边界严格约束完成定义和垄断机制在一个实际的 prompt 里面是怎么配合工作的? 可以啊,比如说我们现在有一个任务是要扩展 jason 的 词库到一千个唯一的词条,那这个时候我们的 prompt 就 会是这样的,首先用范围边界限定只许动这个特定的文件,嗯,然后用严格约束规定必须要用原生的 api 来解析, 再用完成定义写明当这个文件里面真的有一千个不重复的词条,并且可以被成功读取的时候才算完成。对,最后熔断机制,就是说一旦他遇到了三次 jason 解析错误,或者说 token 用完了,他就立刻停下来, 这样的话就可以保证这个任务是既安全又高效的。听起来很不错啊,那我们现在要讲的这个进阶功法一, skill 自动化的提示词生成器,它到底是怎么帮我们来解决手写 prompt 又麻烦又容易出错的这个问题的?你只需要用自然语言把你的需求极简地描述出来。嗯, 比如说你就说为项目增加 cohere rank 作为第五个 provider。 对, 然后这个 skill 引擎就会自动地帮你去查找,并且把这些参数、边界条件、完成状态等等这些东西都帮你组装好, 生成一个完整的蓝图。没错,你就再也不用去担心你会漏写一些关键的东西啊,或者说你要花很多时间去调格式啊什么之类的,真方便啊。 那我们接下来要聊的这个进阶功法二,就是这个 plan 模式,它到底是怎么做到把思考和执行分开,然后来提升我们处理这种比较模糊的、比较复杂的需求的能力的?其实 plan 模式它就相当于这个项目里面的大脑, 他专门负责跟你一起讨论,然后产出一个高层的架构设计。对,那这个时候你就可以不断的去跟他互动,把这个方案逐步的细化。嗯,等到你确定了之后,再把这些具体的任务交给购模式去执行, 这样的话就可以保证每一行代码都是在按照这个战略方向在推进,没错,就不会跑偏。那这个 plan 模式在向购模式提交任务的时候,有没有什么一定要注意的工作流?有啊, 就是你一定要先在 plan 模式下面让 ai 把这个开发清单一步一步地都列出来。嗯,然后你要确认它每一步都是你想要的, 接着你要进到这个气闸仓,就是做一个上下文的清洗。对,最后你才可以把这个任务安全地交给购物模式去执行。 如果你不做这个清洗的话,就很有可能会出现这种虚假的激活啊,或者说直接卡死啊之类的问题。没错,这个是非常关键的。我还有一个疑问,这个 spec driven 到底是在一个什么样的场景下面,会比我们传统的这种提示词的方式更有优势?嗯, 当你的这个任务是一个涉及到多个系统模块的这种长城的重构。嗯,那这个时候就算你的提示词写得再完美,也很容易会出现一些理解上的偏差。对, 那这个时候我们就需要用这个 spec driven, 就是 把我们的自然语言的需求通过这个 open spec 的 转换引擎,变成一个非常严谨的无二异性的规格描述。没错,并且我们可以明确定意这个 go 的 唯一的完成的标准。 这样的话就可以确保 ai 在 执行这种非常复杂的任务的时候,每一步都是符合这个架构的要求的。原来如此啊,那这个 openstack 到底是怎么跟这个 go 命令配合来实现这种工业级的全自动的开发流水线呢? 首先,第一步,我们要在项目的根部路运行 openstack 的 出场的指令,它会帮你植入一个规格生成引擎,然后它会全盘的扫描你的这个项目。嗯,你只要输入一个极简的需求, 它就会自动地帮你生成一个非常严密的叫做 speck md 的 架构调整方案。对,同时它也会生成一个 open speck 的 配置文件的实历,里面详细地列出了每一个文件的修改路径和它们之间的依赖关系。没错, 最后你就可以让 go 命令完全按照这个 spec 点 m d 的 标准去自动地开发,或者说自动地重构你的整个文件架构。我想知道就是面对不同复杂度的开发任务,我们应该怎么去挑选最合适的?这个全自动的开发管线是这样的, 对于那种比较简单的,或者说只是单纯地追加一个功能,又或者是说接入一个独立的 api。 嗯,那你可以直接用 custom skill, 你 只要把你的需求用文本描述一下就可以了,它会帮你自动地补全一些边界的条件,然后直接就可以用 go 命令帮你输出结果。对, 那如果你的需求是稍微有一点模糊的,或者说你要做一些比较复杂的商业化的改造,那建议你使用 plan 模式加上 go 命令。嗯,先通过对话的方式把你的计划完善一下,然后清洗一下上下文,再用 go 命令一条一条地去实现你的需求。没错, 如果你的任务是一个系统级的重构,或者说涉及到很多模块的底层逻辑的修改,那你最好是用 openspec 加上告命令。嗯,先自动地生成一个 spec 点 md 的 规格书, 然后让构命令严格地按照这个文档的状态去逐步地推进。明白了,那我还有一个问题,为什么这三大黄金纪律可以真的让 ai 架构师做到真正的无干预的自制?这三大纪律其实是一个保障,就第一个,你要永远定义终点, 你一定要明确的告诉他什么时候该停下来。嗯,包括你要设置 token 的 预警,不然的话他就会一直跑一直跑,最后把你的预算全部都吃光。对, 然后第二个是谋定而后动,就是你一定要把这个规划和执行拆分开,让人类来负责那些模糊的战略的设计, 然后让这个持久化的 agent 来负责不知疲倦的去实现这些代码。没错,最后一个是信任外部状态,你要习惯把上下文和运行的状态彻底的分开。嗯, 你可以随时的关掉你的终端,让 rufluq 在 后台帮你默默的构建你的项目。对,等你再回来的时候,他已经帮你搞定了, 然后会输出一个 success autonomous looped establish。 好 的,今天我们聊了很多关于如何让 ai 可以 真正地做到无人执手的自主开发。嗯,从这种常识的状态管理,到这种复杂的任务的分解,再到这种全自动的流水线, 确实让我们看到了未来软件开发的一个新的方向。 ok, 那 这期节目咱们就到这里了,感谢大家的收听,咱们下次见,拜拜。拜拜。

大,真的是一个头两个大呀。大周末的,刚起床跑了一下任务,五月六号买的 plus 会员到现在就只剩下百分之三十四了, plus 是 完全不够用。 我这边找了一篇文章,几个技巧能够彻底解决扣袋子跑久了会越来越笨,越来越慢,还能省掉百分之四十上下文的一些技巧给大家分享一下。这篇文章说一下我的理解。第一个,扣袋子跑久了之后会越来越笨, 越来越慢,这个是基本成立的,但是其实逻辑上不是因为模型真的变笨了,其实绘画的上下文越来越长,旧的一些信息,过激的计划, 一些失败的尝试,都混在一起,就会让我们体感上觉得迟钝。判断是对的,如果是有效,上下文的质量下降了,就会导致整个推理和执行的质量下降。第二点,关掉 process location 方向是对的,但不是万能的。减少输出规划的趋势确实能够减少偷客的消耗和噪音,但是问题是,如果你不让 agent 去汇报他这个过程,你也是很难发现他是不是走偏的。尤其是像我们做一些比较复杂的产品架构,涉及到一些复杂的 bug 解决,那适度的汇报还是要看的。 所以并不是说你在那里一直执行你就该干嘛去了,这是非常不合适的。所以更合理的做法就是简单的任务让他少说那长任务,保留一些关键的进展,就不要去输出这种长的身体活动,不要把每一步的工具调用都解释一遍, 这招是有用的,但是全部是被 token 这件事情是说的绝对。第三点是让 code 子当协调者都用 sub agent, 这个是部分对,但是不能滥用。 sub agent 确实能够把一些探索性的任务分散出去,但是主要是你的目的是为了减少上下文的污染,但是只有那种多模块变形调查 架构,审查大代码库的一个区域分析,要变形解读很多的文件,这这一类才是比较适合的。 但是他也会有一些问题,那指 a 诊呢,也会犯错,而且主 a 诊呢还要去汇总他的结果,所以如果本身的任务是限性的,那你多开 a 诊的反倒会增加他协调成本。那么你们讲到的同时开五个,就相当于五个上下文的并行。 这个方向是对的,但是很容易让别人误解,开的越多越好,那实际上只有那种并行边界清晰的任务才值得猜好。第四个是先列他这个例子的 再动手。这个建议其实是很实用的,特别是在一些大大的一个项目里面,你的 prd 原型在任务池并存的一些项目里面,先列任务就能够防止它改错文件,越界重构,甚至是忘记同步相关的一些文件,做到一半就偏题了。特别是像 有时候网络还不稳定,但是小人物就不需要复杂的计划了,比如改一个方案,一个就直接改就好了, ok。 第五个是禁止在代码库里留垃圾,对,而且非常重要。现在 ai 的 一个常见问题就是说它生成的临时脚本,它不删留 delete 文件, 复制旧版的一些文件,乱建一些草稿,把 etc 的 分析结果写进仓库里面,这都是它的问题,会让这个项目越来越乱,也会让后续的 a 制误读项目的状态, 不过这里要区分不是所有的 m g 啊,后缀的文件都是垃圾,那有些是长期的,一个上下文的资产就不是污染好。第六个就是规划,用高推理的模型,执行用快速的模型,这个策略比较合理。 我最早去考虑这个事情的时候,就是因为价格的问题,比如说好的模型,贵的模型去做推理,你把他执行的要求给到一些 poke, 比较便宜的模型去做执行, 也对,看有没有这个必要了。总之一点,如果你的执行模型能力不够,那你就可能把你的规划 在外,所以在切换模型的时候就要把边界写的很清楚。我个人理解,除非你的后坑消耗是巨大的,不然我就觉得没有必要折腾。其实这就是在解决上下文丢失和重复犯错的问题。最终的结论就是,整个他的博主分享的这个文章核心方向都是对的。 后段时长时间的工作质量下降,主要来自于上下文的污染。项目状态不清,无纪律和无记录的写作大概就是这样子的。确实, 连续二十八天都是在每天早上七点钟起床,无论前一天晚上几点睡都是这样子。晚,对,非常晚,四五点才睡,今天睡到大概十点多,整个脑子居然会比较清醒啊。 今天就分享到这里,后续会继续去分享一些 holddance 的 使用体验吧。

如果今天我还只是讲我要学 e c five, 那 这条视频又变成铺垫了,所以我直接往前推进一步。而我现在做自媒体,最真实的问题交给 cortex 拆成一个产品原型。我的问题不是不会拍,也不是不会剪,真正卡住我的是每条视频都有一堆分散的东西, 选择题、素材、录音、字幕、全篇、发布文案,还有发布后的数据。东西一多,我就不知道下一步该做什么。所以这次我没有先做内容,而是按照 e c five 的 思路,先把真实问题拆成需求。我让 codex 给这个工具定了一个很小的 mvp, 他不负责一键爆款,也不负责自动发布。他只做一件事,让我打开,他就知道这条视频卡在哪,缺什么素材,下一步该做什么。这就是第一版原型,左边是视频项目,中间是七个流程节点, 选择题、素材、录音、字幕、全篇、发布库盘,右边不是普通备注,而是 codex 建议区。 他要告诉我当前最大的主塞是什么,需要什么文件,发布前有什么风险,下一条内容该怎么调整。所以这不是一个任务表,它是我用 e c five 做出来的第一个 ai 产品需求单。今天先做到能看见下一条,我会让 cortex 把它继续做成真正可用的界面。

我最近觉得我强的可怕,我现在掌握了一个软件,它解决了困扰了我很久很久的问题,它就是扣的 x, 因为它加快了我得到反馈的频率,我只用了一天的时间,我把我们的独立站重新建立了,把我们的官网全部翻新了。整个过程我是非常被动的,他问我,我解答,然后他会给我 做出来我要的东西,我就能够及时看到效果怎么样,我就得到反馈了。第二,我还做了一个小程序,你看一下 这个小程序是我们内部管理的一个小程序,当我们能够看到我们每个人的积分,还有我们的代办事项,我们的完成度过去,我做这样子一个小程序,我至少要花一万块钱以上,一个月以上的时间,中间我得反复去纠正,但是我现在只花了五分钟做完了, 而且我还用它创建了一个美工,我说帮我做一个 p 二五的电商图主图, 他就能够帮我生成一张我喜欢的主图。那我如果说我有其他的 ai 软件,我说帮我生成 p 二五的主图,那他可能不知道 p 二五是什么,但是他知道我想要什么样的图,那我的美工已经几乎是被我的 code x 去取代掉了。现在这能力技巧都变得非常简单,都没有任何的 门槛。以后的能力体现在多维度的理解,他是个比较抽象的,你又要懂产品,又要懂销售,你要懂用户,你要懂痛点,你要懂市场环境,你必须要对这种东西有多维度的一个了解,你才是真正的有竞争力,有优势, 因为单一的能力已经不再是稀缺的资源,他还替我实现了,比如说我们的 财务数据流水,让它自动的去收集我每天的流水,然后填到表格里面上报上去。除此以外,电脑卡顿的问题啊,我的公司的这些数据没办法利用,我用扣篮子都帮我规范,都帮我解决了。 很早之前我就要求我们公司必须把每个流程都要梳理出来,我觉得这是做的正确的一个事情,因为只有把流程梳理出来了,我才能够喂给 ai, 告诉 ai 我 去怎么去做。我觉得超级个体在我们公司马上就会发生 一人公司不再是非常遥远的东西了,我们公司三十个人,我相信 我们可以在一年之内做到三百个人的战斗力,我觉得是完全有可能实现的。后面 我还要给他创建智能体,我要给他创建单独的微信,部署到单独电脑上面,我要让我的 ai 员工之间能够相互的交流,能够替我更加 简单的,更加省心的做事情出来,等我后面的反馈,如果有任何进展,我会跟你们分享的。

很多人第一次看到 codex, 以为它只是一个会写代码的聊天框,错了。对小白来说, codex 真正重要的地方是它能进入项目文件夹,围绕一个目标持续推进,把结果落到文件里。 普通 ai 更像顾问,你问一句,他答一句。 codex 更像同事,你给他一个项目,一个目标,一个权限边界,他可以把任务拆开,然后一步步推进。 新手第一步不是追模型民,也不是找神提示词。先认识 codex 的 工作台,左边是项目和 thread, 中间是任务推进过程,结果会落在你的项目里。 小白上手路线可以压成五步,先安装登录,再添加项目文件夹,然后新建 thread, 用一句话说清楚目标,最后让它先列计划,不要一上来就直接改。 下载安装本身不难,真正要记住的是入口、账号、模型、权限都会随时间变化,教程只能帮你建立路径感,最终要以你账号里真实能看到的页面为准。 很多小白越用越乱,不是 codex 不 行,而是文件夹一开始就乱。建议先把学习资料、真实项目、沙盒、测试、通用工具分开,添加项目文件夹后,再在里面开 thread。 你可以把文件夹理解成项目群,把 thread 理解成群里的一个具体话题贴。黄金法则只有一句,同一个文件夹里做同一个大方向,同一个 thread 里只推进一件具体的事。不要上午改网页,下午算表格,晚上写文案,全塞进同一条任务线。 设置部分,先抓三件事, generally, 允许后台运行。 personalization 里写清协助规则,权限模式按风险选择,别为了快,把重要目录随便交给全权限。 personalization 本质上就是图形界面的项目规则。你要告诉 codex 改动要小,动手前先说计划,不要胡编路径,不要泄露密,要改完要告诉你最小检查命令。 skills 是 小白最容易低估的部分,它不是炫技插件,而是把固定做事方法沉淀下来。比如写作、调研、生成图文代码检查,都可以变成可附用能力。 定时任务、 m c p。 记忆系统、电脑自动化都很强,但新手不要第一天全开。正确顺序是先会文件夹和 thread, 再会规则和 diff, 最后再接工具和自动化。 如果这个视频只让你记住一个按钮,那就是 plan mode。 它的价值是先让 codex 只规划不动代码, 等你确认计划合理,再允许它执行斜杠命令 status。 推理深度是你日常控制 codex 的 三个入口,简单任务用低一点的推理深度,大任务再切到 high 或 extra high。 真正开始 web coding 后,门槛会从会不会写代码变成会不会描述需求。 你可以开麦说目标,但目标必须具体做什么给谁用,改哪里,怎么验收。也要诚实一点, codex 不是 所有领域都一次做到最好,前端效果不好就换更适合前端的组合,或者明确给它设计规范和截图反馈。 不要跟工具硬较劲。多个 threat 可以 并行推进,但前提是目标拆得清楚。比如一个 threat 改首页,一个 threat 写文档,一个 threat 做数据脚本,不要让他们抢同一批文件。 最后也是最重要的代码管理习惯让 codex 改代码,但不要让项目失控,每次任务都看改动范围,看 diff 跑最小检查确认没问题再提交。 总结一下,小白用 codex 的 最小路线不是学完所有技术,而是先做到三件事,会描述目标,会拆分任务,会检查结果。做到这三件事,你就不是在学一个工具,而是在学一种新的做事方式。

今天教大家用手机控制电脑上的 codex, 这个功能很好理解,电脑继续负责跑项目,手机让你随时看到进度,也能在关键时候做决定。在 mac 上打开 codex, 登录账号,选中你正在做的项目, 直接交代任务,比如修复一个问题,调整一个页面,或者让它帮你运行测试。离开电脑之后,打开手机上的嵌 gpt, 进入 codex, 你会看到正在运行的设备,比如 macbook 或者 mac mini。 点进去手机就能看到 codex 在 电脑上的工作状态,它现在处理到哪一步,改了哪些文件, 测试有没有通过,电脑画面里发生了什么,都会同步到手机上。 codex 需要你确认的时候, 会把请求发到手机上,你可以批准,也可以拒绝,还可以直接告诉他换个方向继续处理。代码、文件权限和本地环境都还留在电脑里,手机只负责查看进度,发指令, 做审批,这就很适合那些需要等一段时间的开发任务,你可以在路上看一眼修改结果,排队时批准测试。回到电脑前, codex 已经把进度整理好了, codex 手机版的价值就在这里,电脑继续工作,你随时接收。

这条视频讲 codex a subagent, 小 白也能听懂的版本。它不是一个新软件,也不是神秘功能,而是 codex 处理复杂任务的一种用法, 你会看到它什么时候该用,什么时候别用,以及怎么用它。 review 一个真实项目,先给 subagent 下一个最朴素的定义。一个复杂任务,你可以让 codex 拆成几块,分别交给几个子代理并行处理。 每个子代理跑在自己的 agent thread 里,最后只把结论交回主线成汇总。官方术语听起来会正式一点。 sub agent workflow 指同时跑多个并行代理在汇总。 sub agent 是 被派出去做某件事的代理, agent, thread 则是每个代理自己的线程,你可以在 cli 里查看和切换。 sub agent 主要解决两件事,第一, context 被污染,读文件跑命令看报错,猜原因,全塞进主线城,后面判断就容易乱。 第二,该病型的事被串行,做安全测试风格可维护性本来可以同时看,却被一个代理从头查到尾。判断要不要开 sub agent。 可以 先问一个问题,任务能不能拆成几块?互不依赖的小事, 能拆就适合试,拆不开就别硬上。任务很小,子任务紧咬在一起,写入范围重叠,或者你自己都还没想清楚怎么拆,这些情况开了反而添乱。不适合的情况也要记住,任务本身很小,没必要开多个代理。 几个子任务互相咬的很紧,并行也不省时间。最危险的是多个代理同时改同一篇文件,这时候省下来的时间很可能被冲突和反攻吃掉。 真正适合练手的场景大多是 rate heavy, 比如大型代码库探索 pr, 多维 review 几个 bug 方向, b 型排查,长文档和长日制分块分析。官方也建议新手起步时先选探索测试、 treeash 和总结这类任务。 codex 默认不会主动开 sub agent, 你 要在 prompt 里讲清楚。常见说法包括 spawn two agents, delegate this work in parallel use one agent per point。 中文直接说启动三个 sub agent, 分 别检查安全测试和可维护性也可以。如果拿来 review pr, 可以 直接用这个模板,一个 sub agent 检查潜在 bug, 一个检查测试覆盖,一个检查代码质量和可维护性, 最后要求主线程等三个都完成后再输出高风险、中风险可选优化,以及建议优先修什么。 这个模板真正值钱的不是文字本身,而是里面的控制点。每个子代理的职责不重叠,避免大家都泛泛 review 一 遍,明确等全部完成再汇总,可以避免主代理拿着半成品就下结论。最后加一句,优先修什么,可以把排序工作也交给主县城。 接下来用 ship ready 这个小项目做例子,它是一个 s s landing page audit 的 mvp, 后端 api 在 s r c app 点 js, 审计规则和 rewrite 在 s r c audit 点 js, 存储是 s r c store 点 js, 前端是 publ i c 斜杠 app 点 js。 代码量不大,正好适合演示怎么稳妥的开 sub agent。 在这个项目里,最稳的开法不是让三个 agent 一 起改代码,而是启动三个 read only sub agent runtime risk agent 看运行风险 q a coverage agent 看测试缺口, architecture agent 看模块边界, 所有子弹里都不要改文件,等全部完成后,主线程再决定要不要修。三个结论里, round time risk agent 最有价值。他发现 handle request 里 in sync 路由没有 await, 外层 try catch 接不住 a sync handler 抛出的错。 这种 bug 在 happy pass 测试里不容易暴露,但线上可能表现成请求挂住或者 unhandle rejection qa coverage agent 的 结论也很实用。 他没有泛泛说测试不够,而是列出 invalid json 未付费 share 过早 follow up。 若 brief 绕过 rewrite 这些副路径, 这些用力不一定都要立刻补,但摆在面前,主县城就能快速挑出最该锁住的状态流。 architecture agent 的 结论最容易让人冲动, 他说 src app 点 js 可以 拆成 page extract checks brief 和 rewrite 几块 判断没错,但这次目标是写测试加修 bug, 不是 重构 auditing, 所以 这部分建议最后先记下来,不立刻动。三个 sub agent 的 优先级其实不一样, round time risks 想让你先修服务端 qa coverage 想让你先补测试, architecture 想让你先理边界。主县城不能给三票打平均分,而是要挑确定性高、改动小、能被测试所注的事情先做,最后真正落地的改动其实很克制, 异步路由统一加 await, 让外层错误处理生效。 rewrite 必须 brief ready 才能解锁, follow up 增加还没提交 brief 和非法字段校验。 read json 加 body size 限制 invalid json 返回四百,最后补 note test 回归测试。 这个案例最有意思的一课是两个代理的结论拼在了一起, round time risk agent 告诉你哪里坏了。 q a coverage agent 告诉你怎么用副路径测试把它锁住, 这就是 sub agent 真正的价值,不是替主线城做决定,而是把几个方向的结论同时端上桌。跑起来之后也要会管理 agent thread codex c l i 里可以用 slash agent 查看和切换线程,如果某个子任务偏离方向,可以让 codex 停掉那个负责性能分析的 sub agent 跑完的线程,也可以让它关闭已经完成的 agent threads。 给新手的练手顺序,不建议一上来就五个 agent 一 起改权。项目先并行阅读,让多个 sub agent 各自理解不同模块,再并行 review, 把 bug 安全测试,可维护性分头看。 第三步是单写,多审一个代理或主线成改代码,其他子代理做 review, 最后才是小范围并行修改。 下一次让 codex review pr, 你 可以直接从这个短 prompt 开始。请使用三个 sub agent 并行检查,当前 pr, 一个看 bug, 一个,看测试一个看可维护性, 等全部完成后,按风险等级汇总给我。就这几句话,已经够你完成第一次 sub agent 练习。 最后记住, sub agent 不是 替主线城做决定,他真正干的活是把几个方向的判断同时端到桌面上,让主线城更快做取舍。新手先从 rate heavy 的 探索和 review 开始,等你能清楚拆分任务,再尝试让多个代理并行改代码。