大家好,这一节我们来讲 codex 的 进阶使用技巧。如果说基础入门解决的是怎么让 codex 好 起来, 那进阶使用解决的就是怎样让 codex 更懂你的项目,并且更稳定地接住复杂任务,融入日常开发流程。首先来看 agnes md, 它可以放在项目跟目录, 你可以把它理解成给 codex 准备的一份项目说明书, codex 启动后会读取它了解项目背景、技术账和目录约定,也可以了解代码规范,以及哪些地方不能随便修改。 比如一个 next js 项目可以写清楚使用 putter。 也可以说明数据库访问要统一,通过指定的 christmas 时的 api 错误处理走统一工具函数生产环境变量不要碰, 没有明确要求时不要修改数据库 sim 也不要删除已有测试。这样做的价值很直接,你不用在每次对话里重复解释规则, codex 获得稳定上下文之后,改代码会更贴近团队约定, 同时也更不容易做出越界操作。第二个技巧是绘画管理大型任务通常不是一次对话就能完成,比如今天分析代码结构,修一部分问题,明天还要继续改造,这时就可以导出和恢复绘画。 在交互界面中可以用 xport 保存当前绘画,下次继续使用 log 恢复上下文。 也可以通过 codex resume last 直接恢复上一次绘画。对于跨天维护、长周期重构、连续排查线上问题,这个能力很有用。第三个方向是把 codex 接入 vs code 官方扩展,可以让你在 idea 中直接使用 codex。 通常流程是打开扩展市场, 搜索 codex or open i codex 安装后登录 check gpt 账号,然后在侧边栏里开始对话。如果你正在看某段代码,也可以把选中的代码发送给 codex, 让它解释、审查或者协助修改。 这样 codex 就 不只是命令行工具,而是进入你的主工作区。第四个进阶用法是四个集成。 codex 可以 可以在无头模式下运行,不需要人工交互,也就是说,它可以直接在流水线里执行任务。一个典型例子是 d 赫八宪子。 当 main 分 支有新提交后,工作流安装 codex 可以 读取 open 内下划线 a p i 下划线 key, 然后运行 code x x, 让 codex 根据最新提交自动更新 change log m d, 最后再提交并推送结果。 这类自动化适合规则清晰、产物明确的任务, 比如生成变更日制、补充文档、整理发布说明。要注意的是, ci 里的权限要收紧,敏感信息放到 secrets 自动提交,也要避免触发无限循环。 最后,我们来看提示词技巧。 codex 的 能力很强,但你的提示词越清楚,它越容易给出可靠结果。第一,提供足够上下文, 不要只说修复 bug, 而要说明报错信息、触发场景、相关文件和出错位置。第二,复杂任务要分步骤,可以先让 codex 只分析问题,等方案确认后再按优先级执行修改。 第三,善用 s 模式探索代码库。 刚接手项目时,可以先让 codex 指读分析认证流程或接口调用链,理解清楚后再切换到可编辑模式动手改。第四,明确写出否定指令, 比如不要修改函数签名,不要改测试文件,不要碰生产环境配置,这些限制能帮助 codex 收窄范围,减少意外影响。第五,让 codex 先汇报再执行。 你可以先问他准备怎么做,让他列出步骤和风险点,确认方向没问题后再让他开始。第一步 总结一下, codex 进阶使用的核心不是让它依次做更多,而是给它更清晰的边界、更稳定的上下文,以及更适合工程流程的入口。 用 agent md 固化项目规则,用绘画管理承接长期任务。 用 vs code 集成贴近日常开发。用 c i 斜杠 cd 处理自动化工作,再配合清晰分步骤有边界的提示词, codex 就 会从一个问答助手变成更可靠的工程协作者。
粉丝19获赞149

美好啊,朋友们,这是一期 codex 奶妈级的零基础系统教程,这期视频我会从安装开始,手把手地把 codex 的 基础能力到高级功能的组合,以及最新的手机端操作,用十个实战场景来带大家彻底拉通 以后这一类的 ai 产品,出一个算一个,你都会触类旁通,游刃有余。我也把这期的文字课间整理成了文档,那这期的含金量可谓是 biu biu biu biu biu, 一个点赞收藏关注是最起码的。好了,不多说,学费都交了吧,我们上课, 那在开始之前,我先说一下 codex 和 cloud code 的 区别。从本质上来说,它俩都是由编程 agent 逐步转向了通用 agent, 分 别是 ansapi 和 open ai。 这两家出的 cloud code 呢,默认使用 cloud 模型,但是我们可以自行替换成任意其他的模型,那在易用程度上, codex 桌面端的产品设计是会更友好的, 更适合零基础的白领工作者,而 cloud code 有 更高的自由度。在功能上, cloud code 原本是最齐全的,什么 skill、 mcp、 斜杠命令、 hock、 远程操控,这都是人家先发明的。但是呢,最近的 c c 更新稍微不如 codex 那 么快了,会更加偏向专业开发者一点。 而 codex 发了非常强的浏览器操控和 computer use, 还内置了最近的 image 二深图模型, 而且昨天还刚刚发布了手机端和 hock, 可以 直接用你的手机 check gpt 来控制电脑上的 codex 干 活。那价格和额度方面呢? codex 的 会员额度非常大方,二十到的会员就很够用,而且还不封号。 而 cloudpod 呢,大多数人可能都没法用它的官方账号基本上都得自行调用 api 的 费用属于是花多少用多少,风险由人。那在使用场景上,我个人喜欢用 cloudpod 搭配 cloud 模型来写作,因为 ops 四点六的写作和规划能力真的很强, 那 codex 的 执行和解决问题的能力也很强。日常的办公场景,我会选择用 codex, 那 在编程的时候嘛,我就两个都用上,所以结论是,入门的朋友用 codex 就 很强了,有条件的朋友呢,两个都来是最完美的, 不过两者的逻辑其实都是一样的,我们学一个,另一个也就会用了。那 cloud code 我 也做了一期系统教程,想拥有左膀右臂的朋友可以去看看。 ok, 正式开始 使用 codex, 我 们唯一需要准备的就是一个叉 gpt 账号,免费的也行,只是会额度稍微少一点。那有了账号之后,我们就直接去它的官网双击安装, 然后安装好之后登录我们的叉 gpt 账号,然后这些设置我们可以先随便选一点啊,选个日常工作,反正后续呢,我们都是可以改的。那搞定了, 那进来之后呢,大家会看到这个对话窗口,好像跟 chat gpt 是 很类似的。那我们打开两边的侧边栏也蛮眼熟的,左边呢,可以管理对话和任务的列表, 那中间就是聊天,右边大概是结果之类的吧,大家应该都能猜个七七八八,所以我们先不深究它的页面,我们直接开用,这其实也是我探索所有的 ai 工具的独门秘方。 我打开一个陌生界面呢,我先不管别的,我先找到我能对话的框,我先聊,先找到我能看得懂的按钮,先按,按着按着你就会了。你看看,独门秘籍都教给大家了,以后你们就是为师的弟子了。 ok, 众弟子不必拘礼,我们还是以学业为重啊。那我们第一个要了解的 codex 能力呢,就是本地文件操作, 也是这一类桌面端的 agent 跟对话 ai 最显著的区别和能力。因为过去我们用叉 gpt, 如果说我们要让它看到我们本地的内容,我们只有两种方式,一个呢就是复制粘贴到这个对话里,另一种就是以它允许的格式和数量把文件给上传上去。 但是 codex 不 一样,它可以自主地读取和操作我们的本地文件,而且不限数量。比如说我作为一个剪辑,我的本地里面存了八十多条视频素材,这都是我剪辑要用的, 但是呢,这个命名全都是乱的,完全看不懂,所以我想以这些视频的内容来命名,到时候我们看见文件名的时候,我们就知道这个素材是什么。那这事 check gpt 肯定是做不了的,但是 codex 可以 我们来看这两个地方,它都显示了一个概念,叫做项目, 我们选择一下,哎,一选择项目,他就让我们选择本地的文件夹了,那我们只要选中这个文件夹,那这个文件就是我们的项目了,里面所有的文件 codex 都可以自由的读取和操作, 当然这需要我们给他权限。大家看这里的权限选择啊,目前呢,我们是一个默认的权限,我们再点开,他有三种权限模式, 那默认权限的意思呢?就是在我们当前的文件夹内,他可以自由的去读写这些文件,但是如果他想要联网呀,或者是帮我们下载一点东西啊, 或者是碰这个文件夹之外的其他文件,那他是不行的,如果他必须要做,就会要向我们提出提高权限的请求,我们点同意才能继续。 那自动审查呢?顾名思义就是有个 ai 自动帮我们审查,由 ai 来判断这个操作危不危险,如果危险呢,就来问我们不危险的,比如说他去下一个知名的这种官方软件什么的,他就直接开干了。 自动审查比默认模式要更宽松和智能,建议大家选这个就完了。那最后呢,是完全访问权限,这意味着 codex 可以 在你的电脑上几乎什么都能干,它可以修改删除任何文件,它可以在任何位置执行命令,例如说它可能会去把你的 cloud code 给删了。 开玩笑啊,它一般情况下是不会这样抽风的。 ai 呢?也没有嫉妒情绪吗? 大家尤其是新手朋友就选择自动审查模式,相信 ai 就 完了,毕竟咱又能审的比 ai 好 多少呢啊,对吧? ok, 那 我们选中了刚刚的这个视频的文件夹,继续来提出我们无理的要求,让他帮我们把这个文件夹里的所有视频素材都按他们的实际画面来重新命名。哎,他就开始做了, 而且大家看他非常的聪明,他先看了看我们到底有多少个视频,然后他选择用抽帧的方式抽取关键画面来判断内容是什么,而且他还知道他不要一张一张图去看,他给拼成了缩略图的形式,一组一组的去看。 ok, 很 快啊,这个文件夹里面的文件名就全改变了。过程中呢, codex 也是没有向我们提全的,因为他都是在这个文件夹内去操作的。那我们也可以检查一下他都对应好了没有。 ok, 钢琴家音乐演奏厅,没错, 雪山近身格斗,没错,旗袍女人夜巷卖热饮哇!而且他的这个命名还遵循着一个序号,任务、场景、行动的一个清晰的命名格式。 ai 做事的这个细心程度啊,人类你不服不行。那另外呢,我们其实也可以在同一个项目里面去开多个不同的对话,它们的上下文都是不一样的,但是同样都可以随时的访问我们这个文件这个项目。 比如说,我们在另外一条对话,我们又给他一个不同的任务,让他想办法把所有关于风景的视频都剪成一整条。 哎,没想到吧,他真的能剪,他自己想办法,用了一些工具问我们要了一些权限,用这个 ffmpeg 给它拼在了一起,效果的确是关于风景的都剪成了一条。 ok, 那 如果我们要创建一个新的任务,我们其实也可以手动的在这边创建,他也会自动的在我们本地创建一个文件夹。 然后呢,我们跟 codex 对 话的整个过程, agent 产生出来的任何文件啊, pdf 啊,什么 markdown, ppt, 它都会直接存在我们本地的电脑上。 ok, 到这里,大家应该 get 了 codex 呢,可以随时地访问我们的本地文件,去读取内容,写文件,删文件,移动文件,文件夹里的内容也就成了我们的 codex 随时可以获取的上下文,那这里的项目也就对应着我们在本地的一个文件夹, 哎,那刚刚这么个任务会花我们多少上下文呢?我们只要看这里就能看到了。 那这个小圈代表的是我们现在的这个对话和里面的操作,一共使用了 gpt 五点五的多少上下文窗口。 如果我们把鼠标悬上去呢,它还会有更详细的一个信息,当上下文快满的时候, codex 会自动地帮我们压缩上下文。不过其实当我们一个任务告一段落之后,不用等它快满了,让它自动压缩,我们也可以自己通过斜杠压缩这个命令 来手动的去压缩上下文,这样呢,可以让模型更聚焦在我们的新任务上,也省一点上下文的额度。那当然大家除了这个对话的上下文余量,其实我们还想知道我作为一个免费用户,或者是我作为一个 pro 用户, plus 会员,我还有多少总共的额度可以用,对吧? 这个呢,有两个方式查看,一个呢是左边的设置,这里我们点开剩余额度,就能看到你五小时内还剩下多少,那本周内又还剩下多少, 甚至呢,也有什么时候到期会刷新的一个提示,这个产品的设计还是比 cloud 的 友好很多的。那另一种方式呢,就是我们可以直接在对话框里输入斜杠,然后找到这个状态, 那打开这个状态之后,它的绘画这里就会持续的显示我们的上下文余量,这个五小时和一周的限额。但再次说实话,这个 codex 的 额度还是非常大方的,二十到的额度我认为是可以满足大多数白领工作的高频使用的。 ok, 那 顺便呢,我们也介绍一下这里的模型选择, 那点开之后,我们可以选择速度,快速呢,就相当于加急通道,会消耗我们更多的额度。那这里呢可以选择其他模型,但是大家都选五点五,因为它确实更好用。然后呢,这里可以选择智能程度,其实呢一般中度智能就够了, 所以我们选高。 ok, 那 这个小麦克风呢,肯定就是语音输入功能了,比手打字还是要快很多的,但是呢,它的转录速度远不如大家去下载一个语音输入法,还是非常推荐大家用语音输入的 好。那现在我们通过一个本地文件处理的案例,也了解了 codex 上常用的一些功能。那 codex 的 第二大能力就是命令行工具使用。 其实刚才我们说到权限的时候就有提到,在默认权限下,它可以读写文件,但是却不能执行一些命令,一些联网的操作。那这些命令是什么意思呢? 刚刚的案例其实也已经用到过了,比如说它把视频抽帧出来,还把几个视频拼接到一起,它用到的 ffmpeg 就是 命令行工具。 还有一些我们熟悉的命令,比如说我们在终端里面来克隆一个 gitup 仓库,或者是大家近期比较熟悉的,我们在命令行里面输入一些命令来下载龙虾和各种依赖。那 codex 的 第二大能力就是在我们授权的情况下,可以使用我们的终端来替我们做这些事。 那我们就来让 codex 帮我们来安装一些平时对于小白来说非常复杂的东西吧。第一类,常用依赖,比如说什么 node gs 啊, git 什么的, 也是大家以后使用各种 agent 或者是做其他项目必备的一些工具啊,那之前大家要装这依赖都得去看一个手把手教程,然后照着命令抄,挨个装。那现在我们就直接跟 codex 说帮我安装个 node js 给他发过去, 也是因为这些东西呢,其实都是比较常见的东西了,所以在我们的自动审核的权限模式下,你看他基本上都不问我们要提权,就熟门熟路的帮我们装好了。 那第二类,就是那些爆火的但是有上手门槛的一些新的 agent, 比如说龙虾,爱马仕,甚至还有这个 codex 的 竞品 cloud code, 我 们都可以让 codex 帮我们装完了呢,它还能教我们该怎么用。那我们装一个 hermes 吧, 我其实都不需要给它官网和仓库链接,我就说最近有一个叫 hermes 的 agent 很 火,你帮我安装一个吧。 哎,他就会自己去搜索,然后帮我们判断到底是哪一个。然后呢,他根据官方的文档帮我们陆续的装好了,还帮我们验证过已经装好了,你瞧瞧,那我们照着他说的来启动一下试试。 哎,真的帮我们装好了,那往后的配置我们就不在这里继续了,但是大家应该 get, 有 了 codex 以后,那些复杂的要收你五九九的部署,你都可以直接让 codex 帮你做了,怒省五九九。而且我们在使用的过程中遇到任何问题,还可以截图去问 codex, 什么瞎死了马挂了,升级出现了问题都可以让 codex 直接帮你修,是不是很方便? 那第三类有点没那么必要,但它其实也可以,就是像 cursor integrity 这种软件应用, 平时都是我们去手动在网页上下载的,它也可以帮你下载和卸载。那大家用 codex, 我 其实也建议大家去下载一个 agent 的 ide 啊,因为现在 codex 有 个缺点是它没有办法打开我们的文件内容,直接去手动编辑。 虽然这个侧边栏呢,是可以看到一些文件结构和内容的,但是我们都没法编辑,所以大家可以让 codex 下载一个自己喜欢的,比如说我们就这样下载。那下好之后呢,我们再执行一个 git i n i t 一个初步化, 那右上角就会出现这个东西,随时可以把我们的项目在编辑器中打开,我们来手动编辑。 那第四类就比较重要了,就是 agent 本身会常用到的那些 skills 啊, mcp 啊和 selli。 那 skill 和 mcp 本身 codex 也是支持的,我们后面会详细讲到, 我先挑两个大家安装一下,方便我们后面综合起来来做案例。那这些 skill 和 c i 呢?通常来讲不像那些 get 那 种大项目那么著名,所以我们最好是找到它的具体仓库,或者是明确的官网地址。比如说我们下载一个专门找 skill 的 这个 find skill 哦,方式就是直接把链接拷贝给 codex, 然后跟他说帮我装一下这个 skill。 那 在他装的期间,我们也说一下 codex 的 另一大好处,并行任务处理, 我们完全可以在他做这个事情的时候再开一个对话,让他去下载一个别的。那我们下载一个飞书 c l i 吧。飞书 c l i 其实非常的典型, 因为现在呢,有一些积极 ai 化的软件,把几乎所有他在软件里能做的操作都做成了命令,让 agent 能够方便的去操作,我们把这个链接发过去,让他开始下载, 那这边呢,其实会显示每一个正在处理当中任务的情况,这个在转呢,就说明它正在执行中,那这个蓝色的点呢,就说明已经完成了,有时候还可能会出现一个需要你申请权限的一个标识。 ok, 那 这里 fan skill 呢?它是已经装好了,我们再看飞书 c l i 这边,它会引导我们去做一些授权, 我们就跟着它的引导去完成就好了。 ok, 那 装好飞书 c l i, 那 codex 就 能帮我们去做飞书里的各种操作了,比如说写文档,发消息,见日历,做表格什么的了,我几乎每天都在用, 好大功告成。我们就这么一个小章节,我们就用自然语言的方式让 codex 帮我们装上了 hermes node, 飞书 c l i 一 大堆东西,这就是 codex 作为 agent 的 第二大常用能力,命令行使用。 那这个能力和这个章节的演示也是希望大家能够 get 到一点,就是我们现在在电脑上想去做的很多很多事情,都可以让 codex 这样的桌面 agent 去做了。那 codex 的 第三大能力是持久记忆。 看过我那篇 cloud code 的 朋友应该都知道, c c 呢,有一个手动的持久记忆, cloud 点 md, 还有一个自动的记忆系统, 都是把我们希望 agent 能够长期记住的,比如规则、篇号和我们的信息之类的东西,以本地文件的方式存在我们的电脑上,然后事实的时候把这些记忆以上下文的方式注入到 agent 里去。那 codex 也是类似的,它也有这两套持久的记忆系统 在 codex 里面呢,手动的持久记忆文件叫做 agents 点 m d, 而且它也有一个自动的记忆机制,来我们打开设置,找到个性化, 那在这里的这个自定义指令实际上就是一个全局生效的 agent state md, 它会在我们任意的项目跟 codex 对 话的时候,它都第一时间作为上下文发给大模型,那我们可以手动地自己在这里写,不过我更喜欢呢,直接在对话中去跟 codex 说, 比如说我说一个,我希望你以后对非书文档里的任何修改都使用一个专属的你的文字颜色和用删除线的方式来修改,不要直接的修改。然后这个帮我寄到局的 a 正 c m d 里。 ok, 那 它这里呢,告诉我们已经写好了,我们再打开个性化这一块,就的确是多出来了这么一套规则,那实际在使用当中,它就会去遵循我们这个规则了。 比如说我这里已经有一篇非输文档了,我在侧面呢也评论了几个我想修改的地方,我直接可以把这个链接发给 codex, 我 让他根据我侧面的评论帮我修改一下。 那因为我们刚才确实已经装好了这个非输的 c r i 也都给他配置好了权限,所以 codex 是 直接可以操作我们的文档的。 ok, 看看它完成之后的效果。 果然他用了紫色的字和删除线的方式来帮我们做的文档修改,那这个呢,是局的 agent md, 适合记一些适用于所有任务的一些大原则,比如说我们的工作习惯,我们要说中文,我们的工作偏好修改文档,要留下这种修改痕迹等等等等。 那另一种呢,就是项目级的 agent md, 这个长期记忆呢,只在这个项目当中生效,我们可以选择一个项目的对话,然后打开编辑器, 自己在这里手动的创建一个 agent 的 md 的 文件,然后我们去写一些针对我们这个项目的一些规则, 当然也可以让 codex 来帮我们写。我个人的建议呢,是在这个项目文件里面有了一些内容之后,让 codex 根据他对我们项目的了解来自己帮我们写。那自动记忆怎么回事呢? 其实我们刚才在这个个性化这个下面我们也看到了,我们需要手动打开这个自动记忆功能, 它的机制是我们打开这个功能之后, codex 会在我们结束对话或者是结束任务,这个对话闲置一段时间之后,它帮我们把那段对话总结成记忆,然后记在一个地方。但是它有几个原则,第一太短的对话它就不记了, 那第二这个对话的总结它一样会消耗我们的额度,所以当我们的额度太低的时候,它也就不记了。 并且这个自动记忆文件呢, open ai 官方是不建议我们去手动修改的,顶多我们可能删一删有些没必要的信息,那这个文件大概是长这样 的,是一个任务,一个任务在记录的,主要呢会写上这个记忆的来源是哪段对话呀?以及它的工作目录是什么,那以及以后触发了什么关键词的时候,它会去召回这段记忆, 再往下呢,是用户在这件事情上的偏好大概是什么样的?那第五段呢,是一些可附用的一些知识,一些踩坑的记录,那这些内容都是 codex 自己记录的,并且以后也是会它自动的招回去使用的,我们就先不修改它, 它这个格式确实也不太方便修改,更多的时候我们对于明确的规则和要求,我们还是通过组织 agent md 来实现。那大家学完这些视频之后呢,我也想给大家再做一期, 通过组织不同层级的这种 agency md 给自己做一个非常懂你的,可以做不同类型事情的超级助手的视频,感兴趣的朋友可以扣个一。 ok, 那 第四大能力就是 codex 可以 直接用到 image, 二来生成图片。不过呢,深图功能其实是一个小功能, 所以这一章节呢,我们不只会用它的图片生成,我们会带大家做一个完整的个人主页的开发项目,并且在了解一些 codex 在 小白开发中的一些用法和功能。那我们再来开一个项目,叫做个人主页, 然后我们点开这个加号,我们把计划模式打开,因为我们要做一个网站嘛,任务会复杂一点,所以打开这个计划模式呢,他会先帮我们列出一个详细的计划,我们确认之后他再开始行动。 计划模式呢,比较适合我们的任务有一定复杂性,或者我们自己还没想清楚,可以跟 ai 讨论出一个计划。那假设我们现在就是第二种情况,我们其实没想清楚,我们直接跟他说我想做一个个人主页, 那你看他看到我们的项目中是没有内容的,所以他以这种选择框的方式来询问我们的细节,这些选项呢,大家可以按照自己的要求去选择,那我就选这个个人品牌吧。 然后如果说这些选项中没有我们满意的呢?我们也可以选到最后一个来填写我们详细的要求,比如说我要他修饰感,也要高级感,然后我选针对合作伙伴,不要个人照 中英双语,巴拉巴拉巴拉。这里真的是问了我们相当多的问题啊,那最后呢,他给到我们出了一个详尽的计划,问我们是否实施此计划,那其实基本的计划我们看着没有什么问题,但我们也可以补充一些调整方案。 比如说我们刚才就要说到了要用它的 image 二的生成能力,我们这里没有体现,我们加一句网页上要多用一些图片,使用 image 二来生成一些高级感的图片,然后我们一起提交。 哎,那他又问我们要走哪种高级感呢?我们如果点开这个小叹号的话,还能看到他说的这个风格到底意味着什么意思,这个产品的小细节真的是我很喜欢,那我们就选他推荐的吧。然后他出了一版新的计划,我瞧着没什么问题, 去吧。 ok, 他 就开始初识化这个项目来逐步帮我们生成了。那这个过程呢,肯定会需要一定的时间,在这个期间我再给大家补充一点点知识点。呦,他的第一张图出来了,不错,挺有艺术感的,果然是最强的 emoji 二,那我要补充的这个知识点呢,叫做引导。 如果说大家在 codex 执行一个很长的任务的过程当中,你觉得他有点跑偏了,我们是可以随时给他补充纠偏的,比如说我们补充一下图片的人味要更强一点,而且不要这么冷的色调。我是一个 ai 博主,然后我们发送出去, 哎,大家会看到他没有立刻打断我们的任务,没有发出去,实际上他在这里排队呢。那我们看到右边的这个引导按钮,他写着我们不打断模型运行,会在下次调用工具后发送过去。这个是非常好的一个功能啊,我们点一下, 哎,他就可以发出去了。这个功能呢,可以让 codex 不 用在错误的道路上一路狂飙,把我们额度都花光,也不会让它重新再跑一轮任务。那另外一个小功能点,我们找到一个已经结束的任务, 我们看一下这个 ai 的 回复,每个 ai 回复的下面都有一个这个按钮,叫做分叉 fork, 这个的意思是我们可以随时从这里开始去开一个新对话,非常适合那种前面聊的还好好的,上下文也非常有价值,但是我们再往下聊,就聊的有点叉劈了的时候。哦,还有个小功能,宠物, 我们点开设置外观,然后这下面就有一小对小宠物可以选,甚至呢,我们还可以点击创建,让 codex 根据对我们的了解来生成一个定制化宠物。那我们先点击唤醒宠物, 哎,就会在桌面上有常驻这么一个小桌宠,脑袋上会冒出来 codex 正在做什么的一个提示,别的呢?好像也没什么用。 ok, 终于在他跑了七七四十九分钟之后,网页完成了, 我们来看看效果,因为 codex 呢,有一个内置的预览浏览器,我们可以直接打开右边的侧边栏啊,我们还给它放大一点。 嗯,这个网页的效果确实是不错啊,不过呢,现在的 a 证呢,其实都有这么一手了,那它这个预览浏览器呢,还有一个好处,我们点击右上方这里的一个批注按钮, 我们就可以在这个页面上选中这里的具体元素去写修改意见,包括重新生成图片,比如说我们要这个 logo 放大一点, 然后 p 住这里这张图加上一个人物,好把这个删掉, 那然后对话框里呢,就会加上我们这几条批注,然后我们点击发送,它就会针对我们的意见进行修改了,是不是挺方便的?那我们现在项目有了雏形之后,我们再 call back 一下刚才说的 agent md, 其实现在呢,就是一个让 codex 帮我们生成项目级 agent md 的 好时候了,因为我们也有了一定的内容,我们就让它自己生成一下,我们打开编辑器看看, 不错,项目的背景,各种信息,各种规则,各种文件路径都已经写好了。那以后呢,无论我们在新开对话,还是我们的聊天记录都已经被清空了, codex 都可以通过这个项目级的 a 证书 md, 立马的了解我们的项目基本情况。 ok, 那 我们先保持这样,先不做精修了,我们直接准备部署上线,当然大家自己做的时候完全可以去打磨的更好,那网页上的这些信息也换成更真实的信息就好。 那我们现在要部署呢,就得要说到 codex 的 第五大能力插件。在现在的 codex 当中,插件大多数是让我们的 agent 跟外部平台、外部工具、外部服务连接的一个作用,它实际上就是我们所说的 skill, mcp, c l i 这一类东西的一个完整集合包,比如说操作邮箱、操作日历、操作 excel 啥的。那我们来点开左边的这个插件栏,我们看这里呢,已经默认帮我们打开了好几个内置插件了,比如说浏览器操作,还有 mac 专有的屏幕操作,还有 excel 表格, ppt 等等。 那他的插件页面没有中文翻译,所以我给大家把这些插件的具体中文意思,分别能干什么也都列出来了,大家课后可以按需装上,点这个加号就好了。那我们先翻到这个 coding 板块,因为我们想要部署上线嘛,通过插件会非常方便。 其实呢,这个 vassel 和 netify 都可以,我们点一个加号给它装上,那如果大家给它没有选上的,也记得要选上。然后我们再回到对话当中,告诉他们,我们想用这个 netify 把这个网站给我们部署上去, 我们大家也不用管他咋部署的,反正他需要干什么呢,他都会告诉我们的。 ok, 他 发现我们没有登录授权,然后主动弹出了这个登录的链接,那这里呢,建议大家用 tapp 账号登录是最方便的, 那登录完之后,他自己就知道我们已经登录好了,然后继续的帮我们部署,这就搞定了。这个链接呢,就是我们最后的网站了, 只要把这个发出去,别人就能访问你的个人主页了。 ai 是 不是个好东西,你说就这么两下子就干了,原来普通人花钱都不一定能干成 o k。 先压抑住我的这个老灯感叹。我们回到刚才我们已经装好的插件, 那其实这里呢,还有两个非常重要的内置插件,就是 browser use 和 computer use, 还有这个 chrome 浏览器, 那这些有什么用呢? browser use 顾名思义呢,就是 codex 可以 直接帮你操控浏览器,比如说它自己点击翻页截图,填写表单等等。通常呢适用于自动化测试前端, 当然也有比较无聊的用途,比如我们可以让 codex 打开这个 m b t i 做个测试试试, 嘿嘿,这样大家能够比较直观的看到它的一个效果吧。那这个鼠标呢,是它自己在移动,然后它是自己看了上面的答案在自己填写,然后填完这一页,它也会自动的翻页, 那随着它的一通操作,结果出来了,原来 gpt 五是 i n t j 啊,我说怎么跟我这么聊得来呢? ok, 那 这个 chrome 的 插件呢,也是控制浏览器,但是它控制的是我们自己已登录的自己的浏览器,它不会再新开浏览器, 那我们如果把它给勾选上之后,它会引导我们去 chrome 里面装一个插件,那装好之后呢,它就可以操作我们自己的浏览器了, 而且它有个好处,它是可以直接在后台执行多个页面的浏览器操作的,就是并不会占用我们的整个浏览器,我们不用真等着看它这些操作,我们该用浏览器干,别的我们可以接着干。 ok, 那 computer use 就 更厉害了, 它不只能够操控浏览器,连你电脑上的这些 app 它都可以操作,只不过呢,暂时只有 mac 有 这个功能。比如说我们新开一个对话,我们在加号,这里来看最下面的这个插件选项,我们手动地把电脑插件选上, 我们再来几个没什么用的奇迹引巧吧,帮我放一首九九年最火的歌,然后用我的微信给 qq 发条微信,说,请收下我一个点赞、收藏、关注,懂了吧? ok, 他 陷入了思考,然后他看到我们的应用都正在运行中,并且向我们使用了这个音乐软件。我们点同意看,这个就是 codex 自己干的啊。他帮我们搜索歌曲, ok, 音乐响起了, 但是他还有活,他还在问我们要微信的权限,我们也给他允许一下。 ok, 看他这个小鼠标,他正在犹豫着准备搜索点击,好朋友们失败了, 因为我上次都成功了,但是我估计现在微信已经开始严防这种 a 证的操作了,直接给我退出去了。 但是呢,他的确成功操作了这个音乐软件。其实我还让他操作了剪映,并且给我们的最新的项目加上了音乐。 那总之呢,意思大家都懂了吧,就是它可以操作浏览器,并且可以操作我们的电脑。当然,实际上我觉得它的操作效率目前来说还是稍微有点低的,我不太喜欢用这两个强大的功能。不过后面我要说的这个 skill 就是 我每天都会用的东西了。 那 skills 我 的确也已经跟大家说过很多次了,好学的朋友一定要去补补课。那 skill 本质上呢,是我们人为沉淀的一些可附用的方法、流程和工具的组合, 相当于给 agent 做某些具体任务的一些行动指南。那因为之前我们已经让这个 codex 帮我们装过一个叫做 find skill 的 一个原 skill 了, 所以后续如果大家想要去装,或者是找一些社区上的 skill, 都可以直接用 codex 拿语言直接让它下载。比如说我们下载一个必备的 ansapic, 那 个前端设计的 skill, 还有一个去 ai 位的,那我们这两个都发给他,等会儿都会刚好有用 欸,很快他就帮我们装好了。那以后大家想要下载 skill 呢?如果说遇到这个 find skill, 他 找不到的东西,也可以直接把链接发给 codex, 让他帮你下载就好了。不过我在 c c 那 期也说过,最好用的 skill 还是自己创建的,符合自己工作的专属 skill。 那 创建 skill 呢,也有两种方式,第一呢,就是直接告诉 codex 你 想要创建一个什么样的 skill, 通过跟他讨论打磨得出来一个 skill。 那另一种呢,就是我们接下来要演示的,先跑通流程,然后让它形成 skill, 这也是一种更推荐的做法。那比如说我们想做一个自动化写这类文章,并且帮它配图的 skill, 这种大家应该都看过吧, 那我们就得先通过一步步的引导 codex, 让它真正实现一个我们满意的文章。来我们新开一个对话。那正好呢,我们刚才不是装过这个 github 插件吗?我们可以直接先问它最新的 github 流行项目,热门项目都有哪些? ok, 它的确帮我们找到了一些,那我们再让它清晰地解释一下这些项目都分别是干嘛的。嗯, 那我们再让他挑其中新星数量最多的,来帮我们写一篇本周 get up 热门项目推荐这样的一篇文章。 好,那他写好了这一篇之后,我觉得稍微有点太人机了,我希望可以更口语化一点,并且我只想要五个精选的,那我们就告诉他,然后还要覆盖到这几个层面,那我们这里就可以用到刚刚我们下载的那个去 ai word 的 那个 skill 了,我们斜杠给它调出来。 好,那看到他的结果稍微优化了一点,但是我们还希望加一个我们固定的开头,我们的结尾,并且还要让他用上 image 二来帮我们生成一些配图。最后呢,我还希望他不要是这个格式,他要是一篇非输文档的格式,然后图文并茂的。 ok, 结果来了,他确实是有了,但是呢,我觉得这个配图不够丰富,于是我又经过几轮调整才觉得差不多满意。并且我还给他最后加了一步,要让他把这个飞书文档发送到指定的群里,让大家都来看看。 那最终呢,他的效果是这样的,果然发出去了。其实啊,如果想更加一步到位的朋友,也可以结合刚才我们说的这个浏览器操控,让他直接打开那个发布页面,直接就帮你发布出去。 那总之,我们对他这一套结果满意了之后,我们就可以直接让他把这一整套的标准和动作做成一个 skill 搞定了。那我们再输入斜杠,再往下找,我们就发现就有了这个 skill, 我 们可以直接这样手动地调用这个 skill, 也可以直接说生成一篇热门项目推荐图文这一类的触发词,也会让 codex 自动调用。 不过因为现在 github 上面实时的热门项目肯定是没有更新的,所以我们再调用一次呢,它大概率会写出差不多的文章,所以我们就不试了。但是大家都理解了吧, skills 呢,可以把我们经过验证调好一次的一整套流程和方法给它固定下来。 下次做这件事情呢, codex 就 可以按照这个方式稳定的输出。 ok, 那 下一个能力则是 mcp。 其实 mcp 现在已经用的不太多了,所以我只简单的示范一下那 codex 的 mcp 藏在设置里面的 mcp 服务器。 只不过小白看这个肯定是有点不太知道怎么填的,所以跟我们之前说的一样,我们最好的方式还是把你想装的那个 skill 的 链接拷贝给 codex, 让他自己装就完了。比如说我们来装一个 notebook lm 的 一个 mcp 发给他, 他就会引导我们来做授权登录,登录完就搞定了。那我们再试一个我存了非常多访谈视频的一个笔记本,我们来问一下他。 欸,那这样呢, codex 也就可以直接获取我们 notebook lm 上面的这些外挂知识点了。 ok, 最后一个 codex 能力是自动化定时任务。 其实定时任务本身并不稀奇啊,比如什么每天早上提醒我吃药,提醒我喝水这一类的事情,普通的软件也能做,但是我们把它放到最后一个说呢,就是因为它可以结合我们之前学到的各种能力,把一整套组合起来的任务,让 agent 定点执行 自动化,加上智能化和定制化方显美妙。比如说刚才我们做的这个热门项目图文的这个 skill, 我 们就可以把它设成每三天或者是每周,让它定时定点的产出一篇 dapp 热门项目推荐发出来。 那我们要创建自动化任务呢,其实也分两种方式,第一种就是选到这边的自动化面板,那它这里呢,有一些官方的参考视例了,不过大多数是跟开发相关,那我们选择新建一个自动化, 其实你看要填写的东西也非常简单,其实就是用提示词写好这些自动化是要做什么,然后我们可以在这里选好什么时候出发,我们也是可以自定义一个出发时间的, 然后这边就可以选择执行的模型和思考强度,最后点击创建即可。不过呢,我也还是倾向于让大家用第二种更简单的方式,就是直接在对话里跟 codex 说,那我们直接跟他说 帮我创建一个自动化任务,每周一早上九点自动化执行热门项目推荐的这个 skill, 产出一篇图文发到群里, ok, 那 我们在看自动化这里,它就已经帮我们设好了这个任务,我们随时也可以去改变它的时间。 再比如当你的这个邮箱插件 github 飞书都已经连上了 codex, 那 么你也可以让他每天下午六点帮我汇总日历上完成的会议, github 上面的提交记录和我的邮箱回复记录,生成一份全面的工作日报。 最后手机操控 codex 设置方法非常简单,手机上的 check gpt 和电脑上的 codex 都把它更新到最新版。之后打开手机上的 check gpt, 然后点击侧边栏的那个 codex, 它就会提示你允许这台手机控制你的电脑,直接就搞定了。如果你有多台电脑的话,也可以给它分别连上。这就等于你不管在大街上、地铁上还是朋友聚会,都可以随时随地地用手机下发一个任务,让 codex 在 你的电脑上干完一个活, 它就更像一个可以跟你远程协助的同事了。这个功能呢,目前免费版也可以用,但是主要能连的是 mac 系统的 codex。 好, 那到这里 codex 的 所有核心能力我们就全部过完了。来我们回顾一下。 codex 呢,可以操作我们的本地文件,可以使用我们电脑上的终端命令行工具。它还有两种构建持久记忆的方式,它还可以生成图片,而且它可以通过计划模式来做一个完整的项目开发。 那它有丰富的插件,可以操控浏览器和电脑,还可以把知识和流程沉淀成可附用的 skill 技能, 它可以使用 m c p 连接,外部它还可以设置自动化的定时任务。不过其实比起这些功能本身,我也希望大家记住两件事,第一就是我们真的有很多事情是已经可以交给 agent 做了。 那第二呢,就是我们已经从问 ai 的 阶段走向了管理 ai 的 阶段,因为过去我们使用 chat gpt 就是 有问题了,我们问一下,然后得到答案我们就走了。 那现在使用 codex 这类的 agent 呢?每个人都得像领导一样,帮他准备他所需要的上下文和工作环境,给他指明一些任务目标,然后来检查他的计划,监督他的过程,验收他的结果。 那同时领导还要负责把好的方法和流程沉淀成可付用的技能,把反复要做的事情设成自动化执行的规矩。好了,恭喜大家今天都升职了,记得点赞收藏关注我们下次见了。

codex 帮我重构了一个多小时,我手电关错窗口,四十多个文件的进度啪一下全没了。那次之后我不敢再裸跑长任务,不是模型不行,是 codex 默认根本没有进度这个概念,而每一轮都活在当下, 窗口一关,记忆为零。我现在跑长任务只靠一个机制,在 ajax 点 md 里写死一段规则,让 codex 每走一步就把状态落到一个叫 progress 点 md 的 文件里。这一段规则就三条,你直接抄。第一条,每完成一个子任务更新 progress 点 md, 里面就三行,已完成进行中。下一步不是写心得,是写状态。比如已完成拆出 os 模块的五个函数, 进行中再重写 login handler。 下一步跑 past tests 斜线 os。 第二条,每条状态后面必须挂一个可跑的命令,不是基本完成这种废话是 past test 斜线 os 通过 npm test 还剩两个失败。 没有命令等于没有证据,你重启之后就接不上。第三条,重启会话,第一句话不要说,继续说,继续,它会自己脑补,越脑补越离谱。 正确的开场白是读 progress 点 md, 从进行中接着干,不要重做已完成。就这一句。 这套规则最关键的地方在哪? agents 点 md 是 codex 每次绘画都会自动读的文件,你写一次,他每次都记得你不用每次开任务都重新交代规则。我自己加了这段之后,上周跑了一个四十分钟的批量改动, 中间 vpn 断了一次,我重开绘画,发了那一句开场白,他接着第七个文件继续改,没重做一次长任务保命不是靠模型更强,也不是靠你不关窗口, 是靠你把状态落到文件规则写进 agent, 点 md 评论区打 checkpoint。 我 把这段 agent 点 md 规则原文加 progress, 点 md 模板一起发你。

很多新手在使用 codex 的 时候,第一次都会犯的一个错误,一打开工具就告诉他,帮我做一个项目,帮我生成一个图片,帮我设计一个页面,帮我修改一下 bug, 然后等了半天,可能最后出来的结果不是自己想要的,不是页面不好看,就是功能跑不通。这个时候很多人是不是就觉得 codex 不好? 其实不是,你可以把 codex 理解成他是一个新加入团队的一个新成员,他很聪明,他很能干,但是他刚来他啥都不知道,他不知道你这个项目是干什么的,不知道你喜欢什么样的风格,不知道哪些地方可以改,哪些地方不能改,也不知道你具体想让这个任务推进到什么样的程度。 所以上如果你上来就是一句帮我做个什么,那他只能靠猜。而 ai 最害怕的就是你让他去猜。正确做法是在开始之前你应该给他一份明确的说明书,其实你只需要告诉他几件事情就好了, 小白也可以写,比如我要做一个短视频文案工具,我要做一个外卖平台,我要做一个 ai 生图的网站,我想做一个可以让别人在网站交流的论坛,这一步主要是让他知道你的大致项目方向。第二个,你可以告诉他你想要什么效果, 比如说页面要干净,或者设计风格的颜色配色步骤不要太复杂,操作按钮不要太多,然后给你的模块都加一些动态效果。这一步是你,是你告诉他你的审美和你期望的一个设计效果 风格。第三,哪不能乱改,这个是给他规定权限,不能让他一个在做前端的时候,一不小心就把你的后端逻辑改 掉,然后在做后端的时候,一不小心又把你的前端页面改掉。第四步是告诉他每次在做完任务的时候都需要去给你总结一份报告,同时要有记录,这样的话在今后的开发当中如果出现了问题 是可以溯源的。其实 ai 和人是一样的,任务越清晰,它的结果就越稳定。其实它只是一个执行能力很强的一个助手,而且是全能助手,但是它不是猜想大师,千万不要让 codex 直接干活,先给他讲清楚规则。所以 ai 你 会提需求,它就是助手,但是你不会提需求,只能让它猜,那它就是在开盲盒。

大,真的是一个头两个大呀。大周末的,刚起床跑了一下任务,五月六号买的 plus 会员到现在就只剩下百分之三十四了, plus 是 完全不够用。 我这边找了一篇文章,几个技巧能够彻底解决扣袋子跑久了会越来越笨,越来越慢,还能省掉百分之四十上下文的一些技巧给大家分享一下。这篇文章说一下我的理解。第一个,扣袋子跑久了之后会越来越笨, 越来越慢,这个是基本成立的,但是其实逻辑上不是因为模型真的变笨了,其实绘画的上下文越来越长,旧的一些信息,过激的计划, 一些失败的尝试,都混在一起,就会让我们体感上觉得迟钝。判断是对的,如果是有效,上下文的质量下降了,就会导致整个推理和执行的质量下降。第二点,关掉 process location 方向是对的,但不是万能的。减少输出规划的趋势确实能够减少偷客的消耗和噪音,但是问题是,如果你不让 agent 去汇报他这个过程,你也是很难发现他是不是走偏的。尤其是像我们做一些比较复杂的产品架构,涉及到一些复杂的 bug 解决,那适度的汇报还是要看的。 所以并不是说你在那里一直执行你就该干嘛去了,这是非常不合适的。所以更合理的做法就是简单的任务让他少说那长任务,保留一些关键的进展,就不要去输出这种长的身体活动,不要把每一步的工具调用都解释一遍, 这招是有用的,但是全部是被 token 这件事情是说的绝对。第三点是让 code 子当协调者都用 sub agent, 这个是部分对,但是不能滥用。 sub agent 确实能够把一些探索性的任务分散出去,但是主要是你的目的是为了减少上下文的污染,但是只有那种多模块变形调查 架构,审查大代码库的一个区域分析,要变形解读很多的文件,这这一类才是比较适合的。 但是他也会有一些问题,那指 a 诊呢,也会犯错,而且主 a 诊呢还要去汇总他的结果,所以如果本身的任务是限性的,那你多开 a 诊的反倒会增加他协调成本。那么你们讲到的同时开五个,就相当于五个上下文的并行。 这个方向是对的,但是很容易让别人误解,开的越多越好,那实际上只有那种并行边界清晰的任务才值得猜好。第四个是先列他这个例子的 再动手。这个建议其实是很实用的,特别是在一些大大的一个项目里面,你的 prd 原型在任务池并存的一些项目里面,先列任务就能够防止它改错文件,越界重构,甚至是忘记同步相关的一些文件,做到一半就偏题了。特别是像 有时候网络还不稳定,但是小人物就不需要复杂的计划了,比如改一个方案,一个就直接改就好了, ok。 第五个是禁止在代码库里留垃圾,对,而且非常重要。现在 ai 的 一个常见问题就是说它生成的临时脚本,它不删留 delete 文件, 复制旧版的一些文件,乱建一些草稿,把 etc 的 分析结果写进仓库里面,这都是它的问题,会让这个项目越来越乱,也会让后续的 a 制误读项目的状态, 不过这里要区分不是所有的 m g 啊,后缀的文件都是垃圾,那有些是长期的,一个上下文的资产就不是污染好。第六个就是规划,用高推理的模型,执行用快速的模型,这个策略比较合理。 我最早去考虑这个事情的时候,就是因为价格的问题,比如说好的模型,贵的模型去做推理,你把他执行的要求给到一些 poke, 比较便宜的模型去做执行, 也对,看有没有这个必要了。总之一点,如果你的执行模型能力不够,那你就可能把你的规划 在外,所以在切换模型的时候就要把边界写的很清楚。我个人理解,除非你的后坑消耗是巨大的,不然我就觉得没有必要折腾。其实这就是在解决上下文丢失和重复犯错的问题。最终的结论就是,整个他的博主分享的这个文章核心方向都是对的。 后段时长时间的工作质量下降,主要来自于上下文的污染。项目状态不清,无纪律和无记录的写作大概就是这样子的。确实, 连续二十八天都是在每天早上七点钟起床,无论前一天晚上几点睡都是这样子。晚,对,非常晚,四五点才睡,今天睡到大概十点多,整个脑子居然会比较清醒啊。 今天就分享到这里,后续会继续去分享一些 holddance 的 使用体验吧。

hello, 大家好,今天给大家讲解一下我是如何使用 codex 来驱动 objects 来完成一系列由 ai 驱动的 ce 仿真的。首先我们去 openai 的 官网去下载 codex 这个 agent 桌面单软件。 codex 是 由 openai 推出的一个以编程为主的桌面单应用程序,我们下载完成之后,安装了之后,你可以登录你的账号,这边 codex 它是免费账号,也是有一定的使用额度的, 但是这个额度不多,建议大家还是充一个 plus 会员。下载完成之后,你可以在这边新开一个对话,然后把我这个 呃 qs mcp 的 链接粘到这个对话里面,让它安装一下这个 mcp 插件。这边安装完成之后,我们可以在设置这边看到这边有个 mcp 服务器, 然后这边的话有一个 opcode server, 这个服务器安装完成之后,你的 codex 就 能够和 opcodex 完成一个联通了。至于这个仿真的界面,它是我们完成的另一个项目, 你可以在 task two cae 这个网站下面把链接复制一下,然后交给 codex 让它安装一下。 安装完成之后,我们就可以使用 codex 联合 opcode 来完成一系列仿真了,但在这个过程中,你肯定要把你的 opcode 啊,我们打开 opcode 之后,我们可以在这边的中端窗口下输入 mcp, 然后下划线,然后 looper, 然后过号点击回车,然后这边的话 appux 就 已经开启了一个 m c p。 我 们在 codex 里面,然后我这边新开一个窗口,我们这边的话问他你是否可以和 appux 联通, 他这边是思考了二十四秒之后返回的信息是可以当天可以和 appx 连通了,如果你测试到这一步的话,那说明你已经成功的打通了 codex 和和 opuse, 然后你就可以使用一系列的提示词来对它进行一个仿真。比方说我这边做的一个仿真,仿真专家做一个仿真学分析,要尽可能的贴近真实工况, 不要简化去做。如果是比方说这种动理学仿真的,你就让他要尽可能的贴近真实功放设定播放的帧率也要高,让仿真动画看起来更流畅。我需要在这个 codex 浏览器里面看到最后的仿真的结果。 在这边有一个界面,这边是模型树,我目前是只做了这个项目的,打开预览的一个模型树,后边的话,这个我可能会再完善一下,把这边的零件材料装配,然后分析部都能够去操作和二次编辑, 目前能够你编辑的在这个可编辑窗口,比方说可以编辑一下模型的一些尺寸,比方说我们把这个模型的尺寸圆孔半径改为二十四,在这边点击重新计算,然后这边的话它就在驱动 appui 完成一个重新的计算。 你也可以改,比方说板长板宽,然后其他的一些弹性模量或者是材料属性可以看到它这边就完成了一个模型的重新计算,然后重新进行了一个就是模态分析。我们先在这里讲一下这个 codex 驱动 ios 进行一个由 ai 驱动的 ce 仿真的流程是怎么样的。首先我们在这里的对话框里发一下你的想要仿真的一个提示词,你可以完全照抄这个,当然你想改一下也是可以的, 然后把提示发给这个 codex 之后, codex 就 会去写一系列的脚本,比方说这个模型建立的脚本也是由 codex 的 python 码完成的,当然一些比方说这个像简单的一些模型,它是可以去建立的,当像这个 洗刀模型它就建立的效果不是很好了。这个洗刀模型是由我在 soodeworks 里面去建立的一个模型,把它转化为 str 格式之后,告诉了 codex 在 哪里, 他就可以把他建立的模型和我提供给他的模型进行一个装配。呃,包括后面的像材料定义装配这个分析布载合了的定义,边界条件的定义,以到我们的网格化划分,都是由 codex 来完成的。 到后面的一些结果的后处理也是由 codex 来完成。 codex 完成之后,它会把一系列的脚本发给发送给我们的 opqs, 来完成最后的一些结果的分析,然后到仿真的一些模型的一些计算,它会发送给我们来完成一系列的仿真计算到结果的后处理, 然后完成之后它会创建一个网址,就是这样一个网址,然后我们点击一下就可以在浏览器里面去 看到 oq 所有的仿真结果。目前的一些仿真的话,其实它只能够进行一些简单的动力学或者是心理学仿真心理学效果目前是最好的,动力学的话,其实效果没有那么好, 大家可以当做一个参考。然后我这边再补充一点,就是如何把这个 mcp 给停掉,因为这个 mcp 运行的话,你的 oq 界面是不能进行任何一个点击操作的,就是它是一个主色运行的状态, 然后大家如果想停掉这个 mcp, 呃,然后在 app 里面查看结果的话,可以点击这边的 stop 按钮,然后就可以停掉这个 mcp 服务了,然后就去进行其他的一些操作。 你如果你有问题的话,可以在这个 github 上去提问,或者说你有好的想法可以在这边跟我说一下,我看一下能不能来实现一下。这就是本期的视频内容,大家如果有什么疑问可以向我提问,谢谢大家。

codex 跑长任务总在最后一步崩,很多人以为是模型的问题,其实是任务没有结构解法,就一步在项目根目录建一个点 hermes 文件夹,里面放一个 task e m l, 把长任务拆成有依赖关系的子任务列表, codex 每完成一步就打勾,下次续跑从断点开始,不用从头来。这个工具叫 hermes, 定位是 codex 的 项目管家,专门解决 codex 跑长任务没有记忆中途崩了不知道跑到哪的问题。核心配置只有三个字,断。 第一个是 task 任务列表,每条任务写清楚做什么,验证标准是什么,依赖哪个前置任务完成。第二个是 risk flags, 提前定义高风险操作,比如删除文件,修改 config 目录,改数据库 schema, 触发这些 hermes 暂停,让你确认 block code 自己闯。第三个是 progress report, 指向一个 progress md hermes 每完成一个子任务,写一条日记,早上起来不是对着一团改动,猜昨晚发生了什么,而是一份清单,告诉你每步做了什么,结果是什么。 我现在跑超过三步的任务,全部先写 task em, 再交给 codex, 翻车率直接调到接近零一人。公司用 codex 干长活,缺的不是模型能力,是任务管理层, hermes 就是 那一层。你的 codex 现在跑长任务吗?评论区聊聊。

很多人用 codex 第一步就错了,前两天我发了一条用 codex 做标书的视频评论区,最让我意外的不是大家不会用,而是很多人还在研究怎么去接这个中转站,怎么去用这个便宜的模型啊。我的观点很简单,就是 你用 ai 去做正经的任务,最不该省的就是模型钱,因为真正贵的它不是调用的,这个费用是返工的成本。 好的模型,你十次里面可能错一次,你检查一下,修复一下就 ok 了。但是你差一点的模型,你十次里面可能会错三次,甚至错五次,每错一次,你都要重新去判断这个逻辑对不对啊?结果能不能交付啊?后面还有没有坑 对吧?就是这里可以看一下啊科特官方的这个 benchmark 的 图,它不是为了证明某个模型永远是第一,而是说明了一件事情,就是在真实的编码的这个场景下,就长模型之间的差距都很明显了,更别说你用这个便宜的模型去代替。 所以如果你只是玩一玩的话,用什么都可以。但是如果你要写方案,要要写代码,去做商业的分析,甚至是你呃,要任何交付给这个别人的东西,你都要用, 就是你直接能用最好的模型就用最好的模型啊。再说 codex 跟 cloud code, 如果你是中文用户,尤其是在国内使用的这个环境下,我会更加偏向 codex, 因为 astropica 它对这个中国的用户限制更加的多,然后它的表述也不是很友好。 而 codex 在 我的使用体验里面的话,它不管是成本啊,能力啊,还是这个中文场景的平衡,它要做的更好一些。就如果说只是国内的 ai, 那 我推荐豆包,而如果是复杂的任务,我还是推荐 codex。 就是 最后一句话, ai 工具它不是说谁单次调用更便宜,它就它就是更便宜的,而是能够让你去少返工,更少的犯错,稳定的能够去交付,所以才是真正的便宜。

codex 太厉害了,给你们看一下啊,就是我跟他说我的需求啊,就是自动化生成图片,然后对应的 cds 二点零的分镜提示词,然后直接生成视频,你看这个流程,直接他就能帮我做了啊, 他先让我啊,登录授权我们这个呃节目的账号啊, 然后我登上去之后啊,他说让我确认,我说我的意思是用 image 二模型生成图片啊, 就是目前来说最强的生图模型,然后好,他用了 gpt 的 生成了这四张啊图片看,然后他就写好了这个完整的分镜提示词, 点进来看一下啊,我对他这一版其实是不是很满意啊,我就又上传了我的塑身形象和这个音频音色一起给他生产啊,他就直接啊添加进去后啊,升级后的,其实是看见没有啊, 他的运镜啊,他的音频音色,还有啊他的模型啊,比例, 分辨率描述,他都会一并成交,让我确认,确认之后,好,你看八分钟之后生成完成, 虽说非常的厉害。你看到这边我自己来剪一下。看这套新中式 主楼加旁边小院房,一进门就是双层挑空门厅气场一下就出来了,面宽十三米,进深十一米五,屋檐声带一亮,晚上比白天还好看。细节看这里,门厅线条,灯光,院子比例,这房子盖的讲究,老家准备建房的评论区打别墅,我把这套思路讲给你听, 怎么样,是不是非常的厉害,就是现在哦,如果说你还没有体验过这种 and just give 就是 这种自动化的啊, 模型就真的是,呃,你现在所有的工作方式都可以通过它给你复制出来了,不信你你问一问他,他都能给你复制出来, 真的。所以如果你还没有体验过的可以好在评论区啊,打个一啊,或者说想体验我会教你怎么去做。我真的想在 ai 时代啊他们大家一起无限进步啊。

先给大家把概念讲透,一定要牢牢记住 codex, 要是你到现在还没有听说过 codex, 我 就必须跟你说,这条视频大概率能够改选你的财富轨迹。有很多人会问,到底什么是 codex? 官方给的定位是编程的智能助手,但它的价值远远不止写代码这么简单,因为他的创始人黄仁勋这里两天来到了北京。大家都知道,他作为全球的顶尖富豪,早就要求公司的所有员工必须标配使用 codex。 你最近看到的英伟达市值暴涨,纳斯达克指数一路走高,资本市场全面的拉升,其背后推手就是 codex 这类顶尖的智能大模型,它代表着当下全球最顶尖的全新生产力。 codex 更是咱们普通人门槛最低,零高成本, 而且能直接用上的顶尖大模型智能体的绝佳工具。反观其他同类平台,普通人 上手很难,注册流程繁琐,网络限制多,还容易莫名其妙的封号,使用成本还高。但 codex 完全没有这些痛点,省心又好用,很多人不会用,其实特别简单,第一步,注册下载,配置好基础网络。 直接开口问他,你能为我带来什么样的价值,把你的日常工作生活现状全部告诉他,让他为你赋能。你是炒股的股民,直接跟他说,我专注 a 股投资,告诉我你能帮我做什么分析,给我什么样的策略参考, 他会一步步带着你去玩转。你是职场的上班族,你每日工作流程如实说,收发邮件、整理数据、下载上传流程复盘,全部描述清楚,直接问他能不能帮我简化工作, 优化流程,提升效率,定制使用工具,他全部都能帮你搞定。如果你还是在校的大学生,或者二十出头想要逆袭翻盘的年轻人,那 codex 绝对是你逆天改变的绝佳机遇。 就像食堂突然新开了一个专属风口窗口,聪明人要做的就是立刻抢占先机,直接站在风口最前排。

很多人第一次看到 codex, 以为它只是一个会写代码的聊天框,错了。对小白来说, codex 真正重要的地方是它能进入项目文件夹,围绕一个目标持续推进,把结果落到文件里。 普通 ai 更像顾问,你问一句,他答一句。 codex 更像同事,你给他一个项目,一个目标,一个权限边界,他可以把任务拆开,然后一步步推进。 新手第一步不是追模型民,也不是找神提示词。先认识 codex 的 工作台,左边是项目和 thread, 中间是任务推进过程,结果会落在你的项目里。 小白上手路线可以压成五步,先安装登录,再添加项目文件夹,然后新建 thread, 用一句话说清楚目标,最后让它先列计划,不要一上来就直接改。 下载安装本身不难,真正要记住的是入口、账号、模型、权限都会随时间变化,教程只能帮你建立路径感,最终要以你账号里真实能看到的页面为准。 很多小白越用越乱,不是 codex 不 行,而是文件夹一开始就乱。建议先把学习资料、真实项目、沙盒、测试、通用工具分开,添加项目文件夹后,再在里面开 thread。 你可以把文件夹理解成项目群,把 thread 理解成群里的一个具体话题贴。黄金法则只有一句,同一个文件夹里做同一个大方向,同一个 thread 里只推进一件具体的事。不要上午改网页,下午算表格,晚上写文案,全塞进同一条任务线。 设置部分,先抓三件事, generally, 允许后台运行。 personalization 里写清协助规则,权限模式按风险选择,别为了快,把重要目录随便交给全权限。 personalization 本质上就是图形界面的项目规则。你要告诉 codex 改动要小,动手前先说计划,不要胡编路径,不要泄露密,要改完要告诉你最小检查命令。 skills 是 小白最容易低估的部分,它不是炫技插件,而是把固定做事方法沉淀下来。比如写作、调研、生成图文代码检查,都可以变成可附用能力。 定时任务、 m c p。 记忆系统、电脑自动化都很强,但新手不要第一天全开。正确顺序是先会文件夹和 thread, 再会规则和 diff, 最后再接工具和自动化。 如果这个视频只让你记住一个按钮,那就是 plan mode。 它的价值是先让 codex 只规划不动代码, 等你确认计划合理,再允许它执行斜杠命令 status。 推理深度是你日常控制 codex 的 三个入口,简单任务用低一点的推理深度,大任务再切到 high 或 extra high。 真正开始 web coding 后,门槛会从会不会写代码变成会不会描述需求。 你可以开麦说目标,但目标必须具体做什么给谁用,改哪里,怎么验收。也要诚实一点, codex 不是 所有领域都一次做到最好,前端效果不好就换更适合前端的组合,或者明确给它设计规范和截图反馈。 不要跟工具硬较劲。多个 threat 可以 并行推进,但前提是目标拆得清楚。比如一个 threat 改首页,一个 threat 写文档,一个 threat 做数据脚本,不要让他们抢同一批文件。 最后也是最重要的代码管理习惯让 codex 改代码,但不要让项目失控,每次任务都看改动范围,看 diff 跑最小检查确认没问题再提交。 总结一下,小白用 codex 的 最小路线不是学完所有技术,而是先做到三件事,会描述目标,会拆分任务,会检查结果。做到这三件事,你就不是在学一个工具,而是在学一种新的做事方式。

新项目第一天,百分之九十的人都是直接 call dx, 启动就开干,第一周爽的飞起,第二周开始踩坑,第三周你会发现大半时间都在给 ai 擦屁股。 今天给你一个五步出场清单。第一步最关键,少做,后面全是坑,十五分钟走完一遍,后面三个月都省心。第一步,写 a j s d i m d, 这一步就是百分之九十的人跳过或者随便写两行就过去的那一步, 必写四块项目结构,加每个目录职责、技术栈和代码规范,明确地禁止事项测试和构建命令写,多花十分钟,后面每次提问都省三分钟,一天就回本。第二步, pay codex ignore, 把不要让 ai 碰的文件列出来。烟味 note modules disk build secrets, 目录数据库备份日制文件。这一步是防御性的,即使 ai 乱搜也碰不到敏感文件。第三步,选审批模式新项目前两天建议 suggest 模式走一遍,摸清楚项目边界,摸熟了切 auto edit, 千万别一上来就 fall out, 你 对项目不熟的时候 ai 也不熟,两面都瞎干最容易出事。第四步,设 token 预算 configer, tmr 里可以设单次任务的 token 上限,一个中型功能开发十万 token 一 般够用,超过说明你该让 ai 干超纲的活,应该拆任务 预算,不是限制能力,是强迫你把任务拆小。第五步,接必要的 mcp 项目,要查数据库就接 db mcp, 要读文档就接文件系统 mcp, 要查 api 就 接对应服务的 mcp, 不 需要的别接, 接越多上下文越杂。这五步我现在每开新项目必走,十五分钟搞定,对比不配就开干的做法,前一周生产率差不多,两周之后拉开差距,一个月之后代码质量完全两个档次。 一个原则,新项目的技术债百分之八十是第一天种下的,多花十五分钟出使花是对未来三个月的自己负责。这个 complex 系列到这里先告一段落,下一个系列讲 cloud code 的 实战技巧,想看的评论区留言。

hello, 大家好啊,欢迎来到 codex 新手入门指南,我是吉克莫导师。近期 codex 备受瞩目,相关的安装教程也层出不穷。为了帮助大家快速入门,本期视频将避开晦涩的专业术语,用最通俗易懂的语言为你梳理从零到一的完整上手流程。 首先明确一点, codex 的 定位并非聊天机器人,而是深度集成在你项目环境中的 ai 编程助手。它拥有读取代码、修改文件及执行终端命令的能力。但在开始之前,学会如何正确引导和控制它是上手的第一步。 在 codex 里,输入其实分两种,普通 prompt 是 下达做什么的任务,而斜杠指令则是定义怎么做的规则。 这里有三条铁律必须记住,第一,指令务必放在开头。第二,记不住指令时,直接输入斜杠就能呼出菜单。第三,千万别把 cloud code 的 习惯带过来。 codex 的 核心是 agents 点 md, 而不是 cloud 点 md。 掌握了基本规则,我们就可以开始探索 codex 的 强大功能了。别担心,你只需要记住下面这几个最常用的指令,就能轻松上手。 第一步,用 init 来出售化你的项目,它会生成一个 agent 点 md 文件,就像给 codex 一 份项目说明书。之后呢,你可以随时用 status 查看它的状态,确认它用的是哪个模型,权限有多大。 说到模型, model 指令可以让你灵活切换,简单的任务用快模型,复杂的难题就交给强模型,既高效又经济。为了安全起见,新手朋友可以用 permissions 先把权限设置得保守一些,比如只读模式,等熟悉了再给他更多自主权。 遇到复杂的重构任务时,可以先用 plan 让他制定一个详细的计划,确认没问题了再让他执行。如果想让他专注于某个文件,用 mention 指令就能精准定位,避免他在整个项目里大海捞针。 当 codex 完成代码修改后,别忘了用 def 来检查一下它到底改了哪些地方,最后再搭配 review 进行一次代码审查。这套组合操作能帮你把好代码质量的最后一道关。掌握了核心指令,还有两个最容易混淆的概念需要厘清, side 和 fork。 side 就 像一个临时的侧边对话窗口,当你有个小问题需要快速确认,但又不想打断当前主线的思路时,就可以用它在小窗口里问完。得到答案后,你就能立刻回到主线任务,它不会影响你的核心上下文, 而 fork 则是真正开启一个新分支,就像 git branch 一 样,当你想尝试不同的解决方案或者探索一个可能失败的方向时,就可以用它。它会完整复制当前的对话状态,让你能保留多条探索路线,随时可以切换回来。了 解了核心指令,我们来梳理一下第一次使用 codex 的 推荐流程。这套流程能帮你建立安全高效的工作习惯。 首先,进入项目目录后执行 innit 指令,这会生成 a g e n, t s 点 m d 文件,相当于给 codex 一 份项目说明书,让它快速了解你的项目结构、技术栈和常用命令。接着使用 status 确认当前状态,检查模型和权限设置是否符合预期,做到心中有数。 然后让 codex 开始阅读和分析你的项目。在这一步,切记不要让他直接修改代码,先让他理解上下文。比如你可以问他分析这个项目的结构。当遇到大型任务时,务必先使用 plan 指令, 让 codex 输出详细的执行计划,包括步骤,拆解和风险点。你确认方案无误后,再让它开始执行。最后,在 codex 完成修改后,先用 diff 查看所有真实的代码改动。确认无误后,再使用 review 进行一次提交前的代码审查,确保代码质量和安全性。 以上就是 codex 新手入门的全部内容,从出场到核心指令,再到推荐流程,掌握了这些,你已经具备了独立使用 codex 的 能力。多动手实践,遇到问题多看 diff 和 review。 我是 即刻模导师,下条视频代码见,拜拜!

装上 codex 直接开干,结果他越写越乱,改两次就跑偏。不是工具有问题,是你的 agent 里密缺了四段关键内容,这四段差一段他就发挥不出该有的水平。第一段是角色定义,把项目是干嘛的,谁在用,要解决什么核心问题讲清楚, codex 才知道往哪个方向走, 而不是只盯着代码本身改字母。第二段是项目约束,包括技术栈、版本、命名、规则、目录结构、绝对不能动的接口和外部依赖, 这些是他的硬边界。写的越具体,他越省事,你也越省心。模糊的描述只会换来模糊的产出。第三段给输入式例,至少放二到三个标准任务的范例,比如一个完整的需求描述,加上预期产出的样子,让他有参照对象。 写新功能时不会自己发明一套,写法风格也会贴合现有代码。第四段是错误兜底,列出常见的错误类型和处理方式,遇到拿不准的情况,让他先停下来问你,而不是瞎猜着往下写。 这一段省掉的返工最多,也最容易被忽略。这四段补齐之后, codex 的 产出稳定性会有明显变化, 返工次数也会少一大截,长期看节省的时间相当可观。我用这个结构跑了三个月,从一开始一天改八次,到现在基本一次过就能用,体感差距挺大。你的 age 四列密写了几段?评论区聊聊你踩过哪些坑。

之前有跟大家来聊 codex 应该怎么去配置,包括中间的 agent 点 md 怎么去写,实际上这一步你可以完全让 codex 帮你来写。对,那还记得我们 speak to note 这个项目的 agent 点 md, 我 们只写了五行,告诉了 codex 这个项目是什么,它的技术栈是什么,全程需要用中文交流等等。 但是最重要的一点,这个项目你不能做什么,这个约束其实是没有说清楚的,那么今天这一节我们要让 codex 自己去把这个 agent 点 md 补充完整。 codex 桌面版 到 speak to note 这个项目,你点击开启新的对话,还是要记住一个任务,开一个对话,避免上下文污染。我们要先去找到它这个 agent 点 md 的 这个文件,你可以 打开右上角的这个资源库,然后点击这里的一个文件夹,找到这个 agent 点 md 这个文件。我们可以看到这个 agent 点 md 里面目前只有五行,这里只是告诉他这个项目的最基本的内容,但是他没有告诉他改代码时应该要注意什么,你的边界行为是什么。 那我们现在就是让他去补充完整。我现在需要告诉他说这个项目有一些依赖,依赖库是核心功能,实用的,我不希望你在我没问的情况下随便添加新库或者升级已有的库。 请根据项目现状帮我写一条 agent 点 md 的 规则,要求你每次给用依赖填先告诉我真的,我的同意,这一条很重要,这一条就是边界行为,我不希望 codex 去做这样的行为,所以我得明确的写到 agent 点 md 里面。 之前我们在自定义里面也说过,项目的 agent 点 m d, 它的优先级要大于整一个自定义的版本,所以我在这个项目里面去特殊地强调了一下,它说已经写入了,你看它的一个整体表述会比我的自然语言来得更加的规范。第二条,这个项目会用到用户的录音,我非常在意隐私, 我希望帮我写一条规则,就是录英文件只能存在用户自己的设备上,不能上传,不能让任何 ai 看到原始录音内容。对,这是一条非常重要的边界,就是隐私边界。那我其实不懂技术应该怎么样去保护这个隐私,但是 codex 他 会知道怎么把这句话翻译成规则。 ok, 他 已经补进去了,我们来看一下他是怎么写的。 前面一条是依赖变更,这一条是录音隐私,用户录音文件只能保存在用户自己的设备上,禁止上传到任何 ai 或第三方处理。 ok, 没问题。好,这是第二个。 第三个,我希望他每一次改完代码都要按一个标准来进行验收。你每次改完代码,我怎么知道你改对了呢?请根据这个项目的实际情况写一套最小的验证方案,以后每次改完 按这个步骤自测,并通知我验收。为什么要告诉他这条?因为这条他也会放到 agent 点 n 里面,后面他去读这个项目文件的时候,他就知道每一个任务的开发他都需要这样去操作。 ok, 他 又新增了两条规则,最小自测。每次改完 先确认依赖没有被授权,没有改动。好。我们上次说过的最小的 check 内容,涉及界面或流程时要做冒烟测试,涉及录音这些要做隐私边界的一个核对通知,我验收每次交付改了什么,自测怎么样?结果怎么样, 给了我最小的复研步骤,所以这个内容后面他每一次任何的任务执行的时候,他都会这么去跑。上面的三类规则都已经确认并且写进文件了,我们打开右侧,依然打开这个 a, n, s, d, m, d, 我 们来看一下它对应的内容,从原来的五条又增加了四条,录音、隐私依赖、变更、最小自测和验收通知对于这个项目的要求,它不是一成不变的, 你一开始没有想清楚,但是你在跟他沟通的任务流过程当中,你都可以写到这个项目级的 a, n, s, d, m, d 里面。那我们来让他复述一下,看 看它是不是真实的记住了,并且会进行使用。请按优先级列出所有生效规则,全区和项目分别有哪些,看到了吗?它这里会写项目内的规则,是第一的,全区的是第二的, 其他通用协助声明是第三的。那么项目内的规则就是有八条全区的规则,在项目规则未覆盖时,它会生效,是吧? ok, 那 这个就是今天我们让 codex 自己去补充这个文档一个过程,大家可以参考我的这个步骤,但是更多的你可以在实践的过程当中不断的去完善和补充。

codex 用了三个月栽过的坑里有一个让我直接反攻三次。今天把五个最容易踩的坑全告诉你,别走我的老路。第一个坑,不写 a 整数的 md 就 开干 codex 没有约束的时候,他会自作主张,你让他修一个 bug, 他 顺手把整个文件重购了。 agent 打 n b, n b 不是 文档,是给 ai 划禁区的法律。第二个坑, sandbox, 用默认配置默认一下。 codex 的 可读范围比你想的大,生产仓库一定要加上 codex vgr write, 把它锁在工作目录里 这一行参数,避免后患。第三个坑,也是让我反攻三次的那个 context 不 清场,跨任务污染。我连续让 codex 干两个不相关的功能,中间没清空上下文, 结果他把昨天 a 功能与 user id 字段的命名规则和今天 b 功能的订单接口混在一起,代码看上去能跑, review 时才发现命名整个对不上,我重写了三遍才理顺。后来我每开新任务 b clear 这一个习惯救了半条命。 第四个坑,审批模式直接开全自动,听起来爽,实际上 codex 偶尔一冲动就把你的依赖所文件删了,或者把分支 force push 掉。全自动模式只在一次性沙盒目录里用真实项目永远开人工确认或者 on failure。 第五个坑,验收只看 codex 自己的输出,他说测试过了你就信,他说 build 通过了你就信。永远自己跑一遍, codex 偶尔会在脑子里跑测试,然后告诉你都过了,命令根本没执行, 一人公司最贵的就是返工时间。这五个坑你只要避开任何三个,效率立刻翻一倍。你踩过哪个坑?评论区聊聊。