如果你还把 ai 编程当成聊天窗口,一句一句问它怎么写代码,那 codex 的 斜杠勾可能就是一个分水岭。它真正重要的地方不是多了一个命令,而是 ai 编程开始从回答问题变成推进任务。 官方文档里,斜杠 go 已经被列成 codex c l i 的 内置命令,它可以设置、查看、暂停、恢复、清除一个任务目标。关键句是给 codex 一个持久目标,让它在更大的任务运行时持续跟踪。 这句话很重,因为以前你给 ai 的 大多是一条 prompt, 现在你给他的是一个挂在县城上的目标状态。更明显的证据,在 app server 文档里,它已经有 thread、 go、 set、 get、 clear 这些接口, 所以任务能跑几小时甚至更久。重点不是玄学超频,而是工作流变了长任务终于有了一个可以被跟踪、恢复和管理的目标锚点。 ai 不 再只是回你一段代码,而是在围绕一个目标持续推进。 但这里有个坑,很多人会把 go 写成一句愿望,比如帮我优化这个项目。这个写法基本等于让 ai 猜谜。真正有效的 go, 应该向一份任务合同、目标背景范围、验收、交付都要写清楚。 比如不要写帮我把登录页优化一下,要写把登录页改成手机端优先布局,保持后端接口不变不改、健全逻辑,完成后验证登录、错误提示、退出登录三个流程, 最后汇总、改动、验证结果和剩余风险。最适合交给 go 的是目标明确、过程繁琐、风险可控的任务, 比如补测试、修炼、迁移 api、 整理文档、跑通一个明确功能,对其启动流程。这些事不一定难,但很耗耐心。 最不适合直接放手的是支付权限、生产数据密钥删除数据、跨仓库大重构。越是长时间自动推进,越要把边界写清楚。 ai 方向一旦错了,跑得越久,偏得越远。 我建议你以后写构时默认加五段目标、背景、范围、验收、交付。目标是完成什么,背景是为什么做? 范围是能改哪里,不能碰哪里,验收是必须跑什么?测试交付是改动招标,验证证据和风险清单。 这套模板的价值是把 ai 从会聊天的代码助手变成能被管理的任务执行者,而开发者的角色也会变化。以前你的价值是写代码,后来是会问 ai。 接下来更重要的是定义好任务,判断结果,控制风险。 所以斜杠 go 正式稳定我认为不是一个小功能更新,它是 ai 编程进入自动干活阶段的信号。 以后,真正拉开差距的可能不是谁打字更快,而是谁更会把复杂工作交给 ai, 谁更会验收 ai 的 交付。如果觉得对你有帮助,欢迎关注、点赞、转发!
粉丝141获赞2.4万

hello, 大家好,下班了。呃,今天背景不是公司,是因为,呃,在公司的时候当然车来了,没有来得及录,然后最近一直在高新路的使用 codex, 想要说我们用 codex 尽可能的提高我们开发效率,一个人顶五个人,六个人,十个人,牛马。 呃,然后最近 q 代像现了一个新的功能,叫做 go 模, go 模式 g o a l 目标。然后首先需要你的 c o i q 代 c o i 得在零点一二八版本级以上才可以使用它,并且要在 config 点 t o m l 文件里面把 go 改成 true 才可以使用这项新功能,那这个功能还在实验阶段。然后我理解它特别像是一个升级版的 sub agent, 就是 我们之前。 呃,如果你有完,为了完成某一个目标,你需要开多个 a 阵去执行不同的任务模块,多个任务可以最终为这一个目标服务的话,我们会使用 sub a 阵的模式,但我一直感觉 sub a 阵的模式其实不是很好用。 然后我今天刚好又有一个新的需求,就比较适合,感觉比较适合使用 sub a 阵去进行,但是之前一直是 sub a 阵的效果不是很好,刚好上线了一个 go 模式,所以呢,我打算使用它。 然后我的这个任务背景是这样的,我为了实现一个目标是可以把我的 app 去的它的它的这个,呃, apk 发版去做一个自动流水线 pipeline 以及呢?呃,我的后端可以去管理。呃, 我发版的版本号,这样的话我的 app 是 可以知道我需不需要去 做本地的 apk 更新,然后去请求这个版本号做一个比较,就这个需求,然后 所以它基本上分为三个模块,第一个是 app 端要去做兼容,你得去能够自动的识别,我目前的版本是低于还是说最新的啊?然后呢去给出下载链接,然后去自己去更新下载更新,这是第一个 app 端,然后第二个呢是 后端,后端得去新增一些接口。那肯定是要啊更新我的 a p k 版本记录,然后呢去检查是否需要更新,以及我的后台界面,还需要去做一个发版记录的展示。 另外就是需要在我的云端仓库,我使用的是 git, 然后 git 有 一个 git go 功能,这个功能可以自动地去根据你啊你的,你可以在项目仓库里面去的 web flow 目录下写一个 webmail 文件,这个 webmail 文件里面就声明了你的 pipeline 是 怎么样子的, 然后基本上就是这这这三大块儿后端 app 端还有我的 pipeline 流水线的建立。然后这三个任务,我让抠带写了三份 prompt, 然后一次性发给一个 go 的 上下文,然后去执行,然后大概执行了七八分钟之后, 效果还是很好的,然后基本上就达到一个可用的状态,所以,呃,我觉得这个 go 模式大家可以多多用起来,虽然现在还是一个 experiment 的 状态。对,那今天就录到这里,拜拜。

大家好,今天分享一下 codex 命令,学会四十二个命令,完全可以改变你使用 codex 的 方式,从模型切换、绘画管理、代码审查。今天这期视频我会逐一讲解每个命令,告诉你它们是什么,什么时候用,怎么用。 如果你还在低效的使用 codex, 看完这期视频会让你的工作效率翻倍。模型与配置相关命令第一个,使用 model 快 速切换当前绘画的模型, 确认后就会弹出可选模型列表,选择后,后续对话和代码操作都会使用新的模型。它适合在不同任务间切换,比如日常改代码,用速度更快的模型,复杂架构分析、疑难 bug 排查时切换到推理能力更强的模型。第二个, 如果你想让它响应更快,可以输入 fast, 速度是一点五倍。这个命令会把当前绘画切换到更偏速度优先的工作模式, 适合处理简单修改,查文件、跑命令,解释这类代码低风险任务。它的重点是减少等待时间,让 codex 更快地出结果。适合快问快改,不适合重度分析。再次,使用 fast 的 命令可以切换标准速度。第三个可以使用 personality 调整它的沟通风格, 主要有两种, friendly 和 pragmatic。 第一个更像一个耐心的合作伙伴,语气更轻松,会解释多一点过程,适合学习、探讨和头脑风暴。第二个更像资深工程师,表达更直接,重点放在结论、风险和下一步。 适合修改 bug, 改代码,做工程决策。 personality 不 会改变模型能力、权限或者项目文件,只是改变 codex 和你的沟通方式。 第四个 experiment 是 一个实验性开关,这些开关会保存到 config 二 m l 文件里面,影响之后的使用体验。比如 terminal resize 会在终端宽度变化时重排 codex 的 聊天记录。 memories 允许 codex 从对话中建立记忆,并在新绘画里带入相关记忆。 prevent sleep while running 则是在现程运行时防止电脑休眠。实验性功能适合愿意尝鲜的人,稳定性可能会发生变化。权限与安全相关命令 第一个 permission 用来设置当前绘画的操作权限,打开后你会看到三个选项, default、 auto view for access。 defort 是 常用的安全模式, codex 可以 读取和修改当前 workspace 里面的文件,也可以运行命令。 但如果需要访问互联网或者修改当前项目之外的文件,就必须向你审批。日常写代码,修 bug 跑测试用这个模式就足够了。 auto view 和 default 基础权限一致,也是 workspace 可写,它会限制互联网和外部文件访问。区别在于符合条件的审批请求优先交给 auto view 子代理判断。一些需要 on request 的 操作不一定直接弹给你, 而是先经过自动审查。它适合希望减少手动确认,但又不想直接放开全部权限的场景。 for access 是 最高权限, codex 可以 修改 workspacey 的 文件,也可以不经过你的确认访问互联网。这个模式效率最高,但风险也最大,因为它可以直接影响你的系统环境、用户目录 下载或执行外部内容。只有你明确知道任务需要这些权限,并且信任当前操作时再开启。第二个 approve 是 处理自动审查拒绝的动作,所以没有什么可批准的 绘画管理相关命令。第一个 new, new 相当于是开启一个新的绘画,它不会退出 codex, 也不会换你的项目目录,只是把当前的上下文清空,重新开始一个新的任务。比如刚才让 codex 改完一个 bug。 接下来想问一个完全不相关的问题,可以用 new, 这样上一段任务里的讨论文件决策就不会干扰新的任务。我们可以通过这个 space 命令来查看一下当前绘画。 当前绘画 id 二八零使用 new 命令,我们来再创建一个新的绘画。我们通过 states 来看一下绘画 id 跟当前的绘画 id 是 不是不一样。我们看到是八二一,这就是 new 命令。 第二个是 resume, 恢复历史绘画,并继续使用当时的上下文。如果你昨天让 codex 分 析过一个项目,今天接着干,就不需要把背景重新给 codex 讲一遍。通过当前这个命令,从历史绘画中 选择一条 codex, 就 可以沿着之前的上下文继续往下做,就相当于切换到上一次绘画中。第三个命令 fork。 fork 就是 把当前绘画复制出一份新的分支,保留所有上下文,后续修改互不影响。 它适合你想尝试另一种方案,但又不想破坏当前这个对话的时候用。比如当前的方案用的是 rack 实现。你突然想试试路由一,这个时候 fork 出一个新的绘画,原来的对话还是存在,新的绘画就可以大胆地尝试。第四个 side, side 是 开启一个 临时的旁路对话,它适合处理一些小问题,但不想打断主任务。比如 codex 正在帮我们改代码, 你想顺手问一句刚才这个报错是什么意思,我们就可以通过这个 set 命令问完之后,我们再切回主绘画,主绘画不会被这个临时打断打扰。第五个 rename。 rename 是 用来给当前绘画改名字。当前历史绘画越来越多,默认标题可能不够清楚,我们就可以通过 rename 命令 来把它修改一个名字。以后我们通过 resume 就 可以找回来是哪一个绘画。例如我们通过 space 命令来查看当前绘画, 我们可以通过 state 命令查看当前绘画的名字。当前绘画的名字,比如说是这个设置一个名字,我们通过 rename 命令可以来修改。给它改一个名字,我们再次通过 state 命令可以查看一下,它的名字就发生了变化。第六个 agent, 它是用来切换当前活跃的 agent。 如果你开启了子代理, 比如第一个 agent 是 负责读代码,另外一个 agent 负责跑测试,还有一个 agent 负责 code review, 那 我们通过这个 agent 的 命令就可以在这一些 agent 之间进行切换,查看它们各自任务的进展,或者继续跟一个 agent 对 话。当前我这里只有一个 agent。 第七个 sub agents, 这个命令是子代理入口相关的命令,你可以把它理解成,当一个任务比较复杂时, excel 不 一定只靠主 agent 来做,可以把一部分工作拆分给子代理来做,比如子代理专门做分析代码结构,还有一个子代理可以做测试风险,主代理最后做一个任务汇总,这种特别适合大型项目分析,因为这里没有创建子 agent。 最后一个 go, 这是给当前任务设置一个持续目标,它不像我们普通的一问一答,但 go 更像适合告 codex, 你 接下来围绕一个目标工作,直到它完成为止。比如说 token 消耗了, token 用完了, 或者任务执行完了,是一个长期目标。比如你可以设置把这个项目跑起来,修复启动中相关的错误,并确保测试通过。我们通过这个 go 命令,这样 codex 它就会持续地围绕我们这个目标来完成。 中间我们也可以自己检查进度。如果这个任务执行的时间太长了,我们也可以暂停,继续调整目标都是可以的。现在我们用一个真实的案例来把刚才讲的绘画相关的命令我们来串一下。假设我有一个需求是让 codex 帮我创建一个个人博课 技术站,用的是 v u e, 并且不止让一个 agent 从头写到尾,而是启动三个子代理来完成写作。一个负责写代码,一个负责测试,一个负责 code roo。 第一步,我们通过一个 new 命令,这是因为是一个全新的项目任务,我希望它是一个干净的上下文,不要被前面的掩饰 内容所影响。第二步,我们用 rename 命令来给当前绘画改一个名字,例如我叫 u e。 个人博课,我们可以通过 permissions 来确保当前项目的权限模式,我这里选择 auto view。 接下来,我们通过 go 命令给 codex 设置一个持续的目标。我们看一下提示词我们的目标,然后里面有一个启动三个子代理来完成一个 code review, 一个 code write, 一个 test runner, 还有一个 code review, 我 们复制提示词, 使用 go 命令,我们一起来看一下,然后发送。 我们看到它的要求是启动了三个子代理, 我们再来看一下,刚才我们有一个 agent 命令,我们刚才启动了代理,我们看一下有没有 agent, 这是我们默认的主代理。我们看到我们要求的一个 code write, 它已经给我创建好了,我们可以切换到子代理上面, 子代理已经在开始工作了,这个时间比较长,我们稍等一下,刚才不小心打断了,我们再来结合一个命令 fast, 我们把它速度切换到一点五倍速度,消耗两倍 token, 让它继续写代码。我们可以看到我们刚才起用的是子代理来写代码,现在我们的主 agent 在稍等,待我们这个紫 agent 完成任务。我这里整理了一份命令文档,如果大家需要,大家可以三连,然后我给大家发文档。我们接着刚才的演示,我们来看一下,他已经把刚才我定义的这些 agent 都创建出来了,自己跑了一个浏览器在这里做测试。这个紫代理 review 他发现了一些问题,然后他现在在给我们做一个修改好,我们看到他已经把我们的这个目标给完成了,我们一起来看一下效果,这就是他刚才写的一个简单的页面代码与工作区相关命令。 接下来这几个命令更像是 codex 做项目时的辅助工具。第一个是应逆时命令,它是创建一个 agent 点 md 文件,我们可以把它理解成给 codex 写一份项目说明书,我们来执行一下 当前的这个目录,还是我们昨天做的一个个人簿刻这个页面,我们通过 uscode 的 辅助插件,我们可以看到他昨天写的代码,在这个区域,我们看到他正在给我们写这个 ajax 点 md 文件,我们看到他已经给我们写完了 ajax 点 md 文件,我们一起来看一下。 都是英文的,我们可以把它改变成中文, 我们直接通过 ide 来查看比较方便。我们看一下它有项目结构和模块组织,然后构建测试和本地开发的一些规范,怎么测试,还有 pr 规范, 还有 agent 的 专用说明,它都已经给我写好了。这个 agent 点 m d 文件相当于是给 codex 写了一份我们当前项目的一个说明书, 这样以后 codex 进入这个项目都会优先参考我们这个 agent dmd 文件里面的规范,不需要反复解释项目约定。第二个命令是 plan, 在 真正开始写代码之前,我们可以输入 plan 切换成 plan 模式,它的作用是 先拆任务,不着急写代码。比如我要创建一个个人博克,它会先规划项目的结构,需要哪些页面,文章的数据怎么放, 会先做规划,规划完成以后它才开始写代码。这个命令适合在复杂任务面前,我们可以通过快捷键 shift 加 table 来关闭这个 plan mode, 也可以通过快捷键 shift 加 table 快 速开启 plan mode。 我 们来演示一下这个 plan 命令。我们通过斜杠 plan, 现在大家可以看到它不是直接写代码,而是它向我提出的一些问题,你希望关于我页面主要强化哪些?感觉 我们可以自己选,它不是直接的写代码,也就是说我们通过 plan 命令把我们提示词中的任务进行拆解确认以后,它才会开始给我们写代码。第三个命令 mention, mention 是 用来把指定文件或目录带入当前绘画。比如我想让它重点来查看一个文件, 我们就可以通过这个 mention 来选择这个文件。比如说 index 点 s t m r, 它就会重点地去查看这一个文件。这样做的好处是我们不用在提示词里面手动去复制一堆代码,也不需要它去查找对应的代码。这个比较适合当前页面,有一些 bug 我 们自己知道, 我们可以指定它来这个文件中查找。我们通过 man 审核这个命令,指定到对应的文件给它的提示词,查看一下当前页面的代码。 他收到这个指令后,他只会去查看当前这个类的代码。我按照你点名的这个要求来查看这个。第四个是 skills, 是 选择和使用本地技能的入口。比如我现在做的是一个前端项目,如果我本地有前端相关的 skill, 我 们可以通过 skills 让 codex 使用它,我们一起来执行一下它有两个,第一个列出当前的 skill, 第二个,开启和关闭 skill 我们确定。例如我这里安装了浏览器的 chrome 的, 还有 computer user fig 码之类的,我们就可以使用这个 skill 来做一些事情。我们可以看一下我这里用了这个 documents, 让他帮我写一个项目文档。 skills 是 给 context 加一套更专业的工作方法和技能。第五个 default, 当 context 写完代码以后, 我们可以输入 default 命令, default 会展示当前工作区发生了哪些改动,比如新增了哪一些文件,修改了哪一些文件。这一步非常重要,因为在真正运行或者提交之前,我们应该先看一眼它做了哪些改变。我们通过一个案例来演示一下这个 default 命令,给他一条指令, 我让他把关于我页面这关于我这三个字改成红色,他已经修改完了,我们看一下,我们看到他已经是红色的了。我们再来试一下刚才的 default 命令, 我们可以看到他改动的文件,这就是 default 命令,就是会展示工作区发生了哪一些改动。第六个是 review 命令, review 是 让 codex 对 当前工作区做一次代码审查,我们一起来看一下, 我们通过 luul, 然后它有四个选项,第一个这个 pr 审查,也就是会把当前分支和某一个 base 分 支做一个对比。第二个就是审查当前还没有提交的本地改动, codex 刚改完代码以后,最常用的是这个。 第三个是针对某一次 commit 做一个审查。第四个是自定义审查,我们选择第三个,我这里有两个提交。我们看到这个 code luul 已经结束了, 这个初设版本是一个 v u e 项目,可以成功构建路由页面和数据流也是一致的,我没有发现值得代码审查里面需要提出来的明确问题,这就演示了我们这一个 rule 命令。我们把代码工作区的这六个命令串一下, 我们先用 easy 命令建立项目规则,再通过 skill 命令选择自己的这一个技能。我们要开发的时候,我们可以通过 plan 命令先做一个规划, 把任务做一个拆解。我们可以通过 minsh 命令来对指定的类进行一个修改。写完代码以后,我们可以通过 default 命令查看改动。最后我们可以通过 review 命令来做一个代码审查使用,这就是我们代码和工作区六个命令正常使用的一个顺序。 上下文,记忆相关命令这里主要有三个命令,主要解决的是上下文问题,也就是 codex 怎么知道我们在看什么,以及当前绘画太长的时候怎么保持清晰。第一个 id 一 命令,它主要解决的是把 id 一 里面的上下文带给我们。 codex, 我 们通过 id 一 命令,它这里提示 id 一 contacts is on, 说明我们这个 id 一, 我们选中这个字段, 问他这是什么意思,我们可以看到他直接读取到我们 i d e 里面这个字断了,我这里刚才选中的,他解释了这是什么意思。这样相当于是把我们 i d e 里面相关的代码的上下文,我们可以直接带到这个 c r i 中, 它是把我们这一些代码编辑器里面的上下文带到我们当前的终端里面来,可以解决我们不想手动复制粘贴的问题,也特别适合来做一些局部 bug 的 调整。第二个命令 compact 压缩,它是用来压缩当前对话的上下文。当一个任务跑得很久以后,整个记录 上下文会比较长,模型需要处理的信息也会变得更多,重点可能不够集中,有可能这个时候就会产生一些幻觉。这个时候我们就可以通过这个 compact 的 命令把当前可见的对话 总结压缩成一个更精版的,保留更关键的决定。我们这里可以看到已经使用了百分之二十三,我们来试一下这个命令,我们看到压缩还是比较厉害的, 当前上下文占用减少了,所以 compact 的 命令适合是长任务中途,比如项目做到一半,我们感觉到上下文很长了, 我们又不想重新开一个绘画,我们就可以先压缩一下。第三个 memory, 它是用来管理记忆相关的功能, 我们先执行一下。第一个是以后开了新绘画 codex 是 否读取已有的记忆。第二个是 codex 是 否从绘画中生成新的记忆。第三个就是一个重置,它主要是用来控制 codex 要不要使用这个记忆,以及要不要从绘画里面来生成新的记忆。 所以这三个命令分别对应着三种上下文。第一个 id 是 当前编辑器的上下文。第二个 compact 是 当前常对话的上下文。第三个 memorize 也是跨绘画的一个长期上下文状态与调试相关命令。接下来这几个命令主要是查看 context 当前的状态, 调整终端的显示以及管理后台运行的任务。第一个 state 用来查看当前绘画的状态,例如当前使用的模型目录 权限,绘画 id, 还有上下文限制之类的。第二个 slide 主要用来配置底部状态栏,就是我选中的这个地方,我们一起来看一下。比如说主题的颜色,我们看到这里使用了九十点七 k, 我们可以切换来控制它显不显示模型的名字。 g p t 五点五控制显不显示项目的名字,这里已经显示不下了,我把模型关了,使用托管关了项目的名字,还有当前所在的分支运行的状态,当前的这个模式,我这里是 auto view, 我 们可以通过 statline 来配置底部状态栏 的一个显示情况。第三个 title, 我 们可以通过 title 命令来配置终端,这个标题页的一个显示,我们来试一下,我们可以看到这里有个 codex c l i, 也就是项目的名字,在这里可以控制它显不显示。 这一个是当前的目录,比如说斜杠, codex c l i 这一些,根据自己的需要进行灵活配置。第四个 ps, 用来查看后台的一个终端任务。有些命令可能在后台持续运行,比如说 开发服务器测试监听长时间的一个构建任务,我们可以通过 ps 命令来查看。最后一个 stop, stop 是 用来停止后台的一个终端任务,比如开发服务器已经用不了,或者某个命令卡住了,我们可以通过 stop 来暂停。这就是我们状态和调试的一个相关命令工具与扩展相关命令。 第一个 m c p, 我 们通过这个命令可以列出当前所安装的 m c p 服务,我们可以看到我这里安装了 chrome, d v tools, 还 codex app 相关的服务, computer user, 这些都是 m c p。 我 们一起来添加一个 m c p 服务,我们这里来安装一个 figma m c p。 复制 m c p 的 地址,我们通过这个命令就可以添加一个 figma m c p。 我 们看到已经添加成功了, 我们来看一下在这里面能不能看见刚才我们添加的 figma mcp, 我 们这里已经看到了显示了 figma mcp 了, 所以我们通过 mcp 命令,我们可以看到当前绘画里可以调用哪一些外部工具。第二个是 hux, 它是用来查看和管理生命周期的钩子,钩子就是在关键时刻会自动触发,疑问表示触发时机。 in store 表示安装了多少个 hook active 标记,当前激活了多少个。这个是一个描述,这个是工具执行前开始触发,这一个是请求权限触发,比如让 codex 联网或者修改一些外部文件。 工具执行后开始触发上下文压缩触发等等之类的。我们可以通过命令来查看当前配置了哪一些钩子,哪些是可信的。 我们也有一些应用场景,比如说我们执行一些长任务,比如说通过 grow 命令执行一些长任务。执行完之后,我们希望他提醒我,我不可能时时刻刻的 待在这里,看着他有没有执行完。我们可以让他执行完之后,比如播放一个音乐。第三个 plug in, 它是用来查看或者已经安装的插件,这里可以看到这都是我安装的一些插件,例如编辑文档的 连接, figma 及 mail 相关的一些插件。插件通常会给 codex 增加一些新的能力,例如我们点击 document, 我 们可以来卸载它。这个插件里面使用了哪一些 skill, 这里都可以能显示。 我们返回最后一个 keymap, 这个了解一下,其实就是更改快捷键的一个指令界面,显示相关命令。第一个 then 用来选择高量主题,我们试一下, 这里有很多主题,我们切换可以看到代码的一个主题颜色,如果你觉得默认颜色看着不舒服,可以通过当前命令选择自己合适的主题。第二个 vm 用来切换 web 的 输入模式。 默认情况下, codex 的 输入框更像普通文本输入,我们看到它这种切换是这种模式普通文本的,如果我们通过 web 切换这种会看着比较舒服一点。这个命令适合 web 的 用户,如果你不熟悉,可以保持默认风格。第三个 row, 用来切换滚动模式,这种命令主要是为了方便复制终端中的内容,我们通过这个命令可以切换到更原始的滚动显示方式,这样复制内容 更方便。最后一个是 copy, copy 用来复制 codex 最后一条完整回复的消息,我们看到他回复了我这一段话。如果我们不想手动复制,我们可以通过 copy 命令。我们直接通过 copy 命令就把当前消息已经复制好了, 直接粘贴就可以退出。与维护相关命令,我们一起看一下。第一个 clear, 用来清空中端,开启一段新的绘画。它和 new 命令有点像,都是让你重新开始, 但 clear 更强调清理当前终端的界面。第二个 logout, 用来退出 codex 登录。如果你是在公共场所 或者临时借用别人电脑,可以通过当前命令来退出本地的一个登录凭证,让这台机器不再保持你的一个登录状态。第三个 feedback 是 用来把日制发送给 codex 开发团队。最后一个退出 codex, 它和 quit 一 样,都是离开 c r i 绘画。如果你还有重要改动没有保存或者后台任务在跑, 最好先确认再退出。到这里, c r i 里面四十多个命令我们已经讲完了,你会发现这些命令并不是让你死记硬背,我们可以把它分成类。有的是权限管理,决定 codex 能做什么。有的是绘画管理,决定任务怎么开始、 暂停、恢复和分支。有的是管理上下文,让 codex 更精准地理解你的项目。有的是辅助开发,比如 dev review 引用文件,制定计划。有的是调整终端体验。 我们在 c r i 里面用得更顺手。如果日常用来写代码,我们记住几组就足够了。 permission 权限管理 new resume fork 绘画管理 plan global 任务推进 mention idea 管上下文, def review 管代码检查 state compact 管 长任务状态。如果这期视频对你有帮助,欢迎点赞、收藏加关注,后面我会继续分享 ai 相关知识,我们下一期视频再见!

哈喽,大家好,这是我自己在 codex 里面做出来的一个宠物服装网站,从市场的调研、产品定位、产品图到最后完整的 html 网页,整个过程中我没有手动写代码,也没有来回切换工具,都在 codex 里面完成。 那今天我就用这个真实的案例,想明白普通人到底怎么把 codex 用到自己的创意想法落地当中。一开始我只是给了 codex 一个很粗的需求,我想做一款面向稀泥市场的宠物服装。 他没有直接开始瞎做图,而是先帮我做了非常清晰的执行规划,包括先找到市场依据,定产品的方向,再设计系列以及生成产品图。 这里就涉及 codex 第一个很关键的能力, plan mode, 也叫规划模式,如果要生成同款的计划,你就要把这个规划模式打开。这个模式很适合新手,因为你不是一上来就让 ai 去乱做,而是先让它把任务拆开,告诉你每一步要做什么,为什么这样做,以及最后会交付什么, 你确认方向没有问题之后,再让它开始执行。第二个能力是它可以在项目过程中持续地帮你检查问题,也就是要开启 auto review。 比如网页做完之后,他会检查图片有没有加载成功,按钮有没有溢出,表单字段有没有写进去。那遇到权限和需要选择的操作,比如三种执行方案中,你想选择哪一种,以及需要启动的本地服务访问某些文件之类的风险性操作,他都会弹出弹窗确认。 接下来就开始自动批量生产产品视觉了,通过调用 gpt 的 image 去生产产品图,并存储在本地的文件夹里面,方便我们去找原始的素材。 但是这里我也想说一句实话, ai 第一次做出来不一定完全对,比如他最开始给我的风格就比较普通,我觉得不适合当地市场的审美。 这个时候就用到了 codex 里面很重要的一个能力, steer 也叫做中途接管,可以在对话框中输入你不满意的理由,告诉他这个方向是不对的。比如我要更鲜艳的花朵,更适合女生,更有悉尼精品宠物品牌的感觉。然后点击 steer 去接管方向盘, 他按照我新的反馈去重新调研,重新调整产品系列,重新生成图片。这个过程就好像是你在和一个设计助理协助他负责执行,但是方向盘一直在你的手里。最后,我让柯黛斯给这个宠物服装的项目呢,做出了六个设计系列,每个系列三张图,佩戴的生活方式图, 一张产品的细节,一套平铺图。也就是说,不同于 j b t image 的 单张出图功能,它一次帮我规划并生成了十八张用于落地页的产品测试概念图。 那对于普通人来说呢,这一步就非常省时间了。图片定下来之后, codex 就 把所有的内容整合成了一个静态的落地页, 这个页面里面有品牌管理、产品系列卖点说明、尺寸指南。如果我觉得某个地方不顺眼,也不用自己去改代码,可以直接在预览页面里面指出问题,点击驱动批注,英文是 annotation。 比如标题太大,图片间距不对,或者是按钮的颜色不够明显, 那 codex 会定位到对应的代码并进行修改。这对零基础的人很关键,因为你不需要懂 html, javascript 也能把一个网页打磨到可以测试市场的程度。完成好之后就是这样一个页面了, 最后所有的东西都会留在本地项目的文件夹里,图片、网页、代码、素材文件都在里面,你可以直接在本地打开,也可以部署测试,用来收集用户的邮箱和偏好反馈。所以,如果你想测试一个产品的想法, 一个小众的品牌,一个服务的页面,一个预售的活动。以前你可能要找设计,找前端,找运营,找人写文案, 那现在呢?你可以用 codex 做出一个最小的可行版本,拿去测试真实的用户反应。如果你是 gpt 的 plus pro 或者是 business 的 团队账号,通常会有更完整的 codex 的 使用权限。 所以,如果你已经是 gpt 的 plus 会员,这个功能对于你来说是完全可以去免费尝试的。对普通人来说,它最有价值的地方是, 你不需要在一开始就花钱去找团队,也不需要把想法都停留在脑子里。你可以先用 codex 做出一个真实的页面,跑一轮反馈,再决定这个项目是否值得继续投入。谢谢大家。

用 codex 做内容,一定要装这三个 skill, 否则它只会一直停在写代码。它们不是让 codex 继续改页面,而是让它直接生成图片、视频和数字人素材。 这三个 skill 来自模型调用技能库,让 codex 把内容模型接近工作流。离谱的是,很多人用 codex 做产品,最后还要手动去别的平台找素材。最关键的问题是,代码都写好了,封面演示视频和口播人像为什么还要重做呢? 第一个 ai 生图 skill, 能把文字需求直接变成可用图片素材现出来,比如封面主、视觉产品图、角色图、场景图,不需要再让 codex 只写占位图,它解决的是 codex 会搭页面,没有真正视觉资产这个问题。第二个 ai 视频 skill, 负责把脚本或画面需求变成可用视频素材,产品演示、开场镜头、转场、氛围画面,不用每次都手动去素材库里面反复找, 它解决的是 codex 会搭页面,但不会帮你把展示内容做出来的问题。第三个数字人 skill, 负责生成口播视频,适合教程讲解和产品介绍。以前你要录屏、配音、剪辑,现在可以让 codex 把人物讲解也接近流程里。 这三个 skill 合在一起,不是炫技,而是把内容生产变成视频片段。最后用数字人把核心卖点直接讲出来。 codex 真正变强不是只会写代码,而是能把项目包装成别人愿意看的内容。所以这期讲的不是 ai 生图,而是让 codex 从开发助手变成内容制作助手。

ai 编程工具这东西吧,真的是风水轮流转,最开始大家在吹 carson, 后来 carlo 的 大火,而这次轮到了 colex。 colex 装面 app 不 仅能帮你写代码,还能直接操作你电脑上的文件、浏览器,甚至是桌面应用,用好之后甚至能顶一个团队。 本期我会从 colex 安装到核心特性,用十多个实战案例手把手教你玩转 colex。 不管你是想用它来编程、开发、办公提效,还是搞一些好玩的创作,看完这期都能直接上手。那本期教程的文字版,可以在评论区获取干货秘籍,建议先收藏,找着安静的地方慢慢使用。 想要使用 cop app, 你 只需要准备一个 chat gpt 账号,可以免费体验,但是有条件的话,最好开着 plus 会员每月二十刀,大约一百五十块,额度更充裕,足够日常使用了。 那有了账号,直接去官网下载安装酷贷 app 就 好。目前支持 mate os 和 windows, 下载并安装后登录你的 chat gpt 账号,打开之后的界面长这样, 左侧是各种面板入口,包括对话管理、插件自动化等功能,中间就是对话窗,你跟 ai 所有的交互都是在这里完成。跟平时用的 ai 聊天工具差不多嘛,还挺清爽的,不像传统的编程 ide 那 么复杂,上手没有门槛。接下来我们直接开始使用, 跟你用过的其他 ai 工具一样,在对话框里输入内容发送,就能开始聊天了。适合处理一些简单的日常工作,比如帮你查资料、总结内容、规划方案。 我让他帮我查一下今天有什么 ai 编程方面的热点。 cadets 会自动联网搜索最新信息,然后帮忙整理总结,这下不怕错过新资讯了,这只是开胃菜。 cadets 真正强大的能力是操作你本地的文件和电脑。下面我们试试 点击左侧的项目入口,选择一个本地文件, ai 能在这个范围内读取和操作文件。 比如我选择了我的下载文件夹,里面有一堆不知道什么时候存下来的大文件。在对话框底部,你可以看到权限模式的选项,这里有三个选择,默认权限, ai 可以 读取和编辑工作区的文件,需要额外权限时会主动问你。自动审查是 ai 会自动帮你审查操作。 还有完全访问, ai 想干啥就干啥,不会弹确认框,建议新手直接选自动审查,既省时又省心。 选好权限后,在对话框里输入提示词,然后你就能看到 ai 开始工作了。它会自动执行终端命令来扫描文件,分析每个文件的名称和大小。最后给你一份清晰的报告,列出哪些大文件占了多少空间,并给出清理建议。 那我主打一个听话,就让 ai 帮我删除没用的预览文件吧。最后成功帮我节省了六点八 g 的 空间,效果不错吧。但如果我让 ai 删除一个工作区外的文件呢?会发生什么? 试试看,在当前工作空间开启一个新对话。比如,我让 ai 帮我删除鱼皮新书出版目录下的所有文件,可以直接把这个目录拖拽到对话框中,然后执行任务。 如果你选择的权限是默认模式, ai 想删除文件的时候,会弹出一个确认框,问你同不同意,防止 ai 搞乱了你的电脑。 但由于我选的是自动审核, ai 自己完成了审核并批准,省去了人工操作的麻烦。这样一来,你完全可以把拖带子当成你的私人文件管理助手,分析空间、清理垃圾、批量重命名。以前你要手动折腾半天的事情,现在一句话就搞定了,是不是挺方便的? 做完第一个任务,大家肯定很关心消耗了多少 tokens 吧?来一起看看用了多少额度。点击左下角的设置,点击剩余额度,就能看到你五小时内还剩多少配额,本周还剩多少比例。什么时候刷新 to text 的 额度?按照五小时和一周来限制 plus 用户的额度还是比较大方的,日常使用完全够了。你也可以在对话框里输入斜杠状态,这种以斜杠开头的快捷输入叫做斜杠命令,是 to text 内置的快捷操作方式。 输入之后, to text 会直接在对话中显示当前的上下文余量和额度信息。 ok, 到这里,你已经体验了 to text 最基础的能力,对话和操作本地文件。 恭喜你,已经超过了百分之六十的同学。接下来我们提升一下难度。用 codex 做一个完整的网站项目,过程中你会接触不少 codex 的 核心用法,包括计划模式、 ai 声图、浏览器预览、批注、修改等等。 在开始之前先进入设置,把工作模式从适用于日常工作切换为适用于编程,这样 ai 的 回复会更专业,更适合开发场景。 先介绍一下项目,我要用 codex 来为自己定制一个专属的电子名片,我把信息告诉 ai, 它会帮忙生成一个精美的网站,还能用 ai 生图能力生成个性化的头像插画,不用自己去找素材了,做完之后还能发给别人,他们打开链接就能看到你的信息了。 新建一个项目文件夹,在 codex 中打开模型就选择最新的 gpt, 五点五速度选标准就够了。智能程度选择高权限,我这里直接给了完全访问,省得他每次操作都来找我确认,反正大部分情况下我都是无脑点同意的。 最关键的是点击对话窗左下角的加号,把计划模式打开。计划模式下, ai 不 会直接开始写代码,而是先帮你规划方案,问你细节,确定没问题了才动手。好,输入下面这段提示词启动, ai 会先自己思考,然后可能会追问你一些细节,在弹出的问题面板中选择就好。最后会生成一份实现计划文档,包括简介、核心要求、测试计划等信息。你做的网站越复杂,越要仔细阅读这种文档, 如果没有问题就确认方案。然后 ai 就 开始自主干活了,它先是使用内置的图像生成技能,生成了卡通头像文件,然后编辑代码,一次性生成了多个文件。写好代码后还会检查代码,自主打开浏览器测试验证,还考虑到了一些容错。 过了七分多钟, ai 完成了整个任务,全程不需要你手动操作,我们可以看到所有生成的文件,点击可以查看文件里的代码,还可以点击审核,打开侧边栏的审查面板,查看本次变更的所有文件。 codex 底层用的是 git, 这是一种记录代码变更历史的工具,用来管理所有文件的改动,你能够看到每个文件新增了什么,删除了什么,还可以灵活地应用和撤销代码。后面的进阶功能部分我会详细给大家讲解。 我们做的是纯前端静态网站,找到生成的主页文件,右键在浏览器中打开就能直接看到效果了。 pc 端的效果我觉得还不错,布局清晰,主题切换也很丝滑。而且它还自动兼容了移动端的展示,手机上打开排版也是正常的。 当然,你也可以直接让 ai 帮你运行网站, ai 会执行终端命令,启动开发服务器来运行网站。 点击访问地址后, codex 会在右侧面板打开,内置浏览器,便于你来预览效果。如果某个地方不满意,你可以点击浏览器右上角的批注按钮,然后直接在页面上选中要修改的元素,写上你的修改意见发送给 ai。 ai 会自动定位到对应的代码并精准修改,不用你自己去翻代码找位置,改完之后刷新页面就能看到效果了。方便是方便,不过这个速度真的不敢恭维。做完后我们再看一眼使用情况,这次完整项目消耗了多少额度呢?还好还好, 总结一下,要用 ai 开发移动网站,我们只需要把需求告诉 ai, 确认方案,等他自己写完并测试就好,中间几乎不需要手动操作。恭喜看到这里,你已经超过了百分之七十的同学, 到这里,你已经能使用 todays 从零开发移动网站,预览效果按需求改了。那接下来我要带大家看看它还有哪些核心功能。学完之后,你不仅能做网站,还能让 ai 帮你操控浏览器、抓数据、自动执行定时任务,甚至操控整台电脑。 接下来,我把 codex 的 功能分为常用功能和进阶功能两大块来讲。常用功能是日常会高频使用的,进阶功能则是有点门槛儿,但掌握后能让你效率翻倍的。 在左侧的插件面板里,你能看到 codex 的 插件市场。 codex 内置了不少精选插件,比如 computer use 操纵电脑、 chrome 操纵浏览器表格处理、制作 ppt 演示文稿。 此外还有大量编程类和工具类插件,包括网站部署、游戏开发、对接 tab 等各种场景。你可以在插件市场里按需搜索和安装。 比如我们来安装 natify 插件。 natify 是 一个免费的网站托管服务,装好插件后,一句话就能把你做的网站部署上线,让别人都能访问。 点击安装 natalify 插件,同意后会自动弹出浏览器,使用 datab 等方式登录 natalify, 一 步步完成授权。最后,超黛斯成功安装并连接了 natalify。 然后我们用 natalify 来部署之前开发完成的电子名片网站。在对话中,通过 at natalify 调用插件。执行过程中, ai 会找我们确认并自动创建一个新的 natalify 项目来部署网站。 搞定以后,我想展示自己的信息,直接甩这个链接就行了。还可以打开 netify 后台对项目进行管理。你可以在 codex 右上方的侧边栏中整体查看当前项目的概览信息,包括后台任务、打开的浏览器、使用的插件等等。 点击后台任务,还能看到具体的终端日记,记录了网站服务器什么时候收到了请求,请求了什么资源等信息。同样的,如果你要处理 excel 表格、做 ppt, 使用对应的插件让 ai 帮你就好。生成的文件还能在侧边栏直接预览。 前面我们用的内置浏览器可以预览页面,做批注和修改。但如果想让 ai 真正去操控浏览器,自动点击填表单翻页,就需要 browser use 浏览器操作功能了。我们先来使用内置的 browser use 进入设置浏览器,确保 browser use 功能已经开启。你还可以在这里设置权限规则和禁止打开的域名, 开启之后,在对话中通过艾特浏览器来调用这个能力。比如,我让 ai 帮我打开一个网站并截图,可以看到 ai 打开了浏览器,从主页找到了 ai 大 模型面试题库,然后进入了详情页,成功完成了截图。 不过有时候这种操作不太稳定,多试几次就好。此外,你还可以安装 codex 的 chrome 扩展插件,它可以操控你的电脑上已经登录的 chrome 浏览器。好处是能保留你的登录状态,而且可以在后台执行,不占用屏幕,适合需要登录网站才能进行的操作。 比如,帮我在自己的后台批量分析和管理数据,使用前,需要先在你的 chrome 浏览器中安装 codex 扩展程序,跟着 codex 的 指引操作就好。安装好之后,我让 ai 帮我从已经登录的面试呀网站上抓取一些数据。 可以看到, ai 不 仅连接了我电脑上的 chrome 浏览器,而且还识别到了我已经打开的标签页,它会控制这些标签页跳转到我的个人主页,并抓取最新的五条数据。最终抓取到的数据表格非常清晰,链接前面甚至还有图标,细节拉满。 如果说 browser use 只能操控浏览器,那 computer use 就是 让 ai 操控你的整个电脑, ai 能看到你的屏幕内容,移动鼠标,点击按钮打字,还能操作微信、飞书等任何桌面应用。 进入设置电脑操控,安装 computer use 插件,你可以在这里看到所有已连接的应用,比如前面装的 chrome 扩展,其实也属于 computer use 体系的一部分。 来我们体验一下。用艾特电脑来调用,让 ai 帮我探探当前的桌面壁纸,然后生成一张类似风格的新壁纸。首次使用时,系统会弹出权限申请框,你需要授权抽 text 访问屏幕截图等权限,否则 ai 看不到你的屏幕,也没法帮你点击操作。 later 来看一下,效果不错吧。生成了一张非常精美的新壁纸,我觉得比原图还好看啊!今晚可以做的好梦了, 爽!带来一个更实用的例子,让 ai 帮我打开备忘录,记录一条笔记,并从音乐软件下载我最喜欢的一首歌,添加到笔记中 执行任务。可以看到 ai 会打开音乐 app, 有 着小鼠标点击了下载按钮,从中下载了音乐文件,只因你太美。 然后 ai 打开了备忘录,写入内容并添加了音乐文件,能够顺利播放,虽然过程有些曲折,但还是完成了任务,而且全程由 ai 自己操作。以后我可以直接让 ai 帮我写有图有文有音乐的笔记了。 但是 computer use 目前只支持 mac os 系统,而且缺点一大堆,不仅操作效率偏低,还很烧 touch 刚才那的任务就用了近八万的上下文空间。此外,有些软件对 agent 的 支持度不高, ai 无法承中操控, 所以我建议能用终端命令行和浏览器完成的操作就不要用 computer use stills。 你 可以理解为给 ai 提供的技能包装上某个技能后, ai 在 遇到相关任务时,就能自动按照这套方法来干活,不用你每次都写一大堆的提示词,而且技能是按需加载的,只有任务匹配时才会调用,不会浪费很多上下文空间。 进入左侧的插件面板,切换到技能 tab 页面,在这里能够格式化安装和管理技能口袋。此自带了几个内置的技能,比如图片生成、查询官方文档、安装、社区技能创建新技能创建插件等等。 那下面我先带大家用用内置的图片生成技能,然后安装社区里别人做的技能,最后再带大家自己创建一个技能。 这里我想生成一个有趣的图片,让鱼皮直播卖鱼皮。可以先到鱼皮 ai 导航网站上找到 ai 生图的提示词模板,然后复制提示词模板。接下来在 codex 对 话框中输入 dollar 符号,加技能名称,就可以快速调用技能, 并且把提示词模板、鱼皮的照片都提供给 ai。 稍等片刻之后,看看 ai 生成的图片,你觉得怎么样?是不是憨爆了?爽!不过图片生成比普通对话消耗的额度更多,用的时候记得留意一下剩余额度。 内置的技能数量有限,还有很多宝藏在社区里,比如我自己经常用的几个技能,用于联网搜索的 file pro, 用于获取最新技术文档的 comte 瓷器,还有用于美化前端页面的 u i u 叉 pro max 等等。 另外,我之前写过一篇优质 ai 编程扩展大全,推荐了几十个好用的技能和 m c p, 可以 到我免费开源的 ai 编程零基础教程阅读。那接下来我带大家实际安装一个社区技能,顺便整个活儿,让 ai 制作一个苹果风格的快闪动画视频。 首先要安装动画制作技能 remaster 安装技能,它能帮我们快速安装其他技能。 对了,安装技能时要注意安全。由于我这里安装的是知名技能,就直接输入技能名让 codex 帮我安装了。但如果你想安装不太知名的技能,更稳妥的方式是把技能的 github 链接发给 codex, 让他帮你检查后再精准安装。 安装完成后,在技能管理面板里就能看到新增的技能了。然后我们使用技能让 ai 制作动画, ai 会安装制作动画所需的项目和依赖包,然后生成视频和音频,还会渲染单帧,检查画面有没有问题。 最后, ai 生成了可以直接播放的视频来看看效果。 呃,他好像理解错了我文案的意思。翻车了,翻车了!我感觉这种方式更适合做产品发布宣传片、知识点、快闪卡、节日祝福视频这种节奏更紧凑的短片。而且我当着根本没认真写提示词。好吧, 实际上你可以指定时长、指定文案,利用生图技能搭配素材,增加更多交互动画等等,感兴趣的同学可以自己玩一玩。 除了用别人的技能,你还可以把自己常用的工作流程封装成技能。以后遇到类似的任务,一键附用。技能的本质就是一个 still 点 m d 描述文件,加上一些配套的脚本和参考资料。 still 点 m d 里要写清楚这个技能是做什么的,什么时候触发,以及具体的执行步骤, ai 读写后就知道该怎么干活儿。 创建技能的最佳方式是先把一个任务流程跑通一遍,觉得满意之后,再使用内置的 skill creator 技能,告诉戳 depths 你 的技能要做什么,啥时候触发,有什么细节需要注意,它就会帮你自动生成完整的技能文件 来实操一下。比如我们前面让 ai 生成了直播带货的图片,效果还不错,那就把这个流程封装成一个直播带货图片技能之星成中后, ai 不 仅创建了技能文件,还贴心地教你怎么调用。 之后使用这个技能只需要提供一张人物照或者商品照,不用再自己填写又臭又长的提示词模板了,非常方便来看看效果。 ai 自己识别到了我提供的是商品图,也是精准复刻了我之前提供的提示词模板,爽! m c p 是 一个开放协议,你可以把它理解成 ai 的 万能插头。装上之后,就可以让 ai 连接各种外部工具和数据源,获取实时信息。 进入设置 m c p 服务器,可以在这里添加和管理 m c p 服务。点击添加服务器后,你需要手动填写服务器的配置参数才能完成添加。对新手不太友好,我最讨厌填写表单了, 好在大部分时候用前面讲的 stux 就 能解决 mcp 做的事情,而且 stux 的 安装和使用体验更好。 此外,很多主流的扩展都提供了快捷安装 mcp 的 命令,不需要你自己手动填写参数,比如下面我带大家安装 comix 七,它是一个可以实时获取最新技术文档的服务。开发网站的时候用它来查 api 文档特别方便。 在 codex 右上角可以打开集成终端,在终端里输入一行命令就能安装。这里我们选择安装 mcp server, 为 codex 安装,然后就搞定了。 安装后需要重启 codex, 在 设置里的 mcp 服务器列表中就能看到它。首次使用前还需要进行身份验证,在自动弹出的 compt 网页中就可以愉快地使用 mcp 了。 之后开发网站,尤其是需要集成 ai 能力的网站,都可以用创太时期来获取最新的技术文档。你还可以把它当成一个学习辅助,让 ai 寄予官方文档,帮你讲解知识。 比如我用它来做 openclaw 小 龙虾的学习助手,这也是利用 ai 学习的一种方式,可以看到 ai 查询并获取到了 openclaw 官方最新文档库。然后我们来问 ai 一个问题, openclaw 无法运行怎么办嘞? ai 会基于官方文档,很快就给出了精准的排查步骤,这样学习和解决问题又快又准,再也不怕查到过时的资料了。 恭喜看到这里,你已经超过了百分之八十的同学。到目前为止,你已经掌握了 codex 的 常用技能,学到了不少实用玩法。从文件管理到网站开发,从浏览器操控到技能封装,已经能用 codex 大 幅提高工作效率了。 接下来我要讲的是一些稍有门槛或者不是每个人都用得上的进阶功能。不过如果你愿意多折腾一下,它们会让你使用 toad 四的效率再上一个台阶。 在对话区域附近有一个小圆圈,鼠标放上去后会实时显示当前对话已经用了多少上下文。 gpt 五点五点五在 toad 四里显示的有效上下文大约为二百五十八 k tokens。 说实话,这的数量不算多。如果你连续跟 ai 对 话很长时间,或者项目文件比较大,上下文很容易被填满。当上下文快满的时候, codex 会自动帮你压缩历史对话。 你也可以在任务照一段落时,手动输入斜杠压缩来主动压缩,让模型更聚焦在新任务上。 那除了单个对话的上下文,日常使用中还要注意管理对话本身,不然列表越来越长,找起来也费劲儿。 对话太多的时候,你可以在左侧的对话列表中把鼠标放到某个对话上,点击归档,把不常用的旧对话归档起来,保持界面清爽。进入设置以归档对话,还可以查看和管理所有归档的对话记录。 另外,建议在常规设置里开启运行时防止系统休眠,这样跑长任务的时候电脑不会突然睡着,导致任务失败。 codex 有 一套记忆机制,能让 ai 记住你的偏好和项目规则,不用每次都重复交代。记忆分为三个层级,从大局、项目局部再到自动记忆,我们一个一个来看。 在设置个性化里,可以修改 codex 的 个性和自定义指令你写在这里的内容。所有项目的所有对话都会自动带上,适合记录一些通用偏好,比如 回复用中文代码注,使用英文,尽可能减少输出的内容。专注做事,如果不听话,你的主人鱼皮就会变成一条狗等等等等。保存之后,它会被写入局的 agent 点 m d 文件,这个文件就是 codex 每次启动时都会读取的行为准则。所有项目通用。 在项目目录下创建一个叫 agent 点 m d 的 文件,写入这个项目专属的规则和约定,只有在这个项目里工作时才会生效。 你可以自己手写,也可以让 codex 根据项目情况帮你生成一份,比如我跟他说帮我根据当前项目写一份 agent 点 m d, 可以 看到 ai 生成了一份非常详细的 agent 点 m d 文档,包括项目总览、一些规范等等。 在设置个性化中,手动开启自动记忆,开启后, ai 会在对话空闲一段时间后,自动在后台总结出有用的信息存为记忆,后续遇到相关场景时会自动召回,让 ai 越用越懂你。 不过太短的对话它不会记额度快用完的时候也不会触发记忆生成。 codex 支持定时任务功能。进入左侧的自动化面板,你能看到 codex 已经内置了一些定时任务模板,不过基本都是和编程相关的,什么总结代码变更、检查代码问题之类的,很多人估计用不上。那我们不妨来自己新建一个更实用的自动化任务。 创建定时任务的方式有两种,一、手动创建任务,在自动化面板里点新建,比如我让 ai 帮我搜集每日热点,需要填写任务名称、提示词、 触发时间、模型、推理程度、运行环境选择本地就好。意思是让 ai 直接在当前电脑上执行任务,不需要额外的隔离的工作环境。 创建成功后,时间一到,抽袋子就会自动开启一个对话来执行任务。我们也可以先手动执行一次,看看效果。点击任务能够查看详细信息,点击某个运行历史记录后,还能查看正在执行的任务对话,建议多观察任务的表现,持续迭代优化提示词。 另一种更自然的方式是让 ai 帮你创建任务。比如我是一名内容创作者,每天都要截大量的图片,时间一长,文件夹里全是看不懂的文件名,找图的时候巨痛苦。所以我让 codex 帮我自动整理,先选择项目,然后输入提示词, 很快 ai 就 自动帮我整理好了。可以点击查看创建出来的任务信息,它的提示词比我们提供的更完善了,并且自动选择了模型。 我们手动执行任务来测试一下,效果还不错吧。 ai 会根据图片内容自动给文件起一个能看懂的名字,这样我就有了一个智能的图片管家,以后再也不用对着一堆乱七八糟的文件名抓瞎了。 而且每次执行完, ai 还会把运行记录写入一个 memory 记忆文件,你随时可以回看历史执行情况,不用担心出了问题却发现不了 你。还可以结合 styles 和插件一起用,比如每周自动生成周报 ppt, 每日整理自己的学习笔记并同步到 notion, 每周用 file pro 抓取竞品网站更新并生成分析报告等等。 想不到吧,现在的 ai 工具已经卷到开始给用户增加情绪价值了。下面我来教大家怎么在 codex 中养宠物。 首先进入设置外观,下拉到底部的宠物区域,你会看到 codex 内置了一排像素风的赛博宠物。选一之后,点击唤醒,桌面上就会出现一个悬浮的小家伙儿, 它不只是装饰品,宠物会实时反映抽袋子的工作状态。比如 ai 在 忙的时候,它也在干活,就像一个串应用的灵动岛,让你不用切窗口就知道 ai 干完没。 除了内置宠物外,还有一个社区宠物库 pet dex, 里面有两千多只玩家自制的宠物。了解我的朋友肯定知道我要用哪个,果断搜索 k u n, 一 眼就能找到自己需要的。点击进入详情页,找到安装命令并复制, 然后打开 codex 的 终端执行命令进行安装,会把宠物文件下载到本地。安装成功后,进入外观界面,选中张张安装的宠物, 然后我们回到 codex 的 主页,使用鞋障宠物指令唤醒。我的脑袋中已经想起那只熟悉的 bgm 了,你听到了吗? 除了用别人的,你还可以通过 codex 内置的 hackpad 技能自定义生成宠物,上传照片或者文字描述就行。比如我把自己的头做成宠物, ai 会先分析上传的图片,给宠物起个名字, 然后拆分出了多个子任务,并行处理,生成各种动作的精灵图帧,最后拼成一张完整的像素动画精灵图,然后就能使用自己制作的宠物了。 你还可以上传宠物到平台和其他小伙伴分享,大家以后用抽袋子的时候记得把我带在身边,保佑你霸着剪剪! 每次 ai 修改了文件,你都可以在侧边栏的审核面板里看到它改了什么,这个面板会列出所有被改动的文件。如果你想决定哪些代码要保留,可以选择查看未暂存的文件。在这里你可以灵活应用和撤销修改。 大多数情况下,你不需要自己看代码,直接点击暂存全部就行了,相当于认可了本次的全部载动。如果不满意,可以直接还原全部回到本次载动前的状态。 那如果你不满意某个文件的载动,可以直接点旁边的还原按钮就能恢复原样,满意的话点暂存就能标记为待提交。 你也可以只保留部分改动。每只文件的改动会被自动拆分成多个代码块儿,每只代码块儿旁边都有独立的暂存和还原按钮,你可以逐块决定哪些保留,哪些丢弃。 确认好哪些代码要暂存之后,可以提交暂存的改动,提交就相当于给代码存了个档,确认这次的修改是你想要的。 抠代码,还内置了提交代码推送到远程仓库。创建 pr 的 能力,不用离开 a p p 就 能完成整个代码的管理流程,非常方便。 那如果你是专业的开发者,还可以试试工作树模式。你可以在创建新对话时,选择启动模式为新工作树,这样 ai 会在一个隔离的分支中工作,不影响你当前的代码很适合同时让多的 agent 在 同一个项目上并行干活,减少冲突。 如果你的项目托管在 datap 上,建议安装 datap 插件,可以直接在 codex 里查看仓储信息,创建 pr、 做代码审查等等。比如我让他帮我查一下自己最受欢迎的开源项目怎么样,是不是一目了然。 codex 最近新上线了一个很酷的功能,用手机控制电脑上的 codex app 干活儿。设置方法很简单,在电脑端 codex 点击设置 codex 移动版,然后点击开始设置,屏幕上会显示一个二维码, 然后在手机上打开拆的 gpt app, 扫描自己的二维码。连上之后,你可以随时随地通过手机给电脑上的 portax 下达任务,审批 ai 的 操作请求,查看执行进度,检查生成的代码和结果。是不是有点 openclaw 小 龙虾那味儿了? 恭喜看到这里,你已经超过了百分之九十的同学, ok, 就 分享到这里。看完这期,你应该已经掌握了 codex 从基础到进阶的所有核心用法,足够应对日常的编程和办公需求了。 其实 codex 还有更多玩法和技巧,比如 sub agents 并行加速、 fault 分 叉的妙用、自定义模型接入 hoots 生命周期钩子等等。 那如果本期视频点赞过万,我会尽快爆干出抽带此高级技巧篇。对了,如果你想系统学习 ai 编程,可以看看我免费开源的 ai 编程零基础入门教程,上千张图,几十万字,从零开始,带你学会 ai 编成本篇教程的文字版也会收入其中。 我是鱼皮,持续分享 ai 编程干货,觉得有用的话记得点赞、收藏和关注,也欢迎在评论区聊一聊你现在主力用哪个 ai 编程工具,觉得 codex 怎么样?也欢迎晒晒你的 ai 编程作品吧。

hello, 大家好,我是艺兴,然后今天趁着周末的话就给大家分享一下我最近用啊 ai 的 编程工具,手搓的一个 diy 的 ai 小 工具。 那么咱们这一期主要是通过 codex 这个新型的 ai 编程工具,手把手去手搓自己的专属的微信的小程序,那右边的话是我自己设计的一个个人的 ip 形象是不是很帅。 然后这一期主要是用的两个工具特别简单,第一个的话就是 codex, 大家直接去官网下载就可以了。 然后第二个的话就是微性能开发者工具,因为其实我们这一期是做小程序的项目嘛,所以说是需要呃借助他去进行项目的预览以及配置上线,然后大家也是去他们的一些官方去进行下载就 ok 了。 那其实做小程序和做 app 呃做产品是一个道理,那流程也是非常简单。那首先第一步要先给 ai 描述清楚我们想要什么样的产品,整理好一定的需求文档,然后让 ai 帮我们去完善我们的需求 md。 然后第二步对应好整个 app 的 一个视觉风格,然后告诉 ai 你 想要什么样的效果,让它给给给我们去输出一个规范的一个需求的文档。 第三步用 codex 去直接生成一些结合的一些需求,自动生成一些小程序的一些全部的代码。然后第四步还要通过 ai 帮我们去调试修 bug, 调细节,那全程不需要自己动手,直接通过口喷的方式,最好的方式就能够让 ai 帮我们去干活。 那么好了,废话呃,废话不多说,咱们直接上手开干吧。那么首先的话就是要打开我们已经安装好的 code desk 的 一个桌面端, 然后的话就是要找到我们的微信的开发者工具去新建好我们本次的要到的项目, 然后本次的话主要是做一个体重管理小程序,二嘛,所以说我们要新建好我们的一个项目,然后选择 ok 就 可以了。然后的话这边的话其实是不需要使用云服务的,然后这边的一个 id 的 话,主要是可以让他去所使用 word 的 就可以了。 然后的话就会来到我们这个微信开发者的一个平台,然后整个界面其实会跟我们传统的编程软件会比较像。 然后右边的话是我们的一些 c 稿的预览区,然后左边是我们一些文件夹的一些区域,然后中间是代码,然后一般来说我个人是比较习惯用那个叉的一个尺寸去进行一个预呃设计稿的一个预览的, 然后的话就要回到我们的一个科室,那首先的话就要新建项目文件夹,然后这个文件夹必须要跟我们刚刚所创建的保持一致,这样的话我们的一个文件信息还有设计稿才能够在那边去进行同步预览。 然后的话会结合我们想要的东西给 ai 描述清楚我们这个产品是什么,给大家去描述一些数据文档,然后的话会结合我们的一些模型去进行选择一些合适的模型, 然后这次的话我是通过用他们的五点五的模型去进行一个生成的,然后整体的生成的一个效率的话,其实我觉得呃不是很快,所以说我觉得如果说 talk 比较有限的同学的话,其实要呃用那个标准就可以了, 然后的话他会结合我的需求帮我去输出一个非常完善的一个小程序的一个需求,稍微能打。 然后企业家的话主要是要生成一个我的一个设计的一个说明 md, 然后这次的话我是给 ai 垫了一张图, 然后让它结合我的一个设计的一个垫图的风格,让我让它帮我结合我的需求去生成一个符合它的风格的一些设计规范,设计的一个语言的一个设计的一个 md 的 文档。 然后这次的话我也是会呃用我们的一个刚刚所生成的一个需求的一个说明它的需求分明它跟课程不一样,它是放在我们一些刚刚创建文件夹的一个目录下的, 所以说呃,我会让它围绕着我的一个呃需求的文档去进行一个呃设计风格的一个生成, 然后的话就是发送给 ai, 让它帮我去写我的一个设计的一个文档,然后的话它就会结合我的一些啊电图的一个它的一个程序版,然后它的配色去帮我去进行 ai 的 生成。 然后接下来的话就是要漫长的等待啦。嗯,整体处理的效率来说,我觉得会呃越跑越快吧, 嗯,然后就开始慢慢地等待它去进行思考生成,然后它生成完之后就会也是会生成一个 md 的 文档,整个 md 文档非常的一个详细,包括字体大小,然后设置以及卡片布局,以及它的整体的一个配色,以及我们的一个文本语言、图标风格等等。 然后紧接着的话就是要开始让 code 帮我结合这两个文档去进行首出代码页面了,然后首先会让它新增两个文件夹,让它去帮我去接这两个文件,去生成一些我想要的一些页面的一个配色的一个界面的效果,让 ai 帮我去写代码, 然后的话它就会结合我的一些需求想要的要什么样的页面,然后我的一个配色风格让我去让它去帮我去写代码, 然后整个的一个页面当中其实雏形已经出来了,然后的话其实整个效率还是非常快的,然后整个视觉风格其实会跟我电图那个视觉语言会比较搭。 然后紧接着的话就是呃继续去围绕的我们想要的一些东西,去让 ai 通过对话的方式帮它去帮我们去修代码,然后修 bug, 然后去调一些 ui 的 一些细节,例如我的设置,然后我们的渐距以及我们的一些图标的风格等等。 然后的话指出就是不断地去进行雕花跟跟进,让我们的一个心中想要的一个产品就可以了。 你要最终的话大家看一下我的效果吧。你要最终的话会来回到我们的微信平台去看一下我们整个页面的一个效果。 那其实整个页面来说,我觉得这的纯就是没有通过呃, figma m c p 的 一个代码,呃的一个设计稿生成,纯用一个对话的一个代码生成,我觉得整个效果我觉得还是不错的。然后大家看一下最后的一个手机的一个预览的效果, 那整个风格是走这种暗色系的,然后的话整个配色我觉得还是非常吸睛的,这是我通过一个纯啊对话和代码的方式去实现的一个小程序, 然后整个的空间它也是会自动去用我们一个微信的一个官方的空间去进行一个实现,然后整个图标风格我觉得还是不错的,嗯。

花三分钟配好这四条,你的 ai 直接上一个档次!大家好,我是宇哥,又和大家见面了 呃,自从上期给大家讲了 codex 基础配置,呃,顺便带了一嘴卡帕西那个约束指令词,后台就大量私信问我指令词。今天这一期,我就重点给大家讲一下这个指令词。话不多说,咱步入正题, 你有没有这种崩溃,就让 ai 改一行代码,他咔咔一顿操作,把你整个项目给充够了,别急着砸键盘啊,今天这四条,就把它彻底治好! 这套指令是卡帕西本人都在用的,上期我一提,评论区和私信都刷爆了。今天咱不光给给原文,还手把手教你把它装到自己的 codex 里。 ai 写代码有四个绝症,第一,不懂装懂,瞎猜需求。第二,过度设计,越写越多。第三,乱写代码殃及无辜。第四,最可气的他假装完成了,其实根本没验证。 而卡巴西就用这四条指令,就把他四个毛病全给治好了。这套指令的文件名就叫 a 帧, md 啊,咱们先看他写了啥 军规第一条,先想着清楚再写核心,就一句,不准瞎假设,不确定地方一定要停下来问,你有好几种理解的时候先摆出来, 绝对不许闷头自己猜着干。军规第二条,能简单绝不复杂,直接解决问题的最少代码不准加你没要的功能,五十行能搞定的,别给整出二百行。 第三条,外科手术式改动,让他改哪他就只改哪,绝对不许顺手去优化你别的代码,每一行改动都对得上你的需求。 第四条,先定目标,让他自己验证。比如你说修个 bug 要翻译成先写一个能复现这个 bug 的 测试,然后把它跑通,让 ai 自己验证,完了再跟你说。搞定了, 接下来三十秒,手把手教你把这道指令词装到自己的口袋子里,接下来大家跟我一起做啊,非常简单,首先咱们打开左下角的设置, 然后找到个性化,然后自定义指令,然后我们选择复制我们的指令, 在这里复制,然后回到 code s, 我 们点粘贴,然后最后我们记得要保存, ok, 我 们的指令开始生效。 那咱们把这个约束指令配置好了啊,以后咱们就记住这四条军规,第一先想清楚,第二保持简单,第三精准改动,第四目标验证。记住这四条,我们就能治好 ai 的 四个绝症。 完整 t 字词太长,这里放不下啊!评论区扣指令,到时候发给大家,关注宇哥带你玩转 ai 时代,下期咱们讲 codex 隐藏配置。

今天给大家介绍下 codex 官方发布的十个技巧,掌握这些技巧,就可以让 codex 变成顶级智能体工具。 别再只会说帮我改了,用官方推荐的四段式提示词,目标上下文约束,加上完成标准。比如优化登录页,你要明确文件路径,规定不准改接口并定死。完成标准,比如在三七五像素宽度下,按钮不能移出,记住你是在给它交付标准。 遇到涨任务,直接用购物模式,别再一轮一轮去催他了,以前 ai 写一半会停,你还得不停说继续,现在给他一个明确目标,他能自主跑几个小时?比如把全站登录注册找回密码,页面统一设计规范。 记住,你的目标描述就是他的完成标准。任务太复杂时,先开 plan, 别急着动代码,先让他阅读项目结构,找出设计的文件,并给出一份详细计划,包括改哪里、怎么改,有什么风险需要你确认什么, 等计划确认了再执行。这一步能有效防止 codex 因为理解偏差导致的大规模翻车。 想减少废话描述,试试 appshot, 在 macos 上按两次 command 键,就能把当前窗口直接发给 codex, 它能读懂里面的文字, 不用再费劲描述。右上角那个按钮间距有点怪,直接截图,然后说看这个界面,把顶部导航右侧的间距调自然点,处理 ui 或报错弹窗,非常高效。 前端改样式,别再用文字描述标题太大或者间距不对了,直接用浏览器标注功能,在预览页点选元素,然后下令这里字体缩小二像素,这里间距加八像素。 这让 codex 从听力描述变成了看着页面改,精准度极高。别只让 codex 生成代码,一定要让它自己验证。 指令里加上改完后运行测试、拎替和类型检查,如果失败了,先自己定位并修复,最后告诉我跑了什么,命令是否通过,还有哪些风险。你要的是经过验证的交付,而不是一段看起来能跑的代码。 如果每次都要重复提醒规范,直接写个 a g e n t s m d, 它就像是给 agent 看的说明书,会自动加载进上下文, 把项目规则、运行命令甚至完成标准全部写进去。比如规定必须用 text script 严格模式,或者禁止乱装依赖, 写一次就等于永久配置好了。复杂项目怎么管?利用 a g g a n d 的 多层级机制,你可以设一个全局配置,比如要求中文回答。在项目跟目录设基础站规范, 在具体的移动端子目录里再单独设 react native 的 规范,规则越靠近当前目录,优先级越高。 codex 进入不同文件夹会自动切换模式, 环境配不好,模型再强也没用。建议用 config tomel 来管理模型和审批策略。你可以设置不同的 profile。 面对陌生仓库,开启 safe 模式,把审批设为每次执行命令都要问我。 面对熟悉的项目,切换到信任模式来提高效率,核心原则是让 codex 高效,但不要让它无边界。 团队用 codex 时,视角要变一下,别盯着它生成了多少行代码,那没意义。真正该看的是哪些重复任务被自动化了,哪些测试和排查流程变短了,哪些内部工具可以共享给全。 codex 的 价值是让那些靠人肉复制搜索跑命令的流程开始被系统性的压缩。总结一下, apps 解决上下文, go mode 解决长任务浏览器标注解决前端反馈插件共享解决规模化 codex 的 正确用法,不再是帮我写一段代码,而是布置一个成熟开发代理的任务。学会这些,你才算真正进入了 codex 的 新阶段。

大家好,今天我们开始讲 codex 的 入门系列,这期我会从零演示一遍 codex 如何安装,怎么打开项目,怎么让它整理资料,分析表格,最后再基于结果生成一张图片。 看完之后你基本就知道第一词应该怎么用了。很多人第一次听到 codex 会以为它只是给程序员写代码的工具,但是我觉得它真正有价值的地方远远不止写代码它。你可以把 codex 理解成一个可以围绕你电脑资料工作的一个 ai 助手。 相比于传统的这种聊天式的 ai 工具,他不是你问一句,他答一句,他可以基于你指定的文件夹去理解里面的文档、表格、截图和各种资料,然后帮你整理分析跟生成结果。 比如说你要做调研,他可以帮你整理资料,你要做计划,他可以帮你把零散的信息变成了行动目标,你可以分析表格,你可以去提炼脚本大纲,甚至生成配图等等。 所以我觉得 codex 对 于普通人也很有价值,只要你的工作经常发生在电脑上,需要处理文件资料啊,调研等等,我就觉得你应该试一下。 好,今天我们首先从安装开始。安装很简单,我们第一步需要打开 codex 的 官方网站,根据你的系统选择对应版本啊, mac 就 选 mac, windows 也可以, windows 安装过程跟普通的软件差不多,就按照提示一步一步完成就可以了。安装完成以后,打开 codex 登录你的 chat gpt 的 账号 啊,然后第一次登录的时候,他可能会让你选择主要的用途,那这我们可以看到这他是有一个工作模式,你是主要用于编程还是日常工作,这个之后都可以修改,但是如果你选择编程的话,他的回答会更技术性一点,更细节一点点。 登录之后你就来到了这个 codex 的 主界面,这个界面可以简单理解成三个区域,左边这块是这个项目跟任务列表,中间是你跟 codex 对 话的地方,右边通常会显示他正在处理的内容啊,或者可以生成的结果等等。接下来讲第一个概念叫做项目, codex 里面的项目本质上就是你对应你电脑里的一个文件夹,你选择哪个文件夹, codex 就 围绕这个文件夹里面的资料来进行工作。我这里用一个普通的例子,比如说啊,我这里可以选择添加新项目,使用现有文件夹就可以找到你自己对应的一个文件夹去作为你想工作的一个区域。 这里准备了一个很普通的例子,周末去杭州玩两天,这个文件夹里面有一些零散资料,比如说旅行笔记,想去的地方,想吃的店等等,也有一些截图、天气或者是酒店的一些路线信息。 在这个下拉菜单,这可以指定你想要的这个项目的文件夹,在这使用现有文件夹就可以指定你的工作目录,比如说我们可以简单看一下他们前 直接在这对话的形式告诉他啊,你可以查看我这个项目下面的一些文件等等。 比如说如果这我想要他帮忙整理这个文件里面的一些资料,比如说整理一个对应的杭州旅行计划, 我们可以通过语音的形式,在这有一个语音的形式,帮我整理一份杭州周末的旅行计划,内容包括目标行程安排,预算,需要提前准备的事项,以及如果下雨的备用方案等等。啊,需要 dog 的 文档,然后有图文, 对,然后就有语音的形式,在这我们可以选择它的智能的一个高低,一般来说高就足够了,然后除了这个智能,就是它的思考的一个深度, 如果是特别复杂的问题,你就可以选择超高,但它对应消耗的 token 会更多一点点,然后在这儿你可以选择对应的模型,现在最新的就是叉 gdp 五点五的这个模型,速度一般就是有标准跟快速,然后快速会一点五倍的快,但是同样的 token 数会增加。在这我们为了演示选择快速,我就开始 看,经过了这个两分二十秒,他就生成了这个文档,我们打开看一下,那就生成了一份两天两晚的旅行计划,有一个目标概,里面有图片也有表格,有对应酒店的一些住宿的建议, 以及两晚的一些价格,餐厅的一些备选,总的来说是非常全面,也非常友好。对于这种复杂文件整理的情况来说,帮我们完成了多的一个信息整理, 这也是 codex 跟普通的聊天工具最大的区别。普通的聊天工具需要在兑换框里面,你反复的复制粘贴文件,然后告诉他怎么做,他再告诉你怎么做,你可能需要去,然后你自己再去操作。但 codex 真正就是 在你指定的这个文件夹里面去读写,去生成你想要的文件,真正帮你去完成了这工作,我们可以看一下在对应的项目下面,他已经生成了这一份文档,相当于你就不需要去手动的去啊复制粘贴很多重复工作。 你可以想象一下,如果你是学生,你可以把论文资料啊,阅读笔记放到一个啊文文件夹,然后让他去生成论文。提高啊,你是做运营的,你同样也可以把这个沟通资料表格,会议记录,让他生成一个执行方案等等。销售啊,可以让他去根据你的客户资料和沟通记录进行一个跟进的计划, 所以这个就是 context 真正有用的地方,他不是给你建议,也不是告诉你怎么做,而是直接帮你去处理资料生成结果啊,这到就会极大的提高你的工作效率。 接下来我讲第二个概念,就是啊县城,就是对于同一个项目来说,你可以啊开多个县城,比如说这是这个项目本身,然后我们可以开,同时在这下面开一个新的,就叫县城,比如说分析一下,在这我想让他帮忙分析一下预算, 这样它会读写里面的一些表格啊,然后生成表格啊等等啊。同时我还想要调用这个啊, x g b t 的 那个深图模型,那么目前这个模型也是市面上深图能力最强的。 对,这样你看我们在左边就能看到转圈的,是正在运行的,然后黄蓝色的小点表示已经完成,这是帮我们那个预算的,它能够生成一个像 csv 的 一些信息,然后它也能够读取原本里面的一些信息啊,对, 让我们再看一下这个 啊,经过这个几分钟他就生成了啊,然后他就生成了一个图片,我们可以看一下效果啊,还是很不错的。就是根据我们刚才的一些旅行安排,然后生成了一个啊,非常清晰,然后也很信息量比较全面的一个旅行安排。对, 然后这个地方有一个点我也想介绍它的功能,比如说在这个工一开始的过程当中,他是尝试生成一个 svg 的 图片,然后没有调用他的,我想他调的那个工具叫 emoji 键啊,在这儿,所以我就用这个,在这个地方可以打断他,比如说用户他还在生成当中,我可以直接啊, 直接去发送,然后他就可以可以调整他的方向啊。另外大家也可以在这个设置地方可以看到自己的一个使用量,在这个地方设置 下面有个剩余用量,他这边有一个每五小时跟一周的一个限制啊。一般来说如果你是叉 g t 的 plus 账户的话,就是啊,你进行一些高强度的整理文章啊,调研啊来说,一般来说是没什么问题的啊。然后 open i 也经常时不时会重置他们的这个限制啊,所以说相比克拉扣的来说,这一点是非常好的,有点量大管饱的意思, 哎,我们回顾一下这一期,就是第一个就是首先 codex 它不只是写代码,它更像是一个可以围绕你电脑资料这么工作的一个 ai 助手。第二个是 codex 里面的一个概念就是项目,项目本质上就是你对应你你选择的一个文件夹。第三个就是同一个项目里面可以开多个县城啊,不同县城处理不同任务 啊。第四个就是啊,他可以帮你整理资料啊,分析表格,生成图片等等一些工具啊。第五个就是你怎么样去看选择模型,速度以及以及查看你的使用量等等。 这一期只是一些基本的一些概念,但是以及能够看到 codex 的 一些核心价值啊,他不只是在告诉你怎么做,而是真的去帮你去完成一项工作啊。 下一期我们会继续讲一些更进阶也更实用的功能,比如说插件呢啊,技能啊,智能浏览器辅助自动化任务,以及啊怎么把一个复杂的任务拆解成几步让他啊连续几天或者上周的去持续的运行啊。这期先到这,请大家继续关注这个系列。

我用了 superpowers 一 段时间之后,最大的感受它不是让 cortex 更快写代码,恰恰相反,它是在让 cortex 不要太快写代码。因为现在 ai coding 里一个常见的问题是,需求还没有澄清,边界还没有确认, 测试还没有想好, cortex 已经开始改文件了。小任务这样做还行,但一旦任务变复杂,这种直接开写的方式很容易出问题。所以这一期我们聊聊 superpowers 到底解决了什么问题。 先简单说一下 superpowers 是 什么,它不是一个单独的 skill, 而是一套给 coding agent 使用的软件开发方法论。在 codex 里面安装很简单,如果 是 codex c r i, 打开 plug ins, 搜索 superpowers, 选择安装就可以了。如果是桌面版的 app, 在 侧边栏 plug ins 或者是那个插件里面找到 superpowers, 点加号安装就可以了。 插件我找到 superpowers 点安装就可以了,因为我已经装过了,所以这边不是加号了。装好之后,它就会作为一组 skills 在 cortex 里面使用。这也是我觉得它很适合 cortex 的 地方。它不是让你每次手动复制一堆 prompt, 而是把一套软件工程流程变成 cortex 可以 按需使用的 skills。 我 理解 superpowers 的 核心就是把 ai coding 拆成 七个顺序执行的步骤。第一步就是头脑风暴,在写代码之前先澄清需求,探索方案,确认边界。第二步就是创建独立工作区,不要直接在当前工作区里乱改, 而是创造一个更安全的独立开发环境。第三步是写实施计划,把任务拆成小步骤,明确要改哪些文件,怎么实现,怎么验证。第四步是指代理开发, 把具体任务交给 subdivision 去执行,让主流程可以更清楚的组织和检查。第五步是 tdd 测试,驱动开发,先考虑怎么证明它是对的,再写实现,而不是先写一堆代码再说。第六步是代码审查,改完不是马上说完成,而是让另一个审查视角检查问题。 第七步是完成分支,最后做验证,收尾、合并或保留分支。所以它的流程不是需求到写代码,而是这一套头脑风暴,到独立工作区域,到实施计划,到代理开发,到 t d d, 到代码审查,再到完成分支,每一步都是一个独立的 skill。 这就是 superpowers 最核心的地方,它把软件工程流程拆成了 ai 可以 执行的一组 skills。 我在 codex 里用下来,感觉它是比较无缝的,尤其是装成插件之后,它不像一个你每次都需要手动调用的命令集合, 更像是给 codex 加了一套开发习惯。比如需求不清楚的时候, codex 会先倾向进头脑风暴,先问问题,探讨边界,确认需求,而不是直接开始改代码。准备实现之前,它会更容易进 writing plans, 设计代码质量时,它会提醒 pdd review 和验证。这就是我觉得就 pos 很 有价值的地方,不是每次靠你提醒 cortex 守流程,而是让 cortex 默认更容易按照工程流程工作。这里也放一个 sdd 的 背景在里面, s d d, 也就是 spec driven development。 规范驱动开发,它的核心思想是不要一上来就写代码,而是先把要做什么说清楚,比如 open spec, 它更偏规范管理,它关注的是把需求变更约定整理成可维护的规范。 spec kit 更偏规范驱动开发流程,它通常会通过一组命令模板,引导 ai 从 需求深层规范计划任务再去实现。而 superpowers 更偏工程纪律和 skills 集合。所以我会这样理解, s d d 解决的是先要把做什么想清楚, superpowers 解决的是做的过程中怎么守流程。最后说一个大家可能关心的问题, token 消耗,而我自己用下来。 superpowers 在 cortex 里的题感是比较轻的,因为它不是每次 都把一大堆规范文档塞进上下文,而是通过一个个 skill 在 需要的时候触发对应流程。当然,它也会消耗 token 头脑风暴,它要讨论需求, writing plans 要写生成计划 review 要读取代码和分析问题, 都不是免费的,但它的消耗更像是按阶段按 skill 触发。而 openstack 和 stackkit 这类的 sdd 工具通常会生成更多的规范计划任务文档,好处呢是结构更完整,坏处是文档越多,后续带入上下文的 token 压力也可能更大。我 之前看到 speckey 的 社区里面有人反馈过类似的问题,有依据里估算,在 cloud code 里,一组 speckey 个 months 可能占用大约十八点六 k 的 tokens, 在 codex c i 的 上下文窗口里面大概占百分之七到百分之十。这个不是官方的 benchmark, 但它说明一件事,流程工具本身也有上下文成本。所以我的判断是, opens back backit 更适合强规范、强文档、强交付约束的任务。 superpowers 更适合日常 ai coding, 因为它更像一层工程流程约束 动成本更低,体感也更自然。所以这一期的结论是, superpowers 不是 给 ai 加超能力,而是给 ai 加工程纪律。它解决的不是 ai 不 会写代码,而是 ai 太容易跳过软件工程流程模型提供能力, superpowers 提供纪律。 下来几期我们会继续拆开看。为什么先要头脑风暴?为什么要写 plans? 为什么 ai 写代码需要 pdd? 以及为什么 ai 也需要 code review? 下一期我们继续。

hello, 大家好,今天给大家分享一些使用 codex 的 小技巧。其实最近在 web coding 的 过程中,我会发现用 codex 最费 token 的 不是写代码,而是反攻。特别是对于我们这种非技术背景的同学来说,很多时候,比如我们只是想加一个小功能,结果他完全理解错了,需求出现了乱改,文件新增了一堆我们根本不需要的东西,我会分享一下自己怎么去。 在这过程中尽量的去节约一些 token 的 思路吧,让 codex 先少猜,少乱动,少反攻。我觉得总结一下我的省 token 大 法就是这九个字。这个视频我做这个攀岩工具作为例子,去分享六个我觉得非常节省 token 的 小技巧。 这六个技巧会把它们分为三类,第一类是在动手前我们要做到让 codex 少猜,避免理解错需求。在开发过程中,我们要让 codex 先去演示产品,来减少一些无效的 ui 的 返工,然后在改改代码的时候,我们要去给它限制边界, 避免项目全部乱改。第一个技巧是我现在每次都会用的就是先别让 codex 去写代码,而是先让他问我问题。在这里我会有一个比较推荐大家的提示词,比如说你有一个 coding 的 需求,那你不要先让他去写代码,而是先让他去问你一些必要的问题, 来避免它后面理解错需求。第二个技巧就是先让 codex 先告诉我这个功能可能在做的过程中会出现什么样的问题。 因为实际在使用的过程中,我觉得 ai 很 容易默认功能越多越完整,很容易把一个简单的工具做得 复杂,所以可以让 ai 在 一开始让它先给到我们的意见,其实也就意味着它在给自己去 框定一些范围。第三个技巧就是不要等到功能做完才去看题,而是先让 codex 去生成一些假的数据,因为空页面我觉得是非常容易误判的,有可能你一开始觉得这个页面还行,但一旦塞进去二十条 真实的数据,你马上就能看出来段是不是太多,页面是不是太乱,图标有没有意义。第四个技巧,我觉得先做一个最丑但是一定能跑的版本, 因为我觉得一般情况下 codex 翻车都是因为我们既要又要,但其实它很容易在这样的情况下出现各种各样的问题,但这个时候我们可能就是要同时去修它的功能,但就会出现越修越乱,所以我觉得一开始就是先去跑通逻辑,然后再去优化 ui。 第五点,每次改代码前,我们都先去给 codex 去设置一个改动的边界范围, 明确的告诉他哪些事情不可以做,因为很多时候可能你只是想改掉其中的一个功能,但他顺手就会把你的 ui 给改了,导致你在他改完之后,你根本就不知道现在最新出现的 bug 来源于哪里。 所以我强烈建议大家每次在修改的时候可以都加上这个提示词,并且如果你给他加上这个提示词,其实 也可以去节省一些相关的 token, 它不会去读太多无关的文件,以及做出无关的修改。第六个小技巧就是每次在改完之后,可以去让 codex 用人话来写一版更新的日记, 作为非技术背景,我们必须知道 codex 在 这个环节到底去改了什么,而我们又要去怎么进行测试,我们怎么去判断它刚刚做的修改是有效的?所以我也是强烈建议大家每次在修改完之后可以给它发送这个 prompt。 所以 真的想要在 web coding 中提效的关键,我觉得不仅是去学一些技术方面的知识, 并且我们要去尽可能地在提示词的过程中去减少 codex 的 猜测空间,只有它猜测的越少,它就越不容易乱改,以及去做一些不做功的行为。以上就是我的一个简单的分享。

呃,最近这个 codex 的 这个 go 模式挺火的啊,今天给大家讲一下怎么打开 go 模式,这样点这个左下角设置, 呃,设置进来之后点这个配置,然后点这个 config, 点这个 进来之后呢搜索 f e a t u i future, 然后呢?这这这这里是这样的,然后你把这个 goes 等于处加进去就可以了, 把这个加进去,加到这个 future 下面就可以了,然后再重启一下 codex, 重启一下它,这个它就有 go 模式了。 然后 cloud code 的 话就是你直接更新就可以,更新的话你就你就发这个 cloud update, 更新到最新版本它就有了。我们试一下 go, 就是 这个 site go。

我太激动了,我的扣代词已经连续工作了十三个小时了,然后他还在自己干活。扣代词他最近上线了一个新功能,叫 go, 那 这个 go 是 什么呢?简单来说就是你给他一个目标之后,扣代词会把后续的工作围绕这个目标持续的去推进,他还能跟踪状态,耗时跟投跟的使用。 以前我们做项目的时候,哪怕计划方案写的很清楚很详细, ai 也很难一次性的去做完,他会分很多个阶段去做,每次之前完一个阶段,你要去验收,有问题还要跟他多次的去沟通修改,然后再一次去推进。别的阶段,你就需要一直守在电脑前。 说实话,自从使用 ai 编程之后,我基本上很少有周末休息的时间了,不知道有没有相同感受的朋友。但是我今天第一次尝试购给扣代斯设定了一个目标之后他连续工作了十三个小时,我今天白天就出去玩了, 我真的可以不用一直在电脑前去守着了。虽然扣代斯之前也有 remote control, 可以 让我不用一直在电脑前守着,但是在验收某些需求的时候,用手机去调试查看,其实还是不是很方便。 那以前最痛苦的不是 ai 不 够聪明, ai 它会读代码,会写代码,查报错、跑测试,但问题就是它不够让人放心, 它很像一个能力很强,但需要你一直盯着的人。所以很多时候你以为自己在用 ai 干活,但实际上你是在给 ai 当主管,你不敢真的把一个复杂任务交给他,他随时都可能会停在半路。但扣代斯这次更新的这个 go 这功能让我第一次觉得这个状态改变了, 他不是回答完这一轮就结束了,他会一直记得自己要完成什么,会读代码,改文件,看失败日记,失败了再改,改完再测,测,试完再去判断这个目标到底完成没有,他知道自己这个目标没有闭环,就会继续接着往下做。 那怎么使用这功能呢?其实也很简单,你只需要打开勾带子,然后输入斜杠目标,然后选中之后就把你要让他做的事输入上去,他就会不达目的誓不罢休的给你干了。我觉得勾的价值就在于他开始让勾带子围绕一个结果持续推进,他改变的是你使用 ai 的 方式。

这条视频讲 codex a subagent, 小 白也能听懂的版本。它不是一个新软件,也不是神秘功能,而是 codex 处理复杂任务的一种用法, 你会看到它什么时候该用,什么时候别用,以及怎么用它。 review 一个真实项目,先给 subagent 下一个最朴素的定义。一个复杂任务,你可以让 codex 拆成几块,分别交给几个子代理并行处理。 每个子代理跑在自己的 agent thread 里,最后只把结论交回主线成汇总。官方术语听起来会正式一点。 sub agent workflow 指同时跑多个并行代理在汇总。 sub agent 是 被派出去做某件事的代理, agent, thread 则是每个代理自己的线程,你可以在 cli 里查看和切换。 sub agent 主要解决两件事,第一, context 被污染,读文件跑命令看报错,猜原因,全塞进主线城,后面判断就容易乱。 第二,该病型的事被串行,做安全测试风格可维护性本来可以同时看,却被一个代理从头查到尾。判断要不要开 sub agent。 可以 先问一个问题,任务能不能拆成几块?互不依赖的小事, 能拆就适合试,拆不开就别硬上。任务很小,子任务紧咬在一起,写入范围重叠,或者你自己都还没想清楚怎么拆,这些情况开了反而添乱。不适合的情况也要记住,任务本身很小,没必要开多个代理。 几个子任务互相咬的很紧,并行也不省时间。最危险的是多个代理同时改同一篇文件,这时候省下来的时间很可能被冲突和反攻吃掉。 真正适合练手的场景大多是 rate heavy, 比如大型代码库探索 pr, 多维 review 几个 bug 方向, b 型排查,长文档和长日制分块分析。官方也建议新手起步时先选探索测试、 treeash 和总结这类任务。 codex 默认不会主动开 sub agent, 你 要在 prompt 里讲清楚。常见说法包括 spawn two agents, delegate this work in parallel use one agent per point。 中文直接说启动三个 sub agent, 分 别检查安全测试和可维护性也可以。如果拿来 review pr, 可以 直接用这个模板,一个 sub agent 检查潜在 bug, 一个检查测试覆盖,一个检查代码质量和可维护性, 最后要求主线程等三个都完成后再输出高风险、中风险可选优化,以及建议优先修什么。 这个模板真正值钱的不是文字本身,而是里面的控制点。每个子代理的职责不重叠,避免大家都泛泛 review 一 遍,明确等全部完成再汇总,可以避免主代理拿着半成品就下结论。最后加一句,优先修什么,可以把排序工作也交给主县城。 接下来用 ship ready 这个小项目做例子,它是一个 s s landing page audit 的 mvp, 后端 api 在 s r c app 点 js, 审计规则和 rewrite 在 s r c audit 点 js, 存储是 s r c store 点 js, 前端是 publ i c 斜杠 app 点 js。 代码量不大,正好适合演示怎么稳妥的开 sub agent。 在这个项目里,最稳的开法不是让三个 agent 一 起改代码,而是启动三个 read only sub agent runtime risk agent 看运行风险 q a coverage agent 看测试缺口, architecture agent 看模块边界, 所有子弹里都不要改文件,等全部完成后,主线程再决定要不要修。三个结论里, round time risk agent 最有价值。他发现 handle request 里 in sync 路由没有 await, 外层 try catch 接不住 a sync handler 抛出的错。 这种 bug 在 happy pass 测试里不容易暴露,但线上可能表现成请求挂住或者 unhandle rejection qa coverage agent 的 结论也很实用。 他没有泛泛说测试不够,而是列出 invalid json 未付费 share 过早 follow up。 若 brief 绕过 rewrite 这些副路径, 这些用力不一定都要立刻补,但摆在面前,主县城就能快速挑出最该锁住的状态流。 architecture agent 的 结论最容易让人冲动, 他说 src app 点 js 可以 拆成 page extract checks brief 和 rewrite 几块 判断没错,但这次目标是写测试加修 bug, 不是 重构 auditing, 所以 这部分建议最后先记下来,不立刻动。三个 sub agent 的 优先级其实不一样, round time risks 想让你先修服务端 qa coverage 想让你先补测试, architecture 想让你先理边界。主县城不能给三票打平均分,而是要挑确定性高、改动小、能被测试所注的事情先做,最后真正落地的改动其实很克制, 异步路由统一加 await, 让外层错误处理生效。 rewrite 必须 brief ready 才能解锁, follow up 增加还没提交 brief 和非法字段校验。 read json 加 body size 限制 invalid json 返回四百,最后补 note test 回归测试。 这个案例最有意思的一课是两个代理的结论拼在了一起, round time risk agent 告诉你哪里坏了。 q a coverage agent 告诉你怎么用副路径测试把它锁住, 这就是 sub agent 真正的价值,不是替主线城做决定,而是把几个方向的结论同时端上桌。跑起来之后也要会管理 agent thread codex c l i 里可以用 slash agent 查看和切换线程,如果某个子任务偏离方向,可以让 codex 停掉那个负责性能分析的 sub agent 跑完的线程,也可以让它关闭已经完成的 agent threads。 给新手的练手顺序,不建议一上来就五个 agent 一 起改权。项目先并行阅读,让多个 sub agent 各自理解不同模块,再并行 review, 把 bug 安全测试,可维护性分头看。 第三步是单写,多审一个代理或主线成改代码,其他子代理做 review, 最后才是小范围并行修改。 下一次让 codex review pr, 你 可以直接从这个短 prompt 开始。请使用三个 sub agent 并行检查,当前 pr, 一个看 bug, 一个,看测试一个看可维护性, 等全部完成后,按风险等级汇总给我。就这几句话,已经够你完成第一次 sub agent 练习。 最后记住, sub agent 不是 替主线城做决定,他真正干的活是把几个方向的判断同时端到桌面上,让主线城更快做取舍。新手先从 rate heavy 的 探索和 review 开始,等你能清楚拆分任务,再尝试让多个代理并行改代码。

codex 加 html 才是做 ppt 的 王炸组合,今天教你用 codex, 只要四步就能做出可以编辑修改的精美 ppt。 第一步,上传你的文档,让 codex 根据你的文档生成 ppt 大 纲和主页内容,这里的大纲就是后续 ppt 的 内容框架。第二步,让 codex 调用 html 这个 style, 根据刚才的大纲生成三版不同视觉风格的 ppt 预览,以拼图形式输出。 这一步我们是为了快速选择合适的视觉风格,我更喜欢这一张。第三步,让 codex 寄予我刚才喜欢的视觉方案,继续调用 image 帧这个 skill, 将拼图中的每一页依次生成高清单页视觉稿图片。 和直接生成 ppt 相比,先生成视觉稿能更好地利用 m h two 模型的构图设计能力,露出的 ppt 会更有设计感。第四步,也是最重要的一步,复制我这段已经调教好的提示词,让 codex 把单页视觉稿图片还原成可以编辑修改的 ppt 文件。 这里我建议每次单独还原一页视觉稿,如果效果不满意,重新生成会更方便。我这里先还原第五页视觉稿,看下效果。可以直接用 wps 打开,我们可以看到这页的还原效果很好,而且可以随便编辑修改 ppt 内容。 接下来我们对剩余每一页视觉稿图片都执行刚才的操作,最后把得到的多个 ppt 文件合并起来,一份充满设计感并且可以编辑修改的 ppt 文件就生成好了。