粉丝5583获赞2.0万

你以为 codex 只是聊天机器人?嵌入式开发里真正耗时的是读旧工程改驱动跑测试查日制 codex 更像代码助手,能在仓库里理解上下文,修改文件,执行命令,生成测试,再把差异给你审。 对车载公共项目,它适合做寄存器封装协议解析 c i 报错定位和代码评审。关键不是替你拍板,而是把可验证的改动先做出来,你会让他接手哪段代码?评论区说驱动协议还是 c i?

程序员注意,现在手机也支持 codex 了,但重点不是让你在手机上写代码,真正重要的是,你可以随时随地控制电脑上的 codex。 以前 codex 跑到一半问你要不要继续,要不要执行命令,你人不在任务就停住。 现在你在手机上就能看进度,批操作、改方向。过去的 ai 编程工作流有一个很大的问题,人必须跟着 agent 的 节奏走。 他问你要不要继续,你不在,他停,他问方案选 a 还是 b, 你 不回,他停,他要执行测试或者高风险命令,你没批准,他还是停, 这不是能力问题,是协助半径太短。 agent 很 强,但他被锁在电脑前。 openai, 把 codex 放进 chat gpt 手机 app, 但重点不是在手机上跑代码, 真正干活的还是你的 mac、 mac mini、 devbox 或者远程开发机。手机只负责看批改方向,文件、凭证、权限都还留在原来的机器上。这件事真正改变的是 agent 工作方式。 以前你在陪 agent 跑,现在是 agent 跟着你的节奏跑。你在地铁上可以看他跑到哪一步,你在开会时可以审一眼 diff, 你 在吃饭时可以批准他继续测试。你在路上发现方向错了,可以直接打一行字让他改。 你看官方信息里真正关键的表述,在 chat gpt 移动应用中开始新工作,查看输出结果,控制执行进度并批准后续步骤。 这句话的重点不是移动端,而是控制执行进度和批准后续步骤。也就是说,手机端承担的是 agent 工作流理的控制面,而不是代码运行面。具体怎么用?第一步,电脑上先跑 codex, 目前主要支持 macos、 windows, 还要等。 第二步,手机更新 chat gpt app, ios 和安卓都已经有 preview。 第三步,在 chat gpt 里打开 codex, 你 就能看到正在跑的任务线程。 第四步,在手机上看 beef, 看测试结果,回复新指令,批准高风险操作,甚至新建任务,继续跑。 这次更新不是让程序员在手机上写完整项目,他更像是给你的 ai 程序员加了一个随身遥控器,你不用把文件凭证、开发环境搬到手机上,你只需要在他需要判断、批准和纠篇的时候能立刻出现。 所以这次更新不是 codex 多了个手机版,而是你的 ai 程序员终于有了一个随身遥控器。对程序员来说,这比手机写代码重要得多。因为真正的效率提升不是你在哪里敲字,而是 agent 卡住的时候,你能不能立刻让他继续往前跑。

你以为 macbook 的 价值是芯片、屏幕续航?现在可能要加一个新理由, codex openai。 最近几轮 codex 更新,其实释放了一个很强的信号, ai 不 再只是网页里的聊天框,它开始进入你的电脑,进入你的 app, 进入你的本地工作流。二零二六年二月, openai 发布 codex app, 最早就是面向 macos 推出的。这个 app 不是 简单的聊天窗口,而是一个 codex 指挥中心。它能同时管理多个 codex, 一个修 bug, 一个写文档,一个跑测试,一个看 pr。 而且它支持 worktrees, 每个 codex 都在隔离环境里干活,不会互相把代码改乱。但真正让 macbook 含金量上升的,是后面的更新。 codex 现在可以用 computer use 在 mac 上操作桌面应用。 什么意思?它不只是读代码,它可以看屏幕、点按钮、输入文字、操作浏览器,复现图形界面里的 bug, 甚至帮你测试一个 micros app 或 ios 模拟器。流程更狠的是, openai 官方写的很清楚, 多个 codex 可以 在你的 mac 上并行工作,同时不干扰你继续使用其他 app。 这就很关键了。以前 macbook 是 一个人用来干活的电脑,现在它正在变成一个人和 codex 一 起干活的工作站。还有一个很适合 mac 用户的功能,叫 appshots。 你 在 mac 上看到一个报错窗口, 一个设计稿,一个网页,一个设置面板,不用长篇大论描述,直接用快捷键把当前窗口发给 codex, 他 会拿到截图和可读取文本,然后基于这个上下文帮你处理任务。这对程序员、设计师、产品经理、内容创作者都很实用。比如,你打开一个网页设计稿,让 codex 看一眼,然后让它改前 端,你打开一个表格文档后台页面,让 codex 根据当前内容继续干活。再加上手机远程控制, 现在拆的 gpt 手机端可以连接到正在 mac 上运行的 codex, 你 人不在电脑前也能看 codex 的 进度,终端输出测试结果,代码 def, 还能远程批准下一步操作。也就是说,你的 macbook 放在桌上跑任务,你在路上用手机盯进度。这就是为什么我说 macbook 的 含金量在上升, 不是因为 macbook 突然变便宜了,也不是因为参数碾压所有电脑,而是因为 ai 时代的电脑价值正在从性能设备变成 ai 工作流底座。 codex 这种工具越成熟,越需要一个稳定的本地环境,代码仓库、终端、浏览器、 ide 设计工具、文档权限系统、桌面 app。 而 macbook 本来就是大量开发者和创作者的主力工作机,现在 codex 正在深度适配 macos 工作流, macbook 就 不只是生产力工具,而是 codex 可以 长期驻扎持续工作的 ai 工作台。 所以这波不是单纯吹 mac, 真正的变化是,以前你买 macbook 是 为了自己更高效,现在你买 macbook 可能是为了让 codex 也能更高效的替你干活。未来值钱的电脑不只是跑分高, 而是谁能让 ai 更顺畅的看见你的工作,理解你的上下文,操作你的工具,持续完成任务。从这个角度看, macbook 的 含金量确实还在被 codex 往上抬。

如果现在你想学习一个 agent 作为你的主流 ai 工具,那么我觉得 codex 将会是现在你的最好的选择。虽然 codex 最早是作为编程 agent 的 诞生的,但是我觉得它经过这段时间的疯狂迭代更新,它已经是目前性价比最高的,普通人也能用到最强的 agent 产品。 所以今天这件视频呢,它是一条零基础小白也能学会的,教你从安装到基础设置,最后再到实力开发的保姆级 code 教程,保证能让每个人都能体会到 web coding 的 乐趣。那话不多说,我们先从安装开始。 首先安装这一步,它其实比较简单,在官网中直接就可以下载, mac、 windows 都有。在这里呢,你需要注意一下,如果你想体验 codex 的 完整的功能,那我十分建议 在 mac 上使用。那其实像电脑控制、远程手机链接这种便捷的功能,目前基本上都还是 mac 专属。我这里还列了一下 mac 和 windows 的 功能对比,感兴趣的朋友可以截图一下。 不得不说,苹果真的是在 a j 的 时代已经麻了, only apple can do? 那 安装好之后呢?你直接登录你的 type g p d 账号就可以了。这里我觉得有一个点呢,非常的有意思, 如果你之前经常抱怨 cloud 额度消耗太快,或者担心自己经常被封号,那么在 codex 中,它非常贴心地帮你设置了 agent 一 键搬家的功能,就是能从 cloud code 中直接导入所有内容,并且继承你在上面的全部的配置。 回想起之前 kyle 的 支持导入记忆来挖的拆的 g p d 用户,那这波只能说是你挖我墙角,我直接就偷你家。 那进入到界面之后呢?我们可以把整个界面 它只分成四个区域,其中正中间最大,这个区域叫工作区,它就是用来和 a 正的对话的地方。那左上角它的功能区主要是 codex 内置的一些便捷工具,你可以选择你喜欢的 skills 或者是插件。那下面就是项目还有对话的一些管理区。项目你可以简单的理解为 codex 的 一个工作间,一个项目里可以开好几个对话, 每条对话的就是一条独立的任务线,他们共享同一个文件夹里面的所有文件,但是记录相互隔离。而右边就是项目的预览区,比如在生成网页的项目的时候,我们就可以在这个区域里面看到你最终生成的效果。但到这里我知道你已经迫不及待的开始手搓一个项目了啊。但是你先别急, 我们先要做一些系统设置,这样才会让你的 codex 比较的好用。那打开左下角的这个设置,常规设置里面这三个开关 打开,并且将跟进行为改成引导,这样你会发现在 agent 的 做法偏离你预想的时候,你就可以及时的跟正他,而不需要去排队,这个样他也 不会特别多浪费你的 talking。 那 接下来你需要设置一个 agent 的 m d, 那 如果说 cox 是 一台可以自动驾驶的汽车,那么这个东西就是你设置的防 好配号,就设置这一步,才会按照你的习惯,用你最舒服的方式把你送到这个目的地里面。那这里我推荐直接使用大神卡萨斯的模板,设置好之后,下面的这个记忆功能会建议你一起打开, 这样它会在你对话结束之后,自动把聊天记录总结成记忆,然后保存下来,以后遇到相关的场景,它就该知道怎么去用了。 ok, 设置这块就搞定了。现在你终于可以开始你真正的第一次 web coding。 这里我用我一个自己的真实需求来做个演示,给大家做一个小 case, 而当你呢,先建好一个项目。建好项目之后,在对话框的左下角里面选择这个计划模式,它可以帮你先制定一个具体可行的方案,等你确认好以后再开始做。 我非常建议大家在开始每个复杂项目之前,都可以用这个模式先过一遍。然后权限这里呢?如果你是一个程序员或者开发的朋 朋友,在这里你完全可以选择默认权限,一步一步你自己来审批,来控制最终的成品质量。但如果像我一样,你什么开发经验都没有的话,同时你又不想频繁的盯着屏幕点击这个确认,那我推荐你跟我一样,选择这个完全访问权限就 ok 了。毕竟我又不是开发出身这东西这些代码我又看不懂, 那不如直接全部放开,让他自己搞你就完事了。当然这个模式风险还是有一点的,你知道的, 那模型直接选择现在最棒的 g p t 五点五就好了。推理等级日常的话你选择高就 ok, 但是遇到真正的硬活大活,你可以选择这个超高。这里我用我真实的需求来演示。 那比如说我最近确实刚刚体检完的,结果不是特别好,所以医生呢,给我开了三种药,那因为服用的顺序不太一样,也包括有的是饭前,有的是饭后,导致我经常搞混有没有吃,所以我就想开发一个 app, 通过糖酸的方式来提醒我按时吃药。那在这个工作区里面,他输入 的需求,再根据这个需求,他会给你一些问题,你把这个问题回答好,最后确认这个计划完的方案,他就可以自动去进行执行了。这非常简单,大概二十分钟以后,他会自己 把这些东西都做完了,这时候你会看到一堆乱七八糟的文件,你看不懂也没有关系,因为这个其实是 app 的 一些基础的文件,那你只需要再把我们的需求用你的大白话说出来就行。比如说我直接跟他说,我想把这个东西我们开发完的这个 app 转到我的手机上,那他会告诉你, 你首先需要装一个叫插扣子的工具,你先不用管插扣子什么,而且大部分人电脑上我不觉得它也有安装过这个东西,所以这个时候你只需要调用 codex 内置的一个插件,叫做 com 的 use 这个插件,它 可以帮你做好后面所有的步骤,所以基本上只有在遇到登录账号这种敏感操作的时候,它才会停下来交给你自己,让你自己去操作一下。那最后你其实按照 codex 的 一步一步的指示,在手机端做好一些设置,那你其实你会发现你这个 app 就 可以真的安装到你的 手机上,非常的简单,几乎都不需要你做什么,主打一个有手就行,只要你会说话。那做完 app 之后,如果你还想继续改东西,但是你又不想一直坐在电脑面前的话,你甚至可以在手机上去远程操控 windows, 苹果和安卓手机都行。那走在路上,你突然比如说想要改一个什么东西,那掏出手机啊,真的就能继续, 真的是随时随地都可以享受 webcoing 的 乐趣。那说实话,我一直觉得 webcoing 这个东西对于非程序员来说,它可能比程序员它更有一些价值。 你以为像开发者,他本来其实就会写些代码, ai 对 他们来说更多的是提效。那对于我们这些原本不会写代码来说, ai 直接把一套原本过不去的坎给铲平了。就像连胡彦斌现在都可以用 webcoding 来给他们的粉丝开发一个社区的 app 了。我最近哇写了一个多月代码, 就写了我自己的 app, 然后打开以后就会有我所有的日常。那说实话,在未来会用 ai 写代码,就会变成像会用 excel 一 样的基本技能一样,这是一个必然。那我也希望人人都能发挥自己的创意,祝大家 call 定愉快!

hello, 大家好,我是 fred, 专注从普通小白的视角去分享怎么从零开始用 ai 和 web coding, 提升自己生活和工作效率。很多人装完 codex 第一反应就是马上去让他写代码,但我会让他做另外一件事情,也就是 给他写好 hmd。 因为 ai 其实不怕复杂的任务,怕的是一开始没有规则,没有规则的时候他可能讲太多,改太多,甚至把你不想动的地方也顺手动的。所以说我们这期会先讲怎么让 codex 在 动手之前先知道你的规矩。 第一,什么是 a g m d? 大家可以把 a g m d 理解成 ai 的 一个写作的说明书,它会告诉 codex 这个项目怎么沟通,怎么写代码,哪些安全底线不能碰,哪些操作必须先问 以前这些要求,你可能要每次重复的去讲,去写进这个文件以后,它就会变成一个默认的规则,你不用每次去教 codex 怎么去配合你。 然后第一部分,其就是他的整个的语言的使用规范,因为我日常沟通就用中文嘛,这样去讨论需求和复盘问题其实更顺的。 但是像在代码,包括命令行啊、变量名啊、日制和报错,其还是要保留英文的。原因很简单,就是因为 英文报错可以直接去搜索,方便去定位问题,如果全翻译成中文,反而会降低排查的效率。所以说我的原则是解释用中文,哎,记住信息,保留原样。 第二部分就是它的代码和提交的规范。虽然我们大家都看不懂代码,但是我也不希望 ai 为了去显得完整,去提前写一堆复杂抽象的东西,其当前需要什么东西,就把当前的问题解决干净,如果单个文件太长, 那就去拆主键,拆函数,去拆模块,每次改动尽量小一些,提交清楚啊,每一次的记录,这样后面口袋再去维护的时候,才不会被一大堆的这种十三代码去劝退,对吧? 第三个最核心的点就是安全,与红线类似,像这种密码啊,密钥啊, a p r key 啊,这种是不能够直接写进代码的,然后包括像点 e n v 这种本地配置的文件,也不能提交到仓库,包括日期,也不要输出一些隐私的信息。 像日常的一些小改动,其实可以用一些低摩擦的去执行,但比如涉及到一些接口的结构啊,数据库的制段啊,批量去删除一些文件啊,或者说一些外部的账号和数据,就必须天 先让他停下来跟我确认。其实这不是去增加一些流程啊,而是防止一次自动执行,把一些项目改到不可控的状态。 然后第四个就是它的整个的执行与测试的工作流。就很多时候 ai 说,诶,我已经修好了,其实不重要,就验证通过才重要,你知道吧? 所以说如果命令报错,要如实的去上 ai 报告,然后包括测试失败也不能查,包括修 bug 的 时候,最好去先写一个能够复现问题的测试,再去改代码,就跑完以后能跑测试就跑测试,能跑 nin 就 跑 nin, 这样才能够减少 ai 的 整个的一个幻觉, 想让他看起来完成,但实际上不能用的这种情况。然后最呃第五个呢,是我自己的一个用户习惯,因为我会要求他叫我 fred, 包括我自己的偏好去直奔主题,找一些形式化的确认,能够直接做的就日常 直接做啊,但涉及到一些可能删除啊,密钥啊,权限啊,上传啊,账号操作这种风险点啊,就必须还是跟我确认,这样应该就不是机械的去回复我,而是更贴近我自己的一个工作节奏。 然后像呃目前我的这个 a g m e a i 的 一个工作模式的话,就是遇到熟悉的问题,他会去用一些内置的 skills, 而不是每次都从零开始去乱试,包括改完源码之后去默认跑测试,降低一些低级的语法错误,也不会去做一些多余的发散。 真正高效的写作不是让 ai 写得越多越好,而是在正确正确的这种边界里面把当前的问题解决掉。 所以说我可以给大家看一下当前我整个的一个 h m d 啊,包括刚刚所说到的语言的问题,安全红线的问题,工作流程的问题以及代码标准的问题,和我自己的一些用户偏好,其实跟刚刚讲的是完全一致的, ok。 最后总结一下就是, agent m d 的 本质就是把你反复叮嘱 codex 的 话一次性写清楚,语言怎么用,代码怎么写,安全边界在哪里,什么时候要去验证,什么时候要去确认,都放进去, 它不是让流程变得复杂,而是去减少废话,减少返工。所以说 codex 安装好以后,我建议不要第一时间让它去写功能,先把规矩建立起来,先定规矩,再让 ai 去干活。规则清楚之后,你只需要告诉它目标, 剩下的就是让他按规则去执行。 ok, 我是 fred, 后面我会持续用真实的案例告诉大家怎么把 ai 用进自己的工作流。这就是本期的分享,我们下期再见。

你把 codex 当聊天框用就亏大了,只会让它写页面,修 bug、 优化代码。这根本不是 codex 的 正确用法,它更像一个 ai 工程队友,能进项目、读文件、改代码,神改动。你可以先收藏这版核心指令,速查。 先建一个 agents, 点 meb 文件,把项目规则、运行命令、完成标准都写进去。 prompt 只是一次性的, agents me 才是长期规则。开局先用这三个 in it 初识化 agents, 点 md mention 指定文件或目录上下文 plan, 先规划再执行。 写完代码后,用这三个 diff 查看具体改动。 review, 审查当前工作区 status, 查看模型权限上下文。长任务别忘了一个 compact 压缩长对话,保留关键信息,继续推进进阶指令还有很多, model permissions, new resume, mcp apps, 新手不用一开始全背,先记住这一条最小闭环就够了。从建 agents me 开始,用 initment plan 做规划,写完代码用 diff review status 检查, 最后用 compact 压缩对话。真正的 ai 编程,不是让它多写几行代码,而是让它进入一套可控、可检查、可持续推进的工程流程。现在就建一个 agents, m e d。 把 codex 当成你的 ai 工程队友用。

codex 不是 不能改代码,问题是很多人一上来就让他动手。我现在会先卡三道门,读规则圈范围定验证三件事说清楚再允许他改。第一,读项目规则, 项目规则文件说明文档,测试命令,代码风格,先让他复述一遍,别靠猜。第二圈改动范围 让他说清楚会看哪些文件碰哪些模块哪些地方,绝对不能乱动。长任务会多读多查多跑验证,所以入口要稳,用量也要能对账。 hello x codex 中转站适合放在这一步用满写 codex 跑长任务。第三,先写验证方式, 改完跑什么测试页面,看什么结果,哪些行为不能变都写进完成标准,这样做完再让它改,你会发现代码差异小很多,代码审查也轻很多。想要这套提示词模板评论扣代码 x, 下一条我拿真实问题跑一遍。

哈喽,大家好,我是迪迪。如果你用 codex 或者 qq 去写代码的时候,但总感觉效果不是那么稳定,有时候特别神,有时候又特别蠢,有时候一条 prom 就 能干完。但有的时候其实聊半个小时,一个小时,整个项目反而变得越来越乱了。 所以问题可能不在于工具,问题在于你把它用错场景了。 building agent 呢?它不是一个万能的按钮,它更加像是一个不同类型的工程师,有的可以是帮你去想方案,有的是可以帮你去执行任务, 有的可以帮你去做前端的出稿,而有的可以做一些 review 去收尾。所以今天不是想讲我只用 code 或者我只用 curl code, 而是想跟大家讲一些更加实用的场景, 哪些场合我会使用 codex, 哪些场合我会使用 clock code? 那 我就先说第一个场景吧。如果说一般来说我的需求没有特别想清楚,我会更加倾向于用 clock code。 比如说你只有一个模糊的想法,我想做一个小工具,但是并不知道产品的形态是什么,或者说我想重构一个功能,但是不知道从哪里去下手。又或者说我感觉项目结构有点乱,但是说不出哪里有具体的问题。这个时候就不要急着让 ai 去写代码,因为你自己都不知道要它写什么, 他如果直接执行的话,这个结果会变得非常的危险,那更重要的是要让他帮你一起去想清楚这个问题。那这个时候我就一般都会用 cloud code, 他 更像一个能跟我一起讨论的工程伙伴。他适合的场景,比如说像需求的澄清, 方案的推演,架构的拆解以及我思路不是那么正确清楚的时候,他可以稍稍的推我一下。所以第一个直接的判断就是,如果你也是任务还在想清楚的阶段,那这个时候强烈建议大家可以去使用 curl code。 那 第二个场景刚好是相反的,如果说你的任务已经非常明确了,那这个时候我会更加倾向于用 codex, 比如说我已经写好了计划 plan, 然后我也知道其中 bug 在 哪一行在哪里,并且知道 pr 要补哪些测试。 那这种时候我不是需要一个陪我发散的人,而是一个牛马,一个执行力很强的工程师 goodax。 在 这种场景里面给我的感觉就是你只要把我需要的任务给说清楚,他就愿意沿着我的指令,然后往前推, 想修 bug, 然后按计划去实现一定的功能跑测试,然后看一些报错或者说改失败的象 检查 diff, 然后把代码能够推进到一个可以 review, 可以 commit 的 一个状态。所以第二个结论就是,如果说你已经知道自己要做什么了,只是需要等到有人把它给做完, 这个时候我就会用 codex。 那 第三个场景就是前端和交互,因为现在随着各种 ai 产品层出不穷,其实我们对 ui 的 界面的需求也会特别的多,像 landing page, dashboard, 小 工具的界面, sars 的 后台,任何对于视觉和交互有要求的一些东西,我都会选择 cloud code 去让它出第一版,原因非常的简单,就是前端不是只有功能正确,前端还有布局节奏,层级状态,空白按钮, hover loading, 移动端的适配等等这些 cloud code 如果生成这种有感觉的出稿,更愿意多想一点。还有一个小 tips 就是 我也会让 cloud design 去设计一下,就它不能够保证每一次都是非常完美的,但是它比较容易给到我一个六十到七十分能够继续打磨的一个基础,但我一般也不会只用 cloud code, 我 的习惯是两者相结合, cloud code 可以 给我出一个方向,设计稿的出稿,一些前端的原型,后面是用 codex 去做一个收尾, 比如说让 codex 去检查交互有没有问题,移动端有没有溢出,测试有没有挂代码,有没有能够简化的地方。所以第三个场景下面, 在前端的原型和设计感的一个初稿, cloud 可以 先上,再让 codex 去做一些收尾工作。那第四个场景其实就是研究报告结构后的文档, 竞品的分析,市场的调研,技术方案的整理。这些我会倾向于用 codex, 因为这类任务的重点它并不是创意,而是结构,或者说是系统化的整合起来。 你需要把一些资料整理成清晰的表格,然后判断标准、优缺点,推荐方案和结论。那 codex 在 这类的任务里面通常会更加的克制,而且输出也更像一个直接能够交付的工作文档。之前其实我很长一段时间都会用 cloud code 的, 但是逐渐的发现 它其实能做,但是有的时候会更加像是讲故事,所以文字也会更加的展开一些。所以如果说我想要做一个产品,我会先找 cloud code, 但是要把一堆信息整合成一个清楚的报告,我就会更加倾向于用 codex。 那 第五个场景就是一个完整的工程交付,这个也就是 codex 实至名归的一个非常强的地方,它给我的感觉就是不是某个单点功能特别夸张,而是它的整个工作流都特别的顺, 他会开任务,改代码,然后跑命令去看结果,并且用他内置的浏览器去检查页面,然后再做 review diff, 最后准备提交,所以更加像是一个完整的工程的工作台,尤其是我的这个真实项目里面,不是玩 demo, 而是要推到可以发布的一个状态,所以在这样的情况下, codex 我 会更加的 prefer 一 些。第六个场景就是想做一些高度定制化的一些工作流, 比如说想设置一些 hooks, 想做自动化的流程,想做一些 skills, 然后让不同的 sub agent 负责不同的一些任务, 并且接近自己的一些系统里面的时候,那这类场景里面其实 cloud 会更加的有优势,因为它更加像一个可以改装的 agent 的 一个系统。所以如果说 codex 像是一张打磨好的工程工作台的话,那么 cloud code 就 更加像是一套自己能够组装让自己扩展的 agent 的 操作系统, 它的上限非常的高,但前提是我真的愿意去折腾整个工作流吗?还是要看我自己想要干什么。如果说只是想让 ai 帮我去写代码,改代码,可能并感受不到这个差异,但是如果说一个长期的生产系统, 这个差异就挺重要的。所以跟大家来总结一下刚刚所有的一些场景,当我需求没有想清楚的时候,就用 codex 前端的第一个版本呢,我会用 code code, 而工程收尾和 qa 的 话呢,会用 codex 研究报告以及搜集整理结构绘画的文档。我会用 codex 那 高度定制的一些 agent 工作流用 cloud code, 这个是我半年的时间以及过去一个月深度使用 codex 总结出来的框架, 但它也是一个当前我的一个工作流,可能未来的两三个月随着模型不断的变强,这个工作流也会变。但我觉得最重要的一点就是不要把单一的一个工具变成一个信仰,不要单纯的变成 code code 党或者说 codax 党,他们干的事情其实都是一样的,帮你操作文件夹里面的一些代码、文档、配置和命令。 真正重要的就是不是站在哪一边,而是能不能判断这个任务现在处于哪一个阶段。对于当前的阶段,选择适合他的最佳工具和模型,他是需要发散还是需要执行?他是需要审美还是需要稳定?又或者说他是需要当前去讨论不同的方案,去做 brainstorm, 还是说需要把事情给做完? 当你看到这样的态度去看待问题的时候,你就不会再纠结哪个 agent 是 最强的,而是把它们会放到不同的一些位置。 可用的 code 可以 帮你去想清楚,而 codex 可以 去帮你去推进完它们,就像不同的一些员工,然后你就可以分配不同的任务给到它们。所以关键不是工具赢了,而是我自己的工作流以及我自己的判断赢了整个流程。 而这个我觉得是 ai 最有魅力的一个地方,它会不断地进化,从而不断地颠覆我自己对于不同工作流的一个认知。今天想跟大家分享的就是我常见的在不同的工作情况下会使用 codex 还是 cloud codex。 我是 迪迪,咱们下期见。

先别保存 ai, 刚改完代码,最危险的不是报错,而是它居然能运行。因为能运行不代表改对了, ai 可能一口气动了十几个文件,加了新逻辑,删了就判断,还顺手改了配置。你今天没看,明天出问题就不知道该退回哪里。 所以今天只学一个救命流程,先看状态,再看差异,挑进暂存区,最后保存成版本。四个动作,把 ai 的 变化关进历史。 get, 不是 get up, git 是 你电脑里的版本时间线, git hub 是 把这条时间线放到云端,方便协助 ai 辅助开发时。第一道安全门是本地 git, 一个项目有三个区域,工作区是你正在改的文件暂存区。像提交前的购物车仓库,是真正保存历史的地方。 每一次 commit 都是一张快照。第一句, get status, 它告诉你哪些文件变了,哪些还没准备提交。 ai 改完代码,第一反应不是相信,而是看 status。 第二句, get diff, 他告诉你具体哪几行被加了,哪几行被删了,你不必每个符号都懂,但要看出方向有没有跑偏。第三句, get add 点,他把你认可的改动放进暂存区。注意,这一步还不是保存历史,只是准备提交。 第四句, get commit, 它才是真正保存版本。提交信息要写清楚目的,比如添加登录表单或者修复按钮点击错误。所以以后让 ai 写代码,就按这个节奏。 status 看文件, def 看变化, add 挑进去, commit 流利时。 今天只练这一条线,建一个文件,改两行内容。跑完这四句命令,你就开始用工程师的方式管理变化。

你第一次用 call 大 师,最危险的不是不会写代码,而是让他乱改你的项目。很多新手一上来就说帮我做个网站,结果 call 大 师改了一堆文件, bug 没修好,项目还更乱了。更崩溃的是安装打不开,手机连不上,看到批准命令也不知道能不能点先搞清楚, call 大 师不是单纯聊天写代码,叉着 gdp 更性回答你问题。 call 大 师更性进入你的项目里干活,他能读文件改代码,跑命令,看报错继续修,所以他能力更强,但也更需要边界。新手翻车空城,不是因为 call 大 师不行, 而是任务太大,指令太模糊,没有回馈方案。一,新手优先用桌面版,你能看到项目文件修改, excel 对 比和任务进度,比 cr 更直观。第二,改代码前先让他读项目,直接说请先阅读项目结构,不要修改任何文件,告诉我功能、技术栈启动方式和风险点。第三,必须加最小改动原则, 比如是修改和这个问题直接相关的文件,不要重构,不要升级依赖,不要改样式,修改前建立计划。第四,看到批准命令,别谋脑点,先让他解释这条命令干什么,有什么风险,不运行会怎么样。第五,手机连不上,不要乱试,检查电脑端是否打开,是否休眠,账号和工作区是否一致, app 是 否最新,说不清就截图, 让 call 大 师根据截图排查。比如你只是想改一个按钮颜色,如果你说帮我优化页面,他可能顺手改结构,换样式,动依赖,正确说法是 只改按钮颜色,不改其他布局,改前告诉我会动哪些违建,这样 call 大 师就从自由发挥变成案范围执行。记住, call 大 师的核心不是会写代码, 而是能在项目里执行任务。你越给他边界,他越稳定,你越鲁乎,他越容易失控。我把新手最推荐的五条 call 大 师提示词放评论区了,你最喜欢用 call 大 师做什么?写网页修 bug? 还是做小工具?评论区告诉我,记得收藏,第一次用真的能少踩坑。

codex 到底是什么?它到底能干嘛?到底什么样的人才会用到它?不是程序员到底能不能用?不会写代码到底能不能用?本来呢,昨天我想出一个基础教程,结果没发出去,现在呢,我就简单口述一下。 首先我要说一下,不一定非得要用 codex, 我 说 codex 就是 指 codex 这一类工具,其实还有很多种工具,比如说像最近开源界比较火的 open code, 像字节出品的 tree, 还有像 carson 等等等等都可以。我只是拿 codex 举个例子,那 codex 到底是什么呢? codex 一 句话总结就是它是 gpt 的 亲兄弟, gpt 呢,就是用来聊天的,而 codex 呢,就是用来干活的。它能干什么活呢?现在能干的活非常多,如果你现在还花大量的时间去做 ppt, 你 现在就可以把这些任务丢给它。现在 ai 做 ppt 能力已经非常强了,我之前做过一次测评, ai 现在直出的 ppt, 简单修改一下,基本上就能够汇报,它还可以帮你做视频,其实我的很多视频都是 koex 或者是 cloud code 帮我做的。 koex 现在能帮我省掉很多剪辑工作,比如说你的电脑驱动坏了,你不知道怎么修,你现在就可以让 koex 帮你修一下,你还可以让 koex 做一个个性化的简报, 如果你真的有想法,你还可以做一个网站,做一个 app。 我 上面说的都是 koex 能力的冰山一角。那 koex 适合什么样的人群? 会写代码?到底能不能用 codex? 很多人以为啊, codex 这类软件就是一个非常专业的软件,这可能是最大的误解之一,你可以问一下你周边程序员的朋友,看看他们现在还写不写代码。今天刚刚刷到谷歌帝麦的研究员姚顺宇的播客, 他说现在大部分项目都不用写代码了,全部都在用 ai coding。 更主要的是像 codex 这类工具,它的使用难度绝对不会比豆包高,当年我学 cad 画图还学了好几个月,才能勉勉强强上手。 而现在的 ai coding 软件,基本上几天的时间就能够学会,最重要的是它不是一个很枯燥的软件。很多人开始 ai coding 之后,它现在连游戏都不玩了, 每天都在等着额度恢复,因为它很容易让你有一个 builder 的 感觉。 codex 其实它的能力跟它的竞争对手 cloud code 还是有一定距离的。 cloud 它更像是一个谋士,在你不知道干什么的时候,它会帮你出主意,而当你确定了想要干什么的时候,并且做好这些规划的时候, codex 就 会派上用场了。它更像是一个总经理,它会帮你认真的完成这些工作,所以两者要结合起来用。

codex 加飞书 c i 简直就是王炸组合,如果你的工作场景里面经常要用到飞书,那我真心建议你一定要把飞书接入 codex, 因为我自己本身就是在做自媒体和内容电商,所以我对竞品内容分析有非常大的需求, 但是市面上很多软件和系统都非常的难用,以及我在用 codex 之前,我自己也搭过一个,只不过是用扣子去搭的一个工作流, 非常的困难,拖拖拽拽搞了我非常久的时间,但这一次用 codex 加飞速 c l i 一个小时不到就帮我全部搞定了,给大家看一下,从提需求到他帮我规划只用了两分钟,然后到确定他帮我搭建这一个系统,只用了二十三分钟。 这个是我让 codex 直接用飞速 c l i 搭建好的一个表格,这个程序它是已经写好了,只要我复制小红书链接,它就可以自动帮我拆解标题,还有正文,还有 视频口播的这个脚本。我觉得视频口播的脚本是对我来说最重要的一个部分。 ok, 那 我们现在复制一个链接,让它试试跑着看, 它现在已经自动在跑了,然后已经在处理中,大家可以看一下。好,它不到两分钟就帮我已经拆解出来了, 对,我们来看一下啊,还是非常非常牛逼的。那其实在我搭建完这一个表格之后,它帮我拆解完视频口播脚本这一部分,其实我没有用到任何的 token, 只是一开始让 codex 帮我开发的时候需要消耗一定的 token, 等后面我再用这一套脚本去跑的时候,已经完全不需要任何的 token, 它花费的额度基本上为零。我在扣子上面搭建这样的一个工作流,还需要我付一定的额度。但其实 codex 已经在这一个文件里面写好了,这个脚本 我在跑的时候就完全不需要消耗额度。但是如果要让 ai 基于这一个口播脚本去分析改写的话,就需要接入一定的 token。 如果你感兴趣的话,我下期也会分享我是怎么用豆包或者是 deep sync 接入到这一个程序当中,让它帮我搭建后面的分析和改写。 所以说大家一定要去接触一下 codex 和飞书 c l i。 如果你也对 ai 加电商, ai 加业务落地感兴趣的话,后续呢,我也会持续更新我的一些实际案例,欢迎大家一起交流。

status, 显示当前模型 token 用量,可写路径、权限设置等所有绘画信息。 plan, 先出计划,让 codex 把执行步骤列出来,再执行 review。 ai 做 code review, 安全漏洞和逻辑问题一并抓出来。 compact, 将当前容长对话自动摘药,释放 context 空间。 model 在 对话中途随时切换 ai 模型。 if, 查看 ai 改了哪些文件,提交前核查变动。 fork, 对 同一问题尝试两种方案,不破坏当前进度。 init 生成 agents, md 自动生成项目说明文件、股价记录、编码规范、测试命令项目背景,用好这些 codex 指令效率翻倍。

录里的,别把 codex 当聊天框用,它更像坐在项目目录里的编程同事。它能读代码,改文件,跑命令,看 diff, 但前提是你得会管它。 codex 里有两种输入, 普通 prompt 是 你让他干活,比如修灯,电路,解释一个文件,重构一个函数。斜杠指令是你控制他怎么干活。这个区别搞清楚,新手就少踩一半坑。最先记住 enit, 它会生成 agents, md, 你 把启动命令、测试命令不能动的目录都写进去。 以后 codex 进项目会先读这份入职手册,再记 status。 你 不知道它在哪个目录,什么权限,用什么模型就敲它。任务一复杂,别急着让它改代码, 先用 plan 让它定位文件,说明风险,给最小方案。如果你只想让它看某个文件,就用 mention 点名。 改完以后别只看总结,一定敲 diff, 看真实改动提交前再跑 review, 让它换成审查视角,找 bug 回归和漏掉的测试对话太长,用 compact 压缩历史, 明天回来用 reason 接着干。临时问一句,用 side, 想试另一条路线,用 fork。 新手最稳的流程就一句话,先让它读,再让它想,再让它改,再由你验收。 codex 指令不用全背,你先把这几条用熟,它就不是一个会写代码的聊天机器人,它会变成一个聪明但边界清楚的项目同事。

大家好,今天分享一下 codex 命令,学会四十二个命令,完全可以改变你使用 codex 的 方式,从模型切换、绘画管理、代码审查。今天这期视频我会逐一讲解每个命令,告诉你它们是什么,什么时候用,怎么用。 如果你还在低效的使用 codex, 看完这期视频会让你的工作效率翻倍。模型与配置相关命令第一个,使用 model 快 速切换当前绘画的模型, 确认后就会弹出可选模型列表,选择后,后续对话和代码操作都会使用新的模型。它适合在不同任务间切换,比如日常改代码,用速度更快的模型,复杂架构分析、疑难 bug 排查时切换到推理能力更强的模型。第二个, 如果你想让它响应更快,可以输入 fast, 速度是一点五倍。这个命令会把当前绘画切换到更偏速度优先的工作模式, 适合处理简单修改,查文件、跑命令,解释这类代码低风险任务。它的重点是减少等待时间,让 codex 更快地出结果。适合快问快改,不适合重度分析。再次,使用 fast 的 命令可以切换标准速度。第三个可以使用 personality 调整它的沟通风格, 主要有两种, friendly 和 pragmatic。 第一个更像一个耐心的合作伙伴,语气更轻松,会解释多一点过程,适合学习、探讨和头脑风暴。第二个更像资深工程师,表达更直接,重点放在结论、风险和下一步。 适合修改 bug, 改代码,做工程决策。 personality 不 会改变模型能力、权限或者项目文件,只是改变 codex 和你的沟通方式。 第四个 experiment 是 一个实验性开关,这些开关会保存到 config 二 m l 文件里面,影响之后的使用体验。比如 terminal resize 会在终端宽度变化时重排 codex 的 聊天记录。 memories 允许 codex 从对话中建立记忆,并在新绘画里带入相关记忆。 prevent sleep while running 则是在现程运行时防止电脑休眠。实验性功能适合愿意尝鲜的人,稳定性可能会发生变化。权限与安全相关命令 第一个 permission 用来设置当前绘画的操作权限,打开后你会看到三个选项, default、 auto view for access。 defort 是 常用的安全模式, codex 可以 读取和修改当前 workspace 里面的文件,也可以运行命令。 但如果需要访问互联网或者修改当前项目之外的文件,就必须向你审批。日常写代码,修 bug 跑测试用这个模式就足够了。 auto view 和 default 基础权限一致,也是 workspace 可写,它会限制互联网和外部文件访问。区别在于符合条件的审批请求优先交给 auto view 子代理判断。一些需要 on request 的 操作不一定直接弹给你, 而是先经过自动审查。它适合希望减少手动确认,但又不想直接放开全部权限的场景。 for access 是 最高权限, codex 可以 修改 workspacey 的 文件,也可以不经过你的确认访问互联网。这个模式效率最高,但风险也最大,因为它可以直接影响你的系统环境、用户目录 下载或执行外部内容。只有你明确知道任务需要这些权限,并且信任当前操作时再开启。第二个 approve 是 处理自动审查拒绝的动作,所以没有什么可批准的 绘画管理相关命令。第一个 new, new 相当于是开启一个新的绘画,它不会退出 codex, 也不会换你的项目目录,只是把当前的上下文清空,重新开始一个新的任务。比如刚才让 codex 改完一个 bug。 接下来想问一个完全不相关的问题,可以用 new, 这样上一段任务里的讨论文件决策就不会干扰新的任务。我们可以通过这个 space 命令来查看一下当前绘画。 当前绘画 id 二八零使用 new 命令,我们来再创建一个新的绘画。我们通过 states 来看一下绘画 id 跟当前的绘画 id 是 不是不一样。我们看到是八二一,这就是 new 命令。 第二个是 resume, 恢复历史绘画,并继续使用当时的上下文。如果你昨天让 codex 分 析过一个项目,今天接着干,就不需要把背景重新给 codex 讲一遍。通过当前这个命令,从历史绘画中 选择一条 codex, 就 可以沿着之前的上下文继续往下做,就相当于切换到上一次绘画中。第三个命令 fork。 fork 就是 把当前绘画复制出一份新的分支,保留所有上下文,后续修改互不影响。 它适合你想尝试另一种方案,但又不想破坏当前这个对话的时候用。比如当前的方案用的是 rack 实现。你突然想试试路由一,这个时候 fork 出一个新的绘画,原来的对话还是存在,新的绘画就可以大胆地尝试。第四个 side, side 是 开启一个 临时的旁路对话,它适合处理一些小问题,但不想打断主任务。比如 codex 正在帮我们改代码, 你想顺手问一句刚才这个报错是什么意思,我们就可以通过这个 set 命令问完之后,我们再切回主绘画,主绘画不会被这个临时打断打扰。第五个 rename。 rename 是 用来给当前绘画改名字。当前历史绘画越来越多,默认标题可能不够清楚,我们就可以通过 rename 命令 来把它修改一个名字。以后我们通过 resume 就 可以找回来是哪一个绘画。例如我们通过 space 命令来查看当前绘画, 我们可以通过 state 命令查看当前绘画的名字。当前绘画的名字,比如说是这个设置一个名字,我们通过 rename 命令可以来修改。给它改一个名字,我们再次通过 state 命令可以查看一下,它的名字就发生了变化。第六个 agent, 它是用来切换当前活跃的 agent。 如果你开启了子代理, 比如第一个 agent 是 负责读代码,另外一个 agent 负责跑测试,还有一个 agent 负责 code review, 那 我们通过这个 agent 的 命令就可以在这一些 agent 之间进行切换,查看它们各自任务的进展,或者继续跟一个 agent 对 话。当前我这里只有一个 agent。 第七个 sub agents, 这个命令是子代理入口相关的命令,你可以把它理解成,当一个任务比较复杂时, excel 不 一定只靠主 agent 来做,可以把一部分工作拆分给子代理来做,比如子代理专门做分析代码结构,还有一个子代理可以做测试风险,主代理最后做一个任务汇总,这种特别适合大型项目分析,因为这里没有创建子 agent。 最后一个 go, 这是给当前任务设置一个持续目标,它不像我们普通的一问一答,但 go 更像适合告 codex, 你 接下来围绕一个目标工作,直到它完成为止。比如说 token 消耗了, token 用完了, 或者任务执行完了,是一个长期目标。比如你可以设置把这个项目跑起来,修复启动中相关的错误,并确保测试通过。我们通过这个 go 命令,这样 codex 它就会持续地围绕我们这个目标来完成。 中间我们也可以自己检查进度。如果这个任务执行的时间太长了,我们也可以暂停,继续调整目标都是可以的。现在我们用一个真实的案例来把刚才讲的绘画相关的命令我们来串一下。假设我有一个需求是让 codex 帮我创建一个个人博课 技术站,用的是 v u e, 并且不止让一个 agent 从头写到尾,而是启动三个子代理来完成写作。一个负责写代码,一个负责测试,一个负责 code roo。 第一步,我们通过一个 new 命令,这是因为是一个全新的项目任务,我希望它是一个干净的上下文,不要被前面的掩饰 内容所影响。第二步,我们用 rename 命令来给当前绘画改一个名字,例如我叫 u e。 个人博课,我们可以通过 permissions 来确保当前项目的权限模式,我这里选择 auto view。 接下来,我们通过 go 命令给 codex 设置一个持续的目标。我们看一下提示词我们的目标,然后里面有一个启动三个子代理来完成一个 code review, 一个 code write, 一个 test runner, 还有一个 code review, 我 们复制提示词, 使用 go 命令,我们一起来看一下,然后发送。 我们看到它的要求是启动了三个子代理, 我们再来看一下,刚才我们有一个 agent 命令,我们刚才启动了代理,我们看一下有没有 agent, 这是我们默认的主代理。我们看到我们要求的一个 code write, 它已经给我创建好了,我们可以切换到子代理上面, 子代理已经在开始工作了,这个时间比较长,我们稍等一下,刚才不小心打断了,我们再来结合一个命令 fast, 我们把它速度切换到一点五倍速度,消耗两倍 token, 让它继续写代码。我们可以看到我们刚才起用的是子代理来写代码,现在我们的主 agent 在稍等,待我们这个紫 agent 完成任务。我这里整理了一份命令文档,如果大家需要,大家可以三连,然后我给大家发文档。我们接着刚才的演示,我们来看一下,他已经把刚才我定义的这些 agent 都创建出来了,自己跑了一个浏览器在这里做测试。这个紫代理 review 他发现了一些问题,然后他现在在给我们做一个修改好,我们看到他已经把我们的这个目标给完成了,我们一起来看一下效果,这就是他刚才写的一个简单的页面代码与工作区相关命令。 接下来这几个命令更像是 codex 做项目时的辅助工具。第一个是应逆时命令,它是创建一个 agent 点 md 文件,我们可以把它理解成给 codex 写一份项目说明书,我们来执行一下 当前的这个目录,还是我们昨天做的一个个人簿刻这个页面,我们通过 uscode 的 辅助插件,我们可以看到他昨天写的代码,在这个区域,我们看到他正在给我们写这个 ajax 点 md 文件,我们看到他已经给我们写完了 ajax 点 md 文件,我们一起来看一下。 都是英文的,我们可以把它改变成中文, 我们直接通过 ide 来查看比较方便。我们看一下它有项目结构和模块组织,然后构建测试和本地开发的一些规范,怎么测试,还有 pr 规范, 还有 agent 的 专用说明,它都已经给我写好了。这个 agent 点 m d 文件相当于是给 codex 写了一份我们当前项目的一个说明书, 这样以后 codex 进入这个项目都会优先参考我们这个 agent dmd 文件里面的规范,不需要反复解释项目约定。第二个命令是 plan, 在 真正开始写代码之前,我们可以输入 plan 切换成 plan 模式,它的作用是 先拆任务,不着急写代码。比如我要创建一个个人博克,它会先规划项目的结构,需要哪些页面,文章的数据怎么放, 会先做规划,规划完成以后它才开始写代码。这个命令适合在复杂任务面前,我们可以通过快捷键 shift 加 table 来关闭这个 plan mode, 也可以通过快捷键 shift 加 table 快 速开启 plan mode。 我 们来演示一下这个 plan 命令。我们通过斜杠 plan, 现在大家可以看到它不是直接写代码,而是它向我提出的一些问题,你希望关于我页面主要强化哪些?感觉 我们可以自己选,它不是直接的写代码,也就是说我们通过 plan 命令把我们提示词中的任务进行拆解确认以后,它才会开始给我们写代码。第三个命令 mention, mention 是 用来把指定文件或目录带入当前绘画。比如我想让它重点来查看一个文件, 我们就可以通过这个 mention 来选择这个文件。比如说 index 点 s t m r, 它就会重点地去查看这一个文件。这样做的好处是我们不用在提示词里面手动去复制一堆代码,也不需要它去查找对应的代码。这个比较适合当前页面,有一些 bug 我 们自己知道, 我们可以指定它来这个文件中查找。我们通过 man 审核这个命令,指定到对应的文件给它的提示词,查看一下当前页面的代码。 他收到这个指令后,他只会去查看当前这个类的代码。我按照你点名的这个要求来查看这个。第四个是 skills, 是 选择和使用本地技能的入口。比如我现在做的是一个前端项目,如果我本地有前端相关的 skill, 我 们可以通过 skills 让 codex 使用它,我们一起来执行一下它有两个,第一个列出当前的 skill, 第二个,开启和关闭 skill 我们确定。例如我这里安装了浏览器的 chrome 的, 还有 computer user fig 码之类的,我们就可以使用这个 skill 来做一些事情。我们可以看一下我这里用了这个 documents, 让他帮我写一个项目文档。 skills 是 给 context 加一套更专业的工作方法和技能。第五个 default, 当 context 写完代码以后, 我们可以输入 default 命令, default 会展示当前工作区发生了哪些改动,比如新增了哪一些文件,修改了哪一些文件。这一步非常重要,因为在真正运行或者提交之前,我们应该先看一眼它做了哪些改变。我们通过一个案例来演示一下这个 default 命令,给他一条指令, 我让他把关于我页面这关于我这三个字改成红色,他已经修改完了,我们看一下,我们看到他已经是红色的了。我们再来试一下刚才的 default 命令, 我们可以看到他改动的文件,这就是 default 命令,就是会展示工作区发生了哪一些改动。第六个是 review 命令, review 是 让 codex 对 当前工作区做一次代码审查,我们一起来看一下, 我们通过 luul, 然后它有四个选项,第一个这个 pr 审查,也就是会把当前分支和某一个 base 分 支做一个对比。第二个就是审查当前还没有提交的本地改动, codex 刚改完代码以后,最常用的是这个。 第三个是针对某一次 commit 做一个审查。第四个是自定义审查,我们选择第三个,我这里有两个提交。我们看到这个 code luul 已经结束了, 这个初设版本是一个 v u e 项目,可以成功构建路由页面和数据流也是一致的,我没有发现值得代码审查里面需要提出来的明确问题,这就演示了我们这一个 rule 命令。我们把代码工作区的这六个命令串一下, 我们先用 easy 命令建立项目规则,再通过 skill 命令选择自己的这一个技能。我们要开发的时候,我们可以通过 plan 命令先做一个规划, 把任务做一个拆解。我们可以通过 minsh 命令来对指定的类进行一个修改。写完代码以后,我们可以通过 default 命令查看改动。最后我们可以通过 review 命令来做一个代码审查使用,这就是我们代码和工作区六个命令正常使用的一个顺序。 上下文,记忆相关命令这里主要有三个命令,主要解决的是上下文问题,也就是 codex 怎么知道我们在看什么,以及当前绘画太长的时候怎么保持清晰。第一个 id 一 命令,它主要解决的是把 id 一 里面的上下文带给我们。 codex, 我 们通过 id 一 命令,它这里提示 id 一 contacts is on, 说明我们这个 id 一, 我们选中这个字段, 问他这是什么意思,我们可以看到他直接读取到我们 i d e 里面这个字断了,我这里刚才选中的,他解释了这是什么意思。这样相当于是把我们 i d e 里面相关的代码的上下文,我们可以直接带到这个 c r i 中, 它是把我们这一些代码编辑器里面的上下文带到我们当前的终端里面来,可以解决我们不想手动复制粘贴的问题,也特别适合来做一些局部 bug 的 调整。第二个命令 compact 压缩,它是用来压缩当前对话的上下文。当一个任务跑得很久以后,整个记录 上下文会比较长,模型需要处理的信息也会变得更多,重点可能不够集中,有可能这个时候就会产生一些幻觉。这个时候我们就可以通过这个 compact 的 命令把当前可见的对话 总结压缩成一个更精版的,保留更关键的决定。我们这里可以看到已经使用了百分之二十三,我们来试一下这个命令,我们看到压缩还是比较厉害的, 当前上下文占用减少了,所以 compact 的 命令适合是长任务中途,比如项目做到一半,我们感觉到上下文很长了, 我们又不想重新开一个绘画,我们就可以先压缩一下。第三个 memory, 它是用来管理记忆相关的功能, 我们先执行一下。第一个是以后开了新绘画 codex 是 否读取已有的记忆。第二个是 codex 是 否从绘画中生成新的记忆。第三个就是一个重置,它主要是用来控制 codex 要不要使用这个记忆,以及要不要从绘画里面来生成新的记忆。 所以这三个命令分别对应着三种上下文。第一个 id 是 当前编辑器的上下文。第二个 compact 是 当前常对话的上下文。第三个 memorize 也是跨绘画的一个长期上下文状态与调试相关命令。接下来这几个命令主要是查看 context 当前的状态, 调整终端的显示以及管理后台运行的任务。第一个 state 用来查看当前绘画的状态,例如当前使用的模型目录 权限,绘画 id, 还有上下文限制之类的。第二个 slide 主要用来配置底部状态栏,就是我选中的这个地方,我们一起来看一下。比如说主题的颜色,我们看到这里使用了九十点七 k, 我们可以切换来控制它显不显示模型的名字。 g p t 五点五控制显不显示项目的名字,这里已经显示不下了,我把模型关了,使用托管关了项目的名字,还有当前所在的分支运行的状态,当前的这个模式,我这里是 auto view, 我 们可以通过 statline 来配置底部状态栏 的一个显示情况。第三个 title, 我 们可以通过 title 命令来配置终端,这个标题页的一个显示,我们来试一下,我们可以看到这里有个 codex c l i, 也就是项目的名字,在这里可以控制它显不显示。 这一个是当前的目录,比如说斜杠, codex c l i 这一些,根据自己的需要进行灵活配置。第四个 ps, 用来查看后台的一个终端任务。有些命令可能在后台持续运行,比如说 开发服务器测试监听长时间的一个构建任务,我们可以通过 ps 命令来查看。最后一个 stop, stop 是 用来停止后台的一个终端任务,比如开发服务器已经用不了,或者某个命令卡住了,我们可以通过 stop 来暂停。这就是我们状态和调试的一个相关命令工具与扩展相关命令。 第一个 m c p, 我 们通过这个命令可以列出当前所安装的 m c p 服务,我们可以看到我这里安装了 chrome, d v tools, 还 codex app 相关的服务, computer user, 这些都是 m c p。 我 们一起来添加一个 m c p 服务,我们这里来安装一个 figma m c p。 复制 m c p 的 地址,我们通过这个命令就可以添加一个 figma m c p。 我 们看到已经添加成功了, 我们来看一下在这里面能不能看见刚才我们添加的 figma mcp, 我 们这里已经看到了显示了 figma mcp 了, 所以我们通过 mcp 命令,我们可以看到当前绘画里可以调用哪一些外部工具。第二个是 hux, 它是用来查看和管理生命周期的钩子,钩子就是在关键时刻会自动触发,疑问表示触发时机。 in store 表示安装了多少个 hook active 标记,当前激活了多少个。这个是一个描述,这个是工具执行前开始触发,这一个是请求权限触发,比如让 codex 联网或者修改一些外部文件。 工具执行后开始触发上下文压缩触发等等之类的。我们可以通过命令来查看当前配置了哪一些钩子,哪些是可信的。 我们也有一些应用场景,比如说我们执行一些长任务,比如说通过 grow 命令执行一些长任务。执行完之后,我们希望他提醒我,我不可能时时刻刻的 待在这里,看着他有没有执行完。我们可以让他执行完之后,比如播放一个音乐。第三个 plug in, 它是用来查看或者已经安装的插件,这里可以看到这都是我安装的一些插件,例如编辑文档的 连接, figma 及 mail 相关的一些插件。插件通常会给 codex 增加一些新的能力,例如我们点击 document, 我 们可以来卸载它。这个插件里面使用了哪一些 skill, 这里都可以能显示。 我们返回最后一个 keymap, 这个了解一下,其实就是更改快捷键的一个指令界面,显示相关命令。第一个 then 用来选择高量主题,我们试一下, 这里有很多主题,我们切换可以看到代码的一个主题颜色,如果你觉得默认颜色看着不舒服,可以通过当前命令选择自己合适的主题。第二个 vm 用来切换 web 的 输入模式。 默认情况下, codex 的 输入框更像普通文本输入,我们看到它这种切换是这种模式普通文本的,如果我们通过 web 切换这种会看着比较舒服一点。这个命令适合 web 的 用户,如果你不熟悉,可以保持默认风格。第三个 row, 用来切换滚动模式,这种命令主要是为了方便复制终端中的内容,我们通过这个命令可以切换到更原始的滚动显示方式,这样复制内容 更方便。最后一个是 copy, copy 用来复制 codex 最后一条完整回复的消息,我们看到他回复了我这一段话。如果我们不想手动复制,我们可以通过 copy 命令。我们直接通过 copy 命令就把当前消息已经复制好了, 直接粘贴就可以退出。与维护相关命令,我们一起看一下。第一个 clear, 用来清空中端,开启一段新的绘画。它和 new 命令有点像,都是让你重新开始, 但 clear 更强调清理当前终端的界面。第二个 logout, 用来退出 codex 登录。如果你是在公共场所 或者临时借用别人电脑,可以通过当前命令来退出本地的一个登录凭证,让这台机器不再保持你的一个登录状态。第三个 feedback 是 用来把日制发送给 codex 开发团队。最后一个退出 codex, 它和 quit 一 样,都是离开 c r i 绘画。如果你还有重要改动没有保存或者后台任务在跑, 最好先确认再退出。到这里, c r i 里面四十多个命令我们已经讲完了,你会发现这些命令并不是让你死记硬背,我们可以把它分成类。有的是权限管理,决定 codex 能做什么。有的是绘画管理,决定任务怎么开始、 暂停、恢复和分支。有的是管理上下文,让 codex 更精准地理解你的项目。有的是辅助开发,比如 dev review 引用文件,制定计划。有的是调整终端体验。 我们在 c r i 里面用得更顺手。如果日常用来写代码,我们记住几组就足够了。 permission 权限管理 new resume fork 绘画管理 plan global 任务推进 mention idea 管上下文, def review 管代码检查 state compact 管 长任务状态。如果这期视频对你有帮助,欢迎点赞、收藏加关注,后面我会继续分享 ai 相关知识,我们下一期视频再见!

上一期我们配置好了 codex, 这一期讲怎么让它安全改代码,不怕把项目改乱。记住一个原则,先让 codex 读懂项目,再让它动手修改。第一步,不要直接提需求,先让它阅读项目结构,解释主要目录入口、文件依赖和启动方式。 第二步,把任务拆小,比如只改一个按钮,文案只修一个,报错只加一个接口字段。第三步,提前告诉 codex 哪些地方不能碰,比如数据库迁移、密钥、文件生产配置和无关模块。第四步,复杂需求,先让他给修改方案,确认方案合理之后再让他真正编辑文件。 第五步,看 diff。 不要只看 codex 的 总结,要看它到底改了哪些文件,删了哪些内容,加了哪些逻辑。第六步,让 codex 跑检查,能跑 link 就 跑 link, 能跑测试就跑,测试,能够建就构建。如果测试失败,不要让他凭空猜,把错误原文和失败命令交给他,让他基于上下文继续修 重要项目。建议先切一个新分支,或者至少确认当前改动可以回滚,这样试错成本低很多。你可以这样说,先分析影响范围,只修改必要文件,修改后说明 diff, 并运行可用的检查命令。 新手最容易犯的错误是给太模糊的指令,比如帮我优化一下项目,这种范围太大,风险也大。更好的说法是在设置页面增加保存提示,只改前端交互,保持接口不变,最后告诉我改了哪些文件。 最后记住五步,读项目,拆任务,定边界,看 diff, 跑检查。下一期讲项目及规则怎么写,让 codex 更懂你的项目习惯。

ai 编程工具这东西吧,真的是风水轮流转,最开始大家在吹 carson, 后来 carlo 的 大火,而这次轮到了 colex。 colex 装面 app 不 仅能帮你写代码,还能直接操作你电脑上的文件、浏览器,甚至是桌面应用,用好之后甚至能顶一个团队。 本期我会从 colex 安装到核心特性,用十多个实战案例手把手教你玩转 colex。 不管你是想用它来编程、开发、办公提效,还是搞一些好玩的创作,看完这期都能直接上手。那本期教程的文字版,可以在评论区获取干货秘籍,建议先收藏,找着安静的地方慢慢使用。 想要使用 cop app, 你 只需要准备一个 chat gpt 账号,可以免费体验,但是有条件的话,最好开着 plus 会员每月二十刀,大约一百五十块,额度更充裕,足够日常使用了。 那有了账号,直接去官网下载安装酷贷 app 就 好。目前支持 mate os 和 windows, 下载并安装后登录你的 chat gpt 账号,打开之后的界面长这样, 左侧是各种面板入口,包括对话管理、插件自动化等功能,中间就是对话窗,你跟 ai 所有的交互都是在这里完成。跟平时用的 ai 聊天工具差不多嘛,还挺清爽的,不像传统的编程 ide 那 么复杂,上手没有门槛。接下来我们直接开始使用, 跟你用过的其他 ai 工具一样,在对话框里输入内容发送,就能开始聊天了。适合处理一些简单的日常工作,比如帮你查资料、总结内容、规划方案。 我让他帮我查一下今天有什么 ai 编程方面的热点。 cadets 会自动联网搜索最新信息,然后帮忙整理总结,这下不怕错过新资讯了,这只是开胃菜。 cadets 真正强大的能力是操作你本地的文件和电脑。下面我们试试 点击左侧的项目入口,选择一个本地文件, ai 能在这个范围内读取和操作文件。 比如我选择了我的下载文件夹,里面有一堆不知道什么时候存下来的大文件。在对话框底部,你可以看到权限模式的选项,这里有三个选择,默认权限, ai 可以 读取和编辑工作区的文件,需要额外权限时会主动问你。自动审查是 ai 会自动帮你审查操作。 还有完全访问, ai 想干啥就干啥,不会弹确认框,建议新手直接选自动审查,既省时又省心。 选好权限后,在对话框里输入提示词,然后你就能看到 ai 开始工作了。它会自动执行终端命令来扫描文件,分析每个文件的名称和大小。最后给你一份清晰的报告,列出哪些大文件占了多少空间,并给出清理建议。 那我主打一个听话,就让 ai 帮我删除没用的预览文件吧。最后成功帮我节省了六点八 g 的 空间,效果不错吧。但如果我让 ai 删除一个工作区外的文件呢?会发生什么? 试试看,在当前工作空间开启一个新对话。比如,我让 ai 帮我删除鱼皮新书出版目录下的所有文件,可以直接把这个目录拖拽到对话框中,然后执行任务。 如果你选择的权限是默认模式, ai 想删除文件的时候,会弹出一个确认框,问你同不同意,防止 ai 搞乱了你的电脑。 但由于我选的是自动审核, ai 自己完成了审核并批准,省去了人工操作的麻烦。这样一来,你完全可以把拖带子当成你的私人文件管理助手,分析空间、清理垃圾、批量重命名。以前你要手动折腾半天的事情,现在一句话就搞定了,是不是挺方便的? 做完第一个任务,大家肯定很关心消耗了多少 tokens 吧?来一起看看用了多少额度。点击左下角的设置,点击剩余额度,就能看到你五小时内还剩多少配额,本周还剩多少比例。什么时候刷新 to text 的 额度?按照五小时和一周来限制 plus 用户的额度还是比较大方的,日常使用完全够了。你也可以在对话框里输入斜杠状态,这种以斜杠开头的快捷输入叫做斜杠命令,是 to text 内置的快捷操作方式。 输入之后, to text 会直接在对话中显示当前的上下文余量和额度信息。 ok, 到这里,你已经体验了 to text 最基础的能力,对话和操作本地文件。 恭喜你,已经超过了百分之六十的同学。接下来我们提升一下难度。用 codex 做一个完整的网站项目,过程中你会接触不少 codex 的 核心用法,包括计划模式、 ai 声图、浏览器预览、批注、修改等等。 在开始之前先进入设置,把工作模式从适用于日常工作切换为适用于编程,这样 ai 的 回复会更专业,更适合开发场景。 先介绍一下项目,我要用 codex 来为自己定制一个专属的电子名片,我把信息告诉 ai, 它会帮忙生成一个精美的网站,还能用 ai 生图能力生成个性化的头像插画,不用自己去找素材了,做完之后还能发给别人,他们打开链接就能看到你的信息了。 新建一个项目文件夹,在 codex 中打开模型就选择最新的 gpt, 五点五速度选标准就够了。智能程度选择高权限,我这里直接给了完全访问,省得他每次操作都来找我确认,反正大部分情况下我都是无脑点同意的。 最关键的是点击对话窗左下角的加号,把计划模式打开。计划模式下, ai 不 会直接开始写代码,而是先帮你规划方案,问你细节,确定没问题了才动手。好,输入下面这段提示词启动, ai 会先自己思考,然后可能会追问你一些细节,在弹出的问题面板中选择就好。最后会生成一份实现计划文档,包括简介、核心要求、测试计划等信息。你做的网站越复杂,越要仔细阅读这种文档, 如果没有问题就确认方案。然后 ai 就 开始自主干活了,它先是使用内置的图像生成技能,生成了卡通头像文件,然后编辑代码,一次性生成了多个文件。写好代码后还会检查代码,自主打开浏览器测试验证,还考虑到了一些容错。 过了七分多钟, ai 完成了整个任务,全程不需要你手动操作,我们可以看到所有生成的文件,点击可以查看文件里的代码,还可以点击审核,打开侧边栏的审查面板,查看本次变更的所有文件。 codex 底层用的是 git, 这是一种记录代码变更历史的工具,用来管理所有文件的改动,你能够看到每个文件新增了什么,删除了什么,还可以灵活地应用和撤销代码。后面的进阶功能部分我会详细给大家讲解。 我们做的是纯前端静态网站,找到生成的主页文件,右键在浏览器中打开就能直接看到效果了。 pc 端的效果我觉得还不错,布局清晰,主题切换也很丝滑。而且它还自动兼容了移动端的展示,手机上打开排版也是正常的。 当然,你也可以直接让 ai 帮你运行网站, ai 会执行终端命令,启动开发服务器来运行网站。 点击访问地址后, codex 会在右侧面板打开,内置浏览器,便于你来预览效果。如果某个地方不满意,你可以点击浏览器右上角的批注按钮,然后直接在页面上选中要修改的元素,写上你的修改意见发送给 ai。 ai 会自动定位到对应的代码并精准修改,不用你自己去翻代码找位置,改完之后刷新页面就能看到效果了。方便是方便,不过这个速度真的不敢恭维。做完后我们再看一眼使用情况,这次完整项目消耗了多少额度呢?还好还好, 总结一下,要用 ai 开发移动网站,我们只需要把需求告诉 ai, 确认方案,等他自己写完并测试就好,中间几乎不需要手动操作。恭喜看到这里,你已经超过了百分之七十的同学, 到这里,你已经能使用 todays 从零开发移动网站,预览效果按需求改了。那接下来我要带大家看看它还有哪些核心功能。学完之后,你不仅能做网站,还能让 ai 帮你操控浏览器、抓数据、自动执行定时任务,甚至操控整台电脑。 接下来,我把 codex 的 功能分为常用功能和进阶功能两大块来讲。常用功能是日常会高频使用的,进阶功能则是有点门槛儿,但掌握后能让你效率翻倍的。 在左侧的插件面板里,你能看到 codex 的 插件市场。 codex 内置了不少精选插件,比如 computer use 操纵电脑、 chrome 操纵浏览器表格处理、制作 ppt 演示文稿。 此外还有大量编程类和工具类插件,包括网站部署、游戏开发、对接 tab 等各种场景。你可以在插件市场里按需搜索和安装。 比如我们来安装 natify 插件。 natify 是 一个免费的网站托管服务,装好插件后,一句话就能把你做的网站部署上线,让别人都能访问。 点击安装 natalify 插件,同意后会自动弹出浏览器,使用 datab 等方式登录 natalify, 一 步步完成授权。最后,超黛斯成功安装并连接了 natalify。 然后我们用 natalify 来部署之前开发完成的电子名片网站。在对话中,通过 at natalify 调用插件。执行过程中, ai 会找我们确认并自动创建一个新的 natalify 项目来部署网站。 搞定以后,我想展示自己的信息,直接甩这个链接就行了。还可以打开 netify 后台对项目进行管理。你可以在 codex 右上方的侧边栏中整体查看当前项目的概览信息,包括后台任务、打开的浏览器、使用的插件等等。 点击后台任务,还能看到具体的终端日记,记录了网站服务器什么时候收到了请求,请求了什么资源等信息。同样的,如果你要处理 excel 表格、做 ppt, 使用对应的插件让 ai 帮你就好。生成的文件还能在侧边栏直接预览。 前面我们用的内置浏览器可以预览页面,做批注和修改。但如果想让 ai 真正去操控浏览器,自动点击填表单翻页,就需要 browser use 浏览器操作功能了。我们先来使用内置的 browser use 进入设置浏览器,确保 browser use 功能已经开启。你还可以在这里设置权限规则和禁止打开的域名, 开启之后,在对话中通过艾特浏览器来调用这个能力。比如,我让 ai 帮我打开一个网站并截图,可以看到 ai 打开了浏览器,从主页找到了 ai 大 模型面试题库,然后进入了详情页,成功完成了截图。 不过有时候这种操作不太稳定,多试几次就好。此外,你还可以安装 codex 的 chrome 扩展插件,它可以操控你的电脑上已经登录的 chrome 浏览器。好处是能保留你的登录状态,而且可以在后台执行,不占用屏幕,适合需要登录网站才能进行的操作。 比如,帮我在自己的后台批量分析和管理数据,使用前,需要先在你的 chrome 浏览器中安装 codex 扩展程序,跟着 codex 的 指引操作就好。安装好之后,我让 ai 帮我从已经登录的面试呀网站上抓取一些数据。 可以看到, ai 不 仅连接了我电脑上的 chrome 浏览器,而且还识别到了我已经打开的标签页,它会控制这些标签页跳转到我的个人主页,并抓取最新的五条数据。最终抓取到的数据表格非常清晰,链接前面甚至还有图标,细节拉满。 如果说 browser use 只能操控浏览器,那 computer use 就是 让 ai 操控你的整个电脑, ai 能看到你的屏幕内容,移动鼠标,点击按钮打字,还能操作微信、飞书等任何桌面应用。 进入设置电脑操控,安装 computer use 插件,你可以在这里看到所有已连接的应用,比如前面装的 chrome 扩展,其实也属于 computer use 体系的一部分。 来我们体验一下。用艾特电脑来调用,让 ai 帮我探探当前的桌面壁纸,然后生成一张类似风格的新壁纸。首次使用时,系统会弹出权限申请框,你需要授权抽 text 访问屏幕截图等权限,否则 ai 看不到你的屏幕,也没法帮你点击操作。 later 来看一下,效果不错吧。生成了一张非常精美的新壁纸,我觉得比原图还好看啊!今晚可以做的好梦了, 爽!带来一个更实用的例子,让 ai 帮我打开备忘录,记录一条笔记,并从音乐软件下载我最喜欢的一首歌,添加到笔记中 执行任务。可以看到 ai 会打开音乐 app, 有 着小鼠标点击了下载按钮,从中下载了音乐文件,只因你太美。 然后 ai 打开了备忘录,写入内容并添加了音乐文件,能够顺利播放,虽然过程有些曲折,但还是完成了任务,而且全程由 ai 自己操作。以后我可以直接让 ai 帮我写有图有文有音乐的笔记了。 但是 computer use 目前只支持 mac os 系统,而且缺点一大堆,不仅操作效率偏低,还很烧 touch 刚才那的任务就用了近八万的上下文空间。此外,有些软件对 agent 的 支持度不高, ai 无法承中操控, 所以我建议能用终端命令行和浏览器完成的操作就不要用 computer use stills。 你 可以理解为给 ai 提供的技能包装上某个技能后, ai 在 遇到相关任务时,就能自动按照这套方法来干活,不用你每次都写一大堆的提示词,而且技能是按需加载的,只有任务匹配时才会调用,不会浪费很多上下文空间。 进入左侧的插件面板,切换到技能 tab 页面,在这里能够格式化安装和管理技能口袋。此自带了几个内置的技能,比如图片生成、查询官方文档、安装、社区技能创建新技能创建插件等等。 那下面我先带大家用用内置的图片生成技能,然后安装社区里别人做的技能,最后再带大家自己创建一个技能。 这里我想生成一个有趣的图片,让鱼皮直播卖鱼皮。可以先到鱼皮 ai 导航网站上找到 ai 生图的提示词模板,然后复制提示词模板。接下来在 codex 对 话框中输入 dollar 符号,加技能名称,就可以快速调用技能, 并且把提示词模板、鱼皮的照片都提供给 ai。 稍等片刻之后,看看 ai 生成的图片,你觉得怎么样?是不是憨爆了?爽!不过图片生成比普通对话消耗的额度更多,用的时候记得留意一下剩余额度。 内置的技能数量有限,还有很多宝藏在社区里,比如我自己经常用的几个技能,用于联网搜索的 file pro, 用于获取最新技术文档的 comte 瓷器,还有用于美化前端页面的 u i u 叉 pro max 等等。 另外,我之前写过一篇优质 ai 编程扩展大全,推荐了几十个好用的技能和 m c p, 可以 到我免费开源的 ai 编程零基础教程阅读。那接下来我带大家实际安装一个社区技能,顺便整个活儿,让 ai 制作一个苹果风格的快闪动画视频。 首先要安装动画制作技能 remaster 安装技能,它能帮我们快速安装其他技能。 对了,安装技能时要注意安全。由于我这里安装的是知名技能,就直接输入技能名让 codex 帮我安装了。但如果你想安装不太知名的技能,更稳妥的方式是把技能的 github 链接发给 codex, 让他帮你检查后再精准安装。 安装完成后,在技能管理面板里就能看到新增的技能了。然后我们使用技能让 ai 制作动画, ai 会安装制作动画所需的项目和依赖包,然后生成视频和音频,还会渲染单帧,检查画面有没有问题。 最后, ai 生成了可以直接播放的视频来看看效果。 呃,他好像理解错了我文案的意思。翻车了,翻车了!我感觉这种方式更适合做产品发布宣传片、知识点、快闪卡、节日祝福视频这种节奏更紧凑的短片。而且我当着根本没认真写提示词。好吧, 实际上你可以指定时长、指定文案,利用生图技能搭配素材,增加更多交互动画等等,感兴趣的同学可以自己玩一玩。 除了用别人的技能,你还可以把自己常用的工作流程封装成技能。以后遇到类似的任务,一键附用。技能的本质就是一个 still 点 m d 描述文件,加上一些配套的脚本和参考资料。 still 点 m d 里要写清楚这个技能是做什么的,什么时候触发,以及具体的执行步骤, ai 读写后就知道该怎么干活儿。 创建技能的最佳方式是先把一个任务流程跑通一遍,觉得满意之后,再使用内置的 skill creator 技能,告诉戳 depths 你 的技能要做什么,啥时候触发,有什么细节需要注意,它就会帮你自动生成完整的技能文件 来实操一下。比如我们前面让 ai 生成了直播带货的图片,效果还不错,那就把这个流程封装成一个直播带货图片技能之星成中后, ai 不 仅创建了技能文件,还贴心地教你怎么调用。 之后使用这个技能只需要提供一张人物照或者商品照,不用再自己填写又臭又长的提示词模板了,非常方便来看看效果。 ai 自己识别到了我提供的是商品图,也是精准复刻了我之前提供的提示词模板,爽! m c p 是 一个开放协议,你可以把它理解成 ai 的 万能插头。装上之后,就可以让 ai 连接各种外部工具和数据源,获取实时信息。 进入设置 m c p 服务器,可以在这里添加和管理 m c p 服务。点击添加服务器后,你需要手动填写服务器的配置参数才能完成添加。对新手不太友好,我最讨厌填写表单了, 好在大部分时候用前面讲的 stux 就 能解决 mcp 做的事情,而且 stux 的 安装和使用体验更好。 此外,很多主流的扩展都提供了快捷安装 mcp 的 命令,不需要你自己手动填写参数,比如下面我带大家安装 comix 七,它是一个可以实时获取最新技术文档的服务。开发网站的时候用它来查 api 文档特别方便。 在 codex 右上角可以打开集成终端,在终端里输入一行命令就能安装。这里我们选择安装 mcp server, 为 codex 安装,然后就搞定了。 安装后需要重启 codex, 在 设置里的 mcp 服务器列表中就能看到它。首次使用前还需要进行身份验证,在自动弹出的 compt 网页中就可以愉快地使用 mcp 了。 之后开发网站,尤其是需要集成 ai 能力的网站,都可以用创太时期来获取最新的技术文档。你还可以把它当成一个学习辅助,让 ai 寄予官方文档,帮你讲解知识。 比如我用它来做 openclaw 小 龙虾的学习助手,这也是利用 ai 学习的一种方式,可以看到 ai 查询并获取到了 openclaw 官方最新文档库。然后我们来问 ai 一个问题, openclaw 无法运行怎么办嘞? ai 会基于官方文档,很快就给出了精准的排查步骤,这样学习和解决问题又快又准,再也不怕查到过时的资料了。 恭喜看到这里,你已经超过了百分之八十的同学。到目前为止,你已经掌握了 codex 的 常用技能,学到了不少实用玩法。从文件管理到网站开发,从浏览器操控到技能封装,已经能用 codex 大 幅提高工作效率了。 接下来我要讲的是一些稍有门槛或者不是每个人都用得上的进阶功能。不过如果你愿意多折腾一下,它们会让你使用 toad 四的效率再上一个台阶。 在对话区域附近有一个小圆圈,鼠标放上去后会实时显示当前对话已经用了多少上下文。 gpt 五点五点五在 toad 四里显示的有效上下文大约为二百五十八 k tokens。 说实话,这的数量不算多。如果你连续跟 ai 对 话很长时间,或者项目文件比较大,上下文很容易被填满。当上下文快满的时候, codex 会自动帮你压缩历史对话。 你也可以在任务照一段落时,手动输入斜杠压缩来主动压缩,让模型更聚焦在新任务上。 那除了单个对话的上下文,日常使用中还要注意管理对话本身,不然列表越来越长,找起来也费劲儿。 对话太多的时候,你可以在左侧的对话列表中把鼠标放到某个对话上,点击归档,把不常用的旧对话归档起来,保持界面清爽。进入设置以归档对话,还可以查看和管理所有归档的对话记录。 另外,建议在常规设置里开启运行时防止系统休眠,这样跑长任务的时候电脑不会突然睡着,导致任务失败。 codex 有 一套记忆机制,能让 ai 记住你的偏好和项目规则,不用每次都重复交代。记忆分为三个层级,从大局、项目局部再到自动记忆,我们一个一个来看。 在设置个性化里,可以修改 codex 的 个性和自定义指令你写在这里的内容。所有项目的所有对话都会自动带上,适合记录一些通用偏好,比如 回复用中文代码注,使用英文,尽可能减少输出的内容。专注做事,如果不听话,你的主人鱼皮就会变成一条狗等等等等。保存之后,它会被写入局的 agent 点 m d 文件,这个文件就是 codex 每次启动时都会读取的行为准则。所有项目通用。 在项目目录下创建一个叫 agent 点 m d 的 文件,写入这个项目专属的规则和约定,只有在这个项目里工作时才会生效。 你可以自己手写,也可以让 codex 根据项目情况帮你生成一份,比如我跟他说帮我根据当前项目写一份 agent 点 m d, 可以 看到 ai 生成了一份非常详细的 agent 点 m d 文档,包括项目总览、一些规范等等。 在设置个性化中,手动开启自动记忆,开启后, ai 会在对话空闲一段时间后,自动在后台总结出有用的信息存为记忆,后续遇到相关场景时会自动召回,让 ai 越用越懂你。 不过太短的对话它不会记额度快用完的时候也不会触发记忆生成。 codex 支持定时任务功能。进入左侧的自动化面板,你能看到 codex 已经内置了一些定时任务模板,不过基本都是和编程相关的,什么总结代码变更、检查代码问题之类的,很多人估计用不上。那我们不妨来自己新建一个更实用的自动化任务。 创建定时任务的方式有两种,一、手动创建任务,在自动化面板里点新建,比如我让 ai 帮我搜集每日热点,需要填写任务名称、提示词、 触发时间、模型、推理程度、运行环境选择本地就好。意思是让 ai 直接在当前电脑上执行任务,不需要额外的隔离的工作环境。 创建成功后,时间一到,抽袋子就会自动开启一个对话来执行任务。我们也可以先手动执行一次,看看效果。点击任务能够查看详细信息,点击某个运行历史记录后,还能查看正在执行的任务对话,建议多观察任务的表现,持续迭代优化提示词。 另一种更自然的方式是让 ai 帮你创建任务。比如我是一名内容创作者,每天都要截大量的图片,时间一长,文件夹里全是看不懂的文件名,找图的时候巨痛苦。所以我让 codex 帮我自动整理,先选择项目,然后输入提示词, 很快 ai 就 自动帮我整理好了。可以点击查看创建出来的任务信息,它的提示词比我们提供的更完善了,并且自动选择了模型。 我们手动执行任务来测试一下,效果还不错吧。 ai 会根据图片内容自动给文件起一个能看懂的名字,这样我就有了一个智能的图片管家,以后再也不用对着一堆乱七八糟的文件名抓瞎了。 而且每次执行完, ai 还会把运行记录写入一个 memory 记忆文件,你随时可以回看历史执行情况,不用担心出了问题却发现不了 你。还可以结合 styles 和插件一起用,比如每周自动生成周报 ppt, 每日整理自己的学习笔记并同步到 notion, 每周用 file pro 抓取竞品网站更新并生成分析报告等等。 想不到吧,现在的 ai 工具已经卷到开始给用户增加情绪价值了。下面我来教大家怎么在 codex 中养宠物。 首先进入设置外观,下拉到底部的宠物区域,你会看到 codex 内置了一排像素风的赛博宠物。选一之后,点击唤醒,桌面上就会出现一个悬浮的小家伙儿, 它不只是装饰品,宠物会实时反映抽袋子的工作状态。比如 ai 在 忙的时候,它也在干活,就像一个串应用的灵动岛,让你不用切窗口就知道 ai 干完没。 除了内置宠物外,还有一个社区宠物库 pet dex, 里面有两千多只玩家自制的宠物。了解我的朋友肯定知道我要用哪个,果断搜索 k u n, 一 眼就能找到自己需要的。点击进入详情页,找到安装命令并复制, 然后打开 codex 的 终端执行命令进行安装,会把宠物文件下载到本地。安装成功后,进入外观界面,选中张张安装的宠物, 然后我们回到 codex 的 主页,使用鞋障宠物指令唤醒。我的脑袋中已经想起那只熟悉的 bgm 了,你听到了吗? 除了用别人的,你还可以通过 codex 内置的 hackpad 技能自定义生成宠物,上传照片或者文字描述就行。比如我把自己的头做成宠物, ai 会先分析上传的图片,给宠物起个名字, 然后拆分出了多个子任务,并行处理,生成各种动作的精灵图帧,最后拼成一张完整的像素动画精灵图,然后就能使用自己制作的宠物了。 你还可以上传宠物到平台和其他小伙伴分享,大家以后用抽袋子的时候记得把我带在身边,保佑你霸着剪剪! 每次 ai 修改了文件,你都可以在侧边栏的审核面板里看到它改了什么,这个面板会列出所有被改动的文件。如果你想决定哪些代码要保留,可以选择查看未暂存的文件。在这里你可以灵活应用和撤销修改。 大多数情况下,你不需要自己看代码,直接点击暂存全部就行了,相当于认可了本次的全部载动。如果不满意,可以直接还原全部回到本次载动前的状态。 那如果你不满意某个文件的载动,可以直接点旁边的还原按钮就能恢复原样,满意的话点暂存就能标记为待提交。 你也可以只保留部分改动。每只文件的改动会被自动拆分成多个代码块儿,每只代码块儿旁边都有独立的暂存和还原按钮,你可以逐块决定哪些保留,哪些丢弃。 确认好哪些代码要暂存之后,可以提交暂存的改动,提交就相当于给代码存了个档,确认这次的修改是你想要的。 抠代码,还内置了提交代码推送到远程仓库。创建 pr 的 能力,不用离开 a p p 就 能完成整个代码的管理流程,非常方便。 那如果你是专业的开发者,还可以试试工作树模式。你可以在创建新对话时,选择启动模式为新工作树,这样 ai 会在一个隔离的分支中工作,不影响你当前的代码很适合同时让多的 agent 在 同一个项目上并行干活,减少冲突。 如果你的项目托管在 datap 上,建议安装 datap 插件,可以直接在 codex 里查看仓储信息,创建 pr、 做代码审查等等。比如我让他帮我查一下自己最受欢迎的开源项目怎么样,是不是一目了然。 codex 最近新上线了一个很酷的功能,用手机控制电脑上的 codex app 干活儿。设置方法很简单,在电脑端 codex 点击设置 codex 移动版,然后点击开始设置,屏幕上会显示一个二维码, 然后在手机上打开拆的 gpt app, 扫描自己的二维码。连上之后,你可以随时随地通过手机给电脑上的 portax 下达任务,审批 ai 的 操作请求,查看执行进度,检查生成的代码和结果。是不是有点 openclaw 小 龙虾那味儿了? 恭喜看到这里,你已经超过了百分之九十的同学, ok, 就 分享到这里。看完这期,你应该已经掌握了 codex 从基础到进阶的所有核心用法,足够应对日常的编程和办公需求了。 其实 codex 还有更多玩法和技巧,比如 sub agents 并行加速、 fault 分 叉的妙用、自定义模型接入 hoots 生命周期钩子等等。 那如果本期视频点赞过万,我会尽快爆干出抽带此高级技巧篇。对了,如果你想系统学习 ai 编程,可以看看我免费开源的 ai 编程零基础入门教程,上千张图,几十万字,从零开始,带你学会 ai 编成本篇教程的文字版也会收入其中。 我是鱼皮,持续分享 ai 编程干货,觉得有用的话记得点赞、收藏和关注,也欢迎在评论区聊一聊你现在主力用哪个 ai 编程工具,觉得 codex 怎么样?也欢迎晒晒你的 ai 编程作品吧。