用 codex 干了三个月,踩了不少坑,今天把沉淀下来的八条铁律一次讲清楚,每一条都是真金白银换来的,新手照着做,至少省半年时间。 第一条,永远先 plan, 再 execute, 需求一上来就让他干活,跑偏概率超过一半,先让他输出方案,方案对了再执行,省下的时间是几倍的。这一条就指你看完整条视频。第二条, agents 打 md 是 项目的灵魂, 没写这个文件的项目,等于让新员工每天重新自我介绍,把项目结构、技术栈、命名、规范禁区都写进去, codex 的 产出质量立刻上一个台阶,这是投入产出比最高的一次性动作。第三条,用优乐模式,必须在 word tree 或容器里,直接在主分支放飞自我,迟早出大事。隔离环境是底线,这一条比任何技巧都重要,宁可慢一点,也不能跳过。 第四条,地府永远要看在自动的流程合并前,那一眼必须是人看的。这不是不信任 codex, 这是基本的工程纪律,别因为用了 ai 就 丢掉这个习惯。第五条,长任务主动调用 compact, 上下文超过六十 k 之后回答质量直线下降。学会在合适的时机压缩历史,是保持智商的关键操作,不要等到他开始胡说八道才反应过来。第六条,把 codex 当初级同事,不是当工具,工具不会失误,但同事会 你要做 code review, 要给反馈,要教他项目规矩,关系建立起来,产出就稳了。第七条,拿不准就开新绘画,死磕一个跑偏的绘画,越改越乱,越乱越改,恶性循环,果断撒神 new, 从头清晰说一遍,比硬 new 快 十倍。 第八条,学会让他停下来,遇到边界拿不准的地方,主动让他先问你,不要让他自己拍板做决定。这一条让我反功率直接降了一半,是性价比最高的习惯。八条铁律全在这,每一条都是用返工时间换来的,建议直接收藏。
粉丝5032获赞3.0万

我真的每天活活要被 codex 急死了,我就今天一上午啊,我让他改两个网页,他足足给我改了两到三个小时,真的把我气死了。我 记得我以前用 cursor 啊,或者用那个 cloud code 的 时候,我有时候改一个网页,他就只花半个小时二十分钟,但是 codex 我 感觉他把工程性和完整性看得太重要了,以至于他在速度上的劣势太明显了。就经常我用他做一个功能,就是一个小时起步或者大半个小时起步。 在以前我还可以勉强接受它的一个速度的劣势是因为它的完整性做的是比较好的,但是我现在明显感觉它的 g p t 五点五好像有点降质了, 就是我今天同样给它一段提示词啊,我发给就是 codex 的 g p t 五点五,然后我再发给 opus 四点七,我明显感觉那个 opus 四点七做出来的设计感呀,网页交互 远远优于 g p t 五点五,但是我在半个月之前测试的时候是没有这么明显的,所以我不知道大家有没有这种感觉 g p t 五点五降至的体验啊。

codex 就是 我们普通人现在能接触到的门槛最低,世界最顶级的大模型了。没有质疑,可能你会说 cloud 不 强吗?强,但是对普通人来说真的很难用上,动不动就封号啊,这个那个的。但 jimmy 呢?又差点意思。 codex 完全没有这些问题,它的稳定性要强于 cloud, 它的 g u i 又强于 jimmy。 那 codex 是 什么?官方的解释就是一个编程的工具。但是我跟你说,如果你就只把它当成一个写代码的东西,那你就太小看它了。 如果你是做自媒体的,让他把你搭建个内容库,把你过去写过的爆款的文案呢?按照类型,结构,情绪全都拆解规档。如果你是做生意的,让他帮你写个销售页面,分析你的用户是谁, 把内部乱成一锅粥的这些流程梳理清楚,以前都要花钱请人来干的,但现在你一个人就能搞定。 黄仁勋就是英伟达的老板,他让所有员工都用上了 codex, 为什么?因为他看到了一件我们大多数人都没看到的事情,就是 codex 它不只是一个工具,它是下一代工作方式。我认为每个时代都有每个时代的信息差和红利, codex 就是 现在这个时代的信息差,它能实现让 ai 真正成为你的杠杆,放大你的生产力,真的。

很多人用 codex 做周报,第一步就做错了,他们一上来就说,帮我写一份周报,这样确实会得到一段很像周报的论文。但问题是,这段论文很难验收。你不知道哪些事实来自会议纪要,哪些责任人是他推出来的,哪些风险只是顺手补上的。这期只拿一个场景做完整案例, 用 codex 把一份周报资料包变成老板能看的周报草稿和检查清单。第一步,先做资料包,你准备一个文件夹,里面放三类东西。 第一类是会议纪要,记录发生了什么,谁提了什么问题,有哪些代办。第二类是项目进度表,至少要有事项负责人进度和截止时间。第三类是上周周报告诉 codex 你 原来的格式、管理口径和表达风格。 这一步的重点在于把输入固定下来,资料数量反而是次要问题,输入固定后面才知道输出有没有编造。第二步, 不要只给一句聊天指令,给 codex 的 任务要向一个项目 brief。 你 可以写,先检查 input 文件夹,列出缺失信息,再按本周进展风险问题,下周计划生成周报大纲,然后输出周报草稿,最后付一份人工验收 check list。 这样写的好处是, codex 不 只是生成一段话,而是按步骤完成一个小项目,它会先理解资料结构,再组织内容,最后把需要人确认的地方单独列出来。 第三步,让 codex 输出交付物。一个好的结果至少应该有四个东西。第一,周报大纲让你先看结构对不对。 第二,周报草稿用老板能快速扫读的语言写出来。第三,风险清单,把口径不一致、责任人缺失、截止时间不明确的地方标出来。第四,验收检查清单提醒你逐项确认事实、数据、责任人和风险判断。这就是 codex 适合的用法, 把资料包变成可交付、可检查、可附用的文件。第四步,最后一定要人工验收, ai 能帮你读资料归类、抄和检查遗漏,但不能替你承担管理。判断。周报里最危险的问题是事实不准,语言是否漂亮,反而靠后。 责任人写错、截止时间写错、风险影响写清了,都会让周报失去价值。所以你要按检查清单看四件事, 事实能不能回到原始资料,责任人有没有人工确认、风险有没有影响和下一步动作 栽要和执行清单有没有分开。这套方法可以沉淀成一个固定模板。输入是会议纪要、项目进度表和上周周报,任务是先检查缺口,再生成大纲,最后输出文件。验收是事实可追溯、责任明确、风险可执行。 以后每周做周报,你不需要重新想怎么问,只要替换音库的文件夹里的资料,再附用这份任务说明,就能得到更稳定的结果。 如果你今天想开始,不要直接拿公司的敏感材料式,先做一个低风险版本,新建 weekly report pack 文件夹,放入会议纪要、项目进度表和上周周报,写一份 codex 输出周报草稿和检查清单。 最后,你亲自确认事实、责任人和风险。普通人用 codex 的 正确入门方式是让他按项目流程交付一个能验收的结果。

hello, 大家好,我是阿亮,这期视频呢,教大家如何把 codex 接入国产模型,比如说接入 deepsea codex 和 cloud code 呢,不一样,它不支持修改配置文件来切换模型。最初呢,我也是想直接用其他的工具来接,比如说 c c x, 但是折腾了很长时间,发现问题比较多,也很复杂,所以呢,就自己动手来搞定的一个专门的工具, codex 杠 switch, 用这个切换 codex 的 模型就方便多了。接下来呢,就照着我整理的这份 codex 文档,一步一步带大家操作。 首先点击文档中的 codex 杠 switch, 跳转到下载页面,根据自己的电脑 选择安装包。下载后呢,双击打开,我们就以 deepsafe 为例,这里选择 deepsafe, 然后点击这里到 deepsafe 官网去申请 k, 这里有每个模型的申请 api k 的 链接好,点进去呢,就是开放平台,点击 api case, 创建 api k, 然后把拿到的 k 复制到这里就行了。然后点击蓝色按钮,这个时候呢,就切换成 deepsafe 模型了,现在呢,需要重启 codex, 记住这里一定要把 codex 关掉,重新启动, 可以看见这里的模型变成了 deepsafe, 输入一条消息试试,如果它有回复说明呢,就接入成功了。 点击红色按钮,也可以一键切回官方的 jpt 模型。注意切换后必须重启。 codex 这个小工具呢,目前支持主流的啊,国产模型也可以自定义模型,每次启动 codex 前呢,把这个工具启动了,就可以顺畅地用国产模型了。 这一期呢,我们主要是想要通过一个案例带大家整体走一遍流程,更熟悉这个扣带子的使用。很多人觉得呢,做一个案例或者做一个东西之前呢,要先想清楚做什么功能啊,有什么样的风格等等吧,就想了好久好久。其实我们根本没必要 给他最简单的提示词,让他呢先做一个东西出来,然后我们再挑毛病。好了,接下来我们直接开始 新建一个项目文件夹,直接命名为汉堡店,然后新开一个对话,添加新项目需求呢,就一句话,帮我做一个汉堡店的网页回车 codex, 自己理解,自己拆任务,自己给方案,它还可以自己的生图,因为它接入了目前最好的模型啊, gpt 杠一, mate 二,这个是最好的生图模型,我也没仔细看啊,先让它跑一半问出来再说。 哎,过了一会呢就出来了,但是我发现他的主页呢只有一张图片,这样感觉真的是太干了,餐厅也没有什么特色,我想每天都有一个的特色汉堡啊,以一周七天来循环,让他来修改 主视图,图片改为五张图片轮播,设置每天的特色套餐,每日的优惠套餐以一周为一个单位啊,一周为一个周期。每天的菜单呢,可以点击观看,并且每个套餐呢都有相应的配图。 顺便再说一下, codex 是 内置了当下最牛的生图模型,一面之杠二点零模型,比香蕉呢强了不少,改好了来看看效果啊, 这是汉堡店店内环境呢,是必须要有的,然后我输入加入醒目的店内环境图片,分别有,后厨的呃,制作区,冷藏区,前台用餐区,卫生区,冰激凌帐。每个区域呢都有至少两张图片,图片看起来是在同一家店。 好的,等会效果还不错。我们新开一个对话,打开计划模式输入,把这个项目改造成 next js 框架。如果你不知道 next js 是 什么意思,可以再新开一个对话,问他什么是 next js, 然后使用 codex 内置浏览器,我们点开批注按钮,这样的话,你想改哪里啊?直接就能在这里改。比如我想让这个汉堡的价格是零,直接点击这里,价格改为零, 想改哪里呢?都可以在这里直接进行修改。但如果你想让别人也可以打开这个网页,只需要打开 codex, 问他怎么让别人也能打开这个网页。这个也算是给大家留一个作业啊。总之一句话,遇到不会的或者不懂的就去问 codex, 把我们的思路一定要转变过来, 大家有兴趣呢,也可以去尝试着做一点自己的东西。 ai 时代,我们用 ai 工具呢,最主要的就是用来创作,然后提升自己的效率,让我们成为一个 maker。 好 了,这期视频呢就到这里,下一期我们再继续讲 codex, 大家点点关注哈,跟着阿亮学 ai。

codex 到底是什么?它到底能干嘛?到底什么样的人才会用到它?不是程序员到底能不能用?不会写代码到底能不能用?本来呢,昨天我想出一个基础教程,结果没发出去,现在呢,我就简单口述一下。 首先我要说一下,不一定非得要用 codex, 我 说 codex 就是 指 codex 这一类工具,其实还有很多种工具,比如说像最近开源界比较火的 open code, 像字节出品的 tree, 还有像 carson 等等等等都可以。我只是拿 codex 举个例子,那 codex 到底是什么呢? codex 一 句话总结就是它是 gpt 的 亲兄弟, gpt 呢,就是用来聊天的,而 codex 呢,就是用来干活的。它能干什么活呢?现在能干的活非常多,如果你现在还花大量的时间去做 ppt, 你 现在就可以把这些任务丢给它。现在 ai 做 ppt 能力已经非常强了,我之前做过一次测评, ai 现在直出的 ppt, 简单修改一下,基本上就能够汇报,它还可以帮你做视频,其实我的很多视频都是 koex 或者是 cloud code 帮我做的。 koex 现在能帮我省掉很多剪辑工作,比如说你的电脑驱动坏了,你不知道怎么修,你现在就可以让 koex 帮你修一下,你还可以让 koex 做一个个性化的简报, 如果你真的有想法,你还可以做一个网站,做一个 app。 我 上面说的都是 koex 能力的冰山一角。那 koex 适合什么样的人群? 会写代码?到底能不能用 codex? 很多人以为啊, codex 这类软件就是一个非常专业的软件,这可能是最大的误解之一,你可以问一下你周边程序员的朋友,看看他们现在还写不写代码。今天刚刚刷到谷歌帝麦的研究员姚顺宇的播客, 他说现在大部分项目都不用写代码了,全部都在用 ai coding。 更主要的是像 codex 这类工具,它的使用难度绝对不会比豆包高,当年我学 cad 画图还学了好几个月,才能勉勉强强上手。 而现在的 ai coding 软件,基本上几天的时间就能够学会,最重要的是它不是一个很枯燥的软件。很多人开始 ai coding 之后,它现在连游戏都不玩了, 每天都在等着额度恢复,因为它很容易让你有一个 builder 的 感觉。 codex 其实它的能力跟它的竞争对手 cloud code 还是有一定距离的。 cloud 它更像是一个谋士,在你不知道干什么的时候,它会帮你出主意,而当你确定了想要干什么的时候,并且做好这些规划的时候, codex 就 会派上用场了。它更像是一个总经理,它会帮你认真的完成这些工作,所以两者要结合起来用。

让 codex 写测试,用力十次有八次,第一遍就交差,跑起来全是无效,断言覆盖率上不去,看上去测了一大堆,其实啥都没测,不少开发者。第二步,直接跳过了 完整的五步法,挨个走清楚。第一步,先把主流程跑通,让 codex 看明白这个函数正常情况下输入什么,输出什么,走哪条路径。 主流程的测试是底线,没这个其他都白搭。第二步是关键,也是大部分人跳过的一步,要手动列出边界条件,空值超长,输入并发场景异常,分支特殊自扶。这一步不能让 codex 替你做,因为他不知道你的业务边界在哪,业务边界只能你说。 这一步偷懒,后面所有测试都立不住。第三步,未让利数据,把真实的测试数据格式贴给他,而不是让他自己造,自己造出来的数据往往跟生产环境对不上,测试通过了也是假的。第四步,让 codex 补 corner case, 基于你给的边界条件让他推演,还有哪些极端情况没覆盖, 这一步他擅长,因为他能穷,举的比你细。第五步,跑覆盖率工具,看哪些分支还没测到,再让 caltex 补一轮,直到达到你设的覆盖率门槛。这套流程跑下来,生产环境的 bug 量会下降一截, 代码上线后的稳定度也会有体感差异,你写测试时是不是也跳过了第二步,评论区聊聊。

很多人第一次用 cortex, 都会经历一个阶段,一开始觉得这东西太强,但后面又觉得怎么越来越难用了?最后很多人得出一个结论,模型不行。但其实很多时候,问题不一定是模型, 而是你的 ai 工作流有问题。呃,很多人现在怎么用 cortex 呢?其实非常简单粗暴打开,嗯,直接开聊,然后,嗯,加功能,改 bug。 patch, patch, patch。 整个 session 一 路硬写,看起来很高效,但实际上这个过程非常容易失控,因为 ai 并不擅长无限持续混乱开发。核心问题有几个? 第一个是没有 task boundary, 很多人什么都在一个 c 型里做,嗯,比如修 bug, 改架构,做 ui, 写测试,调 prompt, 全部混合在一起,结果上下文越来越乱,最后 ai 根本不知道当前真正目标是什么。 第二点是没有 plan。 很多人想到什么就直接让 ai 改,但在复杂的工程里,嗯,没有 plan 其实特别危险, 因为 ai 会不断局部修复,最后派去越来越多,整个系统越来越不可控。 三、没有状态管理这是很多人忽略的问题。 ai 本身其实没有真正长期稳定状态, 它只能依赖当前上下文。所以如果你不主动管理当前目标,当前阶段、当前约束, ai 很 容易把旧信息、错误方案、历史 patch 全部混合在一起。 真正长期使用 context 的 人,其实已经开始管理工作流了。比如 task allocation, 一个任务一个 session, 不要无限续聊, step execution, 先规划,再分步骤执行,而不是一一口气让 ai 改整个系统。 summary 阶段完成后,主动总结,重新开始新的上下文 plan 复杂任务,先让 ai 做 plan, 确定没有问题, 再开始写代码,这其实已经非常接近真正的软件工程,这就是普通用户和工程化用户的一个区别。 呃,在往后呢,很多,嗯,长期使用 cortex 的 人,甚至,呃,还会管理项目上下文工作目录 roles 呢?忽略文件, a j s 文件,呃,因为他们已经意识到 ai 编程不是聊天,而是 cortex engineering。 我 们来展示一下忽略文件吧。 嗯,这就是 cortex 的 一个忽略文件,其实跟 get 的 忽略文件意思是一样的。 呃,然后还有一个 excel 的 文件, excel, 嗯,这是 excel 的 文件。如果你的项目很复杂,呃,有很多模块的话,也可以在模块下面放一个 类似的一个文件,用来管理当前的模块,然后根目录下面的这个文件呢,是管理整个项目的, 呃,所以很多人用不好 cortex。 问题不一定是模型,而是还在用聊天的方式做工程。真正重要的能力其实是 ai 工作流管理。这里是 cortex 工程实践。 下一期,我们继续聊,为什么大仓库加全量上下文会让 ai 编程直接崩掉?

一个不看项目就直接改代码的 codex 才真的危险。很多人第一次用 codex, 以为它和普通聊天一样,你说一句它直接给你一个答案,其实不是。 codex 更像一个会在项目里边儿看编作的 agent, 它不是只靠嘴回答,它会读文件,搜代码,改文件、跑命令,看结果,然后继续调整。 所以你看到它先搜索,先打开文件,先看配置,不要觉得它在绕路。理解 codex 的 工作方式,先记住五个词, thread、 workspace、 tools、 patch、 verification。 第一个是 thread, 也就是当前这次任务绘画,同一个任务尽量放在同一个 thread 里做。你前面让它读过什么,它已经判断过什么, 都会影响后面的动作。比如前面已经分析过登录模块儿,后面再让他改登录按钮,他就能接着前面的上下文继续走。但如果你新开一个绘画,他很可能要重新读项目,不是他变笨了,是上下文断了。 第二个是 workspace, 也就是 codex 当前看到的工作区,它能看到哪些文件。首先看你打开的是哪个目录,它能不能改文件,能不能跑命令,还要看当前权限和模式。新手每次开始任务前,都应该先确认这两件事,可以直接问他一句,让他先报告工作区和文件,再说后面要不要动手。 这句话能防住很多问题,目录开错了,后面做得越多,错得越远。第三个是 tools, codex 会调用工具,读文件是工具,搜索是工具,编辑文件是工具,运行测试也是工具,你不用害怕它用工具。 真正要看的是他有没有先说明理由,用完以后有没有根据结果调整判断?如果他没看文件就开始下结论,你可以打断他,让他先去搜相关文件,而不是凭项目惯例猜路径。第四个是 patch, 也就是他真正改了什么 codex。 改文件时,重点不是他说了什么,而是他改了哪些文件。 一个小需求,如果突然动了十几个文件,就要停下来问清楚。你可以让他按文件说明这次为什么必须改,把非必要改动收敛到最小范围。 第五个是 verification, 也就是验证,改完不验证就不算结束验证。不一定每次都跑全量测试小任务,可以跑 link, 跑类型检查,或者给出手动验证步骤,但他必须说清楚用什么证明这次改动真的成立。你可以在任务一开始就写完成标准,让他最后按这个标准来交付 行为符合需求,只改必要文件,跑过相关检查或者说明为什么没跑。最后把改动验证剩余风险分开讲清楚。一个健康的 codex 工作流大概是这样,你说帮我修复登录按钮,点击后无响应的问题,它应该先找登录页面和按钮实现再查。点击事件 表单,提交接口调用和错误处理,确认原因后,只做最小必要修改。改完以后跑相关检查,或者说明项目里没有可用检查命令, 最后再告诉你改了什么,怎么验证,还有什么风险。这就是 agent loop。 真正要学的不是把每一步背下来,而是看它有没有跑完整个闭环。 如果它只给结论,没有读文件,风险高。如果它只改代码,没有验证,风险高。如果验证失败了,还说已经完成,风险更高。每次任务你都可以用三个问题卡一下它,你是根据哪些文件判断的?这次修改的最小范围是什么?你怎么验证它真的好了? 这三个问题很朴素,但很管用。看 codex 的 工作日记时,不要只看最后一句完成了,你要看中间有没有证据链。一个靠谱的证据链通常是先说要查什么,然后真的去搜文件,再引用具体文件和函数,接着提出原因,做最小修改,跑相关检查,最后把改动、 验证风险分开,说少了哪一环就要追问。比如他没搜索,就说大概率是某个原因,这是猜,他没看测试命令,就说测试通过,这是不可信。他改完只说已完成,不说动了哪些文件, 这是交付不透明。所以这一期只记住一个判断, codex 不是 一次性给答案的机器,它是一个会在项目里循环观察和行动的 agent。 你 要做的不是催它快点答,而是让它每一轮都更接近一个能验证、能交付的结果。这期先到这儿,你还想让我继续展开,哪个点丢到?

代码的目标功能怎么开?什么样的任务适合开?用第三方模型能不能用这个功能?怎么保证目标模式完成的任务的质量?怎么给他权限? 这是我上个视频评论区关注最多的一些问题。哈喽,大家好,上个视频我发了关于 codex 的 后功能的使用体验,收到了大家很多的关注。今天我会一个视频,讲清楚 codex 的 目标功能到底怎么用,什么时候用, 如何高质量的用。希望大家帮忙点赞评论关注。首先需要说明, codex 的 go 不是 让模型突然变聪明,也不是你丢一句话它就可以无限的自动驾驶 go, 它本身是和模型无关的,并不是模型的功能,而是 agent hines 同面实现的一个机制,是 codex 的 产品和运行环境这一层的能力。所以首先第一个问题, 用第三方模型到底能不能用这个功能?答案是可以的,只要你是通过扣代词使用这功能,再更新到最新版的 app 都是可以使用的,但是效果就不一定有 g p u 五点五那么好了。 官方对目标的定义是给扣代词一个持续存在的目标,这个目标既是他开始工作的指令,也是他判断到底做完没有的标准。所以 go 最重要的不是跑的久,而是有一个清楚完成的标准。所以第二个问题,什么样的任务适合开 go? 答案是,如果你只是改一个按钮的颜色,或者修一个很小的 bug, 实现一个很简单的需求,其实没必要上钩。当然,如果你是给他一个 ui, 让他完全对齐这个 ui 设计稿去实现你的 ui 页面,那还是可以的, 真正适合构的是那种多步骤会中途跑,测试会反复修,而且你不想一直在旁边盯着打 continue 的 任务,比如说迁移一个项目,重构一块模块,修一批测试,做性能优化这种任务,你可以给他一个明确的目标,他就可以围绕这个目标去持续的推进。 再比如前面讲的,你给他一个 ui 稿,我个人感觉扣代词在审美这块还是差点意思的,但是你给了他明确的标准,对其 ui 设计稿去实现 ui 页面,他就会一直修改,并且修改完之后去启动项目对比 ui 稿,做到像素级的还原。甚至你都可以用 gpt 一 米二去生成一个精美的页面, 毕竟 gpd 一 米二的生普能力大家是有目共睹的。评论区有人说只有十个小时,最后写出一坨,其实这个问题不是 go 本身能解决的,而是你给的 go 太空了。 go 的 核心是有一个明确的目标加验收标准,不要写帮我优化一下这个项目,优化这个动作本身是没有一个明确的验收标准的,也就不是一个明确的目标,优化哪个方向,功能交互还是性能优化到什么程度才算是完成?这些都没有一个明确的标准。那第三个问题,应该怎么使用 go 呢? 特别是你没办法明确说出你的目标和验收标准的时候。其实有两种办法,第一种是先 plan, 再去用 go 去执行, 提出你的需求,先让 codex 把任务拆清楚,你确认验收范围没有跑偏,再把这个 plan 去变成 go。 第二种,如果你的 codex 已安装上了 superpower 插件,那么你可以直接开启目标模式,你可以说出你模糊的目标,这个时候他前几步会主动的去跟你澄清,直到明确为止才真的去执行这个目标。 也有人问死停完怎么办?比如他用方法 a 跑不通过,一会又用方法 b。 也有人问做科研做复旦任务能不能一阶段一阶段的验收。这里就聊到了第四个问题,如何高质量的用目标功能去提高产物的质量。这里有几个技巧。 第一个就是构力最好加上停止条件,同一个方案失败两次就必须换方案,或者停下来报告原因,不要让他在错误的路径上你去预谋。注意,这里并不是停止你的目标, 在没有满足你的目标之前, codex 是 不会给这个目标去标记上已完成的标志的,它只是暂停了,等你澄清或者纠正之后,是可以点击继续目标去执行的。 第二个技巧, go 不是 让你完全不看了,而是让你不用每分钟问一句继续,不用中间持续的去给他解释上下文,但是中间你随时可以插话纠正。阶段性的去看 def, 看测试,看结果。你仔细观察就会发现, codex 的 go 并不是想象中的,你给他一个 query, 他 一直跑,中间不停止, 反而更像是他自己把围绕这个目标的实现拆解成了很多的小步骤,并且每实现一个小步骤,他都会做充分的测试和验收, 验收通过了这小步骤就会被提交。那他是怎么继续开始新的小步骤的呢?其实更像是完成一个小步骤之后,他自行判断这个目标是否完成了,然后判断下一步该做什么,给自己了一个下一步骤的新宽瑞。 只不过之前这个昆瑞是需要人觉得上一个步骤没问题了,人去判断下一步应该做什么。了解了这个机制,在他执行某个步骤的过程中,你就随时可以点击停止目标,并且对他进行纠错或者提问,确认没问题了,再点击继续目标即可。最后再说一个额外不算技巧的内容。 很多人对目标都是小心翼翼的,开了一个目标之后不敢随便乱点,不敢电脑合上,不敢重启 app, 会担心中间网断了怎么办?账号额度没了怎么办? 答案就是这些都不会影响目标。你的网断了,在网络恢复的时候,可以重新进到那个规划去点击恢复目标,你账号额度没了。一般情况下,在这个账号额度恢复的时候,目标都会自动的继续,但如果没有的话,你也可以手动点击继续。 像我的 pro 账号是五倍的订阅,经常会在五个小时额度重置之前额度消耗完。我这个时候就会用一个账号切换器去切换账号,切换完 app 是 要重启的,重启完之后我就会去点击这个规划里面去继续目标。最后,关于权限这个问题,官方确实支持减少 approval, 比如不想他每一步都问你。 首先说明一下我自己,其实是开的完全的权限,但是是建立在一个干净的分支可信项目的基础上,确保它有 get 记录。此外,再通过外的 hux 机制去保证不操作项目之外的内容上的。 最后总结一句, go 的 价值不是让 codex 永远跑下去,而是让 codex 不 在每一步等你。推一下智能用法,不是让它干活,认清楚什么叫干完。关注我,了解更多 ai 技巧。

这是一条 codex 从零到一完整的新手入门教程。如果你之前完全没用过 codex, 或者只是听说过,但不知道它到底能干什么, 怎么装,怎么用,那这条视频你就可以收藏了。我会按照一个新手真正上手的顺序,带你从 codex 试什么,讲到安装、使用、主界面、怎么操作、基础功能和进阶技巧、 skills 插件、浏览器终端和自动化任务等等,让这个目前全球最顶级的 a 阵的工具真正为你所用,创造价值。 我也会把整个流程整理成文档,打一句 codex, 方便对照,一边看一边选。你可以先把它理解成一个装在电脑里的 ai 工作助手,他不是单纯陪你聊天的工具,而是可以进到一个具体的工作文件夹,帮你读取文件、修改内容、运行命令、调用工具,甚至按步骤完成复杂任务。 举个最简单的例子,像 chat、 gpt、 豆包这一类工具,更像是你问他答,你自己去做。比如你想做一个网页,他通常只会给你一段代码,接下来你还要自己复制代码、创建文件、运行、检查报错等等。而 codex 是 你问他,他理解他还做,他会从零到一帮你创建好这个网页。 目前最适合新手小白的上手方式呢,是桌面端 app, 我 们可以直接在官网开始,根据你的系统选版本, windows 或者 mac os 都可以。安装之后有两种登录方式,一种是官方 chad gpt 账号登录,另一种是用 apikey, 可以 是官方的,也可以用中转站。两种方式各有利弊。综合来看,还是建议第一种,直接官方账号登录, 省心省事。对于 codex 的 界面,新手可以先关注三个核心区域,最左侧是一些常见功能入口和聊天记录管理区,你可以理解为导航栏加历史记录。这里需要重点讲一下对话和项目的区别。对话最好理解就是普通聊天嘛,你甚至可以把它直接理解为 chat、 gpt 或者豆包, 适合随便问一些小问题,帮你写文案、查资料之类的。它不跟具体的文件夹绑定,而项目就涉及到了具体的生成式任务,比如 如飞哥之前开发的工具箱网站,飞剪一触即达这种软件,他们有大量的编程代码文件,就需要一个专用的项目文件夹。你在这里可以新建空白项目,也可以打开现有文件夹,直接选择路径,或者直接把文件夹拖进来也行。鼠标悬停在项目名上,也能看到这个文件夹在电脑中的 底位置。而对于重要的常用的项目和对话,右键就可以置顶,方便快速切换和查看。左侧下方还有设置入口,在设置里你可以修改 codex 的 使用偏好、外观和配置等等。其中个性化需要重点说一下, 如你想给他一个全局指令,就在自定义这里直接写,比如他要怎么称呼你,固定用中文回答问题,设定一些底线原则或者开发习惯,设置完之后对所有项目都会生效,相当于让这个员工摸清楚你这个老板的脾气,投你所好。这里还有一个很有意思的小功能,叫桌面宠物, 他提供了很多默认的宠物形象,你也可以根据自己的喜好让他帮你创建一个,比如我这个就是给了一张参考图,让他自己做出来的,他会实时显示当前任务的一些简单状态,还是挺好玩的。 在首页设置这里还能看到剩余用量,你可以清晰的看到五小时用量和一周用量,做到心中有数。中间这块就是你和 codex 的 主要沟通区域。首先是这个加号里面有两个非常重要的功能,一个是计划模式, 比如你让他开发一个个人博客网站,不要上来就直接让他干,而是让他先列出计划。相当于你给员工一个项目,得先让他出方案,看看他打算怎么做,这样能有效减少返工,既省精力又省 tokyo。 看啊,他会主动问我们这些具体细节,我们按选项敲定,不满意的或者他没提到的就补充一下,让他重新规划, 这才是一个合格的领导该干的事。而目标模式就更厉害了,刚上线的新功能就是你给他设定一个目标,越具体越好,他会自己拆解分析。执行审查,有一种不达目的不罢休的意思,这样就避免了一个很烦的问题,执行一个任务的时候,他每完成一步就要停下来问你。 比如我正在跑的一个很复杂的大项目,目前已经连续跑了三十多个小时,如果正常一步一步改的话,我可能要好几天才能做完这些进度。右边这个权限设置呢,分成三档,默认是最保守的,像是联网修改文件都需要你的授权,自动审查会开放一部分权限,关键节点还需要你把控。 而完全访问就是最激进的,它几乎可以完全操控你的电脑,创建文件、删文件、跑命令,全都自己干。新手,我不建议一上来就开完全访问,刚开始用默认或者自动审查更稳,等你确认这个项目没问题,也知道它要做什么,再考虑给更高权限。我自己是在非常熟悉项目和流程的情况下才会开完全访问。 右边这里还可以切换模型,选模型版本、智能程度和推理速度。如果不是特别复杂的任务呢?不建议开超高,因为它有可能会出现过度思考,而导致你花了更多的 token, 反而干的不好。 这是血淋淋的实战经验教训,一般来说默认高就可以了。这个麦克风是语音输入,但是体验目前并不是很丝滑,我们可以直接用语音输入法。 codex 还有一个和普通聊天很不一样的地方,任务可以排队,他正在执行的时候,你可以继续补充,要求这些新消息会一个一个排在后面,等他处理完当前步骤之后继续执行。比如他正在做网页,你可以接着说,页面再简洁一些,按钮换成黑色,先不要做登录功能等等。 而如果你忽然发现他理解错了你的意思,或者做了一半有点跑偏了,可以直接选择引导,强行把方向盘掰回来。所以用 codex 的 时候不一定要追求第一条提示词写的特别完美,你可以边看他做边补 充,边纠正边引导。真正好用的方式是把他当成一个正在干活的助手,而不是一个只负责回答问题的聊天框。这个思维一定要转变过来。 最右侧的区域目前包括三个功能,侧边聊天就是当前任务的一个临时讨论区。因为有时候 codex 正在执行一个主任务,但你中途想问点小问题,或者单独讨论某 个细节,就可以用它,它不会打断主对话的节奏。浏览器主要是 codex 打开网页查资料测试页面,比如你做了一个网站,可以让他直接打开本地页面,帮你检查布局按钮、交互有没有问题。如果你对某个地方不满意,还可以让他直接打开本地页面,帮你检查布局按钮、交互有没有问题。如果你对某个地方不满意,还可以让他直接打哪的感觉, 口头描述半天要精准的多。终端的话呢,其实你不需要了解太多,因为它主要是给 codex 执行命令用的。到这里,其实你已经看到了 codex 最核心的几种能力,它可以进入项目,读取和修改本地文件,可以用计划模式先想清楚怎么做,可以通过浏览器查资料测试网页,也可以通过终端运行命令检查结果。 所以 codex 真正厉害的地方不是某一个单独按钮,而是它能把这些能力组合起来,帮你完成一个完整任务。理解了这一点,后面的 skill 插件和自动化任务就很好懂了。 因为前面这些能力呢,解决的是 codex 自己怎么干活的问题。但如果你想让他干的更稳定,更像一个熟悉你习惯的助手,就需要用到 skill。 如果你想让他连接更多外部工具,就要用到插件。 这里很多新手分不清 skill 和插件,其实用一句话就能记住, skill 是 方法,插件是工具。 skill 可以 理解成一套可以附用的工作流,或者说给 codex 的 一份工作方法说明书。比如一家公司做项目,通常都有一套标准流程,第一步做什么,第二步做什么,输出格式是什么,有哪些注意事项,哪些地方不能乱改。 这些东西如果每次都重新告诉 ai 一 遍就很麻烦,而且 ai 它还可能每次理解的不一样。所以更好的方式是把这套工作流程固定沉淀成一个 skill。 这样 codex 下次遇到同类任务时,就不用像一个新员工一样重新摸索,而是直接按照你写的流程和标准来做。 比如我自己的飞鸽工具箱里就有很多专属 skill。 比如把好用的软件保存入库到本地,同步到我正在做商单推广的几个云盘,生成下载链接,再同步到正式站,这些流程全都是固定的。 我把它们写成 skill 之后, codex 就 可以按这套流程稳定执行,不会每次都跑偏。再比如,你经常写短视频文案,也可以让 codex 帮你做一个短视频文案 skill, 把你之前写过的大量文案喂给他,让他总结你的开头风格、结构、习惯语言表达、结尾方式,然后形成一个专属文案助手 后,再写类似内容的时候, codex 就 会优先按照这套方法来。插件就不一样了,插件更像是给 codex 装上外部工具,解决的是它能不能操作某个平台,处理某种文件,连接某个服务。 比如浏览器插件,可以让 codex 打开网页查资料、测试页面表格插件可以让它处理 excel、 ppt 插件可以让它生成演示文稿。 gmail 插件可以让它整理游戏, camera 插件可以把生成的内容导入到设计工具里继续编辑,所以不要把他们想的太复杂。 skill 解决,怎么做插件解决用什么工具做?一个是工作流程,一个是工具能力。 codex 目前已经集成了很多实用的插件和 skill, 我 也整理了几个比较常用的,大家可以截图保存,后面自己试试看。 最后我们再来看一个比较进阶但非常有想象力的功能,自动化任务。你可以先理解成让 codex 在 固定的时间、固定的项目里自动帮你做一件事,但它和普通题型软件不一样,它们最多告诉你该干什么了。 而 codex 的 自动化任务是真的可以帮你执行一整套流程。比如你是做内容创作的,你可以让他定期帮你收集某个领域的热门选择题,整理成标题、角度、参考链接和可以拍摄的脚本。而飞哥最常用的就是每天固定时间设置一个今日任务清单,划掉昨天已经做完的,生成当天新的任务, 就像一个机器人一样按清单执行。这也是为啥有人说我效率那么高,一个人干八个人的事情。除了 ai 的 强大助力之外,任务规划本身也非常重要。所以自动化任务真正厉害的地方不是定时提醒,而是定时让 ai 按你的要求去干活。 最后再补充一个很多人会关心的问题, codex 能不能在手机上用?据我所知有三种方式,最早大家都是用 happy 这种开源项目,它可以连接 codex cloud code, 电脑上开个任务就能通过手机和 agent 的 沟通,但始终不太方便,相当于只是给你安排了一个传话筒。 而 codex 的 mac 版本最近更新了手机端的入口, chat gpt app 里面就有 codex 可以 完整读取你的聊天记录。在手机里聊天和电脑端的消息是完全同步的,本质上是远程链接,相当于把你的电脑版正在跑的 codex 搬到了手机里。而最近我发现了一种非常爽的方式,就是网易的优优远程, 出门的时候手机直接远程连电脑,操作起来很方便,最关键的是你能同时测试它的改动,这就相当于把你整个电脑都装进了手机,所以功能最完整。 好,最后我们来个回顾,总结一下你都学了什么。如果你是第一次接触 codex, 其实今天不用记住所有按钮,也不用一上来就研究特别复杂的自动化和插件,你只要先记住这条主线就够了。第一, codex 不是 普通聊天工具,它更像是一个能进入你电脑工作区的 ai 助手。第二,临时问问题,用普 对话,真正要处理文件、项目代码、文档就用项目。第三,复杂任务不要直接让它开干,先用计划模式让它列方案,如果是一个长期目标,再考虑用目标模式让它持续推进。第四, skill 是 方法,插件是工具。 skill 负责告诉 codex 怎么做事儿,插件负责让 codex 连接浏览器、表格、 ppt 邮箱这些外部工具。第五,自动化任务不是简单提醒,而是让 codex 在 固定时间按照你设定好的流程自动干活儿。 所以新手今天先做三件事就够了。第一,安装并登录 codex 桌面端。第二,建立你的第一个项目,找一个真实的小任务试一下,比如整理一个文件夹,总结几篇文案,或者生成一个简单网页。第三,让 codex 帮你写一份自己的 agents, 点 m d 就是 我们刚才提到的个性化。现在你让他自己干,把你的 称呼、语言、习惯、输出格式、工作偏好都写进去。当你把这三件事跑通之后,你就不只是会用一个 ai 工具了,而是开始拥有一个真正属于你自己的 ai 工作站。祝你越来越牛逼!

美好啊,朋友们,这是一期 codex 奶妈级的零基础系统教程,这期视频我会从安装开始,手把手地把 codex 的 基础能力到高级功能的组合,以及最新的手机端操作,用十个实战场景来带大家彻底拉通 以后这一类的 ai 产品,出一个算一个,你都会触类旁通,游刃有余。我也把这期的文字课间整理成了文档,那这期的含金量可谓是 biu biu biu biu biu, 一个点赞收藏关注是最起码的。好了,不多说,学费都交了吧,我们上课, 那在开始之前,我先说一下 codex 和 cloud code 的 区别。从本质上来说,它俩都是由编程 agent 逐步转向了通用 agent, 分 别是 ansapi 和 open ai。 这两家出的 cloud code 呢,默认使用 cloud 模型,但是我们可以自行替换成任意其他的模型,那在易用程度上, codex 桌面端的产品设计是会更友好的, 更适合零基础的白领工作者,而 cloud code 有 更高的自由度。在功能上, cloud code 原本是最齐全的,什么 skill、 mcp、 斜杠命令、 hock、 远程操控,这都是人家先发明的。但是呢,最近的 c c 更新稍微不如 codex 那 么快了,会更加偏向专业开发者一点。 而 codex 发了非常强的浏览器操控和 computer use, 还内置了最近的 image 二深图模型, 而且昨天还刚刚发布了手机端和 hock, 可以 直接用你的手机 check gpt 来控制电脑上的 codex 干 活。那价格和额度方面呢? codex 的 会员额度非常大方,二十到的会员就很够用,而且还不封号。 而 cloudpod 呢,大多数人可能都没法用它的官方账号基本上都得自行调用 api 的 费用属于是花多少用多少,风险由人。那在使用场景上,我个人喜欢用 cloudpod 搭配 cloud 模型来写作,因为 ops 四点六的写作和规划能力真的很强, 那 codex 的 执行和解决问题的能力也很强。日常的办公场景,我会选择用 codex, 那 在编程的时候嘛,我就两个都用上,所以结论是,入门的朋友用 codex 就 很强了,有条件的朋友呢,两个都来是最完美的, 不过两者的逻辑其实都是一样的,我们学一个,另一个也就会用了。那 cloud code 我 也做了一期系统教程,想拥有左膀右臂的朋友可以去看看。 ok, 正式开始 使用 codex, 我 们唯一需要准备的就是一个叉 gpt 账号,免费的也行,只是会额度稍微少一点。那有了账号之后,我们就直接去它的官网双击安装, 然后安装好之后登录我们的叉 gpt 账号,然后这些设置我们可以先随便选一点啊,选个日常工作,反正后续呢,我们都是可以改的。那搞定了, 那进来之后呢,大家会看到这个对话窗口,好像跟 chat gpt 是 很类似的。那我们打开两边的侧边栏也蛮眼熟的,左边呢,可以管理对话和任务的列表, 那中间就是聊天,右边大概是结果之类的吧,大家应该都能猜个七七八八,所以我们先不深究它的页面,我们直接开用,这其实也是我探索所有的 ai 工具的独门秘方。 我打开一个陌生界面呢,我先不管别的,我先找到我能对话的框,我先聊,先找到我能看得懂的按钮,先按,按着按着你就会了。你看看,独门秘籍都教给大家了,以后你们就是为师的弟子了。 ok, 众弟子不必拘礼,我们还是以学业为重啊。那我们第一个要了解的 codex 能力呢,就是本地文件操作, 也是这一类桌面端的 agent 跟对话 ai 最显著的区别和能力。因为过去我们用叉 gpt, 如果说我们要让它看到我们本地的内容,我们只有两种方式,一个呢就是复制粘贴到这个对话里,另一种就是以它允许的格式和数量把文件给上传上去。 但是 codex 不 一样,它可以自主地读取和操作我们的本地文件,而且不限数量。比如说我作为一个剪辑,我的本地里面存了八十多条视频素材,这都是我剪辑要用的, 但是呢,这个命名全都是乱的,完全看不懂,所以我想以这些视频的内容来命名,到时候我们看见文件名的时候,我们就知道这个素材是什么。那这事 check gpt 肯定是做不了的,但是 codex 可以 我们来看这两个地方,它都显示了一个概念,叫做项目, 我们选择一下,哎,一选择项目,他就让我们选择本地的文件夹了,那我们只要选中这个文件夹,那这个文件就是我们的项目了,里面所有的文件 codex 都可以自由的读取和操作, 当然这需要我们给他权限。大家看这里的权限选择啊,目前呢,我们是一个默认的权限,我们再点开,他有三种权限模式, 那默认权限的意思呢?就是在我们当前的文件夹内,他可以自由的去读写这些文件,但是如果他想要联网呀,或者是帮我们下载一点东西啊, 或者是碰这个文件夹之外的其他文件,那他是不行的,如果他必须要做,就会要向我们提出提高权限的请求,我们点同意才能继续。 那自动审查呢?顾名思义就是有个 ai 自动帮我们审查,由 ai 来判断这个操作危不危险,如果危险呢,就来问我们不危险的,比如说他去下一个知名的这种官方软件什么的,他就直接开干了。 自动审查比默认模式要更宽松和智能,建议大家选这个就完了。那最后呢,是完全访问权限,这意味着 codex 可以 在你的电脑上几乎什么都能干,它可以修改删除任何文件,它可以在任何位置执行命令,例如说它可能会去把你的 cloud code 给删了。 开玩笑啊,它一般情况下是不会这样抽风的。 ai 呢?也没有嫉妒情绪吗? 大家尤其是新手朋友就选择自动审查模式,相信 ai 就 完了,毕竟咱又能审的比 ai 好 多少呢啊,对吧? ok, 那 我们选中了刚刚的这个视频的文件夹,继续来提出我们无理的要求,让他帮我们把这个文件夹里的所有视频素材都按他们的实际画面来重新命名。哎,他就开始做了, 而且大家看他非常的聪明,他先看了看我们到底有多少个视频,然后他选择用抽帧的方式抽取关键画面来判断内容是什么,而且他还知道他不要一张一张图去看,他给拼成了缩略图的形式,一组一组的去看。 ok, 很 快啊,这个文件夹里面的文件名就全改变了。过程中呢, codex 也是没有向我们提全的,因为他都是在这个文件夹内去操作的。那我们也可以检查一下他都对应好了没有。 ok, 钢琴家音乐演奏厅,没错, 雪山近身格斗,没错,旗袍女人夜巷卖热饮哇!而且他的这个命名还遵循着一个序号,任务、场景、行动的一个清晰的命名格式。 ai 做事的这个细心程度啊,人类你不服不行。那另外呢,我们其实也可以在同一个项目里面去开多个不同的对话,它们的上下文都是不一样的,但是同样都可以随时的访问我们这个文件这个项目。 比如说,我们在另外一条对话,我们又给他一个不同的任务,让他想办法把所有关于风景的视频都剪成一整条。 哎,没想到吧,他真的能剪,他自己想办法,用了一些工具问我们要了一些权限,用这个 ffmpeg 给它拼在了一起,效果的确是关于风景的都剪成了一条。 ok, 那 如果我们要创建一个新的任务,我们其实也可以手动的在这边创建,他也会自动的在我们本地创建一个文件夹。 然后呢,我们跟 codex 对 话的整个过程, agent 产生出来的任何文件啊, pdf 啊,什么 markdown, ppt, 它都会直接存在我们本地的电脑上。 ok, 到这里,大家应该 get 了 codex 呢,可以随时地访问我们的本地文件,去读取内容,写文件,删文件,移动文件,文件夹里的内容也就成了我们的 codex 随时可以获取的上下文,那这里的项目也就对应着我们在本地的一个文件夹, 哎,那刚刚这么个任务会花我们多少上下文呢?我们只要看这里就能看到了。 那这个小圈代表的是我们现在的这个对话和里面的操作,一共使用了 gpt 五点五的多少上下文窗口。 如果我们把鼠标悬上去呢,它还会有更详细的一个信息,当上下文快满的时候, codex 会自动地帮我们压缩上下文。不过其实当我们一个任务告一段落之后,不用等它快满了,让它自动压缩,我们也可以自己通过斜杠压缩这个命令 来手动的去压缩上下文,这样呢,可以让模型更聚焦在我们的新任务上,也省一点上下文的额度。那当然大家除了这个对话的上下文余量,其实我们还想知道我作为一个免费用户,或者是我作为一个 pro 用户, plus 会员,我还有多少总共的额度可以用,对吧? 这个呢,有两个方式查看,一个呢是左边的设置,这里我们点开剩余额度,就能看到你五小时内还剩下多少,那本周内又还剩下多少, 甚至呢,也有什么时候到期会刷新的一个提示,这个产品的设计还是比 cloud 的 友好很多的。那另一种方式呢,就是我们可以直接在对话框里输入斜杠,然后找到这个状态, 那打开这个状态之后,它的绘画这里就会持续的显示我们的上下文余量,这个五小时和一周的限额。但再次说实话,这个 codex 的 额度还是非常大方的,二十到的额度我认为是可以满足大多数白领工作的高频使用的。 ok, 那 顺便呢,我们也介绍一下这里的模型选择, 那点开之后,我们可以选择速度,快速呢,就相当于加急通道,会消耗我们更多的额度。那这里呢可以选择其他模型,但是大家都选五点五,因为它确实更好用。然后呢,这里可以选择智能程度,其实呢一般中度智能就够了, 所以我们选高。 ok, 那 这个小麦克风呢,肯定就是语音输入功能了,比手打字还是要快很多的,但是呢,它的转录速度远不如大家去下载一个语音输入法,还是非常推荐大家用语音输入的 好。那现在我们通过一个本地文件处理的案例,也了解了 codex 上常用的一些功能。那 codex 的 第二大能力就是命令行工具使用。 其实刚才我们说到权限的时候就有提到,在默认权限下,它可以读写文件,但是却不能执行一些命令,一些联网的操作。那这些命令是什么意思呢? 刚刚的案例其实也已经用到过了,比如说它把视频抽帧出来,还把几个视频拼接到一起,它用到的 ffmpeg 就是 命令行工具。 还有一些我们熟悉的命令,比如说我们在终端里面来克隆一个 gitup 仓库,或者是大家近期比较熟悉的,我们在命令行里面输入一些命令来下载龙虾和各种依赖。那 codex 的 第二大能力就是在我们授权的情况下,可以使用我们的终端来替我们做这些事。 那我们就来让 codex 帮我们来安装一些平时对于小白来说非常复杂的东西吧。第一类,常用依赖,比如说什么 node gs 啊, git 什么的, 也是大家以后使用各种 agent 或者是做其他项目必备的一些工具啊,那之前大家要装这依赖都得去看一个手把手教程,然后照着命令抄,挨个装。那现在我们就直接跟 codex 说帮我安装个 node js 给他发过去, 也是因为这些东西呢,其实都是比较常见的东西了,所以在我们的自动审核的权限模式下,你看他基本上都不问我们要提权,就熟门熟路的帮我们装好了。 那第二类,就是那些爆火的但是有上手门槛的一些新的 agent, 比如说龙虾,爱马仕,甚至还有这个 codex 的 竞品 cloud code, 我 们都可以让 codex 帮我们装完了呢,它还能教我们该怎么用。那我们装一个 hermes 吧, 我其实都不需要给它官网和仓库链接,我就说最近有一个叫 hermes 的 agent 很 火,你帮我安装一个吧。 哎,他就会自己去搜索,然后帮我们判断到底是哪一个。然后呢,他根据官方的文档帮我们陆续的装好了,还帮我们验证过已经装好了,你瞧瞧,那我们照着他说的来启动一下试试。 哎,真的帮我们装好了,那往后的配置我们就不在这里继续了,但是大家应该 get, 有 了 codex 以后,那些复杂的要收你五九九的部署,你都可以直接让 codex 帮你做了,怒省五九九。而且我们在使用的过程中遇到任何问题,还可以截图去问 codex, 什么瞎死了马挂了,升级出现了问题都可以让 codex 直接帮你修,是不是很方便? 那第三类有点没那么必要,但它其实也可以,就是像 cursor integrity 这种软件应用, 平时都是我们去手动在网页上下载的,它也可以帮你下载和卸载。那大家用 codex, 我 其实也建议大家去下载一个 agent 的 ide 啊,因为现在 codex 有 个缺点是它没有办法打开我们的文件内容,直接去手动编辑。 虽然这个侧边栏呢,是可以看到一些文件结构和内容的,但是我们都没法编辑,所以大家可以让 codex 下载一个自己喜欢的,比如说我们就这样下载。那下好之后呢,我们再执行一个 git i n i t 一个初步化, 那右上角就会出现这个东西,随时可以把我们的项目在编辑器中打开,我们来手动编辑。 那第四类就比较重要了,就是 agent 本身会常用到的那些 skills 啊, mcp 啊和 selli。 那 skill 和 mcp 本身 codex 也是支持的,我们后面会详细讲到, 我先挑两个大家安装一下,方便我们后面综合起来来做案例。那这些 skill 和 c i 呢?通常来讲不像那些 get 那 种大项目那么著名,所以我们最好是找到它的具体仓库,或者是明确的官网地址。比如说我们下载一个专门找 skill 的 这个 find skill 哦,方式就是直接把链接拷贝给 codex, 然后跟他说帮我装一下这个 skill。 那 在他装的期间,我们也说一下 codex 的 另一大好处,并行任务处理, 我们完全可以在他做这个事情的时候再开一个对话,让他去下载一个别的。那我们下载一个飞书 c l i 吧。飞书 c l i 其实非常的典型, 因为现在呢,有一些积极 ai 化的软件,把几乎所有他在软件里能做的操作都做成了命令,让 agent 能够方便的去操作,我们把这个链接发过去,让他开始下载, 那这边呢,其实会显示每一个正在处理当中任务的情况,这个在转呢,就说明它正在执行中,那这个蓝色的点呢,就说明已经完成了,有时候还可能会出现一个需要你申请权限的一个标识。 ok, 那 这里 fan skill 呢?它是已经装好了,我们再看飞书 c l i 这边,它会引导我们去做一些授权, 我们就跟着它的引导去完成就好了。 ok, 那 装好飞书 c l i, 那 codex 就 能帮我们去做飞书里的各种操作了,比如说写文档,发消息,见日历,做表格什么的了,我几乎每天都在用, 好大功告成。我们就这么一个小章节,我们就用自然语言的方式让 codex 帮我们装上了 hermes node, 飞书 c l i 一 大堆东西,这就是 codex 作为 agent 的 第二大常用能力,命令行使用。 那这个能力和这个章节的演示也是希望大家能够 get 到一点,就是我们现在在电脑上想去做的很多很多事情,都可以让 codex 这样的桌面 agent 去做了。那 codex 的 第三大能力是持久记忆。 看过我那篇 cloud code 的 朋友应该都知道, c c 呢,有一个手动的持久记忆, cloud 点 md, 还有一个自动的记忆系统, 都是把我们希望 agent 能够长期记住的,比如规则、篇号和我们的信息之类的东西,以本地文件的方式存在我们的电脑上,然后事实的时候把这些记忆以上下文的方式注入到 agent 里去。那 codex 也是类似的,它也有这两套持久的记忆系统 在 codex 里面呢,手动的持久记忆文件叫做 agents 点 m d, 而且它也有一个自动的记忆机制,来我们打开设置,找到个性化, 那在这里的这个自定义指令实际上就是一个全局生效的 agent state md, 它会在我们任意的项目跟 codex 对 话的时候,它都第一时间作为上下文发给大模型,那我们可以手动地自己在这里写,不过我更喜欢呢,直接在对话中去跟 codex 说, 比如说我说一个,我希望你以后对非书文档里的任何修改都使用一个专属的你的文字颜色和用删除线的方式来修改,不要直接的修改。然后这个帮我寄到局的 a 正 c m d 里。 ok, 那 它这里呢,告诉我们已经写好了,我们再打开个性化这一块,就的确是多出来了这么一套规则,那实际在使用当中,它就会去遵循我们这个规则了。 比如说我这里已经有一篇非输文档了,我在侧面呢也评论了几个我想修改的地方,我直接可以把这个链接发给 codex, 我 让他根据我侧面的评论帮我修改一下。 那因为我们刚才确实已经装好了这个非输的 c r i 也都给他配置好了权限,所以 codex 是 直接可以操作我们的文档的。 ok, 看看它完成之后的效果。 果然他用了紫色的字和删除线的方式来帮我们做的文档修改,那这个呢,是局的 agent md, 适合记一些适用于所有任务的一些大原则,比如说我们的工作习惯,我们要说中文,我们的工作偏好修改文档,要留下这种修改痕迹等等等等。 那另一种呢,就是项目级的 agent md, 这个长期记忆呢,只在这个项目当中生效,我们可以选择一个项目的对话,然后打开编辑器, 自己在这里手动的创建一个 agent 的 md 的 文件,然后我们去写一些针对我们这个项目的一些规则, 当然也可以让 codex 来帮我们写。我个人的建议呢,是在这个项目文件里面有了一些内容之后,让 codex 根据他对我们项目的了解来自己帮我们写。那自动记忆怎么回事呢? 其实我们刚才在这个个性化这个下面我们也看到了,我们需要手动打开这个自动记忆功能, 它的机制是我们打开这个功能之后, codex 会在我们结束对话或者是结束任务,这个对话闲置一段时间之后,它帮我们把那段对话总结成记忆,然后记在一个地方。但是它有几个原则,第一太短的对话它就不记了, 那第二这个对话的总结它一样会消耗我们的额度,所以当我们的额度太低的时候,它也就不记了。 并且这个自动记忆文件呢, open ai 官方是不建议我们去手动修改的,顶多我们可能删一删有些没必要的信息,那这个文件大概是长这样 的,是一个任务,一个任务在记录的,主要呢会写上这个记忆的来源是哪段对话呀?以及它的工作目录是什么,那以及以后触发了什么关键词的时候,它会去召回这段记忆, 再往下呢,是用户在这件事情上的偏好大概是什么样的?那第五段呢,是一些可附用的一些知识,一些踩坑的记录,那这些内容都是 codex 自己记录的,并且以后也是会它自动的招回去使用的,我们就先不修改它, 它这个格式确实也不太方便修改,更多的时候我们对于明确的规则和要求,我们还是通过组织 agent md 来实现。那大家学完这些视频之后呢,我也想给大家再做一期, 通过组织不同层级的这种 agency md 给自己做一个非常懂你的,可以做不同类型事情的超级助手的视频,感兴趣的朋友可以扣个一。 ok, 那 第四大能力就是 codex 可以 直接用到 image, 二来生成图片。不过呢,深图功能其实是一个小功能, 所以这一章节呢,我们不只会用它的图片生成,我们会带大家做一个完整的个人主页的开发项目,并且在了解一些 codex 在 小白开发中的一些用法和功能。那我们再来开一个项目,叫做个人主页, 然后我们点开这个加号,我们把计划模式打开,因为我们要做一个网站嘛,任务会复杂一点,所以打开这个计划模式呢,他会先帮我们列出一个详细的计划,我们确认之后他再开始行动。 计划模式呢,比较适合我们的任务有一定复杂性,或者我们自己还没想清楚,可以跟 ai 讨论出一个计划。那假设我们现在就是第二种情况,我们其实没想清楚,我们直接跟他说我想做一个个人主页, 那你看他看到我们的项目中是没有内容的,所以他以这种选择框的方式来询问我们的细节,这些选项呢,大家可以按照自己的要求去选择,那我就选这个个人品牌吧。 然后如果说这些选项中没有我们满意的呢?我们也可以选到最后一个来填写我们详细的要求,比如说我要他修饰感,也要高级感,然后我选针对合作伙伴,不要个人照 中英双语,巴拉巴拉巴拉。这里真的是问了我们相当多的问题啊,那最后呢,他给到我们出了一个详尽的计划,问我们是否实施此计划,那其实基本的计划我们看着没有什么问题,但我们也可以补充一些调整方案。 比如说我们刚才就要说到了要用它的 image 二的生成能力,我们这里没有体现,我们加一句网页上要多用一些图片,使用 image 二来生成一些高级感的图片,然后我们一起提交。 哎,那他又问我们要走哪种高级感呢?我们如果点开这个小叹号的话,还能看到他说的这个风格到底意味着什么意思,这个产品的小细节真的是我很喜欢,那我们就选他推荐的吧。然后他出了一版新的计划,我瞧着没什么问题, 去吧。 ok, 他 就开始初识化这个项目来逐步帮我们生成了。那这个过程呢,肯定会需要一定的时间,在这个期间我再给大家补充一点点知识点。呦,他的第一张图出来了,不错,挺有艺术感的,果然是最强的 emoji 二,那我要补充的这个知识点呢,叫做引导。 如果说大家在 codex 执行一个很长的任务的过程当中,你觉得他有点跑偏了,我们是可以随时给他补充纠偏的,比如说我们补充一下图片的人味要更强一点,而且不要这么冷的色调。我是一个 ai 博主,然后我们发送出去, 哎,大家会看到他没有立刻打断我们的任务,没有发出去,实际上他在这里排队呢。那我们看到右边的这个引导按钮,他写着我们不打断模型运行,会在下次调用工具后发送过去。这个是非常好的一个功能啊,我们点一下, 哎,他就可以发出去了。这个功能呢,可以让 codex 不 用在错误的道路上一路狂飙,把我们额度都花光,也不会让它重新再跑一轮任务。那另外一个小功能点,我们找到一个已经结束的任务, 我们看一下这个 ai 的 回复,每个 ai 回复的下面都有一个这个按钮,叫做分叉 fork, 这个的意思是我们可以随时从这里开始去开一个新对话,非常适合那种前面聊的还好好的,上下文也非常有价值,但是我们再往下聊,就聊的有点叉劈了的时候。哦,还有个小功能,宠物, 我们点开设置外观,然后这下面就有一小对小宠物可以选,甚至呢,我们还可以点击创建,让 codex 根据对我们的了解来生成一个定制化宠物。那我们先点击唤醒宠物, 哎,就会在桌面上有常驻这么一个小桌宠,脑袋上会冒出来 codex 正在做什么的一个提示,别的呢?好像也没什么用。 ok, 终于在他跑了七七四十九分钟之后,网页完成了, 我们来看看效果,因为 codex 呢,有一个内置的预览浏览器,我们可以直接打开右边的侧边栏啊,我们还给它放大一点。 嗯,这个网页的效果确实是不错啊,不过呢,现在的 a 证呢,其实都有这么一手了,那它这个预览浏览器呢,还有一个好处,我们点击右上方这里的一个批注按钮, 我们就可以在这个页面上选中这里的具体元素去写修改意见,包括重新生成图片,比如说我们要这个 logo 放大一点, 然后 p 住这里这张图加上一个人物,好把这个删掉, 那然后对话框里呢,就会加上我们这几条批注,然后我们点击发送,它就会针对我们的意见进行修改了,是不是挺方便的?那我们现在项目有了雏形之后,我们再 call back 一下刚才说的 agent md, 其实现在呢,就是一个让 codex 帮我们生成项目级 agent md 的 好时候了,因为我们也有了一定的内容,我们就让它自己生成一下,我们打开编辑器看看, 不错,项目的背景,各种信息,各种规则,各种文件路径都已经写好了。那以后呢,无论我们在新开对话,还是我们的聊天记录都已经被清空了, codex 都可以通过这个项目级的 a 证书 md, 立马的了解我们的项目基本情况。 ok, 那 我们先保持这样,先不做精修了,我们直接准备部署上线,当然大家自己做的时候完全可以去打磨的更好,那网页上的这些信息也换成更真实的信息就好。 那我们现在要部署呢,就得要说到 codex 的 第五大能力插件。在现在的 codex 当中,插件大多数是让我们的 agent 跟外部平台、外部工具、外部服务连接的一个作用,它实际上就是我们所说的 skill, mcp, c l i 这一类东西的一个完整集合包,比如说操作邮箱、操作日历、操作 excel 啥的。那我们来点开左边的这个插件栏,我们看这里呢,已经默认帮我们打开了好几个内置插件了,比如说浏览器操作,还有 mac 专有的屏幕操作,还有 excel 表格, ppt 等等。 那他的插件页面没有中文翻译,所以我给大家把这些插件的具体中文意思,分别能干什么也都列出来了,大家课后可以按需装上,点这个加号就好了。那我们先翻到这个 coding 板块,因为我们想要部署上线嘛,通过插件会非常方便。 其实呢,这个 vassel 和 netify 都可以,我们点一个加号给它装上,那如果大家给它没有选上的,也记得要选上。然后我们再回到对话当中,告诉他们,我们想用这个 netify 把这个网站给我们部署上去, 我们大家也不用管他咋部署的,反正他需要干什么呢,他都会告诉我们的。 ok, 他 发现我们没有登录授权,然后主动弹出了这个登录的链接,那这里呢,建议大家用 tapp 账号登录是最方便的, 那登录完之后,他自己就知道我们已经登录好了,然后继续的帮我们部署,这就搞定了。这个链接呢,就是我们最后的网站了, 只要把这个发出去,别人就能访问你的个人主页了。 ai 是 不是个好东西,你说就这么两下子就干了,原来普通人花钱都不一定能干成 o k。 先压抑住我的这个老灯感叹。我们回到刚才我们已经装好的插件, 那其实这里呢,还有两个非常重要的内置插件,就是 browser use 和 computer use, 还有这个 chrome 浏览器, 那这些有什么用呢? browser use 顾名思义呢,就是 codex 可以 直接帮你操控浏览器,比如说它自己点击翻页截图,填写表单等等。通常呢适用于自动化测试前端, 当然也有比较无聊的用途,比如我们可以让 codex 打开这个 m b t i 做个测试试试, 嘿嘿,这样大家能够比较直观的看到它的一个效果吧。那这个鼠标呢,是它自己在移动,然后它是自己看了上面的答案在自己填写,然后填完这一页,它也会自动的翻页, 那随着它的一通操作,结果出来了,原来 gpt 五是 i n t j 啊,我说怎么跟我这么聊得来呢? ok, 那 这个 chrome 的 插件呢,也是控制浏览器,但是它控制的是我们自己已登录的自己的浏览器,它不会再新开浏览器, 那我们如果把它给勾选上之后,它会引导我们去 chrome 里面装一个插件,那装好之后呢,它就可以操作我们自己的浏览器了, 而且它有个好处,它是可以直接在后台执行多个页面的浏览器操作的,就是并不会占用我们的整个浏览器,我们不用真等着看它这些操作,我们该用浏览器干,别的我们可以接着干。 ok, 那 computer use 就 更厉害了, 它不只能够操控浏览器,连你电脑上的这些 app 它都可以操作,只不过呢,暂时只有 mac 有 这个功能。比如说我们新开一个对话,我们在加号,这里来看最下面的这个插件选项,我们手动地把电脑插件选上, 我们再来几个没什么用的奇迹引巧吧,帮我放一首九九年最火的歌,然后用我的微信给 qq 发条微信,说,请收下我一个点赞、收藏、关注,懂了吧? ok, 他 陷入了思考,然后他看到我们的应用都正在运行中,并且向我们使用了这个音乐软件。我们点同意看,这个就是 codex 自己干的啊。他帮我们搜索歌曲, ok, 音乐响起了, 但是他还有活,他还在问我们要微信的权限,我们也给他允许一下。 ok, 看他这个小鼠标,他正在犹豫着准备搜索点击,好朋友们失败了, 因为我上次都成功了,但是我估计现在微信已经开始严防这种 a 证的操作了,直接给我退出去了。 但是呢,他的确成功操作了这个音乐软件。其实我还让他操作了剪映,并且给我们的最新的项目加上了音乐。 那总之呢,意思大家都懂了吧,就是它可以操作浏览器,并且可以操作我们的电脑。当然,实际上我觉得它的操作效率目前来说还是稍微有点低的,我不太喜欢用这两个强大的功能。不过后面我要说的这个 skill 就是 我每天都会用的东西了。 那 skills 我 的确也已经跟大家说过很多次了,好学的朋友一定要去补补课。那 skill 本质上呢,是我们人为沉淀的一些可附用的方法、流程和工具的组合, 相当于给 agent 做某些具体任务的一些行动指南。那因为之前我们已经让这个 codex 帮我们装过一个叫做 find skill 的 一个原 skill 了, 所以后续如果大家想要去装,或者是找一些社区上的 skill, 都可以直接用 codex 拿语言直接让它下载。比如说我们下载一个必备的 ansapic, 那 个前端设计的 skill, 还有一个去 ai 位的,那我们这两个都发给他,等会儿都会刚好有用 欸,很快他就帮我们装好了。那以后大家想要下载 skill 呢?如果说遇到这个 find skill, 他 找不到的东西,也可以直接把链接发给 codex, 让他帮你下载就好了。不过我在 c c 那 期也说过,最好用的 skill 还是自己创建的,符合自己工作的专属 skill。 那 创建 skill 呢,也有两种方式,第一呢,就是直接告诉 codex 你 想要创建一个什么样的 skill, 通过跟他讨论打磨得出来一个 skill。 那另一种呢,就是我们接下来要演示的,先跑通流程,然后让它形成 skill, 这也是一种更推荐的做法。那比如说我们想做一个自动化写这类文章,并且帮它配图的 skill, 这种大家应该都看过吧, 那我们就得先通过一步步的引导 codex, 让它真正实现一个我们满意的文章。来我们新开一个对话。那正好呢,我们刚才不是装过这个 github 插件吗?我们可以直接先问它最新的 github 流行项目,热门项目都有哪些? ok, 它的确帮我们找到了一些,那我们再让它清晰地解释一下这些项目都分别是干嘛的。嗯, 那我们再让他挑其中新星数量最多的,来帮我们写一篇本周 get up 热门项目推荐这样的一篇文章。 好,那他写好了这一篇之后,我觉得稍微有点太人机了,我希望可以更口语化一点,并且我只想要五个精选的,那我们就告诉他,然后还要覆盖到这几个层面,那我们这里就可以用到刚刚我们下载的那个去 ai word 的 那个 skill 了,我们斜杠给它调出来。 好,那看到他的结果稍微优化了一点,但是我们还希望加一个我们固定的开头,我们的结尾,并且还要让他用上 image 二来帮我们生成一些配图。最后呢,我还希望他不要是这个格式,他要是一篇非输文档的格式,然后图文并茂的。 ok, 结果来了,他确实是有了,但是呢,我觉得这个配图不够丰富,于是我又经过几轮调整才觉得差不多满意。并且我还给他最后加了一步,要让他把这个飞书文档发送到指定的群里,让大家都来看看。 那最终呢,他的效果是这样的,果然发出去了。其实啊,如果想更加一步到位的朋友,也可以结合刚才我们说的这个浏览器操控,让他直接打开那个发布页面,直接就帮你发布出去。 那总之,我们对他这一套结果满意了之后,我们就可以直接让他把这一整套的标准和动作做成一个 skill 搞定了。那我们再输入斜杠,再往下找,我们就发现就有了这个 skill, 我 们可以直接这样手动地调用这个 skill, 也可以直接说生成一篇热门项目推荐图文这一类的触发词,也会让 codex 自动调用。 不过因为现在 github 上面实时的热门项目肯定是没有更新的,所以我们再调用一次呢,它大概率会写出差不多的文章,所以我们就不试了。但是大家都理解了吧, skills 呢,可以把我们经过验证调好一次的一整套流程和方法给它固定下来。 下次做这件事情呢, codex 就 可以按照这个方式稳定的输出。 ok, 那 下一个能力则是 mcp。 其实 mcp 现在已经用的不太多了,所以我只简单的示范一下那 codex 的 mcp 藏在设置里面的 mcp 服务器。 只不过小白看这个肯定是有点不太知道怎么填的,所以跟我们之前说的一样,我们最好的方式还是把你想装的那个 skill 的 链接拷贝给 codex, 让他自己装就完了。比如说我们来装一个 notebook lm 的 一个 mcp 发给他, 他就会引导我们来做授权登录,登录完就搞定了。那我们再试一个我存了非常多访谈视频的一个笔记本,我们来问一下他。 欸,那这样呢, codex 也就可以直接获取我们 notebook lm 上面的这些外挂知识点了。 ok, 最后一个 codex 能力是自动化定时任务。 其实定时任务本身并不稀奇啊,比如什么每天早上提醒我吃药,提醒我喝水这一类的事情,普通的软件也能做,但是我们把它放到最后一个说呢,就是因为它可以结合我们之前学到的各种能力,把一整套组合起来的任务,让 agent 定点执行 自动化,加上智能化和定制化方显美妙。比如说刚才我们做的这个热门项目图文的这个 skill, 我 们就可以把它设成每三天或者是每周,让它定时定点的产出一篇 dapp 热门项目推荐发出来。 那我们要创建自动化任务呢,其实也分两种方式,第一种就是选到这边的自动化面板,那它这里呢,有一些官方的参考视例了,不过大多数是跟开发相关,那我们选择新建一个自动化, 其实你看要填写的东西也非常简单,其实就是用提示词写好这些自动化是要做什么,然后我们可以在这里选好什么时候出发,我们也是可以自定义一个出发时间的, 然后这边就可以选择执行的模型和思考强度,最后点击创建即可。不过呢,我也还是倾向于让大家用第二种更简单的方式,就是直接在对话里跟 codex 说,那我们直接跟他说 帮我创建一个自动化任务,每周一早上九点自动化执行热门项目推荐的这个 skill, 产出一篇图文发到群里, ok, 那 我们在看自动化这里,它就已经帮我们设好了这个任务,我们随时也可以去改变它的时间。 再比如当你的这个邮箱插件 github 飞书都已经连上了 codex, 那 么你也可以让他每天下午六点帮我汇总日历上完成的会议, github 上面的提交记录和我的邮箱回复记录,生成一份全面的工作日报。 最后手机操控 codex 设置方法非常简单,手机上的 check gpt 和电脑上的 codex 都把它更新到最新版。之后打开手机上的 check gpt, 然后点击侧边栏的那个 codex, 它就会提示你允许这台手机控制你的电脑,直接就搞定了。如果你有多台电脑的话,也可以给它分别连上。这就等于你不管在大街上、地铁上还是朋友聚会,都可以随时随地地用手机下发一个任务,让 codex 在 你的电脑上干完一个活, 它就更像一个可以跟你远程协助的同事了。这个功能呢,目前免费版也可以用,但是主要能连的是 mac 系统的 codex。 好, 那到这里 codex 的 所有核心能力我们就全部过完了。来我们回顾一下。 codex 呢,可以操作我们的本地文件,可以使用我们电脑上的终端命令行工具。它还有两种构建持久记忆的方式,它还可以生成图片,而且它可以通过计划模式来做一个完整的项目开发。 那它有丰富的插件,可以操控浏览器和电脑,还可以把知识和流程沉淀成可附用的 skill 技能, 它可以使用 m c p 连接,外部它还可以设置自动化的定时任务。不过其实比起这些功能本身,我也希望大家记住两件事,第一就是我们真的有很多事情是已经可以交给 agent 做了。 那第二呢,就是我们已经从问 ai 的 阶段走向了管理 ai 的 阶段,因为过去我们使用 chat gpt 就是 有问题了,我们问一下,然后得到答案我们就走了。 那现在使用 codex 这类的 agent 呢?每个人都得像领导一样,帮他准备他所需要的上下文和工作环境,给他指明一些任务目标,然后来检查他的计划,监督他的过程,验收他的结果。 那同时领导还要负责把好的方法和流程沉淀成可付用的技能,把反复要做的事情设成自动化执行的规矩。好了,恭喜大家今天都升职了,记得点赞收藏关注我们下次见了。

你用 codex 成本高,很可能不是用不起 ai, 而是模型没接对,就很多人用 codex 只会配默认的配置。就是如果你 开始写高频,写文案,做 ppt 或者跑代码处理资料,你会发现一个问题,就是调用成本会越来越明显啊,这时候就去接这个 deepsea v 四这类模型就是一个很实用的思路, 逻辑很简单,就扣袋子负责工作流, deepsea 负责模型能力,就是一个负责操作,一个负责这个输出,就搭配起来成本会降低一点,中文场景也更顺手。 就大概这几个流程啊,第一步就是去 deepsea 后台拿官方的 api key, 第二步准备一个 cc switch, 第三步,把 api key 填配进去 啊。第四步,在这个 c c 维 switch 里面扣代词,去添加模型供应商啊。第五步就把请求地址填成这个本地的这个地址,这里有个坑啊,很多人会填错啊, apikey 就是 delete 的 这个,但是请求地址很多人就不会填,叫后台地址留言哈,我给你模板。 还有一个细节就是 cc 十位工具启动后啊,不要关,要关的话他调用就会失败。所以抠袋子接这个事情老点不在技术,而在你。没搞懂啊,这个模型跟中转的关系, 搞懂以后你就能够用更低的成本去跑不同的 ai 任务。就下一条,我出一个,就是这个小白怎么接的这个教程以及闭坑指南啊,照做。

如果你在用 codex 却还没装这个 skill, 就 别怪你的额度总是不够用了,因为在你使用 codex 的 时候啊,它不可避免的要去网上搜索各种信息,比如查找文档,做用户调研、爬 github 仓库,甚至我之前的 ai 捡爆系统, 也是需要 codex 去帮我搜索搜集 ai 资讯的。但搜索其实非常消耗头肯,因为 agent 每打开一个网页,都可能把大量的皱纹、无关的网页代码、广告信息都带进上下文里搜索,轮次一多呀,你的额度就吃不消了。 agent 这个 skill 就是 专门用来解决这个问题的, 因为 agent 在 使用这个 skill 的 时候,会自动调用 agent 的 a p i, 所有搜索工作搞定后,再通过 markdown 的 格式传回给 agent。 这样一来,最重的那些活全部交给 any search 了,我们自己的 agent 就 轻松很多,使用方法也非常的 ai 原声, 我们在它的官网上复制这个 skill 的 命令,粘贴发给 codex, 它自动就会安装好了。我们只需要在对话中调用它, codex 就 能自动使用。我们立刻来测试一下,首先引用 any search 这个 skill, 然后让 codex 帮我们对比下过去一周 cloud code 和 anti gravity 这三款主流的 ai 开发工具,在国内的社媒和论坛中哪个更受欢迎。 最后用一个简洁美观的 html 网页呈现给我们,我们先看一下额度啊,现在是百分之九十八,点击发送 any search 收到请求后,会从海量的信息渠道中精准路由到最相关的数据源。 我们来看看结果。首先他给出了结论, codex 综合第一,下面有一个评分表,然后就是比较重要的量化样本表, any search 追踪了 npm 下载量、 reddit 评论和 hacker news 的 帖子, 下面还有一些基于搜索结果定性的分析。从样本来源我们看到他搜索了非常多的网站,从安装源到国内的社区、论坛到官网都涉及到了, 搜索质量很高,整体消耗了我 codex 五小时额度的十八个点。同时我还让 codex 在 不使用 any search 这个 skill 的 条件下,用同样的 prompt 跑了一次,这是最终的结果。 整体呈现上信息简略了一些,搜索员也大幅减少消耗的额度,还比之前多出了五个点,这就是低效搜索带来的隐性成本。 所以 any search 的 价值呢,就是把这类重活儿专门交给搜索技术设施来完成。当然它也可以直接在网上进行初步体验,从专业维度到普通生活的各个领域都能覆盖,非常推荐。好了,我是阿朱,关注我,让我们一起在 ai 潮头冲浪!

兄弟们有没有使用这个 codex 的? 就是当上下我们满了之后,它会自动压缩嘛?就是现在经常会出现这个压缩失败,就这个, 呃,经常报这个错误啊。这个的话我们就是直接可以从一般情况我们使用的是 g p g 五点五直接切到五点三,然后随便输入点什么,让它自动去压缩一下就可以了。你看我这个的话现在是百分之九十一了, 这样的话他就能基本上就能压缩成功了,要不然的话你一直报错给他写不下去了。

一定要一定要一定要用 codex! 别再把时间浪费在研究一堆 ai 软件上了,直接用一个就是 codex。 为什么我一直在强调 codex? 因为大多数的 ai 只会解决某一个单点的问题。 但是 codex 不 一样,它更像一个真正懂分工、懂协助、懂结果的 ai 中书。你不会做视频没有关系, codex 会帮你调用像 runway、 sit down 这样的专业视频工具。你 不会写文案也没有关系, 他知道应该把任务交给 minus 这类最擅长内容创作的模型。你不会做音乐,也不用焦虑,他还能调用像 solno 这样的音乐生成工具。他真正厉害的地方不是他会某一项功能,而是他知道什么事情应该交给谁来做,并且他能帮你把整个流程串起来。 所以,未来真正拉开人与人差距的,从来不是你会不会操作软件,而是你有没有想法,能不能表达审美够不够好。大道至简。当工具越来越聪明,人最值钱的能力反而变成了更简单的东西, 就是把你想要什么讲清楚。你只需要开口说,哪怕你的普通话不够标准,哪怕带一点口音也没有关系, codex 都能听懂。他不要求你是技术高手,他只要求你有清晰的想法。 所以,如果你真的想提高效率,不要先学一堆技术,先抓住那个最核心的王,擒贼先擒王,在 ai 时代,扣贷就是那个王。

有一个 call 大 师的邪修玩法啊,就是每一个刚安装 call 大 师的人都必须输入一串命令,就是我是谁谁谁谁,然后我是干什么工作的,请你列出十个可以帮助我的 技能。当你玩的 call 大 师一段时间之后啊,你再输入这一串命令,就是基于你对我的了解和记忆啊。请列出十个可以优化我的工作零。

今天这期视频我就带大家完整拆解一下 codex 前端的一个交互界面,然后足够去讲清楚每一个功能按钮,它的作用,切换逻辑以及不同场景下我们该如何去搭配设置。学会之后你就能精准把控工具的权限,按需调配参数,把这款智能工具用出最佳的一个效果。 首先我们来看一下 codex 它前端交互界面的一个整体布局,那么在左侧呢是我们的一个菜单栏,在这里我们可以去发起新对话,搜索历史对话以及安装插件,还有就是设置自动化的一些任务,以及和移动端去进行一个打通,那么在这一块呢,我就不做过多的一个讲解。下面是我们项目展示一个区域,我们可以把自己的每次对话都 归类到不同的这样一个项目当中,便于我们后续的一个调用和查看。好,那我们来重点看一下在对话框这里的一个参数设置。 首先我们来看一下权限设置,这里分为四种方式,第一个是默认权限,那这个方式的话,对于我们来说他的安全等级是最高的,风险是最低的。如果说我们是刚开始使用 codex 的 话,那建议我们就直接选择默认权限就可以了。那第二种自动审查的话呢,他是在 codex 运行一些有风险的 任务的时候,他需要我们人为的去授权。第三个就是完全访问权限,那这个方式他的风险等级是最高的。 最后一个是自定义权限规则,我们可以在这个文件当中去自定义,我们对于 codex 在 运行任务的时候必须要遵循哪些安全的一个 原则,这是在这一块。第二个呢,我们是要去选择它的一个智能程度,那这里从低到中到高到超高,它的这种运行速度是越来越慢的,但是它的智能程度是越来越高的,所以在这里啊,对于我们普通 日常办公来说,我们就直接选择中就可以了。还有就是下面的模型,我们可以直接选择这个 g p t 五点五的一个模型。在速度这里呢,我们 建议大家可以直接选标准就可以了,所以呢这里的参数就直接大家在刚开始使用的时候,在权限这里就直接选择默认权限,然后呢智能这里选中 g p t 选五点五的模型,速度选标准就可以了。在下面我们可以选择本次对话 沉淀到哪一个项目当中,这里我们可以根据自己的实际情况选择,那么在后面的它的一个本地模式以及它的一个分支,我们直接默认就可以了。 接下来再给大家分享一个比较重要的 codex 啊,任务执行的一个逻辑,那分三种场景,第一个场景就是我们给他一个任务,他已经在执行当中了,但是呢我们发现之前给他的指令缺少了一些这个要求, 这个时候呢我想加入一些新的要求,让他在输出的时候也要考虑到我新加的要求。那比如说以我刚才这里的为例,我让他帮我整理成一个 word 文档,但是呢我缺少了一个要求,我可以直接在这里添加进去, 直接点击发送。然后呢我们如果想他这一轮的输出,把我这个需求考虑进去的话,直接点击引导,那他就会直接把我新的这一个要求给考虑进去,这是第一种场景,第二种场景就是当他这个任务执行完过后, 我想要它继续执行下一个任务,那这个时候呢,我们就直接在这里输入新的一个任务要求。 好,这个时候我们就可以不用点引导,它在执行上一个任务完成过后,就会自动去执行帮我生成一份 pdf 的 这一个任务。那这里就讲到两个场景,第一个是对于我现有任务的一个补充,它可以把我新的要求考虑进去。第二个呢就是我 给他再给一个新的要求,让他在上一个任务执行完过后,继续去执行我的下一个任务。还有一种场景就是希望他并行去执行我们的任务,那这个时候呢,我们就只需要最简单的在这里去打开一个新的对话, 然后点击提交就可以了,你会发现这个时候系统他会去并行执行我不同的一个任务,那么这个就是我们 codex 在 前端执行任务的时候,他有三种不同的一个方式。 好,那么本期的视频就先到这里,今天给大家分享重点内容就是如何去设置我们的安全等级,选择智能程度以及我们的模型和我们的一个速度。大家有任何疑问也可以在评论区留言, 后续我会推出更加实,后续我也会持续推出在办公场景下一些好用的 ai 使用小技巧,欢迎大家点赞关注加收藏。

大家好,今天我们开始讲 codex 的 入门系列,这期我会从零演示一遍 codex 如何安装,怎么打开项目,怎么让它整理资料,分析表格,最后再基于结果生成一张图片。 看完之后你基本就知道第一词应该怎么用了。很多人第一次听到 codex 会以为它只是给程序员写代码的工具,但是我觉得它真正有价值的地方远远不止写代码它。你可以把 codex 理解成一个可以围绕你电脑资料工作的一个 ai 助手。 相比于传统的这种聊天式的 ai 工具,他不是你问一句,他答一句,他可以基于你指定的文件夹去理解里面的文档、表格、截图和各种资料,然后帮你整理分析跟生成结果。 比如说你要做调研,他可以帮你整理资料,你要做计划,他可以帮你把零散的信息变成了行动目标,你可以分析表格,你可以去提炼脚本大纲,甚至生成配图等等。 所以我觉得 codex 对 于普通人也很有价值,只要你的工作经常发生在电脑上,需要处理文件资料啊,调研等等,我就觉得你应该试一下。 好,今天我们首先从安装开始。安装很简单,我们第一步需要打开 codex 的 官方网站,根据你的系统选择对应版本啊, mac 就 选 mac, windows 也可以, windows 安装过程跟普通的软件差不多,就按照提示一步一步完成就可以了。安装完成以后,打开 codex 登录你的 chat gpt 的 账号 啊,然后第一次登录的时候,他可能会让你选择主要的用途,那这我们可以看到这他是有一个工作模式,你是主要用于编程还是日常工作,这个之后都可以修改,但是如果你选择编程的话,他的回答会更技术性一点,更细节一点点。 登录之后你就来到了这个 codex 的 主界面,这个界面可以简单理解成三个区域,左边这块是这个项目跟任务列表,中间是你跟 codex 对 话的地方,右边通常会显示他正在处理的内容啊,或者可以生成的结果等等。接下来讲第一个概念叫做项目, codex 里面的项目本质上就是你对应你电脑里的一个文件夹,你选择哪个文件夹, codex 就 围绕这个文件夹里面的资料来进行工作。我这里用一个普通的例子,比如说啊,我这里可以选择添加新项目,使用现有文件夹就可以找到你自己对应的一个文件夹去作为你想工作的一个区域。 这里准备了一个很普通的例子,周末去杭州玩两天,这个文件夹里面有一些零散资料,比如说旅行笔记,想去的地方,想吃的店等等,也有一些截图、天气或者是酒店的一些路线信息。 在这个下拉菜单,这可以指定你想要的这个项目的文件夹,在这使用现有文件夹就可以指定你的工作目录,比如说我们可以简单看一下他们前 直接在这对话的形式告诉他啊,你可以查看我这个项目下面的一些文件等等。 比如说如果这我想要他帮忙整理这个文件里面的一些资料,比如说整理一个对应的杭州旅行计划, 我们可以通过语音的形式,在这有一个语音的形式,帮我整理一份杭州周末的旅行计划,内容包括目标行程安排,预算,需要提前准备的事项,以及如果下雨的备用方案等等。啊,需要 dog 的 文档,然后有图文, 对,然后就有语音的形式,在这我们可以选择它的智能的一个高低,一般来说高就足够了,然后除了这个智能,就是它的思考的一个深度, 如果是特别复杂的问题,你就可以选择超高,但它对应消耗的 token 会更多一点点,然后在这儿你可以选择对应的模型,现在最新的就是叉 gdp 五点五的这个模型,速度一般就是有标准跟快速,然后快速会一点五倍的快,但是同样的 token 数会增加。在这我们为了演示选择快速,我就开始 看,经过了这个两分二十秒,他就生成了这个文档,我们打开看一下,那就生成了一份两天两晚的旅行计划,有一个目标概,里面有图片也有表格,有对应酒店的一些住宿的建议, 以及两晚的一些价格,餐厅的一些备选,总的来说是非常全面,也非常友好。对于这种复杂文件整理的情况来说,帮我们完成了多的一个信息整理, 这也是 codex 跟普通的聊天工具最大的区别。普通的聊天工具需要在兑换框里面,你反复的复制粘贴文件,然后告诉他怎么做,他再告诉你怎么做,你可能需要去,然后你自己再去操作。但 codex 真正就是 在你指定的这个文件夹里面去读写,去生成你想要的文件,真正帮你去完成了这工作,我们可以看一下在对应的项目下面,他已经生成了这一份文档,相当于你就不需要去手动的去啊复制粘贴很多重复工作。 你可以想象一下,如果你是学生,你可以把论文资料啊,阅读笔记放到一个啊文文件夹,然后让他去生成论文。提高啊,你是做运营的,你同样也可以把这个沟通资料表格,会议记录,让他生成一个执行方案等等。销售啊,可以让他去根据你的客户资料和沟通记录进行一个跟进的计划, 所以这个就是 context 真正有用的地方,他不是给你建议,也不是告诉你怎么做,而是直接帮你去处理资料生成结果啊,这到就会极大的提高你的工作效率。 接下来我讲第二个概念,就是啊县城,就是对于同一个项目来说,你可以啊开多个县城,比如说这是这个项目本身,然后我们可以开,同时在这下面开一个新的,就叫县城,比如说分析一下,在这我想让他帮忙分析一下预算, 这样它会读写里面的一些表格啊,然后生成表格啊等等啊。同时我还想要调用这个啊, x g b t 的 那个深图模型,那么目前这个模型也是市面上深图能力最强的。 对,这样你看我们在左边就能看到转圈的,是正在运行的,然后黄蓝色的小点表示已经完成,这是帮我们那个预算的,它能够生成一个像 csv 的 一些信息,然后它也能够读取原本里面的一些信息啊,对, 让我们再看一下这个 啊,经过这个几分钟他就生成了啊,然后他就生成了一个图片,我们可以看一下效果啊,还是很不错的。就是根据我们刚才的一些旅行安排,然后生成了一个啊,非常清晰,然后也很信息量比较全面的一个旅行安排。对, 然后这个地方有一个点我也想介绍它的功能,比如说在这个工一开始的过程当中,他是尝试生成一个 svg 的 图片,然后没有调用他的,我想他调的那个工具叫 emoji 键啊,在这儿,所以我就用这个,在这个地方可以打断他,比如说用户他还在生成当中,我可以直接啊, 直接去发送,然后他就可以可以调整他的方向啊。另外大家也可以在这个设置地方可以看到自己的一个使用量,在这个地方设置 下面有个剩余用量,他这边有一个每五小时跟一周的一个限制啊。一般来说如果你是叉 g t 的 plus 账户的话,就是啊,你进行一些高强度的整理文章啊,调研啊来说,一般来说是没什么问题的啊。然后 open i 也经常时不时会重置他们的这个限制啊,所以说相比克拉扣的来说,这一点是非常好的,有点量大管饱的意思, 哎,我们回顾一下这一期,就是第一个就是首先 codex 它不只是写代码,它更像是一个可以围绕你电脑资料这么工作的一个 ai 助手。第二个是 codex 里面的一个概念就是项目,项目本质上就是你对应你你选择的一个文件夹。第三个就是同一个项目里面可以开多个县城啊,不同县城处理不同任务 啊。第四个就是啊,他可以帮你整理资料啊,分析表格,生成图片等等一些工具啊。第五个就是你怎么样去看选择模型,速度以及以及查看你的使用量等等。 这一期只是一些基本的一些概念,但是以及能够看到 codex 的 一些核心价值啊,他不只是在告诉你怎么做,而是真的去帮你去完成一项工作啊。 下一期我们会继续讲一些更进阶也更实用的功能,比如说插件呢啊,技能啊,智能浏览器辅助自动化任务,以及啊怎么把一个复杂的任务拆解成几步让他啊连续几天或者上周的去持续的运行啊。这期先到这,请大家继续关注这个系列。