粉丝82获赞879

今天教你两个小技巧,让你的 codex 变得又快又聪明。首先我们打开 codex, 打开 codex 前呢,我们运行这条命令去更新,我们分为两块来说,一个是如何让 gpt 变得更加聪明,一个是让 gpt 如何变得更加快, 变得更加聪明呢?其实我就是我们在模型选择上,我们需要去适配自己的一个这个需求,并且我们要设置好一些模型的思考深度。 我们在选择模型上,其实我平时用的比较多的可能是 gpt 五点四啊,但 gpt 五点三 codex 在 部分场景下,它的性能其实会优于 gpt 五点四。那为什么这么说呢?因为 gpt 五点四它在更新中啊,我们上期视频有提到它的这个工具搜索的能力, 它是会去适配你的需求,然后去搜索想要调用的工具,这样就导致一个问题,就是它在一些场景下,其实我不想让它调用工具,它非要去调用工具,因为它为了 token 嘛, 它会调用一个工具去写一个 python, 写完 python 之后用这个 python 脚本去改代码啊,就是这样一套流程操作完之后呢,我觉得它的效率和精准度我觉得其实是不如 gpt 五点三 codex 的, 他直接改,他哪怕多费点 token, 但是大部分场景下其实五点四还是不错的啊,我这边就选择五点四了。 好,那进来之后呢?这边有思考深度,很多人就不知道这个应该怎么选了,他有低中高和超级高, 我个人在大部分情况下我都选择茶嗨,也就是超级高。思考的模式的话,大部分情况下就是匹配你自己的需求吗?如果你的这个问题呢,是比较大的,比较重的一个任务。 我举个例子,你从零开始构建一个非常大的项目,或者说你把别人项目,你想要完全的重构,那这样一个比较大的工程的话,那必须要去选择超级高啊, 但他花的时间会非常长,但是他的模型的智商啊,也是会非常的在线,基本上一遍或者两遍就能改好 啊。那还有一种情况下选择超级高是什么呢?就是比如说你布置了一个任务之后,不管这任务大小哈,你布置了一个任务之后,你就不不管他了,我可能去吃饭,我跟你出门了,那就选择超级高,因为你就让他慢慢做,就就不差这个时间。 实际上他这四种模式呢,其实关键的差距就在于时间。当然 token 也有差距,平时你比如说一些小的改动,改动就涉及几行代码,或者说就涉及一个文件的时候,那你就选择中的啊,这个第一是不建议去选了,我们这选择超级高 这个智商讲完呢,就是速度,那速度其实有很多方面,第一个是这个 fast 模式,我们一定要开启,它可以提升你这个模型 token 的 输出速度 啊,但他会两倍计费啊。我这边是已经开启,再再点一下,就是这边要 on the mode set to on 啊,这就是开启了,如果是 set to off, 那 就是关闭,因为你可能之前已经开启过了。然后还有一个就是这个权限的问题, 如果你不知重的任务,我建议也是给他完全权限,那为什么这么说呢?就是他有可能中断了, 那我可能一个小时,两个小时,那我都得盯着,对吧?其实大部分情况下做不到的,那我就选择完全开启,在完全开启的情况下呢,他是可以直接不经过你的授权修改删除任何的文件。 所以我们在开启这个模式之后呢,我们一定要去做好备份啊,或者是用 get 去做好这个仓库的管理啊,不然的话有可能你的代码会完全丢失啊。你如果仓库管理做好,他误伤了你什么文件,你直接回退一个版本就好了。其实我自己用是开启,但是大家要注意一下,就是 如果是一些老版本你们不愿意更新的话,那就在这个选项里面,它是一个实验性的功能,它有一个叫 marty agent, 也就是呃窝代理的这个功能。新版我刚刚看了,已经是默认开启了 这个功能。之前你在斜杠输入命令 m u 的 话,如果他有的话,他会直接在这里跳出来,就是有一些老版本他是在这边,有一些是在那个呃实验性功能,这这个设置里面都有可能。那个东西他是干嘛用的呢? 就比如说你读取文件啊,我现在有三个文件,对不对?我现在要让他读取这个项目,理解这个项目,那如果你开启 martingale 的 话,他会同时去, 就是多县城的去读取,三个并行去读取,那他的速度就会快非常多。最后读取完之后呢,再统一导入到主代理上,让主代理去理解。所以说你有非常多文件,像像这个文件夹,它有非常多文件,比如说十个文件, 但之前的老版本他需要一个一个去读取,我比如说读完这个去读这个,读完这个去读这个就是太慢了。 那现在的这个 martingale 呢?这个模式是非常非常重要的,所以说大家一定要开启这个对于你的速度的优化是有一个 质的飞跃啊。但整体以 codex 目前的这个使用技巧也就这些,过去如果 codex 有 一些新的更新,我也会同步给大家。好,那本期视频到此结束,我是程序员秃头哥,学 ai, 关注我不迷路。

一句话让 codas 证明你自己。那很多人用 codas 还停留在命令它完成任务,但有一个更有效的用法,让 codas 反过来研究你你每天反复做的那些事情,整理资料,写日报,同步笔记,复盘项目。你以为这是琐事,但在 codas 眼里,这些都是可以被提炼的工作流。那方法很简单,打开 codas 记忆功能,从设置个性化开启记忆, 然后直接把这段提示词丢给他。那请回顾我最近的工作记录和历史。绘画,识别我反复执行的任务类型,提炼其中稳定的步骤,判断标准和输出格式,并把它们设计成为可长期服用的 skill。 那 它就会把你平时怎么做事,怎么判断,怎么输出,整理成一套可调用的 skill。 以后碰到同类的任务就不用再从头解释了。 那 code 会按照你过去的习惯直接进入一个流程,并且这个 skill 还会持续进化。那如果流程变了,去更新旧的 skill, 如果场景变了,可以拆除新的 skill。 那 我自己尝试了一下,瞬间生成了五个新 skill, 快 去试试吧。

跑一整页 gpt 五点五加 codex 如何跑一整页?我这两天有一个感觉, ai 编程的下一步不是辅助编程,而是可托管的执行单元。 gpt 五点五真正的红利不是少写几行代码,而是把一个人能托管的工作块变大。有人给 gpt 五点五 codex 一 份新项目 prd 只说了一个 go, 他 就跑了几个小时,从 bill 到 visual review, 再继续补功能。 gpt 五点五的变化从更聪明改写成更能被托管。 g p t。 五点五不像以前的模型,需要你一步步指导,它更能理解你的意图后自己把活干完,包括构建、调试、跨文件修改。 g p t。 五点五在 codex 里强化了闭环自主性。 g p t。 五点五在 codex 里对高层次指令响应极强。 openai 的 norm brown 说自己明明是 manager, 但用了 g p t。 五点五以后,比过去任何时候都更像一个有效 i c。 他作为经理,却觉得自己在技术产出上达到了新高峰。 ai 编程这件事,好像开始从你在旁边指挥他写,变成你能不能把一块工作托管给他。这就不像传统意义上的在旁盯着一次次交互改的 ai 辅助编程了。代理式编程越来越关乎时间跨度,而不仅仅是单次智能。 当 codex 这种 agent 可以 连续跑几个小时,十几个小时,甚至官方展示到二十五小时以后,未来我们该怎么把它从辅助编程当成可托管执行单元来管理?这我觉得很重要。 这里面会有一种更大的变化,高级人类会越来越像经理加架构师加验收者的混合体。 大家应该有好奇怎么跑长任务,我时常的提示也喜欢让它跑得久一点,把时间跨度拉长的端到端的来验收。 许多人知道它能写代码,但不知道怎么让它把一个大任务跑完。早在 cloud code 泄露的时候,有人用 oh my codex 赶在天亮之前把它用 python 重构了一遍。据它所述,全程都是 codex 自主执行。 o max 系列还有 cloud code 属于是同一作者所做。 o m x 是 在给 codex 包一层长跑工作流和团队运行时,一句话丢给你的 ai 它自己装完。还有一个可能很多人听过的 superpowers, 它长跑不是靠模型硬扛,是靠方法论,把人类判断外质成流程。回到官方材料里,这件事其实更清楚。 open ai 今年二月发过一篇文章,叫 run long horizon tasks with codex, 里面有一个很夸张的实验, 他们给 codex 一个空 report, 一个任务,让他从零构建一个 design tool。 codex 用 gpt 五点三, codex 在 extra high reasoning 下连续跑了大概二十五个小时,大概十三米 tokens, 大 概三十 k 行代码。 这组数字很容易被拿来当标题党,二十五小时十三密 tokens 三十 k 行代码,一看就很爽。但我觉得这篇官方文章最重要的地方,反而不是这些数字。最重要的是, openai 把它为什么没跑丢 拆给你看了。它不是靠一句神奇 prompt, 它靠的是一套很土但是很工程化的东西。四个 markdown 文件,你得给它项目记忆, 你得给他计划,你得给他验收标准,你得让他在跑的过程中持续写状态,像是在给一个会干活但会忘事的人建工位、排日程,留工单做验收一位 gpt 五点二。早期实践者说 codex 诺任长跑会 do outcome, 需要 continuity guidance, 它的连续运行三小时且思路连贯的方法是下面这个提示词。另外我翻了一下 codex chain log, childgo 中出现 memory extensions、 window 等等相关变更。这些不是宣传剧,但它们说明底层工程也在补。状态恢复、审批上下文本事 越长跑越不像单纯模型,能力越像状态机。权限恢复和审计系统状态机有点不一样,它植入硬编码程序来支撑长跑,在一定时间还能清空上下文。这个值得聊,以后再论。 我看到 reddit 上有人问怎么让 codex autonomous 地跑几个小时,它的痛点很直白,它不想把 codex 当 chat assistant, 它想让它像 autonomous agent 一 样连续做 feature 或 refactor, 但现实是它坐一轮就停,等你继续说 continue。 还有人想让 codex cloud 并行处理四到五个任务,自己只 review code, 每个 runner 大 约每小时仍要人工 approval 一 轮,步骤有限,做完就 summary, 然后等确认 步骤塞多了又容易碰 context limit 或 compression。 cloud 有 时像黑盒任务卡住,但不知道为什么。 github issue 里也有类似的具体症状,用户想形成 continuous loop, 但 codex 每做一个小块就 report back 打断连续执行,最后用户只能 q 多条 continue。 跑 codex 的 关键矛盾不是模型能不能连续工作,而是人能不能在他连续工作的时候保留控制权、证据链和恢复能力。这就是为什么最近很多相关东西都在往智力层长。接着这里还有一些内容,你可以在原文这里阅读。 g p t 五点五是入口, codex 二十五小时是证据,但下一个问题不是它还能跑多久。下一个问题是,跑完以后你凭什么相信它? 如果没有状态机,长跑只是一次更贵的走神。如果没有证据链,睡醒验收就会变成开盲盒。如果没有熔断器,它可能会在错误方向上越跑越勤奋。 如果没有恢复包,你中途打断一次,下一轮就要重新考古好了。这里是 ai 进修生,持续分享前沿 ai 实践,如果不错,点个赞,关注一下,我们下期不见不散!

让你志能游天的 ai 动起手来吧!把这个文件夹里的文件按照类别整理好,按顺序改成项目一。项目二,咦,每天早上九点,搜集前一天的 ai 行业资讯,发到群里看,总结这个文档里的内容,生成 ppt。 这期避开专业难懂的术语,让小白也能够流畅运用上扣带,让你的工作效率和创新全面提升。我们先认识它,再到如何使用安装,用六个按键一步步的掌握它。其实词和小技巧呢,我也总结到了,视频里出发 扣带斯和可劳扣的它们呢,是类似的,都是 ai 的 编程工具,只不过一个呢,是 oppo ai 家的,默认的是 gpt 模型的,但你也可以在里面去更换你自己的模型,但你也可以在里面去更换你自己的模型。 这两个阶段性地成为目前好的必然模式。但它们适合使用的场景呢,会有点不同。 ko 代斯,它呢,就适合我用来快速整理文档,处理一些。这种本地的任务界面,对于小白来说会比较友好一点,就很适合初学者或者是我们日常的办公场景。因为是 open ai 的 嘛,所以呢,我们也可以直接在里面调用 j p e m 叉二来生成图片,而 可牢扣的会比较适合追求高质量的创作用户,并且 c c 的 知名度会高一点,所以不论哪种语言,你都能找到关于它的类似教程。 之前还在说 c c 可以 用手机来控制 c c, 在 前几天也出了手机端,二者的功能差距又缩小了。 c c 的 小白使用教程呢,我们之前也聊过,有兴趣的可以去复习一下。那我们要使用 c c, 我 们只需要一个 g p 的 账号, 免费的呢,也是可以用的,只不过它的额度会少一点,会有三种不同的使用路径,就是使用哪种方法来开启你的扣袋子。 c r i 呢,会在你本地去开发操作,你的本地项目就比较适合开发者深度来使用,因为需要一些命令行的使用,所以会有一丢丢的小难度。那这个呢,就是把扣袋子装进你的代码编辑器里, 像 vivo studio code, 反重力这种的,而我们普通用户呢,直接选择这个就可以了,不用懂。命令行,适合大多数人来使用, ok, 我 们来进行安装,我们按照它的指引步骤来操作就好了。进来之后呢,我们可以看到它的整个页面跟我们常用的 ai 工具还是很像的。而左边的这个导航栏就是你的文件柜, 所有的功能入口都会在这里去显示,而中间的呢就是我们对话交流的地方,而右边这里就是你小助理给你交作业的地方,成果的展示区域。而左边的这个导航栏,每一个入口都是一个工作流。在这里重点的呢就是这两个 来快速对话,就是主打一个随问随答,碎片式的对话,就像你给他一个英文的演讲稿件,然后让他给我翻译出来,哎,还挺到位的。像这种只是问问问题,写写代码和 check gdp 呢,其实相差不大。而这个项目呢,它就更适合一些长线的 摸不准,需要高度上下分连贯的这种复杂任务。点击这里我们可以看到这里呢会有两个选项,这个呢是在你默认的路径下新建一个空白的文件夹, 而另一个就是说打开你电脑上的现有文件夹,在这个基础上再去操作。比如给他一个本地的文档,里面呢是一堆的发票图片,那我们在这个对话框的下面也可以看到,我现在是在这个文件夹里进行操作的,这就触碰了沙箱机制,只能操作本地选中的文件夹,不能操作系统其他的文件。那我们现在给他要求根据这几张发票, 然后给我按照金额重新命名一下文件。当然只有这些呢,还是不够的,我们还需要给他开放对应的权限,那我们可以点击这里可以看到这里有三个模式,分别是你只能在当前的文件夹下来修改或者执行, 如果需要联网或者说触碰这个文件夹以外的东西,需要来向我们申请,我们同意,他呢才能继续执行。而这个呢,恰恰相反,他可以自由的读取、写入,修改或者删除目标范围内的程序。 自主性呢会比较高一些,但也会有一定的风险。在我在这种简单的任务下呢,会选择这个模式,简而言之呢,就是 ai 会自主的帮你筛查这个有没有危险,像安装常规的工具这种明显安全的操作,它呢就会直接上手了, 不会再来询问你了。 ok, 他 也操作好了,我们来看一下,那整体呢,也是根据我的这个内容来命名的,还是不错的。那除了帮我们整理本地的文档,还可以在我们授权的情况下,在你的电脑上来执行安装的操作。比如最近爆火,但有点上手门槛了。 cloud code, 我 们在 d 盘新建一个文件夹, 然后回到这个 codex 里面,再把这个文件夹给它呼唤出来。那这步的意思呢,就是让 c c 在 这里面进行操作,那我直接给他说帮我安装一个 colocode, 那 我们稍等一下。好,他现在呢说已经安装好了,我们来启动一下。哦,是可以的了,当然也包括 node js, git 这种我们日常生活中经常用到的依赖。 好,现在你用 codex 整理了你本地的文件夹,大大缩短了你的时间,也把有点安装困难的软件安装到了你的电脑上。对于听到 ai 编程就望而却步的,棒的就不止一点点了。当然 ai 编程嘛,也不能把它的能力举现在这里来, 我们一起做一个芝士机械超玩盲盒,咱们就都是原始谷的动画了。那我们呢,现在在这里选择好它原始的位置,先点击这个加号,那最上面的这个呢,就是我们上传文件, ppt, excel 图片,我们也想让它们进入到这个转化里, 就在这里上传,和我们直接拖拽是一个效果。那中间这个计划模式,在这个模式下呢,他不会立刻来改动我们的文件,而是先帮我列出一个详细的计划,就比较适合复杂项目,或者是你还没有思路的情况。 那右边这里呢,是用来更换模型的,我觉得五点五还是比较好用的,这里呢我就不更换,还有对应的推理强度,也可以在这里去更改。那我现在告诉他我的一些具体要求, 如果你有了一定的构思之后,也可以一起告诉他,当然如果没有的话,直接给他说我们最后想要一个什么效果,他呢也会一步步的引导我们来做出最后的成品,好开始帮我们来构思整个架构了。 哎,他现在问我盲盒系列规模要按照什么来设计?规模怎么搭配?那我们把鼠标放到这个小符号的上面,也会有个更详尽的一个介绍。好,那我在这里选择第一个, 他现在呢还是用这种选择方式来一步步引导我们表达出我们想要的东西,那我们顺着他的想法来就好了。那都选好之后呢,他也给了我一个整体的框架,我大概看了一下还是不错的,那觉得 ok 了,我们就可以让他开始执行,当然我们有需要更改地方,我们直接在这里提出要求就好了,那我们现在同意执行。 ok, 他 现在也在运行中了,在这个思考的过程中呢,我突然想起来,我想让他滑动的时候有一个光效,那我直接在这里提出我的要求。 哎,他现在啊根本就没有办法发出去,而是在这个地方排着这个情况呢,他会在这个任务完成之后再来执行我们现在的这个任务,但是不行啊,我现在就让他考虑到这个要求,并且加进去,那我就点击这里的这个按钮,他呢就插队到了当前的这个任务中, 而路由思呢也会考虑到我们这个要求继续执行,这就是一个插队的小技巧了。好,他现在说呢是可以了,我们先不着急,我们把鼠标放到这个小圆圈上,我们就能观察到我们这个窗口一共用了百分之几。路由思在快满的时候呢,它也会自动的来进行压缩上下文,但因为上下文太多的话,路由思就会表现的不那么聪明了, 那我们就可以手动的来进行压缩,在这里我们打斜杠压缩就好了,他呢就会把上面的聊天记录进行精简,但更细节的东西呢,他也就会不再记录了。 ok, 我 们来看一下我们刚才生成的这小网站,这个例子动销交互界面 还是不错的,那如何实现多任务并行进行呢?那我在本地选择一个项目文件里面呢,有往期的图片还有视频,在这里输入我的要求,把里面按照类别给我分类。好, 那我们再开一个,我要这个把文件里的图片和视频根据内容说明,你再来一个吧,把视频分离出来,音频, ok, 你 看他们在这里努力的转圈圈,我们来看一下结果,这个类别是分为好的,这里是视频的,还有图片的。不得不说啊,他这个名字和内容还起的挺相符的,所以说这里呢,他的每次对话都是独立的,不会再与其他的工作内容产生深度的关联,但都会有权限查看当前的文件夹内容。 到这里我们日常使用是 ok 的 了。更进阶一点的呢,就是扣带斯的插件技能 m c p 这三个词就是小白最大的路虎了,其实一句话就能解释清楚, 插件呢,就是给扣带斯装了一个能力包,比如装了表格插件,它呢就会处理 excel。 而技能 skill 大家都很熟悉了,就是一套固定的工作流程,可以根据我自己的风格来写一篇技术教程。 m c p 就是 连接外部的通用通道,比如我要用扣带斯做一个这样的效果,通过自然语言创建动画视频的技能。包好,我先给他一个文件夹, 然后把要求现在都给他,如果你有想要的效果,那我们就点击这里上传,然后把参考一并发给他。 ok, 他 现在呢是开始工作了, 里面需要的什么依赖啊,组建都不需要,我们再去手动的去添加,他呢都会帮助我们去一步步的完成。好,他现在运行完毕了,我们打开这个呢,是 windows 默认的浏览器浏览一下, 你在这里可以随意的来调节这个动画了,因为在一开始的时候,我提示词中已经提到了提供可以配置的参数项,那我们调节一下。 ok, 我 们关掉背景,那想要这种透明的效果呢?参数的配置是这些,那我们最后给他宣传好就 ok 了。 个人建议,一开始呢,什么插件我们都不要慌,先用它内置能力,等你明确知道了我需要库代词,去安装某个工具能力的时候, 再去插件页寻找也是来得及的,大家有兴趣的我们可以单独出一期,详细聊一聊。说了这么多,其实你也发现了, ai 现在就不只是答疑解惑的工 具了,它呢挑出了一个被动执行的命令曲线,是可以理解你的意图,帮助你完成复杂任务的智能伙伴。而每次操作呢,也成为了我们学习、创新和突破的机会。好了,喜欢这种内容的朋友呢,我们下次见。

一个十几行的小文件,能让 codex 的 输出质量提升一倍以上,这不是夸张,是 codex 官方文档第一条就强调的是这个文件叫 agents md。 今天讲怎么写,写对了,体验完全不一样。 agents md 就是 你给 codex 写的一份项目使用说明。 codex 每次启动的时候会自动读这个文件,不需要你手动加载,也不需要每次粘贴。你在终端里输入斜杠 init, 它就会根据你当前项目自动生成一个模板,你在上面改就行。 你可以理解成 agent m d 就是 codex 的 项目脑,没有这个文件,他每次都是一个失忆的新人,有了这个文件,他一上来就知道你的项目怎么跑,有什么规矩?那具体写什么呢? 很多人的第一反应是把项目文档全搬进去,写个几百行,千万别这么赶。 codex 有 一个三十二 kb 的 硬性上限,超了直接截断重要规则可能就丢了。 而且就算没抄写太长,它也会选择性忽略。我的建议是,只写五类东西,按重要性排。第一,怎么跑?命令用什么测试框架,什么 link 工具,什么包管理器?比如跑测试用 m p m test, 装依赖用 p m p m install。 第二,提交前要做什么? 比如 p r 前必须跑 m p m round link 和 m p m test 都通过才能提。第三,哪些东西不能碰?比如不要修改 e n v 文件,不要动 migrations 目录下的已有文件。第四,项目特殊约定,比如 commit message 的 格式变量命名用驼峰还是下划线? 第五,加依赖的规矩,比如安装新的生产依赖之前先问,我就这五类,每类一两句话就够了,整个文件控制在十几行以内是最舒服的状态。 知道写什么之后,说三个特别容易踩的坑。第一个坑,写态度,不写命令,请认真对待代码质量。这种话, codex 看了等于没看,你要写 p 二前跑 m p m run link, 给他具体的动作,他才知道怎么执行。 第二个坑,把他已经能猜到的东西写进去。如果你项目根目录有 stanfig g s o n, 你 就不用再写本项目使用 tab script 了,他看得到你写了,反而是噪音,会稀释真正重要的规则。 第三个坑,写完就不管了,项目在变,规则也在变,每隔一两周回去看一眼。如果某条规则删掉, codex 照样做得对,说明它已经能从代码里推断出来了,删掉就好,保持精简,越短越有效。 基础写法讲完了,说一个进阶用法,分层管理。如果你的项目是单仓库多服务,比如后端用 python, 前端用 python, 规则完全不一样,全写在一个文件里, codex 会混乱。正确做法是利用目录层级,根目录放通用规则,比如 commit 格式、 pr 流程, 然后在每个服务的子目录里各放一个 agents md, 写各自的测试命令和代码规范, codex 进入哪个目录就自动叠加哪条链路上的规则,离当前目录越近的,优先级越高。 另外还有一个小技巧,如果你想临时改规则,但不想动员文件,在同目录下新建一个 agents override md 就 行,它会自动覆盖原来的,删掉就恢复,非常方便。 总结就一句话, agents md 不是 写的越多越好,是写的越准越好。 agents md 写好了,它比你想象的靠谱得多。关注 maxim, 持续分享更多有意思的内容!

hello, 大家好,我是 fred, 专注从普通小白的视角去分享怎么从零开始用 ai 和 web coding, 提升自己生活和工作效率。很多人装完 codex 第一反应就是马上去让他写代码,但我会让他做另外一件事情,也就是 给他写好 hmd。 因为 ai 其实不怕复杂的任务,怕的是一开始没有规则,没有规则的时候他可能讲太多,改太多,甚至把你不想动的地方也顺手动的。所以说我们这期会先讲怎么让 codex 在 动手之前先知道你的规矩。 第一,什么是 a g m d? 大家可以把 a g m d 理解成 ai 的 一个写作的说明书,它会告诉 codex 这个项目怎么沟通,怎么写代码,哪些安全底线不能碰,哪些操作必须先问 以前这些要求,你可能要每次重复的去讲,去写进这个文件以后,它就会变成一个默认的规则,你不用每次去教 codex 怎么去配合你。 然后第一部分,其就是他的整个的语言的使用规范,因为我日常沟通就用中文嘛,这样去讨论需求和复盘问题其实更顺的。 但是像在代码,包括命令行啊、变量名啊、日制和报错,其还是要保留英文的。原因很简单,就是因为 英文报错可以直接去搜索,方便去定位问题,如果全翻译成中文,反而会降低排查的效率。所以说我的原则是解释用中文,哎,记住信息,保留原样。 第二部分就是它的代码和提交的规范。虽然我们大家都看不懂代码,但是我也不希望 ai 为了去显得完整,去提前写一堆复杂抽象的东西,其当前需要什么东西,就把当前的问题解决干净,如果单个文件太长, 那就去拆主键,拆函数,去拆模块,每次改动尽量小一些,提交清楚啊,每一次的记录,这样后面口袋再去维护的时候,才不会被一大堆的这种十三代码去劝退,对吧? 第三个最核心的点就是安全,与红线类似,像这种密码啊,密钥啊, a p r key 啊,这种是不能够直接写进代码的,然后包括像点 e n v 这种本地配置的文件,也不能提交到仓库,包括日期,也不要输出一些隐私的信息。 像日常的一些小改动,其实可以用一些低摩擦的去执行,但比如涉及到一些接口的结构啊,数据库的制段啊,批量去删除一些文件啊,或者说一些外部的账号和数据,就必须天 先让他停下来跟我确认。其实这不是去增加一些流程啊,而是防止一次自动执行,把一些项目改到不可控的状态。 然后第四个就是它的整个的执行与测试的工作流。就很多时候 ai 说,诶,我已经修好了,其实不重要,就验证通过才重要,你知道吧? 所以说如果命令报错,要如实的去上 ai 报告,然后包括测试失败也不能查,包括修 bug 的 时候,最好去先写一个能够复现问题的测试,再去改代码,就跑完以后能跑测试就跑测试,能跑 nin 就 跑 nin, 这样才能够减少 ai 的 整个的一个幻觉, 想让他看起来完成,但实际上不能用的这种情况。然后最呃第五个呢,是我自己的一个用户习惯,因为我会要求他叫我 fred, 包括我自己的偏好去直奔主题,找一些形式化的确认,能够直接做的就日常 直接做啊,但涉及到一些可能删除啊,密钥啊,权限啊,上传啊,账号操作这种风险点啊,就必须还是跟我确认,这样应该就不是机械的去回复我,而是更贴近我自己的一个工作节奏。 然后像呃目前我的这个 a g m e a i 的 一个工作模式的话,就是遇到熟悉的问题,他会去用一些内置的 skills, 而不是每次都从零开始去乱试,包括改完源码之后去默认跑测试,降低一些低级的语法错误,也不会去做一些多余的发散。 真正高效的写作不是让 ai 写得越多越好,而是在正确正确的这种边界里面把当前的问题解决掉。 所以说我可以给大家看一下当前我整个的一个 h m d 啊,包括刚刚所说到的语言的问题,安全红线的问题,工作流程的问题以及代码标准的问题,和我自己的一些用户偏好,其实跟刚刚讲的是完全一致的, ok。 最后总结一下就是, agent m d 的 本质就是把你反复叮嘱 codex 的 话一次性写清楚,语言怎么用,代码怎么写,安全边界在哪里,什么时候要去验证,什么时候要去确认,都放进去, 它不是让流程变得复杂,而是去减少废话,减少返工。所以说 codex 安装好以后,我建议不要第一时间让它去写功能,先把规矩建立起来,先定规矩,再让 ai 去干活。规则清楚之后,你只需要告诉它目标, 剩下的就是让他按规则去执行。 ok, 我是 fred, 后面我会持续用真实的案例告诉大家怎么把 ai 用进自己的工作流。这就是本期的分享,我们下期再见。

如果你也想像甲方一样用截图给扣带题修改意见,又或者是让他撤回整改,最后再让他这么快处理,那么这三个小技巧一定要收藏好。 一、中途介入修改 ai 帮我预设了这个风格,但是我不想要直接在这输入你的新需求,点这里的引导, ai 就 能顺着我们的新提示来调整了。 然后接下来两步,有一个非常重要的一个前提,就是你需要有自己的 get 仓库。在个人主页里右上角的创建 new repository, 输入项目名称确认,然后这里点复制 这是你已经创建好的网页,直接帮你出场这个项目,这就出场成功了。点上方的文件夹,创建永久工作树。那我还有一个问题,我们的自己创建的永久树跟我直接在下面打开一个窗口,有什么不一样呢?我要回答你, 新窗口会共享代码,工作数是独立运行,再决定要不要合并。先左侧创建两个工作数, 依次打开网页,各自在这输入需求,出现小蓝点,就是任务完成了。来刷新看看效果吧。风格灵感加入了新标签,看看这个新的品牌故事吧。 再回到主项目看看,恭喜你已经学会了多模块处理了。再补充一个最近常用的注试,哪里不会就点哪里,真的超级方便呀! 这里直接提交修改就好了,可又要当甲方爸爸说要用回上一版时啊,这完全不知道咋办了。没事,点右上角的 vs code, 点这里的 get, 在 这找到你要返回的版本,点击 复制提交哈希,回到聊天窗口恢复版本,并粘贴刚刚的哈希,等待执行完成就刷新看看。恭喜你学会了回退版本。

大家好啊,今天咱们来聊聊怎么用 codex 帮咱们绘制 cad 图或者做飞镖设备预算,这可是能大大提高效率的小技巧哦。首先你得知道 codex 就 像个超级聪明的助 理,你得用他听得懂的话来指挥他。比如画 cad 图,你不能只说画个零件得具体点,像帮我用 auto cad 画一个直径五十毫米,长度两百毫米的圆柱体,带 m 十的螺纹孔,这样他才能精准操作。 预算呢,你可以把设备的组成部分告诉他,比如这个设备需要三个四伏猎机,型号选三零 m r j 四系列,还有十米导轨,帮我估算下材料成本和人工费用, codex 会根据你给的参数,结合他知道的市场价格来计算。 不过记得哦,他给的结果你最好再核对一下最新报价,毕竟价格会 变。可以简单描述一下,让他照着那个风格来, 比如参考上次那个输送设备的图纸布局,这次的升降机构也用类似的框架结构。最后要提醒大家, codex 虽然厉害,但它毕竟是工具,输出的结果还是需要咱们自己检查和调整 的,特别是涉及到精确尺寸或者重要数据的时候,可不能完全依赖它哦。你们平时用 codex 做过哪些有意思的事情呢?欢迎在评论区分享经验呀!

哈喽,大家好,我是 qk, 那 么呢今天给大家讲一下,怎么让你的 code 叉变得越来越聪明啊?那么为什么讲这个呢?就我之前有个电脑,就是它一直不知道 python 怎么去调用,然后每次新的绘画呢,都需要我去指定说你要通过这样这样子去调用你的 python, 所以 说我那时候就想,那我能不能把这个弄到一个全局的一个记忆里面,让它每次呢每次一个绘画呢,它就知道怎么去调用了。 那当然呢,我这台电脑是有这个拍摄环境的,所以我问他,他就说有,首先我们需要下载一个小龙虾的一个插件,就是一个 agent, 它你就直接下载这个就行,这个是专门用来自己去学习,让它变得越来越聪明的。 那么下载完之后呢,你就直接让酷狗叉帮你去安装就行哈,你就说添加到 skill 里面,然后学习一下这个 skill, 那 它自己就安装了,那这些呢,就是你大概看一看就行, 然后啊添加完之后呢,就跟他说你帮我配置一下,然后每次新的绘画,你就第一时间去学习这个技能,然后读取全集的记忆, 然后这个时候呢又看次看次的,他又给你去啊,帮你去弄了,其实这个东西啊,你不看也没事啊,这个不太重要,你我们主要目的就是让他啊自己去配置完就行。 那么最后呢,就我比如说我说把这个啊调用 python 的 这个东西寄到全区的一个记忆里面,要放续后续的一个那个绘画里面,能够啊,直接执行这个, 知道怎么去执行这个 python 脚本哈,那他就说就写到全区记忆里面了,那怎么知道说啊?我这个 东西是确实记到了全区记忆在新的绘画里能用的,比如说我这里,呃,打开一个新的绘画,我就说测一下当前系统是否可用,就随便输入个东西。然后呢你可以看到说我现在在仓库里的话,先自己去读取了这个东西, 然后呢就是说他就自己去检测了这个全区的记忆,就说这个东西已经记录到全记忆。那么其实这两个文件呢?这个 门襟大概就是一个啊,全区记忆的一个相关的一个东西啊,比如说它这个全区的一个记忆,它就写到这个 m d 里面,那么它它这个我们添加的这个自学习类技能也添也放到这里面, 然后这个全息,就比如说我们之前添加的这个 pad 怎么调用,所以说它就记录了。然后你每次新的绘画, 就是比如说我这里要我再问你一个新的问题,那么这个时候他就有了这个 python 的 一个啊记忆,说我怎么去调?当然你一些其他的东西,比如说啊,你的 ida 是 吧?放大了怎么调?你的一个 js 的 怎么怎么去调这个这些东西你都可以 跟他说,你就说直接像我之前这样子,你说直接就啊写到全区记忆里面,还有一些其他的技能,比如 比如说,嗯,你的一些习惯,你说啊?我,我研究安卓的,是吧?安卓逆向的,然后我的 feed, 这你通过什么命令能执行? feed 这种你都可以, 就配置好之后,你就让它记忆到全区的记忆里面,然后这样子的话它以后的一个工作就会更加的一个方便。对,就是其实就是一个 多了一段记忆,就是让你的一些关键东西进行一个共享了。那还有个问题就是,呃,他记忆的之后呢?他有可能是会把让你的 token 向后会稍微多一点, 因为他比如说他每次新的绘画他都会,但这个量应该是还好,就是你一个新的绘画他都会读一个这个东西, 然后大家这读的这个东西肯定会消耗,相对来说是消耗多一点点头感,所以说你也不用什么东西都让他去记到这个拳击记忆里边,你只需要把一些关键的东西就记到这里,然后方便你后续的一个 操作就行。大家你如果头肯比较多的话,那就当我没说过哈。好,那么呃,今天介绍大概就这样,我们下期再见。

今天我们聊一下 codex 这一个月更新的八个新玩法。我以前一直觉得 codex 是 个备胎,去年四月, codex c l i 刚出来那会儿, 我用了两天就回去用 cloud code 了。理由很简单, codex 当时就是个会写代码的终端 agent, 跟 cloud code 的 比没什么区别,模型还稍微弱一点。直到四月十六日那天, openai 发了一条公告,标题叫 codex for almost everything, 意思是 codex 不 再只是写代码的 agent。 先说最离谱的那一项, computer use codex 现在能看你屏幕,点你 ui, 用它自己的光标在你电脑上打字,授权之后,它可以操作你电脑上的桌面 app。 我 第一次让它做的活是把这个 figma 设计稿里的色值抓出来,写到 tailwind config 里,它打开 figma 截屏识图写入全程,我没动鼠标 这类跨 app 的 活, cloud code 作为 c l i agent, 很 难直接做 codex 这一步直接跨出了终端,代价是你给他的权限是整台电脑,不是某个项目目录, 心智压力比 cloud code 大 一个量级。跟 computer use 配套的还有一个内置浏览器。最有意思的设计是,你可以在网页上直接评论,把这个 comment 当成指令丢给 agent, 就像在 google docs 上选中一段文字加评论一样,但被评论的是网页 dom。 举个例子,你打开本地预览页,选中一个按钮,评论一句,这个按钮状态太弱,改成更明显的 primary action。 完了, 这种指着浏览器跟 agent 的 说话的交互,比 cloud code 走 mcp 接 api 那 套直觉多了。普通人不用懂什么是 api, 但真正让我有点恍惚的是, automations 是 一个持续任务系统,你给 agent 的 一个长期目标,它可以附用原来的对话上下文, 按计划自动唤醒继续做。 openai 的 原话是 potentially across days or weeks。 比如你可以把任务写成每天监控这个开源项目的 issue, 每出现一个跟性能相关的,就帮我整理背景,附线路径和可能的修复方向。它每天自己醒一次,自己扫,结果放到队列里等你看。这开始有点接近让 agent 接长期任务了。然后是 pets, 五月一日左右上线的,是这个月 codex 最初圈的更新。你输入 slash pet 就 能召唤一只虚拟宠物,浮在屏幕上做状态指示器, 它告诉你 codex 现在在跑什么任务,是不是在等你输入,是不是做完了八只内置宠物可以选。还有一个 slash hatch, 可以 让 ai 生成自定义宠物。这设计妙在,它解决了一个我们都默默忍受的问题。 agent 在 后台跑唱任务的时候,你不知道它现在到哪了。以前要么切终端,要么挂个第二屏幕,现在屏幕上一直有只小猫,它的姿势就是状态,但是区域限制要分清。 open 官方明确说 computer use 初期不再 ee a u k 瑞士开放 pass 这块我没核到同等强度的官方说明。所以如果你人在欧洲,并不是所有 codex 新功能都能立马可用。第二,自定义宠物的画风偶尔会翻车。社区里已经有人把 clippy 动漫角色,各种像素小人都做出来了。好看的是真好看,怪的也是真怪。 但一个虚拟宠物功能能被开发者认真讨论,你就知道它戳到了什么。剩下几样我快点过。五月十四日, codex 进了 chat gpt 手机 app, 准确说是手机端可以远程接入正在运行 codex 的 mac host。 你 在地铁上,在咖啡馆, 可以用手机继续控制回答问题,批准操作,看 df 和测试结果。但电脑那边要保持在线, codex 也要再跑,这事跟 automations 配在一起威力很大。早上出门前交代一个长期任务,路上用手机补两句判断, 回家再看结果。这里要修正一下。 cloud code 也有 remote control, 可以 从 cloud app 或 cloud 网页端继续本机绘画。区别不在有没有手机入口, 而在 codex 把入口放进 chat gpt app 这条产品线里。四月十六日那波还顺手加了九十多个插件, atlanta rover, circle shape code, rabbit, github issues、 microsoft suite 都在里面。 cloud code 走 mcp 也能接,但要自己配。 serverch。 codex 这边是点一下装好的体验,底层也换了。四月二十三日, openai 发布 gpt 五点五,并明确说它正在进入 chatttt 和 codex。 官方说法是 gpt 五点五在同类 codex 任务上更强,也更省 token。 它还跑在 nvidia gb 两百和 gb 三百 n v l 七十二系统上。具体到比 cloud code 省多少,社区里说法很多,我没看到一个能直接当结论引用的统一数字,但我自己的体感是,同样跑长任务, codex 的 成本焦虑确实小不少, cloud code 也没掉队。 antropica 四月十六日发布 opus 四点七 s w e bench verified 报道,百分之八十七点六。 open i 这边 gpt 五点五的 terminal 奔驰二点零是百分之八十二点七, cloud opus 四点七是百分之六十九点四。 这些 benchmark 口径不完全一样,不能简单等同于 codex 工具,打败 codecode 的 工具。我现在更愿意把它理解成 codex, 在 长任务跨 app 成本和可用性上进攻很猛。 cloudcode 在 严肃代码质量和复杂重构上仍然很有竞争力。 dv 上有篇社区余情整理,看了五百多条 reddit 评论和一些盲测,结果给了一个挺贴脸的说法, cloudcode 是 高质量但不好用, codex 是 稍低质量但真的可用。这不是严格抽样调研,但它很像最近很多开发者的体感社区。现在很常见的一种用法是 codex for keystroke, coded code for commits。 日常输入用 codex 跑得快又省心。关键提交 code review, 复杂重构,切回 code code 求质量。 甚至有人把同一套 skill 同时喂给两边。聊完功能再退一步看,会发现一件挺有意思的事儿。 cloud code 这一个月在生化, harness 做插件 hack worktree 和 deny rules 把自己往 o s like 做, codex 则跨出代码边界做 computer use, 内置浏览器 automations, 手机入口和虚拟宠物,把自己做成 digital co worker。 一个想做你的操作系统,一个想做你的同事。两条路都对,但两条路真的不一样了。

最近 cortex 确实火的一塌糊涂啊,如果说你只是把 cortex 当成是一个聊天的工具,一个聊天的对话工具,那么你就太小看它了,或者说你就太浪费了, 简直是把这么大的模型,这么大的,能扔的话扔在一边,其实他最强的应该是什么?应该是他能够帮助你写代码,帮助你跑任务,帮助你解决一切你想要解决的任务啊, 比如说现在的话非常火的是什么?你可以让他操作你的电脑,很简单的一个方法是什么? 就是你经常的话都会是桌面上一大堆乱七八糟的文件啊,工作总结也好, 汇报 ppt 也好,甚至 excel 表格也好一大堆,但是呢,整理起来的话又非常的麻烦,又浪费时间。那这个时候的话,我强烈建议你,你就直接把它丢给 codex 就 好了,直接在对话框里面操作它, 就跟他讲说,请帮我把我的桌面整理一下啊,按照你的风格,或者说按照我的风格把我的桌面的话整理干净啊,进行各种各样的分类啊, 你也可以给他设定相关的分类啊,比如说工作总结,还有项目总结 等等一系列的内容啊,你可以按照你的要求来,或者你也可以直接让 codex 帮你解决它啊,非常的丝滑。

本期分享 codex 零基础上手使用教程,覆盖了办公、编程、自动化等使用分享,让我们每个人可以轻松上手使用。开始之前我们先来了解一下 codex 与 cloud code 相比,它的优点有哪些,第一个就是有更多的额度, 第二个就是不会轻易地限制账号,封账号。第三个就是 ai 升图能力,目前是排名靠前的。第四个就是客户端安装更容易,容易上手。第五个就是不订阅也可以去使用体验,因为它有免费的额度,这是关于 codex 的 一些优势。 第一件事情就是要修改语言,在这里部分伙伴会因为网络原因下载的版本默认的会是英文界面,所以需要修改,如果是打开直接就是中文,可以跳过这个步骤,然后设置语言,是在左下角设置这里,然后选择 设置,然后在默认的常规选项里面,这里有一个语言,在语言这里我们选择中文,这时候就可以切换为中文界面。 下面我们来介绍一下它的功能,我们先从左侧说起,第一个就是新建对话,这里就是创建一个新的对话窗口,在这里我们就可以把它想象成 相当于我们换了一个朋友聊天,然后打开了新的绘画。然后第二个就是搜索功能,在这里就是可以搜索历史对话,这里我们就可以比喻为搜索和朋友的聊天记录。然后第三个插件,这里就是让 codex 更强大,赋予 codex 拓展功能,拥有操作其他软件的能力, 在这个插件这里,它还有技能。这就是我们前面分享了好多次的 skills, 如果大家还不了解,可以看一下之前分享的内容,然后第四个就是自动化, 在这里就是定时任务执行,可以直接去新建自动化功能。下一个就是项目,这里就是我们所有的创建的项目和打开的项目都会显示在左侧,然后下一个就是对话, 当我们在对话窗口没有选择任何项目的时候,我们选择不使用项目,这时候的对话内容就会在 对话栏目下面去显示,这就和我们网页对话使用是一样的,适合做的事情就是一些日常任务,比如搜索资料,写内容等等。分享到这里肯定会有好多小伙伴有疑问,就是上面的项目什么时候用,以及使用的场景是什么?在这里我来分享一下。 这里就是我们需要 ai 生成文件的时候,比如我们写代码,生成 markdown 文档,生成 ppt, 生成 word 文档等等,就是涉及到文件生成的,我们就可以选择创建项目,这样的优势就是生成的内容都会保存到当前项目文件夹,容易编辑和管理。 在这里我就是使用大白话来分享的,就是更容易理解一些,可能还是有些模糊,下面我直接实操,大家来看一下。 在这里我直接新建一个项目,然后在项目这里我们指过来就会有一个添加项目的图标,然后我们选择这里,他有两个选项,一个是新建空白项目,第二个是使用现有文件, 第一个就是我们直接新建,第二个就是如果我们打开某个项目的时候,就选择使用现有文件夹, 在这里我们是新建空白项目,然后我们选择新建之后,可以看一下它,这里就新建了一个项目文件夹。创建之后我们可以去修改项目的名称,我们只到项目名称这里,然后选择三个点,在这里有一个重命名项目,我们在这里 我们命名一下,比如命名为 demo, 然后保存,然后我们看一下对话窗口这里它自动选择的就是这个 demo 项目,在这里我们给它提示词,就是一句话,介绍 ai 生成 txt 文文本档, 然后我们直接发送。现在我们的模式是选中项目文件的,到时候它生成文件的时候,就是生成在当前项目文件夹下面。 好,这时候任务完成了,就显示已生成文本文档。 ai 介绍点 txt, 在 这里我们打开项目文件夹,我们来看一下,然后我们通过项目文件这里三个点,然后在资源管理区中打开, 现在就有了 ai 介绍点 txt 文本文档,这就是 ai 生成的文件内容。如果我们不选择任何项目, 我们选择不使用项目,然后我们再和他对话一句话,介绍一下你自己,然后我们直接发送,可以看一下左侧,他就在对话列表下面,没有在项目文件夹里面,这就是项目和对话的一个区别,经过实操演示,我相信大家已经了解了。 然后如何选择,就是涉及到文件生成,比如文文本档写代码,我们就要创建一个项目,如果只是单纯的和 ai 对 话查资料,我们就不用去创建项目文件夹,直接对话就可以。 下面我再分享一个个人感觉比较好用的功能,就是多任务处理,在这里我还是使用生成个人主页的任务来举例,因为这个应用场景每个人都可以用到,我们先选择我们刚刚创建的这个 demo 项目,然后我们把提示词 粘贴过来,在这里我们就是让它生成一个个人主页,使用 html 加 css, 然后还有就是一些风格指定,还有一些按钮的效果,还有页面布局等等,在这里我们就直接发送 在当前的任务进行中,比如我们突然有一个想法,我们可以使用这个技巧,我们想规定腋角的颜色,比如腋角使用灰色,然后我们直接发送,可以看一下它现在这个提示词就是在排队的状态,如果我们想让它立即执行,在这里我们直接选择这个引导, 可以看一下他这里提示就是提交但不中断模型运行,然后我们直接选择,这时候像我们给他的这个任务,他就直接插队插进来了,就不用等上面的任务执行完毕之后,再执行第二个排队任务, 这是关于这个使用小技巧,可以看一下第一个它会直接在当前工作区生成一个可独立打开的静态文件,然后它这里就有一个已引导对话,它就提示收到页脚,我会做成浅灰色背景,如果我们不点引导的情况下, 它就会等第一个任务执行完成之后,然后再执行页脚使用灰色,好,现在就生成完成了,然后我们打开看一下生成的效果,这就是我们生成的个人主页,这里我们直接自己去修改就可以。 下面我再来演示一下多任务,比如我们在当前项目文件夹下面,我们再有一次对话,就是什么是 ai 一 百字介绍,生成一个 txt 文文本档,然后我们 直接发送,这时候我们就可以在另外一个项目文件夹下面,我们直接选择开始新对话,然后我们再给他一个任务, 如何学习 ai 一 百字介绍生成文档,这时候就是同时进行任务,这就是多任务同时运行,当运行完成之后,他这里就会有一个蓝色的小点,然后我们再返回到项目文件夹,这时候任务就完成了,这就是多任务的应用, 然后下面我们再一起来看一下,就是创建技能,就是创建 skills, 我 们来到插件这里右上角的创建,然后选择 创建技能,在这里它就会显示一个 skill creator, 这就是创建 skills 的 一个技能,然后我们把提示词复制粘贴过来,在这里我们还是封装一个 ai 提示词,让它去制作一个 skills, 然后我们粘贴过来之后,下面给他的就是帮我创建一个写作技能,直接发送 好了,这时候提示我们创建成功了,它也给我们显示出来了这个创建的路径,在这里我们新建对话,使用我们自己创建的 scale, 让它帮我们去生成一篇文章,在这里我们输入斜杠,然后我们选择 技能,然后找到我们刚刚创建的,可以看一下这个是个人,然后我们选择,然后我们再给它提示词,就是什么是 ai 帮我写一篇 seo 文章,然后我们直接发送,像现在这个状态,它就是调用了我们创建的 skill, 这时候用我们创建的 scale 就 写好文章了,在这里我们只关注一个地方,就是我们提示词里面让它包含问答模块,这时候它也是包含的,它严格遵守我们的要求,这就是我们创建技能和使用技能的所有流程。 然后下一个我们再看一下插件的使用,在这里我再新建一个对话,我们使用插件就需要使用 at 符号去指定, 比如我们还是给他一个提示词,就是如何学习 ai 使用,然后艾特符号,然后我们选择 document 插件,这里就是这个 word 文档的一个插件,然后帮我生成 word 文档直接发送, 这时候就用插件创建好了文档,现在我们打开看一下它生成的一个效果,生成的效果还是非常棒的,它不是那些简简单单的文字,它是给我们排版好的,效果还是非常棒的,这就是 codex word 文档的生成插件的使用。 然后下面我们再来看它的另一个功能,就是自动化,在这里我们来到自动化这里,通过右上角,然后新建自动化功能,然后我们输入 就是每天学习一个 ai 术语提示词,这里就是每天上午八点给我推送生成一个学习文档,比如 token 是 什么, ai 是 什么? webcoding 是 什么,就是每天八点让它帮我们生成一个学习文档,然后我们再选择一下项目,我们选择 demo, 然后每天八点在这里就是选择模型,我们就选择默认的, 然后下一个就是推理的设置,这里我们也保持默认,然后我们直接创建就可以,这时候就创建成功了,然后我们选择这个自动化任务,就可以看到它的一个运行状态,还有一些详情信息, 这就是关于这个自动化任务创建,也是非常简单的,都是可直观的操作。好到这里就是我们 codex 安装到使用的所有操作,我们本次分享的都是一些基础的使用,我们可以先上手使用,然后其他的再边使用边研究就可以。 在这里还有一个拓展分享,就是如果你使用 codex 是 一些日常的任务,大家可以到设置这里面,然后常规选项这里工作模式就选择 适用于日常工作的模式,像这样它的模型是同样强大的,就是技术细节更少一些。好了,这就是我们本期的所有内容,欢迎留下你的想法,我们下期再见。

这条视频讲 codex a subagent, 小 白也能听懂的版本。它不是一个新软件,也不是神秘功能,而是 codex 处理复杂任务的一种用法, 你会看到它什么时候该用,什么时候别用,以及怎么用它。 review 一个真实项目,先给 subagent 下一个最朴素的定义。一个复杂任务,你可以让 codex 拆成几块,分别交给几个子代理并行处理。 每个子代理跑在自己的 agent thread 里,最后只把结论交回主线成汇总。官方术语听起来会正式一点。 sub agent workflow 指同时跑多个并行代理在汇总。 sub agent 是 被派出去做某件事的代理, agent, thread 则是每个代理自己的线程,你可以在 cli 里查看和切换。 sub agent 主要解决两件事,第一, context 被污染,读文件跑命令看报错,猜原因,全塞进主线城,后面判断就容易乱。 第二,该病型的事被串行,做安全测试风格可维护性本来可以同时看,却被一个代理从头查到尾。判断要不要开 sub agent。 可以 先问一个问题,任务能不能拆成几块?互不依赖的小事, 能拆就适合试,拆不开就别硬上。任务很小,子任务紧咬在一起,写入范围重叠,或者你自己都还没想清楚怎么拆,这些情况开了反而添乱。不适合的情况也要记住,任务本身很小,没必要开多个代理。 几个子任务互相咬的很紧,并行也不省时间。最危险的是多个代理同时改同一篇文件,这时候省下来的时间很可能被冲突和反攻吃掉。 真正适合练手的场景大多是 rate heavy, 比如大型代码库探索 pr, 多维 review 几个 bug 方向, b 型排查,长文档和长日制分块分析。官方也建议新手起步时先选探索测试、 treeash 和总结这类任务。 codex 默认不会主动开 sub agent, 你 要在 prompt 里讲清楚。常见说法包括 spawn two agents, delegate this work in parallel use one agent per point。 中文直接说启动三个 sub agent, 分 别检查安全测试和可维护性也可以。如果拿来 review pr, 可以 直接用这个模板,一个 sub agent 检查潜在 bug, 一个检查测试覆盖,一个检查代码质量和可维护性, 最后要求主线程等三个都完成后再输出高风险、中风险可选优化,以及建议优先修什么。 这个模板真正值钱的不是文字本身,而是里面的控制点。每个子代理的职责不重叠,避免大家都泛泛 review 一 遍,明确等全部完成再汇总,可以避免主代理拿着半成品就下结论。最后加一句,优先修什么,可以把排序工作也交给主县城。 接下来用 ship ready 这个小项目做例子,它是一个 s s landing page audit 的 mvp, 后端 api 在 s r c app 点 js, 审计规则和 rewrite 在 s r c audit 点 js, 存储是 s r c store 点 js, 前端是 publ i c 斜杠 app 点 js。 代码量不大,正好适合演示怎么稳妥的开 sub agent。 在这个项目里,最稳的开法不是让三个 agent 一 起改代码,而是启动三个 read only sub agent runtime risk agent 看运行风险 q a coverage agent 看测试缺口, architecture agent 看模块边界, 所有子弹里都不要改文件,等全部完成后,主线程再决定要不要修。三个结论里, round time risk agent 最有价值。他发现 handle request 里 in sync 路由没有 await, 外层 try catch 接不住 a sync handler 抛出的错。 这种 bug 在 happy pass 测试里不容易暴露,但线上可能表现成请求挂住或者 unhandle rejection qa coverage agent 的 结论也很实用。 他没有泛泛说测试不够,而是列出 invalid json 未付费 share 过早 follow up。 若 brief 绕过 rewrite 这些副路径, 这些用力不一定都要立刻补,但摆在面前,主县城就能快速挑出最该锁住的状态流。 architecture agent 的 结论最容易让人冲动, 他说 src app 点 js 可以 拆成 page extract checks brief 和 rewrite 几块 判断没错,但这次目标是写测试加修 bug, 不是 重构 auditing, 所以 这部分建议最后先记下来,不立刻动。三个 sub agent 的 优先级其实不一样, round time risks 想让你先修服务端 qa coverage 想让你先补测试, architecture 想让你先理边界。主县城不能给三票打平均分,而是要挑确定性高、改动小、能被测试所注的事情先做,最后真正落地的改动其实很克制, 异步路由统一加 await, 让外层错误处理生效。 rewrite 必须 brief ready 才能解锁, follow up 增加还没提交 brief 和非法字段校验。 read json 加 body size 限制 invalid json 返回四百,最后补 note test 回归测试。 这个案例最有意思的一课是两个代理的结论拼在了一起, round time risk agent 告诉你哪里坏了。 q a coverage agent 告诉你怎么用副路径测试把它锁住, 这就是 sub agent 真正的价值,不是替主线城做决定,而是把几个方向的结论同时端上桌。跑起来之后也要会管理 agent thread codex c l i 里可以用 slash agent 查看和切换线程,如果某个子任务偏离方向,可以让 codex 停掉那个负责性能分析的 sub agent 跑完的线程,也可以让它关闭已经完成的 agent threads。 给新手的练手顺序,不建议一上来就五个 agent 一 起改权。项目先并行阅读,让多个 sub agent 各自理解不同模块,再并行 review, 把 bug 安全测试,可维护性分头看。 第三步是单写,多审一个代理或主线成改代码,其他子代理做 review, 最后才是小范围并行修改。 下一次让 codex review pr, 你 可以直接从这个短 prompt 开始。请使用三个 sub agent 并行检查,当前 pr, 一个看 bug, 一个,看测试一个看可维护性, 等全部完成后,按风险等级汇总给我。就这几句话,已经够你完成第一次 sub agent 练习。 最后记住, sub agent 不是 替主线城做决定,他真正干的活是把几个方向的判断同时端到桌面上,让主线城更快做取舍。新手先从 rate heavy 的 探索和 review 开始,等你能清楚拆分任务,再尝试让多个代理并行改代码。

hello, 今天一分钟时候用 codex 帮我们开发电商 skill, 让 ai 自动我们干活来看效果,操作非常简单,只需要在多框输入,让 ai 帮我们开发一个本地可运行的拆帧 skill, 去批量提取视频,然后开始执行。那么整个 skill 的 开发其实非常简单,不管是用 codex 还是其他模型都可以,核心不在于 工具,而是清除进开发 skill 的 目的。我们来看一下执行的结果,这里显示只用了三分三十六秒就开发了一个 视频 skill, 那 现在我们可以直接上传视频来测试一下拆帧的效果。在执行完后,在这里打开输出的文件夹目录, 可以看到基础的视频拆帧功能已经实现了。接着后续我们就可以对这个 skill 继续调优,比如如果需要对视频拆解的更细致一些,又或者对视频拆解有自己的方法论,都可以告诉 ai, 让 skill 根据我们的需求来执行。我们来看一下第二版的执行结果, 可以看到对比第一版拆解的更细致了,但是不同的业务场景拆帧的逻辑完全不同,有的拆帧是为了参考框架后期实拍,有的是为了后续让 ai 生成需求。不同 skill 的 执行流程也不一样,那么我们就需要根据自己的需求来完善这个 skill。 如果我的需求是让 ai 后续生成分镜,那么我就可以让 ai 继续根据拆帧的画面进行拼接生成。总的来说,我们需要从结果反推,我们要实现什么样的效果,中间刷哪些流程 和 skill 只是作为整个工作流的加速器,用来提高我们的内容存储效率。最终通过几轮简单的对话, ai 就 帮我们开发出了一个可以直接落地使用的 skill。 最后我们就可以直接让 codas 把开发好的 skill 打包成压缩文件,同时生成一份详细的使用文档,不管是自己长期使 使用还是分享给团队都非常方便。有需要这一个 skill 的 可以分享,大家也可以根据自己的需求来调哟。操作也很简单,只需要把压缩包解压到对应的 skill 文件目录下,在执行的时候打开项目文件,在段落发送这一段指令,就可以 截掉这一个 skill 来执行。当我们学会开发一个简单的 skill, 后续如果需要其他的功能也可以尝试自己开发,基本的思路就讲好赖上本期内容,觉得有用的话不用点赞关注,咱们下期见,拜拜!

别再只把 codex 当个代码补全插件了,官方团队这篇分享我反复看了三遍,越看越上头。核心就一句, codex 不是 代码生成器,是能直接接管你整台电脑的工作流。智能体写 代码只是它的基本功,真正拉开差距的全在代码之外。终端浏览器、接口、文档、桌面应用自动化事件,一个对话流全部串起来。下面这七招,招招都能让你的效率直接起飞。尤其是第五招,人走了,活照干。 第一招,持久对话流,把常用现成直接置顶,产品发布、文档审查、外部监控、日常助理,每个方向都有专属的长期上下文 看,慢加数字键秒切工作区,多线并行,脑子不乱。第二招,语音输入,别等想清楚了再敲题式词,但凡有个粗糙的念头,张嘴就说 codex 自己会去搜索补全上下文给你汇报,结果,零感零延迟,越说越顺畅。 第三招,任务干预加任务,排队跑偏了当场掰回来,当前步骤没结束直接排队。下一步你只负责握住方向盘, kodak 负责把油门踩到底的执行力。 第四招,扩大触达范围,应用内浏览器审查网页、 chrome 搞定登录太工作流。 computer use 直接操控桌面图形界面、 m c p 和连接器, boss, lock、 email, 文档数据库全接进来,一个入口,所有工具为你所用。 第五招,离开电脑活不停止,对话流自动化,像心跳一样定期回来检查消息评论任务状态、目标功能,给长期任务设个清楚终点,测试全率精准,性能达标,端到端,流程跑通,下班就走,扣袋子还在替你往前推。 第六招,侧边栏代码、网页、 pdf、 ppt 表格、数据、应用全部并排审查、标注、修改,再也不用在工具之间反复翻运,所见即所得,改了就能继续推进。 第七招,共享记忆。把人员、项目、决策卡点、代办写进可追溯的知识库,下一个对话流直接接手,永远不用重新认识你,像团队里那只不会失忆的大脑。 最后这句直接扎心,抠代码的上限从来不是一次能生成多少代码,而是你敢不敢把它接入完整工作流,让他从听指令、执行、审查自动化到沉淀记忆,形成真正的闭环。你觉得这七招里,哪一招最实用?评论区告诉我,别忘了点赞收藏,别等划走,找不到了!

codex 是 我过去几个月高频使用的 ai 助手之一,我用它做研究,写文档、做 ppt, 整理内容灵感,做网页原型。上个视频讲了 codex 基础,这期视频讲一个今年很值得先搞懂的 ai 概念 skill, 因为它决定了 codex 到底只是陪你聊天,还是能按你的工作方式反复干活。简单理解一份可以重复使用的工作说明书, 你可以把某类任务的流程规则、检查标准提前写进去,下次再让 codex 做类似的事,他就不用每次重新听你解释一遍。比如你经常让 codex 做网页,你不想每次都重复说页面不要太 ai 味,不要蓝紫配色, 这些都可以写进一个设计类 skill 里。以后你只要让 codex 用这个 skill 检查页面,他就会按那套规则去看代码、改样式,再告诉你改了哪里。 这就是 skill 最实用的地方。把你反复说的要求变成一套固定流程,那么在哪里看和怎么用 skill, 可以 去 codex 的 侧边栏这个入口里看,里面会有一个 skill 子页面, 已经添加或创建过的 skill 会出现在这个列表里。使用的时候,通常可以在聊天里输入 skill 名称,或者用斜杠跳出来。比如你有一个 find skill, 就 可以直接斜杠选中,帮我找一个适合做 ppt 的 skill, codex 就 会按 skill 里的流程去跑。那怎么创建 skill? 有 两种方法, 第一种最简单直接这样说,请创建一个 skill 以后,我给你一个网页项目时,你要先检查移动端排版按钮样式、文字层级、颜色是否太乱,最后输出修改文件和检查结果。这种叫 prompt skill, 但我更推荐第二种,先把流程跑通,再把流程固化成 skill。 举个我刚实测的例子,我想做一种白板手绘风讲解图,我先给他一个参考图,让 codex 按我的要求生成讲解图 第一版如果不满意我就继续改,比如少一点黄色纸张质感画面更像课堂白板。等到有一版我觉得可以附用,我再说。把它固化成一个 skill, 这时候 codex 会反推刚才的流程,它会把这次反复调整出来的规则写进一个 skill。 md, 这样下次我再用白板手绘讲解图, 就不用重新解释一遍审美和结构,直接调用这个 skill 就 行。如果你想让 codex 使用 skill creator, 它会按更标准的格式帮你生成可附用 skill。 我是 ai 知识派,我们下期见。

昨晚 codex 来了一波大更新,这次是真挺猛的。首先说一下这个最实用的新功能, app shells, 以前那个 ai 描述问题要截图,要复制代码,最后还要手动解释半天。现在直接在 mac 上按住左右两个 command 键,当前窗口就直接传给 codex 了。这次不只是截图,是截图加文本一起打包进来, 重点在于它不只是读,你屏幕上的 vx 里只显示了五十行代码,没有问题。 codex 读的是完整的上下文,不是你肉眼看到的那一个页面。 整个生态也很丰富,比如说 figma 终端浏览器 notion 等等全部都支持,相当于把你的工作界面整个共享给了 codex, 效率直接拉满。第二个更新是 remote computer use, 手机上就能操控 mac 的 codex 任务,哪怕你的 mac 锁屏了都没有问题。 幻想一下未来的办公,电脑后台多个 a 程序在一起跑,你出门旅行没有带电脑,躺在床上也能指挥 mac 跑脚本发版本是不是方便多了?第三个是构模式正式上线扣代码了,现在 app id 插件 c l i 全线可用,你只需要给它个目标,它就可以自己保长线任务, 中间随时可以暂停或者改方向。我个人的小建议是,配合 plan, 请把方向锁定,加上 set, 随时开个临时对话窗口确认思路,再用 go 模式跑长线任务的时候会稳很多。最后是浏览器内置高级注视模式,可以直接在页面上标注修改甚至编辑元素, 比如说这个字太小,这个颜色不太对之类的视频的。最后我再补充一个细节,现在扣带才支持团队共享插件 team 版本的用户可以批量给其他成员分发插件包、技能、 m c p、 服务器等一起推,省去一个个配置的麻烦了。