一个月前我就跟你们说装 codex 赶紧买苹果电脑,那个时候苹果电脑才六千多, plus 会员呢,一个月也才七十块钱。现在呢,苹果电脑涨到了八千多, plus 会员一个月也涨到了一百四。所以学 codex 就是 越晚学就越贵,越贵呢就越不想学,他陷入了一个死循环。
粉丝1.8万获赞1.8万

今天我们来讲讲大名鼎鼎的 codex, 相信大家都已经听说过这个软件了,这是 open nai 的 核心产品,对标 osarpic 的 cloud code。 codex 能做的事情非常多,它不仅能够帮你编辑代码、排查 bug、 执行测试,还能管理 gate、 操作浏览器,甚至能直接控制电脑完成各种任务,非常强大。不过功能越多,越容易让人抓不住重点,所以这期视频我会带大家系统性地过一遍。 codex 最核心的功能,帮大家建立起一套完整的使用思路。 整个视频一共分为三个部分,第一部分是基础篇,主要带大家快速上手 codex, 并讲解一些核心配置和使用过程中容易踩坑的地方。 第二部分是进阶篇,重点介绍版本控制、绘画管理,以及如何更高效的组织和推进开发任务。第三部分是扩展篇,我们会看看如何通过 plugin、 skill、 automation 和 mobile 等功能进一步扩展 codex 的 能力边界。 所有的功能点和对应的时间戳我都打到目录上了,大家可以按需跳转。好话不多说,我们现在开始。 首先我们要做的是把 codex 安装到电脑上面,我们可以打开这个页面,点击这里面的下载按钮,就可以下载 codex 了。下载好了之后,我们来打开它。安装过程呢,跟其他的普通软件一样,比如我用的是 micros, 那 直接把 codex 拖入到 applications 文件夹里面就可以完成安装了。 安装好了之后,我们来打开 codex。 打开 codex 之后呢,它首先会提示我们登录,它一共给了我们两个选项。 第一个呢是使用叉 gbt 账号登录,这需要你订阅叉 gbt 的 套餐。叉 gbt 呢,它提供了多种套餐,其中最常用的是我屏幕上面显示的这几个,主要是包括免费版 go 套餐、 plus 套餐和 pro 套餐。 你看屏幕上面的这几个套餐,从左到右价格越来越高,当然整体能用的 codax 额度也是越来越大的。 从目前来看,免费版和购套餐的 codax 额度应该差不多,但到了 plus 套餐,额度就会有着明显的上升, pro 套餐自然就更多了。 值得一提的是,即使你用的是免费版,系统也会给你一定的 codex 额度,只不过这个额度少的可怜,只能勉强够你施个水。所以如果你想真正上手体验一下它的能力,我建议你先订阅 plus 这个 plan, 它是二十美元一个月,可用量呢比较适中。 除了订阅套餐之外, openni 还提供了另外一个选项来使用 codex, 那 就是直接接入 api, 对 应的就是这里的 signing another way, 点击之后,它会提示你输入 openian 的 api key。 一 般来说,用 api 没有订阅套餐划算,而且呢,获取这个 api key 的 门槛也有点高,一般需要一张海外的信用卡,所以我建议大家还是订阅套餐来使用 codex。 具体的登录过程呢,我这里就不显示了,大家可以在这里选择适合自己的方式登录。登录好了之后,大家首先看到的就会是这样的一个界面, codex 首先会询问我们是干什么工作的,这里大家就按照实际情况来选就可以了。然后 codex 会提示把 cloud code 和 cloud co work 相关的配置都导到 codex 这里,我们先跳过,然后 codex 提示我们要不要试用 codex 手机版,我们点击这个 set up later, 待会儿呢,我会给大家演示这个功能,所以现在先不着急,现在呢,我们就算是正式的来到了 codex 操作界面,可以开始使用它了,我们来随便跟它打个招呼,看看能否正常使用, 可以看出 codex 已经可以正常使用了。下面我带大家做一个代办软件,并且在做这个代办软件的过程中为大家讲解 codex 的 各个功能点。首先我们要新建一个目录来存放我们的软件代码,让我们打开访答,在这里创建一个新的文件夹,就叫做马克笔记吧。 然后回到 codex 这里,点击 work in the project, 再点击 use an existing folder, 在弹出的对话框里面选择我们刚刚创建好的文件夹,然后再点击 open, 然后呢,你就会发现 codex 把项目目录改成马克笔记了, 这就代表 codex 后面会把代码放到这个文件夹里面。此时我们准备工作就已经是做完了,可以开始提需求了,比如说我们的需求就是使用 html 写一个笔记软件,软件界面分为左右两部分,左边是笔记列表,右边是笔记的内容, 最后我们提醒他注意做好测试,然后回车提交,这个时候呢, codex 就 会开始工作了,可以看出他在疯狂的给我们写代码,当然实际使用是没这么快的,因为为了节省大家时间,这里我做了加速,后面的问答流程呢,也都做了不同程度的加速处理,这个呢,大家知道就好了。 好, codex 暂停了,他提出他想要构建一个本地服务器来验证 html 笔记的效果。这里呢有三个选项,第一个选项是 yes, 这个呢很好理解,其实就是把这个本地服务器启动开就可以了,不过以后如果 codex 提出类似的请求,我们还得再授权一次。 第二个选项呢,是代表我们不仅同意,而且对于这种启动本地服务器的代码,以后呢也就直接执行就好了,不需要再经过我们授权了。第三个选项可以理解为不同意,它其实不是一个按钮,而是一个输入框, 我们点一下就能看出来了。在这里我们可以告诉 codex 自己希望的处理方式,比如只让它检查代码,不要启动本地服务器之类的。当然,如果你不同意,而且你懒得告诉 codex 原因的话,也可以直接点击这里面的 skip 按钮啊,这算是 codex 做了弱化的第四选项了。 好,所有的可选项我们都说完了,在这个地方我们就选择第一项 yes 就 好了。然后呢, codex 就 询问我们能不能访问这个新创建的本地服务器,这个地方呢,我们也同意, 呃,现在 codex 已经彻底完成它的工作了,可以看出这里面最重要的文件呢,就是这个 index html, 我 们可以点击来预览它的效果。 这个呢就是 codex 写的笔记软件了,看起来中规中矩,各种基本功能呢,在这里面都能找到。当然有些人可能觉得这个预览区太小了,想要放大一点,这当然是可以做到的,让我们来点击这个按钮, 这样左边的区域就被收起来了,可预览的空间就更大了,不过下面的这块区域看着也是有点碍事,能不能隐藏它呢?其实也是可以的,我们可以点击这里面的三个点, 然后选择其中的 hide composer 就 好了,你看这样呢就好多了。那假如说这个时候呢,你看着界面里面的这两条笔记,觉得非常碍事,你想把它们去掉, 呃,这个呢,其实也是很简单的,我们就继续追问就好了。既然要追问,我们就必须要把左侧栏再次显示出来,这个呢其实很简单,我们再点一下这个按钮,左侧栏就显示出来了。 然后呢,我们就可以在输入框里面输入我们的问题,把左上角的两条笔记去掉,这个呢肯定是可以的。 呃,不过我这里想给大家演示另外一个方法,另外一个更加准确,更加方便的方法,我们可以点击这个图标,它叫做 annotation, 然后我们就可以直接选中两条笔记这个区域,选中后,输入我们对这个区域的修改意见,很简单,我们的意见就是两个字,去掉, 然后我们提交请求。好,可以看出请求已经成功提交上去了,可以看到他一共是发了两块内容,一个呢是对应的截图,另外一个呢就是我们具体的要求了。 接到了这个请求之后, codex 就 开始工作了,他应该呢就会把这块区域给去掉,让我们稍微等待一下。 好, codex 已经完成了,我们再次打开这个阅览区,看一下效果, 可以看出之前的这块区域呢,确实是没有了, codex 已经帮我们解决问题了,看起来 entity 这个功能还是非常方便的, 那这个时候我们可以再随便点点这个笔记软件,看看有没有其他我们需要修复的问题。这里好像确实有个 bug, 我 点击这个加号按钮的时候,下面呢是要增加一个新的笔记的,但实际上点了之后并没有任何的 bug 呀。让我们跟 codex 说一下这个问题, 我们需要告诉 codex, 点击添加按钮之后,笔记列表区域没有任何的反应。呃,请排查下原因,我确定之后再进行修改 好。 codex 已经排查完了,按照我们的要求,他没有直接去改代码,而是先给出了诊断结果。他猜测呢,这个问题大概率是因为当前页面的 local storage, 也就是本地存储被禁用了。 没错,就是这个原因。说白了,就是 codex 的 右侧预览区有一些安全限制,导致某些功能无法正常使用。如果我们到独立的浏览器里面用一用,问题立马就消失了,不信我们试一试。 你看这个时候再点击添加按钮是不是就完全正常了?既然用户是在真实的浏览器里用我们的软件,而不是在 codex 的 预览区里用,那这根本就不算是个问题,自然也不需要修。 我不知道这算是 codex 的 一个 bug 还是一个 feature, 我 相信 openai 是 把它当成 feature 来做的,不过实际用下来确实有点像 bug。 如果你做的也是外部应用,那一定要额外留意这一点,别被预览区给骗了。既然弄清楚了原因,为了避免再受限制,我们后续就在独立的浏览器页面里面进行测试了。 到这里,这个最基本的笔记软件就算是成功跑通了。现在我想回头聊聊刚才遇到的一个细节,就是 codex 提出的那个请求。 呃,有些同学可能会想,如果我把任务交给 codex 之后去忙别的了,没注意到他在等我授权,那 codex 岂不会一直卡在那里等我回来一看啥也没干,白白浪费了大量时间。 那这有没有办法让他自己做决定,别总是来问我呢,毕竟谁也不想一直盯着他干活,那也太累了吧。没错,一直盯着看呢,确实是非常的麻烦。其实 codex 早就替我们想到了解决办法,就在输入框的下面,大家看这里面呢,一共是有三个全线选项。 第一种就是我们刚才用的 default permissions, 在 这种模式下,如果 codex 需要修改项目目录之外的文件,或者是需要执行一些带有安全风险的命令,它就会老老实实地弹出提醒,只有当你点头同意了,它才会继续接着往下干。 这种模式的优点呢是绝对安全,一切尽在掌握,但缺点也非常明显,就是根本离不开人,你得随时给他授权。 第二种呢是 auto review, 也就是自动审查。这个模式呢很聪明,它引入了一个专门负责安全审查的 agent, 当 codex 准备执行操作的时候,这个 agent 会首先替你把关,安全的直接放行,危险的直接拒绝,只有在极少数连 agent 也拿不定主意的情况下,才会弹窗让你来做决定。 第三种呢是 full access, 顾名思义,这个呢就是放飞自我模式,全部自动同意, codex 想干嘛就干嘛,完全不需要你插手。 这个模式确实是最省心的,但也伴随着风险,万一它误删了什么重要数据,你是拦也拦不住的。虽然 gpt 模型总体上还是非常靠谱的,基本上不太会乱来,但是作为一个负责任的 up 主,我还是要提醒大家,这个模式呢,没有任何的安全,交易开启前一定要三思啊。 所以综合看下来,在这三个模式里面, auto review 是 在效率和安全之间平衡的最好的。为了避免后面频繁弹窗,要我们点同意,接下来的演示呢,我们就统一的切换到 auto review 模式。 既然聊到了这里的权限配置,我们不妨顺便看一下输入框旁边还有哪一些配置。首先大家留意这里面显示的五点五 medium, 这代表我们当前使用的是 gbt 五点五模型,思考深度呢为 medium, 也就是中等。 我们点开它可以看到思考深度呢是可以自由调节的,分为 low、 medium high 和 extra high 四个级别。思考深度越高, codex 花费的时间也就越长,消耗的 token 呢也就越多,但通常给出来的代码质量也会更好一些。 除了调整思考深度,我们还可以在这里面切换模型下来。列表里面除了 gpt 五点五,还有 gpt 五点四等等一系列的模型,大家可以根据具体的任务难度来灵活选择。 最后啊,这里面还能设置模型的输出速度,目前是 standard, 也就是标准的速度。旁边呢还有一个 fast 选项,开启 fast 模式之后生成的速度呢会提升到原来的一点五倍,不过代价呢是 token 的 消耗量也会相应的增加,具体增加多少取决于你用的模型, 比如说在 gbt 五点五这个模型下开启 fast 模式的话, toc 的 消耗量就直接是标准模式的两倍了啊。如果你财大气粗, toc 管用,那你完全可以开启这个快速模式,这样 codex 干活就更快了。 输入框的配置我们就先研究到这里,现在我们的第一版笔记软件已经跑通了,实现了最基本的功能,不过为了防止后面新加功能的时候把代码搞乱,我们最好先用 get 把当前的版本保存一下,这样的话就算是后面出了什么叉子,也能够随时回滚到这个可用版本。心里有个底, 在 codex 里面调用终端非常的方便,我们不需要去点什么菜单,直接按下快捷键, command 加 j, 大家看右侧的终端面板就直接弹出来了。在这里面我们依次输入几条常规的 get 命令, 首先是要执行 get in it, 点把当前的项目目录出示,化为一个 get 仓库。然后呢我们要执行的是 get id, 点把相关的文件呢都添加到暂存区里面。最后呢再执行 get commit 提交我们的第一次修改 好这三步敲完之后,我们的代码就有了一个安全的备份版本,接下来我们就可以放心大胆地继续迭代我们的产品了。 终端用完之后,为了不挡着视线,我们只需要再次按下同样的快捷键, command 加 j 就 能够把它直接关掉。你看用快捷键来开关终端,双手完全不需要离开键盘,整个过程呢非常的丝滑,也是非常的方便。 那现在我们用 codex 做了一个基本可用的笔记软件,而且还用 get 提交了这个可用版本,下面呢,我们就来继续迭代这个笔记软件,让它变得更强大,更美观。 假设这个时候你看了看这个笔记软件,觉得它的色彩设计不是很好,这里面有很多的绿色元素,你不太喜欢绿色,你想试试蓝色怎么样?那这个时候该怎么处理呢?很简单,你就直接在这里面追问就好了,比如我们可以这么提要求, 不过我们先不发送这个请求了吧。啊?为什么呢?你仔细看看啊,我们上一个消息里面还让 codex 排查问题来着, 但说实话,这其实并不是一个问题,只是 codex 的 浏览区有些限制而已。如果我们继续追问的话,这个排查过程不仅会占用模型的上下文,而且可能还会对 codex 后续执行产生一些影响, 他没准会继续尝试修复这个问题,把原来没有问题的页面修出问题来。虽然这种情况发生的概率应该也不会很大,但是能规避的话就尽量规避吧,毕竟这个消息其实一点用也没有。 所以我们该怎么办呢?有一个办法,那就是直接修改上一个消息就可以了,你看这里面有一个编辑按钮,我们点一下就可以直接修改这个消息了,我们来试试 提交。你看原来的请求被替换成了我们的这个,这样的话,原来排查问题的那个消息呢,就消失了,既然消失了,它就不会再占用模型的上下文了,也不会对 codex 后续执行产生任何影响, 所以很多情况下,这个功能还是很实用的。不过要注意的是, codex 只支持编辑最后一条消息,至于更靠前的那消息,它实际上是不支持我们编辑的。 前面的那些消息呢,都是没有编辑按钮的,如果你要编辑更靠近的消息,可以考虑使用 fork 功能来间接实现这个功能。我们后面会讲到,暂时你不必过于关心好。 codex 已经完成任务了,我们来看看效果。 呃,还可以吧。下面呢,我们把这一部分的改动也加入到 get 里面。之前我们是用命令行来操作 get, 这种操作方式准确通用,不过其实 codex 也内置了一些 get 操作的功能来供我们使用。比如我们可以先点击这个图标, 这里面呢就有一个叫做 environments 的 区域,它呢就跟 get 的 使用密切相关。我们可以点击这里面的 changes 按钮,然后再在这个选择框里面选择 on stage 的 选项。这里显示的就是所有还没有提交到暂存区的代码了, 这基本上也就是 codex 刚才所做的改动。如果你觉得哪一行有问题,可以点击旁边的加号,输入你的要求。输入完要求之后,你可以点击这里面的 comment 按钮,让 codex 做出相应的改动。不过这里我们就不做任何修改了, codex 的 任务已经完成的很好了,所以我们取消这个注示, 直接使用 git commit 提交这次改动。那具体该怎么做呢?很简单,直接点击这里面的 commit 按钮,输入 commit 的 message 就 可以了。我们的 commit message 就是 将整体色调改为蓝色,然后呢,再点击 continue, 此时 codex 就 会提交当前所有没有提交的改动了。 好,执行成功了,我们来验证下。先按一下 command 加 j 来到终端,然后再执行 git log, 查询 git 的 commit 记录。 你看,我们的 commit 确实是生效了,确认好了之后,我们按 q 退出 get log, 然后呢,再按 command 加 j 来隐藏终端,到这里,这个需求就算是彻底完成了。那假设这个时候你感觉蓝色这个主题也不怎么好看了,越看越不顺眼,要不再换一个吧。 没问题,我们直接提交需求,将整体色调改为紫色。改完之后呢,再做一次 get commit。 对, 这次我们不自己操作 get 了,有点麻烦,直接让 codex 操作得了。提交之后, codex 就 开始干活了,我们稍微等待一下, 改好了,我们来看看最后的效果。不错,确实改成紫色了,不过怎么说呢,啊,你觉得还是不顺眼啊,你在想,算了,我要不还是改成一开始的那个绿色吧。那这当然是可以的, 照例啊,你可以直接在输入框里面输入,你的要求就是改回来的紫色。这个呢,肯定是行的,只不过这样的话,模型还得再跑一遍,有点浪费 token, 所以 我们就不用这个方法了。 其实我们原来就是绿色,所以用 get 把代码回滚到绿色的那个版本就可以了。只不过这种做法其实也是有点缺陷的, 代码确实是回滚了,但绘画内容还是停留在紫色这里。如果我们希望在当前这个绘画继续问的话, codex 可能会以为目前所用的色调是紫色,从而对后续的任务执行效果产生负面影响。 那我们能不能把绘画和代码同时回滚呢?我们就想回滚到改蓝色之前的那个版本,也就是这个版本,如果有回滚功能的话,那应该是在这个消息旁边有一些相对应的标识吧,我们找找。 哎,还真的有一个图标有点像,不过它不叫回滚,它叫做 fork。 fork 的 意思就是基于当前的这个绘画,再复制一个新的出来,这个新绘画就只到目前所选的这个消息为止,后面的消息全都不保留, 这个呢就非常符合我们的要求了,我们其实就希望绘画到当前的这个消息为止,那既然绘画变了,代码是不是也会自动回滚呢?没准也是可以的,我们来试试。 我们首先点击这个 fork 图标,这里弹出两个选项供我们选择,一个是 fork into local, 另外一个呢是 fork into new work tree。 这两个选项的最大区别在于新绘画的代码存放地址不同。 第一个选项会继续使用当前目录作为新绘画代码存放地址,第二个选项会创建一个新的目录来存放心绘画的代码。你可能现在听的还是有点懵啊,没关系,我来演示一下你就知道了。在演示之前,我们先把左侧栏打开,这样你就会看得更清楚一些。 好,左侧栏打开了,我们来重新点击一下这个 fork 图标,然后选择第一项 fork into local。 可以看出 codex 确实给我们创建了一个新的绘画,并且还在这里标识好了,这个绘画呢,就是从别的绘画那里复制出来的。下面我们来看看代码是否也会滚了, 这个很简单,我们不必看代码,我们直接看最终的效果就行了。让我们来看看页面的颜色有没有改变,可以看出页面的颜色仍然是紫色,所以呢,代码根本就没有回滚。没错,这呢就是 fork into local 这个选项的特点,它只会处理绘画内容,根本就不会对代码做任何修改。 不过还好,我们使用了 git, 我 们可以用 git 来回滚代码。我们先按快捷键 command j, 打开终端,然后执行命令 git log 确定我们想把代码回滚到哪个 commit 上,应该就是这个了。然后呢,我们复制这个 commit 的 哈希值, 最后执行这个命令。这样呢,就可以把代码回滚到绘画对应的那个版本了。让我们回到浏览器这里刷新一下页面, 没错,确实是一开始的绿色版本了,当然绿的也不是很明显啊,只有那么几个模块是绿的。我对这个色调的表述呢,稍微有点问题,但无论怎么样,肯定是回滚成功了,相信大家都能看得出来,这个呢就是 fork into local 了,我们配合着 git, 才能把绘画和代码都回滚到之前的那个状态。 那刚才还有一个选项叫做 fork into new work tree, 那 个选项是用来干什么的呢?我们不妨来试试。让我们回到之前的绘画里, 点击这个 fork 图标,然后再选择 fork into new work tree。 注意看, codex 依然给我们创建了一个新的绘画,而且跟 fork into local 很 像。这个新的绘画呢,也标识出来了,它就是从别的绘画里面复制过来的。 一切看起来似乎都跟那个 fork into local 差不多啊,那到底什么发生变化了呢?答案就是我们当前的这个绘画所对应的项目目录发生了变化,不信我们来打开终端,输入 pwd, 这个命令就是用来显示当前位置的,可以看出我们的当前位置呢,就是这个了,我一开始 fork 出来的那个绘画可不是在这个目录里面操作的,不信的话,我们回到一开始 fork 出来的那个绘画里,同样打开终端, 运行下 pwd, 你 看它俩的项目目录地址是不同的,我把这两个地址打在屏幕上,这样大家就可以看得更清楚一些。 这个呢,就是 fork into new worktree 的 一个特性,它会给 fork 出来的新绘画创建一个对应的新目录,这样新老绘画所处理的代码不是一份,彼此之间互不影响,非常适合在两个绘画分别处理两个不同的功能点,最后做完了再合并到一起就好了。那为什么叫做 worktree 呢? 是因为它是使用 gitworktree 来实现的,这个呢,是 git 的 一个特性。这个要展开讲的话呢,又得讲好几分钟。我们本期是来讲 codex 的, 不是来讲 git 的, 所以呢, gitworktree 在 此就跳过了,感兴趣的同学可以自己查下。 另外值得一提的是, fork into new worktree 同样不会回滚代码,它只是把当前项目目录里面的所有代码复制到一个新的目录里,仅此而已。 好,这个就是 fork 的 两种形式了。总结一下,这两个选项都会复制绘画到所选消息为止,也都不会帮你回滚代码, 它们唯一的区别仅仅是代码的位置, local 呢,是继续沿用原目录,而 new work tree 呢,则是开辟了一个全新的隔离目录。主要呢,就是这个区别了。所以呢,无论是哪一种 fork 形式,都不会更改代码。实际上 codex 在 界面里面也有显示, 我们可以回到一开始的那个绘画。然后呢,再点击一下这里面的 fork 图标。注意到这段话了吗? 其实它想表达的意思就是 fork 只负责对话,不回归代码。对,它说的有点绕,但其实就是这个意思。 好, fork 功能我们终于讲完了,我们目前只需要第一个 fork into local 的 这个绘画,另外一个 fork into work tree 我 们暂时不需要。那我们能把这个绘画删掉吗?能, 不过准确来说啊,我们可以把这个绘画规章,规章和删除稍微还是有些区别的,你可以把规章理解为暂时隐藏起来了,而删除呢,那就是删完就没了。我们来试一下, 我们直接点击绘画旁边的这个图标,然后再点击 confirm, 这个绘画就被规范了。你看这个绘画是不是没了。但跟删除不同的是,我们还可以找回这个绘画。 我们先按 command 加逗号,打开设置面板,再点击里面的 archives chats, 在 这里我们就可以看到所有被规章的绘画了。我们可以解除对应绘画的规章状态,也可以彻底删除对应的绘画。所以你看,删除和规章还是稍稍有些区别的。 那规章这个功能我们就讲到这里,从之前的操作过程中我们可以看出, get 真的 还是挺重要的。那既然这么重要,我们能不能让 codex 每次写完代码的时候都能自动提交一次 get commit 呢,这样的话就不用麻烦我们每次都操作一遍了。 这当然是可以的,其中一个方法就是我们可以直接在输入框里面告诉 codex, 每次完成代码修改之后,都需要提交一次 get commit, 然后提交这个请求就行了。这样在后续的操作里面, codex 肯定就会按照我们所说的,每写完一次代码都提交一次 get commit。 不 过这个方法有个很大的缺陷,那就是它只会在当前的绘画中生效,如果我们创建出一个新绘画的话,那 codex 就 会彻底忘掉这个事情, 所以我们需要一个能够跨绘画的解决方案,即使是在一个新绘画里, codex 也能帮我们做 get commit 这个事情,这能做到吗?当然是可以的,这个呢就是 agent 点 m d 这个文件发挥作用的地方了。 agent 点 m d 简单来说呢,就是一个放在项目根目录里面的配置文件,每当 codex 开始一个新绘画的时候,它都会自动读取这个文件,把里面内容当成对自己的指令来执行, 所以我们只需要在这个文件里面写上这个 git commit 的 要求,那无论我们开多少个新会话, codex 都会记住这件事情的。我们先把原来的这个请求删掉,我们不需要它了,然后我们点击这里使用 vs code 打开这个项目目录, 在根目录下创建一个新的文件,就叫做 agent 后台,然后在这个文件里面写,每次完成代码修改后,都需要提交一次 git commit, 这样 agent dmd 就 创建好了,让我们把 vs code 关掉,现在让我们来验证一下 agent dmd 是 否真的会生效。我们首先创建一个新的绘画, 然后提交需求,往左下角增加一个主题切换选项,支持用户在浅色模式和深色模式之间切换。回车提交,让 codex 开始工作。 好, codex 已经完成了,我们来看看效果。 你看,左下角确实是出现了一个主题切换按钮,我们点击对应的主题,就可以在浅色和深色两种模式之间切换,看起来非常完美。那我们现在最关心的是, codex 有 没有帮我们做 get commit 操作呢?我们按一下 command 加 g, 打开终端执行 get log 来看看。 你看,这里面确实是多了一个新的 commit message 呢,就是 codex 自己写的,这说明 agent 点 m d 确实生效了。即使是在一个全新的绘画里面, codex 也遵从了我们的要求,在完成了代码修改之后,自动提交了一次 git commit。 这个呢就是 agent d m d 的 基本用法了,当然他能做的事情远不止这一件,比如你可以在里面规定代码风格、命名规范、技术占要求,甚至是你的项目背景介绍等等。 codex 每次启动新会话的时候都会去读取这些文件,这样他对你的项目就会有非常好的理解,给出的结果呢也会更加准确。 可以说, agents dmd 写得越好, codex 就 会用起来越顺手。不过需要注意的是, codex 只会提交当前需求所对应的代码改动。我们一开始创建的 agents dmd 不 属于当前需求的范畴,所以呢,刚才 codex 并没有把它提交为一个 git commit, 我 们点击这个 changes, 再选择 on stage, 就 可以发现 agents d m d 的 内容呢?还没有提交上去。没事儿,我们这就提交。我们先来点一下这个 commit 按钮,然后在里面输入对应的 commit message, 再点击 continue, 这样这个改动就会被提交到 get 上面了。好,一切顺利,让我们新开一个绘画,继续迭代这个笔记软件。 现在这个软件本质上就是一个 html 文件,只能在浏览器里打开,不够方便。我们想把它改造成一个真正的桌面客户端,让用户可以直接双击图标打开,就像打开 vs code codex 一 样。 那要做桌面客户端的话, electron 是 非常主流的一个选择,我们可以顺便呢也引入 react 和 type script, 把项目结构整理一下,方便后续继续迭代。那我们就直接把需求发给 codex, 把这个网页应用改成桌面客户端,进入站使用 electron 加上 react, 再加上 type script。 注意做好测试,确保所有的核心功能运转正常 啊。不过要注意这可是一个大工程,所以呢,我们最好先让 codex 做一个规划,我们确认规划没有问题之后,再让它动工。为了实现这一点,我们可以点击这里面的加号,然后选择 plan mode, 这样 codex 就 进入了计划模式,从这个图标也可以看出这一点。 在这个模式下, codex 会先做计划,再写代码,让我们来提交试试。可以看出 codex 开始工作了,让我们稍微等待一会。 好,他现在要问我们几个问题,我们来做一下选择。首先是数据要放在哪里,我们就放到文件里面吧, 然后交付到可开发运行的程度就可以了。这之后呢, codex 就 会继续开始干活了。好,可以看出 codex 开始给我们写这个计划了, 我们再稍微等待一会,它还在这个转写的过程中。 好,写完了,我们来看一下,这个计划本身还是比较完善的。呃,包括各种测试方案呐,架构设计啊,都是写的比较详细的。然后 codex 问我们是不是要按照这个计划去实现代码。 呃,他一共是给了我们两个选项,第一个选项呢就是直接同意啊,开始实现这个计划就好了。第二个选项呢是如果你对这个计划不满意的话,你可以提出你的要求,在这个文本框里面告诉 codex 应该如何做修改,然后 codex 会根据这个修改呢,再出一份新的计划。 呃,这里面呢,我们就不对计划再做一些其他修改了,我们就直接同意好了,让 codex 就 按照这个计划给我们来写代码。 好,现在 codex 开始干活了,我们需要稍微等待一下,在等待的过程中呢,我们可以跟 codex 随便去聊点东西,我们可以在输入框 side 打开 side chat 啊,在这里面呢,我们就可以随便问 codex 点别的问题,这些问题呢不会去影响左侧 codex 的 任务执行。比如说我们可以问一下,你觉得这个笔记软件还需要什么基本功能呢?提交 好 codex 呢,给了我们一些可行的方案。你看在 side chat 的 过程中, codex 左侧的任务执行一点也没有被干扰到。对,这个呢就是 side chat 的 一个非常重要的特点了,它就是允许用户在 codex 执行任务的过程中问一些比较轻量级的问题, codex 在 回答这些轻量级问题的过程中不会影响到左侧主任务的执行。那这个就是 sign chat 这个功能的特性了。这个呢,我们就先讲到这里,这个架构改造的工作量还是挺大的, codex 依然没有完成,让我们再耐心等待一会儿。 好,看起来 codex 已经完成任务了,它提示我们使用 npm runtime 这个命令就可以启动这个 electron 应用啊,让我们来试一下。首先按 command 加 j 打开终端,然后执行命令 npm runtime 回车, 这样的话这个 electron 应用就启动开了,不过看起来好像是有点问题,基本上是一个白屏的状态。呃,我们打开控制台看一下有没有什么报错 啊,确实有报错,这个呢,我们需要让 codex 帮我们来修一下啊,让我们来回到 codex 这里, 先把这个进程关掉,然后呢再把终端关掉,然后我们提出我们的诉求,启动后白屏控制台报错了。看来你之前的测试不够彻底啊,请你修复并确保在修复之后测试好再交付给我。 codex 说,我说的对,哼。呃,让我们等 codex 把这个错误修复之后再试一次。 呃,看起来 codex 已经修复好了,我们来看一下它修复后的效果是怎么样的。呃,同样,我们打开终端,然后执行这个命令 啊,这次呢,看起来没问题了,添加笔记呢也是可以的,我们呢也可以在这里面随便输入的标题内容都可以啊,主题切换也是没有问题的。 那看起来已经很完美了,各项功能都运转正常。让我们再回到 codex 这边。 呃,我们先按一下 ctrl 加 c, 关掉这个进程,然后呢,再把终端收起。好,那改成了 electron 架构,我们就继续来提新的需求。我们的新需求是为这个笔记应用增加 markdown 支持,具体来说,需要在编辑器右上角提供两个模式切换按钮。 那假设这个时候我想换行,怎么做呢?直接按回车肯定是不行的,按回车就提交了,正确的做法是按 shift 加回车。你看这样呢,就可以回车了。我们继续输入任务内容, 首先是编辑模式,显示所有文本内容,并对其中的 markdown 语法进行高亮显示。然后还有一个是预览模式,它用于显示 markdown 的 渲染结果。现在再回车。 好,可以看到 codex 开始工作了,在它工作的间隙,我们再创建一个新的绘画,让它再处理另外一个关系不大的任务。 我们的新任务就是给这个笔记项目生成一个 logo, svg 格式。可以看出这两个绘画都在工作中了。假设这个时候你突然想到了我们的笔记软件有深浅两种模式,这个 logo 需要在任意一个模式下都清晰可见。我们最好提醒一下 codex, 以免它忘了, 好让我们发送请求。不过这个请求似乎没有发出去,它似乎卡在这里了。没错,在默认情况下,只有当上一个请求完成后, codex 才会继续处理下一个请求。 不过到那个时候就有点晚了吧,毕竟 logo 都生成好了。我们能不能现在就把这个信息发送给 codex, 让它在生成 logo 前就注意到这一点呢? 没问题,注意到这里的 steer 按钮了吗?点一下,我们的请求就会立即发送给 codex, 这样我们的目标就达到了。那 codex 现在还在运行中,我们稍稍等待一会儿。 好,可以看出 logo 已经生成完毕了。我们切回到原来的那个绘画,看看它的进度怎么样了,它还在运行中,所以我们可能还需要再稍微等那么一会儿。 好,这两个任务呢都完成了,我们来直接打开软件,看看最终效果。首先是要打开终端,然后呢,我们运行 n p m start, 打开这个 electron 应用。呃,看起来好像是有点问题啊。 logo 没有被成功地加载起来, 那我们需要跟 codex 说一下这个事情,让我们先关掉这个 electron 应用。 然后呢,我们关掉这个 electron 进程,先看看这个 logo 在 不在 啊?这个 logo 确实是在 public 文件夹里面的,那应该不是文件不存在导致的。那是不是这个 svg 文件的格式有问题呢?我们来到访达来验证一下。 打开这个 public 文件夹,看来这个 svg 文件的格式也是没有问题的,毕竟访达都正常渲染出来了。 那大概率是 electron 加载这个 svg 文件的方法有问题。让我们来让 codex 修一下。首先按 command 加 g, 我 们唤起这个绘画列表,然后选择生成 logo 的 那个绘画, 然后在这里面我们输入具体的问题, logo 没有显示出来。提交好,提交之后呢, codex 就 开始给我们排查原因了,我们再稍微等一会儿。 修复完毕,我们再次启动这个软件看看效果。 首先打开终端,运行 npm start 好, 这次看起来 logo 是 成功的显示出来了,我们还可以随便点一点其他的功能,看看整体是否运转正常。 那 markdown 呢?我们可以随便输入几个 markdown 的 关键词,看一看它的高亮显示是否正常。看起来似乎并没有什么太大问题,各种格式呢,都可以非常正常地显示出来, 可以看出预览也是没有问题的。那这次需求就到这里了,我们再次回到 codex 这里,继续迭代它。 前面我们讲的呢,都是 codex 的 基本能力,下面我们来讲讲 plugging。 你 可以把 plugging 想象成一个 codex 的 外挂,它会给 codex 相应的能力,帮助 codex 去做更多的事情。这么说呢,可能比较抽象,我们可以来实战一下。呃,我们首先可以打开侧边栏, 然后点击里面的 plugins, 在 这里我们就能够看到所有可用的 plugin 了,其中有能控制电脑的,有用于操作 chromed, 还有用于编辑 excel 的 啊,还有一些是用来制作 ppt 的。 如果 plugin 的 旁边打了勾,那代表这个 plugin 已经被安装好了。如果 plugin 没有安装的话,旁边会是一个加号,我们点击这个加号就可以正常安装了。我们来随便点几个 plug in, 看看它内部到底有什么。 比如我们可以点一下这个叫做 gmail 的 plug in, 可以 看到这个 plug in 内部有三个组成部分,其中一个是 app, 两个是 skill。 这个 app 呢,是用来把 codex 和 gmail 连接起来的, 它里面提供了很多的工具,当然 codex 没有叫它是工具, codex 叫它是 action, 但其实本质上啊,这里面就是一个一个的工具,跟 mcp 的 工具呢差不多。 比如 apply labels to emails 就是 用来给邮件打标签的 archive emails 就是 用来归档邮件的。这个 app 一 共是提供了二十四个这样的工具,除了 app 之外,这个 plugin 还提供了两个 skill, 呃,你基本上是可以把 skill 当成是给大模型看的一个说明文档, 比如说是这个 gmail skill, 它就写明了怎么总结邮件内容,怎么赚,写回复,以及什么时候该调用哪一些工具啊等等。 而这个叫做 inbox treeash 的 skill 呢,则是告诉大模型如何给邮件归类的,比如说哪一些邮件比较紧急,哪一些邮件需要回复等等。如果你对 skill 比较感兴趣,可以看一下我的这个视频,把 skill 的 使用方法和运行原理一次讲明白。 gmail 的 这个 app 所包含的内容呢,就只有这三个了,我们如果选择安装 gmail 这个插件,那其实就是选择安装了这三个组件。等到用户想要 codex 操作 gmail 的 时候, gpt 模型便会找到这三个组件,并用它们提供的能力和说明来完成。用户的要求 大致就是这个样子的。我们来看一个具体的例子,比如说是 presentations, 这个 plugging 呢,是用来写 ppt 的, 它只有一个组件,那就是这个叫做 presentations 的 skill。 这个 skill 详细说明了该怎么做才能做出一个高质量的 ppt。 下面呢,我们就尝试用这个叫做 presentations 的 plugging 来完成我们的需求,让我们来新建一个绘画,然后输入我们的要求,给这个笔记软件做一个 ppt, 介绍它的产品设计和技术架构。 提交之后, codex 就 会找到我们前面所说的那个叫做 presentations 的 plug in, 并使用那个 plug in 提供的能力来做 ppt。 当然,如果你担心 codex 找不到这个 plug in, 或者说是找错了的话,你可以明确要求 codex 使用这个叫做 presentations 的 plug in, 这只需要在任务的最前面输入一个 at 符号,然后敲入 presentations 回车,这样 codex 就 一定会使用 presentations 这个 plug in 来做 ppt 了。 不过不加也没关系, codex 会自动找到这个 plug in 的, 所以呢,我们暂时就把它给去掉吧。好,提交,可以看出 codex 开始工作了,我们稍微等待一会儿, codex 写好了,我们打开看看。 中规中矩吧,其中其实还有不少可以改进的地方,不过这已经是一个不错的起点了,我们可以在这个基础上做一些其他的改进。 这个叫做 presentations 的 plug in 并不能算上经验。下面呢,我给大家介绍 open ai 所提供的两个用来镇店的 plug in, 一个呢是叫做 computer use, 用来控制电脑。另一个呢是叫做 chrome, 用来操作 chrome 浏览器啊,我们先来试一试 chrome 这个插件, 让我们来到这个插件管理的地方,然后呢,点击 chrome 旁边的这个加号来安装这个插件, 点击 install 好, 安装好了。然后呢, codex 提示我们需要在 chrome 上面也安装对应的扩展也行。好,那我们就按照它的指示来安装这个扩展。 那一切准备就绪之后,我们就来尝试用用这个 chrome 插件,我们可以直接点击旁边的这个按钮,这样的话, codex 就 可以给我们出实化一个使用当前插件的这么一个请求。呃,我们可以把后面的这个部分给去掉,换成我们具体的请求, 那就是打开 product hunt 首页,然后再找出今天最热门的三个新发布的产品,总结它们各自的特点,并附上对应的访问链接好提交。 呃,为了让大家看得更清楚,让我来把 codex 缩小一点,把 chrome 浏览器放出来,这样的话呢,大家就可以更清楚地看到 codex 到底是如何干活的了。 可以看到 codex 创建了一个标签组,这个标签组呢,专门用于解决我们的问题,然后它在这个标签组里面访问了 product hunt 的 首页,今天最热门的三个新发布的产品就在这里了,相信 codex 也看到了。 可以看到,现在 codex 开始打开另外一个标签页了,这个呢,看起来是第一个产品 brew 的 一个相关网站,然后呢,它又打开了一个。 呃,接下来呢,我们就不管了, codex 估计还会查看更多的网页,我们就在这里稍微等待一会,相信他等会就可以查询全部的产品页面,然后给我们一个比较有效的反馈,让我们稍微等待一下。 好, codex 给我们总结了,这个呢,基本上也就是我们想要的结果了,这个呢,就是 chrome 这个插件的相关使用方法了,让我们把这个 codex 再次最大化。 然后下面呢,我们就来看一看 computer use 这个插件的使用方法,它是用来操作电脑的,同样,我们点击这个加号,然后进行安装, 安装成功,让我们来使用一下。跟 chrome 的 使用方法类似,我们也可以点击 computer use 旁边的这个小图标,这样直接就能开启一个相关的 computer use 绘画。我们先把后面这段文本删掉,因为它跟我们真实的请求没有什么关系。 然后呢,我们再稍微改一下这个请求所对应的目录,我们现在呢是放在马克笔记这个地方,但实际上我们要打的这个请求呢,跟这个项目其实没什么太大关系,所以呢,我们就选择 don't work in the project, 也就是说,这就是我们随便提出来的一个请求,不会去绑定某个具体的项目目录。之后,我们就可以正式输入自己的请求了,那就是请打开我电脑自带的日历应用,帮我新建一个五月二十八日十点的日程标题,叫做讨论马克笔记的后续设计。 没错,就是这样,我们让 codex 操作一下日历这个应用,然后同之前一样,我们把 codex 缩小,把日历这个软件漏出来。这样呢,大家就可以更清楚地看到 codex 是 怎么操作我们这个日历软件的。 好, codex 首先询问我们能不能使用日历这个应用,我们同意, 可以看出 codex 开始行动了,这个呢就是 codex 的 鼠标,它跟我们所使用的鼠标呢,根本是两套,彼此之间互不影响啊。然后 codex 呢就开始操作这个鼠标,去完成我们的需求, 它还需要我们确认一下是不是真的要创建这个日程,这个有点啰嗦,那当然是确认了,我们给它回复一下, 好,看起来 codex 已经完成了我们的要求了,我们来看一下, 看起来这个日程的标题和时间段都是满足我们要求的,那就没问题了,我们再把 codex 最大化。 这个呢,基本上就是 computer use 这个插件的使用方法了。值得一提的是, codex 使用独立的虚拟鼠标,与你的鼠标互不干扰。刚才把日历软件提到前台只是为了掩饰,实际上你完全可以让它在后台默默干活,自己该干嘛干嘛,上网看视频都可以,完全不会耽误。 好, computer use 讲完了,我们接下来就来看看 skill 是 如何使用的。想要浏览 skill, 我 们就必须要先打开 plugins, 然后再点击这里面的 skills, 就 可以看到可用的 skill 列表了。 其实我们之前用 plugin 的 时候已经间接的用过 skill 了,因为无论是 presentations, computer use 还是 chrome, 这几个 plugin 的 核心组建呢,都是 skill, 你 在这个 skill 标签下面都能找到。 当我们安装对应的 plugging 的 时候呢,我们都会把相关的 skill 一 块儿安装好,所以我们在这里都能找到这些 skill。 不 过有一个王牌级的 skill 是 单独列在 skill 这个标签下面的,它并没有一个对应的 plugging。 这个 skill 呢,就是 mhgen, 它是用来生成图片的, 相信大家对 g p t 的 生图能力早有耳闻,不仅美观,而且非常的真实。下面呢,我们就来使用这个 skill 来创建一个图片。我们在马克笔记这个项目下新建一个绘画,然后输入我们的要求,给这个笔记软件生成一个宣传海报图片,注意要使用我给你的真实的软件截图。 然后呢,我们需要给 codex 相应的软件截图,我们先按 command 加 j 打开终端, 然后执行 npm start 命令来打开我们的笔记软件, 然后我们回到 codex 这里,点击加号,再找到其中的 attach electron 这个选项,这里面的 electron 其实就是我们的马克笔记软件了, 我们的这个笔记软件就是用 electron 做的,所以呢,在 codex 里面看来,这个笔记软件就叫做 electron, 我 们来直接点击这个选项,点击之后呢, codex 询问我们是否要启用这个功能,我们点击 enable, 然后我们的马克笔记截图就到了聊天框里面了,这样 codex 在 做海报的时候就可以根据真实的软件截图来做了,是不是很方便呢?点一下按钮就可以把截图放进来了, 不过这个还不是最方便的, codex 还提供了一个快捷键,按一下就能够把截图传过来。我来给大家演示一下,我们之前给 codex 的是浅色模式的截图,我现在在给 codex 传一张深色模式的,我们回到马克笔记这里,调到深色模式, 然后重点来了,左右 command 键同时按下,这样深色模式的马克笔记截图也传给 codex 了,这个确实更加方便了吧。好,现在 codex 有 了浅色和深色两种模式的截图,我们可以让它开始做海报了。提交, 首先我们可以注意到 codex 会使用 image 这个我们之前提到的技能来做这张宣传海报,然后我们就再等等,看它能画出什么样子来。 画完了,我觉得还行吧,确实是基于我们的截图来做的,不知道你觉得怎么样呢? 除了使用 codex 给我们安装的 skill 外,我们也可以创建自己的 skill。 让我们按 command 加 n 新建一个绘画,然后输入我们的任务,写一个代码审核 skill, 专门给当前的项目使用。这个 skill 应该包含如下的规则。好,我们提交 可以看到这个 skill 已经做好了,它的名字就叫做 marknotes code review。 下面让我们按一下 command 加 n 新建一个绘画,试试这个 skill 的 效果。首先我们 at 这个 skill, 然后提出我们的请求,检查当前项目的代码是否有问题。好,可以了, 结果出来了,还可以,我们还可以让 codex 根据审查的结果来修改代码。这里呢,我就不再继续演示了, 我们的笔记软件每天都在迭代,每天都有代码更新,所以我们最好能每天定时检查一下代码,看看有没有什么问题。这种场景就很适合起一个定时任务来处理。 codex 也提供了这样的功能,让我们来点击这里面的三个点, 再点击 add automation。 呃,也就是添加一个定时任务。这里呢是定时任务的标题, codex 已经帮我们填好了。这里呢,填写发起定时任务的时候,我们需要发给 codex 的 要求,我们的要求呢就是检查当前项目的代码是否有问题。 然后下面呢是执行环境,一共是有三个选项,分别是 local, worktree 和 chat。 local 呢是在某个项目目录里面运行这个定时任务 worktree 是 基于某个项目目录创建一个新的 worktree, 这个定时任务就在这个新的 worktree 里面运行。 worktree 的 概念我们之前讲过,它是 get 的 一个概念,如果你还是一知半解的话,可以先不管,我们这里不用这个选项。 chat 呢是执行环境,不跟任何项目目录绑定,我们之前用 chrome plugin 搜索网络的时候,实际上是用过 chat 环境的, 这里最适合我们的是 local, 毕竟我们的定时任务就是要扫描马克笔记的项目代码,所以一定是要跟某个项目目录绑定起来的。让我们选择 local, 然后在这里面选择马克笔记,然后这边呢是运行频率,我们选择 daily, 具体的时间呢,我们就维持在九点钟,意思就是我们这个定时任务在每天九点钟的时候启动, 下面呢我们选择模型 g b t 五点五,推理强度呢,我们就维持目前的 medium 就 好了。然后我们点击 save, 再打开左边栏, 我们就可以看到 automations, 这里面多了一个一。点击之后就可以发现我们创建的定时任务了,它会每天十点开始运行,每次运行的时候都会创建一个新的绘画,我们可以点击这个按钮试运行这个定时任务, 可以看到一个绘画创建出来了,就是用来运行这个定时任务的,我们来打开看一下, 好,可以看到这个定时任务已经完成了,后面每天跑的也都是这个样子了,那这个就是定时任务了。最后我想给大家讲讲 codex 的 一个特别有用的功能,那就是 codex mobile, 具体来说就是我们可以在手机上操纵 codex 来给我们完成任务,让我们来点击这里面的 codex mobile, 再点击 allow 允许手机操纵这台电脑, 然后再点击弹,点击完弹了之后, codex 应该会给你显示出一个二维码来。 呃,如果你像我这样没有显示出二维码的话,可以点击这里的手机图标,这样二维码就出来了。随后我们需要打开手机摄像头扫描这个二维码。然后呢,我们就会被引导到叉 g b t 的 codex 页面。在这里我们就能向电脑端的 codex 发送指令了, 比如我们想让它操作一下日历。你还记不记得我们之前在日历上创建了一个日程标题,就叫做讨论马克笔记的后续设计。现在我们在手机上再发送一个指令,让它把这个日程去掉,我们点击聊天。 然后呢,我们再点击这里,呃,在里面找出 computer use 这个选项。 随后呢,我们需要输入我们的请求,我们的请求就是把日历中五月二十八号呃,讨论马克笔记的日程删掉, 写完之后先不要忙着提交,你看,我们现在在马克笔记这个项目目录下,但我们的请求其实跟这个项目的代码没什么关系,我们就想操作一下日历软件,所以我们需要再点一下这个设置按钮,然后选择不使用项目。好,这样呢就万事俱备了。我们提交请求, codex 首先询问我们是否同意使用 calendar 这个软件,我们批准。然后 codex 再次询问我们是否要真的删除掉这个日程,我们确认, 随后 codex 就 开始操纵电脑了,我来给大家看看电脑上是个什么样子,你看日历上面多了一个鼠标,它正在操纵电脑删除这个日程。 好,删除成功了。这样呢,我们就做到了用手机来操纵电脑了,是不是很方便呢? 这样大家在外面也可以使用 codex 来做各种各样的事情了。好到这里本期视频就结束了,我是马克,用最通俗的语言讲最硬核的技术,我们下期再见。拜拜。

本周人工智能圈最有戏的一幕来了, jeffrey hinton 站在领奖台上再次提醒大家,人工智能可能有一天会失控。 听起来很宏大对吧?但重度用户的第一反应可能是,先别统治人类,能不能别先毁我的项目? codex 很 强, cloudcode 也很强,它们写代码的速度已经像把实习生开到涡轮增压。 问题是代码生成得越快,史山也可能堆得越快。以前我们叫技术债,现在更向史山分期付款。 还有 codec 用户更懂的痛, trace log 每天几十个 g 的 写入,不一定马上毁掉固态硬盘,但如果日制缓存重试,数据库写入放大一起叠加,就会慢慢刷总写入寿命。 所以本周真正的焦虑不是人工智能明天会不会统治人类,而是它今天会不会先卡住限流误判,然后把你的 reaper 写成史山。你觉得现在的人工智能更像救世主,实习生还是一个很贵的史山加速器。

最近 codex 越来越火了,但是好多新手用户发现呢,他用起来还挺贵的,转头去用中转站的 api 的话呢,又不太靠谱。所以今天这个视频呢,我教大家用 acnes 这个可以国内直联的 api 接入 codex, 他们的模型呢,已经被调用三万多亿个头啃了,而且是不限时免费用的,所有人都可以体验一下让 ai 全自动帮你干活是什么感觉。 首先呢,我们要在 gittub 上找到 codex 加加这个开源软件,它可以自由切换 codex 的模型。打开 codex 加加管理工具之后呢,在左边的供应商配置里点添加供应商,这里名称呢,写 agnes 接入模式,选纯 api 配置模型呢,要填 agnes 二点零 flash base url 呢,写这个 key。 这里呢,我们要去 agnes 在 api 平台创建一个密要之后才能填 这个 apm 要呢是不限时免费用的,不用你充钱,也不用绑定任何的银行卡。戳贴好了之后直接粘贴到这里,上游协议选 chat completions, 再点上面这个保存就可以了。保存好之后呢,我们回到 上列表这里,选中刚刚填好的 ikenes 模型,再点盖栏启动 codex 加加,就可以自由使用免费的 codex。 接下来呢,我试试它的 ajt 能力,也就是让 ai 来调用各种工具来干活。比如这个博主,他做了个很好用的生成文章配图的 skill, 现在在 gap 上已经有五千多收藏了。 这个 skill 可以让 codex 去调用 agnes 模型,来根据文章内容画出像这样手绘风格的黑色小人插图。这样呢,就比单纯看大段大段的文字要更加轻松易懂,但新手呢,可能都不知道怎么用 btop, 也不知道调用 skill 这种情况呢,我们其实只要把 skill 的链接和文章都扔给 codex, ai 呢,就可以帮你自动读取 skill 的工作流来创作这种 手绘插图了。整个创作的过程中呢,艾格尼斯的 agent 模型会帮我们去分析文章内容,再去调用自己的生图能力,思考的过程中呢,也没有出现什么卡顿,而我们只要把 codex 挂在后台让他干活,然后等几分钟,插图就做好了。说明 agent 模型和声图模 配合的很好,这种多轮任务的工具调用也没有出问题,出来的图呢,也符合我们想要的风格。对于不熟悉 get up 的朋友来讲呢,这么用起来确实要简单方便,很多初学者呢,也可以用它来慢慢上手,体验最新的 ai 智能体是怎么干活了。除了这种插图之外,我们测试了一下让他做常用的乐高风格图片,蜘蛛侠、蝙蝠侠都上手呢,还可以。 像这种电商类的产品图,他的出图效果也没什么毛病,最高有四 k 分辨率,拿来做个演示其实挺够用了。另外, agnis 呢,也有视频模型,我们把这几张乐高图喂给 codex, 让图片动起来。 agnis 的模型呢,可以支持最高一零八零 p 的分辨率,拿来做科普视频,或者在我们拍摄短视频的时候提供一些分镜的参考还是挺合适。 是的,最重要的是,这些声图声视频的模型也同样是完全免费不限量的。想用的话,大家把这个整合了 agnes 官方声图声视频 api 的 dt up 项目链接告诉 cosex 就可以自由使用了,体验下来呢?我们觉得 agnes 确实给很多在意烧 token 问题 或者网络访问不太方便的用户提供了一个可靠的尝鲜方式,这其实就消除了很多人想要体验 ai agent 的心理障碍。大家以后有什么新的 ai 工具又担心跑起来太贵的话,可以上手试试。

之前我就跟你们说,装扣贷四赶紧买,快买,苹果笔记本那么便宜,六千多,现在呢,从六千多涨到八千多了。所以这个事就很有意思啊。一个月之前学扣贷四的学员,他的苹果笔记本六千块钱买的。呃, plus 会员呢,是七十块钱买的。如果你现在在学扣贷四呢, 你的苹果笔记本可能是需要八千块钱。呃,你的 plus 会员呢,是要一百四十块钱。然后你越晚学就越贵,越贵就越不想学。这就是一个死循环啊。你慢慢来,还得涨好吧。

常言建议大家现在如果没有使用 codex, 尽快装一个。过去两周里面我在重度的使用 codex。 其实我一开始是不想换 codex 的, 因为大家也知道感觉切工具非常的麻烦,但使用过 clock 的 同学应该都感觉它的使用都会让你觉得有一点被卡脖子的感觉。当你的 ar 工具已经融入到你每天的工作中的时候,你其实怕的不是贵,而是它突然哪一天不能用了。 products 第一个明显的点就是便宜大碗,虽然从单价的程度上来说,甚至 gbt 五点五是贵一点点的。 gbt 的 价格输入是每 每宝的头肯一美金,输出是三十美金。而 oppo 四点八是输入一美金,输出二十五美金。但是为什么实用的体格下来, oppenai 的 plan 更经用一点呢?主要是因为它 在做一些比较轻的任务的时候,就会自动调用一些比较轻的模型。其实在 call code 的 里面你也可以做,但是你就变成一个手动挡,然后 codex 是 一个自动挡,帮你切那个档位。 在第二个值得表扬的点呢,就是他的迁移非常的顺, context 能做到的是,如果你有 club, 他 就会问你说你要不要迁移,然后你点 yes ta da 他的 project session, 然后 skills 就 全部迁移过去了。我觉得就是这个是一个 open ai, 非常妙的一招,等于说无痛地把你的 iphone 备份到了一台新的 iphone 上面。第三呢,确实有些任务 gbt 现在是做的更好的,第一个是文案,第二是深图,因为它有 image gen。 第三呢,就比如说是一些交互的 codex, 呃,使用 html 和修改 html 都是非常的丝滑的, 所以我现在对 codex 定位不是说一个备胎,尤其是做内容做图,就是支持工作者的这一些 skill 呢。我觉得 codex 其实是非常好用的,至于怎么用 ai 做 ppt 呢?下一集我也想会单独分享一下,有兴趣的同学欢迎关注。

ai 数据中心烧钱,不是因为它贵在一台机器,而是因为它要同时买芯片、电力接入、冷却网络和涌跃。第一笔钱砸在算力上, ai 服务器不是普通服务器,里面是高价 gpu、 高宽带内存和高速互联。 第二笔钱砸在电上, ai 工厂不是找个插座就能跑,它需要长期电力变电站、配电系统和电网接入。 第三笔钱砸在冷却上,电最后几乎都会变成热,热散不出去,芯片就降频,服务就不稳定。 第四笔钱砸在网络上, ai 不是 一张卡单干很多 gpu 要低延迟,通信交换机、光模块和存储都很贵。第五笔钱砸在可信上,数据中心不能轻易停机,所以供电、冷却、消防监控和运维都要有备份。 所以 ai 数据中心烧钱,本质上是在建一座 ai 工厂,买机器只是开始电力冷却,折旧和利用率才会长期决定成本。

就在刚刚, colot fob 五发布了,很多人第一反应是,完了,又来了一个世界级的大模型,是不是又要学一个新的 ai? 但是我觉得普通人真正累的地方不是 ai 不 够强,而是 ai 太多了。今天 colot 更新,明天 gpt 更新,后天 gmi 更新。 写文案一个工具,查资料一个工具,做视频一个工具,剪辑又是一个工具。最后你会发现,不是 ai 在 给你打工,是你每天在给一堆 ai 打工。所以我现在更建议新手学习 codex, 因为 codex 不 仅是一个聊天框,它更像是一个 ai 的 调度员。你给它装上 chrome 浏览器技能,它就能替你查资料、看同行、找选择题。 你给他装上 hyperframes 技能,他就能把你的文案和素材做成视频。你给他装上 go 的 技能,他就能把一个目标拆解成任务,一步一步地向前推。这才是普通人该关注的重点。不是哪个模型又变强了,而是你能不能把这些 ai 变成真正帮你干活的员工。 模型越强,扣带丝越值钱。因为以后不是你一个一个 ai 去学,而是让扣带丝帮你把它们串起来。我把新手该装的三个扣带丝技能整理好了,想要的话,评论区扣技能。

我最近在用 codex 帮客户做一个网站,项目做到一半。我发现一个问题,相信这个问题很多人在运用 ai agent 的 时候也遇到过,就是上下文越长, ai 的 速度会越来越慢,而且很容易忘记之前说过的话。 更重要的是,越消耗 token, ai 变得越来越贵。后来我发现一个特别简单的方法,就是不要把记忆放在聊天记录里,要把你的记忆放在项目文件里。 项目做到一半的时候,直接让 ai 生成一个 handoff 的 文档,把你的项目目标,已经完成的内容,设计规范,还有下一步任务全部都写到这个文档里面。 接着呢,你就可以开启一个新的对话,这里是我已经开启好的新对话, 让 ai 先读这个 handoff 的 文档,然后马上就可以接着开始干了,而且不用带几十万 token 的 聊天记录。如果你也在用 cloud code, codex 或者 cursor 在 做项目, 这个方法真的能够帮你省很多的 token。 如果你们想要这个 handoff 的 提示词的话,可以评论区留言。

用了这么长时间的扣代码,我发现他出现了不少的问题,想让他帮我删测试数据,结果整个表都没了,这种误删误改就打我个措手不及。其次就是在 ypg 中,我改完逻辑函数影响到了其他模块,只给我说一句完成了,跑起来呢就全乱了,也包括去问他有没有跑成功, 他直接回答我已经成功完成了,结果根本就没有跑。最让我受不了的就同样的 bug, 反反复复改下面,下次还踩我的额度都浪费在这上面了。所以我就意识到了,如果我们不去管他,这些坑只会一直循环。 我呢就用了一套 skill 的 方法,把规则流程限制全部给它框起来。今天就来一个踩坑复盘,分享一个极大改善扣袋子使用体验的方法。这次实战味拉满了解决的办法和流程,我也总结出来了,其他的模型呢,也可以用类似的方法看完,如果你还有问题解决不了,说出来我帮你看看。出发, 其实方法呢,就用 skill 去精准的把控,那 skill 是 什么呢?相信大家也有了一个初步了解,这里呢就简单的说一下, 大概呢就以 macd 文件形式的题旨词,并且需要放在 agent 点 m d 文件夹里,一套针对特定任务题旨词和固定的作事方式。不过这里的题旨词呢,要按照这个格式来写,这两个横线里面的呢,就叫语言信息,一个写的是 skill 的 名字,一个呢是对他的一个描述, 告他叫什么,什么时候出发他,那下面呢,就是告诉 ai 怎么去做的一个题旨词。那说了这么多,那具体到底该怎么去设定呢? 这里就需要我们知道问题的点是什么,就像第一个问题,乱猜编数据,就像我让他去按照二手电车给我做个市场分析,但有的时候他的成果却是向市场规模方向去发展,信息不完整导致的幻觉问题。他呢就属于指令层, 我呢就在 skill 里面明确的去规定,不要给我胡编乱造数据,当时数据不存在或者是不确定的时候,不可以去给我瞎编胡造,要说明数据不可用,如果这个数据的来源是不可靠的,那就需要给我标记出来,也不能默认 api 路径这种内容是一定存在的,以及输出前的一个字检能不能达到这个要求。 对于做完不去验证,直接给我说完成了,导致跑起来全乱了。就是修改没有做影响分析,没有做兼容的验证,可以写修改前必须要做影响的一个分析,那说明这个模块会不会受到影响,如果你没有办法确定影响范围,就必须停止,并且说明不确定, 不可以继续给我修改,接着我们就可以写不可以破坏接口。做完之后呢,要按照这几点进行一个验证,而在我批量去操作任务的时候,他呢就会出现误删不改,而批量出错呢,他又不等于能力的问题, 而是缺乏安全的机制。在这里呢,我也写的很详细,规定了批量操作必须要给我分阶段去执行,以及涉及哪些操作,或者是需要按照一个什么流程去执行。而在必要的情况下呢,给我预演一遍, 先列出来被修改或者是被删除的对象,也要展示前后的一个对比,暂时不要给我做真实的改动设计这些操作的呢,要给我二次进行确认一下,或者是你先五个五个文件的小范围的去执行,包括还有一些我想让他在执行前注意到的一些流程,这样的话他就不会再打我个措手不及了。 而一个完整的 prompt skill 的 设计呢,是有六层的,但我们在写的时候也不需要这六层都存在,我们只需要知道问题的点在哪里,我们冲着哪个方向才能把控它。 那除了刚才拆出来这三点,还有目标层、工具与执行层,包括经验层,而目标层呢,就是来把控 ai 做错事,做偏提前结束任务,或者是无限的去做。就像我做任务的时候呢,总会给 ai 一 句帮我去优化一下代码,它呢就会自己去定义优化到底是什么, 可能只是去改变列名,它呢就乱成钩一通,就需要我们给他规定好它的一个目标,怎么样才算完成了,任务标准又是什么? 乱猜。用错工具卡的已经动不了了,包括执行顺序错了,该去给我查信息的时候,不去给我查信息,比如涉及到外部的一些知识 api 库框架时,必须先给我去查信息,不允许基于记忆给我去生成。包括我在修改 a 文件的时候,依赖呢?在 bc ai 呢,就只看 a, 该去给我多读一个文件的时候, 它呢就只给我读一个文件,该去给我换个工具操作了,就只刻那一个。还有一些其他经常出现的小问题, 如果你也有同样的问题麻住,而经验层呢,就不是避免错误,而是避免重复的错误。这里呢,就需要我们日常的一个经验总结了,像某 a p i, 它经常失败,某模块呢,它就是有坑, a p i 呢,每次都要猜一遍,我呢就把这个坑给它写,避免它下次再去翻, 我呢也总结了这个过程中其他方面会出现的一些问题,以及一个解决方法。好,我们知道了,遇到问题就要先去分析哪个层级能够把控得住它,再去固定固定的规则问题点。我们是会找了把 scale 放在不同的位置,它发挥的作用呢,也是不同的, 那到底应该放在哪里呢?这个时候我们就要先搞清楚,在 codex cloud 这一类 ai 编程环境里面,一般呢是分为三层,控制全局的 skill 是 放在你 codex agent 点 md 文件夹里面,管你这个人一个通用的工作流程, 哎,你默认用不用中文回答编码习惯要不要注视?通用的原则是先分析再动手吗?不管你做什么项目,这些呢都会一直生效。项目机 skill, 它呢,就在你项目机根目录 a p i 里面,你用的技术栈线,文件结构, api 规则,平时命名的一个规范包, apple ui 的 一个风格,换一个项目,这一套呢,就会被换掉了,用来统一一个项目的规定。而子目录 skill, 它呢,就在你任意文件夹下的 agent 点 m d 里面,用在局部特殊的一些规定上。你就说一个网站就是一个公司,公司呢要中文沟通,上班时间呢是九点,有一套固定的系统, 但公司里边呢,还有其他的一些不同部门,你就说技术部规定必须写 python, 它的接口呢,要标准化,当然这里面呢,还有设计部规定呢,就是来用 react tailwind, 人却用老写法,他不同的部分呢,规则他又不一样,所以子目录的作用就是来规定在同一个项目下,前端和后端不同的规则,但是这三层呢,他又不是并列共同实践的, 他是一个这样的关系。就像我在选举中说了我用中文,但我在项目中呢,又规定我要用英文,呈现给我的呢,就是英文。项目覆盖选举,当然也要结合你当前任务,你给出的提示词,逻辑呢,就是谁离任务越近越具体,他的优先级呢就会越高。那我们再回过头来看开头的这几个问题, 胡乱猜测编数据,因为这是 ai 的 一个通病,所以呢,我们就把它放到局的 skill 里面,它呢,就会出现一加一大于二的一个效果,而做完不去验证,它呢就分局 skill, 还有项目 skill 了。局写法呢,就更偏向行为的约束, 通用的一个规范,而项目写法呢,偏向于工程的流程,具体的一个执行标准。而第三个问题,这个问题,这三个都要用到,所以局里面呢,它就偏向性格加思维的一个方式。 而项目呢,就是一个具体的经验,这个项目的生存法则,子木的 school 呢,就是往控制具体的模块行为上最接近真实故事的一个规则。 当我们了解了这些,我们就来看看怎么具体的去装,包括三个来源方式,一种呢是 codex 的 sku 市场, 一个任务的流程规范,这里呢还是比较方便的,当我们需要使用的时候,我们在这里召唤出来,哎,它就可以了。如果你不是单装一个 skill, 而是一个插件,在这里呢也可以看得到。那另一种呢,就是别人已经写好的 skill, 你 们项目共同用的规范,或者是某社区里面别人分享的 skill。 那 如果别人分享的就是一个 skill 目录的话,我们 直接把它放到对应的位置,就可以发挥它的作用。那我再回来问,它是识别到了这个 skill 目录呢,是可以用的。还有呢,就是你发现它没有 skill 目录, 是有这样一行的安装命令,它就是让 skill 自动地去安装好,然后放到它对应的位置。那最后呢,就是你自己去创建一个 skill, 这个呢教程一大堆,有兴趣的呢可以去研究一下,这样呢也会更匹配我们自己的一个项目。初用 codex 呢,不会创建 skill 也是很正常的。 我们先在任务中 ai 多写作起来,观察自己反复说了什么,改几次,发现哪些步骤是最有用的,复盘几次,把稳定下来的步骤再写进 skill 里面。 所以说属于你的 skill 呢,它不是在教程里面抄来的,它来自你的任务,你的判断,你的偏好,你的工作节奏。我个人觉得 codice skills 它呢还是比较值得折腾的,也正是因为它把这条路呢讲得更具体了, 模型呢负责上线,而 skills 呢,负责把能力变成稳定流程。而以上呢,就是我今天的分享,觉得有帮助记得点赞收藏关注,下次见。

大家好,今天出一个实操指南, codex 如何接入国产大模型,让 to token 贫困户也能舒服写代码?先说一个最近的体感,不是你用的多了,是模型变贵了。同样的活儿,烧的 to token 越来越多, 平常用的是公司发的额度,上个月还能撑快一个月,这个月几天就见底,只能停下来省着用。 ai 反而成了限速器,自己掏钱买账号,贝壳的一周封了两个号,花钱也买不到稳定, 省着用,买不起保不住号,这就是 token 贫困户的日常。如果你也卡在这里,这篇是写给你的。我最近找到的出路是,换国产 deep c kv 四 pro mini max m 三 g l m 杠五点一。在代码场景下,我跑了一阵,结论是, 日常百分之八十的活儿,国产模型够用。同样一个功能,科奥的写得更精致一点,但 deepsea 也能交作业,但价格只有它的十分之一。既然差距不大,我没必要为了略好一点付十倍的钱。 codex 最近也比较火,但它默认只能接 open n i, 我 们想用国产模型, 怎么把它塞进去?这就是今天要解决的事。第一步,装 codex, 输入屏幕上地址,打开 codex 官网,点击下载安装包,等待下载完成。安装完成后,打开 codex 会提示登录等信息,这里不用管。第二步,装 cc switch, 先进入官网地址,如屏幕所示,点击免费下载,会跳转到 tiktok 上的安装包下载页, 找到对应安装包,点击下载下载完整安装它为什么要装这个?因为它能在 codex 里一键切换不同的模型 provider, 省得我们自己改 cf。 第三步,配置 deepseek api key, 打开 cc switch, 点击右上角橙色加号,选择 deepseek, 从 deepseek 获取 api key, 这里创建一个新的,并复制一下, 拷贝到 c c switch 相应位置。这里需要打开一下本地路由映设,并点击添加,在设置中增加路由配置,打开在主页显示本地路由开关,方便下次打开路由。打开路由总开关和 codex 开关,最后启用 deepsea 配置,这样就配置好了。最后打开一下 codex, 此时输入问题,大模型就是使用 deepseek 回答的,内容延伸推荐皆是接通了。但你可能也好奇,大模型思考的时候内部到底在算什么? deepseek 的 moe 架构是怎么把成本压下来的?想在自己电脑上本地环境跑一个 deepseek 需要做什么?这些问题不搞清楚永远是用 ai 的 人, 搞清楚一层才是懂 ai 的 人。最近在读张志正老师的图解,大模型底层逻辑,从神经网络讲到 dpc vl 多模态实战,还带欧乐曼本地部署的实操章节,挺适合后端朋友。补这一课不一定要自己去训模型, 但搞清楚大模型作为一个特殊的下游服务是怎么跑的,对接调用、定位问题都心里有数,后端朋友尤其值得一读。点个关注不迷路,我们下期见。

身边越来越多人开始用 ai 帮自己写东西、做小工具,甚至直接搭网站。但一说到 codex、 cloud code 这些工具,三个字用不了,网络不稳,账号复杂,收费还贵,门槛对普通人来说真的高。 今天这期,我给你把五款国产平替全测了一遍,从免不免费到中文好不好用,帮你找到最适合自己的那一个。 先说最重磅的一款,通用领马,阿里出的,最近刚改名叫 qdcn 插件,下载量已经超过一千五百万,累计帮用户生成了超过三十亿行代码,是目前国内用户最多的 ai 编程助手。 它最大特点是会自己干活,你说一句,帮我做个某某功能,它会自己分析,自己改文件,自己跑命令, 不用你一步步盯着。还有一个首创的自动记忆功能,它会慢慢记住你的习惯和偏好,用的越久越顺手。不过有个要注意的,二零二六年五月改名之后, 同步推出了点数制度,原来随便用的功能,现在有额度限制了,免费时代基本结束了,适合想要功能最全、任务交给 ai 自己跑的人。 tree 字节跳动出的这款,我觉得是新手最友好的,累计注册用户超过六百万,个人版完全免费,没有任何付费门槛。 它有一个 solo 模式,你只要描述需求,它会自动完成需求拆解、编码测试全流程,就像有个助手在后台帮你干活,你去泡杯咖啡回来代码就好了。中文指令理解准确率比 cursor 高出约百分之十八, 你完全用中文说需求,不用翻译成英文,沟通门槛极低,适合零基础入门,想快速做出东,不想花钱的人。第三款扣子,扣子还是自结出的, 但这款定位完全不一样,它不是给程序员用的,它是让普通人也能做出 ai 工具的平台。如果你是普通用户,可以用它查资料、发邮件、管理日程。如果你是职场人或自媒体创作者, 可以用它解决工作里的重复任务。如果你想做小程序或网页,也可以通过自然语言对话直接开发, 零门槛,不用写代码,不用装任何东西,打开网页就能用个人和小团队场景下,免费版完全跑得起来。还有一个很实用的技能商店,别人封装好的 ai 能力包, 比如爆款文案生成、投资人视角 ppt, 你 一键调用就行,不需要自己从头搭。二零二六年初升级到二点零之后,还加入了长期计划功能, 你给他一个目标,他会自己拆解任务,主动推进,定期汇报,更像一个靠谱的数字同事,适合自媒体创作者、职场人,想做自动化工作流,完全不懂代码的普通用户。 文心快马 comant, 百度出的有一个绝活,设计稿直接变代码。在高级功能上,文心快马的多智能体矩阵是亮点之一。 多个 ai 分 工合作,一个负责规划,一个负责写代码,一个负责检查,最后交出来的代码质量更稳。 在代码安全方面,文心快码能在编码阶段实时发现安全问题,实现漏洞自动修复,防止机密泄露。适合做前端页面开发,对代码质量和安全要求高的团队。 q g x 清华智普出的这款,有一个其他工具都没有的能力,完全开源,可以本地跑代码,不上传任何服务器,你的代码完全在自己电脑上处理 数据,不出本地预算为零,希望零成本尝试的个人开发者,这是首选,跨语言转换也很强, python 转 java, java 转 c 加加一键完成,适合需要迁移老代码的场景。唯一缺点是自动化任务能力弱, 复杂的多步骤任务做不了,更适合当一个聪明的补全工具来用,适合学生,注重隐私,内网环境开发预算为零的用户好。

你在用 codex 的 时候,是不是总觉得投币消耗的飞快?今天给大家分享一个好用的辅助解锁工具,它就是 enquire skill。 这款工具在开源社区热度很高,收获了近四千的 star, 专门适配 ai 智能体做实时信息解锁,包括普通网页搜索、细分行业定向查询以及多任务并行解锁、网页内容提炼等等等等。 它会自动筛选掉没有用的杂乱信息,只把精简有效的内容传给你的 ai 智能体,帮你减少解锁内容所占用的上下文问题,从而在一定程度上改善投屏消耗过快的情况。 它有两个很实用的点,第一,能优化文本占用,减轻使用成本,所有搜索到的网页内容都会先在后台过滤整理一遍再返回给你的 codex, 不会给你一堆无效信息去挤占你的对话空间。第二,它整合了超多行业资讯渠道,汇总了科技、金融、学术、法律、网络安全等等二十二个细分领域,数据员可以补充很多常规解锁不容易挖到的行业细分资料。 简单说下这个 scale 的 设计逻辑,把搜索工作和 a 进程的推理工作分开,只要智能体下发搜索需求,整套信息采集、精简整理都会交给这个 scale 去独立处理, 减轻你的 a 镜头的处理负担。同时一托于它的多渠道资讯,能拿到更多贴合你的细分需求的参考内容,解锁匹配度也会来的更好。

很多人用 ai 工具不是不会用,而是越用越贵。 我也没干啥呀,怎么账单又涨了?问题不一定是模型贵,是你没管投肯预算。很多人一上来就把整个项目长日制截图、需求文档全塞进去,看起来专业,实际是在烧钱。 先分任务,小任务别直接上最贵模型,先压上下文,先看目录关键文件报错片段,再逐步补材料,附用提示词。把角色规范输出格式做成模板,看用量。重点关注 input cache, input, output output ai。 废话越多你花的钱越多。 ai 工具不是不能多用,而是要按任务配模型,按价值花 token 需要稳定接入多模型, a p i 也可以看看 fast token。 收藏这套四步法,下一集讲不同任务怎么选模型。

刚装上 codex 的 朋友,千万不要瞎用,不做好这三步,你的 codex 只会越用越笨。今天给你一套零废话极简讯话法,看完就能上手,不仅不会让 codex 搞乱你的电脑,还能让他越来越懂你,变成真正的生产力。第一步,先给 ai 焊四条铁规矩, 这是最核心的一步,设置一次,永久生效。你打开正在用的 codex, 在 设置里找到自定义指令, 把下面两句话原封不动的粘进去,保存好,就再也不用动了。一、每次对话结束后,自动将本次你出现的错误,我的修改要求记录至 workspace 内的踩坑日记文件。二、每次接受新任务时,优先读去 workspace 内的规矩文档,踩坑日记,严格规避历史同类错误。 为什么要这么做?因为我们把规矩写在这里,就会防止他乱扫你的电脑。一是保护你的隐私,不要让他去扫到你的一些银行密码、账号密码等等,并且还会节省你的算力。 这样设置好之后,也不用你每次重复提醒。第二步,建一个 codex 专属工作文件夹,随便在电脑的哪个位置。我是在 d 盘里新建一个文件夹,就叫 workspace, 里面再建两个文档。第一个叫规矩文档,里边写你定的简单要求,我写的放在这里了,你们可以直接抄作业,也可以自行发挥。 第二个叫踩坑日记,空文档就行,不用你手动去写,在你使用 codex 的 过程中,你每反馈一次错误,它自己会记在里边儿。这两个文档建立好之后,结合第一步, 那么之后 codex 干活之前就会去看这个规矩文档和踩坑日记,他的思路会越来越清晰,而且他产出的成果文件都会放在你指定的地方,不会让你满电脑去找。最后再教你一个每周只能花一分钟的小动作,但是可以让他提升十倍的聪明度。每周花一分钟跟 codex 说一句踩坑日记里的错误, 提炼成十条核心规矩,更新到规矩文档里,然后清空旧日制。就这一句话,它会自己总结,复盘用的时间越久,它越贴合你的习惯,让它真正成为你的私人定制助手。千万别等用乱了再后悔。装上 codex, 先把这三步跑起来, 这才是把 ai 变成真正的能力的关键所在。如果觉得有用的话,别忘了点赞、收藏、转发哦!如果你们还有什么解决不了的问题,可以评论区告诉我。

苹果这次暴涨了啊,你们这帮想学 ai 的 连当韭菜的资格都没有了。之前我说过想装 cosplay 赶紧用苹果电脑,那个时候六千多,结果你们非要等,等到现在你们看一下,你们看看这个是不是 l 十三, 今天是多少钱?九千四百多这个事太讽刺了,一个月前跟我学 cosplay, 全部是六千多买的, gpt 会员是七十多拿下的,现在你才回过神来,学的电脑涨到九千多,初级会员涨到一百四,你还没开始学呢,就得比别人多花大几千, 发现规律没有?你越晚学,设备和工具只会越来越贵。越贵啊,你就越舍不得买,越舍不得买你就越不想学。所以啊,这就是一个死循环,你永远在等明天,我跟你说,你越往后越贵,学习的门槛也会越来越高。

codex 现在能帮你做跨境电商了?今天一条视频跟大家讲明白 codex 在 跨境电商里的应用。我们团队现在已经把这些日常重复的动作打发成了 skill 了,从分析竞品到生土,再到最后的深层视频。 第一个,蒸馏竞品 skill, 当你上传你产品的信息资料,它会自动去搜索你目标平台中排名靠前的竞品,从搜亚马逊竞品到深度拆解各个 a s i n, 最 后直接给你一套完整作图框架。第二个,一键作图 skill, 它会自动拆解竞品视觉逻辑,产出完整竞品视觉 dna 分 析报告。你只需要上传自家产品资料,它对标竞品的构图逻辑、 商业视觉审美,一张一张帮你产出适配平台的产品图。第三个,广告视频生成 skill, 不 用一堆素材,单传一张产品白底图就行,它不会上来直接乱生成,而是先跟你确认全部需求视频时长规格,再分析产品目标人群画面,整套流程调理清晰。 第四个,爆款智能拆解 skill, 也是我最常用的,随便丢一条同行爆款视频进去,它会逐帧深度解析整条内容,黄金三秒钩子设计整片蓄势框架,留住观众停留的核心逻辑转化镜头拆解,连带完整故事脚本画面提示词,成套分镜故事版一次性全部输出。六月二十 七号到二十八号,我在深圳会系统地讲如何把 ai 落地到企业应用里,如何用 ai 做图、做视频、做智能体、做自动化、做工作流等等等等,我们不见不散!

codex shell token 很多时候不是模型贵,而是上下文被污染了。它会看文件跑日制执行测试,终端输出都会进入下一轮上下文。很多人以为 had n 二十就安全,但如果日制只有一行,而且这一行有几 m b 二十行还是会把整段塞进去。 所以真正稳的做法不是按行截断,而是按字节截断。在项目根目录加一个 agents, 点 m d 写清楚。任何未知大小的日制搜索测试构建输出都先限制字结束。最简单的写法就是命令输出接 head c 四千, 这相当于给 codex 加一个上下文保险丝。先看前几 kb 有 用再继续分段读取。如果你经常用 ai 写代码,这个小规则能少烧很多 token, 也能让模型更专注。想继续看最新 ai 资讯工具技巧和真实工作流拆解,记得关注也顺手点个赞。

用 codex 的 朋友,你们最近是否越用越卡?不是 token 的 问题,也不是网速的问题,是 codex 这两天爆了一个重大的 bug, 他 可能正在偷偷的消耗你的电脑硬盘。你都知道固态硬盘的损耗是不可逆的,所以赶紧来自查一下吧。执行这句指令,我这里已经中招了。 这里的 logo 文件其实是一个本地的日制文件,问题不是在于他有多占空间,而是他把 twice 级别的日制持续高频的写入你的电脑硬盘。 踹死级别的网址就是你电脑上操作的每一个痕迹,它都会记下来,这已经是电脑程序里面非常详细的网址了,所以你的普通电脑根本扛不住。最严重的后果不是电脑变卡,而是 ssd 持续消耗。如果你的电脑一直不处理, 有些机器可能不到一年硬盘寿命就会被打爆。如果中招了,解决办法也来了,私信这句指令。这句指令也很简单,意思就是用 second light 的 触发器去拦截日期的 excel 操作,最后再做彩样确认,看这个日期文件是否还在持续增长。所以赶快去把这个 bug 堵住吧!还有尽快升级你的 cad 版本。

有没有人发现你的 codex 用着会越来越卡?打开软件不但反应慢,电脑的硬盘还在莫名疯狂读写。 很多人压根不知道这个问题了出在哪里,只会以为说字电脑可能配置不够,其实根源呢,是垂直级别的网址在高频写入本地的数据库,每一秒将近五十条,日日的反复读写,时间久了你的硬盘就废了。 不要盲目去申请你的电脑硬件,你可以找 a 帮你定位一下这个日历的文件来就能够确诊,直接让 codex 检测一下他日制二的一个 skilllet 的 一个读写状态。 确诊之后呢,你只需要告诉他关闭 codex switch 级别的日制了就可以了。学会工具的这个底层运营啊,才能够把 a 工作台用的超效了且高效。

如果你刚装上扣代码,那么你一定会面临两个问题,第一个问题是他经常会犯同样的错误,你需要反复的去调整他,像教小孩一样不断的去给他纠错,整个过程会非常的劳心费力。第二个问题是他经常会把新项目的文件散落在你电脑的各个角落, 导致后续管理起来会非常的困难。而且等到下一次你再让他去执行新任务的时候,他有的时候还要把整个电脑全部扫描一遍,才知道最核心的项目文件放在哪个位置。 其实上一期视频我也专门录过,教大家怎么样给 codex 做架构管理,让他越来越聪明,那么这个视频现在已经有五十万的播放了,那么今天我就来告诉大家这个架构管理到底该怎么去实操。首先在刚装上 codex 以后,你一定要在桌面上创建一个 workspace 的 文件夹,这个将会是 codex 的 一个核心的工作区, 并且在这个文件夹里面有三个核心的文档。那么第一个叫大局复,利于踩坑日记,这个文档是用来记录扣代码犯过的所有的错误,只要他在哪一个地方做的不让你满意,都需要记录在这个文档里面,或者还有一些他做的比较好,比较让你满意,值得去复用的地方,也需要记录下来。 这个时候有人就会说,那这个文档这么长,未必我们要把每一个字都写进去吗?并不是。那么接下来我们就要介绍第二个文档,也就是这个局工作台的文档,因为这个文档是在扣代码帮你执行一个新项目的时候,必须要先去看完的一个这个工作手册, 在这个文档里面我们就会告诉他,当他自己犯了错误或者取得一些比较满意的成果之后,都需要把所有的内容总结到局复,利于踩坑认知当中。 所以局工作台相当于是给到 codex 的 一个最高指令,也是它最核心的工作手册。同时在局工作台里面,我们会告诉他每一个这个文档的意义是什么,有什么作用,同时再去执行一个新的任务,一个新的计划的时候,都需要新建一个 project 加编号加项目名的这样的一个文件夹, 大家可以看这个就是最终的一个效果。我每一个新的项目,他都会去建一个单独的文件夹,并且把所有新项目相关的内容文档文件,包括代码全部放到对应的这个文件夹里面。这样做的好处是,首先他不会把文件散落到电脑的各个角落,管理起来我们会非常方便。 其次,通过编号加命名的方式,未来 codex 进入 workspace 以后,只要看一眼这些文件夹名称大致的一个目录,就能够知道之前做过哪些项目,以及这一次新的任务,我们需要重点关注哪些文件,相当于给他安装了一个 gps 定位。 那么在这三个文档创建好之后,扣代斯在后续执行新任务的时候,只需要看一眼大局工作台这一个文档,就知道后续的每一个命名的规范,以及他自己就会去总结自己的经验,然后去沉淀一些可以复利的内容,放到我们的这个全区复利于踩坑日程当中。 那么问题来了,这个时候就会有人会问,那我们怎么确保扣代斯在每次做新项目的时候一定会把这几个文档都看一遍呢?那会不会他直接略过了就没有看? 这个时候我们就要去讲到 codex 的 一个底层的记忆中,就是 ajax 点 md 五档,这个文档是你下载好 codex 以后,这个文档会直接存放在 codex 的 这个核心的项目文件夹底下, 它里面会记录关于你的使用的习惯,你的沟通的风格偏好,以及你给到它最重要的一些要求,都会去放到这个 ajax 点 md 的 文档里面。 所以在创建好前面的三个文档之后,最最关键的一步就是你需要在 agent 点 m d 文档里面去加一条规则, 就是让他以后执行大大小小的项目,无论是大是小,全部都要先去查看全局工作台,然后再去执行,并且有任何踩过坑的能够去复利的内容,全部都要总结到对应的日程当中, 以及看完这三个核心的文档再去开始新的工作。那么大家是不是感觉这个事情做起来还稍微有一点复杂对吧?这么多的文档难道是要我们一个字一个字去扣吗?自己去手动的去写吗?并不是,像这么多的文档文件夹的创建全部都是我交给扣代词来做的。 那么怎么让 codex 帮你去搭建这么多的文档和这么多的文件夹呢?你只需要给他一条指令就够了,你只需要告诉他帮我在 workspace 里面创建一个局工作台的文档,用于规范 codex 的 行为规则,再 帮我创建一个局域复利于踩坑日制的文档,用于记录犯过的错误,踩过的坑,走过的弯路,以及未来可以持续复用的方法。最后再帮我创建一个新项目。 sop 的 文档 要求每执行一个项目,必须要创建一个 project 加编号加项目名称的文件夹,而且所有相关的内容全部需要存放到对应的文件夹当中,不能放到电脑的其他位置。 同时把以上的命名规范,各个文档的使用规则,包括文档的目录结构,全部要汇总到全区工作台里面。在做完以上所有的事情之后,一定要在你的 agent 点 m d 文档的这个记忆中,书里面写入一个最高优先级的指令, 在未来执行任何新项目之前,必须先查看大局工作台,大局复利于踩坑日制以及新项目创建的 s o p 这三个文档,确认阅读完成以后,再执行新的任务。 ok, 到这里就全部结束了。你把这段话发给 codex 以后,它会自动帮你把这些文档创建好,并且未来每次执行新项目的时候,都会按照这些规则去操作,自己去复盘,自己去总结,自己去优化, 基本不需要你额外的去管理,甚至你还能够在不断的让他去迭代,让他去升级,让自己变得越来越聪明。所以在 ai 时代,大家不要总是去问我该怎么去执行,而应该去问我该怎么让 ai 更好的去帮你操作,因为这才是 ai 时代最高级的一种思维方式。