粉丝262获赞1273

今天我们来讲讲大名鼎鼎的 codex, 相信大家都已经听说过这个软件了,这是 open nai 的 核心产品,对标 osarpic 的 cloud code。 codex 能做的事情非常多,它不仅能够帮你编辑代码、排查 bug、 执行测试,还能管理 gate、 操作浏览器,甚至能直接控制电脑完成各种任务,非常强大。不过功能越多,越容易让人抓不住重点,所以这期视频我会带大家系统性地过一遍。 codex 最核心的功能,帮大家建立起一套完整的使用思路。 整个视频一共分为三个部分,第一部分是基础篇,主要带大家快速上手 codex, 并讲解一些核心配置和使用过程中容易踩坑的地方。 第二部分是进阶篇,重点介绍版本控制、绘画管理,以及如何更高效的组织和推进开发任务。第三部分是扩展篇,我们会看看如何通过 plugin、 skill、 automation 和 mobile 等功能进一步扩展 codex 的 能力边界。 所有的功能点和对应的时间戳我都打到目录上了,大家可以按需跳转。好话不多说,我们现在开始。 首先我们要做的是把 codex 安装到电脑上面,我们可以打开这个页面,点击这里面的下载按钮,就可以下载 codex 了。下载好了之后,我们来打开它。安装过程呢,跟其他的普通软件一样,比如我用的是 micros, 那 直接把 codex 拖入到 applications 文件夹里面就可以完成安装了。 安装好了之后,我们来打开 codex。 打开 codex 之后呢,它首先会提示我们登录,它一共给了我们两个选项。 第一个呢是使用叉 gbt 账号登录,这需要你订阅叉 gbt 的 套餐。叉 gbt 呢,它提供了多种套餐,其中最常用的是我屏幕上面显示的这几个,主要是包括免费版 go 套餐、 plus 套餐和 pro 套餐。 你看屏幕上面的这几个套餐,从左到右价格越来越高,当然整体能用的 codax 额度也是越来越大的。 从目前来看,免费版和购套餐的 codax 额度应该差不多,但到了 plus 套餐,额度就会有着明显的上升, pro 套餐自然就更多了。 值得一提的是,即使你用的是免费版,系统也会给你一定的 codex 额度,只不过这个额度少的可怜,只能勉强够你施个水。所以如果你想真正上手体验一下它的能力,我建议你先订阅 plus 这个 plan, 它是二十美元一个月,可用量呢比较适中。 除了订阅套餐之外, openni 还提供了另外一个选项来使用 codex, 那 就是直接接入 api, 对 应的就是这里的 signing another way, 点击之后,它会提示你输入 openian 的 api key。 一 般来说,用 api 没有订阅套餐划算,而且呢,获取这个 api key 的 门槛也有点高,一般需要一张海外的信用卡,所以我建议大家还是订阅套餐来使用 codex。 具体的登录过程呢,我这里就不显示了,大家可以在这里选择适合自己的方式登录。登录好了之后,大家首先看到的就会是这样的一个界面, codex 首先会询问我们是干什么工作的,这里大家就按照实际情况来选就可以了。然后 codex 会提示把 cloud code 和 cloud co work 相关的配置都导到 codex 这里,我们先跳过,然后 codex 提示我们要不要试用 codex 手机版,我们点击这个 set up later, 待会儿呢,我会给大家演示这个功能,所以现在先不着急,现在呢,我们就算是正式的来到了 codex 操作界面,可以开始使用它了,我们来随便跟它打个招呼,看看能否正常使用, 可以看出 codex 已经可以正常使用了。下面我带大家做一个代办软件,并且在做这个代办软件的过程中为大家讲解 codex 的 各个功能点。首先我们要新建一个目录来存放我们的软件代码,让我们打开访答,在这里创建一个新的文件夹,就叫做马克笔记吧。 然后回到 codex 这里,点击 work in the project, 再点击 use an existing folder, 在弹出的对话框里面选择我们刚刚创建好的文件夹,然后再点击 open, 然后呢,你就会发现 codex 把项目目录改成马克笔记了, 这就代表 codex 后面会把代码放到这个文件夹里面。此时我们准备工作就已经是做完了,可以开始提需求了,比如说我们的需求就是使用 html 写一个笔记软件,软件界面分为左右两部分,左边是笔记列表,右边是笔记的内容, 最后我们提醒他注意做好测试,然后回车提交,这个时候呢, codex 就 会开始工作了,可以看出他在疯狂的给我们写代码,当然实际使用是没这么快的,因为为了节省大家时间,这里我做了加速,后面的问答流程呢,也都做了不同程度的加速处理,这个呢,大家知道就好了。 好, codex 暂停了,他提出他想要构建一个本地服务器来验证 html 笔记的效果。这里呢有三个选项,第一个选项是 yes, 这个呢很好理解,其实就是把这个本地服务器启动开就可以了,不过以后如果 codex 提出类似的请求,我们还得再授权一次。 第二个选项呢,是代表我们不仅同意,而且对于这种启动本地服务器的代码,以后呢也就直接执行就好了,不需要再经过我们授权了。第三个选项可以理解为不同意,它其实不是一个按钮,而是一个输入框, 我们点一下就能看出来了。在这里我们可以告诉 codex 自己希望的处理方式,比如只让它检查代码,不要启动本地服务器之类的。当然,如果你不同意,而且你懒得告诉 codex 原因的话,也可以直接点击这里面的 skip 按钮啊,这算是 codex 做了弱化的第四选项了。 好,所有的可选项我们都说完了,在这个地方我们就选择第一项 yes 就 好了。然后呢, codex 就 询问我们能不能访问这个新创建的本地服务器,这个地方呢,我们也同意, 呃,现在 codex 已经彻底完成它的工作了,可以看出这里面最重要的文件呢,就是这个 index html, 我 们可以点击来预览它的效果。 这个呢就是 codex 写的笔记软件了,看起来中规中矩,各种基本功能呢,在这里面都能找到。当然有些人可能觉得这个预览区太小了,想要放大一点,这当然是可以做到的,让我们来点击这个按钮, 这样左边的区域就被收起来了,可预览的空间就更大了,不过下面的这块区域看着也是有点碍事,能不能隐藏它呢?其实也是可以的,我们可以点击这里面的三个点, 然后选择其中的 hide composer 就 好了,你看这样呢就好多了。那假如说这个时候呢,你看着界面里面的这两条笔记,觉得非常碍事,你想把它们去掉, 呃,这个呢,其实也是很简单的,我们就继续追问就好了。既然要追问,我们就必须要把左侧栏再次显示出来,这个呢其实很简单,我们再点一下这个按钮,左侧栏就显示出来了。 然后呢,我们就可以在输入框里面输入我们的问题,把左上角的两条笔记去掉,这个呢肯定是可以的。 呃,不过我这里想给大家演示另外一个方法,另外一个更加准确,更加方便的方法,我们可以点击这个图标,它叫做 annotation, 然后我们就可以直接选中两条笔记这个区域,选中后,输入我们对这个区域的修改意见,很简单,我们的意见就是两个字,去掉, 然后我们提交请求。好,可以看出请求已经成功提交上去了,可以看到他一共是发了两块内容,一个呢是对应的截图,另外一个呢就是我们具体的要求了。 接到了这个请求之后, codex 就 开始工作了,他应该呢就会把这块区域给去掉,让我们稍微等待一下。 好, codex 已经完成了,我们再次打开这个阅览区,看一下效果, 可以看出之前的这块区域呢,确实是没有了, codex 已经帮我们解决问题了,看起来 entity 这个功能还是非常方便的, 那这个时候我们可以再随便点点这个笔记软件,看看有没有其他我们需要修复的问题。这里好像确实有个 bug, 我 点击这个加号按钮的时候,下面呢是要增加一个新的笔记的,但实际上点了之后并没有任何的 bug 呀。让我们跟 codex 说一下这个问题, 我们需要告诉 codex, 点击添加按钮之后,笔记列表区域没有任何的反应。呃,请排查下原因,我确定之后再进行修改 好。 codex 已经排查完了,按照我们的要求,他没有直接去改代码,而是先给出了诊断结果。他猜测呢,这个问题大概率是因为当前页面的 local storage, 也就是本地存储被禁用了。 没错,就是这个原因。说白了,就是 codex 的 右侧预览区有一些安全限制,导致某些功能无法正常使用。如果我们到独立的浏览器里面用一用,问题立马就消失了,不信我们试一试。 你看这个时候再点击添加按钮是不是就完全正常了?既然用户是在真实的浏览器里用我们的软件,而不是在 codex 的 预览区里用,那这根本就不算是个问题,自然也不需要修。 我不知道这算是 codex 的 一个 bug 还是一个 feature, 我 相信 openai 是 把它当成 feature 来做的,不过实际用下来确实有点像 bug。 如果你做的也是外部应用,那一定要额外留意这一点,别被预览区给骗了。既然弄清楚了原因,为了避免再受限制,我们后续就在独立的浏览器页面里面进行测试了。 到这里,这个最基本的笔记软件就算是成功跑通了。现在我想回头聊聊刚才遇到的一个细节,就是 codex 提出的那个请求。 呃,有些同学可能会想,如果我把任务交给 codex 之后去忙别的了,没注意到他在等我授权,那 codex 岂不会一直卡在那里等我回来一看啥也没干,白白浪费了大量时间。 那这有没有办法让他自己做决定,别总是来问我呢,毕竟谁也不想一直盯着他干活,那也太累了吧。没错,一直盯着看呢,确实是非常的麻烦。其实 codex 早就替我们想到了解决办法,就在输入框的下面,大家看这里面呢,一共是有三个全线选项。 第一种就是我们刚才用的 default permissions, 在 这种模式下,如果 codex 需要修改项目目录之外的文件,或者是需要执行一些带有安全风险的命令,它就会老老实实地弹出提醒,只有当你点头同意了,它才会继续接着往下干。 这种模式的优点呢是绝对安全,一切尽在掌握,但缺点也非常明显,就是根本离不开人,你得随时给他授权。 第二种呢是 auto review, 也就是自动审查。这个模式呢很聪明,它引入了一个专门负责安全审查的 agent, 当 codex 准备执行操作的时候,这个 agent 会首先替你把关,安全的直接放行,危险的直接拒绝,只有在极少数连 agent 也拿不定主意的情况下,才会弹窗让你来做决定。 第三种呢是 full access, 顾名思义,这个呢就是放飞自我模式,全部自动同意, codex 想干嘛就干嘛,完全不需要你插手。 这个模式确实是最省心的,但也伴随着风险,万一它误删了什么重要数据,你是拦也拦不住的。虽然 gpt 模型总体上还是非常靠谱的,基本上不太会乱来,但是作为一个负责任的 up 主,我还是要提醒大家,这个模式呢,没有任何的安全,交易开启前一定要三思啊。 所以综合看下来,在这三个模式里面, auto review 是 在效率和安全之间平衡的最好的。为了避免后面频繁弹窗,要我们点同意,接下来的演示呢,我们就统一的切换到 auto review 模式。 既然聊到了这里的权限配置,我们不妨顺便看一下输入框旁边还有哪一些配置。首先大家留意这里面显示的五点五 medium, 这代表我们当前使用的是 gbt 五点五模型,思考深度呢为 medium, 也就是中等。 我们点开它可以看到思考深度呢是可以自由调节的,分为 low、 medium high 和 extra high 四个级别。思考深度越高, codex 花费的时间也就越长,消耗的 token 呢也就越多,但通常给出来的代码质量也会更好一些。 除了调整思考深度,我们还可以在这里面切换模型下来。列表里面除了 gpt 五点五,还有 gpt 五点四等等一系列的模型,大家可以根据具体的任务难度来灵活选择。 最后啊,这里面还能设置模型的输出速度,目前是 standard, 也就是标准的速度。旁边呢还有一个 fast 选项,开启 fast 模式之后生成的速度呢会提升到原来的一点五倍,不过代价呢是 token 的 消耗量也会相应的增加,具体增加多少取决于你用的模型, 比如说在 gbt 五点五这个模型下开启 fast 模式的话, toc 的 消耗量就直接是标准模式的两倍了啊。如果你财大气粗, toc 管用,那你完全可以开启这个快速模式,这样 codex 干活就更快了。 输入框的配置我们就先研究到这里,现在我们的第一版笔记软件已经跑通了,实现了最基本的功能,不过为了防止后面新加功能的时候把代码搞乱,我们最好先用 get 把当前的版本保存一下,这样的话就算是后面出了什么叉子,也能够随时回滚到这个可用版本。心里有个底, 在 codex 里面调用终端非常的方便,我们不需要去点什么菜单,直接按下快捷键, command 加 j, 大家看右侧的终端面板就直接弹出来了。在这里面我们依次输入几条常规的 get 命令, 首先是要执行 get in it, 点把当前的项目目录出示,化为一个 get 仓库。然后呢我们要执行的是 get id, 点把相关的文件呢都添加到暂存区里面。最后呢再执行 get commit 提交我们的第一次修改 好这三步敲完之后,我们的代码就有了一个安全的备份版本,接下来我们就可以放心大胆地继续迭代我们的产品了。 终端用完之后,为了不挡着视线,我们只需要再次按下同样的快捷键, command 加 j 就 能够把它直接关掉。你看用快捷键来开关终端,双手完全不需要离开键盘,整个过程呢非常的丝滑,也是非常的方便。 那现在我们用 codex 做了一个基本可用的笔记软件,而且还用 get 提交了这个可用版本,下面呢,我们就来继续迭代这个笔记软件,让它变得更强大,更美观。 假设这个时候你看了看这个笔记软件,觉得它的色彩设计不是很好,这里面有很多的绿色元素,你不太喜欢绿色,你想试试蓝色怎么样?那这个时候该怎么处理呢?很简单,你就直接在这里面追问就好了,比如我们可以这么提要求, 不过我们先不发送这个请求了吧。啊?为什么呢?你仔细看看啊,我们上一个消息里面还让 codex 排查问题来着, 但说实话,这其实并不是一个问题,只是 codex 的 浏览区有些限制而已。如果我们继续追问的话,这个排查过程不仅会占用模型的上下文,而且可能还会对 codex 后续执行产生一些影响, 他没准会继续尝试修复这个问题,把原来没有问题的页面修出问题来。虽然这种情况发生的概率应该也不会很大,但是能规避的话就尽量规避吧,毕竟这个消息其实一点用也没有。 所以我们该怎么办呢?有一个办法,那就是直接修改上一个消息就可以了,你看这里面有一个编辑按钮,我们点一下就可以直接修改这个消息了,我们来试试 提交。你看原来的请求被替换成了我们的这个,这样的话,原来排查问题的那个消息呢,就消失了,既然消失了,它就不会再占用模型的上下文了,也不会对 codex 后续执行产生任何影响, 所以很多情况下,这个功能还是很实用的。不过要注意的是, codex 只支持编辑最后一条消息,至于更靠前的那消息,它实际上是不支持我们编辑的。 前面的那些消息呢,都是没有编辑按钮的,如果你要编辑更靠近的消息,可以考虑使用 fork 功能来间接实现这个功能。我们后面会讲到,暂时你不必过于关心好。 codex 已经完成任务了,我们来看看效果。 呃,还可以吧。下面呢,我们把这一部分的改动也加入到 get 里面。之前我们是用命令行来操作 get, 这种操作方式准确通用,不过其实 codex 也内置了一些 get 操作的功能来供我们使用。比如我们可以先点击这个图标, 这里面呢就有一个叫做 environments 的 区域,它呢就跟 get 的 使用密切相关。我们可以点击这里面的 changes 按钮,然后再在这个选择框里面选择 on stage 的 选项。这里显示的就是所有还没有提交到暂存区的代码了, 这基本上也就是 codex 刚才所做的改动。如果你觉得哪一行有问题,可以点击旁边的加号,输入你的要求。输入完要求之后,你可以点击这里面的 comment 按钮,让 codex 做出相应的改动。不过这里我们就不做任何修改了, codex 的 任务已经完成的很好了,所以我们取消这个注示, 直接使用 git commit 提交这次改动。那具体该怎么做呢?很简单,直接点击这里面的 commit 按钮,输入 commit 的 message 就 可以了。我们的 commit message 就是 将整体色调改为蓝色,然后呢,再点击 continue, 此时 codex 就 会提交当前所有没有提交的改动了。 好,执行成功了,我们来验证下。先按一下 command 加 j 来到终端,然后再执行 git log, 查询 git 的 commit 记录。 你看,我们的 commit 确实是生效了,确认好了之后,我们按 q 退出 get log, 然后呢,再按 command 加 j 来隐藏终端,到这里,这个需求就算是彻底完成了。那假设这个时候你感觉蓝色这个主题也不怎么好看了,越看越不顺眼,要不再换一个吧。 没问题,我们直接提交需求,将整体色调改为紫色。改完之后呢,再做一次 get commit。 对, 这次我们不自己操作 get 了,有点麻烦,直接让 codex 操作得了。提交之后, codex 就 开始干活了,我们稍微等待一下, 改好了,我们来看看最后的效果。不错,确实改成紫色了,不过怎么说呢,啊,你觉得还是不顺眼啊,你在想,算了,我要不还是改成一开始的那个绿色吧。那这当然是可以的, 照例啊,你可以直接在输入框里面输入,你的要求就是改回来的紫色。这个呢,肯定是行的,只不过这样的话,模型还得再跑一遍,有点浪费 token, 所以 我们就不用这个方法了。 其实我们原来就是绿色,所以用 get 把代码回滚到绿色的那个版本就可以了。只不过这种做法其实也是有点缺陷的, 代码确实是回滚了,但绘画内容还是停留在紫色这里。如果我们希望在当前这个绘画继续问的话, codex 可能会以为目前所用的色调是紫色,从而对后续的任务执行效果产生负面影响。 那我们能不能把绘画和代码同时回滚呢?我们就想回滚到改蓝色之前的那个版本,也就是这个版本,如果有回滚功能的话,那应该是在这个消息旁边有一些相对应的标识吧,我们找找。 哎,还真的有一个图标有点像,不过它不叫回滚,它叫做 fork。 fork 的 意思就是基于当前的这个绘画,再复制一个新的出来,这个新绘画就只到目前所选的这个消息为止,后面的消息全都不保留, 这个呢就非常符合我们的要求了,我们其实就希望绘画到当前的这个消息为止,那既然绘画变了,代码是不是也会自动回滚呢?没准也是可以的,我们来试试。 我们首先点击这个 fork 图标,这里弹出两个选项供我们选择,一个是 fork into local, 另外一个呢是 fork into new work tree。 这两个选项的最大区别在于新绘画的代码存放地址不同。 第一个选项会继续使用当前目录作为新绘画代码存放地址,第二个选项会创建一个新的目录来存放心绘画的代码。你可能现在听的还是有点懵啊,没关系,我来演示一下你就知道了。在演示之前,我们先把左侧栏打开,这样你就会看得更清楚一些。 好,左侧栏打开了,我们来重新点击一下这个 fork 图标,然后选择第一项 fork into local。 可以看出 codex 确实给我们创建了一个新的绘画,并且还在这里标识好了,这个绘画呢,就是从别的绘画那里复制出来的。下面我们来看看代码是否也会滚了, 这个很简单,我们不必看代码,我们直接看最终的效果就行了。让我们来看看页面的颜色有没有改变,可以看出页面的颜色仍然是紫色,所以呢,代码根本就没有回滚。没错,这呢就是 fork into local 这个选项的特点,它只会处理绘画内容,根本就不会对代码做任何修改。 不过还好,我们使用了 git, 我 们可以用 git 来回滚代码。我们先按快捷键 command j, 打开终端,然后执行命令 git log 确定我们想把代码回滚到哪个 commit 上,应该就是这个了。然后呢,我们复制这个 commit 的 哈希值, 最后执行这个命令。这样呢,就可以把代码回滚到绘画对应的那个版本了。让我们回到浏览器这里刷新一下页面, 没错,确实是一开始的绿色版本了,当然绿的也不是很明显啊,只有那么几个模块是绿的。我对这个色调的表述呢,稍微有点问题,但无论怎么样,肯定是回滚成功了,相信大家都能看得出来,这个呢就是 fork into local 了,我们配合着 git, 才能把绘画和代码都回滚到之前的那个状态。 那刚才还有一个选项叫做 fork into new work tree, 那 个选项是用来干什么的呢?我们不妨来试试。让我们回到之前的绘画里, 点击这个 fork 图标,然后再选择 fork into new work tree。 注意看, codex 依然给我们创建了一个新的绘画,而且跟 fork into local 很 像。这个新的绘画呢,也标识出来了,它就是从别的绘画里面复制过来的。 一切看起来似乎都跟那个 fork into local 差不多啊,那到底什么发生变化了呢?答案就是我们当前的这个绘画所对应的项目目录发生了变化,不信我们来打开终端,输入 pwd, 这个命令就是用来显示当前位置的,可以看出我们的当前位置呢,就是这个了,我一开始 fork 出来的那个绘画可不是在这个目录里面操作的,不信的话,我们回到一开始 fork 出来的那个绘画里,同样打开终端, 运行下 pwd, 你 看它俩的项目目录地址是不同的,我把这两个地址打在屏幕上,这样大家就可以看得更清楚一些。 这个呢,就是 fork into new worktree 的 一个特性,它会给 fork 出来的新绘画创建一个对应的新目录,这样新老绘画所处理的代码不是一份,彼此之间互不影响,非常适合在两个绘画分别处理两个不同的功能点,最后做完了再合并到一起就好了。那为什么叫做 worktree 呢? 是因为它是使用 gitworktree 来实现的,这个呢,是 git 的 一个特性。这个要展开讲的话呢,又得讲好几分钟。我们本期是来讲 codex 的, 不是来讲 git 的, 所以呢, gitworktree 在 此就跳过了,感兴趣的同学可以自己查下。 另外值得一提的是, fork into new worktree 同样不会回滚代码,它只是把当前项目目录里面的所有代码复制到一个新的目录里,仅此而已。 好,这个就是 fork 的 两种形式了。总结一下,这两个选项都会复制绘画到所选消息为止,也都不会帮你回滚代码, 它们唯一的区别仅仅是代码的位置, local 呢,是继续沿用原目录,而 new work tree 呢,则是开辟了一个全新的隔离目录。主要呢,就是这个区别了。所以呢,无论是哪一种 fork 形式,都不会更改代码。实际上 codex 在 界面里面也有显示, 我们可以回到一开始的那个绘画。然后呢,再点击一下这里面的 fork 图标。注意到这段话了吗? 其实它想表达的意思就是 fork 只负责对话,不回归代码。对,它说的有点绕,但其实就是这个意思。 好, fork 功能我们终于讲完了,我们目前只需要第一个 fork into local 的 这个绘画,另外一个 fork into work tree 我 们暂时不需要。那我们能把这个绘画删掉吗?能, 不过准确来说啊,我们可以把这个绘画规章,规章和删除稍微还是有些区别的,你可以把规章理解为暂时隐藏起来了,而删除呢,那就是删完就没了。我们来试一下, 我们直接点击绘画旁边的这个图标,然后再点击 confirm, 这个绘画就被规范了。你看这个绘画是不是没了。但跟删除不同的是,我们还可以找回这个绘画。 我们先按 command 加逗号,打开设置面板,再点击里面的 archives chats, 在 这里我们就可以看到所有被规章的绘画了。我们可以解除对应绘画的规章状态,也可以彻底删除对应的绘画。所以你看,删除和规章还是稍稍有些区别的。 那规章这个功能我们就讲到这里,从之前的操作过程中我们可以看出, get 真的 还是挺重要的。那既然这么重要,我们能不能让 codex 每次写完代码的时候都能自动提交一次 get commit 呢,这样的话就不用麻烦我们每次都操作一遍了。 这当然是可以的,其中一个方法就是我们可以直接在输入框里面告诉 codex, 每次完成代码修改之后,都需要提交一次 get commit, 然后提交这个请求就行了。这样在后续的操作里面, codex 肯定就会按照我们所说的,每写完一次代码都提交一次 get commit。 不 过这个方法有个很大的缺陷,那就是它只会在当前的绘画中生效,如果我们创建出一个新绘画的话,那 codex 就 会彻底忘掉这个事情, 所以我们需要一个能够跨绘画的解决方案,即使是在一个新绘画里, codex 也能帮我们做 get commit 这个事情,这能做到吗?当然是可以的,这个呢就是 agent 点 m d 这个文件发挥作用的地方了。 agent 点 m d 简单来说呢,就是一个放在项目根目录里面的配置文件,每当 codex 开始一个新绘画的时候,它都会自动读取这个文件,把里面内容当成对自己的指令来执行, 所以我们只需要在这个文件里面写上这个 git commit 的 要求,那无论我们开多少个新会话, codex 都会记住这件事情的。我们先把原来的这个请求删掉,我们不需要它了,然后我们点击这里使用 vs code 打开这个项目目录, 在根目录下创建一个新的文件,就叫做 agent 后台,然后在这个文件里面写,每次完成代码修改后,都需要提交一次 git commit, 这样 agent dmd 就 创建好了,让我们把 vs code 关掉,现在让我们来验证一下 agent dmd 是 否真的会生效。我们首先创建一个新的绘画, 然后提交需求,往左下角增加一个主题切换选项,支持用户在浅色模式和深色模式之间切换。回车提交,让 codex 开始工作。 好, codex 已经完成了,我们来看看效果。 你看,左下角确实是出现了一个主题切换按钮,我们点击对应的主题,就可以在浅色和深色两种模式之间切换,看起来非常完美。那我们现在最关心的是, codex 有 没有帮我们做 get commit 操作呢?我们按一下 command 加 g, 打开终端执行 get log 来看看。 你看,这里面确实是多了一个新的 commit message 呢,就是 codex 自己写的,这说明 agent 点 m d 确实生效了。即使是在一个全新的绘画里面, codex 也遵从了我们的要求,在完成了代码修改之后,自动提交了一次 git commit。 这个呢就是 agent d m d 的 基本用法了,当然他能做的事情远不止这一件,比如你可以在里面规定代码风格、命名规范、技术占要求,甚至是你的项目背景介绍等等。 codex 每次启动新会话的时候都会去读取这些文件,这样他对你的项目就会有非常好的理解,给出的结果呢也会更加准确。 可以说, agents dmd 写得越好, codex 就 会用起来越顺手。不过需要注意的是, codex 只会提交当前需求所对应的代码改动。我们一开始创建的 agents dmd 不 属于当前需求的范畴,所以呢,刚才 codex 并没有把它提交为一个 git commit, 我 们点击这个 changes, 再选择 on stage, 就 可以发现 agents d m d 的 内容呢?还没有提交上去。没事儿,我们这就提交。我们先来点一下这个 commit 按钮,然后在里面输入对应的 commit message, 再点击 continue, 这样这个改动就会被提交到 get 上面了。好,一切顺利,让我们新开一个绘画,继续迭代这个笔记软件。 现在这个软件本质上就是一个 html 文件,只能在浏览器里打开,不够方便。我们想把它改造成一个真正的桌面客户端,让用户可以直接双击图标打开,就像打开 vs code codex 一 样。 那要做桌面客户端的话, electron 是 非常主流的一个选择,我们可以顺便呢也引入 react 和 type script, 把项目结构整理一下,方便后续继续迭代。那我们就直接把需求发给 codex, 把这个网页应用改成桌面客户端,进入站使用 electron 加上 react, 再加上 type script。 注意做好测试,确保所有的核心功能运转正常 啊。不过要注意这可是一个大工程,所以呢,我们最好先让 codex 做一个规划,我们确认规划没有问题之后,再让它动工。为了实现这一点,我们可以点击这里面的加号,然后选择 plan mode, 这样 codex 就 进入了计划模式,从这个图标也可以看出这一点。 在这个模式下, codex 会先做计划,再写代码,让我们来提交试试。可以看出 codex 开始工作了,让我们稍微等待一会。 好,他现在要问我们几个问题,我们来做一下选择。首先是数据要放在哪里,我们就放到文件里面吧, 然后交付到可开发运行的程度就可以了。这之后呢, codex 就 会继续开始干活了。好,可以看出 codex 开始给我们写这个计划了, 我们再稍微等待一会,它还在这个转写的过程中。 好,写完了,我们来看一下,这个计划本身还是比较完善的。呃,包括各种测试方案呐,架构设计啊,都是写的比较详细的。然后 codex 问我们是不是要按照这个计划去实现代码。 呃,他一共是给了我们两个选项,第一个选项呢就是直接同意啊,开始实现这个计划就好了。第二个选项呢是如果你对这个计划不满意的话,你可以提出你的要求,在这个文本框里面告诉 codex 应该如何做修改,然后 codex 会根据这个修改呢,再出一份新的计划。 呃,这里面呢,我们就不对计划再做一些其他修改了,我们就直接同意好了,让 codex 就 按照这个计划给我们来写代码。 好,现在 codex 开始干活了,我们需要稍微等待一下,在等待的过程中呢,我们可以跟 codex 随便去聊点东西,我们可以在输入框 side 打开 side chat 啊,在这里面呢,我们就可以随便问 codex 点别的问题,这些问题呢不会去影响左侧 codex 的 任务执行。比如说我们可以问一下,你觉得这个笔记软件还需要什么基本功能呢?提交 好 codex 呢,给了我们一些可行的方案。你看在 side chat 的 过程中, codex 左侧的任务执行一点也没有被干扰到。对,这个呢就是 side chat 的 一个非常重要的特点了,它就是允许用户在 codex 执行任务的过程中问一些比较轻量级的问题, codex 在 回答这些轻量级问题的过程中不会影响到左侧主任务的执行。那这个就是 sign chat 这个功能的特性了。这个呢,我们就先讲到这里,这个架构改造的工作量还是挺大的, codex 依然没有完成,让我们再耐心等待一会儿。 好,看起来 codex 已经完成任务了,它提示我们使用 npm runtime 这个命令就可以启动这个 electron 应用啊,让我们来试一下。首先按 command 加 j 打开终端,然后执行命令 npm runtime 回车, 这样的话这个 electron 应用就启动开了,不过看起来好像是有点问题,基本上是一个白屏的状态。呃,我们打开控制台看一下有没有什么报错 啊,确实有报错,这个呢,我们需要让 codex 帮我们来修一下啊,让我们来回到 codex 这里, 先把这个进程关掉,然后呢再把终端关掉,然后我们提出我们的诉求,启动后白屏控制台报错了。看来你之前的测试不够彻底啊,请你修复并确保在修复之后测试好再交付给我。 codex 说,我说的对,哼。呃,让我们等 codex 把这个错误修复之后再试一次。 呃,看起来 codex 已经修复好了,我们来看一下它修复后的效果是怎么样的。呃,同样,我们打开终端,然后执行这个命令 啊,这次呢,看起来没问题了,添加笔记呢也是可以的,我们呢也可以在这里面随便输入的标题内容都可以啊,主题切换也是没有问题的。 那看起来已经很完美了,各项功能都运转正常。让我们再回到 codex 这边。 呃,我们先按一下 ctrl 加 c, 关掉这个进程,然后呢,再把终端收起。好,那改成了 electron 架构,我们就继续来提新的需求。我们的新需求是为这个笔记应用增加 markdown 支持,具体来说,需要在编辑器右上角提供两个模式切换按钮。 那假设这个时候我想换行,怎么做呢?直接按回车肯定是不行的,按回车就提交了,正确的做法是按 shift 加回车。你看这样呢,就可以回车了。我们继续输入任务内容, 首先是编辑模式,显示所有文本内容,并对其中的 markdown 语法进行高亮显示。然后还有一个是预览模式,它用于显示 markdown 的 渲染结果。现在再回车。 好,可以看到 codex 开始工作了,在它工作的间隙,我们再创建一个新的绘画,让它再处理另外一个关系不大的任务。 我们的新任务就是给这个笔记项目生成一个 logo, svg 格式。可以看出这两个绘画都在工作中了。假设这个时候你突然想到了我们的笔记软件有深浅两种模式,这个 logo 需要在任意一个模式下都清晰可见。我们最好提醒一下 codex, 以免它忘了, 好让我们发送请求。不过这个请求似乎没有发出去,它似乎卡在这里了。没错,在默认情况下,只有当上一个请求完成后, codex 才会继续处理下一个请求。 不过到那个时候就有点晚了吧,毕竟 logo 都生成好了。我们能不能现在就把这个信息发送给 codex, 让它在生成 logo 前就注意到这一点呢? 没问题,注意到这里的 steer 按钮了吗?点一下,我们的请求就会立即发送给 codex, 这样我们的目标就达到了。那 codex 现在还在运行中,我们稍稍等待一会儿。 好,可以看出 logo 已经生成完毕了。我们切回到原来的那个绘画,看看它的进度怎么样了,它还在运行中,所以我们可能还需要再稍微等那么一会儿。 好,这两个任务呢都完成了,我们来直接打开软件,看看最终效果。首先是要打开终端,然后呢,我们运行 n p m start, 打开这个 electron 应用。呃,看起来好像是有点问题啊。 logo 没有被成功地加载起来, 那我们需要跟 codex 说一下这个事情,让我们先关掉这个 electron 应用。 然后呢,我们关掉这个 electron 进程,先看看这个 logo 在 不在 啊?这个 logo 确实是在 public 文件夹里面的,那应该不是文件不存在导致的。那是不是这个 svg 文件的格式有问题呢?我们来到访达来验证一下。 打开这个 public 文件夹,看来这个 svg 文件的格式也是没有问题的,毕竟访达都正常渲染出来了。 那大概率是 electron 加载这个 svg 文件的方法有问题。让我们来让 codex 修一下。首先按 command 加 g, 我 们唤起这个绘画列表,然后选择生成 logo 的 那个绘画, 然后在这里面我们输入具体的问题, logo 没有显示出来。提交好,提交之后呢, codex 就 开始给我们排查原因了,我们再稍微等一会儿。 修复完毕,我们再次启动这个软件看看效果。 首先打开终端,运行 npm start 好, 这次看起来 logo 是 成功的显示出来了,我们还可以随便点一点其他的功能,看看整体是否运转正常。 那 markdown 呢?我们可以随便输入几个 markdown 的 关键词,看一看它的高亮显示是否正常。看起来似乎并没有什么太大问题,各种格式呢,都可以非常正常地显示出来, 可以看出预览也是没有问题的。那这次需求就到这里了,我们再次回到 codex 这里,继续迭代它。 前面我们讲的呢,都是 codex 的 基本能力,下面我们来讲讲 plugging。 你 可以把 plugging 想象成一个 codex 的 外挂,它会给 codex 相应的能力,帮助 codex 去做更多的事情。这么说呢,可能比较抽象,我们可以来实战一下。呃,我们首先可以打开侧边栏, 然后点击里面的 plugins, 在 这里我们就能够看到所有可用的 plugin 了,其中有能控制电脑的,有用于操作 chromed, 还有用于编辑 excel 的 啊,还有一些是用来制作 ppt 的。 如果 plugin 的 旁边打了勾,那代表这个 plugin 已经被安装好了。如果 plugin 没有安装的话,旁边会是一个加号,我们点击这个加号就可以正常安装了。我们来随便点几个 plug in, 看看它内部到底有什么。 比如我们可以点一下这个叫做 gmail 的 plug in, 可以 看到这个 plug in 内部有三个组成部分,其中一个是 app, 两个是 skill。 这个 app 呢,是用来把 codex 和 gmail 连接起来的, 它里面提供了很多的工具,当然 codex 没有叫它是工具, codex 叫它是 action, 但其实本质上啊,这里面就是一个一个的工具,跟 mcp 的 工具呢差不多。 比如 apply labels to emails 就是 用来给邮件打标签的 archive emails 就是 用来归档邮件的。这个 app 一 共是提供了二十四个这样的工具,除了 app 之外,这个 plugin 还提供了两个 skill, 呃,你基本上是可以把 skill 当成是给大模型看的一个说明文档, 比如说是这个 gmail skill, 它就写明了怎么总结邮件内容,怎么赚,写回复,以及什么时候该调用哪一些工具啊等等。 而这个叫做 inbox treeash 的 skill 呢,则是告诉大模型如何给邮件归类的,比如说哪一些邮件比较紧急,哪一些邮件需要回复等等。如果你对 skill 比较感兴趣,可以看一下我的这个视频,把 skill 的 使用方法和运行原理一次讲明白。 gmail 的 这个 app 所包含的内容呢,就只有这三个了,我们如果选择安装 gmail 这个插件,那其实就是选择安装了这三个组件。等到用户想要 codex 操作 gmail 的 时候, gpt 模型便会找到这三个组件,并用它们提供的能力和说明来完成。用户的要求 大致就是这个样子的。我们来看一个具体的例子,比如说是 presentations, 这个 plugging 呢,是用来写 ppt 的, 它只有一个组件,那就是这个叫做 presentations 的 skill。 这个 skill 详细说明了该怎么做才能做出一个高质量的 ppt。 下面呢,我们就尝试用这个叫做 presentations 的 plugging 来完成我们的需求,让我们来新建一个绘画,然后输入我们的要求,给这个笔记软件做一个 ppt, 介绍它的产品设计和技术架构。 提交之后, codex 就 会找到我们前面所说的那个叫做 presentations 的 plug in, 并使用那个 plug in 提供的能力来做 ppt。 当然,如果你担心 codex 找不到这个 plug in, 或者说是找错了的话,你可以明确要求 codex 使用这个叫做 presentations 的 plug in, 这只需要在任务的最前面输入一个 at 符号,然后敲入 presentations 回车,这样 codex 就 一定会使用 presentations 这个 plug in 来做 ppt 了。 不过不加也没关系, codex 会自动找到这个 plug in 的, 所以呢,我们暂时就把它给去掉吧。好,提交,可以看出 codex 开始工作了,我们稍微等待一会儿, codex 写好了,我们打开看看。 中规中矩吧,其中其实还有不少可以改进的地方,不过这已经是一个不错的起点了,我们可以在这个基础上做一些其他的改进。 这个叫做 presentations 的 plug in 并不能算上经验。下面呢,我给大家介绍 open ai 所提供的两个用来镇店的 plug in, 一个呢是叫做 computer use, 用来控制电脑。另一个呢是叫做 chrome, 用来操作 chrome 浏览器啊,我们先来试一试 chrome 这个插件, 让我们来到这个插件管理的地方,然后呢,点击 chrome 旁边的这个加号来安装这个插件, 点击 install 好, 安装好了。然后呢, codex 提示我们需要在 chrome 上面也安装对应的扩展也行。好,那我们就按照它的指示来安装这个扩展。 那一切准备就绪之后,我们就来尝试用用这个 chrome 插件,我们可以直接点击旁边的这个按钮,这样的话, codex 就 可以给我们出实化一个使用当前插件的这么一个请求。呃,我们可以把后面的这个部分给去掉,换成我们具体的请求, 那就是打开 product hunt 首页,然后再找出今天最热门的三个新发布的产品,总结它们各自的特点,并附上对应的访问链接好提交。 呃,为了让大家看得更清楚,让我来把 codex 缩小一点,把 chrome 浏览器放出来,这样的话呢,大家就可以更清楚地看到 codex 到底是如何干活的了。 可以看到 codex 创建了一个标签组,这个标签组呢,专门用于解决我们的问题,然后它在这个标签组里面访问了 product hunt 的 首页,今天最热门的三个新发布的产品就在这里了,相信 codex 也看到了。 可以看到,现在 codex 开始打开另外一个标签页了,这个呢,看起来是第一个产品 brew 的 一个相关网站,然后呢,它又打开了一个。 呃,接下来呢,我们就不管了, codex 估计还会查看更多的网页,我们就在这里稍微等待一会,相信他等会就可以查询全部的产品页面,然后给我们一个比较有效的反馈,让我们稍微等待一下。 好, codex 给我们总结了,这个呢,基本上也就是我们想要的结果了,这个呢,就是 chrome 这个插件的相关使用方法了,让我们把这个 codex 再次最大化。 然后下面呢,我们就来看一看 computer use 这个插件的使用方法,它是用来操作电脑的,同样,我们点击这个加号,然后进行安装, 安装成功,让我们来使用一下。跟 chrome 的 使用方法类似,我们也可以点击 computer use 旁边的这个小图标,这样直接就能开启一个相关的 computer use 绘画。我们先把后面这段文本删掉,因为它跟我们真实的请求没有什么关系。 然后呢,我们再稍微改一下这个请求所对应的目录,我们现在呢是放在马克笔记这个地方,但实际上我们要打的这个请求呢,跟这个项目其实没什么太大关系,所以呢,我们就选择 don't work in the project, 也就是说,这就是我们随便提出来的一个请求,不会去绑定某个具体的项目目录。之后,我们就可以正式输入自己的请求了,那就是请打开我电脑自带的日历应用,帮我新建一个五月二十八日十点的日程标题,叫做讨论马克笔记的后续设计。 没错,就是这样,我们让 codex 操作一下日历这个应用,然后同之前一样,我们把 codex 缩小,把日历这个软件漏出来。这样呢,大家就可以更清楚地看到 codex 是 怎么操作我们这个日历软件的。 好, codex 首先询问我们能不能使用日历这个应用,我们同意, 可以看出 codex 开始行动了,这个呢就是 codex 的 鼠标,它跟我们所使用的鼠标呢,根本是两套,彼此之间互不影响啊。然后 codex 呢就开始操作这个鼠标,去完成我们的需求, 它还需要我们确认一下是不是真的要创建这个日程,这个有点啰嗦,那当然是确认了,我们给它回复一下, 好,看起来 codex 已经完成了我们的要求了,我们来看一下, 看起来这个日程的标题和时间段都是满足我们要求的,那就没问题了,我们再把 codex 最大化。 这个呢,基本上就是 computer use 这个插件的使用方法了。值得一提的是, codex 使用独立的虚拟鼠标,与你的鼠标互不干扰。刚才把日历软件提到前台只是为了掩饰,实际上你完全可以让它在后台默默干活,自己该干嘛干嘛,上网看视频都可以,完全不会耽误。 好, computer use 讲完了,我们接下来就来看看 skill 是 如何使用的。想要浏览 skill, 我 们就必须要先打开 plugins, 然后再点击这里面的 skills, 就 可以看到可用的 skill 列表了。 其实我们之前用 plugin 的 时候已经间接的用过 skill 了,因为无论是 presentations, computer use 还是 chrome, 这几个 plugin 的 核心组建呢,都是 skill, 你 在这个 skill 标签下面都能找到。 当我们安装对应的 plugging 的 时候呢,我们都会把相关的 skill 一 块儿安装好,所以我们在这里都能找到这些 skill。 不 过有一个王牌级的 skill 是 单独列在 skill 这个标签下面的,它并没有一个对应的 plugging。 这个 skill 呢,就是 mhgen, 它是用来生成图片的, 相信大家对 g p t 的 生图能力早有耳闻,不仅美观,而且非常的真实。下面呢,我们就来使用这个 skill 来创建一个图片。我们在马克笔记这个项目下新建一个绘画,然后输入我们的要求,给这个笔记软件生成一个宣传海报图片,注意要使用我给你的真实的软件截图。 然后呢,我们需要给 codex 相应的软件截图,我们先按 command 加 j 打开终端, 然后执行 npm start 命令来打开我们的笔记软件, 然后我们回到 codex 这里,点击加号,再找到其中的 attach electron 这个选项,这里面的 electron 其实就是我们的马克笔记软件了, 我们的这个笔记软件就是用 electron 做的,所以呢,在 codex 里面看来,这个笔记软件就叫做 electron, 我 们来直接点击这个选项,点击之后呢, codex 询问我们是否要启用这个功能,我们点击 enable, 然后我们的马克笔记截图就到了聊天框里面了,这样 codex 在 做海报的时候就可以根据真实的软件截图来做了,是不是很方便呢?点一下按钮就可以把截图放进来了, 不过这个还不是最方便的, codex 还提供了一个快捷键,按一下就能够把截图传过来。我来给大家演示一下,我们之前给 codex 的是浅色模式的截图,我现在在给 codex 传一张深色模式的,我们回到马克笔记这里,调到深色模式, 然后重点来了,左右 command 键同时按下,这样深色模式的马克笔记截图也传给 codex 了,这个确实更加方便了吧。好,现在 codex 有 了浅色和深色两种模式的截图,我们可以让它开始做海报了。提交, 首先我们可以注意到 codex 会使用 image 这个我们之前提到的技能来做这张宣传海报,然后我们就再等等,看它能画出什么样子来。 画完了,我觉得还行吧,确实是基于我们的截图来做的,不知道你觉得怎么样呢? 除了使用 codex 给我们安装的 skill 外,我们也可以创建自己的 skill。 让我们按 command 加 n 新建一个绘画,然后输入我们的任务,写一个代码审核 skill, 专门给当前的项目使用。这个 skill 应该包含如下的规则。好,我们提交 可以看到这个 skill 已经做好了,它的名字就叫做 marknotes code review。 下面让我们按一下 command 加 n 新建一个绘画,试试这个 skill 的 效果。首先我们 at 这个 skill, 然后提出我们的请求,检查当前项目的代码是否有问题。好,可以了, 结果出来了,还可以,我们还可以让 codex 根据审查的结果来修改代码。这里呢,我就不再继续演示了, 我们的笔记软件每天都在迭代,每天都有代码更新,所以我们最好能每天定时检查一下代码,看看有没有什么问题。这种场景就很适合起一个定时任务来处理。 codex 也提供了这样的功能,让我们来点击这里面的三个点, 再点击 add automation。 呃,也就是添加一个定时任务。这里呢是定时任务的标题, codex 已经帮我们填好了。这里呢,填写发起定时任务的时候,我们需要发给 codex 的 要求,我们的要求呢就是检查当前项目的代码是否有问题。 然后下面呢是执行环境,一共是有三个选项,分别是 local, worktree 和 chat。 local 呢是在某个项目目录里面运行这个定时任务 worktree 是 基于某个项目目录创建一个新的 worktree, 这个定时任务就在这个新的 worktree 里面运行。 worktree 的 概念我们之前讲过,它是 get 的 一个概念,如果你还是一知半解的话,可以先不管,我们这里不用这个选项。 chat 呢是执行环境,不跟任何项目目录绑定,我们之前用 chrome plugin 搜索网络的时候,实际上是用过 chat 环境的, 这里最适合我们的是 local, 毕竟我们的定时任务就是要扫描马克笔记的项目代码,所以一定是要跟某个项目目录绑定起来的。让我们选择 local, 然后在这里面选择马克笔记,然后这边呢是运行频率,我们选择 daily, 具体的时间呢,我们就维持在九点钟,意思就是我们这个定时任务在每天九点钟的时候启动, 下面呢我们选择模型 g b t 五点五,推理强度呢,我们就维持目前的 medium 就 好了。然后我们点击 save, 再打开左边栏, 我们就可以看到 automations, 这里面多了一个一。点击之后就可以发现我们创建的定时任务了,它会每天十点开始运行,每次运行的时候都会创建一个新的绘画,我们可以点击这个按钮试运行这个定时任务, 可以看到一个绘画创建出来了,就是用来运行这个定时任务的,我们来打开看一下, 好,可以看到这个定时任务已经完成了,后面每天跑的也都是这个样子了,那这个就是定时任务了。最后我想给大家讲讲 codex 的 一个特别有用的功能,那就是 codex mobile, 具体来说就是我们可以在手机上操纵 codex 来给我们完成任务,让我们来点击这里面的 codex mobile, 再点击 allow 允许手机操纵这台电脑, 然后再点击弹,点击完弹了之后, codex 应该会给你显示出一个二维码来。 呃,如果你像我这样没有显示出二维码的话,可以点击这里的手机图标,这样二维码就出来了。随后我们需要打开手机摄像头扫描这个二维码。然后呢,我们就会被引导到叉 g b t 的 codex 页面。在这里我们就能向电脑端的 codex 发送指令了, 比如我们想让它操作一下日历。你还记不记得我们之前在日历上创建了一个日程标题,就叫做讨论马克笔记的后续设计。现在我们在手机上再发送一个指令,让它把这个日程去掉,我们点击聊天。 然后呢,我们再点击这里,呃,在里面找出 computer use 这个选项。 随后呢,我们需要输入我们的请求,我们的请求就是把日历中五月二十八号呃,讨论马克笔记的日程删掉, 写完之后先不要忙着提交,你看,我们现在在马克笔记这个项目目录下,但我们的请求其实跟这个项目的代码没什么关系,我们就想操作一下日历软件,所以我们需要再点一下这个设置按钮,然后选择不使用项目。好,这样呢就万事俱备了。我们提交请求, codex 首先询问我们是否同意使用 calendar 这个软件,我们批准。然后 codex 再次询问我们是否要真的删除掉这个日程,我们确认, 随后 codex 就 开始操纵电脑了,我来给大家看看电脑上是个什么样子,你看日历上面多了一个鼠标,它正在操纵电脑删除这个日程。 好,删除成功了。这样呢,我们就做到了用手机来操纵电脑了,是不是很方便呢? 这样大家在外面也可以使用 codex 来做各种各样的事情了。好到这里本期视频就结束了,我是马克,用最通俗的语言讲最硬核的技术,我们下期再见。拜拜。

给大家推荐一个免费的 ai a 键的工具, open code, 它是开源的,如果你想接触 ai, 用上 ai 工具,这个连大模型都是免费的,而且还是 deepsea v 四 flash 版本,我深度用了一天,说实话百分之九十八的人都完全够用了。 我电脑上 cloud code code、 小 龙虾、爱马仕 agent 都装了,现在网上都在推 cloud code code code, 但模型不可能免费。 如果你不是程序员,相信我, open code 的 日常完全足够,各种 skill 都支持。我今天用它几分钟就开发了一个简单的供应链系统的 demo, 来测试一下它的效果。 ui 我 都没怎么调,效果已经非常不错。最重要的就是一分钱不花就能学会用 ai。 在这个入门门槛相对比较高的这种各种的 ai 工具的情况下来说,它太友好了,你只用花你的时间去研究下,如果你把 open code 研究好了,你再花钱去用 cloud code code 等等各种的 ai 工具, 在这个时代能节约一点是一点对不对?再说一遍,最主要的是免费,体验上完全足够,而且完全能满足你的日常使用。

三分钟上手开源 ai 编程神器 open code 厉害!哈喽大家好,我是姚路星,最近有个火爆全网的项目叫 open code, 为了照顾下新人,先简单介绍一下什么是 open code。 open code 是 get up 上面狂揽五十七 k star 的 一个开源 ai 编程神器,号称开源版的卡拉 code, 这是几乎所有主流的一个模型,更绝的是不用登录就能白嫖。免费模型地址如下, open code 不是 最近才出的项目,而让它真正起飞是欧麦 open code 的 插件,直接超进化成终极的一个 ai 编程助手。今天我就来手把手教大家如何三分钟上手这个超级项目。在开始安装之前,咱们先来聊一聊 open code 到底牛在哪里? 一,完全开圆,自由度拉满相比之下, kolog 虽然好用,但主打一个封闭。二、免费模型白嫖 open code 内置了四个免费模型,其中 glm 四点七、 mini max m 二点一、 kologfast。 一, 不用登录直接就可以白嫖。 三、双形态随心选 open code 提供了终端 t u i 和桌面端两种使用方式四,欧曼 open code 插件让 open code 开挂, 配合欧曼 open code 插件使用 open code 可以 获得异步、 sub agent、 关键词触发模式、深度思考、 lsp、 ast 集成、上下文自动管理等能力。好了,废话不多说,接下来手把手教你如何安装并使用 open code。 步骤一,选择你的战斗形态 open code 有 两种安装方式,根据自己的喜好选择方式 a, 桌面端对小白更友好,直接打开官网下载页面,选择你的电脑系统下载安装齐活。 方式 b, 终端 t u i 前提条件是你的电脑已经安装了 node s。 接下来打开终端,输入以下命令,一键安装。安装完之后进入你的项目目录,输入 open code, 看到那个赛博朋克风的 t u i 界面了吗?恭喜你, open code 已经就位了。 步骤二,装配欧曼 open code 的 外挂打开终端执行以下命令过程中你可能会遇到提示说缺少 board, 运行时不要慌, windows 用户和 mac linux 用户分别执行以下命令即可,然后再执行欧曼 open code 的 命令。 安装过程中会依次询问你 cloud 在 gpt 以及 java 的 一个订阅情况,如实回答就好,这样欧麦 open code 会根据你的订阅优化调用策略。 安装完之后,咱们再来看一下如何使用 open code, 基本的使用方式和 cloud code 没什么区别。再来看一下 open code 的 一个使用技巧。技巧一,切换 a 阵模式使用 tab 键就能在 build 模式和 plan 的 模式之间快速切换。 技巧二,关键词触发超能力前提是需要安装 openopencode 插件,配合 openopencode 插件,你可以使用这些魔法关键词完成意想不到的一个强力功能。 技巧三,模型自由搭配 open code 的 最大的优势就是模型自由,比如你可以用 germany 处理前端 ui 任务,用 gpt。 五,处理复杂的一个逻辑任务,用 cloud 处理长文档的一个分析,用免费的 glm 四点七日常开发。 总结一下,今天教给了大家三个事儿,一, open code 视察看原版的 cloud code 几乎支持所有主流模型,完全免费。二,如何安装使用桌面端傻瓜式安装, t o i 端通过命令行安装。 三,如何装配外挂通过 o my open code 插件获得 evaspaint 关键词触发、上下文管理等超能力, 最后的最后 open code 加上欧麦 open code, 绝对是目前开源界最能打的 ai 编程组合。纸上得来终觉浅,绝知此事要躬行,大家赶紧行动起来吧!加油!感谢大家三连谢谢大家,记得关注再走。

如果你想学智能体,先别急着背一堆工具名,你先记住一句话, go 不是 更长的提示词,它是一份完成器。约 普通人用 codex 是 一问一答。真正会用智能体的人是给他一个目标边界、检查点和验收标准,让他持续推进,直到交出能检查的结果。 今天就把这件事讲成小白能照着用的方法。很多人已经知道 codex、 cloud、 code、 open call、 hermes 这些名字,但一到真实工作,还是只会说,帮我优化一下,帮我写一下 智能体。听到这种话,就像员工只收到一句,老板情绪当然容易乱做。所以今天我们不讲排名,讲怎么把一句模糊需求变成智能体,能执行、能验证、能交付的 go。 go 的 意思很简单,给 codex 一个持久目标,让它围绕这个目标持续推进。 翻译成人话就是,你不是让他回答一个问题,而是让他完成一件事,比如修一个 bug, 迁移一段代码,跑一个实验,做一次有证据的审计。 goal 最怕的不是任务难,而是你没说清楚什么叫做完成。 goal 最重要的地方是完成状态必须可验证, 这里对小白特别重要。 go 不是 把提示词写长,而是把完成讲清楚。错误说法是帮我把项目优化一下,正确说法是让登录失败问题可以复现,定位修复并通过指定测试,最后要交付测试结果,改动招标和剩余风险。 这样 codex 才知道自己不是在表演努力,而是在教结果。如果用费曼学习法讲 go, 就 像你给员工派活, 你问老师只要问一句为什么,但你派员工不能只说,你看着办。你要说清楚五件事,目标是什么,边界在哪里,过程中什么时候汇报,用什么证据证明完成,最后交付什么, 这五件事合起来才是一个好构,少了任何一个智能体,都可能自己脑补。先看坏例子,帮我优化一下这个项目,越完整越好。这句话听起来客气,实际上很危险。它没有目标,没有边界,没有检查点,没有验收。 codex 可能真的很努力,改了很多文件,跑了很多命令,但你最后根本不知道它是不是解决了你的问题。 小白,用智能体像智障,很多时候不是模型差,是任务单差好, go 可以 直接写成五句话,第一,目标我要修复登录,提交失败,并让用户能正常进入首页。 第二,边界只改 login form 和 auth, client 不要动路由和环境配置。第三步骤,先赋现,再定位,再做最小修改,再跑测试。第四,验收指定测试通过,并给我测试命令。 第五,风险,如果发现不是前端问题,停止并汇报,不要自己改后端配置。你看,这就不是一句愿望了,这是任务合同。为什么我说 codex 特别适合痴勾? 因为它的定位就是运行在终端里的括顶智能体。终端意味着它能进项目,看文件,改文件、跑测试,读报错。 go 写清楚以后,它就不是随机聊天,而是在一个壁环里工作,读上下文,做修改、跑验证,看结果再决定下一步,你给他越清楚地完成标准,他越像一个可靠执行人。再往前一步, go 解决一次任务, skills 解决重复任务。 比如你经常让 codex 做代码审查,生成视频、抓资料、跑测试,那就不要每次重写一大段规则 skill 可以 放说明脚本、资源和文件。你可以把常用 go 变成 skill, 让智能体下次照着员工手册干真实智能体工程也再补同一件事,可靠运行。 你会反复看到智能体 turns, fallback, usage, limit, configuration 这些词什么意思?复杂?智能体最在意的不是一句提示词有多漂亮,而是回合可靠,配置清楚,失败能恢复。 go 也是这个方向。不要让智能体靠感觉跑,而是让它围绕可检查的状态用。按任务复杂度分三类,只是查概念、问用法,普通聊天就够了。修一个小 bug, 用短 go 限定文件、指定测试、交付、摘药、 做复杂改造,用 go 加检查点,每完成一步先汇报,不要一路自动改到底。重复出现的流程,比如代码审查、视频生成、资料抓取就做成 skill, 这样你就不会把所有问题都塞进同一种问法里。最后你就记住这五个词,目标、边界、检查、点、证据、交付。一个 go。 只要把这五件事写清楚, codex 就 不再像一个只会聊天的工具,而像一个能接任务的执行者。 会用 go 才算真正开始用智能体评论区发 go, 我 把这套可复制模板发出来,你可以直接拿去改自己的项目。

最近,推特向一个 ai 话题爆火, codex 的 核心开发者宣称,勾五指令或许是他们在 codex 中推出的最具深远意义的功能。在二零二六年五月一日, openai 旗下的终端编程代理 codex 发布了 v 零点一二八点零版本,并且引入了核心命令 go 命令、高危命令有着重大意义,他把 codex 从每次只能执行一条指令的工具,升级成了能够持续推进长期工程目标的自主智能体。借助这个命令,开发者只需设定一个宏观目标, codex 就 能跨越多次交互和中断,持续自主地朝着目标迭代前进,直至目标完成或者遇到阻碍。这堪称 ai 编程助手,像真正的自主软件工程师严禁的关键一步。在过去的传统模式里,开发者需要一步步下达指令, codex 则按照指令一步步执行。比如开发者说帮我写一个登录函数, codex 就 完成这一个任务。而现在,有了购物命令, 开发者可以为 codex 设定一个持久的长期目标。一旦目标设定, codex 就 会像一位不知疲倦的工程师,围绕这个目标持续开展工作,包括编辑代码、运行、测试、分析结果,并且在发现问题时自行修复, 全程无需开发者中途干预。对于开发者而言,有了 codex 的 助力,他们无需再死记硬背各种编程语言的特定语法,能够将更多精力放在逻辑设计和架构思维上,这极大地降低了非专业开发者开发功能的门槛。勾勒功能的核心优势体现在自主性和闭环能力上。 其一,自动拆解任务。当 codex 接收到宏观目标后,会自动把它分解成多个可执行的子步骤。其二,自主迭代。它会不断循环执行编码、运行、检查、修复的流程,直到判定目标已经达成。其三,任务管理,开发者可以随时对正在运行的目标进行暂停、 恢复或者清除等操作。有开发者给了 g p t 五点三 codex 一个空仓库以及完整访问权限,并布置了一个完整的射击游戏开发任务。 codex 在 不间断运行大约一个多小时后,自主生成了游戏所需的所有资源。 总之,勾勒命令的出现,让 codex 从每次一条指令的工具转变为持续推进长期工程目标的自主智能体。让开发者设定宏观目标后, codex 能跨越交互和中断持续迭代,这无疑是 ai 编程助手迈向真正自主软件工程师的重要一步。

大家好,我是大叔大 open code codex hermes agent。 这几个工具之前我都做过 windows 安装指南,说实话多多少少都有点门槛,反倒是 openclaw, 大家一直以为它没什么门槛,偏偏 windows 桌面安装一直没人管,这次总算补上了,对新手特别友好。 这期就带你看一遍 openclaw 在 windows 上的三种原生方案,桌面应用、命令行、 wsl 二网关,总有一款适合你。以前装 openclaw 有 多烦呢?先说 wsl 二,先装系统再起 systemmd 还要配网络,一圈下来头都大了, docker 也不省心,为了一个工具还得先学容器,纯命令行就更别提了, 没图形界面出个问题都不知道从哪查。不过现在好了,三种原生方案上线,不管你是习惯点鼠标的,还是喜欢敲命令的,或者离不开 linix 那 套环境,都能找到自己的路子。 首选方案, windows hub, 原生的 winui 桌面应用, win 满十二零 h 二以上和 win 十一都能跑,不用管理员权限。三个核心功能,系统托盘常驻后台,开机自己就启动,内置聊天加 command center, 对 话节点状态诊断都能在一个窗口里搞定, 网关也灵活,本地 wsl 远程 u r l s s h 领到,随一切安装就三步。先去下载页面拿安装包,选 openclaw companion, set up x 六四点 exe 或者 arm 六四版本,双击装好,首次启动选本地设置,它会自动建好 wsl 网关,配好对托盘一律齐活。不想要桌面应用, 那原声 c l i 适合你。 power shell 输一行命令, l i 和 gateway 全装好,在终端里跑 i w r young usb 加上 openclaw, 点 ai 斜杠 install, 点 p s e, 然后管道接 i x 回车。装完用 openclaw 杠杆 version 看看版本。 openclaw doctor 跑个诊断, openclaw gateway status, 杠杆 j 松,检查网关状态,想装成服务就运行 openclaw gateway。 install 会自动注册到计划任务, 临时用用就 open crawl getaway run 前台启动,不用了就关掉。如果你不想碰 wsl 和 docker, 这个方案比较利索,如果你离不开 linux 那 套环境, wsl 二 gave 方案就是给你准备的手动装,分四步,先在 power shell 里跑 wsl 两杠。 install 想指定发行版的话,加个杠 d 二四点零四, 然后进 wsl 配 c s n, d n 启动,写个斜杠 et cetera 斜杠, wsl 点康复文件,接着重启 wsl, 跑 wsl 两杠,刹 down, 再重新进去。最后在 wsl 里装 open claw curl 杠 fssl 接 open claw, 点 ai 斜杠。 install 点 sack, 管道接 bash 回车。如果你是 linux 老手,这个方案肯定合你胃口。 另外 windows hub 也能自动帮你搭好 wsl 网关,全程不用动手装好了,想玩点高级的 windows hub, 还能当节点或者 mcp 服务器用。开 note 模式的话, ai agent 可以 直接操作你的桌面截屏,调摄像,头发通知,语音合成识别 windows 的 能力全开放给 ai。 另一个模式是本地 mcp 服务器, 不经过网关,直接对 cloud, desktop, cursor 这些工具暴露系统能力。 no 模式下常用三类命令,画面类有 canvas 点 present, hide, navigate, evil, snapshot。 媒体类有 screen 点 snapshot record, camera 点 snap clip。 语音类有 s t t 点 transcribe t t s 点 speak 和 system 点 notify 两个模式可以自由组合,都关,就是 get 回节点,只开 m c p 就是 本地服务器,两个都开就是节点加服务器一起上, 反正你按虚选就行。最后说下自动启动和常见问题,如果你用 wsl 方案,想让 gateway 在 没人登录的时候也能跑,先在 wsl 里打开 linger, 跑 sudoggin e ctl enable linger 加 dollar 归号沃米,然后装 gateway, 再到 power show 里用管理员身份建个开机任务 tasks 斜杠 create 任务名,设 wsl boot 触发条件选开机启动,用当前用户身份几个。一、托盘图标没出来,看看任务管理器里有没有 opencloud 点 tree, 点 win u i 点 exc 没, 没有就从开始菜单起一下。二、本地设置失败,检查 wsl 起没起,用虚拟化开没开日制在 local app t 下的 opencloud tree 的 logs 指目录里,进而再进 set up。 三、需要配对审批, 在 gateway 上跑 opencloud devices list 查看设备,再用 opencloud devices approve 加设备 id 批准。四、截屏或摄像头用不了,看看 windows 权限设置,第一次用可能要手动允许。 多数问题出在 wsl 环境或网络,先跑 openclawdoctor 诊断,日制在设置页面也有入口。总结一下, windows hub 桌面应用,开箱即用,适合大多数用户, 原生 c l i 令终端玩家的菜 wsl 二、 gateway 兼容性更强, linux 用户会更习惯 openclaw 在 windows 上确实越来越实用了,三种方案从入门到进阶全覆盖,不用再折腾复杂的 linux 环境或者 dawk, 总有一种适合你。感谢观看,我是大叔大,后续会持续更新,下期见。

直接说一个无限免费用 codex cloud code、 open curl 的 隐藏方法, tokens 随便花,就是这个。直接接入 agnes 模型,没有额度限制,不用充值,不用买会员,完完全全是国内正规的方法,不只是能对话,升图、升视频开发网站,做 ppt 都行,而且设成效果不错。 比如我生成了这个哈基米打工视频,还有最近爆火的 codex 捉虫都可以搞,后面我会详细展示效果。目前 agnes 全模态总托肯掉用量已经达到三点一二万亿,其中文本模型大约一点九万亿,托肯调用图片和视频模型大约一点二万亿托肯调用这个 agnes 模型究竟是什么来头? 大家如果有关注全球模型评测榜单,就会发现这个模型跻身全球 top 十行列,但一直保持不限期免费开放。所以只要把这个模型的 a p i 接入到 codex cloud code、 open core 等工具中,以后就不用担心额度不用一直付费了。 我给大家演示一下如何接入这个模型,有所聚会的程度。拿 open core 接入 agnes 模型为例,打开电脑的终端,执行这个命令,选择 logo, 选择 model, 选择自定义服务商, 输入这个 url, 然后输入密钥。密钥在哪获取呢?在这里进入 agnes 官网的 a p i 平台,在 这里新建密钥即可,复制过来就行。接着输入模型 id, agnes 二点零 flash, 最后确认保存就行了。然后我们就可以在 open globe 里面使用它了,接入其他的软件也是类似的方法。 ok, 现在模型已经配置完毕,来测试一下它的效果。实际上难度首先是生成 ppt 的 准确度和设计水平,这个是我的要求。让他把我的运营数据和项目资料生成一份二零二六年中数值 ppt, 他 直接帮我把内容拆分成了几个整齐的模块,数据部分关键要点都有重点展示,而且发现没, ppt 的 设计也没有那种常见的廉价 ai 页面,层级、标题、重点、配图、排版都非常清楚。他的文本模型最长上下文是一百万 tocs。 接下来我们用图片模型 agnes image 二点一 flash 来生成封面图,测一下深图效果。这里我输出了多套风格提示词,我发现它在设计风格、画面质感和文字处理上比我预期要稳。不管是封面设计、产品设计、电商促销还是真人模特,它都能生成完整的视觉氛围,主体边缘、背景层次、观影过度都比较干净, 而且还是十四 k。 其实很多付费的深图模型,最容易翻车的就是文字的处理还是比较稳的。这就很好了,可以直接拿来做视频封面、营销图、互动海报, 视频的生成效果也不错。这是我生成的哈基密打工日记 vlog, 已经是完全可以拿来发到自媒体的程度。一般来说,市面上完全免费的视频模型效果都不太行,但 agnes video 二点零测完,我觉得拿它省钱完全没有问题。现在的 ai 视频软件会员是真的贵, 这个模型连爆火的哈基密捉宠也能完全搞出来。这是我开发的一个哈基密捉宠项目,可以定制自己的捉宠,教它走路、 伸懒腰、喝水,放在桌面上真的很治愈,大家可以自己搞一个。现在每个软件都要会员,每个平台都要额度,一个月下来几百上千,这谁遭得住?所以把 agnes 直接接入 codex, cloud code, opencloud 这类 agent 的 工具,很多基础的工作都可以搞定,又不花钱,这不香吗?

现在各家模型都官宣支持超长上下文,但实际用起来对话称到四五十万头啃模型,智力就开始下滑,注意力也会飘。 这个现象叫上下文腐烂,上下文越长, ai 越蠢。而且平时让 ai 做事,大多数人就是打开对话框,打一大段需求,然后等结果。需求模糊,没有计划,也没有审核环节, ai 理解了多少,全靠运气。 在大厂里,开发流程基本都上了 a d k agent development kit, 本质上就是一套 s d d 工具。 s d d speck driven development 规范驱动开发核心 就一句话,先写清楚要做什么,再让 ai 去做。那 open speck 就是 这么一个特别清亮的 s d d 套件。 在工作目录初识化一次之后,每次有需求,跟 ai 大 概聊一下怎么做,说一句 propose, ai 就 生成一整套计划文档, 要不要做,怎么做?需求场景、实现步骤全写在 spec 里,看一遍觉得没问题。再说一句, apply, ai 按计划逐步执行,做完了文档可以归档,沉淀成知识库。这里面有个特别好的点,写了 spec 文档以后,就可以安全地压缩上下文啦。 计划多在文档里, ai 不 会忘新的上下文也好,压缩过的也好,都能从 spec 接着干。 ai 智力始终保持在比较好的状态,不被历史对话拖垮。而且 open spec 没有用库克之类的强制注入,就是几份 skill 文件放在项目里, ai 自然去读, 清亮,灵活简单。最近发现了一个项目,叫 os 文档加 c l i 命令的方式,工作不挑环境, 理论上任何支持子 a 阵的 a 阵的软件都能用。第一个增强是 review, 正常用 opensback apply 执行完所有 task 就 直接归档了,加了 review 以后,会自动在最后一个 task 插入一个 review 步骤, 到这一步会起一个全新上下文的字。 agent 独立审查这次的产出,审查完输出问题,主 agent 拿到以后自己判断哪些要修,修完再来一轮 review, 循环往复,直到质量达标或者触发熔断。熔断就是为了防死,循环到上线就停下来交回给用户, 相当于给产出加了一道质量关卡。第二个是 go, 涨任务编排,有时候要做的事情比较大,一个 change 装不下 go, 会把一个大目标拆成多个 change, 交替式地跑。 propose 一个 apply 一个,再 propose 下一个 apply 下一个。每个词 agent 都是 fresh context, 主 agent 只负责调度上下文,保持干净。全部做完以后,最后一个 change 是 test change, 对 整个目标做验收,先做一轮独立语义评估,读目标文档和所有产物,判断达不达标,通过以后再写测试跑,测试没过就进 fix 循环,修完再测,同样有熔断兜底, 只需要在最开始参与,对其目标确定之后全自动跑完成或者熔断才回来。最后还有个小功能, propose 阶段会主动扫描项目里有哪些可用 skill, 根据需求推荐选完写进 spec 文档,这样之后压缩上下文去 apply, 之前选的 skill 要求都会被记住,压缩上下文也不怕丢。这个项目本身也可以改造 fork 仓库,用 agent 加自己的功能就行,每个增强都是独立模块。 总结一下, openspec 是 一个轻量好用的 sdd 套件, propose 起需求 apply 执行计划,帮管理上下文? os stronger 在 上面加了 review, 审查构长任务编排,还有 propose 阶段的 skill 推荐,不挑环境。理论上任何支持子 agent 的 agent 软件都能用。感兴趣的话去 get up 搜 os stronger 看看,拜拜。

大家好,今天我们来讲一下 codex c l i 里面一个新的功能, go 目标,它是你可以理解为给 codex 设置一个长期任务目标,然后让它围绕这个目标持续工作。 它有一点像之前 cloud code 里面的那个 rough loop 这么一个概念,它在你给定的目标情况下,它会去自己计划,然后编码,然后测试评估,直到完成你的目标,或者是它的 api token 耗尽。 需要怎么样起用它?有一个有,有两个条件,第一个就是你需要升级你的 codex 的 c l i 的 版本,要到 v 一 幺二八之后的一个版本。第二个,因为它目前还是个实验性的功能,所以需要你手动去激活这个功能。你可以选择直接在 codex 里面告诉它,就啊 enable ghost, 或者你自己去手动配置一下你的配置文件。在那个 codex 的 config 里面, 我们可以简单看一下,在这个里面是有,你可以直接在这儿加这么一行,在 features 下面加个 ghost 等于 true, 当然你不要,你可能需要重启一下它才能会真正的生效。它支持哪些功能呢?譬如说我们 go, 它会直接 go 告诉你当前的一个状态, 比如说我说重构当前代码,确保测试所有通过,然后它会有一个显示当前时间,用了多长时间以及 token 使用量。同时你也可以 pause, 你 可以 resume, 让它继续做,就又重新变成激活的状态了。 对,同样你也可以直接地把它清除掉,对,它就会变成 clear 的, 相当于它有这么一些命令的选择。对 go 它最佳使用的一些实践,我觉得也可以简单地讲一下,因为在我们之前的 ai 编程当中,经常会说,你帮我改一下某函数, ai 改完之后,你会说继续,然后它又再继续,最后你说跑测试,它才会。跑测试相当于 啊,一步一步,需要你的一个指导才能去做这个工作。但 go 的 思路不太一样,它不是告诉你下一步做什么,而是告诉它最终要达成什么。 譬如说刚才我们提到的重新写所有的测试,确保向后兼容。这样子说,你说整个把认证系统从 j w t 迁移到 off, 这也是一个比较大的工程,它要对上下位有很好的理解,那它可以进行,会需要运行时间比较长一点点。 那和普通的 prompt 最大的区别是什么?普通 prompt 像是一般都是一次性的输入,而 go 是 一个持久化的目标状态。 比如说,如果你只是在 prompt 里面输入帮我重构认证模块,那 codex 会在当前这一轮里面尽量去完成任任务,但是这一轮结束之后,这个任务就不一定还会作为持续目标被系统记住。但是如果你输入 go snapgo 重重构认证模块,保证保持现有 a p i 兼容并补齐测试,那么这个目标就会变成当前现成的一个状态。系统会知道现在有一个激活的一个一激活的目标, 然后它会记录这个目标是什么,以及是否是它的状态,是否完成,以及是否有预算的限制,消耗了多少资源等等。 它有一个状态的一个持续化的一个东西,所以它就不只是当前这一轮对话,而是有一个长期的目标持续行动。 对,怎么它是为什么能够实现这种感觉?它的背后的原理就是它会把系统,会把当前的目标绑定到当前的县城上,就这样就能够记录的目标内容状态是否完成。没有这一层的,那那么它就是一个普通命令。对, 另外一点需要说明的就是在使用的时候应该注意点什么。第一个就是目标要写得具体一点,不要只写优化项目,这个太宽放,更好的写法可能就是优化某某模块的什么测测试覆盖率啊,覆盖关键的一个路径,确保所有错误都通过, 就相当于这是比较具体。第二个要点就是要写清楚成功的标准。譬如说你要举个例子说,确保所有单元测试都通过,确保不改变现有的 a p i, 确保向后兼容,确保新增的测试覆盖核心场景。 所以 codex 就是 它的 codex 这个 go 的 这个更新,它就是让你从原先的你问一句,他答一句的这种编程助手,变成一个围绕一个目标持续工作的自我编程代理,所以它就有一个状态可以持续的循环, 所以还是挺不错的一个功能。现在在 twitter 或者是在海外的开发工程师当中,这个已经引起了很大的一个关注,有人甚至让它编程了五十多个小时一个功能,所以说。

今天起, openai 的 新 codex 能在你锁着屏的电脑里替你工作。奥特曼亲自官宣,这是一次最狠的神迹。 最近一段时间,硅谷有个很搞笑的现象,不管是明星 ceo 还是大厂程序员,走到哪里手上都举着一个半开半合的 macbook。 因为在今天之前,无论是 cloud code 还是 codex, 都无法在苹果电脑合盖后继续工作。今天, openai 彻底解决这一尴尬, codex 锁屏,远程在计算机使用里打开 locked use, 你 的 mac, 哪怕屏幕黑了,锁了, codex 都能从你手机上操作它继续干活。 openai 自己管,这叫 codex 的 黑魔法。第二个 appshots, 在 mac 上连按两下 command, codex 就 把你当前的窗口整个看穿, 不只是截图,连你还没滚动到藏在屏幕外的文本他全读走。第三个,自主编码,给他定一个目标,他就像不下班的劳模,自己干几个小时甚至几天,中途你随时能看进度、改方向,数据更说明问题。 codex 的 周活开发者已经破四百万, 两周前还是三百万,而现在,一半的用户用它干的事已经不是写代码了。从工具到同事,再到下一步,这条路上的加速度比我们想的快得多得多。关注新智源,秒追 a s i。

今天给大家带来 open call 的 配置教程,接下来我分别讲解指令板和桌面板,主要是 api 配置的详细过程,现在你所看到分别是指令板,另一个为桌面板。 界面风格不同,配置过程也有所不同。 open call 具有 clock call 的 同等功能,也就是开源版 cc 都具有相应的计划模式与构造模式切换的能力。 由于地域限制,所以我推荐大家都使用这个工具做开发,其模型支持量以及开源的特性是 c c 的 完美平 替。接下来我将分开讲解你获得了一个 api 后将如何使用。首先根据提示 c l t r 加 p 唤醒设置,向下滚动鼠标到选择模型,现在可以看到你常用的模型。 然后根据提示 clt 二加 a, 打开所有模型,选择一滚到底,找到默认模型选项, 在这里你就可以把所接入的完整轮廓填入并使用你的 key。 注意所填的格式以及不同中转站的接口会有所不同。接下来就是桌面版的配置教程,点击左下角模型,打开模型选择,或者点击设置按钮,打开设置界面, 点击供应商,然后选滑滚到最后选自定义供应商。 在这里填入你所使用的 api 接口 or 以及 key。 同样要注意每个中转站格式有所不同, 按照中转站提供的格式与 open 口的提示填写完整即可。接下来以我使用的中转为例做一个演示, 这个中转就是我常用的平台,在平台创建好自己的 key, 这里就不暴露自己的 key, 各位也要注意防止被盗用。浏览清楚每个中转站的接入格式以及调用方法是什么? 有的是文本模型调用,有的是图或视频模型的调用,一定要分清, 根据之前所获取的,按照要求填入。 这里的立一就是模型调用的一种格式,有的需要,有的不需要,这里还可以固定,你想使用那个模型, 填写完整后就可以调用。在 open 口上运行 opencode 本身也支持一些试用模型,但都是很小的上下文限制以及模型能力。如果各位有需要聚合平台推荐的可以私信哦!可以推荐我所评测过的满血资源以及一些免费资源, 谢谢观看,如果有帮助,记得一键三连。

最近看到 openai 的 博客,上面说的一句话, code is free, 代码免费了。这句话可能放在之前程序员听着会觉得非常的惊讶,但现在我们每天都在使用 cloud code, 每天都在使用 codex, 会发现它其实是非常现实的一件事。现在大家都有 agent 的 时代, 真正稀缺的已经不再是谁能把代码写出来,而是谁能把 agent 稳稳的,稳稳的把它落地,把事情给实现。 openai 把这件事叫 harness engineering, 可能现在又叫 loft engineering, 我 理解下来就是 给 agent 搭上一套外骨骼,你不能对 agent 说帮我写一个什么什么功能,我们要给他写一个完整的完整的规划,要给他项目结构足够多的上下文,任务边界测试标准,权限控制,还有一些 review 的 流程, 还要告诉他哪一些文件可以动,哪一些文件是绝对不可以处理的,失败了的话怎么回滚?以前这些东西看起来像工程细节,但是到了 a 阵时代,他们变成了我们开发者的核心能力,因为模型他已经足够会写代码了,已经他已经可以超过人类百分之九十五以上的 代码工程师。但是模型会写代码,不代表他能在你的项目里面正常的把它落地,就像一个新人,可能会写函数,会写累,但是不能代表他可以单独的负责一个完整的系统,这就是 human, human in the loop。 我 们工程师的角色已经发生变化了,不再是一个 执行写代码的角色,是一个在 a 准的工作流程中一个非常重要的角色。现在是我们在设计 这个流程,怎么能让 a 准的更高效,更准确的去工作,指 a 准怎么分工,然后后台的任务该怎么写,工具的权限怎么管理,这些才是能让 a 准的实际落地的一些细节,这可能是接下来一个非常大的趋势。

最近这两天,我一直在测试完全免费开源,可以本地部署的 ai 编程工具。这次我同时部署了两款目前非常好用的开源 ai 编程代理工具 open code 和 codex, 并且分别给它们接入聊免费开源的大模型接口。 open code 搭配的是 deepsea v 四 codex, 接入的是 agnes 二点零 flash。 两款都是本地部署,永久免费,无限次使用,不用联网付费,没有次数限制,不会泄露自己的项目文件,非常适合学生学习使用。 我这几天完整对比体验了一遍,它们两个能力测重点完全不一样,各有各的强项,我把真实体验全过程分享出来。首先先说 open code, open code 给我的最大感受就是人机交互非常顺滑,非常适合新手迭代项目 改错优化细节。它有一个特别好的特点,每次做完一部分功能,它会主动告诉你哪里有缺陷,哪里不稳定,哪里需要优化, 并且可以在原有代码基础上局部修改,局部迭代,不会每次全部重写,不会打乱我已经做好的结构。我这次用 open code 完整丛林开发了一个专属情侣记录网站,网站的初衷很简单,就是我和女朋友日常记录生活用,可以记录想去的地方, 想做的事,想吃的美食,发生的趣事,互相送的礼物,相当于我们两个人的专属云端日记本。但刚开始做的时候问题非常多,全是新手常见 bug, 本地数据无法上传,云端存储文字写入之后出现乱码,数据不同步, 自己写的内容只有自己能看见,无法双向同步。如果是普通网页, ai 复制粘贴代码, 我大概率直接放弃或者看不懂报错。但我全程在 open code 里一步一步和 deep c 对 话排错,一点点排查后端存储问题,编码格式问题、数据读写逻辑、本地存储同步逻辑,最后完整修复了云端存储 文字乱码、数据同步所有问题。把这个情侣网站彻底做稳定,可以长期正常使用。所以总结 open code 的 优势, 交互温柔,擅长改错,迭代优化,适合丛林做完整项目,慢慢打磨细节。接下来是 codex, codex 和 open 扣带完全是两种风格,它最大的特点就是执行力极强,落地速度极快,权限更高, 全区操控能力更强。如果说 open code 是 耐心陪你慢慢打磨项目的老师,那 codex 就是 你给一句需求,直接帮你全套做完的全能工程师。我专门为了对比测试,用 codex 做了两个完整小游戏项目, 一个是 c s 风格枪战游戏,一个是经典俄罗斯方块。我全程只说了一句简单需求,按照标准 c s 游戏模板,帮我做一个完整枪战游戏逻辑, 人物移动射击逻辑,碰撞判定完整页面结构,最终成品。直接点击 html 文件就能打开运行,不需要配置环境, 不需要复杂部署,整体完成度、完整性完全达标。除了做游戏,我还测试了它的办公文档能力。我用 codex 对 接本地 d o c x 文件,自定义报告模板,我提前设置好了指定字体、 指定字号、固定行间距、固定段落格式、固定封面格式,它全部可以精准识别,严格按照我的格式约束自动生成整篇报告。这一点比普通网页 ai 强太多了,普通 ai 你 需要复制、粘贴、调格式,改错重排, 非常浪费时间。而本地部署的 codex 可以 直接读取本地文件,修改本地文件,保存到本地,一步到位。 而且 codex 可以 开放完整电脑权限,能够直接操作我整个项目文件夹搭建前端搭建终端搭建后端配置文件,写代码、改代码,生成整套项目结构, 对编程小白极度友好。最后我总结一下我这几天真实完整的使用感受。以 open code 加 deepsix 和做创新项目,个人网站需要反复改错,迭代优化,精细打磨。 特点,交互好,会主动指出不足,支持局部修改,排错能力强,适合学习成长。 two codex plus ignis two point zero flash, 适合快速落地,做成品、做游戏、做报告、做模板,全套工程搭建特点,执行力强、效率高、权限高,全职操作,成品完整度极高。对于我们学生来说,这种本地开源免费 ai 真的 太重要了,不用充值, 不限次数,不用上传代码,不会泄露作业和项目,可以无限练手,无限学习,不管你是想学前端、做网站、做小游戏、写报告、做模板、自学编程、做课程设计,这两套免费 ai 工具完全足够学生所有使用场景。

啊准备准备。这就不是很对啊。这就不对啊。怎么能这样呢?他说我生辰,我让他给我写不行,我凭什么不能让他给我写? 那我都自己写,我都手搓。手搓跟我有什么关系,你还让他帮你写?我老玩家破房子。哈哈哈。老大破房子。当徐简在花四十多分钟手改的时候,我只需要让花一个段文字让他改就行。哈哈哈。 不行,我要发抖音怎么办怎么办?你太坏了,这种人我真破防了。破啥防,我改了四十分钟啊。四十五分钟。其实才改四十五分钟而已。你还能继续改,我真服了。我刚改好,我真准备打印去了,真的。

ai 代码越写越快, review 跟不上才是真问题。 ai 项目越写越快,真正难的是代码质量、上下文完整度和后续维护。很多团队现在用 ai 编程助手写代码,但 review 环节跟不上,容易出现逻辑漏洞和风格不一致。 这个项目六千四百多星,最近涨了一千八百多,说明这个方向开始被重视了。 open code review 要解决的不是 ai 能不能写代码的问题,而是写完之后谁来审,怎么审 它。把代码 review 的 流程标准化,让 ai 编程助手的产出能经过结构化检查,而不是直接合并。 它最重要的能力是提供一套可附用的 review 框架,能识别 ai 生成代码里的常见问题,上下文丢失,风格漂移,逻辑断层,适合已经有 c i 流程的团队,接近去基本不改现有节奏, 新手可以直接收藏观察,有编程基础的老手可以尝试接入它兼容常见的命令型工具和本地环境,不需要额外容器化配置,能适配现有的开发流程。 解决的真实问题是 ai 代码产出质量不可控,有 c i c d 流程的团队,代码质量敏感的项目值得优先关注。纯个人开发,代码量小的场景,可以先观察你们团队 ai 代码现在怎么 review?

那么 open code 最容易理解为三个层级。首先,我们有 agent 层,谁来执行工作,谁在驱动?你主要会使用 build mode 和 play mode。 build mode 是 执行工作的模式,而 play mode 是 安全思考的模式。如果你刚接触一个代码库, play mode 可以 防止 agent 横冲直撞,失去控制。第二层是路由层, agent 在 这个仓库中应该如何行为?这就是 agent md 的 作用,它告诉模型你的项目约定结构和注意事项,可以 把它想象成给新团队成员的入职笔记。如何运行?测试文件夹结构格式化规则哪些不能触碰? to request 和 commit 如何工作?如果没有这个,你每次 prompt 都要重复说明这些内容。第三层是 extensions 层,我们如何自动化可重复的工作? skills 是 agents 可以 加载的, 可附用 playbook, 而 commands 则像是你可以通过斜杠名称运行的快捷按钮。当你刚开始使用 open code 的 时,你不想在第一天就构建一个庞大的 skill school。 你 只需要先关注两到三个实际任务,然后将你发现会重复做的事情规范化成 skills。 最好是从一个完善的 agents md 开始,并学会有效使用 agents, 包括 build agent 和 plan agent, 这就是我们将要采用的设置。我们将使用 cursor 进行编辑,在 wsl 环境中运行 open code agents, 现在目标是 cursor 作为编辑器, wsl 作为运行时, open code 在 wsl 中运行,并编辑 cursor 中打开的相同文件。 这里最大的优势在于一致性。一份仓库副本,一套凭证,一个工具链。工作流将是这样的,我们将使用 wsl 文件系统集成,如在 curser 中打开仓库,在同一个仓库文件夹中打开 wsl 终端,然后从那里运行 open code。 一个好的经验法则是,如果你的 id 左下角显示 wsl, 那 么你的设置就正确了。让我们切换到文件系统,打开 curser, 我 来展示如何设置。我假设你已经安装了 wsl, 我们打开终端时,我们会点击顶部这个向下箭头。让我们切换到文件系统。打开 cursor, 我 来展示如何设置。我假设你已经安装了 wsl, 当我们打开终端时,我们会点击顶部这个向下箭头,只需点击它,然后切换到 wsl。 选择乌班兔, 现在我们就进入了 wsl 环境。接下来我们要为项目创建一个新文件夹,让我们看看当前位置。我们进入 coding projects 目录。现在在 coding projects 里面,我们创建一个新目录,命名为 open code demo, 然后我们进入这个目录,现在运行 cursor 命令。在这个目录中打开 cursor, 在 底部你可以看到它正在打开远程连接并进行设置。现在 cursor 已经在这个目录中打开了。在底部你可以看到它正在打开远程连接并进行设置。 现在设置完成了,不过里面还没有任何内容。接下来我们需要安装 open code。 其实顺序并不重要,比如在安装 open code 之前,我们不需要先打开目录,我只是这样设置而已。你可以在之前做这些,但在 open code ai 文档中,它给了我们这个命令来运行。我们现在运行 它。安装完成了,我们将在这个目录中运行 open code。 看起来可能需要重置终端,我复制这个命令,然后打开一个新的终端。你有两个选择,可以在单独窗口中运行终端界面,这是我喜欢的方式,或者在 ctrl 内部运行。我来展示为什么我喜欢用单独窗口。如果我们按 ctrl 加 b, 还会与 cursor 冲突,在 cursor 内部使用有点不方便。这就是为什么我用单独窗口仪。现在我们已经进入 opencode 的。 很好的是,它自动包含了免费模型,无需任何配置。 可以看到我们正在使用 opencode 的 zen 的 bigpaycode 模型。我们可以问任何问题。先说个 hello 来测试是否工作。即使是这样简单的 hello 也花了十六秒才回复。虽然 opencode 的 确实包含免费模型,但速度有点慢,他们不是最好的选择。当我们按 ctrl 加 p, 可以看到所有已内置的 open code 中的命令。它们按类别分组,建议的类别包括切换绘画,切换模型。这里也有一些免费模型,比如 mini max, kimi 和 g l m 五以及 bigpico。 我 们也可以连接流行的提供商。我有 chit gpp plus 套餐,我们选择它,然后用浏览器连接。我在这里登录授权成功,现在可以关闭这个页面。现在我们可以选择 gpt 负五点三 code x, 因为这是他们目前最先进的模型。但如果我们想切换模型,只需回到这里,选择想要使用的模型。我们在不同模式之间切换时会用到 tab 键, 可以看到按下 tab 键后,这里会在 build 和 plan 之间来回切换。想要高效使用 open code 或者 cloud code 这类 ai 辅助编程工具,关键在于同时用好 build 模式和 plan 模式。 我来给你详细讲解什么时候该用哪个模式。 build 模式就是执行工作模式, agent 拥有完整的工具权限,可以编辑文件,执行办事命令。 当你准备好进行代码修改时,使用它最适合添加功能重构、代码修复测试还有一个技巧是保持 prompt 具体明确, 比如执行 x 修改,运行外测试显示差异。而 plan 模式则是安全思考模式,这个模式有权限限制,可以防止意外修改。遇到任何风险操作,他都会询问,在执行任何可能有风险的命令之前,都会先征求你的同意。这个模式最适合设计代码、审查代码、制定调试策略, 总之就是制定可靠的计划。实际工作流程是这样的,始终从 plan 模式开始,确认你的方案,让它非常完善,确保万无一失。一旦方案成熟,就切换到 build 模式,然后开始实现,之后再切回 plan 模式进行审查。我们的下一步是在项目目录中 初步化 open code 的 运行这个命令时,它会做的事情是,就是这个 init 命令,它会生成一个 agents, md 文件,放在仓库跟目录。那这个 agent 是 什么呢?它是针对项目的自定义指令,会解释项目结构、编码规范, 该做的和不该做的。主要作用是帮助 open code 更快速、更安全地导航你的代码库,这就是它的核心价值。这是一个简单的 agent 模板,示意包含如何搭建项目的设置命令,还有一些代码风格指南。一个小技巧是提交你的 agent 文件, 这样整个团队都能获得一致的 agent 行为目标就是提供足够的结构,让 agent 表现得像一个读过 readme 的 团队成员。 现在我们来运行这个命令。我们点击 enix open code。 一个很棒的功能是按下斜杠键时可以看到所有当前可用的命令。他现在正在检查仓库,制定执行计划,然后开始执行。这次他甚至问了我一个问题,这是 正确的仓库路径吗?还是应该分析其他目录?让我看看确认一下。没错,就是这个。在 windows 上,如果想用语音输入,只需按 windows 加 h 键,它就会开始录音,这就是用语音进行 web coding 的 方法。快捷键就是 windows 加 h 啊,我明白了,所以你看到了确保处于正确模式的重要性,那就是开始编码时要处于正确的模式。现在处于 plan 模式,所以他一直在问我问题,让我做更多事情。 我们按 ctrl 加 p 创建一个新绘画。这次我们退出 plan 模式,然后运行 excel 命令。 a 阵词 md 文件已创建。我觉得最后这条信息非常重要,想特别值给你看。他说仓库当前是空的, 所以这些命令有意处于引导矩阵中,直到添加实际的项目脚本和配置。这又回到了核心观点, agents md 不是 一次性写完就完事的,它是一个动态的文件,会随着你的项目变化而更新,你可以看到它目前完成的所有工作。这里甚至有说明,如果以后出现 curser 或 copilot 的 规则该怎么办。 包含 build 和 lint 命令,涵概, java script, python 那 raash 等各种语言,非常完整。不过这些内容对你的项目来说不一定都重要。这是一份动态文档,需要随着项目变化而更新。如果想深入了解 agent m d 格式和它的用途, 可以访问 agents md 官网,查看更多补充信息和一些优秀的 agents md 势力,了解他们推荐的使用方法。添加这个文件包含关键内容,添加额外说明,甚至可以为子项目使用嵌套的 agents md 文件。到这里,我们已经准备好开始做一些很酷酷的项目了。 我们准备开始使用它。我会让它生成一个基础的 flask 应用,创建一个基础的 flask 网站,给我的水管公司用。这是我们的配色方案,我是从 colorant 扣上找到的。我很喜欢这个网站,因为它提供了专业设计师策划的配色方案,都是他们最喜欢的配色。你甚至可以看到每个配色获得了多少点赞。 是个很棒的资源,推荐你看看。应用已经创建完成,他给了我这些本地运行命令,我们来运行这些命令。打开看看,可以看到他很好地使用了我们的配色方案,看起来非常棒。 我还想给你看另一个功能。如果我们全屏显示,可以看到右侧 contacts 下方显示了使用的 token 数量,上下文窗口的占用情况以及花费的金额。我们可以在这里追踪所有这些信息,还可以追踪 l s p 状态,提取文件时会激活 l s p 是 什么呢?它是语言服务器协议, 基于开放这次 n r p c 标准,让代码编辑器能够与特定语言的智能工具通信。听起来很复杂,我来给你解释一下。我看到了这张图,觉得它解释得非常清楚。当开发工具与语言服务器交互时, 想象一下,你打开一个文档,这会向语言服务器发送通知。如果你编辑文档,也会发送通知给语言服务器。然后语言服务器会分析这些,更改 查找可能出现的问题,再把结果返回给你。 l s p。 的 核心价值在于让任何编辑器都能获得智能代码功能, 比如自动补全,跳转到定义查找,引用悬停文档代码,检查重命名和重构,无需编辑器。针对特定语言编辑逻辑。 l s p。 真正帮助 a 人的更好的编辑代码。现在我们来构建这个网站。你想想会有很多重复的 prompt, 比如添加新页面时会有特定的页面结构要求,我们希望页面按照特定方式组织。使用 open code 时,会有一些我们想要保存的 prompt, 这就引出了下一个话题, scales 和 commands。 你 可以把 scales 理解为可附用的剧本,它们不是直接运行的命令,而是知识模块。当 agent 遇到特定类型的任务时就会加载。比如,这是一个关于如何编辑迁移的 skill, 如何创建新的 endpoint, 如何创建新页面,如何在这个仓库中编辑。测试好处是保持一致性,不需要每次都重新解释团队标准,只需编码一次即可。随着你对 open code 越来越熟悉,随着项目不断发展,你会自然地积累 skills。 从第一天就开始投入大量精力创建各种 skill 是 没有意义的,但一旦你发现自己在重复相同的内容,这就是一个信号儿,提示你应该把它捕获为 skill。 skill 的 存放位置也有特定结构。如果是项目级别的 skill, 放在一个名为 opencode 的 文件夹里,然后在里面再创建一个文件夹,依次类推。如果是局 skill, 可以 放在 config 目录中,还可以为它添加权限设置发现机制。是这样的, opencode 会便利 get 工作区加载所有匹配的 skill。 局 skill 在 所有仓库中都可用。这里是一个势力,展示了必须的 front command 格式,需要 name 段和 description 段。然后从这里开始,你可以继续扩展。按照你喜欢的方式, command 非常类似,你可以把它们理解为工作流快捷方式。 command 更像是 你按下的按钮,而不是剧本。 command 是 你明确运行的东西,比如 slash test, slash review 或 slash shape。 可以在 opencode 的 终端用户界面中运行这些命令。 commands 非常适合需要重复执行的场景,减少打字量,降低 prompt 的 出错概率。同样, command 也有特定的存放位置,可以是项目级别或全局级别。这是一个 slash test 的 势力,你需要提供描述,使用哪个 agent 以及模型。然后你可以添加任何你喜欢的 prompt, 如运行完整的测试套件并生成覆盖率报告,专注于失败的测试并建议修改。你还可以使用美元符号添加参数和占位符,就像这里看到的 slash component button, 可以 创建一个名为 button 的 rack 组键,这就是参数的应用场景。如果有多个参数, 使用美元符号加数字一步描述,然后边写你的 prompt, 接着写上美元符号和参数编号。现在你需要创建一个 comfy, 这一省文件放在 so 字目录中,包含键值。对内容再次强调, commands 就是 可重复使用的 prompt 就 这么简单。 skills 是 我们做事的方式。 commands 是 prompt, skills 是 知识剧本。 skills 告诉我们如何做事。 commands 是 prompt, skills 是 知识剧本。 如果想深入了解这些主题,可以在 open code ai 文档中找到。比如这里详细说明了 skill 所需的 front matter 格式以及文件存放位置等信息。 command 部分也提供了更多详细内容,供你深入学习和使用。现在我们来尝试创建自己的 command 和 skill。 我 们继续来尝试创建自己的命令和技能。现在我已经准备好了一个技能,我们直接复制这个文件夹里面内置的技能,然后把它放到 open code 的 配置目录里,就放在这个位置,我也会展示 你们看它具体长什么样子。这个命令能帮助快速搭建新的 open code 的 技能或命令。使用方式很简单,就像这样写 scaffold 的 技能名称,或者 scaffold command 后面跟上名称。你正在搭建一个新的 open code 的 资源。类型是第一个参数,名称是第二个参数。如果这样看不太清楚,你可以运行恰好 后面跟 skill 和名称。名称就是你想取的任何名字。然后它会遵循这些指令来帮我们创建一个新的技能或者命令。 无论哪种类型,都能快速生成技能还是命令,我们还有全局技能和全局命令已经加载到全局配置里了,我们现在来试试看。 添加新命令之后,需要重启 open code, 按下 ctrl 加 c, 然后重新启动它。重新启动后,使用我们的命令运行 sky fold 来创建一个新的命令。我们把它叫做 website, 或者叫 web page 更合适。 这个命令的作用是在应用里快速创建一个新的网页。现在查看目录,它已经帮我们生成了一个 web page。 命令提示我们从一个提示开始创建网页具有精细的结构和样式。它甚至帮我们出示化了命令框架。 我们按下 control c 来退出这个界面,然后重新打开它。如果选择生成网页,它就会运行对应的提示来帮我们创建。还有一件事值得注意,如果查看目录结构,你会发现它已经帮我们搭建好了命令。退出当前界面,然后重新启动。 如果选择生成网页,它就会运行对应的提示来帮我们创建。还有一件事你可以看到我们现在用的是 gpt 负五点三 code x, 但如果想调整思考级别,可以按下 ctrl 加 t, 现在就能调整它的思考级别。不过我们暂时保持常规模式就好。它已经完成了一个网页 index html, 包含了所有需要的内容。现在查看上下文使用情况,你会发现已经达到一万七千个 token。 这还不算太糟,只用了百分之四。但当使用率变高时,我会给你展示一 个命令来处理这种情况。只需运行或 contact, 它就会压缩当前绘画。这个命令会总结毁画内容。现在使用率从百分之四降到了百分之二, to ctrl 也降到了九千。我们继续尝试另一个功能,搭建一个新的技能。我们给这个技能起名儿,说它是一个文案写作技能。 现在可以看到它已经帮我们初识化了一个文案写作技能。不过我想做的是,我个人非常推崇高聚焦语言。 所谓高聚焦语言,就是当你跟对方直接对话时,能够非常清晰的展示价值所在。每个人对高聚焦的定义可能不同。我这里有份说明文档,现在我来引用这些说明,可以看到他成功完成了任务,把这些说明加入了参考资料, 把文档添加到了文案写作技能中,所以我们可以直接删除这个临时文件。现在来修改这个页面上的文案,目前你看到的是它显示的是默认文案,我们来把它改成更具吸引力的版本。高聚焦语言能够直接传达核心价值,让读者立刻明白你能提供什么。 管道工程一次到位,从紧急漏水处理到全套设备安装,我们经验丰富的团队确保水流畅通,家居无忧。现在来使用我们的技能,运行 skis 命令时,你会发现,因为刚添加它还没加载, 只需按 ctrl c 重启 open code, 然后重新进入。现在切换绘画,其实就是这个绘画,然后运行 skills 命令,选择我们要运行的技能,告诉他调整首页文案,查看修改后的文案,他说已经更新了文案更具吸引力,符合高聚焦原则。他还给出了修改摘要,你可以看到清晰的用户价值,而且下一步操作也更加明确, 这应该能给你一个非常扎实的基础,继续完善你的项目。这个教程对你有帮助,这是对 open code 的 完整介绍。回顾一下,每次打开新代码库时,你都需要按照这个流程操作。首先把仓库放进一个环境,最好是用 wsl 环境,然后在那个环境里打开 open code, 接着连接你的模型提供商,用哪个都可以。然 后运行应 a h i i 生成 agent 和 md 文件。开发过程中,你会想到需要添加不同的命令,可能是为了大局项目,或者为了某个独立仓库。你还可以添加技能,记住它们的区别。命令就像是按钮,是可重复使用的提示词, 而技能更像是供 agent 遵循的操作手册。如果你想深入了解这些主题中的任何一个,这里有篇很棒的文章,讲的是编程如何发生变化。 文章会深入探讨这些概念,帮助你更好的理解整个工作流程。如果你想深入了解这些主题中的任何一个,这里有篇很棒的文章,讲的是编程 agent 的 实际工作原理,以及 open code 的 内部的运作方式。就连这个架构分解也非常详细,它 能让你深入了解所有组建是如何协助工作的。如果想查看这篇文章,你可以点击描述里的链接,加入我们的 school 社区,那里会有一篇帖子包含这个视频,我也会把那篇文章的链接贴出来。如果想查看的话,链接就在那里,这期视频就到这里,非常感谢你坚持看到最后。如果喜欢这个视频,请 点个赞,订阅频道,以获取更多类似内容。如果想看我的其他技术演示视频,可以点击这里查看我们下期视频。再见!希望你在编程之路上不断进步,善用这些工具提升效率,再见!感谢观看,祝你编码愉快!

open code 是 cloud code 的 开源低配平替版,因为 cloud code 本身来讲是支持 elastic, 自家的,人家全套闭源模型加这么一个闭源工具,那么 open code 就是 我全开。那么从个人开发者的角度, 即刻黑客的角度,我都可以从这 tab 上把这个 open code 的 代码下下来,按照我的需求进行改造。而且它完全的跑在本地,它适配全球的,我就随便可以配。但 小赵是主要用 cloud code 用的多, open code 呢,也曾尝试过,包括社区里面很多的反馈。现在你要硬说谁更强,那依然是 cloud code 更强。为什么?因为 cloud code 不 仅工程能力上,最关键的是它背后的模型能力也是要更强一些, 包括它在处理这种超长的上下文,比如说上下文达到了百万,那还是 cloud code 要更牛一些,因为你在 open code 里配的这个模型,比如说它上下文能力就远远不如 cloud code。 总之,对于技术特别狂热,我就是要追求最佳性能,不太差,钱儿多跑 token 无所谓,你就首选 cloud code。 然后呢,不是那种重度使用者,我只要有这么个东西能用,那对于大多数小伙伴来讲, open code 真的 够用了。

二十万行的史诗代码摆在你面前,第一步该从哪开始呢? github 上有一个六万多星的项目专门解决这个问题,它叫 understand anything。 简单说啊,就是它把复杂的代码库变成一张啊,可以点可以搜,可以问的知识图谱。这两天我刚好拿 pad 这个项目试了一下,确实有点东西,使用方式非常简单,安装好以后,直接在 open code 或者是 code code 里输入说杠 understand 杠杠 language z h。 这时候它就会分步骤开始规划分析代码结构,最后生成一份中文的代码知识图谱。紧接着再输入 杠 understand dashboard, 开启一个中文格式化的 dashboard。 这样啊,就能看到整个界面。左边不是普通的文件数,它是把 pi momo 这个项目拆成了几层,包括啊,终端的用户界面层、 code agent、 c l i 层、模式层、核心层、工具层、测试层 等等。右边还有一条学习路径,从项目总览到 c l i 入口、绘画核心等等,一步一步的带你看。 这时候我才意识到,它真正有用的地方不是把代码画的很炫,而是把我该从哪里看变成了一个明确的阅读顺序, 哪里是入口,哪里是核心循环,哪里是工具调用,哪里是测试,兜底都安排的明明白白的。所以程序员最怕的不是代码复杂,而是迷路。这个工具真正卖的其实是一张代码的地图。