现在默认情况下, codex 可以 自动扫描你的代码库并读取所有文件。但通过手动将文件添加到上下文中,你给 codex 提供了一个关于工作应该在哪里进行的重要提示。我认为这使其更加专注和有条理。 例如,如果我需要一些代码更改,并且我知道这些更改需要在主页上,那么我可以将该文件添加到上下文中。选择 codex 知道这样做,然后我们可以使用并开始输入该文件。 当我们这样做时, codex 将开始模糊搜索已列出所有可能的文件路径。我们可以在这些路径中渐入并按 type 选择我们想要添加未上下文的那个。当我们这样做时,我们会看到整个路径添加到提示中。该文件的内容作为上下文添加到提示中。 然后,我只想像往常一样写我的提示请求 codex 在 这个文件中为我做一些事情。目前,我将删除这个提示,因为我还有其他东西想给你展示。那就是如何将图像添加到上下文中。 现在,我们可以通过将图像文件拖入终端来做到这一点。当我们这样做时,我们会在这里看到图像的路径。这个图像是 flutter 徽标。我希望 codex 能查看并根据徽标的蓝色在 css 文件中创建两个新的主题颜色。这样的调整将有助于增强整体设计感。所以我将粘贴这些提示。其中说, 你能看看这个 flutter 徽标图像,并根据图像中的两个蓝色在名为 blue one 和 blue two 的 全局 c s s 文件中制作两个新的主题颜色吗?我还将添加全局的 c 文件作为上下文, 以避免再次使用标志时产生任何混淆。接下来,我会开始查找那个 css 文件,直到在选项中找到它。接着我会向下按键已添加该文件。好的,我现在要发送这个请求,看看会有什么结果。 好的,他说已经完成了,所以让我们看看原文件。然后是应用程序,再进入 globos c s s。 而且我们可以在这里看到这两个新的主题颜色,受 flutter 启发的蓝色,所以他成功完成了。 好的,我的朋友,这就是在项目中本地使用正确 c i l i 进行代码更改的基本知识。再说一遍,当任何编码代理如 codex 开始进行更改时,手动使用本地分支是很重要的,因为如果不这样做,你 你会发现自己在代码库中陷入混乱。通常我现在会提交这些更改。如果我对它们感到满意的话。然后我会将这个功能分支推送到 get up。 在 那里我们可以审查它,然后合并到主分支。 我不打算在镜头前做这个,因为这不是版本控制课程。我想保持对 codex 本身的关注。无论如何,在下一节课中,我们将继续使用 c i l 工具,探索一些可以与之一齐使用的内置命。
粉丝1802获赞1.0万

一旦我完成了,我们应该在这个面板内看到一个小的入门训练。所以我将对所有这些点击下一步,直到我们最终到达聊天界面。 从这里,我们可以开始与 codex 聊天,或者让他处理代码。所以我们这里有聊天窗口,可以在这里写任何提示。我们还有几个按钮来控制上下文。 稍后,我们会看到底部。我们还可以选择模式,并在 c i l i 中看到的三个选项之间切换,分别是项目编辑的代理模式,仅聊天的聊天模式以及具有完全访问权限的代理模式,包括互联网和项目外的文件。 我们现在选择聊天模式,这样就可以稍后向 codex 提问。我们还有其他下拉选项,我将在接下来的几节课中讨论。 顶部,我们应能看到最近在 codex cloud 上运行的任务列表。这确实是一个很好的增强功能。如果你点击其中一个任务,你会在扩展中看到该任务。 现在,如果我在这个任务中写点东西并按下回车,它实际上会将该回复发送到 codex cloud 并远程处理。但我们现在不打算这样做。相反,我希望回到常规聊天窗口进行本地工作。那么和往常一样,我们将先询问编辑码器关于这个项目的情况。 提示可以是类似于,你能给我简单总结一下这个项目是什么吗? 所以,当我们按下回车时,我们应该看到 codex 开始浏览项目并收集信息。现在,我实际上非常喜欢这个聊天窗口的用户界面,以及当你要求他执行某项任务时, codex 以这些要点形式作出的响应,你也可以展开其中一些,以查看 codex 在 背后正在做什么或在想什么, 这一点也很不错。好的,看起来 codex 现在已经完成工作了,我们可以看到他提供的这个摘药。

我们使用 add 符号将按钮组建添加到上下文中,并继续说明需要实现 类似于这张图片中的三维斜角效果。好的,希望当我们发送这个时, codex 会查看我们粘贴的图像,并对我们的按钮应用类似的效果。我将把这个发出去,但我现在也会给你发送视频。同时 codex 在 工作,然后当它完成时,我会再次放慢速度。 好的,完成了它。更新了这两个文件。我们实际上可以通过点击这里查看所有更改。它在这里显示了一个小的差异。所以如果我们展开这个并向下滚动,我们可以看到添加了很多 c s s。 我 们现在有了一个按钮斜角类。 如果我们继续向下滚动,你可以看到它还更新了 button t s x 文件。它几乎重写了整个文件。所以我现在要做的是关闭这个,然后在浏览器中预览这个。 好的,让我们前往表单。这里是这个按钮组建被渲染的地方,然后向下滚动。嗯,看起来还不错。我可以看到底部的三维效果。 我可能会以不同的方式做这个,可能颜色会改成深绿色而不是灰色。但是你知道吗?他有了大致的想法。也许我可以回去再提示一次,问他能否更新这个和那个,那样会更好看。好的,这就是为题是添加上下文。接下来我想快速谈谈我们可以选择的不同推理努力水平。 你可以在下面的这个菜单中找到这些水平。默认情况下,推理水平设置为中等,这是我大部分时间保持的设置。

三天全自动搞定闭社,如果你的闭社需要写代码,那你真来对地方了。我用 open and codex 三天自动跑完了整个闭社,全程几乎不用自己动手。很多同学可能还不了解 codex, 你 可以把它理解成拆 gpt 的 进阶版,也就是现在很火的 agent 智能体工具。听不懂也没关系,你只需要知道一件事,它能帮你自己写代码,自己跑项目,自己修 bug。 如果你之前使用过对话式的 a r 写代码,大概率会遇到这些问题。代码要来回复制粘贴,对话异常就开始乱写,就一个 bug, 又引出三个新 bug, 记忆力越来越差。这是因为它只是单轮对话的工具,并不能真正理解你的整个项目。 所以最好的方式还是直接使用 a 阵的工具来做,因为它可以独取整个代码库运行代码运行目的始终围绕一个明确的目标,就是让项目跑起来。 我自己的壁设就是只给他建了一个文件夹和需求文档,其他的只需要刷视频等待即可,他自己会智能化的帮你做项目。甚至由于我的需求文档中写了这段提示词,所以他最后把壁设要求的 api 文档、数据字典、数据库的设计说明书都帮我写好了,甚至做完的时候还帮我做了压力测试。 好,下面详细讲解一下如何使用整个视频所涉及的软件。需求文档我都打包好了,关注,然后私信我要即可。首先你需要安装一下 node, 你 可以把它理解成一个运行环境,它是可以让电脑学会听懂代码的工具, 直接点击下一步,下一步安装即可,安装路径可以改到 d 盘,但要保证软件的安装路径不要出现中文。然后浏览器搜索叉 gpt, 按照提示登录一个账号即可,可以使用自己的邮箱注册,也可以直接从网上买一个。注册以后建议去某鱼拼一个 business team, 这样的话日常也可以用订阅版的 gpt, 最重要的是可以使用完整高额度的 codex, 加入 team 以后,点击头像就可以选择进入了,然后 codex 可以 直接连接 github 来使用,但还是建议部署在本地,这样可以比较方便的操作自己的币设项目。 g p d 账号做好以后,可以直接使用快捷键 win 加 s, 调出 windows 的 搜索,输入 cmd, 右键点击以管理员身份运行,然后输入这段命令进行安装。若要验证安装的话,可以输入 codex word 进行查询,安装没问题的话就直接输入 codex, 这时会弹出需要你登录账号的提示。 在账号搞定后,这里就可以直接选择第一个回车,它会调用你电脑中的默认浏览器,打开登录界面,根据提示一步步进行登录账号即可。 要是出现选择工作空间的话,就选择 business, 这样登录后享受的就是订阅版的权益。登录完成后,中端框会给一些 codex 提示,意思就是提醒你 codex 也会犯错,需要人工看着,你可以决定给 codex 有 多大权限,等看完以后直接回车就行。 现在就进入 codex 界面了,可以先设置一下模型,输入斜杠 model 回车,推荐使用最高模型,我目前最新的是五点四,然后直接回车。 这里是选择 codex 的 思考强度,建议选择 high 或者是 x high, 这样质量会高很多,但同时 codex 的 思考时间也会变长。 codex 的 设置还有很多,我这里列个表格,大家慢慢看。 结束这里后,我们可以给自己的必设设置一个文件夹,比如这是我必设的文件夹,在这个文件夹下,右键选择在终端打开, 这样终端的运行路径会自动定位到该文件夹目录下,然后在这输入 codex, 就 可以直接进入。下面这一行的信息是 codex 的 模型推理能力和上下文剩余空间以及运行路径。然后给大家介绍几个常用的命令。首先是斜杠 init, 这个命令可以让 codex 扫描整个项目的代码, codex 会理解项目结构依赖文件关系,然后在该目录生成一个 agent 点 m d 的 文件, 它可以有效地帮助 codex 理解整个项目。这个命令一般会在第一次打开一个项目,或者说刚进入某个代码目录的时候使用,推荐大家在自己做项目的过程中使用。 再一个是斜杠 compact, 简单解释就是可以压缩当前对话上下文,保留关键信息,丢掉容易细节,减少 token 的 占用。下一个命令是斜杠 approvals, 功能是修改 codex 运行权限,比如默认的时候,他想创建或删除文件的时候,会先问你一下,需要你回车给权限,但 for access 的 情况下会直接删。 这些命令足够我们完成必设了,我给大家做成表格,可以截图保存一下。我在做必设之前想好了必设的大体功能和模块,所以我提前把需求文档写好了, 放在斜杠 box 文件夹下面,这样做的好处是可以作为一个长期稳定的上下文员供 ai 参考,并且可复用性比较高。开新对话可以直接让 codex 重读这个文件不宜每次都诚心讲项目的背景。 然后这是我提前做好的文档,大家想作为参考的话可以直接关注私信我要大家在写的时候可以直接把自己的开机报告等文档直接丢给 d p d, 让他去写续行文档,这样会更方便。这类文档大家最好使用 markdown 格式的文件,平时使用过 markdown 格式编辑器的同学可以挑转到这个位置,我给第一次接触的同学说一下, 这个和平时用的 word 文档是一个意思,就是一种文件格式,比较适合大模型的处理。还有一个原因是一般大模型的输出也都是 markdown 格式, 不知道有没有同学碰到过。将 ai 输出的内容粘贴以后发现有很多星号警号啥的,这些就是 markdown 文档的语法,所以直接将 ai 输出的内容一键复制到 markdown 编辑器时,可以完美兼容格式, 就像这样,所以这样也方便大家未来使用 ai 记录笔记啥的。至于使用什么软件都可以,我自己用的是 oc 点,大家也可以使用 type ro, mark text 都可以。简单说一下 oc 点的使用。安装完软件以后,打开软件会提示你需要建一个仓库,大家可以根据自己电脑的情况去建立,建完以后就可以打开界面了。 现在随便新建一个文件,就可以在刚建库的路径下发现新建的点 m d 文件,这个文件大家可以直接复制到需要用的地方,当然 obc 店还有很多玩法,就不列据了。好,等完成这些后,剩下的工作就全都是 codex 的 了,它是可以直接使用自然语言对话的,比如打个招呼, 然后直接对他说,按照斜杠 dos 路径下的哪个需求文档去做,他就会立刻执行,只要需求文档够清晰,剩下的直接坐等收货就行了。在这期间争的对话框不要关,不然会有关闭对话,因为 c l r 模式的 codex 不 能保存绘画。 下一期我可以将我的壁设录个屏,给大家看一下 codex 的 效果。 ok, 这期视频内容就到这里了,喜欢的朋友求赞、求收藏、求转发,未来我还会做一些速腾大学生活的技巧,那我们下期再见。

hello, 大家好,我是温特妙,我们来体验一下 openai 刚刚发布的 gpt 五点四,它的一个全新的功能啊, computer use, 我 们来看一下它的一个官方网址。啊啊 啊,在通过 codex app 或者是 api 的 话呢, gbt 五点四它是支持原声操控电脑的这个能力的,并且它是 openai 的 首个支持这个能力的一个通用大模型。 比如说它是可以呃,通过打通过就是打开其他的 app 来执行一系列的啊,复杂的一个工作流。比方说它可以帮我们打开, 打开微信 app, 帮我们来回复微信消息,帮我们来那个整理微信消息啊,比如说它也可以打开可用浏览器啊,比如说 打开一个玩游戏的页面,帮我们来玩这个游戏啊,他也可以帮我们比方说,呃,打开我的一个 b 站页面,来帮我回复用户的私信和那个评论。 然后他还可以啊,就是打开一个网站,比如说打开 pinterest 的 网站,按照我的一个要求,帮我来找找我需要的一个图片。 ok, 那 我们直接上手体验一下吧。哦,还有一个,还有一个升级啊,很大的一个升级,他的一个上下文从那个四百 k 升级到了 em 啊,也就是说他的一个上下文能力是之前的一个二点五倍。 好,那我们现在就直接来体验一下啊,我们直接创建一个空的文件夹啊,给大家看一下,我在这里创建了一个可用 sof 文件夹啊,我先把这些之前的内容删掉啊,创建一个空的一个文件夹就可以了,然后通过这个 ai 的 啊添加新项目,把这个文件夹添加进来,添加进来之后呢,在这里面直接和他聊天就可以了啊,比方说我,嗯,跟他说啊,帮我打开可用浏览器访问聘锤斯特网站 啊,搜索猫咪的一个图片啊,然后帮我,嗯,挑选一张好看的图片保存在当前文件夹啊,我这个需求没有准备啊,比较含糊。 嗯,我检查一下, ok 直接发给他啊,比较含糊,没没没有,就是说让他给我挑选一个嗯,什么风格的图片啊?但是呢,因为 我把这个这个打开啊,但是因为它是通过浏览器打开的啊,就是 pinterest 的 对吧? pinterest 的 这上面我已经登录了的,所以的话其实它打开的这些图片都是和我的偏好是很一致的 啊。然后如果大家第一次使用这个功能的话呢?嗯, 他是他是这样的,给大家讲一下,第一次使用这个功能的话呢,他会要求一系列的一个权限啊,你把权限全部给他就可以了啊。然后你这个模型的话呢,你必须要选嗯, gbt 五点四啊,或者最新的模型也都是可以的啊,因为 gbt 五点四是第一个 首次支持啊, computer 柚子的这个 open ai 家的一个大模型啊。 然后这边的话呢,还可以选择速度,速度的话呢,选 fast 的 会更加快啊。 ok, 他 在帮我来找图片,帮我保存啊。然后,嗯,还有一个地方要注意啊,就是如果大家第一次用的话啊,比如说我现在是 让它打开 core 浏览器来帮我做一些任务啊,对吧?它里面会涉及到一个脚本,脚本的一个使用,脚本的一个使用的话呢,我把这这个这个放到这边啊啊,涉及到 ok, 他 又问我要权限啊? ok, 给他啊,涉及到脚本的一个使用的话呢,他需要还需要在 chrome 浏览器的一个上面的一个菜单栏里面啊,在这个显示页面 开发者,对吧?这里把这个也勾上允许 apple 事件中的 javascript 啊,就是说允许, 呃,允许 code x 在 浏览器里面来执行这个脚本指令啊,这样的话它的一个任务会完成得更加顺利一点。 ok 啊,等他来操作啊,因为因为还因为他这还是第一个版本吧啊,所以的话呢是有点慢,执行速度是有点慢的啊,他已经拿到了一个原图地址了啊,然后他你看他用过用这个刻指令来 把这个图片保存到我们当前的一个文件夹啊。 啊,正在执行啊,其实它就是通过一系列的脚本来完成这些。呃,电脑操作的啊,所以它的一个通用性是很强的,就是说它是支持所有的一个 app 的 啊,像有些 app 比如说微信 app 啊,微信 app 不 可能去开放这些 api 给他的。那他是怎么做到的呢?他是通过一个打开微信 app, 然后他去截一张图,截图之后他会来定位到他所需要的一个功能区域,然后再模拟鼠标点击去实现对应的一个事件。 ok, 已经处理好了啊,他给我保存了一个这张图片啊,那我们再来看一下他的一个其他的能力啊。嗯,比如说 我想让他来帮我回复 b 站的一个评论啊啊,然后这个这个的话呢,我为了方便,我不希望我每次都告都给他讲一堆东西,所以的话呢,我一开始我就告诉他, 我让他来帮我创建 agent 点 m d 文件啊,因为 code x 在 执行任务的时候,每次他都会来读这个文件的啊,这样的话,我一些重复的话我就不用给他说了。我告诉他 啊,这是我的 bilibili 啊,我告诉他啊,帮我打理 bilibili 用户的一个回复与私信,然后这是用户的一个回复页面啊,把这链接给他啊,防止他不知道在哪里。因为他是一个通用的一个大模型吗?他需要处理的信息太多了,太广泛了啊,他可能不一定 知道这个回复页在哪里啊,并且如果,如果他不知道的话,他去找的话会费很多功夫,所以我直接给他 啊, ok。 然后呢,我又让他完善了一下,我让他每条回复啊,让他更新一下 id 字母 d, 每条回复要带上尾缀拜扣的 x app gpt 五点四啊,这样的话,用户收到这个回复的时候,知道这条回复不是我发的, 然后每条回复呢,要写到日记里面去啊,这样的话呢,嗯,就更加他做的什么事情我都知道啊。然后他给我更新了,更新好了之后是这样子的啊,这样子的,其实我也没有看,我也没有看,你看工作方式,他给我讲讲好了啊, 他已经默认我已经登录好了的,他默认我已经登录好了的。然后呢,回复的一个原则,他也写好了,我想改的话,我在这里改也可以啊,但是呢,我没有做任何修改。 然后呢,比如说涉及到垃圾信息的话呢,他要先征得我的同意再回复啊,包括这些什么一些邀约啊,一些乱七八糟的东西啊,都都得这样子。 ok, 那 那那现在的话我就可以让他来执行任务了啊,比方说我, 我让他来执行,帮我回复最新的评论啊,打给他把这个小窗打开,这样我我们大家可以来看他是怎么怎么怎么操作的 啊,你看他直接用我给他的链接打开了,打开了,他来看第一条评论是哪一条啊?他先来确认一下, ok 啊,他已经,嗯他,他说然后啊,因为这个评论我已经回复过了啊,我之前让他执行过一次啊,所以的话,你看他还很聪明,他说 这个评论他已经回复过了的。日记记录在这里啊,我们来看一下看一下这个日记啊,日记的话其实在这里啊在这里啊,本人是 u x 设计师,然后您代码基础想学习 web coding 啊,这些可以学习吗?然后 他给我的回复就不是我自己的回复,他说可以学啊,并且你有这个 u x 背景是很有优势的啊,这这么一些 东西啊。啊,那那那我们再,再来继续啊,再来继续,来给大家看一下他的一个玩游戏的一个能力。 code x 啊,玩游戏的一个能力啊。 ok, 我 们还是继续用用这个画好了啊,直接新开一个回话啊,在这里帮我玩一下可用打开的扫雷游戏啊。我,我现在打开的是一个扫雷游戏,我让他帮我玩一下 啊,同样,我为了方便大家观看的话呢,我还是把这个拖到这边来啊,把这拖小一点好了。这样子啊,这是一个扫雷游戏, 看一下它啊,它现在的话呢,它处理这些任务是很慢的,因为因为这是它的第一个正式支持 computer use 的 一个版本嘛,它的速度是很慢的, 但是呢,我觉得就是以这个状态发展下去的话,到下一个版本那我感觉他都可以去做那个,他都可以去代练了啊,就就比方说我们开很多个页面,对吧?让他帮我们在游戏里面来打金币, ok, 然后呢,其实我我我觉得可以这样子,就是每次他成功帮我们执行好一个任务之后呢,我们让他帮我们更新一下 啊,或者如果像我这个项目我都没有创建一些 md 啊,这玩游戏的项目,你可以让他创建一下 md, 帮他更帮你更新一下,这样的话呢,他下次就会少踩很多坑,不然的话你看他在, 他在他的脚本在一个一个执行啊,他执行了很多脚本,他都是尝试性的去实现这个任务,他得他可能得从一百种方式里面 找到一种合适的方式才行啊。但是你更新了 index dm 低了之后呢?后续的话他直接就拿他的成功的方式放在最前面啊,他可能一直接拿第一种方式一试就成功了就可以了。 你看页面变量隔离比预想的要严格。他还他还讲出来这个任务啊,他遇到了什么问题啊,他要怎么解决,都是完完整整的在这个思考过程中说出来的。 ok, 然后然后等一下的话呢,我还让他帮我来回复一下微信消息啊 啊,他要确定一下当前的一个盘是不是新开的,到底是已经玩到一半了还是新开的,如果是玩到一半了,可能他再要看一下当前的一个局势啊,当然我这个盘是新开的, 你看他执行了各种脚本文件啊,其实大部分脚本文件都是都是,都只是一个试错。 嗯,等他,等他完成, ok 啊,他终于理清了终于理清了啊,已经在扫雷了, 读取展开后的局面开始解啊,又在开始解这个,解这个雷了 啊。其实好像,好像,我如果把它变成超高的话,像还快一点啊变成超高好像快一点。为什么呢?因为它的一个思维更会更加神秘一点啊,它解决问题会快一点,只是回复变得慢一点而已。 嗯,你看他通过他不需要做图像识别了,他直接瞬间给你打出来,因为他之前他在尝试用图像识别来解这个问题,但是实际上的话呢,因为我们打开的是网页嘛,他可以直接通过 就是读源码的方式,因为网页它是可以,对吧?在 chromium 里里面,你是可以通过检查通过 f 十二检查来获取网站的一个源码的啊,所以它已经直接报文完成了。 ok, 我 不用开下一局了啊,我,我可以再让他帮我玩一下飞机大战啊, 帮我继续玩飞机大战这个游戏 发送, 然后我,嗯,我好像不能多操啊,这里有一个问题不能多操,因为他他他要打开对应的一个页面啊,所以的话,如果我让他这会帮我回复微信消息的话呢,可能不是很方便, 但是可以给大家看一下啊给大家看一下啊,微信消息啊,回复微信消息。我也是新建了一个 index html 的, 但是我说的非常简单,我直接让他帮我创建 index html 文件用于回信微回复微信 app 啊,他就已经创建好了对吧创建好了之后呢我同样让他就是每条回复都带上尾缀啊,并且啊写上日期啊对吧然后嗯你看 啊帮我回。那他这样这样子啊写了啊 ok 完成了 action dm d 了之后呢我让他帮我回复啊回复的话呢其实是已经回复成功了的啊我我重新开个绘画框。 嗯那我这边玩游戏的把它停掉好了啊停掉 帮我打开微信 app 然后定位到第一条绘画框啊然后回复里面的消息 啊用高算了啊因为这个东西应该主要是涉及到一个图像识别 发送吧啊发送把这窗弹出来啊。因为 啊 ok 他 在思考啊然后他要处理微信消息和处处理核核循消息还不一样啊。因为因为处理核循消息的话他是通 啊他打开了处理核循消息的话呢他是可以通过脚本通过那个读取网页的一个原码来执行一些任务的但是呢他要去 操作微信消息的话呢他有一个问题啊微信是不可能开放这些 a p i 的 微信 app 的 话对吧?那他只能去通过一个图像识别啊,通通过图像识别的一个 窗口。哦哦等一下等一下停止一下啊停止一下有个坑啊。因为因为我现在在录视频我是我是有打开了多个窗口的啊我我我是有多个 屏幕所所以的话呢他他默认打开的屏幕是在第二块屏幕啊对对对,他帮我挪过去了啊我重新给他说啊。嗯微 微信 app 的 话就在当前屏幕处里啊不要挪到其他的屏幕去 啊。因为我这个是特殊情况所以我给他解释一下啊。 ok, 那 不然的话,他给我挪到了另外一块屏幕,我录视频的话,大家就看不到了。为了方便演示一下, 你看啊,他的话,他的执行操作会非常慢啊,因为他打开了之后呢,他得通过 截图的一个方式,他得通过截图的方式来获取当前屏幕的一个信息。 然后呢,他截完图之后呢,他又得通过 ocr 文字识别啊,来识别对应的一个文字来定位到对话框啊,包括包括如果你让他在指定的群里面回复也是可以的,指定的群里面,他可能会定位到这个搜索框来搜索这个群 啊,搜索好这个群之后呢,对吧?他他进每进入一个新页面,他都得进一次,就是视觉啊,进行计算机视觉来识别这个信息啊,所以的话会非常非常慢,所以给大家简单演示一下啊。 啊,他还是要拉到我的我的这个麦克屏幕上去啊,大家可能看不到啊,可能会看不到啊,等一下,等他回复好了,我我我再给他拉出来 啊,已经可见了啊。啊,因为因为我,我现在大家看到的屏幕的话是副屏啊,他,他目前的话我没有跟他讲清楚。卧槽,他已经在掉我的鼠标了, 那我鼠标不能动啊,我鼠标不能动, 等一下啊, 这个是会有点麻烦的, 因为因为微信这种 app 的 话,它的一个隐私保护, 隐私保护它是做的非常那个做的很严,所以的话会麻烦一点啊,如果,比如说,如果让我们让它打开 xcode 啊,去执行一些操作的话呢,它会快很多很多 啊。你看啊,这是他的一个操作流程, 他会,他会执行各种脚本啊,打开搜索框,粘贴完整打开, 他发了一条消息,但是发错了发了一条消息,但发错了啊 啊,之前的话我有测试过,就是他是发的消息是对的啊,可能是因为我的这个屏幕的一个原因,我可以给大家 展示一下。好了啊,因为,因为我现在是双双屏,双屏话可能有点问题,我把它停掉,停掉我给大家展示一下啊。嗯,我让他回复一下啊 啊,比如说他在一个,他在我的一个微博 qq 的 群里面给我回复了一句这样的一个话 啊,比如回复了 open ai, 呃,已经发布了 chat gpt 啊,什么什么拜扣的 xapp 五点四啊,这个话就是他回复的, ok? 呃,那我们 就是今天的一个分享,就到这里感谢大家的一个观看啊,欢迎大家一见三年啊,对我的视频鼓励,感谢感谢。

我试用了几天 openai 新推出的这个 codex 整体使用情况,我是,我觉得我是非常满意,然后用户体验非常好, 尤其是针对那些不喜欢迷你行工具,或者是不知道怎么用 ide 的 那些,给你们看一下这个界面哦, 他这个里都是以文件夹形式,一个项目就是一个文件夹,然后这个文件夹下面你可以跑多条任务,我为什么要出来用呢?你在一个窗口下面,你布置了任务, 你可能还会有些其他的问题,你和他进行了探讨,等你这个上下文过长以后啊,整个模型它的召回率就会比较低, 这就是我们说的那个上下文污染。现在按照这样的方式,他其实已经在引导你,告诉你说,呃,你的一条任务就在一个窗口里面跑,在一个对话窗口里面跑就行了, 然后你可以开多个对话窗口去一个分别执行。还有一块我觉得是比较有特色的,是 openai 做了一个,现在看上去我感觉就是一个给我的技能商店, 然后每一个 skill 你 就可以直接一键安装,安装完成了以后去聊天窗口你就直接可以用,刚刚装好了就在这里就能看到,这个实在是太方便了,然后你不想用了,或者是你觉得不好用,你就直接卸载掉, 这个我真心觉得怎么说,我觉得这应该才是一个软件真正该有的样子吧。然后它的编程我做了一个简单的小测试啊, 因为我看网上有很多人已经测试过了,然后都说速度很快,但我不知道为什么,我这里设置的,我就让他帮我创建一个 to do list 演示程序,然后这是一个很基础的软件了,很基础的一个小的需求了, 但是他应聘的时间你看 work worked for 七分十七秒,我对这个数据, 对这个时间我感觉挺震惊的,然后我就赶紧跑去拿 claus, 四点六跑了一下,一分十七秒就跑完了。那反正我觉得我对 codex 的, 我对它的模型的能力其实是认可的,因为原来我也是在 cursor 里面,经常在 cursor 里面去用 codex 五点三,这个用 codex 五点二,那时候没五点三的时候就用五点二去 改一些比较顽固的 bug, 所以 我对 openlight 的 模型能力从来不怀疑,只是说原来 curses 里面有我没用而已,就没有用官方的了。然后简单说一下这个软件的一些小配置, 这边有个开关建议把打开,因为他可能运行的时间比较长,你电脑可能会睡眠,导致程序运行中断,这个打开了他就能保持你电脑一直处于一个唤醒状态。然后这边是这样模式的话,呃,你可以 相当于你下指令以后,你可以补充你的指令,或者是嗯,他朝另一个方向去思考。这两天反正应该有。我没仔细看他的更新的频率,但我前两天用的有的 bug, 这两天就已经没有了。 我之前这里他会弹出选择框的时候,那个选择框选完了,但是那个选择框不消失, 反正我今天用了一天,我也没发现有这个问题,应该是已经修复了。总结一下,我觉得这次这个格式化界面真的给人耳目一新的感觉。我习惯了格式扣的,但是我用这个我还是觉得用的很爽, 用户体验非常好。格式扣的里面看时间长了我觉得也就切来切去,我切的也很头疼, 我还是强烈推荐大家去试用一下。无论你是做 webcoding 也好,还是说你做一些文案类的工作,我觉得这个软件都非常非常适合你。

windows 的 windows 桌面端已经出来了,我深度体验了三天,接下来就跟大家录一个视频,说一下我在使用的过程中遇到的一些问题。首先这个页面就是我们下载的这个页面,直接点进去就可以下载,它是直接连接 微软的软件商店的,所以我下载的时候遇到的一个问题就是我的版本跟这个商店他不符合,因为我的电脑版本我是 win 十,我没有升级到 win 十一,所以说我在下载的时候他就说跟版本不符,我这个时候就准备了一个这样的升级,就是关闭系统防护的升级,还有一个是这里升级的一个文件,就做了一个升级就可以下载了。 下载之后我看到有朋友说下载之后有闪白的问题,所以我没有遇到闪白的问题, 下载了之后就进入到这个界面,其实因为我是代码的小白,我不知道这个界面之后应该怎么去按嘛,我看网上的教程大部分都直接是这个界面了,所以我当时还研究了半天这个地方直接添加项目就好了,添加项目它会让你选择一个文件夹, 我就建建了一个这样的文件夹,再添加项目,选中这个文件夹之后就能来到这样的一个界面。这样一个界面之后,主要我是看一下我们的左下角,它这个地方有一个剩余的额度好像,因为我 gpt 开的是 plus 版本,好像是可以额外再给两倍,反正这个剩余的额度,比如说百分之百,百分之七十六,这个是一周的,每天会给你多少小时,这个就是剩余的额度反,每天都非常的够用, 我看遇到最多的一个问题,包括我自己也遇到,你给他发了一个东西之后,他一直在思考,你看我这个,我三天之前发的,他一直在思考,我又开了一个新的任务,他仍然在思考,这个是怎么解决的呢?我换了一个节点,把 gpt 的 网页版,网页版打开,打开 gpt 的 网页版,打开了之后,换一个节点,我们可以在新建一个新县城,相当于是在这里去给它输入新的任务,最新的应该一一的,它就可以正常的去操作了。 好,下一个就是关于怎么能更好地使用它,其实我是一个代码的小白,我不知道该怎么去使用,有人说这个地方会有一些 skills, 我 没有额外的安装,我觉得基础的就够了。我这里其实主要是想说不要把它当成一个 ai 工具,就把它当成一个纯写代码的一个东西。那么其他的我建议要跟一些 ai 的 工具去做一些搭配着使用。比如说我最开始是搭配着 gpt 去使用的,就相当于用 gpt 给我的一些指令,我再导入到 codex 里面,让它去给我运行。 但是我深度测试了三两天,我发现 gpt 出来的东西仍然不能看,最后出来的这个效果不尽如人意。我在昨天下午我又深度的去换了一下,我换了一个 germanlab juma 之后,我用的 pro 的 模式,虽然我的 gpt 也是 plus 版本的,但是出来的效果不太好。我又用到了 pro 的 这个版本,就 juma pro 的 版本,给它输出我想要的东西, juma 会把它翻译成机器能读懂的这个代码语言,我再导入到这个 codex 里面,让它去给我运行,最后花了半天的时间,昨天满打满算应该是一天的时间,我最终把这个东西给研究出来了,当然 最后的结果是失败了,我开发的这个东西它是失败了,但是我建议大家如果要去使用它的软件搭配着用,就用其他 ai 工具搭配着用,不要直接在 codex 里面去提问。你看我之前就是遇到一部,我就问那个 codex 它该怎么弄,它就给我弄得很乱,因为我不知道怎么写,所以我就跟着它的步骤去, 但是他给我的步骤就又长,他会你问他一句,他说一句,他就不站在那种能完完全全解决这个事情的基础之上。但是 german 呢?给我的感觉就是他想他能够对准我们的这一个核心的目标去给你拆解,因为这是我整体使用 codex 的 一个感想,如果大家有其他的问题,也可以积极的去交流。

好,大家好,我是小刘。呃,今天我们一起来快速学一下这个 codex, 最近两个月我一直在使用这个 i 编工具,然后用 codex 的 话用的是最多的,然后我心想为什么要用它啊?因为它用起来非常的顺手,冰非常的爽啊。比如说我们看今天我想要打开任何的 i 工具都可以无缝的去集成,那我用的最多的是这个 iq 啊,打开速度非常快。然后呢,我们在这边开发完之后,想看效果,直接打开任何的地方全部集成过来了 啊,比如说像我们要开发一个东西,对吧?那你要开发两倍速率,你可以看到这个地方有一个 fast, 你 点一下就代表当前的速度是两倍,那很很很有一个细节的点是什么呢?就是你看这是空心的,空心代表什么?标准的你点开来之后呢, 它就变成实心的,代表当前速度是两倍,你也可以选择关掉它。然后呢每一个模型都分为推你的低中高、超高,对吧?然后比如说像我现在开发一个简单功能,对吧?一个学生管理系统给大家演示一下,对吧?那这个时候效果是把它长这样子,这个样子像它的这个啊本地的工作数, 那这时候你可以点这个地方,可以给他派生出去一个新工作数,你可以点这个斜杠,点这个派生,相当于他会把当前的这个节点呢给他来复制一份,在那个复制这个节点上进行开发, 就会有一个数的图标运行在工作树当中,如果你输入 pwd 呢,这时候你会发现它创建一个 walking trees 的 这么一个啊分支,然后呢?相当于在这里开发,你开发觉得 ok 了,然后这时候你点击 提交到本地,它会,哎,相当于给你干嘛给你提交到本地,为什么这里没有提交?是说你本地有一个修改,对吧?你没提交它不允许你你你提交,所以它其实很多地方它整的挺规范的,对吧?你看我现在随便提交一下,你看这时候我要提交本地,你看就可以了嘛,是吧?提交本地, 然后呢?你所有的变更可以在这个地方看,然后你所有的终端,比如说我想从这个地方打开终端,点这个,你看它就就开启这个地方当前的终端, 它就有一个区别嘛。还有就是为什么我很喜欢用 q 代词,我一定要讲一下,就是安装 skill 特别方便,我给大家举个例子啊,比如说我现在安装 skill 这个 skill 呢?我安装下来我可能用了呃几,就是呃三十四秒,我给大家举个例子,就是它这个 skill 呢, 是我目前见过安装最方便的一个工具,没有之一。真的特别方便啊,比如说我现在安装十个 skills, 那 非常简单,我就只需要把这一堆 skills, 哎,我这我这么,我这么跟他说啊,就是你看啊,我安装这个,对不对?按这个我我直接,我直接这样子,哎, 我就这样子,截个图,对吧?截个图好,对吧?帮我安装 skills, 你 就跟他说,然后那帮我安装 skills 回收,然后他会干嘛呢?他就真的吭哧吭哧的全部给你安装,对吧?全部安装 你不用管,就这么简单,你看他会全部的给你一个一个的安装,就是很神奇,你看他就已经开始在读了,你你,你懂吗?他就已经在安装了,就就你看这是我就全部安装好了,你看这这都是我刚刚的那些 skills, 像这些什么 u i pro max, 你 看他会自动的去,哎,去查,然后去给你安装,我就不跳过了,就是就是, 不讲这个了。然后呢,就是第一个 skill 是 安装方便,第二个自动化也方便,比如说我想要定时定点的是创建一个什么样的任务,对不对?你创一个新任务你可以去,比如说帮我总结项目,总结项目 那这个时候它会告诉你,哎,每天你选择某一个文件夹,然后呢?哪一个工作树下面,哎,就几点执行,它自动去帮你执行这个任务,真的用起来特别舒服。还有一个点什么,就是它这个额度你很难用得完, 你即使在那个你你你用起来的时候真的怎么都用不完,然后就这个地方是它的指定,就类似于 curses 的 rose 嘛,对吧?就我一般喜欢用 andy 站六去开发,我觉得这个效果还挺不错的。 还有就是 m c p 服务器也是特别方便,你这边你可以选择添加自己的 m c p 服务器。还有这个环境,你看规章就是当前你它的规章不是给你删除,就类似于回收站那个地方放十五天,然后给你消消失,它是这样子给你删除的,然后呢?包括它的整个风格我都特别喜欢,真的,我是特别的爱这个靠 text 真的 越用越好用, 就是它的功能,你会发现啊,更像是一个聚合体,就是把那些好的特性全部给你进行过来,点这个状态,你看就当前,对吧?就跟是 play 模式对吧? play 模式 i shift 加 table 一 样的,对吧?你看你开发什么东西?开发学生, 呃,管理系统,这时候他会问你问题,就相当于问你你要开发什么样的管理系统,就是相当于,哎,作为一个问群, 嗯,问题,然后还有这个权限啊,就你一般来说不要开这个,除非你对自己的这个,呃,电脑上的文件没有任何的这种,嗯,很很高贵的东西,你就可以开, 对吧?然后你看他,他就会问你一些,弹出一个 question 就 让你去选,做选项,选项题,选择题一样的,噔噔噔噔,你选完,你选完之后,哎,就就就结束了,还有就是这个可以关联云端, 然后呢,你这边有一个剩余额度,你可以从这里看嘛,就是他这个额度,我简单说一下吧,就是五小时,啥意思?就是说你这五个小时里面你能用的数量,你这还有还剩多少?归零之后你就不能用了,但是你过完五小时他会给你刷新,就是给你刷到这个全新的这么一个情况。 嗯,当然了,如果一周的额度清零了,代表你所有的这个额度都清零了,你看啊,现在这个 question 就 出来了,你看它有三个 question, 你 可以选择一次性给他回答了,对吧?你点一下,比如说我要开发一个啊,学习管理,你要开发一个什么风格呢? rockaway 加 and 赞,对吧?啊?他就会去思考,根据你这个,根据你的模式去这个文,这个 贴图也特别有意思,你看我随便截个图,你看贴个图,哎,我回车你看放大是吧,就很用的,很很丝滑。我我觉得我真的是特别的喜欢这个 codex 啊。就是用过我现在用过的好多工具啊。我先先用过了,我用过 cursor。 我 用过这个 kylou 的, 还用过 codex 的 之前的终端版嘛,对吧?我用过的特别特别多,我自己都数不出来了,对吧? 还有真的还有很多很多这种主流我就不会一个一个列了啊,我主要列是常用的。那就那你发现没有,我还是觉得扣袋子是最好用的。扣袋子 app 就是 尤其它这个技能这一块,真的,你比如说我想要部署 cloud flair, 对 吧?你安装这个部署哎步就可以部署了。我想要去跟 gitlab 进行关联,对吧?我想要去和这个 losen 进行关联。点一下又可以玩了,是吧? 非常的 nice, 真的 用的很丝滑,当然它有一些不好的点。那不好的点我,我其实也能够列出很多条条框啊。第一个对吧?它没有自己的这个 id, 呃,第二个就是整个这边居然没有个搜索,真的你要搜索某一个记名称搜不出来,这就很很很蠢的一个设置啊。我觉得真的最好就是有一个搜索, 嗯,我觉得会好很多,然后,呃,就大概这些核心功能吧,简单说了一下,我觉得就已经包含了所有核心功能了。那分支也是一样,你就可以切换你自己合适的分支,和之前一样吗?艾特斜杠,然后你可以去看你当前的这个,当前的这个状态,嗯,当前这个额度, 还有就是当前的这个,你回答的一个个性,嗯,就是学你自己嘛,对吧?好,我觉得现在没有什么核心功能,一般看的懂中文的都都都能学的会吧?这个这个工具没有没有啥好讲的,但是我还是想跟大家分享一下。这个工具真的很好用,很好用,我强烈推荐大家试试。

今天这期视频我们只讲一件事,就是普通人怎么用 codex 开发一个小项目,并且部署上线。很多人可能一听到 code 代码就会产生畏难情绪,但你肯定听说过之前的 open cloud, 很 简单,在手机上给他发个信息,他全自动的就给你干完了,但是他贵啊,帮你发一个小红书就可能花你几块钱, 更别说开发一个工具了。但是 codex 作为 ai, 一个 open ai 的 出品,不但可以像 open cloud 一 样帮你完成几乎任何事情, 而且赠送的免费额度就能满足日常所需,如果你是会员,那更是用不完了。更重要的是,学会这种最顶级的 ai 工具,你就具备了做任何产品的能力。这期视频是 codex 的 入门视频, 我会带你从零上手,从怎么安装 codex, 怎么启动 codex, 如何与 codex 对 话,然后我会带着大家从零开始构建一个电影评分网站,并且部署上线。注意啊,就算你完全不懂开发也没关系,这期视频就是为你准备的。 我们开始首先在开始菜单中搜索 cmd, 打开命令行,这是我们与电脑和 codex 沟通的窗口,我们所有的对话都会在这里完成。与此同时呢,我们需要打开一个 check gpt 的 窗口,因为我们都是新手嘛,怎么用这个命令行都需要让 gpt 来告诉我们。 第一个问题,如何在命令行中安装 codex。 他 告诉我,首先确保安装了 node 点 gs, 我 这里已经安装了,如果没有,你可以让他告诉你怎么去安装,这里就略过了。第二步,复制他给我的安装命令,然后 ctrl 加 v 复制到命令行中, 命令行没有报错就说明安装完成了。在命令行中输入 codex, 如果能打开这个界面,就说明我们成功启动了 codex。 第一步,登录 codex 通常都会选择第一个,通过网页端完成登录,登录后回到命令行页面, 点击回车。继续我给大家讲一下最基础的配置。首先点击键盘上的这个斜杠,你可以看到 codex 的 一些基础配置项就出来了,比较重要的是模型选择和权限设置,模型我一般都会选择最新的思考时长,选择 extra high, 这样生成的质量最高。 第二个 permission, 我 选的是 full access, 所有的权限都交给 codex, 不 然它在执行任务中会一直让你去授权,很麻烦。当然这样也是有风险的,有比较小的概率它会删除你的文件,网上就有人遇到过,但是我目前还没有啊。 接下来我们就正式的来做这个电影评分网站,真的超级简单。首先我们创建一个文件夹,作为整个项目的根目录,然后我们要让 codex 进入我们这个项目,怎么操作呢?回到命令行,连续按两下 ctrl 加 c, 退出 codex, 然后复制我们这个项目的地址,打开 gpt, 问他如何让命令行进入这个地址,按照 gpt 的 指示进入后呢? 输入 codex, 这样就在电影打分的这个项目中打开 codex 了。每次重启 codex 后啊,都需要重新设置一下权限,改成 full access。 接着很关键的一步,执行一次启动命令斜杠 i n i t。 执行完毕后,它会在项目下生成一个 agent 点 m d 的 文件,这是 codex 的 一套默认行为规范手册,它会根据文件中的行为规范来完成你的具体任务。 后续你玩熟了,就可以按照自己的要求来修改这个文件了。现在呢,咱们暂时不管它,然后我们就可以来描述具体的需求了。我是这样写的, 由于豆瓣网站的电影评分已经严重失真,我打算做一个新的电影评分网站,基本实现电影的评分和评论功能。你需要完成整个项目的完整开发,并且部署上线。 你需要自动抓取豆瓣上正在上映的电影自动更新。这是一个完整的项目,你负责完整流程,最终交付给我。部署后的网址,你可以利用相关的部署 skill 来帮助你完成。如果没有这些 skill, 你 可以自己去网上搜下载下来用回车发送。 你看,他已经开始自己执行了。突然我想起来忘了跟他说一句话,按一下键盘左上角的暂停键,然后我跟他说,在交付前用肉眼检查一下,没有问题再交付给我, 这样他就会自己用浏览器打开看一下,确保没什么问题。接着他执行了大概二十分钟,最终你看他给我交付了上线的地址,后面简要说了一下他具体交付的内容,我们立刻把这个网址打开,看看效果咋样。 嗯,整体感觉还行,春节档的这几部电影也都在,不过很多图片没有加载出来,界面呢,也不怎么好看。这就是后续你需要不断地跟 codax 沟通来优化迭代的了,包括你后续想用自己的域名,也可以通过跟 codax 沟通来帮你实现。 好了,这期 codex 小 白教学就到这里了,其实还有很多使用的细节技巧,我没有涉及到,你都可以直接通过 codex 或者和 gpt 聊天快速掌握,赶快用起来吧!我是阿猪,关注我,让我们一起在 ai 潮头冲浪!

我可以在代办事项上方看到这个选项,上面写着用 codex 实现,所以我只需点击这个文本,就可以开始一个新的本地任务,让 codex 处理这个为我完成。 现在当我这样做时, codex 会自动启动一个新的聊天会话提示中包含代码中的代办事项,并告诉 codex 用这个任务的实现来替换注视。接下来我会让评论者处理这个,同时加快视频的制作,直到完成。 好的现在完成了,我们可以直接在页面上看到所有的更改。所有这些大绿线是 codex 添加的新代码行,所以这就是这一部分。 这些是我们将要应设的对象,以便为每一对输出一点模板。所以这看起来对我来说都不错。但我们来看看在浏览器中的样子。接下来我们向下滚动一点,我们有流行的配对,这部分已经存在了。然后是这个新部分,最近的配对看起来几乎一模一样,但背景不同,所以是的,我觉得这看起来相当不错。 然后这是一个很好的额外功能, codex 加入了这个功能,因为这意味着我们现在可以在编码时手动添加代办事项。 codex 在稍后拾取这些代办事项,如果你不想立即处理它们的话,再说一次。正如我在这门课中一直提到的,现在我们添加了一个新功能,如果我们满意的话,现在可能是进行提交或将更改推送到 getsup 的 好时机。我一直在强调将更改推送到 getsup 有 两个原因。首先,我认为版本控制 在我们与 ai 工作时是绝对必要的,因为没有任何 ai 编码代理可以很快破坏你的代码库。第二,因为当你使用 codex cloud 时, 它依赖于你拥有一个最新的 gas up 仓库,以便可以远程运行任务。无论如何,视频结束后,我会提交并推送所有这些更改。在下一课中,我们会聊聊 m c p 服务器。

但你也可以降低或提高这个水平。推理水平越低,模型工作的越快。我们获取结果的速度也越快。因为 codex 花费更少的时间去思考和规划它将要做的事情。但反过来,结果有时就不那么可靠,可能会出现边缘情况。 最高的推理水平会进行更多的规划和思考,因此获取结果所需的时间更长,它也会导致大多数情况下更可靠的结果。 那么,你应该选择哪个水平呢?好吧,我个人认为这完全取决于你要求 codex 执行的任务。如果只是一个非常简单的编辑或重构,最低或较低的推理水平可能就足够了。对于大多数范围较大的任务,你可以保持在中等水平。 对于更加复杂的任务,这些任务需要大量的思考和规划,绝对要提高到高水平。再说一次,通常来说,推理水平越高,消耗的 token 就 越多。所以,对于简单任务,绝对不要选择高推理努力水平。 我将保持在中等水平。这是我发现对我执行的大多数任务来说是一个不错的平衡。好吧,还有一件事,我想在这节课中给你展示。这是 codex 为扩展添加的一个不错的小功能,那就是将代码中的代办注式 转换为可以处理的任务。所以,可能是你在完善你的应用程序,并在代码的不同地方留下小的代办注示,以提醒你稍后回过头来做某些事情。例如,如果我打开这个应用程序的主页组建, 我已经在这里有一个代办事项,内容是代办,在这里添加一个最近配对的部分。现在我已经安装了 codex 扩展。

卡兹克找到了个领域最强的大模型,今天我们来讲 ai 编程神器 codex 怎么下载和安装,哪怕你是小白,也能用上顶级大模型。首先你去谷歌搜索这个词, 它跳出来的第一个页面就是我们点击官网之后呢,它这里有个 codex 的 应用,在这个位置我们下去下载,下载好了之后呢,它是一个安装包啊, 我们点击它把这个图标拖进来,这时候就已经下好了,在 app 里面搜 codex, 点击它同意选择用 chat gpt 登录,如果你没有的话可以注册一个,或者你就谷歌一键登录, 当你看到这个标志的时候,就证明你的 codex 已经可以用了,现在你就可以在对话框里跟 codex 对 话了。安装注册过程中有任何问题我们可以随时交流,下期内容给大家更新。怎么用 codex 搭建一个自己的读书系统?

你让 cloud 指挥 codex 干活,任务一复杂,最先乱的往往不是实线,而是上下文。 simon wilson 点的很准, sub agents 最适合代码库探索和多步骤计划,因为单个 agent 装不下那么多脏活。 今天我把这层拆给你看,顺便讲清它怎么接近 agent teams 和 ccb。 复杂任务的问题不是模型不会做,而是读代码,找证据,做修改都塞进同一个窗口, 官方文档直接点名。 sub agents 特别适合代码库探索和多步骤功能计划这种天然并行任务。把这些步骤拆开后,主代理只处理结果和决策,上下文才不会越滚越乱。 codex 现在内置三种子代理, default 都得, worker 专注执行和修复, explorer 专注读代码。 这不是三个窗口同时聊天,而是不同角色先分别完成任务,再回到主县城统一汇总。 simon wilson 的 观察很准,这套模式已经成了 coding agent 的 通用结构, agent teams、 ccb code、 sub agents 不是 一回事,而是三层结构, agent teams 解决,上层协助 ccb 解决, cloud 到 codex 的 任务分发, sub agents 解决, codex 内部再拆执行。 前两层决定谁来指挥,最后一层决定 codex 自己怎么改。如果你之前就在用 ccb, 让 cloud 负责拆需求定边界,审结果,现在它终于能更细地指挥 codex 了。 cloud 不 再只把任务扔给一个 codex, 而是能明确要求 codex 先拉 explorer 查,再拉 worker 改。你还能写自定义 t o m l 代理,但先记住三件事,显示 spawn 六个线程一层深度 token 也会更高。 这项更新的意义不是 codex 多了个按钮,而是 coding agent 开始进入角色分工阶段以后,谁还让一个 agent 一 口气查证?改验慢指是副作用,更大的问题是它会越来越糊。

就在今天凌晨, oppo i 刚刚发布了 gpt 五点四,本来是准备入睡的,那我养的小龙虾给我推了一条更新消息,于是乎直接把睡衣换了,直接开干。那今天的话,花几分钟时间讲清楚它到底升级了什么,再附带一个编程实测。 好,下面我们看一下它的五大核心升级。第一个是上下文窗口,由原来的五百 k 变成了 em, 这一个的话对于你去做一些 长任务,复杂任务有很大的帮助。那第二个的话就是操作电脑的能力也增强了,那这个的话桌面端的 q d agent 也会有很大的帮助。第三个的话,就在恰点 g p 它这个聊天应用中原来的思考过程嘛,就它的 sync 你 是不能去中途去修改的,现在你可以随时打断 补充需求,调整方向。第四点的话,它是有一个更高的托管效率以及更快的响应,响应这块的话我刚刚用 q d x 去实测了,确实是有提升。 那第五个的话,就是它把 codex 的 能力直接合并到了这个 gpt 五点四这个模型里面,什么意思呢?意味着后续是没有 gpt 五点四 codex 的, 直接是 gpt 五点四一个模型就搞定了, 不要像原来那样搞得比较乱。而且现在它新增了一个 fast 的 mini, 我 刚也试了,这个 mini 让你的整个编码速度提升的特别快, 但是你的消耗也是成两倍的一个增长。下面我们来看一下它整体的一个跑分情况,跟几家模型对比来看的话,提升不是特别明显,但是也有一些排到了第一。那跑分的话,其实我们就稍微去看一下就行了,因为 你真实的,不管你在编程实战还是他接触到 a 技能里面,还是在看实际中的表现嘛,对不对?我们直接到编程实战环节,还是同样的 prom 哈,如果熟悉我的老粉都知道这两个项目,在这一次不管是国内的顶尖模型还是国外的顶尖模型,我们都拿这两个项目去做测试同样的 prom。 然后这一个项目是稍微比较复杂的,国内的模型的话它没有做到一次性去把整个任务完成,那国外的模型的话, cloud off 四点六以及 g p 五点三, codex 它做到了,但是 jimmy 三点一 pro 它没有做到,第二个它会稍微比较简单一点。好,我们来开始实测,这次我用的是 codex 这个 app 上去做实测啊,提示词也是跟之前测试是一样的, 并且我们开启了这个 fast 模式,也就说它的整个速度是比较快。对于这个比较复杂的项目啊,就是我们把这个图片 a 帧的项目加上一个认证体系,从另外的项目里面迁移过来,并且做了一个落地页,也是之前那几期视频有测过的。我们来看一下它一个完成结果, 总共是做了三十二个文件的一个修改代码,行数是三千多行,从这个也能看出来,整个任务其实是比较复杂的,他的上下文都快跑满了。我们来看第二个项目,就是给这个 skills agent 是 一个终端 ui 嘛,给他加一个呃,外部 ui 也是一个考验他权重的能力,这个的话他改了十八个文件,大概是两千多行代码, 下面我们来看评分结果,我们来看第一个项目是跨项目迁移认证体系,也就是说给这个图片 a 镜头加一些功能嘛,从另外一个项目里面迁移过来,整体的评分标准是来自于两个,第一个是我人工去看它整个功能的完整程度,第二个是我们把它四个项目所做的代码 用顶尖模型去互相 review, 最终得出来一个评分。那整体看的话,这一次 g p t 五点四,它在这个项目上它的表现是比 oppo 四点六要好的,但是在 g p t 五点三 q max 的 时候的话,它是没有 oppo 四点六好的。 ok, 那 接下来三点一 pro 的 话,它是最差的。 好,我们来看第二个项目的一个评分,就是给这个 skills agent 加上一个终端 ui, 考验它权重的能力,那这块的评分的话,其实它给的有点保守了,为什么呢?因为 给我的一个体感哈,就是它这块的一个 ui 比上一次还要好,但是因为它这块没有去体现 ui 嘛,所以说它的评分的话稍微有点落后,但体感的话是更快, ui 更好了,那代码质量的话, a l u 之后的话是没有这个好的好。我们回过头来进行一个总结,我觉得这次最大的亮点哈,就是第一个, 这个上下文窗口变长了。第二个就是他这个快速模式非常非常有用,如果经常用 codex 的 朋友的话,就应该知道他之前是特别慢嘛,那你用这个 fast 这一个命令之后哈, 他的速度确实比之前快了,但是你的消耗也更快了,那这样子就会对 codex 的 会有更大的冲击,因为之前我几期视频就说过, codex 的 不再成为我单独的一个 coding 的 选择,现在就是我在 codex, 然后 codex 的 互相来回去切换,甚至有时候我还会用那个 open code 再加上欧曼 open code 结合起来去做扣顶开发。好,这就是本期视频的全部内容了,如果你觉得视频做的不错,可以给我一箭三连,大家拜拜。拜拜。

openai 新出的 codex 本来是给程序员的神器,但我发现咱们普通人也能用它来做点离谱的事。以前用 ai, 每次都要重新敲一大段提示词,告诉他上下文格式,避坑指南,就像每次打车都要重新给司机指路,太累了。 codex 最牛的地方在于 skills, 它能把你调教好的复杂流程直接分装成一个 app, 比如这个合同,排雷以后不管来什么文件,不用再废话,点一下结果就出来了,这就是能力固化。 普通人虽然不会写代码,但我们可以用自然语言编出专属自己的工具,一次调教永久附用。当然,它还有什么 word 多智能体, m c p 连接器 这些硬核功能我就不展开了,那是给大神用的,但光是这个 space 就 足够我们普通人起飞了。二零二六年了, ai 在 进步,我们的工具也该升级了,别再用老方法打工了,我是阿康,带你用二零二六年的方式工作。

花了三天时间,嗯,使用这个兔子车开发一个交换机命令的生成器。然后我们来看一下这个页面,就非常的简单,就是一个输入自然语言的,然后包括了市面上的华山、华为、锐捷斯柯等交换机的命令, 然后这边是本地和调用大模型,如果你觉得本地的比例不是很准确的话,我们也可以调用大模型来生成命令,这边可以复制, 然后下边的话添加了一个通过 s s h o 给交换机下发命令的功能和一个评测视频,测试交换机地址是否可达。然后我们来测试一下 创建微浪,是微浪二十,微浪三十,然后微浪四十上两口放通这三个微浪管理地址,就填路由铜段做一个静态路由,下一条到路由网关,使用 i 快, i 快 的 生成还是比较准确的,因为我本地对它进行了规则限制,然后试一下华为,华为的也是非常准确的,所以说呢,但是我没试应该是没问题。然后可以使用模型来试一下, 模型生成就有些慢了,但是它应该比较准确吧,我给模型也定制了本地限制它的规则,它不会乱生成, 就是这样。然后我们来测试一下它的功能, 这边可以直接复制复制命令,命令复制,然后这边我们看一下电脑的 ip 地址, c m d 有 ipad pro 表,然后我们的网吧是二五四五,就是我的交换机的地址,我们就是三层交换机,然后测一下这个交换机地址卡,然后我们输入账号密码, 下方的交换机正在连接交换机下方,下面下方以后它会插电的,然后我们的配置就下发完了,我们检查一下的话就用本地连接一个,连接到交换机, 看一下是不是和我们下发的一样,这是交换机默认自带的。然后十六 a, 二十是二十三、十四个, 有需要的话可以找我要。

嘿,作为开发者朋友们,如果你正在用 ai 做项目,那接下来这两分钟,绝对能让你的工作效率原地起飞。咱们来聊聊一个核心功能, codex 子代理。好,咱们直接说痛点,你有没有感觉,项目一大, ai 的 日制和代码就堆成山,那个上下文搞得特别臃肿? 结果就是 ai 反应越来越慢,给出的结果质量也开始掉链子。我懂,真的那种感觉太让人头疼。 那怎么办呢?其实解决思路很简单,别再让你的人工智能像一个厨师那样手忙脚乱地想同时做八道菜了。咱们换个玩法,把它变成一个高效的后厨团队,请四个厨师,每个人专心做两道菜。 你看,就是 codx 子代理 sub agency 的 魔力,让工作并行起来,效率自然就上去了。那么,用子代理和不用核心区别到底在哪?咱们来扒一扒 来看这张图,对比一下。左边是一般用户 bob, 他 呢?把代码审查、安全检查,所有任务一股脑全扔给主代理,结果就是一个任务卡住,所有都对等着,又骂又容易错误。再看右边的高手 sally, 他 就聪明多了,给每个任务都分派一个专门的子代理, 这些小助手在后台同时开工,互不干扰,主聊天框干干净净,这小吕简直没法比。而且啊,这里最妙的一点是,当这些子代理在后台拼命干活的时候,你的主代理是暂停的。这意味着什么?意味着你的主对话界面永远清爽专注,再也没有乱七八糟的信息干扰你了。 听起来是不是很爽?别急,用起来也超级简单。来,这是你的三步操作指南。第一步,最简单粗暴的方法,直接用大白话在聊天框里下命令就行, ai 会自动给任务创建独立的运行空间。第二步,如果你有些任务要反复做,那就创建一个点 t o m l 文件配置, 别被这名字吓到,它就是个简单的文本文件。第三步呢,就在这个文件里写清楚子代理叫什么,干什么,用哪个模型,你看,就这么几下齐活了。 当然了,想让你的子代理团队稳定又高效,那这四个黄金法则你得记牢了。记住这四条,第一,低 call, 让他们各干各的,互补影响。第二,单一职责,一个子代理就干好一件事,把它干到极致。第三,结构化结果,要求他们按你指定的格式交作业。最后,也是最重要的失败隔离, 绝对不能让一个子代理的失误把整个系统给带崩了。最后,给大伙一个超级实用的建议,你根本不用从零开始,网上有大把开源的,到滔墨子代理库,直接去社区里找你需要的拿过来改一改就能用,这不就是咱们开源社区的魅力吗? 好了,现在轮到你了,动动脑筋,你第一个想创建的子代理是什么?是让他帮你做代码审查还是自动生成文档?快在评论区分现你的想法,我特别想看看大家的创意。