大家好,欢迎来到七科说 ai, 今天我们来上第四课, codex 工作流的进阶, agents 点 md 文件和 plan mode。 那 什么是 agents 点 md 文件?很多时候我们希望和 ai 之间达成一个约定,我们说的话希望他永远记住。比如说我跟他说我的密码是一二三四五六,那我就希望他以后不要再问我密码, 并且也不要产生任何密码相关的幻觉。那这种约定我们写在哪里?一般来说我们就可以写在 agent d m d 里面。当然密码是一个很特殊的东西,不一定是需要写进去,只是说有类似相关的约定规则和一些 策略是希望 ai 永远记住的,或者说是这个项目中的 agent 永远记住了,那这个东西我们就写到 agent 点 md 里面去。 agent 点 md 是 一个项目共识, md 文件,它只是一种特殊格式的 txt 文件,大家不要害怕这个文件, 它就是一个非常非常简单的文件,只是扩展名变成了 md markdown, 大家如果不想要去了解这个文件格式的话,就把它当成 txt 就 行了。 agent d m d 实际上是给 codex 看的项目共识,它就像一份工作的说明书,这个项目是什么文件,在哪儿,怎么写作,哪些事情不要做,哪些事情可以做,以及一些前后的顺序,相当于是我们俩之间的共识。对,那这个共词是怎么被加载的呢? 实际上在我们启动 codex 的 时候, codex 会去自动地加载一些 文件,也就是说他自己会把这些文件读进来,并且记住这个文件。第一,他读的是个人规则,也就是在你的局里面有一个 agent 点 m d 文件,那这个拨浪号就是是你的 home 路径,就是用户目录, 然后点 codex, 是 codex 的 路径,然后 agent 点 m d, 他 要读的你的个人的配置偏好。第二个就是项目规则, 这个是仓库的协助约定,通常是放在根目录,也就是说当我们去做一件事情的时候,这个项目有个要点,那我们放在这个项目的根目录下,那前面是你个人的,相当于是你自己要干什么事情他都知道。 第三个就是局部规则,也就是某个目录自己补充说明,越靠近当前文件越具体。假设这个项目下面有一个文档 d o c s 的 文件夹,那这个文件夹下还有一个自己的 a 乘 d m d, 那 它就会把这个文件也加载到自己的上下文中。 还有一点就是本次任务就是我们当即给他说的东西,他也会加载自己的上下文中,当然我们说的东西就是 prompt, 或者说就是命令,那他肯定会加载进去。在一个成熟的项目里面去给他发一次请求或者是命令的时候,其实 这个 agent 会把前面的这三个文件,或者说是前面,如果有的话,那么这个 agent 就 会把前面的文件也加载进去,作为自己的上下文一起 扔给大约模型。那我们话不多说,直接进入演示好,我们这里打开了一个空的文件夹,大家可以看到这上面的 a 键的显示的目录是在这个地方, 我们打开这个目录,这里是什么都没有的,那我现在随便问他一句话,那我们这里就问他一个非常奇怪的话,我和 trump 之间的交易暗号是什么? 我们文件夹里面是什么都没有的,那它即使是向上去加载那些 a 键 d, m d, 我 里面也没有放任何我和 trump 之间的交易暗号这种奇怪的 东西,所以它肯定是找不到的。那我们现在来看一下结果是什么样。好,那很简单, ai 说,我不知道你和 trump 之间有什么交易暗号,当前对话里没有相关信息,我不能凭空推断。 好,那我们按照我们刚才说的,现在在这个文件夹下加了一个 agent d m d 的 空文件,我们在这个文件夹里面去写。我和 trump 之间的交易暗号 是今晚打老虎。保存好,大家可以看到。现在呢?我们打开了这个文件之后,我和 trump 之间的交涉号是今晚打老虎。那这里有一个 agent 点 m d 文件。那在哪?在这个当前演示 lesson 四的演示文件夹下。好,那我们先看第一点, 我们虽然见了文件,但是我们说了是 context 打开的时候它才会加载。再问一遍,你看我们没有让它去找我们的文件,即使是它在当前项目下, 那我们没有让他去看这个文件,他是不会去找的。所以你不要把东西写在这个文件夹里面,之后,你就认为他一定知道,他是不知道的。那这个时候我们重启这个 agent, 我 们先把这个关掉,然后重启同样的 agent, 打开文件,选择文件键,清开 codex。 好, 我们再说。我和 trump 之间的交易暗号是按照我们刚才讲的,它会自动加载这个 agents 点 m d 文件,所以我们再问这句话,他是一定知道的。看,这里有说我和 trump 之间的交易暗号是今晚打老虎,好的,那我们现在把这个文件给移除掉, 剪切放到第五课里面去,我们再重启这个 agent, 我 们再问他 看,他又不知道了,所以说很简单,那个文件是一个他默认会读取的文件。好的,那回到我们刚才说的个人规则,那现在我把课程四的文件夹放到我们个人规则下,那这就是我的个人规则目录粘贴进来, 那我们在课程四下启动,那这个课程四的文件夹是空的,大家可以看到,当我直接问他我和 trump 之间的交易暗号是什么,他就回答今晚打老虎 agent 在 启动的时候,他会默认去加载这个 agent dmd, 以及你个人目录下的 agent dmd。 所以 当我们想要去和他做一些长期的规定约定或者是共识的时候,我们就应该把自己的项目信息持久化到这个 agent dmd, 或者把个人的一些偏好信息存到这个 agent dmd 里面。 那我相信通过今天的演示,大家应该也知道如何去进阶的去使用 agents 点 md 文件。那这里还有一些的一点就是前段时间非常火的养龙虾,实际上 这个养字就比较传神和,因为很多时候你养的就是这个 agents 点 md 文件。当你有一个比较好的 agents md 文件时的时候呢, 那么 ai 所能产生的幻觉也会越来越少。那么今天的演示就到这里谢谢大家,希望大家也能去试一下自己的 agents 点 m d 文件。
粉丝955获赞3594

今天我们会完成桌面板打开之后的第一次设置,那么我们就开始吧。第一次打开 codex 桌面板,我们要先把界面分成三块来看,左侧是项目和一些插件的入口,中间就是我们的一个对话框了,最下面有一个设置面 板管理。对,那么我们新手进来要先处理几件事情,第一个工作模式,第二个选举指令,第三个批准策略,第四个沙盒,第五个插件入口。 ok, 那 我们先进到设置里面看, 在设置里面左侧有十二个分类,包括常规、外观配置等等。第一次使用我们重点来看这几个,我们先点开常规,常规的第一项就是一个工作模作,开发项目的时候,我们一般选择适用于编程, 你选择了这个模式,那么 codex 会更愿意指示文件命令验证方式。如果你平时是以日常工作居多,比如说是以文字创意等等,那你可以选择用日常工作。在下面的权限区域,我们要来看一个重点是完全访问权限,这里记得是关闭的状态,如果这个开关打开之后, codex 可以 直接编辑更大范围的本机文件,运行网络命令,它的风险会明显变高,所以作为新手阶段而言,我们默认把它关闭掉就可以了。这里的速度可以选择是标准还是快速, codex 会基于跟你的一个整体对话,给到你一个相应的建议,当然如果用快速的话,它的套餐用量也是会增加的,那么我们平时用标准就可以。 那接下去我们来看第二个重点是个性化的,这个选项里面有两个,一个是个性,主要是选择 codex 回复的默认语气, 我这里选择的是务实,希望它能够简洁、专注和直接。第二个我们要去关注的是自定义的指令,这里的自定义指令要知道它是局工作规则,所有的项目都会读到它。所以新手我建议你们只要写八行内容就可以,这八行内容我会放在评论区,当然我自己的会 更完整更长一些。我的结构大概是包括使用范围与优先级通用的一个工作流,安全与合规,通用代码规则,验证与测试提交的规范,常见的项目命令工具,然后输出的一个文本规则。还有一些个人偏好,对, 我觉得大家一开始就用前面的这个八行就足够了,后面当你越用越多。你可以跟 codex 去总结你们经常碰到的一些问题,或者是你自己觉得 codex 经常会犯的一些错误,你把它整理成对应的规则放进去就可以了好吗?它有一个记忆的选项,目前是实验阶段,大家可以把起用记忆这个给开启就可以, ok。 第三个重点是配置,我们来看一下配置的页面配置我们来关注两个内容,第一个是批准策略,第二个是杀核设置。批准策略一般我们都会默认的是 on request, 它的意思就是说当 codex 遇到高风险动作的时候,就会停下来让你确认。当然这里如果说你是用 never, 那 就相当于一次执行到底了,不需要你的任何的批准,所以我建议新手都是用 on request 吧。沙盒设置这里它的默认是 workspace right, 它主要在当前项目里改文件,允许网络访问,这里就是默认开启,你可以把这里的批准策略理解成为它是一个确认按钮,哪些时候需要你来确认?把沙盒设置理解成为 codex 的 活动范围, 你给它框定了一个能够编辑文件和改文件的一个范围,它就只能在这个范围里去进行一个行动。我们再来看一个大家比较容易忽略的一个点,或者是比较容易混淆的一个点, 就是在桌面面板的左侧有一个插件,这里的插件它其实包含了 skill, mcp 和 connect。 skill 是 工作流,是我们的一个技能文件,它里面包括一些代码审查、做表格、生成 ppt 等等。同时像 mcp 就是 codex, code 等等。 connect 呢,是第三方账号的一个连接, 比如说像这 eraser, git, a lotion 都会有,所以这里的插件其实它就是一个能力包的一个合集,像 m, c, p, skill, connect 这些都是它里面的具体的能力,大家根据需要去进行一个安装就可以。 ok, 那 我们再回到设置里面剩下的几个,我们只是来做一个印象, 比如说像外观,你可以基于自己的系统去定义主题色,浅色或者是深色,当然这里有一个隐藏选项,它有一个宠物,看到了吗?这个就跟 cloud code 是 一样的,就是最近出了一个宠物,当你选择唤醒它的时候, 你看它的右下角就会出现这样的很可爱的一个宠物形象来陪伴你头顶。 it 主要是来管理分支的,像浏览器使用和电脑操控,主要针对的就是 browser use 和 computer use, 在 我们后面也会去讲到像以规章和使用情况,就是你本地的一个任务的一个管理和一个用量的展示,平时经常的去看就可以了。

美好啊,朋友们,这是一期 codex 奶妈级的零基础系统教程,这期视频我会从安装开始,手把手地把 codex 的 基础能力到高级功能的组合,以及最新的手机端操作,用十个实战场景来带大家彻底拉通 以后这一类的 ai 产品,出一个算一个,你都会触类旁通,游刃有余。我也把这期的文字课间整理成了文档,那这期的含金量可谓是 biu biu biu biu biu, 一个点赞收藏关注是最起码的。好了,不多说,学费都交了吧,我们上课, 那在开始之前,我先说一下 codex 和 cloud code 的 区别。从本质上来说,它俩都是由编程 agent 逐步转向了通用 agent, 分 别是 ansapi 和 open ai。 这两家出的 cloud code 呢,默认使用 cloud 模型,但是我们可以自行替换成任意其他的模型,那在易用程度上, codex 桌面端的产品设计是会更友好的, 更适合零基础的白领工作者,而 cloud code 有 更高的自由度。在功能上, cloud code 原本是最齐全的,什么 skill、 mcp、 斜杠命令、 hock、 远程操控,这都是人家先发明的。但是呢,最近的 c c 更新稍微不如 codex 那 么快了,会更加偏向专业开发者一点。 而 codex 发了非常强的浏览器操控和 computer use, 还内置了最近的 image 二深图模型, 而且昨天还刚刚发布了手机端和 hock, 可以 直接用你的手机 check gpt 来控制电脑上的 codex 干 活。那价格和额度方面呢? codex 的 会员额度非常大方,二十到的会员就很够用,而且还不封号。 而 cloudpod 呢,大多数人可能都没法用它的官方账号基本上都得自行调用 api 的 费用属于是花多少用多少,风险由人。那在使用场景上,我个人喜欢用 cloudpod 搭配 cloud 模型来写作,因为 ops 四点六的写作和规划能力真的很强, 那 codex 的 执行和解决问题的能力也很强。日常的办公场景,我会选择用 codex, 那 在编程的时候嘛,我就两个都用上,所以结论是,入门的朋友用 codex 就 很强了,有条件的朋友呢,两个都来是最完美的, 不过两者的逻辑其实都是一样的,我们学一个,另一个也就会用了。那 cloud code 我 也做了一期系统教程,想拥有左膀右臂的朋友可以去看看。 ok, 正式开始 使用 codex, 我 们唯一需要准备的就是一个叉 gpt 账号,免费的也行,只是会额度稍微少一点。那有了账号之后,我们就直接去它的官网双击安装, 然后安装好之后登录我们的叉 gpt 账号,然后这些设置我们可以先随便选一点啊,选个日常工作,反正后续呢,我们都是可以改的。那搞定了, 那进来之后呢,大家会看到这个对话窗口,好像跟 chat gpt 是 很类似的。那我们打开两边的侧边栏也蛮眼熟的,左边呢,可以管理对话和任务的列表, 那中间就是聊天,右边大概是结果之类的吧,大家应该都能猜个七七八八,所以我们先不深究它的页面,我们直接开用,这其实也是我探索所有的 ai 工具的独门秘方。 我打开一个陌生界面呢,我先不管别的,我先找到我能对话的框,我先聊,先找到我能看得懂的按钮,先按,按着按着你就会了。你看看,独门秘籍都教给大家了,以后你们就是为师的弟子了。 ok, 众弟子不必拘礼,我们还是以学业为重啊。那我们第一个要了解的 codex 能力呢,就是本地文件操作, 也是这一类桌面端的 agent 跟对话 ai 最显著的区别和能力。因为过去我们用叉 gpt, 如果说我们要让它看到我们本地的内容,我们只有两种方式,一个呢就是复制粘贴到这个对话里,另一种就是以它允许的格式和数量把文件给上传上去。 但是 codex 不 一样,它可以自主地读取和操作我们的本地文件,而且不限数量。比如说我作为一个剪辑,我的本地里面存了八十多条视频素材,这都是我剪辑要用的, 但是呢,这个命名全都是乱的,完全看不懂,所以我想以这些视频的内容来命名,到时候我们看见文件名的时候,我们就知道这个素材是什么。那这事 check gpt 肯定是做不了的,但是 codex 可以 我们来看这两个地方,它都显示了一个概念,叫做项目, 我们选择一下,哎,一选择项目,他就让我们选择本地的文件夹了,那我们只要选中这个文件夹,那这个文件就是我们的项目了,里面所有的文件 codex 都可以自由的读取和操作, 当然这需要我们给他权限。大家看这里的权限选择啊,目前呢,我们是一个默认的权限,我们再点开,他有三种权限模式, 那默认权限的意思呢?就是在我们当前的文件夹内,他可以自由的去读写这些文件,但是如果他想要联网呀,或者是帮我们下载一点东西啊, 或者是碰这个文件夹之外的其他文件,那他是不行的,如果他必须要做,就会要向我们提出提高权限的请求,我们点同意才能继续。 那自动审查呢?顾名思义就是有个 ai 自动帮我们审查,由 ai 来判断这个操作危不危险,如果危险呢,就来问我们不危险的,比如说他去下一个知名的这种官方软件什么的,他就直接开干了。 自动审查比默认模式要更宽松和智能,建议大家选这个就完了。那最后呢,是完全访问权限,这意味着 codex 可以 在你的电脑上几乎什么都能干,它可以修改删除任何文件,它可以在任何位置执行命令,例如说它可能会去把你的 cloud code 给删了。 开玩笑啊,它一般情况下是不会这样抽风的。 ai 呢?也没有嫉妒情绪吗? 大家尤其是新手朋友就选择自动审查模式,相信 ai 就 完了,毕竟咱又能审的比 ai 好 多少呢啊,对吧? ok, 那 我们选中了刚刚的这个视频的文件夹,继续来提出我们无理的要求,让他帮我们把这个文件夹里的所有视频素材都按他们的实际画面来重新命名。哎,他就开始做了, 而且大家看他非常的聪明,他先看了看我们到底有多少个视频,然后他选择用抽帧的方式抽取关键画面来判断内容是什么,而且他还知道他不要一张一张图去看,他给拼成了缩略图的形式,一组一组的去看。 ok, 很 快啊,这个文件夹里面的文件名就全改变了。过程中呢, codex 也是没有向我们提全的,因为他都是在这个文件夹内去操作的。那我们也可以检查一下他都对应好了没有。 ok, 钢琴家音乐演奏厅,没错, 雪山近身格斗,没错,旗袍女人夜巷卖热饮哇!而且他的这个命名还遵循着一个序号,任务、场景、行动的一个清晰的命名格式。 ai 做事的这个细心程度啊,人类你不服不行。那另外呢,我们其实也可以在同一个项目里面去开多个不同的对话,它们的上下文都是不一样的,但是同样都可以随时的访问我们这个文件这个项目。 比如说,我们在另外一条对话,我们又给他一个不同的任务,让他想办法把所有关于风景的视频都剪成一整条。 哎,没想到吧,他真的能剪,他自己想办法,用了一些工具问我们要了一些权限,用这个 ffmpeg 给它拼在了一起,效果的确是关于风景的都剪成了一条。 ok, 那 如果我们要创建一个新的任务,我们其实也可以手动的在这边创建,他也会自动的在我们本地创建一个文件夹。 然后呢,我们跟 codex 对 话的整个过程, agent 产生出来的任何文件啊, pdf 啊,什么 markdown, ppt, 它都会直接存在我们本地的电脑上。 ok, 到这里,大家应该 get 了 codex 呢,可以随时地访问我们的本地文件,去读取内容,写文件,删文件,移动文件,文件夹里的内容也就成了我们的 codex 随时可以获取的上下文,那这里的项目也就对应着我们在本地的一个文件夹, 哎,那刚刚这么个任务会花我们多少上下文呢?我们只要看这里就能看到了。 那这个小圈代表的是我们现在的这个对话和里面的操作,一共使用了 gpt 五点五的多少上下文窗口。 如果我们把鼠标悬上去呢,它还会有更详细的一个信息,当上下文快满的时候, codex 会自动地帮我们压缩上下文。不过其实当我们一个任务告一段落之后,不用等它快满了,让它自动压缩,我们也可以自己通过斜杠压缩这个命令 来手动的去压缩上下文,这样呢,可以让模型更聚焦在我们的新任务上,也省一点上下文的额度。那当然大家除了这个对话的上下文余量,其实我们还想知道我作为一个免费用户,或者是我作为一个 pro 用户, plus 会员,我还有多少总共的额度可以用,对吧? 这个呢,有两个方式查看,一个呢是左边的设置,这里我们点开剩余额度,就能看到你五小时内还剩下多少,那本周内又还剩下多少, 甚至呢,也有什么时候到期会刷新的一个提示,这个产品的设计还是比 cloud 的 友好很多的。那另一种方式呢,就是我们可以直接在对话框里输入斜杠,然后找到这个状态, 那打开这个状态之后,它的绘画这里就会持续的显示我们的上下文余量,这个五小时和一周的限额。但再次说实话,这个 codex 的 额度还是非常大方的,二十到的额度我认为是可以满足大多数白领工作的高频使用的。 ok, 那 顺便呢,我们也介绍一下这里的模型选择, 那点开之后,我们可以选择速度,快速呢,就相当于加急通道,会消耗我们更多的额度。那这里呢可以选择其他模型,但是大家都选五点五,因为它确实更好用。然后呢,这里可以选择智能程度,其实呢一般中度智能就够了, 所以我们选高。 ok, 那 这个小麦克风呢,肯定就是语音输入功能了,比手打字还是要快很多的,但是呢,它的转录速度远不如大家去下载一个语音输入法,还是非常推荐大家用语音输入的 好。那现在我们通过一个本地文件处理的案例,也了解了 codex 上常用的一些功能。那 codex 的 第二大能力就是命令行工具使用。 其实刚才我们说到权限的时候就有提到,在默认权限下,它可以读写文件,但是却不能执行一些命令,一些联网的操作。那这些命令是什么意思呢? 刚刚的案例其实也已经用到过了,比如说它把视频抽帧出来,还把几个视频拼接到一起,它用到的 ffmpeg 就是 命令行工具。 还有一些我们熟悉的命令,比如说我们在终端里面来克隆一个 gitup 仓库,或者是大家近期比较熟悉的,我们在命令行里面输入一些命令来下载龙虾和各种依赖。那 codex 的 第二大能力就是在我们授权的情况下,可以使用我们的终端来替我们做这些事。 那我们就来让 codex 帮我们来安装一些平时对于小白来说非常复杂的东西吧。第一类,常用依赖,比如说什么 node gs 啊, git 什么的, 也是大家以后使用各种 agent 或者是做其他项目必备的一些工具啊,那之前大家要装这依赖都得去看一个手把手教程,然后照着命令抄,挨个装。那现在我们就直接跟 codex 说帮我安装个 node js 给他发过去, 也是因为这些东西呢,其实都是比较常见的东西了,所以在我们的自动审核的权限模式下,你看他基本上都不问我们要提权,就熟门熟路的帮我们装好了。 那第二类,就是那些爆火的但是有上手门槛的一些新的 agent, 比如说龙虾,爱马仕,甚至还有这个 codex 的 竞品 cloud code, 我 们都可以让 codex 帮我们装完了呢,它还能教我们该怎么用。那我们装一个 hermes 吧, 我其实都不需要给它官网和仓库链接,我就说最近有一个叫 hermes 的 agent 很 火,你帮我安装一个吧。 哎,他就会自己去搜索,然后帮我们判断到底是哪一个。然后呢,他根据官方的文档帮我们陆续的装好了,还帮我们验证过已经装好了,你瞧瞧,那我们照着他说的来启动一下试试。 哎,真的帮我们装好了,那往后的配置我们就不在这里继续了,但是大家应该 get, 有 了 codex 以后,那些复杂的要收你五九九的部署,你都可以直接让 codex 帮你做了,怒省五九九。而且我们在使用的过程中遇到任何问题,还可以截图去问 codex, 什么瞎死了马挂了,升级出现了问题都可以让 codex 直接帮你修,是不是很方便? 那第三类有点没那么必要,但它其实也可以,就是像 cursor integrity 这种软件应用, 平时都是我们去手动在网页上下载的,它也可以帮你下载和卸载。那大家用 codex, 我 其实也建议大家去下载一个 agent 的 ide 啊,因为现在 codex 有 个缺点是它没有办法打开我们的文件内容,直接去手动编辑。 虽然这个侧边栏呢,是可以看到一些文件结构和内容的,但是我们都没法编辑,所以大家可以让 codex 下载一个自己喜欢的,比如说我们就这样下载。那下好之后呢,我们再执行一个 git i n i t 一个初步化, 那右上角就会出现这个东西,随时可以把我们的项目在编辑器中打开,我们来手动编辑。 那第四类就比较重要了,就是 agent 本身会常用到的那些 skills 啊, mcp 啊和 selli。 那 skill 和 mcp 本身 codex 也是支持的,我们后面会详细讲到, 我先挑两个大家安装一下,方便我们后面综合起来来做案例。那这些 skill 和 c i 呢?通常来讲不像那些 get 那 种大项目那么著名,所以我们最好是找到它的具体仓库,或者是明确的官网地址。比如说我们下载一个专门找 skill 的 这个 find skill 哦,方式就是直接把链接拷贝给 codex, 然后跟他说帮我装一下这个 skill。 那 在他装的期间,我们也说一下 codex 的 另一大好处,并行任务处理, 我们完全可以在他做这个事情的时候再开一个对话,让他去下载一个别的。那我们下载一个飞书 c l i 吧。飞书 c l i 其实非常的典型, 因为现在呢,有一些积极 ai 化的软件,把几乎所有他在软件里能做的操作都做成了命令,让 agent 能够方便的去操作,我们把这个链接发过去,让他开始下载, 那这边呢,其实会显示每一个正在处理当中任务的情况,这个在转呢,就说明它正在执行中,那这个蓝色的点呢,就说明已经完成了,有时候还可能会出现一个需要你申请权限的一个标识。 ok, 那 这里 fan skill 呢?它是已经装好了,我们再看飞书 c l i 这边,它会引导我们去做一些授权, 我们就跟着它的引导去完成就好了。 ok, 那 装好飞书 c l i, 那 codex 就 能帮我们去做飞书里的各种操作了,比如说写文档,发消息,见日历,做表格什么的了,我几乎每天都在用, 好大功告成。我们就这么一个小章节,我们就用自然语言的方式让 codex 帮我们装上了 hermes node, 飞书 c l i 一 大堆东西,这就是 codex 作为 agent 的 第二大常用能力,命令行使用。 那这个能力和这个章节的演示也是希望大家能够 get 到一点,就是我们现在在电脑上想去做的很多很多事情,都可以让 codex 这样的桌面 agent 去做了。那 codex 的 第三大能力是持久记忆。 看过我那篇 cloud code 的 朋友应该都知道, c c 呢,有一个手动的持久记忆, cloud 点 md, 还有一个自动的记忆系统, 都是把我们希望 agent 能够长期记住的,比如规则、篇号和我们的信息之类的东西,以本地文件的方式存在我们的电脑上,然后事实的时候把这些记忆以上下文的方式注入到 agent 里去。那 codex 也是类似的,它也有这两套持久的记忆系统 在 codex 里面呢,手动的持久记忆文件叫做 agents 点 m d, 而且它也有一个自动的记忆机制,来我们打开设置,找到个性化, 那在这里的这个自定义指令实际上就是一个全局生效的 agent state md, 它会在我们任意的项目跟 codex 对 话的时候,它都第一时间作为上下文发给大模型,那我们可以手动地自己在这里写,不过我更喜欢呢,直接在对话中去跟 codex 说, 比如说我说一个,我希望你以后对非书文档里的任何修改都使用一个专属的你的文字颜色和用删除线的方式来修改,不要直接的修改。然后这个帮我寄到局的 a 正 c m d 里。 ok, 那 它这里呢,告诉我们已经写好了,我们再打开个性化这一块,就的确是多出来了这么一套规则,那实际在使用当中,它就会去遵循我们这个规则了。 比如说我这里已经有一篇非输文档了,我在侧面呢也评论了几个我想修改的地方,我直接可以把这个链接发给 codex, 我 让他根据我侧面的评论帮我修改一下。 那因为我们刚才确实已经装好了这个非输的 c r i 也都给他配置好了权限,所以 codex 是 直接可以操作我们的文档的。 ok, 看看它完成之后的效果。 果然他用了紫色的字和删除线的方式来帮我们做的文档修改,那这个呢,是局的 agent md, 适合记一些适用于所有任务的一些大原则,比如说我们的工作习惯,我们要说中文,我们的工作偏好修改文档,要留下这种修改痕迹等等等等。 那另一种呢,就是项目级的 agent md, 这个长期记忆呢,只在这个项目当中生效,我们可以选择一个项目的对话,然后打开编辑器, 自己在这里手动的创建一个 agent 的 md 的 文件,然后我们去写一些针对我们这个项目的一些规则, 当然也可以让 codex 来帮我们写。我个人的建议呢,是在这个项目文件里面有了一些内容之后,让 codex 根据他对我们项目的了解来自己帮我们写。那自动记忆怎么回事呢? 其实我们刚才在这个个性化这个下面我们也看到了,我们需要手动打开这个自动记忆功能, 它的机制是我们打开这个功能之后, codex 会在我们结束对话或者是结束任务,这个对话闲置一段时间之后,它帮我们把那段对话总结成记忆,然后记在一个地方。但是它有几个原则,第一太短的对话它就不记了, 那第二这个对话的总结它一样会消耗我们的额度,所以当我们的额度太低的时候,它也就不记了。 并且这个自动记忆文件呢, open ai 官方是不建议我们去手动修改的,顶多我们可能删一删有些没必要的信息,那这个文件大概是长这样 的,是一个任务,一个任务在记录的,主要呢会写上这个记忆的来源是哪段对话呀?以及它的工作目录是什么,那以及以后触发了什么关键词的时候,它会去召回这段记忆, 再往下呢,是用户在这件事情上的偏好大概是什么样的?那第五段呢,是一些可附用的一些知识,一些踩坑的记录,那这些内容都是 codex 自己记录的,并且以后也是会它自动的招回去使用的,我们就先不修改它, 它这个格式确实也不太方便修改,更多的时候我们对于明确的规则和要求,我们还是通过组织 agent md 来实现。那大家学完这些视频之后呢,我也想给大家再做一期, 通过组织不同层级的这种 agency md 给自己做一个非常懂你的,可以做不同类型事情的超级助手的视频,感兴趣的朋友可以扣个一。 ok, 那 第四大能力就是 codex 可以 直接用到 image, 二来生成图片。不过呢,深图功能其实是一个小功能, 所以这一章节呢,我们不只会用它的图片生成,我们会带大家做一个完整的个人主页的开发项目,并且在了解一些 codex 在 小白开发中的一些用法和功能。那我们再来开一个项目,叫做个人主页, 然后我们点开这个加号,我们把计划模式打开,因为我们要做一个网站嘛,任务会复杂一点,所以打开这个计划模式呢,他会先帮我们列出一个详细的计划,我们确认之后他再开始行动。 计划模式呢,比较适合我们的任务有一定复杂性,或者我们自己还没想清楚,可以跟 ai 讨论出一个计划。那假设我们现在就是第二种情况,我们其实没想清楚,我们直接跟他说我想做一个个人主页, 那你看他看到我们的项目中是没有内容的,所以他以这种选择框的方式来询问我们的细节,这些选项呢,大家可以按照自己的要求去选择,那我就选这个个人品牌吧。 然后如果说这些选项中没有我们满意的呢?我们也可以选到最后一个来填写我们详细的要求,比如说我要他修饰感,也要高级感,然后我选针对合作伙伴,不要个人照 中英双语,巴拉巴拉巴拉。这里真的是问了我们相当多的问题啊,那最后呢,他给到我们出了一个详尽的计划,问我们是否实施此计划,那其实基本的计划我们看着没有什么问题,但我们也可以补充一些调整方案。 比如说我们刚才就要说到了要用它的 image 二的生成能力,我们这里没有体现,我们加一句网页上要多用一些图片,使用 image 二来生成一些高级感的图片,然后我们一起提交。 哎,那他又问我们要走哪种高级感呢?我们如果点开这个小叹号的话,还能看到他说的这个风格到底意味着什么意思,这个产品的小细节真的是我很喜欢,那我们就选他推荐的吧。然后他出了一版新的计划,我瞧着没什么问题, 去吧。 ok, 他 就开始初识化这个项目来逐步帮我们生成了。那这个过程呢,肯定会需要一定的时间,在这个期间我再给大家补充一点点知识点。呦,他的第一张图出来了,不错,挺有艺术感的,果然是最强的 emoji 二,那我要补充的这个知识点呢,叫做引导。 如果说大家在 codex 执行一个很长的任务的过程当中,你觉得他有点跑偏了,我们是可以随时给他补充纠偏的,比如说我们补充一下图片的人味要更强一点,而且不要这么冷的色调。我是一个 ai 博主,然后我们发送出去, 哎,大家会看到他没有立刻打断我们的任务,没有发出去,实际上他在这里排队呢。那我们看到右边的这个引导按钮,他写着我们不打断模型运行,会在下次调用工具后发送过去。这个是非常好的一个功能啊,我们点一下, 哎,他就可以发出去了。这个功能呢,可以让 codex 不 用在错误的道路上一路狂飙,把我们额度都花光,也不会让它重新再跑一轮任务。那另外一个小功能点,我们找到一个已经结束的任务, 我们看一下这个 ai 的 回复,每个 ai 回复的下面都有一个这个按钮,叫做分叉 fork, 这个的意思是我们可以随时从这里开始去开一个新对话,非常适合那种前面聊的还好好的,上下文也非常有价值,但是我们再往下聊,就聊的有点叉劈了的时候。哦,还有个小功能,宠物, 我们点开设置外观,然后这下面就有一小对小宠物可以选,甚至呢,我们还可以点击创建,让 codex 根据对我们的了解来生成一个定制化宠物。那我们先点击唤醒宠物, 哎,就会在桌面上有常驻这么一个小桌宠,脑袋上会冒出来 codex 正在做什么的一个提示,别的呢?好像也没什么用。 ok, 终于在他跑了七七四十九分钟之后,网页完成了, 我们来看看效果,因为 codex 呢,有一个内置的预览浏览器,我们可以直接打开右边的侧边栏啊,我们还给它放大一点。 嗯,这个网页的效果确实是不错啊,不过呢,现在的 a 证呢,其实都有这么一手了,那它这个预览浏览器呢,还有一个好处,我们点击右上方这里的一个批注按钮, 我们就可以在这个页面上选中这里的具体元素去写修改意见,包括重新生成图片,比如说我们要这个 logo 放大一点, 然后 p 住这里这张图加上一个人物,好把这个删掉, 那然后对话框里呢,就会加上我们这几条批注,然后我们点击发送,它就会针对我们的意见进行修改了,是不是挺方便的?那我们现在项目有了雏形之后,我们再 call back 一下刚才说的 agent md, 其实现在呢,就是一个让 codex 帮我们生成项目级 agent md 的 好时候了,因为我们也有了一定的内容,我们就让它自己生成一下,我们打开编辑器看看, 不错,项目的背景,各种信息,各种规则,各种文件路径都已经写好了。那以后呢,无论我们在新开对话,还是我们的聊天记录都已经被清空了, codex 都可以通过这个项目级的 a 证书 md, 立马的了解我们的项目基本情况。 ok, 那 我们先保持这样,先不做精修了,我们直接准备部署上线,当然大家自己做的时候完全可以去打磨的更好,那网页上的这些信息也换成更真实的信息就好。 那我们现在要部署呢,就得要说到 codex 的 第五大能力插件。在现在的 codex 当中,插件大多数是让我们的 agent 跟外部平台、外部工具、外部服务连接的一个作用,它实际上就是我们所说的 skill, mcp, c l i 这一类东西的一个完整集合包,比如说操作邮箱、操作日历、操作 excel 啥的。那我们来点开左边的这个插件栏,我们看这里呢,已经默认帮我们打开了好几个内置插件了,比如说浏览器操作,还有 mac 专有的屏幕操作,还有 excel 表格, ppt 等等。 那他的插件页面没有中文翻译,所以我给大家把这些插件的具体中文意思,分别能干什么也都列出来了,大家课后可以按需装上,点这个加号就好了。那我们先翻到这个 coding 板块,因为我们想要部署上线嘛,通过插件会非常方便。 其实呢,这个 vassel 和 netify 都可以,我们点一个加号给它装上,那如果大家给它没有选上的,也记得要选上。然后我们再回到对话当中,告诉他们,我们想用这个 netify 把这个网站给我们部署上去, 我们大家也不用管他咋部署的,反正他需要干什么呢,他都会告诉我们的。 ok, 他 发现我们没有登录授权,然后主动弹出了这个登录的链接,那这里呢,建议大家用 tapp 账号登录是最方便的, 那登录完之后,他自己就知道我们已经登录好了,然后继续的帮我们部署,这就搞定了。这个链接呢,就是我们最后的网站了, 只要把这个发出去,别人就能访问你的个人主页了。 ai 是 不是个好东西,你说就这么两下子就干了,原来普通人花钱都不一定能干成 o k。 先压抑住我的这个老灯感叹。我们回到刚才我们已经装好的插件, 那其实这里呢,还有两个非常重要的内置插件,就是 browser use 和 computer use, 还有这个 chrome 浏览器, 那这些有什么用呢? browser use 顾名思义呢,就是 codex 可以 直接帮你操控浏览器,比如说它自己点击翻页截图,填写表单等等。通常呢适用于自动化测试前端, 当然也有比较无聊的用途,比如我们可以让 codex 打开这个 m b t i 做个测试试试, 嘿嘿,这样大家能够比较直观的看到它的一个效果吧。那这个鼠标呢,是它自己在移动,然后它是自己看了上面的答案在自己填写,然后填完这一页,它也会自动的翻页, 那随着它的一通操作,结果出来了,原来 gpt 五是 i n t j 啊,我说怎么跟我这么聊得来呢? ok, 那 这个 chrome 的 插件呢,也是控制浏览器,但是它控制的是我们自己已登录的自己的浏览器,它不会再新开浏览器, 那我们如果把它给勾选上之后,它会引导我们去 chrome 里面装一个插件,那装好之后呢,它就可以操作我们自己的浏览器了, 而且它有个好处,它是可以直接在后台执行多个页面的浏览器操作的,就是并不会占用我们的整个浏览器,我们不用真等着看它这些操作,我们该用浏览器干,别的我们可以接着干。 ok, 那 computer use 就 更厉害了, 它不只能够操控浏览器,连你电脑上的这些 app 它都可以操作,只不过呢,暂时只有 mac 有 这个功能。比如说我们新开一个对话,我们在加号,这里来看最下面的这个插件选项,我们手动地把电脑插件选上, 我们再来几个没什么用的奇迹引巧吧,帮我放一首九九年最火的歌,然后用我的微信给 qq 发条微信,说,请收下我一个点赞、收藏、关注,懂了吧? ok, 他 陷入了思考,然后他看到我们的应用都正在运行中,并且向我们使用了这个音乐软件。我们点同意看,这个就是 codex 自己干的啊。他帮我们搜索歌曲, ok, 音乐响起了, 但是他还有活,他还在问我们要微信的权限,我们也给他允许一下。 ok, 看他这个小鼠标,他正在犹豫着准备搜索点击,好朋友们失败了, 因为我上次都成功了,但是我估计现在微信已经开始严防这种 a 证的操作了,直接给我退出去了。 但是呢,他的确成功操作了这个音乐软件。其实我还让他操作了剪映,并且给我们的最新的项目加上了音乐。 那总之呢,意思大家都懂了吧,就是它可以操作浏览器,并且可以操作我们的电脑。当然,实际上我觉得它的操作效率目前来说还是稍微有点低的,我不太喜欢用这两个强大的功能。不过后面我要说的这个 skill 就是 我每天都会用的东西了。 那 skills 我 的确也已经跟大家说过很多次了,好学的朋友一定要去补补课。那 skill 本质上呢,是我们人为沉淀的一些可附用的方法、流程和工具的组合, 相当于给 agent 做某些具体任务的一些行动指南。那因为之前我们已经让这个 codex 帮我们装过一个叫做 find skill 的 一个原 skill 了, 所以后续如果大家想要去装,或者是找一些社区上的 skill, 都可以直接用 codex 拿语言直接让它下载。比如说我们下载一个必备的 ansapic, 那 个前端设计的 skill, 还有一个去 ai 位的,那我们这两个都发给他,等会儿都会刚好有用 欸,很快他就帮我们装好了。那以后大家想要下载 skill 呢?如果说遇到这个 find skill, 他 找不到的东西,也可以直接把链接发给 codex, 让他帮你下载就好了。不过我在 c c 那 期也说过,最好用的 skill 还是自己创建的,符合自己工作的专属 skill。 那 创建 skill 呢,也有两种方式,第一呢,就是直接告诉 codex 你 想要创建一个什么样的 skill, 通过跟他讨论打磨得出来一个 skill。 那另一种呢,就是我们接下来要演示的,先跑通流程,然后让它形成 skill, 这也是一种更推荐的做法。那比如说我们想做一个自动化写这类文章,并且帮它配图的 skill, 这种大家应该都看过吧, 那我们就得先通过一步步的引导 codex, 让它真正实现一个我们满意的文章。来我们新开一个对话。那正好呢,我们刚才不是装过这个 github 插件吗?我们可以直接先问它最新的 github 流行项目,热门项目都有哪些? ok, 它的确帮我们找到了一些,那我们再让它清晰地解释一下这些项目都分别是干嘛的。嗯, 那我们再让他挑其中新星数量最多的,来帮我们写一篇本周 get up 热门项目推荐这样的一篇文章。 好,那他写好了这一篇之后,我觉得稍微有点太人机了,我希望可以更口语化一点,并且我只想要五个精选的,那我们就告诉他,然后还要覆盖到这几个层面,那我们这里就可以用到刚刚我们下载的那个去 ai word 的 那个 skill 了,我们斜杠给它调出来。 好,那看到他的结果稍微优化了一点,但是我们还希望加一个我们固定的开头,我们的结尾,并且还要让他用上 image 二来帮我们生成一些配图。最后呢,我还希望他不要是这个格式,他要是一篇非输文档的格式,然后图文并茂的。 ok, 结果来了,他确实是有了,但是呢,我觉得这个配图不够丰富,于是我又经过几轮调整才觉得差不多满意。并且我还给他最后加了一步,要让他把这个飞书文档发送到指定的群里,让大家都来看看。 那最终呢,他的效果是这样的,果然发出去了。其实啊,如果想更加一步到位的朋友,也可以结合刚才我们说的这个浏览器操控,让他直接打开那个发布页面,直接就帮你发布出去。 那总之,我们对他这一套结果满意了之后,我们就可以直接让他把这一整套的标准和动作做成一个 skill 搞定了。那我们再输入斜杠,再往下找,我们就发现就有了这个 skill, 我 们可以直接这样手动地调用这个 skill, 也可以直接说生成一篇热门项目推荐图文这一类的触发词,也会让 codex 自动调用。 不过因为现在 github 上面实时的热门项目肯定是没有更新的,所以我们再调用一次呢,它大概率会写出差不多的文章,所以我们就不试了。但是大家都理解了吧, skills 呢,可以把我们经过验证调好一次的一整套流程和方法给它固定下来。 下次做这件事情呢, codex 就 可以按照这个方式稳定的输出。 ok, 那 下一个能力则是 mcp。 其实 mcp 现在已经用的不太多了,所以我只简单的示范一下那 codex 的 mcp 藏在设置里面的 mcp 服务器。 只不过小白看这个肯定是有点不太知道怎么填的,所以跟我们之前说的一样,我们最好的方式还是把你想装的那个 skill 的 链接拷贝给 codex, 让他自己装就完了。比如说我们来装一个 notebook lm 的 一个 mcp 发给他, 他就会引导我们来做授权登录,登录完就搞定了。那我们再试一个我存了非常多访谈视频的一个笔记本,我们来问一下他。 欸,那这样呢, codex 也就可以直接获取我们 notebook lm 上面的这些外挂知识点了。 ok, 最后一个 codex 能力是自动化定时任务。 其实定时任务本身并不稀奇啊,比如什么每天早上提醒我吃药,提醒我喝水这一类的事情,普通的软件也能做,但是我们把它放到最后一个说呢,就是因为它可以结合我们之前学到的各种能力,把一整套组合起来的任务,让 agent 定点执行 自动化,加上智能化和定制化方显美妙。比如说刚才我们做的这个热门项目图文的这个 skill, 我 们就可以把它设成每三天或者是每周,让它定时定点的产出一篇 dapp 热门项目推荐发出来。 那我们要创建自动化任务呢,其实也分两种方式,第一种就是选到这边的自动化面板,那它这里呢,有一些官方的参考视例了,不过大多数是跟开发相关,那我们选择新建一个自动化, 其实你看要填写的东西也非常简单,其实就是用提示词写好这些自动化是要做什么,然后我们可以在这里选好什么时候出发,我们也是可以自定义一个出发时间的, 然后这边就可以选择执行的模型和思考强度,最后点击创建即可。不过呢,我也还是倾向于让大家用第二种更简单的方式,就是直接在对话里跟 codex 说,那我们直接跟他说 帮我创建一个自动化任务,每周一早上九点自动化执行热门项目推荐的这个 skill, 产出一篇图文发到群里, ok, 那 我们在看自动化这里,它就已经帮我们设好了这个任务,我们随时也可以去改变它的时间。 再比如当你的这个邮箱插件 github 飞书都已经连上了 codex, 那 么你也可以让他每天下午六点帮我汇总日历上完成的会议, github 上面的提交记录和我的邮箱回复记录,生成一份全面的工作日报。 最后手机操控 codex 设置方法非常简单,手机上的 check gpt 和电脑上的 codex 都把它更新到最新版。之后打开手机上的 check gpt, 然后点击侧边栏的那个 codex, 它就会提示你允许这台手机控制你的电脑,直接就搞定了。如果你有多台电脑的话,也可以给它分别连上。这就等于你不管在大街上、地铁上还是朋友聚会,都可以随时随地地用手机下发一个任务,让 codex 在 你的电脑上干完一个活, 它就更像一个可以跟你远程协助的同事了。这个功能呢,目前免费版也可以用,但是主要能连的是 mac 系统的 codex。 好, 那到这里 codex 的 所有核心能力我们就全部过完了。来我们回顾一下。 codex 呢,可以操作我们的本地文件,可以使用我们电脑上的终端命令行工具。它还有两种构建持久记忆的方式,它还可以生成图片,而且它可以通过计划模式来做一个完整的项目开发。 那它有丰富的插件,可以操控浏览器和电脑,还可以把知识和流程沉淀成可附用的 skill 技能, 它可以使用 m c p 连接,外部它还可以设置自动化的定时任务。不过其实比起这些功能本身,我也希望大家记住两件事,第一就是我们真的有很多事情是已经可以交给 agent 做了。 那第二呢,就是我们已经从问 ai 的 阶段走向了管理 ai 的 阶段,因为过去我们使用 chat gpt 就是 有问题了,我们问一下,然后得到答案我们就走了。 那现在使用 codex 这类的 agent 呢?每个人都得像领导一样,帮他准备他所需要的上下文和工作环境,给他指明一些任务目标,然后来检查他的计划,监督他的过程,验收他的结果。 那同时领导还要负责把好的方法和流程沉淀成可付用的技能,把反复要做的事情设成自动化执行的规矩。好了,恭喜大家今天都升职了,记得点赞收藏关注我们下次见了。

hello, 大家好,我是肖少,今天给大家分享一下 codex 怎么接入 deepsafe v 四 pro 的 模型,我看网上都是分享 cloud code 怎么接入 deepsafe 的, 几乎没有分享 codex 怎么接入 deepsafe, 今天我来分享一下。我们打开 deepsafe 的 文档,在接入 a 帧的工具这个地方,我们先看它这个啊, cloud code 库里头 我们一直放到最后是没有 codex 的, 这也就是为什么网上大部分都是分享怎么接入 codex, 因为接入 codex 有 官方文档, codex 接入 deepstack 的 话,我们需要用到两个小工具,一个是 c switch, 一个是 c c x。 这边先给大家安装一下 c x, 找到一个就是自己合适的目录,创建一个 c x 的 目录,我用的是 mac 啊,然后这边是给大家准备的工具,有 mac 的 一个 windows, 然后就把这个 c x 啊放到这个 c x 的 目录里边,然后以及这边有个疑问, 给大家打开看一下,这个英文的是一个配置文件,对,这边是我配置的一个本地的 k 啊,一二三四五六,大家直接用我这个就行,这个是一个本地的 k 啊,好的,我们进到 c c x 的 这个目录,通过中单 最大化,我们给 c c x 加下权限, 然后点杠运行它。好的,这个 local host 是 一个本地的页面,我们在浏览器打开 这时候你第一次进,它会让你输一个密码,这密码的话就是这个地方, 我写的是一二三四五六这个地方啊,你也可以直接用,也可以改一下。对,这边你输入密码之后,然后我们选到这个 codex 啊,我这边是加了一个啊,我教大家怎么加,在这个地方点击添加渠道,大家一进来可能是英文啊,这地方可以选中文。 好,这边点添加渠道,然后这边就输入你的这个 dbc 平台,我们找一下啊, 我们复制一下 d p c 的 这个 base u r, 然后粘到这个地方,下面它还需要一个 api k, 然后在这个地方我们创建一个自己的 api k, 然后给它粘上去就可以了,给它粘到这里,然后详细配置这个地方我们选 open ichat, 这里规范非常建化,这个地方给它打开, ok, 点击创建就可以了。我不创建啊,因为我已经创建过了,下面我们打开 cc switch, 然后我们在这个地方点击添加 这个地方 api k, 就 写我们刚才的一二三四五六啊,就写你自己的那个密码,我这边设的是一二三四五六,然后 api 的 请求地址来我们找一下,是这个 local host 三千杠 v, 然后这边我们获取一下模型列表, ok, 可以 看到获取到两个模型, 一个是 deepsea 微斯的 flash, 一个是微斯的 pro, 我 们直接选微斯的 pro 就 可以了啊,往下滑一点,把这个一照,上下文窗口点上,然后点添加即可,我这边就不添加了,我已经添加过了,添加上之后,然后这边点起用, 这就可以关闭了。当我们配置完成之后,这个时候你重启你的 codex, 这时我们进来的话,它就是使用 deepsea 大 模型,来我们给它对话一下。你好, 来我们看一下啊,这边可以看到模型使用的是 deepsea v 四 pro, 没有问题啊,这样 codex 就 可以直接使用 deepsea 的 v 四 pro 模型了啊,你也赶紧去试一下吧,记得回来交作业。好的,下面给大家说下第二个问题,这个地方的名字怎么改? 然后打开它的这个配置文件啊,它的配置文件是在这个 user 目录下的这个 codex。 哦,它是一个隐藏目录啊,这个要打开,进来之后找到它的这个 configure html, 然后我们打开 好,默认的话是 custom, 然后我这边是给它改了三个地方,一个这个地方使用的地方 改成 d p c, 一个是这个 name, 这个你们可以改成自己任意喜欢的单词,改完之后重启一下你的这个 codex。 下面第三个,我说一下它这个对话怎么给它删掉,我们右键之后发现它没有删除,只能归档, 然后归档之后它就可以删了。然后我们怎么删呢?在这个地方还是这个 directx 这个目录下面找到这个目录,然后进来就可以看到,这个是我刚归档的日常对话,这个地方我先不删,给大家验证一下。归档完之后它会在这个地方 已归档的对话。对,你可以取消微档啊,我们不取消微档啊,我们直接给它删掉 删除。哎,我们这个时候再进来验证一下。 嗯,暂无给他聊天。好的,这就是本期视频的全部内容,我们下期视频再见。

好,我们一起来看一下 codex 呢,在五月八号进行了一次最近的更新,增加了一个昆姆扩展的插件,那这一次呢,我们一起来看一下这个插件和相比于其他的方式去操控昆姆有什么区别?好,我们直接点击这个电脑操控这里呢,大家可以看到这个会有存在一个 啊昆姆插件这么一个选项,就是我们点击管理可以看到增加了非常多的配置,比如说像权限历史记录下载上传,那这里呢提供了非常丰富的这种权限控制。嗯,我们可以通过 安装这个插件和 codex 呢进行建立关联,这时候可以看到我们的这个 codex 呢就连接上了当前这个浏览器,那出现了这一个绿色的图标,就说明我们的 codex 呢已经可以完全的托管这个浏览器了。那我觉得这是 codex 呢像全自动操控浏览器迈出的一步哦, 我就挺有趣的,所以今天给大家做一个分享。那如果你把这个开关打开之后呢,接下来呢我们就可以直接去操控了,但是你会发现一个小细节,就是如果你是在国内的环境下,你就直接点击这边去打开呃,安装插件的界面,你会发现这个商品并不能够安装,所以大家呃可以通过我提供的这么一个压缩包去进行补充这个 啊插件,好吧,呃,我们来往来看啊,首先我们来看一个很容易被大家混淆的东西就是,嗯,目前 codex 本身来说是有浏览器,那他操控浏览器和我们的这个插件有什么区别呢?比如说我们在这个 codex 中使用软件到一般是这边新建一个窗口,在侧边会有一个浏览器的选项,那其实这也是我们的第一步,就是我们的这个呃, in app browser, 这是我们的一种内置浏览器,它本身来说是用来调试的,用来开发的,所以和我们 这个插件更新是没有任何关系的,所以大家不要搞混了。那第二种呢?叫做 browse user, 这个是用来操控类似浏览器的,这是相当于前面的这个 in app browse 呢,又往前走了一步,比如说我们在这个设置这边呢,哎,去又往前走一步,这有一个,这个什么有一个啊? browse user, 它可以让呃我们 的 codex 呢去操控这个类似浏览器,去完成一些操作。好,那也就是第三种呢,就是我们刚刚现在讲这种叫 chrome browser, 它可以帮助我们进入真实浏览器状态,去操控我们整个浏览器。 那有小伙伴说了,那其实我的这个 pry white mcp 也可以操控浏览器,或者说我这种外置这个 computer user 也可以操控浏览器,那和这个有什么区别吗?而且区别很全面,对吧?呃,区别的话,呃 computer user 呢?它本身来说它并不是浏览器的插件,对吧?它是一个操控电脑的 g y 能力的 这种插件,比如说它可以通过你屏幕去操控你调出那些图形应用,就比如说我们现在常见的这种,呃剪辑应用,对吧?微信,对吧?它都可以操控,但是你如果单独的话去操控这个浏览器的话,显得并不那么智能,所以 codex 提供了一个新的能力,就是这个 codex com, 那 我们可以通过这个 codex com 去完整的操控我们整个浏览器。举个例子,比如说我现在想让他看到我们整个这个浏览器上有多少个标签页页,对吧?我们就问他,我说,哎,现在当前浏览器上有哪一些 这个标签页?比如说你看是吧?他可以告诉我们现在到底有哪些标签页,我又让他在第一个标签页输入 a, 第二个标签页输入 b, 也可以,我再让他把某一个标签页固定也可以,就能够做到很多之前做不到的一些事情 啊,分的更加的细了。那如果说你细心的话,你会发现,呃,这个插件它其实包含了很多细节的功能,比如说他通过这个插件和 codex 进行关联之后呢,就可以直接在 codex 里面去操控浏览器的所有权限,比如说审批,对吧? 比如说历史记录,你可以让他看到你今天到底有哪一些详细的记录,包括你上传哪些文件都可以使用它,比如说你允许上传哪些,允许下载哪些,都进行了完美的这种配置啊,对吧?非常的清晰。好,那接下来在最后我们想跟大家聊一下,就是为什么要使用这个呃,这个酷路亚 插件呢,对吧?为什么不直接使用 pro white 的 能力呢?其实很清晰啊, pro white 的 本身更像是一个外部的这种工具,而这个呃 这个 com 插件呢,是一个内置能力,如果说你使用这个的话,你会发现其实很多东西它都需要一步一步的去哎,去跟他讲,去分析,那它通过这些 m、 c、 p 的 能力去一个一个去提供。那如果浏览器更新了呢?它并不啊 同步更新,但如果是 codex 呢?它就同步更新的,它更像是一个完整的产品,对吧?也是 codex 官方提供的真实浏览器的一个执行通道。 而 pro y m c p 呢?它只是一套通用的浏览器自动化引擎,对吧?所以呢,你可以相当于它是一个小缩放。而这个,呃, codex 捆绑插件呢?还是更像是一个完整的企业级的真实软件的一个执行通道?它也可以通过现成去控制,并且呢,能够降低了很多我们调试的成本, 比如说我可以让它去帮助我去做一些自动化的事情,对吧?是吧?非常的方便。好了,那以上就是这几个的区别,我是小刘,那我们下期再见。

codex 使用中如何节省 token? 一个任务开一个县城,不要一个项目长期用同一个巨长县城, 县城变长时用 compact, 官方说明 compact 会把可现对话总结以释放 token。 codex 也会自动压缩对话,但长任务里主动用更稳。把长期规则放进 agent dm do a skill 不要每次 point 都重复贴一大段。 官方建议 agent 点 md 自动加载进上下文 prompt, 并强调短而准更有用。重复流程应做成 skill。 agent 点 md 要短, 官方明确说短准确的 id 比长篇模糊规则更有用。太大时把专项规则拆到任务文档 skill references 里,按需读取。 大仓库里明确指向文件目录 chronicle a goal context constraints 当问并点名相关文件,能减少 codex 大 范围搜索读无关文件的头衔。 大量工具或外部信下博不要全塞 post。 官方建议用 m c p host tools to search, 把外部信息作为工具按需取,而不是复制粘贴进上下文。

codex 太厉害了,给你们看一下啊,就是我跟他说我的需求啊,就是自动化生成图片,然后对应的 cds 二点零的分镜提示词,然后直接生成视频,你看这个流程,直接他就能帮我做了啊, 他先让我啊,登录授权我们这个呃节目的账号啊, 然后我登上去之后啊,他说让我确认,我说我的意思是用 image 二模型生成图片啊, 就是目前来说最强的生图模型,然后好,他用了 gpt 的 生成了这四张啊图片看,然后他就写好了这个完整的分镜提示词, 点进来看一下啊,我对他这一版其实是不是很满意啊,我就又上传了我的塑身形象和这个音频音色一起给他生产啊,他就直接啊添加进去后啊,升级后的,其实是看见没有啊, 他的运镜啊,他的音频音色,还有啊他的模型啊,比例, 分辨率描述,他都会一并成交,让我确认,确认之后,好,你看八分钟之后生成完成, 虽说非常的厉害。你看到这边我自己来剪一下。看这套新中式 主楼加旁边小院房,一进门就是双层挑空门厅气场一下就出来了,面宽十三米,进深十一米五,屋檐声带一亮,晚上比白天还好看。细节看这里,门厅线条,灯光,院子比例,这房子盖的讲究,老家准备建房的评论区打别墅,我把这套思路讲给你听, 怎么样,是不是非常的厉害,就是现在哦,如果说你还没有体验过这种 and just give 就是 这种自动化的啊, 模型就真的是,呃,你现在所有的工作方式都可以通过它给你复制出来了,不信你你问一问他,他都能给你复制出来, 真的。所以如果你还没有体验过的可以好在评论区啊,打个一啊,或者说想体验我会教你怎么去做。我真的想在 ai 时代啊他们大家一起无限进步啊。

多人会把 codex 当成更会写代码的聊天机器人,但他真正的定位是面向真实项目的任务执行 agent。 他 接到的不是孤立问题,而是一个需要推进的目标。围绕目标,他会读取项目上下文,理解文件结构,然后判断要改文件、跑命令还是调用别的工具。他能处理代码,也能参与文档数据配置和自动化。 目标进入上下文,经过工具调用,再走向结果验证。所以 codex 的 变化是从回答者变成任务推进者,这才是能把事做完的核心含义。编程 a 整最重要,不是因为代码本身更高级, 而是因为现代工作本来就运行在软件和流程里。资料在文档里需要阅读、归纳、重写和结构化。数据在表格数据库或 api 里 需要清洗和核对流程。在工具链里,需要调用接口、网页和脚本,决策来自日制测试、预览和结果反馈。 代码只是最清晰、最容易验证的任务主体,当 ai 能操作工具链,它就开始接手任务执行,这就是从回答走向行动的关键。迁移。 codex、 hermes 和 openclo 可以 放在同一条趋势里看。 codex 的 重心是项目目录和代码仓库,他擅长读文件、改文件、跑命令、做验证, 所以它适合工程研发、自动化脚本和项目交付。 hermes 更向多工具工作流的任务编排层,它连接浏览器、文档和系统能力。 open core 更靠近通用电脑操作,它强调跨应用、跨页面、跨工具完成任务,三者形态不同, 但都让 ai 进入可执行环境,这意味着 ai 不 止说话,而是真的开始动手。可靠的 agent, 重点不是一次深层漂亮答案,真正重要的是形成完整的工作闭环。先理解目标,读取任务说明和约束条件, 再判断这件事需要哪些工具配合完成,然后读取上下文、项目结构、关键文件和配置。 执行时可以编辑代码,也可以修改文档,还可以调用命令脚本、 api 或浏览器工具做完以后要通过测试日制和预览验证结果,最后汇总改动交付文件路径、结果和风险。 agent 的 的可能性来自发现问题后继续修正,这比一次性回答正确更重要。 codex 和 cloud code 都可以叫编程 agent, 但比较重点不只是看谁,更会补全代码, 真正要看是谁能稳定完成真实任务。 codex 来自 openai, 强调模型能力和产品入口。 codecode 来自 entropic, 也面向开发工作流,二者都会处理代码,理解命令型协助和工程任务, 但产品决定你在哪里使用它,底层模型决定它能处理多长多复杂的任务链。未来差异会体现在上下文理解和工具调用上,也会体现在多阶段执行和验证闭环的稳定性上。同一个 codex 可以 通过不同入口进入工作, c l i 灵活,可组合,可脚本化。它适合自动化批量处理命令型、流程和 ci, 但它也要求用户理解命令权限和环境。 ide 扩展离代码最近,适合编码重构和调试。桌面 app 更像独立工作台,适合长练任务。它也适合多项目切换和多任务并行。 cloud 或 web 启动成本最低,适合快速适用,但它会依赖网络和浏览器环境。四种形态不是高低关系,而是不同入口核心是让 codex 出现在任务现场。选择入口时,不要按名词听起来高级来选,要按任务真正发生的位置来选。 日常编码、补全、重构和调试。优先 ide 扩展,因为它离代码最近,适合高频、小不修改。 自动化脚本批量处理和 ci 优先 cli, 因为它能脚本化,能组合,也能沉淀流程。 独立开发多项目并行和长列任务。适合桌面 app 快 速使用、临时咨询和清量任务。用 cloud 或 web 跨工具任务,可以考虑 hermes、 open call 或 mcp, 让 a 整只进入浏览器文档表格、 api 和本地工具。 经验法则是任务在哪里背,整子就在哪里。最后搜述到一句话, codex 的 价值不只是写代码,它真正的价值是让 ai 接管完整任务链。目标层要理解你想完成什么,还要判断约束风险和交付标准,并把模糊需求拆成可执行步骤。 工具层进入文件系统终端,浏览器 api 和 m c p 也进入文档表格日制测试和预览。 执行层负责修改内容、运行命令、处理数据,并根据反馈继续修正。判断标准是他能否读懂上下文并调用正确工具,还要能验证结果并推进到可交付状态。 hermes 和 open crawl 代表更广泛的工具执行方向, codex 则是工程场景里最清晰的入口, 从会写代码到能完成任务,这才是 a 阵的变化。如果你想继续了解智能体工具,欢迎关注这个系列,后面会继续拆 codex、 hermes、 openclaw 这类工具,也会讲它们如何进入浏览器文档表格和本地流程。回到主页可以查看更多智能体工具内容。

hello, 大家好,下班了。呃,今天背景不是公司,是因为,呃,在公司的时候当然车来了,没有来得及录,然后最近一直在高新路的使用 codex, 想要说我们用 codex 尽可能的提高我们开发效率,一个人顶五个人,六个人,十个人,牛马。 呃,然后最近 q 代像现了一个新的功能,叫做 go 模, go 模式 g o a l 目标。然后首先需要你的 c o i q 代 c o i 得在零点一二八版本级以上才可以使用它,并且要在 config 点 t o m l 文件里面把 go 改成 true 才可以使用这项新功能,那这个功能还在实验阶段。然后我理解它特别像是一个升级版的 sub agent, 就是 我们之前。 呃,如果你有完,为了完成某一个目标,你需要开多个 a 阵去执行不同的任务模块,多个任务可以最终为这一个目标服务的话,我们会使用 sub a 阵的模式,但我一直感觉 sub a 阵的模式其实不是很好用。 然后我今天刚好又有一个新的需求,就比较适合,感觉比较适合使用 sub a 阵去进行,但是之前一直是 sub a 阵的效果不是很好,刚好上线了一个 go 模式,所以呢,我打算使用它。 然后我的这个任务背景是这样的,我为了实现一个目标是可以把我的 app 去的它的它的这个,呃, apk 发版去做一个自动流水线 pipeline 以及呢?呃,我的后端可以去管理。呃, 我发版的版本号,这样的话我的 app 是 可以知道我需不需要去 做本地的 apk 更新,然后去请求这个版本号做一个比较,就这个需求,然后 所以它基本上分为三个模块,第一个是 app 端要去做兼容,你得去能够自动的识别,我目前的版本是低于还是说最新的啊?然后呢去给出下载链接,然后去自己去更新下载更新,这是第一个 app 端,然后第二个呢是 后端,后端得去新增一些接口。那肯定是要啊更新我的 a p k 版本记录,然后呢去检查是否需要更新,以及我的后台界面,还需要去做一个发版记录的展示。 另外就是需要在我的云端仓库,我使用的是 git, 然后 git 有 一个 git go 功能,这个功能可以自动地去根据你啊你的,你可以在项目仓库里面去的 web flow 目录下写一个 webmail 文件,这个 webmail 文件里面就声明了你的 pipeline 是 怎么样子的, 然后基本上就是这这这三大块儿后端 app 端还有我的 pipeline 流水线的建立。然后这三个任务,我让抠带写了三份 prompt, 然后一次性发给一个 go 的 上下文,然后去执行,然后大概执行了七八分钟之后, 效果还是很好的,然后基本上就达到一个可用的状态,所以,呃,我觉得这个 go 模式大家可以多多用起来,虽然现在还是一个 experiment 的 状态。对,那今天就录到这里,拜拜。

国内用户如何使用 codex? 这个视频我将教大家不需要解决网络问题的情况下完美使用 codex 软件, 避免使用 codex 时提示输入手机验证。我们需要准备两个软件和一个网站,那两个软件呢?分别是 codex 和 cc switch, 一个网站就是我们要选择接入哪个模型,或者是我们使用的 api 中转站。首先我们可以到 codex 官网来下载,我们可以直接打开这个网址,国内用户是不需要上网环境就可以打开的, 打开后我们可以直接下载,如果你是 windows 电脑,这里会出现 windows 的 版本, 我们直接点击下载就可以。第二步,我们打开这个 cc switch 的 github 仓库,我们可以直接输入这个网址来打开,在这里我们选择下载它的对应版本,点击后我们向下滑动, 在这里我们可以找到不同的客户端,我的电脑是 mac, 所以 我选择 mac 版本,点击后直接会下载 这里你如果没有配置好上网环境的话,下载这个客户端会比较慢,那我在这里已经帮大家下载好了,并且已经上传到了云盘,如果需要的话,你可以在评论区留言,下载好后我们正常安装就可以。 现在我们打开 codex, 现在我们可以看到它,让我们选择登录,这时如果你没有上网环境的话是无法使用的, 那现在我们就用到了第二个软件 cc switch, 我 们正常安装 cc switch 后,我们选择打开它。 打开这个 cc switch 后,我们看最上方的这一栏,我们选择 codex, 在 首次配置时默认是只有最上方的这一个官方 api 的, 下面这三个都是我自己配置的,那如何配置自己的模型或者 api 呢?我们点击这个加号, 在这里我们可以选择不同的供应商,也可以自己填写供应商的名称。那我这里以这个 ai go code 的 这个 api 网站为例,点击后我们看到这里的参数,它已经帮我们设置好了, 我们现在只需要填写一个 api k, 那 我们可以打开它的官网,在这里我们点击登录或者注册,如果首次使用的话, 它是需要充值额度的,充值好后我们可以点这个 api k, 然后在这里我们可以看到这个 codex 有 不同的两个分组,我们可以选择这个速度更快一些的,或者性价比更高一些的。 我们点击这个创建,可以给这个密钥起一个名称,然后点击创建,这时它会生成一个密钥,我们选择复制,然后把这个密钥粘贴到 cc switch 中, 我们选择添加,添加好后我们在这里点击起用,这时我们再将 codex 重启一下, 这时我们就可以看到他现在可以正常使用了。这里我全程都是使用正常的上网环境,我们来测试一下,帮我生成一张,欢迎大家点赞收藏。评论的图片要求十六比九的比例, 它现在已经按我的要求可以正常对话,并且可以生成图片了,而且调用的还是最新的 emoji 二模型, 并且全程不需要登录,不需要其他的上网环境。我们接入第三方 api 的 话,也是用多少花多少。这个方法主要是针对那些没有上网环境的同学, 如果你在安装过程中出现了任何问题,都可以在评论区留言,我会给大家逐一回复, 下个视频我将教大家如何具体使用这个 codex, 它和 cloud code 有 什么区别?我们下个视频见,欢迎大家点赞收藏评论。

最近有个说法挺刺激, codex 更新之后,有些能力已经超过 cloud code 了。真的假的?我觉得这个问题不能直接回答, 因为你先得问清楚,你比的是谁更会写代码,还是谁更像一个工程团队的操作台。接下来几分钟,我们不站队,拆开看,看完你大概就知道为什么这次 codex 的 变化不只是模型变强了。 以前聊 ai 编程,很多人默认 cloud code 是 标杆。它在终端里很顺,能读代码库,能改文件、能跑测试,开发者的心智负担很小,你让它修一个 bug, 它真的像坐在你旁边的工程师。 但最近 cloud code 新后,社区里开始冒出另一种声音,怎么感觉 cloud code 某些地方更爽了?有人拿它和 cloud code 对 比,有人说自己被 cloud code 搞崩后换了工具。先别急着下结论。 这个争议真正有意思的地方,不是 cloud code 赢没赢,而是大家发现 ai 编程工具已经不是一个命令行聊天框了。 如果只拿一个 bug、 一个重构、一个 delete code 题去比,你很容易比错,因为那是在比底层模型的局部能力。这个当然重要,但它不是全部。 现在的 coding agent 更像一个小型工程流程,它要理解需求,要改代码,要跑命令,要看浏览器,要处理 pr, 还要知道什么时候该停下来让人确认。你看,问题一下就变了,不是谁补全的更准,而是谁能把一件工程任务从头推到尾。 这也是为什么很多人会觉得 codex 这次不一样,它不是只在代码框里变强,而是在代码框外面长出了手脚。 codex 最近最关键的变化是产品形态变大了, openai 官方把它讲成一个可以委派真实工作的 agent, 它不只是改文件,还强调多 agent 工作流,内置 worktree、 skills、 automations、 pr review、 多文件、多终端、远程 devbox, 内置浏览器,甚至电脑操作。 注意这些功能单看都不神奇,但放在一起,味道就变了。以前你让 ai 写代码,更像叫一个人坐到你的电脑前。 现在你可以把任务拆成几路,让不同 agent 同时跑,一个修 bug, 一个写测试,一个看前端页面,一个整理发布。说明,这就不是代码助手了,它更像一个工程指挥台。这个词有点大,但很贴切啊。克拉多瑞弱了吗?不是,克拉多瑞的基本盘还是很硬, 它的优势是终端原声跟开发者每天用的工具贴得很近。你在项目里打开它,它读代码,跑命令,用 git 接 m c p, 很多动作都在你熟悉的命令流里发生。它还有一个很重要的,气质,谨慎, 默认,会问你哪些命令能跑,哪些文件能改。这对真实项目很关键,尤其是老项目、大代码库、线上事故这种场景,你不一定想要一个到处乱点的全能 agent, 你想要的是一个懂代码、懂命令,还愿意听你刹车的人。 cloud 会有,在这块儿还是很舒服。 codex 更容易赢的地方是任务开始变宽的时候。 比如你不是只要修一个函数,而是要做一整个小功能,先看需求,再开分支,再改前端,再跑测试,再打开浏览器确认视觉,再写 p r 描述。这里 codex 的 优势就出来了,它可以把文件、终端、浏览器、工作区放在一个工作台里,还能让多个 agent 并行。更关键的是, 它不止服务程序员,文档、表格演示、自动化检查,这些原本不算写代码的东西,也能被放进同一个流程。说白了, codex 强的不是某一权特别重,而是它开始会组织一套组合权。 这是很多人突然觉得它反超的原因。但如果你的工作方式很终端很连续很工程师, cloud code 还是会让人上头。 你在一个复杂仓库里追依赖,看日制、改测试、处理 c i, 它的节奏很自然,它不像一个大平台,而像一个强力命令行同伴。还有一点容易被忽略, cloud code 的 简单反而是优势,入口少,心智清楚。很多时候,你不用管理一堆 agent, 也不用想工作台怎么摆, 你只要说帮我把这个问题修掉,它就顺着代码库往下钻。所以我不认为 codex 全面超过 cloud code。 更准确的说法是, codex 在 工程流程组织上开始领先,而 cloud code 在 终端深度开发上仍然很强。所以这次真正值得关注的不是 codex 有 没有把 cloud code 打趴下,这个说法太粗糙了。 真正的变化是, ai 编程工具正在换赛道,第一代比谁更会补代码,第二代比谁更懂代码酷。现在开始比谁能组织工作,谁能并行,谁能跨工具,谁能长期跑,谁能在关键时刻把权限交还给人。 以后程序员可能不只是写代码的人,而是调度一组 ai 工程师的人。听起来有点夸张,但说实话,这一天来的比我想象中快。

只需几天,你就能学会 ai 的 玩炸工具 chat gpt 出品的 codex, 你 信吗?很多人觉得像 codex 这种 能接管电脑的超级应用,肯定是给程序员用的,自己搞不定。其实呢,门槛真的没有你想象中的高。只要你会用 chat gpt 或者豆包之类的对话框, ai, 花点时间转变一下思路, 你就能把 codex 调教成一个极度贴心的私人超级助理。等你用顺手以后,你会发现他什么活都能接, 跑几十张发票算账,去邮箱翻找客户邮件,跨软件做 ppt, 甚至帮你盯着竞争对手的网页。 之前会不会写代码根本不是关键,核心在于你有没有意识去把任务拆解,把重复动作打包。今天这个视频主要是想带着非技术的同学快速上手这个 open ai 推出的 ai agent 的 超级应用。 从云端回到本地,不写代码的同学习惯了查 gpt, 第一步往往不太适用 codex 的 存储逻辑。以前你是在网页上对话 传的文件都存在云端,但在 codex 里面,你给他的文件以及他生成的所有文件,全部都直接保存在你自己的电脑本地。 为了不让文件乱成一锅粥,最好的准备工作是什么?是永远在项目里干活。你可以在文件夹里建一个新的项目,所有相关的聊天和生成的文件都会被 codex 自动归整。在这个文件夹下, 非技术的同学可以设置模式为适合日常工作。 codex 适合什么样的活呢? codex 拥有对你电脑文件的全权访问的能力,它能自动找对文件夹并完成任务。具体来说,这几类活最适合交给他。 一、处理本地的繁杂文件。比如你的下载文件夹中有六十张发票照片,你只需要说去读取那些发票,帮我提取文字,并在本地建一个 excel 报表,看消费趋势, 它就会自动搞定,并在本地生成一个真实的 excel 文件。跨软件的信息收集, 通过插件 codex 可以 直接联通你的常用工具,目前有上百个。你只要敲一个 at 符号,比如输入 at gmail 或者 at notion, 你 就能让它去翻阅过去两周找我做广告的邮件,整理成表格。 第三呢,是代替你直接点点点,它能直接用鼠标和键盘控制你的电脑。通过 at computer use, 它可以帮你打开电脑上的 camera 软件,新建换灯片。甚至还能用 at browse use 帮你自动去点击浏览器里面的按钮,测试网页好不好用。然后呢,要沉淀你的专属 s o p。 把活变成技能。 最阻碍新人提效的一点是总在下重复的指令。在 code x 里面,你需要习惯把你做好的工作变成可附用的技能。笔一上来就想着写多复杂的指令。按这个节奏来, 先用大白话让他干活,如果不满意就让他改,一直迭代到结果,让你拍他腿说,啊,太棒了!这时最关键的一步来了,你直接对他说,我很满意这个结果。 把它变成一个技能,它会立刻把刚才所有的经验提炼成一个可重复使用的标准文件。以后你只需要敲一个斜杠符号,比如斜杠品牌合作分析,它就能瞬间按最高标准重跑一遍。 如果你过程中又发现了更好的排版格式,随时告诉他请更新这个技能,以后都按这种格式输出。进阶习惯,让他二十四小时替你打工。定时自动化,对着你整理好的报表说一句, 请在每周五早上九点执行一次这个任务。更新这张表。 codex 呢,就会把这是加进日程表到点,自动在后台干活。你可以在 automation 的 面板里随时管理这些任务。白嫖全球最顶尖的画图模型 codex 内置了最强的 gpt image two 的 模型,生成的图片呢,会直接存进你的本地文件夹。如果你直接给出参照图描述需求,立即会生成质量极高的图片。 那根据图片生成梧桐树下的新功能的效果图,看一下避坑与管理他的大脑。用 codex 久了,他会越来越懂你,因为他有两个记忆占卜,一个是手动记忆, 这是你的规矩本。当你对它说以后这种落地页都用左侧边栏的排版格式并记住它的时候,它会写进 agent 的 n d 里面。 那第二个呢,是自动记忆,它会默默观察你的工作习惯并记录下来。那重要的提示是呢,不要去手动修改这个文件,让 ai 自己去更新就好,它会越来越聪明。所以呢, 别怕什么终端或者代码,先把你的日常痛点丢给他,建个项目,存个技能,你的工作方式呢,就会彻底被改变。如果你真的想学 ai, 请留言,想学 codex, 我 来教你。

你以为你会用 codex 吗?这条视频给你看七个真正的高级命令。第五个,百分之九十的人都没用过,少一个少一半效率。第一个 codex 空格双横杠, full auto。 这是日常开发的甜蜜点,自动批准读和写,但敏感操作还会问你, 你直接优了安全比默认模式快,是写代码的标准启动姿势,每天开工第一行命令就用它。第二个 codex 空格, resume 绘画被打断了,不要慌,敲这个命令直接恢复上次的进度,上下文一点不丢。我每天早上开工的第二个命令就是它,比重新解释一遍项目背景快得多。第三个 codex 空格双横杠。三 dbox 空格 read only, 专门给探索代码用了止读模式,读老项目,查依赖看历史,写文档不会误。改一行代码,安全感拉满,做代码考古的时候必用。第四个 codex 空格双横杠。 profile 加名字,给不同场景配不同的 profile, 比如 review 的 profile, 用更强的模型止读跑 c i 的 profile, 跑非交互模式,不用任何确认,切换一行命令搞定,不用每次手动调参数。第五个,敲 codex 空格 m c p。 这是真正的杀手锏,让 codex 把自己暴露成一个 m c p server, 其他 agent 比如 cloud, code, cursor 都能调用它干活。 一个工具变成所有 agent 的 能力扩展,百分之九十的人都不知道,还能这么玩?知道的人已经在搭多 agent 写作了。第六个 codex 空格双横杠。 s d r 授权额外的可写目录。 比如你要让 codex 同时改前端和后端两个仓库,加这个参数就能跨目录工作,不用来回切目录切上下文。第七个 codex 空格 exact 空格双横杠 jason 加一句话,非交互模式加接送流式输出,专门给自动化脚本用。我的视频生产 pipeline 就是 用这个调度 codex 的, 能嵌入任何工作流。

hello, 大家好,今天给大家讲解一下我是如何使用 codex 来驱动 objects 来完成一系列由 ai 驱动的 ce 仿真的。首先我们去 openai 的 官网去下载 codex 这个 agent 桌面单软件。 codex 是 由 openai 推出的一个以编程为主的桌面单应用程序,我们下载完成之后,安装了之后,你可以登录你的账号,这边 codex 它是免费账号,也是有一定的使用额度的, 但是这个额度不多,建议大家还是充一个 plus 会员。下载完成之后,你可以在这边新开一个对话,然后把我这个 呃 qs mcp 的 链接粘到这个对话里面,让它安装一下这个 mcp 插件。这边安装完成之后,我们可以在设置这边看到这边有个 mcp 服务器, 然后这边的话有一个 opcode server, 这个服务器安装完成之后,你的 codex 就 能够和 opcodex 完成一个联通了。至于这个仿真的界面,它是我们完成的另一个项目, 你可以在 task two cae 这个网站下面把链接复制一下,然后交给 codex 让它安装一下。 安装完成之后,我们就可以使用 codex 联合 opcode 来完成一系列仿真了,但在这个过程中,你肯定要把你的 opcode 啊,我们打开 opcode 之后,我们可以在这边的中端窗口下输入 mcp, 然后下划线,然后 looper, 然后过号点击回车,然后这边的话 appux 就 已经开启了一个 m c p。 我 们在 codex 里面,然后我这边新开一个窗口,我们这边的话问他你是否可以和 appux 联通, 他这边是思考了二十四秒之后返回的信息是可以当天可以和 appx 连通了,如果你测试到这一步的话,那说明你已经成功的打通了 codex 和和 opuse, 然后你就可以使用一系列的提示词来对它进行一个仿真。比方说我这边做的一个仿真,仿真专家做一个仿真学分析,要尽可能的贴近真实工况, 不要简化去做。如果是比方说这种动理学仿真的,你就让他要尽可能的贴近真实功放设定播放的帧率也要高,让仿真动画看起来更流畅。我需要在这个 codex 浏览器里面看到最后的仿真的结果。 在这边有一个界面,这边是模型树,我目前是只做了这个项目的,打开预览的一个模型树,后边的话,这个我可能会再完善一下,把这边的零件材料装配,然后分析部都能够去操作和二次编辑, 目前能够你编辑的在这个可编辑窗口,比方说可以编辑一下模型的一些尺寸,比方说我们把这个模型的尺寸圆孔半径改为二十四,在这边点击重新计算,然后这边的话它就在驱动 appui 完成一个重新的计算。 你也可以改,比方说板长板宽,然后其他的一些弹性模量或者是材料属性可以看到它这边就完成了一个模型的重新计算,然后重新进行了一个就是模态分析。我们先在这里讲一下这个 codex 驱动 ios 进行一个由 ai 驱动的 ce 仿真的流程是怎么样的。首先我们在这里的对话框里发一下你的想要仿真的一个提示词,你可以完全照抄这个,当然你想改一下也是可以的, 然后把提示发给这个 codex 之后, codex 就 会去写一系列的脚本,比方说这个模型建立的脚本也是由 codex 的 python 码完成的,当然一些比方说这个像简单的一些模型,它是可以去建立的,当像这个 洗刀模型它就建立的效果不是很好了。这个洗刀模型是由我在 soodeworks 里面去建立的一个模型,把它转化为 str 格式之后,告诉了 codex 在 哪里, 他就可以把他建立的模型和我提供给他的模型进行一个装配。呃,包括后面的像材料定义装配这个分析布载合了的定义,边界条件的定义,以到我们的网格化划分,都是由 codex 来完成的。 到后面的一些结果的后处理也是由 codex 来完成。 codex 完成之后,它会把一系列的脚本发给发送给我们的 opqs, 来完成最后的一些结果的分析,然后到仿真的一些模型的一些计算,它会发送给我们来完成一系列的仿真计算到结果的后处理, 然后完成之后它会创建一个网址,就是这样一个网址,然后我们点击一下就可以在浏览器里面去 看到 oq 所有的仿真结果。目前的一些仿真的话,其实它只能够进行一些简单的动力学或者是心理学仿真心理学效果目前是最好的,动力学的话,其实效果没有那么好, 大家可以当做一个参考。然后我这边再补充一点,就是如何把这个 mcp 给停掉,因为这个 mcp 运行的话,你的 oq 界面是不能进行任何一个点击操作的,就是它是一个主色运行的状态, 然后大家如果想停掉这个 mcp, 呃,然后在 app 里面查看结果的话,可以点击这边的 stop 按钮,然后就可以停掉这个 mcp 服务了,然后就去进行其他的一些操作。 你如果你有问题的话,可以在这个 github 上去提问,或者说你有好的想法可以在这边跟我说一下,我看一下能不能来实现一下。这就是本期的视频内容,大家如果有什么疑问可以向我提问,谢谢大家。

今天我们聊一下 codex 这一个月更新的八个新玩法。我以前一直觉得 codex 是 个备胎,去年四月, codex c l i 刚出来那会儿, 我用了两天就回去用 cloud code 了。理由很简单, codex 当时就是个会写代码的终端 agent, 跟 cloud code 的 比没什么区别,模型还稍微弱一点。直到四月十六日那天, openai 发了一条公告,标题叫 codex for almost everything, 意思是 codex 不 再只是写代码的 agent。 先说最离谱的那一项, computer use codex 现在能看你屏幕,点你 ui, 用它自己的光标在你电脑上打字,授权之后,它可以操作你电脑上的桌面 app。 我 第一次让它做的活是把这个 figma 设计稿里的色值抓出来,写到 tailwind config 里,它打开 figma 截屏识图写入全程,我没动鼠标 这类跨 app 的 活, cloud code 作为 c l i agent, 很 难直接做 codex 这一步直接跨出了终端,代价是你给他的权限是整台电脑,不是某个项目目录, 心智压力比 cloud code 大 一个量级。跟 computer use 配套的还有一个内置浏览器。最有意思的设计是,你可以在网页上直接评论,把这个 comment 当成指令丢给 agent, 就像在 google docs 上选中一段文字加评论一样,但被评论的是网页 dom。 举个例子,你打开本地预览页,选中一个按钮,评论一句,这个按钮状态太弱,改成更明显的 primary action。 完了, 这种指着浏览器跟 agent 的 说话的交互,比 cloud code 走 mcp 接 api 那 套直觉多了。普通人不用懂什么是 api, 但真正让我有点恍惚的是, automations 是 一个持续任务系统,你给 agent 的 一个长期目标,它可以附用原来的对话上下文, 按计划自动唤醒继续做。 openai 的 原话是 potentially across days or weeks。 比如你可以把任务写成每天监控这个开源项目的 issue, 每出现一个跟性能相关的,就帮我整理背景,附线路径和可能的修复方向。它每天自己醒一次,自己扫,结果放到队列里等你看。这开始有点接近让 agent 接长期任务了。然后是 pets, 五月一日左右上线的,是这个月 codex 最初圈的更新。你输入 slash pet 就 能召唤一只虚拟宠物,浮在屏幕上做状态指示器, 它告诉你 codex 现在在跑什么任务,是不是在等你输入,是不是做完了八只内置宠物可以选。还有一个 slash hatch, 可以 让 ai 生成自定义宠物。这设计妙在,它解决了一个我们都默默忍受的问题。 agent 在 后台跑唱任务的时候,你不知道它现在到哪了。以前要么切终端,要么挂个第二屏幕,现在屏幕上一直有只小猫,它的姿势就是状态,但是区域限制要分清。 open 官方明确说 computer use 初期不再 ee a u k 瑞士开放 pass 这块我没核到同等强度的官方说明。所以如果你人在欧洲,并不是所有 codex 新功能都能立马可用。第二,自定义宠物的画风偶尔会翻车。社区里已经有人把 clippy 动漫角色,各种像素小人都做出来了。好看的是真好看,怪的也是真怪。 但一个虚拟宠物功能能被开发者认真讨论,你就知道它戳到了什么。剩下几样我快点过。五月十四日, codex 进了 chat gpt 手机 app, 准确说是手机端可以远程接入正在运行 codex 的 mac host。 你 在地铁上,在咖啡馆, 可以用手机继续控制回答问题,批准操作,看 df 和测试结果。但电脑那边要保持在线, codex 也要再跑,这事跟 automations 配在一起威力很大。早上出门前交代一个长期任务,路上用手机补两句判断, 回家再看结果。这里要修正一下。 cloud code 也有 remote control, 可以 从 cloud app 或 cloud 网页端继续本机绘画。区别不在有没有手机入口, 而在 codex 把入口放进 chat gpt app 这条产品线里。四月十六日那波还顺手加了九十多个插件, atlanta rover, circle shape code, rabbit, github issues、 microsoft suite 都在里面。 cloud code 走 mcp 也能接,但要自己配。 serverch。 codex 这边是点一下装好的体验,底层也换了。四月二十三日, openai 发布 gpt 五点五,并明确说它正在进入 chatttt 和 codex。 官方说法是 gpt 五点五在同类 codex 任务上更强,也更省 token。 它还跑在 nvidia gb 两百和 gb 三百 n v l 七十二系统上。具体到比 cloud code 省多少,社区里说法很多,我没看到一个能直接当结论引用的统一数字,但我自己的体感是,同样跑长任务, codex 的 成本焦虑确实小不少, cloud code 也没掉队。 antropica 四月十六日发布 opus 四点七 s w e bench verified 报道,百分之八十七点六。 open i 这边 gpt 五点五的 terminal 奔驰二点零是百分之八十二点七, cloud opus 四点七是百分之六十九点四。 这些 benchmark 口径不完全一样,不能简单等同于 codex 工具,打败 codecode 的 工具。我现在更愿意把它理解成 codex, 在 长任务跨 app 成本和可用性上进攻很猛。 cloudcode 在 严肃代码质量和复杂重构上仍然很有竞争力。 dv 上有篇社区余情整理,看了五百多条 reddit 评论和一些盲测,结果给了一个挺贴脸的说法, cloudcode 是 高质量但不好用, codex 是 稍低质量但真的可用。这不是严格抽样调研,但它很像最近很多开发者的体感社区。现在很常见的一种用法是 codex for keystroke, coded code for commits。 日常输入用 codex 跑得快又省心。关键提交 code review, 复杂重构,切回 code code 求质量。 甚至有人把同一套 skill 同时喂给两边。聊完功能再退一步看,会发现一件挺有意思的事儿。 cloud code 这一个月在生化, harness 做插件 hack worktree 和 deny rules 把自己往 o s like 做, codex 则跨出代码边界做 computer use, 内置浏览器 automations, 手机入口和虚拟宠物,把自己做成 digital co worker。 一个想做你的操作系统,一个想做你的同事。两条路都对,但两条路真的不一样了。

来看一下秋之 codex 的 一个教程,那首先来看这 codex 和 cloud code 的 一个区别,本质的话都是一个编程的 agent 转为一个通用的 agent, 一个的话是 anthonpy 公司,一个是 open ai 公司开的模型,那个支持 codex 的 话,请用这个 open ai 的 一个 gpt cloud code, 它可以替换任意的模型,你可以接入 deepsea, 对 吧? 接入一些其他的 kimi 啊,什么国产的一些大模型,易用性的话, codex 更友好,适合零基础的一个白领。 cloud code 它自由度更高,偏专业的一个开发者。 功能上来讲呢, codex 它强化了这个浏览器操作,它可以用,对吧?浏览器操作以及 computer use 内置 image 二,它这个深图的以及新增手机端加 hook, 手机端的话,它就是用手机就可以去操作。 cloud code 呢,功能更全。像这个 skill m c p 斜杠命令, hook 更新较慢。 skill m c p 它通用的接口一样的斜杠,用斜杠命令也可以操作斜杠命令,就像那个编程去写那个斜杠命令嘛, hook 更新较慢, 那这个 hook 的 话就相当于是钩子 hook 的 话,它其实就是一个自动地去调用的一些命令, 它就是相当于说呃有一些自动开呃自动触发的一个条件,自动触发的条件更新较慢。价格维度, codex 二十刀的会员的话,对于就白领重度水温的话都是够用了,不分号。而 cloud code 的 话是按这个 api 的 一个调用计费, a 这个 a p i 的 话,它就是去调用,调用这个什么,就调用这个 deepsea 它的一个这个接口去起用这个所呃用的这个额度, 但是我们自己在 deepsea 里面的话,它是就没有 api, 那 我们这个因为你就 cloud code, 它要用别人的模型,这个的话就要去计费了。适用的场景, codex 的 话,它可以用在日常那个办公解决问题, cloud code 的 写作规划,那编程的话,两者都可以给它结合在一起用是最好的。 然后 codex codex 的 安装与基础设置,首先要准备这个 chat gpt 的 一个账户,用免费或者是付费都可以的,它付费的话它就额度更高一点嘛。安装的话就是官网下载安装登录账号初使用的一个设置, 就选择一些日常的工作,选择你的一个什么身份呢?比如说你是学生,是白领,然后你是设计工作什么的。界面来说的话,它是左侧是对话任务管理,中间是进行聊天,右侧的话是输出结果,是非常简洁的一个界面,左侧的话是一个 任务管理对话,中间聊天,右侧就进行结结果,右侧的话就输出这个结果。核心的能力, codex 核心的能力,它与这个 cloud code 与其他的它特别 不一样的一点呢,它是本地的一个文件操作,本地文件操作项目关联,直接去绑定,绑定本地的文件夹,自动去读写,呃,增增删移动文件,不限数量。就比如说 cloud code 的 话,可能你想要让它处理一些文件的话,你就得 呃把这个文件给它上传到云端什么之类的,但是它这个本地的话,你只要去这个文件夹的一个路径给它写上去,那它能自动去读写增删移动文件,就比如说就是你有,有就是几百个,呃, 照片的一个素材,它不限数量嘛?照片的素,视频的素材,但是没有改名字,没有改名字怎么办呢?你可以这样子,需要这个 cloud code 去识别, 识别这个视频里面的内容,给它起一个合适的名字。那 cloud code 的 话它会自动运行去抽帧,就就是这个视频里面去抽几帧,去识别它的核心的内容。比如说雪地上的狐狸这样,然后它就可能给它一个序号,雪地狐狸, 对吧对吧?然后地点,然后在这个对象是什么?嗯,就这样子能够把几百个几百个这个视频它的一个名称都给它修改了。权限模式,就权限模式的话就是你给这个 codex 它的一个权限, 嗯,修改的一个权限默认的话是在文件夹内操作外外需的话就是齐全 自动审查,就 ai 自己去判断。自动审查,自动判断是推荐新新手完全反问全全全部的权限,就是说可能他把你一些东西都改了,删除了,慎用上下文的管理,自动手动压缩或者是斜杠去 给他进行压缩。上下文管理为啥呢?因为上下文的话他就是一个提示词的上下文,他会可能会给你消耗比较多的一个额度, 所以你给它进行压缩,当它就是已经处理到比较下面的任务的时候,可以把它的上下文给它压缩一下。 查看额度的话在设置设置栏里面去看这个状态,能够查看额度案例的话,就是视频的素材批量进行重命名,以及视视频的剪辑合并,都可以用这个 codex。 命令行工具,使用命令行工具的话就像是我们 嗯,电脑就嗯给他就 command, 给他呼起一个,对吧?嗯,比如说让他关机,那你写你就可以 就就是可以就通过通过输入那个文字让它关机,而不是用鼠标的一个操作,这个叫做命令行工具安装。可这个命令行工具可以怎么用呢?首先就是比如说可以安装这个 nod, js、 git 等基础的一个工具部署 agent, 像这个 hermes cloud code, 你可以直接在对话框里面跟他说帮我部署这个 hermes cloud code 等软件的一个管理是什么?像这个 cursor, 然后飞书 cleet, 它这也是命令行工具等的,就给他用安装技能工具。技能工具,你比如说我要去找一些 skill, 也可以让他自己去找飞书 c, 就是 飞书的命令行工具给它安装进来。并行任务是它的一个特特点, 就是多个对话同时执行不同的任务。你可以因为像豆包啊,像 deepsea, 它们都好像就就只能是当前的一个任务,给它回答完了之后它再去做别的,对不对?但它这个完全是可以并行的,就是多任务同时去 执行不同的一个任务。比如说我这视频素材批量重命名和视频剪辑合并的话,两个,或者是说你你另外一个,你去找一个合适的一些图片,合适的一些字体,对吧? 这两个任务是完全不耽误的,可以并行。而且这个理论上的话就是看你电脑的性能,它可以并行特别多的一个任务。 持久的记忆,手动记忆就是 agent md 的 话,全区性、项目性的手动记忆。 agent md 它就什么叫记忆呢?就是一些规则嘛,就是一些规则指令,像全区的话,在设置 设置里面个性化自定义指令,全职生效,它就是对于所有的工作它都就是,比如说你自字体是多少或什么样子的,是吧?它是全职生效的,像项目级就是指对这个项目生效的一些规则的一个记忆,你可以在项目里面手动地去创建 ai, 或 是说 ai 生成。 ai 怎么生成呢?你可以就比如说这个项目进行到一半啊,进行到一定阶段的时候,你可以让这个 ai 去生成一些, 就就是这个全呃,就项目的一些指令。自动记忆,自动记忆开启后对话闲置、自动总结、储存消耗额度,它是不建议手动改。什么叫自动记忆呢?它就是相当于 ai 的 一个自动记忆的功能嘛,就你的一个工作风格,你的一个 偏好什么之类的,有各种各种维度的,那它的话, ai 的 话它会自己进行总结,总结一些规则,然后可以有一些附用的经验的话,就是下一次的话它就会用。还有是 往下看呢,它是一个持久记忆。就图片生成与项目开发内置了 image two, 你 可以用一些就是提示词去生成这个高级感的一个图片, 而且可以不断的去调整自己的一些提示词,什么之类的。计划模式可以去做一个网页 复杂的任务,先列计划,再执行计划模式,他有点像是那个开发的模式案例的话,就比如说个人主页的一个开发,深层修改、预览部署是怎么生成呢?他个人主页的一个开发,你首先跟他说自己的这个 想法,那他的话会给你列出计划的一步一步,而且在每一步上面,他比如说你这高级感的一个图片的话,他会让你去选择某些风格的, 就一步一步去选择,他会给你三四个选择,那所以深层修改,而且右边的话,他可以预览整个个人主页的开发的一个效果, 最后部署的话可以就发布出去使用的功能呢?任务引导纠篇任务引导纠篇是什么意思?就是说你在完成这个任务的时候,你纠篇,你觉得啊,他这个说的不太对了, 你跟他说的话,他其实不会打断这个任务,只会在下一次的时候进行一个调整,这样的话就不会浪费很多的这个额度,嗯,而且也不会让他跑偏。对话分叉 fork, 他 是在就是整个 整个,呃,就是任务结束之后它会有一个 fork, 是 在这个右下角,右下角 fork 的 话,你会觉得它这是不是有点跑偏了你,你会想着说怎么给它纠正这个 fork, 这里面的话可以进行一些小调整。桌面宠物的话是 一个有意思的一个,就是小宠物在这边插件与操控常用的一个插件,它其实常用的一些插件的话,它就是一个 skill 啊, m c p, 然后包括 c c, 呃, c l i 的 这种 类似的一个集合就插件,它就是会实现一些功能浏览器的一个操作, get up, 然后表格 ppt net nullify however vocal 的 这个部署 browse use 的 话,它是浏览器的一个操作,怎么浏览器操作呢?它能够操控浏览器进行点击方页,然后表单自动化,就比如说你可以让它去做一个呃 m b t i 的 一个测试,或者说基于你的一个性格 去去帮你,帮你测试,它能够自己去选择,然后得出一个答案。 chrome 插件的话可以操控已经登录的浏览器,而且后台是它是在后台,后台多任务操作的,就根本不影响你,你自己去去做这个浏览器 的一个,对吧?你自己还要用这台电脑去浏览其他的页面,完全是 ok 的。 computer use 就 操控电脑的 app, 就 仅 mac, 比如说音乐微信剪映,比如说让它去打开一个音乐软件,把这个音乐发给微信,是吧?或者说就把这个音乐加到这个剪映里面,这个它可以操控这个电脑的 app, 仅在 mac 上是可以实现的。 skills 技能定义 skills, 比如 find skills, 自定义一些 skills 创建的话就是整个流程,流程跑通之后,你可以把这个整个流程怎么样,沉淀下来就附用,沉淀下来附用就直接指令,你就说,哎,就按照这个项目流程去创建这次的这个 skills 案例的话,比如说我想要去做这个 写一篇图文推荐的图文,就 get up 上面的一个热门项目的推荐图文,就在我就是不断地去给它调试后觉得这个结果是满意的,那就把上面的这个流程方法生成这个 skill 下一次, 对吧? ugetup 上面的热门项目就大概每周的话它都会更新,那它就是你每周可以做这个 skills。 m c p 连接 m c p 的 话有点像是 u 盘插口,插口去去把外部的一个数据连接外部的一个知识库服务去安装, 可以就是自己去做,也或者是说你直接让这个 ai 自动授权安装案例的话,比如说 notebook l m 的 一个知识库的连接,知识库连接之后你就可以直接去提问这个知识库里面的一个东西,调用知识库里面的一些 呃,就比如说它这里面存的一些呃反弹啊之类的。自动化定时任务创建的方法,可以在自动化面板上面创建,也可以直接跟这个对话,让它创建案例的话,比如说每周都给我 呃生成 get github 的 一个推荐图文,因为我们这个 skills 不是 已经沉淀下来了吗?然后现在的话就给它定时每周生成,那我们都根本不用去记这个事了,它就是它定它到,比如说周一或者什么时候它就会生成,或者说每日的工作日报的一个汇总, 它也能够给它定时生成,这就自动化的,自动化的那就怎么样子不用人为的去给它介入了。手机端的一个操控,前提的话就是这个手机要下载这个 check gpt, 然后电脑的 codex 更新到最新版本,操作的话就是手机端侧边栏的 codex 授权去连接电脑。 功能是什么样子的?手机端操控就是你远程你就电脑,对吧?你就开着那远程去下发任务,控制电脑干活, 直接能够控给他一个指令,他就能够控制电脑干活,免费版可用,支持 mac。 总结的话就是说这个 codex 的 核心能力是文件操控,而且是本地的一个文件操作命令行操作。持久的一个记忆,持久的记忆一些规则深图的开发 插件的操控 skills skills, 然后 m c p 的 话连接外部的一个知识和数据库自动化,可以自动化定时任务。核心的认知呢?我们现在已经从 问 ai 要一些答案,先到管理 ai 准备一些上下文的一个环境,制定目标,检验成果,去沉淀这个流程,去转变核心的认知。就是我们现在已经到了,就说从问 ai 要一些答案,到就是管理 ai 准备上下文,定目标,验 结果,然后沉淀这个,呃,流程,就让它这个整个流程的话给它自动化 sop 是 吧?

我现在在从上海到义乌的火车上,这两个小时时间也没有算浪费,正好验证一下 codex 的 手机移动端,看看能不能在真实的场景中处理一下工作任务。 在之前已经把相关的一些素材在电脑上已经做好了,但是呢,还没做完,我想看一下这次在手机端上能不能继续我之前在电脑上还没有完成的工作。 这里是前面他这个位置啊,在电脑端已经工作到的进度。 然后从这句话开始,我接着从手机进行命令操控,然后告诉他,我现在在手机上不方便操作,你能不能帮我把已经生成的一些视频的脚本,以及一些预览的一些页面让我看一下,结果你看他就给了一个链接, 我可以通过外网直接看,包括一些抽真的画面呀,还有那个截图啊,都是在这的。 那接下来前面又经过几轮调整啊,反正他都能够很好的处理这个任务。 最后的话呢,我让他尝试着去打开页面的。呃, chrome 界面,抖音发布中心,看看能不能进行发布,反正现在这边还在进行啊,他需要一些权限的授权, 但是呢,我不太建议直接进行全流程自动发布,这时候是在移动端上没办法才这样,因为毕竟还有一些细节还是要人工去把控一下的。 我觉得接下来移动办公,特别是移动调用 agent 还是一个趋势, codex 这块呢,正在抓紧赶上 agent, 其他的像 open call 和 home 这样的 agent, 这是一个不错的信号,但距离在体验上还是有一些不足,比如说你 还是要等很长的时间,再一个就是它那个入口也不怎么明显,你要先打开 check gpt, 然后再找到 codex 那 个入口,还要等很久,让它连上桌面端, 但总归已经是进步了很大的一节,所以是很期待接下来 codex 这边能够做更好的一个产品优化,毕竟在生产力重构这一块,我觉得目前为止它是一个非常棒的一个工具。

好了,大家好,这段时间 codex 相信很多小伙伴已经上手,开始用了一个非常好用的 openai 的 桌面端的一个 agent 工具。那么今天我想推荐一个 codex 里面的一个很强很厉害的一个做视频的插件叫 hyperframes, 它可以帮你按照网页的形式去做成一个视频,相当于用写前端的代码去做一个视频。首先我们知道 ai 在 写前端代码这块已经是非常厉害的,所以说这个插件就可以帮你 让你的 ai 像写代码一样去做视频。好的,那么我们就直接来试一试这个插件到底有多厉害。使用是在这边点击这个插件下面找到这个 hyperframes, 安装之后我们直接右上角点在对话中使用。这里我把 cloud 的 一个官网给他,我说一句,请根据这个网站做一个产品的宣传视频。好的,我们这里让他开始执行。好的,可以看到他跑了一段时间,他去官网去拉取了一些他需要用到的素材, 他接着在执行。好的,现在他已经生成好了,他已经跟我们说宣传视频已经生成好,在这里只需要点开就可以去预览。 并且他除了宣传片以外,他还使用了官方的素材,产品的文案,他还有动画的分镜,他还给这个宣传片加了旁白的阴鬼。让我们来一起看一下 the ai for problem solvers breakdown complex work together research write analyze data and code with expert level collaboration bring code to your desktop browser tools and team code by anthropic think bigger work clearer。 可以 看到整个效果还是非常好的,除了可能画面中有个别的小细节, 有一些排版上的问题,整个的效果你敢相信是我只用了一句话,没有经过任何修改它就出来的一个结果。随着 ai 进一步的发展,一开始的文字、 图片、视频以及到现在的全自动的生成视频以及剪辑, ai 的 发展只会越来越快,而且这个工具对于很多想要制作一些宣传视频、科普视频的人来说非常的有帮助。