你问 ai 一 件他没学过的事,他常常不说不知道,反而一本正经给你编一个。这毛病 r a g 就是 来治他的。 r a g 全称解锁增强生成,说白了是让 ai 从闭卷考试改成开卷考试。 闭卷时他只能凭脑子里记得,记错了,过期了。你公司内部的事,他压根没学过,就开始瞎编。 r a g 给他加一个动作,回答前先去你指定的资料库里,翻出相关的几段,便在眼前再照着答。答案有据可查,还能用上他没学过的新数据,私有数据。 经典做法是,一条流水线,资料切成小块,转成像量存进库。你一提问,就拿问题去库里捞最像的几段,塞进提示词,让模型照着生成。 但这条流水线有死穴,只查一次,查到啥用啥,问题一绕要跨好几处找答案,他就抓瞎。万一第一次没捞对,他也不回头照着错料应答。 于是有了 agentic, r a g 把剪索从斜死的一步,变成 ai 手里随时能调的一个工具。他自己判断要不要查,查几轮,查得不对就换个问法,再查多个来源,挑着用,满意了才收。 解锁从一条直线流水线,变成一个能自己兜圈边查边改的循环。说到底, r a g 不是 让模型自己记下什么,是给他一个随时能翻的外部资料柜。
粉丝1060获赞2507

其实我觉得 agent 它就只有两种形态吧,对于我们一人公司中小企业老板、普通人来说,用 agent 无非就是第一个智能客服型的 agent 和数字员工 agent。 那 什么是智能客服型的 agent 呢?就是把你公司的所有资料,你能收取到的所有资料 喂给一个 agent, 然后用所谓的 rec 技术去帮你解锁。根据这些知识库,你把它设定为一个某某具体领域的一个专家, 对吧?新人来了,员工有什么不懂,都可以在这一个智能体去问他,然后他帮你回答一些关于公司的所有问题。 举个例子,比如说你是律,所有资深的办案经验和法律条款解读能力,那你可以把这些所有的知识库喂给一个 agent, 训练完之后它就是一个智能的法律客服,只需要人把客户的问题全部收集好,然后喂给这一个智能客服,它就可以帮你快速的解答,并且给详细的案例分析建议。那还有一种就是数字员工型的 agent, 像 codex、 cloudco 以及之前很火的 openclo, 它们这一些都属于能在你的业务流程里面帮你真真切切实地去干活。比如说做电商的朋友们,他们能帮你在选品、做图以及上架的时候,帮你做一个自动化的流程,然后像人一样去帮你实实在在的工作。 还有做自媒体的朋友们,他们可以帮你扒竞品内容的文案,以及帮你去分析这一个文案的结构,最后根据你的风格帮你去改写这一个文案。他的核心就是在业务流的各个节点里面代替人干活, 我们也叫它所谓的 agent 工作流,就是帮你搭一个工作流出来,然后这一个工作流如果是非常固定化、标准化的,那你可以把它打包成一个 skill, 二十四小时帮你轮流转,把团队里面的一些重复性的劳动给解放出来,让员工去想一些更有意义的事情。 说白了,智能型的 agent 就是 把牛人的脑子变成一个 ai 顾问,然后你的客户、你的员工,你培养新人,都可以在这一个顾问里面去问他问题, 让他帮你去做一个基于你公司业务的一个解答。数字员工型的 a 诊,就是把你业务流程里面重复性很高的工作交给 ai 去干。其实很多企业老板他根本就不需要懂技术, 我上一期视频也讲到,懂业务其实是最重要的,你公司有哪一些牛人的经验可以复制,可以把它打包成知识库去喂给 ai, 然后哪些业务流程是很重复性的工作,最后再找专业的人把这两种 a 诊都给它搭建起来, ai 其实就可以实实在在地帮你降本提效。所以说懂业务是关键,那后续呢?我也会持续分享 ai 加业务落地的一些实际案例,欢迎大家一起交流。

美好啊,朋友们,这是一期 codex 奶妈级的零基础系统教程,这期视频我会从安装开始,手把手地把 codex 的 基础能力到高级功能的组合,以及最新的手机端操作,用十个实战场景来带大家彻底拉通 以后这一类的 ai 产品,出一个算一个,你都会触类旁通,游刃有余。我也把这期的文字课间整理成了文档,那这期的含金量可谓是 biu biu biu biu biu, 一个点赞收藏关注是最起码的。好了,不多说,学费都交了吧,我们上课, 那在开始之前,我先说一下 codex 和 cloud code 的 区别。从本质上来说,它俩都是由编程 agent 逐步转向了通用 agent, 分 别是 ansapi 和 open ai。 这两家出的 cloud code 呢,默认使用 cloud 模型,但是我们可以自行替换成任意其他的模型,那在易用程度上, codex 桌面端的产品设计是会更友好的, 更适合零基础的白领工作者,而 cloud code 有 更高的自由度。在功能上, cloud code 原本是最齐全的,什么 skill、 mcp、 斜杠命令、 hock、 远程操控,这都是人家先发明的。但是呢,最近的 c c 更新稍微不如 codex 那 么快了,会更加偏向专业开发者一点。 而 codex 发了非常强的浏览器操控和 computer use, 还内置了最近的 image 二深图模型, 而且昨天还刚刚发布了手机端和 hock, 可以 直接用你的手机 check gpt 来控制电脑上的 codex 干 活。那价格和额度方面呢? codex 的 会员额度非常大方,二十到的会员就很够用,而且还不封号。 而 cloudpod 呢,大多数人可能都没法用它的官方账号基本上都得自行调用 api 的 费用属于是花多少用多少,风险由人。那在使用场景上,我个人喜欢用 cloudpod 搭配 cloud 模型来写作,因为 ops 四点六的写作和规划能力真的很强, 那 codex 的 执行和解决问题的能力也很强。日常的办公场景,我会选择用 codex, 那 在编程的时候嘛,我就两个都用上,所以结论是,入门的朋友用 codex 就 很强了,有条件的朋友呢,两个都来是最完美的, 不过两者的逻辑其实都是一样的,我们学一个,另一个也就会用了。那 cloud code 我 也做了一期系统教程,想拥有左膀右臂的朋友可以去看看。 ok, 正式开始 使用 codex, 我 们唯一需要准备的就是一个叉 gpt 账号,免费的也行,只是会额度稍微少一点。那有了账号之后,我们就直接去它的官网双击安装, 然后安装好之后登录我们的叉 gpt 账号,然后这些设置我们可以先随便选一点啊,选个日常工作,反正后续呢,我们都是可以改的。那搞定了, 那进来之后呢,大家会看到这个对话窗口,好像跟 chat gpt 是 很类似的。那我们打开两边的侧边栏也蛮眼熟的,左边呢,可以管理对话和任务的列表, 那中间就是聊天,右边大概是结果之类的吧,大家应该都能猜个七七八八,所以我们先不深究它的页面,我们直接开用,这其实也是我探索所有的 ai 工具的独门秘方。 我打开一个陌生界面呢,我先不管别的,我先找到我能对话的框,我先聊,先找到我能看得懂的按钮,先按,按着按着你就会了。你看看,独门秘籍都教给大家了,以后你们就是为师的弟子了。 ok, 众弟子不必拘礼,我们还是以学业为重啊。那我们第一个要了解的 codex 能力呢,就是本地文件操作, 也是这一类桌面端的 agent 跟对话 ai 最显著的区别和能力。因为过去我们用叉 gpt, 如果说我们要让它看到我们本地的内容,我们只有两种方式,一个呢就是复制粘贴到这个对话里,另一种就是以它允许的格式和数量把文件给上传上去。 但是 codex 不 一样,它可以自主地读取和操作我们的本地文件,而且不限数量。比如说我作为一个剪辑,我的本地里面存了八十多条视频素材,这都是我剪辑要用的, 但是呢,这个命名全都是乱的,完全看不懂,所以我想以这些视频的内容来命名,到时候我们看见文件名的时候,我们就知道这个素材是什么。那这事 check gpt 肯定是做不了的,但是 codex 可以 我们来看这两个地方,它都显示了一个概念,叫做项目, 我们选择一下,哎,一选择项目,他就让我们选择本地的文件夹了,那我们只要选中这个文件夹,那这个文件就是我们的项目了,里面所有的文件 codex 都可以自由的读取和操作, 当然这需要我们给他权限。大家看这里的权限选择啊,目前呢,我们是一个默认的权限,我们再点开,他有三种权限模式, 那默认权限的意思呢?就是在我们当前的文件夹内,他可以自由的去读写这些文件,但是如果他想要联网呀,或者是帮我们下载一点东西啊, 或者是碰这个文件夹之外的其他文件,那他是不行的,如果他必须要做,就会要向我们提出提高权限的请求,我们点同意才能继续。 那自动审查呢?顾名思义就是有个 ai 自动帮我们审查,由 ai 来判断这个操作危不危险,如果危险呢,就来问我们不危险的,比如说他去下一个知名的这种官方软件什么的,他就直接开干了。 自动审查比默认模式要更宽松和智能,建议大家选这个就完了。那最后呢,是完全访问权限,这意味着 codex 可以 在你的电脑上几乎什么都能干,它可以修改删除任何文件,它可以在任何位置执行命令,例如说它可能会去把你的 cloud code 给删了。 开玩笑啊,它一般情况下是不会这样抽风的。 ai 呢?也没有嫉妒情绪吗? 大家尤其是新手朋友就选择自动审查模式,相信 ai 就 完了,毕竟咱又能审的比 ai 好 多少呢啊,对吧? ok, 那 我们选中了刚刚的这个视频的文件夹,继续来提出我们无理的要求,让他帮我们把这个文件夹里的所有视频素材都按他们的实际画面来重新命名。哎,他就开始做了, 而且大家看他非常的聪明,他先看了看我们到底有多少个视频,然后他选择用抽帧的方式抽取关键画面来判断内容是什么,而且他还知道他不要一张一张图去看,他给拼成了缩略图的形式,一组一组的去看。 ok, 很 快啊,这个文件夹里面的文件名就全改变了。过程中呢, codex 也是没有向我们提全的,因为他都是在这个文件夹内去操作的。那我们也可以检查一下他都对应好了没有。 ok, 钢琴家音乐演奏厅,没错, 雪山近身格斗,没错,旗袍女人夜巷卖热饮哇!而且他的这个命名还遵循着一个序号,任务、场景、行动的一个清晰的命名格式。 ai 做事的这个细心程度啊,人类你不服不行。那另外呢,我们其实也可以在同一个项目里面去开多个不同的对话,它们的上下文都是不一样的,但是同样都可以随时的访问我们这个文件这个项目。 比如说,我们在另外一条对话,我们又给他一个不同的任务,让他想办法把所有关于风景的视频都剪成一整条。 哎,没想到吧,他真的能剪,他自己想办法,用了一些工具问我们要了一些权限,用这个 ffmpeg 给它拼在了一起,效果的确是关于风景的都剪成了一条。 ok, 那 如果我们要创建一个新的任务,我们其实也可以手动的在这边创建,他也会自动的在我们本地创建一个文件夹。 然后呢,我们跟 codex 对 话的整个过程, agent 产生出来的任何文件啊, pdf 啊,什么 markdown, ppt, 它都会直接存在我们本地的电脑上。 ok, 到这里,大家应该 get 了 codex 呢,可以随时地访问我们的本地文件,去读取内容,写文件,删文件,移动文件,文件夹里的内容也就成了我们的 codex 随时可以获取的上下文,那这里的项目也就对应着我们在本地的一个文件夹, 哎,那刚刚这么个任务会花我们多少上下文呢?我们只要看这里就能看到了。 那这个小圈代表的是我们现在的这个对话和里面的操作,一共使用了 gpt 五点五的多少上下文窗口。 如果我们把鼠标悬上去呢,它还会有更详细的一个信息,当上下文快满的时候, codex 会自动地帮我们压缩上下文。不过其实当我们一个任务告一段落之后,不用等它快满了,让它自动压缩,我们也可以自己通过斜杠压缩这个命令 来手动的去压缩上下文,这样呢,可以让模型更聚焦在我们的新任务上,也省一点上下文的额度。那当然大家除了这个对话的上下文余量,其实我们还想知道我作为一个免费用户,或者是我作为一个 pro 用户, plus 会员,我还有多少总共的额度可以用,对吧? 这个呢,有两个方式查看,一个呢是左边的设置,这里我们点开剩余额度,就能看到你五小时内还剩下多少,那本周内又还剩下多少, 甚至呢,也有什么时候到期会刷新的一个提示,这个产品的设计还是比 cloud 的 友好很多的。那另一种方式呢,就是我们可以直接在对话框里输入斜杠,然后找到这个状态, 那打开这个状态之后,它的绘画这里就会持续的显示我们的上下文余量,这个五小时和一周的限额。但再次说实话,这个 codex 的 额度还是非常大方的,二十到的额度我认为是可以满足大多数白领工作的高频使用的。 ok, 那 顺便呢,我们也介绍一下这里的模型选择, 那点开之后,我们可以选择速度,快速呢,就相当于加急通道,会消耗我们更多的额度。那这里呢可以选择其他模型,但是大家都选五点五,因为它确实更好用。然后呢,这里可以选择智能程度,其实呢一般中度智能就够了, 所以我们选高。 ok, 那 这个小麦克风呢,肯定就是语音输入功能了,比手打字还是要快很多的,但是呢,它的转录速度远不如大家去下载一个语音输入法,还是非常推荐大家用语音输入的 好。那现在我们通过一个本地文件处理的案例,也了解了 codex 上常用的一些功能。那 codex 的 第二大能力就是命令行工具使用。 其实刚才我们说到权限的时候就有提到,在默认权限下,它可以读写文件,但是却不能执行一些命令,一些联网的操作。那这些命令是什么意思呢? 刚刚的案例其实也已经用到过了,比如说它把视频抽帧出来,还把几个视频拼接到一起,它用到的 ffmpeg 就是 命令行工具。 还有一些我们熟悉的命令,比如说我们在终端里面来克隆一个 gitup 仓库,或者是大家近期比较熟悉的,我们在命令行里面输入一些命令来下载龙虾和各种依赖。那 codex 的 第二大能力就是在我们授权的情况下,可以使用我们的终端来替我们做这些事。 那我们就来让 codex 帮我们来安装一些平时对于小白来说非常复杂的东西吧。第一类,常用依赖,比如说什么 node gs 啊, git 什么的, 也是大家以后使用各种 agent 或者是做其他项目必备的一些工具啊,那之前大家要装这依赖都得去看一个手把手教程,然后照着命令抄,挨个装。那现在我们就直接跟 codex 说帮我安装个 node js 给他发过去, 也是因为这些东西呢,其实都是比较常见的东西了,所以在我们的自动审核的权限模式下,你看他基本上都不问我们要提权,就熟门熟路的帮我们装好了。 那第二类,就是那些爆火的但是有上手门槛的一些新的 agent, 比如说龙虾,爱马仕,甚至还有这个 codex 的 竞品 cloud code, 我 们都可以让 codex 帮我们装完了呢,它还能教我们该怎么用。那我们装一个 hermes 吧, 我其实都不需要给它官网和仓库链接,我就说最近有一个叫 hermes 的 agent 很 火,你帮我安装一个吧。 哎,他就会自己去搜索,然后帮我们判断到底是哪一个。然后呢,他根据官方的文档帮我们陆续的装好了,还帮我们验证过已经装好了,你瞧瞧,那我们照着他说的来启动一下试试。 哎,真的帮我们装好了,那往后的配置我们就不在这里继续了,但是大家应该 get, 有 了 codex 以后,那些复杂的要收你五九九的部署,你都可以直接让 codex 帮你做了,怒省五九九。而且我们在使用的过程中遇到任何问题,还可以截图去问 codex, 什么瞎死了马挂了,升级出现了问题都可以让 codex 直接帮你修,是不是很方便? 那第三类有点没那么必要,但它其实也可以,就是像 cursor integrity 这种软件应用, 平时都是我们去手动在网页上下载的,它也可以帮你下载和卸载。那大家用 codex, 我 其实也建议大家去下载一个 agent 的 ide 啊,因为现在 codex 有 个缺点是它没有办法打开我们的文件内容,直接去手动编辑。 虽然这个侧边栏呢,是可以看到一些文件结构和内容的,但是我们都没法编辑,所以大家可以让 codex 下载一个自己喜欢的,比如说我们就这样下载。那下好之后呢,我们再执行一个 git i n i t 一个初步化, 那右上角就会出现这个东西,随时可以把我们的项目在编辑器中打开,我们来手动编辑。 那第四类就比较重要了,就是 agent 本身会常用到的那些 skills 啊, mcp 啊和 selli。 那 skill 和 mcp 本身 codex 也是支持的,我们后面会详细讲到, 我先挑两个大家安装一下,方便我们后面综合起来来做案例。那这些 skill 和 c i 呢?通常来讲不像那些 get 那 种大项目那么著名,所以我们最好是找到它的具体仓库,或者是明确的官网地址。比如说我们下载一个专门找 skill 的 这个 find skill 哦,方式就是直接把链接拷贝给 codex, 然后跟他说帮我装一下这个 skill。 那 在他装的期间,我们也说一下 codex 的 另一大好处,并行任务处理, 我们完全可以在他做这个事情的时候再开一个对话,让他去下载一个别的。那我们下载一个飞书 c l i 吧。飞书 c l i 其实非常的典型, 因为现在呢,有一些积极 ai 化的软件,把几乎所有他在软件里能做的操作都做成了命令,让 agent 能够方便的去操作,我们把这个链接发过去,让他开始下载, 那这边呢,其实会显示每一个正在处理当中任务的情况,这个在转呢,就说明它正在执行中,那这个蓝色的点呢,就说明已经完成了,有时候还可能会出现一个需要你申请权限的一个标识。 ok, 那 这里 fan skill 呢?它是已经装好了,我们再看飞书 c l i 这边,它会引导我们去做一些授权, 我们就跟着它的引导去完成就好了。 ok, 那 装好飞书 c l i, 那 codex 就 能帮我们去做飞书里的各种操作了,比如说写文档,发消息,见日历,做表格什么的了,我几乎每天都在用, 好大功告成。我们就这么一个小章节,我们就用自然语言的方式让 codex 帮我们装上了 hermes node, 飞书 c l i 一 大堆东西,这就是 codex 作为 agent 的 第二大常用能力,命令行使用。 那这个能力和这个章节的演示也是希望大家能够 get 到一点,就是我们现在在电脑上想去做的很多很多事情,都可以让 codex 这样的桌面 agent 去做了。那 codex 的 第三大能力是持久记忆。 看过我那篇 cloud code 的 朋友应该都知道, c c 呢,有一个手动的持久记忆, cloud 点 md, 还有一个自动的记忆系统, 都是把我们希望 agent 能够长期记住的,比如规则、篇号和我们的信息之类的东西,以本地文件的方式存在我们的电脑上,然后事实的时候把这些记忆以上下文的方式注入到 agent 里去。那 codex 也是类似的,它也有这两套持久的记忆系统 在 codex 里面呢,手动的持久记忆文件叫做 agents 点 m d, 而且它也有一个自动的记忆机制,来我们打开设置,找到个性化, 那在这里的这个自定义指令实际上就是一个全局生效的 agent state md, 它会在我们任意的项目跟 codex 对 话的时候,它都第一时间作为上下文发给大模型,那我们可以手动地自己在这里写,不过我更喜欢呢,直接在对话中去跟 codex 说, 比如说我说一个,我希望你以后对非书文档里的任何修改都使用一个专属的你的文字颜色和用删除线的方式来修改,不要直接的修改。然后这个帮我寄到局的 a 正 c m d 里。 ok, 那 它这里呢,告诉我们已经写好了,我们再打开个性化这一块,就的确是多出来了这么一套规则,那实际在使用当中,它就会去遵循我们这个规则了。 比如说我这里已经有一篇非输文档了,我在侧面呢也评论了几个我想修改的地方,我直接可以把这个链接发给 codex, 我 让他根据我侧面的评论帮我修改一下。 那因为我们刚才确实已经装好了这个非输的 c r i 也都给他配置好了权限,所以 codex 是 直接可以操作我们的文档的。 ok, 看看它完成之后的效果。 果然他用了紫色的字和删除线的方式来帮我们做的文档修改,那这个呢,是局的 agent md, 适合记一些适用于所有任务的一些大原则,比如说我们的工作习惯,我们要说中文,我们的工作偏好修改文档,要留下这种修改痕迹等等等等。 那另一种呢,就是项目级的 agent md, 这个长期记忆呢,只在这个项目当中生效,我们可以选择一个项目的对话,然后打开编辑器, 自己在这里手动的创建一个 agent 的 md 的 文件,然后我们去写一些针对我们这个项目的一些规则, 当然也可以让 codex 来帮我们写。我个人的建议呢,是在这个项目文件里面有了一些内容之后,让 codex 根据他对我们项目的了解来自己帮我们写。那自动记忆怎么回事呢? 其实我们刚才在这个个性化这个下面我们也看到了,我们需要手动打开这个自动记忆功能, 它的机制是我们打开这个功能之后, codex 会在我们结束对话或者是结束任务,这个对话闲置一段时间之后,它帮我们把那段对话总结成记忆,然后记在一个地方。但是它有几个原则,第一太短的对话它就不记了, 那第二这个对话的总结它一样会消耗我们的额度,所以当我们的额度太低的时候,它也就不记了。 并且这个自动记忆文件呢, open ai 官方是不建议我们去手动修改的,顶多我们可能删一删有些没必要的信息,那这个文件大概是长这样 的,是一个任务,一个任务在记录的,主要呢会写上这个记忆的来源是哪段对话呀?以及它的工作目录是什么,那以及以后触发了什么关键词的时候,它会去召回这段记忆, 再往下呢,是用户在这件事情上的偏好大概是什么样的?那第五段呢,是一些可附用的一些知识,一些踩坑的记录,那这些内容都是 codex 自己记录的,并且以后也是会它自动的招回去使用的,我们就先不修改它, 它这个格式确实也不太方便修改,更多的时候我们对于明确的规则和要求,我们还是通过组织 agent md 来实现。那大家学完这些视频之后呢,我也想给大家再做一期, 通过组织不同层级的这种 agency md 给自己做一个非常懂你的,可以做不同类型事情的超级助手的视频,感兴趣的朋友可以扣个一。 ok, 那 第四大能力就是 codex 可以 直接用到 image, 二来生成图片。不过呢,深图功能其实是一个小功能, 所以这一章节呢,我们不只会用它的图片生成,我们会带大家做一个完整的个人主页的开发项目,并且在了解一些 codex 在 小白开发中的一些用法和功能。那我们再来开一个项目,叫做个人主页, 然后我们点开这个加号,我们把计划模式打开,因为我们要做一个网站嘛,任务会复杂一点,所以打开这个计划模式呢,他会先帮我们列出一个详细的计划,我们确认之后他再开始行动。 计划模式呢,比较适合我们的任务有一定复杂性,或者我们自己还没想清楚,可以跟 ai 讨论出一个计划。那假设我们现在就是第二种情况,我们其实没想清楚,我们直接跟他说我想做一个个人主页, 那你看他看到我们的项目中是没有内容的,所以他以这种选择框的方式来询问我们的细节,这些选项呢,大家可以按照自己的要求去选择,那我就选这个个人品牌吧。 然后如果说这些选项中没有我们满意的呢?我们也可以选到最后一个来填写我们详细的要求,比如说我要他修饰感,也要高级感,然后我选针对合作伙伴,不要个人照 中英双语,巴拉巴拉巴拉。这里真的是问了我们相当多的问题啊,那最后呢,他给到我们出了一个详尽的计划,问我们是否实施此计划,那其实基本的计划我们看着没有什么问题,但我们也可以补充一些调整方案。 比如说我们刚才就要说到了要用它的 image 二的生成能力,我们这里没有体现,我们加一句网页上要多用一些图片,使用 image 二来生成一些高级感的图片,然后我们一起提交。 哎,那他又问我们要走哪种高级感呢?我们如果点开这个小叹号的话,还能看到他说的这个风格到底意味着什么意思,这个产品的小细节真的是我很喜欢,那我们就选他推荐的吧。然后他出了一版新的计划,我瞧着没什么问题, 去吧。 ok, 他 就开始初识化这个项目来逐步帮我们生成了。那这个过程呢,肯定会需要一定的时间,在这个期间我再给大家补充一点点知识点。呦,他的第一张图出来了,不错,挺有艺术感的,果然是最强的 emoji 二,那我要补充的这个知识点呢,叫做引导。 如果说大家在 codex 执行一个很长的任务的过程当中,你觉得他有点跑偏了,我们是可以随时给他补充纠偏的,比如说我们补充一下图片的人味要更强一点,而且不要这么冷的色调。我是一个 ai 博主,然后我们发送出去, 哎,大家会看到他没有立刻打断我们的任务,没有发出去,实际上他在这里排队呢。那我们看到右边的这个引导按钮,他写着我们不打断模型运行,会在下次调用工具后发送过去。这个是非常好的一个功能啊,我们点一下, 哎,他就可以发出去了。这个功能呢,可以让 codex 不 用在错误的道路上一路狂飙,把我们额度都花光,也不会让它重新再跑一轮任务。那另外一个小功能点,我们找到一个已经结束的任务, 我们看一下这个 ai 的 回复,每个 ai 回复的下面都有一个这个按钮,叫做分叉 fork, 这个的意思是我们可以随时从这里开始去开一个新对话,非常适合那种前面聊的还好好的,上下文也非常有价值,但是我们再往下聊,就聊的有点叉劈了的时候。哦,还有个小功能,宠物, 我们点开设置外观,然后这下面就有一小对小宠物可以选,甚至呢,我们还可以点击创建,让 codex 根据对我们的了解来生成一个定制化宠物。那我们先点击唤醒宠物, 哎,就会在桌面上有常驻这么一个小桌宠,脑袋上会冒出来 codex 正在做什么的一个提示,别的呢?好像也没什么用。 ok, 终于在他跑了七七四十九分钟之后,网页完成了, 我们来看看效果,因为 codex 呢,有一个内置的预览浏览器,我们可以直接打开右边的侧边栏啊,我们还给它放大一点。 嗯,这个网页的效果确实是不错啊,不过呢,现在的 a 证呢,其实都有这么一手了,那它这个预览浏览器呢,还有一个好处,我们点击右上方这里的一个批注按钮, 我们就可以在这个页面上选中这里的具体元素去写修改意见,包括重新生成图片,比如说我们要这个 logo 放大一点, 然后 p 住这里这张图加上一个人物,好把这个删掉, 那然后对话框里呢,就会加上我们这几条批注,然后我们点击发送,它就会针对我们的意见进行修改了,是不是挺方便的?那我们现在项目有了雏形之后,我们再 call back 一下刚才说的 agent md, 其实现在呢,就是一个让 codex 帮我们生成项目级 agent md 的 好时候了,因为我们也有了一定的内容,我们就让它自己生成一下,我们打开编辑器看看, 不错,项目的背景,各种信息,各种规则,各种文件路径都已经写好了。那以后呢,无论我们在新开对话,还是我们的聊天记录都已经被清空了, codex 都可以通过这个项目级的 a 证书 md, 立马的了解我们的项目基本情况。 ok, 那 我们先保持这样,先不做精修了,我们直接准备部署上线,当然大家自己做的时候完全可以去打磨的更好,那网页上的这些信息也换成更真实的信息就好。 那我们现在要部署呢,就得要说到 codex 的 第五大能力插件。在现在的 codex 当中,插件大多数是让我们的 agent 跟外部平台、外部工具、外部服务连接的一个作用,它实际上就是我们所说的 skill, mcp, c l i 这一类东西的一个完整集合包,比如说操作邮箱、操作日历、操作 excel 啥的。那我们来点开左边的这个插件栏,我们看这里呢,已经默认帮我们打开了好几个内置插件了,比如说浏览器操作,还有 mac 专有的屏幕操作,还有 excel 表格, ppt 等等。 那他的插件页面没有中文翻译,所以我给大家把这些插件的具体中文意思,分别能干什么也都列出来了,大家课后可以按需装上,点这个加号就好了。那我们先翻到这个 coding 板块,因为我们想要部署上线嘛,通过插件会非常方便。 其实呢,这个 vassel 和 netify 都可以,我们点一个加号给它装上,那如果大家给它没有选上的,也记得要选上。然后我们再回到对话当中,告诉他们,我们想用这个 netify 把这个网站给我们部署上去, 我们大家也不用管他咋部署的,反正他需要干什么呢,他都会告诉我们的。 ok, 他 发现我们没有登录授权,然后主动弹出了这个登录的链接,那这里呢,建议大家用 tapp 账号登录是最方便的, 那登录完之后,他自己就知道我们已经登录好了,然后继续的帮我们部署,这就搞定了。这个链接呢,就是我们最后的网站了, 只要把这个发出去,别人就能访问你的个人主页了。 ai 是 不是个好东西,你说就这么两下子就干了,原来普通人花钱都不一定能干成 o k。 先压抑住我的这个老灯感叹。我们回到刚才我们已经装好的插件, 那其实这里呢,还有两个非常重要的内置插件,就是 browser use 和 computer use, 还有这个 chrome 浏览器, 那这些有什么用呢? browser use 顾名思义呢,就是 codex 可以 直接帮你操控浏览器,比如说它自己点击翻页截图,填写表单等等。通常呢适用于自动化测试前端, 当然也有比较无聊的用途,比如我们可以让 codex 打开这个 m b t i 做个测试试试, 嘿嘿,这样大家能够比较直观的看到它的一个效果吧。那这个鼠标呢,是它自己在移动,然后它是自己看了上面的答案在自己填写,然后填完这一页,它也会自动的翻页, 那随着它的一通操作,结果出来了,原来 gpt 五是 i n t j 啊,我说怎么跟我这么聊得来呢? ok, 那 这个 chrome 的 插件呢,也是控制浏览器,但是它控制的是我们自己已登录的自己的浏览器,它不会再新开浏览器, 那我们如果把它给勾选上之后,它会引导我们去 chrome 里面装一个插件,那装好之后呢,它就可以操作我们自己的浏览器了, 而且它有个好处,它是可以直接在后台执行多个页面的浏览器操作的,就是并不会占用我们的整个浏览器,我们不用真等着看它这些操作,我们该用浏览器干,别的我们可以接着干。 ok, 那 computer use 就 更厉害了, 它不只能够操控浏览器,连你电脑上的这些 app 它都可以操作,只不过呢,暂时只有 mac 有 这个功能。比如说我们新开一个对话,我们在加号,这里来看最下面的这个插件选项,我们手动地把电脑插件选上, 我们再来几个没什么用的奇迹引巧吧,帮我放一首九九年最火的歌,然后用我的微信给 qq 发条微信,说,请收下我一个点赞、收藏、关注,懂了吧? ok, 他 陷入了思考,然后他看到我们的应用都正在运行中,并且向我们使用了这个音乐软件。我们点同意看,这个就是 codex 自己干的啊。他帮我们搜索歌曲, ok, 音乐响起了, 但是他还有活,他还在问我们要微信的权限,我们也给他允许一下。 ok, 看他这个小鼠标,他正在犹豫着准备搜索点击,好朋友们失败了, 因为我上次都成功了,但是我估计现在微信已经开始严防这种 a 证的操作了,直接给我退出去了。 但是呢,他的确成功操作了这个音乐软件。其实我还让他操作了剪映,并且给我们的最新的项目加上了音乐。 那总之呢,意思大家都懂了吧,就是它可以操作浏览器,并且可以操作我们的电脑。当然,实际上我觉得它的操作效率目前来说还是稍微有点低的,我不太喜欢用这两个强大的功能。不过后面我要说的这个 skill 就是 我每天都会用的东西了。 那 skills 我 的确也已经跟大家说过很多次了,好学的朋友一定要去补补课。那 skill 本质上呢,是我们人为沉淀的一些可附用的方法、流程和工具的组合, 相当于给 agent 做某些具体任务的一些行动指南。那因为之前我们已经让这个 codex 帮我们装过一个叫做 find skill 的 一个原 skill 了, 所以后续如果大家想要去装,或者是找一些社区上的 skill, 都可以直接用 codex 拿语言直接让它下载。比如说我们下载一个必备的 ansapic, 那 个前端设计的 skill, 还有一个去 ai 位的,那我们这两个都发给他,等会儿都会刚好有用 欸,很快他就帮我们装好了。那以后大家想要下载 skill 呢?如果说遇到这个 find skill, 他 找不到的东西,也可以直接把链接发给 codex, 让他帮你下载就好了。不过我在 c c 那 期也说过,最好用的 skill 还是自己创建的,符合自己工作的专属 skill。 那 创建 skill 呢,也有两种方式,第一呢,就是直接告诉 codex 你 想要创建一个什么样的 skill, 通过跟他讨论打磨得出来一个 skill。 那另一种呢,就是我们接下来要演示的,先跑通流程,然后让它形成 skill, 这也是一种更推荐的做法。那比如说我们想做一个自动化写这类文章,并且帮它配图的 skill, 这种大家应该都看过吧, 那我们就得先通过一步步的引导 codex, 让它真正实现一个我们满意的文章。来我们新开一个对话。那正好呢,我们刚才不是装过这个 github 插件吗?我们可以直接先问它最新的 github 流行项目,热门项目都有哪些? ok, 它的确帮我们找到了一些,那我们再让它清晰地解释一下这些项目都分别是干嘛的。嗯, 那我们再让他挑其中新星数量最多的,来帮我们写一篇本周 get up 热门项目推荐这样的一篇文章。 好,那他写好了这一篇之后,我觉得稍微有点太人机了,我希望可以更口语化一点,并且我只想要五个精选的,那我们就告诉他,然后还要覆盖到这几个层面,那我们这里就可以用到刚刚我们下载的那个去 ai word 的 那个 skill 了,我们斜杠给它调出来。 好,那看到他的结果稍微优化了一点,但是我们还希望加一个我们固定的开头,我们的结尾,并且还要让他用上 image 二来帮我们生成一些配图。最后呢,我还希望他不要是这个格式,他要是一篇非输文档的格式,然后图文并茂的。 ok, 结果来了,他确实是有了,但是呢,我觉得这个配图不够丰富,于是我又经过几轮调整才觉得差不多满意。并且我还给他最后加了一步,要让他把这个飞书文档发送到指定的群里,让大家都来看看。 那最终呢,他的效果是这样的,果然发出去了。其实啊,如果想更加一步到位的朋友,也可以结合刚才我们说的这个浏览器操控,让他直接打开那个发布页面,直接就帮你发布出去。 那总之,我们对他这一套结果满意了之后,我们就可以直接让他把这一整套的标准和动作做成一个 skill 搞定了。那我们再输入斜杠,再往下找,我们就发现就有了这个 skill, 我 们可以直接这样手动地调用这个 skill, 也可以直接说生成一篇热门项目推荐图文这一类的触发词,也会让 codex 自动调用。 不过因为现在 github 上面实时的热门项目肯定是没有更新的,所以我们再调用一次呢,它大概率会写出差不多的文章,所以我们就不试了。但是大家都理解了吧, skills 呢,可以把我们经过验证调好一次的一整套流程和方法给它固定下来。 下次做这件事情呢, codex 就 可以按照这个方式稳定的输出。 ok, 那 下一个能力则是 mcp。 其实 mcp 现在已经用的不太多了,所以我只简单的示范一下那 codex 的 mcp 藏在设置里面的 mcp 服务器。 只不过小白看这个肯定是有点不太知道怎么填的,所以跟我们之前说的一样,我们最好的方式还是把你想装的那个 skill 的 链接拷贝给 codex, 让他自己装就完了。比如说我们来装一个 notebook lm 的 一个 mcp 发给他, 他就会引导我们来做授权登录,登录完就搞定了。那我们再试一个我存了非常多访谈视频的一个笔记本,我们来问一下他。 欸,那这样呢, codex 也就可以直接获取我们 notebook lm 上面的这些外挂知识点了。 ok, 最后一个 codex 能力是自动化定时任务。 其实定时任务本身并不稀奇啊,比如什么每天早上提醒我吃药,提醒我喝水这一类的事情,普通的软件也能做,但是我们把它放到最后一个说呢,就是因为它可以结合我们之前学到的各种能力,把一整套组合起来的任务,让 agent 定点执行 自动化,加上智能化和定制化方显美妙。比如说刚才我们做的这个热门项目图文的这个 skill, 我 们就可以把它设成每三天或者是每周,让它定时定点的产出一篇 dapp 热门项目推荐发出来。 那我们要创建自动化任务呢,其实也分两种方式,第一种就是选到这边的自动化面板,那它这里呢,有一些官方的参考视例了,不过大多数是跟开发相关,那我们选择新建一个自动化, 其实你看要填写的东西也非常简单,其实就是用提示词写好这些自动化是要做什么,然后我们可以在这里选好什么时候出发,我们也是可以自定义一个出发时间的, 然后这边就可以选择执行的模型和思考强度,最后点击创建即可。不过呢,我也还是倾向于让大家用第二种更简单的方式,就是直接在对话里跟 codex 说,那我们直接跟他说 帮我创建一个自动化任务,每周一早上九点自动化执行热门项目推荐的这个 skill, 产出一篇图文发到群里, ok, 那 我们在看自动化这里,它就已经帮我们设好了这个任务,我们随时也可以去改变它的时间。 再比如当你的这个邮箱插件 github 飞书都已经连上了 codex, 那 么你也可以让他每天下午六点帮我汇总日历上完成的会议, github 上面的提交记录和我的邮箱回复记录,生成一份全面的工作日报。 最后手机操控 codex 设置方法非常简单,手机上的 check gpt 和电脑上的 codex 都把它更新到最新版。之后打开手机上的 check gpt, 然后点击侧边栏的那个 codex, 它就会提示你允许这台手机控制你的电脑,直接就搞定了。如果你有多台电脑的话,也可以给它分别连上。这就等于你不管在大街上、地铁上还是朋友聚会,都可以随时随地地用手机下发一个任务,让 codex 在 你的电脑上干完一个活, 它就更像一个可以跟你远程协助的同事了。这个功能呢,目前免费版也可以用,但是主要能连的是 mac 系统的 codex。 好, 那到这里 codex 的 所有核心能力我们就全部过完了。来我们回顾一下。 codex 呢,可以操作我们的本地文件,可以使用我们电脑上的终端命令行工具。它还有两种构建持久记忆的方式,它还可以生成图片,而且它可以通过计划模式来做一个完整的项目开发。 那它有丰富的插件,可以操控浏览器和电脑,还可以把知识和流程沉淀成可附用的 skill 技能, 它可以使用 m c p 连接,外部它还可以设置自动化的定时任务。不过其实比起这些功能本身,我也希望大家记住两件事,第一就是我们真的有很多事情是已经可以交给 agent 做了。 那第二呢,就是我们已经从问 ai 的 阶段走向了管理 ai 的 阶段,因为过去我们使用 chat gpt 就是 有问题了,我们问一下,然后得到答案我们就走了。 那现在使用 codex 这类的 agent 呢?每个人都得像领导一样,帮他准备他所需要的上下文和工作环境,给他指明一些任务目标,然后来检查他的计划,监督他的过程,验收他的结果。 那同时领导还要负责把好的方法和流程沉淀成可付用的技能,把反复要做的事情设成自动化执行的规矩。好了,恭喜大家今天都升职了,记得点赞收藏关注我们下次见了。

codex 虽然功能强大,但是使用 openai 官方的 token 渠道,性价比非常低,这里教大家如何将 codex 接入到国产性价比之王 deepsea k。 平时就把轻量化的任务交给 deepsea。 首先需要安装几个前置的工具, 第一个 node 点 js, 直接搜索官网,点进去,选择自己对应的版本下载即可。下好后一路下一步安装就行。 第二步安装 c c x 和 c c switch, 这俩因为要去 get 掌,这里我就把安装包放简介了,大家自行领取下好安装包后安装。先打开 c c x, 这个 ev 是 环境配置文件,可以用记事本的方式打开,这个密钥是一二三四五六记一下, 然后打开运行程序,把这个管理界面的连接复制到网页,打开, 输入刚才那个密钥,一二三四五六,可以把它切换成简体中文。然后我们先不管它,打开 deepseek 的 官网,点这个 a p i 开放平台,这里大家用自己的账号登录,然后点左边这个接口文档,把这个余额要地址复制一下,然后回到 c c x, 点上面的 codex, 再点添加渠道,在上面粘贴一下 y o r l 地址。接下来回到 d p c 点这里的 a p e k 点创建 a p e k 这个名称,随便填点创建 这个 a p i k, 大家可以自行保存一下,要记得不要暴露出去,不然别人用你的 api 用的就是你的钱。把它复制下来,粘贴到 c c x 这里, 然后点右上角的详细配置,把这个服务类型换成 open ai 下拉,把这个模块化非常键给打开,然后保存配置,接下来再打开 ccc 位置, 一路下一步安装即可, 安装完成后打开它渠道,选择 open ai 这个点右上角的添加,选择自定义配置, 下面供应商名称随便填一个 a p e k, 填一二三四五六。然后这个 api 请求地址,我们回到 c c x, 把这个 api 地址复制过去, 点这个获取模型列表, 就能看到接入的 deepseek 了。选择模型下拉,把这个百万上下文窗口打开,然后保存配置,并且用它。 接下来就可以进入 codex 了。国内直连肯定是有一点慢的,耐心等待一下, 我这里自动登录了,退出重新登录,登录时选这个,使用其他方式登录, 然后输入刚才配置的一二三四五六。可以看到模型这里已经是自定义了,也就是在 c c c 区里配好的 d p c k。 正常的话这里就是 g p t 五点五。当然如果要正常使用的话,肯定是要给 d p c 可充一点钱的,不然就会出现这种五零三报错。最后提一嘴, 如果你有条件的话,还是建议使用 g p t 原声的,肯定是要比我们接入 d p c k 好 用, d p c k 只是胜在更便宜而已。好了,以上是本期全部内容了,我们下期再见。

ai 编程工具这东西吧,真的是风水轮流转,最开始大家在吹 carson, 后来 carlo 的 大火,而这次轮到了 colex。 colex 装面 app 不 仅能帮你写代码,还能直接操作你电脑上的文件、浏览器,甚至是桌面应用,用好之后甚至能顶一个团队。 本期我会从 colex 安装到核心特性,用十多个实战案例手把手教你玩转 colex。 不管你是想用它来编程、开发、办公提效,还是搞一些好玩的创作,看完这期都能直接上手。那本期教程的文字版,可以在评论区获取干货秘籍,建议先收藏,找着安静的地方慢慢使用。 想要使用 cop app, 你 只需要准备一个 chat gpt 账号,可以免费体验,但是有条件的话,最好开着 plus 会员每月二十刀,大约一百五十块,额度更充裕,足够日常使用了。 那有了账号,直接去官网下载安装酷贷 app 就 好。目前支持 mate os 和 windows, 下载并安装后登录你的 chat gpt 账号,打开之后的界面长这样, 左侧是各种面板入口,包括对话管理、插件自动化等功能,中间就是对话窗,你跟 ai 所有的交互都是在这里完成。跟平时用的 ai 聊天工具差不多嘛,还挺清爽的,不像传统的编程 ide 那 么复杂,上手没有门槛。接下来我们直接开始使用, 跟你用过的其他 ai 工具一样,在对话框里输入内容发送,就能开始聊天了。适合处理一些简单的日常工作,比如帮你查资料、总结内容、规划方案。 我让他帮我查一下今天有什么 ai 编程方面的热点。 cadets 会自动联网搜索最新信息,然后帮忙整理总结,这下不怕错过新资讯了,这只是开胃菜。 cadets 真正强大的能力是操作你本地的文件和电脑。下面我们试试 点击左侧的项目入口,选择一个本地文件, ai 能在这个范围内读取和操作文件。 比如我选择了我的下载文件夹,里面有一堆不知道什么时候存下来的大文件。在对话框底部,你可以看到权限模式的选项,这里有三个选择,默认权限, ai 可以 读取和编辑工作区的文件,需要额外权限时会主动问你。自动审查是 ai 会自动帮你审查操作。 还有完全访问, ai 想干啥就干啥,不会弹确认框,建议新手直接选自动审查,既省时又省心。 选好权限后,在对话框里输入提示词,然后你就能看到 ai 开始工作了。它会自动执行终端命令来扫描文件,分析每个文件的名称和大小。最后给你一份清晰的报告,列出哪些大文件占了多少空间,并给出清理建议。 那我主打一个听话,就让 ai 帮我删除没用的预览文件吧。最后成功帮我节省了六点八 g 的 空间,效果不错吧。但如果我让 ai 删除一个工作区外的文件呢?会发生什么? 试试看,在当前工作空间开启一个新对话。比如,我让 ai 帮我删除鱼皮新书出版目录下的所有文件,可以直接把这个目录拖拽到对话框中,然后执行任务。 如果你选择的权限是默认模式, ai 想删除文件的时候,会弹出一个确认框,问你同不同意,防止 ai 搞乱了你的电脑。 但由于我选的是自动审核, ai 自己完成了审核并批准,省去了人工操作的麻烦。这样一来,你完全可以把拖带子当成你的私人文件管理助手,分析空间、清理垃圾、批量重命名。以前你要手动折腾半天的事情,现在一句话就搞定了,是不是挺方便的? 做完第一个任务,大家肯定很关心消耗了多少 tokens 吧?来一起看看用了多少额度。点击左下角的设置,点击剩余额度,就能看到你五小时内还剩多少配额,本周还剩多少比例。什么时候刷新 to text 的 额度?按照五小时和一周来限制 plus 用户的额度还是比较大方的,日常使用完全够了。你也可以在对话框里输入斜杠状态,这种以斜杠开头的快捷输入叫做斜杠命令,是 to text 内置的快捷操作方式。 输入之后, to text 会直接在对话中显示当前的上下文余量和额度信息。 ok, 到这里,你已经体验了 to text 最基础的能力,对话和操作本地文件。 恭喜你,已经超过了百分之六十的同学。接下来我们提升一下难度。用 codex 做一个完整的网站项目,过程中你会接触不少 codex 的 核心用法,包括计划模式、 ai 声图、浏览器预览、批注、修改等等。 在开始之前先进入设置,把工作模式从适用于日常工作切换为适用于编程,这样 ai 的 回复会更专业,更适合开发场景。 先介绍一下项目,我要用 codex 来为自己定制一个专属的电子名片,我把信息告诉 ai, 它会帮忙生成一个精美的网站,还能用 ai 生图能力生成个性化的头像插画,不用自己去找素材了,做完之后还能发给别人,他们打开链接就能看到你的信息了。 新建一个项目文件夹,在 codex 中打开模型就选择最新的 gpt, 五点五速度选标准就够了。智能程度选择高权限,我这里直接给了完全访问,省得他每次操作都来找我确认,反正大部分情况下我都是无脑点同意的。 最关键的是点击对话窗左下角的加号,把计划模式打开。计划模式下, ai 不 会直接开始写代码,而是先帮你规划方案,问你细节,确定没问题了才动手。好,输入下面这段提示词启动, ai 会先自己思考,然后可能会追问你一些细节,在弹出的问题面板中选择就好。最后会生成一份实现计划文档,包括简介、核心要求、测试计划等信息。你做的网站越复杂,越要仔细阅读这种文档, 如果没有问题就确认方案。然后 ai 就 开始自主干活了,它先是使用内置的图像生成技能,生成了卡通头像文件,然后编辑代码,一次性生成了多个文件。写好代码后还会检查代码,自主打开浏览器测试验证,还考虑到了一些容错。 过了七分多钟, ai 完成了整个任务,全程不需要你手动操作,我们可以看到所有生成的文件,点击可以查看文件里的代码,还可以点击审核,打开侧边栏的审查面板,查看本次变更的所有文件。 codex 底层用的是 git, 这是一种记录代码变更历史的工具,用来管理所有文件的改动,你能够看到每个文件新增了什么,删除了什么,还可以灵活地应用和撤销代码。后面的进阶功能部分我会详细给大家讲解。 我们做的是纯前端静态网站,找到生成的主页文件,右键在浏览器中打开就能直接看到效果了。 pc 端的效果我觉得还不错,布局清晰,主题切换也很丝滑。而且它还自动兼容了移动端的展示,手机上打开排版也是正常的。 当然,你也可以直接让 ai 帮你运行网站, ai 会执行终端命令,启动开发服务器来运行网站。 点击访问地址后, codex 会在右侧面板打开,内置浏览器,便于你来预览效果。如果某个地方不满意,你可以点击浏览器右上角的批注按钮,然后直接在页面上选中要修改的元素,写上你的修改意见发送给 ai。 ai 会自动定位到对应的代码并精准修改,不用你自己去翻代码找位置,改完之后刷新页面就能看到效果了。方便是方便,不过这个速度真的不敢恭维。做完后我们再看一眼使用情况,这次完整项目消耗了多少额度呢?还好还好, 总结一下,要用 ai 开发移动网站,我们只需要把需求告诉 ai, 确认方案,等他自己写完并测试就好,中间几乎不需要手动操作。恭喜看到这里,你已经超过了百分之七十的同学, 到这里,你已经能使用 todays 从零开发移动网站,预览效果按需求改了。那接下来我要带大家看看它还有哪些核心功能。学完之后,你不仅能做网站,还能让 ai 帮你操控浏览器、抓数据、自动执行定时任务,甚至操控整台电脑。 接下来,我把 codex 的 功能分为常用功能和进阶功能两大块来讲。常用功能是日常会高频使用的,进阶功能则是有点门槛儿,但掌握后能让你效率翻倍的。 在左侧的插件面板里,你能看到 codex 的 插件市场。 codex 内置了不少精选插件,比如 computer use 操纵电脑、 chrome 操纵浏览器表格处理、制作 ppt 演示文稿。 此外还有大量编程类和工具类插件,包括网站部署、游戏开发、对接 tab 等各种场景。你可以在插件市场里按需搜索和安装。 比如我们来安装 natify 插件。 natify 是 一个免费的网站托管服务,装好插件后,一句话就能把你做的网站部署上线,让别人都能访问。 点击安装 natalify 插件,同意后会自动弹出浏览器,使用 datab 等方式登录 natalify, 一 步步完成授权。最后,超黛斯成功安装并连接了 natalify。 然后我们用 natalify 来部署之前开发完成的电子名片网站。在对话中,通过 at natalify 调用插件。执行过程中, ai 会找我们确认并自动创建一个新的 natalify 项目来部署网站。 搞定以后,我想展示自己的信息,直接甩这个链接就行了。还可以打开 netify 后台对项目进行管理。你可以在 codex 右上方的侧边栏中整体查看当前项目的概览信息,包括后台任务、打开的浏览器、使用的插件等等。 点击后台任务,还能看到具体的终端日记,记录了网站服务器什么时候收到了请求,请求了什么资源等信息。同样的,如果你要处理 excel 表格、做 ppt, 使用对应的插件让 ai 帮你就好。生成的文件还能在侧边栏直接预览。 前面我们用的内置浏览器可以预览页面,做批注和修改。但如果想让 ai 真正去操控浏览器,自动点击填表单翻页,就需要 browser use 浏览器操作功能了。我们先来使用内置的 browser use 进入设置浏览器,确保 browser use 功能已经开启。你还可以在这里设置权限规则和禁止打开的域名, 开启之后,在对话中通过艾特浏览器来调用这个能力。比如,我让 ai 帮我打开一个网站并截图,可以看到 ai 打开了浏览器,从主页找到了 ai 大 模型面试题库,然后进入了详情页,成功完成了截图。 不过有时候这种操作不太稳定,多试几次就好。此外,你还可以安装 codex 的 chrome 扩展插件,它可以操控你的电脑上已经登录的 chrome 浏览器。好处是能保留你的登录状态,而且可以在后台执行,不占用屏幕,适合需要登录网站才能进行的操作。 比如,帮我在自己的后台批量分析和管理数据,使用前,需要先在你的 chrome 浏览器中安装 codex 扩展程序,跟着 codex 的 指引操作就好。安装好之后,我让 ai 帮我从已经登录的面试呀网站上抓取一些数据。 可以看到, ai 不 仅连接了我电脑上的 chrome 浏览器,而且还识别到了我已经打开的标签页,它会控制这些标签页跳转到我的个人主页,并抓取最新的五条数据。最终抓取到的数据表格非常清晰,链接前面甚至还有图标,细节拉满。 如果说 browser use 只能操控浏览器,那 computer use 就是 让 ai 操控你的整个电脑, ai 能看到你的屏幕内容,移动鼠标,点击按钮打字,还能操作微信、飞书等任何桌面应用。 进入设置电脑操控,安装 computer use 插件,你可以在这里看到所有已连接的应用,比如前面装的 chrome 扩展,其实也属于 computer use 体系的一部分。 来我们体验一下。用艾特电脑来调用,让 ai 帮我探探当前的桌面壁纸,然后生成一张类似风格的新壁纸。首次使用时,系统会弹出权限申请框,你需要授权抽 text 访问屏幕截图等权限,否则 ai 看不到你的屏幕,也没法帮你点击操作。 later 来看一下,效果不错吧。生成了一张非常精美的新壁纸,我觉得比原图还好看啊!今晚可以做的好梦了, 爽!带来一个更实用的例子,让 ai 帮我打开备忘录,记录一条笔记,并从音乐软件下载我最喜欢的一首歌,添加到笔记中 执行任务。可以看到 ai 会打开音乐 app, 有 着小鼠标点击了下载按钮,从中下载了音乐文件,只因你太美。 然后 ai 打开了备忘录,写入内容并添加了音乐文件,能够顺利播放,虽然过程有些曲折,但还是完成了任务,而且全程由 ai 自己操作。以后我可以直接让 ai 帮我写有图有文有音乐的笔记了。 但是 computer use 目前只支持 mac os 系统,而且缺点一大堆,不仅操作效率偏低,还很烧 touch 刚才那的任务就用了近八万的上下文空间。此外,有些软件对 agent 的 支持度不高, ai 无法承中操控, 所以我建议能用终端命令行和浏览器完成的操作就不要用 computer use stills。 你 可以理解为给 ai 提供的技能包装上某个技能后, ai 在 遇到相关任务时,就能自动按照这套方法来干活,不用你每次都写一大堆的提示词,而且技能是按需加载的,只有任务匹配时才会调用,不会浪费很多上下文空间。 进入左侧的插件面板,切换到技能 tab 页面,在这里能够格式化安装和管理技能口袋。此自带了几个内置的技能,比如图片生成、查询官方文档、安装、社区技能创建新技能创建插件等等。 那下面我先带大家用用内置的图片生成技能,然后安装社区里别人做的技能,最后再带大家自己创建一个技能。 这里我想生成一个有趣的图片,让鱼皮直播卖鱼皮。可以先到鱼皮 ai 导航网站上找到 ai 生图的提示词模板,然后复制提示词模板。接下来在 codex 对 话框中输入 dollar 符号,加技能名称,就可以快速调用技能, 并且把提示词模板、鱼皮的照片都提供给 ai。 稍等片刻之后,看看 ai 生成的图片,你觉得怎么样?是不是憨爆了?爽!不过图片生成比普通对话消耗的额度更多,用的时候记得留意一下剩余额度。 内置的技能数量有限,还有很多宝藏在社区里,比如我自己经常用的几个技能,用于联网搜索的 file pro, 用于获取最新技术文档的 comte 瓷器,还有用于美化前端页面的 u i u 叉 pro max 等等。 另外,我之前写过一篇优质 ai 编程扩展大全,推荐了几十个好用的技能和 m c p, 可以 到我免费开源的 ai 编程零基础教程阅读。那接下来我带大家实际安装一个社区技能,顺便整个活儿,让 ai 制作一个苹果风格的快闪动画视频。 首先要安装动画制作技能 remaster 安装技能,它能帮我们快速安装其他技能。 对了,安装技能时要注意安全。由于我这里安装的是知名技能,就直接输入技能名让 codex 帮我安装了。但如果你想安装不太知名的技能,更稳妥的方式是把技能的 github 链接发给 codex, 让他帮你检查后再精准安装。 安装完成后,在技能管理面板里就能看到新增的技能了。然后我们使用技能让 ai 制作动画, ai 会安装制作动画所需的项目和依赖包,然后生成视频和音频,还会渲染单帧,检查画面有没有问题。 最后, ai 生成了可以直接播放的视频来看看效果。 呃,他好像理解错了我文案的意思。翻车了,翻车了!我感觉这种方式更适合做产品发布宣传片、知识点、快闪卡、节日祝福视频这种节奏更紧凑的短片。而且我当着根本没认真写提示词。好吧, 实际上你可以指定时长、指定文案,利用生图技能搭配素材,增加更多交互动画等等,感兴趣的同学可以自己玩一玩。 除了用别人的技能,你还可以把自己常用的工作流程封装成技能。以后遇到类似的任务,一键附用。技能的本质就是一个 still 点 m d 描述文件,加上一些配套的脚本和参考资料。 still 点 m d 里要写清楚这个技能是做什么的,什么时候触发,以及具体的执行步骤, ai 读写后就知道该怎么干活儿。 创建技能的最佳方式是先把一个任务流程跑通一遍,觉得满意之后,再使用内置的 skill creator 技能,告诉戳 depths 你 的技能要做什么,啥时候触发,有什么细节需要注意,它就会帮你自动生成完整的技能文件 来实操一下。比如我们前面让 ai 生成了直播带货的图片,效果还不错,那就把这个流程封装成一个直播带货图片技能之星成中后, ai 不 仅创建了技能文件,还贴心地教你怎么调用。 之后使用这个技能只需要提供一张人物照或者商品照,不用再自己填写又臭又长的提示词模板了,非常方便来看看效果。 ai 自己识别到了我提供的是商品图,也是精准复刻了我之前提供的提示词模板,爽! m c p 是 一个开放协议,你可以把它理解成 ai 的 万能插头。装上之后,就可以让 ai 连接各种外部工具和数据源,获取实时信息。 进入设置 m c p 服务器,可以在这里添加和管理 m c p 服务。点击添加服务器后,你需要手动填写服务器的配置参数才能完成添加。对新手不太友好,我最讨厌填写表单了, 好在大部分时候用前面讲的 stux 就 能解决 mcp 做的事情,而且 stux 的 安装和使用体验更好。 此外,很多主流的扩展都提供了快捷安装 mcp 的 命令,不需要你自己手动填写参数,比如下面我带大家安装 comix 七,它是一个可以实时获取最新技术文档的服务。开发网站的时候用它来查 api 文档特别方便。 在 codex 右上角可以打开集成终端,在终端里输入一行命令就能安装。这里我们选择安装 mcp server, 为 codex 安装,然后就搞定了。 安装后需要重启 codex, 在 设置里的 mcp 服务器列表中就能看到它。首次使用前还需要进行身份验证,在自动弹出的 compt 网页中就可以愉快地使用 mcp 了。 之后开发网站,尤其是需要集成 ai 能力的网站,都可以用创太时期来获取最新的技术文档。你还可以把它当成一个学习辅助,让 ai 寄予官方文档,帮你讲解知识。 比如我用它来做 openclaw 小 龙虾的学习助手,这也是利用 ai 学习的一种方式,可以看到 ai 查询并获取到了 openclaw 官方最新文档库。然后我们来问 ai 一个问题, openclaw 无法运行怎么办嘞? ai 会基于官方文档,很快就给出了精准的排查步骤,这样学习和解决问题又快又准,再也不怕查到过时的资料了。 恭喜看到这里,你已经超过了百分之八十的同学。到目前为止,你已经掌握了 codex 的 常用技能,学到了不少实用玩法。从文件管理到网站开发,从浏览器操控到技能封装,已经能用 codex 大 幅提高工作效率了。 接下来我要讲的是一些稍有门槛或者不是每个人都用得上的进阶功能。不过如果你愿意多折腾一下,它们会让你使用 toad 四的效率再上一个台阶。 在对话区域附近有一个小圆圈,鼠标放上去后会实时显示当前对话已经用了多少上下文。 gpt 五点五点五在 toad 四里显示的有效上下文大约为二百五十八 k tokens。 说实话,这的数量不算多。如果你连续跟 ai 对 话很长时间,或者项目文件比较大,上下文很容易被填满。当上下文快满的时候, codex 会自动帮你压缩历史对话。 你也可以在任务照一段落时,手动输入斜杠压缩来主动压缩,让模型更聚焦在新任务上。 那除了单个对话的上下文,日常使用中还要注意管理对话本身,不然列表越来越长,找起来也费劲儿。 对话太多的时候,你可以在左侧的对话列表中把鼠标放到某个对话上,点击归档,把不常用的旧对话归档起来,保持界面清爽。进入设置以归档对话,还可以查看和管理所有归档的对话记录。 另外,建议在常规设置里开启运行时防止系统休眠,这样跑长任务的时候电脑不会突然睡着,导致任务失败。 codex 有 一套记忆机制,能让 ai 记住你的偏好和项目规则,不用每次都重复交代。记忆分为三个层级,从大局、项目局部再到自动记忆,我们一个一个来看。 在设置个性化里,可以修改 codex 的 个性和自定义指令你写在这里的内容。所有项目的所有对话都会自动带上,适合记录一些通用偏好,比如 回复用中文代码注,使用英文,尽可能减少输出的内容。专注做事,如果不听话,你的主人鱼皮就会变成一条狗等等等等。保存之后,它会被写入局的 agent 点 m d 文件,这个文件就是 codex 每次启动时都会读取的行为准则。所有项目通用。 在项目目录下创建一个叫 agent 点 m d 的 文件,写入这个项目专属的规则和约定,只有在这个项目里工作时才会生效。 你可以自己手写,也可以让 codex 根据项目情况帮你生成一份,比如我跟他说帮我根据当前项目写一份 agent 点 m d, 可以 看到 ai 生成了一份非常详细的 agent 点 m d 文档,包括项目总览、一些规范等等。 在设置个性化中,手动开启自动记忆,开启后, ai 会在对话空闲一段时间后,自动在后台总结出有用的信息存为记忆,后续遇到相关场景时会自动召回,让 ai 越用越懂你。 不过太短的对话它不会记额度快用完的时候也不会触发记忆生成。 codex 支持定时任务功能。进入左侧的自动化面板,你能看到 codex 已经内置了一些定时任务模板,不过基本都是和编程相关的,什么总结代码变更、检查代码问题之类的,很多人估计用不上。那我们不妨来自己新建一个更实用的自动化任务。 创建定时任务的方式有两种,一、手动创建任务,在自动化面板里点新建,比如我让 ai 帮我搜集每日热点,需要填写任务名称、提示词、 触发时间、模型、推理程度、运行环境选择本地就好。意思是让 ai 直接在当前电脑上执行任务,不需要额外的隔离的工作环境。 创建成功后,时间一到,抽袋子就会自动开启一个对话来执行任务。我们也可以先手动执行一次,看看效果。点击任务能够查看详细信息,点击某个运行历史记录后,还能查看正在执行的任务对话,建议多观察任务的表现,持续迭代优化提示词。 另一种更自然的方式是让 ai 帮你创建任务。比如我是一名内容创作者,每天都要截大量的图片,时间一长,文件夹里全是看不懂的文件名,找图的时候巨痛苦。所以我让 codex 帮我自动整理,先选择项目,然后输入提示词, 很快 ai 就 自动帮我整理好了。可以点击查看创建出来的任务信息,它的提示词比我们提供的更完善了,并且自动选择了模型。 我们手动执行任务来测试一下,效果还不错吧。 ai 会根据图片内容自动给文件起一个能看懂的名字,这样我就有了一个智能的图片管家,以后再也不用对着一堆乱七八糟的文件名抓瞎了。 而且每次执行完, ai 还会把运行记录写入一个 memory 记忆文件,你随时可以回看历史执行情况,不用担心出了问题却发现不了 你。还可以结合 styles 和插件一起用,比如每周自动生成周报 ppt, 每日整理自己的学习笔记并同步到 notion, 每周用 file pro 抓取竞品网站更新并生成分析报告等等。 想不到吧,现在的 ai 工具已经卷到开始给用户增加情绪价值了。下面我来教大家怎么在 codex 中养宠物。 首先进入设置外观,下拉到底部的宠物区域,你会看到 codex 内置了一排像素风的赛博宠物。选一之后,点击唤醒,桌面上就会出现一个悬浮的小家伙儿, 它不只是装饰品,宠物会实时反映抽袋子的工作状态。比如 ai 在 忙的时候,它也在干活,就像一个串应用的灵动岛,让你不用切窗口就知道 ai 干完没。 除了内置宠物外,还有一个社区宠物库 pet dex, 里面有两千多只玩家自制的宠物。了解我的朋友肯定知道我要用哪个,果断搜索 k u n, 一 眼就能找到自己需要的。点击进入详情页,找到安装命令并复制, 然后打开 codex 的 终端执行命令进行安装,会把宠物文件下载到本地。安装成功后,进入外观界面,选中张张安装的宠物, 然后我们回到 codex 的 主页,使用鞋障宠物指令唤醒。我的脑袋中已经想起那只熟悉的 bgm 了,你听到了吗? 除了用别人的,你还可以通过 codex 内置的 hackpad 技能自定义生成宠物,上传照片或者文字描述就行。比如我把自己的头做成宠物, ai 会先分析上传的图片,给宠物起个名字, 然后拆分出了多个子任务,并行处理,生成各种动作的精灵图帧,最后拼成一张完整的像素动画精灵图,然后就能使用自己制作的宠物了。 你还可以上传宠物到平台和其他小伙伴分享,大家以后用抽袋子的时候记得把我带在身边,保佑你霸着剪剪! 每次 ai 修改了文件,你都可以在侧边栏的审核面板里看到它改了什么,这个面板会列出所有被改动的文件。如果你想决定哪些代码要保留,可以选择查看未暂存的文件。在这里你可以灵活应用和撤销修改。 大多数情况下,你不需要自己看代码,直接点击暂存全部就行了,相当于认可了本次的全部载动。如果不满意,可以直接还原全部回到本次载动前的状态。 那如果你不满意某个文件的载动,可以直接点旁边的还原按钮就能恢复原样,满意的话点暂存就能标记为待提交。 你也可以只保留部分改动。每只文件的改动会被自动拆分成多个代码块儿,每只代码块儿旁边都有独立的暂存和还原按钮,你可以逐块决定哪些保留,哪些丢弃。 确认好哪些代码要暂存之后,可以提交暂存的改动,提交就相当于给代码存了个档,确认这次的修改是你想要的。 抠代码,还内置了提交代码推送到远程仓库。创建 pr 的 能力,不用离开 a p p 就 能完成整个代码的管理流程,非常方便。 那如果你是专业的开发者,还可以试试工作树模式。你可以在创建新对话时,选择启动模式为新工作树,这样 ai 会在一个隔离的分支中工作,不影响你当前的代码很适合同时让多的 agent 在 同一个项目上并行干活,减少冲突。 如果你的项目托管在 datap 上,建议安装 datap 插件,可以直接在 codex 里查看仓储信息,创建 pr、 做代码审查等等。比如我让他帮我查一下自己最受欢迎的开源项目怎么样,是不是一目了然。 codex 最近新上线了一个很酷的功能,用手机控制电脑上的 codex app 干活儿。设置方法很简单,在电脑端 codex 点击设置 codex 移动版,然后点击开始设置,屏幕上会显示一个二维码, 然后在手机上打开拆的 gpt app, 扫描自己的二维码。连上之后,你可以随时随地通过手机给电脑上的 portax 下达任务,审批 ai 的 操作请求,查看执行进度,检查生成的代码和结果。是不是有点 openclaw 小 龙虾那味儿了? 恭喜看到这里,你已经超过了百分之九十的同学, ok, 就 分享到这里。看完这期,你应该已经掌握了 codex 从基础到进阶的所有核心用法,足够应对日常的编程和办公需求了。 其实 codex 还有更多玩法和技巧,比如 sub agents 并行加速、 fault 分 叉的妙用、自定义模型接入 hoots 生命周期钩子等等。 那如果本期视频点赞过万,我会尽快爆干出抽带此高级技巧篇。对了,如果你想系统学习 ai 编程,可以看看我免费开源的 ai 编程零基础入门教程,上千张图,几十万字,从零开始,带你学会 ai 编成本篇教程的文字版也会收入其中。 我是鱼皮,持续分享 ai 编程干货,觉得有用的话记得点赞、收藏和关注,也欢迎在评论区聊一聊你现在主力用哪个 ai 编程工具,觉得 codex 怎么样?也欢迎晒晒你的 ai 编程作品吧。

这是一条 codex 从零到一完整的新手入门教程。如果你之前完全没用过 codex, 或者只是听说过,但不知道它到底能干什么, 怎么装,怎么用,那这条视频你就可以收藏了。我会按照一个新手真正上手的顺序,带你从 codex 试什么,讲到安装、使用、主界面、怎么操作、基础功能和进阶技巧、 skills 插件、浏览器终端和自动化任务等等,让这个目前全球最顶级的 a 阵的工具真正为你所用,创造价值。 我也会把整个流程整理成文档,打一句 codex, 方便对照,一边看一边选。你可以先把它理解成一个装在电脑里的 ai 工作助手,他不是单纯陪你聊天的工具,而是可以进到一个具体的工作文件夹,帮你读取文件、修改内容、运行命令、调用工具,甚至按步骤完成复杂任务。 举个最简单的例子,像 chat、 gpt、 豆包这一类工具,更像是你问他答,你自己去做。比如你想做一个网页,他通常只会给你一段代码,接下来你还要自己复制代码、创建文件、运行、检查报错等等。而 codex 是 你问他,他理解他还做,他会从零到一帮你创建好这个网页。 目前最适合新手小白的上手方式呢,是桌面端 app, 我 们可以直接在官网开始,根据你的系统选版本, windows 或者 mac os 都可以。安装之后有两种登录方式,一种是官方 chad gpt 账号登录,另一种是用 apikey, 可以 是官方的,也可以用中转站。两种方式各有利弊。综合来看,还是建议第一种,直接官方账号登录, 省心省事。对于 codex 的 界面,新手可以先关注三个核心区域,最左侧是一些常见功能入口和聊天记录管理区,你可以理解为导航栏加历史记录。这里需要重点讲一下对话和项目的区别。对话最好理解就是普通聊天嘛,你甚至可以把它直接理解为 chat、 gpt 或者豆包, 适合随便问一些小问题,帮你写文案、查资料之类的。它不跟具体的文件夹绑定,而项目就涉及到了具体的生成式任务,比如 如飞哥之前开发的工具箱网站,飞剪一触即达这种软件,他们有大量的编程代码文件,就需要一个专用的项目文件夹。你在这里可以新建空白项目,也可以打开现有文件夹,直接选择路径,或者直接把文件夹拖进来也行。鼠标悬停在项目名上,也能看到这个文件夹在电脑中的 底位置。而对于重要的常用的项目和对话,右键就可以置顶,方便快速切换和查看。左侧下方还有设置入口,在设置里你可以修改 codex 的 使用偏好、外观和配置等等。其中个性化需要重点说一下, 如你想给他一个全局指令,就在自定义这里直接写,比如他要怎么称呼你,固定用中文回答问题,设定一些底线原则或者开发习惯,设置完之后对所有项目都会生效,相当于让这个员工摸清楚你这个老板的脾气,投你所好。这里还有一个很有意思的小功能,叫桌面宠物, 他提供了很多默认的宠物形象,你也可以根据自己的喜好让他帮你创建一个,比如我这个就是给了一张参考图,让他自己做出来的,他会实时显示当前任务的一些简单状态,还是挺好玩的。 在首页设置这里还能看到剩余用量,你可以清晰的看到五小时用量和一周用量,做到心中有数。中间这块就是你和 codex 的 主要沟通区域。首先是这个加号里面有两个非常重要的功能,一个是计划模式, 比如你让他开发一个个人博客网站,不要上来就直接让他干,而是让他先列出计划。相当于你给员工一个项目,得先让他出方案,看看他打算怎么做,这样能有效减少返工,既省精力又省 tokyo。 看啊,他会主动问我们这些具体细节,我们按选项敲定,不满意的或者他没提到的就补充一下,让他重新规划, 这才是一个合格的领导该干的事。而目标模式就更厉害了,刚上线的新功能就是你给他设定一个目标,越具体越好,他会自己拆解分析。执行审查,有一种不达目的不罢休的意思,这样就避免了一个很烦的问题,执行一个任务的时候,他每完成一步就要停下来问你。 比如我正在跑的一个很复杂的大项目,目前已经连续跑了三十多个小时,如果正常一步一步改的话,我可能要好几天才能做完这些进度。右边这个权限设置呢,分成三档,默认是最保守的,像是联网修改文件都需要你的授权,自动审查会开放一部分权限,关键节点还需要你把控。 而完全访问就是最激进的,它几乎可以完全操控你的电脑,创建文件、删文件、跑命令,全都自己干。新手,我不建议一上来就开完全访问,刚开始用默认或者自动审查更稳,等你确认这个项目没问题,也知道它要做什么,再考虑给更高权限。我自己是在非常熟悉项目和流程的情况下才会开完全访问。 右边这里还可以切换模型,选模型版本、智能程度和推理速度。如果不是特别复杂的任务呢?不建议开超高,因为它有可能会出现过度思考,而导致你花了更多的 token, 反而干的不好。 这是血淋淋的实战经验教训,一般来说默认高就可以了。这个麦克风是语音输入,但是体验目前并不是很丝滑,我们可以直接用语音输入法。 codex 还有一个和普通聊天很不一样的地方,任务可以排队,他正在执行的时候,你可以继续补充,要求这些新消息会一个一个排在后面,等他处理完当前步骤之后继续执行。比如他正在做网页,你可以接着说,页面再简洁一些,按钮换成黑色,先不要做登录功能等等。 而如果你忽然发现他理解错了你的意思,或者做了一半有点跑偏了,可以直接选择引导,强行把方向盘掰回来。所以用 codex 的 时候不一定要追求第一条提示词写的特别完美,你可以边看他做边补 充,边纠正边引导。真正好用的方式是把他当成一个正在干活的助手,而不是一个只负责回答问题的聊天框。这个思维一定要转变过来。 最右侧的区域目前包括三个功能,侧边聊天就是当前任务的一个临时讨论区。因为有时候 codex 正在执行一个主任务,但你中途想问点小问题,或者单独讨论某 个细节,就可以用它,它不会打断主对话的节奏。浏览器主要是 codex 打开网页查资料测试页面,比如你做了一个网站,可以让他直接打开本地页面,帮你检查布局按钮、交互有没有问题。如果你对某个地方不满意,还可以让他直接打开本地页面,帮你检查布局按钮、交互有没有问题。如果你对某个地方不满意,还可以让他直接打哪的感觉, 口头描述半天要精准的多。终端的话呢,其实你不需要了解太多,因为它主要是给 codex 执行命令用的。到这里,其实你已经看到了 codex 最核心的几种能力,它可以进入项目,读取和修改本地文件,可以用计划模式先想清楚怎么做,可以通过浏览器查资料测试网页,也可以通过终端运行命令检查结果。 所以 codex 真正厉害的地方不是某一个单独按钮,而是它能把这些能力组合起来,帮你完成一个完整任务。理解了这一点,后面的 skill 插件和自动化任务就很好懂了。 因为前面这些能力呢,解决的是 codex 自己怎么干活的问题。但如果你想让他干的更稳定,更像一个熟悉你习惯的助手,就需要用到 skill。 如果你想让他连接更多外部工具,就要用到插件。 这里很多新手分不清 skill 和插件,其实用一句话就能记住, skill 是 方法,插件是工具。 skill 可以 理解成一套可以附用的工作流,或者说给 codex 的 一份工作方法说明书。比如一家公司做项目,通常都有一套标准流程,第一步做什么,第二步做什么,输出格式是什么,有哪些注意事项,哪些地方不能乱改。 这些东西如果每次都重新告诉 ai 一 遍就很麻烦,而且 ai 它还可能每次理解的不一样。所以更好的方式是把这套工作流程固定沉淀成一个 skill。 这样 codex 下次遇到同类任务时,就不用像一个新员工一样重新摸索,而是直接按照你写的流程和标准来做。 比如我自己的飞鸽工具箱里就有很多专属 skill。 比如把好用的软件保存入库到本地,同步到我正在做商单推广的几个云盘,生成下载链接,再同步到正式站,这些流程全都是固定的。 我把它们写成 skill 之后, codex 就 可以按这套流程稳定执行,不会每次都跑偏。再比如,你经常写短视频文案,也可以让 codex 帮你做一个短视频文案 skill, 把你之前写过的大量文案喂给他,让他总结你的开头风格、结构、习惯语言表达、结尾方式,然后形成一个专属文案助手 后,再写类似内容的时候, codex 就 会优先按照这套方法来。插件就不一样了,插件更像是给 codex 装上外部工具,解决的是它能不能操作某个平台,处理某种文件,连接某个服务。 比如浏览器插件,可以让 codex 打开网页查资料、测试页面表格插件可以让它处理 excel、 ppt 插件可以让它生成演示文稿。 gmail 插件可以让它整理游戏, camera 插件可以把生成的内容导入到设计工具里继续编辑,所以不要把他们想的太复杂。 skill 解决,怎么做插件解决用什么工具做?一个是工作流程,一个是工具能力。 codex 目前已经集成了很多实用的插件和 skill, 我 也整理了几个比较常用的,大家可以截图保存,后面自己试试看。 最后我们再来看一个比较进阶但非常有想象力的功能,自动化任务。你可以先理解成让 codex 在 固定的时间、固定的项目里自动帮你做一件事,但它和普通题型软件不一样,它们最多告诉你该干什么了。 而 codex 的 自动化任务是真的可以帮你执行一整套流程。比如你是做内容创作的,你可以让他定期帮你收集某个领域的热门选择题,整理成标题、角度、参考链接和可以拍摄的脚本。而飞哥最常用的就是每天固定时间设置一个今日任务清单,划掉昨天已经做完的,生成当天新的任务, 就像一个机器人一样按清单执行。这也是为啥有人说我效率那么高,一个人干八个人的事情。除了 ai 的 强大助力之外,任务规划本身也非常重要。所以自动化任务真正厉害的地方不是定时提醒,而是定时让 ai 按你的要求去干活。 最后再补充一个很多人会关心的问题, codex 能不能在手机上用?据我所知有三种方式,最早大家都是用 happy 这种开源项目,它可以连接 codex cloud code, 电脑上开个任务就能通过手机和 agent 的 沟通,但始终不太方便,相当于只是给你安排了一个传话筒。 而 codex 的 mac 版本最近更新了手机端的入口, chat gpt app 里面就有 codex 可以 完整读取你的聊天记录。在手机里聊天和电脑端的消息是完全同步的,本质上是远程链接,相当于把你的电脑版正在跑的 codex 搬到了手机里。而最近我发现了一种非常爽的方式,就是网易的优优远程, 出门的时候手机直接远程连电脑,操作起来很方便,最关键的是你能同时测试它的改动,这就相当于把你整个电脑都装进了手机,所以功能最完整。 好,最后我们来个回顾,总结一下你都学了什么。如果你是第一次接触 codex, 其实今天不用记住所有按钮,也不用一上来就研究特别复杂的自动化和插件,你只要先记住这条主线就够了。第一, codex 不是 普通聊天工具,它更像是一个能进入你电脑工作区的 ai 助手。第二,临时问问题,用普 对话,真正要处理文件、项目代码、文档就用项目。第三,复杂任务不要直接让它开干,先用计划模式让它列方案,如果是一个长期目标,再考虑用目标模式让它持续推进。第四, skill 是 方法,插件是工具。 skill 负责告诉 codex 怎么做事儿,插件负责让 codex 连接浏览器、表格、 ppt 邮箱这些外部工具。第五,自动化任务不是简单提醒,而是让 codex 在 固定时间按照你设定好的流程自动干活儿。 所以新手今天先做三件事就够了。第一,安装并登录 codex 桌面端。第二,建立你的第一个项目,找一个真实的小任务试一下,比如整理一个文件夹,总结几篇文案,或者生成一个简单网页。第三,让 codex 帮你写一份自己的 agents, 点 m d 就是 我们刚才提到的个性化。现在你让他自己干,把你的 称呼、语言、习惯、输出格式、工作偏好都写进去。当你把这三件事跑通之后,你就不只是会用一个 ai 工具了,而是开始拥有一个真正属于你自己的 ai 工作站。祝你越来越牛逼!

codex 到底是什么?它到底能干嘛?到底什么样的人才会用到它?不是程序员到底能不能用?不会写代码到底能不能用?本来呢,昨天我想出一个基础教程,结果没发出去,现在呢,我就简单口述一下。 首先我要说一下,不一定非得要用 codex, 我 说 codex 就是 指 codex 这一类工具,其实还有很多种工具,比如说像最近开源界比较火的 open code, 像字节出品的 tree, 还有像 carson 等等等等都可以。我只是拿 codex 举个例子,那 codex 到底是什么呢? codex 一 句话总结就是它是 gpt 的 亲兄弟, gpt 呢,就是用来聊天的,而 codex 呢,就是用来干活的。它能干什么活呢?现在能干的活非常多,如果你现在还花大量的时间去做 ppt, 你 现在就可以把这些任务丢给它。现在 ai 做 ppt 能力已经非常强了,我之前做过一次测评, ai 现在直出的 ppt, 简单修改一下,基本上就能够汇报,它还可以帮你做视频,其实我的很多视频都是 koex 或者是 cloud code 帮我做的。 koex 现在能帮我省掉很多剪辑工作,比如说你的电脑驱动坏了,你不知道怎么修,你现在就可以让 koex 帮你修一下,你还可以让 koex 做一个个性化的简报, 如果你真的有想法,你还可以做一个网站,做一个 app。 我 上面说的都是 koex 能力的冰山一角。那 koex 适合什么样的人群? 会写代码?到底能不能用 codex? 很多人以为啊, codex 这类软件就是一个非常专业的软件,这可能是最大的误解之一,你可以问一下你周边程序员的朋友,看看他们现在还写不写代码。今天刚刚刷到谷歌帝麦的研究员姚顺宇的播客, 他说现在大部分项目都不用写代码了,全部都在用 ai coding。 更主要的是像 codex 这类工具,它的使用难度绝对不会比豆包高,当年我学 cad 画图还学了好几个月,才能勉勉强强上手。 而现在的 ai coding 软件,基本上几天的时间就能够学会,最重要的是它不是一个很枯燥的软件。很多人开始 ai coding 之后,它现在连游戏都不玩了, 每天都在等着额度恢复,因为它很容易让你有一个 builder 的 感觉。 codex 其实它的能力跟它的竞争对手 cloud code 还是有一定距离的。 cloud 它更像是一个谋士,在你不知道干什么的时候,它会帮你出主意,而当你确定了想要干什么的时候,并且做好这些规划的时候, codex 就 会派上用场了。它更像是一个总经理,它会帮你认真的完成这些工作,所以两者要结合起来用。

十分钟用 codex 加 oc 点搭建 ai 大 神和那些同款可以自生长的知识库,帮你把信息的利用效率直接拉高到 next level。 这些视频可能是全网最全面系统的 ai 知识库搭建教程,从理念到实操,手把手带着你,从零到一来搭建, 还能定时抓取热点,能自动整理信息进行复盘,能让知识体系自动替代生长,还能直接输出文档、 ppt、 视频等成果。 不管你是什么职业、岗位,只要平常需要先收集整理输出,都能用这个 ai 知识库,最大程度发挥知识的福利价值,拉高效率。而且配置也很简单,小白也能轻松上手。我还整理好了两张搭建知识库的架构图,丢给 codex 就 能一键抄作业,无痛复刻。所有安装方法、技能包、提示词、案例我都放在文档里面喽! ai 大 神卡帕西的自身账理论,简单来说,就是不要把知识库只当成一个收藏夹,而是把它变成一个由 ai 持续维护的自身档系统。整个系统是这样循环的,首先,没有被处理的原始资料会统一进入原始的文件夹 a, 比如说网页、论文、截图、视频、会议叫等等。然后让 ai 定期消化复盘,把真正有价值的内容整理成泛化性的概念,再放进一个处理后的文件夹 b。 随后,你就可以根据具体任务或使用场景,让 ai 沉淀成可附用的方法论模板,放进 skill 库方法库文件夹 c 中。最后,你每一次输出的内容都会放在输出文件夹 d。 等到 ai 定期复盘的时候,这些输出的内容又会重新回流进知识库中。至于每步怎么定制搭建,那我们现在开始吧。 整个安装配置非常简单,就需要 codex 和 obsidian 两个软件,想进阶的视频后面也会分享移动飞书的玩法。那为什么是 codex 加 obsidian 呢?首先, obsidian 是 一个本地 macdown 笔记工具, ai 又可以直接读取本地的 macdown 文件, 意味着你可以直接下指令,不用自己手动整理。而且 obsidian 有 非常强大的场景生态,可拓展的功能很多,你可以根据自己的需要自由组合 obsidian, 再接入 codex, 就 为你的知识库接入了最牛的 a 卷的能力,再加上 codex 的 skill 和电视功能,玩法就更丰富了。 那装好 o c 点后,我们先来把它和 codex 打通,点这里选择第三方插件,关闭安全模式就能浏览插件市场, cloudian 起用。 然后点击选项卡,找到 codex, 打开开关,这里要输入一个 codex c o i 的 路径,有了它你就可以直接连通桌面端的 codex, 不知道路径?没关系,直接问你的 codex 就 能拿到路径。最后很关键的一步, 在 codex 里面打开这个项目工作按钮,链接你在 obsidian 里面建立的仓库文件夹,这样以后就算在 codex 上处理文件,因为本地仓库是连通的,你在 obsidian 里打开也会同步更新哦。 接下来我会重新收集机器管理和新输出三个阶段,来教你怎么结合 ai 来搭建这个能自生长的知识库。如果你已经在用 obsidian 或者已经做好新收集与迭代哦, 那不管你是做内容、写报告还是搞研究,前期的灵感和这道收集真的非常费时费力。而自身长知识库的第一大好处,就是用 ai 让你的信息收集和整理更加自动化,更丝滑高效。 我们工作室之前还专门搭过一套 nba 的 工作流来收集行业资讯,再自动推送到工作群里面,其实效果是有的,但说实话,门槛太高了,不太适合。小白 现在用 obsidian 和 codex 直接搭一套自己的行业情报获取系统,不用写代码,不用懂自动化,也不用研究复杂的工作流,只要用三步,它就能每天帮你找出信息,筛选重点,整理成文档。第一步,把这个 github 项目地址发给 codex, 这个 github 项目就是个资讯收集工具, 他会从 twitter、 gitup、 reddit、 rss 这些主流的平台抓取内容,再帮你去重,然后打分,最后生成一份结构化的日报,让他直接帮我们答。这个插件可就让 ai 帮你找信息源对小白来说非常友好, ai 会提示你需要提供哪些秘钥,比如说 deepstack、 gitup 或者某些信息源平台的 api key。 第二步,直接问 ai 这秘钥要去哪里注册, 我们申请好密钥之后,把密钥发给 ai, ai 就 能够直接配置好。最后一步,告诉他你的身份和需求。我是 ai 自媒体博主,请每天帮我收集 ai 行业热点,并把日报推送到指定的文件夹, ai 就 会自动生成这样的日报,哪些内容值得继续跟进,哪些选择题可以直接开做,一眼就能 够看清楚,而且每条内容都会附上才考链接,有来源、有依据,信息更加可靠。不止是行业文章和新闻热点,如果你每天都需要接触大量外部的信息,比如政策变化、 客户动态、精品动向、岗位资讯等等,都可以让 ai 直接帮你抓,帮你汇总。不用天天手动搜索,也能持续捕捉有用的线索哦。 除了直接抓取信息,你刷手机遇到想要收藏的内容,都可以通过 obsidian 的 插件去直接导入。比如这个某书的导入插件,我装上以后直接粘贴链接就能一键导入。平常在网页上刷到有意思的观点,也可以用这个 clip 插件,选中意向内容段落,就能剪切收藏进 obsidian 里面, 它甚至还可以收藏一些视频提取字幕,在这里你还可以做笔记,然后一键存入 obsidian。 所以平常刷到有用的文章、观点、视频案例,不用再靠截图或者进行收藏夹吃灰,直接随手将它进知识库,就能让 ai 帮你沉淀成素材,之后写方案、做选择题、查资料都能直接调用。 除此之外,你可能还有闪躲在备忘录、其他笔记库里面的旧素材需要用。如果一个个导入到知识库就非常麻烦。比如我们团队平时用飞书办公, 里面就有很多重要的文档,那这时候就可以直接联动飞书了。不让 codex 安装飞书, c o i 客户端程程自动,然后把文件夹链接丢给他,就可以导进数据库了。 如果前面已经把 codex 和 obsidian 的 项目文件夹关联好,这时候打开 obsidian, 就 能看到非是文档已经进来了。再用一个 doc 插件,就能把 word 文件转换成 mong 格式。另外,像这个 import 插件也可以用,它支持非常多的平台和格式,像 notion、 apple notes 都可以直接导入。 所以不管你是学习、工作、研究,还是做个人规划,只要你的信息来源是分散的,只是更新的、需要反复调用的,都可以用这套方式把它们统一放进 opc 店里面。 首先来搭建迭代系统,我们直接把卡帕西的思路丢给 codex, 告诉他结合我的知识库定制一个知识迭代系统 看,定制好的系统里面,你的知识库被分成了多层清晰的结构,并包含了信息输入、 ai 消化、信息输出等一套完整的体系。后续就会帮你检查那些内容,重复那些内容过时,那些内容值得沉淀成模板或方法论。 学生可以用这套方法论替代你的学习笔记,打工人可以拿来管理项目,沉淀客户案例。反正只要你想拥有一个能自主生长、反复叠带的信息库,那这一步就不可或缺。但这样的系统还不够完善,会有很多分赃任务,而且用来需要你经常手动操作。 那现在就可以借助 codex 的 自动化功能,把它变成一系列定时定期的工作。比如我想做一个定时蒸馏的任务,就要让知识库在指定时间内判断整理我这段时间里面的所有工作。 第一步,让 ai 写出这个蒸馏任务的提示词,然后在 codex 的 自动化功能里面粘贴好生成的提示词。定时,每天下午五点, 它就会自动干活了。每次蒸馏完之后,它会自动生成一份总结文件,存为 opc 店对应的项目文件夹里面,打开就能看到,还会关联相关的文档链接,非常便于我后续翻出来复习。 除了征六知识库本身的内容,你还可以定期在 codex 里面整理非书会议纪要、重要消息生成的文件,再放进 o c 店里面,相当于直接完成了一次周报。 你甚至可以做一个 html 复盘看板的 skill, 帮助你对复盘进行格式化,比如生活数据、 项目进展、阅读记录等等,重点内容一眼就能看到。总之,一个自身长的知识库,需要有 n 个定期复盘任务来不断提供养分。比如说每周复盘、资料整理、热点汇总、详细更新等等,你都可以把它们设成定期自动任务,让 ai 到点自己执行,再也不用手搓了。 前面所有的格式词或者文档,其实我们都可以把它称之为 skill, 这就是我接下来要说的,你可让 ai 帮你 diy 专属于自己的 skill, 来管理运用你的知识点,尤其是把你一直不停重复的工作流 一直在用的里面,理论都统统转化为对应的 skill, 可以 随调随用。那我们平常写公众号来说,最常遇到的一个问题是,选择题怎么挖?什么角度有趣又有用?哪些观点是放在开头,哪些案例适合详细研究? 我们就根据这个一直以来的痛点,打造了选择题价值判断 skill, 直接把判断标准告诉 codex, 它几分钟就能写出来。 后面有新信息进入知识库的时候,直接调用这个 skill, 它就能判断这条信息的选择题价值,能利用的亮点,还有可能的机会风险 些,原本要经验老到的人才能看出来的东西,知识库全部给你一键生成了,而且这个完整的判断报告也都直接储存进知识库里面,成为知识库自生长的养分,真的是躺着就能收获成果。另外, 工作室其实也一直在整理视频脚本的写法,之前是一个一个字手搓,现在我直接把写过的内容和讨论出的方法统一丢给知识库,让它沉淀出文风 skill。 你 看直接总结了我的表达节奏、口语化程度、比喻习惯等等,还提炼了我习惯会用的京剧结构,简直比我自己还要熟悉我自己 那其实任何需要重复三次以上的工作方法,像抄报、做分析、做教案、做营销、写需求文档等等,在这套体系里面都可以被沉淀成 skill, 等于你把自己的经验变成一套随时可以调用的工作插件,随时随地都能取用。 接下来就是利用 ai 知识库做好输出,它可以基于你的资料快速批量的产出内容,而产出的内容又会重新回流到库里面,非常适合做媒体矩阵、营销物料、课程资料这些工作的人。 首先,比起每次都要和 ai 反复 battle, 刚才我们整理的 skill 库在这里就派上用场了,直接用已经整理好的 skill, 明显更加省时省力。比如我调用刚才前面做好的文风 skill, 把这篇写好的大纲丢进去,让 ai 结合 obsidian 收集到信息,做一个内容初稿, 你看分分钟就跑出来了,都用了等句表达,而且结构清晰,整体风格和我平常写的真的相差不大, 但细读起来还是 lv 很 重,我就做了个去 lv 的 skill, 搭配起来调整出来的结果就会更接近我日常的口味。所以说只要搭配好 skill, 整个输出的工作流就会非常顺畅。像我这边也整理了很多 skill, 包含了常人的写作、编剧、营销决策、魔书、笔记等等类型, 都放到文档里面了,大家自取。除了储文件的输出,还可以结合 ai 加数据库去做配图,甚至是动画效果。比如前面的这篇稿子,不过要发某号,没有配图,真的挺单调的。于是我做了个配图 skill, 它可以自动判断,自动生图,自动插入图片。 你看整体生成的风格保持了高度的统一性,图片也都插入文档中。而且你在本地附件中可以看到所有的图片设计,这些都是能单独使用的。 甚至我们可以直接把写好的文档直接输出成 ppt。 比如刚才做的选择价值判断报告,我在 codex 里调用 presentations 插件,一句话就能指出 ppt 了。看看这个效果,风格统一,内容相似, 还可以直接下载编辑以后什么每周工作复盘、购物方案汇报之类的,从信息的获取到输出,直接一个闭环了。 还有一种很实用的输入方式,就是让 ai 把知识库直接转成视频摘要。像我就调用 hyperframes 插件,让 ai 把刚才的这篇文章做成视频,也是一句话指出, 你看整个视频,风格简洁大气,动画效果也很高级,看下来马上就能 get 重点。 先输出不只有文字,从图片到视频,其实都是可以交给 ai 一 键完成。无论是平常做 ppt 汇报、做客户方案, 还是写某号发某书整理课程?只要需要做配图做视频,现在都可以考虑,就给 a 知识库来打理了。停下来我真的觉得以前用 ai 就 像零食找外包,你讲一遍背景,它干一次活。但当你的资料、方法论都沉淀在 obcd 里, ai 就 能读到过去的积累,也能直接把铲除放回系统。 所以不用一开始就搭的多完美。先建一个小知识库试试,只要他能帮你省下一次从零开始的时间,就值得继续。那这就是本期视频的全部内容了。这里是勋酱,我们下期见,拜拜!

你们一定一定一定要想办法去用上 codex 跟 cloud code, 我 觉得这个真的是普通人能够用最小的一个成本去接触到目前全球最前沿的一个 ai agent, 就是 大家现在是不是还停留在说,哎,我们大模型有一些啊, cloud 啊,或者说 gbt 啊这些,或者说可能有的同学还在用豆包啊, deepsafe 啊这些大模型阶段,那实际上目前最前沿的一些 ai 落地,你会发现它的 ai agent 跟大模型又相差的非常的大,就是你们没有踏出这一步,你们完全就没有感受到啊。 呃,为什么我觉得说 codex 是 我们普通人最低成本去用上最前沿的东西,反而不是 cloud code, 主要的原因的话是 cloud code, 其实如果你要用上,你会去遇到各种封号啊,用 ip 啊这种形式,对吧?对于你的一个使用的门槛会还是相对比较高的,但是 codex 它不一样,为什么我解释非常解释的 简单的跟大家讲这个事呢?就是它的量大管饱,什么叫量大?就是 token 啊,它的量大,然后呢它又便宜,它不像 codex 一 样,比如说你啊,一个月你去买一个 plus 或者二 max 的, 你用八百多块钱一个月,对吧?你 gpt, 你 不用 gpt, 你 目前你可以在一些公开的一些地方,你可能大概一百八,对吧?你可以买到,你可以用的非常的舒 服。一旦你去下载了一些 code, 一个 codex, 你 会发现你的整体工作流程会完全不一样啊。我们拿产品经理举例, ai 产品经理, ai 运营或者 ai 卷方案举例,呃,拿最基础的一个流程就是调研,对吧?你调研也好,或者说你去做啊,设计,写日常的文档也好,实际上你很大的工作都在写,对吧?那你写你, 你写,你不管用 ai 智能写也好,或者说大模型写也好,都可以,但是 ai 智能它可以去搜搜索你本地所有的一些能力,对吧?你的一些文档沉淀去给它,通过通过充足的上下文,你去给它写出更好的一个文档,同时的话也可以去调用一些 他自己,去调用一些你自己以及沉淀的一些 skill, 对 吧?你去自己只要你能够把一个流程给 s o p 给沉淀下来了,后续沉淀成 skill 之后,你无后续,你只要无限的跟他说,哎,你帮我调用这个 skill 啊,那可能是比如说给你画一个图,写一个 p r d 啊这些,你只要说这句话,它就无限的非常轻松的给你产出符合你要求的这么一个文档出来。 所以说对于你整体的工作的提效是大家没有办法想象中的那么高效的。我已经要求我们公司的人或者说我自己的学员,你们必须要不就用 kol 的 kol, 要不就用 kol css, 你 们必须使用你。 如果说 ai 时代你没有去用这种最前沿的一些 ai 的 agent, 实际上你会发现,哎,你的认知还是在自己的一亩三分地里面啊,那 我没有要营造一些任何的焦虑,我真的希望大家能够用上这些 ai 政策,然后去改变自己的整体的工作方式,因为我们目前我们公司的工作方式就已经变成了 ai, 想 ai 做,对吧?人每天做的什么?跟 ai 对 话, ai 去人去审核,剩下的所有事情都是 ai 做,那你一想你的工作效率提升的会极度的快啊。所以说,哎,我们 这个是真的是我觉得最低成本最快的去提升我自己的一个工作效率也好,或者说我的认知 ai 认知也好,去提升我的 ai science 也好啊,这个产品就叫做 codex, 大家可以去他的官网去下载,非常简单,没有任何的门槛啊。

代码的目标功能怎么开?什么样的任务适合开?用第三方模型能不能用这个功能?怎么保证目标模式完成的任务的质量?怎么给他权限? 这是我上个视频评论区关注最多的一些问题。哈喽,大家好,上个视频我发了关于 codex 的 后功能的使用体验,收到了大家很多的关注。今天我会一个视频,讲清楚 codex 的 目标功能到底怎么用,什么时候用, 如何高质量的用。希望大家帮忙点赞评论关注。首先需要说明, codex 的 go 不是 让模型突然变聪明,也不是你丢一句话它就可以无限的自动驾驶 go, 它本身是和模型无关的,并不是模型的功能,而是 agent hines 同面实现的一个机制,是 codex 的 产品和运行环境这一层的能力。所以首先第一个问题, 用第三方模型到底能不能用这个功能?答案是可以的,只要你是通过扣代词使用这功能,再更新到最新版的 app 都是可以使用的,但是效果就不一定有 g p u 五点五那么好了。 官方对目标的定义是给扣代词一个持续存在的目标,这个目标既是他开始工作的指令,也是他判断到底做完没有的标准。所以 go 最重要的不是跑的久,而是有一个清楚完成的标准。所以第二个问题,什么样的任务适合开 go? 答案是,如果你只是改一个按钮的颜色,或者修一个很小的 bug, 实现一个很简单的需求,其实没必要上钩。当然,如果你是给他一个 ui, 让他完全对齐这个 ui 设计稿去实现你的 ui 页面,那还是可以的, 真正适合构的是那种多步骤会中途跑,测试会反复修,而且你不想一直在旁边盯着打 continue 的 任务,比如说迁移一个项目,重构一块模块,修一批测试,做性能优化这种任务,你可以给他一个明确的目标,他就可以围绕这个目标去持续的推进。 再比如前面讲的,你给他一个 ui 稿,我个人感觉扣代词在审美这块还是差点意思的,但是你给了他明确的标准,对其 ui 设计稿去实现 ui 页面,他就会一直修改,并且修改完之后去启动项目对比 ui 稿,做到像素级的还原。甚至你都可以用 gpt 一 米二去生成一个精美的页面, 毕竟 gpd 一 米二的生普能力大家是有目共睹的。评论区有人说只有十个小时,最后写出一坨,其实这个问题不是 go 本身能解决的,而是你给的 go 太空了。 go 的 核心是有一个明确的目标加验收标准,不要写帮我优化一下这个项目,优化这个动作本身是没有一个明确的验收标准的,也就不是一个明确的目标,优化哪个方向,功能交互还是性能优化到什么程度才算是完成?这些都没有一个明确的标准。那第三个问题,应该怎么使用 go 呢? 特别是你没办法明确说出你的目标和验收标准的时候。其实有两种办法,第一种是先 plan, 再去用 go 去执行, 提出你的需求,先让 codex 把任务拆清楚,你确认验收范围没有跑偏,再把这个 plan 去变成 go。 第二种,如果你的 codex 已安装上了 superpower 插件,那么你可以直接开启目标模式,你可以说出你模糊的目标,这个时候他前几步会主动的去跟你澄清,直到明确为止才真的去执行这个目标。 也有人问死停完怎么办?比如他用方法 a 跑不通过,一会又用方法 b。 也有人问做科研做复旦任务能不能一阶段一阶段的验收。这里就聊到了第四个问题,如何高质量的用目标功能去提高产物的质量。这里有几个技巧。 第一个就是构力最好加上停止条件,同一个方案失败两次就必须换方案,或者停下来报告原因,不要让他在错误的路径上你去预谋。注意,这里并不是停止你的目标, 在没有满足你的目标之前, codex 是 不会给这个目标去标记上已完成的标志的,它只是暂停了,等你澄清或者纠正之后,是可以点击继续目标去执行的。 第二个技巧, go 不是 让你完全不看了,而是让你不用每分钟问一句继续,不用中间持续的去给他解释上下文,但是中间你随时可以插话纠正。阶段性的去看 def, 看测试,看结果。你仔细观察就会发现, codex 的 go 并不是想象中的,你给他一个 query, 他 一直跑,中间不停止, 反而更像是他自己把围绕这个目标的实现拆解成了很多的小步骤,并且每实现一个小步骤,他都会做充分的测试和验收, 验收通过了这小步骤就会被提交。那他是怎么继续开始新的小步骤的呢?其实更像是完成一个小步骤之后,他自行判断这个目标是否完成了,然后判断下一步该做什么,给自己了一个下一步骤的新宽瑞。 只不过之前这个昆瑞是需要人觉得上一个步骤没问题了,人去判断下一步应该做什么。了解了这个机制,在他执行某个步骤的过程中,你就随时可以点击停止目标,并且对他进行纠错或者提问,确认没问题了,再点击继续目标即可。最后再说一个额外不算技巧的内容。 很多人对目标都是小心翼翼的,开了一个目标之后不敢随便乱点,不敢电脑合上,不敢重启 app, 会担心中间网断了怎么办?账号额度没了怎么办? 答案就是这些都不会影响目标。你的网断了,在网络恢复的时候,可以重新进到那个规划去点击恢复目标,你账号额度没了。一般情况下,在这个账号额度恢复的时候,目标都会自动的继续,但如果没有的话,你也可以手动点击继续。 像我的 pro 账号是五倍的订阅,经常会在五个小时额度重置之前额度消耗完。我这个时候就会用一个账号切换器去切换账号,切换完 app 是 要重启的,重启完之后我就会去点击这个规划里面去继续目标。最后,关于权限这个问题,官方确实支持减少 approval, 比如不想他每一步都问你。 首先说明一下我自己,其实是开的完全的权限,但是是建立在一个干净的分支可信项目的基础上,确保它有 get 记录。此外,再通过外的 hux 机制去保证不操作项目之外的内容上的。 最后总结一句, go 的 价值不是让 codex 永远跑下去,而是让 codex 不 在每一步等你。推一下智能用法,不是让它干活,认清楚什么叫干完。关注我,了解更多 ai 技巧。

我去一张产品图,扣电视直接跑出 u g c 带货视频,这一期给大家分享一下怎么用扣电视生成弹出 u g c 风格带货视频。这一套是旧,主要是改善几个常见的问题,比如说制作视频效率低, 没有系统的流程,生成出来的内容比较零散。首先我们来看一下这一整套旧的一个 流程,他不是一上来就直接帮你写一段视频文案,而是先按步骤走完一整套完整的创作流程,等产品方向、脚本方向、镜头方向都确认清楚了,再帮你高效多视角的产出视频内容。那么第一步 他会先确认这一个基础的参数,比如说你的目标市场、脚本语言,视频的形式,视频的时长等等。接着他会对你的上传的产品进行一个深度的理解, 然后再根据产品的内容输出对应视频的钩子,口头口播脚本跟进镜头。也就是说他不只是给你一段文案,他还会告诉你每个时间段,每个画面应该拍什么产品,怎么出现人物,人物怎么表达。 有了这些内容之后,你确定没问题,他会继续的给你生成这一个 u g c 的 人物图提示词和这一个视频生成提示。当你用这些提示生成视频之后,如果截的这个方向内容效果是没有问题的, 那么最关键的一步就来了,你可以沿着这一个方向去放大创新,也可以让他根据你这个产品随机扩展不同的视频内容,这样就不是盲目的生成,而是先把产品和方向分析清楚,再去放大创新产出。 那么这里要注意一下,如果你做的是跨境电商,你就用跨境电商的 skill, 如果国内电商就对应用国内电商的 skill, 因为不同的业务表达方式,平台规则,用户的习惯都不一样,不要把所有的场景都混合在一个 skill 里面,否则生成出来内容很容易不精准。 接下来给大家给我给大家实操一遍。首先调出我们提前准备好的这一个 skill, 比如说我们做海外市场的选择这一个你也可以直接把你的 skill 拖拖到这里来。然后呢,我们再输入这个产品的名称,接着上传产品图片, 这样点击发送就可以了。这时候 skill 它不会马上生成脚本,它会先让我们确认一些基础的参数,好的已经生成完成。这时候我们可以选择这一个目标市场脚本语言视频的形式,比如说是真人口播还是 a i c 女达人口播,还是旁白类的。 然后呢,你是否有固定的人物参考图,上传已授权的人物参考图,如果没有,那么后面会让这一个 ai 帮你去生成一个虚拟的人物参考图。然后视频时长你可以选择十五三十四十五秒,也可以选择十秒八秒啊,这个时长是不限制的。 如果你对这个产品比较熟悉,你还可以补充这个价格,核心卖点,品牌的要求,目标人群,这些信息, 当然也可以不填,让 ai 帮你去针对这个产品自行去分析,当然这些信息不建议每次手动去填,你可以你如果你经常做同一类视频的,你可以提前设置几个默认的方案,比如说这里一个我之前设的一个默认方案 a, 美国市场,然后加英文,是吧?然后又继续口播,然后十五秒的视频,选择什么样的比例,就选择默认方案 a, 方案 b, 那 么我们这里就选择直接选择默认方案 a, 然后点击发送。接下来他会根据刚才的参数对产品进行一个分析,接下来他会根据刚才的参数对产品进行一个分析,包括这个产品的基础理解, 目标人群、画像,以及这个对产品的人群特征、消费的心理痛点,用户需求和使用场景以及适合内容的角度。这一步很重要啊,因为后面所有的都指脚本视频内容以及适合内容的角度。这一步很重要啊,因为后面所有的都指脚本视频,就是展开的, 如果你觉得他对产品的理解是准确的,就回复继续就可以了。如果你觉得哪里不对啊,比如目标人群、用户需求和使用场景不够具体或者卖点方向不合适,你就直接告诉他怎么修改,那么这里我直接点继续就可以了啊。我们点继续, 接下来就会进入这一个第三的阶段,这一阶段主要是选择视频的开头的钩子, 它会给出不同的类型的开头,比如痛点型的、反常实型的以及这错误警告的等等。给出你十个不一样的这一个钩子, 你可以全部用,你也可以选择几个编号,比如说我觉得这一个第五个或者第七个第十二个比较好,那么我就在这里直接输入五七十二就可以了。当然他也给了你一些推荐啊,你也可以按推荐继续,你看到吗?那么我们这里直接选五七十二 或者五九十一把复制它的,然后就发发出去,接下来十六就会根据我选中的钩子继续生成我对应的口播脚本,镜头的一些结构 已经生成完成了,这里呢,你就会看到它不只是给你输出一段散文散的文案,它整个视频内容是有结构的,比如说前三秒吸引这个用户的注意, 然后中间讲用户的一些痛点,是吧?错误引导,然后产品自然的出现核心卖点,最后合规的做一个行动的引导指令,这就是他这个脚本的一个结构,然后这样你再看脚本的时候,你就能很清楚的知道。哎,这条视频为什么这样讲? 每个镜头承担什么样的作用?画面应该怎么配合口播?是不是我们再来看这一个分镜,他每一个画面是是怎么样的,是不是你想要的这样的画面? 他这些脚本和分镜都是根据我刚刚所选的五九十一去对应生成的,如果你觉得这些脚本和镜头结构都没有什么问题,就回复继续就可以了,如果你觉得某一句话太硬了,或者某个镜头不适合你,也可以直接让他调整,那么这里我就继续往下走了啊,我选择继续, 那么这一步呢,它最后呢,就会根据前面的产品的分析勾值的选择脚本的结构,给我生成匹配的 u g c 人物参考图的提示词和这一个视频生成的提示词。 好,现在他就把这一个 u g u g c 的 人物参考图题词给我生成了这一段就是了。然后呢他根据我刚刚所选的版本,给我生成这一个对应匹配的视频题词,是不是看到没有?这些都是视频题词的对应的内容, 最后还会给我输出一个字典的清单,我们来拿到这一个内容后,我们复制这个图片参考题词, 然后在这里直接生成一个就可以了, 它就会给你输出这一个符合这个产品的 u g c 人物参考图。 好了,有了这一个人物参考图的图片后,那么我们就可以去进行生成视频了,把这一段题词复制下来, 然后打开我们的,那么等有了人物参考图后,也有了视频提喻词,那么我们就可以去生成这一个视频了,那么这一些就是我用这个 skill 生成的一个视频提喻词去生成的视频。比如说我们看这个, 那么我就会把这一个产品图片和这一个生成的参考图放到这里面来,然后把刚刚那一段提示复制进来,那么我发送出去,它就可以直接帮我们去生成这样的一个视频了。 好了,其实到这里一条完整的 ai 带货视频流程已经跑通了,但是这一个十六真正提高效率的地方,不只是说给你生成一条视频,因为前面我们已经完成了产品的分析,用户画像、痛点拆解、 钩子的选择、脚本结构的确认等等,所以后面我们可以生成多个备选方案,比如说你可以让它重构五条, 他会基于当前你已经确认的方向,给你继续生成五条类似风格的视频提词,你也可以让他扩展不同角度的五条,他会在当前产品分析的基础上,从不同的开头,用户的需求、镜头的表达, 以及如何合规引导的角度去扩展这个视频提词。也就说我们不是直接大量的去深层,而是先把产品理解通过方向的一个确认,再去多方向的去拓展这一个 视频。这样做的一个好处是前期有逻辑,后期有效果,你可以先生成两三条测试效果,如果方向合适,再继续生成更多备选方案的版本。这就是我们用十六制作 ugg 带货视频的一个思路, 它的核心不是让 ai 随便的写一段文案,而是以把一个稳定视频创作的流程变成可以反复调用的模板。

大家好,今天分享一下 codex 命令,学会四十二个命令,完全可以改变你使用 codex 的 方式,从模型切换、绘画管理、代码审查。今天这期视频我会逐一讲解每个命令,告诉你它们是什么,什么时候用,怎么用。 如果你还在低效的使用 codex, 看完这期视频会让你的工作效率翻倍。模型与配置相关命令第一个,使用 model 快 速切换当前绘画的模型, 确认后就会弹出可选模型列表,选择后,后续对话和代码操作都会使用新的模型。它适合在不同任务间切换,比如日常改代码,用速度更快的模型,复杂架构分析、疑难 bug 排查时切换到推理能力更强的模型。第二个, 如果你想让它响应更快,可以输入 fast, 速度是一点五倍。这个命令会把当前绘画切换到更偏速度优先的工作模式, 适合处理简单修改,查文件、跑命令,解释这类代码低风险任务。它的重点是减少等待时间,让 codex 更快地出结果。适合快问快改,不适合重度分析。再次,使用 fast 的 命令可以切换标准速度。第三个可以使用 personality 调整它的沟通风格, 主要有两种, friendly 和 pragmatic。 第一个更像一个耐心的合作伙伴,语气更轻松,会解释多一点过程,适合学习、探讨和头脑风暴。第二个更像资深工程师,表达更直接,重点放在结论、风险和下一步。 适合修改 bug, 改代码,做工程决策。 personality 不 会改变模型能力、权限或者项目文件,只是改变 codex 和你的沟通方式。 第四个 experiment 是 一个实验性开关,这些开关会保存到 config 二 m l 文件里面,影响之后的使用体验。比如 terminal resize 会在终端宽度变化时重排 codex 的 聊天记录。 memories 允许 codex 从对话中建立记忆,并在新绘画里带入相关记忆。 prevent sleep while running 则是在现程运行时防止电脑休眠。实验性功能适合愿意尝鲜的人,稳定性可能会发生变化。权限与安全相关命令 第一个 permission 用来设置当前绘画的操作权限,打开后你会看到三个选项, default、 auto view for access。 defort 是 常用的安全模式, codex 可以 读取和修改当前 workspace 里面的文件,也可以运行命令。 但如果需要访问互联网或者修改当前项目之外的文件,就必须向你审批。日常写代码,修 bug 跑测试用这个模式就足够了。 auto view 和 default 基础权限一致,也是 workspace 可写,它会限制互联网和外部文件访问。区别在于符合条件的审批请求优先交给 auto view 子代理判断。一些需要 on request 的 操作不一定直接弹给你, 而是先经过自动审查。它适合希望减少手动确认,但又不想直接放开全部权限的场景。 for access 是 最高权限, codex 可以 修改 workspacey 的 文件,也可以不经过你的确认访问互联网。这个模式效率最高,但风险也最大,因为它可以直接影响你的系统环境、用户目录 下载或执行外部内容。只有你明确知道任务需要这些权限,并且信任当前操作时再开启。第二个 approve 是 处理自动审查拒绝的动作,所以没有什么可批准的 绘画管理相关命令。第一个 new, new 相当于是开启一个新的绘画,它不会退出 codex, 也不会换你的项目目录,只是把当前的上下文清空,重新开始一个新的任务。比如刚才让 codex 改完一个 bug。 接下来想问一个完全不相关的问题,可以用 new, 这样上一段任务里的讨论文件决策就不会干扰新的任务。我们可以通过这个 space 命令来查看一下当前绘画。 当前绘画 id 二八零使用 new 命令,我们来再创建一个新的绘画。我们通过 states 来看一下绘画 id 跟当前的绘画 id 是 不是不一样。我们看到是八二一,这就是 new 命令。 第二个是 resume, 恢复历史绘画,并继续使用当时的上下文。如果你昨天让 codex 分 析过一个项目,今天接着干,就不需要把背景重新给 codex 讲一遍。通过当前这个命令,从历史绘画中 选择一条 codex, 就 可以沿着之前的上下文继续往下做,就相当于切换到上一次绘画中。第三个命令 fork。 fork 就是 把当前绘画复制出一份新的分支,保留所有上下文,后续修改互不影响。 它适合你想尝试另一种方案,但又不想破坏当前这个对话的时候用。比如当前的方案用的是 rack 实现。你突然想试试路由一,这个时候 fork 出一个新的绘画,原来的对话还是存在,新的绘画就可以大胆地尝试。第四个 side, side 是 开启一个 临时的旁路对话,它适合处理一些小问题,但不想打断主任务。比如 codex 正在帮我们改代码, 你想顺手问一句刚才这个报错是什么意思,我们就可以通过这个 set 命令问完之后,我们再切回主绘画,主绘画不会被这个临时打断打扰。第五个 rename。 rename 是 用来给当前绘画改名字。当前历史绘画越来越多,默认标题可能不够清楚,我们就可以通过 rename 命令 来把它修改一个名字。以后我们通过 resume 就 可以找回来是哪一个绘画。例如我们通过 space 命令来查看当前绘画, 我们可以通过 state 命令查看当前绘画的名字。当前绘画的名字,比如说是这个设置一个名字,我们通过 rename 命令可以来修改。给它改一个名字,我们再次通过 state 命令可以查看一下,它的名字就发生了变化。第六个 agent, 它是用来切换当前活跃的 agent。 如果你开启了子代理, 比如第一个 agent 是 负责读代码,另外一个 agent 负责跑测试,还有一个 agent 负责 code review, 那 我们通过这个 agent 的 命令就可以在这一些 agent 之间进行切换,查看它们各自任务的进展,或者继续跟一个 agent 对 话。当前我这里只有一个 agent。 第七个 sub agents, 这个命令是子代理入口相关的命令,你可以把它理解成,当一个任务比较复杂时, excel 不 一定只靠主 agent 来做,可以把一部分工作拆分给子代理来做,比如子代理专门做分析代码结构,还有一个子代理可以做测试风险,主代理最后做一个任务汇总,这种特别适合大型项目分析,因为这里没有创建子 agent。 最后一个 go, 这是给当前任务设置一个持续目标,它不像我们普通的一问一答,但 go 更像适合告 codex, 你 接下来围绕一个目标工作,直到它完成为止。比如说 token 消耗了, token 用完了, 或者任务执行完了,是一个长期目标。比如你可以设置把这个项目跑起来,修复启动中相关的错误,并确保测试通过。我们通过这个 go 命令,这样 codex 它就会持续地围绕我们这个目标来完成。 中间我们也可以自己检查进度。如果这个任务执行的时间太长了,我们也可以暂停,继续调整目标都是可以的。现在我们用一个真实的案例来把刚才讲的绘画相关的命令我们来串一下。假设我有一个需求是让 codex 帮我创建一个个人博课 技术站,用的是 v u e, 并且不止让一个 agent 从头写到尾,而是启动三个子代理来完成写作。一个负责写代码,一个负责测试,一个负责 code roo。 第一步,我们通过一个 new 命令,这是因为是一个全新的项目任务,我希望它是一个干净的上下文,不要被前面的掩饰 内容所影响。第二步,我们用 rename 命令来给当前绘画改一个名字,例如我叫 u e。 个人博课,我们可以通过 permissions 来确保当前项目的权限模式,我这里选择 auto view。 接下来,我们通过 go 命令给 codex 设置一个持续的目标。我们看一下提示词我们的目标,然后里面有一个启动三个子代理来完成一个 code review, 一个 code write, 一个 test runner, 还有一个 code review, 我 们复制提示词, 使用 go 命令,我们一起来看一下,然后发送。 我们看到它的要求是启动了三个子代理, 我们再来看一下,刚才我们有一个 agent 命令,我们刚才启动了代理,我们看一下有没有 agent, 这是我们默认的主代理。我们看到我们要求的一个 code write, 它已经给我创建好了,我们可以切换到子代理上面, 子代理已经在开始工作了,这个时间比较长,我们稍等一下,刚才不小心打断了,我们再来结合一个命令 fast, 我们把它速度切换到一点五倍速度,消耗两倍 token, 让它继续写代码。我们可以看到我们刚才起用的是子代理来写代码,现在我们的主 agent 在稍等,待我们这个紫 agent 完成任务。我这里整理了一份命令文档,如果大家需要,大家可以三连,然后我给大家发文档。我们接着刚才的演示,我们来看一下,他已经把刚才我定义的这些 agent 都创建出来了,自己跑了一个浏览器在这里做测试。这个紫代理 review 他发现了一些问题,然后他现在在给我们做一个修改好,我们看到他已经把我们的这个目标给完成了,我们一起来看一下效果,这就是他刚才写的一个简单的页面代码与工作区相关命令。 接下来这几个命令更像是 codex 做项目时的辅助工具。第一个是应逆时命令,它是创建一个 agent 点 md 文件,我们可以把它理解成给 codex 写一份项目说明书,我们来执行一下 当前的这个目录,还是我们昨天做的一个个人簿刻这个页面,我们通过 uscode 的 辅助插件,我们可以看到他昨天写的代码,在这个区域,我们看到他正在给我们写这个 ajax 点 md 文件,我们看到他已经给我们写完了 ajax 点 md 文件,我们一起来看一下。 都是英文的,我们可以把它改变成中文, 我们直接通过 ide 来查看比较方便。我们看一下它有项目结构和模块组织,然后构建测试和本地开发的一些规范,怎么测试,还有 pr 规范, 还有 agent 的 专用说明,它都已经给我写好了。这个 agent 点 m d 文件相当于是给 codex 写了一份我们当前项目的一个说明书, 这样以后 codex 进入这个项目都会优先参考我们这个 agent dmd 文件里面的规范,不需要反复解释项目约定。第二个命令是 plan, 在 真正开始写代码之前,我们可以输入 plan 切换成 plan 模式,它的作用是 先拆任务,不着急写代码。比如我要创建一个个人博克,它会先规划项目的结构,需要哪些页面,文章的数据怎么放, 会先做规划,规划完成以后它才开始写代码。这个命令适合在复杂任务面前,我们可以通过快捷键 shift 加 table 来关闭这个 plan mode, 也可以通过快捷键 shift 加 table 快 速开启 plan mode。 我 们来演示一下这个 plan 命令。我们通过斜杠 plan, 现在大家可以看到它不是直接写代码,而是它向我提出的一些问题,你希望关于我页面主要强化哪些?感觉 我们可以自己选,它不是直接的写代码,也就是说我们通过 plan 命令把我们提示词中的任务进行拆解确认以后,它才会开始给我们写代码。第三个命令 mention, mention 是 用来把指定文件或目录带入当前绘画。比如我想让它重点来查看一个文件, 我们就可以通过这个 mention 来选择这个文件。比如说 index 点 s t m r, 它就会重点地去查看这一个文件。这样做的好处是我们不用在提示词里面手动去复制一堆代码,也不需要它去查找对应的代码。这个比较适合当前页面,有一些 bug 我 们自己知道, 我们可以指定它来这个文件中查找。我们通过 man 审核这个命令,指定到对应的文件给它的提示词,查看一下当前页面的代码。 他收到这个指令后,他只会去查看当前这个类的代码。我按照你点名的这个要求来查看这个。第四个是 skills, 是 选择和使用本地技能的入口。比如我现在做的是一个前端项目,如果我本地有前端相关的 skill, 我 们可以通过 skills 让 codex 使用它,我们一起来执行一下它有两个,第一个列出当前的 skill, 第二个,开启和关闭 skill 我们确定。例如我这里安装了浏览器的 chrome 的, 还有 computer user fig 码之类的,我们就可以使用这个 skill 来做一些事情。我们可以看一下我这里用了这个 documents, 让他帮我写一个项目文档。 skills 是 给 context 加一套更专业的工作方法和技能。第五个 default, 当 context 写完代码以后, 我们可以输入 default 命令, default 会展示当前工作区发生了哪些改动,比如新增了哪一些文件,修改了哪一些文件。这一步非常重要,因为在真正运行或者提交之前,我们应该先看一眼它做了哪些改变。我们通过一个案例来演示一下这个 default 命令,给他一条指令, 我让他把关于我页面这关于我这三个字改成红色,他已经修改完了,我们看一下,我们看到他已经是红色的了。我们再来试一下刚才的 default 命令, 我们可以看到他改动的文件,这就是 default 命令,就是会展示工作区发生了哪一些改动。第六个是 review 命令, review 是 让 codex 对 当前工作区做一次代码审查,我们一起来看一下, 我们通过 luul, 然后它有四个选项,第一个这个 pr 审查,也就是会把当前分支和某一个 base 分 支做一个对比。第二个就是审查当前还没有提交的本地改动, codex 刚改完代码以后,最常用的是这个。 第三个是针对某一次 commit 做一个审查。第四个是自定义审查,我们选择第三个,我这里有两个提交。我们看到这个 code luul 已经结束了, 这个初设版本是一个 v u e 项目,可以成功构建路由页面和数据流也是一致的,我没有发现值得代码审查里面需要提出来的明确问题,这就演示了我们这一个 rule 命令。我们把代码工作区的这六个命令串一下, 我们先用 easy 命令建立项目规则,再通过 skill 命令选择自己的这一个技能。我们要开发的时候,我们可以通过 plan 命令先做一个规划, 把任务做一个拆解。我们可以通过 minsh 命令来对指定的类进行一个修改。写完代码以后,我们可以通过 default 命令查看改动。最后我们可以通过 review 命令来做一个代码审查使用,这就是我们代码和工作区六个命令正常使用的一个顺序。 上下文,记忆相关命令这里主要有三个命令,主要解决的是上下文问题,也就是 codex 怎么知道我们在看什么,以及当前绘画太长的时候怎么保持清晰。第一个 id 一 命令,它主要解决的是把 id 一 里面的上下文带给我们。 codex, 我 们通过 id 一 命令,它这里提示 id 一 contacts is on, 说明我们这个 id 一, 我们选中这个字段, 问他这是什么意思,我们可以看到他直接读取到我们 i d e 里面这个字断了,我这里刚才选中的,他解释了这是什么意思。这样相当于是把我们 i d e 里面相关的代码的上下文,我们可以直接带到这个 c r i 中, 它是把我们这一些代码编辑器里面的上下文带到我们当前的终端里面来,可以解决我们不想手动复制粘贴的问题,也特别适合来做一些局部 bug 的 调整。第二个命令 compact 压缩,它是用来压缩当前对话的上下文。当一个任务跑得很久以后,整个记录 上下文会比较长,模型需要处理的信息也会变得更多,重点可能不够集中,有可能这个时候就会产生一些幻觉。这个时候我们就可以通过这个 compact 的 命令把当前可见的对话 总结压缩成一个更精版的,保留更关键的决定。我们这里可以看到已经使用了百分之二十三,我们来试一下这个命令,我们看到压缩还是比较厉害的, 当前上下文占用减少了,所以 compact 的 命令适合是长任务中途,比如项目做到一半,我们感觉到上下文很长了, 我们又不想重新开一个绘画,我们就可以先压缩一下。第三个 memory, 它是用来管理记忆相关的功能, 我们先执行一下。第一个是以后开了新绘画 codex 是 否读取已有的记忆。第二个是 codex 是 否从绘画中生成新的记忆。第三个就是一个重置,它主要是用来控制 codex 要不要使用这个记忆,以及要不要从绘画里面来生成新的记忆。 所以这三个命令分别对应着三种上下文。第一个 id 是 当前编辑器的上下文。第二个 compact 是 当前常对话的上下文。第三个 memorize 也是跨绘画的一个长期上下文状态与调试相关命令。接下来这几个命令主要是查看 context 当前的状态, 调整终端的显示以及管理后台运行的任务。第一个 state 用来查看当前绘画的状态,例如当前使用的模型目录 权限,绘画 id, 还有上下文限制之类的。第二个 slide 主要用来配置底部状态栏,就是我选中的这个地方,我们一起来看一下。比如说主题的颜色,我们看到这里使用了九十点七 k, 我们可以切换来控制它显不显示模型的名字。 g p t 五点五控制显不显示项目的名字,这里已经显示不下了,我把模型关了,使用托管关了项目的名字,还有当前所在的分支运行的状态,当前的这个模式,我这里是 auto view, 我 们可以通过 statline 来配置底部状态栏 的一个显示情况。第三个 title, 我 们可以通过 title 命令来配置终端,这个标题页的一个显示,我们来试一下,我们可以看到这里有个 codex c l i, 也就是项目的名字,在这里可以控制它显不显示。 这一个是当前的目录,比如说斜杠, codex c l i 这一些,根据自己的需要进行灵活配置。第四个 ps, 用来查看后台的一个终端任务。有些命令可能在后台持续运行,比如说 开发服务器测试监听长时间的一个构建任务,我们可以通过 ps 命令来查看。最后一个 stop, stop 是 用来停止后台的一个终端任务,比如开发服务器已经用不了,或者某个命令卡住了,我们可以通过 stop 来暂停。这就是我们状态和调试的一个相关命令工具与扩展相关命令。 第一个 m c p, 我 们通过这个命令可以列出当前所安装的 m c p 服务,我们可以看到我这里安装了 chrome, d v tools, 还 codex app 相关的服务, computer user, 这些都是 m c p。 我 们一起来添加一个 m c p 服务,我们这里来安装一个 figma m c p。 复制 m c p 的 地址,我们通过这个命令就可以添加一个 figma m c p。 我 们看到已经添加成功了, 我们来看一下在这里面能不能看见刚才我们添加的 figma mcp, 我 们这里已经看到了显示了 figma mcp 了, 所以我们通过 mcp 命令,我们可以看到当前绘画里可以调用哪一些外部工具。第二个是 hux, 它是用来查看和管理生命周期的钩子,钩子就是在关键时刻会自动触发,疑问表示触发时机。 in store 表示安装了多少个 hook active 标记,当前激活了多少个。这个是一个描述,这个是工具执行前开始触发,这一个是请求权限触发,比如让 codex 联网或者修改一些外部文件。 工具执行后开始触发上下文压缩触发等等之类的。我们可以通过命令来查看当前配置了哪一些钩子,哪些是可信的。 我们也有一些应用场景,比如说我们执行一些长任务,比如说通过 grow 命令执行一些长任务。执行完之后,我们希望他提醒我,我不可能时时刻刻的 待在这里,看着他有没有执行完。我们可以让他执行完之后,比如播放一个音乐。第三个 plug in, 它是用来查看或者已经安装的插件,这里可以看到这都是我安装的一些插件,例如编辑文档的 连接, figma 及 mail 相关的一些插件。插件通常会给 codex 增加一些新的能力,例如我们点击 document, 我 们可以来卸载它。这个插件里面使用了哪一些 skill, 这里都可以能显示。 我们返回最后一个 keymap, 这个了解一下,其实就是更改快捷键的一个指令界面,显示相关命令。第一个 then 用来选择高量主题,我们试一下, 这里有很多主题,我们切换可以看到代码的一个主题颜色,如果你觉得默认颜色看着不舒服,可以通过当前命令选择自己合适的主题。第二个 vm 用来切换 web 的 输入模式。 默认情况下, codex 的 输入框更像普通文本输入,我们看到它这种切换是这种模式普通文本的,如果我们通过 web 切换这种会看着比较舒服一点。这个命令适合 web 的 用户,如果你不熟悉,可以保持默认风格。第三个 row, 用来切换滚动模式,这种命令主要是为了方便复制终端中的内容,我们通过这个命令可以切换到更原始的滚动显示方式,这样复制内容 更方便。最后一个是 copy, copy 用来复制 codex 最后一条完整回复的消息,我们看到他回复了我这一段话。如果我们不想手动复制,我们可以通过 copy 命令。我们直接通过 copy 命令就把当前消息已经复制好了, 直接粘贴就可以退出。与维护相关命令,我们一起看一下。第一个 clear, 用来清空中端,开启一段新的绘画。它和 new 命令有点像,都是让你重新开始, 但 clear 更强调清理当前终端的界面。第二个 logout, 用来退出 codex 登录。如果你是在公共场所 或者临时借用别人电脑,可以通过当前命令来退出本地的一个登录凭证,让这台机器不再保持你的一个登录状态。第三个 feedback 是 用来把日制发送给 codex 开发团队。最后一个退出 codex, 它和 quit 一 样,都是离开 c r i 绘画。如果你还有重要改动没有保存或者后台任务在跑, 最好先确认再退出。到这里, c r i 里面四十多个命令我们已经讲完了,你会发现这些命令并不是让你死记硬背,我们可以把它分成类。有的是权限管理,决定 codex 能做什么。有的是绘画管理,决定任务怎么开始、 暂停、恢复和分支。有的是管理上下文,让 codex 更精准地理解你的项目。有的是辅助开发,比如 dev review 引用文件,制定计划。有的是调整终端体验。 我们在 c r i 里面用得更顺手。如果日常用来写代码,我们记住几组就足够了。 permission 权限管理 new resume fork 绘画管理 plan global 任务推进 mention idea 管上下文, def review 管代码检查 state compact 管 长任务状态。如果这期视频对你有帮助,欢迎点赞、收藏加关注,后面我会继续分享 ai 相关知识,我们下一期视频再见!

前两天我发了一条视频啊,我说 codex 很 可能是这一波 ai 浪潮里真正值得认真对待的赚钱工具了。不是因为它会携带码,而是因为它可以帮助你搭建一套个人商业后台, 把你分散在各处的一些经验啊,内容、资产和流程,真正的连成一个可以运转的系统。今天这条视频我们进一步往下说,如果你此刻正在经营一人公司,打造个人 ip, 或者是正在把自己的专业积累转化成商业价值,成为一名超级个体, 我直接带你来拆。你最应该先用 codex 做的五件事情,以及每一件事情的提示词,我都给大家准备好了,先码后看。 第一件事情,先用 codex 盘点你的个人资产。很多有积累的人不是没有资产,而是资产太小了啊!你的公众号里有观点,交付记录里有方法,朋友圈有用户反馈,工作文档里有项目经验。 哎,当这些东西全部分散在不同地方的时候,它只能叫做资料。可是当你把它们统一放进 codex 工作区,它能够帮助你重新梳理出你是谁, 你做过什么,你有哪些可以附用的内容和产品资产提示词?可以这样问,请基于我的电脑或者是我的这个文件夹,帮我盘点内容资产、产品资产、案例资产和可变现经验,并且按照变现潜力进行排序。哎,你这一步做完之后,会对自己的认知发生质的变化, 多人做到这里,才第一次真正看清楚自己手里有什么。第二件事情,基于你的现状,让 codex 给出行动优先级。 我现在该做什么是一个烂问题,因为它缺少上下文。 codex 的 价值在于它已经读过你的全部资料了,所以你可以问出更有价值的问题。请基于你对我的了解,告诉我接下来三十天最应该做的十件事情,并按优先级排序。如果我要把经验产品化,最小可行性产品可以先从哪个方向切入? 再或者你可以问我现在变线路径上最薄弱的环节在哪里?他给出的不是泛化的建议,而是基于你的业务状态做出的判断。这个才是 ai 作为工作助手真正有用的地方,不是替你思考,而是基于充分了解你作出判断。 第三件事情,用 codex 搭建属于你的内容生产工作流。大多数人用 ai 做内容,还停留在想到选择题就让 ai 写一篇的阶段,但真正拉开差距的是你有没有一套可以稳定产出的内容生产系统。 以我自己为例,我不会直接让 codex 帮我写一篇小红书或者是抖音脚本,我会先让它判断这个选择题能不能承接我的主线 ip。 第二步,我会调用一些豹纹创作 skills, 以及 k k 学姐自己的公众号或者是小红书的内容创作 skills。 同时呢,它还会在这个内容库里面调取我的 案例、我的背景、我是谁,我的产品是什么,我的学员案例等等。把这些融合在一起,我会得到第一个版本的内容。第三部呢,我会把这篇内容再拆成对应的一些长文啊,或者是口播内容,朋友圈素材、直播课讲解的内容等等。 第四步,最后再调用 codex 检查我的开头是否有足够的勾子,是否有一些心理反转,语言表达是不是过于的 ai 味浓。第五步,我再手动地进行一些微调,最后进行归党,成为我的内容资产。 这是一套工作流,而不是一次性的输出。你可以直接让 ai 帮你进行设计。你可以说,请基于我的账号定位和内容历史,帮我设计一套从小题到多平台分发的内容生产 skills。 一 人公司超级个体的核心竞争力,不是你能爆发多少次,而是你每一天都能在不同的平台上稳定的输出。 odes 帮你做的工作流就恰恰决定了这件事情。 好!第四件, codex 能帮你做的事情就是让每日复盘变成系统沉淀,有行动没有沉淀是一个创业者最大的效率漏洞。你今天发了内容,明天聊了客户,后天改了产品, 明天都很忙,但一周过去,说不清楚哪里有效,哪里该调整,下一步该怎么走。而 codex 就 能够帮助你做每日或者是每周的复盘,把零散的行动转化成一套可以复用的经验。比如说哈,每天,你可以这样告诉他,请根据我今天的工作记录,总结三个进展,三个问题,三个可以沉淀的经验。 每一周,你可以告诉他,请复盘我的哪些动作是有效的,哪些问题反复出现,哪些内容可以产品化,哪些流程需要优化。当你持续的不断的这样去做,你会发现自己的工作方式在悄悄的发生改变,每一天都开始成为系统的一部分,而不只是完成了一件事情。 第五件事情,让 codex 把你的周期性任务自动化出来,猎人公司超级个体的时间是最稀缺的资源,那些不重要但必须做的任务,比如说整理选题库啊,更新素材库,跟踪用户高频问题,如果这些全靠大脑记,你会持续地处于低水平的认知消耗里。 而 codex 就 可以帮助你设定周期提醒和任务模板,比如说定期整理选择题,搜索适合你账号的热点,每天记录三个用户痛点,每周规当朋友圈素材。这些事情单独看都很小,但是积累起来是你能把精力真正放在高价值决策上的前提。 记住哈,系统化才是一人公司超级个体的护城河。上面讲到的这五件事情,背后有一个底层逻辑,超级个体真正的优势不在于你有没有一套可以持续运转、自我迭代的个人系统。 以前你的经验是散的,内容是散的,行动是散的。而 codex 就 可以帮助你把这些东西一点一点的给它连起来,让你的每一次输出都在加厚系统,而不是只是完成一个任务。 六月四号中午十二点半,我会专门做一场直播公开课,讲一讲普通人超级个体知识。创业者该怎么用 codex 搭建自己的个人商业系统,从资产梳理到流程搭建,带你真正跑通这套逻辑。

在你使用 qqcode 或者 codex 的 时候,如果你想省钱,那么有一件最关键的事就是你要把 session 控制的尽量短,能用单轮绘画的就不要用多轮绘画,能用较短的多轮绘画完成的任务就不要用较长的多轮绘画。 因为多轮绘画的运行机制是,你每发送一个多轮的请求,它是会把之前所有的轮次的请求和在一起打包发给模型的,这样它才能够保持住自己的 context。 也就是说,如果这个多轮绘画现在是第三轮,你在发第三轮的请求的时候,实际你消耗的头肯是第一轮加第二轮加第三轮,所以这个绘画变得越长,你的成本会是平方级上升的 啊。所以如果你想省钱,你就记得要尽量的用短 session, 要尽量的用单轮会花。当然,如果你有一个傻老板或者傻投资人,他特别喜欢看你每周消耗 token 这个指标的话,那你就把所有的一周的东西都合在一个场的 session 里面,这样你就可以非常轻松的完成这个任务。

codex 是 我过去几个月高频使用的 ai 助手之一,我用它做研究,写文档、做 ppt, 整理内容灵感,做网页原型。上个视频讲了 codex 基础,这期视频讲一个今年很值得先搞懂的 ai 概念 skill, 因为它决定了 codex 到底只是陪你聊天,还是能按你的工作方式反复干活。简单理解一份可以重复使用的工作说明书, 你可以把某类任务的流程规则、检查标准提前写进去,下次再让 codex 做类似的事,他就不用每次重新听你解释一遍。比如你经常让 codex 做网页,你不想每次都重复说页面不要太 ai 味,不要蓝紫配色, 这些都可以写进一个设计类 skill 里。以后你只要让 codex 用这个 skill 检查页面,他就会按那套规则去看代码、改样式,再告诉你改了哪里。 这就是 skill 最实用的地方。把你反复说的要求变成一套固定流程,那么在哪里看和怎么用 skill, 可以 去 codex 的 侧边栏这个入口里看,里面会有一个 skill 子页面, 已经添加或创建过的 skill 会出现在这个列表里。使用的时候,通常可以在聊天里输入 skill 名称,或者用斜杠跳出来。比如你有一个 find skill, 就 可以直接斜杠选中,帮我找一个适合做 ppt 的 skill, codex 就 会按 skill 里的流程去跑。那怎么创建 skill? 有 两种方法, 第一种最简单直接这样说,请创建一个 skill 以后,我给你一个网页项目时,你要先检查移动端排版按钮样式、文字层级、颜色是否太乱,最后输出修改文件和检查结果。这种叫 prompt skill, 但我更推荐第二种,先把流程跑通,再把流程固化成 skill。 举个我刚实测的例子,我想做一种白板手绘风讲解图,我先给他一个参考图,让 codex 按我的要求生成讲解图 第一版如果不满意我就继续改,比如少一点黄色纸张质感画面更像课堂白板。等到有一版我觉得可以附用,我再说。把它固化成一个 skill, 这时候 codex 会反推刚才的流程,它会把这次反复调整出来的规则写进一个 skill。 md, 这样下次我再用白板手绘讲解图, 就不用重新解释一遍审美和结构,直接调用这个 skill 就 行。如果你想让 codex 使用 skill creator, 它会按更标准的格式帮你生成可附用 skill。 我是 ai 知识派,我们下期见。

小白也能一键安装的 codeast, 它终于来了,比起来 openclo, 它更适合普通人,它能够操控电脑做 ppt, 调用 emoji 二拓图,还能自动执行你每天的任务。今天就手把手教你安装 codeast, 五点五 再带你使用四个能够真正提高工作效率的用法,记得点赞收藏。第一个就是内容自动化,在左侧点击自动化, 新建自动化功能。其实自动化就相当于定时任务,可以帮你自动执行很多重复的工作,你也可以在这里面选你想用的一个项目自动化的一个时间段,比如在这里,我就让他每一天发给我前一天的 ai 资讯后,点击这里的立即执行,就可以使用了。 同理,不管是日报、周报还是一些重复性的工作,比如签到都可以交给他,这样就可以省下非常多的时间。第二个就是办公软件的调用,你只需要告诉他,比如我想让他收集一下近两个月的金价波动,他就可以自己联网帮我搜集资料,整理成 word, 还帮我编辑了一个表格, 像栽秧的部分,甚至关键的一些节点,也帮我标明了图标,整个都非常的详细。接下来我们可以让它把这个 word 变成一个清晰可见的一个 excel, 分了不同类型,有价格节点、政策节点阶段,一个解读获取,一个观察,还是比较清晰的。可以把一个 sale 内容让它再帮我做成 ppt, 以及调用它的 emoji 二的升图功能。第三个就是 skill, 我 觉得 call this 的 在这一点上非常的友好,因为它安装 skill 过程非常简单, 几乎是我用过最省时的,你只需要给他一句话,或者是发一张截图,他就可以直接帮你安好 skill。 另外呢,你也可以点击左侧的技能,在里面选择你觉得比较好用的一些技能。这里给大家推荐几个我常用的 skill, 能够大大的提升工作的效率,操作电脑和浏览器,这也是 codex 的 非常好用的一个功能。 比如我现在可以让它帮我打开 b 站,替我搜索一下 codex 相关的搜索词,并帮我整理成 word 文档,你就可以看到它可以直接操控我的电脑使用,真正实现了电脑替我打工的美梦。现在你就会发现, codex 它不仅是一个聊天工具,还是一个可以直接帮你干活的 ai 助手。

想不想让你的 codex 越用越聪明,越用越懂?你把这段提示词发给你的 codex, 它的效果啊,是经过 openid 总裁认证的,算是官方认可的优化方式。它的核心的优势是让你从给一个任务,让它帮你完成这个阶段,变成让它自主的去进化。这个提示词可以让 codex 回过头来去看你这段时间的一个工作记录,你最近让他干什么活, 哪些事情是反复出现的,哪些流程每次都差不多,哪些任务明明是可以不用手动重复。结合这个提示词,它自动可以把这个工作分类,有适合它自动帮你做成 still 的, 比如说你固定的内容创作流程,资料的整理流程, ppt 的 生成流程。还有一些适合做自动化的任务, 比如每天定时收集些信息,整理日报,生成代办。所以这个提示词真正有价值的地方,它不是让 callles 再帮你完成某一次任务,而是让它反过来去分析你的工作方式,帮你发现哪些事情以后可以流程化、标准化、自动化,相当于针对你这个助手完成一次整体的系统升级。

最近在用这个 codex, 呃,写一些 a p p 小 程序,好像是建了一些网站什么的, 然后如果说用它自己的模型的话,这个很贵哈,所以说我现在连接了这个咱们本地的 啊, dickzip 的 这个模型通过什么样的工具呢?那这个就可以给大家介绍一下,有个叫 memo to codex 的 啊,这样的一个开源工具啊,它呢也挺好用的,配置上来讲也比较简单。呃,不定期的话, 呃,它也会做一些更新啊,我用的还可以啊,你看设置上来讲就是非常简单哈, 因为它已经预制了一些模型啊,有 miimo 的 这些模型,还有 decip 的 这个模型, 只需要在那个后端的一个配置文件上把这个 decip 的 这个 api key 贴上去,然后就可以使用了啊,贴上去之后,你看我这上面就变成了已启动的这样的一个状态啊, 然后在 codex 接入的这一块,就直接在你想用什么样的模型,比如说现在有这个 v 四 pro 和这个 v 四 flash 啊,你可以用 pro, 也可以用 flash, 在 这边有一个写入文件并起用点一下, 然后你 codex 退出,重新进一下,就可以切换为这个模型了啊,非常方便。 你看我这个模型,我不光用官方的这 a p i, 我 还用这个 open code 的 这个 a p i 的 这个啊, decip 这个模型也都是可以去用的,比较方便,推荐给大家。