ai 还是太强了,这是我们为了自己的服装小店穿版方便,基于 banana 和第二开发的一套详情图的生成工具,可以直接上传 这个现成的服装,然后就能直接生成想要的这个店铺主图。因为现在还在测试阶段,服务器压力山大,你们要是用的时候卡住了,还请喷的轻一点。
粉丝27获赞130

太夸张了,用这个网站批量生产淘系、猫系的爆款服装,主图一张,成本只要几毛钱,感兴趣的可以进主页粉丝群领邀请码试用。

好多人问我用服装置板那个 cad 是 啥,我用的是负一 v 九啊,他好像服装置板有一个负一有博克还有 et, 就是 你能下着哪个下哪个免费的,你就去尝试一下。我感觉这些东西他可能软件不一样,但里面内容应该是大同小异啊。这只是我感觉的,因为我没使用过别的软件。 我最开始是在官网下的那个负一 v 八,那个 v 八也可能是当时我是纯纯小白啊,就不太好用,我觉得用的不顺手。后来就是我想要有 v 九,然后我老公给我整了一个,整了一个我感觉 不像是官方的啊哈哈哈,所以在这我就不说了,这个其实也有问题,但是现在我就是用着也还凑合,至少我把一个图纸完整的做完了,打出来了,做上衣服了。我觉得这个还可以给你们看看他啊,这三个图标就是下完 v 九之后出现的,我一般用这个 这个做这个就是自由自由打版,你想怎么打就可以用这个打。呃,这个是排料系统, 就是他们用那个卖家打印的时候用它排料的,这个就是商用的,带批量放码啥的那种的,就是你做完一件之后,哎,直接放码,就是幺六五幺六零幺七零全都出来那种的, 然后还给你们推荐一个这个,我打印的话就是用这画完图之后,然后导出 p、 l t 文件,然后到这个 a、 b v word 里头给它导成 pdf, 然后直接用打印机打印, 你用 djs 也可以直接导成 pdf, 但是它导出来之后你可以去测量一下,它会有一个零点五以内的误差。

codex 啊,这个东西我真心建议还没用过的人,一定一定要找机会试一次,不是因为它听起来高级,而是你真的用它跑完一个任务之后,你就会理解什么叫 ai agent。 这条视频就是我用 pose 做出来的。我是一个金融从业者,每天面对的东西都在变,市场在变,政策在变,客户的问题也在变,信息越来越多,任务越来越碎,但是真正能沉淀下来的东西却很少。 我接触 codex 之后,我现在脑子就基本就一件事,就是怎么养好我自己的 a i a 枕头。我每天眼睛一睁就是 get skill, 就是 补知识库,我想着怎么能把它变成一套真正能用的系统。 我第一次让 codex 执行任务,就是让他帮我整理了一堆文件,一百七十六个文件,十个文件加五百多兆, 八分钟就八分钟,分类排序归档,全都处理好了。然后我发现 就是 ai 真正有价值的地方,不是一个什么要给你一个最真实最不绕弯子的答案,而是把混乱的工作变成一个可以规划,可以执行,可以复盘,甚至可以持续运转的一个项目。 所以这个账号后面我会记录三件事,就是第一,我用 ai agent 呃解决了什么真实问题。第二,呃,就是这个过程花了多少 token, 到底值还是不值。第三,也是最重要的,就是这些流程能不能慢慢搭成一套普通人也能用的生产系统。 呃,我是从零开始,但我不想一直停留在零,这是我的第一条系统搭建日记。

前几天我发了一条低能量穿搭视频,数据还不错,评论区很多人问我是怎么做的,其实他不是靠什么复杂剪辑,核心就三步,先拆视频, 再生成穿搭图。最后让图片动起来,我直接把完整流程给你讲一遍。第一步,先去找一条你想模仿的对标视频下载下来,然后打开 codex, 把视频发给他,直接输入这句话,拆解这条视频,并为我反推出视频生成的中文提示词。 等一两分钟,他就会把画面风格、镜头节奏、人物动作、服装氛围这些东西拆出来。第二步,继续让他把每一套穿搭的图片提示词写出来, 比如模特长什么样,穿什么衣服,站在哪里,画面是什么风格,全都让他拆成可以直接升图的提示词。第三步,打开 g p t, 把刚才的提示词复制进去,用一妹制二,一次生成穿搭模特图。图出来以后,再打开小梦,把所有图片上传进去,模型选择 sims。 二, 输入刚才反推出来的视频提示词,时长选十五秒,等它生成完,最后稍微减一下节奏,配个 bgm, 一 条低能量穿搭视频就做好了。 所以这类视频真正难的不是会不会穿搭,而是你会不会把爆款视频拆成一套可附用的 ai 流程。想看我下一期直接实操一遍的话,可以先关注我,继续把 ai 做图做视频的玩法拆给你看。

大家呢,一定一定要把 codex 用起来啊,我上一次被 ai 震撼到,还是两年前第一次用 excel 的 时候,完全可以这样说, codex 是 这个时代普通人能够拥有的最好的专家型 ai。 如果你用 ai 还是停留在写个朋友圈,写个标题,生成个图片的初级阶段, 那你本质上呢,还没有真正的入门。真正的 ai 不 仅能够给你答案,它还能够直接动手帮你干活。比如说呢,我们去创作内容,过去呢,需要手动的去找选择题,写脚本,创作标题和封面,全部的流程呢,都依赖于你个人的经验。 但是现在呢, ai 能够帮你拆解整个的业务流程,完成每一步的内容创作。最关键的是,它可以把十年老员工的能力,呃,爆款的经验,做事情的 sop 流程全部固定下来,真正实现解放生产力。这不叫写文章,这叫为你搭建了一条自动化的内容生产线 啊。我们再来说一下这个销售,很多人呢认为用 ai 去做销售就是搞个机器人,自动的去群发,那肯定不是的,一个真正聪明的 ai, 一定能够一比一的复刻你们顶级的销冠的能力,他不仅能够精准的识别每一个客户的情绪和他本身的一个痛点,还能够根据不同的用户画像,动态的调整话术, 甚至自动的去生成针对性的这个转化的方案。过去呢,销售靠的是自己多年的经验,但是现在呢, codex 就 相当于克隆了无数个销冠 扣代码子最可怕的地方不是在于它生成的内容有多快,而是它能够把你们脑袋里的那些多年的经验变成一套可以重复调用的技能 啊,从内容到生产,从产品的交付再到销售的转化,全链路呢,都可以完全跑通。如果大家想要了解整个的 ai 使用的流程呢?大家呢可以点个关注。

codex 真的 特别强,像这样一套非常细致的系统, 它自己运行了二十一个小时,把所有的一些细节在一个一个的完善, 包括这种非常细的交互细节,包括他的一些什么市场定价,以及所消耗的一些这个搜索算力等等,都有非常详细的全线配置,后端管理, 还有邀请链接,前后端一次性全部搞定,他甚至还做了新手引导,就在这干。

大家平时用 ai 写大码儿,是不是总觉得像在开盲盒?运气不好的时候,修 bug 的 时间比自己从头写还要长对吧? 其实问题可能出在你用错工具了。欢迎来到这期解读,今天我们不说废话,直接教你如何停置,把通用 ai 当做万能药,手把手在你打造一个专属的高效率的 ai 工程师小团队,准备好颠覆你的开发习惯了吗? 今天这期解读我们的路线图非常明确,首先看看什么是 ai 编程的新范式,接着聊聊思考与执行该怎么完美配合。然后是核心的任务拆解策略,新手最好怎么练手。最后还会教你怎么像资深大佬一样严格把关。 好,我们直接切入第一部分, ai 编程新范式 reddit 论坛上有个资深开发者总结得特别精辟,简直一语道破天机,他说, chat gpt 是 你的思考伙伴,而 codex 才是你的执行引擎。 大家别再试图让一个 ai 干完所有事儿了,那样逻辑肯定会乱套,咱们得把大脑和双手彻底分开,你得记住,这也是我们今天接下来所有高级战术的绝对基石。接着进入第二部分,我们具体看看大脑和双手怎么才能打出完美配合。 你想啊,如果非要给 ai 定个职级, gpt 绝对是那个天天帮你画架构图的系统架构师, 他负责深思熟虑搞定业务逻辑。而 codex 呢?他就是你手底下那个贼能干、不知疲倦的初级开发小弟。小弟不负责定大方向,他就负责挽起袖子钻进项目里去读文件、改代码,分工明确了,各自发挥特长,才会越帮越忙,你说是不是? 所以说,这几个工具根本不是在打雷台,它们拼在一起,刚好构成了一条超强的自动化流水线。遇到架构难题,先找掐 gpt 聊聊,想清楚了,把魂扔给 codex, 让它在你的 ide 环境里疯狂输出代码。最后,如果你想把这套经验的能力做成长,停给最终用户体验,再去调用 api, 这就是现代 ai 开发行云流水的三部曲。 明白了神仙分工之后,第三部分,咱们聊聊极其关键的任务拆解策略。 面对复杂的项目,千万别上来就跟 ai 说嗨,帮我写个淘宝,那他绝对当场崩溃给你看。 你得先跟你的架构师 check gpt 一 块儿把大项目一点点儿切碎,切成剁碎吗?举个例子,别说写个登录系统,你要说写一个验证邮箱格式的正左函数,然后把这种微型任务一步一步地喂给库尔德斯, 就跟带真正的欣然一样,一口吃不成个胖子,循序渐进才是最搞笑的。肯定有人会问,干嘛费的气这么碎嫌麻烦吗?实战教训太惨痛了各位! 首先, ai 的 记忆力是真的有限,代码塞多了,它直接失忆,上下文全丢了。其次,如果它吐出一堆乱七八糟的半成品,你手动去拼凑的交接成本简直高得吓人。最后,小任务能防患于未然,避免 ai 写嗨了完全跑题, 这就叫防止代码漂移。那么对于刚上手的朋友,第四部分,咱们来看看针对初学者的最佳实践。 如果你刚接触 codex, 听我一句劝,先从小规模任务练起,把它当成一块块拼图,先让它帮你修个极小极小的 bug, 或者写个单一功能的工具函数,千万别指望它一上来就给你建一座大城堡,不然你接下来的日子就只剩无休止的第八个噩梦了。真不是开玩笑的, 我们来个特别经典的实战例子,这可是直接从 codex 的 研究论文里拿出来的。你看这个自然语言指令,简直是教科书级别的。人 家没有含糊其辞地说算个欺术,而是极其精准地定义了输入是什么,甚至举例说明,如果输入这个列表,必须给我返回那个结果。你的指令写得越像一道简的数学大题,它给你的代码就越完美,几乎不用你怎么修改。 咱们得记住一条铁律, ai 可不会读心术,你绝对不能丢下一句,帮我把这页面修好就走人。你得极其明确地告诉他,去找到 header 组建,把背景换成蓝色,并且确保移动端标题是居中的。 必须得啰嗦一点,精准一点,给足上下文一点,瞎猜的空间都别给他留,这才是驾驭他的正确姿势。好了,戴玛尔写完了就行了吗?绝对不是!第五部分,我们要聊聊你的新身份。资深把官人 说真的,代码生成那一刻,好戏才刚刚开始。这时候,不管你真实的编程水平怎样,你必须立马戏精上身,把自己当成公司的资深技术大牛。你不再是个被动接受代码的人了。你是个极其严苛的审查员, 去一行行看逻辑,去跑测试,去盯日制。记住啊,他毕竟只是个干活的 ai 实习生,出了事要在代码上签字,负责的可是你本人呐! 这份权威报告里,有一张图表揭示了一个特别吓人的现象, ai 其实适应性特别强,强到连你的坏习惯它也会全盘接受。 也就是说,如果你提供给它的上下文理本来就有极其细微的 bug, 或者命名一塌糊涂, codex 根本不会去提醒你。它会顺着你的糟糕逻辑完美复制,甚至放大你的不良习惯,惊不惊喜?你的坑最终变成了它挖给你的更大的坑。 所以,在把任何 ai 生成的代码合并上线之前,这几条安全清单必须死死焊在脑子里,认真盯紧测试结果,每一行逻辑都要亲自过目,尤其是那些自贡生成的 pr, 千万别让它悄悄混进去了。最重要的一点,永远永远不要盲目信任 ai, 不管他平时表现得多绳,一旦系统挂了,大半夜爬起来连夜修 bug 的 还是屏幕前的你。好了,咱们把工具边界和工作流都梳理得明明白白了,别再把 ai 当许愿池了,把它当成你手下真实的数字员工去管理吧。 那么,你是想继续靠运气去试那些玄学的提示词呢?还是准备好挺身而出,成为你专属的高校 ai 开发团队的超级经理?掌控带瓦的权力就在你手里。希望这期解读能帮你拨开迷雾,赶紧去构建你的下一个经验项目吧!

codex 太厉害了,给你们看一下啊,就是我跟他说我的需求啊,就是自动化生成图片,然后对应的 cds 二点零的分镜提示词,然后直接生成视频,你看这个流程,直接他就能帮我做了啊, 他先让我啊,登录授权我们这个呃节目的账号啊, 然后我登上去之后啊,他说让我确认,我说我的意思是用 image 二模型生成图片啊, 就是目前来说最强的生图模型,然后好,他用了 gpt 的 生成了这四张啊图片看,然后他就写好了这个完整的分镜提示词, 点进来看一下啊,我对他这一版其实是不是很满意啊,我就又上传了我的塑身形象和这个音频音色一起给他生产啊,他就直接啊添加进去后啊,升级后的,其实是看见没有啊, 他的运镜啊,他的音频音色,还有啊他的模型啊,比例, 分辨率描述,他都会一并成交,让我确认,确认之后,好,你看八分钟之后生成完成, 虽说非常的厉害。你看到这边我自己来剪一下。看这套新中式 主楼加旁边小院房,一进门就是双层挑空门厅气场一下就出来了,面宽十三米,进深十一米五,屋檐声带一亮,晚上比白天还好看。细节看这里,门厅线条,灯光,院子比例,这房子盖的讲究,老家准备建房的评论区打别墅,我把这套思路讲给你听, 怎么样,是不是非常的厉害,就是现在哦,如果说你还没有体验过这种 and just give 就是 这种自动化的啊, 模型就真的是,呃,你现在所有的工作方式都可以通过它给你复制出来了,不信你你问一问他,他都能给你复制出来, 真的。所以如果你还没有体验过的可以好在评论区啊,打个一啊,或者说想体验我会教你怎么去做。我真的想在 ai 时代啊他们大家一起无限进步啊。

最近有做童装类目的朋友来问我,像这样 ai 生成的小女孩跳舞并且可以带货的视频是怎么做的?我去相关博主的橱窗里面看一下他们的数据,发现挺不错,于是折腾了两天做了一个 agent skill, 我 们仅需要输入小女孩跳舞的原视频,服装的图片 以及一句指令,就可以生成一个完整的童装带货视频。好话不多说,我们正式开始本期的教程。那么首先还是来给大家展示一下这个 skill 的 使用效果。我们先来到豆包里面,生成一张模特图,粘入这行提示词, 点击发送。可以看到。等待了几秒钟后,豆包为我们生成了四张模特图,我们选择任意一张进行一个服装的替换, 这个服装呢,是我们要带货的那一套衣服啊, 粘进去依然是把提示词给粘进来,提示词呢就是一句白话,把图一的小女孩换上图二的套装和裙子,点击发送。等待了一会后,我们的这个模特图就生成好了, 我们把这个模特图下载到本地,然后就可以开始制作童装带货视频了。 注意一下,我这边用到的工具是云端的一个小龙虾,如果你想用本地的小龙虾或者是 hermes 都是可以的,看你自己的一个需求,那现在我们就来到云端 openclo 的 一个飞速对话窗口,来实现童装带货视频的操作。在这里我们要输入三个要素,第一个要素的话就是小女孩的一个跳舞视频, 这边的话可以去抖音上寻找任意的一个比较热门的跳舞视频都是可以的,然后把它的原视频下载下来,不知道如何下载原视频的,可以去看我的往期教程。第二步的话就是把我们刚刚制作的一个模特图上传上来,最后的话就是输入这一行指令哈,用这个 skill 把视频里面的女生进行替换, 然后背景也替换,就是实现一个动作模仿,如果你只想替换人物主体的话,可以把这个动作模仿和背景图替换给删掉就行。 然后我们点击发送按钮,等待了一段时间以后呢,这个视频就已经制作好了,然后他会把这个视频地址给我们,我们直接下载下来,然后到剪映里面进行剪辑即可。 来到剪映草稿里面,我们可以看到从左到右依次有三个视频啊,第一个的话是原视频,第二个的话是人物替换,第三个的话是动作模仿, 那么接下来的话我们就看一下这个 skill 是 如何实现的。我们先来看一下它一拖的万向二点七视频编辑模型啊, 我们来看一下它的一个调用是怎么调用的,首先的话是有一个基础的地址,然后的话它有两个方式,第一个的话是使用公网 url, 第二个的话是上传图片的 base 六十四编码, 那么我们还要上传一个东西的话就是原视频啊,接下来的话就是给他一个提示词就行了,就是做一个服装的替换,那么我们要做的工作很简单,就是把这行代码封装到我们的 skill 里面即可。我们首先的话是点击一下复制一下源代码,然后点开我们的 codex, 把这个源代码粘进去,然后输入这一行指令,理解模型的调用规则, 梳理给我,点击发送,可以看到 codex 的 话,很快就把这个模型是怎么调用的一个原理给我们梳理出来了啊,那么接下来我们就可以开始 skill 的 正式制作了, 核心就是这一行指令,把这个模型调用封装为 skill, 名字叫做小肥肠 cf 子。最终的话,要实现用户输入视频和图片,你可以进行 视频的一个编辑操作,同时的话还要注意一下,如果视频和图片是本地的,那么的话就需要先上传到 o s s 里面,由 o s s 转化为公网的一个连接地址,然后后续的 one 二点七才可以进行视频的编辑操作。我们直接把这个 指令给它粘过来,点击发送按钮,那么等待了一阵子,可以看到我们这个 skill 已经做好了,它的一个实现规则是用户输入视频图片编辑指令,然后这边的话如果是公网 url 的 话,就直接传给模型进行一个视频编辑操作,如果是本地文件的话,会先上传到阿里云的 o s s, 然后呢再进行后续的一个视频编辑操作。这个 skill 做好以后呢,我们要怎么用啊?就是如果你要集成到 workbody 里面的话,可以直接来到 workbody 这儿, 点击技能,添加技能,然后像上一个视频一样上传技能就可以直接用了。如果是我们要集成到云端的话,我们就需要先找到一个 ftp 工具,打开这个点, open curl workspace skill 这我们把我们的这个 skill 然后直接上传上来就行了,在这里给大家演示一下啊,我们只要找到 skill 的 一个目录,找到我们刚刚制作的这个 skill, 按住不动,然后给它拖进来就可以了, 小肥肠 sell good 就 可以了,然后我们就直接可以按照视频开头的那个方式来调用就好。以上呢就是本期视频的完整内容,感兴趣的同学可以跟着视频做一下,感谢大家的观看,我们下期再见。

哈喽,大家好,这是我自己在 codex 里面做出来的一个宠物服装网站,从市场的调研、产品定位、产品图到最后完整的 html 网页,整个过程中我没有手动写代码,也没有来回切换工具,都在 codex 里面完成。 那今天我就用这个真实的案例,想明白普通人到底怎么把 codex 用到自己的创意想法落地当中。一开始我只是给了 codex 一个很粗的需求,我想做一款面向稀泥市场的宠物服装。 他没有直接开始瞎做图,而是先帮我做了非常清晰的执行规划,包括先找到市场依据,定产品的方向,再设计系列以及生成产品图。 这里就涉及 codex 第一个很关键的能力, plan mode, 也叫规划模式,如果要生成同款的计划,你就要把这个规划模式打开。这个模式很适合新手,因为你不是一上来就让 ai 去乱做,而是先让它把任务拆开,告诉你每一步要做什么,为什么这样做,以及最后会交付什么, 你确认方向没有问题之后,再让它开始执行。第二个能力是它可以在项目过程中持续地帮你检查问题,也就是要开启 auto review。 比如网页做完之后,他会检查图片有没有加载成功,按钮有没有溢出,表单字段有没有写进去。那遇到权限和需要选择的操作,比如三种执行方案中,你想选择哪一种,以及需要启动的本地服务访问某些文件之类的风险性操作,他都会弹出弹窗确认。 接下来就开始自动批量生产产品视觉了,通过调用 gpt 的 image 去生产产品图,并存储在本地的文件夹里面,方便我们去找原始的素材。 但是这里我也想说一句实话, ai 第一次做出来不一定完全对,比如他最开始给我的风格就比较普通,我觉得不适合当地市场的审美。 这个时候就用到了 codex 里面很重要的一个能力, steer 也叫做中途接管,可以在对话框中输入你不满意的理由,告诉他这个方向是不对的。比如我要更鲜艳的花朵,更适合女生,更有悉尼精品宠物品牌的感觉。然后点击 steer 去接管方向盘, 他按照我新的反馈去重新调研,重新调整产品系列,重新生成图片。这个过程就好像是你在和一个设计助理协助他负责执行,但是方向盘一直在你的手里。最后,我让柯黛斯给这个宠物服装的项目呢,做出了六个设计系列,每个系列三张图,佩戴的生活方式图, 一张产品的细节,一套平铺图。也就是说,不同于 j b t image 的 单张出图功能,它一次帮我规划并生成了十八张用于落地页的产品测试概念图。 那对于普通人来说呢,这一步就非常省时间了。图片定下来之后, codex 就 把所有的内容整合成了一个静态的落地页, 这个页面里面有品牌管理、产品系列卖点说明、尺寸指南。如果我觉得某个地方不顺眼,也不用自己去改代码,可以直接在预览页面里面指出问题,点击驱动批注,英文是 annotation。 比如标题太大,图片间距不对,或者是按钮的颜色不够明显, 那 codex 会定位到对应的代码并进行修改。这对零基础的人很关键,因为你不需要懂 html, javascript 也能把一个网页打磨到可以测试市场的程度。完成好之后就是这样一个页面了, 最后所有的东西都会留在本地项目的文件夹里,图片、网页、代码、素材文件都在里面,你可以直接在本地打开,也可以部署测试,用来收集用户的邮箱和偏好反馈。所以,如果你想测试一个产品的想法, 一个小众的品牌,一个服务的页面,一个预售的活动。以前你可能要找设计,找前端,找运营,找人写文案, 那现在呢?你可以用 codex 做出一个最小的可行版本,拿去测试真实的用户反应。如果你是 gpt 的 plus pro 或者是 business 的 团队账号,通常会有更完整的 codex 的 使用权限。 所以,如果你已经是 gpt 的 plus 会员,这个功能对于你来说是完全可以去免费尝试的。对普通人来说,它最有价值的地方是, 你不需要在一开始就花钱去找团队,也不需要把想法都停留在脑子里。你可以先用 codex 做出一个真实的页面,跑一轮反馈,再决定这个项目是否值得继续投入。谢谢大家。

这是一条 codex 从零到一完整的新手入门教程。如果你之前完全没用过 codex, 或者只是听说过,但不知道它到底能干什么, 怎么装,怎么用,那这条视频你就可以收藏了。我会按照一个新手真正上手的顺序,带你从 codex 试什么,讲到安装、使用、主界面、怎么操作、基础功能和进阶技巧、 skills 插件、浏览器终端和自动化任务等等,让这个目前全球最顶级的 a 阵的工具真正为你所用,创造价值。 我也会把整个流程整理成文档,打一句 codex, 方便对照,一边看一边选。你可以先把它理解成一个装在电脑里的 ai 工作助手,他不是单纯陪你聊天的工具,而是可以进到一个具体的工作文件夹,帮你读取文件、修改内容、运行命令、调用工具,甚至按步骤完成复杂任务。 举个最简单的例子,像 chat、 gpt、 豆包这一类工具,更像是你问他答,你自己去做。比如你想做一个网页,他通常只会给你一段代码,接下来你还要自己复制代码、创建文件、运行、检查报错等等。而 codex 是 你问他,他理解他还做,他会从零到一帮你创建好这个网页。 目前最适合新手小白的上手方式呢,是桌面端 app, 我 们可以直接在官网开始,根据你的系统选版本, windows 或者 mac os 都可以。安装之后有两种登录方式,一种是官方 chad gpt 账号登录,另一种是用 apikey, 可以 是官方的,也可以用中转站。两种方式各有利弊。综合来看,还是建议第一种,直接官方账号登录, 省心省事。对于 codex 的 界面,新手可以先关注三个核心区域,最左侧是一些常见功能入口和聊天记录管理区,你可以理解为导航栏加历史记录。这里需要重点讲一下对话和项目的区别。对话最好理解就是普通聊天嘛,你甚至可以把它直接理解为 chat、 gpt 或者豆包, 适合随便问一些小问题,帮你写文案、查资料之类的。它不跟具体的文件夹绑定,而项目就涉及到了具体的生成式任务,比如 如飞哥之前开发的工具箱网站,飞剪一触即达这种软件,他们有大量的编程代码文件,就需要一个专用的项目文件夹。你在这里可以新建空白项目,也可以打开现有文件夹,直接选择路径,或者直接把文件夹拖进来也行。鼠标悬停在项目名上,也能看到这个文件夹在电脑中的 底位置。而对于重要的常用的项目和对话,右键就可以置顶,方便快速切换和查看。左侧下方还有设置入口,在设置里你可以修改 codex 的 使用偏好、外观和配置等等。其中个性化需要重点说一下, 如你想给他一个全局指令,就在自定义这里直接写,比如他要怎么称呼你,固定用中文回答问题,设定一些底线原则或者开发习惯,设置完之后对所有项目都会生效,相当于让这个员工摸清楚你这个老板的脾气,投你所好。这里还有一个很有意思的小功能,叫桌面宠物, 他提供了很多默认的宠物形象,你也可以根据自己的喜好让他帮你创建一个,比如我这个就是给了一张参考图,让他自己做出来的,他会实时显示当前任务的一些简单状态,还是挺好玩的。 在首页设置这里还能看到剩余用量,你可以清晰的看到五小时用量和一周用量,做到心中有数。中间这块就是你和 codex 的 主要沟通区域。首先是这个加号里面有两个非常重要的功能,一个是计划模式, 比如你让他开发一个个人博客网站,不要上来就直接让他干,而是让他先列出计划。相当于你给员工一个项目,得先让他出方案,看看他打算怎么做,这样能有效减少返工,既省精力又省 tokyo。 看啊,他会主动问我们这些具体细节,我们按选项敲定,不满意的或者他没提到的就补充一下,让他重新规划, 这才是一个合格的领导该干的事。而目标模式就更厉害了,刚上线的新功能就是你给他设定一个目标,越具体越好,他会自己拆解分析。执行审查,有一种不达目的不罢休的意思,这样就避免了一个很烦的问题,执行一个任务的时候,他每完成一步就要停下来问你。 比如我正在跑的一个很复杂的大项目,目前已经连续跑了三十多个小时,如果正常一步一步改的话,我可能要好几天才能做完这些进度。右边这个权限设置呢,分成三档,默认是最保守的,像是联网修改文件都需要你的授权,自动审查会开放一部分权限,关键节点还需要你把控。 而完全访问就是最激进的,它几乎可以完全操控你的电脑,创建文件、删文件、跑命令,全都自己干。新手,我不建议一上来就开完全访问,刚开始用默认或者自动审查更稳,等你确认这个项目没问题,也知道它要做什么,再考虑给更高权限。我自己是在非常熟悉项目和流程的情况下才会开完全访问。 右边这里还可以切换模型,选模型版本、智能程度和推理速度。如果不是特别复杂的任务呢?不建议开超高,因为它有可能会出现过度思考,而导致你花了更多的 token, 反而干的不好。 这是血淋淋的实战经验教训,一般来说默认高就可以了。这个麦克风是语音输入,但是体验目前并不是很丝滑,我们可以直接用语音输入法。 codex 还有一个和普通聊天很不一样的地方,任务可以排队,他正在执行的时候,你可以继续补充,要求这些新消息会一个一个排在后面,等他处理完当前步骤之后继续执行。比如他正在做网页,你可以接着说,页面再简洁一些,按钮换成黑色,先不要做登录功能等等。 而如果你忽然发现他理解错了你的意思,或者做了一半有点跑偏了,可以直接选择引导,强行把方向盘掰回来。所以用 codex 的 时候不一定要追求第一条提示词写的特别完美,你可以边看他做边补 充,边纠正边引导。真正好用的方式是把他当成一个正在干活的助手,而不是一个只负责回答问题的聊天框。这个思维一定要转变过来。 最右侧的区域目前包括三个功能,侧边聊天就是当前任务的一个临时讨论区。因为有时候 codex 正在执行一个主任务,但你中途想问点小问题,或者单独讨论某 个细节,就可以用它,它不会打断主对话的节奏。浏览器主要是 codex 打开网页查资料测试页面,比如你做了一个网站,可以让他直接打开本地页面,帮你检查布局按钮、交互有没有问题。如果你对某个地方不满意,还可以让他直接打开本地页面,帮你检查布局按钮、交互有没有问题。如果你对某个地方不满意,还可以让他直接打哪的感觉, 口头描述半天要精准的多。终端的话呢,其实你不需要了解太多,因为它主要是给 codex 执行命令用的。到这里,其实你已经看到了 codex 最核心的几种能力,它可以进入项目,读取和修改本地文件,可以用计划模式先想清楚怎么做,可以通过浏览器查资料测试网页,也可以通过终端运行命令检查结果。 所以 codex 真正厉害的地方不是某一个单独按钮,而是它能把这些能力组合起来,帮你完成一个完整任务。理解了这一点,后面的 skill 插件和自动化任务就很好懂了。 因为前面这些能力呢,解决的是 codex 自己怎么干活的问题。但如果你想让他干的更稳定,更像一个熟悉你习惯的助手,就需要用到 skill。 如果你想让他连接更多外部工具,就要用到插件。 这里很多新手分不清 skill 和插件,其实用一句话就能记住, skill 是 方法,插件是工具。 skill 可以 理解成一套可以附用的工作流,或者说给 codex 的 一份工作方法说明书。比如一家公司做项目,通常都有一套标准流程,第一步做什么,第二步做什么,输出格式是什么,有哪些注意事项,哪些地方不能乱改。 这些东西如果每次都重新告诉 ai 一 遍就很麻烦,而且 ai 它还可能每次理解的不一样。所以更好的方式是把这套工作流程固定沉淀成一个 skill。 这样 codex 下次遇到同类任务时,就不用像一个新员工一样重新摸索,而是直接按照你写的流程和标准来做。 比如我自己的飞鸽工具箱里就有很多专属 skill。 比如把好用的软件保存入库到本地,同步到我正在做商单推广的几个云盘,生成下载链接,再同步到正式站,这些流程全都是固定的。 我把它们写成 skill 之后, codex 就 可以按这套流程稳定执行,不会每次都跑偏。再比如,你经常写短视频文案,也可以让 codex 帮你做一个短视频文案 skill, 把你之前写过的大量文案喂给他,让他总结你的开头风格、结构、习惯语言表达、结尾方式,然后形成一个专属文案助手 后,再写类似内容的时候, codex 就 会优先按照这套方法来。插件就不一样了,插件更像是给 codex 装上外部工具,解决的是它能不能操作某个平台,处理某种文件,连接某个服务。 比如浏览器插件,可以让 codex 打开网页查资料、测试页面表格插件可以让它处理 excel、 ppt 插件可以让它生成演示文稿。 gmail 插件可以让它整理游戏, camera 插件可以把生成的内容导入到设计工具里继续编辑,所以不要把他们想的太复杂。 skill 解决,怎么做插件解决用什么工具做?一个是工作流程,一个是工具能力。 codex 目前已经集成了很多实用的插件和 skill, 我 也整理了几个比较常用的,大家可以截图保存,后面自己试试看。 最后我们再来看一个比较进阶但非常有想象力的功能,自动化任务。你可以先理解成让 codex 在 固定的时间、固定的项目里自动帮你做一件事,但它和普通题型软件不一样,它们最多告诉你该干什么了。 而 codex 的 自动化任务是真的可以帮你执行一整套流程。比如你是做内容创作的,你可以让他定期帮你收集某个领域的热门选择题,整理成标题、角度、参考链接和可以拍摄的脚本。而飞哥最常用的就是每天固定时间设置一个今日任务清单,划掉昨天已经做完的,生成当天新的任务, 就像一个机器人一样按清单执行。这也是为啥有人说我效率那么高,一个人干八个人的事情。除了 ai 的 强大助力之外,任务规划本身也非常重要。所以自动化任务真正厉害的地方不是定时提醒,而是定时让 ai 按你的要求去干活。 最后再补充一个很多人会关心的问题, codex 能不能在手机上用?据我所知有三种方式,最早大家都是用 happy 这种开源项目,它可以连接 codex cloud code, 电脑上开个任务就能通过手机和 agent 的 沟通,但始终不太方便,相当于只是给你安排了一个传话筒。 而 codex 的 mac 版本最近更新了手机端的入口, chat gpt app 里面就有 codex 可以 完整读取你的聊天记录。在手机里聊天和电脑端的消息是完全同步的,本质上是远程链接,相当于把你的电脑版正在跑的 codex 搬到了手机里。而最近我发现了一种非常爽的方式,就是网易的优优远程, 出门的时候手机直接远程连电脑,操作起来很方便,最关键的是你能同时测试它的改动,这就相当于把你整个电脑都装进了手机,所以功能最完整。 好,最后我们来个回顾,总结一下你都学了什么。如果你是第一次接触 codex, 其实今天不用记住所有按钮,也不用一上来就研究特别复杂的自动化和插件,你只要先记住这条主线就够了。第一, codex 不是 普通聊天工具,它更像是一个能进入你电脑工作区的 ai 助手。第二,临时问问题,用普 对话,真正要处理文件、项目代码、文档就用项目。第三,复杂任务不要直接让它开干,先用计划模式让它列方案,如果是一个长期目标,再考虑用目标模式让它持续推进。第四, skill 是 方法,插件是工具。 skill 负责告诉 codex 怎么做事儿,插件负责让 codex 连接浏览器、表格、 ppt 邮箱这些外部工具。第五,自动化任务不是简单提醒,而是让 codex 在 固定时间按照你设定好的流程自动干活儿。 所以新手今天先做三件事就够了。第一,安装并登录 codex 桌面端。第二,建立你的第一个项目,找一个真实的小任务试一下,比如整理一个文件夹,总结几篇文案,或者生成一个简单网页。第三,让 codex 帮你写一份自己的 agents, 点 m d 就是 我们刚才提到的个性化。现在你让他自己干,把你的 称呼、语言、习惯、输出格式、工作偏好都写进去。当你把这三件事跑通之后,你就不只是会用一个 ai 工具了,而是开始拥有一个真正属于你自己的 ai 工作站。祝你越来越牛逼!

你安装的 code 叉是不是也这样?没有 open ai 的 账号就不能正常使用?本视频教你,没有国外的 open ai 账号也能正常使用 code 叉。这里我们打开电脑上自带的这个微软应用商店,然后在这里搜索 code 叉,搜索之后,这里的话我们选选择这一个图标的, 然后这里是已经安装好的,所以它显示打开没有安的话,我们点击获取,等它安装结束即可。安装结束之后呢,我们点击这里, 然后找到这个 code 叉,然后这个 code 叉它默认的话是使用呃 open a a 的 账号来进行登录,我们在国内没办法正常使用,所以的话我们先不要打开它,我们去到这个 来到这个 c c switch 的 啊界面之后呢,我们选择这里点击一下,然后等它来到这里之后,我们直接划到这个页面最底下, 这里我们根据自己的电脑系统的版本来进行下载即可。 windows 的 话我们就直接下载这一个,然后这里是因为已经下载过了,所以我就不点击下载了。然后还有我们也要如果是 mini max 的 大模型,大模型的话我们就选择下载,把这个也下载下来, 然后这里我也是已经下载,我们就点击这里下载就好。这里我已经下载好了,我们就不继续下载了。下载之后的话,我们就直接去这边打开吧这里然后这个是 c c switch 的 开源项目,我们直接双击运行它, 我们就直接点击下一步,然后这里是让我们去选择这个安装路径,这里的话我把它安装在 c 盘,安装在 d 盘吧, 我直接点击安装,点击下一步,然后这里直接点击安装,然后这里就等它安装结束,这里我们把这个勾选去掉,然后点击结束,结束之后这个 这个我们 mini max 的是使用 mini max 大 模型才才用到的,如果不是 mini max 大 模型的话,需要去选择其他的,可以自己去找相应的开源项目,这里我就直接把它解压, 这里剪下之后的话,我们直接在这里,然后打开这个,这里它有需要你安装的,然后我们本地的话是需要安装这个 node js, 这个的话可以看我上一期的视频去安装,然后这里的话我们就直接把这个命令复制一下, 然后我们点击这里,我们直接输入 cmd, 然后回车,在弹出这个页面里,我们直接复制粘贴一下,然后回车。好,它现在已经在安开始安装依赖了,然后我们这里就会多了一个文件夹, ok, 它显示已经安装,音量已经结束。好,我们现在就把它这个点给关闭掉,然后我们点击这个,我们点击运行这里,运行到这里的话我们就不用管,然后我们就打开我们的安装的那个 cs 微棋, 这个是我们安装 cs 微棋的这个图标,我们直接双击它, 然后这里你如果是第一次使用的话,那默认是这里,然后我们要选择这一个,这里我还是,虽然我已经重新安装了,但是因为之前我是安装过的,所以我这边已经是已经配置好的, 如果是第一次使用的话,我们是需要点击,我直接把这个删掉吧,这个删掉先启动下这个,把这个给删掉。 好,我们现在来重新配置一下,这里的话我们选择这里的 open a, 然后之后我们点击这里的加号,这里我们供应商这些我们就不用管,这里我们就随便填我这里我就填这个 mini max 吧,因为我自己用的是这个模型,然后这里的 api key 我 们也是随便填 这里的请求地址,请求地址的话我们就是把这个运行在这里这里给复制一下,然后把它粘贴到这里来, 这里的话我们模型的话我们选择这里都复制一下 往下滑,这里我们是一定要勾选上,勾选上之后我们就直接点击添加啊,我们现在这里已经添加,然后进这里的话,我们点击这个启动, ok, 已经切换了,那这里我们可以进行测试,这里测试应该是会报错的,因为这里我们还没有填这个东西,就我们还是去到这个 这里,这里面我们是需要把这个配置文件,这个我们先复制一份, 然后把这里给改掉啊,这里的话我们把后面这里给去掉, 我们点击四啊,这里我们一定是要这个点 e n v 的 这样子的格式,然后之后我们点击用我们的这个记事本打开,打开之后的话,这个是我要这里要填入你自己的 mini mag 那 个 api key, 然后每个人我们可以自己去获取一下就行了,那这里有因为 api key 比较私密,所以的话 我就不让大家看到了,把它删掉,然后我去把我的给粘贴过来复制一下 啊,然后这里我已经把这个秘钥给配进去了,配进去之后呢,我们这个界面还是要关闭重启一下, 就这个这个界面,我们直接把它给关闭掉,然后我们就点击这个双击一下,等它启动起来,点击运行,因为它现在已经启动起来了。启动起来之后呢,我们这里再点击一下这个测试, 因为他现在表表示已经正常能正常使用了。然后呢正常能正常使用之后,我们就可以把它给擦掉了。然后现在我们再打开我们的这个 color 叉,然后我现在问一下他,你的 他现在已经回复我了,然后其实他这个回复呢也是在这里会看到的。 然后最后界面我们是不能关闭的,不然关闭的话我们这个 qq 叉就不能正常使用了。我的这个 qq 叉默认的话是其实我们安装的时候它默认都是英文的,然后我们要如果要改变这个,呃四 plus, 我 们就选择这个 setting, 然后找到这里,就这里的我们直接找到往下滑这里我们把它改成中文就行了,这样子我们的 control 它就能正常的使用了。

最近看到一个观点,说现在用 codex 有 点像二零一二年做淘宝。我之前做过国内电商,我觉得这观点很有意思。一个新机会刚出现的时候,大多数人往往是看不懂的。二零一二年,很多人看淘宝,觉得不就是网上卖东西吗?实体店才靠谱,网上开店能有什么价值?但后来大家才发现,身边当时那些做了几年的,都默默换车又买房。 回头看看当年的淘宝,它不是简单的网上摆摊,而是一整套新的商业系统。现在很多人看 callex 也是一样,觉得它不就是写代码吗?我不是程序员,这东西它跟我有什么关系呢?但 callex 真正厉害的地方远远不只是写代码,而是它让普通人第一次能用自然语言把自己的想法做成一个可以运行的工具。 就拿你平时里工作里最繁琐,做的最多的一件事,比如数据整理、做文案等等。放在以前,你敢想这些事能通过自动化直接完成吗? 这种想法你只能停在脑子里,根本落不了地,因为你不懂代码,就好像有堵墙,而现在这堵墙被 codex 给拆了,你可以把需求用嘴巴说给 codex, 让他通过写代码的形式,把你脑子里想的一步一步做出来。 所以说,我理解的 codex 的 红利,不是说用了就能赚钱,而是当大多数人还把 ai 当一个聊天工具的时候,你已经开始把 ai 当执行工具,当开发工具和自动化工具。这个认知差才是真正的早期机会。 就像二零一二年做淘宝,真正重要的不是说开店的早晚,而是更早理解了流量和转化的逻辑。今天用 context 也是一样。真正需重要的不是你注册的早,而是说你更早的理解了需求表达、流程拆解、 ai 执行。有些机会呢,刚出现的时候看起来都不像机会,等所有人都看懂的时候,他早就从从红利变成基本功了。我本身呢,是一个一人公司的老板, 做跨境电商的普通卖家,在此之前没有任何的编程基础。因为呢,最近工作里有很多重复的流程,所以说开始关注 codex web coding 啊,还有这个 ai 智能体。呃,所以我自己也开发了几个小工具 这个账号呢,我会持续用普通人能听懂的话,分享我对 ai 工具、智能体和未来工作方式的理解。如果你也觉得 ai 不是 简单的聊天工具,而是普通人未来必须了解的能力,可以点个关注,我们一起边学边实践。

前两天我发了一条视频啊,我说 codex 很 可能是这一波 ai 浪潮里真正值得认真对待的赚钱工具了。不是因为它会携带码,而是因为它可以帮助你搭建一套个人商业后台, 把你分散在各处的一些经验啊,内容、资产和流程,真正的连成一个可以运转的系统。今天这条视频我们进一步往下说,如果你此刻正在经营一人公司,打造个人 ip, 或者是正在把自己的专业积累转化成商业价值,成为一名超级个体, 我直接带你来拆。你最应该先用 codex 做的五件事情,以及每一件事情的提示词,我都给大家准备好了,先码后看。 第一件事情,先用 codex 盘点你的个人资产。很多有积累的人不是没有资产,而是资产太小了啊!你的公众号里有观点,交付记录里有方法,朋友圈有用户反馈,工作文档里有项目经验。 哎,当这些东西全部分散在不同地方的时候,它只能叫做资料。可是当你把它们统一放进 codex 工作区,它能够帮助你重新梳理出你是谁, 你做过什么,你有哪些可以附用的内容和产品资产提示词?可以这样问,请基于我的电脑或者是我的这个文件夹,帮我盘点内容资产、产品资产、案例资产和可变现经验,并且按照变现潜力进行排序。哎,你这一步做完之后,会对自己的认知发生质的变化, 多人做到这里,才第一次真正看清楚自己手里有什么。第二件事情,基于你的现状,让 codex 给出行动优先级。 我现在该做什么是一个烂问题,因为它缺少上下文。 codex 的 价值在于它已经读过你的全部资料了,所以你可以问出更有价值的问题。请基于你对我的了解,告诉我接下来三十天最应该做的十件事情,并按优先级排序。如果我要把经验产品化,最小可行性产品可以先从哪个方向切入? 再或者你可以问我现在变线路径上最薄弱的环节在哪里?他给出的不是泛化的建议,而是基于你的业务状态做出的判断。这个才是 ai 作为工作助手真正有用的地方,不是替你思考,而是基于充分了解你作出判断。 第三件事情,用 codex 搭建属于你的内容生产工作流。大多数人用 ai 做内容,还停留在想到选择题就让 ai 写一篇的阶段,但真正拉开差距的是你有没有一套可以稳定产出的内容生产系统。 以我自己为例,我不会直接让 codex 帮我写一篇小红书或者是抖音脚本,我会先让它判断这个选择题能不能承接我的主线 ip。 第二步,我会调用一些豹纹创作 skills, 以及 k k 学姐自己的公众号或者是小红书的内容创作 skills。 同时呢,它还会在这个内容库里面调取我的 案例、我的背景、我是谁,我的产品是什么,我的学员案例等等。把这些融合在一起,我会得到第一个版本的内容。第三部呢,我会把这篇内容再拆成对应的一些长文啊,或者是口播内容,朋友圈素材、直播课讲解的内容等等。 第四步,最后再调用 codex 检查我的开头是否有足够的勾子,是否有一些心理反转,语言表达是不是过于的 ai 味浓。第五步,我再手动地进行一些微调,最后进行归党,成为我的内容资产。 这是一套工作流,而不是一次性的输出。你可以直接让 ai 帮你进行设计。你可以说,请基于我的账号定位和内容历史,帮我设计一套从小题到多平台分发的内容生产 skills。 一 人公司超级个体的核心竞争力,不是你能爆发多少次,而是你每一天都能在不同的平台上稳定的输出。 odes 帮你做的工作流就恰恰决定了这件事情。 好!第四件, codex 能帮你做的事情就是让每日复盘变成系统沉淀,有行动没有沉淀是一个创业者最大的效率漏洞。你今天发了内容,明天聊了客户,后天改了产品, 明天都很忙,但一周过去,说不清楚哪里有效,哪里该调整,下一步该怎么走。而 codex 就 能够帮助你做每日或者是每周的复盘,把零散的行动转化成一套可以复用的经验。比如说哈,每天,你可以这样告诉他,请根据我今天的工作记录,总结三个进展,三个问题,三个可以沉淀的经验。 每一周,你可以告诉他,请复盘我的哪些动作是有效的,哪些问题反复出现,哪些内容可以产品化,哪些流程需要优化。当你持续的不断的这样去做,你会发现自己的工作方式在悄悄的发生改变,每一天都开始成为系统的一部分,而不只是完成了一件事情。 第五件事情,让 codex 把你的周期性任务自动化出来,猎人公司超级个体的时间是最稀缺的资源,那些不重要但必须做的任务,比如说整理选题库啊,更新素材库,跟踪用户高频问题,如果这些全靠大脑记,你会持续地处于低水平的认知消耗里。 而 codex 就 可以帮助你设定周期提醒和任务模板,比如说定期整理选择题,搜索适合你账号的热点,每天记录三个用户痛点,每周规当朋友圈素材。这些事情单独看都很小,但是积累起来是你能把精力真正放在高价值决策上的前提。 记住哈,系统化才是一人公司超级个体的护城河。上面讲到的这五件事情,背后有一个底层逻辑,超级个体真正的优势不在于你有没有一套可以持续运转、自我迭代的个人系统。 以前你的经验是散的,内容是散的,行动是散的。而 codex 就 可以帮助你把这些东西一点一点的给它连起来,让你的每一次输出都在加厚系统,而不是只是完成一个任务。 六月四号中午十二点半,我会专门做一场直播公开课,讲一讲普通人超级个体知识。创业者该怎么用 codex 搭建自己的个人商业系统,从资产梳理到流程搭建,带你真正跑通这套逻辑。

兄弟们,我终于找到了 codex 接触国产大模型最简单的方法了,还能解决用原声插件的各种痛点。只需要两个工具,一个是插件打开工具 codex 加加,另一个是切换大模型工 具。一口 board 使用的时候呢,你只需要先打开 codex 加加,然后就可以使用一口 board 随意切换大模型了,就连克拉的扣子都不在话下,这丝滑感简直将 cd switch 按在地上摩擦,学会就赶紧去试试吧!

家人们, codex 现在可以直接做视频剪辑了,我只在 codex 里敲了一行字,装上 hyperframes 插件,一句话就能生成想要的任何视频。动效、转场、字幕、配音全自动,不满意继续打字改就行,秒出新版本,还可以批量生成。下面这个视频是我让 codex 生成 ai 发展史的视频,太酷了!用会 codex, 你 就真正打开了 ai 内容创作的新世界大门!我强烈建议所有内容创作者、自媒体人都要学会 codex 这套玩法,真的能把效率直接拉高十倍!关注我以后分享更多玩法!

同样让 codex 加一个按钮, loading 有 人十分钟做完,有人折腾,整个下午还得回滚,差的就是五步顺序。第一次让 codex 改东西,不要选重构整个系统这种大活儿,也不要选支付权限、删数据这类一旦出错影响很大的任务。更合适的任务是风险低、 范围小,能验证,而且真的会出现在项目里。比如给设置页的保存按钮加 loading 状态,避免用户重复提交。 如果你的项目没有设置页,也可以换成任意一个保存提交搜索按钮。思路是一样的,这个任务不复杂,但很适合作为练习。它会碰到组建状态按钮,禁用请求开始和结束,也会提醒你检查成功和失败两种情况, 同时一般不会改到太多地方。你练的不是让 codex 写几行代码,而是完整走一遍。定位计划、修改、验证、审查。第一步,先定位,不要直接改, 可以这样问。这一步的目的是让 codex 先把现场说清楚,它应该告诉你相关文件在哪里,按钮在哪个组建里,请求函数在哪里,现在有没有 load 状态。如果它只做概念解释,没有给出文件路径和函数名,就继续追问。 第二步,让它给最小方案。这里最关键的是最小修改。你不是让它重新设计设置页,也不是让它把接口调用那一套重新改一遍,只是围绕重复提交这个问题做一个小修。合理方案通常会包括增加或附用 loading 状态提交开始时设为 true, 请求结束后恢复为 false 按钮。 disabled 绑定 loading 按钮,文案在保存和保存中之间切换。如果项目里已经有状态管理或请求状态,就优先附用现有逻辑。 第三步,确认方案后再让它改,这时才让 codex 动手。你要观察它有没有跑偏,是不是只改了相关组建,有没有顺手格式化整份文件,有没有把接口调用那一套也改了?有没有引入不必要的新依赖?一个按钮 loading 最后变成局请求流程重构,那就不是小任务了。 第四步,让它验证真实。项目里不是每次都有完整测试,验证可以分三层,能跑自动测试就跑自动测试,没有测试就跑 lingt 或 type check, 这些都没有, 就写清楚手动验证步骤。这个任务的手动验证可以这样写。第五步,改完后做一次 review。 这一步很重要,因为成功的时候没问题,不代表失败的时候也没问题。保存成功以后 loading 会恢复,那保存失败呢?接口报错呢?页面被关闭或组建被卸载呢?如果只在成功后把 loading 设回 false, 失败时没恢复,用户就会看到按钮一直卡在保存中。所以这个任务真正要验收的不只是按钮。文案变了,至少要检查六件事,点击后是否立即进入 loading, loading 时是否禁止重复提交。 成功后状态是否恢复,失败后状态是否恢复?原有错误提示是否保留,原有叫验买点跳转有没有被影响, 可以让 codex 按清单自查。最后一句要保留,如果没有证据就说没有证据,它能避免 codex 用很肯定的话瞎回复。这一期真正要记住的不是怎么给按钮加 loadin, 而是用 codex 做任务的顺序,先定位,再给方案确认后修改,改完验证,最后检查风险。 以后不管你让他改文案、修 bug 还是补一个小功能,都可以按这个顺序来,这样任务不会一上来就变成大改,改完也知道该怎么验收。这期先到这儿,你还想让我继续展开哪个点丢到评论区,我下一期接着讲。

美好啊,朋友们,这是一期 codex 奶妈级的零基础系统教程,这期视频我会从安装开始,手把手地把 codex 的 基础能力到高级功能的组合,以及最新的手机端操作,用十个实战场景来带大家彻底拉通 以后这一类的 ai 产品,出一个算一个,你都会触类旁通,游刃有余。我也把这期的文字课间整理成了文档,那这期的含金量可谓是 biu biu biu biu biu, 一个点赞收藏关注是最起码的。好了,不多说,学费都交了吧,我们上课, 那在开始之前,我先说一下 codex 和 cloud code 的 区别。从本质上来说,它俩都是由编程 agent 逐步转向了通用 agent, 分 别是 ansapi 和 open ai。 这两家出的 cloud code 呢,默认使用 cloud 模型,但是我们可以自行替换成任意其他的模型,那在易用程度上, codex 桌面端的产品设计是会更友好的, 更适合零基础的白领工作者,而 cloud code 有 更高的自由度。在功能上, cloud code 原本是最齐全的,什么 skill、 mcp、 斜杠命令、 hock、 远程操控,这都是人家先发明的。但是呢,最近的 c c 更新稍微不如 codex 那 么快了,会更加偏向专业开发者一点。 而 codex 发了非常强的浏览器操控和 computer use, 还内置了最近的 image 二深图模型, 而且昨天还刚刚发布了手机端和 hock, 可以 直接用你的手机 check gpt 来控制电脑上的 codex 干 活。那价格和额度方面呢? codex 的 会员额度非常大方,二十到的会员就很够用,而且还不封号。 而 cloudpod 呢,大多数人可能都没法用它的官方账号基本上都得自行调用 api 的 费用属于是花多少用多少,风险由人。那在使用场景上,我个人喜欢用 cloudpod 搭配 cloud 模型来写作,因为 ops 四点六的写作和规划能力真的很强, 那 codex 的 执行和解决问题的能力也很强。日常的办公场景,我会选择用 codex, 那 在编程的时候嘛,我就两个都用上,所以结论是,入门的朋友用 codex 就 很强了,有条件的朋友呢,两个都来是最完美的, 不过两者的逻辑其实都是一样的,我们学一个,另一个也就会用了。那 cloud code 我 也做了一期系统教程,想拥有左膀右臂的朋友可以去看看。 ok, 正式开始 使用 codex, 我 们唯一需要准备的就是一个叉 gpt 账号,免费的也行,只是会额度稍微少一点。那有了账号之后,我们就直接去它的官网双击安装, 然后安装好之后登录我们的叉 gpt 账号,然后这些设置我们可以先随便选一点啊,选个日常工作,反正后续呢,我们都是可以改的。那搞定了, 那进来之后呢,大家会看到这个对话窗口,好像跟 chat gpt 是 很类似的。那我们打开两边的侧边栏也蛮眼熟的,左边呢,可以管理对话和任务的列表, 那中间就是聊天,右边大概是结果之类的吧,大家应该都能猜个七七八八,所以我们先不深究它的页面,我们直接开用,这其实也是我探索所有的 ai 工具的独门秘方。 我打开一个陌生界面呢,我先不管别的,我先找到我能对话的框,我先聊,先找到我能看得懂的按钮,先按,按着按着你就会了。你看看,独门秘籍都教给大家了,以后你们就是为师的弟子了。 ok, 众弟子不必拘礼,我们还是以学业为重啊。那我们第一个要了解的 codex 能力呢,就是本地文件操作, 也是这一类桌面端的 agent 跟对话 ai 最显著的区别和能力。因为过去我们用叉 gpt, 如果说我们要让它看到我们本地的内容,我们只有两种方式,一个呢就是复制粘贴到这个对话里,另一种就是以它允许的格式和数量把文件给上传上去。 但是 codex 不 一样,它可以自主地读取和操作我们的本地文件,而且不限数量。比如说我作为一个剪辑,我的本地里面存了八十多条视频素材,这都是我剪辑要用的, 但是呢,这个命名全都是乱的,完全看不懂,所以我想以这些视频的内容来命名,到时候我们看见文件名的时候,我们就知道这个素材是什么。那这事 check gpt 肯定是做不了的,但是 codex 可以 我们来看这两个地方,它都显示了一个概念,叫做项目, 我们选择一下,哎,一选择项目,他就让我们选择本地的文件夹了,那我们只要选中这个文件夹,那这个文件就是我们的项目了,里面所有的文件 codex 都可以自由的读取和操作, 当然这需要我们给他权限。大家看这里的权限选择啊,目前呢,我们是一个默认的权限,我们再点开,他有三种权限模式, 那默认权限的意思呢?就是在我们当前的文件夹内,他可以自由的去读写这些文件,但是如果他想要联网呀,或者是帮我们下载一点东西啊, 或者是碰这个文件夹之外的其他文件,那他是不行的,如果他必须要做,就会要向我们提出提高权限的请求,我们点同意才能继续。 那自动审查呢?顾名思义就是有个 ai 自动帮我们审查,由 ai 来判断这个操作危不危险,如果危险呢,就来问我们不危险的,比如说他去下一个知名的这种官方软件什么的,他就直接开干了。 自动审查比默认模式要更宽松和智能,建议大家选这个就完了。那最后呢,是完全访问权限,这意味着 codex 可以 在你的电脑上几乎什么都能干,它可以修改删除任何文件,它可以在任何位置执行命令,例如说它可能会去把你的 cloud code 给删了。 开玩笑啊,它一般情况下是不会这样抽风的。 ai 呢?也没有嫉妒情绪吗? 大家尤其是新手朋友就选择自动审查模式,相信 ai 就 完了,毕竟咱又能审的比 ai 好 多少呢啊,对吧? ok, 那 我们选中了刚刚的这个视频的文件夹,继续来提出我们无理的要求,让他帮我们把这个文件夹里的所有视频素材都按他们的实际画面来重新命名。哎,他就开始做了, 而且大家看他非常的聪明,他先看了看我们到底有多少个视频,然后他选择用抽帧的方式抽取关键画面来判断内容是什么,而且他还知道他不要一张一张图去看,他给拼成了缩略图的形式,一组一组的去看。 ok, 很 快啊,这个文件夹里面的文件名就全改变了。过程中呢, codex 也是没有向我们提全的,因为他都是在这个文件夹内去操作的。那我们也可以检查一下他都对应好了没有。 ok, 钢琴家音乐演奏厅,没错, 雪山近身格斗,没错,旗袍女人夜巷卖热饮哇!而且他的这个命名还遵循着一个序号,任务、场景、行动的一个清晰的命名格式。 ai 做事的这个细心程度啊,人类你不服不行。那另外呢,我们其实也可以在同一个项目里面去开多个不同的对话,它们的上下文都是不一样的,但是同样都可以随时的访问我们这个文件这个项目。 比如说,我们在另外一条对话,我们又给他一个不同的任务,让他想办法把所有关于风景的视频都剪成一整条。 哎,没想到吧,他真的能剪,他自己想办法,用了一些工具问我们要了一些权限,用这个 ffmpeg 给它拼在了一起,效果的确是关于风景的都剪成了一条。 ok, 那 如果我们要创建一个新的任务,我们其实也可以手动的在这边创建,他也会自动的在我们本地创建一个文件夹。 然后呢,我们跟 codex 对 话的整个过程, agent 产生出来的任何文件啊, pdf 啊,什么 markdown, ppt, 它都会直接存在我们本地的电脑上。 ok, 到这里,大家应该 get 了 codex 呢,可以随时地访问我们的本地文件,去读取内容,写文件,删文件,移动文件,文件夹里的内容也就成了我们的 codex 随时可以获取的上下文,那这里的项目也就对应着我们在本地的一个文件夹, 哎,那刚刚这么个任务会花我们多少上下文呢?我们只要看这里就能看到了。 那这个小圈代表的是我们现在的这个对话和里面的操作,一共使用了 gpt 五点五的多少上下文窗口。 如果我们把鼠标悬上去呢,它还会有更详细的一个信息,当上下文快满的时候, codex 会自动地帮我们压缩上下文。不过其实当我们一个任务告一段落之后,不用等它快满了,让它自动压缩,我们也可以自己通过斜杠压缩这个命令 来手动的去压缩上下文,这样呢,可以让模型更聚焦在我们的新任务上,也省一点上下文的额度。那当然大家除了这个对话的上下文余量,其实我们还想知道我作为一个免费用户,或者是我作为一个 pro 用户, plus 会员,我还有多少总共的额度可以用,对吧? 这个呢,有两个方式查看,一个呢是左边的设置,这里我们点开剩余额度,就能看到你五小时内还剩下多少,那本周内又还剩下多少, 甚至呢,也有什么时候到期会刷新的一个提示,这个产品的设计还是比 cloud 的 友好很多的。那另一种方式呢,就是我们可以直接在对话框里输入斜杠,然后找到这个状态, 那打开这个状态之后,它的绘画这里就会持续的显示我们的上下文余量,这个五小时和一周的限额。但再次说实话,这个 codex 的 额度还是非常大方的,二十到的额度我认为是可以满足大多数白领工作的高频使用的。 ok, 那 顺便呢,我们也介绍一下这里的模型选择, 那点开之后,我们可以选择速度,快速呢,就相当于加急通道,会消耗我们更多的额度。那这里呢可以选择其他模型,但是大家都选五点五,因为它确实更好用。然后呢,这里可以选择智能程度,其实呢一般中度智能就够了, 所以我们选高。 ok, 那 这个小麦克风呢,肯定就是语音输入功能了,比手打字还是要快很多的,但是呢,它的转录速度远不如大家去下载一个语音输入法,还是非常推荐大家用语音输入的 好。那现在我们通过一个本地文件处理的案例,也了解了 codex 上常用的一些功能。那 codex 的 第二大能力就是命令行工具使用。 其实刚才我们说到权限的时候就有提到,在默认权限下,它可以读写文件,但是却不能执行一些命令,一些联网的操作。那这些命令是什么意思呢? 刚刚的案例其实也已经用到过了,比如说它把视频抽帧出来,还把几个视频拼接到一起,它用到的 ffmpeg 就是 命令行工具。 还有一些我们熟悉的命令,比如说我们在终端里面来克隆一个 gitup 仓库,或者是大家近期比较熟悉的,我们在命令行里面输入一些命令来下载龙虾和各种依赖。那 codex 的 第二大能力就是在我们授权的情况下,可以使用我们的终端来替我们做这些事。 那我们就来让 codex 帮我们来安装一些平时对于小白来说非常复杂的东西吧。第一类,常用依赖,比如说什么 node gs 啊, git 什么的, 也是大家以后使用各种 agent 或者是做其他项目必备的一些工具啊,那之前大家要装这依赖都得去看一个手把手教程,然后照着命令抄,挨个装。那现在我们就直接跟 codex 说帮我安装个 node js 给他发过去, 也是因为这些东西呢,其实都是比较常见的东西了,所以在我们的自动审核的权限模式下,你看他基本上都不问我们要提权,就熟门熟路的帮我们装好了。 那第二类,就是那些爆火的但是有上手门槛的一些新的 agent, 比如说龙虾,爱马仕,甚至还有这个 codex 的 竞品 cloud code, 我 们都可以让 codex 帮我们装完了呢,它还能教我们该怎么用。那我们装一个 hermes 吧, 我其实都不需要给它官网和仓库链接,我就说最近有一个叫 hermes 的 agent 很 火,你帮我安装一个吧。 哎,他就会自己去搜索,然后帮我们判断到底是哪一个。然后呢,他根据官方的文档帮我们陆续的装好了,还帮我们验证过已经装好了,你瞧瞧,那我们照着他说的来启动一下试试。 哎,真的帮我们装好了,那往后的配置我们就不在这里继续了,但是大家应该 get, 有 了 codex 以后,那些复杂的要收你五九九的部署,你都可以直接让 codex 帮你做了,怒省五九九。而且我们在使用的过程中遇到任何问题,还可以截图去问 codex, 什么瞎死了马挂了,升级出现了问题都可以让 codex 直接帮你修,是不是很方便? 那第三类有点没那么必要,但它其实也可以,就是像 cursor integrity 这种软件应用, 平时都是我们去手动在网页上下载的,它也可以帮你下载和卸载。那大家用 codex, 我 其实也建议大家去下载一个 agent 的 ide 啊,因为现在 codex 有 个缺点是它没有办法打开我们的文件内容,直接去手动编辑。 虽然这个侧边栏呢,是可以看到一些文件结构和内容的,但是我们都没法编辑,所以大家可以让 codex 下载一个自己喜欢的,比如说我们就这样下载。那下好之后呢,我们再执行一个 git i n i t 一个初步化, 那右上角就会出现这个东西,随时可以把我们的项目在编辑器中打开,我们来手动编辑。 那第四类就比较重要了,就是 agent 本身会常用到的那些 skills 啊, mcp 啊和 selli。 那 skill 和 mcp 本身 codex 也是支持的,我们后面会详细讲到, 我先挑两个大家安装一下,方便我们后面综合起来来做案例。那这些 skill 和 c i 呢?通常来讲不像那些 get 那 种大项目那么著名,所以我们最好是找到它的具体仓库,或者是明确的官网地址。比如说我们下载一个专门找 skill 的 这个 find skill 哦,方式就是直接把链接拷贝给 codex, 然后跟他说帮我装一下这个 skill。 那 在他装的期间,我们也说一下 codex 的 另一大好处,并行任务处理, 我们完全可以在他做这个事情的时候再开一个对话,让他去下载一个别的。那我们下载一个飞书 c l i 吧。飞书 c l i 其实非常的典型, 因为现在呢,有一些积极 ai 化的软件,把几乎所有他在软件里能做的操作都做成了命令,让 agent 能够方便的去操作,我们把这个链接发过去,让他开始下载, 那这边呢,其实会显示每一个正在处理当中任务的情况,这个在转呢,就说明它正在执行中,那这个蓝色的点呢,就说明已经完成了,有时候还可能会出现一个需要你申请权限的一个标识。 ok, 那 这里 fan skill 呢?它是已经装好了,我们再看飞书 c l i 这边,它会引导我们去做一些授权, 我们就跟着它的引导去完成就好了。 ok, 那 装好飞书 c l i, 那 codex 就 能帮我们去做飞书里的各种操作了,比如说写文档,发消息,见日历,做表格什么的了,我几乎每天都在用, 好大功告成。我们就这么一个小章节,我们就用自然语言的方式让 codex 帮我们装上了 hermes node, 飞书 c l i 一 大堆东西,这就是 codex 作为 agent 的 第二大常用能力,命令行使用。 那这个能力和这个章节的演示也是希望大家能够 get 到一点,就是我们现在在电脑上想去做的很多很多事情,都可以让 codex 这样的桌面 agent 去做了。那 codex 的 第三大能力是持久记忆。 看过我那篇 cloud code 的 朋友应该都知道, c c 呢,有一个手动的持久记忆, cloud 点 md, 还有一个自动的记忆系统, 都是把我们希望 agent 能够长期记住的,比如规则、篇号和我们的信息之类的东西,以本地文件的方式存在我们的电脑上,然后事实的时候把这些记忆以上下文的方式注入到 agent 里去。那 codex 也是类似的,它也有这两套持久的记忆系统 在 codex 里面呢,手动的持久记忆文件叫做 agents 点 m d, 而且它也有一个自动的记忆机制,来我们打开设置,找到个性化, 那在这里的这个自定义指令实际上就是一个全局生效的 agent state md, 它会在我们任意的项目跟 codex 对 话的时候,它都第一时间作为上下文发给大模型,那我们可以手动地自己在这里写,不过我更喜欢呢,直接在对话中去跟 codex 说, 比如说我说一个,我希望你以后对非书文档里的任何修改都使用一个专属的你的文字颜色和用删除线的方式来修改,不要直接的修改。然后这个帮我寄到局的 a 正 c m d 里。 ok, 那 它这里呢,告诉我们已经写好了,我们再打开个性化这一块,就的确是多出来了这么一套规则,那实际在使用当中,它就会去遵循我们这个规则了。 比如说我这里已经有一篇非输文档了,我在侧面呢也评论了几个我想修改的地方,我直接可以把这个链接发给 codex, 我 让他根据我侧面的评论帮我修改一下。 那因为我们刚才确实已经装好了这个非输的 c r i 也都给他配置好了权限,所以 codex 是 直接可以操作我们的文档的。 ok, 看看它完成之后的效果。 果然他用了紫色的字和删除线的方式来帮我们做的文档修改,那这个呢,是局的 agent md, 适合记一些适用于所有任务的一些大原则,比如说我们的工作习惯,我们要说中文,我们的工作偏好修改文档,要留下这种修改痕迹等等等等。 那另一种呢,就是项目级的 agent md, 这个长期记忆呢,只在这个项目当中生效,我们可以选择一个项目的对话,然后打开编辑器, 自己在这里手动的创建一个 agent 的 md 的 文件,然后我们去写一些针对我们这个项目的一些规则, 当然也可以让 codex 来帮我们写。我个人的建议呢,是在这个项目文件里面有了一些内容之后,让 codex 根据他对我们项目的了解来自己帮我们写。那自动记忆怎么回事呢? 其实我们刚才在这个个性化这个下面我们也看到了,我们需要手动打开这个自动记忆功能, 它的机制是我们打开这个功能之后, codex 会在我们结束对话或者是结束任务,这个对话闲置一段时间之后,它帮我们把那段对话总结成记忆,然后记在一个地方。但是它有几个原则,第一太短的对话它就不记了, 那第二这个对话的总结它一样会消耗我们的额度,所以当我们的额度太低的时候,它也就不记了。 并且这个自动记忆文件呢, open ai 官方是不建议我们去手动修改的,顶多我们可能删一删有些没必要的信息,那这个文件大概是长这样 的,是一个任务,一个任务在记录的,主要呢会写上这个记忆的来源是哪段对话呀?以及它的工作目录是什么,那以及以后触发了什么关键词的时候,它会去召回这段记忆, 再往下呢,是用户在这件事情上的偏好大概是什么样的?那第五段呢,是一些可附用的一些知识,一些踩坑的记录,那这些内容都是 codex 自己记录的,并且以后也是会它自动的招回去使用的,我们就先不修改它, 它这个格式确实也不太方便修改,更多的时候我们对于明确的规则和要求,我们还是通过组织 agent md 来实现。那大家学完这些视频之后呢,我也想给大家再做一期, 通过组织不同层级的这种 agency md 给自己做一个非常懂你的,可以做不同类型事情的超级助手的视频,感兴趣的朋友可以扣个一。 ok, 那 第四大能力就是 codex 可以 直接用到 image, 二来生成图片。不过呢,深图功能其实是一个小功能, 所以这一章节呢,我们不只会用它的图片生成,我们会带大家做一个完整的个人主页的开发项目,并且在了解一些 codex 在 小白开发中的一些用法和功能。那我们再来开一个项目,叫做个人主页, 然后我们点开这个加号,我们把计划模式打开,因为我们要做一个网站嘛,任务会复杂一点,所以打开这个计划模式呢,他会先帮我们列出一个详细的计划,我们确认之后他再开始行动。 计划模式呢,比较适合我们的任务有一定复杂性,或者我们自己还没想清楚,可以跟 ai 讨论出一个计划。那假设我们现在就是第二种情况,我们其实没想清楚,我们直接跟他说我想做一个个人主页, 那你看他看到我们的项目中是没有内容的,所以他以这种选择框的方式来询问我们的细节,这些选项呢,大家可以按照自己的要求去选择,那我就选这个个人品牌吧。 然后如果说这些选项中没有我们满意的呢?我们也可以选到最后一个来填写我们详细的要求,比如说我要他修饰感,也要高级感,然后我选针对合作伙伴,不要个人照 中英双语,巴拉巴拉巴拉。这里真的是问了我们相当多的问题啊,那最后呢,他给到我们出了一个详尽的计划,问我们是否实施此计划,那其实基本的计划我们看着没有什么问题,但我们也可以补充一些调整方案。 比如说我们刚才就要说到了要用它的 image 二的生成能力,我们这里没有体现,我们加一句网页上要多用一些图片,使用 image 二来生成一些高级感的图片,然后我们一起提交。 哎,那他又问我们要走哪种高级感呢?我们如果点开这个小叹号的话,还能看到他说的这个风格到底意味着什么意思,这个产品的小细节真的是我很喜欢,那我们就选他推荐的吧。然后他出了一版新的计划,我瞧着没什么问题, 去吧。 ok, 他 就开始初识化这个项目来逐步帮我们生成了。那这个过程呢,肯定会需要一定的时间,在这个期间我再给大家补充一点点知识点。呦,他的第一张图出来了,不错,挺有艺术感的,果然是最强的 emoji 二,那我要补充的这个知识点呢,叫做引导。 如果说大家在 codex 执行一个很长的任务的过程当中,你觉得他有点跑偏了,我们是可以随时给他补充纠偏的,比如说我们补充一下图片的人味要更强一点,而且不要这么冷的色调。我是一个 ai 博主,然后我们发送出去, 哎,大家会看到他没有立刻打断我们的任务,没有发出去,实际上他在这里排队呢。那我们看到右边的这个引导按钮,他写着我们不打断模型运行,会在下次调用工具后发送过去。这个是非常好的一个功能啊,我们点一下, 哎,他就可以发出去了。这个功能呢,可以让 codex 不 用在错误的道路上一路狂飙,把我们额度都花光,也不会让它重新再跑一轮任务。那另外一个小功能点,我们找到一个已经结束的任务, 我们看一下这个 ai 的 回复,每个 ai 回复的下面都有一个这个按钮,叫做分叉 fork, 这个的意思是我们可以随时从这里开始去开一个新对话,非常适合那种前面聊的还好好的,上下文也非常有价值,但是我们再往下聊,就聊的有点叉劈了的时候。哦,还有个小功能,宠物, 我们点开设置外观,然后这下面就有一小对小宠物可以选,甚至呢,我们还可以点击创建,让 codex 根据对我们的了解来生成一个定制化宠物。那我们先点击唤醒宠物, 哎,就会在桌面上有常驻这么一个小桌宠,脑袋上会冒出来 codex 正在做什么的一个提示,别的呢?好像也没什么用。 ok, 终于在他跑了七七四十九分钟之后,网页完成了, 我们来看看效果,因为 codex 呢,有一个内置的预览浏览器,我们可以直接打开右边的侧边栏啊,我们还给它放大一点。 嗯,这个网页的效果确实是不错啊,不过呢,现在的 a 证呢,其实都有这么一手了,那它这个预览浏览器呢,还有一个好处,我们点击右上方这里的一个批注按钮, 我们就可以在这个页面上选中这里的具体元素去写修改意见,包括重新生成图片,比如说我们要这个 logo 放大一点, 然后 p 住这里这张图加上一个人物,好把这个删掉, 那然后对话框里呢,就会加上我们这几条批注,然后我们点击发送,它就会针对我们的意见进行修改了,是不是挺方便的?那我们现在项目有了雏形之后,我们再 call back 一下刚才说的 agent md, 其实现在呢,就是一个让 codex 帮我们生成项目级 agent md 的 好时候了,因为我们也有了一定的内容,我们就让它自己生成一下,我们打开编辑器看看, 不错,项目的背景,各种信息,各种规则,各种文件路径都已经写好了。那以后呢,无论我们在新开对话,还是我们的聊天记录都已经被清空了, codex 都可以通过这个项目级的 a 证书 md, 立马的了解我们的项目基本情况。 ok, 那 我们先保持这样,先不做精修了,我们直接准备部署上线,当然大家自己做的时候完全可以去打磨的更好,那网页上的这些信息也换成更真实的信息就好。 那我们现在要部署呢,就得要说到 codex 的 第五大能力插件。在现在的 codex 当中,插件大多数是让我们的 agent 跟外部平台、外部工具、外部服务连接的一个作用,它实际上就是我们所说的 skill, mcp, c l i 这一类东西的一个完整集合包,比如说操作邮箱、操作日历、操作 excel 啥的。那我们来点开左边的这个插件栏,我们看这里呢,已经默认帮我们打开了好几个内置插件了,比如说浏览器操作,还有 mac 专有的屏幕操作,还有 excel 表格, ppt 等等。 那他的插件页面没有中文翻译,所以我给大家把这些插件的具体中文意思,分别能干什么也都列出来了,大家课后可以按需装上,点这个加号就好了。那我们先翻到这个 coding 板块,因为我们想要部署上线嘛,通过插件会非常方便。 其实呢,这个 vassel 和 netify 都可以,我们点一个加号给它装上,那如果大家给它没有选上的,也记得要选上。然后我们再回到对话当中,告诉他们,我们想用这个 netify 把这个网站给我们部署上去, 我们大家也不用管他咋部署的,反正他需要干什么呢,他都会告诉我们的。 ok, 他 发现我们没有登录授权,然后主动弹出了这个登录的链接,那这里呢,建议大家用 tapp 账号登录是最方便的, 那登录完之后,他自己就知道我们已经登录好了,然后继续的帮我们部署,这就搞定了。这个链接呢,就是我们最后的网站了, 只要把这个发出去,别人就能访问你的个人主页了。 ai 是 不是个好东西,你说就这么两下子就干了,原来普通人花钱都不一定能干成 o k。 先压抑住我的这个老灯感叹。我们回到刚才我们已经装好的插件, 那其实这里呢,还有两个非常重要的内置插件,就是 browser use 和 computer use, 还有这个 chrome 浏览器, 那这些有什么用呢? browser use 顾名思义呢,就是 codex 可以 直接帮你操控浏览器,比如说它自己点击翻页截图,填写表单等等。通常呢适用于自动化测试前端, 当然也有比较无聊的用途,比如我们可以让 codex 打开这个 m b t i 做个测试试试, 嘿嘿,这样大家能够比较直观的看到它的一个效果吧。那这个鼠标呢,是它自己在移动,然后它是自己看了上面的答案在自己填写,然后填完这一页,它也会自动的翻页, 那随着它的一通操作,结果出来了,原来 gpt 五是 i n t j 啊,我说怎么跟我这么聊得来呢? ok, 那 这个 chrome 的 插件呢,也是控制浏览器,但是它控制的是我们自己已登录的自己的浏览器,它不会再新开浏览器, 那我们如果把它给勾选上之后,它会引导我们去 chrome 里面装一个插件,那装好之后呢,它就可以操作我们自己的浏览器了, 而且它有个好处,它是可以直接在后台执行多个页面的浏览器操作的,就是并不会占用我们的整个浏览器,我们不用真等着看它这些操作,我们该用浏览器干,别的我们可以接着干。 ok, 那 computer use 就 更厉害了, 它不只能够操控浏览器,连你电脑上的这些 app 它都可以操作,只不过呢,暂时只有 mac 有 这个功能。比如说我们新开一个对话,我们在加号,这里来看最下面的这个插件选项,我们手动地把电脑插件选上, 我们再来几个没什么用的奇迹引巧吧,帮我放一首九九年最火的歌,然后用我的微信给 qq 发条微信,说,请收下我一个点赞、收藏、关注,懂了吧? ok, 他 陷入了思考,然后他看到我们的应用都正在运行中,并且向我们使用了这个音乐软件。我们点同意看,这个就是 codex 自己干的啊。他帮我们搜索歌曲, ok, 音乐响起了, 但是他还有活,他还在问我们要微信的权限,我们也给他允许一下。 ok, 看他这个小鼠标,他正在犹豫着准备搜索点击,好朋友们失败了, 因为我上次都成功了,但是我估计现在微信已经开始严防这种 a 证的操作了,直接给我退出去了。 但是呢,他的确成功操作了这个音乐软件。其实我还让他操作了剪映,并且给我们的最新的项目加上了音乐。 那总之呢,意思大家都懂了吧,就是它可以操作浏览器,并且可以操作我们的电脑。当然,实际上我觉得它的操作效率目前来说还是稍微有点低的,我不太喜欢用这两个强大的功能。不过后面我要说的这个 skill 就是 我每天都会用的东西了。 那 skills 我 的确也已经跟大家说过很多次了,好学的朋友一定要去补补课。那 skill 本质上呢,是我们人为沉淀的一些可附用的方法、流程和工具的组合, 相当于给 agent 做某些具体任务的一些行动指南。那因为之前我们已经让这个 codex 帮我们装过一个叫做 find skill 的 一个原 skill 了, 所以后续如果大家想要去装,或者是找一些社区上的 skill, 都可以直接用 codex 拿语言直接让它下载。比如说我们下载一个必备的 ansapic, 那 个前端设计的 skill, 还有一个去 ai 位的,那我们这两个都发给他,等会儿都会刚好有用 欸,很快他就帮我们装好了。那以后大家想要下载 skill 呢?如果说遇到这个 find skill, 他 找不到的东西,也可以直接把链接发给 codex, 让他帮你下载就好了。不过我在 c c 那 期也说过,最好用的 skill 还是自己创建的,符合自己工作的专属 skill。 那 创建 skill 呢,也有两种方式,第一呢,就是直接告诉 codex 你 想要创建一个什么样的 skill, 通过跟他讨论打磨得出来一个 skill。 那另一种呢,就是我们接下来要演示的,先跑通流程,然后让它形成 skill, 这也是一种更推荐的做法。那比如说我们想做一个自动化写这类文章,并且帮它配图的 skill, 这种大家应该都看过吧, 那我们就得先通过一步步的引导 codex, 让它真正实现一个我们满意的文章。来我们新开一个对话。那正好呢,我们刚才不是装过这个 github 插件吗?我们可以直接先问它最新的 github 流行项目,热门项目都有哪些? ok, 它的确帮我们找到了一些,那我们再让它清晰地解释一下这些项目都分别是干嘛的。嗯, 那我们再让他挑其中新星数量最多的,来帮我们写一篇本周 get up 热门项目推荐这样的一篇文章。 好,那他写好了这一篇之后,我觉得稍微有点太人机了,我希望可以更口语化一点,并且我只想要五个精选的,那我们就告诉他,然后还要覆盖到这几个层面,那我们这里就可以用到刚刚我们下载的那个去 ai word 的 那个 skill 了,我们斜杠给它调出来。 好,那看到他的结果稍微优化了一点,但是我们还希望加一个我们固定的开头,我们的结尾,并且还要让他用上 image 二来帮我们生成一些配图。最后呢,我还希望他不要是这个格式,他要是一篇非输文档的格式,然后图文并茂的。 ok, 结果来了,他确实是有了,但是呢,我觉得这个配图不够丰富,于是我又经过几轮调整才觉得差不多满意。并且我还给他最后加了一步,要让他把这个飞书文档发送到指定的群里,让大家都来看看。 那最终呢,他的效果是这样的,果然发出去了。其实啊,如果想更加一步到位的朋友,也可以结合刚才我们说的这个浏览器操控,让他直接打开那个发布页面,直接就帮你发布出去。 那总之,我们对他这一套结果满意了之后,我们就可以直接让他把这一整套的标准和动作做成一个 skill 搞定了。那我们再输入斜杠,再往下找,我们就发现就有了这个 skill, 我 们可以直接这样手动地调用这个 skill, 也可以直接说生成一篇热门项目推荐图文这一类的触发词,也会让 codex 自动调用。 不过因为现在 github 上面实时的热门项目肯定是没有更新的,所以我们再调用一次呢,它大概率会写出差不多的文章,所以我们就不试了。但是大家都理解了吧, skills 呢,可以把我们经过验证调好一次的一整套流程和方法给它固定下来。 下次做这件事情呢, codex 就 可以按照这个方式稳定的输出。 ok, 那 下一个能力则是 mcp。 其实 mcp 现在已经用的不太多了,所以我只简单的示范一下那 codex 的 mcp 藏在设置里面的 mcp 服务器。 只不过小白看这个肯定是有点不太知道怎么填的,所以跟我们之前说的一样,我们最好的方式还是把你想装的那个 skill 的 链接拷贝给 codex, 让他自己装就完了。比如说我们来装一个 notebook lm 的 一个 mcp 发给他, 他就会引导我们来做授权登录,登录完就搞定了。那我们再试一个我存了非常多访谈视频的一个笔记本,我们来问一下他。 欸,那这样呢, codex 也就可以直接获取我们 notebook lm 上面的这些外挂知识点了。 ok, 最后一个 codex 能力是自动化定时任务。 其实定时任务本身并不稀奇啊,比如什么每天早上提醒我吃药,提醒我喝水这一类的事情,普通的软件也能做,但是我们把它放到最后一个说呢,就是因为它可以结合我们之前学到的各种能力,把一整套组合起来的任务,让 agent 定点执行 自动化,加上智能化和定制化方显美妙。比如说刚才我们做的这个热门项目图文的这个 skill, 我 们就可以把它设成每三天或者是每周,让它定时定点的产出一篇 dapp 热门项目推荐发出来。 那我们要创建自动化任务呢,其实也分两种方式,第一种就是选到这边的自动化面板,那它这里呢,有一些官方的参考视例了,不过大多数是跟开发相关,那我们选择新建一个自动化, 其实你看要填写的东西也非常简单,其实就是用提示词写好这些自动化是要做什么,然后我们可以在这里选好什么时候出发,我们也是可以自定义一个出发时间的, 然后这边就可以选择执行的模型和思考强度,最后点击创建即可。不过呢,我也还是倾向于让大家用第二种更简单的方式,就是直接在对话里跟 codex 说,那我们直接跟他说 帮我创建一个自动化任务,每周一早上九点自动化执行热门项目推荐的这个 skill, 产出一篇图文发到群里, ok, 那 我们在看自动化这里,它就已经帮我们设好了这个任务,我们随时也可以去改变它的时间。 再比如当你的这个邮箱插件 github 飞书都已经连上了 codex, 那 么你也可以让他每天下午六点帮我汇总日历上完成的会议, github 上面的提交记录和我的邮箱回复记录,生成一份全面的工作日报。 最后手机操控 codex 设置方法非常简单,手机上的 check gpt 和电脑上的 codex 都把它更新到最新版。之后打开手机上的 check gpt, 然后点击侧边栏的那个 codex, 它就会提示你允许这台手机控制你的电脑,直接就搞定了。如果你有多台电脑的话,也可以给它分别连上。这就等于你不管在大街上、地铁上还是朋友聚会,都可以随时随地地用手机下发一个任务,让 codex 在 你的电脑上干完一个活, 它就更像一个可以跟你远程协助的同事了。这个功能呢,目前免费版也可以用,但是主要能连的是 mac 系统的 codex。 好, 那到这里 codex 的 所有核心能力我们就全部过完了。来我们回顾一下。 codex 呢,可以操作我们的本地文件,可以使用我们电脑上的终端命令行工具。它还有两种构建持久记忆的方式,它还可以生成图片,而且它可以通过计划模式来做一个完整的项目开发。 那它有丰富的插件,可以操控浏览器和电脑,还可以把知识和流程沉淀成可附用的 skill 技能, 它可以使用 m c p 连接,外部它还可以设置自动化的定时任务。不过其实比起这些功能本身,我也希望大家记住两件事,第一就是我们真的有很多事情是已经可以交给 agent 做了。 那第二呢,就是我们已经从问 ai 的 阶段走向了管理 ai 的 阶段,因为过去我们使用 chat gpt 就是 有问题了,我们问一下,然后得到答案我们就走了。 那现在使用 codex 这类的 agent 呢?每个人都得像领导一样,帮他准备他所需要的上下文和工作环境,给他指明一些任务目标,然后来检查他的计划,监督他的过程,验收他的结果。 那同时领导还要负责把好的方法和流程沉淀成可付用的技能,把反复要做的事情设成自动化执行的规矩。好了,恭喜大家今天都升职了,记得点赞收藏关注我们下次见了。