粉丝115获赞1018

codex 跟 c c 到底哪个好?我想大家各自都有自己的判断。在我个人为二者都充了二百刀的 pro max 会员以后,我个人的体感是 二者的模型能力之间并没有本质的差异,甚至都足够惊艳,让人心喜。但它们其实代表了两种完全不同的人。与 ai 合作的费洛索费 本质上,我们不是选择两个工具,而是选择两种与 ai 交互的模式。你习惯使用哪种模式,你的工作场景是哪种模式,你就应该选择支持哪种哲学的普顶工具。通常来说,抽象的讲, 软件工程开发的模式可以粗略地分为两大类,首先一类是那些探索性不确定的 idea。 在这种场景下,我们自己可能对需求要做什么,最终的一个中态是什么,甚至过程中该如何实现,它都没有一个明确的定义,它更多是我们一个拍脑袋的灵机一动的想法。当我们解决这类问题时,我们期待的一个 partner, 无论是不是 ai, 它应该都要能 快速的与我们进行交互,通过一些他主动的提问甚至判断给我们更多的信息输入,通过一系列的沟通,最终确定出一个相对更结构化,信息密度更高的思维原型来指引我们后续的执行。 而另一种常见的工作模式则是一个更明确的需求,比如说产品已经给我们了相对明确的 p r d, 那 我们剩下要做的只是说把这个项目 真正转移为一个可以被执行的代码而已。对于绝大多数的研发而言,这种场景下想要做的事情是基本完全确定的,我们在此时要做的无非只是一些 dirty work, 把那个 p r d 转化为真正写出来可用的代码而已。 而结合我自己的使用经历来看, c c 更适用于前者者的工作模式。它会在你输出一些观点之后快速地给你响应,并且高频地向你发出提问,以确定它后续的一些方向执行思路。但 codex 则完全相反,它会在你给完需求以后, 非常认真且可靠地将你的需求描述执行完。这个过程会花很长的时间,但是 结果往往是令我们满意的。想要更明确的拆分这两种工作模式的分野,我们不如从三个维度上来进行拆分,首先是任务商,也就是目标的清晰程度以及约束条件的多少。其次则是以我们预期的交互结构, 我们到底期待着与其他 partner 是 同步的沟通,还是说是一些异步的沟通模式?另外则是一个人类所占主动性的比例, 我们到底期望 ai 占据多少责任?他们是只是执行任务,还是说给我们也有一些他自己的认识建议?其实这三者并非是一个非常正交的关系。一个很明显的结论是,如果一个 目标的本身并不清晰,只是我们拍出的粗糙 idea, 那 我们显然就需要我们的协作者能快速的发问,帮我们把 自己大脑中一些比较模糊的观念导出出来,并且通过一些沟通确定哪些思考是我们需要的,哪一些是可以被删除的。通过这种 快速的同步沟通,得出来一些更结构化的结果,那在这个流程中, ai 需要介入的部分以及引导的主动性就会占比更多,但如果这个需求本身就像我们之前讲的已经相对来说明晰,是一个低伤的场景,那我们就不太 需要。它是一个很同步,事无巨细都要向我们发问的流程,它完全可以在我们把事情说清楚之后,一步的完成这个工作,从而解放我们人类自己的时间。我们也不需要给他太多主动发挥的空间,他只需要忠实的执行我们给他的需求就可以。我觉着对未来工具的使用以及工作流的设计,也都是从这三个维度去进行判断,动 态的选择。我们到底适用于哪种工具,应该主要采用哪一种工作流的思路?如果要打一个比方的话, c c 更像是坐在你隔壁工位的好蜂蜜, 会在有了一些 idea 之后立马的打断你现在的所作所为,跟你去探讨它的一些碎片化想法。而 codex 则更像是一个你忠实可靠的下属,在你交代完任务需求以后,忠实的可靠的帮你把事情完整的办完再通知你。我已经做好了。 每个模型都有它们自己的性格,我们也可以顺应的这种性格,在不同的工作场景中选择不同的工具以及模型。 以上是二零二六年二月我对这两个投影工具的一些使用场景总结,但我相信这个领域是日新月异的,二者工具之间 大概率在未来也会发生一些融合。不会说一个工具只是一种工作流场景,那就需要我们未来本身人类自己有一些对需求使用场景的预判,从而能告诉模型它应该采用哪些工作流模式。软件工程永远没有银弹, 不可能说我们用着一种模式,一条道走到黑,就可以得到一个很完美的结果。如果你在错误的场景使用了错误的工作模式,那模型给你提供的支持也就会非常有限。 结合自己的需求,场景动态切换自己的工作流模式才是一个更高效率开发的必经之途。以上是本视频的全部内容,如果你有一些想法或者建议,期待评论区讨论,谢谢大家!

codex 太厉害了,给你们看一下啊,就是我跟他说我的需求啊,就是自动化生成图片,然后对应的 cds 二点零的分镜提示词,然后直接生成视频,你看这个流程,直接他就能帮我做了啊, 他先让我啊,登录授权我们这个呃节目的账号啊, 然后我登上去之后啊,他说让我确认,我说我的意思是用 image 二模型生成图片啊, 就是目前来说最强的生图模型,然后好,他用了 gpt 的 生成了这四张啊图片看,然后他就写好了这个完整的分镜提示词, 点进来看一下啊,我对他这一版其实是不是很满意啊,我就又上传了我的塑身形象和这个音频音色一起给他生产啊,他就直接啊添加进去后啊,升级后的,其实是看见没有啊, 他的运镜啊,他的音频音色,还有啊他的模型啊,比例, 分辨率描述,他都会一并成交,让我确认,确认之后,好,你看八分钟之后生成完成, 虽说非常的厉害。你看到这边我自己来剪一下。看这套新中式 主楼加旁边小院房,一进门就是双层挑空门厅气场一下就出来了,面宽十三米,进深十一米五,屋檐声带一亮,晚上比白天还好看。细节看这里,门厅线条,灯光,院子比例,这房子盖的讲究,老家准备建房的评论区打别墅,我把这套思路讲给你听, 怎么样,是不是非常的厉害,就是现在哦,如果说你还没有体验过这种 and just give 就是 这种自动化的啊, 模型就真的是,呃,你现在所有的工作方式都可以通过它给你复制出来了,不信你你问一问他,他都能给你复制出来, 真的。所以如果你还没有体验过的可以好在评论区啊,打个一啊,或者说想体验我会教你怎么去做。我真的想在 ai 时代啊他们大家一起无限进步啊。

美好啊,朋友们,这是一期 codex 奶妈级的零基础系统教程,这期视频我会从安装开始,手把手地把 codex 的 基础能力到高级功能的组合,以及最新的手机端操作,用十个实战场景来带大家彻底拉通 以后这一类的 ai 产品,出一个算一个,你都会触类旁通,游刃有余。我也把这期的文字课间整理成了文档,那这期的含金量可谓是 biu biu biu biu biu, 一个点赞收藏关注是最起码的。好了,不多说,学费都交了吧,我们上课, 那在开始之前,我先说一下 codex 和 cloud code 的 区别。从本质上来说,它俩都是由编程 agent 逐步转向了通用 agent, 分 别是 ansapi 和 open ai。 这两家出的 cloud code 呢,默认使用 cloud 模型,但是我们可以自行替换成任意其他的模型,那在易用程度上, codex 桌面端的产品设计是会更友好的, 更适合零基础的白领工作者,而 cloud code 有 更高的自由度。在功能上, cloud code 原本是最齐全的,什么 skill、 mcp、 斜杠命令、 hock、 远程操控,这都是人家先发明的。但是呢,最近的 c c 更新稍微不如 codex 那 么快了,会更加偏向专业开发者一点。 而 codex 发了非常强的浏览器操控和 computer use, 还内置了最近的 image 二深图模型, 而且昨天还刚刚发布了手机端和 hock, 可以 直接用你的手机 check gpt 来控制电脑上的 codex 干 活。那价格和额度方面呢? codex 的 会员额度非常大方,二十到的会员就很够用,而且还不封号。 而 cloudpod 呢,大多数人可能都没法用它的官方账号基本上都得自行调用 api 的 费用属于是花多少用多少,风险由人。那在使用场景上,我个人喜欢用 cloudpod 搭配 cloud 模型来写作,因为 ops 四点六的写作和规划能力真的很强, 那 codex 的 执行和解决问题的能力也很强。日常的办公场景,我会选择用 codex, 那 在编程的时候嘛,我就两个都用上,所以结论是,入门的朋友用 codex 就 很强了,有条件的朋友呢,两个都来是最完美的, 不过两者的逻辑其实都是一样的,我们学一个,另一个也就会用了。那 cloud code 我 也做了一期系统教程,想拥有左膀右臂的朋友可以去看看。 ok, 正式开始 使用 codex, 我 们唯一需要准备的就是一个叉 gpt 账号,免费的也行,只是会额度稍微少一点。那有了账号之后,我们就直接去它的官网双击安装, 然后安装好之后登录我们的叉 gpt 账号,然后这些设置我们可以先随便选一点啊,选个日常工作,反正后续呢,我们都是可以改的。那搞定了, 那进来之后呢,大家会看到这个对话窗口,好像跟 chat gpt 是 很类似的。那我们打开两边的侧边栏也蛮眼熟的,左边呢,可以管理对话和任务的列表, 那中间就是聊天,右边大概是结果之类的吧,大家应该都能猜个七七八八,所以我们先不深究它的页面,我们直接开用,这其实也是我探索所有的 ai 工具的独门秘方。 我打开一个陌生界面呢,我先不管别的,我先找到我能对话的框,我先聊,先找到我能看得懂的按钮,先按,按着按着你就会了。你看看,独门秘籍都教给大家了,以后你们就是为师的弟子了。 ok, 众弟子不必拘礼,我们还是以学业为重啊。那我们第一个要了解的 codex 能力呢,就是本地文件操作, 也是这一类桌面端的 agent 跟对话 ai 最显著的区别和能力。因为过去我们用叉 gpt, 如果说我们要让它看到我们本地的内容,我们只有两种方式,一个呢就是复制粘贴到这个对话里,另一种就是以它允许的格式和数量把文件给上传上去。 但是 codex 不 一样,它可以自主地读取和操作我们的本地文件,而且不限数量。比如说我作为一个剪辑,我的本地里面存了八十多条视频素材,这都是我剪辑要用的, 但是呢,这个命名全都是乱的,完全看不懂,所以我想以这些视频的内容来命名,到时候我们看见文件名的时候,我们就知道这个素材是什么。那这事 check gpt 肯定是做不了的,但是 codex 可以 我们来看这两个地方,它都显示了一个概念,叫做项目, 我们选择一下,哎,一选择项目,他就让我们选择本地的文件夹了,那我们只要选中这个文件夹,那这个文件就是我们的项目了,里面所有的文件 codex 都可以自由的读取和操作, 当然这需要我们给他权限。大家看这里的权限选择啊,目前呢,我们是一个默认的权限,我们再点开,他有三种权限模式, 那默认权限的意思呢?就是在我们当前的文件夹内,他可以自由的去读写这些文件,但是如果他想要联网呀,或者是帮我们下载一点东西啊, 或者是碰这个文件夹之外的其他文件,那他是不行的,如果他必须要做,就会要向我们提出提高权限的请求,我们点同意才能继续。 那自动审查呢?顾名思义就是有个 ai 自动帮我们审查,由 ai 来判断这个操作危不危险,如果危险呢,就来问我们不危险的,比如说他去下一个知名的这种官方软件什么的,他就直接开干了。 自动审查比默认模式要更宽松和智能,建议大家选这个就完了。那最后呢,是完全访问权限,这意味着 codex 可以 在你的电脑上几乎什么都能干,它可以修改删除任何文件,它可以在任何位置执行命令,例如说它可能会去把你的 cloud code 给删了。 开玩笑啊,它一般情况下是不会这样抽风的。 ai 呢?也没有嫉妒情绪吗? 大家尤其是新手朋友就选择自动审查模式,相信 ai 就 完了,毕竟咱又能审的比 ai 好 多少呢啊,对吧? ok, 那 我们选中了刚刚的这个视频的文件夹,继续来提出我们无理的要求,让他帮我们把这个文件夹里的所有视频素材都按他们的实际画面来重新命名。哎,他就开始做了, 而且大家看他非常的聪明,他先看了看我们到底有多少个视频,然后他选择用抽帧的方式抽取关键画面来判断内容是什么,而且他还知道他不要一张一张图去看,他给拼成了缩略图的形式,一组一组的去看。 ok, 很 快啊,这个文件夹里面的文件名就全改变了。过程中呢, codex 也是没有向我们提全的,因为他都是在这个文件夹内去操作的。那我们也可以检查一下他都对应好了没有。 ok, 钢琴家音乐演奏厅,没错, 雪山近身格斗,没错,旗袍女人夜巷卖热饮哇!而且他的这个命名还遵循着一个序号,任务、场景、行动的一个清晰的命名格式。 ai 做事的这个细心程度啊,人类你不服不行。那另外呢,我们其实也可以在同一个项目里面去开多个不同的对话,它们的上下文都是不一样的,但是同样都可以随时的访问我们这个文件这个项目。 比如说,我们在另外一条对话,我们又给他一个不同的任务,让他想办法把所有关于风景的视频都剪成一整条。 哎,没想到吧,他真的能剪,他自己想办法,用了一些工具问我们要了一些权限,用这个 ffmpeg 给它拼在了一起,效果的确是关于风景的都剪成了一条。 ok, 那 如果我们要创建一个新的任务,我们其实也可以手动的在这边创建,他也会自动的在我们本地创建一个文件夹。 然后呢,我们跟 codex 对 话的整个过程, agent 产生出来的任何文件啊, pdf 啊,什么 markdown, ppt, 它都会直接存在我们本地的电脑上。 ok, 到这里,大家应该 get 了 codex 呢,可以随时地访问我们的本地文件,去读取内容,写文件,删文件,移动文件,文件夹里的内容也就成了我们的 codex 随时可以获取的上下文,那这里的项目也就对应着我们在本地的一个文件夹, 哎,那刚刚这么个任务会花我们多少上下文呢?我们只要看这里就能看到了。 那这个小圈代表的是我们现在的这个对话和里面的操作,一共使用了 gpt 五点五的多少上下文窗口。 如果我们把鼠标悬上去呢,它还会有更详细的一个信息,当上下文快满的时候, codex 会自动地帮我们压缩上下文。不过其实当我们一个任务告一段落之后,不用等它快满了,让它自动压缩,我们也可以自己通过斜杠压缩这个命令 来手动的去压缩上下文,这样呢,可以让模型更聚焦在我们的新任务上,也省一点上下文的额度。那当然大家除了这个对话的上下文余量,其实我们还想知道我作为一个免费用户,或者是我作为一个 pro 用户, plus 会员,我还有多少总共的额度可以用,对吧? 这个呢,有两个方式查看,一个呢是左边的设置,这里我们点开剩余额度,就能看到你五小时内还剩下多少,那本周内又还剩下多少, 甚至呢,也有什么时候到期会刷新的一个提示,这个产品的设计还是比 cloud 的 友好很多的。那另一种方式呢,就是我们可以直接在对话框里输入斜杠,然后找到这个状态, 那打开这个状态之后,它的绘画这里就会持续的显示我们的上下文余量,这个五小时和一周的限额。但再次说实话,这个 codex 的 额度还是非常大方的,二十到的额度我认为是可以满足大多数白领工作的高频使用的。 ok, 那 顺便呢,我们也介绍一下这里的模型选择, 那点开之后,我们可以选择速度,快速呢,就相当于加急通道,会消耗我们更多的额度。那这里呢可以选择其他模型,但是大家都选五点五,因为它确实更好用。然后呢,这里可以选择智能程度,其实呢一般中度智能就够了, 所以我们选高。 ok, 那 这个小麦克风呢,肯定就是语音输入功能了,比手打字还是要快很多的,但是呢,它的转录速度远不如大家去下载一个语音输入法,还是非常推荐大家用语音输入的 好。那现在我们通过一个本地文件处理的案例,也了解了 codex 上常用的一些功能。那 codex 的 第二大能力就是命令行工具使用。 其实刚才我们说到权限的时候就有提到,在默认权限下,它可以读写文件,但是却不能执行一些命令,一些联网的操作。那这些命令是什么意思呢? 刚刚的案例其实也已经用到过了,比如说它把视频抽帧出来,还把几个视频拼接到一起,它用到的 ffmpeg 就是 命令行工具。 还有一些我们熟悉的命令,比如说我们在终端里面来克隆一个 gitup 仓库,或者是大家近期比较熟悉的,我们在命令行里面输入一些命令来下载龙虾和各种依赖。那 codex 的 第二大能力就是在我们授权的情况下,可以使用我们的终端来替我们做这些事。 那我们就来让 codex 帮我们来安装一些平时对于小白来说非常复杂的东西吧。第一类,常用依赖,比如说什么 node gs 啊, git 什么的, 也是大家以后使用各种 agent 或者是做其他项目必备的一些工具啊,那之前大家要装这依赖都得去看一个手把手教程,然后照着命令抄,挨个装。那现在我们就直接跟 codex 说帮我安装个 node js 给他发过去, 也是因为这些东西呢,其实都是比较常见的东西了,所以在我们的自动审核的权限模式下,你看他基本上都不问我们要提权,就熟门熟路的帮我们装好了。 那第二类,就是那些爆火的但是有上手门槛的一些新的 agent, 比如说龙虾,爱马仕,甚至还有这个 codex 的 竞品 cloud code, 我 们都可以让 codex 帮我们装完了呢,它还能教我们该怎么用。那我们装一个 hermes 吧, 我其实都不需要给它官网和仓库链接,我就说最近有一个叫 hermes 的 agent 很 火,你帮我安装一个吧。 哎,他就会自己去搜索,然后帮我们判断到底是哪一个。然后呢,他根据官方的文档帮我们陆续的装好了,还帮我们验证过已经装好了,你瞧瞧,那我们照着他说的来启动一下试试。 哎,真的帮我们装好了,那往后的配置我们就不在这里继续了,但是大家应该 get, 有 了 codex 以后,那些复杂的要收你五九九的部署,你都可以直接让 codex 帮你做了,怒省五九九。而且我们在使用的过程中遇到任何问题,还可以截图去问 codex, 什么瞎死了马挂了,升级出现了问题都可以让 codex 直接帮你修,是不是很方便? 那第三类有点没那么必要,但它其实也可以,就是像 cursor integrity 这种软件应用, 平时都是我们去手动在网页上下载的,它也可以帮你下载和卸载。那大家用 codex, 我 其实也建议大家去下载一个 agent 的 ide 啊,因为现在 codex 有 个缺点是它没有办法打开我们的文件内容,直接去手动编辑。 虽然这个侧边栏呢,是可以看到一些文件结构和内容的,但是我们都没法编辑,所以大家可以让 codex 下载一个自己喜欢的,比如说我们就这样下载。那下好之后呢,我们再执行一个 git i n i t 一个初步化, 那右上角就会出现这个东西,随时可以把我们的项目在编辑器中打开,我们来手动编辑。 那第四类就比较重要了,就是 agent 本身会常用到的那些 skills 啊, mcp 啊和 selli。 那 skill 和 mcp 本身 codex 也是支持的,我们后面会详细讲到, 我先挑两个大家安装一下,方便我们后面综合起来来做案例。那这些 skill 和 c i 呢?通常来讲不像那些 get 那 种大项目那么著名,所以我们最好是找到它的具体仓库,或者是明确的官网地址。比如说我们下载一个专门找 skill 的 这个 find skill 哦,方式就是直接把链接拷贝给 codex, 然后跟他说帮我装一下这个 skill。 那 在他装的期间,我们也说一下 codex 的 另一大好处,并行任务处理, 我们完全可以在他做这个事情的时候再开一个对话,让他去下载一个别的。那我们下载一个飞书 c l i 吧。飞书 c l i 其实非常的典型, 因为现在呢,有一些积极 ai 化的软件,把几乎所有他在软件里能做的操作都做成了命令,让 agent 能够方便的去操作,我们把这个链接发过去,让他开始下载, 那这边呢,其实会显示每一个正在处理当中任务的情况,这个在转呢,就说明它正在执行中,那这个蓝色的点呢,就说明已经完成了,有时候还可能会出现一个需要你申请权限的一个标识。 ok, 那 这里 fan skill 呢?它是已经装好了,我们再看飞书 c l i 这边,它会引导我们去做一些授权, 我们就跟着它的引导去完成就好了。 ok, 那 装好飞书 c l i, 那 codex 就 能帮我们去做飞书里的各种操作了,比如说写文档,发消息,见日历,做表格什么的了,我几乎每天都在用, 好大功告成。我们就这么一个小章节,我们就用自然语言的方式让 codex 帮我们装上了 hermes node, 飞书 c l i 一 大堆东西,这就是 codex 作为 agent 的 第二大常用能力,命令行使用。 那这个能力和这个章节的演示也是希望大家能够 get 到一点,就是我们现在在电脑上想去做的很多很多事情,都可以让 codex 这样的桌面 agent 去做了。那 codex 的 第三大能力是持久记忆。 看过我那篇 cloud code 的 朋友应该都知道, c c 呢,有一个手动的持久记忆, cloud 点 md, 还有一个自动的记忆系统, 都是把我们希望 agent 能够长期记住的,比如规则、篇号和我们的信息之类的东西,以本地文件的方式存在我们的电脑上,然后事实的时候把这些记忆以上下文的方式注入到 agent 里去。那 codex 也是类似的,它也有这两套持久的记忆系统 在 codex 里面呢,手动的持久记忆文件叫做 agents 点 m d, 而且它也有一个自动的记忆机制,来我们打开设置,找到个性化, 那在这里的这个自定义指令实际上就是一个全局生效的 agent state md, 它会在我们任意的项目跟 codex 对 话的时候,它都第一时间作为上下文发给大模型,那我们可以手动地自己在这里写,不过我更喜欢呢,直接在对话中去跟 codex 说, 比如说我说一个,我希望你以后对非书文档里的任何修改都使用一个专属的你的文字颜色和用删除线的方式来修改,不要直接的修改。然后这个帮我寄到局的 a 正 c m d 里。 ok, 那 它这里呢,告诉我们已经写好了,我们再打开个性化这一块,就的确是多出来了这么一套规则,那实际在使用当中,它就会去遵循我们这个规则了。 比如说我这里已经有一篇非输文档了,我在侧面呢也评论了几个我想修改的地方,我直接可以把这个链接发给 codex, 我 让他根据我侧面的评论帮我修改一下。 那因为我们刚才确实已经装好了这个非输的 c r i 也都给他配置好了权限,所以 codex 是 直接可以操作我们的文档的。 ok, 看看它完成之后的效果。 果然他用了紫色的字和删除线的方式来帮我们做的文档修改,那这个呢,是局的 agent md, 适合记一些适用于所有任务的一些大原则,比如说我们的工作习惯,我们要说中文,我们的工作偏好修改文档,要留下这种修改痕迹等等等等。 那另一种呢,就是项目级的 agent md, 这个长期记忆呢,只在这个项目当中生效,我们可以选择一个项目的对话,然后打开编辑器, 自己在这里手动的创建一个 agent 的 md 的 文件,然后我们去写一些针对我们这个项目的一些规则, 当然也可以让 codex 来帮我们写。我个人的建议呢,是在这个项目文件里面有了一些内容之后,让 codex 根据他对我们项目的了解来自己帮我们写。那自动记忆怎么回事呢? 其实我们刚才在这个个性化这个下面我们也看到了,我们需要手动打开这个自动记忆功能, 它的机制是我们打开这个功能之后, codex 会在我们结束对话或者是结束任务,这个对话闲置一段时间之后,它帮我们把那段对话总结成记忆,然后记在一个地方。但是它有几个原则,第一太短的对话它就不记了, 那第二这个对话的总结它一样会消耗我们的额度,所以当我们的额度太低的时候,它也就不记了。 并且这个自动记忆文件呢, open ai 官方是不建议我们去手动修改的,顶多我们可能删一删有些没必要的信息,那这个文件大概是长这样 的,是一个任务,一个任务在记录的,主要呢会写上这个记忆的来源是哪段对话呀?以及它的工作目录是什么,那以及以后触发了什么关键词的时候,它会去召回这段记忆, 再往下呢,是用户在这件事情上的偏好大概是什么样的?那第五段呢,是一些可附用的一些知识,一些踩坑的记录,那这些内容都是 codex 自己记录的,并且以后也是会它自动的招回去使用的,我们就先不修改它, 它这个格式确实也不太方便修改,更多的时候我们对于明确的规则和要求,我们还是通过组织 agent md 来实现。那大家学完这些视频之后呢,我也想给大家再做一期, 通过组织不同层级的这种 agency md 给自己做一个非常懂你的,可以做不同类型事情的超级助手的视频,感兴趣的朋友可以扣个一。 ok, 那 第四大能力就是 codex 可以 直接用到 image, 二来生成图片。不过呢,深图功能其实是一个小功能, 所以这一章节呢,我们不只会用它的图片生成,我们会带大家做一个完整的个人主页的开发项目,并且在了解一些 codex 在 小白开发中的一些用法和功能。那我们再来开一个项目,叫做个人主页, 然后我们点开这个加号,我们把计划模式打开,因为我们要做一个网站嘛,任务会复杂一点,所以打开这个计划模式呢,他会先帮我们列出一个详细的计划,我们确认之后他再开始行动。 计划模式呢,比较适合我们的任务有一定复杂性,或者我们自己还没想清楚,可以跟 ai 讨论出一个计划。那假设我们现在就是第二种情况,我们其实没想清楚,我们直接跟他说我想做一个个人主页, 那你看他看到我们的项目中是没有内容的,所以他以这种选择框的方式来询问我们的细节,这些选项呢,大家可以按照自己的要求去选择,那我就选这个个人品牌吧。 然后如果说这些选项中没有我们满意的呢?我们也可以选到最后一个来填写我们详细的要求,比如说我要他修饰感,也要高级感,然后我选针对合作伙伴,不要个人照 中英双语,巴拉巴拉巴拉。这里真的是问了我们相当多的问题啊,那最后呢,他给到我们出了一个详尽的计划,问我们是否实施此计划,那其实基本的计划我们看着没有什么问题,但我们也可以补充一些调整方案。 比如说我们刚才就要说到了要用它的 image 二的生成能力,我们这里没有体现,我们加一句网页上要多用一些图片,使用 image 二来生成一些高级感的图片,然后我们一起提交。 哎,那他又问我们要走哪种高级感呢?我们如果点开这个小叹号的话,还能看到他说的这个风格到底意味着什么意思,这个产品的小细节真的是我很喜欢,那我们就选他推荐的吧。然后他出了一版新的计划,我瞧着没什么问题, 去吧。 ok, 他 就开始初识化这个项目来逐步帮我们生成了。那这个过程呢,肯定会需要一定的时间,在这个期间我再给大家补充一点点知识点。呦,他的第一张图出来了,不错,挺有艺术感的,果然是最强的 emoji 二,那我要补充的这个知识点呢,叫做引导。 如果说大家在 codex 执行一个很长的任务的过程当中,你觉得他有点跑偏了,我们是可以随时给他补充纠偏的,比如说我们补充一下图片的人味要更强一点,而且不要这么冷的色调。我是一个 ai 博主,然后我们发送出去, 哎,大家会看到他没有立刻打断我们的任务,没有发出去,实际上他在这里排队呢。那我们看到右边的这个引导按钮,他写着我们不打断模型运行,会在下次调用工具后发送过去。这个是非常好的一个功能啊,我们点一下, 哎,他就可以发出去了。这个功能呢,可以让 codex 不 用在错误的道路上一路狂飙,把我们额度都花光,也不会让它重新再跑一轮任务。那另外一个小功能点,我们找到一个已经结束的任务, 我们看一下这个 ai 的 回复,每个 ai 回复的下面都有一个这个按钮,叫做分叉 fork, 这个的意思是我们可以随时从这里开始去开一个新对话,非常适合那种前面聊的还好好的,上下文也非常有价值,但是我们再往下聊,就聊的有点叉劈了的时候。哦,还有个小功能,宠物, 我们点开设置外观,然后这下面就有一小对小宠物可以选,甚至呢,我们还可以点击创建,让 codex 根据对我们的了解来生成一个定制化宠物。那我们先点击唤醒宠物, 哎,就会在桌面上有常驻这么一个小桌宠,脑袋上会冒出来 codex 正在做什么的一个提示,别的呢?好像也没什么用。 ok, 终于在他跑了七七四十九分钟之后,网页完成了, 我们来看看效果,因为 codex 呢,有一个内置的预览浏览器,我们可以直接打开右边的侧边栏啊,我们还给它放大一点。 嗯,这个网页的效果确实是不错啊,不过呢,现在的 a 证呢,其实都有这么一手了,那它这个预览浏览器呢,还有一个好处,我们点击右上方这里的一个批注按钮, 我们就可以在这个页面上选中这里的具体元素去写修改意见,包括重新生成图片,比如说我们要这个 logo 放大一点, 然后 p 住这里这张图加上一个人物,好把这个删掉, 那然后对话框里呢,就会加上我们这几条批注,然后我们点击发送,它就会针对我们的意见进行修改了,是不是挺方便的?那我们现在项目有了雏形之后,我们再 call back 一下刚才说的 agent md, 其实现在呢,就是一个让 codex 帮我们生成项目级 agent md 的 好时候了,因为我们也有了一定的内容,我们就让它自己生成一下,我们打开编辑器看看, 不错,项目的背景,各种信息,各种规则,各种文件路径都已经写好了。那以后呢,无论我们在新开对话,还是我们的聊天记录都已经被清空了, codex 都可以通过这个项目级的 a 证书 md, 立马的了解我们的项目基本情况。 ok, 那 我们先保持这样,先不做精修了,我们直接准备部署上线,当然大家自己做的时候完全可以去打磨的更好,那网页上的这些信息也换成更真实的信息就好。 那我们现在要部署呢,就得要说到 codex 的 第五大能力插件。在现在的 codex 当中,插件大多数是让我们的 agent 跟外部平台、外部工具、外部服务连接的一个作用,它实际上就是我们所说的 skill, mcp, c l i 这一类东西的一个完整集合包,比如说操作邮箱、操作日历、操作 excel 啥的。那我们来点开左边的这个插件栏,我们看这里呢,已经默认帮我们打开了好几个内置插件了,比如说浏览器操作,还有 mac 专有的屏幕操作,还有 excel 表格, ppt 等等。 那他的插件页面没有中文翻译,所以我给大家把这些插件的具体中文意思,分别能干什么也都列出来了,大家课后可以按需装上,点这个加号就好了。那我们先翻到这个 coding 板块,因为我们想要部署上线嘛,通过插件会非常方便。 其实呢,这个 vassel 和 netify 都可以,我们点一个加号给它装上,那如果大家给它没有选上的,也记得要选上。然后我们再回到对话当中,告诉他们,我们想用这个 netify 把这个网站给我们部署上去, 我们大家也不用管他咋部署的,反正他需要干什么呢,他都会告诉我们的。 ok, 他 发现我们没有登录授权,然后主动弹出了这个登录的链接,那这里呢,建议大家用 tapp 账号登录是最方便的, 那登录完之后,他自己就知道我们已经登录好了,然后继续的帮我们部署,这就搞定了。这个链接呢,就是我们最后的网站了, 只要把这个发出去,别人就能访问你的个人主页了。 ai 是 不是个好东西,你说就这么两下子就干了,原来普通人花钱都不一定能干成 o k。 先压抑住我的这个老灯感叹。我们回到刚才我们已经装好的插件, 那其实这里呢,还有两个非常重要的内置插件,就是 browser use 和 computer use, 还有这个 chrome 浏览器, 那这些有什么用呢? browser use 顾名思义呢,就是 codex 可以 直接帮你操控浏览器,比如说它自己点击翻页截图,填写表单等等。通常呢适用于自动化测试前端, 当然也有比较无聊的用途,比如我们可以让 codex 打开这个 m b t i 做个测试试试, 嘿嘿,这样大家能够比较直观的看到它的一个效果吧。那这个鼠标呢,是它自己在移动,然后它是自己看了上面的答案在自己填写,然后填完这一页,它也会自动的翻页, 那随着它的一通操作,结果出来了,原来 gpt 五是 i n t j 啊,我说怎么跟我这么聊得来呢? ok, 那 这个 chrome 的 插件呢,也是控制浏览器,但是它控制的是我们自己已登录的自己的浏览器,它不会再新开浏览器, 那我们如果把它给勾选上之后,它会引导我们去 chrome 里面装一个插件,那装好之后呢,它就可以操作我们自己的浏览器了, 而且它有个好处,它是可以直接在后台执行多个页面的浏览器操作的,就是并不会占用我们的整个浏览器,我们不用真等着看它这些操作,我们该用浏览器干,别的我们可以接着干。 ok, 那 computer use 就 更厉害了, 它不只能够操控浏览器,连你电脑上的这些 app 它都可以操作,只不过呢,暂时只有 mac 有 这个功能。比如说我们新开一个对话,我们在加号,这里来看最下面的这个插件选项,我们手动地把电脑插件选上, 我们再来几个没什么用的奇迹引巧吧,帮我放一首九九年最火的歌,然后用我的微信给 qq 发条微信,说,请收下我一个点赞、收藏、关注,懂了吧? ok, 他 陷入了思考,然后他看到我们的应用都正在运行中,并且向我们使用了这个音乐软件。我们点同意看,这个就是 codex 自己干的啊。他帮我们搜索歌曲, ok, 音乐响起了, 但是他还有活,他还在问我们要微信的权限,我们也给他允许一下。 ok, 看他这个小鼠标,他正在犹豫着准备搜索点击,好朋友们失败了, 因为我上次都成功了,但是我估计现在微信已经开始严防这种 a 证的操作了,直接给我退出去了。 但是呢,他的确成功操作了这个音乐软件。其实我还让他操作了剪映,并且给我们的最新的项目加上了音乐。 那总之呢,意思大家都懂了吧,就是它可以操作浏览器,并且可以操作我们的电脑。当然,实际上我觉得它的操作效率目前来说还是稍微有点低的,我不太喜欢用这两个强大的功能。不过后面我要说的这个 skill 就是 我每天都会用的东西了。 那 skills 我 的确也已经跟大家说过很多次了,好学的朋友一定要去补补课。那 skill 本质上呢,是我们人为沉淀的一些可附用的方法、流程和工具的组合, 相当于给 agent 做某些具体任务的一些行动指南。那因为之前我们已经让这个 codex 帮我们装过一个叫做 find skill 的 一个原 skill 了, 所以后续如果大家想要去装,或者是找一些社区上的 skill, 都可以直接用 codex 拿语言直接让它下载。比如说我们下载一个必备的 ansapic, 那 个前端设计的 skill, 还有一个去 ai 位的,那我们这两个都发给他,等会儿都会刚好有用 欸,很快他就帮我们装好了。那以后大家想要下载 skill 呢?如果说遇到这个 find skill, 他 找不到的东西,也可以直接把链接发给 codex, 让他帮你下载就好了。不过我在 c c 那 期也说过,最好用的 skill 还是自己创建的,符合自己工作的专属 skill。 那 创建 skill 呢,也有两种方式,第一呢,就是直接告诉 codex 你 想要创建一个什么样的 skill, 通过跟他讨论打磨得出来一个 skill。 那另一种呢,就是我们接下来要演示的,先跑通流程,然后让它形成 skill, 这也是一种更推荐的做法。那比如说我们想做一个自动化写这类文章,并且帮它配图的 skill, 这种大家应该都看过吧, 那我们就得先通过一步步的引导 codex, 让它真正实现一个我们满意的文章。来我们新开一个对话。那正好呢,我们刚才不是装过这个 github 插件吗?我们可以直接先问它最新的 github 流行项目,热门项目都有哪些? ok, 它的确帮我们找到了一些,那我们再让它清晰地解释一下这些项目都分别是干嘛的。嗯, 那我们再让他挑其中新星数量最多的,来帮我们写一篇本周 get up 热门项目推荐这样的一篇文章。 好,那他写好了这一篇之后,我觉得稍微有点太人机了,我希望可以更口语化一点,并且我只想要五个精选的,那我们就告诉他,然后还要覆盖到这几个层面,那我们这里就可以用到刚刚我们下载的那个去 ai word 的 那个 skill 了,我们斜杠给它调出来。 好,那看到他的结果稍微优化了一点,但是我们还希望加一个我们固定的开头,我们的结尾,并且还要让他用上 image 二来帮我们生成一些配图。最后呢,我还希望他不要是这个格式,他要是一篇非输文档的格式,然后图文并茂的。 ok, 结果来了,他确实是有了,但是呢,我觉得这个配图不够丰富,于是我又经过几轮调整才觉得差不多满意。并且我还给他最后加了一步,要让他把这个飞书文档发送到指定的群里,让大家都来看看。 那最终呢,他的效果是这样的,果然发出去了。其实啊,如果想更加一步到位的朋友,也可以结合刚才我们说的这个浏览器操控,让他直接打开那个发布页面,直接就帮你发布出去。 那总之,我们对他这一套结果满意了之后,我们就可以直接让他把这一整套的标准和动作做成一个 skill 搞定了。那我们再输入斜杠,再往下找,我们就发现就有了这个 skill, 我 们可以直接这样手动地调用这个 skill, 也可以直接说生成一篇热门项目推荐图文这一类的触发词,也会让 codex 自动调用。 不过因为现在 github 上面实时的热门项目肯定是没有更新的,所以我们再调用一次呢,它大概率会写出差不多的文章,所以我们就不试了。但是大家都理解了吧, skills 呢,可以把我们经过验证调好一次的一整套流程和方法给它固定下来。 下次做这件事情呢, codex 就 可以按照这个方式稳定的输出。 ok, 那 下一个能力则是 mcp。 其实 mcp 现在已经用的不太多了,所以我只简单的示范一下那 codex 的 mcp 藏在设置里面的 mcp 服务器。 只不过小白看这个肯定是有点不太知道怎么填的,所以跟我们之前说的一样,我们最好的方式还是把你想装的那个 skill 的 链接拷贝给 codex, 让他自己装就完了。比如说我们来装一个 notebook lm 的 一个 mcp 发给他, 他就会引导我们来做授权登录,登录完就搞定了。那我们再试一个我存了非常多访谈视频的一个笔记本,我们来问一下他。 欸,那这样呢, codex 也就可以直接获取我们 notebook lm 上面的这些外挂知识点了。 ok, 最后一个 codex 能力是自动化定时任务。 其实定时任务本身并不稀奇啊,比如什么每天早上提醒我吃药,提醒我喝水这一类的事情,普通的软件也能做,但是我们把它放到最后一个说呢,就是因为它可以结合我们之前学到的各种能力,把一整套组合起来的任务,让 agent 定点执行 自动化,加上智能化和定制化方显美妙。比如说刚才我们做的这个热门项目图文的这个 skill, 我 们就可以把它设成每三天或者是每周,让它定时定点的产出一篇 dapp 热门项目推荐发出来。 那我们要创建自动化任务呢,其实也分两种方式,第一种就是选到这边的自动化面板,那它这里呢,有一些官方的参考视例了,不过大多数是跟开发相关,那我们选择新建一个自动化, 其实你看要填写的东西也非常简单,其实就是用提示词写好这些自动化是要做什么,然后我们可以在这里选好什么时候出发,我们也是可以自定义一个出发时间的, 然后这边就可以选择执行的模型和思考强度,最后点击创建即可。不过呢,我也还是倾向于让大家用第二种更简单的方式,就是直接在对话里跟 codex 说,那我们直接跟他说 帮我创建一个自动化任务,每周一早上九点自动化执行热门项目推荐的这个 skill, 产出一篇图文发到群里, ok, 那 我们在看自动化这里,它就已经帮我们设好了这个任务,我们随时也可以去改变它的时间。 再比如当你的这个邮箱插件 github 飞书都已经连上了 codex, 那 么你也可以让他每天下午六点帮我汇总日历上完成的会议, github 上面的提交记录和我的邮箱回复记录,生成一份全面的工作日报。 最后手机操控 codex 设置方法非常简单,手机上的 check gpt 和电脑上的 codex 都把它更新到最新版。之后打开手机上的 check gpt, 然后点击侧边栏的那个 codex, 它就会提示你允许这台手机控制你的电脑,直接就搞定了。如果你有多台电脑的话,也可以给它分别连上。这就等于你不管在大街上、地铁上还是朋友聚会,都可以随时随地地用手机下发一个任务,让 codex 在 你的电脑上干完一个活, 它就更像一个可以跟你远程协助的同事了。这个功能呢,目前免费版也可以用,但是主要能连的是 mac 系统的 codex。 好, 那到这里 codex 的 所有核心能力我们就全部过完了。来我们回顾一下。 codex 呢,可以操作我们的本地文件,可以使用我们电脑上的终端命令行工具。它还有两种构建持久记忆的方式,它还可以生成图片,而且它可以通过计划模式来做一个完整的项目开发。 那它有丰富的插件,可以操控浏览器和电脑,还可以把知识和流程沉淀成可附用的 skill 技能, 它可以使用 m c p 连接,外部它还可以设置自动化的定时任务。不过其实比起这些功能本身,我也希望大家记住两件事,第一就是我们真的有很多事情是已经可以交给 agent 做了。 那第二呢,就是我们已经从问 ai 的 阶段走向了管理 ai 的 阶段,因为过去我们使用 chat gpt 就是 有问题了,我们问一下,然后得到答案我们就走了。 那现在使用 codex 这类的 agent 呢?每个人都得像领导一样,帮他准备他所需要的上下文和工作环境,给他指明一些任务目标,然后来检查他的计划,监督他的过程,验收他的结果。 那同时领导还要负责把好的方法和流程沉淀成可付用的技能,把反复要做的事情设成自动化执行的规矩。好了,恭喜大家今天都升职了,记得点赞收藏关注我们下次见了。

codex 加飞书 c i 简直就是王炸组合,如果你的工作场景里面经常要用到飞书,那我真心建议你一定要把飞书接入 codex, 因为我自己本身就是在做自媒体和内容电商,所以我对竞品内容分析有非常大的需求, 但是市面上很多软件和系统都非常的难用,以及我在用 codex 之前,我自己也搭过一个,只不过是用扣子去搭的一个工作流, 非常的困难,拖拖拽拽搞了我非常久的时间,但这一次用 codex 加飞速 c l i 一个小时不到就帮我全部搞定了,给大家看一下,从提需求到他帮我规划只用了两分钟,然后到确定他帮我搭建这一个系统,只用了二十三分钟。 这个是我让 codex 直接用飞速 c l i 搭建好的一个表格,这个程序它是已经写好了,只要我复制小红书链接,它就可以自动帮我拆解标题,还有正文,还有 视频口播的这个脚本。我觉得视频口播的脚本是对我来说最重要的一个部分。 ok, 那 我们现在复制一个链接,让它试试跑着看, 它现在已经自动在跑了,然后已经在处理中,大家可以看一下。好,它不到两分钟就帮我已经拆解出来了, 对,我们来看一下啊,还是非常非常牛逼的。那其实在我搭建完这一个表格之后,它帮我拆解完视频口播脚本这一部分,其实我没有用到任何的 token, 只是一开始让 codex 帮我开发的时候需要消耗一定的 token, 等后面我再用这一套脚本去跑的时候,已经完全不需要任何的 token, 它花费的额度基本上为零。我在扣子上面搭建这样的一个工作流,还需要我付一定的额度。但其实 codex 已经在这一个文件里面写好了,这个脚本 我在跑的时候就完全不需要消耗额度。但是如果要让 ai 基于这一个口播脚本去分析改写的话,就需要接入一定的 token。 如果你感兴趣的话,我下期也会分享我是怎么用豆包或者是 deep sync 接入到这一个程序当中,让它帮我搭建后面的分析和改写。 所以说大家一定要去接触一下 codex 和飞书 c l i。 如果你也对 ai 加电商, ai 加业务落地感兴趣的话,后续呢,我也会持续更新我的一些实际案例,欢迎大家一起交流。

很多人第一次听到 codex, 会以为这是程序员专用工具,这个理解会挡住一大半普通人的机会。 codex 的 核心价值可以先理解成一个能进入项目文件夹、阅读资料、修改文件、运行命令、留下结果的 ai 协助员。 你把工作资料放进一个明确的文件夹,把目标限制和验收标准说清楚,他就能围绕这个项目持续工作。今天不讲复杂配置,只讲普通人最容易上手的三种场景, 第一,把会议访谈、零散资料变成汇报和复盘。第二,把表格名单、运营数据变成分析和交付物。 第三,把一个业务想法变成小工具、网页原型或自动化流程。你会发现, codex 的 重点不在问一句答一句,而在给他一个任务包,让他把过程做完,并且接受你的检查。第一个场景适合职场人士和管理者, 比如你刚开完项目复盘会,手里有会议机要聊天记录、客户反馈、几份旧方案过去,你要自己通读资料,再整理问题原因、行动向和下周计划。 用 codex 的 做法是,先建一个项目文件夹,把资料按会议机要、客户反馈、历史方案、目标模板放进去,然后给他一个明确任务,请阅读这些资料,输出一份复盘报告, 结构包括背景、关键问题、原因分析、行动清单、负责人、截止时间和待确认事项。 这里最重要的是加验收标准,比如不要编造数据,引用文件名,无法确认的地方标成待确认。这样 codex 产出的内容就会更接近可检查、可修改、可继续迭代的交付物。 第二个场景适合运营、市场、销售、 hr 和行政。你手里可能有活动报名表、客户跟进表、招聘后选人表、培训反馈表、 普通聊天工具可以帮你解释表格,但 codex 更适合做成一个小型分析项目。你可以把 csv 或 excel 导出的文件放进文件夹, 再告诉他请先检查字断含义和缺失值,再按渠道、地区、岗位或客户阶段做分组。输出一份分析摘要, 同时生成可附用的清洗规则和图标说明。他可以把过程拆开,先看数据结构,再提出分析口径,再生成结果文件。最后告诉你哪些结论可靠,哪些结论还需要人工确认。你要抓住一个原则, 涉及业务判断和重要结论是 codex 可以 先做整理和计算,你负责确认口径和决策。第三个场景适合个体创业者、自由职业者和业务负责人。 很多人脑子里有小工具及职业长,比如客户需求登记页、课程报名页、员工反馈表、销售话术生成器、周报生成器。 以前你要找开发牌机,现在可以先让 codex 做一个可看的原型。你的任务描述要像产品需求一样,写清楚这个工具给谁用,输入什么,输出什么, 有哪些按钮,页面上显示哪些字段,什么结果算完成。 codex 可以 据此生成网页脚本或本地工具,并运行检查。你不需要一开始就懂技术细节,但你要学会给他业务规则,比如手机号不能为空, 结果要能导出,管理员要能看到汇总。这类工作最适合用 codex, 因为他能把想法落实成文件和可运行结果。 codex 好 用的前提是任务清楚,资料齐全,边界明确。公司内部资料要先脱敏,客户信息和敏感数据要遵守权限。他深层的报告分析和小工具都要经过人工验收, 你可以让他列出修改清单、测试结果和不确定点,再决定是否采用。如果你想今天就开始,先选一个低风险任务,把一份会议资料和两份资料放进文件夹,让扣贷斯输出一份复盘报告。你只要记住这句话, 不要只问他问题,要给他一个项目,一批资料,一个交付标准,这样扣贷斯才会从聊天工具变成真正的工作流助手。

ok, 欢迎大家收看锐 t e s studio, 今天为大家分享四个 codex 里面的 skill 啊。说实话,新手刚开始用 codex 的 时候,都会面临很多的情况,比如装 skill 啊,今天我推荐这四个 skill, 你 装好它之后,它就能直接变成一个帮你干活的工作台,非常的方便。你们可以暂停截图, excel 呢,它们更像是一种固定的工种,可以帮我先问需求,再出方案,再整理文件,最后检查交付。 我个人的 codex 里面呢,也装了几个比较好亮的 excel, 有 个人的,有系统的,大家可以简单的浏览一下。我个人还非常推荐 spring 这个 excel, 当你提供需求的时候,它会帮你整理的非常的好。 这里呢,我用 bruce o'ne 处理一个接单的需求,就比如客户是一家本地的美甲店,想让我在小屋售楼引流,往往他想要多来点客户,然后咱们就可以用 bruce o'ne 先问清需求,然后让他给咱们两到三个可执行的方案。 那我这里只做一个演示,不给大家做安利的输出了,就是教大家怎么样调用一个 skill。 我发现很多新手一上来学 ai 就 开始研究模型了,由此,但其实真正能让你少返工,能交付的往往是这些固定的工作流。 如果你想要打造一套自己的低车门跌单工作流,那么就关注我或者 tony stu, 下一条我会出一条视频,教你怎么安装。

所有想把 codex 这个宇宙最强 ai 用好的人,你们只需要记住一句话,就是你把它当成一个在你身边坐着一群好吧,人均月薪十万的顶级全站全能程序员。然后你做一个产品经理, 你只管提需求,你不需要懂任何的技术代码逻辑,但记住一点,功能是没法一下完成的,不管你提什么需求,一定是经过很多版本的不断迭代修改,然后出来之后你给他反馈哪里不对他给你改啊,慢慢磨, 最后把它搞定。不管是做呃,全套自动化工作流,还做一些什么小程序,做软件,做网页,做任何东西都没问题。

呃,真的很建议所有的产品经理赶快去学习 c c 和 code 叉这类型的 ai, 然后去重塑自己的产品工作流。像我最近的话就碰到一个 比较难的一些需求吧,是一个整套的一个体系架构的一个方案解决方案,不是某一个小的一个功能这一块我就去结合 code 叉,然后去跟我做需求的分析,然后输出原型的方案,然后它原型的方案 还是那种,就是就直接写代码吧,然后把整个的后台啊,然后给它梳理出来,然后我用那个扣子叉的那个批注,比如说哪个字段有问题,我直接在上面去 用语言对话的 promet, 然后这种方式跟它对话方式去帮我改,就像一个小助理一样,它能快速的 get 到我的想法,然后去帮我输出最终的一个方案。呃,然后这个方案做好以后的话给到 会议上去讨论,领导这边反馈,然后效果是很好的。所以话对于我的感受的话,是 ai 到来的话,已经对产品这边的话工作流已经有一个很大的一个提升。我们作为产品经理的话,一定要就是积极去拥抱 ai, 特别是有一些产品经理啊,就是我对产品经理,我觉得产品经理是一个呃 比较接近 ceo 的 一个角色,就是只是说他没有没有实权,然后像公司里的参谋一样去做各种各样的角色。所以的话我觉得产品里很多有想法产品他是有野心的,他肯定也不想一直打工吧,肯定也想做出一些 更好的一些方案。所以我觉得你去用这个软件,然后有什么想法,比如做一套网站,或者做一个模型,然后自己去获客,自己做自己的打造自己的产品体系,引流品,然后利润品、库存品、爆款品,然后再自己怎么变现,这样的话把自己 现在很流行的一人公司的那个概念,你之前的话可能作为产品你不懂代码,你要不懂 ui, 然后现在的话,你通过这种呃扣子叉这种方式的话,就完全可以 重塑一人公司的概念,然后去把这些东西去实现做一人公司的一个反感。如果之前的话说啊,我没有很多想法,因为各方面没有钱呐,或者没有人呐,去实现自己想法,我觉得那个情有可原,的确那个创业或者是有一定的门槛或者资本,但是我现在发现就是扣子叉或者是这些 cg 出来以后 完全不需要,就是就门槛已经降的很低了,所以我现在我也在去运用一些自己的一些想法,然后去实践一些项目,然后对于产品来说,我觉得赶快去拥抱这个 c c, 然后或者是 coach, 然后重塑自己工作流,把自己的时间摘出来,然后的话剩余时间,下班时间,然后去重塑自己的一人公司的那个想法, 然后去实践,这样的话你又做主业,又做自己副业,两步跑,你这样的话你的呃那个职业的上限就比较高,就相当于互联网来说就有更多的可能性。

其实我觉得 agent 它就只有两种形态吧,对于我们一人公司中小企业老板、普通人来说,用 agent 无非就是第一个智能客服型的 agent 和数字员工 agent。 那 什么是智能客服型的 agent 呢?就是把你公司的所有资料,你能收取到的所有资料 喂给一个 agent, 然后用所谓的 rec 技术去帮你解锁。根据这些知识库,你把它设定为一个某某具体领域的一个专家, 对吧?新人来了,员工有什么不懂,都可以在这一个智能体去问他,然后他帮你回答一些关于公司的所有问题。 举个例子,比如说你是律,所有资深的办案经验和法律条款解读能力,那你可以把这些所有的知识库喂给一个 agent, 训练完之后它就是一个智能的法律客服,只需要人把客户的问题全部收集好,然后喂给这一个智能客服,它就可以帮你快速的解答,并且给详细的案例分析建议。那还有一种就是数字员工型的 agent, 像 codex、 cloudco 以及之前很火的 openclo, 它们这一些都属于能在你的业务流程里面帮你真真切切实地去干活。比如说做电商的朋友们,他们能帮你在选品、做图以及上架的时候,帮你做一个自动化的流程,然后像人一样去帮你实实在在的工作。 还有做自媒体的朋友们,他们可以帮你扒竞品内容的文案,以及帮你去分析这一个文案的结构,最后根据你的风格帮你去改写这一个文案。他的核心就是在业务流的各个节点里面代替人干活, 我们也叫它所谓的 agent 工作流,就是帮你搭一个工作流出来,然后这一个工作流如果是非常固定化、标准化的,那你可以把它打包成一个 skill, 二十四小时帮你轮流转,把团队里面的一些重复性的劳动给解放出来,让员工去想一些更有意义的事情。 说白了,智能型的 agent 就是 把牛人的脑子变成一个 ai 顾问,然后你的客户、你的员工,你培养新人,都可以在这一个顾问里面去问他问题, 让他帮你去做一个基于你公司业务的一个解答。数字员工型的 a 诊,就是把你业务流程里面重复性很高的工作交给 ai 去干。其实很多企业老板他根本就不需要懂技术, 我上一期视频也讲到,懂业务其实是最重要的,你公司有哪一些牛人的经验可以复制,可以把它打包成知识库去喂给 ai, 然后哪些业务流程是很重复性的工作,最后再找专业的人把这两种 a 诊都给它搭建起来, ai 其实就可以实实在在地帮你降本提效。所以说懂业务是关键,那后续呢?我也会持续分享 ai 加业务落地的一些实际案例,欢迎大家一起交流。

别一上来就对 codex 说,帮我做个小程序,这样十有八九会坐散。正确做法是把 codex 当工程负责人,不是许愿池。 第一步,先定一个极小 mvp, 比如只做一个预约小程序,列表页、详情页、提交页我的记录。别让 codex 同时做支付会员后台和数据分析。 第二步,给 codex 一个需求包,目标用户页面路径、数据字段、接口,约定 ui 风格,不能做什么,以及完成标准,让它先输出任务清单和目录结构。 第三部分,三轮开发,第一轮搭页面骨架,第二轮接状态和接口,第三轮补空态、异常态和表单校验。每轮都要编辑一次,报错直接丢回给 codex。 上线前别急着点上传。让 codex 做四件事,检查 app jsn 和页面路径,整理自测清单、 review diff, 别出接口域名、权限弹窗和隐私说明。 甄姬流程是这样,微信开发者工具,先预览手机扫码测试,再上传开发版本,设置体验版给别人测,确认没问题,再到公众平台提交审核,通过后再发布。 最容易翻车的点,记住四个 app id 别错。 app secret, 别进前端接口域名要提前配置,没做完的页面别提交审核。想要这套 codex 小 程序,提示词,评论区打小程序。

大家好,我是老曾,十几年程序员,转行做跨境已经两年,前两天录了一个视频,关于介绍酷德 x, 就是 把自己的体验感受说了一下,引起了很大的反响,看来大家对酷德 x 还是比较感兴趣。 今天我顺着这个话题继续跟大家分享和讨论一些里面的子子课题吧,或者子话题。呃,第一个话题就是很多人 叫我去用克拉蔻,说克拉蔻的比那个克拉 x 会更好用。 嗯,我两个对比了一下,用了一下,可能是因为我先用了 code x 啊,所以我再去用 cloud code 的 时候,我并没有感觉到有给我有多大的经验。 然后呢?最近抖音上可能也很多人说卡的克克的最近好像降智了,我也不知道是不是因为我遇到了降智版本。那怎么样才能不降智呢?有没有高手来分享一下。 然后还有就是很多人说会封号,这个当然我还没有碰到啊,但是也是瑟瑟发抖, 所以我也没怎么用,因为我还是一个项目,我会不可能用两个辅助吧,我就是大概搞了一下,感觉没有特别经验,所以我还是守着我的科德 x 去继续用。 这是第一个问题。第二个问题就是很多人问说那个插件是什么?就是那个插件叫做修坡炮。修坡炮 那个 github 上 github 上有啊,大家可以自己去搜一下,去搜一下,而且它的那个 superpos, 它的那个大数很高的,非常高的,这个一搜就知道了啊,这是第二个问题。第三个问题就是 刷到了一个观点,就是说未来可能不会再有软件了。 未来都不会再有软件,不是说不会再有软件工程师,未来连软件都不会有,那软件都不会有,那怎么会有软件工程师呢?他的观点就是说未来的代码都是日抛的,日抛就跟隐形眼镜一样, 每天带完就扔。他这么一说,我现在才想起像 gpt 等等这些窗口,他给我们吐出代码的时候,他的右上角都有一个运行的按钮, 应该就是这个设计理念吧。所以这也是挺恐怖的。就是未来我们自认为 ai 不 会替代我们这种大型复杂工程, 但事实上有没有一种可能就是你每天跟他在交互写代码,慢慢的这些代码的架构啊?这个整个的工程管理其实没必要显示的 啊,由人来去管理。就像现在的操作系统,他其实已经淡化了词盘、目录 这种塑形结构,你看现在的手机跟 pad 等等,对吧?包括现在的电脑小白,他就不会再像我们程序员一样啊,要给词盘搞几个分区,分区下面有搞的目录,对吧?每每一层的目录不会超过七个或八个,超过了又管理不过来了,还一直玩。 现在电脑很少,现在我买的新电脑他都没有分区,他一个词盘就一个,所以你不需要理解这些背后的这些组织。那未来的代码项目是不是也是一样?我们现在分各种模块去设计, 那未来呢?未来的软件工程,未来的代码模块的管理是不是 ai 在 背后帮你解决了,你也不用去管理了? 我我觉得这个趋势是对的,就是他不是说干掉了所有的什么软件, 但是他是以另一种新的形式,就是跟影视的就人工程师,他不再需要去管理整个项目,他项目本身 ai 也在背后管,而且他不需要像我们之前一样搞那么严谨的模块啊等等。 所以这个我感觉可能下半年,最迟明年将会成为一种主流,而这个一旦成了主流,那么普通人编程 也将成为主流。现在用 ai 去编程,其实大多数还是程序员,而一旦项目制被废掉了之后,变成日抛制了,那么就是普通人用 ai 编程 成为主流的时候,这是我的观点,你们觉得呢?所以日抛型的这种代码执行, 我觉得会越来越成为主流,而这种能力将会让 ai 编程这件事情将会突破界限,不只是说程序员或者是稍微懂点代码的这些人,而是真正的普通人也会用得上。 应该下半年,最迟明年,那么一旦这个实现了, 那些什么中台啊,项目架构啊等等这些都会废掉,那么随着时间的推移,那么软件没了,那么软件工程师也就没了。 就像以前搞电脑的人, 他是打五笔的,有打字员这么一个角色,你会打五笔,那可是很吃香的,对吧?在那个在九十年代,那个时候,我在零几年的时候,我在零, 我在零几年的时候还接触过,还要学五笔,但是我学不会啊,我怎么学都学不会什么? 我也不知道什么什么根了,词根还是什么偏旁还是什么乱七八糟的,反正我不会,我学也学不会,但是很幸运的是没多久就学拼音了, 那以前真的打字都是一门高级活,但现在人人都会打字,同样的道理, 你现在程序员通过 ai 去写代码,你其实已经把大脑大脑交给 ai 了,这个你不用去争辩了,反正我的大脑已经交给 ai 了,所以我们其实就是叫做 打字程序员,提需求的程序员,那当这种项目制的再进一步解构掉,变成日抛制的,那你这个打资源,程序员打资源也不值钱,对吧?人人都能够去跑代码, 这个这个很快的,真的很快的,所以 时代将会在你还没做好准备的时候,他就已经来了。最惨的就是现在还在大学里面的 计算机的专业的学生,我一直在强调你们得不要一直沉浸在 就是传统的计算机的那些东西,那些真的没有,没有太大的意义,你们一定要利用 ai, 利用自己的学习能力赶紧动起来,就是驾驭 ai 去探索更高维度的东西, 去研究更高维度的课题,也好去开始去。为了避免你日后送外卖送快递, 还有开出租车,你得做更早的打算,你得去搞流量,你得去完成自己的交易闭环, 做就是实现自己的业务交易闭环,这个非常重要,如果你现在还没有意识到这件事情的话,等到你毕业的时候 那会非常的严峻,因为你毕业的时候不会有计算机招聘这件事情,这个事情虽然不能抬到明面上来说主流的他肯定不会承认这件事情,但是 你等到今年九月份秋招,你就知道他不会有岗位的, 所以动起来。好吧,加油吧,拜拜。

今天 codex 发新版本了啊,就是这个版本有几个功能更新特别好用,我挨个挨个的给大家演示一下。第一个就是它可以自动截图了,比如我们在抠屏的时候,这是一个页面里面有些 bug 要修改,以前可能我们需要手动截图,然后把图片传上去,现在很 简单,两个 cmd 键啊,还是在 mac 电脑上面看,没有就直接截图,我们看一下自动截图,而且它不仅仅是截图啊,不仅仅是你看到的东西。看这个查看文本,还可以把这个页面背后的参数,组建的属性尺寸, 就这个页面背后的信息都可以给你捕捉下来。基于这个你再让它去修改一个什么 bug, 它的理解能力就会非常强,就除了页面展现的问题之外,背后的逻辑都可以给你读出来。基于这个再给你去修改好。这个是截图的功能,两个 command 键一起按自动截图, 然后直接发送你的需求。第二个很好用功能呢,就是前端编辑功能,正好最近六叔用他在写一个封面生成器,直接点击这个前端的页面,在他自带的浏览器里面做一个预览啊。比如这个页面我要修改一些布局文字或者一些排版,以前是靠对话跟他说清楚,现在直接选中好点评论,选择 直接在上面改,看到没有,改完之后,所见即所得,直接在上面生效,我们再来改这个按钮,把这个颜色我们改成一个绿色,选中,你看直接生效,然后在这个对话框里面就可以看到刚刚的一些改动,然后你主动输入,完成这些改动发送啊,最终他就会很精准的按照你的方式做一个修改,包括你的评论,你的批注, 你的团队成员都能够看到,也起到一个协助的功能。用这种方式去修改一些页面,那些 bug 是 不是纯靠口喷,要方便多的多好。这第二个功能所见即所得的 去修改你的网页的任何的问题。格式化的方式。第三个优化的功能啊,大家还记得之前它升级了一个什么版本?移动版本,你可以通过手机端去连接到电脑端,那有个问题,当你的电脑,比如说我的 mac 电脑,我锁屏了啊,这个时候我在外面我就连不上了。 为了解决大家这个问题呢,我们点击设置,这里有个电脑操控,把这个点开,输入你的电脑密码之后,你的 mac 锁屏的状态下,你也可以远程通过你的客户端去连接你的 codex。 我 觉得这个是非常好用的。最后一个功能啊,也非常好用,点这个加号,追求目标,选中适合这种连续性的、复杂性的任务,让它去跑。 比如帮我写一个用户注册的功能,并完成用力测试,在这个功能完成之前,用力测试完成之前,它是不会停的,它会一直的帮你去执行,哪怕一个小时,两个小时,中间你可以随时打开去查看它的一个进度,而且你还可以在这个过程当中不断的去加入你新的指令。如果你的任务比较长,需要多轮的迭代啊,步骤比较多, 耗时也比较长,建议大家可以开启这个购物模式,就是追求目标的模式。好了,以上这几个功能大家赶紧试一试,我持续丰富,你来体验过,拜了个拜。

我用了 superpowers 一 段时间之后,最大的感受它不是让 cortex 更快写代码,恰恰相反,它是在让 cortex 不要太快写代码。因为现在 ai coding 里一个常见的问题是,需求还没有澄清,边界还没有确认, 测试还没有想好, cortex 已经开始改文件了。小任务这样做还行,但一旦任务变复杂,这种直接开写的方式很容易出问题。所以这一期我们聊聊 superpowers 到底解决了什么问题。 先简单说一下 superpowers 是 什么,它不是一个单独的 skill, 而是一套给 coding agent 使用的软件开发方法论。在 codex 里面安装很简单,如果 是 codex c r i, 打开 plug ins, 搜索 superpowers, 选择安装就可以了。如果是桌面版的 app, 在 侧边栏 plug ins 或者是那个插件里面找到 superpowers, 点加号安装就可以了。 插件我找到 superpowers 点安装就可以了,因为我已经装过了,所以这边不是加号了。装好之后,它就会作为一组 skills 在 cortex 里面使用。这也是我觉得它很适合 cortex 的 地方。它不是让你每次手动复制一堆 prompt, 而是把一套软件工程流程变成 cortex 可以 按需使用的 skills。 我 理解 superpowers 的 核心就是把 ai coding 拆成 七个顺序执行的步骤。第一步就是头脑风暴,在写代码之前先澄清需求,探索方案,确认边界。第二步就是创建独立工作区,不要直接在当前工作区里乱改, 而是创造一个更安全的独立开发环境。第三步是写实施计划,把任务拆成小步骤,明确要改哪些文件,怎么实现,怎么验证。第四步是指代理开发, 把具体任务交给 subdivision 去执行,让主流程可以更清楚的组织和检查。第五步是 tdd 测试,驱动开发,先考虑怎么证明它是对的,再写实现,而不是先写一堆代码再说。第六步是代码审查,改完不是马上说完成,而是让另一个审查视角检查问题。 第七步是完成分支,最后做验证,收尾、合并或保留分支。所以它的流程不是需求到写代码,而是这一套头脑风暴,到独立工作区域,到实施计划,到代理开发,到 t d d, 到代码审查,再到完成分支,每一步都是一个独立的 skill。 这就是 superpowers 最核心的地方,它把软件工程流程拆成了 ai 可以 执行的一组 skills。 我在 codex 里用下来,感觉它是比较无缝的,尤其是装成插件之后,它不像一个你每次都需要手动调用的命令集合, 更像是给 codex 加了一套开发习惯。比如需求不清楚的时候, codex 会先倾向进头脑风暴,先问问题,探讨边界,确认需求,而不是直接开始改代码。准备实现之前,它会更容易进 writing plans, 设计代码质量时,它会提醒 pdd review 和验证。这就是我觉得就 pos 很 有价值的地方,不是每次靠你提醒 cortex 守流程,而是让 cortex 默认更容易按照工程流程工作。这里也放一个 sdd 的 背景在里面, s d d, 也就是 spec driven development。 规范驱动开发,它的核心思想是不要一上来就写代码,而是先把要做什么说清楚,比如 open spec, 它更偏规范管理,它关注的是把需求变更约定整理成可维护的规范。 spec kit 更偏规范驱动开发流程,它通常会通过一组命令模板,引导 ai 从 需求深层规范计划任务再去实现。而 superpowers 更偏工程纪律和 skills 集合。所以我会这样理解, s d d 解决的是先要把做什么想清楚, superpowers 解决的是做的过程中怎么守流程。最后说一个大家可能关心的问题, token 消耗,而我自己用下来。 superpowers 在 cortex 里的题感是比较轻的,因为它不是每次 都把一大堆规范文档塞进上下文,而是通过一个个 skill 在 需要的时候触发对应流程。当然,它也会消耗 token 头脑风暴,它要讨论需求, writing plans 要写生成计划 review 要读取代码和分析问题, 都不是免费的,但它的消耗更像是按阶段按 skill 触发。而 openstack 和 stackkit 这类的 sdd 工具通常会生成更多的规范计划任务文档,好处呢是结构更完整,坏处是文档越多,后续带入上下文的 token 压力也可能更大。我 之前看到 speckey 的 社区里面有人反馈过类似的问题,有依据里估算,在 cloud code 里,一组 speckey 个 months 可能占用大约十八点六 k 的 tokens, 在 codex c i 的 上下文窗口里面大概占百分之七到百分之十。这个不是官方的 benchmark, 但它说明一件事,流程工具本身也有上下文成本。所以我的判断是, opens back backit 更适合强规范、强文档、强交付约束的任务。 superpowers 更适合日常 ai coding, 因为它更像一层工程流程约束 动成本更低,体感也更自然。所以这一期的结论是, superpowers 不是 给 ai 加超能力,而是给 ai 加工程纪律。它解决的不是 ai 不 会写代码,而是 ai 太容易跳过软件工程流程模型提供能力, superpowers 提供纪律。 下来几期我们会继续拆开看。为什么先要头脑风暴?为什么要写 plans? 为什么 ai 写代码需要 pdd? 以及为什么 ai 也需要 code review? 下一期我们继续。

ok, 重头戏来了,这一期主要给大家讲一下怎么使用 codex 和其他工程软件连接,然后完成一些工作。首先的话是 thirdworks, 我 们可以看一下它的工作流,可以看出 thirdworks 不 需要接 mcp 的, 它是会调用 thirdworks com 口,然后通过 vbs 脚本进行建模。也就是说我们只需要给它工程图或者描述我们自己的需求就行, 它自己也能打开 thirdworks, 但是我们自己打开的话会省很多启动时间。第二个的话去 matelab, 我 们看一下它的工作流, matelive 也不需要接 m c p, 我 们也只需要描述自己的需求就行。第三个的话就是 ency, ency 是 需要接 m c p 的, 但是我们可以让他自己接好,就是我们给他说一下,给 ency 接一下 m c p 就 行, 他就会自己接好。接好 m c p 之后,我们就可以通过脚本仿真求解了。当然以上这些操作,包括想要达到我在视频中展示的一键全自动生成,都是给他开放的完全访问权限不, 如果开放这个完全访权限也有一定的风险,大家可以根据自己的需求选择开不开。呃,当然也可以开这个默认权限或者是自动审查,这样的话他会在一些关键操作的时候征求你的同意,就很安全了。或者我们让他在指定文件夹工作,这样的话也很安全。

一定要一定要想方设法用上 codex! 如果你还没有听过 codex 或者克拉 code, 那 么恭喜你啊,这段视频有可能会打开新的机会。什么是 codex? 很多人只知道它和编程有关,却忽略了它背后巨大的 ai 时代价值。 英伟达十分重视这类智能工具,业内大佬都在率先使用 codex 提升整体效率。当下 ai 行业快速升温, codex 更是当下极具发展潜力的前沿智能工具。 普通人都想用顶级大模型和智能体去卡。在了注册繁琐、网络受限,还花销偏高。而酷 max 完美避开了这些麻烦, 上手特别简单,注册下载,调好网络,直接问他能为你带来什么帮助,把自身需求全盘告诉他就可以了。做自媒体的朋友,直接收听自己日常剪辑文案,解脚本内容,让他帮忙出思路。大框架上班族梳理日常办公流程,让他帮忙精简步骤,提升工作效率。 再叫年轻人更要尽早接触 codex, 借助优质 ai 工具提升自我,拓展发展路径,越早熟练用好 codex, 越早抢占新时代先机。

姐妹你要把握住,现在在谈论和使用 codex cloud code 的 男人,你自己也可以去研究,去沉浸式的体验,去想方设法的让这些 ai 软件帮你完成任何的事情。现在在用他们的男人啊,那绝对是眼界也好,格局也好,执行力也好,远超一些普通人的普通人还在谈论喝酒吃饭打麻将的时候, 他们已经在用他们的时间精力在做跟新时代连接的事情了,所以他们的思维是非常超前的,做事也 肯定高效。更重要的是就是面对新时代新事物的探索欲,这点很重要,因为人只有拥有了探索欲才会进步,他们骨子里一定藏着极强的进取心和认知高度。所以这样的男人我们要关注一下好不好,宝贝们。