你有没有这样的感受?有时候,我们一旦掌握了一种方法,就会下意识地用它去解释和解决所有问题。好像无论面对什么情况,脑海里浮现的始终都是那一套熟悉的思路。 这种现象在心理学中被称为铁锤人效应。它源自心理学家 abraham marshall 在 其著作 the psychology of science 中提出的一个观点, 当你手里只有一把锤子,你会把所有问题都看成钉子。从本质上来说,这是一种典型的认知偏差。也就是说,我们的大脑会过度依赖自己熟悉的工具、方法或者思维框架,从而忽略了问题本身的多样化。久而久之,我们看到的世界其实不再是客观的世界, 而是被自身能力结构过滤之后的版本。在现实生活中,这种现象非常普遍,比如有些程序员会觉得几乎所有问题都可以通过做一个系统来解决。 经济学背景的人习惯用激励机制去解释复杂的社会行为,而习惯理性分析的人,在面对情绪问题时,也往往试图通过讲道理来化解。再比如,在组织或企业中,当管理层长期依赖某一种手段,比如裁员或者成本压缩来应对问题, 就很容易陷入路径依赖,导致决策越来越单一,甚至陷入创新能力。那么,为什么我们会陷入这种铁拳人效应呢?从认知机制来看,原因主要有三个, 第一,大脑有节能的倾向,要用熟悉的思维路径比重新分析问题要省力的多。第二,过去的成功经验会被不断强化,当某种方法曾经有效,大脑就会默认它普遍有效。第三, 当一种方法以我们的身份认同绑定,比如我是理性的人,或我是控制力很强的人,我们就更难放弃这种工具。但问题在于,世界是复杂的,而工具是有限的。 如果我们始终只使用同一种方式,往往会误判问题,甚至把简单问题复杂化。因此,避免铁锤链效应,关键在于建立多元的思维方式。可以强习多问自己一句,这个问题真的适合用我现在的这把锤子吗?同时,有一习的扩展自己的工具箱,接触不同领域的机器和方法, 在重要决策中引入不同背景的人,从多角度进行判断,并且学会区分我擅长什么和这个问题需要什么。总结来说,铁锤人效应并不是能力不足,而恰恰是能力在不自觉中占据了我们的认知视野。一个人越专业,反而越需要警惕自己是不是只剩下了一把锤子。
粉丝129获赞3436

codex 太厉害了,给你们看一下啊,就是我跟他说我的需求啊,就是自动化生成图片,然后对应的 cds 二点零的分镜提示词,然后直接生成视频,你看这个流程,直接他就能帮我做了啊, 他先让我啊,登录授权我们这个呃节目的账号啊, 然后我登上去之后啊,他说让我确认,我说我的意思是用 image 二模型生成图片啊, 就是目前来说最强的生图模型,然后好,他用了 gpt 的 生成了这四张啊图片看,然后他就写好了这个完整的分镜提示词, 点进来看一下啊,我对他这一版其实是不是很满意啊,我就又上传了我的塑身形象和这个音频音色一起给他生产啊,他就直接啊添加进去后啊,升级后的,其实是看见没有啊, 他的运镜啊,他的音频音色,还有啊他的模型啊,比例, 分辨率描述,他都会一并成交,让我确认,确认之后,好,你看八分钟之后生成完成, 虽说非常的厉害。你看到这边我自己来剪一下。看这套新中式 主楼加旁边小院房,一进门就是双层挑空门厅气场一下就出来了,面宽十三米,进深十一米五,屋檐声带一亮,晚上比白天还好看。细节看这里,门厅线条,灯光,院子比例,这房子盖的讲究,老家准备建房的评论区打别墅,我把这套思路讲给你听, 怎么样,是不是非常的厉害,就是现在哦,如果说你还没有体验过这种 and just give 就是 这种自动化的啊, 模型就真的是,呃,你现在所有的工作方式都可以通过它给你复制出来了,不信你你问一问他,他都能给你复制出来, 真的。所以如果你还没有体验过的可以好在评论区啊,打个一啊,或者说想体验我会教你怎么去做。我真的想在 ai 时代啊他们大家一起无限进步啊。

那本期给大家分享一下我是如何用 codex 实现用 ai 来去做一个账号自动化运营的这个过程。除了录视频这个事情以外,那其实还有很多的 运营的一些琐碎的事情,比如说我要去看我的账号数据,视频录完了我还要写封面标题等等,这些琐碎的工作其实很多,它不是光是录制一个这么简单的事情, 现在我的流程是可以这么做的。我现在是用 ai 的 这个 computer use 这个功能,直接去我的创作者中心帮我去把所有的账号拉出来,在本地上分析,分析完以后它会沉淀出几个特定的文档,这个文档呢就是我的这个 粉丝的文档,账号定位的文档,内容策略的文档。那基于这几个文档, ai 就 会去读取了这几个固定的文档以后,去帮我搜索相关的同行的一些对标的文档以后,去帮我搜索相关的内容, ai 就 会一个一个介绍一下。 每一次我视频拍完结束以后导出字幕,它就可以基于我的这套方法论,帮我批量的自动化的把我的视频的封面标题、描述标签全部搞出来。那也就说现在的主要是它在于你 内容我们已经拍摄好以后的那些环节,那内容的生产前面还是主要是由你自己来想的,不是内容生产前面数据分析它会给我选 dj, 它会跟根据你的账号定位去帮我们来看一下实际的效果就好。那你看 在这里我跟他讲我用了那个 codex 里面 computer use, 他 可以操纵我的浏览器嘛?然后去访问我的这些账户,我让他去分析一下,呃,跟我相关的一些对标账号,然后他是优先读取了我四个 m d 的 文档,嗯,这个文档里面是有我的粉丝画像的,呃,有我的所有的账号的策略定位,我的爆款的复盘, 以及我的选题方向的这几个定位,这是我之前就会有一个引导对话,我这边就跟他讲,我说我发现这些内容太过时了, 你要去重新帮我把这些内容梳理出来,他本来已经准备在做了,最后发现他读的内容太旧了,你就改了他的方向。对,我先去帮你更新你的这些账号定位,对,我要去更新,这个时候我就跟他说,我说你去读去账号吧,你看他在这里面先读了五十一条小红书的内容, 又去读了所有抖音的数据内容,那小红书的所有的明细,然后抖音的所有明细他自己全部读完了以后存在本地,基于这些内容 他开始来做重要的判断,他这几个判断内容是自己判断的,还是你给他自己判断?他根据我的数据分析了我的账号内容,爆款的内容梳理出来的, 那他总结了以后,我说好,那你居然已经调研完了。我说你去把我之前的粉丝画像,账号策略,你去更新一轮,他就叭叭叭叭叭叭更新了一轮最新的内容,所以这是他最后给我的一批我的一些材料,基于这些材料以后,他才会帮我去做这件事情,根据我账号的策略定位, 去帮我寻找跟我匹配的账号的数据。好,注意到小细节,这边这个选题推荐这个 skill 是 你自己写的还是你外面找一个?是我跟他之前合作沟通出来,就是你刚才这生成的一些整套 skill 形容一个,对,是的, 这个里面他就会拿了我很拿到了很多的标题数据。嗯,然后他就给出了所有我这个像内容的爆款的一些封面的建议,然后包括他还给我了一些我能做的选举的建议,都是爆款的选举建议。嗯,好。然后这些内容我跟他讲,我说你要去思考一下你怎么样去更新到现有的 skills 里面。对, 你看他就告诉我直接可以写进 skills 里面的一些规则。好,然后我们看一下我怎么使用的。嗯,然后当我这边输入案例包装,它就自动去调用我的 skills, 然后它的 skills 都是关联在一起的,然后当我把我的字幕给他以后,它就会自动唤起它的一个写作的一个 skills, 然后来去把我这个整个包装发布的内容给它写出来啊,包括标签,包括里面的封面。然后呢?有了封面以后,这个时候他会说他去调用封面 skills 来处理这个图,他就做了好多,你俩玩起来啊,然后他就做了很多不同的图,它还会自动去生成, 因为我还有别的平台,所以它就会生成不同尺寸的图片,你看生成各种尺寸的这个图片给我,生成完了以后,它其实是标题描述标签都是有的,我直接复制就结束了。对,这就是一个全的流程,其实这套方法论 就是最重要的,其实它是不断进化,不断迭代之后。现在不是有那个 codex, 不是 有那个定时功能吗?比如说每个礼拜五去 check 我 所有的视频数据,然后去自动化更新我的相关的一些策略。写作啊,对,写作 skill 更更新过去以后,我每次用到都是新的,就它可以跟着我的账号一同成长,我觉得这个是很牛的。然后再比如说你看这这次的内容生成完了以后,我发现有些过程是可以调优的啊,这个时候我就跟让它去 思思考一下他学到了哪些经验,然后将这些经验告诉我,然后我来判断这哪些经验可以沉淀为 skills, 然后这样的话他下一次就不需要我再教他了,你看他会整理出一批,然后呢?我确认过了以后,他会说他更新了 skills, 他 整理了哪一节步骤,所以我的 skills 是 越来越能够符合我的要求的, 而且再加上 image two 这个深普能力来了以后,封面指出的概率非常高了,我几乎很少去调了。那现在你的就是整个工作流程里面,哪些是 ai 帮你做,哪些还需要你人来做?呃,现在目前我在坚持真人拍摄,然后包括其实选集主要还是我们自己来,就是视频剪辑完了以后,我们直接字幕出来了以后, 视频的封面啊,描述、包装、标签,各个平台的封面的差异,全部都是 ai 在 做的啊,你就露了一个前面就是拍摄前面的啊,就说选题的大纲的准备,嗯,对,选举其实我们自己在准备,但是选题大纲我们会让它来梳理 一下。对,其实我先把我自己,因为我们有的时候内容会需要很多配套的一些材料,比如说我今天要讲 q d s, 嗯, q d s 背后很多一些功能背景,它会帮我收集很多资料。准备好或者这样子,然后呢继续接资料,然后一个大纲, 然后呢?大纲我确认好后再去输出一个 ppt 大 纲, ppt 大 纲里每一页需要画什么,嗯,然后时候再用,再用 ppt skill, 它会帮我做 ppt, ok, 这样子。 嗯,所以这是我们拍摄之前的一些准备。对,其实下次我们可以分享一下拍摄前的一些内容准备,对,这个是我们拍摄完以后数据输出,对,运营数据输出盘,对对对,是,然后最后一个想讲的就是我的整套方法论并不能让我的所有的内容都成为爆款, 是因为去不断地才根据我现有的数据去给我提供建议,也就说他其实是跟我一起成长的。嗯,所以他并不能让我一个 偏账号小白的人立刻成为一个每天爆款的大牛,他只是能不断地基于我现在的重复工作帮我去减少跟我的工作量,就是他没办法取代你的经验。对,他也可以取代你的流程。对,是的,所以他不能让我立刻就变成一个大牛啊。对, ai, 现在时代就是这样,就是成为你能力的杠杆。 对,他是我能力的最上限,所以这个就是我们今天想要分享的,然后包括这一期准备了哪些 skills, 到时候我会变成一个文件,然后放在我们的那个群文件里,大家可以去参考一下。好,那本期视频就这样,拜拜。

今天视频只讲一件事情,如何从零到一,安装 codex, 同时一句话生成一个好看的网页。大家好,我是 fred, 一个纯小白,学习 web coding, 帮助自己和团队提效的百分之五十以上,我希望将我过往踩过的坑全部分享给你。 首先我们第一步的话需要打开 openstack 这个 codex 的 网页啊,大家可以通过基于自己的版本去下载,比如说 macos, 然后下载完了之后呢,就会进入到这样一个看起来像聊天框的这样一个对话。然后首先我们需要做的第一步是需要打开一个项目文件夹, 什么叫文件夹?其实你桌面上的任意的文件夹都都是那是一样的。然后这个时候我们比如说创建一个叫 test 的 一的文件夹, ok, 然后我们通过把这个 test 一 打开,打开了之后呢,这里面你就可以跟 chatbox 有 点类似,你通过自然语言去跟它沟通就 ok 了。但是我们需要注意的是,这里面会有个权限的问题啊,我个人会比较喜欢去可能打开这个完全呃访问的权限, 然后同时呢这边可以去选择你的速度啊和模型,比如说正常呃,比如说我们今天要做的第一件事情就一句话,生成一个网页,就可以用一个呃中模型就 ok 了。好吧,帮我参考 apple apple 的 风格,生成一个 html 网页, 然后发给他就 ok 了啊,是不是很简单?然后下一步趁着他在深层的这个时间,我可以给大家一个一个去介绍一下整个 codex 的 界面。 首先我们这边就可以有个新对话,然后呃如果你是正常在这个项目文件夹里面,他新对话也是在这个项目文件夹,如果你是一个新的项目,可以重新再新开一个项目, 然后这边呢你可以添加你的呃,比如说图片或者文件,同时这里面也可以用计划模式,尤其是新手,我会推荐用计划模式,因为它会跟你去沟通,把这个需求澄清的更清楚,那是 后面的落地会更加的完整一些。同时这里面去可以去选择一些插件,比如说 browser use 这种,可以去呃看到你前端的效果, 那这里刚刚已经讲过呢,你可以选择对应的思考的呃深度,比如说如果是一些大型的项目,你可以选择高或者超高,那同时这里面可以选择不同模型。 gpd 五点五刚发布,然后 gpd 五点四已经一段时间,其实速度和质量也还都不错,大家可以呃基于自己的 考虑去选择,毕竟 gpd 五点五消耗的额度是五点四的两倍。同时这里面你也可以选择更改它的速度,如果是标准就是正常的速度,正常的消耗额度, 如果是快速的话,像 g b d 五点五是一点五倍的速率,但是它消耗的额度是二点五倍,然后 g b d 五点四是二点两倍。 然后同时右侧这边的话,我们可以看到这里可以打开你刚刚创建的文件夹里面的内容,因为我本身是有配置一些 r harness, 包括一些呃全局的东西,所以它每进入一个文件夹,它就会创建一些模板,比如 agent m d m d, 每当它完成一些东西,它会在这上面去更新, 同时这边就是去这个按钮,就是去看对应文件的一些内容,如果不想看可以点击,然后这边会有一些像 open i 自制的一些插件或者一些 skills, 大家可以按照自己的需求去呃更新啊,或者说去下载。那当然这里也可以创建你自己的插件和 skills, 然后同时这边我们可以去打开我们后台的设置,里面可以看到你一些配置的一些建议, 然后以及个性化的一些建议,同时一些外观的建议大家可以基于自己的啊场景去使用,但同时这边有啊浏览器的使用和 computer use, 尤其是这个 computer use 在 目前而言我觉得已经非常非常好用的,可以去操控你的电脑的应用,去帮你去做一些事情。同时这里可以看到你一些规党的对话, 然后这里面可以看到你的额度,比如说 fred, 我 开的是两百美金的 pro 的 账号,现在已经用了。 呃,这七天的额度已经用了百分之九十一了,因为 open ui 就 在昨天又重新重置了额度,然后五小时的额度已经用了百分之五十四呢,所以大家可以在这里看到你的整体的用量。 ok, 我 们回到刚刚的呃兑换,大家你可以看到大概花了一分四十八秒的时间,然后这里面就生成了一个网页。 ok, 我 们可以通过这边去打开 啊,大家可以看到就整体的网页的风格确实是跟苹果非常非常类似的,而这就是我们通过一句话让他生成的一个结果, 所以说不管怎么样,只要大家安装了 codex 以及开始跟他沟通,那我觉得就是第一步,后面我也会持续去分享,不管是使用 qq 还 还是使用 codex 遇到的一些坑和能实现的一些呃功能和帮助大家提效的一个工具,这就是今天的分享,我们下期再见。

推荐所有刚刚 codex 的 朋友啊,都去跑下这个任务,告诉 codex 你 是谁,你的工作是什么?职业是什么?你在工作当中有哪些非常烦的点?有哪些重复性的工作?你最不舒坦的流程是哪些?最后让 codex 帮你梳理一份它可以帮助你去完成的十项任务清单。 跑完这个任务了之后,你会非常清楚 codex 究竟能帮你在工作当中完成哪些事情和任务,推荐你去跑它。

自动化,选品自动化上架这件事情已经跑通了啊,通过 qq 点个四开发的,我们现在双击启动程序,好,它开始会自动打开网页,打开我们的网页抖店以后,我把它缩小一下 移过来。好,紧接着等它自动登录用完了以后,我们在这里点击一个确定说明,我告诉他我已经登录了,接着什么都不要动,我们 等待一下,全程手没动,我离得很远,大家可以看效果,他开始操作了。好,第一步,他进入选品广场,然后选择我们这个店铺需要的类型,比如说我选择的是五金工具的, 他就会选择这个类目。选择好这个类目的产品商品以后呢,紧接着他会去按照我们要求,比如说好评率百分之八十五以上,不单带货率百分之十以上,下单转化率百分之二十以上。类似这个 选品的逻辑和规则,只要我给到他,他就按照我们的选品规则在帮我们选品,选品没有达到要求以后,他就会退出, 重新再选品,你看这里不达标,看到没不达标,他就会跳过,继续回到选品广场, 继续帮我们打开另外一个产品,继续去选品。总之他会实现自动化,我们坐在这里什么都不要做。那假设你这个电脑专门帮你选品,那个电脑专门帮你上架, 另外的电脑专门帮你去投铅汞,那整套流程就不是,是不是就实现了自动化啊? 因为你在某个区域,某个类目,你想人工检查一下,你认为非常重要,对吧?我必须要人去审核一下,你再经过这下一步,那也是可以的,但是那人的效率是不是大大提升了? 以前一个人干一件事、两件事,那现在有了这个自动化, one two three, 你 是不是可以干一件事,两件事、四件事,甚至五件事?这就是我们 codex 开发出来的自动化选品系统,非常好用。

codex 的 安装教程往上一搜一大把,想看基础安装的朋友可以直接往后滑。今天咱们重点来讲 codex 加加, 这是一款开源插件,安装之后能让 codex 焕然一新。首先软件不用登录下载,安装简单配置就能直接使用,像动画制作工具 hyperframe 也能在 codex 里直接调用, 它的安装方法特别简单。打开 github, 搜索 codex 加加,下载并安装,插件会自动识别已装好的 codex, 全部安装完成,配置好对应的 a p i 就 可以上手使用了。下面进入详细安装教学。第一步,打开浏览器搜索 codex, 进入微软商店下载并安装, 安装完成后就会弹出 codex 界面,这个时候不用管它,我们继续。第二步,打开 github, 搜索 codex 加加,找到对应仓库下载文件,双击进行安装。 第三步,安装完成后,打开 codex 加加管理工具,点击配置,添加供应商,写上对应的供应商名字,方便后期管理。接入模式,选择纯 api, 我们接入 deep seek 协议,选择 chat completion, 然后我们去到 deep seek 官网,选择创建 api key, 创建 api key 名字随便,然后复制 api key 粘贴到配置里,接着选择接口文档,选择 base 下划线 u r o 这个地址,复制粘贴到配置项,然后保存,然后起用这个 api 设置,我们就可以在右上角重启 code 了。 在启动 codex 的 过程中,可能会出现等待时间过久等问题,可以耐心等待,如果等待时间过长,可以重启 codex, 多尝试几次一般都会成功。 如果进入到画面跟我是一样看不清字的,可以跟我一样设置,这可能是系统版本原因导致的兼容性问题,不过没关系,调整一下就可以。 设置完成后我们就可以返回对话窗口和 corex 里的 deepsea 沟通了,同时也解锁了插件,大家可以按需使用各类插件。这期内容就到这里,我们再见。

全部给我去用扣袋子,太香了。我昨天研究到凌晨四点搞我那个电商的全自动化商品工具,就自动选品,自动采集自动商家,包括自动合价。我给你们看一下我的进度, 目前是已经完成差不多五分之一了吧。选品自动商家,话不多说,我给你们演示一下吧,好吧。 然后上架时间跳一个月内,一个月内商家的新品,然后点一下来,自动跳到对应的,对吧选品工具,然后筛一个月啊,自动筛,然后自动 获取,比如第一页这二十个所有的产品主图,加上商品 id, 看,现在正在跑了,已经看到没在跑,在跑了,自己在跑。来,我们点一下, 你看一下扣带子界面就很简单,对话就行了,你会提词就可以了,全程不需要自己懂代码,不需要自己写,他帮你写好,帮你做个网页出来。 等一下,因为这一页的话有二十个屏,我们等下把这二十个屏跑完。好吧,我现在是全程没动,我没动鼠标的,你看没自己来跑的。 ok, 搞定,看一下来,现在没有数据吗?对吧?好了,刷新一下,看到没?出来了,呃,产品的品名缩写了对吧?标题以及主图一张,对吧?为什么只需要主图?因为后面会拿这个品去 幺六八八去识别,找同款链接,然后来比价,来筛侵权,来改图, ai 改图,然后再来去用妙手来去,对吧?上架去发布, 所以现在只完成了五分之一,所以只需要主图,然后对应的啊,比如上面 id, 我 点一下,点击之后自动跳转到这个平台,自动输入这个商品 id, 自动搜索,自动到对应这个产品链接,就如果你们想看的话点一下对吧?你看信息有了吗?对不对?比如说 想不想听啊?这是它工具自带的,只说你正常的话你得手动输在 id, 还还那啥自动啊,自动化了回来有人说你这个工具对吧?它本来就自带可以上架的呀,为什么说还要做这个东西呢? 因为听好了。举个例子,我们 y r 选品的话,不光是从,比如不光是从云集看,我们还会看 t k 的 数据,看亚马逊的数据,看店铺前端的数据,看什么各种数据,所以 如果云起这个工具他只是一个来源而已,懂 𠲎? 应该干过,应该懂我意思吧,所以全资的话,对 𠲎。

hello, 大家好,今天是 fred 带你从零到一学习 web coding 的 第六天,今天我带大家开始实操零基础,用 codex 做出第一个你能打开的网页的应用。 很多人学习 ai 的 编程啊,第一天就会卡在比如说像 a p p, kine 插件这些名称上,其实对于新手小白而言,最重要的先跑同一个结果, codex 确实有很多的入口, codex a p p, 对 吧? codex 的 id 的 插件以后呢还会遇到其他的一些名称, 你今天只需要选到一个入口,就是 codex a p p 啊,总原因很简单,就是它最适合去建立一个新手的手感,你能够看到当前的项目,看到文件的变化,你也比较容易判断一些结果到底有没有出来。我们开始之前呢,需要可以先建一个空的文件夹, 然后但是在这里面注意不要放一些隐私或者一些密,要先做一些低风险的东西啊,比如说我们先建立的一个 test 的 这个二文件夹, ok, 然后我们在这里呃去创建新的文件夹,或者使用你已有的文件夹就 ok 了,然后这里面就可以跟他去进行一个沟通,比如说你好,那他就会去做回复。那我们第一件事情呢,就是比如说 就直接用一条 prom 给他一个任务啊,这个时候不是说去问他一些概念,或者需要有一些明确的产物,有页面的元素,或者有验收标准啊,比如说就叫这个名字啊,帮我做一个 ai 的 学习的网站,然后有任务清单,有标题,有呃,任务啊,手机上也好看, ok, 我 们就把这个任务发给他,然后大家可以看到他处理大概三分钟的时间,然后他先看的项目的前端 啊,没有前端框架,然后就会生成一个独立的 html, 然后最终生成一个 html, 就 到这里啊,大家就可以看到整一个是它马上快速生成的一个 html 界面,我们同时也可以通过这个你去打开啊, 这就已经完全呃就已经快速生成好了,那我们下一步呢?呃,你可以看到它除了不只是聊天啊,还会看目录,对吧?列计划,然后最终给到你结果, 然后同时我们也能够看到他改的什么东西,就像我们刚刚看到他实际上是改了一个 html 的 这个网页,对吧? ok, 然后下一步的话,我们也能够看到他的标题任务按钮,包括这种手机的这个尺寸啊,就相当于我们这个是一个电脑端,对吧?我们也可以看手机端 啊,这就是一个模拟 iphone 手机端的一个效果,其实也还是不错啊,通过一句话这种生成,我觉得效果都还蛮不错的啊。 然后下一步我们只需要改一件事情,比如说刚刚啊这个按钮啊,就是我觉得他没有一个添加任务的按钮,所以说我跟他说,哎,帮我新增一个功能,可以添加任务的清单,那我们再去点击他,你就可以看到这里面有个添加任务,比如说学习 ai, ok, 他 就可以把这个任务给呃添加进去,同时你点击还可以呃下一步去把它删掉啊, 所以说就是这么简单啊,我们就通过一句话让他去生成一个网页,同时你可以继续持续去迭代和调整。 然后呢我需要给大家呃需需要注意的啊,就是第一天你不要去开一些很大的权限啊,怎么去开权限呢?我也可以这里去给你快速讲一讲啊,比如说这里面我是开的这个完全访问权限,因为他只有 这个文件内容,对吧?但对于大家而言,可能第一天可以先用默认权限或者自动审查的权限,然后当你 呃持续熟悉之后,然后再用一些完全访问的权限,那这样可能效果会更好一些啊。 ok, 然后呢?最后最后啊,其实大家可以看到,我们这节课你只需要完成五件事情,也是打开酷币 app, 建一个空的文件夹,发出第一条网页的 prompt 任务,可以看它改了哪些文件,然后再打开网页的验收。 做到这里,你就不只是会跟 ai 去聊天,而是第一次让 ai 帮你交付你一个可以打开的结果。 ok, 下一期我们再讲怎么把第一条 prompt 写得更加的稳定,让它的输出质量更好。 ok, 我是 fred, 我 们下一期再见。

用 codex 自动剪视频,效果真的很惊艳。你现在看到这条视频,就是用 hyperframes 做出来的。方法其实很简单,把写好的文案发给 codex, 然后艾特 hyperframes, 接着告诉他 帮我把这段文案做成一条视频,合适的地方可以生成真实感 ai 图片,如果你有录屏,也可以直接放进画面里。 codex 会先理解文案,再拆成适合视频表达的镜头,他会判断哪里用图片, 哪里用实录画面。 hyperframes 负责把标题、字幕、图片、录屏和转场组织起来。于是你得到的不是几个素材拼接,而是一条有节奏、有画面、有配音的视频。最关键的是,这个流程可以附用。下一次你只要换一段文案, codex 就 能继续按这套方式生成新视频。 真正省时间的地方是从第二条开始。你不用每次都重新想结构,重新找素材,重新剪节奏,先把表达讲清楚,剩下的交给流程。

以前很多人喜欢调侃说 open ai 啊,应该叫做 close ai, 说简单点就是 open ai 总是喜欢把一些关键性的东西啊握在自己手里面,对外的开放程度非常不高。 最近他做的一个动作,我觉得大家可能需要用新的眼光来看他了。一直被认为不那么 open 的 open ai 最近做了一件非常 open 的 事情,他把 agent 非常关键的一层能力往外打开了一部分, 它把 ai 真正干活时的工作方式系统性地开放出来了。 open ai 在 四月十五日发布的新版的 agent sdk 里面,明确新增了更强的 hash 和原生的沙箱执行环境,而且开发者可以自带 sandbox, 也可以使用官方内建支持的多家第三方的 provider。 我 们看一下官方的博客怎么说的, 他说更新后的 agent sdk 可以 帮助开发人员在受控的沙箱环境中检查文件、 运行命令、编辑代码,并且处理长期的任务。这句话翻译成人话,其实就是说以前 openai 主要是在卖它的模型能力,一个最强的大脑, 这次他开始把这个大脑怎么进办公室,怎么拿文件,怎么用电脑,怎么把活干完的这一整套工作方法也对外开放。他这里讲的是 s d k 的 又一代的进化方向,我觉得在这个里面啊, s d k 的 升级不是最重要的, 核心还是在于它的 open。 为什么说它 open 呢?因为啊,它明明可以把整个的执行环境锁在自己手里面,如果说它是完全封闭的思路的话,它就可以说你要用我这套的 agent 的 harness, 就 必须跑在我指定的托管环境里面, 但是它没有这么做,它是说给你一套更加成熟的 agent 工作框架,给你原生的 sandbox, 给你 harness, 但是你是可以自己选 provider 的, 也可以自带你的沙箱。你看它这里列出了七家的 provider, 有 大家比较熟悉的 versa, moda, 这些都是可以用的。而且看到这里啊,它这里说 sdk 呢,还专门引入了一个叫做 manifest abstraction, 就是 清单抽象层。这个呢,有一点像 agent 的 工作手册,有了这个 manifest, 新的 agent 可以 在这个框架下更好地运行这个文件,你可以理解它能够让你更好地切换这样不同地 provide 它的不同的。这个 workspace 可以更方便地迁移移植,开发者就可以更好地挂在本地文件去定义输出的目录。而且他这里还说了,开发者能够从 a w s, 谷歌云的存储等等地方去拉取历史的文件,提供了一个非常好的机制, 就是开发者在这个工作空间里面可以很明确地知道在哪里输入,在哪里输出,怎么去运行,这一点非常的重要。实际上它意味着说你不一定必须要用我整套的云服务,它更像是说我把整个的 agent 的 工作方法 开放给你,但是你的执行环境,你的云,你的 provide 不 一定是我的,这个就是它第一个非常 open 的 地方。 第二个它很 open 的 地方是它不只是开放接口,而且开放经验。前面才没过多久, antropic 把第三方的 agent 的 接口全部封了,但是 open ai 走的是 open 的 路线,大家看官网是怎么表达的。它是这样说, 它现在开放的这个 agent s d k 的 框架,它是 kind of like life assistant tools, 这个 s d k 里面它包含了类似 context 的 文件系统工具。我是这么理解的, open ai 正在把 context 里面已经跑出来的那套 ai 工作方式往外抽象,这意味着什么?这意味着 open ai 这一次开放的 s d k, 它的所有的 agent 的 harness 框架是在 codex 这个干活的样板间里面跑过的,就像这个图右边这样子表达的,怎么去处理这个工作空间? workspace 怎么去接文件的?系统 怎么调? shell 怎么做状态的恢复?怎么把任务持续地推进?而现在它是把这一套已经验证过的方法 抽象为一个通用的底座,把它作为一个通用的能力的底座接口,开放给开发者。它这次开放的不是代码能力,而是在它最近这一段时间在 codex 练出来的一整套 ai 的 工作范式,是最近非常热门的点,大家一直在聊各种 computer use, 各种执行能力,各种数字员工,其实 open ai 这一次的升级就是围绕这个展开的, 怎么让 agent 进入一个真正的工作空间?工作场景这里有文件、有依赖、有命令、有目录、有快照、有中断、有恢复。 在这个工作空间里面, agent 能够怎么样读写文件,安装依赖运行代码安全的使用空间,即使中间中断了,那容器也不能丢,工作还能够恢复。其实就是在回答 open call 出来以后,大家非常关注的一个问题,就是 ai 怎么像一个真正能够持续干活的数字员工?这次 openai 开放的内容其实就是似曾一个更强的哈尼斯,大家能想到的 agent 框架的那些内容。 第二个就是一个原生的沙箱执行的环境,这个东西实际上就有一点像 ai 数字员工的工位, 它能不能够在这个数控的环境里面去完成所有的企业交给他的任务。第三个是 workspace, 还有 manifest, 就是 它的整个的工作规范,包括哪些文件你是能看的,哪些目录是你负责写的,数据从哪里来,数据又回到哪里去? 第四层是把 hash 和 compute 分 开,这一点看上去没那么重要,但是其实在企业端非常的关注, 就是我的运行测试环境可以挂,但是我的数据必须保持完整,你可以帮我干活,但是你不能把我内部的数据泄露出去, 甚至你这个活干不成都行。但是数据外泄的这个风险对于企业端是非常要命的。到这里大家应该能够猜出来 openai 的 方式用 codex 来定制业务场景 是什么意思,就是把用 codex 已经跑通的 agent 的 工作模式去占领企业的业务场景。你看官方的博客这里讲得很清楚啊, 他说我们要不断地开发我们的 agent sdk, 然后呢,更容易地将功能更强大的 agent 投入生产。这更强大的 agent 是 谁呢?肯定是他自己的亲儿子 codex, 而且它说减少自定义基础设施的使用,那这基础设施谁来搭建,谁来定义呢?就是 open ai, 这个是 open ai 的 目标和野心。现在 open ai 的 这个动作有没有让你想到最近 antisropic 的 一个动作? antisropic 之前发布了 cloud manage agents, 它和 open i 一 样,两个公司都不只满足于做模型或者 a p i 的 供应商,已经不满足于做最强大脑了,它们都在运行层动起了心思, 当然它们的动作会有一些差别。 anastropic 打法是我给你托管你的 ron thai, open ai 的 打法是我把这个 ron thai 的 关键的规范工作方式,还有 hans 的 设计,还有沙箱的接口,还有 memory, 还有恢复的这种范式都开放出来, 让你按照我的方式去搭。 astropic 更像是托管式的 agent 云, open ai 更像是在做开放式的 agent。 标准层,它不像 astropic 就是 开这种单独的 round tie 的 附加费用的逻辑,它还是更加强调这个 api token 和这个工具使用计费的方式。它把这个沙乡的 provider 的 选择权是交给开发者的,它会相对更加灵活,更加方便企业和开发者去接入到现有的基础设施,也更加有利于它生态的扩张,做更多的用户数。 虽然说 open ai 这样的方式看上去更自由,但是标准是很可怕的。其实 antropic 一 直在定各种标准,现在 mcp 也好, skill 也好,各种的插件的方式也好,其实都是 antropic 做出来的。现在 codex open ai 以新的方式出来定义,它是在抢这种工作方式的利权。一旦你越来越依赖 open ai 所给出的这个 hash, memory, scheme 或者 manifest, 还有 codex 的 这种工作风格和工作方式的话, 后面也会形成一种更软性的锁定,这种是最厉害的。为什么最近苹果出了一个非常便宜的笔记本?我那时候看好像是算上国补,呃,算上学生优惠等等。拿到手一个苹果的笔记本才两千多块钱, 这让那些 windows 笔记本怎么和它 pk? 而且苹果的硬件大家知道,整体的性能是很好的,其实就是软性的竞争。 当你习惯了你的这个桌面的窗口,它的关闭键就是在左边的,所有的这个图标就是圆角的,你再去用 windows 的 系统,你根本就接受不了。 像我们这代人,一开始我们是用 windows 系统,后面用苹果的时候切换起来,真的一开始的时候还是有很高的切换成本的,很多人甚至会在 mac 电脑上面去装一个 windows 系统,这个就是一种软性的束缚。对于 openair 来说,这个事情这个逻辑是一样成立的。 当你选择一个开放的系统,适应了它的工作风格的方式,这种软性的锁定和选择的倾向性往往可能更加恐怖,它的力量可能是更强的。 所以在 agent 的 运行层的争夺上,在未来可能会呈现一个双雄争霸的这么一个局面。 antisorbike, 它会赢。在它的高完成度的托管。 对于那些高价值、长任务重托管的企业场景里面,它一旦站住了脚,它的商业价值是非常清晰的,而且它的产品逻辑也很清晰,那它的整个的收入模式就是 cloud 加 manage agents 再加 round tie 的 收回方式。 open ai, 它的用户群体仍然是最多的,它这样的方式可以在更加广泛的开发者生态里面去铺开, 它可以让更多的人带着现有的云流程和 provider 接入到自己的 age 的 体系。如果大家最近用 codex 用得比较多的话,会 深刻地感知到 codex 已经把 opencloud 的 很多能力已经内化进来了,除了 i m 端没有完全打通,你可以感知到它和小龙虾的能力已经很多地吸收进来了。而且你也可以用 opencloud 去驱动 context, 它不像 episodic 把这个口子给封了,它是开放的,小龙虾可以驱动它。 open ai 是 要赢在生态和广度的,所以它是这么一个态度,这个是一个我认为中期的结果。从长期来看, open ai 后续它也可以出类似像 episodic 这样子的更强的托管层,直接跟 episodic 正面撞上。而且这一次 openai 的 升级,它已经把这些能力都摆上桌的 能力都是具备的,像 sandbox, resume, memory, manifest provider 等等等等。前面走开放,后面去收拢, 相当于做自营的托管的商业城,这是完全可以的,而且非常省。所以啊,这一次 openai 的 sdk 升级,表面上看是工具的升级,但实际上是把 codex 它所练出来的工作方式抽象出来,变成业务的底座。现在 antropica 和 open ai 虽然它们的路径不同,但本质上都在往同一个位置和方向在打。 同时,我也强烈地感知到未来的 ai 数字员工越来越近了。那究竟哪一家会成为未来 ai 员工的基础设施的服务商和提供者呢? 可以在评论区说出你的看法。今天节目就聊到这里,欢迎订阅玲姐说 ai, 给我的节目点赞评论一键三连,我们下期再见,拜拜!

我建议每一个刚装上 cloud code 或者 codex 的 人都去跑一遍这个任务,你就直接跟他说,扫描我的电脑,列出十件你可以帮我做的事情,再给我一个我们长期写作的计划,最后告诉我,在你心目中,我是一个什么样的人。 真的跑完你会很震撼,因为你会第一次发现, ai 不是 一个只会陪你聊天的工具,他开始理解你的文件,你的习惯,你的工作流,甚至开始判断他到底可以怎么真正帮到你。尤其是最后一个问题,特别有意思,他会根据你的项目、你的表达、你的关注点,反 推出你是一个什么样的人。那一刻,你会突然意识到, ai 最厉害的地方可能不是帮你做一次任务,而是慢慢变成一个越来越懂你的长期搭子。如果你刚装好,一定去试一下,然后回来告诉我,在 ai 眼里,你到底是个什么样的人。

我们快速讲几个我经常用的插件。第一个桌面视觉协调,相当于给系统多了一双眼睛和高维图形交互能力,比如在测试桌面 app 时,能直接验证多步交互, 高效完成复杂的长链路任务。那第二个呢,是这个 browser, browser 是 codex 自带的浏览器,适合公开网页,本地预览。比如你让 codex 做了一个页面,它可以直接打开本地预览检查按钮,布局文字有没有问题。 第三个呢,是 chrome, 它比较适合我们日常用的办公网站,那简单说,查公网资料用 browser, 常用办公网页用 chrome。 第四个是我们刚刚演示过的 hyperframes, 适合做 html 视频、动态的标题卡,片头字幕的视觉化,还有动态图文。那其他的插件也建议大家自己去探索一下。 总结一下,你可以把插件理解成给 codex 多接了几只手,每个插件都对应一种真实的工作场景。 最后再给大家介绍几个比较好用的小功能,我自己常用的是计划模式,那比如说你的任务比较复杂,或者是 你自己还没有想清楚到底要怎么去干这个事情,那你不要一上来就让 codex 开干,可以先打开计划模式,先告诉他你的想法,让他去帮你拆解一下目标,然后在你们的一问一答的环节中来生成一个完整的计划,然后再根据这个计划去推进。那第二个呢,是引导功能, 如果扣代词正在执行一个长任务,你突然发现他的方向有点偏,其实这个时候不一定要打断他,比如说我这里让他帮我整理一下今天的 ai 新闻,我这里想给他增加一个需求,是国内国外的新闻我都要。那么这个时候你可以直接输入,然后点击发送的时候,他会有一个引导, 这里呢你可以直接点击引导,他提交了你的需求,但是不会中断模型的运行,那这个功能是我使用频率超高的一个功能,也非常推荐大家去试一下。那第三个功能,分叉, 那分叉呢?适合试不同的路线,比如说同一个选择题,你想同时试一下教程像和吐槽像两个标题的风格,就可以从当前的上下文分叉出去,然后不会影响主线。这里我们可以试一下分叉派生到本地。 ok, 这里就会给你一个新的对话框,那你就可以在这个对话框下开始你新的想法了。第四个功能,宠物, 宠物呢,它不是一个核心的生产力,但是它会显示 codex 当前在做什么,有点像一个清亮的任务状态的提示,对长任务来说还是比较有陪伴感的。在外观里面拉到最下面可以找到宠物,这里呢,我是让 codex 根据我我家猫的照片生成了一个宠物形象, 现在我们已经是启动的状态,我唤醒一下宠物给大家看一下, ok, 出来了,就是这样的一个宠物形象, 然后呢,他会实时的告诉你现在进行中的任务的状态,如果你不需要也可以直接收起。 最后要给大家介绍的是用量的查询,那我们经常在用 agent 的 时候,其实你是不知道自己到底还剩多少额度的。 codex 的 设计比较人性化,它会告诉你五小时和一周之内的剩余额度,比如说我今天啊,五小时额度还剩百分之九十,那一周的额度还剩百分之九十五,非常的够用。 那今天关于 codex 的 介绍就到这里了,最后总结一下,新手呢,用 codex 先记住四步就够了。第一选项目,告诉 codex 它可以处理哪个文件。第二说项目,用自然语言讲清楚你想要的结果。 第三呢,给合适的权限,新手日常选自动审查。那第四呢,是把常用的流程沉淀下来,能用插件的就用插件,反复做的事情做成 skill, 需要连接外部系统,再考虑 c l i 或者 m c p, 你 不需要一开始就掌握所有的功能,真正重要的是先找一个你每天都会遇到的小任务,让 code 帮你跑通一次。比如整理素材,处理字幕,做视频的分镜,检查,发布文案。 跑通一次之后,你就会发现,我们已经不是在问 ai, 而是在管理一个能帮我们做事的 ai 助手。我是 yuna, 关注我,带你一起了解更多 ai 知识!

终于打通了消息语音图片的实时发送和接收,那这个软件的基本框架就跑通了。对于一个什么代码都不懂的人来说,走了很多的外路, 不知道后面还会碰到什么问题,但我相信 codex 都能解决。

美好啊,朋友们,这是一期 codex 奶妈级的零基础系统教程,这期视频我会从安装开始,手把手地把 codex 的 基础能力到高级功能的组合,以及最新的手机端操作,用十个实战场景来带大家彻底拉通 以后这一类的 ai 产品,出一个算一个,你都会触类旁通,游刃有余。我也把这期的文字课间整理成了文档,那这期的含金量可谓是 biu biu biu biu biu, 一个点赞收藏关注是最起码的。好了,不多说,学费都交了吧,我们上课, 那在开始之前,我先说一下 codex 和 cloud code 的 区别。从本质上来说,它俩都是由编程 agent 逐步转向了通用 agent, 分 别是 ansapi 和 open ai。 这两家出的 cloud code 呢,默认使用 cloud 模型,但是我们可以自行替换成任意其他的模型,那在易用程度上, codex 桌面端的产品设计是会更友好的, 更适合零基础的白领工作者,而 cloud code 有 更高的自由度。在功能上, cloud code 原本是最齐全的,什么 skill、 mcp、 斜杠命令、 hock、 远程操控,这都是人家先发明的。但是呢,最近的 c c 更新稍微不如 codex 那 么快了,会更加偏向专业开发者一点。 而 codex 发了非常强的浏览器操控和 computer use, 还内置了最近的 image 二深图模型, 而且昨天还刚刚发布了手机端和 hock, 可以 直接用你的手机 check gpt 来控制电脑上的 codex 干 活。那价格和额度方面呢? codex 的 会员额度非常大方,二十到的会员就很够用,而且还不封号。 而 cloudpod 呢,大多数人可能都没法用它的官方账号基本上都得自行调用 api 的 费用属于是花多少用多少,风险由人。那在使用场景上,我个人喜欢用 cloudpod 搭配 cloud 模型来写作,因为 ops 四点六的写作和规划能力真的很强, 那 codex 的 执行和解决问题的能力也很强。日常的办公场景,我会选择用 codex, 那 在编程的时候嘛,我就两个都用上,所以结论是,入门的朋友用 codex 就 很强了,有条件的朋友呢,两个都来是最完美的, 不过两者的逻辑其实都是一样的,我们学一个,另一个也就会用了。那 cloud code 我 也做了一期系统教程,想拥有左膀右臂的朋友可以去看看。 ok, 正式开始 使用 codex, 我 们唯一需要准备的就是一个叉 gpt 账号,免费的也行,只是会额度稍微少一点。那有了账号之后,我们就直接去它的官网双击安装, 然后安装好之后登录我们的叉 gpt 账号,然后这些设置我们可以先随便选一点啊,选个日常工作,反正后续呢,我们都是可以改的。那搞定了, 那进来之后呢,大家会看到这个对话窗口,好像跟 chat gpt 是 很类似的。那我们打开两边的侧边栏也蛮眼熟的,左边呢,可以管理对话和任务的列表, 那中间就是聊天,右边大概是结果之类的吧,大家应该都能猜个七七八八,所以我们先不深究它的页面,我们直接开用,这其实也是我探索所有的 ai 工具的独门秘方。 我打开一个陌生界面呢,我先不管别的,我先找到我能对话的框,我先聊,先找到我能看得懂的按钮,先按,按着按着你就会了。你看看,独门秘籍都教给大家了,以后你们就是为师的弟子了。 ok, 众弟子不必拘礼,我们还是以学业为重啊。那我们第一个要了解的 codex 能力呢,就是本地文件操作, 也是这一类桌面端的 agent 跟对话 ai 最显著的区别和能力。因为过去我们用叉 gpt, 如果说我们要让它看到我们本地的内容,我们只有两种方式,一个呢就是复制粘贴到这个对话里,另一种就是以它允许的格式和数量把文件给上传上去。 但是 codex 不 一样,它可以自主地读取和操作我们的本地文件,而且不限数量。比如说我作为一个剪辑,我的本地里面存了八十多条视频素材,这都是我剪辑要用的, 但是呢,这个命名全都是乱的,完全看不懂,所以我想以这些视频的内容来命名,到时候我们看见文件名的时候,我们就知道这个素材是什么。那这事 check gpt 肯定是做不了的,但是 codex 可以 我们来看这两个地方,它都显示了一个概念,叫做项目, 我们选择一下,哎,一选择项目,他就让我们选择本地的文件夹了,那我们只要选中这个文件夹,那这个文件就是我们的项目了,里面所有的文件 codex 都可以自由的读取和操作, 当然这需要我们给他权限。大家看这里的权限选择啊,目前呢,我们是一个默认的权限,我们再点开,他有三种权限模式, 那默认权限的意思呢?就是在我们当前的文件夹内,他可以自由的去读写这些文件,但是如果他想要联网呀,或者是帮我们下载一点东西啊, 或者是碰这个文件夹之外的其他文件,那他是不行的,如果他必须要做,就会要向我们提出提高权限的请求,我们点同意才能继续。 那自动审查呢?顾名思义就是有个 ai 自动帮我们审查,由 ai 来判断这个操作危不危险,如果危险呢,就来问我们不危险的,比如说他去下一个知名的这种官方软件什么的,他就直接开干了。 自动审查比默认模式要更宽松和智能,建议大家选这个就完了。那最后呢,是完全访问权限,这意味着 codex 可以 在你的电脑上几乎什么都能干,它可以修改删除任何文件,它可以在任何位置执行命令,例如说它可能会去把你的 cloud code 给删了。 开玩笑啊,它一般情况下是不会这样抽风的。 ai 呢?也没有嫉妒情绪吗? 大家尤其是新手朋友就选择自动审查模式,相信 ai 就 完了,毕竟咱又能审的比 ai 好 多少呢啊,对吧? ok, 那 我们选中了刚刚的这个视频的文件夹,继续来提出我们无理的要求,让他帮我们把这个文件夹里的所有视频素材都按他们的实际画面来重新命名。哎,他就开始做了, 而且大家看他非常的聪明,他先看了看我们到底有多少个视频,然后他选择用抽帧的方式抽取关键画面来判断内容是什么,而且他还知道他不要一张一张图去看,他给拼成了缩略图的形式,一组一组的去看。 ok, 很 快啊,这个文件夹里面的文件名就全改变了。过程中呢, codex 也是没有向我们提全的,因为他都是在这个文件夹内去操作的。那我们也可以检查一下他都对应好了没有。 ok, 钢琴家音乐演奏厅,没错, 雪山近身格斗,没错,旗袍女人夜巷卖热饮哇!而且他的这个命名还遵循着一个序号,任务、场景、行动的一个清晰的命名格式。 ai 做事的这个细心程度啊,人类你不服不行。那另外呢,我们其实也可以在同一个项目里面去开多个不同的对话,它们的上下文都是不一样的,但是同样都可以随时的访问我们这个文件这个项目。 比如说,我们在另外一条对话,我们又给他一个不同的任务,让他想办法把所有关于风景的视频都剪成一整条。 哎,没想到吧,他真的能剪,他自己想办法,用了一些工具问我们要了一些权限,用这个 ffmpeg 给它拼在了一起,效果的确是关于风景的都剪成了一条。 ok, 那 如果我们要创建一个新的任务,我们其实也可以手动的在这边创建,他也会自动的在我们本地创建一个文件夹。 然后呢,我们跟 codex 对 话的整个过程, agent 产生出来的任何文件啊, pdf 啊,什么 markdown, ppt, 它都会直接存在我们本地的电脑上。 ok, 到这里,大家应该 get 了 codex 呢,可以随时地访问我们的本地文件,去读取内容,写文件,删文件,移动文件,文件夹里的内容也就成了我们的 codex 随时可以获取的上下文,那这里的项目也就对应着我们在本地的一个文件夹, 哎,那刚刚这么个任务会花我们多少上下文呢?我们只要看这里就能看到了。 那这个小圈代表的是我们现在的这个对话和里面的操作,一共使用了 gpt 五点五的多少上下文窗口。 如果我们把鼠标悬上去呢,它还会有更详细的一个信息,当上下文快满的时候, codex 会自动地帮我们压缩上下文。不过其实当我们一个任务告一段落之后,不用等它快满了,让它自动压缩,我们也可以自己通过斜杠压缩这个命令 来手动的去压缩上下文,这样呢,可以让模型更聚焦在我们的新任务上,也省一点上下文的额度。那当然大家除了这个对话的上下文余量,其实我们还想知道我作为一个免费用户,或者是我作为一个 pro 用户, plus 会员,我还有多少总共的额度可以用,对吧? 这个呢,有两个方式查看,一个呢是左边的设置,这里我们点开剩余额度,就能看到你五小时内还剩下多少,那本周内又还剩下多少, 甚至呢,也有什么时候到期会刷新的一个提示,这个产品的设计还是比 cloud 的 友好很多的。那另一种方式呢,就是我们可以直接在对话框里输入斜杠,然后找到这个状态, 那打开这个状态之后,它的绘画这里就会持续的显示我们的上下文余量,这个五小时和一周的限额。但再次说实话,这个 codex 的 额度还是非常大方的,二十到的额度我认为是可以满足大多数白领工作的高频使用的。 ok, 那 顺便呢,我们也介绍一下这里的模型选择, 那点开之后,我们可以选择速度,快速呢,就相当于加急通道,会消耗我们更多的额度。那这里呢可以选择其他模型,但是大家都选五点五,因为它确实更好用。然后呢,这里可以选择智能程度,其实呢一般中度智能就够了, 所以我们选高。 ok, 那 这个小麦克风呢,肯定就是语音输入功能了,比手打字还是要快很多的,但是呢,它的转录速度远不如大家去下载一个语音输入法,还是非常推荐大家用语音输入的 好。那现在我们通过一个本地文件处理的案例,也了解了 codex 上常用的一些功能。那 codex 的 第二大能力就是命令行工具使用。 其实刚才我们说到权限的时候就有提到,在默认权限下,它可以读写文件,但是却不能执行一些命令,一些联网的操作。那这些命令是什么意思呢? 刚刚的案例其实也已经用到过了,比如说它把视频抽帧出来,还把几个视频拼接到一起,它用到的 ffmpeg 就是 命令行工具。 还有一些我们熟悉的命令,比如说我们在终端里面来克隆一个 gitup 仓库,或者是大家近期比较熟悉的,我们在命令行里面输入一些命令来下载龙虾和各种依赖。那 codex 的 第二大能力就是在我们授权的情况下,可以使用我们的终端来替我们做这些事。 那我们就来让 codex 帮我们来安装一些平时对于小白来说非常复杂的东西吧。第一类,常用依赖,比如说什么 node gs 啊, git 什么的, 也是大家以后使用各种 agent 或者是做其他项目必备的一些工具啊,那之前大家要装这依赖都得去看一个手把手教程,然后照着命令抄,挨个装。那现在我们就直接跟 codex 说帮我安装个 node js 给他发过去, 也是因为这些东西呢,其实都是比较常见的东西了,所以在我们的自动审核的权限模式下,你看他基本上都不问我们要提权,就熟门熟路的帮我们装好了。 那第二类,就是那些爆火的但是有上手门槛的一些新的 agent, 比如说龙虾,爱马仕,甚至还有这个 codex 的 竞品 cloud code, 我 们都可以让 codex 帮我们装完了呢,它还能教我们该怎么用。那我们装一个 hermes 吧, 我其实都不需要给它官网和仓库链接,我就说最近有一个叫 hermes 的 agent 很 火,你帮我安装一个吧。 哎,他就会自己去搜索,然后帮我们判断到底是哪一个。然后呢,他根据官方的文档帮我们陆续的装好了,还帮我们验证过已经装好了,你瞧瞧,那我们照着他说的来启动一下试试。 哎,真的帮我们装好了,那往后的配置我们就不在这里继续了,但是大家应该 get, 有 了 codex 以后,那些复杂的要收你五九九的部署,你都可以直接让 codex 帮你做了,怒省五九九。而且我们在使用的过程中遇到任何问题,还可以截图去问 codex, 什么瞎死了马挂了,升级出现了问题都可以让 codex 直接帮你修,是不是很方便? 那第三类有点没那么必要,但它其实也可以,就是像 cursor integrity 这种软件应用, 平时都是我们去手动在网页上下载的,它也可以帮你下载和卸载。那大家用 codex, 我 其实也建议大家去下载一个 agent 的 ide 啊,因为现在 codex 有 个缺点是它没有办法打开我们的文件内容,直接去手动编辑。 虽然这个侧边栏呢,是可以看到一些文件结构和内容的,但是我们都没法编辑,所以大家可以让 codex 下载一个自己喜欢的,比如说我们就这样下载。那下好之后呢,我们再执行一个 git i n i t 一个初步化, 那右上角就会出现这个东西,随时可以把我们的项目在编辑器中打开,我们来手动编辑。 那第四类就比较重要了,就是 agent 本身会常用到的那些 skills 啊, mcp 啊和 selli。 那 skill 和 mcp 本身 codex 也是支持的,我们后面会详细讲到, 我先挑两个大家安装一下,方便我们后面综合起来来做案例。那这些 skill 和 c i 呢?通常来讲不像那些 get 那 种大项目那么著名,所以我们最好是找到它的具体仓库,或者是明确的官网地址。比如说我们下载一个专门找 skill 的 这个 find skill 哦,方式就是直接把链接拷贝给 codex, 然后跟他说帮我装一下这个 skill。 那 在他装的期间,我们也说一下 codex 的 另一大好处,并行任务处理, 我们完全可以在他做这个事情的时候再开一个对话,让他去下载一个别的。那我们下载一个飞书 c l i 吧。飞书 c l i 其实非常的典型, 因为现在呢,有一些积极 ai 化的软件,把几乎所有他在软件里能做的操作都做成了命令,让 agent 能够方便的去操作,我们把这个链接发过去,让他开始下载, 那这边呢,其实会显示每一个正在处理当中任务的情况,这个在转呢,就说明它正在执行中,那这个蓝色的点呢,就说明已经完成了,有时候还可能会出现一个需要你申请权限的一个标识。 ok, 那 这里 fan skill 呢?它是已经装好了,我们再看飞书 c l i 这边,它会引导我们去做一些授权, 我们就跟着它的引导去完成就好了。 ok, 那 装好飞书 c l i, 那 codex 就 能帮我们去做飞书里的各种操作了,比如说写文档,发消息,见日历,做表格什么的了,我几乎每天都在用, 好大功告成。我们就这么一个小章节,我们就用自然语言的方式让 codex 帮我们装上了 hermes node, 飞书 c l i 一 大堆东西,这就是 codex 作为 agent 的 第二大常用能力,命令行使用。 那这个能力和这个章节的演示也是希望大家能够 get 到一点,就是我们现在在电脑上想去做的很多很多事情,都可以让 codex 这样的桌面 agent 去做了。那 codex 的 第三大能力是持久记忆。 看过我那篇 cloud code 的 朋友应该都知道, c c 呢,有一个手动的持久记忆, cloud 点 md, 还有一个自动的记忆系统, 都是把我们希望 agent 能够长期记住的,比如规则、篇号和我们的信息之类的东西,以本地文件的方式存在我们的电脑上,然后事实的时候把这些记忆以上下文的方式注入到 agent 里去。那 codex 也是类似的,它也有这两套持久的记忆系统 在 codex 里面呢,手动的持久记忆文件叫做 agents 点 m d, 而且它也有一个自动的记忆机制,来我们打开设置,找到个性化, 那在这里的这个自定义指令实际上就是一个全局生效的 agent state md, 它会在我们任意的项目跟 codex 对 话的时候,它都第一时间作为上下文发给大模型,那我们可以手动地自己在这里写,不过我更喜欢呢,直接在对话中去跟 codex 说, 比如说我说一个,我希望你以后对非书文档里的任何修改都使用一个专属的你的文字颜色和用删除线的方式来修改,不要直接的修改。然后这个帮我寄到局的 a 正 c m d 里。 ok, 那 它这里呢,告诉我们已经写好了,我们再打开个性化这一块,就的确是多出来了这么一套规则,那实际在使用当中,它就会去遵循我们这个规则了。 比如说我这里已经有一篇非输文档了,我在侧面呢也评论了几个我想修改的地方,我直接可以把这个链接发给 codex, 我 让他根据我侧面的评论帮我修改一下。 那因为我们刚才确实已经装好了这个非输的 c r i 也都给他配置好了权限,所以 codex 是 直接可以操作我们的文档的。 ok, 看看它完成之后的效果。 果然他用了紫色的字和删除线的方式来帮我们做的文档修改,那这个呢,是局的 agent md, 适合记一些适用于所有任务的一些大原则,比如说我们的工作习惯,我们要说中文,我们的工作偏好修改文档,要留下这种修改痕迹等等等等。 那另一种呢,就是项目级的 agent md, 这个长期记忆呢,只在这个项目当中生效,我们可以选择一个项目的对话,然后打开编辑器, 自己在这里手动的创建一个 agent 的 md 的 文件,然后我们去写一些针对我们这个项目的一些规则, 当然也可以让 codex 来帮我们写。我个人的建议呢,是在这个项目文件里面有了一些内容之后,让 codex 根据他对我们项目的了解来自己帮我们写。那自动记忆怎么回事呢? 其实我们刚才在这个个性化这个下面我们也看到了,我们需要手动打开这个自动记忆功能, 它的机制是我们打开这个功能之后, codex 会在我们结束对话或者是结束任务,这个对话闲置一段时间之后,它帮我们把那段对话总结成记忆,然后记在一个地方。但是它有几个原则,第一太短的对话它就不记了, 那第二这个对话的总结它一样会消耗我们的额度,所以当我们的额度太低的时候,它也就不记了。 并且这个自动记忆文件呢, open ai 官方是不建议我们去手动修改的,顶多我们可能删一删有些没必要的信息,那这个文件大概是长这样 的,是一个任务,一个任务在记录的,主要呢会写上这个记忆的来源是哪段对话呀?以及它的工作目录是什么,那以及以后触发了什么关键词的时候,它会去召回这段记忆, 再往下呢,是用户在这件事情上的偏好大概是什么样的?那第五段呢,是一些可附用的一些知识,一些踩坑的记录,那这些内容都是 codex 自己记录的,并且以后也是会它自动的招回去使用的,我们就先不修改它, 它这个格式确实也不太方便修改,更多的时候我们对于明确的规则和要求,我们还是通过组织 agent md 来实现。那大家学完这些视频之后呢,我也想给大家再做一期, 通过组织不同层级的这种 agency md 给自己做一个非常懂你的,可以做不同类型事情的超级助手的视频,感兴趣的朋友可以扣个一。 ok, 那 第四大能力就是 codex 可以 直接用到 image, 二来生成图片。不过呢,深图功能其实是一个小功能, 所以这一章节呢,我们不只会用它的图片生成,我们会带大家做一个完整的个人主页的开发项目,并且在了解一些 codex 在 小白开发中的一些用法和功能。那我们再来开一个项目,叫做个人主页, 然后我们点开这个加号,我们把计划模式打开,因为我们要做一个网站嘛,任务会复杂一点,所以打开这个计划模式呢,他会先帮我们列出一个详细的计划,我们确认之后他再开始行动。 计划模式呢,比较适合我们的任务有一定复杂性,或者我们自己还没想清楚,可以跟 ai 讨论出一个计划。那假设我们现在就是第二种情况,我们其实没想清楚,我们直接跟他说我想做一个个人主页, 那你看他看到我们的项目中是没有内容的,所以他以这种选择框的方式来询问我们的细节,这些选项呢,大家可以按照自己的要求去选择,那我就选这个个人品牌吧。 然后如果说这些选项中没有我们满意的呢?我们也可以选到最后一个来填写我们详细的要求,比如说我要他修饰感,也要高级感,然后我选针对合作伙伴,不要个人照 中英双语,巴拉巴拉巴拉。这里真的是问了我们相当多的问题啊,那最后呢,他给到我们出了一个详尽的计划,问我们是否实施此计划,那其实基本的计划我们看着没有什么问题,但我们也可以补充一些调整方案。 比如说我们刚才就要说到了要用它的 image 二的生成能力,我们这里没有体现,我们加一句网页上要多用一些图片,使用 image 二来生成一些高级感的图片,然后我们一起提交。 哎,那他又问我们要走哪种高级感呢?我们如果点开这个小叹号的话,还能看到他说的这个风格到底意味着什么意思,这个产品的小细节真的是我很喜欢,那我们就选他推荐的吧。然后他出了一版新的计划,我瞧着没什么问题, 去吧。 ok, 他 就开始初识化这个项目来逐步帮我们生成了。那这个过程呢,肯定会需要一定的时间,在这个期间我再给大家补充一点点知识点。呦,他的第一张图出来了,不错,挺有艺术感的,果然是最强的 emoji 二,那我要补充的这个知识点呢,叫做引导。 如果说大家在 codex 执行一个很长的任务的过程当中,你觉得他有点跑偏了,我们是可以随时给他补充纠偏的,比如说我们补充一下图片的人味要更强一点,而且不要这么冷的色调。我是一个 ai 博主,然后我们发送出去, 哎,大家会看到他没有立刻打断我们的任务,没有发出去,实际上他在这里排队呢。那我们看到右边的这个引导按钮,他写着我们不打断模型运行,会在下次调用工具后发送过去。这个是非常好的一个功能啊,我们点一下, 哎,他就可以发出去了。这个功能呢,可以让 codex 不 用在错误的道路上一路狂飙,把我们额度都花光,也不会让它重新再跑一轮任务。那另外一个小功能点,我们找到一个已经结束的任务, 我们看一下这个 ai 的 回复,每个 ai 回复的下面都有一个这个按钮,叫做分叉 fork, 这个的意思是我们可以随时从这里开始去开一个新对话,非常适合那种前面聊的还好好的,上下文也非常有价值,但是我们再往下聊,就聊的有点叉劈了的时候。哦,还有个小功能,宠物, 我们点开设置外观,然后这下面就有一小对小宠物可以选,甚至呢,我们还可以点击创建,让 codex 根据对我们的了解来生成一个定制化宠物。那我们先点击唤醒宠物, 哎,就会在桌面上有常驻这么一个小桌宠,脑袋上会冒出来 codex 正在做什么的一个提示,别的呢?好像也没什么用。 ok, 终于在他跑了七七四十九分钟之后,网页完成了, 我们来看看效果,因为 codex 呢,有一个内置的预览浏览器,我们可以直接打开右边的侧边栏啊,我们还给它放大一点。 嗯,这个网页的效果确实是不错啊,不过呢,现在的 a 证呢,其实都有这么一手了,那它这个预览浏览器呢,还有一个好处,我们点击右上方这里的一个批注按钮, 我们就可以在这个页面上选中这里的具体元素去写修改意见,包括重新生成图片,比如说我们要这个 logo 放大一点, 然后 p 住这里这张图加上一个人物,好把这个删掉, 那然后对话框里呢,就会加上我们这几条批注,然后我们点击发送,它就会针对我们的意见进行修改了,是不是挺方便的?那我们现在项目有了雏形之后,我们再 call back 一下刚才说的 agent md, 其实现在呢,就是一个让 codex 帮我们生成项目级 agent md 的 好时候了,因为我们也有了一定的内容,我们就让它自己生成一下,我们打开编辑器看看, 不错,项目的背景,各种信息,各种规则,各种文件路径都已经写好了。那以后呢,无论我们在新开对话,还是我们的聊天记录都已经被清空了, codex 都可以通过这个项目级的 a 证书 md, 立马的了解我们的项目基本情况。 ok, 那 我们先保持这样,先不做精修了,我们直接准备部署上线,当然大家自己做的时候完全可以去打磨的更好,那网页上的这些信息也换成更真实的信息就好。 那我们现在要部署呢,就得要说到 codex 的 第五大能力插件。在现在的 codex 当中,插件大多数是让我们的 agent 跟外部平台、外部工具、外部服务连接的一个作用,它实际上就是我们所说的 skill, mcp, c l i 这一类东西的一个完整集合包,比如说操作邮箱、操作日历、操作 excel 啥的。那我们来点开左边的这个插件栏,我们看这里呢,已经默认帮我们打开了好几个内置插件了,比如说浏览器操作,还有 mac 专有的屏幕操作,还有 excel 表格, ppt 等等。 那他的插件页面没有中文翻译,所以我给大家把这些插件的具体中文意思,分别能干什么也都列出来了,大家课后可以按需装上,点这个加号就好了。那我们先翻到这个 coding 板块,因为我们想要部署上线嘛,通过插件会非常方便。 其实呢,这个 vassel 和 netify 都可以,我们点一个加号给它装上,那如果大家给它没有选上的,也记得要选上。然后我们再回到对话当中,告诉他们,我们想用这个 netify 把这个网站给我们部署上去, 我们大家也不用管他咋部署的,反正他需要干什么呢,他都会告诉我们的。 ok, 他 发现我们没有登录授权,然后主动弹出了这个登录的链接,那这里呢,建议大家用 tapp 账号登录是最方便的, 那登录完之后,他自己就知道我们已经登录好了,然后继续的帮我们部署,这就搞定了。这个链接呢,就是我们最后的网站了, 只要把这个发出去,别人就能访问你的个人主页了。 ai 是 不是个好东西,你说就这么两下子就干了,原来普通人花钱都不一定能干成 o k。 先压抑住我的这个老灯感叹。我们回到刚才我们已经装好的插件, 那其实这里呢,还有两个非常重要的内置插件,就是 browser use 和 computer use, 还有这个 chrome 浏览器, 那这些有什么用呢? browser use 顾名思义呢,就是 codex 可以 直接帮你操控浏览器,比如说它自己点击翻页截图,填写表单等等。通常呢适用于自动化测试前端, 当然也有比较无聊的用途,比如我们可以让 codex 打开这个 m b t i 做个测试试试, 嘿嘿,这样大家能够比较直观的看到它的一个效果吧。那这个鼠标呢,是它自己在移动,然后它是自己看了上面的答案在自己填写,然后填完这一页,它也会自动的翻页, 那随着它的一通操作,结果出来了,原来 gpt 五是 i n t j 啊,我说怎么跟我这么聊得来呢? ok, 那 这个 chrome 的 插件呢,也是控制浏览器,但是它控制的是我们自己已登录的自己的浏览器,它不会再新开浏览器, 那我们如果把它给勾选上之后,它会引导我们去 chrome 里面装一个插件,那装好之后呢,它就可以操作我们自己的浏览器了, 而且它有个好处,它是可以直接在后台执行多个页面的浏览器操作的,就是并不会占用我们的整个浏览器,我们不用真等着看它这些操作,我们该用浏览器干,别的我们可以接着干。 ok, 那 computer use 就 更厉害了, 它不只能够操控浏览器,连你电脑上的这些 app 它都可以操作,只不过呢,暂时只有 mac 有 这个功能。比如说我们新开一个对话,我们在加号,这里来看最下面的这个插件选项,我们手动地把电脑插件选上, 我们再来几个没什么用的奇迹引巧吧,帮我放一首九九年最火的歌,然后用我的微信给 qq 发条微信,说,请收下我一个点赞、收藏、关注,懂了吧? ok, 他 陷入了思考,然后他看到我们的应用都正在运行中,并且向我们使用了这个音乐软件。我们点同意看,这个就是 codex 自己干的啊。他帮我们搜索歌曲, ok, 音乐响起了, 但是他还有活,他还在问我们要微信的权限,我们也给他允许一下。 ok, 看他这个小鼠标,他正在犹豫着准备搜索点击,好朋友们失败了, 因为我上次都成功了,但是我估计现在微信已经开始严防这种 a 证的操作了,直接给我退出去了。 但是呢,他的确成功操作了这个音乐软件。其实我还让他操作了剪映,并且给我们的最新的项目加上了音乐。 那总之呢,意思大家都懂了吧,就是它可以操作浏览器,并且可以操作我们的电脑。当然,实际上我觉得它的操作效率目前来说还是稍微有点低的,我不太喜欢用这两个强大的功能。不过后面我要说的这个 skill 就是 我每天都会用的东西了。 那 skills 我 的确也已经跟大家说过很多次了,好学的朋友一定要去补补课。那 skill 本质上呢,是我们人为沉淀的一些可附用的方法、流程和工具的组合, 相当于给 agent 做某些具体任务的一些行动指南。那因为之前我们已经让这个 codex 帮我们装过一个叫做 find skill 的 一个原 skill 了, 所以后续如果大家想要去装,或者是找一些社区上的 skill, 都可以直接用 codex 拿语言直接让它下载。比如说我们下载一个必备的 ansapic, 那 个前端设计的 skill, 还有一个去 ai 位的,那我们这两个都发给他,等会儿都会刚好有用 欸,很快他就帮我们装好了。那以后大家想要下载 skill 呢?如果说遇到这个 find skill, 他 找不到的东西,也可以直接把链接发给 codex, 让他帮你下载就好了。不过我在 c c 那 期也说过,最好用的 skill 还是自己创建的,符合自己工作的专属 skill。 那 创建 skill 呢,也有两种方式,第一呢,就是直接告诉 codex 你 想要创建一个什么样的 skill, 通过跟他讨论打磨得出来一个 skill。 那另一种呢,就是我们接下来要演示的,先跑通流程,然后让它形成 skill, 这也是一种更推荐的做法。那比如说我们想做一个自动化写这类文章,并且帮它配图的 skill, 这种大家应该都看过吧, 那我们就得先通过一步步的引导 codex, 让它真正实现一个我们满意的文章。来我们新开一个对话。那正好呢,我们刚才不是装过这个 github 插件吗?我们可以直接先问它最新的 github 流行项目,热门项目都有哪些? ok, 它的确帮我们找到了一些,那我们再让它清晰地解释一下这些项目都分别是干嘛的。嗯, 那我们再让他挑其中新星数量最多的,来帮我们写一篇本周 get up 热门项目推荐这样的一篇文章。 好,那他写好了这一篇之后,我觉得稍微有点太人机了,我希望可以更口语化一点,并且我只想要五个精选的,那我们就告诉他,然后还要覆盖到这几个层面,那我们这里就可以用到刚刚我们下载的那个去 ai word 的 那个 skill 了,我们斜杠给它调出来。 好,那看到他的结果稍微优化了一点,但是我们还希望加一个我们固定的开头,我们的结尾,并且还要让他用上 image 二来帮我们生成一些配图。最后呢,我还希望他不要是这个格式,他要是一篇非输文档的格式,然后图文并茂的。 ok, 结果来了,他确实是有了,但是呢,我觉得这个配图不够丰富,于是我又经过几轮调整才觉得差不多满意。并且我还给他最后加了一步,要让他把这个飞书文档发送到指定的群里,让大家都来看看。 那最终呢,他的效果是这样的,果然发出去了。其实啊,如果想更加一步到位的朋友,也可以结合刚才我们说的这个浏览器操控,让他直接打开那个发布页面,直接就帮你发布出去。 那总之,我们对他这一套结果满意了之后,我们就可以直接让他把这一整套的标准和动作做成一个 skill 搞定了。那我们再输入斜杠,再往下找,我们就发现就有了这个 skill, 我 们可以直接这样手动地调用这个 skill, 也可以直接说生成一篇热门项目推荐图文这一类的触发词,也会让 codex 自动调用。 不过因为现在 github 上面实时的热门项目肯定是没有更新的,所以我们再调用一次呢,它大概率会写出差不多的文章,所以我们就不试了。但是大家都理解了吧, skills 呢,可以把我们经过验证调好一次的一整套流程和方法给它固定下来。 下次做这件事情呢, codex 就 可以按照这个方式稳定的输出。 ok, 那 下一个能力则是 mcp。 其实 mcp 现在已经用的不太多了,所以我只简单的示范一下那 codex 的 mcp 藏在设置里面的 mcp 服务器。 只不过小白看这个肯定是有点不太知道怎么填的,所以跟我们之前说的一样,我们最好的方式还是把你想装的那个 skill 的 链接拷贝给 codex, 让他自己装就完了。比如说我们来装一个 notebook lm 的 一个 mcp 发给他, 他就会引导我们来做授权登录,登录完就搞定了。那我们再试一个我存了非常多访谈视频的一个笔记本,我们来问一下他。 欸,那这样呢, codex 也就可以直接获取我们 notebook lm 上面的这些外挂知识点了。 ok, 最后一个 codex 能力是自动化定时任务。 其实定时任务本身并不稀奇啊,比如什么每天早上提醒我吃药,提醒我喝水这一类的事情,普通的软件也能做,但是我们把它放到最后一个说呢,就是因为它可以结合我们之前学到的各种能力,把一整套组合起来的任务,让 agent 定点执行 自动化,加上智能化和定制化方显美妙。比如说刚才我们做的这个热门项目图文的这个 skill, 我 们就可以把它设成每三天或者是每周,让它定时定点的产出一篇 dapp 热门项目推荐发出来。 那我们要创建自动化任务呢,其实也分两种方式,第一种就是选到这边的自动化面板,那它这里呢,有一些官方的参考视例了,不过大多数是跟开发相关,那我们选择新建一个自动化, 其实你看要填写的东西也非常简单,其实就是用提示词写好这些自动化是要做什么,然后我们可以在这里选好什么时候出发,我们也是可以自定义一个出发时间的, 然后这边就可以选择执行的模型和思考强度,最后点击创建即可。不过呢,我也还是倾向于让大家用第二种更简单的方式,就是直接在对话里跟 codex 说,那我们直接跟他说 帮我创建一个自动化任务,每周一早上九点自动化执行热门项目推荐的这个 skill, 产出一篇图文发到群里, ok, 那 我们在看自动化这里,它就已经帮我们设好了这个任务,我们随时也可以去改变它的时间。 再比如当你的这个邮箱插件 github 飞书都已经连上了 codex, 那 么你也可以让他每天下午六点帮我汇总日历上完成的会议, github 上面的提交记录和我的邮箱回复记录,生成一份全面的工作日报。 最后手机操控 codex 设置方法非常简单,手机上的 check gpt 和电脑上的 codex 都把它更新到最新版。之后打开手机上的 check gpt, 然后点击侧边栏的那个 codex, 它就会提示你允许这台手机控制你的电脑,直接就搞定了。如果你有多台电脑的话,也可以给它分别连上。这就等于你不管在大街上、地铁上还是朋友聚会,都可以随时随地地用手机下发一个任务,让 codex 在 你的电脑上干完一个活, 它就更像一个可以跟你远程协助的同事了。这个功能呢,目前免费版也可以用,但是主要能连的是 mac 系统的 codex。 好, 那到这里 codex 的 所有核心能力我们就全部过完了。来我们回顾一下。 codex 呢,可以操作我们的本地文件,可以使用我们电脑上的终端命令行工具。它还有两种构建持久记忆的方式,它还可以生成图片,而且它可以通过计划模式来做一个完整的项目开发。 那它有丰富的插件,可以操控浏览器和电脑,还可以把知识和流程沉淀成可附用的 skill 技能, 它可以使用 m c p 连接,外部它还可以设置自动化的定时任务。不过其实比起这些功能本身,我也希望大家记住两件事,第一就是我们真的有很多事情是已经可以交给 agent 做了。 那第二呢,就是我们已经从问 ai 的 阶段走向了管理 ai 的 阶段,因为过去我们使用 chat gpt 就是 有问题了,我们问一下,然后得到答案我们就走了。 那现在使用 codex 这类的 agent 呢?每个人都得像领导一样,帮他准备他所需要的上下文和工作环境,给他指明一些任务目标,然后来检查他的计划,监督他的过程,验收他的结果。 那同时领导还要负责把好的方法和流程沉淀成可付用的技能,把反复要做的事情设成自动化执行的规矩。好了,恭喜大家今天都升职了,记得点赞收藏关注我们下次见了。

原来失业不一定是结束,有时候反而是你开始用 ai 赚钱的第一天。 前两天我去楼下吃烧烤,坐下就想整点喝的,结果问了一圈,很多摊位要么没有精酿,要么就两三种普通啤酒。 我脑子里突然冒出一个想法,摊主有客流,超市有酒,中间缺的不就是一个会把流程跑起来的人吗?正好我朋友开小超市进了一批精酿,货是好货,就是不知道怎么卖。我当晚就把龙虾和 codex 叫出来开工。 第一步,让龙虾做市场拆解,我让他把路边摊场景拆成三类人,摊主、喝酒、客户、配送员。摊主最关心的是别麻烦,能分成不影响出餐。客户最关心的是价格,透明,扫码就能点,能不能送到桌边 配送最关心的是路线、库存和订单,别乱。第二步,让龙虾帮我写话术, 不是上来就推销,而是跟摊主说,你不用押货,不用收钱,不用管售后,桌上贴一个二维码,有人下单,你拿分成卖出去你多赚,卖不出去你零成本。 这句话一说,摊主就容易听懂。第三步, codex 上场,我让 codex 按这个场景直接做一个扫码点单小程序原型,前台给顾客看酒名、价格、口味、库存、下单按钮, 后台给我们看订单、摊位编号、配送状态、今日流水,再加一个,摊主分成自段,每个摊位自动记账。第四步,让龙虾继续当运营助理, 他帮我整理商品文案,比如果香型、麦香型、入门款、微薰款,还帮我生成桌贴文案,烧烤都点了,要不要喝点好的扫码点单送到桌边,这比我自己憋半天强太多了。 第五步,我们开始小范围测试。先找三家熟悉的烧烤摊,不谈大合作,就说试两天,每张桌贴一个二维码,顾客扫进去能看到明码标价, 摊主不用解释,也不用拿菜单。人最怕的不是贵,是不知道多少钱。不好意思问,跑通以后,我又让龙虾做复盘,哪些酒点击高,哪些下单低,哪个摊位转化好,哪个时间段订单多。 codex 在 帮我把后台加了一个简单统计页,不用复杂,能看懂就行。结果试跑了几天,确实有回款。不是说一夜暴富,而是一个很清晰的 ai 小 生意闭环跑起来了。 发现需求, ai 拆流程, codex 做工具,龙虾写话术,做运营,看数据,人负责去谈摊位,处理真实关系,把服务做好。 我现在越来越觉得,普通人用 ai 赚钱,不一定要做什么惊天动地的大项目,你身边的小生意、老流程、信息差、重复活,其实都值得用 ai 重新跑一遍。 如果你也想要这套龙虾加 codex 的 小生意拆解资料,扫码点单、原型思路,摊主话术模板,欢迎进社群获取免费资料,我是牛哥,继续带你把 ai 用到真实赚钱场景里。

今天是我们 codex 的 第一讲 codex, 它到底解决什么问题呢?其实 codex 最值得讲的地方就是它把 ai 写代码拆成了四种工作方式, c l i、 ide、 桌面 app 和 cloud。 你 可以在终端里面慢慢改,也可以把它 交给 cloud, 在 云端上慢慢跑。那接下来我就带大家一起来看一下这四种形态。好,我们先来看 c l i, c l i 适合及时的迭代,然后来读代码、改文件、跑测试、解释、报错,你坐在旁边验收它,一步一步来推进 c l i, 你 可以在终端里面直接去输入 codex, ok, 当你看到 openai codex 以及它的 model 显示的时候,就代表你已经进入到 c l i 里面了。接下去你就可以直接跟它去进行一个交流,比如说我现在可以切换对目前最高的,它就指到 g p d 五点四, codex 的 桌面板目前已经支持 windows 和 mac, 这里你看到的就是 codex 的 一个桌面版的一个页面,它就比较适合多任务并行。你看我在一个界面里面,这里就打开了深图的,然后打开了很多做课件的,对吧?以前还有一些做项目的,它是完全都可以并行的,包括这里会展示一个自动化的一个入口,就我配置了一个日报和 ai 日报的一个素材沉淀, 还有一些插件。啊,这个我们在后面再去细聊。那接下去我们来看它的第三种形态,是 ide, ide 的 话,你可以在 vs code 或者是 codex 里面都能够看到它的一个 codex 的 面板。我现在点击 codex, 在 codex 里面,我们在左侧面板的上方点击这个下滑箭头,看到这个 codex 就 可以进入了, 那这里恰巧是我用的比较少的地方,像 ide 呢,它比较适合你,左侧就是派发任务,右侧来看代码,比较适合已经习惯在编辑器里面工作的朋友。 好,那最后我们来看一个云端的入口,可以打开你的浏览器啊,上面就会有啊, g p t 点 com code 在 这里呢。云端的入口呢,比较适合后台的任务,你可以把你的仓库和任务交给他,他会在一个隔离环境里面跑,最终给到你一个可 review 的 一个结果,这里你就会可以选择你的一个 github 的 一个远程仓库了。今天这一节呢,我们主要来认识一下 codex 的 四种工作方式。 ok 啊,今天我们就先分享到这里,拜拜。

给大家分享一个小技巧,就是豆包,它可以去解析呃抖音视频,而可能鲜为人知是现在 codax 操纵电脑的能力非常非常强,于是呢,你可以给他以下的这几个提示词, 让他直接去打开你的抖音,去每一条每一条的分析,还可以让他去通过用豆包 直接获得文本,于是呢,你就可以自动化的让他去提取所有的信息,并且帮你去做自媒体的管理。当然了,还有其他的用处,大家可以发挥自己的想象。