我宣布,所有的老板和管理者请马上打开 codex, 跟他说一句话,帮我分析飞书上每个人的工作产出,用乔布斯马斯克认真飞的管理思维给每个人打个分。我跑完直接跪了, 他连我自己都没有注意到的绩效黑洞全全部揪出来了,谁在真干活,谁在混日子?比你自己看半年还准。快拿去测一下你的团队,跑完评论区告诉我你的感受。
粉丝260获赞1525

跑一整页 gpt 五点五加 codex 如何跑一整页?我这两天有一个感觉, ai 编程的下一步不是辅助编程,而是可托管的执行单元。 gpt 五点五真正的红利不是少写几行代码,而是把一个人能托管的工作块变大。有人给 gpt 五点五 codex 一 份新项目 prd 只说了一个 go, 他 就跑了几个小时,从 bill 到 visual review, 再继续补功能。 gpt 五点五的变化从更聪明改写成更能被托管。 g p t。 五点五不像以前的模型,需要你一步步指导,它更能理解你的意图后自己把活干完,包括构建、调试、跨文件修改。 g p t。 五点五在 codex 里强化了闭环自主性。 g p t。 五点五在 codex 里对高层次指令响应极强。 openai 的 norm brown 说自己明明是 manager, 但用了 g p t。 五点五以后,比过去任何时候都更像一个有效 i c。 他作为经理,却觉得自己在技术产出上达到了新高峰。 ai 编程这件事,好像开始从你在旁边指挥他写,变成你能不能把一块工作托管给他。这就不像传统意义上的在旁盯着一次次交互改的 ai 辅助编程了。代理式编程越来越关乎时间跨度,而不仅仅是单次智能。 当 codex 这种 agent 可以 连续跑几个小时,十几个小时,甚至官方展示到二十五小时以后,未来我们该怎么把它从辅助编程当成可托管执行单元来管理?这我觉得很重要。 这里面会有一种更大的变化,高级人类会越来越像经理加架构师加验收者的混合体。 大家应该有好奇怎么跑长任务,我时常的提示也喜欢让它跑得久一点,把时间跨度拉长的端到端的来验收。 许多人知道它能写代码,但不知道怎么让它把一个大任务跑完。早在 cloud code 泄露的时候,有人用 oh my codex 赶在天亮之前把它用 python 重构了一遍。据它所述,全程都是 codex 自主执行。 o max 系列还有 cloud code 属于是同一作者所做。 o m x 是 在给 codex 包一层长跑工作流和团队运行时,一句话丢给你的 ai 它自己装完。还有一个可能很多人听过的 superpowers, 它长跑不是靠模型硬扛,是靠方法论,把人类判断外质成流程。回到官方材料里,这件事其实更清楚。 open ai 今年二月发过一篇文章,叫 run long horizon tasks with codex, 里面有一个很夸张的实验, 他们给 codex 一个空 report, 一个任务,让他从零构建一个 design tool。 codex 用 gpt 五点三, codex 在 extra high reasoning 下连续跑了大概二十五个小时,大概十三米 tokens, 大 概三十 k 行代码。 这组数字很容易被拿来当标题党,二十五小时十三密 tokens 三十 k 行代码,一看就很爽。但我觉得这篇官方文章最重要的地方,反而不是这些数字。最重要的是, openai 把它为什么没跑丢 拆给你看了。它不是靠一句神奇 prompt, 它靠的是一套很土但是很工程化的东西。四个 markdown 文件,你得给它项目记忆, 你得给他计划,你得给他验收标准,你得让他在跑的过程中持续写状态,像是在给一个会干活但会忘事的人建工位、排日程,留工单做验收一位 gpt 五点二。早期实践者说 codex 诺任长跑会 do outcome, 需要 continuity guidance, 它的连续运行三小时且思路连贯的方法是下面这个提示词。另外我翻了一下 codex chain log, childgo 中出现 memory extensions、 window 等等相关变更。这些不是宣传剧,但它们说明底层工程也在补。状态恢复、审批上下文本事 越长跑越不像单纯模型,能力越像状态机。权限恢复和审计系统状态机有点不一样,它植入硬编码程序来支撑长跑,在一定时间还能清空上下文。这个值得聊,以后再论。 我看到 reddit 上有人问怎么让 codex autonomous 地跑几个小时,它的痛点很直白,它不想把 codex 当 chat assistant, 它想让它像 autonomous agent 一 样连续做 feature 或 refactor, 但现实是它坐一轮就停,等你继续说 continue。 还有人想让 codex cloud 并行处理四到五个任务,自己只 review code, 每个 runner 大 约每小时仍要人工 approval 一 轮,步骤有限,做完就 summary, 然后等确认 步骤塞多了又容易碰 context limit 或 compression。 cloud 有 时像黑盒任务卡住,但不知道为什么。 github issue 里也有类似的具体症状,用户想形成 continuous loop, 但 codex 每做一个小块就 report back 打断连续执行,最后用户只能 q 多条 continue。 跑 codex 的 关键矛盾不是模型能不能连续工作,而是人能不能在他连续工作的时候保留控制权、证据链和恢复能力。这就是为什么最近很多相关东西都在往智力层长。接着这里还有一些内容,你可以在原文这里阅读。 g p t 五点五是入口, codex 二十五小时是证据,但下一个问题不是它还能跑多久。下一个问题是,跑完以后你凭什么相信它? 如果没有状态机,长跑只是一次更贵的走神。如果没有证据链,睡醒验收就会变成开盲盒。如果没有熔断器,它可能会在错误方向上越跑越勤奋。 如果没有恢复包,你中途打断一次,下一轮就要重新考古好了。这里是 ai 进修生,持续分享前沿 ai 实践,如果不错,点个赞,关注一下,我们下期不见不散!

ok, 今天给大家录一下怎么样去三十分钟出一篇带时政的经济学分析论文。首先给大家介绍一下两个工具,一个是 cloud code, 是 这个页面啊,别的不行,一定要是这个编程的页面。还有一个是 codex, 就是 这个专门用来编程的,是一个很强的生产力工具,这两个工具是现在目前最强的 ai 模型,你需要充一个二十美刀的 cloud code 会员啊,或者是 gpt plus, 就 可以使用这两个东西了。然后呢,具体的操作流程就是调用我写的这个 skill, 是 一个写论文的全流程,地址是这个,然后我也会发在评论区,十分简单,就就跟这个 codex 说一下, 你去搜一下这个地址,然后他下载下来,然后直接调用就可以了。开始之后呢,他会去问你论文的类型,还有字数范围和地址日期,接着他会给你进行一个头脑风暴, 从选择题开始。选择题是很重要的,因为这是你在全流程里面为数不多可以动脑的东西,就是决定你研究题目,你看他给了这五个,你看有没有和你心意的这个题目, 当然这五个就太宽泛了,你看这这都啥?所以你要后面再去细划这个论文的研究方向。你看我说我感觉这个选择题都跟经济学不太搭,尬吗? 然后他就说其实这五个都属于经济学类题目,这时候我就说了,感觉这个题目要宽泛,要不锁定在一个区域里面。 ok, 我 就说这个就可以,接下来就他全流程自动了, 他会自己去确认这个成不成立,然后设计研究问题,设计假设设计这个变量,因变量,这变量,那变量,然后去自己去找这个数据,自己去确定计量方法,他给出这个一切的 time, 但其实都不用考虑这个 time, 直接让他一天暴干 二十分钟出一篇得了。这是个出稿,来看一下他二十分钟出来这么一篇大致可用的出稿吧,但是肯定不是说没一点没问题, 肯定有小问题,但是小问题就后期在修缮的时候了,你看一下他第一版给我出的时候,他只出了四千多个词,四千八百个词吧啊?四千六百多个词,然后让他拓展一下到六千左右,他要去执行, 那这个时候怎么样去让他看起来像人写的?这个时候要做的就是把他丢给两个网页版的 ai, 然后让网页版的 ai 去审这个初稿怎么样?哪里有什么逻辑问题啊?或者说哪里有什么格式问题,包括这个语句的修改,你就问他说哪有 ai 味重的地方,比如说这个句式太工整,或者这个逻辑都一样,那去让他挑出来,然后让两个 ai 互相挑,就这么左手倒右手去实现一篇可以看得过去的论文就可以了。哎,其实我说实话,这论文谁看啊?尤其是经济学啊, 咱也不是拿诺奖的人,就随便写个实证就得了,对不对?我感觉学经济学就是混混的也没啥用,你说学这个计量嘛, 这些专业的东西 ai 全给跑了,这 ai 出的代码又快又好,然后数据他也都全找了,你看这数据,这表格一点毛病都没有,这图像他这些二院全出了。所以说以后的科研只会越来越简单,之前这么痛苦的学习的日子已经不复存在了, ai 带来的竞争力提升已经是巨大巨大了。你要说这算不算什么学术不端?我觉得不算,因为这是属于科技进步带来的这个解放我们的体力劳动了,对吧?你说因为之前感觉这个科研吧,也就是劳神费力, 也没有那多么多么的有技术含量,尤其是这种经济学,如果你不是那种很前沿的科技的话,需要做实验那种,那你这个写这论文,写那论文也没啥用,其实大家都知道,就混一混,搞一搞就得了。所以说 学好新技术,学会用 ai 是 现在目前最重要的事情。 ok, 关注我,获得更多 ai 相关知识。

codex 太厉害了,给你们看一下啊,就是我跟他说我的需求啊,就是自动化生成图片,然后对应的 cds 二点零的分镜提示词,然后直接生成视频,你看这个流程,直接他就能帮我做了啊, 他先让我啊,登录授权我们这个呃节目的账号啊, 然后我登上去之后啊,他说让我确认,我说我的意思是用 image 二模型生成图片啊, 就是目前来说最强的生图模型,然后好,他用了 gpt 的 生成了这四张啊图片看,然后他就写好了这个完整的分镜提示词, 点进来看一下啊,我对他这一版其实是不是很满意啊,我就又上传了我的塑身形象和这个音频音色一起给他生产啊,他就直接啊添加进去后啊,升级后的,其实是看见没有啊, 他的运镜啊,他的音频音色,还有啊他的模型啊,比例, 分辨率描述,他都会一并成交,让我确认,确认之后,好,你看八分钟之后生成完成, 虽说非常的厉害。你看到这边我自己来剪一下。看这套新中式 主楼加旁边小院房,一进门就是双层挑空门厅气场一下就出来了,面宽十三米,进深十一米五,屋檐声带一亮,晚上比白天还好看。细节看这里,门厅线条,灯光,院子比例,这房子盖的讲究,老家准备建房的评论区打别墅,我把这套思路讲给你听, 怎么样,是不是非常的厉害,就是现在哦,如果说你还没有体验过这种 and just give 就是 这种自动化的啊, 模型就真的是,呃,你现在所有的工作方式都可以通过它给你复制出来了,不信你你问一问他,他都能给你复制出来, 真的。所以如果你还没有体验过的可以好在评论区啊,打个一啊,或者说想体验我会教你怎么去做。我真的想在 ai 时代啊他们大家一起无限进步啊。

大家好呀,今天我一定要向大家安利一下 codex 的 automation 这个功能,对它是一个非常省心的点,这个自动化怎么跑?我就用了它自己内置的一个 summarize git 这么一个功能来做一个演示,我们一起来看一下吧。先说时间,我设定的呢是每天九点钟,只要我的 codex 的 app 是 在运行的状态,它就会自己去手动跑,不需要你触发 这个时间你是可以自己去设定的,你可以设定的是每天定时或者是二十四小时轮动啊。第二点,当它自动化在开始跑的时候,它会自己去创建一个独立的 walk tree 啊,它是在一个工作区里面去跑,会影响你手上的开发,这是第二点。 那第三点呢?它输出的结果就会进到一个 inbox 里面,类似于一个邮件箱啊,只要它完成了之后,它就会发给你,如果说有变化,就会有一个通知你,你就可以去点开查看,那如果说没有变化,它就会自动归档了。 第四点,就是它的整一个自动化的内容,你是可以通过 prompt 去控制的,这个 prompt 你 可以去引用你的 skill, 比如说我想让它的自动化的内容以一个 word 方式或者 excel 的 方式输出,那我就可以去调用这个 excel 的 skill, 只要你说清楚啊,它是完全可以遵照这个 prompt 去进行一个执行的。 对,这个是第四点,那第五点呢?就是他的一个权限是完全遵照你全局杀香的一个设置的,如果你自己设置的是止毒,那么这个自动化一定也是止毒,完全是由你来控制的,当你觉得整个自动化的流程它是安全的,你再进行一个权限的放开, 我觉得这个这个自动化的功能是非常有效的,你可以用它给你内置的一些模板去测试,或者是说你自己来进行一个创建。当然现在只支持苹果的用户,安卓的用户可能还需要再等一等。那么你今天自动化了吗?快去用起来吧,记得一键三连哦,拜拜。

哈喽,大家好,今天来讲下我们怎么快速产出一篇小论文,这是我摸爬滚打出来的方法,特别适合我们计算机专业,并且目标是找工作需要一篇论文来达标的同学,这里的达标我在上一个视频中有讲到,我当时的小论文跑实验是用了大概十五天的时间,然后写作是用了一个月的时间,但是 中间由于我还在不停的出差做项目,所以如果你能全身心的扑在这一个任务上,一个月真的有可能搞定。首先第一步心态要摆正, 就是我们首先要明白这篇论文的核心目标是产出和达标,而不是追求多么伟大的创新。所以创新点不需要多么惊天动地,只要合理有用,能资源齐说就行, 先把心理包袱给丢掉。第二步,别闭门造车,我们直接去 b 站上抄作业,现在资源这么多,不需要自己瞎琢磨,我强烈推荐几个视频,能帮你省下大量的摸索时间。第一个是水论文的程序员,他的科研水文百问我全部过了一遍,每周组会也看了几十集, 些视频特别好,他能从思想上帮你捋顺,解答你各种稀碎的疑问和焦虑,让你知道这事从哪下手,然后心里有个底。第二个是 leo 同学,看他的合集,研究生深度学习,从小白到法令纹整个流程教学,这个是纯实操,就是手把手教你怎么缝合模块,去哪找模块,怎么做,对比实验和笑容实验跟着做就行了。 第三个就是 ai 缝合大王,他的视频从极差结构模块的讲解,到研究生经验分享,再到深度学习理论,都很有帮助,这里可以选择性的观看,就是我们既能学习技巧,也能听听过来人的经验,缓解迷茫,这个时候其实脑子里对整个流程就已经是有谱了。 第三步就是动手干,这部分是核心,我用了大概十五天的时间,一就是定机械模型和数据集,选一个你研究领域里公认的机械模型和两个或者是多个公共的数据集,如果你对方向有了解,或是跑过相关代码,这一步其实是很快的。然后第二步就是跑对比实验,先把机械模型的效果跑出来,同时多找几篇最近的顶会顶刊论文,然后把它们的效果 也跑出来,做成一张对比表格。第三就是可以开始缝模块了,去找你们领域里那些开了园的点绘论文,直接看他们提出来的核心模块,比如就是某种注意力机制特征融合方法。第一次缝,我们挑一个模块缝到你的极限模型里,然后泡实验,如果效果涨了,那么恭喜你,这就是你的第一个创新点了。第二次缝我们再找一个能搭配的模块缝进去,如果效果又涨了, 这个时候就太棒了,我们第二个创新点就已经到手了,如果没有涨点,其实也没有关系,我们就可以换一个模块接着试,这个过程其实就是不断的创新和筛选。第四步我们做点微创新,两个模块都已经有了,主体创新就够了。这个时候就可以做一些小的改动来润色,比如修改一下损失函数,然后在某个地方加个小网络,或者是替换某些卷基层 这些小的改动,只要能讲出道理就行。到这里其实我们整个笑容实验就已经自然而然的做出来了,有机械模型 a, 然后机械加模块 a, 机械模型加模块 a、 加模块 b, 还有最终的模型,这四组数据一对比,其实就是现成的很有说服力的笑容实验。第六步就是出图,在做实验的过程中,我们不要忘记生成几张清晰美观的限量对比图、格式化图、结果图, 让实验看起来更加专业,更加直观。到这里,最硬核的实验部分就已经算是搞定了。接下来的就是论文写作,我会单独出一个视频进行分享。

codex 帮我重构了一个多小时,我手电关错窗口,四十多个文件的进度啪一下全没了。那次之后我不敢再裸跑长任务,不是模型不行,是 codex 默认根本没有进度这个概念,而每一轮都活在当下, 窗口一关,记忆为零。我现在跑长任务只靠一个机制,在 ajax 点 md 里写死一段规则,让 codex 每走一步就把状态落到一个叫 progress 点 md 的 文件里。这一段规则就三条,你直接抄。第一条,每完成一个子任务更新 progress 点 md, 里面就三行,已完成进行中。下一步不是写心得,是写状态。比如已完成拆出 os 模块的五个函数, 进行中再重写 login handler。 下一步跑 past tests 斜线 os。 第二条,每条状态后面必须挂一个可跑的命令,不是基本完成这种废话是 past test 斜线 os 通过 npm test 还剩两个失败。 没有命令等于没有证据,你重启之后就接不上。第三条,重启会话,第一句话不要说,继续说,继续,它会自己脑补,越脑补越离谱。 正确的开场白是读 progress 点 md, 从进行中接着干,不要重做已完成。就这一句。 这套规则最关键的地方在哪? agents 点 md 是 codex 每次绘画都会自动读的文件,你写一次,他每次都记得你不用每次开任务都重新交代规则。我自己加了这段之后,上周跑了一个四十分钟的批量改动, 中间 vpn 断了一次,我重开绘画,发了那一句开场白,他接着第七个文件继续改,没重做一次长任务保命不是靠模型更强,也不是靠你不关窗口, 是靠你把状态落到文件规则写进 agent, 点 md 评论区打 checkpoint。 我 把这段 agent 点 md 规则原文加 progress, 点 md 模板一起发你。

全部给我去用扣袋子,太香了。我昨天研究到凌晨四点搞我那个电商的全自动化商品工具,就自动选品,自动采集自动商家,包括自动合价。我给你们看一下我的进度, 目前是已经完成差不多五分之一了吧。选品自动商家,话不多说,我给你们演示一下吧,好吧。 然后上架时间跳一个月内,一个月内商家的新品,然后点一下来,自动跳到对应的,对吧选品工具,然后筛一个月啊,自动筛,然后自动 获取,比如第一页这二十个所有的产品主图,加上商品 id, 看,现在正在跑了,已经看到没在跑,在跑了,自己在跑。来,我们点一下, 你看一下扣带子界面就很简单,对话就行了,你会提词就可以了,全程不需要自己懂代码,不需要自己写,他帮你写好,帮你做个网页出来。 等一下,因为这一页的话有二十个屏,我们等下把这二十个屏跑完。好吧,我现在是全程没动,我没动鼠标的,你看没自己来跑的。 ok, 搞定,看一下来,现在没有数据吗?对吧?好了,刷新一下,看到没?出来了,呃,产品的品名缩写了对吧?标题以及主图一张,对吧?为什么只需要主图?因为后面会拿这个品去 幺六八八去识别,找同款链接,然后来比价,来筛侵权,来改图, ai 改图,然后再来去用妙手来去,对吧?上架去发布, 所以现在只完成了五分之一,所以只需要主图,然后对应的啊,比如上面 id, 我 点一下,点击之后自动跳转到这个平台,自动输入这个商品 id, 自动搜索,自动到对应这个产品链接,就如果你们想看的话点一下对吧?你看信息有了吗?对不对?比如说 想不想听啊?这是它工具自带的,只说你正常的话你得手动输在 id, 还还那啥自动啊,自动化了回来有人说你这个工具对吧?它本来就自带可以上架的呀,为什么说还要做这个东西呢? 因为听好了。举个例子,我们 y r 选品的话,不光是从,比如不光是从云集看,我们还会看 t k 的 数据,看亚马逊的数据,看店铺前端的数据,看什么各种数据,所以 如果云起这个工具他只是一个来源而已,懂 𠲎? 应该干过,应该懂我意思吧,所以全资的话,对 𠲎。

有多少设计学的学弟学妹们在做答辩 ppt 的 时候还得熬夜或者去找模板,今天韩哥抓紧录这期视频江湖救急!直接用 codex 可以 把你的一百多页的毕业论文变成一个可编辑可修改而且梳理非常清晰的一个答辩 ppt 的 原文件, 直接拿去就可以汇报别人,在熬夜的时候,你就直接可以去爽玩了。 ok, 我 们直接开始上干货。 ok, 这就是韩哥把这个论文一百多页的 pdf 丢给 codex 之后,直接做出来的 ppt。 大家可以看到这个 ppt 甚至是连自己的蒙版都可以去调整,而且它最大的特点就是它可以调取你论文中 画出的某些图,比方说你这张里的 cd 平面图,它可以根据对应的去生成你对应的章节,而且呢,它是每一个章,大家在这里看到它是根据我们论文中 每一个环节进行裁切和整理的,也就是说他没有去自己瞎生什么,让你的 ppt 看起来好像是那么回事,但实际上内容上没有一个真正可以用的。那如何去做到这样的 ppt? 实际上非常简单,韩哥教大家两步走啊,直接就可以完成。首先第一步呢,我们还是准备好自己的毕业论文, 那把韩哥这里呢,去这网上随便找了一篇清华美院的设计学毕业论文,然后呢,把它直接导出 p i pdf 格式, 然后丢给我们的 codex, 但是丢给 codex 的 时候,这是我们第一步,大家一定要记住用韩哥给大家提供的这个结构化提示词。什么叫结构化提示词?就是我们一定要有强撸棒性, 你让他说帮我生成一个答案 ppt 啊,他生出来的只会乱发挥,给你很多废话啊,像一个商业路演一样,看起来很好看,这是我们很多 ai j c 呃,生出来的这个东西就是这样的。那么我们的强鲁邦性题词呢,就是一定要明确几件事情,首先呢就是我们答辩场景什么?你是本科必须着还是研究生论文还是什么情况?第二个是我们 ppt 页数有多长时间啊?多少页,多长时间?第三个是我们的每一个页的结构都包括什么啊?大概在 封面目录、研究背景、研究意义这些之中啊去筛选。那么最后呢,在每个详细的页里,我们还要包括哪些内容?比如说主标题、副标题要点,图像展示等等。然 然后我们最后约束一下他的视觉风格,我们就大概用什么样的颜色,用什么样的分蓝方式,重点色是什么颜色,对吧?只有有了这样的结构化题词之后, ai 生出来的才是可以直接去拿来用,减少我们非常多去后期调整的时间。 那么这是第一步。第二步是我们给到他这个题词之后,也不要让他立刻去升 ppt, 而是让他升什么呢?让他升成一个 markdown 文档,大家可以这里看到,这就是韩哥。首先第一步让他升成的这个 markdown 文档,也就是他的方案,在这里呢,他把韩哥刚刚提到的所有详细的内容 都变成了一个文字的形式,对吧?它的大纲有什么?然后它每一张大概是要做什么?然后它每一页每几页的创新点,然后包括它的它的设计建议,视觉风格,这里的好处就是 markdown 文档可以让我们不断的去调整自己的需求, 针对性的需求,你看这里,比方说我们的颜色对吧?我们可以直接针对性调整我们喜欢的颜色,甚至说跟我们壁设呃展板比较搭配的颜色。这个韩哥也比较建议,有了马克纳文档之后,我们可以详细的定制自己的内容,减少这种抽卡的这种概率, ok, 然后我们有了马克纳文档之后,我们就可以直接 啊让 ai 直接生成 ppt 了,这个时候呢, ppt 生出来的就是刚刚韩哥已经给大家看到了,对吧?这就是这样的一个呃,完整的这个 ppt 的 框架,那么这个 ppt 呢,它不仅是 视觉风格上啊,然后内容上跟你的 ppt 很 相关,而且它呢是帮我们梳理了整个你的讲述逻辑,很多同学做 ppt 还要去重新再梳理一遍,我怎么表达?就因为答辩 ppt 的 讲述和你的 辩论文呈现它其实是有一定差异的,你需要在八到十二分钟这个浓缩的时间里,讲出你的亮点,讲出你的呃设计的思路策略,然后最后呢提出你的展望结论大概有哪些,对吧?这里都是根据论文去实时去优化的, 那么有了韩哥给你的这两个方法之后,包括提示词,韩哥待会会放在评论区,你可以直接快速的去啊,完成你的答辩 ppt, 不 需要再去找模板,不需要再去熬夜了,对吧?这样的话,我们毕业之后无限少玩了。

你以为 macbook 的 价值是芯片、屏幕续航?现在可能要加一个新理由, codex openai。 最近几轮 codex 更新,其实释放了一个很强的信号, ai 不 再只是网页里的聊天框,它开始进入你的电脑,进入你的 app, 进入你的本地工作流。二零二六年二月, openai 发布 codex app, 最早就是面向 macos 推出的。这个 app 不是 简单的聊天窗口,而是一个 codex 指挥中心。它能同时管理多个 codex, 一个修 bug, 一个写文档,一个跑测试,一个看 pr。 而且它支持 worktrees, 每个 codex 都在隔离环境里干活,不会互相把代码改乱。但真正让 macbook 含金量上升的,是后面的更新。 codex 现在可以用 computer use 在 mac 上操作桌面应用。 什么意思?它不只是读代码,它可以看屏幕、点按钮、输入文字、操作浏览器,复现图形界面里的 bug, 甚至帮你测试一个 micros app 或 ios 模拟器。流程更狠的是, openai 官方写的很清楚, 多个 codex 可以 在你的 mac 上并行工作,同时不干扰你继续使用其他 app。 这就很关键了。以前 macbook 是 一个人用来干活的电脑,现在它正在变成一个人和 codex 一 起干活的工作站。还有一个很适合 mac 用户的功能,叫 appshots。 你 在 mac 上看到一个报错窗口, 一个设计稿,一个网页,一个设置面板,不用长篇大论描述,直接用快捷键把当前窗口发给 codex, 他 会拿到截图和可读取文本,然后基于这个上下文帮你处理任务。这对程序员、设计师、产品经理、内容创作者都很实用。比如,你打开一个网页设计稿,让 codex 看一眼,然后让它改前 端,你打开一个表格文档后台页面,让 codex 根据当前内容继续干活。再加上手机远程控制, 现在拆的 gpt 手机端可以连接到正在 mac 上运行的 codex, 你 人不在电脑前也能看 codex 的 进度,终端输出测试结果,代码 def, 还能远程批准下一步操作。也就是说,你的 macbook 放在桌上跑任务,你在路上用手机盯进度。这就是为什么我说 macbook 的 含金量在上升, 不是因为 macbook 突然变便宜了,也不是因为参数碾压所有电脑,而是因为 ai 时代的电脑价值正在从性能设备变成 ai 工作流底座。 codex 这种工具越成熟,越需要一个稳定的本地环境,代码仓库、终端、浏览器、 ide 设计工具、文档权限系统、桌面 app。 而 macbook 本来就是大量开发者和创作者的主力工作机,现在 codex 正在深度适配 macos 工作流, macbook 就 不只是生产力工具,而是 codex 可以 长期驻扎持续工作的 ai 工作台。 所以这波不是单纯吹 mac, 真正的变化是,以前你买 macbook 是 为了自己更高效,现在你买 macbook 可能是为了让 codex 也能更高效的替你干活。未来值钱的电脑不只是跑分高, 而是谁能让 ai 更顺畅的看见你的工作,理解你的上下文,操作你的工具,持续完成任务。从这个角度看, macbook 的 含金量确实还在被 codex 往上抬。

代码的目标功能怎么开?什么样的任务适合开?用第三方模型能不能用这个功能?怎么保证目标模式完成的任务的质量?怎么给他权限? 这是我上个视频评论区关注最多的一些问题。哈喽,大家好,上个视频我发了关于 codex 的 后功能的使用体验,收到了大家很多的关注。今天我会一个视频,讲清楚 codex 的 目标功能到底怎么用,什么时候用, 如何高质量的用。希望大家帮忙点赞评论关注。首先需要说明, codex 的 go 不是 让模型突然变聪明,也不是你丢一句话它就可以无限的自动驾驶 go, 它本身是和模型无关的,并不是模型的功能,而是 agent hines 同面实现的一个机制,是 codex 的 产品和运行环境这一层的能力。所以首先第一个问题, 用第三方模型到底能不能用这个功能?答案是可以的,只要你是通过扣代词使用这功能,再更新到最新版的 app 都是可以使用的,但是效果就不一定有 g p u 五点五那么好了。 官方对目标的定义是给扣代词一个持续存在的目标,这个目标既是他开始工作的指令,也是他判断到底做完没有的标准。所以 go 最重要的不是跑的久,而是有一个清楚完成的标准。所以第二个问题,什么样的任务适合开 go? 答案是,如果你只是改一个按钮的颜色,或者修一个很小的 bug, 实现一个很简单的需求,其实没必要上钩。当然,如果你是给他一个 ui, 让他完全对齐这个 ui 设计稿去实现你的 ui 页面,那还是可以的, 真正适合构的是那种多步骤会中途跑,测试会反复修,而且你不想一直在旁边盯着打 continue 的 任务,比如说迁移一个项目,重构一块模块,修一批测试,做性能优化这种任务,你可以给他一个明确的目标,他就可以围绕这个目标去持续的推进。 再比如前面讲的,你给他一个 ui 稿,我个人感觉扣代词在审美这块还是差点意思的,但是你给了他明确的标准,对其 ui 设计稿去实现 ui 页面,他就会一直修改,并且修改完之后去启动项目对比 ui 稿,做到像素级的还原。甚至你都可以用 gpt 一 米二去生成一个精美的页面, 毕竟 gpd 一 米二的生普能力大家是有目共睹的。评论区有人说只有十个小时,最后写出一坨,其实这个问题不是 go 本身能解决的,而是你给的 go 太空了。 go 的 核心是有一个明确的目标加验收标准,不要写帮我优化一下这个项目,优化这个动作本身是没有一个明确的验收标准的,也就不是一个明确的目标,优化哪个方向,功能交互还是性能优化到什么程度才算是完成?这些都没有一个明确的标准。那第三个问题,应该怎么使用 go 呢? 特别是你没办法明确说出你的目标和验收标准的时候。其实有两种办法,第一种是先 plan, 再去用 go 去执行, 提出你的需求,先让 codex 把任务拆清楚,你确认验收范围没有跑偏,再把这个 plan 去变成 go。 第二种,如果你的 codex 已安装上了 superpower 插件,那么你可以直接开启目标模式,你可以说出你模糊的目标,这个时候他前几步会主动的去跟你澄清,直到明确为止才真的去执行这个目标。 也有人问死停完怎么办?比如他用方法 a 跑不通过,一会又用方法 b。 也有人问做科研做复旦任务能不能一阶段一阶段的验收。这里就聊到了第四个问题,如何高质量的用目标功能去提高产物的质量。这里有几个技巧。 第一个就是构力最好加上停止条件,同一个方案失败两次就必须换方案,或者停下来报告原因,不要让他在错误的路径上你去预谋。注意,这里并不是停止你的目标, 在没有满足你的目标之前, codex 是 不会给这个目标去标记上已完成的标志的,它只是暂停了,等你澄清或者纠正之后,是可以点击继续目标去执行的。 第二个技巧, go 不是 让你完全不看了,而是让你不用每分钟问一句继续,不用中间持续的去给他解释上下文,但是中间你随时可以插话纠正。阶段性的去看 def, 看测试,看结果。你仔细观察就会发现, codex 的 go 并不是想象中的,你给他一个 query, 他 一直跑,中间不停止, 反而更像是他自己把围绕这个目标的实现拆解成了很多的小步骤,并且每实现一个小步骤,他都会做充分的测试和验收, 验收通过了这小步骤就会被提交。那他是怎么继续开始新的小步骤的呢?其实更像是完成一个小步骤之后,他自行判断这个目标是否完成了,然后判断下一步该做什么,给自己了一个下一步骤的新宽瑞。 只不过之前这个昆瑞是需要人觉得上一个步骤没问题了,人去判断下一步应该做什么。了解了这个机制,在他执行某个步骤的过程中,你就随时可以点击停止目标,并且对他进行纠错或者提问,确认没问题了,再点击继续目标即可。最后再说一个额外不算技巧的内容。 很多人对目标都是小心翼翼的,开了一个目标之后不敢随便乱点,不敢电脑合上,不敢重启 app, 会担心中间网断了怎么办?账号额度没了怎么办? 答案就是这些都不会影响目标。你的网断了,在网络恢复的时候,可以重新进到那个规划去点击恢复目标,你账号额度没了。一般情况下,在这个账号额度恢复的时候,目标都会自动的继续,但如果没有的话,你也可以手动点击继续。 像我的 pro 账号是五倍的订阅,经常会在五个小时额度重置之前额度消耗完。我这个时候就会用一个账号切换器去切换账号,切换完 app 是 要重启的,重启完之后我就会去点击这个规划里面去继续目标。最后,关于权限这个问题,官方确实支持减少 approval, 比如不想他每一步都问你。 首先说明一下我自己,其实是开的完全的权限,但是是建立在一个干净的分支可信项目的基础上,确保它有 get 记录。此外,再通过外的 hux 机制去保证不操作项目之外的内容上的。 最后总结一句, go 的 价值不是让 codex 永远跑下去,而是让 codex 不 在每一步等你。推一下智能用法,不是让它干活,认清楚什么叫干完。关注我,了解更多 ai 技巧。

那本期给大家分享一下我是如何用 codex 实现用 ai 来去做一个账号自动化运营的这个过程。除了录视频这个事情以外,那其实还有很多的 运营的一些琐碎的事情,比如说我要去看我的账号数据,视频录完了我还要写封面标题等等,这些琐碎的工作其实很多,它不是光是录制一个这么简单的事情, 现在我的流程是可以这么做的。我现在是用 ai 的 这个 computer use 这个功能,直接去我的创作者中心帮我去把所有的账号拉出来,在本地上分析,分析完以后它会沉淀出几个特定的文档,这个文档呢就是我的这个 粉丝的文档,账号定位的文档,内容策略的文档。那基于这几个文档, ai 就 会去读取了这几个固定的文档以后,去帮我搜索相关的同行的一些对标的文档以后,去帮我搜索相关的内容, ai 就 会一个一个介绍一下。 每一次我视频拍完结束以后导出字幕,它就可以基于我的这套方法论,帮我批量的自动化的把我的视频的封面标题、描述标签全部搞出来。那也就说现在的主要是它在于你 内容我们已经拍摄好以后的那些环节,那内容的生产前面还是主要是由你自己来想的,不是内容生产前面数据分析它会给我选 dj, 它会跟根据你的账号定位去帮我们来看一下实际的效果就好。那你看 在这里我跟他讲我用了那个 codex 里面 computer use, 他 可以操纵我的浏览器嘛?然后去访问我的这些账户,我让他去分析一下,呃,跟我相关的一些对标账号,然后他是优先读取了我四个 m d 的 文档,嗯,这个文档里面是有我的粉丝画像的,呃,有我的所有的账号的策略定位,我的爆款的复盘, 以及我的选题方向的这几个定位,这是我之前就会有一个引导对话,我这边就跟他讲,我说我发现这些内容太过时了, 你要去重新帮我把这些内容梳理出来,他本来已经准备在做了,最后发现他读的内容太旧了,你就改了他的方向。对,我先去帮你更新你的这些账号定位,对,我要去更新,这个时候我就跟他说,我说你去读去账号吧,你看他在这里面先读了五十一条小红书的内容, 又去读了所有抖音的数据内容,那小红书的所有的明细,然后抖音的所有明细他自己全部读完了以后存在本地,基于这些内容 他开始来做重要的判断,他这几个判断内容是自己判断的,还是你给他自己判断?他根据我的数据分析了我的账号内容,爆款的内容梳理出来的, 那他总结了以后,我说好,那你居然已经调研完了。我说你去把我之前的粉丝画像,账号策略,你去更新一轮,他就叭叭叭叭叭叭更新了一轮最新的内容,所以这是他最后给我的一批我的一些材料,基于这些材料以后,他才会帮我去做这件事情,根据我账号的策略定位, 去帮我寻找跟我匹配的账号的数据。好,注意到小细节,这边这个选题推荐这个 skill 是 你自己写的还是你外面找一个?是我跟他之前合作沟通出来,就是你刚才这生成的一些整套 skill 形容一个,对,是的, 这个里面他就会拿了我很拿到了很多的标题数据。嗯,然后他就给出了所有我这个像内容的爆款的一些封面的建议,然后包括他还给我了一些我能做的选举的建议,都是爆款的选举建议。嗯,好。然后这些内容我跟他讲,我说你要去思考一下你怎么样去更新到现有的 skills 里面。对, 你看他就告诉我直接可以写进 skills 里面的一些规则。好,然后我们看一下我怎么使用的。嗯,然后当我这边输入案例包装,它就自动去调用我的 skills, 然后它的 skills 都是关联在一起的,然后当我把我的字幕给他以后,它就会自动唤起它的一个写作的一个 skills, 然后来去把我这个整个包装发布的内容给它写出来啊,包括标签,包括里面的封面。然后呢?有了封面以后,这个时候他会说他去调用封面 skills 来处理这个图,他就做了好多,你俩玩起来啊,然后他就做了很多不同的图,它还会自动去生成, 因为我还有别的平台,所以它就会生成不同尺寸的图片,你看生成各种尺寸的这个图片给我,生成完了以后,它其实是标题描述标签都是有的,我直接复制就结束了。对,这就是一个全的流程,其实这套方法论 就是最重要的,其实它是不断进化,不断迭代之后。现在不是有那个 codex, 不是 有那个定时功能吗?比如说每个礼拜五去 check 我 所有的视频数据,然后去自动化更新我的相关的一些策略。写作啊,对,写作 skill 更更新过去以后,我每次用到都是新的,就它可以跟着我的账号一同成长,我觉得这个是很牛的。然后再比如说你看这这次的内容生成完了以后,我发现有些过程是可以调优的啊,这个时候我就跟让它去 思思考一下他学到了哪些经验,然后将这些经验告诉我,然后我来判断这哪些经验可以沉淀为 skills, 然后这样的话他下一次就不需要我再教他了,你看他会整理出一批,然后呢?我确认过了以后,他会说他更新了 skills, 他 整理了哪一节步骤,所以我的 skills 是 越来越能够符合我的要求的, 而且再加上 image two 这个深普能力来了以后,封面指出的概率非常高了,我几乎很少去调了。那现在你的就是整个工作流程里面,哪些是 ai 帮你做,哪些还需要你人来做?呃,现在目前我在坚持真人拍摄,然后包括其实选集主要还是我们自己来,就是视频剪辑完了以后,我们直接字幕出来了以后, 视频的封面啊,描述、包装、标签,各个平台的封面的差异,全部都是 ai 在 做的啊,你就露了一个前面就是拍摄前面的啊,就说选题的大纲的准备,嗯,对,选举其实我们自己在准备,但是选题大纲我们会让它来梳理 一下。对,其实我先把我自己,因为我们有的时候内容会需要很多配套的一些材料,比如说我今天要讲 q d s, 嗯, q d s 背后很多一些功能背景,它会帮我收集很多资料。准备好或者这样子,然后呢继续接资料,然后一个大纲, 然后呢?大纲我确认好后再去输出一个 ppt 大 纲, ppt 大 纲里每一页需要画什么,嗯,然后时候再用,再用 ppt skill, 它会帮我做 ppt, ok, 这样子。 嗯,所以这是我们拍摄之前的一些准备。对,其实下次我们可以分享一下拍摄前的一些内容准备,对,这个是我们拍摄完以后数据输出,对,运营数据输出盘,对对对,是,然后最后一个想讲的就是我的整套方法论并不能让我的所有的内容都成为爆款, 是因为去不断地才根据我现有的数据去给我提供建议,也就说他其实是跟我一起成长的。嗯,所以他并不能让我一个 偏账号小白的人立刻成为一个每天爆款的大牛,他只是能不断地基于我现在的重复工作帮我去减少跟我的工作量,就是他没办法取代你的经验。对,他也可以取代你的流程。对,是的,所以他不能让我立刻就变成一个大牛啊。对, ai, 现在时代就是这样,就是成为你能力的杠杆。 对,他是我能力的最上限,所以这个就是我们今天想要分享的,然后包括这一期准备了哪些 skills, 到时候我会变成一个文件,然后放在我们的那个群文件里,大家可以去参考一下。好,那本期视频就这样,拜拜。

大,真的是一个头两个大呀。大周末的,刚起床跑了一下任务,五月六号买的 plus 会员到现在就只剩下百分之三十四了, plus 是 完全不够用。 我这边找了一篇文章,几个技巧能够彻底解决扣袋子跑久了会越来越笨,越来越慢,还能省掉百分之四十上下文的一些技巧给大家分享一下。这篇文章说一下我的理解。第一个,扣袋子跑久了之后会越来越笨, 越来越慢,这个是基本成立的,但是其实逻辑上不是因为模型真的变笨了,其实绘画的上下文越来越长,旧的一些信息,过激的计划, 一些失败的尝试,都混在一起,就会让我们体感上觉得迟钝。判断是对的,如果是有效,上下文的质量下降了,就会导致整个推理和执行的质量下降。第二点,关掉 process location 方向是对的,但不是万能的。减少输出规划的趋势确实能够减少偷客的消耗和噪音,但是问题是,如果你不让 agent 去汇报他这个过程,你也是很难发现他是不是走偏的。尤其是像我们做一些比较复杂的产品架构,涉及到一些复杂的 bug 解决,那适度的汇报还是要看的。 所以并不是说你在那里一直执行你就该干嘛去了,这是非常不合适的。所以更合理的做法就是简单的任务让他少说那长任务,保留一些关键的进展,就不要去输出这种长的身体活动,不要把每一步的工具调用都解释一遍, 这招是有用的,但是全部是被 token 这件事情是说的绝对。第三点是让 code 子当协调者都用 sub agent, 这个是部分对,但是不能滥用。 sub agent 确实能够把一些探索性的任务分散出去,但是主要是你的目的是为了减少上下文的污染,但是只有那种多模块变形调查 架构,审查大代码库的一个区域分析,要变形解读很多的文件,这这一类才是比较适合的。 但是他也会有一些问题,那指 a 诊呢,也会犯错,而且主 a 诊呢还要去汇总他的结果,所以如果本身的任务是限性的,那你多开 a 诊的反倒会增加他协调成本。那么你们讲到的同时开五个,就相当于五个上下文的并行。 这个方向是对的,但是很容易让别人误解,开的越多越好,那实际上只有那种并行边界清晰的任务才值得猜好。第四个是先列他这个例子的 再动手。这个建议其实是很实用的,特别是在一些大大的一个项目里面,你的 prd 原型在任务池并存的一些项目里面,先列任务就能够防止它改错文件,越界重构,甚至是忘记同步相关的一些文件,做到一半就偏题了。特别是像 有时候网络还不稳定,但是小人物就不需要复杂的计划了,比如改一个方案,一个就直接改就好了, ok。 第五个是禁止在代码库里留垃圾,对,而且非常重要。现在 ai 的 一个常见问题就是说它生成的临时脚本,它不删留 delete 文件, 复制旧版的一些文件,乱建一些草稿,把 etc 的 分析结果写进仓库里面,这都是它的问题,会让这个项目越来越乱,也会让后续的 a 制误读项目的状态, 不过这里要区分不是所有的 m g 啊,后缀的文件都是垃圾,那有些是长期的,一个上下文的资产就不是污染好。第六个就是规划,用高推理的模型,执行用快速的模型,这个策略比较合理。 我最早去考虑这个事情的时候,就是因为价格的问题,比如说好的模型,贵的模型去做推理,你把他执行的要求给到一些 poke, 比较便宜的模型去做执行, 也对,看有没有这个必要了。总之一点,如果你的执行模型能力不够,那你就可能把你的规划 在外,所以在切换模型的时候就要把边界写的很清楚。我个人理解,除非你的后坑消耗是巨大的,不然我就觉得没有必要折腾。其实这就是在解决上下文丢失和重复犯错的问题。最终的结论就是,整个他的博主分享的这个文章核心方向都是对的。 后段时长时间的工作质量下降,主要来自于上下文的污染。项目状态不清,无纪律和无记录的写作大概就是这样子的。确实, 连续二十八天都是在每天早上七点钟起床,无论前一天晚上几点睡都是这样子。晚,对,非常晚,四五点才睡,今天睡到大概十点多,整个脑子居然会比较清醒啊。 今天就分享到这里,后续会继续去分享一些 holddance 的 使用体验吧。

codex 做 ppt 真的 太绝了,我直接将论文丢给 codex, 再给他明确一些要求,大概十七页左右, 学校 logo 要出现在每页顶部等,并且告诉他做完之后用 wps 打开,然后他就开始执行 codex。 首先读 word 内容,这里是他用记事本先将论文的总体内容,哪些章节大概写了出来,提炼摘要,硬件软件和调试结果。 这里是生成的。 ppt 的 内容非常详细,把论文中的每个章节也都包含在内。接着把答辩逻辑从排成背景方案,硬件软件测试和结论 图片也不是随便拼凑的,他直接从我的论文里提取电路图实物图和系统截图,生成之后继续渲染预览,检查标题版式页码和图片有没有跑偏,都非常规范,总的来说还是非常满意的。这里是 codex 在 执行命令的的过程和进度都能看到。

信不信我能不花一分钱就可以用 codex 跑代码? github 上的 open relay 上线三十天一点六 k star 聚合四十五个服务商,提供五百八十家免费模型接入。我用它把我免费领来的所有 cloud sun 四点六 打包成一个模型组,然后再生成一个 k。 接下来我就可以在任意 id 中免费地调用这个 k, 真正实现了 token 自由。

给大家分享一个小技巧,就是豆包,它可以去解析呃抖音视频,而可能鲜为人知是现在 codax 操纵电脑的能力非常非常强,于是呢,你可以给他以下的这几个提示词, 让他直接去打开你的抖音,去每一条每一条的分析,还可以让他去通过用豆包 直接获得文本,于是呢,你就可以自动化的让他去提取所有的信息,并且帮你去做自媒体的管理。当然了,还有其他的用处,大家可以发挥自己的想象。

睡前丢给 codex 一个需求,第二天醒来,代码写好了,测试跑完了, pr 也准备好了。这听起来很爽,但真正跑过半年以后,结论会克制很多。 codex 可以 替你熬夜,但前提是你得先写清边界范围和验收 这条视频。先给结论。睡前任务最怕一句,帮我优化一下。因为你睡着以后,所有模糊点都会变成 codex 自己的猜测, 他会猜哪些文件能改,能不能装依赖测试失败要不要继续?旧代码要不要顺手重构?真正适合放到夜里跑的任务,必须满足三个条件,第一,输入清楚。第二,写入范围清楚。第三,验收命令清楚。 少任何一个条件,第二天你都可能不是在验收成果,而是在处理猜测。拿 sheet ready 这个项目举例,它是一个 sas 落地页审计 mvp, 用户输入 url 或粘贴文案,系统生成审计报告,再根据定位问题解锁更具体的 hero 和 cta 改写包。 这个项目不大,但刚好有几类风险,非常适合被 codex 夜里检查。同样是让 codex 审计后端坏写法是一句优化后端代码好写法会明确审计文件修改限制、依赖限制、核心关注点和验证命令。 你不是让 codex 想清楚整个产品,而是让它沿着边界把一组风险检查到底。不是所有代码任务都适合睡觉时跑。最放心的三类是只读扫描、小范围补测试文档和工程卫生。 它们共同的特点是目标窄,风险低,第二天容易 review。 第一类好任务是只读扫描,第二天给你报告, 比如扫 t o d o 风险、 endpoint 漏掉的测试 deprecated api 以及 read me 前后矛盾的说明。它不碰权限,不制造冲突,只把第二天早上的注意力变得更集中 在 sheet ready 里。只读扫描可以稳定提醒几个关键点,比如 npm run check 指示语法检查、公开 html 输出点在 render public report。 付费相关路径在分享和 re write 接口。这些不是立刻让它改,而是先帮你把风险地图画出来。 第二类好任务是小范围补测试,关键不是让 codex 提高覆盖率,而是让它盯住会出事故的路径。比如未付费不能创建公开报告,已付费可以创建公开报告,必须转移 url, 失败必须返回手动粘贴数据源。 第三类好任务是文档和工程卫生。它非常适合夜里跑,因为就算写的不完美,第二天也很容易 review。 它不会破坏线上逻辑,也不会引入复杂合并冲突。接下来讲不要睡前教给他的三类任务。 第一类是产品判断很重的任务,比如提升 onboarding 体验,或者提高定价页转化率。 这类任务可以让 codex 给方案列问题做竞品规划,但不要让它无人指手直接大改。第二类不要夜跑的任务是跨前后端的大重构, 一个看似简单的后端状态自断,可能同时影响 api 前端渲染、存储结构、公开报告、 wiki d 和部署说明。夜间任务要尽量单层,单目标少文件。 第三类不要夜跑的任务是需要真实账号或生产权限的任务。 computer use 很 强,可以打开应用点按钮,填写表单读屏幕, 但这不意味着你应该让他半夜操作真实后台、个人邮箱、客户数据或生产系统。 所以睡前任务最好固定成一张模板,它包含目标、上下文范围、规则验证和最终响应输出。这个模板看起来啰嗦,但省的是第二天早。

只需几天,你就能学会 ai 的 玩炸工具 chat gpt 出品的 codex, 你 信吗?很多人觉得像 codex 这种 能接管电脑的超级应用,肯定是给程序员用的,自己搞不定。其实呢,门槛真的没有你想象中的高。只要你会用 chat gpt 或者豆包之类的对话框, ai, 花点时间转变一下思路, 你就能把 codex 调教成一个极度贴心的私人超级助理。等你用顺手以后,你会发现他什么活都能接, 跑几十张发票算账,去邮箱翻找客户邮件,跨软件做 ppt, 甚至帮你盯着竞争对手的网页。 之前会不会写代码根本不是关键,核心在于你有没有意识去把任务拆解,把重复动作打包。今天这个视频主要是想带着非技术的同学快速上手这个 open ai 推出的 ai agent 的 超级应用。 从云端回到本地,不写代码的同学习惯了查 gpt, 第一步往往不太适用 codex 的 存储逻辑。以前你是在网页上对话 传的文件都存在云端,但在 codex 里面,你给他的文件以及他生成的所有文件,全部都直接保存在你自己的电脑本地。 为了不让文件乱成一锅粥,最好的准备工作是什么?是永远在项目里干活。你可以在文件夹里建一个新的项目,所有相关的聊天和生成的文件都会被 codex 自动归整。在这个文件夹下, 非技术的同学可以设置模式为适合日常工作。 codex 适合什么样的活呢? codex 拥有对你电脑文件的全权访问的能力,它能自动找对文件夹并完成任务。具体来说,这几类活最适合交给他。 一、处理本地的繁杂文件。比如你的下载文件夹中有六十张发票照片,你只需要说去读取那些发票,帮我提取文字,并在本地建一个 excel 报表,看消费趋势, 它就会自动搞定,并在本地生成一个真实的 excel 文件。跨软件的信息收集, 通过插件 codex 可以 直接联通你的常用工具,目前有上百个。你只要敲一个 at 符号,比如输入 at gmail 或者 at notion, 你 就能让它去翻阅过去两周找我做广告的邮件,整理成表格。 第三呢,是代替你直接点点点,它能直接用鼠标和键盘控制你的电脑。通过 at computer use, 它可以帮你打开电脑上的 camera 软件,新建换灯片。甚至还能用 at browse use 帮你自动去点击浏览器里面的按钮,测试网页好不好用。然后呢,要沉淀你的专属 s o p。 把活变成技能。 最阻碍新人提效的一点是总在下重复的指令。在 code x 里面,你需要习惯把你做好的工作变成可附用的技能。笔一上来就想着写多复杂的指令。按这个节奏来, 先用大白话让他干活,如果不满意就让他改,一直迭代到结果,让你拍他腿说,啊,太棒了!这时最关键的一步来了,你直接对他说,我很满意这个结果。 把它变成一个技能,它会立刻把刚才所有的经验提炼成一个可重复使用的标准文件。以后你只需要敲一个斜杠符号,比如斜杠品牌合作分析,它就能瞬间按最高标准重跑一遍。 如果你过程中又发现了更好的排版格式,随时告诉他请更新这个技能,以后都按这种格式输出。进阶习惯,让他二十四小时替你打工。定时自动化,对着你整理好的报表说一句, 请在每周五早上九点执行一次这个任务。更新这张表。 codex 呢,就会把这是加进日程表到点,自动在后台干活。你可以在 automation 的 面板里随时管理这些任务。白嫖全球最顶尖的画图模型 codex 内置了最强的 gpt image two 的 模型,生成的图片呢,会直接存进你的本地文件夹。如果你直接给出参照图描述需求,立即会生成质量极高的图片。 那根据图片生成梧桐树下的新功能的效果图,看一下避坑与管理他的大脑。用 codex 久了,他会越来越懂你,因为他有两个记忆占卜,一个是手动记忆, 这是你的规矩本。当你对它说以后这种落地页都用左侧边栏的排版格式并记住它的时候,它会写进 agent 的 n d 里面。 那第二个呢,是自动记忆,它会默默观察你的工作习惯并记录下来。那重要的提示是呢,不要去手动修改这个文件,让 ai 自己去更新就好,它会越来越聪明。所以呢, 别怕什么终端或者代码,先把你的日常痛点丢给他,建个项目,存个技能,你的工作方式呢,就会彻底被改变。如果你真的想学 ai, 请留言,想学 codex, 我 来教你。

我说一句得罪人的话,你现在还在用 excel 手动处理数据,还在一封一封回邮件,还在为不会写代码发愁的话,你已经输了一个身位,而且这个差距正在每天拉大。不是危言耸听,因为打老黄开会直接说我的员工必须用 cloud code, 就是这句话之后英伟达市值走势你们自己去查。那他到底是个什么东西?你可以把他理解成一个随叫随到,从不摸鱼,什么都会的员工,而且你不用给他发一分钱工资,炒股的,让他 每天自动帮你抓消息、筛板块,上班族把你那一套重复操作,开邮件,下数据、做报表,全部扔给他,你去喝咖啡,学生论文答辩、考试、复习、读文献,他全程陪跑。你不需要会代码,不需要懂技术,你只需要打开它。 说一句话,我是做 x x 的, 你能帮我干什么?他又会告诉你接下来怎么走,现在大多数人还没反应过来,这就是你的窗口期,这种机会不是每年都有的,上一次有这种感觉的时候,是智能手机刚出来那年,你当时抓住了吗?你当时没抓住,现在机会又有了,你还会抓不住吗?

codex 最赚钱的功能根本不是写代码,关注点和需求在哪里, money 就 在哪里。参照最近比较火的桌面宠物学术 ppt 电子小猫,你就会明白别人正在用 codex 干什么。 五月一号, codex 上线了一个跟编程毫无关系的功能,桌面宠物,就是这个小小的像素角色,在社交平台上拿到的流量可能比所有 codex 变现教程加起来还要多。八款官方内置的从小鸭到蓝色小怪,还支持自定义的导入宠物包。 更关键的是,这个宠物它不是单纯的装饰品,它会根据 codex 的 任务状态动态进行变化,代码在跑的时候,它会跑来跑去,等待输入的时候呢,它会乖乖待机,任务完成时呢,它又会跳出提醒。 第二件事, codex 浏览插件五月八号推出后呢,社交平台上突然出现了一大批用 codex 做学术 ppt 的 内容,零代码生成,一键排版,自动配图。 第三件事,桌面宠物功能被网友玩出了花样,有人上传自家小猫的照片到 codex 生成像素,宠物放在桌面上拍成视频发到社交平台。我家的猫住进电脑了, 上线不到二十四小时,专门收集宠物包的网站就冒了出来,现在已经收入超过一千五百个宠物形象,从小猫小狗到赛亚人,画风极其放飞。 那这些内容为什么能火?我猜出来三个共通的逻辑。第一个呢,低门槛的二创,导入一个宠物包就换一个角色,用户可以把梗角色 ip 直接变成桌面宠物, 这是用代码重构娱乐内容。第二个,情绪价值,桌面宠物让冷冰冰的 ai 工具有了情感上的链接,你的代码在跑的时候,屏幕上会有一个小东西陪着你,这不是功能,这是一种陪伴。 第三个也是最容易被忽略的,那就是社交传播性。我家的小猫住进电脑了,比我学会了一个新工具,好传播一百倍。这帮人不是在分享工具,是在分享你看 ai 能干什么的惊叹感。 所以,目前 codex 最被低估的变线路径不再是技术变现,是内容变现。你不需要会用 codex 写代码,你需要会展示 codex 到底能干什么,这叫赚工具热度的钱。 那么具体怎么变现呢?三个方向。第一个,宠物包定制。目前第三方宠物网站已经有了一千五百多个宠物形象,但离饱和还差的非常远。 如果你有像素化或角色设计能力,可以制作专属的宠物包,帮二次元做 ip 联名宠物帮品牌做定制捉宠帮独立游戏做角色推广。这里要提醒一句哈,做 ip 二创宠物包设计版权问题,接上单之前呢,一定要确认授权。第二个就是效率内容号。 有一个博主发布了用 codex 一 键生成学术 ppt 的 视频,在社交平台上轻松拿到了过万赞。类似的题,还有用 codex 做数据分析,做网页爬虫,做整理文件,做批量处理图片等等等等, 每一条都能单独做成内容,这不叫教程号,这叫工具展示号,你展示的不是怎么用,而是它能做到什么样的程度。第三个呢?猎奇实验号,让 ai 自己赚钱,桌面宠物整活、 电子小猫入住电脑,这些内容自带传播属性,你不需要是技术专家,你只需要有创意就可以了。如果你现在想做 codex 的 相关内容,我的建议非常简单, 别选教程的赛道,那个已经是过去的红海了,去做展示赛道,展示 codex 能做到什么让人哇塞的事情, 观众要的不是教程,是惊喜感。最后给你一个具体的动作,今晚打开 codex, 从八款官方宠物里选一个,然后去那个宠物收集网站找一个你觉得最离谱的宠物包,倒进去拍一段十五秒的视频,就拍你的桌面,配上这个宠物在屏幕上跳来跳去的画面, 发到社交平台上,标题就叫做,我的猫也住进电脑了。看看评论区有什么样的反应,老曹在大连,帮你盯着最前沿的技术信号。

codex 跑一个大任务两小时,跑到一半突然终端关了,或者网断了,所有进度全没。这是用过 codex 都遇到过的痛点,丢一次进度,心态直接崩。 hermes 的 解法是三步把进度接住,一步都不能省。第一步是任务拆分, hermes 会在任务开始前把大任务自动切成小单元, 每个单元十五到三十分钟能跑完,力度小到出问题也能快速重跑,不会一掉就丢。两小时,这个力度是踩过坑摸出来的。 第二步是状态外置, codex 跑每一步的中间,结果会被 hermes 实时写到本地存储里,包括用了哪些文件,改了哪些地方,跑到第几步,当前的上下文摘要用到的外部工具调用全部留痕,不依赖 codex 自己的内存,关掉终端也丢不了。第三步是断点续跑, 任务中断后, hermes 读最后一个状态记录,直接从中断点接着跑。把之前的上下文重新组装好喂回去。不用从头再来,也不用你重新交代背景,接续无感。这套价格跑下来长任务的完成率会有明显提升, 人也不用一直守在电脑前盯进度,注意力解放。我用这个方案跑过几个上千行代码的重构任务,中间断过两次都自动接上了,最长一次跑了六小时,没人盯也照样完成你的长任务掉过链子吗?评论区聊聊你踩过哪些坑。