好,我现在用 codex 啊,去做一个管理我电脑的一个方法啊,整理电脑文件,比如说我现在在 codex 输入一个命令,整理好我 桌面的文件,不要删除任何文件。好,我现在就给他一个完全的访问权限,然后直接执行。 好,他给我一个回复啊,不会删除任何文件。开始整理可以看到我的桌面啊,其实也不是很乱的,但是呢,只是在做一个测试。 好,可以看到瞬间把这个整理完成了啊,五月十一号这个整理,然后给我说出来一个结果, 对吧?然后他把它分类表格文件、其他文件、图片、网页文档文本打开,你看这里有网页文件啊,所以呢,你看它这个比那个 manos, 它基本上已经可以替代这个 manos 的 这个功能了,就是 codex, 它的那个手已经可以伸到 啊这个 windows 电脑里面去了啊,一个简单的视频。
粉丝15获赞66

国内用户如何使用 codex? 这个视频我将教大家不需要解决网络问题的情况下完美使用 codex 软件, 避免使用 codex 时提示输入手机验证。我们需要准备两个软件和一个网站,那两个软件呢?分别是 codex 和 cc switch, 一个网站就是我们要选择接入哪个模型,或者是我们使用的 api 中转站。首先我们可以到 codex 官网来下载,我们可以直接打开这个网址,国内用户是不需要上网环境就可以打开的, 打开后我们可以直接下载,如果你是 windows 电脑,这里会出现 windows 的 版本, 我们直接点击下载就可以。第二步,我们打开这个 cc switch 的 github 仓库,我们可以直接输入这个网址来打开,在这里我们选择下载它的对应版本,点击后我们向下滑动, 在这里我们可以找到不同的客户端,我的电脑是 mac, 所以 我选择 mac 版本,点击后直接会下载 这里你如果没有配置好上网环境的话,下载这个客户端会比较慢,那我在这里已经帮大家下载好了,并且已经上传到了云盘,如果需要的话,你可以在评论区留言,下载好后我们正常安装就可以。 现在我们打开 codex, 现在我们可以看到它,让我们选择登录,这时如果你没有上网环境的话是无法使用的, 那现在我们就用到了第二个软件 cc switch, 我 们正常安装 cc switch 后,我们选择打开它。 打开这个 cc switch 后,我们看最上方的这一栏,我们选择 codex, 在 首次配置时默认是只有最上方的这一个官方 api 的, 下面这三个都是我自己配置的,那如何配置自己的模型或者 api 呢?我们点击这个加号, 在这里我们可以选择不同的供应商,也可以自己填写供应商的名称。那我这里以这个 ai go code 的 这个 api 网站为例,点击后我们看到这里的参数,它已经帮我们设置好了, 我们现在只需要填写一个 api k, 那 我们可以打开它的官网,在这里我们点击登录或者注册,如果首次使用的话, 它是需要充值额度的,充值好后我们可以点这个 api k, 然后在这里我们可以看到这个 codex 有 不同的两个分组,我们可以选择这个速度更快一些的,或者性价比更高一些的。 我们点击这个创建,可以给这个密钥起一个名称,然后点击创建,这时它会生成一个密钥,我们选择复制,然后把这个密钥粘贴到 cc switch 中, 我们选择添加,添加好后我们在这里点击起用,这时我们再将 codex 重启一下, 这时我们就可以看到他现在可以正常使用了。这里我全程都是使用正常的上网环境,我们来测试一下,帮我生成一张,欢迎大家点赞收藏。评论的图片要求十六比九的比例, 它现在已经按我的要求可以正常对话,并且可以生成图片了,而且调用的还是最新的 emoji 二模型, 并且全程不需要登录,不需要其他的上网环境。我们接入第三方 api 的 话,也是用多少花多少。这个方法主要是针对那些没有上网环境的同学, 如果你在安装过程中出现了任何问题,都可以在评论区留言,我会给大家逐一回复, 下个视频我将教大家如何具体使用这个 codex, 它和 cloud code 有 什么区别?我们下个视频见,欢迎大家点赞收藏评论。

我这两天看我们那个后台啊,很多朋友在问那个关于 qq 的 一些问题啊,呃,首先是怎么订阅的问题,因为第一个呢,我是有一张香港的信用卡,呃, 但是呢,这张香港信用卡他是没有办法直接在 oppo ar 的 官网里面去绑定那个付款方式的,因为香港的卡也不支持。 那我是取现救国的方式啊,我是用香港的信用卡,因为我有一区,有一个美区的苹果 id, 然后我是在苹果官网里面去订购一个两百美金的充值卡,然后通过充值卡的形式,然后充到我的那个 apple store 里面,然后再通过 apple store 去订阅 open a r, 然后其中有一个要注意的点啊,如果说你是第一次使用啊,你需要订阅的费用应该是两百 二十美金,因为 open a r 有 一个比较恶心的点呢,就是它没有办法去升级,就是扣你的那个差价,呃,它是要一步一步的,然后打什么要一步一步呢?就原先它是没有 pro, 直接让你选 pro 的 这个选项,你必须先购买了 plus 啊,然后才能申申请那个,呃,才能升级为 pro, 那 你的 plus 会员已经花了二十美金,对不对?那它是不退的,所以说你必须第一次订阅的话,你就必须是要花二十美金,再加两百美金,等于 二百二十美金啊。然后你等你到下一个月订阅的时候,那这个费用它是呃就直接相当于你的下次的升级的话,那就正常去扣两百美金就可以了。

大,真的是一个头两个大呀。大周末的,刚起床跑了一下任务,五月六号买的 plus 会员到现在就只剩下百分之三十四了, plus 是 完全不够用。 我这边找了一篇文章,几个技巧能够彻底解决扣袋子跑久了会越来越笨,越来越慢,还能省掉百分之四十上下文的一些技巧给大家分享一下。这篇文章说一下我的理解。第一个,扣袋子跑久了之后会越来越笨, 越来越慢,这个是基本成立的,但是其实逻辑上不是因为模型真的变笨了,其实绘画的上下文越来越长,旧的一些信息,过激的计划, 一些失败的尝试,都混在一起,就会让我们体感上觉得迟钝。判断是对的,如果是有效,上下文的质量下降了,就会导致整个推理和执行的质量下降。第二点,关掉 process location 方向是对的,但不是万能的。减少输出规划的趋势确实能够减少偷客的消耗和噪音,但是问题是,如果你不让 agent 去汇报他这个过程,你也是很难发现他是不是走偏的。尤其是像我们做一些比较复杂的产品架构,涉及到一些复杂的 bug 解决,那适度的汇报还是要看的。 所以并不是说你在那里一直执行你就该干嘛去了,这是非常不合适的。所以更合理的做法就是简单的任务让他少说那长任务,保留一些关键的进展,就不要去输出这种长的身体活动,不要把每一步的工具调用都解释一遍, 这招是有用的,但是全部是被 token 这件事情是说的绝对。第三点是让 code 子当协调者都用 sub agent, 这个是部分对,但是不能滥用。 sub agent 确实能够把一些探索性的任务分散出去,但是主要是你的目的是为了减少上下文的污染,但是只有那种多模块变形调查 架构,审查大代码库的一个区域分析,要变形解读很多的文件,这这一类才是比较适合的。 但是他也会有一些问题,那指 a 诊呢,也会犯错,而且主 a 诊呢还要去汇总他的结果,所以如果本身的任务是限性的,那你多开 a 诊的反倒会增加他协调成本。那么你们讲到的同时开五个,就相当于五个上下文的并行。 这个方向是对的,但是很容易让别人误解,开的越多越好,那实际上只有那种并行边界清晰的任务才值得猜好。第四个是先列他这个例子的 再动手。这个建议其实是很实用的,特别是在一些大大的一个项目里面,你的 prd 原型在任务池并存的一些项目里面,先列任务就能够防止它改错文件,越界重构,甚至是忘记同步相关的一些文件,做到一半就偏题了。特别是像 有时候网络还不稳定,但是小人物就不需要复杂的计划了,比如改一个方案,一个就直接改就好了, ok。 第五个是禁止在代码库里留垃圾,对,而且非常重要。现在 ai 的 一个常见问题就是说它生成的临时脚本,它不删留 delete 文件, 复制旧版的一些文件,乱建一些草稿,把 etc 的 分析结果写进仓库里面,这都是它的问题,会让这个项目越来越乱,也会让后续的 a 制误读项目的状态, 不过这里要区分不是所有的 m g 啊,后缀的文件都是垃圾,那有些是长期的,一个上下文的资产就不是污染好。第六个就是规划,用高推理的模型,执行用快速的模型,这个策略比较合理。 我最早去考虑这个事情的时候,就是因为价格的问题,比如说好的模型,贵的模型去做推理,你把他执行的要求给到一些 poke, 比较便宜的模型去做执行, 也对,看有没有这个必要了。总之一点,如果你的执行模型能力不够,那你就可能把你的规划 在外,所以在切换模型的时候就要把边界写的很清楚。我个人理解,除非你的后坑消耗是巨大的,不然我就觉得没有必要折腾。其实这就是在解决上下文丢失和重复犯错的问题。最终的结论就是,整个他的博主分享的这个文章核心方向都是对的。 后段时长时间的工作质量下降,主要来自于上下文的污染。项目状态不清,无纪律和无记录的写作大概就是这样子的。确实, 连续二十八天都是在每天早上七点钟起床,无论前一天晚上几点睡都是这样子。晚,对,非常晚,四五点才睡,今天睡到大概十点多,整个脑子居然会比较清醒啊。 今天就分享到这里,后续会继续去分享一些 holddance 的 使用体验吧。

昨晚 codex 来了一波大更新,这次是真挺猛的。首先说一下这个最实用的新功能, app shells, 以前那个 ai 描述问题要截图,要复制代码,最后还要手动解释半天。现在直接在 mac 上按住左右两个 command 键,当前窗口就直接传给 codex 了。这次不只是截图,是截图加文本一起打包进来, 重点在于它不只是读,你屏幕上的 vx 里只显示了五十行代码,没有问题。 codex 读的是完整的上下文,不是你肉眼看到的那一个页面。 整个生态也很丰富,比如说 figma 终端浏览器 notion 等等全部都支持,相当于把你的工作界面整个共享给了 codex, 效率直接拉满。第二个更新是 remote computer use, 手机上就能操控 mac 的 codex 任务,哪怕你的 mac 锁屏了都没有问题。 幻想一下未来的办公,电脑后台多个 a 程序在一起跑,你出门旅行没有带电脑,躺在床上也能指挥 mac 跑脚本发版本是不是方便多了?第三个是构模式正式上线扣代码了,现在 app id 插件 c l i 全线可用,你只需要给它个目标,它就可以自己保长线任务, 中间随时可以暂停或者改方向。我个人的小建议是,配合 plan, 请把方向锁定,加上 set, 随时开个临时对话窗口确认思路,再用 go 模式跑长线任务的时候会稳很多。最后是浏览器内置高级注视模式,可以直接在页面上标注修改甚至编辑元素, 比如说这个字太小,这个颜色不太对之类的视频的。最后我再补充一个细节,现在扣带才支持团队共享插件 team 版本的用户可以批量给其他成员分发插件包、技能、 m c p、 服务器等一起推,省去一个个配置的麻烦了。

每个月手机账单里都会莫名其妙多出几笔几十块的扣款,查来查去全是各种平台的会员自动续费。我敢说百分之九十的人都被这个套路坑过,而且直到现在你都不知道怎么彻底关掉这个坑人功能。先问大家一个最扎心的问题, 你有没有过这种经历?明明只是想免费试用七天会员,顺手点了个同意,结果七天之后钱直接被扣走,想退都退不回来。明明早就不用的软件,会员早就过期了,可他还是每个月准时从你账户里扣钱,等你发现的时候,已经被扣了好几个月,甚至好几年。 最离谱的是什么?你想关掉自动续费?翻遍整个 app, 找遍所有设置页面,就是找不到关闭入口, 明明开通的时候按钮又大又显眼,生怕你看不见,等到要关闭的时候,恨不得把入口藏到手机最深处,让你找都找不到。我之前就见过太多人,一年到头,光这种莫名其妙的自动续费就要被扣掉大几百上千块钱不多,但每一笔都让人窝火, 感觉自己的钱就这么被人悄悄拿走,连个招呼都不打。很多人会说,不就是几十块钱吗?至于这么较真吗?我告诉你,太至于了!这不是钱的问题,这是我们的消费知情权,是我们自己的钱,凭什么要被平台用这种藏猫猫的套路悄悄扣走? 他们就是抓住了我们的心理,觉得金额小,就算发现了很多人嫌麻烦,也不会去追讨,更不会花时间去关闭。就是靠着这种积少成多的套路,无数平台在我们普通人身上赚的盆满钵满。 我知道现在评论区已经有人想问了,那到底怎么快速找到所有自动续费订单?怎么一次性把所有隐藏的扣费全部关掉?被扣走的钱到底能不能要回来? 别着急,接下来全是干货,我用最简单的大白话,一步步教你全程,不用麻烦别人,自己一分钟就能操作完。不管你是苹果手机还是安卓手机,所有自动续费都不是在 app 里关闭的,这就是平台最忌讳的地方。 苹果手机打开设置,点击最上方你的头像,进入订阅选项,里面所有你开通过的自动续费全部看的一清二楚,不用的直接取消订阅,就不会再扣费。 安卓手机打开支付软件,找到右上角设置,进入扣费服务选项,所有授权过的自动扣费项目全部列在这里,一键关闭,就能杜绝所有隐形扣款。还有最关键的一点,很多人不知道, 只要是你不知情的自动续费扣款,在规定时间内都可以申请退款,大部分情况都能全额退回,不用吃这个哑巴亏。其实我们普通人赚钱,每一分都来之不易, 我们愿意为好用的服务、优质的内容花钱,这是我们心甘情愿的。但我们绝对不能接受这种藏着掖着、套路满满,把用户当冤种的隐形扣费。我们的钱要花在明处,每一笔支出都应该由我们自己说了算,而不是被平台用各种套路悄悄划走。 最后问大家一个问题,你有没有被自动续费莫名其妙扣过钱,最多一次被扣了多少?把你的精力打在评论区,让更多人看看这些平台的套路, 也帮更多人避开这个坑。觉得这条视频有用的,点赞收藏起来,转发给你身边经常用手机,经常开会员的家人朋友,别再让他们白白被扣冤枉钱!关注我,下期继续拆解更多生活里的消费套路,让我们普通人再也不被割韭菜!

codex 自带插件到底从哪看?先看左侧边栏,直接点这里的插件进去以后,顶部可以先切分类。第一次上手,我建议你先看 feature, 这里更像官方先帮你挑好的起步区。如果你想知道插件到底怎么参与工作流,可以先看一个真实势例。 这里是在插件页里选择要用的插件,接下来是在对话里发起这次任务发出去以后, codex 就 会开始接手处理 这一段,重点不是介绍某一个插件,而是先让你看懂插件是怎么被调用起来的。等你知道流程以后,再来看 feature 里的三个常用插件。 chrome 适合网页操作页面查看,还有按步骤执行浏览器任务。如果你想让 codex 帮你打开网页,点击页面检查结果,它会很实用。 spreadsheets 适合创建表格整理数据,也适合修改已经有的表格内容。 如果你平时要做清单统计表,或者把信息整理成表格,这个就很顺手。 presentations 适合创建和编辑演示文稿, 比如快速整理汇报结构,补全页面内容,或者先搭一个演示出稿,都很合适。所以第一次看插件,你就按这个顺序记,先找入口,再看流程,最后再按插件类型细看,就够用了。

如果大家在工作当中使用 excel, word, pdf 特别多的话,那么今天这个视频将会给大家每天起码节省一个小时左右。因为我在工作的时候处理报销比较多,所以我给大家演示一下我是怎么用 codex 来处理平时的我的一些日常的一些报销的。第一步,我会把我的这些报销单全部准备好,我这里准备了一些我平时购买一些 ai 软件的一些报销的一些单据,这里都是我的支付宝的一些 截图内容。我把这些内容全部准备好以后,我还会有一个公司的模板,这个是我平时公司的一个报销的一个模板。 在这里我们要做的事情就很简单,第一步,我们把所有的东西全部复制进来,复制到我们的 codex 里面,我告诉他帮我生成一个报销单,把数据全部填到我的这个模板里面,就是这么简单,我们敲一个回车以后,他其实 codex 就 在进行 思考,进行数据的处理了。 ok, 经过了六分钟的处理, codex 也是完成了自己的这个 excel, 我 们打开看一下它长什么样子,它的整个模板也是完全没有错,每一列都是对的,包括它这个数字二百四十五点三九,我自己也是较对过很多次的,是没有错的。最关键的是你 如果还有错误,你可以跟他继续聊天,直到你让这个 codex 完成你想要的这个表格。这第一步就完成了,我这里就不做演示了。第二步,最关键的是什么?你会输入这个 skill quertime, 就是 这个, 这个是什么意思?把你的刚刚跟他对话的整个流程全部记录下来,做成一个技能,那么 以后当你第二次还要重复的去做这个报销单的时候,你就可以调用这个技能,这个技能以后你每次去制作发票都可以去使用的。我给大家演示一下,这里打一个 skype 以后,你就跟他说 把刚刚的流程做成技能保留下来,我这样子告诉他,以后他就能够把刚刚的技能全部保存下来了。我们稍等一会,我们看这边技能也已经都完成了,这是一个 remasement from abuse 的 一个技能,已经生成好了, 就是填充报销灯的意思,他怎么去引用我们第三步,首先打一个斜杠,这里打出他的这个技能名称,我们叫 remasement, 敲一下回车,我们就可以利用这个技能了。如果大家后续像我一样去使用把这个报销的流程,我们就把图片发给他去 引用这个技能,我们敲一下回车就可以了。我这里就不做演示了。像我们刚刚这个整个流程是比较简单,但是如果你做了一些特别复杂的活,你把这个复杂的流程去封装成这么一个 skill, 会给你带来特别多的时间上的节省。 像我如果只做这个报销,我自己手动的去看每一张 pdf, 每一个订单,我可能要花半个小时的时间,那么我使用这个技能以后,我就不需要看我里面每一个金额是多少了,我只需要把它啪的一下全部丢进去,他就给我生成一个报销单,我只需要稍微核对一下,那么 这个事情我大概能从三十分钟节省到五分钟左右,特别方便,因为像在中间的处理的这个流程里面,我们都是不需要自己去再去关注他了, codex 他 会自己的去帮你做掉。 ok, 今天的分享就到这里了,如果大家有问题,评论区欢迎留言,如果有什么 ai 不 懂的,或者想让我出教程,也欢迎评论区留下你的这些问题。 ok, 那 么我们就到这里啦。

小白也能一键安装的 codeast, 它终于来了,比起来 openclo, 它更适合普通人,它能够操控电脑做 ppt, 调用 emoji 二拓图,还能自动执行你每天的任务。今天就手把手教你安装 codeast, 五点五 再带你使用四个能够真正提高工作效率的用法,记得点赞收藏。第一个就是内容自动化,在左侧点击自动化, 新建自动化功能。其实自动化就相当于定时任务,可以帮你自动执行很多重复的工作,你也可以在这里面选你想用的一个项目自动化的一个时间段,比如在这里,我就让他每一天发给我前一天的 ai 资讯后,点击这里的立即执行,就可以使用了。 同理,不管是日报、周报还是一些重复性的工作,比如签到都可以交给他,这样就可以省下非常多的时间。第二个就是办公软件的调用,你只需要告诉他,比如我想让他收集一下近两个月的金价波动,他就可以自己联网帮我搜集资料,整理成 word, 还帮我编辑了一个表格, 像栽秧的部分,甚至关键的一些节点,也帮我标明了图标,整个都非常的详细。接下来我们可以让它把这个 word 变成一个清晰可见的一个 excel, 分了不同类型,有价格节点、政策节点阶段,一个解读获取,一个观察,还是比较清晰的。可以把一个 sale 内容让它再帮我做成 ppt, 以及调用它的 emoji 二的升图功能。第三个就是 skill, 我 觉得 call this 的 在这一点上非常的友好,因为它安装 skill 过程非常简单, 几乎是我用过最省时的,你只需要给他一句话,或者是发一张截图,他就可以直接帮你安好 skill。 另外呢,你也可以点击左侧的技能,在里面选择你觉得比较好用的一些技能。这里给大家推荐几个我常用的 skill, 能够大大的提升工作的效率,操作电脑和浏览器,这也是 codex 的 非常好用的一个功能。 比如我现在可以让它帮我打开 b 站,替我搜索一下 codex 相关的搜索词,并帮我整理成 word 文档,你就可以看到它可以直接操控我的电脑使用,真正实现了电脑替我打工的美梦。现在你就会发现, codex 它不仅是一个聊天工具,还是一个可以直接帮你干活的 ai 助手。

今天有个重大的更新啊,可以在手机上使用 code x 了,我自己还没有更新,给大家来一个一镜到底啊,怎么去在手机上完成一个配置?好,所以你的 code x 要更新到最新的版本,然后左侧这个图标里面就会有设置 code x 移动版,我们推进看一看,点开 就是这个页面了,同步到你的手机啊,也要更新到最新的版本,我们点开有一个 code x。 好, 我们先在电脑上操作,点击开始设置允许你的手机控制条,电脑好,点击允许,这个时候你的移动设备就要去扫个码,你要拿着你的手机又说是苹果手机,用你的原相机去扫,看到没有,这里就会有一个打开的按钮,点击 点击连接,你看这里就有个授权的界面啦。这一步大家要注意,很多人在他的 app 里面找扫码的入口,没有一定要原相机去扫,这是第一个问题,第二个问题,有人扫了之后回到这个界面,还是等待桌面连接,我就这个问题卡了好久,六处提供解决方案,大家一定要注意看打开你的终端去安装 code c l i 的 能力这个命令, 然后装好之后输入这个指令,它就会帮你去配置,你不管它,它配置完之后,你这边就会弹出一个授权手机了,这个就可以弹出来了。好,这个时候我们点授权,继续再点授权, 等待它完成安全设置。这边已经可以看到我电脑的 code s 工作区了,再看看电脑端显示已连接这里可以点开, 这个是控制你的应用的,这个是控制你的浏览器的,可以点开安装一下,我之前没有装好,然后点击完成设置,我们对看一下操作啊,我们点一个昨天没有做完的,我们试一下,继续完成这个任务啊,帮我重新写一个最新的脚本。好,这是我刚刚发的一个指令, 这里面的功能跟桌面端的都是一对应的啊,这个是上下文的窗口的占用,这是对应的模型的选择都是可以的。好了,搞定啊,生成了一个五月十五号无一一的一个 m d 的 文档,我们继续回到文档上, 这是六叔放文档的地方,你看对应的文档已经生成了,终于可以在手机上去干活了,这个配置流程大家赶紧去试一试。好了,我是六叔,拜了个拜。

美好啊,朋友们,这是一期 codex 奶妈级的零基础系统教程,这期视频我会从安装开始,手把手地把 codex 的 基础能力到高级功能的组合,以及最新的手机端操作,用十个实战场景来带大家彻底拉通 以后这一类的 ai 产品,出一个算一个,你都会触类旁通,游刃有余。我也把这期的文字课间整理成了文档,那这期的含金量可谓是 biu biu biu biu biu, 一个点赞收藏关注是最起码的。好了,不多说,学费都交了吧,我们上课, 那在开始之前,我先说一下 codex 和 cloud code 的 区别。从本质上来说,它俩都是由编程 agent 逐步转向了通用 agent, 分 别是 ansapi 和 open ai。 这两家出的 cloud code 呢,默认使用 cloud 模型,但是我们可以自行替换成任意其他的模型,那在易用程度上, codex 桌面端的产品设计是会更友好的, 更适合零基础的白领工作者,而 cloud code 有 更高的自由度。在功能上, cloud code 原本是最齐全的,什么 skill、 mcp、 斜杠命令、 hock、 远程操控,这都是人家先发明的。但是呢,最近的 c c 更新稍微不如 codex 那 么快了,会更加偏向专业开发者一点。 而 codex 发了非常强的浏览器操控和 computer use, 还内置了最近的 image 二深图模型, 而且昨天还刚刚发布了手机端和 hock, 可以 直接用你的手机 check gpt 来控制电脑上的 codex 干 活。那价格和额度方面呢? codex 的 会员额度非常大方,二十到的会员就很够用,而且还不封号。 而 cloudpod 呢,大多数人可能都没法用它的官方账号基本上都得自行调用 api 的 费用属于是花多少用多少,风险由人。那在使用场景上,我个人喜欢用 cloudpod 搭配 cloud 模型来写作,因为 ops 四点六的写作和规划能力真的很强, 那 codex 的 执行和解决问题的能力也很强。日常的办公场景,我会选择用 codex, 那 在编程的时候嘛,我就两个都用上,所以结论是,入门的朋友用 codex 就 很强了,有条件的朋友呢,两个都来是最完美的, 不过两者的逻辑其实都是一样的,我们学一个,另一个也就会用了。那 cloud code 我 也做了一期系统教程,想拥有左膀右臂的朋友可以去看看。 ok, 正式开始 使用 codex, 我 们唯一需要准备的就是一个叉 gpt 账号,免费的也行,只是会额度稍微少一点。那有了账号之后,我们就直接去它的官网双击安装, 然后安装好之后登录我们的叉 gpt 账号,然后这些设置我们可以先随便选一点啊,选个日常工作,反正后续呢,我们都是可以改的。那搞定了, 那进来之后呢,大家会看到这个对话窗口,好像跟 chat gpt 是 很类似的。那我们打开两边的侧边栏也蛮眼熟的,左边呢,可以管理对话和任务的列表, 那中间就是聊天,右边大概是结果之类的吧,大家应该都能猜个七七八八,所以我们先不深究它的页面,我们直接开用,这其实也是我探索所有的 ai 工具的独门秘方。 我打开一个陌生界面呢,我先不管别的,我先找到我能对话的框,我先聊,先找到我能看得懂的按钮,先按,按着按着你就会了。你看看,独门秘籍都教给大家了,以后你们就是为师的弟子了。 ok, 众弟子不必拘礼,我们还是以学业为重啊。那我们第一个要了解的 codex 能力呢,就是本地文件操作, 也是这一类桌面端的 agent 跟对话 ai 最显著的区别和能力。因为过去我们用叉 gpt, 如果说我们要让它看到我们本地的内容,我们只有两种方式,一个呢就是复制粘贴到这个对话里,另一种就是以它允许的格式和数量把文件给上传上去。 但是 codex 不 一样,它可以自主地读取和操作我们的本地文件,而且不限数量。比如说我作为一个剪辑,我的本地里面存了八十多条视频素材,这都是我剪辑要用的, 但是呢,这个命名全都是乱的,完全看不懂,所以我想以这些视频的内容来命名,到时候我们看见文件名的时候,我们就知道这个素材是什么。那这事 check gpt 肯定是做不了的,但是 codex 可以 我们来看这两个地方,它都显示了一个概念,叫做项目, 我们选择一下,哎,一选择项目,他就让我们选择本地的文件夹了,那我们只要选中这个文件夹,那这个文件就是我们的项目了,里面所有的文件 codex 都可以自由的读取和操作, 当然这需要我们给他权限。大家看这里的权限选择啊,目前呢,我们是一个默认的权限,我们再点开,他有三种权限模式, 那默认权限的意思呢?就是在我们当前的文件夹内,他可以自由的去读写这些文件,但是如果他想要联网呀,或者是帮我们下载一点东西啊, 或者是碰这个文件夹之外的其他文件,那他是不行的,如果他必须要做,就会要向我们提出提高权限的请求,我们点同意才能继续。 那自动审查呢?顾名思义就是有个 ai 自动帮我们审查,由 ai 来判断这个操作危不危险,如果危险呢,就来问我们不危险的,比如说他去下一个知名的这种官方软件什么的,他就直接开干了。 自动审查比默认模式要更宽松和智能,建议大家选这个就完了。那最后呢,是完全访问权限,这意味着 codex 可以 在你的电脑上几乎什么都能干,它可以修改删除任何文件,它可以在任何位置执行命令,例如说它可能会去把你的 cloud code 给删了。 开玩笑啊,它一般情况下是不会这样抽风的。 ai 呢?也没有嫉妒情绪吗? 大家尤其是新手朋友就选择自动审查模式,相信 ai 就 完了,毕竟咱又能审的比 ai 好 多少呢啊,对吧? ok, 那 我们选中了刚刚的这个视频的文件夹,继续来提出我们无理的要求,让他帮我们把这个文件夹里的所有视频素材都按他们的实际画面来重新命名。哎,他就开始做了, 而且大家看他非常的聪明,他先看了看我们到底有多少个视频,然后他选择用抽帧的方式抽取关键画面来判断内容是什么,而且他还知道他不要一张一张图去看,他给拼成了缩略图的形式,一组一组的去看。 ok, 很 快啊,这个文件夹里面的文件名就全改变了。过程中呢, codex 也是没有向我们提全的,因为他都是在这个文件夹内去操作的。那我们也可以检查一下他都对应好了没有。 ok, 钢琴家音乐演奏厅,没错, 雪山近身格斗,没错,旗袍女人夜巷卖热饮哇!而且他的这个命名还遵循着一个序号,任务、场景、行动的一个清晰的命名格式。 ai 做事的这个细心程度啊,人类你不服不行。那另外呢,我们其实也可以在同一个项目里面去开多个不同的对话,它们的上下文都是不一样的,但是同样都可以随时的访问我们这个文件这个项目。 比如说,我们在另外一条对话,我们又给他一个不同的任务,让他想办法把所有关于风景的视频都剪成一整条。 哎,没想到吧,他真的能剪,他自己想办法,用了一些工具问我们要了一些权限,用这个 ffmpeg 给它拼在了一起,效果的确是关于风景的都剪成了一条。 ok, 那 如果我们要创建一个新的任务,我们其实也可以手动的在这边创建,他也会自动的在我们本地创建一个文件夹。 然后呢,我们跟 codex 对 话的整个过程, agent 产生出来的任何文件啊, pdf 啊,什么 markdown, ppt, 它都会直接存在我们本地的电脑上。 ok, 到这里,大家应该 get 了 codex 呢,可以随时地访问我们的本地文件,去读取内容,写文件,删文件,移动文件,文件夹里的内容也就成了我们的 codex 随时可以获取的上下文,那这里的项目也就对应着我们在本地的一个文件夹, 哎,那刚刚这么个任务会花我们多少上下文呢?我们只要看这里就能看到了。 那这个小圈代表的是我们现在的这个对话和里面的操作,一共使用了 gpt 五点五的多少上下文窗口。 如果我们把鼠标悬上去呢,它还会有更详细的一个信息,当上下文快满的时候, codex 会自动地帮我们压缩上下文。不过其实当我们一个任务告一段落之后,不用等它快满了,让它自动压缩,我们也可以自己通过斜杠压缩这个命令 来手动的去压缩上下文,这样呢,可以让模型更聚焦在我们的新任务上,也省一点上下文的额度。那当然大家除了这个对话的上下文余量,其实我们还想知道我作为一个免费用户,或者是我作为一个 pro 用户, plus 会员,我还有多少总共的额度可以用,对吧? 这个呢,有两个方式查看,一个呢是左边的设置,这里我们点开剩余额度,就能看到你五小时内还剩下多少,那本周内又还剩下多少, 甚至呢,也有什么时候到期会刷新的一个提示,这个产品的设计还是比 cloud 的 友好很多的。那另一种方式呢,就是我们可以直接在对话框里输入斜杠,然后找到这个状态, 那打开这个状态之后,它的绘画这里就会持续的显示我们的上下文余量,这个五小时和一周的限额。但再次说实话,这个 codex 的 额度还是非常大方的,二十到的额度我认为是可以满足大多数白领工作的高频使用的。 ok, 那 顺便呢,我们也介绍一下这里的模型选择, 那点开之后,我们可以选择速度,快速呢,就相当于加急通道,会消耗我们更多的额度。那这里呢可以选择其他模型,但是大家都选五点五,因为它确实更好用。然后呢,这里可以选择智能程度,其实呢一般中度智能就够了, 所以我们选高。 ok, 那 这个小麦克风呢,肯定就是语音输入功能了,比手打字还是要快很多的,但是呢,它的转录速度远不如大家去下载一个语音输入法,还是非常推荐大家用语音输入的 好。那现在我们通过一个本地文件处理的案例,也了解了 codex 上常用的一些功能。那 codex 的 第二大能力就是命令行工具使用。 其实刚才我们说到权限的时候就有提到,在默认权限下,它可以读写文件,但是却不能执行一些命令,一些联网的操作。那这些命令是什么意思呢? 刚刚的案例其实也已经用到过了,比如说它把视频抽帧出来,还把几个视频拼接到一起,它用到的 ffmpeg 就是 命令行工具。 还有一些我们熟悉的命令,比如说我们在终端里面来克隆一个 gitup 仓库,或者是大家近期比较熟悉的,我们在命令行里面输入一些命令来下载龙虾和各种依赖。那 codex 的 第二大能力就是在我们授权的情况下,可以使用我们的终端来替我们做这些事。 那我们就来让 codex 帮我们来安装一些平时对于小白来说非常复杂的东西吧。第一类,常用依赖,比如说什么 node gs 啊, git 什么的, 也是大家以后使用各种 agent 或者是做其他项目必备的一些工具啊,那之前大家要装这依赖都得去看一个手把手教程,然后照着命令抄,挨个装。那现在我们就直接跟 codex 说帮我安装个 node js 给他发过去, 也是因为这些东西呢,其实都是比较常见的东西了,所以在我们的自动审核的权限模式下,你看他基本上都不问我们要提权,就熟门熟路的帮我们装好了。 那第二类,就是那些爆火的但是有上手门槛的一些新的 agent, 比如说龙虾,爱马仕,甚至还有这个 codex 的 竞品 cloud code, 我 们都可以让 codex 帮我们装完了呢,它还能教我们该怎么用。那我们装一个 hermes 吧, 我其实都不需要给它官网和仓库链接,我就说最近有一个叫 hermes 的 agent 很 火,你帮我安装一个吧。 哎,他就会自己去搜索,然后帮我们判断到底是哪一个。然后呢,他根据官方的文档帮我们陆续的装好了,还帮我们验证过已经装好了,你瞧瞧,那我们照着他说的来启动一下试试。 哎,真的帮我们装好了,那往后的配置我们就不在这里继续了,但是大家应该 get, 有 了 codex 以后,那些复杂的要收你五九九的部署,你都可以直接让 codex 帮你做了,怒省五九九。而且我们在使用的过程中遇到任何问题,还可以截图去问 codex, 什么瞎死了马挂了,升级出现了问题都可以让 codex 直接帮你修,是不是很方便? 那第三类有点没那么必要,但它其实也可以,就是像 cursor integrity 这种软件应用, 平时都是我们去手动在网页上下载的,它也可以帮你下载和卸载。那大家用 codex, 我 其实也建议大家去下载一个 agent 的 ide 啊,因为现在 codex 有 个缺点是它没有办法打开我们的文件内容,直接去手动编辑。 虽然这个侧边栏呢,是可以看到一些文件结构和内容的,但是我们都没法编辑,所以大家可以让 codex 下载一个自己喜欢的,比如说我们就这样下载。那下好之后呢,我们再执行一个 git i n i t 一个初步化, 那右上角就会出现这个东西,随时可以把我们的项目在编辑器中打开,我们来手动编辑。 那第四类就比较重要了,就是 agent 本身会常用到的那些 skills 啊, mcp 啊和 selli。 那 skill 和 mcp 本身 codex 也是支持的,我们后面会详细讲到, 我先挑两个大家安装一下,方便我们后面综合起来来做案例。那这些 skill 和 c i 呢?通常来讲不像那些 get 那 种大项目那么著名,所以我们最好是找到它的具体仓库,或者是明确的官网地址。比如说我们下载一个专门找 skill 的 这个 find skill 哦,方式就是直接把链接拷贝给 codex, 然后跟他说帮我装一下这个 skill。 那 在他装的期间,我们也说一下 codex 的 另一大好处,并行任务处理, 我们完全可以在他做这个事情的时候再开一个对话,让他去下载一个别的。那我们下载一个飞书 c l i 吧。飞书 c l i 其实非常的典型, 因为现在呢,有一些积极 ai 化的软件,把几乎所有他在软件里能做的操作都做成了命令,让 agent 能够方便的去操作,我们把这个链接发过去,让他开始下载, 那这边呢,其实会显示每一个正在处理当中任务的情况,这个在转呢,就说明它正在执行中,那这个蓝色的点呢,就说明已经完成了,有时候还可能会出现一个需要你申请权限的一个标识。 ok, 那 这里 fan skill 呢?它是已经装好了,我们再看飞书 c l i 这边,它会引导我们去做一些授权, 我们就跟着它的引导去完成就好了。 ok, 那 装好飞书 c l i, 那 codex 就 能帮我们去做飞书里的各种操作了,比如说写文档,发消息,见日历,做表格什么的了,我几乎每天都在用, 好大功告成。我们就这么一个小章节,我们就用自然语言的方式让 codex 帮我们装上了 hermes node, 飞书 c l i 一 大堆东西,这就是 codex 作为 agent 的 第二大常用能力,命令行使用。 那这个能力和这个章节的演示也是希望大家能够 get 到一点,就是我们现在在电脑上想去做的很多很多事情,都可以让 codex 这样的桌面 agent 去做了。那 codex 的 第三大能力是持久记忆。 看过我那篇 cloud code 的 朋友应该都知道, c c 呢,有一个手动的持久记忆, cloud 点 md, 还有一个自动的记忆系统, 都是把我们希望 agent 能够长期记住的,比如规则、篇号和我们的信息之类的东西,以本地文件的方式存在我们的电脑上,然后事实的时候把这些记忆以上下文的方式注入到 agent 里去。那 codex 也是类似的,它也有这两套持久的记忆系统 在 codex 里面呢,手动的持久记忆文件叫做 agents 点 m d, 而且它也有一个自动的记忆机制,来我们打开设置,找到个性化, 那在这里的这个自定义指令实际上就是一个全局生效的 agent state md, 它会在我们任意的项目跟 codex 对 话的时候,它都第一时间作为上下文发给大模型,那我们可以手动地自己在这里写,不过我更喜欢呢,直接在对话中去跟 codex 说, 比如说我说一个,我希望你以后对非书文档里的任何修改都使用一个专属的你的文字颜色和用删除线的方式来修改,不要直接的修改。然后这个帮我寄到局的 a 正 c m d 里。 ok, 那 它这里呢,告诉我们已经写好了,我们再打开个性化这一块,就的确是多出来了这么一套规则,那实际在使用当中,它就会去遵循我们这个规则了。 比如说我这里已经有一篇非输文档了,我在侧面呢也评论了几个我想修改的地方,我直接可以把这个链接发给 codex, 我 让他根据我侧面的评论帮我修改一下。 那因为我们刚才确实已经装好了这个非输的 c r i 也都给他配置好了权限,所以 codex 是 直接可以操作我们的文档的。 ok, 看看它完成之后的效果。 果然他用了紫色的字和删除线的方式来帮我们做的文档修改,那这个呢,是局的 agent md, 适合记一些适用于所有任务的一些大原则,比如说我们的工作习惯,我们要说中文,我们的工作偏好修改文档,要留下这种修改痕迹等等等等。 那另一种呢,就是项目级的 agent md, 这个长期记忆呢,只在这个项目当中生效,我们可以选择一个项目的对话,然后打开编辑器, 自己在这里手动的创建一个 agent 的 md 的 文件,然后我们去写一些针对我们这个项目的一些规则, 当然也可以让 codex 来帮我们写。我个人的建议呢,是在这个项目文件里面有了一些内容之后,让 codex 根据他对我们项目的了解来自己帮我们写。那自动记忆怎么回事呢? 其实我们刚才在这个个性化这个下面我们也看到了,我们需要手动打开这个自动记忆功能, 它的机制是我们打开这个功能之后, codex 会在我们结束对话或者是结束任务,这个对话闲置一段时间之后,它帮我们把那段对话总结成记忆,然后记在一个地方。但是它有几个原则,第一太短的对话它就不记了, 那第二这个对话的总结它一样会消耗我们的额度,所以当我们的额度太低的时候,它也就不记了。 并且这个自动记忆文件呢, open ai 官方是不建议我们去手动修改的,顶多我们可能删一删有些没必要的信息,那这个文件大概是长这样 的,是一个任务,一个任务在记录的,主要呢会写上这个记忆的来源是哪段对话呀?以及它的工作目录是什么,那以及以后触发了什么关键词的时候,它会去召回这段记忆, 再往下呢,是用户在这件事情上的偏好大概是什么样的?那第五段呢,是一些可附用的一些知识,一些踩坑的记录,那这些内容都是 codex 自己记录的,并且以后也是会它自动的招回去使用的,我们就先不修改它, 它这个格式确实也不太方便修改,更多的时候我们对于明确的规则和要求,我们还是通过组织 agent md 来实现。那大家学完这些视频之后呢,我也想给大家再做一期, 通过组织不同层级的这种 agency md 给自己做一个非常懂你的,可以做不同类型事情的超级助手的视频,感兴趣的朋友可以扣个一。 ok, 那 第四大能力就是 codex 可以 直接用到 image, 二来生成图片。不过呢,深图功能其实是一个小功能, 所以这一章节呢,我们不只会用它的图片生成,我们会带大家做一个完整的个人主页的开发项目,并且在了解一些 codex 在 小白开发中的一些用法和功能。那我们再来开一个项目,叫做个人主页, 然后我们点开这个加号,我们把计划模式打开,因为我们要做一个网站嘛,任务会复杂一点,所以打开这个计划模式呢,他会先帮我们列出一个详细的计划,我们确认之后他再开始行动。 计划模式呢,比较适合我们的任务有一定复杂性,或者我们自己还没想清楚,可以跟 ai 讨论出一个计划。那假设我们现在就是第二种情况,我们其实没想清楚,我们直接跟他说我想做一个个人主页, 那你看他看到我们的项目中是没有内容的,所以他以这种选择框的方式来询问我们的细节,这些选项呢,大家可以按照自己的要求去选择,那我就选这个个人品牌吧。 然后如果说这些选项中没有我们满意的呢?我们也可以选到最后一个来填写我们详细的要求,比如说我要他修饰感,也要高级感,然后我选针对合作伙伴,不要个人照 中英双语,巴拉巴拉巴拉。这里真的是问了我们相当多的问题啊,那最后呢,他给到我们出了一个详尽的计划,问我们是否实施此计划,那其实基本的计划我们看着没有什么问题,但我们也可以补充一些调整方案。 比如说我们刚才就要说到了要用它的 image 二的生成能力,我们这里没有体现,我们加一句网页上要多用一些图片,使用 image 二来生成一些高级感的图片,然后我们一起提交。 哎,那他又问我们要走哪种高级感呢?我们如果点开这个小叹号的话,还能看到他说的这个风格到底意味着什么意思,这个产品的小细节真的是我很喜欢,那我们就选他推荐的吧。然后他出了一版新的计划,我瞧着没什么问题, 去吧。 ok, 他 就开始初识化这个项目来逐步帮我们生成了。那这个过程呢,肯定会需要一定的时间,在这个期间我再给大家补充一点点知识点。呦,他的第一张图出来了,不错,挺有艺术感的,果然是最强的 emoji 二,那我要补充的这个知识点呢,叫做引导。 如果说大家在 codex 执行一个很长的任务的过程当中,你觉得他有点跑偏了,我们是可以随时给他补充纠偏的,比如说我们补充一下图片的人味要更强一点,而且不要这么冷的色调。我是一个 ai 博主,然后我们发送出去, 哎,大家会看到他没有立刻打断我们的任务,没有发出去,实际上他在这里排队呢。那我们看到右边的这个引导按钮,他写着我们不打断模型运行,会在下次调用工具后发送过去。这个是非常好的一个功能啊,我们点一下, 哎,他就可以发出去了。这个功能呢,可以让 codex 不 用在错误的道路上一路狂飙,把我们额度都花光,也不会让它重新再跑一轮任务。那另外一个小功能点,我们找到一个已经结束的任务, 我们看一下这个 ai 的 回复,每个 ai 回复的下面都有一个这个按钮,叫做分叉 fork, 这个的意思是我们可以随时从这里开始去开一个新对话,非常适合那种前面聊的还好好的,上下文也非常有价值,但是我们再往下聊,就聊的有点叉劈了的时候。哦,还有个小功能,宠物, 我们点开设置外观,然后这下面就有一小对小宠物可以选,甚至呢,我们还可以点击创建,让 codex 根据对我们的了解来生成一个定制化宠物。那我们先点击唤醒宠物, 哎,就会在桌面上有常驻这么一个小桌宠,脑袋上会冒出来 codex 正在做什么的一个提示,别的呢?好像也没什么用。 ok, 终于在他跑了七七四十九分钟之后,网页完成了, 我们来看看效果,因为 codex 呢,有一个内置的预览浏览器,我们可以直接打开右边的侧边栏啊,我们还给它放大一点。 嗯,这个网页的效果确实是不错啊,不过呢,现在的 a 证呢,其实都有这么一手了,那它这个预览浏览器呢,还有一个好处,我们点击右上方这里的一个批注按钮, 我们就可以在这个页面上选中这里的具体元素去写修改意见,包括重新生成图片,比如说我们要这个 logo 放大一点, 然后 p 住这里这张图加上一个人物,好把这个删掉, 那然后对话框里呢,就会加上我们这几条批注,然后我们点击发送,它就会针对我们的意见进行修改了,是不是挺方便的?那我们现在项目有了雏形之后,我们再 call back 一下刚才说的 agent md, 其实现在呢,就是一个让 codex 帮我们生成项目级 agent md 的 好时候了,因为我们也有了一定的内容,我们就让它自己生成一下,我们打开编辑器看看, 不错,项目的背景,各种信息,各种规则,各种文件路径都已经写好了。那以后呢,无论我们在新开对话,还是我们的聊天记录都已经被清空了, codex 都可以通过这个项目级的 a 证书 md, 立马的了解我们的项目基本情况。 ok, 那 我们先保持这样,先不做精修了,我们直接准备部署上线,当然大家自己做的时候完全可以去打磨的更好,那网页上的这些信息也换成更真实的信息就好。 那我们现在要部署呢,就得要说到 codex 的 第五大能力插件。在现在的 codex 当中,插件大多数是让我们的 agent 跟外部平台、外部工具、外部服务连接的一个作用,它实际上就是我们所说的 skill, mcp, c l i 这一类东西的一个完整集合包,比如说操作邮箱、操作日历、操作 excel 啥的。那我们来点开左边的这个插件栏,我们看这里呢,已经默认帮我们打开了好几个内置插件了,比如说浏览器操作,还有 mac 专有的屏幕操作,还有 excel 表格, ppt 等等。 那他的插件页面没有中文翻译,所以我给大家把这些插件的具体中文意思,分别能干什么也都列出来了,大家课后可以按需装上,点这个加号就好了。那我们先翻到这个 coding 板块,因为我们想要部署上线嘛,通过插件会非常方便。 其实呢,这个 vassel 和 netify 都可以,我们点一个加号给它装上,那如果大家给它没有选上的,也记得要选上。然后我们再回到对话当中,告诉他们,我们想用这个 netify 把这个网站给我们部署上去, 我们大家也不用管他咋部署的,反正他需要干什么呢,他都会告诉我们的。 ok, 他 发现我们没有登录授权,然后主动弹出了这个登录的链接,那这里呢,建议大家用 tapp 账号登录是最方便的, 那登录完之后,他自己就知道我们已经登录好了,然后继续的帮我们部署,这就搞定了。这个链接呢,就是我们最后的网站了, 只要把这个发出去,别人就能访问你的个人主页了。 ai 是 不是个好东西,你说就这么两下子就干了,原来普通人花钱都不一定能干成 o k。 先压抑住我的这个老灯感叹。我们回到刚才我们已经装好的插件, 那其实这里呢,还有两个非常重要的内置插件,就是 browser use 和 computer use, 还有这个 chrome 浏览器, 那这些有什么用呢? browser use 顾名思义呢,就是 codex 可以 直接帮你操控浏览器,比如说它自己点击翻页截图,填写表单等等。通常呢适用于自动化测试前端, 当然也有比较无聊的用途,比如我们可以让 codex 打开这个 m b t i 做个测试试试, 嘿嘿,这样大家能够比较直观的看到它的一个效果吧。那这个鼠标呢,是它自己在移动,然后它是自己看了上面的答案在自己填写,然后填完这一页,它也会自动的翻页, 那随着它的一通操作,结果出来了,原来 gpt 五是 i n t j 啊,我说怎么跟我这么聊得来呢? ok, 那 这个 chrome 的 插件呢,也是控制浏览器,但是它控制的是我们自己已登录的自己的浏览器,它不会再新开浏览器, 那我们如果把它给勾选上之后,它会引导我们去 chrome 里面装一个插件,那装好之后呢,它就可以操作我们自己的浏览器了, 而且它有个好处,它是可以直接在后台执行多个页面的浏览器操作的,就是并不会占用我们的整个浏览器,我们不用真等着看它这些操作,我们该用浏览器干,别的我们可以接着干。 ok, 那 computer use 就 更厉害了, 它不只能够操控浏览器,连你电脑上的这些 app 它都可以操作,只不过呢,暂时只有 mac 有 这个功能。比如说我们新开一个对话,我们在加号,这里来看最下面的这个插件选项,我们手动地把电脑插件选上, 我们再来几个没什么用的奇迹引巧吧,帮我放一首九九年最火的歌,然后用我的微信给 qq 发条微信,说,请收下我一个点赞、收藏、关注,懂了吧? ok, 他 陷入了思考,然后他看到我们的应用都正在运行中,并且向我们使用了这个音乐软件。我们点同意看,这个就是 codex 自己干的啊。他帮我们搜索歌曲, ok, 音乐响起了, 但是他还有活,他还在问我们要微信的权限,我们也给他允许一下。 ok, 看他这个小鼠标,他正在犹豫着准备搜索点击,好朋友们失败了, 因为我上次都成功了,但是我估计现在微信已经开始严防这种 a 证的操作了,直接给我退出去了。 但是呢,他的确成功操作了这个音乐软件。其实我还让他操作了剪映,并且给我们的最新的项目加上了音乐。 那总之呢,意思大家都懂了吧,就是它可以操作浏览器,并且可以操作我们的电脑。当然,实际上我觉得它的操作效率目前来说还是稍微有点低的,我不太喜欢用这两个强大的功能。不过后面我要说的这个 skill 就是 我每天都会用的东西了。 那 skills 我 的确也已经跟大家说过很多次了,好学的朋友一定要去补补课。那 skill 本质上呢,是我们人为沉淀的一些可附用的方法、流程和工具的组合, 相当于给 agent 做某些具体任务的一些行动指南。那因为之前我们已经让这个 codex 帮我们装过一个叫做 find skill 的 一个原 skill 了, 所以后续如果大家想要去装,或者是找一些社区上的 skill, 都可以直接用 codex 拿语言直接让它下载。比如说我们下载一个必备的 ansapic, 那 个前端设计的 skill, 还有一个去 ai 位的,那我们这两个都发给他,等会儿都会刚好有用 欸,很快他就帮我们装好了。那以后大家想要下载 skill 呢?如果说遇到这个 find skill, 他 找不到的东西,也可以直接把链接发给 codex, 让他帮你下载就好了。不过我在 c c 那 期也说过,最好用的 skill 还是自己创建的,符合自己工作的专属 skill。 那 创建 skill 呢,也有两种方式,第一呢,就是直接告诉 codex 你 想要创建一个什么样的 skill, 通过跟他讨论打磨得出来一个 skill。 那另一种呢,就是我们接下来要演示的,先跑通流程,然后让它形成 skill, 这也是一种更推荐的做法。那比如说我们想做一个自动化写这类文章,并且帮它配图的 skill, 这种大家应该都看过吧, 那我们就得先通过一步步的引导 codex, 让它真正实现一个我们满意的文章。来我们新开一个对话。那正好呢,我们刚才不是装过这个 github 插件吗?我们可以直接先问它最新的 github 流行项目,热门项目都有哪些? ok, 它的确帮我们找到了一些,那我们再让它清晰地解释一下这些项目都分别是干嘛的。嗯, 那我们再让他挑其中新星数量最多的,来帮我们写一篇本周 get up 热门项目推荐这样的一篇文章。 好,那他写好了这一篇之后,我觉得稍微有点太人机了,我希望可以更口语化一点,并且我只想要五个精选的,那我们就告诉他,然后还要覆盖到这几个层面,那我们这里就可以用到刚刚我们下载的那个去 ai word 的 那个 skill 了,我们斜杠给它调出来。 好,那看到他的结果稍微优化了一点,但是我们还希望加一个我们固定的开头,我们的结尾,并且还要让他用上 image 二来帮我们生成一些配图。最后呢,我还希望他不要是这个格式,他要是一篇非输文档的格式,然后图文并茂的。 ok, 结果来了,他确实是有了,但是呢,我觉得这个配图不够丰富,于是我又经过几轮调整才觉得差不多满意。并且我还给他最后加了一步,要让他把这个飞书文档发送到指定的群里,让大家都来看看。 那最终呢,他的效果是这样的,果然发出去了。其实啊,如果想更加一步到位的朋友,也可以结合刚才我们说的这个浏览器操控,让他直接打开那个发布页面,直接就帮你发布出去。 那总之,我们对他这一套结果满意了之后,我们就可以直接让他把这一整套的标准和动作做成一个 skill 搞定了。那我们再输入斜杠,再往下找,我们就发现就有了这个 skill, 我 们可以直接这样手动地调用这个 skill, 也可以直接说生成一篇热门项目推荐图文这一类的触发词,也会让 codex 自动调用。 不过因为现在 github 上面实时的热门项目肯定是没有更新的,所以我们再调用一次呢,它大概率会写出差不多的文章,所以我们就不试了。但是大家都理解了吧, skills 呢,可以把我们经过验证调好一次的一整套流程和方法给它固定下来。 下次做这件事情呢, codex 就 可以按照这个方式稳定的输出。 ok, 那 下一个能力则是 mcp。 其实 mcp 现在已经用的不太多了,所以我只简单的示范一下那 codex 的 mcp 藏在设置里面的 mcp 服务器。 只不过小白看这个肯定是有点不太知道怎么填的,所以跟我们之前说的一样,我们最好的方式还是把你想装的那个 skill 的 链接拷贝给 codex, 让他自己装就完了。比如说我们来装一个 notebook lm 的 一个 mcp 发给他, 他就会引导我们来做授权登录,登录完就搞定了。那我们再试一个我存了非常多访谈视频的一个笔记本,我们来问一下他。 欸,那这样呢, codex 也就可以直接获取我们 notebook lm 上面的这些外挂知识点了。 ok, 最后一个 codex 能力是自动化定时任务。 其实定时任务本身并不稀奇啊,比如什么每天早上提醒我吃药,提醒我喝水这一类的事情,普通的软件也能做,但是我们把它放到最后一个说呢,就是因为它可以结合我们之前学到的各种能力,把一整套组合起来的任务,让 agent 定点执行 自动化,加上智能化和定制化方显美妙。比如说刚才我们做的这个热门项目图文的这个 skill, 我 们就可以把它设成每三天或者是每周,让它定时定点的产出一篇 dapp 热门项目推荐发出来。 那我们要创建自动化任务呢,其实也分两种方式,第一种就是选到这边的自动化面板,那它这里呢,有一些官方的参考视例了,不过大多数是跟开发相关,那我们选择新建一个自动化, 其实你看要填写的东西也非常简单,其实就是用提示词写好这些自动化是要做什么,然后我们可以在这里选好什么时候出发,我们也是可以自定义一个出发时间的, 然后这边就可以选择执行的模型和思考强度,最后点击创建即可。不过呢,我也还是倾向于让大家用第二种更简单的方式,就是直接在对话里跟 codex 说,那我们直接跟他说 帮我创建一个自动化任务,每周一早上九点自动化执行热门项目推荐的这个 skill, 产出一篇图文发到群里, ok, 那 我们在看自动化这里,它就已经帮我们设好了这个任务,我们随时也可以去改变它的时间。 再比如当你的这个邮箱插件 github 飞书都已经连上了 codex, 那 么你也可以让他每天下午六点帮我汇总日历上完成的会议, github 上面的提交记录和我的邮箱回复记录,生成一份全面的工作日报。 最后手机操控 codex 设置方法非常简单,手机上的 check gpt 和电脑上的 codex 都把它更新到最新版。之后打开手机上的 check gpt, 然后点击侧边栏的那个 codex, 它就会提示你允许这台手机控制你的电脑,直接就搞定了。如果你有多台电脑的话,也可以给它分别连上。这就等于你不管在大街上、地铁上还是朋友聚会,都可以随时随地地用手机下发一个任务,让 codex 在 你的电脑上干完一个活, 它就更像一个可以跟你远程协助的同事了。这个功能呢,目前免费版也可以用,但是主要能连的是 mac 系统的 codex。 好, 那到这里 codex 的 所有核心能力我们就全部过完了。来我们回顾一下。 codex 呢,可以操作我们的本地文件,可以使用我们电脑上的终端命令行工具。它还有两种构建持久记忆的方式,它还可以生成图片,而且它可以通过计划模式来做一个完整的项目开发。 那它有丰富的插件,可以操控浏览器和电脑,还可以把知识和流程沉淀成可附用的 skill 技能, 它可以使用 m c p 连接,外部它还可以设置自动化的定时任务。不过其实比起这些功能本身,我也希望大家记住两件事,第一就是我们真的有很多事情是已经可以交给 agent 做了。 那第二呢,就是我们已经从问 ai 的 阶段走向了管理 ai 的 阶段,因为过去我们使用 chat gpt 就是 有问题了,我们问一下,然后得到答案我们就走了。 那现在使用 codex 这类的 agent 呢?每个人都得像领导一样,帮他准备他所需要的上下文和工作环境,给他指明一些任务目标,然后来检查他的计划,监督他的过程,验收他的结果。 那同时领导还要负责把好的方法和流程沉淀成可付用的技能,把反复要做的事情设成自动化执行的规矩。好了,恭喜大家今天都升职了,记得点赞收藏关注我们下次见了。

今天 codex 发新版本了啊,就是这个版本有几个功能更新特别好用,我挨个挨个的给大家演示一下。第一个就是它可以自动截图了,比如我们在抠屏的时候,这是一个页面里面有些 bug 要修改,以前可能我们需要手动截图,然后把图片传上去,现在很 简单,两个 cmd 键啊,还是在 mac 电脑上面看,没有就直接截图,我们看一下自动截图,而且它不仅仅是截图啊,不仅仅是你看到的东西。看这个查看文本,还可以把这个页面背后的参数,组建的属性尺寸, 就这个页面背后的信息都可以给你捕捉下来。基于这个你再让它去修改一个什么 bug, 它的理解能力就会非常强,就除了页面展现的问题之外,背后的逻辑都可以给你读出来。基于这个再给你去修改好。这个是截图的功能,两个 command 键一起按自动截图, 然后直接发送你的需求。第二个很好用功能呢,就是前端编辑功能,正好最近六叔用他在写一个封面生成器,直接点击这个前端的页面,在他自带的浏览器里面做一个预览啊。比如这个页面我要修改一些布局文字或者一些排版,以前是靠对话跟他说清楚,现在直接选中好点评论,选择 直接在上面改,看到没有,改完之后,所见即所得,直接在上面生效,我们再来改这个按钮,把这个颜色我们改成一个绿色,选中,你看直接生效,然后在这个对话框里面就可以看到刚刚的一些改动,然后你主动输入,完成这些改动发送啊,最终他就会很精准的按照你的方式做一个修改,包括你的评论,你的批注, 你的团队成员都能够看到,也起到一个协助的功能。用这种方式去修改一些页面,那些 bug 是 不是纯靠口喷,要方便多的多好。这第二个功能所见即所得的 去修改你的网页的任何的问题。格式化的方式。第三个优化的功能啊,大家还记得之前它升级了一个什么版本?移动版本,你可以通过手机端去连接到电脑端,那有个问题,当你的电脑,比如说我的 mac 电脑,我锁屏了啊,这个时候我在外面我就连不上了。 为了解决大家这个问题呢,我们点击设置,这里有个电脑操控,把这个点开,输入你的电脑密码之后,你的 mac 锁屏的状态下,你也可以远程通过你的客户端去连接你的 codex。 我 觉得这个是非常好用的。最后一个功能啊,也非常好用,点这个加号,追求目标,选中适合这种连续性的、复杂性的任务,让它去跑。 比如帮我写一个用户注册的功能,并完成用力测试,在这个功能完成之前,用力测试完成之前,它是不会停的,它会一直的帮你去执行,哪怕一个小时,两个小时,中间你可以随时打开去查看它的一个进度,而且你还可以在这个过程当中不断的去加入你新的指令。如果你的任务比较长,需要多轮的迭代啊,步骤比较多, 耗时也比较长,建议大家可以开启这个购物模式,就是追求目标的模式。好了,以上这几个功能大家赶紧试一试,我持续丰富,你来体验过,拜了个拜。

经常在 coding 的 朋友们一定发现了这个问题,自从 open ai 发布了 g t 五点五模型之后, codex 的 额度消耗的非常快。之前我在用五点四模型的时候,额度好像永远都用不完,经过五点五更新之后,发现刚恢复了五个小时的额度之后,紧接着又被周额度限制住了。 我相信有很多朋友被这个问题所困扰,今天我们就用一条视频来解决这个问题。 hello, 大家好,我是南希,之前在快手做过测的运营银行代码都不懂的纯小白,我的视频都是从纯小白的视角来分享 web coding 的。 要知道 web coding 最怕的就是被中途打断思路,刚捋顺任务,刚推进了一点,但是额度却没了。那么应该怎么解决这个问题 呢?我发现其实我是没有用对模型的,我平时在用 codex 的 时候,会把五点五默认当成产品经理、前端、后端等多个角色,不管是写 p r d, 写功能啊,改页面、修 bug, 还是补文档调样式,全部都让它来做。但是五点五不应该用来干杂活,它最强大的能力在于做规划和做判断, 比如说这个需求到底该怎么拆?这一段代码为什么总修不好?按照现在这个框架,代码后面会不会越写越乱?这次改动有没有潜在的风险?这条路线值不值得继续做? 说白了,五点五更适合做的是大脑应该做的事情,而不是简单的执行。那大量执行的事情应该交给谁来做呢?我现在的分工是,五点五负责判断、拆解,负责做关键的工作,五点四迷你 打杂,第三负责做质检,比如说正常的写功能,接接口,改前后端的逻辑,我会交给五点四,比如说像修改文案,调样式,补测试数据整理 redmi 这种小事,我就交给五点四 mini, 最后再让五点三来过一遍,看看有没有明显的风险遗漏或者是低级的问题。这样一套下来,我发现基本不会被额度限制。 如果你觉得今天的内容对你有帮助的话,可以点个关注收藏赞我。下一条内容可以直接继续讲。我现在具体怎么分配五点五、五点四迷你和审查模型的来搭一套日常的考勤工作流。

codex 刚刚又来了一波大更新,这五个功能是真的在把 ai 接管电脑干活往更深处推。第一,锁屏也能继续用 mac 锁屏之后, codex 还能继续工作,配合手机远程操作,人在外面也能看进度改方向。第二, app shots, 双击 mac 的 command 键,就能把当前窗口直接拍给 codex, 把可用文字塞进对话上下文。第三,桌面版 go 正式上线,你给 codex 一个目标,它会围绕结果持续推进,特别适合大项目跨几天慢慢跑。 第四,插件团队共享,企业用户自定义好的插件可以在团队之间附用,不用每个人重复配置。第五,高级标注模式, 用内置浏览器看页面时可以拖拽元素批量打标注和评论,前端反馈更精准。说白了, codex 这次不是在堆功能,而是在解决真实使用痛点。 上下文怎么进来,任务怎么跑久,团队怎么附用,页面怎么改准。如果你还把 codex 当成命令行写代码工具,那可能要重新认识它了。

hello, 小 伙伴们,大家好,这节课呢,我们来说一下 codex 代码管理。在说代码管理之前呀,我们还是要对 codex 进行一个简单的说明。说明什么呢? codex 啊,它并非传统的 ide, 比如说跟我们所接触的那些开源工具啊,是不一样的。不一样在哪呢?不一样在它并没有提供代码的编辑功能。 有小伙伴们有点懵,说我为什么需要编辑功能呢?我们有什么需要改动的,直接跟他说就行了嘛。我们说这是一种解决方案,但是对于开发者来说,或者说对于很多同学来说,可能还是需要能手动去修改代码这个需求的。那这个需求有的话怎么办呢? codex 有 解决方案吗?我们说有 怎么解决呢?大家还记得我们之前为什么要去安装这个 vs code 吧? vs code 是 什么?它就是一个很常见的代码开发者工具。呃,我们在业内,我们平时就叫它这个编辑器嘛,或者有人也可以把它看成是 ide。 呃,它的现在的体量作为一个 ide 也是成立的。好,那说 vs code 就是 我们开发者用的,用来编辑代码的。我们可以将 codex 啊跟 vsco 的 经营集成,它本身也提供了这样的一个集成操作。怎么操作呢?我们只需要在右上角选择你所安装过的 ide, 如果你装过其他 ide 呢,可以选择其他的你所熟悉的 ide, 如果没有安装,那你就安装这个 vsco 的 就行了,因为它非常好用嘛, 然后就可以去通过 vsco 的 打开你 codex 所生成的代码,然后进行修改,这是没有问题的。那我们给大家演示一下吧, 回到我们的 codex 里边,大家看啊。呃,这是我们之前所实现的,通过 view 三去改动了这个餐馆的一个代码,对不对?跑起来也是没有任何问题的,我这里就不给大家跑了啊, 我们想把这个代码打开,你会发现这里边根本没有能展示代码的点,对不对?那怎么办呢?我们开启一个新的对话啊,就点这里新对话开启这里啊,注意还是要选择你当前的 codex 的 这个项目,当前项目这个目录啊,就是我们的 codex 杠 shop 这个, 然后就是当前这个项目嘛,然后在右上角这里有一个 vs code 的 一个图标,看到了吗?啊?如果安装过,同学对它还是有印象的吧,然后我们点这个就可以在 vs code 中打开了,我们点一下, 你看在这里打开了,然后这个时候我们在这里呢就可以去修改代码了,比如说这是我们的主文件源码文件,对吧?有哪块不满意你就可以去自己改动了,比如这个文本你感觉不满意,你可以手动去改,对不对啊?包含一些其他的配置,不满意你都可以手动去改,那这样的话作为开发者就很友好了。那翻回来 我们接着往下说,他的右边啊,还有一个向下的箭头,当你点击向下箭头,这里呢展示了更多可用的开发者工具, 这里展示的都是你当前本机,就是你当前电脑所安装过的 id, 比如说我安装过 ctrl, 那 它就有 ctrl, 我 安装过你它的 id 二,它就有这个你它的 id 二,有同学安装过其他的开发者工具,那这里呢,也会 展示出来其他的开发者工具,就是选择你所熟悉的,它默认呢是 vsco 的, 因为我们这里我默认使用的是 vsco 的, 你也可以去更改默认。怎么更改默认呢?点左下角的设置,然后找到设置,在设置里边啊,我们 向下滑动一点点,就是它常规啊,向下滑动一点点,在这里你可以看到有一个默认打开目标,这里边默认是 vs code, 你 可以去修改,比如说老师我喜欢用 cursor, 那 我可以默认用 cursor 打开,但是我们这里呢,还是推荐使用 vs code, 因为毕竟我们最开始给大家安装的就是这个 vs code, 对 不对?好,之后我们 就可以在右上角这里边选择你所默认的那个开发工具打开了,打开之后呢,你就可以很好的修改代码了。 ok, 这是我们提前跟大家说明的,因为,呃, codex 并没有提供代码编辑的功能。好,翻回来我们接着往下说。我们本节课的重点目标是代码的管理。代码管理呢,主要有两种解决方案,一种呢是 通过 get 加上分叉的功能来实现,另外一种呢是 getworktree 啊,这两种我们一个个来给大家说。先来说第一种解决方案,就是管理代码,解决方案就是通过 get 来进行管理。首先呢,我们要将当前项目部署化成一个 get 仓库。那你说老师我看你这个文件有同学懂啊,他可能知道说,老师你这里有 点 get ignore 对 吧?这是我们的 get 的 那个,呃呃,就是忽略文件,就是哪些东西上传,哪些东西不上传,对吧?因为有些文件是不需要上传到仓库的啊,这是忽略文件,说,你这是不是就有 get 项目?我们说是不是一个 get 项目有,它当然是一个参考,还有一个就是它当前 是不是有一个点 get 的 一个文件,对吧?这是很重要。所以不管怎样,有没有这个文件,大家第一件事还是要先把它出售化一个 get 仓库怎么出售化呢?你们复制这样命令,大家看,这个命令很简单啊,就是 把项目出售化成一个 get 工程,注意排出一些不需要的文件就可以了。好,这个排出一些不需要的文件,其实就是在生成一个点 get echo 这个文件哈, 回到我们的 codex 里边,然后我们选择当前这个项目,然后把这一个命令给到它之后呢,它就会帮我们把当前的项目给出式化成一个 get 工程,就是出出式化 get, 因为你要通过 get 去管理嘛。好,我们接着往下看啊,让它先出式化着, 当你出式化 get 管理之后呢,你就可以提交到呃仓库里了,比如说你的仓库可以选择 github。 呃,大多数人可能选择 github, 不 过 我身边很多的小伙伴们说,老师, github 我 这里打开确实费劲,或者我平时也不怎么用 github, 用的更多的是这个 git 一 e。 这 git 一 e 以前叫马云是吧?呃,很多小伙伴们喜欢用这个 git 一 e, 因为打开没有限制,速度比较快,所以很多自己的资源都放在 git 一 e 上面,所以这里呢,我们就呃 通过这个 git 一 e 来进行处理吧,就是我不用 github 了,用 git 一 e。 好 吧,好,那这里呢,我们先打开浏览器啊,打开浏览器之后呢, 我们在这里边访问 get 一 点 com, 这也是跟 github 一 样,只不过它你可以认为这是国内的 github 哈。然后我们登录一下,没有账号的可以自己注册一下啊,有账号的话就,呃,登录就行了。 好,我们登录一下,记住。好,登录,登录成功之后呢,在这里边啊。呃,这以前是我自己的仓库,对吧?当然,你现在呢,我希望把我当前的这个项目就是 餐厅的这个项目给它上传到仓库当中,所以呢,我们要创建一个新的仓库去管理这个项目,在右边这有个加号点,新建仓库,然后这里是仓库名称,比如这个呢,我们还是叫 codex。 嗯,来一个餐厅的话,还是也是叫 shop 吧。好吧,啊,还是叫 shop, 然后这里的用户归属就是我当前自己嘛,然后路径呢,也不改了,这里的介绍呢,我们就 type 测试吧。行吧,然后开源,其他的都不选,默认就行了。点击创建, 这样的话我们就有了一个仓库了,一会儿呢,我们就把图纸画好的项目呢,给它上传到这个仓库里边就可以了,这样的话,你就可以通过仓库来管理远程仓库来管理你的代码了。好,我们翻回来 comodex 这边来到这里。呃,现在图纸画呢,可能需要一点时间,所以接下来的时间大家稍作等待。 ok, 当我们看到它展示出了这个信息,说明它已经把我们当前的项目成功的出水化成为一个 get 工程了。 ok, 这是我们要做的第一步,出水化成 get。 呃,项目, 然后接下来呢,我们要去创建 get 仓库,这个 get 仓库我们已经创建完成了,大家可以看一下,这个是我们刚刚创建好的 get 仓库,现在呢,我们就可以把我们的代码给它推送到这个 get 仓库里面了。怎么推送呢?可以来到这里直接跟他说将 当前项目推送到 get 一 上,好,直接跟他说就行,就是你要做什么事情,直接用自然语言跟他对话,跟他说就行。所以现在呢,他正在思考等待他做这个操作,当然这一次操作肯定是不成功的,为什么呢?他 他要想把当前项目推送到这个 get 仓库里啊?那首先呢,他有这的这个仓库地址,事实上我们并没有给他这个仓库地址,所以这件事呢,他是做不成的,没关系,做不成他会提示你让你去 get, 意义上就是马云上去创建仓库,然后给出仓库地址,他才能给你提供 啊这个推送的操作。那现在呢,我们稍等,他去做这个操作就行了。哎,这里有个细节啊,这里我选择默认权限,为了方便呢,我就接下来给他一个完全访问权限吧,这样就操作起来,不用我们老是授权了,是吧?比较方便。 好,大家可以看到他已经给出回复了,他说,呃,需要我们给这样一个地址,然后他才能帮你去推送,对不对?好,那 地址有没有有了,在哪呢?在这儿呢,大家看一下,这里边不是有吗?有一个 h t p s, 对 吧?我们复制这个地址就行了,然后回到我们的 codex 这边,把这个地址直接给他,此时他就会根据这个地址把当前项目推送到这个仓库当中, 等它推送成功之后呢,我们在这么一刷新,你就看到了我们那个项目了, ok, 所以 接下来呢,我们需要稍作等待。 ok, 当我们看到这个信息呢,说明它已经推送成功了,它这里也给出了你一个推送成功,对吧?那回到我们这边,大家刷新一下就能看到了, 大家看,这就是我们推送上来这个项目,跟我们这个源码中保持的是一致的。好,那我们成功做好的第一件事就是将项目推送到了远程仓库,然后我们要做什么呢?回滚。 什么是回滚啊?就是我们当天写代码往后继续写,然后提交,写,提交,然后当某一时刻我们发现这个代码我们写错了,我们想回到上一个版本,能不能做到?能,就是通过什么回滚 这个回滚的功能啊,可以利用 get 的 功能加上分叉的功能。分叉的功能是什么?分叉的是 codex 所提供的, get 就是 get, 对 吧?通过这两个功能相加来进行实现。好。呃,修改代码,然后提交到仓库,这样吧,我们对这个代码呢,可以稍作修改来到这边啊,然后我们可以打开我们当前这个项目, 打开这个项目,或者我们在这里边打开也行,打开的话我们这里需要直接打开这个地址,好关掉一下啊, 好,现在无法访问是因为这个项目没有被跑起来,对吧?它需要我们运行这个 n p m build, 然后去构建一下再跑,我们不用那么麻烦啊,这里不是有 v s code 吗?我们直接在 v s code 里边的终端啊,大家看,我们是按快捷键打开的。 呃,按的是这个 ctrl 加勾啊,打开的,打开我们直接执行 n p m run d e v, 把这个项目跑起来, 他默认地址在这,我们复制一下这个地址,来到这边呢,把这个地址复制过来,然后一回车就可以打开了,看到了吗?好,打开之后呢?这个其实在这里也行,在这里也行,在哪都无所谓。然后我们可以做一个简单的修改,比如说我们想去把今日推荐改成,呃,推荐可以吧?那我们可以点标注,然后把这个 啊,将今日推荐改为推荐菜品,可以吧?然后, ok, 这个时候呢,我们继续发给他,让他去做这个修改,这样的修改的话就相当于我们每天写代码,每天写代码每天都要提交代码,一是一样的,对不对?我们只是做一个简单的修改,然后做一个提交, 现在呢等待它修改,因为我们现在修改内容比较简单,就是今日推荐的一个文本变成推荐菜品,所以它的改动应该是相对比快一点,我们稍作等待。好啊,这是我们之前的是吧?现在的还没有开始,我们稍作等待。 ok, 当我们看到这个信息呢,说明它已经修改完成了,那修改完成我们回到这边啊,干嘛呢?把修改之后的代码重新推送到仓库,那我们可以告诉他 提交代码到 get e 上,对吧?它现在呢就会去重新的把这个代码呢再提交到 get e 上,一会儿我们在这边就可以看到,这就相当于我们去修改了代码。一会儿呢,我们再通过分支的操作,分叉的操作,应该是把它再还原回我们之前的效果。好,我们稍作等待。 好,我们看一下,这里边已经提示了我们成功了,对不对?提交成功,来到浏览器这边我们刷新一下,其实不用刷新,大家看看界面已经有了,对吧?看这儿, 呃,更新了菜单区域的标题,没有任何问题,说明他提交成功了,可是有小伙伴说了,老师,虽然他 交成功了,但是我更希望他能还原我上一次的那个效果,因为在我看来这个推荐菜品啊,没有今日推荐显得更有烟火气,对不对?所以我希望回到之前那个形式,怎么办呢?来到我们这边 你首先要回到你提交代码的上一次那个操作,也就是我们推送成功的这个操作,对不对啊?你看这下面这个是提交代码 啊,在这呢吗?然后我想回到上一次,那不就是上一次我们推动成功这个这个这个点吗?对不对?我想回到这个点,怎么办呢?我们先把绘画给回滚了,怎么回滚呢?其实就是分叉的操作在这里啊,你看下面这是不是有一个小的啊?在这有一个小的分叉呀,我们点一下这个分叉, 然后他会问你是从角就是,呃,怎么去处理啊?是派成到本地还是派成到新的工作数?我们派成到本地就行了,点一下, 稍等片刻,他就会在我们的左侧这里呢派生出来一个新的对话窗口,看到了吗?而这个对话窗口相当于复制了一下之前这个对话,但是又没有下面这个部分 啊,就把上面的全部都复制了一份,看到了吗?那现在呢?其实他只是把你的绘画回滚了,注意此时只回滚了绘画,并没有回滚代码,不信大家可以看到。这边我们刷新一下这面的代码,并没有回滚,还是之前那样。那我现在也既想让他对绘画回滚,也想让他代码回滚,怎么办呢?来看下文档, 他说注意此时分叉功能,只能回滚历史,呃,对话历史不能回退代码,想要回退代码的话,我们需要告诉他把代码回退到哪里,怎么告诉他呢?我们先来到 vs code 这边, vs code 这边在左侧这里边有一个分叉,看到了吗?在这里呢,我们就是原代码管理嘛,点一下他,点一下他这里面,因为你提交到 get 上面了嘛。然后这是你的第一次出纸化提交,这是你的第二次更新,我们要回到就是第一次出纸化那里,对不对?把鼠标放在这,放在这呢,在右侧这里边,在这有一个 提交啊,复制提交哈希,或者你在这里右键这里也有个复制提交哈希,当我这是中文的,你们英文的,你翻译过来就行了,对吧?嗯,然后复制一下它,这时候我们回到这边, 回到这里吧,我们粘贴一下,这个呢,就是你这次推送成功那个 id, 你 只需要让它回退到这个 id, 这就行了。我们这样告诉他把代码回退到这里,然后此时 再让他去操作,我们稍等片刻。之后呢,他就会把代码回退到上一次,就是你修改之前的结果了,这就是整个利用分叉和 get 来做一个回滚的操作,我们稍等片刻。 ok, 当我们看到这个信息呢,说明它代码也回滚完成了,我们验证一下。怎么验证呢?一个是回到我们之前这个项目这里边,我们回到这里之后呢,点一下这里啊,然后呢还是把我们的浏览器打开,打开之后呢,我们直接访问这个历史信息就行了。来看一眼, 大家看这里由原本的那个推荐历史变啊推,呃,就是原本的那个信息变成了今日推荐了,对吧?原本我们改成的是推荐菜品,现在已经回到了我们的呃当前这个今日推荐这个状态了,对不对?说明什么?他已经通过了。然后呢?呃,这里边注意一个小的问题啊,这里虽 然是代码上看着没有问题了,但你要确认一下这边是不是也回滚了,我们强制刷新一下,但你会发现这里有一个提示信息,你可以点开看一下这里的代码是否真的有回滚,如果没有回滚的话,你还需要让他同步一下,咱们向下滑动,找到今日菜品。 看这里边啊,他其实还是显示的推荐菜品。说明什么?说明代码虽然在本地成功了,但是并没有真的回退到,就是代码虽然回退了,但是我们的仓库并没有回退,所以如果你希望此时让你的仓库跟他保持一致的话,那你可以继续跟他对话,仓库 与本地代码保持一致, 好让他进行一个提交,这样的话,呃本地就和仓库保持一致了,因为我们还是希望本地和仓库能保持一致,以便我们下一次再提交的时候不会产生问题,我们稍作等待, ok, 他 说已经同步完成。那此时呢,我们再翻回来看一眼啊,这里边我们直接刷新啊,应该是推荐对吧?不是菜品好,大家可以看到这里变回了,今日推荐没有任何问题。当然呢,你也可以直接回到我们当前仓库, 你可以看到这里边是不是它也回退了,这里的注示信息已经回退到最初的模样了,所以这样的话就代表我们整个回退都是成功的。那么此时我们就完成了第一个操作,就是回滚的操作,利用 get 加分叉功能来进行实现。 我们接下来呢再给大家讲第二个,这是 codex 的, 就叫它叫 getworktree, 啥意思呢?来看一下描述吧。它说 getworktree 啊,本质上就是利用 get 创建一个新的分支,然后把这个新的分支啊, 呃,代码呢?完全复制到一个新的文件夹里边,而这个新的文件夹呢,其实就是一个 work tree, 优点是主文件夹和分支文件夹可以并行工作,各自修改各自的代码,互不干扰。完毕之后呢,还可以很方便的合并到一起,他说合并也非常容易,对吧?那这个怎么操作呢? 我们可以在当前项目下,右键创建有永久工作数,可以创建两个,在不同的工作数里让它去做不同的事情,对不对?然后再去做修改,然后最后再合并。我们演示一下吧,回到我们的 codex 里边, 在这里呢,我们可以将当前的这个项目呀,大家看,我选中项目之后呢,在这里边有一个创建永久工作数,比如第一个我要改什么呢?改 tito, 行吧,改标题,创建一个, 然后第二个我们可以改什么呢?比如说我们要改招牌菜的描述,可以吧?那这里呢,我们再创建一个永久工作树, 呃, bsc 描述嘛,然后创建,这样的话,我们就有了两个分叉,这两个分叉你收起来,大家看它长成这个样子, 这后面呢和前面的图标他长得其实不一样,代表他是分叉。然后此时呢,你可以在不同的分叉里做不同的事情。比如说我们在第一个分叉,我们可以在后面点击这个新的对话,然后在第一个分叉里边让他帮我修改标题, 修改顶部标题,好直接给他就行了。然后下面这个呢,也可以让他再做一件事, 这个呢是让他修改菜品描述,我们就修改菜品描述,当然你可以具体指向哪个区域的菜品描述,我们就直接给他了,他爱修改哪修改哪吧。至于修改哪,其实对我来说不重要,我要给大家演示的呢,就是他修改完成之后呀,我们可以 呃再合并回去。你看现在呢,就是在两个分支上同步工作,对不对?如果你有多件事要去改动,改动完之后呢,再把两个部分同时给他 合并到当前的主分支当中来。其实刚刚我们说了,它这个 worktree 啊,就是 get 的 一个分支操作啊,继承字 get 分 支操作是一个意思。 ok, 那 我们现在稍作等待。 ok, 我 们可以看到它已经修改完成了,看这里,然后这边呢也都修改完成了,修改完成之后啊,我们就可以直接把它合并到主分支上去了,直接跟他说合并到主分支。 然后我们的第二个呢,也是可以直接把它合并到主分支就可以了。当它合并到主分支合并完成之后呢,我们还可以把这两个再给它删除掉。好,我们现在等到它合并主分支。 ok, 我 们可以看到第一个合并已经成功了,它说已合并到主分支,其实它修改了什么,大家可以自己去看,在这里呢都有都有说明,对吧?在这呢,然后另外一个呢,还在合并,我们稍等片刻, 好,这个呢也合并完成了,此时呢,我们已经合并到主分支了,大家可以自己下去也这样的一个操作,看一下是否改动成功,并且合并成功。当你合并完成之后,这两个分支是不是就没有作用了呀?我们可以右键点击移除。这个呢,也可以右键点击移除,这就是我们要给大家说的呃, work tree。 那这个 word tree 到底有什么意义呢?其实刚刚大家已经感受到了,它的优点呢,就是高效的合并,呃并行去处理多个任务,然后合并的主分支非常方便。这就是我们本节课的一个重点, 关于代码的一个管理,可以通过 get 加上分叉去管理,也可以通过呃 word tree 去进行处理。好,那本节课呢,我们就给大家说到这里,感谢各位聆听,咱们下节再见。

来看一下秋之 codex 的 一个教程,那首先来看这 codex 和 cloud code 的 一个区别,本质的话都是一个编程的 agent 转为一个通用的 agent, 一个的话是 anthonpy 公司,一个是 open ai 公司开的模型,那个支持 codex 的 话,请用这个 open ai 的 一个 gpt cloud code, 它可以替换任意的模型,你可以接入 deepsea, 对 吧? 接入一些其他的 kimi 啊,什么国产的一些大模型,易用性的话, codex 更友好,适合零基础的一个白领。 cloud code 它自由度更高,偏专业的一个开发者。 功能上来讲呢, codex 它强化了这个浏览器操作,它可以用,对吧?浏览器操作以及 computer use 内置 image 二,它这个深图的以及新增手机端加 hook, 手机端的话,它就是用手机就可以去操作。 cloud code 呢,功能更全。像这个 skill m c p 斜杠命令, hook 更新较慢。 skill m c p 它通用的接口一样的斜杠,用斜杠命令也可以操作斜杠命令,就像那个编程去写那个斜杠命令嘛, hook 更新较慢, 那这个 hook 的 话就相当于是钩子 hook 的 话,它其实就是一个自动地去调用的一些命令, 它就是相当于说呃有一些自动开呃自动触发的一个条件,自动触发的条件更新较慢。价格维度, codex 二十刀的会员的话,对于就白领重度水温的话都是够用了,不分号。而 cloud code 的 话是按这个 api 的 一个调用计费, a 这个 a p i 的 话,它就是去调用,调用这个什么,就调用这个 deepsea 它的一个这个接口去起用这个所呃用的这个额度, 但是我们自己在 deepsea 里面的话,它是就没有 api, 那 我们这个因为你就 cloud code, 它要用别人的模型,这个的话就要去计费了。适用的场景, codex 的 话,它可以用在日常那个办公解决问题, cloud code 的 写作规划,那编程的话,两者都可以给它结合在一起用是最好的。 然后 codex codex 的 安装与基础设置,首先要准备这个 chat gpt 的 一个账户,用免费或者是付费都可以的,它付费的话它就额度更高一点嘛。安装的话就是官网下载安装登录账号初使用的一个设置, 就选择一些日常的工作,选择你的一个什么身份呢?比如说你是学生,是白领,然后你是设计工作什么的。界面来说的话,它是左侧是对话任务管理,中间是进行聊天,右侧的话是输出结果,是非常简洁的一个界面,左侧的话是一个 任务管理对话,中间聊天,右侧就进行结结果,右侧的话就输出这个结果。核心的能力, codex 核心的能力,它与这个 cloud code 与其他的它特别 不一样的一点呢,它是本地的一个文件操作,本地文件操作项目关联,直接去绑定,绑定本地的文件夹,自动去读写,呃,增增删移动文件,不限数量。就比如说 cloud code 的 话,可能你想要让它处理一些文件的话,你就得 呃把这个文件给它上传到云端什么之类的,但是它这个本地的话,你只要去这个文件夹的一个路径给它写上去,那它能自动去读写增删移动文件,就比如说就是你有,有就是几百个,呃, 照片的一个素材,它不限数量嘛?照片的素,视频的素材,但是没有改名字,没有改名字怎么办呢?你可以这样子,需要这个 cloud code 去识别, 识别这个视频里面的内容,给它起一个合适的名字。那 cloud code 的 话它会自动运行去抽帧,就就是这个视频里面去抽几帧,去识别它的核心的内容。比如说雪地上的狐狸这样,然后它就可能给它一个序号,雪地狐狸, 对吧对吧?然后地点,然后在这个对象是什么?嗯,就这样子能够把几百个几百个这个视频它的一个名称都给它修改了。权限模式,就权限模式的话就是你给这个 codex 它的一个权限, 嗯,修改的一个权限默认的话是在文件夹内操作外外需的话就是齐全 自动审查,就 ai 自己去判断。自动审查,自动判断是推荐新新手完全反问全全全部的权限,就是说可能他把你一些东西都改了,删除了,慎用上下文的管理,自动手动压缩或者是斜杠去 给他进行压缩。上下文管理为啥呢?因为上下文的话他就是一个提示词的上下文,他会可能会给你消耗比较多的一个额度, 所以你给它进行压缩,当它就是已经处理到比较下面的任务的时候,可以把它的上下文给它压缩一下。 查看额度的话在设置设置栏里面去看这个状态,能够查看额度案例的话,就是视频的素材批量进行重命名,以及视视频的剪辑合并,都可以用这个 codex。 命令行工具,使用命令行工具的话就像是我们 嗯,电脑就嗯给他就 command, 给他呼起一个,对吧?嗯,比如说让他关机,那你写你就可以 就就是可以就通过通过输入那个文字让它关机,而不是用鼠标的一个操作,这个叫做命令行工具安装。可这个命令行工具可以怎么用呢?首先就是比如说可以安装这个 nod, js、 git 等基础的一个工具部署 agent, 像这个 hermes cloud code, 你可以直接在对话框里面跟他说帮我部署这个 hermes cloud code 等软件的一个管理是什么?像这个 cursor, 然后飞书 cleet, 它这也是命令行工具等的,就给他用安装技能工具。技能工具,你比如说我要去找一些 skill, 也可以让他自己去找飞书 c, 就是 飞书的命令行工具给它安装进来。并行任务是它的一个特特点, 就是多个对话同时执行不同的任务。你可以因为像豆包啊,像 deepsea, 它们都好像就就只能是当前的一个任务,给它回答完了之后它再去做别的,对不对?但它这个完全是可以并行的,就是多任务同时去 执行不同的一个任务。比如说我这视频素材批量重命名和视频剪辑合并的话,两个,或者是说你你另外一个,你去找一个合适的一些图片,合适的一些字体,对吧? 这两个任务是完全不耽误的,可以并行。而且这个理论上的话就是看你电脑的性能,它可以并行特别多的一个任务。 持久的记忆,手动记忆就是 agent md 的 话,全区性、项目性的手动记忆。 agent md 它就什么叫记忆呢?就是一些规则嘛,就是一些规则指令,像全区的话,在设置 设置里面个性化自定义指令,全职生效,它就是对于所有的工作它都就是,比如说你自字体是多少或什么样子的,是吧?它是全职生效的,像项目级就是指对这个项目生效的一些规则的一个记忆,你可以在项目里面手动地去创建 ai, 或 是说 ai 生成。 ai 怎么生成呢?你可以就比如说这个项目进行到一半啊,进行到一定阶段的时候,你可以让这个 ai 去生成一些, 就就是这个全呃,就项目的一些指令。自动记忆,自动记忆开启后对话闲置、自动总结、储存消耗额度,它是不建议手动改。什么叫自动记忆呢?它就是相当于 ai 的 一个自动记忆的功能嘛,就你的一个工作风格,你的一个 偏好什么之类的,有各种各种维度的,那它的话, ai 的 话它会自己进行总结,总结一些规则,然后可以有一些附用的经验的话,就是下一次的话它就会用。还有是 往下看呢,它是一个持久记忆。就图片生成与项目开发内置了 image two, 你 可以用一些就是提示词去生成这个高级感的一个图片, 而且可以不断的去调整自己的一些提示词,什么之类的。计划模式可以去做一个网页 复杂的任务,先列计划,再执行计划模式,他有点像是那个开发的模式案例的话,就比如说个人主页的一个开发,深层修改、预览部署是怎么生成呢?他个人主页的一个开发,你首先跟他说自己的这个 想法,那他的话会给你列出计划的一步一步,而且在每一步上面,他比如说你这高级感的一个图片的话,他会让你去选择某些风格的, 就一步一步去选择,他会给你三四个选择,那所以深层修改,而且右边的话,他可以预览整个个人主页的开发的一个效果, 最后部署的话可以就发布出去使用的功能呢?任务引导纠篇任务引导纠篇是什么意思?就是说你在完成这个任务的时候,你纠篇,你觉得啊,他这个说的不太对了, 你跟他说的话,他其实不会打断这个任务,只会在下一次的时候进行一个调整,这样的话就不会浪费很多的这个额度,嗯,而且也不会让他跑偏。对话分叉 fork, 他 是在就是整个 整个,呃,就是任务结束之后它会有一个 fork, 是 在这个右下角,右下角 fork 的 话,你会觉得它这是不是有点跑偏了你,你会想着说怎么给它纠正这个 fork, 这里面的话可以进行一些小调整。桌面宠物的话是 一个有意思的一个,就是小宠物在这边插件与操控常用的一个插件,它其实常用的一些插件的话,它就是一个 skill 啊, m c p, 然后包括 c c, 呃, c l i 的 这种 类似的一个集合就插件,它就是会实现一些功能浏览器的一个操作, get up, 然后表格 ppt net nullify however vocal 的 这个部署 browse use 的 话,它是浏览器的一个操作,怎么浏览器操作呢?它能够操控浏览器进行点击方页,然后表单自动化,就比如说你可以让它去做一个呃 m b t i 的 一个测试,或者说基于你的一个性格 去去帮你,帮你测试,它能够自己去选择,然后得出一个答案。 chrome 插件的话可以操控已经登录的浏览器,而且后台是它是在后台,后台多任务操作的,就根本不影响你,你自己去去做这个浏览器 的一个,对吧?你自己还要用这台电脑去浏览其他的页面,完全是 ok 的。 computer use 就 操控电脑的 app, 就 仅 mac, 比如说音乐微信剪映,比如说让它去打开一个音乐软件,把这个音乐发给微信,是吧?或者说就把这个音乐加到这个剪映里面,这个它可以操控这个电脑的 app, 仅在 mac 上是可以实现的。 skills 技能定义 skills, 比如 find skills, 自定义一些 skills 创建的话就是整个流程,流程跑通之后,你可以把这个整个流程怎么样,沉淀下来就附用,沉淀下来附用就直接指令,你就说,哎,就按照这个项目流程去创建这次的这个 skills 案例的话,比如说我想要去做这个 写一篇图文推荐的图文,就 get up 上面的一个热门项目的推荐图文,就在我就是不断地去给它调试后觉得这个结果是满意的,那就把上面的这个流程方法生成这个 skill 下一次, 对吧? ugetup 上面的热门项目就大概每周的话它都会更新,那它就是你每周可以做这个 skills。 m c p 连接 m c p 的 话有点像是 u 盘插口,插口去去把外部的一个数据连接外部的一个知识库服务去安装, 可以就是自己去做,也或者是说你直接让这个 ai 自动授权安装案例的话,比如说 notebook l m 的 一个知识库的连接,知识库连接之后你就可以直接去提问这个知识库里面的一个东西,调用知识库里面的一些 呃,就比如说它这里面存的一些呃反弹啊之类的。自动化定时任务创建的方法,可以在自动化面板上面创建,也可以直接跟这个对话,让它创建案例的话,比如说每周都给我 呃生成 get github 的 一个推荐图文,因为我们这个 skills 不是 已经沉淀下来了吗?然后现在的话就给它定时每周生成,那我们都根本不用去记这个事了,它就是它定它到,比如说周一或者什么时候它就会生成,或者说每日的工作日报的一个汇总, 它也能够给它定时生成,这就自动化的,自动化的那就怎么样子不用人为的去给它介入了。手机端的一个操控,前提的话就是这个手机要下载这个 check gpt, 然后电脑的 codex 更新到最新版本,操作的话就是手机端侧边栏的 codex 授权去连接电脑。 功能是什么样子的?手机端操控就是你远程你就电脑,对吧?你就开着那远程去下发任务,控制电脑干活, 直接能够控给他一个指令,他就能够控制电脑干活,免费版可用,支持 mac。 总结的话就是说这个 codex 的 核心能力是文件操控,而且是本地的一个文件操作命令行操作。持久的一个记忆,持久的记忆一些规则深图的开发 插件的操控 skills skills, 然后 m c p 的 话连接外部的一个知识和数据库自动化,可以自动化定时任务。核心的认知呢?我们现在已经从 问 ai 要一些答案,先到管理 ai 准备一些上下文的一个环境,制定目标,检验成果,去沉淀这个流程,去转变核心的认知。就是我们现在已经到了,就说从问 ai 要一些答案,到就是管理 ai 准备上下文,定目标,验 结果,然后沉淀这个,呃,流程,就让它这个整个流程的话给它自动化 sop 是 吧?

今天我们聊一下 codex 这一个月更新的八个新玩法。我以前一直觉得 codex 是 个备胎,去年四月 codex cli 刚出来那会儿, 我用了两天就回去用 cloud code 了。理由很简单, codex 当时就是个会写代码的终端 agent, 跟 cloud code 比没什么区别,模型还稍微弱一点。直到四月十六日那天, openai 发了一条公告,标题叫 codex for almost everything, 意思是 codex 不 再只是写代码的 agent。 先说最离谱的那一项, computer use codex 现在能看你屏幕点你 u i, 用它自己的光标在你电脑上打字,授权之后它可以操作你电脑上的桌面 app。 我 第一次让它做的活是把这个 figma 设计稿里的色值抓出来,写到 tailwind config 里,它打开 figma 截屏识图写入全程。我没动鼠标 这类跨 app 的 活, cloud code 作为 c l i agent, 很 难直接做 codex 这一步直接跨出了终端,代价是你给他的权限是整台电脑,不是某个项目目录。心智压力比 cloud code 大 一个量级。跟 computer use 配套的 还有一个内置浏览器。最有意思的设计是,你可以在网页上直接评论,把这个 comment 当成指令丢给 agent, 就像在 google docs 上选中一段文字加评论一样,但被评论的是网页 dom。 举个例子,你打开本地预览页,选中一个按钮,评论一句,这个按钮状态太弱,改成更明显的 primary action。 完了, 这种指着浏览器跟 agent 的 说话的交互,比 cloud code 走 mcp 接 api 那 套直觉多了。普通人不用懂什么是 api, 但真正让我有点恍惚的是, automations 是 一个持续任务系统,你给 agent 的 一个长期目标,它可以附用原来的对话上下文, 按计划自动唤醒继续做。 openai 的 原话是 potentially, across days or weeks。 比如你可以把任务写成每天监控这个开源项目的 issue, 每出现一个跟性能相关的,就帮我整理背景附线路径和可能的修复方向。它每天自己醒一次,自己扫,结果放到队列里等你看。这开始有点接近让 agent 接长期任务了。然后是 pets, 五月一日左右上线的,是这个月 codex 最初圈的更新。你输入 slash pet 就 能召唤一只虚拟宠物,浮在屏幕上做状态指示器, 它告诉你 codex 现在在跑什么任务,是不是在等你输入,是不是做完了。八只内置宠物可以选。还有一个 slash hatch, 可以 让 ai 生成自定义宠物。这设计妙在,它解决了一个我们都默默忍受的问题。 agent 在 后台跑唱任务的时候,你不知道它现在到哪了。以前要么切终端,要么挂个第二屏幕,现在屏幕上一直有只小猫,它的姿势就是状态,但是区域限制要分清。 open 官方明确说 computer use 初期不再意义。 a u k 瑞士开放 hats 这块我没核到同等强度的官方说明。所以如果你人在欧洲,并不是所有 codex 新功能都能立马可用。第二自定义宠物的画风偶尔会翻车,社区里已经有人把 clippy 动漫角色,各种像素小人都做出来了。好看的是真好看,怪的也是真怪。 但一个虚拟宠物功能能被开发者认真讨论,你就知道它戳到了什么。剩下几样我快点过。五月十四日, codex 进了 chat gpt 手机 app, 准确说是手机端可以远程接入正在运行 codex 的 mac host。 你 在地铁上,在咖啡馆, 可以用手机继续控制回答问题,批准操作,看 df 和测试结果。但电脑那边要保持在线, codex 也要再跑。这事跟 automations 配在一起威力很大。早上出门前交代一个长期任务,路上用手机补两句判断, 回家再看结果。这里要修正一下。 cloud code 也有 remote control, 可以 从 cloud app 或 cloud 网页端继续本机绘画。区别不在有没有手机入口, 而在 codex 把入口放进 chat gpt app 这条产品线里。四月十六日那波还顺手加了九十多个插件, atlanta rover、 circle shade code、 rabbit、 github issues、 microsoft suite 都在里面。 cloud code 走 mcp 也能接,但要自己配 servoach。 codex 这边是点一下装好的体验,底层也换了。 四月二十三日, openai 发布 gpt 五点五,并明确说它正在进入 chatttt 和 codex。 官方说法是, gpt 五点五在同类 codex 任务上更强,也更省 token。 它还跑在 nvidia gb 两百和 gb 三百 n v l 七十二系统上。具体到比 cloud code 省多少,社区里说法很多,我没看到一个能直接当结论引用的统一数字,但我自己的体感是,同样刨长任务 codex 的 成本焦虑确实小不少, cloud code 也没掉队。 antropica 四月十六日发布 opus 四点七 s w e bench verified 报道,百分之八十七点六。 open i 这边 gpt 五点五的 terminal 奔驰二点零是百分之八十二点七, cloud opus 四点七是百分之六十九点四。 这些 benchmark 口径不完全一样,不能简单等同于 codex 工具,打败 codecode 的 工具。我现在更愿意把它理解成 codex 在 长任务、跨 app 成本和可用性上进攻很猛。 cloudcode 在 严肃代码质量和复杂重构上仍然很有竞争力。 dv 上有篇社区余情整理,看了五百多条 reddit 评论和一些盲测,结果给了一个挺贴脸的说法, cloudcode 是 高质量但不好用, codex 是 稍低质量,但真的可用。这不是严格抽样调研,但它很像最近很多开发者的体感社区。现在很常见的一种用法是 codex for keystroke, coded code for commits。 日常输入用 codex 跑得快又省心,关键提交 code review, 复杂重构,切回 code code, 求质量。 甚至有人把同一套 skill 同时喂给两边。聊完功能再退一步看,会发现一件挺有意思的事儿。 cloud code 这一个月在生化, harness 做插件 hack worktree 和 deny rules, 把自己往 os like 做, codex 则跨出代码边界做 computer use, 内置浏览器 automations, 手机入口和虚拟宠物,把自己做成 digital co worker。 一个想做你的操作系统,一个想做你的同事。两条路都对,但两条路真的不一样了。 我现在的姿势是两个都开。 codex 跑,长任务跑,跨 app 的 活跑,需要在手机上启动的活。 codecode 跑,严肃 commit 跑,要保质量的重构跑,开源项目。那只 codex 的 小猫还浮在我屏幕右下角,告诉我它在等我。省一个 p r。 你 用 codex pets 了吗?

codex 大家应该都用上了吧,但是它的缺点就是额度太少了,完全不够用,而且它的头款实在是太贵了。那一种解决方式就是把咱们自己比较便宜的一些模型借进去,比如说 bitcoin, 咱们需要 c c 叉, c c switch 以及 bitcoin 的 api k。 首先我们在 bitcoin 点击 api 开放平台 api case, 创建 api k, 这个 k 一定要保存好。然后我们搜索 c c 叉, 点击这个,在下面找到适合自己的版本,我下载的是 windows 版本,然后搜索 cc switch, 点击下载,在这个界面一直往下翻,找到适合自己的版本,我仍然下载的是 windows 版本,然后安装 在 c c 叉文件夹下,我们新建一个 text 文件,命名为点 e n v, 把这些内容填进去。 k 就是 你设置的登录密码,我这里设置一二三四五六,然后重命名,把点 txt 删掉,运行 c c 叉,这个时候会弹出终端,复制这个 local host 地址,到浏览器打开点,点击 contacts, 选择添加渠道。在这里可以打开 delete 官网找到调用 api, 复制 c u r l, 把这一行改成 api k, 填写你自己的 delete 的 k, 选择详细配置。我们要选择 open ai chat 模式,继续往下翻,把这两个按钮打开,然后就可以了。现在我们在 c c switch 点击 codex 图标,再点击右上角的加号,供应商名称可以随便写。 api k 是 你在 c c x 的 点 e n v 文件里设置的登录密码,我的是一二三四五六 api 请求地址填写这个,点击获取模型列表,可以看到 deepsea 模型了,选择即可。然后我们点击测试模型,如果正常,说明已经配置好了, 我们重启 codex, 选择其他方式登录。这里的 k 也是你在点 e、 n、 v 文件里设置的登录密码,比如我的是一二三四五六,然后就可以了,现在 codex 里面的模型已经是 zip 了。

想用 codex 帮你改代码,第一步不是写提示词,第一步是先把环境装对。这期我用 windows 新手视角讲一遍 codex 怎么安装, a p i 怎么配置。先说第一步,安装 no case, 你 可以去 no case 官网下载 lts 版本,装完以后打开 power shell, 输入 node v, 再输入 n p m v。 如果两个命令都能显示版本号,说明基础环境没问题。第二步安装 codex, 在 power show 里输入 n p m i g o p n codex, 等它安装完成,然后输入 codex, 第一次运行,它会提示你登录或者使用 app。 这里注意, codex 不是 普通聊天网页,它是跑在你电脑终端里的 ai 编程助手,它能看你的项目文件,能解释代码,也能帮你修改代码。所以第一次用不要直接让它乱改项目,先让它做一个安全任务,以 如输入,先帮我解释这个项目结构,不要修改文件。接下来讲 api 配置。如果你用官方账号,可以按 codex 提示登录。如果你用 api key, 重点看三个东西, api key、 base url、 模型名。这三个必须对应同一个平台。很多新手第一步就错在 base url, base url 不是 网站首页,也不是控制台页面,它是接口地址,常见格式会带 v e。 如果你把官网首页填进去,后面 t 再对也可能连不上。第二个容易错的是 api t t 不要少复制字母,不要前后多空格,更不要把 a 平台的 t 填到 b 平台的接口地址里。遇到四零幺优先查 t。 第三个容易错的是模型名,模型名不要凭感觉写,后台支持什么模型你就复制什么模型名,遇到四零四或者提示模型不存在,先查模型名。还有一个重点, codex 更适合使用支持 responses api 的 接口, 如果你的中转只支持普通聊天接口,可能会出现连不上游戏失败。工具要用异常,所以配置前最好确认这个接口能不能跑。 codex 能不能看日智,能,不能查余额,能不能看到错误原因。 最后给你一张新手排错表, npm 找不到,先查 nodex 有 没有装好 codex 命令找不到,先查 codex 有 没有全区安装成功。四零幺先查 api 机 四零四,先查 base ur 焊模型名四百二十九先查额度焊限速超时,先查网络焊接口稳定性。如果你第一次用 codex, 我 建议先做三件事,第一让他解释项目,第二让他找一个小 bug。 第三让他给修改方案,不要一上来就开全自动, 先看懂他要改什么再让他动手。如果你要 codex 安装检查表评论打 codex, 如果你卡在 api keybase url 模型名也可以评论你卡在哪一步。我下一条专门讲 codex 借 api 中转怎么排错。