现在的模型基本上都是两百 k, 但是你在编程的时候到底用了多少?这个你有仔细去看过吗?今天我给大家分享一个怎么样去设置 cloud code 的 一个上下文查看窗口,这个不像 code x 它会显示这个上下文, cloud code 它是没有默认显示上下文的,只有到最后的百分之十的时候它才会显示。 第二个点就是给大家分享一下我今天踩的一个坑,因为我总感觉做一些稍微大型一点的项目的时候,他的上下文窗口特别的窄,因为我可能做一些稍微大型的项目的测试啊,或者说修改的时候,我想要去拿到足够的上下文,可能就是五轮对话或者十轮对话,他就要压缩上下文了。所以说我就详细的看了一下他的 contacts, 给我震惊到了, 可以看到我这是一个新的对话,他两百 k 的 上下文,我有效的使用空间只有百分之六十四点五不到, 而且是我优化过后的,我把 mcp 删到只剩下了一个 playwrite 的 mcp, 因为我要做这个端到端的测试,所以说留下了这个 mcp。 在 我没有进行优化的时候,比如说在它这个 memory fails, 它里面包含了很多这种嗯规则的文件夹,因为我之前安装了蛮多的黑客松他分享的 cloud code 配置的项目, 所以说我可能就安装了很多这种东西,大家一定安装的,一定要删掉,不要堆很多。我之前启动的时候, 新对话它的这个自由空间就只剩下了百分之四十多,相当于我只有九十多 k 是 有效的空间,其他的全被什么 m c p 记忆文件塞满了,并且它这个记忆文件还跟那个记忆文件还不一样,它其实就是你的一些命令行的一些东西,它会全量的加载。 我们来详细看一下,它的系统提示词包含了四 k, 然后系统的工具就包含了二十二 k, 然后它还要保留三十三 k 的 百分之百分之十六点五的不能侵犯的空间,因为它要做这种上下文压缩,所以说这一部分空间它是直接给你砍掉了的,所以说不管你做什么,它至少有五十多 k 的 上下文是你完全用不了的。 所以说这个点大家还是要知道一下,特别是你的 m c p, 你 的工具,你的这种规则记忆不要写太多,写太多会影响你的上下文,这都是我优化过后的,它有百分之六十四的上下文还可以用,这个是一个特别巨大的坑,特别是 m c p, 别堆一大堆 m c p 上去,你的 contacts 打开来一看, 你这个个 m c p 如果说上了两三个,肯定你这个 m c p 在 十 k 以上了。 ok, 我 们今天还是给大家分享一下这个看上下文的一个项目,但是它这个是到百分之八十二的时候,就基本上是到了它要压缩的上下文,它是按照两百 k 来计算的,不是看按照这个有效上下文来计算的。 所以说大家看在七十的时候,其实就要思考把现在的任务做一个归档和这个总结了。你可以直接告诉他,你的上下文不够了,我准备要压缩你上下文,你有没有什么需要记忆的或者收藏起来的东西,因为我是用的 team 模式,我会专门去给他创建很多,比如说这个是后端的,然后我会让他去把这些文档给记录下来, 然后这个这种一二一的测试的,这种是代码的主要 leader 成员的,然后我会让它记下来,所以说我到七十五 k 的 时候,我基本上就会让它做收尾了,因为你如果不收尾的话,你上下文压缩了之后,它很多信息就丢失了,下一次执行的任务它效果就非常的差。这个就是那个项目 cloud h, 它其实就很简单,首先是你的项目,然后它是什么模型,然后对应用量的上下文调用的工具调用了哪些也有,然后使用了哪些子智能体也有,但是它对这个 team 模式是支持的比较少的, 同时它这个用了哪些 team 它也没有显示,但是它可能后面就慢慢会更新,然后代办事项这种 task 和 to do list 它都会去写下来。 然后安装也是很简单,直接安装这三个,如果说有问题的就可以直接把这个文档发给他,让 cloud code 去给你做安装。但是它有一个比较好的一个点哈,就是它这个是热启动的,只要你安装好了之后,你所有的都不需要什么重启啊这些它直接就可以完全显示。 然后配置的时候,大家也可以把它这个功能全部配置上,因为它这个并不会增加这种托管的消耗,所以说它都是按照钩子这种脚本的方式来做的,做的这种总结,所以说不用担心,直接使用就可以了。 ok, 最后也可以说一下,或者打一个广告,我们几个朋友去做了这样的一个中转,可以大家一起去拼这种二十 x 的 账号,这样的话基本上就不会有被封的风险。如果说大家有用量用的比较多的,也可以点我主页沟通一下,但是如果只能用这种 二十美金的,这种一个月只能做二十美金,其实就完全没必要哈,你如果能用掉这种五 x 的 以上的,可以可以联系我。 其实就是我们几个朋友去搭了这样的一个类似于中转站吧,因为现在很多中转我们自己使用的时候发现反正他有点掺水,然后又不是 cloud code, 所以 说还是蛮大的问题的,而且很容易封号。如果你在国内用的话,你只有去搞个云服务器,在国外这样会稍微好一点,并且他这个 cloud code 是 真的有点痛苦,他还要 连做机制,就是你一个 ip 搞爆了的话,其实你上面的所有账号都废了,它基本上都会给你连连做全部封掉。呃,这也是现在给大家很大的诟病的,但是从实际使用下来还是 cloud code 的 效果会更好,像欧帕这些再多智能体啊,这种使用其实都是 cloud code 的, 会效果好很多, 这也是很痛苦的一个点。但是国内的一些小模型,它模型的性能还是不够的,特别是你在调用一些子智能体,或者说 skills 的 触发上面还是国外的 opus, 它的效果要好很。
粉丝1.4万获赞16.0万

我试用了几天 openai 新推出的这个 codex 整体使用情况,我是,我觉得我是非常满意,然后用户体验非常好, 尤其是针对那些不喜欢迷你行工具,或者是不知道怎么用 ide 的 那些,给你们看一下这个界面哦, 他这个里都是以文件夹形式,一个项目就是一个文件夹,然后这个文件夹下面你可以跑多条任务,我为什么要出来用呢?你在一个窗口下面,你布置了任务, 你可能还会有些其他的问题,你和他进行了探讨,等你这个上下文过长以后啊,整个模型它的召回率就会比较低, 这就是我们说的那个上下文污染。现在按照这样的方式,他其实已经在引导你,告诉你说,呃,你的一条任务就在一个窗口里面跑,在一个对话窗口里面跑就行了, 然后你可以开多个对话窗口去一个分别执行。还有一块我觉得是比较有特色的,是 openai 做了一个,现在看上去我感觉就是一个给我的技能商店, 然后每一个 skill 你 就可以直接一键安装,安装完成了以后去聊天窗口你就直接可以用,刚刚装好了就在这里就能看到,这个实在是太方便了,然后你不想用了,或者是你觉得不好用,你就直接卸载掉, 这个我真心觉得怎么说,我觉得这应该才是一个软件真正该有的样子吧。然后它的编程我做了一个简单的小测试啊, 因为我看网上有很多人已经测试过了,然后都说速度很快,但我不知道为什么,我这里设置的,我就让他帮我创建一个 to do list 演示程序,然后这是一个很基础的软件了,很基础的一个小的需求了, 但是他应聘的时间你看 work worked for 七分十七秒,我对这个数据, 对这个时间我感觉挺震惊的,然后我就赶紧跑去拿 claus, 四点六跑了一下,一分十七秒就跑完了。那反正我觉得我对 codex 的, 我对它的模型的能力其实是认可的,因为原来我也是在 cursor 里面,经常在 cursor 里面去用 codex 五点三,这个用 codex 五点二,那时候没五点三的时候就用五点二去 改一些比较顽固的 bug, 所以 我对 openlight 的 模型能力从来不怀疑,只是说原来 curses 里面有我没用而已,就没有用官方的了。然后简单说一下这个软件的一些小配置, 这边有个开关建议把打开,因为他可能运行的时间比较长,你电脑可能会睡眠,导致程序运行中断,这个打开了他就能保持你电脑一直处于一个唤醒状态。然后这边是这样模式的话,呃,你可以 相当于你下指令以后,你可以补充你的指令,或者是嗯,他朝另一个方向去思考。这两天反正应该有。我没仔细看他的更新的频率,但我前两天用的有的 bug, 这两天就已经没有了。 我之前这里他会弹出选择框的时候,那个选择框选完了,但是那个选择框不消失, 反正我今天用了一天,我也没发现有这个问题,应该是已经修复了。总结一下,我觉得这次这个格式化界面真的给人耳目一新的感觉。我习惯了格式扣的,但是我用这个我还是觉得用的很爽, 用户体验非常好。格式扣的里面看时间长了我觉得也就切来切去,我切的也很头疼, 我还是强烈推荐大家去试用一下。无论你是做 webcoding 也好,还是说你做一些文案类的工作,我觉得这个软件都非常非常适合你。

你让 cloud 指挥 codex 干活,任务一复杂,最先乱的往往不是实线,而是上下文。 simon wilson 点的很准, sub agents 最适合代码库探索和多步骤计划,因为单个 agent 装不下那么多脏活。 今天我把这层拆给你看,顺便讲清它怎么接近 agent teams 和 ccb。 复杂任务的问题不是模型不会做,而是读代码,找证据,做修改都塞进同一个窗口, 官方文档直接点名。 sub agents 特别适合代码库探索和多步骤功能计划这种天然并行任务。把这些步骤拆开后,主代理只处理结果和决策,上下文才不会越滚越乱。 codex 现在内置三种子代理, default 都得, worker 专注执行和修复, explorer 专注读代码。 这不是三个窗口同时聊天,而是不同角色先分别完成任务,再回到主县城统一汇总。 simon wilson 的 观察很准,这套模式已经成了 coding agent 的 通用结构, agent teams、 ccb code、 sub agents 不是 一回事,而是三层结构, agent teams 解决,上层协助 ccb 解决, cloud 到 codex 的 任务分发, sub agents 解决, codex 内部再拆执行。 前两层决定谁来指挥,最后一层决定 codex 自己怎么改。如果你之前就在用 ccb, 让 cloud 负责拆需求定边界,审结果,现在它终于能更细地指挥 codex 了。 cloud 不 再只把任务扔给一个 codex, 而是能明确要求 codex 先拉 explorer 查,再拉 worker 改。你还能写自定义 t o m l 代理,但先记住三件事,显示 spawn 六个线程一层深度 token 也会更高。 这项更新的意义不是 codex 多了个按钮,而是 coding agent 开始进入角色分工阶段以后,谁还让一个 agent 一 口气查证?改验慢指是副作用,更大的问题是它会越来越糊。

嘿,作为开发者朋友们,如果你正在用 ai 做项目,那接下来这两分钟,绝对能让你的工作效率原地起飞。咱们来聊聊一个核心功能, codex 子代理。好,咱们直接说痛点,你有没有感觉,项目一大, ai 的 日制和代码就堆成山,那个上下文搞得特别臃肿? 结果就是 ai 反应越来越慢,给出的结果质量也开始掉链子。我懂,真的那种感觉太让人头疼。 那怎么办呢?其实解决思路很简单,别再让你的人工智能像一个厨师那样手忙脚乱地想同时做八道菜了。咱们换个玩法,把它变成一个高效的后厨团队,请四个厨师,每个人专心做两道菜。 你看,就是 codx 子代理 sub agency 的 魔力,让工作并行起来,效率自然就上去了。那么,用子代理和不用核心区别到底在哪?咱们来扒一扒 来看这张图,对比一下。左边是一般用户 bob, 他 呢?把代码审查、安全检查,所有任务一股脑全扔给主代理,结果就是一个任务卡住,所有都对等着,又骂又容易错误。再看右边的高手 sally, 他 就聪明多了,给每个任务都分派一个专门的子代理, 这些小助手在后台同时开工,互不干扰,主聊天框干干净净,这小吕简直没法比。而且啊,这里最妙的一点是,当这些子代理在后台拼命干活的时候,你的主代理是暂停的。这意味着什么?意味着你的主对话界面永远清爽专注,再也没有乱七八糟的信息干扰你了。 听起来是不是很爽?别急,用起来也超级简单。来,这是你的三步操作指南。第一步,最简单粗暴的方法,直接用大白话在聊天框里下命令就行, ai 会自动给任务创建独立的运行空间。第二步,如果你有些任务要反复做,那就创建一个点 t o m l 文件配置, 别被这名字吓到,它就是个简单的文本文件。第三步呢,就在这个文件里写清楚子代理叫什么,干什么,用哪个模型,你看,就这么几下齐活了。 当然了,想让你的子代理团队稳定又高效,那这四个黄金法则你得记牢了。记住这四条,第一,低 call, 让他们各干各的,互补影响。第二,单一职责,一个子代理就干好一件事,把它干到极致。第三,结构化结果,要求他们按你指定的格式交作业。最后,也是最重要的失败隔离, 绝对不能让一个子代理的失误把整个系统给带崩了。最后,给大伙一个超级实用的建议,你根本不用从零开始,网上有大把开源的,到滔墨子代理库,直接去社区里找你需要的拿过来改一改就能用,这不就是咱们开源社区的魅力吗? 好了,现在轮到你了,动动脑筋,你第一个想创建的子代理是什么?是让他帮你做代码审查还是自动生成文档?快在评论区分现你的想法,我特别想看看大家的创意。

今天这期视频我们只讲一件事,就是普通人怎么用 codex 开发一个小项目,并且部署上线。很多人可能一听到 code 代码就会产生畏难情绪,但你肯定听说过之前的 open cloud, 很 简单,在手机上给他发个信息,他全自动的就给你干完了,但是他贵啊,帮你发一个小红书就可能花你几块钱, 更别说开发一个工具了。但是 codex 作为 ai, 一个 open ai 的 出品,不但可以像 open cloud 一 样帮你完成几乎任何事情, 而且赠送的免费额度就能满足日常所需,如果你是会员,那更是用不完了。更重要的是,学会这种最顶级的 ai 工具,你就具备了做任何产品的能力。这期视频是 codex 的 入门视频, 我会带你从零上手,从怎么安装 codex, 怎么启动 codex, 如何与 codex 对 话,然后我会带着大家从零开始构建一个电影评分网站,并且部署上线。注意啊,就算你完全不懂开发也没关系,这期视频就是为你准备的。 我们开始首先在开始菜单中搜索 cmd, 打开命令行,这是我们与电脑和 codex 沟通的窗口,我们所有的对话都会在这里完成。与此同时呢,我们需要打开一个 check gpt 的 窗口,因为我们都是新手嘛,怎么用这个命令行都需要让 gpt 来告诉我们。 第一个问题,如何在命令行中安装 codex。 他 告诉我,首先确保安装了 node 点 gs, 我 这里已经安装了,如果没有,你可以让他告诉你怎么去安装,这里就略过了。第二步,复制他给我的安装命令,然后 ctrl 加 v 复制到命令行中, 命令行没有报错就说明安装完成了。在命令行中输入 codex, 如果能打开这个界面,就说明我们成功启动了 codex。 第一步,登录 codex 通常都会选择第一个,通过网页端完成登录,登录后回到命令行页面, 点击回车。继续我给大家讲一下最基础的配置。首先点击键盘上的这个斜杠,你可以看到 codex 的 一些基础配置项就出来了,比较重要的是模型选择和权限设置,模型我一般都会选择最新的思考时长,选择 extra high, 这样生成的质量最高。 第二个 permission, 我 选的是 full access, 所有的权限都交给 codex, 不 然它在执行任务中会一直让你去授权,很麻烦。当然这样也是有风险的,有比较小的概率它会删除你的文件,网上就有人遇到过,但是我目前还没有啊。 接下来我们就正式的来做这个电影评分网站,真的超级简单。首先我们创建一个文件夹,作为整个项目的根目录,然后我们要让 codex 进入我们这个项目,怎么操作呢?回到命令行,连续按两下 ctrl 加 c, 退出 codex, 然后复制我们这个项目的地址,打开 gpt, 问他如何让命令行进入这个地址,按照 gpt 的 指示进入后呢? 输入 codex, 这样就在电影打分的这个项目中打开 codex 了。每次重启 codex 后啊,都需要重新设置一下权限,改成 full access。 接着很关键的一步,执行一次启动命令斜杠 i n i t。 执行完毕后,它会在项目下生成一个 agent 点 m d 的 文件,这是 codex 的 一套默认行为规范手册,它会根据文件中的行为规范来完成你的具体任务。 后续你玩熟了,就可以按照自己的要求来修改这个文件了。现在呢,咱们暂时不管它,然后我们就可以来描述具体的需求了。我是这样写的, 由于豆瓣网站的电影评分已经严重失真,我打算做一个新的电影评分网站,基本实现电影的评分和评论功能。你需要完成整个项目的完整开发,并且部署上线。 你需要自动抓取豆瓣上正在上映的电影自动更新。这是一个完整的项目,你负责完整流程,最终交付给我。部署后的网址,你可以利用相关的部署 skill 来帮助你完成。如果没有这些 skill, 你 可以自己去网上搜下载下来用回车发送。 你看,他已经开始自己执行了。突然我想起来忘了跟他说一句话,按一下键盘左上角的暂停键,然后我跟他说,在交付前用肉眼检查一下,没有问题再交付给我, 这样他就会自己用浏览器打开看一下,确保没什么问题。接着他执行了大概二十分钟,最终你看他给我交付了上线的地址,后面简要说了一下他具体交付的内容,我们立刻把这个网址打开,看看效果咋样。 嗯,整体感觉还行,春节档的这几部电影也都在,不过很多图片没有加载出来,界面呢,也不怎么好看。这就是后续你需要不断地跟 codax 沟通来优化迭代的了,包括你后续想用自己的域名,也可以通过跟 codax 沟通来帮你实现。 好了,这期 codex 小 白教学就到这里了,其实还有很多使用的细节技巧,我没有涉及到,你都可以直接通过 codex 或者和 gpt 聊天快速掌握,赶快用起来吧!我是阿猪,关注我,让我们一起在 ai 潮头冲浪!

今天啊,咱们来聊个特别厉害的东西,它能彻底颠覆你的工作流, codex 技能准备好了吗?告别那些烦人的重复劳动,咱们要从一个普通的用户啊,变身成一个真正的创造者。好,我们马上开始。 来问个问题啊,你是不是也烦透了,每次就改那么一丁点代码,结果呢,就得走一遍完整的 staging commit, 还有 create, pull request, 这一套流程下来真的太磨人了。说真的,这种感觉我完全懂,但如果我告诉你,有办法能把所有这些步骤全都压缩成一个词,一个命令就搞定,怎么样?今天咱们就来揭秘这个超强的解决方案 行为了让大家都能跟上节奏不掉段,我把今天的内容拆成了五大块,你就把它当成一个心理进度条。好吧,咱们会从最简单的就是那种拿来就用的自动化开始,然后呢,一步一步往上走,到最后,我还会教你怎么打造那种能自己学习,自己变聪明的技能。好,那我们先来看第一部分。 好,第一部分,咱们先来点最酷最直接的那些你现在马上就能用的自动化技能,重点是什么都不用配,真的是开箱即用,来看看他们到底有多牛。 首先咱们来看 figma 技能,这个东西,我跟你说,绝对是前端开发者的福音。它最厉害的地方在哪呢?就是 ai, 它不是在看一张扁平的图片,它是在读你整个设计文件, 你想想,它能理解你设计里所有的底层逻辑,什么间距呀,字体样式呀,还有那些设计变量,它都懂。然后呢,它就能生成跟你设计稿几乎一模一样的高保真代码,这效率,简直了! 接下来的这个技能,嗯,我个人是超爱的,因为它用起来真的就一个字儿,爽!它叫 it, 你 想象一下这个场景啊,你刚改完代码,接下来呢,不用再敲那一长串烦人的 get 命令了,你只需要对着 ai 说一个词, it 就 这一下,它就自动帮你把赞存提交,创建 pr, 所有事儿全给办了,一个字儿就搞定所有,多酷! 当然了,刚才说的这些还只是冰山一角。这个技能浏览器里啊,简直就是个宝库。我跟你随便举几个例子,比如说你临时需要个图片素材,用 image 站 要处理 bug 和工单, linear 和 sentry 在 这儿等着你。想一键不熟你的应用, cloud blur 技能直接帮你搞定。甚至还有一个叫 adlas 的 技能,它能让 ai 直接看透你的浏览器,帮你做实时化调试,所以你看这里的可能性真的是无限的。 好了,听起来是不是很厉害?这么多强大的技能摆在面前,那下一个问题自然就是到底该怎么用呢?别担心,其实要把它们无缝地整合到你的日常工作里,方法特别简单,主要呢,就两种, 其实就两步,非常简单。第一步叫自然调用,意思就是你完全不用去记那些复杂的命令,你就跟平常和同事说话一样,用大白话告诉 ai 你 想干嘛就行。 codex 内部有个叫 m c p 的 东西,你可以把它想象成一个超级聪明的总机或者调度员,它会自动分析你的话,然后帮你找到最合适的技能去执行。 那第二步呢,就是当你玩的溜了之后,你就可以设置自动化了,让这些技能变成你七乘二十四小时线上的助理,在后台默默帮你清理警报啊,找 bug 啊,这样一来,你就能彻底解放双手,去专心做那些真正有创造性的工作了。 好,到目前为止,我们说的都是怎么用别人做好的技能,现在咱们来玩点更高级的,创建你自己的技能。要知道,很多时候,那些现成的工具总有那么点不合心意对吧?当他没法满足你团队那种特别具体,特别独特的需求时,就是你该升级的时候了。从一个技能的使用者变成一个创造者, 这种转变的价值有多大呢?我们来做个对比,你马上就明白了。你看左边,这是老办法,那些只有你懂的,每天都在重复的手动操作,不仅烦人,还特别容易出错。再看看右边,这是技能之道,你只需要一个自己定义的命令,一敲回车,整个流程就自动跑完了。 这中间的效率差距根本不用我多说了吧?那问题来了,具体要怎么创建呢?好消息是, codex 特别贴心,他给你准备了三条完全不同的路,你可以根据自己的需求,还有你的技术水平随便选。不管你是只想搞个简单的快捷命令,还是想做一个能处理复杂逻辑的智能体,放心,总有一条路是为你量身定做的。我们来看一下这三条路具体是什么。 第一种也是最简单的,就是用自然语言,这个真的可以说适合所有人,你要么就直接告诉 ai 你 想干什么,要么呢,你手动操作一遍,让它在旁边看着学,然后它就能帮你自动生成一个技能,很简单吗? 好。第二种是 c l i 命令,这种就适合创建一些快速的快捷方式,你只要在 codex 文件夹里创建一个 markdown 文件,把指令写进去搞定。 最后一种叫手动创建代理技能,这个是最强大的,专门用来处理那些复杂的逻辑。你需要创建一个技能文件文件在里面用烟某别怕,它就是一种很简单的配置文件来定义规则,你甚至还能加进自己的脚本,让它的功能无限扩张。 好,当你创建完自己的第一个技能之后,你可能会觉得这就完了吗?当然不,我们还能让它变得更聪明,甚至让它自己学会进化。接下来我就要分享几个专业级的技巧,让你的自动化技能拥有真正的学习能力。 这里的核心玩法其实就是给你的技能建立一个反馈循环。你想啊,这就像训练一个小跑一样。首先你得给他树立一些好榜样,让他知道一个漂亮的完美的输出应该长什么样。然后呢,最关键的一步来了,开启他的自我改进模式,你告诉他,以后每次做的好的结果都要自己存下来,当成新的学习范例。 你甚至可以要求他,哎,给我多想几个方案,然后你来挑选最好的那个,这么一来一回,你的技能就会在你手上越用越聪明,自己不断的迭代进化。 所以你看,咱们今天聊了这么多,其实所有东西都能总结成一个特别简单的自动化公式。这个核心的旅程是什么呢?就是第一步,找到你工作流理那个最让你头疼的痛点,第二步一步一步的把它打造成一个自动化的解决方案。 而且你要记住啊,这个思路可不仅仅是针对编程的,它是一个可以复制的框架,能用到你工作里遇到的任何挑战上。好了,听了这么多理论和方法,咱们都讲完了,现在球传给你了,我想听听你的想法,在你自己的工作流程里,你第一个最想最迫不及待想用一个自定义 codex 技能去解决的是哪个重复性的任务? 是什么让你最头疼?在下面留言告诉我吧,我真的非常期待看到大家都有哪些好玩的有创意的想法。

windows 的 windows 桌面端已经出来了,我深度体验了三天,接下来就跟大家录一个视频,说一下我在使用的过程中遇到的一些问题。首先这个页面就是我们下载的这个页面,直接点进去就可以下载,它是直接连接 微软的软件商店的,所以我下载的时候遇到的一个问题就是我的版本跟这个商店他不符合,因为我的电脑版本我是 win 十,我没有升级到 win 十一,所以说我在下载的时候他就说跟版本不符,我这个时候就准备了一个这样的升级,就是关闭系统防护的升级,还有一个是这里升级的一个文件,就做了一个升级就可以下载了。 下载之后我看到有朋友说下载之后有闪白的问题,所以我没有遇到闪白的问题, 下载了之后就进入到这个界面,其实因为我是代码的小白,我不知道这个界面之后应该怎么去按嘛,我看网上的教程大部分都直接是这个界面了,所以我当时还研究了半天这个地方直接添加项目就好了,添加项目它会让你选择一个文件夹, 我就建建了一个这样的文件夹,再添加项目,选中这个文件夹之后就能来到这样的一个界面。这样一个界面之后,主要我是看一下我们的左下角,它这个地方有一个剩余的额度好像,因为我 gpt 开的是 plus 版本,好像是可以额外再给两倍,反正这个剩余的额度,比如说百分之百,百分之七十六,这个是一周的,每天会给你多少小时,这个就是剩余的额度反,每天都非常的够用, 我看遇到最多的一个问题,包括我自己也遇到,你给他发了一个东西之后,他一直在思考,你看我这个,我三天之前发的,他一直在思考,我又开了一个新的任务,他仍然在思考,这个是怎么解决的呢?我换了一个节点,把 gpt 的 网页版,网页版打开,打开 gpt 的 网页版,打开了之后,换一个节点,我们可以在新建一个新县城,相当于是在这里去给它输入新的任务,最新的应该一一的,它就可以正常的去操作了。 好,下一个就是关于怎么能更好地使用它,其实我是一个代码的小白,我不知道该怎么去使用,有人说这个地方会有一些 skills, 我 没有额外的安装,我觉得基础的就够了。我这里其实主要是想说不要把它当成一个 ai 工具,就把它当成一个纯写代码的一个东西。那么其他的我建议要跟一些 ai 的 工具去做一些搭配着使用。比如说我最开始是搭配着 gpt 去使用的,就相当于用 gpt 给我的一些指令,我再导入到 codex 里面,让它去给我运行。 但是我深度测试了三两天,我发现 gpt 出来的东西仍然不能看,最后出来的这个效果不尽如人意。我在昨天下午我又深度的去换了一下,我换了一个 germanlab juma 之后,我用的 pro 的 模式,虽然我的 gpt 也是 plus 版本的,但是出来的效果不太好。我又用到了 pro 的 这个版本,就 juma pro 的 版本,给它输出我想要的东西, juma 会把它翻译成机器能读懂的这个代码语言,我再导入到这个 codex 里面,让它去给我运行,最后花了半天的时间,昨天满打满算应该是一天的时间,我最终把这个东西给研究出来了,当然 最后的结果是失败了,我开发的这个东西它是失败了,但是我建议大家如果要去使用它的软件搭配着用,就用其他 ai 工具搭配着用,不要直接在 codex 里面去提问。你看我之前就是遇到一部,我就问那个 codex 它该怎么弄,它就给我弄得很乱,因为我不知道怎么写,所以我就跟着它的步骤去, 但是他给我的步骤就又长,他会你问他一句,他说一句,他就不站在那种能完完全全解决这个事情的基础之上。但是 german 呢?给我的感觉就是他想他能够对准我们的这一个核心的目标去给你拆解,因为这是我整体使用 codex 的 一个感想,如果大家有其他的问题,也可以积极的去交流。

兄弟们, codex 性价比拉满了啊?这是我年前买的一个 codex tim 拼车,然后用了满满的一周饱饱的用,每天白天晚上都在用了,他提示我说现在还有百分之二十五的额度,也就是我用了一周他还剩百分之二十五。关键这是在某鱼上 tim 拼车只花了六块八,并且看啊, 还支持最新的 gpt 五点四模型,一个月六块八,还支持 gpt 五点四,并且还用不完啊,性价比拉满。

g p t 五点四还是不如 office 四点六? codex 它真的是量大管饱,我每次问他,他都说已经完成了百分之九十三到九十五了,但是最后这三个比拼多多还难砍。 codex 它本身并没有按照我最开始那长文规划的去给我产出内容, 从 readme 上可以看出来。而 office 呢,它明显对我的人话理解的更加精准,它知道我在说什么。而且经过我过去的经验呢,它的产出也非常符合你一开始的计划。 过去了一个星期的时间,我每天晚上回来的时候会不停的坐在 codex 前面点 ok ok, 让它继续继续。虽然目前为止我还没有真正的看到这个 app 的 样子,就从九十天上面就可以看得出它已经偏航了。

发了一个研究报告,是他们内部的一个小团队做了一个应用,在几周的时间交付了一百万行的代码,完全是用 codex 进行编辑的,完全没有使用人工的方式,这也是他们的一个强制的要求,它整体是搭建了这样的一个系统。 他也说了一下他的一些经验,最终达到的结果就是他们只需要一个提示,然后他们的这种智能体代码,智能体会直接去执行这种各种的一个预设的这种流程来进行完成和最终的发布。 他这个经验报告呢,如果说我们能搭出来这样的一件事情的话,肯定是去完成一个项目是绰绰有余的。而且他这个经验里面我个人觉得非常牛的是两件事情, 因为我们现在用这种 codex 或者说 cloud code, 我 们运行出来并不是说它性能好不好,准确度高不高,而是它跑出来的结果。我们人很大的成本现在来自于如何去做测试。 但是他们这个应用不是说这种桌面版的应用,更多的都就是一个网页前端的应用。他们用了这种 chrome 的 开发者模式,让很高的一个权限给到了 codex, 让 codex 去做检查解锁,达到了自己解锁这个内容,然后重现错误,并且修复,并且分析这些 ui dom 的 一些行为, 这是一个比较大的一个点。还有一个点我是认为非常有趣的,就是吞吐量改变了合并的观念,因为我们做一些修改的时候, 其实我们会非常的小心,特别是一些成熟的项目,你做一些修改,你必须要做非常多的验证,觉得完全没问题了之后,你才会把它合并到主项目的文件这个数中。 但是当 codex 大 模型来了之后,它的规范反而成了反作用,因为它做修复非常的快,所以说你只要能简单的测试它是好的,就直接合并,直接上线,如果有错误它马上就拉下来进行修改就完成了,就没有必要去做非常严谨的这种验证, 因为他的纠正错误的成本十分的低廉,而等待去测试的成本是非常的高昂的。所以说现在的一个策略是会有一定的进行转变的。 我们还是详细看一下这篇报告,他主要也分享了很多他们的一些经验。首先他们就说了一下,他们是人类掌舵智能体进行执行,他们有一个规定就是不允许手写一行代码,从开始 他们不编写任何代码,工程师是做这种框架和需求进行转化成 prom 的 一个工作, 然后是由 codex 进行编写,然后他们就发现了一个问题,他们的瓶颈就是如何审核这些 codex 出来的结果,然后他们解决的方案就是让他拿到更多的这种开发者权限,让他自己能去复现错误,然后修复错误,并且这些日制信息都会暴露给这个 codex。 就是他们的一个经验,是给 codex 提供一张地图,而不是一千页的使用手册。因为 codex 它的上下文就是特别稀缺的,所以说你不要给它过多的指导,因为全是重点,那么就是全部没有重点。 它跟 cloud code 它们的方式是一样的,就是你给它的这种文档是分成树状的结构的,它需要的时候它会到对应的文件夹里面去找去查,而不是你把所有都放在一个文件中。 然后就是智能体读取才是最大的目标,因为上下文是有限的,每一次执行的时候他都要去对应的上下文,所以说你的这些项目必须要让一个新的工程师马上拿到之后,他就知道他的上下文他要做什么,所以说他的文档必须要写的非常详细,而且要非常有结构性, 要对应的文档要放在对应的一个项目,对应的一个模块下面。然后就是其实他这个翻译有点问题啊,他这个意思就是你要保证输入输出就可以了,他具体怎么样实现就让智能体自己去实现,甚至尽量不要使用这种 新的一些库,最好就是让大模型他的训练,在最好就是使用大模型在网络上训练常见的一些库,或者常见的一些原则性、 原理性的代码,甚至让大模型他自己去实现,都比他直接使用某一些库,某一些现有的库会效果更好。因为现有的一些库他在他的训练中看到过的比例是非常少的,所以说他是不擅长的,甚至让他自己去实现他还更擅长一点。然后就是吞吐量,就刚才说的, 然后他也说了一下,他们生成的真正的含义是几乎所有的内容都是由智能体生成的, 他们没有做一行代码的更新,只做了这种优先级的排序,然后将用户的反馈转化成验收的标准,或者说一些新的功能工具,然后把这种 pr 提到代码库中,由 codex 自行进行编辑或者修复,最终达到了很高的一个自主水平, 如果能搭建出这么一套智能体编程的系统,那么就非常的牛了,但是他们没有开源他整个系统或者怎么样使用。然后最后他也说了一下,因为智能体他的自主进行写代码,他也会有非常多的问题,就是他的伤他会非常的混乱。可能这里这里的命名是这样,这里的命名是这样, 最开始他们是由人工去做一些修复或者清理这些遗留的问题,然后后面的话他们就使用每一天去做一下扫描,定期的进行这种技术债的消除。 然后他们说了一下他们的一些欠缺,其实就是设计环境、反馈回路和控制系统,他还是很大的原因就是怎么样去做审核,因为他这个都还是比较好判断结果的一些方式,因为他都是这种外部的应用,如果是一些这种桌面级的应用,他这个也不是那么合适。

好,大家好,我是小刘。呃,今天我们一起来快速学一下这个 codex, 最近两个月我一直在使用这个 i 编工具,然后用 codex 的 话用的是最多的,然后我心想为什么要用它啊?因为它用起来非常的顺手,冰非常的爽啊。比如说我们看今天我想要打开任何的 i 工具都可以无缝的去集成,那我用的最多的是这个 iq 啊,打开速度非常快。然后呢,我们在这边开发完之后,想看效果,直接打开任何的地方全部集成过来了 啊,比如说像我们要开发一个东西,对吧?那你要开发两倍速率,你可以看到这个地方有一个 fast, 你 点一下就代表当前的速度是两倍,那很很很有一个细节的点是什么呢?就是你看这是空心的,空心代表什么?标准的你点开来之后呢, 它就变成实心的,代表当前速度是两倍,你也可以选择关掉它。然后呢每一个模型都分为推你的低中高、超高,对吧?然后比如说像我现在开发一个简单功能,对吧?一个学生管理系统给大家演示一下,对吧?那这个时候效果是把它长这样子,这个样子像它的这个啊本地的工作数, 那这时候你可以点这个地方,可以给他派生出去一个新工作数,你可以点这个斜杠,点这个派生,相当于他会把当前的这个节点呢给他来复制一份,在那个复制这个节点上进行开发, 就会有一个数的图标运行在工作树当中,如果你输入 pwd 呢,这时候你会发现它创建一个 walking trees 的 这么一个啊分支,然后呢?相当于在这里开发,你开发觉得 ok 了,然后这时候你点击 提交到本地,它会,哎,相当于给你干嘛给你提交到本地,为什么这里没有提交?是说你本地有一个修改,对吧?你没提交它不允许你你你提交,所以它其实很多地方它整的挺规范的,对吧?你看我现在随便提交一下,你看这时候我要提交本地,你看就可以了嘛,是吧?提交本地, 然后呢?你所有的变更可以在这个地方看,然后你所有的终端,比如说我想从这个地方打开终端,点这个,你看它就就开启这个地方当前的终端, 它就有一个区别嘛。还有就是为什么我很喜欢用 q 代词,我一定要讲一下,就是安装 skill 特别方便,我给大家举个例子啊,比如说我现在安装 skill 这个 skill 呢?我安装下来我可能用了呃几,就是呃三十四秒,我给大家举个例子,就是它这个 skill 呢, 是我目前见过安装最方便的一个工具,没有之一。真的特别方便啊,比如说我现在安装十个 skills, 那 非常简单,我就只需要把这一堆 skills, 哎,我这我这么,我这么跟他说啊,就是你看啊,我安装这个,对不对?按这个我我直接,我直接这样子,哎, 我就这样子,截个图,对吧?截个图好,对吧?帮我安装 skills, 你 就跟他说,然后那帮我安装 skills 回收,然后他会干嘛呢?他就真的吭哧吭哧的全部给你安装,对吧?全部安装 你不用管,就这么简单,你看他会全部的给你一个一个的安装,就是很神奇,你看他就已经开始在读了,你你,你懂吗?他就已经在安装了,就就你看这是我就全部安装好了,你看这这都是我刚刚的那些 skills, 像这些什么 u i pro max, 你 看他会自动的去,哎,去查,然后去给你安装,我就不跳过了,就是就是, 不讲这个了。然后呢,就是第一个 skill 是 安装方便,第二个自动化也方便,比如说我想要定时定点的是创建一个什么样的任务,对不对?你创一个新任务你可以去,比如说帮我总结项目,总结项目 那这个时候它会告诉你,哎,每天你选择某一个文件夹,然后呢?哪一个工作树下面,哎,就几点执行,它自动去帮你执行这个任务,真的用起来特别舒服。还有一个点什么,就是它这个额度你很难用得完, 你即使在那个你你你用起来的时候真的怎么都用不完,然后就这个地方是它的指定,就类似于 curses 的 rose 嘛,对吧?就我一般喜欢用 andy 站六去开发,我觉得这个效果还挺不错的。 还有就是 m c p 服务器也是特别方便,你这边你可以选择添加自己的 m c p 服务器。还有这个环境,你看规章就是当前你它的规章不是给你删除,就类似于回收站那个地方放十五天,然后给你消消失,它是这样子给你删除的,然后呢?包括它的整个风格我都特别喜欢,真的,我是特别的爱这个靠 text 真的 越用越好用, 就是它的功能,你会发现啊,更像是一个聚合体,就是把那些好的特性全部给你进行过来,点这个状态,你看就当前,对吧?就跟是 play 模式对吧? play 模式 i shift 加 table 一 样的,对吧?你看你开发什么东西?开发学生, 呃,管理系统,这时候他会问你问题,就相当于问你你要开发什么样的管理系统,就是相当于,哎,作为一个问群, 嗯,问题,然后还有这个权限啊,就你一般来说不要开这个,除非你对自己的这个,呃,电脑上的文件没有任何的这种,嗯,很很高贵的东西,你就可以开, 对吧?然后你看他,他就会问你一些,弹出一个 question 就 让你去选,做选项,选项题,选择题一样的,噔噔噔噔,你选完,你选完之后,哎,就就就结束了,还有就是这个可以关联云端, 然后呢,你这边有一个剩余额度,你可以从这里看嘛,就是他这个额度,我简单说一下吧,就是五小时,啥意思?就是说你这五个小时里面你能用的数量,你这还有还剩多少?归零之后你就不能用了,但是你过完五小时他会给你刷新,就是给你刷到这个全新的这么一个情况。 嗯,当然了,如果一周的额度清零了,代表你所有的这个额度都清零了,你看啊,现在这个 question 就 出来了,你看它有三个 question, 你 可以选择一次性给他回答了,对吧?你点一下,比如说我要开发一个啊,学习管理,你要开发一个什么风格呢? rockaway 加 and 赞,对吧?啊?他就会去思考,根据你这个,根据你的模式去这个文,这个 贴图也特别有意思,你看我随便截个图,你看贴个图,哎,我回车你看放大是吧,就很用的,很很丝滑。我我觉得我真的是特别的喜欢这个 codex 啊。就是用过我现在用过的好多工具啊。我先先用过了,我用过 cursor。 我 用过这个 kylou 的, 还用过 codex 的 之前的终端版嘛,对吧?我用过的特别特别多,我自己都数不出来了,对吧? 还有真的还有很多很多这种主流我就不会一个一个列了啊,我主要列是常用的。那就那你发现没有,我还是觉得扣袋子是最好用的。扣袋子 app 就是 尤其它这个技能这一块,真的,你比如说我想要部署 cloud flair, 对 吧?你安装这个部署哎步就可以部署了。我想要去跟 gitlab 进行关联,对吧?我想要去和这个 losen 进行关联。点一下又可以玩了,是吧? 非常的 nice, 真的 用的很丝滑,当然它有一些不好的点。那不好的点我,我其实也能够列出很多条条框啊。第一个对吧?它没有自己的这个 id, 呃,第二个就是整个这边居然没有个搜索,真的你要搜索某一个记名称搜不出来,这就很很很蠢的一个设置啊。我觉得真的最好就是有一个搜索, 嗯,我觉得会好很多,然后,呃,就大概这些核心功能吧,简单说了一下,我觉得就已经包含了所有核心功能了。那分支也是一样,你就可以切换你自己合适的分支,和之前一样吗?艾特斜杠,然后你可以去看你当前的这个,当前的这个状态,嗯,当前这个额度, 还有就是当前的这个,你回答的一个个性,嗯,就是学你自己嘛,对吧?好,我觉得现在没有什么核心功能,一般看的懂中文的都都都能学的会吧?这个这个工具没有没有啥好讲的,但是我还是想跟大家分享一下。这个工具真的很好用,很好用,我强烈推荐大家试试。

哎呀,我真的服了,这个我跟靠了,我真的服了,你看,别看他刚更新了二零二六点三点七,好像是最新版本的,但是,但是什么呢?我要说但是,但是,你看今天一晚上这个 gpt 五点四,他一直都是四零幺四零幺四零幺,那我该怎么办呢?我只能看大佬们的在这边的 评论,你看他们有说有需要这样的错误,在三点七上有回滚,到三点二我都不会回滚啊,好不好?于是万般艰苦之下,我总算在给他找到了 他的这一串。你看,通过 code 访问五点四错误的 api, 然后他是这么说的,他只要把这一段粘贴进去,粘贴到那个 opencloud 点 json, 你 看它这是粘贴到 models 点 json, 我 们只要粘贴到 opencloud 点 json 就 可以了。像这样, gpt bank 的 api 这边用 codex response, 而不是用 ve response, 不 然的话就会提示说没有读写,你看,不包括 response 的 right, 所以 返回四零一。所以呢,我们只要把这下面改成 base 二 l 改成它, api 改成它,于是我们就会发现铛铛可以用了。

今天教你两个小技巧,让你的 codex 变得又快又聪明。首先我们打开 codex, 打开 codex 前呢,我们运行这条命令去更新,我们分为两块来说,一个是如何让 gpt 变得更加聪明,一个是让 gpt 如何变得更加快, 变得更加聪明呢?其实我就是我们在模型选择上,我们需要去适配自己的一个这个需求,并且我们要设置好一些模型的思考深度。 我们在选择模型上,其实我平时用的比较多的可能是 gpt 五点四啊,但 gpt 五点三 codex 在 部分场景下,它的性能其实会优于 gpt 五点四。那为什么这么说呢?因为 gpt 五点四它在更新中啊,我们上期视频有提到它的这个工具搜索的能力, 它是会去适配你的需求,然后去搜索想要调用的工具,这样就导致一个问题,就是它在一些场景下,其实我不想让它调用工具,它非要去调用工具,因为它为了 token 嘛, 它会调用一个工具去写一个 python, 写完 python 之后用这个 python 脚本去改代码啊,就是这样一套流程操作完之后呢,我觉得它的效率和精准度我觉得其实是不如 gpt 五点三 codex 的, 他直接改,他哪怕多费点 token, 但是大部分场景下其实五点四还是不错的啊,我这边就选择五点四了。 好,那进来之后呢?这边有思考深度,很多人就不知道这个应该怎么选了,他有低中高和超级高, 我个人在大部分情况下我都选择茶嗨,也就是超级高。思考的模式的话,大部分情况下就是匹配你自己的需求吗?如果你的这个问题呢,是比较大的,比较重的一个任务。 我举个例子,你从零开始构建一个非常大的项目,或者说你把别人项目,你想要完全的重构,那这样一个比较大的工程的话,那必须要去选择超级高啊, 但他花的时间会非常长,但是他的模型的智商啊,也是会非常的在线,基本上一遍或者两遍就能改好 啊。那还有一种情况下选择超级高是什么呢?就是比如说你布置了一个任务之后,不管这任务大小哈,你布置了一个任务之后,你就不不管他了,我可能去吃饭,我跟你出门了,那就选择超级高,因为你就让他慢慢做,就就不差这个时间。 实际上他这四种模式呢,其实关键的差距就在于时间。当然 token 也有差距,平时你比如说一些小的改动,改动就涉及几行代码,或者说就涉及一个文件的时候,那你就选择中的啊,这个第一是不建议去选了,我们这选择超级高 这个智商讲完呢,就是速度,那速度其实有很多方面,第一个是这个 fast 模式,我们一定要开启,它可以提升你这个模型 token 的 输出速度 啊,但他会两倍计费啊。我这边是已经开启,再再点一下,就是这边要 on the mode set to on 啊,这就是开启了,如果是 set to off, 那 就是关闭,因为你可能之前已经开启过了。然后还有一个就是这个权限的问题, 如果你不知重的任务,我建议也是给他完全权限,那为什么这么说呢?就是他有可能中断了, 那我可能一个小时,两个小时,那我都得盯着,对吧?其实大部分情况下做不到的,那我就选择完全开启,在完全开启的情况下呢,他是可以直接不经过你的授权修改删除任何的文件。 所以我们在开启这个模式之后呢,我们一定要去做好备份啊,或者是用 get 去做好这个仓库的管理啊,不然的话有可能你的代码会完全丢失啊。你如果仓库管理做好,他误伤了你什么文件,你直接回退一个版本就好了。其实我自己用是开启,但是大家要注意一下,就是 如果是一些老版本你们不愿意更新的话,那就在这个选项里面,它是一个实验性的功能,它有一个叫 marty agent, 也就是呃窝代理的这个功能。新版我刚刚看了,已经是默认开启了 这个功能。之前你在斜杠输入命令 m u 的 话,如果他有的话,他会直接在这里跳出来,就是有一些老版本他是在这边,有一些是在那个呃实验性功能,这这个设置里面都有可能。那个东西他是干嘛用的呢? 就比如说你读取文件啊,我现在有三个文件,对不对?我现在要让他读取这个项目,理解这个项目,那如果你开启 martingale 的 话,他会同时去, 就是多县城的去读取,三个并行去读取,那他的速度就会快非常多。最后读取完之后呢,再统一导入到主代理上,让主代理去理解。所以说你有非常多文件,像像这个文件夹,它有非常多文件,比如说十个文件, 但之前的老版本他需要一个一个去读取,我比如说读完这个去读这个,读完这个去读这个就是太慢了。 那现在的这个 martingale 呢?这个模式是非常非常重要的,所以说大家一定要开启这个对于你的速度的优化是有一个 质的飞跃啊。但整体以 codex 目前的这个使用技巧也就这些,过去如果 codex 有 一些新的更新,我也会同步给大家。好,那本期视频到此结束,我是程序员秃头哥,学 ai, 关注我不迷路。

大家好,今天跟大家分享一下我这几天使用 windows codex 桌面端的一些体验和感受。我先把结论放在这里,我觉得这是一个非常有趣的应用,如果你正在使用 ai 进行 web coding 的 话,我强烈推荐你去试一试, 我觉得它弥补了 web coding 生态里面一个非常有趣的空白点。虽然这个事情见仁见智,但是我会推荐你去尝试一下,因为说不定你会发现它很对你的胃口,或者你会跟我有一个类似的一些感受和想法。 呃,首先呢,怎么得到这个 codex windows 桌面端呢?其实在三月四号的时候,也就是前天,呃, open i 已经给出了 codex windows 版的正式版,不过要注意的是,你必须在微软商店里面下载这个软件,你不能在这个浏览器里面去下 载,所以对于国内的用户来说,这个微软商店的连接可能会构成一个问题,这个需要具体去解决一下, 那么在下载完之后就来到这样一个界面了。呃,首先我要说的是,我不会介绍太多技术面的东西,比方说 gittree, 比方说这个 mcp skills, 自动化,这些东西我不会展开去讲,我主要是谈一谈我对它的一些定位和理解。 那么我当时在第一时间下载完这个东西,打开之后我是懵的,因为我在问我的 coding 界面哪去了?我的代码在哪? 我一开始以为这个东西是一个跟 antigravity 类似的东西,就是 antigravity, 其实就是一个,呃,把谷歌自家的 ai 嵌进了 ide 里面的这个这样一个东西,它的这个整个对环境的控制能力,对这个工具的调用能力,确实比 用 vs code 的, 然后用别家的呃,这个插件会更强一点,但是本质上它还是一个 ide, 所以 在下载这个 codex 之前,我会以为它也是一个 ide, 当时就是抱着一个尝试的心态去的,结果打开之后就发现完全没有 ide 的 影子,完全没有代码的影子。 我就去读了一下 openai 的 官方文档,又去看了一下很多博主已经公开的在 mac 上面的一些评测视频,我在仔细研究了一下之后,就发现这个东西其实是一个 ai 项目管理器, 就是在这个东西的左侧,你会看到有一个你的项目列表,你在这个地方是可以添加非常多项目的,你只需要把你对应的这个项目的文件夹给到他就可以了啊,我随便添加一个都可以啊。然后呢,你可以在这个里面去进行一个跟 ai 的 沟通, 随后如果你想看代码怎么办?在这个右上角,你可以用很多种不同的方式去看代码,比如说使用 cs code, 你就可以打开这个代码。那么这个时候有的人就要问了啊,我当时也有这个疑问,那 open ai 做这个东西是干嘛呢?对吧?它既然我在 vs code 里面,你可以看到我是有 codex 的 插件的,我可以在这里面直接沟通。我为什么需要一个单独的软件来直接跟 ai 沟通,而且还看不到代码呢?啊? 我稍微用了使用了两天,把我的一两个项目放进了这个里面跑了跑,我就发现这个是一个非常聪明的而且有趣的设计,就是在没有 ai web coding 这个概念之前, 我们是没有必要做一个项目管理器的,因为你只需要把你所有的项目放在一个文件夹里面,然后你开很多 vs code 的 窗口去写代码就可以了。就是写代码的重点永远在 coding 上,而不是在对这么多项目的管理上。你只要把它放到文件夹里就可以了 啊。对每一个单独的项目,你单独使用 get 就 可以了,对吧?不需要别的工具。但是现在情况不一样,现在很多时候我们写代码 可能一个小时的拷定时间里面有四十分钟都是 ai 在 思考, ai 在 写代码。如果说 我还需要面对着一个传统的 ide, 需要花大量的精力和这种注意力在代码这个事上,然后我的 ai 的 插件挤在旁边,会觉得有一点点的主次失调。即使在 vs code 里面,你是可以通过调整这个布局,把这个代码缩的小一点,然后把这个插件放到一个更主体的位置上。但是你如果想进行多个项目的话,你终究是需要开很多个窗口的。 在以前你想同时写多个项目的代码,这是一件几乎不可能的事情,因为你所有的注意力都要放在代码上。你不可能说我先写一会这个代码,点击运行,然后又去思考另一个代码,这个人脑是很难接受这样的 呃强度的劳动的,但是 ai 可以。 所以现在对于这样一个管理器来说,你只需要在左边把你所有的项目放进来,每一个项目可以同时调用 codex, 同时并发地去进行操作。你就有点像什么。我打一个比方啊,你是一个很厉害的产品经理, 你手底下同时管着四五个项目,然后你这个时候开了一个微信聊天窗口,这里面有五个人都在跟你聊天,你只需要跟他们不断地提需求,提反馈就可以了,你不需要去一直盯着每个人代码, 当然了,我们有的时候仍然是要 review 代码的,仍然是要去做一些手动的调整的,那这个时候你再调映,调出相应的这个 vs code 或者是别的什么工具的界面再去做,那就可以了。 那么我本来呢是有一块负屏的,我为了方便演示就没有打开它,你如果有一块负屏的话,你就把 vs code 的 界面,把别的 ide 的 界面放到负屏上,你的主屏幕永远就是这样一个项目管理器。 我们来具体看一下,在 codex 这个桌面端的应用里面到底保留了什么,到底有什么,我们才能更好的理解。呃,它的定位就首先第一你会看到 ok, 它有一个项目列表,然后在每一个项目下面是你跟它进行多轮的这种对话。好, 然后呢,在这里你可以使用这个别的 id 去查看代码,然后在这里它有一个 get 的 操作,就是如果你这个项目还没有 get, 你 可以在这里,呃,如果没有 get, 比如说我们换一个,你会在这里有一个创建 get 存储库,然后在这儿就会出现一个 get 相关的东西,就是 vs code 上面的 get 的 插件已经够简单了,但是甚至还是没有它简单。然后呢,包括这个 get 界面,你会发现这个界面现在变成了项目 跟 ai 的 沟通以及 get, 它完完全全地去掉了所有,比如说断点、 debug, 呃环境的这些东西,什么这些东西很多都都没有了,我们只保留了作为一个项目本身最需要的东西。当然还有一个东西是终端,因为你需要终端去对写好的代码进行一个运行调试或者是之类的, 就是它完完全全是以一个项目的视角去看一个代码工作,代码本身是交给 ai 去处理的,我们只需要进行项目管理、版本管理,跟 ai 的 沟通, 我们现在再打开它这个设置界面来看一下,就更理解这个事儿,你会发现它包括怎么打开这个代码文件,然后你的环境是什么?然后关于这个在跟 codex 沟通的过程里面呃它的一些基本的行为, 然后呢你可以呃改变它的语气, m c p, 然后 get, 然后还有就是这个环境我觉得是非常有趣的, 就是在之前在本地运行的时候, ai 都会遇到一个问题,就是对环境的处理是比较差的,然后在这个地方他显示的把环境这个问题给你解决了,就是你可以告诉他该怎么样来访问你正在运行这个项目的环境啊?这个我觉得是超级有用的一个东西,所以就是总体来讲,你 回到这样一个项目的界面,你就会发现非常的干净,非常的清爽。如果说 ai 如果他真的可以完成大部分代码构建,我现在目前对 codex 五点三 extra high 的 这个体验的话,呃可能最多十次, 呃沟通你需要亲自看一次代码,大部分时候我可能二三十次沟通都不需要看,他就可以给到我一个非常好非常好的结果啊,所以我觉得他真的是非常非常有趣的。 我其实也不认为这是一个非常必要的东西,但是当你真的在多个项目并行开发的时候使用这个东西,你会感觉到你变得更加的轻松,你变得更加的专注,而且你的 呃就是你整个工作的流程会让你感觉非常的流畅而舒适,我个人是这样感觉的。 当然了,这个事情完全是见仁见智的,有的人会认为对于高手来说是根本不需要这种 g u i 图形界面的高手都用命令行啊。也有人会认为对小白来说他又太过于复杂了,毕竟你还是得知道终端,还是得知道 get 等等这些东西。但是我觉得 起码对于我这样的用户来讲,我很乐意使用图形界面,我也非常乐意使用 ai 进行多步的开发,所以我觉得 它是有一定的可取之处的。它填补了一个从人的需求到 web coding, coding 本身的空白,就是从人到 coding 中间还有一个 web, 这个 web coding 的 这个 web 的 这个部分其实之前没有被单独拎出来去讨论成一个单独的软件或者工具,但是现在 codex 其实就是这个定位,它填补了中间这个链条上的这个空白 啊。不管你认为他是不是有用的呃,我都推荐你还没有尝试的人去尝试一下,我呢,也不敢说他一定就是正确的。这个生态链上的答案可能过几个月,过半年、一年之后我们才能看到市场对他真正的一些反应。不过目前来说,我觉得他是一个非常值得尝试的工具, 所以如果说,呃,你看到我的这个视频,然后还没有下载他的话,我非常推荐你去尝试一下。

hello, 大家好,我是 d p。 在 一天前,也就是三月十八日, openair 发布了 gpt 五点四 mini 和 nano 两款小模型。伴随着这次发布, codex 的 免费账号恢复了对高级模型 gpt 五点四和五点三 codex 的 使用权限。这也是时隔八天, openair 再次恢复了免费账号对高级模型的使用权限。录一个视频跟大家分享一下相关情况。 首先我进行了一些本地测试,以下的测试结果仅限我本地测试呃,给大家做一个简单的分享。 首先我进行了第一组测试,是在 vs code 的 插件里使用的是,呃,大家可以看一下这张图,上面分别标出了一二三,一号位代表我用的是五点四模型, 思考强度是中等。二号位,我问他的问题是非常简单的一个问题, which model are you? 你 是什么模型?三号位,他给出了一个中规中矩简单的回答。然后我 提供了一下这次请求的数据情况,分别访问了两个模型, gpt 五点四和 gpt 五点一 codex mini。 然后一号位是模型,二号位是输入 talk, 三号位是输出 talk, 四号位是总 talk。 所以 我们进行了一个简单的统计, 模型是 gpt 五点四中等思考强度十五点二 k 的 总 top 用量,然后占了免费账号的周额度的百分之四。 好的,紧接着我又做了第二组测试,因为我的机器上还有那个 codex app, 然后分别是一二三四五,我都在图上标出来了一号位代表我用的是五点三 codex, 呃,高,高级思考。 然后二号位我问的问题是一样的,然后三号位是回答,呃,四号位是上下文的一个长度,然后五号位是我当时使用的 codex 的 版本,也就是当时的最新版, 然后同样的这边也提供呃,这次请求的一个详情情况,分别是一二三四,一号位输入。啊,说错了,二号位输入,三号位输出,然后四号位总 top 数, 然后进了,进行了一个简单的总结,分别是模型 gpd, 五点三 codex 思考强度是高等,就是 high, 然后总套根数是二十一 k, 然后它用的周额度比例是百分之六。 好的,这就是我的测试的详细情况,下面我们来做一个额度的计算。首先第一点需要确认的是,免费账号在 codex 里只有周额度, 然后本次测试我们用了十五点二 k 和二十一 k, 总总的 talk 是 三十六点二 k, 然后占周额度的百分之十,那么可以推算出周额度在零点三六 m, 然后同时我们拉入 tim 账号来做对比, tim 账号分别有五小时额度和周额度。 在我之前的测试中, team 账号的五小时额度大概是这么一个关系,六点八 m 的 talk 对 应百分之二十七的五小时额度,那么 可以测算出五小时的额度大概是二十五到三十 m。 这里有一个范围是因为我发现后面它的那个 talk 是 浮动的, 因为它的额度比较大,所以我们这次测试中取呃,三十 m, 然后五小时额度大概是周额度的三分之一,也就是一周可以用三次五小时, 那么经过简短的换算,九十个免费账号才能等于 一周的一次的五小时额度,因为免费账号只有周额度,对吧?然后再计算,如果想要和 team 账号的周额度打平,需要两百七十个免费账号。好,这就是我计算的一个结果,下面我们来做一些思考和总结。 首先,无论如何,这是一个好消息,因为它是免费的,并且这对初次接触 codex 想要尝试的用户来说是非常友好的一件事情。 但正是因为如此,我想说它也只能做测试用途,因为一周零点三 m 的 额度其实干不了什么事。大家回想一下我刚刚的两个问题,两次问了简单的问题,它就用了百分之十,也就是相同的问题,我可以用问 二十次,然后这个额度就结束了,所以它只能做非常少的事情。然后这边我还想提醒大家的是,当前是在两倍额度的优惠期间,我不确定这个免费账号这次恢复的额度是否能吃到两倍额度的这个红利。 不确定,但是有可能它没有,没有两倍额度的一个福利在里面。然后下面是我的一些思考。首先对于这种逆节奏周期的这种开放,我不太能理解,为什么说呢?因为,呃,像 google, 呃,吉米纳、 c l i 和 antigravity 都进行了额度的收紧,包括 co pilot。 我 们之前也报道过,对学生订阅的额度也进行了收紧,所以整个趋势来看,额度是收紧的。但是 open a r 居然反节奏而行,我没太看得懂。然后紧接着我在思考一个问题,这种 高级权限对免费账号的违规是临时的还是持久的?然后在网上有一种呃说法,就大家的讨论说,因为发布了五点四, mini 和 nano, 由于这次 bug 导致了这个高级模型的临时回归,但我觉得好像也不太像,为什么呢?因为它的模,它的模型的额度少的可怜,所以我觉得不太像是一个 bug 性的回归,反而像是一种象征性的回归。 然后还有一种说法说会把五点四呃路由到五点四 mini 上进行一些降置的操作,我觉得也不太可能。为什么呢?因为他给的额度真的太少了,这么点额度再转到小模型上去有点没意义。 好的,以上只是我的一些思考,欢迎大家留言参与讨论。另外在最后也推荐大家 尝试测试 codex, 首选的模型是 gpt 五点四,如果觉得额度不太够用,可以考虑用五点三 codex 这个模型。 另外,关于呃发布的小模型五点四 mini, 在 小模型领域它是值得一试的一个模型。好的,这就是这一期 openai 恢复 codex 免费账号使用高级的 gpt 五点三 codex 模型视频的全部内容。 如果这期视频对你有帮助,请帮忙点赞和转发。如果你有相同的经验,想要分享或者遇到相关问题,欢迎留言。我们最近开放了呃 ar 相关的讨论组,如果有兴趣欢迎私信我。好,就这样,我是 d p, 谢谢!

hello, 大家好,我是 d p, 今天是二零二六年的三月十日, open a r 在 几个小时前对 codex 中免费账号的使用模型进行了限制,简单地说,取消了五点三 codex 和五点四两模型。录一个视频跟大家分享一下相关情况。 首先我们来看这次 oppo ar 的 限制的具体情况,我们能在使用中得到的错误信息就是图上这一条,比如说这次是 gpt 五点三 codex 这个模型不再支持在呃这个账号在 codex 里使用。 然后这次限制的主要情况是针对免费账号取消了 gpt 五点三 codex 和 gpt 五点四两个模型的使用权限。当然这也是我们 用的最多的两个模型,保留的权限是 gpt 五点二和 gpt 五点二 codex, 然后付费账号不受影响。这时候我就需要拿出 五点二和五点四的对比图,五点二里如果使用 codex 的 话,应该用的是 gpt 五点二 codex 这个模型,那么从对比上来发现编程能力还好,唯一的差别我想呢,就是可能五点二会慢一些, 毕竟五点四本身就已经加速,还有 fast 模式。然后目前这样看,好像 免费账号也没被限制到完全不能用。但是我想问大家一个问题是,免费账号的限制真的就到此为止吗?给大家三秒钟思考一下。一二三,好,我相信大家心里已经有答案了。 据这个问题我有一些思考。首先是一个五万个账号的故事,这是一个粉丝告诉我的,大概的意思就是说他们有一个群,群里面每个人都有几千到几万个账号不等,都是免费账号,大家都用的很嗨。 呃,后来我去了解了一下,确实有相关的技术实现或者什么,然后,但是我本意不愿意相信这是真的,因为这这个数字实在是太疯狂了,所以我就说这是一个故事。 基于这个故事,我当时就在想,这个免费账号被限制是早晚的事,但没想到来的这么早。 然后后,后来我又联想到了被限制的 antigravity pro 订阅的配额,然后我又联想到了这次的 codex 的 免费账号的限制,然后我心里就在想,下一个被限制的会是什么? 所以我想跟大家,我就是我们大家应该能有一个共识,就是一定会有下一个,对吗? 好,那么接下来的问题就是我们该怎么办?因为我们是一群一定要使用 ar 的 人,我们不可能说因为你限制了我们就不太用,我们有些人会就是去找下一个,但我们留下来的人怎么办?我们需要稳定使用的人怎么办? 这边我提供一下我的一些想法,算是抛砖引玉吧,这是我未来的一个计划。首先我有一个付费的 codex 账号,然后我会用它来完成百分之六十的编码工作。 呃,这边多提一句啊,就是 codex 其实已经很快了,可以可以适应到一个正常的工作流程,但是里面需要一些技巧,这个我们稍后说。 然后我还有 antigravity 的 pro 账号,我会用它负担我百分之四十左右的工作。这百分之四十是这样分配的,首先 u r 设计相关的工作大概占百分之三十,会有基利纳三 pro high 这个模型来完成, 然后剩下的百分之十会交给 opus 四点六,差不多是这么一个比例。这边再提醒一句,就是 codex 在 我的测试中已经足够优秀了,它没有那么的慢 呃可以负担我的百分之六十的使用场景,我相信对大多数人来说也是 ok 的, 所以如果没有尝试 codex 可以 开始尝试一下。但是如果你的 codex 在 使用中会有点慢或者什么,那就代表可能你设置的有问题,或者说可能你选择的方案 技术路线有问题。这个我们再说,反正是有一点技巧在里面的。然后稍后我们会推出 codex 的 一些相关视频,目前我还在准备中,也感谢之前跟我联系的几位呃 codex 大 佬提供的一些技术支持,非常谢谢,也欢迎有经验的 codex 用户继续呃发私信跟我联系,提供相关的技术支持,我们一起来完善这件事。 好的,这就是这一期 open a r 对 呃 context 中免费账号可用模型进行限制视频的全部内容,希望这期视频对大家有帮助, 如果可以,请帮忙点赞和转发,如果有相同的经验想分享或者遇到相关问题,欢迎留言,我是 d p, 祝我们大家一切顺利,谢谢!

我在 windows 系统底下用 color code 和 code x 这个命令行板特别不方便,自己写了一个窗口模式,桌面版可以 color code 又可以 code x, 比较方便。那这个有几种问题啊?就是这个命令行板输入时光标定位特别慢, 他这边用用方向键定位就特别的不就骂,如果很长的话题是词就特别麻烦。这个就是复制那些截图很麻烦,因为有时候我像截图内行版,这个截图就复制就特别累。那我这边的截图就比较轻松啊,接,我喜欢这个截图,截一个 直接在这里,窗口里就直接粘贴就可以复制了,这样比较方便一点。另外呢,窗口监控啊,不知道哪窗口已经完成,因为有时候我会开特别多窗口吗?我能开七八个这种窗口,那这种窗口就不知道哪个完成了,就要点,特别麻烦。 那我这个写了以后就完成了,就是一个红点啊,直接这个红点点进去就取消了,因为他完成了吗? ok。 还有个就是历史记录多查找不方便,有时候我会关掉那历史记录,他特别多,有时候就找头大。那这个地方 历史记录点开以后就往下就比较方便了。这个是扣格勒扣的,这个是扣 x, 历史记录拉下来啊,就搜索比较方便。做了一个自动化运行的工具,剪一下这个地方,先给他一个计划,让他写一个计划,例如罗列了以后就直接点这个自动点一下, 很简单啊,就是会自动的给他弹出一行字,然后执行计划,下一步一个很简单的小程序,他自动就运行了。你可以设置他的这个步数,调那个小脚本 切换的话,用这个 cc, cc 切换,然后我这个已经开源了,代码已经开源了,就是这个分享一下啊?