我这两天看我们那个后台啊,很多朋友在问那个关于 qq 的 一些问题啊,呃,首先是怎么订阅的问题,因为第一个呢,我是有一张香港的信用卡,呃, 但是呢,这张香港信用卡他是没有办法直接在 oppo ar 的 官网里面去绑定那个付款方式的,因为香港的卡也不支持。 那我是取现救国的方式啊,我是用香港的信用卡,因为我有一区,有一个美区的苹果 id, 然后我是在苹果官网里面去订购一个两百美金的充值卡,然后通过充值卡的形式,然后充到我的那个 apple store 里面,然后再通过 apple store 去订阅 open a r, 然后其中有一个要注意的点啊,如果说你是第一次使用啊,你需要订阅的费用应该是两百 二十美金,因为 open a r 有 一个比较恶心的点呢,就是它没有办法去升级,就是扣你的那个差价,呃,它是要一步一步的,然后打什么要一步一步呢?就原先它是没有 pro, 直接让你选 pro 的 这个选项,你必须先购买了 plus 啊,然后才能申申请那个,呃,才能升级为 pro, 那 你的 plus 会员已经花了二十美金,对不对?那它是不退的,所以说你必须第一次订阅的话,你就必须是要花二十美金,再加两百美金,等于 二百二十美金啊。然后你等你到下一个月订阅的时候,那这个费用它是呃就直接相当于你的下次的升级的话,那就正常去扣两百美金就可以了。
粉丝48获赞284

是不是我用错了,一百万 token 做不了一个小项目,我买的十五美金的额度,半小时就用完了。呃,我知道了,看来大家对一百万 token 的 概念还是有点模糊啊,我来帮大家梳理一下。一 token 呢,大概是一个中文汉字,或者是四分之三个单词, 一行代码呢?我们按照十个单词来算,大概就是十到三十个 token, 那 一个文件我们按照五百行代码来算,大概是五千到一万五的 token。 现在我们的前端项目都用了 ts, 那 些类型声明其实都是通过杀手, 实际的通过量可能更多。假如我们在操作的是一个中型项目,大概是一百个文件,那就是五十万到一百。五十万的 token。 中型项目 ai 还是能够理解的,如果说是一个大型项目,你想让 ai 理解都理解不了, 上下文就爆了。所以对于 ai 来说,去理解一个中型的项目,一百万 token 啊,其实也就是几分钟的事啊。现在顶级模型的价格,每百万 token 海枯石一刀,骚奈特是三刀,呃,奥普斯是五刀。所以你用 ai 写代码的话,几分钟就有可能会花你个十几或几十块钱。 怎么办呢?也简单吧,就是你一定要用艾特符号,用井号去控制好上下文,遵循上下文最小化原则,也能让 ai 输出的结果更准确。所以平时我们在用 ai 编程的时候,一定要有一个 token 的 消耗意识, token 就是 钱,省 token 就是 省钱。

hello, 大家好,我是 d p。 在 一天前,也就是三月十八日, openair 发布了 gpt 五点四 mini 和 nano 两款小模型。伴随着这次发布, codex 的 免费账号恢复了对高级模型 gpt 五点四和五点三 codex 的 使用权限。这也是时隔八天, openair 再次恢复了免费账号对高级模型的使用权限。录一个视频跟大家分享一下相关情况。 首先我进行了一些本地测试,以下的测试结果仅限我本地测试呃,给大家做一个简单的分享。 首先我进行了第一组测试,是在 vs code 的 插件里使用的是,呃,大家可以看一下这张图,上面分别标出了一二三,一号位代表我用的是五点四模型, 思考强度是中等。二号位,我问他的问题是非常简单的一个问题, which model are you? 你 是什么模型?三号位,他给出了一个中规中矩简单的回答。然后我 提供了一下这次请求的数据情况,分别访问了两个模型, gpt 五点四和 gpt 五点一 codex mini。 然后一号位是模型,二号位是输入 talk, 三号位是输出 talk, 四号位是总 talk。 所以 我们进行了一个简单的统计, 模型是 gpt 五点四中等思考强度十五点二 k 的 总 top 用量,然后占了免费账号的周额度的百分之四。 好的,紧接着我又做了第二组测试,因为我的机器上还有那个 codex app, 然后分别是一二三四五,我都在图上标出来了一号位代表我用的是五点三 codex, 呃,高,高级思考。 然后二号位我问的问题是一样的,然后三号位是回答,呃,四号位是上下文的一个长度,然后五号位是我当时使用的 codex 的 版本,也就是当时的最新版, 然后同样的这边也提供呃,这次请求的一个详情情况,分别是一二三四,一号位输入。啊,说错了,二号位输入,三号位输出,然后四号位总 top 数, 然后进了,进行了一个简单的总结,分别是模型 gpd, 五点三 codex 思考强度是高等,就是 high, 然后总套根数是二十一 k, 然后它用的周额度比例是百分之六。 好的,这就是我的测试的详细情况,下面我们来做一个额度的计算。首先第一点需要确认的是,免费账号在 codex 里只有周额度, 然后本次测试我们用了十五点二 k 和二十一 k, 总总的 talk 是 三十六点二 k, 然后占周额度的百分之十,那么可以推算出周额度在零点三六 m, 然后同时我们拉入 tim 账号来做对比, tim 账号分别有五小时额度和周额度。 在我之前的测试中, team 账号的五小时额度大概是这么一个关系,六点八 m 的 talk 对 应百分之二十七的五小时额度,那么 可以测算出五小时的额度大概是二十五到三十 m。 这里有一个范围是因为我发现后面它的那个 talk 是 浮动的, 因为它的额度比较大,所以我们这次测试中取呃,三十 m, 然后五小时额度大概是周额度的三分之一,也就是一周可以用三次五小时, 那么经过简短的换算,九十个免费账号才能等于 一周的一次的五小时额度,因为免费账号只有周额度,对吧?然后再计算,如果想要和 team 账号的周额度打平,需要两百七十个免费账号。好,这就是我计算的一个结果,下面我们来做一些思考和总结。 首先,无论如何,这是一个好消息,因为它是免费的,并且这对初次接触 codex 想要尝试的用户来说是非常友好的一件事情。 但正是因为如此,我想说它也只能做测试用途,因为一周零点三 m 的 额度其实干不了什么事。大家回想一下我刚刚的两个问题,两次问了简单的问题,它就用了百分之十,也就是相同的问题,我可以用问 二十次,然后这个额度就结束了,所以它只能做非常少的事情。然后这边我还想提醒大家的是,当前是在两倍额度的优惠期间,我不确定这个免费账号这次恢复的额度是否能吃到两倍额度的这个红利。 不确定,但是有可能它没有,没有两倍额度的一个福利在里面。然后下面是我的一些思考。首先对于这种逆节奏周期的这种开放,我不太能理解,为什么说呢?因为,呃,像 google, 呃,吉米纳、 c l i 和 antigravity 都进行了额度的收紧,包括 co pilot。 我 们之前也报道过,对学生订阅的额度也进行了收紧,所以整个趋势来看,额度是收紧的。但是 open a r 居然反节奏而行,我没太看得懂。然后紧接着我在思考一个问题,这种 高级权限对免费账号的违规是临时的还是持久的?然后在网上有一种呃说法,就大家的讨论说,因为发布了五点四, mini 和 nano, 由于这次 bug 导致了这个高级模型的临时回归,但我觉得好像也不太像,为什么呢?因为它的模,它的模型的额度少的可怜,所以我觉得不太像是一个 bug 性的回归,反而像是一种象征性的回归。 然后还有一种说法说会把五点四呃路由到五点四 mini 上进行一些降置的操作,我觉得也不太可能。为什么呢?因为他给的额度真的太少了,这么点额度再转到小模型上去有点没意义。 好的,以上只是我的一些思考,欢迎大家留言参与讨论。另外在最后也推荐大家 尝试测试 codex, 首选的模型是 gpt 五点四,如果觉得额度不太够用,可以考虑用五点三 codex 这个模型。 另外,关于呃发布的小模型五点四 mini, 在 小模型领域它是值得一试的一个模型。好的,这就是这一期 openai 恢复 codex 免费账号使用高级的 gpt 五点三 codex 模型视频的全部内容。 如果这期视频对你有帮助,请帮忙点赞和转发。如果你有相同的经验,想要分享或者遇到相关问题,欢迎留言。我们最近开放了呃 ar 相关的讨论组,如果有兴趣欢迎私信我。好,就这样,我是 d p, 谢谢!

codexbar 这是 opencap 作者彼得斯坦伯格的又一开源神器,可以实时追踪投肯额度。目前在 github 上有七点七 k 收藏。它挂在 mac os 菜单栏中,可以让我们随时随地看到 vi 工具的投肯用量和重置时间, 再也不用输入命令或者去后台查看了。目前它支持多工具监测,例如库戴克斯克洛的 code 等,基本上在用的主流 ai 抠点工具,它都支持添加监控。

发现 codex 还是比任何的工具都好用啊, 你看我现在做量化的一个软件,也不算量化吧,就是寻找最优的一套策略去炒美股,然后我我想要的就是胜率大概百分之七八十左右, 然后我之前是让叉的 g g p d 去出一些策略嘛,然后再不断的去测试。我后面突然想起我不需要这样做,我用 codex 让他帮我先把所有的美股核心的一千多家美股的数据,全部全部五年的数据全部下载下来,然后就让他开发工具, 自动的给他一个种子策略,让他拿这个种子策略去跑这一千多家股票的所有的信息, 每天跑我就告诉他,我的我的策略就是大概百分之六十左右的胜率,你让他就不断的在跑,不断的在跑这些策略,然后呢, 他只要跑完一轮没有达到又继续跑,又重新的去优化,去学习,又重新的优化学习。我把电脑的权限,我把电脑权限开给他了,他自动的去跑这些东西,电脑权限开开了二十四小时跑,然后你看现在还在跑, 我的妈呀,我觉得这个工具太爽了,他只要直到跑成功了,最后告诉我策略,是告诉我具体的策略是怎么样子的,你看他就跑了好多人呢,跑了好多人呢。然后最后我再把这个策略 去每天去抓每天相应的那些对应的数据的股票,用它来操作,然后我再用它,我想用它开发一个量化的软件, 我现在在用的卡机,他刚给我开过来一个监控,监控的我后面要把这个软件把它全部自动化量化接接到这个里面来,然后这边策略每天去跑牛逼的策略,然后再用牛逼的策略去去跑我的股票。哇,我觉得这个很兴奋啊。

hello, 大家好,我是潜水小高,今天刚好 codex 五点四更新了,刚好下班之后我还剩一千多个 talkin, 嗯,想着给大家录一期我在我 iq 中如何去改写潜水代码的,让 codex 五点四, 然后这是我一个简单一个简单一个代码,然后咱来这边看一下我给 codex 五点四出来是什么功能,让他帮我实现什么效果。 就是我现在代码已经实现了普通的 f o c 去控制电机,就是控制双电机,然后我的代码是先通过 adc 中断采集电压,然后去计算电流,这个方法我已经我实现了,然后去通过串口控制双电音的速度环或者位置环。 嗯,现在呢,我想给我系统加上 f i t s 不 使用 q 慢的生成的,因为这个生成的话就是版本比较老,而且很多东西都不支持。 我给他提供了一个 github 链接,让他去帮我,一直让他并且把所有的任务都进行划分,然后保证没有错误, 然后发布任务之后呢,他先简单去看了一下我的工程结构那个以及那个中断链路,还有 f o c 的 入口,然后他看完这些之后呢,他开始往下一步步的去做做这之后他就直接去拿取了官方的 f r t s 的 一些代码, 然后他然后拉取完之后呢,他要开始去配置 firs 的 一些那个任务层啊,然后再把终端入口切到内核啊等等等,他开始改改代码,改改改很多。然后呢,由于我本地是那个 j b k 编码模式,他为了保留这种编码,编码模式呢,他就是直接用那个 power shell 去改写的一些东西, 然后他后来在那个那个把任务把代码改完之后呢,他在那个 q 里边就加上了些文件组,包括这个包,路径等等等。 然后他又在那我本地进行了一些编辑验证,做一些语法检查,把明显错误先清掉, 然后最后他遇见一个,遇到一个问题帮我改了,直接帮我改了,然后他编辑了之后,然后发现一个小小的问题,不清零的话,什么等等的,他又帮我把这个改了,涉尾阶段他要保证,保证做了什么事情,那咱可以,他大概这段时间用的是二十二分钟十八秒, 然后它完成的事情呢,就是把官方的 fratts 移入了工程,然后增加了 fratts 配置什么任务接口,把调度器那个 svc 碰 svc cct 点 c 接到了 fratts, 还什么等等等,这这条嘛是吧?然后进行任务划分,什么串口解解包嘛?就是那个怎么去控制它?什么电机位置环呢?位置环那个速度环怎么控制? 包括按键那些功能,什么高频 foc 电流音保什么等等,这串口指令如何去用它?用什么串口可以控制它?串口指令控制它,包括包括路径啊等,也帮我配齐了,然后他去用我本地东西去验证这个代码写的成功不成功, 然后这是最后也帮我检验过了,检查过了,最后他还给我提个小建议,下一边可以去做这什么什么规范,对吧?然后咱们去检查看一下,他帮我改改小代码, 这个是这个捆紧考呢,是我之前那个自己那个用 q 按重新生成代码时候自动加载的捆紧考,咱可以去看下其他代码。看其他代码,对吧?他这边还是 jpk 那 个编码模式,他没有去帮我改成乱码的,对吧? 这是检查代码,这是他帮我改的那个新增的 freex 点 c 这个文件在这里边放着任务,什么都帮我规划好, 他大概用的是二十二分钟,事情完成了我大概一周的工作量吧,或者说那个三到四天的工作量, 然后这个配额呢?配额呢?也剩了是四十八个,基本上不能做什么事情了,今天就到此结束,对吧?

兄弟们, codex 性价比拉满了啊?这是我年前买的一个 codex tim 拼车,然后用了满满的一周饱饱的用,每天白天晚上都在用了,他提示我说现在还有百分之二十五的额度,也就是我用了一周他还剩百分之二十五。关键这是在某鱼上 tim 拼车只花了六块八,并且看啊, 还支持最新的 gpt 五点四模型,一个月六块八,还支持 gpt 五点四,并且还用不完啊,性价比拉满。

最近体验了一段时间 codex c l i, 整体使用下来体验非常之丝滑,还不用担心被封号。这期视频把 codex 的 使用做了一个总结,除了前期的环境配置和安装外,还会做一个简单的植物大战僵尸小游戏,然后演示一下 codex 如何结合 pencil 画原形图。 第一步,配置环境。首先要确认电脑是否安装了 node js 和 git, 打开控制台分别输入这两个命令,看到版本号则说明安装了。如果没有安装也非常简单,去他们的官网下载一下,安装时一直点击下一步安装即可。环境准备好之后,在控制台输入这个命令, 看到这个提示就说明安装成功了。接下来直接在控制台输入 codex, 正常情况下会弹出这个登录页面。如果你输入 codex 后没有任何反应,则需要安装一个 windows 运行库。直接在浏览器搜索 vcradist, 找到微软提供的下载页面下载安装即可。重新在控制台输入 codex, 选择第一个选项,使用 chat gpt 登录,在浏览器弹窗里登录有 gpt 订阅的账号,如果你是 team 用户,选择一下你的组织,登录成功后返回控制台就能看到登录成功的提示了。后续的步骤一直按回车,直到进入 codex 的 主界面。 发哥你好,测试一下登录成功。接下来我们来做一个植物大战僵尸小游戏试试效果。为了管理更方便,需要新建一个工作目录,使用斜杠 quit 命令退出 callex, 然后依次使用 mktl demo 和 cd demo 新建一个 demo 文件夹并进入 在新的文件夹启动 callex, 然后就可以给 callex 指令,让他开始工作了。首先输入斜杠 plan, 告诉 callex 我 要做一个网页版植物大战僵尸,让他规划一下应该怎么做。 使用斜杠 plan 命令的目的是让 callex 开始工作前先做好规划,规划好后再执行具体的任务,避免浪费时间和 token。 callex 在 规划的过程中会询问一些问题,根据需要选择即可。 稍等片刻后, codex 规划完成了,这里 codex 会询问是否直接开始开发, 如果对规划内容不满意,可以填写要求让 codex 继续修改。比如这次计划上写的是使用点击的方式进行放置植物,但是我想使用拖拽式放置。返回最下方,选择第二个选项回车,然后输入我的要求,等待 codex 修改规划内容, 再次修改完成,这次直接开始开发。如果是默认权限,执行过程中 codex 会询问是否执行命令,确认没问题后回车授权即可。 等待 codex 开发完成。直接启动项目试一下。打开一个新的命令行,进入到文件夹,使用 mpm run dev 启动项目,启动完成。访问这个链接 页面还是比较简单的,向日葵还有点样子,豌豆射手有点像忍者神龟,直接开始战斗,看看实际游戏效果,基本上没什么问题, 运行很流畅,就是这个难度比想象的高了一点。接下来把这个 demo 提交到 github, 方便后续的版本管理。 首先在 github 创建一个新的仓库,然后把仓库链接直接交给 codex, 让 codex 完成推送。这里如果你会使用命令行进行操作,也可以自己操作。为了方便,我选择直接交给 codex。 codex 执行到这里告诉我没有仓库权限,这是因为我的 git 还没绑定上 github, 无需理会,还是直接交给 codex 处理,告诉他我没有仓库的访问权限,让他帮我配置。 这里按照 codex 的 要求执行命令,然后在弹窗里访问这个地址,输入他提供的设备码,返回命令行,让他再试一次。成功出现登录 github 的 请求,直接点击按钮在浏览器登录返回命令行,发现他推送成功了,去 github 检查一下, 好可以看到文件,这样这个代码就推送给 guitar 了。接下来我将介绍一些 codex 的 常用命令和功能,然后使用 pencil mcp 来解决开发时比较头疼的 ui 设计问题。 codex 的 常用命令并不多,正常情况下只需要用到斜杠 innit、 斜杠 plan、 斜杠 clear 和斜杠 resume 这几个,有时还会用到斜杠 permission 切换权限,斜杠 review。 检查代码,其他命令知道即可,需要的时候再查询使用。这里建议截图保存一下 关于 codex 的 skills 和 mcp, 需要什么就让 codex 自行寻找并安装。然后会使用斜杠 skills 和斜杠 mcp 管理即可。 最后演示一下如何使用 codex 制作一个圆形图并落地成代码。这里用 pencil mcp 做演示。 首先来到 pencil 官网下载并安装 pencil, 安装过程一直点击下一步即可安装完成。直接运行 pencil 注册账号并填写信息。这个弹窗是告诉我们 mcp 支持的 c l i, 在 里面可以看到 codex clay。 接下来先打开一个画布,重启 codex, 这里让它画一个宠物爱好者的交流网站, 可以看到 codex 会自动扫描 pencil 的 画布,并进行操作。 制作完成了,简单看一下效果,接下来直接让 codex 完成前端代码的开发。 最后我们看一下效果,还原度还是比较高的,这里拓展一点 codex clee 也可以直接复制图片进去, 如果你对原型图不满意,可以截图给 codex, 让它自己修改即可。如果你用的截图软件是 pippix, 需要在配置中把这个选项改为除自动之外的其他选项,来解决无法复制的问题。 codex clee 好 用的功能还有很多,比如 subjects、 代理等,大家可以在评论区留下你的高级用法。这期视频就到这里了,留下你的关注,然后快去下载尝试吧!

codex 跟 c c 到底哪个好?我想大家各自都有自己的判断。在我个人为二者都充了二百刀的 pro max 会员以后,我个人的体感是 二者的模型能力之间并没有本质的差异,甚至都足够惊艳,让人心喜。但它们其实代表了两种完全不同的人。与 ai 合作的费洛索费 本质上,我们不是选择两个工具,而是选择两种与 ai 交互的模式。你习惯使用哪种模式,你的工作场景是哪种模式,你就应该选择支持哪种哲学的普顶工具。通常来说,抽象的讲, 软件工程开发的模式可以粗略地分为两大类,首先一类是那些探索性不确定的 idea。 在这种场景下,我们自己可能对需求要做什么,最终的一个中态是什么,甚至过程中该如何实现,它都没有一个明确的定义,它更多是我们一个拍脑袋的灵机一动的想法。当我们解决这类问题时,我们期待的一个 partner, 无论是不是 ai, 它应该都要能 快速的与我们进行交互,通过一些他主动的提问甚至判断给我们更多的信息输入,通过一系列的沟通,最终确定出一个相对更结构化,信息密度更高的思维原型来指引我们后续的执行。 而另一种常见的工作模式则是一个更明确的需求,比如说产品已经给我们了相对明确的 p r d, 那 我们剩下要做的只是说把这个项目 真正转移为一个可以被执行的代码而已。对于绝大多数的研发而言,这种场景下想要做的事情是基本完全确定的,我们在此时要做的无非只是一些 dirty work, 把那个 p r d 转化为真正写出来可用的代码而已。 而结合我自己的使用经历来看, c c 更适用于前者者的工作模式。它会在你输出一些观点之后快速地给你响应,并且高频地向你发出提问,以确定它后续的一些方向执行思路。但 codex 则完全相反,它会在你给完需求以后, 非常认真且可靠地将你的需求描述执行完。这个过程会花很长的时间,但是 结果往往是令我们满意的。想要更明确的拆分这两种工作模式的分野,我们不如从三个维度上来进行拆分,首先是任务商,也就是目标的清晰程度以及约束条件的多少。其次则是以我们预期的交互结构, 我们到底期待着与其他 partner 是 同步的沟通,还是说是一些异步的沟通模式?另外则是一个人类所占主动性的比例, 我们到底期望 ai 占据多少责任?他们是只是执行任务,还是说给我们也有一些他自己的认识建议?其实这三者并非是一个非常正交的关系。一个很明显的结论是,如果一个 目标的本身并不清晰,只是我们拍出的粗糙 idea, 那 我们显然就需要我们的协作者能快速的发问,帮我们把 自己大脑中一些比较模糊的观念导出出来,并且通过一些沟通确定哪些思考是我们需要的,哪一些是可以被删除的。通过这种 快速的同步沟通,得出来一些更结构化的结果,那在这个流程中, ai 需要介入的部分以及引导的主动性就会占比更多,但如果这个需求本身就像我们之前讲的已经相对来说明晰,是一个低伤的场景,那我们就不太 需要。它是一个很同步,事无巨细都要向我们发问的流程,它完全可以在我们把事情说清楚之后,一步的完成这个工作,从而解放我们人类自己的时间。我们也不需要给他太多主动发挥的空间,他只需要忠实的执行我们给他的需求就可以。我觉着对未来工具的使用以及工作流的设计,也都是从这三个维度去进行判断,动 态的选择。我们到底适用于哪种工具,应该主要采用哪一种工作流的思路?如果要打一个比方的话, c c 更像是坐在你隔壁工位的好蜂蜜, 会在有了一些 idea 之后立马的打断你现在的所作所为,跟你去探讨它的一些碎片化想法。而 codex 则更像是一个你忠实可靠的下属,在你交代完任务需求以后,忠实的可靠的帮你把事情完整的办完再通知你。我已经做好了。 每个模型都有它们自己的性格,我们也可以顺应的这种性格,在不同的工作场景中选择不同的工具以及模型。 以上是二零二六年二月我对这两个投影工具的一些使用场景总结,但我相信这个领域是日新月异的,二者工具之间 大概率在未来也会发生一些融合。不会说一个工具只是一种工作流场景,那就需要我们未来本身人类自己有一些对需求使用场景的预判,从而能告诉模型它应该采用哪些工作流模式。软件工程永远没有银弹, 不可能说我们用着一种模式,一条道走到黑,就可以得到一个很完美的结果。如果你在错误的场景使用了错误的工作模式,那模型给你提供的支持也就会非常有限。 结合自己的需求,场景动态切换自己的工作流模式才是一个更高效率开发的必经之途。以上是本视频的全部内容,如果你有一些想法或者建议,期待评论区讨论,谢谢大家!

发了一个研究报告,是他们内部的一个小团队做了一个应用,在几周的时间交付了一百万行的代码,完全是用 codex 进行编辑的,完全没有使用人工的方式,这也是他们的一个强制的要求,它整体是搭建了这样的一个系统。 他也说了一下他的一些经验,最终达到的结果就是他们只需要一个提示,然后他们的这种智能体代码,智能体会直接去执行这种各种的一个预设的这种流程来进行完成和最终的发布。 他这个经验报告呢,如果说我们能搭出来这样的一件事情的话,肯定是去完成一个项目是绰绰有余的。而且他这个经验里面我个人觉得非常牛的是两件事情, 因为我们现在用这种 codex 或者说 cloud code, 我 们运行出来并不是说它性能好不好,准确度高不高,而是它跑出来的结果。我们人很大的成本现在来自于如何去做测试。 但是他们这个应用不是说这种桌面版的应用,更多的都就是一个网页前端的应用。他们用了这种 chrome 的 开发者模式,让很高的一个权限给到了 codex, 让 codex 去做检查解锁,达到了自己解锁这个内容,然后重现错误,并且修复,并且分析这些 ui dom 的 一些行为, 这是一个比较大的一个点。还有一个点我是认为非常有趣的,就是吞吐量改变了合并的观念,因为我们做一些修改的时候, 其实我们会非常的小心,特别是一些成熟的项目,你做一些修改,你必须要做非常多的验证,觉得完全没问题了之后,你才会把它合并到主项目的文件这个数中。 但是当 codex 大 模型来了之后,它的规范反而成了反作用,因为它做修复非常的快,所以说你只要能简单的测试它是好的,就直接合并,直接上线,如果有错误它马上就拉下来进行修改就完成了,就没有必要去做非常严谨的这种验证, 因为他的纠正错误的成本十分的低廉,而等待去测试的成本是非常的高昂的。所以说现在的一个策略是会有一定的进行转变的。 我们还是详细看一下这篇报告,他主要也分享了很多他们的一些经验。首先他们就说了一下,他们是人类掌舵智能体进行执行,他们有一个规定就是不允许手写一行代码,从开始 他们不编写任何代码,工程师是做这种框架和需求进行转化成 prom 的 一个工作, 然后是由 codex 进行编写,然后他们就发现了一个问题,他们的瓶颈就是如何审核这些 codex 出来的结果,然后他们解决的方案就是让他拿到更多的这种开发者权限,让他自己能去复现错误,然后修复错误,并且这些日制信息都会暴露给这个 codex。 就是他们的一个经验,是给 codex 提供一张地图,而不是一千页的使用手册。因为 codex 它的上下文就是特别稀缺的,所以说你不要给它过多的指导,因为全是重点,那么就是全部没有重点。 它跟 cloud code 它们的方式是一样的,就是你给它的这种文档是分成树状的结构的,它需要的时候它会到对应的文件夹里面去找去查,而不是你把所有都放在一个文件中。 然后就是智能体读取才是最大的目标,因为上下文是有限的,每一次执行的时候他都要去对应的上下文,所以说你的这些项目必须要让一个新的工程师马上拿到之后,他就知道他的上下文他要做什么,所以说他的文档必须要写的非常详细,而且要非常有结构性, 要对应的文档要放在对应的一个项目,对应的一个模块下面。然后就是其实他这个翻译有点问题啊,他这个意思就是你要保证输入输出就可以了,他具体怎么样实现就让智能体自己去实现,甚至尽量不要使用这种 新的一些库,最好就是让大模型他的训练,在最好就是使用大模型在网络上训练常见的一些库,或者常见的一些原则性、 原理性的代码,甚至让大模型他自己去实现,都比他直接使用某一些库,某一些现有的库会效果更好。因为现有的一些库他在他的训练中看到过的比例是非常少的,所以说他是不擅长的,甚至让他自己去实现他还更擅长一点。然后就是吞吐量,就刚才说的, 然后他也说了一下,他们生成的真正的含义是几乎所有的内容都是由智能体生成的, 他们没有做一行代码的更新,只做了这种优先级的排序,然后将用户的反馈转化成验收的标准,或者说一些新的功能工具,然后把这种 pr 提到代码库中,由 codex 自行进行编辑或者修复,最终达到了很高的一个自主水平, 如果能搭建出这么一套智能体编程的系统,那么就非常的牛了,但是他们没有开源他整个系统或者怎么样使用。然后最后他也说了一下,因为智能体他的自主进行写代码,他也会有非常多的问题,就是他的伤他会非常的混乱。可能这里这里的命名是这样,这里的命名是这样, 最开始他们是由人工去做一些修复或者清理这些遗留的问题,然后后面的话他们就使用每一天去做一下扫描,定期的进行这种技术债的消除。 然后他们说了一下他们的一些欠缺,其实就是设计环境、反馈回路和控制系统,他还是很大的原因就是怎么样去做审核,因为他这个都还是比较好判断结果的一些方式,因为他都是这种外部的应用,如果是一些这种桌面级的应用,他这个也不是那么合适。

好的,大家好啊,今天 openai 终于是更新了一个新的东西,叫做 codex app, 一个桌面版,它 openai 沉寂了这么久,终于是端了点有用的东西上来,这个我也是第一时间上手测试了一下,我这边规划下来大概有这么几个我觉得还不错的一个功能,我自己也试了一下。第一个它是支持 skills 管理, 这是什么意思?我们可以看到这这是一个它的界面,它的界面的侧边栏里把你本地电脑上的所有的 skill 它已经扫进来了,同时你可以自己去添加,或者说新建一些 skill, 都在这里一个模块化的去管理,这看上去还是比较直观和清晰的, 这个是比那个 ci 界面会好看一点。第二个是我觉得还蛮好的,是它是一个基于 git 的 一个 worktree 的 一个并行隔离开发,就是什么意思?比方说这里,我们在我们的一个新的项项目下,它这里有一个 logo 和一个 worktree 的 一个形式,当你选 worktree 的 时候,它就会基于你当前项目的这个分支,这个主分支你就可以去下发 多种的开发任务,你可以同时去测试,或者说同时去修改,或者说同时去呃,新建一些新的功能,它都是独立出来的,不同的分支,当你把这些分支都做完之后,它又可以去合并到一起,这个就比很方便。 第三个是他多了一个叫自动化的任务 automation, 这里相当于是你可以去设置一些定时的任务,或者说一些自动化的任务。比方说你每次做完之后,你想让他帮你 review 一下代码,或者说你想设置一个定时给你发送什么新闻或者消息的一个自动化的任务,都可以在这里去设置,这个也蛮好。 第四个我觉得还不错的一个小功能,他是你可以自己去配置你运行这个项目的运行的命令,或者说第八个命令或者测试的命令,这个就有点意思,这个有点像 vsco 的 那种一样的一个 编辑器的一个功能,你看上面我这里是设置了一个 run 的 一个功能,它这里当你点这个 add action 时,你可以去选择你的这个工具是 run, debug 还是 test, 或者说其他的工具。比方说这你选择 run, 你 可以取一个这个命令的名字,下面就是 你要运行的这个命令的一个具体的命令行代码。比方说你想运点一下这个运行,它就会去跑一个前端,你就可以用 p m run, 或者说你要你要配置这个项目之后,你想把这个一键点击,它就会把环境和 run 的 命令都放到这里面,你直接去这里点击这个运行, 它就会自动去跑起来,这个就有点意思了,这个感觉其他的平台的桌面版没有太见过这个功能。这边 open, 比方说你有的项目,你想具体去看一下细节的代码,你就可以去设置你默认的一个打开的一个软件,因为它它相当于是把所有的代码文件全部是隐藏在后台的,你没办法去仔细的看。 第五个的一个功能就是它可以在你提交或者修改了代码之后,它可以直接在这个界面去管理你的地址的版本,不管是提交也好还是推到远端也好,这里它现在是智慧的,因为我已经把我刚才改过的都推上去了。 如果你要推,这里有 commit, 有 push, 这些命令都有,同时如果你有任何的改动或者说暂存,它都会在这里显示出来。这个还蛮好的,相当于有一点,把 vs code 的 里面的一些很好的功能拿到这边就做了减法。这个我觉得整体来说这个 olex app 我 觉得还是很不错的,而且界面的设计和简约 都很好看。这个唯一有一个我觉得需要诟病一下,我知道是因为我没有发现,他这里虽然可以去把我们的终端调出来,但是他只能跑一个终端,因为很多项目他比方说是前后端分离的,他可能需要跑两个终端,他跑多个终端的时候, 现在这个 app 里面只支持一个终端,所以这个我觉得是可能后面看能不能更新的一个功能。对总体来说这个体验我觉得还是很不错的,只不过现在刚刚只有 mac 版本上了,后面 windows 可能要等一下。对,大概就是这样。

目前我用 codex 就是 openel codex, 已经完成了我的 app 的 开发,这个 app 包含用户端跟管理端都已经开发上线了,在苹果商城已经上线了。然后我现在用的主力呢是 gpt 五点四啊,而且我是 pro 会员,我前两天 pro 会员已经额度都用完了。其实我是已经算是比较重度的使用了, 他是基本上是一次就过,体验呢是极其的丝滑,基本上复杂的问题。你可以使用他的那个 play 计划啊,计划模式,他可以给你自己再去猎取一些计划,然后你可以给他一个完整的访问权限,基本上他后期的调试都会自己去操作, 很省事。我每次现在晚上睡觉之前,我会给他制定一个详细的计划,基本上可能跑个两个小时,能把我的一些代码再去做一下更好的一些完善。

code 叉据说爆出了一个执行漏洞,像这样的一个漏洞啊,基本上的原理都是相通的,我记得以前给大家讲过一个 git 的 一个漏洞,为什么要提这个呢?因为它们的原理是类似的, 我用 git 去克隆我的一个仓库,这个仓库呢是我配置好里面写了一些代码的一些漏洞的仓库,只要你用这个 git 克隆下来, 你就会中招,可能是远程执行一个命令,或者打开个记事本,或者打开个计算机,这是展示的一个 demo, 你 也可以去看看,现在还有。 呃,那么这个 code 叉或者 cloud 像这样的 ai 编程工具,它在本地,比如在我们的 go lab 里面,在我们的这个呃 vs code 里面,它可以去帮我们去执行,哎,修改我们的文件,可以操作一些文件,像可以执行一些这个命令,那我们可不可以在这个 get 的 这个仓库里面恶意构造一些代码, 只要别人呃克隆下来,只要用这个,比如说 code x 打开它就可以触发我们的恶意代码呢?这是一个问题,当然我也没有复现,只是网络上说有这么一种东西,但是这种东西的话,我们 open code 也是类似的,它都是在本地执行命令。 都说这种东西的话,大家要小心,就是不要去随意的去克隆别人的这个仓库,因为你也不知道是什么。当然你说不克隆好像也不太现实,因为你总要去用到,所以说呃,这个还是要小心,要及时更新你的这个客户端就可以了。