所以,这就是我们可以与 codex 合作的四种不同方式。令人印象深刻的是,它们可以相互连接并提供相互的上下文。例如,我可以利用 codex id 一 扩展在云服务上委派一个新的任务。 当他完成那个任务时,我可以将这些更改带回本地,或者告诉 codex cloud 直接在 getsup 上打开一个拉取请求。 codex review bot 可以 立即介入,并在我们合并之前仔细检查他自己的工作。 因此,它们并不感觉像是独立的产品,而是无缝斜坐在一起,它们更像是同一产品的不同窗口。这意味着你可以根据情况在它们之间切换,而不会感觉像是在 juggling 完全不同的工具。 因此,在本课程中,我们将分别探索每个不同的接口,并看看它们如何一起工作。我们将首先从 codex cloud 开始, 它将连接到一个 guess up 仓库,然后用于启动云任务。然后,我们可以从这些任务打开 p, r, s, 并要求 codex 直接在 guess up 上审查它们。接下来,我们将跳入 codex c, l i, 并在本地进行项目工作,然后手动将这些更改推送到仓库。之后,我们将在 v s code 中安装 codex id 一 扩展。我们将讨论上下文推理以及如何添加 m c p 服务器。最后,我们将看到扩展和 codex cloud 如何通过将多个任务从本地设置委派到云中来协助工作。在那里他们可以并行工作。 但在我们进一步讨论之前,我想提到两件事。首先,这不是一个面向非编码者的 y 编码课程,这是一个针对编码者的课程,适合新手和经验丰富者,帮助他们将 codex 融入当前工作流程。其次,考虑到这一点, 希望你对网页开发有基本了解。理想情况下还应该了解 guess up。 我 认为,当你让 ai 在 你的项目中编码时,理解 get 和 guess up 尤其重要。没有它, ai 驱动的编码代理可能会在几分钟内破坏你的代码库。正如我之前所说, codex 对 任何拥有 chatpad pro 或 plus 账户的人开放。
粉丝1715获赞9748

就在今天, astonovic 放出了他们的最强模型 cloud office 四点六这个最强的头衔,它只保住了二十七分钟,半个小时不到, openai 直接在线狙击发布了 gpt 五点三 codex。 这里放一张今天特别火的图,美国的 ai 大 战 vs 中国的 ai 大 战,大家怎么看?熟悉我的朋友都知道我的 ai 大 战 vs 中国的 ai 大 战,大家怎么看?熟悉我的朋友都知道,我的模型评测风格一般,不去看一些奔驰实测, 两个模型同一个 problem, 正面硬钢,剧透一下哈,结果挺意外的,一个功能做全了,但代码有坑,一个代码漂亮,但他前端漏了功能,到底两个模型哪个写代码更能打?看完这个视频你心里就有数了。 好,我们下面来快速过一下模型树懒部分 off。 四点六这边三大亮点,第一个, 它的一个上下文翻了五倍,到了一百万 token, 但目前只能按 api 付费的用户才能去体验。第二个 agent teams, 多代理协助,不是以前那种只代理模式,是真正的团队多个 agent 并行干活,互相沟通,质疑,不通过这个负责人去中转。第三个的话,它整个的一个输出 token 啊,翻倍了,由原来的六十四 k 到现在一百二十八 k, 可以 执行一个更长的一个任务,不中断。好,我们来看一下 gbt 五点三 ko deck 这边在第一项这一块, terminal bridge mark 这个参数呢,它是比 office 四点五要强接近十二个百分点,并且 这个速度相较于它的上一代模型快了百分之二十五左右,我的一个体感非常的明显,特别快。第二个的话是它的一个 首个参与构建自身的一个模型,也就是说他用早期的版本来 diabag 自己的个训练管理部署,然后针对评估 ai 帮自己 diabag, 想想就挺科幻的是不是?第三个的话是以前扣贷干活你只能等着,现在你可以随时介入,随时去调方向,不用先停止了。 那真实项目这一块的话,我给他准备了两个项目,第一个让他去做一个跨项目的一个迁移认证体系,也就是说我有一个纹身图的一个 agent, 我 要让他去参考另外一个项目,把那部分啊,谷歌邮箱登录、 github 邮箱登录 认证全部给他摘过来,这个考验他对另外一个项目的探索能力、架构适配能力。但第二个项目的话,我之前做了一期视频,是讲 skill 的 加载原理的,那并且我也做了一个开源项目,把它放出来了,那个时候是一个终端交互的一个性质,现在我把它做成一个外部 y。 第一个是 cloud 四点六完成的一个落地页,大家觉得怎么样?就一般般吧。那它在登录这一块的话, github 谷歌邮箱注册全部搞定了,没有任何的问题,我们也可以试一下,点击 可以看到它能登录成功邮箱也是对的,那整体这一块的话,它是整个完成度还 ok 的。 我们来看一下 gbt 五点三 codex 表现怎么样。 首先落地说实话不太行,比较简陋,大家看它的那个集成登录的情况,只实现了 get up 后端的代码,谷歌那边它也完成了,但是它没有在前端上写一个按钮。整体这一块的话,我会把票投给 cloud off 四点六 单看功能这一块哈,但是后面还有坑,待会我再慢慢讲。好,下面我们来看另外一个项目,就是给一个 skills agent 去加一个 外部 ui 嘛,因为之前是终端,我们来看一下,也就说我有这样的一个项目啊,这个项目是去使用当前一点零去构建了一个 skills agent, 演示了这个三层加载的一个原理嘛, 那主要的一些特性的话,就是有一些流势输出,然后托肯的响应,显示工具的名称,执行的过程,展示三层 skills 的 一个加载过程。原来的话是通过终端 ui 去交互的嘛,现在我希望他给我们做成一个外部版本,我们直接来看结果, 这个是 cloud 的 off 四点六完成的,这个 ui 太简陋了。 ok 来给了一个这个平台的文章,让他去做 思考,他会去做加载技能,然后去分析,再提取,再做其他的一些任务,看他能不能做到。 ok, 可以 看到他有调用的 skill 去加载这一个 skill, 然后他去执行那些命令,他发现这是命令有问题,他这个时候需要去安装相关的依赖, 那这个的话就是 gpt 五点三 codex 完成的,左边是他发现了我安装了哪些 skills, 并且右边你可以开多个聊天框去聊天,我在提示词里面其实有让他去要去实现对应的一些指令,那 gpt 五点三这一边的话是完成的非常好的。好,我们来试一下, 可以看到这边它加载了就是新闻提取器,这个时候它会去执行霸性,跟那边一样,因为一些依赖问题,这个先忽略它,总之就展示这一个加载的过程嘛, 很明显 gpt 五点三 codex 完成这个版本会比 off 四点六会好很多,我感觉不管从 ui 上交互上, 这一轮我会给他投票。好,我们来看一下完整的一个对比结果。第一个项目就是给这个 agent 加上一个用户认证体系嘛,主要是 email, 谷歌认证 get up, 然后从另外一个项目迁移过来。我们来看一下评分情况, 对话人数大家都用了第一轮,那功能完整程度的话, off 四点六这边要完整一些,所以给了他九点五分。 那 gpt 五点三这边因为它漏了嘛,所以说它的评分要低一些,在 ui 上的话也是这边会好一些。在代码架构上这个就有有的说了,在代码架构上的话, off 四点六这一边就是快,但它整体的实现其实有有一些漏洞, 那 gpt 五点三扣带这边它就像一个更有经验的工程师一样,然后整体的代码架构,工程规范都很完美, 为什么会得到这一个评分呢?给大家解释一下这个评分怎么来的。他们两个模型把代码写完, get commit 提交完了之后, 我用了他们两个最顶尖的模型去 review 代码,先让 off 四点六去 review 啊,两个人写的,再让 gpt 五点三 code 是 两个人写的,大家得到的结果都一样,就是 gpt 五点三 code 写的代码要好, 只不过在功能实现上它漏了,以及在落地页上它的实线会没有 off 四点六那么好看。但是代码这一块的话, gdp 五点三扣袋子这边肯定是要厉害一点的。 那整体总结一下的话,在代码架构上扣袋子要领先一些,它全链路的用户隔离、迁移、脚本测试覆盖都写到了。但实际功能体验上的话, off 是 因为它三种登录都可用, 然后 codex 它这边缺少了一个谷歌的,我不知道它为什么会缺少的。哈,那 ui 设计上也是 office 更优。那第二个想法,就我们刚刚看到的,我们把这个 skills agent 的 一个终端 ui 变成一个 web ui 嘛,那这块的话, gpt 五点三就明显领先了,不管是在 ui 上还是整体的代码实现上, 都要领先于这个 off 四点六。所以说我觉得整个这一次的发布来看的话, off 四点六它的代码提升并不是特别明显,反而这个 gpt 五点三 codex 相较于 gpt 五点二 codex, 我 认为它们提升了蛮多的。因为这几天我也一直在用 gpt 五点二 codex, 以前是速度有点慢,现在是速度又快,质量又高,我觉得未来 g p t 五点三 codex 大家会用的特别多,不像以往一样,大家可能都用 cloud code 的, 现在的话多了一个选择,并且它更便宜。我做这一期测试,我把这个 off 四点六这个模型的 整个五个小时的窗口全部用完了,但是这个我只花了二十道订阅了,它还没用完,一直可用,一直可用,很爽,速度又快,那为什么不选择一一个便宜,质量又高的呢?所以这一轮总结来看的话,就是 codex 整个代码实现明显领先,功能实现也领先,整个 uiux 都领先,所以说我把票投给了 codex。 好,我们来一个总结,第一个项目去做跨项目的一个迁移认证,这轮 off 四点六渗出, 第二个把一个终端 ui 变成外部 ui, 这一个 gpt 五点三 codex 渗出。那整体平均来看的话, codex 是 要领先一些,因为它这一次提升真的非常明显,速度快,成本更友好,而且后续的话我会更加的去增加我整个 codex 的 一个使用频率。 ok, 这就是这一期视频的全部内容了,如果你觉得视频做的不错,可以给我一键三连,谢谢大家,拜拜。拜拜。

codex 中可以免费使用的,就在前几天,萨姆奥特曼宣布为了庆祝 codex 用人的发布,添加了免费访问服务, 接着更是直接宣布在活动后将会继续向这个 free 用户提供 codex 服务。在 codex 中,我们能够直接使用最新发布出的 gpt 五点三 codex 模型,接下来介绍如何在 codex 中使用这个最新的 gpt 五点三 codex 模型。首次安装 codex 的 话,我们需要在终端中输入这行指令, 就是如果是我们之前安装过的话,先输入下面的代码,也就是这行代码来更新我们的 codex c l i, 否则就会用的是旧模型。输入后呢会提示添加了几个 package, 代表我们更新完成,然后输入 codex, 显示 codex 得到了升级, 比如就在这里显示我们 codex 已经得到了升级,将会使用这个 gpt 五点三 codex 模型。其中我们点击 try new model, 也就是使用这个新的模型, 然后再进入下面的页面中,我们可以看到就顺利使用上了这个模型。他在问我们要不要给 codex 配一个沙箱的环境来保护我们的文件,并控制网络访问入口。其中有三个选项可以选,第一个是 set up default sandbox, 它需要呢管理员权限,会创建一个隔离环境,限制文件的访问范围,然后控制网络权限,这是一种比较安全的方式。 第二种是 user 默认 sandbox, 不 需要完全权限,配置更简单,但隔离能力会弱一些,可能会发生提示错误的一个风险。还有一种就是退出选择之后,进入以下界面,我们就顺利地升上了 gpt 五点三 codex 也能显示我们当前的工作。一个目录进入了 codex 之后,我先拿我之前做的一个小项目做测试。 作为一个自媒体博主,我经常需要对测评 ai 产品,特别是办公赛道与 excel、 数据处理、数据格式化等等一些问题。之前我用 cloud code 加 glm、 四点七错漏子以及数据生成器就是这个表格,它支持人力资源类,然后财务类、销售类、行政运营类 的一个表格的生成,里面包含各种各样的数据,比如员工画名册、考勤记录表、销售订单表、项目进度表等等。 这个数据生成器呢,可以选择每文件的行数、每类型生成几个文件以及导出的格式,还可以在点击预览数数据之后,可以直接下载选中表格。因为当时生成的这个 ui, 我 个人觉得还是比较 ai 味比较重,不是太好看。于是我把这个项目先投给 codex 帮我优化优化。先优化它的性能方面, 可以看到这个 codex 先快速扫描我这个项目的结构、依赖和关键代码、路径、性能和维护性等等,直接对这个仓库的项目进行可运行的一个优化。优化完成了,它主要改了以下这几个文件中的内容,从性能、交互稳定性、项目与文案文档方面进行一个修改完善, 使用起来比原本的更流畅,下载起来的体验也是更快速、更方便。接着我又让 codex 帮我优化了一下界面 ui, 因为之前的 ui 界面我觉得 ai 味儿挺重的,这个是它优化之后的,我觉得审美还是非常可以的,非常清新淡雅的那种,又让它生成了另一个版本的 ui 界面, 科技味儿比较重的这个深蓝色的样子。之后呢,我又让 codex 重新呢做了一个基于网页的瞬时记忆小游戏,用于训练和测试玩家的短时记忆能力。 这个游戏的玩法就是先记住彩色格子的颜色位置,再在空白网格里选色选色,然后填回正确答案。主要的玩法就是进入关卡后,网格中会短暂显示目标彩盒方块,然后目标方块隐藏。进入一阶段, 玩家先在调色板选择颜色,再点击对应位置,达到本关目标数量后,会自动剔掉并判定结果。整体的首页的 ui 设计,包括可玩性以及这个游戏内的关卡。这个方块的设置评分的规则我觉得都是非常的 优秀,从推出 codex c l i, 再到推出 g p t 五点二 codex, 再到如今推出迈克端的 codex 和 g p t。 五点三 codex open i 的 这款工具也在也在不断进化。从模型性能方面呢, g p t 五点三 codex 在 s w e 奔驰 pro 上达到了顶尖的水平。 这个这个测试基础呢,主要是对真实世界软件工程能力的一个进行评估,它在 terminal 奔驰二点零上的表现也是比以前好一些。 这个测评标准主要是衡量像 codex 这样的编程智能体所需的终端操作技能也都在终端上操作了一个情况。文章写到最后,我们又在看网上呢,看到了许多科技圈的信息,一是无痕 ai 将下线 g p c o g p c o 以我个人来说,它不是最顶尖最厉害的模型,但真的确实是无数人心中最具人味的情感依赖和聊天对象。 第二个就是关于 cloud 的, 它的模型能力真的非常厉害,前几天出了 agent teams 功能,上线了 openstar 六,能力也是非常嘎嘎,提升 token 也是嘎嘎,消耗速度是真的快,能力是真的强,但是也是真的好 token。 最近呢,有的人爆出 cloud code 的 可能,买了一些代码,降低用户使用其他非 cloud 模型式的缓存命中率,这样我们就得多花些 token 的 费用。好了,今天的文章就到这里。

刚刚 openai 把 codex 做成了一个独立的桌面应用,还搞了个限时活动,不仅免费用户和购订阅都可以使用,而且付费用户的额度翻倍。左侧可以添加多个仓库, 直观明了管理多个仓库,允许同时开启多个现成,给 agent 安排不同任务。设置了专门的界面来创建和管理 skills, 内置二十余款 skills, 可以 非常方便地统一管理。官方还搞了个很夸张的演示, 让 codex 使用 skill 做了一个三 d 赛车游戏,整个过程消耗了超过七百万 token, 只用了一条出使 prompt 还内置了 automations 自动化功能,让 codex 按时在后台自动跑任务,比如找 bug、 生成周报等等。还内置了 work trees, 多个 agent 可以 在同一个仓库上同时工作而不发生冲突。不仅提高效率, wipe coding 的 门槛也大大降低了。

来,普通人想要用 ai 去接管你的任何工作,你只需要有一个 open ai 旗下的大模型,叫 codex, 不 需要你去下载什么豆瓣元宝,什么 kimi, 你 只需要这一个大模型来跟着我操作。首先 开通一个 china gbt plus 会员,开通成功之后,他就会给你多一个五点二 thinking 这个模型。好,如果说你们现在一个月不愿意花二十美刀去购买,现在也有一些团队的拼车的服务,可以把价格打在二十块钱人民币以内一个月。 好,第一步,登录之后,在任何的 ai 编辑器里边,我使用的是 cursor, 你 也可以使用 vs code 等等在插件市场里面搜索 code x 哦, code x 搜索之后找到 open ai 官方的快捷插件,点击安装好,我已经安装好了。安装好之后就是这个页面使用切的 g p 登录,刚刚我们已经把账号和密码登录了,我们来回到这个 ai 编辑器里边。好,就是这个页面,我们一直点下一步,下一 步,下一步。好,这时候我们选择权限,我们给他,我们给他全部的权限。好, 我们给他完全访问的权限。为什么要完全访问的权限呢?因为风浪越大鱼越贵是吧?这个权限的意思就是你的电脑里边的所有的文件夹,所有的文件夹系统全部归 codex 管理,不管你是做呃编码工作,还是做各种文书工作,还是任何的需要你手动去呃办公的软件。不管你是想安装什么 opencloud, 就是 那个龙虾的机器人吗?还是想安装 cloudcloud 的, 还是想做一个 ppt, 还是想做一个 word, 还是想做一个 呃什么财务的、法律的、文书的那个全部在这个小黑框里面都能够实现,有不懂的可以问我。

我把可乐扣的变成了黑心老板,专门压大扣单词写代码,结果效率翻了,成本还降了。如果你想彻底解放双手,那么我这一套工作流的方案一定可以帮到你。使用可乐扣的扣单词这类工具久了, 慢慢的就想让他们自己长久运行,但又怕写偏或上下文爆了。针对这个需求,我设计了一道可乐扣的监督扣单词的工作流,今天就把这套工作流以及设计思路分享给大家, 不仅仅是个方案,更是一种思路,大家完全可以拿去改成适合自己的方案。我先讲解一下这个思路,大家如果不想听这部分,可以跳到这个时间点直接抄作业。 我自己的情况是有切尔克 ppt plus 可以 使用扣带子,同时还有质朴的扣领 part 会员可以被摄到可乐扣的中使用。 gmail 我 也有,但是 gmail 的 c u i 我 个人感觉体验不太好,所以这里就使用卡拉扣的以及扣带子。 总结一下就是智普的扣令牌栏额度非常多,我基本上没有碰到过限额的情况。可乐扣的功能非常多,非常齐全,但有时会出现过着完成任务的情况。扣袋子则相对稳定一点,但模型对我来说相对较贵,所以要省着点用。 我这里的策略是让可乐扣的来充当监督者,让扣袋子去干活。关于扣袋子模型,我建议使用切的 gpt 五点二 mini, 但 扣袋子后缀官方说法是专门针对边层和代理任务优化,但我实际拆下来干活效果不太理想。 medium 类似于 auto, 你 也可以选择 high, 但是最好不要选择 x high 我 之前试过,效果是真的很好, 但是一天就跑完了,一周的额度,钱包真的收不住。最近出的五点三扣袋子也可以试试看,速度是真的很快,但多多少少也存的 爱的、偷懒的情况。决策分工是可乐扣的充当监督者。扣代词则是工人,这里使用两个 a 级的进行工作,最大程度上防止某些作弊。一个只负责写,一个只负责验收。整个流程开始于我使用扣代词生成的一份 open spark 偏更题案,这些题案会被转化为 test m d 中的具体代码是将列表。每当需要执行一项新任务时,可拉库尔就会启动一个 sub agent, 使用 codex e x e c 调用 codex, 然后使用自按语言调用 open spark。 open spark 最好是 零点二一点零版本,因为在新的版本, open spark 的 工作流就重构了,也支持自按语言调用,但使用的是 skills。 出发后续我研究一下怎么配合到这个工作流里。 托马斯在写完代码后,他必须制作一个可复现的测试方案作为完工凭证。 c u i 任务他必须提供一个智能化的测试脚本。 g u i 任务则提供一份 m c p 的 操作方案,可劳克勒会亲自运行脚本并进行验收。对于 g u i 任务,他会严格按照流程调用 payload m c p 辅 物,驱动浏览器并抓取截图作为证据,确保代码不仅写了,而且真实可用。只有当可拉库的亲自确认测试方案运行通过,且手中的证据链完整无误时,他才会执行一系列的确凿操作。在 tasks md 中勾选任务,更新 feature list, 点最省的 pass 状态,直接 get 提交存档,将日期写进 progress 点 t s t。 如果遇到技术卡点卡拉扣的,会利用 ctrl 七或浏览器搜索工具自主寻找解决方案,便知道 ctrl 进行重试。 我最在意的就是防止 ai 跑偏以及 ai 假装完成的任务。为了解决这个问题,我设计了一个双保险机制,分别是用 tasks m t 记录过程, 可使用 finisherlist 点击率记录结果。我们先说 tasks m d, 它是给人类以及 ai 件的文件,包含具体的任务以及详细的需求和实施步骤。我们先使用 codex 进行一个完整的体验, 可靠的会在这里记录具体的验证命令、截图路径和报错日期。如果有阻碍, codex 只能在这里写。具体的问题是什么? 是由当可拉扣的执行验证后,由可拉扣的写通过,确保我们知道代码是怎么出来的,而不是凭空变出来的。 有的过程还不够,我们还需要一个绝对理性的验收机制,就是 file list 检测这个解释给 ai 的 使用的。这里不记录任何过程,请关注任务是否通过完成了。它是一个结构化的交付清单,所有任务默认状态全是 false, 只有到某个任务真正被验证无了,它才会变成出。那么这两个文件是怎么配合,以此来防止 ai 作弊的呢?核心就在于标签印刷和单向流程。首先是标签印刷,我们在 tasks m d 里的具体任务后,会打算像简号 r e 这样的标签会对应 for list 点击层里 id 为 r e 的 功能条目。其次是单向的流程,可拉克的必须先在 task 四 m d 里跑通代码,拿到缺少的 pass 证据,然后才会去 for list 里面去更改状态。 首先是安装可拉克的和 code, 这个就不列据了,安装奥巴斯 bug 这里要说一下,最好是零点二一点零的版本 使用这个命令安装 open spark。 然后回到项目目录,使用 open spark 抽象化加项目,然后再把它的这些提示给复制到扩展词里面。 首先是 palette m c p, 可以 让可乐扣的去检验 g o i 界面,选自动化确认浏览器并收集证据,再配一个 control 器,遇到卡点时能查资料,浏览器搜索 m c p。 我 这里使用的是这幅的档案,你也可以换成其他的。大家可以去我的簿客或 知乎 app 上,也可以去云盘上进行下载复制,下载后就是这些内容了。 skills 大家可以配置到它们的根目录或者是项目目录,配置到项目目录的话直接粘贴过来就可以了。 skills 这里一共有三个,两个是给 cosys 用的,第一个是 使用采访式反问,把我们的需求和 ai 界的对齐。第二个是生成 fairlist 点 jason, 最后一个则是给可拉克的一道卡点石使用的。为了让这道流程跑起来,我们需要覆盖和新建几个配置文件。首先是 windows 八 pro pro 点 o d 需要添加的 windows 的 位置在这里, ios 的 就是这个,直接在这个 step 六后面添加内容。下面则就在项目目录里面的 openstack 文件夹下的 project dmd 的 末尾添加这个。它和上一个的目的都是为了让 openstack 生成的 test dmd 符合我们的要求。 这里需要着重说一下更改 open spark 端口, 点 m d, 则需要在输入 open spark int, 也就是说实话命令后再更改,否则会重置掉。下面则是在项目目录下完全覆盖 colocode, 点 m d, 目的则是为了明确 colocode 的 身份以及任务流。最后则需要新建一个自定义命令,位置则是在这个 新建一个昂迪脚本,这是我们自动化的核心,它定义了克拉克的如何自动循环调用 codex, 同时也避免了我们重复输入。下面则是重复流程了,先打开 codex, 使用自然语言作为一个变更体验,例如为我这个项目添加一个支持夜间模式自动切换的 openstack 体验。然后再使用 skills openstack 劝解 interviewer id, 让模型通过采访的方式引起我们的需求对其需求。这里的 id 是项目目录下的 open spark 文件夹劝诫词文件夹下的当前提案的文件夹名称。再用 open spark future list id 这个 skills 让模型创建一个 future list addition。 最后就是打开查找 code, 输入斜杠 monitor open spark codes id 就 可以开始工作了。本期视频到这里就结束了,视频创作不易,还请您点赞、关注、支持。如果您有任何问题,欢迎在评论区交流讨论。

这临近过年,我们的国产模型真的太猛了。前面我做过两期视频,用同样的 prom, 同样的真实项目任务实测,对比了 cloud office 四点六, gpt 五点三、 codex mini max 二点五。 那期视频做完之后,评论区就有人让我测试一下质朴新发布的模型 gom 五,咱也是加班加点的干出来了,而且据可靠消息,过两天还有 deepsea 微视版本的发布,到时候也给大家带来一期真实项目的一个编程实测。 求一个一箭三连不过分吧?在这里要插播一下,当我准备去测 gm 五的时候,我去官网去订阅它的 cooling plan, 直接受庆了,就我的套餐买不到。哇,那如果按 ipa 计费的,我目前也没有找到。他们可以用 insulate 的 一个协议来测试 gm 五, 所以我就用了 ppl 他 们家的去测试,他们是非官方首发部署的 gm 五,一个开源模型的一个权重,那兼容安斯罗比的一个协议接到可拉扣的里面也非常方便,因为我之前的评测的话,都是用可拉扣的去做的嘛。所以说为了保证公平公正,我们也是用同样的 工具方的编程任务去做实测。好,我们先去创建个 api k, 这里我就写 gm 五 确认,点击复制好,我们开始进入真实项目的一个编程实测环节,也是同样的 prompt。 哈,那第一个任务的话,是把 我们另外一个项目里面完整的一个用户认证体系,包括邮箱、谷歌认证登录、 github 登录迁移到我有一个新的图片生成 a 级的项目里面,同时让它去做一个落地页, 需要考验它的一个代码理解能力,架构适配能力,一个工程规范。这个任务还算比较复杂,之前用 mini max m 二点五去测的时候,它花了三轮对话才完成的,那 op 四点六跟 gpt 五点三 colex 的 话,它们一轮对话就完成了。 那第二个任务的话是我本地有一个 skills agent, 它是一个终端 ui 交互的,我们把它做成一个外部聊天页面,让它保留 syncing 工具,调用流逝输出。这个任务主要考验它全站开发, 流势输出以及 u i u x 的 一个交互能力。之前测试的话, off 四点六跟 g p d 五点三 codex 他 们一人赢了一局,那下面我们就开始做 g o m 五的一个测试。 这两个项目现在都是开启了一个沙杯进者的模式去探索已有的代码。那右边的话,它弹出来一个让我选择想用的框架以及 u i 主键库,我就按我一个常用的方式去选好,它提示已经成功了。 好,我们打开了他给我们写的这个 y y, 哈,他把这个 skills 是 放在右边的,就展示我已有的一些项目,来测试一下它可用吗? 好,我们开始让他去总结这篇文章,看一下他有没有去做到加载这个 skills, 然后加载完了之后去执行一些脚本去做爬虫,然后再去做总结。可以看到这边他已经加载到这一个 skills 了,下面去执行一些命令 总结出来了哈。整体的话完成度还可以的,就是他这个 ui 上稍微会差一点点,相较于那个 gbt 五点三 codex 的 话,这个完成的没有 gbt 的 好。 左边这个窗口就是 cloud off 四点六写的,这个 ui 上确实会差一些。右边的话是 gbt 五点三 codex 写的,当时我是把票投给了他,那么同时去可以看一下刚刚那个任务,他们俩其实都没什么太大问题,不是特别难,后端也就 thinking, 然后做工具调用, 可以看到都是 ok 的, 没有什么太大的问题。好,下面我们去看一下那一个纹身图 agent 用户认证体系那块它完成的怎么样了? 可以看到它这个已经完成了哈,可以看到这个代码它已经写完了,我们先看它能不能一次性去启动,之前 mini max m 二点五这一块是没有做到一次性启动,我们先开新开一个窗口去测一下。好,我们可以看到 g m 五的话,它目前启动是没有什么问题啊,我们再看一下它实际的一个表现, 我们看一下它整个 ui 表现哈, ui 还行,那我们看它的那个认证功能可不可以用。我们先试谷歌登录,谷歌登录的话,它这块放了一个小 bug 啊,它把那个毁掉的端口弄错了,我们改一下。好,我们继续。 好吧,登录失败了,这边还是有些问题,你看到它登录的时候认证失败了,应该是数据库的表结构那块有点问题,从这么看的话, gbt 五点三 codex 跟 op 四点六还是要猛一些哈,就是它们没有这些问题。 好,我们再来选择谷歌登录,刚让它修复了一下, 好,他终于可以了。哎,有个问题,他登录成功之后没有回,没有进到我们的那个主页面,登录成功之后没有进到我们 agent 里面, 这个算第二轮对话吧,看他第二轮对话能不能搞定好,我们点击登录选择谷歌, 他还是没有修复成功,他还是要再刷新一下,看没有再刷新一下,进来再给他描述一下吧。现在还有个小问题,当我们认证之后,他先跳转了到首页,我再刷新页面,他才进到了 a 镜的里面。 在他这是第三轮了,就证明他在这个方面其实跟 mini max m 二点五差不太多,他们俩再点登录。 我靠,跟这个问题杠上了,他还是修复不了啊,还是有问题,你能不能好好深入去修改一下,去思考一下。 这是我们第四次对话,让他去修改这一个小问题哈,这个表现呢,就有一点不是特别好了,我们再来,如果他再再进不去,我就不撤了,这个就默认他四轮吧。 好,我放弃了。这个问题我不测了,他修他,我跟他一直对话,他修不了。我们之前测 gbt 五点三跟 colorof 四都是一轮。 ok, 我 们下面来看一下评分,整体的一个打分标准是第一个,我人为的去检测他们的一个功能完整性以及 ui 的 一些情况。那代码架构,工程规范,我都是把他们所有的代码给到 gbt 五点三, codeof 四点六,让他们分别去 review, 然后去打分。 它现在结果是这样子的, off 四点六,在第一个项目用户认证里面,它是表现最好的,它在功能完整度以及 ui 落地上是表现的比较好,并且是一轮就完成任务了。但是它的代码架构跟工程规范会有一些小问题, gpt 五点三扣贷 x 的 话,它的代码架构以及工程规范会比它好,而且是这四个模型里面最好的。那它的功能完整度呢?因为它漏了一个谷歌登录的一个前端,所以说这个评分稍微低一点,那它 ui 落地页的话也会稍差一些。 上一期视频测试 mini max m 二点五这一边的话,他是花了三轮对话去完成了这个任务。那智普这边的话,刚刚你也看到了,其实四轮对话完下来之后,他还有一些小问题,所以说评分的话,他俩其实差不太多吧,我个人感觉哈, 我们来看第二个,把这个 skills agent 做成一个外部 ui, 那 这个项目的话就是 gpt 五点三 codex, 它在业务完成上逻辑错误控制以及 ui 代码质量工程实现都是最好的。那剩下这三个的话,大家表现的都差不多吧,大家有优势的地方也有他劣势的地方。 好,下面我们开始进入 agent 的 实测环节,把 gm 五模型接入到我这一个真实的一个 agent 的 项目里面去,它是做自媒体视频拆解的, 主要需要去看他的一个速度,拆解深度以及表达一个真实感。那整个 a 型的工作内容的话,就是先去下载视频,做音频提取,转文字,然后去做内容的结构化分析,爆款元素的提取,最终输出一个拆解报告。好,我们下面开始吧。好,右边也完了, 我们来简单看一下哈,他们两边格式上会有一些差异。在拆解上我们看他这个结构拆解这块,他这个时间出其实是有问题的,他做的不对,因为我这个是十二分钟的,他是做了 十四分钟到十五分钟,那 g m 五这边的话,它也有讲一个时间戳吧。啊对,你看它有二十分钟,还有三十到三十五分钟都来了,所以说我感觉它在整个 a 帧的表现里面不是特别好啊,它这个拆解的深度也不太够,我感觉相较于昨天我测那个 mini max m 二点五的话会稍微差一些。 好,我们下面总结一下。把 gm 五接到这一个自媒体视频拆解的 a 帧里面,它的一个表现情况哈,整体上的话速度偏慢,就响应速度不算快,可能跟当前用户量大有关系,因为都知道它这个套餐都卖的受庆了。第二个的话,它的拆解深度的话相较于 mini max m 二点五会有一些稍稍不足。 第三个的话,它的一个真实感稍微偏弱一些啊,这是整体的一个表现情况。好,下面我们进入整个的一个总结环节,在编程方面的话,一句话,在我的这一个测试项目里面, gbt 五点三 codex 表现最好,比 off 四点六会好一些。 glm 五跟 mini max 它们的体感接近,都是开源的嘛,并且它们的成本非常低,所以说 对于一个高性价比的一些开发任务的话,我觉得这两模型都非常不错。好,这就是这一期视频的所有内容了,如果你觉得这期视频做的不错,一定记得给我一键三连哦。那下一期视频的话大概率是做 deepsea 微四,有可能是在过年那一天发布,我猜测哈,据可靠消息。好,那视频就到这里了,大家拜拜拜拜拜拜拜拜。

我试用了几天 openai 新推出的这个 codex 整体使用情况,我是,我觉得我是非常满意,然后用户体验非常好, 尤其是针对那些不喜欢迷你行工具,或者是不知道怎么用 ide 的 那些,给你们看一下这个界面哦, 他这个里都是以文件夹形式,一个项目就是一个文件夹,然后这个文件夹下面你可以跑多条任务,我为什么要出来用呢?你在一个窗口下面,你布置了任务, 你可能还会有些其他的问题,你和他进行了探讨,等你这个上下文过长以后啊,整个模型它的召回率就会比较低, 这就是我们说的那个上下文污染。现在按照这样的方式,他其实已经在引导你,告诉你说,呃,你的一条任务就在一个窗口里面跑,在一个对话窗口里面跑就行了, 然后你可以开多个对话窗口去一个分别执行。还有一块我觉得是比较有特色的,是 openai 做了一个,现在看上去我感觉就是一个给我的技能商店, 然后每一个 skill 你 就可以直接一键安装,安装完成了以后去聊天窗口你就直接可以用,刚刚装好了就在这里就能看到,这个实在是太方便了,然后你不想用了,或者是你觉得不好用,你就直接卸载掉, 这个我真心觉得怎么说,我觉得这应该才是一个软件真正该有的样子吧。然后它的编程我做了一个简单的小测试啊, 因为我看网上有很多人已经测试过了,然后都说速度很快,但我不知道为什么,我这里设置的,我就让他帮我创建一个 to do list 演示程序,然后这是一个很基础的软件了,很基础的一个小的需求了, 但是他应聘的时间你看 work worked for 七分十七秒,我对这个数据, 对这个时间我感觉挺震惊的,然后我就赶紧跑去拿 claus, 四点六跑了一下,一分十七秒就跑完了。那反正我觉得我对 codex 的, 我对它的模型的能力其实是认可的,因为原来我也是在 cursor 里面,经常在 cursor 里面去用 codex 五点三,这个用 codex 五点二,那时候没五点三的时候就用五点二去 改一些比较顽固的 bug, 所以 我对 openlight 的 模型能力从来不怀疑,只是说原来 curses 里面有我没用而已,就没有用官方的了。然后简单说一下这个软件的一些小配置, 这边有个开关建议把打开,因为他可能运行的时间比较长,你电脑可能会睡眠,导致程序运行中断,这个打开了他就能保持你电脑一直处于一个唤醒状态。然后这边是这样模式的话,呃,你可以 相当于你下指令以后,你可以补充你的指令,或者是嗯,他朝另一个方向去思考。这两天反正应该有。我没仔细看他的更新的频率,但我前两天用的有的 bug, 这两天就已经没有了。 我之前这里他会弹出选择框的时候,那个选择框选完了,但是那个选择框不消失, 反正我今天用了一天,我也没发现有这个问题,应该是已经修复了。总结一下,我觉得这次这个格式化界面真的给人耳目一新的感觉。我习惯了格式扣的,但是我用这个我还是觉得用的很爽, 用户体验非常好。格式扣的里面看时间长了我觉得也就切来切去,我切的也很头疼, 我还是强烈推荐大家去试用一下。无论你是做 webcoding 也好,还是说你做一些文案类的工作,我觉得这个软件都非常非常适合你。

前两天呢, oppo 还推出了 codex 的 app 版本,所有计划的用户呢都可以使用,并且额度翻倍两个月,也就是说接下来的两个月你可以爽玩,如果你有 mac 设备的话,可以直接下载进行使用。我们首先来看一下这个页面里都有些什么功能,在左侧映入我们眼帘的呢,就是这个定时任务, 然后定时任务下面呢还有一个 skills, 第一个呢是技能创建者套娃这一块,玩明白了,这个呢应该是从 github 上搜索安装, 我们可以试一试。我说我需要一个制作 ui 的 skills, 然后发送给他,在这里呢我们就能看到他运行的命令帮我们创建。下面呢又询问了我们一下,是否允许他列出 getup 中的项目。好,当然可以,我从精选技能里查到了跟 ui 最相关的这些,他把它列了出来,问我们想安装哪一个,我随便让他装一个吧。 已经把这些 ui 相关的 skills 都装好了,重启 codex 就 能加载 skills, 我 们在上方点击这个刷新,就能看到它帮我们安装的技能,可以说是非常方便。我们接着来试一下它,这个技能创建者,我让它制作一个可以利用 remote 生成丝滑文字动画并生成视频的 skills, 我 可以发送, 现在已经写完了,我们让它安装一下,安装到这样呢,它就会自己找到这个合适的位置安装进去。就关于 skills 那 个视频,我已经拖了有个一个多月了,看来好像不用出了,这个很方便,我们看一下它安装的怎么样, 刷新一下哦,已经存在了,在这里你可以直接点击他,然后进行尝试,这样呢,就自动选中了一个技能,你再去聊天的时候,直接就默认用他,我让他制作一个 skills 的 科普视频, 然后直接来吧,虽然他下边还没跑完,但是这个视频已经出来了,我们可以简单看一下。你有没有发现最近到处都在聊 skills 啊,他应该用的这个技术是不支持中文的,但是这个动画是可以的。 在上期视频呢,我用那个 mini max agent 也做了一个类似的,我还是那个观点,就是你用 skills 来制作视频,它性价比太低了,所以我们先不管它了,看一看其他的功能。我们可以在左侧看到这个工作区里我们聊的所有内容,也可以直接新建一个工作区,或者是把本地的文件直接在这里打开。 比如说我刚才把我的博克工作区给导入了进来,那这里呢,可以看到他还有很多的聊天记录,因为这个项目在很久之前,我用过 codex 来给大家做过演示。可能有些朋友呢,还记得我曾经让他在这个项目中呢,添加过一个精灵球,点击之后出现烟花。我这里呢给他一个任务是尝试在首页添加一个悬浮的精灵球,点击后 出现烟花,那在右下角呢,可以看到有这个精灵球,点击一下,啊,有这个彩带, 我说是烟花啊,他给我做成彩带了。一个新的对话中呢,在下方我们可以选择三种不同的模式,第一种呢就是本地 到我们本地进行操作。第二个呢就是工作区里泊客税模式呢,是 get 版本控制的一个高级功能,我们可以在同一个 get 仓库里创建多个独立的工作目录,每个工作目录呢都可以剪出不同的分支,而且还不需要多次的克隆,主要是可以节省值班工钱和时间,尤其是一些大型的项目,可以直接并行的开发,同时去修复多个 bug 或者创建多个功能。 第三个 cloud 就是 云嘛,不会在我们本地进行任何操作,而是在 openai 的 服务器上去进行处理。大家所熟知的那种一两个小时的长任务,那就可以在云端里进行完成,包括说我们一开始提到的这个定时任务,当我们设定在云端的时候,即使是我们的电脑关机,它一样会开始工作,大家可以按自己的需求去选择, 我一般呢还是选择本地,主要就是发发博克,它的即时性比较强,我要在本地实时的看它的效果。当我们在这个工作区里随便聊了一句之后,那右上角呢就会多出一个运行的图标,我们点击一下可以在这里设置我们的运行命令,因为这个项目呢就是一个 x o 静态泊客站点,所以我给他设置了一个启动命令,然后我点一下 它呢就会自动在下方去启动,我们也可以直接点击去添加更多的命令,然后可以在这块查看,比如说 debug 或者是这个 text 的 测试。只不过如果我们只在这里配置,它只应用于当前的对话中。如果想要整个工作区都默认使用这一个命令,那我们点击下方这里 啊在这一块进行添加就可以了。在后面呢我们还能看到有个按钮,哎,好奇怪,点击下菜单哦,有很多的 ide, 也就是在其他的 ide 中去打开这个项目,那后面这个就不用说了,就是 get 用的嘛,在后边就是快捷打开一个终端,可以直接在里边输入命令之类的,然后是这个更改记录 啊,都能在这里查看。最后呢还有一点刚才我们没有提到这个语音就不说了,就是前面这个按钮,他默认情况下呢,是在一个沙盒里去进行我们的命令, 但当我们点击之后呢,就赋予了他最高的权限,他这里呢也有提示,非常的危险,所以不建议大家打开更多的配置呢,各位可以在设置里去查看。 总体的功能大概就是这么多,应该都讲到了,我个人还是比较喜欢这种设计风格的,各位如果感兴趣,又刚好有麦克设备,可以下载来看一看。那以上呢就是本期视频的全部内容了,如果对你有所帮助或者觉得视频做的还不错的,欢迎给个一键三连,有什么想看的内容也可以在评论区进行留言,我都会看。那最后祝各位玩的愉快,我是段峰,我们下期再见,拜拜!

好的,来吧。在这个系列中,我们将讨论 openai 的 codex, 以及我们在开发工作流程中使用它的各种方式。首先, codex 到底是什么呢? 这是我在过去几个月中问过自己的一个问题,它实际上是几个不同工具集合而成的单一产品。现在,我感觉 openai 正在努力消除任何混淆,并将所有这些工具统一在这个单一的 codex 名称下。从本质上讲, codex 是 一个由 openai 创建的 ai 驱动的编程助手,它可以自主完成我们指派给他的编码任务。它使用的是 gpt 五 codex 模型,这是它们专门为 codex 的 代理编码量身定制的模型, 任何拥有 chatpad 或 pro 账户的人都可以使用它而无需额外收费。它与其他 ai 编程助手如 codecode 和 copilot 的 不同之处在于, 它提供了多种我们可以与之合作的方式。有一个 codex id 一 扩展可以添加到 vs code cursor 或 windsurfer 中使用,这与针对 vs code 的 copilot 类似。我们有一个与 ai 模型互动的聊天面板, 当我们需要时,我们还可以让它更自主地承担当前任务。还有, codex c l i 更类似于 cloud code, 能够让我们直接通过终端与模型互动并委派任务。 然后是 codex 云服务,这是一个基于浏览器的工具,我们可以将其连接到 getop 仓库,然后我们可以使用它来指派任务给 codex 去完成。当我们这样做时, codex 会启动一个远程容器来远程运行代码并进行更改。然后它会在你的 getop 仓库上打开一个拉取请求, 其背后的理念是,你可以在任何地方启动 codex 任务,你的笔记本手机,甚至是没有访问你代码的随机计算机。你不需要在本地克隆你的项目。 codex 云会远程连接到你的仓库,并在其自己的服务上处理事情。 最后还有 codex 审核工具,我们可以在 getsup 上安装它,以便在创建拉取请求时自动审核。

oppo ai 又整大火,推出革命性的 codex app, 定位 ai agent 管理平台,亮点与槽点齐飞。它带来开发范式大转型,从传统 ide 迈向多 agent 协调管理,解决开发者新需求,能并行跑多个 agent 任务, 支持长周期运作,内置 word tree 隔离代码库修改,还集成七百家开源 skills, 向三 d 赛车游戏开发、 实时协议迁移等都不在话下,引发争议。界面被喷,套壳叉 s g p t 内存占八 g b 也遭嫌,技术选也来闯,框架被批。开发者觉得该深度集成系统 api, 这反映出 ai 公司重能力、轻体验的毛病,重大意义。 它标志 ai 计划成异步团队成员,或重塑软件开发流程,免费开源策略,加速生态渗透,推动行业协助标准建立。未来咋发展,咱拭目以待。

啊,我好喜欢 codex 最近新出的这个 plan 的, 这个模式给人满满的安全感,特别是对于那些想学习一些新技术,新的概念的呃人来说,呃,这种 plan 的 模式 就是他可以来说他可以把你脑中的比较模糊的要学习的一个技术,然后经过和你呃一点一点的呃规划,把它总结成一个包含时间周期,包含成本、 包含场景、包含要学习的内容的这么一个一个计划,给你规规划下来满满的安全感。比如说我最近学习那个 cloud boot, 也就是 open cloud, 它的下边的一个框架叫 pi, 叫 pi 是 一个很优秀的一个框架, 但 aj 的 框架,但是我不知道他优秀在什么地方,我只知道很多人在讨论他,所以说我就希望他啊,我就希望他我想学习这样的一个技术,一个能力,然后但是我不知道从哪入手,或者我应该怎么去一步一步的去实现,去体会到, 然后他给我一步一步的去给我设定目标,设定时间啊,设定成本、设定场景,给我出了一个小小的计划,我觉得 还是很舒服啊,这个拍板对于我这种不习惯用终端命令的人来说非常的舒服啊,所以我就拍这个视频。

我们进入科室的主界面,首先我们要打开一个文件夹, 我们可以看到现在的科室它是一个英文版,我们先要把它做成一个中文版,我们点击左侧这里的这个扩展按钮,在搜索框里输入 chinese, 这个就是简体中文的安装包,我们点击 install, 这里是提示我们更换语言,并且重启,点击这个按钮重启,可以看到菜单已经变成了中文,我们点击打开这个文件夹, 我们现在是在试用期,看看都可以使用哪些模型,这里是 cloud opus, 四点五, sonnet 四点五, gpt 五点二, code x 和 gemini 三,这是它的四种模式。这个 agent 模式是它的默认模式,可以计划,然后构注代码。 play 模式 是用来计划将要做的任务的,那么 debug 模式呢?是用来修复 bug 的。 ask 模式,就是你跟这个 cs 进行对话,来了解当前的代码,这就是这四种模式。

好内容我要一直发,坚持的发,重复的发。我之前拍过一条视频,我是说怎么用 ai 去接管你的任何工作,当然前提你是一个小白领,或者是你你做的大部分工作都是 文书类的工作,都是 ppt, word, 或者是做一些图片生成的工作,或者是文案策划的工作。 你不需要玩什么豆包,也不需要 kimi 元宝,你也不需,更加不需要搞那种极客的那种 opencloud, 是 吧?你更加不需要玩这个 opencloud, 你 只需要下载一个 codex 插件,就是 openai 旗下的这个 codex 插件就是这个 codex 插件。 当然我给大家一个路径,你们按照这个路径去做,有任何问题你们可以直接来问我。首先第一步,你们要去选择 gpt, 去 购买一个 cheap 的 七 p t plus 的 会员,这个如果是在官网上会是二十美刀,大概是一百四、一百五或者是一百六十块钱人民币, 我现在已经可以搞到二十块钱以内了。好,一定要搞一个 cheap 的 七 p t plus 会员,二六年,给你们一个 性价比最高的一个方案,就是购买一个车载 gpt plus 会员,购买之后登录到回到咱们刚刚的入口,我已经下载好了我的 codex 的 这个插件,你们在下边啊,这个权限要给他最大的权限。为什么要给到最大的权限?因为风浪越大,鱼越贵。 你给他最大的权限就是让这个小黑屏,让 codex 这个大模型目前已经来到了五点三的这个版本,让这个小黑屏去 控制你的整台电脑的文本。所以说第一步,购买 qgg plus 会员,第二步,下载 codex 的 这个插件。第三步就是打开你的一个文档,在这个文档下边去 使用 codex 的 打磨型去实现你的任何的工作,遇到任何问题前来咨询。

codex 免费了!就在刚刚, openai 发布了 codex 的 桌面版 app, 并且这段时间可以免费使用 gpt、 五点二等最新模型。这可不仅仅是简单的代码工具,而是你的全天候 ai 助理。它能够自动化执行每天定时任务,比如每天拉取金融信息、 ai 资讯生成进度报告等,省掉大量机械操作。 同时还内置了诸多 skills, 甚至还支持一键创建 skills, 以及如飞格玛、 m c p 等也都内置其中,多肉并行也不在话下,后台执行多个县城每个都在为你卖命干活,这简直就是河东牛马!趁着免费赶紧下载体验吧!关注我,了解更多 ai 干货!

ai 圈又开始神仙打架了?就在昨天, openai 发布了 codex 的 桌面版,它现在已经不是去年那个单纯写代码的工具了,而是变成了一个 ai 编程的 agent, 从一个只会写代码的 ai 变成了一个 ai 编程团队。你给他派一个任务, codex 就 会让多个 agent 同时开工,像指挥中心一样管理所有项目而不发生冲突。写前端后端脚本, 测试重构修 bug 全都能干,还能自动化定时任务,早上起来直接就可以看结果。甚至 codex 还可以免费使用 g p t 五点二等最新模型, mac os 上直接就能下载了。这不就是一个免费的核动力纽码吗?

很多人对 ai 编程工具的认知还局限在辅助股权代码、减少手动输入的层面,殊不知,这样的理解早已跟不上行业的实际发展。 openai 旗下的 codex 桌面板早已跳出了单纯代码助手的定位,升级为全新的开发指挥平台。开发者只需下达清晰指令,多组 ai 智能体便会自动分工写作, 从设计稿转化到项目部署上线,全程无需手动敲击代码就能完成全流程开发。这背后,是编程开发的底层逻辑发生了本质改变。以往的人机协助模式更像是双向配合,开发者梳理需求, ai 生成基础代码,后续还要反复调试修改,整个过程繁琐且耗时。而如今的开发模式早已简化,只需明确指令,比如按照 figma 设计稿制作登录页面,对接 o s 零认证部署至 v c o 平台,短短时间内, ai 智能体就会自动拆分任务, 分别完成 ui 代码转化、认证配置、上线部署等工作,通过专属流程隔离操作,避免任务冲突,最终自动整合成果, 开发者无需额外干预,就能拿到可直接运行的云端项目。 codex 能实现这样的高效写作,核心一是多智能体协同作业,不 再依赖单一 ai 完成全部工作,而是模拟团队分工,分别负责前端、后端部署、运维等环节,开发者只需把控整体目标,扮演指挥者角色。二是技能包附用机制,将 figma 转代码、项目部署、问题管理等重复流程打包存储,一次调用后即可自动记忆, 后续直接赋用,大幅减少重复劳动。三是安全刹厢兜抵保障,默认限制操作权限,尽可访问当前项目文件夹,关键操作需手动确认,从根源规避操作风险,让开发者可以放心使用。实际应用中,已有开发者借助 codex 通过七百万 token 的 资源量, 从零搭建出可正常运行的三 d 赛车游戏。整个过程中,开发者仅负责下达指令、把控方向、任务拆解、流程执行、版本迭代均由 ai 自主完成,这样的效率是传统开发模式难以企及的。当下行业趋势已十分清晰,开发者的核心竞争力正在悄然转移,过去比拼的是代码书写速度、 框架熟练程度,未来更看重需求拆解能力、精准指令设计能力以及自动化工作流的规划能力。指挥基础代码编辑的开发者,可发挥的空间会逐渐缩小,而能调度调度 ai 做好指挥的开发者,仅凭一人就能实现小团队的开发效能。 相关数据也印证了这一趋势,越来越多的开发者开始使用这类 ai 工具,使用规模持续增长,传统的终端开发模式也正逐步被全新的指令驱动模式替代。这并非制造行业焦虑,而是客观呈现技术革的现实。 对开发者而言,核心问题从来不是 ai 带来的冲击,而是能否快速适应新角色,成为合格的 ai 写作指挥官。 codex 降低的不是编程的基础门槛,而是规模化整合开发的门槛。未来需要打磨的 不再是繁杂的语法细节,而是把模糊的创意需求转化为 ai 可执行的精准指令。最后不妨思考,当代码编辑变成清晰的指令下达,你更愿意成为统治权的指挥者?还是仍在打磨指令表达的精准度?