anthropic 和 codex 的 分歧这次是真的公开了,同样都在做 coding agent, 但他们对 harness 的 判断正在走向两条完全不同的路。一边是 anthropic 前几天刚发工程博课系统展示他们怎么把 harness 做得更强更厚。另一边是 codex 的 开源负责人 michael bolin 最近在一场访谈里给出了几乎相反的信号,一个在继续加厚,一个却在努力作薄。所以现在真正的问题已经不是 harness 重不重要,而是它到底是终局,还是一个过渡阶段的中间态。先把 harness 讲清楚,如果用最简单的话说, harness 就是 模型外面的那套控制结构,模型负责生成,但 harness 决定任务怎么拆,工具怎么调,上下文怎么传,结果谁来验,流程怎么往下走。所以它不是单个 prompt, 也不只是工具调用,它更像是 agent 真正能跑起来的那套工程外骨骼。而现在最有意思的地方就在于, anthropic 和 codex 都承认 harness 很 重要,但它们对 harness 的 未来判断已经开始明显分叉。 anthropic 的 路线是把 harness 做厚,这点我们前面其实已经拆过了。它们在最新工程簿里,为了让 cloud code 能长时间构建完整应用,加了很多非常重的结构。 比如 planner, 把一句话,需求扩成完整规格。比如 generator, 负责真正实现功能,比如 evalerer, 像真实用户一样去测页面接口、数据库状态。 再比如 contact reset, 就是 上下文快脏掉的时候直接清空,重新起一个新 agent, 再通过结构化交接文件把状态接过去,你会发现, anthropic 这套思路的核心是模型本身还不够稳的时候,要靠更强的外部编排去兜住长任务里的跑偏风险。说白了就是模型做事, harness 保证特别失控, 所以 answer pact 的 判断其实很明确,复杂任务之所以能落地,靠的不是单次深层能力,而是整套控制结构够不够强。但 codex 这边, michael bolin 在 最近访谈里给出的信号儿几乎是反过来的,他说的很直接,他们理想中的 harness 应该尽可能小,尽可能轻。 什么意思?就是不要把太多决策硬编码进外部框架里,不要疯狂堆专用工具,不要把流程做得越来越重,不要让模型每走一步都被人类写好的规则牵着走。 codex 的 思路更像是尽量给模型一个真实环境, 比如终端,比如沙箱,比如必要的上下文连接能力,但探索路径、调用方式、执行策略,尽量让模型自己决定。你可以把这理解成两种完全不同的工程哲学。 antropic 更像是在说模型还不够稳,所以我们要先把脚手架搭起来。而 codex 更像是在说,脚手架可以有,但别把它做成一栋楼,因为模型早晚会涨到能自己处理更多东西。这就是两边真正的分歧, 不是要不要 harness, 而是 harness 到底应该越来越强,还是应该随着模型变强不断收缩?所以这个问题为什么值得我们认真看?因为它背后其实决定了未来 coding agent 的 产品形态。如果 entropy 这条路是对的,那未来的核心竞争力就会越来越像系统工程,谁的 planner 更强, 谁的 evalerer 更稳,谁的 handoff 更完整,谁的流程控制更严密,最后拼的会是整个 agent 框架本身。也就是说,未来的竞争可能是 harness 之战。但如果 codex 这条路是对的,那现在很多复杂的外部编排本质上都只是过渡期补丁。随着模型的推理、记忆 工具使用,还有长期执行能力继续变强,这些重型框架里的一大部分可能都会被模型自己内化掉。到最后真正留下来的,可能不是一个很厚的编排系统,而是一个相对轻量的运行环境,比如 sandbox, 比如 memory, 比如 connector, 比如少量但足够强的工具入口。如果真走到这一步,那 harness 就 不是中矩,它更像一个中间态,是模型还不够强的时候,人类替它补上的那层结构。但这里最有意思的是, michael 也没有说 harness 会彻底消失, 它其实保留了一个底线,就是环境和安全不会退场。这点特别重要。因为这说明,哪怕在最做薄 harness 的 路线里,也不是完全没有 harness, 它只是会从流程控制层慢慢收缩成运行环境层。这才是这场分歧最值得看的地方。 anthropic 在 回答的是模型还不够稳的时候,怎样让复杂任务真的能跑起来。 codex 在 回答的是模型越来越强之后,哪些外部结构还值得保留。所以如果把这两条路线放在一起看,我觉得真正值得记住的一句, where anthropic or codex 谁对, 而是 harness 现在当然重要,但它最终会不会成为主角这件事还没有定论,它有可能是 ai coding 的 终局, 也有可能只是模型能力跃迁之前被快速放大的中间态。而这个问题一旦想明白,你看今天很多 a 阵的产品视角就会完全不一样,你就不会只问这个产品加了多少工具,做了多少编排,有多少 a 阵在写作。你会开始问另一个更关键的问题, 这些结构到底是长期护城河,还是只是在替今天的模型补短板?如果是前者,那你应该继续把 harness 做强。如果是后者,那你就得非常警惕,别把过渡期脚手架做成未来的长期负担。所以我自己的结论是, entropic 和 codex 的 分歧, 表面上看是在讨论一件更根本的事,未来 coding agent 的 核心竞争力到底会停留在框架层, 还是重新回到模型层?这也是为什么我觉得这个问题不是技术细节,而是路线判断。我最后留一个问题,你觉得 harness 最后会变成 ai coding 的 终局,还是只是一个被迅速放大的中间态?评论区聊聊,关注我,下期继续带你拆。
粉丝3026获赞1.3万

挑战,每天讲出一个 ai 知识点,今天是 codex 模型切换哎,然后如果是我们通过 api 去做的一个使用的话,大家可以去看一下,就是哎 整个的一个价格啊,就是不同模型它的价格也不一样,那如果大家要考虑到更加经济,是吧?省钱的一个版本的话,你可以用 gbt 五的一个 mini 版本,这个就是 token 的 话,哎,非常便宜,是吧?只有零点五,零点二五美元,这个 依照的这么一个 token, 那 么它比较适用于任务比较明确的一个场景啊,如果说大家做的是一个非常专业的一个场景,比如说你要做编程,做一些比较复杂的这个推理的时候,那你就要选这个 gbt 四五点四的一个模型是吧? 包括,呃,以前老版本的一个 gbt 的 一个 api 版本啊,像简单的内容生成用 gbt 四点一足够了啊,或者是 mini 啊,或者是 nano, nano 的 话就是 更省钱的一个版本啊,它是最低的一个版啊,当然还有这个欧四,欧四的话是这个欧系列的话是适合这个推理是吧?强推理类的,那么这个 gbt 的 这个系列的话,就是做内容生成会比较好一些啊,这个大家可以去看一下官方的这么一个介绍啊,就是关于 这个费用这一块的,我们可以去看一下啊,这个跟大家具体的这个使用量是吧,会有一些关联。然后这个目前 codex 默认搭配的是 open a n 啊,最厉害的这个代码生成模型叫 jbt 五的这个 codex 版啊,我们等下给大家演示的就是一个 codex 五点三的这么一个版本啊, 然后推理等级用的是这个 mad 啊,就是一个中等这个 codex code 的 这么一个啊,版本的话它其实是一个专用的代。

首先来猜一猜下面哪些是 cds 做不了的事?是从这个像素运动到这个像素,沿着能画好的路径,是时光飞逝,恰好停在六点十五分,是地图上一个真实的坐标,一段精准的海岸线,是可以听见的声音,是一字不差的文字, 是用代码下一场雨,是用复历页函数画出的樱花,是一百万条数据涌入,每一条都找到自己该去的位置。答案是 以上所有啊, cds 做不了这些。 cds 可令这些 diffusion 模型确实很强,它能伸展你脑子里想不出的那些画面,但是它无法精确地控制每个细节。而 remote 加 ai 可以。 过去的一个月,我都在用 remote 加各种 ai 平台,包括 cloud code 来做产品演示,数据格式,三 d 场景,地图、动画等等。 我发现越来越多的博主也在用 web 神,比如这个主播,七个视频,十三万粉,全程 web 神制作。现在我把一个月的踩坑经历凝练成十分钟的教程,里面有大量的实战技巧以及完整的工作流。手把手从零到一,带你告别 a。 一, 实现逗笑自由。建议点赞、关注、收藏,我们开始吧。 以前做动画视频,首先你要打开 after effects 或者 fusion 学图层,关键帧曲线编辑器,光学软件就要几个月。而现在,你只需要跟 ai 说,帮我做个中日韩三国生育率随时间变化的动画。啪的一下,很快啊,视频就做出来了,这就是 ymotion。 一 句话,凭感觉做视频, 什么实现 remote, 这 cloud 就是 一种玩法,当然你可以换成悟空, codex 都可以。这么说,你们容易理解, remote 就是 那个全自动的厨房, a cloud 就是 那个厨师,而你就是负责点菜的,想要什么视频,动嘴就行。 在我的另一只视频里已经详细讲过怎么样借助 cloud 安装 remote, 悟空啊, codex 这些平台的安装方法也都是一样的。我也贴在评论区了, 我们把悟空的官网链接丢给靠,让他根据这个网页做一个产品动画。注意啊,我加了一句,不要做像 ppt, 先跟我讨论你打算怎么做。我习惯先和他讨论方案,这样返工就会比较少。方案 ok, 继续,然后他就会开始干活了。注意看,每做完一个镜头,他自己会检查一下。 ok, 让他打开预览。这个界面看着很吓人啊,但是别慌,你什么都不用学。当然了,你可以点这边手动渲染,但咱们有靠的是吧,让他干活就行。给我渲染一个视频到本地,看视频就躺在文件夹了。 顺着刚才那个案例聊啊,与 motion 最适合做的其实就是软件动画和 ui 演示,因为它本身就是 ui, 很多画面不是画出来的,而是搭出来的。像打字机啊,中端风啊,界面飞来飞去啊这些它特别擅长。来看这个案例啊,怎么表达打碎机 ui, 让它彻底 c l i 画。你看整体效果 这里我把每个镜头要什么直接拆给他了,然后反过来问他,你觉得怎么样才能做到极致的酷炫?接着 ai 会给出他建议的工具,让 ai 自己选武器,因为他懂得比你多。 数据格式化是与 motion 的 绝对主场,像 g p t 近速图啊,手机销量图啊,份额变化图啊,华语乐坛人物关系图啊这些只要有数据,它就能变成视频。 你当然可以让 ai 自己上网去找数据,也可以让 ai 读取你自己本地的 excel 表格、建层数据集等等。图表画的好不好看,关键不在于 motion, 而在于你选了什么样的前端图库。 别慌啊,你不用真的懂这些库,只需要告诉他,我想要财经媒体那种丝滑的竞速图,或者直接扔一张参考图给他,他就知道该怎么配。这些是一些常用的图标库,供你参考。 地图动画当然也是预谋选的舒适区啦,这就没有不舒适的吧,旅游路线、地理大发现的航线病毒扩散热力图都能做。我之前的地图动画教程有六千多人收藏,但你可能会发现啊,同样的提示词,你做出来的可能就是这样。核心的诀窍是,你需要一个地图外挂。想做正经的地图动画,你光靠模型去脑补可不行,要接真实的地图底图。 国内直接用高德稳一点,海外码你可以用 macbox, 免费额度完全够用。你只需要去高德的开发者后台申请一个 api key, 剩下的码交给 cloud 去配。提示词里加上地图外挂,质感完全不一样。 那直接复刻别人 ae 效果可以吗?可以的同学,可以的。有博主直接用它复刻了小林说的动效,而我则用它复刻了代码宇的动效。秘密就是让 ai 直接读视频, 我们只需要安装一个 f f n pack 技能,把视频放在本地文件夹, ai 就 能读出这只视频的每一帧,更好的还原你想要的效果。哎,这比用嘴描述可高效太多了。 先看这个效果怎么做的,这是春节档电影票房三 d 排行动画。首先呢,让 cloud 收集电影票房的数据,把电影海报和导演的照片下载到本地,然后把这段提示词 发给他,他会自己去调用 r 三 f 来做。注意啊,这个时候柱子是三 d 的, 但场景还不是。我们去这个网站随便下载一个免费的。点击 l b 的 三 d 场景,放在本地的文件夹,让 ai 去读取,你还可以让它改成黄昏的氛围,或者任何你想要的氛围。 注意啊,三 d 场景的远近大小角度,用嘴来跟 ai 沟通,效率非常低。这是我从推特上一个大佬学的,让 ai 把这些数值作为属性暴露出来,在自己的预览里直接改数字,实时看效果,这样速度会快十倍。 唇釉 remo 选做完整的视频当然可以,但是把它和实拍进行结合,表现力会更加的丰富。比如这个效果以及这个效果背后的秘密是,透明序列针,把序列针拖进剪辑软件,就能做出别人做不到的效果。我自己视频里的很多过程以及包装,现在都是用 remo 选做的。怎么样?还挺酷吧, 再快速过几个啊。 remote 加 ocr, 写一段提示词,就能做出这种重点标注马克笔的效果,指哪打哪。把字母文件给 remote 写一段提示词,就能做出这种逐字高亮的效果。把音频文件给到 remote, 就 能做出音频和释 怀。还有一个必杀技啊,自适应尺寸,做好一个横版视频,一个指令瞬间得到一个自动适配的竖版视频,同时发 b 站和抖音,不用做两遍。 ok, 复习下今天的技巧。一、先讨论方案再动手。二、让 ai 自己选武器。三、搭配前端图标库,做出更酷炫的图标。四、地图要酷炫得加外挂。五、 整段视频都可以为 ai 参考。六、沟通不清楚的参数可以让 ai 变成属性,自己来填。七、导出透明矩阵帧和剪辑软件进行配合。 再说一下我的完整的工作流,我通常不会用 remote 来做一整段视频,而是会让它去做一个个小的片段,因为动效是辅助讲解的,而不是替代讲解的。当然,如果要做长视频,具体的流程是,一、先让 ai 来设计分镜,来规划每一帧的内容 以及节奏。二、让 ai 来搭整个时间线的框架,把骨架先搭起来。第三步,建议一个镜头一个镜头的去做,这样你调整起来就不会太麻烦。 四步,一个个单镜头做好之后就可以整体进行调优,节奏啊,风格啊,转场等等。再补充一个进阶的小建议,可以写一个 call 点 md 放在项目的根目录,告诉 ai 你 常用的分辨率、帧率、动画风格以及偏好。每次开新的项目, ai 一 上来就会知道你的审美,不用从头再说一遍。 最后再聊一个重要的话题,就是 remotion 适合做什么以及不适合做什么。上面的三项是主场随便打,中间是过渡区,能做,但是需要搭配外部的裤。下面两项别 影作有更好的工具。我自己就是 remault, 做动画剪辑我还是会交给剪映和达芬奇,遇到一些实拍的素材我还是会用 cds 和可林。 remaulting 不 会取代任何的工具,但如果你是知识博主,或者你想给自己的产品做演示的视频,而你又不想花几个月的时间去学, a e remault 加 ai 就是 最快的那条路。 ok, 如果你觉得这期视频对你有一点点帮助的话,就就给个一箭三连。在评论区我想看到诸位的作品,我们下期见。

你让 cloud 指挥 codex 干活,任务一复杂,最先乱的往往不是实线,而是上下文。 simon wilson 点的很准, sub agents 最适合代码库探索和多步骤计划,因为单个 agent 装不下那么多脏活。 今天我把这层拆给你看,顺便讲清它怎么接近 agent teams 和 ccb。 复杂任务的问题不是模型不会做,而是读代码,找证据,做修改都塞进同一个窗口, 官方文档直接点名。 sub agents 特别适合代码库探索和多步骤功能计划这种天然并行任务。把这些步骤拆开后,主代理只处理结果和决策,上下文才不会越滚越乱。 codex 现在内置三种子代理, default 都得, worker 专注执行和修复, explorer 专注读代码。 这不是三个窗口同时聊天,而是不同角色先分别完成任务,再回到主县城统一汇总。 simon wilson 的 观察很准,这套模式已经成了 coding agent 的 通用结构, agent teams、 ccb code、 sub agents 不是 一回事,而是三层结构, agent teams 解决,上层协助 ccb 解决, cloud 到 codex 的 任务分发, sub agents 解决, codex 内部再拆执行。 前两层决定谁来指挥,最后一层决定 codex 自己怎么改。如果你之前就在用 ccb, 让 cloud 负责拆需求定边界,审结果,现在它终于能更细地指挥 codex 了。 cloud 不 再只把任务扔给一个 codex, 而是能明确要求 codex 先拉 explorer 查,再拉 worker 改。你还能写自定义 t o m l 代理,但先记住三件事,显示 spawn 六个线程一层深度 token 也会更高。 这项更新的意义不是 codex 多了个按钮,而是 coding agent 开始进入角色分工阶段以后,谁还让一个 agent 一 口气查证?改验慢指是副作用,更大的问题是它会越来越糊。

卧槽,朋友们出大事了,刚才 openai 官方上线了一个 plugg, 叫做 codex plugin cc, 那 它干什么的?顾名思义就是允许你直接在 cloud code 里面调用 codex 携带码进行这个 review。 那 么刚才我本来是在录制一个 cloud code 的 一个教学视频,看了这个视频绝对是超过百分之九十九的人,那里面就讲到我们如何在 cloud code 里面调用 codex, 本来我们的方案是调用一个啥背景的,对吧?结果现在 openai 直接做了一个 plugg 让你调用, 那么它这个插件的第一功能叫做标准代码生产,就是帮你改 bug。 第二功能就是对抗性生产,那就是它不仅帮你改 bug, 同时它还会刺激你的架构设计,是不是合理?还有第三功能叫做救援模式,这个什么就比如说你现在写用克拉克写代码,发现 有个 bug, 怎么改就改不掉,对吧?那可以直接使用 rescue, 那 么它勾代码就会接受整个代码,然后帮你完成后续的。那么安装也特别简单,我把命令放在这里,大家直接去复制安装就好,赶紧去用起来体验一下。

强烈推荐大家去使用 open ai 的 ai agent 编程助手的终端 codex, 甚至你可以用 codex 来修复龙虾中的 bug, context 加 openclaw, 简直是天作之合,完美的搭配。而且啊, open ai 在 这个点上还真的是比较大方的, 如果原来你是 openai 的 plus 或者是 pro 会员订阅用户的话,在 codex 上面会给你配备一定额度的 token 的 使用配额。 大家好,欢迎来到玲姐说一 i 这期视频啊,我们聊聊同步在 windows 上线的 codex 的 使用,非常推荐,之前其实他在苹果的终端也上线了,所以我在这里给大家做一波强烈的推荐。 原来你在使用 cloud code, 同样的二十美金或者两百美金的这个订阅计划。大家知道那个配额啊,是很不够用的,稍微干点活就不能用了,就要另外买 token 了。但是 codex 使用的配额还是相对比较充沛的。 open ai 你 花二十美金每个月的订阅啊,给你整个的配额还是挺多的,又可以聊天,又可以申图,还可以用 sora 每天大概十到三十条的 这个使用条数,同时你还可以使用 codex, 现在苹果用户和 windows 用户都可以使用了,赶紧在电脑端把它下载下来。这个编码助手啊,也可以说是 cloud code 的 平替, 当然叫平替啊,也不太合适,我只是说 cloud code 在 这个领域上面我之前讲过,它做过很多刻意的练习,解决过很多开放性的生产任务,所以它整体的位置是行业老大的位置。我说这个领域啊,不是说呃,所有领域 是在这个生产工具的 call 顶的领域啊,它是属于引领的位置,而且它也一直在定义行业的标准,包括大家熟知的 m c p, skill, co work 等等的工作方式。但是呢, codex 这一波的上新呢,确实是有它的创新点在里面的,它用户的交互界面体验比较好, 对于那种比较厌恶命令行的这种交互方式的用法会特别的丝滑。它会有自己的特色,比如说像工作数这样的任务的并行的方式啊,我觉得对于多任务并行啊也特别的友好。另外使用它你基本不用付出 额外的成本和费用,更重要的是加持上了它最新的五点四的模型。 五点四最重要的一个优化是什么?就是它加强了在 computer use 上面的能力,也就是这个 agent 的 编码助手,它有更强的执行操作和理解的能力,相当于它的闭环能力更强了。 所以听到这里,是不是已经迫不及待去微软商店下载 codex 了?这期视频我会给大家介绍 codex 的 特性,以及如何从零到一。使用 codex 我 会给它几个实战任务,看看它这个过程中会遇到什么 bug, 怎么执行解决,会不会有翻车的情况。 如果你是苹果用户呢,直接在 app store 里面去下载就可以了。如果说你是 windows 用户啊,你是 win 十及以上的用户, 你就直接在微软的这个 microsoft store 里面直接下载就可以了,它的整个的下载安装非常丝滑,你就按着它的引导一步步完成就可以了,这里我就不做深入的演示了,这个就是 codex 安装后打开的界面, 是不是一股熟悉的味道扑面而来,特别像 try gpt 的 聊天窗口,对于那种使用命令式的交互窗口,仍然有一些抗拒的。这份使用者 codex 我 认为是一个非常好的选择。 在这里啊,你可以很好地过渡。我就结合 codex 的 使用,从零到一实操,给大家也讲讲 codex 的 使用特性。 首先啊,在设置这个地方,点开,大家在这里登录自己的 try gpt 的 账号,同时在这里可以很快地切换你经常使用的语言,英语或者中文都可以。在这个地方会显示你这个账号的额度, 它是通过两个维度限制你,一个是五小时的使用量,还有一周的使用量。如果说你真的做很多深度密集的 这个使用任务的话,我觉得这个额度可能还是不够。但是对于大部分的使用者而言,我认为这个额度啊,已经比 cloud code 要大方很多了,基本你们都是够用的。 在出事安装的时候,在这个地方,现在我已经弹点掉了啊,就是它会弹一个窗口让你安装这个沙箱。 这个专用的沙箱也是 codex 针对 windows 的 一个设计,有这样的沙箱,让它的整个的命令的执行在一定受控的环境里面,也可以有效地保护你系统本身运行的文件, 就按照它默认的配置去选就可以了。在下面这个位置啊,可以更改权限的范围,除非你非常笃定啊,给它完全的访问权限, 大份情况下建议使用默认权限。另外,在模型这个位置,可以选择不同类型的模型。 现在比较推荐初学者使用的是 g p t 五点四,因为五点四是一个综合型的模型,它既有理解能力,又有推理能力,还有 computer use 的 能力,还有 coding 的 能力,它是一个综合型的模型。另外呢,如果是针对专门的 扣顶的工作,可以选择五点三 context, 它是针对 context 这个环境和 context 的 任务,专门进行过优化的这么一个模型。 在这个地方,推理强度一般默认是高,也可以选择超高,当然这个背后所消耗的 token 数就会不一样。另外在加号这里啊,你可以去上传文件和照片, 这里就会有很多的玩法了,又可以对一些多模态的内容啊进行加工,比如说对视频进行剪辑。同时在这里可以调它的 speed standard 和 fast。 这里啊,我觉得它有一个做得很好的地方,相当于它在用户体验侧的一个优化,它这里有一个计划模式, plan 模式。其实这个技巧呢,我在之前给大家教学 chain 这个软件的时候,也会讲过类似的技巧, 只是说他现在把它单独拎出来了,对于这个功能进行了优化。你在做一些项目的时候,你可以先计划,先和这个 gpt 去沟通, 这个项目怎么规划,它的框架是什么,怎么设计,计划完了之后再开始执行 coding。 所以 从这个层面来说, context 它的定位啊,其实分为三层,第一层它是一个代码助手,它可以帮你写代码,解释代码,审裁代码。第二层,它是一个工程型的 agent, 它可以帮你去识别 bug, 修 bug、 提 pr 等等。而且它还可以做很多并行的任务, 比如说我在这里有个任务啊,你点击这个右击鼠标,在这里啊,它就有一个特色,叫做派生到新的工作树,叫做 walk g, 就是 你在做一个项目的时候,当它出现问题的时候, 你会发现可能有好几个东西要修。如果做过生产实践,你会发现啊,你修 a 的 时候, b 也在修,那么它们有可能把 a 修好了, b 又出了问题,就是它会出现相互的交叉污染这个情况。有了这样的 work tree, 你 就能够并行地进行很多工作任务,那么你发现没有,你的效率就提上来了。 codex 的 第三层,它还是一个电脑操作型的 agent, 比如说我刚刚讲的剪辑视频这样的任务,或者说其他的这个文件名批量命名的任务,整理会议资料的这样的任务,它其实都是电脑操作型的, 它也是一个电脑操作型的 agent, 这是我对 codex 这个 agent 工具的三层的理解。当你需要新建一个项目的时候,可以点击这个位置,这里点击 add project, 新建一个项目文档,然后在里面呢点击这个新县城。 同时呢,它这里有一个功能啊,叫做自动化,你可以让它定期的帮你制作一些任务,那么你就可以设置一些定时任务,比如说让它每天定期的帮你去搜集某个领域的专业信息,或者定期的跑一些这个整理文件文档的这么一个信息 等等等等。这里需要关注的一个点就是它的权限问题啊,你给它开多大的权限?当然它这里也少不了最近最流行的 skill 技能 这个板块我在 cloud code 的 这个视频里面讲过,它也是类似的,你看它这里,它的官方 skill 里面放在最前面的也就是 skill create 创建一个新技能的技能, 你在这里可以去调用它的技能啊,它不是那种命令的交付窗口。比如说你想要用这个 figure 码,你就可以点击这个加号,它就直接帮你安装了这个 skill。 如果说你想用这里面的视频生成工具,你就可以用这个 sora 生成视频的技能,并且啊,你想生成新的技能,点击右上角的新技能, 这里呢,它就自动调用了 skill creator, 你 就可以跟它去交互聊天,告诉你你要创建怎么样的技能,然后它帮你进行封装。并且啊,如果说历史你用的是 vs code 这样的终端,你也可以同步很好地去打开对应的项目, 很好的平移切换到这里。而且我自己用下来的体验,它会比 vs code 更好用一点。所以对于 vs code, 我 觉得大家可以放一放,然后平移切换到 context 这个终端来使用。下面我就讲一些具体的实操的案例来启发一下大家,可以用 context 做什么任务?它有哪些魔力?效果怎么样?好,我们进入任务实操,我先给他一个任务,我让他给我批量修改文件的名称。在这个文件夹里面我放了五条视频,这个视频是我 youtube 上面已经剪辑好的成品视频。 现在他的命名啊,只是有日期的标签,是没有主题的,我希望他能够基于这个视频的前六十秒所表达出来的内容抽取主题,把这个主题加上日期,对这些文件进行批量命名。 在 context 里面,我就把我的要求和希望达到的结果告诉给他,这里是我写的提示词。在任务的进行过程中啊,因为我们对它进行的是一个有限的授权,在一些关键步骤上面,它会来询问你的授权和意见。 比如说这里啊,它问你是不是直接就对这些文件名进行重命名了,你可以回答是,或者一直允许,或者是告诉他如何调整。这里啊,我就允许是 在这个思考过程中啊,他也会说,从命名的这个动作是越过沙箱的一步,可以看到,在这个过程中,你的文件,你的系统内的东西是比较安全的,这也是我比较推荐大家使用 context 的 一个原因。同时在这个任务跑的过程中啊,我再同步地开一个新的项目,新的县城, 点击这里的 add project, 创建一个新的文件夹, orange cad game, 然后选择这个文件夹,这样我就进入了一个新的项目文档。我现在想做的这个任务是类似这个经典的 flappy bird 的 这个网页小游戏这样的开发,把这个游戏的主角形象换一下,把那只经典的黄鸟 换成一只橘猫,飞行员稍微做一个调整。但是整个游戏的框架和逻辑啊,还是去参考 flappy bird 的 这个设计。在这里啊,我就把这个游戏的要求放到这个 context 里面。 注意啊,这个游戏的要求的需求文档和整体的项目框架,我也是让 g p t 给我写的,为什么我会这样操作呢?其实这也是一个技巧,因为虽然 open ai 在 codex 上面的配额还是相对比较大方的, 但是如果你要做比较极致的生产任务,这个配额可能还是不够,所以我就尽量可以省一点,把前面的需求设计和构建的这个阶段蓝图规划的内容交给 gptchat 去聊,用五点四 thinking, 这样子相当于前后的模型,是前后连贯的这么一个状态。先把需求沟通好, 然后呢,再回到 context 里面,在这里面我们还可以再极致一下,再细划一下,打开这里的计划模式,让它再给我规划一下这个游戏开发的任务。这里的推理功能,我选择一个超高,然后点击发送, 在右侧,这里就可以看到不同的项目文档,不同的县城,它们就在并行。如果说你比较关心的县城呢,你还可以使用这里的这个钉钉一下,它就会置顶在前面,这样子你关心的核心在修的一些 bug, 重点在做的项目就在最前面。使用了这么多款 编程助手的终端 app, 我 自己的感觉 projects 是 我整体用下来觉得最丝滑的。这里帮我把整个的开发计划规划出来了,包括需求理解,文件结构,关键接口,七步 mvp 开发计划,以及最后的验收,还有第二阶段的功能等等,都包含了。 他问我是否实施此计划,我点击确认实施。哎,这个文件夹从命名的任务已经完成了,他告诉我每个文件分别从命名了什么,而且他这里还讲了这个转写的逻辑是什么。前六十秒他识别出了 这个视频主要是讲什么内容的,然后提炼出的主题是什么,然后把这个主题加上日期格式的转写,变成了这个新的命名。我们打开 d 盘看一下, 欸,都命名好了,完成的很棒哦,以后这种批量重复的工作啊,都可以尝试交给 codex 来使用。当然对于这个 codex 这个工具啊, gpt 对 它的定位,还是说把它作为一个 agent coding 的 工具, 你要尽量让他做他擅长的工作。再回过头来看,他的执行路径是比较清晰的,因为他扫描发现我这台计算机没有装离线的音频转文字的转写的工具,这个不可用, 所以他就通过工具把这个视频的前六十秒进行抽帧,核心去保留底部的字幕区域。因为我的这个视频啊,有时候也会有这个背后贴了这个 ppt 的 信息,所以他会同时用 windows 的 ocr 去读这个字幕,以及 ppt 的 标题和页面的文字 综合来形成对这段视频主题的判断。最后呢,再把它整合成新的文件名,并且啊,它强调这次的授权仅在这个指定的文件夹里面进行操作,不能够碰其他目录的文件。 整个过程流程清晰,权限的边界也很清晰。这个任务其实对于 codex 都是非常简单的任务啊,我给他上一个高的推理权限,实际上也是有点大炮打蚊子的感觉。我想表达的是可以用 这个工具去执行以往我介绍的在其他终端的其他任务都是可以的,它的能力上限啊,和智能程度还是比较高的,甚至你可以用 codex 来修复龙虾中的 bug。 context 加 openclaw 简直是天作之合,完美的搭配。这个游戏的任务它完成了,总共花了十七多分钟,给了我这个试跑的链接。这个试跑的链接啊,就存在我的 d 盘里面的项目文档里面一个 html, 我 们在浏览器里面打开这个界面啊, 空格,点击上升穿门就得分,我们开始飞行试试。哎呦哎呀,碰到柱子了,再试一下。哎呀,还挺难的,再试一下。哎呀,这个有点难通过呀。 一分,哎呀,一分,结束了, 得两分。哎呀,得两分,这是我的最好成绩了。以上就是 context 的 介绍和实操,它可以帮你写项目,写代码,也可以帮你修 bug, 提 pr, 还能够做电脑的 computer use。 你 打算用它来做什么呢?欢迎在评论区分享你的想法,我们下期再见!记得订阅玲姐说 ai 的 频道哦,拜拜!

好,今天我们接下来学 codex, 在 前两天 codex 又进行了一次更新,可以看到旁边多了一个技能和应用,那这个技能也就是 skills, 我 们理解了,但这个应用啥意思呢?所以这节我们一起来学习一下。那我们可以看到应用呢,其实相当于我们之前安装过的一些,呃,像 github, 像这个,呃 几秒,对吧?那这些应用都可以直接在这边通过安装安装这个插件或者应用,那我们安装好了完成之后呢,那这时候我们就可以和这个应用进行对话了,这也是和 skills 最大的不同, 看到这里呢,会自动的选择当前我自己的所有 get up 仓库。那很多小伙伴可能疑惑说,我安装了应用和安装插件有什么区别呢?那唯一的区别可能在于它一个应用是一个整体,整个整体里面包含了它提供的功能,比如说它包含哪些呢?包含我们整个仓库的所有权限一宿, 包括提交 pr 以及进行什么,进行这个 push, 对 吧?你可以看到,对吧?还有 revenue, 还有这个啊,这个相当于它把一堆的这个 skills 呢作为一个整体给变成一个应用给到你,相当于你不需要一个一个去安装 skills 了,你只需要,哎,直接走安装我这个应用就相当于安装了这么多个 skills 以及这么多个操作,对吧?而且这是官方提供的,是更加的啊精确。那这时候我们可以在这里面去对话,比如说,哎,帮我合并一个 pr, 对 不对?通过这样的方式可以更加的啊准确去对我们应用进行操作。那你安装好了之后呢?在 manage 这里呢,也有一个分类,对吧?比如说告诉你插件在这里 啊, app 在 这里, mcp 在 这里, sku 在 这里,对吧?看出你的具体数量, ok, 让我安装了三十六个 sku, 四个 mcp, 是 不是通过这样的方式,是不是很清晰 那?呃,其实这一次它提出来,除了这个点之外呢,它还提出了一个 create plugin, 对 吧?之前是有一个 create skills, 是 不是?而且有一个 create plugin, 就是 说你可以在你的创建你自己的插件,它提供了这么一个啊,提供了这么一个 skills 帮助你创建插件,比如说你可以创建一外部的插件来去帮助你访问一些数据,对吧?通过这样的方式,但是你分类也分得很清楚,比如说像 抠点相关的,对吧?它跟 face。 那 当我们选择去安装某一个应用的时候,我们比如说点击安装啊,再点点击安装某一个应用,它会自动弹起一个授权,比如这个对不对?你看就是安装它,这时候它会选择安装它安装的过程中会弹起一个授权去关联你线上的这个 os, 你 看 不管什么就会相当于关联你自己线上的一个东西,让你选择认证,这时候呢就会把授权的信息给到 codex 啊, codex 就 安装好了,相当于能够获取你所有的这些权限啊,这是我们的这一次的一个简单的更新。好,那这一次我们继续还来学习一下,就是 codex 呢,我们已经知道,对吧?它这一次 还加了一个这个应用,是不是加了这么一个应用这个东西,那其实我们在使用 codex 的 时候还有一个 mcp, 对 吧?之前我忘记讲了,这个 mcp 我 想呃,很多小伙伴都提过,是一个老生常谈的东西,但是 codex 这里我也是第一次提,所以今天给大家讲一下,那 这里面可以看到这个学习,这里也提出了非常多的和这个 codex mcp 相关的。 如果说你想要去哎,把你的服务器上的 mcp 登录一下,授权一下,你可以通过这个命令这边授权一下,你也可以在这里面去配置你自己的 mcp, 比如说我现在在里面打开了他的目录,对吧?在这里面我配了一个 mcp, 对 吧?他在这个目录下面配置成 mcp, 叫 mcp server 点 fish, 对 吧? 这是我的 mcp, 它会执行一个这个命令,然后并且开启了 mcp, 所以呢,我在这里呢配置好 mcp 之后呢,在这个 codex 里面就可以去呃加载 mcp, 加载 m c p, 可以 让这边你通过 m c p 的 方式哎去把这个东西吊起来,哎,就告诉你,哎,我现在确实开启了这么多 m c p, 或者你也可以像我一样,对吧?通过啊,直接吊 kill 的 方式,比如说我想安装某一个这个 m c p, 你 就直接跟他说,对吧?啊,帮我安装这个 m c p 安装,那他安装了,实际上就是会把这个安装的这个结果哎写入到这个啊这个里面来,然后从而去调用当前这个目录下面这个啊,这个工具,是吧?就完成了 m c p 的 调用,好吧,嗯,那我们现在已经知道了 m c p, 也知道 skill, 对 吧? 那所以呢,我们就相当于把 skill 变成一个整体,变成了所谓的应用,大家都明白了吧?就很清晰的一个东西,我觉得 啊,并没有很复杂,所以这是它的更新那,呃,大家可以灵活的去把这个 skills 和 m c p 整合起来的,灵活去用啊。当然这里县城这里呢,也加了一些简单的排序,比如说这里你可以全部全部折叠,全部展开, 也可以按时间去排序啊,我觉得这也是它的一个改动,之前的话可能没那么细啊,对,对吧,是吧。好了,那就本期视频全部内容啦,我是小刘,我们下期再见。

自从我 cloud code 被封了以后,我基本上就用 codex 作为我的主力了。最近 codex 出的这个多 agent 方式 我觉得还挺好的。你看现在我就让他有五个 agent 一 起在并行地开发。那你需要在提示词当中明确地告诉他,请用多 agent 的 方式去开发。 我觉得紫 a 证的可以这么去使用,比如说我现在要改一个产品的 landing page, 就是 它的首页,我告诉他说我要跟竞品拉开差距,然后你去调研一下竞品怎么设计的, reddit 上面去看一下用户的真实反馈,同时 你再去看一下我现在怎么设计的,那他就会给我创建三个子 a 阵的,分别做这三件事情。他把结果汇总之后,给我一个最终的结论,怎么去改,让他们各自并行的处理不同的任务,最后汇总在一块。


codex 跟 c c 到底哪个好?我想大家各自都有自己的判断。在我个人为二者都充了二百刀的 pro max 会员以后,我个人的体感是 二者的模型能力之间并没有本质的差异,甚至都足够惊艳,让人心喜。但它们其实代表了两种完全不同的人。与 ai 合作的费洛索费 本质上,我们不是选择两个工具,而是选择两种与 ai 交互的模式。你习惯使用哪种模式,你的工作场景是哪种模式,你就应该选择支持哪种哲学的普顶工具。通常来说,抽象的讲, 软件工程开发的模式可以粗略地分为两大类,首先一类是那些探索性不确定的 idea。 在这种场景下,我们自己可能对需求要做什么,最终的一个中态是什么,甚至过程中该如何实现,它都没有一个明确的定义,它更多是我们一个拍脑袋的灵机一动的想法。当我们解决这类问题时,我们期待的一个 partner, 无论是不是 ai, 它应该都要能 快速的与我们进行交互,通过一些他主动的提问甚至判断给我们更多的信息输入,通过一系列的沟通,最终确定出一个相对更结构化,信息密度更高的思维原型来指引我们后续的执行。 而另一种常见的工作模式则是一个更明确的需求,比如说产品已经给我们了相对明确的 p r d, 那 我们剩下要做的只是说把这个项目 真正转移为一个可以被执行的代码而已。对于绝大多数的研发而言,这种场景下想要做的事情是基本完全确定的,我们在此时要做的无非只是一些 dirty work, 把那个 p r d 转化为真正写出来可用的代码而已。 而结合我自己的使用经历来看, c c 更适用于前者者的工作模式。它会在你输出一些观点之后快速地给你响应,并且高频地向你发出提问,以确定它后续的一些方向执行思路。但 codex 则完全相反,它会在你给完需求以后, 非常认真且可靠地将你的需求描述执行完。这个过程会花很长的时间,但是 结果往往是令我们满意的。想要更明确的拆分这两种工作模式的分野,我们不如从三个维度上来进行拆分,首先是任务商,也就是目标的清晰程度以及约束条件的多少。其次则是以我们预期的交互结构, 我们到底期待着与其他 partner 是 同步的沟通,还是说是一些异步的沟通模式?另外则是一个人类所占主动性的比例, 我们到底期望 ai 占据多少责任?他们是只是执行任务,还是说给我们也有一些他自己的认识建议?其实这三者并非是一个非常正交的关系。一个很明显的结论是,如果一个 目标的本身并不清晰,只是我们拍出的粗糙 idea, 那 我们显然就需要我们的协作者能快速的发问,帮我们把 自己大脑中一些比较模糊的观念导出出来,并且通过一些沟通确定哪些思考是我们需要的,哪一些是可以被删除的。通过这种 快速的同步沟通,得出来一些更结构化的结果,那在这个流程中, ai 需要介入的部分以及引导的主动性就会占比更多,但如果这个需求本身就像我们之前讲的已经相对来说明晰,是一个低伤的场景,那我们就不太 需要。它是一个很同步,事无巨细都要向我们发问的流程,它完全可以在我们把事情说清楚之后,一步的完成这个工作,从而解放我们人类自己的时间。我们也不需要给他太多主动发挥的空间,他只需要忠实的执行我们给他的需求就可以。我觉着对未来工具的使用以及工作流的设计,也都是从这三个维度去进行判断,动 态的选择。我们到底适用于哪种工具,应该主要采用哪一种工作流的思路?如果要打一个比方的话, c c 更像是坐在你隔壁工位的好蜂蜜, 会在有了一些 idea 之后立马的打断你现在的所作所为,跟你去探讨它的一些碎片化想法。而 codex 则更像是一个你忠实可靠的下属,在你交代完任务需求以后,忠实的可靠的帮你把事情完整的办完再通知你。我已经做好了。 每个模型都有它们自己的性格,我们也可以顺应的这种性格,在不同的工作场景中选择不同的工具以及模型。 以上是二零二六年二月我对这两个投影工具的一些使用场景总结,但我相信这个领域是日新月异的,二者工具之间 大概率在未来也会发生一些融合。不会说一个工具只是一种工作流场景,那就需要我们未来本身人类自己有一些对需求使用场景的预判,从而能告诉模型它应该采用哪些工作流模式。软件工程永远没有银弹, 不可能说我们用着一种模式,一条道走到黑,就可以得到一个很完美的结果。如果你在错误的场景使用了错误的工作模式,那模型给你提供的支持也就会非常有限。 结合自己的需求,场景动态切换自己的工作流模式才是一个更高效率开发的必经之途。以上是本视频的全部内容,如果你有一些想法或者建议,期待评论区讨论,谢谢大家!

为什么我说现在就是你开始 vaping 的 最佳时机?因为现在开始的成本真的很低。 openai 的 创始人 sam ottoman 在 推向上宣布,他家旗下的 codex 能免费用了,而且免费的不是什么渣渣模型,而是 openai 最新的 gpt 五点三。 codex 速度更快,逻辑更强,完全不输隔壁添加了 cloud ops 四点六,那我已经深度使用一个月了,并且已经手搓上线了自己的产品。那么这期视频我们一起来学习一下如何正确使用 codex, 开启你的 web coding 旅程。 给还不了解 codex 的 同学简单介绍一下, codex 是 open ai 旗下的编程智能体,而隔壁 cloud code 是 同一种产品,有了 codex, 再加上 gpt 五点三的模型,就可以愉快的编程了。 一般人看到黑底白字的命令行界面估计就被劝退了。别担心, codex 不是 硬核的即刻工具,它有正儿八经的图形界面,官网下载、安装、登录一气呵成,没有什么要你做的复杂配置, 接下来的内容很关键,你要搞清楚两个概念,工作区和 thread 工作区。你可以理解为你的项目文件夹,比如你想做一个网站, 先建立好文件夹之后,所有的代码文件都会保存在这里。而 thread 就是 一个个的聊天窗,这些聊天窗就是 一个个的任务线。这里有个黄金法则,大家一定要记住,不同的任务要开不同的 thread, 千万别在一个窗口,一会让它改 bug, 一 会让它写新功能。另外你也不用傻,等任务完成,你可以同时开多个 thread, 同时处理多个任务,效率直接起飞。前段时间爆火的 skills 在 codex 里直接格式化了,内置了几十种的 skills, 鼠标点点就能安装了。这些 skills 能让你的 agent 如虎添翼,关键省去了繁琐的搜索和安装过程。 最后分享一点个人使用心得。上一个视频里我推荐了谷歌的 anti gravity, 其实这两个产品你可以一起用,把 codex 的 插件装在了 anti gravity 里面,这样你可以同 同时要用多个模型,比如让 g p t 五点三改 back, 让 jammer 做前端,让 cloud 出方案,不用切屏,不用复制粘贴,一个界面汇集世界上最好的三种模型帮你干活。这套 web coding 的 形态, 你值得拥有。以上就是本期视频的所有内容,欢迎关注艾伦,二零二六年,我会持续创作更多 web coding 和 ai 工作流的相关内容,我们下期再见。

好,这节我们继续来学习 codex 的 部署,那 codex 呢,提供了非常多的部署技能,那接下来呢,我给大家举一个很简单的例子,这是我开发了一个简单的静态元型图, 但这个元型图呢,我们现在只能在本地去访问它,如果我想分享给我的领导,或者分享给我的同事,对吧?我做出一个怎样的项目,他是看不到的,只能把我的电脑拿过去给他看,所以这个时候我们就要把它部署到线上去,对不对? 所以呢, codex 呢,也提供了对应的公开的技能,就是我们的 vsail 和 skills, 这个 skills, 那 我现在已经部署好了,给大家看一下,对吧?第一个是这个 vsail, vsail, 那 这个,呃,部署文件相当于哎,它这里面给你声明好了,我现在要部署这个脚本,该执行哪些文件,该执行哪些命令,它的作用就是这样子,就是相当于哎,可以帮助你去哎,告诉你如何部署,然后呢,你需要使用它的话,非常简单,按一个斜杠,然后选择这个 vsail, 选择这个 vsail 部署, 然后帮我部署一下,注意一定要切到你刚刚的项目上面去,对吧?然后部署完成之后呢,他会给你一个链接,我们点一下, ok, 看到他已经帮我们部署好了,对不对?这个链接现在是即使是领导也可以访问,并且他是 https 的, 也是安全的啊,也就是说现在不仅是你可以看到,你的同学都可以看到,当然呢,在国内也需要做一个转发啊,当然这种涉及的啊,讲解了好,我们再看另外一种方式啊,就是这个叫做 cloud flair 的, 这个方式也是一样的,我们需要用到一个叫做 cloud 这个 cloud file 桌面,对不对?然后我们点这个,这个也是一样的,它也是提供了一个一系列的文件,哎,它更像是一个什么应用,对不对?你看它帮你部署好了,我们点一下试试,点一下,哎,三二一,你看也可以访问了,那有小伙伴说了,我学习第一种 file 的 部署就可以了,那为什么还选第二种 cloud file 呢?对吧?我们用一个键就可以了。 首先你需要搞清楚一个点,程序员讲究的是一个,就是 back up, 比如说 cloud file, 对 不对? 这时候我们提供了这个链接呢,就有一个啊,随时随地的切换的一个备用的一个情况,对不对?其实一个访问不了,另外一个还可以访问。那我在讲其实 skills 这个东西啊,我觉得非常神奇,就如果说大家找不到什么是 skills 呢?我们就可以使用这个 find skills, 比如说我想找一个 ui 美化的,对不对?你就跟他说我要查找, 帮我找一个 ui 美化的 skills, 相当于有一类人已经把这个标准封装好了,我们就可以直接使用这一类 skills, 比如说我们这种比喻跟他说帮我查找一个 ui 美化的 skills, 我 就要直接用到我的项目当中 啊,这个时候呢,我们可以看到它这个泛的 skills, 它是作用的时候帮助我们查找这个 skills, 那 目前使用的人数是非常的多。那我知道了,下面去看的话都有啊,七八十万的一个使用量,大家可以自行去使用这个 skills 非常好用啊,就是它可以帮助你,相当于去帮你找什么样的 skills 适合你这个项目。那我刚刚跟他说,那我帮他找一个, 我让他帮我找一个 u i 美化的,他就会去帮我找 u i 美化的,并且呢,找到之后呢,我就可以直接让他帮我安装好这个 skills, 就是 完全一系列流程了,对不对?那顺便讲猜一嘴,就是这个地方 cloud 的 这个 codex 呢,他实际上 最近啊他又加了个新权限,就这个沙盒权限之前是默认和完全,现在补了个沙盒,就相当于,哎,你在你的这个呃 这个项目当中给你建一个啊保护,相当于,诶,你做一些危险的操作的时候,他会进,就在这个沙盒里面去执行,你看他会帮我去查,他会执行这个命令查 ui 的 赞,你看 ui 美化的是不是 ui 设计,是不是他会帮你查有没有对应的这个 skills, 诶?发现有是不是,那就直接帮你呃,安装一下,是不是,你看 帮我查,有非常非常多啊,因为我之前是安装了好几个,第一个是这个,呃,这个 skill 我 给大家看一下 这个 fr, 你 看是不是这是前端设计的,包括这个 ui 啊, pro max 我 之前讲过,是不是这些都是我之前安装的,但是你通过这个方法安装,你看它可以帮你找非常非常多,然后你给自己一个一个就是找到真正适合你的那一个 skills, 然后呢,大家可以发现没有,这个自动化最近其实也改了很多,你看官方提供给你的一些自动化的建议,就是说,哎,有哪一类人用的最多的自动化?我推荐你去用,比如第一个是状态报告,你看是不是他希望哎定时定点的给你生成一个报告,你可以直接使用他这个模板,是不是昨天的一个结果,你看是不是告诉你,哎,我是否可以去 根据昨天提到的 p r 或者文件,是不是还可以生成一个工作报告,这样可以每天看到你的工作是什么样的,对吧?包括可以帮你查 bug, 也可以帮你去做一些啊,一些 分字系的一些操作,你看是不是非常的分类非常清晰啊,相当于他也提供一些自动化的,你也可以选择创建自己的相当于一个周报,是吧?一般我用的最多的就是怎样呢?就是哎收集最近的 ai 信息,帮助你哎去汇总就最近的一些前沿的 ai 里面的信息,你看还是找到了,哎,找到了,是不是这个,你看官方提供了一个哎前端的是不是,你看 有二百一十三 k, 相当于哎有二十多万人在使用这个,这个 skill 是 不是这样子,对吧?所以呢, 大家可以非常方便的通过这个 find skill 去查,也可以非常方便的通过这个 versale 或者这个 cloud flair 的 这个部署的这个啊方式去帮助你把这东西呢给它推到线上去,而且是一种非常好的形式,大家可以去尝试一下。好吧,那本期视频全部内容呢?我是小刘,我们下期再见。

今天给大家分享两个项目,专门是用于武装你的 cloud code 和 codex, 它的作者都是一个人,都叫 o my cloud code 和 o my codex。 我 们直接看一下这个 cloud code, 因为 cloud code 它有个 type 模式,效果会比 codex 要好一点。虽然 codex 它的这个模型感觉会更聪明一点,但是 cloud code 它各种配置啊,还是要更好一点的。把这个装上之后,它的功能就会非常的强大, 首先它可以根据你的任务给出这样的一个配置啊,还是要更好一点的。把这个装上之后,它的功能就会非常的修复, 它大概是这样的一个流程,而且每个里面它都有这种团队成员角色,它一共是三十多个,它收集了三十多个,所以说它还是效果非常的好。然后它是可以去协调其他的一些 c i 的 命令,比如说 codex, 比如说 jimmy, 比如说你用一些思考,可以用 codex 这种计划的搭建,比如说像有一些是前端 的一些内容,其实就可以用 gemite, 然后实现的话可以用这 cloud code, 但是它综合都是用的 cloud code 来进行综合的,并且可以进行并行执行啊,因为 cloud code 的 team 模式它就是原生支持并行的,还有其他的一些 hock 啊。 这个分阶段的方式其实跟这个病型是一起的,它用 opus 的 模型,它自己会去判断各个任务之间是否有依赖,它一共有三十二个这种智能体,那我们看一下它是怎么样去安装啊?其实这些都不用管,你直接把这个项目直接给到 cloud code, 它就可以安装了, 然后都推荐大家可以去用这个 team 模式,因为我也是开源了一个专门去创建 team 角色团队的一个项目,叫 cctime creator, 我 认为它这个里面有非常值得借鉴的。首先第一个 他的这些团队成员可以借鉴,他的一些提示词可以借鉴下来。还有就是他的模型的智能路由,因为你必须要去测试了之后你才知道什么模型适合做什么样的一个角色项目。但是他里面也有一个坑了,他也是没有提到的,因为像现在的 cloud code, 他 一照上下文的是 o p s, 如果你授权 o p s 去做执行,他默认是继承的一照上下文,他的成本就很高,他要达到一照的时候,他才会去压缩上下文, 其实在三百 k, 五百 k, 它甚至跟 sonata 的 这种能力是差不多的,但是你要一直到一照上下文,所以说它的这个性价比极差,这也是一个比较大的坑。所以说我的这个项目都是默认 这几个角色都是默认的这个 sonata 的 模型,这也是有一定坑存在。再就是它的这个技能,它技能是可以沉淀下来的,自动的管理技能,自动的进行学习,而且它技能列表也是非常多,这个也可以进行一些借鉴。但是我认为它这个还是有一些欠缺的点在哪里呢?它是没有一个叫 持久化状态,或者说叫文件存储的,它是没有详细去说明它这些任务啊,这些派发的任务啊,进度啊,这些是保存在哪里的,所以说这个点也是它这里面不太好的,它没有借鉴这个 plan with fails 这个项目, 这个项目的话才能让这些智能体在压缩了上下文或者说重新启动的时候,它能继续之前的一个状态进行下一步的执行。 但是它这个就纯是在依赖 cloud code 的 一个能力了。不过整体来讲,它这个东西还是非常完整的,很多东西它都已经加上去了,之前非常火的这个持久进行执行的模式也加上去了,然后它的一个正规的工作流程的编排, 先要 plan, 再去按照这个 plan 做计划维护,再做修复。整个流程它是做的非常好的,但是它 codex 就 没有那么多 codex, 它基本上就不像 cloud code 的, 它是支持这个 p 模式的, 我也一直在找这个,有没有哦。一些框架可以把 codex 直接转化成类似于 tim 模式的方式,因为你起这种子智能体,其实你 token 消耗比 tim 模式还要高,因为其子智能体它都是一次性的, 那很多已经拿到的上下文下一个任务的时候,它其实是可以附用的,但是你起这种子智能体,它状态是没有保留下来的,所以说它做并行处理,做子智能体的时候,它的 token 消耗很恐怖, 而且很多时候他的上下文其实是不饱满的,所以说死神人体你只能把它当成一个工具来用,你没有办法把它当成这种角色,不同角色不同员工之间的这种协调,只有这个 cloud code 的 能去做这样一件事情。 ok, 最后也给大家推荐一下我这个开源项目, cctime quitter, 把这个装到这个 skills 里面, 你去跟他沟通,他自己去创建这几个角色,当然你让他创建其他角色也是一样的,其实他是学会的这样的几个原则。 比如说这个是后端的,这个是前端的,这个是研究调研的,这个是端到端测试的,这个是 review 的, 这个是管理所有东西的管理文档啊,管理这些代码有没有一些技术债啊?这种东西的。

大家好,我是一个看不懂代码,又喜欢使用 ai 编程工具来开发 ai 智能体的一个爱好者。现在扣代码时新增加的这个子代理并行开发的这个功能真的是用起来越来越爽。刚才我下达了这个任务,让他同时 使用子代理来并行任务,他同时创建了三个智能体进行分工,然后主智能体就去跑测试, 它使用自动化测试的 m c p 自动地在这个浏览器里面去创建任务来跑测试。我现在开发的是这个 ai 短距的一个自动帮你分镜,帮你生成提示词,就像 cds 二点零这个模型一样, 它会自动生成这个分镜,然后帮你生成每个分镜的提示词。你只需要复制提示词就可以用到这个模型里面去直接生成啊 c d 弹幕的视频。那目前我碰到的问题是,调用 ai 模型来生成提示词的时候,还存在一些 bug, a i。 就 根据我的需求,它自动创建几个并行的纸袋里,提高这个开发效率,还可以降低上下文的这个消耗。因为纸袋里它的上下文窗口是分开独立计算的, 它只把结果放到这个主 edge 的 这个上下文里面去,所以现在的开发真的是爆棚了,而且每个上下文窗口也变得越大,你看可以看到它在测试的时候它会发现问题,所以这个效果用起来真的是非常爽。

哈喽,大家好,我们现在来教大家去如何去安装和使用酷呆斯增强版。我们首先 拿到这个 get up 的 地址,我们会在评论区放出来,我们首先访问这个 get up 的 仓库,先进来首先点一个 star, 然后我们再看 安装方法。 mark linux wsl 的 话可以直接使用这一行命令,我们复制它,直接在终端粘贴就可以安装了。 windows 的 也是一样的,复制这一行命令,然后在你的终端 粘贴,然后就可以继续安装了。我们打开我们的终端,然后粘贴刚才的命令,我们直接回车等待它的安装。 安装话跟你的网速有关系,如果你的网速不够快的话,可能需要等一会, 不快,它安装好了,它默认的话会把你二进字文件安装在你的 logo 并目落下的。我们可以检查一下使用命令,我们检查一下它安装好了是不是 ok, 确定安装好之后,我们可以查看一下它的最新版本, 最新版本的话是一点二点零,默认的脚本安装就会安装最新版本到你的本地。 然后我们查看一下当前酷带 s 增强版具体有哪些新增的功能,比如 agent, teams, hux, 繁琐拎拎, ip agent 以及 webui。 我们可以先看一下路由 server 是 怎么实现的,可以看到路由 server 是 使用 httpss 去进行实现的,这样最大的优势呢就是, 呃,你启动多个 c 型只会占用一个进程,这样的话你的进程消耗就会非常少。我们直接使用路由 server 将微博 ui 启动起来。 cordless server 会随机启动一个端口和随机的托克密钥,你拿到这个端口和密钥呢?可以在本地启动一个内网穿透,这样你在外面就可以通过手机访问微博 ui 去进行远程的微博扩顶。 我们可以直接切换到移动界面去进行测试,先随机选择一个目录 发送嗨来进行测试。 ok, 我 们开始测试下一个功能,我们回到仓库地址,我们看一下 agent team 和 hux 以及奥斯突击 api agent, 我 们首先演示一下 agent team, 使 我们来到这个仓库,我们通过 code s 启动。然后怎么使用呢?首先第一步你需要在配置文件里面去启动多媒体的配置,我们 可以看一下在这个配置文件 copy 里面去将这个配置多媒体给它启动, 我们就可以开始那个尝试这个功能了。比如说我们 use agent teams 这样子告诉模型,告诉模型,比如说告诉了五点二, 我们需要需要启动 a 键的 team 来去做接下来的工作。比如说我们分析当前项目,就代表了我们使用 a 键的 team 来分析当前项目, ai 会分析任务难度来判断具体创建多少个 a 帧。 ok, 我 们看到它根据呃项目复杂度启动了五个 a 帧,五个分析帧 这个中括号括起来的这个就是我们的具体的一个执行 aint, 比如说是其中的五个分析的 aint, 然后来去并行的执行分析当前项目,它对于仓库结构 rooster 的 库的代码,然后 build c i 以及文档以及安全 sandbox, 然后去单独的 每一个单独的去进行分析。啊,这五个的话就是在并行的那五个都是同时创建,然后在并行的这里就会有一个等待所有的 a 帧,我们现在可以等他返回。 ok, 全部 a 帧已经返回了,五个 a 帧都已经执行完成,然后返回了他的一个结果,分析结果, 然后五个 a 帧的全部返回成功之后呢?慢 a 帧就会去收集五个 a 帧返回的内容,做一个汇总,然后再去判断当前的分析是否完成了,然后模型会自己去判断 是否还会需要继续的去进行分析,如果不需要的话,他就会直接返回结果,如果需要的,他还会去再次的创建 a 帧去进行分析。 ok, agent teams 全部结束,返回了最终的结果,这就是整个 agent teams 的 一个调用过程。

下班了吧,该学 ai 啦,各位观众老爷们下午好啊!今天我们来讲讲 codex 到底该怎么上手。 codex 支持 gpt 五点一到五点四的所有模型,并且允许各位观众老爷自定义推理强度,对于不同难度的任务可以随意调节推理强度,这样就不会浪费 token 啦。 codex 也可以更改权限,可以让 codex 完全接管电脑,但是各位观众老爷还是要慎重选择,注意信息安全保护哦! codex 内置了很多应用和技能,可以在应用页面直接添加,比如这个网页 app 的 应用,我们直接点击加号进行授权就可以直接使用了,非常方便。 除此以外, codex 也内置了像 kanva、 figa 这些设计应用,对于需要进行 ui 设计的观众老爷来讲也是较为便利。 skills 方面, codex 也有像 play ray 这类的内置 skills, 可以 自行配置,也支持通过第三方方式添加自定义 skills。 同时 codex 也支持自动化定时任务,比如这里小卡想让他每天审查我的代码有没有问题并给我汇报,就可以自定义一个任务让他来完成哦。 设置方面,值得一提的是, codex 允许用户修改模型运行速度这个地方,如果我们调成 fast 模式,模型就会以一点五倍速工作,但是同时要注意 token 的 消耗也是翻倍的哦。 实操方面,对于小白来讲,和小卡之前讲过的其他软件区别不大。我们打开计划模式,输入我们的想法,就可以让 codex 开始工作啦。依旧是会根据我们的需求提出几个问题,确定好执行计划,然后开始写代码就好了。 值得一提的是, codex 允许将所有代码在 cursor vs code 等软件中打开,打开后各位观众老爷想用其他的模型来继续工作也是完全没问题的。 那 cursor 和 codex 以及 cloud code 到底有什么区别呢?嘿嘿,我们下次再说。

三大 ai 编程助手横屏 codex、 cloud code、 jamaica, 他 们到底谁更强? 先看硬参数, codex 背后是 openai 的 gpt 五点二模型, soebench, 编程测试得分百分之七十,四点五,业界第一。 cloud code 基于 cloud opus, 四点六上下文窗口达到二十万 token, 代码理解深度行业领先。 gemini c u i 接入 google 搜索一百万 token, 超长上下文,多模态能力最强。 codex 刚刚完成重大升级,推理速度提升百分之四十,延迟大幅降低,还推出了独立的桌面应用,不再只是 co pilot 的 后端引擎。 最重磅的是加入了插件支持,开发者可以调用外部工具扩展能力。编程正在从一个辅助工具变成真正的自主 agent。 cloud code 走的是另一条路,它不追求速度最快,而是把代码质量做到极致。安全对其机制业界最佳,企业及合规场景表现最优, bug 少,逻辑严谨,特别适合代码审查和大型项目。贵是贵,但稳定性和安全性确实没对手。 杰曼纳 c l i 的 打法是免费加多模态,个人用户每天一千次免费请求,基本不用花钱。而且它原生支持图片、音频、代码一起理解,注示,文档、设计图全部搞定。如果你预算有限,或者需要处理大量非纯代码的内容,它是性价比最高的选择。 总结一下,追求编程机准第一,速度最快。选 code, 看中代码质量和企业安全。选 cloud code, 预算有限,需要多模态,选 gmail c l i。 但无论如何, ai 编程工具正在加速进化,从代码补全走向真正的自主编程,你准备好了吗?

零零后马龙一个视频讲明白三个编程 agent 的 体感区别, caller, cloud code code x 天天有人吹,到底有啥不一样?听完你比大部分程序员还门清。 caller 是 个图形化界面的 ui, 呈现的感觉是个代码编辑器,核心是后面的 ai 随便切。 cloud gpt gemini 写不好再换一个体感就像你坐在旁边的同事,脑子还是能换的那种。 另外两个登录官方账户之后只能用他们公司自己的模型,都是命令行在黑框打字,用法完全不同。可 outcode 像一把瑞士军刀,你指一个问题,他推理一下直接切进去去修, 能接工具,能派小弟分头干活快种狠。但是对代码的整体情况没有那么明白。 codex 风格相反,一个需求或者 bug 说出去,他先把整个项目看完一遍再去下手, 所以体感非常慢,等三十来分钟很正常,但是经常一次性成功改的全面说人话。 coser 是 编辑器, ai 脑子随便切。 cologad code 是 瑞士军刀,指哪打哪。 code x 是 解剖刀,慢,但是一个没漏。下次聊聊这三个月费怎么买最便宜?评论区说说你最喜欢哪个?

全球 ai 编程工具排行 number five co pilot 原生的编程助手核心竞争力在于生态整合与开发,全流程深度绑定,团队治理体系最为成熟。对企业和团队而言,它是 一个可以放心铺开、无需折腾的标准化工具,在平稳中创造持续的价值。 number four try 榜单中黑马气质最浓的产品, viewer 与 solo 模式,直击从需求到成品的核心诉求,擅长快速原型验证与丛林搭建。虽然生态沉淀尚不及前三款,但迭代速度与产品创新力使其成为不可忽视的强劲挑战者。 number three cursor ai 原生 ide 的 领军产品,将补全 agent、 诊断等能力有机整合,在 ide 内构建完整开发闭环,同时支持自由切换底层模型。它的价值不在于单模型能力的峰值, 而在于将 ai 无缝融入 ide 体验的综合实力。 number two codex openai 推出的全能型编程 agent, 能力分布均衡,从信息检测到最终交付,链条流畅,在复杂长任务中维持高水准输出。作为几乎没有明显短板的通用型 agent, codex 是 最稳妥的选择。 number one cloud code 终端原生的架构级编程 agent, 复杂重构与疑难问题定位能力突出,最接近高级工程师的思维方式,配合 em token 长上下文,足以应对最庞大的代码仓库,代表了当前 agent 型编程助手的最高水准。