hello, 大家好,今天呢,我们来说一下二月五号,也就是今天最新发布的这一个 g p t 五点三的 codex 版本, 嗯,据 openai 说呢,呃,这一代呢,比上一代是有了一个百分之二十五的一个速度的提升, 然后,呃,对于这种上下文的这种记忆也是更加的增强了,也是不会去遗忘。然后根据我今天的一天的使用下来呢,我发现确实是比这一个五点二的 codex 有 了一个很强的提升。然后我们可以先来看一下它这一个官网,你看, 根据它官网的一个测试数据啊,它与这一个五点二的 codex 以及五点二自身相比,它的这一个 output tokens 啊,是要更少啊,只要更少就能达到更高的精度,这样的话就说明我们可以完成更加复杂的任务。 然后包括这里的一个 accuracy, 它相比于前代也是增加了十几个百分点。然后包括这里是 openai 它官网给我们的应用,也就是说,嗯, 单凭这一个 codex, 它自己就能去实现这样一个游戏界面啊,就能实现这样的一个游戏界面的架构。然后啊,我们继续来看, 然后就是,嗯,除了 coding, 它还可以给我们去做这种,嗯,材料建议的这种 ppt 啊,嗯,这种 word 文档啊, 这种分析表格文档啊,还有 pdf 文档,它现在都是可以啊,非常容易地去进行去做,当然 在五点二版本也是能做的,但是五点二版本可能没有那做的那么好。嗯,我们继续来看,然后这是另外一个 os world 啊,他的这样的一个 accuracy 的 一个评评估,你看他是要比前代更是多了接近三十个百分点 啊,所以说啊,我们今天就是来简单的测试一下这个 gpt 嘛。嗯, 哦,还有一件事,就是说现在这一个 codex 版本,嗯,不同于网页版,它 codex 版本是一定要部署在我们电脑的这一个系统上的,因为它是要读取我们系统的文件,嗯, 所以说现在是只支持 mac os, 还有那个 linux os 啊,现在是不支持 windows 系统的,这是我要说的一点。然后我们今天要做的这样的一个测试呢,就是说,呃,你看,我现在已经是把这一个最新版的 codex 给安装好了,然后它这里的 model 这里也显示的是五点三 codex 啊,然后我用的这一个 reasoning, 我 用的是 extra high, 也就是用的它最高算力啊。 那么我们今天要做一个什么事呢?因为我事先呃已经是把这一个 codex 的 官方的一个呃 document 放到了我电脑的一个位置上啊,我是放在了我电脑的这个 document, 然后里面有一个 codex 文件夹,然后这个文件夹里就是我 codex 进行读写的一个主要的场所啊。 我们今天就是啊给 codex 一个指令,让它来读取我们文件夹里的一个 excel 表格,然后根据这个表格读取到内容去做一个 maclab 程序啊,去给它做一些数据统计, 然后把统计后的这个 maclab 程序再给返回到这个 codex 这样的一个文档里 啊,这是我们今天要它做的一个非常简单的任务,来看一看它的这种实时的读写能力,以及它的这样的一个读写速度,以及理解人类指令的这种能力相比于前代到底是进步了还是退步了? 那么我们还是首先要新建一个 excel 文件,你看我这里先打开一个 excel, 我 点击一个 new blank wordbook, 嗯,这里的话可以随便写嘛,比如说这里的话写个 number 啊,然后后面的话就写这个数值啊, value, 然后后面的话,比如说 number 的 话 啊,我给他一个编号嘛,从 a 一 开始一直到这一个 a 十吧,我给他十个数据,然后我们给他一个 value, 给他一个 value, 我 们首先先全部给他设置成二, 然后在有的地方给他啊,人为的改一下数,六,呃,八,对。然后 unit 话,比如说是毫米啊,这是两毫米,嗯,我们先给他全都弄成毫米, 然后这里我们用一个 play trick, 比如说这里我不用毫米了,我用一个米,然后这里的话就是对应的这样的一个零点零零二米, 对吧?这还是两毫米嘛?我们就要看现在的这一个五点三的 codex 能不能反映出来它是一个两毫米,而不是就是说占前不顾后这种感觉,是吧?然后我们就今天就让它去 输出一个频率图吧,比如说这个表里二出现了多少次啊?四出现了多少次啊?六出现多少次?八出现了多少次啊?然后还要求他进行一个小小的一个转换,然后我们也不给他太多的一个指令,我们直接来到这一个,呃,我们保存一下, 保存的话就是保存 document codex, 好, 然后它的名字就叫做 book one 吧,给他一个 book one, 好, 现在是保存到我们的电脑里了,你看这里就是我们的 book one, 然后回到我们的 codex, 我 们就给他去施加这样的一个指令,稍等,我换一下这个书法 啊,那么我们就让他啊, please 啊,去读一下我们的 book one 吧。啊,在我们的这个默认文件夹里, 我们这里当然也不告诉他默认文件夹是哪一个啊,让他自己去寻找。然后呢,给我们生成一个 maclab code 啊,这个扣子呢,去 plot 啊,一个 histogram 啊,就是我们的柱状图啊,数据的柱状图,然后我们也不告诉他是什么样的柱状图,一般来说的话,我们就默认是这种直方的频率图嘛, 好,那我们就发送给他。好,然后大家来啊,等一下,看一看他到底要思考多久。然后啊,首先你看他开始 low key 这个 book one 了, low key book one, 你 看,哎,大约五秒后,他就发现了这个 book one 这个 excel 文件,然后开始这一个读取这个文件 速度还是要比呃,前几代是要快的,你看,它已经 pass 不 换啊,已经 identify 这些 numer, numeric field, 还有这一个 unit, 你 看 好,你看,已经是生成完毕了,总共用时四十秒,它就已经生成了这样的一个 matlab code 啊,生成了这样的一个 matlab code, 这个 code 的 名字叫做 plotbook one histogram, 我 们可以回来看一下。哎,你看,就在这里生成了, 对吧,就在这里生成了,因为这个扣子呢,也是呃,不大的,所以说也是很简单,那么我们在这里运行一下。 哎,你看,我们这边出了一个错, error using unable to final open 啊,这里的话,是我们的这一个 maclab 的 问题,我来给它改一下这样的一个文件,稍等一下, 好,这里的话,你看,我就自动的去生成了这样的一个 figure, 呃,二的话它是出现了六次,三四六八各出现了一次,那么我们回到我们刚才啊,输入了这个表格, 你看二一次,两次,三次,呃,四次,五次,六次啊,然后三四六八各出现了一次,对吧? 所以说啊,这一个读取还是没有问题的。然后这样的话,比如说,比如说我现在把这个八改成二,我们保存一下, 然后再给这一个,呃, codex 啊,给他一个指令,比如说, now, 呃, we've changed book one sheet can you regenerate a code for me。 然后我们继续来看它这一次要思考多久, 这一次应该是要比上一次我估计是要更快一些的。好, 那我们拭目以待呗。你看, i've regenerated the script, ok, 三十三秒搞定。三十三秒搞定的话,你看,呃,是这样的一个文件,这样的一个文件, 这样一个文件的话,你看他在这里可能就是已经做了更改了,那我们不知道,我们重新去打开一下这个文件,我们给他取消一下,然后重新跑一下。 哎,你看这一次二的频率就变成了七了,然后原来的八就不见了,说明我们的 my lab code 已经被它改过了。你看这是原先两个不同的一个脂肪图, 所以说我们通过这样的一个小例子啊,我们就可以看到现在的 codex 五点三啊,功能还是比较完善,性能也是比较强劲。好,那我们今天就测试到这,好,再见。
粉丝620获赞1.3万

为什么我说现在就是你开始 vaping 的 最佳时机?因为现在开始的成本真的很低。 openai 的 创始人 sam ottoman 在 推向上宣布,他家旗下的 codex 能免费用了,而且免费的不是什么渣渣模型,而是 openai 最新的 gpt 五点三。 codex 速度更快,逻辑更强,完全不输隔壁添加了 cloud ops 四点六,那我已经深度使用一个月了,并且已经手搓上线了自己的产品。那么这期视频我们一起来学习一下如何正确使用 codex, 开启你的 web coding 旅程。 给还不了解 codex 的 同学简单介绍一下, codex 是 open ai 旗下的编程智能体,而隔壁 cloud code 是 同一种产品,有了 codex, 再加上 gpt 五点三的模型,就可以愉快的编程了。 一般人看到黑底白字的命令行界面估计就被劝退了。别担心, codex 不是 硬核的即刻工具,它有正儿八经的图形界面,官网下载、安装、登录一气呵成,没有什么要你做的复杂配置, 接下来的内容很关键,你要搞清楚两个概念,工作区和 thread 工作区。你可以理解为你的项目文件夹,比如你想做一个网站, 先建立好文件夹之后,所有的代码文件都会保存在这里。而 thread 就是 一个个的聊天窗,这些聊天窗就是 一个个的任务线。这里有个黄金法则,大家一定要记住,不同的任务要开不同的 thread, 千万别在一个窗口,一会让它改 bug, 一 会让它写新功能。另外你也不用傻,等任务完成,你可以同时开多个 thread, 同时处理多个任务,效率直接起飞。前段时间爆火的 skills 在 codex 里直接格式化了,内置了几十种的 skills, 鼠标点点就能安装了。这些 skills 能让你的 agent 如虎添翼,关键省去了繁琐的搜索和安装过程。 最后分享一点个人使用心得。上一个视频里我推荐了谷歌的 anti gravity, 其实这两个产品你可以一起用,把 codex 的 插件装在了 anti gravity 里面,这样你可以同 同时要用多个模型,比如让 g p t 五点三改 back, 让 jammer 做前端,让 cloud 出方案,不用切屏,不用复制粘贴,一个界面汇集世界上最好的三种模型帮你干活。这套 web coding 的 形态, 你值得拥有。以上就是本期视频的所有内容,欢迎关注艾伦,二零二六年,我会持续创作更多 web coding 和 ai 工作流的相关内容,我们下期再见。

openai 刚刚发布了 codex 桌面板,它的核心功能有三点,第一,你可以同时开好几个 ai 代理,让它们分别写功能,修 bug, 跑脚本,互不打架。第二,每个任务会产出清晰的改动,你能直接看修改痕迹,再决定要不要合进去。第三,有些活不用盯着等, 它可以自己跑很久,你回来再收结果。所以 codex 桌面板让你从自己写每一行变成派活家验收,更像带着一对 ai 打工人做开发。

刚刚 openai 把 codex 做成了一个独立的桌面应用,还搞了个限时活动,不仅免费用户和购订阅都可以使用,而且付费用户的额度翻倍。左侧可以添加多个仓库, 直观明了管理多个仓库,允许同时开启多个现成,给 agent 安排不同任务。设置了专门的界面来创建和管理 skills, 内置二十余款 skills, 可以 非常方便地统一管理。官方还搞了个很夸张的演示, 让 codex 使用 skill 做了一个三 d 赛车游戏,整个过程消耗了超过七百万 token, 只用了一条出使 prompt 还内置了 automations 自动化功能,让 codex 按时在后台自动跑任务,比如找 bug、 生成周报等等。还内置了 work trees, 多个 agent 可以 在同一个仓库上同时工作而不发生冲突。不仅提高效率, wipe coding 的 门槛也大大降低了。

兄弟们,酷的是,增强版现在太猛了,一次性启动九个镜头来进行更新,快来用起来,快来用起来。

大家好呀,今天我一定要向大家安利一下 codex 的 automation 这个功能,对它是一个非常省心的点,这个自动化怎么跑?我就用了它自己内置的一个 summarize git 这么一个功能来做一个演示,我们一起来看一下吧。先说时间,我设定的呢是每天九点钟,只要我的 codex 的 app 是 在运行的状态,它就会自己去手动跑,不需要你触发 这个时间你是可以自己去设定的,你可以设定的是每天定时或者是二十四小时轮动啊。第二点,当它自动化在开始跑的时候,它会自己去创建一个独立的 walk tree 啊,它是在一个工作区里面去跑,会影响你手上的开发,这是第二点。 那第三点呢?它输出的结果就会进到一个 inbox 里面,类似于一个邮件箱啊,只要它完成了之后,它就会发给你,如果说有变化,就会有一个通知你,你就可以去点开查看,那如果说没有变化,它就会自动归档了。 第四点,就是它的整一个自动化的内容,你是可以通过 prompt 去控制的,这个 prompt 你 可以去引用你的 skill, 比如说我想让它的自动化的内容以一个 word 方式或者 excel 的 方式输出,那我就可以去调用这个 excel 的 skill, 只要你说清楚啊,它是完全可以遵照这个 prompt 去进行一个执行的。 对,这个是第四点,那第五点呢?就是他的一个权限是完全遵照你全局杀香的一个设置的,如果你自己设置的是止毒,那么这个自动化一定也是止毒,完全是由你来控制的,当你觉得整个自动化的流程它是安全的,你再进行一个权限的放开, 我觉得这个这个自动化的功能是非常有效的,你可以用它给你内置的一些模板去测试,或者是说你自己来进行一个创建。当然现在只支持苹果的用户,安卓的用户可能还需要再等一等。那么你今天自动化了吗?快去用起来吧,记得一键三连哦,拜拜。

codex 跟 c c 到底哪个好?我想大家各自都有自己的判断。在我个人为二者都充了二百刀的 pro max 会员以后,我个人的体感是 二者的模型能力之间并没有本质的差异,甚至都足够惊艳,让人心喜。但它们其实代表了两种完全不同的人。与 ai 合作的费洛索费 本质上,我们不是选择两个工具,而是选择两种与 ai 交互的模式。你习惯使用哪种模式,你的工作场景是哪种模式,你就应该选择支持哪种哲学的普顶工具。通常来说,抽象的讲, 软件工程开发的模式可以粗略地分为两大类,首先一类是那些探索性不确定的 idea。 在这种场景下,我们自己可能对需求要做什么,最终的一个中态是什么,甚至过程中该如何实现,它都没有一个明确的定义,它更多是我们一个拍脑袋的灵机一动的想法。当我们解决这类问题时,我们期待的一个 partner, 无论是不是 ai, 它应该都要能 快速的与我们进行交互,通过一些他主动的提问甚至判断给我们更多的信息输入,通过一系列的沟通,最终确定出一个相对更结构化,信息密度更高的思维原型来指引我们后续的执行。 而另一种常见的工作模式则是一个更明确的需求,比如说产品已经给我们了相对明确的 p r d, 那 我们剩下要做的只是说把这个项目 真正转移为一个可以被执行的代码而已。对于绝大多数的研发而言,这种场景下想要做的事情是基本完全确定的,我们在此时要做的无非只是一些 dirty work, 把那个 p r d 转化为真正写出来可用的代码而已。 而结合我自己的使用经历来看, c c 更适用于前者者的工作模式。它会在你输出一些观点之后快速地给你响应,并且高频地向你发出提问,以确定它后续的一些方向执行思路。但 codex 则完全相反,它会在你给完需求以后, 非常认真且可靠地将你的需求描述执行完。这个过程会花很长的时间,但是 结果往往是令我们满意的。想要更明确的拆分这两种工作模式的分野,我们不如从三个维度上来进行拆分,首先是任务商,也就是目标的清晰程度以及约束条件的多少。其次则是以我们预期的交互结构, 我们到底期待着与其他 partner 是 同步的沟通,还是说是一些异步的沟通模式?另外则是一个人类所占主动性的比例, 我们到底期望 ai 占据多少责任?他们是只是执行任务,还是说给我们也有一些他自己的认识建议?其实这三者并非是一个非常正交的关系。一个很明显的结论是,如果一个 目标的本身并不清晰,只是我们拍出的粗糙 idea, 那 我们显然就需要我们的协作者能快速的发问,帮我们把 自己大脑中一些比较模糊的观念导出出来,并且通过一些沟通确定哪些思考是我们需要的,哪一些是可以被删除的。通过这种 快速的同步沟通,得出来一些更结构化的结果,那在这个流程中, ai 需要介入的部分以及引导的主动性就会占比更多,但如果这个需求本身就像我们之前讲的已经相对来说明晰,是一个低伤的场景,那我们就不太 需要。它是一个很同步,事无巨细都要向我们发问的流程,它完全可以在我们把事情说清楚之后,一步的完成这个工作,从而解放我们人类自己的时间。我们也不需要给他太多主动发挥的空间,他只需要忠实的执行我们给他的需求就可以。我觉着对未来工具的使用以及工作流的设计,也都是从这三个维度去进行判断,动 态的选择。我们到底适用于哪种工具,应该主要采用哪一种工作流的思路?如果要打一个比方的话, c c 更像是坐在你隔壁工位的好蜂蜜, 会在有了一些 idea 之后立马的打断你现在的所作所为,跟你去探讨它的一些碎片化想法。而 codex 则更像是一个你忠实可靠的下属,在你交代完任务需求以后,忠实的可靠的帮你把事情完整的办完再通知你。我已经做好了。 每个模型都有它们自己的性格,我们也可以顺应的这种性格,在不同的工作场景中选择不同的工具以及模型。 以上是二零二六年二月我对这两个投影工具的一些使用场景总结,但我相信这个领域是日新月异的,二者工具之间 大概率在未来也会发生一些融合。不会说一个工具只是一种工作流场景,那就需要我们未来本身人类自己有一些对需求使用场景的预判,从而能告诉模型它应该采用哪些工作流模式。软件工程永远没有银弹, 不可能说我们用着一种模式,一条道走到黑,就可以得到一个很完美的结果。如果你在错误的场景使用了错误的工作模式,那模型给你提供的支持也就会非常有限。 结合自己的需求,场景动态切换自己的工作流模式才是一个更高效率开发的必经之途。以上是本视频的全部内容,如果你有一些想法或者建议,期待评论区讨论,谢谢大家!

codex 原声版来了, windows 开发者告别复杂配置,那个时代结束了,那么这次的原声版到底强在哪呢?首先,它不是简单的套壳,这是一个为 windows 全新设计的底层架构,核心就是速度和安全。 以前的网页插件设置麻烦,性能也总感觉差点意思,现在完全不一样了。它是个真正的原声应用,在独立的沙盒里运行,跟系统深度集成。这意味着什么呢? 简单说,这个沙盒就像一个给 codex 准备的专属空间,它在里面怎么运行都不会影响你的系统,既保证了速度,又保证了安全。 而原生性的关键就是它直接在 pro shell 上跑,这就意味着它能调用最底层的 windows 系统能力,性能自然是原汁原味的。好的架构最终还是为了提升效率。我们来看看它具体怎么改变你的开发工作哟, 你是不是也烦了?同时开好几个项目窗口,来回切换,思路总被打断。现在好了,一个界面就能管理你所有的项目,再也不用痛苦地切换上下文了。实现这个的关键就是工作树, 它能让一个项目里同时开好几个互不干扰的任务空间。想象一下,这边的工作树专心修一个紧急 bug, 另一边的工作树同时开发一个新功能, 逻辑清楚,互不干扰。还有一个亮点是自动化,你在专心写核心代码的时候, codex 已经在后台默默帮你搞定代码格式化、写文档这些杂我了,让你能真正专注。 除了工作流, codex 还带来了一整套专为 windows 开发者打造的生态工具,比如能不断扩展的记忆能库,专门给桌面开发用的 winui 技能,甚至能一键切换终端,可以说每个功能都非常懂。 windows 开发者 特别要说说这个 win u i 技能,如果你开发 windows 桌面应用,这个功能简直就是为你量身定制的。 当然,如果你习惯用 linux 环境也完全没问题,它的编码代理和终端可以一键切换到 wsl, 无缝衔接你的工作习惯。说了这么多,肯定想问这么好的工具怎么拿到?非常简单,直接去微软商店或者官网下载,然后用你的账户或者 api 密钥登录就行。 最方便的一点是,你不需要重新注册你手头现有的 chad gpt 账号或者 api 秘诀,直接就能用,没有任何门槛。所以总结成一句话就是,入门的门槛更低了,但效率的天花板却更高了。对所有 windows 开发者来说,一个全新的时代可能真的来了。

g p t 五点四还是不如 office 四点六? codex 它真的是量大管饱,我每次问他,他都说已经完成了百分之九十三到九十五了,但是最后这三个比拼多多还难砍。 codex 它本身并没有按照我最开始那长文规划的去给我产出内容, 从 readme 上可以看出来。而 office 呢,它明显对我的人话理解的更加精准,它知道我在说什么。而且经过我过去的经验呢,它的产出也非常符合你一开始的计划。 过去了一个星期的时间,我每天晚上回来的时候会不停的坐在 codex 前面点 ok ok, 让它继续继续。虽然目前为止我还没有真正的看到这个 app 的 样子,就从九十天上面就可以看得出它已经偏航了。

哈喽哈喽,大家好,这里是不孤,最近呢我是赚到了急诊科,那急诊大家都懂,实在是太忙了,所以也没有怎么更新视频。 最近养小龙虾特别火,但是网上对于小龙虾它还是一个褒贬不一的状态啊,尤其是对于我们这些信息基础不太好的同学,那么去部署一个 open log 呢,还是相当费劲的一个工作。 那么我前两天在网上看到这个 openai, 它的 codex 推出了官方的 windows 版本,然后现在在这个 microsoft 的 商店里面就可以直接下载,所以我也是尝试下载使用了一下, 那么也是有一个呃非常好的体验感吧,所以跟大家出一条视频来分享一下。那么我们直接在这里把它下载部署到本地之后呢, 就可以开始使用了,打开之后可以看到一个这样的页面,其实类似于这个 chat gpt 的 一个网页版,那么 但是它和网页版的不同在于,它是可以直接去在你的电脑本地调用程序查看文件,以及部署一些新的构建一些新的文件的。比如说我用一个最简单的事例,你直接告诉他去给你构建一个贪吃蛇的小游戏, 那么他就会在这块运行一些指令,那运行完了以后呢,他你可以看到他就在你的本地计算机上给你成功的生成了一个这个贪吃蛇的一个小游戏,那么我们打开这个文件夹以后呢,也是可以看到直接就是这个小程序,哎, 那么我们运行小程序以后呢,就可以看到一个可以操控的版本的贪吃蛇的一个小游戏了, 那么对于我们医学生来说呢,其实编程用的不是特别多,大家更想尝试去做的场景其实是深信分析。那么目前如果我们用网页端去做一些流程的话,想让他帮你去总结或者是输出一些新的脚本,你需要给他上传文件,那么这是十分困难的。 但是呢如果说你用这个 codex 的 话呢,他可以直接访问你本地的这些文件,你可以让他去帮你去做一些这种总 或者是编辑类的工作。那这也是我让他去总结了我最近在做的一个项目,那可以看到他查找查看了我这个文件夹里面的所有的这个项目文件,然后最终呢概括成了一个这个 对于我项目的一个非常详细的一个总结。那么这一点呢,我觉得是,呃,对于我们这个医学生来说是一个非常非常实用的一个功能,那么大家也可以去尝试一下,看看有没有能发现一些好玩的东西。

hello, 大家好,我是温特妙,我们来体验一下 openai 刚刚发布的 gpt 五点四,它的一个全新的功能啊, computer use, 我 们来看一下它的一个官方网址。啊啊 啊,在通过 codex app 或者是 api 的 话呢, gbt 五点四它是支持原声操控电脑的这个能力的,并且它是 openai 的 首个支持这个能力的一个通用大模型。 比如说它是可以呃,通过打通过就是打开其他的 app 来执行一系列的啊,复杂的一个工作流。比方说它可以帮我们打开, 打开微信 app, 帮我们来回复微信消息,帮我们来那个整理微信消息啊,比如说它也可以打开可用浏览器啊,比如说 打开一个玩游戏的页面,帮我们来玩这个游戏啊,他也可以帮我们比方说,呃,打开我的一个 b 站页面,来帮我回复用户的私信和那个评论。 然后他还可以啊,就是打开一个网站,比如说打开 pinterest 的 网站,按照我的一个要求,帮我来找找我需要的一个图片。 ok, 那 我们直接上手体验一下吧。哦,还有一个,还有一个升级啊,很大的一个升级,他的一个上下文从那个四百 k 升级到了 em 啊,也就是说他的一个上下文能力是之前的一个二点五倍。 好,那我们现在就直接来体验一下啊,我们直接创建一个空的文件夹啊,给大家看一下,我在这里创建了一个可用 sof 文件夹啊,我先把这些之前的内容删掉啊,创建一个空的一个文件夹就可以了,然后通过这个 ai 的 啊添加新项目,把这个文件夹添加进来,添加进来之后呢,在这里面直接和他聊天就可以了啊,比方说我,嗯,跟他说啊,帮我打开可用浏览器访问聘锤斯特网站 啊,搜索猫咪的一个图片啊,然后帮我,嗯,挑选一张好看的图片保存在当前文件夹啊,我这个需求没有准备啊,比较含糊。 嗯,我检查一下, ok 直接发给他啊,比较含糊,没没没有,就是说让他给我挑选一个嗯,什么风格的图片啊?但是呢,因为 我把这个这个打开啊,但是因为它是通过浏览器打开的啊,就是 pinterest 的 对吧? pinterest 的 这上面我已经登录了的,所以的话其实它打开的这些图片都是和我的偏好是很一致的 啊。然后如果大家第一次使用这个功能的话呢?嗯, 他是他是这样的,给大家讲一下,第一次使用这个功能的话呢,他会要求一系列的一个权限啊,你把权限全部给他就可以了啊。然后你这个模型的话呢,你必须要选嗯, gbt 五点四啊,或者最新的模型也都是可以的啊,因为 gbt 五点四是第一个 首次支持啊, computer 柚子的这个 open ai 家的一个大模型啊。 然后这边的话呢,还可以选择速度,速度的话呢,选 fast 的 会更加快啊。 ok, 他 在帮我来找图片,帮我保存啊。然后,嗯,还有一个地方要注意啊,就是如果大家第一次用的话啊,比如说我现在是 让它打开 core 浏览器来帮我做一些任务啊,对吧?它里面会涉及到一个脚本,脚本的一个使用,脚本的一个使用的话呢,我把这这个这个放到这边啊啊,涉及到 ok, 他 又问我要权限啊? ok, 给他啊,涉及到脚本的一个使用的话呢,他需要还需要在 chrome 浏览器的一个上面的一个菜单栏里面啊,在这个显示页面 开发者,对吧?这里把这个也勾上允许 apple 事件中的 javascript 啊,就是说允许, 呃,允许 code x 在 浏览器里面来执行这个脚本指令啊,这样的话它的一个任务会完成得更加顺利一点。 ok 啊,等他来操作啊,因为因为还因为他这还是第一个版本吧啊,所以的话呢是有点慢,执行速度是有点慢的啊,他已经拿到了一个原图地址了啊,然后他你看他用过用这个刻指令来 把这个图片保存到我们当前的一个文件夹啊。 啊,正在执行啊,其实它就是通过一系列的脚本来完成这些。呃,电脑操作的啊,所以它的一个通用性是很强的,就是说它是支持所有的一个 app 的 啊,像有些 app 比如说微信 app 啊,微信 app 不 可能去开放这些 api 给他的。那他是怎么做到的呢?他是通过一个打开微信 app, 然后他去截一张图,截图之后他会来定位到他所需要的一个功能区域,然后再模拟鼠标点击去实现对应的一个事件。 ok, 已经处理好了啊,他给我保存了一个这张图片啊,那我们再来看一下他的一个其他的能力啊。嗯,比如说 我想让他来帮我回复 b 站的一个评论啊啊,然后这个这个的话呢,我为了方便,我不希望我每次都告都给他讲一堆东西,所以的话呢,我一开始我就告诉他, 我让他来帮我创建 agent 点 m d 文件啊,因为 code x 在 执行任务的时候,每次他都会来读这个文件的啊,这样的话,我一些重复的话我就不用给他说了。我告诉他 啊,这是我的 bilibili 啊,我告诉他啊,帮我打理 bilibili 用户的一个回复与私信,然后这是用户的一个回复页面啊,把这链接给他啊,防止他不知道在哪里。因为他是一个通用的一个大模型吗?他需要处理的信息太多了,太广泛了啊,他可能不一定 知道这个回复页在哪里啊,并且如果,如果他不知道的话,他去找的话会费很多功夫,所以我直接给他 啊, ok。 然后呢,我又让他完善了一下,我让他每条回复啊,让他更新一下 id 字母 d, 每条回复要带上尾缀拜扣的 x app gpt 五点四啊,这样的话,用户收到这个回复的时候,知道这条回复不是我发的, 然后每条回复呢,要写到日记里面去啊,这样的话呢,嗯,就更加他做的什么事情我都知道啊。然后他给我更新了,更新好了之后是这样子的啊,这样子的,其实我也没有看,我也没有看,你看工作方式,他给我讲讲好了啊, 他已经默认我已经登录好了的,他默认我已经登录好了的。然后呢,回复的一个原则,他也写好了,我想改的话,我在这里改也可以啊,但是呢,我没有做任何修改。 然后呢,比如说涉及到垃圾信息的话呢,他要先征得我的同意再回复啊,包括这些什么一些邀约啊,一些乱七八糟的东西啊,都都得这样子。 ok, 那 那那现在的话我就可以让他来执行任务了啊,比方说我, 我让他来执行,帮我回复最新的评论啊,打给他把这个小窗打开,这样我我们大家可以来看他是怎么怎么怎么操作的 啊,你看他直接用我给他的链接打开了,打开了,他来看第一条评论是哪一条啊?他先来确认一下, ok 啊,他已经,嗯他,他说然后啊,因为这个评论我已经回复过了啊,我之前让他执行过一次啊,所以的话,你看他还很聪明,他说 这个评论他已经回复过了的。日记记录在这里啊,我们来看一下看一下这个日记啊,日记的话其实在这里啊在这里啊,本人是 u x 设计师,然后您代码基础想学习 web coding 啊,这些可以学习吗?然后 他给我的回复就不是我自己的回复,他说可以学啊,并且你有这个 u x 背景是很有优势的啊,这这么一些 东西啊。啊,那那那我们再,再来继续啊,再来继续,来给大家看一下他的一个玩游戏的一个能力。 code x 啊,玩游戏的一个能力啊。 ok, 我 们还是继续用用这个画好了啊,直接新开一个回话啊,在这里帮我玩一下可用打开的扫雷游戏啊。我,我现在打开的是一个扫雷游戏,我让他帮我玩一下 啊,同样,我为了方便大家观看的话呢,我还是把这个拖到这边来啊,把这拖小一点好了。这样子啊,这是一个扫雷游戏, 看一下它啊,它现在的话呢,它处理这些任务是很慢的,因为因为这是它的第一个正式支持 computer use 的 一个版本嘛,它的速度是很慢的, 但是呢,我觉得就是以这个状态发展下去的话,到下一个版本那我感觉他都可以去做那个,他都可以去代练了啊,就就比方说我们开很多个页面,对吧?让他帮我们在游戏里面来打金币, ok, 然后呢,其实我我我觉得可以这样子,就是每次他成功帮我们执行好一个任务之后呢,我们让他帮我们更新一下 啊,或者如果像我这个项目我都没有创建一些 md 啊,这玩游戏的项目,你可以让他创建一下 md, 帮他更帮你更新一下,这样的话呢,他下次就会少踩很多坑,不然的话你看他在, 他在他的脚本在一个一个执行啊,他执行了很多脚本,他都是尝试性的去实现这个任务,他得他可能得从一百种方式里面 找到一种合适的方式才行啊。但是你更新了 index dm 低了之后呢?后续的话他直接就拿他的成功的方式放在最前面啊,他可能一直接拿第一种方式一试就成功了就可以了。 你看页面变量隔离比预想的要严格。他还他还讲出来这个任务啊,他遇到了什么问题啊,他要怎么解决,都是完完整整的在这个思考过程中说出来的。 ok, 然后然后等一下的话呢,我还让他帮我来回复一下微信消息啊 啊,他要确定一下当前的一个盘是不是新开的,到底是已经玩到一半了还是新开的,如果是玩到一半了,可能他再要看一下当前的一个局势啊,当然我这个盘是新开的, 你看他执行了各种脚本文件啊,其实大部分脚本文件都是都是,都只是一个试错。 嗯,等他,等他完成, ok 啊,他终于理清了终于理清了啊,已经在扫雷了, 读取展开后的局面开始解啊,又在开始解这个,解这个雷了 啊。其实好像,好像,我如果把它变成超高的话,像还快一点啊变成超高好像快一点。为什么呢?因为它的一个思维更会更加神秘一点啊,它解决问题会快一点,只是回复变得慢一点而已。 嗯,你看他通过他不需要做图像识别了,他直接瞬间给你打出来,因为他之前他在尝试用图像识别来解这个问题,但是实际上的话呢,因为我们打开的是网页嘛,他可以直接通过 就是读源码的方式,因为网页它是可以,对吧?在 chromium 里里面,你是可以通过检查通过 f 十二检查来获取网站的一个源码的啊,所以它已经直接报文完成了。 ok, 我 不用开下一局了啊,我,我可以再让他帮我玩一下飞机大战啊, 帮我继续玩飞机大战这个游戏 发送, 然后我,嗯,我好像不能多操啊,这里有一个问题不能多操,因为他他他要打开对应的一个页面啊,所以的话,如果我让他这会帮我回复微信消息的话呢,可能不是很方便, 但是可以给大家看一下啊给大家看一下啊,微信消息啊,回复微信消息。我也是新建了一个 index html 的, 但是我说的非常简单,我直接让他帮我创建 index html 文件用于回信微回复微信 app 啊,他就已经创建好了对吧创建好了之后呢我同样让他就是每条回复都带上尾缀啊,并且啊写上日期啊对吧然后嗯你看 啊帮我回。那他这样这样子啊写了啊 ok 完成了 action dm d 了之后呢我让他帮我回复啊回复的话呢其实是已经回复成功了的啊我我重新开个绘画框。 嗯那我这边玩游戏的把它停掉好了啊停掉 帮我打开微信 app 然后定位到第一条绘画框啊然后回复里面的消息 啊用高算了啊因为这个东西应该主要是涉及到一个图像识别 发送吧啊发送把这窗弹出来啊。因为 啊 ok 他 在思考啊然后他要处理微信消息和处处理核核循消息还不一样啊。因为因为处理核循消息的话他是通 啊他打开了处理核循消息的话呢他是可以通过脚本通过那个读取网页的一个原码来执行一些任务的但是呢他要去 操作微信消息的话呢他有一个问题啊微信是不可能开放这些 a p i 的 微信 app 的 话对吧?那他只能去通过一个图像识别啊,通通过图像识别的一个 窗口。哦哦等一下等一下停止一下啊停止一下有个坑啊。因为因为我现在在录视频我是我是有打开了多个窗口的啊我我我是有多个 屏幕所所以的话呢他他默认打开的屏幕是在第二块屏幕啊对对对,他帮我挪过去了啊我重新给他说啊。嗯微 微信 app 的 话就在当前屏幕处里啊不要挪到其他的屏幕去 啊。因为我这个是特殊情况所以我给他解释一下啊。 ok, 那 不然的话,他给我挪到了另外一块屏幕,我录视频的话,大家就看不到了。为了方便演示一下, 你看啊,他的话,他的执行操作会非常慢啊,因为他打开了之后呢,他得通过 截图的一个方式,他得通过截图的方式来获取当前屏幕的一个信息。 然后呢,他截完图之后呢,他又得通过 ocr 文字识别啊,来识别对应的一个文字来定位到对话框啊,包括包括如果你让他在指定的群里面回复也是可以的,指定的群里面,他可能会定位到这个搜索框来搜索这个群 啊,搜索好这个群之后呢,对吧?他他进每进入一个新页面,他都得进一次,就是视觉啊,进行计算机视觉来识别这个信息啊,所以的话会非常非常慢,所以给大家简单演示一下啊。 啊,他还是要拉到我的我的这个麦克屏幕上去啊,大家可能看不到啊,可能会看不到啊,等一下,等他回复好了,我我我再给他拉出来 啊,已经可见了啊。啊,因为因为我,我现在大家看到的屏幕的话是副屏啊,他,他目前的话我没有跟他讲清楚。卧槽,他已经在掉我的鼠标了, 那我鼠标不能动啊,我鼠标不能动, 等一下啊, 这个是会有点麻烦的, 因为因为微信这种 app 的 话,它的一个隐私保护, 隐私保护它是做的非常那个做的很严,所以的话会麻烦一点啊,如果,比如说,如果让我们让它打开 xcode 啊,去执行一些操作的话呢,它会快很多很多 啊。你看啊,这是他的一个操作流程, 他会,他会执行各种脚本啊,打开搜索框,粘贴完整打开, 他发了一条消息,但是发错了发了一条消息,但发错了啊 啊,之前的话我有测试过,就是他是发的消息是对的啊,可能是因为我的这个屏幕的一个原因,我可以给大家 展示一下。好了啊,因为,因为我现在是双双屏,双屏话可能有点问题,我把它停掉,停掉我给大家展示一下啊。嗯,我让他回复一下啊 啊,比如说他在一个,他在我的一个微博 qq 的 群里面给我回复了一句这样的一个话 啊,比如回复了 open ai, 呃,已经发布了 chat gpt 啊,什么什么拜扣的 xapp 五点四啊,这个话就是他回复的, ok? 呃,那我们 就是今天的一个分享,就到这里感谢大家的一个观看啊,欢迎大家一见三年啊,对我的视频鼓励,感谢感谢。

今天给大家看一看扣子 x 到底能干什么?你比如现在我的这个 c 盘已经只有四百兆,导致我现在打开路由器就会卡死, 我又用管家去看这个能不能清理,但是确实是清理不出来,只有这个大文件可以清,但是你进去以后底下的都删不了,你就只有这两个,也没多大, 实在是没有办法,那我就不行试试酷德 x, 我 问他现在买了能不能想办法清理出来一些空间,卸载一些我用不到的软件, 我之前也重新清理过,实在是找不到可以清理的软件了。我现在是四百一十四兆,现在用 gpt 五点四去运行一遍,看看他怎么样。这里快进一下,这里就找到了 六个 g 的 缓 uv 缓存,包括这这几个 g 的 都是我下的模型的文件,这都可以删除。刚才管家里面就没有找到这些东西,他现在已经开始帮我去删除了, 哇,然后非常让我惊讶的是,这第一轮就释放出来十几倍的空间,然后你可以看到这边 现在有十二点七 g 可用了,现在已经差不多这个我这个就不需要再担心 c 盘的空间了。 这个电脑管家里面我们刚才已经说过了,它是根本没有再找到其他的可以去清理的空间,包括这里的大文件点进去以后,它都是不会让你去轻易删除,包括剪映的缓存, 刚才这个电脑管家他都没有找出来,并且这个软件有四个 g, 这些大概都有十个 g。 下一步我甚至可以让他去帮我们执行这个删除的操作。我们来试一下 删除阿克的 gs pro, 我 允许你删除, 哎,我允许你删除,尽管 这个要注意,你在他执行删除这种比较重要的操作的时候,尽量给他一些权限,最重要的是把这一个完全权限,你可以打开看一下,原来是这种默认的权限,他是在一个独立的环境下运行, 这样他是没办法去操作你这个项目以外的一些文件,如果给他的完全权限,他就可以完全去替代你进行操作了,这次再试一下。 好了,现在程序结束了,刚才我们可以看到这里,第一次把缓存文件删掉后有十二 g 的 空间,然后他说的是十四 g, 其实要远远比这个多。今天的一个主要问题您通过 codex 去解决了,也就是之前用电脑管家, 他没有办法再一进一步的帮我们把 c 盘去清理。最开始我的 c 盘只有四百 m b 四百兆的空间,到目前为止已经到了有才十十四点七 g, 可以 看到十五 g 甚至更多 这样的,目前我的电脑已经可以正常去使用了。这个后台讨论为什么 codex 相比于电脑管家这种专业软件,他却能更加深层次的去清理 c 盘的空间, 那是因为电脑管家这一类的软件是比较成熟的公司级的产品, c 盘清理只是他的一部分功能, 在做这个功能过程中不能去影响其他软件的正常运行和存在, c 盘的一些重要资料不能被删除。所以电脑管家的它的调教是比较稳健的, 它不会很激进的去帮你完全深层次清理 c 盘空间。而 codex 它是完全按照你的需求, 你想让他去清理,你想让他删一个软件,他都会帮你一次性执行,会深层次帮你扫描一些没用的缓存去清理,只要你同意, 并且他也能帮你直接去删除这软件,你不用再去自己去找怎么去删,对于一些流氓软件的清理可能也有特别好的效果。
![Codex AI编程新王者, 5 大理由让你爱上 Codex 和Claude Code蜜月两月,我却在3天内叛逃到 Codex 。一次语音助手重构让我见识到它在大型代码仓库的“稳、准、狠”,也更贴合我的SPEC驱动开发。视频用5大理由拆解差异,还聊相同模型在不同系统提示下的表现与性价比。看完就知道该怎么选。顺手点个赞订阅,评论聊聊你的体验。
时间戳:
00:00 [为啥3天叛逃?] - 5大理由抢先剧透一下
00:24 [理由一|大仓稳准狠] - 大仓库也能稳准狠在线
01:45 [理由二|稳定与重构] - 语音助手重构全过程惊喜
05:31 [理由三|SPEC更高效] - 三点文档法提升成功率
06:35 [理由四|同模不同解] - Kimi 在 Codex 更冷静
07:12 [理由五|性价比&建议] - 20刀如何花得最划算
#chatgpt #codex #claudecode](https://p3-pc-sign.douyinpic.com/image-cut-tos-priv/72d96bed8eac862444581e7220ecbcdb~tplv-dy-resize-origshort-autoq-75:330.jpeg?lk3s=138a59ce&x-expires=2089598400&x-signature=hLytDPJM4GmkKxgLn%2FuRELDjpsg%3D&from=327834062&s=PackSourceEnum_AWEME_DETAIL&se=false&sc=cover&biz_tag=pcweb_cover&l=202603231200144872668A8E7BD36C5743)

你好。你好,麻烦帮我搜索三款比较好用的海钓讲板啊,是需要带这个动力推进器的啊,并且帮我整理一份完整的产品报告方案以及把它做成一个实验纸的 ppt 放到桌面,桌面新建文件夹的名称叫做海钓讲板。谢谢, 完事了啊,看看他这个做的怎么样。讲板啊,先看一下 ppt, 太难看了,再跟他说一下。你好你好,我觉得你做的这个 ppt 一 张图片都没有,我也看不太明白啊。麻烦你生成一张会有审美的啊,并且有一点点设计感在里面的 ppt。 谢谢。 好了啊,看一下怎么样。哎呀,有图了, 有点乱呢。是吧,快捷档还不行啊。这样就不乱了啊。还可以啊还可以 哎,这做的真不错啊。啊,真不错。还有来源呢,不错。

openai 今天发了 codex 的 桌面 app 啊,就是一个能让你同时指挥一群 ai 帮你做不同领域的代码迸发编程的工具。 现在的因为也已经过去快三个月了。什么三个月了?就是顶级大模型更新。举个例子,谷歌 gemini pro 十一月底,然后可洛他们的 opps 四点五是十一月底,这不快三个月了,就要又要迎来大更新了,据说马上就是索尼特五就要来了啊,可洛家族的新的这个神级玩意儿。然, 然后马上怎么样? openai 抢先发了一个叫做 codex, 直接是原声在 mac 上面的工具。有些人会说,哎呀操,不就是写个代码吗,给我那装的没好激动啥的, 他是把根本逻辑改了。以前是你告诉 ai 怎么写代码,现在是你定任务, codex 直接迸发一堆 ai 去做不同的任务,也就是多现成 ai, agent 也可以称之为 agent 的 集群。 一个负责新功能,一个重修老代码,一个负责跑测试,各干各的,相互不影响,你只负责最后的审核。 openai 这一次 macos 上首发的这个 codex 原声就 就是把这件事做了,也就是说既当爹又当妈啊,把设计师,把程序员,把测试的工作一口气儿拉表,任务清单全做完。但是我觉得更狠的是定价,我说白了, g p t 的 两百刀我一直在定,但是我现在越来越觉得不值,唯独 deep research 和这个 g p t 五点二 pro 偶尔用一用, 但是现在你发现它什么东西都下放到免费,真的,这些二百刀以上的我全都定最值的,听我的兄弟们, cloud 二十 max is the real money 挂着 其他那些东西免费版都给太多了啊,你就像那 g b d 这玩意,我到时候看看你免费版的你 codex 到底能用多少就完事了。以后啊, codex 就是 你的 ai 团队 leader 了,不管你是不是程序员,只要有嘴就行。以前是 talk is cheap show me the code, 现在时代变了, code is cheap show me the talk。 一 抹波浪。

哈喽,大家好,我们现在来教大家去如何去安装和使用酷呆斯增强版。我们首先 拿到这个 get up 的 地址,我们会在评论区放出来,我们首先访问这个 get up 的 仓库,先进来首先点一个 star, 然后我们再看 安装方法。 mark linux wsl 的 话可以直接使用这一行命令,我们复制它,直接在终端粘贴就可以安装了。 windows 的 也是一样的,复制这一行命令,然后在你的终端 粘贴,然后就可以继续安装了。我们打开我们的终端,然后粘贴刚才的命令,我们直接回车等待它的安装。 安装话跟你的网速有关系,如果你的网速不够快的话,可能需要等一会, 不快,它安装好了,它默认的话会把你二进字文件安装在你的 logo 并目落下的。我们可以检查一下使用命令,我们检查一下它安装好了是不是 ok, 确定安装好之后,我们可以查看一下它的最新版本, 最新版本的话是一点二点零,默认的脚本安装就会安装最新版本到你的本地。 然后我们查看一下当前酷带 s 增强版具体有哪些新增的功能,比如 agent, teams, hux, 繁琐拎拎, ip agent 以及 webui。 我们可以先看一下路由 server 是 怎么实现的,可以看到路由 server 是 使用 httpss 去进行实现的,这样最大的优势呢就是, 呃,你启动多个 c 型只会占用一个进程,这样的话你的进程消耗就会非常少。我们直接使用路由 server 将微博 ui 启动起来。 cordless server 会随机启动一个端口和随机的托克密钥,你拿到这个端口和密钥呢?可以在本地启动一个内网穿透,这样你在外面就可以通过手机访问微博 ui 去进行远程的微博扩顶。 我们可以直接切换到移动界面去进行测试,先随机选择一个目录 发送嗨来进行测试。 ok, 我 们开始测试下一个功能,我们回到仓库地址,我们看一下 agent team 和 hux 以及奥斯突击 api agent, 我 们首先演示一下 agent team, 使 我们来到这个仓库,我们通过 code s 启动。然后怎么使用呢?首先第一步你需要在配置文件里面去启动多媒体的配置,我们 可以看一下在这个配置文件 copy 里面去将这个配置多媒体给它启动, 我们就可以开始那个尝试这个功能了。比如说我们 use agent teams 这样子告诉模型,告诉模型,比如说告诉了五点二, 我们需要需要启动 a 键的 team 来去做接下来的工作。比如说我们分析当前项目,就代表了我们使用 a 键的 team 来分析当前项目, ai 会分析任务难度来判断具体创建多少个 a 帧。 ok, 我 们看到它根据呃项目复杂度启动了五个 a 帧,五个分析帧 这个中括号括起来的这个就是我们的具体的一个执行 aint, 比如说是其中的五个分析的 aint, 然后来去并行的执行分析当前项目,它对于仓库结构 rooster 的 库的代码,然后 build c i 以及文档以及安全 sandbox, 然后去单独的 每一个单独的去进行分析。啊,这五个的话就是在并行的那五个都是同时创建,然后在并行的这里就会有一个等待所有的 a 帧,我们现在可以等他返回。 ok, 全部 a 帧已经返回了,五个 a 帧都已经执行完成,然后返回了他的一个结果,分析结果, 然后五个 a 帧的全部返回成功之后呢?慢 a 帧就会去收集五个 a 帧返回的内容,做一个汇总,然后再去判断当前的分析是否完成了,然后模型会自己去判断 是否还会需要继续的去进行分析,如果不需要的话,他就会直接返回结果,如果需要的,他还会去再次的创建 a 帧去进行分析。 ok, agent teams 全部结束,返回了最终的结果,这就是整个 agent teams 的 一个调用过程。

兄弟们, codex 性价比拉满了啊?这是我年前买的一个 codex tim 拼车,然后用了满满的一周饱饱的用,每天白天晚上都在用了,他提示我说现在还有百分之二十五的额度,也就是我用了一周他还剩百分之二十五。关键这是在某鱼上 tim 拼车只花了六块八,并且看啊, 还支持最新的 gpt 五点四模型,一个月六块八,还支持 gpt 五点四,并且还用不完啊,性价比拉满。