粉丝3254获赞47.5万

codex 跟 c c 到底哪个好?我想大家各自都有自己的判断。在我个人为二者都充了二百刀的 pro max 会员以后,我个人的体感是 二者的模型能力之间并没有本质的差异,甚至都足够惊艳,让人心喜。但它们其实代表了两种完全不同的人。与 ai 合作的费洛索费 本质上,我们不是选择两个工具,而是选择两种与 ai 交互的模式。你习惯使用哪种模式,你的工作场景是哪种模式,你就应该选择支持哪种哲学的普顶工具。通常来说,抽象的讲, 软件工程开发的模式可以粗略地分为两大类,首先一类是那些探索性不确定的 idea。 在这种场景下,我们自己可能对需求要做什么,最终的一个中态是什么,甚至过程中该如何实现,它都没有一个明确的定义,它更多是我们一个拍脑袋的灵机一动的想法。当我们解决这类问题时,我们期待的一个 partner, 无论是不是 ai, 它应该都要能 快速的与我们进行交互,通过一些他主动的提问甚至判断给我们更多的信息输入,通过一系列的沟通,最终确定出一个相对更结构化,信息密度更高的思维原型来指引我们后续的执行。 而另一种常见的工作模式则是一个更明确的需求,比如说产品已经给我们了相对明确的 p r d, 那 我们剩下要做的只是说把这个项目 真正转移为一个可以被执行的代码而已。对于绝大多数的研发而言,这种场景下想要做的事情是基本完全确定的,我们在此时要做的无非只是一些 dirty work, 把那个 p r d 转化为真正写出来可用的代码而已。 而结合我自己的使用经历来看, c c 更适用于前者者的工作模式。它会在你输出一些观点之后快速地给你响应,并且高频地向你发出提问,以确定它后续的一些方向执行思路。但 codex 则完全相反,它会在你给完需求以后, 非常认真且可靠地将你的需求描述执行完。这个过程会花很长的时间,但是 结果往往是令我们满意的。想要更明确的拆分这两种工作模式的分野,我们不如从三个维度上来进行拆分,首先是任务商,也就是目标的清晰程度以及约束条件的多少。其次则是以我们预期的交互结构, 我们到底期待着与其他 partner 是 同步的沟通,还是说是一些异步的沟通模式?另外则是一个人类所占主动性的比例, 我们到底期望 ai 占据多少责任?他们是只是执行任务,还是说给我们也有一些他自己的认识建议?其实这三者并非是一个非常正交的关系。一个很明显的结论是,如果一个 目标的本身并不清晰,只是我们拍出的粗糙 idea, 那 我们显然就需要我们的协作者能快速的发问,帮我们把 自己大脑中一些比较模糊的观念导出出来,并且通过一些沟通确定哪些思考是我们需要的,哪一些是可以被删除的。通过这种 快速的同步沟通,得出来一些更结构化的结果,那在这个流程中, ai 需要介入的部分以及引导的主动性就会占比更多,但如果这个需求本身就像我们之前讲的已经相对来说明晰,是一个低伤的场景,那我们就不太 需要。它是一个很同步,事无巨细都要向我们发问的流程,它完全可以在我们把事情说清楚之后,一步的完成这个工作,从而解放我们人类自己的时间。我们也不需要给他太多主动发挥的空间,他只需要忠实的执行我们给他的需求就可以。我觉着对未来工具的使用以及工作流的设计,也都是从这三个维度去进行判断,动 态的选择。我们到底适用于哪种工具,应该主要采用哪一种工作流的思路?如果要打一个比方的话, c c 更像是坐在你隔壁工位的好蜂蜜, 会在有了一些 idea 之后立马的打断你现在的所作所为,跟你去探讨它的一些碎片化想法。而 codex 则更像是一个你忠实可靠的下属,在你交代完任务需求以后,忠实的可靠的帮你把事情完整的办完再通知你。我已经做好了。 每个模型都有它们自己的性格,我们也可以顺应的这种性格,在不同的工作场景中选择不同的工具以及模型。 以上是二零二六年二月我对这两个投影工具的一些使用场景总结,但我相信这个领域是日新月异的,二者工具之间 大概率在未来也会发生一些融合。不会说一个工具只是一种工作流场景,那就需要我们未来本身人类自己有一些对需求使用场景的预判,从而能告诉模型它应该采用哪些工作流模式。软件工程永远没有银弹, 不可能说我们用着一种模式,一条道走到黑,就可以得到一个很完美的结果。如果你在错误的场景使用了错误的工作模式,那模型给你提供的支持也就会非常有限。 结合自己的需求,场景动态切换自己的工作流模式才是一个更高效率开发的必经之途。以上是本视频的全部内容,如果你有一些想法或者建议,期待评论区讨论,谢谢大家!

就在刚刚, codex 终于官方发布了手机版,很多朋友说现在只支持连 mac, 其实 windows 也能连上了。这期视频我就手把手教大家怎么把 windows 电脑上的 codex 和我们手机连上,让我们在外休闲时也能远程指挥家里的电脑干活儿。首先确保 codex 已经更新到了最新版,通常 codex 会自动更新,然后我们打开 c 盘,进入用户文件夹,找到点 codex 文件夹,打开后找到这个文件,双击打开,找到 features 这一栏,如果没有就自己按照我这里的格式加一行, 然后把这两行复制粘贴到 features 下面,保存配置就改好了。打开 codex, 等待手机连接。接下来我们就拿出手机,打开 check gpt app, 在 侧边栏点击 codex, 它会弹出一个窗口,如果电脑这边配置正常,下面就会出现这样一个黑色按钮,点击后要走一次认证流程,通过后呢就到了确认界面, 我们点击右侧的黑色按钮,稍等一会,就能看到屏幕上显示出来了我的电脑名称,并且同步了电脑上我与 codex 对 话的历史记录。我们点进一个绘画,可以看到之前的绘画记录,那么我们来测试一下,我让他在桌面创建一个 txt 文档,然后打开 点击发送,可以看到电脑上已经同步了我发送的信息,速度很快,文档也很快创建好,打开了, 体验非常丝滑。不过我发现一个 bug 就是 如果这是一个全新的绘画,发消息出去手机和电脑都没有反应,可能需要等待后续的更新了。好了,我是阿朱,关注我,让我们一起在 ai 潮头冲浪。

好,我们一起来看一下 codex 呢,在五月八号进行了一次最近的更新,增加了一个昆姆扩展的插件,那这一次呢,我们一起来看一下这个插件和相比于其他的方式去操控昆姆有什么区别?好,我们直接点击这个电脑操控这里呢,大家可以看到这个会有存在一个 啊昆姆插件这么一个选项,就是我们点击管理可以看到增加了非常多的配置,比如说像权限历史记录下载上传,那这里呢提供了非常丰富的这种权限控制。嗯,我们可以通过 安装这个插件和 codex 呢进行建立关联,这时候可以看到我们的这个 codex 呢就连接上了当前这个浏览器,那出现了这一个绿色的图标,就说明我们的 codex 呢已经可以完全的托管这个浏览器了。那我觉得这是 codex 呢像全自动操控浏览器迈出的一步哦, 我就挺有趣的,所以今天给大家做一个分享。那如果你把这个开关打开之后呢,接下来呢我们就可以直接去操控了,但是你会发现一个小细节,就是如果你是在国内的环境下,你就直接点击这边去打开呃,安装插件的界面,你会发现这个商品并不能够安装,所以大家呃可以通过我提供的这么一个压缩包去进行补充这个 啊插件,好吧,呃,我们来往来看啊,首先我们来看一个很容易被大家混淆的东西就是,嗯,目前 codex 本身来说是有浏览器,那他操控浏览器和我们的这个插件有什么区别呢?比如说我们在这个 codex 中使用软件到一般是这边新建一个窗口,在侧边会有一个浏览器的选项,那其实这也是我们的第一步,就是我们的这个呃, in app browser, 这是我们的一种内置浏览器,它本身来说是用来调试的,用来开发的,所以和我们 这个插件更新是没有任何关系的,所以大家不要搞混了。那第二种呢?叫做 browse user, 这个是用来操控类似浏览器的,这是相当于前面的这个 in app browse 呢,又往前走了一步,比如说我们在这个设置这边呢,哎,去又往前走一步,这有一个,这个什么有一个啊? browse user, 它可以让呃我们 的 codex 呢去操控这个类似浏览器,去完成一些操作。好,那也就是第三种呢,就是我们刚刚现在讲这种叫 chrome browser, 它可以帮助我们进入真实浏览器状态,去操控我们整个浏览器。 那有小伙伴说了,那其实我的这个 pry white mcp 也可以操控浏览器,或者说我这种外置这个 computer user 也可以操控浏览器,那和这个有什么区别吗?而且区别很全面,对吧?呃,区别的话,呃 computer user 呢?它本身来说它并不是浏览器的插件,对吧?它是一个操控电脑的 g y 能力的 这种插件,比如说它可以通过你屏幕去操控你调出那些图形应用,就比如说我们现在常见的这种,呃剪辑应用,对吧?微信,对吧?它都可以操控,但是你如果单独的话去操控这个浏览器的话,显得并不那么智能,所以 codex 提供了一个新的能力,就是这个 codex com, 那 我们可以通过这个 codex com 去完整的操控我们整个浏览器。举个例子,比如说我现在想让他看到我们整个这个浏览器上有多少个标签页页,对吧?我们就问他,我说,哎,现在当前浏览器上有哪一些 这个标签页?比如说你看是吧?他可以告诉我们现在到底有哪些标签页,我又让他在第一个标签页输入 a, 第二个标签页输入 b, 也可以,我再让他把某一个标签页固定也可以,就能够做到很多之前做不到的一些事情 啊,分的更加的细了。那如果说你细心的话,你会发现,呃,这个插件它其实包含了很多细节的功能,比如说他通过这个插件和 codex 进行关联之后呢,就可以直接在 codex 里面去操控浏览器的所有权限,比如说审批,对吧? 比如说历史记录,你可以让他看到你今天到底有哪一些详细的记录,包括你上传哪些文件都可以使用它,比如说你允许上传哪些,允许下载哪些,都进行了完美的这种配置啊,对吧?非常的清晰。好,那接下来在最后我们想跟大家聊一下,就是为什么要使用这个呃,这个酷路亚 插件呢,对吧?为什么不直接使用 pro white 的 能力呢?其实很清晰啊, pro white 的 本身更像是一个外部的这种工具,而这个呃 这个 com 插件呢,是一个内置能力,如果说你使用这个的话,你会发现其实很多东西它都需要一步一步的去哎,去跟他讲,去分析,那它通过这些 m、 c、 p 的 能力去一个一个去提供。那如果浏览器更新了呢?它并不啊 同步更新,但如果是 codex 呢?它就同步更新的,它更像是一个完整的产品,对吧?也是 codex 官方提供的真实浏览器的一个执行通道。 而 pro y m c p 呢?它只是一套通用的浏览器自动化引擎,对吧?所以呢,你可以相当于它是一个小缩放。而这个,呃, codex 捆绑插件呢?还是更像是一个完整的企业级的真实软件的一个执行通道?它也可以通过现成去控制,并且呢,能够降低了很多我们调试的成本, 比如说我可以让它去帮助我去做一些自动化的事情,对吧?是吧?非常的方便。好了,那以上就是这几个的区别,我是小刘,那我们下期再见。

国内终于有能和 cloud code 和 codex 扳扳手腕的产品了。 risclex 是 一个专门为 deep seek 优化的桌面端产品,由 nodjs 构建,已有七千四百加薪。它和前阵子爆火的那个 deep seek t u i 不 同,它核心只做一件事,极致优化 deep seek 前缀缓存架构,围绕缓存优先、循环设计三大支柱,全部服务一个目标 有用户测试,单日四点三五亿输入 token, 缓存命中率百分之九十九点八二,成本十二美元,同样量无缓存约六十一美元。功能覆盖 m c p 技能、系统记忆、 point 模式、语义锁影、 web 面板。作者故意只支持 deep, 感兴趣的小伙伴赶紧去试试。

哈喽朋友们,我是阿水,今天给大家介绍一下,我用 codex 微博抠定了一个可以代替我干活的小插件,从设计稿的生成再到切图交付, u i 设计师必看的这一期,如何一分钟看完别人一整天的活,那这个插件呢?纹身图和图身图 目前都是支持的,首先是在这里可以选择纹身图,那这里呢,我们输入简单的提示层描述就可以,然后要做移动端的话,直接选择九比十六,那或者需要根据自己的需求我们自定义尺寸也是 ok 的, 那图片数量呢?这个就没有啥要求了,好了之后呢,我们就直接点击生成设计稿按钮, 这个速度大概是在一分钟左右就可以完成,好了之后呢,我们就可以选择要切图的图片,点击切图按钮,然后用鼠标直接框选就可以。鼠标拖动的方法切图可以说是非常的方便,我们只需要在页面上点击鼠标 画一个句型就可以选中切图,无论是大一点的 icon 还是按钮,以及我们在底部的这种 tab, 还有页面上的这种小箭头主标题也可以用这个方法来切出来。当然如果我们想要把 icon 的 背景给它变成透明的,我们只需要点击透明的按钮 就可以了,正好的一点就是针对单个的按钮可以自己自定义设置。那切图好了之后呢,我们就可以导进 figma 里面,可以看到刚才切好的图片,它已经单独帮我们进行了图片分层,而且有一个特别好的点是 我们把单独的 icon 切出来之后,它原图的背景上面的 icon 就 会没有,就会消失,并且呢,它填充的颜色也和我们的背景特别的相似,几乎看不出来有颜色填充的痕迹。那其实到这一步呢,完全可以是一个可交付的一个状态了, 因为我们的图已经切好了,只需要交付给开发就 ok 了。那除了纹身图,其实图生图的方法也是一样的,必要是我们手动设计的环节,全程都是由 ai 去工作,而且呢,大家可以看到切完图之后,它的原始背景上面,你当前切图的这个 icon, 其实它已经从背景上面消失了,并且呢,它用了一个色块填充,而且呢,它填充的这个色块也是很好的,而且呢,对于透明的这一点,它做的也非常的好,就是呢,它把你的 icon 主体给你留下了,但是背景呢,它真的是透明了,这个真的是特别的方便。我做这个插件呢,其实 初心是因为我没有飞格玛的教育版,也没有飞格玛的会员,那所以呢,我没有办法去使用 m c p。 然后呢,这个插件就诞生了,这个也是一种 没有会员,没有教育版的一种解决方案。那如果大家对这个插件有什么要求或者建议更好的功能点,那大家可以在评论区和我讨论,而且想拥有这个插件的也可以直接在评论区找我来拿,我是阿水,大家记得点赞关注评论哟,我们下期再见,拜拜。

你以为 macbook 的 价值是芯片、屏幕续航?现在可能要加一个新理由, codex openai。 最近几轮 codex 更新,其实释放了一个很强的信号, ai 不 再只是网页里的聊天框,它开始进入你的电脑,进入你的 app, 进入你的本地工作流。二零二六年二月, openai 发布 codex app, 最早就是面向 macos 推出的。这个 app 不是 简单的聊天窗口,而是一个 codex 指挥中心。它能同时管理多个 codex, 一个修 bug, 一个写文档,一个跑测试,一个看 pr。 而且它支持 worktrees, 每个 codex 都在隔离环境里干活,不会互相把代码改乱。但真正让 macbook 含金量上升的,是后面的更新。 codex 现在可以用 computer use 在 mac 上操作桌面应用。 什么意思?它不只是读代码,它可以看屏幕、点按钮、输入文字、操作浏览器,复现图形界面里的 bug, 甚至帮你测试一个 micros app 或 ios 模拟器。流程更狠的是, openai 官方写的很清楚, 多个 codex 可以 在你的 mac 上并行工作,同时不干扰你继续使用其他 app。 这就很关键了。以前 macbook 是 一个人用来干活的电脑,现在它正在变成一个人和 codex 一 起干活的工作站。还有一个很适合 mac 用户的功能,叫 appshots。 你 在 mac 上看到一个报错窗口, 一个设计稿,一个网页,一个设置面板,不用长篇大论描述,直接用快捷键把当前窗口发给 codex, 他 会拿到截图和可读取文本,然后基于这个上下文帮你处理任务。这对程序员、设计师、产品经理、内容创作者都很实用。比如,你打开一个网页设计稿,让 codex 看一眼,然后让它改前 端,你打开一个表格文档后台页面,让 codex 根据当前内容继续干活。再加上手机远程控制, 现在拆的 gpt 手机端可以连接到正在 mac 上运行的 codex, 你 人不在电脑前也能看 codex 的 进度,终端输出测试结果,代码 def, 还能远程批准下一步操作。也就是说,你的 macbook 放在桌上跑任务,你在路上用手机盯进度。这就是为什么我说 macbook 的 含金量在上升, 不是因为 macbook 突然变便宜了,也不是因为参数碾压所有电脑,而是因为 ai 时代的电脑价值正在从性能设备变成 ai 工作流底座。 codex 这种工具越成熟,越需要一个稳定的本地环境,代码仓库、终端、浏览器、 ide 设计工具、文档权限系统、桌面 app。 而 macbook 本来就是大量开发者和创作者的主力工作机,现在 codex 正在深度适配 macos 工作流, macbook 就 不只是生产力工具,而是 codex 可以 长期驻扎持续工作的 ai 工作台。 所以这波不是单纯吹 mac, 真正的变化是,以前你买 macbook 是 为了自己更高效,现在你买 macbook 可能是为了让 codex 也能更高效的替你干活。未来值钱的电脑不只是跑分高, 而是谁能让 ai 更顺畅的看见你的工作,理解你的上下文,操作你的工具,持续完成任务。从这个角度看, macbook 的 含金量确实还在被 codex 往上抬。

生产力大爆发啊! openai codex 正式支持 chrome 浏览器了!不管你是 macos 还是 windows 用户,现在只需安装插件, ai 就 能直接在你的浏览器后台跨标签页并行处理任务。 这意味着你在浏览网页的同时, codex 已经在静默处理你的工作流,完全不干扰操作。想体验这种无缝衔接的丝滑感吗?赶紧去更新插件,咱们评论区见!

我们都知道,我们在 gbt 可以 实现通过生成一张图片的各个元素来实现它的 psd 分 层, 但是呢,通过这样的生成方式生成的元素最多不超过十个,而且它的文字是不可编辑的。这时候大家不妨试一下用 codex 来完成这些操作。 codex 它不仅仅是一款为编程而服务的 agent, 那 同时也能帮我们实现很多工作的自动化。 而且就在本月月初, codex 它的每日安装量已经超过了 cloud code。 另外 codex 本身已经支持了 gpt emoji 二点零的图片生成, 所以今天我们就试一下在 codex 上来实现它对图片的 psd 分 层。我们上传一张和之前一样的图片, 为了方便呢,我们这里选完全访问权限,对于这样偏简单的,我们自然选择中就可以了。跟 gbt 客户端一样,我们只要输入好提示词,然后按发送键就可以让它执行。当然这个提示词我可能要求比较严格,写的比较多, 所以比较长一点。好的一共花了十六分钟,他就给我生成了一个 psd 文件。在整个过程,他其实就是对各个元素进行重新生成,并对其中的文字进行一个 ocr 识别。 在我们的 ps 中呢,我们可以看到它不仅把这些元素分开了,而且把各个文字都转化成了一种可编辑的状态。当然它字体做不到百分之一百还原,但好在它的字体是可以进行编辑和修改其中的具体内容, 而且字体外的图层它同样是分割好可移动的。我们再看一个马克杯的例子,同样是用这一套提示词,当然它这里中断了一次,因为它生成的跟原图差距过大,所以我让它继续生成好,这就是最终生成的 psd 文件。 你看到元素可以移动,文字可以编辑,没什么问题。我们在利用 emoji 是 二点零制作这样的图片。除了文字的问题之外,我们还会遇到一个问题,就是它的图片通常就是生成一 k 的 图, 如果我们想打印图片或者要更高分辨率的图片的话,如果它值出的一 k 图片完全没有办法满足我们。但是它用 api 能生成四 k 的 图片,但是呢,这个 api 一 是要额外收费,而且 它和我们要拆分的过程相背。所以我建议大家在编辑好图片之后,可以通过以下两个方式进行放大。第一种方法,我们可以通过 comfy 里的 c 的 vr 这个模型,把我们一 k 的 图片放大到四 k。 工作流也非常的简单,我这里大概花了一百二十秒, 大家也可以看一下它跟原图的对比,放大效果还行,没有改变太多原图的细节。 如果你完全不会使用 comui 的 话,你也可以用谷歌它的 nano pro, 我 们在这个 ai studio, 我 们可以选择这个 nano pro。 右边这里我们也简单设置一下。首先把画质调到四 k 温度的话,调成零到零点二之间比较好。最下面这个参数呢,我们也给他调成零点五。同时我们输入以下提示词,一分钟后我们也可以得到一张四 k 放大的图片了。 我们也可以看下对比效果,虽然变清晰了,但是比 s d vr 它的重绘幅度稍微大那么一些,但是整体的细节大多数没有改变,可以勉强接受吧。这就是整个在 codex 来实现 p s t。 分 层加上高清放大的 一些基本方法。当然你可以通过 codex 来实现一些更高难度,更精确的 p s t。 分 层和 自动化工作流。我这里只是抛砖引玉一下,你可以把梯子十优化的更好。总之,以后 codex 无论是在编程还是说像这种图像自动化处理流程,都会变成必不可少的工具。我们本期利用 codex 如何将 图片进行 psd 分 层以及 image 二点零图片放大的方法就介绍到这,有关于具体的提示词,还有空 v i 的 工作礼物会放在视频剪辑的下方。 好,如果你觉得本期视频对你有所帮助的话,欢迎帮我点一个赞,我们下期再见!

大家中午好,我想了想,我还是要跟大家录一下,因为最近 codex 跟 anthropic 的 cloud code 真的 太火了,昨天晚上 openai 也发布了 codex, 现在已经可以直接支持谷歌的 chrome 以及 windows, 就是 chrome 在 macos 和 windows 情况下,呃,可以直接调用 codex 的。 我快速录一个视频,教一下大家怎么把这个功能激活。首先呢, 我们要打开最新版本的 codex, 如果不是最新版本的,可以在这里去检查 update, 就是 要确保更新到最新版本的 codex。 更新完之后,打开这个插件 plug ins, 打开这个插件, plug ins, chrome 的 这个选项就会出现了,点击这个 chrome 点击吧,因为刚才我已经点击了啊,可以直接点打开, 打开它会直接跳到你默认浏览器的这个 codex 的 激活界面啊,如果你默认的是 chrome, 就 会正常蹦到这个 chrome 的 界面 crom 蹦到之后直接点击艾特 crom 就 ok 了啊,因为我认为接下来会很精彩的。其实 cloud 大家能看到我的 cloud 已经支持了,就当我点开这个 cloud 的 时候, cloud 的 无论他调用自己大模型也好,还是还是 cloud code 也好,他可以直接操纵我的 crom。 那 现在呢,就是我把 code 也加入到 crom 之后, open up code 也可以直接调用我的 crom 吧。因为今天我想录这个视频的原因就是我认为接下来整个电商的搜索逻辑都会因为世界头部的几个大模型公司会带来天翻地覆的变化。 比如我现在自己日常的使用已经不用去打字了,我调用的是 tapis 会比较多,所以现在目前,哦,现在才五月份,我觉得其实 ai 的 风向已经调了好几次了。比如年初的 open code 火了一阵子, openclaw 就是 龙虾。 那其实我认为到现在为止了, open opencloud 的 风风口或者说营销热度已经完全消退了。那接下来就是 webcoding。 那 目前最主流的就是 codex 和 android 的 cloud code。 就是 cloud 的 code 啊。好吧,今天就跟大家快速录一下。我估计可能很多伙伴不知道怎么在 codex 里面去添加 chrome, 在 chrome 里面去激活 codex。 好 吧,那今天先这样,拜拜。

hello, 大家好,我是阿亮,这期视频呢,教大家如何把 codex 接入国产模型,比如说接入 deepsea codex 和 cloud code 呢,不一样,它不支持修改配置文件来切换模型。最初呢,我也是想直接用其他的工具来接,比如说 c c x, 但是折腾了很长时间,发现问题比较多,也很复杂,所以呢,就自己动手来搞定的一个专门的工具, codex 杠 switch, 用这个切换 codex 的 模型就方便多了。接下来呢,就照着我整理的这份 codex 文档,一步一步带大家操作。 首先点击文档中的 codex 杠 switch, 跳转到下载页面,根据自己的电脑 选择安装包。下载后呢,双击打开,我们就以 deepsafe 为例,这里选择 deepsafe, 然后点击这里到 deepsafe 官网去申请 k, 这里有每个模型的申请 api k 的 链接好,点进去呢,就是开放平台,点击 api case, 创建 api k, 然后把拿到的 k 复制到这里就行了。然后点击蓝色按钮,这个时候呢,就切换成 deepsafe 模型了,现在呢,需要重启 codex, 记住这里一定要把 codex 关掉,重新启动, 可以看见这里的模型变成了 deepsafe, 输入一条消息试试,如果它有回复说明呢,就接入成功了。 点击红色按钮,也可以一键切回官方的 jpt 模型。注意切换后必须重启。 codex 这个小工具呢,目前支持主流的啊,国产模型也可以自定义模型,每次启动 codex 前呢,把这个工具启动了,就可以顺畅地用国产模型了。 这一期呢,我们主要是想要通过一个案例带大家整体走一遍流程,更熟悉这个扣带子的使用。很多人觉得呢,做一个案例或者做一个东西之前呢,要先想清楚做什么功能啊,有什么样的风格等等吧,就想了好久好久。其实我们根本没必要 给他最简单的提示词,让他呢先做一个东西出来,然后我们再挑毛病。好了,接下来我们直接开始 新建一个项目文件夹,直接命名为汉堡店,然后新开一个对话,添加新项目需求呢,就一句话,帮我做一个汉堡店的网页回车 codex, 自己理解,自己拆任务,自己给方案,它还可以自己的生图,因为它接入了目前最好的模型啊, gpt 杠一, mate 二,这个是最好的生图模型,我也没仔细看啊,先让它跑一半问出来再说。 哎,过了一会呢就出来了,但是我发现他的主页呢只有一张图片,这样感觉真的是太干了,餐厅也没有什么特色,我想每天都有一个的特色汉堡啊,以一周七天来循环,让他来修改 主视图,图片改为五张图片轮播,设置每天的特色套餐,每日的优惠套餐以一周为一个单位啊,一周为一个周期。每天的菜单呢,可以点击观看,并且每个套餐呢都有相应的配图。 顺便再说一下, codex 是 内置了当下最牛的生图模型,一面之杠二点零模型,比香蕉呢强了不少,改好了来看看效果啊, 这是汉堡店店内环境呢,是必须要有的,然后我输入加入醒目的店内环境图片,分别有,后厨的呃,制作区,冷藏区,前台用餐区,卫生区,冰激凌帐。每个区域呢都有至少两张图片,图片看起来是在同一家店。 好的,等会效果还不错。我们新开一个对话,打开计划模式输入,把这个项目改造成 next js 框架。如果你不知道 next js 是 什么意思,可以再新开一个对话,问他什么是 next js, 然后使用 codex 内置浏览器,我们点开批注按钮,这样的话,你想改哪里啊?直接就能在这里改。比如我想让这个汉堡的价格是零,直接点击这里,价格改为零, 想改哪里呢?都可以在这里直接进行修改。但如果你想让别人也可以打开这个网页,只需要打开 codex, 问他怎么让别人也能打开这个网页。这个也算是给大家留一个作业啊。总之一句话,遇到不会的或者不懂的就去问 codex, 把我们的思路一定要转变过来, 大家有兴趣呢,也可以去尝试着做一点自己的东西。 ai 时代,我们用 ai 工具呢,最主要的就是用来创作,然后提升自己的效率,让我们成为一个 maker。 好 了,这期视频呢就到这里,下一期我们再继续讲 codex, 大家点点关注哈,跟着阿亮学 ai。

ai 编程能完全免费在本地运行了, codex 和奥莱曼正式打通,开源模型直接接进来。之前想用 ai 写代码,要么掏钱买 api, 要么依赖云服务,每个月动辄几十上百美元,小团队和个人根本扛不住,现在所有成本归零。 olym 这个工具能让用户在自己的电脑里跑开源模型。 codex 是 open ai 的 ai 编程助手,能写代码、改代码、审核代码,两者一组合,本地就能用上 jam 四 qman、 三点六这些模型一分钱不用花,全靠自己的显卡和内存。 具体怎么用,三条路走通。第一,装好 codex 和欧拉玛,两个软件都免费。第二,选一个适合自己电脑的模型, gamer 四的四 b 参数版本就够用,去 camera ai 网站输入显卡型号和内存,网站会推荐能跑的模型。 第三,在命令行里敲一行命令,模型就下载到本地了,大概九点六 g 币,等几分钟就装好,然后启动 codex, 选择这个本地模型。所有 codex 的 功能全都能用,写代码、改页面、调逻辑, 这意味着以后写代码、建网站、调样式都不用靠云服务,自己电脑就能跑数据不出门,速度还快,相当于把 ai 编程的门槛从月费降到了零。打开 codex, 选本地模型开工。 有人用 jma 四四 b 模型生成一个 cs 落地页,复制代码到浏览器打开页面完整布局干净。一个四 b 参数的本地模型就完成了以前需要付费 a p i 才能做的事。

hello, 大家好,我给大家介绍一下我做的 codex 的 小屏幕,那它是一个小单板啊,可以看到它可以把 codex 的 所有的状态, 包括你当前 agent 所处的啊,用的模型,推力强度,还有是否是 fast 模式 啊?包括还有几个啊,我们的五小时窗口和周窗口,以及当前的上下窗口的占用啊,都会给你显示出来。然后呢,它还支持语音呢? ok, 我 演示一下,现在是见证奇迹的时刻。 ok, 那 这个就有语音了啊,然后可以把它删除啊,可以把它删除。 ok, 那 现在我让我们让他正式来干个活吧。啊啊,好,这样展示一下会比较好,帮我介绍一下这个项目。 ok, ok, 让他接着干。那我们可以看到,其实可以通过这个窗口,基本上所有的活都可以通过这个小玩意给它 让他干了。那跑起来之后呢,也会有一个跑马灯,也是正在 working。 呃,你的 qd 人才也会 跟着这个小屏幕交互下去,完成相应的工作。 ok, 那 就演示就到这里,大家觉得酷不酷?

好,今天这期视频呢,主要给大家讲一下我们安装好 codex 过后的一些基础设置,为了后续更好的帮助我们工作呢,有些基础设置我们是需要 提前去做的,那第一个就是在这里我们的常规,大家可以先去选择这些工作模式,如果你是用于编程的话,你可以选择第一种,如果你是用于日常工作的话,你可以选择第二种,这是工作模式的一个选择 好,后续的这些可以按照它默认的设置就可以。第二个就是外观,外观这里的话有一个比较好用的,就是因为现在 codex 它已经支持宠物了,大家也可以去养自己的宠物,创建自己的宠物都可以的, 这是第二个。第三个在配置这里啊,配置这里呢?用户配置这里大家可以去选一下,就是第一个批准策略就是 on request, 第二个就是杀和设置这里我们选择我们的工作区就是 workspace right 就 可以了,那这是用户配置的一个设置。 好。第三个个性化啊,个性化,这里就是他的一个回复的语气,呃,大家可以去进行一个选择,那我自己选的就是比较务实的,是简洁、专注和直接,如果你喜欢亲和的话,也可以自己去进行一个选择。好,那么这是我们的一个个性化, 后面这里就起用记忆这里大家记得勾选上,这里记得勾选上好了,那么这是这一个的还有就是浏览器啊,允许他去控制我们的这个内核浏览器,因为后续他可以去操作我们浏览器,去帮我们做一些数据分析啊,包括一些其他的一些操作, 下面就是一个电脑操控这里,呃,我们一般建议可以去共享上这个就是 computer use, 就是 呃, codex 直接可以用我们的电脑去做一些这个查看,那我经常用的就是我让这个 codex 去帮我 登录我的小红书的后台以及抖音的后台,去帮我做一些粉丝画像和我这个账号的一些数据的一个分析,从而给我输出一份分析报告,包括 有关浏览器的扩展应用,这是在电脑操作这一块的啊,那么最后一个就是,呃,可以查看自己的已归党对话 这一块呢,就是我们在安装好 codex 过后呢,建议大家首先要去做的一些基础设置。好,那我们这期的视频就讲到这里,大家可以点赞关注加收藏,后续我们也会讲更多关于 ai 进的一些应用。

之前在 codex 里面做了个 origin image 的 skill, 现在根据那个 skill 做了一个程序, 该说不说, codex 默认的 ui 还是要好好设置一下。这次主要是在原来的基础上增加了批量编辑图的功能,用于实验的还是之前 skill 演示的 excel 文件。接下来是软件示范, 默认的第一列是 x 轴,后面的为 y 轴,同时也支持多文件批量处理。如果是一个文件,选一键生成和运行批处理都可以,这里我就选一键生成 over 镜图了。 现在 over 镜开始自动投图,主包电脑太拉这一段就加速了, 可以看到 cdr 也自动出来运行了。 此时我们上拉软件,就可以看到软件已经运行成功, 如图所示,和 sq 一 样生成了三种格式的文件。首先检查 cdr 文件,种装的 cdr 还没来得及调出薄雾窗, 取消全部选择以后可以看到数字和曲线都是矢量化的,数字和英文默认的 april, 中文默认的黑体。 然后看欧若君的文件这个界面想后续修改颜色之类的也比较方便。 最后是 svg 的 史量图文件,我电脑默认浏览器打开实际是没问题的,因为设计的时候 cdr 文件就是用 svg 导入的,现在还只是初始阶段,后续会慢慢优化的。

强烈推荐大家去使用 open ai 的 ai agent 编程助手的终端 codex, 甚至你可以用 codex 来修复龙虾中的 bug, context 加 openclaw, 简直是天作之合,完美的搭配。而且啊, open ai 在 这个点上还真的是比较大方的, 如果原来你是 openai 的 plus 或者是 pro 会员订阅用户的话,在 codex 上面会给你配备一定额度的 token 的 使用配额。 大家好,欢迎来到玲姐说一 i 这期视频啊,我们聊聊同步在 windows 上线的 codex 的 使用,非常推荐,之前其实他在苹果的终端也上线了,所以我在这里给大家做一波强烈的推荐。 原来你在使用 cloud code, 同样的二十美金或者两百美金的这个订阅计划。大家知道那个配额啊,是很不够用的,稍微干点活就不能用了,就要另外买 token 了。但是 codex 使用的配额还是相对比较充沛的。 open ai 你 花二十美金每个月的订阅啊,给你整个的配额还是挺多的,又可以聊天,又可以申图,还可以用 sora 每天大概十到三十条的 这个使用条数,同时你还可以使用 codex, 现在苹果用户和 windows 用户都可以使用了,赶紧在电脑端把它下载下来。这个编码助手啊,也可以说是 cloud code 的 平替, 当然叫平替啊,也不太合适,我只是说 cloud code 在 这个领域上面我之前讲过,它做过很多刻意的练习,解决过很多开放性的生产任务,所以它整体的位置是行业老大的位置。我说这个领域啊,不是说呃,所有领域 是在这个生产工具的 call 顶的领域啊,它是属于引领的位置,而且它也一直在定义行业的标准,包括大家熟知的 m c p, skill, co work 等等的工作方式。但是呢, codex 这一波的上新呢,确实是有它的创新点在里面的,它用户的交互界面体验比较好, 对于那种比较厌恶命令行的这种交互方式的用法会特别的丝滑。它会有自己的特色,比如说像工作数这样的任务的并行的方式啊,我觉得对于多任务并行啊也特别的友好。另外使用它你基本不用付出 额外的成本和费用,更重要的是加持上了它最新的五点四的模型。 五点四最重要的一个优化是什么?就是它加强了在 computer use 上面的能力,也就是这个 agent 的 编码助手,它有更强的执行操作和理解的能力,相当于它的闭环能力更强了。 所以听到这里,是不是已经迫不及待去微软商店下载 codex 了?这期视频我会给大家介绍 codex 的 特性,以及如何从零到一。使用 codex 我 会给它几个实战任务,看看它这个过程中会遇到什么 bug, 怎么执行解决,会不会有翻车的情况。 如果你是苹果用户呢,直接在 app store 里面去下载就可以了。如果说你是 windows 用户啊,你是 win 十及以上的用户, 你就直接在微软的这个 microsoft store 里面直接下载就可以了,它的整个的下载安装非常丝滑,你就按着它的引导一步步完成就可以了,这里我就不做深入的演示了,这个就是 codex 安装后打开的界面, 是不是一股熟悉的味道扑面而来,特别像 try gpt 的 聊天窗口,对于那种使用命令式的交互窗口,仍然有一些抗拒的。这份使用者 codex 我 认为是一个非常好的选择。 在这里啊,你可以很好地过渡。我就结合 codex 的 使用,从零到一实操,给大家也讲讲 codex 的 使用特性。 首先啊,在设置这个地方,点开,大家在这里登录自己的 try gpt 的 账号,同时在这里可以很快地切换你经常使用的语言,英语或者中文都可以。在这个地方会显示你这个账号的额度, 它是通过两个维度限制你,一个是五小时的使用量,还有一周的使用量。如果说你真的做很多深度密集的 这个使用任务的话,我觉得这个额度可能还是不够。但是对于大部分的使用者而言,我认为这个额度啊,已经比 cloud code 要大方很多了,基本你们都是够用的。 在出事安装的时候,在这个地方,现在我已经弹点掉了啊,就是它会弹一个窗口让你安装这个沙箱。 这个专用的沙箱也是 codex 针对 windows 的 一个设计,有这样的沙箱,让它的整个的命令的执行在一定受控的环境里面,也可以有效地保护你系统本身运行的文件, 就按照它默认的配置去选就可以了。在下面这个位置啊,可以更改权限的范围,除非你非常笃定啊,给它完全的访问权限, 大份情况下建议使用默认权限。另外,在模型这个位置,可以选择不同类型的模型。 现在比较推荐初学者使用的是 g p t 五点四,因为五点四是一个综合型的模型,它既有理解能力,又有推理能力,还有 computer use 的 能力,还有 coding 的 能力,它是一个综合型的模型。另外呢,如果是针对专门的 扣顶的工作,可以选择五点三 context, 它是针对 context 这个环境和 context 的 任务,专门进行过优化的这么一个模型。 在这个地方,推理强度一般默认是高,也可以选择超高,当然这个背后所消耗的 token 数就会不一样。另外在加号这里啊,你可以去上传文件和照片, 这里就会有很多的玩法了,又可以对一些多模态的内容啊进行加工,比如说对视频进行剪辑。同时在这里可以调它的 speed standard 和 fast。 这里啊,我觉得它有一个做得很好的地方,相当于它在用户体验侧的一个优化,它这里有一个计划模式, plan 模式。其实这个技巧呢,我在之前给大家教学 chain 这个软件的时候,也会讲过类似的技巧, 只是说他现在把它单独拎出来了,对于这个功能进行了优化。你在做一些项目的时候,你可以先计划,先和这个 gpt 去沟通, 这个项目怎么规划,它的框架是什么,怎么设计,计划完了之后再开始执行 coding。 所以 从这个层面来说, context 它的定位啊,其实分为三层,第一层它是一个代码助手,它可以帮你写代码,解释代码,审裁代码。第二层,它是一个工程型的 agent, 它可以帮你去识别 bug, 修 bug、 提 pr 等等。而且它还可以做很多并行的任务, 比如说我在这里有个任务啊,你点击这个右击鼠标,在这里啊,它就有一个特色,叫做派生到新的工作树,叫做 walk g, 就是 你在做一个项目的时候,当它出现问题的时候, 你会发现可能有好几个东西要修。如果做过生产实践,你会发现啊,你修 a 的 时候, b 也在修,那么它们有可能把 a 修好了, b 又出了问题,就是它会出现相互的交叉污染这个情况。有了这样的 work tree, 你 就能够并行地进行很多工作任务,那么你发现没有,你的效率就提上来了。 codex 的 第三层,它还是一个电脑操作型的 agent, 比如说我刚刚讲的剪辑视频这样的任务,或者说其他的这个文件名批量命名的任务,整理会议资料的这样的任务,它其实都是电脑操作型的, 它也是一个电脑操作型的 agent, 这是我对 codex 这个 agent 工具的三层的理解。当你需要新建一个项目的时候,可以点击这个位置,这里点击 add project, 新建一个项目文档,然后在里面呢点击这个新县城。 同时呢,它这里有一个功能啊,叫做自动化,你可以让它定期的帮你制作一些任务,那么你就可以设置一些定时任务,比如说让它每天定期的帮你去搜集某个领域的专业信息,或者定期的跑一些这个整理文件文档的这么一个信息 等等等等。这里需要关注的一个点就是它的权限问题啊,你给它开多大的权限?当然它这里也少不了最近最流行的 skill 技能 这个板块我在 cloud code 的 这个视频里面讲过,它也是类似的,你看它这里,它的官方 skill 里面放在最前面的也就是 skill create 创建一个新技能的技能, 你在这里可以去调用它的技能啊,它不是那种命令的交付窗口。比如说你想要用这个 figure 码,你就可以点击这个加号,它就直接帮你安装了这个 skill。 如果说你想用这里面的视频生成工具,你就可以用这个 sora 生成视频的技能,并且啊,你想生成新的技能,点击右上角的新技能, 这里呢,它就自动调用了 skill creator, 你 就可以跟它去交互聊天,告诉你你要创建怎么样的技能,然后它帮你进行封装。并且啊,如果说历史你用的是 vs code 这样的终端,你也可以同步很好地去打开对应的项目, 很好的平移切换到这里。而且我自己用下来的体验,它会比 vs code 更好用一点。所以对于 vs code, 我 觉得大家可以放一放,然后平移切换到 context 这个终端来使用。下面我就讲一些具体的实操的案例来启发一下大家,可以用 context 做什么任务?它有哪些魔力?效果怎么样?好,我们进入任务实操,我先给他一个任务,我让他给我批量修改文件的名称。在这个文件夹里面我放了五条视频,这个视频是我 youtube 上面已经剪辑好的成品视频。 现在他的命名啊,只是有日期的标签,是没有主题的,我希望他能够基于这个视频的前六十秒所表达出来的内容抽取主题,把这个主题加上日期,对这些文件进行批量命名。 在 context 里面,我就把我的要求和希望达到的结果告诉给他,这里是我写的提示词。在任务的进行过程中啊,因为我们对它进行的是一个有限的授权,在一些关键步骤上面,它会来询问你的授权和意见。 比如说这里啊,它问你是不是直接就对这些文件名进行重命名了,你可以回答是,或者一直允许,或者是告诉他如何调整。这里啊,我就允许是 在这个思考过程中啊,他也会说,从命名的这个动作是越过沙箱的一步,可以看到,在这个过程中,你的文件,你的系统内的东西是比较安全的,这也是我比较推荐大家使用 context 的 一个原因。同时在这个任务跑的过程中啊,我再同步地开一个新的项目,新的县城, 点击这里的 add project, 创建一个新的文件夹, orange cad game, 然后选择这个文件夹,这样我就进入了一个新的项目文档。我现在想做的这个任务是类似这个经典的 flappy bird 的 这个网页小游戏这样的开发,把这个游戏的主角形象换一下,把那只经典的黄鸟 换成一只橘猫,飞行员稍微做一个调整。但是整个游戏的框架和逻辑啊,还是去参考 flappy bird 的 这个设计。在这里啊,我就把这个游戏的要求放到这个 context 里面。 注意啊,这个游戏的要求的需求文档和整体的项目框架,我也是让 g p t 给我写的,为什么我会这样操作呢?其实这也是一个技巧,因为虽然 open ai 在 codex 上面的配额还是相对比较大方的, 但是如果你要做比较极致的生产任务,这个配额可能还是不够,所以我就尽量可以省一点,把前面的需求设计和构建的这个阶段蓝图规划的内容交给 gptchat 去聊,用五点四 thinking, 这样子相当于前后的模型,是前后连贯的这么一个状态。先把需求沟通好, 然后呢,再回到 context 里面,在这里面我们还可以再极致一下,再细划一下,打开这里的计划模式,让它再给我规划一下这个游戏开发的任务。这里的推理功能,我选择一个超高,然后点击发送, 在右侧,这里就可以看到不同的项目文档,不同的县城,它们就在并行。如果说你比较关心的县城呢,你还可以使用这里的这个钉钉一下,它就会置顶在前面,这样子你关心的核心在修的一些 bug, 重点在做的项目就在最前面。使用了这么多款 编程助手的终端 app, 我 自己的感觉 projects 是 我整体用下来觉得最丝滑的。这里帮我把整个的开发计划规划出来了,包括需求理解,文件结构,关键接口,七步 mvp 开发计划,以及最后的验收,还有第二阶段的功能等等,都包含了。 他问我是否实施此计划,我点击确认实施。哎,这个文件夹从命名的任务已经完成了,他告诉我每个文件分别从命名了什么,而且他这里还讲了这个转写的逻辑是什么。前六十秒他识别出了 这个视频主要是讲什么内容的,然后提炼出的主题是什么,然后把这个主题加上日期格式的转写,变成了这个新的命名。我们打开 d 盘看一下, 欸,都命名好了,完成的很棒哦,以后这种批量重复的工作啊,都可以尝试交给 codex 来使用。当然对于这个 codex 这个工具啊, gpt 对 它的定位,还是说把它作为一个 agent coding 的 工具, 你要尽量让他做他擅长的工作。再回过头来看,他的执行路径是比较清晰的,因为他扫描发现我这台计算机没有装离线的音频转文字的转写的工具,这个不可用, 所以他就通过工具把这个视频的前六十秒进行抽帧,核心去保留底部的字幕区域。因为我的这个视频啊,有时候也会有这个背后贴了这个 ppt 的 信息,所以他会同时用 windows 的 ocr 去读这个字幕,以及 ppt 的 标题和页面的文字 综合来形成对这段视频主题的判断。最后呢,再把它整合成新的文件名,并且啊,它强调这次的授权仅在这个指定的文件夹里面进行操作,不能够碰其他目录的文件。 整个过程流程清晰,权限的边界也很清晰。这个任务其实对于 codex 都是非常简单的任务啊,我给他上一个高的推理权限,实际上也是有点大炮打蚊子的感觉。我想表达的是可以用 这个工具去执行以往我介绍的在其他终端的其他任务都是可以的,它的能力上限啊,和智能程度还是比较高的,甚至你可以用 codex 来修复龙虾中的 bug。 context 加 openclaw 简直是天作之合,完美的搭配。这个游戏的任务它完成了,总共花了十七多分钟,给了我这个试跑的链接。这个试跑的链接啊,就存在我的 d 盘里面的项目文档里面一个 html, 我 们在浏览器里面打开这个界面啊, 空格,点击上升穿门就得分,我们开始飞行试试。哎呦哎呀,碰到柱子了,再试一下。哎呀,还挺难的,再试一下。哎呀,这个有点难通过呀。 一分,哎呀,一分,结束了, 得两分。哎呀,得两分,这是我的最好成绩了。以上就是 context 的 介绍和实操,它可以帮你写项目,写代码,也可以帮你修 bug, 提 pr, 还能够做电脑的 computer use。 你 打算用它来做什么呢?欢迎在评论区分享你的想法,我们下期再见!记得订阅玲姐说 ai 的 频道哦,拜拜!

来看一下秋之 codex 的 一个教程,那首先来看这 codex 和 cloud code 的 一个区别,本质的话都是一个编程的 agent 转为一个通用的 agent, 一个的话是 anthonpy 公司,一个是 open ai 公司开的模型,那个支持 codex 的 话,请用这个 open ai 的 一个 gpt cloud code, 它可以替换任意的模型,你可以接入 deepsea, 对 吧? 接入一些其他的 kimi 啊,什么国产的一些大模型,易用性的话, codex 更友好,适合零基础的一个白领。 cloud code 它自由度更高,偏专业的一个开发者。 功能上来讲呢, codex 它强化了这个浏览器操作,它可以用,对吧?浏览器操作以及 computer use 内置 image 二,它这个深图的以及新增手机端加 hook, 手机端的话,它就是用手机就可以去操作。 cloud code 呢,功能更全。像这个 skill m c p 斜杠命令, hook 更新较慢。 skill m c p 它通用的接口一样的斜杠,用斜杠命令也可以操作斜杠命令,就像那个编程去写那个斜杠命令嘛, hook 更新较慢, 那这个 hook 的 话就相当于是钩子 hook 的 话,它其实就是一个自动地去调用的一些命令, 它就是相当于说呃有一些自动开呃自动触发的一个条件,自动触发的条件更新较慢。价格维度, codex 二十刀的会员的话,对于就白领重度水温的话都是够用了,不分号。而 cloud code 的 话是按这个 api 的 一个调用计费, a 这个 a p i 的 话,它就是去调用,调用这个什么,就调用这个 deepsea 它的一个这个接口去起用这个所呃用的这个额度, 但是我们自己在 deepsea 里面的话,它是就没有 api, 那 我们这个因为你就 cloud code, 它要用别人的模型,这个的话就要去计费了。适用的场景, codex 的 话,它可以用在日常那个办公解决问题, cloud code 的 写作规划,那编程的话,两者都可以给它结合在一起用是最好的。 然后 codex codex 的 安装与基础设置,首先要准备这个 chat gpt 的 一个账户,用免费或者是付费都可以的,它付费的话它就额度更高一点嘛。安装的话就是官网下载安装登录账号初使用的一个设置, 就选择一些日常的工作,选择你的一个什么身份呢?比如说你是学生,是白领,然后你是设计工作什么的。界面来说的话,它是左侧是对话任务管理,中间是进行聊天,右侧的话是输出结果,是非常简洁的一个界面,左侧的话是一个 任务管理对话,中间聊天,右侧就进行结结果,右侧的话就输出这个结果。核心的能力, codex 核心的能力,它与这个 cloud code 与其他的它特别 不一样的一点呢,它是本地的一个文件操作,本地文件操作项目关联,直接去绑定,绑定本地的文件夹,自动去读写,呃,增增删移动文件,不限数量。就比如说 cloud code 的 话,可能你想要让它处理一些文件的话,你就得 呃把这个文件给它上传到云端什么之类的,但是它这个本地的话,你只要去这个文件夹的一个路径给它写上去,那它能自动去读写增删移动文件,就比如说就是你有,有就是几百个,呃, 照片的一个素材,它不限数量嘛?照片的素,视频的素材,但是没有改名字,没有改名字怎么办呢?你可以这样子,需要这个 cloud code 去识别, 识别这个视频里面的内容,给它起一个合适的名字。那 cloud code 的 话它会自动运行去抽帧,就就是这个视频里面去抽几帧,去识别它的核心的内容。比如说雪地上的狐狸这样,然后它就可能给它一个序号,雪地狐狸, 对吧对吧?然后地点,然后在这个对象是什么?嗯,就这样子能够把几百个几百个这个视频它的一个名称都给它修改了。权限模式,就权限模式的话就是你给这个 codex 它的一个权限, 嗯,修改的一个权限默认的话是在文件夹内操作外外需的话就是齐全 自动审查,就 ai 自己去判断。自动审查,自动判断是推荐新新手完全反问全全全部的权限,就是说可能他把你一些东西都改了,删除了,慎用上下文的管理,自动手动压缩或者是斜杠去 给他进行压缩。上下文管理为啥呢?因为上下文的话他就是一个提示词的上下文,他会可能会给你消耗比较多的一个额度, 所以你给它进行压缩,当它就是已经处理到比较下面的任务的时候,可以把它的上下文给它压缩一下。 查看额度的话在设置设置栏里面去看这个状态,能够查看额度案例的话,就是视频的素材批量进行重命名,以及视视频的剪辑合并,都可以用这个 codex。 命令行工具,使用命令行工具的话就像是我们 嗯,电脑就嗯给他就 command, 给他呼起一个,对吧?嗯,比如说让他关机,那你写你就可以 就就是可以就通过通过输入那个文字让它关机,而不是用鼠标的一个操作,这个叫做命令行工具安装。可这个命令行工具可以怎么用呢?首先就是比如说可以安装这个 nod, js、 git 等基础的一个工具部署 agent, 像这个 hermes cloud code, 你可以直接在对话框里面跟他说帮我部署这个 hermes cloud code 等软件的一个管理是什么?像这个 cursor, 然后飞书 cleet, 它这也是命令行工具等的,就给他用安装技能工具。技能工具,你比如说我要去找一些 skill, 也可以让他自己去找飞书 c, 就是 飞书的命令行工具给它安装进来。并行任务是它的一个特特点, 就是多个对话同时执行不同的任务。你可以因为像豆包啊,像 deepsea, 它们都好像就就只能是当前的一个任务,给它回答完了之后它再去做别的,对不对?但它这个完全是可以并行的,就是多任务同时去 执行不同的一个任务。比如说我这视频素材批量重命名和视频剪辑合并的话,两个,或者是说你你另外一个,你去找一个合适的一些图片,合适的一些字体,对吧? 这两个任务是完全不耽误的,可以并行。而且这个理论上的话就是看你电脑的性能,它可以并行特别多的一个任务。 持久的记忆,手动记忆就是 agent md 的 话,全区性、项目性的手动记忆。 agent md 它就什么叫记忆呢?就是一些规则嘛,就是一些规则指令,像全区的话,在设置 设置里面个性化自定义指令,全职生效,它就是对于所有的工作它都就是,比如说你自字体是多少或什么样子的,是吧?它是全职生效的,像项目级就是指对这个项目生效的一些规则的一个记忆,你可以在项目里面手动地去创建 ai, 或 是说 ai 生成。 ai 怎么生成呢?你可以就比如说这个项目进行到一半啊,进行到一定阶段的时候,你可以让这个 ai 去生成一些, 就就是这个全呃,就项目的一些指令。自动记忆,自动记忆开启后对话闲置、自动总结、储存消耗额度,它是不建议手动改。什么叫自动记忆呢?它就是相当于 ai 的 一个自动记忆的功能嘛,就你的一个工作风格,你的一个 偏好什么之类的,有各种各种维度的,那它的话, ai 的 话它会自己进行总结,总结一些规则,然后可以有一些附用的经验的话,就是下一次的话它就会用。还有是 往下看呢,它是一个持久记忆。就图片生成与项目开发内置了 image two, 你 可以用一些就是提示词去生成这个高级感的一个图片, 而且可以不断的去调整自己的一些提示词,什么之类的。计划模式可以去做一个网页 复杂的任务,先列计划,再执行计划模式,他有点像是那个开发的模式案例的话,就比如说个人主页的一个开发,深层修改、预览部署是怎么生成呢?他个人主页的一个开发,你首先跟他说自己的这个 想法,那他的话会给你列出计划的一步一步,而且在每一步上面,他比如说你这高级感的一个图片的话,他会让你去选择某些风格的, 就一步一步去选择,他会给你三四个选择,那所以深层修改,而且右边的话,他可以预览整个个人主页的开发的一个效果, 最后部署的话可以就发布出去使用的功能呢?任务引导纠篇任务引导纠篇是什么意思?就是说你在完成这个任务的时候,你纠篇,你觉得啊,他这个说的不太对了, 你跟他说的话,他其实不会打断这个任务,只会在下一次的时候进行一个调整,这样的话就不会浪费很多的这个额度,嗯,而且也不会让他跑偏。对话分叉 fork, 他 是在就是整个 整个,呃,就是任务结束之后它会有一个 fork, 是 在这个右下角,右下角 fork 的 话,你会觉得它这是不是有点跑偏了你,你会想着说怎么给它纠正这个 fork, 这里面的话可以进行一些小调整。桌面宠物的话是 一个有意思的一个,就是小宠物在这边插件与操控常用的一个插件,它其实常用的一些插件的话,它就是一个 skill 啊, m c p, 然后包括 c c, 呃, c l i 的 这种 类似的一个集合就插件,它就是会实现一些功能浏览器的一个操作, get up, 然后表格 ppt net nullify however vocal 的 这个部署 browse use 的 话,它是浏览器的一个操作,怎么浏览器操作呢?它能够操控浏览器进行点击方页,然后表单自动化,就比如说你可以让它去做一个呃 m b t i 的 一个测试,或者说基于你的一个性格 去去帮你,帮你测试,它能够自己去选择,然后得出一个答案。 chrome 插件的话可以操控已经登录的浏览器,而且后台是它是在后台,后台多任务操作的,就根本不影响你,你自己去去做这个浏览器 的一个,对吧?你自己还要用这台电脑去浏览其他的页面,完全是 ok 的。 computer use 就 操控电脑的 app, 就 仅 mac, 比如说音乐微信剪映,比如说让它去打开一个音乐软件,把这个音乐发给微信,是吧?或者说就把这个音乐加到这个剪映里面,这个它可以操控这个电脑的 app, 仅在 mac 上是可以实现的。 skills 技能定义 skills, 比如 find skills, 自定义一些 skills 创建的话就是整个流程,流程跑通之后,你可以把这个整个流程怎么样,沉淀下来就附用,沉淀下来附用就直接指令,你就说,哎,就按照这个项目流程去创建这次的这个 skills 案例的话,比如说我想要去做这个 写一篇图文推荐的图文,就 get up 上面的一个热门项目的推荐图文,就在我就是不断地去给它调试后觉得这个结果是满意的,那就把上面的这个流程方法生成这个 skill 下一次, 对吧? ugetup 上面的热门项目就大概每周的话它都会更新,那它就是你每周可以做这个 skills。 m c p 连接 m c p 的 话有点像是 u 盘插口,插口去去把外部的一个数据连接外部的一个知识库服务去安装, 可以就是自己去做,也或者是说你直接让这个 ai 自动授权安装案例的话,比如说 notebook l m 的 一个知识库的连接,知识库连接之后你就可以直接去提问这个知识库里面的一个东西,调用知识库里面的一些 呃,就比如说它这里面存的一些呃反弹啊之类的。自动化定时任务创建的方法,可以在自动化面板上面创建,也可以直接跟这个对话,让它创建案例的话,比如说每周都给我 呃生成 get github 的 一个推荐图文,因为我们这个 skills 不是 已经沉淀下来了吗?然后现在的话就给它定时每周生成,那我们都根本不用去记这个事了,它就是它定它到,比如说周一或者什么时候它就会生成,或者说每日的工作日报的一个汇总, 它也能够给它定时生成,这就自动化的,自动化的那就怎么样子不用人为的去给它介入了。手机端的一个操控,前提的话就是这个手机要下载这个 check gpt, 然后电脑的 codex 更新到最新版本,操作的话就是手机端侧边栏的 codex 授权去连接电脑。 功能是什么样子的?手机端操控就是你远程你就电脑,对吧?你就开着那远程去下发任务,控制电脑干活, 直接能够控给他一个指令,他就能够控制电脑干活,免费版可用,支持 mac。 总结的话就是说这个 codex 的 核心能力是文件操控,而且是本地的一个文件操作命令行操作。持久的一个记忆,持久的记忆一些规则深图的开发 插件的操控 skills skills, 然后 m c p 的 话连接外部的一个知识和数据库自动化,可以自动化定时任务。核心的认知呢?我们现在已经从 问 ai 要一些答案,先到管理 ai 准备一些上下文的一个环境,制定目标,检验成果,去沉淀这个流程,去转变核心的认知。就是我们现在已经到了,就说从问 ai 要一些答案,到就是管理 ai 准备上下文,定目标,验 结果,然后沉淀这个,呃,流程,就让它这个整个流程的话给它自动化 sop 是 吧?

codex 是 openai 于二零二一年发布的 ai 代码生成模型。它是 gpt 三的一个变体,专门针对编程语言进行了微调。 codex 可以 理解和生成多种编程语言的代码,是 geekopopilot 的 底层技术之一,标志着 ai 辅助编程时代的开启。 codex 的 发展经历了多个重要里程碑。 二零二一年八月, openai 首次发布 codex, 并在 decopopilot 中投入使用。 二零二二年, openai 发布了 codex 的 改进版本,提升了代码质量和准确性。二零二三年,随着 g p t 四的发布, codex 技术被整合到更强大的模型中。 二零二五年, openai 宣布逐步淘汰独立的 codex api, 将其功能整合到 gpt 四级。后续模型中, codex 的 核心能力非常强大,它可以根据自然语言描述生成代码,完成代码补全和续写,将代码从一种语言翻译到另一种语言,解释复杂代码的逻辑,还能生成测试用力和文档符串。 此外,它还可以调试代码优化性能,生成 sql 查询等。 codex 与其他 ai 编程工具有显著区别。 codex 是 底层模型,而 gigabyte copilot 是 基于 codex 构建的产品。与 cloud code 相比, codex 主要通过 api 提供能力,而 cloud code 是 一个完整的终端编程助手。 与 chat gpt 相比, codex 专注于代码生成,而 chat gpt 是 通用对话模型。 codex 对 主流编程语言都有出色的支持,它包括 python、 javascript、 tax、 script、 go、 ruby、 java、 c、 c、 加加、 c 井、 rust、 php、 swift、 codeline 等。 其中, python 和 javascript 的 支持最为强大,因为训练数据中这两种语言的内容最丰富。 codex 在 实际开发中有广泛的应用场景, 它可以快速构建原型,自动化、重复性编码任务,为代码生成文档和注示,学习新的编程语言的语法,将遗留代码迁移到现代语言,以及生成数据分析和可适化代码。使用 codex 有 多种方式, 最直接的方式是通过 openai api 调用 codex 模型,虽然二零二五年后已逐步淘汰,更常用的方式是通过 github co pilot, 它集成在 vs code、 visual studio、 neowind 等 ide 中。 此外,还可以通过一些第三方工具和平台间接使用 codex 的 能力。使用 codex 时需要注意一些局限性。 首先,它生成的代码可能包含 bug 或安全问题,必须经过人工审查。其次,它的训练数据截止于二零二一年,对最新技术和库的支持有限。此外,它可能会生成受版权保护的代码,引发知识产权争议。 最后,过度依赖 ai 生成代码可能影响程序员的成长。虽然 kodax 作为独立产品已经逐步退出历史舞台,但它的影响是深远的。 它开创了 ai 辅助编程的先河,催生了 gigapopilot、 cursor、 rapid、 go stratter 等一系列产品。它的技术已经进化并整合到 gpt 四、 gpt 五等更强大的模型中。 未来, ai 编程助手将变得更加智能,更加上下文感知,最终可能彻底改变软件开发的方式。