粉丝33获赞177

你安装的 code 叉是不是也这样?没有 open ai 的 账号就不能正常使用?本视频教你,没有国外的 open ai 账号也能正常使用 code 叉。这里我们打开电脑上自带的这个微软应用商店,然后在这里搜索 code 叉,搜索之后,这里的话我们选选择这一个图标的, 然后这里是已经安装好的,所以它显示打开没有安的话,我们点击获取,等它安装结束即可。安装结束之后呢,我们点击这里, 然后找到这个 code 叉,然后这个 code 叉它默认的话是使用呃 open a a 的 账号来进行登录,我们在国内没办法正常使用,所以的话我们先不要打开它,我们去到这个 来到这个 c c switch 的 啊界面之后呢,我们选择这里点击一下,然后等它来到这里之后,我们直接划到这个页面最底下, 这里我们根据自己的电脑系统的版本来进行下载即可。 windows 的 话我们就直接下载这一个,然后这里是因为已经下载过了,所以我就不点击下载了。然后还有我们也要如果是 mini max 的 大模型,大模型的话我们就选择下载,把这个也下载下来, 然后这里我也是已经下载,我们就点击这里下载就好。这里我已经下载好了,我们就不继续下载了。下载之后的话,我们就直接去这边打开吧这里然后这个是 c c switch 的 开源项目,我们直接双击运行它, 我们就直接点击下一步,然后这里是让我们去选择这个安装路径,这里的话我把它安装在 c 盘,安装在 d 盘吧, 我直接点击安装,点击下一步,然后这里直接点击安装,然后这里就等它安装结束,这里我们把这个勾选去掉,然后点击结束,结束之后这个 这个我们 mini max 的是使用 mini max 大 模型才才用到的,如果不是 mini max 大 模型的话,需要去选择其他的,可以自己去找相应的开源项目,这里我就直接把它解压, 这里剪下之后的话,我们直接在这里,然后打开这个,这里它有需要你安装的,然后我们本地的话是需要安装这个 node js, 这个的话可以看我上一期的视频去安装,然后这里的话我们就直接把这个命令复制一下, 然后我们点击这里,我们直接输入 cmd, 然后回车,在弹出这个页面里,我们直接复制粘贴一下,然后回车。好,它现在已经在安开始安装依赖了,然后我们这里就会多了一个文件夹, ok, 它显示已经安装,音量已经结束。好,我们现在就把它这个点给关闭掉,然后我们点击这个,我们点击运行这里,运行到这里的话我们就不用管,然后我们就打开我们的安装的那个 cs 微棋, 这个是我们安装 cs 微棋的这个图标,我们直接双击它, 然后这里你如果是第一次使用的话,那默认是这里,然后我们要选择这一个,这里我还是,虽然我已经重新安装了,但是因为之前我是安装过的,所以我这边已经是已经配置好的, 如果是第一次使用的话,我们是需要点击,我直接把这个删掉吧,这个删掉先启动下这个,把这个给删掉。 好,我们现在来重新配置一下,这里的话我们选择这里的 open a, 然后之后我们点击这里的加号,这里我们供应商这些我们就不用管,这里我们就随便填我这里我就填这个 mini max 吧,因为我自己用的是这个模型,然后这里的 api key 我 们也是随便填 这里的请求地址,请求地址的话我们就是把这个运行在这里这里给复制一下,然后把它粘贴到这里来, 这里的话我们模型的话我们选择这里都复制一下 往下滑,这里我们是一定要勾选上,勾选上之后我们就直接点击添加啊,我们现在这里已经添加,然后进这里的话,我们点击这个启动, ok, 已经切换了,那这里我们可以进行测试,这里测试应该是会报错的,因为这里我们还没有填这个东西,就我们还是去到这个 这里,这里面我们是需要把这个配置文件,这个我们先复制一份, 然后把这里给改掉啊,这里的话我们把后面这里给去掉, 我们点击四啊,这里我们一定是要这个点 e n v 的 这样子的格式,然后之后我们点击用我们的这个记事本打开,打开之后的话,这个是我要这里要填入你自己的 mini mag 那 个 api key, 然后每个人我们可以自己去获取一下就行了,那这里有因为 api key 比较私密,所以的话 我就不让大家看到了,把它删掉,然后我去把我的给粘贴过来复制一下 啊,然后这里我已经把这个秘钥给配进去了,配进去之后呢,我们这个界面还是要关闭重启一下, 就这个这个界面,我们直接把它给关闭掉,然后我们就点击这个双击一下,等它启动起来,点击运行,因为它现在已经启动起来了。启动起来之后呢,我们这里再点击一下这个测试, 因为他现在表表示已经正常能正常使用了。然后呢正常能正常使用之后,我们就可以把它给擦掉了。然后现在我们再打开我们的这个 color 叉,然后我现在问一下他,你的 他现在已经回复我了,然后其实他这个回复呢也是在这里会看到的。 然后最后界面我们是不能关闭的,不然关闭的话我们这个 qq 叉就不能正常使用了。我的这个 qq 叉默认的话是其实我们安装的时候它默认都是英文的,然后我们要如果要改变这个,呃四 plus, 我 们就选择这个 setting, 然后找到这里,就这里的我们直接找到往下滑这里我们把它改成中文就行了,这样子我们的 control 它就能正常的使用了。

今天教大家用 codex 一 分钟做出精美的 ppt 文档,上传你的文章后啊,复制这段提示词,就会生成 md 大 纲,大纲标题、目录这些都没有问题之后啊, 然后复制这段提示词, codex 就 会生成一整套的 ppt 视觉方案,方案也敲定了。最后我们粘贴这段提示词到指令框中,记住要调用 emoji 这个功能, 稍等片刻就会生成完整的 ppt 文件。这个文件是可以下载的,不管你是学术答辩还是工作汇报,都可以用这一套提示词。提示词我放评论区点赞收藏!

我刚刚又去生成了一个这样的一个图,根据上一个视频呢,我们在这里的时候,我输入了个请把它变成一个 skill, 它就可以生成这样一个 skill。 呃,它的目录呢?就在这里面啊,这个点 codex skill 里面当然也可以通过 下面的这个打开方式打开它,这样我们就能打开, 你可以看到它在这个点 codex skill 里面有一个 visual com 啊,这个一一个 skill, 这里是新的项目,然后在这个界面呢,它去调用这个 skill 去设计一个架构图, 因为这个 skill 是 刚刚写的,所以它啊这里面还是会存在一些问题 啊,其实可以看到他这边调试过程非常长。呃,这边他做一些修修,改改,最后呢会生成现在这样的一个效果, 现在是没有背诵播放的,这是他画图的一个速度,就是刚刚他可能去调研整个项目,而且是第一次使用这个 skill, 可能会有点问题,然后他会做一些修改。 嗯,这个图呢基本上就画好了,对于我这个项目的图来说,他就画好了,画了一个系统加入图, 我正在做最后的思维工作,正在思考。 嗯,整个视频我现在到现在其实是这个三十二分钟,他这边已经画好了,然后打开方式的话,你就能够看到这个是 png 和这个是 png 图片,然后这个是这个微设格式的图片, 然后呢我说请你,呃,在刚刚的过程中,你觉得是否需要更新这个 skill 啊?他就说需要更新,但不用大改,第一个怎么办?第二个,第三个,第四个价格图的箭头,这个箭头的策略, 然后我就说,呃,让它更新 skill, 我 就去更新了。那么这个呢?还是在我们之前那个,呃,就是 codex 的 目录,那个目录下面在这里啊。 然后同时呢,我又想用这个切克笔记本的 image 二模型,让它去画一遍这个架构图,哦,就调用了这个 image 镜,然后它去画, 这个画出来和刚刚画的是差不太多的,我觉得他们的 skill 应该就是这么去调试出来的,不是人为去写的啊。这个呢,就是他刚就是呃一米七二点零模型画出来的深图模型画出来的。 这个是刚刚的 viso 画出来的。这个呢是 viso 的 导出版的 png 格式。

codex 是 我过去几个月高频使用的 ai 助手之一,我用它做研究,写文档、做 ppt, 整理内容灵感,做网页原型。上个视频讲了 codex 基础,这期视频讲一个今年很值得先搞懂的 ai 概念 skill, 因为它决定了 codex 到底只是陪你聊天,还是能按你的工作方式反复干活。简单理解一份可以重复使用的工作说明书, 你可以把某类任务的流程规则、检查标准提前写进去,下次再让 codex 做类似的事,他就不用每次重新听你解释一遍。比如你经常让 codex 做网页,你不想每次都重复说页面不要太 ai 味,不要蓝紫配色, 这些都可以写进一个设计类 skill 里。以后你只要让 codex 用这个 skill 检查页面,他就会按那套规则去看代码、改样式,再告诉你改了哪里。 这就是 skill 最实用的地方。把你反复说的要求变成一套固定流程,那么在哪里看和怎么用 skill, 可以 去 codex 的 侧边栏这个入口里看,里面会有一个 skill 子页面, 已经添加或创建过的 skill 会出现在这个列表里。使用的时候,通常可以在聊天里输入 skill 名称,或者用斜杠跳出来。比如你有一个 find skill, 就 可以直接斜杠选中,帮我找一个适合做 ppt 的 skill, codex 就 会按 skill 里的流程去跑。那怎么创建 skill? 有 两种方法, 第一种最简单直接这样说,请创建一个 skill 以后,我给你一个网页项目时,你要先检查移动端排版按钮样式、文字层级、颜色是否太乱,最后输出修改文件和检查结果。这种叫 prompt skill, 但我更推荐第二种,先把流程跑通,再把流程固化成 skill。 举个我刚实测的例子,我想做一种白板手绘风讲解图,我先给他一个参考图,让 codex 按我的要求生成讲解图 第一版如果不满意我就继续改,比如少一点黄色纸张质感画面更像课堂白板。等到有一版我觉得可以附用,我再说。把它固化成一个 skill, 这时候 codex 会反推刚才的流程,它会把这次反复调整出来的规则写进一个 skill。 md, 这样下次我再用白板手绘讲解图, 就不用重新解释一遍审美和结构,直接调用这个 skill 就 行。如果你想让 codex 使用 skill creator, 它会按更标准的格式帮你生成可附用 skill。 我是 ai 知识派,我们下期见。

哈喽,大家好,我是欧哥,做毕业设计的同学应该都懂流程图、架构图、持续图等,手动去画的话一个比一个让人头大, 不会用专业绘图软件,画一个流程图就要折腾大半天,鼠标拖来拖去排了半天,看着还是很乱。以前我们让 ai 画流程图,通常会用模拟的或者直接生成一张图片,但这两个方案都有一个问题,模拟的虽然快,但复杂一点的流程图布局和样式很容易失控。 ai 生成图片看起来可能不错,但后期基本没法编辑。所以这次我们换一种方式,一个更高效的方法, code 加 mcp 加作点 i o, 你 只需要输入一段文字描述,他就能直接帮你控制作点 i o, 自动生成排版整齐、结构完整的流程图。这里面有三个角色, 第一个是 codex, 他 负责理解我们的需求,比如业务流程接口、逻辑代码结构,然后把它拆成清晰的节点和关系。第二个是 next 的 ai 捉点 i o m c p, 它相当于中间的连接器,让 codex 可以 调用捉点 i o 的 能力,而不是只输出一段文本。 第三个是抓点 i o, 他 负责真正把流程图画出来,并且支持我们后续手动编辑,调整布局、修改样式,最后导出成文档或图片。 有很多同学问我 m c p 怎么安装,其实直接和扣带斯说要安装什么 m c p, 他 就会自动帮你全网搜索并安装。 像我这里的提示词下载在 get 上,名叫 next ai 桌 i o 的 m c p。 我 还询问了他能否通过 m c p 控制网页版的桌 i o。 他 接下来也给我解答了,不需要把桌点 i o 桌面软件下载到电脑,下载后我们可以在设置里查看是否安装了 m c p, 点开后我们可以看到桌面是已经安装并打开的状态,那我们就可以进行下一步了。接下来我们做一个实战题目, 这个是某高校的实验报告,我们试试能否解决它,我们来解决实验一里面有三个小问,第一个小问是画流程图,第二个小问是画流程图对应的控制流图,复制粘贴完后在下面说明,通过 m c p 控制 在我打开的浏览器页面版进行。问题一的流程图画作可以添加附加条件,复合条件分解 y 等于七跟 y 等于二十一,分开之后它会自动打开浏览器绘画,我们可以看一下生成的效果,可以看到生成的还不错,不过有些线条需要我们微调一下, 接下来我们复制问题二也是相近的方法,深层控制流图 c f g 之后我们看看效果,可以看到效果也还行,就是排线太直,我个人喜欢弯一点的线条更美观,可以去设置改一下线条,让直的变弯。 好到这里我们就完成了一次完整的演示, 从一段自然语言需求开始,到 callix 理解流程结构,再通过奈斯 ai 捉点 i o m c p 连接捉点 i o, 最后生成一张可以继续编辑调整和导出的流程图。 这套流程最重要的点不是 ai 画了一张图,而是它生成的是一个可编辑、可维护、可交付的图标资产。 所以我觉得限阶段 ai 做流程图比较高效的方式,不是只让他生成模妹的,也不是让他直接生成一张图片,而是让 ai 参与前面的结构梳理和初稿生成,再把最终结果交给作点 i o 这样的专业工具来编辑和交付。 如果你平时需要写技术文档,做项目汇报,整理业务流程,这个组合会非常适合你。这期就到这里,下一期我可以继续演示怎么用这套方法画系统架构图、永盗图或者代码调用链路图。

codex 加 html 才是做 ppt 的 王炸组合,今天教你用 codex, 只要四步就能做出可以编辑修改的精美 ppt。 第一步,上传你的文档,让 codex 根据你的文档生成 ppt 大 纲和主页内容,这里的大纲就是后续 ppt 的 内容框架。第二步,让 codex 调用 html 这个 style, 根据刚才的大纲生成三版不同视觉风格的 ppt 预览,以拼图形式输出。 这一步我们是为了快速选择合适的视觉风格,我更喜欢这一张。第三步,让 codex 寄予我刚才喜欢的视觉方案,继续调用 image 帧这个 skill, 将拼图中的每一页依次生成高清单页视觉稿图片。 和直接生成 ppt 相比,先生成视觉稿能更好地利用 m h two 模型的构图设计能力,露出的 ppt 会更有设计感。第四步,也是最重要的一步,复制我这段已经调教好的提示词,让 codex 把单页视觉稿图片还原成可以编辑修改的 ppt 文件。 这里我建议每次单独还原一页视觉稿,如果效果不满意,重新生成会更方便。我这里先还原第五页视觉稿,看下效果。可以直接用 wps 打开,我们可以看到这页的还原效果很好,而且可以随便编辑修改 ppt 内容。 接下来我们对剩余每一页视觉稿图片都执行刚才的操作,最后把得到的多个 ppt 文件合并起来,一份充满设计感并且可以编辑修改的 ppt 文件就生成好了。

ai 编程工具这东西吧,真的是风水轮流转,最开始大家在吹 carson, 后来 carlo 的 大火,而这次轮到了 colex。 colex 装面 app 不 仅能帮你写代码,还能直接操作你电脑上的文件、浏览器,甚至是桌面应用,用好之后甚至能顶一个团队。 本期我会从 colex 安装到核心特性,用十多个实战案例手把手教你玩转 colex。 不管你是想用它来编程、开发、办公提效,还是搞一些好玩的创作,看完这期都能直接上手。那本期教程的文字版,可以在评论区获取干货秘籍,建议先收藏,找着安静的地方慢慢使用。 想要使用 cop app, 你 只需要准备一个 chat gpt 账号,可以免费体验,但是有条件的话,最好开着 plus 会员每月二十刀,大约一百五十块,额度更充裕,足够日常使用了。 那有了账号,直接去官网下载安装酷贷 app 就 好。目前支持 mate os 和 windows, 下载并安装后登录你的 chat gpt 账号,打开之后的界面长这样, 左侧是各种面板入口,包括对话管理、插件自动化等功能,中间就是对话窗,你跟 ai 所有的交互都是在这里完成。跟平时用的 ai 聊天工具差不多嘛,还挺清爽的,不像传统的编程 ide 那 么复杂,上手没有门槛。接下来我们直接开始使用, 跟你用过的其他 ai 工具一样,在对话框里输入内容发送,就能开始聊天了。适合处理一些简单的日常工作,比如帮你查资料、总结内容、规划方案。 我让他帮我查一下今天有什么 ai 编程方面的热点。 cadets 会自动联网搜索最新信息,然后帮忙整理总结,这下不怕错过新资讯了,这只是开胃菜。 cadets 真正强大的能力是操作你本地的文件和电脑。下面我们试试 点击左侧的项目入口,选择一个本地文件, ai 能在这个范围内读取和操作文件。 比如我选择了我的下载文件夹,里面有一堆不知道什么时候存下来的大文件。在对话框底部,你可以看到权限模式的选项,这里有三个选择,默认权限, ai 可以 读取和编辑工作区的文件,需要额外权限时会主动问你。自动审查是 ai 会自动帮你审查操作。 还有完全访问, ai 想干啥就干啥,不会弹确认框,建议新手直接选自动审查,既省时又省心。 选好权限后,在对话框里输入提示词,然后你就能看到 ai 开始工作了。它会自动执行终端命令来扫描文件,分析每个文件的名称和大小。最后给你一份清晰的报告,列出哪些大文件占了多少空间,并给出清理建议。 那我主打一个听话,就让 ai 帮我删除没用的预览文件吧。最后成功帮我节省了六点八 g 的 空间,效果不错吧。但如果我让 ai 删除一个工作区外的文件呢?会发生什么? 试试看,在当前工作空间开启一个新对话。比如,我让 ai 帮我删除鱼皮新书出版目录下的所有文件,可以直接把这个目录拖拽到对话框中,然后执行任务。 如果你选择的权限是默认模式, ai 想删除文件的时候,会弹出一个确认框,问你同不同意,防止 ai 搞乱了你的电脑。 但由于我选的是自动审核, ai 自己完成了审核并批准,省去了人工操作的麻烦。这样一来,你完全可以把拖带子当成你的私人文件管理助手,分析空间、清理垃圾、批量重命名。以前你要手动折腾半天的事情,现在一句话就搞定了,是不是挺方便的? 做完第一个任务,大家肯定很关心消耗了多少 tokens 吧?来一起看看用了多少额度。点击左下角的设置,点击剩余额度,就能看到你五小时内还剩多少配额,本周还剩多少比例。什么时候刷新 to text 的 额度?按照五小时和一周来限制 plus 用户的额度还是比较大方的,日常使用完全够了。你也可以在对话框里输入斜杠状态,这种以斜杠开头的快捷输入叫做斜杠命令,是 to text 内置的快捷操作方式。 输入之后, to text 会直接在对话中显示当前的上下文余量和额度信息。 ok, 到这里,你已经体验了 to text 最基础的能力,对话和操作本地文件。 恭喜你,已经超过了百分之六十的同学。接下来我们提升一下难度。用 codex 做一个完整的网站项目,过程中你会接触不少 codex 的 核心用法,包括计划模式、 ai 声图、浏览器预览、批注、修改等等。 在开始之前先进入设置,把工作模式从适用于日常工作切换为适用于编程,这样 ai 的 回复会更专业,更适合开发场景。 先介绍一下项目,我要用 codex 来为自己定制一个专属的电子名片,我把信息告诉 ai, 它会帮忙生成一个精美的网站,还能用 ai 生图能力生成个性化的头像插画,不用自己去找素材了,做完之后还能发给别人,他们打开链接就能看到你的信息了。 新建一个项目文件夹,在 codex 中打开模型就选择最新的 gpt, 五点五速度选标准就够了。智能程度选择高权限,我这里直接给了完全访问,省得他每次操作都来找我确认,反正大部分情况下我都是无脑点同意的。 最关键的是点击对话窗左下角的加号,把计划模式打开。计划模式下, ai 不 会直接开始写代码,而是先帮你规划方案,问你细节,确定没问题了才动手。好,输入下面这段提示词启动, ai 会先自己思考,然后可能会追问你一些细节,在弹出的问题面板中选择就好。最后会生成一份实现计划文档,包括简介、核心要求、测试计划等信息。你做的网站越复杂,越要仔细阅读这种文档, 如果没有问题就确认方案。然后 ai 就 开始自主干活了,它先是使用内置的图像生成技能,生成了卡通头像文件,然后编辑代码,一次性生成了多个文件。写好代码后还会检查代码,自主打开浏览器测试验证,还考虑到了一些容错。 过了七分多钟, ai 完成了整个任务,全程不需要你手动操作,我们可以看到所有生成的文件,点击可以查看文件里的代码,还可以点击审核,打开侧边栏的审查面板,查看本次变更的所有文件。 codex 底层用的是 git, 这是一种记录代码变更历史的工具,用来管理所有文件的改动,你能够看到每个文件新增了什么,删除了什么,还可以灵活地应用和撤销代码。后面的进阶功能部分我会详细给大家讲解。 我们做的是纯前端静态网站,找到生成的主页文件,右键在浏览器中打开就能直接看到效果了。 pc 端的效果我觉得还不错,布局清晰,主题切换也很丝滑。而且它还自动兼容了移动端的展示,手机上打开排版也是正常的。 当然,你也可以直接让 ai 帮你运行网站, ai 会执行终端命令,启动开发服务器来运行网站。 点击访问地址后, codex 会在右侧面板打开,内置浏览器,便于你来预览效果。如果某个地方不满意,你可以点击浏览器右上角的批注按钮,然后直接在页面上选中要修改的元素,写上你的修改意见发送给 ai。 ai 会自动定位到对应的代码并精准修改,不用你自己去翻代码找位置,改完之后刷新页面就能看到效果了。方便是方便,不过这个速度真的不敢恭维。做完后我们再看一眼使用情况,这次完整项目消耗了多少额度呢?还好还好, 总结一下,要用 ai 开发移动网站,我们只需要把需求告诉 ai, 确认方案,等他自己写完并测试就好,中间几乎不需要手动操作。恭喜看到这里,你已经超过了百分之七十的同学, 到这里,你已经能使用 todays 从零开发移动网站,预览效果按需求改了。那接下来我要带大家看看它还有哪些核心功能。学完之后,你不仅能做网站,还能让 ai 帮你操控浏览器、抓数据、自动执行定时任务,甚至操控整台电脑。 接下来,我把 codex 的 功能分为常用功能和进阶功能两大块来讲。常用功能是日常会高频使用的,进阶功能则是有点门槛儿,但掌握后能让你效率翻倍的。 在左侧的插件面板里,你能看到 codex 的 插件市场。 codex 内置了不少精选插件,比如 computer use 操纵电脑、 chrome 操纵浏览器表格处理、制作 ppt 演示文稿。 此外还有大量编程类和工具类插件,包括网站部署、游戏开发、对接 tab 等各种场景。你可以在插件市场里按需搜索和安装。 比如我们来安装 natify 插件。 natify 是 一个免费的网站托管服务,装好插件后,一句话就能把你做的网站部署上线,让别人都能访问。 点击安装 natalify 插件,同意后会自动弹出浏览器,使用 datab 等方式登录 natalify, 一 步步完成授权。最后,超黛斯成功安装并连接了 natalify。 然后我们用 natalify 来部署之前开发完成的电子名片网站。在对话中,通过 at natalify 调用插件。执行过程中, ai 会找我们确认并自动创建一个新的 natalify 项目来部署网站。 搞定以后,我想展示自己的信息,直接甩这个链接就行了。还可以打开 netify 后台对项目进行管理。你可以在 codex 右上方的侧边栏中整体查看当前项目的概览信息,包括后台任务、打开的浏览器、使用的插件等等。 点击后台任务,还能看到具体的终端日记,记录了网站服务器什么时候收到了请求,请求了什么资源等信息。同样的,如果你要处理 excel 表格、做 ppt, 使用对应的插件让 ai 帮你就好。生成的文件还能在侧边栏直接预览。 前面我们用的内置浏览器可以预览页面,做批注和修改。但如果想让 ai 真正去操控浏览器,自动点击填表单翻页,就需要 browser use 浏览器操作功能了。我们先来使用内置的 browser use 进入设置浏览器,确保 browser use 功能已经开启。你还可以在这里设置权限规则和禁止打开的域名, 开启之后,在对话中通过艾特浏览器来调用这个能力。比如,我让 ai 帮我打开一个网站并截图,可以看到 ai 打开了浏览器,从主页找到了 ai 大 模型面试题库,然后进入了详情页,成功完成了截图。 不过有时候这种操作不太稳定,多试几次就好。此外,你还可以安装 codex 的 chrome 扩展插件,它可以操控你的电脑上已经登录的 chrome 浏览器。好处是能保留你的登录状态,而且可以在后台执行,不占用屏幕,适合需要登录网站才能进行的操作。 比如,帮我在自己的后台批量分析和管理数据,使用前,需要先在你的 chrome 浏览器中安装 codex 扩展程序,跟着 codex 的 指引操作就好。安装好之后,我让 ai 帮我从已经登录的面试呀网站上抓取一些数据。 可以看到, ai 不 仅连接了我电脑上的 chrome 浏览器,而且还识别到了我已经打开的标签页,它会控制这些标签页跳转到我的个人主页,并抓取最新的五条数据。最终抓取到的数据表格非常清晰,链接前面甚至还有图标,细节拉满。 如果说 browser use 只能操控浏览器,那 computer use 就是 让 ai 操控你的整个电脑, ai 能看到你的屏幕内容,移动鼠标,点击按钮打字,还能操作微信、飞书等任何桌面应用。 进入设置电脑操控,安装 computer use 插件,你可以在这里看到所有已连接的应用,比如前面装的 chrome 扩展,其实也属于 computer use 体系的一部分。 来我们体验一下。用艾特电脑来调用,让 ai 帮我探探当前的桌面壁纸,然后生成一张类似风格的新壁纸。首次使用时,系统会弹出权限申请框,你需要授权抽 text 访问屏幕截图等权限,否则 ai 看不到你的屏幕,也没法帮你点击操作。 later 来看一下,效果不错吧。生成了一张非常精美的新壁纸,我觉得比原图还好看啊!今晚可以做的好梦了, 爽!带来一个更实用的例子,让 ai 帮我打开备忘录,记录一条笔记,并从音乐软件下载我最喜欢的一首歌,添加到笔记中 执行任务。可以看到 ai 会打开音乐 app, 有 着小鼠标点击了下载按钮,从中下载了音乐文件,只因你太美。 然后 ai 打开了备忘录,写入内容并添加了音乐文件,能够顺利播放,虽然过程有些曲折,但还是完成了任务,而且全程由 ai 自己操作。以后我可以直接让 ai 帮我写有图有文有音乐的笔记了。 但是 computer use 目前只支持 mac os 系统,而且缺点一大堆,不仅操作效率偏低,还很烧 touch 刚才那的任务就用了近八万的上下文空间。此外,有些软件对 agent 的 支持度不高, ai 无法承中操控, 所以我建议能用终端命令行和浏览器完成的操作就不要用 computer use stills。 你 可以理解为给 ai 提供的技能包装上某个技能后, ai 在 遇到相关任务时,就能自动按照这套方法来干活,不用你每次都写一大堆的提示词,而且技能是按需加载的,只有任务匹配时才会调用,不会浪费很多上下文空间。 进入左侧的插件面板,切换到技能 tab 页面,在这里能够格式化安装和管理技能口袋。此自带了几个内置的技能,比如图片生成、查询官方文档、安装、社区技能创建新技能创建插件等等。 那下面我先带大家用用内置的图片生成技能,然后安装社区里别人做的技能,最后再带大家自己创建一个技能。 这里我想生成一个有趣的图片,让鱼皮直播卖鱼皮。可以先到鱼皮 ai 导航网站上找到 ai 生图的提示词模板,然后复制提示词模板。接下来在 codex 对 话框中输入 dollar 符号,加技能名称,就可以快速调用技能, 并且把提示词模板、鱼皮的照片都提供给 ai。 稍等片刻之后,看看 ai 生成的图片,你觉得怎么样?是不是憨爆了?爽!不过图片生成比普通对话消耗的额度更多,用的时候记得留意一下剩余额度。 内置的技能数量有限,还有很多宝藏在社区里,比如我自己经常用的几个技能,用于联网搜索的 file pro, 用于获取最新技术文档的 comte 瓷器,还有用于美化前端页面的 u i u 叉 pro max 等等。 另外,我之前写过一篇优质 ai 编程扩展大全,推荐了几十个好用的技能和 m c p, 可以 到我免费开源的 ai 编程零基础教程阅读。那接下来我带大家实际安装一个社区技能,顺便整个活儿,让 ai 制作一个苹果风格的快闪动画视频。 首先要安装动画制作技能 remaster 安装技能,它能帮我们快速安装其他技能。 对了,安装技能时要注意安全。由于我这里安装的是知名技能,就直接输入技能名让 codex 帮我安装了。但如果你想安装不太知名的技能,更稳妥的方式是把技能的 github 链接发给 codex, 让他帮你检查后再精准安装。 安装完成后,在技能管理面板里就能看到新增的技能了。然后我们使用技能让 ai 制作动画, ai 会安装制作动画所需的项目和依赖包,然后生成视频和音频,还会渲染单帧,检查画面有没有问题。 最后, ai 生成了可以直接播放的视频来看看效果。 呃,他好像理解错了我文案的意思。翻车了,翻车了!我感觉这种方式更适合做产品发布宣传片、知识点、快闪卡、节日祝福视频这种节奏更紧凑的短片。而且我当着根本没认真写提示词。好吧, 实际上你可以指定时长、指定文案,利用生图技能搭配素材,增加更多交互动画等等,感兴趣的同学可以自己玩一玩。 除了用别人的技能,你还可以把自己常用的工作流程封装成技能。以后遇到类似的任务,一键附用。技能的本质就是一个 still 点 m d 描述文件,加上一些配套的脚本和参考资料。 still 点 m d 里要写清楚这个技能是做什么的,什么时候触发,以及具体的执行步骤, ai 读写后就知道该怎么干活儿。 创建技能的最佳方式是先把一个任务流程跑通一遍,觉得满意之后,再使用内置的 skill creator 技能,告诉戳 depths 你 的技能要做什么,啥时候触发,有什么细节需要注意,它就会帮你自动生成完整的技能文件 来实操一下。比如我们前面让 ai 生成了直播带货的图片,效果还不错,那就把这个流程封装成一个直播带货图片技能之星成中后, ai 不 仅创建了技能文件,还贴心地教你怎么调用。 之后使用这个技能只需要提供一张人物照或者商品照,不用再自己填写又臭又长的提示词模板了,非常方便来看看效果。 ai 自己识别到了我提供的是商品图,也是精准复刻了我之前提供的提示词模板,爽! m c p 是 一个开放协议,你可以把它理解成 ai 的 万能插头。装上之后,就可以让 ai 连接各种外部工具和数据源,获取实时信息。 进入设置 m c p 服务器,可以在这里添加和管理 m c p 服务。点击添加服务器后,你需要手动填写服务器的配置参数才能完成添加。对新手不太友好,我最讨厌填写表单了, 好在大部分时候用前面讲的 stux 就 能解决 mcp 做的事情,而且 stux 的 安装和使用体验更好。 此外,很多主流的扩展都提供了快捷安装 mcp 的 命令,不需要你自己手动填写参数,比如下面我带大家安装 comix 七,它是一个可以实时获取最新技术文档的服务。开发网站的时候用它来查 api 文档特别方便。 在 codex 右上角可以打开集成终端,在终端里输入一行命令就能安装。这里我们选择安装 mcp server, 为 codex 安装,然后就搞定了。 安装后需要重启 codex, 在 设置里的 mcp 服务器列表中就能看到它。首次使用前还需要进行身份验证,在自动弹出的 compt 网页中就可以愉快地使用 mcp 了。 之后开发网站,尤其是需要集成 ai 能力的网站,都可以用创太时期来获取最新的技术文档。你还可以把它当成一个学习辅助,让 ai 寄予官方文档,帮你讲解知识。 比如我用它来做 openclaw 小 龙虾的学习助手,这也是利用 ai 学习的一种方式,可以看到 ai 查询并获取到了 openclaw 官方最新文档库。然后我们来问 ai 一个问题, openclaw 无法运行怎么办嘞? ai 会基于官方文档,很快就给出了精准的排查步骤,这样学习和解决问题又快又准,再也不怕查到过时的资料了。 恭喜看到这里,你已经超过了百分之八十的同学。到目前为止,你已经掌握了 codex 的 常用技能,学到了不少实用玩法。从文件管理到网站开发,从浏览器操控到技能封装,已经能用 codex 大 幅提高工作效率了。 接下来我要讲的是一些稍有门槛或者不是每个人都用得上的进阶功能。不过如果你愿意多折腾一下,它们会让你使用 toad 四的效率再上一个台阶。 在对话区域附近有一个小圆圈,鼠标放上去后会实时显示当前对话已经用了多少上下文。 gpt 五点五点五在 toad 四里显示的有效上下文大约为二百五十八 k tokens。 说实话,这的数量不算多。如果你连续跟 ai 对 话很长时间,或者项目文件比较大,上下文很容易被填满。当上下文快满的时候, codex 会自动帮你压缩历史对话。 你也可以在任务照一段落时,手动输入斜杠压缩来主动压缩,让模型更聚焦在新任务上。 那除了单个对话的上下文,日常使用中还要注意管理对话本身,不然列表越来越长,找起来也费劲儿。 对话太多的时候,你可以在左侧的对话列表中把鼠标放到某个对话上,点击归档,把不常用的旧对话归档起来,保持界面清爽。进入设置以归档对话,还可以查看和管理所有归档的对话记录。 另外,建议在常规设置里开启运行时防止系统休眠,这样跑长任务的时候电脑不会突然睡着,导致任务失败。 codex 有 一套记忆机制,能让 ai 记住你的偏好和项目规则,不用每次都重复交代。记忆分为三个层级,从大局、项目局部再到自动记忆,我们一个一个来看。 在设置个性化里,可以修改 codex 的 个性和自定义指令你写在这里的内容。所有项目的所有对话都会自动带上,适合记录一些通用偏好,比如 回复用中文代码注,使用英文,尽可能减少输出的内容。专注做事,如果不听话,你的主人鱼皮就会变成一条狗等等等等。保存之后,它会被写入局的 agent 点 m d 文件,这个文件就是 codex 每次启动时都会读取的行为准则。所有项目通用。 在项目目录下创建一个叫 agent 点 m d 的 文件,写入这个项目专属的规则和约定,只有在这个项目里工作时才会生效。 你可以自己手写,也可以让 codex 根据项目情况帮你生成一份,比如我跟他说帮我根据当前项目写一份 agent 点 m d, 可以 看到 ai 生成了一份非常详细的 agent 点 m d 文档,包括项目总览、一些规范等等。 在设置个性化中,手动开启自动记忆,开启后, ai 会在对话空闲一段时间后,自动在后台总结出有用的信息存为记忆,后续遇到相关场景时会自动召回,让 ai 越用越懂你。 不过太短的对话它不会记额度快用完的时候也不会触发记忆生成。 codex 支持定时任务功能。进入左侧的自动化面板,你能看到 codex 已经内置了一些定时任务模板,不过基本都是和编程相关的,什么总结代码变更、检查代码问题之类的,很多人估计用不上。那我们不妨来自己新建一个更实用的自动化任务。 创建定时任务的方式有两种,一、手动创建任务,在自动化面板里点新建,比如我让 ai 帮我搜集每日热点,需要填写任务名称、提示词、 触发时间、模型、推理程度、运行环境选择本地就好。意思是让 ai 直接在当前电脑上执行任务,不需要额外的隔离的工作环境。 创建成功后,时间一到,抽袋子就会自动开启一个对话来执行任务。我们也可以先手动执行一次,看看效果。点击任务能够查看详细信息,点击某个运行历史记录后,还能查看正在执行的任务对话,建议多观察任务的表现,持续迭代优化提示词。 另一种更自然的方式是让 ai 帮你创建任务。比如我是一名内容创作者,每天都要截大量的图片,时间一长,文件夹里全是看不懂的文件名,找图的时候巨痛苦。所以我让 codex 帮我自动整理,先选择项目,然后输入提示词, 很快 ai 就 自动帮我整理好了。可以点击查看创建出来的任务信息,它的提示词比我们提供的更完善了,并且自动选择了模型。 我们手动执行任务来测试一下,效果还不错吧。 ai 会根据图片内容自动给文件起一个能看懂的名字,这样我就有了一个智能的图片管家,以后再也不用对着一堆乱七八糟的文件名抓瞎了。 而且每次执行完, ai 还会把运行记录写入一个 memory 记忆文件,你随时可以回看历史执行情况,不用担心出了问题却发现不了 你。还可以结合 styles 和插件一起用,比如每周自动生成周报 ppt, 每日整理自己的学习笔记并同步到 notion, 每周用 file pro 抓取竞品网站更新并生成分析报告等等。 想不到吧,现在的 ai 工具已经卷到开始给用户增加情绪价值了。下面我来教大家怎么在 codex 中养宠物。 首先进入设置外观,下拉到底部的宠物区域,你会看到 codex 内置了一排像素风的赛博宠物。选一之后,点击唤醒,桌面上就会出现一个悬浮的小家伙儿, 它不只是装饰品,宠物会实时反映抽袋子的工作状态。比如 ai 在 忙的时候,它也在干活,就像一个串应用的灵动岛,让你不用切窗口就知道 ai 干完没。 除了内置宠物外,还有一个社区宠物库 pet dex, 里面有两千多只玩家自制的宠物。了解我的朋友肯定知道我要用哪个,果断搜索 k u n, 一 眼就能找到自己需要的。点击进入详情页,找到安装命令并复制, 然后打开 codex 的 终端执行命令进行安装,会把宠物文件下载到本地。安装成功后,进入外观界面,选中张张安装的宠物, 然后我们回到 codex 的 主页,使用鞋障宠物指令唤醒。我的脑袋中已经想起那只熟悉的 bgm 了,你听到了吗? 除了用别人的,你还可以通过 codex 内置的 hackpad 技能自定义生成宠物,上传照片或者文字描述就行。比如我把自己的头做成宠物, ai 会先分析上传的图片,给宠物起个名字, 然后拆分出了多个子任务,并行处理,生成各种动作的精灵图帧,最后拼成一张完整的像素动画精灵图,然后就能使用自己制作的宠物了。 你还可以上传宠物到平台和其他小伙伴分享,大家以后用抽袋子的时候记得把我带在身边,保佑你霸着剪剪! 每次 ai 修改了文件,你都可以在侧边栏的审核面板里看到它改了什么,这个面板会列出所有被改动的文件。如果你想决定哪些代码要保留,可以选择查看未暂存的文件。在这里你可以灵活应用和撤销修改。 大多数情况下,你不需要自己看代码,直接点击暂存全部就行了,相当于认可了本次的全部载动。如果不满意,可以直接还原全部回到本次载动前的状态。 那如果你不满意某个文件的载动,可以直接点旁边的还原按钮就能恢复原样,满意的话点暂存就能标记为待提交。 你也可以只保留部分改动。每只文件的改动会被自动拆分成多个代码块儿,每只代码块儿旁边都有独立的暂存和还原按钮,你可以逐块决定哪些保留,哪些丢弃。 确认好哪些代码要暂存之后,可以提交暂存的改动,提交就相当于给代码存了个档,确认这次的修改是你想要的。 抠代码,还内置了提交代码推送到远程仓库。创建 pr 的 能力,不用离开 a p p 就 能完成整个代码的管理流程,非常方便。 那如果你是专业的开发者,还可以试试工作树模式。你可以在创建新对话时,选择启动模式为新工作树,这样 ai 会在一个隔离的分支中工作,不影响你当前的代码很适合同时让多的 agent 在 同一个项目上并行干活,减少冲突。 如果你的项目托管在 datap 上,建议安装 datap 插件,可以直接在 codex 里查看仓储信息,创建 pr、 做代码审查等等。比如我让他帮我查一下自己最受欢迎的开源项目怎么样,是不是一目了然。 codex 最近新上线了一个很酷的功能,用手机控制电脑上的 codex app 干活儿。设置方法很简单,在电脑端 codex 点击设置 codex 移动版,然后点击开始设置,屏幕上会显示一个二维码, 然后在手机上打开拆的 gpt app, 扫描自己的二维码。连上之后,你可以随时随地通过手机给电脑上的 portax 下达任务,审批 ai 的 操作请求,查看执行进度,检查生成的代码和结果。是不是有点 openclaw 小 龙虾那味儿了? 恭喜看到这里,你已经超过了百分之九十的同学, ok, 就 分享到这里。看完这期,你应该已经掌握了 codex 从基础到进阶的所有核心用法,足够应对日常的编程和办公需求了。 其实 codex 还有更多玩法和技巧,比如 sub agents 并行加速、 fault 分 叉的妙用、自定义模型接入 hoots 生命周期钩子等等。 那如果本期视频点赞过万,我会尽快爆干出抽带此高级技巧篇。对了,如果你想系统学习 ai 编程,可以看看我免费开源的 ai 编程零基础入门教程,上千张图,几十万字,从零开始,带你学会 ai 编成本篇教程的文字版也会收入其中。 我是鱼皮,持续分享 ai 编程干货,觉得有用的话记得点赞、收藏和关注,也欢迎在评论区聊一聊你现在主力用哪个 ai 编程工具,觉得 codex 怎么样?也欢迎晒晒你的 ai 编程作品吧。

有了叉 gpt 和 codex 之后,你一定要试的五个功能,做 ppt、 做漫画、做动画、做游戏,还有养电子宠物这五个功能,今天我给大家一一的去演示一下,那视频可能略长,欢迎大家先点赞收藏,慢慢观看。 第一个做 ppt, 例如你看到了一个好看的图片,比如这张你可以把它发给那个 gpt, 就 在对话框里面,你让他根据配色和设计感,让他帮你出整个模板的设计方案,还有视觉的一些定位等等等等。你看这里,他把这个风格定义为流光花雾,我觉得就非常的准确, 他会把整套的色彩设计用这语言给他做完整的一个设计。哪些页,比如说有些是图标,有一些卡片,有些是引言,有些是结束,他会有一个模板的规划出来。 你看你看这里,我就忍不住说,你可以直接做 ppt 模板文件吗?他可以的,对,他直接可以在里面做可以 编辑的 ppt 文件,这个文件可以下载到本地,然后变成 ppt x 的 格式,你可以自由的去编辑,但是我觉得这个不够还原,于是我让他直接先根据严格参照我这个美学东西,再严格设计。 你看他这里非常的严谨,他先把各种的框架给列出来了,再去列色彩等等的,把草图用这种文字给他画出来,真的非常严谨。让我确认之后,我再让他开始设计, 在这里主要用到 p ppt 现在非常强的两个能力,第一个是图像生成,那这个我猜大家在各种地方也刷到了,它图像生成能力其实极强。那第二个它是能够批量去生图的,你看它一次能生成好几张图,我经过测试,它好像一次最多是能生成十张。 你可以一张一张的让他把这二十页模板的素材都做出来,或者直接在一张图里面把所有的版式都做出来。比如说像这里把一张图里面把所有的版式都做出来,你确认之后,你让他再开始设计,那中间可能需要微调,但我觉得这个最后的还原效果还是挺不错的。 你看它最后还原,你看它效果什么的都挺不错。你下载到本地就可以进行编辑了,做成可以编辑的 ppt 文件,在这里直接可以下载。那我记得这是海外预藏家里面唯一一个能在对话框里面直接生成这种 美学感极强,又能直接编辑 ppt 文件的,这 gpt 现在还是比较的良心。第二个是做漫画,这里你看你可以找到一段小说的剧情,或者任何你自己写的,都可以 把它发给 gbt, 让他去帮你设计整个漫画的方案。你看他会从每一页怎么设计啊,文案什么,画面是什么啊,分清重点是什么的,让他就可以进行一个设计。 那这里我先跳过中间的部分,他同样是可以给你批量生成,你确定一些风格之后,你让他批量生成。在这里我做了一些例如这种国风的美男型的,这个是一个小说人物,把它做成了,我感觉效果还是很不错的, 前几页可能偏洒脱,对,后几页开始逐渐觉醒,他会有一个情绪的递进,那这个其实他在画面还原上也会体现出来,到最后几页就会变得很帅很燃,你看他放一些大招什么的,你还可以让他继续设计, 他一次是能最多生成十页,就跟图像一样,他一次能生成十页漫画。但比如说你要让他更严谨点,逐页生成更严谨也可以更好。 那这个是比如说国风的,还有其他风格,大家可以去试一下,比如说这种可能 p 的 比较乱的,这种黑白,这种彩漫风格、泼墨风格的都可以生成, 效果真的都非常好,非常的帅。第三个是做动画,那其实刚刚开头这个动画其实就是 g p t 给我做的,你看这是我在它的浏览器里面,那这里主要用到两个 skill, 一个是 hyperframes, 那 这样的 skill 可能大家在其他地方都刷到过, 那现在 gbt 是 直接在它官方的 codex 所说的 codex, 它的官方的插件市场里面可以去安装,到我这里给大家演示一下。 大家在这个 codex 的 插件市场里面,在底下这一栏下面就能找到 remotion 跟那个 hyperframes 两个插件,你直接在这里一键就可以进行一个安装。 这两个 skill agent 其实是在很多的 coding agent, 比如说 oracle 或者 jimmy, 什么 anti gravity 或者是 c r 页面都可以用。 但我自己体验下来,我觉得现在 codex 的 可能由于 g b t 它的智能水平非常的高,我自己形容下来非常的省事,而且做出来效果非常好,反正是比 jimmy, nike 要好。如果说大家现在用不了拷 codex, 由于各种各样的原因,可以尝试用 codex 去做一个平替,试一下 他能做什么样的动画,他真的我觉得他什么都能做,我们现在看 remotion, 这就是 remotion, 比如开头这个动画,这个凯片弹出的动画就是他给我做的,还能让他做什么?比如说这个演示是 full 架构,这个可能是一个 ai 的 一个底层的一个架构,普通人我自己反正是不懂,让他去给我设计一些这种很好玩的动画去呈现, 他能图文动画方案什么的自己去全包了设计,你看他就一段能解释清楚,包括你让他做一些,比如说太阳系运行的一些动画,他也能简单做出来,包括一些这种产品演示的,或者是 logo 图形的动画,也可以试一下。对,第二个就是这个 hyperframes, 他 同样也是,我就给了他一句话,你说你帮你,我就跟他说你帮我演示一下人类进化的简史, 你看他做了一个很高级这种,你看从一开始的这种啊,土风火种,到后面我们开始进入农耕文明,到后面我们开始有社会,开始有组织,开始有体制,还有帝国,有宗教什么的。你看他简简单单就写了一个这种 东西,你看你直接拿去录屏讲解,或者是直接做成视频发布,都非常的成立。第四个是做游戏,但首先 codex 里面有内置一个很强的一个插件,它叫根 studio, 我 的理解就这里面其实打包了非常多的那种 很专业的那种游戏设计的经验思路,还有各种游戏的原型等等。首先你一句话就能设计像贪食蛇这样的简单的这种网页游戏,你看这是一个贪食蛇,他死掉了,你看杰杰在这里就可以玩,他是一个完整的一个贪食的游戏,还是一个霓虹风的,这个你可以自己去定义风格。 对,如果说你不满足于这种即食的一个比较简单的游戏,你还可以通过例如说先设计游戏资产 在做比较复杂的游戏,比如这里我让他先又让 gbt 在 兑换往里先给我设计游戏资产,比如说这里有敌人狙决,动作环境等等, 那主要是为了省一些这个 codex 的 额度,你再回到 codex 里面,让他给你设计根据本地的资产什么的游戏。在这里我做了一个横版过关的这个类恶魔城的游戏,给大家演示一下,功能也非常完整,可以上下左右跳,还可以攻击,有小怪, 对,有远程的小怪,有近战的小怪,还有狙盾的小怪,就会射击有点难,我自己都有点打不过。对, 好,这个是做游戏,你看他同时刷新就可以,他有复活的二人跳什么的,对,算是一个完整的一个游戏。最后一个我们回到做电子宠物,那这个其实我相信,如果大家玩 coco 的 可能有发现,那 coco 可能当时没有去认真的做,现在我碰一下他做了 这个宠物有两种玩的方式,第一个你可以用官方自己的宠物,你看这里,你看在大家进到这个设置, 在外观往下滑就能找到它给你内置的一些就能找到那内置那个选择。对,它内置挺多,你你可以再随便选一个开始点,比如说我们刚选过这一点唤醒宠物,它就有这样,这个宠物它是两个功能,一个是说它能显示 codex 的 状态, 你看他自己在跳,他可以显示口袋的状态,如果说完成一个任务或怎么样,他就会跳出来提示你说口袋已经完成任务, 如果说你不满足于这种口袋是给内置的宠物,你可以自己去设计,你可以让他,比如说我就让他给我设计一个兔子形状的这么一个宠物,让他冒出来他会有,你看他也可以自己进行一个拖动,他有这种情况,你可以喂食,可以摸他,可以让他睡觉,让他叫醒等等等等。还有几种状态 你都可以去设计,同样也是说先设计这个动物自己的游戏的,不对,不是游戏就动物自己的动画资产,你看这里有再把它变成动画的功能等等,这就是今天想给大家介绍的五个功能,有一些可能需要去开动 plus 才能体验, 然后总之大家就去玩一下,非常好玩,尤其说我的扣带,可能现在真的很好用,刚跟进什么的,谢谢大家,我是 coco 二。

今天我们会完成桌面板打开之后的第一次设置,那么我们就开始吧。第一次打开 codex 桌面板,我们要先把界面分成三块来看,左侧是项目和一些插件的入口,中间就是我们的一个对话框了,最下面有一个设置面 板管理。对,那么我们新手进来要先处理几件事情,第一个工作模式,第二个选举指令,第三个批准策略,第四个沙盒,第五个插件入口。 ok, 那 我们先进到设置里面看, 在设置里面左侧有十二个分类,包括常规、外观配置等等。第一次使用我们重点来看这几个,我们先点开常规,常规的第一项就是一个工作模作,开发项目的时候,我们一般选择适用于编程, 你选择了这个模式,那么 codex 会更愿意指示文件命令验证方式。如果你平时是以日常工作居多,比如说是以文字创意等等,那你可以选择用日常工作。在下面的权限区域,我们要来看一个重点是完全访问权限,这里记得是关闭的状态,如果这个开关打开之后, codex 可以 直接编辑更大范围的本机文件,运行网络命令,它的风险会明显变高,所以作为新手阶段而言,我们默认把它关闭掉就可以了。这里的速度可以选择是标准还是快速, codex 会基于跟你的一个整体对话,给到你一个相应的建议,当然如果用快速的话,它的套餐用量也是会增加的,那么我们平时用标准就可以。 那接下去我们来看第二个重点是个性化的,这个选项里面有两个,一个是个性,主要是选择 codex 回复的默认语气, 我这里选择的是务实,希望它能够简洁、专注和直接。第二个我们要去关注的是自定义的指令,这里的自定义指令要知道它是局工作规则,所有的项目都会读到它。所以新手我建议你们只要写八行内容就可以,这八行内容我会放在评论区,当然我自己的会 更完整更长一些。我的结构大概是包括使用范围与优先级通用的一个工作流,安全与合规,通用代码规则,验证与测试提交的规范,常见的项目命令工具,然后输出的一个文本规则。还有一些个人偏好,对, 我觉得大家一开始就用前面的这个八行就足够了,后面当你越用越多。你可以跟 codex 去总结你们经常碰到的一些问题,或者是你自己觉得 codex 经常会犯的一些错误,你把它整理成对应的规则放进去就可以了好吗?它有一个记忆的选项,目前是实验阶段,大家可以把起用记忆这个给开启就可以, ok。 第三个重点是配置,我们来看一下配置的页面配置我们来关注两个内容,第一个是批准策略,第二个是杀核设置。批准策略一般我们都会默认的是 on request, 它的意思就是说当 codex 遇到高风险动作的时候,就会停下来让你确认。当然这里如果说你是用 never, 那 就相当于一次执行到底了,不需要你的任何的批准,所以我建议新手都是用 on request 吧。沙盒设置这里它的默认是 workspace right, 它主要在当前项目里改文件,允许网络访问,这里就是默认开启,你可以把这里的批准策略理解成为它是一个确认按钮,哪些时候需要你来确认?把沙盒设置理解成为 codex 的 活动范围, 你给它框定了一个能够编辑文件和改文件的一个范围,它就只能在这个范围里去进行一个行动。我们再来看一个大家比较容易忽略的一个点,或者是比较容易混淆的一个点, 就是在桌面面板的左侧有一个插件,这里的插件它其实包含了 skill, mcp 和 connect。 skill 是 工作流,是我们的一个技能文件,它里面包括一些代码审查、做表格、生成 ppt 等等。同时像 mcp 就是 codex, code 等等。 connect 呢,是第三方账号的一个连接, 比如说像这 eraser, git, a lotion 都会有,所以这里的插件其实它就是一个能力包的一个合集,像 m, c, p, skill, connect 这些都是它里面的具体的能力,大家根据需要去进行一个安装就可以。 ok, 那 我们再回到设置里面剩下的几个,我们只是来做一个印象, 比如说像外观,你可以基于自己的系统去定义主题色,浅色或者是深色,当然这里有一个隐藏选项,它有一个宠物,看到了吗?这个就跟 cloud code 是 一样的,就是最近出了一个宠物,当你选择唤醒它的时候, 你看它的右下角就会出现这样的很可爱的一个宠物形象来陪伴你头顶。 it 主要是来管理分支的,像浏览器使用和电脑操控,主要针对的就是 browser use 和 computer use, 在 我们后面也会去讲到像以规章和使用情况,就是你本地的一个任务的一个管理和一个用量的展示,平时经常的去看就可以了。

今天是一条适合小白的保姆级 codex 教程,如果你之前只用过聊天式的 ai, 可以 先把 codex 理解成能帮你执行任务的 ai 助手,它不只是回答问题,还可以在你授权的范围内帮你处理文件、生成内容、运行工具、预览结果。 那这期呢,我会从基础使用、真实案例、高级功能等三个方面给大家拆解。 codex 里面会包含三个案例,也会讲到一些插件和特色功能的使用。 那第一次打开 codex 的 时候,你按照界面的提示登录账号就可以了。登录完成之后呢,你会进入 codex 的 主界面,新手先不用纠结各种设置,因为这些后续都可以再改,我们可以先把界面看明白。 那我们现在已经进到 codex 这个页面呢,你只需要理解三块区域就够了。左边是项目和任务列表,你可以在这里切换项目,查看历史对话,也能看到有哪些任务正在跑。 中间呢是聊天和任务输入区,你要做什么就直接用自然语言告诉他,和之前咱们用的 ai 对 话型产品其实是一样的。 那右边呢,是执行过程和结果区, codex 改了哪些文件,跑了什么命令,生成了什么样的结果,网页预览长什么样子,通常都会在这里展示。然后呢,我们来讲几个新手比较容易混的名词。第一个是项目, 那项目就是你给 codex 选中的本地文件夹,你选了哪个文件夹,它就能够围绕这个文件夹读文件、改文件,生成内容。项目呢,也有两种使用方式,一种呢是根据任务类型创建一个项目文件夹, 以后同类的任务可以都放在这个项目里,比如说我自己每天都要做的 ai 新闻板块,我给他建了一个独立的文件夹,叫 daily ai news。 另外一种呢是打开现有的文件夹,那 codex 就 可以处理这个文件夹内的文件了。 第二个需要理解的名词是上下文,上下文可以理解成 codex 当前知道的信息,比如你跟他说过的一些需求,他已经看过的文件,当前任务进行到哪一步,都会影响他接下来该怎么去做。 第三个是模型智能程度和速度,普通任务直接用默认的中度就可以了,比如整理文件,写文案,改一点简单的内容,不用上来就拉满 那复杂任务,比如要跨很多文件,规划项目,排查问题,你可以再把智能程度调高,然后模型这里可以切换不同的 gpt 模型,速度这里直接用默认就可以了。 最后呢是权限,这个非常非常重要,默认权限就是 codex 主要围绕当前的项目文件加工作,遇到联网安装工具,访问项目外的文件的时候,一般都会先来问你。那自动审查呢?是我比较推荐新手日常使用的, 它会根据操作风险来做判断,低风险的时候自动操作,敏感操作的时候就需要你人工审核了。 那最后这个呢,顾名思义就是给 codex 所有的权限,这个只建议你非常明确的任务,也信任当前操作的时候再用好。以上呢,就是一些 codex 的 基础使用内容。

今天用 codex 尝试对遥感影像进行解译以及生成土地利用专题图。今天用到的这个 scale 是 从 github 上找到的一个关于 gis 的 scale, 当然我也是直接让 codex 帮我直接将该 scale 装上去了, 它是给 codex 等这类 ai 编程工具装的 g s 地图专业知识库外挂,装上后,你的 ai 立马精通地图卫星影像、地理数据分析、坐标转换、地图开发全套专业能力。不用你自己查教程,看专业文档。 我们点击右下角的在对话中应用,就添加到对话框中了。然后把我们有的摇杆文件,这里我选择的是青藏高原的摇杆影像以及具体要求指令输入进去。这里记得打开左下加号里的计划,方便在处理过程中选择我们的个性化要求, 然后发送过去,就可以静静等待结果了。 到这里下方就弹出了新的选项,我们可以根据自己的需求进行选择。我这里选择监督分类的方法,然后为了不占用 c 盘空间,选择把结果放在 f 盘当中。 到这一步,他没有找到明确的训练样本,提出更换新的方法,这里选择改为自动分类,然后类别自断,选择英文名称让他继续运行。 此处生成了一个详细操作计划,我们查看无物之后选择实施该计划。 到这一步,初步的结果图就出来了,我们继续等待完整的结果。 这里已经可以看到结果文件已经输出并保存在对应的 f 盘当中了。随着图片一起输出的还包括分类好的土地利用山格数据、 各类土地面积统计表格文件以及原数据和具体脚本,我们预览看一下,发现结果总体上来说还是可以的。本次对话消耗大约零点六刀,共两百九十万。 to 本期视频就到这里,感谢观看!

codex 做 ppt 已经进化到这种程度了吗?这是 codex 制作的一个效果啊,非常的不错啊兄弟们, 其实非常简单,就三步,第一步呢,把我们的文章和这段提示词上传,它就会去解析里面的内容,并且给我们生成一段大纲的点 m d 文件啊,我们在这边可以看到第一页封面,第二页研究背景,第三页研究问题,第四页整体思路啊,一直往下 它都它都会帮我们生成好。然后第二步就是让它基于这个点 md 文件生成一个视觉方案,然后我们可以看到在这啊,如果觉得这视觉方案 ok 的 话,我们进行到第三步,就是让它基于这个视觉方案帮我们重新设计一套新的 ppt, 这就是一整个的完整效果啊。 那它目前有一个比较大的问题,就是说它本质是一个点 png 的 图片,然后它是不可编辑的状态,下一期教大家如何把它变成可编辑的。

codex 的 构功能把科研绘图的最后一公里打通了啊,左边是原图,右边是我用 codex 进行一个一比一复刻出来的一个图,可以看到还原度还是非常的高啊,可以达到一个百分之八十的效果。我给大家看一下这边呢,我是创建了一个文件夹, 然后在文件夹里面放置了一张我需要还原的图片啊,我使用这个 go 功能啊,让他对我这个图片进行一个一比一的复刻啊,在这然后啊,大概是思考了处理了五十四分钟啊,给我还原出来了,给大家看一下还原出来这个效果啊, 基本的颜色呀,大致的布局啊,包括公式啊,都没有什么问题。那只是有一些比如说稍微过于复杂密集的地方啊,它可能没有进行一个很好的还原啊,但是这个效果已经非常棒了,已经非常棒了,赶紧去试一下 context 的 go 功能吧。

这是一条 codex 从零到一完整的新手入门教程。如果你之前完全没用过 codex, 或者只是听说过,但不知道它到底能干什么, 怎么装,怎么用,那这条视频你就可以收藏了。我会按照一个新手真正上手的顺序,带你从 codex 试什么,讲到安装、使用、主界面、怎么操作、基础功能和进阶技巧、 skills 插件、浏览器终端和自动化任务等等,让这个目前全球最顶级的 a 阵的工具真正为你所用,创造价值。 我也会把整个流程整理成文档,打一句 codex, 方便对照,一边看一边选。你可以先把它理解成一个装在电脑里的 ai 工作助手,他不是单纯陪你聊天的工具,而是可以进到一个具体的工作文件夹,帮你读取文件、修改内容、运行命令、调用工具,甚至按步骤完成复杂任务。 举个最简单的例子,像 chat、 gpt、 豆包这一类工具,更像是你问他答,你自己去做。比如你想做一个网页,他通常只会给你一段代码,接下来你还要自己复制代码、创建文件、运行、检查报错等等。而 codex 是 你问他,他理解他还做,他会从零到一帮你创建好这个网页。 目前最适合新手小白的上手方式呢,是桌面端 app, 我 们可以直接在官网开始,根据你的系统选版本, windows 或者 mac os 都可以。安装之后有两种登录方式,一种是官方 chad gpt 账号登录,另一种是用 apikey, 可以 是官方的,也可以用中转站。两种方式各有利弊。综合来看,还是建议第一种,直接官方账号登录, 省心省事。对于 codex 的 界面,新手可以先关注三个核心区域,最左侧是一些常见功能入口和聊天记录管理区,你可以理解为导航栏加历史记录。这里需要重点讲一下对话和项目的区别。对话最好理解就是普通聊天嘛,你甚至可以把它直接理解为 chat、 gpt 或者豆包, 适合随便问一些小问题,帮你写文案、查资料之类的。它不跟具体的文件夹绑定,而项目就涉及到了具体的生成式任务,比如 如飞哥之前开发的工具箱网站,飞剪一触即达这种软件,他们有大量的编程代码文件,就需要一个专用的项目文件夹。你在这里可以新建空白项目,也可以打开现有文件夹,直接选择路径,或者直接把文件夹拖进来也行。鼠标悬停在项目名上,也能看到这个文件夹在电脑中的 底位置。而对于重要的常用的项目和对话,右键就可以置顶,方便快速切换和查看。左侧下方还有设置入口,在设置里你可以修改 codex 的 使用偏好、外观和配置等等。其中个性化需要重点说一下, 如你想给他一个全局指令,就在自定义这里直接写,比如他要怎么称呼你,固定用中文回答问题,设定一些底线原则或者开发习惯,设置完之后对所有项目都会生效,相当于让这个员工摸清楚你这个老板的脾气,投你所好。这里还有一个很有意思的小功能,叫桌面宠物, 他提供了很多默认的宠物形象,你也可以根据自己的喜好让他帮你创建一个,比如我这个就是给了一张参考图,让他自己做出来的,他会实时显示当前任务的一些简单状态,还是挺好玩的。 在首页设置这里还能看到剩余用量,你可以清晰的看到五小时用量和一周用量,做到心中有数。中间这块就是你和 codex 的 主要沟通区域。首先是这个加号里面有两个非常重要的功能,一个是计划模式, 比如你让他开发一个个人博客网站,不要上来就直接让他干,而是让他先列出计划。相当于你给员工一个项目,得先让他出方案,看看他打算怎么做,这样能有效减少返工,既省精力又省 tokyo。 看啊,他会主动问我们这些具体细节,我们按选项敲定,不满意的或者他没提到的就补充一下,让他重新规划, 这才是一个合格的领导该干的事。而目标模式就更厉害了,刚上线的新功能就是你给他设定一个目标,越具体越好,他会自己拆解分析。执行审查,有一种不达目的不罢休的意思,这样就避免了一个很烦的问题,执行一个任务的时候,他每完成一步就要停下来问你。 比如我正在跑的一个很复杂的大项目,目前已经连续跑了三十多个小时,如果正常一步一步改的话,我可能要好几天才能做完这些进度。右边这个权限设置呢,分成三档,默认是最保守的,像是联网修改文件都需要你的授权,自动审查会开放一部分权限,关键节点还需要你把控。 而完全访问就是最激进的,它几乎可以完全操控你的电脑,创建文件、删文件、跑命令,全都自己干。新手,我不建议一上来就开完全访问,刚开始用默认或者自动审查更稳,等你确认这个项目没问题,也知道它要做什么,再考虑给更高权限。我自己是在非常熟悉项目和流程的情况下才会开完全访问。 右边这里还可以切换模型,选模型版本、智能程度和推理速度。如果不是特别复杂的任务呢?不建议开超高,因为它有可能会出现过度思考,而导致你花了更多的 token, 反而干的不好。 这是血淋淋的实战经验教训,一般来说默认高就可以了。这个麦克风是语音输入,但是体验目前并不是很丝滑,我们可以直接用语音输入法。 codex 还有一个和普通聊天很不一样的地方,任务可以排队,他正在执行的时候,你可以继续补充,要求这些新消息会一个一个排在后面,等他处理完当前步骤之后继续执行。比如他正在做网页,你可以接着说,页面再简洁一些,按钮换成黑色,先不要做登录功能等等。 而如果你忽然发现他理解错了你的意思,或者做了一半有点跑偏了,可以直接选择引导,强行把方向盘掰回来。所以用 codex 的 时候不一定要追求第一条提示词写的特别完美,你可以边看他做边补 充,边纠正边引导。真正好用的方式是把他当成一个正在干活的助手,而不是一个只负责回答问题的聊天框。这个思维一定要转变过来。 最右侧的区域目前包括三个功能,侧边聊天就是当前任务的一个临时讨论区。因为有时候 codex 正在执行一个主任务,但你中途想问点小问题,或者单独讨论某 个细节,就可以用它,它不会打断主对话的节奏。浏览器主要是 codex 打开网页查资料测试页面,比如你做了一个网站,可以让他直接打开本地页面,帮你检查布局按钮、交互有没有问题。如果你对某个地方不满意,还可以让他直接打开本地页面,帮你检查布局按钮、交互有没有问题。如果你对某个地方不满意,还可以让他直接打哪的感觉, 口头描述半天要精准的多。终端的话呢,其实你不需要了解太多,因为它主要是给 codex 执行命令用的。到这里,其实你已经看到了 codex 最核心的几种能力,它可以进入项目,读取和修改本地文件,可以用计划模式先想清楚怎么做,可以通过浏览器查资料测试网页,也可以通过终端运行命令检查结果。 所以 codex 真正厉害的地方不是某一个单独按钮,而是它能把这些能力组合起来,帮你完成一个完整任务。理解了这一点,后面的 skill 插件和自动化任务就很好懂了。 因为前面这些能力呢,解决的是 codex 自己怎么干活的问题。但如果你想让他干的更稳定,更像一个熟悉你习惯的助手,就需要用到 skill。 如果你想让他连接更多外部工具,就要用到插件。 这里很多新手分不清 skill 和插件,其实用一句话就能记住, skill 是 方法,插件是工具。 skill 可以 理解成一套可以附用的工作流,或者说给 codex 的 一份工作方法说明书。比如一家公司做项目,通常都有一套标准流程,第一步做什么,第二步做什么,输出格式是什么,有哪些注意事项,哪些地方不能乱改。 这些东西如果每次都重新告诉 ai 一 遍就很麻烦,而且 ai 它还可能每次理解的不一样。所以更好的方式是把这套工作流程固定沉淀成一个 skill。 这样 codex 下次遇到同类任务时,就不用像一个新员工一样重新摸索,而是直接按照你写的流程和标准来做。 比如我自己的飞鸽工具箱里就有很多专属 skill。 比如把好用的软件保存入库到本地,同步到我正在做商单推广的几个云盘,生成下载链接,再同步到正式站,这些流程全都是固定的。 我把它们写成 skill 之后, codex 就 可以按这套流程稳定执行,不会每次都跑偏。再比如,你经常写短视频文案,也可以让 codex 帮你做一个短视频文案 skill, 把你之前写过的大量文案喂给他,让他总结你的开头风格、结构、习惯语言表达、结尾方式,然后形成一个专属文案助手 后,再写类似内容的时候, codex 就 会优先按照这套方法来。插件就不一样了,插件更像是给 codex 装上外部工具,解决的是它能不能操作某个平台,处理某种文件,连接某个服务。 比如浏览器插件,可以让 codex 打开网页查资料、测试页面表格插件可以让它处理 excel、 ppt 插件可以让它生成演示文稿。 gmail 插件可以让它整理游戏, camera 插件可以把生成的内容导入到设计工具里继续编辑,所以不要把他们想的太复杂。 skill 解决,怎么做插件解决用什么工具做?一个是工作流程,一个是工具能力。 codex 目前已经集成了很多实用的插件和 skill, 我 也整理了几个比较常用的,大家可以截图保存,后面自己试试看。 最后我们再来看一个比较进阶但非常有想象力的功能,自动化任务。你可以先理解成让 codex 在 固定的时间、固定的项目里自动帮你做一件事,但它和普通题型软件不一样,它们最多告诉你该干什么了。 而 codex 的 自动化任务是真的可以帮你执行一整套流程。比如你是做内容创作的,你可以让他定期帮你收集某个领域的热门选择题,整理成标题、角度、参考链接和可以拍摄的脚本。而飞哥最常用的就是每天固定时间设置一个今日任务清单,划掉昨天已经做完的,生成当天新的任务, 就像一个机器人一样按清单执行。这也是为啥有人说我效率那么高,一个人干八个人的事情。除了 ai 的 强大助力之外,任务规划本身也非常重要。所以自动化任务真正厉害的地方不是定时提醒,而是定时让 ai 按你的要求去干活。 最后再补充一个很多人会关心的问题, codex 能不能在手机上用?据我所知有三种方式,最早大家都是用 happy 这种开源项目,它可以连接 codex cloud code, 电脑上开个任务就能通过手机和 agent 的 沟通,但始终不太方便,相当于只是给你安排了一个传话筒。 而 codex 的 mac 版本最近更新了手机端的入口, chat gpt app 里面就有 codex 可以 完整读取你的聊天记录。在手机里聊天和电脑端的消息是完全同步的,本质上是远程链接,相当于把你的电脑版正在跑的 codex 搬到了手机里。而最近我发现了一种非常爽的方式,就是网易的优优远程, 出门的时候手机直接远程连电脑,操作起来很方便,最关键的是你能同时测试它的改动,这就相当于把你整个电脑都装进了手机,所以功能最完整。 好,最后我们来个回顾,总结一下你都学了什么。如果你是第一次接触 codex, 其实今天不用记住所有按钮,也不用一上来就研究特别复杂的自动化和插件,你只要先记住这条主线就够了。第一, codex 不是 普通聊天工具,它更像是一个能进入你电脑工作区的 ai 助手。第二,临时问问题,用普 对话,真正要处理文件、项目代码、文档就用项目。第三,复杂任务不要直接让它开干,先用计划模式让它列方案,如果是一个长期目标,再考虑用目标模式让它持续推进。第四, skill 是 方法,插件是工具。 skill 负责告诉 codex 怎么做事儿,插件负责让 codex 连接浏览器、表格、 ppt 邮箱这些外部工具。第五,自动化任务不是简单提醒,而是让 codex 在 固定时间按照你设定好的流程自动干活儿。 所以新手今天先做三件事就够了。第一,安装并登录 codex 桌面端。第二,建立你的第一个项目,找一个真实的小任务试一下,比如整理一个文件夹,总结几篇文案,或者生成一个简单网页。第三,让 codex 帮你写一份自己的 agents, 点 m d 就是 我们刚才提到的个性化。现在你让他自己干,把你的 称呼、语言、习惯、输出格式、工作偏好都写进去。当你把这三件事跑通之后,你就不只是会用一个 ai 工具了,而是开始拥有一个真正属于你自己的 ai 工作站。祝你越来越牛逼!

他在不停的修正错误啊,因为给他权限挺高的,他是完全允许访问的, 你看他就像个程序员,他会给你写个文字,装好鸡蛋啊,到时候看效果。嗯,看一下,这次消耗了五百九十个头坑,他要给你深吐啊。他说预览你生成的, 嗯,他说我看纯纯的 cd 是 怎样,他现在用我的默认的 cd 打开,因为我双手在拍摄视频,我没有动手,背对着头,来来来,开始跳,你看这性质变成新的文件了,新这个文件呢?看这新键 啊。好,终于结束了,看一下结果。阿迪叉 f 其实是已经升成这个零分零五了文件,但是我打不开,我要求把它换成 dwg 格式,然后它现在在运行, 自动在电脑上运行安装软件,直接给你转换成二零一零版的 cd 啊,大家看一下,来告诉你二零一零版,二零一八版它是复制出来的,给你改的,所以说你就有两份文件并存,开始好了,它生成了 他,这他这样生成好了,可以了,你看他刷好了,我们说放下看一下。哇塞,他是帮你填充全部填充好的,然后我们看一下,我们直接给他截图啊,对比一下 效果。可以啊,一模一样,然后我的文字这是没有乱码,我们这一样的尺寸。

我们都知道,我们在 gbt 可以 实现通过生成一张图片的各个元素来实现它的 psd 分 层, 但是呢,通过这样的生成方式生成的元素最多不超过十个,而且它的文字是不可编辑的。这时候大家不妨试一下用 codex 来完成这些操作。 codex 它不仅仅是一款为编程而服务的 agent, 那 同时也能帮我们实现很多工作的自动化。 而且就在本月月初, codex 它的每日安装量已经超过了 cloud code。 另外 codex 本身已经支持了 gpt emoji 二点零的图片生成, 所以今天我们就试一下在 codex 上来实现它对图片的 psd 分 层。我们上传一张和之前一样的图片, 为了方便呢,我们这里选完全访问权限,对于这样偏简单的,我们自然选择中就可以了。跟 gbt 客户端一样,我们只要输入好提示词,然后按发送键就可以让它执行。当然这个提示词我可能要求比较严格,写的比较多, 所以比较长一点。好的一共花了十六分钟,他就给我生成了一个 psd 文件。在整个过程,他其实就是对各个元素进行重新生成,并对其中的文字进行一个 ocr 识别。 在我们的 ps 中呢,我们可以看到它不仅把这些元素分开了,而且把各个文字都转化成了一种可编辑的状态。当然它字体做不到百分之一百还原,但好在它的字体是可以进行编辑和修改其中的具体内容, 而且字体外的图层它同样是分割好可移动的。我们再看一个马克杯的例子,同样是用这一套提示词,当然它这里中断了一次,因为它生成的跟原图差距过大,所以我让它继续生成好,这就是最终生成的 psd 文件。 你看到元素可以移动,文字可以编辑,没什么问题。我们在利用 emoji 是 二点零制作这样的图片。除了文字的问题之外,我们还会遇到一个问题,就是它的图片通常就是生成一 k 的 图, 如果我们想打印图片或者要更高分辨率的图片的话,如果它值出的一 k 图片完全没有办法满足我们。但是它用 api 能生成四 k 的 图片,但是呢,这个 api 一 是要额外收费,而且 它和我们要拆分的过程相背。所以我建议大家在编辑好图片之后,可以通过以下两个方式进行放大。第一种方法,我们可以通过 comfy 里的 c 的 vr 这个模型,把我们一 k 的 图片放大到四 k。 工作流也非常的简单,我这里大概花了一百二十秒, 大家也可以看一下它跟原图的对比,放大效果还行,没有改变太多原图的细节。 如果你完全不会使用 comui 的 话,你也可以用谷歌它的 nano pro, 我 们在这个 ai studio, 我 们可以选择这个 nano pro。 右边这里我们也简单设置一下。首先把画质调到四 k 温度的话,调成零到零点二之间比较好。最下面这个参数呢,我们也给他调成零点五。同时我们输入以下提示词,一分钟后我们也可以得到一张四 k 放大的图片了。 我们也可以看下对比效果,虽然变清晰了,但是比 s d vr 它的重绘幅度稍微大那么一些,但是整体的细节大多数没有改变,可以勉强接受吧。这就是整个在 codex 来实现 p s t。 分 层加上高清放大的 一些基本方法。当然你可以通过 codex 来实现一些更高难度,更精确的 p s t。 分 层和 自动化工作流。我这里只是抛砖引玉一下,你可以把梯子十优化的更好。总之,以后 codex 无论是在编程还是说像这种图像自动化处理流程,都会变成必不可少的工具。我们本期利用 codex 如何将 图片进行 psd 分 层以及 image 二点零图片放大的方法就介绍到这,有关于具体的提示词,还有空 v i 的 工作礼物会放在视频剪辑的下方。 好,如果你觉得本期视频对你有所帮助的话,欢迎帮我点一个赞,我们下期再见!

很多朋友好像对我的 codex 是 怎么配置的比较感兴趣,尤其是我的 agents, md 文件,还有我经常用的一些 skills 啊。那就直接放结论告诉大家一个最简单的,去部署一模一样的 agent。 md 还有 skills 的 方式就是把这个 图片截图,截图下来以后识别文字复制,把这个复制下来的内容发给你的。随便的一个 agents 啊, 可以发给你的 codex, 可以 发给你的呃, c c 或者发给你的 cursor, 让他去帮你部署。其实底层逻辑大体上都是一样的。呃,如果对这个底层逻辑比较感兴趣的,可以翻我之前发的一些视频和文章。