codex 用了三个月栽过的坑里有一个让我直接反攻三次。今天把五个最容易踩的坑全告诉你,别走我的老路。第一个坑,不写 a 整数的 md 就 开干 codex 没有约束的时候,他会自作主张,你让他修一个 bug, 他 顺手把整个文件重购了。 agent 打 n b, n b 不是 文档,是给 ai 划禁区的法律。第二个坑, sandbox, 用默认配置默认一下。 codex 的 可读范围比你想的大,生产仓库一定要加上 codex vgr write, 把它锁在工作目录里 这一行参数,避免后患。第三个坑,也是让我反攻三次的那个 context 不 清场,跨任务污染。我连续让 codex 干两个不相关的功能,中间没清空上下文, 结果他把昨天 a 功能与 user id 字段的命名规则和今天 b 功能的订单接口混在一起,代码看上去能跑, review 时才发现命名整个对不上,我重写了三遍才理顺。后来我每开新任务 b clear 这一个习惯救了半条命。 第四个坑,审批模式直接开全自动,听起来爽,实际上 codex 偶尔一冲动就把你的依赖所文件删了,或者把分支 force push 掉。全自动模式只在一次性沙盒目录里用真实项目永远开人工确认或者 on failure。 第五个坑,验收只看 codex 自己的输出,他说测试过了你就信,他说 build 通过了你就信。永远自己跑一遍, codex 偶尔会在脑子里跑测试,然后告诉你都过了,命令根本没执行, 一人公司最贵的就是返工时间。这五个坑你只要避开任何三个,效率立刻翻一倍。你踩过哪个坑?评论区聊聊。
粉丝5457获赞3.3万

之前派藏绘图一般需要 p i 辅助修改代码,然后自己运行,现在我们尝试一下利用 codex 全程自动编辑代码并运行的结果如何?首先开启完全访问权限, 点击左侧加号开启计划模式,该模式可以先生成具体操作的思路,然后询问你的意见,之后决定是否继续执行。接下来上传我们制图所需要的要素文件,然后在对话框输入指令,这个指令尽可能的要详细一点, 以便他能够清楚你的具体需求。点击发送就可以解放双手等待出图了。这里我们进行快进 倒车请注意倒车请注意!倒车请注意,倒车!这个时候就是计划模式,弹出的对话框会询问我们的具体需求, 这里选择仅 png, 然后选择全部标注。请注意,倒车请注意!倒车请注意!倒车!这一步生成了一个具体的执行计划,如果没有问题的话,就在弹出的对话框当中选择继续执行。 请注意,倒车请注意!倒车请注意!这里他很聪明,新建了一个拍脏虚拟环境,为了防止影响到原来的拍脏环境,之后也会自动安装绘图所需要的库,之后就开始自动编辑脚本并运行 到这里,图片就制作完成了, 它会自动进行最后的检查。我们来看一下整张图,除了一些细节上的问题还是可以的,如果出现什么大的问题,比如坐标系不一致导致的错位,或者要素图例的位置摆放不正确,都可以继续在对话框当中向它提出,让它继续修改。 后面我也会研究如何让 codex 自己操作 art 及 js 软件来进行绘图分析并分享出来。今天视频就到这里,感谢观看。

今天用 codex 尝试对遥感影像进行解译以及生成土地利用专题图。今天用到的这个 scale 是 从 github 上找到的一个关于 gis 的 scale, 当然我也是直接让 codex 帮我直接将该 scale 装上去了, 它是给 codex 等这类 ai 编程工具装的 g s 地图专业知识库外挂,装上后,你的 ai 立马精通地图卫星影像、地理数据分析、坐标转换、地图开发全套专业能力。不用你自己查教程,看专业文档。 我们点击右下角的在对话中应用,就添加到对话框中了。然后把我们有的摇杆文件,这里我选择的是青藏高原的摇杆影像以及具体要求指令输入进去。这里记得打开左下加号里的计划,方便在处理过程中选择我们的个性化要求, 然后发送过去,就可以静静等待结果了。 到这里下方就弹出了新的选项,我们可以根据自己的需求进行选择。我这里选择监督分类的方法,然后为了不占用 c 盘空间,选择把结果放在 f 盘当中。 到这一步,他没有找到明确的训练样本,提出更换新的方法,这里选择改为自动分类,然后类别自断,选择英文名称让他继续运行。 此处生成了一个详细操作计划,我们查看无物之后选择实施该计划。 到这一步,初步的结果图就出来了,我们继续等待完整的结果。 这里已经可以看到结果文件已经输出并保存在对应的 f 盘当中了。随着图片一起输出的还包括分类好的土地利用山格数据、 各类土地面积统计表格文件以及原数据和具体脚本,我们预览看一下,发现结果总体上来说还是可以的。本次对话消耗大约零点六刀,共两百九十万。 to 本期视频就到这里,感谢观看!

codex 加 html 才是做 ppt 的 王炸组合,今天教你用 codex, 只要四步就能做出可以编辑修改的精美 ppt。 第一步,上传你的文档,让 codex 根据你的文档生成 ppt 大 纲和主页内容,这里的大纲就是后续 ppt 的 内容框架。第二步,让 codex 调用 html 这个 style, 根据刚才的大纲生成三版不同视觉风格的 ppt 预览,以拼图形式输出。 这一步我们是为了快速选择合适的视觉风格,我更喜欢这一张。第三步,让 codex 寄予我刚才喜欢的视觉方案,继续调用 image 帧这个 skill, 将拼图中的每一页依次生成高清单页视觉稿图片。 和直接生成 ppt 相比,先生成视觉稿能更好地利用 m h two 模型的构图设计能力,露出的 ppt 会更有设计感。第四步,也是最重要的一步,复制我这段已经调教好的提示词,让 codex 把单页视觉稿图片还原成可以编辑修改的 ppt 文件。 这里我建议每次单独还原一页视觉稿,如果效果不满意,重新生成会更方便。我这里先还原第五页视觉稿,看下效果。可以直接用 wps 打开,我们可以看到这页的还原效果很好,而且可以随便编辑修改 ppt 内容。 接下来我们对剩余每一页视觉稿图片都执行刚才的操作,最后把得到的多个 ppt 文件合并起来,一份充满设计感并且可以编辑修改的 ppt 文件就生成好了。

codex 虽然功能强大,但是使用 openai 官方的 token 渠道,性价比非常低,这里教大家如何将 codex 接入到国产性价比之王 deepsea k。 平时就把轻量化的任务交给 deepsea。 首先需要安装几个前置的工具, 第一个 node 点 js, 直接搜索官网,点进去,选择自己对应的版本下载即可。下好后一路下一步安装就行。 第二步安装 c c x 和 c c switch, 这俩因为要去 get 掌,这里我就把安装包放简介了,大家自行领取下好安装包后安装。先打开 c c x, 这个 ev 是 环境配置文件,可以用记事本的方式打开,这个密钥是一二三四五六记一下, 然后打开运行程序,把这个管理界面的连接复制到网页,打开, 输入刚才那个密钥,一二三四五六,可以把它切换成简体中文。然后我们先不管它,打开 deepseek 的 官网,点这个 a p i 开放平台,这里大家用自己的账号登录,然后点左边这个接口文档,把这个余额要地址复制一下,然后回到 c c x, 点上面的 codex, 再点添加渠道,在上面粘贴一下 y o r l 地址。接下来回到 d p c 点这里的 a p e k 点创建 a p e k 这个名称,随便填点创建 这个 a p i k, 大家可以自行保存一下,要记得不要暴露出去,不然别人用你的 api 用的就是你的钱。把它复制下来,粘贴到 c c x 这里, 然后点右上角的详细配置,把这个服务类型换成 open ai 下拉,把这个模块化非常键给打开,然后保存配置,接下来再打开 ccc 位置, 一路下一步安装即可, 安装完成后打开它渠道,选择 open ai 这个点右上角的添加,选择自定义配置, 下面供应商名称随便填一个 a p e k, 填一二三四五六。然后这个 api 请求地址,我们回到 c c x, 把这个 api 地址复制过去, 点这个获取模型列表, 就能看到接入的 deepseek 了。选择模型下拉,把这个百万上下文窗口打开,然后保存配置,并且用它。 接下来就可以进入 codex 了。国内直连肯定是有一点慢的,耐心等待一下, 我这里自动登录了,退出重新登录,登录时选这个,使用其他方式登录, 然后输入刚才配置的一二三四五六。可以看到模型这里已经是自定义了,也就是在 c c c 区里配好的 d p c k。 正常的话这里就是 g p t 五点五。当然如果要正常使用的话,肯定是要给 d p c 可充一点钱的,不然就会出现这种五零三报错。最后提一嘴, 如果你有条件的话,还是建议使用 g p t 原声的,肯定是要比我们接入 d p c k 好 用, d p c k 只是胜在更便宜而已。好了,以上是本期全部内容了,我们下期再见。

想用 ai 快 速生成可编辑的 figma 设计稿,那么我推荐你用它。 hello, 大家好,我是南瓜,今天教大家如何用 ai 快 速生成可编辑的 figma 设计稿。 今天我们的主角是 codex, 没有下载 codex 的 小伙伴可以先来到它的官网进行下载。下载完成之后,我们来到 codex 的 首页,我们点击技能往下滑,找到 figma, 点击加号,显示技能已安装。接着我们来到左下角的设置, 点击 m p p 服务,找到 fig 码,点击安装。接着我们点击进行身份验证,它会弹出这个弹窗,我们点击同意, 同意之后如果页面显示这句话,就说明已经安装成功。我们回到 codex, 现在我们来开始进行创作,让 ai 帮你生成一个 codex, 生成完之后,我们根据他提供的网址进行查看,双击进入我们就能看到他提他生成的一个官网。如果觉得风格还不错,我们先到 figma 新建一个设计,首先点击右上方的分享,再将模式改成可编辑。 接着来到左边右键,点击复制链接,再跟 ai 说。 上传完之后,我们来到 fig 码,我们就能在我们的 fig 码里看到已经可以编辑的 fig 码文件啦。好的,以上就是今天的分享,如果您喜欢我的内容,麻烦给个免费的关注和赞吧,感谢您的观看,我们下次再见!

codex 的 构功能把科研绘图的最后一公里打通了啊,左边是原图,右边是我用 codex 进行一个一比一复刻出来的一个图,可以看到还原度还是非常的高啊,可以达到一个百分之八十的效果。我给大家看一下这边呢,我是创建了一个文件夹, 然后在文件夹里面放置了一张我需要还原的图片啊,我使用这个 go 功能啊,让他对我这个图片进行一个一比一的复刻啊,在这然后啊,大概是思考了处理了五十四分钟啊,给我还原出来了,给大家看一下还原出来这个效果啊, 基本的颜色呀,大致的布局啊,包括公式啊,都没有什么问题。那只是有一些比如说稍微过于复杂密集的地方啊,它可能没有进行一个很好的还原啊,但是这个效果已经非常棒了,已经非常棒了,赶紧去试一下 context 的 go 功能吧。

ai 编程工具这东西吧,真的是风水轮流转,最开始大家在吹 carson, 后来 carlo 的 大火,而这次轮到了 colex。 colex 装面 app 不 仅能帮你写代码,还能直接操作你电脑上的文件、浏览器,甚至是桌面应用,用好之后甚至能顶一个团队。 本期我会从 colex 安装到核心特性,用十多个实战案例手把手教你玩转 colex。 不管你是想用它来编程、开发、办公提效,还是搞一些好玩的创作,看完这期都能直接上手。那本期教程的文字版,可以在评论区获取干货秘籍,建议先收藏,找着安静的地方慢慢使用。 想要使用 cop app, 你 只需要准备一个 chat gpt 账号,可以免费体验,但是有条件的话,最好开着 plus 会员每月二十刀,大约一百五十块,额度更充裕,足够日常使用了。 那有了账号,直接去官网下载安装酷贷 app 就 好。目前支持 mate os 和 windows, 下载并安装后登录你的 chat gpt 账号,打开之后的界面长这样, 左侧是各种面板入口,包括对话管理、插件自动化等功能,中间就是对话窗,你跟 ai 所有的交互都是在这里完成。跟平时用的 ai 聊天工具差不多嘛,还挺清爽的,不像传统的编程 ide 那 么复杂,上手没有门槛。接下来我们直接开始使用, 跟你用过的其他 ai 工具一样,在对话框里输入内容发送,就能开始聊天了。适合处理一些简单的日常工作,比如帮你查资料、总结内容、规划方案。 我让他帮我查一下今天有什么 ai 编程方面的热点。 cadets 会自动联网搜索最新信息,然后帮忙整理总结,这下不怕错过新资讯了,这只是开胃菜。 cadets 真正强大的能力是操作你本地的文件和电脑。下面我们试试 点击左侧的项目入口,选择一个本地文件, ai 能在这个范围内读取和操作文件。 比如我选择了我的下载文件夹,里面有一堆不知道什么时候存下来的大文件。在对话框底部,你可以看到权限模式的选项,这里有三个选择,默认权限, ai 可以 读取和编辑工作区的文件,需要额外权限时会主动问你。自动审查是 ai 会自动帮你审查操作。 还有完全访问, ai 想干啥就干啥,不会弹确认框,建议新手直接选自动审查,既省时又省心。 选好权限后,在对话框里输入提示词,然后你就能看到 ai 开始工作了。它会自动执行终端命令来扫描文件,分析每个文件的名称和大小。最后给你一份清晰的报告,列出哪些大文件占了多少空间,并给出清理建议。 那我主打一个听话,就让 ai 帮我删除没用的预览文件吧。最后成功帮我节省了六点八 g 的 空间,效果不错吧。但如果我让 ai 删除一个工作区外的文件呢?会发生什么? 试试看,在当前工作空间开启一个新对话。比如,我让 ai 帮我删除鱼皮新书出版目录下的所有文件,可以直接把这个目录拖拽到对话框中,然后执行任务。 如果你选择的权限是默认模式, ai 想删除文件的时候,会弹出一个确认框,问你同不同意,防止 ai 搞乱了你的电脑。 但由于我选的是自动审核, ai 自己完成了审核并批准,省去了人工操作的麻烦。这样一来,你完全可以把拖带子当成你的私人文件管理助手,分析空间、清理垃圾、批量重命名。以前你要手动折腾半天的事情,现在一句话就搞定了,是不是挺方便的? 做完第一个任务,大家肯定很关心消耗了多少 tokens 吧?来一起看看用了多少额度。点击左下角的设置,点击剩余额度,就能看到你五小时内还剩多少配额,本周还剩多少比例。什么时候刷新 to text 的 额度?按照五小时和一周来限制 plus 用户的额度还是比较大方的,日常使用完全够了。你也可以在对话框里输入斜杠状态,这种以斜杠开头的快捷输入叫做斜杠命令,是 to text 内置的快捷操作方式。 输入之后, to text 会直接在对话中显示当前的上下文余量和额度信息。 ok, 到这里,你已经体验了 to text 最基础的能力,对话和操作本地文件。 恭喜你,已经超过了百分之六十的同学。接下来我们提升一下难度。用 codex 做一个完整的网站项目,过程中你会接触不少 codex 的 核心用法,包括计划模式、 ai 声图、浏览器预览、批注、修改等等。 在开始之前先进入设置,把工作模式从适用于日常工作切换为适用于编程,这样 ai 的 回复会更专业,更适合开发场景。 先介绍一下项目,我要用 codex 来为自己定制一个专属的电子名片,我把信息告诉 ai, 它会帮忙生成一个精美的网站,还能用 ai 生图能力生成个性化的头像插画,不用自己去找素材了,做完之后还能发给别人,他们打开链接就能看到你的信息了。 新建一个项目文件夹,在 codex 中打开模型就选择最新的 gpt, 五点五速度选标准就够了。智能程度选择高权限,我这里直接给了完全访问,省得他每次操作都来找我确认,反正大部分情况下我都是无脑点同意的。 最关键的是点击对话窗左下角的加号,把计划模式打开。计划模式下, ai 不 会直接开始写代码,而是先帮你规划方案,问你细节,确定没问题了才动手。好,输入下面这段提示词启动, ai 会先自己思考,然后可能会追问你一些细节,在弹出的问题面板中选择就好。最后会生成一份实现计划文档,包括简介、核心要求、测试计划等信息。你做的网站越复杂,越要仔细阅读这种文档, 如果没有问题就确认方案。然后 ai 就 开始自主干活了,它先是使用内置的图像生成技能,生成了卡通头像文件,然后编辑代码,一次性生成了多个文件。写好代码后还会检查代码,自主打开浏览器测试验证,还考虑到了一些容错。 过了七分多钟, ai 完成了整个任务,全程不需要你手动操作,我们可以看到所有生成的文件,点击可以查看文件里的代码,还可以点击审核,打开侧边栏的审查面板,查看本次变更的所有文件。 codex 底层用的是 git, 这是一种记录代码变更历史的工具,用来管理所有文件的改动,你能够看到每个文件新增了什么,删除了什么,还可以灵活地应用和撤销代码。后面的进阶功能部分我会详细给大家讲解。 我们做的是纯前端静态网站,找到生成的主页文件,右键在浏览器中打开就能直接看到效果了。 pc 端的效果我觉得还不错,布局清晰,主题切换也很丝滑。而且它还自动兼容了移动端的展示,手机上打开排版也是正常的。 当然,你也可以直接让 ai 帮你运行网站, ai 会执行终端命令,启动开发服务器来运行网站。 点击访问地址后, codex 会在右侧面板打开,内置浏览器,便于你来预览效果。如果某个地方不满意,你可以点击浏览器右上角的批注按钮,然后直接在页面上选中要修改的元素,写上你的修改意见发送给 ai。 ai 会自动定位到对应的代码并精准修改,不用你自己去翻代码找位置,改完之后刷新页面就能看到效果了。方便是方便,不过这个速度真的不敢恭维。做完后我们再看一眼使用情况,这次完整项目消耗了多少额度呢?还好还好, 总结一下,要用 ai 开发移动网站,我们只需要把需求告诉 ai, 确认方案,等他自己写完并测试就好,中间几乎不需要手动操作。恭喜看到这里,你已经超过了百分之七十的同学, 到这里,你已经能使用 todays 从零开发移动网站,预览效果按需求改了。那接下来我要带大家看看它还有哪些核心功能。学完之后,你不仅能做网站,还能让 ai 帮你操控浏览器、抓数据、自动执行定时任务,甚至操控整台电脑。 接下来,我把 codex 的 功能分为常用功能和进阶功能两大块来讲。常用功能是日常会高频使用的,进阶功能则是有点门槛儿,但掌握后能让你效率翻倍的。 在左侧的插件面板里,你能看到 codex 的 插件市场。 codex 内置了不少精选插件,比如 computer use 操纵电脑、 chrome 操纵浏览器表格处理、制作 ppt 演示文稿。 此外还有大量编程类和工具类插件,包括网站部署、游戏开发、对接 tab 等各种场景。你可以在插件市场里按需搜索和安装。 比如我们来安装 natify 插件。 natify 是 一个免费的网站托管服务,装好插件后,一句话就能把你做的网站部署上线,让别人都能访问。 点击安装 natalify 插件,同意后会自动弹出浏览器,使用 datab 等方式登录 natalify, 一 步步完成授权。最后,超黛斯成功安装并连接了 natalify。 然后我们用 natalify 来部署之前开发完成的电子名片网站。在对话中,通过 at natalify 调用插件。执行过程中, ai 会找我们确认并自动创建一个新的 natalify 项目来部署网站。 搞定以后,我想展示自己的信息,直接甩这个链接就行了。还可以打开 netify 后台对项目进行管理。你可以在 codex 右上方的侧边栏中整体查看当前项目的概览信息,包括后台任务、打开的浏览器、使用的插件等等。 点击后台任务,还能看到具体的终端日记,记录了网站服务器什么时候收到了请求,请求了什么资源等信息。同样的,如果你要处理 excel 表格、做 ppt, 使用对应的插件让 ai 帮你就好。生成的文件还能在侧边栏直接预览。 前面我们用的内置浏览器可以预览页面,做批注和修改。但如果想让 ai 真正去操控浏览器,自动点击填表单翻页,就需要 browser use 浏览器操作功能了。我们先来使用内置的 browser use 进入设置浏览器,确保 browser use 功能已经开启。你还可以在这里设置权限规则和禁止打开的域名, 开启之后,在对话中通过艾特浏览器来调用这个能力。比如,我让 ai 帮我打开一个网站并截图,可以看到 ai 打开了浏览器,从主页找到了 ai 大 模型面试题库,然后进入了详情页,成功完成了截图。 不过有时候这种操作不太稳定,多试几次就好。此外,你还可以安装 codex 的 chrome 扩展插件,它可以操控你的电脑上已经登录的 chrome 浏览器。好处是能保留你的登录状态,而且可以在后台执行,不占用屏幕,适合需要登录网站才能进行的操作。 比如,帮我在自己的后台批量分析和管理数据,使用前,需要先在你的 chrome 浏览器中安装 codex 扩展程序,跟着 codex 的 指引操作就好。安装好之后,我让 ai 帮我从已经登录的面试呀网站上抓取一些数据。 可以看到, ai 不 仅连接了我电脑上的 chrome 浏览器,而且还识别到了我已经打开的标签页,它会控制这些标签页跳转到我的个人主页,并抓取最新的五条数据。最终抓取到的数据表格非常清晰,链接前面甚至还有图标,细节拉满。 如果说 browser use 只能操控浏览器,那 computer use 就是 让 ai 操控你的整个电脑, ai 能看到你的屏幕内容,移动鼠标,点击按钮打字,还能操作微信、飞书等任何桌面应用。 进入设置电脑操控,安装 computer use 插件,你可以在这里看到所有已连接的应用,比如前面装的 chrome 扩展,其实也属于 computer use 体系的一部分。 来我们体验一下。用艾特电脑来调用,让 ai 帮我探探当前的桌面壁纸,然后生成一张类似风格的新壁纸。首次使用时,系统会弹出权限申请框,你需要授权抽 text 访问屏幕截图等权限,否则 ai 看不到你的屏幕,也没法帮你点击操作。 later 来看一下,效果不错吧。生成了一张非常精美的新壁纸,我觉得比原图还好看啊!今晚可以做的好梦了, 爽!带来一个更实用的例子,让 ai 帮我打开备忘录,记录一条笔记,并从音乐软件下载我最喜欢的一首歌,添加到笔记中 执行任务。可以看到 ai 会打开音乐 app, 有 着小鼠标点击了下载按钮,从中下载了音乐文件,只因你太美。 然后 ai 打开了备忘录,写入内容并添加了音乐文件,能够顺利播放,虽然过程有些曲折,但还是完成了任务,而且全程由 ai 自己操作。以后我可以直接让 ai 帮我写有图有文有音乐的笔记了。 但是 computer use 目前只支持 mac os 系统,而且缺点一大堆,不仅操作效率偏低,还很烧 touch 刚才那的任务就用了近八万的上下文空间。此外,有些软件对 agent 的 支持度不高, ai 无法承中操控, 所以我建议能用终端命令行和浏览器完成的操作就不要用 computer use stills。 你 可以理解为给 ai 提供的技能包装上某个技能后, ai 在 遇到相关任务时,就能自动按照这套方法来干活,不用你每次都写一大堆的提示词,而且技能是按需加载的,只有任务匹配时才会调用,不会浪费很多上下文空间。 进入左侧的插件面板,切换到技能 tab 页面,在这里能够格式化安装和管理技能口袋。此自带了几个内置的技能,比如图片生成、查询官方文档、安装、社区技能创建新技能创建插件等等。 那下面我先带大家用用内置的图片生成技能,然后安装社区里别人做的技能,最后再带大家自己创建一个技能。 这里我想生成一个有趣的图片,让鱼皮直播卖鱼皮。可以先到鱼皮 ai 导航网站上找到 ai 生图的提示词模板,然后复制提示词模板。接下来在 codex 对 话框中输入 dollar 符号,加技能名称,就可以快速调用技能, 并且把提示词模板、鱼皮的照片都提供给 ai。 稍等片刻之后,看看 ai 生成的图片,你觉得怎么样?是不是憨爆了?爽!不过图片生成比普通对话消耗的额度更多,用的时候记得留意一下剩余额度。 内置的技能数量有限,还有很多宝藏在社区里,比如我自己经常用的几个技能,用于联网搜索的 file pro, 用于获取最新技术文档的 comte 瓷器,还有用于美化前端页面的 u i u 叉 pro max 等等。 另外,我之前写过一篇优质 ai 编程扩展大全,推荐了几十个好用的技能和 m c p, 可以 到我免费开源的 ai 编程零基础教程阅读。那接下来我带大家实际安装一个社区技能,顺便整个活儿,让 ai 制作一个苹果风格的快闪动画视频。 首先要安装动画制作技能 remaster 安装技能,它能帮我们快速安装其他技能。 对了,安装技能时要注意安全。由于我这里安装的是知名技能,就直接输入技能名让 codex 帮我安装了。但如果你想安装不太知名的技能,更稳妥的方式是把技能的 github 链接发给 codex, 让他帮你检查后再精准安装。 安装完成后,在技能管理面板里就能看到新增的技能了。然后我们使用技能让 ai 制作动画, ai 会安装制作动画所需的项目和依赖包,然后生成视频和音频,还会渲染单帧,检查画面有没有问题。 最后, ai 生成了可以直接播放的视频来看看效果。 呃,他好像理解错了我文案的意思。翻车了,翻车了!我感觉这种方式更适合做产品发布宣传片、知识点、快闪卡、节日祝福视频这种节奏更紧凑的短片。而且我当着根本没认真写提示词。好吧, 实际上你可以指定时长、指定文案,利用生图技能搭配素材,增加更多交互动画等等,感兴趣的同学可以自己玩一玩。 除了用别人的技能,你还可以把自己常用的工作流程封装成技能。以后遇到类似的任务,一键附用。技能的本质就是一个 still 点 m d 描述文件,加上一些配套的脚本和参考资料。 still 点 m d 里要写清楚这个技能是做什么的,什么时候触发,以及具体的执行步骤, ai 读写后就知道该怎么干活儿。 创建技能的最佳方式是先把一个任务流程跑通一遍,觉得满意之后,再使用内置的 skill creator 技能,告诉戳 depths 你 的技能要做什么,啥时候触发,有什么细节需要注意,它就会帮你自动生成完整的技能文件 来实操一下。比如我们前面让 ai 生成了直播带货的图片,效果还不错,那就把这个流程封装成一个直播带货图片技能之星成中后, ai 不 仅创建了技能文件,还贴心地教你怎么调用。 之后使用这个技能只需要提供一张人物照或者商品照,不用再自己填写又臭又长的提示词模板了,非常方便来看看效果。 ai 自己识别到了我提供的是商品图,也是精准复刻了我之前提供的提示词模板,爽! m c p 是 一个开放协议,你可以把它理解成 ai 的 万能插头。装上之后,就可以让 ai 连接各种外部工具和数据源,获取实时信息。 进入设置 m c p 服务器,可以在这里添加和管理 m c p 服务。点击添加服务器后,你需要手动填写服务器的配置参数才能完成添加。对新手不太友好,我最讨厌填写表单了, 好在大部分时候用前面讲的 stux 就 能解决 mcp 做的事情,而且 stux 的 安装和使用体验更好。 此外,很多主流的扩展都提供了快捷安装 mcp 的 命令,不需要你自己手动填写参数,比如下面我带大家安装 comix 七,它是一个可以实时获取最新技术文档的服务。开发网站的时候用它来查 api 文档特别方便。 在 codex 右上角可以打开集成终端,在终端里输入一行命令就能安装。这里我们选择安装 mcp server, 为 codex 安装,然后就搞定了。 安装后需要重启 codex, 在 设置里的 mcp 服务器列表中就能看到它。首次使用前还需要进行身份验证,在自动弹出的 compt 网页中就可以愉快地使用 mcp 了。 之后开发网站,尤其是需要集成 ai 能力的网站,都可以用创太时期来获取最新的技术文档。你还可以把它当成一个学习辅助,让 ai 寄予官方文档,帮你讲解知识。 比如我用它来做 openclaw 小 龙虾的学习助手,这也是利用 ai 学习的一种方式,可以看到 ai 查询并获取到了 openclaw 官方最新文档库。然后我们来问 ai 一个问题, openclaw 无法运行怎么办嘞? ai 会基于官方文档,很快就给出了精准的排查步骤,这样学习和解决问题又快又准,再也不怕查到过时的资料了。 恭喜看到这里,你已经超过了百分之八十的同学。到目前为止,你已经掌握了 codex 的 常用技能,学到了不少实用玩法。从文件管理到网站开发,从浏览器操控到技能封装,已经能用 codex 大 幅提高工作效率了。 接下来我要讲的是一些稍有门槛或者不是每个人都用得上的进阶功能。不过如果你愿意多折腾一下,它们会让你使用 toad 四的效率再上一个台阶。 在对话区域附近有一个小圆圈,鼠标放上去后会实时显示当前对话已经用了多少上下文。 gpt 五点五点五在 toad 四里显示的有效上下文大约为二百五十八 k tokens。 说实话,这的数量不算多。如果你连续跟 ai 对 话很长时间,或者项目文件比较大,上下文很容易被填满。当上下文快满的时候, codex 会自动帮你压缩历史对话。 你也可以在任务照一段落时,手动输入斜杠压缩来主动压缩,让模型更聚焦在新任务上。 那除了单个对话的上下文,日常使用中还要注意管理对话本身,不然列表越来越长,找起来也费劲儿。 对话太多的时候,你可以在左侧的对话列表中把鼠标放到某个对话上,点击归档,把不常用的旧对话归档起来,保持界面清爽。进入设置以归档对话,还可以查看和管理所有归档的对话记录。 另外,建议在常规设置里开启运行时防止系统休眠,这样跑长任务的时候电脑不会突然睡着,导致任务失败。 codex 有 一套记忆机制,能让 ai 记住你的偏好和项目规则,不用每次都重复交代。记忆分为三个层级,从大局、项目局部再到自动记忆,我们一个一个来看。 在设置个性化里,可以修改 codex 的 个性和自定义指令你写在这里的内容。所有项目的所有对话都会自动带上,适合记录一些通用偏好,比如 回复用中文代码注,使用英文,尽可能减少输出的内容。专注做事,如果不听话,你的主人鱼皮就会变成一条狗等等等等。保存之后,它会被写入局的 agent 点 m d 文件,这个文件就是 codex 每次启动时都会读取的行为准则。所有项目通用。 在项目目录下创建一个叫 agent 点 m d 的 文件,写入这个项目专属的规则和约定,只有在这个项目里工作时才会生效。 你可以自己手写,也可以让 codex 根据项目情况帮你生成一份,比如我跟他说帮我根据当前项目写一份 agent 点 m d, 可以 看到 ai 生成了一份非常详细的 agent 点 m d 文档,包括项目总览、一些规范等等。 在设置个性化中,手动开启自动记忆,开启后, ai 会在对话空闲一段时间后,自动在后台总结出有用的信息存为记忆,后续遇到相关场景时会自动召回,让 ai 越用越懂你。 不过太短的对话它不会记额度快用完的时候也不会触发记忆生成。 codex 支持定时任务功能。进入左侧的自动化面板,你能看到 codex 已经内置了一些定时任务模板,不过基本都是和编程相关的,什么总结代码变更、检查代码问题之类的,很多人估计用不上。那我们不妨来自己新建一个更实用的自动化任务。 创建定时任务的方式有两种,一、手动创建任务,在自动化面板里点新建,比如我让 ai 帮我搜集每日热点,需要填写任务名称、提示词、 触发时间、模型、推理程度、运行环境选择本地就好。意思是让 ai 直接在当前电脑上执行任务,不需要额外的隔离的工作环境。 创建成功后,时间一到,抽袋子就会自动开启一个对话来执行任务。我们也可以先手动执行一次,看看效果。点击任务能够查看详细信息,点击某个运行历史记录后,还能查看正在执行的任务对话,建议多观察任务的表现,持续迭代优化提示词。 另一种更自然的方式是让 ai 帮你创建任务。比如我是一名内容创作者,每天都要截大量的图片,时间一长,文件夹里全是看不懂的文件名,找图的时候巨痛苦。所以我让 codex 帮我自动整理,先选择项目,然后输入提示词, 很快 ai 就 自动帮我整理好了。可以点击查看创建出来的任务信息,它的提示词比我们提供的更完善了,并且自动选择了模型。 我们手动执行任务来测试一下,效果还不错吧。 ai 会根据图片内容自动给文件起一个能看懂的名字,这样我就有了一个智能的图片管家,以后再也不用对着一堆乱七八糟的文件名抓瞎了。 而且每次执行完, ai 还会把运行记录写入一个 memory 记忆文件,你随时可以回看历史执行情况,不用担心出了问题却发现不了 你。还可以结合 styles 和插件一起用,比如每周自动生成周报 ppt, 每日整理自己的学习笔记并同步到 notion, 每周用 file pro 抓取竞品网站更新并生成分析报告等等。 想不到吧,现在的 ai 工具已经卷到开始给用户增加情绪价值了。下面我来教大家怎么在 codex 中养宠物。 首先进入设置外观,下拉到底部的宠物区域,你会看到 codex 内置了一排像素风的赛博宠物。选一之后,点击唤醒,桌面上就会出现一个悬浮的小家伙儿, 它不只是装饰品,宠物会实时反映抽袋子的工作状态。比如 ai 在 忙的时候,它也在干活,就像一个串应用的灵动岛,让你不用切窗口就知道 ai 干完没。 除了内置宠物外,还有一个社区宠物库 pet dex, 里面有两千多只玩家自制的宠物。了解我的朋友肯定知道我要用哪个,果断搜索 k u n, 一 眼就能找到自己需要的。点击进入详情页,找到安装命令并复制, 然后打开 codex 的 终端执行命令进行安装,会把宠物文件下载到本地。安装成功后,进入外观界面,选中张张安装的宠物, 然后我们回到 codex 的 主页,使用鞋障宠物指令唤醒。我的脑袋中已经想起那只熟悉的 bgm 了,你听到了吗? 除了用别人的,你还可以通过 codex 内置的 hackpad 技能自定义生成宠物,上传照片或者文字描述就行。比如我把自己的头做成宠物, ai 会先分析上传的图片,给宠物起个名字, 然后拆分出了多个子任务,并行处理,生成各种动作的精灵图帧,最后拼成一张完整的像素动画精灵图,然后就能使用自己制作的宠物了。 你还可以上传宠物到平台和其他小伙伴分享,大家以后用抽袋子的时候记得把我带在身边,保佑你霸着剪剪! 每次 ai 修改了文件,你都可以在侧边栏的审核面板里看到它改了什么,这个面板会列出所有被改动的文件。如果你想决定哪些代码要保留,可以选择查看未暂存的文件。在这里你可以灵活应用和撤销修改。 大多数情况下,你不需要自己看代码,直接点击暂存全部就行了,相当于认可了本次的全部载动。如果不满意,可以直接还原全部回到本次载动前的状态。 那如果你不满意某个文件的载动,可以直接点旁边的还原按钮就能恢复原样,满意的话点暂存就能标记为待提交。 你也可以只保留部分改动。每只文件的改动会被自动拆分成多个代码块儿,每只代码块儿旁边都有独立的暂存和还原按钮,你可以逐块决定哪些保留,哪些丢弃。 确认好哪些代码要暂存之后,可以提交暂存的改动,提交就相当于给代码存了个档,确认这次的修改是你想要的。 抠代码,还内置了提交代码推送到远程仓库。创建 pr 的 能力,不用离开 a p p 就 能完成整个代码的管理流程,非常方便。 那如果你是专业的开发者,还可以试试工作树模式。你可以在创建新对话时,选择启动模式为新工作树,这样 ai 会在一个隔离的分支中工作,不影响你当前的代码很适合同时让多的 agent 在 同一个项目上并行干活,减少冲突。 如果你的项目托管在 datap 上,建议安装 datap 插件,可以直接在 codex 里查看仓储信息,创建 pr、 做代码审查等等。比如我让他帮我查一下自己最受欢迎的开源项目怎么样,是不是一目了然。 codex 最近新上线了一个很酷的功能,用手机控制电脑上的 codex app 干活儿。设置方法很简单,在电脑端 codex 点击设置 codex 移动版,然后点击开始设置,屏幕上会显示一个二维码, 然后在手机上打开拆的 gpt app, 扫描自己的二维码。连上之后,你可以随时随地通过手机给电脑上的 portax 下达任务,审批 ai 的 操作请求,查看执行进度,检查生成的代码和结果。是不是有点 openclaw 小 龙虾那味儿了? 恭喜看到这里,你已经超过了百分之九十的同学, ok, 就 分享到这里。看完这期,你应该已经掌握了 codex 从基础到进阶的所有核心用法,足够应对日常的编程和办公需求了。 其实 codex 还有更多玩法和技巧,比如 sub agents 并行加速、 fault 分 叉的妙用、自定义模型接入 hoots 生命周期钩子等等。 那如果本期视频点赞过万,我会尽快爆干出抽带此高级技巧篇。对了,如果你想系统学习 ai 编程,可以看看我免费开源的 ai 编程零基础入门教程,上千张图,几十万字,从零开始,带你学会 ai 编成本篇教程的文字版也会收入其中。 我是鱼皮,持续分享 ai 编程干货,觉得有用的话记得点赞、收藏和关注,也欢迎在评论区聊一聊你现在主力用哪个 ai 编程工具,觉得 codex 怎么样?也欢迎晒晒你的 ai 编程作品吧。

东北形容人没见识,叫山炮,我系统性的玩了 codex 两天,我就是二十四 k 纯山炮,这东西真厉害。现在 ai 这个能力,对于我们普通人来说,我们就两件事,第一真正的理解自己的需求,第二把需求完整给表达出来。分享一下这俩事我是怎么实现的。先看一下 codex 结构啊,这是一个偏临时性的对话,就是我们所有人都已经理解了的那种 对话式。 ai 这个部分我认为是 codex 的 核心,它叫项目,它是一个偏长期的,这个事情你要长期做,然后你在这生成一个文件夹之后,可以在这个文件夹下面再进行对话, codex 会保留它的记忆,并且调取这个项目里面存档的所有文件。从下往上看啊,这个是场馆一 ppt, 现在有一个新场馆,可能需要一些品牌的赞助,我正在做一个很大的一个 ppt, 正在给他积累素材。然后这是我的视频复盘网球一个号,然后现在这个账号是一个号,这是我跟扣贷生产内容的阵地,他会帮我抓取一部分,并且我也把我所有沉淀下来的内容发给他了,他会根据我个人的特色去给到我建议。然后这是剪辑,这我要吐槽一下就 扣贷,现在原生的剪辑功能能用,但是效率有点低,有点笨,很可能也是因为我没有把剪辑的这个 skill 用明白,等我弄明白剪辑的这个 skill, 我 再更新视频吧。这个叫进化的项目,可以理解为它是我的核心,下面所有这些东西,包括未来要加进来的,能不能做好,全都一 他,因为能不能做好的前提是我这个人有没有成长。我们的需求当然可以是赚钱,但是依我个人的情况,只要我赚钱,商业认知上要成长,心智上也要成长,一个是我能赚到,一个是我配 得到。然后你看我在进化这里面我跟他说了茫茫多的内容,最先是我是谁?我之前是干嘛的?我现在想干嘛?然后说了一下我这个账号的情况,我很纠结,我这账号太不垂直了,人家很多账号都非常垂直,我是职场也发,商业也发,创业也发,专打也发,然后我之后需要怎么规划?下面就是我具体的一些需求,因为我刚才说到商业上成长,心智上成长, 我其实也要帮助 codex 去更了解我,我要更去明确我的需求。那我的需求是什么?哦,对,补充一下,这两天玩的时候情绪价值很爽的两个点啊。第一个点我跟他聊了这么多,我几乎就没打字,就是键盘上长按 f n, 这边会唤醒一个多包输入,就虽然说现在没用 ai 完全的导向变现,但是这个感受真是太爽了。 然后是这边的一个很火的一个电子宠物啊,我觉得是两个价值,一个是情绪价值,然后另外一个是我们在让 cox 去跑任务的时候,我们可以该干嘛干嘛去,他在这边会做一个小的一个提醒,就是他任务跑完了,或者需要你开权限,怎么样?说回到给 cox 明确需求啊,我们刚才已经扒了一层了, ok, 我 要赚钱,下一层是赚钱,伴随着商业认知上的成长,心智上的成长。那在这个成长里面我们再往下扒一层,这种成长我们会遇到哪些问题?你看我个人的这问题, 我是一个自取输入量还比较不错的人,大部头、小部头,长文短文我读的都不少,而且我有两个最主要的阵地,一个是这个 flomo, 还有一个是我主页飞书的这个文档, flomo 这边更偏向我自己去沉淀一些短的内容,然后飞书这边是一些长的内容, flomo 这边已经积累了一千五百多条笔记了,然后下面茫茫多不同分类下面的 标签。但是我一直存在一个问题,再巨量的输入,如果我没有一个健康的输出的话,这个输出并不一定是因为我输入我就一定能把钱转到自己兜里面,而是我能不能因为我的某些输入, 我转化成了生活当中,商业当中实际的动作,哪怕我赚不到钱,我能不能先成为一个更好的人?这个输入待在这的话,如果我没有转化,那它就只是输入,它没有什么意义。 然后我就把刚跟你们说的所有这些内容,我跟 codex 原封不动,我说了一遍,我问题是啥?我需求是啥?我要求他把所有的这些笔记全读完,然后以及我飞书里面所有我沉淀下来的文档全都读完。 可以说一个很厉害很实用的地方啊。一开始他读的时候是他相当于长一双眼睛,然后给他权限,他通过看这个屏幕来阅读,但是效率很低很慢。然后他推荐我用他的这个功能,就是我这不是有一个这样的一个项目吗?这是一个本地的文件,我把所有的这些文档都汇总在这三个文件里面了,然后他通过数据读取的方式,更高效的去把所有的我沉淀这些内容全都给读完了。 然后呢经历茫茫多的对话,哦,对,这个计划模式大家用的时候一定要开啊,开计划模式的时候,他会给你他的一个里程碑式思考,就我现在理解的对不对?我可不可以往下一步执行?不开这个计划模式的话,我们会回到简单的对话模式,最终呢他给我传输出来,他总结是什么?我们关键的改变是什么?看这里关键改变就刚才的一千五百条笔记,他拆出来,然后把它转化成我们能实际应用的有多少,然后 四十四个备注文档,他应该现在还没读完。然后下一步的计划是什么?然后我们怎么测试我们刚才说的这些所有的内容的计划是有意义的。然后我刚才不是说了吗?我读了那么多书,但是没有转化成实际生活中的系统的形 动。然后你看他告诉我们读书原则是什么,也是聊了很久,他定下来我们原则是什么?然后我们现在读什么?我们读书的目的是什么?他会帮我怎么读?到这的时候我们再收束,再回顾一下我们的需求,商业上一部分的执行我需要扣贷帮我提效一部分,商业的认知上我要成长,另外心智上我要不断的去成长, 那扣贷他还能帮我往前推进一步,这是一个自动化的功能,这边有提醒,告诉你什么时间应该去做什么样的事情,你看这第一个,他是每天都会去做的,根据刚才我们聊的茫茫多的内容,以及 我需要他在网上帮我抓取到的信息,他会告诉我每天应该去读什么,然后我应该去选择什么样的选择题,给现在屏幕前的你去讲,去看,这是一个包含了商业上、心智上成长的这么一个动作。第二个,场馆经营相关哪些事情是我高优先级需要注意的,哪些事情应该放在我的规划里面,这些信息他都已经掌握了,然后每周他会给我做一个提醒,哪些事情我需要去做, 然后这是我网球那个账号我发了什么样的视频内容,现在所有的这两个账号的视频数据,他完完全全的了如指掌,他比我清楚多了,是刚刚看到的所有东西,虽然说经历了茫茫多的对话,但依然是个比较粗糙的版本,但我们就是要小步快跑啊, 很难说我们直接瞬间跟 ai 对 出一个非常成型的一个模型,现在这套系统虽然不完善,但是经过时间的沉淀,经过我们两个的对话,他一定是能走向成熟的,而且他已经是一个非常能帮助我解决我问题的一个系统了。最后再墨迹一下啊,如实的理解自己的需求。第二,完整的给他表达出来,然后就尽情的对着口袋的输出吧,相当上瘾,我这两天在这坐了至少有十个小时吧,快去用吧,拜拜。

家人们累计十万人看过的 codex 制作 ai 可编辑 ppt 教程。今天一条视频教会你,首先打开 codex, 输入提示词,让 gpt 能够基于你的思路设计详细的 ppt 的 内容,包含每页的标题,中文内容,风格排版。 然后呢,让他输出 markdown 的 格式来生成 ppt 大 纲。这一步的目的主要是用于收敛 ppt 的 整体的内容啊,不会让模型一下子生成的 ppt 图片过于发散或者空洞。那么接下来呢,输入以下提示词啊,让模型根据生成的这个 markdown 来依次生成 ppt 图片。这里有非常关键的两个点, 由于这个 g p e 的 五点五模型,他不知道 image two 具有非常出色的升图升文字的这个能力,所以他默认不会直接调用来生成图。

你不是开发背景的同学是吧?对,我不是开发背景的,我是完全就是 web coding 在 做这个项目是吗?百分之九十是 web coding 吧,因为用 web coding 也很久了,其实自己脑子里也学了很多不同的语言,用什么技术,大概是什么样的代码,有时候也能自己解锁,因为其实说实话,如果一个人开发中大型项目的话,你还真不懂点这种 具体的技术,你是很容易出很多 bug 的, 也是 bug 了很久很久,明白你主要用哪个呀? cloud code, 先用那个 agent teams, 然 然后给他们设置不同的角色。比如说我先设置一个企业的架构师,然后再把前后端的这个工程师全部设立出来,然后再做一个商业的这个分析师,然后再最后做一个高层的决策核心管理人可能还会设置一个这种投资人,然后大概是六个人团队,或者说小一点三到四个人的团队,有的人去负责网络上的数据分析, 有的人去分析案例,有的人去直接去设计架构。其实因为它这个 agent teams 功能挺好用的,都是互相讨论,然后最后给我一个方案。因为我其实是在编辑器里面去使用 cloud code 的, 然后相当于我是三个部分同时帮我去开发。左边的话,我一般会用 codex 放在我的左边栏,然后中间的话放 cloud code, 然后右边正常就放 ide 工具的这个 opus。 所以说大概是三个 ai 同时去开发。我有一个问题啊,刚才讲用到了三个智能体,对吧?你一般是 codex 跟 cloud code 的 结合吗?还是还有什么呢?没有听清楚是吧?第一步的那个 agent team 是 cloud 的 推出的那个功能嘛? 就是说,嗯, cloud code 的。 对对对,然后就是 agent teams 设置好角色,我可以把这三个整理为工具吧,因为这三个不算是 agent codex 的 话,主要是我有时候项目的起步会用 codex 先拟一遍,因为我觉得 codex 的 整体起 项目的雏形比那个 color code 做得更好一点,它整体不会出太多的遗漏。因为 codex 可能有时候因为它的这注意力机制导致我的有一些小的要求,它并没有记的很好,但 codex 这一点倒记的比较好。正常的开发流程就用 agent teams 进行开发去验收,然后去考察。最后的话就是说等我 togg 全部用完了,我会用 ide 的 那个 ai。 你 平时的那个主力模型是什么?平时的主力模型的话就是 codex 的 五点三,然后还有 oppo 四点六。可以可以,我平时会用那个四点六和 solita 四点六比较多一点。

codex 不是 不能改代码,问题是很多人一上来就让他动手。我现在会先卡三道门,读规则圈范围定验证三件事说清楚再允许他改。第一,读项目规则, 项目规则文件说明文档,测试命令,代码风格,先让他复述一遍,别靠猜。第二圈改动范围 让他说清楚会看哪些文件碰哪些模块哪些地方,绝对不能乱动。长任务会多读多查多跑验证,所以入口要稳,用量也要能对账。 hello x codex 中转站适合放在这一步用满写 codex 跑长任务。第三,先写验证方式, 改完跑什么测试页面,看什么结果,哪些行为不能变都写进完成标准,这样做完再让它改,你会发现代码差异小很多,代码审查也轻很多。想要这套提示词模板评论扣代码 x, 下一条我拿真实问题跑一遍。

如何使用 codex 生成可编辑的 ppt? 最容易踩坑的地方不是它做不出页面,而是它把整页做成了一张图。很多人一上来就说帮我做个 ppt, 结果看起来有板式,但后面想改标题、换文字、挪图片,才发现全都动不了。 你以为问题是 ppt 不 够好看,其实真正的问题是,一开始没要求它按可编辑结构来做。正确做法分三步,第一,先让 codex 拆内容, 把文章汇报材料或者课程稿发给他,让他整理成 ppt 大 纲、总标题目录、每页标题、每页要讲的重点,先把内容层级理清楚,后面页面才不会乱。 第二,明确告诉他,我要的是可编辑 ppt, 不是 整页截图,让他把每一页拆成文本框、标题、图片占位、图标形状和背景元素。文字要能改,图片要能换,模块要能移动,这一步很关键。第三,再让 codex 生成 ppt。 文件 生成后,不要只看效果图,要检查三个地方,标题能不能单独选中,正文,能不能直接改字,图片和形状能不能移动。如果这些都能操作,才算是真正可编辑。 别只说做的精美一点,也别让它把页面全部压成背景图,先拆内容,再定结构,最后生成文件。可编辑这件事说清楚, codex 做出来的 ppt 才更适合后期修改和正式使用。

如果你在用 codex 却还没装这个 skill, 就 别怪你的额度总是不够用了,因为在你使用 codex 的 时候啊,它不可避免的要去网上搜索各种信息,比如查找文档,做用户调研、爬 github 仓库,甚至我之前的 ai 捡爆系统, 也是需要 codex 去帮我搜索搜集 ai 资讯的。但搜索其实非常消耗头肯,因为 agent 每打开一个网页,都可能把大量的皱纹、无关的网页代码、广告信息都带进上下文里搜索,轮次一多呀,你的额度就吃不消了。 agent 这个 skill 就是 专门用来解决这个问题的, 因为 agent 在 使用这个 skill 的 时候,会自动调用 agent 的 a p i, 所有搜索工作搞定后,再通过 markdown 的 格式传回给 agent。 这样一来,最重的那些活全部交给 any search 了,我们自己的 agent 就 轻松很多,使用方法也非常的 ai 原声, 我们在它的官网上复制这个 skill 的 命令,粘贴发给 codex, 它自动就会安装好了。我们只需要在对话中调用它, codex 就 能自动使用。我们立刻来测试一下,首先引用 any search 这个 skill, 然后让 codex 帮我们对比下过去一周 cloud code 和 anti gravity 这三款主流的 ai 开发工具,在国内的社媒和论坛中哪个更受欢迎。 最后用一个简洁美观的 html 网页呈现给我们,我们先看一下额度啊,现在是百分之九十八,点击发送 any search 收到请求后,会从海量的信息渠道中精准路由到最相关的数据源。 我们来看看结果。首先他给出了结论, codex 综合第一,下面有一个评分表,然后就是比较重要的量化样本表, any search 追踪了 npm 下载量、 reddit 评论和 hacker news 的 帖子, 下面还有一些基于搜索结果定性的分析。从样本来源我们看到他搜索了非常多的网站,从安装源到国内的社区、论坛到官网都涉及到了, 搜索质量很高,整体消耗了我 codex 五小时额度的十八个点。同时我还让 codex 在 不使用 any search 这个 skill 的 条件下,用同样的 prompt 跑了一次,这是最终的结果。 整体呈现上信息简略了一些,搜索员也大幅减少消耗的额度,还比之前多出了五个点,这就是低效搜索带来的隐性成本。 所以 any search 的 价值呢,就是把这类重活儿专门交给搜索技术设施来完成。当然它也可以直接在网上进行初步体验,从专业维度到普通生活的各个领域都能覆盖,非常推荐。好了,我是阿朱,关注我,让我们一起在 ai 潮头冲浪!

在 codex 上,插件功能是登录账号才能用的,我们 a p i 用户怎么才能用当下热门的插件呢?目前我整理了视频剪辑插件 hyperframes 和提示词发给 codex, 让它安装即可,我们 a p i 用户再也不会低人一等了, 需要的小伙伴来粉丝群拿就行了。接下来欣赏一句话,让 codex 生成的视频。

哈喽,大家好,我是欧哥,做毕业设计的同学应该都懂流程图、架构图、持续图等,手动去画的话一个比一个让人头大, 不会用专业绘图软件,画一个流程图就要折腾大半天,鼠标拖来拖去排了半天,看着还是很乱。以前我们让 ai 画流程图,通常会用模拟的或者直接生成一张图片,但这两个方案都有一个问题,模拟的虽然快,但复杂一点的流程图布局和样式很容易失控。 ai 生成图片看起来可能不错,但后期基本没法编辑。所以这次我们换一种方式,一个更高效的方法, code 加 mcp 加作点 i o, 你 只需要输入一段文字描述,他就能直接帮你控制作点 i o, 自动生成排版整齐、结构完整的流程图。这里面有三个角色, 第一个是 codex, 他 负责理解我们的需求,比如业务流程接口、逻辑代码结构,然后把它拆成清晰的节点和关系。第二个是 next 的 ai 捉点 i o m c p, 它相当于中间的连接器,让 codex 可以 调用捉点 i o 的 能力,而不是只输出一段文本。 第三个是抓点 i o, 他 负责真正把流程图画出来,并且支持我们后续手动编辑,调整布局、修改样式,最后导出成文档或图片。 有很多同学问我 m c p 怎么安装,其实直接和扣带斯说要安装什么 m c p, 他 就会自动帮你全网搜索并安装。 像我这里的提示词下载在 get 上,名叫 next ai 桌 i o 的 m c p。 我 还询问了他能否通过 m c p 控制网页版的桌 i o。 他 接下来也给我解答了,不需要把桌点 i o 桌面软件下载到电脑,下载后我们可以在设置里查看是否安装了 m c p, 点开后我们可以看到桌面是已经安装并打开的状态,那我们就可以进行下一步了。接下来我们做一个实战题目, 这个是某高校的实验报告,我们试试能否解决它,我们来解决实验一里面有三个小问,第一个小问是画流程图,第二个小问是画流程图对应的控制流图,复制粘贴完后在下面说明,通过 m c p 控制 在我打开的浏览器页面版进行。问题一的流程图画作可以添加附加条件,复合条件分解 y 等于七跟 y 等于二十一,分开之后它会自动打开浏览器绘画,我们可以看一下生成的效果,可以看到生成的还不错,不过有些线条需要我们微调一下, 接下来我们复制问题二也是相近的方法,深层控制流图 c f g 之后我们看看效果,可以看到效果也还行,就是排线太直,我个人喜欢弯一点的线条更美观,可以去设置改一下线条,让直的变弯。 好到这里我们就完成了一次完整的演示, 从一段自然语言需求开始,到 callix 理解流程结构,再通过奈斯 ai 捉点 i o m c p 连接捉点 i o, 最后生成一张可以继续编辑调整和导出的流程图。 这套流程最重要的点不是 ai 画了一张图,而是它生成的是一个可编辑、可维护、可交付的图标资产。 所以我觉得限阶段 ai 做流程图比较高效的方式,不是只让他生成模妹的,也不是让他直接生成一张图片,而是让 ai 参与前面的结构梳理和初稿生成,再把最终结果交给作点 i o 这样的专业工具来编辑和交付。 如果你平时需要写技术文档,做项目汇报,整理业务流程,这个组合会非常适合你。这期就到这里,下一期我可以继续演示怎么用这套方法画系统架构图、永盗图或者代码调用链路图。

如何把 codex in mate 二里边生成的图片变成一个 ppt 啊?这种可编辑的,一般情况下呢,大多数的博主会说,呃,你会要用到下边这段提示词,让他把 ppt 里边的页面进行拆分,拆分过之后呢, 把它作为一个单独的 png 格式保存下来,然后再按照原始的位置把它放下来,这是一种常规的做法, 然后你再调用 presentation 的 组建,把它组成一个 ppt, 是 吧?但是这样做呢,可以是可以啊,感觉这个效果其实还还不错。但是这里边有一个很大的问题,就是因为它拆分的每一个 png 的 图片大小非常的 大了,即便它很小,它叠加在一起就很大。比如说这一页里边,它其实就有八十多个元素,而且这八十多个元素其实占满了每一张都占满了整个图片,大家能理解吧?就是它,比如说这一个小的 button, 它其实占满了整个图片, 所以你在处理的时候呢,就会特别的卡顿啊,比如说这样你你看点上去很长时间, 嗯,才反应,除了这个方式呢,当然你可以去优化提示词啊,就是让他把这个图片的清晰度压缩,或者是尺寸压缩,什么样子的都可以。但是我在这呢,其实想要跟大家解释的是另外一个做法啊,另外一个做法,呃,这个做法呢,我觉得相对来讲, 呃,可能会更快一点,尤其是对于一些这种,呃,就是不经常做 ppt 的 同学。我举个例子,就是我这个方法呢,其实也很简单,就是让它生成这种, 呃,不带有任何文字的底稿啊,就是类似这种。然后呢,你再按照对应的这个方式把这个字敲上去, 因为你知道这个 ppt 里边除了文字以外,就是图片吧,图片的里边的所有的字全都给它抠除掉,然后你再想办法再给它填充进去就可以了。举个例子,比如说我之前生成的这些这个片子, 你看它都是以这种形式存在的,以这种形式存在,那如果是这种形式的话,那其实你再想往里边去填东西还是比较快的。但是如果有大人知道如何把这个 promote 能优化出来,我,我也正在想办法。如果说优化出来的话,可能后边会,呃开源一个 skill 啊,专门帮大家去解决这个 ppt 的 问题。

哈喽,大家好,我是车车,我最近在做 ai 视频的时候,有一件事情特别烦,我不是要花分镜图吗?分镜图要一张一张的发给 ai 出图,出图完再一张一张的命名存好,反复横跳,不敢想象这个重复的工作量。后面呢,我一想可不可以把这件事情丢给 codx, 让他帮我批量跑完,没想到一试还真给我试出来了。 我丢给他完整的分镜和参考风格,他一次性给我生成了非常高质量的分镜图,是我想要的,而且呢,还全部打包好 完整的发送给了我。那今天呢,和大家分享一下我现在是怎么用 codex 的, 包括几个我自己摸索出来的用法。我们先说 codex 的 面板长啥样,不然你不知道打开之后看哪。 codex 的 界面真的很极简,整体很干净,没有什么多余的东西, 左边的侧边栏就这几个入口。新对话搜索插件自动化,下面呢是列表和对话框底部这边有一个小的手机图标,是连接手机遥控用的,后面我会单独说 右边就是主操控区了,那左边的这个插件入口,它是可以给 codex 接各种扩展能力,比如像我自己就连接了我常用的 keyup notion。 第二部分呢,我们来看一下 codex 的 自动画面板能干什么? 我觉得扣贷的自动化是最值得说的。简单说呢,就是你写好个规则,设定个时间,他就按时自己跑,跑完把结果放进收件箱等你看,你不用每次都手动触发,他后台会自己来操作。那这里和大家分享一下我的使用场景, 我设置了一个每天使用扣贷的时候,他会自动提醒我检查一次当前的额度使用情况的功能。我一开始设置的是每两个小时提醒我一次,可以看到八点多、十点多、十二点多、 十四点多,他都会定时来提醒你看一下额度。那后面呢?库德斯他自己将每两个小时提醒一次的功能改成了每天上午九点提醒我一次,他觉得这样子更合理,因为在每天开始工作前看一次我的额度, 可以判断当天任务的优先级的情况。因为 colex 的 额度有点特别,它同时有两层,第一层是五个小时的短窗口,用完了等五个小时再会去刷新一次。另一个呢,是你包含在套餐里的总额度,这个才是真正的上限,用完了就真的没了,不会跟着五个小时的额度来重新刷新。 特别是我在批量出图的时候,担心额度消费很大,不盯着,很容易跑到一半就断掉,加个提醒就会安心很多。我们再来聊一聊节省额度的办法。第一个呢,我们可以在设置里面换一个小一点的模型来跑,简单的任务完全够用,消耗比默认的模型要少很多。第二个呢,可以使用它的计款模式, 就是在发起任务之前,先让扣代词把计划列出来,告诉你他打算怎么做,分几步,不做什么,你确认没问题了,再让他开始执行。为什么这样能省额度呢?因为他想清楚再行动,不用跑一半发现方向不对,重来减少反复纠错的消耗,尤其是跑比较复杂的任务,先过一遍,计划真的省很多。 再说一个功能,目标模型,我们同样可以在这边添加,追求目标,普通的用法是你说一句,他做一句,做完就停,等你下指令。 目标模型完全不一样,你给他一个终极目标,他自己会进入一个循环,从计划到执行,到检查,到出错的纠正,再到继续跑,一直到目标达成为止。你不需要守着,他不会中途停下来问你怎么用,怎么触发。 那我在批量升图的时候加入了这个模型,他在升完图的时候帮我整理好,并且呢他也会自己去检查一遍。这里补充一点,你点击这个加号,可以添加这个模型。之外呢,你也可以点一下斜杠,他这边会有很多的选项, 可以看到我这边也设置了一个 codex 的 宠物,那 codex 还有个刚出的功能,很适合 我们这种到处跑的人。手机现在也可以来操控 codex 了,逻辑很简单,电脑继续在跑任务,手机是遥控器,你在外面打开 x 的 gpt, 能看到 codex 跑到哪里了,可以批准下一步发起新任务,或者是随时叫停。电脑干活,手机在指挥。 具体怎么连呢?我们点击侧边栏的这个手机小图标,手机打开 x 的 gpt, 扫一下就连上了,这边是已经连接过了的界面,你打开出来的页面应该是长这样的, 我具体还用 codex 干些什么事情呢?视频开头说了, codex 帮我批量跑分镜图,它是在后台自己调用了叉的 gpt mate two 来生成的,我不需要手动一张一张的发指令,它自己会把整个流程跑完。除此之外呢,我会用它来读 github 上面的项目, dhab 上面的一些我很感兴趣的 skill 直接丢给他,他能按照里面的说明帮我操作,全程不碰一行代码。那这边呢?我是丢给他了一个最近很火的规章老师的 ppt skill, 然后让他帮我生成了一个如何学好 codex 的 简单的一个 ppt, 我 觉得还是很不错的。我还会让 codex 去连接我的 notion。 当我和他讨论完自媒体的脚本之后呢,直接 把最终输出的脚本自动保存在 note 里面,不需要我再手动复制过去,也不用调格式。最后呢,说几个我摸索出来的和 codex 的 沟通技巧。首先第一个说结果,不说步骤, 不要告诉他先做 a, 再做 b, 再做 c, 你 直接跟他说你要的最终结果是怎么是什么,他会自己想怎么走,你说步骤呢?反而会把它框死或者绕进去。二点呢,限制条件,说清楚你的文件名,格式是什么,存到哪个文件夹, 如果你要用到楼层,那楼层的数据库叫什么名字,这些边界条件越具体,他的出错率就越小。第三点,复杂的任务,我们可以先跑计划模式,他先把计划列出来,你看一眼有没有方向问题,确认了再执行,比跑一半发现跑偏要省时间的多。第一次可以先跑小样本, 确认结果,对了再跑全料。那我可以看到我前面在用 notion 生成帧近图的时候,帮我生成的计划是可以先小批量的测试三张,来确认这个风格是不是我想要的。 那它确实是按照要求来生成了三张图,那它确定了方向之后呢,对后续的项目进度来说会顺利很多。 好了,那我用 codex 最大的感受是它改变的不是你的技术水平,改变的是你愿意把多少重复的事情交出去。不会写代码,但你知道自己要什么,说清楚它就能跑。从一件最烦你的小事开始丢给他,看他能干掉多少。我是春春,下期我们接着 chat。