还不到半年的时间,现在 agent 创业团队真是雨后春笋一般拔地而起。就我个人而言,各种戏份赛道 agent 我 都试了一下,包括什么 agent for 游戏引擎啊,包括 agent 的 深图深 ui 啦, agent 自动化测试啊等等。 嗯,感觉现在基本上就分为两派吧,一派是原生态,就大部分用的直接用扣贷,说挑 code, 加上一些 mcp, 比如说 ufo mcp 或者勾到 mcp 等等,顶多再加一些官方插件,比如说这种 superpowers, 或者自己写的一些 skill 就 够了。 另外一派呢,就是第三方派,这种具体的 a 卷的名字和创业团队我就不提了,不然有点像广, 也不好说这类,到底他的优势有多大,不过测试了很多,我现在发现问题就是,其实你只要 m c p 接的好,使用 skill 得当情况下,大模型本身的能力是特别拉开差距的。第三方的优势其实比较薄, 你说你针对性的优化了一些东西,但是这种定制化的优化用扣带是或者用刀扣的,我自己写,也许几天就能写出一个更适合我自己项目的一系列流程,或者一些定制化的 skill 等等。呃,挺难崩的,就这块, 当然美术方向也是一样。呃,目前扣带深图这个能力确实太强了。说实话,如果你没接这些 api 的 话,大概率你之前做的再好也打不过吧。所以看了一圈,商业化真的太难了, 所有开发团队似乎都在给这个 codex 或者漂 call 送更多的数据,让他们生成更强的模型,然后吃掉你原有的一点点的定制化优势。到底小团队有没有人真正能赚到钱的,如果有,来分享一下呗。这个赛道到底能不能做大做强呢?还是根本就是一个伪概念?拜拜。
粉丝3174获赞5127

ai 开发的风还是卷到了 unity, 现在你使用 codex 连接上 unity mcp 就 可以通过 ai 来开发你的 unity, 无论是建模还是一些其他逻辑开发,你可以看到现在就已经连接上了,这是我的 mcp, 我 把所有的权限啊都给这 ai 了, 完全交给他。好吧,那现在比如说看我现在这个项目啊,有一些报错啊,让他给我修复一下,帮我修复一下现在的一些 bug, 此时他就可以控制我的 unit 项目了,非常简单。接下来我还要探索使用 ai 来做更精美的模型,以及打通整个建模动作,还有 unit 开发的全部流程。

codex 最近上线了原生的图片生成功能这个视频,我来试一下它生成游戏素材的能力怎么样。先在 unity 里运行一下我当前的游戏,这几天新增了四个新玩法, 但是图标还没有做,正好可以用来测试。现在打开 code 的 窗口,让他直接帮我生成相关素材,我也不跟他说要生成什么样的素材了,只告诉他当前有几个子游戏在大厅中还没有图标,让他自己去看我项目的美术风格去生成, 生成后直接放项目里等待过程加速一下视频。这里能看到 codex 提取了已有图标去参考风格,然后就开始陆续生成图片。稍等片刻后,任务完成了,但是生成的图片一直在最下面显示,挡住了 codex 的 回复。 接下来到 unity 里看一下效果,能够看到原本显示黑框的四个玩法现在都有图标了, 图片质量感觉也还可以。并且这几天一直在流传 g p t 新的图片生成模型,据说能力比 nano banana 还强很多。再加上现在 codex 这方面的原声图片生成功能,后续个人游戏开发者大概就越来越方便了。

最近很多人在聊一个组合 code image two 再加勾 dot, 甚至有人几天就做出了一个二 d 独立游戏。但重点其实不是勾 dot 就 要干翻 unity, 而是 ai 为什么会更偏爱勾 dot? 原因特别简单, 因为勾 dot 太适合 ai 理解了。它的 g d script 很 像拍法,代码短,结构简单,大模型,写起来准确率非常高。 更关键的是, godot 的 场景文件本质上是纯文本, ai 不 只是能写代码,它甚至能直接帮你拼场景。但 unity 不 一样, unity 背后有大量隐藏的 guiid、 meta 文件,序列表引用很多资源关系,对 ai 来说其实是黑盒。 所以 ai 很 难像操作文本一样直接操作整个工程。再加上 unity 的 c sharp 工程更复杂,每次改代码还要重新翻译。当你一天和 ai 来回迭代几百次的时候,这种等待会特别明显。 但这不代表 unity 不 行,真正的大型商业项目,移动端主机多平台发行,现在主力依然还是 unity 和 unreal。 所以 本质上不是谁更强, 而是谁更适合 ai。 高频写作勾搭更像 ai 原生工作,流于立体,更像成熟工业体系。未来真正变化的,也不是哪个引擎赢了,而是 ai 正在把游戏开发从工程制造变成即时创作。没有万能引擎,只有适配的创作方式。你更看好哪款工具的发展?点赞关注,后续持续分享行业技术新动态!

hello, 大家好,我是阿亮,这期视频呢,教大家如何把 codex 接入国产模型,比如说接入 deepsea codex 和 cloud code 呢,不一样,它不支持修改配置文件来切换模型。最初呢,我也是想直接用其他的工具来接,比如说 c c x, 但是折腾了很长时间,发现问题比较多,也很复杂,所以呢,就自己动手来搞定的一个专门的工具, codex 杠 switch, 用这个切换 codex 的 模型就方便多了。接下来呢,就照着我整理的这份 codex 文档,一步一步带大家操作。 首先点击文档中的 codex 杠 switch, 跳转到下载页面,根据自己的电脑 选择安装包。下载后呢,双击打开,我们就以 deepsafe 为例,这里选择 deepsafe, 然后点击这里到 deepsafe 官网去申请 k, 这里有每个模型的申请 api k 的 链接好,点进去呢,就是开放平台,点击 api case, 创建 api k, 然后把拿到的 k 复制到这里就行了。然后点击蓝色按钮,这个时候呢,就切换成 deepsafe 模型了,现在呢,需要重启 codex, 记住这里一定要把 codex 关掉,重新启动, 可以看见这里的模型变成了 deepsafe, 输入一条消息试试,如果它有回复说明呢,就接入成功了。 点击红色按钮,也可以一键切回官方的 jpt 模型。注意切换后必须重启。 codex 这个小工具呢,目前支持主流的啊,国产模型也可以自定义模型,每次启动 codex 前呢,把这个工具启动了,就可以顺畅地用国产模型了。 这一期呢,我们主要是想要通过一个案例带大家整体走一遍流程,更熟悉这个扣带子的使用。很多人觉得呢,做一个案例或者做一个东西之前呢,要先想清楚做什么功能啊,有什么样的风格等等吧,就想了好久好久。其实我们根本没必要 给他最简单的提示词,让他呢先做一个东西出来,然后我们再挑毛病。好了,接下来我们直接开始 新建一个项目文件夹,直接命名为汉堡店,然后新开一个对话,添加新项目需求呢,就一句话,帮我做一个汉堡店的网页回车 codex, 自己理解,自己拆任务,自己给方案,它还可以自己的生图,因为它接入了目前最好的模型啊, gpt 杠一, mate 二,这个是最好的生图模型,我也没仔细看啊,先让它跑一半问出来再说。 哎,过了一会呢就出来了,但是我发现他的主页呢只有一张图片,这样感觉真的是太干了,餐厅也没有什么特色,我想每天都有一个的特色汉堡啊,以一周七天来循环,让他来修改 主视图,图片改为五张图片轮播,设置每天的特色套餐,每日的优惠套餐以一周为一个单位啊,一周为一个周期。每天的菜单呢,可以点击观看,并且每个套餐呢都有相应的配图。 顺便再说一下, codex 是 内置了当下最牛的生图模型,一面之杠二点零模型,比香蕉呢强了不少,改好了来看看效果啊, 这是汉堡店店内环境呢,是必须要有的,然后我输入加入醒目的店内环境图片,分别有,后厨的呃,制作区,冷藏区,前台用餐区,卫生区,冰激凌帐。每个区域呢都有至少两张图片,图片看起来是在同一家店。 好的,等会效果还不错。我们新开一个对话,打开计划模式输入,把这个项目改造成 next js 框架。如果你不知道 next js 是 什么意思,可以再新开一个对话,问他什么是 next js, 然后使用 codex 内置浏览器,我们点开批注按钮,这样的话,你想改哪里啊?直接就能在这里改。比如我想让这个汉堡的价格是零,直接点击这里,价格改为零, 想改哪里呢?都可以在这里直接进行修改。但如果你想让别人也可以打开这个网页,只需要打开 codex, 问他怎么让别人也能打开这个网页。这个也算是给大家留一个作业啊。总之一句话,遇到不会的或者不懂的就去问 codex, 把我们的思路一定要转变过来, 大家有兴趣呢,也可以去尝试着做一点自己的东西。 ai 时代,我们用 ai 工具呢,最主要的就是用来创作,然后提升自己的效率,让我们成为一个 maker。 好 了,这期视频呢就到这里,下一期我们再继续讲 codex, 大家点点关注哈,跟着阿亮学 ai。

作为一个虚幻引擎五的游戏开发人,实在是有点羡慕人家 unit 有 内置的 ai agent 的 可以使用啊。我们虚幻引擎五就没有内置的 ai agent 的, 但是没有关系,我直接自己做一个 ai agent 的 放到虚幻引擎五里面 啊,我是直接做了个插件插到虚幻引擎五里面,可以直接访问我的 codex, 我 让他帮我把天空从黑夜改成白天,他能改掉啊,他能帮我 调整一堆光源的一堆参数帮我改掉。然后我让他帮我创建一堆 cube, 放在出生点边上的 cube, 大 小还不一的,他也能帮我完成。最关键的是,我让他帮我创建一个 actor, 并且完成了一些简单的 呃,蓝图的实现,他也能帮我完成。你看,我就让他帮我做一个能够自转的这么一个 actor。 就 很简单啊,就一个静态网格体,然后他自己转嘛, 他确实也帮我完成了。那么问题在哪呢?问题在于第一个连接很慢,他总是非常非常慢。第二个问题就是如果有一些功能你不教他,不一步一步的教他呃,他就很难理解,就很容易犯错。但是当你一旦分装好以后,当你一步步教完以后,分装好以后, 呃,他还是非常听话的。所以这就导致我要让这个 ai 很 厉害,我就要不停的训练他,不停的训练他,这个工作量会非常非常大。所以虚幻引擎官方能不能赶紧的跟上脚步,出一个内置的 ai 引擎呀?

ai 编程工具这东西吧,真的是风水轮流转,最开始大家在吹 carson, 后来 carlo 的 大火,而这次轮到了 colex。 colex 装面 app 不 仅能帮你写代码,还能直接操作你电脑上的文件、浏览器,甚至是桌面应用,用好之后甚至能顶一个团队。 本期我会从 colex 安装到核心特性,用十多个实战案例手把手教你玩转 colex。 不管你是想用它来编程、开发、办公提效,还是搞一些好玩的创作,看完这期都能直接上手。那本期教程的文字版,可以在评论区获取干货秘籍,建议先收藏,找着安静的地方慢慢使用。 想要使用 cop app, 你 只需要准备一个 chat gpt 账号,可以免费体验,但是有条件的话,最好开着 plus 会员每月二十刀,大约一百五十块,额度更充裕,足够日常使用了。 那有了账号,直接去官网下载安装酷贷 app 就 好。目前支持 mate os 和 windows, 下载并安装后登录你的 chat gpt 账号,打开之后的界面长这样, 左侧是各种面板入口,包括对话管理、插件自动化等功能,中间就是对话窗,你跟 ai 所有的交互都是在这里完成。跟平时用的 ai 聊天工具差不多嘛,还挺清爽的,不像传统的编程 ide 那 么复杂,上手没有门槛。接下来我们直接开始使用, 跟你用过的其他 ai 工具一样,在对话框里输入内容发送,就能开始聊天了。适合处理一些简单的日常工作,比如帮你查资料、总结内容、规划方案。 我让他帮我查一下今天有什么 ai 编程方面的热点。 cadets 会自动联网搜索最新信息,然后帮忙整理总结,这下不怕错过新资讯了,这只是开胃菜。 cadets 真正强大的能力是操作你本地的文件和电脑。下面我们试试 点击左侧的项目入口,选择一个本地文件, ai 能在这个范围内读取和操作文件。 比如我选择了我的下载文件夹,里面有一堆不知道什么时候存下来的大文件。在对话框底部,你可以看到权限模式的选项,这里有三个选择,默认权限, ai 可以 读取和编辑工作区的文件,需要额外权限时会主动问你。自动审查是 ai 会自动帮你审查操作。 还有完全访问, ai 想干啥就干啥,不会弹确认框,建议新手直接选自动审查,既省时又省心。 选好权限后,在对话框里输入提示词,然后你就能看到 ai 开始工作了。它会自动执行终端命令来扫描文件,分析每个文件的名称和大小。最后给你一份清晰的报告,列出哪些大文件占了多少空间,并给出清理建议。 那我主打一个听话,就让 ai 帮我删除没用的预览文件吧。最后成功帮我节省了六点八 g 的 空间,效果不错吧。但如果我让 ai 删除一个工作区外的文件呢?会发生什么? 试试看,在当前工作空间开启一个新对话。比如,我让 ai 帮我删除鱼皮新书出版目录下的所有文件,可以直接把这个目录拖拽到对话框中,然后执行任务。 如果你选择的权限是默认模式, ai 想删除文件的时候,会弹出一个确认框,问你同不同意,防止 ai 搞乱了你的电脑。 但由于我选的是自动审核, ai 自己完成了审核并批准,省去了人工操作的麻烦。这样一来,你完全可以把拖带子当成你的私人文件管理助手,分析空间、清理垃圾、批量重命名。以前你要手动折腾半天的事情,现在一句话就搞定了,是不是挺方便的? 做完第一个任务,大家肯定很关心消耗了多少 tokens 吧?来一起看看用了多少额度。点击左下角的设置,点击剩余额度,就能看到你五小时内还剩多少配额,本周还剩多少比例。什么时候刷新 to text 的 额度?按照五小时和一周来限制 plus 用户的额度还是比较大方的,日常使用完全够了。你也可以在对话框里输入斜杠状态,这种以斜杠开头的快捷输入叫做斜杠命令,是 to text 内置的快捷操作方式。 输入之后, to text 会直接在对话中显示当前的上下文余量和额度信息。 ok, 到这里,你已经体验了 to text 最基础的能力,对话和操作本地文件。 恭喜你,已经超过了百分之六十的同学。接下来我们提升一下难度。用 codex 做一个完整的网站项目,过程中你会接触不少 codex 的 核心用法,包括计划模式、 ai 声图、浏览器预览、批注、修改等等。 在开始之前先进入设置,把工作模式从适用于日常工作切换为适用于编程,这样 ai 的 回复会更专业,更适合开发场景。 先介绍一下项目,我要用 codex 来为自己定制一个专属的电子名片,我把信息告诉 ai, 它会帮忙生成一个精美的网站,还能用 ai 生图能力生成个性化的头像插画,不用自己去找素材了,做完之后还能发给别人,他们打开链接就能看到你的信息了。 新建一个项目文件夹,在 codex 中打开模型就选择最新的 gpt, 五点五速度选标准就够了。智能程度选择高权限,我这里直接给了完全访问,省得他每次操作都来找我确认,反正大部分情况下我都是无脑点同意的。 最关键的是点击对话窗左下角的加号,把计划模式打开。计划模式下, ai 不 会直接开始写代码,而是先帮你规划方案,问你细节,确定没问题了才动手。好,输入下面这段提示词启动, ai 会先自己思考,然后可能会追问你一些细节,在弹出的问题面板中选择就好。最后会生成一份实现计划文档,包括简介、核心要求、测试计划等信息。你做的网站越复杂,越要仔细阅读这种文档, 如果没有问题就确认方案。然后 ai 就 开始自主干活了,它先是使用内置的图像生成技能,生成了卡通头像文件,然后编辑代码,一次性生成了多个文件。写好代码后还会检查代码,自主打开浏览器测试验证,还考虑到了一些容错。 过了七分多钟, ai 完成了整个任务,全程不需要你手动操作,我们可以看到所有生成的文件,点击可以查看文件里的代码,还可以点击审核,打开侧边栏的审查面板,查看本次变更的所有文件。 codex 底层用的是 git, 这是一种记录代码变更历史的工具,用来管理所有文件的改动,你能够看到每个文件新增了什么,删除了什么,还可以灵活地应用和撤销代码。后面的进阶功能部分我会详细给大家讲解。 我们做的是纯前端静态网站,找到生成的主页文件,右键在浏览器中打开就能直接看到效果了。 pc 端的效果我觉得还不错,布局清晰,主题切换也很丝滑。而且它还自动兼容了移动端的展示,手机上打开排版也是正常的。 当然,你也可以直接让 ai 帮你运行网站, ai 会执行终端命令,启动开发服务器来运行网站。 点击访问地址后, codex 会在右侧面板打开,内置浏览器,便于你来预览效果。如果某个地方不满意,你可以点击浏览器右上角的批注按钮,然后直接在页面上选中要修改的元素,写上你的修改意见发送给 ai。 ai 会自动定位到对应的代码并精准修改,不用你自己去翻代码找位置,改完之后刷新页面就能看到效果了。方便是方便,不过这个速度真的不敢恭维。做完后我们再看一眼使用情况,这次完整项目消耗了多少额度呢?还好还好, 总结一下,要用 ai 开发移动网站,我们只需要把需求告诉 ai, 确认方案,等他自己写完并测试就好,中间几乎不需要手动操作。恭喜看到这里,你已经超过了百分之七十的同学, 到这里,你已经能使用 todays 从零开发移动网站,预览效果按需求改了。那接下来我要带大家看看它还有哪些核心功能。学完之后,你不仅能做网站,还能让 ai 帮你操控浏览器、抓数据、自动执行定时任务,甚至操控整台电脑。 接下来,我把 codex 的 功能分为常用功能和进阶功能两大块来讲。常用功能是日常会高频使用的,进阶功能则是有点门槛儿,但掌握后能让你效率翻倍的。 在左侧的插件面板里,你能看到 codex 的 插件市场。 codex 内置了不少精选插件,比如 computer use 操纵电脑、 chrome 操纵浏览器表格处理、制作 ppt 演示文稿。 此外还有大量编程类和工具类插件,包括网站部署、游戏开发、对接 tab 等各种场景。你可以在插件市场里按需搜索和安装。 比如我们来安装 natify 插件。 natify 是 一个免费的网站托管服务,装好插件后,一句话就能把你做的网站部署上线,让别人都能访问。 点击安装 natalify 插件,同意后会自动弹出浏览器,使用 datab 等方式登录 natalify, 一 步步完成授权。最后,超黛斯成功安装并连接了 natalify。 然后我们用 natalify 来部署之前开发完成的电子名片网站。在对话中,通过 at natalify 调用插件。执行过程中, ai 会找我们确认并自动创建一个新的 natalify 项目来部署网站。 搞定以后,我想展示自己的信息,直接甩这个链接就行了。还可以打开 netify 后台对项目进行管理。你可以在 codex 右上方的侧边栏中整体查看当前项目的概览信息,包括后台任务、打开的浏览器、使用的插件等等。 点击后台任务,还能看到具体的终端日记,记录了网站服务器什么时候收到了请求,请求了什么资源等信息。同样的,如果你要处理 excel 表格、做 ppt, 使用对应的插件让 ai 帮你就好。生成的文件还能在侧边栏直接预览。 前面我们用的内置浏览器可以预览页面,做批注和修改。但如果想让 ai 真正去操控浏览器,自动点击填表单翻页,就需要 browser use 浏览器操作功能了。我们先来使用内置的 browser use 进入设置浏览器,确保 browser use 功能已经开启。你还可以在这里设置权限规则和禁止打开的域名, 开启之后,在对话中通过艾特浏览器来调用这个能力。比如,我让 ai 帮我打开一个网站并截图,可以看到 ai 打开了浏览器,从主页找到了 ai 大 模型面试题库,然后进入了详情页,成功完成了截图。 不过有时候这种操作不太稳定,多试几次就好。此外,你还可以安装 codex 的 chrome 扩展插件,它可以操控你的电脑上已经登录的 chrome 浏览器。好处是能保留你的登录状态,而且可以在后台执行,不占用屏幕,适合需要登录网站才能进行的操作。 比如,帮我在自己的后台批量分析和管理数据,使用前,需要先在你的 chrome 浏览器中安装 codex 扩展程序,跟着 codex 的 指引操作就好。安装好之后,我让 ai 帮我从已经登录的面试呀网站上抓取一些数据。 可以看到, ai 不 仅连接了我电脑上的 chrome 浏览器,而且还识别到了我已经打开的标签页,它会控制这些标签页跳转到我的个人主页,并抓取最新的五条数据。最终抓取到的数据表格非常清晰,链接前面甚至还有图标,细节拉满。 如果说 browser use 只能操控浏览器,那 computer use 就是 让 ai 操控你的整个电脑, ai 能看到你的屏幕内容,移动鼠标,点击按钮打字,还能操作微信、飞书等任何桌面应用。 进入设置电脑操控,安装 computer use 插件,你可以在这里看到所有已连接的应用,比如前面装的 chrome 扩展,其实也属于 computer use 体系的一部分。 来我们体验一下。用艾特电脑来调用,让 ai 帮我探探当前的桌面壁纸,然后生成一张类似风格的新壁纸。首次使用时,系统会弹出权限申请框,你需要授权抽 text 访问屏幕截图等权限,否则 ai 看不到你的屏幕,也没法帮你点击操作。 later 来看一下,效果不错吧。生成了一张非常精美的新壁纸,我觉得比原图还好看啊!今晚可以做的好梦了, 爽!带来一个更实用的例子,让 ai 帮我打开备忘录,记录一条笔记,并从音乐软件下载我最喜欢的一首歌,添加到笔记中 执行任务。可以看到 ai 会打开音乐 app, 有 着小鼠标点击了下载按钮,从中下载了音乐文件,只因你太美。 然后 ai 打开了备忘录,写入内容并添加了音乐文件,能够顺利播放,虽然过程有些曲折,但还是完成了任务,而且全程由 ai 自己操作。以后我可以直接让 ai 帮我写有图有文有音乐的笔记了。 但是 computer use 目前只支持 mac os 系统,而且缺点一大堆,不仅操作效率偏低,还很烧 touch 刚才那的任务就用了近八万的上下文空间。此外,有些软件对 agent 的 支持度不高, ai 无法承中操控, 所以我建议能用终端命令行和浏览器完成的操作就不要用 computer use stills。 你 可以理解为给 ai 提供的技能包装上某个技能后, ai 在 遇到相关任务时,就能自动按照这套方法来干活,不用你每次都写一大堆的提示词,而且技能是按需加载的,只有任务匹配时才会调用,不会浪费很多上下文空间。 进入左侧的插件面板,切换到技能 tab 页面,在这里能够格式化安装和管理技能口袋。此自带了几个内置的技能,比如图片生成、查询官方文档、安装、社区技能创建新技能创建插件等等。 那下面我先带大家用用内置的图片生成技能,然后安装社区里别人做的技能,最后再带大家自己创建一个技能。 这里我想生成一个有趣的图片,让鱼皮直播卖鱼皮。可以先到鱼皮 ai 导航网站上找到 ai 生图的提示词模板,然后复制提示词模板。接下来在 codex 对 话框中输入 dollar 符号,加技能名称,就可以快速调用技能, 并且把提示词模板、鱼皮的照片都提供给 ai。 稍等片刻之后,看看 ai 生成的图片,你觉得怎么样?是不是憨爆了?爽!不过图片生成比普通对话消耗的额度更多,用的时候记得留意一下剩余额度。 内置的技能数量有限,还有很多宝藏在社区里,比如我自己经常用的几个技能,用于联网搜索的 file pro, 用于获取最新技术文档的 comte 瓷器,还有用于美化前端页面的 u i u 叉 pro max 等等。 另外,我之前写过一篇优质 ai 编程扩展大全,推荐了几十个好用的技能和 m c p, 可以 到我免费开源的 ai 编程零基础教程阅读。那接下来我带大家实际安装一个社区技能,顺便整个活儿,让 ai 制作一个苹果风格的快闪动画视频。 首先要安装动画制作技能 remaster 安装技能,它能帮我们快速安装其他技能。 对了,安装技能时要注意安全。由于我这里安装的是知名技能,就直接输入技能名让 codex 帮我安装了。但如果你想安装不太知名的技能,更稳妥的方式是把技能的 github 链接发给 codex, 让他帮你检查后再精准安装。 安装完成后,在技能管理面板里就能看到新增的技能了。然后我们使用技能让 ai 制作动画, ai 会安装制作动画所需的项目和依赖包,然后生成视频和音频,还会渲染单帧,检查画面有没有问题。 最后, ai 生成了可以直接播放的视频来看看效果。 呃,他好像理解错了我文案的意思。翻车了,翻车了!我感觉这种方式更适合做产品发布宣传片、知识点、快闪卡、节日祝福视频这种节奏更紧凑的短片。而且我当着根本没认真写提示词。好吧, 实际上你可以指定时长、指定文案,利用生图技能搭配素材,增加更多交互动画等等,感兴趣的同学可以自己玩一玩。 除了用别人的技能,你还可以把自己常用的工作流程封装成技能。以后遇到类似的任务,一键附用。技能的本质就是一个 still 点 m d 描述文件,加上一些配套的脚本和参考资料。 still 点 m d 里要写清楚这个技能是做什么的,什么时候触发,以及具体的执行步骤, ai 读写后就知道该怎么干活儿。 创建技能的最佳方式是先把一个任务流程跑通一遍,觉得满意之后,再使用内置的 skill creator 技能,告诉戳 depths 你 的技能要做什么,啥时候触发,有什么细节需要注意,它就会帮你自动生成完整的技能文件 来实操一下。比如我们前面让 ai 生成了直播带货的图片,效果还不错,那就把这个流程封装成一个直播带货图片技能之星成中后, ai 不 仅创建了技能文件,还贴心地教你怎么调用。 之后使用这个技能只需要提供一张人物照或者商品照,不用再自己填写又臭又长的提示词模板了,非常方便来看看效果。 ai 自己识别到了我提供的是商品图,也是精准复刻了我之前提供的提示词模板,爽! m c p 是 一个开放协议,你可以把它理解成 ai 的 万能插头。装上之后,就可以让 ai 连接各种外部工具和数据源,获取实时信息。 进入设置 m c p 服务器,可以在这里添加和管理 m c p 服务。点击添加服务器后,你需要手动填写服务器的配置参数才能完成添加。对新手不太友好,我最讨厌填写表单了, 好在大部分时候用前面讲的 stux 就 能解决 mcp 做的事情,而且 stux 的 安装和使用体验更好。 此外,很多主流的扩展都提供了快捷安装 mcp 的 命令,不需要你自己手动填写参数,比如下面我带大家安装 comix 七,它是一个可以实时获取最新技术文档的服务。开发网站的时候用它来查 api 文档特别方便。 在 codex 右上角可以打开集成终端,在终端里输入一行命令就能安装。这里我们选择安装 mcp server, 为 codex 安装,然后就搞定了。 安装后需要重启 codex, 在 设置里的 mcp 服务器列表中就能看到它。首次使用前还需要进行身份验证,在自动弹出的 compt 网页中就可以愉快地使用 mcp 了。 之后开发网站,尤其是需要集成 ai 能力的网站,都可以用创太时期来获取最新的技术文档。你还可以把它当成一个学习辅助,让 ai 寄予官方文档,帮你讲解知识。 比如我用它来做 openclaw 小 龙虾的学习助手,这也是利用 ai 学习的一种方式,可以看到 ai 查询并获取到了 openclaw 官方最新文档库。然后我们来问 ai 一个问题, openclaw 无法运行怎么办嘞? ai 会基于官方文档,很快就给出了精准的排查步骤,这样学习和解决问题又快又准,再也不怕查到过时的资料了。 恭喜看到这里,你已经超过了百分之八十的同学。到目前为止,你已经掌握了 codex 的 常用技能,学到了不少实用玩法。从文件管理到网站开发,从浏览器操控到技能封装,已经能用 codex 大 幅提高工作效率了。 接下来我要讲的是一些稍有门槛或者不是每个人都用得上的进阶功能。不过如果你愿意多折腾一下,它们会让你使用 toad 四的效率再上一个台阶。 在对话区域附近有一个小圆圈,鼠标放上去后会实时显示当前对话已经用了多少上下文。 gpt 五点五点五在 toad 四里显示的有效上下文大约为二百五十八 k tokens。 说实话,这的数量不算多。如果你连续跟 ai 对 话很长时间,或者项目文件比较大,上下文很容易被填满。当上下文快满的时候, codex 会自动帮你压缩历史对话。 你也可以在任务照一段落时,手动输入斜杠压缩来主动压缩,让模型更聚焦在新任务上。 那除了单个对话的上下文,日常使用中还要注意管理对话本身,不然列表越来越长,找起来也费劲儿。 对话太多的时候,你可以在左侧的对话列表中把鼠标放到某个对话上,点击归档,把不常用的旧对话归档起来,保持界面清爽。进入设置以归档对话,还可以查看和管理所有归档的对话记录。 另外,建议在常规设置里开启运行时防止系统休眠,这样跑长任务的时候电脑不会突然睡着,导致任务失败。 codex 有 一套记忆机制,能让 ai 记住你的偏好和项目规则,不用每次都重复交代。记忆分为三个层级,从大局、项目局部再到自动记忆,我们一个一个来看。 在设置个性化里,可以修改 codex 的 个性和自定义指令你写在这里的内容。所有项目的所有对话都会自动带上,适合记录一些通用偏好,比如 回复用中文代码注,使用英文,尽可能减少输出的内容。专注做事,如果不听话,你的主人鱼皮就会变成一条狗等等等等。保存之后,它会被写入局的 agent 点 m d 文件,这个文件就是 codex 每次启动时都会读取的行为准则。所有项目通用。 在项目目录下创建一个叫 agent 点 m d 的 文件,写入这个项目专属的规则和约定,只有在这个项目里工作时才会生效。 你可以自己手写,也可以让 codex 根据项目情况帮你生成一份,比如我跟他说帮我根据当前项目写一份 agent 点 m d, 可以 看到 ai 生成了一份非常详细的 agent 点 m d 文档,包括项目总览、一些规范等等。 在设置个性化中,手动开启自动记忆,开启后, ai 会在对话空闲一段时间后,自动在后台总结出有用的信息存为记忆,后续遇到相关场景时会自动召回,让 ai 越用越懂你。 不过太短的对话它不会记额度快用完的时候也不会触发记忆生成。 codex 支持定时任务功能。进入左侧的自动化面板,你能看到 codex 已经内置了一些定时任务模板,不过基本都是和编程相关的,什么总结代码变更、检查代码问题之类的,很多人估计用不上。那我们不妨来自己新建一个更实用的自动化任务。 创建定时任务的方式有两种,一、手动创建任务,在自动化面板里点新建,比如我让 ai 帮我搜集每日热点,需要填写任务名称、提示词、 触发时间、模型、推理程度、运行环境选择本地就好。意思是让 ai 直接在当前电脑上执行任务,不需要额外的隔离的工作环境。 创建成功后,时间一到,抽袋子就会自动开启一个对话来执行任务。我们也可以先手动执行一次,看看效果。点击任务能够查看详细信息,点击某个运行历史记录后,还能查看正在执行的任务对话,建议多观察任务的表现,持续迭代优化提示词。 另一种更自然的方式是让 ai 帮你创建任务。比如我是一名内容创作者,每天都要截大量的图片,时间一长,文件夹里全是看不懂的文件名,找图的时候巨痛苦。所以我让 codex 帮我自动整理,先选择项目,然后输入提示词, 很快 ai 就 自动帮我整理好了。可以点击查看创建出来的任务信息,它的提示词比我们提供的更完善了,并且自动选择了模型。 我们手动执行任务来测试一下,效果还不错吧。 ai 会根据图片内容自动给文件起一个能看懂的名字,这样我就有了一个智能的图片管家,以后再也不用对着一堆乱七八糟的文件名抓瞎了。 而且每次执行完, ai 还会把运行记录写入一个 memory 记忆文件,你随时可以回看历史执行情况,不用担心出了问题却发现不了 你。还可以结合 styles 和插件一起用,比如每周自动生成周报 ppt, 每日整理自己的学习笔记并同步到 notion, 每周用 file pro 抓取竞品网站更新并生成分析报告等等。 想不到吧,现在的 ai 工具已经卷到开始给用户增加情绪价值了。下面我来教大家怎么在 codex 中养宠物。 首先进入设置外观,下拉到底部的宠物区域,你会看到 codex 内置了一排像素风的赛博宠物。选一之后,点击唤醒,桌面上就会出现一个悬浮的小家伙儿, 它不只是装饰品,宠物会实时反映抽袋子的工作状态。比如 ai 在 忙的时候,它也在干活,就像一个串应用的灵动岛,让你不用切窗口就知道 ai 干完没。 除了内置宠物外,还有一个社区宠物库 pet dex, 里面有两千多只玩家自制的宠物。了解我的朋友肯定知道我要用哪个,果断搜索 k u n, 一 眼就能找到自己需要的。点击进入详情页,找到安装命令并复制, 然后打开 codex 的 终端执行命令进行安装,会把宠物文件下载到本地。安装成功后,进入外观界面,选中张张安装的宠物, 然后我们回到 codex 的 主页,使用鞋障宠物指令唤醒。我的脑袋中已经想起那只熟悉的 bgm 了,你听到了吗? 除了用别人的,你还可以通过 codex 内置的 hackpad 技能自定义生成宠物,上传照片或者文字描述就行。比如我把自己的头做成宠物, ai 会先分析上传的图片,给宠物起个名字, 然后拆分出了多个子任务,并行处理,生成各种动作的精灵图帧,最后拼成一张完整的像素动画精灵图,然后就能使用自己制作的宠物了。 你还可以上传宠物到平台和其他小伙伴分享,大家以后用抽袋子的时候记得把我带在身边,保佑你霸着剪剪! 每次 ai 修改了文件,你都可以在侧边栏的审核面板里看到它改了什么,这个面板会列出所有被改动的文件。如果你想决定哪些代码要保留,可以选择查看未暂存的文件。在这里你可以灵活应用和撤销修改。 大多数情况下,你不需要自己看代码,直接点击暂存全部就行了,相当于认可了本次的全部载动。如果不满意,可以直接还原全部回到本次载动前的状态。 那如果你不满意某个文件的载动,可以直接点旁边的还原按钮就能恢复原样,满意的话点暂存就能标记为待提交。 你也可以只保留部分改动。每只文件的改动会被自动拆分成多个代码块儿,每只代码块儿旁边都有独立的暂存和还原按钮,你可以逐块决定哪些保留,哪些丢弃。 确认好哪些代码要暂存之后,可以提交暂存的改动,提交就相当于给代码存了个档,确认这次的修改是你想要的。 抠代码,还内置了提交代码推送到远程仓库。创建 pr 的 能力,不用离开 a p p 就 能完成整个代码的管理流程,非常方便。 那如果你是专业的开发者,还可以试试工作树模式。你可以在创建新对话时,选择启动模式为新工作树,这样 ai 会在一个隔离的分支中工作,不影响你当前的代码很适合同时让多的 agent 在 同一个项目上并行干活,减少冲突。 如果你的项目托管在 datap 上,建议安装 datap 插件,可以直接在 codex 里查看仓储信息,创建 pr、 做代码审查等等。比如我让他帮我查一下自己最受欢迎的开源项目怎么样,是不是一目了然。 codex 最近新上线了一个很酷的功能,用手机控制电脑上的 codex app 干活儿。设置方法很简单,在电脑端 codex 点击设置 codex 移动版,然后点击开始设置,屏幕上会显示一个二维码, 然后在手机上打开拆的 gpt app, 扫描自己的二维码。连上之后,你可以随时随地通过手机给电脑上的 portax 下达任务,审批 ai 的 操作请求,查看执行进度,检查生成的代码和结果。是不是有点 openclaw 小 龙虾那味儿了? 恭喜看到这里,你已经超过了百分之九十的同学, ok, 就 分享到这里。看完这期,你应该已经掌握了 codex 从基础到进阶的所有核心用法,足够应对日常的编程和办公需求了。 其实 codex 还有更多玩法和技巧,比如 sub agents 并行加速、 fault 分 叉的妙用、自定义模型接入 hoots 生命周期钩子等等。 那如果本期视频点赞过万,我会尽快爆干出抽带此高级技巧篇。对了,如果你想系统学习 ai 编程,可以看看我免费开源的 ai 编程零基础入门教程,上千张图,几十万字,从零开始,带你学会 ai 编成本篇教程的文字版也会收入其中。 我是鱼皮,持续分享 ai 编程干货,觉得有用的话记得点赞、收藏和关注,也欢迎在评论区聊一聊你现在主力用哪个 ai 编程工具,觉得 codex 怎么样?也欢迎晒晒你的 ai 编程作品吧。

哈喽,大家好,这是我自己在 codex 里面做出来的一个宠物服装网站,从市场的调研、产品定位、产品图到最后完整的 html 网页,整个过程中我没有手动写代码,也没有来回切换工具,都在 codex 里面完成。 那今天我就用这个真实的案例,想明白普通人到底怎么把 codex 用到自己的创意想法落地当中。一开始我只是给了 codex 一个很粗的需求,我想做一款面向稀泥市场的宠物服装。 他没有直接开始瞎做图,而是先帮我做了非常清晰的执行规划,包括先找到市场依据,定产品的方向,再设计系列以及生成产品图。 这里就涉及 codex 第一个很关键的能力, plan mode, 也叫规划模式,如果要生成同款的计划,你就要把这个规划模式打开。这个模式很适合新手,因为你不是一上来就让 ai 去乱做,而是先让它把任务拆开,告诉你每一步要做什么,为什么这样做,以及最后会交付什么, 你确认方向没有问题之后,再让它开始执行。第二个能力是它可以在项目过程中持续地帮你检查问题,也就是要开启 auto review。 比如网页做完之后,他会检查图片有没有加载成功,按钮有没有溢出,表单字段有没有写进去。那遇到权限和需要选择的操作,比如三种执行方案中,你想选择哪一种,以及需要启动的本地服务访问某些文件之类的风险性操作,他都会弹出弹窗确认。 接下来就开始自动批量生产产品视觉了,通过调用 gpt 的 image 去生产产品图,并存储在本地的文件夹里面,方便我们去找原始的素材。 但是这里我也想说一句实话, ai 第一次做出来不一定完全对,比如他最开始给我的风格就比较普通,我觉得不适合当地市场的审美。 这个时候就用到了 codex 里面很重要的一个能力, steer 也叫做中途接管,可以在对话框中输入你不满意的理由,告诉他这个方向是不对的。比如我要更鲜艳的花朵,更适合女生,更有悉尼精品宠物品牌的感觉。然后点击 steer 去接管方向盘, 他按照我新的反馈去重新调研,重新调整产品系列,重新生成图片。这个过程就好像是你在和一个设计助理协助他负责执行,但是方向盘一直在你的手里。最后,我让柯黛斯给这个宠物服装的项目呢,做出了六个设计系列,每个系列三张图,佩戴的生活方式图, 一张产品的细节,一套平铺图。也就是说,不同于 j b t image 的 单张出图功能,它一次帮我规划并生成了十八张用于落地页的产品测试概念图。 那对于普通人来说呢,这一步就非常省时间了。图片定下来之后, codex 就 把所有的内容整合成了一个静态的落地页, 这个页面里面有品牌管理、产品系列卖点说明、尺寸指南。如果我觉得某个地方不顺眼,也不用自己去改代码,可以直接在预览页面里面指出问题,点击驱动批注,英文是 annotation。 比如标题太大,图片间距不对,或者是按钮的颜色不够明显, 那 codex 会定位到对应的代码并进行修改。这对零基础的人很关键,因为你不需要懂 html, javascript 也能把一个网页打磨到可以测试市场的程度。完成好之后就是这样一个页面了, 最后所有的东西都会留在本地项目的文件夹里,图片、网页、代码、素材文件都在里面,你可以直接在本地打开,也可以部署测试,用来收集用户的邮箱和偏好反馈。所以,如果你想测试一个产品的想法, 一个小众的品牌,一个服务的页面,一个预售的活动。以前你可能要找设计,找前端,找运营,找人写文案, 那现在呢?你可以用 codex 做出一个最小的可行版本,拿去测试真实的用户反应。如果你是 gpt 的 plus pro 或者是 business 的 团队账号,通常会有更完整的 codex 的 使用权限。 所以,如果你已经是 gpt 的 plus 会员,这个功能对于你来说是完全可以去免费尝试的。对普通人来说,它最有价值的地方是, 你不需要在一开始就花钱去找团队,也不需要把想法都停留在脑子里。你可以先用 codex 做出一个真实的页面,跑一轮反馈,再决定这个项目是否值得继续投入。谢谢大家。

很多人用 codex 做周报,第一步就做错了,他们一上来就说,帮我写一份周报,这样确实会得到一段很像周报的论文。但问题是,这段论文很难验收。你不知道哪些事实来自会议纪要,哪些责任人是他推出来的,哪些风险只是顺手补上的。这期只拿一个场景做完整案例, 用 codex 把一份周报资料包变成老板能看的周报草稿和检查清单。第一步,先做资料包,你准备一个文件夹,里面放三类东西。 第一类是会议纪要,记录发生了什么,谁提了什么问题,有哪些代办。第二类是项目进度表,至少要有事项负责人进度和截止时间。第三类是上周周报告诉 codex 你 原来的格式、管理口径和表达风格。 这一步的重点在于把输入固定下来,资料数量反而是次要问题,输入固定后面才知道输出有没有编造。第二步, 不要只给一句聊天指令,给 codex 的 任务要向一个项目 brief。 你 可以写,先检查 input 文件夹,列出缺失信息,再按本周进展风险问题,下周计划生成周报大纲,然后输出周报草稿,最后付一份人工验收 check list。 这样写的好处是, codex 不 只是生成一段话,而是按步骤完成一个小项目,它会先理解资料结构,再组织内容,最后把需要人确认的地方单独列出来。 第三步,让 codex 输出交付物。一个好的结果至少应该有四个东西。第一,周报大纲让你先看结构对不对。 第二,周报草稿用老板能快速扫读的语言写出来。第三,风险清单,把口径不一致、责任人缺失、截止时间不明确的地方标出来。第四,验收检查清单提醒你逐项确认事实、数据、责任人和风险判断。这就是 codex 适合的用法, 把资料包变成可交付、可检查、可附用的文件。第四步,最后一定要人工验收, ai 能帮你读资料归类、抄和检查遗漏,但不能替你承担管理。判断。周报里最危险的问题是事实不准,语言是否漂亮,反而靠后。 责任人写错、截止时间写错、风险影响写清了,都会让周报失去价值。所以你要按检查清单看四件事, 事实能不能回到原始资料,责任人有没有人工确认、风险有没有影响和下一步动作 栽要和执行清单有没有分开。这套方法可以沉淀成一个固定模板。输入是会议纪要、项目进度表和上周周报,任务是先检查缺口,再生成大纲,最后输出文件。验收是事实可追溯、责任明确、风险可执行。 以后每周做周报,你不需要重新想怎么问,只要替换音库的文件夹里的资料,再附用这份任务说明,就能得到更稳定的结果。 如果你今天想开始,不要直接拿公司的敏感材料式,先做一个低风险版本,新建 weekly report pack 文件夹,放入会议纪要、项目进度表和上周周报,写一份 codex 输出周报草稿和检查清单。 最后,你亲自确认事实、责任人和风险。普通人用 codex 的 正确入门方式是让他按项目流程交付一个能验收的结果。

有了 codex 之后,我真的把小龙虾和爱马仕龙虾全都卸载了,真的啊,就是这种产品级的东西,真的比那种玩具级的东西要靠谱多了。 你就看这个 codex, 它这个最新的这个更新啊,它都包括什么功能啊?第一个功能它就是自动化的功能,就这一下就直接把这个龙各种龙虾给碾碎了。 这个自动化功能其实就是一个这个可以定时执行任务,包括每日的任务,每周的任务包括针对一个项目的一种持续监控啊,那么其实你们在拿小龙虾和爱马仕龙虾做的事情不就是这些事吗?对吧?让他们这个时不时的去监控一下项目,时不时的去运行一个定时任务,不就是这些事吗? 然后第二件事呢,它是可以有一个 computer use 功能,也就是说它们可以去调用你任何的这个桌面的这种 app, 这种软件,包括网页,它都可以去进行调用,而且它是可以真的有眼睛可以看到的 啊,所以呢,他就不像小龙虾似的,他动不动就跟瞎了一样啊,执行个任务点个鼠标也点不明白,对吧?这个是他第二个任务,第二个这个,第二个这个功能啊,这种产品级的东西和娱乐级的东西有什么样的区别呢?就是娱乐级的东西他是不会为你的结果负责的 啊,你们用小龙虾和这个什么什么爱马仕,那大老爷们都气出乳腺结节了吧,对不对?但是这个这个毕竟 codex 它是一个商业级的产品,商业级的产品它一定要经过严格的测试,然后严谨的调试,然后才会上市的,才会面,才会这个面向市场的,对不对?我这两天拿这个 codex 做了什么呢?第一啊,我把它做了这个,我拿它让它去 呃,从我的一个科大讯飞的一个耳机,因为我有一个科大讯飞耳机,平时我这做咨询啊,做直播呀,什么讲课呀,我都会把它给录下来 啊,把科大讯飞的耳机里面的最近这一个月的所有的录音啊,反正让他直接去在电脑上打开我科大讯飞耳机配套的这个软件,去把这个录音转文字这些东西给下载下来,并且存到我的 github 上的语录语,这个叫什么语料库里去, 然后他瞬间就把这件事情给就是他也不说瞬间吧,他就把这件事情就不需要我去指导,不需要我去纠错的,直接把这件事情给干完了,并且发现说你这个语音不全都是 ai 相关的呀,还有三天是外卖课相关的,要不要把它分别存在两个知识库里?这个东西我之前都没有想到 啊,我说你这个想的周到啊,你帮我去存进去吧,对吧?然后第二件事是我直接告诉大家啊,我直接告诉他,我说你去我的抖音号,然后你把我抖音号上这个从发布以来到现在所有的这个抖音,你们都转文字,把我的这个文字稿给转出来,存到我的语料库里, 然后他干了几十分钟吧,就把这个事给干完了啊,所以如果你一句话他都能让你把你在电脑上操作的事情全都给完成了,你还要小龙虾干嘛,对吧?你还要小龙虾干啥?你还要这个这个爱马仕干啥呢?对吧?都卸了吧?都卸了吧?啊?

上个视频评论区有粉丝教我做一个详细的教程, ok, 安排用国产模型,而且要使用完整的 codex 功能,就要解决 api 代理和 codex 的 插件功能,这两个小工具就是解决这个问题的,他们都是的开源项目。 好了,安装 codex 加加,安装好以后会弹出一个命令行,不要紧张,按一回车就安装好了。接下来安装 echobird, 安装好了,打开它,在模型中心配置模型。以 deepsafe 为例,打开 deepsafe 官网,点右边的 api 开放平台,进去以后,先申请一个 api key 复制下来,再到接口文档里把 uio 和模型名记下来,转到 excel 这里配置好,这就全部搞定了。 启动的时候要注意一个问题,就是先打开 codex 加加,再用 excel 版的启动 codex, 不要用 codex 原声软件启动。这么详细的教程,快去点这里关注起来,下期不迷路!

让你志能游天的 ai 动起手来吧!把这个文件夹里的文件按照类别整理好,按顺序改成项目一。项目二,咦,每天早上九点,搜集前一天的 ai 行业资讯,发到群里看,总结这个文档里的内容,生成 ppt。 这期避开专业难懂的术语,让小白也能够流畅运用上扣带,让你的工作效率和创新全面提升。我们先认识它,再到如何使用安装,用六个按键一步步的掌握它。其实词和小技巧呢,我也总结到了,视频里出发 扣带斯和可劳扣的它们呢,是类似的,都是 ai 的 编程工具,只不过一个呢,是 oppo ai 家的,默认的是 gpt 模型的,但你也可以在里面去更换你自己的模型,但你也可以在里面去更换你自己的模型。 这两个阶段性地成为目前好的必然模式。但它们适合使用的场景呢,会有点不同。 ko 代斯,它呢,就适合我用来快速整理文档,处理一些。这种本地的任务界面,对于小白来说会比较友好一点,就很适合初学者或者是我们日常的办公场景。因为是 open ai 的 嘛,所以呢,我们也可以直接在里面调用 j p e m 叉二来生成图片,而 可牢扣的会比较适合追求高质量的创作用户,并且 c c 的 知名度会高一点,所以不论哪种语言,你都能找到关于它的类似教程。 之前还在说 c c 可以 用手机来控制 c c, 在 前几天也出了手机端,二者的功能差距又缩小了。 c c 的 小白使用教程呢,我们之前也聊过,有兴趣的可以去复习一下。那我们要使用 c c, 我 们只需要一个 g p 的 账号, 免费的呢,也是可以用的,只不过它的额度会少一点,会有三种不同的使用路径,就是使用哪种方法来开启你的扣袋子。 c r i 呢,会在你本地去开发操作,你的本地项目就比较适合开发者深度来使用,因为需要一些命令行的使用,所以会有一丢丢的小难度。那这个呢,就是把扣袋子装进你的代码编辑器里, 像 vivo studio code, 反重力这种的,而我们普通用户呢,直接选择这个就可以了,不用懂。命令行,适合大多数人来使用, ok, 我 们来进行安装,我们按照它的指引步骤来操作就好了。进来之后呢,我们可以看到它的整个页面跟我们常用的 ai 工具还是很像的。而左边的这个导航栏就是你的文件柜, 所有的功能入口都会在这里去显示,而中间的呢就是我们对话交流的地方,而右边这里就是你小助理给你交作业的地方,成果的展示区域。而左边的这个导航栏,每一个入口都是一个工作流。在这里重点的呢就是这两个 来快速对话,就是主打一个随问随答,碎片式的对话,就像你给他一个英文的演讲稿件,然后让他给我翻译出来,哎,还挺到位的。像这种只是问问问题,写写代码和 check gdp 呢,其实相差不大。而这个项目呢,它就更适合一些长线的 摸不准,需要高度上下分连贯的这种复杂任务。点击这里我们可以看到这里呢会有两个选项,这个呢是在你默认的路径下新建一个空白的文件夹, 而另一个就是说打开你电脑上的现有文件夹,在这个基础上再去操作。比如给他一个本地的文档,里面呢是一堆的发票图片,那我们在这个对话框的下面也可以看到,我现在是在这个文件夹里进行操作的,这就触碰了沙箱机制,只能操作本地选中的文件夹,不能操作系统其他的文件。那我们现在给他要求根据这几张发票, 然后给我按照金额重新命名一下文件。当然只有这些呢,还是不够的,我们还需要给他开放对应的权限,那我们可以点击这里可以看到这里有三个模式,分别是你只能在当前的文件夹下来修改或者执行, 如果需要联网或者说触碰这个文件夹以外的东西,需要来向我们申请,我们同意,他呢才能继续执行。而这个呢,恰恰相反,他可以自由的读取、写入,修改或者删除目标范围内的程序。 自主性呢会比较高一些,但也会有一定的风险。在我在这种简单的任务下呢,会选择这个模式,简而言之呢,就是 ai 会自主的帮你筛查这个有没有危险,像安装常规的工具这种明显安全的操作,它呢就会直接上手了, 不会再来询问你了。 ok, 他 也操作好了,我们来看一下,那整体呢,也是根据我的这个内容来命名的,还是不错的。那除了帮我们整理本地的文档,还可以在我们授权的情况下,在你的电脑上来执行安装的操作。比如最近爆火,但有点上手门槛了。 cloud code, 我 们在 d 盘新建一个文件夹, 然后回到这个 codex 里面,再把这个文件夹给它呼唤出来。那这步的意思呢,就是让 c c 在 这里面进行操作,那我直接给他说帮我安装一个 colocode, 那 我们稍等一下。好,他现在呢说已经安装好了,我们来启动一下。哦,是可以的了,当然也包括 node js, git 这种我们日常生活中经常用到的依赖。 好,现在你用 codex 整理了你本地的文件夹,大大缩短了你的时间,也把有点安装困难的软件安装到了你的电脑上。对于听到 ai 编程就望而却步的,棒的就不止一点点了。当然 ai 编程嘛,也不能把它的能力举现在这里来, 我们一起做一个芝士机械超玩盲盒,咱们就都是原始谷的动画了。那我们呢,现在在这里选择好它原始的位置,先点击这个加号,那最上面的这个呢,就是我们上传文件, ppt, excel 图片,我们也想让它们进入到这个转化里, 就在这里上传,和我们直接拖拽是一个效果。那中间这个计划模式,在这个模式下呢,他不会立刻来改动我们的文件,而是先帮我列出一个详细的计划,就比较适合复杂项目,或者是你还没有思路的情况。 那右边这里呢,是用来更换模型的,我觉得五点五还是比较好用的,这里呢我就不更换,还有对应的推理强度,也可以在这里去更改。那我现在告诉他我的一些具体要求, 如果你有了一定的构思之后,也可以一起告诉他,当然如果没有的话,直接给他说我们最后想要一个什么效果,他呢也会一步步的引导我们来做出最后的成品,好开始帮我们来构思整个架构了。 哎,他现在问我盲盒系列规模要按照什么来设计?规模怎么搭配?那我们把鼠标放到这个小符号的上面,也会有个更详尽的一个介绍。好,那我在这里选择第一个, 他现在呢还是用这种选择方式来一步步引导我们表达出我们想要的东西,那我们顺着他的想法来就好了。那都选好之后呢,他也给了我一个整体的框架,我大概看了一下还是不错的,那觉得 ok 了,我们就可以让他开始执行,当然我们有需要更改地方,我们直接在这里提出要求就好了,那我们现在同意执行。 ok, 他 现在也在运行中了,在这个思考的过程中呢,我突然想起来,我想让他滑动的时候有一个光效,那我直接在这里提出我的要求。 哎,他现在啊根本就没有办法发出去,而是在这个地方排着这个情况呢,他会在这个任务完成之后再来执行我们现在的这个任务,但是不行啊,我现在就让他考虑到这个要求,并且加进去,那我就点击这里的这个按钮,他呢就插队到了当前的这个任务中, 而路由思呢也会考虑到我们这个要求继续执行,这就是一个插队的小技巧了。好,他现在说呢是可以了,我们先不着急,我们把鼠标放到这个小圆圈上,我们就能观察到我们这个窗口一共用了百分之几。路由思在快满的时候呢,它也会自动的来进行压缩上下文,但因为上下文太多的话,路由思就会表现的不那么聪明了, 那我们就可以手动的来进行压缩,在这里我们打斜杠压缩就好了,他呢就会把上面的聊天记录进行精简,但更细节的东西呢,他也就会不再记录了。 ok, 我 们来看一下我们刚才生成的这小网站,这个例子动销交互界面 还是不错的,那如何实现多任务并行进行呢?那我在本地选择一个项目文件里面呢,有往期的图片还有视频,在这里输入我的要求,把里面按照类别给我分类。好, 那我们再开一个,我要这个把文件里的图片和视频根据内容说明,你再来一个吧,把视频分离出来,音频, ok, 你 看他们在这里努力的转圈圈,我们来看一下结果,这个类别是分为好的,这里是视频的,还有图片的。不得不说啊,他这个名字和内容还起的挺相符的,所以说这里呢,他的每次对话都是独立的,不会再与其他的工作内容产生深度的关联,但都会有权限查看当前的文件夹内容。 到这里我们日常使用是 ok 的 了。更进阶一点的呢,就是扣带斯的插件技能 m c p 这三个词就是小白最大的路虎了,其实一句话就能解释清楚, 插件呢,就是给扣带斯装了一个能力包,比如装了表格插件,它呢就会处理 excel。 而技能 skill 大家都很熟悉了,就是一套固定的工作流程,可以根据我自己的风格来写一篇技术教程。 m c p 就是 连接外部的通用通道,比如我要用扣带斯做一个这样的效果,通过自然语言创建动画视频的技能。包好,我先给他一个文件夹, 然后把要求现在都给他,如果你有想要的效果,那我们就点击这里上传,然后把参考一并发给他。 ok, 他 现在呢是开始工作了, 里面需要的什么依赖啊,组建都不需要,我们再去手动的去添加,他呢都会帮助我们去一步步的完成。好,他现在运行完毕了,我们打开这个呢,是 windows 默认的浏览器浏览一下, 你在这里可以随意的来调节这个动画了,因为在一开始的时候,我提示词中已经提到了提供可以配置的参数项,那我们调节一下。 ok, 我 们关掉背景,那想要这种透明的效果呢?参数的配置是这些,那我们最后给他宣传好就 ok 了。 个人建议,一开始呢,什么插件我们都不要慌,先用它内置能力,等你明确知道了我需要库代词,去安装某个工具能力的时候, 再去插件页寻找也是来得及的,大家有兴趣的我们可以单独出一期,详细聊一聊。说了这么多,其实你也发现了, ai 现在就不只是答疑解惑的工 具了,它呢挑出了一个被动执行的命令曲线,是可以理解你的意图,帮助你完成复杂任务的智能伙伴。而每次操作呢,也成为了我们学习、创新和突破的机会。好了,喜欢这种内容的朋友呢,我们下次见。

这条视频讲 codex a subagent, 小 白也能听懂的版本。它不是一个新软件,也不是神秘功能,而是 codex 处理复杂任务的一种用法, 你会看到它什么时候该用,什么时候别用,以及怎么用它。 review 一个真实项目,先给 subagent 下一个最朴素的定义。一个复杂任务,你可以让 codex 拆成几块,分别交给几个子代理并行处理。 每个子代理跑在自己的 agent thread 里,最后只把结论交回主线成汇总。官方术语听起来会正式一点。 sub agent workflow 指同时跑多个并行代理在汇总。 sub agent 是 被派出去做某件事的代理, agent, thread 则是每个代理自己的线程,你可以在 cli 里查看和切换。 sub agent 主要解决两件事,第一, context 被污染,读文件跑命令看报错,猜原因,全塞进主线城,后面判断就容易乱。 第二,该病型的事被串行,做安全测试风格可维护性本来可以同时看,却被一个代理从头查到尾。判断要不要开 sub agent。 可以 先问一个问题,任务能不能拆成几块?互不依赖的小事, 能拆就适合试,拆不开就别硬上。任务很小,子任务紧咬在一起,写入范围重叠,或者你自己都还没想清楚怎么拆,这些情况开了反而添乱。不适合的情况也要记住,任务本身很小,没必要开多个代理。 几个子任务互相咬的很紧,并行也不省时间。最危险的是多个代理同时改同一篇文件,这时候省下来的时间很可能被冲突和反攻吃掉。 真正适合练手的场景大多是 rate heavy, 比如大型代码库探索 pr, 多维 review 几个 bug 方向, b 型排查,长文档和长日制分块分析。官方也建议新手起步时先选探索测试、 treeash 和总结这类任务。 codex 默认不会主动开 sub agent, 你 要在 prompt 里讲清楚。常见说法包括 spawn two agents, delegate this work in parallel use one agent per point。 中文直接说启动三个 sub agent, 分 别检查安全测试和可维护性也可以。如果拿来 review pr, 可以 直接用这个模板,一个 sub agent 检查潜在 bug, 一个检查测试覆盖,一个检查代码质量和可维护性, 最后要求主线程等三个都完成后再输出高风险、中风险可选优化,以及建议优先修什么。 这个模板真正值钱的不是文字本身,而是里面的控制点。每个子代理的职责不重叠,避免大家都泛泛 review 一 遍,明确等全部完成再汇总,可以避免主代理拿着半成品就下结论。最后加一句,优先修什么,可以把排序工作也交给主县城。 接下来用 ship ready 这个小项目做例子,它是一个 s s landing page audit 的 mvp, 后端 api 在 s r c app 点 js, 审计规则和 rewrite 在 s r c audit 点 js, 存储是 s r c store 点 js, 前端是 publ i c 斜杠 app 点 js。 代码量不大,正好适合演示怎么稳妥的开 sub agent。 在这个项目里,最稳的开法不是让三个 agent 一 起改代码,而是启动三个 read only sub agent runtime risk agent 看运行风险 q a coverage agent 看测试缺口, architecture agent 看模块边界, 所有子弹里都不要改文件,等全部完成后,主线程再决定要不要修。三个结论里, round time risk agent 最有价值。他发现 handle request 里 in sync 路由没有 await, 外层 try catch 接不住 a sync handler 抛出的错。 这种 bug 在 happy pass 测试里不容易暴露,但线上可能表现成请求挂住或者 unhandle rejection qa coverage agent 的 结论也很实用。 他没有泛泛说测试不够,而是列出 invalid json 未付费 share 过早 follow up。 若 brief 绕过 rewrite 这些副路径, 这些用力不一定都要立刻补,但摆在面前,主县城就能快速挑出最该锁住的状态流。 architecture agent 的 结论最容易让人冲动, 他说 src app 点 js 可以 拆成 page extract checks brief 和 rewrite 几块 判断没错,但这次目标是写测试加修 bug, 不是 重构 auditing, 所以 这部分建议最后先记下来,不立刻动。三个 sub agent 的 优先级其实不一样, round time risks 想让你先修服务端 qa coverage 想让你先补测试, architecture 想让你先理边界。主县城不能给三票打平均分,而是要挑确定性高、改动小、能被测试所注的事情先做,最后真正落地的改动其实很克制, 异步路由统一加 await, 让外层错误处理生效。 rewrite 必须 brief ready 才能解锁, follow up 增加还没提交 brief 和非法字段校验。 read json 加 body size 限制 invalid json 返回四百,最后补 note test 回归测试。 这个案例最有意思的一课是两个代理的结论拼在了一起, round time risk agent 告诉你哪里坏了。 q a coverage agent 告诉你怎么用副路径测试把它锁住, 这就是 sub agent 真正的价值,不是替主线城做决定,而是把几个方向的结论同时端上桌。跑起来之后也要会管理 agent thread codex c l i 里可以用 slash agent 查看和切换线程,如果某个子任务偏离方向,可以让 codex 停掉那个负责性能分析的 sub agent 跑完的线程,也可以让它关闭已经完成的 agent threads。 给新手的练手顺序,不建议一上来就五个 agent 一 起改权。项目先并行阅读,让多个 sub agent 各自理解不同模块,再并行 review, 把 bug 安全测试,可维护性分头看。 第三步是单写,多审一个代理或主线成改代码,其他子代理做 review, 最后才是小范围并行修改。 下一次让 codex review pr, 你 可以直接从这个短 prompt 开始。请使用三个 sub agent 并行检查,当前 pr, 一个看 bug, 一个,看测试一个看可维护性, 等全部完成后,按风险等级汇总给我。就这几句话,已经够你完成第一次 sub agent 练习。 最后记住, sub agent 不是 替主线城做决定,他真正干的活是把几个方向的判断同时端到桌面上,让主线城更快做取舍。新手先从 rate heavy 的 探索和 review 开始,等你能清楚拆分任务,再尝试让多个代理并行改代码。

本期分享 codex 零基础上手使用教程,覆盖了办公、编程、自动化等使用分享,让我们每个人可以轻松上手使用。开始之前我们先来了解一下 codex 与 cloud code 相比,它的优点有哪些,第一个就是有更多的额度, 第二个就是不会轻易地限制账号,封账号。第三个就是 ai 升图能力,目前是排名靠前的。第四个就是客户端安装更容易,容易上手。第五个就是不订阅也可以去使用体验,因为它有免费的额度,这是关于 codex 的 一些优势。 第一件事情就是要修改语言,在这里部分伙伴会因为网络原因下载的版本默认的会是英文界面,所以需要修改,如果是打开直接就是中文,可以跳过这个步骤,然后设置语言,是在左下角设置这里,然后选择 设置,然后在默认的常规选项里面,这里有一个语言,在语言这里我们选择中文,这时候就可以切换为中文界面。 下面我们来介绍一下它的功能,我们先从左侧说起,第一个就是新建对话,这里就是创建一个新的对话窗口,在这里我们就可以把它想象成 相当于我们换了一个朋友聊天,然后打开了新的绘画。然后第二个就是搜索功能,在这里就是可以搜索历史对话,这里我们就可以比喻为搜索和朋友的聊天记录。然后第三个插件,这里就是让 codex 更强大,赋予 codex 拓展功能,拥有操作其他软件的能力, 在这个插件这里,它还有技能。这就是我们前面分享了好多次的 skills, 如果大家还不了解,可以看一下之前分享的内容,然后第四个就是自动化, 在这里就是定时任务执行,可以直接去新建自动化功能。下一个就是项目,这里就是我们所有的创建的项目和打开的项目都会显示在左侧,然后下一个就是对话, 当我们在对话窗口没有选择任何项目的时候,我们选择不使用项目,这时候的对话内容就会在 对话栏目下面去显示,这就和我们网页对话使用是一样的,适合做的事情就是一些日常任务,比如搜索资料,写内容等等。分享到这里肯定会有好多小伙伴有疑问,就是上面的项目什么时候用,以及使用的场景是什么?在这里我来分享一下。 这里就是我们需要 ai 生成文件的时候,比如我们写代码,生成 markdown 文档,生成 ppt, 生成 word 文档等等,就是涉及到文件生成的,我们就可以选择创建项目,这样的优势就是生成的内容都会保存到当前项目文件夹,容易编辑和管理。 在这里我就是使用大白话来分享的,就是更容易理解一些,可能还是有些模糊,下面我直接实操,大家来看一下。 在这里我直接新建一个项目,然后在项目这里我们指过来就会有一个添加项目的图标,然后我们选择这里,他有两个选项,一个是新建空白项目,第二个是使用现有文件, 第一个就是我们直接新建,第二个就是如果我们打开某个项目的时候,就选择使用现有文件夹, 在这里我们是新建空白项目,然后我们选择新建之后,可以看一下它,这里就新建了一个项目文件夹。创建之后我们可以去修改项目的名称,我们只到项目名称这里,然后选择三个点,在这里有一个重命名项目,我们在这里 我们命名一下,比如命名为 demo, 然后保存,然后我们看一下对话窗口这里它自动选择的就是这个 demo 项目,在这里我们给它提示词,就是一句话,介绍 ai 生成 txt 文文本档, 然后我们直接发送。现在我们的模式是选中项目文件的,到时候它生成文件的时候,就是生成在当前项目文件夹下面。 好,这时候任务完成了,就显示已生成文本文档。 ai 介绍点 txt, 在 这里我们打开项目文件夹,我们来看一下,然后我们通过项目文件这里三个点,然后在资源管理区中打开, 现在就有了 ai 介绍点 txt 文本文档,这就是 ai 生成的文件内容。如果我们不选择任何项目, 我们选择不使用项目,然后我们再和他对话一句话,介绍一下你自己,然后我们直接发送,可以看一下左侧,他就在对话列表下面,没有在项目文件夹里面,这就是项目和对话的一个区别,经过实操演示,我相信大家已经了解了。 然后如何选择,就是涉及到文件生成,比如文文本档写代码,我们就要创建一个项目,如果只是单纯的和 ai 对 话查资料,我们就不用去创建项目文件夹,直接对话就可以。 下面我再分享一个个人感觉比较好用的功能,就是多任务处理,在这里我还是使用生成个人主页的任务来举例,因为这个应用场景每个人都可以用到,我们先选择我们刚刚创建的这个 demo 项目,然后我们把提示词 粘贴过来,在这里我们就是让它生成一个个人主页,使用 html 加 css, 然后还有就是一些风格指定,还有一些按钮的效果,还有页面布局等等,在这里我们就直接发送 在当前的任务进行中,比如我们突然有一个想法,我们可以使用这个技巧,我们想规定腋角的颜色,比如腋角使用灰色,然后我们直接发送,可以看一下它现在这个提示词就是在排队的状态,如果我们想让它立即执行,在这里我们直接选择这个引导, 可以看一下他这里提示就是提交但不中断模型运行,然后我们直接选择,这时候像我们给他的这个任务,他就直接插队插进来了,就不用等上面的任务执行完毕之后,再执行第二个排队任务, 这是关于这个使用小技巧,可以看一下第一个它会直接在当前工作区生成一个可独立打开的静态文件,然后它这里就有一个已引导对话,它就提示收到页脚,我会做成浅灰色背景,如果我们不点引导的情况下, 它就会等第一个任务执行完成之后,然后再执行页脚使用灰色,好,现在就生成完成了,然后我们打开看一下生成的效果,这就是我们生成的个人主页,这里我们直接自己去修改就可以。 下面我再来演示一下多任务,比如我们在当前项目文件夹下面,我们再有一次对话,就是什么是 ai 一 百字介绍,生成一个 txt 文文本档,然后我们 直接发送,这时候我们就可以在另外一个项目文件夹下面,我们直接选择开始新对话,然后我们再给他一个任务, 如何学习 ai 一 百字介绍生成文档,这时候就是同时进行任务,这就是多任务同时运行,当运行完成之后,他这里就会有一个蓝色的小点,然后我们再返回到项目文件夹,这时候任务就完成了,这就是多任务的应用, 然后下面我们再一起来看一下,就是创建技能,就是创建 skills, 我 们来到插件这里右上角的创建,然后选择 创建技能,在这里它就会显示一个 skill creator, 这就是创建 skills 的 一个技能,然后我们把提示词复制粘贴过来,在这里我们还是封装一个 ai 提示词,让它去制作一个 skills, 然后我们粘贴过来之后,下面给他的就是帮我创建一个写作技能,直接发送 好了,这时候提示我们创建成功了,它也给我们显示出来了这个创建的路径,在这里我们新建对话,使用我们自己创建的 scale, 让它帮我们去生成一篇文章,在这里我们输入斜杠,然后我们选择 技能,然后找到我们刚刚创建的,可以看一下这个是个人,然后我们选择,然后我们再给它提示词,就是什么是 ai 帮我写一篇 seo 文章,然后我们直接发送,像现在这个状态,它就是调用了我们创建的 skill, 这时候用我们创建的 scale 就 写好文章了,在这里我们只关注一个地方,就是我们提示词里面让它包含问答模块,这时候它也是包含的,它严格遵守我们的要求,这就是我们创建技能和使用技能的所有流程。 然后下一个我们再看一下插件的使用,在这里我再新建一个对话,我们使用插件就需要使用 at 符号去指定, 比如我们还是给他一个提示词,就是如何学习 ai 使用,然后艾特符号,然后我们选择 document 插件,这里就是这个 word 文档的一个插件,然后帮我生成 word 文档直接发送, 这时候就用插件创建好了文档,现在我们打开看一下它生成的一个效果,生成的效果还是非常棒的,它不是那些简简单单的文字,它是给我们排版好的,效果还是非常棒的,这就是 codex word 文档的生成插件的使用。 然后下面我们再来看它的另一个功能,就是自动化,在这里我们来到自动化这里,通过右上角,然后新建自动化功能,然后我们输入 就是每天学习一个 ai 术语提示词,这里就是每天上午八点给我推送生成一个学习文档,比如 token 是 什么, ai 是 什么? webcoding 是 什么,就是每天八点让它帮我们生成一个学习文档,然后我们再选择一下项目,我们选择 demo, 然后每天八点在这里就是选择模型,我们就选择默认的, 然后下一个就是推理的设置,这里我们也保持默认,然后我们直接创建就可以,这时候就创建成功了,然后我们选择这个自动化任务,就可以看到它的一个运行状态,还有一些详情信息, 这就是关于这个自动化任务创建,也是非常简单的,都是可直观的操作。好到这里就是我们 codex 安装到使用的所有操作,我们本次分享的都是一些基础的使用,我们可以先上手使用,然后其他的再边使用边研究就可以。 在这里还有一个拓展分享,就是如果你使用 codex 是 一些日常的任务,大家可以到设置这里面,然后常规选项这里工作模式就选择 适用于日常工作的模式,像这样它的模型是同样强大的,就是技术细节更少一些。好了,这就是我们本期的所有内容,欢迎留下你的想法,我们下期再见。

当前主流的 ai 编码工具,比如 cloud code cursor, 在 处理大型代码库时,普遍面临同一个结构性问题。为了理解项目架构, ai 需要反复执行搜索、读取再搜索的循环, 先用 graph 定位关键词,找到文件后再逐一读取,如此往复。这个过程的代价是双重的,大量消耗 token 以及频繁的工具调用带来的延迟堆叠。在复杂项目中, ai 很 容易陷入反复横跳,却始终找不到核心调用链的困境。 code graph 针对的正是这个问题,它的核心做法是把静态代码分析和本地剪辑做了深度融合。 具体来说,他利用 tree sitter 在 本地将原代码解析为抽象语法数函数类接口被抽象为图中的节点调用关系继承关系模块导入则被定义为边 整张图存入本地的 sqld 数据库。这样一来, ai 在 需要理解代码结构时,不再需要竹文件盲目扫描,而是通过 m c p 协议向本地数据库发出一次图查询,直接取回所需的符号信息和上下文切片 查询路径从多次探索压缩为单次定向命中。它还有一个值得注意的能力,框架感知。它不止做简单的符号匹配,还能识别主流后端框架的路由映射追踪事件流的触发链路,以及 react 状态更新到渲染的完整路径。 这意味着 ai 可以 做到真正意义上的端到端调用链追踪,而不是停留在单个函数层面的局部理解。 从工程价值角度来看,它带来三个方面的改善, token 消耗降低。因为 ai 获取的是结构化的精确上下文,而不是原始文件内容的大段重复读取, 响应速度加快,因为整个缩影和查询流程完全在本地完成。没有网络依赖,代码隐私得到保障,项目结构不会流转到任何第三方服务。当然,它也有明确的边界。 对于大量依赖反射圆编程或复杂依赖注入的项目,静态分析本身存在天花板无法覆盖运行时的动态行为。在极大规模的遗留代码库中,首次构建图所引的资源占用也需要纳入评估。 这里我用两个相同的 unit 工程做了一个实测,两个相同的项目,我用 clode 终端加 dspv 四进行相同提示词的测试。 最后我们看一下测试效果对比。有趣的是,右边起用了 code graph 并构建本地锁影,总费用不仅没有降,反而从一点一三美元飙升到了一点八七美元, api 耗时也直接翻倍。 这难道说明 code graph 的 本地锁影是个鸡肋吗?恰恰相反,仔细看底层数据,你会发现一个非常高级的反直觉现象, code graph 确实起作用了。右边的提示词缓存命中量高达一点三兆,几乎是左边的两倍, 这说明他成功帮模型精准定位了文件,在输入端疯狂瘦身。但为什么总价高了?答案藏在 oppo token 里。右边的模型输出量整整暴涨了六倍,难道这就是本地所引带来的架构师效应吗? 所以,多花的这零点七四美元,不是缩影的失败,而是我们用极低的输入成本雇佣到了一个思考更深、考虑更全面的 ai 架构师。最后,方案 b 得到的效果也更好,而方案 a 报错无法运行。 总体来看, code graph 提供的是一个工程上相当扎实的解法,用本地语意图网络替代 ai 队代码库的无结构文探索。 如果你正在深度使用 ai 编码工具,或者在基于 m c p 协议构建自己的编码 agent, 这个项目值得在本地实际跑一遍,而不只是停留在概念层面的了解。

我用 codex 写代码后才发现, ai 真正可怕的地方不是它会写几段代码,而是它能把一个模糊想法推进成一个可运行的结果。 以前我用 ai 写代码,基本就是复制报错,问怎么改,或者说一句帮我做个功能,他也能回答,但经常给我一段看起来很完整,放进项目里却对不上的代码。 后来我发现,问题不是 ai 不 够强,而是我一直把它当搜索框用。 codex 真正适合的用法,是把它当成一个能进项目现场的协助程序员。你不要只说帮我写登录功能,而要说先阅读项目里和登录用户路由相关的文件,理解现在的实现方式。 我要新增手机号验证码登录,不影响原来的账号密码登录。先告诉我你准备改哪些文件和原因,再开始修改,最后运行项目或测试检查有没有报错。 这句话的重点不是提示词多高级,而是给了他工作流程,先看现有代码,避免凭空写,再限定修改范围,避免乱动文件,然后小步实现,出现问题,继续定位,最后验证结果能跑起来,才算完成。 很多人觉得 ai 写代码不稳定,其实是因为一上来就让他教成品,却没有让他理解上下文,拆任务、跑验证,也别把任务一次性扔太大。 不要说帮我重构整个项目,先让它解决一个具体问题,比如修一个页面,加一个按钮,接一个接口,改一个报错。 ai 写代码真正可怕的地方,不是替你敲键盘,而是它开始具备了执行闭环,理解、修改、验证,再修正流程。用对了,它就不只是回答你,而是在陪你把事情做完。

codex 是 一个和你一起工作的 ai 编程伙伴,他不只是回答问题,而是能够进入你的项目,读代码,理解结构,然后手动修改。 当你有一个想法, codex 可以 帮你把它拆解成任务,找文件,跑测试,定位错误,写实线,再把结果解释清楚。他擅长处理那些废时,但需要细心工作, 修 bug, 不 测试,整理文档、搭界面、分析日记,甚至生成本地可打开的文件。和普通聊天工具不同, callix 更像坐在一个工作牌旁边,你给目标他观察环境,使用终端和工具,一步步把事情做好。 他也会尊重你的代码和改动,先读取现有的模式,再做小而清晰的修改,不随便颠覆你原有的东西。所以 callix 核心价值不是替你思考,而是放大你的行动力。你负责方向和判断, 他负责把复杂过程变得更快。一句话总结, codex 是 能够理解项目、会使用工具、可以协助交付的 ai 编程工具。

很多人用 codex 做复杂任务时,都会先说一句,你先帮我做个计划。这个习惯当然是对的,但问题是,很多计划最后只留在对话里。一开始, ai 可能会规划得很清楚,第一步做什么,第二步做什么,风险在哪里,测试怎么跑?但等你中间补了几次测试, 测试失败了几轮对话越来越长之后,经常会出现一个问题, ai 好 像又偏离了最初的计划。所以这一期我想聊一个非常实用的思路,别把复杂任务的计划只留在对话里。 对话里的计划本质上还是上下文,上下文很适合保存当前这次交流的信息,但它不一定适合保存一个复杂任务的完整状态,尤其是这些任务。比如一次比较大的重构, 比如跨多个文件的功能开发,比如需要先读代码,再设计方案,再分阶段执行。再比如测试失败后需要反复修复。这时候,计划如果只存在聊天记录里,就很容易出现三个问题, 第一,早期计划被后续对话冲淡。第二,关键发现散落在聊天记录里。第三,如果任务跨绘画继续, ai 不 一定还能完 完整知道之前做到哪一步。所以我越来越觉得,如果计划只留在对话框里,它不是项目资产,它只是临时上下文。复杂任务的计划最好能进项目文件系统,这就是 planning wins files 这个 skill 想解决的问题,它解决的不是 ai 会不会做计划的问题。 cortex 本来就可以, plan 科室也有自己的 计划模式,很多 ai 编程工具也都可以先规划再执行。但普通 plan 最大的问题是,它通常还停留在当前工具、当前绘画、当前上下纹理。而 planning with files 的 思路不一样,它会为一次复 杂的任务在项目组里面生成一组 planning 文件,包括 task plan, confidings, progress。 task plan 用来记录任务目标、阶段拆分 执行计划。 firing plans 用来记录调研过程中的发现,比如关键代码位置、项目结构、分线点和设计判断。 progress 用来记录当前做到哪一步, 哪些已经完成,哪些测试已经通过,还有哪些问题没有解决。所以它不是简单地让 ai 写一个计划,它更像是给这次复杂任务创建一个小型任务工作区。我个人觉得, planning with files 和普通 plan 模式最大的区别就在这里。普通 plan 模式是让 ai 在 这次对话里想清楚, planning with files 是 让项目把这次记录任务记下来, 这意味着什么?假设我今天用 cortex 做了一个重构任务, cortex 生成了这些文件,明 我不想继续用 context 换成 ctrl 或者其他 ai 编程工具。他只要读取这些文件,他就可以知道这次任务的目标是什么,之前做过哪些判断,哪些文件已经读过,哪些代码已经改过,哪些测试已经通过,还有哪些问题没有解决?这点很关键, 因为复杂任务的状态不再被锁在某一个 agent 的 上下文里,而是沉淀到项目文件系统里。当计划进入文件系统,任务状态就不再属于某一个 agent, 而是属于这个项目。 不过这里也要注意,不是所有任务都需要这个 planning with files 这个 skill。 如果只改一个变量名,补一个小函数,做一个简单的功能,那完全没必要,小任务直接做效率更高。 planning with files 这个 skill 更适合快 多个文件的修改,比较大的重构,需要先调研再开发,需要多轮测试和修复,或者是今天可能做不完,后续还要继续,甚至中途换不同 agent 来接手。简单地说就是小任务靠对话,复杂任务靠文件。 实际使用的时候,我因为还装了别的 skill, 我 会明确告诉 codex 我 大概是这么做的, 然后再加上需求,我将是显示地告诉那个 cortex, 我 要调用这个 skill。 它会为呃任务创建 task, plan, findings, progress 这些文件,这组文件就变成这次任务的入口。下次继续做的时候,不管你用 cortex, cursor 还是其他的 ai agent, 都可以先让它 读取这几个文件再继续执行。这和普通 plan 的 模式的区别就很明显了,普通 plan 更像是一次对话里的临时计划, planning with files 更像项目里的任务状态文件所。 所以这一期我想表达的是,复杂任务不要只留在聊天里,要变成项目里面的任务资产。 planning with files 的 价值不只是让 cortex 写计划,更重要的是它把计划发现进度都放到项目文件系统里,这样复杂任务就有一个可恢复,可以追踪,甚至可以被其他 ai agent 继续接手的工作区。不过这也会引出下一个问题,如果我同时安装了 planning with files, superpowers, 甚至还有自己写的 planning skill, cortex 到底应该听谁的?同类 skill 装太多会不会冲突?会不会增加 token 消耗?这个问题我们下期继续聊,这里是 cortex 共创实践,下期我们继续。