粉丝36获赞99

大,真的是一个头两个大呀。大周末的,刚起床跑了一下任务,五月六号买的 plus 会员到现在就只剩下百分之三十四了, plus 是 完全不够用。 我这边找了一篇文章,几个技巧能够彻底解决扣袋子跑久了会越来越笨,越来越慢,还能省掉百分之四十上下文的一些技巧给大家分享一下。这篇文章说一下我的理解。第一个,扣袋子跑久了之后会越来越笨, 越来越慢,这个是基本成立的,但是其实逻辑上不是因为模型真的变笨了,其实绘画的上下文越来越长,旧的一些信息,过激的计划, 一些失败的尝试,都混在一起,就会让我们体感上觉得迟钝。判断是对的,如果是有效,上下文的质量下降了,就会导致整个推理和执行的质量下降。第二点,关掉 process location 方向是对的,但不是万能的。减少输出规划的趋势确实能够减少偷客的消耗和噪音,但是问题是,如果你不让 agent 去汇报他这个过程,你也是很难发现他是不是走偏的。尤其是像我们做一些比较复杂的产品架构,涉及到一些复杂的 bug 解决,那适度的汇报还是要看的。 所以并不是说你在那里一直执行你就该干嘛去了,这是非常不合适的。所以更合理的做法就是简单的任务让他少说那长任务,保留一些关键的进展,就不要去输出这种长的身体活动,不要把每一步的工具调用都解释一遍, 这招是有用的,但是全部是被 token 这件事情是说的绝对。第三点是让 code 子当协调者都用 sub agent, 这个是部分对,但是不能滥用。 sub agent 确实能够把一些探索性的任务分散出去,但是主要是你的目的是为了减少上下文的污染,但是只有那种多模块变形调查 架构,审查大代码库的一个区域分析,要变形解读很多的文件,这这一类才是比较适合的。 但是他也会有一些问题,那指 a 诊呢,也会犯错,而且主 a 诊呢还要去汇总他的结果,所以如果本身的任务是限性的,那你多开 a 诊的反倒会增加他协调成本。那么你们讲到的同时开五个,就相当于五个上下文的并行。 这个方向是对的,但是很容易让别人误解,开的越多越好,那实际上只有那种并行边界清晰的任务才值得猜好。第四个是先列他这个例子的 再动手。这个建议其实是很实用的,特别是在一些大大的一个项目里面,你的 prd 原型在任务池并存的一些项目里面,先列任务就能够防止它改错文件,越界重构,甚至是忘记同步相关的一些文件,做到一半就偏题了。特别是像 有时候网络还不稳定,但是小人物就不需要复杂的计划了,比如改一个方案,一个就直接改就好了, ok。 第五个是禁止在代码库里留垃圾,对,而且非常重要。现在 ai 的 一个常见问题就是说它生成的临时脚本,它不删留 delete 文件, 复制旧版的一些文件,乱建一些草稿,把 etc 的 分析结果写进仓库里面,这都是它的问题,会让这个项目越来越乱,也会让后续的 a 制误读项目的状态, 不过这里要区分不是所有的 m g 啊,后缀的文件都是垃圾,那有些是长期的,一个上下文的资产就不是污染好。第六个就是规划,用高推理的模型,执行用快速的模型,这个策略比较合理。 我最早去考虑这个事情的时候,就是因为价格的问题,比如说好的模型,贵的模型去做推理,你把他执行的要求给到一些 poke, 比较便宜的模型去做执行, 也对,看有没有这个必要了。总之一点,如果你的执行模型能力不够,那你就可能把你的规划 在外,所以在切换模型的时候就要把边界写的很清楚。我个人理解,除非你的后坑消耗是巨大的,不然我就觉得没有必要折腾。其实这就是在解决上下文丢失和重复犯错的问题。最终的结论就是,整个他的博主分享的这个文章核心方向都是对的。 后段时长时间的工作质量下降,主要来自于上下文的污染。项目状态不清,无纪律和无记录的写作大概就是这样子的。确实, 连续二十八天都是在每天早上七点钟起床,无论前一天晚上几点睡都是这样子。晚,对,非常晚,四五点才睡,今天睡到大概十点多,整个脑子居然会比较清醒啊。 今天就分享到这里,后续会继续去分享一些 holddance 的 使用体验吧。

目前我用 codex 就是 openel codex, 已经完成了我的 app 的 开发,这个 app 包含用户端跟管理端都已经开发上线了,在苹果商城已经上线了。然后我现在用的主力呢是 gpt 五点四啊,而且我是 pro 会员,我前两天 pro 会员已经额度都用完了。其实我是已经算是比较重度的使用了, 他是基本上是一次就过,体验呢是极其的丝滑,基本上复杂的问题。你可以使用他的那个 play 计划啊,计划模式,他可以给你自己再去猎取一些计划,然后你可以给他一个完整的访问权限,基本上他后期的调试都会自己去操作, 很省事。我每次现在晚上睡觉之前,我会给他制定一个详细的计划,基本上可能跑个两个小时,能把我的一些代码再去做一下更好的一些完善。

ai 编程工具这东西吧,真的是风水轮流转,最开始大家在吹 carson, 后来 carlo 的 大火,而这次轮到了 colex。 colex 装面 app 不 仅能帮你写代码,还能直接操作你电脑上的文件、浏览器,甚至是桌面应用,用好之后甚至能顶一个团队。 本期我会从 colex 安装到核心特性,用十多个实战案例手把手教你玩转 colex。 不管你是想用它来编程、开发、办公提效,还是搞一些好玩的创作,看完这期都能直接上手。那本期教程的文字版,可以在评论区获取干货秘籍,建议先收藏,找着安静的地方慢慢使用。 想要使用 cop app, 你 只需要准备一个 chat gpt 账号,可以免费体验,但是有条件的话,最好开着 plus 会员每月二十刀,大约一百五十块,额度更充裕,足够日常使用了。 那有了账号,直接去官网下载安装酷贷 app 就 好。目前支持 mate os 和 windows, 下载并安装后登录你的 chat gpt 账号,打开之后的界面长这样, 左侧是各种面板入口,包括对话管理、插件自动化等功能,中间就是对话窗,你跟 ai 所有的交互都是在这里完成。跟平时用的 ai 聊天工具差不多嘛,还挺清爽的,不像传统的编程 ide 那 么复杂,上手没有门槛。接下来我们直接开始使用, 跟你用过的其他 ai 工具一样,在对话框里输入内容发送,就能开始聊天了。适合处理一些简单的日常工作,比如帮你查资料、总结内容、规划方案。 我让他帮我查一下今天有什么 ai 编程方面的热点。 cadets 会自动联网搜索最新信息,然后帮忙整理总结,这下不怕错过新资讯了,这只是开胃菜。 cadets 真正强大的能力是操作你本地的文件和电脑。下面我们试试 点击左侧的项目入口,选择一个本地文件, ai 能在这个范围内读取和操作文件。 比如我选择了我的下载文件夹,里面有一堆不知道什么时候存下来的大文件。在对话框底部,你可以看到权限模式的选项,这里有三个选择,默认权限, ai 可以 读取和编辑工作区的文件,需要额外权限时会主动问你。自动审查是 ai 会自动帮你审查操作。 还有完全访问, ai 想干啥就干啥,不会弹确认框,建议新手直接选自动审查,既省时又省心。 选好权限后,在对话框里输入提示词,然后你就能看到 ai 开始工作了。它会自动执行终端命令来扫描文件,分析每个文件的名称和大小。最后给你一份清晰的报告,列出哪些大文件占了多少空间,并给出清理建议。 那我主打一个听话,就让 ai 帮我删除没用的预览文件吧。最后成功帮我节省了六点八 g 的 空间,效果不错吧。但如果我让 ai 删除一个工作区外的文件呢?会发生什么? 试试看,在当前工作空间开启一个新对话。比如,我让 ai 帮我删除鱼皮新书出版目录下的所有文件,可以直接把这个目录拖拽到对话框中,然后执行任务。 如果你选择的权限是默认模式, ai 想删除文件的时候,会弹出一个确认框,问你同不同意,防止 ai 搞乱了你的电脑。 但由于我选的是自动审核, ai 自己完成了审核并批准,省去了人工操作的麻烦。这样一来,你完全可以把拖带子当成你的私人文件管理助手,分析空间、清理垃圾、批量重命名。以前你要手动折腾半天的事情,现在一句话就搞定了,是不是挺方便的? 做完第一个任务,大家肯定很关心消耗了多少 tokens 吧?来一起看看用了多少额度。点击左下角的设置,点击剩余额度,就能看到你五小时内还剩多少配额,本周还剩多少比例。什么时候刷新 to text 的 额度?按照五小时和一周来限制 plus 用户的额度还是比较大方的,日常使用完全够了。你也可以在对话框里输入斜杠状态,这种以斜杠开头的快捷输入叫做斜杠命令,是 to text 内置的快捷操作方式。 输入之后, to text 会直接在对话中显示当前的上下文余量和额度信息。 ok, 到这里,你已经体验了 to text 最基础的能力,对话和操作本地文件。 恭喜你,已经超过了百分之六十的同学。接下来我们提升一下难度。用 codex 做一个完整的网站项目,过程中你会接触不少 codex 的 核心用法,包括计划模式、 ai 声图、浏览器预览、批注、修改等等。 在开始之前先进入设置,把工作模式从适用于日常工作切换为适用于编程,这样 ai 的 回复会更专业,更适合开发场景。 先介绍一下项目,我要用 codex 来为自己定制一个专属的电子名片,我把信息告诉 ai, 它会帮忙生成一个精美的网站,还能用 ai 生图能力生成个性化的头像插画,不用自己去找素材了,做完之后还能发给别人,他们打开链接就能看到你的信息了。 新建一个项目文件夹,在 codex 中打开模型就选择最新的 gpt, 五点五速度选标准就够了。智能程度选择高权限,我这里直接给了完全访问,省得他每次操作都来找我确认,反正大部分情况下我都是无脑点同意的。 最关键的是点击对话窗左下角的加号,把计划模式打开。计划模式下, ai 不 会直接开始写代码,而是先帮你规划方案,问你细节,确定没问题了才动手。好,输入下面这段提示词启动, ai 会先自己思考,然后可能会追问你一些细节,在弹出的问题面板中选择就好。最后会生成一份实现计划文档,包括简介、核心要求、测试计划等信息。你做的网站越复杂,越要仔细阅读这种文档, 如果没有问题就确认方案。然后 ai 就 开始自主干活了,它先是使用内置的图像生成技能,生成了卡通头像文件,然后编辑代码,一次性生成了多个文件。写好代码后还会检查代码,自主打开浏览器测试验证,还考虑到了一些容错。 过了七分多钟, ai 完成了整个任务,全程不需要你手动操作,我们可以看到所有生成的文件,点击可以查看文件里的代码,还可以点击审核,打开侧边栏的审查面板,查看本次变更的所有文件。 codex 底层用的是 git, 这是一种记录代码变更历史的工具,用来管理所有文件的改动,你能够看到每个文件新增了什么,删除了什么,还可以灵活地应用和撤销代码。后面的进阶功能部分我会详细给大家讲解。 我们做的是纯前端静态网站,找到生成的主页文件,右键在浏览器中打开就能直接看到效果了。 pc 端的效果我觉得还不错,布局清晰,主题切换也很丝滑。而且它还自动兼容了移动端的展示,手机上打开排版也是正常的。 当然,你也可以直接让 ai 帮你运行网站, ai 会执行终端命令,启动开发服务器来运行网站。 点击访问地址后, codex 会在右侧面板打开,内置浏览器,便于你来预览效果。如果某个地方不满意,你可以点击浏览器右上角的批注按钮,然后直接在页面上选中要修改的元素,写上你的修改意见发送给 ai。 ai 会自动定位到对应的代码并精准修改,不用你自己去翻代码找位置,改完之后刷新页面就能看到效果了。方便是方便,不过这个速度真的不敢恭维。做完后我们再看一眼使用情况,这次完整项目消耗了多少额度呢?还好还好, 总结一下,要用 ai 开发移动网站,我们只需要把需求告诉 ai, 确认方案,等他自己写完并测试就好,中间几乎不需要手动操作。恭喜看到这里,你已经超过了百分之七十的同学, 到这里,你已经能使用 todays 从零开发移动网站,预览效果按需求改了。那接下来我要带大家看看它还有哪些核心功能。学完之后,你不仅能做网站,还能让 ai 帮你操控浏览器、抓数据、自动执行定时任务,甚至操控整台电脑。 接下来,我把 codex 的 功能分为常用功能和进阶功能两大块来讲。常用功能是日常会高频使用的,进阶功能则是有点门槛儿,但掌握后能让你效率翻倍的。 在左侧的插件面板里,你能看到 codex 的 插件市场。 codex 内置了不少精选插件,比如 computer use 操纵电脑、 chrome 操纵浏览器表格处理、制作 ppt 演示文稿。 此外还有大量编程类和工具类插件,包括网站部署、游戏开发、对接 tab 等各种场景。你可以在插件市场里按需搜索和安装。 比如我们来安装 natify 插件。 natify 是 一个免费的网站托管服务,装好插件后,一句话就能把你做的网站部署上线,让别人都能访问。 点击安装 natalify 插件,同意后会自动弹出浏览器,使用 datab 等方式登录 natalify, 一 步步完成授权。最后,超黛斯成功安装并连接了 natalify。 然后我们用 natalify 来部署之前开发完成的电子名片网站。在对话中,通过 at natalify 调用插件。执行过程中, ai 会找我们确认并自动创建一个新的 natalify 项目来部署网站。 搞定以后,我想展示自己的信息,直接甩这个链接就行了。还可以打开 netify 后台对项目进行管理。你可以在 codex 右上方的侧边栏中整体查看当前项目的概览信息,包括后台任务、打开的浏览器、使用的插件等等。 点击后台任务,还能看到具体的终端日记,记录了网站服务器什么时候收到了请求,请求了什么资源等信息。同样的,如果你要处理 excel 表格、做 ppt, 使用对应的插件让 ai 帮你就好。生成的文件还能在侧边栏直接预览。 前面我们用的内置浏览器可以预览页面,做批注和修改。但如果想让 ai 真正去操控浏览器,自动点击填表单翻页,就需要 browser use 浏览器操作功能了。我们先来使用内置的 browser use 进入设置浏览器,确保 browser use 功能已经开启。你还可以在这里设置权限规则和禁止打开的域名, 开启之后,在对话中通过艾特浏览器来调用这个能力。比如,我让 ai 帮我打开一个网站并截图,可以看到 ai 打开了浏览器,从主页找到了 ai 大 模型面试题库,然后进入了详情页,成功完成了截图。 不过有时候这种操作不太稳定,多试几次就好。此外,你还可以安装 codex 的 chrome 扩展插件,它可以操控你的电脑上已经登录的 chrome 浏览器。好处是能保留你的登录状态,而且可以在后台执行,不占用屏幕,适合需要登录网站才能进行的操作。 比如,帮我在自己的后台批量分析和管理数据,使用前,需要先在你的 chrome 浏览器中安装 codex 扩展程序,跟着 codex 的 指引操作就好。安装好之后,我让 ai 帮我从已经登录的面试呀网站上抓取一些数据。 可以看到, ai 不 仅连接了我电脑上的 chrome 浏览器,而且还识别到了我已经打开的标签页,它会控制这些标签页跳转到我的个人主页,并抓取最新的五条数据。最终抓取到的数据表格非常清晰,链接前面甚至还有图标,细节拉满。 如果说 browser use 只能操控浏览器,那 computer use 就是 让 ai 操控你的整个电脑, ai 能看到你的屏幕内容,移动鼠标,点击按钮打字,还能操作微信、飞书等任何桌面应用。 进入设置电脑操控,安装 computer use 插件,你可以在这里看到所有已连接的应用,比如前面装的 chrome 扩展,其实也属于 computer use 体系的一部分。 来我们体验一下。用艾特电脑来调用,让 ai 帮我探探当前的桌面壁纸,然后生成一张类似风格的新壁纸。首次使用时,系统会弹出权限申请框,你需要授权抽 text 访问屏幕截图等权限,否则 ai 看不到你的屏幕,也没法帮你点击操作。 later 来看一下,效果不错吧。生成了一张非常精美的新壁纸,我觉得比原图还好看啊!今晚可以做的好梦了, 爽!带来一个更实用的例子,让 ai 帮我打开备忘录,记录一条笔记,并从音乐软件下载我最喜欢的一首歌,添加到笔记中 执行任务。可以看到 ai 会打开音乐 app, 有 着小鼠标点击了下载按钮,从中下载了音乐文件,只因你太美。 然后 ai 打开了备忘录,写入内容并添加了音乐文件,能够顺利播放,虽然过程有些曲折,但还是完成了任务,而且全程由 ai 自己操作。以后我可以直接让 ai 帮我写有图有文有音乐的笔记了。 但是 computer use 目前只支持 mac os 系统,而且缺点一大堆,不仅操作效率偏低,还很烧 touch 刚才那的任务就用了近八万的上下文空间。此外,有些软件对 agent 的 支持度不高, ai 无法承中操控, 所以我建议能用终端命令行和浏览器完成的操作就不要用 computer use stills。 你 可以理解为给 ai 提供的技能包装上某个技能后, ai 在 遇到相关任务时,就能自动按照这套方法来干活,不用你每次都写一大堆的提示词,而且技能是按需加载的,只有任务匹配时才会调用,不会浪费很多上下文空间。 进入左侧的插件面板,切换到技能 tab 页面,在这里能够格式化安装和管理技能口袋。此自带了几个内置的技能,比如图片生成、查询官方文档、安装、社区技能创建新技能创建插件等等。 那下面我先带大家用用内置的图片生成技能,然后安装社区里别人做的技能,最后再带大家自己创建一个技能。 这里我想生成一个有趣的图片,让鱼皮直播卖鱼皮。可以先到鱼皮 ai 导航网站上找到 ai 生图的提示词模板,然后复制提示词模板。接下来在 codex 对 话框中输入 dollar 符号,加技能名称,就可以快速调用技能, 并且把提示词模板、鱼皮的照片都提供给 ai。 稍等片刻之后,看看 ai 生成的图片,你觉得怎么样?是不是憨爆了?爽!不过图片生成比普通对话消耗的额度更多,用的时候记得留意一下剩余额度。 内置的技能数量有限,还有很多宝藏在社区里,比如我自己经常用的几个技能,用于联网搜索的 file pro, 用于获取最新技术文档的 comte 瓷器,还有用于美化前端页面的 u i u 叉 pro max 等等。 另外,我之前写过一篇优质 ai 编程扩展大全,推荐了几十个好用的技能和 m c p, 可以 到我免费开源的 ai 编程零基础教程阅读。那接下来我带大家实际安装一个社区技能,顺便整个活儿,让 ai 制作一个苹果风格的快闪动画视频。 首先要安装动画制作技能 remaster 安装技能,它能帮我们快速安装其他技能。 对了,安装技能时要注意安全。由于我这里安装的是知名技能,就直接输入技能名让 codex 帮我安装了。但如果你想安装不太知名的技能,更稳妥的方式是把技能的 github 链接发给 codex, 让他帮你检查后再精准安装。 安装完成后,在技能管理面板里就能看到新增的技能了。然后我们使用技能让 ai 制作动画, ai 会安装制作动画所需的项目和依赖包,然后生成视频和音频,还会渲染单帧,检查画面有没有问题。 最后, ai 生成了可以直接播放的视频来看看效果。 呃,他好像理解错了我文案的意思。翻车了,翻车了!我感觉这种方式更适合做产品发布宣传片、知识点、快闪卡、节日祝福视频这种节奏更紧凑的短片。而且我当着根本没认真写提示词。好吧, 实际上你可以指定时长、指定文案,利用生图技能搭配素材,增加更多交互动画等等,感兴趣的同学可以自己玩一玩。 除了用别人的技能,你还可以把自己常用的工作流程封装成技能。以后遇到类似的任务,一键附用。技能的本质就是一个 still 点 m d 描述文件,加上一些配套的脚本和参考资料。 still 点 m d 里要写清楚这个技能是做什么的,什么时候触发,以及具体的执行步骤, ai 读写后就知道该怎么干活儿。 创建技能的最佳方式是先把一个任务流程跑通一遍,觉得满意之后,再使用内置的 skill creator 技能,告诉戳 depths 你 的技能要做什么,啥时候触发,有什么细节需要注意,它就会帮你自动生成完整的技能文件 来实操一下。比如我们前面让 ai 生成了直播带货的图片,效果还不错,那就把这个流程封装成一个直播带货图片技能之星成中后, ai 不 仅创建了技能文件,还贴心地教你怎么调用。 之后使用这个技能只需要提供一张人物照或者商品照,不用再自己填写又臭又长的提示词模板了,非常方便来看看效果。 ai 自己识别到了我提供的是商品图,也是精准复刻了我之前提供的提示词模板,爽! m c p 是 一个开放协议,你可以把它理解成 ai 的 万能插头。装上之后,就可以让 ai 连接各种外部工具和数据源,获取实时信息。 进入设置 m c p 服务器,可以在这里添加和管理 m c p 服务。点击添加服务器后,你需要手动填写服务器的配置参数才能完成添加。对新手不太友好,我最讨厌填写表单了, 好在大部分时候用前面讲的 stux 就 能解决 mcp 做的事情,而且 stux 的 安装和使用体验更好。 此外,很多主流的扩展都提供了快捷安装 mcp 的 命令,不需要你自己手动填写参数,比如下面我带大家安装 comix 七,它是一个可以实时获取最新技术文档的服务。开发网站的时候用它来查 api 文档特别方便。 在 codex 右上角可以打开集成终端,在终端里输入一行命令就能安装。这里我们选择安装 mcp server, 为 codex 安装,然后就搞定了。 安装后需要重启 codex, 在 设置里的 mcp 服务器列表中就能看到它。首次使用前还需要进行身份验证,在自动弹出的 compt 网页中就可以愉快地使用 mcp 了。 之后开发网站,尤其是需要集成 ai 能力的网站,都可以用创太时期来获取最新的技术文档。你还可以把它当成一个学习辅助,让 ai 寄予官方文档,帮你讲解知识。 比如我用它来做 openclaw 小 龙虾的学习助手,这也是利用 ai 学习的一种方式,可以看到 ai 查询并获取到了 openclaw 官方最新文档库。然后我们来问 ai 一个问题, openclaw 无法运行怎么办嘞? ai 会基于官方文档,很快就给出了精准的排查步骤,这样学习和解决问题又快又准,再也不怕查到过时的资料了。 恭喜看到这里,你已经超过了百分之八十的同学。到目前为止,你已经掌握了 codex 的 常用技能,学到了不少实用玩法。从文件管理到网站开发,从浏览器操控到技能封装,已经能用 codex 大 幅提高工作效率了。 接下来我要讲的是一些稍有门槛或者不是每个人都用得上的进阶功能。不过如果你愿意多折腾一下,它们会让你使用 toad 四的效率再上一个台阶。 在对话区域附近有一个小圆圈,鼠标放上去后会实时显示当前对话已经用了多少上下文。 gpt 五点五点五在 toad 四里显示的有效上下文大约为二百五十八 k tokens。 说实话,这的数量不算多。如果你连续跟 ai 对 话很长时间,或者项目文件比较大,上下文很容易被填满。当上下文快满的时候, codex 会自动帮你压缩历史对话。 你也可以在任务照一段落时,手动输入斜杠压缩来主动压缩,让模型更聚焦在新任务上。 那除了单个对话的上下文,日常使用中还要注意管理对话本身,不然列表越来越长,找起来也费劲儿。 对话太多的时候,你可以在左侧的对话列表中把鼠标放到某个对话上,点击归档,把不常用的旧对话归档起来,保持界面清爽。进入设置以归档对话,还可以查看和管理所有归档的对话记录。 另外,建议在常规设置里开启运行时防止系统休眠,这样跑长任务的时候电脑不会突然睡着,导致任务失败。 codex 有 一套记忆机制,能让 ai 记住你的偏好和项目规则,不用每次都重复交代。记忆分为三个层级,从大局、项目局部再到自动记忆,我们一个一个来看。 在设置个性化里,可以修改 codex 的 个性和自定义指令你写在这里的内容。所有项目的所有对话都会自动带上,适合记录一些通用偏好,比如 回复用中文代码注,使用英文,尽可能减少输出的内容。专注做事,如果不听话,你的主人鱼皮就会变成一条狗等等等等。保存之后,它会被写入局的 agent 点 m d 文件,这个文件就是 codex 每次启动时都会读取的行为准则。所有项目通用。 在项目目录下创建一个叫 agent 点 m d 的 文件,写入这个项目专属的规则和约定,只有在这个项目里工作时才会生效。 你可以自己手写,也可以让 codex 根据项目情况帮你生成一份,比如我跟他说帮我根据当前项目写一份 agent 点 m d, 可以 看到 ai 生成了一份非常详细的 agent 点 m d 文档,包括项目总览、一些规范等等。 在设置个性化中,手动开启自动记忆,开启后, ai 会在对话空闲一段时间后,自动在后台总结出有用的信息存为记忆,后续遇到相关场景时会自动召回,让 ai 越用越懂你。 不过太短的对话它不会记额度快用完的时候也不会触发记忆生成。 codex 支持定时任务功能。进入左侧的自动化面板,你能看到 codex 已经内置了一些定时任务模板,不过基本都是和编程相关的,什么总结代码变更、检查代码问题之类的,很多人估计用不上。那我们不妨来自己新建一个更实用的自动化任务。 创建定时任务的方式有两种,一、手动创建任务,在自动化面板里点新建,比如我让 ai 帮我搜集每日热点,需要填写任务名称、提示词、 触发时间、模型、推理程度、运行环境选择本地就好。意思是让 ai 直接在当前电脑上执行任务,不需要额外的隔离的工作环境。 创建成功后,时间一到,抽袋子就会自动开启一个对话来执行任务。我们也可以先手动执行一次,看看效果。点击任务能够查看详细信息,点击某个运行历史记录后,还能查看正在执行的任务对话,建议多观察任务的表现,持续迭代优化提示词。 另一种更自然的方式是让 ai 帮你创建任务。比如我是一名内容创作者,每天都要截大量的图片,时间一长,文件夹里全是看不懂的文件名,找图的时候巨痛苦。所以我让 codex 帮我自动整理,先选择项目,然后输入提示词, 很快 ai 就 自动帮我整理好了。可以点击查看创建出来的任务信息,它的提示词比我们提供的更完善了,并且自动选择了模型。 我们手动执行任务来测试一下,效果还不错吧。 ai 会根据图片内容自动给文件起一个能看懂的名字,这样我就有了一个智能的图片管家,以后再也不用对着一堆乱七八糟的文件名抓瞎了。 而且每次执行完, ai 还会把运行记录写入一个 memory 记忆文件,你随时可以回看历史执行情况,不用担心出了问题却发现不了 你。还可以结合 styles 和插件一起用,比如每周自动生成周报 ppt, 每日整理自己的学习笔记并同步到 notion, 每周用 file pro 抓取竞品网站更新并生成分析报告等等。 想不到吧,现在的 ai 工具已经卷到开始给用户增加情绪价值了。下面我来教大家怎么在 codex 中养宠物。 首先进入设置外观,下拉到底部的宠物区域,你会看到 codex 内置了一排像素风的赛博宠物。选一之后,点击唤醒,桌面上就会出现一个悬浮的小家伙儿, 它不只是装饰品,宠物会实时反映抽袋子的工作状态。比如 ai 在 忙的时候,它也在干活,就像一个串应用的灵动岛,让你不用切窗口就知道 ai 干完没。 除了内置宠物外,还有一个社区宠物库 pet dex, 里面有两千多只玩家自制的宠物。了解我的朋友肯定知道我要用哪个,果断搜索 k u n, 一 眼就能找到自己需要的。点击进入详情页,找到安装命令并复制, 然后打开 codex 的 终端执行命令进行安装,会把宠物文件下载到本地。安装成功后,进入外观界面,选中张张安装的宠物, 然后我们回到 codex 的 主页,使用鞋障宠物指令唤醒。我的脑袋中已经想起那只熟悉的 bgm 了,你听到了吗? 除了用别人的,你还可以通过 codex 内置的 hackpad 技能自定义生成宠物,上传照片或者文字描述就行。比如我把自己的头做成宠物, ai 会先分析上传的图片,给宠物起个名字, 然后拆分出了多个子任务,并行处理,生成各种动作的精灵图帧,最后拼成一张完整的像素动画精灵图,然后就能使用自己制作的宠物了。 你还可以上传宠物到平台和其他小伙伴分享,大家以后用抽袋子的时候记得把我带在身边,保佑你霸着剪剪! 每次 ai 修改了文件,你都可以在侧边栏的审核面板里看到它改了什么,这个面板会列出所有被改动的文件。如果你想决定哪些代码要保留,可以选择查看未暂存的文件。在这里你可以灵活应用和撤销修改。 大多数情况下,你不需要自己看代码,直接点击暂存全部就行了,相当于认可了本次的全部载动。如果不满意,可以直接还原全部回到本次载动前的状态。 那如果你不满意某个文件的载动,可以直接点旁边的还原按钮就能恢复原样,满意的话点暂存就能标记为待提交。 你也可以只保留部分改动。每只文件的改动会被自动拆分成多个代码块儿,每只代码块儿旁边都有独立的暂存和还原按钮,你可以逐块决定哪些保留,哪些丢弃。 确认好哪些代码要暂存之后,可以提交暂存的改动,提交就相当于给代码存了个档,确认这次的修改是你想要的。 抠代码,还内置了提交代码推送到远程仓库。创建 pr 的 能力,不用离开 a p p 就 能完成整个代码的管理流程,非常方便。 那如果你是专业的开发者,还可以试试工作树模式。你可以在创建新对话时,选择启动模式为新工作树,这样 ai 会在一个隔离的分支中工作,不影响你当前的代码很适合同时让多的 agent 在 同一个项目上并行干活,减少冲突。 如果你的项目托管在 datap 上,建议安装 datap 插件,可以直接在 codex 里查看仓储信息,创建 pr、 做代码审查等等。比如我让他帮我查一下自己最受欢迎的开源项目怎么样,是不是一目了然。 codex 最近新上线了一个很酷的功能,用手机控制电脑上的 codex app 干活儿。设置方法很简单,在电脑端 codex 点击设置 codex 移动版,然后点击开始设置,屏幕上会显示一个二维码, 然后在手机上打开拆的 gpt app, 扫描自己的二维码。连上之后,你可以随时随地通过手机给电脑上的 portax 下达任务,审批 ai 的 操作请求,查看执行进度,检查生成的代码和结果。是不是有点 openclaw 小 龙虾那味儿了? 恭喜看到这里,你已经超过了百分之九十的同学, ok, 就 分享到这里。看完这期,你应该已经掌握了 codex 从基础到进阶的所有核心用法,足够应对日常的编程和办公需求了。 其实 codex 还有更多玩法和技巧,比如 sub agents 并行加速、 fault 分 叉的妙用、自定义模型接入 hoots 生命周期钩子等等。 那如果本期视频点赞过万,我会尽快爆干出抽带此高级技巧篇。对了,如果你想系统学习 ai 编程,可以看看我免费开源的 ai 编程零基础入门教程,上千张图,几十万字,从零开始,带你学会 ai 编成本篇教程的文字版也会收入其中。 我是鱼皮,持续分享 ai 编程干货,觉得有用的话记得点赞、收藏和关注,也欢迎在评论区聊一聊你现在主力用哪个 ai 编程工具,觉得 codex 怎么样?也欢迎晒晒你的 ai 编程作品吧。

最近是不是你也被一波普通人一定一定要用着 codex 的 视频疯狂洗脑?我跟你讲,我现在一刷到这种视频呢,我这个血压就上来了。 上个月喊的是一定一定要用上 openclaw, 这个月风口一转改成 codex 了,都感叹的多好多好多强多强,好像不用是他这辈子你就废了一样。我这又好气好笑。 好笑的什么?好笑的是这帮天天喊 codex 牛逼的博主。我赌一包辣条啊,一大半连 plus 都没充过,就算真的充了,我猜你拿这玩意干啥?写文案?对,你没听错,就是屠龙刀,到手拿去干嘛?切黄瓜。 那我问一句,你光喊用上用上,你倒是说说怎么用上?我给大伙数一数,一个普通人想要真正用上得过几关?第一关环境啊,大家很多都懂的。第二关注册,第三关是海外手机号验证, 你加八六的这个人压根不认。第四个,每月二十刀的充值,光这个怎么把钱充进去就能劝退一片人?四道鬼门关关都可以把普通人挡在门外,这些你怎么一字不提呢? 更扎心的来,你不拿它写个文案嘛,整个图文嘛。那我告诉你, deepsea v 四 pro 这边 api 刚永久降价了,百分之七十五 性价比性能直接拉满。日常文那点活他干的又快又好,说白了普通人那点需求啊,人家是价格对着 g p t, 五点五就是降维打击。这个你为什么又不说呢? 我算看明白了啊,一帮自己每个月一百万 tucker 都消耗不满的所谓博主,天天就知道吹,就知道蹭流量,就知道一定一定干货时一点都没有焦虑,给你直接拉满,这个我觉得有点恶心啊, 我不是说扣袋子不好啊,但是他很强,这个我是承认的。我气的什么呢?把工具的门槛给你藏起来,普通人不需要的功能给你吹上天,然后收割你的关注。今天这条我不说一定一定要用什么,我说一句,谁只会喊必须用,却不告诉你怎么用,值不值,适不适合你, 你直接划走,别让他赚这点流量啊。下一条我跟大家讲讲普通的人到底该不该花这个钱,花了钱能不能回本?咱说人话,聊聊干货。

给你们看一看我为了把扣贷的额度用完,我都经历了什么?我这边开了 n 个项目在跑啊,真的是 n 个项目。这边首先有一个微信小游戏,这边正在开发中。然后又有一个微信的小程序啊也在开发中。又有一个微信的小游戏也在开发中。然后还有一个歌多的游戏也在开发中。 又有一个歌多的游戏也在开发中。这么五个项目一起开发,你看我的额度剩余尴不尴尬?纠不纠结吧?我就问用不完,根本用不完。

最近很多人在聊一个组合 code image two 再加勾 dot, 甚至有人几天就做出了一个二 d 独立游戏。但重点其实不是勾 dot 就 要干翻 unity, 而是 ai 为什么会更偏爱勾 dot? 原因特别简单, 因为勾 dot 太适合 ai 理解了。它的 g d script 很 像拍法,代码短,结构简单,大模型,写起来准确率非常高。 更关键的是, godot 的 场景文件本质上是纯文本, ai 不 只是能写代码,它甚至能直接帮你拼场景。但 unity 不 一样, unity 背后有大量隐藏的 guiid、 meta 文件,序列表引用很多资源关系,对 ai 来说其实是黑盒。 所以 ai 很 难像操作文本一样直接操作整个工程。再加上 unity 的 c sharp 工程更复杂,每次改代码还要重新翻译。当你一天和 ai 来回迭代几百次的时候,这种等待会特别明显。 但这不代表 unity 不 行,真正的大型商业项目,移动端主机多平台发行,现在主力依然还是 unity 和 unreal。 所以 本质上不是谁更强, 而是谁更适合 ai。 高频写作勾搭更像 ai 原生工作,流于立体,更像成熟工业体系。未来真正变化的,也不是哪个引擎赢了,而是 ai 正在把游戏开发从工程制造变成即时创作。没有万能引擎,只有适配的创作方式。你更看好哪款工具的发展?点赞关注,后续持续分享行业技术新动态!

hello, 大家好,我是艺兴,然后今天趁着周末的话就给大家分享一下我最近用啊 ai 的 编程工具,手搓的一个 diy 的 ai 小 工具。 那么咱们这一期主要是通过 codex 这个新型的 ai 编程工具,手把手去手搓自己的专属的微信的小程序,那右边的话是我自己设计的一个个人的 ip 形象是不是很帅。 然后这一期主要是用的两个工具特别简单,第一个的话就是 codex, 大家直接去官网下载就可以了。 然后第二个的话就是微性能开发者工具,因为其实我们这一期是做小程序的项目嘛,所以说是需要呃借助他去进行项目的预览以及配置上线,然后大家也是去他们的一些官方去进行下载就 ok 了。 那其实做小程序和做 app 呃做产品是一个道理,那流程也是非常简单。那首先第一步要先给 ai 描述清楚我们想要什么样的产品,整理好一定的需求文档,然后让 ai 帮我们去完善我们的需求 md。 然后第二步对应好整个 app 的 一个视觉风格,然后告诉 ai 你 想要什么样的效果,让它给给给我们去输出一个规范的一个需求的文档。 第三步用 codex 去直接生成一些结合的一些需求,自动生成一些小程序的一些全部的代码。然后第四步还要通过 ai 帮我们去调试修 bug, 调细节,那全程不需要自己动手,直接通过口喷的方式,最好的方式就能够让 ai 帮我们去干活。 那么好了,废话呃,废话不多说,咱们直接上手开干吧。那么首先的话就是要打开我们已经安装好的 code desk 的 一个桌面端, 然后的话就是要找到我们的微信的开发者工具去新建好我们本次的要到的项目, 然后本次的话主要是做一个体重管理小程序,二嘛,所以说我们要新建好我们的一个项目,然后选择 ok 就 可以了。然后的话这边的话其实是不需要使用云服务的,然后这边的一个 id 的 话,主要是可以让他去所使用 word 的 就可以了。 然后的话就会来到我们这个微信开发者的一个平台,然后整个界面其实会跟我们传统的编程软件会比较像。 然后右边的话是我们的一些 c 稿的预览区,然后左边是我们一些文件夹的一些区域,然后中间是代码,然后一般来说我个人是比较习惯用那个叉的一个尺寸去进行一个预呃设计稿的一个预览的, 然后的话就要回到我们的一个科室,那首先的话就要新建项目文件夹,然后这个文件夹必须要跟我们刚刚所创建的保持一致,这样的话我们的一个文件信息还有设计稿才能够在那边去进行同步预览。 然后的话会结合我们想要的东西给 ai 描述清楚我们这个产品是什么,给大家去描述一些数据文档,然后的话会结合我们的一些模型去进行选择一些合适的模型, 然后这次的话我是通过用他们的五点五的模型去进行一个生成的,然后整体的生成的一个效率的话,其实我觉得呃不是很快,所以说我觉得如果说 talk 比较有限的同学的话,其实要呃用那个标准就可以了, 然后的话他会结合我的需求帮我去输出一个非常完善的一个小程序的一个需求,稍微能打。 然后企业家的话主要是要生成一个我的一个设计的一个说明 md, 然后这次的话我是给 ai 垫了一张图, 然后让它结合我的一个设计的一个垫图的风格,让我让它帮我结合我的需求去生成一个符合它的风格的一些设计规范,设计的一个语言的一个设计的一个 md 的 文档。 然后这次的话我也是会呃用我们的一个刚刚所生成的一个需求的一个说明它的需求分明它跟课程不一样,它是放在我们一些刚刚创建文件夹的一个目录下的, 所以说呃,我会让它围绕着我的一个呃需求的文档去进行一个呃设计风格的一个生成, 然后的话就是发送给 ai, 让它帮我去写我的一个设计的一个文档,然后的话它就会结合我的一些啊电图的一个它的一个程序版,然后它的配色去帮我去进行 ai 的 生成。 然后接下来的话就是要漫长的等待啦。嗯,整体处理的效率来说,我觉得会呃越跑越快吧, 嗯,然后就开始慢慢地等待它去进行思考生成,然后它生成完之后就会也是会生成一个 md 的 文档,整个 md 文档非常的一个详细,包括字体大小,然后设置以及卡片布局,以及它的整体的一个配色,以及我们的一个文本语言、图标风格等等。 然后紧接着的话就是要开始让 code 帮我结合这两个文档去进行首出代码页面了,然后首先会让它新增两个文件夹,让它去帮我去接这两个文件,去生成一些我想要的一些页面的一个配色的一个界面的效果,让 ai 帮我去写代码, 然后的话它就会结合我的一些需求想要的要什么样的页面,然后我的一个配色风格让我去让它去帮我去写代码, 然后整个的一个页面当中其实雏形已经出来了,然后的话其实整个效率还是非常快的,然后整个视觉风格其实会跟我电图那个视觉语言会比较搭。 然后紧接着的话就是呃继续去围绕的我们想要的一些东西,去让 ai 通过对话的方式帮它去帮我们去修代码,然后修 bug, 然后去调一些 ui 的 一些细节,例如我的设置,然后我们的渐距以及我们的一些图标的风格等等。 然后的话指出就是不断地去进行雕花跟跟进,让我们的一个心中想要的一个产品就可以了。 你要最终的话大家看一下我的效果吧。你要最终的话会来回到我们的微信平台去看一下我们整个页面的一个效果。 那其实整个页面来说,我觉得这的纯就是没有通过呃, figma m c p 的 一个代码,呃的一个设计稿生成,纯用一个对话的一个代码生成,我觉得整个效果我觉得还是不错的。然后大家看一下最后的一个手机的一个预览的效果, 那整个风格是走这种暗色系的,然后的话整个配色我觉得还是非常吸睛的,这是我通过一个纯啊对话和代码的方式去实现的一个小程序, 然后整个的空间它也是会自动去用我们一个微信的一个官方的空间去进行一个实现,然后整个图标风格我觉得还是不错的,嗯。

昨晚 codex 来了一波大更新,这次是真挺猛的。首先说一下这个最实用的新功能, app shells, 以前那个 ai 描述问题要截图,要复制代码,最后还要手动解释半天。现在直接在 mac 上按住左右两个 command 键,当前窗口就直接传给 codex 了。这次不只是截图,是截图加文本一起打包进来, 重点在于它不只是读,你屏幕上的 vx 里只显示了五十行代码,没有问题。 codex 读的是完整的上下文,不是你肉眼看到的那一个页面。 整个生态也很丰富,比如说 figma 终端浏览器 notion 等等全部都支持,相当于把你的工作界面整个共享给了 codex, 效率直接拉满。第二个更新是 remote computer use, 手机上就能操控 mac 的 codex 任务,哪怕你的 mac 锁屏了都没有问题。 幻想一下未来的办公,电脑后台多个 a 程序在一起跑,你出门旅行没有带电脑,躺在床上也能指挥 mac 跑脚本发版本是不是方便多了?第三个是构模式正式上线扣代码了,现在 app id 插件 c l i 全线可用,你只需要给它个目标,它就可以自己保长线任务, 中间随时可以暂停或者改方向。我个人的小建议是,配合 plan, 请把方向锁定,加上 set, 随时开个临时对话窗口确认思路,再用 go 模式跑长线任务的时候会稳很多。最后是浏览器内置高级注视模式,可以直接在页面上标注修改甚至编辑元素, 比如说这个字太小,这个颜色不太对之类的视频的。最后我再补充一个细节,现在扣带才支持团队共享插件 team 版本的用户可以批量给其他成员分发插件包、技能、 m c p、 服务器等一起推,省去一个个配置的麻烦了。

codex 可以 做什么?从做游戏设计和开发,到搭建一个品牌官网,以及做一份高质量的 ppt, 这三个超强用法普通人一定要学。第一个,用 codex 做游戏开发。首先我们打开 codex, 在 输入框这里输入指令, 我让他做的是类似天天爱消除这样的游戏美术风格,是水果主题。然后点击按钮, codex 就 开始帮我们做游戏开发了。等个几分钟游戏就做好了, 我们来试玩一下这个水果风格的消除类游戏,美术质量还是很高的,游戏玩起来也非常有趣,运行很流畅,没有 bug, 完成度极高。 普通人用 codex 不 需要懂代码,也能轻松搞定游戏开发了。第二个,用 codex 做网站,同样我们还是在 codex 中输入做网站的指令,我让他做的是 ai 家务机器人的品牌官网,品牌名是 nova。 codex 很 快就理解了我的要求,先帮我做网站的设计,然后开始编辑网站代码,稍等一会,我们的机器人品牌官网就开发完成了。我们可以在 codex 里简单预览,然后在浏览器里面完整打开这个网站。网站的页面设计非常高级,有科技感, 而且内容详细,甚至有很多页面特效。网站的完整代码你也可以在 codex 里面查看,全程就几句话就做完网站开发了,非常适合普通人。第三个,用 codex 做高质量 ppt。 我 们只需在 codex 里输入 ppt 的 主题,比如刚刚的 ai 家务机器人 nova 的 发布会 ppt, codex 会调用它的图像生成等技能,快速的帮我们生成这份 ppt 文件。我们可以在 codex 里预览一下它的效果,然后在电脑的文件夹里找到这份已经下载好的 ppt 文件。你可以选择用办公软件打开它。这份 ppt 的 质量还是非常好的,设计感很高级, 不是简单的套模板,是认真的设计出来的。当然, ppt 的 内容支持自由编辑和修改,可用性极高。这就是 codex 强大的能力,通过对话就能帮我们干活了。我是汤姆喵喵,持续分享超好用的 ai 工具!

codex 是 openai 推出的 ai 编程伙伴,可以帮助我们开发功能、修复 bug、 重构代码、做代码审核等。 openai 官方也提到, codex 可以 处理从功能开发到代码 review, 发布相关的工程任务。 但对孩子说,我们不用一上来就讲那么复杂,我们可以把它想象成一个把想法变成作品的 ai 助手。比如说我想做一个数学错题的讲解器,我不会直接说 帮我写代码,这样太空了,我会说,请帮我做一个适合三年级小学生使用的数学错题讲解网页功能包括,学生可以输入一道数学错题 e i 页面,提示学生先分析题目条件, 在引导学生写出题解之后,再举一反三。应用风格要可爱清楚,适合孩子,这就叫任务拆解。这我也给大家进行干货总结。给 codex 写提示词有一个万能的公式,角色加目标加用户,加功能,加风格加输出形 式。比如说角色是,你是一个 ai 编程助手,目标是帮我做一个教学错题分布讲解, 生成类似体,风格是卡通,也要简洁,适合孩子。初初就是做成网页。在 ai 时代,孩子真正要学的不是复制答案,而是把自己的想法讲清楚,因为你讲的越清楚, ai 做出来的作品就越接近你想要的样子。

揭秘,纯 ai 开发的游戏到底能赚多少钱?这是我开发的一个模拟经营类模拟摆摊的小游戏,叫摆摊王逆袭啊,摆摊王逆袭,然后我们现在看一下这个用户的活跃吧,我是四月,应该是三十号发布的,然后现在, 呃,最高的一天就五月二十号这天,五二零怎么会这么多人玩游戏呢?有八十五个用户,然后累计用户是已经达到了呃,四百七十个, 哎,但是为什么五二零这天会有这么多用户呢?然后我们再来看下收入,那么四月三十号是没有收入的,到现在最高的一天是五月二十五号,三十五块七, 你看五月二十号他没有,五月二十号人最多,但没有收益,这什么情况?大家有时间拿我的游戏消遣,但是没时间看是吧?没时间,这个整十五秒,三十五秒啊,那我们看累计收入, 累计收入也是从十四号开始啊,增长的到现在已经是一百点五四元。其实摆摊王逆袭在我自己看来只能算是一个完成了百分之八十的游戏,它都不能算是一个完整的游戏,因为我刚开始做的时候是四月初那会儿啊, gpt 五点五度还没出来,更没有一麦九二。 那整个游戏开发成本除了 ai 智能的会员费以外,就没有成本了。那这个会员费虽然说挺贵的,但是我也不止开发这一个项目嘛,我觉得虽然说一百块钱不多啊,但是对于呃 ai 开发游戏 并且完成赚钱这个事情啊,可以算是一个不错的起步了。那大家有什么 ai 开发游戏方面的想法可以评论区交流打鼓。

完全 webcoding, 没有写一行代码开发的游戏到底能不能商业化?我之前发了一期关于我用 codex 加 code 开发的二 d 游戏铁根生进, 收到了非常多的认可和支持,非常感谢大家。那我来分享一下我开发这个游戏的心路历程和目的。因为我是一个老独立游戏开发人了,所以说我对 ai 辅助开发游戏一直特别关注。哪怕三年前我也用 ai 辅助我做一些简单的图片, 那个时候,呃,这个图片的 ai 位特别重啊。但是在 g p t。 的 一麦九二发布之后,我脑子突然突然闪现过一个想法,开发游戏的最小团队无非就是策划、程序,美术、音乐、动画建模,还有宣发。那一想,不对啊,这些东西好像基本上呃可以用 ai 去完成了。然 然后我就想着测试一下那 ai 到底能不能开发商业游戏作品这个事情,开发游戏是肯定可以的,我只探讨能否开发商业作品,所以你们看,我问 ai agent 呢?第一句话就是 steam 销量最好的二 d 游戏是什么?第二句话就是让他帮我分析泰拉瑞亚的成功因素啊,这就开始让他帮我策划了。我的目的始终是 在我只和 ai 对 话的情况下,测试它能否开发出一款商业作品。那目前的结果来看,至少它开发出了一个基本成熟的十五到三十分钟的游戏 demo。 实话说,我很兴奋,因为我的结论是可以开发完整商业作品的,但是目前还需要人的加持,我打算再进一步测试这个游戏。我会以 完全免费游戏的形式让大家一起帮我见证在当下以及未来 ai 的 发展下, web coding 的 游戏作品到底能到什么水平?那希望大家都来给我的 ai 员工挑挑刺儿捣鼓。

gemini 也出桌面端了,我用它做了动画,开发了游戏,还尝试了一系列的常用功能,还真有点平替 codex 的 意思了。就在昨天 google i o 开发者大会上,发布了一系列面向模型搜索、开发者工具和多模态创作的一整套 ai 更新, 有新一代基础模型 gemini 三点五,有融合了 nano、 banana 和 vivo 等模型能力的多款桌面端 agent 的 重度用户。 我们也终于等来了 google 版的 codex itigraphy 二点零,我已经迫不及待想上手玩一玩了,那么话不多说,马上实测。嗨,这里是头哥不请自来的 ai 频道,我们先来看一下它的界面,如果不仔细看,我真的以为自己打开的是 codex。 左边是项目和对话任务,右边是主要的对话窗口,对用过 codex co work 或者其他桌面端 a 阵的工具的朋友来说,基本没有任何的学习门槛。这里可以看到, atigraphy 已经把刚刚发布的 gemini 三点五 flash 集成到了模型列表中, 而且之前 it gravity ide 版本里已经支持的模型也被保留了下来,比如 cloud sonic 四点六,还有 cloud ops 四点六。光是模型种类这一点, it gravity 就 比 codex 丰富了不少。 所以接下来我们就通过几个案例详细盘一盘 it gravity 的 能力到底怎么样。第一个案例当然是制作我们熟悉的 remotion 动画视频,之前的节目里,我们已经详细介绍过如何使用 codex 配合插件市场中自带的 remover 插件制作像这样的动画效果。但 itagraft 有 一个很明显的区别,它并没有自带的技能库和插件市场,所以这里我们先要安装下这个技能。 我们先新建一个项目,然后把 remotion 最佳实践这个 scale 手动安装到项目的点 a 阵子文件夹中。接下来我们就直接输入这段指令,使用 remotion 制作一个介绍 it graffiti 二点零的动画视频,要求浅色主题,将 logo 与 logo 的 配色融入到视频风格中。 输入完成后, a 阵的没有马上开始写代码,而是先开始分析我们的需求以及当前项目里这个 remote skill 的 能力。然后他先给我们生成了一版详细的实施计划。 这一点就和 codex 的 工作方式有着明显区别,因为我们一开始并没有主动开启 autograph 的 计划模式, 但他仍然先进入了计划阶段。从体验上来看, itgraphy 这一点很打动我,所以这里我先检查了一下他的实施计划, 确认整体思路没有问题之后,就让 agent 继续执行,并自动渲染出了视频文件,你看效果是不是还不错?第二个案例我想稍微上一点难度,我们让 agent 使用 react 加 three 点 gs 开发一个三 d 太空设计游戏。 这一次我们直接开启 atigraphy 的 计划模式,先不让它马上写代码,而是让 agent 先和我们讨论具体要做成什么样子。这点就很像 codex 里的计划模式, agent 会一步一步向用户确认游戏细节,比如核心玩法是什么, 是固定视角还是第三人称视角,有没有剧情模式,有没有关卡推进等等。待所有细节都确认完成以后, agent 就 会生成一个详细版的实时计划,确认没有问题,我们就让 agent 继续执行。 经过几分钟的开发,一款打开浏览器就能玩的三 d 太空设计游戏就搞定了。到目前体验下来,我们的感觉是, atigraphy 并不是只把 codex 的 界面复刻了一遍。像这种面对复杂任务时停下来先把任务规划清楚,再一步一步执行的能力, 是现代 a 阵的终端里最重要的能力之一。最后,我们再来测试一些平时经常会用到的场景,比如 codex 里的自动化功能, 它可以让 a 阵子定时执行一条指令,每天帮你检查信息、整理资料或者生成固定格式的简报。而在 atigraphy 里,这个能力叫做定时任务, 它提供了几乎相同的能力,比如,我们可以指定一个每天都要执行的指令,每天早上九点检查 github training 里推荐的热门开源项目并输出中文总结。 创建方式也很简单,你可以像这样在定时任务菜单里直接添加,也可以在聊天窗口里通过杠 schedule 加上这段自然语言描述,直接创建定时任务。 这样一来,它就不只是一个你输入才会工作的工具。甚至在一些固定的标准任务上,它已经几乎可以替代像 openclaw 这样的常驻智能笔了。 下面我还想测一下 itigraphy 能不能生成图片。在 itigraphy 里, agent 也同样继承了自家的 nano banana 生图模型,我们只需要在提示词里明确要求它生成图片, agent 就 可以直接完成图片创作,这个能力对内容创作者很有帮助。 最后, ideography 还带来了动态 sub agents 功能,就是一个主 agent 带领一群专业的子 agent 一 起完成复杂任务。我们可以直接在体脂词里指定使用 dynamic sub agents 创作多个子智能体。 然后 atigraphy 就 会自动启动紫 a 阵特并行处理每项工作。展开右侧边栏,可以看到每一个子 a 阵特都在并行工作中。把复杂任务拆分成多个紫 a 阵特之后,每个紫 a 阵特只需要专注于一个非常垂直的小领域,它的 目标更清楚,上下文更集中,出错概率也就更低。这次体验下来,不敢说全新的上下文更集中,出错概率也就更低。这次体验下来,不敢说全新的 atigraphy 可以 平替 code, 但确实值得你认真尝试一下。 桌面端 a 阵子越来越卷,可实用的工具也越来越多,希望朋友们都可以用上能力更强,成本更低的好工具。智能指手段,人类才是答案。这里是头哥不请自来,我们下期再见,拜拜!

codex 真的 特别强,像这样一套非常细致的系统, 它自己运行了二十一个小时,把所有的一些细节在一个一个的完善, 包括这种非常细的交互细节,包括他的一些什么市场定价,以及所消耗的一些这个搜索算力等等,都有非常详细的全线配置,后端管理, 还有邀请链接,前后端一次性全部搞定,他甚至还做了新手引导,就在这干。

大家好,现在看到的是我用 codex 辅助开发的一套 btc u sdt 低周期量化策略。这个策略目前分为两个周期, 一分钟和五分钟,一共四个模型,分别对应一米做多、一米做空、五米做多、五米做空。做多和做空是分开训练,分开管理的 模型使用的是 x g b o o s t, 也就是 x g b。 策略的核心逻辑不是预测 b t c 大 方向,而是在价格触碰布林带边缘之后,判断他有没有机会先回到 birken, 在 判断回本之后能不能多吃一小段利润。现在屏幕上看到的是开发完成后的 o o s 回测和后选池表现,但满和逻辑我已经反复检查过,也让 codex 配合多 agent 做过审查,目前没有发现明显的未来函数问题。 同时我也做了样本外验证和 e t h i。 不 验证,用来降低过你和风险,但我不会说过你和已经被完全排除。量化里没有这种绝对结论,现在它只能说明 这个框架不是纯粹的回测幻觉,值得介入模拟盘验证阶段。目前策略已经接入 balance 石盘公共 k 线作为信号源,模拟盘只负责镜像下单,也就是说 限号来自真实市场行情,但下单还在 demo testnet 环境里跑。当前每笔仓位是零点零零一 btc, 按现在 btc 价格大概是八零 u 民意价值模拟盘杠杆是五倍,所以每条策略单笔大约是十几,已有保证金级别的小仓位测试。截至现在, 策略已经跑了三十笔已结算交易,其中十笔是净盈利,但整体表现只能说一般,因为 time mat 比例偏高,盈利单的收益暂时覆盖不了亏损单。这里的 time mat 指的是进场之后既没有打到止盈,也没有打到止损, 持仓达到最大时间后强制退出。这个问题也是 live 阶段暴露出来的。我后面会重点研究六十根 k 线的持仓上限是否合理,比如缩短到三十分钟会不会减少这种磨损亏损。所以这不是一个稳赚策略, 也不是回测神话,它现在只是一个从研究阶段进入模拟盘印证阶段的量化系统。接下来我会继续收集到一百笔交易样本,重点观察 tamad 净盈利因子 profit factor 个子策略表现以及模型是否出现衰减。我觉得量化最难的不是写出一个策略,而是在真实环境里验证它有没有衰减,以及你能不能再结果不够好看的时候仍然保持纪律。

codex 跟 c c 到底哪个好?我想大家各自都有自己的判断。在我个人为二者都充了二百刀的 pro max 会员以后,我个人的体感是 二者的模型能力之间并没有本质的差异,甚至都足够惊艳,让人心喜。但它们其实代表了两种完全不同的人。与 ai 合作的费洛索费 本质上,我们不是选择两个工具,而是选择两种与 ai 交互的模式。你习惯使用哪种模式,你的工作场景是哪种模式,你就应该选择支持哪种哲学的普顶工具。通常来说,抽象的讲, 软件工程开发的模式可以粗略地分为两大类,首先一类是那些探索性不确定的 idea。 在这种场景下,我们自己可能对需求要做什么,最终的一个中态是什么,甚至过程中该如何实现,它都没有一个明确的定义,它更多是我们一个拍脑袋的灵机一动的想法。当我们解决这类问题时,我们期待的一个 partner, 无论是不是 ai, 它应该都要能 快速的与我们进行交互,通过一些他主动的提问甚至判断给我们更多的信息输入,通过一系列的沟通,最终确定出一个相对更结构化,信息密度更高的思维原型来指引我们后续的执行。 而另一种常见的工作模式则是一个更明确的需求,比如说产品已经给我们了相对明确的 p r d, 那 我们剩下要做的只是说把这个项目 真正转移为一个可以被执行的代码而已。对于绝大多数的研发而言,这种场景下想要做的事情是基本完全确定的,我们在此时要做的无非只是一些 dirty work, 把那个 p r d 转化为真正写出来可用的代码而已。 而结合我自己的使用经历来看, c c 更适用于前者者的工作模式。它会在你输出一些观点之后快速地给你响应,并且高频地向你发出提问,以确定它后续的一些方向执行思路。但 codex 则完全相反,它会在你给完需求以后, 非常认真且可靠地将你的需求描述执行完。这个过程会花很长的时间,但是 结果往往是令我们满意的。想要更明确的拆分这两种工作模式的分野,我们不如从三个维度上来进行拆分,首先是任务商,也就是目标的清晰程度以及约束条件的多少。其次则是以我们预期的交互结构, 我们到底期待着与其他 partner 是 同步的沟通,还是说是一些异步的沟通模式?另外则是一个人类所占主动性的比例, 我们到底期望 ai 占据多少责任?他们是只是执行任务,还是说给我们也有一些他自己的认识建议?其实这三者并非是一个非常正交的关系。一个很明显的结论是,如果一个 目标的本身并不清晰,只是我们拍出的粗糙 idea, 那 我们显然就需要我们的协作者能快速的发问,帮我们把 自己大脑中一些比较模糊的观念导出出来,并且通过一些沟通确定哪些思考是我们需要的,哪一些是可以被删除的。通过这种 快速的同步沟通,得出来一些更结构化的结果,那在这个流程中, ai 需要介入的部分以及引导的主动性就会占比更多,但如果这个需求本身就像我们之前讲的已经相对来说明晰,是一个低伤的场景,那我们就不太 需要。它是一个很同步,事无巨细都要向我们发问的流程,它完全可以在我们把事情说清楚之后,一步的完成这个工作,从而解放我们人类自己的时间。我们也不需要给他太多主动发挥的空间,他只需要忠实的执行我们给他的需求就可以。我觉着对未来工具的使用以及工作流的设计,也都是从这三个维度去进行判断,动 态的选择。我们到底适用于哪种工具,应该主要采用哪一种工作流的思路?如果要打一个比方的话, c c 更像是坐在你隔壁工位的好蜂蜜, 会在有了一些 idea 之后立马的打断你现在的所作所为,跟你去探讨它的一些碎片化想法。而 codex 则更像是一个你忠实可靠的下属,在你交代完任务需求以后,忠实的可靠的帮你把事情完整的办完再通知你。我已经做好了。 每个模型都有它们自己的性格,我们也可以顺应的这种性格,在不同的工作场景中选择不同的工具以及模型。 以上是二零二六年二月我对这两个投影工具的一些使用场景总结,但我相信这个领域是日新月异的,二者工具之间 大概率在未来也会发生一些融合。不会说一个工具只是一种工作流场景,那就需要我们未来本身人类自己有一些对需求使用场景的预判,从而能告诉模型它应该采用哪些工作流模式。软件工程永远没有银弹, 不可能说我们用着一种模式,一条道走到黑,就可以得到一个很完美的结果。如果你在错误的场景使用了错误的工作模式,那模型给你提供的支持也就会非常有限。 结合自己的需求,场景动态切换自己的工作流模式才是一个更高效率开发的必经之途。以上是本视频的全部内容,如果你有一些想法或者建议,期待评论区讨论,谢谢大家!

最近呢,很多人都用上了 codex 啊,会发现 codex 真的 非常的好用啊,尤其是一些可能没有太多基础的普通人,会发现 codex 插件以及 skills 非常的友好,对你来说使用起来非常的方便,非常的高效。 不过呢,也有一个致命问题,就是它的额度经常会不够用,偷客会用的比较快。那这个呢,可以很好的通过我们国产的 deepsea 微四 pro 模型啊来解决这样的一个视频简单给大家介绍清楚,我通过了测试呢,它整体推移能力和完成的效率也是比较高的啊,你可以两个模型相互的切换来完成你的一些 开发以及你的一些工作。大家也看到了,我现在已经接上了 deepsea 微四 pro 模型啊,并且的话也通过它去实际的游戏啊,平台的游戏通过它的 这个插件 game studio 来开发整体它的产品化的结构,还包括它的开发流程还是比较快的,因为我只是简单的一个提示词啊,做的效果的话我已经把它打开了啊,这个链接的话你直接点开就可以预览,预览之后的话会看到它的画面,包括它 ui 以及一些功能啊,跳跃给二连跳 我觉得也非常不错了啊,当然呢,这只是一个简单的提示词,我没有给他非常专业的一些提示以及进行的优化,包括它的特效,我看它落地的时候有一些提示 就只是一个简单的提示,对于我们普通人包括一个技能可以变大啊,对于普通的用户来讲的话,我觉得已经非常足够用了啊,我这个最后这个地方其实已经过关了,其实还有音效,还有特效,看这个画面优化了,非常不错了啊,可以进行下一关,我就不敢演示了, 具体怎么接呢?就是必须得用到这个 codexplus 最新的这个工具啊,你下载之后呢,在电脑上就会有了,在 github 上面搜索都可以找到啊。 核心的操作就是你需要去点到这个供应商配置这个地方,去添加供应商,添加供应商这里上面的名字自己写,这里填入啊,这个上面这里填你的模型名称,就有 dsp 威士 pro 啊, 下面这里的 ul 就是 你 dsp 官网,这里会有啊,你进到 dsp 的 官网,这里有一个文档,把上面这个链接接 open i 的 这个链接复制过去啊, 复制到那个插件,那个文件里面,复制到这个位置下方 key, 那 就是你 deepsafe 开放平台里面的这个 key 啊,你自己创建一个之后,记住,然后粘贴粘贴到这个地方来啊。下方这个地方一定注意选择这个 chat conditions, 选这个编这个啊,然后保存,保存之后重启 codex, 重启打开之后下方这个 就可以去使用了,你自己在这选啊,就在这可以选,看到没,你可以选 deepsafe 是 pro 了,进入之后自己赶紧去测试一下啊,功能还是非常强的啊。