大家好,我是安逸,今天跟大家聊聊 code to code 的 上下文压缩机制,这是一个让 ai 能处理超长对话的关键设计,主页有更多技术架构解析,感兴趣的朋友可以点个关注。好,咱们直接进入主题。 code to code 会做的事情越多,上下文膨胀的越快,读个大文件会塞进很多文本,跑一条长命令会得到大段输出,多轮任务之后就结果越堆越多。没有压缩机制的话,问题来了, 模型的注意力被就结果淹没, a p r 请求越来越重,越来越贵,最惨的是直接撞上上文,上线生物直接中断。这一章要解决的就是怎么在不丢掉主线连续性的前提下,把活跃上下文重新腾出空间。 先讲清楚三个概念,上下文窗口就是模型的这一轮真正能一起看到的输入容量。它不是无限的活跃上下文,不是历史上所有内容都要一直留着,而是当前这几轮继续工作时最值得模型马上看到的那一部分。 压缩呢?不是 z i p 压缩文件,而使用更短的表示方式,保留继续工作真正需要的信息。比如大输出只保留预览文,写到词盘,旧工具,结果改成占位提示。整段历史总结成一份摘要。理解了这三个词,接下来讲三层架构就顺了。 这一章节你先记三层,不要一上来七八层十层。第一层大结果不直接塞进上下文,写到词典只留预览。第二层旧结果不一直原样保留,替换成简短占位提示。第三层整体历史太长时,生成一份连续性摘药,手动触发 compact 工具,本质上也是走第三层,这三层是从小到大的递进关系, 前两层是日常,第三层是兜底。先看第一个关键数据结构, persisted apple mark。 当工具输出太大时,不要把文强塞进当前对话。它的最小标记结构是这样的,用 xml 标签包裹,里面写明文保存到了哪个路径,再附上一段预览。 这个结构表达三层意思,权威没有丢,只是搬去了词盘。当前上下文里只保留一个足够让模型继续判断的预览。核心思想就一句话,让模型知道发生了什么,但不强迫他一直背着整份原始大输出。 第二个数据结构是 compact state, 教学版建议显示维护一份压缩状态,它有三个字段, has compacted, 标记这一轮之前是否已经做过完整压缩。 last summary, 存最近一次压缩得到的摘要 recent files。 这通最近碰过哪些文件,方便继续工作。还有个 microcompact boundary, 就是 一条简单规则,只保留最近三个工具结果的完整内容,更旧地改成占位提示。这已经足够让初学者理解,不是所有历史都要原封不动地一直带着跑。 讲完数据结构来看,最小实线分五步,第一步,大工具结果先写磁盘,判断长度,超过预值就保存到文件,返回一个 persistent auto 拨记。第二步,旧工具结果做微压缩,把超过保留边界的那些改成占位提示。第三步,当整体历史过长时,做一次完整压缩,用摘要替换整段对话。 第四步,在主循环里接入压缩逻辑,每次迭代都先做微压缩,然后检查上下文大小是否超线,超了就触发完整压缩。第五步,手动压缩和自动压缩附用同一条机制,用户主动触发 compact 命令,不需要重新发明另一套逻辑,做到这一步最小实现就完整了。 这里有个地方特别容易讲虚,压缩不是把历史缩短这么简单,真正重要的是让模型还能继续接着干活。所以,一份合格的压缩结果至少要保住五大类信息,第一,当前任务目标是什么?第二,已经完成了哪些关键动作?第三,改过哪些文件或重点看过哪些。第四,做过什么关键决定和约束。第五,下一步应该做什么? 如果这些没有保住压缩虽然腾出了空间,却打断了工作连续性,那还不如不养。从这一章开始,主循环多了一个很关键的责任管理,活跃上下文的预算 agent loop。 现在同时维护两件事,任务推进和上下文预算这步非常重要,因为后面的很多机制都会和它联动。 记忆系统决定什么信息值得长期保存。系统提示词 apply 决定哪些快,应该重新注入错误恢复会处理压缩不足时的恢复分支。上下文,压缩就是整个系统里的空间管理器。 讲完正确做法,再来看初学者最容易犯的五个错。第一,以为压缩等于删除,不是的,压缩是把不必常驻的内容换种表示。第二,只在撞到上限才临时乱补。更好的做法是从一开始就有三层思路。第三,摘要只写成一句空话,没有保住文件决定下一步,对继续工作没帮助。 第四,把压缩和 memory 混成一类。压缩解决的是当前绘画太长怎么办? memory 解决的是哪些信息?跨绘画仍然值得保留?第五,一上来就给初学者讲过多产品化层级教学主线,先讲清最小正确模型比堆名次更重要。 最后一句话,记住这张的核心上下文。压缩的核心不是尽量少字,而是让模型在更短的活跃上下文里仍然保住继续工作的连续性。 proceed out top 加 micro compact, 再加 summary compact。 能做到这一点,这章就到位了。我是安逸,下期我们聊权限系统,不是所有工具调用都能直接执行,高风险操作必须先过安全关。主页有完整系列,感兴趣的朋友可以去看,咱们下期见。
粉丝526获赞3406

你的 codex 压缩上下文的时候是不是经常卡死?教你一招,用五点三来压缩,然后再切回五点五, ok。

如果你在使用 codex 一 段时间后,感觉它越来越慢,那么我推荐大家安装这个 skill keep codex fast, 直接复制这个命令行,丢给 codex, 让它自行安装。安装好后,第一步可以将这行命令丢给 codex, 让它先扫描,告诉你哪些对话该归档,哪些 word tree 残留以及日期有多大等等。 第二步进行交接,直接将这行命令丢到你比较重要的项目中,它会针对旧项目生成交接文档, 记录你这个项目改了什么,跑了什么命令,以及下一步应该怎么做。第三步就是归档模式,它会备份移除旧的 word tree, 清理日期等等。关键是它不是自动执行,它主要是每周或者是每半个月来自动提醒你该做这个事情了,这样会更安全。

好,大家好,我是小刘。呃,今天我们一起来聊一下在 codex 中上下文管理的一些技巧,那这里呢,我会讲我平时在使用 codex 当中,我是怎样进行上下文管理的。那我们先说一下背景, 什么上下文管理呢?就是我们知道我们在一次对话的过程当中,它的绘画窗口是有限的,可以看到这里是共二百五十八 k, 那 已经使用了三十二 k, 当这个上下文满的时候呢,扣代码,它会自动的压缩这个背景,这样呢我们的这个整个上下文会失真。什么是压缩背景呢?比如说猫和老鼠四个字,那就是我们绘画的主要内容,他会把它压缩一下变成猫老鼠,你看是不是压缩了,对不对? 但这样就会产生一个通病,就是产生 ai 幻觉,那也就是我们的功能开发会越用越不好用,你会发现你跟他说一个点,他就是不明白,然后呢会导致我们很崩溃。 那我们来看一下这个网友是怎么解决的,然后我再讲我自己的方案,他的方案就非常的简洁易懂,就我们都知道每一次对话呢,它会产生一个绘画的 id, 那 我们这次绘画它是存储到我们本地内存当中或者数据当中,这时候我们可以选择复制这绘画 id, 那 这个绘画 id 呢?本身上是一堆的这种字母,就我们扣带子可以根据这个字母找到我们当前上下我们所有对话, 他拿到绘画呢,可能是压缩库的,可能是不准确的,所以呢他就遇到了这个情况,他就把他哎复制到一个新的窗口当中,比如说新对话,这时候你看跟他说对吧?请你帮我进行这个功能继续开发是不是?那这个时候是不是就拿到了我们的青山崖纹?这个也可以,只是说开发的时候,那他需要去浪费更多的图层,因为他需要加载数据库,加一个内存,对吧? 好,首先我先说一下我的方案,就是这里呢,我会回顾一个上下文的文档,进行定期的总结。举个例子,比如说像这个绘画呢,他都满了,那我就跟他说,请你帮我根据当前这一次的绘画呢进行总结出一个 markdown 文件,这个 markdown 文件呢是包含了这一次的一些所有的关键信息,那你可以看我思路这样的,请你帮助我, 请你总结当前项目的关键决策已经完成的部分和代办事项,便于我下次听话加的一定要加这句话,如果说你不加这句话,他给你的可能就是一个总结性的文档,如果说你加这句话的话,他会按照 call 代词能够处理的绘画格式给你一个哎,一个合理的 bug 档,所以就相当于固定的一个格式给他。那如果说,哎,我这时候跟他说这句话对不对? 尽量用五点五模型,用最好的模型实现的效果可能是最好的。然后你比如说用五点五超高你发送一下,那这时候呢,他就会根据你当前的这个项目进行总结一个 bug 大 文件,那收下一次开启的时候呢,你就可以把这个 bug 大 文件哎给他 就是丢进去,然后这个时候呢,他就可以直接的进行上一次上下文的复用,而且呢失真不会失的很严重,那最起码会比直接使用 codex 压缩的方式会好一点,那这是我的第一种方法。第二个呢,就是使用这 codex 内置的压缩功能呢,这个我刚刚说过了,对吧?我们 正常来说 codex 也会进行自动压缩,但是它会进行四帧,但是进阶技巧就是我们可以直接让 codex 呢,每次都生成这个 prompt, 就是 给它设定一个这个啊, ajax, ajax, markdown, 这种,对吧?让它自动生成,而不是让我们手动去指定它。 那这里呢,再分享一下我自己的这个 codex 技巧,因为有小伙伴他会问我说,你视频当中平时使用 codex, 那 我先说我怎么使用呢?首先我不会把一个项目 丢到一个上下绘画里面,一个上下文绘画里面我会把它拆成多个小的功能,在每一个小的功能对应一个绘画,这样呢,我这个绘画可以赞成很大,并且呢它总结出一个 markdown 文件,再把这个 markdown 文件丢给一个新的绘画,这样呢,我们就基于这个功能在进行优化,不会去影响整个的大局。啊,能懂我意思吧? 那第三种就是我们可以使用外部的持久化工具,那这个外部持久化工具有很多,比如像我们之前说的 context 上来说,就是把原先我们的 markdown 给它缔造了外部的这种 社区部里面去,你可以这么去理解,然后通过一些更好的方式去把它读取到这个 collect。 那 每一个开源项目都有自己的方式,大家可以自行研究,因为篇幅有限,所以我这里呢就讲这几种,好吧。 然后呢?呃,这种方式呢?其实我还是建议大家使用 bit 进行管理起来,因为当我们用 bit 进行管理起来之后,我们整个上下文呢,能够更加有链路的去回溯,就是每一个版本都有对应的回溯, 我们能够很清晰的看到,对吧?这是我们整个流程,你可以看到通过这样的方式,那就是像上下文的这个管理,好吧,这呢是。呃,好了,那以上就是本期视频的全部了呢,我是小刘,我们下期再见。

好,我们一起来看一下 codex 呢,在五月八号进行了一次最近的更新,增加了一个昆姆扩展的插件,那这一次呢,我们一起来看一下这个插件和相比于其他的方式去操控昆姆有什么区别?好,我们直接点击这个电脑操控这里呢,大家可以看到这个会有存在一个 啊昆姆插件这么一个选项,就是我们点击管理可以看到增加了非常多的配置,比如说像权限历史记录下载上传,那这里呢提供了非常丰富的这种权限控制。嗯,我们可以通过 安装这个插件和 codex 呢进行建立关联,这时候可以看到我们的这个 codex 呢就连接上了当前这个浏览器,那出现了这一个绿色的图标,就说明我们的 codex 呢已经可以完全的托管这个浏览器了。那我觉得这是 codex 呢像全自动操控浏览器迈出的一步哦, 我就挺有趣的,所以今天给大家做一个分享。那如果你把这个开关打开之后呢,接下来呢我们就可以直接去操控了,但是你会发现一个小细节,就是如果你是在国内的环境下,你就直接点击这边去打开呃,安装插件的界面,你会发现这个商品并不能够安装,所以大家呃可以通过我提供的这么一个压缩包去进行补充这个 啊插件,好吧,呃,我们来往来看啊,首先我们来看一个很容易被大家混淆的东西就是,嗯,目前 codex 本身来说是有浏览器,那他操控浏览器和我们的这个插件有什么区别呢?比如说我们在这个 codex 中使用软件到一般是这边新建一个窗口,在侧边会有一个浏览器的选项,那其实这也是我们的第一步,就是我们的这个呃, in app browser, 这是我们的一种内置浏览器,它本身来说是用来调试的,用来开发的,所以和我们 这个插件更新是没有任何关系的,所以大家不要搞混了。那第二种呢?叫做 browse user, 这个是用来操控类似浏览器的,这是相当于前面的这个 in app browse 呢,又往前走了一步,比如说我们在这个设置这边呢,哎,去又往前走一步,这有一个,这个什么有一个啊? browse user, 它可以让呃我们 的 codex 呢去操控这个类似浏览器,去完成一些操作。好,那也就是第三种呢,就是我们刚刚现在讲这种叫 chrome browser, 它可以帮助我们进入真实浏览器状态,去操控我们整个浏览器。 那有小伙伴说了,那其实我的这个 pry white mcp 也可以操控浏览器,或者说我这种外置这个 computer user 也可以操控浏览器,那和这个有什么区别吗?而且区别很全面,对吧?呃,区别的话,呃 computer user 呢?它本身来说它并不是浏览器的插件,对吧?它是一个操控电脑的 g y 能力的 这种插件,比如说它可以通过你屏幕去操控你调出那些图形应用,就比如说我们现在常见的这种,呃剪辑应用,对吧?微信,对吧?它都可以操控,但是你如果单独的话去操控这个浏览器的话,显得并不那么智能,所以 codex 提供了一个新的能力,就是这个 codex com, 那 我们可以通过这个 codex com 去完整的操控我们整个浏览器。举个例子,比如说我现在想让他看到我们整个这个浏览器上有多少个标签页页,对吧?我们就问他,我说,哎,现在当前浏览器上有哪一些 这个标签页?比如说你看是吧?他可以告诉我们现在到底有哪些标签页,我又让他在第一个标签页输入 a, 第二个标签页输入 b, 也可以,我再让他把某一个标签页固定也可以,就能够做到很多之前做不到的一些事情 啊,分的更加的细了。那如果说你细心的话,你会发现,呃,这个插件它其实包含了很多细节的功能,比如说他通过这个插件和 codex 进行关联之后呢,就可以直接在 codex 里面去操控浏览器的所有权限,比如说审批,对吧? 比如说历史记录,你可以让他看到你今天到底有哪一些详细的记录,包括你上传哪些文件都可以使用它,比如说你允许上传哪些,允许下载哪些,都进行了完美的这种配置啊,对吧?非常的清晰。好,那接下来在最后我们想跟大家聊一下,就是为什么要使用这个呃,这个酷路亚 插件呢,对吧?为什么不直接使用 pro white 的 能力呢?其实很清晰啊, pro white 的 本身更像是一个外部的这种工具,而这个呃 这个 com 插件呢,是一个内置能力,如果说你使用这个的话,你会发现其实很多东西它都需要一步一步的去哎,去跟他讲,去分析,那它通过这些 m、 c、 p 的 能力去一个一个去提供。那如果浏览器更新了呢?它并不啊 同步更新,但如果是 codex 呢?它就同步更新的,它更像是一个完整的产品,对吧?也是 codex 官方提供的真实浏览器的一个执行通道。 而 pro y m c p 呢?它只是一套通用的浏览器自动化引擎,对吧?所以呢,你可以相当于它是一个小缩放。而这个,呃, codex 捆绑插件呢?还是更像是一个完整的企业级的真实软件的一个执行通道?它也可以通过现成去控制,并且呢,能够降低了很多我们调试的成本, 比如说我可以让它去帮助我去做一些自动化的事情,对吧?是吧?非常的方便。好了,那以上就是这几个的区别,我是小刘,那我们下期再见。

大,真的是一个头两个大呀。大周末的,刚起床跑了一下任务,五月六号买的 plus 会员到现在就只剩下百分之三十四了, plus 是 完全不够用。 我这边找了一篇文章,几个技巧能够彻底解决扣袋子跑久了会越来越笨,越来越慢,还能省掉百分之四十上下文的一些技巧给大家分享一下。这篇文章说一下我的理解。第一个,扣袋子跑久了之后会越来越笨, 越来越慢,这个是基本成立的,但是其实逻辑上不是因为模型真的变笨了,其实绘画的上下文越来越长,旧的一些信息,过激的计划, 一些失败的尝试,都混在一起,就会让我们体感上觉得迟钝。判断是对的,如果是有效,上下文的质量下降了,就会导致整个推理和执行的质量下降。第二点,关掉 process location 方向是对的,但不是万能的。减少输出规划的趋势确实能够减少偷客的消耗和噪音,但是问题是,如果你不让 agent 去汇报他这个过程,你也是很难发现他是不是走偏的。尤其是像我们做一些比较复杂的产品架构,涉及到一些复杂的 bug 解决,那适度的汇报还是要看的。 所以并不是说你在那里一直执行你就该干嘛去了,这是非常不合适的。所以更合理的做法就是简单的任务让他少说那长任务,保留一些关键的进展,就不要去输出这种长的身体活动,不要把每一步的工具调用都解释一遍, 这招是有用的,但是全部是被 token 这件事情是说的绝对。第三点是让 code 子当协调者都用 sub agent, 这个是部分对,但是不能滥用。 sub agent 确实能够把一些探索性的任务分散出去,但是主要是你的目的是为了减少上下文的污染,但是只有那种多模块变形调查 架构,审查大代码库的一个区域分析,要变形解读很多的文件,这这一类才是比较适合的。 但是他也会有一些问题,那指 a 诊呢,也会犯错,而且主 a 诊呢还要去汇总他的结果,所以如果本身的任务是限性的,那你多开 a 诊的反倒会增加他协调成本。那么你们讲到的同时开五个,就相当于五个上下文的并行。 这个方向是对的,但是很容易让别人误解,开的越多越好,那实际上只有那种并行边界清晰的任务才值得猜好。第四个是先列他这个例子的 再动手。这个建议其实是很实用的,特别是在一些大大的一个项目里面,你的 prd 原型在任务池并存的一些项目里面,先列任务就能够防止它改错文件,越界重构,甚至是忘记同步相关的一些文件,做到一半就偏题了。特别是像 有时候网络还不稳定,但是小人物就不需要复杂的计划了,比如改一个方案,一个就直接改就好了, ok。 第五个是禁止在代码库里留垃圾,对,而且非常重要。现在 ai 的 一个常见问题就是说它生成的临时脚本,它不删留 delete 文件, 复制旧版的一些文件,乱建一些草稿,把 etc 的 分析结果写进仓库里面,这都是它的问题,会让这个项目越来越乱,也会让后续的 a 制误读项目的状态, 不过这里要区分不是所有的 m g 啊,后缀的文件都是垃圾,那有些是长期的,一个上下文的资产就不是污染好。第六个就是规划,用高推理的模型,执行用快速的模型,这个策略比较合理。 我最早去考虑这个事情的时候,就是因为价格的问题,比如说好的模型,贵的模型去做推理,你把他执行的要求给到一些 poke, 比较便宜的模型去做执行, 也对,看有没有这个必要了。总之一点,如果你的执行模型能力不够,那你就可能把你的规划 在外,所以在切换模型的时候就要把边界写的很清楚。我个人理解,除非你的后坑消耗是巨大的,不然我就觉得没有必要折腾。其实这就是在解决上下文丢失和重复犯错的问题。最终的结论就是,整个他的博主分享的这个文章核心方向都是对的。 后段时长时间的工作质量下降,主要来自于上下文的污染。项目状态不清,无纪律和无记录的写作大概就是这样子的。确实, 连续二十八天都是在每天早上七点钟起床,无论前一天晚上几点睡都是这样子。晚,对,非常晚,四五点才睡,今天睡到大概十点多,整个脑子居然会比较清醒啊。 今天就分享到这里,后续会继续去分享一些 holddance 的 使用体验吧。
![第111期丽姐的AI悄悄话-上集:Codex使用技巧第一弹,小白新手必看!
[技巧1 - 自动压缩会话]
[技巧2 - @键快速调用插件]
[技巧3 - Markdown渲染+注释]
[技巧4 - 海量插件即插即用]
#codex #AI #agent #编程入门 #软件分享](https://p3-pc-sign.douyinpic.com/image-cut-tos-priv/172629e0568ee588746ae17ca65686e1~tplv-dy-resize-origshort-autoq-75:330.jpeg?lk3s=138a59ce&x-expires=2094105600&x-signature=6yuLMAtfWINQpFAW6x45XTca100%3D&from=327834062&s=PackSourceEnum_AWEME_DETAIL&se=false&sc=cover&biz_tag=pcweb_cover&l=20260514160934C45866EBCD148FCE8BC9)
你有没有遇到过这种崩溃 ai 对 话,越聊越长,上下文爆了,要手动清理! ai 干活时突然想问一个问题,一,插嘴任务直接重置 在 codex 呢?这八个技巧让你的效率翻倍!欢迎来到新手村,今天给你分享 codex 的 八个使用技巧,学完从小白变老手! 技巧一,自动压缩绘画什么意思呢?就是 ai 会自动整理上下文,把废话删掉,保留住精华,不用你去手动清理, 再也不用担心对话太长一出,也不用重新开绘画,用的越久越感觉这货是真懂我呀!技巧二,艾特键快速调用插件 想用插件别翻菜单了,直接敲 at 键,弹出一个插件列表,想用哪个 at 哪个,秒掉出来。不用记命令,不用查文档,手指头一敲,插件就位,这才是真正的一触即发。 技巧三, markdown 渲染加注式敲代码写文档的看过来, codex 原声支持 markdown 渲染,写出来的东西格式漂漂亮亮,阅读体验拉满 还不够?它还有两个小技能,第一个就是它可以一键还原原始 markdown, 想看原码随时切换。第二个就是给某段内容添加一个注视,精准标记问题所在,再也不用密密麻麻的文字里面大海捞针, 还可以精准地给这个 markdown 进行一个注视,然后在对话里面去让 codex 去帮你去修改,非常的便捷,更加的精准化的定位我们的问题。 第四个技巧就是海量插件,即插即用。 codex 呢?它默认支持很多插件,开箱即用,不用你折腾配置,不用你找安装包,点开就用 翻译插件、画图插件、数据分析插件等等,别人还在装环境,你已经开始开工了。好了,这一期就到这,下期我教你进阶技巧多现成自动化的骚操作,觉得有用的话点点关注点点赞,我们下期再见啦!

经常用 cloud code 或者 codex 这类 coding agent 的 朋友,应该都会挺关心 token 消耗和上下文管理这两件事情,但我发现哪怕用了一段时间的人,对于让 agent 做什么事情会消耗 token 这件事认知偏差还是挺大的。所以今天这条视频就给大家讲清楚两个事情,第一个是 token 和上下文 context 到底是什么意思。 第二个也是最重要的,让 agent 做什么事情是会消耗 token 的, 而哪些其实根本就不消耗,也不占用上下文。刚好 cloud code 的 官方其实做了这样一个特别直观的交互式的界面,把你从打开 cloud code 跟它进行多轮对话的整个过程中,它的 上下文是如何累积的,然后每条指令它消耗多少 token 全都非常清晰地画了出来。下面我们就顺着这个界面把这件事情讲明 来。首先就是在我们输入第一条消息之前, agent 它的上下文里面其实就已经被装进去一堆东西了,这里就包括系统的提示词,这个是 histogram 官方写的用来约束 cloud code 行为的一些固定指令。然后是 memory 文件,是之前你看 cloud code 的 绘画里面 agent 自动记下来的一些 笔记和记忆。然后第三个就是环境信息,包括当前的目录、操作系统 get 状态这些,还有 m c p, 还有就是我们非常熟悉的 skill, 还有 cloud 点 m d 这些 map down 文件, 这些都是固定成本,只要你打开一个 cloud 的 绘画,哪怕你一个字都还没有说,这些出土化的上下文就已经加载好了。那从我们发送第一条消息开始,托管是怎么一步步消耗的?这件事情我们站在 agent 的 工作流程的角度来看,就会特别的清楚,你 输入一个任务, agent 会首先理解你的指令,你的提示词本身就成了上下文的一部分,然后他会,然后他会触发绿的命令去读上下文的一些文件,读完他可能会做一些思考,思考完之后可能又会调用一些工具去读一些新的文件,或者跑一些命令去拿输出, 然后再基于得到的结果继续去做思考,这样进行反复多轮,最终他判断任务完成的差不多了,需要你的介入了,就会给你输出一条摘药返回给 给你。把这个流程总结一下,其实 agent 在 你输入完之后干活的其实就这四件事情,第一个就是去读你项目里面的一些文件,第二个去跑一些命令 或者执行一些工具来拿到一些对应的输出,第三个是进行一些思考和推理,第四步就是把摘要总结输出给你,这四件事情产生的所有的内容都会消耗 token, 然后进入到 agent 的 上下文里面。 那么讲到这里有两个事情是我觉得新手比较容易去误解或者搞混的点,这里需要重点去讲一下。首先第一个点就是跑命令本身是不消耗 token 的, 举个例子,你让 agent 把一条两个小时的音频转成文字,或者让他跑爬虫去抓取各个社交媒体上的数据,只要你有现成的脚本或者写好的 skill 让他去执行。这个执行过程中用的是你电脑的算力, agent 本身并没有去参与,所以这个过程哪怕很复杂,跑了一两个小时才跑出一个结果,也不消耗任何的 token。 只有当这个脚本命令执行完之后, agent 真正开始要去读这份结果文件,比如说你让他翻译这份文字稿,或者是基于爬虫的数据去提取观点等等,他必须读完这个原始内容才能开始干活,这个时候才会真正地去消耗 toker。 单纯的脚本执行过程中,无论跑了多久,他都是零 toker 消耗的。 toker 消耗只发生在 a 件的, 去读你的执行日制或者结果,这是我觉得新手最容易搞错的地方。那第二个点就是说,我们去在任务过程中去挤起用子代理的一个情况下,也就是 sub agent 子代理他执行的过程中,我们可以看到他本身是会消耗各种 token 的, 但他消耗的 token 是 累积在子代理自己独立的上下文里面的,不会污染到我们这个主体制。等子代理只是读到这样一份招标文件是消耗 token 的, 所 所以此代理是一种隔离消耗的方式,你让他干一堆需要读大量内容的活,但是主代理的上下文并不会因此受到污染。总结来看,我觉得官方的这个交互式页面真的非常的直观,浅显易懂。如果你对于 cloud code 的 上下文机制还不是特 特别清楚,我非常强烈建议大家去这个页面玩一下,你能够非常清晰的看到 agent 的 上下文是怎么加载的,然后 token 是 在哪些环节去消耗的。有了这个直观感受之后,以后你跟 agent 的 对话,让他干活的时候,就能比较准确的判断哪些事情真的会在消耗你的 token, 而哪些事情看起来可能很复杂,但因为只是脚本 或者命令在跑,其实根本不会消耗多少 token。 ok, 这期视频就讲到这里,如果大家觉得有帮助的话,帮我点个赞,我们下期再见!

如果你想更好地使用 codex, 第一步不是多写指令,而是把它当做一个会读代码、会动手,也需要上下文的协助。工程师给 codex 的 任务最好包含四件事,目标、成功、标准、约束以及你希望他不要碰的边界。 不要只说修一下,而是说修复登录后跳转错误,通过现有测试,不重构健全模块。第二步,给足上下文, 指出相关文件、附件步骤、报错信息、设计稿、接口文档,或者你已经试过但失败的方法。上下文越清楚, codex 越少猜。第三步,让他先侦查 复杂任务,可以要求他先阅读代码,列出计划、标出风险,再开始改,这样你能在真正写代码之前就纠正方向。 第四步,小步快跑,把大需求拆成可验证的小任务,先修一个 bug, 再补测试,再优化界面。每一步都让 codex 解释改动并看一眼 diff。 第五步,建立验证闭环, 让 codex 运行测试 linked 类型检查前端任务,还要打开页面或截图检查,没有验证的完成,通常只是代码写完了。 第六步,管理安全边界,不要把密钥、私人数据或生产凭证直接贴近提示, 涉及删除文件、改数据库发布。提交代码时,让 codex 先说明影响再执行。 更高阶的用法是把 codex 当做持续协作者,维护 agents、 md 记录项目、命令风格、测试方式和禁区。把 issue、 日制和期望结果写清楚,让他在每次结束时留下可附用的下一步。一句话总结好提示,不是命令更长, 而是上下文更准,边界更清、反馈更快。你给 codex 一个清晰的工作现场,它就能交付更可靠的工程结果。

如果你用了 codex 觉得不顺手,先别急着怪他,不是他不够强,是百分之九十的人根本没用。对,我见过太多人装了十几种 skill, 越用越慢,最后得出一个结论, codex 也就这样。但其实不是工具的问题,是方法的问题。 先说一个你可能不知道的事实, codex 的 skills 不是 越多越好,是定位越准越好。我把市面上最常见的 skills 分 成了三类,第一类,效率加速类。这类 skill 帮你把重复性工作自动化,比如 tivoli c l i 做搜索 lock, c l i 做文档管理,装二到三个就够了,别贪多。 第二类,专业增强类,这类 skill 帮你处理垂直领域的任务,比如 p m u p d f 提取 pdf 图片, zotaro obsidian 连动作知识管理这类,要根据你的实际工作需求来装,用什么装什么。 第三类,全局增强类,最常见的就是 superpowers, 它能帮你做高水平的头脑风暴和架构设计,辅助决策,非常有效。但注意一点,这类 skill 有 一个致命缺点,少透肯。我用下来发现它在大型项目里会一直问,一直确认,一不小心几十块的额度就出去了。所以我的建议是,按需开启,不要默认全开。 接下来是关键部分,新手一定要记住这三步。第一步,不要自己找 skills, 让 codex 帮你选,你跟他说我做什么什么工作,帮我去 getop 找适合我的 skills, 按任务类型分类,整理好他就会帮你搞定。 第二步,装完 skills 之后,开一个新窗口再用,这是很多人犯错的地方。在 skills 那 个县城里,直接开始正式任务, codex 会变得不稳定,容易卡住。正确做法是,装完 skills, 开新窗口,再开始你的任务。 第三步,先告诉他任务类型,再说具体要什么。很多人的说法是帮我写一个,或者帮我看看,这个太泛了。正确说法是,我接下来要做一篇小红书。内容大概是这样的,想表达什么?触发对应的条件, codex 会自动匹配适合这个任务的 skills, 而不是只给你一个很泛的回答。 在我看来, codex 已经在从被围观的新工具变成需要被驯服的生产力系统。接下来的竞争不是比谁装了更多的 skills, 而是比谁能把它用得更顺。如果你觉得这条视频对你有所帮助,欢迎点赞、收藏加关注下一条视频,想看什么,欢迎评论区告诉我。

大家最近使用 codex 时,额度是不是又不够用了?或者你是一个小白,还不会配置上网环境,连切记 gpt 账号都注册不了, 那么这期视频我会手把手教你,将性价比之王 deepstack v 四接入 codex 中,国内用户直连兼具经济和性能于一体,可以说是国内入门编程者上手的最优解,我们直接从零到一进行教学。首先打开网页,输入 node js, 点击进入,进入官网后我们点击获取 note g s, 之后选择对应的操作系统,点击安装程序,国内直联的话下载速度很慢,大家耐心等待。下载完成后,我们打开安装包,最后一路点击同意完成最终的安装。 下一步呢,我们搜索 codex 桌面端下载,点击第一个我这里以 windows 系统下载为例,我们找到微软应用商店,点击下载之后打开下载的程序, 下载完成后就会出现 codex 桌面端登录的一个页面,然后我们先不用管它,我们还需要 c c x 和 c c switch 这两个工具,有需要我飞书的小伙伴点赞评论加关注,我也会把我的飞书链接分享给大家。 我们将这两个安装包解压,解压之后点击这个 c c x, 然后这里有一个环境配置文件,这里可以看到我们的这个 s k 是 一二三四五六,这个大家记一下之后点击下面这个程序,然后我们找到这个管理界面,把这个链接复制粘贴到网页端, 打开之后我们在这里输入刚才的那个 s k 就是 一二三四五六, 然后我们点击这里切换到简体中文,然后我们点击这个 codex, 点击添加渠道,之后我们进入 deepsafe 的 官网, 点击 api 开放平台,然后我们自行登录之后找到这个接口文档,我们将这个 baseurl 进行复制,然后返回在这里粘贴。之后我们在 deepsafe 的 apikey 里点击创建 apikey, 这里随便命名, 然后点击创建,之后进行复制,同样在这里进行一个粘贴,然后呢我们点击右上角的详细配置,在这里把服务类型选择成 open i chat, 然后我们下滑,找到这个规范化非常键,我们将这个进行开启,之后点击创建渠道即可。接下来我们找到刚才解压的 cc switch 这个软件,我们同样的进行登录, 安装成功后,我们打开 cc switch, 然后在这里选择呃切的 gpt open i, 我 们点击右上角的添加, 选择自定义配置供应商名称,随便起一个名字,这个 api k 还是我们的环境配置的 k, 就是 一二三四五六。 之后 api 请求地址呢,我们就返回 c c x 中的这个 api 地址,我们将这个地址进行复制,然后在这里进行粘贴,之后点击获取模型列表, 这里我们就可以看到我们已经获取了 deepsea 的 v, 已经获取了 deepsea v 四的两个模型,然后我们往下滑,把这个一百万上下窗口进行打开,然后点击添加, 之后我们关闭 codex 进行重启,这里大家稍等片刻,因为是国内网络的指令,所以说它会有一些延迟。重新打开之后呢,我们选择这个 enter api, 然后输入一二三四五六。 进入之后呢,我们点击上面的 file, 然后点击 settings, 我 们在 general 下面往下滑,然后找到呃这个 language, 进行一个汉化,然后我们在这儿选择中文。进入之后,我们输入对话, 可以看到我们的 deepsafe 已经接入到 codex 中了,我们也可以直接让 codex 帮我们安装 skills, 比如我视频开头制作的 ppt, 就是 用这个 ppt skills 制作的。我们只需要在网页上输入我们想要的一个 skills, 找到 github 的 原始仓库,我们打开, 然后将这个链接地址复制到 codex 里,让它帮我安装这个网页里的 skills, 然后它就会一步一步自动化地去执行我们的操作,最终帮我们安装上了这个 skills。 然后我们之后制作 ppt 的 时候,它就会自动调用这个技能,帮我们生成这样风格的一个 ppt。 这个是 skills 的 一个安装技巧。本期视频就到这里,如果觉得对你有帮助,别忘了点赞关注,谢谢大家!

哈喽,大家好,我是 qk, 那 么呢今天给大家讲一下,怎么让你的 code 叉变得越来越聪明啊?那么为什么讲这个呢?就我之前有个电脑,就是它一直不知道 python 怎么去调用,然后每次新的绘画呢,都需要我去指定说你要通过这样这样子去调用你的 python, 所以 说我那时候就想,那我能不能把这个弄到一个全局的一个记忆里面,让它每次呢每次一个绘画呢,它就知道怎么去调用了。 那当然呢,我这台电脑是有这个拍摄环境的,所以我问他,他就说有,首先我们需要下载一个小龙虾的一个插件,就是一个 agent, 它你就直接下载这个就行,这个是专门用来自己去学习,让它变得越来越聪明的。 那么下载完之后呢,你就直接让酷狗叉帮你去安装就行哈,你就说添加到 skill 里面,然后学习一下这个 skill, 那 它自己就安装了,那这些呢,就是你大概看一看就行, 然后啊添加完之后呢,就跟他说你帮我配置一下,然后每次新的绘画,你就第一时间去学习这个技能,然后读取全集的记忆, 然后这个时候呢又看次看次的,他又给你去啊,帮你去弄了,其实这个东西啊,你不看也没事啊,这个不太重要,你我们主要目的就是让他啊自己去配置完就行。 那么最后呢,就我比如说我说把这个啊调用 python 的 这个东西寄到全区的一个记忆里面,要放续后续的一个那个绘画里面,能够啊,直接执行这个, 知道怎么去执行这个 python 脚本哈,那他就说就写到全区记忆里面了,那怎么知道说啊?我这个 东西是确实记到了全区记忆在新的绘画里能用的,比如说我这里,呃,打开一个新的绘画,我就说测一下当前系统是否可用,就随便输入个东西。然后呢你可以看到说我现在在仓库里的话,先自己去读取了这个东西, 然后呢就是说他就自己去检测了这个全区的记忆,就说这个东西已经记录到全记忆。那么其实这两个文件呢?这个 门襟大概就是一个啊,全区记忆的一个相关的一个东西啊,比如说它这个全区的一个记忆,它就写到这个 m d 里面,那么它它这个我们添加的这个自学习类技能也添也放到这里面, 然后这个全息,就比如说我们之前添加的这个 pad 怎么调用,所以说它就记录了。然后你每次新的绘画, 就是比如说我这里要我再问你一个新的问题,那么这个时候他就有了这个 python 的 一个啊记忆,说我怎么去调?当然你一些其他的东西,比如说啊,你的 ida 是 吧?放大了怎么调?你的一个 js 的 怎么怎么去调这个这些东西你都可以 跟他说,你就说直接像我之前这样子,你说直接就啊写到全区记忆里面,还有一些其他的技能,比如 比如说,嗯,你的一些习惯,你说啊?我,我研究安卓的,是吧?安卓逆向的,然后我的 feed, 这你通过什么命令能执行? feed 这种你都可以, 就配置好之后,你就让它记忆到全区的记忆里面,然后这样子的话它以后的一个工作就会更加的一个方便。对,就是其实就是一个 多了一段记忆,就是让你的一些关键东西进行一个共享了。那还有个问题就是,呃,他记忆的之后呢?他有可能是会把让你的 token 向后会稍微多一点, 因为他比如说他每次新的绘画他都会,但这个量应该是还好,就是你一个新的绘画他都会读一个这个东西, 然后大家这读的这个东西肯定会消耗,相对来说是消耗多一点点头感,所以说你也不用什么东西都让他去记到这个拳击记忆里边,你只需要把一些关键的东西就记到这里,然后方便你后续的一个 操作就行。大家你如果头肯比较多的话,那就当我没说过哈。好,那么呃,今天介绍大概就这样,我们下期再见。

hello, 大家好,下班了。呃,今天背景不是公司,是因为,呃,在公司的时候当然车来了,没有来得及录,然后最近一直在高新路的使用 codex, 想要说我们用 codex 尽可能的提高我们开发效率,一个人顶五个人,六个人,十个人,牛马。 呃,然后最近 q 代像现了一个新的功能,叫做 go 模, go 模式 g o a l 目标。然后首先需要你的 c o i q 代 c o i 得在零点一二八版本级以上才可以使用它,并且要在 config 点 t o m l 文件里面把 go 改成 true 才可以使用这项新功能,那这个功能还在实验阶段。然后我理解它特别像是一个升级版的 sub agent, 就是 我们之前。 呃,如果你有完,为了完成某一个目标,你需要开多个 a 阵去执行不同的任务模块,多个任务可以最终为这一个目标服务的话,我们会使用 sub a 阵的模式,但我一直感觉 sub a 阵的模式其实不是很好用。 然后我今天刚好又有一个新的需求,就比较适合,感觉比较适合使用 sub a 阵去进行,但是之前一直是 sub a 阵的效果不是很好,刚好上线了一个 go 模式,所以呢,我打算使用它。 然后我的这个任务背景是这样的,我为了实现一个目标是可以把我的 app 去的它的它的这个,呃, apk 发版去做一个自动流水线 pipeline 以及呢?呃,我的后端可以去管理。呃, 我发版的版本号,这样的话我的 app 是 可以知道我需不需要去 做本地的 apk 更新,然后去请求这个版本号做一个比较,就这个需求,然后 所以它基本上分为三个模块,第一个是 app 端要去做兼容,你得去能够自动的识别,我目前的版本是低于还是说最新的啊?然后呢去给出下载链接,然后去自己去更新下载更新,这是第一个 app 端,然后第二个呢是 后端,后端得去新增一些接口。那肯定是要啊更新我的 a p k 版本记录,然后呢去检查是否需要更新,以及我的后台界面,还需要去做一个发版记录的展示。 另外就是需要在我的云端仓库,我使用的是 git, 然后 git 有 一个 git go 功能,这个功能可以自动地去根据你啊你的,你可以在项目仓库里面去的 web flow 目录下写一个 webmail 文件,这个 webmail 文件里面就声明了你的 pipeline 是 怎么样子的, 然后基本上就是这这这三大块儿后端 app 端还有我的 pipeline 流水线的建立。然后这三个任务,我让抠带写了三份 prompt, 然后一次性发给一个 go 的 上下文,然后去执行,然后大概执行了七八分钟之后, 效果还是很好的,然后基本上就达到一个可用的状态,所以,呃,我觉得这个 go 模式大家可以多多用起来,虽然现在还是一个 experiment 的 状态。对,那今天就录到这里,拜拜。

一定要,一定要,一定要想方设法用上 codex, 如果你还没有听过 codex 或者克拉 code, 那 么恭喜你,这段视频你有可能会改变你的财富。 什么是 codex? 官方定义是一个编程证书,但它不仅仅是编程啊,黄仁勋就是英伟达的老总啊,世界首富,他已经让他的所有的员工都用上了 codex 或者克拉 code。 现在你听到的所有的什么英伟达的事实翻了多少倍啊?然后纳斯达克翻了多少倍啊?股市暴涨都是因为克拉克或者库克拉斯,它是代表着当前最先进的生产力。 codex 应该是对咱们普通人是门槛最低,成本最低,来使用世界上最顶级的大模型和智能体克拉克的对于普通人来说,还搞不定一些注册和网络问题,动不动就封号啊,也比较贵。那 codex 本身是不存在这种问题的,如果你不知道怎么使用,那么你第一步就只要注册下载, 然后搞定网络问题。你直接问他啊,你对我有什么作用?然后你把你的所有的工作,所有的生活告诉他,问他能帮助你。譬如说如果你是个股民,你就告诉他,我是个股民,我平时炒什么股? 我炒 a 股,然后你能帮助我什么?直接问啊,然后他一步一步的引导你。就是说如果你是工作,你每天的工作是什么?比如说你去打开邮箱啊,下载邮件, 处理数据,上传等等,把你的流程详细的描述给他,你直接问他,我这种工作你能帮我做什么?你能帮我优化什么样的流程,提供什么样的效率,做什么的工具就可以了。 如果你是在校学生或是二十来岁,那么克莱斯可能成为你改变人生的一个工具。就如同你在食堂打菜,突然开了一个新的窗口,那你要做的就是马上切过去,直接去排到队伍的最前面。

如果你也想像甲方一样用截图给扣带题修改意见,又或者是让他撤回整改,最后再让他这么快处理,那么这三个小技巧一定要收藏好。 一、中途介入修改 ai 帮我预设了这个风格,但是我不想要直接在这输入你的新需求,点这里的引导, ai 就 能顺着我们的新提示来调整了。 然后接下来两步,有一个非常重要的一个前提,就是你需要有自己的 get 仓库。在个人主页里右上角的创建 new repository, 输入项目名称确认,然后这里点复制 这是你已经创建好的网页,直接帮你出场这个项目,这就出场成功了。点上方的文件夹,创建永久工作树。那我还有一个问题,我们的自己创建的永久树跟我直接在下面打开一个窗口,有什么不一样呢?我要回答你, 新窗口会共享代码,工作数是独立运行,再决定要不要合并。先左侧创建两个工作数, 依次打开网页,各自在这输入需求,出现小蓝点,就是任务完成了。来刷新看看效果吧。风格灵感加入了新标签,看看这个新的品牌故事吧。 再回到主项目看看,恭喜你已经学会了多模块处理了。再补充一个最近常用的注试,哪里不会就点哪里,真的超级方便呀! 这里直接提交修改就好了,可又要当甲方爸爸说要用回上一版时啊,这完全不知道咋办了。没事,点右上角的 vs code, 点这里的 get, 在 这找到你要返回的版本,点击 复制提交哈希,回到聊天窗口恢复版本,并粘贴刚刚的哈希,等待执行完成就刷新看看。恭喜你学会了回退版本。

曾经我对 cloud code 的 终端爱不释手,但现在我只能说一句, codex 真香啊,真香! 大家好,我是布鲁。随着 codex 近期频繁的更新,我自己的工作站也已经全面的切换过来了。今天就来分享一下我自己的完整使用经验,怎么用 codex 打造一套不打断心流的生产力闭环。 本期视频我把它分成了七个章节,每一张都是我自己实际在用的技巧,希望能对你有所帮助。那我们话不多说,直接开始 第一张,先来介绍一下我的工作站是怎么布局的。左上方是 codex 的 对话框,下方是 terminal 终端。 你可能会问,已经有 codex 的, 为什么还要开一个 terminal 跑 c c? 因为我发现对于一些需要探索、需要设计的任务, c c 的 表现要更出色一些。所以我的习惯是用 c c 来做方案设计,配合 planning with files 这个 skill, 把设计思路直接落成文件, 然后再让 codex 读这份计划,接手后续的具体实施。这样一来, cloud code 负责想, codex 负责做,两者可以各司其职。 右上方这个区域我用来做任务完成后的查看和审阅,比如代码的 review, 文件的浏览,还有浏览器都在这里。虽然现在浏览器还不支持多标签页,但对于日常的任务来说完全够用。这边我就分享一个实际的案例, 我让 c c 参考了最近很火的这篇卡巴西提出的知识库的文章,让他借鉴里面的思路,出一份设计稿和完整的实施计划。目的呢是做一套前端的页面,方便我日常的维护文档使用。 接着 c c 就 会调用 planning with file 这个技能啊,将所有的计划落成文档,然后我就会回到 colex 这边,让 colex 去阅读当前项目内的这份计划文件,然后基于这份计划文件让他进行开发。开发完结果之后,我会在这边 内置的浏览器里面去进行结果的 review, 包括代码的一个审查,整个过程从设计到开发再到 review, 全都在这一个工作站里面完成,不需要切换任何的窗口,这就是我前面所说的,心流不会被打破。 第二章,批注功能。这个功能是我觉得 codex 真正强大的原因之一,也是最能体现沉浸式开发的地方。 以前我们改代码的方式是找到文件定位到哪一行,描述问题,让 ai 修改,整个过程中你的注意力是在代码上的,但现在 codex 的 批注功能让这件事情变了,你可以直接在文件上进行批注,告诉他哪里怎么改,需要怎么改。 更厉害的是,现在这个批注功能不止限于代码文件,你可以直接在前端页面上进行批注,看到哪个按钮位置不对,哪块布局不满意,直接在页面上标出来, codex 就 能理解你的意图,并帮你进行调整。这件事的意义在于,正好对应了 webcodd 的 核心理念, 开发者的重心不在于怎么写,而在于写出来的东西对不对。批注功能把这个理念落地了。 第三章,上下文管理 codex 项目里可以同时开多个县城,每个县城对应一个任务,互相独立,不干扰。对比 cloud code 需要开多个对话窗口, codex 把所有县城都收在了一个项目下,管理起来会清晰很多, 然后是项目的记忆核心就是 a 键的点 md, 这个文件你可以类比为 cloud md, 把项目的背景、开发规范都写进去, ai 每次进来都会读取,不用反复的交代。 还有一点, codex 的 上下文管理非常省心,它会自动帮你压缩上下文,它也没有提供像 cloud code 中 compact 的 那样的命令,这种事情让 ai 自己处理就好了,你专注于任务本身就行。 第四张,自动化这块是我觉得 codex 比其他 agent 做得更好的地方,几个原因,第一,用起来非常的方便,直接在 gui 里面新建自动化任务,还内置了很多模板可以选择, 大到项目管理技术、眼镜,小到个人的生活习惯,都可以交给它来定期的处理。第二,自动化可以调用 codex 自身的能力,比如插件、 skill、 mcp、 浏览器操作、电脑操作等全都能用进来,这就是为什么我说 codex 在 逐步形成自己的生态。 第三,我们可以根据不同的场景来灵活的选择模型和推理强度,简单的任务用轻量模型,复杂的任务上强推理,这样的话头肯可以用的更加的合理。第四,稳定性,我实测下来, codex 相较于其他的 agent, 定时任务的准确性已经能达到生产级别,相当的靠谱。 第五张插件和技能, codex 有 相当丰富的官方插件和 skill 生态。先说说两者的区别, skill 就是 纯文档,本质是给一份 ai 的 说明书,告诉他在特定场景下应该怎么做事。比如说我前面提到的 planning with files, 就是 一个 skill 插件的概念会更大一些,你可以把它理解为 codex 打补丁,里面可以包含 skill, 也可以带上 mcp 配置,甚至集成其他的 app。 一个插件装下去, codex 就 多一套能力。 另外, codex 在 插件和 skill 的 管理体验上面要比 cloud code 的 友好太多了。 cloud codex 需要改配置文件,而在 codex 里直接在界面上点击安装,或者自己创建,整个过程非常的直观。 第六章浏览器和电脑操作 codex 可以 直接操控浏览器,你可以让它自动填表,抓取数据,验证 ui 效果。 比如我需要批量收集一些网页上的信息,直接告诉 codex 去哪个页面拿什么数据,它就能自己打开浏览器去完成操作,整个过程中都不需要你的介入。除了浏览器, codex 还能直接操作你的电脑文件的整理,应用的打开都可以交给它来处理,相当于有一个助手在帮你操作桌面。 不过这里要说明一点,随着 ai 自动化越来越普及,现在已经有不少软件开始加强安全控制,对自动化操作做了限制,所以实际能操作的范围会因软件而异,遇到限制情况也很正常,大家用的时候留意一下。 第七章通用功能这些功能不是 codex 独有的,很多 agent 都支持,但作为一个完整的工作站,这些基础能力 codex 当然也不会缺少。先说 play mode, 在 执行一个比较复杂的任务之前,先让 codex 把完整的计划列出来,你过一遍觉得方向对了再让他动手, 这个习惯能帮你省掉很多返工的时间,大任务尤其推荐开 play mode。 再说 m c p, 也就是模型上下文协议,通过 m c p 可以 把各种外部的工具和服务接进来,让 q d x 能力边界大幅扩展,无论是连接数据库,调用第三方的 api, 还是接入自己家的服务,配置好之后, q d x 就 能可以直接调用。 另外还有一点, q d x 相较于 logot code 的, 有一个非常关键但很容易被忽视的小功能,语音识别。目前我的任务几乎都是语音发起的,连打字都很少了。 ok 以上就是我在使用扣袋子过程中总结的一些技巧,如果对你有帮助的话,希望能得到你的点赞和关注。 最后我想说一句, ai 发展太快了,各家 a 键的功能越来越趋同,但工具再多,适合自己的才是最好的。有时候做做加法,找到真正需要的,做做减法,去掉用不上的,慢慢摸索出一套自己的工作范式才是最重要的。我是布鲁,我们就下一期再见。

跟着马姐涨知识,今天我们来聊的是让程序员失业的 codex, 先捅破一层窗户纸。这东西不是什么科幻机器人,而是 openai 在 二零二一年推出的代码生成工具,能听懂人话,直接输出可运行代码。 你说帮我做个带专项附加扣除的工资计算器,它几秒就能出一整段能跑的程序。现在国内不少公司已经在日常开发里用上了。 他怎么做到的?核心就是数据喂出来的,研发团队给他灌了黑 tab, 上几十亿行公开代码和配套文档,靠模式匹配加概率统计输出结果就像你背熟了海量满分作文,看到考题不用想逻辑就能套对应段落。 他压根不懂代码背后的逻辑,但猜出来的准确率高到离谱,而且不只是搜索那么简单。他能理解连续上下文。比如你前面写了电商订单列表代码,再说给这个列表去重,他会自动选保留下单顺序的逻辑。 代码出 bug 了,你描述问题,他马上输出修正版,说白了就是把程序员日常写通用功能、复制粘贴的体力活全自动化了。那程序员真要失业吗?答案很明确,只会淘汰只会重复编码的初级程序员,根本碰不到高级工程师的饭碗。 因为 codex 所有输出都基于历史存量代码,碰到需要创新的场景,比如设计全新的高并发系统架构,针对特定人群调整推荐算法。逻辑,他完全摸不着头脑,他只管生成代码,根本不知道输出有没有逻辑漏洞,能不能适配业务需求。 程序员的核心价值是搞懂需求背后的逻辑,知道为什么要这么写, codex 只会照以前大家都这么写。输出本质上就是个升级版效率工具,就像计算器没干掉数学家,反而让专注难题更高效,会用他的人效率翻倍,只会抵触的才真危险。感谢大家点赞关注,感兴趣的主题可以评论区留言。

codex 是 openai 推出的 ai 编程伙伴,可以帮助我们开发功能、修复 bug、 重构代码、做代码审核等。 openai 官方也提到, codex 可以 处理从功能开发到代码 review, 发布相关的工程任务。 但对孩子说,我们不用一上来就讲那么复杂,我们可以把它想象成一个把想法变成作品的 ai 助手。比如说我想做一个数学错题的讲解器,我不会直接说 帮我写代码,这样太空了,我会说,请帮我做一个适合三年级小学生使用的数学错题讲解网页功能包括,学生可以输入一道数学错题 e i 页面,提示学生先分析题目条件, 在引导学生写出题解之后,再举一反三。应用风格要可爱清楚,适合孩子,这就叫任务拆解。这我也给大家进行干货总结。给 codex 写提示词有一个万能的公式,角色加目标加用户,加功能,加风格加输出形 式。比如说角色是,你是一个 ai 编程助手,目标是帮我做一个教学错题分布讲解, 生成类似体,风格是卡通,也要简洁,适合孩子。初初就是做成网页。在 ai 时代,孩子真正要学的不是复制答案,而是把自己的想法讲清楚,因为你讲的越清楚, ai 做出来的作品就越接近你想要的样子。

我给 callix 发了一条命令啊,生成我这篇文章需要的全部图片。不到十分钟,这个文件夹里就已经装满了深深好的图片了。如果说你也需要给文章配图的话,那今天的内容就赶紧的要放进你的收藏夹了。 你写公众号发小红书吗?插图你是怎么做的呢?打开某个生图平台的网页,发送这样的一条提示词,等上几十秒,他吐出来四张照片。小姐姐,挺好看的哈,不过四张图根本他不是一个人本。 那你想的是早上画面呢?明显就是傍晚。今天呢,我们就从零开始,全程都用 callix, 你 用别的大模型也可以哈,配合 obsidian 这个笔记软件,让你的文章配图变成一个固定的工作流。以前两个小时的工作量,以后呢,就是一句话的事,准备好了没?那咱们就直接发车。 今天的工作流呢,主要用到两个工具, callix 和 obsidian。 不要划走啊,不需要懂编程,全程都是说人话,真的是 有手就行。总的逻辑呢是,在 obsidian 里面,你已经写好了一篇 markdown 格式的文章,这个格式呢,是目前公认的 与大模型沟通最好的。我们要做的呢,就是让 codex 来帮你读取文章的内容,分析配合文章需要哪些场景,再让它自己来生成提示词,自己生图,一条龙服务。等你用顺了这套工作流之后呢,麻麻再也不用担心你的出图了。实现这一套流程呢,拢共就是四步,阅读、理解、场景、设计其 词、出图。那咱们就从第一步开始配图。最烦的事呢,就是大模型出图啊,老是抽卡,你要的是早上,出来的是下午,你讲的是夏天,出来的是冬装。花了大力气去改提示词啊,这一轮 ok 了,那下一篇呢,又得重新搞这个呢,是因为你没有积累 图片呢,是要服务于内容的哈,所以说,第一步呢,要从文章开始。这篇文章是讲啥的呀?我们的林芝夏小姐姐五一去了成都见老朋友,这是他的一篇心情日记,自然呢,会有很多的自拍照,美食照,风景照。所以说呢,第一件事是要让大模型 读懂这篇文章。我的提示词是这么写的,注意看哈,提示词里的第一行呢,是把这篇邮寄按给 context, 先体会下文章的内容,人物的关系,时间线和情绪节奏,然后帮我来判断哈,这篇文章如果要配插图的话,需要哪些画面,每张图大概放在什么位置, 要解决什么问题?有没有人物一致性的要求?在同一个文件夹里面新建一份配图项目总控笔记,把你的判断整理进去,并作为我们接下来沟通的参考哈,他仔细的阅读理解了这篇文章,他发现呢,这篇文章是 篇生活化篇心情记录的邮寄。他给我的第一轮判断呢,就是说这篇文章要体现整个旅途的过程,比如说呢,出发前的行李箱,机场,成都接机,景点,餐厅,酒店等等这么一些画面。同时呢,他还提醒我哈, 这种游记里面的人物会多次的出现,所以说人物一致性的问题要考虑到。而且他认为啊,我说的建一份项目总控笔记是很有必要的,这份笔记呢,会作为整套配图工作的说明书,当然哈, 你自己甚至啊都不需要读,这本来也是给大模型看的。这个呢,就是我喜欢用 codex 配合 obsidian 的 原因了哈,它不是只在对话框里给你一段回答, 他会真的进入你的笔记库,把这些判断写成一份可以持续迭代的文件。当然呢,第一轮哈,往往不会特别的满意。那我会继续的追问他了, 你刚才的这些场景是不是有点像旅行相册了呀?公众号里面真的需要这么多的图吗?他会重新的收敛一遍,把那些指示好看但不服务于正文的画面给删掉。而且呢,还让他加上了一些画面中不要出现的东西, 比如说不要冬装,不要过度精修,不要把串串化成了高档火锅等等吧。这几轮来回之后啊,项目总共笔记才算是能用了。 这个过程呢,重点不是哪一句提示词最重要,重点呢,是要让你让大模型先读懂文章,再让他给你一个判断,然后呢,继续追问,收敛不约束,这个呢,才像是真的在干活。大模型读懂了你的文章,我们的总控笔记就写好了,现在就到了第二步了。场景设计 这里要包括两块了,一个是人物,一个是场景。人物当然很重要哈,你成都你就玩一天,逛街的时候你不可能换几套衣服几套发型吧,场景呢,也是一样的哈,必须得符合实际的情况。 五一是夏天吗?你就不能穿着羽绒服吧,吃的是串串,你画面就不能搞成了川菜?而我们先说人物,如果是一个正规的作品啊,人物会非常的讲究,需要在开始之前呢,就要确认全部的人设,包括年龄、发型、穿搭、脸部气质、拍摄风格、常见表情,不要出现的画面 等等等等。比如说,我就不希望主角变成网红锥子脸或者是广告模特的样子,他应该就像你身边的一个真实的人。照片呢,像是手机随手拍出来的。 我就这么跟 callix 讲了哈。读取这篇邮寄和项目总共这两份笔记。这个时候你先不要写具体的场景题词,新建一份人物一致性备忘录,用来约束后续所有的人物出镜图片。这份备忘录要包括 主角灵芝下的人物特征、穿搭、发型、拍摄风格、禁止出现的风格,以及配角阿乔的基础特征。请特别注意,这个不是人物小传,不要给我搞什么文学化的描述, 我要的是直接可以给深图模型使用的视觉信息。最后呢,请给出主角和配角的标准照,三式图,深沉建议,方便后面做图深图的参考。很快啊, codex 生成了这一篇备忘录。这份笔记啊,清楚的写到了主角大概二十八岁,黑色中长发, 米白色轻薄外套,浅蓝牛仔裤,真实手机摄影,自然光,生活化构图,不要澎湃,不要商业广告感。更重要的是啊,他会写清楚后面凡是林芝下本人出镜的图片,都要参考这张标准图。由于文章里还有一位配角阿乔哈, codex 还很贴心的把 阿乔的特征也写到了这一份备忘录里。注意哈,不要让大模型写什么美女啊,氛围感呐,高级感啊,这样的一些词,听起来高大上,但是对生图模型来说呀,非常容易跑偏, 他可能就会把人物往什么影楼大片的方向去带。显然呢,不符合邻家小姐姐的人设了。咱们要的是能执行的信息,能量化的信息才是稳定性的来源。 人设定了,咱们就要考虑场景了,与人物设计类似哈,还是跟 context 先沟通,确认这篇文章需要多少个关键画面,每个画面放在哪里?每个画面服务正文的哪一个段落 的提示词是这么写的,请继续的读这么一篇邮寄和总控笔记和人物一致性备忘录。现在需要你帮我新建一份配图场景清单,不要写生图提示词。这一步呢,咱们只做场景设计,每个场景要包含编号、对应正文的位置、 图片的用途,是否有人物出镜、生成方式,必须出现的元素,禁止出现的元素,建议的文件名等等等等。请控制图片数量,不要每一段都给我配图公众号,它不是相册啊。图片是要服务于阅读节奏的,很快啊。 copy 生成了一份配图场景清单 笔记清单会很细,像图的编号,正文的位置、画面用途、生成方式,必须出现什么建议文件名等等。 比如说机场图要体现出发和疲惫。茶馆图呢,要体现成都的小巷和下午的自然。光吃串串的时候呢,就要像玉林路边的小店,你不能搞成什么高级餐厅了,我们来简单的盘点一下哈。到这呢,除了刚才林志祥的邮寄之外啊, 我们一共有了三份笔记了,分别用来让大模型知道文章讲什么,主角长什么样,每张图应该怎么服务于正文?你看哈,我说不难吧,全程呢,没有一点需要,你在 obsidian 里面写东西的时候更没有什么编程,都是自然语言,跟 context 讲就行了。对了哈,如果你不喜欢打字的话呢, 试试 typeface, 谁用谁知道。 ok, 到这呢,咱们才可以开始准备正式的写题词了。 虽然还没有开始写提示词啊,但是我们出图的工作已经完成了一大部分了,上面的所有一切是写好提示词的。提示词 如果一开始就用大模型来写二十条提示词哈,他会写的很热闹,但是大概率啊,伸出来图片你都用不了,因为他并没有想清楚一样的办法。我在 callix 的 对括号里头按他的那几份刚才的笔记,我让他根据要求准备开始生成正式的提示词。我是这么说的, 请读取配图项目总控、人物一致性备忘录和场景清单。现在呢,你 需要新建一份提示词物料包。注意哈,这份笔记不是直接拿去批量出图的正式版,它是一个准备稿结构呢,分成三个部分。第一个部分是写全区,要求包括画面风格、照片质感、比例、色彩真实、手机摄影不要澎湃不, 不要商业广告感,不要过度磨皮,不要让人物换衣服。第二个部分呢,写人物的原型提示词主角长什么样,生成一个标准照和三式图。这一步呢,只做人,不做场景, 因为后面所有的人物出境图都要参考这些原型。第三部分呢,是每个具体场景的提示词,每个场景必须保留编号正文的提示词和输出文件名等等。如果是图生图的话呢, 而且场景变化和动作就不需要在每一条里面反复的长篇描述人物是谁了,人物信息呢,是会放在局要求里,通过标准照路径来引用。你看哈,这些提示词咱们讲的非常的详细啊,你不把任务拆清楚, 大模型就会把所有东西混在一起,越写上下文越乱。所以说呢,提示词物料包必须要包括两层,上层呢是大局要求管统一风格的,下层呢是具体的要求人物原型,管一致性,具体场景呢,管每一张图该干什么, 两层三个东西不要搅到了一起来。我们先看人物原型图哈,如果有问题呢,你就持续让他改 定下来之后啊,咱们就应该先生成主角和配角的人物原型图了,这些是一会正式的图生图的参考物料,很简单哈,你让 codex 按照人物原型的要求 生成两个人物的三式图,就这么一句话。这个呢,就是林芝夏和阿乔的原型图了,人物的发型、衣服、年龄感基本上比较稳定,这个角度来看呢, 认得出是同一个人。等到主角配角的原型图都定稿之后啊,咱们提示词的部分就可以进入最后一步了,我要让 codex 生成一份提示词正视版。这一份正视版呢,要非常的干净,不要保留前面那些讨论的过程, 只保留全剧要求和每一个场景的具体提示词。说白了哈,这份东西呢,才是最终给 image 二点零看的,他就会直接照着他出图了,他读到的是执行文件, 是一份聊天记录。恭喜哈,提示词咱们终于写完了,有没有发现大模型有时候是很笨的哈,他不是一句话就能拿到结果,没有关系啊,他又不会累,又不会生气,达不到要求的时候呢,咱们就跟他多拉扯几轮,总会得到你想要的结果。 到这哈,我们已经完成了百分之九十五以上的工作了。 codex 现在本来就可以直接驱动 emoji 二点零这个最近特别火的 open 的 香蕉刚出道的时候啊, 还要火爆。只要你的提示词写的足够的好,出图就不用操心了。这条视频呢,是我们专门对他做过的一个测评,有兴趣的小伙伴呢可以去看一看哈。 磨刀不误砍柴工,平时出图不满意啊,就是没有花什么心思磨刀。好了,我把提示词的正式版笔记艾特给了高黛斯,来帮我按照这条笔记中的提示词,用你的 emg 二点零大模型生成全部场景的图片。就是这么简单,你的大局要求里面有整体风格的要求, 有人物原型图的存放路径,不管是图身图还是纹身图,每一个画面都有非常详细的要求,这样的话,大模型就不会出错了。图片不少,可以伸个懒腰,咱休息一下哈。不一会呢,你在聊天记录里面和出图的文件夹里头就可以看到这些深沉的图片了,有没有成就感啊? 检查一下哈,大部分的图片都是可用的,偶尔呢可能出现几张不太满意的。没关系啊,咱笔记里不是有编号吗?还是很简单,你就这么说哈, a 零三, a 零九 b 幺五,咱不满意重 新生成。这个时候呢,不用你重新描述一遍那张插管图,还是那张机场图,直接讲编号就完事了。 gmail 会回到那份提示词笔记,按照原来的要求重新来跑对应的图片。这个就是为什么前面要把任务拆清楚,你前面拆的越清楚,后面的反攻呢,就会越轻松。 感谢你能看到这里啊,真的很简单哈,只要你的逻辑清晰一点,完全可以自己来搭这套系统。只要把文章准备好,他就可以帮你拆场景,写题词, 生成图片,按编号返工。公众号配图啊,小红书图文呢,产品体验文章啊,都用得上。或者是做 ppt 封面,课程配图,视频分镜等等啊,都可以。当你能够把你的全部的任务拆解清楚,用一种管件式的方式来跟大模型来写作。把你的判断放进笔记, 大模型就能沿着你的判断来干活。它不再是临时给你一个结果了,而是参与了一整条的生产线。当然哈,可以把这些流程整理成可以附用的 skill, 不知道你有没有兴趣哈。好了,希望今天内容呢,能够真正的帮到你。这期里面所有的提示词文档,我都会打包好,评论区自取。