excel 让你的 cloud code, codex token 消耗量减少百分之六十五,这个 github 上面五十五 k 的 一个项目,就是这个 qman, 这什么意思?这个这个项目做了什么呢?他说他把你的普通的上下文的书,对话的文本做了一个极致的压缩,它是怎么压缩?类似于 现在的简体中文,他给压缩成文言文,你可以这样去理解,你看他举的举的这个例子,你看这个是那个 u i 渲染的这个例子,你看这个英文非常长,是不是?中文也很长,但是他压缩完之后,用文言文之后,竟然是你看悟出新参照致重会, 这个英文也是一句话,这个很有意思哎,这个作者是一个外国人,他竟然支持了文言文,而且他这个 文言文竟然还有三个模式,有那个我看一下好像有那个,你看这个文言文这个经典版,你的不要压缩太多这种, 还有全版,还有凹凸版本,就是极致压缩那种。但这个场景,比如说你要是那个做深度研究,做分析,很多的那种文本多轮对话的,你编成是不是你用可拉扣的,你肯定会不停的修改你的提示,是不是?这个就很非常完全适合?但是如果你是简单的一轮对话,两轮对话,这种 其实就没什么意义。想想你,因为你是你一轮对话,你要把你的文本发给 ar, ar, 然后把它转为文言文,文言文再得到处理完结果之后,再把文言文再转成白话文,再转给你,这一过程相当于多做了一次转换,是不是? 所以说你单词对话的话肯定不合适,但是你多次对话,这种有多轮对话这种场景,这个是非常非常好用的, ok。
粉丝1224获赞8811

codex 使用中如何节省 token? 一个任务开一个县城,不要一个项目长期用同一个巨长县城, 县城变长时用 compact, 官方说明 compact 会把可现对话总结以释放 token。 codex 也会自动压缩对话,但长任务里主动用更稳。把长期规则放进 agent dm do a skill 不要每次 point 都重复贴一大段。 官方建议 agent 点 md 自动加载进上下文 prompt, 并强调短而准更有用。重复流程应做成 skill。 agent 点 md 要短, 官方明确说短准确的 id 比长篇模糊规则更有用。太大时把专项规则拆到任务文档 skill references 里,按需读取。 大仓库里明确指向文件目录 chronicle a goal context constraints 当问并点名相关文件,能减少 codex 大 范围搜索读无关文件的头衔。 大量工具或外部信下博不要全塞 post。 官方建议用 m c p host tools to search, 把外部信息作为工具按需取,而不是复制粘贴进上下文。

现在 code 可以 直接使用 dc v 四了, code 确实好用,但是额度真的是不经烧,随便几个问题直接就清空了,又得等五个小时。所以我试着把 dc v 四接进去,烧了四 e token 之后,发现操作竟然很丝滑,体验也完全不输原版,关键是真的大碗便宜, 后面我会带你一步步接好。其实步骤是非常简单的,就三样东西, c c 叉, d c 的 a p i, 还有 c c switch, 而且工具我都已经整理好,你照着我这几部点,基本几分钟就可以搞定。 解压后先打开 c c 叉的文档,然后打开 emv 文件,里面会有一个密钥,这里你可以保持默认,也可以自己去修改一个。改完之后记得先保存,然后启动 c c 叉,它会弹出一个终端,你找到这个管理界面的地址, 然后按住 ctrl 键再点击,就会来到这个页面。进去之后把刚才 e v m 里面的密钥粘进去,就能够进入到后台,这里你可以顺手切成中文就行,这部分就基本搞定了。接下来我们去到 d c 的 官网,点击 api 开发平台,第一次进来得先注册一下,然后点击左边的 api key, 新建一个 key, 名字可以随便填。创建完记得先保存好,因为它只会显示一次。然后回到 c c 叉上面,选择 code, 中间点击添加频道,这里就可以直接把这个文档粘进去。最下面把刚才复制的 a p i 粘进去,创建就算成功了。记得顺手做两个设置,一个是选一下 openchain, 另外一个是把规范化,非常健 打开。这一步搞定, d c 其实已经接近来了,然后打开 cc switch, 点击上面的这个标志,右边新增一个配置,具体的参数你可以按照这个来就好。这里有三点是需要注意一下, 首先,这里的 api key 不是 d c 的 那个,是一开始 emv 里面的那个密钥。第二点,点击一下这个获取模型列表,就不用自己手动去填写了。第三点,把 e m 上下文窗口勾上,这样子才能全力去跑,下面这些都不用管,填完之后直接点击保存, 然后点击启动,最后把 codex 安装或重启一下,到了这一步就已经接好了。打开之后, codex 这里不是显示 d c, 它只会显示自定义。别慌,这个时候你随便发一句话,先试试能不能是正常使用。然后直接去看看 cc switch 的 使用记录,你会看到模型这一栏已经变成了 d c v 四 pro, 来源是 codex, 那 说明已经是链接成功了,也就是说后台真正在跑的已经是 deepsea 了。最后我补两个词,已踩过的坑。第一个坑是 cc switch 最新的版本,现在有 bug 会连不上 codex, 所以 别手痒去更新,直接用包里面的版本就行。 第二个坑是 d c v 四没有视觉能力,所以一旦你平时有看图识图这类型的需求,进来之后可能会有部分的能力用不上。不过好消息是这套流程本身是通用的,你可以直接换成其他的多模态模型,思路也是一样的。我是木马,陪你一起玩 air 赛博达子,咱们下期见,拜拜!

你们有没有发现, cloud 最近封号是越来越狠了,不过我两个账号没了之后,发现了一套比 cloud code 还要顺手的工作流。今天我就来跟大家分享一下我实战了整整两个月得出来的干货经验。很多人来问我, cloud code 到底值不值得用, 封号风险这么高,但是不上车会不会落后?坦诚来讲啊, cloud code 确实是好用的,但我每次想起我那两个被封的账号,再加上动不动头肯就消耗殆尽,让我坐着干等几个小时,热情就去了一半了。 所以我换了一套玩法,是 cloud chat 加上 codex, 我 有两个工具,各干各自擅长的事情,因为 cloud chat 要比 c c 的 使用门槛要低非常多。然后呢,又可以用到 cloud 的 最新模型。流程很简单啊,我一般都是有一个需求,或者有个项目需要开发的时候,我都是用 cloud chat 去把我的需求梳理清楚,并且输出一份 p r d, 再让他直接用 html 把前端的页面给搭建出来。 web、 ios 小 程序都可以这么去做, cloud 在 审美这一步上真的是拉满的。那页面做好了呢?我就会把前端的代码和 p r d 一 起都下载下来,丢进一个本地的文件夹里,然后带着这些图纸去找 codex, 告诉他我要做什么, 然后让他参考着这些东西来做前后端的开发。而且你也可以直接让他帮你做部署。我写了一个快速把系统部署到腾讯云上的 skill, 基本就可以实现一键部署。 如果你是要开发小程序呢,你就要去下载一个微信开发者工具。如果你要开发 ios 应用,你就要下载一个 xcode, 你 不需要像以前那样在这两个工具上去做编程,所有都只需要在 codex 上去提需求。那这两个工具呢?都只是用来看 ai 开发的效果和测试用的 codex 的 审美啊,真的确实是非常一般,直接让它来见网页,见页面 就像是一个报告,密密麻麻的文字堆成一坨,毫无设计感可言。但我觉得充一个 pro 会员基本就可以无限跑,同时开发两三个系统 一天也会够用,性价比真的拉满。现在很多人会有感觉不用 cc 就 好像会被鄙视,但其实工具焦虑真的没必要,找对配合方式,用趁手舒适的工具才能发挥出最高效率。好啦,那今天的分享就到这里啦,我是雷子,我会经常分享 ai 呀,创 ai 呀相关的所思所想,希望可以给你带来一些启发,拜拜。

如果你有订阅 coding plan, 并且每天 token 的 消耗量巨大的话,你肯定遇到过这个问题。当你用 cloud code 把一个项目好不容易推进到一半的时候,突然触发限额了,那此时要么选择去休息五个小时,等它额度刷新,要么就切换到其他的 a 阵继续推进这个项目。 但是不同 a 阵之间的 session 状态是不互通的,比如你没有办法在 codex 里面直接用 resume 的 命令去继续一段刚才 cloud code 的 这个状态,就像你没有办法在 deepstack 里面去继续一段你跟豆包或者跟 gbt 之前的对话。 我遇到这个问题的时候,就觉得这个问题肯定有人解决过,于是我去看了一圈网上的所有项目,但是看完之后我发现了一个更大的问题。现在所有去尝试解决这种多 a 阵子上下文共享的解决方案, 都是从记忆管理的方式出发的,没有人是从状态管理的方式出发去解决这个多 a 阵子上下文共享的问题。 为什么我要特别说这种从记忆管理的方式出发的解决方案解决不了这个事呢?因为我试了一下,比如说像曼木林莱塔这种做共享记忆的,他们做的都是同一件事情, 就是把你之前做过的这些项目,或者你正在做的项目写成招标存到知识库里面。比如你做过的这个项目,他是什么项目,目标他分成哪些阶段,之前做到哪一步了,下一步是什么,踩过什么坑之类的。 当你开了一个新 session, 或者你接入一个新 agent 的 时候,在你开始跟这个 agent 正式讨论项目之前, 他们会先 rank 一下,把之前关于这个项目的记忆给这个 agent brief 一 遍,相当于就省掉了你每次在新 session 里还要先跟 agent 聊这个项目背景时间,但是这种程度的 brief, 它能解决多大的问题呢? 我观察下来,感觉没有什么太大用处,因为可以从一个很普遍的矛盾现象开始说起。 就是在 ai 行业,当大家去聊 point 定的时候,我们嘴上都说肯定要做状态外化,要把 a 证当做无状态机来管理项目,但是你看实际在用 a 证子的这些工程师,其实没有人是这么干的。我观察下来, 我们团队的工程师,大家都是非常主动的,手动的在管理这些 sessions, 一个 session 做一个项目,什么时候要 branch 去做不同的方案,什么时候要 rewind 去去掉一些之前污染掉的上层文,这些都是在手动管理状态,而不是在 用一个更本质的或者更普遍的记忆管理的方式去修改。那说明记忆管理在这个场景下起不了作用,大家都还是依赖于状态管理的。那什么是状态管理呢?用一句话来说两者的差别。 如果说记忆管理是让 a 正更好的回忆过去,那状态管理就是直接让 a 正回到过去了。听起来只有一字之差,但实际上他们两个是完全不一样的。 如果以人类同事之间的写作来打个比方的话,那就是这样,假设你有一个同事要离职, 需要你去接手这个同事的项目。按照第一种记忆管理的这个逻辑呢,就是让这个同事先写一份非常详细的项目交接文档, 为了高效的交接,这种文档通常会很精简,他只会把最主要的,比如说这个项目的目标,计划这些东西给写下来。但是一个项目的计划,他通常会经历很多轮的讨论和修改才定下来, 而你却看不到这些修改。你在项目交接书上通常只能看到最终定稿的这个方案,所以你是不知道他写下这个计划的 context 有 什么的。 而第二种方式就是状态管理的方式,这个思路就有点像是在打游戏,相当于让你的同事在离职之前,把自己的状态和整个游戏状态都存个档, 当你去交接的时候,你直接点击继续游戏,你去读了他的存档,你切换到你带入到了他的角色之后,就自动继承了他的所有项目记忆,那你直接往下打这个游戏,直接往下推进这个项目就行了,也不需要去写和读什么项目交接文档。 当然在现实世界里,人类之间肯定是只能通过文档的方式来写作和管理的。但是对于 agent 来说,用第二种方式,用这种直接让一个 agent 共享自己的游戏存档给另外一个 agent 的 方式却是完全可行的。 说到这个,我也做了一个能让 cloud code, codex 这些 agent 之间无缝共享它们状态和 session 的 一个产品,叫做 oppo bridge, 可以 直接在 tapp 上面找到。那说这些你可能会觉得像共享状态,它是不是明显听上去就要比 共享记忆来的更好?其实也不完全是,虽然状态共享能够直接让你带入角色,带入所有的记忆,但是他有一个问题,就是他会把一些不必要甚至是有负面作用的污染了的上下文也带进来。比如你在读入你 同事的存档那天,你同事当天可能因为股票亏钱了,所以花了很多心思去想股票为什么亏钱,那你就会把他关于自己股票亏钱的这些记忆也继承过来。而这些记忆的上下文对于你推进这个项目来说,却是没有任何帮助,甚至是占用了你很多上下文空间。 想到这一步,咱们其实就已经在讨论一个更深刻的问题了,就是共享记忆和共享状态长期来说他们应该是一样的。 换句话说,只要你那个离职的同事他足够能写,并且你的阅读理解能力足够强,那完全可以让你那个同事给你写一个 一千万页的交接文档,然后你快速读完,读完了之后你就可以极高的颗粒度去复现他推进项目的状态,那其实就和直接去读他的这个游戏存档也没有什么太大差别了,甚至这样效果会更好,因为 他不会把他的那些糟心事都写到这个文档里面来,那你的上下文就不会被污染掉。所以现在我们觉得 工程师去主动管理这些筛选状态和去同一个外部记忆来协调 agent 的 上下文,是在做两件不同的事, 但是本质上他们是在以两种不同的侧重点来解决同一个问题,就是怎么样给 agent 最合适的上下文,让他去完成任务。 all right? 我是 b a 七,欢迎关注我的 ai 创业日记, have a good one。

codex 大家应该都用上了吧,但是它的缺点就是额度太少了,完全不够用,而且它的头款实在是太贵了。那一种解决方式就是把咱们自己比较便宜的一些模型借进去,比如说 bitcoin, 咱们需要 c c 叉, c c switch 以及 bitcoin 的 api k。 首先我们在 bitcoin 点击 api 开放平台 api case, 创建 api k, 这个 k 一定要保存好。然后我们搜索 c c 叉, 点击这个,在下面找到适合自己的版本,我下载的是 windows 版本,然后搜索 cc switch, 点击下载,在这个界面一直往下翻,找到适合自己的版本,我仍然下载的是 windows 版本,然后安装 在 c c 叉文件夹下,我们新建一个 text 文件,命名为点 e n v, 把这些内容填进去。 k 就是 你设置的登录密码,我这里设置一二三四五六,然后重命名,把点 txt 删掉,运行 c c 叉,这个时候会弹出终端,复制这个 local host 地址,到浏览器打开点,点击 contacts, 选择添加渠道。在这里可以打开 delete 官网找到调用 api, 复制 c u r l, 把这一行改成 api k, 填写你自己的 delete 的 k, 选择详细配置。我们要选择 open ai chat 模式,继续往下翻,把这两个按钮打开,然后就可以了。现在我们在 c c switch 点击 codex 图标,再点击右上角的加号,供应商名称可以随便写。 api k 是 你在 c c x 的 点 e n v 文件里设置的登录密码,我的是一二三四五六 api 请求地址填写这个,点击获取模型列表,可以看到 deepsea 模型了,选择即可。然后我们点击测试模型,如果正常,说明已经配置好了, 我们重启 codex, 选择其他方式登录。这里的 k 也是你在点 e、 n、 v 文件里设置的登录密码,比如我的是一二三四五六,然后就可以了,现在 codex 里面的模型已经是 zip 了。

一行命令直接让你暴省几万块! apple coding 的 时候, top 是 不是烧的飞起?于是聪明的你给小龙虾丢了这样一个命令,紧接着你会发现, a 证的工具调用直接砍掉了百分之九十六, top 直接省了九成!你省的不是数字,而是实打实的饭钱! 而且不管你用的是 tree 还是 coser 还是 cloud, code 还是 code 叉,它全都能用!装一次可以持续帮你省钱!这波格局直接拉满!记得点赞收藏评论区扣一看,看你的 ai 能帮你省多少钱!

我最近又把主力从 codex 换回到了 cloud code, 不是 codex 不好用, codex 现在双倍额度用下来确实更便宜, 而且大部分普通需求他都能做,但是我真的受不了,就是那百分之五的难题,就是你项目里突然遇到一个卡壳的问题,就是扣贷是解决不了那百分之五的问题,你刚开始并没有反应过来,你跟他反复交互, 过了半天一天你才反应过来,我靠,他就是解决不了,这个时候你就发现你时间就浪费了,然后你算上这种浪费的时间,浪费了偷啃他就显得并没有更便宜。 最关键是你遇到这种他反复都解决不了的时候,你会很痛苦,一直人不断的引导他,你去看一下最近改动了些什么,地府上有什么差异,日子上有什么打,怎么去打底, bug 怎么去用,一吐一调是不断的去引导他, 但是他即便是这样子,他有的时候还是很困难才能把这问题解决。但是相同问题我换回 cloud code, 我, 我只要简单引导一下他,大概率能够很快解决。

最近干货让 deepstack 为 callex 打工, tockin 节约百分之五十。嗯,我手搓了一个工具,让 gpt 五点五能指导 deepstack 工作,把我的 tockin 消耗降低了百分之五十,把性价比拉满。 deepstack 桌面版就是今天最好的 ai 生产的工具,但它缺点有两个,一是订阅太贵,二是 gpt 五点五的额度太废。而 deepstack 又是一线模型中价格最便宜的,让 gpt 当大毛, deepstack 干活才是最完美的组合。 但 deepsea 是 需要接入可捞的扣子让他干活,然后把它包装成 mcp 给 callix 调用。我写好的 mcp 已经开源可用啊,大家可以直接跟 callix 说让他装上啊。这个 mcp 的 核心价值呢,有以下几点。 这个 m c p 本身我就是用 codex 桌面版开发的啊,开发过程很简单,可以说有手就行。如果你希望做一个这样的 m c p 的 话,可以把下面这些话发给 codex 桌面版 啊。注意,这样做出来的只是一个基础版啊,甚至不一定省 tokyo, 你 要一边用一边跟 codex 对 话来解决各种问题啊,最终肯定是能迭代出一个跟我一样甚至更好的版本,大家都可以试一下。

各位,今天咱们直奔主题,聊聊最近 ai 编程圈里一个极其让人抓狂的痛点。你用 cloud 或 cursor 写代码时,是不是总觉得 token 简直像纸一样烧得飞快?因为咱们总习惯一上来直接把整个大项目甩给 ai, 然后眼巴巴看着鱼儿狂飙红灯。 这时候, ai 只能像无头苍蝇一样疯狂 grab read, 到处忙搜几十个底层文件,看着是不是特努力。其实呢,这纯粹是叫当冤大头,白白浪费你那昂贵的 token。 最惨的是什么?他一顿操作猛如虎,结果找错上下文,还偏偏漏掉最核心的文件。讲真,这就好比你让 ai 蒙着眼在书堆里瞎翻,却死活不给他一本精准的目录。 不过别慌,最近 github 上火出圈的神器 code graph 直接先发了这种低效玩法,他的思路绝了,不硬逼 ai 变聪明,而是提前给你的代码建个超强的知识图谱。说白了,就是把项目里谁调用谁文件,怎么依赖逻辑,入口在哪,提前给你全摸透。 这么一来,现在 ai 准备动手改代码时,第一件事就是先去查找这张全景图谱,真的是零弯路,直接命中目标代码。 所以,敲黑板了,以后用 ai 改 bug, 千万别一上来就傻乎乎的说帮我修改这个项目,听我的,强制他分三步走,第一步,必须让他先准确揪出所有核心文件。 接着第二步,死死盯住他,让他把代码上下游的调用关系全部理得清清楚楚。最后第三步,强迫他明确判断出这道代码改下去,究竟会牵扯影响到哪些地方。发现没?这种稳扎稳打的套路,才是真正在 ai 时代攘住钱包狂生偷看的绝对王道。 所以记住喽,省 tokyo 的 精髓真不是让你少用 ai, 而是决不让 ai 瞎跑走弯路。那么问题来了,你的 ai 还在代码库里猛眼狂奔吗?还是说你现在就打算塞给他一张地图?

用 ai 编程,爽是爽,就是账单看着心疼。每次问个小 bug, ai 都要先给你写一大段客套话。今天介绍这个六万星标的神器,教你如何从大模型嘴里抢回美金。 caveman 这个插件的逻辑简单粗暴,强制 ai 用原始人的方式说话,没有废话,没有寒暄,只说核心逻辑和代码,直接砍掉,大量偷肯消耗。 他甚至内置了文言文模式,利用汉字极高的信息密度,把百字解析压缩成一句话,省钱省到有点离谱。如果你是高频使用自动化工具的极客,或者公司内部跑了几百个 a, 整这个插件,一周就能帮你省下非常可观的 api 费用。 他不只是一个梗,而是一套完整的提效工具链,完全免费,一行命令就能装到你的开发环境里。 ai 时代,真正昂贵的不是模型本身,而是每一次被废话浪费掉的上下文等待时间和推理预算。赶紧把这个神仙插件装上,把省下来的 api 费用拿去喝杯咖啡吧!我是带你每天半小时看透前沿 ai 的 酋长 andy 下课!

啊,我跟你讲,前几天我看了一下我的账单,吓了我一大跳,就是我的 agent, 现在已经单个的 agent 模型已经花了我大几千刀了,然后我看到这个数字我就绷不住了,我在想说,哇,我的,我做的项目已经现在非常非常受我的偷看了,应该怎么办呢?然后我去 github 上找了一个项目叫 call 外卖, 这个项目翻译过来叫做学居人。那我去研究了一下这个项目,这个 skill 啊,这个 skill 挺有意思的,就是它的创作者是让我们用 让你的 agent 去用学巨人一样的方式跟你去说话,去跟你聊天,然后完成你的任务。他不再会说一些非常客套的话,因为每一个客套的话他认为都是没有用的嘛。那我去试了一下这个项目, 呃,现在感觉还不错,好像我的 token 是 被大大的降低了,因为他的这个介绍里面有讲说他大概会省降你百分之六十到百分之八十的 token。 啊,这个数字应该不是非常的 呃,严谨,但是我相信他一定会给我省下一些 token 的。 然后,嗯,现在 a 阵的这个赛道里面有很多人做一些好用好玩的 skill 啊,确实能帮助我们开发者来去去解决一些 token 消耗的问题,那我觉得这是一个比较好的 skill, 那 今天分享给大家。

新版 codex 通过 c c switch 切换成 deepsea 还在摸索中,但切换本地大模型已经搞定了,我来一步一步细讲一下。首先在 c c switch 中新增一个供应商 api key, 随便填 api 请求地址写本地的就行,别忘加微一,点击获取模型列表,选择即可保存后点使用,然后重启 codex 看顺利调用本地大模型,再不担心 token 费用了,来创建个 html 文件还可以吧。有疑问评论区留言。

你是不是也希望你的 ai 编程助手像开了挂一样,一次陪你干完整个项目?代码不断,思路不断,结果呢?现实直接一记重锤,一个 get status 可能吃掉上千 token。 一 次 cargo test 几千 token 没了,一个大嘀嘀嘀,直接把上下文塞满。 ai 还没写几行就开始失意跑偏,胡言乱语。需求忘了, bug 忘了,刚改过的文件也忘了。你以为 ai 变笨了?不是你未给他的废话太多了, 成功日制重复输出无关信息, ai 根本不需要看,但它每读一行都在烧 token。 token 你 就理解成 ai 的 阅读额度。额度被废话吃光, ai 就 撑不住。现在 r t k 来了。 r t k 全名 rust token killer, 它不是新模型,也不是代码生成神器, 他就干一件事,命令输出交给 ai, 钱先看废话,重复的合并,没用的压缩,关键报错失败原因,文件变化留下。官方说,常见开发命令能减少百分之六十到百分之九十的 token 消耗。 get cargo p test, grab, alice find 这些常用命令都能精简, quick code, cursor, winsole, gemini c i codex 都能接。装好之后, ai 不 再看满屏垃圾日制,他只看浓缩后的重点, 绘画更长,上下文更干净,成本更低。记住一句话,别急着换模型,先别让你的 a r 被 token 活活憋死!

众所周知啊, codex 有 很强的电脑控制能力和浏览器控制力,而且它还有谷歌浏览器的插件,那么支持度来说是拉满的,那么我们可以用它来做什么呢?答案就是 set token。 具体怎么做呢?首先啊,我以我的项目为例啊,现在呢项目需要大概生成四十个左右的分镜头时,需要去阅读剧本,还有文案, 还有这么多的文件都要统一分析,所以我就耍了个小聪明,我让 codex 打开 deepsafe 的 官网, 用专家模式来统一分析我所有需要分析的文稿文案、剧本。同时呢,让 deepsafe pro 我 们拆分分镜,能看到这个分镜, deepsafe 拆分的非常不错, 总体来说方法还是挺好玩的,我觉得主打一个互联网上没有一个真人,现在呢,他就会去网站上把 d p c 生成的结果完完全全的抓出来,这样我们节省 token 的 目的就达到了。怎么样,学会了吗?

如果你每天都在用 codex, 真正麻烦的不是花了多少 cking, 而是很难知道这些 tiroki 到底花到哪里了。 codex scope 做的事很窄,扫描你本机的 codex 绘画预制,然后生成一个可以直接打开的本地用量面板。 它不是一个 a c s, 也不需要账号接入页面是静态 html 页面,真实数据指导出到本地的 data j s 和 data roi j s 默认不会提交到 git 面板。最先解决的是可见性 curl 趋势调用分布、绘画排行、模型排行、额度、风险和费用估算都放在同一个界面里。 你可以快速判断 curl 什么时候涨得最快,哪个项目最好,哪个模型占比最高,以及什么时候接近额度压力。 数据流也很透明。 codex 把绘画日记写到本地 sessions 目录生成器,只提取用量元数据,再交给浏览器渲染。 dashboard 隐私边界是它最重要的设计之一。它会导出绘画 id、 目录名、模型名、 t o 梗数量和 read limit 原数据, 但它不会导出提示词就手回复工具输出或文件内容,也就是说它看用量不搬走对话内容, 普通用户不用自己编辑去 git up readies 下载 macos 或 windows 平台包,解压后双击启动脚本就能打开真实用量面板。 所以 codex scope 的 价值不是做一个复杂平台,而是把你本季已有的 codex 用量数据变成一个可信清量、能马上打开的观察窗口。

如果你经常让 cloud、 code cursor 或 codex 去理解一个陌生代码库,最耗时间的往往不是写代码,而是探索代码。 ergent 会不停地 grab、 glob read 文件,先找入口,再找调用链,最后才开始真正解决问题。 code graph 这个开源项目,解决的就是 ai 编码工具的代码探索成本。从产品经理角度看,它抓住的是一个非常具体的痛点,大模型并不缺推理能力,缺的是低成本、结构化可查询的项目地图。没有地图时, ergent 只能边走边看, 工具调用多,上下文膨胀快,项目越大,浪费越明显。 code graph 的 定位不是普通权威搜索,而是一个预缩影的代码知识图谱。它把函数类方法导入关系、调用关系、继承关系和路由关系提前抽出来, 放进本地缩影里。这样 urgent 的 问问题时,可以先查图谱,而不是从零扫文件。他的工作流很清楚,先在项目里运行初识化。 code graph 会用 tree sitter 解析源代码,抽取符号和边,再写入本地 sqlite 数据库, 之后通过 m c p server 暴露搜索上下文、调用方、背调用方、影响分析和文件结构这些工具项目说明文档里给了一组很直观的精准测试。它在七个真实开源代码库上对比有 code graph 时,平均成本降低百分之三十五, top 减少百分之五十九,速度提升百分之四十九,工具调用减少百分之七十。对大型仓库来说,这个价值非常直接。 产品能力上,它最值得看的是三点,第一, smart context 可以 一次返回入口相关符号和代码片段。第二, impact analysis 可以 在改代码前看影响范围。第三,文件监听会自动增量同步,让图谱随着代码变化保持新鲜。 另一个亮点是框架路由感知,它不止识别普通函数调用,还能识别 java、 fast、 api、 express、 nest js rails、 spring gene、 axem、 react, router、 sweat kit 等框架里的路由和 handle 关系。对 web 项目来说,这比单纯搜函数名更接近真实业务入口。 code graph 也强调百分百本地运行,不需要 api key, 不 把代码发到外部服务。它用 scalelight 和 f t s 五作存储于文搜索,支持 typescript、 javascript、 parse、 java c, sharp、 php、 ruby、 swift、 collin view、 spell 等多种语言。 当然,边界也要讲清楚。 code graph 适合已经比较大的代码库,或者需要频繁让 agent 做架构探索、影响分析和跨文件修改的场景。如果只是很小的项目,原声搜索已经够快,图谱带来的收益就会变小。 它不是替代阅读源码,而是减少无效探索。所以我的结论是, code graph 很 适合重度使用 ai 编码工具的开发者和团队。 它把代码库变成一张可查询、可追踪、可增量更新的本地知识图谱,让 a 镇的少读文件、少消耗偷啃,更快进入真正的工程问题。关注我,每天带你了解更多优质的 getop 开源项目。

这个工具可以帮你省百分之八十的 token。 我是 努力的。艾迪克,一款名为血巨人的比特 app 项目引人注目,已获得六万多星。它可以让智能体像元神一样说话,减少约百分之七十五的 token 输出,同时保持准确性。看看这个例子,原本需要六十九 token 的 输出,血巨人只用了十九个字,妥妥的赛博文言文了,属于是 按作者的话说,脑子依然强大,但是嘴巴却很小。参考作者的测试数据,最高可以节省百分之八十七的 token, 平均节省百分之六十五。我想说,现在模型的废话确实是太多了,不止省 token, 看起来都会方便一点。安装方式放在评论区了,赶紧试一下吧。

openai 的 codex c l i 开源七五 k stars, 号称 clock code 杀手,两个都深度,用了两周,结论都很强,但擅长的完全不一样。 先说 codex 确实强的地方,速度快三至四倍, token 省二至三倍。写个 crack 接口三秒出结果,云沙箱内合即隔离审查不信任的代码不怕翻车。开源 rust 写的七五 k stars 代码可审计 plus 美元二十月,因为 token 省钱,实际能做更多事,但限制也有, plus 每月只能跑两三个大任务, pro 要二百美元才不限量。 clockcode 强在深度,两个模型都能到 e m 上下文,但用法不同, clockcode 默认就用满标准价不加钱。 codex 默认二七二 k, 开场上下文要多收两倍。 更关键的是绘画架构 cloud code 持续累积跨十个文件的重构,能记住三天前的上下文。 codex 每轮处理方式不同,复杂项目容易丢上下文。 agent teams 多智能体协作,这是 codex 目前没有的 一句话。 codex 是 速度型选手,简单任务碾压。 cloud 是 深度型选手,复杂项目碾压,截图收藏单文件写测试生成接口给 codex 快, 还省钱。跨模块重构, agent 协助给 cloud 深度理解碾压。最强玩法三步走, codex 起草, cloud 精修, codex 再审查, 实操就两个终端,左边 codex 生成,右边 clock 精修,反过来也行,效率翻倍,别二选一,二零二六年最聪明的用法是各干擅长的事。你平时主要用哪个评论区聊聊?

现在市面上各种 agent 的 产品层出不穷,像国外的 cloud code codex, 国内的 coder codebody, 但为什么这些 agent 的 产品用起来总是感觉效果很一般呢?也切了最强的模型,换了各种 agent 的 工具,但总是感觉没有别人说那么好用。其实有一个最关键的点,就是你没有做好善文管理。 现在大部分模型的山亚纹都有一百万的 token, 很多人使用的时候看山亚纹窗口还没满就会一直继续的聊,但实际上这么庞大的山亚纹窗口,在达到百分之四十左右的时候,模型的注意力就会因为被稀释导致能力下降。 osrotiki 官方也说过,山亚纹越长,模型表现就会越差, cloud 的 注意力就会被越来越多的 token 去稀释。 旧方案错误的假设跟无关日制都会开始干扰当前的任务。所以 colloud 它不是到一百万 token 的 时候才会突然变笨,它是从上下文变重的那一刻就开始慢慢的变迟钝。 很多人用 colloud 感觉前面很聪明,后面越聊越不对,它不是模型突然不行了,而是你把它的工作记忆给弄脏了。那什么是上下文呢?你可以把它理解成当前能看见能够依据的全部信息, 他读过的每个文件,跑过的每条命令,你们聊过的每句话,甚至工具和 m c p 的 定义,都会一点点塞进这个窗口里。 问题是这些信息它不会自动的区分有用还是没用,你前面试错留下的错误路线,你临时问过的旁枝问题,都会去的留在模型的脑子里,然后他后面每一步都会被这些信息影响, 所以真正的沙纹管理不是等它满了再说,而从一开始就控制它,看什么丢什么。哈喽,大家好, cc 高级使用指南今天会一个视频,教会你管理沙纹的全部技巧,内容有点多,大家也可以让 ai 工具整理一下,希望大家帮忙点赞收藏关注。 那第一个技巧就是先用 context 命令看当前的占用。 context 命令的作用就是返回当前山下文的使用情况,所以在使用 c c 的 时候,可以多用这个指令,观察山下文的用量,才能更好地去做山下文管理。不要凭感觉去判断,可要的是不是变笨了,而是主动去看山下文的状态。 第二技巧有点反直觉,就是提示词不要太短。很多人以为少写几个字省下文,但如果你只说帮我改一下,可要的就要自己去翻仓库。探索可能会读一堆没用的文件,那更省的方法就是直接告诉他目标是什么,不要动哪里,重点看哪个文件,你写的越明确,他就探索的越少,下文也就越干净。 第三个技巧就是多主动地用 compact 命令,它能保证下文更短,并且更聚焦。比如说探索已经完成了,方案已经定了, 你准备正式改代码了。这时候不要把前面所有的试错过程都带进执行阶段。你可以这样说, compact 保留当前架构的判断,用户的明确要求,已经排除的错误方向,该验证的命令丢弃无关的试错过程。这一步的本质是把删文从聊天记录变成了工作交接。 第四个技巧是新任务要用 clear 指令,这点其实比较简单,一个完全跟当前绘画无关的任务,最好不要继续聊,而是通过 clear 命令新开一个绘画。 第五个技巧是错误路线,要学会用 rewind 的 指令,比如说 cloud, 读了几个文件,尝试了方案 a, 结果发现方案 a 根本走不通。那很多人的做法可能就会继续说刚才不对,你换个方式,但这样就会把失败过程也继续留在下文里。 更好的方式就是回到错误发生之前,把后面的失败尝试丢掉。再补一句新的约束,不要走方案 a, 直接走方案 b。 第六个技巧就是旁支问题,不要污染主线。你正在让 cloud 去改支付流程,突然想问一个数据库自断的含义,这种问题不要直接在主绘画里问,而用 btw 指定,或者说专门去开一个新的绘画去隔离掉主删文,只服务当前的主任务。 第七个技巧就是规划执行验收,不要长期混在同一个沙文里复杂任务,让他先规划列清楚影响的文件风险边界,验证方法确认之后再去执行,执行完之后再验收。每个阶段接触都要问自己一句,现在是要继续还是 compact 还是 clear cc。 自己的 plan 模式本身也会做完规划之后,在退出 plan 模式的时候,问你是否要清理掉山亚文再去执行任务。这时候建议大家采用这种方式,不要担心丢失了之前的探索的山亚文,因为核心关注的内容其实都在 plan 里了,当前的山亚文反而加载着规划 plan 的 时候的一些脏东西。 第八个技巧主要是针对一些大项目,提任务的时候一定要给文件路径,不要让查找在全仓库里去乱猜。你越明确,他读的越少,下文也就越干净,结果也就越稳定。第九个技巧是能隔离的噪音一定要隔离, 如果说下一步会产生大量的中间输出,比如说全仓库搜索,日证分析、测试排查,那就让 sub agent 去做主规划,只拿结论,不吃过程。这也是 iceberg 官方说的一个思路,如果你以后只需要结论,不需要工具输出本身,那就要把它放到独立的账本里面。 第十个技巧是用 r t k 命令给输出截流。 r t k 是 github 上的一个项目,全名是 rust token killer。 他 做的事情很简单,就是在卡拉库德里面的 bug 工具和真实终端之间加一层代理。 卡拉要跑 git status py test, npm test 这些命令的时候,他会先改成 r t k git status r t k test, 然后把工具执行噪音重复日制进度条无意义的空白压掉,只把失败点跟关键摘要送回山亚文。 r d k 主要拦的是 best 命令,山亚文污染不止来自对话,也来自终端。输出一次 n p m test get log 可能就会吐出几百行日制, kalot 会默认把这些东西吃进山亚文。 r d k。 官网给我一个例子, 典型的两小时 ai 编程,会产生大约二十一万 token 的 命令噪音,用了 r d k 之后大概能变成二点三万 token, 减少了约百分之八十九。 这不是让他更会写代码,而是让他更少去吃垃圾输出不仅沙文更可控,也更节约你的额度,让重要的信息留下,让探索噪音离开。以上就是本期的全部内容,关注我,了解更多的 ai 技巧。