来啦,朋友们, cc switch 一 键切换大模型,管理所有的 skill 技能管理、绘画管理、提示词监控模型用量。这么强的工具到底怎么去使用它呢?我们来看看吧。 cc switch 是 已经在 get up 上有八万八千多个星星的热门开源工具,到底是干啥的嘞? 咱们在用 cloud code 或者 codex 的 时候,大部分用户还是在用国内的大模型或者中转站, 但想要顺利地连接上,就要去手动修改配置文件。比如 cloud code, 就 需要去修改点 cloud 文件夹下的 settings, 点 json 文件。这对于程序员来说还好,但对于小白来说属实不太友好。 再就是每个 ai 软件的配置文件还都不一样,就很麻烦。比如 codex 就是 要去修改点 codex 文件夹下的 config, 点创文件, 那 cc switch 就 可以做到多个大模型供应商之间的随意切换,也就是自动帮你去修改这个配置文件。比如我现在想用 dipstick, 就 点击一下起用就可以了,想用 kimi 再点击起用就切换过来了,同样它也可以去监控用量,非常的方便。 那怎么安装呢?来到 cc switch 的 get up 仓库往下滑,看到这里的 download and installation windows 用户需要点击这个 release 来到这个页面,根据自己的电脑系统选择安装即可。 mac 系统如果你安装了 homebrew, 就 直接运行这行命令就可以了。安装好后,你就可以看到 cc switch 的 主界面, 左上角是设置和用量监控,右边是各种 ai 软件,有 cloud code codex、 gemini、 open code、 open claw、 hermes agent。 再往右分别就是 skill 技能管理、提示词管理、绘画管理和 m c p 服务, 中间就是不同大模型的显示,强调一点,如果你还没有安装 cloud code, 需要点击设置,将跳过 cloud code 初次安装确认的开关打开,这样让你在安装 cloud code 之后就不用去登录 asteropek 的 账号了。 那 ok, 我 们来做个演示,用 cc switch 让 cloud code 接入 deep sync。 先来到 deep sync 的 官网,点击 api 开放平台,先确保你是有余额的,没有的话需要去充值一点。然后点击 api kiss, 创建一个 api key, 取个名字并把它复制下来。注意这个 key 是 绝对不能泄露的,不然别人用你的 key 去跑 ai 的 话,用的就是你的钱。这时候有人就要说了,那你怎么不打码嘞?哎,我到时候会删除的嘛。 回到 cc switch, 点击加号,找到 deepsea, 将 api key 粘贴上去,再点击高级选项,将模型名称填上去就可以了。 又要划重点了,这个模型名称不能乱填,有大小写的要求,比如我这里就要用到小写的 d。 这时候有人就要问了,我怎么知道填哪些模型名称呢?一般来到 ai 的 官网都有一个开发文档,看看里面是怎么写的, 你就怎么填就可以了。那最后点击添加就 ok 了,打开 cloud code, 它会显示当前的模型,再问问他你是什么模型?他回答说, deepsea v 四 pro 非常的 nice, 这样你就可以随意的切换,像 codex、 小 龙虾、爱马仕都是一样的道理。 c c switch 不 仅可以管理大模型,它还可以管理你的 skill 技能。点击右上角的小扳手,第一次进来它是空白的,我们可以点击导入已有,就可以将你现在所有的 skill 都放进来, 你会看到每个 skill 的 后面都会有不同的 ai 工具,点亮它,这个 skill 就 可以在多个 ai 工具中使用了。 上面还有一个从 zip 包安装用法也是一样的。右上角的发现技能,可以搜索并下载 skill, 比如我搜索一个 video, 它就会出现一些视频制作相关的 skill, 并且可以看到它的安装次数, 但我觉得它只能英文搜索,没有 find skill 好 用,所以我用的不多。另外这里还可以点击查看,直接看到 github 上的源码, 我们知道 cloud code 里的 cloud 点 md, codex 里的 agents 点 md, 以及 gemini 里面的 gemini 点 md 一 般是写个人片号、文档格式、代码风格的一些通用的提示词,在你和 ai 对 话的时候,它会提前加载。 但像 codex 的 规范,我们要使用到 cloud code 或者 gemini 当中就要来回复制,非常的麻烦, 那用 cc switch 就 非常的方便,你只需要点击添加提示词复制上去, codex、 gmail 都可以用上这个提示词。并且你还可以准备多套不同的规范,比如说前端的规范,后端的规范,以及专门用来写文档的排版规范。 你可以在里面提前定好用什么字体,字体的颜色,甚至是行间距,用的时候只需要点击后面的按钮 将它开启就可以了,是不是非常的妙。点击第三个图标,来到绘画馆里,你就可以看到历史记录,这里有一行命令,复制这行命令到终端,就可以回到这个历史记录继续对话。同时在这里也可以一键清空所有的绘画。最后就是用量监控了, 点击左上角的用量监控图标,就可以看到使用的统计总头、砍树缓存以及命中率等等,还可以看到不同 ai 工具的用量,以及每个不同日期的具体用量。那 ok, 这就是本期 cc switch 的 教程,你学会了吗?
粉丝44获赞102

很多小伙伴问怎么让 cloud code 接上 deep seek? 这条流程我从头到尾给你讲一遍,照着走就行。 视频稍微有点长,建议先点个收藏,耐心看完,按步骤动手。先说清楚, cloud 是 anforepic 的 网页和 app 聊天助手,你打开浏览器就能用。而 cloud code 是 跑在你电脑终端里的编程搭子, 它能直接读你的项目代码,改文件、跑命令,相当于把 ar 装进了你的工程目录。更狠的是,凭借社区里那一大批开源 skills, 它还能调度你电脑里的一切浏览器表格、邮件、设计稿,几乎想自动化什么都可以。 为什么要接 deep seek? 两个原因,在国内访问稳定,不挂代理,按 token 计费,也比海外接口便宜不少。而 deep seek v 四 pro 的 能力,应付日常写代码、改 bug、 做重构绰绰有余。 开始之前先准备两样东西,第一, node js 十八以上版本提前装好,长期支持版就行。第二, get for windows, windows 用户必装,不装后面依赖会报错。 第一步,安装 cloud code, 在 开始菜单里搜 power shell, 右键以管理员身份运行。打开窗口后复制官方的 m p m 命令,粘上去回车,等它装完。 装完输入 cloud, 加上版本参数,看到版本号就说明装好了。第二步,获取密钥, 进入 api 开放平台,进入控制台后,在左边的侧边栏找到 api keys 这一项,点进去, 页面下方有一个创建 api key 的 按钮,点一下弹出小窗,给这把密钥起个名字,比如就叫 demo, 然后点创建, 创建成功之后会弹出一个密钥字符串,立刻点复制保存到记事本或者密码管理器里。特别提醒,关掉这个窗口之后,密钥就会变成密文,再也看不见。 如果你不小心丢了,只能删掉,重新创建一把。第三步,配置 cloud code, 打开文件资源管理器,进入 c 盘用户目录,再进入点 cloud 这个文件夹。 如果看不到点 cloud, 要先在查看里把隐藏项目和文件扩展名都打开, 然后新建一个文件,名字叫 settings jason 把这段配置直接复制进去,把 api key 行换成你刚才复制的密钥保存即可。第四步,验证打开终端或者 power shell, 输入 cloud, 回车 看到红色边框的欢迎界面,模型型显示 deep seek v 四 pro, 就 说明已经成功接上 deep seek。 最后再送一个加分项。如果你平时在 vs code 里写代码,配好 antropic 官方的 cloud code 插件, 装完进入侧边栏的 cloud code chat, 它会自动识别你刚才配置好的账号,直接就能在编辑器里聊天和改代码。 整个流程下来,你就拥有了一个本地终端加编辑器,双端可用的用 deep seek 驱动的 cloud coat。 你 学会了吗?欢迎评论区聊聊。

昨天我电脑的 c 盘又被塞满了九 g, 就 windows 电脑怎么就用着用着它就会被塞满,会变红?就是相信很多人也遇到过这种问题,明明我在安装各类软件,然后保存各类数据的时候呢,我会特殊的指定这些东西都保存到 d 盘,但是呢,不知道为什么 c 盘总是会爆满, 然后昨天呢,我也没找到原因,我通过杀毒软件用了 c 盘的此盘清理去排查,但是都没找到原因。然后今天呢,我突发奇想,能不能用 ai, 让 cloud code 帮我去本地查一下到底什么原因? 今天呢,让我大吃一惊,大家可以看到他自己在跑命令,然后呢翻系统,然后呢精准定位,全程呢?我没有用代码,现在不单帮我生成了存储变动的比较大文件的 top 十的清单,还帮我分析了原因,甚至还帮我复原了一下当时我大概应该是做了什么样的动作,导致这些 c 盘的呃文件被存储下来。 最后我还是用了一句话,让他帮我直接去清理相关的数据,直接帮我通摩出了五点二 g 的 内存。就是这个这个案例,让我突然想到,我们对 ai 的 想象力可能还是太平寂了,他们不用以为现在的 ai 是 帮我们写什么视频的文案,帮我们拆视频的脚本,然后呢帮我们拍视频,做图片,这种跟我们的日常生活跟工作没有那么大的关系。 但实际上通过这个事呢,其实我想表达的事是,咱们不要把 ai 想的太局限,就是以前我们不敢想,懒得想,想不出来,做不出来,很复杂的一些事,现在我们大胆交给 ai, 可能会有一个非常好的效果, 它甚至会给我们一个我们自己从来没有想过的解决方案,然后呢它的效率,它的准确率会让我们大吃一惊,所以呢,就是咱们大胆想,大胆用 ai 的 效率会比我们想的会更加夸张,去试试吧,我相信所有人会重新的逐步的深入 ai 时代进步。
![教你最大化Claude Code缓存命中来节省token 之前两期讲了Prompt Cache怎么省token、breakpoint怎么命中。这期反过来讲:什么动作会让cache直接报废,怎么用才能最大化命中率。
先给一个心法。
把每个请求想成一根从左到右的链条:tools → system → CLAUDE.md/skills → messages。改哪一段都会让cache失效,区别只在影响范围:改左边的从这段往右全部跟着废,改右边的只伤自己那一段。所以越靠左越要锁死。官方三级失效层级表(tools/system/messages)就是这个原则的精简版(CLAUDE.md严格来说在messages层,单独抽出来是因为它最常被改)。
4个日常杀手,按它们出现在链条上的位置从左到右排:
1. 切 /model —— 最左。每个模型独立的KV cache,跨模型完全隔离。Opus跑了10万token再切Sonnet,反而比继续用Opus更贵。非要切?正解是用subagent隔出去跑(Claude Code的Explore agent就是这么干,用的Haiku)
2. 装新MCP —— tools层。装一个新MCP,tools数组就多几个工具,链条最左边一动,下面system+messages连锁失效(三层全废)。但MCP只在Claude Code启动时读一次,session内装新MCP不影响当前session——真正的杀手是 /resume 或 /reload-plugins,触发重读后tools数组重组,之前cache全丢
3. 改CLAUDE.md 或装新 skill —— messages层。CLAUDE.md 是 user 消息(052已实证),skill 列表也注入在 messages[0]——都只在启动时读一次:改完文件或装完 skill 别 /resume,否则 messages 整段重建
4. idle超过5分钟 —— TTL过期,服务器直接删条目
每个杀手都给出怎么避免:MCP/hook 启动前一次配好;长任务前 `export ENABLE_PROMPT_CACHING_1H=1` 把 TTL 延到 1 小时。
#claude #AI工具 #张司机 #个人开发者 #命令行](https://p3-pc-sign.douyinpic.com/image-cut-tos-priv/4c2093cebb91654dd10cf078b747d4ba~tplv-dy-resize-origshort-autoq-75:330.jpeg?lk3s=138a59ce&x-expires=2097266400&x-signature=Tt4iW4%2F3L4cR%2BvMNd9pHRch8eVY%3D&from=327834062&s=PackSourceEnum_AWEME_DETAIL&se=false&sc=cover&biz_tag=pcweb_cover&l=20260620060034F95E23ABF23CECCEE9BE)
前面两集视频我们详细介绍了 prompt cache 的 工作原理,那我们今天讲点实用的干货,你每天用 curl code 敲代码, 你知道到底有哪些动作会影响缓存的利用率吗?要怎样才能最大化地帮你提高缓存的命中来节省 token 呢?我们把每一个请求发送的上下文扒开来,最左边是工具定义 tools, 然后是系统提示词 system, 然后是 cloud 点 m d skills 列表这些注的上下文最右边是 messages 对 话的历史。改哪一段都会让 catch 失效,区别只是在影响范围改。如果左边的,那么从左到右全部都跟着废掉了,改右边那么只伤自己那一段,所以越靠左越要锁死。 今天讲了四个缓存杀手,就按他这么出现的位置从左往右讲,第一名最狠的是切模型,因为缓存是按模型隔离的,为什么呢?因为缓存存的不是文字本身,而是 transformer 架构里 attention 层计算出来的 kb cache, 也就是每一层的 key 和 value 的 张量。 opus 和 sonnet 模型架构不一样,所以权重也不一样。同样提示词算出来的 k v 两个模型完全不同,所以 sonnet 没法附用 opus 的 k v cash。 跟 opus 聊了十万 token, 再切回 sonnet, sonnet 这边 cash 完全是空的,所有的 token 都要重新算 k v cash, 所以重新写入账单,瞬间从零点一倍基础价飙回一点二五倍。原来便宜十多倍的 token 要重新当全价算,那如果你有情况必须要切模型怎么办?那么正确的做法是用 sub agent 的 格力出去主对话,继续用 opus, 然后科微 cash 就 可以一动不动开一个 sub agent 跑另外一个模型,让他把活干完,输出一段交接消息给主对话 cologold 自己就这么干的,像 explore tool, web search tool agent 就是 用的海库。第二个大杀器就是装新的 m c p, 新装的 m c p 会添加到拓子数组的末尾, 哈希一变,下面 system 和 messages 全部跟着失效。但是 m c p 只在 clock code 启动时读一次,启动后整个 session 都是用启动时读的版本,所以当前的这个 session 是 不受影响的。真正的杀手是 resume 和 reload 的 plugging, 一旦触发重载,那么 call code 会重新组装托斯数据库。新的托斯和之前的 cash 对 不上,那么之前积累的 cash 就 全部白付了。所以开始一个任务之前,先把 m c p 一 次性都装好,不要把等活干了一半发现少了一工具再装,这时候前面积累的缓存就全没用了。 第三个杀手是改 cloud md 或者装新的 skills, 两个都是 message 层的注入上下文。 cloud md 本身就是一条 user message 排在 message 组里面的 block 三里面,然后 skills 列表是在 block 二, 跟 m c p 一 样,他们也只是在 cloud 启动时读一次,然后中途改 cloud md 或者装新的 skills。 当前 session 是 看不到的,真正的杀手还是在 slash resume 的 时候装完 skill, 你 想 resume 回来,那么 cloud code 会重新组装这个 message。 宿主 内容变了,跟之前的 cash 对 不上,那么 matches 整段都要重建。所以和 m c p 那 条一样,一开始一个任务先要想好需要哪些 skills, 或者当前的这个 cloud md 还有什么对于当前任务很重要的上下文没有添加一次性,我们把它准备好,不要在任务中途去修改这些东西对缓存的伤害很大。 第四个缓存杀手就是活干到一半去喝杯咖啡再回来。官方默认 t t l 过期时间是五分钟,超过五分钟没有新请求,那么 cash 就 直接清空了,并不是哈西不对,是福气。主动删条目回来,即便发一样的请求,那么所有的上下文都必须重新计算。 有时候 coco 的 返回结果,我们检查成果,然后想下一步都不止五分钟了,而且 coco 自己思考的时间有时候都不止五分钟。所以长任务如果想保住 cash, 我 个人无脑建议使用一小时的 ttl, 只需要在任务开始之前先 export enable prompt cashing 一 小时等于一, 那么启动这个环境变量就把 ttl 延长到一小时了。写入会比五分钟稍微贵一点点,五分钟是一点二五倍,然后一小时是两倍。但是复杂任务里,一小时的缓存绝对比五分钟缓存失效更划算。所以我们总结一下四个缓存杀手,按照伤害值从大到小排序, 第一个是中途切模型,那么第二个呢?是中途装新的 m c p, 三是改 cloud md 或者装新的 skills, 四是活干到一半中途中断超过五分钟。 它们的共同原则就是开启一个任务之前一次性把东西都配好。那么 session 里就不要用 slash resume 了。复杂的任务一定记得开一小时的 ttl。

今天我花二十分钟把这个可绕的扣的给装起来了,其实呢,这个还是比较简单的,我今天就来给大家演示一下,先把这个可绕的扣的零摩擦, 帮大家先装起来,然后再告诉大家后面怎么去领免费的偷客人怎么 处理,自己的文件怎么用。我们首先就准备几样工具啊,一个就是电脑,电脑肯定是要有啊,但这个性能是无所谓。还有一个就是 qcloud 的, 这之前我教大家装过,如果不会的话就翻一下前面的视频, 然后还有一个就的不希克的网页版本,你如果有什么问题,安装过程中出错了什么的,你直接截图发给他,他会给你解答。 那 qq 二的你直接告诉他帮我安装一下 cloud code, 然后他他就会给你自动安安装上去, 这里我已经安装好了,我看一下能不能演示一下 qq 二呢,他每天也是有免费的额度的,所以说处理这些小小事情还是绰绰有余,这就是已经在在装了啊, 你不用管他,他自己会跑,跑完以后呢,那就装好了。那如果呃出问题呢,你就截图发给那个 deepsea 是 吗?根本不用人为的来操作,这难点呢,就是你这个装好以后怎么用,因为他用 cloud code 的, cloud 的 这个这个模型呢是海外的模型,你国内的话还用不了,需要配置一下,我之前用的是 deepsea, 这个配置起来比较简单, 等会告诉大家,如果还不清楚的可以加我的粉丝群哦,我群里会把相关资料上传上去,有问题呢也可以和群友大家一起交流一下,你看安装完成让我来确认一下这个内容。好,这安装好了,然后这些就是文件, 这还有个启动文件啊,直接开始刚刚第一个跳,跳出来的是是是否信任这个文件夹,直接打确定回车就可以了 啊,这里呢就可以开始聊了。我周边之前是有装过的啊,有装过这个模型的,现在已经切换到小米的这个这个大模型, 所以说他能回答我正常的话,你是这里是他会报错的,因为你没有接入这个 cloud 的 这个模型。 那我们怎么办呢?看一下啊,就你先要登录这个 deepsea 的 开放平台,然后 api 开放平台点进去,点进去呢,他这边的话会有一个,呃,个人认证, 个人认证啊,就认证完了以后呢,他会给账号里面充十块钱,那十块钱的话你用一下其实可以用好一段时间啊,再点这里 a p r k, 你 自己创建一个,然后呢,你这个 钥匙拿到以后,直接创建密钥的一个脚本,直接把对这一段文字呢全部发给那个,如果不知道就让 qcloud 帮你找你这跑完以后呢,它会新建一个 apikey 的 这个 hup, 这个自动程序里面呢,他是有你的,有你的这个密钥,把这个命令中的这个密钥替换成你真实的这个 api 的 这个密钥, 就是我刚刚复制的那个外串密码,然后还是发给你电脑这一串文字,那么他会给你新建一个 这个文件,它里面会告诉你是用的是哪哪个大模型吗? 我这里是 deepsea, 所以 说他已经写好 deepsea, 如果说要用好一点模型,你直接给他替换成好一点模型,然后那两个文件生成以后呢?你就可以重新打开这个 试一下,你打开试一下,你随便给他发句你好或者怎么样,他如果能回答你,那么就说明你这个已经是成功了,就是已经从卡拉的模型切换到 deepsea, 那 么你就可以用国内的这个大模型去调用这个程序。 那大家如果遇到什么困难或者不懂的,可以加我的首页粉丝群,大家一起过来探讨一下吧。

ai 智能体成本最大的因素是什么?很多人会说是 token 的 长度越长,那么成本它肯定是越高。但是 cloud code 他 们的开发者发了这样一篇文章,他说的是提示词缓存命中就是一切,也就是 k v catch 的 缓存命中率, k v catch 的 缓存命中和不命中它的成本会相差到十倍以上。首先说一下 k v catch, 它本质就是你 之前上一轮对话,他已经计算好的一些内容,他会保存下来,那么你下一轮对话最好只是给他新增,比如说你新增这几句话,然后前面所有的上下文是完全没动的,那么他只需要计算你发的这几句话的这种计算量就够了,前面的他都是已经保存下来了,所以说这样的成本会非常的低。 但是如果你的上下文里面塞了现在的时间,那么你的上下文就已经断掉了,你在哪里 改变的,那么他后面的全部都要重新进行计算,所以说他的成本会非常的高。 ok, 这篇文章也给我们了一些怎么样提高提示词缓存命中率的一些操作经验。 首先他们就列出来了他这种提示词他大概的一个排列顺序,那么你改的时候一定就不要去改前面的,那么你新增的一些消息就应该放在最后面。 他就说了一下,首先是这种静态的系统提示词,然后是这个 cloud 的 md 文档,然后绘画上下文,然后才是这个对话消息,你一定要把你应用的上下文,比如说足够长了之后,你一定要打印出来,看一下你的应用上下文到底是怎么样排序的, 一定要把它顺序排好,最好对话的消息就是放在最后不断地加载,不断地加载的,然后他就说了一下, 这个消息一定是放在最后进行更新的,自动进行更新去进行添加,要放在最后的第二个点,就是不要在中途去换这个模型,哪怕你之前使用的是 opus, 但是如果你把它换成嗨酷,虽然这个嗨酷比 opus 的 成本要降了,应该是在五分之一, 但是实际上你换成这个嗨酷,它会比你之前再去对话其实是更贵的,因为它需要重建这个嗨酷的提示词缓存。所以说如果你需要换模型,那么你应该是起用一个子智能体,而不是去直接换模型。 还有就是千万不要在绘画的途中去添加或者移除工具,或者去动态的改变工具。这也就是我们之前出现过很大的问题,因为我们的应用它有非常多的 m c p, 这个 m c p 可能就占到了几十个甚至二十到三十 k 的 这种上下文缓存,我就想把它压缩,其实我不动它调用它的成本反而是更低的,这也是我们的一些坑点。 然后就是规划的模式,因为 cloud code 它是有一个规划的模式的,它是就不用具体去操作规划的模式,它是完全不会动这些工具提示词的,而是会跟它加一句这个提示词描述做约束,而不是去换它的体这些工具,因为这些工具如果你去换它,你会破坏掉它的缓存。 然后就是工具搜索,就是 m c p, 也就是我们刚才遇到的那个问题,他说了一下,他们不会去移除这些 m c p 工具,并且也并不会进行加载,而是做了一个 to 搜索工具,去搜索具体的这些 m c p, 而这些 m c p 的 提示词, 他会去把它整理成一个短的前缀,直接放在他的出示文档里面。然后我们要去做压缩,因为很多时候我们要做压缩,它上下文快达到上限的时候,你就必须要进行压缩。他也说了一下,他们之前可能想的就直接把这种对话直接进行压缩,这样的话少掉一些工具,少掉一些内容,这些可能会效果更好, 但是他们发现这样其实是不 ok 的, 他们用了一个最简单的方式,就是直接再发了一个提示词发给 cloud code, 让 cloud code 自己去执行这个压缩的命令,这就是他们的一个解决方案,他会把后面的这个压缩消息会固定一个消息去发给这个 cloud code, 然后总结了一下,一共有五个。首先就是提示词的缓存,就是前缀的匹配,就是你前缀永远不要换,用消息去替代这个系统提示的,更改你的系统提示词千万不要动。 然后不要在中途特别是你对话了一百 k 的 上下文的时候,你去换模型,这样的性价比是极低的,哪怕你换到一个最便宜的模型,都没有他那个缓存命中的成本低。然后他们要监控这个缓存的一个命中率, 要一直监控这个缓存的命中率,如果有问题他们就要马上进行修改,因为像梅纳斯或者 cloud code 的, 他们如果没有考虑这个缓存命中的话,他两百美金一个月,不要说两百美金,两千美金他们就算是自己模型提供商,他们的成本都打不住, 所以说缓存命中是非常重要的。还有就是这种节点尽量还是使用这种消息去进行压缩的方式,而不要去动他前面的上下文。 所以说总结了一个点,你想要成本低,那么你前面的东西最好什么都不要修改,包括你的提示词,包括你工具返回的内容,前面的东西全部都不要再做修改,那么你这个应用才是一个成熟的应用,要不然你的成本肯定是打不住的。

之前呢,我们分享了一期 cloud code 接入 deepseek, 但其实没过多久啊, cloud 就 有过一次版本更新,新版本的模型名称就会出现一些问题, 那这一次就正好我们把桌面版 codex 和 cloud code 都通过 c c switch 来接入 deepseek, 我 们出 three two one。 我 这里啊,把前置环境和 c c switch 都准备好了,同时呢也写了文字版的安装教程。呃,大家可以参考一下,我就不展开了,我们直接开始。 那先说 codex 吧。首先呢,我们需要做一个 cc switch deep seek 的 通道,这个呢,我已经准备好了。呃,文字版里面大家可以自己找一下。首先我们打开这个文件夹,找到这个文件, 复制一下再黏贴。然后呢重命名,文件名是点 env, 注意啊,这个点不能忘记。然后呢,这个文件呢,我已经有了,所以呢我就不确认了,我把这个删掉。 我现在打开这个点 env 给大家看一下,这里面啊就是一条 apikey, 你 们打开的话就把自己的 apikey 写上去就可以了。然后呢,我们双击一下这个 start 点 back 的 文件, 出现这样子的界面,这就算成功了。那如果中间哪里有报错啊,就要重新回去验证一下自己在前面的环境这里有没有什么没有安装好或者遗漏的地方。 好,那我们接着打开安装好的 cc switch, 这个是 codex 的 界面啊,它是 gpt 的 图标。 进来我们看到这个,我们点击右上角的加号,可以看到的是添加供应商,呃,我们下滑,这里填供应商名称, deepseek v 四 pro。 备注呢,我们就随便写写一个 test 官网的链接,这里是可以不填的, api key 就 填自己的 deep seek 的 api key 就 可以。 这里注意啊, api 请求地址填的不是 deep seek 的 接口,因为前面我们已经做过 cc switch 的 转接了,所以填的是本地的地址, 然后下面到模型名称这里就填 deepseek v 四 pro, 然后我们拉到最下面,这里直接就是点添加, 然后它会自动回到上页。这里啊,已经多了一条 v 四 pro。 看一下啊,这里我们直接点一下它就可以切换到使用中了。现在我们来打开 codex 看一下 这里,它其实已经绕开登录环节了,原本打开呢是需要 gpt 的 账号了,现在呢,呃,都是需要验证手机号的。那我们现在通过 cc switch 就 可以直接接入 dbic, 跳过登录直接进到 codex 的 界面了。 这里我们根据他的提示啊,先初步一下,然后这个 set up 好 快速就完成。现在我们发消息来问他一下,你当前使用的是什么模型,有回复了啊,他这里回复呢,他是 deepsea 了。好,我们现在再来验证一下 这里呢啊,使用之前他会向你申请一下电脑的权限。没关系啊,我的 codex 工作区也在桌面上面,我们现在直接打开看一下。 好的,这里呢,他是已经在工作区里面建立文件夹了,速度啊,我觉得是很快的,根本没什么毛病。那其实到这里为止呢, codex 接入 dbic 就 完成了 啊,如果没有账号没法注册或者说登录需要验证的朋友们啊,我们就先把 dbic 可以 这样耍起来了。 然后接下来呢,我们直接再来试一下 cloud code, 这里同时也是一样的啊,我们首先先要打开 cc switch, 我 先把我刚才的配置都删掉, 注意啊,这里是 cloud 的 配置页,也同样啊,直接点击加号进来,直接就是选择 deepsea, 这里的供应商链接,官方名称都已经直接有了备注。我们也先随便写一个测试 a p r key, 这里也同样是写 deep seek 的 key 请求地址,这里也不需要动了。 好,接下来我们就到了模型这里,模型这里呢,我们都填 deep seek v 四,然后这个 e m 呢?呃,之前的视频也说过,其实就是百万上下文使用的意思,如果不加的话呢,不用做大项目的话也是够用的。 然后这里其实还是可以换一个 flash 模式的,也不用全部都是 pro, 然后随便找一个改一下啊,这几个模型名字等会都有用的,是一个对应的关系。然后这里我们就直接先添加, 回到这里就有这个选项了,我们这里就直接点起用。之后呢,我们再开通一下本地路由,在这个设置路由本地路由里面,本地路由打开 cloud 打开, 然后同样这个本地的服务器地址是要记一下,后面要用的。好,我们返回上一集测试一下,看到他是正常运行的。接下来呢,就是打开 qq 的 第一次 打开登录界面,不用登录啊,左上角 help 这里啊,点击这个 troubleshooting, 然后进到这个 enable develop mode, 然后点击 enable, 然后这里其实就是进入它的开发者模式, 然后重启,重启之后你会发现这里多了一个 develop 的 入口,然后我们选择 configure party info, 然后进来。进来之后,首先第一个 provider, 我 们这里直接就选 getaway, 然后 getaway 这里的 base url 就 写刚才我们 cc switch 这里出现复制下来的地址,这一个 key, 这里呢,当然还是 deep seek 的 key, 然后 bear 这里是不用动的。好,到模型 list 这里怎么填啊?这里就是填我们前面在 c c switch 里面配置过的对应模型,前面呢,加一个 cloud。 好, 这里两个模型够了,直接我们拉到最下面 apply locally。 好, 然后直接重启。 看啊,这里就是直接不用登录,我们就进到 cloud 的 界面了,然后 solo party 的 模式到 code 这里试一下。首先呢,我们随便设置一个工作区,然后测试一下,帮我建个文件夹。好,我们看一下它的这个速度还是很快的啊。 ok, 那 到这里呢, codex 和 cloud 都已经接入完成了。我最后补充一点啊, mac 系统呢,相对比较稳定,但是 windows 的 话呢,会经常会出现这样子的报错, 但这种报错啊,其实没有什么关系,通常都是安装有问题。呃,因为网络原因,组建安装可能会有丢失,最好呢是可以调整一下自己的网络环境,重新安装一下就 ok 了。 顶级的 a g 呢,配上我们的国产大模型,就再也不用为无法登录烦恼了。好,那这次的内容就到这里,希望对你有所帮助。我是阿月,我们下期再见。

这个视频呢,记录一下 cloud code 的 一个安装的全过程,主要有这个四个步骤啊,这先安装 node, 然后安装 git, 再安装 cc switch, 最后就是在 cloud code 里面配置这个大模型 安装 node。 我 们进入到这个网网站以后啊,我们就点击这里呢根据电脑的系统进行一个安装,那我呢是 windows, 所以 就下载 windows 版本 啊,这里我已经有了,我就不下了,等装好以后啊,安装过程是比较简,比较简单,然后装好以后就测试一下到底有没有装好呢?我们直接在这个 c m d 里面打入这个 node 杠啊, v 出现这个版本号就成功了。那么第二步就是进入到这个网站去安装这个 get 环境, 然后呢是根据这个,也是根据电脑的系统啊去装这个 windows 的 这个六四位的 啊,下载好以后我们安装,安装好以后,我们点开这个 git bash, 在 这个框里面也是输入这个呃 git 两条杠 vision, 然后有一这个反馈这个版本号的话,就说明已经安装成功了啊。接下去就是在我们的这个呃命令,命令窗口里面去安装这三条命令,这样就可以把这个 cloud code 就 安装好了。 好,这样就是可以把 cloud 的 功能安装好了,然后在这里我们输入 cloud, 然后这个界面出来,就说明已经已经安装成功了。好,接下去就是安装这个 cc switch, 我 们点击到这个网站,然后拉到最后面有一个叫 release 点过来,我们看到这个最新版本,然后也是拉到最后面,然后就是选择我们的 windows 操作这个版本, 把它下载下来,然后再进行进行安装。装好以后呢,我们就在这个 c c switch 里面去配置这个模型,那这里我已经配置好了这个归机流动的一个方案, 配置好以后我只要也是打开这个命令窗口,然后输入这个 cloud, 然后这里输入一个 hello 吧,然后 那这里就会反馈啊,已经说明已经连上了,已经成功了。那么我这里问他一下啊,你是什么模型? 我在轨迹流动里面给他配的是这个 deepsea v 四的 flash 模型。 好,接下去我就是再尝试一下,在那个 deepsea 官网里面获取这个 a p i 去配置这个 v 四 pro 这个模型,因为 pro 这个模模型在这个轨迹流流动里面是没有的,所以我们这里选到 deepsea, 然后呢这里就是输入到我们刚才申请到的这个 key, 然后这里它默认是也是没有这个 v 四的,那么我们需要点到这个,嗯,官网接口文档里面把这个 model 名称给它复制下来, 然后复制到这里面都给它复制成这个 deepsea v 四 pro, 那 这样的话就是配置好了,那我们再测试一下,进入到这个命令窗口, 然后你看到看,大家看到这这里面它底下这个模型,它已经是变成了这个 deepsea b 四 pro 模型,然后我我也是给它进行一个测试,然后这样通的。

在这个系列视频的第一期里,我们就看到过 cloud code 里有一段特殊的系统提示词,叫做延迟加载的工具 deferred tools, 比如说 ask user question, 还有之前介绍过的 web search, 都在这个工具清单里。 这些延迟加载的工具和 to 字族里的工具有什么不同呢?它们到底是如何被调用的?进一步思考,如果工具是被动态加载的,那么 to 字族改变后对于提示词缓存有什么影响呢?这期我们就深入来分析一下 clock code 里动态工具调用的机制。 tool search, 我 们在 clock code 里输入, 我现在好无聊呀,用交互式的方式给我三个出去玩的选项,然后他调用了 ask user question 这个工具来询问我们的答案。 然后我们来看一看背后整个调用的过程。我们还是用老朋友 cloud tab 抓包,但这里有个坑,之前抓包就发现,一开始几十个工具都会被塞进上下文,根本就不需要言辞加载。 后来有朋友在评论区里提醒我才知道,因为 cloud tab 是 反向代理,会把 astropack base url 这个环境变量指到本地的抓包服务器。 而根据这篇官方文档,大部分代理服务器都不会转发托 reference 这个块,所以 cloud code 一 看到 base url 并不是 sql 自家的,所以默认就会把 to search 整个关掉。 也就是说,如果你用的是第三方大模型,比如说 deepseek, 智普等等,那么 cloud code 默认每次对话都会把所有工具都塞进上下文, 这样非常浪费 token。 所以 要解决这个问题,得设置一个环境变量,叫做 enable to search, 等于 true, 强制开启这个 to search, 延迟加载大部分工具, ok, 这就是 cloud tab 的 抓包结果。我们先看这个轮次三的用户消息,这个是我们刚才发的提示词,对吧?然后往上翻, 可以看到完整的延迟加载的工具名单啊。后面还有两个这个 m c p 的 插件工具,然后它们只有名字,没有 description, 也没有 skin 嘛。一开始大模型只知道这些工具存在,但是并没有任何的额外的信息。我们再看这个 tos 树组, 一共十个工具,前面几个都是老实人了, bash edit 啊 grab。 然后最后一个叫 to search, 这个是我们这期的主角,然后它的这个 description 翻译过来就是按需展开这个 deferred 工具的完整定义, 你可以把它理解成一本工具的字典。当模型决定要用哪个,就跟 tool search 报一个名字,于是它就把这个工具的完整说明书读出来。接下来看服务器的响应模型,输出了一个 tool use, 名字是这个 tool search, 对 吧?然后参数等于 select, 冒号, ask user question。 他看到了用户要的是交互式给三个选项,这是一个选项类的任务,得有一个能谈问题给用户选的工具。于是他扫了一页上面延迟加载的工具名单,这个 ask user question 可以 做这个事情。于是调用 to search 工具,把它的完整说明书发给我,我们继续看下一个轮次次的请求,然后点击对比。上次 可以看到用户消息里多了一个 tool result, 然后它的 type 是 这个 tool reference, 然后 tool 内是之前的这个 ask user question, 对 吧?并且还有一行字表示这个工具已经加载完毕了。那这个工具加到哪里去了呢?可以看到这个工具里多了一个 ask user question, 我 们可以去 tos 序组里点开它, 我们发现这就是 ask user question 工具的完整定义和说明书。有了这个,这时候大模型就知道怎么完整的调用它了,我们往下可以打开完整的这个原始的 json 响应。我们可以往下翻, 可以看到一个普通的这个工具没有的字段叫 defer loading 等于 true, 后面的请求也是一样的,新增的这个延迟加载的工具都会带这个标记。最后来看这轮服务器的响应, 我们看到模型按照给出的工具说明,真的返回了这个 ask user question 的 工具调用,对吧?这个 question 的 参数里面给出了三个的出行选项,让用户来选。我们把刚才的抓包分析总结一下, to search 这套机制只是比正常的工具调用多了一次请求。比如第一步, clock code 的 命令行发请求,带上了 toos 矩阵里所有的延时加载的工具清单,然后用户说给我三个出去玩的选项。 第二步,当 opus 收到了这个请求以后,大模型判断当前提示词它是需要 ask user question 这个工具的,但是目前并没有在上下文里,于是输出了一个托 use, 调用这个托 search 工具,把 ask user question 的 工具的说明书发给我, 然后客户端的 to search 工具再收到查询命令,在本地所有的工具定义里按名字匹配,把命中的工具的完整的 steam 读出来,准备塞回下一轮请求。第三步, colloquial 命令行发新请求。然后 tos 序组里面多了一个 ask user question 的 完整的定义,并且带了一个 defer loading 的 这个等于 to 的 字段。 然后在用户消息的末尾追加了一个 to reference 的 快, to 的 内是写的这个工具名称 ask user question。 然 第四步, opus, 它收到了请求,然后模型已经看到了 tos 里已经有了这个工具的完整的 schema, 于是正式发起了工具调用。 所以第一次这个请求是模型向客户端要工具的说明书,然后第二次请求模型才真正用这个工具来干活。然后我们回到视频一开始的问题,如果工具是被动态加载的,那么 tos 数值改编以后对于提示词缓存有什么影响呢? 官方文档里有一段专门讲 default loading 和 cache preservation, 刚好解释了这件事情,它的机制是这样子的, 刚才我们看到 tos 树组里被动态加载的工具定义都有一个 default loading 字段对不对?所以服务器端在算 cash 前缀哈希的时候,带这个字段的工具会被直接跳过,不参与计算,所以延迟加载的工具不算进 cash 前缀。 但是这个工具的定义也并没有消失,刚才被添加进对话历史的这个拓 reference 块,服务器端在检测到以后会把它自动展开成完整的工具定义,再发给大模型,所以模型在后面的轮次上下纹理就都可以看到这个工具了。 所以我们可以看到加载工具之后的这个调用缓存前缀里的 to 完全没有变动,然后新工具只添加在了最末尾,于是 cash 的 前缀就保住了,工具的定义也完整地进入了上下文提示词,缓存完全没有被破坏。讲完机制,我们回头看一看 to search 到底帮我们省了多少 token asterisk 在 去年底在上线 to search 的 时候发了一篇工程博课,标题就叫 introducing advanced to use on the cloud developer platform, 里面给了一组对照的数据, 他说这个在接入 github, slack central, splunk 这五个常见的 m, c, p server 的 时候,一共有五十八个工具,光定义就吃掉了大概五万五千个 token, 然后整个绘画大概七千多个 token。 开了拓色史之后, 拓色史自己第一轮大概用了五百个 token, 然后加上按需展开的三到五个工具,大约三千个 token, 合起来一共就八千个 token。 工具定义开销直接砍掉百分之八十五以上。 而且不只是省头肯模型在一大堆工具里挑对那个的准确率也提高了。比如这里说 opus 四从百分之四十九涨到了百分之七十四,然后 opus 四点五从百分之七十九点五涨到百分之八十八点一,工具少了,模型反而选得更准确。

如果你的 cloud 用不了,可以接入 deep sync。 v 四,用很低的预算解锁一百万上下文,加 max 思考等级。第一步,安装 c c switch c c switch 是 一个开源工具,专门解决 cloud code 切换模型的问题,一键将供应商导入应用, 一键在不同的供应商之间进行切换,内置五十家供应商预设软件可以进粉丝群获取。第二步,买 deepsea 的 a p i 并配置。打开 deepsea 官网,进 a p i 开放平台,网页版聊天是免费的, 但调 a p i 必须先充值。他们目前没有按约定约那种 token plan, 纯粹用多少花多少,对个人用户其实更友好。 v 四 pro 现在打二点五折, 每百万头肯缓存,命中输入零点零二五元,未命中三元,输出六元,这个价格到五月三十一号截止。点充值,选金额和支付方式,建议先小额试一笔,用完再补 付款完进左边 api keys 点创建,随便起个名字,把生成的密钥复制下来。注意,这个密钥只在创建那一刻能看到, 关掉就再也看不见了,丢了只能重建。打开 c c switch, 点 cloud 图标,添加预设供应商,选 deepsafe, 把刚才的 key 填进去,默认模型写 deepsafe vs pro, 然后添加后缀,这个后缀是官方公告里指定的,加了才会起用。一百万上下文 填完点添加,列表里就会多出 deep seek 这一项点测试按钮,验证 api 是 否可用。最后点起用 cloud code 就 可以正常用了。打开 vs code, 输入 model, 启动的就是 v 四 pro, 加一百万上下文,输 context, 验证一下,确实是一百万 tokens, 默默认思考等级是 medium, 敲 effort 加空格会列出所有可选档位,填 max 车就拉到最高 切模型用 model 社会列出来。 opus 和 sonnet 都映射到 v 四 pro haiku 是 v 四。 flash 上下键选中回车确认切到 flash 之后再敲 contacts 能看到上下纹变成二百 k。

今天教大家一下如何最大化的节约你 cloud code 的 token。 第一个就是这个切模型,你切模型的话就相当于把你的缓存命中给清空了,这个这样的话你的缓存命中率就降低了,消耗的 token 就 会更多。 还有一个就是你新装这个工具 m c p, 你 装这个绘画内新装 m c p 是 不影响的,不影响当前的绘画的,但是你复位或者是 reload 插件 触发工具数值重组之前的这个缓存就全没了。还有一个就是我们经常改的 cloud md, 这 cloud md 它也是启动的时候读一次,你这个改,改完这个,嗯, cloud md 之后 不要 resume, 否则,否则你的缓存也是清空的。最后一个点就是这个这个东西, 它这个缓存时间是五分钟,呃,你做长任务之前添加这个命令,把这个缓存时间延长到一个小时,这样的话可以上头看,就这个命令。

cloud 不 会用终端到底是什么?没有官方账号,想先接 deep c 跑起来这条从第一步讲清楚。安装,打开项目,接 api 换模型, 先分清两个入口,客户端和终端,客户端能点按钮,适合第一次上手。中端就是输入命令的窗口,适合跟教程跑项目。 先看 plop 桌面版里的 code, 是 一个本地项目入口,它会先确认项目分支和工作区,这些信息决定它能看哪份代码。进入任务以后,你会看到它读取文件,写入代码,检查结果也会放在同一个界面,所以它不是普通聊天窗口, 他是在你的项目里干活,第一次用,先让他读代码给计划确认没问题,再让他改文件。 mac 和 windows 先装桌面版,进入扣后再打开项目,再看终端版。 mac linux w style 走官方安装命令, windows 用 power shell 安装命令,装完先检查版本,再跑一次, doctor 版本能出来,环境检查没报错再进入项目。 客户端是点文件夹,终端是先进入项目目录,再启动 cloud, 你 可以把终端理解成给电脑发指令的输入框。 接下来讲 delete, 没有 cloud 官方账号,也可以先看 delete 接入路径,它不是重新下载 cloud code, 而是换三个配置, base, url, api, key, 模型名 delete 现在有 entropic 兼容入口, 所以 cloud code 可以 走这条路由。 mac 在 终端里设置这三个环境变量 windows 在 power shell 里设置这三个环境变量。 key 一定要打码,这个东西露出去别人就能用你的额度模型,明暗服务商给你的来,想快一点省一点。看 flash 想要更强推理,看 pro 配置好以后再启动 cloud code 能进入绘画,说明路由已经接上。最后讲换模型。客户端点发送按钮旁边的模型下拉框,终端里输入 model 命令, 官方模型和 deepsea 模型都在这里确认。第一次提问,不要让他直接改文件,先让他阅读代码给计划,你确认以后再让他动手。 记住这个顺序,先安装再选项目,再接 a p i 再换模型。你卡在安装终端还是 deep seek? 接入评论区聊聊。

为什么很多人现在装到 clothes code, 然后在使用的过程中觉得没有别人口中那么智能或者是不好用?今天我们就来解决这个问题。目前像 clothes code 这类智能体可以说是第一梯队,它不仅是依靠整个魔性的能力,它还比较依靠整个智能体的能力。 那么其实我们在安装之后是需要有几个地方,我们需要进行一些配置和给它制定一些规范,这个其实就是它的配置文件。比如第一个配置文件就是在安装了 cloud code 里面,它有一个 cloud 点 md, 这个 md 文件主要就是 比如说后期你执行项目或者是任务的过程中,你要给他制定哪些相关的条件或者是约束,避免的后期他可能有太多的一些幻觉,或者是在执行问题的过程中出现太多的错误,这个其实就需要我们给他制定这个规则和规范。那么我这里举例第一个就是我们在这个文件目录下的 cloud 点 md, 这个其实它是一个隐藏目录,我们平时在电脑上看不见的,那我就教大家怎么打开这个文件。我这里以那个苹果电脑为例,其实可以直接通过在终端命令行,比如说命令的方式,直接打开这个相应的文件目录, 可以看到这个其实就是我们整个 code code 安装的一个隐藏文件目录,包括我们的 skills 全部在这个文件目录下面。这个 code 点 md, 就是 刚才所说的我们要去后期改配置,把我们的一些条件和约束放里面。那我们具体的看一下我们该怎样去设置相应的条件和约束, 其实这里也相对比较简单,我这里使用了一个通用的模板,这个通用模板大家可以直接复制之后拿过去使用。它其实是有几个维度的。 第一个就是在使用的过程,我给他设定了我的语言条件,比如说全程是通过中文沟通,包括他的推理过程,或者是呃,我整个的结果是以中文,包括在执行任务的时候,我给他的条件是先讲阶段,然后再讲关键原因,以及给出一些简短的执行计划,再进行执行。 那么工作方式,因为我们有时候会用 qq 的 这些执行一些复杂任务,或者是读取我们电脑中本地的一些多个文件,然后再执行任务,给出一个结果。在这里对他的整个工作方式也要进行相应的约束,比如说修改范围要尽可能小,不做与任何无关的重构。如果发现一些需求模糊的 情况,我们要提出关键的问题,说白了他就像一个检查员或者是一个专业人员来帮你去制定这个规范,来帮你去严格的要求。在执行的过程中可能会出现的一系列问题, 包括一些安全编辑。我们也看到了很多人可能在网上说使用 coco 的 过程中,他误删了自己的数据,或者是执行了一些误操作。这个其实我们在这个 coco 的 点 md 里面文件也可以给它约束,好比如说不能让他随随便删我们的用户数据,或者是在执行一些 get push 的 时候不能自动执行,要通过我们人为确定。 还有最终的一些交付标准和长期记忆维护,这个其实就是我们最终对这个生成任务的结果,怎样的一个判断标准呢?比如我生成一个代码文件或者执行的任务,我先让他给我检验一下,或者说改了东西,让他给我判断一下改了什么样的内容。 最终的话就是我们要沉淀一个长期记忆维护的机制,这个机制的话就是他每次对你执行的任务,或者是你执行项目的过程中一些关键的信息,他会沉淀 下来形成一个记忆,这个记忆在下次你执行同样的任务过程中,他可能还会带到这一次的绘画中,这就避免了后期可能他就会越来越懂你,越来越了解你。刚才我们讲的更多的是在全军目睹,说白了 他是站在整个 coco 的, 你去执行任何任务,他会按照这个约束去执行。那么还有一个就是我们要去规定他整个项目的刻点 md 的 这个方式,这个项目规划其实就是我们每次会建一个任务的项目, 这个项目其实更多是执行一些代码或者程序,比如这里我们也可以给他设定整个项目的目标、工作方式以及目的的约定。这里很多更多的是偏我们在生成代码的方面,比如说呃,我们在整个源代码或者测试过程中,以及在呃文档的过程中,因为很多人使用 code, code 让他写代码,因为我们并不是专业的程序员, 那我想让它给我执行的结果更标准或者质量更高,那么这个约束肯定是必要的,因为有了这条约束之后,那后期可能你来改整个项目或者执行整个的这个结果的质量就相对比较高。还包括 可能我们要开发一个复杂的项目,涉及到一些阅读文档,比如 api 数据库,这里面其实也是需要在整个项目的整个 md 文件去给它进行最终的约束的。我们可以直接把这两个模板复制到大家的 qq 中,然后来好好体验一下它的能力有没有变强。

最近很多朋友 q 反应,格拉拉扣的桌面板为什么会越用越慢?今天我就用一条视频给大家解释一下它越用越慢的原因和解决方法是什么。 你先不要急着把文件卸载,实际上不是软件变差了,它是缓存被激发,包括你的呃后台的进度,你影响到了它启动和加载的这个速度,造成整个软件会卡顿,甚至影响你电脑的一个卡顿,我们用两分钟就能解决这个问题。 原因就三点,一个历史对话的积压,因为你每天高强度的使用。第二个呢,就是本地的一个膨胀。第三个呢,就是后台进程的一个残留。 历史对话的积压呢,是因为啊,我们默认的软件的保存的天数是三十天,你每天用量非常大的话,可能就需要加载全部的对话可原数据啊,一些上下文数据量就越来越大,所以加载的很慢。 解决办法就是把对话改成七天,你直接在桌面端呢,跟你的大模型助手直接说一声,你说把我默认的保存时间从三十天改成七天,他就会帮你改好。第二个呢,就是 本地缓存的膨胀,因为你在使用高德扣的桌面端的过程中啊,他会自动缓存相关的 ui 资源、页面数据等很多临时的文件到你的硬盘,目的呢是加速启动和切换,然后这些缓存时间长了,也会占用你硬盘空间,影响你的速度。 解决办法就是进入到你那个缓存目录,把里面的内容删掉,也不会影响你系统的一个稳定性。最重要的一点就是有后台进程的一个残留, 因为你把 logon 的 桌面端打开以后啊,我们正常的关闭就是直接点右上角的叉,当你关闭了以后啊,你认为关闭了实际上没有真正的关闭,你打开那个内部管理器啊,就会看到里面还有 logon 点 exe 的 很多进程还在后台运行,它会占用你电脑的资源,也会影响你加载 logon 桌面端的这个加载的速度。 我们常规的办法,当你发现这个问题以后啊,就是在内幕管理器把那个进程结束掉,然后呢你的速度也会 ok, 这样就会造成问题,我每次重复去操作这个步数就觉得相当的麻烦。我这边也碰到了同样的问题,我就创建了两个脚本文件,一个 v b s 的 脚本文件,还有一个 ps one 的 一个脚本文件。 这两个脚本文件呢,你只要按照视频中的这个内容啊啊用记事的创建,然后改掉这个后缀名,保存到一个文件夹里面,直接运行 vbs 文件,双击运行就 ok 了。然后你运行以后啊,我这个脚本的逻辑就是自动会加入到你的这个开机的系统项里面去,然后当你启动那个的桌面版的时候, 它也会自动清理掉在后台自动运行的相关的进程,就不会导致你的那个桌面单的软件呢,会越用越卡,甚至影响你电脑整个系统的速度。 然后当你创建好脚板以后啊,你要检查一下那个快捷方式的一些指向啊,你可以在那个现有的快捷方式的记录上找到他的那个目标快捷方式的地址,你也可以修改这个地址,具体的可以参看我这个视频中的这个说明。 然后当你清理掉以后啊,你可以做一下验证这个脚本是否 ok。 当你处理完前面的三步以后,你可以做一下对比的验证,第一呢就是他的启动速度,第一呢就是他的启动速度是不是比原来快了?第二呢就是你看一下关闭以后,他的内部管理器里面啊,他的进程是不是自动的卸载掉了,如果说这个目的都达到了,那证明我们的脚本文件是验证 ok 的。 所以说呢,我们做了这三个动作就缩短了缓存。第三个呢就是卸载掉了后面的进程。 你做完这三步以后啊,你再重新使用那个扣子桌面端的时候,你感觉这个软件的速度啊,包括关闭的速度都超级的快。我们总结一下,工具呢,不是他变慢,也不是他不行了,是我们没有真正的学会使用他,掌握底层逻辑才是我们真正要学的东西。好了,今天的分享就到这里,有什么问题大家可以评论区讨论留言。

我今天突然发现用 cloud code 来清理一下 c 盘是一个很不错的方法。呃,之前在网上我就刷到过有人会用 cloud code 去清理 c 盘,然后就抱着 试一试的心态,因为我一直都不太感动 c 盘里面的东西,就我之前也经历过,我自己手动去删一些东西,不知道删到什么了,然后后面整个电脑就出了一些问题,然后就捧着电脑去重装了 c 盘。那我给他的命令也很简单,就是直接问他 说让他推荐一个方案给我先不要执行,然后也告诉他我会比较担心电脑不能正常使用了,这里面还有错别字,但是也并没有影响他去理解我的这个需求,就真的返回给我了 一个很清晰的一个报告,里面包括了很多文件,它的占用的大小,以及后面他还给我排了个序,就觉得最安全的需要我确认的,还有需要最好是我自己亲自去操作的,然后分别都能释放多少的空间。一顿操作下来, 很快就已经把这些东西都处理好了,然后直接把内存从五点六个 gb 直接提升到了二十一点九个 gb, 然后可以看到我现在的这个电脑 变得非常的健康了,因为我原先还在想说,哎呀,这电脑用不了了,我是不是又要换一个空间更大一点的,就觉得可以再坚持一下,所以很多跟你电脑相关的一些东西,呃,你都不太懂的都可以, 就是跟他讨论,让他去代替你去执行。那整个过程我只会在这个 vs code 的 界面跟他用自然语言去做一些交互,那全程我是没有去真的去到 c 盘里去做任何操作的,感谢 cc 大 神。

这期视频呢,将会教会你使用 cloud code, cloud code 呢,和只会聊天的对话式 ai 不 同,它可以在你本地的电脑上自主运行。那为什么 cloud code 很 强呢?因为它拥有很强的 highness, 可以 理解为各种工具的集成。 cloud code 虽然有 code 这个词,但是它做的好的不仅仅是编程。我们直接进入安装环节。首先呢,我们打开浏览器搜索 vs code, 我 们找到官网, 在这里呢有一个其他安装包,之后根据你的系统下载对应的安装包即可打开安装包,我们同意协议下一步 完成安装之后呢,打开 vs code, 如果你是第一次使用,那么你的 vs code 应该是英文的。这时候呢,我们去左边点开四个小方块组成的那个图标,在里面搜索, 找到下载量最多的那一个,下载完成之后,右下角会让你重启,我们直接重启。嗯,这时候我们就可以安装 cloud code 了,我们 ctrl alt 加 i, 打开它自带的 agent, 我 们可以直接用这个 agent 来帮我们安装 cloud code, 告诉他帮我安装 n o d e, 并且用 n p m 安装最新版本的 cloud code。 如果这样说呢,他会默认把 cloud code 安装在 c 盘。 安装完成之后呢,我们创建一个文件夹,将这个文件夹用 vs code 打开, 选择信任作者,在最上边的菜单栏选择终端,新建终端,第一次下载使用默认终端就出现在 vs code 的 下边, 我们在终端里面输入 cloud, 就 可以启动 cloud 了,我们点信任作者,这时候的 cloud 是 使用不了的,因为我们安装的 cloud 就是 一个工具包,还没有给它接入大模型, 我们给它接入 deepsea 微四大模型,如果想把图奥的 code 和 deepsea 组装到一起,我们需要一个链接软件,这个软件呢就是 cc switch, 如果你们下载的很慢的话,可以去评论区拿我的百度网盘的链接下载。 下载完成之后呢,我们在上边选择 cloud, 在 右边点击加号。供应商呢,我们选择 deepsea, 点进去之后,我们只需要填写 apikey, apikey 从哪获得呢?我们在我们打开浏览器搜索 deepsea, 进入 deepsea 的 官网, 找到 deepsea, 找到 api 开放平台, 我们只需要在这里创建一个新的 apikey 就 可以了。 之后呢,将 a p i k 复制到 c c switch 里边。这时候呢,我们就可以让 cloud 帮我们做小项目了, 我让他帮我做一个视频项目管理网站吧。值得注意的是,我们的对话框下边有一个 plan mode on, 在 这个模式下呢,他会倾向于跟你讨论方案,哎,出来了,我们随便选一下。 而 cloud code 实际上有三种模式,第一种呢就是我们刚刚说的 plan 模式。第二种就是默认模式,这时候呢,它会自己衡量哪些能做,哪些不能做,也会自动的切换模式。第三种呢就是编辑模式,这个模式下它有权进行文件修改,但是有些命令还是需要经过你的审核。 这三种模式呢,按 shift 加 tab 可以 切换,但这三种模式都有点麻烦,它总是会找你确认。 所以 c c 呢?还有一种模式,我称它为无视风险模式,它需要在打开 c c 的 时候加上这样一句话,因为绝大部分情况下我也不会管 c c 要什么权限,我都是直接同意的,这时候会多出来一种模式,当然这四种模式依然可以自动切换。完全做好了我们可以看一看。 嗯,还是不错的,之后大家就可以出几期视频,把我觉得常用的功能分享给大家。

你用 cloud code 还没敲第一个有用的 prompt, token 就 已经在烧了。想省 token, 大 部分人第一反应是把 prompt 写短,但真正废 token 的, 从来不是你打的那几个字,而是那些一直跟着绘画走的东西。 cloud 配置文件 工具描述, mcp, schema、 shell 输出重复读过的文件,还有上下文压缩时丢掉的信息。省 token 不是 提示词工程,而是上下文工程。你要省的不是某一句话,而是整个绘画里哪些东西被反复读,反复传,反复站着上下文。 我这次从一百多个 cloud code 的 相关工具和 skills 里挑了七个对审 token。 最直接的第一个, token optimizer, 它解决的是你不知道 token 花在哪里的问题。很多人一上来就先装压缩工具,但更应该先做审计。 token optimizer 会看你的配置, system prompt memory, 还有上下文压缩这些环节,告诉你 token 浪费在哪里,哪些地方需要改,它适合什么人,适合已经频繁用 cloud code, 但不知道 token 为什么掉的这么快的人。它会给你实时面板花费,统计上下文健康度,还有审计模式, 把该清理的配置按优先级列出来。第二个, caveman, 它管的是长内容太占上下文这件事。 cloud code 很多 token 不是 花在代码上,而是花在 prompt、 system prompt、 cloud 配置文件、长文档和重复说明上。 caveman 的 思路很直接,意思保留字数,压短, 你可以把它理解成压缩层。它适合处理那些反复出现在上下文里的内容,比如规则文件,常 prompt 固定说明,常文档摘要。但如果一段内容本来就需要讲完整,比如复杂方案、关键决策、详细复盘,就不要强行压得太狠。 第三个 intent layer, 它解决的是 agent 忙扫项目的问题。很多时候你只是改一个小功能, agent 却会顺着 import 引用文件、相邻文件一路读下去。不是它不仔细, 是他不知道哪些文件和这次任务关系最大。 intent layer 的 做法是在目录里放清亮的规则文件,把这个目录做什么,哪些文件重要,常见坑在哪里写清楚。这样 agent 不是 从零开始猜项目结构, 而是先拿到一张清晰的地图。它适合中大型项目,尤其是目录多、模块多、老代码多的项目。第四个 handoff, 它解决的是绘画快满时怎么接力的问题。长任务最怕绘画快满了才想接力。 cloud code 自带的 compact 能压缩上下文,但压缩通常会有损耗变量名、 设计、取舍、边界条件、已经踩过的坑都可能在压缩里变模糊。 handoff 的 做法是,在你快到上下文上线时,主动生成一份结构化接力文档,它会记录当前进度、关键决策、约束条件、 get 状态、 下一步建议。然后你开一个新绘画,把这份接力文档带过去继续做。它适合长任务,不适合几分钟就能结束的小改动。 第五个 carposy 版 cloud 配置文件。它解决的是 agent 做事边界的问题。偷看浪费不止来自工具,有些浪费来自 agent 做了太多没要求的事,比如擅自重构,偷偷加抽象, 把简单任务做复杂。这套 cloud 配置文件不是 astropic 官方模板,更像社区把 carposy 的 几条工程原则整理成了项目规则,它的核心不是让 cloud 更聪明, 而是让它更克制。编码前先说假设,简单优先,只改用户要求的地方,把任务变成可验证的成功标准。它适合放在团队项目里做基础约束,但也有代价,它会让 agent 更保守、琐碎任务,不用把规则压得太死。第六个 code review graph。 它针对的是代码审查时反复读文件的问题。普通 review 里, agent 会读改动文件,依赖文件引用它的文件,测试文件很多结构信息每次都要重新发现。 code review graph 的 思路是先把代码库解析成知识图谱,再通过 m c p 提供给 agent。 这样 agent 可以 先通过图谱判断这次改动影响哪些函数、哪些相关文件、哪些测试,而不是一上来大面积读文件。它适合大仓库、多人项目、频繁 code review 的 场景,小项目不一定要上, 维护图谱本身也有成本。第七个, r t k rust token killer。 它解决的是 shell 输出太多的问题。 cloud code 跑 git status、 git diff test link 这类命令时,输出很容易进入上下文,麻烦不在某一次输出很大, 而是这些输出会在后续轮次里被反复读。 r t k 的 做法是把 shell 输出先过一层处理,再压缩成 agent 做决策需要的版本,尽量避免大段原始输出直接进入上下文。像 git status、 get diff 这类命令,输出都很容易变长, r t k 处理后会短很多。这里的关键不是具体百分比,而是它挡住了 shell 噪音进入上下文。如果只从投入产出看, r t k 很 适合先上,因为它不要求你重写工作流,也不要求你先理解整个项目,你的绘画里经常跑命令, 它就能开始帮你省 token。 这七个工具不需要一口气全装,更合适的顺序是一层一层来。第一层,先处理绘画里的基础配置,用 carpos 版 cloud 配置文件给 agent 立边界,再用 token optimizer 做一次审计,知道 token 到底浪费在哪里。 第二层,处理绘画过程中最占上下文的东西,固定说明和长文档太多就上 cavemen shell, 输出太多就上 r t k。 项目文件读得太散就考虑 intent layer。 第三层,处理大项目和长任务,频繁 review 大 仓库,再考虑 code review graph。 一个任务要跨多个绘画就用 handoff, 而不是只靠 compact 硬撑。这期先到这,你还想让我继续展开哪个点丢到评论区,我下一期接着讲。

这是个能将全网公开数据秒变 markdown 格式的携修工具,每天一个硬核的网站推荐第六十六期。今天要讲的是,过去我们整理网页公开内容,要么天天熬夜写代码,要么花重金折腾网络环境,成本高到怀疑人生。现在有了它,你只要把网址输入到格式化面板里, 直接给你生成干净的 markdown、 html 格式、结构化 jason, 甚至还有截图排版,极其清爽,完全不需要二次清洗, 拿来直接喂给大模型就能用,并且任务成功率稳在百分之九十左右。更离谱的是,它深度适配 cloud decode, 一 键导入配置,普通人不写银行代码也能完成专业级别的内容收集和整理,就很好用。

你有没有发现,用 clockcode 的 时候,同样的工作量费用却越来越高? 不是因为模型变贵了,而是 clockcode 在 每一次请求的系统提示词最前面,偷偷塞进了一个三字母的哈希码。这个哈希码来自你第一条消息里的几个字母。每次新对话新代码里哈希都不一样。有人可能要问,加个哈希怎么了?关键在于 antropic 的 缓存机制是基于前缀匹配的, 前缀只要改变一个字节,后面所有缓存内容全部失效。所以这一个三字福哈西直接导致每一次新会话那大约幺二零零零 token 的 系统提示词全部要重新算。注意,系统提示词在请求最前面,它一变,后面所有的工具定义你的对话历史全部没法命中缓存,这叫什么?这叫系统的第一行就给你埋雷。 缓存命中的时候读一次只要零点五美元,每百万 token 没命中,就得按五美元全额重新算,贵了十倍。一个健康的绘画缓存命中率应该在百分之九十五以上,可社区实测,受影响绘画的缓存命中率直接掉到了百分之四十八。 你算算,一个本来每小时只要五毛钱的绘画,因为缓存被破坏,硬生生烧到了五到十美元。而且这个过程是无声的,没有任何提示告诉你缓存丢了,你只会觉得,怎么今天额度用的这么快。 还有更过分的,当你用瑞纵恢复一个绘画,系统会悄悄丢掉一些关键记录,导致每次恢复都要重建八到十二万 token 的 缓存。一个绘画恢复三四次,额外多烧几十万 token, 这都是你的钱。 早在二零二五年九月, clock code 就 出过在英文里随机插入中文和泰文字符的恶性版。现在好了,不插随机文本了,改插哈希了,好一个进步。更讽刺的是, iso 内部把缓存命中率当基础设施 opan 来监控,掉一点就要开事故, 可自己的产品却在每一条请求的系统提示词里主动塞进一个破坏缓存的哈希。社区开发者看不下去,自己写了个代理工具,把缓存命中率从百分之八十二拉回到了百分之九十五点五。 产品自己做不到的,用户自己修。 antipark 在 二零二五年九月说过,我们绝不会因为负债降低模型质量,但主动破坏缓存让用户多付费。这和说一套做一套有什么区别? 作为一个每天用 cloud code 的 开发者,我想说的是,要么你修好这个缓存瓣,要么你就把那个该死的哈希去掉,让大家自选,把用户的成本偷偷垫高,这不是负责任的做法,太恶心了。