00:00 / 01:00
连播
清屏
智能
倍速
点赞NaN
00:00 / 02:36
连播
清屏
智能
倍速
点赞332
教你最大化Claude Code缓存命中来节省token 之前两期讲了Prompt Cache怎么省token、breakpoint怎么命中。这期反过来讲:什么动作会让cache直接报废,怎么用才能最大化命中率。 先给一个心法。 把每个请求想成一根从左到右的链条:tools → system → CLAUDE.md/skills → messages。改哪一段都会让cache失效,区别只在影响范围:改左边的从这段往右全部跟着废,改右边的只伤自己那一段。所以越靠左越要锁死。官方三级失效层级表(tools/system/messages)就是这个原则的精简版(CLAUDE.md严格来说在messages层,单独抽出来是因为它最常被改)。 4个日常杀手,按它们出现在链条上的位置从左到右排: 1. 切 /model —— 最左。每个模型独立的KV cache,跨模型完全隔离。Opus跑了10万token再切Sonnet,反而比继续用Opus更贵。非要切?正解是用subagent隔出去跑(Claude Code的Explore agent就是这么干,用的Haiku) 2. 装新MCP —— tools层。装一个新MCP,tools数组就多几个工具,链条最左边一动,下面system+messages连锁失效(三层全废)。但MCP只在Claude Code启动时读一次,session内装新MCP不影响当前session——真正的杀手是 /resume 或 /reload-plugins,触发重读后tools数组重组,之前cache全丢 3. 改CLAUDE.md 或装新 skill —— messages层。CLAUDE.md 是 user 消息(052已实证),skill 列表也注入在 messages[0]——都只在启动时读一次:改完文件或装完 skill 别 /resume,否则 messages 整段重建 4. idle超过5分钟 —— TTL过期,服务器直接删条目 每个杀手都给出怎么避免:MCP/hook 启动前一次配好;长任务前 `export ENABLE_PROMPT_CACHING_1H=1` 把 TTL 延到 1 小时。 #claude #AI工具 #张司机 #个人开发者 #命令行
00:00 / 04:16
连播
清屏
智能
倍速
点赞183
00:00 / 03:51
连播
清屏
智能
倍速
点赞23
00:00 / 02:36
连播
清屏
智能
倍速
点赞138
00:00 / 04:30
连播
清屏
智能
倍速
点赞NaN
00:00 / 01:42
连播
清屏
智能
倍速
点赞1339