00:00 / 00:34
连播
清屏
智能
倍速
点赞4096
00:00 / 01:45
连播
清屏
智能
倍速
点赞12
00:00 / 03:31
连播
清屏
智能
倍速
点赞53
00:00 / 01:35
连播
清屏
智能
倍速
点赞11
00:00 / 52:10
连播
清屏
智能
倍速
点赞5
Claude提示词缓存 Prompt Caching算法详解 之前的视频我们介绍了Claude Code如何利用Prompt Caching节省token的。这次我们深入讲解一下Claude Code客户端在请求里明文写的cache_control标记是如何工作的。 cache_control有两种用法。Automatic自动模式,请求顶层放一个字段,服务器自动给最后一个block打1个breakpoint,简单粗暴。Explicit明确指定,自己往block上挂,最多4个,位置自己挑。Claude Code用的是Explicit,3个breakpoint的位置全是它自己选的。3个分别标在system数组第2项末尾、第3项末尾、最新user消息末尾。前两个是稳定锚点,第3个是游标,每轮跟着最新输入往后跑。 3条核心原理: 原理1:缓存只在breakpoint位置写,写的是从头到这里的累积prefix。所以29个tools没标cache_control也被缓存——蹭system[1]的车一起打包写进去。 原理2:读的时候在breakpoint位置查不到,往前一个block查,最多查20个。它找的是"之前写过的条目",不是"现在稳定的内容"。 原理3:20格上限。超过就放弃。 官方博客Thariq的"Prompt Caching is Everything"分享了Claude Code围绕缓存的几个设计:分层(静态在前动态在后)、Plan Mode做成两个工具而不是swap工具集、Tool Search用defer_loading发轻量存根、compact共享原session的system+tools+history做前缀。两条提醒:不要中途切模型(缓存按模型分隔),不要中途改MCP/hook(整段前缀重来)。 #claude #个人开发者 #命令行 #AI工具 #张司机
00:00 / 06:46
连播
清屏
智能
倍速
点赞209
00:00 / 02:41
连播
清屏
智能
倍速
点赞24
00:00 / 00:39
连播
清屏
智能
倍速
点赞NaN
00:00 / 02:31
连播
清屏
智能
倍速
点赞1096
00:00 / 01:25
连播
清屏
智能
倍速
点赞NaN
00:00 / 01:44
连播
清屏
智能
倍速
点赞742
00:00 / 03:17
连播
清屏
智能
倍速
点赞122
00:00 / 02:23
连播
清屏
智能
倍速
点赞457
00:00 / 06:20
连播
清屏
智能
倍速
点赞1
00:00 / 09:20
连播
清屏
智能
倍速
点赞1
00:00 / 01:46
连播
清屏
智能
倍速
点赞NaN
00:00 / 04:18
连播
清屏
智能
倍速
点赞145
00:00 / 11:10
连播
清屏
智能
倍速
点赞4837
00:00 / 01:23
连播
清屏
智能
倍速
点赞1862