00:00 / 02:49
连播
清屏
智能
倍速
点赞2791
00:00 / 01:28
连播
清屏
智能
倍速
点赞23
Claude提示词缓存 Prompt Caching算法详解 之前的视频我们介绍了Claude Code如何利用Prompt Caching节省token的。这次我们深入讲解一下Claude Code客户端在请求里明文写的cache_control标记是如何工作的。 cache_control有两种用法。Automatic自动模式,请求顶层放一个字段,服务器自动给最后一个block打1个breakpoint,简单粗暴。Explicit明确指定,自己往block上挂,最多4个,位置自己挑。Claude Code用的是Explicit,3个breakpoint的位置全是它自己选的。3个分别标在system数组第2项末尾、第3项末尾、最新user消息末尾。前两个是稳定锚点,第3个是游标,每轮跟着最新输入往后跑。 3条核心原理: 原理1:缓存只在breakpoint位置写,写的是从头到这里的累积prefix。所以29个tools没标cache_control也被缓存——蹭system[1]的车一起打包写进去。 原理2:读的时候在breakpoint位置查不到,往前一个block查,最多查20个。它找的是"之前写过的条目",不是"现在稳定的内容"。 原理3:20格上限。超过就放弃。 官方博客Thariq的"Prompt Caching is Everything"分享了Claude Code围绕缓存的几个设计:分层(静态在前动态在后)、Plan Mode做成两个工具而不是swap工具集、Tool Search用defer_loading发轻量存根、compact共享原session的system+tools+history做前缀。两条提醒:不要中途切模型(缓存按模型分隔),不要中途改MCP/hook(整段前缀重来)。 #claude #个人开发者 #命令行 #AI工具 #张司机
00:00 / 06:46
连播
清屏
智能
倍速
点赞249
00:00 / 04:01
连播
清屏
智能
倍速
点赞1
00:00 / 00:46
连播
清屏
智能
倍速
点赞933
一段提示词,快速入门任何陌生领域🔥 哲学家Amanda在最近一次访谈中分享了自己探索好奇领域的一个方法。 她有一个提示词,大意是: 我希望你从某个领域里选一个大概研究生水平的概念,我会最后告诉你是哪个领域。然后我希望你通过写一个寓言的方式,间接地把这个概念完整讲出来。最好一直到快结尾时,人才会慢慢意识到这个概念究竟是什么。然后在故事之后,再补一段解释,把你刚才真正要讲的概念说清楚。 翻译成一个标准提示词模版: 你是一位擅长用寓言讲授复杂知识的研究生导师。 我会给你一个领域:【填写领域】。 请你从这个领域中,选择一个“大概研究生入门到进阶水平”的重要概念。 要求如下: 1. 不要在故事开头告诉我你选择了什么概念。 2. 不要在故事前 80% 的内容里直接出现这个概念的名称、相关术语、公式或标准定义。 3. 请用一个寓言故事,间接但完整地讲出这个概念。 4. 故事要有明确的人物、冲突、选择、代价和结果,不要写成空泛鸡汤。 5. 故事中的关键情节,必须能和这个概念的核心结构一一对应。 6. 最好让读者在快到结尾时,才逐渐意识到这个故事真正讲的是什么。 7. 故事之后,请补充一段清晰解释,把你刚才真正要讲的概念说清楚。 请按照下面结构输出: 一、寓言标题 标题不要直接暴露概念。 二、寓言故事 用故事完整呈现这个概念。 三、概念揭示 告诉我这个故事真正讲的是哪个概念。 四、故事与概念的映射表 用表格说明:故事中的人物、事件、冲突、结果,分别对应概念中的什么要素。 五、通俗解释 用普通人能听懂的话,把这个概念解释清楚。 六、现实应用 举 2-3 个现实场景,说明这个概念可以如何帮助我理解现实问题。 七、一个自测问题 最后给我一个问题,测试我是否真正理解了这个概念。 #ai新星计划 #真实生活分享计划 #学习方法安利 #抖音精选 #claude
00:00 / 03:55
连播
清屏
智能
倍速
点赞308