00:00 / 01:15
连播
清屏
智能
倍速
点赞120
Claude提示词缓存 Prompt Caching算法详解 之前的视频我们介绍了Claude Code如何利用Prompt Caching节省token的。这次我们深入讲解一下Claude Code客户端在请求里明文写的cache_control标记是如何工作的。 cache_control有两种用法。Automatic自动模式,请求顶层放一个字段,服务器自动给最后一个block打1个breakpoint,简单粗暴。Explicit明确指定,自己往block上挂,最多4个,位置自己挑。Claude Code用的是Explicit,3个breakpoint的位置全是它自己选的。3个分别标在system数组第2项末尾、第3项末尾、最新user消息末尾。前两个是稳定锚点,第3个是游标,每轮跟着最新输入往后跑。 3条核心原理: 原理1:缓存只在breakpoint位置写,写的是从头到这里的累积prefix。所以29个tools没标cache_control也被缓存——蹭system[1]的车一起打包写进去。 原理2:读的时候在breakpoint位置查不到,往前一个block查,最多查20个。它找的是"之前写过的条目",不是"现在稳定的内容"。 原理3:20格上限。超过就放弃。 官方博客Thariq的"Prompt Caching is Everything"分享了Claude Code围绕缓存的几个设计:分层(静态在前动态在后)、Plan Mode做成两个工具而不是swap工具集、Tool Search用defer_loading发轻量存根、compact共享原session的system+tools+history做前缀。两条提醒:不要中途切模型(缓存按模型分隔),不要中途改MCP/hook(整段前缀重来)。 #claude #个人开发者 #命令行 #AI工具 #张司机
00:00 / 06:46
连播
清屏
智能
倍速
点赞424
00:00 / 00:13
连播
清屏
智能
倍速
点赞871
00:00 / 05:22
连播
清屏
智能
倍速
点赞283
00:00 / 01:15
连播
清屏
智能
倍速
点赞67
00:00 / 01:11
连播
清屏
智能
倍速
点赞NaN
00:00 / 05:12
连播
清屏
智能
倍速
点赞7
智能体 Skill 完整教程, 1分钟生成竞品报告 #claude #skills #智能体 #SOP #工作流 🚀 这个视频讲什么 手把手教你用 Skills 机制 给 AI 装上「技能包」——写一次 SKILL.md,AI 永远记住,触发时自动按你定义的 SOP 稳定执行。用竞品分析场景完整演示:原来人工整理需要 2 小时的报告,AI智能体 自动执行,1 分钟出结果。 👥 适合谁看 开发者 / AI 工具重度用户:每天用 AI 处理重复任务,每次都要重新描述流程——智能体定制 和 智能体开发 的核心就在这里。把常用工作流封装成 Skill,一句话触发,节省 98% 的重复时间。 企业 AI 负责人:公司 SOP 没法让 AI 稳定执行,换人就要重新教。用 AI Agent 配合 Skills 机制,把公司流程写进 SKILL.md,团队共用,新人上手从 1 周压缩到 1 天。 想快速上手 AI 智能体的:不知道从哪开始用 Agent Workflow?Skills 是最低门槛的入口——一个 Markdown 文件,不需要写代码,10 分钟写好第一个 Skill。 🛠️ 你会学到什么 完整的 7 步流程:Skill 是什么 → 目录结构(SKILL.md 必须,其余可选)→ AI工具调用 的加载机制 → 渐进式加载原理(100 个 Skills 只有 1 个被完整读取,极省 Token)→ 写一个竞品分析 Skill → 触发调用 → 看到效果。 重点理解:智能体定制 的核心不是写代码,而是把「怎么专业做某件事」写清楚。Agent 启动时先读所有 Skill 的名称和描述,命中目标后才加载完整内容——这就是 Skills 与普通 AI Workflow 最大的区别:按需加载,极省上下文空间。 实战演示:从创建 competitor-analysis/SKILL.md,到写好触发描述,再到对 AI 说「帮我分析竞品」,全程展示 AI Agent 如何自动输出 SWOT 分析 + 多维度评分 + 竞品对比表 + 策略建议。
00:00 / 03:34
连播
清屏
智能
倍速
点赞28