Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko; compatible; ClaudeBot/1.0; +claudebot@anthropic.com)
精选
推荐
搜索
探索
直播
放映厅
短剧
小游戏
搜索
您是不是在找:
codex可以每天给我发文章吗
吃黑包谷的ai指令用的什么AI
密钥呢密钥哪个图要报的比较多
codex工作流如何接入微信
宏怎么设置forza
520781.com代码怎么打开
CODEX的UI界面怎么更换
randombras是什么文件
先进封装是半导体吗
cc switch配置小米订阅
欧拉欧拉的替身AI
2周前
在之前的视频里有观众问我:为什么我的缓存命中率这么高? 基于这个原因我出了这期视频来分享我使用AI的一些提高缓存命中和节省token的小技巧。如果大家有更好的技巧和方法欢迎在评论区分享出来!#DeepSeek #token #agent #ai知识分享
00:00 / 01:37
连播
清屏
智能
倍速
点赞
575
AI小李
2周前
Github这次真没炸! deepseek-reasonix实测好用!#deepseekV4 #reasonix #deepseektui #claudecode
00:00 / 00:25
连播
清屏
智能
倍速
点赞
NaN
做游戏的小🐟
3周前
如何安装使用reasonix,并且高达99的缓存命中率是如何做到的?#deepseek #reasonix #agent
00:00 / 10:53
连播
清屏
智能
倍速
点赞
6906
逆转的王牌
2周前
为什么token计费分为输入输出和缓存命中不命中。是涉及到PD分离和kv cache两个概念。 所以华为昇腾950和英伟达vera rubin都针对PD分离做了专用型号。 #英伟达 #华为 #AI #GPU #token
00:00 / 01:09
连播
清屏
智能
倍速
点赞
1133
自由践行
6天前
个人目前还是推荐cherry ,期待Cherry的V2版 我觉得reasonix的高命中率是以增加几倍的命中缓存换来的,算总账可能还更贵,只是个人感觉 #Cherry #reasonix #代码编辑器 #ai编程 #程序员
00:00 / 03:37
连播
清屏
智能
倍速
点赞
6
张司机在路上
2周前
教你最大化Claude Code缓存命中来节省token 之前两期讲了Prompt Cache怎么省token、breakpoint怎么命中。这期反过来讲:什么动作会让cache直接报废,怎么用才能最大化命中率。 先给一个心法。 把每个请求想成一根从左到右的链条:tools → system → CLAUDE.md/skills → messages。改哪一段都会让cache失效,区别只在影响范围:改左边的从这段往右全部跟着废,改右边的只伤自己那一段。所以越靠左越要锁死。官方三级失效层级表(tools/system/messages)就是这个原则的精简版(CLAUDE.md严格来说在messages层,单独抽出来是因为它最常被改)。 4个日常杀手,按它们出现在链条上的位置从左到右排: 1. 切 /model —— 最左。每个模型独立的KV cache,跨模型完全隔离。Opus跑了10万token再切Sonnet,反而比继续用Opus更贵。非要切?正解是用subagent隔出去跑(Claude Code的Explore agent就是这么干,用的Haiku) 2. 装新MCP —— tools层。装一个新MCP,tools数组就多几个工具,链条最左边一动,下面system+messages连锁失效(三层全废)。但MCP只在Claude Code启动时读一次,session内装新MCP不影响当前session——真正的杀手是 /resume 或 /reload-plugins,触发重读后tools数组重组,之前cache全丢 3. 改CLAUDE.md 或装新 skill —— messages层。CLAUDE.md 是 user 消息(052已实证),skill 列表也注入在 messages[0]——都只在启动时读一次:改完文件或装完 skill 别 /resume,否则 messages 整段重建 4. idle超过5分钟 —— TTL过期,服务器直接删条目 每个杀手都给出怎么避免:MCP/hook 启动前一次配好;长任务前 `export ENABLE_PROMPT_CACHING_1H=1` 把 TTL 延到 1 小时。 #claude #AI工具 #张司机 #个人开发者 #命令行
00:00 / 04:16
连播
清屏
智能
倍速
点赞
496
Biny
1周前
DeepSeek Reasonix 增加 TTS 提示功能 这么好用的 DeepSeek 工具,咋没啥热度😶,缓存命中率高的离谱,比 CC 有的一比了,给它加个回答播报功能先😁#DeepSeek #DeepSeekReasonix #AI编程
00:00 / 01:02
连播
清屏
智能
倍速
点赞
240
生活的临时工
3周前
#编程 #deepseek #智能体 #agent #token 简直是把省钱刻在骨子里了!给大家推荐一个编程智能体deepseek reasonix 这个非常节省token绝了简直
00:00 / 02:56
连播
清屏
智能
倍速
点赞
319
AI随风
5天前
DeepSeek+Reasonix:AI编程更省钱 DeepSeek 的 Token 调用成本本来已经很低,但如果缓存命中率能进一步提高,实际使用成本还能继续下降。 这期视频给大家介绍一款专门适配 DeepSeek 的 AI 编程 Agent:Reasonix。 它的核心思路是通过提高缓存命中率,让 DeepSeek 在编程场景下更省钱。视频里会讲到: Reasonix 为什么能降低 DeepSeek 使用成本 缓存命中率对 Token 成本的影响 Reasonix 桌面端和终端端的使用体验 Plan 模式、审批模式、推理强度等核心功能 它和 Claude Code、Codex、OpenCode 这类工具的体验差异 适合哪些人使用 Reasonix 如果你平时经常用 DeepSeek 做 AI 编程,或者想找一个成本更低、体验接近 Claude Code / Codex 的编程 Agent,可以重点关注一下这款工具。 #AI编程 #Deepseek #AI编程工具
00:00 / 07:35
连播
清屏
智能
倍速
点赞
1682
阿sir
2周前
deepseek百分百缓存命中率 针对deepseek定制开发的reasonix,缓存命中率高得吓人,跑了一下午不到1块钱 #ai #deepseek #国产agent
00:00 / 01:31
连播
清屏
智能
倍速
点赞
82
Cookcoco
1周前
DeepSeek-Reasonix 到底省多少 看看源码,DeepSeek 如何设计以确保 100% 的 cache 命中。以及用它做 Vibecoding 到底能省多少钱? #ai #oomol #vibecoding #deepseek#编程
00:00 / 04:28
连播
清屏
智能
倍速
点赞
139
TextFuture
4天前
Claude Code的绝佳平替-Reasonix Claude Code的绝佳平替,适合新手上手的Deepseek专属Agent,Reasonix#Deepseek #Claudecode #Codex #agent #ai
00:00 / 04:03
连播
清屏
智能
倍速
点赞
41
微机课代表阿银
6天前
超级省token的国产Agent #dou出新知#这个视频有点儿料#电脑#电脑知识#deepseek
00:00 / 00:29
连播
清屏
智能
倍速
点赞
3576
既白真摆
1周前
小白第一款AI编程助手Reasonix,23块媲美几百块效果 #Reasonix #小白编程 #deepseek #deepseekv4
00:00 / 01:41
连播
清屏
智能
倍速
点赞
6872
程序员亚哥
6天前
DeepSeek霸榜!用这神器账单直接省80% DeepSeek霸榜!用这神器账单直接省80% #程序员 #DeepSeek #Reasonix #OpenRouter #AI智能体
00:00 / 00:44
连播
清屏
智能
倍速
点赞
14
炫影墨客(互关)
2周前
DeepSeek的缓存命中率高的惊人 #DeepSeek #deepseekv4
00:00 / 01:22
连播
清屏
智能
倍速
点赞
46
IT咖啡馆
3天前
「Github一周热点116期」AI Agent的记忆系统 1、项目名称:EverOS – AI Agent记忆操作系统 2、项目名称:DeepSeek-Reasonix – DeepSeek原生终端编程代理 3、项目名称:HyperFrames – 写HTML出视频 4、项目名称:Understand-Anything – 代码仓库知识图谱 5、项目名称:academic-research-skills - 完整的学术研究Skill包 #AI新星计划 #Github #智能体 #vibecoding #IT咖啡馆
00:00 / 08:13
连播
清屏
智能
倍速
点赞
6527
.Z
2周前
DeepSeek 神工具|省钱 + 高效双在线 专为 DeepSeek 打造的两个神器🔥 deepseek‑tui + reasonix 实测 2 天缓存命中率超高 1.3 亿 token 仅花费 5.58 元 性价比直接拉满,输出质量在线 AI 干活效率神器,强烈推荐! #deepseek #reasonix #花小钱办大事
00:00 / 00:18
连播
清屏
智能
倍速
点赞
137
40岁开始学ai的老张
4天前
ai方法论第25课:缓存命中的神——让AI长任务少烧钱 量子位报道了 DeepSeek 原生编程 Agent 项目 Reasonix:通过稳定 prefix-cache、append-only 运行循环、工具调用修复和成本控制,把长会话缓存命中做到 99.82%。这节课教你如何省token#deepseek #claudecode #hermes #harness #缓存命中
00:00 / 03:00
连播
清屏
智能
倍速
点赞
86
程序员晓刘
5天前
一个专为 DeepSeek 打造的开源 AI 编程Agent #DeepSeek #Reasonix #AI编程 #Agent #开源项目
00:00 / 06:09
连播
清屏
智能
倍速
点赞
131
秦楚zoro
2天前
Deepseek必备AI编程搭子 #AI #ai #AI工具 #AI推荐 #AI编程 Reasonix
00:00 / 00:41
连播
清屏
智能
倍速
点赞
52
灵枢聊AI
1周前
Deepseek V4缓存神技,账单2折到手,智源大会图灵队 🔥 今天AI圈效率战的瓜太有意思了! 1️⃣ DeepSeek V4+Reasonix组合拳直接把缓存命中率干到99.82%!61刀的账单砍到12刀,相当于打了2折,这波操作真的香到跺脚~ 2️⃣ 智源大会6.12要在北京开幕啦,图灵奖得主都来组队,中国大模型第一梯队直接成团出道! 3️⃣ SaaS-Bench实测扎心了:Claude这些主流模型的真实办公通过率才3.8%,看来全自动办公还得再等等。 你觉得现在AI是在进步还是内卷?评论区一起唠唠👇 #AI资讯 #DeepSeek #智源大会 #Agent #大模型
00:00 / 00:50
连播
清屏
智能
倍速
点赞
10
晴天AI实战
2天前
Coding Plan怎么选?这几点要注意! 选Coding Plan时得留意时效性,还有缓存命中的问题。虽然看起来确实便宜了,但可不能只看表面数据。 #codingplan #mimo #小米mimo #token #ai编程
00:00 / 09:16
连播
清屏
智能
倍速
点赞
530
托马斯干 AI(卖token)
1月前
#ai创业 #Token #聚合站 #缓存命中 #省token
00:00 / 01:29
连播
清屏
智能
倍速
点赞
40
人工智障指北师😎
5天前
什么是“缓存命中” 大家好,我是指北师。 今天就来聊一下,缓存命中到底是什么?它有什么作用? #Deepseek #mimo #我在抖音聊科技 #ai
00:00 / 01:04
连播
清屏
智能
倍速
点赞
53
AI先行者
2天前
DeepSeek-Reasonix 工具速览 它有点像 Claude Code,但更专门:围绕 DeepSeek API 做终端 Agent。 这期看三点:它是什么、为什么只支持 DeepSeek、适合谁用。 #DeepSeek #AI编程 #Agent #编程工具 #ClaudeCode #开源项目
00:00 / 04:29
连播
清屏
智能
倍速
点赞
73
全栈二把刀
1周前
Reasonix升级解读v0.46.0→v0.47.2 #deepseek #reasionix #AI #智能体编程 TUI 全面翻新 桌面端成熟 TUI Composer 第二轮 搜索强化 Claude 生态兼容 提示词预算压缩
00:00 / 04:14
连播
清屏
智能
倍速
点赞
28
全栈二把刀
4天前
Reasonix升级解读(v0.50.1→v0.53.2) #智能体 #AI #reasonix #deepseek 这次更新是一次以大型工程任务、缓存效率、终端交互和稳定性为核心的全面升级,重点解决了长会话成本、大型项目执行效率和用户体验痛点。
00:00 / 01:45
连播
清屏
智能
倍速
点赞
257
Nuyoahyl
2周前
专为DeepSeek缓存打造的AI编程代理 Reasonix 是目前唯一专门围绕 DeepSeek 前缀缓存机制工程化的终端 AI 编程代理。真实用户单日数据:4.35 亿 token ▎ 缓存命中,命中率 99.82%,成本直降 80%(v4-flash)/ 91%(v4-pro)。支持一波作者大大 @做游戏的小🐟 #deepseek #科技 #ai大模型 #ai
00:00 / 01:42
连播
清屏
智能
倍速
点赞
51
Cookcoco
1周前
不要被百分比的变化误导,人其实对这个不敏感。 涉及百分比的变化都要自己心算一下,否则很容易搞错。比如 CodeX/Claude Code 的缓存命中率提升几个点,都会节约很多成本。这就是为什么云计算公司要用 4 个 9 这种说法来表达可用性,而非百分比。 #ai #百分比 #codex #deepseek_reasonix
00:00 / 01:35
连播
清屏
智能
倍速
点赞
10
AI编程大白
2天前
零基础入门AI编程100讲115期: 什么是缓存命中? 本文会用大模型调用的场景讲清楚什么是缓存命中,以及它为什么能明显降低 token 费用。核心逻辑是:如果多次请求的输入前缀完全一致,模型服务端就可以复用之前已经计算过的中间状态,不必每次都从头处理长提示词、系统指令或文档上下文。我把缓存、命中、输入 token 成本和前缀复用之间的关系串起来解释,也会讲到客服机器人、代码助手这类实际场景,帮助你理解如何通过固定内容在前、动态内容在后的请求结构,提高命中率、降低成本和延迟。#科普知识 #AI编程大白 #VibeCoding #大模型 #缓存命中
00:00 / 06:49
连播
清屏
智能
倍速
点赞
200
AI编程大白
2周前
零基础入门AI编程100讲88期: 什么是缓存? 这篇文章用生活中的水杯类比,把缓存讲成“把可能重复使用的数据放到更近更快的位置”。它不仅解释了缓存命中、未命中、TTL、LRU/LFU 等基本流程和策略,也串起了浏览器缓存、CDN、Redis、数据库缓存到 CPU 缓存等不同层级。核心逻辑是用空间换时间,减少重复读取和计算,但也要面对旧数据、一致性、穿透、击穿、雪崩等问题。看完能更系统地理解缓存为什么有用,以及设计缓存时该权衡速度、成本和准确性。。#零基础入门 #AI编程 #AI写代码 #大模型 #缓存
00:00 / 07:04
连播
清屏
智能
倍速
点赞
124
予禾呈象
5天前
省到就是赚到! DeepSeek专属神器Reasonix,把AI编程成本直接压到1折。 #Reasonix #DeepSeek #AI编程神器 #程序员工具 #开源项目 #API降本 #编程效率 #DeepSeekV4
00:00 / 01:12
连播
清屏
智能
倍速
点赞
9
40岁开始学ai的老张
3天前
ai方法论第26课:缓存小妙招——四个让AI白烧钱的坏习惯 - 四个缓存杀手:切模型、加工具、改配置、闲太久 - 缓存链原理:前缀稳定,后面才能命中 - Claude Code 的 cch 暗坑和一行修复 - 五个实操小妙招#openclaw #hermes #claudecode #agent #ai应用
00:00 / 02:41
连播
清屏
智能
倍速
点赞
65
费曼学徒冬瓜
2周前
8分钟说清楚KVCache与Prompt Cache KV Cache 是什么?为什么没有它,大模型会越来越慢? Prompt Cache 又是什么?为什么缓存命中率一高,成本就能砍到脚踝? DeepSeek 为什么被称为"赛博善人"?某些 Token 中间商又是怎么靠缓存差价割韭菜的? Claude Code 源码里密密麻麻写着的"缓存",到底藏着什么省钱秘籍?
00:00 / 06:49
连播
清屏
智能
倍速
点赞
2181
跳跳风
1周前
PRD:DeepSeek Reasonix PRD:DeepSeek Reasonix #AI新闻 #短视频
00:00 / 00:45
连播
清屏
智能
倍速
点赞
0
全栈二把刀
1周前
Reasonix 0.48.0升级详解 #智能体 #AI编程 #reasonix #智能体编程 四大升级详解
00:00 / 02:35
连播
清屏
智能
倍速
点赞
28
成路小栈
4天前
用deepseek的看过来,帮你解约大量token #节省token #缓存 #缓存命中 #deepseek #大模型
00:00 / 00:42
连播
清屏
智能
倍速
点赞
25
小闲修AI
3周前
大模型的前缀缓存,能省很多钱吗? #我在抖音聊科技 #一人一个舍不得删的app
00:00 / 06:24
连播
清屏
智能
倍速
点赞
125
卡皮拉
5天前
DeepSeek Reasonix 配置Mac 版
00:00 / 02:44
连播
清屏
智能
倍速
点赞
31
张司机在路上
1周前
提示词缓存里存了什么?和KV Cache有什么区别? 很多人对prompt cache有个误解,以为它存的是prompt原文,或者上次的回答,又或者像Redis一样key对value、命中直接返回结果。三种都不对。 这期从Transformer架构往下挖。模型生成回答分两段:Prefill把整段提示词一口气读完,Decode再一个字一个字往外蹦。每蹦一个字,都要把前面所有内容重新过一遍。 要看懂这个过程,得先复习attention。每个token会被投影成三个向量:Query、Key、Value。Query是想找什么,Key是能提供什么,Value才是真正携带的信息。 前面token的K和V,算一次就不再变,每一步Decode都要翻出来重用。于是存下来——这就是KV cache。单步复杂度从N平方降到N。prompt cache再把这种复用扩展到跨请求。前缀和上次一样,Prefill直接搬出存好的K和V,整段Attention计算跳过。所以prompt cache里存的东西,字面上就是Attention里的KV张量。不是原文,不是回答,是模型算到一半的中间结果。 视频里完整画出了QKV三个矩阵、Prefill和Decode到底在算什么、KV cache长什么样、跨请求怎么命中,最后用一张表把KV Cache和Prompt Cache的本质、复杂度、生命周期对比清楚。 #claude #transformer #attention #kvcache #张司机
00:00 / 09:23
连播
清屏
智能
倍速
点赞
1614
微风吹
1周前
Github这次真没炸!Deepseek-reasonix实测好用! #DeepSeekv4 #reasonix #DeepSeektui #Claudecode
00:00 / 00:25
连播
清屏
智能
倍速
点赞
19
锋芒AI
4天前
AI编程成本砍到1/5 4.3亿token只花12美元!这个开源AI编程Agent把缓存命中率拉到99.82%#DeepSeek #AI编程 #开源项目 #开发者工具 #AI Agent
00:00 / 01:09
连播
清屏
智能
倍速
点赞
21
磊磊ai
1天前
Deepseek缓存命中率低?三步搞定它 这两天用CC编程时,我的Deepseek额度掉得飞快!后来一查才发现是缓存命中率太低,token直接飙到爆炸…现在总算找到原因把问题解决了~主要是Claude版本更新导致的错误啦 #deepseek #dou+小助手 #干货分享 #ai #token
00:00 / 00:53
连播
清屏
智能
倍速
点赞
978
不夜-AI
1天前
reasonix针对deepseek的智能体 reasonix针对deepseek的智能体 @做游戏的小🐟 #AI #deepseekv4 #智能体 #reasonix #省钱
00:00 / 03:31
连播
清屏
智能
倍速
点赞
3
自由践行
1周前
目前发现所有工具的性价比之王,值得一试 #deepseek #reasonix #ai编程 #ai开发 #程序员
00:00 / 03:23
连播
清屏
智能
倍速
点赞
19
超级大立
5天前
reasonix试用效果 reasonix适配Deepseekv4pro,很好用,虽然智力一般,但超级省token,2个小时就花了1块钱,可以让CC做执行计划选择方向,让reasonix做构建,再回过头来让CC做审查和调优。#reasonix #claude code#deepseek
00:00 / 01:52
连播
清屏
智能
倍速
点赞
40
全栈二把刀
1周前
Reasonix 0.50.1升级详解 #智能体 #AI编程 #reasonix #智能体编程 Desktop 仪表盘统一 Preset 抽象移除 累积用量统计 Context 折叠优化 Subagent 模型覆盖
00:00 / 00:58
连播
清屏
智能
倍速
点赞
57
李文
6天前
Claude code节约token的4个注意的地方
00:00 / 01:13
连播
清屏
智能
倍速
点赞
26
莫说闲话
6天前
deepseek 可太省钱了 cache 命中率高的吓人,这架构或许真的是翻盘机会了! 跟我一起喊,梁圣无敌!#deepseek #大模型
00:00 / 03:01
连播
清屏
智能
倍速
点赞
18
向日楑
2周前
DeepSeek-TUI和Reasonix实测,推荐后者 #Deepseek #Agent #Codex #Ai
00:00 / 00:39
连播
清屏
智能
倍速
点赞
112
刺破万象
3周前
命中缓存,Deepseek V4, AI大模型便宜 90% 视频拆解 3 个AI大模型Token计费真相:①输入便宜、输出贵;②缓存复用省 90%;③长上下文成本暴涨。附 3 个省钱铁律:控制输出长度、固定前缀放动态信息、同任务同对话,看完直接省一半 Token 钱!Deepseek V4举例 #AI科普 #AI使用指南 #deepseek #AI干货 #AI教程
00:00 / 02:20
连播
清屏
智能
倍速
点赞
47
瑞克老张有话说
4周前
DeepSeek V4编程命中缓存比例高,性能强还很便宜 #deepseekV4 #大模型 #token出海 #AI编程
00:00 / 04:30
连播
清屏
智能
倍速
点赞
362
睿思答AI
5天前
DeepSeek V4还能更省!新工具缓存命中率达99.8% #AI#人工智能 #DeepSeek
00:00 / 00:44
连播
清屏
智能
倍速
点赞
1
每日AI评论
6天前
DeepSeek Reasonix,更省钱的Agent #ai #技术分享 #Agent
00:00 / 10:38
连播
清屏
智能
倍速
点赞
197
做游戏的小🐟
3周前
reasonix国产agent!最适合deepseek #deepseek #agent #reasonix #tui
00:00 / 08:07
连播
清屏
智能
倍速
点赞
1004
全能的野人
1周前
deepseek降价是利好还是利空?#deepseek降价 #金融#财经#股市#算力
00:00 / 03:00
连播
清屏
智能
倍速
点赞
NaN
大胡子AI说
3天前
这个工具轻松帮你省下百分之九十八的token #ai #ai工具 #AIGC #AI #AI应用
00:00 / 01:05
连播
清屏
智能
倍速
点赞
28
联飞玩AI
4周前
DeepSeek写代码4.72亿Token成本实测 用DeepSeek V4 Pro在Claude Code 里写了一天代码,缓存命中很高,成本低得离谱。下一期看看它到底写出了什么工具。#deepseekv4 #deepseek #deepseek模型 #claudecode #AI编程
00:00 / 00:27
连播
清屏
智能
倍速
点赞
8252
合伙人Mike
1周前
从价格到护城河:DeepSeek冲击下的模型竞争格局 #壹渥观察 DeepSeek V4上线三周后,摩根大通的实地查验揭示:官方直营API凭借极致缓存复用机制,将输入缓存命中价打至第三方云厂商的四十分之一;与此同时,市场并非零和博弈,而是严重供不应求的增量爆发期——这直接宣告国内大模型行业进入「结构性分化」阶段。
00:00 / 07:17
连播
清屏
智能
倍速
点赞
233
鲁班大叔讲源码
5年前
MyBatis源码分析之二级缓存使用与命中场景
00:00 / 17:27
连播
清屏
智能
倍速
点赞
4
李飞说
1天前
DeepSeek把价格砍了75%,但重要的不是降价。 DeepSeek v4-pro,他们最强的模型,输入三块、输出六块。原价十二块。 v4-flash?一块钱一百万token。命中缓存?两分钱。 但我今天不是来报价格的。我想说的是——Token,正在从奢侈品变成自来水。 2015年流量10块钱100MB,没有抖音没有直播。后来流量便宜了,整个移动互联网炸了。 现在Token走同样的路。当调用AI的成本趋近于零,会冒出一大批我们今天想象不到的东西。 #DeepSeek #AI #Token
00:00 / 03:05
连播
清屏
智能
倍速
点赞
25
安之
4天前
ds高缓存命中工具推荐 刚接触VSCode的0基础小白看过来!分享个超好用的高缓存命中扩展~搭配DS国模和高缓存,入门真的轻松不少,对新手特别友好! #ai入门教程 #vscod #ai #ai代码 #agent
00:00 / 01:02
连播
清屏
智能
倍速
点赞
3
张司机在路上
3周前
Claude提示词缓存 Prompt Caching算法详解 之前的视频我们介绍了Claude Code如何利用Prompt Caching节省token的。这次我们深入讲解一下Claude Code客户端在请求里明文写的cache_control标记是如何工作的。 cache_control有两种用法。Automatic自动模式,请求顶层放一个字段,服务器自动给最后一个block打1个breakpoint,简单粗暴。Explicit明确指定,自己往block上挂,最多4个,位置自己挑。Claude Code用的是Explicit,3个breakpoint的位置全是它自己选的。3个分别标在system数组第2项末尾、第3项末尾、最新user消息末尾。前两个是稳定锚点,第3个是游标,每轮跟着最新输入往后跑。 3条核心原理: 原理1:缓存只在breakpoint位置写,写的是从头到这里的累积prefix。所以29个tools没标cache_control也被缓存——蹭system[1]的车一起打包写进去。 原理2:读的时候在breakpoint位置查不到,往前一个block查,最多查20个。它找的是"之前写过的条目",不是"现在稳定的内容"。 原理3:20格上限。超过就放弃。 官方博客Thariq的"Prompt Caching is Everything"分享了Claude Code围绕缓存的几个设计:分层(静态在前动态在后)、Plan Mode做成两个工具而不是swap工具集、Tool Search用defer_loading发轻量存根、compact共享原session的system+tools+history做前缀。两条提醒:不要中途切模型(缓存按模型分隔),不要中途改MCP/hook(整段前缀重来)。 #claude #个人开发者 #命令行 #AI工具 #张司机
00:00 / 06:46
连播
清屏
智能
倍速
点赞
414
简介:
您在查找“
reasonix缓存命中高的原因
”短视频信息吗?
帮您找到更多更精彩的短视频内容!
最新发布时间:2026-06-01 06:08
最新推荐:
非赛季精灵怎么确定出没出异色
要有去哪都一个人的勇气
特种兵密钥山谷怎么打
光头永爱钓鱼技巧
挽回的英文怎么说
昊艺在杨娇娇那什么时候出场
双胞胎解锁哪个面部
怎么爱因斯坦那么聪明
平陆运河航道主体工程完成后的意义
墨西哥为什么都戴面罩
相关推荐:
各科学时多少
怎么摔比自己高和力气大的人
chivalry歌曲安迷修
白鹿请工作人员吃包子原因
凉皮摆摊咋做才能又筋又软
超标蒙犽上线时间
油泼老虎斑做法
唐僧骑马咚那个咚手势舞怎么有卡点
审务督察的作用
魔兽世界在哪抄饰品
热门推荐:
怎么让豆包生成剧本里需要的素材
yu7gt怎么看开场动画
小品为什么用ai
cc switch配置小米订阅
新款90promax
你真的会用苹果闹钟吗
抖音纯原特效教程
淘宝开票销方名称不一致什么意思
顺丰同城骑士c能力值怎么激活
经纬线p图教程