00:00 / 00:20
连播
清屏
智能
倍速
点赞NaN
00:00 / 08:09
连播
清屏
智能
倍速
点赞10
00:00 / 01:24
连播
清屏
智能
倍速
点赞6
Thinking模式是如何让Claude Code变聪明的 Claude Code的`/config`里有个thinking mode开关,Claude App的回答前也常挂一段灰色「思考过程」。这一期用claude-tap抓真实请求拆开看——这段思考到底是装饰,还是真的在影响最终答案。 先说本质。普通模式是 上下文 → 行动;thinking模式是 上下文 → 中间推理 → 行动。中间多出来那段是模型给自己行动之前写的草稿。关键在Transformer,生成下一个token时前面所有token都是上下文,所以这段先写的thinking会被自己读回去当输入。 请求体两个字段:thinking: "adaptive"让模型自己决定想不想、想多深;effort: "high"控制深度,五档low/medium/high/xhigh/max,档位越高越细越慢。 响应体content数组两块。我贴了cache.js(带TTL的内存缓存)和app.js(set一秒TTL两秒后get,期望null实际拿到值),问根因和修复。thinking block里干一件事——定位bug在get函数:取出entry但没检查过期。text block给修复:在get里对比`Date.now()`和`entry.expiry`,过期就删除返回null。thinking做诊断,text基于诊断出修复——thinking是text的地基。 这段思考怎么来的?大模型训练四步:预训练 → 指令微调 → RLHF → Reasoning Tuning。普通模型走前三步就上线,reasoning模型多走第四步。样本格式从"问题+答案"变成"问题+`<reasoning>`+`<answer>`"。比如解2(x-3)=14,普通样本直接给x=10,推理样本先在reasoning里写Step 1、2、3再给answer。模型反复看,就把"先写推理再答"内化成了输出习惯。运行时再靠`thinking: adaptive`字段显式开启——没这字段,模型想推理也没地方写。 所以开关控制的是模型张嘴前要不要先把思路在心里过一遍。代价是慢一点、token多烧一点;好处是同一个bug它会枚举可能性、排除错误选项,再给答案。 下次你的Claude Code请求看着没动静,可能就是它在写草稿。 #claude #个人开发者 #程序员 #AI工具 #张司机
00:00 / 06:58
连播
清屏
智能
倍速
点赞171
00:00 / 00:36
连播
清屏
智能
倍速
点赞116
00:00 / 01:34
连播
清屏
智能
倍速
点赞1
00:00 / 12:09
连播
清屏
智能
倍速
点赞0
00:00 / 02:40
连播
清屏
智能
倍速
点赞182
教你最大化Claude Code缓存命中来节省token 之前两期讲了Prompt Cache怎么省token、breakpoint怎么命中。这期反过来讲:什么动作会让cache直接报废,怎么用才能最大化命中率。 先给一个心法。 把每个请求想成一根从左到右的链条:tools → system → CLAUDE.md/skills → messages。改哪一段都会让cache失效,区别只在影响范围:改左边的从这段往右全部跟着废,改右边的只伤自己那一段。所以越靠左越要锁死。官方三级失效层级表(tools/system/messages)就是这个原则的精简版(CLAUDE.md严格来说在messages层,单独抽出来是因为它最常被改)。 4个日常杀手,按它们出现在链条上的位置从左到右排: 1. 切 /model —— 最左。每个模型独立的KV cache,跨模型完全隔离。Opus跑了10万token再切Sonnet,反而比继续用Opus更贵。非要切?正解是用subagent隔出去跑(Claude Code的Explore agent就是这么干,用的Haiku) 2. 装新MCP —— tools层。装一个新MCP,tools数组就多几个工具,链条最左边一动,下面system+messages连锁失效(三层全废)。但MCP只在Claude Code启动时读一次,session内装新MCP不影响当前session——真正的杀手是 /resume 或 /reload-plugins,触发重读后tools数组重组,之前cache全丢 3. 改CLAUDE.md 或装新 skill —— messages层。CLAUDE.md 是 user 消息(052已实证),skill 列表也注入在 messages[0]——都只在启动时读一次:改完文件或装完 skill 别 /resume,否则 messages 整段重建 4. idle超过5分钟 —— TTL过期,服务器直接删条目 每个杀手都给出怎么避免:MCP/hook 启动前一次配好;长任务前 `export ENABLE_PROMPT_CACHING_1H=1` 把 TTL 延到 1 小时。 #claude #AI工具 #张司机 #个人开发者 #命令行
00:00 / 04:16
连播
清屏
智能
倍速
点赞194
00:00 / 00:35
连播
清屏
智能
倍速
点赞4