00:00 / 03:59
连播
清屏
智能
倍速
点赞27
AI 产品经理实战篇之token怎么控制 你知道跟 ChatGPT 聊一次天,到底要花多少钱吗? 很多人以为免费版就不花钱,但 OpenAI 后台为你这一句话,可能已经烧了几毛钱。这个单位叫 Token。 ① Token 是什么 大模型眼里的最小语言单位。你打的字、AI 回的话都要先切成 Token,模型才能处理。大模型按 Token 数量收钱。 中英文换算(背下来): 1 个中文字 ≈ 1.5-2 token 1 个英文单词 ≈ 1.3 token 一句"今天天气真好" ≈ 9 token 1000 字中文文章 ≈ 1500-2000 token ② 到底烧多少钱 GPT-4 每百万 token 5-15 美元,国产 DeepSeek 1-8 元人民币,差 10 倍以上。 假设你做一个 AI 客服,用 GPT-4 跑:每天 1000 用户 × 10 轮 × 500 token = 500 万 token / 天 = $30-50 / 天 = 月烧 $1500 起。 这还没算 RAG 重复输入、多 Agent 互相调用、System Prompt 重复消耗、失败重试。真实成本往往是估算的 2-3 倍。 ③ AI PM 怎么省 Token 老板不问模型多牛,只问能不能再省一半。4 招按效果从高到低: Prompt Caching(提示词缓存)→ 省 90% 分场景选模型(简单任务用便宜的)→ 省 70% 压缩上下文(只传相关历史)→ 省 50% 设 max_tokens 上限 → 省 30% 面试金句(直接抄) 被问"怎么控制 AI 产品成本",按 4 句答: 第 1 句:开 Prompt Caching 第 2 句:分场景选模型,便宜的先用 第 3 句:压缩上下文,只传相关历史 第 4 句:设 max_tokens 上限 4 招用完,一个月省 1 万美元起。 一句话总结 会算 Token 的 AI PM,才是真正能落地的 AI PM。 下条讲上下文窗口,AI 为啥总忘了你说过什么。关注 NOVA,每天一个 AI PM 知识点。 评论区聊,你公司 AI 产品一个月烧多少钱? #AI产品经理 #Token #AI成本 #大模型 #AIPM求职
00:00 / 03:34
连播
清屏
智能
倍速
点赞27
00:00 / 04:01
连播
清屏
智能
倍速
点赞4404
00:00 / 01:42
连播
清屏
智能
倍速
点赞570
00:00 / 05:53
连播
清屏
智能
倍速
点赞195
00:00 / 01:01
连播
清屏
智能
倍速
点赞5
00:00 / 02:41
连播
清屏
智能
倍速
点赞13
00:00 / 08:45
连播
清屏
智能
倍速
点赞2
教你最大化Claude Code缓存命中来节省token 之前两期讲了Prompt Cache怎么省token、breakpoint怎么命中。这期反过来讲:什么动作会让cache直接报废,怎么用才能最大化命中率。 先给一个心法。 把每个请求想成一根从左到右的链条:tools → system → CLAUDE.md/skills → messages。改哪一段都会让cache失效,区别只在影响范围:改左边的从这段往右全部跟着废,改右边的只伤自己那一段。所以越靠左越要锁死。官方三级失效层级表(tools/system/messages)就是这个原则的精简版(CLAUDE.md严格来说在messages层,单独抽出来是因为它最常被改)。 4个日常杀手,按它们出现在链条上的位置从左到右排: 1. 切 /model —— 最左。每个模型独立的KV cache,跨模型完全隔离。Opus跑了10万token再切Sonnet,反而比继续用Opus更贵。非要切?正解是用subagent隔出去跑(Claude Code的Explore agent就是这么干,用的Haiku) 2. 装新MCP —— tools层。装一个新MCP,tools数组就多几个工具,链条最左边一动,下面system+messages连锁失效(三层全废)。但MCP只在Claude Code启动时读一次,session内装新MCP不影响当前session——真正的杀手是 /resume 或 /reload-plugins,触发重读后tools数组重组,之前cache全丢 3. 改CLAUDE.md 或装新 skill —— messages层。CLAUDE.md 是 user 消息(052已实证),skill 列表也注入在 messages[0]——都只在启动时读一次:改完文件或装完 skill 别 /resume,否则 messages 整段重建 4. idle超过5分钟 —— TTL过期,服务器直接删条目 每个杀手都给出怎么避免:MCP/hook 启动前一次配好;长任务前 `export ENABLE_PROMPT_CACHING_1H=1` 把 TTL 延到 1 小时。 #claude #AI工具 #张司机 #个人开发者 #命令行
00:00 / 04:16
连播
清屏
智能
倍速
点赞346
00:00 / 00:31
连播
清屏
智能
倍速
点赞68
00:00 / 01:30
连播
清屏
智能
倍速
点赞2