补齐 DeepSeek V4 视觉短板:免费本地部署方案! 智能体时代,多模态是入场券,但很多前沿大模型推理虽强,却不支持图像输入。本期视频以 DeepSeek V4 Pro 为例,手把手演示,如何用本地部署的 Qwen3.6-35B-A3B 为它补齐识图能力。从 Claude Code 配置 Python 虚拟环境、编写识图 Skill,到规避图片 base64 污染上下文,全程实操。最后用真实任务验证:两张杂志截图直接生成英语播客课件,逐字对照原图,一字不差。本地加云端的混合推理,方便、免费、成本可控,建议有动手能力的朋友试试看! 视频里提到的 Claude Code 里创建识图Skill 的提示词: 创建一个全局 Skill 及对应的代码,用于图像识别(注意并不是 OCR)并返回 Markdown 文本。当用户提供图片时,Skill 应使用自带的 Python 代码,自动执行以下操作: 1. 将图片缩放到最长边 ≤1280 px; 2. 将图片及识图默认提示词:“识别图片里所有信息,使用 markdown 输出全部内容,并保持排版的一致”,发送到本地视觉 API(你的本地识图 api 地址+/v1/chat/completions); 3. 获取 Markdown 文本,并提供给会话供后续操作。 关于 Python:请检查主目录下的 python 虚拟环境,如果没有创建,请在 Claude Code 主目录下新建 venv,并在未来执行所有 python 代码时,统一使用这个虚拟环境。 #deepseek #claude#智能体 #大模型 #人工智能
00:00 / 13:21
连播
清屏
智能
倍速
点赞331
Thinking模式是如何让Claude Code变聪明的 Claude Code的`/config`里有个thinking mode开关,Claude App的回答前也常挂一段灰色「思考过程」。这一期用claude-tap抓真实请求拆开看——这段思考到底是装饰,还是真的在影响最终答案。 先说本质。普通模式是 上下文 → 行动;thinking模式是 上下文 → 中间推理 → 行动。中间多出来那段是模型给自己行动之前写的草稿。关键在Transformer,生成下一个token时前面所有token都是上下文,所以这段先写的thinking会被自己读回去当输入。 请求体两个字段:thinking: "adaptive"让模型自己决定想不想、想多深;effort: "high"控制深度,五档low/medium/high/xhigh/max,档位越高越细越慢。 响应体content数组两块。我贴了cache.js(带TTL的内存缓存)和app.js(set一秒TTL两秒后get,期望null实际拿到值),问根因和修复。thinking block里干一件事——定位bug在get函数:取出entry但没检查过期。text block给修复:在get里对比`Date.now()`和`entry.expiry`,过期就删除返回null。thinking做诊断,text基于诊断出修复——thinking是text的地基。 这段思考怎么来的?大模型训练四步:预训练 → 指令微调 → RLHF → Reasoning Tuning。普通模型走前三步就上线,reasoning模型多走第四步。样本格式从"问题+答案"变成"问题+`<reasoning>`+`<answer>`"。比如解2(x-3)=14,普通样本直接给x=10,推理样本先在reasoning里写Step 1、2、3再给answer。模型反复看,就把"先写推理再答"内化成了输出习惯。运行时再靠`thinking: adaptive`字段显式开启——没这字段,模型想推理也没地方写。 所以开关控制的是模型张嘴前要不要先把思路在心里过一遍。代价是慢一点、token多烧一点;好处是同一个bug它会枚举可能性、排除错误选项,再给答案。 下次你的Claude Code请求看着没动静,可能就是它在写草稿。 #claude #个人开发者 #程序员 #AI工具 #张司机
00:00 / 06:58
连播
清屏
智能
倍速
点赞302
00:00 / 01:44
连播
清屏
智能
倍速
点赞2217
00:00 / 05:12
连播
清屏
智能
倍速
点赞7
00:00 / 06:02
连播
清屏
智能
倍速
点赞33
00:00 / 01:11
连播
清屏
智能
倍速
点赞48
00:00 / 02:45
连播
清屏
智能
倍速
点赞18
00:00 / 01:05
连播
清屏
智能
倍速
点赞22