00:00 / 05:36
连播
清屏
智能
倍速
点赞14
00:00 / 01:19
连播
清屏
智能
倍速
点赞70
00:00 / 01:47
连播
清屏
智能
倍速
点赞14
补齐 DeepSeek V4 视觉短板:免费本地部署方案! 智能体时代,多模态是入场券,但很多前沿大模型推理虽强,却不支持图像输入。本期视频以 DeepSeek V4 Pro 为例,手把手演示,如何用本地部署的 Qwen3.6-35B-A3B 为它补齐识图能力。从 Claude Code 配置 Python 虚拟环境、编写识图 Skill,到规避图片 base64 污染上下文,全程实操。最后用真实任务验证:两张杂志截图直接生成英语播客课件,逐字对照原图,一字不差。本地加云端的混合推理,方便、免费、成本可控,建议有动手能力的朋友试试看! 视频里提到的 Claude Code 里创建识图Skill 的提示词: 创建一个全局 Skill 及对应的代码,用于图像识别(注意并不是 OCR)并返回 Markdown 文本。当用户提供图片时,Skill 应使用自带的 Python 代码,自动执行以下操作: 1. 将图片缩放到最长边 ≤1280 px; 2. 将图片及识图默认提示词:“识别图片里所有信息,使用 markdown 输出全部内容,并保持排版的一致”,发送到本地视觉 API(你的本地识图 api 地址+/v1/chat/completions); 3. 获取 Markdown 文本,并提供给会话供后续操作。 关于 Python:请检查主目录下的 python 虚拟环境,如果没有创建,请在 Claude Code 主目录下新建 venv,并在未来执行所有 python 代码时,统一使用这个虚拟环境。 #deepseek #claude#智能体 #大模型 #人工智能
00:00 / 13:21
连播
清屏
智能
倍速
点赞221
00:00 / 05:02
连播
清屏
智能
倍速
点赞3
00:00 / 02:20
连播
清屏
智能
倍速
点赞42