00:00 / 00:48
连播
清屏
智能
倍速
点赞14
00:00 / 01:21
连播
清屏
智能
倍速
点赞4
00:00 / 01:10
连播
清屏
智能
倍速
点赞50
补齐 DeepSeek V4 视觉短板:免费本地部署方案! 智能体时代,多模态是入场券,但很多前沿大模型推理虽强,却不支持图像输入。本期视频以 DeepSeek V4 Pro 为例,手把手演示,如何用本地部署的 Qwen3.6-35B-A3B 为它补齐识图能力。从 Claude Code 配置 Python 虚拟环境、编写识图 Skill,到规避图片 base64 污染上下文,全程实操。最后用真实任务验证:两张杂志截图直接生成英语播客课件,逐字对照原图,一字不差。本地加云端的混合推理,方便、免费、成本可控,建议有动手能力的朋友试试看! 视频里提到的 Claude Code 里创建识图Skill 的提示词: 创建一个全局 Skill 及对应的代码,用于图像识别(注意并不是 OCR)并返回 Markdown 文本。当用户提供图片时,Skill 应使用自带的 Python 代码,自动执行以下操作: 1. 将图片缩放到最长边 ≤1280 px; 2. 将图片及识图默认提示词:“识别图片里所有信息,使用 markdown 输出全部内容,并保持排版的一致”,发送到本地视觉 API(你的本地识图 api 地址+/v1/chat/completions); 3. 获取 Markdown 文本,并提供给会话供后续操作。 关于 Python:请检查主目录下的 python 虚拟环境,如果没有创建,请在 Claude Code 主目录下新建 venv,并在未来执行所有 python 代码时,统一使用这个虚拟环境。 #deepseek #claude#智能体 #大模型 #人工智能
00:00 / 13:21
连播
清屏
智能
倍速
点赞390
00:00 / 01:19
连播
清屏
智能
倍速
点赞95
00:00 / 00:50
连播
清屏
智能
倍速
点赞7
00:00 / 05:19
连播
清屏
智能
倍速
点赞3
00:00 / 05:36
连播
清屏
智能
倍速
点赞14
00:00 / 05:02
连播
清屏
智能
倍速
点赞3
Mac 本地跑 Qwen3.6-27B,我实测了 4 种方案 这期视频我系统测试了 Qwen3.6-27B 在 Mac 上的本地运行体验。 我一共体验了 4 种方式:Qwen Chat 官网版本、Unsloth 的 UD-Q5 GGUF、Unsloth MLX 6bit 搭配 DFlash,以及最后速度最让我满意的 MTPLX 4bit 方案。 这次重点不是只看跑分,而是看它在真实任务里的表现:网页复刻、交通仿真、3D 魔尺、礼物包装助手、仓库分拣系统、体素艺术场景、写作、推理和幻觉识别。整体来看,Qwen3.6-27B 的编码和创作能力确实很强,尤其在 MTPLX 上,本地速度可以跑到 40 tok/s 以上,对 Mac 用户来说体验提升非常明显。 当然,它也不是完美的。比如复杂 3D 场景会出现穿模、逻辑不稳定、动效不准确等问题;MTPLX 当前也不支持图像识别。但如果你想在 Mac 上本地运行一个速度快、质量不错、适合 AI 编程和日常任务的 27B 模型,Qwen3.6-27B 很值得尝试。 本期会聊到: - Qwen3.6-27B 为什么值得关注 - Mac 上运行 27B 稠密模型的真实速度 - GGUF、MLX、DFlash、MTPLX 的体验差异 - MTPLX 的安装和 Open WebUI 接入体验 - 4bit 模型在编码、写作和推理任务中的表现 - 我目前更推荐哪一种本地运行方案 如果你也在 Mac 上折腾本地大模型、AI 编程模型或 Qwen 系列模型,这期可以作为一个实际体验参考。 时间戳 00:00 开场:为什么这期要测 Qwen3.6-27B 02:21 Mac 上运行 Qwen3.6-27B 的几种新方案 05:00 官网版本与 Unsloth GGUF 10:37 Unsloth MLX 6bit + DFlash 16:34 MTPLX 上手 20:50 写作、推理、幻觉识别测试 #Qwen #Qwen36 #Qwen3_6_27B #本地大模型 #Mac本地部署 #AI编程
00:00 / 24:26
连播
清屏
智能
倍速
点赞25