00:00 / 02:59
连播
清屏
智能
倍速
点赞15
00:00 / 05:36
连播
清屏
智能
倍速
点赞14
补齐 DeepSeek V4 视觉短板:免费本地部署方案! 智能体时代,多模态是入场券,但很多前沿大模型推理虽强,却不支持图像输入。本期视频以 DeepSeek V4 Pro 为例,手把手演示,如何用本地部署的 Qwen3.6-35B-A3B 为它补齐识图能力。从 Claude Code 配置 Python 虚拟环境、编写识图 Skill,到规避图片 base64 污染上下文,全程实操。最后用真实任务验证:两张杂志截图直接生成英语播客课件,逐字对照原图,一字不差。本地加云端的混合推理,方便、免费、成本可控,建议有动手能力的朋友试试看! 视频里提到的 Claude Code 里创建识图Skill 的提示词: 创建一个全局 Skill 及对应的代码,用于图像识别(注意并不是 OCR)并返回 Markdown 文本。当用户提供图片时,Skill 应使用自带的 Python 代码,自动执行以下操作: 1. 将图片缩放到最长边 ≤1280 px; 2. 将图片及识图默认提示词:“识别图片里所有信息,使用 markdown 输出全部内容,并保持排版的一致”,发送到本地视觉 API(你的本地识图 api 地址+/v1/chat/completions); 3. 获取 Markdown 文本,并提供给会话供后续操作。 关于 Python:请检查主目录下的 python 虚拟环境,如果没有创建,请在 Claude Code 主目录下新建 venv,并在未来执行所有 python 代码时,统一使用这个虚拟环境。 #deepseek #claude#智能体 #大模型 #人工智能
00:00 / 13:21
连播
清屏
智能
倍速
点赞384
00:00 / 01:28
连播
清屏
智能
倍速
点赞74
00:00 / 02:30
连播
清屏
智能
倍速
点赞3
00:00 / 01:13
连播
清屏
智能
倍速
点赞84
Qwopus3.6-27B 本地部署,24G 显卡轻松跑 Qwen 加 Opus,缝合怪又来了,这次是 27B 本地版。大家好,我是AI学习的老章。今天聊一个有意思的开源模型,Qwopus3.6-27B-v1-preview,作者 Jackrong。光看名字你就懂了,Qwen 加 Opus,意思是拿 Claude Opus 的蒸馏数据,去调教 Qwen3.6-27B。底座是阿里的 Qwen3.6-27B 稠密模型,原生 262K 上下文,能扩到 1M。训练用的 Unsloth,数据是 Claude 蒸馏数据集打底,混入 GLM-5.1、Kimi-K2.5、Qwen3.5 的推理数据。最关键的一步在这,作者用一个 8B 模型当过滤器,把风格跑偏的样本剔掉,最后只留 12K 条调性统一的高质量数据。这思路特别反直觉,别人都是越多越好,他在做减法。我觉得这个项目最值得琢磨的就是这个点,吃什么长什么样,数据干净,比数据多重要得多。早期评测合作者用 16 条 prompt,单卡 5090 跑 GGUF 量化版,覆盖 Agentic 推理、前端设计、创意 Canvas 三类场景,对比的是 Qwen3.6-27B 原版。但说实话,16 条样本,作者自己都说是 early signal,谁也别当定论。GGUF 仓库已经放出来,量化档位很全,IQ4_XS 是 15.2 G,单张 24G 显卡就能跑,4090、5090、3090 都行。Q2_K 是 10.7 G,16G 显卡能塞但损失不小。直接用 llama.cpp 或者 Ollama 拉起来就行。我的看法是,值得关注,但别神化。它是 preview 版,作者自己都说在探路。但这个思路把 Claude 风格用工程手段迁移到可本地部署的 27B 模型上,加上 Apache-2.0 协议商用友好,给国产开源生态加了一个有 Claude 味儿的选择,这个角度挺难得。手上有 4090、5090 的玩家可以尝个鲜,正式版出来我再拉出来实测一波
00:00 / 02:13
连播
清屏
智能
倍速
点赞193
00:00 / 05:19
连播
清屏
智能
倍速
点赞3