Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko; compatible; ClaudeBot/1.0; +claudebot@anthropic.com)
精选
推荐
搜索
探索
直播
放映厅
短剧
小游戏
搜索
您是不是在找:
codex上的skill怎么是空的
jup完结是什么
obs吸附和范围挂的区别
claude查出时间了怎么办
codex怎么加技能让它改代码
扣子编程怎么购买token?
ecc安装给openclaw
封obs的原理是什么
obsAI识别怎么做到的
Cloud CodeQQ机器人怎么
东辰视觉
1周前
无限制,免破甲,本地部署大语言模型,只需一步操作。#本地部署 #ollama #大语言模型 #破甲 #qwen
00:00 / 02:49
连播
清屏
智能
倍速
点赞
57
戚向北
2周前
Qwen 3.5 9B本地模型测试 测试一:自动搜索并下载图片 #hermes #qwen3.5 #本地模型 #aiagent
00:00 / 01:53
连播
清屏
智能
倍速
点赞
21
智慧工具坊
1月前
Qwen 3.5本地部署全攻略 2026算力大饥荒:别再排队等API #Qwen3.5 #ai教程
00:00 / 05:07
连播
清屏
智能
倍速
点赞
43
戚向北
2周前
Qwen 3.5 9b模型能力测试 测试任务二:自动生成PPT #hermes #hermes爱马仕 #qwen3.5 #本地大模型
00:00 / 01:47
连播
清屏
智能
倍速
点赞
12
新尊锐服务器
1月前
想本地部署Qwen的小伙伴们看过来,整理了Qwen3.5本地部署所需的硬件配置信息 #Qwen #千问 #ai本地部署 #电脑硬件 #ai
00:00 / 01:41
连播
清屏
智能
倍速
点赞
10
绘世玩家
2周前
llama.cpp本地部署 llama.cpp本地部署&集成Qwen3.6大模型-效率起飞 #comfyui #ComfyUI教程 #llama #qwen
00:00 / 08:21
连播
清屏
智能
倍速
点赞
67
AI赚钱研究社
3月前
Qwen 3.5中杯发布:本地部署教程 深度解析 Qwen 3.5 各版本差异,分享 35B-A3B 本地部署避坑参数与显存优化技巧。#Qwen35 #大模型 #vllm #SGLang #本地部署
00:00 / 05:26
连播
清屏
智能
倍速
点赞
891
搬砖最勤快
1周前
测试下本地小模型的应用 本期测试的是在简单的日常单据入库出库流程,本地小模型可以担任什么角色,可以去完成简单又能让我们省时的工作,为何不用ocr?因为测试过会有错误,需要拍的比较正,字迹比较清楚的单据使用起来成功率较高,用多模态小模型的好处是他识别后提取,再按要求整理成程序可以识别的表格,错误率降低不少。下一期极限点 把qwen3.5 9b q4km换成qwen3.5 2b q8,试试同个工作流他能否胜任。#本地部署 #ai #qwen #应用 #人工智能
00:00 / 03:46
连播
清屏
智能
倍速
点赞
26
戚向北
2周前
Qwen 3.5 9b能力测试 测试四:整理本地文件 #hermes #hermes爱马仕
00:00 / 00:53
连播
清屏
智能
倍速
点赞
14
kate人不错
2月前
Qwen3.5 小模型实测:0.8B 到 35B-A3B 这期视频我实测了 Qwen3.5 中小模型在本地端的真实表现: 你会看到: - 不同量化下的显存占用与推理速度差异 - 浏览器端 WebGPU 运行 0.8B 的体验 - 视觉识别/OCR 实测表现 - 9B 与 35B-A3B 在任务稳定性与效果上的差异 - LM Studio 关闭 thinking 的实操方法 - 在 OpenCode / Cline 中做工具调用与编码测试的结果 如果你也在找一套“能在本地跑、质量又够用”的模型组合,这期会很有参考价值。 时间戳 00:00 Qwen3.5 中小模型简介 00:50 格式与部署 02:21 显存与速度实测 03:40 视觉/OCR能力对比 05:33 本地实战案例 11:00 工具调用与编码测试 #Qwen35 #本地大模型 #Ollama #LMStudio #千问
00:00 / 13:28
连播
清屏
智能
倍速
点赞
707
小小XYZ
5天前
初具人性的本地部署Qwen3.5b模型 #本地部署#大模型#哲学#生活#训练
00:00 / 01:19
连播
清屏
智能
倍速
点赞
0
Tony沈哲
2月前
本地 AI 推理平台 第十一期 Vol.11|Qwen3.5-9B 实测:代码 + VLM + Agent 这一期我们实测一个新的本地模型:Qwen3.5-9B。 它不仅是一个 9B 参数的代码模型,同时还是一个 VLM(视觉语言模型),支持图像理解。 所以这一期我设计了三个测试场景,看看这个模型在真实工程中的表现: 测试 1:纯 LLM 能力 让模型实现一个 OpenCV C++ 的直方图匹配算法, 主要观察: * 代码质量 * OpenCV API 使用 * 算法逻辑 看看一个 9B 模型本身的代码能力到底如何。 测试 2:VLM 多模态能力 因为 Qwen3.5-9B 是 多模态模型, 我们给它输入一张图片,让模型描述图片内容。 测试它的 图像理解能力。 测试 3:Agent 工程能力(重点) 在真实工程里,模型不仅要回答问题,还要 完成任务。 所以这一部分让 Agent 自动完成一个工程操作: 生成一个 OpenCV C++ 的直方图匹配函数 并自动保存为: histogram_match.cpp 通过这个例子可以看到: 模型能力 → 如何变成 Agent 的工程能力 这一期主要想回答一个问题: 一个 9B 的本地模型,在代码、视觉、多工具 Agent 场景下到底能做到什么程度? 如果你对 本地 AI 推理 / Agent / RAG / 小模型能力实测感兴趣,欢迎关注这个系列。 #Qwen #本地大模型 #LLM #VLM #Agent
00:00 / 07:43
连播
清屏
智能
倍速
点赞
42
不夜
4周前
本地4种软件部署qwen3.6-27b性能测试 ollama,llama.cpp,LMstudio,vLLM本地部署测试#ollama#llamacpp#lmstudio#AI#vLLM
00:00 / 10:27
连播
清屏
智能
倍速
点赞
163
沪上码仔AI
2月前
#qwen3.5 #LLM #开源大模型 #mac #本地部署 在Mac book上本地部署qwen3.5大模型测试结果。使用LMStudio进行本地部署大模型。实测qwen3.5最新开源大模型。
00:00 / 02:11
连播
清屏
智能
倍速
点赞
442
单车酒吧搞机社
2周前
企业AI本地部署,买机器?洗数据! #AI本地部署 #AI装机 #deepseek本地部署 #Qwen
00:00 / 05:53
连播
清屏
智能
倍速
点赞
1324
外行人搞AI
1周前
VLLM+Qwen3.5的部署实践 #VLLM#千问
00:00 / 01:28
连播
清屏
智能
倍速
点赞
74
沪上码仔AI
2周前
#本地大模型 #qwen #自动回复 #AI #AI应用 本地大模型支持全自动回复。
00:00 / 00:51
连播
清屏
智能
倍速
点赞
37
AI猿姗姗
1年前
20分钟学会qwen大模型本地部署+微调法律大模型,只需5G 20分钟学会qwen大模型本地部署+微调法律大模型(只需5G内存) #大语言模型 #qwen #通义千问 #大模型本地部署 #大模型微调
00:00 / 25:56
连播
清屏
智能
倍速
点赞
217
单车酒吧搞机社
3周前
Qwen3.5大模型本地部署的高性价比服务器怎么配 #Qwen#AI本地部署 #AI装机 #硬件配置 #大模型本地部署
00:00 / 06:54
连播
清屏
智能
倍速
点赞
1735
耍耍Al
1周前
本地测试QW3.6编程任务表现-3/6#Qwen #LLM #Agent
00:00 / 01:30
连播
清屏
智能
倍速
点赞
11
yx1n
1月前
最新量化版模型本地部署 Qwen3.5-9B-Claude-4.6-Opus-Reasoning-Distilled-v2-GGUF Q4_K_M量化 经过Claude-4.6-Opus蒸馏版本 在普通家用电脑也可以超快处理128k上下文 #Ai #大模型 #Claude #千问 #开源
00:00 / 00:57
连播
清屏
智能
倍速
点赞
912
王纯迅
1月前
OpenCLaw终于在本地把qwen3.5-27b跑起来了 #openclaw #人工智能 #qwen #ollama #vLLM
00:00 / 08:12
连播
清屏
智能
倍速
点赞
291
㤅
2周前
#本地大模型 #qwen #ai #本地部署 #3080显卡
00:00 / 05:36
连播
清屏
智能
倍速
点赞
15
AI技能教学网
1月前
Qwen3.5蒸馏版本地部署教程 解析Qwopus核心优势:专注代码与硬逻辑,支持3090及Mac本地部署,拒绝废话干活快。#Qwen35 #大模型 #本地部署 #ClaudeCode #人工智能
00:00 / 03:31
连播
清屏
智能
倍速
点赞
374
懂AI的引路哥
1月前
本地Qwen3.5 9B接OpenClaw #Qwen3.5 9B #OpenClaw #模型调优 #本地部署 #bug修复
00:00 / 01:30
连播
清屏
智能
倍速
点赞
50
IT产品及方案专业供应商__田工
1月前
1534 纯本地openclaw+Qwen3.54b运行环境 #openclaw
00:00 / 01:23
连播
清屏
智能
倍速
点赞
22
通义实验室
1年前
手机也能跑 Qwen3?手把手教你部署! 全球开源模型冠军 Qwen3 、端到端全模态模型 Qwen2.5- Omni 在手机上也能跑通啦!Android、 iOS、桌面端通通安排~ #通义 #Qwen #大模型 #教程 #涨知识
00:00 / 01:40
连播
清屏
智能
倍速
点赞
NaN
Ai 学习的老章
3天前
Qwen3.6 上了MTP,本地推理速度起飞
00:00 / 01:13
连播
清屏
智能
倍速
点赞
87
再见静无言
2月前
#qwen3.5 #ai #agent#自动操作电脑 利用本地的qwen3.5 9b量化模型借鉴autoglm项目让agent自主操作自己的电脑,可玩性较强
00:00 / 08:59
连播
清屏
智能
倍速
点赞
22
kate人不错
1周前
Mac 本地跑 Qwen3.6-27B,我实测了 4 种方案 这期视频我系统测试了 Qwen3.6-27B 在 Mac 上的本地运行体验。 我一共体验了 4 种方式:Qwen Chat 官网版本、Unsloth 的 UD-Q5 GGUF、Unsloth MLX 6bit 搭配 DFlash,以及最后速度最让我满意的 MTPLX 4bit 方案。 这次重点不是只看跑分,而是看它在真实任务里的表现:网页复刻、交通仿真、3D 魔尺、礼物包装助手、仓库分拣系统、体素艺术场景、写作、推理和幻觉识别。整体来看,Qwen3.6-27B 的编码和创作能力确实很强,尤其在 MTPLX 上,本地速度可以跑到 40 tok/s 以上,对 Mac 用户来说体验提升非常明显。 当然,它也不是完美的。比如复杂 3D 场景会出现穿模、逻辑不稳定、动效不准确等问题;MTPLX 当前也不支持图像识别。但如果你想在 Mac 上本地运行一个速度快、质量不错、适合 AI 编程和日常任务的 27B 模型,Qwen3.6-27B 很值得尝试。 本期会聊到: - Qwen3.6-27B 为什么值得关注 - Mac 上运行 27B 稠密模型的真实速度 - GGUF、MLX、DFlash、MTPLX 的体验差异 - MTPLX 的安装和 Open WebUI 接入体验 - 4bit 模型在编码、写作和推理任务中的表现 - 我目前更推荐哪一种本地运行方案 如果你也在 Mac 上折腾本地大模型、AI 编程模型或 Qwen 系列模型,这期可以作为一个实际体验参考。 时间戳 00:00 开场:为什么这期要测 Qwen3.6-27B 02:21 Mac 上运行 Qwen3.6-27B 的几种新方案 05:00 官网版本与 Unsloth GGUF 10:37 Unsloth MLX 6bit + DFlash 16:34 MTPLX 上手 20:50 写作、推理、幻觉识别测试 #Qwen #Qwen36 #Qwen3_6_27B #本地大模型 #Mac本地部署 #AI编程
00:00 / 24:26
连播
清屏
智能
倍速
点赞
25
郑州智沛科技
2月前
Openclaw用本地模型也可以干活了,先养着玩玩
00:00 / 00:38
连播
清屏
智能
倍速
点赞
143
爱开车的程序猿
4周前
我训了 1 周本地 Qwen,架构循环救活了吗? 第三集留了个钩子:硬塞架构循环必崩,那如果训呢?这一集用一周时间给出答案。 实验设置:M4 Pro 64GB · Qwen 3.5-9B 4-bit · 冻结主干 · 中间 8 层挂 LoRA · 20K 数学样本 · 2 epoch · GSM8K 30 题评估。 四个深度依次跑: · Loop×1(depth 32 · 纯 LoRA)→ 83.3% · Loop×2(depth 40 · PEAK)→ 90.0%,超过 CoT 长思考的 86.7% · Loop×4(depth 56)→ 80.0%,反而退步 · Loop×8(depth 88)→ 训到 iter 250 直接 NaN,eval 抢救出 23.3% 倒 U 形给出双重洞察: ① 存在最优深度。多加 8 层就是甜蜜点,再多变成训练负担 ② 训练算力有边界。Depth 88 不是练得不够,是数值结构本身撑不住,必须用 OpenMythos 的 LTI 谱半径约束 完整训练journey:撞墙四次、阈值从 1GB 一路降到清缓存每步、grad_accum 从 16 砍到 1、断点续跑机制全部从零搭起。视频里都有。 #Qwen #LoRA #本地AI #MLX
00:00 / 02:16
连播
清屏
智能
倍速
点赞
48
碳基生物退役指南
1周前
补齐 DeepSeek V4 视觉短板:免费本地部署方案! 智能体时代,多模态是入场券,但很多前沿大模型推理虽强,却不支持图像输入。本期视频以 DeepSeek V4 Pro 为例,手把手演示,如何用本地部署的 Qwen3.6-35B-A3B 为它补齐识图能力。从 Claude Code 配置 Python 虚拟环境、编写识图 Skill,到规避图片 base64 污染上下文,全程实操。最后用真实任务验证:两张杂志截图直接生成英语播客课件,逐字对照原图,一字不差。本地加云端的混合推理,方便、免费、成本可控,建议有动手能力的朋友试试看! 视频里提到的 Claude Code 里创建识图Skill 的提示词: 创建一个全局 Skill 及对应的代码,用于图像识别(注意并不是 OCR)并返回 Markdown 文本。当用户提供图片时,Skill 应使用自带的 Python 代码,自动执行以下操作: 1. 将图片缩放到最长边 ≤1280 px; 2. 将图片及识图默认提示词:“识别图片里所有信息,使用 markdown 输出全部内容,并保持排版的一致”,发送到本地视觉 API(你的本地识图 api 地址+/v1/chat/completions); 3. 获取 Markdown 文本,并提供给会话供后续操作。 关于 Python:请检查主目录下的 python 虚拟环境,如果没有创建,请在 Claude Code 主目录下新建 venv,并在未来执行所有 python 代码时,统一使用这个虚拟环境。 #deepseek #claude#智能体 #大模型 #人工智能
00:00 / 13:21
连播
清屏
智能
倍速
点赞
402
王耀鐭
2月前
本地部署Qwen3.5: vllm VS llama.cpp #大模型部署 #大模型 #学习日常
00:00 / 07:32
连播
清屏
智能
倍速
点赞
38
AI伙夫长
1年前
全网都在找Qwen2.5-omni多模态大模型如何使用 这里我将告诉大家两个使用和申请他的方法,第一个直接就能使用,第二个可在手机端操作,快来拿走吧!#AI #AI工具 #qwen25omni #多模态ai
00:00 / 01:19
连播
清屏
智能
倍速
点赞
642
酋长师兄
3周前
本地大模型提速三倍方法Qwen3.6模型跑出200t/s生成 4090单显卡,本地大模型提速三倍Qwen3.6模型跑出200t/s生成 #本地大模型提速 #本地大模型配置 #MTP配置
00:00 / 04:40
连播
清屏
智能
倍速
点赞
348
爱开车的程序猿
1月前
上期我们扒完了 OpenMythos 的代码,留了个悬念:RDT 循环深度 Transformer 这套思路,能不能直接拿现成的 Qwen 来玩?这期给答案。 M4 Pro + MLX + Qwen3.5-9B 4bit,两条 test-time compute 路线硬怼: · 思维链 CoT:256 tok → 768 → 2048,精度 10% → 53% → 87% · 架构循环:原版 32 层 → depth 40 → 56 → 88,精度 53% → 37% → 27% → 3.3% 同一个模型、同一批 GSM8K 题,方向完全相反。 更戏剧的是 Loop×8 深度 88 的时候,模型不是答错,是直接塌缩到反复输出 "1"、"0" 或空白——硬件还在算,大脑已经宕机。 视频里讲清楚三件事: ① 魔改代码只有一行:Python list 复制中间 8 层 ② CoT 为什么赢得干净利落 ③ 架构循环为什么会让 LayerNorm 失调、Softmax 塌缩 实战结论:想让本地模型变聪明,老老实实堆思维链 tokens;想搞 RDT?必须从训练开始。下期继续做"真·训练版 Qwen-RDT 嫁接"。 #AI #大模型 #Qwen #Transformer #MLX
00:00 / 02:00
连播
清屏
智能
倍速
点赞
80
yx1n
1月前
日常基础能力测试 Qwen3.5-9B-Claude-4.6 蒸馏版模型 #Ai #OpenClaw #大模型 #编程 #计算机 本地部署
00:00 / 05:08
连播
清屏
智能
倍速
点赞
116
波哥的AI课
1周前
告别付费 API !Ollama本地模型+OpenClaw 零基础本地部署 Ollama 教程!Windows/Mac/Linux 全平台,5 分钟安装、一键拉取 Qwen/Llama3/DeepSeek 等模型,附 OpenClaw 对接配置,本地 API 永久免费、数据安全,多 Agent 开发必备!#OpenClaw #AI #Agent #Ollama #Hermes
00:00 / 05:02
连播
清屏
智能
倍速
点赞
145
大维
4天前
99%人不知道的收藏夹备份方法,换电脑直接复原 重装系统更换电脑总弄丢收藏网址?教你最简单的浏览器收藏夹导出导入方法,生成HTML本地备份文件,随时随地一键恢复所有书签,不用云端同步,安全又稳妥,电脑实用干货技巧,新手也能轻松学会!#电脑技巧 #电脑干货 #实用教程 #电脑知识#科技改变生活 #办公技巧
00:00 / 01:09
连播
清屏
智能
倍速
点赞
18
橙色溪流
1月前
本地运行大模型:该省的省,该花的花! Unsloth✖️MLX ,拉爆本地推理效率! Qwen 3.5 采用了全自注意力(Self-Attention)+ GatedDeltaNet 的混合架构。这种设计有一个致命弱点:不同的架构组件对精度丢失的敏感度天差地别。 如果你给每个权重都强加相同的位宽(比如粗暴的 4-bit),结果就是灾难。底层数据显示,在同一套量化方案下,`lm_head` 张量的 KL 散度(KLD)只有极低的 0.05,稳如老狗;但像 `linear_attn.out_proj` 这种核心输出层,KLD 直接飙到 6.0! 这两天,Unsloth 的Dynamic 2.0 逐张量量化技术被完美移植到了针对 Apple Silicon 优化的 mlx 原生管线中 。 具体的效果我会持续跟进分享。 #科技下一站 #本地大模型 #开源项目 #ai工具学习 #超好用的ai指令分享
00:00 / 01:21
连播
清屏
智能
倍速
点赞
1053
子龙爱分享
2月前
我量化了Qwen3.5_35B!显存速度质量全拉满+本地养虾 完犊子!我不小心把Qwen3.5_35B量化了!显存速度质量全拉满+联网技巧,OpenClaw本地轻松养虾!50系显卡的春天#openclaw #本地模型 #ai #开源 #分享
00:00 / 25:48
连播
清屏
智能
倍速
点赞
137
Ai 学习的老章
3天前
Qwen3.6 MTP加速,本地部署+ ClaudeCode Qwen3.6 MTP加速,本地部署,驱动 Claude Code
00:00 / 01:22
连播
清屏
智能
倍速
点赞
100
AI趋势解码
1周前
OpenAI的Codex现在能免费本地运行开源模型了 本地免费跑AI代码助手?Codex Ollama正式支持开源模型,Gemma 4、Qwen 3.6等模型本地托管,零成本使用AI编码能力。#Codex #ai #ai工具 #人工智能 #Ollama
00:00 / 01:47
连播
清屏
智能
倍速
点赞
132
琪琪AI科技
1周前
拒绝云端泄密!阿里QwenPaw 本地部署才是真香选择!#阿里 #QwenPaw #本地部署 #AI
00:00 / 01:49
连播
清屏
智能
倍速
点赞
3379
延安科创-蔡老师
1月前
TurboQuant + 权重量化 = 组合爆炸 Google Turbo Quant 在 Atomic Chat 中本地运行 MacBook Air M4 16 GB 模型型号:QWEN3.5-9B 上下文窗口:50000 几秒钟内概括2万字的内容…… 您可以设置比以前大 3 倍的上下文窗口,处理速度提高 3 倍!下载地址:https://atomic.chat/
00:00 / 00:35
连播
清屏
智能
倍速
点赞
22
巛Turned丶陌影
3周前
RAGFlow+ollama+qwen3.5部署AI知识库 RAGFlow是为解决AI知识不足,新数据不能实时更新,容易出现幻觉等问题RAGFlow+ollama+lmstudio本地部署,可与本地AI对接api来运行。其中本地大模型需要ollama和lmstudio来运行,qwen3.5是本地比较常用的LLM模型,embedding模型shaw/dmeta是用来对输入数据做向量处理。此外还涉及到docker容器技术#AI #RAG #知识库 #人工智能 #openai
00:00 / 11:14
连播
清屏
智能
倍速
点赞
12
STAD星光工作室
1周前
本地文件如何导入到手表中? #vivo教学 #vivo手表watch2 #vivo手表 #手机 #手表
00:00 / 03:00
连播
清屏
智能
倍速
点赞
12
耍耍Al
1周前
本地测试QW3.6编程任务表现-5/6#Qwen #LLM #Agent
00:00 / 01:28
连播
清屏
智能
倍速
点赞
2
刘东-长乐未央
2月前
OpenClaw 安装、配置使用本地 Qwen 3.5 模型 #OpenClaw #AI #本地大模型
00:00 / 02:57
连播
清屏
智能
倍速
点赞
342
杨大哥
2月前
Qwen3.5 4b/9b, 适配龙虾机器人的本地模型
00:00 / 01:33
连播
清屏
智能
倍速
点赞
112
Ruby_Axxx
2月前
手搓本地agent测试 测试模型为qwen3.5-9b-q8_0量化版本,采用llama.cpp编译运行,测试过程的任务执行速度和工具调用能力在小参数模型里是一绝的#qwen #ai #agent #openclaw
00:00 / 01:40
连播
清屏
智能
倍速
点赞
2
大萌AI进化论
4天前
MiniMax Hub:全自动整理本地文件 #AIGC #AI #MiniMaxHub @大萌AI进化论
00:00 / 01:42
连播
清屏
智能
倍速
点赞
13
七小祁的成长笔记
2周前
模型切换 给我的智能助手添加了批量反思功能和模型切换功能,日常用ollma本地部署的Qwen 3.5 9B模型,然后每七天用云端模型将我的对话进行一次复盘总结,将优化后的能力迭代升级给智能助手#技术自学 #Ai #自我提升 #创作者扶持计划
00:00 / 01:41
连播
清屏
智能
倍速
点赞
1
子沐AIGC
1月前
告别API!5090本地部署千问QWEN3.5 27b模型 Windows+vllm+chatbox全流程#AI #OPENCLAW #本地部署 #5090
00:00 / 00:54
连播
清屏
智能
倍速
点赞
93
戚向北
2周前
Qwen 3.6 35B 能力测试 测试内容二:一句话自动生成PPT#软件开发 #hermes #hermes爱马仕 #本地模型 #千问大模型
00:00 / 01:46
连播
清屏
智能
倍速
点赞
17
莫失莫忘
3周前
4月27日(1) #opencode #qwen #AI应用 #大模型 #ai龙虾 #claudecode
00:00 / 02:01
连播
清屏
智能
倍速
点赞
20
大曼哒
2月前
本地部署智能体:Qwen3.5 + Claude Code 本视频将演示如何使用 Llama.cpp 和 Claude Code 在本地安装 Qwen3.5 4B 模型 #claude #ai编程 #千问qwen #ai #智能体
00:00 / 06:07
连播
清屏
智能
倍速
点赞
436
从小就坏®²⁰²⁶ ོ
1周前
本地大模型避坑指南:从硬件选型到推理优化 深入探讨了在本地部署大语言模型的核心逻辑,将其拆解为硬件、内存、运行环境、模型选择及量化五个关键维度。作者指出,内存带宽而非算力才是决定本地推理速度的瓶颈,并详细分析了苹果统一内存与英伟达显存的优劣。文中提供了实用的内存计算公式,强调上下文窗口对资源的隐形消耗,并对比了 Ollama 与 llama.cpp 等主流运行工具。针对模型选型,文章解释了量化技术如何在损失极小精度的情况下大幅降低硬件门槛,帮助用户在性能与质量间找到平衡。最后,作者分享了进阶优化技巧,旨在引导爱好者从单纯“跑起来”过渡到高效“跑得好”的专业阶段。
00:00 / 08:27
连播
清屏
智能
倍速
点赞
36
Ai 学习的老章
3周前
Qwopus3.6-27B 本地部署,24G 显卡轻松跑 Qwen 加 Opus,缝合怪又来了,这次是 27B 本地版。大家好,我是AI学习的老章。今天聊一个有意思的开源模型,Qwopus3.6-27B-v1-preview,作者 Jackrong。光看名字你就懂了,Qwen 加 Opus,意思是拿 Claude Opus 的蒸馏数据,去调教 Qwen3.6-27B。底座是阿里的 Qwen3.6-27B 稠密模型,原生 262K 上下文,能扩到 1M。训练用的 Unsloth,数据是 Claude 蒸馏数据集打底,混入 GLM-5.1、Kimi-K2.5、Qwen3.5 的推理数据。最关键的一步在这,作者用一个 8B 模型当过滤器,把风格跑偏的样本剔掉,最后只留 12K 条调性统一的高质量数据。这思路特别反直觉,别人都是越多越好,他在做减法。我觉得这个项目最值得琢磨的就是这个点,吃什么长什么样,数据干净,比数据多重要得多。早期评测合作者用 16 条 prompt,单卡 5090 跑 GGUF 量化版,覆盖 Agentic 推理、前端设计、创意 Canvas 三类场景,对比的是 Qwen3.6-27B 原版。但说实话,16 条样本,作者自己都说是 early signal,谁也别当定论。GGUF 仓库已经放出来,量化档位很全,IQ4_XS 是 15.2 G,单张 24G 显卡就能跑,4090、5090、3090 都行。Q2_K 是 10.7 G,16G 显卡能塞但损失不小。直接用 llama.cpp 或者 Ollama 拉起来就行。我的看法是,值得关注,但别神化。它是 preview 版,作者自己都说在探路。但这个思路把 Claude 风格用工程手段迁移到可本地部署的 27B 模型上,加上 Apache-2.0 协议商用友好,给国产开源生态加了一个有 Claude 味儿的选择,这个角度挺难得。手上有 4090、5090 的玩家可以尝个鲜,正式版出来我再拉出来实测一波
00:00 / 02:13
连播
清屏
智能
倍速
点赞
193
刘东-长乐未央
2月前
mac 使用 oMLX 本地运行 Qwen 3.5 AI模型 文字版内容,请看课程讲义文档:https://clwy.cn/courses/openclaw 注意:本课程使用oMLX部署,仅支持M 系列芯片的Mac。 Windows 用户,请改为Ollama或LM Studio。 #oMLX #千问 #Qwen #AI大模型
00:00 / 02:17
连播
清屏
智能
倍速
点赞
456
昆山糕糕数码
4天前
为什么 1+1 要思考 23 秒,有没大哥能教我下怎么优化? 我也醉了#ollama #qwen #本地部署大模型 #本地部署 mac os26 air m5 24+1tb 内存快爆了。cpu只用5% qwen3.5 4b
00:00 / 00:15
连播
清屏
智能
倍速
点赞
15
简介:
您在查找“
qwen3.5:9b如何解锁本地文件操作
”短视频信息吗?
帮您找到更多更精彩的短视频内容!
最新发布时间:2026-05-23 06:42
最新推荐:
白俄罗斯一元等于多少人民币
朋友圈都在晒520怎么回复
lr怎么看颜色构成
英语天天练活动社区在哪
至尊宠物每张图都能用吗
怎样快速了解经济行业
猫剪指甲怎么剪不会批
凡尘问道4季更新到哪了
学不瑞怎么停更了
徒徒步怎么生成清单
相关推荐:
男生错不过的好看的电影
萨隆矿坑T怎么带
25高会运动会周边
理想照耀中国小男孩活下来了吗
豆包今天怎么不好用了语音识别错误
昂库夺冠不喷香槟是什么原因
苏州太湖杜子腾
大耳狗之梦单抽好还是十连抽好
16件发型展示动作
蝶腭神经节针灸
热门推荐:
虫子显摆 臭显摆特效教程
LibTV怎么进行合规校验
那种可以跑的监控还能讲话是什么
deepseek代入自己怎么办
一加15紫色适合的手机壳
520朋友圈九宫格醒图教程
mac wps配置和修复工具在哪
红果短剧在哪里接单ai漫剧
欢鹿电竞您当前无法上机什么意思
theone陪伴聊崩了怎么办