查看AI文稿
酋长师兄
酋长师兄

粉丝1317获赞4236

相关视频

  • 8G显存-mtp加速:60~75.92t/s128k 写代码场景  
   #mtp #qwen3 #openclaw
    04:43
    查看AI文稿
  • llama.cpp本地部署 llama.cpp本地部署&集成Qwen3.6大模型-效率起飞 #comfyui  #ComfyUI教程  #llama  #qwen
    08:21
    查看AI文稿
  • 保持上下文窗口的同时利用mtp提升Qwen3.6模型运行速度 #MTP加速模型运行 #TurboQuant #加速Qwen27B
    03:17
    查看AI文稿
  • 手把手教会你!用Qwen3+RagFlow本地构建私人智能助手,22分钟全程干货无废话!#大模型 #人工智能 #智能助手 #Ai #程序员
    22:40
    查看AI文稿
  • 实战利用MTP补丁免费大幅提升Qwen3.6-27B运行速度 #mtp补丁
    04:05
    查看AI文稿
  • Qwen3.7-Max 刚上线,我连夜拿真实项目测了一遍 Qwen3.7-Max 上线后,榜单很亮眼:国产模型第一,官方也强调 Agentic Coding。
这期视频我们直接把它丢进真实项目里测:
图片生成 Agent:认证迁移、OAuth、用户隔离
Skills Agent:从 CLI 做成 Web UI
内容分析 Agent:字幕、标题、描述、封面一起拆解 
结论很简单:
Qwen3.7-Max 这代编程提升明显相较于前两代提升明显,已经能进真实项目候选; 
如果你做 Coding Agent 和多模态内容工作流,这期值得看。
如果你更看重深度复盘,DeepSeek 依然有自己的位置。 
@抖音科技  
#qwen37 #vibecoding大赏 #deepseekv4 #glm51 #ai新星计划
    07:29
    查看AI文稿
  • 本地4种软件部署qwen3.6-27b性能测试 ollama,llama.cpp,LMstudio,vLLM本地部署测试#ollama#llamacpp#lmstudio#AI#vLLM
    10:27
    查看AI文稿
  • 600W跑出官网级AI速度 一猫之下 1Cat-vLLM 1.0.0 实测来了:本地部署 Qwen3.6-27B-AWQ,四张 V100 同时跑起来,整机 GPU 功耗约 600W,实测生成速度达到 124–130 tokens/s。
同样提示词对比阿里云百炼官网速度,本地部署已经跑出非常接近甚至不输官网的体验。现场还让模型写代码、写贪吃蛇,看 1Cat-vLLM 在老 V100 平台上的推理表现到底能不能“飞起来”。
#Qwen #vllm #本地部署 #一猫之下 #v100显卡
    01:02
    查看AI文稿
  • 核显牛逼,270K Plus随手提15%核显性能 CS2跑175帧,qwen3.6 35b a3b也能跑出13Tokrn速度
#cpu #intel #270kplus #核显 #电脑
    04:30
    查看AI文稿
  • Qwen3.6 MTP加速,本地部署+ ClaudeCode Qwen3.6 MTP加速,本地部署,驱动 Claude Code
    01:23
    查看AI文稿
  • 5月4日 (1)(1) llama.cpp windows11 下源码编译#下源码编译 #llama#本地部署ai #Qwen #ai应用
    03:26
    查看AI文稿
  • Qwen3 6 27B对决MTP版 RT 在RTX 3090上同台竞技 普通版Qwen3 6 27B对战MTP版本 通过熔岩灯 迷你水族箱等相同编程任务 实测对比两者的生成速度 创意与指令遵循能力
    18:40
    查看AI文稿
  • RTX3090流畅跑Qwen3.6-35B详解
    05:56
    查看AI文稿
  • Mac 本地跑 Qwen3.6-27B,我实测了 4 种方案 这期视频我系统测试了 Qwen3.6-27B 在 Mac 上的本地运行体验。 
我一共体验了 4 种方式:Qwen Chat 官网版本、Unsloth 的 UD-Q5 GGUF、Unsloth MLX 6bit 搭配 DFlash,以及最后速度最让我满意的 MTPLX 4bit 方案。 
这次重点不是只看跑分,而是看它在真实任务里的表现:网页复刻、交通仿真、3D 魔尺、礼物包装助手、仓库分拣系统、体素艺术场景、写作、推理和幻觉识别。整体来看,Qwen3.6-27B 的编码和创作能力确实很强,尤其在 MTPLX 上,本地速度可以跑到 40 tok/s 以上,对 Mac 用户来说体验提升非常明显。 
当然,它也不是完美的。比如复杂 3D 场景会出现穿模、逻辑不稳定、动效不准确等问题;MTPLX 当前也不支持图像识别。但如果你想在 Mac 上本地运行一个速度快、质量不错、适合 AI 编程和日常任务的 27B 模型,Qwen3.6-27B 很值得尝试。 
本期会聊到: 
- Qwen3.6-27B 为什么值得关注
- Mac 上运行 27B 稠密模型的真实速度
- GGUF、MLX、DFlash、MTPLX 的体验差异
- MTPLX 的安装和 Open WebUI 接入体验
- 4bit 模型在编码、写作和推理任务中的表现
- 我目前更推荐哪一种本地运行方案 
如果你也在 Mac 上折腾本地大模型、AI 编程模型或 Qwen 系列模型,这期可以作为一个实际体验参考。 
时间戳 
00:00 开场:为什么这期要测 Qwen3.6-27B  
02:21 Mac 上运行 Qwen3.6-27B 的几种新方案  
05:00 官网版本与 Unsloth GGUF
10:37 Unsloth MLX 6bit + DFlash
16:34 MTPLX 上手
20:50 写作、推理、幻觉识别测试 
#Qwen  #Qwen36  #Qwen3_6_27B  #本地大模型 #Mac本地部署  #AI编程
    24:27
    Mac 本地跑 Qwen3.6-27B,我实测了 4 种方案 这期视频我系统测试了 Qwen3.6-27B 在 Mac 上的本地运行体验。
    我一共体验了 4 种方式:Qwen Chat 官网版本、Unsloth 的 UD-Q5 GGUF、Unsloth MLX 6bit 搭配 DFlash,以及最后速度最让我满意的 MTPLX 4bit 方案。
    这次重点不是只看跑分,而是看它在真实任务里的表现:网页复刻、交通仿真、3D 魔尺、礼物包装助手、仓库分拣系统、体素艺术场景、写作、推理和幻觉识别。整体来看,Qwen3.6-27B 的编码和创作能力确实很强,尤其在 MTPLX 上,本地速度可以跑到 40 tok/s 以上,对 Mac 用户来说体验提升非常明显。
    当然,它也不是完美的。比如复杂 3D 场景会出现穿模、逻辑不稳定、动效不准确等问题;MTPLX 当前也不支持图像识别。但如果你想在 Mac 上本地运行一个速度快、质量不错、适合 AI 编程和日常任务的 27B 模型,Qwen3.6-27B 很值得尝试。
    本期会聊到:
    - Qwen3.6-27B 为什么值得关注
    - Mac 上运行 27B 稠密模型的真实速度
    - GGUF、MLX、DFlash、MTPLX 的体验差异
    - MTPLX 的安装和 Open WebUI 接入体验
    - 4bit 模型在编码、写作和推理任务中的表现
    - 我目前更推荐哪一种本地运行方案
    如果你也在 Mac 上折腾本地大模型、AI 编程模型或 Qwen 系列模型,这期可以作为一个实际体验参考。
    时间戳
    00:00 开场:为什么这期要测 Qwen3.6-27B
    02:21 Mac 上运行 Qwen3.6-27B 的几种新方案
    05:00 官网版本与 Unsloth GGUF
    10:37 Unsloth MLX 6bit + DFlash
    16:34 MTPLX 上手
    20:50 写作、推理、幻觉识别测试
    #Qwen #Qwen36 #Qwen3_6_27B #本地大模型 #Mac本地部署 #AI编程
    查看AI文稿
  • 用Qwen3.7Max解决三个基于真实项目封装的BUG Qwen3.7Max评分很能打,在实际祖传代码的项目里,是否依旧能打?#Qwen37 #程序员日常 #千问大模型 #与AI同行#qwen
    06:08
    查看AI文稿
  • AI性价比装机(1万5 ),丝滑跑Qwen3.6-35B
    05:56
    查看AI文稿