116
70
113
26
举报
发布时间:2026-05-25 10:24
查看AI文稿
G港折磨王
G港折磨王

粉丝19获赞1573

相关视频

  • 实战利用MTP补丁免费大幅提升Qwen3.6-27B运行速度 #mtp补丁
    04:05
    查看AI文稿
  • 本地大模型提速三倍方法Qwen3.6模型跑出200t/s生成 4090单显卡,本地大模型提速三倍Qwen3.6模型跑出200t/s生成 #本地大模型提速 #本地大模型配置 #MTP配置
    04:41
    查看AI文稿
  • Qwen3.6 上了MTP,本地推理速度起飞
    01:13
    查看AI文稿
  • Qwen3.6 MTP加速,本地部署+ ClaudeCode Qwen3.6 MTP加速,本地部署,驱动 Claude Code
    01:23
    查看AI文稿
  • Qwen3 6 27B对决MTP版 RT 在RTX 3090上同台竞技 普通版Qwen3 6 27B对战MTP版本 通过熔岩灯 迷你水族箱等相同编程任务 实测对比两者的生成速度 创意与指令遵循能力
    18:40
    查看AI文稿
  • gemma 4 mtp#AI
    01:18
    查看AI文稿
  • 低成本玩转前沿AI的时代 谁还花大钱买算力?使用MTP技术史上最快的本地推理,低成本玩转前沿AI的时代已到,llamacpp重大更新!!#本地模型 #ai #小龙虾
    08:55
    查看AI文稿
  • Google深夜放毒:MTP投机解码本地大模型提速三倍教程 Google深夜放毒,教你用MTP投机解码技术让你的Gemma 4 /Qwen3.6 27B 本地大模型提速三倍 #本地大模型加速 #MTP #投机解码 #投机解码教程 #本地大模型MTP
    02:58
    查看AI文稿
  • llama.cpp合并了MTP功能,无痛加速两倍! #mtp #openclaw #ai #本地部署 #hermesagent
    02:59
    查看AI文稿
    326Y.Ai
  • 保持上下文窗口的同时利用mtp提升Qwen3.6模型运行速度 #MTP加速模型运行 #TurboQuant #加速Qwen27B
    03:17
    查看AI文稿
  • 尾速上不去?提速老太太?我来告诉你! #九号 #控制器 #电摩  #闪骑 #AUSI控制器
    03:20
    查看AI文稿
  • amd显卡7900xtx跑qwen27b mtp模型测试 十多次调试达到最快速度
遗憾turbo压显存仍不支持#AI大模型#qwen27b
    02:21
    查看AI文稿
  • 修复MTP提速Qwen3.6-27B后多模态(图片)崩溃问题 #MTP多模态正常加速
    02:35
    查看AI文稿
  • 谷歌刚刚发布MTP, 大模型的推理速度提升3倍。
    00:43
    查看AI文稿
  • 新款MTP触摸屏的通讯注意事项(时间同步)#剑儒 #plc培训 #plc编程
    01:34
    查看AI文稿
  • 一个参数让本地AI起飞实录,经评论区大神指导速度翻5倍 同款卡别人跑120tok/s,我只有28。排查发现是FP16全精度吃满了带宽,换INT4翻倍到62,再上MTP多token预测,直接飙到136。 
从28到136,速度翻了快5倍。同一张卡同一个模型,推理引擎和参数差了5倍。 
感谢评论区各位大佬指路🙏 硬件买回来只是开始,怎么用才是真正的坑。 
速度解决了,下一步继续折腾💪 
#PRO6000 #RTX6000 #本地大模型 #llamacpp #AI硬件 #显卡 #深夜补完计划
    01:41
    查看AI文稿