qwen3.5 4b使用教程 - 抖音

您是不是在找：

AI先锋官7月前

阿里通义Qwen 3开源4B端侧大模型更智能、更精准，支持256k上下文，AIME25得分超越Claude 4 Opus#通义 #qwen3 #阿里 #ai #开源

00:00 / 00:55

连播

清屏

智能

倍速

点赞8

AI 博士嗨嗨10月前

人人都能玩! Qwen3最强开源模型保姆级本地部署教程 #qwen3 #ollama #本地部署 #cherrystudio #AI模型

00:00 / 08:09

连播

清屏

智能

倍速

点赞580

ModelDaDa4天前

一分钟用上本地小模型 🤩一分钟教你在 Windows 本地用上阿里 Qwen3.5 - 4B 大模型！超简单步骤，小白也能秒上手，赶紧来试试！#Qwen3.5 - 4B 模型 #本地部署 #阿里千问 #大模型使用 #Windows 操作 #LMStudio

00:00 / 01:04

连播

清屏

智能

倍速

点赞78

敢抢我神棍名号4天前

小核弹-千问3.5及节点支持-qwen3.5 #comfyui教程去小破站（B）获取选在链接

00:00 / 01:51

连播

清屏

智能

倍速

点赞4

智东西4天前

马斯克惊呼太强了！阿里Qwen开源四款小模型 Qwen3.5-0.8B、Qwen3.5-2B、Qwen3.5-4B、Qwen3.5-9B，引发外网热议，在iPhone17pro上都能实现飞速运行，回答速度堪比云端。#马斯克 #阿里巴巴 #Qwen #千问大模型

00:00 / 01:00

连播

清屏

智能

倍速

点赞3284

千问大模型7月前

坤坤教你搭建RAG知识库 🤯 RAG搭建+Qwen3-Embedding部署太难？头发掉光还报错？坤坤保姆级手把手教学来了！0基础也能搞定的AI知识库，从部署模型部署到知识库搭建，一条龙服务。小白直呼“真香”！ #Qwen #通义千问 #AI #RAG

00:00 / 04:00

连播

清屏

智能

倍速

点赞1576

老王Bingo4天前

小块头，大智慧！四款 Qwen3.5 小模型开源今天，阿里正式开源4款 Qwen3.5 小尺寸模型系列：Qwen3.5-0.8B/2B/4B/9B。这一系列模型继承了 Qwen3.5 家族的强大基因，采用原生多模态训练、最新的模型架构，表现出卓越的性能，以满足从极端资源受限到高性能轻量级应用的不同需求： 📌 0.8B / 2B：极致轻量，端侧首选特点：体积极小，推理速度极快。场景：非常适合移动设备、IoT 边缘设备部署，以及低延时的实时交互场景。 📌 4B：轻量级 Agent 的强劲基座特点：性能强劲，多模态基座模型，适合Agent。场景：适合作为轻量级智能体的核心大脑，完美平衡了性能与资源消耗。 📌 9B：紧凑尺寸，越级性能特点：结构紧凑，但性能媲美gpt-oss-120B，让人惊艳。场景：适合需要较高智力水平但受限显存资源的服务器端部署，是性价比极高的通用模型选择。#Qwen #开源

00:00 / 06:02

连播

清屏

智能

倍速

点赞19

IT咖啡馆2周前

深度实测Qwen3.5，原生多模态表现如何 #AI新星计划 #qwen #千问大模型 #IT咖啡馆 #大模型

00:00 / 07:52

连播

清屏

智能

倍速

点赞2380

kate人不错3天前

Qwen3.5 小模型实测：0.8B 到 35B-A3B 这期视频我实测了 Qwen3.5 中小模型在本地端的真实表现：你会看到： - 不同量化下的显存占用与推理速度差异 - 浏览器端 WebGPU 运行 0.8B 的体验 - 视觉识别/OCR 实测表现 - 9B 与 35B-A3B 在任务稳定性与效果上的差异 - LM Studio 关闭 thinking 的实操方法 - 在 OpenCode / Cline 中做工具调用与编码测试的结果如果你也在找一套“能在本地跑、质量又够用”的模型组合，这期会很有参考价值。时间戳 00:00 Qwen3.5 中小模型简介 00:50 格式与部署 02:21 显存与速度实测 03:40 视觉/OCR能力对比 05:33 本地实战案例 11:00 工具调用与编码测试 #Qwen35 #本地大模型 #Ollama #LMStudio #千问

00:00 / 13:28

连播

清屏

智能

倍速

点赞174

Menus内侧入口10月前

《点水资源》Qwen3手机版下载教程，手机怎么下载通义千问3模型#qwen3 #大模型 #通义千问3 #qwen大模型 #ai模型

00:00 / 00:36

连播

清屏

智能

倍速

点赞15

卢菁老师讲AI10月前

通义千问qwen3 如何通过参数控制思考过程？ #通义千问 #qwen3 #qwen #ai大模型 #人工智能

00:00 / 02:52

连播

清屏

智能

倍速

点赞50

千问大模型7月前

不只是写代码！Qwen3-Coder 来啦！ Qwen3-Coder，现在开源！ 480B参数，MoE架构，每次运行激活35B。从代码生成到页面交互，Qwen3-coder都不在话下。人民需要什么，千问就开源什么！欢迎体验！ #Qwen #AI #大模型 #开源 #通义千问

00:00 / 00:35

连播

清屏

智能

倍速

点赞1478

AI赚钱研究社1周前

Qwen 3.5中杯发布：本地部署教程深度解析 Qwen 3.5 各版本差异，分享 35B-A3B 本地部署避坑参数与显存优化技巧。#Qwen35 #大模型 #vllm #SGLang #本地部署

00:00 / 05:26

连播

清屏

智能

倍速

点赞402

用户7938744820683天前

小模型超智能，3000元本地流畅运行Qwen3.5 系列模型 #随变ai随便玩 #这也能开播

00:00 / 02:55

连播

清屏

智能

倍速

点赞42

通义实验室9月前

手机也能跑 Qwen3？手把手教你部署！全球开源模型冠军 Qwen3 、端到端全模态模型 Qwen2.5- Omni 在手机上也能跑通啦！Android、 iOS、桌面端通通安排～ #通义 #Qwen #大模型 #教程 #涨知识

00:00 / 01:40

连播

清屏

智能

倍速

点赞NaN

玉七零【教程👀简介】9月前

【Qwen3+Dify】手把手教你构建私有合同审查助手高效率、低风险、低成本AI工作流！全程干货！（附文档）大模型LLM #大模型 #大模型学习 #AI #人工智能 #Qwen

00:00 / 07:19

连播

清屏

智能

倍速

点赞90

沪上码仔AI3天前

#openclaw #qwen3.5 openclaw接入本地部署大模型。无限token，再也不用心疼token了。本地安装openclaw最简单的方式。一共就三步。

00:00 / 00:49

连播

清屏

智能

倍速

点赞237

AI超元域8月前

Qwen3 Embedding 4B模型+n8n工作流结合 🚀🚀🚀视频简介： ✅AI知识库搭建终极指南！Qwen3 Embedding模型性能超越同类产品，结合N8N工作流平台实现文档自动处理、向量存储、智能问答一站式解决方案 ✅本视频详细演示了如何使用阿里巴巴最新发布的Qwen3 Embedding 4B模型，结合n8n工作流平台，无需编程基础即可快速构建强大的个人AI知识库。 🚀 核心亮点： - Qwen3 Embedding系列：支持0.6B、4B、8B三种参数规格，在MTEB多语言排行榜排名第一，检索准确率高达95%，支持100多种语言和32K上下文长度 - N8N工作流平台：零代码可视化操作，支持500多种服务集成，提供灵活的部署方案 📋 实操步骤： 1. 安装Ollama和Node.js环境 2. 下载并导入Qwen3 Embedding 4B量化模型 3. 使用N8N构建两个核心工作流： - 📁 文件读取→向量化存储工作流 - 🔍 智能检索→问答工作流 💡 技术特色： - 支持中英文混合文档处理 - 递归文本分割和向量存储 - 实时检索验证效果显著完全开源免费的解决方案，让每个人都能拥有专属的智能知识助手！🤖✨ 🔥🔥🔥时间戳： 00:00 - 阿里巴巴Qwen3 Embedding系列模型介绍 00:48 - Qwen3 Embedding模型优势详解 01:28 - n8n工作流平台优势介绍 02:20 - 环境准备：安装Ollama和Node.js 02:41 - 下载并导入Qwen3 Embedding 4B模型到Ollama 04:07 - 安装并启动n8n工作流平台 04:25 - 构建知识库工作流：添加文件读取和循环组件 05:56 - 配置向量数据库和嵌入模型 08:38 - 构建检索工作流：配置AI Agent和向量存储工具 10:33 - 测试个人知识库检索功能 11:26 - 检索结果展示和总结 #n8n #qwen3 #qwen #RAG #知识库

00:00 / 11:45

连播

清屏

智能

倍速

点赞276

磊哥聊AI2周前

OpenClaw保姆级教程：带你免费调用Qwen3.5！龙虾免费调用最Q开源大模型Qwen3.5详细教程#openclaw #qwen #随变ai随便玩

00:00 / 05:48

连播

清屏

智能

倍速

点赞4772

芥末拔丝香菜10月前

qwen3本地部署实操4B模型就够让你的其他api吃灰 #qwen3 #mcp #ai实操 #千问3 #ai本地部署

00:00 / 01:17

连播

清屏

智能

倍速

点赞85

西安数学张老师1月前

林俊旸：扩展模型规模与上下文长度，迈向通用智能 #北京大学 #nlp #具身智能 #大模型 #深度学习

00:00 / 23:56

连播

清屏

智能

倍速

点赞24

程序员晓刘7月前

阿里Qwen3-Coder比肩Grok4，开源大模型真的强？ #程序员 #编程 #开源 #Qwen #大模型

00:00 / 04:44

连播

清屏

智能

倍速

点赞506

硬评测7月前

上手即封神！阿里Qwen3-Coder 不只是地表最强，它正在重新定义AI生产力 #AI #程序员 #生产力 #Qwen #GPT4 @通义千问大模型

00:00 / 02:45

连播

清屏

智能

倍速

点赞2779

Enine 亿玖1周前

满足千人并发的本地模型部署机器人视觉研发服务器 #本地部署 #深度学习 #组装服务器 #机器学习 #diy装机

00:00 / 00:49

连播

清屏

智能

倍速

点赞373

程序员御风2周前

Qwen3.5 实测：会写代码，能读视频原生多模态到底强在哪？ #AI #Qwen #千问大模型 #人工智能 #开源

00:00 / 06:07

连播

清屏

智能

倍速

点赞220

郭震AI7月前

目前开源最强编程智能体：Qwen3-Coder，安装到自己电脑的步骤，需要的可以收藏 #qwen3coder #智能体 #郭震AI频道

00:00 / 00:59

连播

清屏

智能

倍速

点赞54

AI猿姗姗9月前

10分钟教你使用Dify+Qwen3构建合同审查助手，提升效率、降低风险并节约成本！附文档代码！ #人工智能 #ai #Dify #Qwen3 #大模型

00:00 / 15:02

连播

清屏

智能

倍速

点赞798

赋范课堂10月前

一文详解源神Qwen3全需求硬件配置指南 #Qwen3 #大模型 #Agent #人工智能

00:00 / 08:31

连播

清屏

智能

倍速

点赞148

AI超元域10月前

企业级最强开源大模型Qwen3震撼发布！本地部署+客观测评 🚀企业级最强开源大模型Qwen3震撼发布！本地部署+全面客观测评！Qwen3-235B-A22B+Qwen3-32B+Qwen3-14B谁是最强王者？ollama+LM Studio+vLLM本地部署 🚀🚀🚀视频简介： ✅【本地部署+真实测评】阿里巴巴Qwen3最强模型对决：从235B混合专家到14B本地部署，全方位能力测试从JSON格式化到Python编程，从SQL查询到矩阵运算，从Ollama到LM Studio到vLLM全平台部署教程 📢 本视频详细演示了阿里巴巴最新发布的Qwen3系列模型，包括混合专家架构模型（235B/22B和30B/3B）以及32B、14B、8B、4B、1.7B、0.6B等多种参数版本。📊 ⚙️ 视频分为两大部分：首先展示了如何在不同平台部署Qwen3模型，包括Windows/macOS用户使用Ollama和LM Studio进行简易部署，以及企业用户使用vLLM在Ubuntu系统进行高性能部署的完整流程。🖥️ 🔍 第二部分进行了全面的性能测试，重点对比了235B、32B和14B三个版本在知识库截止日期、幻觉问题、规律识别、JSON格式化、代码理解、SVG生成、提示词遵循、SQL能力、农夫过河问题、文档分析以及Python编程等多个维度的表现。🧠 💡 测试结果显示，开启思考模式的14B参数模型在多项测试中表现优于不开启思考模式的32B甚至235B模型，为用户选择最适合自己需求的模型版本提供了宝贵参考。✨ #Qwen3 #Qwen #AI #ollama #AIGC

00:00 / 15:39

连播

清屏

智能

倍速

点赞314

小天fotos1周前

Qwen3.5-27B太好玩，不小心养了一窝龙虾 #ai新星计划 #抖音年味新知贺岁 #openclaw #qwen #4090魔改

00:00 / 08:29

连播

清屏

智能

倍速

点赞NaN

沐凌熙3天前

Qwen3.5小模型实现手机端本地运OCR兼顾效率与隐私 #Ai #电脑 #科技

00:00 / 02:19

连播

清屏

智能

倍速

点赞6

赛博杨千幻4天前

Claude出记忆复制系统大量收揽openai退订会员#openclaw #ai新闻

00:00 / 01:34

连播

清屏

智能

倍速

点赞24

九天Hector7月前

Claude Code最佳平替，Qwen3 Code使用指南与性能评测！ Qwen3 Coder模型性能解读，Qwen3 Code编程智能体上手实测！ #qwen #ai #开发 #代码 #ai新星计划

00:00 / 07:44

连播

清屏

智能

倍速

点赞474

澳門AI佬4天前

9B 参数干翻 80B？阿里开源四款Qwen3.5系列小模型 - 可在手机、笔记本、普通电脑上运行... - 而且都是多模态，支持文字、图片、视频输入 - 百万 Agent 级别 RL 训练，Agent 任务能力显著提升 - 支持 201 种语言 - 支持 262K token 的超长上下文，可扩展到100万下面是2B版本在手机上本地运行#玩个很新的东西 #每日ai

00:00 / 00:07

连播

清屏

智能

倍速

点赞82

公子玄天6天前

有人已经直接用 Qwen3.5-27B + DGX Spark 做成 Android Agent，通过 Web UI 下发任务，让模型自己读屏、决策、点按，推理速度提升 4 倍。#OpenClaw #Ai

00:00 / 00:18

连播

清屏

智能

倍速

点赞1453

九章云极AladdinEdu1周前

旗舰版千问3.5部署困难？三分钟带你一键部署！ #AI大模型 #AI部署 #人工智能 #千问

00:00 / 01:55

连播

清屏

智能

倍速

点赞9

遇见AI1月前

2步加速LoRA好像不太行事实证明，步数少不一定速度快，体积大也不一定质量高！今天体验了一个Qwen-Image-2512的2步加速LoRA，速度和质量都还差点意思！最后给大家补充分享了一个语音识别插件（Qwen3-ASR），效果还不错～#AI生图 #加速 #LoRA #ComfyUI

00:00 / 02:37

连播

清屏

智能

倍速

点赞14

小工蚁1周前

Qwen3.5 27B和35B选哪个？Ceval模型评测实践 #小工蚁 #通义千问 #开源大模型

00:00 / 02:31

连播

清屏

智能

倍速

点赞110

Aiwood爱屋研究室3天前

开源绝唱？如何在Comfyui部署qwen3.5

00:00 / 05:03

连播

清屏

智能

倍速

点赞53

跟着小坛学AI9月前

【喂饭教程】10分钟学会Unsloth微调Qwen3大模型，环境配置+模型微调+模型部署+效果展示，详细教程！小白也能学会~~~#大模型 #程序员 #大模型微调 #大模型学习 #Qwen

00:00 / 11:18

连播

清屏

智能

倍速

点赞22

aiaihaozhe95274天前

qwen3.5-4B-Q8_0，图片视频分析带思考开关，GGUF版本，12G显存。 #ai整合包 #qwen3.5

00:00 / 00:28

连播

清屏

智能

倍速

点赞1

通义实验室2周前

除夕！Qwen3.5来了！我们很高兴正式发布 Qwen3.5，并推出Qwen3.5系列的第一款模型—— Qwen3.5-397B-A17B 的开放权重版本，作为原生视觉-语言模型，在推理、编程、智能体能力与多模态理解等全方位基准评估中表现优异。亮点速览： ✦ 基于混合结构，397B总参/17B激活，能力匹配>1T参数的Qwen3-Max； ✦ 原生多模态设计，同等规模下超越Qwen3-VL； ✦ 覆盖201种语言； ✦ 在代码生成、智能体推理与多模态理解方面表现卓越！ #Qwen #千问大模型 #大模型 #除夕 #新年快乐

00:00 / 01:15

连播

清屏

智能

倍速

点赞NaN

杨大哥1周前

Qwen3.5 35b本地部署适配OpenClaw

00:00 / 02:00

连播

清屏

智能

倍速

点赞1617

程序员寒山10月前

本地部署Qwen3小参数版本实测：并非鸡肋实测多个本地模型本期视频主要给大家介绍本地部署大模的相关知识，实测Qwen3 小参数模型的过程，包括与DeepSeek r1 8b和在线版本的对比。更多往期视频内容可以到主页列表下查看(程序员寒山:CxyHanShan)，欢迎大家留言关注讨论。#Qwen3 #Deepseek #本地部署 #ollama

00:00 / 08:58

连播

清屏

智能

倍速

点赞365

风林火山2天前

Qwen3.5-35b本地模型编码能力测试，编写简单游戏（贪吃蛇）没问题，编写项目工程（视频AI监控调度），前后台框架问题不大，但细节bug较多，总体属于可用程度

00:00 / 00:28

连播

清屏

智能

倍速

点赞9

AI樟榆树7月前

Qwen-3 coder快速上手教程 Qwen-3 Coder再加点油，不要卡，我就取消订阅Claude，踩在聚人的肩膀上一点不假#Qwen3coder #ai编程 #智能体 #claude #agent #ai

00:00 / 01:12

连播

清屏

智能

倍速

点赞684

Spark4天前

macbook 跑通qwen3.5-4b 小尺寸模型

00:00 / 00:15

连播

清屏

智能

倍速

点赞5

敢抢我神棍名号1月前

极速音色克隆-Qwen3TTS-多国语言+方言 #comfyui教程 #人工智能主页获取

00:00 / 05:47

连播

清屏

智能

倍速

点赞21

学大模型的小粒9月前

手把手教你本地部署Qwen3-235B模型，只需24G显存！ #Qwen3 #大模型 #AI #大模型部署 #程序员

00:00 / 37:17

连播

清屏

智能

倍速

点赞164

AI逐风4天前

千问3.5小尺寸模型发布手机本地运行的大模型越来越强了。真正完全免费完全隐私 #qwen #千问

00:00 / 00:32

连播

清屏

智能

倍速

点赞54

小萌芽科技4天前

阿里开源四款Qwen3.5小模型，马斯克惊叹“智能密度”惊人阿里近日开源Qwen3.5系列四款小尺寸模型（0.8B/2B/4B/9B），这些模型专为端侧设备优化，可在笔记本电脑甚至手机上运行。马斯克在社交媒体评价其具备“令人惊叹的智能密度”，引发开发者社区热烈反响。 #Qwen35 #马斯克 #阿里 #AI小模型性能突破：小模型实现大能力 Qwen3.5-9B在多项基准测试中表现卓越，在GPQA Diamond、MMMU-Pro等评测中超越GPT-5 nano、Gemini 2.5 Flash-Lite等大型模型。特别是9B版本在MMMU-Pro测试中以13分优势击败GPT-5-Nano，展现出色性能。4B版本在多语言知识、视觉推理等任务接近9B水平，成为轻量级智能体的理想选择。端侧部署优势明显 0.8B/2B版本专为移动设备和IoT边缘设备设计，具备低延时特性；4B版本支持多模态任务，平衡性能与资源消耗；9B版本在受限显存环境下提供高性价比服务。实测显示，Qwen3.5-9B在AMD Ryzen AI平台配合量化算法，处理速度达30 token/s，仅需16GB显存即可运行。开发者积极验证应用潜力开发者验证模型可在Mac mini等设备配合OpenClaw实现全天候运行，成本低于初级员工月薪。有用户成功在iPhone部署，引发移动端应用热潮。虽然小模型在复杂数学推理方面存在局限，但其在特定任务上已达到商用级水平。此次开源标志着端侧AI能力显著提升，为低成本AI部署开辟新路径。模型已在魔搭社区和Hugging Face开放下载，助力全球开发者探索边缘计算新场景。

00:00 / 05:51

连播

清屏

智能

倍速

点赞31

赋范课堂7月前

Claude Code最佳平替，Qwen3 Code使用指南 Qwen3 Coder模型性能解读，Qwen3 Code编程智能体上手实测！#Qwen #AI #智能体 #编程 #ai新星计划

00:00 / 07:43

连播

清屏

智能

倍速

点赞120

AI随风7月前

Qwen3-coder实测，效果出乎意料 Qwen3-coder实测，效果出乎意料，AI编程有了更多选择，使用Qwen3-coder实现一个AI批改作文小程序界面设计, 使用阿里开发工具灵码#ai #qwen3 #AI编程

00:00 / 07:52

连播

清屏

智能

倍速

点赞727

赛博小凡7月前

阿里开源了强大的代码模型，但是我觉得普通用户已经被抛弃了 #qwen3 #阿里 #人工智能 #科技热点 #ai新星计划

00:00 / 01:06

连播

清屏

智能

倍速

点赞1565

赋范课堂9月前

从零接入Qwen3，手把手教你代码编写MCP客户端！ #人工智能 #ai #Qwen3 #MCP #大模型

00:00 / 14:43

连播

清屏

智能

倍速

点赞37

通义实验室9月前

大模型如何持续进化，实现精准检索？近日，Qwen3 Embedding系列模型开源发布。该系列模型专为文本表征、检索与排序任务设计，充分继承了Qwen3在多语言文本理解能力方面的优势。欢迎体验~ #通义 #Qwen #大模型 #开源 #科普

00:00 / 01:59

连播

清屏

智能

倍速

点赞1218

赛脖古7月前

AI编程工具的收费政策，你可能永远算不清 🤔AI编程工具收费就像手机流量，用多用少你算不清楚，一切都是"运营商说了算"。 #AI编程工具 #ClaudeCode #qwen3 #科技测评 #编程神器

00:00 / 01:34

连播

清屏

智能

倍速

点赞20

小元老师7月前

挑战16分钟搞定，Dify+Qwen3构建合同审查系统 #人工智能 #大模型 #AI大模型 #大模型学习 #大模型入门

00:00 / 16:15

连播

清屏

智能

倍速

点赞1215

小天fotos1周前

用Qwen3.5做一个Tutor Skill数学题转讲解视频 #ai新星计划 #抖音年味新知贺岁 #qwen35 #qwen #skills

00:00 / 08:34

连播

清屏

智能

倍速

点赞1599

郝点儿4天前

一张 3090，真的能把千问 3.5 35B 模型跑明白吗#本地ai #千问#ai #diy

00:00 / 01:52

连播

清屏

智能

倍速

点赞1437

梅加雨6天前

3090跑qwen3.5 27b测试#程序员科普 #ai #qwen

00:00 / 01:32

连播

清屏

智能

倍速

点赞119

CSDN8月前

全方位对比DeepSeek-V3和Qwen3 文心大模型4.5系列开源，在GitCode首发。通过在 “硅基流动” 云平台实测，与 DeepSeek-V3、Qwen3 正面 PK——文心 4.5 生成速度“火箭级”，多模态表现亮眼，常规问答平分秋色，专业难题 DeepSeek-V3 略胜一筹。 #AI #开源大模型 #多模态 #文心4_5 #DeepSeekV3 #Qwen3 #模型评测 #GitCode

00:00 / 05:42

连播

清屏

智能

倍速

点赞3

titan9092年前

4060Ti 16G显卡安装通义千问Qwen1.5-14B大模型 #4060ti16g显卡 #通义千问1.5

00:00 / 08:40

连播

清屏

智能

倍速

点赞75

博弈4天前

使用22G单卡的2080ti，2卡即可运行Qwen3.5-35B-A3B-Q8_0.gguf量化版，上下文设置130K ，每卡占约20G显存，模型大小35G，总显存占用40G左右，在0上下文情况下，首句话速度70token/s，使用opencode在vscode进行编程测试，首上下文1.3K，首句话速度66token/s，当上下文2万时，速度62token/s，当上下文5万时，速度52token/s，当上下文50%，7万时，速度45token/s 运行命令：CUDA_VISIBLE_DEVICES=4,5 ~/llama.cpp/build/bin/llama-server --port 8000 --host 0.0.0.0 --n-gpu-layers -1 --parallel 1 --ctx-size 130000 --flash-attn on --batch-size 4096 --ubatch-size 2048 --cont-batching --no-mmap --mlock --split-mode layer --cache-type-k q8_0 --cache-type-v q8_0 --temp 0.6 --top-p 0.95 --top-k 20 -m /home/boyiu/models/GGUF/Qwen3.5/Qwen3.5-35B-A3B-Q8_0.gguf --jinja --chat-template-file /home/boyiu/models/jinja/Qwen3.5-35B-A3B-Q8_0/chat_template.jinja 由于GGUF量化版在llama.cpp运行时，会出现"System message must be at the beginning"（系统消息必须在开头）的错误问题，需要下载原.jinja发送给大模型，修改为，模板允许系统消息不在开头，单独使用--jinja即可正常回复，与Qwen3.5-122B-A10B同样问题编码能力与Qwen3.5-122B-A10B相当，由于速度快，能力并不弱，所以完胜A10B，但是在编码指令遵循，逻辑方面还差点意思，在60G以下模型体积下，这款模型应该没有对手，性价比超高，期待deepseek v4版本发布后进行测评#大模型 #量化

00:00 / 00:31

连播

清屏

智能

倍速

点赞694

简介:

您在查找“qwen3.5 4b使用教程”短视频信息吗？帮您找到更多更精彩的短视频内容！最新发布时间：2026-03-06 07:12

最新推荐:

相关推荐:

热门推荐: