Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko; compatible; ClaudeBot/1.0; +claudebot@anthropic.com)
精选
推荐
AI抖音
探索
直播
放映厅
短剧
搜索
您是不是在找:
rex直装安全吗
tedict lite在哪下
lobsterai使用教程
日淘酱怎么注销
支付宝金币云商要发票吗
熊猫商城竹子兑换不了流量呢
拼多多怎么用oooooo
如何收听凤凰无线广播电台
QQ到现在多少天了
英语天天练小组件怎么添加到桌面
AI先锋官
7月前
阿里通义Qwen 3开源4B端侧大模型 更智能、更精准,支持256k上下文,AIME25得分超越Claude 4 Opus#通义 #qwen3 #阿里 #ai #开源
00:00 / 00:55
连播
清屏
智能
倍速
点赞
8
AI 博士嗨嗨
10月前
人人都能玩! Qwen3最强开源模型保姆级本地部署教程 #qwen3 #ollama #本地部署 #cherrystudio #AI模型
00:00 / 08:09
连播
清屏
智能
倍速
点赞
580
ModelDaDa
4天前
一分钟用上本地小模型 🤩一分钟教你在 Windows 本地用上阿里 Qwen3.5 - 4B 大模型!超简单步骤,小白也能秒上手,赶紧来试试!#Qwen3.5 - 4B 模型 #本地部署 #阿里千问 #大模型使用 #Windows 操作 #LMStudio
00:00 / 01:04
连播
清屏
智能
倍速
点赞
78
敢抢我神棍名号
4天前
小核弹-千问3.5及节点支持-qwen3.5 #comfyui教程 去小破站(B)获取选在链接
00:00 / 01:51
连播
清屏
智能
倍速
点赞
4
智东西
4天前
马斯克惊呼太强了!阿里Qwen开源四款小模型 Qwen3.5-0.8B、Qwen3.5-2B、Qwen3.5-4B、Qwen3.5-9B,引发外网热议,在iPhone17pro上都能实现飞速运行,回答速度堪比云端。#马斯克 #阿里巴巴 #Qwen #千问大模型
00:00 / 01:00
连播
清屏
智能
倍速
点赞
3284
千问大模型
7月前
坤坤教你搭建RAG知识库 🤯 RAG搭建+Qwen3-Embedding部署太难?头发掉光还报错?坤坤保姆级手把手教学来了!0基础也能搞定的AI知识库,从部署模型部署到知识库搭建,一条龙服务。小白直呼“真香”! #Qwen #通义千问 #AI #RAG
00:00 / 04:00
连播
清屏
智能
倍速
点赞
1576
老王Bingo
4天前
小块头,大智慧!四款 Qwen3.5 小模型开源 今天,阿里正式开源4款 Qwen3.5 小尺寸模型系列:Qwen3.5-0.8B/2B/4B/9B。这一系列模型继承了 Qwen3.5 家族的强大基因,采用原生多模态训练、最新的模型架构,表现出卓越的性能,以满足从极端资源受限到高性能轻量级应用的不同需求: 📌 0.8B / 2B:极致轻量,端侧首选 特点:体积极小,推理速度极快。 场景:非常适合移动设备、IoT 边缘设备部署,以及低延时的实时交互场景。 📌 4B:轻量级 Agent 的强劲基座 特点:性能强劲,多模态基座模型,适合Agent。 场景:适合作为轻量级智能体的核心大脑,完美平衡了性能与资源消耗。 📌 9B:紧凑尺寸,越级性能 特点:结构紧凑,但性能媲美gpt-oss-120B,让人惊艳。 场景:适合需要较高智力水平但受限显存资源的服务器端部署,是性价比极高的通用模型选择。#Qwen #开源
00:00 / 06:02
连播
清屏
智能
倍速
点赞
19
IT咖啡馆
2周前
深度实测Qwen3.5,原生多模态表现如何 #AI新星计划 #qwen #千问大模型 #IT咖啡馆 #大模型
00:00 / 07:52
连播
清屏
智能
倍速
点赞
2380
kate人不错
3天前
Qwen3.5 小模型实测:0.8B 到 35B-A3B 这期视频我实测了 Qwen3.5 中小模型在本地端的真实表现: 你会看到: - 不同量化下的显存占用与推理速度差异 - 浏览器端 WebGPU 运行 0.8B 的体验 - 视觉识别/OCR 实测表现 - 9B 与 35B-A3B 在任务稳定性与效果上的差异 - LM Studio 关闭 thinking 的实操方法 - 在 OpenCode / Cline 中做工具调用与编码测试的结果 如果你也在找一套“能在本地跑、质量又够用”的模型组合,这期会很有参考价值。 时间戳 00:00 Qwen3.5 中小模型简介 00:50 格式与部署 02:21 显存与速度实测 03:40 视觉/OCR能力对比 05:33 本地实战案例 11:00 工具调用与编码测试 #Qwen35 #本地大模型 #Ollama #LMStudio #千问
00:00 / 13:28
连播
清屏
智能
倍速
点赞
174
Menus内侧入口
10月前
《点水资源》Qwen3手机版下载教程,手机怎么下载通义千问3模型#qwen3 #大模型 #通义千问3 #qwen大模型 #ai模型
00:00 / 00:36
连播
清屏
智能
倍速
点赞
15
卢菁老师讲AI
10月前
通义千问qwen3 如何通过参数控制思考过程? #通义千问 #qwen3 #qwen #ai大模型 #人工智能
00:00 / 02:52
连播
清屏
智能
倍速
点赞
50
千问大模型
7月前
不只是写代码!Qwen3-Coder 来啦! Qwen3-Coder,现在开源! 480B参数,MoE架构,每次运行激活35B。 从代码生成到页面交互,Qwen3-coder都不在话下。 人民需要什么,千问就开源什么! 欢迎体验! #Qwen #AI #大模型 #开源 #通义千问
00:00 / 00:35
连播
清屏
智能
倍速
点赞
1478
AI赚钱研究社
1周前
Qwen 3.5中杯发布:本地部署教程 深度解析 Qwen 3.5 各版本差异,分享 35B-A3B 本地部署避坑参数与显存优化技巧。#Qwen35 #大模型 #vllm #SGLang #本地部署
00:00 / 05:26
连播
清屏
智能
倍速
点赞
402
用户793874482068
3天前
小模型超智能,3000元本地流畅运行Qwen3.5 系列模型 #随变ai随便玩 #这也能开播
00:00 / 02:55
连播
清屏
智能
倍速
点赞
42
通义实验室
9月前
手机也能跑 Qwen3?手把手教你部署! 全球开源模型冠军 Qwen3 、端到端全模态模型 Qwen2.5- Omni 在手机上也能跑通啦!Android、 iOS、桌面端通通安排~ #通义 #Qwen #大模型 #教程 #涨知识
00:00 / 01:40
连播
清屏
智能
倍速
点赞
NaN
玉七零【教程👀简介】
9月前
【Qwen3+Dify】手把手教你构建私有合同审查助手 高效率、低风险、低成本AI工作流!全程干货!(附文档)大模型LLM #大模型 #大模型学习 #AI #人工智能 #Qwen
00:00 / 07:19
连播
清屏
智能
倍速
点赞
90
沪上码仔AI
3天前
#openclaw #qwen3.5 openclaw接入本地部署大模型。无限token,再也不用心疼token了。 本地安装openclaw最简单的方式。一共就三步。
00:00 / 00:49
连播
清屏
智能
倍速
点赞
237
AI超元域
8月前
Qwen3 Embedding 4B模型+n8n工作流结合 🚀🚀🚀视频简介: ✅AI知识库搭建终极指南!Qwen3 Embedding模型性能超越同类产品,结合N8N工作流平台实现文档自动处理、向量存储、智能问答一站式解决方案 ✅本视频详细演示了如何使用阿里巴巴最新发布的Qwen3 Embedding 4B模型,结合n8n工作流平台,无需编程基础即可快速构建强大的个人AI知识库。 🚀 核心亮点: - Qwen3 Embedding系列:支持0.6B、4B、8B三种参数规格,在MTEB多语言排行榜排名第一,检索准确率高达95%,支持100多种语言和32K上下文长度 - N8N工作流平台:零代码可视化操作,支持500多种服务集成,提供灵活的部署方案 📋 实操步骤: 1. 安装Ollama和Node.js环境 2. 下载并导入Qwen3 Embedding 4B量化模型 3. 使用N8N构建两个核心工作流: - 📁 文件读取→向量化存储工作流 - 🔍 智能检索→问答工作流 💡 技术特色: - 支持中英文混合文档处理 - 递归文本分割和向量存储 - 实时检索验证效果显著 完全开源免费的解决方案,让每个人都能拥有专属的智能知识助手!🤖✨ 🔥🔥🔥时间戳: 00:00 - 阿里巴巴Qwen3 Embedding系列模型介绍 00:48 - Qwen3 Embedding模型优势详解 01:28 - n8n工作流平台优势介绍 02:20 - 环境准备:安装Ollama和Node.js 02:41 - 下载并导入Qwen3 Embedding 4B模型到Ollama 04:07 - 安装并启动n8n工作流平台 04:25 - 构建知识库工作流:添加文件读取和循环组件 05:56 - 配置向量数据库和嵌入模型 08:38 - 构建检索工作流:配置AI Agent和向量存储工具 10:33 - 测试个人知识库检索功能 11:26 - 检索结果展示和总结 #n8n #qwen3 #qwen #RAG #知识库
00:00 / 11:45
连播
清屏
智能
倍速
点赞
276
磊哥聊AI
2周前
OpenClaw保姆级教程:带你免费调用Qwen3.5! 龙虾免费调用最Q开源大模型Qwen3.5详细教程#openclaw #qwen #随变ai随便玩
00:00 / 05:48
连播
清屏
智能
倍速
点赞
4772
芥末拔丝香菜
10月前
qwen3本地部署实操4B模型就够让你的其他api吃灰 #qwen3 #mcp #ai实操 #千问3 #ai本地部署
00:00 / 01:17
连播
清屏
智能
倍速
点赞
85
西安数学张老师
1月前
林俊旸:扩展模型规模与上下文长度,迈向通用智能 #北京大学 #nlp #具身智能 #大模型 #深度学习
00:00 / 23:56
连播
清屏
智能
倍速
点赞
24
程序员晓刘
7月前
阿里Qwen3-Coder比肩Grok4,开源大模型真的强? #程序员 #编程 #开源 #Qwen #大模型
00:00 / 04:44
连播
清屏
智能
倍速
点赞
506
硬评测
7月前
上手即封神!阿里Qwen3-Coder 不只是地表最强,它正在重新定义AI生产力 #AI #程序员 #生产力 #Qwen #GPT4 @通义千问大模型
00:00 / 02:45
连播
清屏
智能
倍速
点赞
2779
Enine 亿玖
1周前
满足千人并发的本地模型部署机器人视觉研发服务器 #本地部署 #深度学习 #组装服务器 #机器学习 #diy装机
00:00 / 00:49
连播
清屏
智能
倍速
点赞
373
程序员御风
2周前
Qwen3.5 实测:会写代码,能读视频 原生多模态到底强在哪? #AI #Qwen #千问大模型 #人工智能 #开源
00:00 / 06:07
连播
清屏
智能
倍速
点赞
220
郭震AI
7月前
目前开源最强编程智能体:Qwen3-Coder,安装到自己电脑的步骤,需要的可以收藏 #qwen3coder #智能体 #郭震AI频道
00:00 / 00:59
连播
清屏
智能
倍速
点赞
54
AI猿姗姗
9月前
10分钟教你使用Dify+Qwen3构建合同审查助手 ,提升效率、降低风险并节约成本!附文档代码! #人工智能 #ai #Dify #Qwen3 #大模型
00:00 / 15:02
连播
清屏
智能
倍速
点赞
798
赋范课堂
10月前
一文详解源神Qwen3全需求硬件配置指南 #Qwen3 #大模型 #Agent #人工智能
00:00 / 08:31
连播
清屏
智能
倍速
点赞
148
AI超元域
10月前
企业级最强开源大模型Qwen3震撼发布!本地部署+客观测评 🚀企业级最强开源大模型Qwen3震撼发布!本地部署+全面客观测评!Qwen3-235B-A22B+Qwen3-32B+Qwen3-14B谁是最强王者?ollama+LM Studio+vLLM本地部署 🚀🚀🚀视频简介: ✅【本地部署+真实测评】阿里巴巴Qwen3最强模型对决:从235B混合专家到14B本地部署,全方位能力测试从JSON格式化到Python编程,从SQL查询到矩阵运算,从Ollama到LM Studio到vLLM全平台部署教程 📢 本视频详细演示了阿里巴巴最新发布的Qwen3系列模型,包括混合专家架构模型(235B/22B和30B/3B)以及32B、14B、8B、4B、1.7B、0.6B等多种参数版本。📊 ⚙️ 视频分为两大部分:首先展示了如何在不同平台部署Qwen3模型,包括Windows/macOS用户使用Ollama和LM Studio进行简易部署,以及企业用户使用vLLM在Ubuntu系统进行高性能部署的完整流程。🖥️ 🔍 第二部分进行了全面的性能测试,重点对比了235B、32B和14B三个版本在知识库截止日期、幻觉问题、规律识别、JSON格式化、代码理解、SVG生成、提示词遵循、SQL能力、农夫过河问题、文档分析以及Python编程等多个维度的表现。🧠 💡 测试结果显示,开启思考模式的14B参数模型在多项测试中表现优于不开启思考模式的32B甚至235B模型,为用户选择最适合自己需求的模型版本提供了宝贵参考。✨ #Qwen3 #Qwen #AI #ollama #AIGC
00:00 / 15:39
连播
清屏
智能
倍速
点赞
314
小天fotos
1周前
Qwen3.5-27B太好玩,不小心养了一窝龙虾 #ai新星计划 #抖音年味新知贺岁 #openclaw #qwen #4090魔改
00:00 / 08:29
连播
清屏
智能
倍速
点赞
NaN
沐凌熙
3天前
Qwen3.5小模型实现手机端本地运OCR兼顾效率与隐私 #Ai #电脑 #科技
00:00 / 02:19
连播
清屏
智能
倍速
点赞
6
赛博杨千幻
4天前
Claude出记忆复制系统大量收揽openai退订会员#openclaw #ai新闻
00:00 / 01:34
连播
清屏
智能
倍速
点赞
24
九天Hector
7月前
Claude Code最佳平替,Qwen3 Code使用指南与性能评测! Qwen3 Coder模型性能解读,Qwen3 Code编程智能体上手实测! #qwen #ai #开发 #代码 #ai新星计划
00:00 / 07:44
连播
清屏
智能
倍速
点赞
474
澳門AI佬
4天前
9B 参数干翻 80B? 阿里开源四款Qwen3.5系列小模型 - 可在手机、笔记本、普通电脑上运行... - 而且都是多模态,支持文字、图片、视频输入 - 百万 Agent 级别 RL 训练,Agent 任务能力显著提升 - 支持 201 种语言 - 支持 262K token 的超长上下文,可扩展到100万 下面是2B版本在手机上本地运行#玩个很新的东西 #每日ai
00:00 / 00:07
连播
清屏
智能
倍速
点赞
82
公子玄天
6天前
有人已经直接用 Qwen3.5-27B + DGX Spark 做成 Android Agent,通过 Web UI 下发任务,让模型自己读屏、决策、点按,推理速度提升 4 倍。#OpenClaw #Ai
00:00 / 00:18
连播
清屏
智能
倍速
点赞
1453
九章云极AladdinEdu
1周前
旗舰版千问3.5部署困难?三分钟带你一键部署! #AI大模型 #AI部署 #人工智能 #千问
00:00 / 01:55
连播
清屏
智能
倍速
点赞
9
遇见AI
1月前
2步加速LoRA好像不太行 事实证明,步数少不一定速度快,体积大也不一定质量高!今天体验了一个Qwen-Image-2512的2步加速LoRA,速度和质量都还差点意思!最后给大家补充分享了一个语音识别插件(Qwen3-ASR),效果还不错~#AI生图 #加速 #LoRA #ComfyUI
00:00 / 02:37
连播
清屏
智能
倍速
点赞
14
小工蚁
1周前
Qwen3.5 27B和35B选哪个?Ceval模型评测实践 #小工蚁 #通义千问 #开源大模型
00:00 / 02:31
连播
清屏
智能
倍速
点赞
110
Aiwood爱屋研究室
3天前
开源绝唱?如何在Comfyui部署qwen3.5
00:00 / 05:03
连播
清屏
智能
倍速
点赞
53
跟着小坛学AI
9月前
【喂饭教程】10分钟学会Unsloth微调Qwen3大模型,环境配置+模型微调+模型部署+效果展示,详细教程!小白也能学会~~~#大模型 #程序员 #大模型微调 #大模型学习 #Qwen
00:00 / 11:18
连播
清屏
智能
倍速
点赞
22
aiaihaozhe9527
4天前
qwen3.5-4B-Q8_0,图片视频分析 带思考开关,GGUF版本,12G显存。 #ai整合包 #qwen3.5
00:00 / 00:28
连播
清屏
智能
倍速
点赞
1
通义实验室
2周前
除夕!Qwen3.5来了!我们很高兴正式发布 Qwen3.5,并推出Qwen3.5系列的第一款模型—— Qwen3.5-397B-A17B 的开放权重版本,作为原生视觉-语言模型,在推理、编程、智能体能力与多模态理解等全方位基准评估中表现优异。 亮点速览: ✦ 基于混合结构,397B总参/17B激活,能力匹配>1T参数的Qwen3-Max; ✦ 原生多模态设计,同等规模下超越Qwen3-VL; ✦ 覆盖201种语言; ✦ 在代码生成、智能体推理与多模态理解方面表现卓越! #Qwen #千问大模型 #大模型 #除夕 #新年快乐
00:00 / 01:15
连播
清屏
智能
倍速
点赞
NaN
杨大哥
1周前
Qwen3.5 35b本地部署适配OpenClaw
00:00 / 02:00
连播
清屏
智能
倍速
点赞
1617
程序员寒山
10月前
本地部署Qwen3小参数版本实测:并非鸡肋 实测多个本地模型 本期视频主要给大家介绍本地部署大模的相关知识,实测Qwen3 小参数模型的过程,包括与DeepSeek r1 8b和在线版本的对比。更多往期视频内容可以到主页列表下查看(程序员寒山:CxyHanShan),欢迎大家留言关注讨论。#Qwen3 #Deepseek #本地部署 #ollama
00:00 / 08:58
连播
清屏
智能
倍速
点赞
365
风林火山
2天前
Qwen3.5-35b本地模型编码能力测试,编写简单游戏(贪吃蛇)没问题,编写项目工程(视频AI监控调度),前后台框架问题不大,但细节bug较多,总体属于可用程度
00:00 / 00:28
连播
清屏
智能
倍速
点赞
9
AI樟榆树
7月前
Qwen-3 coder快速上手教程 Qwen-3 Coder再加点油,不要卡,我就取消订阅Claude,踩在聚人的肩膀上一点不假#Qwen3coder #ai编程 #智能体 #claude #agent #ai
00:00 / 01:12
连播
清屏
智能
倍速
点赞
684
Spark
4天前
macbook 跑通qwen3.5-4b 小尺寸模型
00:00 / 00:15
连播
清屏
智能
倍速
点赞
5
敢抢我神棍名号
1月前
极速音色克隆-Qwen3TTS-多国语言+方言 #comfyui教程 #人工智能 主页获取
00:00 / 05:47
连播
清屏
智能
倍速
点赞
21
学大模型的小粒
9月前
手把手教你本地部署Qwen3-235B模型,只需24G显存! #Qwen3 #大模型 #AI #大模型部署 #程序员
00:00 / 37:17
连播
清屏
智能
倍速
点赞
164
AI逐风
4天前
千问3.5小尺寸模型发布 手机本地运行的大模型越来越强了。真正完全免费完全隐私 #qwen #千问
00:00 / 00:32
连播
清屏
智能
倍速
点赞
54
小萌芽科技
4天前
阿里开源四款Qwen3.5小模型,马斯克惊叹“智能密度”惊人 阿里近日开源Qwen3.5系列四款小尺寸模型(0.8B/2B/4B/9B),这些模型专为端侧设备优化,可在笔记本电脑甚至手机上运行。马斯克在社交媒体评价其具备“令人惊叹的智能密度”,引发开发者社区热烈反响。 #Qwen35 #马斯克 #阿里 #AI小模型 性能突破:小模型实现大能力 Qwen3.5-9B在多项基准测试中表现卓越,在GPQA Diamond、MMMU-Pro等评测中超越GPT-5 nano、Gemini 2.5 Flash-Lite等大型模型。特别是9B版本在MMMU-Pro测试中以13分优势击败GPT-5-Nano,展现出色性能。4B版本在多语言知识、视觉推理等任务接近9B水平,成为轻量级智能体的理想选择。 端侧部署优势明显 0.8B/2B版本专为移动设备和IoT边缘设备设计,具备低延时特性;4B版本支持多模态任务,平衡性能与资源消耗;9B版本在受限显存环境下提供高性价比服务。实测显示,Qwen3.5-9B在AMD Ryzen AI平台配合量化算法,处理速度达30 token/s,仅需16GB显存即可运行。 开发者积极验证应用潜力 开发者验证模型可在Mac mini等设备配合OpenClaw实现全天候运行,成本低于初级员工月薪。有用户成功在iPhone部署,引发移动端应用热潮。虽然小模型在复杂数学推理方面存在局限,但其在特定任务上已达到商用级水平。 此次开源标志着端侧AI能力显著提升,为低成本AI部署开辟新路径。模型已在魔搭社区和Hugging Face开放下载,助力全球开发者探索边缘计算新场景。
00:00 / 05:51
连播
清屏
智能
倍速
点赞
31
赋范课堂
7月前
Claude Code最佳平替,Qwen3 Code使用指南 Qwen3 Coder模型性能解读,Qwen3 Code编程智能体上手实测!#Qwen #AI #智能体 #编程 #ai新星计划
00:00 / 07:43
连播
清屏
智能
倍速
点赞
120
AI随风
7月前
Qwen3-coder实测,效果出乎意料 Qwen3-coder实测,效果出乎意料,AI编程有了更多选择, 使用Qwen3-coder实现一个AI批改作文小程序界面设计, 使用阿里开发工具灵码#ai #qwen3 #AI编程
00:00 / 07:52
连播
清屏
智能
倍速
点赞
727
赛博小凡
7月前
阿里开源了强大的代码模型,但是我觉得普通用户已经被抛弃了 #qwen3 #阿里 #人工智能 #科技热点 #ai新星计划
00:00 / 01:06
连播
清屏
智能
倍速
点赞
1565
赋范课堂
9月前
从零接入Qwen3,手把手教你代码编写MCP客户端! #人工智能 #ai #Qwen3 #MCP #大模型
00:00 / 14:43
连播
清屏
智能
倍速
点赞
37
通义实验室
9月前
大模型如何持续进化,实现精准检索? 近日,Qwen3 Embedding系列模型开源发布。该系列模型专为文本表征、检索与排序任务设计,充分继承了Qwen3在多语言文本理解能力方面的优势。 欢迎体验~ #通义 #Qwen #大模型 #开源 #科普
00:00 / 01:59
连播
清屏
智能
倍速
点赞
1218
赛脖古
7月前
AI编程工具的收费政策,你可能永远算不清 🤔AI编程工具收费就像手机流量,用多用少你算不清楚,一切都是"运营商说了算"。 #AI编程工具 #ClaudeCode #qwen3 #科技测评 #编程神器
00:00 / 01:34
连播
清屏
智能
倍速
点赞
20
小元老师
7月前
挑战16分钟搞定,Dify+Qwen3构建合同审查系统 #人工智能 #大模型 #AI大模型 #大模型学习 #大模型入门
00:00 / 16:15
连播
清屏
智能
倍速
点赞
1215
小天fotos
1周前
用Qwen3.5做一个Tutor Skill数学题转讲解视频 #ai新星计划 #抖音年味新知贺岁 #qwen35 #qwen #skills
00:00 / 08:34
连播
清屏
智能
倍速
点赞
1599
郝点儿
4天前
一张 3090,真的能把 千问 3.5 35B 模型跑明白吗#本地ai #千问#ai #diy
00:00 / 01:52
连播
清屏
智能
倍速
点赞
1437
梅加雨
6天前
3090跑qwen3.5 27b测试#程序员科普 #ai #qwen
00:00 / 01:32
连播
清屏
智能
倍速
点赞
119
CSDN
8月前
全方位对比DeepSeek-V3和Qwen3 文心大模型4.5系列开源,在GitCode首发。通过在 “硅基流动” 云平台实测,与 DeepSeek-V3、Qwen3 正面 PK——文心 4.5 生成速度“火箭级”,多模态表现亮眼,常规问答平分秋色,专业难题 DeepSeek-V3 略胜一筹。 #AI #开源大模型 #多模态 #文心4_5 #DeepSeekV3 #Qwen3 #模型评测 #GitCode
00:00 / 05:42
连播
清屏
智能
倍速
点赞
3
titan909
2年前
4060Ti 16G显卡安装通义千问Qwen1.5-14B大模型 #4060ti16g显卡 #通义千问1.5
00:00 / 08:40
连播
清屏
智能
倍速
点赞
75
博弈
4天前
使用22G单卡的2080ti,2卡即可运行Qwen3.5-35B-A3B-Q8_0.gguf量化版,上下文设置130K ,每卡占约20G显存,模型大小35G,总显存占用40G左右,在0上下文情况下,首句话速度70token/s,使用opencode在vscode进行编程测试,首上下文1.3K,首句话速度66token/s,当上下文2万时,速度62token/s,当上下文5万时,速度52token/s,当上下文50%,7万时,速度45token/s 运行命令:CUDA_VISIBLE_DEVICES=4,5 ~/llama.cpp/build/bin/llama-server --port 8000 --host 0.0.0.0 --n-gpu-layers -1 --parallel 1 --ctx-size 130000 --flash-attn on --batch-size 4096 --ubatch-size 2048 --cont-batching --no-mmap --mlock --split-mode layer --cache-type-k q8_0 --cache-type-v q8_0 --temp 0.6 --top-p 0.95 --top-k 20 -m /home/boyiu/models/GGUF/Qwen3.5/Qwen3.5-35B-A3B-Q8_0.gguf --jinja --chat-template-file /home/boyiu/models/jinja/Qwen3.5-35B-A3B-Q8_0/chat_template.jinja 由于GGUF量化版在llama.cpp运行时,会出现"System message must be at the beginning"(系统消息必须在开头)的错误问题,需要下载原.jinja发送给大模型,修改为,模板允许系统消息不在开头,单独使用--jinja即可正常回复,与Qwen3.5-122B-A10B同样问题 编码能力与Qwen3.5-122B-A10B相当,由于速度快,能力并不弱,所以完胜A10B,但是在编码指令遵循,逻辑方面还差点意思,在60G以下模型体积下,这款模型应该没有对手,性价比超高,期待deepseek v4版本发布后进行测评#大模型 #量化
00:00 / 00:31
连播
清屏
智能
倍速
点赞
694
简介:
您在查找“
qwen3.5 4b使用教程
”短视频信息吗?
帮您找到更多更精彩的短视频内容!
最新发布时间:2026-03-06 07:12
最新推荐:
中国有别的国家军事基地吗
g沙盒中的典狱长怎么装扮?
如何清理人际关系
相亲无业游民该怎么说
长发为什么不油
滨海新区游园会时间
10万点赞1000元真的吗
你的身份证到底拍的有多美怎么回
最好的我女儿生气
生化危机9管理员门怎么打开
相关推荐:
除恶陈恳和小雅什么关系
豆包APP隐私设置优化指南
魔兽世界血精灵跳过新手村任务出来怎么去主
云闪购发票怎么看
孔知和谁是CP
给实习结束的姐姐发红包发多少合适
内伊今年多大了
陈四姐螺蛳粉
中东爆发战争的原因豆包
从今天起关心食物和身体酸奶
热门推荐:
bubbly更新失败怎么办
相册被抹掉了怎么恢复
大疆商城怎么打开
抢专辑用流量还是wifi
安乾镐wvs怎么样回复
长广设备功能限制
火红switch怎么弄中文
怎么退出个税计算周度订阅
17c.com新域名有什么用
cs2_video.txt怎么修改