qwen3.5如何扩大上下文 - 抖音

您是不是在找：

郝点儿2周前

一张 3090，真的能把千问 3.5 35B 模型跑明白吗#本地ai #千问#ai #diy

00:00 / 01:52

连播

清屏

智能

倍速

点赞3931

AI技能研究社1周前

oMLX 框架部署Qwen3.5 实测oMLX让Qwen3.5生成速度提升4.14倍，解决长上下文响应慢与智能体解析报错难题。#oMLX #Qwen35 #Mac #本地大模型 #AI智能体

00:00 / 01:59

连播

清屏

智能

倍速

点赞499

赵兄休得胡言3周前

Coding Plan，openclaw最佳调用拍档 openclaw调用的最大问题是上下文过多，我最大一次293k上下文，意味着100万token可能发几个逗号都耗光了。百炼的coding plan改为了调用次数，更适合openclaw使用。 qwen，kimi，glm的最新模型都在套餐包里面。#openclaw #阿里云百炼 #token #抖音养虾人俱乐部

00:00 / 05:53

连播

清屏

智能

倍速

点赞1796

霍格沃兹软件测试开发3周前

Qwen3.5 四款模型发布当 35B 可以挑战 235B，问题就不只是模型大小。 Qwen3.5 释放的信号，可能意味着参数时代正在进入下半场。规模、长上下文、RL——真正的变量到底是什么？#qwen #人工智能 #自动化测试 #大模型

00:00 / 00:51

连播

清屏

智能

倍速

点赞7

敢抢我神棍名号3周前

小核弹-千问3.5及节点支持-qwen3.5 #comfyui教程去小破站（B）获取选在链接

00:00 / 01:51

连播

清屏

智能

倍速

点赞5

Ai 学习的老章1周前

神操作再现，单卡3090 起跑！Claude-Opus蒸馏Qwen3.5-27B #大模型#蒸馏 #程序员

00:00 / 01:46

连播

清屏

智能

倍速

点赞592

AI技能研究社3周前

SGLang部署Qwen3.5-27B实战踩坑记录详解 SGLang 部署 Qwen3.5 27B 流程，攻克工具调用、显存优化及 OpenClaw 对接等 5 大实战坑位。#SGLang #Qwen35 #大模型部署 #AIAgent #人工智能

00:00 / 06:08

连播

清屏

智能

倍速

点赞392

AI名人说2周前

AGI-next林俊旸：Qwen3怎么变聪明数据、回答里加入Thinking的技术；承认Coding、Agent落后 #林俊旸 #阿里 #qwen #AI #离职

00:00 / 02:34

连播

清屏

智能

倍速

点赞124

AI技能研究社1周前

5090 vLLM 部署 Qwen3.5-27B-NVFP4 手把手教你 5090 部署 Qwen3.5 27B，解决 Docker 换源与 NVFP4 量化难题。 *参考github：aliez-ren/vllm-qwen3.5-nvfp4-sm120#Qwen3527B #RTX5090 #vLLM #大模型部署 #深度学习

00:00 / 03:31

连播

清屏

智能

倍速

点赞853

一蛙AI2周前

Qwen3.5上用Claude最新工具调用方法如果你的 AI Agent 可以通过“按需搜索工具”并编写代码来编排数十个工具调用，而不是让大语言模型（LLM）逐一处理，从而大幅降低 Token 消耗，会怎样？在这段视频中，我们将 Anthropic 工程博客中提到的两种高级工具调用模式，实现在我们自定义的 Python 和 React AI Agent 中：即工具搜索工具（Tool Search Tool）以及通过代码执行沙箱实现的程序化工具调用。这些并非 Claude 的专属功能。它们是通用的 Agent 设计模式，你可以将其应用于任何模型或框架。我们对这两种方法进行了侧重对比，将传统的工具调用与程序化执行进行衡量，并在 Claude Haiku 和运行在 RTX 5090 本地环境下的全新 Qwen 3.5 27B 上运行了相同的任务。 #大模型 #Qwen #aiagent #openclaw

00:00 / 19:02

连播

清屏

智能

倍速

点赞97

梅加雨3周前

3090跑qwen3.5 27b测试#程序员科普 #ai #qwen

00:00 / 01:32

连播

清屏

智能

倍速

点赞143

肝帝AI7月前

更快的Qwen3-Coder来啦千问3半夜炸塘，发布极速版Qwen3 Coder，全称Qwen3 Coder Flash 包含3个特性：1，超强的Agent能力；2，超长上下文；3，已经正式开源。 RTX4090、RTX5090都可以跑 #qwen3 #通义千问 #ai编程 #qwen3coder #大模型

00:00 / 00:43

连播

清屏

智能

倍速

点赞330

AI名人说2周前

AGI-next林俊旸：Qwen想做无限上下文窗口 memory对AI自我认知很重要；Qwen系列很大精力在多语言支持 #林俊旸 #离职 #Qwen #AI #阿里

00:00 / 02:53

连播

清屏

智能

倍速

点赞73

AI技能研究社1周前

Qwen3.5-27B Opus蒸馏版实测实测注入Claude Opus数据的Qwen3.5蒸馏版，解决原生报错并支持长任务稳定运行。#Qwen35蒸馏版 #ClaudeOpus #AIAgent #本地大模型 #编程助手

00:00 / 01:37

连播

清屏

智能

倍速

点赞95

AI赚钱研究社3周前

Qwen 3.5中杯发布：本地部署教程深度解析 Qwen 3.5 各版本差异，分享 35B-A3B 本地部署避坑参数与显存优化技巧。#Qwen35 #大模型 #vllm #SGLang #本地部署

00:00 / 05:26

连播

清屏

智能

倍速

点赞764

AI逐风3周前

千问3.5小尺寸模型发布手机本地运行的大模型越来越强了。真正完全免费完全隐私 #qwen #千问

00:00 / 00:32

连播

清屏

智能

倍速

点赞58

王耀鐭6天前

本地部署Qwen3.5: vllm VS llama.cpp #大模型部署 #大模型 #学习日常

00:00 / 07:32

连播

清屏

智能

倍速

点赞20

千问大模型8月前

教你正确打开 Qwen3-Coder 自动制定项目计划、网络搜索、素材整理、独立完成项目！Qwen3-Coder正确打开方式教会你，通通都可以实现！ #Qwen #AI #通义千问 #大模型 #教程

00:00 / 01:33

连播

清屏

智能

倍速

点赞1317

kate人不错2周前

Qwen3.5 小模型实测：0.8B 到 35B-A3B 这期视频我实测了 Qwen3.5 中小模型在本地端的真实表现：你会看到： - 不同量化下的显存占用与推理速度差异 - 浏览器端 WebGPU 运行 0.8B 的体验 - 视觉识别/OCR 实测表现 - 9B 与 35B-A3B 在任务稳定性与效果上的差异 - LM Studio 关闭 thinking 的实操方法 - 在 OpenCode / Cline 中做工具调用与编码测试的结果如果你也在找一套“能在本地跑、质量又够用”的模型组合，这期会很有参考价值。时间戳 00:00 Qwen3.5 中小模型简介 00:50 格式与部署 02:21 显存与速度实测 03:40 视觉/OCR能力对比 05:33 本地实战案例 11:00 工具调用与编码测试 #Qwen35 #本地大模型 #Ollama #LMStudio #千问

00:00 / 13:28

连播

清屏

智能

倍速

点赞514

AI 博士嗨嗨10月前

人人都能玩! Qwen3最强开源模型保姆级本地部署教程 #qwen3 #ollama #本地部署 #cherrystudio #AI模型

00:00 / 08:09

连播

清屏

智能

倍速

点赞622

挽风听雨1周前

超简单OpenClaw+Qwen3.5-Plus+QQbot #openclaw #养龙虾 #OpenClaw#qwen3 #龙虾部署 #openclaw部署

00:00 / 05:44

连播

清屏

智能

倍速

点赞45

小天fotos3周前

Qwen3.5-27B太好玩，不小心养了一窝龙虾 #ai新星计划 #抖音年味新知贺岁 #openclaw #qwen #4090魔改

00:00 / 08:29

连播

清屏

智能

倍速

点赞NaN

光影织梦7月前

Qwen3-Coder-480B 私有化部署专业指南一、部署核心配置方案 1. Docker环境优化 - --shm-size=100g ：配置超大共享内存，满足节点内8卡间高频数据交换需求，消除多进程通信瓶颈。 - --gpus all ：全量启用节点内GPU资源，结合 --tp 16 参数实现16卡协同计算，避免资源闲置。 - 辅助配置： --network host 与 --ipc host 模式减少网络与进程通信开销，为分布式计算提供高效环境。 2. NCCL通信协议配置 - 网络硬件绑定：通过 NCCL_IB_HCA=mlx5_0,...mlx5_8 指定节点内8张GPU对应的InfiniBand网卡，依托400Gbps高速链路实现低延迟通信。 - 通信参数优化： NCCL_IB_QPS_PER_CONNECTION=8 配置匹配单节点8卡并行通信需求，提升多卡协同效率。 3. SGLang框架核心参数设置 - 编译优化： --enable-torch-compile 启用PyTorch编译功能，针对A100的Tensor Core特性生成优化内核，推理速度提升20%-30%。 - 批处理控制： --torch-compile-max-bs 8 结合A100大显存优势，平衡吞吐量与延迟，支持高并发场景。 - 上下文扩展：通过 --context-length 131072 参数及YaRN技术，将上下文长度扩展至128k，满足长文本代码生成需求。三、节点部署实现主从节点核心差异 - 主节点：通过 --node-rank 0 标识，负责分布式任务初始化与协调，所有节点通过 --dist-init-addr ip:port 与其建立连接。 - 从节点：以 --node-rank 1 标识，专注于执行计算任务，与主节点保持参数一致性（除节点标识外），确保集群协同性。通过上述配置，可在2×8×A100环境下构建高效、稳定的Qwen3-Coder-480B私有化部署方案，为企业提供专业级代码智能辅助能力。 #大模型 #私有化部署 #qwen #推理引擎 #人工智能

00:00 / 14:49

连播

清屏

智能

倍速

点赞265

人工大黑1月前

我让7个AI给我的猫建了个天堂 | 国产AI编程大横评 Qwen3.5、GLM-5、Seed 2.0、MiniMax、Kimi、Step、Claude，统一提示词，全程录屏。有惊喜，有翻车，有后门账号，有代码彩蛋。这不是benchmark，是一次赛博斗蛐蛐。祝各大国内厂商早日干翻Claude。 #Qwen #kimi #GLM #Seed #ai新星计划

00:00 / 10:59

连播

清屏

智能

倍速

点赞7183

澳門AI佬3周前

9B 参数干翻 80B？阿里开源四款Qwen3.5系列小模型 - 可在手机、笔记本、普通电脑上运行... - 而且都是多模态，支持文字、图片、视频输入 - 百万 Agent 级别 RL 训练，Agent 任务能力显著提升 - 支持 201 种语言 - 支持 262K token 的超长上下文，可扩展到100万下面是2B版本在手机上本地运行#玩个很新的东西 #每日ai

00:00 / 00:07

连播

清屏

智能

倍速

点赞82

沪上码仔AI3周前

#qwen3.5 #LLM #开源大模型 #mac #本地部署在Mac book上本地部署qwen3.5大模型测试结果。使用LMStudio进行本地部署大模型。实测qwen3.5最新开源大模型。

00:00 / 02:11

连播

清屏

智能

倍速

点赞336

ModelDaDa2周前

一分钟用上本地小模型 🤩一分钟教你在 Windows 本地用上阿里 Qwen3.5 - 4B 大模型！超简单步骤，小白也能秒上手，赶紧来试试！#Qwen3.5 - 4B 模型 #本地部署 #阿里千问 #大模型使用 #Windows 操作 #LMStudio

00:00 / 01:04

连播

清屏

智能

倍速

点赞136

AI技能研究社2周前

单卡跑通商业级知识库：极致压榨显卡性能教你如何用一张48G显卡同时运行OCR、向量检索、35B推理模型与语音识别，实现私有化部署。#商业级知识库 #Qwen35 #私有化部署 #大模型 #MinerU

00:00 / 05:10

连播

清屏

智能

倍速

点赞66

Ai 学习的老章5天前

vLLM 紧急补丁！Qwen3.5 越跑越蠢，元凶找到了 Qwen3.5 的大模型用了 Mamba 加 Attention 的混合架构，两种层共享 GPU 上同一套缓存空间。Mamba 往里写的是 32 位浮点数，attention 用的是 8 位或 16 位。一个缓存块先被 Mamba 用过，回收后分配给 attention，旧数据在新的精度下直接变成了 NaN。更坑的是，attention 的掩码机制用的是乘以零。零乘正常数字等于零，但零乘 NaN 还是 NaN。脏数据就这么一路扩散，所以服务刚启动没事，跑一阵之后精度才悄悄往下掉。这种 bug 排查起来最折磨人，你查模型、查数据、查 prompt，全都没问题。但输出就是在变差。vLLM 这次修复方案很朴素：新分配的缓存块，用之前先清零。性能代价不到百分之一。只要你在跑 Qwen3.5 混合架构，建议尽快升级。除了这个，0.17.1 还正式支持了 Nemotron 3 Super。英伟达 120B 参数的开源模型，OpenClaw 排行榜杀进前五，前五里唯一的开源选手。现在 vLLM 一航命令就能部署了。

00:00 / 01:13

连播

清屏

智能

倍速

点赞67

电磁波Studio2周前

LTX-2.3开源了！本地部署ComfyUI工作流生成电影级视频🔥 ✅ 4090显卡本地可跑工作流 ✅ 竖屏视频画质大幅优化 ✅ 配合Qwen3.5自动写专业提示词 4个工作流：Logo视频｜电影厂标｜宠物播客｜武打片段 💬 你最喜欢哪个Demo？ #ai新星计划 #科技下一站 #comfyui #aigc #runninghub

00:00 / 08:51

连播

清屏

智能

倍速

点赞1067

大曼哒1周前

本地部署智能体：Qwen3.5 + Claude Code 本视频将演示如何使用 Llama.cpp 和 Claude Code 在本地安装 Qwen3.5 4B 模型 #claude #ai编程 #千问qwen #ai #智能体

00:00 / 06:07

连播

清屏

智能

倍速

点赞91

九天Hector10月前

【深度解析】大模型新王Qwen3发布！ Qwen-3深度解析！硬件配置、原生MCP功能介绍、模型选择详解！仅需1/3硬件成本，性能超越DeepSeek-R1！ #千问3 #通义千问 #大模型 #国产大模型

00:00 / 07:28

连播

清屏

智能

倍速

点赞246

九天Hector9月前

Qwen3接入MCP，企业级智能体开发实战！Qwen3原生MCP能力解析｜MCP Client源码级开发｜Qwen-Agen接入海量MCP高效搭建智能体！#ai #Qwen3 #mcp #ai新星计划

00:00 / 01:42:45

连播

清屏

智能

倍速

点赞287

杨大哥3周前

Qwen3.5 35b本地部署适配OpenClaw

00:00 / 02:00

连播

清屏

智能

倍速

点赞2741

Aiwood爱屋研究室2周前

开源绝唱？如何在Comfyui部署qwen3.5

00:00 / 05:03

连播

清屏

智能

倍速

点赞69

码上架构3周前

Qwen3.5 多模态实战使用Qwen3.5 来做 OCR 和目标检测任务 #ai #大模型 #qwen #ocr #目标检测

00:00 / 03:46

连播

清屏

智能

倍速

点赞128

nxlz10月前

qwen3 本地实测 🚀 本地运行Qwen3模型零门槛教程 📱 小白也能快速上手的AI大模型教程 🔥 无需高配置，轻松本地运行Qwen3模型 ⚙️ LM Studio客户端一键下载部署Qwen3 🌐 Cherry Studio跨平台调用，扩展应用场景 #Qwen3 #LMStudio #AI大模型 #本地部署 #技术教程

00:00 / 03:48

连播

清屏

智能

倍速

点赞73

博弈3周前

使用22G单卡的2080ti，2卡即可运行Qwen3.5-35B-A3B-Q8_0.gguf量化版，上下文设置130K ，每卡占约20G显存，模型大小35G，总显存占用40G左右，在0上下文情况下，首句话速度70token/s，使用opencode在vscode进行编程测试，首上下文1.3K，首句话速度66token/s，当上下文2万时，速度62token/s，当上下文5万时，速度52token/s，当上下文50%，7万时，速度45token/s 运行命令：CUDA_VISIBLE_DEVICES=4,5 ~/llama.cpp/build/bin/llama-server --port 8000 --host 0.0.0.0 --n-gpu-layers -1 --parallel 1 --ctx-size 130000 --flash-attn on --batch-size 4096 --ubatch-size 2048 --cont-batching --no-mmap --mlock --split-mode layer --cache-type-k q8_0 --cache-type-v q8_0 --temp 0.6 --top-p 0.95 --top-k 20 -m /home/boyiu/models/GGUF/Qwen3.5/Qwen3.5-35B-A3B-Q8_0.gguf --jinja --chat-template-file /home/boyiu/models/jinja/Qwen3.5-35B-A3B-Q8_0/chat_template.jinja 由于GGUF量化版在llama.cpp运行时，会出现"System message must be at the beginning"（系统消息必须在开头）的错误问题，需要下载原.jinja发送给大模型，修改为，模板允许系统消息不在开头，单独使用--jinja即可正常回复，与Qwen3.5-122B-A10B同样问题编码能力与Qwen3.5-122B-A10B相当，由于速度快，能力并不弱，所以完胜A10B，但是在编码指令遵循，逻辑方面还差点意思，在60G以下模型体积下，这款模型应该没有对手，性价比超高，期待deepseek v4版本发布后进行测评#大模型 #量化

00:00 / 00:31

连播

清屏

智能

倍速

点赞923

啦啦啦的小黄瓜7月前

Qwen-Image开源，人人秒变设计师！ Qwen-Image开源，完全免费。23个效果以及提示词，详细本地教程！#ComfyUI #AI #AI设计 #Qwenimage #科技

00:00 / 19:21

连播

清屏

智能

倍速

点赞611

赋范课堂10月前

一文详解源神Qwen3全需求硬件配置指南 #Qwen3 #大模型 #Agent #人工智能

00:00 / 08:31

连播

清屏

智能

倍速

点赞150

赋范课堂10月前

一文详解Qwen3 黄金搭档Qwen-Agent接入MCP！ #人工智能 #ai #大模型 #Qwen3 #MCP

00:00 / 09:39

连播

清屏

智能

倍速

点赞24

薛定谔的叨叨1周前

阿里千问qwen3.5-35B-A3B大模型本地部署体验，实现养龙虾模型自由#大模型 #本地大模型 #部署大模型

00:00 / 06:47

连播

清屏

智能

倍速

点赞66

行侠好书1月前

国产AI逆袭！阿里云QWen3.5发布国产AI逆袭！阿里云QWen3.5发布，128K上下文碾压GPT-4！#QWen3.5 #国产AI #开源大模型 #多模态AI #阿里云

00:00 / 02:26

连播

清屏

智能

倍速

点赞32

AI伙夫长11月前

全网都在找Qwen2.5-omni多模态大模型如何使用这里我将告诉大家两个使用和申请他的方法，第一个直接就能使用，第二个可在手机端操作，快来拿走吧！#AI #AI工具 #qwen25omni #多模态ai

00:00 / 01:19

连播

清屏

智能

倍速

点赞643

通义实验室9月前

大模型如何持续进化，实现精准检索？近日，Qwen3 Embedding系列模型开源发布。该系列模型专为文本表征、检索与排序任务设计，充分继承了Qwen3在多语言文本理解能力方面的优势。欢迎体验~ #通义 #Qwen #大模型 #开源 #科普

00:00 / 01:59

连播

清屏

智能

倍速

点赞1218

小代不爱学1周前

微调后更加简洁，避免啰嗦，只要结果，不要过程！！#编程学习 #大模型 #qwen #大模型学习 #vlog流量扶持计划

00:00 / 01:13

连播

清屏

智能

倍速

点赞10

沐凌熙2周前

Qwen3.5小模型实现手机端本地运OCR兼顾效率与隐私 #Ai #电脑 #科技

00:00 / 02:19

连播

清屏

智能

倍速

点赞6

IT极客.J1周前

国产 AI 王炸！ Qwen3.5 让旧笔记本跑顶级大模型，算力平权时代来了！

00:00 / 07:48

连播

清屏

智能

倍速

点赞0

公子玄天3周前

有人已经直接用 Qwen3.5-27B + DGX Spark 做成 Android Agent，通过 Web UI 下发任务，让模型自己读屏、决策、点按，推理速度提升 4 倍。#OpenClaw #Ai

00:00 / 00:18

连播

清屏

智能

倍速

点赞1566

赋范课堂10月前

从零接入Qwen3，手把手教你代码编写MCP客户端！ #人工智能 #ai #Qwen3 #MCP #大模型

00:00 / 14:43

连播

清屏

智能

倍速

点赞37

Aiden1周前

ComfyUI-Qwen3.5本地的安装方法 #AIGC#COMFYUI#comfyui教程#comfyui设计#runninghub

00:00 / 10:21

连播

清屏

智能

倍速

点赞12

小天fotos1月前

用Qwen3.5做一个Tutor Skill数学题转讲解视频 #ai新星计划 #抖音年味新知贺岁 #qwen35 #qwen #skills

00:00 / 08:34

连播

清屏

智能

倍速

点赞2440

AI猿姗姗9月前

Qwen3成功越狱！突破限制！，5分钟打造你的虚拟AI女友，让大模型回答任何问题！附完整代码！ #Qwen3 #AI #大模型 #人工智能 #科技

00:00 / 09:52

连播

清屏

智能

倍速

点赞233

程序员寒山10月前

本地部署Qwen3小参数版本实测：并非鸡肋实测多个本地模型本期视频主要给大家介绍本地部署大模的相关知识，实测Qwen3 小参数模型的过程，包括与DeepSeek r1 8b和在线版本的对比。更多往期视频内容可以到主页列表下查看(程序员寒山:CxyHanShan)，欢迎大家留言关注讨论。#Qwen3 #Deepseek #本地部署 #ollama

00:00 / 08:58

连播

清屏

智能

倍速

点赞388

AI随风7月前

Qwen3-coder实测，效果出乎意料 Qwen3-coder实测，效果出乎意料，AI编程有了更多选择，使用Qwen3-coder实现一个AI批改作文小程序界面设计, 使用阿里开发工具灵码#ai #qwen3 #AI编程

00:00 / 07:52

连播

清屏

智能

倍速

点赞727

无限进步的Rangen7月前

手把手教你接入Qwen3Coder写代码的三种方法手把手教你接入Qwen3Coder写代码的三种方法#AI #千问 #Qwen3 #编程

00:00 / 06:32

连播

清屏

智能

倍速

点赞71

AI猿姗姗10月前

10分钟教你使用Dify+Qwen3构建合同审查助手，提升效率、降低风险并节约成本！附文档代码！ #人工智能 #ai #Dify #Qwen3 #大模型

00:00 / 15:02

连播

清屏

智能

倍速

点赞797

隆哒隆10月前

qwen 3.0下载教程 #qwen3模型下载方法 #Qwen3 #人工智能通义千问3下载教程

00:00 / 00:31

连播

清屏

智能

倍速

点赞20

村东头二狗子(限流版)1周前

ollama导入完整第三方qwen3.5 破限模型我用夸克网盘分享了「ollama导入模板参考.txt」，点击链接即可保存。打开「夸克APP」，无需下载在线播放视频，畅享原画5倍速，支持电视投屏。链接：https://pan.quark.cn/s/bf1a0d93abbd

00:00 / 08:19

连播

清屏

智能

倍速

点赞0

小工蚁3周前

Qwen3.5 27B和35B选哪个？Ceval模型评测实践 #小工蚁 #通义千问 #开源大模型

00:00 / 02:31

连播

清屏

智能

倍速

点赞178

陈虾仁AI3月前

千问开源了Qwen-Image-Layered，平面图直接可以分图层，还可以编辑，Photoshop还香吗？ #千问 #Qwen #Photoshop #图层 #AI

00:00 / 02:52

连播

清屏

智能

倍速

点赞NaN

杨博士说AI2周前

千问3.5真正开启AI应用元年！ #千问 #Qwen35 #ChatGPT #Claude #Gemini

00:00 / 04:16

连播

清屏

智能

倍速

点赞87

程序员御风1月前

Qwen3.5 实测：会写代码，能读视频原生多模态到底强在哪？ #AI #Qwen #千问大模型 #人工智能 #开源

00:00 / 06:07

连播

清屏

智能

倍速

点赞236

简介:

您在查找“qwen3.5如何扩大上下文”短视频信息吗？帮您找到更多更精彩的短视频内容！最新发布时间：2026-03-20 06:08

最新推荐:

相关推荐:

热门推荐: