Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko; compatible; ClaudeBot/1.0; +claudebot@anthropic.com)
精选
推荐
搜索
探索
直播
放映厅
短剧
小游戏
搜索
您是不是在找:
黄仁勋的ai是怎么做出来的
Qclaw接入豆包好用吗
token项目
如何让codex24小时
codex自动创作脚本该选哪个
嘉立创原理图怎么找到工程文件
ddc的采访音效路人能听到吗
codex破甲提示词怎么用
libtv教程利用主体库生产成脚本
codex可以帮忙做文件么
46wg
2月前
在vllm轻松关闭qwen3.5 推理功能 只需要一行参数轻松关闭qwen3.5推理。 #vllm #qwen #qwen3 #think #关闭推理
00:00 / 07:02
连播
清屏
智能
倍速
点赞
15
一把老骨头
1天前
国产龙虾QwenPaw测试任务五之制作PPT PPT制作技能一般... #QwenPaw #qwen大模型 #27B #llama #PPT制作
00:00 / 02:51
连播
清屏
智能
倍速
点赞
4
绘世玩家
2周前
llama.cpp本地部署 llama.cpp本地部署&集成Qwen3.6大模型-效率起飞 #comfyui #ComfyUI教程 #llama #qwen
00:00 / 08:21
连播
清屏
智能
倍速
点赞
67
琪琪AI科技
1周前
拒绝云端泄密!阿里QwenPaw 本地部署才是真香选择!#阿里 #QwenPaw #本地部署 #AI
00:00 / 01:49
连播
清屏
智能
倍速
点赞
465
千问大模型
5天前
一码当先,长程执行 Qwen3.7-Max 融合了前沿推理、跨框架泛化与持续高效执行的能力,是千问迄今最全面、最强大的智能体模型~ #Qwen #千问大模型 #千问 #AI #大模型
00:00 / 01:16
连播
清屏
智能
倍速
点赞
2289
小工蚁
2年前
多GPU推理加速Qwen-72B开源大模型
00:00 / 04:52
连播
清屏
智能
倍速
点赞
425
kate人不错
2月前
Qwen3.5 小模型实测:0.8B 到 35B-A3B 这期视频我实测了 Qwen3.5 中小模型在本地端的真实表现: 你会看到: - 不同量化下的显存占用与推理速度差异 - 浏览器端 WebGPU 运行 0.8B 的体验 - 视觉识别/OCR 实测表现 - 9B 与 35B-A3B 在任务稳定性与效果上的差异 - LM Studio 关闭 thinking 的实操方法 - 在 OpenCode / Cline 中做工具调用与编码测试的结果 如果你也在找一套“能在本地跑、质量又够用”的模型组合,这期会很有参考价值。 时间戳 00:00 Qwen3.5 中小模型简介 00:50 格式与部署 02:21 显存与速度实测 03:40 视觉/OCR能力对比 05:33 本地实战案例 11:00 工具调用与编码测试 #Qwen35 #本地大模型 #Ollama #LMStudio #千问
00:00 / 13:28
连播
清屏
智能
倍速
点赞
708
迷糊大王
1周前
qwenpaw自己做的系列视频 #qwenpaw #齐齐哈尔工程学院
00:00 / 02:59
连播
清屏
智能
倍速
点赞
15
一把老骨头
1周前
国产龙虾QwenPaw测试任务之一:发送邮件 视频打码没学会,尴尬.....调用家里部署的大模型,顿生赚了大把token的舒爽。#国产龙虾 #Qwenpaw
00:00 / 02:35
连播
清屏
智能
倍速
点赞
2
AI随风
1月前
编程能力大加强,Qwen-3.6-plus 前后端编程测试 本视频介绍了 Qwen3.6-plus 大模型的前后端测试 Qwen-3.6-plus 特点 默认支持100万上下文窗口 显著提升的智能体编程能力 更出色的多模态感知与推理能力 测试案例 注意: 本次测试客户端阿里开发工具 Qoder 进行测试,已经内置 Qwen-3.6-plus 模型 测试流程仍然是按照先 plan->执行, 一个需求对话不超过 5 轮 #AI编程 #Qwen #千问 #AI编程工具
00:00 / 06:31
连播
清屏
智能
倍速
点赞
309
AI赚钱研究社
3月前
Qwen 3.5中杯发布:本地部署教程 深度解析 Qwen 3.5 各版本差异,分享 35B-A3B 本地部署避坑参数与显存优化技巧。#Qwen35 #大模型 #vllm #SGLang #本地部署
00:00 / 05:26
连播
清屏
智能
倍速
点赞
891
AI信息差
3天前
Qwen3.7-Max深度实测 通过逻辑推理、输出稳定性及硬核编程实战三个维度,深度拆解Qwen3.7-Max的真实性能表现。分析其指令遵循、上下文幻觉抑制及使用中的Token成本与技巧。#Qwen37Max #大模型测评 #人工智能 #编程实战 #通义千问
00:00 / 04:47
连播
清屏
智能
倍速
点赞
28
迷糊大王
1周前
掀开AI黑盒子!三层架构让你的Agent像人一样思考 #qwenpaw #齐齐哈尔工程学院
00:00 / 03:05
连播
清屏
智能
倍速
点赞
6
迷糊大王
1周前
QwenPaw 是什么? 别再用传统 AI 了!QwenPaw 到底是什么?#qwenpaw #齐齐哈尔工程学院
00:00 / 03:18
连播
清屏
智能
倍速
点赞
14
Ai 学习的老章
4天前
Qwen3.6 上了MTP,本地推理速度起飞
00:00 / 01:13
连播
清屏
智能
倍速
点赞
88
赛脖古
4天前
Qwen3.7-Max正式发布 2026阿里云峰会,Qwen3.7-Max正式发布,3个月三代旗舰,聊聊我的感受 #我在抖音聊科技 #科技下一站 #科技资讯 #vibecoding #qwen
00:00 / 02:00
连播
清屏
智能
倍速
点赞
234
碳基生物退役指南
1周前
补齐 DeepSeek V4 视觉短板:免费本地部署方案! 智能体时代,多模态是入场券,但很多前沿大模型推理虽强,却不支持图像输入。本期视频以 DeepSeek V4 Pro 为例,手把手演示,如何用本地部署的 Qwen3.6-35B-A3B 为它补齐识图能力。从 Claude Code 配置 Python 虚拟环境、编写识图 Skill,到规避图片 base64 污染上下文,全程实操。最后用真实任务验证:两张杂志截图直接生成英语播客课件,逐字对照原图,一字不差。本地加云端的混合推理,方便、免费、成本可控,建议有动手能力的朋友试试看! 视频里提到的 Claude Code 里创建识图Skill 的提示词: 创建一个全局 Skill 及对应的代码,用于图像识别(注意并不是 OCR)并返回 Markdown 文本。当用户提供图片时,Skill 应使用自带的 Python 代码,自动执行以下操作: 1. 将图片缩放到最长边 ≤1280 px; 2. 将图片及识图默认提示词:“识别图片里所有信息,使用 markdown 输出全部内容,并保持排版的一致”,发送到本地视觉 API(你的本地识图 api 地址+/v1/chat/completions); 3. 获取 Markdown 文本,并提供给会话供后续操作。 关于 Python:请检查主目录下的 python 虚拟环境,如果没有创建,请在 Claude Code 主目录下新建 venv,并在未来执行所有 python 代码时,统一使用这个虚拟环境。 #deepseek #claude#智能体 #大模型 #人工智能
00:00 / 13:21
连播
清屏
智能
倍速
点赞
414
迷糊大王
5天前
AI学会「记住你」的秘密:两个文件让机器变成伙伴 #qwenpaw #齐齐哈尔工程学院
00:00 / 02:41
连播
清屏
智能
倍速
点赞
8
一把老骨头
4天前
国产龙虾QwenPaw测试任务四:编制ISO27001计划书 上下文长度再破极限...... #国产龙虾 #QwenPaw #2080ti22g #iso27001信息安全管理体系 #大模型
00:00 / 04:42
连播
清屏
智能
倍速
点赞
4
迷糊大王
1周前
为什么你的AI永远记不住你?3个致命缺陷90%的人没发现 #qwenpaw #齐齐哈尔工程学院
00:00 / 03:40
连播
清屏
智能
倍速
点赞
5
AGI_Ananas
10月前
Qwen3-235B & Qwen3-Coder 超深度解析 本期视频为你带来一场极致深入的技术解析,全面拆解阿里通义千问 Qwen3 最新发布的两个重磅模型:Qwen3-Coder 与 Qwen3-235B-A22B。 模型架构 / 参数规模 / 性能对比 Coder 编码能力实测 混合专家机制(MoE)亮点解析 中文与多语言支持能力 API、开源情况 本视频为想真正了解 Qwen3 系列模型的开发者、AI从业者、模型评测爱好者量身打造,信息密度爆表,看完你将对国产大模型生态有全新认知!#Qwen3 #Qwen3Coder实测 #编码模型 #模型性能测试 #参数规模解析
00:00 / 02:28
连播
清屏
智能
倍速
点赞
47
迷糊大王
1周前
你用的ChatGPT和QwenPaw,根本不是同一种东西 #qwenpaw #齐齐哈尔工程学院
00:00 / 02:21
连播
清屏
智能
倍速
点赞
8
Ai 学习的老章
1周前
DeepSeek-V4 蒸馏 Qwen3.5,只有 9B
00:00 / 01:19
连播
清屏
智能
倍速
点赞
96
玩Ai的智能体
2天前
周末在家用mac studio搭建qwenpaw本地算力 #养虾#openclaw#本地模型#macstudio #qwenpaw
00:00 / 00:52
连播
清屏
智能
倍速
点赞
67
sjw1933
2天前
M5 Max 128G本地AI推理 性能测试,我先说:我最喜qwen3.5:122b!#本地大模型 #m5max #千问 #我在抖音聊科技 #本地模型
00:00 / 05:42
连播
清屏
智能
倍速
点赞
40
外行人搞AI
1周前
VLLM+Qwen3.5的部署实践 #VLLM#千问
00:00 / 01:28
连播
清屏
智能
倍速
点赞
74
sjw1933
1天前
120B选GPT还是QWEN? 大家看看两者推理表现如何,这一局我选择GPT#gpt #qwen #本地模型 #m5max #我在抖音聊科技
00:00 / 07:31
连播
清屏
智能
倍速
点赞
27
赋范课堂
1年前
一文详解Qwen3黄金搭档,实操带练Qwen-Agent! #人工智能 #ai #大模型 #Qwen3 #QwenAgent
00:00 / 10:49
连播
清屏
智能
倍速
点赞
55
光影织梦
10月前
Qwen3-Coder-480B 私有化部署专业指南 一、部署核心配置方案 1. Docker环境优化 - --shm-size=100g :配置超大共享内存,满足节点内8卡间高频数据交换需求,消除多进程通信瓶颈。 - --gpus all :全量启用节点内GPU资源,结合 --tp 16 参数实现16卡协同计算,避免资源闲置。 - 辅助配置: --network host 与 --ipc host 模式减少网络与进程通信开销,为分布式计算提供高效环境。 2. NCCL通信协议配置 - 网络硬件绑定:通过 NCCL_IB_HCA=mlx5_0,...mlx5_8 指定节点内8张GPU对应的InfiniBand网卡,依托400Gbps高速链路实现低延迟通信。 - 通信参数优化: NCCL_IB_QPS_PER_CONNECTION=8 配置匹配单节点8卡并行通信需求,提升多卡协同效率。 3. SGLang框架核心参数设置 - 编译优化: --enable-torch-compile 启用PyTorch编译功能,针对A100的Tensor Core特性生成优化内核,推理速度提升20%-30%。 - 批处理控制: --torch-compile-max-bs 8 结合A100大显存优势,平衡吞吐量与延迟,支持高并发场景。 - 上下文扩展:通过 --context-length 131072 参数及YaRN技术,将上下文长度扩展至128k,满足长文本代码生成需求。 三、节点部署实现 主从节点核心差异 - 主节点:通过 --node-rank 0 标识,负责分布式任务初始化与协调,所有节点通过 --dist-init-addr ip:port 与其建立连接。 - 从节点:以 --node-rank 1 标识,专注于执行计算任务,与主节点保持参数一致性(除节点标识外),确保集群协同性。 通过上述配置,可在2×8×A100环境下构建高效、稳定的Qwen3-Coder-480B私有化部署方案,为企业提供专业级代码智能辅助能力。 #大模型 #私有化部署 #qwen #推理引擎 #人工智能
00:00 / 14:49
连播
清屏
智能
倍速
点赞
265
迷糊大王
5天前
一个300字文件,就能让AI拥有性格?手把手教你写 #qwenpaw #齐齐哈尔工程学院
00:00 / 02:24
连播
清屏
智能
倍速
点赞
2
张老师讲论文
9月前
最新非思考 Ai大模型 #qwen3 #最新ai大模型 #非思考ai大模型 #ai工具使用 #通义千问
00:00 / 00:32
连播
清屏
智能
倍速
点赞
44
小工蚁
2年前
Qwen1.5-72B上下文推理准确度评估演示 16K时最优 #小工蚁
00:00 / 03:42
连播
清屏
智能
倍速
点赞
319
九天Hector
11月前
Qwen3接入MCP,企业级智能体开发实战!Qwen3原生MCP能力解析|MCP Client源码级开发|Qwen-Agen接入海量MCP高效搭建智能体!#ai #Qwen3 #mcp #ai新星计划
00:00 / 01:42:45
连播
清屏
智能
倍速
点赞
286
Ai 学习的老章
3周前
Qwopus3.6-27B 本地部署,24G 显卡轻松跑 Qwen 加 Opus,缝合怪又来了,这次是 27B 本地版。大家好,我是AI学习的老章。今天聊一个有意思的开源模型,Qwopus3.6-27B-v1-preview,作者 Jackrong。光看名字你就懂了,Qwen 加 Opus,意思是拿 Claude Opus 的蒸馏数据,去调教 Qwen3.6-27B。底座是阿里的 Qwen3.6-27B 稠密模型,原生 262K 上下文,能扩到 1M。训练用的 Unsloth,数据是 Claude 蒸馏数据集打底,混入 GLM-5.1、Kimi-K2.5、Qwen3.5 的推理数据。最关键的一步在这,作者用一个 8B 模型当过滤器,把风格跑偏的样本剔掉,最后只留 12K 条调性统一的高质量数据。这思路特别反直觉,别人都是越多越好,他在做减法。我觉得这个项目最值得琢磨的就是这个点,吃什么长什么样,数据干净,比数据多重要得多。早期评测合作者用 16 条 prompt,单卡 5090 跑 GGUF 量化版,覆盖 Agentic 推理、前端设计、创意 Canvas 三类场景,对比的是 Qwen3.6-27B 原版。但说实话,16 条样本,作者自己都说是 early signal,谁也别当定论。GGUF 仓库已经放出来,量化档位很全,IQ4_XS 是 15.2 G,单张 24G 显卡就能跑,4090、5090、3090 都行。Q2_K 是 10.7 G,16G 显卡能塞但损失不小。直接用 llama.cpp 或者 Ollama 拉起来就行。我的看法是,值得关注,但别神化。它是 preview 版,作者自己都说在探路。但这个思路把 Claude 风格用工程手段迁移到可本地部署的 27B 模型上,加上 Apache-2.0 协议商用友好,给国产开源生态加了一个有 Claude 味儿的选择,这个角度挺难得。手上有 4090、5090 的玩家可以尝个鲜,正式版出来我再拉出来实测一波
00:00 / 02:13
连播
清屏
智能
倍速
点赞
193
剑道尘心
2周前
qwen3.6 35b可以刻蚀到cpu么?之前看到过相关新闻 具体原理不太懂,不记得是刻到cpu还是别的什么东西里面,就是国外团队研究的技术,说是有点是极大降低推理成本,缺点是刻死了某个具体的模型无法更新。reddit上和yt上,很多人说qwen3.5 27b,或者qwen3.6 35b a3b已经可以算作生产力模型了,把这种用这种技术做到我能买得起,我肯定入手一台。有懂行的来说说么? #qwen #本地部署大模型 #生产力工具 #tinyai #本地大模型
00:00 / 01:46
连播
清屏
智能
倍速
点赞
56
Ai剪辑助手
1年前
程序可以识别图片视频了,分享最新视觉理解大模型 分享Qwen2-Vl本地整合包。AI图片、视频理解,图片、视频对比,基于图片、视频的问答、对话、内容创作等方式 我根据开源代码制作了Qwen2-Vl本地整合包 2B 整合包,该整合包修改了装入大图片和视频显存就溢出的bug,优化了部分代码。有需要源代码的朋友请私信:视频识别,无法私信的请留言,我手动发您。 官方项目地址:https://github.com/QwenLM/Qwen2-VL 72B线上体验:https://huggingface.co/spaces/Qwen/Qwen2-VL@DOU+小助手
00:00 / 02:05
连播
清屏
智能
倍速
点赞
55
东日
1年前
qwen3-30b-目前推荐使用的本地大语言模型 可以选择8845hs机器,推理速度最快24tokens/s
00:00 / 07:07
连播
清屏
智能
倍速
点赞
67
九天Hector
1年前
【深度解析】大模型新王Qwen3发布! Qwen-3深度解析!硬件配置、原生MCP功能介绍、模型选择详解!仅需1/3硬件成本,性能超越DeepSeek-R1! #千问3 #通义千问 #大模型 #国产大模型
00:00 / 07:28
连播
清屏
智能
倍速
点赞
246
锋芒AI
1月前
一张 3090 跑出 Claude 味 Qwen 闭源模型拿不到,就先把思路学下来。有人把 Claude Opus 的推理习惯蒸进 Qwen 3.5,一张 3090 就能跑本地高阶推理,社区实测速度 29-35 tok/s,显存大约 16.5 GB。对折腾本地编程助手的人,这个方向很值得看。#Qwen35 #ClaudeOpus #本地AI #AI编程 #推理模型
00:00 / 01:25
连播
清屏
智能
倍速
点赞
27
AI研究社
1年前
通义发布开源 QVQ 多模态推理大模型,刷新视觉推理记录! #AI #阿里云 #通义大模型 #AI大模型 #Qwen
00:00 / 01:39
连播
清屏
智能
倍速
点赞
152
晓辉博士
1年前
6分钟看懂大模型的蒸馏。上次看DeepSeek R1那篇论文,讲到用R1模型基于Llama3和Qwen蒸馏出具备推理能力的模型,我就好奇到底蒸馏是怎么做到的,于是这两天就系统学习了下到底什么是蒸馏 #知识蒸馏 #DeepSeek #幻方量化 #大模型蒸馏 #OpenAI
00:00 / 06:14
连播
清屏
智能
倍速
点赞
3771
AI次元站
10月前
阿里千问 Qwen 3 旗舰版模型宣布更新,最强编程模型开源 #AI #千问 #Qwen3 #Qwen3Coder #阿里
00:00 / 00:43
连播
清屏
智能
倍速
点赞
43
赋范课堂
1年前
从零接入Qwen3,手把手教你代码编写MCP客户端! #人工智能 #ai #Qwen3 #MCP #大模型
00:00 / 14:43
连播
清屏
智能
倍速
点赞
37
AGI_Ananas
1年前
本地vllm部署Qwen3-0.6B CPU部署推理 📘 学术/工程风格 基于本地环境的 Qwen3-0.6B 语言模型部署与测试分析 Qwen3-0.6B 模型在本地的部署方法与运行性能探究#AI #qwen3 #人工智能 #本地部署 #vllm
00:00 / 06:11
连播
清屏
智能
倍速
点赞
16
杨竹筠
1年前
国产开源模型封神时刻 阿里千问三震撼发布 阿里王炸!最新Qwen3大模型,成本仅需DeepSeek-R1的1/3,国内首个“混合推理模型”,性能登顶全球开源模型!超越DeepSeek-R1、OpenAl-o1!成为全球第一! 但Qwen3真正震撼的地方,根本就不在于性能,它最大的奇迹到底是什么呢 #阿里千问3登顶全球最强开源模型 #阿里巴巴 #开源模型
00:00 / 03:08
连播
清屏
智能
倍速
点赞
1386
孙观楠在AI创业
1年前
大模型推理时所需要的GPU显存,需要多少显存?如何计算 一种简单的计算方法#人工智能 #大模型 #gpt4 #qwen #本地部署
00:00 / 07:23
连播
清屏
智能
倍速
点赞
55
清华鑫哥讲AI智能体
1年前
阿里千问大模型qwen3发布超越deepseekr1登顶全球 阿里千万大模型qwen3深夜发布!性能超越deepseekr1模型,登顶全球开源模型第一名,也是国内首个混合推理模型。 #qwen3 #阿里千问 #千问3 #通义千问 #智能体搭建
00:00 / 02:13
连播
清屏
智能
倍速
点赞
136
GG 爆玩 AI
3周前
Qwen3.6_35BClaude4.6蒸馏本地部署 #本地部署大模型#openclaw 本地部署实测,8G部署的35B大模型到底有多大的用处#ai
00:00 / 16:51
连播
清屏
智能
倍速
点赞
18
kate人不错
3月前
实测 Qwen3.5-Plus,性价比极高 千问 3.5 正式发布了,我重点实测了 Qwen3.5-Plus(开源 397B-A17B): - 架构:混合线性注意力 + MoE,基于 Qwen3-Next,推理效率高 - 体验:知识截止更新到 2026 年 - 多模态/OCR:论文图空间理解、反写铅活字、反光复杂大图、模糊小票文字识别 - 推理/指令遵循:40 字严格计数、红包礼仪规则抽象、年夜饭方案、7 语种翻译 - 复杂规则:让它当“产品政策审核员”找冲突、判案例、补边界 - 编程:生成气候数据故事网页、无限循环动画、复古终端文字冒险游戏 时间戳 00:00 Qwen 3.5 发布 01:17 多模态实测 04:37 推理能力实测 07:05 编程实测 #Qwen #Qwen35 #Qwen35Plus #千问 #开源AI
00:00 / 08:59
连播
清屏
智能
倍速
点赞
104
C哥聊科技
8月前
Qwen把AI成本降10倍,推理快10倍 离谱!Qwen团队发布的下一代模型架构 Qwen3-Next,训练成本还不到之前320亿参数模型的十分之一。推理速度直接飙升了10倍以上。#推理 #千问 #ai #大模型
00:00 / 03:44
连播
清屏
智能
倍速
点赞
366
宇图瑞视
5天前
通义千问Qwen3.7有多强?Arena全球第13! 2026年5月19日,阿里千问发布Qwen3.7! Arena全球第13,国产第一 数学推理第7,编程第10 preserve_thinking让Agent不再失忆 编程追平Claude 4.5 Opus 中文编程超越Claude! #人工智能 #AI大模型 #通义千问 #Qwen3 7 #编程
00:00 / 06:03
连播
清屏
智能
倍速
点赞
0
小工蚁
2年前
通义千问Qwen1.5多个LoRA同时部署和推理加速演示 #小工蚁
00:00 / 13:52
连播
清屏
智能
倍速
点赞
402
一把老骨头
1周前
国产龙虾Qwenpaw调用Qwen3.6-27B大模型测试 下一步要测跑任务了!之前llama崩溃......#国产龙虾 #QwenPaw #Qwen36 #大模型 #2080TI魔改
00:00 / 01:35
连播
清屏
智能
倍速
点赞
18
夜蝶
1月前
推理模型时代快结束了 前Qwen负责人离职后首发 林俊旸,前通义千问Qwen负责人,阿里最年轻P10。离职后发6000字长文,判断AI正从推理思考转向智能体思考。Qwen3混合思考的失败经验,DeepSeek和Kimi的不同路线。#AI #推理模型 #Agent #Qwen #DeepSeek
00:00 / 01:08
连播
清屏
智能
倍速
点赞
49
AGI_Ananas
3月前
Qwen3-Max-Thinking编程能力,逻辑推理实测 全网都在说阿里云最新的 Qwen3-Max-Thinking 逻辑无敌。 为了验证它的真实水平,我给 Qwen3-Max、Claude 3.5 Sonnet 和 Gemini 3 Pro 准备了三轮测试: 架构测试:用 Python 手搓一个命令行“操作系统”,看逻辑严密性。 空间测试:用 Ursina 引擎写一个 3D FPS 射击游戏,看空间想象力。 智商测试:高难度逻辑陷阱与蒙特卡洛模拟,看推理深度。 有的模型写出的游戏丝滑流畅,有的模型连“敌人”都刷在墙里... 如果你正在纠结该用哪个 AI 写代码,或者想知道国产大模型的真实水平,这期视频绝对能帮你省下冤枉钱。 第一轮:手搓 Python 操作系统(Claude 秀翻全场?) 第二轮:3D FPS 游戏开发(Qwen 翻车现场/Gemini 表现如何) 第三轮:逻辑陷阱与数学推导(Qwen 的高光时刻!) 总结:工程师选 Claude,科学家选 Qwen? #Qwen3Max #通义千问 #大模型 #AI编程助手推荐 #Gemini
00:00 / 07:46
连播
清屏
智能
倍速
点赞
246
AI 博士嗨嗨
9月前
个人电脑最强AI模型,Qwen3-30B本地部署教程! #qwen3 #本地部署 #Ollama #AI模型 #大模型
00:00 / 12:41
连播
清屏
智能
倍速
点赞
1809
杨大哥
1月前
Qwen3.6-Plus
00:00 / 00:58
连播
清屏
智能
倍速
点赞
543
Knowly
2周前
5090D的24G显卡,实测qwen3.6:27b,推理能力和生成速度都非常的不错,适合各企业低成本试点部署大模型 #AI知识助手 #本地部署大模型模型 #ollama #llamacpp
00:00 / 03:11
连播
清屏
智能
倍速
点赞
78
智慧工具坊
1月前
8G显存也能起飞?llama.cpp+qwen模型深度调优 为什么显存没占满,速度却掉到了脚脖子? 为什么 CPU 线程拉满,性能反而缩水 50%? 本期视频带你实测 RTX 3050 8G 在运行 Qwen 3.5 9B 时的性能极限。 通过《三体》3 万字压力测试,深度拆解上下文长度、KV Cache 量化、Batch Size 以及 CPU 线程对推理速度的真实影响。 【核心调优结论】 8G 显存黄金平衡点:32k 上下文--ctx-size 64k 极限模式:必开缓存量化 --cache-type-k/v q4_0 预处理加速:调大吞吐量 --batch-size 远比增加 CPU 线程有效。#模型调优 #本地部署ai 【我的配置】显卡: 3050 8G | 内存: 32G DDR4 | CPU: i3-12100
00:00 / 06:03
连播
清屏
智能
倍速
点赞
111
码哥AI科普
1年前
重磅新闻:阿里Qwen团队正式发布他们最新的研究成果-#QwQ -32B大语言模型#阿里 #AI #重磅新闻
00:00 / 01:11
连播
清屏
智能
倍速
点赞
138
小工蚁
1年前
Qwen2-72B大模型推理性能对比 4张RTX4090对比2张L20
00:00 / 02:27
连播
清屏
智能
倍速
点赞
70
小工蚁
7月前
Qwen3-Next模型推理实践 MTP会提高推理性能吗? #小工蚁 #通义千问 #大模型推理
00:00 / 04:18
连播
清屏
智能
倍速
点赞
35
简介:
您在查找“
qwenpaw关闭显示推理过程
”短视频信息吗?
帮您找到更多更精彩的短视频内容!
最新发布时间:2026-05-25 06:50
最新推荐:
咋不多亲一会
森画shashin怎么评论白鹿的事
欧姆龙7117血压计准吗
银魂将军名场面
他不适合谈恋爱
飞书多维表格怎么表示非空值
5月23号和12生肖有什么关系
上海地铁10号线晚点
猫咪体长算头吗
未闻花名适合的白色裙
相关推荐:
小号没金币怎么办暗黑4
常州水母山门票
既然他嘴巴如此不好听挠痒痒
不好意思stop
g社拍田栩宁拍了多少
和死对头在一起了怎么办ai剧
有人懂《我只在乎你吗》[流泪]
湖中豪华别墅是谁的
唐僧的原型是玄奘还是鉴真
飞鸟藏爱弟弟为什么娶弟媳
热门推荐:
AI我最像哪个
康康去伦敦的那个用剪映怎么
豆包没登录之前的的记录怎么同步
盼之光换绑失败怎么办
三角洲健康分怎么恢复
番茄没验证前能看到书吗
codex允许提示怎么开启
最新版的电脑端yy好友列表在哪
悟空浏览器查历史无记录。怎么恢复?
bambu上面发模型有收益吗