80b模型需要多少显存 - 抖音

您是不是在找：

卡卡同学（三角洲行动）3周前

三角洲画质模型关于三角洲画质模型到底如何选择#三角洲行动 #三角洲画面设置 #电脑小技巧 #三角洲模型

00:00 / 00:46

连播

清屏

智能

倍速

点赞1778

翼王5月前

90G超大显存轻薄本挑战70B大模型！英特尔新驱动增加了一个可以灵活调节共享显存的功能，轻松调出大显存，再搭配支持更换内存条的联想小新Pro 14 2025，最高90G显存有点夸张。 #AI #轻薄本 #intel #deepseek #联想小新

00:00 / 08:23

连播

清屏

智能

倍速

点赞696

鸦无量7月前

2025年AI本地部署性价比之王！双卡V100！ 32G大显存，deepseek-r1:32b、qwen3:32b等模型随便跑。比同价位2080Ti 22G算力更高、显存更大！安装有些麻烦，但是值得！#ai本地部署 #v100显卡 #显卡坞 #deepseek #qwen

00:00 / 05:20

连播

清屏

智能

倍速

点赞2047

【教程👀简阶】爱学大模型的疯哥5月前

DeepSeek+LoRA：训练专属领域大模型！环境配置+模型微调+模型部署+效果展示详细教程！草履虫都能学会~大模型|LLM #大模型 #模型微调 #DeepSeek #AI #人工智能

00:00 / 28:00

连播

清屏

智能

倍速

点赞1868

有趣的80后程序员5月前

800亿参数的模型，真的抗打吗？hunyuan 3.0 评测 🔥一个参数高达80B、号称“戏出名门”的AI绘画模型，实际表现究竟如何？我怀着敬畏之心，精心设计了22个涵盖不同风格和复杂度的提示词，将新鲜出炉的腾讯混元Hunyuan Image 3.0 与大家熟知的开源强者通义千问Qwen Image 进行了一场全方位的横向评测。从复杂的构图到精细的材质，从文字渲染到逻辑推理，结果真的让我大跌眼镜。本期视频，我们将一起见证这场精彩的对决，看看被寄予厚望的Hunyuan Image 3.0 是否真的名副其实。 #waytoagi #runninghub#ai新星计划 #comfyUI#hunyuanimage

00:00 / 11:27

连播

清屏

智能

倍速

点赞103

文哲聊AI1年前

大模型推理时所需要的GPU显存需要多少显存？如何计算？一种简单的计算方法 #人工智能 #openai #大模型 #gpt4 #GPU

00:00 / 06:03

连播

清屏

智能

倍速

点赞1989

GPU老李10月前

一个视频带你了解H100、H200、H800、H20 之间的关系#英伟达H200 #H20#H100H800#GPU

00:00 / 01:55

连播

清屏

智能

倍速

点赞2527

数萌AI服务器6月前

8卡32G v100 4029超微服务器跑openai gpt oss 120b模型速度达到35token每秒至少需要80G 显存

00:00 / 03:10

连播

清屏

智能

倍速

点赞86

Et-beta1周前

八台Spark组集群 1TB显存跑满血大模型博主搞了个大工程——把八台 NVIDIA DJX Spark（每台128GB内存）用高速网络组成集群，总共凑出了1TB的显存 🔥 过程中踩了不少坑：买错了QSFP线缆型号、交换机端口被硬编码为50G、还得花1300美元买MicroTik交换机……好在有Claude AI当远程运维助手，SSH登录交换机帮忙排查问题 🤖 最终实现了100Gbps的RoCE连接，延迟仅3微秒！测试结果：小模型（Qwen3 4B）集群加速不明显，但大模型表现亮眼——Qwen3 VL 32B从单节点3.58 tok/s飙到四节点11.36 tok/s，扩展性近乎线性 📈 最炸裂的是成功在八节点上运行了800GB的Qwen 3.5（3970亿参数）和600GB的Kimi K2，分别达到24和13.35 tok/s。博主感叹这是拍过最贵的视频 💸 来自：Alex Ziskind #DJXSpark #AI集群 #大模型推理 #Qwen35 #用一篇长文记录我的春节

00:00 / 22:49

连播

清屏

智能

倍速

点赞715

AI踩坑指南3周前

LM Studio最新更新0.4版，8G显存也能爽玩大模型！ LM Studio最近更了0.4版。这个版本更新了很多新功能。其中MoE专家内存卸载也做了一定程度的改动。现在你可以用8G显卡流畅推理80B的大模型了。跟着我教你如何操作。 #ai大模型 #ai大模型应用 #lmstudio #ai本地部署 #ai本地部署教程

00:00 / 04:57

连播

清屏

智能

倍速

点赞642

IT绿灯侠11月前

一百万价格就能平替H20一体机？24卡集群671B模型部署 #L20 #DeepSeek #英伟达 #数码科技 #热门 @DOU+小助手

00:00 / 04:27

连播

清屏

智能

倍速

点赞1446

捷易科技GPU算力服务1月前

L40s 大显存！AI 推理速度直接拉满 #转场 #L40s #A6000 #PRO6000

00:00 / 00:31

连播

清屏

智能

倍速

点赞2

热AI之路7月前

想要部署大模型？最低配置要求必须要记下来。 #本地大模型 #离线大模型 #大模型 #deepseek #部署大模型

00:00 / 01:36

连播

清屏

智能

倍速

点赞80

IT绿灯侠9月前

8卡狂飙，科研团队豪掷32万升级，8K渲染、文生视频全碾压 #DeepSeek #5880 #AI #显卡 #数码科技 @DOU+小助手

00:00 / 01:03

连播

清屏

智能

倍速

点赞249

博弈6天前

测试千问新模型，Qwen3.5-122B-A10B，使用4卡22G单卡的2080ti即可运行Qwen3.5-122B-A10B-Q4_K_M.gguf 量化版，上下文设置为256K ，每卡占用约21G显存，模型大小为70G，总显存占用约为83G左右，在0上下文的情况下，首句话速度为34token/s，使用opencode在vscode进行编程测试，首上下文约1.2K，首句话速度为32token/s，当上下文为2万时，速度为32token/s，当上下文为5万时，速度为21token/s 运行命令：CUDA_VISIBLE_DEVICES=0,1,2,3 ~/llama.cpp/build/bin/llama-server --port 8000 --host 0.0.0.0 --n-gpu-layers -1 --parallel 1 --ctx-size 262144 --flash-attn on --batch-size 4096 --ubatch-size 2048 --cont-batching --no-mmap --mlock --split-mode layer --cache-type-k q8_0 --cache-type-v q8_0 --temp 0.6 --top-p 0.95 --top-k 20 -m /home/boyiu/models/GGUF/Qwen3.5/Q4_K_M/Qwen3.5-122B-A10B-Q4_K_M.gguf --jinja --chat-template-file /home/boyiu/models/jinja/Qwen3.5-Qwen3.5-122B-A10B-Q5_K_M/chat_template.jinja 由于GGUF量化版在llama.cpp运行时，会出现"System message must be at the beginning"（系统消息必须在开头）的错误问题，需要下载原.jinja发送给大模型，修改为，模板允许系统消息不在开头，单独使用--jinja即可正常回复编码能力弱于minimax2.5的IQ3_XXS量化版，但是指令遵循能力比较强，但是由于太强，会重复遵循指令，修改代码的逻辑跟不上，主力编码模型还得是minimax，下视频测Qwen3.5-35B-A3B#大模型 #量化

00:00 / 00:29

连播

清屏

智能

倍速

点赞151

IT绿灯侠1年前

4卡A6000,192GB显存能否喂饱70B模型？ #DeepSeek #DS #70B #A6000 #AI@DOU+小助手

00:00 / 00:36

连播

清屏

智能

倍速

点赞1833

林亦LYi7月前

AMD+128GB统一内存=YES！大显存，大有可为！ #AMD #大模型 #统一内存 #AI#AI新星计划

00:00 / 12:08

连播

清屏

智能

倍速

点赞7829

共享电脑-B工7月前

机械设计显卡这么选！少走弯路！#机械设计 #显卡 #Solidworks #电脑

00:00 / 00:32

连播

清屏

智能

倍速

点赞14

贰零壹组装服务器1年前

测试deepseek 70b模型部署模型推理显存相当重要 70b至少要48G显存，用CPU和内存的话速度会很慢，所以配置两块4090涡轮卡！！#deepseek #70b #服务器 #语言大模型

00:00 / 01:37

连播

清屏

智能

倍速

点赞984

SEAN-X7月前

个人量化选这种显卡性价比直接拉满 #量化交易 #显卡 #性价比 #装机 #金融

00:00 / 00:45

连播

清屏

智能

倍速

点赞263

硬件世界2周前

全新国产GPU首次公开 80GB显存、单卡算力1千万亿次#国产GPU #摩尔线程

00:00 / 00:18

连播

清屏

智能

倍速

点赞588

七哥不水论文「CCF 版」2月前

模型训练总是不收敛？😭 显存不够导致实验跑不通？📉 很多时候不是你模型写错了，是你“超参数”没调对！参数（Weights）是机器学的，超参数（Hyperparameters）是你定的。 👉 大佬用80G卡跑的参数，你直接拿来用在24G卡上，肯定会崩啊！今天教你3招“穷人调参法”，学会了，烂显卡也能跑出SOTA结果！🚀 👇 具体的调参手册在后面 #深度学习 #调参 #炼丹 #神经网络 #代码复现

00:00 / 01:31

连播

清屏

智能

倍速

点赞1103

小羊聊供应9月前

AMD线程撕裂者+24GB显存！地质建模、遥感分析快人一步 #GIS #地质勘探 #amd线程撕裂者 #4090 #数码科技 @DOU+小助手

00:00 / 01:14

连播

清屏

智能

倍速

点赞68

内衣云讲堂1年前

75C和80B一样大？听我说完你就懂了 #初来乍到请多关照 #知识 #女性健康 #内衣 #唯爱与生命不可辜负

00:00 / 01:51

连播

清屏

智能

倍速

点赞153

AI大模型学习3周前

大模型微调如何估算显存？ #人工智能 #AI #AI大模型 #大模型 #大模型即将改变世界

00:00 / 03:45

连播

清屏

智能

倍速

点赞943

服务骑士7月前

还在为AI算力烧钱发愁？3张4090涡轮显卡=144GB显存！低成本碾压A100方案揭秘#抖音小助手 #显卡 #4090 #机器狗

00:00 / 00:58

连播

清屏

智能

倍速

点赞21

AI算力租赁9月前

H100凭什么值24万？#算力租赁 #算力资源 #出租 #4090 #H100

00:00 / 00:48

连播

清屏

智能

倍速

点赞50

AI算力租赁7月前

裸金属租赁云平台专业团队一手资源#算力租赁 #算力资源 #deepseek #H100 #H200

00:00 / 00:41

连播

清屏

智能

倍速

点赞2

小羊聊供应11月前

30万开箱实录。深度学习神机究竟有那些配置？ #AI推理 #教育科研 #开箱测评 #L20 #深度学习 @DOU+小助手

00:00 / 01:10

连播

清屏

智能

倍速

点赞90

博弈1周前

使用6张2080ti显卡，每卡22G显存，使用llama.cpp运行MiniMax-M2.5-UD-IQ3_XXS.gguf量化版大模型，大模型为87G大小，130K上下文占用每卡约19G显存，通过vscode远程ssh代码服务器上的opencode进行程序编写时，使用命令CUDA_VISIBLE_DEVICES=0,1,2,3,4,5 CUDA_SCALE_LAUNCH_QUEUES=8x ~/llama.cpp/build/bin/llama-server --port 8000 --host 0.0.0.0 --n-gpu-layers -1 --parallel 1 --ctx-size 130000 --flash-attn on --batch-size 2048 --ubatch-size 512 --cont-batching --no-mmap --mlock --split-mode layer --cache-type-k q8_0 --cache-type-v q8_0 --temp 1.0 --top-p 0.95 --top-k 40 --jinja --chat-template-file /home/boyiu/models/GGUF/MiniMax-M2.5-GGUF/UD-IQ3_XXS/chat_template.jinja -m /home/boyiu/models/GGUF/MiniMax-M2.5-GGUF/UD-IQ3_XXS/MiniMax-M2.5-UD-IQ3_XXS.gguf，最大化发挥显卡性能，大模型智商最高，极致压榨显卡性能，在0上下文的情况下，首句话速度可达43token/s，首次上下文占用约为13K，首句回复速度为27token/s，当上下文占用为20K时，速度降为22token/s，当上下文占用50%左右时，速度降为11token/s，速度比minimax2.1略有提升，可增加更多上下文，但会牺牲token速度，财经资讯分析程序已建立基础功能，可实时获取最新资讯，并进行api调用分析，从获取最新资讯，到分析结果不到3分钟，完全适用现有策略，后面将增加新闻源获取途径，增加个股独立新闻分析功能#大模型 #量化

00:00 / 00:29

连播

清屏

智能

倍速

点赞553

李维孝AI7月前

大模型训练和推理的显存需求 #人工智能 #知识分享

00:00 / 03:15

连播

清屏

智能

倍速

点赞10

小深ai硬件分享8月前

这个算力租赁平台卡多价格便宜到离谱？#深度学习#深度学习服务器#算力租赁深脑云平台官网:dbcloud.pro/ 邀请码:aQWOnSzL 通过邀请码注册可得50算力可免费开2天4090

00:00 / 03:02

连播

清屏

智能

倍速

点赞76

狗提督小车车1周前

sd lora模型更新之后，12G显存显卡比较顺畅。入门卡里面2060 3060 6700xt都可以，图便宜整个p104学习的话够用了，干活的话直接90hx，性能相当于3080，游戏不怎么行#AI绘图#电脑推荐#显卡推荐#lora

00:00 / 01:15

连播

清屏

智能

倍速

点赞16

算力出租（AI）9月前

用八卡的AI训练服务器还能省点？#AI大模型 #算力 #超算 #GPU #CPU

00:00 / 00:43

连播

清屏

智能

倍速

点赞18

鹏迈组装服务器1年前

感谢粉丝信任，大模型数据分析服务器，显卡ADA6000 48G计算卡 128G运行内存超微H12单路主板#模型训练#专业卡#Ada架构#丽台

00:00 / 01:27

连播

清屏

智能

倍速

点赞13

算力出租（AI）2月前

英伟达B200到底有多强#算力 #英伟达 #B200 #算力租赁

00:00 / 00:28

连播

清屏

智能

倍速

点赞39

算力租赁一站式服务1周前

显存不够大模型根本跑不起来#算力 #显卡 #算力租赁 #算力租赁资源成抢手香饽饽

00:00 / 00:31

连播

清屏

智能

倍速

点赞28

AI智选汇（戴普）1年前

零下20摄氏度也能运行？太牛了吧！！ #戴尔 #deepseek #70b最佳方案 #开源大模型

00:00 / 02:10

连播

清屏

智能

倍速

点赞44

AI技能研究社3周前

GLM-OCR 0.9B本地部署实战智谱AI新开源的0.9B模型专门针对OCR优化，2G显存老显卡也能跑。本期手把手教你在本地部署：从环境配置到避开随机采样、分辨率和显存管理的三大深坑。重点演示如何精准还原Markdown表格与双栏排版，彻底告别乱码。#GLMOCR09B #Python #本地部署 #OCR识别 #大模型

00:00 / 05:00

连播

清屏

智能

倍速

点赞2424

彭涛AI11月前

企业本地部署 DeepSeek 需要多少钱？#deepseek本地 #deepseek部署

00:00 / 00:55

连播

清屏

智能

倍速

点赞106

AI踩坑指南3周前

QWEN3 CODER NEXT 80B发布！速评+尝鲜！千问刚刚发布了旗下最新的QWEN3 coder next 80B A3B模型。其官方测试里verified SWE bench测试达到了70.6%。GLM4.7 flash最强本地ai代码模型的王座还没捂热这就要易主了吗？让我们尝鲜实测一下。 #ai代码 #qwen3 #glm #大语言模型

00:00 / 02:27

连播

清屏

智能

倍速

点赞30

爱科技的小羽1年前

爆显存？12G显卡驯服8B模型！deepseek-R1 #deepseek #人工智能 #模型微调 #deepseek电脑版 #人工智能 🔥 左边微调前 VS 右边微调后！ 🔥 三行代码安装+三步参数修改 🔥 点击运行键看进度条狂飙！关注后私信“微调”自动发送完整代码

00:00 / 05:43

连播

清屏

智能

倍速

点赞33

建筑师小翔3周前

4台Mac Mini变身AI服务器？揭秘Exo“显存融合”黑 Mac Mini还能这么玩？国外大神用Exo Labs技术，把4台电脑“物理合体”，显存直接叠加到64G！轻松运行70B大模型。这就是“算力平权”！别再花冤枉钱买专业显卡了，家里的闲置设备都能组集群。这思路太野了！🖥️🔗 #MacMini #AI大模型 #黑科技 #ExoLabs #数码科普

00:00 / 00:51

连播

清屏

智能

倍速

点赞1433

AI那些事儿（籽料请官~）1月前

首个音画同步视频模型开源啦！8G显存就能流畅生成视频~ LTX-2 GGUF量化版，全套模型、Lora和工作流！无偿分享！ #AI #AI视频 #人工智能 #AI漫剧 #模型

00:00 / 01:04

连播

清屏

智能

倍速

点赞133

pay峰1年前

AI 395迷你主机，96G显存，4060级核显，部署70B 不是很深入的测评，因为工程机+测试处理器，bug有点多，优化有点差。比如满负载会140w和10w来回跳，性能大大折扣。反正70G的模型可以跑不报错，128G内存也是显存，大模型都能容纳。16c32t的zen5 5.1Ghz很强。40cu的8060S核显能跑到4060水平，不过可能ES处理器，并不能跑到官方2900Mhz。总之工程机先给大家前瞻一下，等大UP的正式版更详细深入的测评~#六联minipc #AMD #AI生产力 #主机推荐 #生产力搭子

00:00 / 05:44

连播

清屏

智能

倍速

点赞430

小灰兔1年前

实际测试，游戏本使用的最佳deepseek参数是8b，速度快，GPU使用率最高。次之14b，速度稍微慢一点点。 70b卡顿，需要30G以上内存再大的模型，内存100以上，预估慢的离谱。

00:00 / 04:58

连播

清屏

智能

倍速

点赞15

任无君NoKings3月前

【拼好卡】我终于用12张渣显卡运行80GB的千问3大语言模型 #AI #人工智能 #大语言模型 #千问 #英伟达显卡

00:00 / 02:51

连播

清屏

智能

倍速

点赞10

虽然但是张黑黑2周前

仅售30万的AI集群！4台M3 Ultra，挑战万亿参数模型这是一套你可以带到世界任何角落的，个人AI算力中心。它的内核，是四台拥有512G统一内存的Mac Studio。这意味着什么？意味着你拥有了2TB的显存池，意味着你可以同时在本地，流畅运行满血版的DeepSeek v3.1和1万亿参数的Kimi 2.5。这一期，我手把手教你如何把多台Mac“合体”成一台超级计算机。 #mac #苹果 #macbookpro #人工智能 #硬核玩家计划

00:00 / 11:24

连播

清屏

智能

倍速

点赞2668

东京老桂1周前

我们买的AI神器到了，轻巧使用，就是价格有点小贵，速度是杠杠的！#AI #英伟达 #AI硬件

00:00 / 02:30

连播

清屏

智能

倍速

点赞252

一站式服务算力裸金属5天前

30B 以上模型并发？A100 显存更有优势 #算力 #算力租赁 #GPU #英伟达

00:00 / 00:31

连播

清屏

智能

倍速

点赞14

AI赚钱研究社6天前

Qwen 3.5中杯发布：本地部署教程深度解析 Qwen 3.5 各版本差异，分享 35B-A3B 本地部署避坑参数与显存优化技巧。#Qwen35 #大模型 #vllm #SGLang #本地部署

00:00 / 05:26

连播

清屏

智能

倍速

点赞268

一站式服务算力裸金属1周前

30B 以上模型并发？A100 显存更有优势 #算力 #算力租赁 #GPU #英伟达

00:00 / 00:31

连播

清屏

智能

倍速

点赞33

小牛聊AI1周前

国产GPU单卡算力破千TFLOPS，训练性能提升30% 实测对标H100，万卡集群已落地摩尔线程旗舰GPU MTT S5000参数首曝光，单卡AI算力高达1000TFLOPS，配备80GB显存。实测性能对标英伟达H100，训练性能提升30%，万卡集群浮点运算能力达10EFLOPS。支持FP8全精度计算，刷新国产GPU推理纪录，科学计算性能完胜H100。 #AI芯片 #GPU #算力革命 #科技突破 #大模型训练

00:00 / 00:10

连播

清屏

智能

倍速

点赞22

广州三欣#电脑#GPU算力卡#服务器2年前

NVIDIA H100 ，是一款强大的GPU，拥有80GB显存，2TB/sGPU 显存带宽，在每个工作负载中实现出色性能、可扩展性和安全性。可连接多达 8个 H100 来加速百亿级工作量。相比上一代产品，H100 的超大模型的 AI 推理性能提升高达 30 倍，从而提供业界领先的对话式 AI。随着现在Ai技术的发展，H100 成为 NVIDIA 率先推出的计算功能的加速器。#h100gpu #源头实力厂家 #nvidia #丽台 #a100显卡 @DOU+上热门 @DOU+好生意 @DOU+小助手

00:00 / 00:30

连播

清屏

智能

倍速

点赞47

aiaihaozhe95271周前

8G显存#ai本地部署 #大语言模型

00:00 / 00:31

连播

清屏

智能

倍速

点赞7

嘉荣聊算力5月前

捷智算H100裸金属租赁，80GB HBM3显存，大模型训练如飞，1小时起租，灵活租期，算力怪兽级体验！

00:00 / 00:34

连播

清屏

智能

倍速

点赞0

算泥5月前

#阿里开源Qwen3-Next！800亿参数，干活只花3亿的脑细胞 ☀️阿里通义团队开源新一代基础模型 Qwen3-Next，其 800 亿总参数模型仅激活 30 亿参数，性能却对标 2350 亿参数旗舰版，部分测试中还超越谷歌 Gemini-2.5-Flash-Thinking。 💡该模型靠混合注意力机制、高稀疏 MoE 结构等四大技术，实现训练成本较 Qwen3-32B 降超 90%，长文本推理吞吐量提 10 倍以上，原生支持 262K 上下文，还可扩展至 101 万 token。目前 Hugging Face 上通义千问衍生模型超 17 万个，Qwen3-Next 也快速跻身趋势榜前十。#强烈推荐 #干货分享 #人工智能 #开源大模型

00:00 / 01:23

连播

清屏

智能

倍速

点赞44

易加服务器11月前

DeepSeek70b大模型本地部署服务器配置！两张原版4090D涡轮显卡，共48G显存，INTEL至强服务器平台，4U机架式可支持4张GPU显卡。 #deepseek70b性能测试 #deepseek #大模型测试 #LLAMA3

00:00 / 01:30

连播

清屏

智能

倍速

点赞60

AI技能研究社3周前

Qwen 32B int4量化 vs 8B全精度显存卡死在16G时，大模型部署面临终极二选一：是选“脑子好但视力差”的32B Int4量化版，还是“视力好但脑容量小”的8B全精度版？本视频深度解析参数量与精度的博弈，揭示为何“聪明的模糊”远胜“愚蠢的清晰”。#Qwen32B #LLM #大模型量化 #显卡显存 #本地部署

00:00 / 05:02

连播

清屏

智能

倍速

点赞29

聊与AI服务器6月前

显卡插槽不够怎么办？低成本扩展方案值得一试！本地大模型实测现在有一些价格非常低的计算卡，用来跑跑大模型非常合适。比如英伟达的V100，AMD的MI50。要是能插上个4张或者8张这类的显卡，性能也是非常不错的。但是问题来了，像是普通主板，有两个pcie x16的插槽就不错了，根本插不下4张显卡。那么有没有办法扩展显卡插槽的数量呢？这样就可以把旧的设备利用起来了。。。 #大模型 #本地大模型 #显卡 #AI #硬件

00:00 / 03:28

连播

清屏

智能

倍速

点赞131

算力裸金属一站式服务2周前

微调大模型到底要多少钱？ #微调大模型到底要多少钱？ #算力 #算力租赁

00:00 / 00:29

连播

清屏

智能

倍速

点赞6

简介:

您在查找“80b模型需要多少显存”短视频信息吗？帮您找到更多更精彩的短视频内容！最新发布时间：2026-02-27 07:38

最新推荐:

相关推荐:

热门推荐: