Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko; compatible; ClaudeBot/1.0; +claudebot@anthropic.com)
精选
推荐
搜索
探索
直播
放映厅
短剧
小游戏
搜索
您是不是在找:
逃出惊魂夜转圈剪辑教程
obs后续使用教程
金舟文本编辑器怎么删除广告
搜索什么才会有AI回答我
你的眼眸才是真迹p图教程
窄脸特效在哪找
水豚噜噜动态壁纸怎么把时间放到后面
雨霖铃迅雷怎么玩
手机绑定喜马拉雅怎么取消
obs卸载了三角洲还是二百伤害踢
AI踩坑指南
3月前
LM Studio最新更新0.4版,8G显存也能爽玩大模型! LM Studio最近更了0.4版。这个版本更新了很多新功能。其中MoE专家内存卸载也做了一定程度的改动。现在你可以用8G显卡流畅推理80B的大模型了。跟着我教你如何操作。 #ai大模型 #ai大模型应用 #lmstudio #ai本地部署 #ai本地部署教程
00:00 / 04:57
连播
清屏
智能
倍速
点赞
1812
AI大模型学习
8月前
混合专家模型(MoE) | 12分钟搞定混合专家模型MoE #人工智能 #大模型 #AI大模型 #大模型学习 #混合专家模型
00:00 / 12:22
连播
清屏
智能
倍速
点赞
1257
芝麻资源
9月前
GeekUninstaller|零残留卸载专家,纯净无广告,免费带走,永久使用! #电脑知识 #电脑小技巧 #卸载 #卸载软件 #流氓软件
00:00 / 01:01
连播
清屏
智能
倍速
点赞
935
AI大模型学习
1月前
从数学底层到MoE混合专家模型革新,12分钟给你讲明白! #人工智能 #大模型 #AI大模型 #MoE #混合专家模型
00:00 / 12:24
连播
清屏
智能
倍速
点赞
548
薛什么
5月前
大白话讲明白MoE混合专家模型 #MoE #混合专家模型 #知识前沿派对 #ai新星计划 #抖音年终知识大赏
00:00 / 05:01
连播
清屏
智能
倍速
点赞
1790
AI大模型学习
7月前
MoE混合专家模型 | 挑战24分钟搞定,MoE架构深度拆解 #人工智能 #大模型 #AI大模型 #LLM #MoE
00:00 / 24:30
连播
清屏
智能
倍速
点赞
557
玄感X
11月前
MoE大模型到底是什么? #ai新星计划 #人工智能 #MoE #大模型 #混合专家模型
00:00 / 03:26
连播
清屏
智能
倍速
点赞
3461
阡陌交通_
3月前
原来混合专家模型 MoE 就是安排个接待员在前台,专事专办! #手撕AI大模型
00:00 / 06:08
连播
清屏
智能
倍速
点赞
1316
小工蚁
2年前
微软开源DeepSpeed-MoE训练更大更复杂混合专家模型 #小工蚁 #deepspeed
00:00 / 10:29
连播
清屏
智能
倍速
点赞
388
小黑黑讲AI
1年前
从零学DeepSeekV3大模型源代码,MoE专家混合模型 #deepseek #transformer #深度学习 #大模型 #神经网络
00:00 / 09:22
连播
清屏
智能
倍速
点赞
1410
小工蚁
2年前
GPT-4模型架构泄露:1.8万亿参数混合专家模型 (MoE) 揭秘 #小工蚁 #gpt4
00:00 / 07:52
连播
清屏
智能
倍速
点赞
1267
蒋蒋aha
5天前
MOE混合专家-rust实现-part01 rust手搓MOE混合专家模型结构的第一部分 #MOE #AI #rust
00:00 / 08:05
连播
清屏
智能
倍速
点赞
25
安先生
1月前
大模型面试经验与技术栈分享(7) —— MoE(专家混合模型) #大模型 #面试经验 #MoE #秋招 #互联网
00:00 / 07:52
连播
清屏
智能
倍速
点赞
61
栖栖学AI
6月前
20分钟带你解析MOE混合专家模型! MOE架构深度拆解,全程干货!大模型|LLM #大模型 #AI #人工智能 #计算机 #科技
00:00 / 25:07
连播
清屏
智能
倍速
点赞
61
倾听·智慧™
1年前
DeepSeek专家混合架构(MoE) 和chatGPT自然语言处理架构(NLP)对比#chatgpt #deepseek
00:00 / 27:55
连播
清屏
智能
倍速
点赞
47
逆转的王牌
1周前
国产开源模型与美国闭源模型的主要差距就是参数量和架构(MOE混合专家模型和dense模型),归根结底是缺卡。 国产模型中,Deepseek V4在编程方面略差于GLM5.1,主要是受到FP4和BF16的精度差距导致信息量上限不同,以及FP4的训练难度更大。 #Deepseek #AI #Claude
00:00 / 01:57
连播
清屏
智能
倍速
点赞
1372
YSK
4天前
零基础看懂稠密大模型 VS MoE 混合专家模型 三分钟通俗拆解大模型两大核心架构,通俗易懂讲清稠密模型全员算力全开、推理稳但成本高,MoE混合专家模型按需调度专家模块、高效省钱速度快,盘点市面主流AI所属架构,教你根据使用场景精准选型,看懂AI算力进化逻辑,轻松玩转各类智能大模型。 #大模型科普 #AI 干货 #MoE 混合专家模型 #稠密大模型
00:00 / 03:12
连播
清屏
智能
倍速
点赞
11
产品经理PMGao
1年前
AI产品经理必知:混合专家模型(MoE)是什么 #产品经理 #AI产品经理 #AIGC产品经理 #大模型 #机器学习
00:00 / 08:42
连播
清屏
智能
倍速
点赞
692
AI大表哥
10月前
什么是混合专家模型(MoE) #大模型 #AI #DeepSeek #人工智能
00:00 / 06:59
连播
清屏
智能
倍速
点赞
273
数影科技(无限进步)
10月前
华为开源盘古专家模型被质疑抄袭阿里云通义千问 Qwen-2.5 14B 模型。华为诺亚方舟实验室今日发布最新声明,表示盘古 Pro MoE 开源模型是基于昇腾硬件平台开发、训练的基础大模型,并非基于其他厂商模型增量训练而来。盘古团队表示,“盘古 Pro MoE 开源模型部分基础组件的代码实现参考了业界开源实践,涉及其他开源大模型的部分开源代码。我们严格遵循开源许可证的要求,在开源代码文件中清晰标注开源代码的版权声明,所以那些黑子别造谣了!#华为
00:00 / 00:34
连播
清屏
智能
倍速
点赞
61
阡陌交通_
2月前
代码实战:原来混合专家架构MoE就是反垄断和路由加权 #手搓AI大模型 #手撕AI大模型 #python
00:00 / 09:06
连播
清屏
智能
倍速
点赞
552
蒋蒋aha
3天前
MOE混合专家-rust实现-04 rust手搓MOE混合专家模型结构的第四部分 #MOE #AI #rust
00:00 / 06:55
连播
清屏
智能
倍速
点赞
6
蒋蒋aha
4天前
MOE混合专家-rust实现-03 rust手搓MOE混合专家模型结构的第三部分 #MOE #AI #rust
00:00 / 08:37
连播
清屏
智能
倍速
点赞
32
蒋蒋aha
6天前
MOE混合专家模型-01介绍 介绍MOE概念及结构 #AI #MOE
00:00 / 07:11
连播
清屏
智能
倍速
点赞
18
蒋蒋aha
3天前
MOE混合专家-rust实现-05 rust手搓MOE混合专家模型结构的第五部分 #MOE #AI #rust
00:00 / 22:32
连播
清屏
智能
倍速
点赞
9
大模型学习
6天前
DeepSeek的MoE架构和专家崩溃问题 #DeepSeek的MoE架构 #专家崩溃
00:00 / 01:11
连播
清屏
智能
倍速
点赞
1
瑞克老张有话说
1年前
#华为 #科大讯飞 #deepseek #大模型 讯飞和华为联手干翻了行业天花板!国产算力竟然实现了MoE模型大规模跨节点专家并行集群推理,这可是基于国产算力的解决方案。这波操作直接让国产算力实现75%效率提升,专家计算密度翻4倍!更牛的是,他们把DeepSeek V3和R1都搬上了国产平台,训练时推理效率还能再涨200%。想弄明白他们在做什么?评论区橱窗里置顶的课程,可以帮到你。
00:00 / 02:33
连播
清屏
智能
倍速
点赞
2500
Agent创世纪
1月前
RFMoE:专家自主激活新范式 传统 MoE 架构依赖中心化路由器、Softmax 和 TopK 机制,导致训练不稳定、参数容量受限及专家间的“零和博弈”困境。本视频深度解析 Routing-Free MoE(RFMoE)架构,该方案彻底移除中央路由器,通过在专家内部封装激活功能,使其基于内部置信度得分和 ReLU 函数实现自主激活。研究引入了统一自适应负载均衡框架,利用滑动参数动态平衡令牌端与专家端的资源分配。实验证明,RFMoE 在 9 大下游任务中显著提升了平均准确率,并有效增强了训练稳定性与推理吞吐量,为大规模模型去中心化扩展提供了新路径。#人工智能 #机器学习 #AIforScience #科学发现 #科研解读
00:00 / 08:16
连播
清屏
智能
倍速
点赞
50
卢菁老师讲AI
11月前
大模型 混合专家模型 MOE架构详解! #人工智能 #人工智能入门 #大模型入门 #混合专家模型
00:00 / 21:08
连播
清屏
智能
倍速
点赞
100
鹏宇AI大模型
3月前
为什么现在主流的前沿模型都要用MoE混合专家模型? MoE 混合专家模型架构详解 #大模型 #ai大模型 #MoE #混合专家模型 #大模型学习
00:00 / 04:19
连播
清屏
智能
倍速
点赞
431
羊上上
5月前
A领域中的(MoE)混合专家模型是什么 #ai #人工智能 #ai人工智能 #混合专家模型 #大模型
00:00 / 01:50
连播
清屏
智能
倍速
点赞
269
ai大模型见见
2月前
13分钟彻底搞懂MoE混合专家模型架构详解 #人工智能 #大模型 #AI大模型 #MoE #混合专家模型
00:00 / 13:26
连播
清屏
智能
倍速
点赞
149
鹏宇AI大模型
1月前
面试官问:Transformer和MoE混合专家模型各有何优劣? #大模型 #ai大模型 #Transformer #MoE #大模型面试
00:00 / 04:59
连播
清屏
智能
倍速
点赞
107
小元老师
6月前
挑战9分钟搞定,MoE混合专家模型架构之GIAM模型 #人工智能 #大模型 #AI大模型 #MoE #LLM
00:00 / 09:42
连播
清屏
智能
倍速
点赞
62
林夕 AIGC
2天前
MoE 大模型也开始“省算力”了。 这篇 HuggingFace Daily Papers 里的论文,提出了一种训练后自蒸馏方法。 它不需要从头重新训练,而是把已经训练好的静态 MoE 模型,改造成更高效的动态推理模型。 最关键的是:它可以让模型在推理时跳过超过一半的专家计算,同时只带来很小的准确率损失。 这件事很有意义。 因为 MoE 模型强,但专家调用成本也高。 如果模型能自己判断“这次哪些专家不用出场”,推理成本就能明显降下来。 大模型下一阶段,不只是更大,而是更会省。 #MoE #大模型 #AI论文 #模型推理 #人工智能
00:00 / 00:27
连播
清屏
智能
倍速
点赞
2
lemo
1年前
AI科普-什么是MOE? 混合专家模型是一种机器学习方法,它将人工智能模型分为多个子网络或专家。 每个专家都专注于输入数据的一个子集,并且只有相关的专家才会被激活来执行给定的任务,而不是将整个网络用于每个操作。这种方法可以提高人工智能模型的效率和性能,尤其是大型语言模型。#混合专家模型 #AI模型训练 #科普知识 #ai训练师 #MOE
00:00 / 07:02
连播
清屏
智能
倍速
点赞
13
Ai编程朱老师
1年前
MoE:就像一个专家团队,大家各自在不同领域都很厉害 #大模型 #gept4 #技术分享 #人工智能 #chatgpt应用领域
00:00 / 01:53
连播
清屏
智能
倍速
点赞
40
小向同学的 店铺
3月前
LLM中的专家混合模型(MoE)原理详解#读书分享 #LLM #大语言模型#moe #人工智能
00:00 / 03:19
连播
清屏
智能
倍速
点赞
95
鹏宇AI大模型
3月前
面试官:MoE混合专家模型里的Router具体是怎么实现的? #大模型 #ai大模型 #MoE #大模型面试 #混合专家模型
00:00 / 04:41
连播
清屏
智能
倍速
点赞
265
陈兴AI
4月前
搞懂DeepSeek MoE #DeepSeek #AI #MoE
00:00 / 08:25
连播
清屏
智能
倍速
点赞
68
大魔王搞AI4S
3周前
#ai大模型 #MOE架构 MoE 架构通过路由器仅激活部分专家子网络,实现了参数容量与计算效率的平衡
00:00 / 08:33
连播
清屏
智能
倍速
点赞
14
AI大模型入门教程
6月前
面试官:混合专家模型MOE如何降低计算成本?#AI大模型 #面试 #大模型应用 #互联网大厂
00:00 / 08:42
连播
清屏
智能
倍速
点赞
31
有限无边
4月前
当AI模型变大时,混合专家模型MoE架构如何节省算力? #ai #算法#机器学习算法 #人工智能 #混合专家模型
00:00 / 00:26
连播
清屏
智能
倍速
点赞
1173
新词元
1周前
大模型居然有两副面孔?稠密 vs MoE 一次讲透 #大模型 #人工智能 #豆包 用医院分诊的比喻,带你搞懂大语言模型的两种架构——稠密模型和混合专家模型。看完你就明白:为什么 DeepSeek 能用更少的算力跑出更强的效果?
00:00 / 03:06
连播
清屏
智能
倍速
点赞
4
鹏宇AI大模型
3月前
MoE 架构深度解析:显存杀手 面试官问:“混合专家模型,推理速度明明很快,但为什么大家都在吐槽它是‘显存杀手’?” #大模型 #ai大模型 #MoE #大模型学习 #混合专家模型
00:00 / 03:58
连播
清屏
智能
倍速
点赞
35
深度人工智能
2年前
大模型的研究新方法:混合专家模型(MoE)
00:00 / 02:26
连播
清屏
智能
倍速
点赞
0
三无产品
1年前
什么是MoE 今天我们来聊一个在AI圈子里越来越火的词——混合专家模型,也叫 MoE(Mixture of Experts)。#AI #人工智能 #MoE #混合专家模型
00:00 / 03:20
连播
清屏
智能
倍速
点赞
14
二进制茶馆
1年前
核心技术——如何让专家「小而精」? 上期我们提到,DeepSeekMoE通过「专家细分」提升专业性。今天我们来拆解它的两大核心技术:**细粒度分割**与**共享专家隔离**。 **第一招:专家拆分成蚂蚁军团** 传统MoE的每个专家相当于一个完整团队,而DeepSeekMoE把每个专家「砍成四份」。比如原本隐藏层维度2048的专家,拆成4个512维的小专家。这样做的好处是:**组合自由度爆炸式增长**! 论文用数学证明了:原本16个专家选2个只有120种组合,拆成64个专家后,选8个的组合数超过44亿种!就像乐高积木——零件越小,能拼的造型越多。 **第二招:设立「基础课代表」** 团队中总有些通用技能(比如数学公式),如果每个专家都学就太浪费了。DeepSeekMoE专门设置**固定激活的共享专家**,负责吸收这类通用知识。实验发现,禁用共享专家会让模型性能暴跌35%,足见其不可替代性。 更有趣的是,通过调整共享/专用专家的比例,模型在语言建模任务上的损失值还能进一步优化。下期我们将看到,这种设计如何在实际评测中碾压传统MoE模型!#利用deepseek可以做什么 #人工智能 #deepseek是什么 #deepseek介绍
00:00 / 01:24
连播
清屏
智能
倍速
点赞
1
荒野芯智观察
4月前
Moe多GPU专家并行:DeepSeek为什么启动快但生成慢 从原理到落地的全链路教学,一条视频让你彻底搞明白MOE模型的优缺点以及如何跑在多个GPU上。
00:00 / 40:06
连播
清屏
智能
倍速
点赞
24
芝麻大叔
1年前
什么事MOE(混合专家模型) #大模型 #MOE
00:00 / 02:18
连播
清屏
智能
倍速
点赞
7
耀哥说AI
9月前
人人都是大导演!通义万相 Wan2.2 炸场! 通义万相 Wan2.2 亮点十足: 业内首创 MoE 架构,通过 “高噪专家” 搭建视频整体框架、“低噪专家” 精修画面细节,分工协作提升生成效果; 依托海量数据训练,图像数据量增加 65.6%,视频数据量增加 83.2%,更经过 “美学精调”,学习电影级光影、构图与色彩,让生成内容更具美感; 采用高压缩比 3D VAE 技术,5B 模型大幅降低显存占用,为消费级设备运行提供可能。 功能方面同样强大,真正实现 “言出 Wan 行”: 推出 “电影级美学控制系统”,提供 60 余个专业参数,输入 “黄昏”“背光”“对称构图” 等描述,即可生成电影感大片; 复杂动作处理超稳定,无论是街舞、体操等大幅度运动,还是微表情、手势,乃至多人互动,画面都流畅自然、细节饱满; 高度还原现实世界,遵循物理规律,能精准理解文字描述,稳定生成包含多物体互动、空间感强的逼真场景。 #通义万相 ##Wan #AI视频
00:00 / 04:38
连播
清屏
智能
倍速
点赞
59
死磕A论文I女算法
2年前
中文版Mixtral-7×8bMoE 25GB显存畅玩专家模型 真·超越GPT3.5#人工智能 #专家模型 #深度学习 #大语言模型 #语言模型
00:00 / 01:06
连播
清屏
智能
倍速
点赞
104
AI灵魂拷问
3月前
什么是混合专家模型(MoE)? #AI #大模型 #混合专家模型 #AI科普
00:00 / 01:53
连播
清屏
智能
倍速
点赞
1
本元商业评论
1年前
最适合MoE模型的技术诞生了,可实现一卡一专家#超节点#MoE模型#华为云#AI
00:00 / 01:30
连播
清屏
智能
倍速
点赞
6
鸣姐.AI进阶
5月前
deepseek新发布的 v3 模型强在哪里,背后的MoE架构就是花小钱办大事的技术方案,MoE架构/混合专家模型,现在也是大模型的主流架构之一|挑战21天入门智能体第12期#deepseek #deepseekv3 #deepseekv2 #moe #大模型
00:00 / 02:44
连播
清屏
智能
倍速
点赞
39
鹏宇AI大模型
3月前
MoE混合专家模型分布式架构深度解析 面试官问:“在分布式 MoE 推理中,All-to-All 通信,究竟发生在哪两个关键阶段?” #大模型 #ai大模型 #MoE #大模型学习 #混合专家模型
00:00 / 04:16
连播
清屏
智能
倍速
点赞
38
今天记住一句话
1月前
EP 36 · MoE 架构:专家混合模型为什么更高效? 零基础读懂 AI · 第五章 进阶篇 好,前四章你撑下来了,恭喜 🎉 但真正烧脑的来了—— 为什么同一个模型,有人用得出神入化,有人用得一塌糊涂? 为什么大模型越来越大,但有人说方向根本就错了? AI 会有意识吗?它说「我很难过」,是真的难过还是在演你? AGI 什么时候来?有人说三年,有人说永远不会…… 进阶篇 8 集,不绕弯子,直接聊那些 AI 圈真正在争的问题。 看完你在朋友面前聊 AI,不会再被人带跑偏了 😏 关注我,最硬核的一章开始了 👇 #AI科普 #人工智能 #AGI #AI意识 #AI安全 #大模型进阶 #零基础学AI
00:00 / 02:25
连播
清屏
智能
倍速
点赞
0
𝙆𝙈𝙏𝙀𝘾𝙃
1月前
三分钟带你理解什么是大模型MOE架构 现在 MOE 架构已经是当前主流模型的主要架构。让我们来看看它是如何在不牺牲性能的前提下降低成本的。#AI #大模型
00:00 / 04:21
连播
清屏
智能
倍速
点赞
37
鹏宇AI大模型
1月前
面试官问:MoE混合专家架构为什么比Dense模型更高效? #大模型 #ai大模型 #MoE #大模型学习 #大模型面试
00:00 / 05:37
连播
清屏
智能
倍速
点赞
65
Bonny的Daily Tech
1周前
EMO 模块化MoE大模型 #ai #agent #moe #chatgpt #model
00:00 / 00:36
连播
清屏
智能
倍速
点赞
0
开哥的深海AI日常
2月前
1分半理解-MoE混合专家模型
00:00 / 01:30
连播
清屏
智能
倍速
点赞
1
简介:
您在查找“
moe模型怎么卸载专家
”短视频信息吗?
帮您找到更多更精彩的短视频内容!
最新发布时间:2026-05-21 06:42
最新推荐:
给阿魔的情书中的男主长什么样
有线耳机打瓦
陈奕恒红线怎么拍
村里抢房我屯黄金
三菱劲炫质量怎么样
张一帆怎么走的
除了数学还有什么
tenir为什么叫少爷
King试训TEC效果好
61怎么拍照
相关推荐:
洛克王国怎么离线不提出互访
家业站内热度是多少
苏超教练压力为啥比中超大
传功卷轴什么时候上线丹修仙
家业男主有妻子吗
马斯克一天喝多少可乐
熊猫1108和熊会长
鸣潮洛瑟拉毕业攻略
有没有能打的铅球
恩居2025赢了几场
热门推荐:
熊出没画中画设置
压缩包设置密码2345
闺蜜调查问卷问卷星怎么发送
haeyoday鼠标怎么设置
vivo小v修图技巧
异环怎么改电台歌曲
api中转怎么做c端
黄仁勋你会不会把内存卖给华为
快手极速版怎样回复
在哪申诉取消ai