00:00 / 04:14
连播
清屏
智能
倍速
点赞266
00:00 / 01:39
连播
清屏
智能
倍速
点赞113
00:00 / 01:27
连播
清屏
智能
倍速
点赞0
00:00 / 00:50
连播
清屏
智能
倍速
点赞13
00:00 / 04:34
连播
清屏
智能
倍速
点赞829
00:00 / 04:21
连播
清屏
智能
倍速
点赞6339
00:00 / 01:15
连播
清屏
智能
倍速
点赞4
00:00 / 04:06
连播
清屏
智能
倍速
点赞777
睿睿3周前
、什么是“超节点”?为什么要搞超节点? AI大模型这几年参数越卷越大,万亿参数已经是标配,十万亿在路上。传统只堆单卡的方法有两个死穴:一是显卡成本高得吓人,二是数据在卡之间来回传递的通道太窄,大量算力被浪费在“等数据”上。超节点就是破局的方案——把几百张芯片用超高速互联网络绑在一起,组成一台“超级计算机”来协同作战。除了英伟达GB200 NVL72用铜缆互联把72张GPU捆成一台。 华为则推出了更具革命性的CloudMatrix 384超节点,通过两层交换网络把384颗昇腾NPU连接成单一逻辑算力池,突破了传统的单点算力瓶颈,堪称国产算力逆天改命的“聚怪大法”! 2、DeepSeek已经全面跑在了昇腾上 今年4月DeepSeek新旗舰模型V4的选择非常坚决,从设计之初就开始全方位匹配昇腾生态。研发团队重写了200多个核心算子,包括Attention、MoE并行和Broadcast等操作,完成了从CUDA到华为CANN架构的全面迁移。最终实现了在昇腾910C万卡集群上训,昇腾950PR上推理,跑通了一套完整的国产训推闭环,中国AI产业首次实现了大模型与国产算力的彻底拉齐。同时DeepSeek还表示,受限于高端算力,目前Pro版的服务吞吐还十分有限,但是等下半年昇腾950超节点大规模铺开之后,Pro的价格会大幅腰斩,届时推理成本将被打到白菜价~ 正如任正非说的:单芯片我们还是落后一点,但数学可以补物理,群计算可以补单芯片。从今天起,高端AI算力,我们自己造! #Atlas950#昇腾950#国产算力#超节点#DeepSeek
00:00 / 00:25
连播
清屏
智能
倍速
点赞19
00:00 / 04:52
连播
清屏
智能
倍速
点赞23