00:00 / 00:27
连播
清屏
智能
倍速
点赞16
00:00 / 00:44
连播
清屏
智能
倍速
点赞34
00:00 / 07:36
连播
清屏
智能
倍速
点赞0
摩尔线程还有机会追吗? 摩尔线程还有机会追吗?英伟达、谷歌TPU、AMD、寒武纪的差异化路径解析 过去十年间,AI与高性能计算的飞速发展催生出多条加速器设计路线:从通用GPU,到专用NPU/TPU,再到兼顾图形与通用计算的混合架构。摩尔线程(中国新兴GPU厂商)、寒武纪(专注于NPU)、英伟达(通用与专用结合的GPU路线)、谷歌TPU(为深度学习定制的端到端ASIC)以及AMD(通用GPU + HPC/AI专用扩展路线)分别代表了五种典型的技术谱系。将它们放在一起对比,能够清晰地看到不同的设计取舍如何影响性能、能效、生态构建与产业链风险。 英伟达:生态驱动的通用加速平台 英伟达从图形渲染起步,其GPU架构逐渐被证明极其适合矩阵乘加与张量计算,因而演进出了强大的张量核心和丰富的混合精度支持,旨在覆盖从游戏、图形到深度学习训练与推理的广泛场景。英伟达在数据中心领域押注“GPU即AI加速器”,并通过软件层构建了强大的生态体系。其架构核心是通用计算单元、专用张量单元与高带宽互连技术的结合。 谷歌TPU:为TensorFlow定制的专用芯片 谷歌TPU自诞生之初就是为深度学习的矩阵乘加运算与TensorFlow框架量身打造的专用集成电路。其核心在于大规模的脉动阵列设计,将乘加阵列与低延迟本地内存紧密耦合,并借助专用编译器将模型数据流映射为高度优化的内存与计算流水线。这种设计可以理解为“将数学直接做在硅片上”,以牺牲部分通用性来换取极高的能效与规模化吞吐量。 AMD:开放路线与双架构并行 AMD长期遵循GPU通用计算路线,近年来则将目标细分为HPC与AI两大方向,推出了分别面向AI/HPC的CDNA架构与面向图形的RDNA架构。其策略是通过开放的软件栈和高性能互连技术来构建可扩展的加速平台,强调可组合性与多卡互联能力,旨在超级计算与云端市场与英伟达展开正面竞争。 寒武纪:聚焦NPU,端云一体 寒武纪的定位更偏向于神经网络处理器,采取端云一体的产品策略,其产品线覆盖从终端SoC到云端加速卡。 这几家厂商代表了从高度通用到完全专用,以及中间不同平衡点的技术光谱。它们的差异化不仅体现在硬件架构上,更深刻反映在软件生态、市场定位和对产业链的整合能力上。摩尔线程作为追赶者,其发展路径需要在性能追赶、生态构建与应用场景聚焦之间找到自己的独特平衡点。#摩尔线程 #英伟达 #AMD #寒武纪 #谷歌
00:00 / 03:31
连播
清屏
智能
倍速
点赞236
00:00 / 04:11
连播
清屏
智能
倍速
点赞533
00:00 / 00:46
连播
清屏
智能
倍速
点赞105
00:00 / 01:47
连播
清屏
智能
倍速
点赞102