大家有没有想过,当我们在为国产算力芯片的每一次突破欢呼时,却可能忽略了另一个同样致命的卡脖子环节?就在今天,3月12号,中科曙光在郑州投下了一枚重磅炸弹,正式发布了国产全栈自研的400G高速网络产品scaleFabric,并且直接宣布在国家超算互联网核心节点实现了3万卡的商业化集群落地。这不仅仅是一个产品的发布,这宣告了中国在AI算力的最后一块短板——高速互联网络,被正式补上了。 其实逻辑很简单,大家想一想,万卡集群,甚至十万卡集群,把几万个芯片连在一起干活,靠的是什么?靠的就是网络。这就好比你要指挥三万人协同作战,如果没有一个高效的指挥部和通信系统,那场面得多混乱?在AI大模型训练中,网络通信耗时占比高达30%到50% 。过去,这个领域被英伟达的InfiniBand,也就是我们常说的IB网络绝对垄断,它不仅贵,更是把国产算力锁死在单体性能的天花板上。这意味着什么呢?意味着就算我们有了一流的国产GPU,如果连不上、连不好,算力集群的效率就会大打折扣,就像堵在路上的超级跑车。 但今天,中科曙光这个scaleFabric,从底层的112G SerDes IP,到交换芯片、网卡,再到软件,100%国产,性能全面对标甚至部分超越了英伟达的NDR产品,端到端时延低至0.9微秒 。更重要的是,它已经在郑州的核心节点撑起了3万卡的商用集群,而且成本比国外方案降低了30% 。这不仅是能用,而且是好用、划算。国家超算互联网这个国家级工程选择它,就是对它稳定性最好的背书 。 那么,这条“算力大动脉”被打通之后,产业链的机会在哪里呢?首当其冲的,就是中科曙光本身,作为核心参与者,它的“算—存—网”协同能力将形成更深的护城河 。其次,这张网铺开,会直接拉动上游的国产光芯片、光模块需求。大家记住,高速网络跑起来,光电转换是关键。像光迅科技、华工科技这些在高端光模块有布局的公司,有望迎来新的增长曲线。另外,既然网络瓶颈被打破,大规模算力集群的建设将加速,这会直接利好国产算力芯片的放量,比如海光信息、寒武纪这些,以及为他们做配套的PCB和服务器厂商,比如深南电路、浪潮信息等,整个国产算力生态都被激活了。 #中科曙光 #scalefabric #万卡集群 #深南电路 #浪潮信息
00:00 / 03:01
连播
清屏
智能
倍速
点赞177
00:00 / 07:43
连播
清屏
智能
倍速
点赞9
00:00 / 04:12
连播
清屏
智能
倍速
点赞156
最近业内传出一个消息,国内的头部算力厂商要推出原生的无损RDMA方案,性能直接对标国际主流的IB技术,成本还有望降低。大家想一想,这意味着什么?这不仅仅是又多了一个新芯片或者新设备,这是在动AI时代的地基。如果把AI大模型训练比作一场需要数万甚至十万颗GPU同时参与的超级交响乐,那RDMA网络就是连接它们的乐谱和指挥棒。以前,这根指挥棒最趁手的,一直握在海外巨头手里。但现在,我们不仅要有自己的乐团,还要有自己的指挥系统。 其实逻辑很简单,为什么AI训练非它不可?现在的AI集群动辄万卡起步,大家想一想,上万张卡同时在那算,它们之间要不停地交换数据,也就是我们说的“西东流量”。如果网络稍微卡一下,哪怕是丢了一个数据包,成千上万的GPU可能就得停下来等,那算力浪费起来可是真金白银。所以,这个网络必须做到极致的低延迟、零丢包。这就是RDMA存在的意义。过去,业界有两个主流选择,一个是高高在上的IB架构,性能极好但价格极其昂贵,生态也比较封闭;另一个是大家更熟悉的RoCE技术,它基于标准的以太网,成本低很多,开放性好,但在大规模组网时就像在拥挤的普通马路上试图开快车,需要非常复杂的调优才能保证不“堵车”。 而这次提到的原生无损方案,可以说是取两者之长。它走的是类似IB的技术路径,性能硬刚国际顶尖水平。像国内的中科曙光,已经推出了叫scaleFabric的方案,端到端延迟能控制在1微秒以内,单子网能支持超十万卡的扩展,这在以前是不可想象的。更关键的是,它完美兼容现有的IB应用生态,这意味着以前的软件不用改就能跑,切换成本极低,而且组网成本相比IB能降低约30%。这就是在打破技术垄断的同时,也打破了价格垄断。 基于这个逻辑,我们再看资本市场,机会其实藏在三个层次里。第一层,是直接实现技术突破的“破局者”。比如前面提到的中科曙光,它的scaleFabric填补了国内原生RDMA的空白,是构建自主可控算力体系的核心底座。第二层,是围绕这个生态提供核心硬件的“筑基者”。任何网络方案都离不开交换芯片和FPGA加速。像安路科技,它的FPGA芯片就被广泛用在了中兴通讯、新华三等头部厂商的RDMA网卡和智能交换机里,做硬件加速,可以说是“卖铲子”的关键角色, #RDMA #IB架构 #中科曙光 #中兴通讯 #中国移动
00:00 / 03:48
连播
清屏
智能
倍速
点赞90
00:00 / 00:47
连播
清屏
智能
倍速
点赞6
00:00 / 05:49
连播
清屏
智能
倍速
点赞496
00:00 / 04:05
连播
清屏
智能
倍速
点赞102
00:00 / 04:44
连播
清屏
智能
倍速
点赞1517