这两天喷圈都在刷屏,中科曙光的 style fabric 在 发布会上,中国工程院院长吴鹤泉的致辞呢,分量极重,他直接点明了这件事的核心意义,这标志着我国在高性能计算互联领域实现了从零到一的突破,补齐了国产高速网络的短板。在 咱们得琢磨一下,就为什么院士会给予这么高的评价,因为啊,这高速网络这个东西啊,在过去很长的一段时间里,是我们算力体系里的房间里的大象。那大家都看到了 gpu 被卡,但很少有人注意到,就连接这些 gpu 的 神经系统,也就高端网络市场同样被国外巨头主导的。 那吴院士的发言里呢,有一句话是特别的关键的,其自主可控性直接关乎国家算力基建安全与发展质量。那这话说的很重啊, 你可以想象一下,就如果咱们的制算中心,从芯片到交换机,再到软件协议啊,底层全是别人的,那这不仅仅是贵的问题,更是在关键节点上,随时可能被断梁或者留后门的风险。 那这就像一个大厦的钢筋水泥啊,都是咱们自己的,但连接钢筋的焊点和螺丝是别人控制的,那这楼你说能建的踏实吗?而曙光的厉害之处就在于,他们选了那条难但对的路。 那目前呢,行业里主流的有两种搞法,一种呢,是基于以太网的 rookie, 好 处呢是兼容性好,但在超大疾巡里啊,它容易卡顿丢包,就像高峰期的高速公路,那车一多呢,就开始堵了。 另一种呢,就是 indian 版的,也就是 i b 原声路线,那这是专为高性能计算设计的赛道,那性能是极强的,但它技术门槛极高,一直是被国外控制的。 那曙光的 sky fabric 呢,恰恰走的就是后者这种原生 ip 路线。这意味着啊,它不是简单的在别人的地基上盖房子了,而是从底层的地基打起,那他们自研的一百一十二 g service ip 交换芯片网卡,那做到了百分之百全占自研, 这就相当于我们不仅修了路,连修路的压路机、沥青图纸那都是咱们自己的。那实测数据呢,也证明了这条路咱们走对了。与英伟达 ndr 相比呢,这交换机端口密度提升了百分之二十五,网卡最大 qb 数支持提升百分之百,单子网互联规模是传统 ib 的 二点三三倍。所以产业的机动那是有道理的。 skyflabric 的 发布给了我们一个选择,就当我们在建万卡十万卡集群的时候,终于可以用上咱们自己手里这条又快又稳的高速公路了。那这不仅仅是商业的胜利,更是国家算力安全的一大步啊!我是轩哥,关注我,看懂经济科技与国家发展。
粉丝45.6万获赞580.7万

妈呀,这几天全网都在聊的国产自研原生 i b 架构终于落地了,又是中科曙光。就在今天,中科曙光 skill fabric 高速网络重磅发布,咱们盼了这么久的国产无损 r d m a 高速网络,可以说直接干到了国际顶尖的水平。就你知道这个东西,咱们真的等了很多年了。 那刚刚在两会开完的节点上,咱们十五规划把科技自立自强新高度已经讲得很清楚了, 要实施超大规模的制算集权,以及加强全国一体化顺利监测调度,也就是说顺利已经被定位为国家的核心基础设施了。所以在这个节点, skill family 出来,这个政策的风口就踩得非常的准。 老实说,很多人都清楚啊,这些年咱们在制算网络领域有多么大的憋屈,因为大模型的训练对网络的要求是非常的高的,你既要零丢包,又要极低的延迟, 你只有原生 ip 架构才能搞定。但是在过去, ip 技术一直在老外手里啊,咱们要么受制于人,要么退一步用 lucy 在 性能上妥协呗。但是想要做大规模集权,最后经常不是算力不够啊,反而是网络先卡住了,所以要自主可控和高性能只能二选一。 但今天中科曙光用 skill fabric 就 彻底打破了这个僵局。呃,不只是简单的国产平替啊,它直接从底层的一百一十二 g servers ip 到转换芯片,再到网卡跟整个软件平台, 百分之一百的做到了全掌自研原生无损的 r d m a 网络性能,直接对标 media 的 n d r 级 i d 网络,甚至在直网扩容能力这一块还有反超, 完全有能力适配十万卡级别智算级群的未来需求,那以前咱们用 uki 是 没得选,现在有了 skill fabric, 首先咱们就不用看别人脸色了对吧?也不用被迫在自主可控跟高性能之间二选一,站在战略上,更为十五五期间建立全国一体顺利网 扫清最关键的一步技术障碍。从东数西算到算力网一张网,从规模的扩张到提职增效,跟上国家战略的节奏。作为圈内人,咱们一步一步看着国产硬核科技从技术智力走向引领, 还是感动的。那十万卡计算时代,咱们国产网络也终于可以站到舞台的中央了。这一波,确实要给中科曙光点赞,也给国产科技点赞。

大家好啊,昨天是吧中科曙光发了自己的 i b 的 整个的产品啊,整个的那种高速的网络的调制调制器和整个网关的一系列的产品好了,那这个东西很多朋友不知道它意义什么, 实际上呢,昨天中科曙光发的这个产品呢?它对标的是谁呢?对标的是英伟达的 n v l 七二或 n v l 幺四四里边那个 n v l, 这个你要知道啊,这个大模型的运算,它需要高级群,大群现在你没有单卡能单或者几张卡能撑起来的模型了, 都是几百上千甚至上万张卡成型的模型。那这些大的这个卡变成一个机柜,一个机柜可能四十、四十多张,五十多张,甚至一百张卡,几百张卡这样一个机柜,每个机柜之间要进行高速的连接的, 现在是四百到八百 g, 这台是一点六 t 是 吧?未来还要变成三点二 t。 高速的连接越宽,它数据交换的越多,数据的交换速度越快,所以整体的效率越高啊,这就是超节点整个系统的概念,那这里边中间这个 i b 就是 整个网络传输控制中心, 这个是最关键的啊,以前我没办法,我们 r d m a 就 整个底层全是没有的,只能是靠美国人这套技术,我们来追人家的东西啊。华为自己的东西是靠着短程加中程啊,它没有长程、短程加中程的东西来结合做这个事的,在这个东西它也做的比较麻烦。 那么曙光这回他们花了两年多的时间全自研啊,做整个这一套东西的概念在哪?一个?就是它的那个交换机啊,它是可以现在就做到八百 g 的 四十个端口, 而然而 ml 的 那个交换机呢,实际上号称是八百 g 的 四十个端口,其实它是八百 g, 四百 g 的 那个八十个端口,然后它是两合命方式对外提供测试数据,但真正实施起来呢,依然是每个端口是四百 g 的, 而不是八百 g 的。 另, 另外这个反应包括传输速度的微秒上面呢?整个速度上面通过曙光的他的反应速度差不多两百纳秒左右, n l 的 基本上打平 n l 也是都在这两百纳秒左右晃荡啊,没有说比他超出一个没有的。所以这样从这些数据,包括他的一组网性,包括他可以直接挂十一万张卡, 他整个网络挂十一万张卡就倒贴了,哎,他下一代还没有出来的,可能要挂到六万张卡到八万张卡,但是通过曙光直接挂到十一万张卡, 这个就意味着什么呢?就很多事我没法跟大家讲,因为我去过什么,这是国家超算互联网的核心节点,这个我去过参观过,我只能说未为壮观,找不到什么其他的词来修饰。但这里边中科曙光的这个技术已经开始使用了, 而且大规模使用的。我告诉你他们的使用三万张卡的一个集群,你知道他们花了多长时间把它部署出来的吗?明的告诉你们三十六个小时,而同样两万张卡的集群就是英伟达的集群,在马斯克那部署花多长时间呢?十一天, 中科曙光的整个系统的部署三十六个小时,这个事实是他们工程师在交流中给我们透露的数据,我觉得特别好,真的特别好啊,跟大家简单的说一下,这个意味着什么?而且这意味着什么?这个光通信光模块后续东西的整体长城的 发展趋势大家清晰可见,这是接下来我们已经把底层的网络、 i b 网络整个技术打通了,我相信华为接下来发的肯定有类似东西,因为曙光能做,华为也能做啊,这两家都能做东西,但打通了以后,他就会有了中国国产这条路,这条路。以前的那些光模块很多东西是要给英伟达做适配的, 那接下来大家就要给国产东西做适配,以前他们给英伟达做适配就已经现在这个业绩了,你猜猜他们给国产,他接着做适配会有什么样的情况? 是不是?这?所以说他长线又看出来了好不好?简单跟大家说到这了啊,有很多朋友说的话,现在很多东西都压到热点了,我在哪看呢?哎,关注我们的小程序,奥特豆豆与瑞克老张科普课啊,上面那个年卡金卡啊,幺六九九,但是我们一年一百八十以上的会员视频, 三十二场以上的会员直播,所有的专栏免费看,我觉得非常的划算,因为平均下来一个内容可能就七八块钱,你就能看这些东西了,我觉得非常棒啊,有需要可以赶紧看一下,好研究到这。我是瑞可老张,关注我,带大家看中国科技的高度和温度,我们下期见,拜拜。

三年磨一剑,中科曙光 sky 发布,这个发布补齐了国产算力的最后一块拼图,高端计算循环成型。这次发布份量极重,因为它不仅仅是一款产品的问世,它更标志着国产高端计算体系真正的打通了任督二脉。 细看曙光的布局就会发现,从高性能计算到 ai 大 明星训练,最核心的三要素,算力、存力、网力。它们已经在每一个维度上都对标国际巨头,形成了完整的自主技术。循环。 算力层面有近末夜冷算力底座,让芯片释放极限性能。存力层面有帕萨斯尔,分布式存储,吞吐效率全球顶尖。网力层面就是今天的主角 skill fabric, 补齐了那张让整个行业等待了多年的高速网。 以前我们总说 ai 算力的命门是 gpu, 是 芯片,但今天我要告诉你,当集训规模充到了十万卡,真正的命门其实不在 gpu, 而是在那根不起眼的网线上。 过去算力再强,存力再大,如果网络不通不稳,那这三者就是一盘散沙。只有把这张网攥在自己手里,才算是真正拥有了高端计算的完整话语权。 以前这条路只有两条,一条是 lowkey, 便宜灵活,中小规模玩的转。但到了万卡级,动态时延和优色控制,就有点像在高速公路上开手动挡,不是不行,就是得时刻盯着调着。 另一条是 ib, 也就是尹菲利贝,这东西好原生为超算而生,低延时真无损,是十万卡级群的标配。但问题是,这么多年, ib 的 技术和产品一直被海外攥在手里,咱们想进大级群,要么就在别的路线上修修补补, 说白了,高端 i b 网络一直是国产算力体系里那块最疼的拼图,始终没补上。但今天,曙光这面硬钢搞了三年,拿出了 scale fabric 这个纯原生的 i b 方案。 咱们看数据, scale fabric 四百,网卡通讯十元,低到了零点九微秒。 scale fabric 四百,交换机交换十元,约二百六十纳秒,这是什么概念呢?数据从这头到那头,几乎就感觉不到时间的流逝。 交换机单端口再宽达每秒八百 g, 整机交换容量可达双向每秒六十四 t, 这直接领先了当下主流的二百 g 不 止一代。当算力、存力、网力这三块拼图严丝合缝的拼在一起,意味着什么呢? 意味着咱们的国产算力从底层硬件到顶层调度,终于有了一套完全自主且性能对标国际巨头的完整体系。以前咱们可以硬气的说,这叫同台竞技, 曙光这次补上的不只是一个产品,而是让国产 ai 算力有了一条真正属于自己的专属高速路。为了这份沉得住气的突破,必须得点个赞!

中科曙光近日宣布推出其自主研发的四百 g 无损高速网络 scale fabric, 只在解决当前数据中心网络面临的性能瓶颈问题。 该产品全面对标国际领先技术,部分性能指标超越英伟达 n d 二,标志着中国在高端 r d m a 领域实现关键技术突破,填补国内行业空白。该产品基于原生 r d m a 架构打造,从一百一十二 g vr 核心 ip 交换芯片、智能网卡交换机到驱动与管理软件,实现百分之一百自主研发,构建完整自主技术体系。其采用信用制精准留控机制,从根源杜绝数据丢包,实现真正无损传输,大幅降低其群组网与运维复杂度。 性能上, steel fabric 达国际顶尖水平,四百 g 网卡端到端时延低至零点九微秒,八百 g 交换机交换时延仅二百六十纳秒,整机双向交换容量六十四兆兆位每秒, 端口密度、磁网规模等指标部分超越国际同类产品,可稳定支撑超十万卡级智算集群部署。 目前已在国家超算互联网郑州核心节点规模化验证,支撑万卡及集群稳定运行超十个月。该产品全面对标国际主流方案,网络总成本降低约百分之三十,有效破解 ai 大 模型训练、超算运算的高速互联瓶 颈。此次发布打破海外技术垄断,夯实我国算力新基建自主可控底座,为智算产业高质量发展提供核心支撑。

此次发布的 scarab fabric r o d m a。 高速网络是智算集群的算力大动脉, 非常高兴与大家共同见证曙光公司 scarab fabric 高速网络产品的发布。当前,人工智能全域普及,算力成为核心生产力,算力的竞争也升级为算网纯血铜的全生态的博弈。 高速网络作为算力基础设施的核心关键技术,其自主可控性直接关乎国家算力基建安全与发展的质量。 长期以来,高速高端网络市场被国外技术垄断,成为我国算力产业自主发展的核心瓶颈之一。令人振奋的是,此次发布的 scarab fabric 是 国内首款自主研发的原生 r o d m a。 高速网络系统, 性能对标国际主流,且经过规模化的实践验证,打破了国外的技术垄断,补齐了国产高速网络的短板。 希望曙光公司以此为新起点,持续技术创新、生化产业,携手构建自主、先进、安全的高速网络技术和产品体系。

圈内的朋友们,今天必须炸一波,咱们熬了这么久的大模型万卡训练网络困局终于被彻底打破了!就在刚刚,中科曙光 skill fabric 高速网络正式发布,直接给智障行业扔了一颗重磅炸弹。做过大模型训练的都懂, lucy 方案在千卡级还能应付,但规模一上去,基于 pfc 的 流控就容易波动, 参数调优全靠手艺人贷款利率往下掉,算力红利,被通信号时一点点铲食。另一边, id 方案性能虽好,但技术攥在别人手里,想掉底层 没门。这局面苗维部长看的透彻。三月十一日,人民日报发文强调,我们正在通过超大组网、高速互联和统一调度这些工程创新,在集群层面实现算力跃升。 话翻译成大白话,就是单点芯片的差距,我们用系统级的协调能力来补。别人的封闭生态,我们用开放架构来破。而今天正式亮相的中科曙光 skill fabric, 正是这套思路的集大成者。作为国产全站自研的原生无损 r d m a 高速网络, skill fabric 从芯片到软件,百分之一百自主可控 单子网轻松支撑超十一万卡扩展,端到端时延低于一微秒,转发时延仅两百六十纳秒。这些参数放在国际市场上,就是对标顶尖 id 的 水准。但比参数更重要的,是它的开放架构底色。 skill fabric 支持多品牌硬件混合部署,不绑死任何一家芯片,真正实现了苗圃所说的兼容主流。 这意味着,不同架构的芯片都可以在同一张高速网上协同跑起来。芯片可以百花齐放,但网络这张大动脉必须是自主开放无损的。 更硬核的是,这套方案不是 ppt, 已经在国家超算互联网郑州核心节点完成三万卡商用部署,服务上万用户,近百家科研院所累计运行作业超十万次。 实打实的规模化验证,把系统级能力从纸面落到了地上。以前我们纠结选 rookie 还是 ip, 本质是在性能和自主之间二选 一。现在 skill fabric 把这道选择题彻底废除了。性能对标国际顶尖架构,全面开放兼容国产芯片想上十万卡集群这张网,接着算力大动脉通了国产 ai 基础设施的团体赛才刚刚开始。


今年双会智能经济首次写入工作报告,目标是到一五末干到十万元以上。那么盘子花这么大?但有个问题啊,一直想问,十万亿的算力,南海船造好了吗? 就在刚刚看完中科曙光发布的 scale fabric, 我 突然觉得有眉目了。为什么这么说呢?因为要搞全国算力一张网啊,最核心的技术挑战就是连接 未来的算力中心不再是孤岛。东边的算力啊,要随时调到西边用,训练一个大模型,可能需要调动好几个城市的算力中心一起干活。 这时候啊,如果没有一张高速稳定且完全自主可控的网络,这一张网啊就是个空架子,算力啊,根本流动不起来。曙光的 scale fabric, 如今就是在这个连接器上取得了关键突破。它不是简单的贷款升级,而是从底层解决了大规模集群互联的顽疾。比如说,它的单子网支持十一点四万卡规模部署是国外主流产品的二点三三倍。 这意味着未来构建超大型的国家级算力枢纽,技术上有了国产的承重墙。再比如说,它的故障恢复时间小于一毫秒, 这对于动辄训练几个月的大模型来说啊,太重要了,网络抖动一下,训练可能中断重来,这种毫秒级的自愈能力,才敢把最核心的任务啊交给他。而更重要的是对产业生态的影响。以前高端市场被国外垄断,价格高昂,供货周期啊还不稳定, 国内下游厂商根本没得选,只能用 plan a。 现在曙光的 square fabric 出来之后啊,性能对标国际顶尖,成本啊还大幅降低,这就像在一个原本一家独大的市场里面,突然杀出了一个实力相当的搅局者, 这带来的连锁反应啊,是巨大的,对于用户来说,有了溢价权,不用再承受不合理的溢价。 对于国内产业链来说,更是一个重大利好。因为曙光实现了从芯片到软件百分之百之研,这就会带动整个国产的半导体、风测、 pcb 板、光模块,包括操作系统等上下游企业一起上车, 形成一个基于自主技术的朋友圈。就像曙光说的,他们在光核组织下推动标准制定。这意味着 scale fabric 不是 一个孤立的产品,而是一个生态的起点。 当这个生态滚起来,应用场景越多,产品迭代越快,产品性呢也就越好,应用规模也就越大,最终它会成为支撑一五算力网的坚实底座。所以,毫无疑问, scale fabric 的 发布,补上的不只是技术短板,更是为中国从算力大国迈向算力强国铺平了一个最关键的一条路。

现在的这样一个传,或者说传统的超算系统的话,它对于支持我们智能科学智能的这种用,尤其我们刚才的分子光学模拟的应用不够好,对吧?所以我说我们想去做一种新的机器,用新的芯片, ok, 刚好我们这个曙光的 skill fabric 这个产品就发布出来,我们就第一时间拿到了,放到我们这个系统当中去用。因为我们是 ib 的 话,我们一开始就定位就是要去,要去比,因为拿了 cx 自己我们国产的这样 ib 的 这个网卡的话,在宽带性能上不比他弱,对吧?甚至还单 q p 还比较强一些, ok, ok, 你 可以说明它的这个转发延迟基本上就是在在二百五五十五个纳秒左右,对,它和这个英伟达的这个 i b 的 这个交换机是基本上相当的。

家人们,昨天下午我在郑州,手心里的汗就没干过,因为我亲眼见证了一场中国科技对西方垄断的绝地反杀。中科曙光刚刚正式发布了全自研高速网络 skala fabric。 可能有人问一个网络产品至于吗?太至于了,你们知道吗?现在搞 ai 大 模型卡再多,网络不行,全白搭。而这个领域的老大叫做 infine bend, 核心技术几十年被国外的 miller x 垄断,英伟达收购后,更是封死了所有路高速的 cds r d m a 隐形交换芯片,全是卡脖子的硬骨头。我们见算力中心处处受制于人, 等于命根子捏在别人手里。但今天咱们就不干了。中科院研究所的王展研究员,作为第一批拿到产品的用户,他分享了一个细节,让我瞬间起鸡皮疙瘩。 他说,他们拿到 skala fabric 后,第一时间就拿去跟英伟达的 cx 七网卡做了最硬核的头对头测试,结果怎么着?单 q p 通信性能比 cx 七还要好, r d m a right 和 send 延迟 最好成绩能做到一点一四微秒和一点四七微秒。王展研究员原话是,我记得数据比英伟达还要好一点。 这意味着什么?这意味着中国人花了三年时间,不仅把从一百一十二 g 高速 samsung ip 到四百 g 网卡芯片,再到六十四 g 交换芯片,这些硬骨头全啃下来了,而且在核心性能上直接对标甚至超越了国际巨头。 大家想想,以前我们说国产替代,总有人说能用但不好用。但今天王展研究员给出的实测数据,零点九三微秒的网卡,延时 两百六十纳秒的交换机转发岩石,这是真正意义上的世界级选,这不是追赶,这是在英伟达最深的护城河里,中国人硬生生的填出了一条路, 这不仅是补上了中国智算的最后一块短板,这是把高速网络的心脏彻底换成了中国心。为中国科研人员点赞!

国家要建设算力高速公路,他到底是个什么样的呢?高文院是给出了一个直观的答案,那就是让大家像用电一样使用算力,哪家便宜就用哪家。 这听起来很美啊,但是想做到这一点,就要求我们的算力网络是开放的,用户也能自由选择, 不会像美国那样只有一个英伟达你爱用不用。这也是二零二六年开始,全球 ai 用户都开始选择中国算力的原因。而就在这个时候,中科曙光 scarlet fabric 发布,交出了国内首份硬核答卷,答案就是首发了国产原生无损 ib。 可能有朋友不知道什么叫无损 ib, 英文名叫 infini bond, 是 一种高性能、低延迟的网络通信标准,广泛应用于超级计算机、 ai、 大 模型训练集群以及高性能存储系统等等。 它的要求是在传输数据的过程中不丢包、高吞吐和低延迟。这个无损 ib 是 由一家非盈利性国际组织 infini bond 贸易协会完善并推广的。 二零一九年,英伟达收购了一家在 ib 领域领先的企业,使得无损 ib 逐渐成为了高性能网络的标准。而曙光这次发布的正是国产原生自研的四百 g ib 无损网络。 我们的算力网络终于有了自己的大动脉。曙光四百 g ib 无损网络的最大特点,第一是开放,第二是开放,第三还是开放,芯片可以自由选择,网络层不做任何的锁定,而且兼容现有的 ib 生态。 以前无论哪个厂家基于 ib 开发的并行计算代码,直接牵过来就能跑,对那些已经在运转中的 超算中心和制算中心来说,这就意味着升级成国产替代,却不用从头再来,更不用再交一遍学费。有了 scarlet fabric 这张网,就是算力高速公路的一个具体表现,它能连接所有参赛选手的赛道,让芯片厂商可以专注做芯片, 算力中心可以自由选行。曙光 scholar zebras 则负责在网络层把所有力量高效协调起来,让我们在算力层面打一场团体赛,这才是符合我国国情和能力优势的算力发展之路。我是雷哥梁枫叶,陪我的国一起复兴!

最近外媒都在报导的咱们国内几家公司在 i b 网络无损 r d m a 技术上的突破。你可能之前没太听过这俩词儿。别慌,我先给你掰扯清楚,保证说人话,不整那些晦涩的术语。 首先说 r d m a, 简单来说啊,就是远程直接内存访问,你平时发个文件,传个数据,是不是得先经过 cpu 处理?就像你快递东西得先让快递员上门取件儿,再运过去。 r d m a 就 不一样了,它能绕过 cpu, 直接把数据从一台电脑的内存传到另一台电脑的内存里,这意味着什么呢? 延迟特别低,效率特别高,就像两个邻居隔着墙直接递东西,不用绕一大圈。然后是 ib 网络,也就是 infinite band 的 网络,这个之前是英伟达垄断的高端方案,是 ai 训练的首选。你想想,现在大模型训练,动不动就上万张显卡一起跑, 数据传输量超大,对网络的要求特别高。 ib 网络就是干这个的,能让这么多显卡之间的数据传的又快又稳。 还有无损二 dma, 这个就更关键了,就是零丢包。你上网的时候有时候会不会遇到文件传一半断了,得重新传?在万卡集群这种大规模的 ai 训练里,要是数据丢包了,整个训练进程都可能受影响,甚至得重来。 无损二 dma 就 能保证数据百分之百传过去不会丢,这对万卡集群来说简直就是刚需。好了,概念说清楚了,咱们来聊聊国内这几家做出突破的企业。 第一家是云麦新联,这家公司二零二一年才成立,算是个后起之秀,专门盯着 r d m a 芯片作,二零二四年,他们量产了四零零 g 芯片 y s a 零零客户还挺厉害的,像浪潮、新华三、中原懂艺这些行业里的大玩家都在用他们的东西, 他们用的是 roc v 二技术路线,简单说就是在以太网基础上实现 r d m a, 成本可能相对低一点,兼容性也不错。 第二家是中科曙光,这家可不一样,是国内唯一一家真正做 i b 网络的企业。他们自研了 scale fabric 技术, 二零二六年二月的时候在郑州部署了一个三万卡的集群,还支持十万卡扩展。技术路线直接对标英伟达的 i b。 这是什么概念呢?就是说他们的技术已经能和英伟达这个行业老大掰掰手腕了, 以后咱们国内的大模型训练不用再完全依赖英伟达的 i b 网络了,自己就能搞定。第三家是中兴通讯,大家对中兴应该不陌生, 他们做的是全站 r d m a, 还自研了定海 d p u 芯片 d p u, 你 可以理解成专门处理数据传输的芯片,和 c p u g p u 搭配起来用,能把数据处理效率提上去。他们和快手合作了万卡集群,还服务过阿里、腾讯这些头部客户,技术实力也是相当在线的, 用的也是 o c v r 路线。说到这,你可能发现了,中科曙光和另外两家的技术路线不太一样。中科曙光是真正做 ib 网络的,直接对标英伟达,而与麦新联合中心通讯用的是 r c v r 路线,虽然也是 r d m a, 但底层网络不一样, 这两种路线各有各的优势, ib 网络性能更强,适合超大规模的集群, o c v r 成本更低,兼容性更好,适合更多场景。 其实咱们国内能在这个领域取得突破真的挺不容易的,之前高端的 ib 网络和 r d m a 技术基本都被国外垄断了,咱们想用就得花钱买,还得看人家脸色。现在好了,有了自己的技术,不仅能降低成本,还能保证咱们的信息安全,不用再担心被人卡脖子。 你想想啊,以后咱们国内的大模型训练用的都是自己的网络和芯片,那发展速度肯定能更快,也更有底气。 好了,今天咱们就聊到这,简单总结一下, r d m a 和 ib 网络是 ai 训练的关键技术,国内三家企业云麦新联、中科曙光、中心通讯分别在不同路线上取得了突破,其中中科曙光是唯一真正做 ib 网络的直接对标英伟达 希望咱们国内的企业能继续加油,在更多高端技术领域实现突破。如果你对这个话题还有什么想法,欢迎在评论区留言,咱们下次再聊。

二零二六年三月十二日,中科曙光正式发布首款全站字研四百 g 原生无损 r d m a 高速网络 scale fabric, 填补国内大规模制算集群领域空白。据需,该产品从底层 ip 到上层管理软件百分之一百自主研发,性能比肩国际顶尖水平, 网卡端到端使延低至零点九微秒,可支撑十一点四万卡及制算集群,部署成本较同类产品降低百分之三十。目前, scale fabric 已落地国家超算互联网核心节点,支撑三万卡及制算集群稳定运行。 此次发布标志着国产制算网络打破海外垄断,补齐我国制算基础设施关键短板,为 ai 大 模型训练助劳算力大动脉。