全程追玩曙光发布会,直接让我热血沸腾呢!没有空洞的口号,全是扎进产业深处的干货, 彻底讲透了智算产业的底层逻辑,也让我们看到了国产高速网络终于实现了从跟跑到并行的跨越式突破。姚浪总一语中的,超算系统的效率从来不等同于风之算力。 过去咱们搞算力建设,总盯着计算芯片发力,却忽略了网络和存储这两个关键支柱,结果就是算力集群成了瘸腿巨人。大模型训练、工业仿真这些核心场景, 全被海外网络技术卡着脖子。 infini band 被垄断多年,国内只能被动接受高价慢服务,产业发展处处受制。 而曙光花三年啃下硬骨头打造的 scale fabric 全站自研方案,正是瞄准这个痛点精准出击。它详细拆解了核心底气,不光有四百 g 网卡、六十四 t 交换芯片,这些自研核心硬件,更攻克了存算传精藕合的关键技术, gpu 算力利用率直接提百分之三十,网络延迟砍半 iu, 性能暴涨二十倍。每一项数据都是针对产业痛点的精准破局。最让我动容的是,这份突破不是闭门造车。姚总提到,曙光已经完成从 cpu、 gpu 到网络交换芯片, 构建起完整的国产算力技术战。 scale fabric 更是深度适配全站硬件,不管是科研领域的分子动力学模拟,还是高端制造的工业仿真,又或是大模型训练,都能完美适配,真正做到自主可控。对比海外方案, scale fabric 没有丝毫逊色,组网规模突破十一万卡,远超传统 i b 的 五万卡上线组网成本直降百分之三十,现货可交付,复杂场景即插即用, 郑州超算的万卡集群就是最好的证明。从补齐制算短板,到打破海外垄断,再到构建自主可控的算力基座, scale fabric 的 意义早已超越产品本身。正如姚总所言,算力是能力,生态才是竞争力。而曙光用存算传一体化的硬核创新,为中国制算产业筑牢了根基,这不仅是技术的胜利,更是中国科技人不甘受制、勇攀高峰的最好见证。
粉丝15.5万获赞142.7万

这两天喷圈都在刷屏,中科曙光的 style fabric 在 发布会上,中国工程院院长吴鹤泉的致辞呢,分量极重,他直接点明了这件事的核心意义,这标志着我国在高性能计算互联领域实现了从零到一的突破,补齐了国产高速网络的短板。在 咱们得琢磨一下,就为什么院士会给予这么高的评价,因为啊,这高速网络这个东西啊,在过去很长的一段时间里,是我们算力体系里的房间里的大象。那大家都看到了 gpu 被卡,但很少有人注意到,就连接这些 gpu 的 神经系统,也就高端网络市场同样被国外巨头主导的。 那吴院士的发言里呢,有一句话是特别的关键的,其自主可控性直接关乎国家算力基建安全与发展质量。那这话说的很重啊, 你可以想象一下,就如果咱们的制算中心,从芯片到交换机,再到软件协议啊,底层全是别人的,那这不仅仅是贵的问题,更是在关键节点上,随时可能被断梁或者留后门的风险。 那这就像一个大厦的钢筋水泥啊,都是咱们自己的,但连接钢筋的焊点和螺丝是别人控制的,那这楼你说能建的踏实吗?而曙光的厉害之处就在于,他们选了那条难但对的路。 那目前呢,行业里主流的有两种搞法,一种呢,是基于以太网的 rookie, 好 处呢是兼容性好,但在超大疾巡里啊,它容易卡顿丢包,就像高峰期的高速公路,那车一多呢,就开始堵了。 另一种呢,就是 indian 版的,也就是 i b 原声路线,那这是专为高性能计算设计的赛道,那性能是极强的,但它技术门槛极高,一直是被国外控制的。 那曙光的 sky fabric 呢,恰恰走的就是后者这种原生 ip 路线。这意味着啊,它不是简单的在别人的地基上盖房子了,而是从底层的地基打起,那他们自研的一百一十二 g service ip 交换芯片网卡,那做到了百分之百全占自研, 这就相当于我们不仅修了路,连修路的压路机、沥青图纸那都是咱们自己的。那实测数据呢,也证明了这条路咱们走对了。与英伟达 ndr 相比呢,这交换机端口密度提升了百分之二十五,网卡最大 qb 数支持提升百分之百,单子网互联规模是传统 ib 的 二点三三倍。所以产业的机动那是有道理的。 skyflabric 的 发布给了我们一个选择,就当我们在建万卡十万卡集群的时候,终于可以用上咱们自己手里这条又快又稳的高速公路了。那这不仅仅是商业的胜利,更是国家算力安全的一大步啊!我是轩哥,关注我,看懂经济科技与国家发展。

有人想让我讲一下中科曙光,我刚看了一下中科曙光,他是中科院旗下的,主要是做那个高端服务器,他现在又布局了算力,前几年业绩比较稳定,就算增长也是有限,那二五年四季度突然就爆发了,净利润暴涨了百分之三百八十四, 主要原因是 skyx 万卡基群超大规模交付海关芯片的业务增长比较高, 他持有海关信息百分之二十七点四二的股权,这部分就相当于六百亿市值,是一个隐藏的情况。那三月份刚刚又发布了存在资源的四百 g 高速网络,说是对标应未达。我觉得算力业务反正接下来应该是 比较有确定性的,但是需要注意风险就是高管集中减持,也不知道是什么原因,到底是不是因为他们个人资金需求。 我觉得吧,如果是个人资金需求的话,应该不大可能是集中坚持,又是董事长又是高层高管,集中在三月至六月坚持。

美国人最近一定非常后悔为什么去年没有禁止出口他们的 nvidia 网络产品,因为就在昨天,中科曙光在福建正式发布了我们首款全站自研的四百 g 无损高速网络产品 seal fabric。 在人工智能的时代,英伟达之所以能够成为这个世界上最强大的公司,靠的可不仅仅只是他们所谓的 ai 芯片,真正让他们遥遥领先的,其实是他们的 ai 算力集群解决方案。即便是在同一个国家内部, 想要把两张 ai 芯片组成双卡集群,那也得找英伟达。想要组成一百张卡的集群,还是得找英伟达,这就是他们收取所谓 ai 加速计算税的基础。 我们现在的国产算力集群之所以一直处在被抢脖子的状态,就是因为除了单张芯片和单台服务器之外,其他的几乎都是美国人的。这其中 最重要的一块拼图就是高速网络。为了突破这项技术,中科曙光已经努力了很多年,终于在今年的三月份成功研发出了 school fabric 网络。相比国外同类型产品, real fabric 性能强,端到端时延低至零点九微秒,单个机柜待宽达到四百千兆位每秒,单个子网支持高达十一点四万张卡的集群部署。这套网络已经在国家超算互联网郑州核心节点稳定运行近十个月,支撑三个万卡级集群稳定运行, 相比国外进口的产品,成本下降了整整百分之三十。中科曙光总裁王建福表示, feel fabric 填补了国产算力系统在高速网络这一核心部件上的空白。根据工信部数据, 预计到今年年底,中国将建成四十二个万卡级别的制算集群,发展自主高速网络显得尤为迫切。中科曙光还表示,未来将继续坚持开放的态度, 联合国内上下游伙伴共同建设国产算力基础架构的产业新生态。这项宏伟目标直接挑战了英伟达。依靠 ai 芯片加网络打造的封闭生态,虽然任重道远,但至少我们已经迈出了第一步。


家人们,昨天下午我在郑州,手心里的汗就没干过,因为我亲眼见证了一场中国科技对西方垄断的绝地反杀。中科曙光刚刚正式发布了全自研高速网络 skala fabric。 可能有人问一个网络产品至于吗?太至于了,你们知道吗?现在搞 ai 大 模型卡再多,网络不行,全白搭。而这个领域的老大叫做 infine bend, 核心技术几十年被国外的 miller x 垄断,英伟达收购后,更是封死了所有路高速的 cds r d m a 隐形交换芯片,全是卡脖子的硬骨头。我们见算力中心处处受制于人, 等于命根子捏在别人手里。但今天咱们就不干了。中科院研究所的王展研究员,作为第一批拿到产品的用户,他分享了一个细节,让我瞬间起鸡皮疙瘩。 他说,他们拿到 skala fabric 后,第一时间就拿去跟英伟达的 cx 七网卡做了最硬核的头对头测试,结果怎么着?单 q p 通信性能比 cx 七还要好, r d m a right 和 send 延迟 最好成绩能做到一点一四微秒和一点四七微秒。王展研究员原话是,我记得数据比英伟达还要好一点。 这意味着什么?这意味着中国人花了三年时间,不仅把从一百一十二 g 高速 samsung ip 到四百 g 网卡芯片,再到六十四 g 交换芯片,这些硬骨头全啃下来了,而且在核心性能上直接对标甚至超越了国际巨头。 大家想想,以前我们说国产替代,总有人说能用但不好用。但今天王展研究员给出的实测数据,零点九三微秒的网卡,延时 两百六十纳秒的交换机转发岩石,这是真正意义上的世界级选,这不是追赶,这是在英伟达最深的护城河里,中国人硬生生的填出了一条路, 这不仅是补上了中国智算的最后一块短板,这是把高速网络的心脏彻底换成了中国心。为中国科研人员点赞!

工科曙光在郑州发布了 scale fabric 高速网络产品,这个消息在科技圈可是炸开了锅,你听说了吗? 我当然知道,这不就是国内首款全站自研的 i b 网络产品吗?听说已经进入量产交付阶段了,还部署在了国家超算互联网核心节点,支撑三万卡商用集群落地,这可太牛了。 没错,你说的这些只是表面的信息,咱们今天就来好好聊聊这个产品背后的技术突破和行业影响。首先得先搞清楚 ib 网络到底是什么,它为什么这么重要? 这个我知道一点, ib 网络,也就是 infinite band 的 网络,是全球顶级超算和 ai 级群的首选,全球大概百分之六十的高性能计算系统都在用 ib 架构,以前这个产业链一直被海外厂商垄断,咱们国内在这方面一直被掐脖子。 对,你说的很对,在大规模分布式训练中,网络通信耗时占比能达到百分之三十到百分之五十,网络性能直接影响算力系统的整体效率。 尤其是现在 ai 大 模型参数规模都突破万亿级了,决定算力效率的关键已经从单卡性能转向集群网络互联了。这么看来, ib 网络的重要性不言而喻啊。那中科曙光的这个 scale fabric 产品到底有哪些技术突破呢? 这就多了,首先是全站自研,从底层一百一十二 g service ip 核心芯片,到 ib 网卡交换机及管理软件,实现了百分之一百自主研发,彻底打破了海外技术垄断。这一点太关键了,意味着咱们终于不用再看别人的脸色了。 确实,全站自研可是硬实力的体现。那性能方面呢?和海外竞品比起来怎么样?性能上也毫不逊色。 scale fabric 四零零网卡,基于 pca 五点零端口带宽四百 gbps, 端到端通信时延低至零点九微秒, 交换机单端口八百 g d p s, 整机交换容量双向六十四 t d p s, 交换时延约两百六十纳秒。和英伟达 n d r 相比,交换机端口密度提升百分之二十五,网卡最大 q p 数支持提升百分之一百, 单子网互联规模是传统 ib 的 二点三三倍,可支持最大十一点四万卡集群部署。哇,这性能提升的不是一点半点啊,那成本方面呢?有没有什么优势? 当然有,网络总成本叫市面 ib 方案降低约百分之三十,这对于大规模部署来说能节省不少开支,而且稳定性也非常好,基于信用的无损留控机制,从根源规避庸色丢包风险,链路故障恢复时间小于一毫秒, 已经支撑近万卡集群稳定运行,验证超十个月了,这稳定性也太让人放心了。看来中科曙光的这个产品确实是下了大功夫。那它的落地应用情况怎么样? 目前已经在国家超算互联网核心节点郑州部署了三套万卡级 scalex 智算集群,总规模三万卡, 这个平台已经服务了一百多万用户,应用商品超七千三百个,单日处理作业峰值一百零三万个,累计支撑一点九六亿次作业,还完成了适配优化四百多个主流大模型与世界模型, 这应用规模可真不小,看来已经得到了市场的认可。那中国工程院院士乌赫全对这个产品有什么评价吗? 乌赫全院士指出, scale fabric 是 国内首款全站自主研发的四百 g 原声 r d m a 高速网络系统,性能对标国际主流,且经规模化实践验证,补齐了国产高速网络的短板,这可是非常高的评价了。 是啊,这说明 scale fabric 确实是一款非常优秀的产品。那它的战略意义和对中国 ai 产业发展的深远影响是什么呢? 战略意义可太大了。首先,它打破了海外厂商在 i b 网络产业链的垄断地位,解决了国内制算基础设施的卡脖子问题,让咱们在高速网络领域有了自主可控的技术和产品,这对于保障国家信息安全和产业安全来说事关重要。 没错,自主可控才是硬道理。那对 ai 产业发展的影响呢?对 ai 产业发展的影响也是长远 的。随着 ai 大 模型的不断发展,对算力和网络的要求越来越高, scale fabric 的 高性能、低成本和稳定性能够为 ai 大 模型的训练和部署提供更好的支持,提高算力系统的整体效率,降低企业的运营成本, 这有助于推动中国 ai 产业的快速发展,提升中国在全球 ai 领域的竞争力。你说的太对了,有了这样的技术支撑,咱们中国的 ai 产业肯定能迎来更好的发展。而且这个产品的量产交付也意味着国产高速网络已经从实验室走向了市场,开始真正服务于实体经济。 没错,这只是一个开始,相信在中科、曙光等国内科技企业的努力下,咱们在更多的关键技术领域都能实现自主可控,打破海外垄断,推动中国科技产业不断向前发展。今天咱们就聊到这里,感谢大家的收听,咱们下次再见。再见!

圈内的朋友们,今天必须炸一波,咱们熬了这么久的大模型万卡训练网络困局终于被彻底打破了!就在刚刚,中科曙光 skill fabric 高速网络正式发布,直接给智障行业扔了一颗重磅炸弹。做过大模型训练的都懂, lucy 方案在千卡级还能应付,但规模一上去,基于 pfc 的 流控就容易波动, 参数调优全靠手艺人贷款利率往下掉,算力红利,被通信号时一点点铲食。另一边, id 方案性能虽好,但技术攥在别人手里,想掉底层 没门。这局面苗维部长看的透彻。三月十一日,人民日报发文强调,我们正在通过超大组网、高速互联和统一调度这些工程创新,在集群层面实现算力跃升。 话翻译成大白话,就是单点芯片的差距,我们用系统级的协调能力来补。别人的封闭生态,我们用开放架构来破。而今天正式亮相的中科曙光 skill fabric, 正是这套思路的集大成者。作为国产全站自研的原生无损 r d m a 高速网络, skill fabric 从芯片到软件,百分之一百自主可控 单子网轻松支撑超十一万卡扩展,端到端时延低于一微秒,转发时延仅两百六十纳秒。这些参数放在国际市场上,就是对标顶尖 id 的 水准。但比参数更重要的,是它的开放架构底色。 skill fabric 支持多品牌硬件混合部署,不绑死任何一家芯片,真正实现了苗圃所说的兼容主流。 这意味着,不同架构的芯片都可以在同一张高速网上协同跑起来。芯片可以百花齐放,但网络这张大动脉必须是自主开放无损的。 更硬核的是,这套方案不是 ppt, 已经在国家超算互联网郑州核心节点完成三万卡商用部署,服务上万用户,近百家科研院所累计运行作业超十万次。 实打实的规模化验证,把系统级能力从纸面落到了地上。以前我们纠结选 rookie 还是 ip, 本质是在性能和自主之间二选 一。现在 skill fabric 把这道选择题彻底废除了。性能对标国际顶尖架构,全面开放兼容国产芯片想上十万卡集群这张网,接着算力大动脉通了国产 ai 基础设施的团体赛才刚刚开始。

三年磨一剑,中科曙光 sky 发布,这个发布补齐了国产算力的最后一块拼图,高端计算循环成型。这次发布份量极重,因为它不仅仅是一款产品的问世,它更标志着国产高端计算体系真正的打通了任督二脉。 细看曙光的布局就会发现,从高性能计算到 ai 大 明星训练,最核心的三要素,算力、存力、网力。它们已经在每一个维度上都对标国际巨头,形成了完整的自主技术。循环。 算力层面有近末夜冷算力底座,让芯片释放极限性能。存力层面有帕萨斯尔,分布式存储,吞吐效率全球顶尖。网力层面就是今天的主角 skill fabric, 补齐了那张让整个行业等待了多年的高速网。 以前我们总说 ai 算力的命门是 gpu, 是 芯片,但今天我要告诉你,当集训规模充到了十万卡,真正的命门其实不在 gpu, 而是在那根不起眼的网线上。 过去算力再强,存力再大,如果网络不通不稳,那这三者就是一盘散沙。只有把这张网攥在自己手里,才算是真正拥有了高端计算的完整话语权。 以前这条路只有两条,一条是 lowkey, 便宜灵活,中小规模玩的转。但到了万卡级,动态时延和优色控制,就有点像在高速公路上开手动挡,不是不行,就是得时刻盯着调着。 另一条是 ib, 也就是尹菲利贝,这东西好原生为超算而生,低延时真无损,是十万卡级群的标配。但问题是,这么多年, ib 的 技术和产品一直被海外攥在手里,咱们想进大级群,要么就在别的路线上修修补补, 说白了,高端 i b 网络一直是国产算力体系里那块最疼的拼图,始终没补上。但今天,曙光这面硬钢搞了三年,拿出了 scale fabric 这个纯原生的 i b 方案。 咱们看数据, scale fabric 四百,网卡通讯十元,低到了零点九微秒。 scale fabric 四百,交换机交换十元,约二百六十纳秒,这是什么概念呢?数据从这头到那头,几乎就感觉不到时间的流逝。 交换机单端口再宽达每秒八百 g, 整机交换容量可达双向每秒六十四 t, 这直接领先了当下主流的二百 g 不 止一代。当算力、存力、网力这三块拼图严丝合缝的拼在一起,意味着什么呢? 意味着咱们的国产算力从底层硬件到顶层调度,终于有了一套完全自主且性能对标国际巨头的完整体系。以前咱们可以硬气的说,这叫同台竞技, 曙光这次补上的不只是一个产品,而是让国产 ai 算力有了一条真正属于自己的专属高速路。为了这份沉得住气的突破,必须得点个赞!

大家好,我是瑞特老张,终于官宣了啊!今天,中科曙光正式发布了国产首款的原生 i b 无损网络,叫 skill fabric, 动静特别不小。为什么呀?啊?因为这意味着,国产高端计算在算力、存力、网力三大核心领域完成了对国际巨头的全面对标,据事件自主可控,并且由中国曙光亲齐。 讲真,高端网络一直是国产体系,尤其是算力体系中的芯片突破了,服务器突破了,但十万张卡的集群命门其实是在那根网线上。过去因菲尼帕的技术被海外攥在手里面,想建大集群,得按别人的规矩来,核心技术不开放,咱们 爱被动。曙光的接法是正面硬钢,从底层一百 a 一 十二 g 的 search ip, 到交换芯片网卡,再到上层软件平台,百分之百全占字眼单子网支持十一点四万卡, 是主流 a b 产品的二点三三倍。这意味着国家超算互联网这样的工程,可以把全国的算力中心连成一张网,算力真正流动起来。 为什么说这是闭环最后一步?因为高端计算需要体系作战,这家公司在算力上有近末夜冷底度啊。在存力上有全球超算存储的榜单常客 power store 啊。如今算力和网力上算存网铁三角成型啊!国产高端计算终于有了完整的自主体系, 全站字眼,从底层的一百一十二 g 的 搜索 ip, 到交换芯片到网卡,再到上层软件平台,百分之百自主可控, 这意味着什么?哎,这意味着,以后建十万卡集训,我们不用再看任何人的脸色,从芯片到网络,全是咱们自己的东西,尤其值得一提的是扩展能力单子网支持十一点四万张卡,是主流 ip 产品的二点三三倍。 这意味着什么?意味着像国家超算互联网这种级别的工程,可以真正把全国各地的算中心连成一张网,算力调动动输得出,不再是信息孤岛、算、存网三个维度一旦打通,算力资源才能真正像水电一样流动起来。还有一个设计坎肩功力,它 实现了超算和制算的融融合合适配啊,一套网络,两种场景都能打,以前那种建一个中心就能搭一张网的局面可以翻篇了。这对于降低整体建设成本、提升算力利用效率都是实打实的价值。 从算力芯片到高速网络,国产 ai、 算力全链条,四种可控的拼图,今天终于完整!算力、存力、网力三箭齐发,国产替代!正在从跟跑走向并跑,被曙光这次硬桥硬马的突破点赞!好,今天就到这,我是瑞卡老张,关注我,带大家看中国科技的高度和温度,再见!拜拜!

大家有没有想过,当我们在为国产算力芯片的每一次突破欢呼时,却可能忽略了另一个同样致命的卡脖子环节。就在今天,三月十二号,中科曙光在郑州投下了一枚重磅炸弹,正式发布了国产全站自研的四零零 g 高速网络产品 scale fabric, 并且直接宣布在国家超算互联网核心节点实现了三万卡的商业化集群落地。这不仅仅是一个产品的发布,这宣告了中国在 ai 算力的最后一块短板,高速互联网络被正式补上了。 其实逻辑很简单,大家想一想,万卡集群,甚至十万卡集群,把几万个芯片连在一起干活,靠的是什么? 靠的就是网络。这就好比你要指挥三万人协同作战,如果没有一个高效的指挥部和通信系统,那场面得多混乱。在 ai 大 模型训练中,网络通信耗时占比高达百分之三十到百分之五十。 过去,这个领域被英伟达的 infiniti band, 也就是我们常说的 i b 网络绝对垄断,它不仅贵,更是把国产算力锁死在单体性能的天花板上。 这意味着什么呢?意味着就算我们有了一流的国产 gpu, 如果连不上,连不好,算力集群的效率就会大打折扣, 就像堵在路上的超级跑车。但今天,中科曙光这个 scale fabric, 从底层的一百一十二 g cirrus ip, 到交换芯片网卡,再到软件百分之一百,国产更能全面对标,甚至部分超越了英伟达的 ndr 产品,端到端食研,低至零点九微秒。 更重要的是,它已经在郑州的核心节点撑起了三万卡的商用集群,而且成本比国外方案降低了百分之三十, 这不仅是能用,而且是好用、划算。国家超算互联网这个国家级工程,选择它就是对它稳定性最好的背书。那么这条算力大动脉被打通之后,产业链的机会在哪里呢?首当其冲的就是中科曙光本身, 作为核心参与者,他的算存网协调能力将形成更深的护城河。其次,这张网铺开,会直接拉动上游的国产光芯片、光模块需求。大家记住,高速网络跑起来,光电转换是关键, 像光讯科技、华工科技这些在高端光模块有布局的公司,有望迎来新的增长曲线。另外,既然网络瓶颈被打破,大规模算力集聚的建设将加速,这会直接利好国产算力芯片的放量, 比如海光信息、韩五 g 这些,以及为他们做配套的 pcb 和服务器厂商,比如深南电路、浪潮信息等,整个国产算力生态都被激活了。最后,我们得深度思考一下, 二零二六年是十五五的开局之年,也是人工智能从百魔大战走向千行百业落地的关键一年。当中科曙光把这张高速网铺进国家超算互联网,它其实是在干一件修路的事儿, 当路通了,而且是自主可控的高速路,未来跑在上面的,无论是大模型还是具身智能,才能真正的车水马龙,这才是我们今天这条资讯背后最令人振奋的底层逻辑。

所以我们今天这个发布会啊,可能不是一个这个产品的预发布,我们是实打实的可以这个量产的这个交货。然后同时呢也经过前面几个月的这个验证啊,我们也 有有更多的信心,然后能够保障我们的产品在各种复杂的这个场景里面,这个,呃,即插即用的这个能力。

现在的这样一个传,或者说传统的超算系统的话,它对于支持我们智能科学智能的这种用,尤其我们刚才的分子光学模拟的应用不够好,对吧?所以我说我们想去做一种新的机器,用新的芯片, ok, 刚好我们这个曙光的 skill fabric 这个产品就发布出来,我们就第一时间拿到了,放到我们这个系统当中去用。因为我们是 ib 的 话,我们一开始就定位就是要去,要去比,因为拿了 cx 自己我们国产的这样 ib 的 这个网卡的话,在宽带性能上不比他弱,对吧?甚至还单 q p 还比较强一些, ok, ok, 你 可以说明它的这个转发延迟基本上就是在在二百五五十五个纳秒左右,对,它和这个英伟达的这个 i b 的 这个交换机是基本上相当的。