今天我给大家看一下,我们这一台价值三十个 w 的 一台超威的八卡的英伟达显卡的一台服务器,到底是一个什么样的配置啊?那现在我们这台机器已经是在跑这个呃磁盘阵列了,因为这个机器组了两组的磁盘阵列,一组是 系统的实盘阵列,一组是数据的实盘阵列,它分了两组。那我们来看看机器,我们已经开机了,这个声音其实是很大的,那我们这一台是 cpu 是 用了英特尔志强的,它用了两个 cpu, 两个 cpu 一 起跑啊,这个是六三三零的一个金牌的 cpu 来的,用了两颗内存条是用了六十四 g 乘以八,就是五幺二 g 的 内存条。然后硬盘的话是组了两个十盘阵列,系统盘是两 k d 乘以二,然后数据盘的话是五个做了锐的五的,那系统系统盘是做了锐的一的。那你像我们这样的一台整机,它搭配的英伟达的显卡是我们这一个, 还有二零的一个四十八 g 的 一个英伟达的专业显卡,这显卡都是没有风扇的,所以我们在打开的时候,现在这个温度是比较高的了,我们一会录完了就马上把它盖起来了,一会要不把它给弄烧了。这个外观其实是跟 一百 h、 一 百这些外观都是一样的,这种专业的显卡,然后这个吹风是往这边出去的,后面的有四个两千瓦的电源。那你像我们这里还有个小细节,这里是加了一个 阵列卡的,那这个机器除了加阵列卡之后还可以加什么卡呢?加个采集卡,加个网卡都是 ok 的 啊,它还有空间可以可以去做扩展的,包括我们的内存槽也是可以扩展的。你看我们的内存槽还有槽位可以加啊。然后这几个是八个暴力风扇,这个机器一旦跑起来 是噪音比较大的,他不能放在办公室里面,他只能放在机房机柜里面去。所以像有兄弟想要了解服务器,了解工作站的,你不懂配置不懂方案的可以私信我们或者你的工作站。呃,服务器遇到问题的可以私信我们,我们可以给你技术支持。好不?感谢支持。
粉丝2032获赞5160

你敢信吗?现在中国市场上一台英伟达 b 三百服务器已经被炒到接近七百万人民币。注意,不是一整排机柜,也不是一个小型机房,就是一台服务器。那很多人肯定会问,这东西到底凭什么这么贵? 我们先看参数,一台典型的 b 三百服务器,里面不是一张显卡,而是八颗。 b 三百 like vivo ultra gpu, 每颗 gpu 最高配两百八十八 g 字节 hbm 三 e 显存,八颗,加起来就是二点三太字节级别的 gpu 显存什么概念?以前很多人觉得 h 一 百已经很猛,但 h 一 百单卡显存通常是八十 g 字节 八卡,也就是六百四十 g 字节。而 b 三百这一台显存直接拉到二台字节以上。这对大模型推率非常关键,因为模型越大,上下纹越长, 并发用户越多,最先卡住的往往不是算,而是显存。再看性能, d g x b 三百官方规格显示,整机可以做到 f p 四推理一百四十四 p f l p s f p 八训练七十二 p f l p s, 并且配备第五代 nv link, 整机 nv link 聚合贷款可达十四点四泰字节每秒。这句话翻译成人话就是,它不只是算的快,而是八颗 gpu 之间传输数据也特别快,这点非常重要,因为大模型不是把一张卡插上就能跑完的, 很多时候模型要拆到多张 gpu 上一起跑,如果 gpu 之间通信慢,就会出现一个很尴尬的情况,显卡很强, 但彼此等数据性能发挥不出来。所以 b 三百贵不只是贵在 gpu 本身,而是贵在大显存、高带宽、多卡互联、推理吞吐 这一整套能力。再跟 b 两百对比一下, d g x b 两百同样是八卡系统,总显存是一点四四 type 值,而 b 三百可以做到二点一 type 值到二点三 type 值。也就是说, b 三百相比 b 两百,最大的提升不是纸面 f p 四峰值, 而是显存容量更大,更适合大模型长上下文和高频发推理。这也解释了为什么现在市场抢的是公三, 因为 ai 行业已经从训练大模型进入到推理变现阶段。你每次打开一个 ai 应用,问一句话, 生成一段代码,做一次图片理解,背后都在消耗 token, 用户越多, token 越多,服务器压力就越大。对 ai 公司来说, b 三百不是玩具,也不是面子工程,它是生产工具,只要能把推理成本打下来, 把病发能力拉上去,这台机器就有可能帮他赚钱。但问题来了, b 三百现在不能正常进入中国市场,美国出口管制卡住了正规渠道, 渠道又被查的越来越严,所以中国市场上的价格已经不是按硬件成本定价,而是按稀缺程度定价。这就是为什么美国市场大概五十五万美元一台的机器,到了中国可以被炒到接近一百万美元,也就是大约七百万人民币。这里面包含的不只是硬件钱, 还有渠道风险、合规风险、售后风险,以及最关键的现货溢价。更现实的是,很多公司买不起就开始租一台 b 三百,月租可能就要十几万,甚至更贵。 这说明什么?说明中国 ai 市场现在最缺的不是故事,不是 ppt, 而是真正能跑大模型,能跑高并发,能把 tucker 成本压下来的高端算理,所以这条新闻表面看是一台服务器被炒到七百万,但本质上 它反映的是三个趋势,第一,高端英伟大算理在中国会越来越稀缺。第二, ai 公司会越来越重视推理成本,而不是只盯着训练。第三, 国产 ai 芯片会迎来机会,但短期内英伟达生态仍然很难让开。最后一句话总结, b 三百贵不是因为它只是一台服务器,而是因为在今天的 ai 市场里,它代表的是一张通往高端推理算力的门票。

今天带大家看一下 ai 超级服务器,英伟达 d g x b 三零零现在看到的是设备刚刚到达数据中心的画面。整机采用工业级运输包装,重量接近半吨级别, 从落地开始,每一步都需要专业工程团队配合。完成拆箱之后,可以看到整机是标准数据中心机架形态,这不是普通服务器,而是一台专为大模型训练打造的 ai 超级计算系统。整机高度达到十六, 内部搭载八张 blackwell ultra gpu, 拥有超过二 t b 的 gpu 显存,单机即可支撑超大规模模型训练与推理。接下来进入最关键的步骤,上架 工程师使用升降设备将整机精准推入机柜,并完成滑轨固定与安全锁定,这一过程必须保证毫米级对齐,因为整机功耗接近十四千瓦,对供电与散热都有极高要求。 随后进行电源与高速网络连接, b g x b 三百支持八百 gbs 高速网络,专为 ai 集群与数据中心互联设计。 完成上电后,这台 ai 超级计算机正式加入我们的算力集群。

今天给律所粉丝落地这套 ai 大 模型,服务器已经准备发走了。粉丝之前试过各种在线 ai 工具,要么上传卷宗担心泄密,要么分析不专业容易出错,所以 ai 转型一直卡在原地,但又怕掉队,焦虑的不行。手上金融案、行案卷宗堆积如山,以前想梳理案情,得律师通宵熬夜阅卷,眼睛都得瞎。 关键是客户机密案卷绝对不敢上传云端数据,安全红线完全碰不得。我给客户现场演示了一下,向客户卷宗转账流水合同模板 全部一键导入,证据要点自动提取,时间线自动梳理,证据矛盾自动排查,无效材料自动过滤,最后直接生成阅卷、摘药和庭审思路,还能建立律所私有知识库,历史叛逆常用法条、所内规范全部存在,本地一句话提问 直接给出精准参考,对其他同行律师而言,堪称降维打击。更强大的是,这些机密数据全在你自己手里,完全不用担心泄露问题。从硬件配置、模型部署、私有知识库搭建,到后续系统优化升级,全年陪跑。现在做律师,用本地 ai 实现安全、高效、合规的办案,这已经是主任的必备眼光了。

英伟达的 b 三百,不管是别人报你五百万还是六百万,我现在教你一个方法,拿到任何的报价单,五分钟内算出他的真实底价。先看两 tb 版本,商家报五百六十万,核心溢价在十六条的一百二十八 gb 内存,最优解是 选择丐版的服务器,加装三十二条六十四 gb 六十零的内存条,成本可以到五百三十九万,同样是两 tb 容量加装方案,成本直接降了二十一万, 不要再迷信原厂自带了,买的就是这二十一万的信息差,同样配置能省二十一万,就问你香不香?如果你确定需要三 tb 能量呢?三 tb 的 超微服务器标配五百八十万是原厂的行情, 如果你要性价比,四百八十万到五百万是目前三 tb 的 代版的拿货底价,低于这个价基本没现货,不要想着怎么捡漏了。 至于说非四 t b 不 可的老板们,目前核算价是六百一十二万,下周大概率会突破六百二十万, 现在的行情,四 t b 最高就是给炒家挣杀头钱。记住了,报价差一百二十万,不是配置差,是你的信息不对称,下一期老彭会告诉你,按你的需求到底该选哪一款,怎么跟商家谈。我是老彭,关注我,下期教你三步锁定最优配置方案。

今天给大家带来一台狠货,超威的 b 三百 ai 服务器的顶流性能天花板。这台机器内置八片,过来必有欧尚核心,整机八 u, 光散热就有四 u。 cpu 模块单内存 ddr 五九十六 g, 整机满插三十二个内存,大家可以算算光内存有多少 g。 冷知识 b 三百对机房供电机柜散热要求极高,普通机房根本带不动。看看这个电源模块,六千六百瓦满功耗, 整机满载一小时要用四十度电,这也是他只面向专业算力中心的原因。目前市场现货极度稀缺,期货排队周期长,超微原厂整机更是一级难求。当前市场行情超微 b 三百满配现货约含税价三百八十万到四百二十万,期货略低,弹药等数月。 现在让我们给这台机器上电,听听机器启动的咆哮, 现在能拿到就是抢占算力先机,无论是自建集群还是算力租赁,都是当前最具价值的硬核资产。关注 it 梦想家,带你了解不一样的硬件世界!

现在中国市场上,一台英伟达 b 三百服务器已经被炒到接近七百万人民币。注意,不是一整排机柜,也不是一个小型机房,就是一台服务器。很多人纳闷,一台服务器而已,凭啥这么贵? 其实核心就一个,它的配置拉满了。一台 b 三百里装了八颗专门的 ai 芯片,每颗芯片自带的显存就有二百八十八 g, 八颗加起来足足有二点三 tb, 相当于几十台普通电脑的内存总和。 这就好比普通 ai 芯片是小仓库, b 三百芯片就是超大物流仓,能一次性装下海量数据,不会出现装不下转不开的情况。除此之外,这台服务器不仅干活快, 八颗芯片之间还能无缝沟通,就像一个团队,每个人都很能打,而且配合默契,不用互相等消息,效率直接拉满。要是芯片之间的沟通慢,就好比一群高手,各干各的,再厉害也发挥不出真实的实力。而 b 三百就完美解决了这个问题。 和上一代产品相比, b 三百最厉害的地方就是写存更大了,能装下更多的数据,处理更复杂的 ai 任务,比如常文本对话、多图识别。现在 ai 已经不是实验室里的摆设,而是我们日常能用的工具,每一次问 ai 问题,让它写代码 都需要服务器处理,用的人越多,对服务器的要求就越高。 b 三百就是能扛住这种压力的主力工具。它之所以能炒到七百万,关键不是硬件本身贵,而是它太少了,因为外部限制,正规渠道进不来,货 物以稀为贵,价格就被炒上去了。原本国外卖五十五万美元的机器,到国内翻了近一倍,还得承担各种风险。很多公司买不起就只能租,一个月就要花十几万元。这背后其实藏着三个简单的趋势,第一,这种高端 ai 服务器会越来越少,越来越稀缺。第二, ai 公司不再只追求能做出模型,更在意用起来省钱高效。第三,国产的类似服务器会有机会,但短期内还是很难比得上 b 三百的好用程度。

英伟达的 b 三百,从建议液冷到 logo 的 新品,要求是前置液冷,这已经不是建议,而是百分之百的绝对要求。为什么会说的这么绝对?这还不是因为达一家的事情,连谷歌的第七代 tpu 算力越高,能耗越高,功耗直接撑到了九百八十瓦。大厂的分享在这里,散热方案必须升级。 叶冷是大厂的选择,但是真小型公司要不要跟进?我给你三个判断维度。第一,回本周期只想跑半年,一年回本的选分冷,打算跑三五年的,长期主义的选叶冷,硬件更耐造,算力更稳。 第二,芯片的根号,芯片根号在三百五十瓦以下的无脑选分冷,省心又省力。当你的芯片的根号撑到五百瓦到一千瓦,比如说刚才说的 tpu 的 v 七或者是 b 两百,首选是液冷,风冷根本就压不住。那第三,部署的规模如果说只有三五台服务器,就不要配液冷了, cdu 的 冷却系数加上运维的人工费,能把你拖死。但是如果你有二十三十台以上,液冷的长期优势就出来了,主要还是看你的应用场景。 回本周期短芯片跟号梯规模小,那就选分冷。长期主义芯片如果是高冷号,规模又比较大,首选是业冷。如果说你正在选择和了解业冷方案,可以在评论区说说你的情况,我来帮你分析到底适合哪一种方案。我是老冯,关注我,看懂趋势,抓住机会!

英伟达全新一代入门平台即将首发量产,究竟谁能真正吃透这波算力红利?当市场焦点还停留在过往机型时,二零二六年的出货主力早已暗中切换, 这背后藏着怎样的产业真相?从服务器、整机到 pcb 版,乃至电源模块,各大核心厂商的真实份额分配,又将揭开哪些被掩盖的预期差?英伟达的代际交替正在重塑产业链格局。工业复联在英伟达业务中的份额已超过百分之五十五, 深度参与了多个待机的核心平台,市场共识往往容易忽略产品线的精准切换节奏。根据产业真相, 英伟达二零二六年服务器出货量预计接近三十五万台。传统的 g b 两百系列主要是为了处理存量订单,预计在二零二六年第一和第二季度就会完成交付并结束生产。真正的核心增量环节在于三百系列, 这也是二零二六年的生产主力,因为达全年总出货量预计接近十万个基轨,而工业复联预计全年出货五万多个基轨,在这个系列产品中占据超过百分之七十的核心地位。至于备受瞩目的如饼平台,其底层逻辑与前代产品截然不同,如饼的复杂度相比之前呈现几何级数增长, 生产并非简单附用现有产线,单价极高。台给出的指引量约为二三零零零台,预计在二零二六年第三和第四季度开始生产。工业复联作为首发供应商, 预计将占据百分之八十至百分之九十的份额,实际拿到的订单预计在幺零零零零台左右。扶贫平台的成熟和稳定出货预计在二零二六年第四季度,届时将开始向北美核心客户进行小批量交付,而真正的规模化放量预计要等到二零二七年第一季度或第二季度。从价值量补货的层面来看, 代工的利润池正在发生演变,纯粹的整机组装业务毛利率大约在百分之五至百分之七,但如果能切入自产的关键零组建,综合毛利率就能提升至百分之十几。 目前,工业复联已经通过英伟达认证并供货的自研零部件,包括液冷快接头、部分电缆以及铝制机构件等。除了英伟达,其他云服务商的需求同样是重要的市场主线。在亚马逊的业务中,工业复联占据主导地位, 市场份额超过百分之五十,主要负责 l 十一的组装业务,而唯一的份额大约在三十到四十个百分点。对于谷歌的业务,天虹一直扮演着总包和协调者的角色。目前工业复联计划参与谷歌 tpuv 八的制造,希望成为其核心的一级供应商, 主要以组装业务作为切入点。 v 八预计将在二零二六年开始生产并有出货计划,二零二七年有着千万颗级别的出货目标继续降为拆解硬件核心增量环节。 印刷电路板和电源模块的供应商格局存在着明显的预期差。在 g b 三百的计算托盘电路板供应中,圣红占据约百分之四十至百分之五十的份额,盆顶份额约为百分之二十至百分之三十, 景旺约占百分之十,方正的份额在个位数。在交换托盘电路板方面,方正的份额可能达到百分之三十多,圣红约为百分之二十左右, 户电的份额在百分之十几。到了 ruibing 平台的测试阶段,中板的电路板供应商依然以盛宏为主,彭鼎也是一个重要的供应商,户电和深南电路等厂商也都在测试名单中。电源领域,谷歌电源的主要供应商之一是欧路通, 其份额有望达到百分之五十以上,因为达也在推动电源等部件的标准化,要求供应商的产品能够实现平替。这位符合新标准的供应商如欧陆通提供了很好的进入机会。最后需要进行客观的风险提示。季产业的迭代速度极快, 产品量产进度可能受到技术验证和供应链瓶颈的质疑,各大厂商的实际订单落地情况以及市场份额的最终分配。投资者应保持理性,切勿盲目追逐短期热点, 需密切关注宏观经济环境以及企业才能爬坡的真实兑现风险。

我们避开拥挤的高位赛道,要紧盯这两大细分方向。英伟达新一代服务器硬件迭代征服远超预期, pcb 和 mlcc 迎来了爆发式的增长,其中电路版的价值 从三万五千美金飙升到了十一点七万美元,涨幅高达百分之二百三十。板材的层数全面升级,用料的规格呢,加了档次,增加了多层核心板件。单机的硬件价值大幅飙升, m、 l、 c、 c 价值同步大涨了百分之一百八十二。单台的用量 普通服务器的十到十五倍,整机柜搭载量达到了四十四万颗。高端产品涨价最高达到了百分之三十五,供货周期拉长到了半年,缺口持续扩大。而光模块呢,现在已经出现了严重的内卷,存储芯片的估值已经提前兑现。而 pcb、 mlcc 目前的涨幅并没有那么大, 市场认知还不足,已具备极大的预期差空间。大幅增长的数据验证了产业的红利已经到来。我们避开拥挤的高位赛道,要紧盯这两大细分方向,充分把握这轮算力服务器升级带来的实质性投资机遇。

英伟达市值疯涨十二倍,你知道为什么吗?从二零二三年初三千六百亿美元,到二零二六年四月的四点三万美元,疯涨了百分之一千一百八十三年前投英伟达十万,现在变一百二十八万。英伟达疯涨的原因你可能不知道, 竟是 gpu 下面那块电路板 hdi。 为什么 ai 服务器非要用 hdi 板? ai 服务器里 gpu 和 hbm 内存之间要高速交换数据。传统电路板的线路太粗,间距太大,信号跑不快,还会互相干扰。 hdi 版的线路能做到头发丝那么细, 信号传输路径短,损耗小。这就是为什么英伟达、 amd、 谷歌都在抢 hdi 的 产能。普通服务器 pcb 层数只有八到十六层,线宽线距零点一到零点二毫米。英伟达 ai 服务器 hdi 层数五十二层以上,线宽线距零点零七五毫米以下。头发丝那么细,全球能做好的厂家一只手数得过来。它的制成难在哪?三点,第一,微孔比头发丝还细, 激光钻能量高,一毫米孔壁就糊了。第二、五十二层板子压在一起,每层伸缩几微米,对,不准全废。第三,材料从 m 七升级到 m 八,再到 m 一 零,越来越贵。但所有大厂都在抢 h d i 产能,为什么?因为 ai 算力每升级一代, p c b 就 要跟着升两代,这块市场还在爆发。 h d i 以后会不会完全替代 p c b? 聊聊你的看法。

一张英伟达的五零九零显卡,国内很多时候要卖到三万左右,要搭一台本地的 ai 工作站,可能需要三十到四十万。一台 b 三百的服务器,国内的售价可能要六百万左右,他们都能跑 ai, 但为什么价格差了这么多? 差的不只是 gpu 算力、显存的容量、宽带系统规模和成本结构是完全不一样的。 rt 叉五零九零用的是 g ddr 七,能跑本地 ai。 rt 叉 pro 六千用大容量的 g ddr 七更适合企业的本地部署。但 h 一 百比两百这种数据中心级的 gpu 必须用到 hbm。 所以 这一篇我们就讲清楚一个问题,同样是跑 ai, 为什么普通显卡用 g ddr, 而 ai 服务器要用 hbm? 首先我们了解一下 ai 的 任务是怎么跑下来的, 不管是本地跑 ai 还是云端去租算力,但本质上的工作流是一样的,哎。模型和数据先存到硬盘里,然后再加载到内存和现存,最后交给 gpu 去计算,哎。所以很多人本地跑 ai, 最先卡住的不是硬盘,而是显存不够,所以模型放不下,或者说它能跑,但是速度很慢。 到了 ai 服务器呢,流程是类似的,但规模完全就变了。这里的重点变成了 hbm, 能不能持续把数据喂给 gpu 啊?因为大模型训练和推理要反复读写模型的参数,中间结果和 q v cash, 如果 hbm 贷款不够, gpu 就 会等数据,那 gpu 一 等算力就跑不满,哎。所以总结一下,本地 ai 用 g d d r 为 gpu, 那 ai 服务器呢?用 hbm 为 gpu, 那 算力租赁也是这个逻辑。你以为租的是一张 h 一 百,那实际租的是一整套 gpu 的 服务器资源。理解了 ai 任务怎么跑,再来看显卡就容易的多了。那不同类型的显卡,它本质上解决的是不同场景下数据供给的一个问题。 那我们先看一下离普通消费者最近的消费级显卡,比如 rt 叉五零九零,它主要服务的是 g d r 七,它的规格如下, 这个规格书已经吊打所有的产品了,但消费级的显卡不能只对性能,还要考虑价格、功耗、散热体积和量产成本。所以五零九零用 g p d 二 g, 不是 因为性能不够强,而是因为对于消费级显卡来说,五零九零已经在性能、 成本和硬件上取得了一个平衡。再看看专业级显卡,比如说 r 六十 pro 六千 blanc wheel, 它也是 g t d r 器,但它不是游戏卡,它面向的是建模、渲染、仿真、工业设计、专业 ai 的 大模型。看了它的规格后,你会发现它和 r t 叉五零九零带宽接近,但显存容量从三十二 gb 拉到了九十六 gb, 还带 e c c 纠错。这说明专业卡的重点不是游戏帧数,而是大项目要放得下,长时间要跑得稳,专业软件兼容要更好。比如有的企业工作设计保密数据, 不能把资料放到云端,就会选择本地部署模型,用四张二零一七 pro 六千的这种专业卡,搭一台本地的 ai 工作站,给几十个人日常使用人机会做到三四十万的级别。这个方案不便宜,但它解决的是数据不出门,模型本地跑多,人日常推理成本还能接受的这种场景, 到了 h 一 百、 h 二百 b 二百 b 三百这种数据中心级的 gpu, 那 问题就完全变了,它不是给个人电脑用的,它服务的是大模型训练推理,多 gpu 机群、算力租赁。哎,这时候核心不是单机体验,而是待宽,数据吞吐 啊,并发和算力利用率。给你一张很直观的数据对比表,你就能看到一个趋势,消费指数看性价比,专业级看容量和稳定, 数据中心看贷宽和吞吐。这个时候聪明的你应该看出来了这些产品的主要差别,一个是显存的容量,还有一个是显存的贷宽。那问题来了, h p m 老说的高贷宽,高到底高在哪儿?为什么 ai 服务器会这么依赖它?显存贷宽的 计算公式其实很简单,它等于显存速度乘以显存未宽的除以八。我们拿高速公路去举例,那显存未宽呢?这个五百一十二位,你可以理解成 高速公路有多宽,这里的数字越大,代表它数据的供给能力就越强。那二十八 g b p s 这种参数可以理解成每条车道上的车速,它代表着每一个显存引脚的数据传输速度,数字越大,每条车道的最高车速就越快。 那这么说来,而一叉五零九零就是二十八 g b p s 乘以五幺二除以八,大概就是一点八 tb 每秒的传输速度。去看看你自己的显卡,它的显存位宽是多少, 就知道为什么五零九零的卖这么贵。那再回到 hbm, 一 两百的速度,它的数据传输大概是每秒八 tb, 它的单条车道的速度其实没有 gdp 那 么夸张,但是它的显存微宽是很大, gdp 和 hbm 最大的区别是 gdp 靠高频, hbm 靠超宽的 微宽。前者向车速很快的高速路,那后者向车道特别多的高速网络。大模型需要的不是一条快车道,而是一整片的高速网络大模型需要的不是一整片的高速网络。 所以这篇讲清楚一件事,它俩不是谁代替谁,而是对应着不同级别的 ai 任务。所以 hbm 不是 简单的更高级,它是更适合 ai 服务器的显存方案。 那可能会有人问,那它为什么这么贵这么难,那为什么不能像普通显存一样直接焊在显卡的板子上呢?那下一篇我们就拆开 hbm 的 结构,讲什么是 brm 堆叠,什么又是陷阱跟踪关注我不迷路。

今天你是不是被全市场都在喊的 p c b 刷屏了?一条视频帮你看懂怎么回事。这件事情的起因是一个 ai 行业的重磅消息,摩根士丹利刚刚拆解了英伟达的下一代 ai 计算平台 verribili 机架, 得出了一个颠覆所有人认知的结论,未来的 ai 服务器 gpu 不 再是唯一的主角, pcb、 内存、电容这些看似不起眼的零部件,价值正在集体爆发。第一部分,我们先看最震撼的结论,价格几乎翻倍,但不是因为 gpu。 首先给大家一个最直观的数字, 英伟达上一代的 gb 三零零 nbl 七十二标准机架,从 odm 厂商那里直接采购的价格是三百九十九万美元一台。 而到了下一代如饼 vr 二零零 n v l 七十二机架,这个价格直接涨到了七百八十万美元,几乎翻了一倍。这里先给大家快速解释一个行业术语, o d m 原始设计制造。简单说就是既做设计又做生产的代工厂。 和只负责按客户图纸代工的 o e m 不 同, o d m 会独立完成 ai 机架的整体设计、零部件整合和整机制造, 最后交付给英伟达或云厂商。如果是通过联想、华硕、技嘉、戴尔这些 o e m 品牌商采购,价格还会更高。 可能很多人第一反应是肯定是 g p u 又涨价了,对吧?但摩根士丹利把整个机架拆得明明白白, 告诉我们,这一次价格翻倍的核心驱动力真的不是 gpu。 第二部分, boom 结构大洗牌,内存存储逆袭成第二大成本项, boom 就是 物料清单,也就是一台机器所有零部件的成本总和,我们来对比一下两代机架的成本结构变化,你就知道变化有多大。 在上一代 g b 三零零机架里,成本结构非常单一, g p u 一 家独大,占了总成本的百分之六十五,内存只占了百分之九左右,也就是三十七万美元,剩下的所有部件加起来才占百分之二十六。但 到了 rubin 机架这个结构发生了天翻地覆的变化, g p u 的 占比直接掉到了百分之五十一,虽然绝对价值还是涨了,从两百五十二万美元 涨到了三百九十六万美元,涨幅百分之五十七,但他的份额被严重压缩了,内存的占比直接飙升到了百分之二十六,绝对价值从三十七万美元涨到了两百万美元,涨 幅高达百分之四百三十五,一下子成为了仅次于 gpu 的 第二大成本,其他零部件的价值也都出现了大幅增长。接下来我们会一个个拆解。 第三部分,我们逐个拆解为什么这些零部件突然变得这么值钱。一、内存涨了百分之四百三十五。三重因素叠加内存是这次涨价最猛的部件,没有之一。它的暴涨来自三个因素的叠加。第一,容量翻倍。 单颗入侵 gpu 的 内存容量从 gb 二零零的幺九二 gb 直接提升到了二八八 gb, 一 台七十二卡的机架总 hbm 四,内存容量达到二十点七 tb, 再加上三十六颗 very cpu 配备的五十四 tb lpd 二五叉系统内存,全机架内存总容量翻了三倍以上。 第二,价格暴涨。自从英伟达推出 gb 二零零以来, hbm 高带宽内存的价格已经累计涨了超过百分之一百五十,而且还在涨。 第三,架构创新。 rubin 采用了英伟达全新的 so com 架构,把内存控制器直接集成到了内存模组里,待宽提升到了每秒二十至二十二 t b 以上,但这也大幅推高了模组的制造成本,这直接导致三星 s k、 海力士、镁光这三家内存厂商在 ai 产业链里的话语权一下子就上来了。 二、 pcb 涨了百分之两百三十三,而且相对存储,国内厂商占据了 pcb 的 核心供应链。 pcb 就是 印刷电路板,是所有电子原件的主体,它是所有下游部件里价值增幅最大的,从三点五亿万美元涨到了十一点六七万美元,涨了两倍多。 为什么涨这么多?两个核心原因。第一,新增了两类之前完全没有的 pcb 模组,每台机架要加七十二块 connect 模组 pcb 每块二百七十美元,合计一万九千四百四十美元,每台机架要加十八块中板 pcb, 每块一千五百美元,合计两万七千美元。光这两项就新增了四点六四万美元的成本。计算版从二十二层 hdi pcb 升级到了二十六层, 材料等级也从 m 七提升到了 m 八,交换机托盘从二十四层升级到了三十二层,还 额外加了一块四十四层的中板 pcb, 已满足七十二颗 gpu 的 nv link 六高速互联需求,所有 pcb 的 物理尺寸也都变大了。 三、 m l c c 涨了百分之一百八十二,小原件爆发大需求。 m l c c 就是 多层陶瓷电容器,是电路板上密密麻麻的那些小原件,负责稳定电压和滤波,它的价值从一千五百三十美元涨到了四千三百二十美元,涨了一点八倍。增量来自两个方面, 第一,单板用量大幅增加。每块计算板上的 m l c c 价值从二十五美元涨到了九十美元。每块交换基板上的从二十美元涨到了四十五美元。第二,新增模组带来的额外需求。如本新增了十八块 bluefield 四 d p u 模组和七十二块 connectx 九 r k 的 模组, 这些模组上也需要大量的 m l c c。 现在高端 ai 服务器用的 m l c c 已经出现了供应紧张,各大代工厂都在疯狂抢库存,就怕二零二六年下半年 rubin 量产的时候断货。 四、 abf 基板涨了百分之八十二,芯片的地基也涨价了。 abf 基板是 gpu 芯片下面的那个核心基板, 相当于芯片的地基,它的价值从一点一二万美元涨到了二点零三万美元,涨了百分之八十二。驱动因素有三个,第一,单颗 gpu 用的 a、 b、 f 基板单价直接翻倍,从一百美元涨到了二百美元。 第二, nv switch 交换芯片的用量从每机价十八颗增加到了三十六颗。第三, connect x 芯片的用量从每机价三十六颗增加到了七十二颗。五、电源和液冷 功率密度提升带来的稳健增长电源从五点六万美元涨到了七点五万美元,涨幅百分之三十二。 rubin 标配了一百一十千瓦的电源架,而且已经由美国云服务商开始采用八百伏高压直流独立电源机架了。 预计到二零二七年的如滨 out 平台八百伏直流架构会全面普及,夜冷从六点四六万美元涨到了七点二一万美元,涨幅百分之十二。如滨采用了全夜冷无风扇设计,彻底淘汰了风冷, 增量主要来自快速街头用量的增加和底部散热板的设计优化。如果算上机房里挂的 cdu 冷量分配单元,单机架的散热总价值大概是十二点二一万美面。 第四部分,打破误区, o d m 厂商不仅没被压缩,反而赚得更多了。之前市场上有一个非常普遍的观点, 英伟达把计算托盘做得越来越标准化, o d m 代工厂的附加值会被不断压缩,最后只能赚点辛苦钱。 但摩根施丹利的拆解结果直接打了这个观点的脸。 o d m 的 增值部分,从 g b 三零零的每台机价十点八二万美元,涨到了 rubin 的 每台机价十四点九六万美元,涨幅百分之三十五到百分之四十。这些增值分布在整个机价的各个环节,计算版组装测试涨了, 计算托盘组装测试涨了,整机机架组装测试也涨了,而且还新增了 connect x 或 okey 的 模组的组装测试环节,这一项就新增了三千六百美元的价值。 有人可能会说,我看到 odm 的 毛利率从百分之二点七降到了百分之一点九吧?没错,毛利率是降了,但绝对盈利额涨了百分之三十八。原来坐一台赚十点八二万,现在坐一台赚十四点九六万,哪个更赚钱一目了然。 而且,如果云服务商自行采购内存模组, odm 的 毛利率还能回升到百分之二点二到百分之二点六。最后,我们来做一下总结。 ai 产业链的价值分配正在彻底重构。这次 ruby 计价拆解给我们带来的三个最重要的启示, 第一, ai 服务器的价值蛋糕不再只属于 gpu。 之前大家投资 ai 产业链,眼睛只盯着英伟达, 但现在 pcb、 mlcc、 一 百 f 机板、内存这些中下游环节的价值增幅都远远超过了 gpu 本身,它们正在迎来自己的黄金时代。第二,系统级创新比单纯的 gpu 性能提升更重要。 root 机架标志着 ai 服务器已经从简单堆叠 gpu 的 时代,进入了系统级创新的时代。散热、供电、互联、内存架构这些方面的全面升级,正在成为下一代 ai 平台的核心竞争力。 第三,内存已经成为了 ai 产业链的新瓶颈,内存占比从不到百分之十跃升到百分之二十六,价格和供应的波动将会直接影响整个 ai 行业的发展节奏。 英伟达的如饼平台预计在二零二六年第三季度开始生产出货,第四季度上量,二零二七年第一季度大规模交付,这场 ai 产业链的价值重构才刚刚开始。

又捉一批了,台湾省精准收网 b 三百的转运队,直接掐断英伟达的高端算力的灰色通道,钓鱼执法精准点炮,跨境走失链,连根拔起。 我们算力圈都懂, b 三百是当前顶流的算力卡,从三百多炒到七百多,万一台,细节性是拉满的。这次的雷霆行动,断的不是货源,更是卡脖子的关键命脉。 灰色的渠道彻底是冰封了,国产的蒜泥迎来黄金的窗口期,华为升腾加速补位不是吹,赶紧一起去卖国货吧!关注我,持续输出蒜泥瓜!

b 三百反复调卡,我先自己排查一下,省点时间也省点检测费。不对,刚开始只是偶尔调卡,现在怎么连 gpu 识别都不稳定了?我们自己换过线也挪过卡位,现在故障更乱了, 你们能不能看一下把拆过的位置拍照,保留日记,记录每一步操操作机器送过来,我们先还原现场,再检测整机。客户自查不是不可以,但 b 三零这种整机不能盲目拆,拆之前没有记录,后面就很难判断,那客户自己排查真的会把问题变严重。 原本可能是一个链链问题,拆乱没交叉到位,必须和时间都会影响判断。我以为自己先拆一下是在省钱,但没想到可以。故障必须做专业检测,自己排查不一定错,盲目拆机才是风险。