董事长们,华为升腾这条线可能马上又要来一个新催化了。为什么这么说?因为五月二十二日,华为要开 a p n 两 k p n 分 论坛,主题就一句话,构建硬件伙伴赋能体系,打造丰富端边产品组合。 这句话你别小看它,翻译成市场,听懂的话就是,升腾生态不只是自己卖了,接下来要把伙伴体系、渠道体系、分销体系一起做大。 更关键的是,这次论坛里后半段直接出现了两个非常敏感的表述,一个叫华强巨链赋能生态共赢,一个叫算力流动赋能生态价值共生。 这说明市场一直在交易的那个预期,正在越来越往名牌方向走。华为不是单纯想卖整机,而是要把升腾这套东西通过更多伙伴铺出去。 谁最先受益?不是空喊口号的,而是那些本来就在升腾伙伴体系里,又有渠道整机交付能力的公司。所以今天这条视频,咱们就把这件事讲透。华为为什么现在要推这套机制?这对产业链到底意味着什么? a 股里谁最值得盯?第一家,神舟数码 这个票我会放在最前面,因为它既有渠道属性,也有整机属性。公开资料显示,神舟数码旗下的神舟昆泰本身就是升腾部件伙伴。而且在今年三月,神舟昆泰已经和其他核心伙伴一起 发布了基于 atles 三五零搭载升腾九五零 pr 的 服务器整机产品,这标志着升腾九百五十待机推理算力已经开始正式进入商用。也就是说,神舟数码不是单纯蹭分销两个字,它本身就已经卡在了升腾整机和伙伴体系里面, 如果后面升腾真的从服务器 odm 继续往板卡加分销升级,神州数码会是最有辨识度的一只。 至于市场为什么老拿它和总代预期挂钩,本质也是因为它本来就在这个体系里,不是空想象。第二家,深圳华强这个票就是很典型的分销预期,映射 公司在投资者关系活动和互动平台上都明确说过自己是升腾 a p n 的 金牌部件伙伴,并且已经围绕升腾做了边缘 ai 模组 推理计算和等方案开发。更关键的是,公司自己还特别强调,未来会发挥自身的分销实力和技术能力,去推动升腾在端边云全站生态里的落地去。 当然,公司也讲的很实在,截至目前,升腾相关业务占公司收入比例不到百分之零点一,这句话很重要,说明他现在不是业绩兑现型,而是分销预期差型。 一旦后面市场真的确认华为会通过更多渠道把板卡卖出去,深圳华强的弹性就会被重新定价。但在此之前,你也要知道,这更偏预期, 而不是已经大规模兑现。第三家,拓维信息这个票的逻辑不在分销,而在整机和行业落地。虽然我没有用总代去定义它,但它是这条线上非常标准的。升腾 做分销不是为了单纯多卖几张卡,而是为了让更多行业场景更快的落地。 而拓维信息这种本身就在做造焊服务器、做行业算力解决方案的公司,天然会在这一轮生态扩张里受益, 你可以把它理解成分销机制,解决的是卖的更广,而拓维这种整机和行业方案公司解决的是卖出去以后怎么真正用起来,所以它更偏生态放量。第四家,高新发展这个票看的是华昆振宇这层。 证券时报之前就报导过,高头电子集团已经持有华昆振宇百分之五十五股权,而高新发展一直在推动把华昆振宇相关资产装进上市公司。 为什么市场老把它和升腾服务器绑定?因为华坤阵雨就是升腾服务器第一梯队的重要玩家之一。 也就说,如果后面华为从整机直销往板卡分销伙伴携手这个方向继续推进,像华坤阵雨这类本身就有整机能力、有客户资源的伙伴, 受益是很直接的。高新发展的逻辑不在于他自己分销,而在于他绑定的核心整机资产会在升腾放量时被重新估值。第五家,华丰科技这个票放在这里,是因为很多人容易只盯芯片和整机,忽略了高速连接器。 但你要知道,板卡卖的更多,服务器做的更多,超节点服务器开始上量之后,真正最先跟着放量的往往不是最显眼的那个,而是连接器、背板、现览这些基础部件。华丰科技本身就是高速连接器龙头,之前才哥视频里也反复讲过,他在华为算力服务器产业链里位置很深, 你可以把它理解成分销机制,如果把升腾板卡和整机的出货节奏拉起来,画风这种底层配套反而是最容易跟着吃量的一层。这个票偏链条传达受益不是直接分销,但逻辑很顺。
粉丝5900获赞3.2万

华为深腾九五零 pr 背后的十家核心公司,供大家参考。第一家,拓维信息,华为深腾生态核心合作伙伴,其控股子公司湘江鲲鹏拥有华为官方授权,参与深腾 ai 芯片算力集群行业落地,覆盖多领域解决方案。第二家,欧陆通,为华为深腾 ai 服务器提供高效电源配套产品, 是 ai 服务器电源算力中心、 ups 电源核心供应商。第三家,益华股份,是华为升腾高速互联核心供应商,提供八百 g 高速连接器和高速背板连接器,解决算力集成高速数据传输瓶颈。第四家,新生科技,为升腾九五零 p r 芯片提供封装所需的 a、 b、 f 窄板,是芯片封装环节的关键材料供应商, 契合升腾芯片对高端窄板的需求增量。第五家,华丰科技,华为哈伯投资实现股权绑定,是升腾 ai 服务器高速连接器核心供应商。 第六家,泰嘉股份,通过全资子公司雅迪电子成为华为 ai 服务器电源核心供应商。第七家,川润股份,深度绑定华为升腾算力产业链,是核心散热解决方案提供商,为 ai 服务器和智算中心提供液冷散热核心部件。第八家,高兴发展控股华坤阵雨 是目前市场上升腾服务器供应链最大的厂商。第九家,深蓝电路,为升腾 ai 服务器及芯片配套提供高端 pcb 版与封装,窄版是硬件环节的关键配套供应商。 十家,飞龙股份,是升腾九五零系列服务器液冷循环泵核心供应商,他将汽车级高标准技术引入数据中心液冷领域,适配升腾超节点散热需求。

今天我们必须来聊一聊华为的掏定律,堪称为载入科技史的大事。依靠这套技术路线,到二零三一年,芯片直接做到一点四纳米,那换句话说,跟台积电差距三年,跟三星差距两年,跟 intel 差距一年,这路线比光刻机追的快。过去六年,基于掏定律,华为设计量产三百八十一款芯片,性能能效显著提升, 就是用逻辑折叠搭配三 d 堆叠技术,摆脱对极致制成的依赖,直接立好 a、 b、 f 载板。用这套技术方案,芯片层数要跳到八到十六层,高端 ai 芯片甚至二十层,层数越高, a、 b、 f 用量越大。二零二六年秋季麒麟升腾,全面上逻辑折叠, a、 b、 f 载板备货已启动, q 四起需求集中释放。接下来给大家梳理一下 a、 b、 f 载板的龙头企业。深南电路是国内 a、 b、 f 载板绝对龙头,全球第二梯队领头羊,是国内唯一实现二十到二十二层 a、 b、 f 载板稳定量产的企业。 目前二十四层在验证,二十六层在加速研发,二零二六到二零二七年,新增十到十五万平方米,每月冲刺全球百分之十实战率,现已通过华为逻辑折叠技术认证。二零二六年, q 四启动批量供货,单颗芯片 a、 b、 f 材料用量随之翻倍。星森科技是国内 a、 b、 f 量产先行者, 国内唯一同时量产 a、 b、 f 载板及 bt 载板的厂商,不管算力还是存储爆发都能受益。公司正大力扩产, 预计二零二七年 a、 b、 f 载板月产量将达十五到二十万片,对应年产值约一百二十亿元,渴望占据国产 a、 b、 f 载板总量百分之七十以上。目前,约百分之七十的 a、 b、 f 产量已锁定供应华为升腾与麒麟芯片深度绑定头部算力客户。 华正新材是类 a、 b、 f 国产绝对龙头,是国内唯一通过升腾九一零 c 九百五十认证并批量供货的厂商。单颗芯片 c、 b、 f 膜价值高达二十美元, 公司总产值高达六百万平方米,每年对应营收二十亿元,可填补国内百分之三十的 a、 b、 f 膜缺口。二零二五年该产品供货升腾芯片超十万片,创收一点五亿元。二零二六年伴随升腾芯片持续放量,相关订单将实现翻倍,该收入占公司 c、 b、 f 总营收同比也将攀升至百分之六十。生意科技是国内富铜板龙头, 二零二零年切入高端封装材料赛道,重点布局可用于 a、 b、 f 载板的类 a、 b、 f 基层膜。公司早在二零二五年年中就完成产品送样并启动客户验证,二零二六年一季度正式进入小批量试产阶段。目前该产品国产替代率约百分之五到百分之十。 随着产能与技术持续优化,二零二七年 a、 b、 f 基层膜的试战率将攀升至百分之二十,加速推进 a、 b、 f 载板龙头企业,在此领域做大做精的企业,无疑是最大的受益者。不过我得提醒一句, 以上内容都是基于公开信息整理,不构成任何投资建议。今天的分享就到这里了,要是觉得内容有参考价值,欢迎点赞、关注、评论,咱们下期再见!

此时此刻,历史正在被写下,就连英伟达创始人黄仁勋都清楚承认,这是美国在全球人工智能领域的灾难性打击。 deepthink v 四刚一发布, 就直接把华为生成写进了硬件验证清单的最前烈,态度决绝,一定要看到最后,近期,又一个 deepthink 时刻重磅登场。如果说一年前大模型刚破圈时,国内新片厂还在手忙脚乱做紧急适配,那么这一次,中国大模型已经实现了真正的出厂及高配。 再也不看海外巨头的脸色,整个中国 ai 产业正在以决绝的姿态,整体性的从英伟达扩大生态,全面向本土自主可控的硬件矩阵大迁徙,彻底打破垄断。在此,官方技术报告里提到了一个特别硬核的词儿,心魔血统。很多人看不懂,相关专家打了个绝妙的比方,这就像汽车的原厂设计, 不是大模型做好了再去找芯片对接口,而是从画第一张代码草图开始,模型和芯片的研发团队就坐在同一个办公室里死磕,深度绑定,同步推进。站在国家产业安全的视角看,有句话说的太对,在别人的墙基上砌房子,地基再高也只是沙滩上的城堡。 只有这种深度的心魔血统,才能彻底甩掉对单一海外巨头卡伯兹的恐惧,真正把 ai 主权把握在自己手里。此刻我们必须明确一点,这从来不是蒂普森克一家公司的胜利,而是以整条国产 ai 产业链百花齐放背后藏着三层核心逻辑, 每一层都彰显中国 ai 的 底气。首先看机械层的多链适配,这一次除了华为升腾事件超节点全系列支持, 国内至少有八家硬核 a r 芯片厂同步官宣适配。从大模型的机模五虎到芯片界的 g、 p、 u 四小龙,一套完全独立于美方体系的国产算力加国产模型,商业生态 已经彻底跑通了,系统性、安全性的量产可行性,再也不是单点突破,而是全面开花。其次,看成本与安全的双重结欧,过去全行业都不得不接受高昂的海外硬点议价, 被卡脖子时更是束手无策。而现在,通过本土产业链携手创新,中国企业第一次在 ai 领域走出了艰巨成本优势与安全保障的中国路径。互联网上半场,我们经历过缺心少魂的痛点,被卡脖子的无奈, 但在 ai 下半场,这个核心底座我们自己说了算。最后看客观存在的长跑带叉、保持清醒也是我们的必修课。必须客观看到,目前国产算力的优势主要集中在推理测,在更核心的训练测,我们依然需要漫长而艰难的爬坡。 diffin v 四虽然在开源领域独步天下,但对比全球最顶级的避远模型,依然存在技术代差。正如 diffin 自己所说,通用人工智能是一场比拼耐力的长期出行马拉松。点赞、收藏、看透中国 ai 反沙的底层逻辑!


再把供应商直接换人,份额从零拉到百分之四十五以上。顺着这份行业专家的交流计,要把升腾供应链正在发生的几件事顺一遍,你会发现有些变化比表面看起来更具体。先说一个比较反常识的点, a、 b、 f 载板这边, 供应商格局在主动洗牌。原来九一零时代主要供应商是新兴电子,现在九五零系列直接切了,新增科技的份额将大幅提升,预计干到百分之四十五到百分之五十之间。 深南电路作为长期第二供应商,金星还会保留一部分,但量已经小了。切换的逻辑是什么呢?不是品质问题,是性价比。金森在九百五十上的报价整体比较低,而九百五十的量起的很快,原有供应商在利润考核和价格上要求比较高,此前跟新星签的长期协议是基于九一零和九二零代替产品, 产品生命周期结束协议也跟着终止了。说白了,量大了之后,价格敏感度完全不一样了。京森和申南在十六层、十四层载板上已经没有技术问题, 但超过十八层可能会吃力。九百五十 p r 用的是十六层 a、 b、 f 载板,单科价格大约七百多元,每张计算卡对应两科载板到九百六十内带层数预计还在二十层以内,现有厂商能接住,到九百七十,可能才会遇到真正挑战。 现在整个 a、 b、 f 载板市场持续紧张,产能基本都被提前锁定了,很多厂商提前两年就把产能预定需求端。不光是 gpu 本身在放量, hbm 的 用量和颗数也在增加,从四颗往八颗甚至更多走,对载板面积的需求是倍增的, 技术难度也在往上顶。封装这边还有一个变化值得留意,目前用的是 kolos 路线,但九百六十单代尺寸很大,必须切到 kolos。 l 切过去之后,供应商分成两条线,一条是自由产线和供应商,比如驱凉,在 l 路线上已经有经验储备。另一条是外部供应商, 富富微店和盛和京微依然是核心合作伙伴。短期内盛和的量率更高,趋量的量率大概要到二零二七年底才能接近盛和水平,能赶上九百六十的量产节点,但总体量率还是会略低。 供应计划里,盛和是第一家,渠梁是第二家,渠梁的量率一直在爬坡,成本短期内不会降太多。连接器这边也在持续卷随产品迭代到二二四 g 供应商体系,引入了航天电器,现在三家供应商的产品性能和量率都通过了验证, 等于技术门槛已经跨完了,未来的竞争更多体现在价格上。双十一二季方案更多用在相对轻量化的集群单柜六十四卡或者三百张卡以下九百五十系列的大型超节点,尤其是训练用的,必须上单模组。二百二十四 g 高速模组。 两百二十四 g 方案的 ip 授权目前还是双向授权状态,公司提供一部分,海外厂商提供一部分,全链路自主可控,预计要到二零二八年。再往大理看,接下来两年 gp gpu 架构还是主流推移 场景里 g b g p u 省成本,性能稳定,国内市场认可度也高, asic 架构的优势需要更长时间才能体现,大概三年后模型稳定了才会起来。九五零系列的定位其实很有意思,单卡算力弱于 h 一 百,大致对折。 h 二零 性能比韩五 g 五九零高百分之二十五,大概是六九零的百分之七十。但在 deepsea 这类深度优化过的模型上,因为有底层算子库和翻译工具的适配,性能表现会更稳。芯片两大玩家目前基本满产满销, 没有明显的客户倾向性,只要是大型客户都会采购。核心瓶颈还是三个老问题,流片、封装和 hbm 三个环节都面临约束, 尤其 hbm 国内供应链相对薄弱,仍需依赖海外渠道六百九十跟字节跳动深度绑定,因此不会把大量产能分给其他客户。整体上,两款芯片的总产能还满足不了市场的真实需求。中信南方还在筹备扩产,目前升腾主力产能就来自它, 未来整体产能分给升腾的比例可能会减少,主要基于政策调度考虑,升腾自身也具备部分产能,不完全依赖外部流。 刚聊完这份计要,载板、封装、连接器三条线都在动,供应商格局在重新切分,成本和量率还在拉扯,整个供应链正在往更大体量、更高规格的方向移。

英伟达会把芯片卖给华为吗?面对这个问题,黄仁勋在会议上整整错了三秒,最后只反问了一句,这真是个奇怪的问题,为什么黄仁勋难以回答这个问题?这背后,其实是硅谷巨头对市场失控最深层的恐惧。如今时代大变,你以为我们还要看人脸色等你下锅?大错特错! 英伟达刚退场,华为深腾芯片今年营收就要冲到一百二十亿美元,同比暴涨百分之六十。他正以恐怖的速度疯狂蚕食所有空白市场。曾经的买家,如今已变成随时能掀翻台桌的致命对手,这种被替代的下场,正在每一个行业惨烈上演。那尴尬的三秒沉默,就是巨头落幕的危险信号。

升腾九五零和升腾九六零这条线表面上是在比性能,实际上很多变化都压在封装、流片、 h、 b、 m、 窄板这些环节上。供应链能不能跟上这次核心供应链的大洗牌,哪些公司真的能吃到红利吗? 往产业链里拆,会发现,九百五十和升腾九六零最先变的不是宣传口径,而是封装路线。现在用的是 coos 路线, 可申腾九六零因为单带尺寸太大,后面封装就必须往 kol 四 s l 切,这个切换不是简单换个工艺名字,背后对应的是整套工艺体系要重新排布。 l 路线这边自由产线里,徐良已经有比较丰富的经验储备,外部供应商这边,通富和、盛和还是核心合作伙伴。 问题在于,从 s 切到 l, 不是 谁先进去谁就能马上跑顺良率爬坡会直接决定谁先拿到更高的供应权重,短期内盛和的良率还是更高,这个没有太多悬念。徐良要把良率追到接近盛和的水平, 预计得等到二零二七年底,时间点上差不多能赶上升腾九六零量产。可即便到那个时候,渠梁的整体量率大概率还是会略低一点,所以成本端也不会一下子降太多。等于说升腾九六零这套供应体系里,盛和现在被定成第一供应商,渠梁是第二供应商, 这个排序本质上还是由量率和成本一起决定的。再看产品本身,升腾九五零系列不管是 pr 还是 dt 版本,单卡算力和宽带配置跟英伟达旗舰产品比,差距还是在的。性能弱于 h 一 百, 大致是对标 h 二零这个水平,国内横向比较的话,在同样的模型条件下,比如豆包、千问这些验证场景里, 升腾九五零的表现大概处在韩五 g 五九零和六九零之间。更具体一点说,它大约能达到韩五 g 六百九十性能的百分之七十,但比韩五 g 五百九十高出百分之二十五。不过这个比较也不是一刀切,你换到 deep seek 这种模型上,因为升腾这边做了更深的优化,包括底层算子库和翻译工具适配, 所以它的性能表现会更稳定,也会更强一点。也就是说,这里面不只是裸芯片能力,还跟生态适配深度直接相关。市场竞争这块儿,其实现在也不是谁压着谁打的状态。申腾和韩五 g 这两款主流 ai 芯片,目前看都没有特别明显的客户倾向性, 大厂客户基本都会买,而且两边都属于满产满销,放在国内他们都还是第一梯队。真正的问题不在需求端,而在供给端,就是产量不够,两家的总产能加起来也还满足不了真实需求。韩五 g 六九零这边约束还更明显一些,它的瓶颈是三层叠在一起的,一个是流片环节本身就紧, 一个是封装环节因为也走 coos 路线,所以卡得很明显。再一个就是 hbm, 国内这条链本来就薄弱,还是得依赖海外渠道采购。再叠加一个现实情况,六九零和字节跳动绑定比较深,所以它也不会把大量产能分给其他客户。你把这条链从金源一直看到最终交付, 会发现行业共性的核心瓶颈其实就是流片、 hbm 和封装这三个环节再往组网那边延伸, c p u 和光模块也有问题。深腾这套体系因为更看重供应链安全, 所以重点盯的也是流片、 hbm 和封装。说白了,这几个环节谁先松,谁的出货节奏就更顺,谁一直卡谁,哪怕产品性能还行,最后也很难把量真正打出来。 金源这边,升腾现在的主要产能还是来自中芯南方,另外还有少量来自三星和 p s m c。 中芯南方现在还在积极筹备扩产,但后面分给升腾的份额比例不一定会一路往上走,里面不是单纯商业分配的问题,还带着政策层面的统筹。升腾当然希望多拿一些产能,可它自己也不是完全没有产能基础, 不是彻底依赖外部流篇,再加上还要给其他国内厂商留出一定份额,所以未来中芯南方破产之后,深腾能分到多少,不只是看需求,还得看整体平衡。 a b f 载板这块的变化其实也挺关键,而且是非常明确的结构性切换。深腾九五零系列的 a、 b、 f 载板供应商正在换血,九一零那一代主要供应商还是新兴电子, 但到了九五零,新兴的份额会往下掉,新生的比例会明显抬上来。这个调整不是被动发生的,更多是主动选择。原因一方面是原来部分供应商在利润考核和价格上的要求比较高,另一方面是九五零系列上量很快,新生整体报价更低, 性价比更合适。再加上此前跟新兴围绕九一零和九二零签的长期协议,随着产品生命周期结束也自然终止了,所以新一代产品就有了重新分配份额的空间。接下来这块的供应格局大致是新森和申楠做主要供应商,新森预计能拿到百分之四十五到百分之五十的份额, 申楠会长期扮演第二供应商的角色。新新还会保留一小部分份额,但已经不是过去那个位置了,第三家供应商暂时还没最终定下来。规格上, 九百五十系列现在用的是十六层 a、 b、 f 载板,单科价格大概七百多元一张计算卡要对应两科。载板有阶阶段看 新森和深南承接十六层、十四层是没有问题的,后面到深腾九六零,预计载板层数还会控制在二十层以内,国内厂商暂时也还能接。可如果再往九百七十走,或者层数超过十八层、二十层以后,国产化压力就会明显变大, 这个挑战还是真实存在的。而且 a、 b、 f 这条线,不是说你技术能做就一定有货,二零二六到二零二七年,整个 a、 b、 f 载板市场大概率都会持续紧张,现有产能基本已经被提前预定掉了, 厂商往往要提前两年去锁。再加上需求不只是 gpu 自己在长, hbm 的 用量也在从四颗往八颗甚至更多走,这会直接把载板面积需求拉大,同时把技术难度也往上推。所以你会发现,载板这块后面不只是国产替代的问题,也是供需错配的问题。连接器这边也不是小事, 双幺幺二 g 方案更多还是用在相对轻量化的集群里,比如单柜六十四卡,三百张卡以下,还有部分三百八十四卡集群,可一旦到了深腾九五零系列的大型超节点,尤其是训练型超节点,就必须上单模组、二二四 g 高速模组供应商格局也跟着变了。随着产品迭代到二百二十四 g 体系里,已经引入了航天电器,现在三家供应商的产品性能和量率都已经验证通过,后面竞争的重点会更多落到价格上。 再往自主可控去看,两百二十四 g 方案的 ip 授权目前还是双向授权,也就是公司自研 ip, 加上海外厂商授权文件一起存在。按现在的节奏, 预计到二零二八年,这部分 ip 才有望做到全链路自主可控。所以你回头看,升腾服务器生态最大的潜在风险,其实还不是国内谁和谁竞争,而是海外供给。如果海外 ai 芯片供给哪天真的完全放开了,升腾现在这个市场位置一定会受到很大冲击,这个风险是摆在那儿的, 没有必要回避。但另一边最大的机会也很清楚,还是来自模型迭代,尤其像 deepsea, 未来如果继续往 agent 模型去走,而且新模型效果足够好,又能和深腾生态适配的比较顺, 那他对深腾部署规模和市场用量的拉动会非常直接。你会发现,深腾九五零和深腾九六零这条线,表面上大家在看性能、看对标,看谁更接近英伟达。真落到产业链里,决定节奏的还是那几个老问题,流片够不够? hbm 拿不拿得到封装?能不能顺利切到新路线? abf 载板有没有人能稳稳接住?二二四 g 连接器和 ip 自主可控能不能按时间往前推,等于说这条线接下来怎么走,不只是看产品定义的怎么样,更要看供应链每个环节能不能在同一个时间窗口里跑顺。

上个升腾视频我们说了金源封装、 hbm 竞品对比,还有架构路线,这期视频我们就详细盘一盘连接器和 a b f 载板这两个核心部件,带你看看选型、供应、成本、交付这些执行层面的刺刀见红的细节,还有供应商背后的微妙变化。交付 已经成为二零二六年官方重点推广的核心形态了,甚至说更大规模的万卡超节点集群,现在也都在紧锣密鼓的规划当中。伴随着这种整机柜和超节点的普及, g p u 卡与高速连接器的配比关系直接被颠覆了, 说白了就是彻底从过去的共享模式演变成了单卡独占的配套模式。我们看在申腾九幺零 c 时代, 采用的还是常规的八卡服务器对应六套高速线路的方案。但是到了申腾九五零这一代,在超节点集群中, 由于跨版卡之间必须进行点对点横向互联,导致每一张卡都必须雷打不动地对应一套二百二十四 g 线缆模组。这种一比一的独占配比,直接就让机柜内横向互联的高速连接器用量迎来了爆发式增长。从互联升级来看, 九一零 c 主要配套的是一一二 g 连接器,但到了九百五十系列,随着宽带暴增,这就必须全面叠代代到二二四 g 连接器了。在二二四 g 这个硬核战场上面,第一条是单模组二百二十四 g 方案, 它的核心瓶颈在于部分 ip 授权现在仍需要依赖海外,不过它的优势非常明显,整体功耗和延迟极低,综合性能及其稳定是超算等对延迟要求极高场景的绝对首选。 另一条路线是双幺幺二机拼接方案,技术更成熟,最大的优势就是成本低,但它的缺点也很明显,模组间功耗偏高,且必须在端口额外增加一块主控 ic 板来做通道管理, 无形中增加了系统复杂度。所以说它目前主要应用在常规的八卡或者十六卡服务器或者是单机柜产品当中。这个时候,行业里其实出现了一个很有意思的供应商变化, 那就是为什么利迅精密等传统名品大厂在二二四 g 时代选择缺席,而航天电器等军工企业却极其积极呢?其实核心原因就在于 ip 授权的合规性风险。 这个二二四 g 方案涉及到了海外授权的底层协议,目前行业采用的模式是官方提供 ip, 各家厂商负责定制化加工。力迅精密这类由海外市场拓展计划的名品巨头,出于合规风险的考量,最后选择不参与。而像航天电器、中航光电等企业,本身就有硬核的技术储备, 也更愿意去承接这类高端的定制业务。就在二零二六年五月,今年连接器的第二轮招标正式打响了,直接锁定下半年的所有出货份额。 由于所有参与招标的厂商技术方案都已经通过了验证,物料也从研发转为了生产,技术上已经没有显着的差异了。所以你会发现官方的招标策略变得非常直接,主要就是依据供应商的产能规模和最终报价来决定份额。 我们可以看一下目前的连接器供应格局。作为已经入局的生产品牌,华丰庆红已经稳稳进入了生产物料供应体系,而新进玩家方面,航天电器也已经拿到了认证报告,近期就会通过招标正式确定为第三家供应商。官方引入新玩家的目的,一方面是为了保障二零二七年大爆发的需求, 避免单一供应商出现破产不及时的风险,另一方面说白了就是为了杀价。因为目前二二四 g 产品的价格定位比较高,成本对官方构成了不小的压力,大家都期望通过引入第三方竞争,在二零二六年底前把高昂的毛利给打下来。如果我们从历史降价节奏来看, 幺幺二 g 连接器此前正是因为利迅精密的杀入,在招标中爆出了低价,直接引发了单次大约百分之十五的非周期性暴跌。目前一百一十二 g 模组价格在经历前期的持续下降之后, 近期受到原材料价格上涨的影响,出现了一些小幅波动。不过目前整个供应链在产能执行上最大的隐忧其实是在于扩展信心与良率爬坡。因为二零二五年的实际出货量没有达到预期,导致连接器供应商目前对官方的需求量信心不足, 大家的扩展态度相对来说比较保守。虽然单条产线的建设周期只要两个半月,但是二二四 g 连接器的生产工艺远比一一二 g 复杂, 导致新产线的量律爬坡周期非常长,而且不可控,一旦过度依赖一两家供应商,物料分分钟会成为整机出货的致命瓶颈。除了连接器之外,作为大芯片地基的 a、 b f 载板, 它的供应商格局也正在上演一场本土化的洗牌。目前,在深腾、九幺零 c 和九五零的 a、 b、 f 载板供应链中,新森科技已经斩获了最高的份额占比,占据了绝对的主导地位, 其技术能力已经基本覆盖了 hbm 和 kolos 相关的载板需求,其余的小部分市场被台席厂商和深南电路等公司瓜分,未来这个主导格局预计会保持稳定。很多人会好奇,为什么去年二零二五年新生科技没能成为主力, 今年却成功切入并大权独揽了呢?其实主要因为去年市场在消化大量的库存,确实没必要大规模切换原有的供应商框架协议。但到了二零二六年,部分原有供应商的战略重心发生了错配。更重要的是,二零二六年的载板需求量预计是去年的整整两倍比。极具诱惑力的巨大增量, 恰好为新生科技的成功切入创造了完美的天然气机。如果我们从执行层的时间线和交付节奏来看,新生科技的备料工作早在春节前后就秘密启动了。因为九百五十系列从二零二六年五月初才开始正式出货,所以新生科技的业绩体现会存在一定的时间差。对于型号切替, 此前的九幺零 c 交付节奏其实是前高后低。等五月九五零上量之后,九幺零 c 的 采购将主要缩减至正企,客户量会逐步萎缩。再看技术和价格,九百五十对载板的要求明显上了一个台阶,工艺复杂度更高。在价格方面, 经过二零二五底的招标和价格平衡之后,目前双地方案的九百五十载板价格基本稳定在两千到两千两百元人民币左右。最后,咱们不妨拉高一下视角,看看整个大蒜力市场的执行层中局。在九百五十系列的产品矩阵里面,很多人可能都在关注九百五十 d t 版本,但必须明确的是, 这个 d t 版本并不是一款能够完全契合传统大型训练场景的产品,它的核心使命其实是做强化学习或者后训练,官方从来没有放弃过利润丰厚、技术空间巨大而且竞争相对温和的训练市场,真正的欲训练大杀器, 预计要等到下一代九百六十系列产品才会正式推出,到时候会全面向预训练方向去发展。虽然现阶段国内的云厂商基于底层生态和成熟度的考虑,用国产卡进行大规模预训练的意愿还不算特别强,但行业里普遍的共识是, 到了二零二七年,国内绝大部分厂商的推理卡性能都将达到门槛,到那个时候,推理卡市场势必会陷入一场惨烈的性价比与产能内卷,也就是变成一片尚未被完全开发的蓝海。

我想问大家一个问题啊,就是现在市场上这么多的自驾方案,为什么华为敢压住一个别人不敢走,换句话说也别人也不能走的这一条路?那说这个问题之前,我们先来看一下目前主流的自驾几个流派。那 vla 它主打的是给车装上一个非常无敌,算力极高的一个大脑,就是这个算力芯片,你会发现,呃,包括理想也好,小朋友也好,他们对车端的算力的要求是越来越高,越来越高。那端到端它主打的是什么?纯粹的模仿人类。但华为这个 vivo 价格架构,这个 wua 这个世界模型的架构做了一个更疯狂的决定, 它是在云端直接是造了一个虚拟的驾校,让 ai 在 里面考出驾照。那为什么华为的 a d s 能给人这么好的一个安心感,开起来像一个老司机,这个驾驾校功不可没。这个虚拟驾校是无限接近于真实的世界,每秒钟产生的数据量和计算量是非常非常炸裂的一个级别的, 它能模仿出各个道路的使用场景。所以一个灵魂拷问来了,什么样的芯片能扛住这种算力的地狱? 这个也是华为系的智驾对车端的算力没那么高的要求的根本原因。那现在我们就必须请出我们今天的主角,华为的升腾芯片, 麒麟芯片大家都耳熟能详对不对?升腾芯片其实有好多朋友也是第一次听说,那我们今天就好好的说一说华为这个 ai 算力芯片升腾,那前一阶段大家都知道啊,英伟达的黄仁勋,然后跟着老头一起到访我们中国,其实他的目的就非常简单,他就是想把他的 ai 芯片去卖到我们中国。 那这件事好像过去了这么多天啊,特斯拉的 fsd 修都宣布了落地国内,那他这个芯片为什么没有掀起太大的波澜呢?第一个他也没有带最好的芯片给我们。第二个那就是最近科技圈也有一个特别火的东西,叫华为的升腾九五零。 火到什么程度呢?就是字节跳动,阿里、腾讯这种大型的,我们国内最大的几个科技巨头都拿着钱在门口下单我们的升腾九五零, 有人说他是国产芯片的英雄,但是也有人说他跟现在世界上最牛的英伟达的芯片还相差甚远。那今天我们不聊那些冷冰冰的参数,因为那些参数我们我们没有深入了解的话,这个感知是不是特别强的?那我今天用一个你绝对能听懂的比喻,把这件事跟大家说透。 其实你可以把一个芯片比作一个送外卖的骑手,或者是开餐厅的一个厨师。有一种芯片,他就像米其林的那种顶级的大厨,一个人就能给你整出一桌满汉全席来,单兵作战的能力无敌。这个就是英伟达最贵最牛的 b 二百芯片, 这个还不是这一次带带我们中国的 h 两百, h 两百其实没有这个 b 二百厉害,目前他们最顶杆的是这个 b 二百芯片。而华为这个升腾九五零呢?他是靠怎么样一个逻辑去跟这种世界顶尖的去抗衡的呢?他更像是那种标准化出餐,几块一个人能同时炒出几十份盖浇饭的连锁快餐的大厨, 懂我意思吗?他单兵作战的能力没有米其林大厨那么强的,但是单挑做硬菜,他可能比不过米其林,但论起效率和性价比,我能在单位时间内做出最多人能吃的饭,这个是他的主战场。 所以华为这个策略其实是非常非常聪明的,因为我们现在的芯片制成的工艺其实是落后于漂亮国的。那我们定的这个策略就是,我不跟你比单挑,我比你跟你比群殴我人多啊,我以人海战术去取胜。那这个就是所谓的阿特拉斯九五零超节点, 你别把它想成一个芯片,你你要把它想成一个拥有八千一百九十二个厨师的超级中央厨房,这个中央厨房一旦开动,同一时间能处理的订单量是因为达一个顶级大厨团队的六点七倍。 国内的那些大厂 ai 公司他们都不少,他们知道这个我这个超节点的厉害,才会捧着钱去下单,对不对?那 整个厨房里的流转的食材,也就是数据容量是人家的十五倍,传输带的速度就是互联网的,网的那个宽带是人家的六点二倍,这个就好比一个双拳难敌四手的这么一个道理。你单边再强也架不住我这边几千号人的默契配合,流程顺畅,在每天处理海量的短视频推荐啊,然后商品的推荐啊,这种大锅饭的任务上,我的总产出 是比你高的多的。其实那这种超级快餐大厨有多抢手呢?现在的 ai 时代,所有的公司都抢着搞大模型,就像一条街上所有的店就突然开始都卖快餐了,这个时候能快速上岗,出餐稳还不贵的厨师就成了宝贝。嗯,这个道理大家都能懂吗?那现在的结果呢?就华为这个大厨培训班上岗的速度跟不上开店的速度了, 预计今年能上岗七十五万个,但在外面等着的远远不止这个数字。所以就以现在出现大厂都在托关系派长队去抢购这个升腾九五零的芯片。 所以你看华为升腾九五零这场仗,其实他打的是非常非常聪明的,因为我们知道自自己的薄弱点在哪里,我们的芯片的制成工艺没有那么高,我们只能用略微差一点的芯片,但是我们能通过呃完美的调度协同去搞出这样一个三八四的超节点出来啊,与之跟你抗衡。那 他并没有硬碰硬的去争这个单挑之王的名号,而是换了个赛道,成为了效率之王,用一套超级中央厨房的系统,站在中国 ai 落地的这场大潮里,稳稳的站住了脚跟,我觉得这个才是真实又厉害的进步,因为知己知彼,我知道自己的短处,我也知道你的长处,我们扬长避短。 好,我是左伟,关注我,我带大家一起去了解华为更多的黑科技,我们下期再见!

abf 在 版摩根史丹利超级周期才刚刚开始,二零三零年缺口扩大至百分之二十二一、 abf 膜类。 abf 膜这一环节是打破海外垄断的关键,业绩弹性最大。目前实现量产或明确对标 abf 的 上市公司主要有 华正新材被视为 a 股最纯正的 a、 b、 f 概念龙头之一。公司自主研发的 c、 b、 f 基层绝缘膜作为 a、 b、 f 替代方案已实现量产,部分性能指标超越日本未知数,并成功切入华为升腾供应链,正在中兴国际等头部大厂加速验证。莲花控股 通过收购深圳纽菲斯快速切入赛道,其子公司是国内极少数实现高阶 a、 b、 f 膜量产的企业,产品已进入新兴电子、深南电路等头部 p、 c、 b、 i、 c 载板厂商供应链, 且新订单报价具备显著的成本优势。南亚新材通过关联公司布局 a、 b、 f 膜领域,投资建设的高性能基层膜智能工厂主体已封顶,只在实现国产替代突破。二、 a、 b、 f 载板制造, 这些企业直接生产 fcbga 高端载板。受益于量价齐升,深南电路国内高端 pcb 及 abf 载板绝对龙头公司二十层 abf 载板以批量量产广州基地产能稳固扩张,产品已通过英伟达、 amd 等国际巨头认证, 国内试占率超百分之六十。星森科技国内 ic 载板先行者,也是全球第五家实现 fcbga 高端 abf 载板量产的国产企业。珠海基地产线量率已突破百分之九十,进入英伟达、华为供应链,二零二六年产能释放将带来强劲增长。捧顶控股 全球 pcb 绝对龙头, abf 载板技术国内领先,已直接进入英伟达 amd 核心供应链,是目前国内 abf 载板量产能力最强、订单最饱满的公司之一。 三、其他配套及上游原材料生意科技附铜板龙头研发了类 abf 基层膜,并通过长电科技 coloros 二封装验证,同时作为 abf 基板上游材料龙头,为高端载板提供关键基材。 红河科技打破日企垄断,小批量供货高端 t glass 波纤布,这是 abf 载板不可互削的核心原料。中京电子积极布局高速 abf 载板业务,目前处于产品研发和客户验证阶段,未来成长空间较大。

deepsea 深度适配升腾 deepsea 全面深度适配华为升腾生态,叠加升腾九五零芯片有望提前上线,整条升腾产业链迎来系统性爆发行情,成为当下 a 股最确定、最核心的投资主线。 本次产业核心催化来自模型与算力的双向深度绑定,彻底完成国产 ai 商业化闭环。近期, deepsix v 四模型迎来重磅升级,不仅官方降价百分之七十五,还大幅提升 api 并发能力与推理速度。 而这一系列极致性能优化,核心底层支撑并非软件微调,而是华为升腾九五零超节点提前部署落地。这也标志着国产顶级大模型 deepseek 与国产顶级算力升腾彻底摆脱对外依赖,完成全方位适配协调, 从过往的概念预期,正式迈入规模化商用、业绩持续兑现的全新阶段。国产 ai 自主可控产业逻辑彻底走通,硬件端核心标的强势延续行情,易华股份持续连板走强,逻辑完美闭环。 公司作为华为升腾高速 i o 连接器核心独家供应商,旗下版对版连接器已顺利通过升腾超节点服务器权威认证,单机配套价值提升二到三倍,产业数据实打实落地。益华股份一季度升腾相关订单同比暴涨百分之三百以上。 随着升腾九五零芯片加速量产上量, deepsea 模型全面适配落地,公司硬件出货量迎来持续爆发。作为升腾硬件端最核心、最纯正的受益标的,行情持续性充足。 除硬件端外,升腾生态分销区域落地环节逻辑彻底清晰,确定性拉满。一拖五月二十四日,华为升腾生态伙伴大会官方正式落地,总经消息,模式加速全国算力生态布局,两大核心总代加区域标杆标地价值全面重估。 第一,核心总经销双龙头深圳华强、神州数码两家企业是华为官方唯一认证的升腾计算部件总经销商,承担全国升腾服务器算力硬件的全域分销技术赋能与生态拓展工作,是华为搭建全国 ai 算力生态的核心中枢纽。 其中,神舟数码具备双重核心逻辑,不仅手握升腾整机分销资质,同时布局升腾服务器 odm 自研制造业务,叠加上游英挑 cpu 涨价力好,双重锦旗加持,赛道地位无可替代。 随着 deepsea 适配落地算力需求爆发,两家企业分销业务将迎来量级式增长。第二,区域生态标杆标地重城科技 作为华为升腾河南区域核心合作伙伴,深度受益于升腾生态下沉战略, 一托华为区域生态伙伴大会落地的总经销模式,公司精准承接区域政企客户算力、方案设计、设备部署、后期运维等全链条服务,是升腾算力从全国总部落地地方市场的核心标杆企业,区域增量空间彻底打开。 整体来看,本轮升腾产业链行情具备极强的产业支撑,国际层层递进完美闭环。底层是升腾九五零芯片提前量产的算力突破,中层是 deepsea 模型降价提速的商用落地,顶层是华为总经销模式铺开的生态扩张。 当前市场最清晰的投资路径已经明确,硬件端持续锁定翼华股份,深度受益算力硬件放量 生态端,重点关注深圳华强、神舟数码、众诚科技,全方位把握深腾生态规模化落地的产业红利。 风险提示,芯片量产进度、模型适配落地节奏存在不及预期风险。行业市场竞争加聚,板块短期情绪与估值存在波动风险。产业技术路线存在迭代更新风险。 免责声明,本视频内容仅为产业信息客观科普,不含任何各股推荐。投资建议,不构成任何交易依据。投资有风险,入市需谨慎。

华为在北京办了一场大会,很多人可能没太注意,但这件事对整个 ai 算力产业链的影响,可能比你想的大得多。五月二十二号,鲲鹏升腾开发者大会,二零二六上, 华为做了一个关键动作,升腾 c a n n 全面开源开放,同时发布了升腾九五零芯片的超节点架构。 很多人一听 ai 算力,觉得就是 gpu、 算力集群这些老概念,但这次华为释放的信号很明确, ai 正在从被动响应走向主动决策,一个全新的计算范式正在成型,如果你还在盯着旧方向,可能已经错过了一个关键拐点。先搞清楚这次大会到底说了什么?两个核心关键词, ai 和超节点架构。 ai, 也就是智能体式 ai, 跟现在大家用的 chat、 gpt 有 什么区别?现在的 ai 大 模型是你说一句,他答一句,是被动响应。而 ai 是 ai 自己思考、自己决策,自己调用工具去完成复杂任务,是主动协同执行,从聊天机器人到数字员工,这是质的跨越。 华为这次的核心判断是未来的算力底座不再只为大模型训练设计,而是为运行 agent 负债重塑,这就需要全新的芯片架构、系统架构和软件架构来支撑。 升腾九五零芯片的超节点架构瞄准的就是 agent 场景下的三大刚需,超大 k v、 catch、 超低时延、超长上下文。简单说就是让多个芯片像一台超级计算机一样协同工作,专门为智能体服务。为什么?这次大会值得关注?三个条件正在同时成熟。 第一,技术条件,升腾九五零通过优异的互联能力,构建出更高待宽、更低食盐覆盖范围更大的超节点。同时, c a n 全面开源,兼容 pettorch、 v l、 l m 等主流 ai 框架,开发者不用改变使用习惯就能调用升腾硬件。这意味着什么? 生态壁垒在降低,采用门槛在下降。第二,产业条件。据大会数据,截至目前,鲲鹏已携手七千余家生态伙伴, 联合孵化两万七千余个解决方案,积累了四百一十五万名专业开发者。这不是一个从零起步的生态,而是一个有庞大开发者基数的成熟生态在做技术升级。 第三,需求条件。 agent 从概念走向落地,对算力的需求不再只是更多算力,而是更适合 agent 的 算力。芯片的算力、内存带宽、内存容量、互联 i o 带宽这四大核心指标在不同 agent 的 场景下,优先级各有差异, 需要全新的架构设计来平衡。从产业链导来看,算力芯片到服务器整机制造,再到软件适配层和行业应用, 每个环节都可能有新的需求释放。升腾服务器制造环节有神舟数码旗下的神舟昆泰,行业应用落地环节有拓维信息在教育、交通等领域的案例。产业链其他环节还有大量相关企业值得关注。除了上述两大公司,从芯片代工到光模块,从散热方案到服务器制造, 升腾和鲲鹏的产业链上还有大量相关企业值得关注。值得注意的一个信号是, c a n n 全面开源,意味着华为在主动降低升腾生态的接入门槛。对于国产算力产业链来说,这是从能用到好用再到易用的关键跨越 mind 系列软件的全面升级也在印证这个方向。 mindspring 面向超节点做组件化解,偶 mindspeed 通过架构革新,让开源社区更方便地调用。升腾算力, mindae 系列软件站全新升级,让推理更快、更稳、更简单。 当然,以上只是基于公开信息的逻辑梳理,国产算力替代是一个长期过程,短期业绩兑现节奏需要理性看待,技术路线竞争也存在不确定性。 升腾 c a n n 全面开源,超节点架构发布,四百一十五万开发者生态。这三件事放在一起看,华为正在为 agentai 时代的算力底座做系统性布局,从被动响应到主动决策, ai 的 范式在变,算力底座也在跟着变。 这不是一个孤立事件,它意味着国产算力正在围绕 a 阵子场景构建自主的技术范式。你觉得国产算力生态能不能跑出来?

今天国内科技圈最大的新闻应该就是华为提出了一个全新的概念, top scaling law, 也被翻译成 top 定律。那同时呢,华为还发布了一个非常关键的新技术路线,那 就是逻辑 folding, 逻辑折叠。那华为表示有望在二零三一年之前做出等效一点四纳米芯片。那大家都在热议华为的这一套 top 定律和逻辑折叠,到底讲的 是什么呢?我们先来说掏定律,我们都知道,现在已经进入了后摩尔定律时代,传统上每十八到二十四个月晶体管密度翻一翻的摩尔定律,在物理上已经接近 极限。所以呢,华为提出了一个全新的视角,不要只问晶体管还能不能变小,而是问信号还能不能传得更快,数据还能不能搬得更短,系统等待时间 能不能更少。那这里的 to 可以 理解为时间长数。在电路里面,时间长数跟两个东西有关, r 电阻以及 c 电容。 公式可以简化理解为 to 等于 r 乘以 c, 电阻越大,电容也就越大,信号变化越慢,那导线越长,电阻和电容通常也越大,所以呢,信号走得越远, 延迟就越高,功耗也越高,这就是掏定律的核心。那过去呢,靠缩小晶体管来提升性能,未来还要靠压缩时间,缩短路径,减少等待时间来提升系统性能。那掏定律呢,不是一个单一的技术,而是一个全站优化的框架, 覆盖了四层器件级、电路级、芯片级以及系统级。大家可以看这张图的电路级,这里有一个记忆点,那接下来我们来看掏定律和 逻辑折叠到底是什么关系?两者的关系呢?可以这样子理解,掏定律是理论框架,而逻辑折叠是其中在电路层面的工程实现。 奥定律回答的是芯片能不能单纯缩小晶体管还能怎么变快。而折叠逻辑呢,回答的是在电路层面怎么把信号路径变短。 那到底什么是逻辑折叠呢?传统芯片设计呢,像一张奥维的平面图,逻辑门触发器、存储单元,信号线都铺在这个平面上,那很多信号呢,要在这个平面上 很远的路,这就像是一个城市,只有平面的道路,没有立交桥以及地铁,那车越来越多,路也越来越长,堵车就不可避免了。逻辑折叠的意思呢,是把一部分原本铺在二维平面上的逻辑电路拆分到 上下多层金源里面,通过垂直连接打通。也就是说,过去芯片是一层大平层,而逻辑折叠呢,是要把它变成很多层楼,那过去信号可能要在平面上走几百微米甚至是毫米级,那现在呢,可以通过垂直方向 宽楼连接,距离可能只有几十微米。逻辑折叠不是传统意义上的封装阶段 die to die stacking, 而是呢,在设计阶段就把芯片内部的电路下沉到啊门电路触发器级别, 在多层晶圆之间进行分布式设计,而不是简单的芯片。对芯片这个区别非常重要。很多人会把啊逻辑折叠和 covers s o i c forest h b m 混在一起,那它们呢,都属于从二维走向三维的大方向,但是层级不同,具体大家可以看这张图,所以逻辑折叠更细,它不是两个完整芯片垒在一起,而是一个芯片内部的逻辑电路被折叠到很多 多层。那为什么华为提出的这件事情很重要呢?因为先进封装制成的核心瓶颈已经不只是晶体管本身,而是互联和数据移动。所以呢,这件事真正的含义不是说啊,华为马上要拥有一点四纳米,而是华为试图 在先进光刻受限的情况下,用电路封装互联和系统工程获得接近先进制成的 等效受益。那这个会给哪些技术环节带来增量呢?混合建核是最核心的增量之一,混合建核的价值在于连接间距更小,信号路径更短,寄生电阻电容更低,贷款密度更高,那更适合金源到金源 die to wafer 的 高密度互联。 所以呢,如果逻辑折叠走向量产的话,我是说如果那混合建核设备、工艺、材料检测都会成为核心增量。 t s v 硅通孔可以理解为穿过硅片的垂直电梯井,那逻辑堆叠如果要把逻辑电路分布到上下,就必须要解决垂直方向的数据以及信号传输, t s v 的 直径和间距需要进一步的缩小,同时呢,对准 精度和量率要求都非常高。金源级堆叠以及三 d i c 逻辑堆叠本质上要求设计和制造从二维走向三维,那 这会带来金源级堆叠和三 d i c 的 增量。传统先进封装很多是在后道的封装环节,但是呢,逻辑堆叠更靠近的是设计以及前后道融合,那需要金源级的工艺封装工艺设计设计工具共同来配合。 d d a 呢,可能是最容易被低估的瓶颈,那逻辑堆叠呢,不是简单的把两个芯片叠起来,而是在设计阶段就把逻辑电路拆到上下多层, 这意味着传统的二维 e d a 已经不够用了。所以呢,国产 e d a 会迎来一个非常重要的新方向,从二维芯片设计工具走向三维集成设计平台两侧检测和量率控制。三维堆叠最大的问题就是量率,那二维芯片里面一个缺陷可 可能会影响一颗带,而逻辑堆叠这种更细力度的电路级折叠,对缺陷对准啊,空洞污染、撬取硬币都非常敏感。另外要说的一点是,移动芯片能够承受大幅提升的密度,因为呢,它的散热性尚可控制, 人工智能加速器则不然,在数据中心级功耗下,折叠逻辑电路会将瓶颈转移到散热。这也就是为什么华为选择在今年秋季发布的麒麟处理器上率先采用逻辑对叠技术的原因。 不过呢,比起这一次的掏定律,我更关注的是刚刚发布的升腾九五零 n p u 架构白皮书。那升腾九五零分为九五零 p r 以及九五零 d t 两个方向,九五零 p r 呢,是更偏向于呃推荐系统 大模型以及 prefer 都模态推理。呃,九五零 d t 更偏向于大模型训练后训练以及复杂推理生成九五零的第三代达芬奇架构,可以理解为一次专门为 ai 大 模型设计的 工厂大改造。如果把芯片比成一座超级工厂,那过去的问题不是机器够不够快,而是数据过不过来,仓库够不够大,工位之间交接太慢,升成九五零这一次升级呢,就是同时改造啊,生产机器仓储系统 步流通道。那首先呢,计算核心更聪明了,负责矩阵计算的 qq 支持 high f 八等低精度格式,那大模型计算并不需要每一步都精确到小数点后很多位,就像要称一车的西瓜,不需要精确到毫克,那算力功率大幅提升。 其次呢,是 wettercore, 支持 s i m d s i m t 混合编程,那两种模式结合可以让不同的 ai 任务可以找到更合适的处理方式。那第三呢,是升腾九五零建了更大的 线上数据仓库。第四呢,是物流通道更顺呢, cube 以及 vector 之间有直连通道,减少来回的搬运。那一句话总结的话呢,是生成九五零不是单纯的堆算力,而是在系统性解决大模型 算不完,存不下、传不动的问题。随着升腾 m p u。 的 架构调整,那今年 c s p。 的 业务将会有所斩获。大家还记不记得不久前 deepsea v 四签署升腾九五零 p r 合作的 消息,而近期呢, deepsea 宣布把 v 四 pro 永久性降价,这也意味着今年将会带来新的一轮放量,值得期待。以上就是本期内容,如果你觉得这期内容对你有所启发,欢迎点赞收藏关注,我是派我们下期见!

最近黄仁勋逛街不是上热搜了吗?全网都在夸他平易近人,热爱中国美食。醒醒吧,这个只是一场表演而已。 当你看到这位身价千亿的科技巨头,穿着标志性的黑色皮夹克,站在喧闹的大街上,大口大口的吃着面,甚至用生硬的中文和路人聊天合影的时候,很多人都被感动了,甚至有人感慨说,你看他骨子里还是个中国人,没有忘本。 这个在心理学上叫准社会交往,是一种由大众单向虚幻投射出来的心理依赖。就是你以为的老乡见老乡,在华尔街团队的眼里,不过是降低你防御值的廉价的麻醉剂而已。 你赶紧把视线从那碗冒着热气的那个猪脚面身上移开吧。抬头看一看英伟达在纳斯达克那条陡峭的 k 线图, 他每在夜市上吃一口,即便贪大洋彼岸的资本都在为之狂欢,他吃进嘴里哪是面啊,他吞下的是稳定中国市场预期的定型丸啊!很多人被情绪反复的洗脑,变成了记忆只有七秒的金鱼。 回想一下吧,就在前不久,当大洋彼岸挥舞着科技霸权的大棒,企图将中国彻底锁死的时候,这位和蔼可亲的老乡扮演着什么角色呢?他,黄仁勋,还有他的英伟达,没有任何的质疑, 瞬间切断了中国企业的顶级专利供应。我们的大冒险研发自动驾驶高效实验室,一夜之间面临釜底抽薪的致命绝境。 后来,为了不丢掉中国这一块最肥硕的利润蛋糕,英伟达又玩起了极其冷酷的精准刀法,他们推出了针对中国市场的特供版阉割芯片,这些芯片的性能被死死的卡在了禁令红线之下,一分一毫的都不多给你,价格上却依然的高高在上。一边严格的遵守漂亮国的战略意图, 死死的遏制中国,一边又极度的贪婪的盯着中国企业口袋里的真金白银,用残次品榨干你最后一点剩余价值,这个 才是资本的真实逻辑。既然当初你切断钻利时那么的冷酷决绝,为什么现在你要顶着一张笑脸跑来中国街头上吃大排档,疯狂的释放善意呢?答案其实也极其的赤裸,因为恐惧啊,全球 ai 浪潮狂热期正在慢慢的回归理性了,因为达想要维持它令人眩晕的高适应率,就绝对不能失去中国的市场。 更让他脊背发凉的是,遏制彻底打碎了中国科技界的幻想,却倒逼出了中国自主算力生态破釜沉舟般的突飞猛进。 以华为升腾芯片为代表的国产 ai 芯片,正以惊人速度疯狂的节带。在大量的推理场景和部分训练场景下的国产芯片,已经完全具备了替代英伟达严格版芯片的能力。一旦中国科技企业习惯了本土的算力生态,从硬件到软件实现闭环的运转,英伟达将面临被永久的剔除的风险。 他根本不是来品尝风味美食的,他是来给客户做心理按摩的,是用个人魅力这一块遮羞布,去掩盖英伟大在华即将面临的断崖式的崩溃式的恐惧。 黄仁勋出生于台湾,成长于美国,拿的是美国护照,受的是纯正的西方精英式的教育,在他的灵魂深处,那张华人面孔仅仅是一个生理特征,在商业博弈中,这张脸反而是他实施情绪催眠的最强武器。他是一个彻头彻尾的亲吻。在西方资本修罗场里的顶级掠食者。 看透了这一切,我们该如何面对跨国巨头们的公关手腕呢?是愤怒去抵制,去砸了他吃面的桌子?不,那依然是弱者的情绪发泄。真正的成熟和破局,是建立理性的情绪防火墙,把商业还原为冷酷的交易。第一, 商人就当商人看,戒掉情感的依赖。如果当下技术迭代确实离不开他的芯片,那就去买再生研商啊,交钱拿货,转身拼命的去搞自主研发。千万不要对卖给你拐杖的那个人感恩戴德,哪怕他打断你腿的时候表现的很无奈。第二,收起你廉价的工情吧,把流量留给那些在暗夜里负重前行的国产制造 一个真正强大的民族,不需要靠跨国企业 ceo 吃我们的烤串来获得文化认同,核心技术的尊严是求不来的,更是用热情招待不来的。 当年,我们没有因为外国专家的连夜撤离而失去两弹一星,今天,我们同样不会因为几块被掐着脖子的芯片而错失人工智能的时代,丢掉幻想,用无坚不摧的硬核实力去迎回这个世界最真实的敬畏。

就算中国的电价不要钱,华为声能九五零 pr 还是打不过英伟达的 b 三百,这其实就是事实。现在呢,就让我这个大二学生为你们硬核拆解这场中美顶端的科技较量。让我们邀请选手华为、英伟达和谷歌。 有没有人好奇啊,为什么还有谷歌的事?其实啊,在全球市场上,谷歌也是重要的 ai 三零玩家。目前市场上主要的玩家其实就两类,第一种,以英伟达为代表的 gpu 流派, 目前国内所有的大模型,还有叉 gpt 和 rock 都是使用 gpu 的 流派。第二种是以谷歌为代表的 tpu 流派,这个流派有 jimmy lake cloud 和苹果。怎么理解他俩的差别呢?我们来请出一个小时厨房。 英伟达的 gpu 就 像很多个全能的超级大厨,手里工具齐全,不管是切丝、雕花还是烤蛋糕,立刻就能上手, 所以他非常灵活,适合研发新模型。而谷歌的 tpu 更像是中央厨房流水线,嗯,就像那个西贝,剥蒜的剥蒜,炒菜的炒菜,微波炉加热的指挥加热,在大光门没法推理时,因为他省去了来回换工具的动作, 速度更快,更省电。缺点是一旦流程变了,效率就直线暴跌,所以他只能在谷歌云上托管,不对外售卖。 简单总结一下, gpu 更适合规模的定制化和随时的架构变动,而谷歌的方案更适合成熟的大模型架构没有大的调整,但速度更快,成本更低。这么一说是不是就清楚多了?很显然,华为走的是 gpu 这条路。 前一阵华为刚发布升腾九五零 pr, 就 收获了不少订单,包括字节跳动、阿里巴巴在内的多家科技巨头都计划下单这张卡。高端 hbm 版本的售价约为七万元人民币,按照这个价格和出货量计算,九五零 pr 今年将为华为创造约六十亿美元的收入。 这里有个关键词,就是 hbm 显存。其实纵观所有方案,都绕不开两个关键技术, hbm 显存和先进的芯片制成。 先进制程很好理解,大家熟悉的台积电就是全球最先进芯片制造工艺,几乎唯一的供应商。那么 hbm 又是啥? hbm 其实就是显存,只不过速度很高,所以用三 d 封装工艺直接连接 gpu, 减少了数据交换的距离。 举个反例,你们在宿舍打游戏的那种便宜显卡的显存都在显卡主板上,这样就慢很多。 ai 模型的参数量巨大, gpu 算的极快,如果显存传输速度不够, gpu 就 会停工,就算炒菜炒一半等原材料。传统的显存,比如 g、 d、 d、 r, 像是放在厨房门外的普通冰箱,大厨每做一道菜都要跑进跑出拿食材,路程远且门缝窄。而 hbm 则是直接在大厨手边堆了一叠高度压缩的立体冰箱,它通过把多层内存芯片像盖楼一样垂直堆叠在一起,直接搬到大厨手旁边,消除了搬运食材的距离。 现实是,对于华为来讲,既没有先进的芯片制成,又没有好用的 hbm, 全国产方案是怎么来的呢? 事实,在国际上,目前只有三家企业能掌握 hbm 的 核心技术,三星、海力士和镁光。这也是前一阵储存涨价的核心逻辑。生产线都去搞 hbm 了,普通低利润的内存没人生产, 所以华为这套流程演变为,华为设计 hbm 架构,由长兴提供基础的储存金源。接着大概率是中兴国际负责代工,盛和金微负责封装。也就是说,纯国产的方案把英伟达、博通、海力士台机电变成了华为、长兴、中兴、盛和金微,实现了完全自主可控。 但不可否认的是,由于技术带差,每项技术都差点意思。目前网上的对比,更多的是华为声动九五零和英伟达很早之前的入门级 h 二零对比,这并不公平,要比就比最新量产的 d 三百 升腾九五零, hbm 的 速度相较于 b 三百仍然相差五倍左右。在核心规格上,无论是 f p 八训练算力,还是 f p 四推理算力,因为达 b 三百的性能都是华为九五零 pr 的 九倍。但是华为正从另一条路寻求突破,那就是华为传统的优势项目,数据交换和通信。 换个思路,单颗芯片打不过华为,就搞 super pad 集群,它能把几千甚至上万颗九五零芯片像搭积木一样完美锁死。 在这种规模下,整个集群的算力利用率极高。如果说普通芯片之间通信是走乡村小道,那九五零之间就是走双向十六车道,它让成千上万颗芯片连接在一起,数据交换几乎没有延迟,就像一颗巨大的超级大脑在同步思考。 所以声动九五零最终的不是参数,而是工业韧性和体系化作战。在算力被封锁的当下,这就是国产 ai 的 救命稻草。 但是商业就是商业,我们还要算一笔计算的经济账,对于目前的计算来说,无非就是训练和推理, 这两个词理解起来也很容易。训练是从零用数据造一个大模型的过程,而推理是已经有一个模型之后使用它来帮你完成工作。一亿美金大家都有吧,现在我们只买显卡,注意我们的前置条件,这一亿美金是纯粹的 gpu 采购预算,并且算力按照筹密算力来计算性价比。 在实际运营中,我们还要额外套一笔极高的基建和运营费用,比如庞大的场地租聘费、三人设备建设费、电费以及人工运维成本。 事实上,由于华为卡更多,需要更多的场地和散热,网络成本更高,集群计算效率更低,并且缺乏扩大生态,运维成本也更高。但是为了方便计算,我们先忽略掉这些。 最终对比的卡数是,华为升腾九五零 pr 一 万张 vs 英伟达 b 三百一千六百六十六张。假设这两套集训率百分百全面爆发,我们可以看到,集训 f p 八,训练极限,英伟达是十一点六六一副 lops, 华为是七点八一副 lops, 集群 f p 四推理极限,英伟达是二十三点三二亿 flops, 华为是十五点六亿 flops。 最终结论是,花同样的一亿美元,英伟达的产出无论是推理还是训练都比华为多出近百分之五十。此时可能就有大聪明说,中国的电价很便宜,一定能比美国的成本低。 那么我们就再计算一点,如果升腾九五零大规模集聚的所有电费为零,英伟达 b 三百,算上散热和空调,所有的一切按照三年的运行时间算,两者的推力成本能接近吗? 华为三年的应用成本按一亿美元算,其单位算力成本约是六百四十一万美元每亿 flops。 英伟达的电费往高了算,三年总拥有成本 tco 约为一点零八七五亿美元,及单位算力成本约四百六十六万美元每亿 flops。 就算华为连散热和空调电费都不交,三年下来,它的综合推理成本依然比英伟达贵了将近百分之三十七。 要用电费磨平这个差距需要工作十七年。这就是我们开头所说的结论,即使电费降为零,华为升腾九五零的推理和训练成本仍然高于英伟达 b 三百,那么华为升腾的技术意义到底在哪里呢?我们忽略了一个重要的东西,中线存持的绝对碾压。 虽然华为单卡显存只有一百二十八 gb, 但一万张卡加起来就是一点二八 gb, 而英伟达一千六百六十六张卡总和也才约零点四八 gb。 华为在显存容量上反超将近三倍。这意味着,当你需要加载一个极其庞大的超万亿参数模型,或者要进行极长上下文的全集缓存时, 华为机型的一点二八 pb 显存池可以直接把整个巨无霸模型完整的通进显存里运行,而一亿美金的英伟达只能爆显存。此外,目前主流的顶尖模型,比如 gbt 五 glm 等 都全面转向了 moe 架构,华为单卡算力弱、待宽窄的缺点在 moe 架构下被巧妙的隐藏了起来,而它一万张卡带来的一点二八 pb 恐怖显存刚好用来存放 moe 那 成千上百个专家的参数。 在性价比预算下,华为的实际效果随着魔性的迭代和软件的优化,依然有进步空间。我们单看投资回报率,华为这张卡确实会被英伟达打得毫无还手之力。但是英伟达 b 三百,国内你买不到啊,高性能的 hbm 你 也买不到啊! 现实世界从来不是单纯的数学题,而是残酷的生存题。在当前的局势下,华为这张卡不仅有意义,而且是关乎国内 ai 产业密脉的战略资产。 在美国的算力封锁和出口管制下,高端的算力芯片早就断供。在这个前提下,华为的九五零 p r 不是 选择题,而是填空题里的唯一标准答案。性能低一点,内耗大一点,总好比彻底断网停摆。有算力跑模型,就有留在牌桌上的资格。纯国产完全自主可控的权重远远大于性价比。 这笔账算的不是商业利润。有了声能九五零,即使技术落后,中国就是世界上唯一一个能独立制造 hbm 显存、高性能 gpu 的 国家。正是因为如此,我们才更要正视差距,努力追赶。