呃,其实英伟达呃,黄志坚出场也是去介绍了一下整体的背景,也是讲到了其实跟他上个业绩会的这个口径一样啊,有时候现在整体进入了这个就是 agent 的 推移时代啊,正式进入 agent 的 推移时代,然后也是展示了跟英伟达去深度合作的这些 这个 ai 原声的公司啊,也是讲到了就是啊,各个领域的这个 ai 原声公司呢啊,在这个,呃呃,以 在整个二五年呢,是包括从融资的角度啊,包括从这个规模扩张的角度啊,都迎来了这个飞速的增长, 然后整个行业呢,是获得了一百五十亿美元的这个风险投资啊,是人类历史规模上最大的一次。然后回顾了之前的整个的 ai 发展啊,从二十三年的这个生成式 呢啊,到了这个 reason ai 啊,也就是说 从二二四年啊,二四年九月份的这个啊拆的 g p t o 一 的诞生开始 啊,那这时候其实一个显著的特征就是输出的头肯啊,去急剧的增长啊,那在这个过程中呢,其实输入的头肯代表了这个模型去理解用户的一个指令啊,那输出其实代表了这个,呃,这个就是啊,这个模型的思考过程 学输出,我们当时就看到了这个思维电中不断的有这个啊,思考的啊,过程啊,有,有这个思维电的这个在在不断的输出啊,那这是二十四年的一个范式啊,那到二五年年底已经年底 建的这个 go 的 啊,也是正式进入了这个 a 政的时代啊,有 ai 啊,也是讲到了就是 ai 能够完成人类工作啊,并且富有成果啊,这也是成为啊整个的这个 ai 技术的一个关键, 所以说现在进入了就是新的啊,这个推理时代的这个转折点啊。所以,所以说从过去两年来看啊,整体看这个算力需求的一个变化啊,推理饭吃的转变,使得了这个计算量的需求是扩大了一万倍啊,也就是说,呃,我们之前的这个 呃,跟完成单次任务的啊,这个推理饭吃的这个算力需求相比啊,是提升了一万倍啊,再加上了这个使用量 扩大了一百倍啊,所以说这里啊,老黄提到了给他一个模糊数字啊,就整体的算力需求是增长了啊,一百万倍啊,这是,这是,呃目前推理时推,呃,就是进入推理时代这样的一个背景 啊。那下面的话,其实我们是啊,就是整个昨晚啊,因为今天凌晨这个 啊,二两点到四点,整个这个英美达它的股价跳涨最明显的啊,这个,呃,一页 ppt 就 来了啊,一个是他继续去强调,呃,去重申,到了,就截止到啊,二六年底 啊,这个五千亿的这个销售目标,那这个销售目标呢,是在去年啊,十月份的这个华盛顿华盛顿 gtc 大 会上啊,去提出来的,当时其实他讲到了就是,呃,呃,目前正在交付的这个 blackwell, 其实他是从年,呃,从 这个算六个季度一共是五千亿啊,那,那讲到是就是呃, g 三百,再加上这个呃,就是二六年下半年少量出货的这个 rubin, 加起来一共是这个五千亿的一个销售目标啊, 那这次重申了这个目标,就是二零年底啊,达到这个目标,然后再又一次讲到了说到二七年 这个规模至少达到一万亿啊,所以说我们解这么一万亿,其实他们下面的这个轴上啊,去标注的是二五到二七年啊,这个,那怎么去理解这个数字啊? 因为这个数字呢?其实,呃,提供一个理解角度啊,他其实是,他其实是是去讲到了就是截至我,我理解应该是他啊,目前如果以截至二七年的维度来看啊,目前在呃看到的这些确就是确定性的。这个 如果滚动到啊,这个二七年底是来到了一万亿啊,所以说这个数字呢,其实他,嗯,其实当时因为会议说的也比较模糊啊,他应该也不是说现在给到一个明确指引,就是二七年单年啊,有一万亿啊,那其实他讲到的就是可能目前的债主名单,如果我们跟这个五六个月 啊,这个之前的这个啊,华盛顿 dc 啊,华盛顿的这个 dc 相比的话啊,其实现在是来到了这个一万亿的水平啊,这是,这是也也是对未来的这个史努比系列的这个增长的版图呢,去提供了 这样的一个信息的一个指引啊,然后包括这他去讲到的现在一个收入结构啊,就是百分之六十的是这个,他说的是五大啊,这个 high pro 厂商啊,那其实包括四大 c s p 啊,再加上啊,应该加上 oracle 啊,是占到百分之六十的 这个收入占比,然后啊百分之四十呢,是其他的,包括,呃,各各种的这种传媒企业,然后 啊,机器人、边缘计算啊等一些这种肠胃的啊,一些场景啊,这是他目前的这样一个,呃,这是他这个一个这个 一个情况啊,当时也是讲的黄军讲的这个一万亿呢,其实英伟达,当英伟达晚上是最高是拉到四个多点啊,拉到四个多点,但是后面呢啊又又有逐步的兑现啊,这是,这是他呃,这是 对对未来收入一个整体的指引啊,所以说呃,其实刚才铺垫这么多啊,所以讲到这个又是进入这个时代啊,也好,其实为了是说明一个点呢,就是下面这个图,其实因为呃,其实呃,老黄在这次大会上就讲到这个部分的时候,明显明显是感觉到跟之前的大会 相比来看,其实他的语气中我感觉是比较强硬的,就有点带着气的这种感觉啊,他其实就讲到了 就是呃,这里是也是呃强,也是对这个推移时代去看空啊, n v 的 这些声音啊,给到一个强力的一个反击啊,他其实这里的呃就是用的这个 呃数据啊,他其实如果我们看左边这个图啊,那其实跟上次 g d c 的 这个通讯学的数数据的那个呃,那个图其实差不多的啊,横轴依然是就是美用户 的这个呃分到最大投肯啊,那其实我们可以理解成就是横轴啊,我们可以把它理解成这个食盐的一个呃,一个这个这个 呃成成反比的这样一个指标啊,那其实相当于就是在用户可接受的这个食盐价给用给单用户去提供的这个最大的投肯量啊,然后重轴呢?它这里它是用的是这个,就是每 啊相当于美啊美美瓦特的这个数数,呃,这个 ai 工厂,也就是说集群啊,去提供的 这个啊,收入啊,其实我们可以把它理解成就是啊宋卓和仍然是这个宋祖亮的一个概念啊,因为宋祖亮其实相当于我们在啊 ai 工厂去卖,呃,去去售卖托根他的这个量的概念啊,所以说这个里面我们看他给到的是 g b 三百的啊, g p 三百相比这个 h 二百啊,是提升了,呃,每,呃是提升了五十五十的这个学习效率,也就说 我在同在这个电力有限的情况下啊,能够去 ai 工厂去能够去产生的最大收益是提升了五十倍啊,同时成本呢是降低了三十五倍。然后在这个图中呢,我们也看到这个灰色曲线是它 这个呃,写的这个就是竞争,竞争对手的曲线啊,那这里的话啊,他没有具体给到我们两家,应该是我们可以可以,可以,呃,如果我们猜想的话,应该是某主流的这个 ic 的 产品啊,所以说这里才是用通过这个跟英特达一致,与 ic 强调点是一一致的啊,就是通过这个, 呃,我在每每每每瓦特上的这个性能表现是远高于这个竞争对手的,所以说啊可以创造这些收益呢,可以去磨平掉前期的啊,这个左右成本上啊带来的这个差距 啊。这是这是这个他继续强调到啊,就是 n v 仍是目前来看就是性价比,还是去强调这个点。 下面的话是来到这个大会的这个这本次 g d c 的 这个重点,重点的部分啊去去,呃给到了,就是啊一些新品的,包括这个维尔 rubin 啊的一些这个新的新品的一些细节。 好,那我们看到这相比于上次 c e s 啊,上次 c e s。 大 啊,年初 c e s 大 会的时候给到我们当时主要引入的这个最大的新品是这个就是 b f 四啊,路飞的四,这个,呃,相当于存储存储管理芯片这个智能网卡啊, 这次的话是引入了,呃,几个之前之前从来没有讲到一个东西啊,然后新增量就包括以下几几个啊,一个是我们看到它是引入了这个,呃,但,呃,这里,这个,下面,下面这张图的这个第三个啊, 就是 very compute tree, 也有时候引入了这个单独配备,呃,这个 cpu, very cpu 的 啊,这个 compute tree 啊,然后引入了就是,呃,之前大家呃从 从会前所预期的啊,从,呃,当时包括我们在讲那个 gpc 前瞻的时候也跟大家讲过的啊,这个 l p lpu 的 这个 control tree 啊,大概是在下面这个图的最右边啊,这个啊,这个形态啊, 那它是每一个板子上呢,是配备了八颗啊,格鲁克三代的这个 lpu 啊。然后再就是给到了这个,就是它的这个, 呃, spectrum 啊,呃, cpu 的 这个 switch 啊,当然这个还是用于这个 skill up 的 部分的啊。然后再就是上次提到的这个啊, p f 四啊,那我们具体来看啊, 再次呃包,呃,在介绍这个玩 ruby 的 时候,他再次去强调到了就是目前的这个就是多个芯片啊,统一成一个系统, 再次去强调到了整个的 very ruby 的 一个系统的一个设计理念呢啊,包括把这个软件去融入到里面去啊,嗯,是一个从端到端啊,去协调优化的啊,这样的一个整体的 ai 推理系统 啊,然后啊下面这个图会更加清晰啊,左一的这个就是刚刚讲到八个啊,配备八个 lpu 的 这个 control tree 啊,我们可以看到它在呃它的这个形态呢,跟这个 呃,我们就我们这个熟知的这缓存的缓存的形态是一一样的啊,是啊,只不过上面也插了放了八块啊,这个啊,格鲁三的 lpu 啊,然后中间 呃中间这个的话还是是这个 m 一个 c 啊,没有什么太大的变化啊。然后这个呃这个就是传统的这个啊,玩 ruby 的 computer tree 啊,跟上次 cs 去介绍到一样,也说里面这个小跳线的一些设计啊,嗯, 具体说话了,这是上面没有像这个 g b 系列一样的,这个像上面的飞线啊,跳线的啊,这个部分了啊,全部都挤成在板子里面啊,所以说整体的他的这个装备的量率啊,包括装备的时间啊,都装备量率提升啊,装备时间大大缩短啊。 然后右边这个右边这张图来看啊,这个最左边啊,这个就是 b f 四它的一个存储管理芯片啊,然后中间的话是这个 very very cpu 的 啊,单独的这个 computer 啊,但是这个的话,在这次其实上次业绩会的时候也提到就是说这个 呃,电信上他会讲去单独售卖啊, c p u 的 这个事啊,但是,但是,其实他只是给也是给到了这个产品,也是讲到了就是在 a 政的时代大呃,这个 a a 政的推理啊,对于这个 c p u 的 赋值的一个提高,我们也看到他引入了这种单独的 单独的 contrast 去相对于去提升了这个整体的这个 cpu 跟 gpu 的 一个配置。有单独的啊,就是解偶的这种 cpu 啊,当然啊,但是没有给,呃,这里就没有给到太多的细节啊,当然我觉得就是啊,后续这个 a 正推理的占比提升了,这个就是 cpu 啊, cpu 的 这个, 嗯,至少 cpu 在 在 a 正时代去承担更多的工作啊。去这个逻辑应该是没有什么问题的,只不过说后续这种单独配备的这个 cpu 到底有多大量呢啊,只不过现在还说不太清楚。 这是这是关于 cpu 哦,右边的话就是这个 specfone x 的 这个 cpu 的 产品啊,包括老王手里拿的这个啊,也是这个 cpu 的。 呃,这个食物啊,我看到跑外外侧有一圈的这个光影琴,好,这是,这是,呃,这是从从几个这个这个 细节上来看啊,这是发布的一个新品啊,然后那如何去理解这是整个 verubine 它带来的这个性能提升呢?然后以及如何去理解在因为啥在这个时候一定要引入这个 啊, grok 的 啊, lpu 进入它整个体系中呢啊,下面其实老黄给了我们观这个推理的啊,一个细致的一个解释。 左边这个图不知道能不能看的很清楚啊,左边这个图的横轴呢,其实它代表了就是啊,不同级别的这个模型 啊,不同级别的这个模型啊,老王也讲到就是这个模型的规模正在呃不断的扩大啊,然后从最初的可能十万个 token 的 输入长度,到现在去输出百万个 token 啊,所以说,嗯,他讲到的是 token, 就 像一,就像这个商品一样啊,就是 一旦发展到啊,发展成熟,也就说发展了也也,呃,就是 ai 到现在啊,也有个这个,这个三年多的时间了啊,一旦一旦说趋于成熟啊,那就会有一个不同的部分啊,所以说横轴其实也生动的代表了,就是目前我们在 openroot 上看到的这样的一个模型格局, 也就是说啊,头部最领先的模型呢,他啊可以有定价权啊,去收到最高的这个费用啊,然后下面呢,呃,就是这个,呃,更多更便宜的这个模型啊,可能去去去有更大的量啊。所以说横轴他现在代表的,包括我们看到 啊开源的这个二二二百三十五 b 版本的这个模型啊,相对于是是是免费提供的啊,包括在一些这个集群上啊,也是这个免费提供 到 kimi t 二点五啊,那他可能收取就是三三美元啊,每百万头肯的这个价格。然后再往右就是对应更高级的模型,包括到 gbt 啊,到到 gbt 五点四啊,再到这个就是, 呃,更更收费更贵的这个模型啊。来看,你就说现在模型上有这种啊,就是从横轴来看,它其实代表了这个就是模型的这个,我把这个图放大一点啊,就是代表了,呃,代表了当今当下这个模型的 啊,这个模型的分层,但是从这个图就是虽然他是不同模型,但是还可以代表一个什么, 其实它跟就是老黄居常用的这个通缉学那个图是是一样的啊,杭州它还是是代表了就是 gps 美用户啊,那那怎么理解呢?就是美用户可以分到的这个最大 token, 也说其实现在其实越智能的模型呢,它其实也是越 呃,呃就是每用户啊,在完成所问的问题的时候,他分到最大部分啊,是是更多的啊,所以说这个图跟呃老黄就是纵轴是呃是吨数量啊,横轴是在可以可以在一定程度上代表食盐的啊,那个图是一样的 啊,比如说横轴其实代表了呃其实是价格啊,然后纵轴的话就是这个数量啊,就是这个数量呃乘以这 个价格啊,所以说它其实我们看到的每条线呢,它跟这个 x 轴 y 轴啊,去围成这个面积啊,其实是代表了呃这个呃水 a 工厂得到的一个收入 啊,所以说这里我呃详细的介绍一下这个图是怎么去理解啊。那我们再去看到就是这里面的一个迭代的过程啊,就是从这个 over 系列啊,到这个呃 blackwell 系列啊,那呃到 blackwell 七十二啊, 其实是整体是提升了大概四百,呃三十五倍啊,提升了,呃提升了三十五倍的这个非理性效率啊,然后再从这个,嗯, 呃 blackwell 系列到这个 ruby 系列啊,这里又提升了啊,它我们可以看到不同模型它是提升的幅度是不一样的啊, 看到在呃这个比较便宜的模型啊,或者说单用户分到 token 量比较小的情况下啊,其实它可能就提升两倍啊,在最左侧来看,然后中间的话可能提升三倍啊,那最右侧啊,针对最大的优化,它正最右侧,它提供的 其实是最贵的这个模型,它是提升了这个十倍啊,也就是说,也就是说这个我们可以看到它是对于这个最大的模模型啊,这就是单用户分到最大 token 啊,这个模型是提供了最好的一个优化, 那其实这还代表什么呢?就是单用户分到 token 最大,其实也是代表了就是,呃,我们可以可以可以想象,就是在一定的标准时言下,用户可以分到最大, 越往右呢,越代表了就是对于食言的啊,一个高要求啊,我们可以可以把这个横轴同时理解成什么呢?同时理解成越往右啊,这个整体的食言啊,是越低的啊,所以说,呃,理解了这一点的话,我们就可以看,就可以下面就可以理解,就是, 呃,就是为什么要引,要引入这个 l p u l p x l p u 的 这个架构啊,比如说我们可以看到上面在这个图中呢,呃,它最大的,呃就是最大,呃,其实它就是支持到了什么呢?支持到了每用户相当于每 用户这个量啊,因为再往右它其实是不行了啊,那这里的这个限制呢,其实主要是来源于这个就是 h b m 的 一个贷宽啊, 是啊,食言,要不然食言就过大,是超出了这个用户的一个等待极限啊,所以说,呃,这个贷款的限制呢,导致了就是,呃每个用户他不能分到更大的啊,这个透客量啊, 所以说这里的话他就引入了这个,呃,就是 grog 啊,就是在这里去进行的 这个引入啊。那我们看这个右边这个图,我再放大一下,我们仔细的看一下,那其实刚才啊在横轴在这个位置啊,那现在横轴的这个单用户的这个头肯呢?是拓展到了一千以上啊,有时候这个曲线的一个呃延伸呢啊,就是由于这个 呃 l p u 啊所带来的啊,有时候 rubin 他 其实是不能够不能够去支持到啊,单用户啊,更大的一个头肯量的啊,所以说, 所以说这是啊 lpu 的 一个意义啊,一个最大意义啊,所以说我们如果看具体的使用场景的话,就说如果工作赋载是在编码啊和高价值工程的这个透明进程上,也就说在啊,在于这种高价值的 agent 和这个呃呃 和这个 coding agent 啊,这种这种场景下啊,这种场景下呢,它就没有呃像,就只有呃只有 gpu 的 话,它就是没有办法去提供更低视野的一个推理了啊,所以说要啊,要加入啊这个 groot 啊, 然后啊,黄志勋他跟他讲到的是我可能会在数据中心中百分之二十五的容量啊,去添加 groot, 也就是说啊, groot 跟 呃跟这个呃 gpu 啊去做一个,去做一个这个啊搭配啊,去进行使用啊,然后这里也讲到就是 group 三啊,这个 sram 呢,也是由三星啊进行提供,然后于 q 三去进行发货啊, 然后嗯,再就是其实这个也是比较符合,就是大家在 gtc 会前啊,对于这个的一个预期啊,对于 呃整体 l p u 的 一个预期啊,也说这次大会呢,可能呃就肯定不会发跟菲曼相去结合那个部分啊,可能肯定会要引入这个啊,就是单独的啊,这个 l p u 到整个系统中啊,但是跟大家之前的预期有所不同的一点是啊,就是之前呢 呃,大家可能会讲的是整个 lpu, 它可能会融入到这个 enigma 生态中,用 enigma 进行连接啊。但是老黄这里讲到就是他其实并没有用 enigma 啊,这里用了一种特殊模式的以太网啊,也说通过这个特殊模式以太网呢,去跟啊,去跟这个 ruby 啊,去进行这个连接啊, 就是呃,然后包括他把这个他的那个代代诺的这个推理的优化系统啊,也跟啊 lpu 去进行了一定的结合啊,然后一共是获得了这个三十五倍啊,三十五倍以上的这个性能提升啊。我,如果我们去, 呃,如果我们去对应这个上一张图啊,刚才看到这个 ruby 跟,呃这个 ruby 系列跟 blackwell 系列,其实上一张图这里是提升十倍啊,那加入了这个 rpu 之后呢?是啊,整体提升了三十五倍,而且是在然后如果我们看场景的话,就是在这个呃高吞吐量啊, 对于誓言要求不高的这种场景下啊,其实是提升不高的,尤其是在这个,就是对于誓言啊,要求高的这个这个场景下啊,那来迎来了一个很大的提升啊。所以说,所以说我们就在看现目前的这个 agent 带来的这个革命啊,就是这个对半是到底发生什么样的变化啊? 一个是那英伟达又又分别推出哪些应对啊?一个是这个呃,就是显著延长的这个上下纹啊,有更大的更大的这个 keep touch 啊,就是那英伟达的这个呃,支持。呃,这个变化呢,就是把整体的 嗯存储啊,去打通,嗯,包括从这个 s b m 啊,到 d r m 到这个 net 上面啊,去卸载这个 k v k, 然后再就是,嗯,处理器的深度大幅增加啊,那这里呢,既包括了对于存储要求,又包括了就是对于计算的一个要求, 然后包括再就是多智能体网携的网络带来的这个平发性和低延迟的一个要求啊,那这里的话给大家解决方案就是,呃,呃,如果我们 pd 分 离来看啊, profile 阶段的话,由这个如饼 gpu 进行完成,然后 dco 的 这个解码阶段啊,由 lpo 去进行完成啊, 那这里,这里其实可以多多说一点啊,不知道大家还记不记得就去。呃,应该是二五年九月份的时候吧啊,那时候又拿去推出那个 cps 卡啊,但是后续就是一直其实那个的预期,一开始的预期呢,也是在这个, 嗯,二六年下半年去进行发货啊,但是,但是我们看到这个后续啊, cps 那 个卡就没有后续了,那个那个卡当时是为了解决什么呢? 其实也是看到了这个推力时代,呃,这个,嗯,单依靠单一的 gpu 啊,可能是没有 更大的优势啊。那 cpx 它的这个设计建设计架构设计理念呢?其实是采用了这个 aspect 的 架构啊,那其实它更像是一个就是去提升整体的这个性价比的 啊。这个架构,因为它当时去强调的一个点,什么就是 cpx, 我 们知道它是去处理整个计算过程中的这个预选中的阶段 啊,去需要去引入这个 c p x 啊,那啊,包括他其实讲到 c p x, 当时没有说没有用到这个 h b m 呀,啊,因为不需要那么大的贷款啊,只是去需要去堆训练,去,去堆这个 profile 阶段的这个训练啊, 嗯,但是,但是我们看到明显看到就是这个方案,应该是这个被被英达放弃了啊,也是胎死腹中了啊。那现在啊,取之而来呢,是在整个集团中加呃,加加入了这个 l p u 啊,那 其实 c p s 它对应的是这个 prefill, 然后低,然后 l p u 呢,它其实对应的是这个 d c o 的 啊,它是完全两个阶段,之前也跟大家汇报过,就是推理时,推理时间啊,推理时代,到底啊,推理的这个过程中啊,这个到底会发生什么啊? 到底是一个怎么样的一个架构去进行,去进行的啊?所以说,所以说从这个点我们可以可以可以的。呃,理解到哪个点 可以理解到就是就是现在这个进入 a 证的时代之后呢?这个真正的这个食言的,或者说啊,更加去提升推理效率的卡点啊,其实是在这个 dq 的 阶段,而不是在 freestyle 阶段。所以说这也是为什么说因为咱在呃去放弃了 c p x, 转而去引入了, 有啊,所以说就是,呃,那我我们知道就是 prefer 的 阶段,它其实是影响,影响的是这个首个的 token 去生成的啊,这个时间,然后 dq 的 阶段呢,是影响了这个后续啊, token 啊,后续每个 token 去生成的这个时间, 比如说随着现在的这个词汇量变长了啊,那后续的这个头肯去生成时间呢,是变得啊,愈发重要,这也是为什么就是说 lpu 啊去呃这个,这个啊,被加入了这个集训中啊,但是啊, cps 被放弃,这是在这一点。 然后再就是呃第四个核心变化的话,就是这个多模态的推理啊,可以去处理各种多种任务啊。我们看啊,就是存储级的方案,跟他 这个就是引入了这个 b f 四,跟他的这个 c e s 上去讲到的点是一样的啊。然后当时我在讲那个 g d c 大 会前瞻的时候,当时讲到就是看他这个 b f 四会在会 去呃他的这个,呃就是额外的这个纯属积压啊。去这个这个客户的这个接受程度怎么样啊?我们看到这次给到了我们这个第一批啊,这个,呃 bluefield 四的他这个合作伙伴啊,我们看到就是不出意外还是他啊, 呃跟他控控股的这些,呃这些幸运厂商啊,先去进行部署啊,我们之前也呃就是这个呃,包括蔻维哇,包括 natus 啊,这里还包括,呃这个 aaron and lamda 啊,这些他呃因为拿去投资的这些幸运厂商,然后再就包括 orico 啊,所以说因为拿一一般的话来来看的话,有新品啊,包括有这种试验性的这个集群的这个互联的新品也好,或者计算的新品也好啊, 一般来说都会优先部署在这个幸运场当中啊。去去先先去跑啊,先去跑去去看效果啊。所以说第一批的这个存储机会呢啊,预计也都会啊,部署在他去 这个呃投资的啊,这几家有有所参股的啊,这几家这个幸运场上去做啊,那这是存储方面啊,那为了解决这个计算瓶颈加入了这个呃锐克啊,那我们看到 就是呃那呃加加入 gopro, 我 们看到就是它的整体的这个处理的啊,方式来看就是在预填中阶段啊,现在就是利用这个 gpu 的 核心啊,在预填中阶段,去 去去进行这个高速的计算,然后解码阶段的话啊,就是利用 gopro 啊,利用 gopro 的 stream 啊,去以极高的宽带去啊低延迟的啊,去生成生成 token 啊,去解决目前啊这个 a 证的时代下啊,最大更大的这个啊计算瓶颈啊。 所以说这是这是它引入呃这个 lpu 的 啊,整体的这个核心的核心的思想啊。好, 嗯那其实,呃那那 lpu 我 们就讲完了,如果下面我们再看这个就是大家再预期更呃,很很多的一个点,就是关于这个 camera 的 机柜,也就说关于这个 logo 叉的啊,这个互联架构。 但是,呃,这次呢,其实英伟达去,嗯,就是可能会前呢大家,呃比较激进的预期啊,可能预期到英伟达会在这个荣威奥斯的架构中去推脱 n p o 或者 c p 呃, n p o 或者这个 c p o 的 这个 就是光进 skill up 的 这个方案啊,但是很遗憾这次其实并没有给到我们这个具体的方案啊,具体的方案还是啊,就是之前 kyber 的 这个正佳贝版的啊,这个这个方案啊,有时候,呃,因为因为他他他是讲的就是中版的这个方案啊,那其实还是用这个 p d b 啊同连接去做这个 skill up 啊,也就说其实并没有更多的强调到这个 c p o 啊,但是好一点的,他其实也讲到了,就是在这个 rubicon 中啊,去也会考虑到啊,用这个啊 c p o 去做这个 scrap 啊,他他讲到就是将将同时采用啊同同 和这个 cpu 啊,去进行这个 skr 的 连接啊,所以说我理解的就是这次其实也没给,没没给到我们这个具体的方案,但是其实其实其实呃就是可能,可能是因为就是呃又拿这边的这个就是 skr 的 光光学的方案呢,其实可没有说真正的 啊,真正的真正的落地啊,真正的决定好用什么样的架构啊,所以说这次其实并没有给到我们这种实验性的这个实物展示啊, 可能这个 ruby outro 更再往后去去推进的时候,然后啊可能有更多的这个就是光镜 scout 方案啊,会展示出来啊。然后, 嗯,那总体最后再看一下,就是这个,呃整体的这个,呃七张卡啊,构成了现在的这个整个 ruby 肌群的啊,这个整体的啊,整体的这个架构, 对于对于之前的这个啊,包括跟之前的这个 oppo 系列的啊,这个整体的性能对比啊,如果相较于 oppo 的 话啊,整体性能是提升了这个如果啊从这个量角度来看啊,整体性能是提升了这个三百五十倍啊,那其实这个这个提升还是 啊就通过这一系列的这个系统级优化吧啊,提成还是比较大的啊。然后再就是给到了我们关于未来的这个 road map 啊,我们看到就是飞慢架构中啊,这里,呃,我们看到飞慢架构中包括这个飞慢 gpu 的 这个升级,然后这个 lp 四零的话 是这个就是就是呃,对于相,呃就相当于是这个 lpu 的 这个下一代的产品,然后我们看到分频啊,它标注了这个 link 也可以用, 通过这个之后就会将整体的这个 lpu 的 生态呢,去跟啊,通过那个去跟整个英达的这个生态进行打通,然后包括这个 rosa 的 啊, cpu 啊,就是后续下一代的这个 cpu 版本啊,包括下一代的这个 bf bf 五啊,然后这里这里我红框圈出来了,这个 其实大家比较比较期待的啊,这个 skill up 的 这个 cpu 的 部分啊,我们看它它这里是是 是是是放到了这个这个图啊,叫恩尼克八 cpu, 也就说可能在可能这个光镜,光镜机柜光镜这个 scratch 的 这个节奏呢,可能并没有说预想的那么快,后续还需要啊,去需要看可能入标串上,我估计会试验,会试验一版这个 scratch 用光的这个方案出来啊, 那这是这是下一单啊,但是关于下一单的这个菲曼架构呢,其实也没并没有给到我们呃更多的这个技术细节了,之前给到一个这个技术的一个展望啊, 好,这是这是关于这个发的整个的产品线的一个展望,然后包括也在也提到了,就是啊,也现在正在设计这个维尔 rubin 的 啊,这个 就是太空算力的这个模块啊,之后也会在这个考虑在这个太空中啊去建立整个数据中心。好,嗯,那上以上呢,是那个关于就是他的这个新品发布的一个部分。 那,那最后啊,就是新产品的这个部分,新一年产品的部分,然后下下面的话,它其实,呃去讲到了它整个的对于整个 a 阵的生态的啊,一个布局 发布了这个 namo cloud, namo cloud 啊,那就是其实相当于就是在英伟达自己的这个 open cloud 的 框架啊,也是参考英伟达,参考这个 open cloud 的 这个框架呢?去啊去提供了一个这个英伟达的啊这个解决方案啊,然后他 去讲到一个背景,就是说企业 it 从萨斯啊转向啊,转向这个 agent s service 啊,那这个点呢?其实他后面也也讲,也也介绍了一些这个,呃, 就是呃合作伙伴啊, service, 包括 servicenow 啊,包括包括一些其他啊,也就说从这个点来看的话,他其实讲到就是各个这个萨斯厂商呢,从之后啊,从之前的提供这个软件级服务,到后面 会提供这个不同的 agent 啊,那其实他这里我觉得他,嗯从他的居住来看的话,其实也讲到就是软件厂商他可能在这个业务流程理解上还是有很大的一个存在价值的啊,之后之后他是以这种 a 证的方式啊进行提供, 其实是不是可以理解成老黄其实也呃给给这个软件去进行站台呢?是不是可以理解成就是其实这个呃模型分析软件啊,可能也也会有利用啊,就是不会啊,不会是引来这么大的担心呢。 这个这个其实其实还还需要更多的一个时间去观察啊。然后,嗯,那再就是它的关于它的这个开源,开源的这个推理框架啊,就是 namo klo 的 这个推理框架啊,它以其实我们知道就之前 gtc 的 时候,因为啥它其实有自己的这个 a 阵的框架,叫那个蓝图嘛啊, 然后这次的话也是集也是整合了这个 open cloud 的 啊,整个的思想啊,然后包括去提供了这个快速快速部署啊,模型快速部署啊,这个 agent 的 这个环境啊,然后包括集成了一些这 这个呃 a 智能的这个工具软件啊,然后提供的这个沙沙香的环境,然后包括优达这面的这个开幕型啊,可以调用,然后包括就适配到了它的这个端侧硬件啊,我们看到现在国内啊,就是我们国内的这个各个端侧硬件, 各个这个开箱即用的这个 cloud 产品也是也是蠢蠢不行。所以说因为啊这边的这个动作呢,其实其实跟这个就是我们 cloud 出来之后,国内上传这动作也差不多啊,去强调它的这个端侧硬件产品啊,然后和 和这个它的整个的这个 cloud 框架啊,然后再就是前,然后再就是前几天的这个,呃, 伊美达这边发布了一个开源,就发布了这个新的开源模型啊, namotron, 呃, three super 啊,那这个模型的话,呃其实看整体评分来看还是 还是不错的啊,就是现在海外的整个的开整个开源模型的这个最大的声,最大的这个推动,其实是由是由伊美达去去推动的嘛。然后如果我们看这个榜单来看的话,其实它来到了这个 j r m k m k two 啊, 去拿拿到这些模型去进行对比啊,也就说强调了他的这个模型的一个能力,也就是说英伟达在,其实在在开源模型上,然后都,呃一直在这个不断去努力,然后包括前几天去讲到一个点,就是未来五年内将 将投资二百六十亿啊美元去用于构建这个开源模型啊,然后如果我们看现在英伟达他的整个的开源模型的家族呢?啊, 包括用于这个,呃,我们我们熟悉的,呃,就是包括用于这个 agent 的 这个,就是 number one, 这个就是主力的这个大眼开眼模型,然后包括这个啊, cosmos 啊,物理 ai, 然后 group 啊,这个机器人的啊,机器人的这个模型,然后再就是包括这个 cs 上去开源的这个啊, apple maya 啊,这个座驾式模型,然后 words two 是 这个,呃,相当于数字万生,数字万生这个模型,然后 bell 啊, nemo 是 它用于这个生物学的这个模型,所以说整体的这些开源模型呢,因为它确实是构建了一个比较好的一个生态, 然后包括这些模型,它的它的这个,呃,评分啊,包括在这个主权 a 的 这个采用啊,也是不也是不多的,呃,也也是也是不少的。所以说从这个点呢,呃,我要去讨论一个点啊,就是 这个优达为什么去要从现在这个角度要去发力去搞这些模型?第一个点啊,我觉得是这样。第一个点就是 啊,进入区块链时代之后啊, n v 是 看好这个云巧脏和模型层的这个利润增厚的啊。之前啊,就是英伟达去,当时 open i 跟英伟达去合作的时候啊,去投资,去投资 open i 的 时候 啊,去做过一个这样的拆解啊。这里面我们问一个大概的数啊,就是实际瓦的整个的商业投资啊,它整个一个价值链路是怎么流动的? 可以看到就是十几万的税中心啊,按自己的口径啊,他自己是可以拿到三百五十啊,三千五百亿的这个卖一年的收入的。那中间的这些啊,云厂商啊,或者是说新云厂商只做分利租赁啊,不 考虑上层的这些啊,这个其他软件收入和模型收入的话啊,是可以拿到一千六百亿美元啊,然后再再就是我们再看最终的这个模型厂商啊, open i 啊,如果我们按照如果当时按照这个,按照现在 open i 的 这个指引来看的话啊,如果我们可以看到是两千八百亿美元的这个收入, 如果按照托尼学的上限来看,比如说在整个这个卡的生命周期中去产生的这个,呃,如果我们按五年去记啊,去产生的这个啊, token 的 这个总数啊,按照这个啊,这个这个啊, token 的 这个均价,如果去看的话 啊,那其实这个上限是是是非常大的,甚至可以达到这个万亿级别以上啊,就是理论上可以达到这个啊,三千七百八十币, 每个万亿级别三万亿级别以上,所以说整体的这个模型端和云,云和和云这层的啊,其实整个的利润啊,因为咱们也是看好这一点啊,去发力这个啊, 去发力这期这个开源模型,然后包括去投资了,这样啊,这样的一堆小弟去做他的这个向外输出云的这个白手套啊,然后所以说他是看好 啊,这这这层面,所以说就推动开箱模型啊,也就是说其实是致力于他的这些,就是控呃,参股的这些 ncd 上市,最后后面去实现,他就是远期去对给这个中超委客户去提供云的这个愿景啊,那这是一点,那第二点的话就是,呃, 等这个 c p 板块扩张结束啊,到时候这个主权啊,企业的中长尾客户,有时候他现在占百分之四十的这个中长尾客户啊,将成为这个下一阶段的这个主要主力的一个增长点,所以说搞开模型是利于他 去去继续卖硬件啊,所以说我觉得这是这是第二个点,所以说这是它整体对于模型的呃,这个部分啊,那, 那其实啊,那其实整体我们回顾这个 w 内容来看吧,其实最重要的就是刚才讲到这个第二部分,那其实所有 这个超预期的东西吧,好像好像也没看到啊,就是整体的这个内容来看的话,跟大家一开始的这个预测呢,前瞻呢啊,其实整体来看是大差不差的,然后光的进,这个呃, n p o 的 进展呢?可能也没有想象的那么快啊,所以说整体整体去看吧,然后这里就不 呃不对这个呃各个方向去做更多的一个评论了,然后整体看整个 g t 大 会还是比较还是符合预期的,然后可能后续关注的方向就是关于 l p u 这边的这个商业。
粉丝1361获赞2892

黄仁勋这个老贼又出来画饼了,他的这个 gtc 大 会呢,把科技圈呢基本都给震麻了。但是呢,面对这样的顶级大佬的讲话,我们 a 股三月十七号却给了一个暴跌,超过四千五百家企业下跌。 今天呢,我就用最通俗的大白话呢,帮你拆解这背后的逻辑。首先一点,我先说好的一面,黄仁勋的疯狂预言,他说英伟达二零二七年的收入将达到一万亿美元, 比他之前预估的五千亿美元呢,要翻了一倍,我认为是非常利好整个科技界的,也利好全球科技,因为我们知道全球的经济呢,需要第四次工业革命来把它重新做一遍,所以老黄的英伟达居然还能再翻一倍,我们叫大象跳舞,他的收入呢,其实蛮简单的,核心呢,就那几个大的客户, 美国的七个姐妹,我们的巨头啊,微软呢, mate 啊,谷歌啊,亚马逊呢,甲骨文这几家大金主,实际上已经把他一万亿的收入干了大几千亿了。剩下呢,就是 ai 的 一些大黑马,些新贵,譬如即将上市的现在固执已经八千亿的 open ai, 包括固执已经三千多亿的 ospec。 很多人呢,觉得 ai 好 像这个基建投资好像到一定瓶颈了,好像差不多了。老黄的这个口号呢,实际上告诉大家,不是的, ai 的 基础建设正在发展期,远远没有结束, 实际上是给整个的科技界注入了一个强心剂,是非常利好的。这一点上呢,实际上我们看每一股的反应就能看出来,当天每一股就一片走 红啊,几乎所有的科技公司都在涨。还有第二点呢,非常有意思的谈到叫 token 工厂经济学,这个我认为也是具备一定划时代的啊,他的意思什么呢?万物皆可按照 token 来计费,怎么理解呢? 首先,什么是 token 呢?你可以把它理解为 ai 世界的通用货币, ai。 如果你问一个问题,它要生成一段话,生成一段字,几个词,消耗的都是 token。 token 工厂什么意思呢?譬如你想生成一个图片,包括帮你推理等等,产生了很 多的结果,这结果呢,可以直接用 token 来计算,所以它从过去的成本中心变为了利润中心了。以前的 kpi 呢,是比谁服务器多,现在 kpi 改变了,这每度电能产出多少个 token? 谁在同样的电费下算的越快,谁就越赚钱。这里呢,黄 明轩也谈到他的卢秉的架构,你的数据中心,只要接入我的这个芯片,用了我的芯片,那你的这个速度最快了,而且呢,应该最赚钱。所以这里体现什么?效率为王,功耗低, 手里头很快的芯片和架构就会被这些全世界的大客户抢先购买。你看,听起来有点像一个招商大会了,未来的 ai 服务会分为五个档次,从免费到几块、十几块,几十块、一百五,速度越快,当然越智能,价格就越贵。 所以这对 a 股的什么启示呢?那些能提供高算力,低功耗的公司就是力多了。但是呢,他也提到了一些让有些细分板块呢,是有点利空的一些话语,就是光模块啊, cpu 模块。因为前期呢, 无论是美股还是 a 股的光模块公司呢,大家都在下注下,重注一个趋势什么呢?光要替代铜,我们讲光缆替代个铜缆,但实际上呢,黄仁勋谈到了光铜并举,不是光进铜退,铜短期退不了。 再讲的细一点呢,铜缆呢,还是会大量的用到短距离和机柜内,譬如服务器到交换机,铜缆完胜,所以我们 a 股很多这种关联公司呢,马上涨停,立空谁呢?立空就是当初下重注,希望光能替代掉铜的,譬如像天福通信,我创科技这些做柜内光器械公司, 直接来一个八到十厘米的跌停,因为逻辑变了。换句话说呢,短距呢,光模块没有那么实用,铜缆就 ok 了。但是长距离呢,高 端可插拔的光模块呢?譬如像易中天的新易胜啊,中继续创呢,对他们实际上不会太多影响,但 a 股的情绪太蔓延了,光 模块要跌全跌,所以呢,他们这些公司呢,实际上是被情绪给带崩的。理论上呢,他们中长期的逻辑其实并不会被低估。我们回到三月十七号那天,为什么全线飘绿?几个原因,第一是黄仁新的对光模块,光同并举这个的消息出来,对光模块 那是一个利空。第二个原因呢,就是因为意中天,这个天呢,他非要在 h 股要发行股票,我们指的是在大 a, 我 们国内发行完,在中国香港,他又要再上市一次,那发港股等于稀释股权呢?主力资金一看,先砸为敬,所以导致整个的算力模块呢,恐慌性的杀跌。第三点在那天呢,刚好布伦特的油价突破了一百美元每桶, 都知道美伊战争呢,库尔德海峡封锁啊等等呢,导致的油价从站前的七十美元一桶,曾经最高冲到一百二十六美元一桶,这个油价当日的上涨呢,担心通胀智障,美联储降息预期基本没有了,所以呢,这些高估值科技股呢,也是成压美 a 股的高科技股没怎么变化啊, a 股是抢先,非常的敏感。还有一块呢,就是大盘的资金,我们叫抽血效应,因为资金呢,去拉银行,拉中字头护盘了,这中小盘的成长股呢,没人接盘,大量的抛售,踩踏恐慌。但是呢,其实也不用太担心啊,当日的暴跌呢,其实第二天呢,慢慢就收复回来了,但是我想说什么呀,第一点, 科技 ai 依然看好,这个是非常非常关键的,如果没有这次的美疫战争,那么应该是全线飘红,一片红,但是因为有美疫战争,还有光模块的不确定性,导致了 a 股情绪性的杀跌,长距离的光模块,它的 价值依然还在前期被已经冲高了下,赌注比较重的,现在逻辑改变了呢,稍微小心一下。

今天视频跟大家聊聊这个科技春晚啊,就是这个英伟达的 gtc 大 会啊。那么首先呢,昨天的其实网上应该说的人很多啊,我主要跟大家聊几个关键点啊,也就说,呃,比较有技术革的点啊,因为就是昨天黄奕迅就推出来了, 呃,包括把它未来几年的价格都退出来了,除了 ruby, 我 们在去年就一直谈了啊,现在最新的这个飞吻也也退出来了。目前加强趋势的有两个,第一个就是光护帘的趋势是加强的,尤其是这个光入柜内啊。光入柜内呃, ruby 呢,是采用了 c p u 进行拓展啊, ruby 是 在 c p u 在 柜内使用了啊。那么 呃,黄奕勋在演讲中明确提出来了,就是这个 nv link 七二系统,使我们保持向后接兼容啊,柜内的铜线呃, 但是可以进行这个拓展啊,至 nv 五七六,也就是光铜并用啊。那么 rubin 是 通过 cpu 交换机将八个机柜连接成五七六的触节点啊,同时在呃飞满中的搭载了这个 nv link 八的 cpu 交换芯片啊, 也就是说在飞满的柜内中将首次大规模使用这个光学技术光入柜内的产业趋势被加强啊。那么其中提到的这个另外一个就是这个 lpu 啊, lpu 因为之前 市场上讲的人比较多了, l p u 主要是这个推理啊,因为他收了那个 gork 的 那个公司之后呢,他主要是做推理的,因为现在英伟达也意识到一整的时代肯定是推理为王,所以他现在也全面在往推理去转。呃,那么推理这块,包括存储这块,除了我跟大家说的就是 一定要用到这个三 d 的 e q 集成啊,三 d 封装把这个存储单元和它计算单元对叠到一起,同时它的链接都需要光互联。所以我跟大家说,其实从英伟达的这个, 就是这个最新的这个大会上,其实印证了三个日内一直讲的三个趋势,就是未来不管计算芯片、推理芯片,它的趋势就是传输效率越来越高啊,然后存储的 容量要越来越大,然后功耗要越来越低,你只有解决这三个问题,你的计算性能才会越来越强啊,所以其实趋势就是加强了光互联,加强了存储啊,同时当然还有一些像夜冷啊,强制夜冷啊,还有 pcb 版一些材料都有增量,都有加强啊,这是确定的产业趋势啊。 呃,但是回到我们今天的市场啊,为什么最近我跟大家说,我说我们这个市场啊,尤其我们国内的市场短线已死啊, 现在基本上就是量化全控的事。今天我看了一下整个板块或者概念里边跌幅排第一的就是这个 c p u 和光通信啊,为什么会这样呢?一个是我们现在的量化,就是这个市场生态其实已经被量化搞臭了,就是说 基本上一捕捉到什么热点,或者说呃,到了某一特定事件,你看立马砸,这其实就是量化的一个 很让人恶心的行为啊,就是说其实大家为什么现在觉得这市场越来越难做呢?其实就是给人量化生态玩坏了啊,但是啊,但是我跟大家说产业趋势不会变啊,大家看到其实过往任何一个板块,大家最近发现就说 很多人都在有一个困惑,就说,哎,为什么这个市场别人说要去避险了,我买贵金属,贵金属跌,别人说化工要涨价,原油这个禁运,化工要涨价,买化工刚没几天跌,然后这个又说这个农产品,又说这个煤炭,又说这个电力啊,反正就是买什么跌什么,你看今天又开始拉房地产、钢铁。 其实大家思考一个问题,这就是在缩量情况下的轮动,市场的一个特征就是产业趋势在这里是没问题的,但是资金就在那里,天天纯搞博弈啊。其实究其原因,我觉得还是我们这市场 之前的病痛太多啊,就是这个五千多家公司太多啊,然后市场一旦缩量了之后,资金量不够, 那么大量的机构又用了量化策略之后,就导致这市场生态其实被玩坏了,就说这种市场生态指数现在已经失真了,就说你哪怕涨到四千一、四千二、四千五,财务还是不赚钱,因为你轮动啊,你在轮动,你在频繁的在拉,而且很多就很多板块跟指数的关系并不大,你看今天稍微拉一拉券商、银行、保险啊, 你这个指数一立马就上去了,但是你一追他又砸你又套你,所以其实现在我说你看的太短啊,你这个指数一立马就上去了,但是你一追他又砸你。所以其实现在我说你看的太短,你在市场根本玩不下去 啊,为什么我一开始去,呃,很早之前我说今年会很难玩,就是你一旦知道了这个量化的这种运行规律之后啊,你就会发现今年你要是看短或者是老是去说我做短线埋伏什么生态,好有意义啊, 但是,但是大家看到的是什么?我们,我们虽然国内就是我说了就是喜欢博弈啊,五千年的文化就是这样啊,不只给就喜欢博弈。全球昨天油价是大跌的,然后全球的欧,欧洲的,美国的日韩股市都在涨,科技都在修复,都在反弹,我们这边好,我们把最景气的行业给你砸穿啊,然后去涨那些莫名其妙的, 给你把最紧切的砸穿之后去拉那些什么房地产,什么钢铁啊,建筑,其实这其实反映了一个什么东西啊,就是他在博弈啊,其实正常,如果说一个正常的运行规律,正常市场,人家你看美股的光通信,美股的科技巨头都在 呃,反转啊,都在反弹啊,都在反弹,那么日韩自从这个地源扰动之后,这慢慢又修复,慢慢要回正轨了,所以国内就无非还就是在博弈啊,所以其实大家看长远一点啊,你我举个例子啊,就说我们国内这个存储板块,其实存储板块的逻辑没那么硬,但是你看到去年的存储涨价拉完一波之后就消停了, 外围的存储是一直在涨的啊,我们的美股的也好,韩,韩国的巨头频繁的在创新高,一直在拉,但是国内不跟了,哎,但是为什么洗完一两个月,最近又开始我们国内的存储板块都在创新高, 所以其实大家把这个眼光周期拉长,就是他为什么要搞长牛慢牛,其实原因就说不想涨太快,想让这个牛市持续久一点,但是他用什么方法来控制?因为国内的资金就是这样,一一热,大家一热一拥而上,对吧?一看一个行业赚钱也是一拥而上。 股市它原有的规律就是大家只要资金猛怼之后,立马就不会有慢牛,就肯定是疯牛。但是他为了控制这种长牛慢牛,他必然就要做这种 量化的收割,量化的博弈,量化来压盘,量化来制造波动,制造制造波动才能收割流动性啊,所以这就是这个市场的生态。所以真的论起来博弈啊,我觉得国内的博弈要比国外还要猛啊,有时候还要猛,但是国外的博弈有时候也也很,收割起来也很惨啊,所以就拉长周期看,你看,哪怕说存储这个板块不那么硬 啊,他洗完一两个月之后,他还是要回归产业趋势,因为产业趋势就是存储是今年最景气的一个行业啊,最受卡 ai 脖子的一个行业啊。那么, 呃,回到这个光互联,回到这个 pcb 页览这些,这些趋势也不会变的啊,所谓的光进同退的这种趋势也不会变的啊。所以说 市场最终啊,哪怕短期它量化搞事情也好,还是说一些呃,所谓的做热点,做买 f 事件的资金啊,会被量化去精准狙击收割也好, 它不影响做长期产业跟踪,做长期投资的人啊。所以大家现在面对我们国内这个市场生态啊, 一定要想清楚今年要走什么模式啊。所以我今年其实我个人的策略就很简单,今年坚决不做短啊,做短是没法玩的,不管你去博弈什么东西,哪怕你市场,你的就是就是策略再好,就不管你的策略再好,它还量化,还是会去收割啊,也就说不会再只给了啊。 外围科技都涨那么好,为什么今年不涨?那你今天一看哦,科技跌了你一割,他明后天说不定又拉了啊,这就是现在量化这个生态,所以大家面对这样的市场环境啊,我们没办法去改变他啊,个人力量有限, 但是我们要在市场玩,就只能适应他,那么适应他唯一的好好的方法就是眼光放长远,尊重产业趋势,因为 不管是消息还是资金还是短期的走势都会骗人。但是真正的技术发展的方向啊,产业的趋势他不会骗人。为什么我一直说大家回过头去看你,那是回过头去看,你说去年也好,前年也好,你很多方向只要拿着不动,不要受中间的扰动,你很多方向都翻几倍的存在, 这个原因就是于产业趋势在这里,然后资金面在这里,所以今年首先资金面也不会差的啊,我们的降息降准的空间不变,政策宽松的空间不变啊,甚至我们新增的后续的增量入场资金也不会变啊,这个趋势不会变, 所以这个牛还在啊,这个大家请放心啊,远远还没到呃,要要走完趋势,甚至可能是新一轮七涨点博弈点的开始, 所以牛还在,但是短期的阵痛和短期的这种博弈呢,我觉得不会影响我们做长期投资的这个人的产业预判啊,所以这一点是马哥要给大家打气的点,所以就是景气的方向,景气的行业和技术本来就要发展的方向,他不会受到短期的量化补贴的扰动的啊, 博弈的都是那些只是想进来投机的自己明白吧?他想进来捞一笔,他想干一笔他就走,那就死给你看,就杀给你看,狙击给你看啊。所以其实大家现在再做一段时间,慢慢都会理解我说的这个观点和我说的一些东西啊, 包括你看我昨天说美股的恐慌值到了一定的阶段,很有可能就会上演逼空啊,把那些开空单的人抱藏啊,你看着这美股昨天立马就是高开啊,高开,然后虽然有一些扰动,但是它目前那些趋势已经比较好了啊,可能就是在不停的注底,震荡注底的阶段啊。 所以全球的一旦这个战争慢慢走向脱敏之后啊,全球的科技还是会重回趋势的啊,只不过国内现在还在博弈呃,我,我感觉可能大家需要的还是无非多点耐心啊。

英伟达 gtc 大 会将至,大洋彼岸 a 股市场光纤概念股和光模块集体飙升,这是为啥?大家好,我是么么消息的墨鱼。很多同学可能还不知道,连接显卡跑 ai 的 这套神经系统,也就是高速光模块,已经被中国企业彻彻底底的控盘了。 ai 和光纤有什么关系?咱们打个比方,像训练、 check gpt 这样万亿参数的大语言模型,从来都不是靠一张显卡单打独斗,而是需要成千上万张显卡部署在分布式集训中,同时进行海量参数的并行训练和同步。 这中间产生的东西向数据流是极其庞大的,如果用传统的铜线来传,根本搞不定。为什么?因为在八百 g 这种极高的传输速率下,高频信号在铜线中会产生严重的屈服效应,信号的有效传输距离被死死压缩到了两米左右, 基本是连一个标准服务器机柜的上下层都连不到。而且铜线的高频电阻发热量大得离谱,要是上百万颗 gpu 的 集群全用铜线,光是维持电缆传输就能吃掉一百八十兆瓦的宝贵电力。更别提为了保证数据不出错,铜线必须引入复杂的前向纠错机制。 这在每一个网络节点都会产生五十到一百纳秒的 ai 训练来说,这是灾难,这就逼着数据中心必须光进同退, 利用宇宙中最快的姓氏光子,在极细的玻璃纤维中建立毫无阻碍的时空虫洞。根据目前的架构配置,在英伟达主推的 h 一 百级群里, 一颗显卡通常要配二点五到三个八百 g 高速光模块。而到了最新的 b 两百芯片架构单卡,不仅外部互联需求超过一千两百 g 比特每秒,而且直接需要配比二到二点五个八百 g 甚至一点六 t 的 光模块。 显卡的算力再牛,如果没有这些高端光模块做神经通路,几万美元的设备就是一块极其昂贵的砖头,只能停工等待数据。这就是硅谷巨头们搞 ai 大 模型必须交的一笔极其昂贵的硬件过路费。 说到这,可能有人会觉得,这种人类最高精尖的 ai 硬件赛道,肯定又是美国企业垄断吧? 事实恰恰相反,在这个极其吃技术积累、量律控制和规模化交付能力的赛道里,中国企业打出了一场统治级的表现。你看全球排名前十的光膜快厂商,中国企业直接拿下了七个席位。尤其是在目前利润最丰厚、技术壁垒最高的八百 g 高速光膜快市场, 中国企业的全球合计市场占有率已经突破了百分之七十。甚至在英伟达自己暴增的八百 g 光模块订单中,仅两家中企就联手斩获了高达百分之六十的供应份额。但是,大家千万别以为这钱一直都这么好挣,也别以为我们天生就站在这条赛道的顶端。 如果你把时间倒回十几年前,你会发现,这根本不是一场在同一起跑线上的公平竞争。这里也有一场产业大逆袭。在二零一零年以前,中国的光通信产业正处于暗东期,光纤光缆里面最核心的基础材料叫做光纤预制棒。 这东西的技术壁垒极高,当时全球的产能完全被美国和日本等几家跨国巨头垄断,那时候中国市场超过百分之七十的光纤预制棒,必须依赖纯进口。更残酷的是,一条极度不对称的产业链利润分配法则。当时掌握着核心预制棒配方的外资巨头, 轻轻松松就拿走了整个产业链百分之七十的利润。而中国成百上千家光缆企业,只能挤在最下游技术门槛最低的承揽环节,进行同质化的低价肉搏,赚取百分之十的物理组装费。不仅如此,就连买一个配套的管件或者生产设备上的一颗螺丝钉, 外企都要在成本上单方面强加百分之二十五的利润,你爱买不买,完全仰人鼻息。面对这种几乎被锁死的底层位置,中国企业是怎么破局的?没有捷径,唯有破釜沉舟,死磕底层技术。国内的领军企业当时立下了一条极其严苛的死规矩, 每年必须把销售收入的百分之五强制用于自主研发,并且上不封顶。这笔钱砸下去,要求必须彻底转化为技术成果。 因为老外对核心参数严防死守,咱们的工程师就硬是用海量的基础实验,一点点去摸索气象乘积的最优热力学曲线。 经过长达十年的公益消化和无数次失败的实验,中国企业不仅造出了拥有自主知识产权的生产设备,还全面掌握了等离子体、化学、气象乘积等三大主流核心制备技术。原来老外的单根预制棒拉丝长度有限,现在咱们的技术做到了,单根预制棒能连续拉出一万公里的光纤, 直接干到了行业全球最高水平。有意思的是,当时刚刚在实验室或者初步量产取得突破最脆弱的时候, 那些海外垄断巨头就开始搞降价倾销,试图用庞大的资本把中国本土的竞争对手绞杀在摇篮里。 不过,咱们全产业链打通后,规模效应的威力很快显现。原来被外资垄断时,一新公里的光缆能卖到一百多块钱,咱们自己造出来,并且产量大爆发后,硬生生把价格打到了四十块钱左右的白菜价。 从二零零七年微不足道的百分之二十自己率,到今天中国光纤预制棒的国产化率已经成功突破了百分之八十的绝对安全线,并正在向百分之八十五以上发起冲锋。现在中国每年光纤光缆的设计产超过十五亿新公里,占全球百分之五十以上, 二零二五年实际出货量更是拿下了全球百分之五十六点三的绝对统治份额。更绝的是,连制造光纤预制棒最核心的掺杂矿物质元素的开采和出口配额,也被中国牢牢把控。 以前是别人卡我们的脖子,现在是欧美科技巨头想在本土疯狂扩建数据中心,却随时面临上游核心原材料和高端产量供应不足的潜在风险。最后,在这个充满变格的新纪元,在接下来的一点六 t 甚至更高速率的时代, 硅谷的巨头们会不会想尽各种办法在底层物理架构上绕开咱们的供应链,又或者面对这场史无前例的算力焦虑?这次轮到咱们来看,光魔快企业还能把这波时代红利吃多久?欢迎大家在评论区聊聊你们的看法。

昨晚熬夜看完英伟达 gtc 二零二六大会,我现在感觉呢,就两个字,窒息!如果说以前的英伟达是在卖铲子,那现在老黄直接把整座金矿加上全自动挖掘机都给你造好了。 这条视频呢,用五分钟带你扒一下 gtc 二零二六被誉为科技界春晚,老黄所有的底牌,不管你是炒股的,干互联网的,还是普通职场人,这条视频啊,我都建议你看到最后,因为未来五年的财富密码和残酷淘汰赛,全在昨晚的这几张 ppt 里。 一、一万亿美元的推理拐点,老黄向全世界抛出了一个极其恐怖的数据,一万亿美元的算力焦虑!很多人以为过去几年大模型疯狂训练,算力需求已经到顶了吧?老黄在台上直接宣布, 错,大错特错! ai 已经正式跨越了纯粹的在实验室里训练的阶段,全面步入了推理和深沉的商业落地期,这就是所谓的推理拐点。 这意味着,以前只有科学家在跑 ai, 而现在是几十亿人,无数个企业每天每秒都在调用 ai。 老黄预测,从二零二五到二零二七年,全球在 ai 算力上的支出将达到令人发指的一万亿美元。而老黄更是铁了心要吃下这块蛋糕。英伟达的商业模式彻底变了。 以前呢,老黄是一张一张的显卡卖给你,今年的聚光灯打在了一个叫 ver ruby 架构,英伟达直接开始卖系统,卖 ai 工厂 的潜台词就是,别再自己组装折腾了,买我的完整系统,我把推理效率给你压到极致!这是一场巨大的算力豪赌,而老黄呢,显然已经是庄家第二,智能体 ai 生态。接下来这个概念啊,绝对会颠覆你的认知。过去我们是怎么用电脑的? 你打开 word 打字,点开剪映剪视频,是人在操作软件。但在老黄的蓝图里,未来企业的基础设施是智能体 ai, 它在现场猎取了 s、 c、 p 这样的传统软件巨头,说了一句极度反常识的话, ai 不 会直接取代这些传统软件工具,相反, ai 会反 过来去使用它们。以后的工作方式是这样,你给 ai 下载一个指令,比如说帮我设计一个芯片草图,或者整理一份千万级的财务报表。然后 ai 自己去打开那些专业复杂的软件,去按按钮, 去拉表格, ai 帮你完成一切。工具还是工具,但是坐在电脑前操作工具的打工人,换成了不知疲倦的智能体。 第三,物理世界大爆发, ai 长出了双腿与车轮。昨晚的高潮时刻之一,是老黄直接把一百一十台形态各异的机器人搬到了舞台上,从机械臂到人形机器人,整齐列阵,那压迫感,我直呼,好家伙,天网降临了,属于是 仅是机器人,还有汽车。老黄呢,直接甩出一枚重磅炸弹,英伟达和 uber 达成了史诗级合作计划,在二零二八年在四大洲二十八个城市推出完全由英伟达全站软件驱动的自动驾驶车队。不仅如此,老黄呢,还现场点名表扬了我们的国产之光,比亚迪、吉利, 再加上现代和日产这些全球车企大军,将全面采用英伟达技术,集体冲刺 l 四级别的自动驾驶。 未来的汽车,不再是四个轮子的沙发,而是四个轮子的超级 ai 计算机第四,图形学的核弹 d l s s 五。对于游戏玩家和影视从业者,老黄也没有吝啬,他直接扔出了图形渲染界的核武器 d l s s。 五,预计今年秋季推出。官方给他的评价极高。 这是二零一八年光纤追踪技术问世以来,计算机图形学领域的最大突破。为什么这么牛?因为以前的渲染是靠显卡计算光照和材质,而现在的 d l s s。 五 直接引入了深沉式 ai。 ai 不是 在计算画面,而是在脑补和深沉。极度逼真的物理光影,你将分不清什么是现实,什么是虚拟。在演讲最后,黄日勋说了这样一句话,让我久久不能平静。 他说,我们重新定义了计算,就像个人电脑革命和互联网革命一样,我们现在正处于一个变格的开端。是啊,从芯片到工厂,从数字世界到物理世界,英伟达已经不再是一家显卡公司,它正在成为构建未来人类文明的基建矿脉。

主播回来,看完这次英伟达 gdc 二零二零年大会,我最直观的感受不是震撼,而是一种由于降维打击带来的冷情。老王这次终于不再是卖铲子的商人了,他直接把全自动挖金矿的基础设备铺在了全人类的面前。如果你觉得这次只是科技圈的春晚,那想的都太简单了。 那几张 ppt 的 背后啊,谈的是未来五年所有行业的生存逻辑。把这几万字的演讲精炼成四个最硬的底层逻辑,帮你拆解这一场数字革命的底牌。第一,从卖零件到卖工厂,一万亿美元的推理时代。 以前大家觉得就是 ai 嘛,只是在实验室里面练肌肉训练。但老黄宣布, ai 正式进入了干钱赚货的爆发期, 多么恐怖?他抛出来一个很恐怖的数据,未来三年,全球的 ai 算力支出将高达一万亿美元。为了吃下这块蛋糕,因为他的商业模式彻底变了,他不再是一张一张的去卖显卡,而是推销基于他的整一个系统的算力提取。 逻辑变了,你以前你要自己买零件组装电脑,现在的话,老王直接给你一个 ai 算力工厂,我直接组装好电脑,还给你提供算力,你直接买了就用。他的目标其实很明确,就是通过极致的系统集成,然后把推理成本压到了地板上,这是一场专家通吃的局。第二, 软件的终结, ai 智能体正在接管你的按钮,这个点是最值得职场人和创业者的警惕的。老王说了一句极度仿制局的话, ai 不 会取代传统软件, 他会直接去使用这些软件。在老黄的蓝图里面,未来的企业就有设施,不是软件,而是 ai 智能体,也就是 agent。 未来的工作流的话,你不再需要去学习怎么去操作复杂的设计软件, ai ps, 你 只需要给 ai 下指令,他就会自己打开 ps, 自己去设计了设计。然后呢,拉那个草图, 这个呢,就是真相工具还是那些工具?但是坐在那些电脑前操作工具的打工人,正在变成不知疲倦,永远不会报错的智能体。 第三个物理 ai 给灵灵魂装上了躯壳。昨晚的高潮是一百一十台机器人集体整齐亮相,老黄展示的是不仅是机器人的肌肉,更是他们的大脑。因为英伟达和 uber 达成了一个合作计划,在二零二八年让权杖软件驱动自动驾驶车队落地到落地到二十八个城市。 然后他还点名了我们中国的比亚迪啊,吉利啊这些汽车。未来的汽车不再是带轮子的沙发,而是带轮子的超级 ai 计算机。当 ai 长出了轮子和双腿,物理世界和数据世界的墙已经彻底塌了。 第四个视觉细节,简单点来说就是以前我们玩游戏,他的一个画面呢,是由显卡来决定的,是由显卡算出来的。但是呢,现在的 画面他们是由 ai 自己脑补出来的。这种深层式渲染,能够让虚拟画面的逼真度直接抹平了与现实的边界。 当算力不再是瓶颈,审美和创意就成了唯一的通行证。王一勋说,我们正在定义计算,其实他在定义的是杠杆, 从芯片到工厂,韦达正在构建未来文明的底层系统。所以兄弟们,我想说,老王在这个台上讲的是芯片,但是我看到的是个体杠杆的极限扩张, 以前你想办一百个人的公司,你需要管理,需要社保,需要无数次低效的沟通,但是在这次英伟达 gtc 二零二六年大会的逻辑里面,你只需要一个超级大脑,然后加上老王给你的这套全自动的挖掘机, 你就可以自主运行了,所以门槛已经全部消失了,剩下的就是你的野心和想象力。然后老黄之前不是提一个问题吗?就是说考核一个呃,员工的一个标准是什么?他说每一年他要消耗二十五万美金的头壳,这个就是他考核的标准,所以不是在开玩笑,这是老黄给所有人 一个痛点,在这个时代,如果说你还在用右神去拼体力,那你就是在用旧时代的马车去撞新时代的重型坦克,门槛已经消失了,剩下的只有你的野心和想象力。

朋友们大家好,我是专注题材梳理的天才哥,今天我们来讲的题材是英伟达 gtc 大 会。英伟达 gtc 大 会是英伟达主办全球 ai 与加速计算领域最顶尖的年度盛会, 被誉为 ai 届的超级晚,从二零零九年九月三十日每年固定三月份举办。这场 ai 届的超级晚 定位是 ai 与加速计算的技术方向标、生态枢纽产品发布主舞台。二零二六年的主题为 ai 基础设施时代,聚焦 ai 工厂代理式 ai 物理、 ai 推理优化。核心看点主要包括新一代 gpu 芯片架构,包括 ai 工厂推理、平台模型、生态路线,并且定义 ai 技术、设施物理、 ai 智能体等新方向。 五大核心内容板块包括 ai 基础设施模型与推理、代理式 ai 智能体、物理、 ai 科学计算以及开发者实战。回归主题,我们来看英伟达 d c c。 大 会的四大核心看点包括 cpu 模块、 p c b 散热以及电池。 cpu 中继续创、 英伟达 cpu 一 公新一胜二公、天福通信、英伟达光引擎供货商 pcb、 盛宏科技、英伟达 pcb 一 公户电股份、山南电路、玖旺电子、方正科技。 pcb 供货商, 龙阳电子、英伟达 pcb 铜锣供货商,生意电子、东财科技、飞利华散热。主要包括叶冷球龟以及球铝。叶冷英维克供货、英伟达叶冷分配系统。飞龙股份, 攻获英伟达夜朗泵解决方案,球龟、连瑞新材、一时通、雅阁科技、球形龟尾粉产量第一到第三,球铝、一加连瑞新材,球铝导热粉试炸率低百分之十一,国内第三。最后是电源解决方案, 包括谦旭电池以及 bbu 电池、谦旭电池、圣阳股份、南都电源、熊涛股份 数据中心、千续电池收入第一到第三。 bilibiu 电池、蔚蓝锂芯、新旺达总结最新整理的英伟达 g c c 大 会,包括 cpu p c b 散热以及电池整理不易,大家别忘了点赞、收藏、关注,一键三连!

英伟达的 gdc 大 会向来是技术落地的风向标,今年的重点主要有四个,第一,电力,英伟达下一代 ai 芯片,一颗的功耗顶三台家用空调这么多电,如果用传统交流电传半路就损耗不少。英伟达的方案呢,是换成八百伏的高压直流, 减少转换,让电直达芯片。国内能够提供八百伏高压直流供电方案的公司有,麦格米特、中恒电器、四方股份、科士达。第二,散热芯片,功耗翻倍。传统的风扇散热已经失效,夜冷成了唯一的选择。 瑞达目前正在推进大冷板异冷技术,并引入金刚石,导热率是铜的四倍,已经开始进行小规模测试。国内能够提供金刚石散热技术的公司有黄河旋风、沃尔德、四方达等。第三芯片,这次 gtc 大 会预计会推出 lpu 计时推理芯片, 这种芯片采用了先进分装技术,直接把芯片分装在 pcb 上。当然呢,这意味着传统的低级别附铜板已经无法满足 pcb 材料体系,必须要叠代到高等级 m 九级别。 相关的公司有,生意科技、飞利华东财科技、联瑞新材等。第四, cpu, ai 数据量暴增。过去数据要用铜线传,但铜线不仅传得慢,还传不远。而 cpu 技术可以把光模块和芯片分装在一起, 能让数据光速跑,信号传得快,损耗低。这次大会有可能会公布 c p o 商用路线图,二零二六年有望成为 c p o 从概念走向大规模商用的元年。相关公司有终极续创新、益肾、天赋通信、光谷科技等。没记住没关系,记得先收藏起来!

很多人看到黄仁勋的 gtc, 第一反应都是又发新芯片了,又讲新架构了,参数看的人眼花缭乱,大家都在死盯着那些眼花缭乱的新芯片代号,甚至有人看着发布会期间波动的骨架直冒冷汗, 还有惊艳的迪士尼雪宝和黄仁勋对话。但我看完这场发布会,老子只有一句话,这根本不是一场技术发布会,至少老黄在给未来几年资金怎么留?提前画路线图了? 因为,因为的啊,现在早就不是卖芯片的,官方自己都在讲一个词, ai factory 啊。 war roblin 平台也不是一张卡,它是把 gpu、 cpu、 网络存储、 dpu 这些东西一起打包,变成了一个超级系统。 warren rubin n v l 七十二一台机柜里就是七十二个 rubin gpu 加三十六个 war cpu, 本质上是在把数据中心做成一个完整的 ai 工厂。这场大会极其明明确地指出了未来三年的资金流向, ai 的 底层逻辑彻底变了。 在这个狂飙的时代,淘金者未必能笑到最后,但卖水修路送电的基建商马上就要迎来裂变式的爆发了。所以这次 gtc 真正值得普通投资者看的不是芯片代号,而是四个方向,算力、基建、 液冷散热、推理成本、机器人和物理世界。为什么这么说?因为整个 ai 产业正在从无底洞的推理与落地期,算力的载体变了,运行的成本塌了, 数字世界的风暴正在带着巨量的资金加速插入我们真实的物理世界。我给你句最重要的总结, ai 上半场拼模型, ai 下半场拼工厂,谁能把电冷却、网络、机柜、推理机器人整成一条产业链,谁就能吃到真正的大钱。第一条线叫做算力基建的送水人 warro rubin nv n v l 七十二,不是丹麦芯片,是整机柜,是整体系统整工厂方案。官方还专门发布了 warro rubin dx ai factory reference design, 连怎么建 ai 工厂,怎么接电怎么配,冷却怎么做,数字孪生都开始标准化了。更夸张的是, 围着这套设计一起干活的伙伴已经超过两百家。这就意味着未来吃红利的绝不只是英伟达本体积贵,交换、存储、电力、运维、设计院都会被一起带起来。第二条线叫液冷和高速互联。官方写得很直白, world cpu 机柜是 desk liquid cooled, 这就是液冷 pro 三 l p x 机柜也是 fully liquid cooled, 为什么?因为风冷已经压不住这种密度了。再加上 n v l 七十二通过巨大的 n v link 同互联 spell 连成了,同互联的连成了一个系统。旁边还有啊 quantum x 八百和 infinitely bend 和 speck two x efferent 来撑住这个系统。我们第三条线叫推理成本下降,应用层开始活了。这一句最关键, warlord n v n v l 七十二相比 blackwell, 官方给的口径是推理成本, 推理每每瓦吞吐最高十倍,单 token 成本降到十分之一。这意味着什么?意味着以前很多 ai 应用层公司最大的问题是用户越多,亏的越快。但如果底层推理成本真的被打下来,那么很多企业级的 a 卷的行业 s 自动化工作流,才第一次有机会能从 能用变成能赚钱。第四条线叫机器人和物理世界。这次 gtc 不是 只讲数据中心 呃,同时再推 physical ai commerce isec 呃, g r o g r o t n。 模型,还点名了一批机器人和制造业伙伴一起下场。官方用的词很重, take physical to the real world, 以及帮助 humanoid deployment scale。 这种说明资本接下来 呃不只会把比特世界打转,而是会往原子世界走。减速器、传感器、伺服电机、制造、自动化,这些东西的想象力越来越大。当然,这不代表只要站在 ai 就 起飞,真正危险的是那种只会讲模型故事,但没有电力冷却、 网络系统支付能力的公司。因为 gtc 这次已经把门槛说透了,未来比的不是谁的 ppt 好 看,而是谁能真的把 ai 工厂建起来,把 token 稳定产出来。所以我看完 gtc 的 感受很简单,英伟达不是在卖芯片, 它是在卖下一代工业体系。上半场炒的是 ai, 会不会来,下半场拼的是谁能为 ai 供电降温、联网降本,并把它装进机器人和工厂里。 如果你还只是把 gtc 当成一个参数秀,那你看的是热闹。但如果你从资金流向看,这场会已经把未来几年最硬的四条线讲的很清楚了。别再盯着虚无缥缈的概念了, 紧盯夜冷高速互联、机器人硬件、智能电网时代的狂飙才刚刚开始。点赞收藏这波红利,我们一起抓!

英伟达在 gtc 二零二六大会上官宣了全新的 mgx 一 t 二服务器机架架构,没有过度炒作的噱头,却藏着国产 ai 算力的关键转折。很多人还没反应过来这件事到底意味着什么。这款新架构最核心的变化就是开放兼容, 不再只是配单一品牌芯片,而是把英伟达、 amd、 intel 以及国产 ai 芯片全都纳入支持范围,再通过专属高速网络实现高效互联。放在以前,这样的局面很难出现,一边是成熟完善的 ai 软件生态,一边是稳固突破的国产芯片,两者之间始终隔着一道壁垒。 如今英伟达主动打开这个口子,让国产芯片能够接入成熟生态运行,相当于绕开了此前的算力落地阻碍。这难道不是行业层面的重要破局吗? 这件事的底层逻辑很清晰, mgx 一 t l 打破了原有的算力壁垒,不再是封闭体系,而是走向开放协调。对于国内 ai 算力行业来说,意味着国产芯片有了更广阔的落地场景,能够更快切入主流算力集群,抢占市场份额,整个国产算力的推进速度会被明显加快。同时,一个新架构落地, 从来不是单一环节的改变,高速互联传输、高端硬质板材、液冷散热系统、大功率供电模块这些配套产业链都会跟着机价的量产落地,迎来同步的需求增长。 尤其是高速光互联相关方向,随着多芯片集群互联需求暴增,成为这一轮架构升级里最明确的增量环节。液冷和高功率电源也是高密度 ai 算力机架的刚需行业需求会跟着逐步释放,我们不用过度渲染,也不用盲目乐观,这不是短期的题材炒作,而是 ai 算力行业走向开放、 国产算力稳固突围的真实进程。过去行业卡在生态兼容,现在这个卡点被打通,后续的商业化落地、规模放量都会一步步推进。对比传统封闭架构,开放兼容是大势所趋。英伟达这一步 本质是顺应全球 ai 算力多样化的趋势,也给国产芯片留出了更大的成长空间。从产业发展来看,这是一次双赢的调整,更是国产 ai 算力迈向规模化的重要气息。 对于关注 ai 算力的人来说,不用追涨杀跌,看懂这个长期逻辑就够了。开放生态带来的需求共振会慢慢传达到整个产业链,这是一场慢而确定的行业升级。我是题材逻辑哥,只讲客观趋势,踏踏实实聊透产业真逻辑。关注咱们,下条视频,不见不散!

英伟达的 gtc 二零二六大会已经不单单是一场技术发布会了,它更像是一场决定未来 ai 产业格局的华山论剑。一份关于英伟达的研究报告,为我们揭示了这场盛会背后可能正在发生的一场深刻的战略转型。 这不仅仅是关于新芯片的发布,更是关于英伟达如何为未来几年的人工智能推理时代布下的一盘大棋。好了, 我们先来聊聊这次 gtc 大 会大家最关心的核心看点。这份报告里提到了三个需要特别关注的焦点,第一个是英伟达更新后的产品路线图,一直规划到了二零二八年的费曼系列 gpu。 第二个也是我认为最有意思的一点, 就是英伟达正在推出一系列全新的经过协同设计的定制化产品。第三个是在专有光学技术上取得大规模应用的突破。听起来有点复杂对吧?别急,我们一个一个来拆解。 我们先说这个听起来最玄乎的第二个点,就是协同设计的定制化产品,这是什么意思呢?你可以这么理解,以前我们一说英伟达,想到的就是它的 gpu, 一个通用的 强大的大脑,既能用来训练 ai 模型,也能用来让 ai 模型进行推理,也就是回答问题,生成内容。但现在 ai 的 应用场景越来越细分,对硬件的需求也变得五花八门,英伟达现在的打法就是针对推理这个环节, 推出更专业、更高效的专用引擎。报告里提到了几个关键产品,我试着用大白话给你解释一下。首先是 cpx, 这个东西是专门为 推理欲填充阶段设计的。什么叫推理欲填充呢?你可以把 ai 生成答案的过程想象成做一道菜。欲填充阶段就像是厨师在拿到菜谱后,把所有需要的食材都从冰箱里拿出来,准备好, 摆上操作台。这个阶段需要处理大量的上下文信息,但对延迟要求没那么高。所以 cpx 这个引擎就是个备菜专家,它优化了处理这个备菜环节,让后续的工作能更顺畅。接下来是重头戏叫 lpu, 全称是 language processing unit。 语言处理单元这个东西就更有意思了, 它专门针对的是低延迟解码,还是用刚才那个做菜的比喻。解码阶段就是厨师真正开始动手炒菜,然后一盘一盘把菜端到你桌上的过程。这个过程最讲究的就是快, 你不可能让客人等一个小时才上一道菜吧? lpu 就是 个超级快手厨师,它的核心任务就是极速的,一个词一个词的把答案吐出来,追求的就是极致的低延迟。 报告里还特别提到,这个 lpu 可能会采用基于 sram, 也就是静态随机存取内存的技术,并且最早可能在二零二七年的鲁滨 ultra 或者二零二八年的费曼平台上集成到英伟达自己的机柜里。 除了 cpx 和 lpu, 还有针对常上下文解码的 icmp 和针对批处理任务的 veracpu。 你 看, 从准备食材到快速烹饪,再到处理一大堆订单。因为打靶, ai 推理这个复杂的流程 拆解成了一个个独立的、可以被专门优化的步骤,然后为每一步都打造一个最合适的工具。这就像是从一个全能型选手转形成了一个由各个领域的顶尖专家组成的复仇者联盟。 这种专机专用的思路,目的就是为了在推理时代把性能、成本和效率做到极致。说完了定制化的推理引擎,我们再来看看第三个焦点,专有光学技术。这个技术听起来更硬核了,叫 c p o, 也就是供风装光学。它要解决的是数据中心内部数据传输的瓶颈。你可以想象,随着 gpu 越来越强,它们产生的数据量也越来越大,就像一条条越来越宽的马路,但最终都会汇集到一条主干道上, 如果主干道不够宽,或者红绿灯太多,就还是会堵车。 cpu 技术简单说就是把光学收发器,也就是负责光信号收发的模块 直接封装在交换机芯片旁边,大大缩短了电信号传输的距离,从而提升数据传输的速度和能效。报告里提到,英伟达可能会发布下一代的五十一点二 t 的 spectrum 六交换机和一百一十五 t 的 quantum x 交换机,并且会集成 cpo 技术。 这就像是给数据中心修了无数条无红绿灯、全立交的超级高速公路,让数据能够在整个 ai 级群里飞速穿梭。 所以你看,把这些点连起来,英伟达描述的未来图景就非常清晰了,它的产品矩阵会变得更加立体。 有用于训练的维拉鲁滨标准平台,有我们刚才聊的用于推理预填充的 c p x, 用于低延迟解码的 l p u, 用于长上下文的 ic m s p, 还有用于批处理的 vera c p u。 这已经不是一个单纯的 g p u 公司了,而是一个提供全套 ai 基础设施的超级供应商。甚至报告还猜测, 英伟达可能会和英特尔合作,推出定制的 x 八六 cpu, 进一步渗透到企业级数据中心,甚至是消费级 cpu 市场。 聊完了这些激动人心的产品和战略,我们再从投资者的角度来看看市场最关心哪些问题。报告也列出了一系列关键问题,我觉得这些问题其实也代表了我们普通人对英伟达未来的种种疑问。第一个问题,地缘政治中动的冲突会不会影响供应链? 其他国家对 ai 芯片的需求,也就是所谓的主权需求会怎么变化?能源成本上涨怎么办?这些都是实实在在的风险。 第二个问题,供应链的保障。英伟达现在几乎是每年都推出一代新产品,它能不能持续拿到足够多的金源、内存、基板和光学原件?这就像一个顶级餐厅,菜谱越来越复杂,它能不能保证每天都能采购到最顶级的食材?第三个问题, 关于 hbm, 也就是高宽带内存。既然英伟达推出了像 lpu 这样使用 sram 的 芯片,那会不会对 hbm 的 需求造成影响?这又是一个技术路线和市场份额的博弈。 第四个问题, c p o 也就是供风装光学的落地时间。这项技术到底什么时候能大规模应用?它对于英伟达的集群来说,是可选项还是必选项?如果是可选项,那客户可能就不一定会买单。第五个问题,现金怎么用? 英伟达现在现金流非常充裕,光是未来的供应预付款就高达九百五十亿美元, 还像 open ai、 anthropropic 这些公司投资了几十上百亿美元,这些钱除了投资还会用来做什么?是继续通过回购和分红回报股东?还是会进行更大规模的并购?第六个问题,成本。新一代的维拉 鲁冰平台能不能实现比上一代 grace blackwell 平台成本低十倍的单 token 成本?这直接关系到 ai 推理的普及速度。最后一个问题,软件, 硬件再强,也需要软件来驾驭。像 s g、 l a、 m、 l m 这些运行在库达之上的推理引擎,英伟达会如何布局来进一步巩固自己的护城河?你看 这些问题,从宏观的地缘政治,到微观的技术细节,再到公司财务和战略,几乎包含了所有方面。这也从侧面反映出英伟达这艘巨轮的航行,已经牵动着整个科技产业的神经。 好了,说了这么多定性的分析和未来的展望,我们还是得回到一些硬核的数字上来,看看英伟达的家底到底有多厚。 这份报告给出了从二零二五年到二零二九年的财务预测,我挑几个关键的数字跟大家分享一下。首先是每股收益,也就是 e p s, 预计会从二零二五年的二点八三美元,一路增长到二零二九年的十三点一八美元,年复合率非常惊人。 更有意思的是市盈率,也就是 p 一 报告预测英伟达的市盈率会从二零二九年的十三点九倍,这背后反映了一个什么趋势呢?一方面 公司的盈利在高速增长,另一方面,随着利润基数的扩大,市场给出的估值倍数会逐渐回归到一个更理性的水平。报告还特别提到,在二零二八年,英伟达的市盈率预计只有十七倍,这被看作是历史性的低估值, 对于一个如此高速成长的公司来说,这个估值水平确实非常有吸引力。再来看看资产负债表,这部分数字更能体现英伟达的超能力。报告预测, 英伟达的现金及等价物会从二零二六年的一百零六亿美元,暴增到二零二七年的一千一百六十一亿美元,再到二零二八年的两千六百零三亿美元,这是什么概念?就是公司账上的现金在短短一两年内可能会增长超过二十倍,这主要得益于其强劲的现金流和预收款模式。 同时,公司的股东权益也会从二零二六年的一千五百七十三亿美元 增长到二零二八年的四千八百八十四亿美元。这些数字都在告诉我们,英伟达不仅赚钱能力强,而且财务状况非常非常健康,家底越来越厚实。当然,报告也给出了一个三百美元的目标价,这相比当时一百八十二点六五美元的股价有超过百分之六十的上涨空间。 这个目标价是基于二零二七年每股收益的二十八倍市盈率在剔除现金后得出的。这个估值倍数也处在英伟达历史估值区间的中值附近,看起来是一个相对合理且乐观的预期。好了,聊到这里,我们今天关于英伟达 gtc 二零二六前瞻的讨论也差不多接近尾声了, 我们来简单总结一下今天聊到的几个核心要点。第一,殷伟达正在经历一场深刻的战略转型,从一家以通用 gpu 为核心的公司向一个提供高度定制化、模块化 ai 解决方案的平台型公司引进,这标志着 ai 产业特别是推理市场 正在走向成熟和细分。第二,这场转型的核心是推出一系列专机专用的 ai 推理引擎,比如负责备菜的 c、 p、 x 和负责快手出餐的 lpu, 这种好刚用在刀刃上的策略,只在彻底优化 ai 推理的性能和成本,为下一阶段 ai 应用的爆发打下基础。第三,除了芯片层面的创新,英伟达还在连接上做文章,通过 cpu 这样的专有光学技术 构建下一代超高速数据中心网络,确保海量数据能够在庞大的 ai 集训中畅通无阻,这同样是保持其领导地位的关键一环。第四,从财务数据来看, 英美达展现出了惊人的增长势头和财务实力,无论是每股收益的高速增长,还是资产负债表上即将迎来的巨额现金储备,都预示着这家公司在未来几年都将拥有强大的竞争力和投资潜力。 总而言之,即将到来的 gtc 二零二六不仅仅是英伟达展示新肌肉的一场秀,它更可能是一个宣言,宣告着人工智能行业进入了一个由通用计算向智能高效专用计算转变的新时代,而英伟达正努力成为这个新纪元的总设计师。

大家好,二零二六年英伟达 gtc 大 会将于三月十六日在美国加州盛和赛举行。作为 ai 产业关键风向标,核心看点在于英伟达新一代高功率芯片 rubin fanto 系列的发布与落地,其功率将突破两至五千瓦。 这一技术突破将直接引发 a i dc 产业从电源到电子元器件液冷的全产业链技术重构。接下来,我们将围绕技术逻辑、产业链环节两大核心维度, 逐一拆解各细分领域的技术迭代方向,以及具备竞争优势的核心选择逻辑,为大家清晰呈现本次大会背后的投资机遇。一、电源领域重构供电架构迎接八百伏高压时代 技术逻辑,芯片功率剧增至两到五千瓦,导致电流成指数级飙升,传统泵力电源方案因体积庞大、损耗高、干扰强而失效, 行业被迫转向垂直供电模块与 iv 二集成电压调节器,以解决空间占用与电压跌落问题。同时,为应对超高功率八百伏高压直流架构成为二零二六年规模化部署的大趋势, bbu 与超级电容亦称为标配,以确保供电稳定性。 产业链环节,电源模块 pcb 需采用立体埋嵌工艺,技术门槛极高。麦格米特与英伟达深度预言,八百伏电源预计二零二六年下半年送样 中付电路进入 m p s。 伟创利供应链,具备埋嵌工艺优势。科华数据作为 h v d c 头部厂商,有望受益于八百伏架构的全面普及。二、液冷领域,全液冷时代微通道与浸没式并行技术逻辑, 两千三百瓦级芯片热流密度已超过传统冷板散热极限,微通道冷板成为短期主流,散热效率需提升百分之四十以上。谷歌、微软已批量应用全液冷机柜蜂液比零比一百。 长期看,随着 p u e 要求严苛,禁墨式液冷将成为超算中心唯一选择。液态金属金刚石导热材料迎来爆发。 产业链环节,冷板技术分化。中石科技、高栏股份,技术成熟,科创新源,沃尔德布局快接头 禁墨式领域,曙光束创禁墨相变技术领先。恒生电子布局液态金属材料。三、电子元器键高功率下的被动键升级 技术逻辑,高功率推动电感耐流能力升级。顺络电子、麦捷科技量价齐升, m l c c 供需紧张,存涨价弹性。同时 sirdes 速率向四百四十八 g b p s 引进,推动 p c b 板材向 m 九级超低损耗附铜板升级。产业链环节, 电感电容厂商直接受益。生意科技、互电股份在高端板材具备优势。综上,此次 gtc 大 会的核心逻辑是芯片功率突破导致全产业链技术迭代的过程,投资有风险,入市需谨慎。

英伟达 g t c 大 会要点总结啊!首先黄仁勋说了,到二零二七年, black 为和 logo 芯片至少创收一万亿美元。此外近期的需求还在持续的上升,相当于给了一个很满的预期啊。然后重磅的是夏代价格,沃尔沃饼采用全液冷设计, 引入了针对自人体任务优化的沃尔 cpu, 并且整合了确定性流处理器技术。沃尔沃饼价格如不入可融合,节后推你直接开启了三百五十倍的加速。 这就是英伟达自己推出的 limo club, 参考设计,类似于龙虾,但是更安全,并且开启了物理爱的洽谈。 g p p 时刻宣布自动驾驶已进入大规模的商用阶段, 新增比亚迪现代吉利的合作伙伴。我觉得最震撼的就是雪宝阿拉夫真的能够在虚拟世界中净化出的物理适应能力。 关于他可以看我上一个视频啊。最后就是黄仁勋纰漏了继入柄之后的下一代 gpu 架构,他们将搭载 l p 四零处理器和罗萨 cpu, 支持 cpu 技术,然后宣布进军太空计算。整个 g t c 大 会不愧是科技重网,现在呀,后续重要信息我在解读啊。

因为达 g t c 大 会炸场了,黄仁勋没有说透的三个信号,决定你未来五年的财富!因为达 g t c 二零二六年的大会正式落幕,一点六纳米的芯片, d n s 五技术,太空 计算布局刷屏全网,很多人只看到了芯片参数的升级,却没有看懂黄仁勋没有说透的三个 核心信号,而这恰恰决定了未来五年普通人的财富走向。第一个信号, ai 从云端彻底的走向了观测,这次发布了全新的芯片,是大规模的 推理能力,直接下放到了终端设备,这就意味着未来每个人的手机、电脑、汽车都能拥有专属的本 本地 ai 端测 ai 的 时代彻底的来了。第二个信号, ai 从对话全面迈入执行时代。黄仁勋用了一半的时间将巨生智能、 ai 智能体,这和之前爆火的 open 可乐、 ai 龙虾本质上是同一个方向。 ai 不 再是陪你聊天的顾问,而是能帮你落地干活的执行者。第三个信号就是算力,也是未来核心的生产力。黄仁勋直言,明年 芯片订单将突破万亿美元,全球算力,谁掌握了算力,谁就掌握了未来的 话语权。对于普通人,你不用去搞芯片的研发,你只需要看懂这个趋势,会用 ai 工具放大你自己的能力,就能在这场时代的变格里抓住属于你自己的红利。 你注意看好 ai 的 哪个方向,评论区说一说,关注我,抓住 ai 时代的普通人的红利!

大家好,今天 a 股市场出现了一个特别有意思的现象,两个紧密相关的科技板块,一个长得热火朝天,一个却跌得愁云惨淡,上演了一出冰火两重天的大戏。这背后都源于大洋彼岸的一场科技盛会, 英伟达的 gtc。 二零二六大会上传出的一句话。今天凌晨,英伟达的 ai 教父黄仁勋在演讲中说了这么一句,同仍然重要,光学会用于不同维度的扩展,两者都是必须能力。 就这么一句话,像一颗石子投入平静的湖面,立刻在 a 股市场激起了千层了。同高速连接器概念股,比如新亚电子直接涨停了,神语股份涨超百分之五,沃尔核材、新科材料也跟着涨。 而另一边,被市场寄予厚望的 c p o 供风装光学概念却集体铺接了龙头天府通信一度跌超百分之九,光库科技、长新、博创等也跌了超过百分之七。是不是感觉有点懵?不是说好了光进同退吗? 不是说铜锣要被光膜块彻底淘汰吗?怎么黄老板一句话,市场反应就完全反过来了? 今天咱们就来好好扒一扒,这背后到底藏着什么样的技术真相和投资逻辑。首先,咱们得搞清楚英伟达到底发布了什么。这次 gtc 大 会的重头戏之一,是一个叫做 nvidia kyber 的 新一代 mgx 机架。 这个机架可不得了,它的 nv link 预容量直接翻倍,能塞进去一百四十四个 gpu。 为了搞定这么高密度的互联,英伟达给出的方案不是二选一,而是我全都要! 黄仁勋明确说, keep 机架将共同采用 cpo 和铜互联两种技术来实现扩展,这意思再明白不过了。在 ai 算力这个超级工程里,铜和光不是敌人,而是并肩作战的队友。 铜凭借其成本低、功耗低、安全性高的绝对优势,依然是机柜内部短距离互联的性价比之王。你想啊,在一个机柜里, gpu 和 gpu 之间脸贴脸,传输数据距离很短,用又便宜又稳定的铜缆,它不香吗? 国海证券的分析也指出,铜缆方案在推理端,因为追求极致的性价比和低功耗,成为了云厂商的首选。那光呢? 光互联,特别是 c p o 技术,代表的是未来,是解决长距离超高宽带传输瓶颈的终极方向。但它就像一位身怀绝技但身价不菲的贵族,技术成熟和成本下降还需要时间。 黄仁勋去年就说过,硅光技术落地还需要几年,应该尽可能继续使用铜技术。所以,英伟达的路线图非常务实,短期内铜和可插拔光模块共存,中长期 c p u 会逐步渗透,但这是一个渐进的过程,决不识一夜之间的革命。 市场的剧烈反应,恰恰暴露了之前的一个认知误区。过去一段时间,很多声音把 c p o 描述成一种终极替代技术,仿佛很快就要彻底消灭铜栏和传统光模块。这种非黑即白的现行思维,在今天被英伟达官方路线图狠狠修正了。 原来产业真实的演进路径是光同并举、分层替代。预期的突然修正,导致了资金迅速从过度炒作的 c p o 板块流出,转而涌入被撮杀或价值重估的同连接板块。那么这场技术路线的证明,对我们投资 a 股有什么启示呢? 咱们分两条线来看,第一条线,铜连接被低估的黄金血管,别看它传统,但在 ai 算力爆发的当下,需求是实实在在的。英伟达的 g b 两百系统里,密密麻麻的铜缆价值不菲, 随着 rubin、 kyber 这些新架构推进,机柜内短距互联对高速铜缆的需求只会增不会减。该股市场上有几家公司值得关注,沃尔何才通过子公司乐亭智联, 其高速通信泄览已进入英伟达供应链,全球市场份额不低,今天股价涨停就是市场最直接的反应。赵龙互联是国内数据中心捅览专家,八百 g d a c 组建,通过了英伟达认证,深度绑定北美云巨头 神宇股份,据报导是国内唯一通过英伟达一百一十二 g 二百二十四 gdc 认证的企业,今天涨幅靠前。华丰科技是高速背板连接器龙头,是华为升腾 ai 服务器的核心供应商,同时也进入了英伟达 g b 两百供应链,受益于国产和海外算力双线发展, 投资逻辑很清晰,这些公司是 ai 算力基础设施的卖水人,技术壁垒高,客户认证难,一旦进入头部供应链,业绩的确定性相对较强。第二条线, c p o。 长期主义者的选择。今天的下跌更像是情绪和估值的回调,而不是行业逻辑的崩塌。 信达证券的观点很明确, c p o。 的 导入是分阶段的,短期可能在数据中心的横向扩展网络中先落地,中长期才会在纵向扩展中大规模应用。 光通信向更高速率、更高集成度远近的大趋势没有变,接下来,对真正有技术、有订单的龙头公司,或许是更好的关注时机。 比如中际旭创是全球光模块龙头,一点六 t 产品领先,深度绑定海外云厂商和 ai 巨头。 新益盛是高速光模块核心厂商,八百 g 一 点六 t 产品是核心供应商。天福通信是光器械平台型公司,是英伟达指定的首批 c p o 供应链合作伙伴之一。今天跌幅较大,但公司的产业地位并未改变, 所以未来的投资地图变得清晰了。你不能再用光膜怪一个篮子装所有公司,而是要细分看场景, 分清是服务于机柜内短距互联,还是机柜间数据中心间长距互联。看技术。在光领域,关注那些在 c p o 归光、高速率以上有实质性布局和订单的公司,看客户是否进入了英伟达、华为升腾海外顶级云厂商的核心供应链。 最后总结一下,英伟达 gtc 二零二六大会,与其说发布了一款新芯片,不如说重新绘制了 ai 算力互联的技术地图。它告诉我们,在追求极致算力的道路上,没有唯一的神兵利器,实用主义和性价比才是硬道理。铜与光 这对曾经的冤家,现在被证明是互补的搭档。对于投资者来说,这意味着我们需要更冷静、更细致地去挖掘产业链上的真实价值, 避开纯粹的概念炒作,去寻找那些无论技术路线如何演变,都能牢牢卡住关键生态位的公司。故事的篇章刚刚翻开,好戏还在后头。