粉丝4682获赞1.9万

来 gtc 的 第一天,我的世界观就被彻底击碎了。说实话,来森后赛之前,我以为这就跟咱们平时看的车展数码发布会差不多,就是一群搞技术的人聚在一起秀肌肉,发发新硬件。结果一进门,我直接蒙了,这哪是什么科技大会, 这分明就是一场把未来硬生生砸到你脸上的真实预演!我感觉自己瞬间穿越到了五年以后。我本来还想着来现场偷点诗,学一学怎么用 ai, 帮我写个好点的总结,怎么样搞一个好看的配图。 结果呢?转了一大圈,发现根本没有人聊这个,人家聊的全部都是接下来这几年, ai 会直接掀翻哪个行业,咱们普通人饭碗会被怎么样重新洗牌。这就好比我还在苦苦研究怎么把手里的诺基亚按键按的快一点,人家那边已经开始全面普及全触屏智能机了,这种降维打击太狠了。 但这几天最让我后背发凉的还不是那些满场跑的高科技机器,而是这里的参会者。跟他们聊完,你真的会突然出一身冷汗,因为你非常强烈的意识到,当咱们普通人还在天天焦虑,应该会不会抢了我的工作啦?下个月的业绩该怎么办啦? 但是已经有那么一小波人完全在另外一个维度里面做决定了,他们根本不会盯着眼前这点小烦恼,他们已经在用上帝视角重新设计咱们所有人未来的活法了。外面的世界早就翻天覆地了,如果我们还低着头只看脚下,那么未来被淘汰的时候,真的连一声招呼都不会跟你打。

最近英伟达正在举办的 gtc 大 会很有可能成为他股价的催化剂,这次英伟达会发布他们家最新的光学封装产品 cpo 交换机,持续时间是三月十六号到三月十九号,也就是到这周的周五。 虽然历史不会简单的重复,但是参照以往的数据,在每一次的 gtc 大 会之后,英伟达的股价都非常的强劲,在三个月的时间内会跑赢大盘。 这次大会呢,会立好所有从事光子封装,光子学技术的公司,光子以及光子学呢,一直都是卡着 ai 脖子的一项技术。 这次会议的主舞台会有特斯拉、微软 mate 这些公司呢,大概率也会从这次会议当中获益。 很多人会做大会开始之前的买家预期有助于提高股价,目前的远期市盈率仅为十七,为历史的低点。 能吃到这次大会立好的公司特别多,像什么台积电、英特尔、 amd、 博通等等都会从中受益,所以说这次大会是一个很好的机会,有助于提振这些公司的股价,并且呢会促进光子学产业链的发展。 光子学和光子技术呢,也是我长期看好的一个领域,我认为它的价值呢,不仅仅是在未来能够引领 ai, 同时也是 ai 发展的一种基础,原材料会限制 ai 的 发展,所以这类公司的价值在未来就很有可能会飞涨。

如果我问你谁是国内光模块的一个,你大概率会说出终极虚创、新易胜这些如雷贯耳的名字。但今天我要说的这家公司,它就像一个幽灵玩家,产品已经塞进了 deep seat 的 机房, 手里握着五十多亿的订单,甚至拿到了英伟达的双料认证,可整个市场却几乎感觉不到它的存在。它就是航景科技。这家被彻底遗忘的隐形亚军,到底什么来头? 说实话,要不是我最近深扒 d c 的 供应链,我也没注意到它。就在所有人都在盯着那几个头部厂 上吃肉的时候,航景科技居然已经把八百激光模块做到了规模化量产。 你想想八百 g 是 什么概念?那是目前 ai 算力集群的血管,专门负责 gpu 之间的高速数据交换。更夸张的是,就在咱们熟悉的 deepsea 北京一庄智算中心里, 在那些用来训练大模型的英伟达 h 一 百和升腾九幺零 b 背后,支撑他们高速互联的,就是航景科技的模块。这就像一场比赛,所有人都盯着冠军怎么冲线, 结果发现那个默默拿了亚军的家伙,大家根本叫不上名字。可能有人要问了,他凭什么? 光模块这个行业过去被两个东西卡脖子,一个是核心物料,一个是客户认证,很多玩家就算设计出来了也量产不了。但行景科技厉害就厉害在他的 垂直整合能力,根据最新的行业信息,他已经不只是简简单单的组装,而是构建了从 光芯片、光机电、光模块的全链条能力。这意味着什么?意味着他能自己掌握核心环节,这也是为什么他能突破供应链壁垒, 成为英伟达 gpu 和网络技术的双精英级合作伙伴。既有英伟达的朋友圈, 又有全产业链的基本功,这种组合在二三线厂商里绝对是异类。更有意思的是,就在这个月,有研报还提到了他的一个关键信号,为了满足下游需求,他开始给子公司提供巨额的担保, 这个担保额度直接扩容了二十倍。这说明什么?说明他已经具备了承接大规模订单的底层能力, 正在为二零二六年八百亿的灵活出货囤粮草。但是,即便手握超过五十亿的算力合同,即便业务做的风生水起,他在资本市场和公众视野里, 存在感依然几乎为零。为什么?原因很残酷,一方面,他太低调了,从来不刷存在感。 另一方面,他之前的财务问题和信息透露争议,让很多稳健的机构资金望而却步。在投资圈,信任成本往往比技术成本更昂贵。 其实我今天聊航锦科技,不只是为了介绍这只股票,更想聊聊这种现象。在一个极度火热的赛道里, 我们往往只看得见塔尖的那几个明星,却忽略了像航锦科技这样在塔基默默支撑的玩家。 ai 算力的发展不只是那些被炒上天的 gpu 的 功劳, 也是这些藏在背后提供关键连接却不被看见的名字的功劳。这种隐形状态,对一家公司来说,是保护色,还是发展的天花板? 最后想问问你,在你所在的行业里,有没有这样实力很强,名字却很陌生的隐形冠军?咱们评论区见。

最近英伟达 gtc 大 会大家都关注了吧,黄仁勋提到的同光并举,让不少朋友有点懵。 pcb 和 cpo 这两个方向好像都受影响,但仔细一看,他们的路数可不一样哦。 今天就来给大家捋捋清楚。先说说 pcb, 这次可是实实在在超预期了。你想啊, ai 服务器现在多火, pcb 的 订单根本不愁,像盛宏科技、沪电股份这些头部厂商能都排得满满当当,甚至都计划到二零二六年要大笔花钱破产了, 这量的增长绝对超出之前的预料。更厉害的是价,以前传统 pcb 也就几百美元一块,现在因为 lpu 推理芯片的需求,用上了五十二层以上的高端货,单颗价值量直接蹦到三百到五百美元一台,机柜里的 pcb 价值量更是传统的五到十倍, 这价值量涨得太猛了,而且上游材料也给力。富通版巨头建涛三月十号刚宣布全规格提价,百分之十成本有支撑, pcb 企业赚钱能力自然也水涨船高。 关键是这高端 pcb 技术壁垒高,不是谁都能做的龙头企业就能吃的更开,行业集中度和毛利率都会提升。这次 pcb 的 超预期主要就体现在这些高端细分领域,那 cpo 呢?这次节奏上确实有点不急预期。 黄仁勋明确说了,二零二六到二零二七年还是以铜为主, c p u 从之前大家以为的标配变成了一个更长期的路线图, 比如那个 fan man 架构,这就意味着短期订单落地可能要慢一点,业绩想看到实实在在的东西,时间也要往后推一推了。 虽然 spectormax c p u 交换机订单有五万多台,对应大概八十万直光隐形的需求,但市场原来预期二零二六年就能大规模出货,现在看来可能要调整到二零二七年才开始上量。不过大家也不用太灰心, c p u 的 长期逻辑还是在的, 二零二六年算是个验证源年,咱们国内的一六 t c p u 已经能量产了,量率还不低,有百分之九十以上三点二 t 的 也在推进中, 技术上咱们跟国外没啥代际差距,所以长远来看,光进同退这个大趋势还是没问题的。所以啊,虽然都被同光并举这四个字影响, pcb 是 实实在在的量价齐升超预期, cpo 则是短期脚步慢了点,但长远方向没。

a 股市场上打链的股票多数都在下跌,大家就觉得你说了个寂寞,不是这样子,他还在引领 ai 的 发展。 g t c 大 会有哪些颠覆性产品和投资机会?今天早上一起来肯定是万字长文黄仁勋砸场,真的是 ai。 春晚这个事情确实很重要,整个资本市场 产生了一个惯性,过去两年的 g t c 大 会都出现了引领整个资本市场炒作方向的现象级大世界。所以整个资本市场对黄仁勋的这场演讲是非常看重的。伊伟达在这一块就是全球最强的,就是王者霸主, 不管他对资本市场,特别是 a 股市场上这些股票产生了什么样的影响。基于你对 ai 的 关注,你就得看一下万字长文的将近两个小时的演讲核心都说了些什么东西。我认为这次的 gtc 大 会非常清晰地告诉全市场,英伟达已经从 单纯的硬件公司转型成为 ai 基础设施平台,你不要再把它局限于是卖 gpu 的,是卖机柜的,他现在是在构造一个无 完整的 ai 的 商业闭环。公司的转型就意味着后边提到的一万亿美元从哪来?就是从单一硬件公司转型为系统平台级公司催生出来的新的商机。这一万亿主要是体现在这个环节, 我认为这是最重要的。那我们具体到从硬件到软件这种协调设计,包括里面提到的一些新的技术路线,甚至包括他对未来的一些展望预期 们,都可以一一梳理。第一个,这次推出了一个微软的平台,这个平台到底是一个什么东西?简单而言,两百五十六颗 cpu 加两百五十六颗 lpu, 加一百四十四块 gpu, 构成了一个新的 ai 平 台。硬件协同设计把 cpu、 gpu 和 lpu 完美的协同了,这种协同的背后有两个数字,它的新的平台架构和它目前的 blackview 架构相比, 算力性能提升了三十五倍。如果按照摩尔定律的技术推进路径看,大概只能提升一点五倍,它就直接提升了三十五倍,这简直就是 ai 的 暴力美学,这也是它发布的硬件系统里面的最重要的一个东西。二零二六年下半年就要开始往出推了,第二款出现了一个新的东西,我前面提到的 l p l p u 是 这次推出了一个新的芯片,专门为推理而生的一块芯片。用黄仁勋的话来说,现在的算理中心就是 tokken 工程,以龙虾为代表的 tokken 的 应用的大爆发, tokken 成百倍级的增长。从 从 ai 算理结构上来说,主要依赖的是推理能力,之前的 g p u 既要肩负训练的重任,又要肩负推理的重任,他这一次等于说把推理单独给猜出来了,专门做了一款专用芯片,恰恰是迎合了 tokam 爆发式增长的大权 趋势。拿业内的说法是, l p u 的 推出是滔氽经济学的核心硬件,这是第二款,很明显人家是有新东西的,只不过今天 a 股市场上打链的股票多数都在下跌,大家就觉得你说了个寂寞,不是这样子 的,它还在引领 ai 的 发展。第三个东西我觉得是大多数 a 股投资者特别关注的光电混合趋势的一个反 反转啥意思?之前市场对光进同退的这个事情预期特别高,因为高速铜缆链接方案是英伟达推出来的光模块,包括之后的 c p o 都是英伟达布局的重点, 因为这里面要解决一个高吞吐量和低延时的矛盾的问题,所以光进同退是一个既定的、确定性的技术方案。但是通过昨天晚上黄仁勋在产品设计上这种布局,其实一句话就是市场对光进同退的预期过高了,步子卖的太大了。 所以今天你去看牌面上虽然说都在跌,但是与光相关的,比如说光模块、 c p o 甚至薄膜基酸里,这些都在下跌,跌幅更大。而高速铜栏板块反而是红的,那就是黄仁军没有彻底的或者说更大力度的转向光互联的方案,还是采用了光电混 合的方案。之前大家觉得光进的速度会比较快,那么铜的预期,所以市场在纠正对铜栏链基过于悲观的预期。 网易云熏的意思是什么?我们需要更多的铜烂才能,我们需要更多的光芯片才能,我们需要更多的 c p o 才能。这句话意思是啥? 目前现在的技术还离不开铜,同时并不意味着抛弃光,只不过光的过高的那个预期被压制。今天排面走的这些东西,就是对昨天晚上光铜混合方案的重新定价,并不意味着光互联方案就没有预期了,我觉得预期依然很强, 只不过黄仁勋要的是一个系统的稳定性、可能性、阶段性的,市场情绪上有一点点失落。第四块其实也是 a 股投资者关注度更高的。关于叶冷的渗透率的问题,按照黄仁勋介绍维纳罗宾架构的方案里面,全叶冷方案加 四十五度温水冷却,也就说全叶冷方案也是一个确定性非常强的一个方向。这个东西其实是一个物理题, 因为它的单颗芯片的性能还在提升,功耗还在增长,对散热方案的迭代的需求就是一个刚需。从它的技术路线上来看,全业的方案会变成一个越来越确定的方向。 问第五个,我们再说一说他在发布会上透漏出来的一些关于未来的展望或者未来的设想。会上出现了超过一百一十台机器人,同时宣布了和四大整车厂商的智能驾驶的合作规划。这是什么?这是除了 ai 大 模型龙虾带来的 token 的 爆发式增长之外的新的应用场景, 甚至黄人参都预期了自动驾驶的 deep six 时刻也即将到来。它是非常看重 ai 的 应用落地场景的,因为它整体上造出来这么强悍的算力,最终要有用武 之地,那么它就必须展望到底这些算力都能用来干什么。这就对未来机器人、自动驾驶,包括 太空算力都有一些展望,他觉得这都是未来的趋势,都是未来的场景。总结就是一句话,英伟达通过这种系统级的创新,硬件加软件加架构的全链路的这种布局设计,最终要 实现的是一个系统级、平台级、 ai 基础设施的缔造者,他要做成这样的一个帝国,从而实现二零二七年一万亿美元的营收目标。美得很嘹咋咧?

昨晚,被誉为科技界的春晚的英伟达 g c 大 会落下了帷幕,创始人呢,黄仁勋长达了两个半小时的演讲,再一次向全球的科技圈投下一枚重磅的炸弹。信息量呢,是非常之大的,尤其是对 ai 的 领域,几乎可以说是重新描绘了一幅发展蓝图。老黄究竟说了什么呢?有 有哪些观念的变化呢?最重要的是,对于我们投资者来说,又能够从中捕捉到哪些机会呢?今天我们就来一次深度拆解。首先呢,最重磅的是老黄一开场就抛出的一个数字, 一万亿美元。他明确表示,英伟达的旗舰芯片将会助力公司在二七年实现一万亿美元的营收。这个业绩指引什么概念呢?要知道,二零二五年的十月份,老黄当时给出的预测是到今年年底实现五千个亿美元的收入,而昨晚的预测 时间仅仅往后延长了一年,金额就直接就翻了一倍。这背后所传递的信号是英伟达对于未来 ai 的 算力需求的极度看好,甚至可以说是超预期的乐观。话音刚落,市场呢就迅速的给出了反应, 英伟达股价是一度涨超百分之四,到二七年年底要突破万亿美元的营收,英伟达的底气到底从何而来?这一次呢,黄仁勋是提出了一个全新的概念,代币工厂,他说英伟达是一家垂直整合的计算公司, 言外之意就是以后公司的定位要发生大转变了。以前呢,英伟达是靠卖显卡、卖芯片来赚钱,但从今往后呢,他要成为 ai 世界的总包工头,从计算芯片到互联技术,再到散热系统,全部打包一体化的交付, 实现从芯片公司到 ai 的 基础设施和工厂公司蜕变,也就是所谓的托肯工厂经济学。除了以上战略的指引以及全新的定位,这一次的演讲还重点勾勒了两个方向,第一个就是算力上天。应为达推出了 space 模块,要将数据中心级别的 ai 计算能力部署到卫星轨道上面去。以前呢,都是卫星在天上拍了数据,再传回到地面分析计算,一来一回几个小时就过去了, 很浪费时间。而算力上天之后呢,卫星就可以直接在天上完成各种分析计算,最后呢,只把结果传回给地面,这对于实时监控全球互联网, 甚至是心念计划来说,都是颠覆性的改变。所以这一条赛道呢,一旦跑通的话,直接交换的公司以及一些做航天配套的公司都有望迎来一波高速的增长。第二个就是软件养虾, 黄承鑫呢,直接说了未来每一家公司都需要养龙虾,当然这个龙虾呢,并不是特指小龙虾,而是比喻 ai 智能。英伟达针对开源 ai 智能体的生态,推出企业级平台的 name 可络,定位就是 open 可络的基础设施层, 可以直接实现一键部署。简单来说,就是让 ai 主动学习操作工具,主动调用软件去干活。如果 ai 以后都能自己敲代码的话,自己调软件干活,那么最受益的方向是什么呢?是不是依旧还是算理?当然,对于做企业的服务巨头来说,这就是一 一个危机,因为以后呢,可能会整个软件行业会彻底被 ai 员工所颠覆,到最后,关于资本上的投资机会,我觉得可以围绕两条主线来进行展开。首先呢,第一个就是数据传输,在顺利暴涨前提下,数据在芯片之间跑路的速度也能够跟得上,这就离不开光模块和高速互联技术, 谁能够让数据传输的更快更稳,谁就是这波浪潮的卖场的人。第二条主线就是功耗与散热,现在一块旗舰芯片的功耗快赶上一个小型电机了,传统的风冷散热呢已经是完全不够用,液冷散热呢成了标配,同时呢,对供电性能要求也极高,高压直流、新型电源这些细分领域上的空间 也就有望迎来爆发式的增长。总之呢, ai 这个赛道还很长,老黄呢,已经是把未来三年的蓝图都画好了,咱们要做的就是找到那些在蓝图里边提供基础设施配套的环节。

你可能无法相信,黄仁勋穿着那件标志性的黑皮衣,在最近的英伟达二零二六年 g t c 大 会上,又扔出一枚足以改变未来三年科技格局的核弹。 明年英伟达的 g p u 收入将会超过一万亿美元。我们一口气看完英伟达昨天举办的 g t c 二零二六年大会一开场,黄仁勋在数万人的尖叫声中走上舞台,他身后的巨幕正展示着一个由 ai 构建的未来城市。 这不仅仅是一场技术发布会,更像是一场关于人类文明进化的宣讲,因为英伟达即将不再是一家芯片公司,而是彻底转型为 ai 工厂的建造者。 黄仁勋首先回顾了库达诞生二十周年的辉煌历程,这个当年几乎耗尽公司利润的疯狂赌注,如今已成为驱动全球 ai 飞轮的核心动力。接着,他抛出了第一个王炸 dlss 五神经渲染技术,它利用生成式 ai 与三 d 图形融合,让游戏画面达到了肉眼无法分辨虚实的电影级质感。 无论是潮湿阴暗的赛博街头,还是充满科幻感的星际酒吧,在 dlss 五的加持下,所有的光影和材质都像是被赋予了生命。 黄仁勋兴奋地表示, ai 不 再只是解锁信息,而是在实时创造世界。这一突破将彻底改变价值数千亿美元的游戏和影视产 业。然而,这还仅仅是个开始,英伟达正深入企业计算的骨髓,通过 cudf 和 cuvs 库,将全球百分之九十难以处理的非结构化数据转化为黄金。 ibm、 戴尔、谷歌、云、亚马逊等科技巨头悉数到场,战队甚至连雀巢这样的传统快销巨头,也利用英伟达的算力节省了百分之八十三的成本。 黄仁勋在台上直言不讳地宣布,摩尔定律已经过时,现在是加速计算的时代,只有通过软硬一体的垂直整合,才能实现算力的跨越式增长。 你可能不敢想象,现在的 ai 算力需求已经爆炸到了什么程度。黄仁勋给出了一个令人震撼的数字,过去两年,计算需求增长了一百万倍。 他指出, ai 正在从感知向推理和行动进化,而这一切的背后,是人类对 toc 这种新型商品的疯狂渴求。在此基础上,黄仁勋发表了一个史诗级的预言,到二零二七年, ai 的 营收规模至少一万亿美元。 为了支撑这一野心,英伟达寄出了最强硬件 river rubin 架构,这是 blackwell 的 继任者,也是未来 agintic ai 的 动力引擎。 在短短十年间,英伟达将算力提升了惊人的四千万倍,这种进化速度在整个人类科技史上都是绝无仅有的。这一代系统实现了百分之一百的液冷技术,省去了复杂的线路,将原本需要两天的安装时间缩短到了两个小时,效率提升令人发指。 最让人意想不到的是,英伟达通过整合收购的 groq 技术,推出了 rubin lpx 系统,针对推理场景实现了三十五倍的性能飞跃。 这种极端协同设计让芯片不再是独立的个体,而是通过 nv link 连接成一个巨大的、拥有数百 tb 带宽的单一超级 gpu。 黄仁勋在现场展示了 rubin outra 的 强大性能,他自信地表示,即使是免费的架构,如果能效比不够高,对企业来说也是昂贵的负担。而英伟达的架构就是目前全球成本最低、效能最高的 ai 工厂标配,这让在场的 ceo 们无不为之动容。 更离谱的是,他宣布英伟达的芯片已经准备上太空了,直接在轨道上算完,把结论扔下来。 除了硬件,殷伟达还展示了在开元世界的统治力。 openclaw 项目在短短几周内的 github 星数就超越了发展三十年的 linux。 黄仁勋将 openclaw 定义为 agentic 系统的操作系统,就像当年 windows 定义了个人电脑,它将定义个人智能体的时代。这意味着未来每一家公司都需要有自己的 openclaw 策略,就像当年必须拥有互联网策略一样,这是生存的门槛。 发布会的最后,气氛变得活泼而温馨。黄仁勋邀请了来自迪士尼的三 d 雪人机器人 olaf 上台互动。这个在虚拟世界 omniverse 中学会走路的小家伙,展示了英伟达在巨深智能和物理 ai 领域的深厚积累。 机器人不再只是冷冰冰的机器,而是拥有感知、推理和行动能力的物理智能体,他们即将走进工厂、医院和我们的家庭。甚至在最后,黄仁勋还带来了一场由机器人组成的复盘演唱会,用一首悠扬的乡村民谣总结了这一整天的震撼发布。 从万亿级别的工厂布局到太空中的卫星计算模块,英伟达的触角已经伸向了人类文明的每一个角落。黄仁勋最后感叹,我们正处在一次伟大的文艺复兴中, ai 将成为每个人的放大器,让生产力实现十倍甚至百倍的飞跃。 这是一个属于建设者的时代,英伟达已经打好了地基,剩下的就看全人类如何在这片算力的沃土上种出改变世界的未来。

现在还活着的朋友们,那千万别记了,英伟达 g t c。 大 会刚结束,黄仁勋在一场两小时的演讲里,直接描绘了未来世界格局的蓝图。不讲废话,一条视频带你看懂。第一件 virus 如饼 ai 工厂平台正式发布,这不是一颗芯片,是七颗芯片、五种机架级系统组成的超级计算机。采用三纳米工艺的如饼 g p o 算力较上代提升五倍,单位 toc 生成成本降低百分之九十、百分之一百。夜冷设计,安装时间从两天缩到两小时 四十五度,热水冷却,消除数据中心空调能耗。第二件全新推理芯片 group q 三 l p u 登场,这是收购 group q 后整合出的新品,专为解决大模型推理吐字慢的痛点。 三星四纳米制成单芯片带宽达一百五十 tb, 每秒两百五十六个 l p u 组成的机架系统与 verry rubin 协同工作,通过解偶推理技术,将美瓦特 t 刻的实时神经渲染技术, 它不是简单的超分辨率,而是用生成式 ai 给每个像素注入照片及真实光照,将可控三 d 图形与生成式 ai 完美融合。今年秋季上线。第四件 name klo 一 键养虾安全部署平台发布随着智能体爆发,安全问题成了心头大患。 name klo 是 专为 open klo 智能体打造的部署 工具,两行命令搞定安装内置隔离沙箱,确保数据隐私。黄仁勋说,每一家萨斯公司都将成为智能体及服务公司。第五件 space 太空数据中心模块发布针对能源不足问题, 英伟达推出为极端太空环境设计的抗辐射 ai 计算模块,部署在卫星或空间站上,卫星不再是信号终极站,而是在轨运行的智能节点。第六件,物理 ai 与自动驾驶全面落地比亚迪、吉利、日产、 现代宣布加入英伟达 robot taxi 平台。 uber, 计划从二零二七年起部署英伟达驱动的自动驾驶车队,二零二八年扩展到二十八城。黄仁轩说,自动驾驶可能是第一个价值数万亿美元的机器人产业。机器人方面,与迪士尼合作的雪宝登台互动,背后是 isaxim 仿真平台和 justin thor 计算模块。 第七件,下一代 fireman 架构提前曝光。这是全球首款面向世界模型与物理 ai 的 下一代 gpu, 采用台积电一点六纳米 a a 十六工艺,搭载硅光子光互联宽带提升十倍,能耗降低百分之九十,推理性能为 blackwell 的 五倍。计划二零二八年量产。从万亿美元的算力工厂,到太空中的智能节点,再到可以互动的机器人伙伴,英伟达正在构建一个前所未有的 ai 基础设施帝国。

英伟达 g t c 大 会要点总结啊!首先黄仁勋说了,到二零二七年, black 为和 logo 芯片至少创收一万亿美元。此外近期的需求还在持续的上升,相当于给了一个很满的预期啊。然后重磅的是夏代价格,沃尔沃饼采用全液冷设计, 引入了针对自人体任务优化的沃尔 cpu, 并且整合了确定性流处理器技术。沃尔沃饼价格如不入可融合,节后推你直接开启了三百五十倍的加速。 这就是英伟达自己推出的 limo club, 参考设计,类似于龙虾,但是更安全,并且开启了物理爱的洽谈。 g p p 时刻宣布自动驾驶已进入大规模的商用阶段, 新增比亚迪现代吉利的合作伙伴。我觉得最震撼的就是雪宝阿拉夫真的能够在虚拟世界中净化出的物理适应能力。 关于他可以看我上一个视频啊。最后就是黄仁勋纰漏了继入柄之后的下一代 gpu 架构,他们将搭载 l p 四零处理器和罗萨 cpu, 支持 cpu 技术,然后宣布进军太空计算。整个 g t c 大 会不愧是科技重网,现在呀,后续重要信息我在解读啊。

嘿,朋友们,科技圈的 ai 春晚、英伟达 gtc 大 会,他又来了,老黄那两个多小时的演讲,新鲜量简直是核弹级的。但别怕,今天咱们就花几分钟,把这场技术盛宴里头最硬核、最关键的那些东西给你拔的明明白白的, 你听听。一开场,老黄就扔下这么一句话,我们正处于计算领域的根本性转折点。 这话可不是随便说说的啊,这份量太重了,意思就是整个行业的牌桌马上就要被掀了,要重新洗牌了。 紧接着一个数字就这么直接砸你脸上了,一万亿美元,你没看错,这是啥?这是牢黄放的话说啊,到二百二十七年,光是英伟达的新一代 ai 芯片就能干出这么多的营收,跟你说,这个数字背后藏着一个全新的世界。 那么老黄到底给我们画了一张什么样的大饼,或者说一张怎样的未来蓝图呢?别急,我给你总结了四大核心看点,这里头每一个都可能决定了未来十年咱们科技圈的玩法, 跟紧了,我们马上出发。好,咱们先来看第一个未来万亿目标和 ai 工厂时代 老黄说的那个一万亿,你可千万别以为只是卖芯片那么简单。不,他的野心大着呢,他是要从根本上把现在所有的数据中心都给他颠覆掉,变成一种全新的东西。 这个新东西啊,老黄管它叫 ai 工厂,说的再精确一点就是 token 工厂。你想想看,未来的数据中心,它不再是一个存东西的仓库了,它变成了一个生产线,生产什么?生产智能,也就是 token。 那 怎么衡量这个工厂厉不厉害呢?看的不是你存了多少东西,而是你每用一度电能蹦出多少个 token 来。你看这张对比图,一下子就把这事给说明白了。 过去咱们搞数据中心,天天算的是存储成本,怎么存共便宜,现在呢,全变了,咱们要算的是生产效率,整个行业的底层逻辑就从存东西变成了造东西。这一下就解释通了,为啥咱们需要一套完完全全彻彻底底的新硬件, 这就带出了咱们的第二个未来。全新的硬件你还记得吧?以前老黄开发布会,特别喜欢从兜里掏出一块芯片举着给大家看, 现在呢,画风突变,他直接把一整个机柜给你搬上台。为什么?因为他现在要卖的早就不是一块块的芯片了,而是一整套一整套的 ai 超级计算机。 咱们来求瞅这个超基计算机全家桶里都有些啥? cpu、 gpu、 dpu、 超级网卡、高速交换机? 好家伙,各种定制的芯片全给你配齐了!老黄的意思很明白,哥们别自己的那费劲钻了,我这直接给你一道配齐了的解决方案,开箱即用,直接就是一座 ai 工厂的基建 哎,但这里头啊,藏着个秘密武器,就是这个 grok lpu! 这玩意是干嘛的?这么跟你说吧,当 ai 模型需要疯狂往外吐 token 的 时候,传统的 gpu 有 时候会觉得有点跟不上,有点喘。 而这个 lpu 呢,就是专门解决这个问题的一个超低廉耻的专家,他就好像是给这个 ai 工厂的生产线装上了一个巨猛的涡轮增压器, 这效果有多炸裂?你直接看图,这个新平台加上 a o p u 之后,每兆瓦的吞吐量。注意啊,是直接给你干到了三十五倍,这是什么概念?意思就是你花同样的电费,能干出以前三十五倍的活,产出三十五倍的智能。 这么一来, ai 工厂这个经济账瞬间就算明白了。好硬件的肌肉修完了,但光有肌肉还不行啊,你得有聪明的玩法,有策略。九九来了,老黄抛出的第三个未来,他管着叫讯福开源龙虾。 这背后啊,是因为达一个高明到不行的软件和生态布局。你肯定好奇这龙虾到底是个啥玩意儿?其实啊,它指的是最近在开发者圈子里火到爆炸的一个开源 ai 代理项目,叫 open crawl。 它有多火呢?这么说吧, linux 花了三十年才达到的热度,它短短几个礼拜就给秒了,成了有史以来增长最快的开源项目。 那他为啥这么重要呢?因为老黄直接给他定了姓,他说这个 open cloud 就是 未来 ai 智能体时代的全新操作系统。你品你细品这句话, 这就好像当年 windows 开启了个人电脑时代一样。现在 open cloud 正在开启一个全新的个人 ai 代理的时代。 那英伟达的策略是啥呢?非常清晰,就三步走,第一步,不跟你对着干,我直接拥抱这场开元革命。第二步,我来解决你们企业最头疼的安全问题,我推出一个叫内蒙恐龙的东西,给这只野生的龙虾套上一个企业级的安全外壳。 第三步,有了这个安全地基,我来催生一个全新的产业,叫做智能体即服务。你看这部棋啊,简直是教科书级别的格局,一下就打开了, 所以你看,顶级的硬件有了,聪明的生态策略也有了,那么所有这些东西凑在一起,最终要描回一个什么样的图景呢?这就是老黄想要的第四个,未来 ai 无处不在, 你先看看这个路线图, blackwell reuben 赛道,下一代的 fireman, 一 年一代新架构,这个速度简直不给人一点喘息的机会,就是在逼着整个行业所有人都得跟着他的节奏跑,因为达用行动告诉你,我的野心没有尽头。 那这些恐怖的算力最后要流向哪里呢?你看看这些应用物理 ai, 从波士顿动力到 figer 的 那些网红机器人,全都在排队接入英伟达的生态 自动驾驶,咱们的比亚迪、吉利还有日产这些巨头也纷纷上传,你以为这就完了吗?不,格局再打开一点,人家还要把 ai 工厂直接搬到太空轨道上去。 所以啊,咱们来总结一下老黄这次 gtc 大 会传递的核心信息,其实就三句话,第一, ai 工厂的时代来了。第二, token 会是这个时代的新货币。第三, ai 智能体就是这个时代的操作系统。 最后,他给在场的所有人,也给我们所有人留下了一个问题,现在每一家公司都需要一个 open cloud 的 战略,那么你的战略是什么呢?

一年一度的英伟大 g d c。 大 会马上就要来了,全世界 ai 投资者都在等着黄教主拯救世界,拯救整个 ai 行业的信心。一块 gpu 从晶体到存储器需要多家公司参与供应链,只要黄教主在演讲的时候能正常发挥,整个产业链都会迎来利好。 英伟达的下一代的 gpu 将采用台积电一点六纳米 a 幺六工艺,这是台积电最先进的制造进度节点。为了满足英伟达的需求,台积电正在计划扩大 a 幺六工艺智能,所以台积电的技术发展速度作为全球 ai 产业链的下限, a 幺六的扩展速度这次特别值得关注。 另外,据说英伟达也在考虑将一些复杂度比较低、风险比较小的芯片外包给英特尔,这个预期对美国本土的先进制程会是一个确定性的预期。光有先进的制程还不够,它需要 hbm 高宽带内存,把计算速度和存储速度拉到同等水平。 三星和 s k。 凯丽石将在 g t c。 现场展示新一代的 h b m 四技术,都会为英伟达的 low 频平台量产。 h b m。 四美光的进度要稍微慢一点,等到二季度,存储三巨头同台竞争,但需求量大到根本不够分。整个行业未来几年的 h b m。 产几乎都会被消耗殆尽。 对三星 s k。 凯丽石来说,预期也是会消耗殆尽,对三星 s k。 凯丽石之间的运行速度也会越来越快, 传统铜线已经到了极限。英伟达的解决方案是用光代替电,把光学引擎直接封装到交换机里,预计将在 gtc 展示 cpu 光学交换机之前的 lmt 和 cofin 各投资了二十亿美元,就是为了锁定激光器和光学组建供应。 上周甚至和 amd、 博通达成了合作,共同开发光互联技术。这是英伟达正在构建的另外一条护城河,把整个 ai 产业链上下游都拉进自己的生态系统。很多散户现在还很纠结,说英伟达的股价比利是高点跌了不少,是不是已经见顶了? 华尔街平均目标价现在是二百七十三,意味着还有百分之五十二的上涨空间。资本市场压住的不是某一个 ai 模型,而是整个 ai 工业体系, 从精原厂到内存厂再到服务器、光通信、数据中心,所有产业链在一起能同时爆发。未来十年, ai 拼的是工业能力,真正决定赢家的会是那些控制供应链的人,而整个供应链中心就是英伟达。

整个英伟达的 gtc 发布会看完了,现在是深夜四点多五点了,我说三个点,第一,老王开场商业酷吹,但英伟达它是把老美各个独立的公司联合在一起这么强。 第二,展示了很多功能和新产品,包括现实物理,虚拟模拟,还有各种芯片等等的。第三,讲解了多个板块, ai 服务器搭建, ai 算力大幅降低电力能耗,如何降低太空算力等等的,还讲解了大龙虾,这些我就不多说了,很多博主会讲解的,说白了英伟达就是大件的一个完整生态。我说下我两个感受, 第一,英伟达确实强,它从一个小锄头公司成长为一个大铁厂公司,还把老美各个公司联合在一起, 而我们中国呢?还是单打独斗,我们缺乏一个联合体,缺乏一个底座让各个顶级公司联合在一起。 目前华为是有这个能力的,海思和华为阿特拉斯生产九五零零曲联合在一起,形成一个 ai 发展底座,那是因为它这样子的。第二,我就一直说我们国家的顶级人才 一直外流,让老美的巨头公司收集了,现在他们成为我们的直接竞争对手,说到底工资和发展配不上这些人才,这真的很恐怖, 这次英伟达的发布会会让我们国内很多科技巨头和高校恐慌的,所以我真的希望有更好的动作挽留人才。最后,虽然英伟达他很强, 但我不会像其他博主一样吹捧一维达的,他是我们的竞争对手。作为一个中国科技人,虽然我的本事不大,但我会让我的团队加大投入,对华为领取的开发也会免费帮助很多企业入门领取 的是对我们国家算力基础的做一些贡献。我最近开通了一个华为生态和其他公司相关合作的内容,如果你们喜欢华为,欢迎加入,感谢支持关注!

大家好,在今天上午老黄演讲完之后,网上很多博主都发了关于 gdc 的 内容,但是绝大多数都是新闻性质的,他们都只讲了老黄说了啥。 这个视频我们就结合伊敏达的技术规划,来聊一聊网上可能还没有的一些分析和我认为的本次 gdc 大 会的核心看点。 第一个就是 cpx 将黯然退场。在上个月下旬的时候,网上依然还传着很多关于 cpx 要使用 hbm 的 传言,但我当时就听到消息说 cpx 要取消了, 但是这个信息太炸裂,所以当时我也不是很相信,但事实证明确实要被 lpu 取代了,那取代的原因就是英达的路线转换,它们要从 free 加速切换到推力加速了。 这些内容和观点我们之前都在星球讲过。第二个就是谁是这次大会之后的最大受益方, 那显然是三星,因为 l p u 是 找三星独家代工,采用的是三星的 n 四工艺,那这意味着三星不仅是英美达全层级存储的核心供应商,现在更独揽了 l p u 的 代工大单, 那在 ruby 上,三星的综合价值量已经超过了台积电,因为台积电是只负责代工和封装。第三个看点, lpx 机架引入了 fga, 这可能是很多人没有想到的,那 它引入 ipga 的 作用是什么?第一个就是它专门负责实现系统内可配置的串联通信旁路,而且它后端还搭配了一颗 cpu 来进行协调控制,那这种精密协调控制就可以保障二百五十六颗 lpu 能够作为单一的巨型处理器运行,从而从而可以实现低延迟的确定性推力加速。第四点就是为什么要把 cpu 独立成机柜?这个是因为我们现在已经进入到智能体时代, 那智能体在自主工作的时候,它需要频繁地去调用工具执行逻辑代码,进行强化学习和自我纠错。而独立的 cpu 机柜正是为了提供海量的沙盒环境而生。那单个机架呢,集成了二百五十六颗 cpu, 可以同时维持超过两万两千五百个病发的智能体测试和验证环境。这样呢,就可以填补 gpu 在 复杂单线层逻辑处理上的短板。 第五个看点就是英伟达为什么要设立独立的存储柜?这个呢,就要结合英伟达之前提出的 i c e m s 来解释了,就是推理上下文内存存储这个方案 在智能体时代模型,它需要处理数百万托管的超长上下文,这个呢,就导致 k、 v k 值的数量暴增了。那如果是加含量的 k v k 值全部都存放到 h b m 层呢?不仅容量出现,而且成本非常高。 但是如果全都卸载到传统的共享企业存储中呢?那它的延时又会严重拖慢推理速度,导致 g p u 处于闲置等待状态。 所以呢,英文达就采用了分级存储的架构啊, cms 充当了整个 a r 基群的长期记忆库,它专门针对海量临时的 k p k 开始数据的存储、解锁和共享进行了优化。 通过高速的 idma 网络,它可以将上下文数据预加载回 gpu 内存。同样呢,可以避免历史数据的重复计算,可以显著提高效率。第六点就是抛开技术层面,老黄最关注的是什么?那显然是能和共赢点, 他这两年频繁地来亚洲,就是为了锁定存储金元代工和先进封装的潜能。英伟达在供应链管理上的优势是其他所有企业都望尘莫及的。这里呢,我们再多说一点, 就是谷歌去年的时候他卖了很多 tpu 给 astropica, 但是谷歌其实非常后悔啊,因为谷歌在卖了之后呢,他很快就推出了 nasa banana 以及 jimmy 三, 这样呢,就导致他们内部都没得用了,结果呢,还把珍贵的算力卖给了竞争对手。所以呢,这也是 open a r 去年疯狂地去跟各个大厂合作,去给他们画饼要产量的原因。 那这个案例呢,也恰恰证明了,在 a r 算力即企业命脉的当下,那对底层的绝对把控力才是决定最终胜负的关键。

hello, everybody welcome to g t c。 我 没想到黑客帝国竟然真的会从科幻, do you want to know? 以前我们总觉得虚拟世界、数字大脑、超强、 ai 都是电影里才有的东西,但这次我看完 en vivo 的 g t c 大 会,我才发现老黄正带着英伟达,正把科幻一点点的搬进现实。 今天我们就用三个角度跟你们聊聊这次大会真正的震撼。第一,游戏画面已经不是升级了,是重生。不管是新一代的显卡、光追,还是说玩全体的大力水手插针,以后的游戏真的会真假难分。 画面细腻到像现实,流畅度拉满到丝滑。我们这代玩家真的要亲眼见证游戏时的变更,以前是我们玩游戏,未来可能是我们走进游戏。第二, 这些黑科技不只是给发烧友看的,是在帮我们普通人。 ai 不 再是高大上的一个概念,他会钻进你生活的每一处,工作帮你效率翻倍,生活帮你省心省事, 创作帮您实现以前不敢想的东西。科技越发达,普通人的机会就越多,这才是最实在的意义。第三,也是我最感慨的,这次的变更直接指明了未来十年的发展方向。 算力、 ai、 虚拟世界、数字生命。听起来都很大,但其实说的都是同一件事,一个全新的时代真的来了。 很多人可能会迷茫,未来太快,我们跟不上,怎么办?我想说,害怕是正常的,但期待更有力量。黑客帝国从科幻走向现实,不是为了淘汰我们,而是为我们拥有更强的工具,更广的一个世界, 而更多的可能科技在往前跑,我们只要保持好奇,保持学习,就永远不会被时代抛下。关注我,了解更多电脑动态!

大家好,今天我们基于美银证券最新发布的英伟达专项研报,深度拆解二零二六年 gtc 大 会的核心产业信号,看看外资是如何评价这场 ai 春晚大会的。首先说最核心的结论,这次 gtc 大 会,英伟达不仅拿出了延伸至二零二八年的完整产品路线图, 共把二零二五到二零二七年数据中心业务的销售可见度,从之前的超五千亿美元直接上调到了超一万亿美元。更关键的是,这个统计口径和此前保持一致, 仅包含 g p u 系统及配套的 c p u 网络产品收入,还不包含本次新发布的 verac p u l p l p u 机架系统的独立销售收入。 这两部分会是一万亿目标之外的额外业绩增量。从客户结构来看,这一万亿的业绩预期里,百分之六十来自全球前五大超大规模云厂商,剩下百分之四十来自企业、工业主权国家等下沉市场。 客户结构的多样化,让英伟达的业绩抗周期能力大幅增强。同时,英伟达计算 e g w 的 数据中心对应约四百亿美元的资本开支, 其中公司可覆盖的市场空间就有两百到三百亿美元,业务边界已经从单一算力芯片延伸到了数据中心全产业链配套。第二,我们看产品端的核心布局。这次大会,英伟达彻底补全了全站结偶的 ai 算力管限, 实现了 ai 训练预填充解码、批量优化、全工作负债的定制化覆盖。一方面, gpu 迭代路线清晰,落地二零二六年下半年推出 rubin 架构,二零二七年发布 rubin ultra, 二零二八年落地, fragment 架构核心算力与能效持续领跑行业。 从 hopper 到 black cleveland 架构,英伟达已经把单 token 成本最高下降了三十五倍, reuben 架构会在此基础上再实现二到十倍的通用效率提升,搭配 l p u 方案后, 低延迟场景的效率最高能再提升三十五倍。另一方面,针对 ai 推理场景,英伟达推出了基于 s r a m 架构的 g q l p u 产品,二零二六年三季度正式量产,专门解决了此前的场景短板。 同时,针对市场关注的 c p o 供风装光学技术,英伟达做了客户可选设计,客户可以继续沿用铜缆方案,彻底打消了技术迭代带来的替换成本顾虑,也会加速光学方案在 ai 数据中心的渗透。 第三,我们看英伟达的核心护城河。这次大会最让市场安心的是,英伟达明确表示,二零二五到二零二七年全产品线的产能已经完全锁定,彻底消除了市场对先进制程产能瓶颈的担忧,这也是万亿销售指引能够兑现的核心基础。 再加上全站系统级的产品能力和客户深度协同的联合设计, c u d a 软件生态的深厚壁垒,竞争对手很难在短时间内形成实质性挑战。最后说投资层面, 美银证券在大会后维持英伟达买入评级,目标价三百美元,对应二零二七年除现金 pe 为二十八倍,处于公司历史二十五到五十六倍的远期 pe 区间内。当然,我们要客观看待潜在风险,包括 ai 芯片行业竞争、家具出口监管政策收紧等, 而国内相关产业链由于 gtc 大 会前市场预期已经打满,短期还需提防高位品种的兑现风险。好,今天的分享就到这里,后续我们也会持续跟踪产业链的变化,欢迎点赞关注,谢谢大家!

呃,其实英伟达呃,黄志坚出场也是去介绍了一下整体的背景,也是讲到了其实跟他上个业绩会的这个口径一样啊,有时候现在整体进入了这个就是 agent 的 推移时代啊,正式进入 agent 的 推移时代,然后也是展示了跟英伟达去深度合作的这些 这个 ai 原声的公司啊,也是讲到了就是啊,各个领域的这个 ai 原声公司呢啊,在这个,呃呃,以 在整个二五年呢,是包括从融资的角度啊,包括从这个规模扩张的角度啊,都迎来了这个飞速的增长, 然后整个行业呢,是获得了一百五十亿美元的这个风险投资啊,是人类历史规模上最大的一次。然后回顾了之前的整个的 ai 发展啊,从二十三年的这个生成式 呢啊,到了这个 reason ai 啊,也就是说 从二二四年啊,二四年九月份的这个啊拆的 g p t o 一 的诞生开始 啊,那这时候其实一个显著的特征就是输出的头肯啊,去急剧的增长啊,那在这个过程中呢,其实输入的头肯代表了这个模型去理解用户的一个指令啊,那输出其实代表了这个,呃,这个就是啊,这个模型的思考过程 学输出,我们当时就看到了这个思维电中不断的有这个啊,思考的啊,过程啊,有,有这个思维电的这个在在不断的输出啊,那这是二十四年的一个范式啊,那到二五年年底已经年底 建的这个 go 的 啊,也是正式进入了这个 a 政的时代啊,有 ai 啊,也是讲到了就是 ai 能够完成人类工作啊,并且富有成果啊,这也是成为啊整个的这个 ai 技术的一个关键, 所以说现在进入了就是新的啊,这个推理时代的这个转折点啊。所以,所以说从过去两年来看啊,整体看这个算力需求的一个变化啊,推理饭吃的转变,使得了这个计算量的需求是扩大了一万倍啊,也就是说,呃,我们之前的这个 呃,跟完成单次任务的啊,这个推理饭吃的这个算力需求相比啊,是提升了一万倍啊,再加上了这个使用量 扩大了一百倍啊,所以说这里啊,老黄提到了给他一个模糊数字啊,就整体的算力需求是增长了啊,一百万倍啊,这是,这是,呃目前推理时推,呃,就是进入推理时代这样的一个背景 啊。那下面的话,其实我们是啊,就是整个昨晚啊,因为今天凌晨这个 啊,二两点到四点,整个这个英美达它的股价跳涨最明显的啊,这个,呃,一页 ppt 就 来了啊,一个是他继续去强调,呃,去重申,到了,就截止到啊,二六年底 啊,这个五千亿的这个销售目标,那这个销售目标呢,是在去年啊,十月份的这个华盛顿华盛顿 gtc 大 会上啊,去提出来的,当时其实他讲到了就是,呃,呃,目前正在交付的这个 blackwell, 其实他是从年,呃,从 这个算六个季度一共是五千亿啊,那,那讲到是就是呃, g 三百,再加上这个呃,就是二六年下半年少量出货的这个 rubin, 加起来一共是这个五千亿的一个销售目标啊, 那这次重申了这个目标,就是二零年底啊,达到这个目标,然后再又一次讲到了说到二七年 这个规模至少达到一万亿啊,所以说我们解这么一万亿,其实他们下面的这个轴上啊,去标注的是二五到二七年啊,这个,那怎么去理解这个数字啊? 因为这个数字呢?其实,呃,提供一个理解角度啊,他其实是,他其实是是去讲到了就是截至我,我理解应该是他啊,目前如果以截至二七年的维度来看啊,目前在呃看到的这些确就是确定性的。这个 如果滚动到啊,这个二七年底是来到了一万亿啊,所以说这个数字呢,其实他,嗯,其实当时因为会议说的也比较模糊啊,他应该也不是说现在给到一个明确指引,就是二七年单年啊,有一万亿啊,那其实他讲到的就是可能目前的债主名单,如果我们跟这个五六个月 啊,这个之前的这个啊,华盛顿 dc 啊,华盛顿的这个 dc 相比的话啊,其实现在是来到了这个一万亿的水平啊,这是,这是也也是对未来的这个史努比系列的这个增长的版图呢,去提供了 这样的一个信息的一个指引啊,然后包括这他去讲到的现在一个收入结构啊,就是百分之六十的是这个,他说的是五大啊,这个 high pro 厂商啊,那其实包括四大 c s p 啊,再加上啊,应该加上 oracle 啊,是占到百分之六十的 这个收入占比,然后啊百分之四十呢,是其他的,包括,呃,各各种的这种传媒企业,然后 啊,机器人、边缘计算啊等一些这种肠胃的啊,一些场景啊,这是他目前的这样一个,呃,这是他这个一个这个 一个情况啊,当时也是讲的黄军讲的这个一万亿呢,其实英伟达,当英伟达晚上是最高是拉到四个多点啊,拉到四个多点,但是后面呢啊又又有逐步的兑现啊,这是,这是他呃,这是 对对未来收入一个整体的指引啊,所以说呃,其实刚才铺垫这么多啊,所以讲到这个又是进入这个时代啊,也好,其实为了是说明一个点呢,就是下面这个图,其实因为呃,其实呃,老黄在这次大会上就讲到这个部分的时候,明显明显是感觉到跟之前的大会 相比来看,其实他的语气中我感觉是比较强硬的,就有点带着气的这种感觉啊,他其实就讲到了 就是呃,这里是也是呃强,也是对这个推移时代去看空啊, n v 的 这些声音啊,给到一个强力的一个反击啊,他其实这里的呃就是用的这个 呃数据啊,他其实如果我们看左边这个图啊,那其实跟上次 g d c 的 这个通讯学的数数据的那个呃,那个图其实差不多的啊,横轴依然是就是美用户 的这个呃分到最大投肯啊,那其实我们可以理解成就是横轴啊,我们可以把它理解成这个食盐的一个呃,一个这个这个 呃成成反比的这样一个指标啊,那其实相当于就是在用户可接受的这个食盐价给用给单用户去提供的这个最大的投肯量啊,然后重轴呢?它这里它是用的是这个,就是每 啊相当于美啊美美瓦特的这个数数,呃,这个 ai 工厂,也就是说集群啊,去提供的 这个啊,收入啊,其实我们可以把它理解成就是啊宋卓和仍然是这个宋祖亮的一个概念啊,因为宋祖亮其实相当于我们在啊 ai 工厂去卖,呃,去去售卖托根他的这个量的概念啊,所以说这个里面我们看他给到的是 g b 三百的啊, g p 三百相比这个 h 二百啊,是提升了,呃,每,呃是提升了五十五十的这个学习效率,也就说 我在同在这个电力有限的情况下啊,能够去 ai 工厂去能够去产生的最大收益是提升了五十倍啊,同时成本呢是降低了三十五倍。然后在这个图中呢,我们也看到这个灰色曲线是它 这个呃,写的这个就是竞争,竞争对手的曲线啊,那这里的话啊,他没有具体给到我们两家,应该是我们可以可以,可以,呃,如果我们猜想的话,应该是某主流的这个 ic 的 产品啊,所以说这里才是用通过这个跟英特达一致,与 ic 强调点是一一致的啊,就是通过这个, 呃,我在每每每每瓦特上的这个性能表现是远高于这个竞争对手的,所以说啊可以创造这些收益呢,可以去磨平掉前期的啊,这个左右成本上啊带来的这个差距 啊。这是这是这个他继续强调到啊,就是 n v 仍是目前来看就是性价比,还是去强调这个点。 下面的话是来到这个大会的这个这本次 g d c 的 这个重点,重点的部分啊去去,呃给到了,就是啊一些新品的,包括这个维尔 rubin 啊的一些这个新的新品的一些细节。 好,那我们看到这相比于上次 c e s 啊,上次 c e s。 大 啊,年初 c e s 大 会的时候给到我们当时主要引入的这个最大的新品是这个就是 b f 四啊,路飞的四,这个,呃,相当于存储存储管理芯片这个智能网卡啊, 这次的话是引入了,呃,几个之前之前从来没有讲到一个东西啊,然后新增量就包括以下几几个啊,一个是我们看到它是引入了这个,呃,但,呃,这里,这个,下面,下面这张图的这个第三个啊, 就是 very compute tree, 也有时候引入了这个单独配备,呃,这个 cpu, very cpu 的 啊,这个 compute tree 啊,然后引入了就是,呃,之前大家呃从 从会前所预期的啊,从,呃,当时包括我们在讲那个 gpc 前瞻的时候也跟大家讲过的啊,这个 l p lpu 的 这个 control tree 啊,大概是在下面这个图的最右边啊,这个啊,这个形态啊, 那它是每一个板子上呢,是配备了八颗啊,格鲁克三代的这个 lpu 啊。然后再就是给到了这个,就是它的这个, 呃, spectrum 啊,呃, cpu 的 这个 switch 啊,当然这个还是用于这个 skill up 的 部分的啊。然后再就是上次提到的这个啊, p f 四啊,那我们具体来看啊, 再次呃包,呃,在介绍这个玩 ruby 的 时候,他再次去强调到了就是目前的这个就是多个芯片啊,统一成一个系统, 再次去强调到了整个的 very ruby 的 一个系统的一个设计理念呢啊,包括把这个软件去融入到里面去啊,嗯,是一个从端到端啊,去协调优化的啊,这样的一个整体的 ai 推理系统 啊,然后啊下面这个图会更加清晰啊,左一的这个就是刚刚讲到八个啊,配备八个 lpu 的 这个 control tree 啊,我们可以看到它在呃它的这个形态呢,跟这个 呃,我们就我们这个熟知的这缓存的缓存的形态是一一样的啊,是啊,只不过上面也插了放了八块啊,这个啊,格鲁三的 lpu 啊,然后中间 呃中间这个的话还是是这个 m 一个 c 啊,没有什么太大的变化啊。然后这个呃这个就是传统的这个啊,玩 ruby 的 computer tree 啊,跟上次 cs 去介绍到一样,也说里面这个小跳线的一些设计啊,嗯, 具体说话了,这是上面没有像这个 g b 系列一样的,这个像上面的飞线啊,跳线的啊,这个部分了啊,全部都挤成在板子里面啊,所以说整体的他的这个装备的量率啊,包括装备的时间啊,都装备量率提升啊,装备时间大大缩短啊。 然后右边这个右边这张图来看啊,这个最左边啊,这个就是 b f 四它的一个存储管理芯片啊,然后中间的话是这个 very very cpu 的 啊,单独的这个 computer 啊,但是这个的话,在这次其实上次业绩会的时候也提到就是说这个 呃,电信上他会讲去单独售卖啊, c p u 的 这个事啊,但是,但是,其实他只是给也是给到了这个产品,也是讲到了就是在 a 政的时代大呃,这个 a a 政的推理啊,对于这个 c p u 的 赋值的一个提高,我们也看到他引入了这种单独的 单独的 contrast 去相对于去提升了这个整体的这个 cpu 跟 gpu 的 一个配置。有单独的啊,就是解偶的这种 cpu 啊,当然啊,但是没有给,呃,这里就没有给到太多的细节啊,当然我觉得就是啊,后续这个 a 正推理的占比提升了,这个就是 cpu 啊, cpu 的 这个, 嗯,至少 cpu 在 在 a 正时代去承担更多的工作啊。去这个逻辑应该是没有什么问题的,只不过说后续这种单独配备的这个 cpu 到底有多大量呢啊,只不过现在还说不太清楚。 这是这是关于 cpu 哦,右边的话就是这个 specfone x 的 这个 cpu 的 产品啊,包括老王手里拿的这个啊,也是这个 cpu 的。 呃,这个食物啊,我看到跑外外侧有一圈的这个光影琴,好,这是,这是,呃,这是从从几个这个这个 细节上来看啊,这是发布的一个新品啊,然后那如何去理解这是整个 verubine 它带来的这个性能提升呢?然后以及如何去理解在因为啥在这个时候一定要引入这个 啊, grok 的 啊, lpu 进入它整个体系中呢啊,下面其实老黄给了我们观这个推理的啊,一个细致的一个解释。 左边这个图不知道能不能看的很清楚啊,左边这个图的横轴呢,其实它代表了就是啊,不同级别的这个模型 啊,不同级别的这个模型啊,老王也讲到就是这个模型的规模正在呃不断的扩大啊,然后从最初的可能十万个 token 的 输入长度,到现在去输出百万个 token 啊,所以说,嗯,他讲到的是 token, 就 像一,就像这个商品一样啊,就是 一旦发展到啊,发展成熟,也就说发展了也也,呃,就是 ai 到现在啊,也有个这个,这个三年多的时间了啊,一旦一旦说趋于成熟啊,那就会有一个不同的部分啊,所以说横轴其实也生动的代表了,就是目前我们在 openroot 上看到的这样的一个模型格局, 也就是说啊,头部最领先的模型呢,他啊可以有定价权啊,去收到最高的这个费用啊,然后下面呢,呃,就是这个,呃,更多更便宜的这个模型啊,可能去去去有更大的量啊。所以说横轴他现在代表的,包括我们看到 啊开源的这个二二二百三十五 b 版本的这个模型啊,相对于是是是免费提供的啊,包括在一些这个集群上啊,也是这个免费提供 到 kimi t 二点五啊,那他可能收取就是三三美元啊,每百万头肯的这个价格。然后再往右就是对应更高级的模型,包括到 gbt 啊,到到 gbt 五点四啊,再到这个就是, 呃,更更收费更贵的这个模型啊。来看,你就说现在模型上有这种啊,就是从横轴来看,它其实代表了这个就是模型的这个,我把这个图放大一点啊,就是代表了,呃,代表了当今当下这个模型的 啊,这个模型的分层,但是从这个图就是虽然他是不同模型,但是还可以代表一个什么, 其实它跟就是老黄居常用的这个通缉学那个图是是一样的啊,杭州它还是是代表了就是 gps 美用户啊,那那怎么理解呢?就是美用户可以分到的这个最大 token, 也说其实现在其实越智能的模型呢,它其实也是越 呃,呃就是每用户啊,在完成所问的问题的时候,他分到最大部分啊,是是更多的啊,所以说这个图跟呃老黄就是纵轴是呃是吨数量啊,横轴是在可以可以在一定程度上代表食盐的啊,那个图是一样的 啊,比如说横轴其实代表了呃其实是价格啊,然后纵轴的话就是这个数量啊,就是这个数量呃乘以这 个价格啊,所以说它其实我们看到的每条线呢,它跟这个 x 轴 y 轴啊,去围成这个面积啊,其实是代表了呃这个呃水 a 工厂得到的一个收入 啊,所以说这里我呃详细的介绍一下这个图是怎么去理解啊。那我们再去看到就是这里面的一个迭代的过程啊,就是从这个 over 系列啊,到这个呃 blackwell 系列啊,那呃到 blackwell 七十二啊, 其实是整体是提升了大概四百,呃三十五倍啊,提升了,呃提升了三十五倍的这个非理性效率啊,然后再从这个,嗯, 呃 blackwell 系列到这个 ruby 系列啊,这里又提升了啊,它我们可以看到不同模型它是提升的幅度是不一样的啊, 看到在呃这个比较便宜的模型啊,或者说单用户分到 token 量比较小的情况下啊,其实它可能就提升两倍啊,在最左侧来看,然后中间的话可能提升三倍啊,那最右侧啊,针对最大的优化,它正最右侧,它提供的 其实是最贵的这个模型,它是提升了这个十倍啊,也就是说,也就是说这个我们可以看到它是对于这个最大的模模型啊,这就是单用户分到最大 token 啊,这个模型是提供了最好的一个优化, 那其实这还代表什么呢?就是单用户分到 token 最大,其实也是代表了就是,呃,我们可以可以可以想象,就是在一定的标准时言下,用户可以分到最大, 越往右呢,越代表了就是对于食言的啊,一个高要求啊,我们可以可以把这个横轴同时理解成什么呢?同时理解成越往右啊,这个整体的食言啊,是越低的啊,所以说,呃,理解了这一点的话,我们就可以看,就可以下面就可以理解,就是, 呃,就是为什么要引,要引入这个 l p u l p x l p u 的 这个架构啊,比如说我们可以看到上面在这个图中呢,呃,它最大的,呃就是最大,呃,其实它就是支持到了什么呢?支持到了每用户相当于每 用户这个量啊,因为再往右它其实是不行了啊,那这里的这个限制呢,其实主要是来源于这个就是 h b m 的 一个贷宽啊, 是啊,食言,要不然食言就过大,是超出了这个用户的一个等待极限啊,所以说,呃,这个贷款的限制呢,导致了就是,呃每个用户他不能分到更大的啊,这个透客量啊, 所以说这里的话他就引入了这个,呃,就是 grog 啊,就是在这里去进行的 这个引入啊。那我们看这个右边这个图,我再放大一下,我们仔细的看一下,那其实刚才啊在横轴在这个位置啊,那现在横轴的这个单用户的这个头肯呢?是拓展到了一千以上啊,有时候这个曲线的一个呃延伸呢啊,就是由于这个 呃 l p u 啊所带来的啊,有时候 rubin 他 其实是不能够不能够去支持到啊,单用户啊,更大的一个头肯量的啊,所以说, 所以说这是啊 lpu 的 一个意义啊,一个最大意义啊,所以说我们如果看具体的使用场景的话,就说如果工作赋载是在编码啊和高价值工程的这个透明进程上,也就说在啊,在于这种高价值的 agent 和这个呃呃 和这个 coding agent 啊,这种这种场景下啊,这种场景下呢,它就没有呃像,就只有呃只有 gpu 的 话,它就是没有办法去提供更低视野的一个推理了啊,所以说要啊,要加入啊这个 groot 啊, 然后啊,黄志勋他跟他讲到的是我可能会在数据中心中百分之二十五的容量啊,去添加 groot, 也就是说啊, groot 跟 呃跟这个呃 gpu 啊去做一个,去做一个这个啊搭配啊,去进行使用啊,然后这里也讲到就是 group 三啊,这个 sram 呢,也是由三星啊进行提供,然后于 q 三去进行发货啊, 然后嗯,再就是其实这个也是比较符合,就是大家在 gtc 会前啊,对于这个的一个预期啊,对于 呃整体 l p u 的 一个预期啊,也说这次大会呢,可能呃就肯定不会发跟菲曼相去结合那个部分啊,可能肯定会要引入这个啊,就是单独的啊,这个 l p u 到整个系统中啊,但是跟大家之前的预期有所不同的一点是啊,就是之前呢 呃,大家可能会讲的是整个 lpu, 它可能会融入到这个 enigma 生态中,用 enigma 进行连接啊。但是老黄这里讲到就是他其实并没有用 enigma 啊,这里用了一种特殊模式的以太网啊,也说通过这个特殊模式以太网呢,去跟啊,去跟这个 ruby 啊,去进行这个连接啊, 就是呃,然后包括他把这个他的那个代代诺的这个推理的优化系统啊,也跟啊 lpu 去进行了一定的结合啊,然后一共是获得了这个三十五倍啊,三十五倍以上的这个性能提升啊。我,如果我们去, 呃,如果我们去对应这个上一张图啊,刚才看到这个 ruby 跟,呃这个 ruby 系列跟 blackwell 系列,其实上一张图这里是提升十倍啊,那加入了这个 rpu 之后呢?是啊,整体提升了三十五倍,而且是在然后如果我们看场景的话,就是在这个呃高吞吐量啊, 对于誓言要求不高的这种场景下啊,其实是提升不高的,尤其是在这个,就是对于誓言啊,要求高的这个这个场景下啊,那来迎来了一个很大的提升啊。所以说,所以说我们就在看现目前的这个 agent 带来的这个革命啊,就是这个对半是到底发生什么样的变化啊? 一个是那英伟达又又分别推出哪些应对啊?一个是这个呃,就是显著延长的这个上下纹啊,有更大的更大的这个 keep touch 啊,就是那英伟达的这个呃,支持。呃,这个变化呢,就是把整体的 嗯存储啊,去打通,嗯,包括从这个 s b m 啊,到 d r m 到这个 net 上面啊,去卸载这个 k v k, 然后再就是,嗯,处理器的深度大幅增加啊,那这里呢,既包括了对于存储要求,又包括了就是对于计算的一个要求, 然后包括再就是多智能体网携的网络带来的这个平发性和低延迟的一个要求啊,那这里的话给大家解决方案就是,呃,呃,如果我们 pd 分 离来看啊, profile 阶段的话,由这个如饼 gpu 进行完成,然后 dco 的 这个解码阶段啊,由 lpo 去进行完成啊, 那这里,这里其实可以多多说一点啊,不知道大家还记不记得就去。呃,应该是二五年九月份的时候吧啊,那时候又拿去推出那个 cps 卡啊,但是后续就是一直其实那个的预期,一开始的预期呢,也是在这个, 嗯,二六年下半年去进行发货啊,但是,但是我们看到这个后续啊, cps 那 个卡就没有后续了,那个那个卡当时是为了解决什么呢? 其实也是看到了这个推力时代,呃,这个,嗯,单依靠单一的 gpu 啊,可能是没有 更大的优势啊。那 cpx 它的这个设计建设计架构设计理念呢?其实是采用了这个 aspect 的 架构啊,那其实它更像是一个就是去提升整体的这个性价比的 啊。这个架构,因为它当时去强调的一个点,什么就是 cpx, 我 们知道它是去处理整个计算过程中的这个预选中的阶段 啊,去需要去引入这个 c p x 啊,那啊,包括他其实讲到 c p x, 当时没有说没有用到这个 h b m 呀,啊,因为不需要那么大的贷款啊,只是去需要去堆训练,去,去堆这个 profile 阶段的这个训练啊, 嗯,但是,但是我们看到明显看到就是这个方案,应该是这个被被英达放弃了啊,也是胎死腹中了啊。那现在啊,取之而来呢,是在整个集团中加呃,加加入了这个 l p u 啊,那 其实 c p s 它对应的是这个 prefill, 然后低,然后 l p u 呢,它其实对应的是这个 d c o 的 啊,它是完全两个阶段,之前也跟大家汇报过,就是推理时,推理时间啊,推理时代,到底啊,推理的这个过程中啊,这个到底会发生什么啊? 到底是一个怎么样的一个架构去进行,去进行的啊?所以说,所以说从这个点我们可以可以可以的。呃,理解到哪个点 可以理解到就是就是现在这个进入 a 证的时代之后呢?这个真正的这个食言的,或者说啊,更加去提升推理效率的卡点啊,其实是在这个 dq 的 阶段,而不是在 freestyle 阶段。所以说这也是为什么说因为咱在呃去放弃了 c p x, 转而去引入了, 有啊,所以说就是,呃,那我我们知道就是 prefer 的 阶段,它其实是影响,影响的是这个首个的 token 去生成的啊,这个时间,然后 dq 的 阶段呢,是影响了这个后续啊, token 啊,后续每个 token 去生成的这个时间, 比如说随着现在的这个词汇量变长了啊,那后续的这个头肯去生成时间呢,是变得啊,愈发重要,这也是为什么就是说 lpu 啊去呃这个,这个啊,被加入了这个集训中啊,但是啊, cps 被放弃,这是在这一点。 然后再就是呃第四个核心变化的话,就是这个多模态的推理啊,可以去处理各种多种任务啊。我们看啊,就是存储级的方案,跟他 这个就是引入了这个 b f 四,跟他的这个 c e s 上去讲到的点是一样的啊。然后当时我在讲那个 g d c 大 会前瞻的时候,当时讲到就是看他这个 b f 四会在会 去呃他的这个,呃就是额外的这个纯属积压啊。去这个这个客户的这个接受程度怎么样啊?我们看到这次给到了我们这个第一批啊,这个,呃 bluefield 四的他这个合作伙伴啊,我们看到就是不出意外还是他啊, 呃跟他控控股的这些,呃这些幸运厂商啊,先去进行部署啊,我们之前也呃就是这个呃,包括蔻维哇,包括 natus 啊,这里还包括,呃这个 aaron and lamda 啊,这些他呃因为拿去投资的这些幸运厂商,然后再就包括 orico 啊,所以说因为拿一一般的话来来看的话,有新品啊,包括有这种试验性的这个集群的这个互联的新品也好,或者计算的新品也好啊, 一般来说都会优先部署在这个幸运场当中啊。去去先先去跑啊,先去跑去去看效果啊。所以说第一批的这个存储机会呢啊,预计也都会啊,部署在他去 这个呃投资的啊,这几家有有所参股的啊,这几家这个幸运场上去做啊,那这是存储方面啊,那为了解决这个计算瓶颈加入了这个呃锐克啊,那我们看到 就是呃那呃加加入 gopro, 我 们看到就是它的整体的这个处理的啊,方式来看就是在预填中阶段啊,现在就是利用这个 gpu 的 核心啊,在预填中阶段,去 去去进行这个高速的计算,然后解码阶段的话啊,就是利用 gopro 啊,利用 gopro 的 stream 啊,去以极高的宽带去啊低延迟的啊,去生成生成 token 啊,去解决目前啊这个 a 证的时代下啊,最大更大的这个啊计算瓶颈啊。 所以说这是这是它引入呃这个 lpu 的 啊,整体的这个核心的核心的思想啊。好, 嗯那其实,呃那那 lpu 我 们就讲完了,如果下面我们再看这个就是大家再预期更呃,很很多的一个点,就是关于这个 camera 的 机柜,也就说关于这个 logo 叉的啊,这个互联架构。 但是,呃,这次呢,其实英伟达去,嗯,就是可能会前呢大家,呃比较激进的预期啊,可能预期到英伟达会在这个荣威奥斯的架构中去推脱 n p o 或者 c p 呃, n p o 或者这个 c p o 的 这个 就是光进 skill up 的 这个方案啊,但是很遗憾这次其实并没有给到我们这个具体的方案啊,具体的方案还是啊,就是之前 kyber 的 这个正佳贝版的啊,这个这个方案啊,有时候,呃,因为因为他他他是讲的就是中版的这个方案啊,那其实还是用这个 p d b 啊同连接去做这个 skill up 啊,也就说其实并没有更多的强调到这个 c p o 啊,但是好一点的,他其实也讲到了,就是在这个 rubicon 中啊,去也会考虑到啊,用这个啊 c p o 去做这个 scrap 啊,他他讲到就是将将同时采用啊同同 和这个 cpu 啊,去进行这个 skr 的 连接啊,所以说我理解的就是这次其实也没给,没没给到我们这个具体的方案,但是其实其实其实呃就是可能,可能是因为就是呃又拿这边的这个就是 skr 的 光光学的方案呢,其实可没有说真正的 啊,真正的真正的落地啊,真正的决定好用什么样的架构啊,所以说这次其实并没有给到我们这种实验性的这个实物展示啊, 可能这个 ruby outro 更再往后去去推进的时候,然后啊可能有更多的这个就是光镜 scout 方案啊,会展示出来啊。然后, 嗯,那总体最后再看一下,就是这个,呃整体的这个,呃七张卡啊,构成了现在的这个整个 ruby 肌群的啊,这个整体的啊,整体的这个架构, 对于对于之前的这个啊,包括跟之前的这个 oppo 系列的啊,这个整体的性能对比啊,如果相较于 oppo 的 话啊,整体性能是提升了这个如果啊从这个量角度来看啊,整体性能是提升了这个三百五十倍啊,那其实这个这个提升还是 啊就通过这一系列的这个系统级优化吧啊,提成还是比较大的啊。然后再就是给到了我们关于未来的这个 road map 啊,我们看到就是飞慢架构中啊,这里,呃,我们看到飞慢架构中包括这个飞慢 gpu 的 这个升级,然后这个 lp 四零的话 是这个就是就是呃,对于相,呃就相当于是这个 lpu 的 这个下一代的产品,然后我们看到分频啊,它标注了这个 link 也可以用, 通过这个之后就会将整体的这个 lpu 的 生态呢,去跟啊,通过那个去跟整个英达的这个生态进行打通,然后包括这个 rosa 的 啊, cpu 啊,就是后续下一代的这个 cpu 版本啊,包括下一代的这个 bf bf 五啊,然后这里这里我红框圈出来了,这个 其实大家比较比较期待的啊,这个 skill up 的 这个 cpu 的 部分啊,我们看它它这里是是 是是是放到了这个这个图啊,叫恩尼克八 cpu, 也就说可能在可能这个光镜,光镜机柜光镜这个 scratch 的 这个节奏呢,可能并没有说预想的那么快,后续还需要啊,去需要看可能入标串上,我估计会试验,会试验一版这个 scratch 用光的这个方案出来啊, 那这是这是下一单啊,但是关于下一单的这个菲曼架构呢,其实也没并没有给到我们呃更多的这个技术细节了,之前给到一个这个技术的一个展望啊, 好,这是这是关于这个发的整个的产品线的一个展望,然后包括也在也提到了,就是啊,也现在正在设计这个维尔 rubin 的 啊,这个 就是太空算力的这个模块啊,之后也会在这个考虑在这个太空中啊去建立整个数据中心。好,嗯,那上以上呢,是那个关于就是他的这个新品发布的一个部分。 那,那最后啊,就是新产品的这个部分,新一年产品的部分,然后下下面的话,它其实,呃去讲到了它整个的对于整个 a 阵的生态的啊,一个布局 发布了这个 namo cloud, namo cloud 啊,那就是其实相当于就是在英伟达自己的这个 open cloud 的 框架啊,也是参考英伟达,参考这个 open cloud 的 这个框架呢?去啊去提供了一个这个英伟达的啊这个解决方案啊,然后他 去讲到一个背景,就是说企业 it 从萨斯啊转向啊,转向这个 agent s service 啊,那这个点呢?其实他后面也也讲,也也介绍了一些这个,呃, 就是呃合作伙伴啊, service, 包括 servicenow 啊,包括包括一些其他啊,也就说从这个点来看的话,他其实讲到就是各个这个萨斯厂商呢,从之后啊,从之前的提供这个软件级服务,到后面 会提供这个不同的 agent 啊,那其实他这里我觉得他,嗯从他的居住来看的话,其实也讲到就是软件厂商他可能在这个业务流程理解上还是有很大的一个存在价值的啊,之后之后他是以这种 a 证的方式啊进行提供, 其实是不是可以理解成老黄其实也呃给给这个软件去进行站台呢?是不是可以理解成就是其实这个呃模型分析软件啊,可能也也会有利用啊,就是不会啊,不会是引来这么大的担心呢。 这个这个其实其实还还需要更多的一个时间去观察啊。然后,嗯,那再就是它的关于它的这个开源,开源的这个推理框架啊,就是 namo klo 的 这个推理框架啊,它以其实我们知道就之前 gtc 的 时候,因为啥它其实有自己的这个 a 阵的框架,叫那个蓝图嘛啊, 然后这次的话也是集也是整合了这个 open cloud 的 啊,整个的思想啊,然后包括去提供了这个快速快速部署啊,模型快速部署啊,这个 agent 的 这个环境啊,然后包括集成了一些这 这个呃 a 智能的这个工具软件啊,然后提供的这个沙沙香的环境,然后包括优达这面的这个开幕型啊,可以调用,然后包括就适配到了它的这个端侧硬件啊,我们看到现在国内啊,就是我们国内的这个各个端侧硬件, 各个这个开箱即用的这个 cloud 产品也是也是蠢蠢不行。所以说因为啊这边的这个动作呢,其实其实跟这个就是我们 cloud 出来之后,国内上传这动作也差不多啊,去强调它的这个端侧硬件产品啊,然后和 和这个它的整个的这个 cloud 框架啊,然后再就是前,然后再就是前几天的这个,呃, 伊美达这边发布了一个开源,就发布了这个新的开源模型啊, namotron, 呃, three super 啊,那这个模型的话,呃其实看整体评分来看还是 还是不错的啊,就是现在海外的整个的开整个开源模型的这个最大的声,最大的这个推动,其实是由是由伊美达去去推动的嘛。然后如果我们看这个榜单来看的话,其实它来到了这个 j r m k m k two 啊, 去拿拿到这些模型去进行对比啊,也就说强调了他的这个模型的一个能力,也就是说英伟达在,其实在在开源模型上,然后都,呃一直在这个不断去努力,然后包括前几天去讲到一个点,就是未来五年内将 将投资二百六十亿啊美元去用于构建这个开源模型啊,然后如果我们看现在英伟达他的整个的开源模型的家族呢?啊, 包括用于这个,呃,我们我们熟悉的,呃,就是包括用于这个 agent 的 这个,就是 number one, 这个就是主力的这个大眼开眼模型,然后包括这个啊, cosmos 啊,物理 ai, 然后 group 啊,这个机器人的啊,机器人的这个模型,然后再就是包括这个 cs 上去开源的这个啊, apple maya 啊,这个座驾式模型,然后 words two 是 这个,呃,相当于数字万生,数字万生这个模型,然后 bell 啊, nemo 是 它用于这个生物学的这个模型,所以说整体的这些开源模型呢,因为它确实是构建了一个比较好的一个生态, 然后包括这些模型,它的它的这个,呃,评分啊,包括在这个主权 a 的 这个采用啊,也是不也是不多的,呃,也也是也是不少的。所以说从这个点呢,呃,我要去讨论一个点啊,就是 这个优达为什么去要从现在这个角度要去发力去搞这些模型?第一个点啊,我觉得是这样。第一个点就是 啊,进入区块链时代之后啊, n v 是 看好这个云巧脏和模型层的这个利润增厚的啊。之前啊,就是英伟达去,当时 open i 跟英伟达去合作的时候啊,去投资,去投资 open i 的 时候 啊,去做过一个这样的拆解啊。这里面我们问一个大概的数啊,就是实际瓦的整个的商业投资啊,它整个一个价值链路是怎么流动的? 可以看到就是十几万的税中心啊,按自己的口径啊,他自己是可以拿到三百五十啊,三千五百亿的这个卖一年的收入的。那中间的这些啊,云厂商啊,或者是说新云厂商只做分利租赁啊,不 考虑上层的这些啊,这个其他软件收入和模型收入的话啊,是可以拿到一千六百亿美元啊,然后再再就是我们再看最终的这个模型厂商啊, open i 啊,如果我们按照如果当时按照这个,按照现在 open i 的 这个指引来看的话啊,如果我们可以看到是两千八百亿美元的这个收入, 如果按照托尼学的上限来看,比如说在整个这个卡的生命周期中去产生的这个,呃,如果我们按五年去记啊,去产生的这个啊, token 的 这个总数啊,按照这个啊,这个这个啊, token 的 这个均价,如果去看的话 啊,那其实这个上限是是是非常大的,甚至可以达到这个万亿级别以上啊,就是理论上可以达到这个啊,三千七百八十币, 每个万亿级别三万亿级别以上,所以说整体的这个模型端和云,云和和云这层的啊,其实整个的利润啊,因为咱们也是看好这一点啊,去发力这个啊, 去发力这期这个开源模型,然后包括去投资了,这样啊,这样的一堆小弟去做他的这个向外输出云的这个白手套啊,然后所以说他是看好 啊,这这这层面,所以说就推动开箱模型啊,也就是说其实是致力于他的这些,就是控呃,参股的这些 ncd 上市,最后后面去实现,他就是远期去对给这个中超委客户去提供云的这个愿景啊,那这是一点,那第二点的话就是,呃, 等这个 c p 板块扩张结束啊,到时候这个主权啊,企业的中长尾客户,有时候他现在占百分之四十的这个中长尾客户啊,将成为这个下一阶段的这个主要主力的一个增长点,所以说搞开模型是利于他 去去继续卖硬件啊,所以说我觉得这是这是第二个点,所以说这是它整体对于模型的呃,这个部分啊,那, 那其实啊,那其实整体我们回顾这个 w 内容来看吧,其实最重要的就是刚才讲到这个第二部分,那其实所有 这个超预期的东西吧,好像好像也没看到啊,就是整体的这个内容来看的话,跟大家一开始的这个预测呢,前瞻呢啊,其实整体来看是大差不差的,然后光的进,这个呃, n p o 的 进展呢?可能也没有想象的那么快啊,所以说整体整体去看吧,然后这里就不 呃不对这个呃各个方向去做更多的一个评论了,然后整体看整个 g t 大 会还是比较还是符合预期的,然后可能后续关注的方向就是关于 l p u 这边的这个商业。

隔夜美股大反弹,科技七姐妹指数是大涨了百分之一点三,那其中上周末暴跌了四个趴的 mate 旁前宣布和 nubios 达成了一项两百七十亿美元的合作,那 mate 是 大涨了近三个点, nubios 暴涨了百分之十五。所以你发现没有,最近科技和 ai 领域的订购合作消息啊,又开始密集起来了,那这是啥趋势呢? 英伟达 gtc 大 会,老黄说到二七年底 ai 芯片的营收将超过一万亿美元,那这是天文数字啊, ai 科技一下子就疯了,像达子的股价一度被情绪推高到逼近啊,一百九十美元,大涨了近四个点,美中不足的是英特啊。陈立武宣布枭龙六将成为英伟达全新如饼机架的 cpu, 那 小英是一度暴涨了七个点啊,触发短线获利朝后回落方率,我一觉醒来啊, 滋味不爽。昨天晚上美股大涨的原因其实很简单,或目汁海霞受阻缓解了嘛,一是董王邀请大家来参与保护油船的通航,二是深特出来公开的为原油市场降温。他说当前石油供应不构成危机,并说油价将持续回落至八十美元下方。你发现没有,现在白房子啊, 出生华尔街的深刻。他说的话,市场其实是很给面子的,反正不有短暂的回落至一百美元下方,美股封篇回归,那叠加英伟达 g t c 大 会的利好啊, ai 科技依旧是时代的弄潮额,那从数据上来看,隔夜那子大涨百分之一点二,倒止零点八,标普五百涨了百分之一,那差一个问题啊,中东冲突到现在已经三周了,标普其实才跌了多少呢?

炒股一定要尊重历史规律,否则就会吃个大亏。今天讲的历史规律是英伟达 gdc 大 会魔咒,从二十四年开始,每次 gdc 大 会,黄教主发表完演讲第二天, a 股英伟达供应链公司就会打跌,今天也不例外,这张表也是二十四年英伟达供应链公司股价的表现。 黄教主演讲的时间是美国时间上午,也就是北京时间夜里,他讲完第二天就叫做 t 日,这一天 a 股主要供应链公司都是下跌的。第二张图是二五年英伟达供应链公司在 t 日的股价表现,也是跌的,而且跌得更惨。 表里可以看出,开会前预期拉满,涨得多的标地,地日跌的也多。今天是二六年 g d c 大 会的替日,科技股堪称灾难。历史之所以重复,是因为人性是不变的,当散户觉得利好来了,觉得股价要大涨,趾高气昂的追高进去,机构就会反着跟你做。 这个时候一定会有观众说这柚子适合诸葛亮,其实我是提前说的,只是你没看到,所以不妨点个关注,省得错过。最近一段时间的行情对散户来说是低预期难度,每个板块的持续性很短,没有任何格局可言, 机构为了对抗量化,提前埋伏,一出力好立刻出货给量化,量化看到卖盘出来,转手就卖给散户。这几天资金从高位板块持续流出, 开始进入处在低位的上证五菱,今天全天只有八百六十七家上涨,但是平安、茅台、药明都是红的。宁王虽然尾盘绿了,但是在电池板块里边也算独树一枝, 这些公司在各自的板块里边都属于超大市值,他们都在上涨,说明涨的不是行业板块,而是上证五菱。当主力资金开始防守了,你还想着进攻,那就很有可能会吃亏。今天的行情体现出来的就是股市有风险,所以大家一定要谨慎,记得控制仓位。

哈喽,大家好,录一下这个英伟大的 gtc 大 会讲了哪些重要的事情。那第一个呢,就是黄仁勋说出了一万亿这个数字, 那这个一万亿呢?他说的是到二零二七年的营收。那这边要具体明确一下,这个一万亿并不是指二零二七年单年的营收有一万亿美元, 而是指这个 blackwell 和 vera rubin 两款芯片从出生到二零二七年底这一段时间里面,总共会卖出去一万亿的水平。那之前呢,黄仁勋也提过五千亿这个数字,那五千亿指的就是这两款芯片从出生到二零二六年底, 就是说其中的差额的五千亿就是二零二七年全年的营收。那二零二七年实现五千亿营收是一个什么水平呢?在过去的一年里面,也就是说在过去二零二五年,英镑的营收是两千一百五十九亿美元, 也就是说在后续的两年中会增长超过百分之一百,这两年平均的年化营收增长大概是百分之五十。那另外呢,这个数字也是当前可以预见的确信度比较高的,这个预测的营收, 那其他估计也会有新增的量在后续进来。那硕万一万亿呢?我们再来看一下黄仁勋发布的 vera rubin 这个芯片。 那这一次他 gtc 大 会上面所公布的 vera rubin 芯片,和他上一次在这个二月份财报会上所公布的这个 vera rubin 芯片其实有一些不同。那最大的不同呢,就是引入了 这个 grok 推理芯片的机柜,现在在 verubin 的 一组机架里面,大概会有十个柜子,都专门是用来放这个 grok 推理芯片的,那我们知道在去年年底的时候,黄仁勋也是花了两百亿美元买到了 grok 这个专门做推理芯片公司的所有的技术的授权,同时呢,也把他们的整个创始人加上高管团队全部挖到了英伟达公司里面来,那在挖过来三个月之后,就直接融合成自己的产品发布了,这个速度也是非常的快。那现在呢,这个 gucci 推理芯片 是交给三星来代工的,也是可能是英伟达所有的产品中唯一不交给台积电的,有可能是因为这个才能来的太突然,实在是排不上台积电的才能了, 只好交给三星,那他的交付呢,也会在今年下半年大概三季度的时候开始交付。那现在黄瑞轩表示,当前整一个 ai 世界里面算力的运用已经逐渐从之前模型的训练转移到推理,推理变成 更大的一个 to 肯用量,所以呢,推理阶段的性能,推理阶段的性价比,也更多成为了这些云服务商所考虑的重点, 这个正是运用 grog 芯片的这个原因所在。有了 grog 之后,英伟达芯片相较于上一代的性能最高能够提升三十五倍以上。那另外呢,随着 open cloud 的 爆火,黄仁勋也发布了英伟达版本的 open cloud, 叫做 nemo cloud, 那 它在安全和隐私性上对 open cloud 做了加强。并且黄仁勋也表示, 随着当前整一个智能体时代来临,随着 ai agent 越来越多的运用,其实对于偷坑的消耗是会继续呈指数级的增长,所以呢,这也正好需要英伟达开发出性能更强的芯片来提供更低成本的算力。