ai 届的春晚英伟达 gtc 大 会三月十六号开幕,老黄提前放话,这次有款神秘芯片能让全世界惊掉下巴, 网传可能是 ruben ultra, 甚至是下一代颠覆性 fireman 架构。更狠的是老黄把散热技术都卷疯了,从铜进化到金刚石级别,液态金属直接安排, 老黄这是要把算力堆到天上去。供应链已经集体狂欢,等着接单到手软。这哪是发布会,分明是 ai 核弹现场。
粉丝1241获赞2.6万

当地时间三月十六日,黄仁勋站在圣和赛的舞台上,面对台下黑压压的人群,说出了一句让整个华尔街都坐不住的话。到二零二七年,英伟达的 ai 芯片营收至少要达到一万亿美元。注意,他说的是,至少这个数字意味着什么, 两年时间,要从现在的五千亿预期直接翻倍。很多人第一反应是,老黄是不是飘了?英伟达的股票还能不能追?但如果你真听完了那两小时的演讲,就会明白,这不仅仅是个业绩目标, 这是一场关于未来 ai 世界谁说了算的宣战。咱们得先搞明白,这一万亿美元的底气到底从哪来。这次 gtc 大 会,英伟达不是简单的挤压高,而是直接把未来五年的家底都亮出来。 三代架构同时发布,这在芯片行业里几乎没见过。首先是 vrv, 这是 blackwell 的 正统接班人,用上了三纳米工艺和 hbm 四内存,单张卡能装两百八十八级字节的显存,预计今年下半年就要量产。但这只是个开胃菜, 真正让懂行的人倒吸一口凉气的,是黄仁勋提前两年剧透的下一代架构 findman。 这玩意用的是台积电最先进的一点六纳米 a 十六工艺,还搭载了硅光、紫光互联技术,代宽提升了十倍,能耗反而降低了百分之九十。 黄仁勋的原话是, findman 的 推理性能是现在 black white 的 五倍。五倍是什么概念?打个比方,你今天花几个亿建了个数据中心,等 findman 在 二零二八年量产后,同样一张电费单子, 能产出的 token 数量直接翻五倍。这就好比你家的电费没涨,但空调、冰箱、电视的功率全变低了,能效直接起飞。但这还不是全部, 这次发布会最让人意外的一点是,英伟达居然干了一件以前根本不屑于干的事,把别人的芯片搬进了自己的机柜。这就是这次发布的 l p u 推理芯片,它整合了去年英伟达花两百亿美元买下技术许可的 grok 公司的产品。 为啥要这么做?因为 grog 的 lpu 是 专门为推理场景设计的,它的首头肯延迟低于零点一毫秒,什么意思?就是你跟 ai 说话,它几乎瞬间就能回复你,基本感觉不到卡顿。在处理那些需要极速响应的任务时,传统 gpu 确实拼不过它。黄仁勋自己打了个比方, 在一个 ai 工厂里,有的活儿需要 verubin 这种大显存的芯片来干,比如预填充数据,但有的活儿,比如那些对延迟极度敏感的解码阶段,就得交给 grog。 这种搭配组合拳,让英伟达的新系统在吞吐效率上比之前的 blackwell n v l 七十二提升了三十五倍。说白了,就是同样的时间,能干更多的活,赚更多的钱。从这一系列动作里,咱们能看出啥风向?最明显的一点就是 ai 产业的天平正在从训练往推里倾斜。 以前大家拼的是谁能训练出更大的模型,那是烧钱抢地盘的阶段。现在模型差不多了,拼的是谁能把 ai 真正用起来,谁能用最低的成本、最快的速度生成最多的头啃。 黄仁勋把这事总结成一个词,叫 token 经济学。他说,未来的每一座数据中心,都是一座生产 token 的 工厂,而这座工厂是受电力限制的,你家的电网就那么大,扩容不了。 在固定功率下,谁的每瓦 token 吞吐量最高,谁的生产成本就最低,谁就能在市场上卷死竞争对手。所以,英伟达现在卖的不仅仅是芯片,更是帮你降低每瓦 token 生产成本的能力。这就引出了一个更深的问题, 为啥有人说英伟达这次不卖铲子了,开始卖玉质金矿?过去淘金热里,卖铲子的是最稳的,不管谁挖到金子都离不开你。但现在,英伟达的逻辑变了,他不光卖铲 子,他连怎么挖,挖多快,挖出来的矿石怎么提炼成金子,甚至最后金子的定价权,他都想给你包圆了。这背后是商业逻辑的深刻转变,从卖硬件转向卖基础设施即服务。黄仁勋在演讲里举了个很有意思的例子, 说未来公司招工程师, offer 里除了年薪,还得附带一笔 token 预算,比如基础年薪几十万美元,再拿出差不多一半的金额作为 token 额度给你,让你用 ai 实现十倍效率的提升。你看, token 已经成了像电费、网费一样的计量单位,英伟达要做的,就是成为这个计量单位的定义者和最大的供应商。 那黄仁勋到底高明在哪?高明在他看透了,在物理定律面前,算力的提升终归有极限,但 toc 的 需求是无限的,他把 ai 的 发展从技术竞赛拉到了能源效率的竞赛上。他说,过去两年计算需求增长了一百万倍,而摩尔定律在同时期只能带来约一点五倍的提升。 这巨大的剪刀差就是英伟达的数据中心里,把 toc 的 生成率从两千两百万提升到了七亿, 实现了三百五十倍的增长。只要企业还想在 ai 时代保持竞争力,就必须进英伟达的工厂,用它的生产线。有人可能会问,搞这么大阵仗,是不是因为英伟达被市场竞争逼急了? 从表面看,压力确实不小。在推理市场,不仅有谷歌自研的 tpu, 还有 sirius 这类创业公司,用更高速度、更低成本的方案抢份额。 open ai maker 这些曾经的大客户也开始组建自研芯片团队, 想摆脱对昂贵 gpu 的 依赖。博通这样的 aic 芯片厂商,股价更是涨疯了,被媒体称为下一个黄仁勋。但如果你觉得老黄是被逼得走投无路才搞创新,那就太小看他了。他的应对不是防守,而是进攻。 与其等别人来颠覆我的 gpu 帝国,不如我自己用新物种来补充它,把 gor 拉进自己的生态,让三星代工分担台积电的压力。这一招既缓解了能源焦虑,又引入了竞争,还补上了技术短板,堪称一时三鸟。之后的 ai 时代,会变成一个大家集体离不开英伟达的世界吗? 从这次发布看,这种趋势反而在加强,因为他们正在把边界拉到现实世界,甚至拉到地球之外。物理 ai 是 这次的重点。黄仁勋宣布和比亚迪、吉利、日产在 l 四级自动驾驶上合作,还要和 uber 在 二零二八年落地 robotix 车队。但更让人浮想联翩的是,那个听起来像科幻片的太空计算。 英伟达宣布正在研发部署在太空的数据中心计算机 verubian space。 一、 为啥巨头们都瞄准太空? 因为 ai 的 尽头是电,而地球上电不够用了。微软的 ceo 曾抱怨手里有大量英伟达 gpu 闲置,因为没电点亮它们。太空不一样,那里有二十四小时不间断的太阳能,还有零下两百七十度的天然散热器。马斯克的 space x 有 星舰,谷歌有捕日者计划, 大家都想把数据中心送上天,解决能源和散热的物理极限,那中国在这一块有动作吗?这次还真不是我们落后。恰恰相反,当硅谷巨头们还在画 ppt 的 时候, 中国公司国星宇航在去年五月就已经发射了全球首个太空计算卫星星座一箭十二星组网,形成了全球首个载轨的太空计算中心,而且已经开始商业化运营。 比如邦加都科技处理广州的交通大模型数据,把响应时间从小时级压缩到了分中级。在太空算力这条赛道上,发令枪其实已经在中国酒泉打响。回到黄仁勋那一万亿美元的豪言壮语,你觉得靠谱吗? 我个人觉得,他看到的不是现在的需求,而是未来的成本结构。当 ai 推理的成本降到足够低,低到每一次点击、每一次对话、每一次代码补全的背后,都有 ai 在 跑, 那一万亿美元可能只是个开始。英伟达的模式在中国能发展起来吗?很难直接复制,因为这种软硬件全站封闭的生态,需要极强的全球协助和对顶级供应链的掌控。但中国有自己独特的优势, 比如在太空计算这种新赛道上,我们的落地速度和商业化场景的丰富度反而可能更快。无论如何,这场关于算力、关于能源、关于 token 的 战争才刚刚进入下半场,英伟达已经亮出了底牌,接下来就看对手们怎么跟了。

昨晚,被誉为科技界的春晚的英伟达 g c 大 会落下了帷幕,创始人呢,黄仁勋长达了两个半小时的演讲,再一次向全球的科技圈投下一枚重磅的炸弹。信息量呢,是非常之大的,尤其是对 ai 的 领域,几乎可以说是重新描绘了一幅发展蓝图。老黄究竟说了什么呢?有 有哪些观念的变化呢?最重要的是,对于我们投资者来说,又能够从中捕捉到哪些机会呢?今天我们就来一次深度拆解。首先呢,最重磅的是老黄一开场就抛出的一个数字, 一万亿美元。他明确表示,英伟达的旗舰芯片将会助力公司在二七年实现一万亿美元的营收。这个业绩指引什么概念呢?要知道,二零二五年的十月份,老黄当时给出的预测是到今年年底实现五千个亿美元的收入,而昨晚的预测 时间仅仅往后延长了一年,金额就直接就翻了一倍。这背后所传递的信号是英伟达对于未来 ai 的 算力需求的极度看好,甚至可以说是超预期的乐观。话音刚落,市场呢就迅速的给出了反应, 英伟达股价是一度涨超百分之四,到二七年年底要突破万亿美元的营收,英伟达的底气到底从何而来?这一次呢,黄仁勋是提出了一个全新的概念,代币工厂,他说英伟达是一家垂直整合的计算公司, 言外之意就是以后公司的定位要发生大转变了。以前呢,英伟达是靠卖显卡、卖芯片来赚钱,但从今往后呢,他要成为 ai 世界的总包工头,从计算芯片到互联技术,再到散热系统,全部打包一体化的交付, 实现从芯片公司到 ai 的 基础设施和工厂公司蜕变,也就是所谓的托肯工厂经济学。除了以上战略的指引以及全新的定位,这一次的演讲还重点勾勒了两个方向,第一个就是算力上天。应为达推出了 space 模块,要将数据中心级别的 ai 计算能力部署到卫星轨道上面去。以前呢,都是卫星在天上拍了数据,再传回到地面分析计算,一来一回几个小时就过去了, 很浪费时间。而算力上天之后呢,卫星就可以直接在天上完成各种分析计算,最后呢,只把结果传回给地面,这对于实时监控全球互联网, 甚至是心念计划来说,都是颠覆性的改变。所以这一条赛道呢,一旦跑通的话,直接交换的公司以及一些做航天配套的公司都有望迎来一波高速的增长。第二个就是软件养虾, 黄承鑫呢,直接说了未来每一家公司都需要养龙虾,当然这个龙虾呢,并不是特指小龙虾,而是比喻 ai 智能。英伟达针对开源 ai 智能体的生态,推出企业级平台的 name 可络,定位就是 open 可络的基础设施层, 可以直接实现一键部署。简单来说,就是让 ai 主动学习操作工具,主动调用软件去干活。如果 ai 以后都能自己敲代码的话,自己调软件干活,那么最受益的方向是什么呢?是不是依旧还是算理?当然,对于做企业的服务巨头来说,这就是一 一个危机,因为以后呢,可能会整个软件行业会彻底被 ai 员工所颠覆,到最后,关于资本上的投资机会,我觉得可以围绕两条主线来进行展开。首先呢,第一个就是数据传输,在顺利暴涨前提下,数据在芯片之间跑路的速度也能够跟得上,这就离不开光模块和高速互联技术, 谁能够让数据传输的更快更稳,谁就是这波浪潮的卖场的人。第二条主线就是功耗与散热,现在一块旗舰芯片的功耗快赶上一个小型电机了,传统的风冷散热呢已经是完全不够用,液冷散热呢成了标配,同时呢,对供电性能要求也极高,高压直流、新型电源这些细分领域上的空间 也就有望迎来爆发式的增长。总之呢, ai 这个赛道还很长,老黄呢,已经是把未来三年的蓝图都画好了,咱们要做的就是找到那些在蓝图里边提供基础设施配套的环节。

英伟达黄仁勋昨晚的一场重磅演讲,直接宣告了 ai 上半场的结束,接下来 a 股算力板块的底层投资逻辑将发生彻头彻尾的颠覆。央视财经刚刚确认的消息,当地时间十六号,也就是咱们这边的昨天, 英伟达年度开发者大会在美国开幕。老黄做了两个半小时的演讲,抛出了一个极其炸裂的观点, ai 推理市场的拐点已经正式到来, ai 正在从训练阶段全面跃升到推理与执行阶段。不仅如此,为了支撑未来万亿级的算力市场,英伟达宣布要和专注推理技术的初创公司格洛克合作,直接杀入 ai 服务器系统领域, 主攻低成本、低延迟的推理计算。大白话讲,这到底意味着什么?大家平时看到的那些大模型,前期需要为海量的数据去教它,这叫训练,极其烧钱,对 gpu 算力要求极高,这也是过去一年多英伟达赚得盆满钵满的核心原因。 但是模型训练好之后,真正投入到实际应用中,去回答你的问题,去生成图片,去控制机器人,这个过程叫推理。 老黄这次的动作说明,大模型的军备竞赛基建期虽然没结束,但大规模商业应用的爆发期已经提前杀到了。懂行的人都知道,格洛克的底层架构在处理深层式 ai 推理时,速度极快且成本更低,主要就是为了解决传统架构在推理时遭遇的内存待宽瓶颈。 英伟达作为芯片霸主,主动联合推理赛道的黑马座系统,说明产业巨头已经意识到,未来的护城河不仅仅是芯片单体的算力,而是整个服务器系统的综合性价比和极低延迟, 这绝对是极其客观的产业引进规律。回到咱们 a 股市场,这个消息对算力板块有着极其深渊的指向性利好。但方向变了, 过去大家都在无脑炒作那些能提供大算力集群、能做模型训练的公司,但接下来的核心主线必将向推理端疯狂倾斜。大家需要重点盯紧两个细分领域,是国内真正在做边缘计算、 ai 推理芯片以及终端设备 ai 化的硬核科技公司。 第二是那些能够提供高密度、低能耗 ai 服务器、整机制造以及配套的液冷温控系统的企业。因为当 ai 全面进入推理阶段,算力需求将呈指数级爆发,不再是几个互联网大厂在搞,而是千行百业,无数个应用终端都需要部署推理服务器, 这个量级比训练服务器要大得多。至于对咱们普通人生活的影响,可以说是一场体验上的彻底革命。你想想,现在咱们用一些 ai 软件问个问题,它还得转半天圈圈。如果英伟达和格洛克合作的低延迟推理系统全面铺开,算力成本被打下来,响应速度变成毫秒级。 你手机里的语音助手将变成一个拥有人类反应速度的超级管家。无论是自动驾驶的瞬间决策,还是实时多语言的无缝翻译,都会变得像呼吸一样自然。 时代的巨轮正在转向,从算力霸权走向应用普惠。在这个历史性的拐点前,看懂产业巨头的前瞻布局,才能在接下来的科技股结构性轮动中精准踩准节奏。

昨天晚上老黄说的这些问题,我的解读可能远远没有老黄的原文带给你的冲击更大。昨天晚上黄仁勋在这个 gtc 大 会上面的一个演讲,我把他的全文的内容全部都用 ai 提炼和翻译出来了, 我是非常建议大家去读一下的。真的你读完了之后,你会有一种醍醐灌顶的感觉,你会对这个时代改变,未来十年、二十年的这个世界的格局充满了确定性和泡儿。 废话不多说了,我们就直接说一下,总结一下昨天黄仁勋他说的几个核心的一个观点。第一个是他认为说到了二零二七年,全球 ai 的 基础设施市场规模会达到一万亿美元左右, 但他认为说可能实际的需求会比他的这个预估还要高很多,远超于之前他认为的五千亿美金的预期。为什么?因为他认为真正 ai 的 inference 的 推理时代正式开启了。然后从去年的这个局面,大家看到 ai 的 工作负债从感知深层进化到了推理和行动 算力的消耗呈现了一个指数级的增长。特别是去年 cloud ai、 codex 这些大模型在整个 coding 能力上面的一个指数级的一个上升,直接让 inference 的 前端推理的应用进入了一个 指数级的市场规模。所以我们看到了以前的这些数据中心变成了现在的 token 工厂,就是未来的数据中心,它不再只是一个存储,而是生产 ai token 的 工厂。那商业模式就变成了什么, 就是谁能够提供更有性价比的 token, 谁就能够拿到未来世界的门票。 ai 的 竞争力,它其实是在生产要素成本上面的竞争力, 其实从这个侧面能够看得出来,为什么美国现在呃任何的一个大厂都在自建自己的电厂,他们基本上把市场上面的天然气发电机、光伏以及电网设备的采购已经拉到了二零二七年之后。所以大家看到像中国的这些玉柴发电机,维柴的这些发电机 基本上在美国是卖得非常好的。那黄仁勋说了第二个点还是来自于什么,就是 open core, 他 认为 open core 是 ai 的 时代的一个真正的 iphone 时刻,相当于零八年的智能手机操作系统出来的时候, open core 它是一个什么?智能体的一个操作系统,现在这个开元的 open core 几乎是在几周之内就超过了 liux 三十年的成绩,被誉为智能体时代的操作系统。 现在在重述企业级的 it 的 架构。而且我们也看到了像美国的这些萨斯的巨头,拥抱 ai 的 这些企业全面转型去做什么?全面转型去做 ace, 我 们知道以前萨斯是什么,就是 s a a s 这种企业级的平台操作系统变成了一个什么,就是 a a a 三个 a s 叫做人工智能的一个智能体操作系统,以前叫做软件级服务,现在是一个智能体级服务的一个系统。黄正勋在会上也说了,英伟达他们为了去参与企业级的智能体级服务的这样的一个系统,他们自己开发了一个 amo curl, 就是 一个完全基于企业级的 open curl 的 一个产品出来。 并且他认为说未来全世界的这些 it, 或者说这些顶级的工程师,他们的工资的构成部分应该是由他的金钱加上他每年能够调用的 token 的 预算,构成了他的薪酬架构。他说的是你的 offer 里面带有多少 token, 决定了你是一个什么样层级的工程师,也会成为企业去招聘那些顶级工程师上面的一个重要的招聘筹码。如果你能够给我更多的 token, 就 意味着我能够在生产效率上面得到一个非常大的提升。 他认为说如果按照 token 的 价格,在未来的电力和算力的整体设备下行下,包括应用策算法的优化下面,能够下降三十五倍左右, 那么就意味着以后能够配集给高级工程师的 token 的 数量肯定是以十倍计的,这也是能够吸引未来的 ai 工程师们非常重要的一个 token 筹码。这是我觉得黄仁勋里面讲到的一个非常重要的未来世界的人才观和行业格局的看法。 这个点给我非常大的一个启发,就是当全世界的人都能够做 coding, 我 们其实在创造一个真正代码之上的世界,那对于你的代码能力和马龙的能力和技术已经不重要。重要的是什么? 你能够在一个新的沙盒之上,以 code 为砖的基础设施,构建起来了一个新的想象力的世界。那么未来更重要的是什么? 就是你的想象力,你的工程能力,你的业务的整体性来说的话,他会比你的抠顶能力会更强。所以未来我认为说像学文学的、 学哲学的,再加上他有树立推理能力的,这帮人可能会成为未来世界,特别是抠顶世界的新的筑梦者。我们中国人其实在审美能力上面是很差的, 当然这个跟经济发展的情况也有关系,因为经济基础决定上层建筑,说白了就是从温饱线上面活过来。我们并不像日本、美国,包括整个西方的这些发达国家一样,他们已经负了一百年、两百年了,对吧? 他们其实在整个经济基础之上构建出来了更多的美学的观察。而中国现在在一个 ai 的 时代,我们刚刚构建起来了在移动互联网时代上面的优势,却丧失了在 ai 时代上面最重要的全要素 的数字的能力,这种能力就包括了所谓的审美想象力,以及对未来世界的理解,对更大空间探索的抽象的思考。这个我认为是中国人可能在大多数维度上面是非常缺失的。所以我们看到说黄仁勋,他在这个演讲的最后,他说英伟达现在 给予 c、 u、 d、 a、 x 的 这个操作系统,他们的这套操作系统已经完全覆盖了锤类的这些行业,比如说自动驾驶、金融、医疗、工业、机器人、电信这些方面的锤类领域,他们都已经提供了这种端到端的加速能力。很多人还是把英伟大理解成是一个制造业类型的企业, 那如果说按照一个制造业类型的企业来看的话,那的确现在英伟达的 pe 估值是偏高的。但是如果你把它变成一个互联网企业的逻辑,它的头肯参与到的是每一个 c 端上面的这种能力,它就不再是一个制造业了,而是一个硬软件结合的互联网生态体系, 它能够享受的估值是一个互联网企业的估值,而不是制造业企业的估值。就是说一直以来我们在分析英伟达的时候,我们再给大家说, 特别是 ai 时代,每一个行业它的估值逻辑都应该去重新思考。因为你不知道 ai 会给这个行业,或者说给这个世界未来会带来怎样的冲击,怎样的机遇,所以传统的估值逻辑正在失效, 而在这个过程当中,我们需要重新去思考的是 ai 到底能够给这些行业带来什么样新的变化和估值。 所以这个层面上面,黄仁勋昨天晚上他在 g t c 大 会上面最后也说了,他们认为说每一座数据工厂从定义上面来说都是受电力限制的, 一座一 g 瓦的工厂永远不会变成两 g 瓦,这是物理和原子的一个定律,在固定的功率下面,谁每一瓦电力的吞吐量更高,谁的生产成本就会最低。他也做了一下预测,他说的是随着模型越来越大,上下文越来越长,那么 ai 就 会变得更加的聪明, 但 token 的 生产率会降低,他说什么在这个 token 的 工厂里里面,你的吞吐量和你的 token 的 生成速度将会直接转化为你每年的精确数。 他强调了英伟达为什么现在在架构和生态上面要去构建免费层上面的高吞吐量,其实核心的一个点是要拿到最高价值的推理, 将性能提升到惊人的三十五倍以上,而不是行业现在普遍认为的十倍的水平。总结来说,英伟达要做的事情不是去生产和卖 gpu 的 硬件制造业厂商, 而是一个生态体系,要通过英伟达能够提供的全世界最高效、最便宜、最有性价比的 hok 供应,参与到整个下游的应用层的算法生态里面去,对吧?这也是我们之前一直在说的,老黄讲的这个故事一直都是一个生态的故事,而不是制造业的故事。 所以我为什么说一定建议大家去看一下老黄在各个大会上面的演讲,大家看完这个演讲就应该作为未来世界的参与者, 你要去想象说, ok, 如果他说的这些故事都能够实现,他的估值应该是一个什么样的估值?他还是一个制造业的估值吗?还是说你应该理所应当的给予像谷歌一样的互联网企业的一个估值?这就是黄仁勋昨天晚上说的非常重要的一个重点, 我们总结一下来说,就是算力和电力肯定就是 ai 应用了一个非常重要的 in front 的 底层,那么谁能够提供更便宜的 token, 谁就能够掌握未来。所以我们其实是非常看好谷歌, 因为的啊,这些底层的企业相反来说,像 open ai、 马斯克马上要去搞的 x a i 一 样,在应用车大模型上面仍然是一个红海的竞争,而在上游的竞争相对来说其实是一个比较南海且确定性相对比较高的,这也是我们最近一直在说的, 我们要在不确定性的当下去找到确定性的要素,而这些确定性的要素我们在之前的这个播课里面也梳理过,主要还是上流的算力策和电力策。

本次 g t c t c 二零二六大会在当地时间三月十六日正式开启,被称为 ai 届的春晚英伟达创始人黄仁勋在盛和赛 scp 中心登台演讲。大会持续到十九日,超过三万名来自一百九十多个国家的开发者和企业代表参与,核心就是探索 ai 如何成为关键基础设施。 哇,这个规模确实够大,不愧是 ai 界的春晚。那黄仁勋的演讲里第一个重磅信息是不是关于算力需求的调整? 没错,黄仁勋直接把二零二六到二零二七年的全球 ai 算力需求预测从五千亿美元上调到了一万亿美元。他说这是百万倍增长的新阶段。 去年他还在说五千亿的需求覆盖到二零二六年,现在直接翻倍到一万亿,甚至认为实际需求可能更高,会出现供不应求的情况。受这个消息影响,英伟达股价一度涨了百分之一点六五,市值达到四点四五万亿美元。 这个调整幅度真的很大,看来 ai 算力的需求增长确实超出了预期。那黄仁勋对 ai 发展阶段的判断有没有更新? 有,他说 ai 已经跨越了生成式 ai 阶段,进入了推理拐点和智能体时代。过去三年有三个里程碑,叉 gpt 开启了生成式 ai 时代。 open ai 的 o 一 模型让 ai 能反思规划、分解复杂问题。 cloud code 智能题革新了软件工程, ai 从感知到生成,再到现在的推理和执行,完成了一轮演进。 这么说, ai 已经从能生成内容变成能主动解决问题了。那黄仁勋提到的 token 工厂经济学又是什么意思啊? token 工厂是他提出的全新概念,未来数据中心不再是存储中心,而是生产智能 token 的 工厂。 token 是 ai 理解世界的基本单位,是核心生产资料。 他强调,数据中心受电力限制,一 g w 的 工厂永远变不成二 g w, 所以 谁的每瓦 token 吞吐量最高,谁的生产成本就最低。英美达还把 ai 服务分成了五个层级,从免费层到超高速层,每百万 token 的 价格从零到一百五十美元不等。 这个分层很有意思,不同需求的用户可以选择不同的服务层级。那本次大会的重头戏 veruben 超级 ai 平台具体有哪些突破? vr room 不 再是单一芯片的迭代,而是七款芯片垂直整合的超级系统,专为智能体 ai 设计。它采用台积电三纳米制成,集成了三千三百六十亿晶体管,比上一代 blackwell 提升了百分之六十一点五。 搭载两百八十八 gb hbm 四显存,内存待宽达到二十二 tb 每秒。整个平台由微软 cpu 和 roman gpu 组成,采用百分之一百液冷散热,支持四十五度热水冷却,能大幅降低散热能耗,而且实现了全线缆消失。 机架安装时间从两天缩短到两小时, n v l 七二机架的安装时间更是从两小时压缩到五分钟。这个安装时间的提升太夸张了,从两天到两小时,再到五分钟,效率提升了好几十倍。那性能方面的提升具体有多少? 每兆瓦吞吐量提升了三十五倍,相比 hopper 架构,每瓦特 token 生成能力提升了三十五倍。 在一 g w 的 数据中心里, token 生成速率从每秒两百万提升到七亿,增幅达到三百五十倍,性能十项的飞跃,这个性能提升确实是飞跃级的。那针对高吞吐和低延迟的矛盾,英伟达有没有什么解决方案? 有,英伟达收购了 groot 芯片团队,把 groot lpu 三纳入了产品系列。 groot lpu 擅长低延迟解码和擅长高吞吐量预填充的 rubin gpu 形成互补架构。 黄仁勋建议,高吞吐工作载可以百分之一百使用 vero rubin, 对 于高价值、低延迟的场景,比如代码生成或交互,可以配置百分之二十五的 groot lpu 节点,实现性能和成本的最优解。 grog 三 lpu 搭载两百三十,照片上 sram 数据带宽达八十 tb 每秒首 token 延迟小于零点一秒,推理性能是 h 一 百的十倍,未来还会以三 d 堆叠的方式集成在 finam 芯片 gpu 核心上。 这个互补架构确实能解决很多实际场景中的痛点。那飞吻下一代架构有什么亮点? philim 是 继 robin 之后的下一代 gpu 架构,搭载 lp 四十处理器和 rosa cpu, 支持供风装光学技术,也就是 cpu 技术,是全球首款采用台积电一点六纳米 a 十六制成的 ai 芯片。 它的核心突破是把 lpu 和 gpu 深度集成,专攻推理延迟和内存强问题,融合了英伟达的规模优势和 grok 团队的工程能力,预计二零二八年启动生产,二零二九年交付客户。 cpo 技术好像也是本次大会的重点之一,具体有什么作用? 英伟达推出了全球首个 cpo 光电供风装的 nvidia spectrum internet switch, 把光模块直接集成到芯片封装中,实现电子信号和光信号的直接转换,能耗仅为传统铜栏的百分之五, 能大幅降低 ai 集群的能耗成本和散热压力。这项技术是和台积电共同开发的,已经进入量产阶段。 这个技术对数据中心来说应该能节省不少成本,毕竟散热和能耗是数据中心的一大支出。那软件生态方面,英伟达有没有什么新动作? 黄仁勋把开源项目 openclog 定义为 ai 时代的 linux, 说它的普及速度超越了 linux, 是 智能体计算机的操作系统。 针对企业使用时的安全顾虑,英伟达推出了 nimo cloud 企业级参考架构,内置策略引擎、网络护栏和隐私路由器,确保智能体在企业内部安全运行。还可以通过 nvidia agent to locate 软件,用一条命令优化 opencloud 开源加企业级安全方案,这样企业使用起来就更放心了。那 ai 和现实世界的结合,比如机器人和自动驾驶,黄仁勋有没有提到新的进展? 他说,二零二六年是人形机器人商业化圆眼,下一波 ai 浪潮的核心是 ai 理解物理规律,并与现实世界交互。 在自动驾驶领域,英伟达和比亚迪、现代、日产、吉利及 uber 合作,部署 robert taxi 网络,推动自动驾驶的 chat gpt 时刻,在机器人领域和 abb、 酷卡、迪士尼等合作,用 iclab newton 物理引擎和 cosmos 世界模型训练人形机器人。 在太空计算领域,还发布了 verran space one 计划,在轨道上建设数据中心,用辐射散热解决冷却难题,没想到英伟达已经布局到太空领域了,这确实很有前瞻性。那数据处理方面有没有什么新的技术突破啊? 英伟达打造了 cudf 和 cuss 两项核心技术, cudf 专注于加速数据框计算、处理结构化数据,能让企业级结构化数据运行数量级提升。 c u s 面向向量存储和语义数据处理非结构化数据和 ai 生成数据,实现非结构化数据的语义化和可计算化转换,这两项技术是未来数据基础设施的核心。 这两项技术相当于解决了结构化和非结构化数据的处理难题,为 ai 的 发展打下了更坚实的基础。今年还是 cod 二十周年,黄仁勋有没有提到相关的内容? 有,今年是 cod 问世二十周年,二十年来, cod 已经累积了数亿 gpu 的 装机量,渗透到了每一个技术生态中。现在有数千个工具、编程器、框架和库,还有数十万个开源项目。 cod 已经深度集成到各个生态系统里,成为 ai 发展的重要基石。 uda 确实是英伟达生态的核心,这么多年的积累让英伟达在 ai 领域占据了很大的优势。那这次大会和演讲对全球 ai 产业链会有什么影响? 首先是算力需求的暴涨会带动整个 ai 算力产业链的发展,从芯片制造到数据中心建设都会受益。 英伟达的 vr rubin 平台和 phnom 架构会进一步巩固它在 ai 芯片领域的领先地位。 grok lpu 的 加入会完善它的产品矩阵,满足不同场景的需求。 opencloud 和 nimo cloud 的 推出会推动智能体 ai 的 普及,加速 ai 在 企业中的落地。 ai 和物理世界的结合,比如自动驾驶和机器人,会带动相关行业的技术升级,推动人形机器人的商业化进程。不过需要注意的是,这些分析只是产业解读,不构成投资建议。 本期解读接近尾声,英伟达二零二六 gtc 大 会与黄仁勋演讲,核心内容我们已梳理完毕,我们会持续跟踪全球 ai 算力与科技产业动态,继续输出干货分析。感谢您的收听,大家下期再见!

当地时间三月十六日,英伟达创始人兼 ceo 黄仁勋现身盛和赛 sap 中心, 开启 gtc 二零二六主题演讲。身着标志性皮衣的黄仁勋时隔一年重返舞台, 带来从人形机器人到智能驾驶、从 open crawl 到七款新品芯片的重磅发布。黄仁勋宣布,英伟达正从芯片公司向 ai 工厂、 ai 基础设施公司转型。 现场发布的 virubin 平台由七款芯片、五种机架组成,包括 virubin g p u、 dot and v link 六交换机等核心组建。其中 virubin c p u 是 全球首款专为代理式 ai 打造的处理器, 效率较传统机价级 cpu 提升两倍,将于今年下半年向合作伙伴供货。 阿里巴巴、联想、字节跳动等中国企业已在部署名单之列。备受关注的 open cloud 项目成为演讲焦点,黄仁勋将其比作智能体计算机的操作系统, 争取几周内达成的成就超过 linux 三十年的发展。英伟达同步推出尼莫 cloud 软件站,为 open cloud 智能体平台提供基础设施层支持。业内人士指出, 传统 sas 将进化为智能体级服务, tocoin 消耗量将成为衡量 ai 生产力的关键指标。针对算力成本问题, 黄仁勋提出每瓦 tocoin 数核心评价指标,预计英伟达算力芯片到二零二七年将实现一万亿美元营收。独立国际策略研究员陈佳分析,英伟达表面卖算力,实际在售卖算力生态, 通过生成式大模型与三 d 图形引擎融合,都受算力需求概念,这才是其无可替代的核心竞争力。至顶网总裁高飞表示,英伟达并非转向系统方案商,核心仍是算力效率。面对 ai 应用场景的爆发式需求, 英伟达针对各场景做专业优化,本质是在卖标准,而非直接淘金。随着推理算力需求指数级增长,定制化推理芯片市场将迎来新机遇。

嘿,朋友们,科技圈的 ai 春晚、英伟达 gtc 大 会,他又来了,老黄那两个多小时的演讲,新鲜量简直是核弹级的。但别怕,今天咱们就花几分钟,把这场技术盛宴里头最硬核、最关键的那些东西给你拔的明明白白的, 你听听。一开场,老黄就扔下这么一句话,我们正处于计算领域的根本性转折点。 这话可不是随便说说的啊,这份量太重了,意思就是整个行业的牌桌马上就要被掀了,要重新洗牌了。 紧接着一个数字就这么直接砸你脸上了,一万亿美元,你没看错,这是啥?这是牢黄放的话说啊,到二百二十七年,光是英伟达的新一代 ai 芯片就能干出这么多的营收,跟你说,这个数字背后藏着一个全新的世界。 那么老黄到底给我们画了一张什么样的大饼,或者说一张怎样的未来蓝图呢?别急,我给你总结了四大核心看点,这里头每一个都可能决定了未来十年咱们科技圈的玩法, 跟紧了,我们马上出发。好,咱们先来看第一个未来万亿目标和 ai 工厂时代 老黄说的那个一万亿,你可千万别以为只是卖芯片那么简单。不,他的野心大着呢,他是要从根本上把现在所有的数据中心都给他颠覆掉,变成一种全新的东西。 这个新东西啊,老黄管它叫 ai 工厂,说的再精确一点就是 token 工厂。你想想看,未来的数据中心,它不再是一个存东西的仓库了,它变成了一个生产线,生产什么?生产智能,也就是 token。 那 怎么衡量这个工厂厉不厉害呢?看的不是你存了多少东西,而是你每用一度电能蹦出多少个 token 来。你看这张对比图,一下子就把这事给说明白了。 过去咱们搞数据中心,天天算的是存储成本,怎么存共便宜,现在呢,全变了,咱们要算的是生产效率,整个行业的底层逻辑就从存东西变成了造东西。这一下就解释通了,为啥咱们需要一套完完全全彻彻底底的新硬件, 这就带出了咱们的第二个未来。全新的硬件你还记得吧?以前老黄开发布会,特别喜欢从兜里掏出一块芯片举着给大家看, 现在呢,画风突变,他直接把一整个机柜给你搬上台。为什么?因为他现在要卖的早就不是一块块的芯片了,而是一整套一整套的 ai 超级计算机。 咱们来求瞅这个超基计算机全家桶里都有些啥? cpu、 gpu、 dpu、 超级网卡、高速交换机? 好家伙,各种定制的芯片全给你配齐了!老黄的意思很明白,哥们别自己的那费劲钻了,我这直接给你一道配齐了的解决方案,开箱即用,直接就是一座 ai 工厂的基建 哎,但这里头啊,藏着个秘密武器,就是这个 grok lpu! 这玩意是干嘛的?这么跟你说吧,当 ai 模型需要疯狂往外吐 token 的 时候,传统的 gpu 有 时候会觉得有点跟不上,有点喘。 而这个 lpu 呢,就是专门解决这个问题的一个超低廉耻的专家,他就好像是给这个 ai 工厂的生产线装上了一个巨猛的涡轮增压器, 这效果有多炸裂?你直接看图,这个新平台加上 a o p u 之后,每兆瓦的吞吐量。注意啊,是直接给你干到了三十五倍,这是什么概念?意思就是你花同样的电费,能干出以前三十五倍的活,产出三十五倍的智能。 这么一来, ai 工厂这个经济账瞬间就算明白了。好硬件的肌肉修完了,但光有肌肉还不行啊,你得有聪明的玩法,有策略。九九来了,老黄抛出的第三个未来,他管着叫讯福开源龙虾。 这背后啊,是因为达一个高明到不行的软件和生态布局。你肯定好奇这龙虾到底是个啥玩意儿?其实啊,它指的是最近在开发者圈子里火到爆炸的一个开源 ai 代理项目,叫 open crawl。 它有多火呢?这么说吧, linux 花了三十年才达到的热度,它短短几个礼拜就给秒了,成了有史以来增长最快的开源项目。 那他为啥这么重要呢?因为老黄直接给他定了姓,他说这个 open cloud 就是 未来 ai 智能体时代的全新操作系统。你品你细品这句话, 这就好像当年 windows 开启了个人电脑时代一样。现在 open cloud 正在开启一个全新的个人 ai 代理的时代。 那英伟达的策略是啥呢?非常清晰,就三步走,第一步,不跟你对着干,我直接拥抱这场开元革命。第二步,我来解决你们企业最头疼的安全问题,我推出一个叫内蒙恐龙的东西,给这只野生的龙虾套上一个企业级的安全外壳。 第三步,有了这个安全地基,我来催生一个全新的产业,叫做智能体即服务。你看这部棋啊,简直是教科书级别的格局,一下就打开了, 所以你看,顶级的硬件有了,聪明的生态策略也有了,那么所有这些东西凑在一起,最终要描回一个什么样的图景呢?这就是老黄想要的第四个,未来 ai 无处不在, 你先看看这个路线图, blackwell reuben 赛道,下一代的 fireman, 一 年一代新架构,这个速度简直不给人一点喘息的机会,就是在逼着整个行业所有人都得跟着他的节奏跑,因为达用行动告诉你,我的野心没有尽头。 那这些恐怖的算力最后要流向哪里呢?你看看这些应用物理 ai, 从波士顿动力到 figer 的 那些网红机器人,全都在排队接入英伟达的生态 自动驾驶,咱们的比亚迪、吉利还有日产这些巨头也纷纷上传,你以为这就完了吗?不,格局再打开一点,人家还要把 ai 工厂直接搬到太空轨道上去。 所以啊,咱们来总结一下老黄这次 gtc 大 会传递的核心信息,其实就三句话,第一, ai 工厂的时代来了。第二, token 会是这个时代的新货币。第三, ai 智能体就是这个时代的操作系统。 最后,他给在场的所有人,也给我们所有人留下了一个问题,现在每一家公司都需要一个 open cloud 的 战略,那么你的战略是什么呢?


归机文明的工业革命,英伟达彻底重塑人类生产力。那是二零二六年三月十六日的盛和赛。 sap 中心被一种混合着即刻狂热与资本焦虑的氛围所笼照。黄仁勋依旧穿着那件标志性的黑色皮衣,走进聚光灯下,开启了一场足以载入人类技术史册的漫长演说。 我们此时回望这场演讲会,发现它不仅是年度技术更新的历行公式,更标志着全球人工智能产业彻底挥别了实验室里的模型竞赛,正式跨入了生产力落地的深水区。 在过去二十年里,加速计算的基石一直由平台支撑,从最初的科学计算,到后来的图形渲染,再到席卷全球的深度学习, 每一次范氏跃迁都在积累能量。王仁勋在演讲开场就投下了一个重磅结论,全球计算产业已经跨越了推理拐点,这意味着智能已经不再是某种稀缺的、 昂贵的科研产物,而是转变成为了一种像电力一样可以大规模生产、按需供应的工业代币。我们必须理解代币工厂这个概念背后的深意。 在黄仁勋的视角里,未来的数据中心不再只是储存和处理信息的仓库,其核心智能已经重新定义为生产代币。 这种生产力的飞跃由过去两年内增长了一百万倍的计算需求所驱动,这种指数级的趋势已经彻底甩开了摩尔定律的束缚。 为了支撑这种规模的增长,英伟达提出了一套被称为五层蛋糕的架构模型,其包含了能源芯片、 基础设施模型以及应用。这五层结构的深度协同,正是其在未来五年实现累计收入突破一万亿美元大关的核心战略支柱。英伟达将赌注压在了两个关键领域,代理式人工智能与物理。人工智能。 这两个词听起来或许有些遥远,但它们代表了硅基智能从屏幕背后的对话框走向现实世界执行复杂任务的终极演变。当智能可以像工业品一样被批量制造时,人类文明的生产力逻辑将被重新书写。万亿美金背后的计算账本 资本市场在那一天感到了前所未有的震撼。黄仁勋在演讲中更新了一项财务预测,英伟达预计,在二零二七年之前,仅在人工智能芯片和基础设施领域的销售额就将达到一万亿美元。这个数字相比几个月前的预测直接翻了一倍。这种乐观并非盲目, 而是建立在对算力需求结构性转换的深刻洞察之上。在过去几年里,行业主要精力集中在预训练阶段,那是大模型从零到一的蛮荒生长。 然而现在我们正在进入大规模推理时代。黄仁勋解释说,训练需求或许存在周期性,但推理需求却是持续且随着用户规模呈指数级增长的。当人工智能从智能生成内容 进化为能够进行逻辑推理并自主执行任务的智能代理时,每一个任务的完成都伴随着海量待币的消耗。目前,全球头部的四家云服务商在二零二六年的资本支出预计将超过六千六百亿美元, 同比增长率高达百分之六十。这份账单显示,大型科技公司正在不计成本的扩充军备,试图在即将到来的智能代理时代占据制高点。 英伟达目前的业务结构中有六成来自于这些超大规模云服务商,而剩余的四成则分布在区域云、企业级市场、机器人以及游戏等多元化领域。这种布局让其在面对地缘政治波动或单一市场饱和时,具备了极强的抗风险能力。 从财务指标的演变趋势看,英伟达在二零二五财年凭借预训练需求带来的红利,实现了超过一千三百亿美元的营收。到了二零二六财年,随着推理需求的爆发,这个数字预计会攀升至两千一百五十亿美元。 而在二零二七财年第一季度,随着维拉鲁滨平台的正式部署,英伟达给出的单季度营收指引已经达到了七百八十亿美元。这种持续的增长背后,是全站人工智能基础设施对全球算力市场的全面统治。英伟达正在证明自己不仅是卖铲子的人, 更是这台驱动全球经济转型的智能机器唯一的操作系统提供商。揭开维拉鲁滨平台的面纱作为整场演讲的核心技术亮点, 维拉鲁冰平台的揭晓彻底打破了人们对显卡的认知边界。这套平台不再是一颗简单的处理器,而是一套由七颗芯片、五种机架系统构成的垂直集成超级计算机。它专门为处理万亿参数级别的代理推理任务而设计, 解决了人工智能在执行复杂逻辑时面临的瓶颈。维拉鲁冰架构的核心在于对计算与数据移动的平衡,在代理式人工智能时代, 限制性能的往往不是计算核心本身,而是数据在中央处理器、图形处理器与内存之间流动的效率。 为了彻底解决这个问题,英伟达引入了专门设计的维拉中央处理器。这款处理器标志着英伟达正式介入高性能通用计算市场,向传统的芯片巨头提出了最直接的挑战。这款中央处理器采用了八十八个高性能核心, 并配备了专门的神经分支预测器。这种设计能让处理器在结果产生之前就完成部分计算,从而显著降低处理延迟。对于需要维持常对话一致性和执行多步逻辑编排的智能代理来说,这种极低延迟的表现直观重要。 在具体的性能表现上,维拉鲁滨图形处理器集成了三千三百六十亿个晶体管,采用了最新的内存技术, 其推理性能提升了五倍,而成本却降低到了钱贷的十分之一。与其配合的网络系统也实现了贷宽翻倍,能够支持超过一千个图形处理器的超大规模互联。 这种硬件级的飞跃,本质上是为智能代理构建了一个近乎无限的算力底座,让复杂任务的实时处理从可能变为了常态。与此同时,为了应对日渐激烈的推理市场竞争,英伟达还展示了其在特定架构上的突破。通过引入极速的堆叠式内存架构, 维拉鲁滨平台在处理实时对话和待币生成时展现出了惊人的吞吐量。黄仁勋提到, 虽然高性能宽带内存在大规模并行任务中表现优异,但在追求极致实时性的智能代理场景下,静态随机存取存储器的低延迟优势无法被替代。 这种技术路径的选择使得万亿参数模型的实时对话能够像人类交谈一样流畅,这无疑是对自研芯片阵营的最强力回击。探寻费曼架构的远景,黄仁勋在演讲中展现的视野并未止步于眼前,他罕见地透露了费曼架构的长期眼镜细节。 这一架构预计在二零二八年左右面世,是英伟达在后摩尔定律时代维持计算性能领先地位的关键。费曼架构的出现本质上是人类在微观物理极限边缘的一次豪赌。这一架构下的图形处理器将采用台积电最先进的一点六纳米工艺, 并且首次在核心中引入三维芯片堆叠技术。这意味着在同样大小的硅片上,工程师们一样将计算单元垂直堆叠, 以获取更强悍的性能。除了工艺层面的极致追求,费曼架构还将深度集成共封装光学技术,这是一个听起来有些枯燥但极具革命性的词汇。 随着单机架内图形处理器数量向一千一百五十二颗眼镜,传统的铜缆连接已经遭遇了物理瓶颈。铜缆在传输高频信号时产生的热量和损耗已经无法支持这种规模的算力扩展。共封装光学技术允许利用激光在芯片间直接移动数据, 极大的提升了系统的规模上限,并显著降低了功耗。这种从电到光的转变,标志着计算设备内部的通信方式正在发生根本性变更,配合费曼图形处理器的将是名为罗莎的下一代中央处理器。这款芯片的名字源于著名科学家罗莎林德弗兰克林, 其设计初衷是在整个智能代理基础设施站中以更高的效率移动数据工具和代币。工程师们的设计哲学是将计算资源与生命科学级别的精密架构相结合,试图让数据流动像生物神经系统一样自然且高效。这种长远的技术路径图 向全球展示了一个清晰的信号,英伟达正在从底层物理规律出发,重新定义未来十年的计算形态。代理操作系统的觉醒硬件性能的指数级增长必须由同样强大的软件来释放。英伟达已经从一家单纯的芯片公司 彻底转型为一家全站人工智能平台公司,支撑这一转型的是分布在五层架构中的一百七十个函数库和四十个预训练模型。 黄仁勋在演讲中正式宣布了名为戴纳摩的一点零系统,这是英伟达推出的开源人工智能工厂分布式操作系统。这套系统的核心任务是编排跨级群的图形处理器和内存资源, 专门针对深层式推理进行深度优化。通过原生集成该操作系统和相关的优化工具,布莱克威尔系列芯片的推理性能提升了七倍。 这直接导致全球数百万个正在运行的图形处理器的待币生产成本大幅下降。在商业逻辑中,成本的下降往往意味着应用的大规模爆发。 为了加速这一过程,英伟达给予了开源项目个人人工智能框架极高的评价将其比作个人人工智能时代的互联网基石。该框架允许人工智能代理在用户的本地机器上持续运行,具备长期记忆,并能自主执行文件管理、 跨应用操作等复杂任务。为了解决企业对开源工具安全性的担忧,英伟达同步推出了企业级代理站。 这套方案为开源框架增加了隐思路游、网络护栏和策略驱动的安全框架。这确保了企业级代理在执行自动处理客户订单管理、临床试验或设计半导体工作流等敏感任务时, 不会泄露核心数据。目前,全球已有十七家领先的软件供应商宣布加入这一生态,将代理式人工智能深度嵌入到各自的生产力工具中。 我们正在见证一种新型软件形态的诞生,软件不再只是被动响应指令的工具,而是能够理解意图自主写作的数字固原。物理智能走进现实人工智能的下一波浪潮被称为物理智能。黄仁勋强调,这不仅仅是让人工智能在电脑里思考, 而是要让他学会像人一样在物理世界中行动。演讲现场最引人注目的时刻是迪士尼动画角色雪宝机器人的登场。这个行走在舞台上的机器人并非简单的遥控玩具,其内部集成了英伟达的工业级边缘计算芯片,专门为机器人设计的通用基础模型。 这些机器人通过数字孪生环境进行数百万次的强化学习,然后将训练好的权重下载到物理身体中,从而实现了从虚拟仿真到现实行为的无缝跨越,这种被称为具身智能的技术正在让机器人摆脱预设程序的束缚。 全球四大工业机器人巨头以及各种人形机器人先驱目前都在英伟达的平台上构建,其机器人大脑 物理智能的渗透远不止于人形机器人。在自动驾驶领域,英伟达与优步达成了里程碑式的合作。 优步计划从二零二七年开始在部分城市试点,并在随后的一年将规模扩展到全球二十八个城市, 推出完全由英伟达自动驾驶软件驱动的无人驾驶出租车队。此外,多家主流车企也加入了这一生态。新发布的阿尔帕玛约一点五模行为,这些车辆提供了类似于人类的推理能力,使其能够处理变幻莫测的路况、极端天气以及复杂的行人和非机动车交互。 这种技术眼镜意味着曾经只存在于科幻电影中的自主驾驶世界,正在通过算力与算法的深度结合,加速变成现实生活中的基础设施。算力主权与星际工厂黄仁勋在演说中强调了一个正在改变全球政治格局的概念。 随着人工智能成为竞争的核心,越来越多的国家开始意识到,算力已经成为一种类似于石油或淡水的国家战略资源,这就是主权人工智能的逻辑。 一个国家必须在自己的领土内,根据自身的文化和语言特点,拥有并运行属于自己的人工智能工厂。这种趋势正在打破有少数几家跨国巨头垄断算力的局面,让技术底座与国家意志深度绑定英伟达与帕兰提尔达成的合作方案 被形象的称为主权智能网格。这套方案将最新的图形处理器集群与具备零信任架构的操作系统相结合, 专门为那些对数据主权极度敏感的政府客户提供私有化的基础设施。在南亚,印度,初创公司正在利用这一平台开发深度契合当地复杂语境的大模型。 与此同时,德国电信、新加坡电信等超过二十个国家的机构也都在紧锣密鼓的建设完全由自主算力驱动的云平台。这种从国际化算力向主权算力回归的趋势,标志着技术竞争已经上升到了文明生存的高度。除了地球上的布局, 英伟达还将视野投向了被称为最后边疆的广袤星空。演讲中最具科幻色彩的部分,莫过于维拉鲁滨空间一号模块的发布。这是一个专门为卫星和轨道数据中心设计的计算设备, 只在实现空间数据的原地处理,而非费力的将其传回地球进行分析。在太空中运行高性能芯片是一个巨大的工程挑战。由于没有空气对流 散热,只能依靠效率极低的辐射机制,工程师们为此开发了一套全新的红外辐射冷却系统,配合精密的同制热传输装置, 才确保了芯片在真空中能够稳定运行。空间一号模块同样基于维拉鲁冰架构,单颗芯片集成了八十八核心处理器和数千亿晶体管的计算单元。为了抵御太空强辐射可能导致的计算错误, 该设备支持一种特殊的锁部处理模式,即两颗处理器同时执行相同的任务并进行交叉验证。 这种星计算力的出现,意味着实时的全球监测和行星级的数据处理将成为可能人类正在迈向星际人工智能时代的门槛。 与此同时,为了应对地球上日渐增长的巨型工厂建设需求,英伟达发布了一套用于构建和运营超大规模算力基础设施的数字孪生框架。随着人工智能工厂的规模从兆瓦级跃升至几瓦级,传统的工程管理方法已经难以为继。 新的系统允许运营商在物理建设开始前,在虚拟空间中构建一个百分之百精确的数字工厂模型,从每一颗芯片的散热路径到每一根网线的延迟表现, 都能进行高保真仿真。这种方法将工厂投入运营的时间从几个月缩短到了几天。通过与全球工业基础设施巨头的合作, 英伟达正在利用这一平台优化全球电网的负荷分配,试图解决人工智能带来的巨大能耗压力。整套系统不仅能最大化产出,还能让数据中心与电网实时通信, 动态调节功率,以维持能源系统的稳定性。待闭经济时代的全面统治回看这场演讲,我们能清晰的感受到,英伟达已经不再满足于作为一家芯片供应商存在。通过横跨能源、芯片、 基础设施、模型和应用的五层架构,这家公司建立起了一个极其稳固的商业护城河。二十年的技术积累锁定了全球开发者 极致的硬件性能,锁定了超大规模客户,而日渐完善的软件生态则紧紧抓住了企业用户 计算的本质,正在发生根本性的改变。在未来的世界里,每一家成功的公司在本质上都将是一家代币工厂,他们通过消耗能源,产出能够理解世界执行任务的智能行为,而英伟达正致力于成为这台庞大机器唯一的操作系统。 随着全球算力需求向着百万倍增量的深水区迈进,其在硬件能效、全站软件和全球生态布局上的综合实力,依然使其在可预见的未来保持着统治地位。未来三年,一万亿美元营收目标的提出,不仅是一份财务上的宣言, 更是一份对全球产业转型的最后通碟。在这个智能代币化的新时代,企业和国家要么选择拥抱这种由算力驱动的智能代理, 要么就得面对在这一轮工业革命中被彻底边缘化的风险。人类文明正在经历一场物理意义上的起点跨越, 而这场变更的引擎正轰鸣在那些彻夜不息的待币工厂之中。我们正在见证一个由硅基智能重塑的未来,那里的每一行代码、每一次计算都在重新定义价值的产生方式。这就是我们在二零二六年春天所看到的景象。 一个由代码、激光芯片和国家意志交织而成的未来图景,正以一种不可逆转的趋势向我们走来。在这个时代,智能不再是点缀,而是支撑文明运转的底座。 无论是穿梭在城市街道的无人出租车,还是在轨道上默默处理数据的星际模块,亦或是工厂里自主协助的机器人, 他们背后的逻辑核心都是那份对算力的极致追求。当计算变得像呼吸一样自然,当智能变得像电力一样廉价,人类社会的每一个角落都将被重新点亮。我们正站在一个新纪元的门口, 而推开这扇门的,正是那些在盛和赛的灯光下被反复讨论的技术细节。这不仅是一场技术的眼镜,更是一次关于人类生产力边界的终极探索。我是 davinci, 如果你也想在这个商增的世界构建你的精神秩序,欢迎加入达芬奇矩阵。

三月十六日,英伟达 gtc 二零二六全球开发者大会重磅开幕,黄仁勋一场演讲彻底重构 ai 产业未来。 从芯片巨头到 ai 工厂构建成,英伟达颇受重磅预期二零二七年飞来佛隆与 ruby 芯片将创造至少一万亿美元需求, ai 正式迈入推 大规模运用的工业化时代。这一数字叫去年黄仁勋给出的五千亿美元预期直接翻倍。消息一出,英伟达股价当日涨超百分之四点三,市场对 ai 算力的信心再被点燃。 过去两年生城市 ai 的 爆发,让全球 ai 计算需求暴增一百万倍,仅推理计算量就涨了一万倍。微软 mate、 谷歌等巨头争相采购, ai 算力正成为堪比云计算的长期核心资本开支。支撑万亿需求的是英伟达史上最复杂的 ai 计算系统 verilion, 这一专为智能体工作负债打造的系统实现百分之一百亿了,完全摒弃传统限了机架安装时间从两天骤减至两小时, 极致的软硬件协同设计,让 e g w 数据中心的 token 生成速率在两年内从两千两百万飙升至七亿,实现三百五十倍加速,而同其摩尔定律仅能带来一点五倍提升。 为破解急速推理的贷款瓶颈,英伟达整合谷 q 芯片,打造非对称分离推理方案,将大计算量的预填充阶段交给 vero、 rubio 低延迟的解码阶段交给 grok, 直接让高价值推理性能提升三十五倍。目前,由三星代工的 grokplp 三零已量产,预计 q 三出货,首台微软 roblin 机架也已在微软 azure 云正式上线,企业可按百分之二十五 grok 加百分之七十五 roblin 的 比例 配置高价值算命。黄仁勋还提出了全新的商业底层逻辑 tucker 工厂经济学, 未来数据中心不再是存储文件的仓库,而是生产 ai 基本单位 tok 的 工厂,每瓦 tok 吞吐量将决定企业的核心竞争力, tok 也成为 ai 时代的新大宗商品。 按速度和价值分为五层定价,从免费层到超高速层,每百万 tok 定价从零飙升至一百五十美元, 吞吐量和速度直接转化为企业的实际收入。硬件之外,软件生态迎来颠覆性革命。 opencall 龙虾被黄仁勋定义为智能体时代的 linux, 仅用几周就超越了 linux 三十年的开源成就,成为 ai 智能体的专属操作系统。黄仁勋直言, 所有 s e s 公司终将转型为 a a s s 智能体系服务。英伟达已推出企业及尼莫克拉参考设计,搭配 open shoe 的 安全层,让智能体在访问敏感数据、执行代码时实现全流程安全管控。这场变格更将重塑职场规则。 未来硅谷招聘将迎来新标配,年薪加偷啃预算,工程师除了几十万美元的年薪,还能拿到相当于薪资一半的偷啃额度,工作效率直接提升十倍。而英伟达的算力布局早已覆盖全领域,目前百分之六十业务来自头部五大云服务商, 百分之四十分布于主权云、工业机器人、边缘计算等赛道,构建起无死角的全场景算力生态。本次大会,英伟达还带来了图形学领域的重磅突破, dlss 五 作为自实时光线追踪技术后最具里程碑意义的创新, dlss 五完美融合手工渲染与生成式 ai, 为每个像素注入照片级的光照和材质属性。被黄仁勋称为图形学的 gpt 时刻,不仅让视觉真实感实现跨越式提升, 更保留了艺术家进行创意表达所需的绝对控制权,开启了三 d 图形与 ai 深度融合的全新时代。 从 blackwell 到 vera rubin, 再到下一代飞门架构,从地面超算 ai 工厂到太空数据中心 vera rubin、 space 一 韦达,正构建起全链路、全场景的 ai 基础设施。 推理时代的全面到来,不仅是全球算力的新一轮激烈竞争,更是 ai 技术从感知生成到推理执行的多样化跨越, 一个全新的万亿算力赛道正式开启。正如黄人群所说,计算成本正在急剧下降,创新速度正在指数级上升,现在是开始构建未来的最好时机。


从莎莉到星海,黄仁勋与他的万亿美元智能炼金术盛和赛的春寒撬撬未能冷却 s a p 中心内那股即将沸腾的 热浪。二零二六年三月十六日,当黄仁勋身着那件标志性的黑色体衣,如一位即将开启炼金仪式的祭司般走上 g t c。 大 会的舞台时,整个科技世界的目光都聚。 这不再仅仅是一场关于芯片迭代的例行发布会,而是一场关于未来文明底层逻辑重构的步道。空气中弥漫的不再是硅质与电流的味道,而是一种更为抽象且昂贵的气息。智能本身 正被量化,被锻造成为新的黄金。万亿预言智能时代的点睛术演讲的序幕拉开,黄仁勋没有给予展示那些精巧的 晶体管阵列,而是先抛出了一个足以让华尔街摒息的数字炼金术公式。去年的此刻,他预言了五 千亿,今天,这个数字被毫不留情的翻倍,至少一万亿美元。这不是简单的营收预期,这是对人类文明进入智能工业化阶段的庄严宣告。他所描述的二零二七年并非遥不可及的科幻远景,而是一个由无数偷空工厂、 数据中心那些现代文明的神庙,其智能正在发生根本性的异变,他们不再是冰冷的文件仓库,而是炙热的智能熔炉。在这个熔炉里,电力被转化为 toc, 数据被练成智慧。 黄仁勋用一种近乎残酷的物理定律,每瓦克 toc 术为这场新的工业革命定下了冷酷的竞赛规则。 这不仅是技术的跃迁,更是经济学的重塑。未来的商业版图将由那些能以最低能耗、最高效率点石成金的企业来直比。英伟达毅然从一个工具的提供者转身成为这场宏大炼金术的总工 城市。 vera rubin 与 broke 交响诗般的算力协奏当话题转向承载着万亿美元梦想的物理基石时,黄仁勋展示的不再是单颗闪耀的孤 星,而是一个庞大、精密、协调运作的心系。 vera rubin 的 平台。这是一台为生成而生的巨型机器, 一个将芯片、夜网、光互联、系统架构垂直整合的怪兽。过去我们习惯于欣赏一颗芯片的玲珑之美,而今,我们必须学会敬畏一个系统的磅礴之力。从两千两百万到七亿,两年间三百五十倍的头寸生成素 延伸。这是一场由极致协同设计驱动的算力大爆炸。然而,完美的吞吐量并非一切。为了填补极速推理那对延迟极度敏感的空白, 英伟达挤出了 groq 这枚棋力。这并非简单的硬件堆砌,而是一场精妙的软硬件二重奏。但 neil 系统如同一位高明的指挥家,将繁重的预填充任务交给沉稳的 wear ruby 交流 qq。 这种节藕推理的智慧使得整个系统既有大象的磅礴力量,又不是蜂鸟的灵巧敏捷。 铜栏与光互连的病情推进量产芯片与未来架构的交替闪现,共同支救了一张从地面延伸至太空的算命天王。 open cloud 与物理 ai 从数字幽灵到钢铁之区。如果说硬件是骨骼与肌肉,那么软件便是灵魂 神经。黄仁勋将 openclaw 誉为新时代的操作系统,这并非夸张,它标志着 ai 从被动的应答者进化为主动的执行者。智能体未来的软件不再是冰冷的指令集合,而是拥有自主意识,能够穿梭于数字迷宫与物理式 的体。每一个 s a s 公司都将在这一浪潮中被传输,成为 a a s。 的 提供者。 这场革命的终极篇章,是 ai 从屏幕内的数字幽灵走向物理世界的钢铁之躯。 当那个由迪士尼打造的雪宝机器人用略带稚气的声音与黄文轩互动时,它不仅是一个可爱的玩偶,更是物理 ai 战略的缩影。从自动驾驶的出租车到工厂里的机械臂,再到家庭中的伴侣,机器人 ai 正获得在三维世界中感知、行动与交互的能力。这不仅仅是技术的进步, 更是人类能力的又一次伟大延伸。节语光追之内皆是未来演讲落幕,余音绕梁。黄仁勋用两个小时的时间为我们勾勒出一幅从地面到太空,从沙粒到星海的壮丽蓝图。 这不仅是英伟达的路线图,更是整个人类文明在 a i g。 园的航行图。 我们正站在一个起点之上,看着智能从一种奢侈品迅速转变为像水电一样触手可及的大中商品。未来以来,它只是尚未居民分布。 而黄仁勋和他的英文答正手持那根点金之杖,致力于将智能的光芒洒向世界的每一个角落。这是一场属于全人类的、激动人心的智能炼金术。

今天和大家聊聊英伟达 gtc 大 会。三月十六日备受科技圈和投资圈关注,被视为 ai 行业年度朝圣的英伟达 gtc 大 会开幕,老黄给市场画了张万亿大饼。黄仁勋在演讲中确认,英伟达的旗舰芯片将帮助公司到二零二七年创造一万亿美元的营收。 这个大胆的预测瞬间引燃了市场情绪,英伟达股价盘中最多上涨超百分之四。但是这股情绪来得快,去得也快,涨上去靠的是老黄讲的好故事。随后的回落则是因为认真算了账。英伟达当前探讨的早已超越了单纯的市场扩张, 它描绘了一条由推理需求拉动的增长曲线,覆盖了超大规模云厂商云、 ai 原生企业主权、 ai 项目、工业落地场景以及各类企业及应用。这种宏大的趋势自然撑起了一个更高的长期营收预期,也完美解释了为什么演讲一进行,股价就立马拉升。 但是投资者冷静后再做个对比,这个惊喜感就开始打折了。根据机构的预测,英伟达在二零二六到二零二八财年的数据中心,总营收本来就已经算到了大概九千六百九十六亿美元, 这个数字跟新抛出的一万亿美元两者只差了大约三百零四亿美元,换算下来也就是百分之三左右的增幅,远远没有万亿美元的标题那么震撼。 这个是背后还有个暗藏的问题,英伟达已经是全球市值最高的公司了,对于其他公司的满分答卷,放在他身上只能叫及格业绩,只是积分分远远不够,他必须把附加分都拿到,才能满足市场刁钻的胃口,大家真正盯着的是他能不能继续把天花板无限推高。 这也解释了为什么英伟达的未来故事依然大有看头。假设推理需求继续呈现指数及爆发,假设主权 ai 和企业及 ai 持续疯狂拓展客户基本盘,并且英伟达能够顺畅地通过全站 ai 来实现商业变现,彻底告别丹麦芯片的模式,那么一万亿美元绝对不会是最终的终点。 在会上,除了给投资者描绘一下未来的盛景,英伟达也是拿出了一些新的行业尖货来彰显实力。英伟达推出 space 一 vr 二模型,将数据中心及 ai 计算能力部署到卫星和轨道数据中心,并强调其面向载轨推理、实时地理、空间智能和自主航天任务。 同时,英伟达也布局了龙虾产业,正把 ai 智能体基础设施变成新的增长赛道。英伟达的 namco 可通过一条命令部署 ai 代理,并集成 namco 模型和 open sour 运行环境,补其安全隐私与杀伤能力, 不仅要极简部署,还要安全养虾。英伟达也宣布进一步扩展开放模型体系,覆盖三大 ai 方向。英伟达宣布扩大其开放基础模型家族,重点覆盖智能体 ai、 物理 ai 和医疗 ai 三大领域。 英伟达展现出了雄厚的技术实力以及对未来走向的精准反应,同时也对未来充满信心,给了不错的预期,只是难以满足市场愈发严苛的期望。