粉丝8.3万获赞23.1万


在这个世界上,目前敢对英伟达 gpu 说不的只有一家公司,那就是谷歌,因为它有最严的 tpu, tpu 到底有多强大,就这么跟你说吧,谷歌自己啊,包括 ai 在 内的所有内部业务,基本上都是靠它来实现计算的,那么英伟达 gpu 在 其数据中心内部的这个占比啊,是 非常小的,仅供租赁客户啊,选择性使用。而目前呢,有超过百分之六十的深圳市 ai 的 创业公司和超过百分之九十的生 是 ai 的 独角兽,都在使用谷歌的 tpu 云服务。就连苹果这样的巨步,那么在训练 apple intelligence 的 模型底座时呢,也是毫不犹豫向谷歌投怀送抱了,把英伟达直接晾在一边了。这期视频呢,我们就来深度了解一下谷歌的 tpu 是 如何撼动英伟达的地位的。 饭局必备,先赞后看!可能很多人会反驳,敢对英伟达 g p u 说不的只有谷歌吗?啊,华为它不是吗?华为啊,它当然有资格啊,我们之前也讲过,它的升腾系列已经是可以追标英伟达上一代产品,但是呢,华为目前它主要走的是超节点的狼群战术啊,它的单卡性能与英伟达差距依然是非常巨大。 而谷歌最新的第七代 t p u 不 仅是单卡,性能上已经是对标了英伟达的 b 二百,甚至啊,这个集群互联上更是直接吊打在 t c o 上,更是一跃绝尘啊,能够比英伟达低出百分之四十都不止, 直接把鸿星尔给干一懵了。故事要从二零一三年讲起啊,当时呢,谷歌的 ai 负责人就发现啊,如果说有一亿的安卓用户每天使用手机语音转文字服务三分钟,那么它所消耗的这个算力啊,就已经是谷歌所有数据中心 总算力的两倍。而这种巨大的工作赋能呢,如果说通过 c p u 的 话,必然是效率吃不消,如果说用 g p u 的 话,那么更是面临巨大的基建投入。所以啊,当时谷歌呢,就毅然决定啊,自研 ai 芯片,并于二零一五年发布了第一代 t p u。 谷歌的 t p u 到底跟 g p u 有 何区别呢?那么这个其实很好理解,如果说当年老黄坚持开发 g p u 是 为了从 g p u 分 流出专业任务啊, 提高效率,那么这个 t p u 呢,就是从 g p u 来分流专业任务,提高效率。而 t p u 所分流出来的这个专业任务呢,就是为深度学习技术,深度定制的。大家都知道英伟达的 g p u 啊,有两种啊,那么一种是游戏显卡,专门用于渲染。另外一种啊,就是 g p g p u 也就是数据中心 g p u 啊, 可以用于科学计算和 ai 大 模型,两者的区别就在于啊, g p g p u 在 核心数量、内存、宽带和数据格式等等方面呢, 是专门为高性能计算而设计的。而开发者呢,可以通过扩大这个框架来调用 gpu 的 算力,用于各种各样的计算任务,比如流体力学模拟等等。啊,那么这个是因为啊, gpu 它相比 cpu 来说的话,它的这个预算单元数量,这个面积是大幅度提升的,那么它的核心数量呢,也比较多,可以支持并行计算。 而谷歌的 tpu 则是进一步从 gpu 的 这个价值中啊,凸出专属于 ai 的 那一部分。而更进一步啊,谷歌还让 tpu 呢只适配自家的 ai 软件,也就是特色 flow 啊,形成一个深度的绑定。所以呢,谷歌的 tpu 啊,它其实呢就是一种 ic 芯片啊, 它的这个电路设计呢,是高度定制化的,只能够运行谷歌自己的特定算法,这样的好处是什么呢?就是可以获得最为极致的 tco 啊,因为谷歌呢,它不是别的公司啊, 它同时坐拥最大的搜索引擎和 v 二的移动 os, 那 么每天都要应对以 e 为单位的这个用户请求,它如果说用 gpu 来作为这个算力底座的话,那么这个电费账单啊,就直接拉爆了。而当时来说的话,第一代的 tpu 就是 一个专门为 ai 的 推理而诞生的定制芯片。那个时候呢, 其实谷歌还无法直接对英伟达的 tpu 说不,到了二零一七年,谷歌推出了第二代 tpu, 开始支持浮点预算, 也就开始支持了 ai 的 训练,这个时候呢,它与英达的这个供需关系呢啊,就开始发生了改变。那么之后的几年内, t p u 呢,不仅是对架构进行了持续优化啊,性能在不断提升。那么到了这个二零二四年啊,谷歌更是发布了第六代 t p u 啊,也就是这个吹领。那么这个版本呢,就是在叉 t v t 爆火之后呢, d p u 对 于声控式 ai 的 一个最直接的响应,相较于第五代啊,第六代的这个峰值性能呢,直接上调了四点七倍啊,这个架构更为激进。而目前在二零二五年发布的则是第七代 t p u 叫做 ionward, 它在 f p 八峰值专利内存容量和贷款方面呢,已经是跟英伟达的 b 二百直接看齐了啊, 与这个 b 三百还是有点差距的。不过呢, t p u 最大的优势啊,其实呢,在于这个集成互联,那目前英伟达的这个恩维力克呢,可以实现七十二个 g p u 的 质联,也就是说啊,组成一个巨大的 g p u 嘛,而谷歌的这个 t p u 呢,它可以一次性实现九千两百一十六个芯片的质联,也就是说啊,组成一个巨大的 t p u, 这个呢,主要就是得益于啊,谷歌它自研了一款叫做 polo 码的一个光学芯片和 ocs 系统。那么这里呢,我们来简单的说一下啊,在谷歌的这个服务器配置中啊,六十四个 tpu 呢,通过电互联会组成一个 cube, 而基于这个 ocs 系统呢,一百四十四个 cube 呢,就可以通过光互联组成一个大的计算域啊,而英伟达所对应的这个概念呢, 其实呢是 nvlink 啊,目前呢是只有七十二个 gpu 来组成一个域。所以说啊,谷歌通过对互联技术的一个深度资源,就直接在这个算卡的基群上碾压了英伟达。不仅如此呢,在谷歌的这个 ocs 内部啊,各个 q 部之间呢,它还可以改变互相连接的这个拓扑结构啊,根据具体的这个模型来重新配置,那么这个就极大增强了灵活性。而 而这一点呢,最直接的收益啊,就是 tpu 的 这个算力利用率就大幅度提升了,一定要注意这个利用率啊,因为数据中心它的这个大量算卡儿,它们在训练和推理时呢,是需要对这个任务进行分布式这个处理的, 而如果说各个算卡之间它的这个沟通啊,桥梁是七拐八绕的,就容易卡住啊,那么只有少部分算力呢,是得以有效利用,那么谷歌在对这个互联系统进行深度的自研啊,就提升了这个指标,那么这也是为何谷歌啊在这个 t c o 上有巨大优势的一个原因之一。而 o c s 呢,是在二零二一年在第四代的 t p o 发布时引入的, 那可见谷歌当时的野心是有多么大,前瞻性是有多么强。那么谷歌的 t p o 从架构层面来说,它到底是一种什么样的设计呢?前面讲到啊,它是一个专门为 a f 的 而设计的, 更进一步讲呢,它是只支持特定的一个开发框架啊,比如说自带的这个 turn flow jacks 以及 meta 的 pie charts。 当然了,目前的第七代已经是不支持 turn flow 了啊,不过它的这个核心精髓就在于通过与主流开发框架的深度融合,那么从电路层面 来实现单向的奔赴啊,最大化它的开发效果。我们来看下这个图啊,那么这个就是第四代 tpu 的 一个简图,那么这个是芯片 level 的 一个结构啊,这里是 hbm 内存,那么这个 cm 呢,就是共享内存的意思啊,它呢是一个 sm 电路,相当于是 cpu 中的这个缓存的这个性质, 而这些就是它的计算核心,叫做 tensor 啊,那么 tpu 中的 t 就是 tensor 嘛,张亮的意思,而这个 tensor 呢,就是跟英伟达 gpu 那 个 tensor 呢,其实这个作用是一样的, 而 turn circle 它的内部呢,就有这些东西,那么这个呢,叫做标量单元,它相当于是一个小小的 c p u 啊,负责控制和调度整个 turn circle 的 这个运行的这个是标量内存,就是标量单元的缓存,那么这个 v p u 呢,是向量处理单元的意思啊,那么它类似于 这个 g p u 中呢,扩大口的一个作用,那主要是负责计算一些计算函数等等非矩阵操作,而这个就是向量处理单元的一个缓存。那么最为重要的当然呢,就是这些啊, m x u, 那 么它们呢,就是矩阵乘法单元,也就是乘法口中占据电路面积最大的计算模块啊,它们呢,主要就是负责乘积累加计算啊, 而这个计算呢,就是在大模型的训练和推理中,占百分之九十以上的预算量的一种操作,那么剩下的百分之十呢,就是由这个 v p u 来负责的啊, 所以 tpu 的 这个内部架构啊,从原件上来说的话,它跟 gpu 其实呢是有很大的交集的,只不过啊,它的具体的这个存储层级啊,和设计折形呢是有差异的,而 gpu 中呢,因为它要兼顾非大模型用途啊,那么所以说它存在大量的这个库达口啊, 那么这个地位上,就等同于 tpu 中的这个 vpu 这个电阻嘛,但是呢, vpu 在 tpu 中的这个占据的面积是非常小的,而在存储配置上呢, gpu 是 hbm 大 啊,这个 l 一 l 二合成, 那么 t p u 呢,是 h b m 相对较小,但是呢片上缓存大,所以呢,你可以简单的粗暴理解为啊, t p u, 它就是一个大幅度压缩了 g p u 中的库达扣的这么一个比例,进而去提升了吞吐扣的这个比例啊, 那么同时在这个运行逻辑上,只是会特定架构的一种算力芯片,而谷歌 t p u 的 这个核心精髓,其实呢,在于一种叫做脉动阵列的设计哲学,它就是说啊,数据呢,在一个阵列中流动啊,从输入开始啊,就一直计算出一个结果来,那么中间呢,不会频繁的访问内存,那么这个就是它的一个基本的架构啊, 传送数据和激活数据呢,分别输入那么一个 pe, 就是 说一个处理单元,那么得出结果后呢,就会传给下一个 pe 啊,那么正是因为这种设计啊,就使得 tpu 在 工号和效率上呢,又发挥出了非常大的优势,但是呢,也很明显啊,它只适合矩阵乘法这样的预算啊, 这个计算模式是非常固定的,那所以说它不如 gpu 那 么灵活。正是由于这种从底层架构到上层逻辑的自主构建,就让谷歌的 tpu 的 年出货量已经是超过了两百万克啊, 二零二五年呢,预计可能会达到三百万这个水平,其实目前啊,就仅次于英伟达的数据中心 gpu, 那 么后者呢,大概是三点五到四万万克的水平, 所以从出货量来看,那么谷歌的 tpu 当仁不让就是全球老二,这个可能是很多人还没有想到的,有人可能会问啊,这么大的出货量,那么平时都没有听说哪里可以买呢?这个是因为啊, tpu 此前全部都是在谷歌 cloud 啊, 还对外提供这个算力服务,一般是不对外直接销售硬件或者说系统的。那么根据全场报告呢,谷歌 t p u 的 这个算力啊,大约有百分之七十到百分之八十呢是用于自家产品的啊,比如说这个搜索广告,视频以及 java 等等,剩余的百分之二十到百分之三十呢,是对外租赁的啊,但是呢,目前随着算力需求的激增以及电力的短缺,那么谷歌的这个 t p u 啊,已经是开始 成见制对外销售了啊,根据公开报导的话,那么第一个客户就是 cloud 的 开发商 isop 已经啊签署了大规模的供货协议,还有报道显示啊,谷歌正在跟 mata 谈判啊,那么如果说一切顺利的话,那么可能会在二零二七年 会直接向 yata 销售 tpu 的 这个成品机架,用于后者自己的数据中心。而 openai 据传也曾试图通过转向 tpu 啊来向这个英伟达施压,从而呢还获得了后者百分之三十的 gpu 折扣,压缩了后者的利润。所以可以预见的是啊,那么针对一些特定的大型客户啊,谷歌可能会直接开辟一个新的商用机器版图, 届时呢,将直接威胁到英伟达的业务。那我觉得马斯克的这个 x a i 啊,后续也可能会跟进,虽然目前 t p u 呢,它并不像 g p u 那 样啊,可以以个人身份去购买啊,或者说这个小批量购买。但是啊,它的外部化推动,其实呢,已经是给英伟达敲响警钟了。事实上呢,对于硅谷的那些大公司来说,也是苦英伟达久矣啊,敢怒不敢言罢了啊, 一方面呢,英伟达通过 g p u 挟持着大部分的这个 ai 生态,那么另一方面, g p u 这个硬件本身啊,它其实并不是 ai 时代的一个原生硬件啊, 他只是说有这方面的能力而已。那么此前一直用英伟达啊,其实那是一份没得选。而现在,经过了十年磨一剑,谷歌的 t p u 不 论从单卡性能还是低级水平上,已经完全可以跟英伟达在 ai 的 训练和推理层面呢摆摆手腕了。在 t c o 更低的前提下,那么硅谷大佬呢,肯定是更青睐 t p u 了,毕竟它的创造者谷歌才 这一波 ai 技术浪潮背后的真正的功臣,那么技术层面呢,是更为正统了。而对于谷歌来说的话,通过 tpu 的 这个外化推动,也能够进一步啊,就巩固自己在 ai 产业的核心地位。其实啊,说起来啊,谷歌作为一家互联网企业啊,那么它对于这个硬件真的是情有独钟。我在刚入行的时候呢,接触的就是谷歌 glass 啊, 这个 chromebook 这些谷歌推出的硬件,虽然说当时很多产品呢都失败了啊,或者说不温不火,但是呢,谷歌它的这个硬件野心是从未停止,现在啊,你还可以买到 pixel 手机和 ness 的 智能家居等等一系列的硬件, 而谷歌的 t p u 可以 说是他过去十年来做过的最为正确的决策之一。虽然这一波是被拆的 g p t 给带动起来的啊,但是呢,从目前 jamal 的 水平来看,这个谷歌啊,也还是宝刀未老,那不仅如此呢,他还意外收获了一个 bonus, 那 就是大家对于 t p u 开始产生了浓厚的兴趣。我是大刘,感谢观看。

每日一家好公司,谷歌一条九百三十亿美元的供应链,养肥了哪些公司?谷歌 t p u 供应链 三十亿美金的谷歌内部,正上演芯片内战。搜索、云计算、自动驾驶这些核心部门为了抢 ai 芯片,闹到要 ceo 劈柴哥亲自调停, 巨头钱多却陷入算力饥荒。但真正的赢家不是他们,而是背后卖军火、修基础设施的人,他们就是深度绑在谷歌 ai 心脏、 tpu 芯片全产业链上的中国硬核公司。不聊模型多智能,聊聊托起所有智能的物理根基。我们一起走一遍这条千亿供应链数数里面的中国面孔。 数据跑得快,全靠光膜快贷,这是中国公司优势最大的一环。中际续创核心益盛是谷歌八百 g 光膜快的两大核心,下一代一点六 t 也少不了他们。天福通信提供光引擎等核心器械,长飞光纤负责数据中心内部高速光纤。这条信息高速路,从核心到血管,中国公司全包了。 芯片再强,也要站在可靠的 pcb 板上,这是承载一切的地基。互电股份和深南电路是给谷歌最新 tpu 六 v 七造地基的主力,提供三十层、四十四层超高端 pcb。 盛虹科技订单不断,中副电路则专攻电源模块 pcb。 这四家公司牢牢托起了 tpu 的 物理根基,功耗冲天,供电散热就是生命线。新雷能已打进谷歌 v 七 tpu 电源系统,博科星才提供核心芯片。电感 散热方面,英维克是龙头,是谷歌 tpu 液冷方案核心供应商,没他们,芯片也得中暑。最后把数万芯片连成超级大脑 光交换, ocs 是 算力总指挥塞微电子的子公司,独家生产核心。曼镇近芯片光库科技负责 ocs 交换机整机代工、芯片集成环节。工业复联深耕封装。长电科技是国内唯一通过谷歌认证的先进封装商,负责 tpu 的 二点、五 d、 三 d 集成手术, 从数据传输、电路承载到供电散热集成调度,一条完整的千亿 ai 算力产业链清晰浮现。这十多家中国公司,在不同环节各司其职,成为不可或缺的螺丝钉和顶梁柱。 他们打入全球顶级供应链,解决真实痛点,业绩确定性与成长性更加清晰。这是一个中国制造从体力输出迈向脑力欠入的升级故事。这条产业链上,你觉得哪个环节壁垒最高?哪家公司潜力最大?评论区聊聊。

谷歌神厂背后的公司有哪些呢?今天来具体聊下 ai 算力基建核心供应商的全景解析。拿笔记下,谷歌将二零二六年 tpu 芯片出货量目标大幅上调,那么推动了全球顶级科技巨头重构了供应链体系。 近期谷歌在亚洲密集开展的神厂工作,有一些公司成功突围,不仅拿到了确定性的大额订单,更重要的是进入了全球 ai 算力基建设施的核心圈层。首先,冷却系统 英伟克作为冷却赛道的核心标的,已完成了 cdo 冷却液分配单元和快接头的最终审核,成功锁定谷歌 cdo 约百分之二十到二十五的份额, 快接头约百分之十的份额对应新增订单价值二十亿到三十亿。其中 cdo 产品覆盖数据中心,液冷核心组建支持单机柜功率一百二十千瓦, tu 低至了一点一四六。 第二,金坛科技则通过谷歌干式变压器专项审厂,近两年来自谷歌的订单已达到了十二亿,作为电力设备领域的龙头企业,成为液冷配套电力系统的关键供应商。 然后是光通信中继续创成为了全球光模块龙头,是谷歌八百 g 和一点六 t 光模块的主力供应商, 其中八百 g 光模块份额超过六成,一点六 t 产品已通过认证。更值得关注的是,公司独家为谷歌代工 ocs 光电路交换机,单台价值超过三万美元,成为谷歌光互联系统的核心支撑。新益盛与联特科技则构成了光模块领域的核心补充。 新益盛作为谷歌光模块的供应商,八百 g 产品占比超过两成,一点六 t 产品已通过认证,联特科技已批量出货八百 g ioc 和 dr 八产品。长飞光纤作为全球光纤光缆龙头,更是谷歌数据中心内部光互联的主力供应商, 市场份额超过了百分之六十。第三, pcb 互电股份是谷歌 tpu 主板的核心供应商,市场份额约百分之三十,掌握七阶 hdi 和四层高多层的 pcb 技术, m 八材料加工量率达到了百分之九十五以上。 深蓝电路则在高端 pcb 领域实现了独家突破,为谷歌 tpu v 七提供了四十四层的高端 pcb, 是 该规格的独家供应商,占全球市场百分之十五的份额。工业复联作为 ai 服务器核心供应商,不仅承担了 tpu 芯片的封装业务,还拿下了 asic 芯片订单。 最后,消费电子逆讯精密作为谷歌 ar 眼镜的一级供应商,不仅负责关键结构件生产,还承担整机组装业务。 还在审核中的公司有哪些呢?伯爵股份,你提供 ai 服务器测试设备。易东电子,你提供 i v c 冷板代工。欧陆通,你提供服务器电源。东财科技,你提供 m 九材料。 飞龙股份,你提供液冷泵。忠实科技,你提供液冷泵模组。长兴博创,你提供 m p u 连接器和 o c s 交换机。聚光科技,你提供透镜阵力,你学会了吗?

临近年末,最大的看点在于,谷歌计划二零二六年 tpu 芯片出货量目标上调百分之五十到六百万颗, 这给目前也要入赘的 ai 打上了一次强行针。伴随着谷歌的神场推进工作,相关的产业链有望迎来持续的爆发期。 点赞加关注,马上发车。本次成长呢,是为了满足 tpu 的 i 芯片,构建全新的供应链体系,所以抛开其订单的确定性,此事对于行业的影响不局限于以下三点,第一呢,入围的企业有望其增强在市场细分领域的核心地位。 第二呢,谷歌放量达到四百万片以上,与英伟达相当,意味着广阔的市场空间。经过特算,即二次叶轮的市场规模就有望达到十一亿美金,整个叶轮市场二零二六年有望达到千亿,而二零二五年扩容达到五倍。 第三呢,持续范围不绝,续页了,还衍生到算力高功耗的 ai 服务器、光通信、 pcb 连接器等多个关键环节,所以呢,值得市场的高度关注。那具体有哪些看点?本次受益的对象有哪些?新哥特地给大家做了以下梳理。 夜冷方向是本次的重点,而神场的主角因为是国内夜景的主力一哥,有望锁定谷歌 cpu 百分之二十五的市场份额。飞龙呢,提供关键的电子水泵,为夜冷循环的动力来源。 散热呢,有忠实提供模组。宏盛看的是热交换器有望此次踏上快车。除了夜冷,核心的要点还在于光通信和光纤中继呢,是目前八百 g 和一点六 t 的 全球龙头,地位摆在那里。而腾锦呢,致力于提供 ocs 的 交换器, 占到整个采购量的百分之四十。博创提供定制化的 mpo 连接器份额占到百分之十五的份额。 而光纤呢,方向基本上是有前三缆,扩长飞提供主干光缆的百分之六十,亨通提供百分之三十的捉摩光纤,而烽火 提供特工抗弯光纤份额来的百分之二十。连续四天的情绪已经说明这个方向的强度。光纤呢,今年有望涨价达到百分之十五。 ocs 为上次爆发的时间已经启动,这个方向的格局高度确定。光库是国内唯一的碳酸锂调制器,占到榜七十。德克呢,是英某达的核心供应商,双料冠军。 赛维呢,是 m e m s。 的 金元制造龙头,提供不可或缺的微镜阵列,金元 横井式光收发的光器械。最后呢,今天高达百亿回流到 c p o, 在 业绩高度确定,同时板块技术突破的背景下,有望持续走出趋势。好了,本次分享就到这,关注新哥,给你带来最新的市场解读。

谷歌四百万克的 tpu 芯片会有哪些?中国供应商?自从谷歌的 tpu 动摇英伟达的地位后,其真量预期比英伟达近很多。谷口的 tpu 主要由博通设计,并由台积电代工生产,而中国供应商主要集中在供应链的下游环节, 包括 pcb 板、光模块、电源模块、热管理和光学主件等领域。经过这些报导的深度研究和对比交叉验证,我分为伙伴重要和间接供应商三类。伙伴供应商包括了中继续创光库科技赛微电子和长电科技,分别提供一点六 t 的 光模块, ocs 交换机、 imax 微镜芯片和 tpu 封装。二重要供应商包括富士康负责 tpu 的 服务器代工,新雷能提供电源模块,光伏电路提供 pcb, 英维克提供液冷 cdu 和冷板, 新益盛提供光模块,互电股份和澎湃科技都提供 pcb 板。三间接供应商包括天福通信和钛城光提供 ocs 交换机的 fau 主件, 藤井科技提供光学主件,长青薄创提供光鲜,飞龙股份提供电子水泵,龙池科技提供 t p u 电源。你记住了吗?我是聆听科技的,原谅,谢谢。

谷歌的 tpu 供应商的审厂进展如何?针对上一个视频,不少小伙伴告诉我有遗漏以及需要表格,我做了更详细的数据总结。 谷歌的直接和间接供应商可能有上百家,林金科技是算力集成商,所以我更关注直接供应商,因为更代表行业地位以及头部认可度。基于公开数据,我把信息可靠度分为高中低三档,再通过已完成审厂进行中和额外提示三点进行说明。 一、已完成审厂一共七家,英伟克十二月十七日完成,主要是检查 c、 d、 u 门板和快捷头对应二十到三十亿的年订单。金盘科技的干式变压器已经获得谷歌的十二亿订单,未来可能二十到三十亿。 中期续创和新意向依然是前两位的光模块供应商,必讯和工业互联分别提供电子制造和服务器集成。盛宏科技由于早就在提供 p c b 版,以及被谷歌锁定了泰国工厂的能源,也是审厂的重点对象。二、审核进行中的公司如图所示,分为页呢、 电力、光通信、 pcb 和其他一共二十一家,不包括间接供应的厂商。中华工科技、新雷能和互联股份。深蓝电路是可信比较高的,其余请大家等待明确的信息公布。 三、补充一下额外信息,就是谷歌大概率在一月份明确具体的公。此外,谷歌的 tpu 之后其实还有亚马逊的去年 ai 芯片,那么预期二零二六年会出货一百八十万颗左右。关注聆听科技,原谅,下期带你了解还不太热的 ai 芯片,谢谢!