粉丝393获赞1399


今天,海外科技媒体 the information 连发了两篇关于中国大模型和 h 两百的新闻。第一条,发改委和工信部召集阿里自洁、腾讯等云计算大厂研判到底要买多少 h 两百。 细节没啥可说的,无非就是调研大厂们对英伟达 gpu 的 真实需求,以及是否要强制要求他们在买 h 两百的同时搭配一些国产算力。第二条呢,是 the information 应该是拿到了独家的信约。国内那家春节是风光无限的大模型公司,最近这段时间通过水下的渠道大量买入了英伟达 blackwell 芯片,以支持明年年初发布新产品。 我想其实这两条新闻说的是同一个事,由于英伟达产品相比国内阿斗们巨大的性能代差,监管部门在支持大模型企业的业务发展和国产战略的替代策略之间陷入了两难抉择。 但是整个事件的滑稽之处就在于啊,美国放松限制之后呢,监管部门表态了,爱国喷子也表态了, 唯独国内 h 两百的真实买家始终不敢说话。当然,我们也理解啊,就国内目前的这种监管环境和舆论环境,他们轻易不敢表态是非常合理的。爱国喷子们认为啊,国产算力没问题,坚决不买以为的。 我觉得吧,牛逼可以乱吹,但是国内科技大厂门的身体是诚实的,轻易别和客观规律对着干。我简单说说,从英伟达生态切换到国内 啊,升腾、韩五 g、 海光这些国产算力的痛点在哪里?首先,国产大模型的底层全部是基于英伟达扩大编写的,如果要迁移到升腾的 k n 架构,或者是海光那个 md 的 那个 rockman 生态啊,需要将扩大代码适配自己的,需要手动重写, 而且即便代码跑通了,国产芯片在负电运转上的精度处理也不如英伟达,这就会导致模型在训练过程中出现误差,排除误差显然就费时费力了。其次呢,国产 ai 芯片通常把单卡的性能吹上天,但是集训能力是要大打折扣的。 通常意义上的万卡集群啊,并不是说要把这个单卡性能乘以一万,国产 ar 芯片由于片间互联贷款远逊色于英伟达产品,这就会导致模型在训练时啊, gpu 的 大部分时间是在等数据传输,而不是 有效的进行赋电核算。最后在万卡集群中啊,硬件的故障是一种常态,英伟达的生态经过多年的打磨,融错率显然是更高的。 国内大模型如果采用国产算力计算进行高富帅的模型训练啊,那就要频繁的面对超市啊,吊卡这些故障。全球范围内因为的 ai 生态占据的绝对统治地位,赢者通吃, md 的 份额长期维持在百分之五左右啊。 国产算力生态恰恰相反,每家厂商都有自己的软件生态,碎片化严重,开发者如果要适配国产芯片,那么又意味着每家厂商都要维护一套独立的代码,这纯属吃饱了撑着的。 哎呀,再说点题外话,我有时候挺佩服国内某些冒号的逻辑的,他们在处理万科债务困境和地产危机的时候,始终坚持市场化的原则,任由形势恶化, 那怎么到了更应该市场化的科技企业正常的商业行为的时候,又不敢放任这些企业完全进行市场化的决策呢?

呃,我觉得这个也是,呃,黄仁勋的功劳,大家花很多时间经营这个,这个跟川普的关系, 而且今年几次陪川普啊,出访到中东,英国,呃,当地的,呃, 业绩也,那个时候就是宣布会购买大量的 nvidia 回答的镜片。那另外,呃,今年已经宣布几次了,跟其他的相关企业投资美国这个 data center 数据中心呢? 所以啊,川普也是认为,哎,黄润迅为我做这么多事情啊,我必须要给他一个一个回馈啊,所以我就答应了,而且 荒人事也答应把这这个业务的百分之二十五的,呃呃,算是一个一种佣金吧,给美国政府。那川普也是认为,哎,我为美国政府也赚钱了。而且 川普也是认为,虽然他也是不是镜片专家,我不是批评的,这是事实,川普也不是科技人士了,但 川普是认为,我已经听到了很多次,这个不是最先进的镜片啊,对川普来说,只要不是最先进的镜片,他觉得我们可以接受没有国家安全的。呃,优乐啊,那另外,呃,说是在 商务部长这个 latnik, 他 已经公开说了很多次,他觉得这个 a, 不 管是 h 二十或 h 两百,他真的觉得,哎,也不是最先进的镜片,买到中国去也没关系了,就是 second or third, 甚至是 fourth ray 的 这个这个镜片。所以啊,这个是省委部长的态度啊,川普也有也有听,那当然也有很有很多反对的意见了。嗯,但是最后这个还是有总统决定,那是不是对中国说出什么讯号。其实我觉得重点是我刚刚 讲到的就是川普,呃,觉得,哦,黄文旭为了 vivo 已经做了很多事情啊,必须要帮个忙啊,另外也不是最先进的科技了,所以是不是给中国一种需要?我觉得这个不是川普的第一个或第二个卡里昂,或许是第三个卡里昂而已。 对,当然这就如同刚刚 rose 所说的,这个川普啊,就听黄仁轩这句话,给了二十五趴,他就觉得,哎,有钱有 money, money 就 觉得没问题了吗?真的是这么样的简单吗?但是还有很多人在问的是啊,这 h 两百 给了中国大陆,中国大陆要不要接受又是另外一回事哎,尤其你知道吗,现在中国大陆是请全国之力哦,在他们是发挥了非常多的这个力量来做投入意注, 那此时此刻你看到了哈,美国鹰派就认为说啊,川普在出卖国安哦, h 两百等于替中国的军事 ai 啊,装上了火箭燃料可以一飞冲天呐。 那甚至呢,金融时报就报道指出说啊,北京啊,很有可能限制企业购买 h 两百哦,要求买家提交申购理由书啊,不排除禁止公部门采购, 他就为了呢,就像我刚刚讲的,半导体要自给自足的这个政策节奏。那接着推测北京呢,刻意保持低调,可能是会有条件接受,当然各方的讯息啊,其实非常的混乱哦,但最了解的其实像中国外交部在昨天的郭嘉坤的回应啊,其实你可以看到了,他只说 啊,我们中国大陆有注意到三观的讯息,以上就没了,所以看到中国大陆呢,此时此刻会不会接受 h 两百又是另外一回事了。蔡博士会不会接受 h 两百是因为 h 两百是现在的主流啊。嗯哼,全世界 ai 芯片量最大的就是 h 两百。对, 然后那个所有的 b 两百。布拉格尔两百是是今年刚出来,可是量还不大。嗯哼,量还不大,所以主流就是 h 两百对,所有算力中间的主流。那它这一款晶片跟 给这个 b 两百的差别是什么?嗯,因为这是单镜片, b 两百是双镜片。对,所以速度看起来会大一倍,但是双镜片运作,那我们技术细节我们不提,大概有个概念就好了。是啊,就有些人有些卖电脑是单核心,双核心,四核心这种概念啊。这类是这种概念, 但是为什么北京也需要 h 两百,而且不要 h 二零嘞?因为 h 二零是打折的。嗯,那打折其实还可以买,问题是被鲁特林克修路。对,就我们那个市集的,不要了才给你。嗯, 中国是不死皆来死。嗯,如果你鲁特林克在讲说,哦,那个 h 两百是乐事,我们在给中国,中国就马上不买。哦,可是如果纯这种市场的需要的话, 中国还是需要 h 两百。为什么? h 两百强在什么?因为我们知道 ai 模型哈,分两部分,一个叫训练,一个叫推理。 对,训练是什么意思?就把小孩子从幼儿园把他培养到博士毕业。嗯,这个叫训练。对,让所有的参数啊懂,都懂。什么叫推理?他拿到博士学位以后去上班,去教书, 然后有人问他问题,他回答什么问题,根据他的学问资料去推理出来给人家答案。嗯啊,那给他推理,然后在训练部分好, 要用通用型的 gpu, 就是 h 两百最适合。对啊,但是如果推理的话, h 两百就很贵。嗯,耗电量也比较大,成本比较高。嗯,还不如那个谷歌的那个天手。对, tpu 还不如。 那也不如华为升腾九一零 c, 因为那款是神经网络处理器。嗯,然后 google 的是账样处理器,然后这个辉达是图形处理器,它处理器性质不同,所以不管是辉达的或者是 google 的, 它的推理成本都比辉达便宜。嗯,辉达便宜。嗯,所以中国大陆的模型要扩大训练的时候,嗯,用 h 二零最适合 啊,但是要推理的时候用华为最适合。嗯,那可是晶片的数目。好,这个推理的部分百分之八十, 嗯,境内部分只有百分之二十,大概是这样的比例。嗯,所以中国大陆在这百分之二十部分他可能也需要有那个有些单位需要 h 两百。对,所以你看中国大陆态度不是绝对禁止。嗯,说,你来申请 到底有什么需要?嗯,你真的需要再让你买啊?对,所以你认为说是会有有限度的采购?不是啊,你如果只念到大学就会等华为就好了。嗯,那如果你要念到博士,我就给你买 h 两百。简单讲就是这样子。嗯,啊, 对,他还是优秀。那中美 ai 的 上面是不是会把这个如果 h 两百到了中国大陆之后,他的啊,这个差距呢?会越来越少,然后呢?美国会在中国大陆会紧追在后?哎,不能不能这样讲啊。哈,因为 ai 的 竞争哈, 不是要完全看芯片这一起和大语言模型这一起,也要看应用这一起。是啊,那不可否认中国大陆的应用这一部分是比美国强。嗯 啊,因为他制造业多啊,工厂多啊。对啊,那可以人形机器也可以。不是人形机器也可以,自动驾驶也可以。那这应用范围本来制造业就一定有优势,是 因为你美国金融业用的人简单了,制造业就是比较复杂。是用的比较广啊。是还有医疗啊,还有这个各方面呢。这个 应用的部分大陆现在是比美国强太多了啊。但是在大语言模型方面哈,虽然阿里巴巴很强,然后这个,哎。对,这个也很强哦,但是现在要跟美国这个内卷竞争啊。刚开始,比如举个例子, gbt 这两天呢?被那个谷歌压着打。呵,被谷歌压打?可是你说 gbt 认输,那也不见得 哦,就是刚开始而已哈。刚开始而已。那一样啊,阿里巴巴跟那个 deepsea 也是刚开始而已啊。嗯啊,那百度也也搭一脚啊。嗯,而且这些大爷的某些都想要自己设计镜片。对,那设计镜片就变成自己 很窄的。就是阿斯克的特用镜片好。哎,很难,比如我为 google 设计的特用镜片,我很难卖给别人。嗯,会有这种问题在。嗯哦,但是往上层的镜片设计跟制造,嗯,不可否认, 辉达还是 number one, 台机电还是 number one。 嗯,那你华为的镜片如果没有台机电这个加工的话,代工的话,嗯,让中兴国际代工就是差那么一点点, 但就是要时间了,去克服。我同意,要时间,要时间克服了,但是未来 you never know。 哈哈哈,对,我们都还不知道,都还要慢慢的看了。对,那赛博斯,你认为说这一次川普做了这个动作哈,很多人讲说他可能像是因为接下来他这个他四月要访问中国大陆嘛。 那当然也对,中国大陆试出了一个讯号,不管是相关的稀土,他也希望这个中国大陆的相关的限制能够再放宽一些。你认为说只有单纯就是黄人勋的原因吗?有这么单纯吗? 黄仁鑫元旦是个原因?当然当然的,因为黄仁鑫上次那个 h 两 h 二十有没有对,他已经下单给台积电制造了。制造总量多少?一百三十万颗 一颗多少钱?试价一万美金是一百三十,以压在那边是,即使是成本呢,就说他没有赚的就算了。对,他的成本是多少?两千五百块。嗯嗯嗯,他毛利是等于是七千五吗?对 哎,两千五百块,一百三十亿美金的四分之一也很可观呐,他投下去就赔钱呐。 那现在流行的就是 h 两百,那有人认为 h 两百会被 b 两百给取代?嗯,那是民货人用的是。嗯,至少 这个川普可以用这个当礼物啊。哦,是好哎,是好哎,那以前那 h 二零哦,品质比较差哦,给你实在不好意思啊,现在改用这个主流产品哦。哎, 对了,川普是对外生生说他。不不,这本来就善意嘛。善意的,因为你那个什么那个华为的档次只比 h 二零高而已,距离 h 两百还早。嗯,我们,我们简单讲是这样子哈, 所以这是善意,我们不能把它解释成好像川普做的都是恶意,我不会这样讲,我不能这样。对的,所以我说是不是有试出什么样的信号,当然是善意嘛。对啊,那另外一个他也对这个黄子勋事实善意啊。哎呀,这个美国 这个已经赔了一笔 h 二零了,你怎么好意思赔 h 两百。对啊,而且你让他卖中国大陆不一定说会对中国大陆的华为经费产生影响,我认为是相互搭配。嗯,就是华为会在 哎推理当中还占很大优势,可训练方面用它会使中国的语言模型更成熟。哦,那当然,美国很多国语演讲说我了,你怎么就跟我竞争,对不起啊, 中文世界还是跟你英文世界不太一样哦。啊,对,这个这个不能这样比较了。是不能这样比较了。是,那举个例子你,你记得马斯克用 ai 把美国的所有的继承者全部捅包了?嗯, 中国就是阿里巴巴同胞自己的吧,这有什么差别的对不对?那你美国又没有制造业对不对 啊?比较港口那个吊车,你美国又不会做,那我中国做了对不对?你美国也可以用啊。对,所以我是觉得我不晓得那个美国那国会一眼脑筋到底是什么东西啊,实在我看不太懂, 可能看到中国就害怕了,或者是看到中国就觉得好像他们好可怕。怎么样,中国继续壮大成长是正常的。对啊,但是你美国还是处于领先地位啊。嗯, 对啊,我,我不否认,可是可能美国议员他们担心是这个差距。我就刚我讲了吗,差距缩小是必然的吗?对啊,但是你都一定会赶过去, 平常讲还还是有点距离的。还是有点距离,因为你都一定会赶过去。平常讲美国没有制造呀,船也不行。那个 没有错,这是他美国弱点。对,可是美国还是很多优点,你要看他强势,不然他 gdp 怎么会比中国大陆高嘞?嗯,而且他人均 gdp 比中国大陆 多很多倍啊。嗯,中国大陆人均 gdp 还没两万呢。嗯哼,美国人均 gdp 已经快八万了,你要这样算嘛。对,所以你不要老是看到你输了,没有看到你赢的。这美国人是很。