粉丝388获赞3285


在很久以前啊,就经常听到有人说焦火,那到底什么是焦火呢?今天给大家带来两个小东西,这个到底是什么呢?那听我来说吧。 交火有两种,第一种是 mb 的混合交火技术,也叫 cosplay, 那就是把 cpu 的集成显卡,独立显卡连起来使用,或者是两个独立显卡连起来使用,提升游戏性能,包括坦白说你可不打。 第二种就是英伟达的交火技术,也叫 si, 顾名思义就是把两张相同的选法调节起来。那说到交火的话,就不得不说一个交火神器,英维达恩威利,来,我们打开看看, 你看他身材小巧,做工精炼,方寸之间别有洞天。坦白的说,这个小洞洞看起来很普通,但如果你想把两张阔者的阿贴斯显卡性能发挥到最好, 你就离不开它,它可以把两张显卡的显存和 gpu 做叠加,也就是说把两张显卡变成一个整体,比如说我们的 rtx 六千二十四 gb 显存,那么通过它以后可以变成四十八级显存, 杠杠的。当然我们在市面上还可以看到其他的 si 的连接线,经过我们的实际测试啊,除了好看,性能上基本上没什么提成。对了,还没有告诉大家落地价幺六八八,确实有点过分,但是他是蝎子的粑粑。

哈喽兄弟们,今天呢,利用三分钟时间讲清楚 m 零版本与 p c i 版计算卡的区别,毫不夸张的说呢,今年佳琪接到关于咨询 a 一百 a 八百 g k 的问题啊,没有八十到一百个了,那今天呢,我们就来聊一聊他们的区别。首先是形态区别,比如英伟达 a 八百 s chain 版本, 是将四个或者八个 a 八百集成在一个主板上面,用在英伟达的 dg 叉或者 on 厂家的 hg 叉服务器中。而 pca 版本呢,就是我们视频中出现的金砖形态,与我们常见的显卡差不多,通过计算机的 pca 通道进行数据通信。 其次是性能区别,我们分两个点讲,一是算力方面, a 八百之前的 g p u 没有差别,而新一代的 hopen 架构 g p u 在精度、现存、带宽、工号互联上呢,都有非常大的区别。第二个是通信互联方面, s 叉零版本的 g p u 通过 n b s v 去将 四个或者八个 gpu 互联互通,实现任意 gpu 之间的高带宽,比如他们非常适合大数据分析和 ai 大模型训练。而 pci 版本啊,只能通过 nmink bridge 实现成对互联,也就是说卡一可以直接连到卡二,而与其他卡呢,只能通过 pci 通道进行数据通信, 这啊就要利用到 cpu 的 pci 资源,现在最高的也就是 pci 五点零实现的一百二十八 gb 每秒。最后呢,就是应用场景的区别, s 叉呢,适用于百亿千亿级的大模型训练和大数据分析,因为这些场景啊,对于 gpu 间的互联带宽要求非常非常高,比如他们 pci 呢,则适合工作负载较小的场景,比如深度学习的小模型训练、实验室的教学场景等等,并且能够让用户灵活调用。比如一个实验场景中,管理员可以在巴卡 pci 的服务器中 单独划出两张卡给到实验室使用,那非常的灵活。好的,以上呢,就是 m 令版本与 pc 版的 gpu 的区别,大家看一下还有什么需要补充的可以在评论区留言哦。

评论区好多兄弟们都说自己有 h 一百 a 八百,这有什么稀奇的,这年头谁没有几张啊,嚣张!有钱当然嚣张,但你手上的 h 一百和我手上的 h 一百那是真的一样吗?同样数量的卡,我能让他们的性能发挥到极致!本期纯干货,速速点赞收藏!相信很多兄弟们啊,都知道显卡交货, 那这个时候啊,就不得不提到我们黄教父首创的高速 gpu 互联技术 mvd, 欧宁可是英维达开发的一种高速互联技术,用过的人啊,都说很香,说白了就是把多张显卡连接起来,实现并行计算和共享内存,连接后,他们的显存可以合并为一个大的虚拟显存空间。结果呢,就是你拥有了更大的显存容量, 但是你以为只有如此吗?五年后啊,你不仅仅有了更大的显存容量,计算的性能还能翻倍提升,还会立刻提供高带宽低延迟的连接,确保 数据之间传输的效率,可以并行处理计算任务,从事 ai 计算、图形渲染等工作。兄弟们应该都知道,数据量只会越来越大,那就需要更多的 gpu 系统,单纯的上 pca 肯定是不行的, 因为带宽有限,我们需要速度更快,拓展性更强互联。而 nv link 很好的帮我们解决了这个问题,用了 nn link 的兄弟们,请在评论区留下你的使用感受。

英伟达在三月十八号的发布会,这个皮衣老黄先是赶出一堆机器人来,然后掏出个 b 二百来,这个带货手段非常的高明啊,紧贴客户需求。你们不是在通用机器人领域搞局面竞赛吗?这不军火就来了,要想打胜仗,马克沁肯定比汉阳造效率要高多了, 虽然芯片贵了,但是你用起来实际上是省钱了,这个话术跟卖冰箱洗衣机也差不多,但是我觉得更值得关注的是 b 二百的制造工艺, 有人说看发布会觉得咱们差距更大了,但是这个反而可能暗示了一点弯道超车的机会。 b 二百虽然性能提高,但是芯片制成跟前一代没有差别,都是四纳米。新的 blackwell 架构是把两块四纳米芯片放到一块 gpu 里面, 用高速链路把这两块 cpu 连接在一起,总的晶体管数量达到了两千零八十亿,比前代 h 一百的八百亿也差不多是增加了一倍多。 所以从工艺上来说,根本的变革在于他这个第五代的 nv link 技术,而不是芯片本身,你怎样把几块现有的芯片高效连接在一起是关键,里面这两块独立芯片相互之间传输速度达到了一百 tb 每秒,所以才可以达到这种内外部分一加一大于二的效果。 新技术把封装好的 gpu 之间的带宽也提高到了一点八 tb 每秒,比上一代 h 一百的外部带宽增加了一倍,这个几乎已经相当于 cpu 或者 gpu 内部晶体管之间传输速率了。 老黄同时拿出来卖的加速计算平台,全名叫 d g x g b 二百 n v l 七二这个名字你看啊,实际上就是 b 二百跟 n v link 的缩写, 在这个系统内部集成了高速链接端口,可以让芯片之间、机器之间高速互联。之前对于大模型的计算,至少有一半的运算时间都是耗费在 gpu 之间,或者 cpu 跟 gpu 的相互通讯上了, 提高数据传输带宽,可以在现有资源下大大提高效率。新设计的机柜可以支持二十七万亿参数的模型,而传输啊, gpt 四的模型参数只有一点七万亿。老黄这也算是量身定做,要啥给啥。这里面的关键问题是,一旦芯片跟芯片之间、设备跟设备之间的通路打通了, 那么整个系统就可以无限堆叠,而不太用考虑相互之间通讯造成的计算时间的损耗。那这个时候我就想起来在之前发的短视频里面给大家介绍的光芯片其中一大发展方向,其实也是要解决 cpu 之间、 gpu 之间,还有就是 cpu 跟 gpu, 机柜跟机柜之间的通讯问题。 其实一旦这个问题解决了,那芯片做大一点就不是罪了,可以拼积木多做几块,只要能塞到机箱里面就可以了,大点不是事了,那么光刻机也就不卡脖子了。这个不由得又让人联想起之前另外一个新闻,就是某创业公司 用落后制成,直接把一整块精源做成芯片,当然做大了有做大了的麻烦啊,要不然早就有人这么干了。一个是发热,一个是凉滤,这个制成太大了,主频上去了,温度也上去了。另外就是整个精源上有灰尘或者出现缺陷的时候,如果你切成小块的话,那哪落灰坏了切下来扔了就好了。 但如果整个经元做芯片,一旦有缺陷就很麻烦,整个都得扔。那么这家公司用了很多办法来解决以上这些问题,但是效果还说不上完美,应用场景有限,而且成本不一定能低多少。 但是我们看完老黄的发布会啊,再联系最近的一些创业项目跟科技新闻,感觉其实大家都是对于再往小发展信心不足,或者觉得性价比不高,整半天钱都给阿斯麦跟台机电了。干脆我们换个思路, 依照线有制成,只要能解决芯片之间互联互通问题,尺寸大小就没那么重要了。目前在光芯片或者设备间数据通讯方面领头的 英超跟英伟达这一挂的我们虽然落后,但是落后没有那么多。海外的几家相关的头部创业企业也基本都是华人,而且很多都是国内留学生直接跑去创业的,具体的也可以看之前的视频啊。 总归来说,无论在国内国外在这方面的技术突破看起来只是时间问题,眼见的着的不会太远。而且一旦芯片之间的通讯突破了,某个速率值达到或者超过了芯片内部的通讯速率,最起码在短期内大家在芯片领域的应用开发技术水平就没有什么太大区别了。 这个会不会是今后有可能让整件事情发生戏剧性变化的一个点,我们可以继续观察,起码你要指望弯道超车的话,这个路子比外面乱起哄的光客场什么的要靠谱多了。 当然了啊,台机电、三星、 intel 这些还在继续竞争二纳米制成,据说眼下这次领先的有可能是 intel, 虽然大家现在都 不太强调制成的具体尺寸了,实际上最后拼的就是同等面积上能放多少晶体管,横着放不下,大家只能往高里叠 fine fat, 不行我直接往板子里面埋线。 另外还有其他各种野路子啊。芯片领域几十年的发展可以说就是各种野路子转正的过程,在下一代芯片领域,具体哪条路最终证明是正路,哪条路是斜路,最后谁会死在半路上?这个说来就话长了啊,有空可以单独再聊两期。