家人们,今天科技圈、股市圈彻底炸了!一个颠覆工业软件算力格局的重磅消息砸来,阿里达摩院正式发布 gpu 版本敏捷求解器,直接干碎了困扰全球的一级变量不可解魔咒!这不是小打小闹的升级, 是从零到一的国产突破,更是 a 股算力工业软件国产替代赛道的超级催化剂!先给小白科普,这玩意到底有多牛! 一句话,求解器等于工业软件之心,是电力调度、航班编排、高端制造、金融风控这些国家关键领域的大脑计算器。以前咱们用的都是国外 cpu, 求解器算小问题还行,一旦遇到一级变量的超大规模计算,直接卡死, 内存爆炸算几小时没结果,甚至崩溃,这就是行业无解的场尾效应。但今天,阿里达摩院直接换道超车,把求解器搬到 gpu 上,靠并行加速加全新算法彻底攻克场尾效应。测试两千个通用算力,百分之九十九以上问题能高精度求解,连传统不可解的一级变量问题都能稳定算出来, 相当于以前要一百台超级计算机算一年的活,现在一台 gpu 服务器几天搞定,这效率,这技术直接对标国际顶尖水平! 国产工业软件终于扬眉吐气了!别觉得这离咱们炒股很远,记住,技术突破、产业爆发、明单狂增、股价起飞,这条逻辑永远不变!阿里这一步直接带动 a 股三大核心赛道,相关各股全是硬逻辑干货,直接给你们扒明白!一、 国产 gpu 算力核心绑定,阿里直接吃满红利!敏捷求解器 gpu 版核心就是靠国产 gpu 支撑和阿里深度绑定的芯片企业,订单直接爆炸。海光信息,绝对核心,阿里深度合作伙伴 d c u 系列 g p u 兼容 c u d a 和阿里联合开发下一代训练卡,是唯一通过阿里 blade disk 编辑器验证的国产 g p u。 这次求解器爆发,直接带动 g p u 需求翻倍,业绩弹性拉满,含五 g。 阿里云推理芯片核心供应商, 四元五九零,芯片完美适配阿里服务器,二零二五年已拿阿里十亿订单。 gpu 求解器普及,推理芯片需求同步暴涨,直接受益新源股份、平头哥 rasv, gpu ip 核心供应商,深度参与阿里芯片研发, ip 授权业务直接躺赢。二、 ai 服务器加算力基建, 阿里订单爆满,龙头直接躺赚。 gpu 求解器大规模落地,必须靠 ai 服务器数据中心支撑,阿里产业链上的基建龙头订单排到明年。 浪潮信息,阿里 ai 服务器第一大供应商,供应阿里云百分之七十服务器,支撑,百分之九十训练任务,二零二四年拿阿里三十亿订单。 gpu 解析器爆发,服务器需求激增,业绩直接炸裂。工业复联,全球 ai 服务器制造龙头,深度绑定阿里高端服务器规模化量产,阿里服务器没有一张卡是空的,订单根本接不完。数据港,阿里云专属 idc 服务商,百分之九十收入来自阿里城建,二十多个数据中心, 算力需求爆发,机柜利用率拉满,租金收入稳步增长。英维克液冷散热龙头,阿里采购占比超百分之六十 gpu 高工号刚需液冷,直接受益于阿里数据中心扩建。三、工业软件加高端制造国产替代加速打开万亿空间。 球解器是工业软件核心,阿里突破后,电力、制造、金融等领域国产替代全面加速,相关标的迎来黄金期。所成科技工业仿真软件龙头 和阿里协同发力,工业优化, gpu 求解器落地,仿真效率提升十万倍,直接受益于高端制造需求爆发。润建股份算力运为龙头和阿里共建制算云提供算力运维服务。 gpu 求解器普及后,运维需求同步暴涨。家人们清醒一点, 这不是普通的科技新闻,是国产工业软件加算力自主可控的里程碑事件。以前咱们被国外卡脖子,现在阿里带头突破,技术自主了,成本降低了,产业爆发了, a 股相关各股全是硬逻辑支撑,没有虚的。 再提醒一句,现在市场主线就是国产替代加 ai 算力加工业软件,阿里这波突破直接给赛道点火,资金大概率疯狂涌入。上面梳理的都是和阿里深度绑定,业绩确定性强的龙头,没有杂毛,都是硬逻辑。 科技强国不是口号,国产替代不是空谈。阿里达摩院用实力证明,咱们能攻克核心技术, a 股也会诞生世界级科技巨头。接下来这条线必须重点盯紧,机会永远留给有准备的人。
粉丝1.1万获赞8196

就在今天,阿里达摩院都扔出了一枚重磅炸弹,根据官方最新消息,他们首次正式发布了显卡版本的敏捷数学优化求解器,直接把这个过去长期被国外巨头掐脖子的工业软件之星,带上了一个难以想象的高性能新高度。 听到求解器这个词,可能很多不搞技术的朋友会觉得有点陌生,但咱们得看透这件事的本质。用大白话来讲,求解器这玩意其实就是工业和高端制造领域的超级数学大脑。平时不管是一个国家的电网怎么搞智能调度,成百上千个航班怎么做最完美的编排, 高端智能制造的流水线怎么提高效率,还是复杂的金融风险和资金管理,背后,全都要依赖它在底层做最极限的精细化数学计算,所以它才会被各界公认为工业软件皇冠上最闪亮的一颗明珠。 以往咱们国内乃至全球用的主流限性规划求解期,基本上全都是基于传统的中央处理器设计的,也就是极度依赖电脑主板上那颗普通芯片的算力,而且计算过程要面对非常繁琐复杂的矩阵分解。 可是随着现在的系统越来越庞大,数据量呈现爆发式的增长问题规模一旦发生膨胀,对电脑内存的需求就会出现爆炸式的无底洞增长。 你想想看,当里面的数学变量动不动就突破一级门槛的时候,由于传统算法的并行计算能力实在是太有限了,经常会出现一个大算力扔进去算了好几个小时也收敛不了问题,算不出结果,甚至导致系统直接崩溃卡死的尴尬局面。而 这一次,达摩院的敏捷求解器厉害就厉害在它完全换了赛道,充分利用了图形显卡天生的海量并行加速特性,并且引入了行业内最头疼的那个常规效应难题。 在针对大约两千个通用算力的严苛横向测试中,这个新版本居然可以把百分之九十九以上的问题类型稳定求解到极高的精度。更夸张的是,它还成功攻克了传统模式上被视为根本不可解的一级变量限性规划难题。 在理性分析层面上,意味着我们在最核心的工业算力底座上,不仅真正摆脱了对海外商业软件的依赖,甚至在复杂大系统的计算效率上找到了属于自己的超车路线。那既然这个领域的底层逻辑发生了质的改变, 在我们平时最关心的资本市场上,到底哪些相关的上市公司和板块会因此迎来一波真金白银的产业增量呢? 咱们实事求是的盘一盘,首当其冲最直接受益的,必然是那些纯正的国产工业软件以及仿真设计板块,特别是那些本身就拥有自主研发底层求解器核心竞争力的科创版龙头, 比如锁神科技,它们作为国内仿真软件和物理仿真的破局者,底层的核心竞争力就是高性能计算框架下的求解器算法。 现在整个行业的技术天花板被拉高了,这类稀缺性极高的硬科技标地,在产业生态中的估值溢价无疑会被明显放大。 同样的道理,像中望软件、保信软件这种在工业自动化和数字工厂领域深耕的头部大厂,未来也极有可能通过算力引擎的升级,让自己的工业全产业链携同效能再上一个大台阶。我们再把目光放得更长远一些,往更深层的垂直应用端去看, 那些本身就需要面对超大规模复杂调度计算的行业,同样也迎来了巨大的效率拐点。比如说负责复杂电网调度、需要秒级优化计算的智能电网相关上市公司,像国网、信通或者远光软件这些企业。 再比如,面对海量高维金融管理和复杂风险模型计算的金融科技巨头,像恒生电子这类公司,由于他们在日常业务中对顶级求解器的刚性需求, 未来随着这类国产高端求解器的应用普及,整个业务线的数字化和智能化进程全都会迎来几何级的爆发式提速。当然了,咱们和朋友聊天聊到这,也得保持一份冷静和理性, 千万不能一看到技术突破就热血沸腾去盲目追高。虽然这个消息对整个国产工业软件和先进计算产业链带来了实打实的底层信心重塑,客观上往往需要一个周期去逐步消化落地。 我们作为市场里的观察者,最核心的投资逻辑还是要聚焦在那些真正拥有硬核自主技术资产,且在下游有明确且刚性应用场景的行业头部企业身上,保持独立且务实的判断,才能在科技创新带动的长周期产业红利里走得更稳、看得更远。

五月二十八日,阿里巴巴达摩院敏捷球解器 mind opt 正式发布 gpu 版本。球解器被誉为工业软件之星,负责电力调度、航班编排、高端制造、金融管理等关键领域的复杂计算。产业链相关如下。


今天阿里达摩院选铁团队官宣了一条信息,很可能直接改写整个芯片行业的竞争格局,他们家最强的九系列高性能处理器,已经完美适配了安卓十六操作系统。 这可不是简单刷个机,它是全球第一款能够跑起来最新版安卓,并且符合 rva 二三规范的 riscv 处理器。你可能会觉得,这不就是又一颗芯片吗?但我告诉你,它背后藏着的是 visv 架构。从实验室能用迈入产品化交付的生态拐点, 一个万亿级终端市场的大门正在被缓缓推开。今天咱们就用几分钟深度盘一盘这背后的底牌,让各位看懂这一轮的投资门道。咱们先把逻辑讲清楚, r a s c v 这个架构过去几年其实不落,到今年三月份,全球市场份额已经吃下了百分之二十五。 去年一整年,全球基于 r a s c v 的 芯片出货量大概有六十九亿颗。但他心里一直憋着一股劲,有一个最大的痛 是进不了真正主流的安卓生态。你想想手机、平板、智能座舱这些动辄上亿出货的超级终端,根本就跑不了 r i s c v 的 原声安卓系统,它就只能被困在互联网和嵌入式的小圈子里。这一次,玄铁九系列把安卓十六给打通了, 而且不是靠模拟或者移植,是真正符合了 r i s c v 国际标准里的 r v a 二三规范。这意味着什么? 意味着全世界的开发者从此以后可以拿着标准的安卓开发工具,在 r i s c v 平台上像在 a r m 上一样顺滑的开发原生应用芯片,从原型到产品上市的周期会被大幅压缩,研发成本直线下降。更关键的是, 正侧面的东风也在猛吹。通信部已经明确要把加快 r s c 杠 v 产业发展列为十五五的重点任务。在技术突破和政策护航的双重驱动下,产业链的兑现窗口真的来了。那么问题来了,一旦安卓生态开始起量,谁会最先看见真金白银? 根据 markets and markets 的 数据,在整个 r i c c v 产业版图中, ip 授权和芯片设计服务这个环节占据着最大的市场份额,也是最早实现货币化弹性最大的那一环。说到这里,就不得不提 a 股的新源股份,它在 r i s c v 上深耕超过七年,是中国 r i s c v 产业联盟的首任理事长单位, 会员单位已经有两百多家,号召力不用多。说到去年底,星源的 ip 已经被十四款 r s c v 芯片采用,还帮二十五家客户的二十五款芯片做过一站式定制服务,项目正陆续进入量产。 最关键的是,它跟阿里达摩院是深度绑定的,是选铁核心 ip 伙伴联手开发 r i s c 杠 v g p u i p 和 chiplet 设计服务。你可以这么理解, 选铁安卓平台一旦向更多终端扩散,下游五花八门的芯片定制需求会像血片一样飞来。而新源就是那个站在门口最先接到订单的角色,这个环节的逻辑最顺,短期弹性也可能是最值得留意的。聊完上游的设计服务,咱们再看直接造芯片的原厂, 这批公司吃的是安卓生态打开后量价齐升的逻辑,因为适配一打通 o s s c v 芯片的场景,就不再是只有智能灯泡传感器了,它开始往平板边缘、 ai 甚至汽车智能座舱里渗透。 有机构预测到,二零三一年,全球 risk v 芯片出货量会达到三百五十九亿颗,年复合增长超过百分之三十一。这里面有几家公司必须交代清楚。 全智科技是首批选铁优选伙伴,和阿里联合开发 r s c v 架构 a i o t 芯片,而且不少芯片已经量产出货了,是选铁生态里出货确定性最强的一家。安卓生态扩展后,国产 r s c v 在 消费终端的需求会率先让它受益。 赵毅创新则是另一个标杆,他搞出了全球首款基于玄铁内核量产的 r s s v。 通用 m c u, 本身又是国产 m c u 龙头,这两个趋势一叠加,确定性很强。在往高门槛的汽车领域看,国新科技已经加入了无间联盟, 今年四月刚研发成功国内第一款基于 r i s c v 架构的抗量子高性能汽车电子 ai m c u 六个高性能核加六个能效核, 主屏干到五百兆赫兹,瞄准的是车身动力和中央域控制器。 r i s c v 在 汽车智能化的渗透,就是它中期最硬的催化剂。还有视频领域的当红科技,今年三月刚刚被评为阿里选铁优选伙伴,它的商用级视频转码产品已经用上了选铁处理器,能在几乎不损失画质的情况下,把视频压缩到原来的十分之一, 在卫星互联网那种带宽金贵的场景下,压缩比甚至能到一百倍。安卓生态一打通,这种边缘智能视频终端在消费端的落地节奏会明显加快。 芯片设计光有图纸不够,还得有尖端的 e d a。 工具来验证仿真。玄铁这次发布安卓平台,意味着下游一大堆芯片公司要从原型验证冲到系统级验证,对 r i s c。 杠 v。 专用 e d a。 工具的需求会瞬间爆发。虽然目前 a 股还没有特别纯的 r i s c v e d a。 上市公司, 但是有一家公司大家一定要知道,就是核建公软。它是国内数字 e d a。 的 龙头,在玄铁生态大会上和达摩院联合发布了混合仿真和原型验证方案,已经跟玄铁 c 九三零处理器做了深度适配,覆盖了从原型验证到硬件仿真的全流程。 一旦日后有资本动作或者相关业务放量,它会是绕不开的一个角色。除了上面这几个实打实做技术和产品的环节,还有一个生态卡位层值得注意。玄铁搭建了一个无剑联盟,全球已经汇聚了超过三百家核心合作伙伴。玄极信息拿下了玄铁 c 九三零的独家代理, 联合开发低功耗互联网 soc 平台,在渠道和方案上有先发优势。若核软件,则是把玄铁处理器适配到了 openharmony 上,共建 r i s c v。 实验室, 在操作系统生态这个位置上,卡得很稀缺。虽然这类公司眼下业绩贡献还不大,但这种平台型卡位的中长期价值是值得持续跟踪的。所以把整条线串起来看,玄铁九系列适配安卓 绝对不是一颗芯片的简单亮相,而是 r a s c v 商业化从量变到质变的一个加速信号。当然一定得给大家提个醒, r a s c v 整个生态建设目前还在早期阶段,应用兼容性、工具链完善度都需要时间打磨。

家人们,今天,国产工业软件又传来一个重磅好消息,就在五月二十八日,阿里达摩院正式发布了敏捷求解器的 gpu 版本,直接解决了过去行业里公认的一级变量不可解难题, 性能还全面领先国际主流产品。这可是咱们在工业软件核心领域的又一次重大突破。很多人可能会问,求解器就是工业领域的超级数学大脑,不管是国家电网的智能调度、 航空公司的航班编排、工厂的生产线优化,还是互联网的流量分配,金融的风险计算,所有需要做复杂决策的地方都离不开它。以前这个市场基本被欧买厂商垄断,而且传统的 c p u 求解器有个致命问题, 就是问题规模一大,内存就会爆炸,跑几个小时甚至几天都算不出来,最后直接崩溃。那这次达摩院的 gpu 版求解器到底厉害在哪?给大家看组实打实的数据,在近两千个通用算类的测试中,他能稳定求解百分之九十九以上的问题类型,比国际主流产品高出好几个百分点。 大规模问题上成功率提升了百分之十四,速度平均快了二点六七倍。最牛的是,面对过去根本算不了的一级变量超大规模问题,它能稳定解决百分之八十以上的常见类型。有个实战案例特别能说明问题, 某大型广告平台要给三点三亿用户分配流量,有一千六百万个约束条件,传统球解器跑四十八小时都算不出来。敏捷 gpu 版只用了不到半小时就搞定了,这件事的意义可太大了。 首先,它打破了欧美在工业软件核心领域的长期垄断,让咱们不用再被别人卡脖子。以前很多关键行业只能花高价买国外的求检器,不仅贵,还存在数据安全风险, 现在终于有了自己的国产替代方案。其次,它能大幅提升各行各业的运行效率,比如电力调度更精准,就能减少能源浪费。物流路线更优化,就能降低运输成本。工厂生产更高效,就能提高产品质量和产量,这些最终都会惠及我们普通人的日常生活。 另外,这次突破也证明了咱们在算法和工程结合方面的实力,为后续更多工业软件的国产化打下了坚实的基础。 总的来说,这次阿里达摩院的 gpu 求解析发布,不是一个简单的技术升级,而是国产工业软件从跟跑到并跑,甚至领跑的重要一步。工业软件是制造业的灵魂,只有把核心技术掌握在自己手里,咱们的高端制造才能真正强大起来。 相信未来会有更多的国产科技企业在这些关键领域取得突破,让我们的工业基础越来越扎实。内容仅为客观科普,不构成任何投资建议及决策参考。想了解更多科技和产业动态,欢迎关注我。

大家好,今天给大家梳理两个近期科技圈的产业热点,全程只做客观科普,不构成任何投资建议。一、 pcb 被低估的 ai 算力股价 pcb, 也就是硬质电路板,被称为电子产品之母,从手机、服务器到新能源车,所有电子设备都离不开它。 ai 算力爆发带动了高频高速 pcb 服务器版、 ic 载板的需求,高端产品价值量大幅提升,国产替代进程也在加速推进。二、阿里达摩院 gpu 求解器突破一级变量难题 五月二十八日,阿里达摩院正式发布敏捷求解器 gpu 版本,它利用 gpu 并行加速能力,解决了传统上很难处理的一级变量限行规划问题,在 ai 算力调度、工业优化、供应链规划等场景,实现了效率和精度的大幅提升。 三、产业链相关上市公司一、 pcb 产业链沪电股份、深南电路、盛宏科技、恒鼎控股、生意科技等是国内 pcb 领域的核心企业, 覆盖服务器版、消费电子版、附铜版等关键环节。二、球解器相关产业链算力底座海光信息、恒维科技为球解器提供底层算力支撑与调度平台。 工业软件、协同中控技术、保信软件、所成科技、华大九天与求解器在工业优化、仿真、 e、 d、 a 等场景高度协同 行业应用场景看的信息,国网信通在供应链调度、电力系统优化等场景具备落地潜力。可归提示,以上内容仅为行业科普与产业链事实陈述,不构成任何投资建议,不推荐各股,不预测市场涨跌,股市有风险,投资需谨慎。

今天,阿里达摩院正式发布玄铁 c 九五零处理器,这是目前全球性能最强的 r i s c c v 架构 cpu, 直接把国产开源芯片拉到高端算力新高度。玄铁 c 九五零采用五纳米工艺, 主频最高有三点二千兆赫兹,单核性能突破七十分,综合性能是上一代的三倍以上,真正对标国际高端 cpu 水平。最关键的突破是它内置自研 ai 引擎, 成为全球首款能原生跑千亿参数大模型的 risk b 芯片,不用外挂加速卡,单芯片就能完成通用计算和 ai 推理,效率远超行业平均水平。在云计算、 ai 终端、边缘计算、工业控制等场景,它都能直接替代传统架构,性能和工号表现全面升级。 这不仅是选铁系列的重大迭代,更意味着 risk c 正式从嵌入式领域进军高端通用计算和 ai 核心赛道。 国产芯片在开源架构上实现自主可控,彻底打开了国产算力的长期空间。伴随着选铁 c 九五零落地,相关产业链公司直接受益,全智科技作为选铁优选伙伴, 芯片出货量巨大,深度绑定生态润和软件,在智能驾驶 a i o t 领域落地。选铁方案新源股份提供 ip 与设计服务,参与生态构建。中科蓝讯主打 r s c v 音频芯片出货,持续放量, 玄机信息独家代理玄铁核心互联网 soc, 快 速上量。一句话总结,玄铁 c 九五零今天正式宣告, r s c b 新时代来了,国产高端算力再添硬核底牌,整条产业链都将迎来确定性的景气上行。

今天这期视频,我想先聊一个听上去就很离谱的事,一个开源的芯片架构是真开源,不是那种我给你看一点点原码,然后关键部分你自己去想办法。那种半开不开,而是那种谁都能用,谁都能看原代码,谁都能魔改的芯片架构。 这不算离谱,更离谱的是,就为了这么个开源的东西,达摩院这边做了七年,最后居然真的把它干成了地表最强。 事情是这样的啊,前两天我去参加选铁生菜大会,咱们频道的老观众看这个会一年一年半,也算是他的创世老粉了。那往年这个会的气质呢?就是那种标准的技术大会,聊愿景啊,聊布局啊,聊产品啊。但是今年呢,没聊梦想,直接给你端了盘硬菜,地表最强 respect cpu 选铁 c 九五零, 超过了龟仙人 jim keller, 公司不久前刚刚发布的得意之作,直逼叉八六 am 最新的一代产品,这种感觉就是啊,达木院不装扫地僧了,直接摊牌了,不装了, 我是亿万富翁。摊牌了这个事离谱的地方啊,不止在它跑分高,而是在它把 race five 这个过去长期被很多人当成低端平替小盒玩家、 mcu 专业户的这种架构啊,直接拎上了高性能,服 起主战场。那问题是,达摩院为什么要做这件事情,能给他们带来什么好处呢?这个时候啊,我脑子里突然想起了老黄这两年特别爱讲的一个词儿,主权 ai。 他说人工智能时代,各个国家,各个地区各个产业都在建设属于自己的 ai 能力,那如果 ai 有 主权,那芯片是不是也应该有一种更底层的主权?不是我能买到芯片的主权,而是我能决定芯片底层规则的主权。我们可以把它叫做架构主权。 risk architecture is gonna change, everything yeah, risk gets good。 那 我们为什么需要架构主权? risk five 这个免费架构能否扛起这面大旗?玄铁 c 九五零到底有多强? ai 爆发为什么会让这件事情突然变得比去年、前年,甚至比所有人预期的都更重要?以及这到底是不是中国芯片距离换道超车最近的一次呢? 剧透一下,答案可能没你想的那么乐观。 要说清楚为什么需要芯片的架构主权,就必须要先弄明白现在的架构有什么问题。 你可以把架构啊,简单理解成计算机软件和硬件之间约定好的语言,软件说一句加法,硬件知道该怎么执行,软件说一句保存,硬件知道去哪里拿数据。那现在的芯片世界啊,被两门语言统 一种呢?是叉八六,它统治 pc 和服务器几十年,以至于历史包袱都成了生态护城河。另一个呢,是 arm, 它靠低功耗起家,从手机到平板,从汽车到服务器,它基本已经完成了从移动端到数据中心的全面渗透。但问题在于呢,这两条路啊,无论选哪条,对后来者都不够自由。叉 八六就别想了,那是英特尔和 amd 的 自留地。 arm 呢,貌似开放,因为你可以买到 ip 授权,但那更像是买房,不是买地。 你可以选现成的户型,可以装修,可以把窗帘换成你喜欢的颜色。但是啊,你别想砸承重墙,更别想自己改地基。 这几年 am 和高空的纠纷,表面上看是授权和合同的争议,深层看其实就是一句话,在专有架构模式下,即便你有极强的设计能力,你的命脉依然可能握在别人手里。这就是为什么我们需要架构主权。意思希望来自十五年前啊,加州伯克利的教授们提出了 risk five, 他的目标很简单,甚至有点理想主义,就是做芯片界的 linux, 做一套任何人都能用,任何人都能扩展,任何人都不用交巨额授权费的开放指令级架构。 但是就像绝大部分学术项目一样,在很长一段时间里, race five 就是 一个瘦弱的少年,只能在嵌入式啊,互联网啊这些低端领域打打杂,跑跑简单的控制逻辑,大家也都觉得他只是个低端平替。 但是啊,这次达摩院拿出了玄铁 c 九五零,狠狠改变了人们的刻板印象。 spec 跑分二十二分,每 g 赫兹五纳米工艺下,主频达到了三点二 g 赫兹总分突破七十分,逼近了英特尔直强六、 amunus v 二、 amd 任五啊,这些友商的高性能产品,也超过了归宣人 jim keller 去年底刚刚发布的 sclor x 地表最强 race five cpu。 那 这次大会上,我碰到了达摩院首席科学家孟建义博士啊,他一路带着玄铁长大,带队搞了十四颗 cpu。 他 说啊, c 九幺零是让大家看到 race five 有 往高兴,能走的希望,而 c 九五零是要给整个行业打个样儿, 告诉大家 recife 可以 做到这么高的性能,而且这个东西你是可以拿到,可以授权,可以真正做产品的。 c u 九五零肯定是一个标杆性的产品,因为它整个来说在计算能力这块上面,其实已经能够跟国际上的这些通用的产品基本上能够对齐了。 那我们在做九五零的时候,其实也花了好久的时间一直在探索这个 t 一 结构啊。那我们其实在做的过程中有几个点,嗯,是比较重要的一个呢?就是说它微架构还是要持续的往上往上调啊,比如说它发射宽度还是要往上走,但是你发射宽度 宽了之后,必然带来的一个挑战,就是说你的工号,你的成本其实还是要控制相对比较好,才能够让这个产品能够真正的发不出来,所以微架构的创新其实是非常重要的。第二个其实还是要做软件啊,软硬件的协助创新, 在这个里面其实我们也做了啊,不管从变易器啊还是底层的那些库,都是在不断的跟我们的硬件打磨的,那这也是 vive 的 非常重要的一个给整个行业带来的一个机会啊,因为你通过软硬件的磨合,其实可以发挥出相比于纯硬件或者纯软件去做更好的一个 一个机会。 c 九五零里面除了这个通用性能之外,其实我们加了好多可扩展的东西,我们自己做了好多有意思的扩展,比如说我们对安全啊,我们已经把它加进去了,我们对这个矩阵 啊,很好的这个做了加速。还有一些呢,面向于我们一些业务场景,比如说云计算业务场景,其实我们也做了一些 软硬件系统的加速,那这些东西就是我们用瑞萨架构就可以做了啊,如果我们用个传统的架构啊,那我们其实就相当于给你的就是一个固定的一个一个模块啊,那这里面是个黑盒你也做不了啊,所以九五零里面的好多需求是非常有意思的, 所以芯片的架构主权建立在性能对等的基础上,只有你在性能上和别人平起平坐,你才有不被卡的底气。 ai 时代到底谁是主角?谁是配角?我是主角,浓眉大眼的老黄说,主角必然是我。之前啊,他把 gpu 推到风口,但今年的 gtc 话风一转,把自家的 cpu 推到了台前, 甚至说在 ai 一 阵的时代, cpu 会帮绿厂带来数十亿美元的收入,那原因到底是什么呢?孟博说, cpu 已经成了 ai 智能体时代的算力瓶颈,所以呢,需要更强大的 cpu, 这个尤其是最近大火的大家看到的龙虾,对吧?大家也把它称为新的这个 ai 时代的一个操作系统,或者啊新的一个底座,那实际上它就是在编排各种各样的任务。那么在编排这个任务的时候啊,这个大家都发现,其实 ai 处理能力很强,但是编排任务 它很慢,就是传统 cpu 现在也面临了一个挑战,说在编排这些任务的时候,是不是能够把 gpu 等待时间把它变短啊?不是说啊,这个 gpu 很 快,我 cpu 这边很慢,整个系统的效率就比较低了。 所以现在来说的话,大家都希望说面向于 agi 的 这些 c p u, 它也要面向于这个啊,新的把这种编排任务去优化,去做这个新的啊,这个架构的创新,所以 c p u 谈不了啊,因为我觉得 啊,这个世界来讲的话,从计算的范式来讲的话,肯定是通用计算加加速计算,通用计算是一个底座啊,加速计算就可以把这个面向应用做得更好。 说白了,大模型正在从回答问题走向替你做事,它不只是 to token, 它还要调 api, 要查数据库,要解释代码,要调度工具,要编排工作流,还要跨多个步骤迭代执行。 而这些呢,都不是 gpu 所擅长的,只有 cpu 才能做。但是现在 cpu 和 cpu 的 性能差距太大,那根据研究数据,在智能体的工作载里, cpu 处理工具调用这些任务的延迟占比高达百分之九十点六。 所以啊,玄铁走的路叫通推一体,也就是把通用计算和推理加速结合起来,这样既能保证 cpu 的 灵活性,又能提升 ai 的 性能实现既要又要。 我觉得推理本身来讲的话就是一种加速计算,我希望用推理这件事情去引领整个路由 life 啊,让它往更多的扩展的角度去做。 所以我们在 cpu 里面的话,会给他加上一部分的啊, ai 的 一个算力,那这部分的算力其实它就可以去作为我们整个计算系统啊, cpu 加 gpu 的 啊,这个过程中有一部分算力就在 cpu 上运行掉了,这样呢,就就不需要再 数据拷贝,任务迁移这个上面跟 gpu 来回的交换,它整体的效率就会比较高啊。当然在一很有些场景下面,其实它也可以独立于 c gpu, 它就可以单独就一颗芯片就可以运行了啊,所以通推一体的概念,其实就是想把推理的啊,部分功能放到 cpu 里面去 啊,也也有很多场景,它的模型呃,不是非常大啊,那它其实很多时候就在 cpu 上运行的效率远比 cpu 这样加个 cpu 要高得多。 根据达木院给出的数据, c 九五零搭载了达木院自研的矩阵加速引擎之后,已经跑通了千万三最强开源模型和 deepsea v 三满血版,输出速度分别达到了三十四陀刻每秒和十八陀刻每秒,那首陀刻延迟分别是三点四秒和 一点七秒。这就意味着 race five 在 ai 领域不再只是打杂的了,而是可以作为整个生产链条的一环。再进一步,旧时代叉八六和 arm 已经把很多地盘给坐实了,而 ai 时代还在快速变化,很多规则还没写死,这就是后来者最有机会的时候。 所以架构主权是适应变化的自由,那从架构到芯片到模型,再到应用,这就是 ai 为中国科技的发展带来的大机会。 刚才我们说到 am 的 授权协议非常严格,你买的就是一个黑盒,不能修改里面的任何一行代码,它就是一个精密但是无法拆解的劳力士。看看时间还可以啊,但是改里面的齿轮绝对不可能。 相比之下, race five 可以 做指令级扩展,就像乐高一样,可以随意的组装。那前面说的这些 ai 加速引擎的扩展啊,就是很好的例子。 在 ai 推理的过程中, race five 其实有两件事情一直在做,那 c 九五零现在也在不断地去尝试做啊。一个呢,在于是说如何把 resign r v v 就 vector 这个能够做得更宽啊,整个在 ai 的 这个处理过程中啊,能够变得更加高效啊,所以我们这一次呢增加了一个 vector 的 这个引擎 啊,那这个引擎呢?其实它的宽度可以做得很宽啊,可以做到四零九六啊。那么矩阵这一块来讲的话啊,也是这次呃九五零的一个一个亮点,所以我们准备就是说在矩阵这个上面, 哎,现在能够耽搁和我们其实已经可以做到了八 t 这个算力,所以实际上能够把这个计算能力进一步往上提升。为了让人们更方便的修改和定制, w m 这次推出了名叫 flex 的 软件平台,它提供了完整的处理器建模、开发环境和工具链,能让海尔、中国电信这些厂商快速定制出适合自己业务和应用的芯片。 它其实,呃也是说要在我们的选体的基础之上你再去做些定制化啊,也不是说完全推倒重来 啊,因为推导从来带来的是巨大的验证的工作量啊,您做验证就非常清楚,原来很多时候大家只开放了指令这一块,你可以定制, 现在你把存储啊,把这一些外围这一段都开放了之后,用户的整个定制的灵活性就非常高了,所以他在我们这个平台的基础之上去做定制就会相对比较容易。为什么不能?就只说,比如说我们配置一个 ip, 对, 然后我们让他有一些参数的变化就可以了,为什么还让他从这个架构的角度,微架构的角度做的定制? 这个其实就是跟刚才 rap 怎么样能够跟别人竞争走出来的这个逻辑有关系,如果通过配置,那基本上还是说 啊,就是一种传统思路啊,说我做芯片这个人,我把所有的事预制菜都做好了,然后你们来做,但实际上今天我觉得我们还是应该是让我们的应用的这些人能够现炒,能够把这个菜根据应用直接炒出来。 哎,以前是架构定义应用,你得适应 cpu 的 规则,那现在呢?是应用反向定义架构,尤其是在 a i a 阵的时代,每个公司都有自己的模型、形态、工具链、组合、场景约束,那别人家的最优解未必是你的最优解,所以芯片的架构主权是定义的,自 就是当你真的知道自己的应用需要什么的时候,你有能力在芯片最底层打补丁。这就是从租客到房东的区别,租客可以软装,房东可以改户型,而玄铁想要做的就是让更多中国企业第一次拥有改户型的权利。 那它有没有缺点呢? 一个芯片架构如果每个人都能随便用随便改,会不会造出来成千上万种 cpu, 让上层软件互相不兼容,语言不通呢?这个就是很多人质疑 race five 的 碎片化问题,那从我和孟婆对话中我能感受到啊,碎片化确实存在,但并非解决不了,关键就是不要让大家从头造轮子了。 reesiv 的 话,确实大家最担心的就是碎片化的问题,因为碎片化它就没有办法形成一个生态痕,所以对上层的软件是非常痛苦的啊。那今天我觉得如果说我们 resiv 是 沿着所有人都从零开始做, 那我觉得这个碎片化的是存在的啊,因为你对整个标准的理解有一个深入的一个过程啊,这个体系理解有过程。所以我们现在是说普通的这种 resiv, 你可以授权一个核啊,或者说你可以用一个已经被大家所认可的一些开源的核,你来做, 你要做的是什么?你要做的更多的是在这个核上面的那部分本身就是你自己掌控的,那可能是百分之二十的工作量,产生百分之八十价值的那部分东西。所以你刚才提到的我们这一次发的这个 flex, 其实就这样一个模式, 说白了就是底层的兼容性问题,你不用关心底层兼容性的事情,这个由玄铁这帮人去帮你搞定,你要做的事更多的是差异化那部分东西,把它做好。所以这个其实是我们今天在解决这个啊,碎片化和我们真正能够统一到一个生态里面的一个 啊,一对辩论的矛盾的啊,一个问题,为了打通芯片的设计、制造软件适配的全链路,他们还搞了一个无间联盟。墨墨认为生态的难点不再是基础软件,而是如何让下游应用感知到价值,这就是为什么他们要去支持 wps, 支持钉钉,甚至让 race five 笔记本给跑起来。 其实我们首先来讲的话,必须要具备一种基础能力,如果基础能力没有,就没有入场券,但是你入了个场之后,你在牌桌上依然要表现出非常强的竞争力,这个就是针对沃克罗的这种 这种的,所以我去说服这些应用厂商的时候,往往会说我们的应用场景下面是不是我们可以做的更好啊?能不能说有一些更好的定制化的,不管是架构也好,微架构这方面的机会能够帮助整个产品在竞争力上更强,所以 真正产品要落地,还是要在他的场景下面能够做出竞争力来。 回顾这七年,从二零一九年 c 九幺零发布时的没人相信,到二零二六年 c 九五零的地表最强, 达摩院做了十四款处理器,进入了两百五十多款量产芯片,总出货量超过了四十五亿颗。所以回到视频最开始的那个问题,达摩院为什么要做这件事? 我觉得他们图的啊,不只是做一颗更强的 cpu, 也不只是一条更完整的产品线,他们图的是一件更难,但是也更重要的是,让中国芯片第一次有机会在架构这一层,不只是使用别人定义的规则,而是参与定义规则,这才是架构主权真正的含义。 主权不是封闭主权,不是口号,而是在你需要的时候,既有平起平坐的性能,也有修改底层的自由,还有一个繁荣的生态去承接你的各 种想象。就像孟博说的,我们不应该以补位架构的眼光去看待它,它不是叉八六或 arm 的 备胎,它是为了满足今天那些全新未被满足的需求而生的未来架构啊,每一个架构都长在自己的时代下面, 那原来的不管叉八六还是 arm, 它也有自己的时代背景,它其实也做的是非常不错的啊。那他们今天服务于整个全人类的这些应用里面,他们也服务的非常好啊,所以说 reishi 应该走在 哎,今天一些全新的啊,或者说过去技术没有真正很好满足需求的这些地方率先去走出来,所以他们不是一个此消彼长的关系, 我觉得他们会长期共存,但是大家也相互之间也都在不断的借鉴和创新啊,然后在这个里面真正通过我们的技创新和我们的产品真正落地啊。能够真正走出来, race five 的 开源不是因为免费,而是因为自由。如果说过去几十年,全球芯片产业的底层地基主要是由少数几种专有架构铺出来的,那么接下来十年, race five 很 可能就会成为那个让更多国家、更多企业、更多创新者第一次有机会自己参与打地基的工具。 对于中国芯片来说,这不是一条容易的路,它只能靠一代一代标杆产品硬打出来。而从 c 九幺零到 c 九五零,我们至少已经看到有人真的在这样做了。好了,以上就是本期视频的全部内容,有用请点赞,喜欢请关注,我是芯片工程师老师,我们下期视频再见!

今天我们正式发布全铁高性能旗舰产品 c 九五零,它的单核 spec 二零零六超过七十分,是当前全球性能最高的莱赛 cpu, 这莱赛领域非常重要的时刻,它标志的莱赛正式进入高性能领域。