粉丝1832获赞6.3万

五月十四日,一家你可能没听说过的公司要在纳斯达克敲钟。它叫 cybrass systems, 发行价区间一百一十五到一百二十五美元,对应估值最高两百六十七亿美元。它的目标是打败英伟达。 先别急着鼓掌,在 ai 芯片这个英伟达几乎统治一切的赛道, cybrass 说,我们的推理速度是它的二十一倍,成本只有三分之一,工号只有三分之一。 二零二五年,这家公司收入五点一亿美元,同比增速百分之七十六。招股书里净利润写着二点三八亿美元,看起来健康的不像一家初创公司。但剥开会计处理, non g a a p 口径下, 净亏损七千六百万美元,运营亏损一点四六亿美元,而他要求市场给出两百六十七亿的估值,五十二倍的市销率,英伟达现在是二十一倍。一家运营亏损的公司要求比英伟达更高的估值倍数, 它凭什么?这就是今天要聊的问题。我们从技术讲起,再看财务,再看风险,最后看那个改变了所有蓄势的大单。要理解 sirius 的 价值,先要理解英伟达 gpu 在 推理任务中的一个结构性瓶颈在内,叫它内存强。 英伟达的 gpu 是 什么逻辑?多颗芯片协同工作,每张 gpu 有 自己的高宽带存储,芯片之间通过 nv link 互联。 当你在跑一个大模型推理任务时,模型的权重参数需要不断从存储、搬运到计算单元,计算完再搬回去。这个搬运动作在大规模推理场景下会成为速度瓶颈。数据离计算越远,延迟越高,这是物理定律,不是工程问题。 sirbrass 的 解法非常直接,也非常激进,造全世界最大的芯片 wse 三鲸源级引擎第三代, 整张晶圆就是一颗芯片,面积约七十二平方英寸,包含数十万个 ai 核心,以及大量片上存储。类比来说,英伟达 gpu 集群向城市里的快递员在各小区仓库之间跑, ws e 三是把所有仓库都搬进了同一栋厂房,数据不用搬运,片上带宽可以达到二十 p b 每秒以上的量级, 这是 gpu 集群无法企及的数量局。在低延迟推理这个具体场景, wse 的 优势是结构性的,不是靠堆算力堆出来的实时 ai agent 需要极低首字母延迟的对话系统长上下文处理,这是 sirbress 真正的主场, 但技术也有清晰的边界。训练任务不是 w s e。 的 优势。场景超大规模模型仍需外挂存储扩展。软件生态与英伟达 c u d a。 的 差距是真实的。以年计,不是以月计。 制造上完全依赖台积电,良率风险被精元级设计放大,而且英伟达不会做事。 vero rubin 溢购价购,二零二六年交付, 明确针对低延迟推理优化,并且带着 c u d a。 生态进场。如果他在推理场景兑现承诺, sirbrass 当前最核心的差异化窗口将显著收窄。招股书显示, sirbrass 二零二五年净利润二点三八亿美元,乍一看盈利了,很健康。 对比二零二四年净亏损四点八二亿美元,看起来像是戏剧性翻盘。但这是一次性会计处理的结果,不是经营改善的结果, 背后是特定长期合同负债的重估调整,产生了账面收益。剥开这层, non g a a p 净亏损七千六百万美元,运营亏损一点四六亿美元,而且这个运营亏损比二零二四年的两千一百八十万扩大了近七倍。收入在增长,亏损也在扩大, 增速确实是真实的。二零二二年收入两千四百六十万,二零二三年七千八百七十万,二零二四年二点九亿,二零二五年五点一亿三年二十倍。 毛利率也在改善,从二零二二年的百分之十二走到二零二五年的百分之三十九,这个进步是真实的,反映了规模效应和产品组合优化,但百分之三十九远低于英伟达的约百分之七十五, 主要原因是硬件产品毛利率偏低,靠云服务和托管服务拉升整体。然后是估值两百六十七亿,市值五点一亿,收入五十二倍。 英伟达现在二十一倍, amd 大 约六倍。五十二倍意味着市场需要相信 openai 合同,按计划确认收入。 uae 客户不出叉子,毛利率持续改善,英伟达在推理市场无法反击。四个假设需要同时成立, 这是很高的要求。现在来说最关键的问题。二零二五年 sirius 的 两大客户是 g 四二和阿布扎比人工智能大学。 m b c u a i。 两家阿联酋机构在会计准则下被认定为关联方, 他们合计贡献了 sirius 二零二五年百分之八十六的收入。年末应收账款中, m b c u a i。 独占百分之七十七点九。 一家挑战英美达的美国芯片公司,百分之八十六的钱从中东来,这不是秘密,写在招股书里, 但这句话的地缘含义值得仔细想。二零二四年, cybers 第一次递交 s 一 准备上市,随即美国外资投资委员会 c f i u s 介入审查。审查焦点是 g 四二,是 cybers 的 股东间最大客户 c f i s, 担忧其历史东大商业关系 可能构成京元级技术外流通道。最终, g 四二同意剥离东大投资持股被调整为无投票权。 ipo 重启,监管风险暂时清清,但不等于永久消失。中东地缘局势如果再出变数,美国出口管制如果进一步升级,这个问题会重新回来。 但今年一月,局面出现了变化。 openai 和 sirbraz 签了一个多年期协议,提供七百五十兆瓦算力容量,合同价值超过一百亿美元,期限至二零二八年。 这是这次 ipo 能够成功推进的最核心趋势支撑从中东资金变成了 openai。 算力供应商 a w s 也在 bedrock 上接入了 sirbraz 的 高速推理,客户名单里出现了 meta male、 clinic、 美国能源部。为什么 openai 要选 sirrus, 而不是直接用英伟达?逻辑很清晰,第一,有了替代供应商, openai 对 英伟达的谈判筹码更强。第二, openai 的 实时推理服务对手字符延迟极其敏感, sirrus 在 这个场景的速度优势是真实需求。第三,算力多样化本身就是大型 ai 公司的合理策略。这笔合同不是 openai 要抛弃英伟达,而是 openai 在 构建一个更复杂的算力组合。 但有一个细节必须说清楚, sirbress 透露的剩余履约义务高达两百四十六亿美元,约为年收入的四十八倍,这个数字让很多人兴奋。看这么大的 backlog, 但 rpo 是 合同承诺,不是已经确认的收入, 更不是已经收到的现金。 openai 的 一百亿大单,绝大部分还躺在 backlog 里,需要随着服务交付逐步确认。这个确认节奏取决于 openai 实际使用算力的速度,以及双方合同里的里程碑条款。 backlog 不 等于收入, 这是一场和时间的赛跑。 openai 合同何时开始大规模结款,决定 sirbrass 能否在下一个风险事件发生前真正完成客户多样化。 这家公司,它可能是华尔街推出的蓄势泡沫,但也可能是 ai 硬件格局重写的起点。一张晶元级芯片,在推理这个越来越重要的战场上,找到了英伟达护城河里真实存在的裂缝。历史上 每一个不可撼动的技术垄断,最终都被一个你没预料到的方向撕开了口子。英特尔不是被另一家做 x 八六的公司打败的,它是被 arm 打败的。 只是这一次撕口子的,是那张全世界最大的芯片,还是那张从中东收钱的账单?先出了问题,我们拭目以待。我是清醒财经,我们下期见。

这是什么?这是晶源,用来切割成一颗颗小芯片,然后封装成 cpu, 再装进电脑、电器、手机里,最终构成了你我的数字化生活。没错,但放在 ai 的 应用场景里,就出现了一个比较奇怪的情况, 一块晶源先被拆分成几百颗芯片,各自封装成 cpu, 然后这些 cpu 又被放进同一个机架里,集合起来,用于 ai 计算。这算不算再绕弯路?你这么一说,好像真的是这样。 所以有一家公司叫 sirius, 它的做法是干脆用一整块晶圆直接做成一颗巨大的芯片。 等等。你说整个晶圆一整片都不切,那得有多大啊?差不多相当于 ipad 屏幕那么大, 比英伟达最新的 b 两百芯片大了将近六十倍。它在一片完整的十二英寸晶圆上,刻出了四万亿个晶体管,九十万个 ai 计算核心,全部连在一起,像一座微缩的电路城市。 可是过去别人也想过做大芯片,良品率、散热、供电都是迈不过去的坎。 siribras 是 怎么解决的? 这就是它晶源级引擎厉害的地方。传统方法是把几百颗小芯片装到一块板上,数据要在它们之间来回搬家,像一群人通过窄胡同传话,又慢又费电。 sirbraus 把所有东西都放在同一块硅片上,内存带宽能做到每秒二十一个 pb, 差不多是英伟达 h 一 零零的七千倍数据,根本不用出门。 但我查到一个数据,它的片上内存只有四十四 gb, 像 lama 七零 b 这样的大模型,跑起来需要上百 gb 空间,这个超级芯片岂不是一个小容器? 问到点子上了,这四十四 gb 相当于芯片的光速,大脑缓存速度极快,但容量有限,所以 sirbress 给它配了一个叫 memory x 的 超大号外挂硬盘,容量可以从一点五 tb, 也就是一点二 tb、 一点二 pb 那 装下目前任何大模型都绰绰有余了。对,而且对于那些大到连单套系统加外存都装不下的巨型模型, sirrus 还能把它像流水线一样切开,分摊给多套 cs 三系统协调处理。 比如运行一个七百亿参数的拉玛三点一模型,用少至四台 cs 三系统就能流畅跑起来。但对开发者来说,感觉就像在一台机器上操作一样简单。 它这个巨无霸芯片最后变成什么产品了?它们把这块芯片封装成一个叫 cs 三的系统,一台机器就能顶得上一堆 gpu 集群才能干的事。 而且它还能从一台系统轻松扩展到两千多台,组合成一台叫 condor galaxy 的 ai 超级计算机。但从程序员的角度看,就像在操作一台设备。也就是说,它既可以当单机用,也能组超算,还可以上云。 对, sirrus 自己也提供云推理服务,用户直接通过 api 调用,几分钟就能部署好一个开源大模型。按官方数据对比, gpu 方案,推理速度能提升二十多倍,功耗和成本反而更低。 你一直说它更快,但到底快多少?如果和英伟达最强的 blackwell 放在一起,一个机架对一个机架,结果会怎样?那我们来算算账。一个装了两台 sirius cs 三的机架,能提供两百五十 petflops 的 ai 算力,功耗是四十六千瓦, 而一个英伟达 n v l 七二标准机架塞了七十二块 blackwell gpu, 能提供三百六十 petaflops 的 算力,但功耗高达一百三十二千瓦,也就是说,英伟达的绝对算力更高。但 sirbrous 的 功耗控制得太出色了。 没错,做一道简单的除法, sirbrous 这个机架每瓦电能可以产出五点四 petaflops 的 算力,而英伟达是二点七 petaflops, 能效刚好是两倍。这还不是全部,官方在推理场景里测试 c s 三的速度比英伟达 b 二零零方案快二十一倍,成本还能再降低三分之一,这就是大芯片植廉带来的优势。没有中间商赚差价,也没有搬运工耗能量, 这么颠覆的产品,到底谁在用?说出来你可能不信,客户名单相当不得了,最大的客户是 open a a, 跟 sirius 签了超过两百亿美元的长期协议,专门用来跑 ai 推理。 metta 也在用,他们在拉玛寺模型上测试,跑出了每秒超过两千六百个 token 的 速度,是普通 gpu 方案的十九倍, 这速度聊天几乎感觉不到任何延迟了,就是这种感觉。此外,还有梅奥诊所用它分析基因组数据来做精准药物匹配, gsk 药厂用它加速新药研发。就连美国国防部、阿贡国家实验室、亚马逊 a w s 都在和 sirbrass 深度合作, 从医疗到国防,从云厂商到顶级 ai 公司,全给覆盖了。那这家公司现在到底是什么状态?是不是也该上市了? 你猜的很准, sirbress 二零一五年成立,创始人当年卖了一家叫 c micro 的 公司给 amd, 现在算是连续创业者的第二春。财务上,去年营收五点一亿美元,已经实现了年度盈利,而且就在这个月,他们即将在纳斯达破上市。 代码是什么?估值多少?代码是 cbrs, 发行价在一百一十五到一百二十五美元之间,计划募资最高三十五亿美元,整体估值大约两百六十六亿美元,据说到现在已经收到超过一百亿美元的认购意向了。 所以这不只是一个技术故事,也是一个资本故事。对,上市之后,他们手上会有更多弹药去和英伟达正面竞争。至少在 ai 推理这个赛道上,精元级引擎的思路很可能把小芯片再拼装这条路给重新定义了。 我开始觉得,未来 ai 算力的答案可能不是把一堆小芯片叠起来,而是干脆造一块最大的芯片。 cyberrus 正是沿着这个方向,把所有赌注都压在一块餐盘大的龟片上,去赌 ai 世界的下一城。

上一期聊 oppai 两百亿压芯片架构创新,这期视频评论区被三个问题刷屏了,我手里的光模块是不是要崩?我重仓的存储是不是要崩?英伟达是不是要走下坡了?今天就把这三件事一次说清楚。但在聊这三个问题之前,我得先说一个比这三个问题都重要的事。 deepsea v 四前两天正式发布了这件事,把我上一期埋的那条国产链,是这波架构革命的天然受益方的伏笔,直接盯上了实锤。 deepsea v 四,一万六千亿,参数一百万上下文,但比模型本身更重要的 是他的硬件路径,你打开他的论文看,里面写的很清楚,这一次他的犀利度专家并行方案在英伟达 gpu 跟华为升腾两条路上同时验证,推理这一块直接全面适配升腾九百五十 p r, 还顺手提供了基于升腾 a 三超节点的训练参考实线。我说一下我自己的感受啊,现在 ai 越来越好用了, 尤其 ai 编程跟 agent, 不 管是做芯片设计、模型训练,还是搭软件生态,速度比之前快了一个量级。所以这次最关键的事情,其实是 deepsea 主导者把一套可以跑在深层上的软件层做出来了。华为是硬件方向的紧密配合,在国内重新跑通了一条模型到推理到部署的完整路径,这是过去两年大家一直在等的那个工业级闭环。所以我上期说国产链有机会,不是预言,是已经在发生。 ok? 那 回到评论区,那三个问题,我一条一条说。先说光模块是不是要崩,这个不是一件事情的因素,要多角度来看, 你想啊 sirrus 那 个方案是一片晶圆内不出硅片,但两千零四十八台机器之间还是要互联,那一层依然要靠光通信。而且更重要的,全球 ai 算力的总盘子还在膨胀,光模块的需求基数没动,真正要警惕的不是技术替代,而是本身短期涨幅。如果已经计价了未来几年的增长, 那任何风吹草动都会被市场翻成利空。这是估值阶段的问题,不是基本面的问题。再说存储这条线,我先说现象,然后再说判断。你看 siri bros 这个架构,它的 memory x 系统走的就是大容量 dm 的 路子,没有用 h m deepsea v 四这次的工程实现里还有 k v 缓存王,企业级 ssd y e 的 设计, 这两件事叠加起来确实在动 h b m 的 仅有和路径,但你猜怎么着?三十 tb 企业级 s s d 过去一年价格涨了两倍半,连英伟达自己最新的如饼平台都加了高速 s s d 缓存卸载方案,这说明什么?说明 serp 这种架构本质上等于工程上帮我们理出了一条被迫走的路。 h b m 我 们现在确实拿不到,但是要落地 ai 算理 d y m 加上 s s d 加上先进封装,这条路是能走通的,这对国产链是真的好。那 h b m 自己呢?我的判断是短期不会被替代, 中期会出现分化,长期 hbm 还是 ai 内存的底盘。为什么这么说?因为英伟达自己就是 hbm 最大的使用方,它的 gpu 方案直接绑死 hbm, 亚马逊今年还定了一百万颗 gpu, hbm 的 绝对需求量是确定的,所以 hbm 不 会崩,反而是整个存储层级被重新打开了,对国产链是双重利好。最后说英伟达,英伟达绝对体量还在涨, 亚马逊一百万颗 gpu 这个订单刚才说过了,库达在海外的生态护城河也没动。大厂去做 asic 芯片,国产链做自主可控, sirubras 搞架构创新,这些都是增量市场分流的自然结果,不是英伟达地位的替代,英伟达还是这条赛道的霸主。 那这一波到底对谁有利?我自己看。是三条线。第一条,先进封装。不管 cerrobras 这种金元级方案,还是国产 chiplite, 多芯片集成终端,硅片加工加上先进封装,这是绕不过去的环节,而这一块国产链是真有东西的。第二条,液冷散热。 评论区好多朋友也在问散热怎么解决,答案就一个字,液冷。 cerrobras 单台机器功耗二十三千瓦,是英伟达 d g x 的 一点六倍,做成机柜级液冷,这不是趋势了,这是硬刚需, 而且叶冷恰恰是国产链最不卡脖子的一环。第三条,国产算力比环 deepsea v 四这次发布,国内几家国产芯片厂商基本都做了对零的适配,不只是华为,其他几家头部国产芯片厂商也都跟上了。阿里自洁、腾讯这些大厂的国产芯片订单 最近也在大幅追加,国产芯片现货价格短期上浮百分之二十,这条线刚开始,所以我这期想说的核心其实是 ai 算力,这个增量市场 现在正在分流出几条并行的路,因为打主航道,绝对量还在长。大厂自研 asic, 把卡脖子的环节攥在自己手里。架构派,比如 sirius, 是 训练推理新场景的增量国产链走自主可控这四条路不是互相替代,是同时存在。而中国在大厂自研、架构创新、自主可控这三条上 都站到了好位置。这才是增量市场最有意思的地方,不是革命,是分流。所以这事对谁都有钱赚,就看你站在哪条路上,站在哪个阶段。但产业逻辑跑通,不等于股票马上要涨或者马上要跌。这是我想聊的最后一件事,也是这期最值钱的一个判断。同样一条消息,落到不同涨幅的赛道里,效果是反的, 涨多了的赛道,任何消息都会被解读为利空,没涨的赛道,任何小作文都是上车机会。所以我这条线还能不能持有,其实是个伪命题。真问题是,你手里这条线现在处在什么情绪位?合理、固执、舒服、姿态这八个字,比追任何热点都值钱。评论区聊一句,你手里现在哪条线,你觉得它处在什么阶段?

下周三, cerberus 正式登陆纳斯达克代码 cbrs, 这家公司专做晶圆级 ai 芯片,单颗芯片几乎是一整片十二寸晶圆,面积是英伟达 h 一 百的五十七倍, 主营产品是 wse 三芯片、 cs 三整机系统,以及按 token 计费的推理云服务。在和英伟达 gpu 的 正面竞争中,主打超大模型推理的极低延迟 价格区间一百一十五到一百二十五美元,发行两千八百万股,募资约三十二亿美元,上线估值二百六十六亿。 二零二五年收入五点一亿美元,同比增长百分之七十六,订单储备高达二百四十六亿。但要注意,账面净利润主要来自一次性会计收益,剔除后,经营层面其实仍在亏损,而且亏损在扩大。 按二零二五年收入算,发行上限对应的市销率高达五十二倍,是英伟达、 amd 这些成熟同行的两到三倍。 最大的风险是客户集中度,阿联酋背景的谋位占了六成,加上 g 四二,共占百分之八十六。未来 open day 二百亿美元的多年合约一旦执行不及预期,收入会断崖式下跌。 底线故事很大,但当前估值已经把完美执行打进价格里,建议把它当成高悲态的 bia 主题期权,不追首日高点,等第一份季报验证收入确认节奏再说。

因为他真正的竞争对手 hbm 高代宽内存海力士的杀手来了! siri bros, 没错,就是那个直接把模型权重直接烧录在金元上的那个芯片公司。 他跟达子走的是完全相反的路线,如果后续这手技术真的成熟的话,那他真的就把 hbm 高代宽内存给消灭了呀。因为他直接把模型权重刻到金元了呀,缺点就是费金元, 这要是成了还要买套客吗?到时候再回头想一想,今天如此疯狂的建设呃,这种数据中心, 别到时候给一一技术节贷没用了,变成这种过剩的算力了。首次 ipo 募资三十五亿,大模高盛领头,希望你的技术快快成熟。

cyberrus 五月十四日纳斯达克 i p o。 硬刚英伟达的另类芯片巨头,谁能撼动英伟达的 ai 芯片王座? 这家走京元级超大芯片路线的硬核公司 cyberrus, 五月十三日定价,五月十四日纳斯达克正式 i p o 上市,募资最高三十五亿美元。今年美国最大 i p o 即将弯道超车, 别人把晶圆切成几百颗小芯片,他直接把整片晶圆做成一颗芯片。 w s e 三,拥有四万亿晶体管,餐盘大小数据不用跨 gpu 传输,芯片内部直连,低延迟、超快推理速度,超大内存带宽 直接绕开英伟达 nv link 集群,路线完全不同,底气来自硬核。创社团队全是 amd 老兵, 曾创办 c micro 被 amd 收购, ceo 更是硅谷硬科技狂人,销售战略拉满, 二零一五年成立,提前卡位。 ai 算力赛道,如今推理时代到来,直接迎来爆发 open ai 算力赛道,如今推理时代到来,直接迎来爆发。 i 签下一百两百亿美元长期打单,二零二八年交付七百五十兆瓦算力 open a m e 按拨奖康清大单,二零二八年交付七百五十兆瓦算力 open a 按拨奖主言语新 i 正式开启,去英伟达话 二零二五年中东客户占比超百分之八十六,如今成功摆脱单一依赖 sirobras, 成为少数能承接顶级算力的厂商,本周四正式敲钟, ai 算力格局真的要变天了。关注我,了解一手信息!

终于等到 cyrus 出来了,绝对是这个夏天的王炸,认真听一下啊,今天我要给你讲一个真正意义上的完美的天时地利 ipo cyrus, ai 芯片设计公司时代 顶级赛道名字你可能有点陌生了,但他做的事啊,可能会让你重新理解什么叫顺利。这一家公司正在用一颗整张金元做成的芯片啊,试图正面硬刚硬伟大。而他的 ip 啊,从启动到现在,短短两周,定价已经调了两次了,认购需求超过一 百亿美元,定价从一百一十五美元一路拉到一百六十美元,木质规模冲到了四十八亿,估值直奔三百五十亿美元。 今天这条视频啊,我要告诉你,它凭什么值三百五十一?它的技术到底行不行,以及这一次 ipo 究竟是 ai 基础设施的里程碑,还是又一个被狂热吹起来的泡泡? 先来说一下最容易理解的部分,它的芯片和所有人的都不一样。英伟达的 gpu 是 一块小芯片,然后把成千上万个更小的芯片连在一起,组成集群,这是主流路线。 ceo 则走了一条完全不一样的路,他把一整张三百毫米的硅晶圆,直接做成了一颗芯片。是的,一颗啊, 他的第三代晶圆引擎 ws 一 杠三,面积是四十六平方毫米,集成了九十万个计算核心,四十四 gb 片上 sara 片上的内存贷款达到了二十一 p b, 每秒是英伟达 b 两百的 两千六百倍。这个数字意味着什么呢?意味着它在推理任务上快得离谱。实测数据显示,跑拉玛三点一小模型 cyrus 每秒能处理一千八百个 token, 而英伟达 h 一 百只有九十个左右,差了整整二十倍。为什么会差这么多呢?因为深度学习真正的瓶颈并不是壮丽,是数据搬运。 gpu 每读一次权重都要去偏 y h、 b、 m 绕一圈,而 cyrus 把 所有的数据都放在偏上十万里,物理上绕过了内存墙,这就是它的核心逻辑。推理速度才是 ai 落地的真正瓶颈, 但代价同样巨大,一整张金元做成一颗芯片,量率极低,金元上哪怕是一个微小的瑕疵,整颗芯片就报废。这就导致了它的成本居高不下,毛利率只有百分之三十九,远低于英伟达百分之七十以上,这也是市场最大的争议点。你的技术确实牛,但你能把成本降下来吗? 从财务数据来看,增长是炸裂的,二零二二年营收仅两千四百六十万美元,而到了二五年就干到了五点一亿美元,四年增长了近二十倍。而且 gap 口径下已经扭亏为盈,从亏损四点八二亿到盈利二点三八亿美元。 那你得看清楚啊,非 gap 口径下,主页其实还在亏啊,大约是七千五百七十万美元。 gap 盈利里有很大的一部分来自于一次性收益,也就是说,他还没有真正证明自己能持续的赚钱。 真正让华姐感到兴奋的不是财务数据,而是他的客户名单, openai。 今年一月, openai 跟 cyrus 签了一百亿美元的双利合同, 四月追加到了两百亿美元以上。与此同时, openai 还拿到了 cyrus 大 约百分之十的股权,把最大的客户变成了他的股东。此外, cyrus 还和亚马逊达成了合作,作为 channel 芯片的补充供应商,中东客户 n b z 和 g 四二在二零二五年合计贡献了百分之八十六的营收。 客户集中度极高,既是亮点,其实也是风景。公司批漏的积压订单高达两百四十六亿美元,如果这些订单能顺利地转化为收入,未来几年的增长曲线会非常的陡峭。那这次 i p o 为什么会这么火呢? 其实就两个原因嘛,第一,市场环境正好啊, ai 基础设施投资热潮处于峰值,双利短缺问题持续发酵,而 ropy 近期和 spacex 达成的双利采购协议就是最好的例证。在这种供需紧张局面下,任何与 ai 双利相关的标的都会被资金追捧。 第二,有参照物。去年上市的云计算公司 covid 以每股四十美元发行,尽管仍在稍前,但股价已经涨到了一百一十五美元。华尔街在评估 ai 相关标的时,愿意把盈利压力占着放一边,优先关注 ai 场口。 cedarbrace 的 蓄势比 cedarbrace 的 更性感,他不是卖算力的中间商,而是设计芯片的底层玩家。但机会的另一面永远是风险。首先是技术路线的不确定性, cedarbrace 的 推力速度优势是十大十大, 但英伟达不是吃素的。如果英伟达下一代芯片也能解决推理延迟问题,那 ceramics 的 差异化优势就会被大幅度压缩。其次是厂能开机垫两纳米,厂能极其紧张,而 ceramics 的 芯片面积是最大的,能否拿到足够多的配额目前并不确定。 再次是客户集中度,百分之八十六的收入来自于中东两百多亿美元的积压,订单里 openai 占了绝大部分,任何一个大客户出问题,都会对营收造成剧烈冲击。最后是估值啊,三百五十亿美元对应五点一亿的营收,市销率就已经来到了六十八倍。这个定价已经把 完美蓄势啊全部打了进去,任何执行层面的偏差都有可能引发剧烈波动。这是 ipo, 本质上是一次市场对于 ai 推理新架构的工头,如果成功,意味着花街愿意为差异化的技术路线买单,即使它短期之内不赚钱。 如果遇冷,则说明市场对于 ai 芯片赛道的热情已经开始从闭眼从转向挑着买。对于我们来说, sidebeats 不是 一个可以无脑买入的标的,它的波动会很大,它的故事需要被时间验证, 让它值得被放进你的观察列表。因为在这个 ai 基础设施重构的时代,每一次这样的 ipo 都是我们重新理解双利格局的机会。我是美刀哥,带你价值投资做时间的朋友。

大家好,我是美股豹哥。今天聊一家即将上市的 ai 芯片公司 siri。 先说结论, siri 不是 英伟大杀手,他真正赌的是 ai 从离线生成走向实时推理之后,市场会不会需要一种新的低延迟算力。如果未来三年 ai 主战场仍然是训练集群、通用 gpu 和 tpu 的 生态, 那 siri 布鲁斯很难正面挑战英伟达。但如果高价值应用从慢速问答变成实时 agent、 交互式代码、长输出和企业工作流,那 siri 布鲁斯的经元及路线就突然有了位置。先讲公司, siri 布鲁斯成立于二零一六年,总部在加州塞尼维尔,联合创始人兼 ceo 使 andrew falman。 他 最特别的地方是没有沿着做一张更强的 gpu 卡这条路走,而是把整片经元级引擎从 u 三公开,规格非常夸张,四万亿晶体管、九十万个 ai 优化核心、 一百二十五 fop 峰值 ai 算力。这些数字很抓眼球,但真正重要的不是大,而是把通信留在片上。传统 gpu 集群做大模型推理时, 很多延迟不是来自算不动,而是来自显存访问、跨芯片通信、网络调度和输出、 token 串行生成。 sirius 的 核心判断是,当模型已经足够聪明,用户愿意付费的,体验差异会从答案对不对变成答案快不快、涨不涨、能不能实时互动。 所以它卖的不是普通芯片,而是低延迟推理能力。这里有一个技术分歧很关键,把模型推理可以粗略分成两段,与填充,负责处理用户输入和上下文,适合并行计算 解码,负责一个 token 接一个 token, 输出更值内存、宽带和低延迟 a w u s。 和 sirius 的 合作,正好把这个逻辑商品化。 a w u s 四言 training 负责提示词处理, sirius cs 三负责输出生成,这说明云厂开始把推理流水线拆工种。 cybers 在 这里更像一个高端解码引擎,不是完整替代 awus 自研芯片,也不是完整替代英伟达平台。在看订单验证,第一条线是 openai, 公开材料显示, cybers 与 openai 有 七百五十 mw 低延迟推理容量合作, 相关容量将分批上线至二零二八年,这个协议价值超过两百亿美元,并可能在二零三零年前扩展到二极瓦。第二条线是 awus open 内爱证明顶级模型实验室愿意为速度付战略议价, a w u s 证明这种速度能不能通过云渠道卖给更多企业客户。如果 a w u s bedrock 上的企业客户愿意为 sirbus 的 低延迟推理买单, siribus 就 有机会从少数大客户合同 走向更可扩展的云服务收入。再看财务招股书显示, siribus 二零二四年的百分之四十二点三,剩余履约义务约两百四十六亿美元, 说明未来收入可鉴性很强。但这里不能只看订单,二零二五年 abzo y 贡献百分之六十二收入, g 四二贡献百分之二十四收入。二零二四年 g 四二单一客户贡献百分之八十五收入。也就是说, sirbrass 不是 靠大量企业客户自然分散涨出来的公司, 而是由少数大客户把收入曲线拉起来。未来欧盟内爱可能成为更大的单一变量,客户质量提高了,但客户集中风险没有消失, ipo 口径也要分清。官方公开区间是发行两千八百万股,每股一百一十五到一百二十五美元。 ruders 报道称,公司正在考虑把区间上调到一百五十到一百六十美元,并把发行股数增至三千万股。 但这个属于市场消息,还不是最终官方定价风险主要看四件事,第一,客户集中。中东客户和欧本内艾都是高质量客户,但单一客户变量太大,每个季度都会很刺激。第二,毛利率, 二零二五年毛利率不能上行,它更像资本密集型基础设施公司,而不是高毛利芯片设计公司。第三,交付复杂度。 晶源集芯片的优势来自大风险,也来自大良律。封装供电、液冷维修、排机电排产、数据中心上电都可能影响订单兑现。低次竞争不会停,英伟达不会放弃推理, a w u s google med 会继续自研芯片, rock 和其他专用芯片公司也会继续迭代。所以总结一下, threebrees 不是 英伟达的正面替代品。如果在产品继续从慢速问答走向实时斜坐长电路 agent 和企业工作流, threebrees 会非常重要。但要把这个位置变成长期商业价值, 他还必须证明三件事,按时交付、改善毛利率吧。 open 内外以外的客户做起来。你看好 siri bros 吗?评论区聊聊。以上内容仅供科普参考,不构成任何投资建议。

最近有一家美国公司很恐怖啊,得到了亚马逊、谷歌等巨头支持,让英伟达、台积电害怕的要死。谁呢?就是初创公司 cyrus, 绕开英伟达的 gpu 和台积电的两纳米之尘,用五纳米之尘直接在十二英寸整片金源上做一片芯片,结果它的推理速度是 b 二百的二点四倍,每偷看成本降低百分之八十。 为什么会这样呢?因为它芯片大呀,集成四十四 gb 高速 slam, 搬运数据的需求极低,内存宽带是 b 二百的两千六百二十五倍。 这样做还省电还省夜冷。天呐,这是在给光刻机授权的中国公司指路呢,直接做金元级芯片,国产现有能力就能搞定。我相信中国公司已经看到了。

在如今由英伟达绝对主导的 ai 算力市场上,有一家估值超百亿美元的美国独角兽企业 cerebrius 正试图用一种极其硬核的方式来打破垄断。照芯片的常规执行逻辑是把硅晶圆切成几百个小碎片,但 cerebrius 却反其道而行之,它把整块三百毫米的晶圆作为单一的芯片,面积是传统最大的 gpu 的 五十倍。那制造瑕疵怎么办? cerebrius 在 架构中设计了海量的荣誉, 一旦遇到物理坏点,控制流就会自动绕行。更关键的是,它直击一个核心痛点。 ai 计算中数据搬运的耗时与功耗往往是超过计算本身。那么 sirius 将四十四 g b 超高速内存和九十万个 ai 计算核心 紧密集成在同一张柜片上,实现二十一 p b 每秒极速带宽,一举砸碎算力底层的内存桥。同时,面对单芯片高达二十五千瓦的极限功耗,还设有垂直三 d 供电架构与定制水冷系统, 确保巨型芯片的满载下稳定运行。这些操作意味着你不再需要用昂贵复杂的网络去连接上百上千张显卡,直接打破了 ai 算力的极群诅咒。及其复杂的分布是切片与调度被简化为单台设备上的直接运行。 面对这种底层架构的挑战,英伟达目前的策略是继续巩固护城河,通过新一代架构和更高速的外部互联网络, 将传统 gpu 集群的效率推向极致。从市场趋势来看,虽然英伟达的生态短期内难以撼动,但 siri 思的成功标志着 ai 算命正在走向分化,未来的数据中心将不再只有单一的 gpu 形态。