deepseek v 四产业机遇深度拆解大家好,今天我们来聊一个市场关注度极高的话题, deepseek v 四带来的投资机会。目前的时间点是二零二六年四月初,市场对 v 四的发布预期正在增强,但我们做投资分析不能只看热闹,更要看门道。结合最新的产业调研和会议纪要, 我们需要厘清一个核心逻辑,这次 v 四的发布,本质上是一次国产算力全占适配的压力测试。 今天我将用最客观的数据和产业链逻辑,为大家拆解这次事件背后的算力链、应用层以及硬件端的三个核心机会。首先,我们要回答第一个问题,这次 v 四到底有什么不一样?根据产业链消息, deepsea 为了适配国产算力,专门推迟了 v 四的发布时间。这不仅仅是简单的兼容, 而是与华为韩五 g 深度合作,甚至重写了模型底层代码的部分模块。这里有一个关键的博弈点,大家一定要关注。我们需要等待 v 四正式发布后, 去确认他是全站适配还是仅推理适配。如果是训练和推理全流程都能跑在国产芯片上,这是国产算力的超级利好,意味着我们真正打破了卡脖子的训练环节。 如果仅仅是推理端适配,虽然也是力好,但力度和战略高度会相对弱一些。从性能上看,根据目前的辉度测试反馈, v 四在代码能力、多轮解锁等核心指标上,体感已经追平,甚至超越了 g、 p、 t 四点六,这种性能的提升将直接带动下游需求的爆发。基于上述逻辑,资金会流向哪里? 我们的策略非常清晰,核心仓位死磕国产算力卫星仓位关注 ai 应用第一,国产算力是核心主线,这是最确定的受益方向。如果 v 四能在国产芯片上跑起来,意味着国产算力从可用走向好用,训练和推理的需求将呈指数级爆发。 产业链的导导顺序是芯片、服务器、配套设施。第二, ai 应用是事件驱动, v 四的强大性能会加速 a 阵的落地, 企业级应用渗透率会提升。对于 a 股的应用板块,这会带来普涨的事件性催化。但请注意,今年的投资策略和去年不同,我们不再单纯看谁的故事讲得好,而是看营收和利润双提速的标地。只有那些真正利用 ai 降本增效,并在客户侧拿到业务增量的公司,才是真正的机会。 接下来,我们深入硬件端,看看具体的产业链机会。目前的焦点是华为升腾九五零。根据调研,这款芯片目前处于小批量测试阶段,预计今年出货量在六十五万片左右。 性能定位,他的单卡算力虽然在绝对数值上可能弱于含五 g 的 部分型号,但他在互联带宽和生态上具有优势。价格预期在七点二万到七点五万人民币之间。性价比,从理论吞吐量和性价比来看, 升腾九五零目前在国产卡中处于领先地位,将是未来两年国内算力积淀的中流砥柱。基于此,产业链的传播逻辑如下,芯片端核心关注华为升腾系和韩五 g。 服务器端随着芯片放量,服务器厂商将直接受益,如神州数码、蜂火通信等 配套设施,这是一个容易被忽视但极具弹性的环境光模块,天福通信、华工科技、夜冷、英维克、高端股份连接器、航天电器,特别是其高速连接器业务,目前已有新进展。 最后,我想提两个容易被市场忽视的隐形机会,第一个是 cpu 的 涨价预期,这听起来可能有点反直觉。随着 ai 需求的爆发,通用算力 cpu 也开始供不应求。 英特尔、 amd 的 消费级 cpu 近期已经出现了百分之十到百分之十五的涨价,这说明算力紧缺的逻辑正在从 gpu 向 cpu 传导,这是一个值得我们关注的边际变化。第二个是模型厂商的估值逻辑。 以前我们看软件公司看 ps, 但现在看 ai, 模型公司未来要看毛利,谁能通过更高效的 toc 提供服务,谁的毛利率越高,谁的估值上限就越高。
粉丝2.6万获赞4.8万

上回啊,咱们说到 tips, 应该是在憋大招,那憋了这么久的 v 四到底会有啥本事呢?今天我来根据互联网上已知的资料给大家预估一下。第一,就是万亿参数级别, v 四一定是定位万亿参数级的巨型基础表现, 比 v 三要大的一个数量级。第二,一百万 token 的 上下文,这意味着新的 deepsea v 四,它能一次性吞下好几本书或者一个超大型的代码库,然后进行深度逻辑推理。三 就是原生的多模态, v 四一定不是简单的 v 三升级版,而是全新的价格原声,这是图片、视频和文本的联合理解与生成。更劲爆的是啊,据内部测试, v 四在编程任务上的表现已经超过了科考德的 gpt。 前段时间还有网友在 open rooster 上发现了两个神秘的模型。一四是 v 四的预览版,其中一个的描述是具备视觉、听觉、推理与行动能力的前沿全模态模型。另外啊, 根据 deepsea 团队近几个月公开的研究报告,其实也揭示了一部分 v 四的技术方向,就像二零二五年十二月,有一篇论文提出了优化全方面的论文,提出了条件记忆技术。 同月, deepsea ocr 二发布,让 ai 能像人一样因果式的阅读文档,而不是机械的扫描,这几条线 很可能在 v 四里边进行会合。据说 deepsea 掌门人梁文峰过去半年的主要工作就是普及 deepsea 在 长期记忆上的短板。什么意思呢?就是现在的 ai 聊着聊着就失忆了, 忘了前面说了啥, v 四要解决的就是这个问题,让 ai 能够真正的记住,能够处理超长任务,这么看技术功能是不是会变强了很多?但是性能能不能跟上呢?甚至还能有所提升?我是老林,关注我,下回接着聊。

美国的出口限制难道真要沦为笑话? dbc 给 v 四准备用实际行动告诉全世界,禁令无效。即使未来英伟达完全断供,梁老板的 ai 进化也不会停下一秒钟, 因为他们马上要宣布全面采用华为升腾方案,拒绝向英伟达、 amd 开放测试权限。这有点意思,是一次极其硬气的全站国产宣言。这意味着国内在大模型最核心的通信效率和内存读取上, 已经有了硬钢顶级芯片的底气。星际在杭州朋友透露,过去三个月 deepsea 闭关重写底层代码,就是为了让 v 四能在华为芯片上丝滑运行。而且结果出人意料,性能指标完全对标国际顶尖水平。 除了华为,韩五 g、 思源、五九零也同步完成了适配,多模态性能提升了三倍。正式公开数据,大家看看星级的信息有没有错?通常大家认为出口限制会拖慢中国 ai 的 脚步,但现实刚好相反,限制反而成了最强催化剂,逼着 deepsea 这种全村希望型的公司去搞自主创新, 结果就是他们用更低的成本跑出了更高的效率。这件事最深的影响是中国 ai 铁了心要走向了自主可控。 以前我们担心算力被掐断,现在我们正在构建了从芯片框架到模型的完整闭环,政务、金融等核心领域已经开启大规模测试。 二零二六年毋庸置疑是国产算力的彻底爆发元年。这件事的本质是生态霸权的转移,当中国顶尖的大模型不再以兼容英伟达为荣,而是以适配国产芯片为先时伸远的看,英伟达在中国 一护成河就正在被瓦解了,未来十年我们看不清,但是未来一年我建议开发者关注一下升腾生态的算力库,这会是就业项目资金的风口。你觉得国产 ai 芯片今年能拿走英伟达多少市场份额?星际带你抢跑 ai 大 时代。

本周 ai 大 事件, deepsea v 四的中国芯,据多方消息显示,预计即将推出的 deepsea v 四有望优先全面适配华为升腾九五零 p r 芯片。这意味着顶尖量级的大模型有望在国产芯片上实现核心推理与运算, 将关键算力环节一托于国产算力底座这件事的意义,真正回答的是一个比跑分榜单参数更大的问题,中国的大模型能不能真正站在中国自己的芯片、自己的软件,站自己的算力生态上跑出世界级能力?这一步的价值,比任何一次参数翻倍, 任何一张排行榜第一都更重。过去几年,全球前沿大模型的底座几乎被硬伟达斜死了, openai 背后是硬伟达, antropica 背后是硬伟达,几乎所有顶级模型训练、推理部署绕来绕去还是美国芯片和美国软件生态。 这就意味着,你表面上是在做模型竞争底层,其实是在别人修的高速公路上飙车,路能不能走、车能不能开快、收费多少,什么时候限流都不完全由你决定。 而 deepsea 卫士这次他干的就不是一次普通升级,他是在试图把中国大模型从会做模型推进到会做完整体系。为什么非得这么做呢?因为 deepsea 比谁都清楚, 就算你的算法优化的再逆天,只要你还趴在英伟达的算力底座上,就永远逃不开西方的傲慢与偏见。大家一定还记得,二零二五年, deep sec v 三发布震动全球,美国舆论一边惊叹 v 三的强大性能和成本优化,一边质疑 deep sec 利用美国的底层技术红利才堆出来的成绩, 所以只要还在用枯的生菜,哪怕你只用最低配的特工卡,你在别人眼里也永远低人一等。而这次 deepsea 就是 要用完全体纯写的国产算力,向全世界打个名牌。中国的顶级大模型,绝不需要靠什么国外显卡来续命,我们完全有能力在自己的地基上盖起万丈高楼。 这次 v 四的几次延迟,恰恰是因为他在做一件更难也更值得等待的事,把一个前沿级别的大模型,从英伟达扩大体系迁移到国产芯片和国产软件站上。 这根本不是换个驱动那么简单。底层算子要重写,通信库要适配,内存调度要重构,推理框架要重调,编异器驱动、集训稳定性、开发工具链全都要重新磨合。 这是换地基,是把一整套工业体系重新搭起来。所以 v 四晚一点,但换来的是一个更完整、更自主、更稳定的国产模型加国产芯片完成体,那这份延迟不是坏消息,反而可能是最值得尊重的耐心。真正决定一个国家 ai 上线的,从来不只是一版模型参数, 而是模型、芯片、框架、变异器、云平台开发者、生态产业落地,能不能合在一起形成壁环。 deepsea 个 v 四的意义就在这里。 第一,他证明了国产芯片不是只能凑合用,而是有机会承接前沿模型。以前大家总觉得国产芯片可以跑一些中小模型、边缘场景、定制化任务,但真到最前沿的大模型,还是得靠英伟达。 如果 v 四在升腾上实现高质量推理,甚至未来进一步推进训练链路迁移,那他就真正证明了国产算力走向了主战场。第二,他会带动整个产业链飞轮转起来。 因为一个前沿模型一旦真正跑通国产芯片,后面就不止是 deep ck 一 家公司的事了。阿里、腾讯、字节这样的云厂商会跟进部署, 开发者会围绕这个生态做应用,企业客户会把需求导向本土基础设施,芯片厂商会拿到更大订单,变异器和框架团队会得到更多真实场景去打磨产品,这就是飞轮效应。 以前是没有模型,所以生态起不来,以后则变成因为有了前沿模型,整个生态一起起飞。第三,他重新定义了领先这两个字。 什么叫领先?是榜单上多拿几分,是参数更大一点,还是成本更低一点?这些当然重要, 但真正高维度的领先,是你不再只是做一个孤立的模型,而是开始构建自己的技术主权。当一个国家、一家公司能把模型和芯片协同设计,把训练和推理逐步放到自己的体系里,把开发工具和应用生态一点点补齐 完整。体系一旦成型,它带来的护城河是长期的,是战略级的,这种领先才是真正的领先。当然,我们也要保持理性,今天谁都不能说国产芯片已经全面追平英伟达, 无论是单卡性能、万卡集群、通信效率、开发者生态成熟度,还是工具链的丰富程度,差距依然存在。 dpc 归四,如果成功,也不意味着一夜之间就全面替代,它更像是一个关键拐点,不是宣告终局,而是证明这条路真的走得通,这就足够重要了。 这里是起点世界,支持 dpc 和国产算力自主的请点赞转发给你的朋友,我们下期视频不见不散!


如果 deep six v 四这个月还不出来, ai 区一半的 up 主都要被狼来了这三个字送走了。你先别划,我后面要讲一个更刺激的,这次大家看到的灰度按钮,可能压根不是你以为的那个王炸版本, 而是一次很典型的铺路动作。顺手先说一句啊,关注我后面这种 ai 圈,半夜放风,早上炸锅,中午辟谣,晚上复盘的局,我给你盯着。大家好,我是杜宇,带你看懂 ai 赛道的钱和事儿。 先说事实,今天 it 之家发消息说梁文峰在内部沟通里透露啊, deepsea v 四会在四月下旬正式发布。注意啊,我这里说的是媒体原音内部沟通,不是 deepsea 官网正式官宣啊。所以这条消息你可以高度关注,但先别直接当红头文件盖章。 deepsea 的 同学如果刷到这条视频来评论区回我一下, 我今天纯属替全网催更。但说真的呀,这事现在已经有点狼来了那半了。最近几天大家都在盯 d p 个新版的灰度,结果很多人一上手,第一反应不是经验,而是就这我自己刷下来,包括很多用户测评,最明显的感受就是两个字,分层网页端。现在公开能看到的主流还是闪电和钻石这两个按钮, 一个偏快,一个偏复杂任务。可问题来了,有网友又给我发了五个按钮的版本,还有扮演模式、视觉模式、代码模式。所以我也想问问你们,你们到底被挥霍了几个按钮啊?打在公屏上, 我想看看全国网友到底谁是天选内测人。我自己现在的判断很简单,这一版先别挠,补成 v 四全面降临,更像是产品架构再重搭地基。哎。你看他的方向很明确,一个是把用户分层,轻任务走快,难任务走深。那个是把后面的 a 字的能力先埋进去。 p c 官方后续公开版本也一直在强调工具调用和 age 的 能力,这说明啊,行业已经不满足,会聊天都在充会执行。还有一个很现实的点,很多人猜,这波也在给全国产化适配铺路。因为真正往正企行业、国产芯片环境里走, 拼的就不只是榜单成绩了,还得拼部署成本、稳定性、兼容性。说白了呀,能打和能落地中间隔着一条护城河。所以我建议大家对这轮灰度稍微控一下预期,别一看见新按钮就以为明天直接把全球前排全断了。现在海外头部模型已经卷到快 g p t 六这条线了。 国内这边也不是 deepstack 一 家公司在跑,阿里的坤三、百度文星五点零月占面的 kimi k 二点五,再加上腾讯混元豆包,这些都在拼模型能力、工具链和应用入口。今天这场仗已经不是单点模型的升级了,是全战能力、产品节奏和生态卡位一起打。 从投资的视角看,这事更有意思。 deepsea 每往前一步,一级市场和二级市场都会一起抖一下,为什么呢?因为它会直接改写市场对国产大模型的定价逻辑。以前投模型,很多人看故事,看参数,看谁更像中国版的 open ai, 现在不太一样了,资本越来越看三件事,第一,你能不能把能力稳定跑出来。第二,你能不能真正接住 agent 这部商业化。 第三,你有没有机会把成本打下来,变成一个可复制、可部署、可结算的生意?一旦 v 四真出来,而且不是实验实验化,而是性能、成本、产品化,都往前拱一大步的话,那质谱、 minimax、 月值、暗面,这些公司的估值预期一定会被重新拉扯, 头部会更贵,中央部会更难,市场会更任强者恒强,也更不愿意给差一点意思的公司留耐心了。 讲得再直白一点儿, v 四如果真能打,影响的不只是 deepstack 自己,而是整个国产模型圈的时间表都要被迫提前,大家会更快上强推理更快上多模态更快上 agent 更快往行业方案和企业付费冲, 谁还停留在我也有个聊天助手,那基本上就是在 ai 牌桌上端茶倒水了。所以这条消息最值得看的不是四月下旬这四个字啊,而是它背后的信号, 国产大模型竞争已经从有没有进入到了谁先形成闭环,闭环一旦跑通,模型公司就不只是技术公司了,它会开始长出平台溢价、生态溢价,最后才是资本市场最爱听的那三个字,稳定性。 最后我还是那句话,别神话,也别看清 deepsea。 要真的把这一步走出来,受影响的不会只是 ai 圈的热搜,可能是未来两三年中国大模型产业的排位赛。 qq 四到底是真狼来了,还是又一次集体空耳呢?我们一起盯 deep six 的 同学啊。评论区给个准话,被灰度到五个按钮的朋友也别藏着了,发出来让我开开眼。点关注不迷路, ai 搞钱,我带路,我是杜宇,咱们下期见!

deepsea v 四四大升级预判?大家盼了很久的 deepsea v 四马上就要来了,结合日内消息和当前大模型趋势,我大胆预测一下, v 四版本将会有以下四大升级, 第一,网传编程能力相比上一代会有大幅突破, acb 一 b 只是权威编程机制,网传 v 四得分百分之八十三点七,超过 gbt 五点二, cloud 二 or 四点五,如果数据准确的话,就是国产大模型首次在这个指标中表现突出。 第二,百万头等上下文, gpt 四欧月十二点八万, clas 四约二十万, v 四直接到一百万,记忆准确率很高,一次性读完整本书,整套合同不用分断,企业知识库,法律审计效率会大幅提升。 第三,成本会再次大幅下降,新架构 roe 二点零,推利成本仅为 gpt 的 七十分之一,中小企业月成本往常可控制在千元内,保持 dyp 一 贯的高性价比路线。 第四,深度适配国产芯片,网传对升腾含五 g 海光适配率很高,升腾优化后速度提升明显,国产大模型加国产芯片形成技术壁环,数据安全层面将会有大幅提升。以上仅是个人技术预判,一切以官方发布为准。

hello, 大家好,非常激动,刚到家就给大家录视频。我有一个非常惊天的发现, deepsea v 四应该已经上架 api 端了。就在前几天,它已经上架了手机端和网页端的聊天儿灰度测试。 然后就在今天四月八号,手机端和网页端已经可以开启专家模式了,这证明 deepsea v 四已经上线了。抱着试一试的心情,我对 deepsea v 三点二进行了测试,发现它的数据跑分能力远超 jammer, 打平 os 超过 solit 四点六。好的,具体怎么操作的,我现在坐到电脑面前给大家看一看。 好的,我回到了电脑前,我被逼着要换模型做 open cloud 的 底座。于是呢,我就对国产四大模型进行了一个评测,我订阅了国产所有模型的 call 定 plan, 因为我这个人比较偏执,我要用就一定要用尽可能好的。当然, 如果使用 cloud code 的 a p i 的 话就太贵了,分分钟钟五万美金,十万美金就没有了。我用 oops 对 它进行一个测试,以及对所有的一个模型进行一个全量的测试。好的,那我们给大家看一下。最后我让这个 ops 进行了一个测试。 ops 的 测试一共是八个模型,二十四道题的一个全面的测试,而且它还使用了一个交叉互评最后的得分。从理科上来看, deepsea 和 ops 是 持平的,数学和编程是持平的,而且它们遥遥领先国内的别的模型,甚至遥遥领先 cloud 四点六模型。但是有一个有一个重点,就是它们一分之差啊, 但是它们的价格是差很多的, deepsea 的 a p i 调用的费用只有 opps 费用的六十分之一,非常非常的便宜。 ok, 这就是本期的一个测试内容了,简单的来讲, deepsea v 四一定是最好的,一定 带来颠覆性的改变。接着我给大家看一下,把它融入到我的工作流之后还我还跟他说,竟然 deepsea 给我去 ai 网,去完 ai 网之后, 他又给我做了一做了一批,做了一批之后后还给我生成了六张漫画,大家感觉感受一下。怎么样 漫画呢,就可以让我发图文社交媒体了,我觉得这个还是很不错的,对不对?简单的说,我用 kimi 的 api 来生成了一个简单的网站来展示这个评分,我觉得它太简单了,不过也还可以,该说的都说了,只是没那么深层。 然后呢,我让它固化成一个 skill。 把它固化成 skill 之后呢,以后我再生成类似的网站,我就不需要用 cloud code 了,我就可以用 kimi 直接进行生成了,这样成本就打下去了,这也算是一个干货,大家觉得有用的话 给我点赞。另外呢,视频也预告一下,我们的网页版 tipsy 已经可以做可以玩的游戏了,非常的强啊, 非常的强,可以做能玩的游戏。下一期视频我就详细给大家说一说。好的,点击关注,点击赞,拜拜!

deepsea 微四巨报导,将运行在升腾芯片上,并且打破 ai 行业多年来的惯例,没有给英伟达和 amd 提供新模新的早期访问权限。巨报导,仅华为、字节、腾讯三家的批量订单就达到了数十万颗升腾芯片, 升腾九五零 pr 芯片价格在几周内上涨百分之二十,出现供不应求的状态。考虑到 ai 算力市场的巨大缺口和国产替代的破解性,升腾系列芯片的市场空间获得千亿级别。下面是升腾产业链梳理,首先是华丰科技,某为哈伯投资企业,升腾 ai 服务器高速连接器核心供应商, 二百二十四 g 高速产品全面适配深腾九五零 p r 超节点架构,供货份额行业领先。然后是拓维信息,深腾钻石级战略合作伙伴、自研照焊级 ai 服务器,深度适配 deepsea v 四大模型, 深腾芯片出货量占比约百分之三十,以及承接国家级智算中心和互联网厂商核心订单, 国外高新发展空谷划空阵雨,持股约百分之七十。盛腾服务区市占率稳居行业第一,是智捷、阿里等互联网巨头数十万颗盛腾芯片采购的核心供应商,深度适配 deepsea 威斯大模型。今天到这里,点点关注,明天见!

deepsea v 四将搭载华为芯片!这则重磅消息近日刷屏了海外 ai 圈。而我最感叹的是呢,一个曾被金融时报断言训练环节遭遇技术瓶颈的团队,凭什么能在短短八个月内,不仅完成了国产算力的深度试派,还让阿里字节、腾讯等巨头 纷纷提前下单华为芯片,为 v 四的大规模部署做准备。今天啊,咱们就从头梳理这场中国 ai 产业链的双向奔赴。 首先啊,我们把时间线捋清楚,今年二月二十五日,路透社呢,就报道了一个反常的信号, deepsea 没有按照行业惯例把即将发布的新模型呢,提前交给英伟达和 amd 做适配优化, 而是先给了华为等中国供应商。这在以前啊,是不可想象的。你做大模型不先找英伟达,这说明啊, deepsea 在 有意识地把技术路线往中国算上靠。 然后呢,到了四月三号,消息啊,进一步明确, v 四呢,将直接跑在华为最新芯片上。华为这边呢,也没闲着。今年三月,华为就在 mwc 巴塞罗那发布了 atlus 九五零超节点一百二十八个机柜 f p 八算力呢,达到八个 xflops。 这不是实验室的产品,这是冲着大规模商用去的基础设施。与此同时呢,华为啊,明确写了升腾深度适配 deepsea, 华为云也把 deepsea 接入了 mass 平台, 基于升腾做了推理优化。所以啊,这不是孤立的世界,而是整条产业链同时动了起来。那么,为什么说这一次不一样呢?过去几年啊,中国 ai 最大的痛点是什么?不是没有好模型,不是没有好芯片,也不是没有市场需求,而是啊,这三件事,从来没有真正的闭环过。 模型很强,但可能呢,跑在英伟达的卡上,芯片做出来了,但顶级模型不愿意花时间适配。 云平台搭好了,但缺少最硬核的业务场景来压测。每一个单独环节啊,看来都有进展,但串不起来,就形成不了体系。这一次呢, deepsea 和华为啊,恰恰把这几个最难的环节给接上。 deepsea 证明了一件事, 中国团队啊,不只是能跟跑,还能在模型架构和训练效率上做出原创性突破。 v 四呢,预计采用万亿参数的稀疏 m o d 架构,每次推理只激活大约三百二十亿参数。 这种用更少算力做更强模型的思路啊,本身就降低了对最顶级美系芯片的绝对依赖。 华为呢,证明了另外一件事,国产算力不再只是停留在 ppt 上。升腾芯片、 c a n n 框架、集群互联云交付,这些过去总被认为还 还差那么一点儿的东西啊,现在正在被顶级模型和头部客户真实需求一起往前推。当 deepsea 主动选择华为,当阿里自洁、腾讯跟着下单,这就不是政策驱动的国产替代,而是市场驱动的生态闭环。 说到这里呢,我还是要给大家泼一点冷水。去年八月金融时报报导, ibisc 在 用华为升腾芯片训练 r 模型的时候呢,遇到了技术问题,最后的方案是英伟达负责训练,升腾负责推理。这说明什么呢?说明在最前沿的大模型训练这个环节上啊,华为和英伟达之间还有差距, 这个差距呢,不是一两代产品能抹平的。而且啊, deepsea v 四到今天还没有正式发布,官方最新版本仍然是 v 三点二。所以呢,一切还在验证阶段。别把预期当成现实。 最稳的判断是,中国在推理部署、生态适配、供应链自主化上影面已经很大了,但在最顶级的前沿训练上,仍处于追赶和验证的过程中。 最后啊,帮大家划三个重点。第一呢, deepsea v 四选择华为芯片,标志着中国头部 ai 公司开始主动向国产算力倾斜, 这不是被动替代,是主动选择。第二呢,真正的意义不是某个芯片参数超过谁,而是中国第一次有机会把顶级模型、国产算力、软件站、云平台和大厂订单串成一个能自循环的体系。 第三呢,训练端仍有差距。别把进展说成胜利,但方向已经明确,趋势啊,已经形成。

放弃全球霸主英伟达,中国最强 ai 大 模型 deepsea 上演史诗级倒戈,这背后是一场不得不打也必将打赢的国产算力突围战。由于之前博主已经发布过关于 ds 四的相关视频,本期我们再来梳理一下。 对了,本次提到的所有公司都只是基于公开资料客观整理,均不做推荐。由于部分涨幅过大,请各位注意风险。二零二六年四月,中国 ai 领域投下了一枚重磅炸弹, 被誉为国产之光的大模型公司深度求索正式宣布其下一代旗舰模型 v 四将全面迁移至华为深腾九五零 p 二芯片。 这不仅仅是芯片供应商的简单更换,而是一次从底层开始的灵魂迁移,其计算框架从英伟达统治性的 c u d a 彻底切换到了华为自研的 c a n n 架构。 这一操作标志着国产 ai 算力生态取得了历史性突破。它首次证明,千亿参数级别的顶级大模型,其核心的推理任务可以完全脱离以英伟达为核心的西方技术体系,运行在自主可控的国产芯片上。 距今,阿里等大厂等云巨头已紧急向华为下单数十万颗深腾九五零 pr 芯片,已备战即将到来的 v 四服务部署浪潮, 一场由头部模型厂商引领的国产算力转正大潮已势不可挡。 deep seek 的 导歌并非一时冲动,而是多重压力与机遇下的必然选择,深刻反映了当前 ai 产业的核心矛盾。 ai 产业的游戏规则已变,从简单的问答对话演进到能自动编程执行复杂任务的智能体模式,导致 token 消耗量呈现指数级增长,全国日军 token 调用量已突破一百四十万亿,两年激增上千倍。 这种爆发性需求对算力的规模和效率提出了空前要求。全球高端 ai 芯片供应持续紧张,且受地缘政治影响,对中国企业形成严重质疑,即便可供货的特供版产品,在性能上也存在差距。 算力这个 ai 时代的石油,其供应链安全已成为国家与产业发展的生命线。经过数年追赶,以华为升腾为代表的国产芯片性能已实现质的飞跃升腾九五零 p 二专为推理优化,在适配后可使 deep six v 四的推理效率提升百分之一百八十七。 更重要的是,在算力成本成为核心支出的 token 经济时代,国产芯片展现出显著的性价比优势,为面临算力焦虑的企业提供了可靠替代方案。从芯片框架到模型应用的自主可控 ai 生态是中国赢得未来科技竞争的关键。 deepsea 的 迁移正是响应这一战略的标杆性实践,它向整个产业证明,基于国产算力全站技术,不仅能跑得通,更能跑得好, 从而极大增强了行业信心,将带动从硬件到软件的国产化替代进入加速道。 deepsea v 四的迁移如同一声发令枪,宣告了国产算力黄金时代的来临,其机遇并非孤立于芯片,而是贯穿基础设施、软硬件协同的完整产业链。 例如,以华为升腾、海光信息、韩五 g 等为代表的国产 ai 加速芯片是算力的心脏。 在训练靠英伟达推理用国产芯的格局下,国产推理芯片需求率先爆发。同时,在易构计算成为主流的背景下,国产 c p u 在 任务调度、流程控制中的核心作用凸显。受益于信创替代与性能提升,同样进入量价齐升通道, 升腾下一代芯片、韩五 g 新产品等路线图将持续提供催化。至于国产算力的相关公司,各位可以参考我之前的这几个视频,或者加入我的专属会员获取。 总结而言, deepsea v 四转向华为升腾远非一次简单的供应链切换,它是一个强烈的信号,标志着在 token 经济引爆的算力即可证下,叠加自主可控的迫切需求,国产算力生态已从点状突破,进入系统崛起的新阶段。

大模型公司不优先适配英伟达,反而集体导向国产芯片?这种反常识的操作,背后藏着怎样的财富密码? 四月四日消息, deep seek 即将发布的新一代大语言模型 v 四,以基于华为等国产 ai 芯片完成深度优化。过去数月, deep seek 与华为、韩五 g 密切合作,对模型底层程序进行了调整与重写。 这一次, deepsea 打破行业惯例,没有向美国 ai 芯片供应商开放测试,而是将国产芯片置于优先位置。大家想一想,这为什么值得高度关注? 因为这是模型研发逻辑的根本性逆转。在 ai 大 模型这场游戏中,硬件和软件从来都是硬币的两面。 英伟达之所以垄断市场,靠的不仅是芯片算力,更是长达十年的软件生态壁垒。 c u d a 大 模型在英伟达芯片上运行测试、优化,整个训练和推理流程早已深度绑定。 deepsea 这次操作意味着什么?意味着他们主动切断了对 c u d a 生态的路径依赖,用算法工程能力去适配国产硬件。 其实逻辑很简单,过去是英伟达造路,大家开车,路是英伟达铺的,你要换条路跑,性能立马打折。但 deepsea 过去数月,联合华为、韩五 g 把底层代码重写了一遍,相当于自己修了一条适配国产芯片的路。 当算法主动适配硬件,国产芯片的短板就不再是不可逾越的天堑。更重要的是,下游巨头已经用脚投票。报道显示,阿里巴巴字节跳动,腾讯为应对 v 四云服务上线需求,已提前向华为下单数十万颗新一代 ai 芯片。这意味着什么? 意味着这不是 deepsea 一 家企业的独立选择,而是一个正在成型的产业共识,这对整个行业格局将产生深刻影响。第一,国产 ai 芯片的商业闭环正式形成。过去,国产芯片最缺的不是算力,而是真实的大规模应用场景去验证、去迭代。 deepsea v 四的推出,等于为国产算力提供了一个顶级的大规模实战测试场,这正是加速芯片性能追赶的催化剂。 第二,推理市场将成为国产芯片的主战场。据机构预测,二零二六年将是中国算力需求从云端训练向训练加推理双轮驱动转型的关键之年。 deepsea 还同步开发了两款针对不同场景的 v 四衍生版本,同样基于国产芯片设计。当推理测大规模放量,国产芯片的市场空间将被迅速打开。 那么,在这个逻辑导路径上,哪些环节会率先受益?沿着模型适配、芯片放量、算力激进这条线索来梳理,第一环最直接的受益者是核心国产 ai 芯片厂商,特别是与 deepsea 深度合作的标的 韩五 g, 凭借思源系列云端 ai 芯片的领先性能,已实现商业化落地,二零二五年营收大幅增长,净利润扭亏为盈。华为升腾九五零 p 二处理器的 atlus 三五零加速卡, 单卡算力达到 e p f lops。 第二环,互联芯片与服务器配套环节,大规模 ai 级群离不开高速互联技术。华为基于升腾九一零 c 已推出 cloud matrix 三八四超节点, 有效算力利用率可提升百分之五十以上。随着 ai 芯片出货量持续增长,高速互联芯片如圣科通信、蓝启科技和背板连接器如华丰科技、易华股份将迎来增量需求。第三环,模型应用测的生态厂商 deepsea v 四以针对国产芯片完成深度优化,这将带来软硬件协调效率的提升。相关标地包括每日互动、浙树文化等。 回到开头的问题,当大模型主动拥抱国产芯片这条逆行者的道路,正在打开一个万亿美元量级的市场, deepsea v 四只是第一块多米诺骨牌。接下来我们要看到的是整个国产 ai 算力生态从能用走向好用的历史性跨越。

据 information 爆料, deepsea 呢,我将在今年的二月中旬就是春节的前后发布。新一代的模型是由 v 四, v 四呢,属于它的一个积木,在这基础上呢,我们可能会一并地推出,或者是很快就会推出 r two 就是 它的虚拟模型。那 v 四的重点在于什么呢?很多人的预测呢,是在编程能力上会有所突破, 用编程呢,是目前类似 cloud 这样的顶级模型最核心的差异化优势。目前的 adopic cloud 依然是全网公认的编程之王,想要打败它不是一件容易的事情。首先可以讨论一下关于 deepsea 的 宣传的一个策略。按照去年的爆火的节奏呢,春节是一个大家很容易情绪高涨的时间点, deepsea 去年阿一的重磅出世了,全网掀起了巨震,在 全球范围之内,大家的目光都放在 deepsea, 所以呢,这个是被证明是教科书籍的节奏,讨论密度,传播强度,收集反馈全部都拉到了峰值。 我相信了 deepsea 呢,也会尝试重新复制这样的一个时间窗口效应。在过去的一年, deepsea 在 没有推出大的迭代的基础上,从 v 三到 v 三点一到 v 三点二,基本上呢,可以看到,在没有一个真正的重大的腕带模型基础上,已经实现了部分能力的反超。比如说 aimee, live code bench, hle 这些呢,基本上都已经超越了所有的开源模型,甚至很多的闭源模型。那 v 四呢,被赋予了比以往任何一次 迭代都会更高的期待。那 v 四具体可能会哪些能力的提升呢?首先肯定是刚说的这个编程能力,那知情人透露了 deepsea 内部的初步的精准测试显示, v 四在编程任务上表现出超越了目前的主流模型。那这个能领先多久不知道,但是至少呢,我们在春节期间呢,希望能看到它是登顶整个的编程的贴 常做的第二个,所有的工程师,包括做 a 证的创业公司,最期待的创业模型的能力就是上下文的处理长度。现在毕业模型对于创业模型最大的差异就是上下文的处理长度是很长的,这个是在编程以外的一个很核心的一个需求,目前是否能从一百二十八 k 甚至二百五十六 k 涨到一 m 甚至两个 m, 对 此顾占多大能力,这我们是非常期待的。其他的一些能力,我们看到最近的一些论文,可能已经有一些引射了,比如说有关 mhc 的, 我之前也分享过,叫做 manifold constraint hyper connections, 是基于何凯明的 r, s, n 和字节的 apple connection 基础上的一个不衰减,就能实现更可靠、更严密的这种运营能力的提升。我们希望在 v 四上面 d p c 通过算法的升级能看到的一些前沿性能优势。 当然还有些问题呢,我们作为创业者,作为使用者来说是很关心的,比如说是否会有真六版本,一些小版本,针对不同的场景的一些类似千万的,从十币到三十币到八十币的小的真六版本模型, 论是 dance model 还是 mv 模型,对于我们后续来说价值是很大的。那目前呢,在 l m arena 上已经有些神秘的身影,据说是 v 四已经在野测了,当然这个呢,只是一些用户的猜测,期待今年春节 deepsea v 四的风采。

做大模型的还在烧钱,但给它们供电、供芯片、供散热的环节,利润已经在往口袋里跑了。 deepsea v 四马上要上线, 但真正值得琢磨的不是模型本身,而是它背后那条国产算力供应链,利润正在重新排坐。次,今天我把这条链从头到尾拆一遍, 先聊这件事本身。 v 四这次选了华为升腾九百五十座深度适配,推理速度比上一代快了大概三十五倍,功耗还降了四成左右。但真正有意思的是,他们没给英伟达和 amd 流预测试的机会。你想想,这在以前不太可能发生。 国内做大模型的公司,多少都会检谷英伟达的生态,但这次不一样,头部团队直接把国产芯片当成了第一优先级来做优化,这个信号的分量比参数量本身大得多。 深圳 9 8 5 是 到底什么水平?我对着三数表看了一下,算力和显存容量比英伟达 h 一 百要高一截,能效比大概是它的一点八倍。但有个短板,很明显,内存宽带差了将近一半。华为的解法不是死磕单芯片,而是搞超大规模组网,八千一百九十二张卡对成一个超节点, 总算列能到八个 e f l o p s 跟英伟达 n v l 一 百四十四的集训比,规模优势很突出,简单说就是单挑,可能还差点意思,但打群架,华为现在有底气了。 反过来看英伟达在中国的处境,就明白为什么这个切换正在加速。出口管制收得越来越紧, h 二百到现在还没批下来, 每个季度因为管制少,赚的钱大概在八十亿美元这个量级。更难受的是 h 二十为中国专门做的低配版,库存积了四十五亿美元都卖不动。你换个角度想, 当头部客户已经主动选择了国产方案,这个趋势再想掰回来,成本和难度都不小了。芯片环节的变化大家容易看到,但真正在闷头赚钱的是中间环节。叶冷这个赛道今年一季度的订单同比翻了两到三倍,原因很直接, a c i 训练的功耗太高,风扇根本扛不住,新建的支算中心基本全用夜冷了,渗透率已经超过了七成,光模块在放量,八百 g 今年预计出四千万只一点六 t 也开始起来了,但这里有个分化,要注意,国内做夜冷的玩家太多,价格战已经打起来了, 毛利率被压到了百分之十的百分之四十这个区间,海外动画能做到百分之三十的百分之四十,跑得快不代表都能赚到钱。 我把这条链的利润结构理了一下,芯片环节目前溢价能力很强,因为能做的就那么一两家,供不应求,想买得排队。规模快,技术门槛比较高,从八百 g 往一点六 t 迭代,能跟上的也就那几家,所以毛利率还能守住接近百分之五十。叶冷虽然量大, 但进入者也多,毛利率已经在往下走了。下游的数据中心和云计算平台需求缺口很大,大概有十五到十六 g w, 但建设成本被上游吃交了不少,利润空间反而不宽裕。整体看,利润正在从下游的算力使用者手里往上游的核心硬件环节聚集。 前面说的都是硬件层面的事,但还有个更关键的变量,软件生态。英伟达的 c u d a 经营了十七年,几千万开发者在上面写代码, 主流 ai 框架全都原生支持。华为去年把 cnn 全面开源了,对接了五十多个社区, petouch 和 v l l m 这些都能用 v 四的深度适配,也算是给 cnn 做了一次大规模验证。 但说实话,开发者数量的差距还是很明显的,第三方工具链也不够丰富。这里的逻辑是,如果 c a n n 的 生态能逐步跑通,那现在这波硬件切换就可能变成一个长期趋势。如果生态跟不上,硬件再强也只是阶段性的替代方案。 最后梳理一下我的判断,芯片环节确定性比较高,供给稀缺,利润再往头部集中,光模块门槛在,毛利还行。夜冷要分开看, 有量不等于有利润,得看谁能扛住价格战。数据中心端需求没问题,但利润空间被上游压缩了。最不确定的就是 c a n n 和 c u d a 的 生态之争,这个变量可能需要两到三年才能看出方向。你觉得国产晚间生态能跑出来吗?欢迎留言讨论,也可以告诉我你还想了解哪个行业。 本视频所有数据来源于公开权威媒体及网站,仅供学习、研究、参考。

别等了, deepsea v 四真的要来了。 v 四四月上线,专为江板增效。别打招,去年 v 三靠 mo 一 架构把算力成本砍半,今年各种 agent 和小龙虾疯狂好讨论,成本又涨回去了。 deepsea v 最近当季专家模式上线,全是 v 四回头测试大模型落地,关键不是堆参数,是算力成本场景的综合能力。这次 v 四很可能再次定义 ai 性价比。

deepseek v 四要来了!近一万亿参数加百万上下文,开源扣顶王者!据 the information 报道, deepseek 下一代模型 v 四将在未来数周内发布,接近一万亿参数。一百万偷啃上下文窗口, 专为华为升腾九五零 p r 芯片深度优化。光这三条就已经让开发者社区炸锅了。弹幕打一,看,看有多少人已经在等 v 四了。 v 四到底有多强?先说核心参数,接近一万亿参数, deep c v 三是六千七百一十亿参数, v 四如果接近一万亿 参数,规模直接提升了将近百分之五十。参数量不是唯一指标,但它代表着模型能记住和理解的信息密度上限。觉得这个升级幅度猛的,弹幕扣个猛。一百万 token 上下文窗口一百万 token 是 什么概念? 大概相当于一本六十万字的长篇小说, ai 可以 一次性全部读完并理解。对于编程场景,这意味着 ai 可以 同时看到一整个大型项目的所有代码文件, 不再需要分段位给他。这是 v 三用户最痛的点之一。 v 四直接解决了代码能力大幅提升。据已经拿到测试版的开发者反馈, v 四在代码生成和代码搜索两块相比, v 三都有显著提升。目前开发者社区的预期是, v 四将成为开源领域最强的抠定模型。 华为升腾九五零 p 二是什么来头?这次 v 四最大的技术看点不只是模型本身,而是底层芯片的选择。据报道, v 四将完全运行在华为升腾九五零 p 二芯片上。 deepsea 与华为合作数月,对模型核心代码进行了重写和测试,实现了一点八倍推理加速 升腾。九五零 p 二是今年三月二十一日华为在合作伙伴大会上正式发布的最新产品,搭载 atlus 三五零 ai 训练推理加速卡, 配备自研 h b m 内存,阿里巴巴字节跳动、腾讯等大厂已经批量订购了这款芯片。 v 四选择它做底层,本质上是一次技术上的深度绑定。 同一套芯片生态,同时服务训练和推理两个环节对开发者意味着什么?聊完技术,说说对普通开发者最直接的影响。第一, 开源最强,抠顶模型触手可及。如果 v 四代码能力确实如测试所示大幅提升,这是一款可以免费用、可以本地部署的顶级编程 ai, 不 需要订阅任何服务,直接跑在自己的服务器上,成本是闭源模型的几十分之一。 第二,上下文突破带来工作流革命,一百万抠肯上下文,对开发者的实际价值远不止读整个项目 代码审查、文档生成、跨文件重构、大型数据库查询优化,这些任务以往要分多次完成, v 四可以一次性处理。 第三,扣顶工具链格局或将重写。现在 cloud code、 cursor 等 ai 编程工具底层调用的都是闭源模型,如果 v 四开源且代码能力足够强,这些工具未来切换到 v 四作为底层引擎,成本会大幅下降, 开发者使用门槛也会跟着降低。目前 deepsea v 三的 api 价格已经是 gpt 四级别的几十分之一。 v 四如果维持这个定价策略, 对整个 ai 编程工具链是一次成本革命。个人开发者、小团队、独立 app 创业者,将第一次拥有和大公司同等水准的抠定 ai, 而且几乎免费。

大家好啊, d f c v 四可能马上就来了啊,昨天晚上已经在网页版悄然间出现了灰度测试啊,甚至把自己的那个原本的 只有单一的选项变成了三个不同的啊,这个模型的选项,这个东西已经出来的话,我们预计啊,应该在很快就会跟大家露面,而且这将是一个啊 打破上下文的区间,甚至可能会超越百万的这个数,这个上下文啊相关强的这样一个模型,我觉得这个东西就非常有意思,因为之前我们测试过,在里头测试过,我们认为他们的编程已经做了一个大范围的提升啊,而且他已经不认同自己是这个 v 三点二啊,他得说我就是最新版的模, 那说明这个东西的话,他在三点二之基础上已经做了很多的补充啊,很多的调整啊。而且呢,在三月底的时候,我们当时的测试是吧,我们一个那个网网业的生成啊,三分二十七秒啊,之前的时候,同样东西在二月份的时候生成的时候,是他最新的那个三点二出来的时候,我们做过生成的测试,那是八分四十六秒, 所以这样的话,而且的效果它比那时候要好很多,所以就说明它是像在不断地替换掉原本中的各个不同的模块啊,像现在产生这样一个效果,我觉得特别好,大家可以关注一下,最近很可能会有一个很大的消息。另外的话呢,就是 各个国外媒体,国内媒体都爆了啊,这一次 dvd 微四开始不再适配英伟达,完全是以国产算力,尤其是 d 那 个升腾的算力为核心了啊,它已经完全进入在这,而且呢据说有四十万的算子,它是重新写的,整个 dvd 自己重新写的, 就像未来啊,这也看到他现在联盟招聘中也有这个硬件工程师,所以未来很可能还会推出软硬一体机啊,这个我觉得倒是很有意思,值得大家关注。他那个一体机可能就完全不一样的一些东西啊,因为他是完全从自己的角度上去做的, 所以这个东西都是可以去看一看的好不好啊?当然了,这个对于整体的,咱们的这个产业链,包括算力产业链啊,包括 ai、 d、 c 产业链啊,包括大模型、 ai 应用产业链,可能都是一个新的奇迹,它引发的东西会无限下降。那这个背后呢,有没有什么大家现在在忽略,但未来可能成为重点东西呢?哎, 需要的话咱们可以看看我们的季度的这个科普课啊,咱们季度的会员这个东西,这个呢,我们九十天四十五个会员视频大场专门的会员直播啊,内容非常丰富,关键是平台给补贴啊,咱们现在原价六百多,只有四百多块钱,而且之前所有内容都能看,你能抹平信息差,你跟 机构之间对赌的时候你就有胜率对不对?如果需要真的好好看一下咱们链接,链接就在底下点击即可。好啊,另外提醒一下,一定要记得接咱们助教老师电话,不然你不知道怎么看课啊。今天就到这,我是瑞小张,关注我,咱们从投资的视角看科技背后的精彩,我们下期见,拜拜。

deepsea 的 v 四为什么迟迟出不来?根据官网的更新啊,出了快速模式和专家模式。那好多人都在催啊,赶紧上线吧,真的不要催,这件事情比想象的要难的多得多,而且要做足充分的准备。那难在哪? 上周外媒啊 information 的 报道说 v 四在做国产适配是在华为的申腾和韩无忌两家身上,那这边我们的官方是没有证实的,也不可能主动来证实,而且是永远不可能。后面我会说,为什么我们假设适配是真的,那你知道 适配国产算力底座,它不是把代码改一遍就行,而是要从底层的你的训练的语料,底层的代码迁移,算子翻译器,就是从硬件到软件,一 整个国产生态的适配,比想象的要复杂得多,得多得多。但是啊,这次它还不仅仅是真正的从零到一,还有一层双重的压力,国产适配以后,你的能力上要超越最新的从零到一,还有一层双重的压力,国产适配以后你的能力 gps, 它没有一个非 非常创新的点,我觉得没必要着急出来,因为国内现在也不缺模型用。那它为什么不直接在英伟达上直接迭代呢?很多人不知道,我觉得从去年的年初开始, tipsy 的 使命就是要 死磕国产酸粒生态了。因为对梁文峰来说, v 四在国产底座上训练出来,它其实有两层非常重要的意义。首先大家一定要意识到,这件事情是一件极其 高壁垒的事情。那在国产底座上从零到一,训练出一个全世界顶尖的大模型,这在国内将会是第一个。注意啊,我说的是从零到一以及顶尖两个前提,不要跟我杠什么讯飞啊质谱,从此 deep secret 就 可以摘掉那个国外给他扣上的非常傲慢的帽子啊,说他只会蒸馏的这顶帽子。而且 更重要的是未来国内的金融、教育、医疗这些国际民生相关的产业,它的安全自主可控的这个底层的要求,只要它未来布局 ai, 它都会长在 deepsea 的 底座上,这个是 巨大的产业级的机会,那机会越大,准备就要越充分。其实大家想过没有,一旦 v 四正式推出,背后对于国产算力的需求会是指数级的,你的产能准备好了吗?不管是深腾还是韩无忌,你今年有多少卡可以供得上?所以他要考虑这个发布的时机,是一个整个产业链的事情, 是单一一个模型的事情。那今天更新两个巴腾,市场就开始慌了,一旦正式发布,会有哪些影响?我先说我的观点,即便有一天正式推出了,我认为官方也不会告诉你,告诉我,告诉国内外的媒体,他是不是从硬件到软件,从工具全部是国产自主,让对手猜不透, 这是一种顶级聪明的战术。但是你会从年底的国内的 ai 算力的采购和消耗的数据上去直观的看到,从去年二零二五年,英伟达是百分之五十五的占比,华为是百分之二十, amd 百分之 四,大家可以猜一下,今年二零二六年会是多少呢?其实国外的算力产业会抖三抖,这个是一定的了啊,不止英伟达,我说的是包含整个算力产业链的所有,但是我认为影响更大的其实是国内的模型跟大厂,国外的这些公司,它毕竟是全 全球生态,全球产业链,而国内其实是在一个池塘里的竞争,国内的这些模型和大厂,你不快速的去适配国产算力生态,我认为至少要准备两套方案, 如果你不准备好,就我刚刚说的国际民生相关的这些产业机会,可能就跟你没啥关系了。这就是为什么有很多消息也在猜测,国内大厂都在加速的做适配, v 四一旦出来,国内的这些模型可能要等五等,所以啊, v 四的价值对于国产算力生态它是无价的,它会带动国内的模型和互联网大厂 真正意义上去主动地接纳国产算力,而不是被迫。 vs 的 发布会成为 ai 路线,就是中国和美国两条路线,一个真正意义上的转折点,全世界会真正意义上有两个选择,把整个算力价格打下来的一个底层逻辑,只有你有更多的选择了,价格才能下得来,对不对? 所以不要催啊,给梁文峰和他年轻的团队一些时间,也给其他的模型和厂商加速适配一些时间。那你们有什么看法也可以在评论区聊一聊,就这样,点赞关注不迷路。

华为呢,最近的话有一个新的 ai 芯片叫做升腾九五零,根据我这边得到的信息哈,咱们的国产的 ai 芯片升腾九五零的话呢,已经都被各大厂商给订购完了啊,现在大中型的厂商的话,都在针对升腾九五零做各种各样的算法的优化和迭代, 尤其是其中有一家很重要的公司啊,去年过春节那段时间,有一家公司火了, deep sec, 深 度求索,这家公司非常非常出名啊哈,他们那个时候靠什么火的呢?靠的是他们的 deep sec r e 二零二五年的三月份发布的,到现在的话一年了,根据我这边得到的一个最新的情况,就是说 deep sec v 四,它将首发适配华为的 ai 芯片。 可能很多人不理解这件事情,它到底有多牛?你们知道 deepsea 最早的时候它是怎么火出圈的吗?不是说这个人工智能它到底有多聪明,而是他们震惊的地方在于说这个 deepsea 它到底有多便宜。刚刚发布的时候,它的成本只需要 国外同样性能的人工智能大模型的二十分之一的成本就能够跑出,大概相当于是西方顶级的 ai 大 模型的差不多百分之九十以上的一个能力,这性价比一下就出来了,这就让西方人感到非常非常震惊, 那么它到底是怎么做到的呢?其实就是基于它在算子层面上的一个优化,一般咱们国内做大模型的,无论是阿里啊还是腾讯呢,它们都属于在软件层面,那么一般做软件的话是很难涉及到算子层 面的,但是 deepstack 它牛就牛,在这个地方它是在算子层面上做了优化,优化了之后的话提升了对应的 ai 芯片的计算效率。 但是在去年这个实验点深度求索是基于谁的算子去做的优化呢?是基于美国的英伟达 的这套生态的算子去做的优化,也就说是基于美国的库大生态去做的优化。现在我们即将要发布的这个 v 四的版本,它要全面的适配我们的国产的 a e i 芯片,而且将首发适配我们国产的, 也就是华为的这一套 ai 生态。在二零二五年的六月份的时候,其实华为做了一个非常非常重大的一个决策,将它的升腾的算子级别的能力全面开源。相对比而言的话,英伟达那套扩大生态,它是闭源的, 为什么要开源?这就要说到 deepsea, 当时在 v 三那个版本,他们虽然说基于英伟达这东西的话做了一些优化,做一些迭代,当他们想再往下更进一步的时候,就会发现一个最大的问题在哪里?最大的问题就是英伟达的这套生态是闭源的, 什么叫开源和闭源?它的区别到底是什么呢?就是意味着说像深度求索这样的技术能力非常非常强的公司,对于他们来讲的话,他们已经没有继续开发的空间了。因为英伟达这东西他不给你用,他不告诉你里面是什么样子的, 所以你就没办法改,就是一个黑盒,黑盒上面它只有几个接口,你往上插,插完之后你就能用,但是这个黑盒里面你是打不开的,你不知道这里面是什么东西,所以这就导致说你想改你改不了,但现在华为做了一件什么事情呢?把盒子给你打开了,让你看到每一个芯片的算子 它是如何去运行的,如何去计算。也就意味着说,如果你的技术能力真的足够强的话,你就可以深入到芯片的算子层面的话去做优化,而这件事情正是现在深度求索,我相信他们即将要做的一件事情。 而如果你用美国的那套 ai 芯片呢?也许它也能跑,但是因为它盒子里面东西它没动,所以它的效率将会远远低于我们国产的这套 ai 生态, 这意味着整个生态的替换呐。以前我们国内训练 ai 用的算力芯片基本上都是美国的, 而以后很有可能全世界未来所有的人工智能可能都要切换到我们国产的 ai 生态了,因 只有这套生态的话,跟 deepsea 那 套模型,那套架构是最适配的。全世界对于我们国产 ai 算力的需求一定会呈现一个叫做爆炸式增长,国内的 ai 算力芯片未来一定会供不应求,包括华为的升腾,包括韩五 g 等等,这些芯片将会从原来的背血变成未来的主流。所以啊,这颗叫做 deepsea 微四的石头一旦投下去之后,我们国内的 ai 大 模型的生态可能就会彻底建立起来,而且可以孕育出 非常非常多不同的可能。所以你看,对于美国来讲,它们还能靠 ai 继续收割吗?它们还能靠它们的 ai 芯片继续收割吗?没有办法了对不对? 而当这些传统的美国的这些高端的领域都没有办法再赚取暴利的时候,美股的那些巨头们还能够再继续维持高估值吗?很多人其实啊都没有意识到, 其实在人工智能这一块的话,中美之间正在进行一场非常非常激烈的技术竞争,但是我觉得他不是一个简单的技术竞争,我觉得甚至我们可以把这场人工智能之争,我们把它看作是一场国运之争。

第一,四五一四正式开源,全球首个零一伟达依赖的顶级大模型完全运行在华为升腾九五零 p r 芯片上,推理速度暴涨三十五倍,能耗降低百分之四十。关于参数模架构, m i t 开源免费用,这不只是一次模型更新,这是国产算力崛起的宣言。

朋友们,就在前天,沉寂了一年多的 deepsea 终于是传出了相关的重磅消息,两家重量级的外媒 the information 还有路透社先后爆料, deepsea 最新的 v 四模型就要发布了。 但这个报导里的重点也是最让这些外媒感到震惊的,其实并不是这个最新的 v 四模型性能方面有多强,而是这一次最新的 v 四模型性能方面有多强,而是这一次最新的 v 四模型性能方面有多强,而是这一次最新的华为芯片上。 那有些朋友可能还不太了解这个背景,我就快速讲一下,为什么我说这一件事这么的重磅。过去几年,美国一直在干一件事,就是卡我们的芯片, 中国想搞 ai 可以, 但是我就卡着你,不卖给你最好的芯片。他们的逻辑非常清楚,因为 ai 的 命脉是算力,而算力的命脉是芯片,但芯片呢?他的命脉则捏在美国,在美国的企业英伟达手上。 而且问题不只是芯片这一个硬件的本身,这个英伟达公司,它的编程框架枯的才是真正的杀手锏。现在全世界所有的 ai 实验室以及相关的 ai 企业都被锁在英伟达的这一套框架里。所以为什么英伟达能在今天的 ai 时代成为全球市值最高的公司呢? 因为它在某种意义上已经实现了芯片领域上的垄断,全世界现在都被它卡着。而现在 deepsea 说,这次我不跟你玩了。 这也就是很多人一直在问的,为什么 deepsea 的 v 四模型发布一拖再拖。要知道以前 deepsea 发布模型的节奏从 v 二到 v 三只用了七个月,然而在二零二四年十二月二十六日发布 v 三模型,到现在已经过去快一年半了,还是迟迟的没有发布 v 四模型。 因为像 deepsea 这样一个技术能力已经被验证,并且资金充裕,团队稳定的公司,单纯去优化训练一个新的模型,根本不至于拖这么久。现在答案全都揭晓了, 原来 deepsea 他 们并不是在调一个模型那么简单,而是在换地基。梁文峰带领 deepsea 团队花了好几个月,和华为的工程师以及韩五 g 的 团队坐在一起, 把 deepsea 的 模型底层代码一行一行的重写,把原来跑在英伟达酷逮架构上的整套模型和系统全部迁移到了华为自研的 cnaa 框架上。 所以说,一旦这一次 v 四模型发布之后被验证它是稳定可行的,那影响的可不只是 deepsea 一 家公司的事儿,而将成为我们国家科技领域 ai 领域的一个重要的里程碑,时刻 意味着我们整个中国的 ai 产业从此有了一条独立自主的技术路线,我们可以彻底的摆脱以往在芯片领域依赖于美国的企业被美国人卡脖子的困局。 另外呢,外媒在这一次爆料里还说,据准确的消息,阿里字节、腾讯这三大巨头也是我们国内 ai 领域领先的几家企业已经也是向华为下单了几十万片的华为升腾芯片。 那几十万片,这肯定不是试水了,而是战略级的信任投票。很多人或许还会有一些质疑,因为确实华为的芯片是刚刚的起步,客观上讲,在性能上大概只有英伟达芯片的六成左右,那么 ai 模型是否能稳定正常的运行呢? 但是根据外媒的爆料, deepsea 团队它的厉害之处就在于此。今年年初呢, deepsea 团队先后发了三篇论文,涉及到创新性的三项技术,叫 mhc、 ingram 以及 doope。 表面上看呢,这三项技术分别属于算法、数学、模型、架构和系统工程三个截然不同的领域。但是如果你把它们拼在一起,就会发现,它们并不是孤立的单纯的学术研究,而是 deepsea 团队在有的放矢地设计一种新的架构。 也就是说, deepsea 团队一开始就把怎么在非英伟达硬件上高效运行 ai 模型这件事在进行系统的规划和研究,用一种巧妙的架构上的设计以及算法上的优化,来弥补芯片硬件上的性能差距,从而实现 ai 模型的顺利运行。 所以朋友们,你们可以想象一下这个画面,西部戈壁滩上的绿色电力,驱动着我们国产的华为芯片,跑着 deepsea 的 最前沿的大模型,再通过我们的海底光缆向全世界输出我们的算力,那会是怎样一个宏大的场景? 从电力到芯片,再从芯片到模型,以及从模型到全球的 ai 服务,整一条链路以后都会是我们中国的自研自造。在未来的 ai 时代,这将是我们国家最强大的底牌。 一句话,感谢 deepsea 团队的努力,美国人,你们可以进芯片,但是你们进不了我们中国人发展的决心。