粉丝18.1万获赞129.3万


国家队终于出手了,这次直接砸向了国产 ai, 主角呢就是 deep seek, 国家人工智能投资基金准备投,它给的估值多少呢? 五百亿美金,换算一下,差不多三千五百亿人民币。这事啊,最让人震惊的是什么呢?就在几个礼拜前, deep seek 还没发 v 四的时候呢,一级市场的估值大概是一百到两百亿美金, 结果呢,短短不到一个月啊,估值直接翻了一倍还多。这可不是二级市场炒作,是国家对真金白银准备入场的价格。 deepsea 这家公司啊,很有意思啊,老板叫梁文峰,之前搞量化换方的,赚了不少钱,所以很长一段时间呢, deepsea 都是小团队,梁文峰自己投钱呢,慢慢做,很排斥外部投资啊。 但这次不一样,来的可是国家队。这个国家人工智能投资基金呢,是国家大基金三期专门拿出来两百多亿成立的,就是国家级的产业基金,专门投人工智能。国家队做生意从来不是冤大头,他能给到五百亿美金,这个天文数字背后的逻辑很深。 第一呢,这是认可,也是一种收编。 deepsea 最大的价值在哪?在于它是基于华为的系统去做的,走出了一条跟美国完全平行的技术路线。这事啊,做出来了,国家队呢,就用这笔投资给你盖个章,让你正式成为国家队的一员。 第二,这是在给国内所有的 ai 人才打个样,以前我们老说光赌着不让用国外的技术没用,人才都跑到美国去了,怎么办呢?现在国家队就告诉你,你留在国内好好干,干出名堂了,我们给的钱,给的估值不比美国那些金主爸爸少。 你想想, deepsea 现在还没盈利,梁文峰个人占股百分之三十四,按五百亿美金,上千亿人民币了,这就是一个活生生的标杆。 所以这个动作的核心就是强化我们自己的国产化替代产业链。以后 deep sea 有 国家队背书,要资源有资源,还能跟华为这些国产化链条上的企业深度结合。这也等于告诉美国,你们搞技术封锁, 讨论什么 ai 安全护栏,我们现在不 care 了,我们已经走出了自己的路,符合我们利益的我们就做,不符合的我们自己干。这笔投资是把国产 ai 提到了一个前所未有的战略高度。那么各位朋友,你觉得国家队花这么大价钱投 deepsea 这笔买卖划算吗?评论区聊聊看。

dbic 呢,又崩了,严格来说呢,这已经不是第一次了,半年的时间不到崩了三次,而且呢,他每次崩啊,都是下午这种高峰的这种时间段崩,奇怪的是呢,就这么大的平台,这么频繁的出问题,但是所有的人啊,却只能是接受你骂两句以后等他恢复,恢复完了以后你又接着来用。但是呢,对于我们来讲, 说实话肯定是不能这样的,因为我们的用户等不了,所以呢,我们从来都不会只用一个大模型,像 tpc 崩了,我们用 cloud 的 来顶上,如果 cloud 的 慢了,我们就会用 gbt 来补位。模型呢,在后台呢,它会自动的来切换,用户啊,根本就感知不到这种模型的这种波动。内容啊,会照常的生产出来。核心呢,我们用的是一整套的一种系统机制,就 任何的一个环节断掉这个生产线是不会断的。我们做的事情啊,非说实话,非常简单,就是把短视频创作中的每一个环节,从选择题到文案到配音,到数字人出镜,再到视频的剪辑合成,都会通过多引擎那种方式在后台啊, 实时的来调度,哪个模型稳,我们就用哪个,你只管去用它,永远都不会崩,因为呢,我们给你的并不是一个 ai, 是 一条根本就不怕断的一个生产线。关注英哥,带你了解更多的 ai 知识。

ai 对 话串台 deep seek 做出回应。据三十六课五月二十日报导, deep seek 近日就用户关注的模型异常回复问题做出回应。此前有用户反馈,在使用 deep seek 网页版时,输入类似 sync 等特殊字符后,模型偶尔会返回与当前提问无关的内容。 由于这些回复看起来像是其他问题的答案,部分用户因此产生了对话内容是否泄露的疑虑。针对这一情况, deep sec 方面表示,技术团队经过排查后确认,相关异常属于特殊字体触发的模型幻觉,并不涉及安全问题,也不涉及用户隐私泄露。 deep sec 同时表示,后续将通过针对性训练,增强模型对特殊字体的识别和处理能力,修复相关已知问题,并优化类似场景下的模型表现。 这起事件也反映出,大模型产品在快速普及的同时,用户对 ai 工具的稳定性、安全性和隐私保护提出了更高要求。 对于 ai 企业来说,模型能力之外,异常响应处理、用户反馈机制和透明沟通同样是产品可信度的重要组成部分。关注我,每天热点更新,带你第一时间看重点!

上周 deepsea v 四发布,这行小字引起了我的注意。大白话说就是价格贵是因为芯片不够,等华为下半年出货价格就能降下去。这有什么,不就是没办法,拿不到海外的高端芯片,只能等国产顶上美? 不是的,早在两个月前,海外媒体就报道过, deepsea 没有把模型给美国芯片厂商做性能优化,而是优先开放给华为这样的本土厂商。明明可以选择现成的方案,但 deepsea 没有。所以这不是很多人以为的。不得不,这更像是一次主动压轴。 为什么?这要从 deep seek 的 技术路线说起。 m o e 专家混合什么意思?我打个比方,你身体不舒服去医院,当然希望医生懂得越多越好,最好内科、外科、脑科全都精通,但要培养这样的全科医生,太贵了,也太难了。 传统大模型,就像全能医生,问什么问题都调动全部参数回答。 deepsea 换了个思路,他不训练全科医生,而是训练多个专科医生,再设一个导诊台,同样是去问问题。比如我最近老是头疼导诊台,一听脑科大夫你来接诊,那内科和外科医生呢?不用动,在旁边待命。 这就是 moe, 参数总量巨大,但每次只激活一部分干活。所以 deepsea 才会说, v 四 pro 总参数一点六万亿,激活只有四百九十亿。 但 moe 有 个限制,沟通效率,几百个专科医生要高效写作,导诊台得快速分发病人,再把结果汇总回来,每颗芯片都要随时跟其他芯片高效沟通,稍有延迟,效率就崩了。 moe 的 核心是用通信换算力,通信跟不上,延迟就成了瓶颈。 那能不能把芯片间的通信做好?英伟达说,我拿手,我有一套专门的技术,叫 n v link。 英伟达的主力产品 n v l 七二,就是靠这个把七十二颗芯片连成一个计算单元,那 deep signal 它不就行了? 有两个问题,第一, n v l 七十二这种顶级算力设备受美国出口管制。第二, m o e 架构有个特点,同时参与的芯片越多,跑得越好。七十二块可能还不够,但要再加芯片,因为答就遇到麻烦了。麻烦的根源是铜来。打开 n v l 七二的后盖,你会看到几千根铜来编织沉迷网, 总长度好几公里,机柜重量超过一吨。为什么要用到这么多筒?因为在带宽速度快到 t b 级的时候,铜缆信号的有效传输距离不到一米,再加上芯片要么机柜塞不下,要么长度够不着,换普通网线,带宽和延迟又不行,铜缆已经逼近物理极限, 怎么办?华为想到一个办法,用光。相比较于铜缆,光纤有两个核心优势,第一,传的远,电信号传输越快,衰减越大,但光子不受电阻和电磁干扰,几百米传输依然稳定。 第二,带宽高,光纤可以同时传输多个波长的光,相当于一条路上开多个车道,互不干扰。两个优势加起来,补上了铜缆的短板,最终让几百颗芯片可以像一颗一样工作。 二零二五年七月,华为展出了 cloud matrix 三八四超节点,他把三百八十四颗升腾芯片连成了一颗超级芯片。同年九月,华为伦治董事长徐志军直言,华为单颗芯片的算力相比于英伟达仍然有差距, 但凭借三十年在连接技术的积累和突破,做到了全球最强算力超节点。讲到这,你可能会问,既然华为已经搭好台了,那 deepseek 直接拎包入住,把魔星搬上去跑不就行了? 没这么容易,想要绕开英伟达非常困难。要知道,英伟达不止提供算力,还提供一整套把算力榨干的方法。大多数 ai 模型都跑在英伟达的芯片上。酷的是英伟达配套的开发环境, 它俩就像电脑主机和 windows 操作系统。过去十几年,全世界的 ai 科学家、开发者习惯在酷的上写代码、开发应用, 一旦绕开,意味着数百万行代码从头开始,意味着大量经验、习惯的不适配,甚至工程能不能进行下去都难说,这就是英伟达垄断的底气。据透露,二零二五年年初, deepsea 在 用华为芯片训练 v 四的过程中,遇到大量中途崩溃、通信速度未达预期等问题, 但他们没放弃。最终, deepsea v 四在升腾上的推理速度比迁移初期提升了三十五倍。据传言,梁文峰说过一句话, v 四从英伟达搬到华为,相当于在飞行中的飞机上更换引擎。 好在这台新引擎不仅换上了,还飞吻了。回过头再看那行不起眼的小字,等华为下半年出货,价格就能降下去,你还觉得这只是一次妥协吗?这更像一种底气背后,是中国 ai 产业正在迈过三道坎。第一,算力坎, 华为卖了出去。过去几年,大家比的是什么?谁家单卡更强,谁就更牛,但中国拿不到最强的单卡怎么办?超节点也好,光互联也好,本质上都是让很多张卡像一张卡一样干活。一个灯泡不够亮,十个灯泡放进一个灯盏,亮度总是够的。第二,生态,看 deepsea 卖了出去, 英伟达厉害不只是因为算力强,而是酷的把全世界开发者数十年的代码、习惯、经验全绑死了。 谁想换芯片,等于推倒重来。但 deep seek 全面支持华为,意味着从今往后,你想跑 deep seek, 不 用酷狗也行,国产芯片、国产工具,也能跑顶级模型。第三,默认路径的砍,这需要芯片和模型的双向奔赴。 什么叫默认路径?就像现在搞 ai 开发,默认买英伟达,默认用 cloud, 这是一种习惯。未来, ai 一定会走向东南亚、中东、非洲 这些地方的开发者不会从零开始,他们会问,用谁的最方便?只有我们的模型加芯片生态能在海外生根发芽,全球的开发者才会愿意基于升腾,加 deepsea 写教程、搭框架、做应用。 今天, ai 世界的权力游戏正式进入下半场。上半场是拼谁先把模型做大,拼谁先把算力堆满。下半场是拼谁能用最低的成本、最自主的生态,把 ai 能力像水电煤一样输送出去。在这条路上, deep seek 走出了最关键的一步,这一步价值连城。 and the day that deep seek comes out on huawei first, that is a horrible outcome for our nation。 关注刘润,降低商业的认知门槛。