V4 来了!被芯片封锁下的中国 AI 交出了怎样的答卷? 就在刚刚,深度求索发布了第四代模型技术报告。仔细看完,说几个让我震撼的点👇 **1/ 数字本身就很炸裂** 旗舰版 1.6T 参数,但每次推理只激活 49B。百万字上下文,计算量只有上一代的 27%,缓存只有 10%。自研的混合压缩注意力技术,用最少的算力做最多的事。 **2/ 性能一点也不虚** - 知识能力:开源模型第一 - 常识问答准确率接近 58%,领先第二名 20 个百分点 - 编程竞赛评分 3200+,追平 GPT-5.4 - 百万字深度测试,超过谷歌最强模型 - 以上全部只激活 490 亿参数 **3/ 这才是最让我触动的** 它开源了。最开放的协议,随便用。量化后家用显卡就能跑。这不仅是跑在英伟达上——华为昇腾芯片同样跑得飞起,自研 MoE 内核在华为上提速一倍多。 论文里甚至专门写了如何在华为芯片上做优化,给国产硬件厂商提建议。 这不只是一个模型的事。这是一个完整的中国 AI 技术栈在崛起:从芯片到训练框架到模型到应用,全链路自主可控。 **4/ 当然也要客观说** 预览版,推理能力还落后顶尖闭源模型 3-6 个月。但芯片封锁下做到这个程度,而且开源、便宜、人人可用。 这就是中国 AI 该有的样子。 视频里从技术细节到硬件突破都讲了,可以边看边感受。 #DeepSeek #国产大模型 #华为昇腾
00:00 / 02:12
连播
清屏
智能
倍速
点赞75
00:00 / 01:25
连播
清屏
智能
倍速
点赞560
00:00 / 01:16
连播
清屏
智能
倍速
点赞29
00:00 / 01:02
连播
清屏
智能
倍速
点赞47
00:00 / 08:41
连播
清屏
智能
倍速
点赞30
全球AI格局,今天彻底变天了!DeepSeek V4横空出世,直接把大模型竞争,砸进了全新的转折点! 你没看错,就在OpenAI发布GPT-5.5的同一天,中国AI企业深度求索,直接甩出了DeepSeek V4,同步开源权重,正面硬刚全球顶级闭源模型! 1.6万亿总参数的旗舰版,490亿激活参数,MoE架构,直接登顶全球最大开源权重模型;更狠的是,全系标配100万Token超长上下文,一整部《三体》一次性喂进去,完整解析不丢信息,直接把行业高端功能,打成了普惠标配! 代码能力干赢Gemini,Agent能力逼近Claude Opus,推理成本比海外顶级模型低了上百倍!过去只有硅谷巨头能摸到的AI天花板,现在被中国团队直接捅破,还把梯子递到了所有人手里。 这不是简单的模型更新,这是全球AI竞争的分水岭——闭源垄断的时代,被开源普惠彻底终结了! 版本二:3分钟科技财经中长视频口播(YouTube/B站深度内容适配,讲透转折点) 今天我们聊的,不只是一个大模型的发布,而是全球AI产业,一个真正的时代转折点。 2026年4月24日,DeepSeek V4正式发布并开源,就在同一天,OpenAI放出了GPT-5.5。这个时间点的巧合,从来都不是偶然——这是中国AI力量,第一次在大模型的核心赛道,和全球顶级巨头正面硬碰硬。 很多人问,一个模型更新,凭什么叫转折点?我给你拆解三个维度,你就会明白,DeepSeek V4到底掀翻了行业的哪些底层规则。 第一个,它直接打破了“闭源=顶级性能”的行业神话。 过去,全球AI的天花板,永远握在OpenAI、Anthropic这些闭源巨头手里。但DeepSeek V4直接用实力改写了规则:旗舰版Pro总参数1.6万亿,依托33万亿高质量语料预训练,在复杂代码、Agent智能体、深度推理等核心赛道,性能直接对标GPT-5、Claude Opus这些全球顶级闭源模型,更是拿下了开源模型的性能天花板。 更关键的是,它把顶级能力直接开源了。这意味着,全球的开发者和企业,再也不用被巨头的API卡脖子,就能用上万亿参数级的顶级AI能力,这是对闭源垄断最彻底的颠覆。 第二个,它把百万级上下文,从高端奢侈品打成了行业标配。 #deepseekv4 #大模型 #人工智能 #股市 #算力
00:00 / 01:28
连播
清屏
智能
倍速
点赞90
00:00 / 01:12
连播
清屏
智能
倍速
点赞43
DeepSeek V4 靠算法掀翻“算力霸权”!🇨🇳🔥 大家都说搞AI大模型就是“堆算力”,没有顶配的英伟达芯片就玩不转? 今天告诉你,错得离谱!国产之光 DeepSeek V4 刚刚用实力证明,靠极致的算法创新,照样能掀翻全球的“算力霸权”!一直以来,我们都在担心算力被“卡脖子”。 但这次 DeepSeek V4 直接在受限的英伟达GPU和咱们国产的华为昇腾NPU芯片上跑通了训练! 不仅跑通了,它的综合能力甚至可以硬刚目前全球最顶级的 GPT-5.4 和 Claude 4.6! 它到底是怎么做到的?全靠这三大“变态级”的底层算法黑科技:第一,首创“混合注意力机制”(CSA和HCA)! 以前的模型看100万字长文,要逐字逐句死记硬背,非常吃算力。 但 V4 呢?它直接把 128 个词压缩成 1 个,就像看书只看“标题和目录”一样高效! 结果就是:满血Pro版处理百万字长文,算力消耗只要上一代的 27%,内存只要 10%! 轻量级的Flash版更离谱,算力消耗降到10%,内存只要 7%!省钱省到了骨子里! 第二,直接换“发动机”! 整个AI圈都在用传统的 AdamW 优化器,但 V4 偏不!它在训练时换上了超硬核的 Muon 优化器,让整个庞然大物学得更快、跑得更稳! 第三,拓宽信息高速公路! 它引入了一种叫 mHC 的超连接技术,直接把神经网络层与层之间的“连接线路”拓宽了整整 4 倍!大脑信息传输再也不堵车! 发现了吗?面对外部的封锁和非议,DeepSeek 没有随波逐流,而是坚持“不休于誉,不恐于诽”,按自己的节奏做技术! 它用行动告诉全世界:中国AI的未来,不仅要靠国产算力的突围,更要靠中国程序员顶级的算法智慧!#DeepSeek #DeepSeekV4 #人工智能 #大模型 #ChatGPT #国产之光 #科技前沿 #程序员日常 #AI工具推荐 #开源大模型
00:00 / 15:54
连播
清屏
智能
倍速
点赞32
00:00 / 02:59
连播
清屏
智能
倍速
点赞124
00:00 / 04:40
连播
清屏
智能
倍速
点赞3
00:00 / 01:17
连播
清屏
智能
倍速
点赞18
00:00 / 01:33
连播
清屏
智能
倍速
点赞26
00:00 / 01:17
连播
清屏
智能
倍速
点赞15
00:00 / 01:48
连播
清屏
智能
倍速
点赞40