Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko; compatible; ClaudeBot/1.0; +claudebot@anthropic.com)
精选
推荐
AI抖音
探索
直播
放映厅
短剧
搜索
您是不是在找:
绝区零站点可以加几个
k模型设置完树还会动
manus有付费用户吗
plc的com接线
gorebox好玩的代码
ug四轴编程教程唐文会
repo中的枪掉了下一局会回来吗
coze工作流如何关闭SSE
豆包pcb设计教程
c语言文件
TechScopeLab-科境坊
6天前
DeepSeek元旦抛出“王炸” mHC架构或将重塑AI基础 什么是mHC(流形约束超连接)? 为何引起轰动?#mHC #流形约束超连接 #ResNet #DeepSeek #梁文锋
00:00 / 08:48
连播
清屏
智能
倍速
点赞
1608
风行雅集
6天前
Deepseek最新爆点mHC:让信息洪流变得有约束和边界 Deepseek最新爆点mHC,就是给神经网络装上的“物理约束器”。它解决了一个困扰行业十年的问题:当神经网络变得极度复杂时,信息流会像失控的洪水一样崩溃。它是怎么解决的?答案就藏在微分几何的流形里。让我联想到流体里有两个非常成功的案例。Deepseek实现了“有秩序的复杂”,这不亚于当年流体力学的研究在混沌的湍流中发现存在拟序结构,是里程碑式的成果。#Deepseek #超链接 #科技 #AI #人工智能 *部分图片由AI生成,请谨慎甄别。
00:00 / 03:51
连播
清屏
智能
倍速
点赞
42
人工智能产业链union(联盟)
4天前
DeepSeek MHC“多车道”换血,残差连接神话终结! @王兴波(Ra·Zero) DeepSeek 发布新研究提出 “流形约束超连接(MHC)” 技术,打破大模型依赖残差连接的十年 “祖传配方”,在不依赖堆参数的前提下,解决了多车道信息流架构的稳定性难题,为高性能 AI 构建提供了全新路径,有望改写大模型发展逻辑。 核心痛点:残差连接的局限与超连接的困境 传统大模型依赖残差连接实现深层网络稳定训练,但其本质是单车道信息流,在复杂推理任务中存在瓶颈。业界尝试的 “超连接” 技术虽能拓宽信息通道,却因缺乏约束导致训练后期信息流干扰、梯度失控,模型极易崩盘,难以实用化。 关键突破:MHC 技术的双重优势 MHC 通过给信息流立规矩,要求控制信号混合的矩阵行和、列和均为 1,既保留残差连接的稳定性,又实现多车道信息流有序交互。实验验证,采用 MHC 的模型在数学、逻辑推理等任务中性能显著提升,同时通过定制 GPU 程序、选择性重计算等工程优化,仅以 6.7% 的训练时间和 6.27% 的硬件成本增加,实现 4 倍信息流宽度提升,突破 “内存墙” 限制。 行业影响与未来猜想 该技术是 DeepSeek R1 推理模型的技术延续,彰显其重构训练框架的能力,也体现中国 AI 生态的技术自信。市场猜测 MHC 或将应用于其下一代旗舰模型,虽在西方分发渠道存在挑战,但技术本身的突破性已引发行业关注,促使业界重新思考大模型架构优化的更多可能性。#人工智能产业链联盟 #科技 #人工智能 #Deepseek#大模型
00:00 / 07:55
连播
清屏
智能
倍速
点赞
34
财经土拨鼠
5天前
DeepSeek的mHC新架构有哪些受益板块?#deepseek #股票#股票交易 #国产芯片 #国产算力
00:00 / 03:35
连播
清屏
智能
倍速
点赞
48
四月的AI茶歇
1周前
解读DeepSeek2026年开篇之作 2026年首日,DeepSeek就带来了他们在大模型架构上的一大创新,梁文锋再次出现在了作者栏,用一个叫做流形约束超连接(mHC: Manifold-Constrained Hyper-Connections)的组件,来解决目前大模型在Scaling Law道路上的棘手难题。#DeepSeek #梁文锋 #编译器 #TileLang
00:00 / 04:29
连播
清屏
智能
倍速
点赞
2384
古择工具箱
6天前
DeepSeek暴力美学进化:MHC架构全拆解#AI #Deepseek #mhc #AI资讯 #国产大模型
00:00 / 03:20
连播
清屏
智能
倍速
点赞
183
稀饭煮天下
11月前
主要组织相容性复合体 MHC 移植排斥反应 #医学生#医学科普 #知识科普 #手绘图
00:00 / 08:38
连播
清屏
智能
倍速
点赞
518
InfoQ
4天前
DeepSeek-V4 预警!mHC 架构降临:从 3000 倍失控到 1.6 倍稳健,数学才是真神。#DeepSeek #mHC #数学 #3000 #AI #InfoQ @抖音创作小助手
00:00 / 02:39
连播
清屏
智能
倍速
点赞
35
懂AI的嗨嗨
5天前
DeepSeek新论文mHC!5分钟通俗解读技术原理 #AI #大模型 #深度学习 #DeepSeek #MHC
00:00 / 07:21
连播
清屏
智能
倍速
点赞
8
赋能创新家
6天前
流形约束超连接的大规模训练稳定性研究! Manifold-Constrained Hyper-Connections (mHC),这是一种旨在提升大语言模型训练稳定性和扩展性的新型架构设计。研究指出,传统的超连接 (HC) 虽然通过加宽残差流提升了模型性能,但其不受限的连接方式破坏了恒等映射属性,导致大规模训练时信号出现爆炸或消失。
00:00 / 09:08
连播
清屏
智能
倍速
点赞
22
何毅财经课堂
6天前
DeepSeek论文引爆AI圈,mHC架构横空出世 新年第一天,DeepSeek 又来踢馆,又来炸街了#经济 #财经 #deepseek #人工智能 #零距离看懂财经
00:00 / 10:06
连播
清屏
智能
倍速
点赞
3046
田丰(3060研究所)
5天前
DeepSeek MHC架构
00:00 / 03:06
连播
清屏
智能
倍速
点赞
9
园林品茗的茶客
6天前
@壁纸君 #精彩片段#人工智能技术草新#分享A1智能且谈浅知识
00:00 / 01:30
连播
清屏
智能
倍速
点赞
13
向前的时代
6天前
神经网络架构——流形约束超连接mHC 大家好,欢迎来到DeepSeek-AI的技术分享。今天我们要深入探讨一种兼顾性能、稳定性和效率的新一代神经网络架构——流形约束超连接,简称mHC。在大模型不断演进的今天,我们提出的这一通用框架,旨在解决复杂连接带来的不稳定性,为基础模型的拓扑结构设计揭示了全新的未来方向
00:00 / 06:48
连播
清屏
智能
倍速
点赞
26
经济导报
5天前
DeepSeek发布新论文,梁文锋参撰,提出mHC新架构,能解决传统架构在大规模模型训练中的不稳定性,DeepSeekR2预计将于2月份问世
00:00 / 00:27
连播
清屏
智能
倍速
点赞
62
AI商业前沿
4天前
DeepSeek出大招了!mHC 直接炸穿 AI 圈~ 嫌 “窄电梯” 传不动、“八车道” 易崩?它靠双约束狠活,把 3000 倍失真砍到 1.6 倍!6.7% 开销换千万训练零崩盘,还为 V4 多模态铺路~ 这波稳赚不亏!颠覆 AI 训练稳了吗?一起聊聊你的看法~ #ai #人工智能 #DeepSeek #技术 #热点
00:00 / 01:02
连播
清屏
智能
倍速
点赞
9
三周目勇者
6天前
【梁文锋署名】DeepSeek新论文:mHC流形约束的超连接 点赞收藏,获取PPT+论文 arxiv - https://arxiv.org/pdf/2512.24880arxiv - https://arxiv.org/pdf/2512.24880 GitHub - https://github.com/Open-Superintelligence-Lab/5-dollar-llm#deepseek #人工智能 #特斯拉 #梁文锋 #马斯克
00:00 / 11:30
连播
清屏
智能
倍速
点赞
21
老郑说 AI 前瞻
6天前
DeepSeek 发明 mHC 新架构,刷爆科技圈,我用大白话给你讲清楚牛在哪里#DeepSeek #梁文锋 #mHC #AI #人工智能
00:00 / 04:32
连播
清屏
智能
倍速
点赞
1187
AIGC 深一度
6天前
刚刚,梁文锋署名,DeepSeek元旦新论文发布,提出「mHC」新架构,果然一如既往地逢节搞动作..#论文 #人工智能 #大模型 #科研 #DeepSeek
00:00 / 08:01
连播
清屏
智能
倍速
点赞
7
栗噔噔
1周前
DeepSeek新论文mHC说了啥?2分钟带你搞懂 #ai #deepseek
00:00 / 02:29
连播
清屏
智能
倍速
点赞
1104
智元科技
6天前
1月2日 (1) 2026元旦AI王炸! DeepSeek mHC架构颠覆来袭, 改写行业十年规则! #AI #大模型 #人工智能 #AI科技
00:00 / 04:10
连播
清屏
智能
倍速
点赞
16
AI 博士嗨嗨
5天前
DeepSeek新论文通俗解读,下一代AI架构mHC! #AI #大模型 #深度学习 #DeepSeek #MHC
00:00 / 07:21
连播
清屏
智能
倍速
点赞
29
学免疫的姚小姚
5年前
08_02 MHC的遗传特点
00:00 / 18:11
连播
清屏
智能
倍速
点赞
180
数字炼丹师
4天前
DeepSeek发布mHC流形约束超连接#AI #ai #deepseek #DeepSeek #AI技术
00:00 / 00:27
连播
清屏
智能
倍速
点赞
20
好哒好哒
1周前
新的突破开始了
00:00 / 01:02
连播
清屏
智能
倍速
点赞
4
奇妙世界说
6天前
DeepSeek mHC 新架构:AI 模型的 "智能导航系统" #ai
00:00 / 01:17
连播
清屏
智能
倍速
点赞
2
王利杰 Leo
1周前
DeepSeek又整活了 - mHC技术接回大模型脊梁骨 大模型最核心的“残差连接”快要断了?DeepSeek 团队带着 mHC(流形约束超连接)强势登场!本视频带你深入浅出地拆解这项颠覆性技术。看中国 AI 团队如何通过数学上的“流形约束”与底层的“TileLang 算子融合”,在仅增加 6.7% 开销的情况下,彻底解决模型训练不稳定的“大坑”,让万亿参数模型的智商上限再次飙升。这不仅是一场数学革命,更是一次极致的工程暴力美学! 订阅频道,带你洞察 AI 行业最深层的技术变革! #DeepSeek #mHC #人工智能 #大模型 #AI技术 #中国科技 #神经网络 #深度学习 #看一看长视频
00:00 / 00:56
连播
清屏
智能
倍速
点赞
231
万大叔
4天前
DeepSeek开年王炸!梁文锋重磅论文来了,mHC要颠覆大模型架构? #deepseek #mhc #架构 #ai
00:00 / 03:22
连播
清屏
智能
倍速
点赞
251
AI周老师
6天前
1月2日AI时间差 DeepSeek发布#mHC架构; #OpenAI 新一代音频 AI 模型进入最终测试;#Google开源 权重模型家族;#壁仞科技 在港交所挂牌上市;#月之暗面 完成5亿美元C轮融资;2026 年 AI 应用将爆发等一大波最新AI资讯 #人工智能 #AI #大模型
00:00 / 00:12
连播
清屏
智能
倍速
点赞
35
AI费曼
4天前
DeepSeek又在年末放大招,这次要取代ResNet? arxiv: 2512.24880 mHC: Manifold-Constrained Hyper-Connections #DeepSeek
00:00 / 03:11
连播
清屏
智能
倍速
点赞
17
鱼小圈
4天前
DeepSeek :下一代超级模型的“地基”已筑好 #DeepSeek #mHC #大模型 #人工智能 #梯度爆炸 DeepSeek 跨年夜甩出王炸!延续一贯作风:不拼显卡拼脑子
00:00 / 06:18
连播
清屏
智能
倍速
点赞
17
雾里看花
6天前
DeepSeek开年首发mHC架构 破解大模型训练核心难题#科技前沿 #人工智能 #科技创新 #ai #抖音推广 @抖音小助手
00:00 / 01:29
连播
清屏
智能
倍速
点赞
61
何雪峰
10月前
移植的前世今生(13) 科学家逐步认识到免疫系统对自我和外来的识别是是否能够移植成功的关键。免疫系统怎么样识别呢?其实是身体会给自己的细胞发一套门牌号码,叫做主要组织相容性复合体抗原,别名MHC,给普通细胞发的门牌号叫MHC 1型,给血细胞发的门牌号叫MHC 2型。免疫系统如果发现来的细胞没带门牌号,那作为身体军警的它们,立刻发动起来把此细胞拿下。托马斯博士70年代鸟枪换炮,到了条件更好的鼎鼎有名的弗莱德哈钦森肿瘤研究中心,终于把移植的长期生存从0提高到了13%,这已经是极其重要的进步了,虽然对比我们目前总体平均60%的生存率还是不够看。 #骨髓移植 #造血干细胞移植 #历史 #苏州大学附属第一医院
00:00 / 01:14
连播
清屏
智能
倍速
点赞
92
肖林林
1周前
马克思发布新论文
00:00 / 00:54
连播
清屏
智能
倍速
点赞
25
AI导图
5天前
AI底层架构硬核突破!DeepSeek mHC破解稳定性难题
00:00 / 07:16
连播
清屏
智能
倍速
点赞
8
余灵 提供脑机接口,激发大脑无限潜能
6天前
破解千亿参数训练难题 破解千亿参数训练难题,DeepSeek mHC架构落地,为大模型训练成本砍半 2026年1月1日,DeepSeek团队于arXiv平台发布重磅研究论文《mHC: Manifold-Constrained Hyper-Connections》,提出全新流形约束超连接框架,对传统超连接(HC)范式实现根本性革新。这一被视作大模型“脊椎”(残差结构)的重大技术突破,精准破解了超大规模模型训练的拥堵与不稳定难题,为2026年AI训练效率的系统性升级筑牢根基,更引发全球行业对大模型底层架构创新的深度研讨。#芯片技术 #大模型 #人工智能 #上热门话题🔥🔥🔥 #短视频创业
00:00 / 10:09
连播
清屏
智能
倍速
点赞
4
深度思索deepthink
6天前
mHC架构为下一代大模型架构指明方向,未来可探索差异化几何约束、跨模态统一架构等新路径。#DeepSeek#AI#大模型#训练架构#取得重大突破
00:00 / 00:57
连播
清屏
智能
倍速
点赞
21
免疫小课堂Pro
2周前
#上热门 #知识科普 #每天跟我涨知识 在细胞免疫应答中,抗原递呈细胞给T细胞提供抗原时,MHC分子起到了关键作用。那么除了这个,MHC分子还有哪些作用?快来评论区一起讨论#涨知识 #科普
00:00 / 01:37
连播
清屏
智能
倍速
点赞
26
Ryan的AI笔记
5天前
2026开年必看两个科技突破,有何关联? 2026开年必看两大科技突破,启元的Q1+DeepSeek的mHC,或许藏着一个你该知道的未来信号,紧跟趋势不容错过! #上纬启元Q1#你的第一个个人机器人#DeepSeek#mHC架构#具身智能机器人
00:00 / 02:02
连播
清屏
智能
倍速
点赞
1362
余杰丰AI
4天前
1 月 3 日,DeepSeek 创始人梁文锋在社交媒体上暗示,基于 mHC(流形约束超连接)新架构的 V4 大模型已训练完成,预计春节前后正式发布。V4 模型将重点强化多模态能力和国产芯片适配性。你期待吗?#deepseek #梁文锋 #国产AI #AI
00:00 / 00:09
连播
清屏
智能
倍速
点赞
42
哪一剑的风情
5天前
DeepSeek新架构mHC DeepSeek新架构mHC炸场!大模型训练要告别“越训越崩”?#AI #科技
00:00 / 01:35
连播
清屏
智能
倍速
点赞
2
铜雀春情
4天前
DeepSeek新架构mHC横空出世 # A l架构革命
00:00 / 01:21
连播
清屏
智能
倍速
点赞
1
周大爷说事儿
4天前
元旦炸场!Deepseek 扔出 AI 重磅论文 #deepseek #热点新闻事件 #科普 #涨知识
00:00 / 03:29
连播
清屏
智能
倍速
点赞
3
BioBro大师兄
7月前
一天认识一个免疫细胞 MHC分子分类
00:00 / 01:15
连播
清屏
智能
倍速
点赞
15
智涨Ultra
6天前
Deepseek新论文快速解读 这是论文,不是工程落地,不用特别沸腾…… 但是确实思路很牛逼,一旦落地就会有很大作用…… Deepseek真的是把优化做到极限了 #Deepseek #mHC
00:00 / 03:00
连播
清屏
智能
倍速
点赞
171
海晏清的阳光海洋
5天前
2026年1月1日,DeepSeek发布论文《mHC: Manifold-Constrained Hyper-Connections》,提出流形约束超连接架构,解决超连接(HC)在大规模训练中的不稳定性问题。传统残差连接依赖恒等映射保障稳定性,但信息通道受限;HC虽拓宽通道提升性能,却因无约束矩阵导致信号爆炸和梯度失稳。mHC的核心创新在于:通过Sinkhorn-Knopp算法将连接矩阵投影至双拟随机矩阵流形(Birkhoff多面体),强制矩阵满足非负、行列和为1的约束,使信号传播变为特征凸组合,既保留多流并行能力,又恢复恒等映射的稳定性。 工程层面,团队采用算子融合、选择性重计算和DualPipe通信重叠策略,将额外计算开销控制在6.7%以内。实验显示,在27B参数模型中,mHC训练损失较基线降低0.021,梯度范数稳定,且下游任务(如BBH推理、DROP阅读理解)性能提升2.1%-7.1%,显著优于HC和基线模型。该架构支持3B至27B参数规模的稳健扩展,为万亿级模型训练奠定基础。DeepSeek创始人梁文锋参与研究,论文强调mHC通过“几何约束+工程优化”平衡性能与稳定,或推动大模型架构从参数堆砌转向拓扑创新。#机器人 #人工智能 #马斯克 #奥特曼 #黄仁勋 @红衣大叔周鸿祎 @雷军 @尹烨
00:00 / 01:36
连播
清屏
智能
倍速
点赞
14
瑞克老张有话说
6天前
一月一日发论文,梁文锋和DeepSeek准备逼死OpenAI #deepseek #梁文锋 #AI #大模型 DeepSeek新论文提出mHC数据传输方法,用一道“数学阀门”,把大模型训练里最头疼的“数据水管爆裂”问题给摁住了。楼可以继续盖,水可以放肆流,成本却越来越低,理想状态能让万亿模型跑在千卡矩阵上,训练成本直接减半。OpenAI的故事越来越不好编。
00:00 / 06:14
连播
清屏
智能
倍速
点赞
5546
ai创造
1周前
主要组织相容性复合体概述:MHC I 类与 MHC II 类 主要组织相容性复合体概述:MHC I 类与 MHC II 类——免疫学讲座
00:00 / 17:23
连播
清屏
智能
倍速
点赞
0
聊AI的小乐匠
5天前
Deepseek最新论文厉害在哪里 Deepseek前两天又发了新论文,我们分二部分来聊聊,它为什么又炸了圈,被称为底层架构的高阶优化。我们先来看看它干了什么、再来说它厉害在哪里。#deepseek#人工智能 #大模型#mHC
00:00 / 03:58
连播
清屏
智能
倍速
点赞
167
全释硬科技
5天前
DeepSeek这次真的在“根技术”上动了手术刀,如果这项技术能大规模落地,未来的AI模型会更稳、更强、更便宜。#DeepSeek新论文提出mHC架构 #DeepSeek发布新论文 #全释硬科技
00:00 / 03:59
连播
清屏
智能
倍速
点赞
49
余杰丰AI
5天前
DeepSeek 发布 mHC 新架构论文,解决大规模模型训练不稳定问题。彭博情报认为,该成果彰显中国 AI 团队在底层创新上的实力,即便无法自由获取英伟达最高端芯片,仍能与 OpenAI 等企业展开竞争。#AI #中国AI #DeepSeek
00:00 / 00:09
连播
清屏
智能
倍速
点赞
21
shifu
5天前
DeepSeek的mHC架构模型引发全球科技圈热议#AI突破#DeepSeek#大模型底层创新#打破巨头垄断#2026开年王炸
00:00 / 02:46
连播
清屏
智能
倍速
点赞
7
一缕夕阳
1周前
# Deep Seek#ai科技改变生活 #
00:00 / 00:50
连播
清屏
智能
倍速
点赞
12
狮子(探索)
1周前
DeepSeek新架构,改写AI训练新规则。
00:00 / 01:04
连播
清屏
智能
倍速
点赞
2
愚人杰AI生活
5天前
DeepSeek 的王炸到底是个啥?让普通人也可以看懂的 AI 解说#AI #DeepSeek #mHC #科普 #王炸
00:00 / 01:53
连播
清屏
智能
倍速
点赞
55
雨羲YouSee
4天前
#deepseek新论文提出mhc架构#AI趋势#科技股#商业逻辑 #人工智能 DeepSeek 为什么让市场紧张?答案不是技术 最近很多人都在刷 DeepSeek, 但真正被重算的, 不是模型强不强, 而是——价格假设还成不成立。 @雨晴YouQing @哈囉Hello!羅
00:00 / 02:43
连播
清屏
智能
倍速
点赞
3
环球智联
1周前
DeepSeek新论文:mHC架构提升模型稳定性
00:00 / 00:44
连播
清屏
智能
倍速
点赞
7
恒昌摄影1
1周前
时事新闻 #Deepee发布mHC架构革新Al训练
00:00 / 01:31
连播
清屏
智能
倍速
点赞
40
萤🔥虫
6天前
#deepseek最新论文#梁文锋#流形约束超链接(MHC)
00:00 / 06:01
连播
清屏
智能
倍速
点赞
16
黄小勋-远胜过往
6天前
梁文锋又放大招deepseek发布最新的mhc模型,对我们所有人来说意味着是什么?#deepseek #梁文峰 #ai #大模型 #算力
00:00 / 01:33
连播
清屏
智能
倍速
点赞
285
老爱叔聊科技
5天前
Deepee 开年放大招,提出AI底层新架构
00:00 / 02:38
连播
清屏
智能
倍速
点赞
4
简介:
您在查找“
mhc架构是什么意思
”短视频信息吗?
帮您找到更多更精彩的短视频内容!
最新发布时间:2026-01-05 06:10
最新推荐:
抖音ai漫剧A保底激励要求是什么
问为什么不找男人聊天
为什么男人一定要生孩子
lol全区临时维护结束了吗
鳌太线救援的流程是怎样的?
八抬大轿明媒正娶多少公里
辣椒用药配方大全
荒原曙光永居群岛建筑谜题怎么过
我的世界勇者之章3通臂大师怎么召唤
熊猫人裁缝525-600在哪学
相关推荐:
玉骨茗茶白颖生是谁演的
元梦之星奇迹农场怎么在别人地里孵蛋
和平精英活动他的玫瑰在哪里
卉了个妮的含义
钓鱼战记太极钓法秘籍怎么获得
底枭是什么
张天志有真功夫吗
花洒喷头出水太散了怎么办
陕西话影响颜值
星奇世界萤火号ex可以装摄像头
热门推荐:
酷喵续费后不愿退款怎么办
韩束怎么申请退款tb
罗永浩捐赠意义
ios10宣传片
莎头全球轨迹怎么弄
蚂蚁阿福的注册流程是怎样的?
苹果16绿屏解决办法
谷歌二维码认证怎么解决
飞书e签宝使用教程
抖音上卖二手衣服货源哪里进的