Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko; compatible; ClaudeBot/1.0; +claudebot@anthropic.com)
精选
推荐
AI抖音
探索
直播
放映厅
短剧
搜索
您是不是在找:
中国为什么要先强后富呢
中国和美国位置对立吗
委内瑞拉为什么不还手
这种国家都没有办法来处理吗
苏毅如何解决危机
李在明放华油管上怎么看
美国胡作非为世界拿他没办法
委内瑞拉未来谁主沉浮
新闻怎么看怎么抓重点
什么也会被人民高高举起
四月的AI茶歇
1周前
解读DeepSeek2026年开篇之作 2026年首日,DeepSeek就带来了他们在大模型架构上的一大创新,梁文锋再次出现在了作者栏,用一个叫做流形约束超连接(mHC: Manifold-Constrained Hyper-Connections)的组件,来解决目前大模型在Scaling Law道路上的棘手难题。#DeepSeek #梁文锋 #编译器 #TileLang
00:00 / 04:29
连播
清屏
智能
倍速
点赞
2447
老郑说 AI 前瞻
1周前
DeepSeek 发明 mHC 新架构,刷爆科技圈,我用大白话给你讲清楚牛在哪里#DeepSeek #梁文锋 #mHC #AI #人工智能
00:00 / 04:32
连播
清屏
智能
倍速
点赞
1258
瑞克老张有话说
1周前
一月一日发论文,梁文锋和DeepSeek准备逼死OpenAI #deepseek #梁文锋 #AI #大模型 DeepSeek新论文提出mHC数据传输方法,用一道“数学阀门”,把大模型训练里最头疼的“数据水管爆裂”问题给摁住了。楼可以继续盖,水可以放肆流,成本却越来越低,理想状态能让万亿模型跑在千卡矩阵上,训练成本直接减半。OpenAI的故事越来越不好编。
00:00 / 06:14
连播
清屏
智能
倍速
点赞
5577
小萌芽科技
1周前
梁文锋 DeepSeek 跨年之日 发文炸场 DeepSeek发布mHC技术:用“流形约束”解决大模型训练稳定性难题 DeepSeek团队在2025年末发布重要论文《Manifold-Constrained Hyper-Connections》,提出了一种能显著提升大模型训练稳定性的创新方案。该研究针对当前超连接(HC)技术在扩展过程中出现的训练不稳定、信号失真等核心问题,通过数学约束与工程优化相结合的方式,为大模型架构演进提供了新思路。 传统残差连接的升级困境 传统残差连接的“恒等映射”特性是深度网络稳定的关键,但HC技术在提升表达能力的同时,由于缺乏约束,导致训练中出现信号放大(最高达3000倍)和梯度异常问题。这不仅影响训练稳定性,还显著增加了GPU内存和通信带宽需求。 mHC核心机制:双随机流形约束 DeepSeek提出的mHC方案核心在于将HC中的残差映射矩阵投影到双随机矩阵构成的“流形空间”。通过Sinkhorn-Knopp算法实现投影,使矩阵具备行列和为1的守恒特性,从而恢复恒等映射性质,避免信号放大或衰减。 实测效果显著 在27B参数规模的测试中,mHC展现出卓越的稳定性:损失曲线平稳收敛,梯度范数保持稳定,复合映射增益控制在1.6(HC为3000)。在下游任务上,mHC全面超越HC,尤其在BBH(+2.1%)和DROP(+2.3%)等复杂推理任务中表现突出。 工程可行性得到验证 通过内核融合、重计算与通信重叠等优化措施,mHC在扩展率n=4时仅引入6.7%的额外训练开销,实现了高效训练。这一方案为解决大模型扩展中的稳定性问题提供了切实可行的技术路径,为下一代基础架构演进指明了方向。
00:00 / 10:57
连播
清屏
智能
倍速
点赞
11
余杰丰AI
1周前
1 月 3 日,DeepSeek 创始人梁文锋在社交媒体上暗示,基于 mHC(流形约束超连接)新架构的 V4 大模型已训练完成,预计春节前后正式发布。V4 模型将重点强化多模态能力和国产芯片适配性。你期待吗?#deepseek #梁文锋 #国产AI #AI
00:00 / 00:09
连播
清屏
智能
倍速
点赞
51
AIGC 深一度
1周前
刚刚,梁文锋署名,DeepSeek元旦新论文发布,提出「mHC」新架构,果然一如既往地逢节搞动作..#论文 #人工智能 #大模型 #科研 #DeepSeek
00:00 / 08:01
连播
清屏
智能
倍速
点赞
8
InfoQ
1周前
DeepSeek-V4 预警!mHC 架构降临:从 3000 倍失控到 1.6 倍稳健,数学才是真神。#DeepSeek #mHC #数学 #3000 #AI #InfoQ @抖音创作小助手
00:00 / 02:39
连播
清屏
智能
倍速
点赞
38
AI商业前沿
1周前
DeepSeek出大招了!mHC 直接炸穿 AI 圈~ 嫌 “窄电梯” 传不动、“八车道” 易崩?它靠双约束狠活,把 3000 倍失真砍到 1.6 倍!6.7% 开销换千万训练零崩盘,还为 V4 多模态铺路~ 这波稳赚不亏!颠覆 AI 训练稳了吗?一起聊聊你的看法~ #ai #人工智能 #DeepSeek #技术 #热点
00:00 / 01:02
连播
清屏
智能
倍速
点赞
10
AI红发魔女
6天前
DeepSeek又搞事!梁文锋重磅论文,又要硬刚“万亿算力” #deepseek#前沿科技#AI#科技#算力大模型
00:00 / 01:37
连播
清屏
智能
倍速
点赞
62
万大叔
1周前
DeepSeek开年王炸!梁文锋重磅论文来了,mHC要颠覆大模型架构? #deepseek #mhc #架构 #ai
00:00 / 03:22
连播
清屏
智能
倍速
点赞
257
三周目勇者
1周前
【梁文锋署名】DeepSeek新论文:mHC流形约束的超连接 点赞收藏,获取PPT+论文 arxiv - https://arxiv.org/pdf/2512.24880arxiv - https://arxiv.org/pdf/2512.24880 GitHub - https://github.com/Open-Superintelligence-Lab/5-dollar-llm#deepseek #人工智能 #特斯拉 #梁文锋 #马斯克
00:00 / 11:30
连播
清屏
智能
倍速
点赞
21
TechScopeLab-科境坊
1周前
DeepSeek元旦抛出“王炸” mHC架构或将重塑AI基础 什么是mHC(流形约束超连接)? 为何引起轰动?#mHC #流形约束超连接 #ResNet #DeepSeek #梁文锋
00:00 / 08:48
连播
清屏
智能
倍速
点赞
1621
杜雨说AI
1周前
说人话解读DeepSeek梁文锋元旦论文 #deepseek #梁文锋 #杜雨
00:00 / 06:50
连播
清屏
智能
倍速
点赞
85
哲先生聊配置
6天前
Deepseek元旦王炸 #Deepseek #梁文锋#哲先生聊配置
00:00 / 02:11
连播
清屏
智能
倍速
点赞
23
经济导报
1周前
DeepSeek发布新论文,梁文锋参撰,提出mHC新架构,能解决传统架构在大规模模型训练中的不稳定性,DeepSeekR2预计将于2月份问世
00:00 / 00:27
连播
清屏
智能
倍速
点赞
64
Ben Meng聚焦热点社会和科技新闻
1周前
梁文锋和Deepseek想做啥?#梁文锋 #Deepseek##deepseek模型 #深度思考
00:00 / 00:59
连播
清屏
智能
倍速
点赞
11
暖暖阅天下
1周前
梁文峰论文开创AI里程碑 #DeepCeek #人工智能 #热点话题
00:00 / 01:14
连播
清屏
智能
倍速
点赞
38
雾里看花
1周前
DeepSeek开年首发mHC架构 破解大模型训练核心难题#科技前沿 #人工智能 #科技创新 #ai #抖音推广 @抖音小助手
00:00 / 01:29
连播
清屏
智能
倍速
点赞
61
天翼
1周前
梁文锋又搞大动作了#Deepeek#梁文锋 #大模型 #训练效率 #人工智能
00:00 / 01:02
连播
清屏
智能
倍速
点赞
9
哪一剑的风情
1周前
DeepSeek新架构mHC DeepSeek新架构mHC炸场!大模型训练要告别“越训越崩”?#AI #科技
00:00 / 01:35
连播
清屏
智能
倍速
点赞
2
shifu
1周前
DeepSeek的mHC架构模型引发全球科技圈热议#AI突破#DeepSeek#大模型底层创新#打破巨头垄断#2026开年王炸
00:00 / 02:46
连播
清屏
智能
倍速
点赞
7
天下文明
1周前
deepseek梁文锋团队的mHC架构来了! 它就像给AI配了个金牌故事导演,数字交警定规矩:所有支线戏份总和不变,该加加该减减,绝不乱加戏! 这下好了!剧情合理、人物立体,训练时间只多6.7%,小团队也能玩得起! 你觉得这招能让AI写出封神小说吗?评论区聊! 一句话科普!#
00:00 / 00:21
连播
清屏
智能
倍速
点赞
1
遇见羊老板
1周前
#涨知识 #deepseek #AI #遇见羊老板
00:00 / 03:45
连播
清屏
智能
倍速
点赞
966
第一财经
1周前
DeepSeek新年炸场!梁文锋署名论文发布指明基础架构新方向,业内预计DeepSeek或在V4版本中做出重大更新。
00:00 / 00:09
连播
清屏
智能
倍速
点赞
2283
星辰大海捞针
5天前
从炼金术到精准工程,关于学习 DeepSeek 最新的论文提出的 MHC 这样一个算法创新的学习心得体会分享
00:00 / 08:25
连播
清屏
智能
倍速
点赞
3
萤🔥虫
1周前
#deepseek最新论文#梁文锋#流形约束超链接(MHC)
00:00 / 06:01
连播
清屏
智能
倍速
点赞
16
榛果information
1周前
deepseek论文 #DeepSeek
00:00 / 00:55
连播
清屏
智能
倍速
点赞
9
余杰丰AI
1周前
DeepSeek 发布 mHC 新架构论文,解决大规模模型训练不稳定问题。彭博情报认为,该成果彰显中国 AI 团队在底层创新上的实力,即便无法自由获取英伟达最高端芯片,仍能与 OpenAI 等企业展开竞争。#AI #中国AI #DeepSeek
00:00 / 00:09
连播
清屏
智能
倍速
点赞
21
好的AI早知道
1周前
#deepseek
00:00 / 01:19
连播
清屏
智能
倍速
点赞
1
狮子(探索)
1周前
DeepSeek新架构,改写AI训练新规则。
00:00 / 01:04
连播
清屏
智能
倍速
点赞
2
黄小勋-远胜过往
1周前
梁文锋又放大招deepseek发布最新的mhc模型,对我们所有人来说意味着是什么?#deepseek #梁文峰 #ai #大模型 #算力
00:00 / 01:33
连播
清屏
智能
倍速
点赞
288
肖恩科创圈
2周前
DEEPSEEK梁文峰的第一桶金 DEEPSEEK梁文峰的第一桶金是怎么来的?#DEEPSEEK #梁文峰 #企业家 #创业故事 #肖恩科创圈
00:00 / 03:20
连播
清屏
智能
倍速
点赞
3590
深度思索deepthink
1周前
mHC架构为下一代大模型架构指明方向,未来可探索差异化几何约束、跨模态统一架构等新路径。#DeepSeek#AI#大模型#训练架构#取得重大突破
00:00 / 00:57
连播
清屏
智能
倍速
点赞
21
证券时报
1周前
DeepSeek梁文锋署名论文发布!提出新网络架构,旨在解决大规模模型训练中的不稳定性问题
00:00 / 00:09
连播
清屏
智能
倍速
点赞
913
南山资本论
10月前
梁文峰:10万到1000亿的财富狂飙,秒杀巴菲特!量化投资之父西蒙斯秘籍大揭秘!#梁文峰 #投资 #思维认知 #Deepseek
00:00 / 05:08
连播
清屏
智能
倍速
点赞
NaN
千越中华
1周前
DeepSeek梁文锋跻身全球富豪榜 预估身家或超黄仁勋
00:00 / 05:47
连播
清屏
智能
倍速
点赞
399
根号2
11月前
梁文锋的来时路:从幻方量化,到全球顶级AI大模型的创始人 #DeepSeek #幻方量化 #热点话题 #AI #韭菜
00:00 / 05:39
连播
清屏
智能
倍速
点赞
365
21世纪经济报道
1周前
新年重磅!DeepSeek有新东西,新论文梁文锋现身作者名单。论文中提出全新网络架构,或为下一代模型铺垫
00:00 / 00:12
连播
清屏
智能
倍速
点赞
91
京城数码
1周前
#真实内容 #中国制造 #了不起的中国制造 #每日学习一点点 #内容真实
00:00 / 00:08
连播
清屏
智能
倍速
点赞
3
凡索观察
11月前
一名程序员眼里中国量化投资的未来-梁文锋 DeepSeek & 幻方 创始人2019年的演讲内容 #量化 #deepseek @凡索观察
00:00 / 13:01
连播
清屏
智能
倍速
点赞
392
传记出版网
7月前
中国的年轻人又一次震动世界了! #梁文锋 #ai #传记 #企业家 #出版
00:00 / 02:59
连播
清屏
智能
倍速
点赞
83
亮哥学AI
10月前
花3分钟,给孩子听下Deepseek创始人梁文锋的采访记录,明白读书将来的意义。值得给更多的孩子听听#DeepSeek #人工智能 #孩子 #学习 #梁文锋
00:00 / 07:41
连播
清屏
智能
倍速
点赞
NaN
梁辉讲粤语
11月前
#话题上热门 Deepseek创始人梁文锋的母语系黎话?#粤语文化 #梁文锋 #AI #广东人
00:00 / 03:53
连播
清屏
智能
倍速
点赞
452
AI碎碎念
9月前
“代码狂人”梁文锋的疯魔人生 #梁文锋 #deepseek#创始人故事
00:00 / 01:36
连播
清屏
智能
倍速
点赞
16
私募排排网
7月前
第一人称自述视角,带你深度了解梁文锋! #财经 #金融 #梁文锋 #DeepSeek #私募排排网
00:00 / 03:10
连播
清屏
智能
倍速
点赞
NaN
流星蝴蝶剑
11月前
读书有用吗?花三分钟,听一下答案 deepseek创始人梁文锋的访谈实录,值得转给更多孩子听听#deepseek #梁文锋 #人工智能 #湛江 #杭州
00:00 / 03:15
连播
清屏
智能
倍速
点赞
2107
名人智慧
10月前
deepseek创始人梁文锋,赚钱速度到底有多可怕吗?会用AI的人,正在淘汰那些不会用AI的人#人工智能 #deepSeek #ai #梁文锋 #思维认知
00:00 / 03:44
连播
清屏
智能
倍速
点赞
NaN
大司马聊科技
5月前
从量化天王到AI先锋,小镇青年梁文锋的崛起之路 #硅基智能#司马华鹏#硅基数字人#梁文锋#DeepSeek
00:00 / 02:47
连播
清屏
智能
倍速
点赞
341
AI阿楠
7月前
梁文锋遇到麻烦了 #梁文锋 #科技 #互联网资讯 #AI工具 #vidu
00:00 / 01:42
连播
清屏
智能
倍速
点赞
6953
瑞克老张有话说
5月前
梁文锋论文获奖,DeepSeek V4真要来了? #梁文锋 #deepseek #AI #大模型 DeepSeek下一代技术提前曝光,梁文锋署名论文获ACL2025最佳论文。这项技术可以把上下文长度扩展到1百万tokens,将被应用到下一个前沿模型中。结合论文发表于DeepSeek-R1推出之后,实验设置中也提到使用了DeepSeek-R1的蒸馏数据来微调了新的模型。大家纷纷猜测,这项技术将被用于下一代DeepSeek-V4以及DeepSeek-R2。
00:00 / 05:34
连播
清屏
智能
倍速
点赞
1117
AI张子淼
6月前
梁文锋面对巨大挑战,全球的AI公司都不淡定了 #梁文锋 #DeepSeek #AI #科技 #人工智能
00:00 / 00:50
连播
清屏
智能
倍速
点赞
997
华
10月前
梁文锋#幻方量化 #DeepSeeK#人工智能#ai
00:00 / 01:47
连播
清屏
智能
倍速
点赞
2539
韩歌飞扬
10月前
广东AI三巨头之:梁文峰
00:00 / 03:21
连播
清屏
智能
倍速
点赞
2
小婷讲AI
9月前
梁文锋一路走来的艰辛 #deepseek #梁文锋 #热点 #国产AI #干货分享
00:00 / 01:56
连播
清屏
智能
倍速
点赞
32
小满💕
9月前
就连科学也解释不了,梁文峰到底有多强 #梁文峰 #deepseek #励志 #正能量
00:00 / 14:13
连播
清屏
智能
倍速
点赞
5
话框
10月前
梁文锋往事曝光,幸亏他上了浙大而没有报清华! #大实话 #Deepseek #梁文锋 #ai #正能量
00:00 / 00:05
连播
清屏
智能
倍速
点赞
6885
酱可可
8月前
美国人眼中最值钱的天才少年,每一个人都是我们真正的无价之宝!最后一位彻底改变了我们的生活#deepseek #梁文锋 #人工智能 #好书推荐
00:00 / 08:30
连播
清屏
智能
倍速
点赞
NaN
ai言翎
6月前
梁文锋再次放出大招!连马斯克都自愧不如! #梁文锋 #马斯克 #AI #认知 #趋势
00:00 / 00:52
连播
清屏
智能
倍速
点赞
234
黑马牛文文
10月前
梁文锋3次拒绝,著名天使投资人抛出的橄榄枝 #DeepSeek #梁文锋 #人工智能 #创业黑马 #牛文文
00:00 / 01:09
连播
清屏
智能
倍速
点赞
296
虾哥老板AI人工智能
8月前
梁文锋吓得连夜推出三个核弹级别的网站!!!#deepseek #梁文锋 #AI #矩阵 #矩阵系统
00:00 / 01:19
连播
清屏
智能
倍速
点赞
440
AI小星
1周前
2025 年最后一天,创始人梁文锋还亲自参与了,一篇论文?
00:00 / 01:12
连播
清屏
智能
倍速
点赞
2
简介:
您在查找“
梁文锋提出的mhc到底是什么
”短视频信息吗?
帮您找到更多更精彩的短视频内容!
最新发布时间:2026-01-06 05:39
最新推荐:
瓦罗兰特怎么修改战区
三角洲20系显卡怎么开dlss
南迦巴瓦峰身后是什么
尘埃安装教程
亲戚关系让我内耗了怎么办
花洛莉亚提亮怎么用陈圆圆
词最好的诗人
萨摩耶幼年特点
罗云熙新剧《剥茧》水里加了啥
今晚巅峰赛什么时候停服
相关推荐:
e宝全面战争三国mod怎么装
农场物语胶水怎么做
不管怎样我都会守护你的歌
大乐透62预测
10周年最具影响力主播
加更fcc说了什么
fc26怎么一键更新ut
DLSS4.5对比幻灯片
2026电子表格函数生成动态
唐三蓝银草第六魂技是什么
热门推荐:
乌萨齐是哪个国家的
政治哲学分为哪几类
委内瑞拉领导保卫工作哪个部门负责
委内瑞拉总统说什么成语
韩国访华对日本影响
委内瑞拉公告怎么做
11国联合声明影响
为了国家为了人民是哪个党
韩国总统李在明几天
政治怎么分辨是什么为什么怎么做