Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko; compatible; ClaudeBot/1.0; +claudebot@anthropic.com)
精选
推荐
搜索
探索
直播
放映厅
短剧
小游戏
搜索
您是不是在找:
男生怎么学30倍杠杆做空闺蜜
大a放量了吗
三月股票亏损10个点是什么水平
台湾股票账户库存po图是什么样的
连续4000家下跌
美军陆战队抵达中东对经济股市影响
晨安科技是干什么的
马斯克spacex提交ipo时间
黄金分割线0.786是如何来的
法尔胜是什么概念股ai
海晏清的阳光海洋
4天前
各位朋友,今天聊聊Google刚发布的“内存瘦身神器”TurboQuant!它专治大模型推理时的“内存膨胀病”:KV缓存越存越多,拖慢速度还费钱。它的秘密武器是两招:第一招叫PolarQuant,把数据从直角坐标转成极坐标(类似“半径+角度”),利用角度分布集中的特点,省掉传统量化的额外开销,直接压缩到3比特;第二招QJL,用1比特残差修正误差,像给数据“打补丁”,保证精度不丢。这俩一结合,KV缓存内存直降6倍,推理速度飙8倍,关键是不用重新训练模型,Gemma、Mistral这些现成模型直接套用!以后长对话、大文件处理,再也不用担心“内存爆了”,连手机都能跑长文本大模型,这波技术真香!#人工智能 #机器人 #马斯克 #奥特曼 #黄仁勋 @尹烨 @红衣大叔周鸿祎 @雷军
00:00 / 00:54
连播
清屏
智能
倍速
点赞
11
Chris IT先生
5天前
#AI#大模型 #算法 #Google
00:00 / 01:28
连播
清屏
智能
倍速
点赞
39
郝点儿
5天前
谷歌新发布 turbo quant 六倍压缩 kv cache,你们期待吗?#谷歌 #ai #大模型
00:00 / 01:34
连播
清屏
智能
倍速
点赞
325
Annie智言智语
1周前
内存堪比上海一套房!#内存#HBM#企业级SSD#存储#Token
00:00 / 01:11
连播
清屏
智能
倍速
点赞
33
财论社
5天前
谷歌发布KV缓存压缩技术谷歌TurboQuant存储为什么跌 #存储芯片#谷歌 #缓存 #缓存压缩
00:00 / 01:04
连播
清屏
智能
倍速
点赞
60
LeoPrinceAI
5天前
谷歌新算法压降AI内存需求,存储芯片承压 解析TurboQuant如何6倍压缩KV缓存,及其对HBM/NAND需求、AI算存平衡的潜在影响 #谷歌 #存储芯片 #hbm #nand #新质生产力
00:00 / 05:31
连播
清屏
智能
倍速
点赞
4
叫我卷卷
2天前
5分钟搞懂TurboQuant!Google AI黑科技 众所周知,随着大模型对话上下文越来越多,KV cache 导致的内存压力越来越大,也是制约现在AI 发展的关键环节。 Google 在3月发表的新的论文提到“TurboQuant”内存压缩,可以将KV cache 压缩到六分之一左右,并且基本不影响模型效果,发布后引爆硅谷AI圈。今天我们就花5分钟时间,深入浅出的理解一下Google的TurboQuant到底做了什么。 #大模型 #ai #google #深度学习
00:00 / 06:48
连播
清屏
智能
倍速
点赞
6
算法博士
4天前
谷歌也被存储卡脖子? 最近谷歌刚放出一篇论文,急着推出自己的KV Cache压缩技术……#AI #谷歌 #存储 #科技#好东西晒点大会
00:00 / 01:51
连播
清屏
智能
倍速
点赞
1
龙哥AI全视角
4天前
谷歌kv缓存压缩算法,节省内存开支有限,适用场景不普适#谷歌 #AI
00:00 / 00:29
连播
清屏
智能
倍速
点赞
23
北鼻有料_研报解读
5天前
美光科技,朗科科技
00:00 / 02:43
连播
清屏
智能
倍速
点赞
7
作手阿飞(巴菲特版)
5天前
美股存储集体下挫!谷歌发布KV缓存压缩技术 #热点 #财经 #存储 #人工智能 #作手阿飞
00:00 / 00:40
连播
清屏
智能
倍速
点赞
3297
夜蝶-AI信息速递
5天前
TurboQuant后续 存储白跌了? Google的TurboQuant论文砸崩存储股,但大部分压缩红利早被工程消化。从1×到4.5×已逼近香农极限,这条路快走到头了。#TurboQuant #KVcache #存储股 #AI芯片 #大模型推理 #量化压缩 #科技解读
00:00 / 01:32
连播
清屏
智能
倍速
点赞
166
芯片yi姐
5天前
谷歌一纸论文血洗存储板块,别被市场带偏了。 #谷歌 #KV缓存 #存储 #美股
00:00 / 03:00
连播
清屏
智能
倍速
点赞
899
盯当猫tsukasa
4天前
倒狗好似喵#内存条降价 #安田危机 #内存条 #空中飞人#电脑diy #空中飞人
00:00 / 00:18
连播
清屏
智能
倍速
点赞
NaN
周大爷说事儿
4天前
#科普#热点新闻事件 #涨知识
00:00 / 03:42
连播
清屏
智能
倍速
点赞
31
夜蝶-AI信息速递
5天前
Google把KV内存砍到六分之一 还快八倍 Google Research刚发了TurboQuant,把大模型最烧内存的KV Cache压到原来六分之一,H100上注意力计算最高快八倍,几乎零精度损失,不需要重新训练。它用PolarQuant把向量转成极坐标压缩边界信息,再用QJL对残差做1-bit编码,最后靠无偏估计补回误差。LongBench上效果基本保住,KV内存直接砍六倍以上。这不是普通论文更新,这是在重写AI系统的内存账本。#TurboQuant #GoogleResearch #AI #KVCache #大模型 #量化 #深度学习 #人工智能
00:00 / 01:18
连播
清屏
智能
倍速
点赞
42
根根趣闻
4天前
#科技 #内存 #谷歌 #财经知识 谷歌发布新技术,ai变天?
00:00 / 01:10
连播
清屏
智能
倍速
点赞
3
Trader韭
5天前
存储大跌 谷歌KV缓存压缩 deepseek时刻2.0? 存储大跌 谷歌KV缓存压缩 deepseek时刻2.0? #存储 #美光 #闪迪 #谷歌 #TurboQuant
00:00 / 03:37
连播
清屏
智能
倍速
点赞
413
博时基金
5天前
谷歌发布KV缓存压缩技术!存储板块集体下挫! #KV缓存 #谷歌 #存储板块 #博时热点快讯 @DOU+小助手
00:00 / 00:38
连播
清屏
智能
倍速
点赞
479
眼睛-已停更-
11月前
运营:别告诉老板我在断轨痛击哈夫克
00:00 / 01:14
连播
清屏
智能
倍速
点赞
NaN
胡子哥资讯
5天前
高位利空?存储板块承压,谷歌发布 KV缓存压缩技术存储需求预期遭冲击#存储芯片#存储#美股#股市#谷歌 理财有风险投资需谨慎
00:00 / 00:41
连播
清屏
智能
倍速
点赞
359
上市公司消息解读
5天前
#涨知识 #消息解读
00:00 / 02:41
连播
清屏
智能
倍速
点赞
72
自己拼凑的小伴
4天前
#股票 存储芯片又得抗压了
00:00 / 00:17
连播
清屏
智能
倍速
点赞
17
华吹
4天前
黄仁勋命根子被人刨了啊。谷歌发布超高效AI内存压缩算法TurboQuant。将大型语言模型运行时的缓存内存占用至少减少6倍、性能提升8倍。 这一技术直接把算力卡的需求减少了48倍
00:00 / 00:37
连播
清屏
智能
倍速
点赞
1169
架构师之路
11月前
(57)每秒10万并发写,无锁缓存,如何实现?第57期 #程序员#架构师#架构师之路#干货分享 知其然,知其所以然!
00:00 / 03:50
连播
清屏
智能
倍速
点赞
6901
医大四院张会永
3月前
#传承中医文化 #张会永 #张会永老师
00:00 / 04:42
连播
清屏
智能
倍速
点赞
NaN
余杰丰AI
4天前
谷歌新论文让AI提速8倍 别再花冤枉钱买几万块的顶配电脑了! 谷歌刚刚开源了王炸技术TurboQuant,大模型推理提速,内存占用暴降!一台16G的Mac Mini都能流畅跑满血AI,普通人的算力自由真的要来了!这波技术开源你怎么看?评论区聊聊👇 #AI #谷歌 #内存 #大模型 #黑科技
00:00 / 00:08
连播
清屏
智能
倍速
点赞
62
糖糖_TangYani_
3天前
内存降价真的是谷歌新技术引起的吗 #内存 #内存条 #AI #大模型 非深入研究,可能有部分错误
00:00 / 03:01
连播
清屏
智能
倍速
点赞
318
大罗8秒解读
5天前
#谷歌 #算法
00:00 / 00:07
连播
清屏
智能
倍速
点赞
0
重庆商报
5天前
谷歌新算法声称 能“6倍压缩KV缓存” 美股存储板块集体走弱
00:00 / 00:07
连播
清屏
智能
倍速
点赞
2
比尔·盖被(登榜福布斯中)
2天前
#父亲#父爱 #父亲的爱 #父爱一直在身边 #父亲的爱总是无声
00:00 / 01:18
连播
清屏
智能
倍速
点赞
NaN
老余
3天前
#股民交流 #股民
00:00 / 02:24
连播
清屏
智能
倍速
点赞
11
睿睿
4天前
谷歌把AI内存“压缩”了!KV缓存减6倍提速8倍🤯💾#谷歌 #TurboQuant #AI内存 #KV缓存 #美光
00:00 / 00:09
连播
清屏
智能
倍速
点赞
85
来思则摩
4天前
3.26 HN AI 热榜:一边狂飙,一边碰壁 1️⃣ TurboQuant|Google 极限压缩方案,KV 缓存 + 向量检索内存双减负,AI 工程正式进入拼成本、拼显存时代 🔗 https://news.ycombinator.com/item?id=47513475 2️⃣ ARC-AGI-3|首个交互式 Agent 评测基准,不刷静态题,专测探索、试错、适应能力,单轮问答彻底 OUT 🔗 https://news.ycombinator.com/item?id=47520309 3️⃣ Ensu|本地离线 LLM App,隐私为王,但本地运行≠产品价值,工作流 + UX 才是真壁垒 🔗 https://news.ycombinator.com/item?id=47516650 4️⃣ GitHub Copilot|用户交互数据默认用于训练引争议,AI 产品的默认值就是价值观 🔗 https://news.ycombinator.com/item?id=47521799 5️⃣ 模型量化|从冷门部署技巧变基础工程能力,本地 / 边缘部署必学核心技能 🔗 https://news.ycombinator.com/item?id=47519295 6️⃣ Claude Code|90% 产出流向低星 GitHub 仓库,别迷信 stars、commit 数,真实价值才是硬指标 🔗 https://news.ycombinator.com/item?id=47521157 7️⃣ 医疗 AI 禁令|新西兰禁用 ChatGPT 写临床记录,高风险行业合规>demo 效果 🔗 https://news.ycombinator.com/item?id=47523169 8️⃣ 社媒成瘾案|Meta/YouTube 被判过失,算法优化上瘾行为要承担法律责任 🔗 https://news.ycombinator.com/item?id=47520505 9️⃣ 欧盟隐私监管|拟扫描私人消息 / 照片,AI 正式进入社会审核、监控基建层面 🔗 https://news.ycombinator.com/item?id=47522709 🔟 版权判例反转|美最高法支持 Cox,平台责任边界重塑 AI 训练数据合规规则 🔗 https://news.ycombinator.com/item?id=47518
00:00 / 17:08
连播
清屏
智能
倍速
点赞
2
Tech Alpha研选
5天前
谷歌提出的 TurboQuant 压缩算法,在几乎不牺牲精度、无需重训模型的前提下,实现了对大模型推理中 KV cache 的约 6 倍内存压缩和最高 8 倍加速,显著改善单卡推理产出效率。 #谷歌 #turboquant #大模型 #人工智能 #美股
00:00 / 06:27
连播
清屏
智能
倍速
点赞
66
Ryan大模型
4天前
别把 #TurboQuant 吹上天!TurboQuant只针对KV Cache进行优化,无法压缩占更大显存的权重文件。
00:00 / 00:15
连播
清屏
智能
倍速
点赞
32
想不起来叫什么D4
5天前
#热门 浅聊一下,听完弄简直播的感触 #desire4
00:00 / 02:16
连播
清屏
智能
倍速
点赞
3243
杨大哥
3天前
Turbo Quant-Atomic Chat
00:00 / 01:27
连播
清屏
智能
倍速
点赞
3361
Agent创世纪
3周前
KV缓存压缩50倍与百倍加速 MIT重磅发布:大模型KV缓存压缩50倍,处理速度快百倍且精度近乎无损这项研究介绍了一种名为注意力匹配(Attention Matching)的新技术,旨在解决大型语言模型在处理长文本时面临的键值(KV)缓存内存瓶颈。该方法通过优化算法(如正交匹配追踪)和引入标量偏差,在大幅缩减缓存体积的同时,力求模拟原始模型的注意力行为。研究者发现,不同注意力头对压缩的敏感度各异,因此采用非均匀预算分配策略来进一步提升效率。实验证明,该方法在保持高准确度的前提下,处理速度比现有的梯度优化方法快出两个数量级。此外,这种技术还能与文本摘要结合使用,或应用于在线实时压缩,从而支持更长周期的逻辑推理。该成果为在有限硬件资源下实现长文本理解与复杂智能体协作提供了更具可行性的方案。#KV缓存压缩 #AttentionMatch #大语言模型 #LLM #MIT #注意力匹配 #长文本处理 #LongContext #推理优化 #InferenceOptim #正交匹配追踪 #OMP
00:00 / 08:32
连播
清屏
智能
倍速
点赞
52
财经小怪兽
4天前
#财经#金融#股市#消息面#股民
00:00 / 00:10
连播
清屏
智能
倍速
点赞
20
AI天天酱
4天前
显存焦虑终结?谷歌TurboQuant压缩6倍KVCache 谷歌展示TurboQuant算法,KV Cache压缩6倍精度零损失,美光西部数据股价大跌;阿里Qoder专家团模式上线,开启多智能体协同编程新范式;它石智航A1机器人刷新吉尼斯纪录,亚毫米级精度让工业自动化进入新纪元! #AI #谷歌 #开源 #阿里Qoder #具身智能 #程序员 #GPU
00:00 / 02:32
连播
清屏
智能
倍速
点赞
6
老六看趋势
5天前
存储芯片要被谷歌挂山顶了?
00:00 / 01:26
连播
清屏
智能
倍速
点赞
117
void
4天前
太好了终于能看空中飞人了#存储芯片 #涨价
00:00 / 00:18
连播
清屏
智能
倍速
点赞
649
星云动漫
3天前
坦克动画中最忠诚的角色!-IS44 #坦克动画 #坦克世界动画 #IS44 #深度解析 #gerand
00:00 / 03:35
连播
清屏
智能
倍速
点赞
3813
善财雯子
4天前
3.26📝 😤#股民 #财经
00:00 / 01:37
连播
清屏
智能
倍速
点赞
13
花兒街大叔
4天前
03/26 美光闪迪暴跌!谷歌新算法,消灭内存股? 内存股崩盘了,美光,闪迪连续两天大跌,谷歌新算法能够把大模型缓存压缩6倍,内存占用砍掉80%以上,推理速度提升8倍,而且精确度100%,做到零损失。内存行业因此面临生死劫,满仓内存股如何自救?#美股 #MU #SNDK #半导体 #AI
00:00 / 10:42
连播
清屏
智能
倍速
点赞
53
KOVE 王榛
6天前
我们坦然倾听质疑的声音,同时#水鸟 是最优秀的ADV车型之一,能被拿来和#凯越625X 对标,是鞭策更是荣耀——这也正是凯越ADV车型研发始终追求的初心。 #凯越625X
00:00 / 02:19
连播
清屏
智能
倍速
点赞
5736
龍
5天前
☕️新闻早知道 1️⃣ SpaceX计划最早本周提交IPO申请,公司在IPO中或募资超750亿美元,高于此前外界估计的500亿美元。 2️⃣ 谷歌新算法声称能“6倍压缩KV缓存” 美股存储板块承压走弱。 3️⃣ 特斯拉Optimus机器人第三代准备量产,马斯克称其将改变全球劳动力经济格局。
00:00 / 01:09
连播
清屏
智能
倍速
点赞
0
小牛聊AI
4天前
谷歌TurboQuant压缩算法:KV cache内存降6倍 AI推理内存瓶颈被突破,美光股价应声大跌 小牛说:谷歌新论文TurboQuant将AI推理中的KV cache压缩至少6倍,精度零损失,速度提升8倍。这项技术通过极坐标量化和量化JL变换实现3-bit量化,无需额外内存开销。虽然目前还是实验室成果,但已引发存储芯片市场震动。你觉得这会是AI内存的DeepSeek时刻吗? #AI #内存压缩 #KVcache #芯片 #科技
00:00 / 00:10
连播
清屏
智能
倍速
点赞
34
巴菲特遇见索罗斯陈长
4天前
杰文斯悖论也拯救不了存储器业务情绪的衰败!
00:00 / 07:45
连播
清屏
智能
倍速
点赞
118
科技快喵
4天前
3月27日全球科技圈动态
00:00 / 01:07
连播
清屏
智能
倍速
点赞
4
口罩哥直播号
5天前
谷歌ymf!!!
00:00 / 01:06
连播
清屏
智能
倍速
点赞
3677
科技信息
4天前
2026年3月24日全球热点资信 #今日头条 #热点信息 #股市 #黄金 #科技资讯#人工智能 #新能源#机器人#今日热点#新闻 #OpenClaw #原油 #名人故事 #石油 #大模型应用 #低空经济
00:00 / 02:16
连播
清屏
智能
倍速
点赞
19
爱炒股的小马
4天前
兄弟们快醒醒!外围市场已经“炸锅”了!跟大家说个事儿。 老美三大指数全线飘绿,科技板块大幅回调,存储领域的闪迪直接暴跌11%。 原因还是咱昨天早报提过的,谷歌开发了KV缓存压缩技术,能让存储成本缩减6倍。您说这没事开发什么新技术呢?消息刚出来时,大伙还半信半疑,结果经过昨天一天的发酵,昨晚存储板块集体“栽跟头”。期货市场那边也不省心,纽约金跌了3.88%,银更是暴跌6.22%。其他消息在这面前,基本没啥分量了。 兄弟们,面对这外围局势,咱大A能不能硬气一回?别老跟着“买单”了,走一波独立行情行不行?#股票 #投资 #股市 #财富增长
00:00 / 00:50
连播
清屏
智能
倍速
点赞
6
黄财神
4天前
有一样,也有不一样
00:00 / 01:27
连播
清屏
智能
倍速
点赞
160
熊猫信息社
5天前
谷歌新算法重挫存储股
00:00 / 01:03
连播
清屏
智能
倍速
点赞
106
简介:
您在查找“
kv缓存压缩龙头是谁
”短视频信息吗?
帮您找到更多更精彩的短视频内容!
最新发布时间:2026-03-29 06:39
最新推荐:
被朋友说是青蛙是什么意思
现在很堂的歌曲
两只猫会找自己的猫砂盆吗
洛克王国世界精灵怎么骑乘
山青研学基地
刮土豆丝神器多功能第一名
洛克王国卡在明天找可莉怎么办
电子身份证和纸质身份证区别
洛克王国十九级后没任务了咋整
金子是如何从男子体内到女子体内的
相关推荐:
豆包云南p图蓝花楹指令教程
做什么的女儿长这样
养生食材购买
洛克王国世界苹果授权体验怎么预约
创游世界出群是啥意思
玫瑰ak怎么赠送
权欲之巅智秀是谁演的
娘娘腔ai短剧在哪看
对它好也许只花了你一部分的时间
洛克王国背包满了宠物会消失吗
热门推荐:
哈夫币回收计划中的野炊利器是哪个
交叉点为什么一定有牛
blf哪里冒出来的
油价影响哪些行业
个人贷款利息一般是多少
银行卡不可以绑定别人名下手机号码
舒华体育的基金有哪些
台湾股票账户库存po图是什么样的
黄金白银ETF在哪里查看抛售数据
dollar trader怎么操作