558
44
368
105
举报
发布时间:2026-03-30 09:38
查看AI文稿
郝点儿
郝点儿

粉丝4124获赞15.0万

相关视频

  • 谷歌最新TurboQuant技术如何突破AI内存墙 谷歌 TurboQuant技术凭什么让美光、三星股价大跌?因为它把大模型“内存杀手” KV Cache 直接砍掉了 6 倍! 黑科技: 给模型装上“超级缩微胶卷”。 不仅省: 内存占用减 6 倍,智商还不掉! 还要快: 推理速度 TPS 飙升,告别“打字机”卡顿。 更长了: 以前读 50 页就忘,现在 200 页轻松分析。 5分钟带你读懂这个改变 AI 投资版图的硬核技术!⚡ #AI #谷歌 #TurboQuant #科技前沿 #大模型 #显存优化
    07:34
    查看AI文稿
  • SanDisk暴跌11% 一篇论文48小时蒸发数十亿美元 Google Research 发了篇叫 TurboQuant 的论文,把 AI 模型的 KV 缓存从 16bit 压到 3bit。6倍压缩,精度几乎无损。
投资者没等同行评审直接用脚投票:SanDisk -11%,Micron -7%,SK海力士 -6.2%,三星 -4.7%,连英伟达都跌了4.2%。费城半导体指数整体跌近5%,同一时间纳斯达克在涨。
Morgan Stanley 的分析师倒很冷静:市场反应过度了,TurboQuant 只压缩 KV 缓存,不压缩模型权重。
但真正的反转是杰文斯悖论——资源越便宜,人们用得越多。省了6倍内存?公司就会跑6倍复杂的模型。社区实测 M4 Air 16GB 之前跑 9B 到两万上下文就崩溃,用了 TurboQuant 之后稳定运行。
内存需求不会减少,只会爆炸式增长。 
#AI  #人工智能  #Google #深度解读  #硬核科普
    04:13
    SanDisk暴跌11% 一篇论文48小时蒸发数十亿美元 Google Research 发了篇叫 TurboQuant 的论文,把 AI 模型的 KV 缓存从 16bit 压到 3bit。6倍压缩,精度几乎无损。
    投资者没等同行评审直接用脚投票:SanDisk -11%,Micron -7%,SK海力士 -6.2%,三星 -4.7%,连英伟达都跌了4.2%。费城半导体指数整体跌近5%,同一时间纳斯达克在涨。
    Morgan Stanley 的分析师倒很冷静:市场反应过度了,TurboQuant 只压缩 KV 缓存,不压缩模型权重。
    但真正的反转是杰文斯悖论——资源越便宜,人们用得越多。省了6倍内存?公司就会跑6倍复杂的模型。社区实测 M4 Air 16GB 之前跑 9B 到两万上下文就崩溃,用了 TurboQuant 之后稳定运行。
    内存需求不会减少,只会爆炸式增长。
    #AI #人工智能 #Google #深度解读 #硬核科普
    查看AI文稿
  • Google即将Get一个标签:内存价格终结者🥷 Google Research最新发布了TurboQuant 的创新AI 压缩技术,能减少最高6倍内存占用,并能将处理速度提高数倍。
核心就两步:
1️⃣PolarQuant:抛弃传统的直角坐标,把数据丢进极坐标系!通过巧妙的随机旋转,把数据分布变得像钟表一样规律,直接干掉了传统量化方法里的“额外内存开销”。 2️⃣QJL:针对剩下的计算误差,它只用 1-bit 的算力(要么 +1 要么 -1)做了一个极限纠错,保证了大模型 Attention 机制的绝对精准!
对于需要在本地设备(尤其是Mac)上部署开源大模型开发者来说,这项技术堪称神级。
#我的数码好物清单 #本地大模型 #大模型微调 #开源项目 #ai工具学习
    01:22
    Google即将Get一个标签:内存价格终结者🥷 Google Research最新发布了TurboQuant 的创新AI 压缩技术,能减少最高6倍内存占用,并能将处理速度提高数倍。
    核心就两步:
    1️⃣PolarQuant:抛弃传统的直角坐标,把数据丢进极坐标系!通过巧妙的随机旋转,把数据分布变得像钟表一样规律,直接干掉了传统量化方法里的“额外内存开销”。 2️⃣QJL:针对剩下的计算误差,它只用 1-bit 的算力(要么 +1 要么 -1)做了一个极限纠错,保证了大模型 Attention 机制的绝对精准!
    对于需要在本地设备(尤其是Mac)上部署开源大模型开发者来说,这项技术堪称神级。
    #我的数码好物清单 #本地大模型 #大模型微调 #开源项目 #ai工具学习
    查看AI文稿
  • 谷歌最新量化算法,4比特几乎不损失精度 #大模型 #ai
    04:20
    查看AI文稿
  • 5分钟搞懂TurboQuant!Google AI黑科技 众所周知,随着大模型对话上下文越来越多,KV cache 导致的内存压力越来越大,也是制约现在AI 发展的关键环节。 
Google 在3月发表的新的论文提到“TurboQuant”内存压缩,可以将KV cache 压缩到六分之一左右,并且基本不影响模型效果,发布后引爆硅谷AI圈。今天我们就花5分钟时间,深入浅出的理解一下Google的TurboQuant到底做了什么。 
#大模型  #ai  #google  #深度学习
    06:49
    查看AI文稿
  • 谷歌TurboQuant算法引爆内存股崩盘 谷歌研究院3月26日发布TurboQuant压缩算法,宣称能在不损失精度前提下,将AI运行时键值缓存内存占用降低6倍,性能提升最高8倍。消息一出,美光、三星、SK海力士等存储巨头股价应声暴跌,单日市值蒸发超900亿美元。#谷歌 #内存不足 #股价暴跌对公司的影响 #科技资讯 #科技前沿
    00:44
    查看AI文稿
  • #AI#大模型 #算法 #Google
    01:29
    查看AI文稿
  • AI本周Top进展(20260329)|TurboQuant AI本周Top进展:谷歌黑科技改写算力规则,巨头新模密集登场,国产 AI 强势领跑。1分钟我们速读AI关键进展和核心趋势。 
本周头号炸场:谷歌TurboQuant压缩黑科技横空出世!无需微调模型,靠极坐标变换 + 1bit 误差校正,把大模型 KV 缓存压到 3bit,内存狂降 6 倍、H100 推理速度飙升 8 倍,长文本推理零精度损失,小显存设备跑大模型成为现实,直接引发存储芯片板块震动。 
谷歌另一王炸Agent Smith智能体爆火出圈,员工抢用挤爆服务器!手机就能远程指挥,自动写代码、测漏洞、办办公,自主性拉满,布林亲自参与研发,谷歌更是把 AI 工具纳入绩效考核。 
Anthropic 绝密模型Claude Mythos意外泄露,实力碾压所有旗舰,编程、学术推理、网络安全能力断层领先,因安全风险仅封闭测试,堪称 “最强闭卷王”。
多模态与前沿科技全面爆发:谷歌 Gemini3.1 Flash Live 实时语音 AI 覆盖 200 国,自带隐形水印防造假;Meta TRIBE v2 数字大脑模型,秒预测人脑神经活动,全开源助力脑科学研究。 
国产 AI 火力全开:智谱 GLM-5.1 编程能力逼近全球顶尖,订阅套餐瞬间售罄;昆仑万维三大模型登顶游戏、视频、音乐赛道,视频模型拿下全球第一;蚂蚁 F2LLM-v2 支持 282 种语言,横扫 11 项评测第一;港科大 PhysBrain 用人自拍视频训练机器人,大幅降低具身智能成本。 
本周 AI 核心趋势已定:效率优先、智能体爆发、多模态深化、安全与开源并重!这场 AI 革命,正以肉眼可见的速度落地。
#AI #AIGC #Agent #Google #大模型
    01:31
    AI本周Top进展(20260329)|TurboQuant AI本周Top进展:谷歌黑科技改写算力规则,巨头新模密集登场,国产 AI 强势领跑。1分钟我们速读AI关键进展和核心趋势。
    本周头号炸场:谷歌TurboQuant压缩黑科技横空出世!无需微调模型,靠极坐标变换 + 1bit 误差校正,把大模型 KV 缓存压到 3bit,内存狂降 6 倍、H100 推理速度飙升 8 倍,长文本推理零精度损失,小显存设备跑大模型成为现实,直接引发存储芯片板块震动。
    谷歌另一王炸Agent Smith智能体爆火出圈,员工抢用挤爆服务器!手机就能远程指挥,自动写代码、测漏洞、办办公,自主性拉满,布林亲自参与研发,谷歌更是把 AI 工具纳入绩效考核。
    Anthropic 绝密模型Claude Mythos意外泄露,实力碾压所有旗舰,编程、学术推理、网络安全能力断层领先,因安全风险仅封闭测试,堪称 “最强闭卷王”。
    多模态与前沿科技全面爆发:谷歌 Gemini3.1 Flash Live 实时语音 AI 覆盖 200 国,自带隐形水印防造假;Meta TRIBE v2 数字大脑模型,秒预测人脑神经活动,全开源助力脑科学研究。
    国产 AI 火力全开:智谱 GLM-5.1 编程能力逼近全球顶尖,订阅套餐瞬间售罄;昆仑万维三大模型登顶游戏、视频、音乐赛道,视频模型拿下全球第一;蚂蚁 F2LLM-v2 支持 282 种语言,横扫 11 项评测第一;港科大 PhysBrain 用人自拍视频训练机器人,大幅降低具身智能成本。
    本周 AI 核心趋势已定:效率优先、智能体爆发、多模态深化、安全与开源并重!这场 AI 革命,正以肉眼可见的速度落地。
    #AI #AIGC #Agent #Google #大模型
    查看AI文稿
  • 谷歌最新算法TurboQuant大幅压缩内存使用 #ai #aigc #大模型
    00:35
    查看AI文稿
  • 【谷歌推出压缩算法TurboQuant 宣称实现约6倍内存节省】#财经知识
    01:18
    查看AI文稿
  • turboquant 谷歌新算法 拯救内存 #ai #谷歌 #turboquant #内存 #算法
    01:55
    查看AI文稿
  • 谷歌TurboQuant终结英伟达显存霸权 谷歌新算法压缩能力堪比把大象装进冰箱,凭一己之力撼动整个显存股票圈。#AI人工智能 #谷歌 #显存 #英伟达 #算法
    00:38
    查看AI文稿
  • 把大象塞进冰箱,还不让它喘粗气? 聊聊谷歌最新研究TurboQuant这个AI模型"压缩魔法"
 #谷歌  #Google  #AI算法  #TurboQuan t #大模型
    02:06
    查看AI文稿
    111JUN
  • 存储卡都涨了300%了,google用论文拯救普通人的钱包#google #大模型 #openclaw #程序员科普 #互联网资讯
    03:17
    查看AI文稿
  • 谷歌TurboQuant:AI内存压缩,内存市场要变天! 谷歌最新研究 TurboQuant,通过 PolarQuant + QJL 两步压缩,实现 3-bit 无精度损失量化,在  H100 上获得 8 倍性能提升,已应用于 Gemini 模型。                     
 当同样的推理任务只需要 1/8 的显存,SK 海力士、三星、美光正在疯狂扩产的 HBM
 产线,会不会变成过剩产能? 
 本期从技术原理讲到产业冲击,两分半说清楚。 
 论文来源:research.google/blog/turboquant-redefining-ai-efficiency-with-extreme-compres
 sion/#程序员 #科研
    02:41
    查看AI文稿
  • #谷歌 发布#TurboQuant AI内存压缩算法,带崩美股#存储芯片 巨头#美光 #闪迪 @DOU+上热门
    02:11
    查看AI文稿