token, token! token! 这次二零二六英伟大 gtc 大 会,感觉满屏幕都充斥着 token, 老黄甚至还给自己颁了个奖, token king。 他 这次的观点很明确, token 即财富, 也就是说未来的财富将以 token 为单位来衡量。那可能很多人还并不是非常理解, token 为单位来衡量,那可以是一个词,半个词,甚至一个字母。 比如你好可能是一个 token, 也可能拆成你和好两个 token。 你 写的每一段文字,生成的每张图片,每次点击 ai 生成,甚至无人车,每看懂一个红绿灯,背后都在消耗和订购 token。 但在英伟达这次的定义里啊, token 还远不止于此。 当然,正在成为数字世界的通用货币,因为未来世界的数字资产都将由这些微小的单元构成,谁能让 token 生产的又快又便宜,谁可能就是未来世界的基建狂魔。 为了让 token 生产的更多更快,英伟达发布了全新的 token 工厂 ver ruby 计算平台,这不是一块芯片,而是一整套生产 token 的 工业系统。这次老黄还提出了一套全新的经济学,叫 token 工厂经济学。也就是说,未来每一个企业的数据中心啊,它都会像一座精密的工厂。算力芯片就是生产 token 的 机器, 目标是最大化产出,最小化成本。这可能就意味着未来的 token 可能会像空气一样便宜,但价值却像石油一样巨大。这里老黄还立下了一个 flag, 说是到二零二七年底,仅为达旗舰算力芯片创造的价值就有望达到一万亿美元。那照这样发展下去啊,以后的世界可能是你用 ai 写方案、做设计,甚至陪你聊天,背后的算力成本几乎可以忽略不计了。 token 可能会从稀缺资源 变成了像拧开水龙头就有的自来水,它会进入我们世界的每一寸空间,甚至开始驱动物理世界。比如老黄这次提到的 自动驾驶,迎来了自己的 check gpt 时刻。因为处理物理世界数据的头盔技术已经成熟了,路上跑的每一辆车都在实时处理海量的传感器、头盔、路况、行人、红绿灯。而未来的汽车,可能也不再是一个交通工具了, 而是一个移动的托肯生产者和消费者。像比亚迪、吉利、沃尔都已经加入了这个行业,再包括甚至连天上的卫星英伟达都给他装上了 ai 芯片。 以后卫星不再是傻傻拍照往下传,他自己在天上就能实时分析数据,把画面变成有价值的托肯,直接向地面报告哪里有森林火险,那条航线的货轮延误了等等等等。这也就是说,从地上跑的车到天上飞的卫星,一切都在变成托肯。 那这里啊,又来了一个问题,如果真的说有一天,托克像空气一样无处不在,谁来保证安全呢?所以,因为大家在这里又推出了一个尼莫克洛, 对,就是那个 openclo 的 新成员,他相当于是给企业养的龙虾穿的龙虾壳。因为 openclo 的 爆火啊, ai 智能体大规模替你干活,他就变成了一个趋势。但处理邮件、调用数据、替你下订单的这些过程中,每一步都在交换。托克 如果没有护栏,有害信息可能会泄露,隐私可能会被窃取。而尼莫克洛扮演的角色就是为每一笔 token 的 流动加上护栏, 他是为了确保 ai 在 调用工具处理数据时,每一步都是安全合规的。按照这个说法,到了未来,你作为普通人,你可能会拥有一个几乎免费的无所不能的 ai 私人助理。而作为一个打工人啊,公司发给你的 offer 出了年薪,可能还会附带一笔 token 预算,让你随时调用 ai 算力替你干活。 而作为社会公隐,以后可能我们坐的车都是无人驾驶的,给你做手术的可能会变成 ai 机器人。总的看下来,这次英伟达 gtc 的 演讲里,主要就在传达一个讯息,就是一切可能都在变成 toon, 而英伟达这次想要打造的是从生产芯片到运营系统,再到安全防护的这一整个完整的 toon 机器的技术设施。至于英伟达的这个 toon 帝国能不能建立的像他说的那么宏伟,那确实也说不准, 毕竟 token 再金贵,也得靠爹来喂,这个确实是国内的优势,还有再加上光链街夜冷金刚石导热啊等等等等,也都是芯片以外的战场,也就是说, token 世界是一个必然的趋势。但这个航线怎么走,未来啊,还真都不好说,记得点赞关注哦!
粉丝152.3万获赞1175.4万

北京时间今天凌晨,那个穿着标志性皮衣的男人又来了!在盛和赛 s a p 中心,新伟达 ceo 黄仁勋用长达两个半小时的 g d c 二零二六主持演讲,再次引爆科技圈。这场被誉为 ai 春晚的盛会,不仅砸出了新一代性能怪兽,老黄更是抛出了一个颠覆行业的重磅论断, ai 行业已正式进入推理拐点。这意味着什么?数据中心的定义被彻底推翻,它不再是单纯算力的堆砌,而是变成了一座生成 token 的 工厂。衡量这座工厂的核心指标只有一个,每瓦特电力能产出多少 token。 token 就是 ai 时代的新商品。 为了这座未来工厂,英伟达寄出了大杀器。新一代 ai 超算架构微软 cpu 和配备两百八十八 gb 显存的 ruby gpu 组成。 最直观的震撼是两点,第一,百分之一百夜冷,使用四十五度热水冷却能耗大幅下降。第二,全线懒消失,机架安装时间直接从两天缩短到两小时,在最高价值服务场景中,吞吐量直接飙升十倍。 你以为英伟达只卖 gpu? 不? 这次他们发布了全新数据中心 cpu rosa, 专为高频 ai 推理优化, 而且 mate 已经决定大规模单独部署。老黄自己都感叹,我们从未想过会单独卖 c p u, 但这已经是个数十亿美元的业务了。不仅如此,老黄还剧透了二零二八年的下一代架构番曼全球首款台积电一点六纳米 ai 芯片 l p u 与 g p u 深度融合,彻底击穿内存强。 为了算力的狂飙,英伟达甚至在底层材料上搞起了革命,量产 c p u 光互联交换机冷板材料升级到金刚石级别, 引入液态金属。在这些硬科技的支撑下,老黄描绘了极其清晰的商业图景。未来的 toko 将像商品一样分层定价,从每百万 toko 三美元到一百五十美元不等。未来每个 ceo 都必须紧盯自己 ai 工厂的 toko 采购速度,因为这就是白花花的真金白银。 表面上看,英伟达是在发新品,但实际上,他们正在完成一次身份的终极进化,从芯片公司升级为 toko 经济的助力。这就是英伟达可怕的战略, 垂直整合,横向开放。从 c p u 到 g p u, 从光互联到夜冷,英伟达吃透了每一个环节,但同时,它们的技术又可以部署在世界上任何一个云端和数据中心。不锁死生态,却做到了极致的统治。 时代的车轮正在加速,从 v r u b 的 夜冷无氧化到金刚时散热的引入硬件技术的每一次跳跃,都在重塑运维的生态。 作为专业的服务器维保与维修服务商,为云信息科技紧跟技术前沿,已提前储备液冷系统检测、 g b 系列交付运维芯片及故障诊断等硬核能力。 ai 时代的淘金热已经开始, 你的 ai 工厂需要最可靠的后勤保障,让算力永不停歇。为云信息科技,您身边的 ai 服务器运维专家 g t c 二零二六还在继续,想了解更多硬核科技解读,别忘了点赞、关注我,咱们下期见!

免费的头肯随便用,没有任何限制。最近使用了 oppo cola, 头肯是太费了,随便一用一下就用完了。 自己的这个 ai 开发软件,缺氧是免费,可以用各种模型,我就想这里能不能想点办法。然后借鉴了 oppo cola 的 思路,写了一个飞速机器人, 用手记上这个飞书啊,控制这个电脑上的翠。我现在给飞书机器人发一个消息啊,发一段指令。如何计算润年这个 new 呢?表示开启一个新的绘画啊,这里已经有四个绘画了,现在我们来发送, 你看啊。好,来了,产生了第五个新的绘画,现在他正在执行。 咨询完了以后呢,他会给我手机发送一个回复,是不是像 open core 一 样?差不多了, 接下来准备用 open core 去接入这个机器人,这样子有一些重型的写代码的工作就交给这个确认来做好了。这个确认呢,写本地的文件, 稍等片刻,瑞典已经即将完成, 现在马上要发送回来啊。这个呢,比调用 api 肯定是慢,因为这是个图形界面,但反正在手机上使用,不着急的话,我觉得也可以接受。 哇哦,不错呦,好消息来了,已经完成了日历的计算代码在哪里?怎么计算好?

很遗憾啊,英伟达的 g t s 大 会,我本来要去现场,身体的问题加上壮胆没有去成,那我在线上看完了华尔勋两个半小时的演讲, 信息量确实很大,哈哈哈,华尔勋现场说到现场的最大占比的不是搞制造,搞汽车,搞机器人这些产业向的人,而是金融圈的意料之中吧,本来英伟达就一直在资本聚焦的中心点投资追捧的对象,但是 我们稍微理性一点,就这说明在美国至少 ai 还没有完全的真正走入产业,这很戏剧化,因为华尔勋现场预估明年因为大家会有一万亿美元的订单这件事说明我们已经不缺理想主义,也不缺资本的围炉狂欢,缺的是冷静思考跟把它落到产业的这种执行的人。 这期内容啊,我用 gtc 大 会上华尔勋的四个很极致的罪啊展开,跟大家聊一聊现在 ai 在 发生什么。其中第四个罪我觉得是 整场的核心,就华而勋把 ai 工厂竞争从堆算力拉到了经营算力的能力啊,甚至他要开始给 tiktok 定价,就是要掌握那个定价规则,我们直接开始啊。第一个最也是最没有争议的就是开发者生态最强,华而勋现场展示了库达生态的飞轮,那今年是库达的二十周, 他的逻辑很简单,就因为达在全球的装机量会推动他的生态上的开发者持续的去优化架构,那这个算法的突破又会让这些开发者生态跟因为达绑的更牢。大家去看这个飞轮,哎,看起来好像是一个很完整的闭环,牢不可破。 其实侧面也给我们看到了可以突破的方向,那就是装剂量开发者算法突破和生态系统任何一个点断掉大猪,小猪落于盘,那这个强大的扩大生态加上百万级的开发者贡献出来的就是因为它的第二个最架构,最优计算架构某种意义上决定了单位 token 产生的价 值。而徐非常自信的说,如果你的架构不对,即便你的 token 是 免费的,那也不够便宜, 因为在美国,美极化工厂的成本就是你搭建这个工厂的成本,大概是四百亿美金,就算你啥也不干,你把芯片买回来,安上四百亿美金也就投出去了。 直白一点,就计算架构其实决定了 toc 能不能转化成真正的生产力,那为了让英伟达计算架构持续的领先,华尔勋又一次的重新定义了英伟达。上一次定义英伟达是在 c e s 上,他说我们是一个平台公司, 就是他的第三个罪来了啊,这次重新定义了英伟达是世界上第一个垂直整合加水平开放的公司啊,就是产业链的每一个环节我都会参与,但是每个环节我都会开放来合作,比如芯片架构的设计啊, omnibus 物理仿真平台,包括刚刚宣布要对标 opencloe 做的 nimo cloe 这个智能体平台, 还有前阵子的投资通信板块,甚至他直言没有放弃做大模型。注意啊,这里不是说他要做垄断, 而是搞 ai 基建的公司,你必须要有全站能力,你不把你的手脚拼齐,你怎么知道你的大脑指挥的动呢啊,就像苹果的生态,它要搞 apple music 一 样,可以不用我的 apple music, 但是我不能不会。这其实跟华为很像,所以严格意义上,你可以说你是市值最高的,垂直且开放的公司,但不算第一个。而且啊,现场他终于承认他是搞软件的了,而且说了两次,因为他其实是一家算法公司。 未来这个软件公司真的会一直站在顶端吗?这是一个问题。那重头戏来了啊,最重要的也是我认为全场最高能的就是第四个,最 token 最便宜。黄旭给自己颁奖了啊,他说,我是 token king, 皮衣皇,算力王。我看到这张图片的时候,真的,谁说小小的身躯不能称王 啊?营销真的还得看老黄, there was a monkey king, token king 就华而勋,从一小时十八分到一小时三十分,真的全程高能。强烈建议大家去看一下这一段,他第一次在公开场合 给 token 定级,就把 token 按照应用场景分,免费,三美元,十美元,最高一百五十美元。就像你坐坐飞机,有经济舱啊,有头等舱,未来会有大量的免费 算力,但大家想要算力平权啊,那很难。比如,如果你只会用大模型去问一些简单的问题,让 agent 帮你点个外卖,低延迟的啊,交互感要强的。这种场景,它其实不需要大量的上下文计算和 k v k, 所以 它会很便宜,它甚至会免费,但是它带不来实质的生产力的提升。那相反,像科研啊,模型训练,包括这种写复杂的代码,涉及到大量的数据跟计算的这种吃算力和吃内存的场景,这个 token 就 会更贵, 对应产生的价值可能就会更高。这件事情应该反过来理解,就华而勋在用 token 产生的价值来重新给 token 定价,他要掌握 token 的 定价权,这点非常值得重视。这个时候其实你就突然能够理解他为什么要收购 grok, 就 这家做推理的公司,去把 grok 上场的推理的这个 lpu 集成到 vr 平台上,它到底会带来怎样的应用场景上的颠覆?怎样做到单位 token 成本最低? 其实很简单,这跟我前两天跟大家讲申腾的九五零超节点的时候的逻辑是基本一致的,它解决的就是在同一个 valuby 平台上,既可以满足头等舱的客户的这种高贷宽高吞吐 的需求,又能满足经济舱的低延迟的这种响应能力,让一台服务器能够识别在什么任务下放在什么芯片上去计算最划算,才能最大化的把这个数据中心的收入拉起来。 这就是为什么微软 ruby 是 七颗芯片的组合, ruby 是 通用计算 cpu, 那 ruby 是 gpu 高性能计算,而 lpu 是 推理计算,再加上存储芯片、交换芯片 cpu, 哎, 组合在一起,它能像一套完整的系统一样工作。这背后的核心能力其实是它的编程器的软件在调度, 就把需求解偶以后重新编排,这个确实对软件能力要求非常高,所以某种意义上,他其实就是在自己擅长的架构设计能力上长出来了一套适合自己的架构模式啊。所以终于啊,他承认自己是算法公 司了,哈哈哈,因为技术故事讲到这里了,但这也意味着算力竞争会从拼谁能堆最大规模的算力,到了拼谁的算力,调度谁的经营算力的能力更强,不仅要让单位算力成本更低,还要让它真正的 这个算力用在合适的场景上。当然整体听下来你可能会觉得因为他很狂,这么多的罪恶,不愧是搞营销的一把好手。但是我觉得不代表我们中国是没有机会的,我们可以用芯片的才能去换制成 通过对于规模的方式,对吧?就像今天超节点一样,加上我们有电力系统光连接和冷却技术上面的优势就是系统集成的优势。但是回到最难的,其实我觉得还是开发者要能够在国产算力上有持续的算法突破,才能够形成我们 国产算力生态自己的那个绯闻。所以懂为什么达子迟迟不能进来,他进来了我们怎么用?我们不用,怎么会有自己的生态呢?所以回到去年年初,我说过一个观点,就是全球的 ai 技术设施就是两条路线, 中国路线和美国路线。那即便华而迅今天说的这么多的罪,但是他深刻地知道他需要一个强大的对手来防止,因为他进入商增之后很快会迎来商减,这个对手只有我们, 没有别人。好了,以上就是我的观点了。最后啊,我给一些我个人在产业上的判断啊,如果上一个确定性是存储 啊,那么下一个确定性就是应用,不是说上有没有价值。相反我觉得不管是台光卖还是韩国人的这些脸色,因为大家都是得顾着的。那供应链上的这些制造大哥,他其实是物理性决定的,高壁垒凭你架构怎么优化?哎,我就处在那里。如果说要求高回报,看应用端,即便没有所谓的 a g i 来资本推动,他也必须要把算力用起来,用好了,否则这故事讲不下去了。那能把英伟达明年这一万亿订单转化成 gdp 的 公司,我觉得明年一定要出现,到时候可以对比一下 啊,达子的一万亿营收和他的客户的营收如果差距特别大,那这真的是有大问题了。那关于光和铜,黄旭说出 both 的 时候啊,我觉得这对产业链来说好像是一种妥协, 它总不能一句话带崩铜吧,但是这一句话好像把 c p u 带崩了。但是我个人判断终极还得是光,因为铜它有不可再生的物理性的局限,只会越来越贵,所以能被取代就一定要被取 代。而光连接的核心在光气件和光芯片还有整个控制系统上,这些是通过技术是可以不断地去突破的。再说液冷虽然相对成熟,但是它存在物理性的风险,而且它不是百分百可以预防的。所 所以叶冷我感觉它并不是终极的冷却方式啊,这是我个人的感觉,冷却材料这块儿算是一个前沿的探索方向吧,这种公司也值得关注。最后的最后,最容易被忽略的全是电啊。如果你们去看过 a i d c, 你 会发现电力设施的配套可能比服务器本身规模还要大。 a 级以上的计算中心,它都是要有两套的电力系统 去做熔于的一套用一套备用。中国的供电模式又跟美国差别很大,美国的现在科技巨头政府都是允许他们自供电啊,自己买发电机,自己搭整个供电系统啊,你自己负责,那中国的 a i d c 是 要跟地方的电力系统去协调,就 相当于你要拿到配额才能去搭建自己的算力中心,这也是防止 token 高价的一种方式,那恰恰也是这种方式,未来会让中国的 token 变成全球最便宜的 token 啊,这是早晚的事情。那以上就是我个人的一些判断,大家有什么观点可以在评论区碰撞这样。

我给一只龙虾买了一套十万块的豪宅啊, mac mini studio m 三 ultra, 加上显示器配件,全套下来差不多十万块。为了就是给我的龙虾吃二十四小时不间断的自助餐套餐,想吃多少就吃多少啊!有人说,你是不是疯了啊,但是别着急, 跟我算笔账。先说说别人是怎么养龙虾的,大部分人是花两三千块钱买个 mac mini 接到云端大冒险的。 a p i。 龙虾每干一件事就要掉一次,一天每掉一次要烧一毛钱, 轻度用户一个月大概花几百块,重度用户花几千甚至上万。有一哥们晚上没盯住,第二天直接看账单是 六千块一晚上。这龙虾吃的真多呀,这就好比是什么呢?你租了一个毛坯房,每一天都要叫外卖,而且这个外卖特别贵,还是要按客收费的, 所以你住的憋屈,吃的还贵。而我的方案不一样,我给龙虾一个五幺二 g 内存的 max studio, 直接在本地就能跑满血大冒险。我用的是千问三点五,不用掉额外的外国,一天不经过任何第三方 talk, 成本直接规定。 我给龙虾不是点外卖,是给他二十四小时无限量的自助餐,所以想吃多少就吃多少。而且这个自助餐呢,还不会涨价,因为蒜粒是我自己。再说一个真实的我为什么要给龙虾搞这么好的条件,是因为我发现一个规律啊, 龙虾的产出质量跟它的居住环境直接挂钩。什么意思呢?用 mac mini 加云端 a p i。 养龙虾的人啊,因为怕烧滔天,每一次给龙虾的指令都小心翼翼的,特别短,特别省。帮我写一个文案,完了然后龙虾给你吐出来的一堆通用的废话,为什么呢?因为你没有给到它足够的上下文, 他多说一句话呀,多烧一块钱。但是我不一样,我的龙虾住在十万块的豪宅里面,掏坑管够。我可以为他我们公司整个的业务文档,过去三年的客户数据,所有的行业报告,他吃的越多,干活越聪明。 而我现在给他下一个指令,他出来的东西,带着我们公司的业务逻辑,带着行业认知,带着客户偏好,这不是一个通用的 ai 助手,这是一个真正懂得我们生意的数字合伙人。 上周呢,我让他帮我出了一份客户的提案,我拿出来一看,改了不到百分之五,就直接发给客户了。 以前这种提案团队至少要写两天。但是这个事情的本质是什么呢?养龙虾这件事跟养员工其实差不多,你给员工做一个地下室,每天吃泡面,你指望他能给你拼命吗?不可能的,但是你给他一个好的环境,好的资源,充分的信息,他能给你产出 更好的结果。龙虾其实也是一样,你给他一个两千块的 mac mini, 每月限量的 tucker, 用不是那么好的模型,他只能给你干两千块钱的 活。你给他一个十万的豪宅 tucker 无限量供应,他能给你干十个人的活。我的判断是,二零二六年养龙虾会出现一个严重的两极分化,一批人花几千块钱, 几百块钱养了一个玩具,玩了两天就扔了,然后到处说钱没用。另外一批人认认真真的养龙虾,把龙虾的环境打好,数据喂好,训练好流程,把它变成公司的核心生产力,这两批人之间的差距会在未来一年内拉开到不可逆的程度。 所以别问我十万块钱养龙虾到底值不值,你应该问问自己,你给你的 ai 提供的是毛坯还是豪宅,是限量外卖还是无限自助?你是怎么对他的,他就是怎么回报你。这个道理,管人如此,养龙虾也一样。评论区告诉我,你现在的龙虾住在什么条件上。

兄弟们,用老本夸大概十天了,我跟你们说,这东西是真好用,可玩性非常高。但有个很头疼的问题,免费抽根不够用, 玩着玩着就超时,要付费。对我们普通玩家来说,一天抽根费就要上百块,真耗不起。所以今天我直接把我研究出来的 低成本白嫖 talking 免费套模型的方法分享给你们,先做我踩过的坑。一开始我去英伟达官网注册了免费账号,想用它的免费模型, 网上都说免费模型慢,我又下来,根本不是慢不慢的问题, 直接调用不了,没法设成默认模型。你们看这里哦啊,显示 no 用不了,服务商那些设置又太麻烦,我也懒得折腾。后来我找到一个最简单最稳的办法,先去注册一个 mini max 付费账号, 不用贵,我开的就是二十九块那种。把它配纸巾稳稳夸。 终点来了,这是最关键的一步,默认模型固定用 mini max 别动,但让它实际回答的时候优先用免费模型。我现在设置的是 优先用千万二点五,不行再走。英伟达那些免费模型, 八 b、 四 b, 十二 b、 三十 b 全都失败了,最后才走 mini map 付费。只要末音模型不改,这个顺序不乱,他就会先拼命用免费的,实在不行才走付费。 我亲测了好几天,非常稳,我现在一天玩十几个小时,查查资料,问问题,熟悉功能,偶尔聊聊天,抽根完全够用,几乎不怎么扣付费额度,等于白嫖。 这个方法我亲测有效,分享给跟我一样喜欢折腾 open call 的 兄弟,希望能帮到你们,我们下期再见!

token? token 还是 token? 昨晚老黄在 g d c 舞台上反复就这一个词,因为未来的一切都是 ai, ai 的 一切都需要 token。 你 需要 ai 写邮件扣十个 token, 你 需要 ai 做 ppt 扣一百个,你需要 ai 陪你聊一个小时扣一千个,你以为这是壳外皮?不,这不是预言。我把昨晚两个小时的发布会给你总结成老黄发布的三套新规则。第一套规则让 token 变得像空气一样便宜。 vio robi 平台来了!三纳米工艺加 hbm 四内存,意味着芯片能塞进去的东西更多,跑起来更快。五倍推理吞吐量加上 nvfp 四新格式,意味着同样的时间能干五倍的活,同样的活只用几分之一的资源。这一通操作下来, ai 推理的成本直接被砸到了十分之一。 再加上 vio robi nv 六个七十二计件训练顶级 mo 模型,只需要上一代平台四分之一的 gpu, 以前四个人干的活,现在一个人干完。 还有之前收购了格鲁克公司发布的格鲁克三 l p x 机架,二百五十六个 l p u 处理器,每兆瓦吞吐量提升三十五倍, 专门跑推理的芯片,效率干倒三十五倍。这一整套砸下来,结果是什么? token 比自来水还便宜,它不再是稀缺资源,它会像空气一样,你感觉不到,但一刻也离不开。 a w s 已经部署了超过一百万款 nv 加 g p u, 微软 air 第一个跑通 vivo robin nv link 七十二,他们在建的不是芯片仓库, 而是未来世界的自来水厂。老黄还端出了一整套软件, nano cloud 加 aint 的 toy kit, 帮你自己手动打 ai。 aint 的 从硅片到软件,全站开发,这不是在卖芯片,这是在给每家每户装水龙头啊!第二套规则,让 ai 进入每一寸空间。 dlss 五,老黄成为图形领域的 gpt 时刻, ai 时时生成电影级画面,逼真到分不清楚是游戏还是现实。生化危机,霍格沃兹遗产已经用上了 n e x 芯片,任伟达杀入的 pc 处理器市场,二十个二模核心与联发科合作集成 gpu, 性能对标 rtx 五零七零, ai 将装进你的笔记本,你的手机本地就能跑。 ai 进的 i g x store 平台,已经装进了卡特比勒公司的挖掘机力和强盛的手术室里。 还不够,老黄在现场说了一句,全场安静了两秒,我们要去太空了。不是想去,是已经去了。 nvidia, 微软 rubin specs one 轨道数据中心芯片上天,数据中心上天, ai 上天。然后他说了一句让所有工程师道谢凉气的话, 在太空中,没有传导,没有对流,只有辐射,我们必须想办法在太空中冷却这些系统。地球上所有的散热经验全部作废。你的手机到强生的手术室,到地球轨道, ai 正在覆盖所有你能想象的地方。第三道规则, ai 开始自己动手。 open h 全球最大的手术数据集,七百七十六个小时真实手术画面。强生的手术机器人已经开始学习怎么做手术了。 alpha fu 的 数据库新增了一百七十万个蛋白质复合物,推理速度提升一百倍,药物发现的速度被彻底重构。 perfect alpha mail 发布新基础模型,专门推动人形机器人进化。老黄在现场,让冰雪取暖的雪宝直接从屏幕里走了出来。 不是特效啊,那个雪宝有实体,能走路,能对话。背后是 amy vors 模拟 neutron 物理引擎 isec, 机器人平台在实时运行,数字和物理之间的墙被推平了。 这还没完,老黄把未来三年的路也画好了。 viroubin, 现在生产中, viro ultra, 二零二七年下半年, 一个机架的工号顶得上一座小型工厂。这玩意不是电脑,而是工业级的心脏起搏器 freeman。 二零二八年两年后, ai 会在光速里思考, freeman 用光代替电,让数据跑得比神经信号还快。当几千块 gpu 连成一片硅光的技术会让它们向同一个大脑在呼吸,连接,从此不再是平静。 所以整场发布会其实只讲了一件事,我们的未来全是 ai 以前的技术革命,整体机、电力、互联网都有参照系。整体机之前有水车、风车、电力之前有煤气管道,互联网之前有电报电话,但这一次地图没了。没人知道当 ai 便宜向空气覆盖到太空还能自己动手的时候,人类会变成什么样, 老黄自己也不知道,他只是在解决问题。芯片散热、太空辐射、手术数据、蛋白质结构,一个一个解决,然后把路铺到我们脚下。至于这条路通向哪里,没人走过,也没有人知道。

阿里最近不是成立一个阿里 tokinhop 这一个新的事业部门,这个部门其其实它的命源其实非常有意思,你们出核心要关注的就中间这个东西, tokin, tokin 呢,可以说是现在大冒险世界运行的唯一的一个口粮,也是唯一的一个硬通货币。所以在 tokin 的 发放和管理上,其实整个 部门话对它的管理其实非常严苛的。但是针对这一些阿里 tokinhop 这个部门话,它其实就基本上处于一种无限发放的状态。 其实现在对于其他部门,你看西很多大工的,他们都在讲每个月发了多少头肯的额度,然后每个头肯又有多少多少的限制等等。其实现在在年前之前嘛,我觉得在大厂里面,其实在用的时候,其实在头肯的管理上其实非常的 没有任何的一些管理措施嘛,就大家随便有,想怎么就怎么用,我也是在那会几乎拿个头肯各种跑模型,各种跑动,跑数据,各种来做应用,其实没人管,这感觉就是在年后这一两周,尤其特别明显说发现这 部门发现这个头肯的量发生在一种几何倍数的一个增长,然后赶紧开始收口了,说啊,每个人必须每个月我给你限定多少多少额度,然后必须除非你有特别极重要的一个应用要用的话,他才会把头肯开放给你,不然话有很多人都在拿着公司的头肯在那里白嫖,学习什么乱七八糟的,最后探索了一圈之后什么都没有做出来, 然后这里可以也可以看出来一些,现在随着这个时间的一个发展,这个 toc 的 一个重要性也是越来越重要,其实最值得黄立勋的一些分分享吧。其实将来在 ai 世界里面, toc 其实是唯一一个硬通的一个货币,他们现在就想怎么办法,就通过算力或者电力把技术措施做好,然后把 toc 的 价格给打下来, 然后打下来之后呢是会是什么?就 token 变得非常的便宜,然后等足够便宜,便宜到应用地步之后,比人还便宜的时候,那么我们就可以化与 token 融为一身,就化为 token 的 一部分了。 嗯,差不多就这么个情况,也只给大家分享一下凡大厂的一些最近的一些近况吧,然后看一看这个阿里 token 出来之后,看会对行业造成一个什么样一个冲击吧。

兄弟们,这个腾讯的 qq 我 今天测了一下,然后通过微信连接,可以用微信给他发消息。我们看一下,我今天问了他几个问题, talking 每天可以使用四千万。然后我今天问了他两个问题啊,三个问题。第一个查询我主页的粉丝,他说查不了,因为有这个联网沙箱联网限制。然后问了他三个问题, 消耗了二十四万 toking, 吓死了,一共就三个问题,他消耗了二十四万的 toking, 搞笑呢是不是?你看第一个无法访问,第二个上海天气,第三个 他回答这个问题,醉了。我最后重申一下我的观点,任何 club 都是乐色,个人不要在这上面浪费时间了。

这几天想了一下老黄在英美达大会说的托肯经济学,这个仍然感觉后尾发凉啊,因为在老黄的定义里,托肯将会完全的颠覆整个社会的和职场的结构。他有两个核心观点,第一个就是说他说未来企业聘任员工 有一万的成本,可能是给员工去购买 token, 像我有个朋友,他那公司已经免费的帮大家去报销 token 了。第二个,他提出了一个 token 经济学的五个模型,核心就是说你只有够强的员工,你才配用好的 token, 如果你不够强,你只用只能用弱的 token。 他 给这个 token 定了五档价格,我这里有表格,大家可以这个截屏或者暂停下来看一看啊。 就是从免费层就是说简单的对话一直到最高层,可能解决一些复杂的科学问题,他的整个的成本是不不一样的,就每份免费层,可能你不用付出什么成本,但是他只能简单对话,然后逐级逐级的往上走。其实我在 这几个月使用 ai 的 过程中,我也感觉到了,就比如说我去撸免费的呃 talkin 就是 用在我小龙虾的身上,比如,比如说是免费的 mini max 的 模型,还有呃 qwind 的 模型,它的效果就肯定不如我付费用的平。 但是呢,比如说你想再用解决复杂的问题,你肯定得去买最贵的模型,就是比如说 cloud code 这样的,你在编程和输出上整体的质量都是不一样的, 所以未来 talkin 将会成为这个职场竞争的基座啊。就是你,首先呢,你要去工作的话, talkin 将会 成为你必要的成本,然后呢,可能公司替你去承担了成本,但是你必须要很好的用这个托坑。然后我还听说一个案例啊,就是小鹏汽车,他有个软件团队,然后有个技术问题, 一个月时间都没有人能解决,而他们团队有很多是年薪五十到一百万的程序员,然后呢,没办法,他们就决心说去充值可 out code 去看一下能不能解决问题, 结果他们用 cologne 的 就是两个小时就把这个技术问题给解决了。就像傅生最近说他说未来职场的核心是什么,你要去学会驱动 ai, 驱动 ai 的 核心,他是这么讲,他觉得第一个想清楚,第二个就说清楚, 就他觉得眼高手低,未来不是一个贬义词,就是眼高手低,未来是一个褒义词,特别是在 ai 时代,就是你花的比较少的钱,你就能输出很好的结果。然后呢,这个托肯经济学未来肯定会成为整个 ai 的 资助啊,就是因为资本已经嗅到了这个味道了,就是 ai 的 新贵,就是 timi 和智补已经股价爆发百分之两百了,然后阿里现在也成立了托肯事业部, 然后,呃,现在华尔街分析师给了这个英伟达估计重新估值,就是从一个卖显卡的公司变成一个提供托肯的一个 基础设施,就是未来,就是谁掌握了优质的 talkin, 谁才能就是在这个社会上,职场上抢占一个最好的位置。以前我都会接触顶级投资人和最前沿的创业者,欢迎大家关注。

全网争议不断的 dj spark 如今又涨价了,英伟达这是飘了还是真有底气?上期我们拿它打了游戏热了身,今天我们就深度实测下大模型推理,看看 spark 到底怎么样。我们先通过英伟达 think 登录进去,这个就是它的控制台界面,左边是内存和 gpu 占有率,右边是控制台,后续的所有测试配置全在这搞定。另外它还系 统出厂就把 ai 环境给你装好了,开机直接就能用。那测试结果我们也会在结尾全部展示出来。接下来我们开始测试,我们先测试一下千万三零 b 模型,分别有 f 幺六 p 八、 n v f p 四这三种精度,上下文从一百二十八到两 k 并发从一到五百。先说 n v f p 四,一百二十八,上下文 五百并发下,生成速率五千七百七十七 toky 每秒,首延迟零点一秒,完全没有跑满性能。不过随着上下文增加到两 k 时,性能瓶颈卡在了两百并发左右,总的来说,在两千上下文以下并发不超过两百, 可以随便跑。再看 f p 八量化生成速率明显下滑,那建议并发在两百以内使用。最后是 f p 幺六量化两 k 上下文,两百并发,调到了六百七十六抖屏每秒,但手延迟依然低于零点三秒, 还算优秀。接下来我们跑下脸书的七零 b 模型,我们测试了 f p 八、 n v f p 四两种精度,先看 n v f p 四版本,整体的生成速度偏低,低并发下勉强够用,但手脱屏延迟还不错,那 f p 一八精度和想象的一样,扩音速率继续下滑,引发刚到一百首,延迟已经超过了一秒,这个模型推荐还是低病发的测试使用,因为 f p 幺六版本太大,需要显存高达一百四十一 g b, 单台 g b 幺零完全跑不了,下期我们再串联一台 g b 幺零试试。再聊一点额外干货,如果你需要大模型的 n v f p 四的量化版本,可以去 h f 下载文件,里面带有 n v f p 四的就是 如果找不到,也可以用英伟达的容器手动量化。那为啥 dj s bug 强烈建议用量化版本呢?因为 gb 幺零的 blackwell 架构对这类的低精度推理有原生的优化支持, 这是它最核心也最容易被忽略的能力。另外有评论区的小伙伴提到了黑神话悟空,一起来看看效果吧。最近 open color 很 火,那 dj s bug 是 不是配呢?我们下期再来看看。

昨晚熬夜看完了英伟达、 gdc 二零二六大会,我现在感觉就两个字,窒息。如果说以前的英伟达是在卖铲子,那现在的老黄直接把整座金矿加上全自动的挖掘机都给你造好了。 这条视频呢,用五分钟带你扒一下 gdc 二零二六,被誉为客一届春晚的老黄所有的地盘。不管你是炒股的、干互联网的,还是普通的职场人,这条视频我都建议你看到最后,因为未来五年的财富密码和残酷淘汰赛,全在昨晚这几张 ppt 里了。 第一, token 成为新时代的石油。这次演讲最震撼的观点是,老黄把 token 这个 ai 领域的基础单位,比作工业时代的石油、电力,甚至是人类社会的血液。 它的原话是, token 正在利用新一轮清洁能源解锁星辰秘密。这句话触听起来像是诗意的表达,但细想之下却非常有道理。 老黄在演讲中把 token 称为 ai 时代的核心燃料。他说, token 不 仅是处理单位,更是一种新型商品。 就像石油曾主导工业时代一样, token 正在成为衡量智能价值的基本单位。更厉害的是,老黄描述了 token 如何渗透到生活的每个角落,医疗、工业、农业, token 都在发挥作用。他甚至说,在人类双手够不到的地方, token 已经在工作。这些描述暗示着 ai 的 影响力将远远超过科技行业本身,而是深入到人类文明的每一个细胞。 第二, ai 工厂,下一个工业革命的核心。老黄还提出了一个超前的概念,把数据中心变成工厂产品,就是 token。 它的原话是,你的数据中心,过去是文件的数据中心,现在是一个生成 token 的 工厂。 这个转变的意义在于,传统工厂的规模化、标准化思维被引入了 ai 领域。在电力受限的时代,每瓦特电力都应该转化为最大数量的 token。 这就像工业革命时期,谁能让每单位的煤炭产生更多的能量,谁就更有竞争力。老黄还指出,在 ai 工厂里,数据是赋予 ai 上下文和意义的真实基准。 这句话的潜台词是,未来的企业竞争将更多地取决于谁能够更好地理解和利用自己的数据资产,而不仅仅是拥有多少计算能力。以前,老黄是一张一张的显卡卖给你,今天的聚光灯打在了一个叫做 m v l 七二的庞然大物上。 英伟达直接开始卖系统,卖 ai 工厂。他的潜台词就是,别再自己组装折腾了,买我的完整系统,我把我的推理效率给你压到极致。第三,一万亿美元的推理拐点。老黄向全世界抛出了一个极其恐怖的数据,一万亿美元的算力产值, 很多人以为过去几年大模型疯狂训练,算理需求已经达到顶了吗?老黄在台上直接宣布,错,大错特错! ai 已经正式跨越了纯粹的在实验室里训练的阶段,全面步入推理和生成商业落地期,这就是所谓的推理拐点。这意味着,以前只有科学家在跑 ai, 而现在是几十亿人,无数个企业、个人每天每秒都在调用 ai。 老黄预测,从二零二五到二零二七年,全球在 ai 算力上的支出将达到令人发指的一万亿美元,而老黄更是铁了心要吃下这块蛋糕, 这是一场巨大的算力豪赌,而老黄显然已经是庄家。第四,物理世界大爆发, ai 长出了双腿与车轮。 昨晚的高潮时刻之一是老黄直接把一百一十台形态各异的机器人搬到了舞台上,从机械臂到人形机器人整齐列阵,那压迫感,我直呼,好家伙,天网降临了,属于是 不仅仅是机器人,还有汽车!老黄呢,直接甩出一枚重磅炸弹,英伟达和乌本达成了史诗级的合作计划,在二零二八年在四大洲二十八个城市推出完全有英伟达全站软件驱动的自动驾驶车队。 不仅如此,老黄还现场点名表扬了我们的国产之光,比亚迪、吉利,再加上现代和日产这些全球车企大军,将全面采用英伟达技术,集体冲刺 l 四级别的自动驾驶。 未来的汽车不再是四个轮子的沙发,而是四个轮子的超级 ai 计算机。第五, open cloud ai 应用的下一个超级入口。 这次演讲中,最令人意外的是,老黄用大量的篇幅讲解了 openclaw, 老黄将其称为人类历史上最受欢迎的开源项目,甚至超越了 linux 三十年积累的影响力。这个类比本身就足够震撼, 他对 openclaw 的 定义非常的清晰, openclaw 本质上是开源了智能体计算机的操作系统, 它将 openclaw 和 windows 相提并论, windows 使个人电脑成为可能, openclaw 则使个人智能体成为可能。这种定位意味着未来的每个用户可能都会拥有自己的 ai 智能体,就像今天每个人都有自己的电脑一样, 关于 open cloud 面临的安全问题,英伟达还推出了 new cloud 来专门解决企业环境中的 ai 安全问题。老黄还说,汇集了世界上最好的安全和计算专家,目的是让 open cloud 既强大又安全。 在演讲的最后,黄仁勋说了这样一句话,让我久久不能平静。他说,我们重新定义了计算,就像个人电脑革命和互联网革命一样,我们现在正处于一个改革的开端。他引用了历史上几次重大的技术革命、 pc 革命、互联网革命、 移动云革命来说明,当前的 ai 革命具有同等甚至更大的规模。但与之前技术革命不同的是, ai 革命的影响将更加深刻、更加广泛,也更加迅速。 在未来的岁月里,我们将见证这场革命如何逐步展开,如何改变我们的工作、生活和整个社会。

今天跟大家说一下 token 工厂是什么意思?先我们要明白 token, 它是人工智能计量的最小单位,就像我们计量电灯用了多少,我们会说用了几瓦或者几千瓦,那么 token 就是 我们在问人工智能问题的时候,比如我们提的英文单词 my name is, 这就是三个 token, 不 过一些常用的单词是两到三个 token, 但我们通常计量不会用 token, 会用百万 token。 中国的百万 token 一 般是一块钱到几块钱, 而美国的百万 token 通常是一美金到几美金,当然输入和输出都要计算,而且输出还比较贵。然后再说 token 工厂是什么意思?以前用人工智能会要自己搭建一台 ai 服务器放在家里, 但是我们有时候会用,大部分时候会闲置,这叫私有化的 ai 服务器。偷啃工厂的意思就是大家以后不需要自己部署一台 ai 服务器,而是数据中心部署很多台 ai 服务器通过网络产生偷啃给我们用。 这就有点像我们最早会在家里装一个发电机,或者是用电池供我们的灯泡,但是当电器越来越多的时候,家里不需要用发电机或者电池,因为那样远远不能满足我们的需求, 并且很多时候会闲置,所以出来了偷啃工厂的概念。那么意味着什么?意味着会降低 ai 研发企业的成本和使用门槛,有电有网的地方就会有人工智能偷啃。再说一个,大家可能没想到偷啃工厂带来的好处,你的算力或偷啃来自英伟达还是国产芯片?大家?