今天跟大家说一下 token 工厂是什么意思?先我们要明白 token, 它是人工智能计量的最小单位,就像我们计量电灯用了多少,我们会说用了几瓦或者几千瓦,那么 token 就是 我们在问人工智能问题的时候,比如我们提的英文单词 my name is, 这就是三个 token, 不 过一些常用的单词是两到三个 token, 但我们通常计量不会用 token, 会用百万 token。 中国的百万 token 一 般是一块钱到几块钱, 而美国的百万 token 通常是一美金到几美金,当然输入和输出都要计算,而且输出还比较贵。然后再说 token 工厂是什么意思?以前用人工智能会要自己搭建一台 ai 服务器放在家里, 但是我们有时候会用,大部分时候会闲置,这叫私有化的 ai 服务器。偷啃工厂的意思就是大家以后不需要自己部署一台 ai 服务器,而是数据中心部署很多台 ai 服务器通过网络产生偷啃给我们用。 这就有点像我们最早会在家里装一个发电机,或者是用电池供我们的灯泡,但是当电器越来越多的时候,家里不需要用发电机或者电池,因为那样远远不能满足我们的需求, 并且很多时候会闲置,所以出来了偷啃工厂的概念。那么意味着什么?意味着会降低 ai 研发企业的成本和使用门槛,有电有网的地方就会有人工智能偷啃。再说一个,大家可能没想到偷啃工厂带来的好处,你的算力或偷啃来自英伟达还是国产芯片?大家?
粉丝2.2万获赞8.1万

下班了,大家好,这周阿里成立了 tucker 哈布事业群,创造 tucker, 输送 tucker 应用 tucker 黄仁勋在 gdc 上把数据中心重新定义成了 tucker 工厂。 两个顶级公司呢,不约而同的把 tucker 推到了舞台中间。但真正让我体验到 tucker 时代到来的呢,还是自己的亲身经历啊。前几天我哥在公测上线爆火,服务器崩了,那状态就跟小学时候学校 突然停电全当欢呼一样,但笑着笑着就笑不出来了,因为你发现自己真的回不去了。还有更扎心的,昨天三月刚过半啊,我公司的两个头盔账号全都用完了,新的额度申请还没批下来。我平时的工作状态也是这样的,同时开五个 code body, 智能体干五千,不同的任务,交替验收、发指令, 头盔一断,我能做的事极其有限,把几个上下文不复杂的小任务迁移到 jimmy 和 magna 上凑合着干。 但那些已经工作了好几天的文字报告改到一半的 ppt, 我 几乎没法做任何操作。有人说,你不能手工接着干,不是不会,也不是犯懒,是整个工作流已经彻底改变了。 我不能把 ai 生成的 macdunk 文档转成 word 继续手搓,也不可能把改到一半的 html 的 ppt 手工改回泡泡那里去拍吧。 因为一旦切回原来的工作流程和格式,等 token 恢复之后, ai 的 效率会大幅下降。除非 token 断好几天,否则切回人工模式的成本是不可能承受的啊。就像你不可能因为停一小时的电就去买个手摇发电机。 overclock 的 爆火呢,是一个重要的转折点。实话,没有这只龙虾,也会有别的对虾、鳞虾。年初几个国产 a 阵的模型交替发布的时候,我就判断,今年长城之行的智能体将带来 token 使用量至少两个数量级的爆发。 以前你用达摩星问一个问题,回段话,几百个头肯。现在一个 a 阵的从接到任务到完成交付,中间要规划、搜索、写代码、调试所修正,一个任务跑下来几万甚至几十万个头肯。 我同时开五个,一天的消耗量远超以前几个月的他们,消耗从对话级跳到了直性级,这是一个质变。 所以阿里为什么要用电力行业的逻辑,发电、输电、用电来组织爱业务。黄仁勋为什么要把数据中心变成 token 工厂?因为他们看到了同样的东西。当 token 真正开始干活,就不是一个计量单位了,它是基础设施,是新时代的电力。 但现实还是很骨感的,现在所有的龙虾基本都在开会、在聊天,没几个在干正事。我去各行业交流讲课,大家的状态都是焦虑和懵逼,知道 ai 厉害,知道 ai 阵势趋势,但是不知道怎么用,不知道从哪下手。企业买龙虾,就像去年买的 deepsea 体系一样,先养一个再说,至于养来干嘛,不知道。 这其实是一个非常典型的技术落地困境,技术供给已经到了,但需求侧的认知和组织能力还没跟上来。 你看现在 a 阵的使用场景,绝大多数还是程序员在用。写代码、改 bug 大 项目,这是 a 阵的最先跑通的领域,因为程序员天然懂得怎么下指令,怎么拆任务,那怎么验收?但这只是冰山一角,真正的爆发点,在每一个行业、每一个岗位,都学会用 a 阵的工作逻辑来干活的那一天。 一个月以前,我研究 f d e 全线部署工程师这个概念的时候,其实很困惑。道理很简单,要深入一线场景,要帮助用户跑通工作流。但中国企业的数字化基础太差了,很多公司连 erp 都没整明白。你跟他聊 a 阵的写作,我其实也不知道这条路该怎么走。但龙虾和 workday 的 出现呢,让我一下看清了一条更容易落地的 f d e 之路啊,它不需要再教会每个人编程,而是带着工具进场景现场共创。明天,我会跟 workbody 的 团队和教育行业的同事一起去明德学校啊,给老师们做培训,不 光讲 ppt, 而是坐下来跟每个老师一起啊,把他们教学中的真实场景拆出来啊,用 a 阵的帮老师实现因材施教 啊。这个四个字,说了几千年,传统教育很难做到,因为一个老师面对几十个学生根本不可能。但如果每个老师有几个智能体助手呢? 这就是 f d e 的 正确打开方式,不是培训完发个手册,而是带个工具啊,在现场,一个场景一个场景的跑通啊,固化成工作流和 skill 啊,再推广到下一个学校和行业。 这套能力不是程序员专属的,每个知识工作者都应该也能够学会。这也是大厂让员工提前体验无限 pockin 的 真正意义,不是让你提前半年以上,看到整个社会和所有行业的未来工作状态。 腾讯、阿里都给员工标配了几乎用不完的 tucker。 华仁勋说,给员工配了价值年薪一半的 tucker, 然后因为能力越强, tucker 对 你的放大就越强。然后我相信配 tucker 会成为所有企业的基本共识啊。 当每个行业都跑通了自己的 fde 最佳实践,当 agent 呢,不只是程序员的工具,而是成为每个人的日常操作系统。就像我们已经体验到的那样, tucker 消耗量就会迎来真正指数级的爆发。到那一天呢? tucker 断供带来的混乱可能比今天大面积停电还要严重。 还有个事啊,今天看到有人又在征集偷看这个词的中文,觉得词源无法包含多模态的概念。我的建议是呢,一定是外国人能听懂的音译叫通根,如何 啊?万是万物之根啊!同意的可以点个赞啊,不同意的在评论区说说你的想法,感谢关注未来博士,我们一起用跨界的视角看懂未来的方向。

现在大模型的算力全面告急,我今天用千问的时候发现啊,总是掉线不给我用了。今天有一个新闻,几个大厂的 token 价格全面提价,涨幅百分之三十多,核心原因就是采购成本,尤其是存储芯片价格暴涨, 而现在 token 的 消耗量又在快速的增长,最后导致什么呢?导致就像阿里巴巴这样的大土豪,他的算力都不够用了。前段时间我就发现 timi 经常不工作,就是因为太拥挤,现在就连阿里这样的土豪都面临这种算力短缺的问题了。我告诉大家,我现在每个月消耗的 token 的 价格 已经快超过一千块钱了,我可以很明确的告诉大家,以后这个 token 就 跟我们现在用的水电气一样,成为我们生活中的必需用品。阿里巴巴真的行动非常迅速,昨天还是前天就成立了专门由 ceo 带队的一个新的事业部,就叫 token 事业部,以后大家在支付宝上付费,哎,就有专门的费用,就 token 费用了,跟我们现在付水电气一样的,很厉害啊,这也是一个入口。

黄仁勋在 gtc 大 会上抛出的 ai tok 工厂不是一个营销术语,而是一次对 ai 产业本质的重新定义。过去几年, ai 产业的焦点一直在训练阶段,科技公司烧钱建数据中心,训练大模型, 然后发布一个又一个参数更大的模型。现在不一样了。摩根大通在今年二月发布的报告中给出了一个惊人的预测,中国 ai 推理 talk 消耗量将从二零二五年的约十千万亿增长至二零三零年的约三千九百千万亿,增长约三百七十倍。为什么推理突然爆发? 答案很简单, ai 应用正在从玩具变成干活的助手、客服、智能体、 ai 辅助编程 以及图像、音频、视频分析需求爆发。摩根大通直言,二零二六年是 ai 从尝鲜走向重度使用的转折点, tok 经济的爆发正在重塑整个 ai 产业链。二零二七年, ai 计算需求将达到一万亿美元。 二零二六年, ai 推理市场规模为一千一百七十八亿美元,复合增长率百分之十二点九八。 tok 生产是一条完整的流水线,从电力输出到 tok 输出, 涉及了电力、算力、芯片、服务器、数据中心、光模块、数据服务、 ai 平台、算力运营八大核心环节。在这场 talkin 经济的全球竞争中, 中国正在领跑 talkin 消耗。根据 openroute 平台数据,二零二六年二月中旬,中国 ai 大 模型在推理 talkin 消耗中占比达到百分之六十一,首次超越美国。总之, talkin 经济的发展才刚刚开始。 talkin 消耗量的激增,标志着 ai 产业进入新时代。

阿里这次突然成立 token 事业群,先别把它只理解成一次普通重组。更值得看的是,阿里开始把 ai 业务按 token 这条线重新算了。 新事业群叫 ath, 由吴永明直接负责,整合了通义实验室、 mark、 千问、悟空还有 ai 创新业务。 他给自己的目标也写的很直接,创造 token、 输送 token、 应用 token。 这意味着阿里现在想打通的已经不只是模型研发,而是从模型能力到平台分发,再到应用落地,整条链路一起做。 这里面最值得注意的是首次曝光的悟空事业部,他盯的是 b 端 ai 原声工作平台。也就是说,阿里这轮调整已经不止想做个人助手, 他还想把 agent 能力直接塞进企业工作流里。所以,这次成立 at, 重点不只是组织变化,更大的信号是阿里开始把 ai 下半场往 token 消耗和 agent 落地上集中火力了。

黄仁勋在 gdc 二零二六大会上扔出了一颗震撼全球的炸弹,到二零二七年,英伟达看到的需求至少是一万亿美元, 这是什么概念?哈,去年这个时候他说的数字可是五千亿啊,仅仅过去一年时间直接翻倍,这可不是画饼,这是已经摆在桌面上的订单。今天这期视频啊,我会帮大家拆解三件事,第一,为什么是一万亿?这个数字背后的底层逻辑是什么? 第二,黄仁勋说的 tock 工厂经济学那是什么?为什么称之为未来十年最重要的投资范式?第三,当然最关键的就是咱们普通人怎么从这场 ai 革命中分到一倍更。 首先,我们先讲讲这一万亿需求的本质,其实是 ai 从玩具变成了工厂。很多人听到一万亿,第一反应是 ai 从玩具的诞生, ai 从感知、 进化到生成,他能写文章、画图片、写代码。第二次是二零二四年推理, ai 的 出现以 o n 为代表啊, ai 学会了自己思考, 不再是你教他做,而是你说他想把复杂问题拆解成步骤,一步步推理给你看。第三次就是现在叫 a 诊智能体的爆发,就像当下最火的 o n、 curl 小 龙虾,哈用上的人都发现, ai 不 再只是回答问题了,他能主动理解你,理解你想做的一系列任务,之后自主干活,并 记住你每一次提的要求和改进。刚用的时候,你可能觉得他像个大学实习生,做啥都好像有点错,用久了你会深刻理解 agent 这个词,你仿佛真的请了一个私人助手一般,他能够在一次次的任务之中 学习进化和迭代。所以黄仁勋在演讲中说了这么一句话,我认为值得所有的投资人都要记下来。英伟达现在百分百的工程师都在用 ai 写代码, 没有例外。这意味着 ai 已经从可选项变成了必选项,就像当年企业必须要用电脑,必须上网一样,现在企业必须用 ai。 那 重点来了, ai 干活用的是什么呢?是 token。 token 就是 ai 生成的一个基本单位,你让 ai 写一段代码,它可能要生成几百个 token, 你 让它分析一份财报,那可能要生成几千个 token。 所以, 未来的数据中心不再是存储文件的地方,而是生产 token 的 工 工厂。这就是接下来要重点拆解的话题了。黄仁勋这次演讲最核心提出的叫 tock 工厂经济学。 g d c 上啊,黄仁勋打了一个比方, 非常形象,每一座数据中心,每一座工厂,从定义上来讲都是受电力限制的。一座一 g 瓦的工厂,永远变不成两 g 瓦,这是物理和原子的定律。什么意思?就是电力,它是一种应约束,你不可能无限的扩容。在固定功率下,谁的每瓦吞吐量,谁的每瓦 投肯产出最高,谁的生产成本就最低。这就好比两家工厂都用一万度电, a 工厂生产了一万件商品, b 工厂生产十万件,你说谁的成本更低, 谁更有竞争力?答案是显而易见的。所以黄仁勋就把 ai 服务分成了五个商业层级。第一层叫免费层,高吞吐、低速度,每百万投肯几乎不要钱。中级层叫每百万投肯 三美元,高级层六美元,高速层四十五美元,超高速层每百万 token 要约一百五十美元。所以在这个 token 工厂里面,你的吞吐量和你的 token 生成速度将直接转化为你每年的精确收入。这段话就完美全释了,为什么英伟达拼了老命都要提升芯片的性能?华而勋公布了如下这么一组数据啊,在短短两年时间内,英伟达将 token 的 生成率从两千两百万提升到了七个亿, 实现了三百五十倍的增长。作为对比啊,摩尔定律在同时期仅能带来约一点五倍的提升。三百五十倍,一点五倍,这就是英伟达的护城河。另外,还有一个特别重要的事情啊,就是这一次 g d c 里面啊,英伟达发布了史上最复杂的 ai 计算系统,叫 vera ruby。 黄良勋说啊,过去提到 hopper, 它会举起一块芯片,它说它很可爱。但提到 vera ruby, 大家想到的应该是整个系统有多强啊。第一,它百分百热了,彻底 消灭传统的限量。第二,过去需要两天安装的这个机架,现在两个小时搞定。第三,在一 g 瓦的数据中心里面啊, tocan 生产速率能达到七亿每秒。更关键的是啊,因为它整合了被收购的 grogloo 的 这个技术哈,所以黄仁勋解释了两者的分工。 verubiu 付 择海量的计算,还有显存的预填充阶段, core q 一 就负责对延迟极度敏感的解码阶段。所以他说的这种非对称式分离推理很复杂,但结果很惊人,让整体性能提升了三十五倍。如果你的工作主要是高吞吐,那百分百实用。 vero ruby, 如果你有大量高价值的编程级别的 token 生成需求,那拿出四分之一的数据中心规模给 gucci。 所以呢,这个就是黄仁勋给到很具体的 ai 应用企业的建议。 但同时呢,也有很多投资人关心的小龙虾,我自己也在用啊。这次演讲,黄仁勋也花了很多篇幅讲 open crawl。 他 说 open crawl 是 人类历史上最受欢迎的开源项目,仅用几周时间就超越了 linux 在过去三十年取得的成就。但这么长篇的论文里面,我给大家抓取了一个最值得关注的点, 不是 open crawl 是 什么,而是黄仁勋对未来职场做了一个描会。在未来哈,他说,我们公司的每一位工程师都需要一个年度 token 的 预算,他们的基础年薪可能是几十万美元,但会在这个基础上, 公司拿出大约一半的金额作为 token 的 额度给到他们,让他们实现十倍的效率提升。这已经是硅谷的新招聘筹码了。 想象一下,在以后的 hr 的 面试里面哈,他可能问你的不是上一个东家给你多少薪水,而是上一个东家给了你多少 token 的 预算,因为这比薪水更能反映你自己的价值,这是正在发生的现实。 好了,说了这么多,那咱们普通人应该怎么从这个 ai 浪潮里面分一辈更呢?对投资者到底意味着什么?我给大家五条最具体落地的投资策略。 第一,咱们要死盯每瓦性能的这个核心指标,未来 ai 公司的竞争力啊,不是看你有多少模型,不是看你有多少用户,就是看你在固定功率之下到底能生产多少 token? 这一定是一个硬指标,而且骗不了人。 第二,我们要关注头肯分层定价的商业模式哈,那个免费层、中基层、高级层、高速层、超高速层,不同层级对应不同的应用场景,谁能占据高价值的层级,谁就有定价权。第三,我们看到传统的萨斯的公司啊,可能面临 生死转型,要么它变成 a a s, 要么就被淘汰。还有那些在卖软件许可证的公司啊,未来可能就会非常非常艰难了。第四,在投资的这个赛道上,电力 伴热一定还是隐形冠军。托管工厂啊,会受电力限制, e g o 啊,可能是上限,谁能提供更高能效的电力解决方案,更高效的夜冷技术,谁就是那个卖铲子 的人,这里有着中国巨大无比的优势啊,以后我们再讲。第五啊, a 准应用呢,就会是下一个爆发点,基础设施已经 就位,接下来是应用爆发。那些用 open crawl 构建垂直领域的智能体公司啊,就有机会成为下一个 salesforce, 下一个 surface now。 而对于个人而言很重要。今天,无论你从事什么工作,如果你不去拥抱这种 agent 的 应用,或者你连小龙虾都不愿意了解,那你跟你身边人的差距,很有可能在 在这一两年时间内被瞬间拉得无比远。所以最后啊,我想用黄仁勋演讲中的这么一句话来结束今天的内容。我们正处于某件非常非常重大的事情的起点,一万亿美金的需求,它不是终点,它是起点。 open 工厂的时代已经到来了。

token 才是中国真正的电力出口。电卖不出国境线,但 token 可以。 一个想了两年才想通的产业逻辑。先说一个反常识的事实,中国是全球发电量第一的大国,年发电量超过九万亿度,比美国、印度、日本加起来还多。但去查海关数据,电力出口这一项几乎可以忽略不计。不是几乎, 是真的可以忽略。为什么?因为电这玩意没法储存,没法长途运输,高压线,跨个国境都费劲,总不能把三峡大坝的电用充电宝打包发往硅谷吧?所以问题来了,手里攥着全球最大的能源,才能却只能在国境线以内打转,这就像开了个金矿,但金子太重,运不出去,只能自己在院子里堆着玩。 直到 token 这个概念出现,事情才开始变得有意思。一、算力即电力,这是第一层窗户纸。很多人到现在还没想明白,为什么美国人对 ai 芯片那么疯魔?为什么英伟达的市值能飙到三万亿美金? 他们买的不是芯片,是算力,而算力的底层是电力训练。一个大模型耗电量相当于三千个美国家庭一整年的用电总和。 openai 搞 gpt negative four 的 时候,光电费账单就吓死人。马斯克去年公开吐槽过,说 ai 再这么发展下去,美国的电网要先崩为敬。这时候再回头看,中国 有电,有大量的电,有全世界最便宜的工业电价。但问题是,把电卖给谁?直接卖电,电网不联通协议谈不拢,地缘政治一缴获十年都搞不定。 但如果把电变成算力,再把算力变成 token 呢?这就是那层窗户纸电出不了国境,但 token 可以。 token 是 数字的,是计时的,是点一下鼠标就能穿越太平洋的东西。在北京,用一千度电算出来的结果,一秒钟后就能出现在旧金山的屏幕上,没人能拦得住。 二、 token 是 电力的压缩包。理解这个逻辑,需要换个脑子。以前出口商品走的是实物路线,原材料工厂、集装箱、轮船、货架这条路线上,中国卡在中间环节,赚的是辛苦钱, 但 token 走的是另一条路,电力算力、模型输出,订阅付费。在这个链条里,电力是原材料,算力是加工厂, token 是 最终产品。而且这个产品有个逆天特性,边际成本趋近于零。 练一次大模型花掉一千万度电,但产出的 token 可以 无限复制。第一个 token 贵如黄金,第一百万个 token 便宜如尘埃。这种规模效应是传统制造业想都不敢想的。更妙的是, token 的 定价权在谁手里? 在模型厂商手里。 open, 一个 g p t negative four 的 订阅卖二十美金,一个月毛利率超过百分之八十。这百分之八十里面,有一大块是电力的增值。只是增值的方式变了,从卖电变成了卖电的智力成果。中国现在缺的不是电,缺的是把电变成 token 的 炼金术。 三、为什么这事想了两年才想通。说实话,这个逻辑业界琢磨了整整两年,不是笨,是路径依赖。太可怕。 这一代商人被世界工厂的趋势淹入味了,总觉得出口就是集装箱,就是码头,就是报关单。数字产品,那是虚拟经济,是泡沫,是脱石象虚。这种偏见根深蒂固,以至于很多人看不见。一个基本事实,全球贸易的增量百分之七十已经发生在数字领域。另一个障碍是技术迷雾。 token、 大模型、算力、集群、推理、优化,这些词堆在一起,天然巨人千里,但拨开术语的外衣,核心逻辑朴素的很。人类正在从搬运原子转向搬运比特,而比特的搬运成本 是原子的百万分之一。想通这一点,再看中国的能源优势,视角完全不同。内蒙古的风电,四川的水电,新疆的光伏。以前愁的是消纳问题,发出来了用不完气风气光,心疼的要命。现在呢?直接建算力中心,就地转化,变废为宝。 电还是那些电,但出口形态变了,价值链位置变了,利润空间变了,这不是弯道超车,这是换道超车。四、暗战已经开始。美国人不是傻子,他们一边喊 ai 安全,一边卡芯片出口,本质上就是在抢电力,投垦转换链的控制权。 英伟达的 h 一 hundred 为什么禁售?因为那是当前最高效的电力压缩器,没有它,电再便宜,转化效率也上不去。但封锁从来都是双刃剑。中国的应对策略很清晰,堆规模,拼效率,找替代。华为升腾、韩五 g、 海光,国产芯片的生态在艰难爬坡。与此同时,算法层面的优化也在狂飙,用更少的算力,干更多的活。 这场战争的终局是什么?可能是一个新的全球分工。美国掌握顶尖模型和生态,中国掌握底层算力和制造。欧洲在边上打监管牌, 听起来有点悲观,但别忘了,电是硬通货,算力是硬通货,而 token 的 产量最终受制于这两样东西的供给,谁有电,谁就有底气,谁能把电高效的变成 token, 谁就能在新一轮全球化里切到最大的蛋糕。五、普通人的机会在哪里?说点实在的,这个趋势跟普通人有什么关系? 第一,职业选择,电力工程、散热技术、数据中心运维。这些以前被视为传统行业的领域,正在变成 ai 时代的基建核心,懂电又懂算力的人, 未来十年会很抢手。第二,投资视角,别只盯着模型公司看,往上游走,发电集团、电网改造、夜冷设备、国产芯片,这些才是 tok 经济的卖产人。第三,认知升级,理解电力 tok 的 转换逻辑,就能看懂接下来十年的大国博弈和产业变迁。 为什么中东土豪疯狂投资 ai? 因为他们有油,油能发电,电能变 token, token 能换未来这套逻辑放之四海而接准。

最近 ai 领域有个关键词彻底火了, token 工厂、阿里云、百度智能云集体涨价,英伟达、黄仁勋重新定义数据中心,阿里成立专属事业群。押注这一系列动作背后,都是因为 ai 产业正式迈入了 token 经济驱动的新阶段。 今天我们就来深度拆解什么是 token 工厂?这条全新的产业链里藏着哪些核心机会?又为什么说掌握 token 的 企业将主导下一代数字基础设施的竞争? 首先我们得搞懂最基础的问题,什么是 token? 其实它就是 ai 处理信息的最小单元。就像我们拼乐高的小积木、 chat gpt、 deep seek 这些大模型,不管是理解文字还是生成内容,都会把所有信息拆成一个个 token。 比如中文里的人工智能会被拆成人工和智能两个 token, 英文的 unbelievable 会拆成 un believeable 三个。 简单说, token 就是 ai 世界的基础粒子,所有的智能输出都是由这些小单元拼接而成的。而 token 工厂这个概念,是英伟达 ceo 黄仁勋在今年的 gtc 大 会上重磅提出的, 他直接把专用 ai 算力集聚比作一座标准化工厂,输入电力、数据和算法这三大原料,输出的就是可量化、可调用的 token。 更关键的是,黄仁勋提出了一个全新的核心指标,每瓦 token 数 彻底取代了原来的算力指标。这标志着 ai 产业从拼模型能力的时代,正式转向了拼 token 生产效率的时代。这里有个数据能直观体现 token 工厂的价值。英 伟达透露,其核心客户微软单季度就能生成超过一百万亿个 token, 这个数字不仅反映了 ai 应用的活跃程度,更重要的是, token 的 深层能力已经直接转化为企业的确定性收入。谁的工厂能以更低的成本、更高的效率生产 token, 谁就能在 ai 时代拿到最核心的话语权。 toker 工厂的运行逻辑其实很清晰,输入是电力数据算法,输出是 toker。 而这些 toker 就 像数字世界的乐高积木,能转化为文字、图像、视频、三维结构等各种形态,成为支撑所有 ai 应用的底层智能载体。 现在,整个 ai 产业链的主线已经从原来的模型研发升级成了算力 token agent 三层体系对应的 token 工厂产业链也清晰地分为上游算力基建、中游 token 分 发与商业化、下游 agent 应用生态三大核心环节。每个环节都有明确的价值量和核心玩家,我们一个个来细说。 先看上游的算力基础设施,这是 token 工厂的厂房和生产设备,也是整个产业链的核心 beta 资产价值量占比超过百分之四十, 它的效率和成本直接决定了 token 的 市场竞争力。算力基建的核心就是为 token 生产提供 gpu 集群、制算中心、电力供应等基础支撑,同时还包括算力租赁、液冷技术、高速光互联这些关键配套。 gpu 集群是 token 生产的核心硬件。 现在国内的 gpu 集群发展已经进入规模化阶段,中科曙光的超节点技术能在单机柜部署六百四十张加速卡,摩尔县城的花岗架构,支持十万卡以上的智算集群。百度还点亮了国内首个自研昆仑新三代万卡集群。 国产 gpu 厂商主要采用两种技术路线,一种是华为、升腾为代表的全自研 ip, 从指令级到计算单元完全自主设计。另一种是通过授权外部 ip 进行二次开发的混合 ip 路径。 当然,搭建算力集群的成本并不低,硬件采购、电力贷款、场地租赁、运维、人力,每一项都是大开销,尤其是电力成本, gpu 运行时的耗电量巨大,电费往往是数据中心最大的成本支出。也正因为如此,算力租赁成了当下的主流商业模式。玩家主要分三类,阿里云、腾讯云这些传统云厂商,万国数据、世纪互联这样的专业 i d c 服务商,还有中贝通信、鸿博股份这些整合资源的名企。 算力租赁的优势特别明显,能帮企业降低百分之三十到百分之五十的 it 运营成本,还能灵活扩缩容,把大型应用的部署时间从几周缩短到几小时,对中小企业和初创企业来说几乎是唯一的选择。随着 token 生产规模的爆发,算力基建还有两个必选的升级方向,夜冷技术和高速光互联。 叶冷是 ai 方向,长坡后雪中长逻辑赛道,当前机柜功耗密度上行,推动叶冷由可选走向刚需。技术路线迭代,从单向变双向变到组合静默路线提升,叠加海外进入兑现期以及国内商业化提速,产业链核心环节有望迎来高速发展机遇。 ai 加速爆发,带动数据中心内部流量激增,光互联持续向算力连接环节渗透。光互联新技术 c p o n p o o o i o c s。 百花齐放,叠加高速光模块,加速迭代、放量,共同构建起光电算深度协调体系,为 ai 算力集群提供全链路技术支撑, 从跨数据中心光互联、领域相干光通信、板级光互联到机架级光互联。说完上游的生产环节,我们再来看看中游的 token 分 发与商业化,这是整个产业链的 alpha 来源,也是目前的核心瓶颈,价值量占比在百分之二十到百分之三十。 如果说上游是生产 tokken 的 工厂,那中游就是 tokken 流通的高速公路,核心作用是提供算力调度、跨境网络传输、 c d n 加速等服务,确保 tokken 能稳定、快速地从工厂送到下游的应用场景中。现在这个环节有两个非常关键的信号, 第一, tokken 的 消耗量正在呈爆发式增长,自解火山引擎的日军 tokken 使用量已经高达五十万亿,国产模型的 tokken 消耗量更是占到了全球前十名的百分之六十一,发展速度非常惊人。 第二, token 的 商业化还处于早期的零到一阶段,目前的商业模式还是以算利付费为主,而从算利付费向 token 计费的切换才刚刚拉开帷幕,这中间藏着巨大的市场空间和想象空间。最后就是下游的 agent 应用生态,这是 token 的 终端消费环节,也是把 token 转化为实际生产力的关键。 简单说, agent 就是 ai 智能体,它能把 token 这种智能基本单元转化为文字、图像、代码等具体内容,应用到企业服务、工业生产、个人办公等各个领域,例如金山办公深度集成 wps ai 实现文档自动生成、数据分析等 agent 功能。 福星软件通过 pdf 处理能力支持 open core 自动化办公。科大讯飞发布星火认知大模型及 agent 开发平台,在教育、医疗等垂直领域领先。三六零推出三六零智脑 agent 平台,聚焦安全搜索场景。 昆仑外围发布天宫大模型,推出 ai 音乐、社交 agent, 这些都是 agent 的 实际应用,而背后支撑这一切的,都是源源不断的头肯。近期爆火的 openclaw, 也就是大家常说的小龙虾,更是成了 agent 产业从技术竞争转向应用落地的关键拐点。 它是一个完全开源、能本地运行的 ai agent 框架,它的爆火标志着 ai agent 从巨头竞争真正走向了全民应用。 你在上面部署一个 agent, 它可以帮你订票、写邮件、处理文件,背后消耗的全是 token, 这直接导致了云端 token 需求的紧喷。阿里、腾讯、百度都迅速推出了针对 opencloud 的 一键部署服务,目的就是锁定未来海量的 token 调用。 未来三到五年会出现通用人工智能的早期形态,到时候会有数以百亿级的 ai agent 参与到数字劳动中。 这就像当年智能手机普及后,移动互联网流量爆发一样, agent 就是 那个让 token 消耗量呈指数级增长的杀手级应用。 token 工厂不仅是一个技术概念,更代表了一种新的商业模式。传统的云计算收费模式正在从算力付费转向 token 计费。 这种转变背后的逻辑是, token 直接对应 ai 应用的价值输出,而不是底层的资源消耗。这种模式变更带来了新的投资机会。在上游,拥有低成本电力规模化制算中心的企业具备先天优势。在中游,能够高效调度算力,保障 token 传输质量的服务商将获得溢价。 在下游,能够将 token 转化为具体应用价值的 a 阵平台,具有最大的增长潜力。从投资角度来看, token 工厂产业链的各个环节都有值得关注的方向。 上游可以关注算力基建的核心硬件、叶冷和光互联的技术龙头,还有算力租赁的头部企业。中游可以关注 cdn 算力调度的优质企业。下游则重点关注 opencloud 相关的产业链,以及垂直领域的 agent 应用龙头。 当然,这条产业链目前还处于发展早期,不管是上游的算力效率提升,还是中游的 token 计费模式落地,又或者是下游 agent 生态的丰富,都还有很多需要探索的地方,但长期的价值已经非常清晰。回顾 ai 产业的发展历程,从最初的大模型研发,到后来的算力竞争,再到现在的 token 工厂, 每一次迭代都是产业向落地向实用化迈进的标志。 token 工厂的出现,让 ai 的 价值变得可量化、可交易,也让 ai 普绘化成为可能。 未来,当 token 的 生产、流通、消费形成完整的体系,我们的数字生活、工业生产、企业服务都会迎来一场全新的改革。好了,今天关于 token 工厂产业链的解析就到这里了,我们下期再见。

你以为这只是阿里又一次部门整合,其实他抢的是整个 ai 时代的主导权。阿里这次突然搞出一个阿里巴巴 token hub, 由 ceo 吴永明亲自挂帅,把阿里 ai 战队全给凑一块了。能让 ceo 亲自带队,这 token 有 这么重要吗? 首先我们先来了解一下什么是 token? token 说白了就是 ai 干活的计量单位。举个例子,输入想吃火锅,后台会切分为想吃火锅三个 token, ai 干多少活,就看他耗了多少 token, 跟咱们上班干多少活,拿多少钱一个意思。 那阿里为啥突然要围绕 token 集合力量?其实核心就是为了在 ai 战场上抢地盘。未来像做表格、跑重复流程的这些数字化工作,大部分都会交给 ai 去干,而这些智能体跑起来,底层烧的就是 token。 想到这,想必大家就明白了吧, token 就是 ai 时代的燃料,连卖铲人黄仁勋都在把重心从卖硬件往推理和 ai 智能体这边靠,也想分 token 一 杯羹。阿里现在不抢,等 ai 智能体全面爆发的时候,再想进场就晚了。除此之外,阿里的大公司病已经到了不得不动刀的地步。 大厂大家都懂得,为了抢点资源,几个部门能开一下午会,百分之八十的时间在对齐颗粒度。 整合之后的部门目标就一句话,创造 token、 输送 token, 应用 token。 至于每个部门具体干啥,咱就不细说了,又不是要去阿里上班。最关键的来了,阿里的优势在于它能走出一条完整的变现道路,一方面它能让 token 稳定大规模被调用。你看阿里搞了这么多年,双十一每秒几十万笔订单都能扛住, 更别说让他在海量的调用下把数据稳定送出去洒洒水而已。另一边,他让 token 不 止停留在云端和企业后台,而是让咱们普通人每天都能用上。阿里拿到了苹果在中国 iphone ai 功能的 本地合作资格,这意味着我们以后用的 siri 接的是阿里的大模型。最后,你觉得阿里这次整合能不能先坐上 ai 时代 token 生意的 c 位?

二零二六,一种狠心的 token 出海正在悄然暴利。不出国不运货,靠家里的显卡做 token 出海,这门生意,今年或许真的能跑通。现在,美国硅谷正陷入一场前所未有的电力饥荒。 一边是 ai 算力的需求爆炸,一边是老旧的电网根本承载不了这么大的负荷。在弗吉尼亚州和加州,很多数据中心想要扩容并网,排队已经排到了两三年后。这种有钱买卡没电开机的窘境,正在推高全球的 ai 产业的底层成本, 而这恰恰给了一种全新的跨境贸易模式留出了巨大的套利空间。它不是简陋的倒卖硬件,也不是复杂的软件外包, 这本质上是一场利用两国资源禀赋差异进行的数字能源套利。我们来做一个最直观的对比,在美国,工业电价受限于能源转型和基建之后,很多核心地带已经涨到两三毛美金一度。 而在国内,一托完善的能源工业体系,我们的电费成本只有人家的几分之一。更重要的是人的红利。 同样一套分布式算力集群,美国聘请专业运维工程师的成本极高,而国内拥有大量懂架构、会调优的自动化和计算机专业人才。这种工程师配置的性价比是全球任何地方都比不了的。 你用最低成本的店,配上最高效率的人,跑的是国产最强的 mini max。 开源模型生成的 token, 通过云端 api 卖给对价格敏感的美国独立开发者。你在境内完成生产,他们在海外完成消费,赚回来的是真金白银。 算力正在变成像煤炭、石油一样的基础商品,美国虽然在芯片制成上领先,但是在 ai 竞争中拼到最后,拼的是单位算力的综合成本。未来,谁能把低廉的电费和高校的人才红利转化为全球通用的 api token, 谁就掌握了印钞机的摇杆。这种分布式数字出口,正在打破地理和政策的边界, 这不仅是技术的较量,更是能源效率和人才密度的对撞。当然,这种路子对一般人来说也是有门槛的,跨海传输的延迟如果控制不好海外客户的体验就会直接崩掉。美国最新的法案虽然复杂,但是只要搞清楚服务贸易和算力租赁的界限,空间依然很大, 更别说还有资金回笼时的合规审查,每一步都得踩准节奏。这门生意是留给一些既懂底层技术又懂国际贸易规则的国际数字玩家的。

生成一百个汉字,就要消耗一百五十个 token, 你 以为这只是计数参数?黄仁勋和奥尔特曼最近放出了一个极其炸裂的信号,以后发工资可能直接发 token, 甚至它会计入全民基本收入。这到底是科技攻里,还是收割普通人的新镰刀字节?阿里、 kimi 这些巨头集体转向卖 token 模式?好家伙, token 是 什么?它就是 ai 处理信息的最小单位。你可以理解为 ai 界的计件工资。为什么大佬们这么疯狂?逻辑很简单, ai agent, 也就是人工智能体正在爆发。 以前是咱们搜资料,现在是 ai 帮咱们跨应用自主干活。英伟达更是直接把未来的数据中心叫做 token 工厂。黄仁勋甚至想给工程师发年薪加 token 预算。 本质上,巨头们是在争夺 ai 时代的认知、水电煤定价权。谁掌握了 token 的 计量标准,谁就是未来数字世界的美联储。 这事离咱们普通人远嘛?算力、硬件、散热材料、存储芯片的逻辑全变了。以前看芯片出货量,以后得看 token 的 吞吐效率。对普通打工人,如果未来算力成了全民低保,你不会用 ai, 可能连基本的生存资源都领不到。未来最值钱的可能不是劳动力,而是你名下的算力配额。 如果有一天,你的银行卡里不再是余额,而是能让 ai 替你干活的 token, 你 觉得这是一种进步,还是另一种形式的数字奴役?评论区,聊聊你的看法。

token 翻译成中文叫什么?叫词源,是模型处理文本的最基本单位。 token 和字呢?有什么区别? token 呢,可以是一个字,一个词,甚至半个字,那这是谁规定 的?是模型看了大量人类文字统计出来的,这样表达呢,更省事。常见的字和词就用一个 token 表示,其他的就用多个 token 拼接。 一个 token 到底是多少钱? deep 呢?输出一百万 token 呢?约等于三本新华字典只需要三块钱, gpt 五呢更贵,超过九十块 token 和上网流量收费是一样的道理吗?不是的, token 收的是计算费,是生产成本,而流量收费呢,是搬运费,不是一回事。为什么养龙虾要烧 token? 是 因为龙虾要用大模型思考和回答问题,因为大模型按 token 收费,所以就说烧 token。 本地部署大模型是不是就不用烧 toon 了?还是要用到 toon, 因为 toon 机制本身和部署方式无关。本地部署呢,不需要按量付费,但电费得自己掏,算上硬件成本不一定划算。如果我把一段话复制粘贴进去,是不是就算一次 toon 不是 文字越多呢?计算的输入 toon 数量就越多? 我问的问题很长,但答案很短,是不是只扣答案的 token 不是, 输了 token 呢?也要算钱?表情符号算几个 token 会不会比一个字还贵?常见的表情呢,是一个 token, 不 常见的会用两到四个 token 拼接表示。 deepsea 和 gpt 的 token 是 一样的吗? 不一样,互相不认识。 y, y, d, s 这种网络词是几个 token, 一 般拆成 y, y 和 d s 两个 token, 要是这个词足够火,也可能被模型当做一个整体。同样的问题,我上午问和下午问,输出的 token 数会不一样吗?不一样,模型输出具有随机性,每次输出的 token 数量不同。 那小龙虾帮我下载电影是否要按 token 计费?小龙虾思考怎么下载?打开下载网站,执行下载命令,这些都需要消耗 token, 但是下载电影本身不消耗 token, 因为电影不是大模型生成的, 电影是存在第三方服务器上,只消耗下载流量,不消耗 token。 为什么我和 ai 聊得越久,回复同样一句话,花的钱就越多? 模型是基于对话历史进行回答的,所以你所有说过的话呢,都会参与计算,计算成本就越高,这也是 ai 还需要按照输入 token 数量计费的原因。 怎么才能少用点 token 输入更少的提示词去掉?你好,请问这类废话规定模型输入长度,加一句五十字以内回答,但很有可能问题没有说清楚,回答呢也不够准确。如果前后问题呢?不相关也可以新开对话,避免历史对话参与计算。 托管是加密的密码吗?不是,托管只是一种文字编码方式,虽然你看不懂,但他并没有加密。 图片和文本的托管是一样的吗?不一样,图片会切分成很多小小的方块,每个方块呢?当做一个视觉托管,就像拼图一样。托管是为了收费而发明的吗? 不是,托管是技术发明,是为了能表达和能计算,只是计算的成本和托管数量正相关,所以就按照托管数量收费。我使用豆包没有付费啊。为什么说托管是收费的?大厂为了抢占市场让你免费使用,成本呢?暂时不用你出, 如果你是企业用户或者养龙虾就需要支付费用。我在一段话里疯狂敲空格, ai 是 视而不见还是会偷偷扣我的钱? 空格也算钱,虽然有的模型会把几个空格打包,大部分时候你多敲一个空格就再多烧一份算力。那 ai 产生的废话是不是能退费?不能,因为废话也是显卡辛辛苦苦算出来的。

token 才是中国真正的电力出口。电卖不出国境线,但 token 可以。 一个想了两年才想通的产业逻辑。先说一个反常识的事实,中国是全球发电量第一的大国,年发电量超过九万亿度,比美国、印度、日本加起来还多。但去查海关数据,电力出口这一项几乎可以忽略不计。不是几乎, 是真的可以忽略。为什么?因为电这玩意没法储存,没法长途运输,高压线,跨个国境都费劲,总不能把三峡大坝的电用充电宝打包发往硅谷吧?所以问题来了,手里攥着全球最大的能源,才能却只能在国境线以内打转,这就像开了个金矿,但金子太重,运不出去,只能自己在院子里堆着玩。 直到 token 这个概念出现,事情才开始变得有意思。一算理,即电力,这是第一层窗户纸。很多人到现在还没想明白,为什么美国人对 ai 芯片那么疯魔?为什么英伟达的市值能飙到三万亿美金? 他们买的不是芯片,是算力,而算力的底层是电力训练。一个大模型耗电量相当于三千个美国家庭一整年的用电总和。 openai 搞 gpt negative four 的 时候,光电费账单就吓死人。马斯克去年公开吐槽过,说 ai 再这么发展下去,美国的电网要先崩为敬。这时候再回头看,中国 有电,有大量的电,有全世界最便宜的工业电价。但问题是,把电卖给谁?直接卖电,电网不联通协议谈不拢,地缘政治一缴获十年都搞不定。 但如果把电变成算力,再把算力变成 token 呢?这就是那层窗户纸电出不了国境,但 token 可以。 token 是 数字的,是计时的,是点一下鼠标就能穿越太平洋的东西。在北京,用一千度电算出来的结果,一秒钟后就能出现在旧金山的屏幕上,没人能拦得住。 二、 token 是 电力的压缩包。理解这个逻辑,需要换个脑子。以前出口商品走的是实物路线,原材料工厂、集装箱、轮船、货架这条路线上,中国卡在中间环节,赚的是辛苦钱, 但 token 走的是另一条路,电力算力、模型输出,订阅付费。在这个链条里,电力是原材料,算力是加工厂, token 是 最终产品。而且这个产品有个逆天特性,编辑成本趋近于零。 练一次大模型花掉一千万度电,但产出的 token 可以 无限复制。第一个 token 贵如黄金,第一百万个 token 便宜如尘埃。这种规模效应,是传统制造业想都不敢想的。更妙的是, token 的 定价权在谁手里? 在模型厂商手里。 open 一个 gpt negative four 的 订阅卖二十美金,一个月毛利率超过百分之八十。这百分之八十里面,有一大块是电力的增值。只是增值的方式变了,从卖电变成了卖电的智力成果。中国现在缺的不是电,缺的是把电变成 token 的 炼金术。 三、为什么这事想了两年才想通。说实话,这个逻辑业界琢磨了整整两年,不是笨,是路径依赖太可怕。 这一代商人被世界工厂的趋势淹入味了,总觉得出口就是集装箱,就是码头,就是报关单。数字产品,那是虚拟经济,是泡沫,是脱石象虚。这种偏见根深蒂固,以至于很多人看不见。一个基本事实,全球贸易的增量百分之七十已经发生在数字领域。另一个障碍是技术迷雾。 token、 大模型、算力、集群、推理、优化。这些词堆在一起,天然巨人千里,但拨开术语的外衣,核心逻辑朴素的很。人类正在从搬运原子转向搬运比特,而比特的搬运成本 是原子的百万分之一。想通这一点,再看中国的能源优势,视角完全不同。内蒙古的风电,四川的水电,新疆的光伏。以前愁的是消纳问题,发出来了用不完气风气光,心疼的要命。现在呢?直接建算力中心,就地转化,变废为宝。 电还是那些电,但出口形态变了,价值链位置变了,利润空间变了,这不是弯道超车,这是换道超车。四、暗战已经开始。美国人不是傻子,他们一边喊 ai 安全,一边卡芯片出口,本质上就是在抢电力。 toc 转换链的控制权。 英伟达的 h y, 韩准为什么禁售?因为那是当前最高效的电力压缩器,没有它,电再便宜,转化效率也上不去。但封锁从来都是双刃剑。中国的应对策略很清晰,堆规模,拼效率,找替代。华为升腾、韩五 g、 海光,国产芯片的生态在艰难爬坡。与此同时,算法层面的优化也在狂飙,用更少的算力,干更多的活。 这场战争的终局是什么?可能是一个新的全球分工。美国掌握顶尖模型和生态,中国掌握底层算力和制造。欧洲在边上打监管牌, 听起来有点悲观,但别忘了,电是硬通货,算力是硬通货,而 token 的 产量最终受制于这两样东西的供给,谁有电,谁就有底气,谁能把电高效的变成 token, 谁就能在新一轮全球化里切到最大的蛋糕。

大家好,欢迎来到科技快报,今天我们要聊聊通向智能未来的重要组成部分, token。 token 是 一种全新的创造方式,它可以看作是 ai 的 构建模块。深层的每一个 token 都代表着人工智能背后的核心驱动力。这 些 token 的 诞生让数据得以转化为知识,并以此为基础,深度结合我们已有的经验,进一步扩展学习与应用能力。 他们不仅笑能卓著,例如帮助机器人在虚拟世界里学习,也在真实的物理领域中创造了前所未有的可能,其中包括提升工业流程和农业生产力。除此之外,透根已经被用于我们生活的方方面面。他们负责支持高风险、高感知的领域,比如不可达的人类手工操作环境、医疗监控等。 正因为他们的存在,我们能够更轻松的呼吸,同时保障生命中最小心跳的力量,也及人类健康的点滴细节。 通过发挥这种智能模块的力量,我们有机会在前人难以企及的工程中创新突破,比如探索宇宙星云的广袤和发现背后的更多奥秘。 随着探索边界不断推进, tucker 正在参与新一波技术浪潮,推动全人类迈向一个更加光明的未来。从这里开始,科技力量结合新的创造,开启的正是一个属于全人类的未来篇章。

哈喽,大家好,欢迎收听我们的播客,今天咱们要聊的话题呢是 token 出海,那这个话题呢,我们会从 token 出海的基本逻辑,为什么现在这个时间点 token 出海会成为一个风口,让包括 token 出海的产业链上面有哪些重要的企业,以及 token 出海未来的市场会怎么发展这几个角度来给大家聊一聊。 好,那我们就直接开始今天的主题吧。咱们先第一个先来聊出海的逻辑啊,就这个 token 出海到底是个什么东西?它的本质是什么啊?就是简单讲就是,呃,海外的用户或者企业,他通过调用我们国内的这个大模型的 a p i, 然后呢?呃,他每消耗一个 token, 就 相当于他用了我们国内的一份算力嘛?那这个时候他的这个请求是通过网络发过来的,我们国内的这个智算中心进行计算之后,把结果再回传给他。 这个过程其实就是一个我们把算力以 token 为单位卖到了海外,听起来像把国内的算力变成了一种可贸易的数字商品,没错没错,对,那它的这个底层其实是靠我们国内的这个绿电以及我们的这个大规模的 gpu 集群,还有我们的这个先进的大模型技术,然后把我们的这个电力变成了一种高附加值的数字服务出口, ok, 对, 那它其实跟这个传统的这种硬件或者说云服务的出海还是不太一样的,它是一种 更高效的、更灵活的一种跨境的商业模式。你觉得中国的这个 token 出海为什么可以在全球市场形成这么强的商业模式,你觉得中国的这个绿电价格非常便宜啊,可能就欧美电价了四分之一, 然后呢,我们又有这个大规模的制算中心,所以我们的这个算力的成本也被拉下来了。我们可能就是,呃,每百万 token 处理的成本比欧美要低百分之三十到六十,有的甚至可以说我们的这个成本只是他们的十分之一到二十分之一,成本优势确实吓人。对,然后更巧的是这个 wto 的 这个电子传输是免征关税的, 所以我们这个 token 出海是几乎没有什么贸易壁垒的。再加上我们的这些国产的大模型在国际上面的这个评测当中也越来越强,所以我们现在不光是有价格的优势,我们现在也有技术的优势,所以就是相当于我们这个竞争力是非常非常强的。你觉得这波 token 出海热潮背后的核心的推动力到底是什么?我觉得首先第一个就是全球对 ai 算力的需求是爆发式的, 你看这个多模态,还有这个 ai agent 这些新的玩法出来之后,大家对这个推理的需求就是成倍的往上翻,然后市场规模可能接下来几年都是以万亿为单位的, ok, 但是呢,这个海外的这些云厂商呢,他们又在不断的提价, 所以大家就开始寻找更便宜的地方。那这个时候呢,中国的这个算力就成了一个新的宠儿。确实,现在大家都在追求又便宜又好用的算力嘛。然后呢,我们国家又有这个东数西算这个工程,把我们西部的这个绿电和我们的这个大规模的集群都用起来了,所以我们的这个算力的成本是全球最低的。我们的这些国产的大模型 在国际上面的这个评测当中也越来越强,再加上我们的这个政策层面,不光是给你免税,还给你把这个数据跨境和这个合规的框架都搭得非常的稳, 所以就是相当于给你铺了一个高速公路,让你这个东西可以出海。然后咱们来进入第二部分,就是咱们来聊一聊这个 talkin 出海的这个产业链都有哪些核心的企业在这个不同的环节。 ok, 那 这个产业链主要都分哪些环节呢?整个这个产业链的话,其实可以分成上游的绿电和跨境网络,以及下游的这个大模型 a、 p、 i 和 mas 平台。 ok, 那 在这个其中呢, 其实每一个环节都有一些骨干的企业在里面发挥作用,就说每一个关键的步骤都有专门的玩家在里头深耕,是吧?没错没错没错,是的是的,你比如说像这个提供绿电的和能耗指标的,那肯定就是一些 大型的能源企业啊,然后包括一些有地方国资背景的一些公司在做。那这个智算集群和算力租赁呢,就有一些头部的这种云计算的公司啊,也有一些这个专门的这种新锐的玩家在里面。 那这个跨境网络和数据的流通呢,就有一些呃专业的这种 c、 d、 n 和边缘计算的公司在帮你做保证,这个芯片和硬件呢就更不要提了,有一些呃国产的这种芯片巨头在帮你做支撑。这个大模型和 mas 平台呢,就更是有一些这种本土的这种 ai 龙头和一些呃,全球化的这种平台在帮你做。最后就是这个 金融和合规这一块,也是有一些支付科技的公司和一些啊持牌的这种机构在帮你做,保驾护航, ok, 对, 就是这样大家才能形成一个合力,把这个 token 出海这件事情真正的做起来。你觉得这些 token 出海的这些企业,他们在布局上面有什么共通的地方吗?呃,其实我觉得他们第一个就是大家都在跟头部的大模型做深度的绑定, 就是确保自己的这个 token 的 消费是有一个持续的很大的量的。然后第二个就是大家都在电价比较低的地方,或者说绿电比较充裕的地方去建自己的这个智算中心 啊,来压低成本。所以就说既拼技术也拼资源呗,没错没错没错。然后除了这个智算中心的布局呢,大家也都在全球各地去铺自己的这个节点啊,来减少用户的访问延迟,包括在网络的合规啊,数据的安全啊,上面下很多的功夫,就是让你能够 跨国的这个调用就像本地一样的顺畅。同时呢,大家都是聚焦在这个推理的算力上面啊,来实现一个更高的资源利用率和一个稳定的收益。你觉得这些企业在这个头肯出海这个赛道里面,他们的竞争优势到底在哪里?我觉得首先就是他们已经形成了一个从 绿电的供给啊,到芯片啊,到这个制算中心啊,到这个跨境的网络啊,到大模型啊,再到这个金融的合规啊,这样的一个完整的产业生态, 那这个其实是全球范围内都是非常少见的哦,等于说大家是在多维度展开竞争。对,而且就是呃,头部的公司都在加紧的绑定这个低价的绿电啊,然后扩充自己的这个制裁的潜能啊,不断的去拓展海外的市场啊,也在跟这个监管啊,去推动这个合规的互任啊等等的。那这些其实都是一些门槛,让后来者很难去快速的跟上, 所以就说未来的格局会越来越清晰,那这些龙头的公司的优势也会越来越明显。我们来进入第三个板块,我们来聊一聊未来的趋势啊,就是中国的这个 token 出海的市场份额和这个地域的格局会怎么发展?呃,这个其实最近的数据已经很震撼了,就是中国的这个 ai 模型的 token 的 全球的市占率已经超过了百分之六十。 然后呢,这个头部的厂商里面有很多,他们的海外的收入已经占到了大头,甚至有一些就是纯海外的用户占比超过九成啊,这个就是说海外的需求已经成为绝对主力了。对,没错,而且这个日军的 token 的 消耗在过去的一年半的时间里面涨了三百倍,然后呢,预计到二零二六年可能会突破五百万亿,就是全球每消耗三美金的推理的算力就有两美金,是中国的 这个北美、欧洲是主要的市场,但是呢,东南亚、中东这些地方也在加速的增长,所以就说未来中国的这个主导地位只会越来越巩固,可能到二零三零年的时候市占率会超过百分之七十,你觉得接下来几年这个 tokin 出海在技术和产业生态上会有哪些新的变化?呃,我觉得就是首先就是芯片和硬件层面的这个国产替代会明显的加速, 就是升腾啊,海光啊、韩五 g 啊这些本土的方案会成为智算中心的主力。然后呢这个也会让整个这个算力的占从下到上都能够自主的掌控,所以整个链条都在变得更自主、更高效。对,没错。然后呢,包括这个大模型本身也会在这个 混合专家模型啊,包括这个迪比特量化啊,包括这个多模态的能力上面不断的去突破,包括这个智算中心本身也会往这个夜冷啊、绿色节能啊去发展。 整个这个液态也会从这个单纯的卖 api 调用到这个提供一整套的这种算力加模型、加应用,加合规的这种全站的解决方案,甚至是跟这个终端的应用出海形成一个壁画,所以就是说这个技术和生态的这个护城河也会越来越高。你觉得就未来这个 token 出海在商业模式和这个产业格局上会有哪些新的变化? 呃,现在大家还是以这个按 token 计价的这种推理机服务为主。那未来的话,这个通过开源模型和这个微调工具来吸引用户,然后再叠加这个企业级的定制啊,和这个生态的分成,会成为一个主流, 那这个聚合平台的作用也会越来越大,就是他会成为一个全球的开发者,都来接入中国的这个算力的一个统一的入口,所以头部公司的优势会越来越明显吗?对,就是这样,就是最终会形成一个 强者越强的一个局面,就是那些拥有低价绿电的啊,然后拥有大规模的制算中心的,以及掌握了核心的模型的,这些巨头会牢牢的占据这个主导地位,那其他的一些小的玩家可能就会被整合,或者是说就出局了,那整个这个产业的协助也会变得更加的紧密。那同时呢,大家也要去面对这个各地的监管的挑战啊,数据合规的挑战, 所以这个行业的门槛也会越来越高。对,今天我们从这个托肯出海的基本的逻辑,到他背后的一些驱动力,然后再到这个产业链的全景以及未来的一些趋势给大家聊了一遍。那其实最后我们也可以看出来,就是这个 浪潮其实给投资者带来的是一个非常独特的横跨多个高成长赛道的这样的一个投资机会。好了,那就是这一期节目咱们就到这里了,然后感谢大家的收听,咱们下期再见,拜拜。拜拜。

一九五六年,美国人发明了集装箱,在那之前,全球贸易的成本一半是装卸费。集装箱一出现,世界变了,货物被标准化,运输成本暴跌,全球贸易爆炸。今天 ai 时代也出现了一个集装箱,它叫 token。 很多老板听到 token 只当技术名词,但如果你是做生意的,你要看到的是,这是一次电力的重新定价。 什么是 token? 简单说就是 ai 处理文字的技能班位。你问一句话,写一段代码,生成一份报告,背后都在消耗 token。 重点在于, token 可以 被计量,被计费、被出口。这就像集装箱,把原本难以交易的智能服务装进标准化容器,从此脑力可以像货物一样卖到全球 来。算一笔账,一度电直接出口大概卖零点五元,炼成铝定大概卖一点五元,翻三倍。如果拿去跑大模型推理呢? 一度电大概能产出五百多万。 tokyo 按国内模型定价算,可以卖到十一元,十一元是直接卖电的二十二倍。如果按 open i 的 价格算,将近四百元, 七百八十五倍。你看到中奖了吗?同样是一度电,换个皮价值差几十倍上百倍。这不是能源生意,这是算力生意,是标准化的脑力出口。更关键的一点,电不能装箱,但 tucker 可以 跨国流动, 不用电网,不用特高压,不用对方国家批准,只要一根网线。印度创业者调用中国 api, 背后是甘肃的风电,青海的光伏在转电没出国,钱出国了,这才是结构性机会。 很多老板问, ai 这么卷,价格都打烂了,还赚什么钱?你要明白一件事,现在的二十二倍,不是天花板,是价格战的结果。美国把价格毛在高位,中国用工程能力把成本打下来。一个负责教育市场,一个负责规模收割,这就是新的全球分工。 真正值得你思考的,不是模型谁更强,而是在这个时代,你是卖店的,还是卖 token 的,是卖原材料还是卖标准化能力。 所有产业都会被 token 重构,教育变成按 token 计费,客服变成按 token 计费,编程变成按 token 子计费,营销、法务、设计、咨询全部变成可计量的智能服务。一旦被计量,就可以规模化, 一旦规模化,就会诞生新的巨头。生意的本质从来没变,谁掌握标准,谁赚溢价,谁只卖原料,谁被压价。 一九五六年,集装箱改变了全球制造业。二零二六年, taco 正在改变全球脑力市场。电力过剩不是问题,算力过剩才是机会。美国把 taco 价格炒上去,中国把 taco 成本打下来,悉数东算的战争才刚刚开始。 如果你是老板,现在真正该问自己的,不是要不要用 ai, 而是你能不能把自己的行业装进 tokyo 里卖。

三月十七号,一个很多人没看懂的信号出现了,港股偷看第一股训测,尾盘直接拉了百分之三十七,更关键的不是股价,而是黄仁勋刚刚说了一句话,未来数据中心不是算力中心,是偷看工厂。 今年的 gdc 大 会,黄仁勋抛出一个非常关键的新定义, ai 基础设施等于生产 tcn 的 工厂。 什么意思?过去我们理解 ai 是 训练模型跑数据,但现在变了, ai 每一次推理,写一句话,生成一张图,写一段代码,都在消耗 token。 所以 token 本质上变成了什么 ai 时代的计价单位? 很多人还停留在一个旧认知, ai 拼的是训练。但黄仁勋直接说了,推理才是爆发点。而且有个非常炸裂的数据,过去两年, ai 算力需求增长了一百万倍,这意味着什么?训练只是起点,真正好算力的是每天在用 ai 的 人。 所以你就能理解为什么今天资金开始炒 token 概念。因为逻辑已经变了,以前卖软件,现在卖 token 消耗。而港股的讯测被贴了一个标签, token 第一股, 再叠加券商预期二零二六年净利润二点七二亿,二零二七年八点四一亿,直接从亏损走向爆发。 但这里我要说一个更重要的判断, token 只是表象,真正赚钱的是背后的基础设施。说白了, token 等于电,数据中心等于发电厂, 整个链条其实可以这样看,一、 token 需求入口即应用层,谁在疯狂消耗 token? 对 应公司是顺网科技,属于云算力入口加应用分发。 二、 ai 工厂载体就是数据中心,谁在生产 token, 对 应公司是美利云做 i d c 加算力,同力添起做数据中心工程加能源系统,本质是 ai 工厂的厂房 三核心瓶颈,电加散热。重点来了,黄仁勋这次反复强调一个指标,梅瓦特 token 树。 这句话翻译一下就是谁能用更少的电生产更多 token, 谁就赢。对应公司像做夜冷的高栏股份,伊米康边缘算力加温控,勺能股份电力测。 所以这轮 ai 其实已经升级了,第一阶段拼模型,第二阶段拼算力。现在拼 token 生产效率。 而决定 token 效率的不是 gpu 本身,是电,是散热,是基础设施。那问题来了,如果 ai 未来按 token 收费,你觉得最赚钱的会是 卖 token 的 公司还是造 token 工厂的公司?评论区选一个, a 应用层 b 基础设施算力加液冷。

朋友们,大家有没有想过一个问题,为什么 ai 大 模型要按透坑消费?同样的一百万透坑,不同的大模型之间价格能差三十多倍。 你可能会说,咱们平时用的豆包、元宝这些也没交过钱啊。没错,网页版和 app 确实免费,那是大厂为了抢占市场给的福利。但如果你是专业用户,或者使用 api 调用大模型, 那就得按量付费,烧起钱来就真的非常吓人了,这身钱到底烧在哪里?当模型正式发布后,使用成本其实分为两个部分。第一部分,固定成本, 包括前期的研发投入、训练成本,还有算力基础设施建设。呃,比如建机房、采购显卡、购置内存和硬盘。 最近大家可能都注意到,显卡和内存价格一路上涨,很大程度就是因为 ai 需求暴增,把硬件价格推高了。但这些成本有个特点,它是沉没的,在魔性发布前就已经支出了。随着用户越来越多,这部分费用会被不断地摊薄, 到每次调用时占比会越来越低,甚至可以低到忽略不计。第二个部分就是动态成本,每次调用模型时实打实消耗的东西,比如电力消耗、内存占用、网络流量传输, 所有这些消耗都和 token 的 数量直接相关。 token 中文可以翻译成词语,它可以是一个字儿、一个词儿、一个分词,甚至一个字节。在大模型中, token 被表达为一组数字序列,用于计算下一个 token。 token 越多,模型的计算时间就越长, 占用的算力和资源自然就越多。所以按照托管数量收费,本质上是一个多用多付、少用少付的计费方式,非常直观,也非常合理,这就像我们每个月交着水电气一样。 从这个角度看, ai 正悄悄完成一个转变,它从一项技术产品变成了一种基础服务。我们想要获得治理,就需要购买算力,说不定以后每个月的水电账单旁边就会多出来一行托管费用。 既然都是按 token 收费,为什么不同大模型的价格差这么多?比如一百万 token, bitcoin 的 收费是零点二八美元, gbt 模型要二点五美元输出 token 的 差距更夸张, bitcoin 是 零点四二美元, gbt 是 十五美元,整整差了三十多倍。 同样都是头肯,为什么价格能差出这么多?决定价格的两大因素,第一,电力和人工成本不同。在美国、中国、中东等不同地区,电价、运维成本、人力成本差异非常大,这些最终会反映到价格里。 第二就是算法不同。好的算法就像一台省油的发动机,同样跑一百公里,有的车只需要三升油, 有的车却烧掉十升。大模型也一样,算法设计的越巧妙,达到同样质量的输出,消耗算力就越少。所以优化算法是模型研发人员最重要的任务之一。算法越高效,成本就越低,价格自然就更有优势。这里顺便澄清一个常见的误解, token 的 发明初衷不是为了计费。 token 是 纯粹的算法创新的发明,是为了把人类的语言翻译成机器能听懂的数学坐标。 只是后来大家发现, token 的 数量恰好决定了计算量,这才顺理成章的用它来计费,绝不是因为收钱才搞出来这么个复杂的概念,当 ai 像自来水一样按量收费,一个属于算力文明的时代就真正开始了。关注我,我会为大家持续科普。

今天咱们聊个特别的话题, token 才是中国真正的电力出口。哎,说到这个我就来劲了,之前总听别人说中国卖电给全世界,结果现在怎么变成 token 了? 你别急,听我给你掰扯明白。首先得搞清楚, token 出口的本质,其实是电力价值的跨境交付。二零二六年二月 openroot 数据显示,全球前十模型总 token 消耗约八点七万亿,中国模型独占五点三万亿,占比百分之六十一。 你想想这些 token 背后是什么?是咱们的服务器在跑,是电力在支撑啊。哦,合着咱们不是直接把电用高压输过去,而是把电变成了 token 这种数字产品卖出去? 没错,就是这个意思。而且中国能做这个,是因为咱们有别人复制不了的双重壁垒,电力和算力。你看电价,中国工业电价零点四到零点六元每度,美国零点八到一点二元每度, 咱们的综合推理成本仅为美国的三分之一,五度关一,这成本优势摆在这,谁能跟咱们比?确实,店价便宜是真的香。那这 tko 出口到底赚不赚钱啊? 那可太赚了,比传统行业赚多了,一度店可产出数百万, tko 按海外定价,最高可变现近四百元,毛利率碾压传统行业。你想想传统卖店一度店能赚多少钱?可能也就几分几毛,这 tko 一 卖直接翻了几百倍。 哇,这差距也太大了,那除了赚钱还有啥别的影响不?当然有,现在地缘政治也在加速全球能源格局向数字电力转型。 二零二六年中东冲突导致布伦特原油价格突破八十一美元每桶,而中国 token 俗物凭借零关税、零损耗优势逆势增长。你看传统能源容易受地源影响,但是 token 这种数字产品就没那么多限制了。 确实,传统石油天然气运输还得靠管道游轮,一旦有冲突就断供了。 token 直接线上传输确实方便多了, 对吗?而且咱们还能预测一下未来的发展,我觉得二零二七年,中国模型全球 token 占比将突破百分之七十,毕竟现在都已经百分之六十一了,按照这个趋势增长,突破百分之七十不是问题。 那数字人民币会不会也跟着沾光?肯定的,数字人民币将成为 token 出口结算的主要货币。现在咱们都在推数字人民币国际化, token 出口正好是个好机会,用数字人民币结算,既能方便交易,又能提升数字人民币的国际地位。 还有一点我比较好奇,现在新能源发电越来越多,绿电 token 化会不会成为主流?你说对了,绿电 token 化将成为新能源消纳的主流模式。 现在新能源发电不稳定,发多了用不了就浪费了。把绿电变成 token, 就 能把这些多余的电力价值储存起来,需要的时候再用,这不就解决了肖纳的问题吗? 这么看来, token 出口不仅是个生意,还能解决能源行业的痛点啊。没错,这就是新赛道的魅力。传统能源贸易模式已经玩了这么多年,有太多痛点,价格受地源影响大,运输成本高,损耗大,但是 token 出口就完美解决了这些问题。 那咱们中国在这个新赛道上是不是已经领先了?可以这么说,咱们有电力成本优势、算力优势,还有庞大的市场需求,这些都是别人比不了的。而且咱们现在已经在大力发展数字经济, token 出口正好是数字经济和能源行业结合的产物,未来的发展空间巨大。 看来以后别人再问中国靠什么赚钱,除了制造业,还得多加上一个 token 出口了。错,这就是中国电力出口的新形态, 用数字的方式把电力价值卖到全世界,既能赚钱又能引领全球能源格局的转型。今天这干货可真是不少,听我都有点热血沸腾了。期待咱们中国在这个新赛道上越跑越快!

兄弟们,黄仁勋直接自封 tucker 之王,今天喊 tucker 是 ai 硬通货。很多人听傻了,觉得这是美国的未来。但我告诉你, 换个角度看,这根本就是中国的未来。因为黄仁勋吹的所有牛都绕不开一个核心算力。没有算力, tucker 就是 个数字笑话。而算力这个真正的王炸,早就握在中国手里了。黄仁勋说,数据中心是 tucker 工厂,按 tucker 定价,分五档收费, 听着很厉害,但剥开底层一看,地基只有一个算力,每一个 token 的 生成、传输、计算,全靠算力支撑。他谈万亿市场,谈分层定价,本质就是在卖算力,赚算力的钱。但问题来了, 谁有更便宜、更稳定、更大规模的算力?答案就是,中国。黄仁勋的算力,靠昂贵芯片、高成本数据中心堆出来,而我们的算力,靠全产业链自主可控, 从芯片设计、服务器制造,到数据中心运营,我们有完整闭环。更关键的是,我们有规模领先的算力基建和成本优势。而真正拖住中国算力的,不是芯片, 是中国电力基建。记住一句话,偷啃靠算力,算力靠电。黄仁勋可以不提电,但我们必须讲透。看看美国电网老化频繁断电,工业电价居高不下。 讲大规模建算力中心,先跟居民抢电,跟脆弱电网扯皮,成本高到根本铺不开。再看中国西电东送,特高压全国组网, 我们拥有全球最稳定的电力供应体系,这才是中国算力能做到低成本、高稳定、全覆盖的真正底牌。黄仁勋的未来,成本高、门槛高,是少数人的游戏,而我们的未来,靠电力基建打底, 是普惠自主,所有中国企业都用得起的未来。黄仁勋在谈商业模式,我们在谈核心命脉。他说 tucker 是 新硬通货,未来算力需求突破万亿。但我问你,没有中国算力供给,这个万亿市场能成立吗? 根本不能!中国是全球最大的算力生产国和消费国,支撑着千万企业、亿万用户的 ai 应用。黄仁勋现在推 token, 本质上是在为中国算力的全球价值铺路。 这就像他在宣布黄金很值钱,却忘了金矿在中国手里,我们的算力就是 ai 时代的金矿。所以,黄仁勋描绘的未来,看似是美国的,其实根上是中国的。算力是 tucker 的 核心,电力是算力的根基,没有中国电力, 就没有中国算力,没有中国算力,他的头肯未来就是空中楼阁。从这个角度你就明白,黄仁勋的发言恰恰证明了中国在 ai 时代的绝对底气。我们要的不是美国定义的未来,而是由中国算力、中国电力共同定义的,真正属于我们的 ai 未来。