建一个标准的托管工厂,比如亚马逊 a w s 这种门槛有多高?我们负责任的来盘点一下。首先要有物理底座,也就是 a i d c a i d c 也叫智算中心,这不是随便找个普通机房,而是要有高密度的 gpu 集群,比如一百二十八台,我们要把它联网起来,还要有标准的冷却系统,风也好,夜也好,然后还要有稳定的电力系统, 包括柴油发电机, ups, 动力电池或者是储能。二、软件和大模型工厂。小的托管工厂只能用开源的大模型,而 aws, 微软或者是阿里,他们可以拿到大厂的授权,可以装闭源模型。闭源模型主要是 gpt cloud 旗舰,然后 豆包 mini max 的 先进版本, g l m 的 新版本, kimi 的 新版本,而开源就是 deepsea, 千问拉玛和 miniso。 而且你还需要根据用户的场景和显存的性价比, 高频的测哪些开源模型比较好,动态的更新,高性价比的开源大模型,让算力发挥大的价值。 三、生产管理我们需要有算力调度和计费系统。跑通模型不难,但要做到高并发下的商业交付,比如多个用户用 api 调用不同的大模型,如何做到高并发, 并且做到动态的显存管理,把首次的延迟 t t f t 降下来,并且做到毫秒级的精准计费,也是一整套复杂的系统。 四、分销渠道,我们要换成现金流,无论是自建 to b 的 团队去打大客户,还是作为云服务商的节点来转售,或者是上架 a p i 到一个聚合分发平台,或者上架到电商吃,这样的一个长尾的流量,多渠道的 销售能力也会决定工厂的兴衰。总结一下,偷啃工厂是未来一项可见的快速增长的业务,现在是起点,也是机会,也是重技术、重运营的硬核基建。至于一个电站,买一台五零九零,拉一根网线,部署开源大模型和调度管理软件,我们 称之为偷啃作坊。未来市场不只需要工厂,也需要作坊,作坊也有自己的生存空间,下期来聊。
粉丝2.4万获赞8.8万

最近我收到最多的后台私信就是 token。 既然是个新的大众商品,那普通人能不能自己生产 token 自己卖?今天一条视频给你讲清楚。先说结论,能生产,但你算完账,你就不会干了。我们来算一笔账, deepstack 目前最火的大模型,它卖 token 的 价格是多少?输出,每百万个 token 三块钱。 一百万个 token 是 什么概念?大约相当于五十到七十万个中文字,一本书大概十万字,也就是说, ai 帮你能写将近七本书的内容,只收你三块钱。反过来说,你自己要生产这一百万 token, 至少得花几十万买个 gpu, 装一台服务器, 二十四小时不断电。就这样,你的一台机器大概需要十几个小时才能生产出这一百万个 token。 而且这个你还没有算你的工程师维护机房电费和宽带费。 deepsea 为什么能卖三块钱?因为它拥有几万张 gpu, 同时跑,一天处理上千亿个头梗,成本被摊到几乎为零。这就好比你自己在家养了一头牛,挤了奶想拿出去卖,一瓶卖五块, 你觉得能赚,但是你一算,买牛花了两万,饲料每月两千,一天只能挤几斤奶,隔壁蒙牛一天出几千吨,一瓶卖三块钱还能赚?你的奶不比它的差,但是你的成本是它的一百倍还要多。 这就是普通人生产 token 面临的问题,不是做不了,是做了一定亏。所谓普通人在 token 这门生意里的正确姿势,不是自己生产 token, 而是用便宜的 token 去创造贵的服务。 举个例子,你用 deepstack 花三块钱买一百万个 token, 让 ai 帮你写十篇小红书文案,通过小红书的文案带货去赚钱,那么你的成本就是三块钱。 你赚的不是 token 的 差价,是你知道怎么用 token, 而别人不知道的信息差。再举个例子,你用 ai 帮一个小型企业搭建一套 ai agent 的 token, 成本可能不到十块钱,但你收企业五千块钱的咨询费, 企业买的不是你那十块钱的 token, 而是你的判断力和方案。不要去跟巨头抢着生产 token, 要去想怎么用三块钱的 token 创造三千块钱的价值。生产 token 的 钱留给巨头去赚,用 token 去做赚钱的生意,才是留给普通人的机会。我是文思,关注我每天带你看懂 ai。

卖透坑不产透坑就是个二道贩子。我的逻辑流程都很简单的,就是拿代理做销售,就是去解决销售的问题,怎么拿到代理,拿到后卖给谁,这个才是我们要去花时间和精力去解决的事情。风来之前我先得保证我自己被风吹的到。

中国找到了一种新的出口方式,不出口一度电,不出口一块芯片。但全世界都在为中国的电力买单,听起来不可能,对吧?但这件事已经发生了,而且有一个专门的名字,叫做 token 出海。我之前那条五十四万播放的视频讲过, token 是 ai 时代的消耗品。 ai 每回答你一句话,每执行一个动作,背后都在燃烧 token。 黄仁勋刚刚在三万人面前说了同样的话, token 是 新时代的大宗商品。 那么现在问题来了,这些 token 是 哪里生产的?谁在为他买单?答案越来越多地指向中国。一个美国的程序员打开电脑,调用 deepsea 的 api 写代码。他敲下回车的瞬间,请求数据通过太平洋海底光缆到达中国西部的数据中心。中国的 gpu 集群消耗着中国的电力, 让他把代码跑出来,结果再传回美国。整个过程不到一秒钟,电没有离开中国,芯片没有离开中国。但是这个美国程序员这次的服务付了美元,他买的是什么?就是 token。 token 的 成本就是电,中国的电通过 token 这个主体,变成了美元收入。这就是 token 出海 规模到底有多大?我给你几个数字,你感受一下。二零二四年初,中国 ai 日军 togo 消耗量是一千亿,二零二五年中突破三十万亿。 二零二六年二月一百八十万亿,十八个月暴增了三百倍。在全球最大的 ai 模型平台 openroot 上, 中国模型的调用量已经占到了百分之六十一,前五名里,中国占四个。 mini max 上市前,百分之七十的收入来自海外。 kimi 的 海外 a p i 收入增长了四倍,已经超过国内。这些公司赚的是什么钱?是全世界的开发者调用中国大模型时,一个 token 一个 token 浮的费。 为什么全世界要买中国的 token, 而不买美国的?一个字,便宜。 mini max token 价格是每百万 token 零点三美元, cloud 同样的服务要五美元,差了近二十倍。能力差多少? mini max 的 代码能力测试拿了八十点二分, cloud 是 八十点八分, 只差零点六分,价格差了二十倍。你是开发者,你会怎么选?为什么中国能做到这么便宜?因为 token 的 成本百分之七十以上是电力和算力。 华泰证券说了一句话,中国低电价优势正在转化为全球 ai 服务的定价权。中国全社会用电量超过十万亿千瓦时,是美国的两倍多。新疆的绿电成本低到零点二元一度, 这些电大量闲置着,因为当地用不完。现在通过东数西算,把数据中心建在这些电力富裕的西部地区,用便宜的电生产 token, 再通过光缆卖给全世界。电没出境,钱进来了。这件事为什么现在爆发了?因为 ai 的 用法变了。 以前大家用 ai 就是 聊聊天,一个人一天消耗几千个 token。 现在 open cloud 火了, agent 火了, ai 从一问一答变成了自己干活,一个 agent 执行一个任务,可能从消耗上亿个 token。 有 人算过,从聊天模式切换到任务模式,人均 token 消耗量翻了一百倍。一百倍的需求增长,谁的 token 最便宜,谁就吃到最大的市场。中国模型的价格是美国的几十分之一。直接接触了这波需求爆发。你可能会问,这跟我有什么关系? 如果你是做生意的, tokyo 出海告诉你一件很重要的事, ai 的 使用成本在快速下降。如果你今天觉得用 ai 太贵,可能半年后就便宜到你用得起了。因为中国的 ai 公司正在用低成本的电力和钻力把全球的 ai 价格打下来,你的竞争对手可能很快就会用上几乎免费的 ai 工具来降本增效。 如果你关心中国经济的大方向, token 出海可能是继中国制造之后下一个出口引擎。过去三十年,中国出口的是衣服、鞋子、手机、汽车。以后中国出口的可能就是 token, 用中国的电,中国的芯片,中国的大模型,生产全世界需要的 a f 五、 政府工作报告里写的算电协同智能经济新形态落到产业层面就是这件事儿。 minnes 的 创始人算过一笔账,海外用户为软件付费的意愿是中国用户的五倍,再乘以七的汇率,就等于三十五倍大的市场。 token 出海就是吃这个三十五倍市场。 之前我说 token 是 ai 时代的石油,现在可以加一句, token 出海就是把中国的电变成全世界的石油。我是文思,关注我,每天带你看懂 ai。

大家好,我是你们的科普达人,今天咱们来聊聊个人开发者怎么低成本入门 tocan 生产。很多朋友可能觉得 ai 模型部署门槛高,成本贵,其实只要配置得当,咱们普通人也能玩转。先说说硬件怎么选, 如果预算在一万五以内,想先试试水,那 rtx 四零九零 d 或者四零九零显卡是首选。二十四 gb 或十三 b 的 模型,搭配 i 五或 r 五的 cpu、 三十二 gb 内存, e t b 的 nvme 固态硬盘,再加上一千瓦的电源和一套散热好的机箱,总价大概一万一到一万六就能稳定运行。模型 托肯吞吐量能到每秒两百到五百个,日常测试和小流量使用完全够了。要是预算能到两到四万,想搞小批量生产,那就可以考虑上双卡四零九零 b, 或者直接上 a 一 零零,内存加到六十四 gb, 这样吞吐量能到每秒八百到两千个,接下小 b 客户的需求也没问题。硬件搞定了,软件和模型怎么选呢?模型方面,七 b 规模的 q 文二七 b instruct 或者 lama 三七 b 就 很适合入门,显存占用小,延迟低, 聊天、写文案、生成代码都在行。十三 b 的 模型像 q d r 杠一三 b instruct, 复杂推理和行业知识库的应用效果更好。这里有个小技巧,优先用 i n t 四量画板,显存占用能降百分之七十五, 速度还能提升两到三倍,效果几乎没损失,性价比超高。推理框架推荐 v l l m 开源免费,吞吐量比原声 pie torch 高十倍以上,个人开发者首选。部署工具方面, fast api 或 flask 用来封装 api 接口, prometheus 和 grafana 监控性能, e l k stack 记录日记这些都是免费又好用的工具。大家最关心的成本问题来了,按三年折旧算,入门级硬件每月折旧大概四百一十七元。电费方面,单卡四零九零币,满载运行 每月电费差不多一百九十四元,总成本约六百一十一元。按每天产出两千五百九十二万 token 算,单位 token 成本约零点零零零零二三六元,也就是二点三六分。每千 token 对 比 openai 的 gpt 三点五 turbo, 成本只有它的四分之一,价格优势很明显,想快速上手, 一天内就能跑通,先装 uber 二二点零四 lts 系统,然后安装 cuda 十二点一 cuda n, 再装 python 三点一零和 vl l m。 接着用命令启动模型服务, 最后用 qiro 测试一下生成 token, 看看返回结果里的 usage 词段,统计 token 数就搞定了。最后给大家几个进阶优化建议,用 v l l m 的 批量请求功能提升吞吐量,尝试模型蒸馏,降低显存占用和延,使用 radis 做请求队列应对高流量 在整个数据库记录用户 token 消耗,实现自动计费。这样一套下来,你的 token 生产系统就既高效又经济了。怎么样,是不是觉得个人搞 token 生产没那么难?你最想先用这个系统来生成什么内容呢?评论区告诉我吧!

大家好啊,华为最近有一个新的消息,你们可能都忽略了啊,这个消息其实是对于英伟达最新的一个东西的回应, 你们要看英伟达的前两天大家都知道啊,老黄在那台北说什么呢?说自己的机贵啊,开放给第三方了啊,包括 amd 的, 包括谷歌的这个芯片都可以塞上去啊。昨天我们也简单讲一讲,看好多人可能还没有关注我再重复一遍啊。老黄并不是针对国产卡的,首先他是特定的几种卡,其次你非英伟达的卡 接上去,你是享受到它内部的通讯加成的啊。你无法用光光缆,也无法用铜缆,你用什么?用以太网?用网线, 你要接这个东西要用网线,那你的计算是一百的话,你的数据传输只有十啊,只有十,那就变成一个拿小细溜水管往里边灌数据效率能高的好才怪呢啊。而且这个事还有一个最核心的问题,就是这个事情所引发的其实是一个流啊。但是这个事呢,华为云的给出了自己的答案,什么样 立体的这样的一个机房,什么意思?叫三 d 的 机房啊?他们单栋楼他干脆不是平面了,干脆给你一栋楼以单栋楼做超级点啊,以前的超级点要平面的很大嘛,我给他竖起来一栋楼做超级点,我可以塞进去十万张卡,这不是简单的一个翻倍,是直接把这个逻辑变了,对吧?他 这三 d 东西实际上就把 a、 d、 c 他 原来必须平面解决了啊,而且他把那个阿克拉斯九五零直接放进去,他现在芜湖的基地已经放了十万张的 升腾九五零啊,八千一百九十二张,一个节点通过全光互联领取的,然后它的 f 八算力的,这是一个节点啊,就干到了八亿 f o l o p s 啊,而且互联网带团十六 pb 每秒,相当于今天全球互联网的十倍峰值,十倍峰值 啊,所以这个东西对标英伟达这个二七年上市的 n l 五七六都一点都不差的,而且是指标非常有优势。 另外的话呢,就是现在咱们现在为什么做这东西?华为为什么做这东西?核心在哪?核心在于现在的电流量成一个指数倍上升,为什么要做楼? 因为平面的话你要拉更多的东西,对吧?你要做更多的这种延展性,但楼的话它可以做数值啊,这样的垂直甚至数据的区分都可以在这个把这整个楼看做一个大机房,看做一个大机柜,那这一块呢,可以动态的去分布,它的效率又进一步的提升, 就这样的东西的话,它可以把混合利用率从百分之三十啊提升到新的一个高度,再加上它的这个柔性计算的这个操作系统啊,叫什么? 叫 flex npu, 前两天我们讲过这个玩意,就是给这个算力做了一个操作系统,在不断地最小化地调度算力的底层,这是非常强的,非常牛的东西啊。所以这样的话呢,全部都混在一起的话,那它就可以你既有自己的,又有这超级点,然后通过这种楼的方式把它连起来啊, 所以建立一个整体的这个供电、制冷,包括效率这样的提升的一个整体架构,非常厉害,这个这个思路以前没有人敢,以前都是平面,但现在能不能立起来了,把它立起来了啊? 而且呢,它实际上呢是构建了一个非煤气的算力的终端形态,对吧?产业链的上游啊,光波块啊,液冷高压制热供电,实际上是一定的爆发这个区间,而且呢,它拥有十万张卡的一个无服务基地啊,将承载 接下来这华为云,它的 b 端通过企业的 agent 平台,是吧?它已经 art agent agent 这样的一个平台承载了一个平台和军人智能的这个工厂,他干这个的,那这个设计的话,就使得他对于整体的企业端的这个能力释放有一个非常踏实的基础,对不对?你像其他那几家互联网大厂,最多就是三万张卡, 华为直接给你整个十万张卡的,而且它的效率还能在自那个平面那搭这个卡技术上给你提升百分之三十,这已经非常恐怖的一件事情了,非常恐怖的一件事情啊,所以呢,比如说刚刚入驻的青岛港,他们的传播调度已经从三小时压缩到了五分钟,就利用整合这套系统是非常强的一件事啊。 所以呢, ai 技术设施呢,现在正从什么呀?正从数据中心变成 toc 生产的工厂啊,那么在这种情况下衡量的话就是美杜店生产多少个 toc? 华为云这个三 d 加高加超点加 flex npu 啊,这一个东西呢,是出于在今年 ai 的 这个深水区搭建一个算力租界非常强的东西, 所以如果想深刻的理解他,并找到真的深的趋势啊,找到新的这种趋势和新的可行的看到的潜在的水下的东西,找到你真正好的标的的话,哎,我建议你可以看看我们的 这个季度视频,对吧?我们的视频的话呢,一个季度九十天,我们给你四十五个会员视频啊,这个深度定制一个十几分钟解读一个科研现象啊。 我们再给你这个八场的专场的直播啊。而且这些东西的话,咱们以前定价六百多块钱,咱们现在四百多块钱,优惠一天给补贴,所以需要可以赶紧拿,下面就有链接。赶紧拿完了以后的话记得我们接朱耀老师的联系方式啊,接朱耀老师的电话。好,今天到这,我是小张,关注我,从投资的视角看科技背后的精彩,再见。拜拜。

token 工厂这项业务的全流程是什么?包括选 token、 选设备、建厂、开店和维护五个环节,两分钟讲清楚。一、选 token ai 使用的 token 和电力是不一样的,电力是标准的,谁生产的电都一样。 但是 token 由于是智力单位不同,大模型出来的 token 是 不一样的,有聪明一点的,弱一点的,有擅长编程的,比如 cloud code, 有 擅长做视频的,比如 view、 sora 和我们的 cds, 还有擅长软件工程的,比如 gm。 这里面闭源的模型像 gbt、 cloud、 gmail、 豆包、 mini max, 你 有 ai 服务器也没办法,你只能在服务器上面部署开源的 ai 大 模型,比如 kimi、 千问、 deepsea 和 glm 来生产 token, 至于选哪个,就要看生产销售的性价比了。 二、选设备。通常准备卖 token 这个生意都是看上我们的电力和工程师比较便宜,所以我们的 token 大 概是 美国 tok 的 五分之一到七分之一。而选择推理型的 ai 服务器或者说芯片,它的耗电量和维护量都更高,我们村的优势更大。而且推理服务器像五零九零芯片,它的产值也更有优势。这个在我之前的视频有说,后面也会单独出一期。 关于 tok 工厂的设备选择三、建厂选好模型和设备以后,就要选择一个 a、 i、 d、 c, 把我们的设备和模型部署进去, 基于稳定性的需求,现在 t 三级别以上的 a、 i、 d、 c 才能考虑。然后是选店和网络都便宜的地方,把 ai 服务器进行主网,然后安装大模型 进行统一调度,就可以不断地生产 token 出去了。四、运营销售有三种,一种是上架到 token 的 分发平台,像 openroot 直接在 openroot 上面开店就好了。 另一种是直接甩锅给云服务商,让云服务商去代卖,这种就需要缴纳高额的费用。还有就是自己去找,像高校影视动漫公司去分销。五、维护维保托肯工厂建好以后不是一劳永逸的,英伟达的 a f 武器的年维护量或者说故障率在百分之十五到百分之二十 是要维修或者说维护的。此外, tok 的 性价比也会动态变化,大厂们每个月都在 pk 谁家的模型号,也许这个月你卖 deep six 划算,下个月就是小米模型或者 g l m 了,大模型是需要动态调整的,如果对你有用,请点赞关注,我会持续更新,我们 tok 出海的过程也会提供相应的技术支持服务。

为什么说 token 会是 ai 时代的新货币?你应该听过黄仁勋那句话吧,未来数据中心不是算力中心,而是 token 工厂。当然听过,感觉这话有点颠覆认知啊,按他那意思,以后数据中心得靠生产 token 赚钱? 差不多是这个意思。你别忘了,现在这些数据中心天天在那吭哧吭哧跑模型算数据,电费成本老高了,就这么一直靠卖算力赚钱,早晚有一天得卷到死。 对哦,现在 ai 行业卷的不行,算力价格一降再降,好多做算力租赁的公司都快撑不住了。 所以黄仁勋才说得把数据中心变成 toc 工厂。说白了,就是让这些算力不光能算数据,还能直接生产价值载体,也就是 toc。 这样一来,数据中心就从单纯的体力劳动者变成了价值生产者。 那 toc 凭啥能当 ai 时代的新货币啊?你想想, ai 时代最值钱的是什么?不是算力,也不是数据,是 ai 生产出来的价值。 大模型生成的文案、图片、代码,这些都是价值,但这些东西没法直接流通啊。 token 就 不一样了,它能把这些 ai 生成的价值直接打包成可交易的数字资产。哦,我懂了,就像是给 ai 的 每一份劳动成果都盖上公章,让它能在数字世界里自由买卖。 没错,你再想想,现在咱们用 ai 是 不是得先花钱买算力?买 api, 以后说不定就不用了,你直接用 token 去换 ai 的 服务, ai 生成了一张图,你给他打赏几个 token, ai 帮你写了一段代码,你付几个 token 就 行。 那这样的话, token 不 就成了连接 ai 和人类的中间媒界了?对,而且这个媒界还自带信任属性。 token 是 基于区块链的,每一笔交易都能查到,谁也没法赖账。你想想,要是 ai 帮你做了个项目,你转头不认账了怎么办?有了 token 就 不一样了,交易记录明明白白写在链上,想赖都赖不掉。 那这么说,以后 ai 自己都能拿着 token 去买东西了?比如 ai 模型,自己去买算力,买数据, 这就是终极形态了。到那时候, ai 就 不是咱们的工具了,而是和咱们平等的参与者,他们能通过生产价值获得 token, 再用 token 去获取自己需要的资源,形成一个完整的生态闭环。听起来有点科幻啊,不过想想还挺合理的, 其实现在已经有苗头了,你看那些 ai 生成内容的平台,已经开始尝试用 token 来激励创作者和用户了,以后这种模式肯定会越来越普及。 那咱们普通人现在能做点啥?也不用急着下场,先把逻辑搞明白就行。搞清楚 tokens 在 ai 时代的作用,以后不管是投资还是参与,心里都有数。行,今天这干货够硬,咱们下次再接着聊。

磁源崛起,中国 toto 钓用量稳居全球第一。当前我国爱 toto 日钓用量已突破一百四十万亿,短短两年实现超千倍增长,成为全球最大的 toto 消费云涌市场。 在这一浪潮下,是产业逻辑发生根本性变化,数据中心不再只是数据存储工具,转而成为规模化生产 toto 的 智能工厂,形成成熟的商业化体系。高时效、高质量推理 toto 具备显著溢价空间。 二零三零年全球推理透肯规模将达到三千九百千万亿,较当前水平四年增长一百一十八倍。随着需求持续爆发,提供高质量透肯,拥有高效算力潜能的企业迎来广阔的增长空间。 不过需声明,本内容依据公开资料,仅做产业和公司的基本情况科普梳理,不构成任何投资建议。润泽科技是国内领先的传统算力与 ai 制算龙头,深度布局高密算力服务,全面支撑大模型训练与推理需求, 布局京津冀、长三角、大弯曲、成渝等六大核心智算集群,规划六十一栋智算中心,三十二万架机柜,目前已投产约七点六万架, 单机柜功率密度达四十千瓦,适配高工号 ai 场景,为豆包,部署超一千两百匹专属算力。廊坊智算中心承担 c 电子二点零超百分之六十推理任务, 与三大运营商签订十到十五年协议,是运营商云的算力服务的核心底座。二零二五年第三季度净利润为四十七亿,同比增长百分之两百一十。宏景科技是 ai 算力租赁加业冷技术龙头,聚焦偷啃经济核心需求, 资源相变,季末式液冷技术可支持六十到八十千瓦柜的高密度机柜部署,能耗较传统风冷节省百分之四十以上,大幅提升每瓦 tokyo 吞吐量。凭借领先的技术实力,深度绑定阿里、腾讯、字节等头部云厂商, 成为其 ai tokyo 服务的核心算力底座,稳定承接万亿级 tokyo 训练与推理需求,与正大集团联合打造五百兆瓦制算项目, 侵入东南亚及全球 toc 市场,开启算力服务出海。二零二五年算力合同二十七点五亿元,二零二六年国内累计合同预期四百五十亿,锁定未来三到五年 toc 收益,业绩增长确定性强。尤克的是全球 toc 生产与分发枢纽, 在 toc 经济国际化浪潮中占据核心卡位,布局全球二十二个地区、三十个可用区的数据中心。 国内自建乌兰察布、上海青浦两大制算集群,搭建高密制算中心,部署 a 七零零 h 二零零 b 二零零千卡级 g e p u 集群,可稳定支撑国产大模型万亿级韬塄训练与推理需求,算力规模与交付能力行业领先。依托自研孔明制算平台 amodeverse 模型 a p i 平台级全球算力调度系统,毛利率从二零二四年的百分之十点五八,大幅攀升至二零二五年 上半年的百分之二十四点九六。与智普 ai 达成五年二十亿元战略合作,提供五千加 g p u 机柜,深度支撑 g l m 五大模型迅推与 tok 出海,助力更多国产大模型实现 tok 价值全球变现。协创数据以算力加存储加边缘终端三位一体为核心布局, 实现从传统智能硬件 odm 向 ai 算力、基建、边缘计算领域的全面转型,深度契合偷啃经济全链路发展需求,自建共建北京、上海、深圳多个智算中心,部署 a 七零零、 h 二零零、 b 二零零千卡级际 peo 级群。 同时在全球布局时加算力节点广泛覆盖中国、东南亚、北美地区,构建起高效便捷的互联网,深度绑定字节、智普、 ai 等头部企业 提供千卡奇迹 pu 级群稳定支撑万亿级 tocan 推理服务。一托英伟达 drive 授权优势,为自动驾驶机器人厂商提供边缘算力, 实现 tocan 价值在端侧的落地,成为兼具技术实力与场景覆盖能力的核心服务商。以上是四家企业的基本情况梳理,不构成任何投资建议。如果觉得今天的内容对你有参考价值,欢迎点赞、关注、评论,咱们下期再见!


今天为什么要聊 a i d c 储能呢?因为这是一个从无到有增量爆炸的一个新风口啊。呃,我跟你们讲哈,很多人还停留在呃数据中心用 ups 这种老的这个认知里面, 现在呢,都是 ai 算力的,这种就是智算中心的啊,所以呢,他会催生一个全新的储能的这个赛道,就是从无到有啊,这个成为储能整个行业里面最核心的一个增量的这个市场。 呃,为什么说从无到有呢?哎,我因为大家不是搞这个 i i d c 的 哈,我和大家讲一下,以前呢的传统的 i d c 哈,就是数据中心它功率低,然后负荷本基本上用个备用的这个 ups 就 够了哈, 根本它就不需要什么大规模的这个储能。但现在的情况不一样, ai 大 模型的这个训练,还有智算中心,它的这个功率密度直接翻了五到十倍 啊,不说别的啊,当说当个机会吧,从呃几千瓦就一直飙升到几十甚至上百千瓦啊,对供电的这个可能性是是非常非常苛刻的,比如说你,你好 秒级的这种断电可能就让你啊几个星期的这个 a r 训练成果就白费了啊。 呃,还有一点非常关键啊,就是,呃以前它是没有 a i d c 储能的这个概念的,现在不是到处都在搞这个智创中心了吗?对吧?然后这个需求直接就从零到一,从一到一百啊。 大家说到储能,可能会觉得这个呃主要的这个这个呃场景在什么电网啊,然后在那些工商业啊,甚至在家庭里面啊, 当时 a i d c 的 这个产能,我告诉大家才是这种呃,最猛的新增的一个场景啊, 为什么呢?我们看看现在阿里云、腾讯云、华为云的这个智算中心哈储能的这个配套已经从可选变成了这个标配里面那些,呃,磷酸铁锂啊,高倍率的这种锂电液冷的这个储能,这种很多技术已经能够来适配了。 所以呢,呃,以后啊,可想而知,专门为 a i、 d c 场景定制的储能产品会越来越多,所以这个场景是刚出来没多久啊,所以未来的空间,呃,可想而知。

想知道 ai 时代的财富密码吗?它就藏在三毛钱一度电,怎么变成六十美元这个账里。这就是 tok, 中文名磁源经济的秘密。今天花两分钟把 tok 经济的四大环节给你讲透,怕找不到的先点赞收藏! token 经济分四大环节,生产、分发、结算、使用。搞懂他们,你就知道普通人怎么上车了。我们从第一层开始。第一层是生产层, token 的 不是凭空产生的,它需要三大基础设施做支撑,自算中心好比 token 的 生产厂房,提供海量算力, ai 芯片加服务器,如同 token 的 生产机器,负责快速生成数据和大模型,则是生产原料决定了 token 的 质量。 ai 芯片公司、服务器厂商、 ai dc 服务商等属于这一层。第二层呢,是分发层,生产出来的 token 如何送到用户手中, 这就需要分发层,它就像一个高速的传输网络,无论是阿里云、华为云这样的公有云大厂,还是专门的 token 分 发平台,都在确保 token 能更快、更稳定、更精准地到达企业和个人手中。 第三层是结算层, token 作为 ai 时代的新货币,必须有定价和交易规则,这就是结算层的作用,相当于 ai 时代的收银台。比如我们调用 api 按 token 收费,企业购买 ai 服务的订阅套餐,这些背后都有专门的计费系统在运作。拥有网络,蚂蚁集团就是这一层的典型代表。 第四层是应用层, token 只有被使用才有价值,这也是我们最熟悉的场景,从 ai 写作、 ai 客服,到我们常用的豆包、季梦、千问、元宝 app 以及各个领域的 ai 服务都属于应用层,是 token 价值的最终体现。 总的来说, token 经济的核心逻辑很简单, token 的 消耗量就是 ai 时代的 gdp, 用的越多,说明 ai 越普及,相关产业的前景就越广阔。当年淘宝刚出来,很多人看不懂,今天 token 经济就是当年的淘宝,普通人也能上车。想一起研究 token 经济的评论区扣六六六。

哈喽,我是欧阳,本期聊聊最近火热的题材,脱贫干货有点多,大家可以先点赞收藏再观看。从本质上来说啊,脱贫就等于算力加上电力。 算力就等于生产机器,包括 c p o p 四 b, 液冷服务器、存储芯片、光纤电缆等等。数据中心机柜的组建部分,也就是脱贫生产线。 电力就等于生产燃料,包含什么火电、水电、风电、光伏发电,什么垃圾燃烧发电等等,当然也应该包括输变电设备。 ai 算力是极度耗电的工业,算力越大,耗电越猛,产出的脱口越多。 家人们,我们国家有全球最丰富相对最便宜的电力,也有全球最庞大最完整的 ai 硬件制造体系。 中国电力加上中国算力,就可以生成最便宜的托肯,然后再迈向全世界。 你看,托肯出海,这就来了。回到正题啊,托肯应该怎么炒呢?我觉得可以分为三条主线啊,第一,算力设备造托肯的硬件设备,也就是数据中心组建部分。 第二是电力造托肯的燃料,最近电力涨得非常的猛啊。第三,数据中心,也就是托肯生产工厂,家人们看明白应该怎么炒了吗?点个关注加分享,干货不断,福利不停!

如果 ai 时代有一种新货币,你觉得会是什么?三月十六号这一天呢,东西方两个巨头同时盯上了同一个词。西边呢,英伟达 gtc 大 会,黄仁勋站台两个半小时,提出一个概念,叫 token 工厂。他说未来的数据中心呢,不再是存文件的地方,而是生产 token 的 工厂。那东边,阿里巴巴也发了一封内部信, ceo 呢, 吴永明亲自宣布成立了一个新的事业部,名字就叫做阿里巴巴 token。 他 们的任务只有三个,创造 token、 输送 token、 应用 token。 你 可能要问, token 是 什么?为什么两家公司同一天?哎,把它当成了战略核心。 token 这个词啊,听起来很技术,但说白了,它就是 ai 思考的最小单位。你问 ai 一 句话,这句话呢,会被拆成一个个小碎片喂给模型。那 ai 回答,你也是 抽出一堆的小碎片去拼成一个答案,每一次体温呢?每一次生成,本质上都是 token 的 消耗。那过去两年, ai 圈呢,讨论最多的是模型参数,算你规模。但现在风向变了。 黄仁勋在 g t c 上面算了一笔账, ai 从能理解、进化到能干活,哎,计算的需求增长了一百万倍。二零二七年前,这个市场啊,至少是一万亿美元。这一万亿啊,不是卖芯片的钱,是整条产业链的钱,而这条产业链的核心就是 token。 先看看英伟达在做什么?黄仁勋呢,提出了一个词,叫 token 工厂经济学,什么意思呢?他把数据中心呢比作工厂,电力是成本上限,那 token 呢,是产出品,同样的电 能产出多少 token, 直接决定你能赚多少钱。它公布了一个新指标,叫每瓦 token 数。那听起来技术啊,其实就是能耗产出比你的工厂的效率高不高?因为它下一代的架构 weber ruby, 能让一个一级瓦的数据中心呢? token 产出提升三百五十倍,这意味着什么呢?意味着同样的店收入能翻几百倍。那黄仁勋还在演讲里透露了一个细节啊,硅谷呢,现在招人,这份工作附带多少 token 额度? 已经要写进 offer 里了。未来每个工程师都需要年度的 token 预算,公司呢,要给相当于半个基础薪水的 token, 让他们获得十倍的生产力。英伟达在做的就是造印钞机哎,把 token 生产出来,然后卖给全世界,再看看阿里在做什么。吴永明的内部信里写了一段话,当下正处在 a g i 爆发的前夜, 大量数字化工作啊,将由数以百亿级的 ai agent 来支撑,而这些 ai agent 将由模型产生的 token 支撑运行,成为人类与数字世界交互的主要主体。这句话翻译一下就是啊,未来会有几百亿个 ai 替身替我们去干活, 他们呢,每干一件事都要消耗 token。 所以 啊,阿里成立了 token hop 事业群,核心就三件事啊,创造 token、 输送 token、 应用 token。 最值得关注的是一个新名字,叫 悟空事业部。这是阿里啊,第一次把 b 端的 ai 原生平台单独立出来,要把模型能力深度融入企业工作流。如果说英伟达呢,是造印钞机的,那阿里想干的事情更复杂,他既要自己发电,又要建电网,还要啊造各种的电器,让老百姓用上电。 这套打法呀,很像当年阿里云的路径,就是把算力变成水电煤。然后呢,让企业按需付费。把两件事啊放在一起看,你会发现一个有趣的对照,英伟达呢,站在产业链的最上游,定义 token 怎么生产?他 想让全球企业都用它的印钞机 in token。 那 阿里站在产业链的中下游第一, token 怎么流动?怎么用?他想啊,搭建一套发电、输电、用电的完整体系,一个呀,在造发电厂,一个呢,在建电网和电器。他们在同一天同时用 token 这根主线, 重新创起了自己的 ai 战略。这当然不是巧合啊,这说明 ai 产业正在发生一个关键转折,从模型的能力竞赛转向 toc 的 商业闭环。谁能让更多人更高频地消耗 toc, 谁就能掌握下一个时代的注闭权。那回到开头那个问题, 如果 ai 时代有一种新货币,它会是什么?三月十六号的这一天,东西方两个巨头给出了同一个答案。当然, toc 呢,能不能真的成为石油,还要看有没有足够多的应用去消耗它,有没有足够多的人需要它。 再有一点呢,可以确定,当阿里啊,把 token 写进组织结构,当英伟达呢,用 token 工厂重新定义数据中心这个词就不再只是一个技术概念,它正在成为 ai 时代的通用货币和一场新战争的起点。 科技衍生,冒的是思想焰火。

每一次工业革命,都有一样东西在背后疯狂燃烧。第一次工业革命,蒸汽机来了。蒸汽机本身不值钱, 值钱的是让它跑起来的东西。煤。煤从地里挖出来烧掉,变成蒸汽,蒸汽推动机器、机器生产商品。整个英国的矿山、铁路、钢铁厂,全都围绕着怎么挖更多的煤,怎么运更多的煤来建立起来。煤就是那个时代的核心消耗品。 第二次工业革命,电来了,电本身也看不见摸不着,但他改变了一切。爱迪生建发电厂,特斯拉搞交流电,全世界开始拉电网、发电、输电、配电、用电,一条完整的产业链,养活了成千上亿的人, 创造了通用电器这种巨无霸公司。电就是那个时代的核心消耗品。第三次石油、内燃机、汽车、飞机、塑料化工。整个二十世纪,全球经济都建立在石油上,围绕着石油打了多少仗?中东为什么重要?因为那里有油,石油就是那个时代的核心消耗品。 现在 ai 时代来了,它的核心消耗品是什么呢? token, 你 可能听过这个词,但不太理解。简单说, token 就是 ai 处理信息的最小单位。 你跟 ai 说一句话, ai 会把你的话拆成一个一个的 token, 然后逐个处理,逐个生成回答。每一次你问 ai 一个问题,每一次 ai 给你写一段文字,画一张画,生成一段代码,背后都在消耗 token。 一个中文字大约是一到两个 toc, 你 让 ai 写一篇一千字的文章,大概就是消耗了两千个 toc, 听起来不多,对吧?赶紧把这个数字乘以全球的用户量, chat gpt 每周九亿活跃用户,豆包 kimi 千万, 中国五点一五亿生成式 ai 用户,每个人每天跟 ai 对 话好几轮,每一轮都在烧 toc。 再加上企业端自动驾驶的 ai, 每秒处理海量的传感器数据,全是 token。 金融公司的 ai 交易系统,每毫秒做一次决策也全是 token, ai 写代码, ai 做客服, ai 审核合同, ai 看片子,全都是 token。 英伟达为什么一年赚两千一百多亿美金?因为生成 token 需要 gpu, gpu 就是 token 的 发电机。英伟达卖的每一块芯片,最终都是在帮客户生产更多的 token。 openai 为什么要花六千亿美元建数据中心?因为数据中心就是 token 的 发电厂。越多的人用 ai, 就 需要越多的数据中心,就需要越多的电力,就需要越多的芯片。 google 为什么要签一百五十兆瓦的地热能协议?因为 ai 的 数据中心太吃电了,生产 token 这件事,最终还是要烧真实的能源。所以 token 这条产业链从上到下是这样的, 最底层是能源发电厂,电网、地热核能给数据中心供电。往上一层是芯片,英伟达、 amd 含五 g 造生产 token 的 发动机。 再往上是云计算,亚马逊、微软、阿里云建 token 工厂,把算力租给别人。再往上是大冒险公司 open ai、 ospec、 deepsea、 月之暗面,它们把芯片和算力变成可以使用的 ai 服务。 最上面是应用层, chat、 gbt、 豆包 kimi 各种 ai 工具,它们是 token 加油站,每个用户来一次就烧一次。煤的时代,谁控制了煤矿,谁就是亡。石油时代,谁控制了油田,谁就是亡。电力时代,谁建了发电厂,谁就是亡。 token 时代,谁能更便宜、更高效的生产和分发 token, 谁就是王。这就是为什么英伟达市值全球第一,所有的科技巨头疯了一样的砸七千亿建数据中心。这就是为什么 deepsea 一 出来,全世界都撼动,因为它证明了用更少的算力能生产同样质量的 token, 等于用更少的煤烧出了同样多的蒸汽。但 token 跟煤石油炼里有一个根本区别,就是 煤你能看得见,能称重,一吨多少钱清清楚楚,石油你能闻到?一桶多少美元,全球统一报价。 电你虽然看不见,但电表会转,每个月你都会收到电费单 token 你 看不见,摸不着,闻不到。你跟 ai 聊天的时候,他不知不觉的会在消耗这个东西。每一次对话,每一次生成,背后都有真实的芯片在运转, 真正的电力在燃烧,真实的成本在产生。 openai 去年收入一百三十一亿美元,亏了八十亿。收入从哪儿来?卖 token 亏的钱花在哪了?生产 token 按 so pick 给 cloud 的 定价,按输入 token 和输出 token 分 别收费。 google 的 gmail 三点一 pro, 两百 k 以下的 token 一个价,两百 k 以上的 token 另外一个价。整个 ai 行业的商业模式底层逻辑就是一句话,生产 token, 卖 token。 未来十年, token 的 价格会像电价一样成为一个关键的经济指标。哪个国家的 token 成本更便宜,哪个国家的 ai 产业就更有竞争力。中国为什么拼命搞国产芯片?因为用英伟达的芯片生产 token 太贵了,还随时可能被卡脖子。 deepstack 为什么重要?因为它把每个 token 的 生产成本打了下来。当年煤价涨价,工厂就停工。油价涨了,航空公司就亏钱,电价涨了,铝厂就关门。未来, token 成本涨了, ai 应用就用不起。 token 成本降了, ai 就 能渗透到更多应用场景,替代更多人力,创造更多价值。 我是文思,你每天用 ai 的 时候,可能从来没有想过这些,但从今天开始,你可以换一个视角看 ai。 你 用的每一个 ai 工具,背后都连着一条从能源到芯片到数据中心到大模型的完整产业链。你敲下的每一个字, ai 回复你的每一句话,都在消耗一种你看不见的资源,这种资源就是 token, 它是 ai 时代的煤, ai 时代的石油, ai 时代的电,只不过这一次烧的东西,你看不见。觉得涨知识了,可以转发给你的朋友看看。关注我,每天带你看懂 ai!

哈喽,大家好,最近如果你关注 ai 圈,应该被一个词刷屏了,就是 token。 就 在上周英伟达 gtc 大 会上,黄仁勋两个小时的演讲,从头到尾贯彻的核心关键词就是 token。 他 提出了一个概念,叫做 token。 工厂经济学。 未来的数据中心不再是存储数据的机房,而是生产 token 的 工厂。他甚至预测,未来老板不仅每个月会给你发钱,还会给你发 token。 几乎同一时间,阿里巴巴直接成立了一个新的事业群,叫做 cocoon 事业群,有 ceo 亲自挂帅。这个事业群的目标只有九个字,创造投肯、输出通肯、应用投肯。 因为他和阿里一个在台上,一个在幕后,同时盯着一个东西投肯,然后他就火了。那投肯到底是什么?你可能会在各个地方看到过这个词,但未必真正理解它,今天咱们就把它讲透。投肯的定义是大步行处理语言的最小单位,你可以把它理解为语言世界的跨客。 我们都知道跨课,跨课是物理世界的最小单位,而 token 是 语言世界的最小积木。再拆,意思就变了或者没了,所以它是不可再拆分的了。 那么不同的语言环境, token 的 划分是不太一样的。在咱们中文环境下面,通常一个汉字就是一个 token, 智能就是两个 token。 我 喜欢你四个 token。 为什么汉字是一个字就是一个 token 呢?因为我们的汉字,每一个字基本上都能独立表意。而在英文的环境下面则不是这样的。英文的环境下面,它不是按照单词来拆的,而是按照有意义的最小片段来拆分的, 那比如说 happy, 它是一个 token, 而 unhappy 是 两个 token, 为什么呢?因为 on 代表福相, happy 代表开心,两个词都是有着不同的含义的,所以 unhappy 一个词,它会有两个 token, teacher 也是类似的。 为什么 token 这么重要呢?原因在于你所有输入的文字,大模型都要先拆成 token, 然后才能计算,所有它输出的内容也都是一个 token, 一个 token 拼出来的。 这里有一个关键点啊, token 的 数量直接决定了你的使用成本,几乎所有大模型都是按照 token 计费的, 你输入需要花钱,模型的输出也要花钱。这就是为什么厂商们这么看重 token, 因为它不仅是一个技术概念,更是商业化的核心计量单位。另外还有一个我们所需要知道的常识啊,所有大模型都有 token 的 长度限制, 比如说四 k、 八 k、 三十二 k, 一 百二十八 k 等等。大模型的 token 长度限制越来越长,这直接的关系到了什么呢?关系到了大模型每一次对话,我们可以输入多长的内容,大模型的记忆能力,大模型的产品体验和它的计费方式。所以你看 token 这小小的积木,既是语言世界的基础,也是 ai 商业化的度量衡,更是产品设 计的边界。理解了 token, 你 才真正走进了大模型的世界。聊到这,我们就基本讲完了 token, token 既然是大模型处理语言 的最小单位,所有的文字都会被拆成 token 再进行计算。但如果 token 是 个多义词,该怎么办呢?下一期我们聊一下,如果 token 是 个多义词大模型,怎么理解呢?记得点赞关注,不要错过哦!

大家好,今天我们用三分钟讲透 ai 产业底层商业逻辑。黄仁勋提出的 token 工厂经济学,首先明确核心概念。这里的 token 中文意思叫磁源,和虚拟货币、区块链没有任何关系,它是 ai 大 模型处理信息的最小数据单元,是 ai 时代的标准化产品。 黄仁勋这套理论的核心,就是把 ai 算力变成了一套标准化、可量化、可盈利的制造业体系,它彻底重构了数据中心的价值。 传统数据中心是存文件的仓库,而 ai 时代的数据中心就是一座二十四小时不间断生产 token 的 智能工厂。这座工厂的完整逻辑非常清晰, 电力是生产原料, ai 芯片与算力集群是生产核心的硬件底座, ai 服务器、高速光互联、液冷散热、高端 pcb 是 核心生产设备,最终产出的产品就是 ai token。 而整个工厂的核心 kpi 也是核心盈利密码就是 token w, 也就是每瓦电力能产出的 token 数量。核心目标就是在固定电力上限下最大化 token 产出,最小化单位 token 成本。为什么这个指标是行业黄金标准?因为黄仁勋点破了 ai 产业的物理铁律, 是 token 工厂不可突破的天花板。一个数据中心的供电总量是锁死的,单纯堆显卡、堆积柜没有长期意义。未来 ai 算率的竞争,本质就是效率的竞争。同等电力下, token w 越高,生产效率越高,单位成本越低,盈利能力就越强。这套经济学彻底改写了算力行业的游戏规则, 全产业链的价值平台都围绕能不能提升 token w 展开,而算力租赁就是 token 工厂产能的商业化分销出口。在这套思维下,行业竞争的核心早已不是单一芯片的比拼, 而是算力集群整体系统能力的提升。在这一赛道中国具备全球领先的核心竞争优势。首先是无可替代的电力成本优势。 剔除西部丰富的绿电资源与东数西算工程的全国算力网络布局,我们拥有全球极具竞争力的低电价,直接击穿 tiktok 工厂的核心成本线,从根源上拉高磁源瓦的核心效率。其次是全链条自主可控的配套优势,我们拥有光互联、 pcb、 叶冷等 tiktok 工厂全环节的全球核心产能, 供应链稳定性与成本优势独步全球。更关键的是全球顶尖的系统级优化能力,以华为 atlus 九百五十算力集群为典型代表,通过算力调度、网络协调、能效管理的全占优化,实现了万卡集群百分之九十以上的限行加速比, 把算力损耗降到最低,直接将磁源瓦效率拉至全球第一梯队。这些从能源底座、硬件配套到系统优化的全闭环优势,让中国在全球 toc 工厂的竞争中掌握了核心的效率话语权。 也正是基于这套核心逻辑,我们准备了三期系列节目,带大家完整梳理 tiktok 工厂的全产业链机会。第一期聚焦 tiktok 工厂的传输神经网络光互联赛道。第二期拆解工厂的硬件载体 与散热心脏, pcb 与夜冷赛道。第三期落到产能变现中局算力租赁赛道筛选同步高成长标地。感谢收听我们系列节目,再见!