最近 talk 这个词燃爆了 ai 和投资圈,那么这些内容就让一口气搞懂关于 talk 的 几个问题啊。 talk 凭啥是中国真正的电力出口呢?这条万亿产业上有哪些核心公司,以后别人再问你 talk 是 啥,你分分钟钟就能给它讲明白。 咱们直接开始整活。我们先聊第一个问题啊, talk 为啥是中国电力的出口?二零二五年,中国的发电量超九万亿度,那么美国加欧盟加印度加起来都没有咱多。那么全球每三度电就一度电,是中国发的 电太多了,也用不完了。那么西电东输后,还有大量的赋余存又存不住,那么只能弃风气光。有人问,咋不卖电给国外呢?电没法装船呢,就像手里有矿啊,当太重搬不出去,直到 togg 出现,富裕的电有了新的出路,变成算力,再封装成 togg, 卖到全世界。 togan 到底是个啥呢?今年两会,官方给了中文的名字叫做词源,它是 ai 大 模型能识别的最小的信息颗粒。举个例子啊,你让 deepsea 写一个麻婆豆腐的教程,他不会一下子读懂整句话,而是先把指令呢拆成一个个最小的语义 togan。 比如说写一篇麻婆豆腐制作教程, 然后去自助库里解锁豆腐焯水,豆瓣酱炒出红油,勾芡收汁。这些 togan 每次解锁匹配都在消耗 togan, 最后再组合成完整的教程。那么这篇教程拆出来,大概有四百个羽翼的 talk, 你 这个操作呢,就消耗了四百个,那么这背后调用的全是 gpu 芯片,服务器集群,而驱动这一切的是电力, 所以 togelink 就是 电力的数字压缩包,西北绿电经过 gpu 提炼成高价值的产品。搞懂了 togelink 是 啥,再看中国的 togelink 在 全世界是啥水平?今年二月啊,全球前十大模型总 togelink 销量二十八点七万亿,中国模型贡献了十四点六九万亿, 占比百分之五十一点二,首次超越了美国。而且这波调用里的百分之四十七的用户来自美国,这是全世界开发者在用脚投票的结果。 为啥?性价比啊?德国工业电价近两元每度,那么中国西北算力中心专用电价最低能压到零点一毛五每度,不到人家的五分之一。所以 deepsea v 三每百万的 top 输出价 只要一元,比硅谷大厂便宜十倍以上。结果呢, mini max kimi、 智普 g l m deepsea 占了全球周度 top 钓用量的前五席中的四席,试战率呢,一度高达百分之六十一。黄立新说过啊, ai agent 的 时代呢,任务消耗的 togg 量会是现在的十到五十倍,那么机构预测到,二零三零年,中国的 ai 推理 togg 消耗量要长 近三百七十倍。那么接下来大家最关心的是, togg 和电力出口到底啥关系呢?过去啊,咱们出口衣服、家电、电动车都逃不过官税和码头,但是 togg 是 走官心啊, wto 规则下,电子传输免征官税的 a p i 数据瞬间穿越了海底观澜到宁夏内蒙的算力中心。 g p u 消耗着中国的最便宜的绿电。推理完一秒送回旧金山的屏幕,全程一滴油都没动,一根电缆也没有出镜。但是电力的价值通过 tucker 完成了跨境的交付,这就是电力 换皮出海。那 tucker 这条产业链怎么赚钱呢?逻辑很清晰,海外调用需求增加,那么模型厂商赚钱,然后扩建算力设施,推动芯片服务器 i d c 需求,最终消耗更多的电力 整体变现。产业链分为四层,前端 a p i 直接收费,模型厂商靠低成本推理服务赚调用费,那么 ai 聚合平台抽佣金,上游的硬件芯片服务器需求爆棚,行业有望量价齐升。而中游的云厂商和数据中心靠出租 gpu 机柜 以及配套的电力盈利。最底层是电力供应和智能调度,西部绿电是核心之称,算电携同的智能调度是关键。那么这条产业链上的核心公司有哪些呢?产业链啊,一共有六大环,结合行公司梳理如下啊, 模型环节,核心公司有智普 ai、 月智、暗面、深度求索、 mini max。 算力服务和 it 系环节有红警科技、数据港论责科技、四 g 复联。那么国产算力的硬件的环节有海光信息、 韩五 g 以及华为深等产业链的太家股份、华丰科技。电力能源环节有内蒙华电、禁控电力、精能能源。算电协同环节有南网科技、国能日行。那么电网设备的环节有特别电工、 中国西电、徐集电力配套有生幸福、安恒信息、网速科技。一句话,整个产业链的核心逻辑,前端模型厂商赚不赚钱,取决于后端的算力和电力成本的控制能力。 那么中国的最大的底牌是低价的电力和高效的算力技术设施。那么如今啊,中国正推动电力和算力的深度融合,在全球的 ai 服务贸易领域呢,实现了换道的超车,让西北的绿电变成 talk 出海正外汇。 那些曾经被白白气掉的西北绿电,如今摇身变成了 talk, 重新释放出价值投资。投什么呢?投的就是这些日常里正在发生的改变。 ai 拼到底还是算力,而算力的根基就是电。
粉丝37.8万获赞10.4万

oppo 可浪呢,是我目前用过最强大的软件和工具,但它的 togg 消耗量也确实让很多人望而却步,甚至呢,因为高额成本不敢完全释放它的潜力。 今天呢,我就教大家四种方法,在性能完全不打折的情况,就是前提下把成本降到最低,实现 top。 四。在讲方法之前呢,我们要先弄明白 top 到底花在哪。 其实呢,你每问 ai 一个问题,发过去的就是并不是一句话,而是一个巨大的工作包,它包含五部分, 一、系统规则,他是谁,能干啥。二、工作去文件, a 阵 g 文件等等。三、对话历史会形成滚雪球效应,越聊越贵。四、工具的输出,抓取的网页,论文日制等等。 最后才是你当时的问题。这个呢,就像你雇了一个员工,然后每次想让他工作,你都得把员工手册,公司章程,岗位职责先从头到尾的就是跟他说一遍,然后再问他今天你中午吃了什么,你说这能不会吗?对吧? 那如何节省掏根呢?就是我们今天要告诉他步骤,而不是问题。第一种方法, qm, 传统情况呢,就是把整个资料像填鸭一样,整天给报大模型,就会呢导致输入 token 的 爆炸。 qmd 的 逻辑呢,就是在本地把 make down 数据库建立,所以你问问题的时候,它只提取最相关的几个片段和摘录给部分框,也就是模型,不再读全库,只读需要的部分,那它是如何工作?所以库是如何建立的呢? 第一个是 update, 所以 文件刷新。第二个呢,是向量的更新,以及向量的投,就是投射。重点呢是这两件事全是在本地跑,不消耗云端的投币,也就是说 qmd 把云端投币用来读所有文件和信息的成本都转化为了本地所有的成本。 那如何安装 qm 币呢?你可以让你的 opencloud 帮你安装,或者呢你想就是手动的安装,那么也只有这三步。首先呢就是运行这些命令到我们终端里安装 qm 币,之后呢,我们去到 opencloud 点 json 文件, 确保我们的 memory 是 这样的,然后呢我们就重启网关,这样呢就结束了。还有一点呢,值得一提的就是 qm d 还允许你精确的去控制你的预算,通过三个参数来实现,还是在我们的 open file 边最顺,这个文件形式就是里面 可以看到厘米的,下面呢有三个参数, max result 是 最多可以注入几段, max snivetime charts 是 每段允许多长,而 max injector charts 是 每轮总注入最多允许多长,也就是总的预算阀门。 接下来呢,我们来看第二种方法,就是用本地模型跑心跳,心跳呢就是 open clock 定时的唤醒行为,他呢按照你配置的频率把 a 阵的叫醒一次,让他呢执行一段心跳清单,他的屁的心跳本身就是走一次完整的 a 阵的回合, 他呢可以当监工,比方说你给我们可到一个特别长期的任务,他做就是承诺做完之后可能做一步就不会往下推进了,这个时候呢,我们就可以使用心跳, 定期的呢,每三十分钟的去刺激一下,触发一下我们 a 阵,疼,让他呢没有完成任务之前不准停下来。 这样呢我就保证了我们整个这阵的 open cloud, 我 们 ai 助手有一次性能确保完成我们的长期任务。那为什么心跳呢?会花费很多的 token 呢?因为每次心跳的输入通常都会包含系统提示词, worker space 文件的输入,尤其是 memory 点 md 和 agent 点 md 可能会变得很大,还有可能的对话历史。还有呢,就是 hadbeat 心跳本轮的提示词或清单,所以它的输出可能会很短,可能就是 ok 没有问题,但是输入可能会很大很长。 那如何减小心跳的成本呢?除了增大时间间隔这种常规的方法外呢,最根本还是直接让本地的大模型,小的大模型来跑心跳这种低智商的任务。 心跳呢,只用来触发,不用来执行任何任务。如果用本地的模型呢,大家需要下载一个欧莱吗? 然后呢,根据你电脑内存的配置来选择相对比较好的模型,比方这里的千万的各个参数的模型。然后呢,大家可以去告诉 openclock 心跳呢,触发任务 用本地小模型来做。然后呢,第三种方法,也就是最简单一种方法,就是尽量用订阅,而不是 api 用量。值得注意的呢,是很多的厂商是不支持这么做的,比方说安卓配,比方说谷歌, 他们的订阅呢,是严禁禁止使用到 open klo 的, 避免的,但是 open ai 目前他们是收购了 open klo 的, 所以呢,他们还是开放状的这个状态。如果呢,想要极致的稳定 走 api 用量而不走订阅,这个时候呢,你要注意了,如果你用最新的模型,不论是 azure 还是 open ai 的 模型,你的账单可能会成倍的增长。 最后呢,第四种方法,直接呢给你的 overclock 发指令,让他呢给你生成一个成本的体检报告,不用固定形式, 让他给你一份靠谱起的消耗驱动清单,可以是百分比的形式,看看到底哪项任务呢,最烧钱,最高的消耗来自于哪里找到不合理的地方。因为你刚开始利用 overclock, 总是会有很多不合理的地方, 比如说一个简单的轻任务,却携带了巨就是巨大的上下文。其实呢,有很多不合理的地方是可以被优化, 而高消耗其实不一定是必要的成本,很多很可能是那种就是流程和配置的浪费,我们呢是要根据我们自己的用处和任务来杜绝掉,那发现问题呢?如何优化呢?这里可以分为流程和模型两个方面考虑, 流程方面呢,能不能有一些轮询的任务改成就是事件触发符不符合条件。然后呢就是我们刚才讲的 gdp, 也是一个非常好的减少上下工序, 就是注入的一个方法。第二点呢就是从模型方面,有一些轻任,我们能用更便宜的模型或者小模型来替代,就像我们刚才说过的,用本地模型来做心跳也是一个非常好的方法。 最后呢就是由 openkey 给出的任务清单,和他讨论有哪些任务可以就是优化来减少成本。最后呢我们总结一下 大幅减少就是成本的四种方法,分别呢是使用 g m d 大 幅减少上下文的注入,心跳呢用本地的模型。第三个呢就是尽量用订阅,而不是走 a g i 消耗。第四个呢就是跟你自己的 openkey, 让他列出所有的就是 消耗投款的任务,由大到小。然后呢,跟他讨论优化的可能性以及如何优化,按照这个方案,保证你的欧文克劳既聪明又省钱。如果呢,你的理论别忘了点赞关注,我们下期再见。

推理芯片呢?我觉得未来的几个应用场景的的确确是跟原来会有所不同。 a 股啊,对于这个应用场景的理解,其实大家会发现东西很多,预计五花八门啊。比方说像一月份的这个 ai 中的营销叫 g e o, 然后到后面的 mas, 然后大家再去看各种各样的 ag 城, 再到最近比较火的这个小龙虾,那我想这个龙虾可能是一个爆款前夜 就是我认为这个场景,其实目前看下来,就你前面所说的很多场景最终是靠它来突破,因为它涉及的领域太多了,每个行业其实它都能涉足 你 ag, 它越爆发,那倒推它的整个 talk 的 这种逻辑就会很顺。但是问题就又来了,如果说啊 talk 里面有一个绕不开的东西,那又回到了点, 所以大家又看到算电协同,包括原来的西电东输,那我想这些很多的政策端其实已经帮你放在那边了,所以我想托肯围绕的这个绕不开的方向,那电依然是绕不开。所以你去看这一次,如果一旦市场见底的话,那智能电网这一端 肯定是有机构会配的,而且这个定价权关键是在我们中国自己手上。所以我觉得一个是智能电网打跌完之后,大家可以去看。第二个呢,就是找应用场景的爆款,我不是去直接找那个应用端,其实你会发现应用端基本都是昙花一现,现在没有能够超过两周以上的, 所以我觉得就是 c d n 云服务、云计算那些可能也会穿插。第三个呢,就是如果真的那个爆款出现了,对应的那个上市公司,或者说那个题材方向,那可能就会股价产生比较大的一个 变量。现在就是大家会发现小龙虾其实是监管的制度跟不上啊,太快。所以安全补丁啊,各种漏洞的补丁其实也在迭代, 就是我觉得等这个体系全部至少大家都能接受的那个度的时候,可能我觉得真正是应用端的这个爆款级产品出现,所以在国民级应用的这些产品没有出现之前,那我觉得还是会围到托克国产算力啊,然后就是云,然后就是电,围绕这三个方向。

啊?啥呀?说实话,现在所有人的眼睛都专注于战某征上面去了,但是说实话,他不管这种局部的怎么打啊,咱 ai 产业该发展还是发展的,就比如说最近的 top 肯, 你要知道为什么美子那边不天天讲 top 肯,因为我们这边 ai 时代的优势是 电力非常的便宜啊,他们那边可能是算力非常的给劲,那我们电力便宜代表我们的 tucker 就 便宜,我们这边非常着急的把 tucker 命名为词源就说明问题了。再然后是前段时间有消息称 tucker 的 啊,日军调研量暴增 百分之十万,百分之十万,你说现在有哪个行业还能对某样东西的一个需求量能暴增百分之十万呢?没有了,基本上都是红海存量竞争,但是滔凯这个东西他是蓝海,那 可以预示的到这一部分的这个肉啊,非常的肥,非常的多。 ipc 所跑的那平台不再是英伟达了,而是咱们菊花的芯片。 那三月底的时候,腾讯阿里字节啊,也是定了一堆菊花的芯片,可以预示的到我们这边啊,芯片更便宜,然后对于芯片的使用效率也非常的高, 再加上电力便宜,那我们这个掏坑的成本会非常的低,那这个利润会非常的有想象力, 届时我觉得啊,今年下半年会有很多的云服务厂商啊,这个业绩爆炸,业绩暴增的啊。所以说不要只关注于这个战争什么的,抛看对于我们中国 ai 时代代表着什么好玩。

普通人怎么参与托肯工厂业务?首先给虽然普通但有着实远见的你点赞!托肯业务将会重构我们未来的算力, ai 和能源的计价方式和结构,在某种程度上甚至直接和我们企业的竞争力挂钩, 那么普通人就意味着无法大量投资进行建厂,甚至可能没有全职的时间去参与这项业务,不能去代理托管的销售或者搬运便宜的托管 a p i 去海外销售。那么我给你四条建议,千万不要去找不靠谱的算力设备托管投资,投个五万十万。有很多小伙伴告诉我,他们遇到了杀猪盘, 尤其是那些深层能在一到两年回本的,没有那么多天上掉馅饼的事情。如果你是云服务、算力或者 it 相关行业的人,那么快速调整到偷恒工厂这个赛道,这个赛道的发展速度会很快,尤其是现在 ai 建设的景气度和缺货程度之高,是我没有遇到过的, 你需要提前在技术和岗位上进行调整,等待机遇。三、如果你是非技术人员,那么你可以选择电商或者分发平台进行拓展的销售,但这个和卖房子不一样,它有学习门槛,但我认为在 ai 工具的前提下,一般人可以学得懂,搞得定, 并不是学大模型算法那样高不可攀。四、如果你不想投建,也不想学技术,甚至不想销售,那么你就把投肯融入你的工作中,能用 ai 写代码、做 ppt、 做图、做视频的,就不要自己在做,你在用豆包的时候,其实是在免费用别人给你的投肯,这也是一种普通人参与投肯的方式。

上一集讲到 token 背后的逻辑,今年两会官方已经给 token 定下了中文标准一名词源,他是 ai 大 模型,对自然语言、代码、图像、语音等各类信息进行拆解、理解、运算,还有生成的基本语义单位。设大模型能识别的最小信息颗粒, 就像用电按度计量,打电话按分钟计量。使用 ai 大 模型写代码、生图、写文案、做问答的所有操作, 全都是按 token 计量消耗的。举个例子,当你下一个指令给豆包写一篇回锅肉的制作教程,豆包并不会直接读懂整句话的完整意思, 而是会先把这句指令拆解成一个个独立而能被模型识别的最小语义 token。 比如写一篇回锅肉的制作教程,这些是豆包能接收处理的基础信息颗粒,这是大模型处理所有指令的第一步, 也是 token 发挥作用的起点。下一期我将更清晰的解读分享给大家,有明白 token 的 朋友可以在评论区留言。

你发现没有,现在你每问 ai 一 句话,每生成一张图,背后都在烧一种东西, token, 它就像 ai 时代的石油、电力和硬通货,谁掌握了它,谁就掌握了财富密码。 今天咱们就用大白话把这条万亿产业链彻底讲透,谁吃肉谁喝汤,一眼就能看清那 token 到底是啥。 简单说, token 就是 ai 处理信息的最小单位,你用它,它就烧钱。举个例子你就明白了,你让豆包写一篇一千字的工作报告,大概要消耗八百到一千两百个 token。 你 用 t p t 生成一张高清海报,一次就烧掉三千多个 token。 越复杂的任务,烧的越猛。而且有个特别反常识的现象,费用越便宜,大家用的越疯狂, ai 推理成本降了二点四倍,这就好比油价降了,开车的人更多,总的油钱反而暴涨一样的道理。 在 token 经济时代,有五个环节会赚翻天。第一个算力基建,它就是炼油厂英伟达,靠 gpu 已经赚麻了,数据中心营收同比暴涨百分之一百四十三,一台高端 ai 服务器,售价超过两百万,照样被疯抢。国内华为升腾含五 g 也在紧急追赶, 成了国产 ai 的 定心丸。第二个智算中心加 ai 云,它就是发电厂。中国 ai 云市场年增速高达百分之七十二。 二零二六年, ai 加速芯片的市场规模直奔三千八百一十三点九亿, ai 服务器销量暴涨百分之五十六。举个例子,长三角有一个置换中心,一天跑满算力,光靠 token 相关的营收就超过百万。第三个 mas 模型服,它就是加工厂, 像阿里云的通一千问字节的豆包,把大模型打包成 a p i, 按 token 收费。比如一家电商公司用 ai 写文案,每月的 token 费用从五千元涨到了三万,业务越做越大,烧钱也越来越猛。第四个, ai 应用和智能体, 这就是消费端聊天、机器人、编程助手,全是 token 的 吞金兽。比如最近爆火的 ai 工具 openclaw, 一 夜之间火遍全网,当日 token 消耗量破一级,直接把传统办公软件按在地上摩擦。 第五个对咱们个人职业的影响, ai 在 催生新岗位,也在淘汰旧岗位。 ai 训练师月薪一点五万到三万,需求暴涨超过百分之一百。 但基础客服、简单文员这类岗位需求大跌百分之十五。就业市场正在两级分化。更可怕的是幽灵 gdp 公司产值在涨,员工工资却不涨,钱全流向了科技巨头。国产大模型正在用超高性价比抢占全球市场。 给你看个对比,国产模型 mini x m 二点五跑一次,标准测试成本只要一百二十五美元,而国外的 cloud office 要四千九百七十美元, gpt 五点二也要三千两百四十四美元,性价比高得离谱。 靠着这个优势,国产模型在全球平台的前十名里占了半壁江山。国内现在是两强争霸,阿里从芯片、模型 moses 到企业应用,全占闭环,像个 ai 界全能王。 字节靠着抖音加豆包加火山引擎,疯狂砸钱抢市场,增速一蹶绝尘。腾讯、百度、华为也在后面紧紧跟着。 以前云厂商都在卷低价利润薄的巷子,现在呢?集体涨价拿回定价权。二零二六年初, a w s 的 机器学习服务涨价百分之十五, 谷歌云、国内的网速科技 ucloud 全跟着涨。摩根斯坦利算过一笔账,每涨价百分之十,阿里云的利润就能直接提升四个百分点。美国卡,咱们的芯片脖子,中国就全力搞国产替代。 算力已经变成了新时代的战略物资。未来就看三件事,降成本、整合、全站抢定价权。那这对于咱们普通人意味着什么? 很简单,拥抱变化,提升技能,高技能岗位的工作正在消失,搞懂托肯经济 就是高洞 ai 时代的财富密码,这不仅是技术革命,更是一场财富重新分配的历史机遇。你是想成为被替代的打工人,还是想抓住这波浪潮,成为先富一代?文字稿已放在余志义的书房,点赞关注,投资不迷路!

大家好,我是一凡,欢迎来到 token 工厂系列四期。三期内容里,我们完整拆解了断力租赁赛道的核心标地。而当下整个赛道正在迎来两大核心变局,第一是三大运营商集体下场,第二是行业资本翻倍投入。 本期内容,我们聚焦这个行业最大的核心变量,拆解运营商入局带来的格局重构,以及行业洗牌周期里最核心的投资甄选逻辑。本期内容我们分三步层层拆解,第一步, 拆解行业两大核心变局,这是我们所有判断的底层基础。第二步,基于运营商入局的变量,演二零二七年行业中局竞争格局。第三步, 给出洗牌期完整的标地甄选标准,从生死线到超额收益加分项,形成可落地的完整筛选逻辑。首先看行业第一大变局, token 需求爆发带动算力投资翻倍扩容。需求端,中国厂商 ai 大 模型周度 token 全球掉用量连续三周稳居全球第一,全球占比百分之三十六, 是美国模型的两倍以上。国内日军 token 掉用量较二零二五年同比增长近四十七倍。 ai 大 模型商业化加速, 催生了海量 token 生产需求,这是算力租赁赛道最底层的增长逻辑。需求紧喷直接带动供给端资本扎堆入场。二零二六年国内算力基础设施总投资规划达三千八百到四千五百亿元,较二零二五年实际完成额 实现二到二点五倍的翻倍增长。全行业扎堆扩展通用算力供给,将快速从供不应求转向供需平衡,甚至会出现局部过剩的情况,这也是行业洗牌的核心导火索。如果说算力投资翻倍是洗牌导火索,那三大运营商集体下场 就是改写行业规则的核心变量。二零二六年开年,中国电信官宣全面转向透支经营,移动、联通同步将算力服务定为公司核心战略, 全年三家合计算利相关投资近八百亿元,同比增长百分之二十八以上。运营商绝非普通的新增玩家,而是带着碾压级优势重构行业规则的主导者。核心碾压优势包括四大方面,第一, 百分之二十以上的用电成本优势。第二,近乎零成本的贷款资源。第三,一级政企存量客户。第四,全牌照合规资质与充足能耗指标。 这些优势直接击穿了行业的成本底线与核心竞争壁垒。运营商入局,直接让行业过去的三大旧玩法全面失效,野蛮生长的红利期彻底终结。第一,拿卡就能赚钱的红利期结束,运营商规模化采购的成本溢价直接抹平了中小厂商的拿货优势。 第二,小而美的生存空间彻底消失,通用算力价格战一触即发,无成本优势、无差异化能力的中小玩家毫无生存空间。第三,纯硬件出租的商业模式失效,运营商将算力网络 token 服务打包成标准化产品, 纯硬件租赁只能陷入同质化价格战的内卷。基于行业基础数据与头部企业战略规划,我们对二零二七年中性情景下的 行业格局做出完整推演,行业最终将形成双龙头主导的金字塔型固化格局,塔尖是行业绝对主导者,合计拿下百分之六十五到百分之七十五的市场份额。 其中头部互联网云厂商占百分之三十八到百分之四十二,牢牢占据高端训练算力市场。三大运营商占百分之二十八到百分之三十三,主导通用推理算力与政企大订单市场,腰部是头部差异化第三方厂商预计占百分之二十到百分之二十五的市场份额。 核心生存逻辑是不与龙头正面竞争,靠细分赛道壁垒、生态配套能力实现逆势增长。塔基是区域型中小厂商,最终市场份额不足百分之五。 未来两年,百分之六十以上无核心壁垒的中小玩家将批量出清,行业马太效应将持续凸显。二零二六到二零二七年是行业价格战与集中洗牌的关键周期。这里给大家明确三类必须重点规避的高风险标的。第一类,纯租赁、第三方机逢运营的企业, 无自由产权机房与能耗指标,无核心成本优势,价格战中毫无还手之力。第二类,无芯片厂商官方合作资质的企业,仅靠散彩二手芯片维持运营,无稳定芯片供给,抗风险能力极差。第三类, 单一客户营收占比超百分之五十的企业,无偿协订单锁定业绩,业绩完全依赖单一客户现金流,无任何安全垫。避坑之后,我们先看标地甄选的三道生死线,这是权重百分之一百的必达门槛,迈不过去必然被行业淘汰。 第一道极致的成本控制能力量化达标线,明确为与发电企业签订五年以上长协供电协议 p u e 稳定控制在一点一五以内,算力集群利用率长期维持百分之七十以上。第二道 合规的产能扩张能力量化达标线,明确为八大算力枢纽节点拥有自由产权,机房具备充足能耗指标,拥有 idc i s p 全牌照合规资质。 第三道稳定的现金流安全店量化达标线明确为与核心客户签订三年以上长协租赁协议, 机柜上架率长期稳定在百分之八十以上,无单一客户营收占比超百分之五十的情况,迈过生死线只能保证企业活下来。想要站稳市场、避开内卷,必须具备三大核心护城河。第一, 核心算力资源长期锁定能力量化达标线明确为拥有英伟达、华为、深腾官方核心合作伙伴资质,与芯片厂商签订一年以上长协采购协议,芯片供给稳定,来源可追溯。 第二,商业模式升级能力。量化达标线明确为从纯硬件租赁升级为全站服务增值服务,营收占比超百分之三十,彻底摆脱同质化内卷。 第三,与龙头的生态协调能力量化达标线。明确为不与运营商、头部云厂商正面竞争, 成为龙头企业的生态合作伙伴,提供不可替代的技术配套服务。具备生死线与护城河,能保证企业获得行业平均收益。 想要拿到超额收益,需要具备这三大加分项,第一,国产算力深度适配能力,与华为、升腾等国产芯片厂商深度绑定,拥有全国产化算力解决方案,可承接政务国企国产替代订单。第二, 跨境算力服务能力,布局海外合规算力节点,服务企业 token 出海跨境 ai 应用需求,赛道竞争更小,订单溢价更高。第三, 自研算力调度与优化技术,拥有自研万卡级集群调度平台,可提升算力利用率与 token 生产效率,形成极强的客户粘性与技术壁垒。最后,给大家总结四个核心结论,这也是本期内容的核心观点。第一,运营商集体入局, 彻底改写了算力租赁行业的竞争逻辑,野蛮生长的时代全面终结,行业正式进入成本、技术生态为王的存量洗牌周期。第二, 洗牌期企业穿越周期的核心是先过生死线,再建护城河,而非单纯比拼算力规模大小,无核心支撑的规模只会成为企业的发展负担。第三,行业中局将形成 双龙头主导基础市场差异化厂商占据细分赛道、中小玩家批量出清的稳定格局,行业集中度将持续提升。第四, toker 工厂全系列至此以完整覆盖 ai 算力基础设施从底层硬件到商业化变现的全产业链闭环,完整拆解了 toker 工厂从生产到变现的全流程逻辑。最后, 本内容为行业研究与观点分享,仅供参考,不构成任何投资建议与具体操作指引。本期所有核心数据均来自国家数据局 三大运营商官方批露信息、 overroder、 全球 token 调用监测数据、 i d c、 中国信通院等机构行业报告以及上市公司官方公告。所有数据均有权威来源,客观可追溯。关注一、凡带你看懂科技产业底层逻辑,感谢大家的收听!

一口气搞懂为什么说 toc 才是中国真正意义上的电力出口?这条万亿级新兴产业链里,又有哪些核心上市公司值得关注?我会用最通俗的逻辑 让你彻底吃透 toc 这个概念,以后再不用刷碎片化内容,并助力你在风口来临前站稳脚跟。首先,我们先解答第一个核心问题,为什么说 toc 才是中国真正意义上的电力出口? 要知道,中国是全球当之无愧的第一发电大国,二零二五年全年发电量超九万亿度,几乎是美国、欧盟、印度的发电量总和,占全球总发电量的三分之一。风电、光伏的装机量更是连续多年稳居世界第一。但过去我们一直面临一个尴尬的问题, 电太多了,用不完,吸电能输之后仍有大量富余,又因为电力存储成本居高不下,最终只能用无奈的办法解决。要么降低发电功率,让风机和光伏板停转,要么把电输送给电节、铝、冶金这类高耗能产业,实在没办法,就只能眼睁睁看着 发出来的绿电被浪费,也就是常说的气风气光。下一期我为大家再继续分享用不完的电用在什么地方?知道的朋友们可以在评论区留言。

这可能是今年财经圈最硬核,也最容易被普通人忽略的超级风口,甚至可以说是普通散户今年最容易抓住的一个重点方向,它就是 token, 或者我们说它的官方中文名 词源。它和大家印象里的投机概念没有半毛钱关系,反而是中国律、电算力、 ai 大 模型三大产业融合的核心主体, 更是咱们国家真正意义上能把电力卖到全世界的关键突破口。今天我就用最接地气的逻辑,带大家彻底吃透这个万亿赛道。看完你就会明白为什么说 t 肯是中国产业换道超车的关键一步。我们先解决一个最核心的困惑,中国明明是全球第一发电大国, 二零二五年全年发电量突破九万亿度,这个数字相当于美国、欧盟、印度加起来的总和,占到全球总发电量的三分之一。风电、光伏装机量更是连续多年全球领跑。可这么庞大的电力产量,却一直面临一个特别尴尬的困境,发的多,用不完, 西电东送,已经把能输送的电力都送到了东部沿海,可依旧有大量绿电富余,更难的是电力存储成本一直居高不下,我们没有办法把多余的电大规模存起来,最后只能选择两种方式消化,要么让风机光伏板降功率停转,造成大家常说的气风气光, 要么只能把电输送给电节、铝、冶金这类高耗能产业,相当于用高价值的绿电去做低附加值的加工,完全是大材小用。 可能有人会问,既然电用不完,为什么不直接出口卖给其他国家?不是我们不想,是真的做不到。电这个东西很特殊,他没办法像煤炭、石油那样装船运输,也没办法像商品一样打包出口。 就像我们手里握着全球最大的金矿,却因为金子太重,运输太难,只能堆在自家院子里看着浪费。这个问题困扰了中国能源产业很多年,直到偷啃的出现,才真正迎来了破局点。 我们终于找到了一条全新的路径,把国内富裕的低成本的绿电先转化成算力,再把算力封装成 token, 通过数字网络卖到全世界,让原本浪费掉的电力变成了全球都抢着要的高价值商品。那到底什么是 token? 我 给大家举个最生活化的例子,你听完就能懂。 当你打开 ai 助手,让他帮你写一段自动抢票的代码, ai 并不会直接理解你整句话的意思,他会先把你的指令拆解成一个个最小的语义单位,这个最小单位就是 token。 就 像我们用电按度计量,打电话按分钟计费, ai 大 模型处理所有信息生成所有内容消耗的核心单位都是 token。 从指令拆解、知识库解锁、 逻辑运算,到最后生成完整内容,每一步都在消耗 token。 而 token 的 总消耗量,就是 ai 服务收费计算算力成本的核心依据。现在中国 token 已经在全球市场站稳了脚跟,今年二月的数据显示,全球前十大模型总 token 消耗量超过二十八点七万亿, 其中中国模型贡献了十四点六九万亿,占比达到百分之五十一点二,第一次实现了对美国模型的超越。而且在这庞大的调用需求里,有百分之四十七的用户来自美国。 这不是国内市场的自嗨,是全球开发者用真金白银做出的选择。为什么北美、欧洲的程序员宁愿放弃硅谷的主流大模型,转而选择中国的 ai 模型?核心就三个字,性价比。硅谷模型的性能确实有优势,但算上使用成本,中国模型的优势直接拉满。 中国工业电价本身就远低于欧美大西北的风电、光伏给算力中心的专用电价最低能压到零点一五元每度, 而德国的工业电价折合人民币接近两元一度。这样的电价挖地在全球都是独一党的存在。成本优势直接转化成了价格优势。国产大模型的 api 定价比 openai 便宜近三十倍,比其他硅谷大厂便宜十倍以上。 minimax、 kimi、 智普 ai、 deepsea 这几家中国模型,一度占据了全球周度 toc 掉用量前五席中的四席,试战率高达百分之六十一。 中国 ai 模型已经从全球追赶者,变成了全球价格敏感市场的定价主导者。当美国的程序员调用中国大模型 api 生成代码,数据会通过海底光缆 瞬间抵达宁夏、内蒙古的算力中心,成千上万颗 gpu 开始运转,消耗着中国西部零点一五元一度的风光电,完成推理运算后,再把结果一秒钟传回美国。 整个过程,我们没有输出一滴油,没有出进一根电缆,但中国电力的价值已经通过 tucker 完成了跨境交付。 这就是 tucker 出海的本质。电力不出境价值走全球,把戈壁滩上廉价的绿电转化成全球通用的数字商品,实现了价值的成倍提升。这绝对不是偶然的风口, 而是全球供需的完美匹配。一边是全球开发者对高性价比 ai 服务的迫切需求,一边是中国充足廉价的赋予电力成熟的大模型技术、完善的算力基础设施,供需两端精准对接,形成了可持续的商业闭环。过去二十年,我们出口衣服、 家电、手机,后来我们出口光伏、锂电池、电动车,而现在中国开始出口算力本身,这就是中国出口结构的一次根本性升级。那咱们普通散户 到底该怎么在这条产业链上赚到钱,怎么参与进这场时代的红利里呢?我们不妨将眼光放的长远一些,这不是单点的机会,而是从软件到硬件、从前端到能源的全链条传到红利。最直接参与的就是前端的 模型服务与 ai 平台,这是偷啃变现最直接的环节,也是市场关注度最高的方向。再往上走,算力需求持续爆发,直接利好芯片、 服务器、 ai 整机这些硬件提供商。只要大模型还在扩规模,这个环节的业绩支撑就会非常扎实。中间层的算力中心与 i、 d、 c 数据中心同样是核心受益方,大量 g、 p、 u 机柜上架, 算力租赁需求暴涨,会直接体现在营收与订单上。而真正压仓底最稳的一环还是西部绿电运营商和算电协调调度相关企业。毕竟 token 的 本质是电力出口,只要算力在跑电,就必须持续供应, 这是整条产业链最确定的底层支撑。再延伸开配套的电网设备、网络安全、高速传输等环节也会跟着同步受益。 整条赛道从上游到下游,从高弹性到稳增长,覆盖了不同风险偏好的参与方式。咱们散户完全可以根据自己的操作风格,找到适合自己的切入位置,分享这条万亿级新赛道的成长红利。人类历史上 每一次大国格局的重构,都源于能源形态的革命。英国靠煤炭和蒸汽机砥定格局,美国靠石油和内燃机定义规则。而今天,中国正在用电力和算力的融合,在全球 ai 服务贸易中开辟新赛道。那些曾经因为无处消纳而被浪费的西北律电, 如今正以偷啃的形式释放出前所未有的价值。从前,我们靠算法、靠电力挣外汇, 这不是弯道超车,是真正的换道超车。 ai 的 尽头是算力,算力的底层是电力,而 token 就是 连接这一切的核心纽带。这条万亿赛道才刚刚起步,未来的增长空间远比我们想象的更广阔。

token 到底是什么?它到底重要在哪里?和我们普通人到底有什么关系?我现在一口气给你讲清楚好吗?那 token 到底是什么呢? 我们发现其实现在 togg 有 了一个正式的中文的一个名词,叫词源,其实把这两个字拆掉,一个是词,一个是源。对于词的角度来讲,你应该瞬间能够意识到它跟语言跟词汇,或者说通过语言词汇再传达的是信息,它表达的是这个意思, 那么源往往代表的是单元,也就说最小的这个单元。现在目前词源我觉得终于有了一个信达雅的这么一个中文的名称出现了。在那之前,每次我们讲跟到 ai 有 关的时候,中国人也是在讲 token, token, token, 但你,但是 token 到底是什么?大家好像都主动地迂越掉了。 好,现在有了信达雅的这么一个词源以后,好像貌似我们离这个词的内涵也近了一些。 那么现在目前角度来讲,既然它是关于到语言,关于到词汇最小的这个单元,那给大家举一个例子,比如说我们今天问一个问题,说今天你心情如何?那如果你去按 token, 按词源来分解的话,它到底是什么呢?可能我们会把今天 你心情如何,再加后面这个问号,一共会分解成多少?一二三四五五个 token。 所以借助这个例子,大家迅速地就能够秒懂。 token 跟原来的所谓的字母是两个概念,并不是一个字儿就是一个这个 token, 而是说它最小的信息单元就是一个 token, 这个是我们在这个案例当中就能够理解的。那为什么 token 目前会出现在老黄的演讲当中,也会出现在吴永明的演讲当中,显然它是非常重要的。 那这里我给大家总结了三个要点啊。第一个 token 几乎在代表某种 ai 时代的成本单位。你像现在目前来讲, gtc 大 会当中,老黄已经在表达,从当下到未来,几乎可以看到会出现分层定价的收费体系, 也就是说叉的 gbt 大 模型出来了以后,我们一直都在讲,但凡我们在使用,我们就要为 token 而付费,那这个付费的单位叫每百万的 token, 我 们要付多少钱? 那随着整个的 ai 时代不断地往前去发展,在过去的三年的这个时间,发展到现在二零二六年,那老黄的体系里面,他认为未来在计费的过程当中可能会分成免费,当然就是零 这样一个层次。中级,那每百万 token 是 三美金,高级六美金,高速四十五美金,超高速甚至达到一百五十美金,每百万 token, 那 问题就来了,每百万 token 都是一样的这个量,但是为什么计费的整个的金额会从零到一百五十美金, 差别会这么的大?核心的原因是同样的百万级别的这个 token, 那 么未来我们得到的响应速度,让你等一丢丢时间秒回,还是让你等很长的时间? 回复的整个的质量,你对他的这个回复你觉得满意还是不满意?你觉得他的整个的回复是很充满了 ai 的 塑料感?还是回复完了以后,你就觉得整个好像他这个 ai 比我这个脑子还要好使?以及信息交互的过程当中上下文的整体的长度。 所以未来的整个 token 作为一个成本的单位,会出现的是分层定价的收费的这个模式。 好,那他除了是一个成本的单位以外,非常显然他也会成为效率的这个单位。 你像之前我们看老黄在 gtc 大 会上发表的这个演讲,老黄说我现在目前英伟达的公司 未来大概率一年的营收去到一万亿美金,那他凭什么那么自信呢?讲白了一句话,当下认为自己已经不是只是在生产这个 gpu 的 芯片了,他现在目前认为他是一个 ai 的 工厂, 它正在打造的是从单芯片到服务器到整个的数据中心的所有的基础设施建设。而当它成为了 ai 工厂以后,它还能够做出一个趋势分享给到我们未来的 ai 数据中心, 其实衡量的是消耗同样的电力,消耗同样的算力,每秒钟到底谁能够生成更多的有效的 token? 所以我们看到的是什么? token 既是成本的单位,也是在 ai 时代来衡量你的效率的这个单位。 好,那现在目前角度来讲, gtc 大 会上老黄还讲了一个特别别开生面的一个场景,他说现在英伟达的软件工程师在自己的体系里面拿到的收入,一部分是所谓的年薪,另外一部分就是公司目前给到的 token 的 补贴。 我记得当时就有人就说,怎么可能?谁去稀罕你每个月给的 token 的 消耗的额度?你真的不要小看这一点,什么原因?我在我的公司里面现在也在给我们的软件工程师给予每个月的 token 的 额度, 他要帮公司去做很多的 ai 方面的研发和开发,那好了,他能够有多大的额度去调用这个 token, 可能也决定了他的工作效率, 所以一个愿意去提效的公司往往会给自己的员工提供什么每个月 token 额度的 福利。好啦,所以目前角度来讲,我们今天在整个的比较短的这个时间里面,给大家迅速的去科普了什么是 token, token 为什么变得这么的重要?为什么大佬们都在提 token, 那 么现在目前我们拉回到跟我们相关,跟我们普通人到底有什么关系? 在我看来的话,至少有三个层面是有关系的。首先你会看到整体角度来讲,你未来能够如何高效地去生成 token, 其实本质上就是你的效率的衡量的这个指标。那从这个角度来讲,每一个看视频的你要意识到生成 token 的 效率几乎成为了 ai 时代个人的核心竞争力, 所以你要积极去拥抱整个的 ai, 让自己驾驭 ai 的 能力变得非常的强,这是第一个可能适合于每一个有主业的你。 那么第二个是什么?如果你是在创业的这个过程当中,我也可以明确的给你分享。在三年前我就已经意识到了一人公司已经到来了,那这个地方的一人公司并不是在强调真的只有一个人在强调的是一小批人 借助指挥 ai 的 千军万马。或者是我们在前一段时间看到匹配龙虾,一个个人就可以有很多条的龙虾,每一个龙虾都可以帮你去解决不同的场景或者是研发的场景,所以我们在这里讲到的一人公司代表一种极其轻量化的运作。 好,那些目前角度来讲,可能后知后觉的人可能会担心说以后全是艺人公司了,那谁来雇我们?所以又回到第一点,你要抓紧时间变成能够输出大量有效 token 的 这种类型的人。好,那么第三点是什么?我们是一个投资方面的账号, 所以我要明确的告诉你,如果你作为一个产业投资人,你会发现开始给你提供了很好的机遇。那目前我给你举一个例子,二零二四年到二零二五年这两年的时间里面,老黄公布了一个数据,目前 token 的 输出量两年的时间上涨了一万倍,这个是什么概念? 这就意味着每年的上涨幅度是达到了一百倍,所以你每年的 token 的 输出都达到了一百倍。 请问如果你进行投资布局,对你有没有启发?所有的这个背后,可能至少我们马上就看到围绕 ai 的 算力的整个的需求,当下还不鉴定,毕竟整个的推理时代才刚刚开始。

摩根大聪预测,未来的五年,全球拓客消耗量将暴涨四百倍,谁能分到最大的蛋糕?逻辑非常清晰,看准四个核心环节。第一环,算力基建的地主,谁拥有核心城市群的智算中心?谁绑定了头部大模型场上的长期订单? 他们是托运工厂的房东,无论哪家大魔仙深处,只要是算力在跑,他们就能够稳稳的收入确定性最高,是行业的压舱式。第二款,国产算力的总包商。 在海外高端的 g、 p、 u 受限的这种背景下,谁能借华为、升腾等国产的芯片快速搭建起万卡级群?他们是国产生产线的献舍者,从规划设计到落地运营,国产替代的紧迫性让他们拥有了最大的订单弹性。第三款, 深度绑定的运营商,谁不只是卖硬件,而是在大模型厂商进行深度的技术协调和全流程优化。他们掌握了如何让算力更高效的秘诀,这种技术赋能盒让他们在算力紧缺时拥有最高的溢价权。第四,传输配套的 高速路拓客生产出来必须瞬间送大用户,谁能提供低延时的边缘计算和 c、 d、 n 加速呢?它们算力落地的是最后一个公里, a 应用的爆发必然带动这条高速公路的车流量的激增。 以前我们担心算力过剩,现在今年亚马逊、谷歌全面提价算力,摩根大聪预测,未来的五年,全球拓客消耗量将暴涨四百倍。当需求呈指数级爆炸而供给跟不上时, 酸力它的属性,它彻底就变了,它不再是过剩的工业品,而是稀缺的战略资源。跟底层的逻辑在于,托肯本质上就是中国的电力衍生品。在大模型的成本结构里面,电力占比高达百分之七十。 当美国用户调用中国的大模型 a p i 时,数据呢?在国内数据中心用我们的电力完成推理,结果传回海外。电没有出国门,但电力的价值,它通过推广完成了跨境支付。在中国拥有全球最低电力成本和最稳的电网的这种背景下,我们实际上是在做一件大事, 利用能源的优势,向全球输出高附加值的数字电力。以前我们靠廉价的商品出口,现在我们靠低成本电力加高智能算法的组合权,重新定义全球贸易。这不仅是企业的机会,更是中国在全球 ai 产业链中从跟随者变为核心供电局的战略机遇。 在这个时代,拥有算力资源、掌握国产技术、具备能源优势的企业才是真正的中流砥柱。

上一期我们聊到用不完的电该怎么办?相信很多人问到,既然电多到用不完,为啥不直接卖给国外?不是不想,是真的做不到。电没法大量储存,更不能装船装车运输, 就像你手里攥着全世界最大的金矿,却因为金子太重运不出去,只能白白堆在自家院子里看着浪费。直到偷肯的出现,彻底打破了这个僵局。 现在这些多女的赋于电力,终于有了高价值,出路就是把电变成算力,再把算力封装成 toc, 卖到全世界。想搞懂这整套逻辑, 你必须先明白 toc 到底是什么,他凭什么能把废电变成黄金。下一期我把底层逻辑讲的清清楚楚,听懂的人已经抓住下一个风口。懂 toc 的 朋友,评论区留一句,我看看有多少内行。

偷偷出海,正在把中国的电变成世界的商品,中国把过剩电力变成了全球疯抢的一种商品,一度电出口赚五毛,未给 ai 后竟卖出四百元。行,如果啊,你是冲着电力套利和东数西算这样热到的词语点进来的,你可能就要输忘了,因为今天啊,我要泼三盆冷水。 嗨嗨,我是艾瑞斯,一个天天跟 ai 模型账单打交道的创业者。最近呢,偷偷出海这个词啊,火到了发烫,但是呢,我却越看越心惊啊, 因为呀,几乎所有的分析呢,都错到了根上。今天这条视频啊,我只说三句大实话,帮你把幻觉突破。第一句实话呀, ai 的 竞争从来都不是挖矿,别用电费便宜来幻想统治世界了,很多人啊,算账,中国电费便宜。所以呢, ai 的 老细胞,也就是扑克,成本就低,出口呀,必胜, 大错特错,英伟达的脑皇的五层蛋糕理论说的已经很清楚了, ai 的 产业呢,有五层,从下到上啊,是能源、芯片、基础设施, ai 模型和应用。电费呢,只是最底层,最基础的一层,在整个总成本里啊,它只占百分之十五到百分之二十五。真正烧钱的是什么呀?就是几十上百亿甚至上千亿的研发投入 砸出来的模型是贵上天的, g p u 显卡也是整个系统的工程优化,你电费再便宜,能够便宜过这些吗?所以呢,纯电费套地啊,本质上就是用挖矿的思维去规划发射卫星的生意赛道啊。从一开始就看错了。第二句实话呀,中美模型的价差呢,不是成本差,而是物种差。 openai 的 gpt 敢卖天价,咱们国产模型却只能做到它的几十分之一,这是为什么呢?技术上啊,美国的主流模型是全院专家会诊,问题呢,再简单也需要全体的专家到场,成本啊,极高。咱们的主流呢,是智能分诊,也就是用谁叫谁,效率至上。 从商业上啊,美国卖的是华尔街硅谷认可的技术霸权和确定性。是啊,奢侈品。咱们呢,卖的是给普罗大众的 补贴工具和生态门票,是基础设施。市场上呢,咱们美国消费者为顶级的生产率付费是习惯。咱们呢,还在用地板价去教育市场,我自己公司啊,就分的很清,写核心代码,搞系统设计。咱们呢,会用美国的高价模型 买的呀,是可信和效率,但是处理文档,生成文案这些国产模型啊,绝对是 y y d s。 是 因为啊,足够好且便宜太多。这个价差的背后呢,是技术路线、商业策略、市场阶段的三重差异。你买的呢,根本就不是同一种福分。 第三句实话啊,出本出海呢,不是开个 a p i 就 收美金,而是啊,闯进了全球最复杂的雷区。你以为啊,把夫妻搭好,翻译个文档就能够收全球的钱了吗?这个太天真了。第一道鬼门关是数据合规,欧盟的 g d p r, 美国的各种法律,你的数据能不能出镜呢? 很多的海外公司根本啊,就不可能数据要传回中国的 ai 服务。第二道卡是地缘政治,在去风险的背景下,你今天的生意做的很好,可是明天啊,一纸禁令就可能让你归零了。第三呀,是税务法律,实体 钱怎么收费怎么交,在哪个国家啊?被告了怎么办?这些问题呢,就能够让一个技术团队呢直接崩溃了。所以呀, 通过出海有机会吗?有的,但是呢,绝对不是一个懒人捡钱的机会。真正的初度呢,我认为只有三条,第一啊,是去友好市场,比如像东南亚等地,中国的模型呢,好用不贵,靠极致的性价比呀,取上核心啊,是做好区域深耕,而不是啊全球撒网。 第二呢,是全球开发者的杠杆在 openner 上啊,中国模型的这个钓流量呢,已经超过了美国了,咱们呢,已经是无数开发者的性价比首选啊。第三呢,是模式生伪和草船借箭, 从卖 a p i 变成卖本地合规的解决方案。但是啊,这需要巨大的资源和实力,或者呢,和海外合规平台,比如说 fireworks, ai 等等合作,作为模型供应商融入他们的生态,这也是许多中国开源模型团队的实际选择。说到底呀, ai 的 全球竞争是技术、工程、生态、规则的全方位博弈,突破价格呢,只是一个缩影, 未来的赢家啊,绝对不是吆喝着我的电费最低的人,而是能够让每一度电,每一秒算你都产生更高智能价值的团队。热闹呢,是别人的成本呀,是自己的。在 ai 这场无限游戏里面,看错地图啊,比跑得慢可怕了一万倍。 我是艾瑞斯,在 ai 创业一线专治各种简单归因和认知幻觉。如果呀,这条视频让你呢更清醒了一点,记得呀,点赞分享,咱们下期再见了,拜拜。

黄仁勋在 gdc 二零二六大会上扔出了一颗震撼全球的炸弹,到二零二七年,英伟达看到的需求至少是一万亿美元, 这是什么概念?哈,去年这个时候他说的数字可是五千亿啊,仅仅过去一年时间直接翻倍,这可不是画饼,这是已经摆在桌面上的订单。今天这期视频啊,我会帮大家拆解三件事,第一,为什么是一万亿?这个数字背后的底层逻辑是什么? 第二,黄仁勋说的 tock 工厂经济学那是什么?为什么称之为未来十年最重要的投资范式?第三,当然最关键的就是咱们普通人怎么从这场 ai 革命中分到一倍更。 首先,我们先讲讲这一万亿需求的本质,其实是 ai 从玩具变成了工厂。很多人听到一万亿,第一反应是 ai 从玩具的诞生, ai 从感知、 进化到生成,他能写文章、画图片、写代码。第二次是二零二四年推理, ai 的 出现以 o n 为代表啊, ai 学会了自己思考, 不再是你教他做,而是你说他想把复杂问题拆解成步骤,一步步推理给你看。第三次就是现在叫 a 诊智能体的爆发,就像当下最火的 o n、 curl 小 龙虾,哈用上的人都发现, ai 不 再只是回答问题了,他能主动理解你,理解你想做的一系列任务,之后自主干活,并 记住你每一次提的要求和改进。刚用的时候,你可能觉得他像个大学实习生,做啥都好像有点错,用久了你会深刻理解 agent 这个词,你仿佛真的请了一个私人助手一般,他能够在一次次的任务之中 学习进化和迭代。所以黄仁勋在演讲中说了这么一句话,我认为值得所有的投资人都要记下来。英伟达现在百分百的工程师都在用 ai 写代码, 没有例外。这意味着 ai 已经从可选项变成了必选项,就像当年企业必须要用电脑,必须上网一样,现在企业必须用 ai。 那 重点来了, ai 干活用的是什么呢?是 token。 token 就是 ai 生成的一个基本单位,你让 ai 写一段代码,它可能要生成几百个 token, 你 让它分析一份财报,那可能要生成几千个 token。 所以, 未来的数据中心不再是存储文件的地方,而是生产 token 的 工 工厂。这就是接下来要重点拆解的话题了。黄仁勋这次演讲最核心提出的叫 tock 工厂经济学。 g d c 上啊,黄仁勋打了一个比方, 非常形象,每一座数据中心,每一座工厂,从定义上来讲都是受电力限制的。一座一 g 瓦的工厂,永远变不成两 g 瓦,这是物理和原子的定律。什么意思?就是电力,它是一种应约束,你不可能无限的扩容。在固定功率下,谁的每瓦吞吐量,谁的每瓦 投肯产出最高,谁的生产成本就最低。这就好比两家工厂都用一万度电, a 工厂生产了一万件商品, b 工厂生产十万件,你说谁的成本更低, 谁更有竞争力?答案是显而易见的。所以黄仁勋就把 ai 服务分成了五个商业层级。第一层叫免费层,高吞吐、低速度,每百万投肯几乎不要钱。中级层叫每百万投肯 三美元,高级层六美元,高速层四十五美元,超高速层每百万 token 要约一百五十美元。所以在这个 token 工厂里面,你的吞吐量和你的 token 生成速度将直接转化为你每年的精确收入。这段话就完美全释了,为什么英伟达拼了老命都要提升芯片的性能?华而勋公布了如下这么一组数据啊,在短短两年时间内,英伟达将 token 的 生成率从两千两百万提升到了七个亿, 实现了三百五十倍的增长。作为对比啊,摩尔定律在同时期仅能带来约一点五倍的提升。三百五十倍,一点五倍,这就是英伟达的护城河。另外,还有一个特别重要的事情啊,就是这一次 g d c 里面啊,英伟达发布了史上最复杂的 ai 计算系统,叫 vera ruby。 黄良勋说啊,过去提到 hopper, 它会举起一块芯片,它说它很可爱。但提到 vera ruby, 大家想到的应该是整个系统有多强啊。第一,它百分百热了,彻底 消灭传统的限量。第二,过去需要两天安装的这个机架,现在两个小时搞定。第三,在一 g 瓦的数据中心里面啊, tocan 生产速率能达到七亿每秒。更关键的是啊,因为它整合了被收购的 grogloo 的 这个技术哈,所以黄仁勋解释了两者的分工。 verubiu 付 择海量的计算,还有显存的预填充阶段, core q 一 就负责对延迟极度敏感的解码阶段。所以他说的这种非对称式分离推理很复杂,但结果很惊人,让整体性能提升了三十五倍。如果你的工作主要是高吞吐,那百分百实用。 vero ruby, 如果你有大量高价值的编程级别的 token 生成需求,那拿出四分之一的数据中心规模给 gucci。 所以呢,这个就是黄仁勋给到很具体的 ai 应用企业的建议。 但同时呢,也有很多投资人关心的小龙虾,我自己也在用啊。这次演讲,黄仁勋也花了很多篇幅讲 open crawl。 他 说 open crawl 是 人类历史上最受欢迎的开源项目,仅用几周时间就超越了 linux 在过去三十年取得的成就。但这么长篇的论文里面,我给大家抓取了一个最值得关注的点, 不是 open crawl 是 什么,而是黄仁勋对未来职场做了一个描会。在未来哈,他说,我们公司的每一位工程师都需要一个年度 token 的 预算,他们的基础年薪可能是几十万美元,但会在这个基础上, 公司拿出大约一半的金额作为 token 的 额度给到他们,让他们实现十倍的效率提升。这已经是硅谷的新招聘筹码了。 想象一下,在以后的 hr 的 面试里面哈,他可能问你的不是上一个东家给你多少薪水,而是上一个东家给了你多少 token 的 预算,因为这比薪水更能反映你自己的价值,这是正在发生的现实。 好了,说了这么多,那咱们普通人应该怎么从这个 ai 浪潮里面分一辈更呢?对投资者到底意味着什么?我给大家五条最具体落地的投资策略。 第一,咱们要死盯每瓦性能的这个核心指标,未来 ai 公司的竞争力啊,不是看你有多少模型,不是看你有多少用户,就是看你在固定功率之下到底能生产多少 token? 这一定是一个硬指标,而且骗不了人。 第二,我们要关注头肯分层定价的商业模式哈,那个免费层、中基层、高级层、高速层、超高速层,不同层级对应不同的应用场景,谁能占据高价值的层级,谁就有定价权。第三,我们看到传统的萨斯的公司啊,可能面临 生死转型,要么它变成 a a s, 要么就被淘汰。还有那些在卖软件许可证的公司啊,未来可能就会非常非常艰难了。第四,在投资的这个赛道上,电力 伴热一定还是隐形冠军。托管工厂啊,会受电力限制, e g o 啊,可能是上限,谁能提供更高能效的电力解决方案,更高效的夜冷技术,谁就是那个卖铲子 的人,这里有着中国巨大无比的优势啊,以后我们再讲。第五啊, a 准应用呢,就会是下一个爆发点,基础设施已经 就位,接下来是应用爆发。那些用 open crawl 构建垂直领域的智能体公司啊,就有机会成为下一个 salesforce, 下一个 surface now。 而对于个人而言很重要。今天,无论你从事什么工作,如果你不去拥抱这种 agent 的 应用,或者你连小龙虾都不愿意了解,那你跟你身边人的差距,很有可能在 在这一两年时间内被瞬间拉得无比远。所以最后啊,我想用黄仁勋演讲中的这么一句话来结束今天的内容。我们正处于某件非常非常重大的事情的起点,一万亿美金的需求,它不是终点,它是起点。 open 工厂的时代已经到来了。