最近有一个词很火,叫做 token 出海。今天一个视频让你明白 token 出海的底层逻辑以及机遇。如果用一句话来解释, token 出海的本质是中国开始把人工智能能力变成一种可以计价的商品,然后卖到全世界。那这里面有两个关键问题,第一,什么是 token? 第二,为什么它能拿来做生意?先说 token, 你 可以把 token 理解成 ai 系统里的计量单位,你每问一句话,每让 ai 生成一段文字,或者生成一张图片,系统都会把这些操作拆解成很多最小的计算单元,这些单元就叫 token。 换句话说, token 本质上就是 ai 在 工作时消耗的燃料单位。现在大多数 ai 平台都是按照 token 来收费的,用的越多,花的钱就越多。理解了 token, 你 就能理解 token 出海在做什么了。 简单来说,就是中国的一些公司把自己的算力资源和 ai 模型能力通过接口开放给全球用户, 国外的开发者、企业甚至个人用户只要调用这些接口就会消耗 token, 同时也就完成了一次付费。这背后其实是一条非常清晰的价值链。电力被用来驱动服务器,服务器提供算力,算力运行 ai 模型, ai 模型在对外提供服务时产生 token, 而 token 最终变成收入从全球用户那里留回来。你可以把这个过程理解成一种能量变现,原本看起来很普通的电力资源,通过算力和算法的转化,变成了可以卖钱的智能服务。 这和传统外贸有一个本质区别,过去我们出口的是看得见摸得着的商品,比如衣服、家电、手机。 而现在 token 出海输出的是一种无形的能力,也就是智能。更关键的一点在于,这种模式并不需要把实体产品运出国,服务器可以一直放在国内,电力也在国内消耗,但全球用户通过互联网调用服务并为此付费,于是就出现了一种新的经济形态, 算力不出海,但价值在全球流动。那为什么这件事会在最近两年快速爆发?核心原因其实有三个。第一个原因是成本优势。中国在电力、数据中心以及基础设施方面有明显的规模优势, 这意味着同样的 ai 服务,中国企业往往可以用更低的成本提供出来,从而在全球市场上具备价格竞争力。第二个原因是需求爆发。随着人工智能技术的发展,越来越多的公司开始接入 ai, 从内容生成到客服系统,从代码辅助到数据分析, ai 正在成为基础设施, 这就带来了一个非常巨大的市场需求,而这种需求天然适合用 token 这种按量计费的方式来承载。第三个原因是商业模式的成熟。过去 ai 虽然很强,但很难直接变现,而现在通过 token 计费, ai 服务变成了一种类似水电费的模式, 用户用多少就付多少钱,简单直接,而且非常容易规模化。从产业角度来看, token 出海大致分为三类角色, 第一类是模型提供方,他们负责研发和训练 ai, 模型是 token 的 生产者。第二类是算力提供方,包括数据中心和云计算厂商, 他们提供基础设施,相当于能源供应商。第三类是平台,他们把不同的模型整合起来,对接全球用户,负责分发和商业化。这三类角色共同构成了一个完整的产业链, 也意味着 token 出海并不是一个单点机会,而是一整套新的产业体系。最后,我们可以把这件事情放到更大的时间尺度来看。过去二十年,中国依靠制造业参与全球分工,通过出口商品获得增长。 而在未来,随着人工智能的发展,一种新的分工方式正在出现,那就是通过输出算力和智能能力参与全球价值链, 真正重要的是理解它背后的逻辑。在 ai 时代,算力正在成为一种可跨境交易的新型商品,就像当年跨境电商崛起一样,抓住趋势,底层逻辑的人才可能吃到红利。
粉丝21.3万获赞65.7万

中国电信出了个 tock 套餐,好多人都在问, tock 到底怎么用?我用一个比喻,一分钟给你讲明白。你买个机器人回家,就等于提了辆新车,车有了能开走吗?不能,你得加油,得充电,这个油,这个电就是 tock。 tock 就是 机器人的饭,不给他吃,他连话都说不出来,一堆废铁, 那怎么用呢?三样东西对号入座。第一,买偷看包,这是给机器人买饭票,你是包月随便吃,还是吃一顿买一顿自己选。第二,买提速包,这是给机器人修路,你叫网速慢,机器人就抢,等于豪车跑泥巴路,再贵也白搭。这个包给你铺一条高速,让他跑起来。第三,买安全包, 这是给机器人上保险,请保镖,你跟机器人说的隐私,让他处理的合同文件,这个包帮你防贼。所以偷看怎么用,就是你买智能产品后花的智商费,没它,智能产品就是个废铁摆设。 但这还只是基础玩法,电信真正在步的是一盘大棋。塞利王、 tokyo 银行、 tokyo 超市,这才是未来 ai 世界的真正高速公路和加油站。关注我,下期给你讲透这三个到底是什么,跟你有啥关系?

现在啊, tock 太火了,有人说他是虚拟币,有人说 tock 能当工资发,甚至有人说呢,他能当钱花。很多人呢,听的一头雾水啊,那 tock 到底是什么哈,为什么突然火了?跟咱们普通人到底有啥关系? 今天呢,大叔就用一个比喻,把这三个问题一次性讲明白,听完哈,不仅不懵,还能少花冤枉钱。 token 呢,到底是什么啊? token 就是 ai 的 计量单位,用 ai 就 得消耗它,就像我们呢,用电器就得消耗电一样。 你问 chat gbt 一个问题啊,他消耗 token, 你 用龙虾让他帮你干活也消耗 token, 就 跟看电视开空调消耗的电一样。那谁是生产 token 的 厂家呢?就是那些语音计算厂商啊, 比如阿里云,腾讯云,谷歌云,他们建了一大堆的服务器,就相当于建了一座座的发电厂,二十四小时不停的生产图腾。你每次用后台呢,都有一个电表在转,转一圈就扣掉几个图腾。那图腾能买卖吗? 不能,那这些厂家哈,卖 token 给你,是让你自己用的,不是让你倒卖的。而且 token 呢,并不通用,你在阿里买的 token 只能在阿里的 ai 上用,你在腾讯买的就只能在腾讯上用,那 token 它能存起来吗? 哎,这个浓,但是呢,也有期限,这些厂家可精着呢啊,你买完图腾之后,在一定时间内不用完就作废了。那每个厂商图腾的价格不一样,而且呢,干不同事的图腾价格也不一样, 你比如哈你普通聊天的,他就便宜大概一百万的图腾呢,十块钱,那专门给程序员写代码用的呢,需要更精准,更文静。哎,那就贵了,大概是一百万的图腾要一千元, 那就像家里用电和这个商业用电就两个价。那 took 它为什么突然火了哈?以前 took 不 火是因为大家用 ai 哈,就是聊聊天,相当于就点个灯泡看看电视用电量不大。 但现在不一样了哈,各种智能体出来之后, ai 从聊天进化到干活了。我给你一个数字,你感受一下哈, 普通聊天机器人,完成一次对话只要几百个图腾,但是呢,智能企执行编程、解锁调用工具啊,这些长链条的任务,图腾消耗可能达到几千万。 这就好比你家呢,以前就就有几盏灯啊,一个电视。现在呢,装了中央空调,热水器,电冰箱,那电表转的飞快, toc 的 用量就这么炸了,这就是 toc 突然火的原因。那 toc 跟咱们普通人到底有啥关系呢?那关系大了啊,我说三件事啊,第一, 以后用 ai 啊,跟你交水电费一样,你得算计着花。现在很多 ai 还是免费的,但免费的日子长不了,你想想,滴滴美团当年也免费,后来呢,养成习惯了,就开始收费了。 偷看呢,就是 ai 的 计件器,以后你问 ai 一个问题,那后台电表就得转一下,你用的越狠,花的就越多。 第二呢,你用的 app, 网站背后呢,都在烧,偷看最终的成本会转嫁给你。你现在刷抖音,用美团逛淘宝啊,背后都有 ai 在 跑,推荐你看什么视频,给你推荐哪家的外卖,搜索结果怎么排?全是 ai 干的, 每干一次都消耗 toc, 那 这些 toc 谁买单呢?现在大厂是先垫着,那大厂不傻哈, toc 的 账早晚算到咱头上。第三, 那 toc 呢?正在创造新的职业,也正在淘汰旧的岗位。华人勋啊,说了一句很炸裂的话,未来英伟达,每一个工程师都需要一份年度 toc 的 预算。 现在鬼谷招人哈,面试的时候,工程师会问我的 offer 带多少 toc, 这说明啥啊? toc 正在变成一种数字工资,以后不光程序员,做设计,写文案,搞运营,可能都得看公司给你配了多少的 toc 预算。 那反过来呢?那些只会干简单重复脑力活的人危险了。因为 ai 干这些活花的 toc 比雇人便宜多了。 老板一算账,肯定用 a i, 这就是 token 跟咱普通人最直接的关系。他正在重新定义工作值多少钱。 token 呢,并没有那么神秘哈,不知道大叔讲明白了没有?对咱普通人来说哈,记住一句话就够了, 以后用 a i 就 像用电一样,得算计着花。但别焦虑,该用用该省省,把 token 花在能给你创造价值的地方。我是兼三大叔,下期见。

token 翻译成中文叫什么?叫词源,是模型处理文本的最基本单位。 token 和字呢?有什么区别? token 呢,可以是一个字,一个词,甚至半个字,那这是谁规定 的?是模型看了大量人类文字统计出来的,这样表达呢,更省事。常见的字和词就用一个 token 表示,其他的就用多个 token 拼接。 一个 token 到底是多少钱? deep 呢?输出一百万 token 呢?约等于三本新华字典只需要三块钱, gpt 五呢更贵,超过九十块 token 和上网流量收费是一样的道理吗?不是的, token 收的是计算费,是生产成本,而流量收费呢,是搬运费,不是一回事。为什么养龙虾要烧 token? 是 因为龙虾要用大模型思考和回答问题,因为大模型按 token 收费,所以就说烧 token。 本地部署大模型是不是就不用烧 toon 了?还是要用到 toon, 因为 toon 机制本身和部署方式无关。本地部署呢,不需要按量付费,但电费得自己掏,算上硬件成本不一定划算。如果我把一段话复制粘贴进去,是不是就算一次 toon 不是 文字越多呢?计算的输入 toon 数量就越多? 我问的问题很长,但答案很短,是不是只扣答案的 token 不是, 输了 token 呢?也要算钱?表情符号算几个 token 会不会比一个字还贵?常见的表情呢,是一个 token, 不 常见的会用两到四个 token 拼接表示。 deepsea 和 gpt 的 token 是 一样的吗? 不一样,互相不认识。 y, y, d, s 这种网络词是几个 token, 一 般拆成 y, y 和 d s 两个 token, 要是这个词足够火,也可能被模型当做一个整体。同样的问题,我上午问和下午问,输出的 token 数会不一样吗?不一样,模型输出具有随机性,每次输出的 token 数量不同。 那小龙虾帮我下载电影是否要按 token 计费?小龙虾思考怎么下载?打开下载网站,执行下载命令,这些都需要消耗 token, 但是下载电影本身不消耗 token, 因为电影不是大模型生成的, 电影是存在第三方服务器上,只消耗下载流量,不消耗 token。 为什么我和 ai 聊得越久,回复同样一句话,花的钱就越多? 模型是基于对话历史进行回答的,所以你所有说过的话呢,都会参与计算,计算成本就越高,这也是 ai 还需要按照输入 token 数量计费的原因。 怎么才能少用点 token 输入更少的提示词去掉?你好,请问这类废话规定模型输入长度,加一句五十字以内回答,但很有可能问题没有说清楚,回答呢也不够准确。如果前后问题呢?不相关也可以新开对话,避免历史对话参与计算。 托管是加密的密码吗?不是,托管只是一种文字编码方式,虽然你看不懂,但他并没有加密。 图片和文本的托管是一样的吗?不一样,图片会切分成很多小小的方块,每个方块呢?当做一个视觉托管,就像拼图一样。托管是为了收费而发明的吗? 不是,托管是技术发明,是为了能表达和能计算,只是计算的成本和托管数量正相关,所以就按照托管数量收费。我使用豆包没有付费啊。为什么说托管是收费的?大厂为了抢占市场让你免费使用,成本呢?暂时不用你出, 如果你是企业用户或者养龙虾就需要支付费用。我在一段话里疯狂敲空格, ai 是 视而不见还是会偷偷扣我的钱? 空格也算钱,虽然有的模型会把几个空格打包,大部分时候你多敲一个空格就再多烧一份算力。那 ai 产生的废话是不是能退费?不能,因为废话也是显卡辛辛苦苦算出来的。

最近很多人起一个号子在教你去靠 token 出海这个实现你这个所谓的财富自由。但很多人连一台服务器怎么回本,你这个 token 成本到底怎么算都没搞清楚,就开始教普通人怎么去发财。首先啊, token 没那么玄乎, 它本质上它不是黄金,它本质上就是大模型在处理这个你这个文本式的一个基本计量单位, 你问一句怎么写周报,人家从读懂到生成答案,消耗的就是 top 坑背后他不是玄学,是实打实的一个计算。第二点,成本和定价是两码事,很多人听中国电费便宜对吧?觉得就把 top 坑卖给全球就能赚差价。 但真正决定 top 坑成本的不只是电费,而是四大四大三。第一个呢是硬件折旧,你高端显卡买回来那一刻就开始贬值,这笔钱要比电费贵的多。第二点是研发和工程 ai 服务,他不是说有台服务器啊,有台机器就能跑,你还要做调试,你要做安全,你要做熔灾。第三呢,他才是电费,如果你的架构优化不行,电价他再便宜也白搭。 第三,普通人最容易踩进去的三个坑。第一个,做大厂 apa 的 代理,这也是市面上很多的一个情况,你以为自己是分销商,实际上就是给大厂做免费销售。而且我告诉你一个很残酷的一个事实,大厂的代理资格普通人根本就拿不到, 人家不仅要验你公司资质、资金流水,还要签对赌协议,承承诺高额月流水,如果你达不到 保证金,直接泡汤。第二个,自己租 gpu 部署开源模型,你觉得省的省了钱,其实是把 api 买 api 的 风险换成了自己扛机器利率是吧?抗运维的苦力活。第三个坑自己买机器托管 啊,这个更是门槛极高,真的,你拼的是全球网络囤土是吧?调度熔灾和持续运营 跟你那电费其实便不便宜真没关系。所以说别被那些什么零门槛暴富的什么给忽悠了,很多都是一个新的全新的一个庞氏骗局,财富自由根本就没有捷径,看懂这些成本起码能在第一刻躲开镰刀这件事上及格。 所以大家根本不要去相信现在所谓的抖音上有很多新的一个账号给你讲是吧?你成为一个 open open ai 的 一个代理去挣多多少多少钱,其实根本就不现实,大家要注意上当,不要被割韭菜。

每一次工业革命,都有一样东西在背后疯狂燃烧。第一次工业革命,蒸汽机来了。蒸汽机本身不值钱, 值钱的是让它跑起来的东西。煤。煤从地里挖出来烧掉,变成蒸汽,蒸汽推动机器、机器生产商品。整个英国的矿山、铁路、钢铁厂,全都围绕着怎么挖更多的煤,怎么运更多的煤来建立起来。煤就是那个时代的核心消耗品。 第二次工业革命,电来了,电本身也看不见摸不着,但他改变了一切。爱迪生建发电厂,特斯拉搞交流电,全世界开始拉电网、发电、输电、配电、用电,一条完整的产业链,养活了成千上亿的人, 创造了通用电器这种巨无霸公司。电就是那个时代的核心消耗品。第三次石油、内燃机、汽车、飞机、塑料化工。整个二十世纪,全球经济都建立在石油上,围绕着石油打了多少仗?中东为什么重要?因为那里有油,石油就是那个时代的核心消耗品。 现在 ai 时代来了,它的核心消耗品是什么呢? token, 你 可能听过这个词,但不太理解。简单说, token 就是 ai 处理信息的最小单位。 你跟 ai 说一句话, ai 会把你的话拆成一个一个的 token, 然后逐个处理,逐个生成回答。每一次你问 ai 一个问题,每一次 ai 给你写一段文字,画一张画,生成一段代码,背后都在消耗 token。 一个中文字大约是一到两个 toc, 你 让 ai 写一篇一千字的文章,大概就是消耗了两千个 toc, 听起来不多,对吧?赶紧把这个数字乘以全球的用户量, chat gpt 每周九亿活跃用户,豆包 kimi 千万, 中国五点一五亿生成式 ai 用户,每个人每天跟 ai 对 话好几轮,每一轮都在烧 toc。 再加上企业端自动驾驶的 ai, 每秒处理海量的传感器数据,全是 token。 金融公司的 ai 交易系统,每毫秒做一次决策也全是 token, ai 写代码, ai 做客服, ai 审核合同, ai 看片子,全都是 token。 英伟达为什么一年赚两千一百多亿美金?因为生成 token 需要 gpu, gpu 就是 token 的 发电机。英伟达卖的每一块芯片,最终都是在帮客户生产更多的 token。 openai 为什么要花六千亿美元建数据中心?因为数据中心就是 token 的 发电厂。越多的人用 ai, 就 需要越多的数据中心,就需要越多的电力,就需要越多的芯片。 google 为什么要签一百五十兆瓦的地热能协议?因为 ai 的 数据中心太吃电了,生产 token 这件事,最终还是要烧真实的能源。所以 token 这条产业链从上到下是这样的, 最底层是能源发电厂,电网、地热核能给数据中心供电。往上一层是芯片,英伟达、 amd 含五 g 造生产 token 的 发动机。 再往上是云计算,亚马逊、微软、阿里云建 token 工厂,把算力租给别人。再往上是大冒险公司 open ai、 ospec、 deepsea、 月之暗面,它们把芯片和算力变成可以使用的 ai 服务。 最上面是应用层, chat、 gbt、 豆包 kimi 各种 ai 工具,它们是 token 加油站,每个用户来一次就烧一次。煤的时代,谁控制了煤矿,谁就是亡。石油时代,谁控制了油田,谁就是亡。电力时代,谁建了发电厂,谁就是亡。 token 时代,谁能更便宜、更高效的生产和分发 token, 谁就是王。这就是为什么英伟达市值全球第一,所有的科技巨头疯了一样的砸七千亿建数据中心。这就是为什么 deepsea 一 出来,全世界都撼动,因为它证明了用更少的算力能生产同样质量的 token, 等于用更少的煤烧出了同样多的蒸汽。但 token 跟煤石油炼里有一个根本区别,就是 煤你能看得见,能称重,一吨多少钱清清楚楚,石油你能闻到?一桶多少美元,全球统一报价。 电你虽然看不见,但电表会转,每个月你都会收到电费单 token 你 看不见,摸不着,闻不到。你跟 ai 聊天的时候,他不知不觉的会在消耗这个东西。每一次对话,每一次生成,背后都有真实的芯片在运转, 真正的电力在燃烧,真实的成本在产生。 openai 去年收入一百三十一亿美元,亏了八十亿。收入从哪儿来?卖 token 亏的钱花在哪了?生产 token 按 so pick 给 cloud 的 定价,按输入 token 和输出 token 分 别收费。 google 的 gmail 三点一 pro, 两百 k 以下的 token 一个价,两百 k 以上的 token 另外一个价。整个 ai 行业的商业模式底层逻辑就是一句话,生产 token, 卖 token。 未来十年, token 的 价格会像电价一样成为一个关键的经济指标。哪个国家的 token 成本更便宜,哪个国家的 ai 产业就更有竞争力。中国为什么拼命搞国产芯片?因为用英伟达的芯片生产 token 太贵了,还随时可能被卡脖子。 deepstack 为什么重要?因为它把每个 token 的 生产成本打了下来。当年煤价涨价,工厂就停工。油价涨了,航空公司就亏钱,电价涨了,铝厂就关门。未来, token 成本涨了, ai 应用就用不起。 token 成本降了, ai 就 能渗透到更多应用场景,替代更多人力,创造更多价值。 我是文思,你每天用 ai 的 时候,可能从来没有想过这些,但从今天开始,你可以换一个视角看 ai。 你 用的每一个 ai 工具,背后都连着一条从能源到芯片到数据中心到大模型的完整产业链。你敲下的每一个字, ai 回复你的每一句话,都在消耗一种你看不见的资源,这种资源就是 token, 它是 ai 时代的煤, ai 时代的石油, ai 时代的电,只不过这一次烧的东西,你看不见。觉得涨知识了,可以转发给你的朋友看看。关注我,每天带你看懂 ai!

为什么有这么多傻子相信 tucker 出海,甚至有人去相信电力出海?难道是中国的九年义务教育普及的不够吗? 他们说啊,这个中国的基础设施全球最发达,中国的电呢,也是全球最富裕最便宜。所以呢,中国的 tucker 也很便宜。因为中国的 tucker 很 便宜呢,所以老外们都很喜欢用。你看 openroot 上面,中国模型的这个 tucker, 交易量已经超过了百分之五十。 首先啊,中国大模型的 token 呢,确实是足够便宜, kimi 千问 deepsea 这些比 cloud 的 gpt 要便宜五到十倍。但是呢,这个便宜啊,和电他妈半毛钱关系都没有。中国的这些大模型 token 之所以便宜,最根本的原因是架构问题。举个简单的例子啊,一个模型 脑袋这么大,一百亿参数,它覆盖了方方面面的知识,什么问题都能回答好,你问一个问题, 今天天气怎么样?当这个问题被丢给这个大模型的时候呢?美国模型的处理逻辑是这样子的,拿到你的问题,然后呢,整个大脑一百亿参数,一起来思考今天天气怎么样?然后呢,再出答案给你。 那要把这么大的模型全部激活呢? gpu 的 运行成本呢?要一百块。打个比方啊,那中国大模型的运行方式呢?同样这么大个模型,一百亿参数, 同样把今天天气怎么样这个问题丢给大模型,他不会整个大脑一起来想今天天气怎么样,后脑勺负责天气相关的问题。所以呢,只有后脑勺在思考,那其他部分呢?都在休息。所以呢, gpu 运行的成本呢,只用支持你的后脑勺十块钱就够了。 这个呢,就是中国大模型的架构优势。有人可能会好奇啊,哎,美国的大模型他就不会只用后脑勺思考吗?其实呢,也会专业术语呢,叫做稀疏程度, 美国旗舰模型呢,大都是半稀疏,大概呢,就是用小半个大脑在思考。中国旗舰模型呢,都是极致稀疏,就是用一点点脑回路就可以思考了。价格优势带来的另外一个成本优势呢,就是预训练, gbt 五的这个预训练成本呢,大概是五亿美金左右。 deepsea 的 预训练成本呢,只有六百万美金,相差一百倍啊。那这些呢,才是中国大模型便宜的根本原因。 那和电是没有半毛钱关系的,每一次大模型调用产生的成本结构 g p u 的 折旧呢,大概要占到百分之八十四,而电呢,只占百分之六。所以呢,电再便宜就算是不要钱吧,节省的成本呢,也只有百分之六。但是呢,架构优势,让 deepsea 两千零四十八张卡 就可以干出美国模型几万张卡的事,这个才是指数级的成本下降。好话再说回来,中国的大模型确实这么便宜,那么 top 出海为什么就是扯淡呢?原因很简单啊,卖的动的模型呢,门槛太高,门槛低的模型呢,你卖不动? cds 二点零呢,是碾压性的领先,慢剧,短剧,电影,电视电商这些行业啊,需求量都非常大, 但是呢,代理费的门槛是一千万,如果不是本身就有很多成熟客户从零开始呢,风险我觉得是很大的,因为呢,大模型是几个月一次大变化,你半年一年回不了本,可能到明年你就卖不了了,因为因为又有更加优秀的模型出现了, 那么门槛低的模型呢?你又卖不动。比如说你去搞阿里云的代理或者分销商,门槛可能低得多,千万, deepsea 这些都能卖, 但是呢,你拿到哪里去卖?你卖给谁?上个月呢?千问 deepsea, kimi 这些中国模型在 openroot 上面的 token 消耗量达到百分之五十,但是真正收到中国公司手上的钱呢?少于百分之五。为什么会这样呢?因为这些模型都是开源模型,美国公司 shoots, deep info, together 等等, 把模型、代码、模型权重拿过来,部署到自己的云上,自己生产,自己卖,不需要向中国公司付一分钱。 而且呢,因为他们不研发,不预训练,没有前期的投入成本,需要去贪销。所以呢,他们的 token 售价有一些甚至比中国模型的官方价格还要便宜。所以你告诉我你怎么卖?今天就这么说,下课。

今天聊一个很多人想问但是又不太敢问的问题,做投胎、中传,做大模型,去和文化在国内到底合不合规?先说我的态度吧,这个话题必须要正视啊,不能装看不见。哎,你要在一个赛道里长期赚钱,首先就得确保自己站在一个法律允许的 范围内,否则赚再多,一纸通知全部归零。目前国内头肯中转,这个生意啊,说白了确实处在一个模糊的地带,不是说完全违法,也不是说完全的合法,关键在于你怎么做啊,用什么模型服务什么客户,走什么渠道。 好,我先把最核心的几条法律红线啊,帮你梳理清楚。第一条红线就是未经备案的境外大模型不能在国内公开提供服务啊,这个是最最重要的一条, 根据国家网信办二零二三年发布的深层式人工智能服务管理转型办法啊,向中国境内公众提供深层式 ai 服务的,需要完成算法备案。那像 open ai 的 gpt 系列, ospec 的 cloud 系列,谷歌的 gemini 系列,这些模型在中国 没有备案呐,官方也没有在中国开展面向公众的服务。那如果你搭了一个平台,把这些未备案的境外模型包装一下,直接面向国内普通用户销售。哎,这是有明确的法律风险的, 很多小众转账做的就是这件事情。那境外模型的 a p i 套一个壳卖给国内的用户啊,短期内可能没人管,但政策一收紧,第一批被清理的就是这种。那我们再说第二条红线, 数据出境的问题。用户通过你的平台调用境外的模型,那用户的输入内容提示词啊,文件啊,代码等等就会被发送到境外服务器 中。关于数据出境的规定就涉及到啊,数据安全法和个人信息保护法中啊,关于数据出出境的那个规定啊,特别是如果你的客户是企业, 他们的商业数据啊,代码啊,客户信息啊,通过你的平台啊,传到了海外服务器,一旦出了数据泄露事件,那法律责任链条会追溯到你这个中间环节。以三条法律红线就是内容的安全责任。 你作为平台方,那对通过你的平台产生的 ai 生成的内容负有任何义务啊?如果用户通过你的平台钓鱼模型生成的违规的内容,那你作为服务提供者是有连带责任的。 境外模型不受国内的内容安全规则的约束啊,输出内容呢,没有经过国内标准的安全过滤,那这一层风险那是实实在在的 啊。第四条红线,支付和税务合规。很多小众转账用户呢,是个人的账户收款啊,不开发票不报税啊,短期没问题,金额大了一定会出问题,特别是现在做透肯分销啊,设计的资金流水可以恒大, 那税务部门呢,对这种新业务的关注度是在上升的。哎,那不是说,那是不是说这个赛道就不能做了呢?哎,不是,关键你要选对 姿势啊,合规的做法是什么呀?聚焦以备案的国产模型, deepsea、 通用千问、智普、 glm、 kimi、 mini max、 百川豆包,这些模型已经完成了国内的算法备案,在中国境内合法提供服务。那你基于这些模型来去做聚合分发啊,法律上那是站得住脚的。 而且说实话啊,国产模型现在的能力已经非常强了,在编程啊,智能体啊,日常对话这些核心的场景上面,跟海外模型的差距已经 非常小了,而且价格还便宜几十倍,你完全可以用合规的国产模型组合啊,满足绝大部分的客户的需求。好,第二个合规的要点就是注册正规主体,走正规的财务流程。要 做这门生意呢,就得把公司注册好啊,对公账户去收款,该开发票的开发票,该交税的交税,这不是给自己找麻烦啊,是给自己买保险。 当行业开始规范化的时候呢,有正规主体的玩家会活下来,靠个人号啊,收款会被清底出局的。那第三个核心要点就是关注政策的动态,预留调整空间啊。中国通信院呢,已经在制定人工智能云 token 工厂权杖服务能力要求的评估标准了啊,这说明 token 聚合风发正在从 野蛮生长走向行业规范啊。标准一旦出来,合规的玩家呢,就会获得准入资格,那不合规的玩家呢,就会被挡在门外。好,我们总结一下,嗯, token 聚合风发不是灰色生意,但确实有灰色的做法,红线在哪里很清楚。那未备案的境外模型,面向国内的公众服务数据违规出境啊,逃避内容审核义务,财务 税务啊,不合规,避开这些红线,那用已备案的国产模型来做聚合,走正规公司化运营,这门生意是完全可以光明正大的啊。那些打着低价旗号倒卖境外模型的小众转账,短期可能很赚钱,但是呢,在刀尖上跳舞啊,把政策一变,第一个倒下的那就是他们了, 认认真真做合规聚合风发的渠道商啊,反而会因为他们的退出而获得更大的市场空间。那合规不是成本,是互成合。关注我啊,我会持续分享 cocoon 赛道的最真实最负责任的行业认知啊!我们下期再见!

什么是 tiktok? 警局?有一天,你在办公室对着 ar 打了这么几个字,我爱你。你按下回车,屏幕上 ar 就 开始回复你,看起来只不过是再普通不过的对话了,但是这背后却发生着一件复杂的计算。 在 ar 的 眼里,他不认识人类自然语言,就像是计算机,满脑子只有零和一一样, ar 的 脑子里只有一段信号的,它会被拆开,变成一段一段可以计算的单位。这些最小单位有一个名字叫做 token, 中文叫做词源。那什么是 token 词源呢?我们就来做一个测试好了。中文,我爱你是三个 tokens, 三个字母,英文的 i love you 也是三个 tokens, 十个字母。这里的中英文的 token 的 数量是一样的,这说明了什么呢? token 不是 字,也不是词,而是模型,用来理解世界的最小计量单位。或者说 token 把人类语言拆解成机器能懂的碎片了。 听到这里,大多数人就会以为这只是一个技术细节,干嘛告诉我啊,因为它很重要啊。当你输入我爱你的时候,这些 token 就 会被模型计算, 当 ar 开始回复你的时候,它会在一个一个的生成 token。 也就是说,人类与 ar 的 对话,本质上是一场 token 词源的流动, 而流动就意味着一件事情消耗。比如你让他做一张海报,消耗了多少 tok 呢? ar 完成了多少工作量呢?那么问题来了,当工作产量可以用 tok 衡量的时候,他的成本和价格 应该怎么定呢?王富贵有一家电商公司,每天都要做一张拖鞋促销海报。过去他有一个美工,月工资是九千块钱,一天做一张海报,每张海报的成本大概是三百块钱嘛。 后来他开始用 ar, 同样一张海报一分钟内完成,几乎没有时间成本,而这张海报带来的结果并没有什么巨大的差别。那么问题又来了,这张海报成本是多少呢? 有可能你会说,不要钱啊,现在很多的 ar 工具都是免费的,豆包千万元宝随便用啊。 但是这里有一个非常大的误解,免费不等于没有成本啊,这些免费只是因为有人在替你付费,而这些大模型的背后,数据中心是在烧电的,模型是不断在推理的。也就是说,每一次的生成其实都是在消耗真实的资源, 只不过现在这个成本被平台补贴了而已嘛。但是你看另外一边, chat、 gpt 和 gemina, 它们都是付费订阅的呀,当补贴结束的时候,当竞争稳定的时候,天下肯定是没有午餐的嘛。 但是这个我们今天就不再讨论范围了,回到这张海报的成本,不是零,而是消耗了多少头肯。于是我们就可以得出一个结论,这个结论是非常重要的,成本从时间函数变成了计算函数。 什么意思呢?如果你仔细想一想,就会发现一件有趣的事情,人类的劳动报酬几乎都是按时间计算的,上班是按月薪或者是时薪的。 过去整个社会经济的成本计算方式本质上就是时间。为什么呢?因为在人类的世界里边,有一个无法绕开的事实,生命是单向消耗的,一个美工一天只有二十四个小时,他今天做了这张海报,就不可能再同时做另外一张了。 所以当王富贵付他三百块钱的时候,他买的是这个生命体不可逆的一段时间。工作八个小时,本质上就是把八个小时的人生 卖给了公司。而公司也很清楚一件事情,这八个小时里边并不全是有效产出的,里边包含了发呆、走神、摸鱼、情绪等等。 在叹气的世界里边,这些损耗是不可避免的呀。但是 ar 把这件事给彻底掀翻了, ar 不 卖时间,他甚至是没有时间的概念的,他不疲劳、不休息、不焦虑,也不会因为状态不好,今天就少出两个版本的海报, 他只做一件事情计算,当 ar 生成一张海报的时候,他没有工作了。一段 token 词源, ar 时代是整个底层价格体系的重塑,这就是托肯经济。但是如果你觉得这只是做海报变便宜了,那就太低估这件事情了。那么我们再来换一个例子, 你用过 iphone 的 吧,一台售价七千九百九十九的手机,如果拆开来看,你会发现一件非常有意思的事情,屏幕、电池、外壳加起来可能就是三千块钱,工厂组装可能只要十几块钱,那剩下的四千块钱去了哪里呢? 答案很简单,我们在为思考付钱,为芯片设计、为系统架构,为工业设计、为算法优化等等。也就是说,买的不是手机本身,而是人类最顶级的大脑世界, 这个叫做智力溢价。但是现在这件事情就开始变喽,我们把王富贵的逻辑套到了 iphone 身上,过去设计一个模块需要五十个工程师开会争论,试错要花三个月甚至更长的时间, 但是现在只要输入一个复杂的指令模型就开始运行了,消耗海量的东西开始发生了变化。 第一是效率的意义变了,过去效率的提升意味着用更少的时间赚更多的钱嘛。但是在 token 的 世界里,时间已经不是成本了。第二,竞争的本质变了。 过去公司之间拼什么呢?拼人、拼团队,拼谁更努力。但是现在开始就变成了拼谁的 token 更便宜,更加智能。于是竞争的核心就从人力资本转向了算力加上算法。 第三是权力的分配变了,在旧世界里,最重要的资源是人,谁能够组织更多的人,谁就更强嘛。但是在新世界里,真正重要的资源变成了 token, 你 会发现这个结构就非常熟悉了,资源垄断、定价权和石油时代的逻辑几乎是一模一样的。 第四,最深层的一层变化来了,当劳动被拆解成 token 之后,一件几乎不可逆的事情就发生了, 劳动被彻底的标准化了。过去每个人的能力不同,每个作品是带着人的差异的,以后越来越多的工作可以被还原成一段计算的流程,这意味着什么呢?脑力劳动开始像支付水和电一样被使用了, 用户根据实际消耗支付费用。这段话该怎么理解呢?你想一想,现在是怎么用电的,你不会关心哪个电厂发电的,是哪台发电机在运转的,你只关心一件事情,用了多少度的电,要付多少的钱。 用水也是一样的,你打开水龙头,水就出来了呀,你只要看水表,多少吨的水要付多少钱,而 ar 正在把办公室劳动变成了同样的东西。 过去,你用一个人,要面试,要管理,要沟通,要发工资,要承担他的情绪和状态。现在你用 ar, 只需要输入一句,结果就出来了。中间发生了什么呢?不需要知道,只需要知道一件事情,这次深层是消耗了多少的头肯。 同样的,王富贵也不再关心是哪个设计师做的,做了多久,他只关心一件事情,做出这家海报要消耗多少的头肯。 但是,如果你把这件事情再往上看一层,你就会发现,这已经不是王富贵的账本的问题了,这个就是国家层面的事情了。过去,中国是一个典型的工业国, 向全世界输出物质资料,家电、服装、汽车等等。但是在 ar 时代,这件事情正在发生变化,生产资料正在从物质转向计算。 未来的竞争不只是谁的工厂更大,谁的制造能力更强,而是谁能生产更多、更便宜、更智能的 token, 或者你可以把它理解成一次角色的转换。工业时代,中国输出的是商品,而在 ar 时代,中国如果要升级,输出的将是智能,从工业国走向智算国。而在另外一边,中美的竞争也在悄悄地转换战场。 过去争什么呢?石油、航道、能源。但是现在真正的核心资源已经变了,很多人还在用旧世界的视角去理解竞争,传统的能源大国之间的思维去争夺石油、关税、制造业等等。但是真正的新石油已经出现了, 不是黑色的液体,而是 token。 谁控制 token 的 生产,谁控制 token 的 成本和智能,谁掌握 token 的 定价权,谁就掌握了这个时代的新能源, token 就是 数字时代的石油。 对了,今天我们讲的 token 只是针对 ar 世界里的,在加密货币世界里的 token, 我 们是还没有讲的,有兴趣我们再下次讲。好了,说完了,再见。

你的手机话费套餐里,马上就要多出一笔你从来没有见过的费用。不是流量,不是通话,是一个叫 token 的 东西。五月十五日,上海电信正式发布了 token 算力套餐,一块钱二十五万,额度点从三十九块九到二百九十九块九,基础版、专业版、旗舰版都有, 话费直接扣。你的手机号就是 ai 账号,听起来是不是特别像十五年前的流量包?其实逻辑完全是一样的。回忆一下,上一次运营商把一个新的技术塞进套餐里卖,后面发生了什么? 二零零九年,三 g 流量包上线,三年时间只没收入腰斩网约车重购了出行市场,移动支付代替了现金,长视频跟短视频分走了一大部分注意力。不是说技术本身有多厉害,是运营商 在卖它的那一刻,就意味着这项技术的普及已经不可逆了,它从吉克手里的玩具变成了水电煤。再看一个数据国家数据局,譬如中国,日前日军 tokin 的 钓用量已经突破了一百四十万亿。 你今天打开的每一个 app 背后,大概率都在消耗 token。 智能客服在烧, ai 推荐在烧,你的公司用的那个自动报价系统也在烧,只不过以前这些成本藏在企业技术预算里,你感知不到。现在电信把它拎出来,明码标价塞进话费单,是因为消耗量已经大到要像水电一样要按照表收费的程度。 同时,电信还搭了三个入口, ai 云电脑当 agent 的 运行主体。智能城市做企业赋地化服务,一张基础设施的网正在从上到下的铺开。电信这一步,表面上看是出了一个新套餐。往深一层, ai 的 计费权正在从科技公司手里转移到基础设施运营商手里,谁掌握计费通道,谁就掌握用户关系。十年前,微信跟支付宝抢的就是支付入口,今天,运营商抢的就是算力入口。对普通人来说,你不需要搞懂 token 到底是什么,就像二零零九年时,你不需要搞懂什么是 tcp ip 协议。 再回过头来看,上一次运营商改变计费单位的时候,反应过来的那批人用流量红利筑起了自己的生意。这一次的节奏呢,会更快,留给人反应的时间呢,也会更少。

你知道现在全球最值钱的生意是什么吗?不是石油,也不是芯片啊,是 token。 但大多数人呢,对 token 的 理解还停留在 ai 聊天要花钱那个层面。 所以今天呢,我想给大家去讲清楚,就是 token 到底是一门什么样的生意,到底谁在赚钱?钱呢?又流向哪里?我先说 token 是 什么?本质上它就是 ai 处理信息的计量单位。之前呢,我也专门用一条视频来去拆解过 token, 在这里呢,我简单介绍一下啊, token 就是 你输一段话,他输出一段回复,背后全都是在算这个 token。 就 好像你家里的电表,不管你开的是空调还是电视,之后呢,都折算程度数去收费。 token 呢,就是 ai 世界的度数。 我看过一组数据啊,真的挺震撼的,二零二四年初呢,国内每天的这个 token 调用量大概是在千亿级别,但到今年三月份,这个数字已经冲到了超级千倍啊。这种增数不是行业在增长,我觉得真的是在重构。 硅谷那边有个现象就已经很能说明问题了,一些工程师开始把透客消耗量当成一个炫耀的资本,比谁用的多用的猛,有人一周烧掉的透客量,就算换算成文字,能够去把维基百科塞满好几十遍。 而马塔相比法这些公司呢,更直接把员工的透客使用量写进了绩效,用的少的人会被重点关注。可能你会去说啊,我每天都在用 ai, 也没有去觉得花多少钱。 这里呢,其实有个认知盲区,就是你日常问 ai 的 几个问题,消耗的 top 确实是微乎其微的,但一旦你开始去用 agent, 让 ai 去帮你做研究,去写方案,去跑流程,情况就完全不一样了。 agent 在 后台要去调用一堆的模型协助工作, top 的 消耗量是普通对话的几百倍起步, 很多看起来免费的工具,就在这个节点开始去跟你要钱的。好,那搞清楚了 token 是 什么之后,我们再来看是要产业链怎么去分钱的,我把它呢分成三层去讲,上游呢,是基础设施层,也就是卖场子的生产, token 需要去赚利,需要存储,需要电。而英伟达公司呢,在 ai 芯片这块的市场份额是超过了八成, 海积电呢,是全球顶尖芯片唯一的代工选择。另外呢,这还有一种叫做 hbm 的 高带宽内存,是目前 ai 训练最卡脖子的硬件, s k 海力士和镁光是主要的供应商,数 据中心的动量也在急速的飙升,预计今年呢,全球会超过五百 t w h。 这一层的特点就是不管上面谁在打架,他都在里面 稳稳的去收钱。好,那我们再说。中游是模型层和分发层,像 openai 这些公司,负责把这个算力变成会思考的东西,定义了 ai 的 能力边界。 阿里云、微软这些云厂商把模型能力打包成接口卖给开发者,你掉一次 a p r, 他 收一次托管费。 还有类中间商呢,专门去帮你在全球各家模型里面去找性价比最高的那个自动路由,按需去分配。好,我们再说下游,这个呢,是应用层,也是真正去用托管干活的地方,像 ai 智能体就是这里最大的一个消费主力, 一个复杂任务跑下来偷客的消耗量可能是人类聊天的几百倍,企业用它呢,也去生成代码,出设计稿,做数据分析,直接替代原来要付给人的那部分成本。 那这三层里面钱是具体是怎么流转呢?我也输入了四种变现逻辑。第一种就是按量收费,你掉一次 a p r, 他 收一次钱,输出的偷客会比输入的贵, 通常呢也会贵好几倍。这个是最直接最稳定的模式,现金流呢,也非常非常的清晰。第二种呢,是订阅的成本远低于 你付的钱,厂商赌的是大多数用户不会把这个额度用满,这个利润空间有多大呢?我只能说相当可观。第三种呢,就是机器间的结算,这个是很多人没有意识到的,当一个 ai 智能体在完成任务的时候,他会去调用其他的 ai 去做协助,比如查资料的,比如写代码的,比如 做判断的,这些 ai 之间的服务费用是在实时自动结算的,这是一套完全不需要人参与的经济系统,规模呢会越来越大。第四种呢,就是实物资产向债劵向房产、股 权拆成 token, 放到链上去交易,打破了时间和地域上的限制。这个赛道目前体量已经不小了,而且还在快速扩张。另外呢,我再说一说现在的竞争格局啊,像中国这边, deepsea 做了一件很有意思的事情,就 相对低的研发成本,做出了顶尖水平的模型。然后呢,把价格打到极低,便宜到什么程度呢?同等能力的模型,国内的报价和美国头部公司之间有百倍级的差距,这直接逼着 open ai 跟着调价,但你看价格战打的越来越激烈,谁越开心呢?其实就是因为打,不管哪家模型赢,训练和推力都得用它的芯片。 这个就是卖产值生意的核心逻辑,你不需要压住水银,只要让有人在挖矿就行。而黄仁勋在一次访谈里面也说过一个让我印象深刻的观点,他说如果一个年薪很高的一个工程师,一年下来花在 ai 算力的钱少的可怜,他会觉得这个人没有真正在用 ai 工作, 他衡量的不是你加了多少班,而是你有没有把算力当成生产资料在用。这句话背后的逻辑其实就是英伟达整个产品战略的底层 假设。所以说白了,托管这门生意的本质就是把动脑的这件事情给工业化了。你看一百年前,电力让体力劳动变成了可以被机械替代,被标准化,被大规模复制。 而托管呢,正在对我们的脑力劳动做同样的事情。当这个过程足够成熟, ai 就 不再只是科技公司的工具,而是呢,会渗透进每个需要判断、需要创作、需要分析的行业。那之后呢,也说说我三个我觉得最值得关注的行业。那之后呢,也说说我三个,我觉得从存多少变成每度电产 产生多少有效的 token, 这指标会越来越重要。第二个就是 ai 成为最大买家, token 的 主要消费者未来不是人了,是 ai 智能体机器雇机器,机器付钱给机器, 这规模会远超人类用户。第三个就是非文字内容的 token 化,像图片、像视频、像音频、像传感器数据都在被纳入 ai 的 处理范畴,多模态的 token 消耗帧数比纯文本要快得多,所以这要产业链上每个位置都有人在去压住。问题只有一个,你打算要在哪个位置去赚你想要赚的钱。

这期深度视频目的就一个,让你一口气搞懂为什么说 token 才是中国真正意义上的电力出口。 这条万亿级新兴产业链里,又有哪些核心上市公司值得关注?我会用最通俗的逻辑、最落地的例子,让你彻底吃透 token 这个概念, 以后再不用刷碎片化内容,并助力你在风口来临前站稳脚跟。首先,我们先解答第一个核心问题,为什么说 token 才是中国真正意义上的电力出口?要知道,中国是全球当之无愧的第一发电大国, 二零二五年全年发电量超九万亿度,几乎是美国加欧盟加印度的发电量总和,占全球总发电量的三分之一。 风电、光伏的装机量更是连续多年稳居世界第一。但过去我们一直面临一个尴尬的问题,电太多了,用不完, 西电东输之后仍有大量赋余,又因为电力存储成本居高不下,最终只能用无奈的办法解决。要么降低发电功率,让风机、光伏板停转,要么把电输送给电截铝、冶金这类高耗能产业, 实在没办法,就只能眼睁睁看着发出来的绿电被浪费,也就是常说的气风气光。很多人会问,既然电多到用不完,为什么不直接卖到国外专卖会?不是不想,是真的做不到。 电力无法大量存储,更没法装船运输,就像手里攥着全球最大的金矿,却因为金子太重运不出去,只能堆在自家院子里看着。直到 token 的 出现,彻底改变了这一局面。现在这些富裕的电力终于有了全新的高价值去处, 把电变成算力,再把算力封装成 token, 卖到全世界。而要搞懂这背后的逻辑,首先得说清 token 到底是什么。今年两会,官方已经给 token 定下了中文标准一名词源, 它是 ai 大 模型对自然语言、代码、图像、语音等各类信息进行拆解、理解、运算和生成的基本语义单位,是大模型能识别的最小信息颗粒。 就像用电按度计量,打电话按分钟计量,使用 ai 大 模型写代码、生图、写文案、做问答的所有操作,全都是按 token 计量消耗的。举个例子,当你下一个指令给手机里的豆包写一篇回锅肉的制作教程, 豆包并不会直接读懂整句话的完整意思,而是会先把这句指令拆解成一个个独立的、能被模型识别的最小于一 token。 比如写一篇回锅肉的制作教程, 这些就是豆包能接收和处理的基础信息颗粒。这是大模型处理所有指令的第一步,也是 token 发挥作用的起点。为了完成这个指令,豆包会调动背后的模型数据库和算力 解锁、匹配和回锅肉制作相关的所有核心 token。 比如五花肉焯水、豆瓣酱煸炒、冷水下锅煮至八成熟这类关键信息。这个过程中,每一次解锁、匹配和逻辑运算都是在消耗 token 资源, 就像用电时每一秒都在累计度数,用 ai 的 每一次运算也都在累计 token 数。之后,豆包会把这些零散的 token 按照中文表达、逻辑和烹饪的先后顺序重新组合,最终生成一篇通顺完整的回锅肉教程。 这篇教程拆解后,大概有两百个羽翼 token, 这次指令的完成就计量为消耗了两百个左右的 token。 整个过程从指令拆解、运算、解锁到内容输出,每一个环节都以 token 为核心单位,而最终的 token 消耗总量, 也是衡量 ai 调用算力成本、收取服务费用的核心依据。还是这个例子,我们看看深沉这篇回锅肉教程背后到底调用了哪些资源? 首先会调用大模型沉淀的美食烹饪知识库,调取回锅肉的食材搭配、步骤、火候等信息作为内容基础。而最核心最关键的是算力硬件资源,包括 gpu 运算芯片、 ai 服务器集群等。 你在虚拟世界下达的一个简单指令,在现实中字节跳动部署在张家口的低时延推理集群会立刻运转,完成 token 的 拆解、解锁、匹配和运算,最终把零散的 token 重组为完整教程,几秒内就传回你的手机屏幕。而这一切的底层支撑就是电力。 为 ai 服务的算力硬件是典型的高耗能设备, gpu 高速运转处理 token 服务器集群满负荷运算时会持续消耗大量电力,电力是驱动这些硬件正常工作的唯一动力源。 生成那篇回锅肉教程的短短几秒,背后是算力硬件在电力的持续驱动下完成的一系列高速运算。 算力硬件的高耗能特性,让电力成为了算力调用、 token 处理乃至整个 ai 内容生成最底层的物理支撑。简单说, token 就是 电力的数字压缩包,是中国西北绿电经过 gpu 提炼后输出的最终高价值产品。 电力驱动算力,算力驱动模型,模型用磁元计价,这就是最核心的逻辑。而中国的 token 已经在全球市场站稳了脚跟。 今年二月,全球前十大模型总 token 消耗量超二十八点七万亿,其中中国模型贡献了十四点六九万亿,占比百分之五十一点二,首次超越美国模型。 更关键的是,这部分调用需求中,百分之四十七的用户都来自美国。这意味着,中国 token 的 爆发不只是靠国内市场,更是全球开发者用脚投票的结果。为什么北美、欧洲的程序员纷纷放弃 gpt、 五 cloud、 四点六等硅谷模型?选择中国模型, 核心原因就三个字,性价比。硅谷模型的极致效能虽略胜一筹,但算上成本,中国模型的优势直接拉满 我们的工业电价,还不到欧美国家的五分之一。德国的工业电价折合人民币将近两元每度,而中国大西北的风电、光伏给算力中心的专用电价最低能压到零点一五元每度,这是全球独一档的电价洼地。 在这样的成本优势下,国产模型的定价极具竞争力。 deepseek v 三每百万 token 输出价仅一元, r 一 仅两元, q n 三点五腾 plus 也才两到四元,比硅谷大厂的价格便宜十倍以上。 deepseek 的 api 定价甚至比 openai 便宜近三十倍。最新统计显示, mini max、 kimi、 智普、 g l m、 deepseek 这四家中国大模型,已经占据了全球周度 token 掉用量排行榜前五席中的四席,试战率一度高达百分之六十一。 中国 ai 模型已经从曾经的全球追赶者,在全球价格敏感性市场中逐步掌握定价主动权 这一发展趋势才刚刚起步。英伟达 ceo 黄仁勋早就判断, ai agent 时代的拐点已经到来。未来一个 ai 完成一项任务,消耗的 token 量有望实现现在的十到五十倍增长。 机构更是预测到,二零三零年,中国 ai 推理领域的 token 消耗量有望实现近三百七十倍的增长,这条赛道的未来增长空间具备较大想象空间。搞懂了这些,我们再聊核心, toc 和电力出口到底是什么关系。过去,中国的出口模式围绕原材料工厂、集装箱、货架展开,在产业链中赚取微薄的加工费。 哪怕是出口电动车这类高端制造业,也会面临官税、贸易壁垒,要在码头等待检查,处处受限。但 token 的 出口走的是光鲜。根据 wto 限行规则,电子传输暂时免征官税。没有集装箱,没有货轮,没有报关单, 中国的电力披着数据的外衣,就能大摇大摆进入全球每一个终端。当硅谷的程序员坐在电脑前调用中国大模型的 a p i 数据,会瞬间穿越海底光缆,抵达宁夏、内蒙古的算力中心, 成千上万颗 gpu 开始轰鸣,消耗着中国最便宜的西北绿电。完成逻辑推理后,再把结果一秒钟送回旧金山的屏幕,全程一滴油没动,一根电缆没出镜。但中国电力的价值已经通过 token 完成了跨境交付。 这就是 token 出海的本质。电力换皮出海,把西部戈壁滩上零点一五元一度的风光电输入数据中心的 gpu 集群,封装成可交易的 token, 再通过海底光缆送到全球开发者手中,我们的电力没有出海,但电力的价值实实在在地走出了国门。 而这一切的爆发并非偶然,而是一场完美的全球共需匹配。一边是全球开发者对高性价比 ai 模型的迫切需求,另一边是中国拥有的低成本算力、成熟可用的大模型,以及充足廉价且富裕的电力 供需,两端精准对接,就形成了一个可持续的商业闭环。过去二十年,中国出口的是衣服、家电、手机,后来我们出口光伏板、锂电池、电动车,而现在,中国开始出口算力本身。 当美国程序员调用 api 生成代码,当欧洲创业者用模型训练客服、机器人,它们消耗的每一个 token 背后都是乌兰察布的风、宁夏的阳光,还有中国一套完整的工业体系, 一度电在戈壁滩上仅值几毛钱。当他以 token 的 形式流转至全球市场后,价值实现了大幅提升,展现出相当可观的溢价空间。接下来就是大家最关心的问题, token 出海到底怎么赚钱?谁在这条产业链里受益?这不是一个单点机会,而是一整条产业链的导红利。逻辑清晰且明确, 海外模型调用需求增加,模型厂商盈利提升,加速扩建算力设施,拉动芯片、服务器、 idc 等产业需求,最终形成算力的持续消耗。这是一条从软件端逐步传导至能源端的完整产业链条。整体的变现逻辑可以分为四层, 最前端, api 直接收费。模型公司依靠低成本的推理服务赚调用费,各类 ai 聚合平台赚中间佣金上有硬件、芯片与服务器需求爆发后,行业有望迎来量价齐升的发展趋势。 云厂商数据中心通过出租 gpu 机柜以及提供算力配套电力服务实现盈利。最底层电力与智能调度, 西部绿电资源成为核心支撑,算电携同的智能调度服务更是重中之重。这条产业链主要包含六大环节,各环节的核心代表上市公司梳理如下,都是赛道内的核心玩家模型和聚合环节,智谱 ai、 minimax、 kimi、 月之暗面、 deep sea、 深度求索 算力服务及 i d c 环节,润泽科技、首都在线、红景科技、数据港、奥菲数据、世纪互联。国产算力硬件环节,海光信息、韩五 g 以及华为升腾。产业链中的华丰科技、太家股份。 电力与能源环节,绿电运营商精能能源、西部算力枢纽配套的内蒙华电、近控电力、算电携同智能调度领域的国能日新、南网科技。电网设备环节,中国西电、特变电工许继电器 配套环节,网速科技、深信服、安恒信息。而整个产业链的核心逻辑,能用一句话总结,前端模型厂商的盈利能力,取决于后端算力、电力等基础设施的成本控制能力。 而中国在这条赛道上的核心优势,正是拥有规模化的低价电力资源,以及高效的算力基础设施体系。 人类历史上,每一次大国秩序的重构,皆始于能源形态的革命。大英帝国凭煤炭与蒸汽机颠覆世界格局,美利坚靠石油与内燃机定义全球规则。而今天,中国正以电力与算力的终极融合,在全球 ai 服务贸易竞争中探索新的发展路径。 那些曾因消纳无门被迫弃风气光的西北绿店,正以偷看的形式被重新挖掘价值,迎来新的发展机遇。从前,我们靠汗水换外汇,如今,我们用算法挣外汇,这从不是简单的弯道超车,而是真正的换道超车。 那些真正改变世界的事,往往从不在新闻头条的喧嚣里发生,而是藏在每个普通人的日常里。打开一个对话框,敲下一行字,静静等待回复。 而这简单的互动背后,是内蒙古的风、四川的水、新疆的光。跨越几千公里的传输,在 gpu 中奔腾燃烧,化作一个个 token 飞跃太平洋,最终落在世界各地的屏幕上。那么,投资到底投的是什么?说到底,就是投我们日常生活里的真实变化嘛! 当你用 ai, 我 用 ai, 人人都在用 ai, 就 会读懂一个核心逻辑, ai 的 尽头,拼的是算力,算力的底层,拼的终究是电力。

九点九元买一千万一个视频讲透 token 到底是什么?官方名字叫磁源,说白了就是互联网世界的通用粮票。以前买米的票不能换油,现在一张票能换所有东西。两个最常见例子, ai 的 token, 写文案做 ppt 都要消耗它。一千个 token 约等于六百个汉字,就像坐公交刷卡,用多少扣多少, 能换流量换通话换 ai 算力,用不完还能存到下个人,再也不会有月底流量清零这种糟心事了。黄仁勋都说了, token 就是 新的货币,以后所有互联网服务都会变成 token 模式,用过的评论区扣一,赶紧收藏转发给还听不懂的朋友!

啊,大家好,那么今天呢,我们来探讨一下非常前沿且激动人心的话题啊,就是滔氣出海。 那这不仅仅是一个 ai 圈的新概念啊,同时呢,也更代表了我们中国一种全新的国际化的输出模式啊,想象一下啊, 我们的电力没有离开国门,却已经流过啊,通过无形的数据流服务了全球的开发者,这背后究竟发生了什么啊?然后呢,呃,让我们一起来揭开这个新时代的一个序幕啊。然后呢,这个 本次的啊分享呢,我们主要从六个方面啊,首先呢,我会解释什么是掏粪出汗这新型现象,接着呢,分析他为何能够迅速火爆全球。然后呢,深入探讨中国模型具备价格优势的核心原因。 最后呢啊,我们会关注啊,驱动消耗这个 tucker 消耗的增长的两大的高耗的一个成绩,在此基础上呢,揭示这一模式如何革命性的改变啊,电力的呃,这个价值的传播方式。最后呢啊,客观的分析啊,我们面临挑战和未来啊。 首先呢,我们来定义啊,什么是掏根出海啊,简单来说啊,这是中国首次向啊,将我们的算力, gpu 啊,包括电力大模型的能力打包成一种标准化的数字服务啊,输出给全球的开发者。而这与我们啊熟悉的传统的出口方式呢,截然不同, 过去我们出口的是啊,货物啊,手机啊,汽车了,实体的一个产品。而现在海外开发者只需发送一个 a p r 的 一个请求,就能远程调用我们数据中心的资源,电力核算力在国内呢被消耗啊,最终呢,计算结果啊,返回到用户的手中, 那所以说这种的模式呢,啊,构建了一条全新的啊,价值传导的一个链条,从电力开始呢,经过 g p 的 转化 生成代表服务的 talking 啊,最后呢,在全球市场上的呢,兑换成美美元啊,这意味着我们卖的不再是具体的硬件或软件,而是代码的生成啊,语言的翻译啊,数据的分析等,实实在在的啊,生产力,这是一种看不见啊,高效的一种服务的贸易,它正在 重塑我们全球 ar 基础的设施的格局。那么这个模式呢,为什么突然会爆火呢?答案就在市场的数据里,也把老特尔这个全球知名的 ar 模型聚合平台为例啊,数据显示呢,中国模型呢, top 消耗占比呢,已经超过了百分之六十一, 占据了绝大啊,绝对的主导的一个地位。更近的是呢,平台前十名的热门模型中,一周处理了也是八十七万亿的 top 给 全部来自于中国团队,这说明全球开发者正在用脚投票啊,与他们选择的核心原因只有一个,就是便宜。那我们看一下具体的数字啊,感受一下这种价格优势多惊人一些国内的模型输入成本啊,低至每百万投资呢,零点三美元, 输出呢,也仅为啊一到两美元。而相比之下呢,西方头部的模型输入成本呢,高达五美元,输出呢,更是飙升到二十五美元以上,十倍甚至二十倍的价格啊,对于任何需要大模型啊, 哎呀能力的开发者来说呢,就是无法忽视的哈,这种成倍成的碾压,是中国模型能够迅速占领市场的核心武器啊,那么中国模型凭什么能够 做到如此便宜?这并非偶然,而是整个中国形成一套低成本啊,推理的啊,一个能力的共为体系。这种优势呢,可以归结为三层逻辑,首先呢是我们的能源技术,其次是技术层面的 架构的创新,最后呢,激励的市场竞争环境啊,接下来我们逐一拆解这三方面的优势啊。具体的来看啊,第一层呢,是最基础的是店家优势啊,中国的数据的电费呢,比这个美国低百分之四十左右,那直接影响了我们算力成本的互成和。 第二个呢,技术创新啊,我们的架构呢,更少的是啊,完成了同样的任务,实现了基础的一个成本。第三个也是啊,最现实的就是国内市场的 激烈竞争,厂商也为了抢占用户呢,不惜用低价啊,补贴和共同推荐这个整体的价格。所以除了价格优势,通过消耗的爆发增长,也得益于两大高耗场景的一个绝技。第一个呢, 就是啊,就是 ar 的 这个消耗呢,代码生成的吊射会消耗大。那么一个一个 top 更具潜力的是 ai 进程的工具流, ai 进程不像传统聊天的机器人一文一达,所以它能自主复杂的把这个过程变成 成百上千个模型调用也是指数级的增长,这也是低成本的,算你提供的更大的市场空间。深入了解一下 a 店的工作流程的高耗场景啊,传统的人机交互呢,是一门一达, 只设计一次模型的调用而而定的不同,他接到任务以后呢,像一个聪明的一个助理一样,自己去拆检任务呢,寻找工具啦,包括反复的像模型去提问啊,获得信息与子子任务完成啊,最后整合结果,而这个过程可能设计啊,几十或几百次的模型的调用,所以他 是啊,这个低成本算计的,大显身手的一个舞台。所以涛很出海呢,真正的革命意义呢,在于他彻底改变了电的价值传达方式。 传统模式下呢,电力作为一种资源,被用来生产硬件和产品,而价值通过实体商品的一个实现。而在新模式下呢,电力直接转化为可被消耗的数字 服务,也就是 talking。 这意味着呢,我们的能源优势呢,不再仅仅支撑工业生产,而是直接变成高附加值的一个服务的出口。这也是啊,一个 必须要面子的话题。当然呢,我们也要清楚的认识到,掏粪出汗并非一帆风顺,面临着严峻的一个挑战。首先呢,数据主权问题敏感行业呢,无法出境,限制了市场的空间。其次呢,也是 高端低 p 的 一个出口管制,选在我们 ar 产业上的达摩克里斯之境。最后呢,随着我们影响力的扩大,未来可能面临更多不可限, 这个遇见了政策风险,这是我们需要面对的。那总结一下哈,他会出汗呢,绝不是一个炒作的概念啊,他真实的反映了我们啊,中国呢,也正在将电力算力和模型能力整合成一种全新的啊,全方位的啊输出模式。这种看不见的服务呢,正在 巧兰呢啊,改变全球的 ai 基础设施的一个格局,它标志着一种新的贸易的范式啊,一种新的国家优势,以及一个前所未有的历史机遇啊,店里从未离开国门,但它所创造价值已经流向了全世界啊 啊,另外另外呢,这个分享呢到此结束,也感谢大家聆听。所以说呢,大家有什么需要沟通交流的,我们可以沟通一下啊,也欢迎大家来提问啊,或者是交流,好吧。

托管到底是什么?把它换成数据资产?你马上就明白了。最近你在商业圈子里面是不是常常听到托管、数据资产化、 r w、 a 这些新鲜词,听得云里雾里的,但又感觉跟自己有那么点关系。 这个感觉就对了,今天我就掰开了揉碎,跟你说清楚,这东西到底跟你的生意有什么关系,你该怎么让他帮你挣钱?先别纠结托管是什么这种技术问题。在商业世界里,托管的本质是资产的数字凭证,你只需要记住这一句话就够了。打个最简单的比方,你手里有一套房子,房本上写着你的名字, 这是物理确权。如果现在有一个公认的受法律保护的数字系统,直接在上面给你生成一个凭证,证明这套房子归你, 甚至可以拆分为一百份,卖给一百个人。那这个凭证就叫托管,不是炒币,是把真实的、有价值的资产,用一种标准化、可交易的方式搬到数字世界。你可能会问,这跟我有什么关系?关系大了,你的工厂每天产生的生产数据、积累的客户数据库、 研发的算法模型或者知识产权,这些以前在财务报表上根本不显示价值的东西。二零二六年开始,它正在变成企业里最值钱的资产。 二零二六年是数据要素价值释放年,国家把这件事提到了很高的战略层面,最新数据显示,数字经济核心产业增加值占 gdp 比中呢,已经超过了百分之十点五。这不光是概念, 真金白银已经进来了。国家正在推广数据产权登记制度,二零二六年四月正式发布了数据产权登记工作指引,就是给你手里的数据资产上身份证,有了确权,数据才能真正变成资产。 就在前几天,全国首单纯数据资产 a b s 在 深交所发行成功,基础资产完全只是数据,没有任何传统抵押物,首期规模就融了五点三二亿,全场认购倍数远超一区。这意味着什么? 黄老根那些最聪明的人已经在大军买入数据了。以后再有人问你数据有什么用,你就告诉他们数据现在可以直接去深圳证券交易所发债去。

妈,我又发现一个好东西,你听过 tok 吗?听过,这是热门词,老刷到的,怎么啦?嘿嘿, tok 就是 ai 处理文字内容最小计量单位,中文呢,叫词源。老厉害了哦,理论看的不错,那我问你词句怎么用,怎么落地?这我还没想好。 这么说吧,普通人日常啊,带豆包上的问答压根接触不到的,只有商用或者大批量的使用,才需要象棋批量调用 ar 接口机构的高频数据整理,这样才会统计消耗。说白了啊,就像流量,日常的上网闲聊就是免费通用流量,随便用 剂量的。 oppo 呢,就像专属的定向流量,大批量的高频使用就会核算消耗额度。爸也发现了,没什么用啊。当然有用, oppo 的 底层支撑靠的就是率理和这电力,这两样啊,才是实打实的核心的关键,你呀,还要好好学学的。

你是不是天天听人家说 talking, 以为是什么金融代币或者神秘代码?错了,今天我用一分钟让你彻底搞懂。而且以后聊天绝对能装个大的。来个比方, 爱就像一个玩乐高的三岁小孩,你给他一本红楼梦,他先得把书拆成一个个的小积木块甲宝玉,句号都是单独的积木,这个最小的积木块就叫 tokyo, 你写我喜欢吃火锅, ai 眼里就是四个积木,我喜欢吃火锅。第二件事,这玩意真花钱,你用 ai 的 付费接口, 你说的话算托克,他回答的话也算托克,聊嗨了,一顿饭的钱可能就没了。顺嘴一提啊,一套三体三部曲,大约九十万个托克, ai 读完也就几块钱,比买书便宜多了。 最牛的是托肯,是 ai 的 呼吸。以前的 ai 只能记住两千个托肯,聊着聊着就失忆了。现在的 ai 能记住二十万个,能陪你读完一本小说在细聊 里面的细节。但最有意思的是,人类说话也有托肯的密度。有人废话连篇,托肯多,但信息少,有人三言两语直接要害 a i 在 拼命的对 talk 求智能,而我们人类却可以用有限的 talk 创造无限的可能,这就是我们叹气生物最大的优越感。懂了没?下次聊 a i, 你 就这样跟他说。

最近我的私信已经被问爆了,有人问我说 token 到底是啥?对于 token 它有四层方面的含义,一点,它在 ai 领域,它就是词源,它就是说大模型里面是最小的单位。 在网络安全领域, token 它是一个令牌身份证验证的一个临时身份证,它在区块链领域也有相应的含义,它就是可以说作为一个数字货币一样去做一个交易。 它还有一个领域,就是说网络安全领域,就在于通讯领域呢,它是数据传输的一个权限开关。 对于这四个领域呢,它各有各的各司其职的地方。就像 ai 领域,它是文本处理的一个最小的词源单位。在网络安全领域,它是身份认证和权限控制的一个功能。在区块链领域,它就是一个数字货币, 他在网络通信领域就是说他是数据传输与权限管理的一个代名词,大家听懂了吗?