嗯,上次发视频,小伙伴问我说 talk 是 什么,那 talk 在 ai 里边有几个作用啊?第一个是关于 ai 记忆体的一个上下文,也就是超过了某一个上下文的话,他就不知道你上面发的内容是什么了,他就不再去记忆了。 那还有一个问题呢,是给用户做计费的啊,比如说你要去用什么商业版的一些 ai, 然后需要去买一些 tucker, 那 他是用来计费的。那这个 tucker 呢?简单来讲,像 简单来讲的话,其实就是一个中文的词吧?你这么理解可能更简单一点。那像一千个 talk 的 话,你可以大概理解到。嗯,七百到八百个字左右,差不多就是一千个 talk。
粉丝7获赞921

每一次工业革命,都有一样东西在背后疯狂燃烧。第一次工业革命,蒸汽机来了。蒸汽机本身不值钱, 值钱的是让它跑起来的东西。煤。煤从地里挖出来烧掉,变成蒸汽,蒸汽推动机器、机器生产商品。整个英国的矿山、铁路、钢铁厂,全都围绕着怎么挖更多的煤,怎么运更多的煤来建立起来。煤就是那个时代的核心消耗品。 第二次工业革命,电来了,电本身也看不见摸不着,但他改变了一切。爱迪生建发电厂,特斯拉搞交流电,全世界开始拉电网、发电、输电、配电、用电,一条完整的产业链,养活了成千上亿的人, 创造了通用电器这种巨无霸公司。电就是那个时代的核心消耗品。第三次石油、内燃机、汽车、飞机、塑料化工。整个二十世纪,全球经济都建立在石油上,围绕着石油打了多少仗?中东为什么重要?因为那里有油,石油就是那个时代的核心消耗品。 现在 ai 时代来了,它的核心消耗品是什么呢? token, 你 可能听过这个词,但不太理解。简单说, token 就是 ai 处理信息的最小单位。 你跟 ai 说一句话, ai 会把你的话拆成一个一个的 token, 然后逐个处理,逐个生成回答。每一次你问 ai 一个问题,每一次 ai 给你写一段文字,画一张画,生成一段代码,背后都在消耗 token。 一个中文字大约是一到两个 toc, 你 让 ai 写一篇一千字的文章,大概就是消耗了两千个 toc, 听起来不多,对吧?赶紧把这个数字乘以全球的用户量, chat gpt 每周九亿活跃用户,豆包 kimi 千万, 中国五点一五亿生成式 ai 用户,每个人每天跟 ai 对 话好几轮,每一轮都在烧 toc。 再加上企业端自动驾驶的 ai, 每秒处理海量的传感器数据,全是 token。 金融公司的 ai 交易系统,每毫秒做一次决策也全是 token, ai 写代码, ai 做客服, ai 审核合同, ai 看片子,全都是 token。 英伟达为什么一年赚两千一百多亿美金?因为生成 token 需要 gpu, gpu 就是 token 的 发电机。英伟达卖的每一块芯片,最终都是在帮客户生产更多的 token。 openai 为什么要花六千亿美元建数据中心?因为数据中心就是 token 的 发电厂。越多的人用 ai, 就 需要越多的数据中心,就需要越多的电力,就需要越多的芯片。 google 为什么要签一百五十兆瓦的地热能协议?因为 ai 的 数据中心太吃电了,生产 token 这件事,最终还是要烧真实的能源。所以 token 这条产业链从上到下是这样的, 最底层是能源发电厂,电网、地热核能给数据中心供电。往上一层是芯片,英伟达、 amd 含五 g 造生产 token 的 发动机。 再往上是云计算,亚马逊、微软、阿里云建 token 工厂,把算力租给别人。再往上是大冒险公司 open ai、 ospec、 deepsea、 月之暗面,它们把芯片和算力变成可以使用的 ai 服务。 最上面是应用层, chat、 gbt、 豆包 kimi 各种 ai 工具,它们是 token 加油站,每个用户来一次就烧一次。煤的时代,谁控制了煤矿,谁就是亡。石油时代,谁控制了油田,谁就是亡。电力时代,谁建了发电厂,谁就是亡。 token 时代,谁能更便宜、更高效的生产和分发 token, 谁就是王。这就是为什么英伟达市值全球第一,所有的科技巨头疯了一样的砸七千亿建数据中心。这就是为什么 deepsea 一 出来,全世界都撼动,因为它证明了用更少的算力能生产同样质量的 token, 等于用更少的煤烧出了同样多的蒸汽。但 token 跟煤石油炼里有一个根本区别,就是 煤你能看得见,能称重,一吨多少钱清清楚楚,石油你能闻到?一桶多少美元,全球统一报价。 电你虽然看不见,但电表会转,每个月你都会收到电费单 token 你 看不见,摸不着,闻不到。你跟 ai 聊天的时候,他不知不觉的会在消耗这个东西。每一次对话,每一次生成,背后都有真实的芯片在运转, 真正的电力在燃烧,真实的成本在产生。 openai 去年收入一百三十一亿美元,亏了八十亿。收入从哪儿来?卖 token 亏的钱花在哪了?生产 token 按 so pick 给 cloud 的 定价,按输入 token 和输出 token 分 别收费。 google 的 gmail 三点一 pro, 两百 k 以下的 token 一个价,两百 k 以上的 token 另外一个价。整个 ai 行业的商业模式底层逻辑就是一句话,生产 token, 卖 token。 未来十年, token 的 价格会像电价一样成为一个关键的经济指标。哪个国家的 token 成本更便宜,哪个国家的 ai 产业就更有竞争力。中国为什么拼命搞国产芯片?因为用英伟达的芯片生产 token 太贵了,还随时可能被卡脖子。 deepstack 为什么重要?因为它把每个 token 的 生产成本打了下来。当年煤价涨价,工厂就停工。油价涨了,航空公司就亏钱,电价涨了,铝厂就关门。未来, token 成本涨了, ai 应用就用不起。 token 成本降了, ai 就 能渗透到更多应用场景,替代更多人力,创造更多价值。 我是文思,你每天用 ai 的 时候,可能从来没有想过这些,但从今天开始,你可以换一个视角看 ai。 你 用的每一个 ai 工具,背后都连着一条从能源到芯片到数据中心到大模型的完整产业链。你敲下的每一个字, ai 回复你的每一句话,都在消耗一种你看不见的资源,这种资源就是 token, 它是 ai 时代的煤, ai 时代的石油, ai 时代的电,只不过这一次烧的东西,你看不见。觉得涨知识了,可以转发给你的朋友看看。关注我,每天带你看懂 ai!

一九五六年,美国人发明了集装箱,在那之前,全球贸易的成本一半是装卸费。集装箱一出现,世界变了,货物被标准化,运输成本暴跌,全球贸易爆炸。今天 ai 时代也出现了一个集装箱,它叫 token。 很多老板听到 token 只当技术名词,但如果你是做生意的,你要看到的是,这是一次电力的重新定价。 什么是 token? 简单说就是 ai 处理文字的技能班位。你问一句话,写一段代码,生成一份报告,背后都在消耗 token。 重点在于, token 可以 被计量,被计费、被出口。这就像集装箱,把原本难以交易的智能服务装进标准化容器,从此脑力可以像货物一样卖到全球 来。算一笔账,一度电直接出口大概卖零点五元,炼成铝定大概卖一点五元,翻三倍。如果拿去跑大模型推理呢? 一度电大概能产出五百多万。 tokyo 按国内模型定价算,可以卖到十一元,十一元是直接卖电的二十二倍。如果按 open i 的 价格算,将近四百元, 七百八十五倍。你看到中奖了吗?同样是一度电,换个皮价值差几十倍上百倍。这不是能源生意,这是算力生意,是标准化的脑力出口。更关键的一点,电不能装箱,但 tucker 可以 跨国流动, 不用电网,不用特高压,不用对方国家批准,只要一根网线。印度创业者调用中国 api, 背后是甘肃的风电,青海的光伏在转电没出国,钱出国了,这才是结构性机会。 很多老板问, ai 这么卷,价格都打烂了,还赚什么钱?你要明白一件事,现在的二十二倍,不是天花板,是价格战的结果。美国把价格毛在高位,中国用工程能力把成本打下来。一个负责教育市场,一个负责规模收割,这就是新的全球分工。 真正值得你思考的,不是模型谁更强,而是在这个时代,你是卖店的,还是卖 token 的,是卖原材料还是卖标准化能力。 所有产业都会被 token 重构,教育变成按 token 计费,客服变成按 token 计费,编程变成按 token 子计费,营销、法务、设计、咨询全部变成可计量的智能服务。一旦被计量,就可以规模化, 一旦规模化,就会诞生新的巨头。生意的本质从来没变,谁掌握标准,谁赚溢价,谁只卖原料,谁被压价。 一九五六年,集装箱改变了全球制造业。二零二六年, taco 正在改变全球脑力市场。电力过剩不是问题,算力过剩才是机会。美国把 taco 价格炒上去,中国把 taco 成本打下来,悉数东算的战争才刚刚开始。 如果你是老板,现在真正该问自己的,不是要不要用 ai, 而是你能不能把自己的行业装进 tokyo 里卖。

token 出海是什么意思?我们一起来看一下,先和大家讲一下什么是 token。 token 其实就是 ai 服务的一个计费单位啊, 既然是计费单位哈,我们通俗的来讲,就换成英文单词或者是中文的这个汉字,一个 token 大 概等于零点七五个英文单词,或者约等于一点三五个中文汉字,每个国家都有,每个国家的这个语言和文字是大家是不通的啊,那么最公平 最公开的一个方式呢,就把这个文字呢转换成 token, 比如说你问 ai, 今天天气怎么样啊?这么简单的一句话,那么 实际上呢,会对 ai 来讲哈,它就是变成了若干个 token。 那 么 ai 回答你啊,今天的天气晴啊,这个温度是二十度。回答出来,这个文字呢,也是转换成 token 啊,不管你送哪个国家的这个文字都一样的,都转换成 token。 token 出海这个词听上去好像很高大上,其实是什么意思呢?其实就是让外国人,让鬼佬来用中国的这个 app, 用中国的这个大模型,用中国的 ai 服务,这个就叫 token 出海。 第一啊,我们先说一下模型层啊,什么叫模型层,就是呃大模型层面的啊,然后呃它的体现形式,可能是 app, 也可能是提供这个 api 的 这个接口啊,就直接地卖 token, 也就说直接赚鬼佬的钱,可能是包月包年啊,怎么样的 直接面向鬼佬来提供这个 ai 服务的啊?我列了这五家,一家 mini max, 它是呃港股的龙头啊,全球的。这个钓用量呢,应该是第一,海外的收入就是占比了百分之七十几啊。 第二呢是呃制服 ai 啊,它是面向东南亚和中东比较多一些。第三呢是 kimi, kimi 就是 月字暗面啊,它的这个优势在于它的这个长文本的这个模型啊,在海外还是很受欢迎的,并且它海外的这个收入也超过了国内。 第四个呢是 deepsea 啊,大家很熟悉啊,用,而且只有 open ai 的 大概十分之一左右。第五个是昆仑万维啊,昆仑万维有一个叫天宫大模型,这个海外的这个收入占比也是逐步在提升的, 这是模型层啊,模型的背后是什么呢?是算力啊,就在背后提供算力的啊,比较核心的我列了这三家啊, 第一,宏博股份,它对应的是这家啊, minmax, 它是 minmax 的 这个独家的这个双利提供商,而且呢,在那个美国,呃,有自建这个数据中心啊,打算这个海外做交付。 第二呢是手足在线啊,手足在线对应的是这个智普 ai 啊,是智普 ai 背后的这个算力提供商。第三个润泽科技啊,这个呃是字节的这个核心的这个算力合作伙伴啊,呃,主要主打这个东南亚的算力项目, 还有一些做呃,跨境的这个算力的啊,火烈了这四家,其中网速科技呢,是做全球的这个 c、 d、 n 加速的,并且它也有做这个边缘计算。中北通信主要是呃海外算力和这个跨境网络两个布局啊,服务于这个东南亚和中东的一些模型出。海 利通电子呢,主要是跟英伟达做一个合作哈,然后呢,自己呢,布局这个国内和东南亚的这个算力的这个租赁。回到最开始的这个标题哈,电力加算力 token 出海啊,因为中国的这个电力呢,相对来讲是比较便宜的,那我们的算力呢,是比较厉害的, 所以呢,这个在背后做支持,我们就可以 token 出海。很多人搞不懂 token 出海是什么意思,因为有不少媒体把简单的事情复杂化,显得自己高深莫测,其实 token 出海就是这么简单,我们下期见。

什么是算力?什么是 token? 什么样的企业需要拿算列补贴?什么样的企业需要拿 token 补贴?今天一条视频给你讲清楚。先用一句话来给大家定一个调。算力是 ai 的 基础设施, token 是 ai 的 计量单位,两者完全不是一个维度的概念,但是高度绑定 算法就是 ai 的 发动机和电,它是贷款,是硬件,是集群,它决定了模型能不能训,训的快不快,推理稳不稳。需要算力补贴的呢,是大模型厂商,是算力,匀,是推理集群,他们呢,是偷更的生产者和承载者,他们才需要算力补贴。 而 token 呢,是 ai 处理信息的最小单位。你给 ai 一 段话是输入 token, ai 回你一段话是输出 token。 简单来说,输入是读,输出是写。 哪些企业输入 token 多呢?比如说做文档问答的,做知识库的,做法律研报的,他们读得多,深层的少。这些企业呢,最需要输入方面的 token 的 降价和补贴。 哪些企业输出透坑多呢?比如说做虚拟人问答的,做这个代码生成的,他们问的少,但是输出呢,极长。那这些企业就需要输出透坑方面的降价和补贴。以后你们再碰到这类的 ai 的 项目,别只听他说算力, 你要搞清楚,他到底是产透坑的,是读透坑的,还是写透坑的,这样呢,他的成本结构和商业模式就一目了然了。关注我,用投赠的逻辑看懂各类行业。

一九五六年,美国人发明的集装箱将货物标准化,直接让全球贸易的装卸成本减半,运输成本暴跌,彻底引爆了全球贸易,重塑了全球制造业格局。如今进入 ai 时代,同样诞生了一个类似集装箱的革命性产物 token。 它不仅是一个技术名词,更是一次电力价值的重新定价,对做生意的老板而言,更是不容错过的结构性机遇。简单来说, token 就是 ai 处理文字的技能单位, 无论是提问、写代码,还是生成报告,背后都在消耗 token。 其核心价值在于,它能将原本难以交易的智能服务 装进标准化容器,实现可计量、可计费、可出口,让脑力能像货物一样通过网络卖到全球。这也是它被称为 ai 时代集装箱的核心原因。一组数据足以体现 token 的 巨大价值,一度电直接出口 仅能卖零点五元,链程履定可卖一点五元翻三倍。而用来运行大模型推理,可产出五百多万个 token。 按国内模型定价,这些 token 能卖十一元,是直接卖店的二十二倍。按 openai 的 价格更是接近四百元,是直接卖店的七百八十五倍。 这充分说明,透肯背后不是简单的能源生意,而是高附加值的算力生意,是标准化的脑力出口。透肯的独特优势的在于,它可跨国自由流动,无需依赖电网特高压,也无需对方国家批准,仅凭一根网线就能实现。电未出国, 钱已出国。比如印度创业者调用中国 a p i, 背后依靠的是甘肃的风电,没有跨境收益,却已流入国内。面对 ai 行业的价格战, 很多老板疑惑,还能赚钱吗?实则,当前二十二倍的价值差并非天花板,而是价格战的结果。美国将 token 价格铰定高位,负责教育全球市场。 中国凭借强大的工程能力压低成本,负责规模收割,这已形成新的全球分工。未来, token 将重构所有产业,教育、客服、 编程、营销、法务、设计等领域都将变成按托肯计费的可计量智能服务,一旦实现计量,就能规模化发展,进而催生新的行业。巨头 生意的本质从未改变,掌握标准者赚溢价,只卖原料者被压价。一九五六年,集装箱改变了全球制造业。二零二六年,托肯正改变全球脑力市场。 电力过剩不是问题,算力过剩才是真正的机遇,基数东算的竞争才刚刚起步。对老板而言,当下最该思考的不是要不要用 ai, 而是如何将自己的行业装进 token 里,实现标准化、国际化售卖,抓住这场时代红利。

面试的时候,十个候选员里八个说不清楚 token 到底是啥,今天一分钟给你讲透!很多同学刚开始接触接口验证的时候,都会听到 token 这个概念。其实我们可以用游乐园的手环做类比,你 去游乐园买完票,工作人员给你带个带防伪的手环,之后玩项目只要出示手环就行,不用每次套身份证购票凭证。 token 的 作用和这个手环完全一致,它是服务端生成的一串特殊字符串,作为客户端访问接口的身份凭证, 用户第一次登录验证账号密码通过后就能拿到 token, 后续请求不用反复提交密码,能大幅降低密码泄露的风险。 这里要特别注意, token 本身不具备加密属性,只是身份标识,千万不要把它当成加密工具来使用。那为什么会出现 token 这种验证方案呢?早期的 web 系统大多用 session 做身份验证,服务端要给每个登录用户存一份 session 数据。就像景区把所有游客的身份信息都存在入口的记录本上, 只有一个入口的时候没问题。可如果景区开了十几个入口,每个入口同步游客记录会非常麻烦。 token 就是 为了解决分布式场景的身份验证问题,诞生的 所有身份信息都存在 token 里,由客户端保管,服务端不需要存储用户的状态数据,多服务部署时也不需要做数据同步。当然,它不是 session 的 替代品,如果是内部单节点系统,用 session 反而更易维护。现在行业内最常用的 token 是 j w t 格式 完整的 jwt 分 为头、载客、签名三个部分,中间用点分隔,头部分记录 token 的 类型和签名算法。载客用来存储用户 id、 权限、有效期这类非敏感信息。签名则是服务端用私有密钥对前两部分生成的防伪标识。 这里要提醒大家,这三个部分里的头和载荷都是用 base 六十四编码的,相当于只是把铭文转成了方便传输的格式,没有做加密处理,任何人拿到都能解码看到内容,所以绝对不能在载荷里存密码、身份证号这类敏感信息。 了解了结构之后,我们再看 token 的 生成逻辑。 token 必须由服务端生成,用户第一次提交账号密码时,服务端先较验信息是否正确,确认是合法用户后,会用只有自己知道的私有密钥, 结合用户 id、 权限、有效期等信息,生成完整的 token 再返回给客户端。整个流程就像游乐园售票处核对你的身份证和购票信息无误后,给你发印有专属防伪章的手环,只有园区官方发的手环才有效。 私自打印的手环过不了工作人员的叫宴。大家一定要记住,不要在前端生成 token, 没有服务端密钥签名的 token 没有任何可信度。客户端拿到 token 之后,通常有两种存储方式,要么存在 local storage 里,要么存在 cookie 里。 存在 local storage 时,每次发请求需要手动把 token 放到请求头里,就像你每次玩项目,主动抬手给工作人员看。手环存在 cookie 时,可以配置自动随请求携带,不需要手动处理,但要额外做好 c s r f 攻击防护。 这里要避开一个常见误区,不要把 token 存在前端的普通 g s 变量里,页面刷新或者关闭后,变量会被清空, token 就 丢失了,用户就需要重新登录。 存储完成后,客户端每次向服务端发请求时都要带上 token。 服务端拿到 token 后的校验分为三步,首先把 token 的 头和载鹤用同样的密钥重新生成签名,和传过来的签名比对,确认是自己发的合法 token, 再检查 token 的 有效期有没有过。最后读取载荷里的用户信息,判断有没有当前接口的访问权限。整个过程,服务端不用查任何存储的用户状态,只要叫验通过,就可以直接处理请求,响应速度更快。 千万不要跳过签名校宴,只读取载贺内容,否则很容易收到伪造的非法 token。 所有的 token 都会设置有效期,短的十五到三十分钟,长的最多七天。就像游乐园的手环,通常只有当天有效,过了日期就算防伪没问题,也不能用。 有效期到了之后,常见的处理方式有两种,要么让用户重新登录账号获取新 token, 要么搭配 refresh token 使用。用户不需要输密码,直接用有效期更长的 refresh token 向服务端换一个新的普通 token。 不要把 token 的 有效期设置得太长,一旦 token 泄露,其他人可以用它冒用你的身份操作账号,风险很高。 除了控制有效期,我们还要注意 token 使用过程中的安全问题。 token 传输过程中必须走 http 协议,避免 http 明文传输被中间网络节点劫获。就像你不要在公共场合大声念自己的手环编号,避免被别有用心的人抄下来伪造。 拿到 token 后,不要随便存在公共缓存、第三方云同步目录里,涉及转账、修改密码这类高风险操作时,除了叫验 token, 还要加短信验档者类的二次验证。不要觉得 token 有 签名就绝对安全,只要 token 被别人拿到,就能直接冒充你的身份发起请求,和拿到密码的效果差不多。 最后我们来看 token 的 试用场景。现在 token 的 使用场景非常广,前后端分离的 web 应用、手机 app、 小 程序的接口、身份验证基本都用 token, 第三方开放平台的授权也会用。比如你用微信账号登录其他 app 时,微信就是给第三方 app 发了一个带你的身份信息的 token, 第三方不用拿到你的微信账号密码就能识别你的身份。当然,也不是所有场景都必须用 token, 如果你做的是只有几个用户的内部小系统,用传统的 session 验证实现成本更低,不需要硬套 token 方案。以上就是今天关于什么是 token 的 全部内容。

每天一个 ai 新词汇,今天要学习的是 token, 咱们把 token 直接当成钟点工的一分钟基础工时,一下就全懂了。你约的钟点工单次最多只能上门干四小时,两百四十分钟,这就是大模型的上下文窗口, 单次能处理的总偷肯上线。你打电话跟阿姨说需求,每句话都会拆成一分钟的公示单元,擦客厅玻璃,洗三件衣服,做两人晚饭是有效公示。今天上班气死了,楼下超市打折全是没用的废话单元。废话占的分钟越多,留给阿姨正经干活的时间就越少。 超了两百四十分钟的上限,阿姨要么干不完,要么糊弄事。而且你说需求的时间,阿姨干活的时间都按分钟收费,废话越多,花的冤枉钱越多。我是小白随便说。感兴趣的小伙伴们可以点赞关注进粉丝群,我会分享更多 ai 知识!

token 才是中国真正的电力出口。电卖不出国境线,但 token 可以。 一个想了两年才想通的产业逻辑。先说一个反常识的事实,中国是全球发电量第一的大国,年发电量超过九万亿度,比美国、印度、日本加起来还多。但去查海关数据,电力出口这一项几乎可以忽略不计。不是几乎, 是真的可以忽略。为什么?因为电这玩意没法储存,没法长途运输,高压线,跨个国境都费劲,总不能把三峡大坝的电用充电宝打包发往硅谷吧?所以问题来了,手里攥着全球最大的能源,才能却只能在国境线以内打转,这就像开了个金矿,但金子太重,运不出去,只能自己在院子里堆着玩。 直到 token 这个概念出现,事情才开始变得有意思。一、算力即电力,这是第一层窗户纸。很多人到现在还没想明白,为什么美国人对 ai 芯片那么疯魔?为什么英伟达的市值能飙到三万亿美金? 他们买的不是芯片,是算力,而算力的底层是电力训练。一个大模型耗电量相当于三千个美国家庭一整年的用电总和。 openai 搞 gpt negative four 的 时候,光电费账单就吓死人。马斯克去年公开吐槽过,说 ai 再这么发展下去,美国的电网要先崩为敬。这时候再回头看,中国 有电,有大量的电,有全世界最便宜的工业电价。但问题是,把电卖给谁?直接卖电,电网不联通协议谈不拢,地缘政治一缴获十年都搞不定。 但如果把电变成算力,再把算力变成 token 呢?这就是那层窗户纸电出不了国境,但 token 可以。 token 是 数字的,是计时的,是点一下鼠标就能穿越太平洋的东西。在北京,用一千度电算出来的结果,一秒钟后就能出现在旧金山的屏幕上,没人能拦得住。 二、 token 是 电力的压缩包。理解这个逻辑,需要换个脑子。以前出口商品走的是实物路线,原材料工厂、集装箱、轮船、货架这条路线上,中国卡在中间环节,赚的是辛苦钱, 但 token 走的是另一条路,电力算力、模型输出,订阅付费。在这个链条里,电力是原材料,算力是加工厂, token 是 最终产品。而且这个产品有个逆天特性,边际成本趋近于零。 练一次大模型花掉一千万度电,但产出的 token 可以 无限复制。第一个 token 贵如黄金,第一百万个 token 便宜如尘埃。这种规模效应是传统制造业想都不敢想的。更妙的是, token 的 定价权在谁手里? 在模型厂商手里。 open, 一个 g p t negative four 的 订阅卖二十美金,一个月毛利率超过百分之八十。这百分之八十里面,有一大块是电力的增值。只是增值的方式变了,从卖电变成了卖电的智力成果。中国现在缺的不是电,缺的是把电变成 token 的 炼金术。 三、为什么这事想了两年才想通。说实话,这个逻辑业界琢磨了整整两年,不是笨,是路径依赖。太可怕。 这一代商人被世界工厂的趋势淹入味了,总觉得出口就是集装箱,就是码头,就是报关单。数字产品,那是虚拟经济,是泡沫,是脱石象虚。这种偏见根深蒂固,以至于很多人看不见。一个基本事实,全球贸易的增量百分之七十已经发生在数字领域。另一个障碍是技术迷雾。 token、 大模型、算力、集群、推理、优化,这些词堆在一起,天然巨人千里,但拨开术语的外衣,核心逻辑朴素的很。人类正在从搬运原子转向搬运比特,而比特的搬运成本 是原子的百万分之一。想通这一点,再看中国的能源优势,视角完全不同。内蒙古的风电,四川的水电,新疆的光伏。以前愁的是消纳问题,发出来了用不完气风气光,心疼的要命。现在呢?直接建算力中心,就地转化,变废为宝。 电还是那些电,但出口形态变了,价值链位置变了,利润空间变了,这不是弯道超车,这是换道超车。四、暗战已经开始。美国人不是傻子,他们一边喊 ai 安全,一边卡芯片出口,本质上就是在抢电力,投垦转换链的控制权。 英伟达的 h 一 hundred 为什么禁售?因为那是当前最高效的电力压缩器,没有它,电再便宜,转化效率也上不去。但封锁从来都是双刃剑。中国的应对策略很清晰,堆规模,拼效率,找替代。华为升腾、韩五 g、 海光,国产芯片的生态在艰难爬坡。与此同时,算法层面的优化也在狂飙,用更少的算力,干更多的活。 这场战争的终局是什么?可能是一个新的全球分工。美国掌握顶尖模型和生态,中国掌握底层算力和制造。欧洲在边上打监管牌, 听起来有点悲观,但别忘了,电是硬通货,算力是硬通货,而 token 的 产量最终受制于这两样东西的供给,谁有电,谁就有底气,谁能把电高效的变成 token, 谁就能在新一轮全球化里切到最大的蛋糕。五、普通人的机会在哪里?说点实在的,这个趋势跟普通人有什么关系? 第一,职业选择,电力工程、散热技术、数据中心运维。这些以前被视为传统行业的领域,正在变成 ai 时代的基建核心,懂电又懂算力的人, 未来十年会很抢手。第二,投资视角,别只盯着模型公司看,往上游走,发电集团、电网改造、夜冷设备、国产芯片,这些才是 tok 经济的卖产人。第三,认知升级,理解电力 tok 的 转换逻辑,就能看懂接下来十年的大国博弈和产业变迁。 为什么中东土豪疯狂投资 ai? 因为他们有油,油能发电,电能变 token, token 能换未来这套逻辑放之四海而接准。

ai 里面有一个词叫做 talkin, 你 知道是什么意思吗?其实说白了, talkin 就是 ai 专属的技术单位,也是它计算用量核算费用的标准。你发给 ai 的 内容和 ai 回复你的内容都会被计入 talkin 统计。它不按你提问的次数算, 只看实际的内容篇幅,按照次数来算。重点来了,关于 talkin 来说,记住这一点就够了。 talkin 就是 ai 核算的总用字量,说白了就是你和 ai 的 互动过程中总共用了多少字。关于 talkin, 你 明白了吗?关注我,我们一起学 ai。

ai 消耗的 toc 是 什么意思?简单来说, toc 就是 ai 阅读和处理文字的最小单位,你可以把它想象成乐高积木里的基础零件。 ai 在 理解一段话时,并不会像人类那样直接看整句话,也不会拆解成一个个汉字或单词,而是通过算法把内容切碎成一粒粒 toc。 在英文里,一个 token 可能是一个单词或前缀,而在中文里,它通常是一个汉字或常用词组。因为 ai 本质上是在进行数学运算,它必须把语言信息转换成这些数字零件才能工作。为什么我们要关心这个概念呢?因为 token 既是 ai 的 油耗,也是它的内存。 当你向 ai 提问或者让它写代码时,它消耗的不仅是你看到的字数,还包括了背后转换逻辑产生的 token 总量。 如果你把整个项目的代码库一股脑塞给 ai, 哪怕只问一个小问题, ai 也需要重新扫描并计算所有代码转换后的 token。 这种载重会导致计算成本飙升,也是为什么工具会对超长文本收取双倍费用的底层原因。 基于这种 token 成本,编程工具厂商包装出了一套大家都能听懂的计费逻辑,也就是使用次数。在主流的 ai 编程工具中,使用次数通常分为两类, 第一类是自动补全次数,就是你写代码时跟随光标出现的灰色提示。因为这类补全消耗的 token 极少,所以专业版通常会提供无限次使用,让你在写代码时完全没有心理负担。 第二类是高级对话或 agent 请求次数。当你要求 ai 解释复杂报错、重构整个模块或者跨文件改代码时, ai 会动用最聪明的模型,这会瞬间消耗大量的 token。 为了不亏本,厂商会限制这种高级请求的次数,比如一个月给你五百次快速响应机会。 一旦你在单次提问中塞入的代码超过了规定的 token 上限,哪怕你只提问了一次,系统也可能会扣除你两次请求额度。 所以,理解 token 和次数的关系,能帮你省钱省力。简单的小修小补,可以放心交给不限次数的自动补全,而要把宝贵的高级对话次数留给真正复杂的难题, 同时养成及时开启新对话的习惯。可以清空累积的 token 缓存,让 ai 的 思维更敏捷,也避免因为上下文太长而白白浪费额度。

今天聊个 ai 学习中避不开的概念 token, 它被形象的比喻为 ai 的 思维碎片,是 ai 处理文本时的最小单位,也是计量单位。但以我最直观的感受, token 就是 我们花钱购买 ai 服务的货品单位。 当你使用 ai 问答服务或功能丰富的 agent 时,每一次交互都在消耗 token。 token 背后是 ai 的 思考过程,可以说是算力的具象化体现。 ai 为了达成你的目的,消耗多少算力 token 就是 那把良尺。 这背后其实是一种商业逻辑。各大模型厂商开发出强大模型,消费者通过 ai 软件、网页端、 agent 等工具,直接或间接的为模型消耗了 tock 付费。虽然目前大多数人用的还是免费版本, 但如果你想通过 ai 赚钱或经营相关业务, tock 支出就是绕不开的成本,这或许也是未来的常态。 具体消耗情况如何呢?我通过 opencode 绑定的 deepsafe 最新模型做了个小测试,问了五六条常规问题,顺便调用了一些本地数据, 总共调用了六十四次 deepsafe api, 消耗了约一百三十万 token 花费零点五元。如果是调用 agent 运行复杂工具,消耗会成倍增加。重度使用者每月花费几百甚至上千元都很常见。 不同厂商的大模型价格和性能各不相同,有的按套餐收费,类似会员制,但更多的还是基于 token 的 实际消耗量来系费。如果有性价比不错的,我会推荐给大家。目前我用的还是 deepseek。

一句话回答, token 到底是什么?今天用工程逻辑一秒讲透 ai 核心 token 就是 ai 能识别的最小单位,就像钢结构里不能再拆分的硫酸与基础零件, ai 不 认识整句文字,必须先切成 token 才能读懂计算执行指令。看好了,这就是核心! ai 的 运算计费速度全部由 token 决定,它就是 ai 的 基本单位。 现在你懂了吗? token 就是 ai 的 最小单元。关注我,用工程思维看懂 ai!

常常听到 tokken, tokken, tokken 到底是什么东西? tokken 就是 数字世界的通用票证,积分权益通行证,就像现实里的电影票、会员卡、游戏币、股权代金券,全部打包成一个数字凭证,就叫做 tokken。 那么 tok 它值钱吗?嗯,有的非常值钱,有的一文不值。好的 tok 就 像比特币,一大包能值很多钱,垃圾的 tok 就 像空隙币,骗局币,一文不值,就像有的股票值钱,有的股票是骗局。 怎么样才能获得 tok? 方法一,注册全球正规的平台,实名认证,用美元、广币等合法的购买 tok, 放到钱包里面,这是最主流最稳妥的方法。 方法二,平台签到,看视频,答题分享,完成简单的任务,平台送你都肯不花钱白拿,很多 ai 平台,区块链都是这样送的。 方法三,玩炼油打怪,升级赚奖励,平台送你都肯当做报酬,未来越来越多这样的模式。方法四,新项目为了推广, 只要你注册关注啊,参与测试,直接送你托肯,托肯又能兑换什么呢?换其他的托肯,换平台的会员软件, ai 服务, 换数字商品、虚拟资产,正规平台可以换回法定的货币,未来能换实物服务权益,一句话,数字世界的硬通货。那么最近托肯他火在哪个点呢? ai 的 大爆发, ai 服务都用托肯来付费计量, 区块链、落地、游戏、社交内容都用 tok, 大家意识到未来的积分、权益、身份全是 tok, 这不是炒必火,是应用真的来了。未来 tok 会走向每个人的生活,你的积分、会员卡、门票都会变成 tok, 你 发的视频,做的任务、贡献的收益、赚的钱都是 tok。 你 用 ai 买服务、消费都是用 tok 支付。你的数字身份、数字资产都靠 tok 证明 一句话,它本质是为了数字世界的钱,身份证、股权、名票。

talken 出海真正的机会,结论先行就是北美电力,那最近 talken 出海话题比较火,所以说呢,就跟大家讲一下这个什么是 talken 出海,以及背后是电力的这个核心逻辑到底是什么? 在套根出海之前呢,我们要去讲一下这个过去一个工业商品啊,它在全球范围内流动的一个过程,是吧?就比如说我们过去讲 made in china 啊,有一个这个东西啊,它在中国制造了,说那制造的时候呢,它会有背后的要工业用电啊,它背后呢会有中国的一些原材料,以及会有些其他的一些这个乱七八糟这个东西,生产这个商品, 生产这个商品之后的话呢,然后呢它就会这个用运输把它运输到国外,是吧?那运输的过程呢?还得有这个船呐、飞机啊等等乱七八糟这个东西运到海外 是吧?那海外的话呢?还有这个销售环节,有些东西还有海外的这个二次包装啊,甚至呢很多有些东西呢,它可能不是最终的工业品,它可能还有海外的这个二次加工,是 吧?等等等等,然后呢最后再把这个东西变成一个成熟的商品,然后呢卖给了这个老外啊,然后呢老外呢再把钱啊给打回来,是吧?这个是过去传统的一个这个 made in china 啊,这个一个商业模式是吧?那什么叫 talking 出海呢? talking 出海其实 其实非常简单啊,比如说一个老外,他用豆包是吧?他提了一个需求,让豆包帮他去做一段视频,生成一段文字等等,他把这个需求的话呢,就提给了这个国内啊,就通过网络直接传回来了, 假设豆包,是吧?然后呢经过一系列的这个计算,那背后的话呢,可能需要这个国产的这个算力啊,然后呢这个以及需要的各种的这个电力啊,以及其他的各种各种的这个零部件的一些东西, 然后呢进行了一顿计算啊,算完之后的话呢,他会生成个结果,可能是一段视频,一段文字啊,然后呢就直接给了这个老外,是吧?首先呢中间这个传输环节呢,他只用一根这个网线就够了,跟过去的这个传运的话呢,这个成本就完全不同。 然后呢在境外的话呢,他其实也没有什么销售环节,没有什么包装环节,也没有什么二次加工环节,所有的这个生产可以说基本上是百分之百是在境内完成的,以前的话呢,在境内可能也就完成一个百分之六十到七十左右吧,啊,就大概是这么一个情况, 这个时候呢其实就说明了在这个境内,然后呢把这个做通过大模型去做计算,是吧?你的整一个的这个供给啊就出海了,就是它是供给全球的。是那这个时候的话呢,所有的相关的上游的算力啊,电力啊只用在本地发生就行了, 就真正利好是什么呢?就在全球范围内来说的话,利好就是有有本地计算能力以及有本地大模型的这个国家,那一个就是中国,那另外一个的话呢,就是只有美国了。我们现在其实真正机会为什么是电力呢 啊?因为以前的电力的话呢,他是生产一个东西,然后呢把这个东西运到国外去等等,他很多时候的电力消耗是要在海外发生的。那现在整个 ai 的 百分之百的这个计算过程啊,或者说百分之九十九的这个过程,是吧?他其实都是在这个境内去消耗电力的,那我们就可以看一下啊,这个中美的一个电力的这个差别。 中国的话呢,大家也知道是一个这个工业大国,所以说中国的整个工业用电量的话呢,他是一个就建设的是非常超前的。中国大概在二零二五年,一年的话呢,大概工业用电大概是七亿度电,是吧?居民大概是三亿度, 总共的话呢,大概是十亿度电的一个一个规模,是吧?那我们现在讲的是美国啊,这美国的工业用电才多少?美国的工业用电大概才五千到一亿度电啊,因为美国就不是一个工业大国。 那大家也知道现在现在全世界是吧?这个大模型能力最强的啊,就是这个肯定就是美国我们讲的 tokken 出海,不仅是中国的 tokken 出海,我觉得更重要其实是美国的 tokken 出海,那就说美国未来在 ai 时代,我们所有的大模型,大模型背后生产了很多很多东西,是吧?以后会有个单词叫 made in usa, 到二零三零年整一个 ai, 这个电力需求大概是多少呢?就目前的预估啊,目前预估大概起码大概就是一个五千到一亿度电的一个新增的这个需求,是吧?那美国现在大概也就五千到一亿度的工业用电,那就说在未来的这个几年过程当中,是吧?美国的整一个工业用电的规模,是 吧?那如果比如说把五千到一亿度电了,是吧?那你再额外的去增加这个五千到一亿度电,是吧?其实你整一个增量,其实没有说这么的,这个没有说这么的夸张, 是吧?但是五千到一亿度电,中国五千到一度,美国五千到一度,所以说对于未来的整一个的这个电力的这个建设,在未来几年的这个速度是非常非常快的,是吧?因为中国的七亿度电也不是一年、两年、几年之内完成,它是过去这个二三十年整个工业化的这个过程慢慢慢慢积累起来的,就是未来的这个结论就是 talk 出海,就是中国和美国的整一个大模型,以及大模型背后的这个所有的一些零部件,包括算力的零部件,包括电力的各种电力设备等等等等,它供应的是全球, 而且不用把这些电力的这个设备啊放到什么?这个就是放到终端的用户那边去,可能是一个非洲人啊,可能是一个欧洲人,是吧?也可能是一个东南亚的这个人,甚至是比说小日子的人,是吧?所有他们对于 ai 的 需求要么就给到中国,要么就给到美国,然后呢?背后所有的这个电力计算啊,这个所有等等等等都在中美发生就行了。 说中国和美国的整一个的这个算力供应链和背后的整个强大的电力供应链,是吧?整个的这个天花板啊,是在在这个 tucker 出海这个逻辑下是在不断被提高的,是吧?因为过去我们认为中国的电力,中国的模型供中国,美国的模型供美国是吧?现在是中美要供全球啊,就说整个天花板是提高的, 所以说呢,这个也背后也代表了整一个在未来一段时间电力的这个投资的这个持续性会更强。而且电力投资呢,还有一个问题,你因为是要去满足未来几年的规划的,所以说很多时候电力在做规划的时候呢,基本上我现在要去做的这个电力的一些规划,它是按照未来几年那个规划提前去布局的。 就比如说我现在建的这个发电厂啊,我是按照未来五年的整一个的这个算力中心去规划的,是吧?就说其实电力建设是领先于整一个的这个这个 ai 的 这个发展的啊,所以呢,就是这个整个五千到一亿度电,它其实真正建设就在未来一年到两年建设就完成了。那美国呢?这个电力建设主要靠什么?主要就是靠燃气轮机, 为什么呢?因为美国天然气便宜啊,美国的这个液燃气的这个很多成本也很低,说美国的主要就是用燃气轮机,是吧?那中国的话呢,其实主要呢就是一个呢是用这个煤电改造,另外的话呢,其实就是用风光储物啊,用风光啊, 然后呢通过特高压的电网电网,然后呢运运过来,甚至现在很多中国的一些算力中心叫西数东算,是吧?其实也就是把这个很多算力中心放到西部离风光这个更近的地方去做这个计算。相对来说的话呢,这个燃气轮机的这个增量未来的天花板会更高。 燃气轮机的话呢,其实整一个全球其实就就这么几家,是吧?就大的话其实就西门子。然后呢美国的这个机翼啊,就是通用电器,是吧?然后呢还有这个小儿子,这个三菱,是吧?其实就在三家龙头。然后呢现在的话呢,这个很多的中国公司啊,他其实也开始慢慢慢慢,然后呢去抢这些公司的这个市场了。 或者说是有些有些中国公司是西门子或者说通用的这个零部件供应商啊,比如说中国有些 a 股上市公司,他是做这个燃气轮机的这个叶片的啊,因为燃气轮机需要这个高温高压,是吧?它这个叶片不能够说是一下子就断掉了。 然后呢这个有些中国公司的话呢,这个就开始自己去切入,有些是做零部件的啊等等等等。所以说这种公司的话呢,我觉得在未来几年这个增长的这个增速啊,首先这个非常确定,然后呢增速也非常高,其实 talk 出来我觉得真正机会应该还是看在店里的。

豆包豆包, token 是 什么呢?麻烦用写周报的这个例子帮我用大白话简单地说明一下, token 就是 养龙虾的饲料,按字数收费。比如用 openclaw 写周报,你把五封共八百字的邮件给他,邮件内容,你的指令写三百字,周报还有 ai 生成的回复都会被拆成 token, 加起来就是这次用的饲料量,用完就得花钱买新的 token。 怎么计费呢? token 计费就像手机流量,按使用量来,输入和输出价格不一样,输出通常更贵。比如普通模型每千个 token 几分钱,高级模型可能贵几十倍。 这么说还有一字千金的模型喽?有啊, openai 的 o e pro 模型输出一百万, token 要六百美元,按中文算差不多一个字四毛钱,真一字千金。哇哦, 还有一个问题,中文和英文的计算方法一样吗?不一样,中文通常一个汉字算一个 token, 而英文单词会拆成多个 token, 比如 apple 可能算一个, unhappiness 可能拆成三个。那中文呢? 中文一般一个汉字就是一个 token, 标点符号通常也算一个 token。 所以 一段中文文本的 token 数和字数差不多。 有没有什么技巧可以节省 token? 当然有,最主要的就是精简提示词。比如把你是一个经验丰富的咨询师,帮我总结下销售数据,改成咨询师总结二零二三年上半年销售波动原因,这样能省不少 token。 还有就是控制输出长度,比如让 ai 写周报时,直接说最多三百字,别让它写太长。另外,处理文件时,先自己摘重点再给 ai, 有 问题记得问豆包哦!