全球大模型 token 消耗量疯狂暴增,很多平台调用量直接翻倍。很多人还不知道 token 就是 ai 的 真实应变量,它暴增就意味着一件事,推理算力彻底供不应求。 这不是炒概念,是真需求、真订单、真现金流,谁能吃下这块最大的蛋糕?真正的行业龙头,手握机柜、机房电力,相当于 ai 时代的核心地产, 谁用算力都得先找它们。第二类,服务器与硬件龙头。国产 g p u 高性能服务器、高速网络是 ai 跑起来的硬底盘,订单最扎实。 第三类,云服务商与算力调度龙头,帮企业把算利用好,成本降下来,是商业化落地的关键,业绩兑现最快。一句话总结, token 爆量等于算力刚需爆发,不是短期情绪,是 ai 商业化真正开始跑通。抓住这几条主线,你就抓住了今年科技赛道最硬的逻辑。
粉丝2565获赞9151

每天一个 ai 新词汇,今天要学习的是 token, 咱们把 token 直接当成钟点工的一分钟基础工时,一下就全懂了。你约的钟点工单次最多只能上门干四小时,两百四十分钟,这就是大模型的上下文窗口, 单次能处理的总偷肯上线。你打电话跟阿姨说需求,每句话都会拆成一分钟的公示单元,擦客厅玻璃,洗三件衣服,做两人晚饭是有效公示。今天上班气死了,楼下超市打折全是没用的废话单元。废话占的分钟越多,留给阿姨正经干活的时间就越少。 超了两百四十分钟的上限,阿姨要么干不完,要么糊弄事。而且你说需求的时间,阿姨干活的时间都按分钟收费,废话越多,花的冤枉钱越多。我是小白随便说。感兴趣的小伙伴们可以点赞关注进粉丝群,我会分享更多 ai 知识!

token 出海是什么意思?我们一起来看一下,先和大家讲一下什么是 token。 token 其实就是 ai 服务的一个计费单位啊, 既然是计费单位哈,我们通俗的来讲,就换成英文单词或者是中文的这个汉字,一个 token 大 概等于零点七五个英文单词,或者约等于一点三五个中文汉字,每个国家都有,每个国家的这个语言和文字是大家是不通的啊,那么最公平 最公开的一个方式呢,就把这个文字呢转换成 token, 比如说你问 ai, 今天天气怎么样啊?这么简单的一句话,那么 实际上呢,会对 ai 来讲哈,它就是变成了若干个 token。 那 么 ai 回答你啊,今天的天气晴啊,这个温度是二十度。回答出来,这个文字呢,也是转换成 token 啊,不管你送哪个国家的这个文字都一样的,都转换成 token。 token 出海这个词听上去好像很高大上,其实是什么意思呢?其实就是让外国人,让鬼佬来用中国的这个 app, 用中国的这个大模型,用中国的 ai 服务,这个就叫 token 出海。 第一啊,我们先说一下模型层啊,什么叫模型层,就是呃大模型层面的啊,然后呃它的体现形式,可能是 app, 也可能是提供这个 api 的 这个接口啊,就直接地卖 token, 也就说直接赚鬼佬的钱,可能是包月包年啊,怎么样的 直接面向鬼佬来提供这个 ai 服务的啊?我列了这五家,一家 mini max, 它是呃港股的龙头啊,全球的。这个钓用量呢,应该是第一,海外的收入就是占比了百分之七十几啊。 第二呢是呃制服 ai 啊,它是面向东南亚和中东比较多一些。第三呢是 kimi, kimi 就是 月字暗面啊,它的这个优势在于它的这个长文本的这个模型啊,在海外还是很受欢迎的,并且它海外的这个收入也超过了国内。 第四个呢是 deepsea 啊,大家很熟悉啊,用,而且只有 open ai 的 大概十分之一左右。第五个是昆仑万维啊,昆仑万维有一个叫天宫大模型,这个海外的这个收入占比也是逐步在提升的, 这是模型层啊,模型的背后是什么呢?是算力啊,就在背后提供算力的啊,比较核心的我列了这三家啊, 第一,宏博股份,它对应的是这家啊, minmax, 它是 minmax 的 这个独家的这个双利提供商,而且呢,在那个美国,呃,有自建这个数据中心啊,打算这个海外做交付。 第二呢是手足在线啊,手足在线对应的是这个智普 ai 啊,是智普 ai 背后的这个算力提供商。第三个润泽科技啊,这个呃是字节的这个核心的这个算力合作伙伴啊,呃,主要主打这个东南亚的算力项目, 还有一些做呃,跨境的这个算力的啊,火烈了这四家,其中网速科技呢,是做全球的这个 c、 d、 n 加速的,并且它也有做这个边缘计算。中北通信主要是呃海外算力和这个跨境网络两个布局啊,服务于这个东南亚和中东的一些模型出。海 利通电子呢,主要是跟英伟达做一个合作哈,然后呢,自己呢,布局这个国内和东南亚的这个算力的这个租赁。回到最开始的这个标题哈,电力加算力 token 出海啊,因为中国的这个电力呢,相对来讲是比较便宜的,那我们的算力呢,是比较厉害的, 所以呢,这个在背后做支持,我们就可以 token 出海。很多人搞不懂 token 出海是什么意思,因为有不少媒体把简单的事情复杂化,显得自己高深莫测,其实 token 出海就是这么简单,我们下期见。

ai 消耗的 toc 是 什么意思?简单来说, toc 就是 ai 阅读和处理文字的最小单位,你可以把它想象成乐高积木里的基础零件。 ai 在 理解一段话时,并不会像人类那样直接看整句话,也不会拆解成一个个汉字或单词,而是通过算法把内容切碎成一粒粒 toc。 在英文里,一个 token 可能是一个单词或前缀,而在中文里,它通常是一个汉字或常用词组。因为 ai 本质上是在进行数学运算,它必须把语言信息转换成这些数字零件才能工作。为什么我们要关心这个概念呢?因为 token 既是 ai 的 油耗,也是它的内存。 当你向 ai 提问或者让它写代码时,它消耗的不仅是你看到的字数,还包括了背后转换逻辑产生的 token 总量。 如果你把整个项目的代码库一股脑塞给 ai, 哪怕只问一个小问题, ai 也需要重新扫描并计算所有代码转换后的 token。 这种载重会导致计算成本飙升,也是为什么工具会对超长文本收取双倍费用的底层原因。 基于这种 token 成本,编程工具厂商包装出了一套大家都能听懂的计费逻辑,也就是使用次数。在主流的 ai 编程工具中,使用次数通常分为两类, 第一类是自动补全次数,就是你写代码时跟随光标出现的灰色提示。因为这类补全消耗的 token 极少,所以专业版通常会提供无限次使用,让你在写代码时完全没有心理负担。 第二类是高级对话或 agent 请求次数。当你要求 ai 解释复杂报错、重构整个模块或者跨文件改代码时, ai 会动用最聪明的模型,这会瞬间消耗大量的 token。 为了不亏本,厂商会限制这种高级请求的次数,比如一个月给你五百次快速响应机会。 一旦你在单次提问中塞入的代码超过了规定的 token 上限,哪怕你只提问了一次,系统也可能会扣除你两次请求额度。 所以,理解 token 和次数的关系,能帮你省钱省力。简单的小修小补,可以放心交给不限次数的自动补全,而要把宝贵的高级对话次数留给真正复杂的难题, 同时养成及时开启新对话的习惯。可以清空累积的 token 缓存,让 ai 的 思维更敏捷,也避免因为上下文太长而白白浪费额度。

面试的时候,十个候选员里八个说不清楚 token 到底是啥,今天一分钟给你讲透!很多同学刚开始接触接口验证的时候,都会听到 token 这个概念。其实我们可以用游乐园的手环做类比,你 去游乐园买完票,工作人员给你带个带防伪的手环,之后玩项目只要出示手环就行,不用每次套身份证购票凭证。 token 的 作用和这个手环完全一致,它是服务端生成的一串特殊字符串,作为客户端访问接口的身份凭证, 用户第一次登录验证账号密码通过后就能拿到 token, 后续请求不用反复提交密码,能大幅降低密码泄露的风险。 这里要特别注意, token 本身不具备加密属性,只是身份标识,千万不要把它当成加密工具来使用。那为什么会出现 token 这种验证方案呢?早期的 web 系统大多用 session 做身份验证,服务端要给每个登录用户存一份 session 数据。就像景区把所有游客的身份信息都存在入口的记录本上, 只有一个入口的时候没问题。可如果景区开了十几个入口,每个入口同步游客记录会非常麻烦。 token 就是 为了解决分布式场景的身份验证问题,诞生的 所有身份信息都存在 token 里,由客户端保管,服务端不需要存储用户的状态数据,多服务部署时也不需要做数据同步。当然,它不是 session 的 替代品,如果是内部单节点系统,用 session 反而更易维护。现在行业内最常用的 token 是 j w t 格式 完整的 jwt 分 为头、载客、签名三个部分,中间用点分隔,头部分记录 token 的 类型和签名算法。载客用来存储用户 id、 权限、有效期这类非敏感信息。签名则是服务端用私有密钥对前两部分生成的防伪标识。 这里要提醒大家,这三个部分里的头和载荷都是用 base 六十四编码的,相当于只是把铭文转成了方便传输的格式,没有做加密处理,任何人拿到都能解码看到内容,所以绝对不能在载荷里存密码、身份证号这类敏感信息。 了解了结构之后,我们再看 token 的 生成逻辑。 token 必须由服务端生成,用户第一次提交账号密码时,服务端先较验信息是否正确,确认是合法用户后,会用只有自己知道的私有密钥, 结合用户 id、 权限、有效期等信息,生成完整的 token 再返回给客户端。整个流程就像游乐园售票处核对你的身份证和购票信息无误后,给你发印有专属防伪章的手环,只有园区官方发的手环才有效。 私自打印的手环过不了工作人员的叫宴。大家一定要记住,不要在前端生成 token, 没有服务端密钥签名的 token 没有任何可信度。客户端拿到 token 之后,通常有两种存储方式,要么存在 local storage 里,要么存在 cookie 里。 存在 local storage 时,每次发请求需要手动把 token 放到请求头里,就像你每次玩项目,主动抬手给工作人员看。手环存在 cookie 时,可以配置自动随请求携带,不需要手动处理,但要额外做好 c s r f 攻击防护。 这里要避开一个常见误区,不要把 token 存在前端的普通 g s 变量里,页面刷新或者关闭后,变量会被清空, token 就 丢失了,用户就需要重新登录。 存储完成后,客户端每次向服务端发请求时都要带上 token。 服务端拿到 token 后的校验分为三步,首先把 token 的 头和载鹤用同样的密钥重新生成签名,和传过来的签名比对,确认是自己发的合法 token, 再检查 token 的 有效期有没有过。最后读取载荷里的用户信息,判断有没有当前接口的访问权限。整个过程,服务端不用查任何存储的用户状态,只要叫验通过,就可以直接处理请求,响应速度更快。 千万不要跳过签名校宴,只读取载贺内容,否则很容易收到伪造的非法 token。 所有的 token 都会设置有效期,短的十五到三十分钟,长的最多七天。就像游乐园的手环,通常只有当天有效,过了日期就算防伪没问题,也不能用。 有效期到了之后,常见的处理方式有两种,要么让用户重新登录账号获取新 token, 要么搭配 refresh token 使用。用户不需要输密码,直接用有效期更长的 refresh token 向服务端换一个新的普通 token。 不要把 token 的 有效期设置得太长,一旦 token 泄露,其他人可以用它冒用你的身份操作账号,风险很高。 除了控制有效期,我们还要注意 token 使用过程中的安全问题。 token 传输过程中必须走 http 协议,避免 http 明文传输被中间网络节点劫获。就像你不要在公共场合大声念自己的手环编号,避免被别有用心的人抄下来伪造。 拿到 token 后,不要随便存在公共缓存、第三方云同步目录里,涉及转账、修改密码这类高风险操作时,除了叫验 token, 还要加短信验档者类的二次验证。不要觉得 token 有 签名就绝对安全,只要 token 被别人拿到,就能直接冒充你的身份发起请求,和拿到密码的效果差不多。 最后我们来看 token 的 试用场景。现在 token 的 使用场景非常广,前后端分离的 web 应用、手机 app、 小 程序的接口、身份验证基本都用 token, 第三方开放平台的授权也会用。比如你用微信账号登录其他 app 时,微信就是给第三方 app 发了一个带你的身份信息的 token, 第三方不用拿到你的微信账号密码就能识别你的身份。当然,也不是所有场景都必须用 token, 如果你做的是只有几个用户的内部小系统,用传统的 session 验证实现成本更低,不需要硬套 token 方案。以上就是今天关于什么是 token 的 全部内容。

当你不小心拥有了一个 open class, 但你总感觉它傻傻的,不好用于事。聪明的你钻研了一番后,明白了,小龙虾只是这个智能体的一双手,大模型才是它的大脑,决定了它是否聪明,而 skills 是 它的工作技能,决定了它是否有能力处理各种任务。 而大家总提到了 token, 就是 智能体的能量。使用智能体需要让大脑运转并调动小龙虾的双手并使用技能, 所以会消耗 token。 这也是为什么我们需要向大模型厂商付费。然后聪明你开始尝试使用不同的国内大模型来给智能体安装不同的大脑。这个时候你发现了接入了 cloud code 的 时候,这个智能体他是最聪明的,任务的完成质量最高,但是费用也最高。 然后你又发现接入了国产模型的时候呢,他也能完成很多任务,花销也很划算。于是不想当冤大头的你,想着好像可以让不同的小龙虾安装不同的大模型, 简单的一些工作,比如每日发送日报,这种工作就可以直接交给接通了国内大模型的小龙虾去做,赶紧去这么做吧。然后聪明的你为了让小龙虾能更快更好的完成任务,打算教给他各种 skills, 也就是技能。于是你在 skills 后面加上了 s h, 发现这里有七万多个 skills, 你 又了解到 open club 官方 skills 也有一万多个。不要慌,我已经给非技术背景的你准备好了十个基础 skills 和五十个进阶 skills, 咱们放心使用。这个时候呢,不想当月大头的你,感觉还是有方法能降低 token 的 成本?没错,这里我给你准备了三个方法,让你的 token 花费能降低十倍。一是多使用订阅而非 api 的 用量模式。 二是建立本地的 markdown 知识库, opencloud, 每次读取的时候只读取锁瘾。三是部署一个小模型来在本地跑。 opencloud 的 心跳模式,就是那个让你们感觉小龙虾火起来的关键机制,实际上是小龙虾内置了一个每过一段唤醒自己一次完成任务的机制。 除了以上三个方法呢,你还可以给你的小龙虾建立体检机制,及时的找到那些高消耗的任务并及时优化。别慌啊,以上方法听起来有点复杂,我已经帮聪明的你把上述方法的详细的文字版也整理好了。我是拉菲儿,这是 openclaw 实战系列的第二期,后面会有更多实操,咱们下次见。

在我了解了这个通会是怎么被消耗的这件事之后啊,我最大的直觉是,我觉得未来的程序员很可能会两极分化, 分为有钱的程序员和没钱的程序员,分为富程序员、穷程序员。你想啊,有钱的程序员,他能够使用最先进的工具,使用最先进的模型,然后去创造出更好的产品, 然后去赚更多的钱。而没钱的程序员,他分为两类人,一类呢是打工人,他使用的是公司提供的免费 ai 工具,一般都不咋地。第二类是创业者,他需要是自负盈亏,如果他的商业模式跑起来了,他就是一个有钱的程序员, 如果他的商业模式没跑起来,那么他需要承担 ai 编程的高额费用,很有可能会入不敷出。 因为 ai 编程和我们平时使用拆一批聊天不太一样啊。一百万头肯,如果你聊天的话,你可以聊个几百次,能用很长时间,但是你 ai 编程,你让 ai 去分析一个功能模块,就有可能会消耗几千到几万头肯, 如果你让 ai 去分析一个完整的项目,全量代码几十万,上百万投坑代码还没开始写,几十块钱就没了,玩不起。我希望我这个直觉是错的,你觉得呢?说说你的看法。

o p k l 彻底火了,喂龙虾的 token 到底是什么?今天一句话给你讲明白,它不是虚拟货币,而是咱们中国 ai 算力出口的新方式。简单说, token 就是 ai 的 计量单位,咱用 ai 聊天写文案都是在消耗的。 大家说的喂龙虾,其实就是用 token 训练 ai, 让他按照咱的想法去做事,像养宠物一样。 其实我们一直有掏恨出来,只是被龙虾的爆火而引爆了。这个词本质上还是把国内的电力算力换了一种形式卖到全世界,不用输电,建立电网,不用运硬件,没有管水,成本低,覆盖还广。 咱们的 ai 模型在海外已经很有优势,背后是一整条产业链在发力,也是中国科技换道超车的新方向。看懂产业趋势比盲目跟风更重要。关注我下期继续拆解掏坑出海的底层逻辑。

每一次工业革命,都有一样东西在背后疯狂燃烧。第一次工业革命,蒸汽机来了。蒸汽机本身不值钱, 值钱的是让它跑起来的东西。煤。煤从地里挖出来烧掉,变成蒸汽,蒸汽推动机器、机器生产商品。整个英国的矿山、铁路、钢铁厂,全都围绕着怎么挖更多的煤,怎么运更多的煤来建立起来。煤就是那个时代的核心消耗品。 第二次工业革命,电来了,电本身也看不见摸不着,但他改变了一切。爱迪生建发电厂,特斯拉搞交流电,全世界开始拉电网、发电、输电、配电、用电,一条完整的产业链,养活了成千上亿的人, 创造了通用电器这种巨无霸公司。电就是那个时代的核心消耗品。第三次石油、内燃机、汽车、飞机、塑料化工。整个二十世纪,全球经济都建立在石油上,围绕着石油打了多少仗?中东为什么重要?因为那里有油,石油就是那个时代的核心消耗品。 现在 ai 时代来了,它的核心消耗品是什么呢? token, 你 可能听过这个词,但不太理解。简单说, token 就是 ai 处理信息的最小单位。 你跟 ai 说一句话, ai 会把你的话拆成一个一个的 token, 然后逐个处理,逐个生成回答。每一次你问 ai 一个问题,每一次 ai 给你写一段文字,画一张画,生成一段代码,背后都在消耗 token。 一个中文字大约是一到两个 toc, 你 让 ai 写一篇一千字的文章,大概就是消耗了两千个 toc, 听起来不多,对吧?赶紧把这个数字乘以全球的用户量, chat gpt 每周九亿活跃用户,豆包 kimi 千万, 中国五点一五亿生成式 ai 用户,每个人每天跟 ai 对 话好几轮,每一轮都在烧 toc。 再加上企业端自动驾驶的 ai, 每秒处理海量的传感器数据,全是 token。 金融公司的 ai 交易系统,每毫秒做一次决策也全是 token, ai 写代码, ai 做客服, ai 审核合同, ai 看片子,全都是 token。 英伟达为什么一年赚两千一百多亿美金?因为生成 token 需要 gpu, gpu 就是 token 的 发电机。英伟达卖的每一块芯片,最终都是在帮客户生产更多的 token。 openai 为什么要花六千亿美元建数据中心?因为数据中心就是 token 的 发电厂。越多的人用 ai, 就 需要越多的数据中心,就需要越多的电力,就需要越多的芯片。 google 为什么要签一百五十兆瓦的地热能协议?因为 ai 的 数据中心太吃电了,生产 token 这件事,最终还是要烧真实的能源。所以 token 这条产业链从上到下是这样的, 最底层是能源发电厂,电网、地热核能给数据中心供电。往上一层是芯片,英伟达、 amd 含五 g 造生产 token 的 发动机。 再往上是云计算,亚马逊、微软、阿里云建 token 工厂,把算力租给别人。再往上是大冒险公司 open ai、 ospec、 deepsea、 月之暗面,它们把芯片和算力变成可以使用的 ai 服务。 最上面是应用层, chat、 gbt、 豆包 kimi 各种 ai 工具,它们是 token 加油站,每个用户来一次就烧一次。煤的时代,谁控制了煤矿,谁就是亡。石油时代,谁控制了油田,谁就是亡。电力时代,谁建了发电厂,谁就是亡。 token 时代,谁能更便宜、更高效的生产和分发 token, 谁就是王。这就是为什么英伟达市值全球第一,所有的科技巨头疯了一样的砸七千亿建数据中心。这就是为什么 deepsea 一 出来,全世界都撼动,因为它证明了用更少的算力能生产同样质量的 token, 等于用更少的煤烧出了同样多的蒸汽。但 token 跟煤石油炼里有一个根本区别,就是 煤你能看得见,能称重,一吨多少钱清清楚楚,石油你能闻到?一桶多少美元,全球统一报价。 电你虽然看不见,但电表会转,每个月你都会收到电费单 token 你 看不见,摸不着,闻不到。你跟 ai 聊天的时候,他不知不觉的会在消耗这个东西。每一次对话,每一次生成,背后都有真实的芯片在运转, 真正的电力在燃烧,真实的成本在产生。 openai 去年收入一百三十一亿美元,亏了八十亿。收入从哪儿来?卖 token 亏的钱花在哪了?生产 token 按 so pick 给 cloud 的 定价,按输入 token 和输出 token 分 别收费。 google 的 gmail 三点一 pro, 两百 k 以下的 token 一个价,两百 k 以上的 token 另外一个价。整个 ai 行业的商业模式底层逻辑就是一句话,生产 token, 卖 token。 未来十年, token 的 价格会像电价一样成为一个关键的经济指标。哪个国家的 token 成本更便宜,哪个国家的 ai 产业就更有竞争力。中国为什么拼命搞国产芯片?因为用英伟达的芯片生产 token 太贵了,还随时可能被卡脖子。 deepstack 为什么重要?因为它把每个 token 的 生产成本打了下来。当年煤价涨价,工厂就停工。油价涨了,航空公司就亏钱,电价涨了,铝厂就关门。未来, token 成本涨了, ai 应用就用不起。 token 成本降了, ai 就 能渗透到更多应用场景,替代更多人力,创造更多价值。 我是文思,你每天用 ai 的 时候,可能从来没有想过这些,但从今天开始,你可以换一个视角看 ai。 你 用的每一个 ai 工具,背后都连着一条从能源到芯片到数据中心到大模型的完整产业链。你敲下的每一个字, ai 回复你的每一句话,都在消耗一种你看不见的资源,这种资源就是 token, 它是 ai 时代的煤, ai 时代的石油, ai 时代的电,只不过这一次烧的东西,你看不见。觉得涨知识了,可以转发给你的朋友看看。关注我,每天带你看懂 ai!

一九五六年,美国人发明了集装箱,在那之前,全球贸易的成本一半是装卸费。集装箱一出现,世界变了,货物被标准化,运输成本暴跌,全球贸易爆炸。今天 ai 时代也出现了一个集装箱,它叫 token。 很多老板听到 token 只当技术名词,但如果你是做生意的,你要看到的是,这是一次电力的重新定价。 什么是 token? 简单说就是 ai 处理文字的技能班位。你问一句话,写一段代码,生成一份报告,背后都在消耗 token。 重点在于, token 可以 被计量,被计费、被出口。这就像集装箱,把原本难以交易的智能服务装进标准化容器,从此脑力可以像货物一样卖到全球 来。算一笔账,一度电直接出口大概卖零点五元,炼成铝定大概卖一点五元,翻三倍。如果拿去跑大模型推理呢? 一度电大概能产出五百多万。 tokyo 按国内模型定价算,可以卖到十一元,十一元是直接卖电的二十二倍。如果按 open i 的 价格算,将近四百元, 七百八十五倍。你看到中奖了吗?同样是一度电,换个皮价值差几十倍上百倍。这不是能源生意,这是算力生意,是标准化的脑力出口。更关键的一点,电不能装箱,但 tucker 可以 跨国流动, 不用电网,不用特高压,不用对方国家批准,只要一根网线。印度创业者调用中国 api, 背后是甘肃的风电,青海的光伏在转电没出国,钱出国了,这才是结构性机会。 很多老板问, ai 这么卷,价格都打烂了,还赚什么钱?你要明白一件事,现在的二十二倍,不是天花板,是价格战的结果。美国把价格毛在高位,中国用工程能力把成本打下来。一个负责教育市场,一个负责规模收割,这就是新的全球分工。 真正值得你思考的,不是模型谁更强,而是在这个时代,你是卖店的,还是卖 token 的,是卖原材料还是卖标准化能力。 所有产业都会被 token 重构,教育变成按 token 计费,客服变成按 token 计费,编程变成按 token 子计费,营销、法务、设计、咨询全部变成可计量的智能服务。一旦被计量,就可以规模化, 一旦规模化,就会诞生新的巨头。生意的本质从来没变,谁掌握标准,谁赚溢价,谁只卖原料,谁被压价。 一九五六年,集装箱改变了全球制造业。二零二六年, taco 正在改变全球脑力市场。电力过剩不是问题,算力过剩才是机会。美国把 taco 价格炒上去,中国把 taco 成本打下来,悉数东算的战争才刚刚开始。 如果你是老板,现在真正该问自己的,不是要不要用 ai, 而是你能不能把自己的行业装进 tokyo 里卖。

最近很多人都在养龙虾,也就是安装 open core, 不 少人刚上手就被各种大模型的海量 token 消耗给整懵了,甚至有的人一天能用掉几百块钱。那么到底什么是 token 呢? 其实 token 一 点不悬,就是 ai 处理信息的最小计费单位,相当于给模型加油。 open core 本身是不收费的,它是 ai 代理框架,真正思考的是 gpt、 dips 等大模型。你发的指令对话、历史上传的文件,还有模型返回的内容,都会被拆成 token 计费。 粗略换算,一个 token 约等于一个汉字,一千个 token 约等于七百五十个英文单词。在 open 括号里, token 消耗尤其快,它每次交互都要加载一大堆的配置文件,再加上所有的对话历史上下文和工具返回动辄几十万, token 就 没了。 输入和输出分开算算,多轮对话,复杂任务很容易烧, token 烧的可快了。简单说, token 就是 你用 ai 的 油,钱,用的越猛,花的钱越多。要想少花钱,就得精简配置,控制上下文长度,选高性价比模型。 那么你养龙虾了吗?快来评论区聊聊吧!最后别忘记点个关注呀,你的喜欢才是我更新的动力!

你知道吗? token 就 像七十年前的集装箱,改变了全球贸易的方式。集装箱让货物运输变得简单,而 token 则让智能服务变得可计量和可交易。 通过 token, 中国可以大规模输出脑力,特别是在 ai 领域。想象一下,一个印度程序员通过一个接口请求生成代码, 他的请求经过海底光缆传到中国的数据中心,由数百个 gpu 同时处理生成代码并消耗 token。 这样,中国的电力和算力被转化为印度程序员眼前的智能服务。 token 的 本质在于,他将电力、算力和工程师的智慧打包成可交易的单位。 中国的电力资源丰富,但传统电力出口面临很多挑战,而 token 则为中国提供了一个新的出口方式,能够将电力转化为更高价值的智能服务。尽管中国在 token 出口方面有优势,但与美国的差距仍然存在。 品牌溢价、技术能力、生态信任和地缘政治等因素都影响着 token 的 市场价值, 但中国的发展潜力巨大, token 将成为未来全球竞争的新焦点。总之, token 的 崛起为中国提供了一个前所未有的机会,推动智能服务的国际化。未来,中国将不仅仅是电力的供应国,更是智能服务的输出国。

今天,一个消息悄悄出来,但我觉得它比很多头版头条都重要。国家超算互联网突然宣布,面向所有 openclaw 用户,限时两周,每人免费送一千万 token。 养龙虾的朋友看到这条消息,大概是这个反应,什么?国家队开始支持养龙虾啦? 这是什么信号?我们先了解一个概念,一千万 token 到底值多少钱? token 是 大模型思考和说话的最小单位,你说的每一个字, ai 回的每一句话,背后都是 token 在 计费。 一千万 token 是 什么概念?按字来算,大概能和 ai 进行,相当于写几十万字长篇小说的对话量。那这些 token 值多少钱呢?取决于你用哪个模型。你要是用 chat gpt 那 个级别的 gpt 四 o, 市场价大概是每百万 token 三四十块钱人民币。一千万 token 换算下来差不多三四百块。 用国内像 kimi 这种主流模型,均价也有十几块,一百万一千万也得一两百块。就算是目前国内价格最能打的 deep seek, 也要两三块钱。一百万一千万 token 折合二三十元。 也就是说,这次免费送的东西,市场价从几十块到几百块不等,取决于你用什么模型去类比。同日,国家超算互联网还顺手公布了续费价格,零点一元每百万 token, 这个价格是什么水平?比目前国内最便宜的主流模型还便宜一半都不止,比国际主流模型便宜了几十倍。 但我想说的是,这件事的意义根本就不在那几十块钱上。打个比方你就懂了,当年国家要推广新能源汽车怎么干的?直接把补贴砸下去,买车给钱充电免费,高速路不收费。那个时候你说买电动车是因为省了几千块吗? 不是,是因为国家在告诉你,这条路是对的,跟着走就行了。今天国家超算互联网送 token, 逻辑一模一样。 国家超算互联网是什么?是国家部署的顶级算力基础设施,全国最强的一批超级计算机都在里面,是货真价实的国家队。 这支国家队今天选择了用手里的算力去主动喂养 open claw, 等于是在用行动告诉所有人,智能体这条路,国家看好,国家在背书,国家要推,这对企业和开发者来说,信号意义远大于钱的意义, 你可以放心去用,放心去投。政策的风向已经非常明确了。上一个有同等信号意义的事件,是政府工作报告头一次写进智能体三个字,这一次是国家算力基础设施直接下场书写。那这件事对 a 股有什么具体影响? 从产业链角度可以拆成三层来看,最直接的那一层是算力基础设施。国家超算互联网背后是一批超级计算机中心,这些中心的算力扩张、设备更新、国产替代,都是看得见的硬需求。 中科曙光作为国家超算中心的核心设备提供商,可以说是最近这条产业链里距离政策最近的一家公司。 浪潮信息是国内服务器龙头,超算互联网的规模扩张,意味着服务器需求持续放量。 韩五 g 和海光信息在 ai 芯片领域深耕多年,超算国产化趋势下,国产 ai 芯片的使用比例只会越来越高。中间这一层是大模型和 ai 平台,国家超算互联网送 token 用的是自家算力去跑大模型, api 掉用量增加,意味着整个模型生态的活跃度提升。 科大讯飞长期深耕政务、教育、医疗的 ai 应用场景,这些恰恰是国家主推智能体落地的重点领域。昆仑万维在 ai 大 模型业务上持续加注 agent 生态的活跃,对它们的调用量也是实质性利好。 最后这一层是下游 ai 应用公司, token 成本大幅降低,等于降低了整个 ai 应用开发的门槛。金山办公的 ai 办公助手、用友网络的 ai 财务系统,这些有大量企业客户的公司,会因为 ai 使用成本下降而加速推广。 当然,冷静看这件事也有一些值得关注的地方。超算互联网的 token 是 限时两周免费,用完了之后能不能真正培养出稳定的付费用户群体是关键的考验。 另外, token 价格战的持续,对大模型公司来说是把双刃剑,用量上去了,但眉笔收入也薄了。所以这件事利好的更多是上游算力硬件,而不是中游的模型公司。但最关键的一句话就是,国家下场了,方向定了,剩下的只是时间问题。

ai 时代, tok 已成为新的重要资源。很早以前,在第一次工业发展中诞生了蒸汽机,给蒸汽机提供动力的是地底下挖出来的煤炭,煤炭烧掉变成了蒸汽, 蒸汽在推动机器,让机器生产商品。当时大家都在想着怎么挖煤,到了第二次工业发展出现了电,大家都在想着怎么发电、输电、配电、用电, 一套完整的工业链养活了越来越多的电气公司。再看第三次工业发展,石油成了重要的资源,围绕着石油产生了化工、塑料、机器动力。直到如今,世界经济依然建立在石油上,甚至为了石油引发了战争。 那么在接下来的 ai 时代,要想分到蛋糕,大家需要争抢的资源是什么呢?那就是 talking, 就是 ai 处理信息的基本单位。 比如你给 ai 提了一个需求, ai 会把你的需求拆分成很多个 token, 然后逐个处理,解决你的整个需求。也就是说, ai 产品背后都在消耗 token。 比如一个汉字大约是一点六个 token, ai 回复了你一百个汉字,那它就是消耗了一百六十个 token。 当我们把所需的 token 乘以全球的人数,那它就是一个巨大的资源需求。 因为我们看到的所有的 ai 工具,每时每刻都在消耗 token, ai 写代码, ai 绘图, ai 写文案、 ai 操作机器人,这些全都需要大量的 token。 我 们知道石油和煤炭资源是挖出来的,那么 token 资源又是如何产生的呢?答案就是 gpu 产生 token。 可以 说 gpu 是 token 的 发电机,这也是为什么英伟达公司一年能赚呢几千亿, 因为英伟达卖的芯片都是在帮用户生产更多的 token, 而数据中心就是 token 的 发电厂。随着 ai 普及,所需要的数据中心就越来越多,而数据中心的算力需要大量的电力,这些电力又需要大量的发电厂、 发电设备、发电能源,比如煤炭、石油、各种绿电等。也就是说, token 资源其实还是消耗真实的能源, 这些真实的能源给数据中心供电,然后上游是芯片, amd 含五 g, 因为打这些生产 token, 再上游就是云计算,比如阿里云、微软等,他们把算力租给大模型公司,比如 deepsea、 千问,然后再到实际应用端,比如豆包等各种具体的 ai 工具,每个用户来一次就烧一堆 token。 在 这个 token 的 时代, 谁能更加快速、更加高效、持续的生产和分发 toc, 谁就能在新工业发展中占领市场。这是为什么很多大企业花几百亿甚至千亿建数据中心,也就是 toc 厂的原因。 这也是为什么先进的大模型一出来,直接轰动全球资本市场。整个 ai 行业的商业模式。底层逻辑就是一句话,生产 toc 和卖 toc, 未来十年, toc 会像其他能源一样成为一个关键的经济指标,哪个地方的脱困成本更便宜,哪个地方的 ai 产力就更有竞争力。所以咱们需要努力拼命的搞国产芯片,搞大模型,搞算电协同,搞绿色电力, 否则我们的经济会非常被动。今天的讲解就到这里,如果觉得对您有帮助,可以转发给身边的朋友。

这条视频的话,同样用最通俗的话语和大家聊一聊龙虾, ai 部署后都在说这个特别烧 taco, 特别费钱,那么这个 taco 到底是什么? 虽然我会用很通俗的方式去描述啊,但是内容的话全是干货,大家可以收藏起来,方便以后反复去听。这个知识点的话,基本上不会过时啊。 在标准的解释里, talkin 的 话可以理解为字母,也就是说 ai 在 运行的过程中,无论是反馈给你的内容,还是他要执行的动作,在程序里都是需要这一个个字母像搭积木一样呈现在你的面前, 或者说像铺路一样一步步完成结果。即便这样描述,很多人还是会觉得抽象,那么我们换个更形象的说法,我们之前已经把 opencloud 这类的智能体工具比作汽车, 那么 tucker 的 话就好,就是汽车必不可少的汽油。 tucker 的 消耗取决于你要这辆车做什么任务,载客要区分是家用还是客车,载货的话要看货物重量的大小,出行要考虑距离的远近。 不同的场景,汽油的消耗都不一样, ai 也一样,不同的任务产生的 tucker 消耗也会不同。 那么这些 tok 是 谁提供的呢?就是我们常听到的各种 ai 大 模型,比如 open ai、 dpc, 阿里的千问,腾讯的会员,抖音的豆包等。 我们可以把这些大模型产品想象成一座油井,这些油井想要产生收益,就要把汽油卖给我们,也就是把 tok 卖给我们。 平时我们听到的某家大模型更厉害了,或者说发布了新版本,可以简单的理解成他的炼油技术提升了,汽油的品质更好了,更利于汽车的运行。 那么问题来了,为什么现在这个阶段,大家觉得这么烧滔克特别费钱, ai 永远都这么费钱吗?答案肯定是否定的。 现在的 open 可乐只是最初代的汽车,发动机并不成熟,喷油和燃烧都不够优化,我们的驾驶习惯呢,也不够熟练。 油门的轻重都会影响 tucker 的 消耗,甚至我们连目的地和路线都不清楚,盲目的运行就会绕路产生多余的消耗。 还有我们都不知道这个汽车应该加什么品质的汽油,现在却盲目的选择最好的模型。滔肯拿着九二号的车去加九八号的油,自然也是过度消费。 所以等大家真正的学会使用 ai, 等真正的习惯使用 ai, 就 会学会管理滔肯,也就是学会省油省钱。 这一波龙虾业的爆火,既有划时代的 ai 能力升级,也有那些卖铲子营销号的吹捧,更主要的是各个大厂快速跟进的推波助澜。 目前几乎每家智能体都已经上线了 open club 这类的智能体工具,无论是包装的、封装的、伪装的、原装的,还是自研的,都在努力抢占市场。 这些大公司花这么大的成本号称让我们免费体验,本质当然是为了卖我们涛肯。 当然这是需要大家参与共建的场景,因为这些大厂的油井想要提炼出更高品质的汽油,只靠少量的测试车是没法有效迭代的, 必须大家一起多用未来的 tokken 有 效性才会更高。我们上一条视频提到不同大厂的龙虾 ai 就 好比不同品牌的汽车,如果各个品牌的汽车都有指定的有井的竞争,那么我们未来买 tokken 的 价格就会更有优势。 当然还要看各家汽车品牌的优缺点,根据不同的使用场景去选择不同公司的 ai 智能体工具。 这里没有提到的是,个人也可以手搓一辆汽车,用自己的算率去跑 talk, 这也是一种选择,取决于每个人的需求和能力。 下一条的话,我会和大家去聊一下 ai 会带来哪些改变,至少有一点可以确定,这波 ai 会把所有人拉起到同一起跑线上。 不管你现在有没有开始研究 ai, 接下来都会有无限的机会。喜欢的话点个关注,用最通俗的语言带你一步步看懂 ai。

哈喽,同志们,今天我们聊聊算力。 ai 时代的全球竞争本质上是一场关于弹药的战争,而在 ai 时代, token 就是 子弹。可能有很多人到现在还不明白 token 到底是什么东西,其实很简单,我这句话给你说明白,就是你跟 ai 哪怕说对话, 说一句话,你让他给你写一个方案,让他给你生成一个视频,生成一张图片等等一系列的,只要你跟他有互动,这些都需要消耗 token。 那 像我们普通人,你平时凑个热闹,跟 ai 去交流交流,让他给你画个图啊什么的, 让他给你设计点什么东西,那就像玩具枪里面的塑料子弹去打个气球一样的,可能你打两枪就不打了,玩过就不玩了嘛。 那现在不一样了,现在的话,因为我们 ai 大 模型的不断升级,不断进化,对吧?我们 ai 越来越牛逼了嘛,那全行业都在用 ai 去干活赚钱了呀,做业务就好像程序员用 ai 写代码,创作者用 ai 去做视频,设计师用 ai 画图等等。 那到了这一步, tokon 就 不是塑料弹了,它是正儿八经能打仗的真枪实弹了,它可以被用来去打市场,用来去赚取真金白银了,就这个子弹打出就能换订单,换零售,换市场了。 但是你要知道,子弹它不会凭空出来的,对吧?每一颗 tokon 的 子弹都得用算力来生产,那算力它就造子弹的兵工厂, 你有多少稳定低成本自己能说了算的算力,你就能造多少子弹,你能造多少子弹,你就能接多大的生意,你能接多大的生意,你就在,你就能在 ai 这条赛道里站的多稳?那为什么现在突然聊这个呢?因为从今年 开年开始,整个情况就突然变屌了。那我们国内的朋友应该是最早感受到这个变化的,先不说远的,就说大家都 刷到过的那个字节的 c 蛋是二点零。这个视频大魔性有多火,不用我多说了吧,前面我也专门,我也有专门出过这个视频,可以去翻一下我前面的视频。 这个大魔性牛逼,是真的很牛逼,能够直接生成剧情啊,带运镜啊之类的对吧?画面也很牛逼,但随之而来的是什么?是全网都在吐槽的排队。就算是你充了五千一百九十九块的高级会员,高峰期提交一个视频生成任务也要排队。就算是你充了五千一百九十二个小时才能拿到一段十几秒的视频, 那我们普通用户就更不用说了,前面排几万人一天都未必能够出片。而且这个还不是个例啊,现在国内所有的头部大模型都在缺算力,都在要排队,小米新模型上线二十天,收入就超过了过去整整一年。二十天对比一年啊兄弟们。 结果就是直接公开高喊缺算力,缺显卡,满世界去找算力合作伙伴。讲一个实打实的数据,就是今年二月份,全球性的 ai 接口聚合平台 open loop 出了官方榜单, 全球掉用量最高的五个大模型,我们中国就占了四个,而且二月每周的 toker 掉用量比一月还比这 翻了一倍。那这组数据的背后,不只是我们国内用的人多了,更关键的是,现在全世界都在认可我们中国的 ai 能力了,像海外的企业创作者、开发者也都在用我们中国的 ai 了,这就不是我们单纯在国内小打小闹了,这是把账直接打到全球市场去了。 那说到这里,就大家都最近都听到的那个算力出海了吗?那很多人以为算力出海就是把服务器啊,芯片啊是这种东西卖到国外去,那我只能说格局小了, 像过去的几十年,三四十年吧,我们中国是靠什么?我们是靠卖衣服,卖家电,卖工业品这种东西去完成全球化的原始积累,赚到了全世界的钱。 那现在呢?现在 ai 时代, ai 时代全世界最缺的是什么?缺的是 ai 算力啊,兄弟们,像现在的海外 ai 应用,用户排队动议就要排一天对吧? 有的甚至可能要排几天,有些国际巨头为了抢产量,连自己的股权期权都拿出来了,就为了能稳定的拿到货。那咱们的算力出来,本质上就是拿着我们自己造的兵工厂给全世界提供 ai 子弹。 那具体的来说就两条路径,第一条就是把我们的国产 ai 芯片、服务器全站系统出海,这个属于硬件出海,是去抢占全球算力基建的份额。第二条是在海外建立合法合规的算力中心,用我们自己的算力底座去给全世界提供 ai 服务, 用我们稳定高性价比的头壳的供给去换美元,换用户,换行业话语权。然后到了这里,有一个很核心的前提, 也是大多数人会忽略的,就是你不可能总拿着别人造的枪管去打仗吧,对吧?说白了就你要是你的 芯片,你的核心技术都是别人的,那别人随时能卡你脖子的对吧?人家一卡你脖子,你不完蛋了?你的兵工厂直接就停工了,你的枪直接就压火了, 那还怎么打仗?怎么出海去赚钱?就像过去我们的数字经济很多时候就是在别人的地级上盖房子,人家一抽地级房子就直接塌掉了。但是现在不一样了,我们国产的高端 ai 新,比如华为升腾的九五零,它核心的推理性能, 也就是我们平时用 ai 干活最常用的能力,已经对标了英伟达的 a 一 百很多场,甚至很多场景下性能还会比人家高一截。同时我们国内的头部大模型现在都在优先配备我们自己的国产算力生态, 先进制程的才能也在慢慢往上爬。也就是说我们有了我们自己的从头到尾全链条都是自己说了算的弹药生产线,有了能够支撑我们把账打到全球去的底气。至于算力会不会过剩,那如果真能过剩,那也是牛逼了。 就现在这个情况,只有缺口没有过剩。按照国际头部券商还有伽纳这种全球第三方机构的测算,我们国内 ai 训练和推理用的算力缺口至少到二八年都会持续存在。因为 ai 对 我们的生活生产的改造才刚刚开始, 我们现在还只是简单的用 ai 去做做内容,写写代码,搞搞设计什么的,那未来 ai 机器人、 ai 驾驶、 ai 制造全部都会深度的用上 ai, 可以 说到时候 ai 应用的地方只有我们想不到,那到了那个时候, tiktok 的 消耗量只会从指数级的往上去 跑,会比现在的这个量要翻好几个量级。那一边是按月甚至按周翻倍的子弹需求,另外一边是建一个数据中心,造一条芯片生产线,动不动就是一年半载,三年五年的 供给周期,需求涨得飞快,然后供给又跟不上。就这条赛道最硬的逻辑,以前的互联网时代,建服务器买算力就是 纯纯花出去的成本,是为了支撑住自自己的业务。那现在对于做算力计件的厂商来说,算力就是能直接赚钱的核心资产了,兵工厂只要开起来,造出的每一颗子弹都能卖钱。而对于下游用 ai 的 公司来说,算力就是现在它最大的刚性成本了, 谁能拿到更便宜更稳定的算力,谁就能比同行更赚钱。也就是现在全世界的公司都想降本, 都想拿稳定的算力,才给了我们国产算力出海最好的历史性机会。投坑为蛋,算力为己,自主可控为核,全球化合规布局为界。这场关于算力的竞争,不是一次短期的风口炒作,而是一场关乎未来 十年中国 ai 产业的长期战役。而能走到最后的,永远是那些手里握着自己的弹药生产线,能把子弹稳稳打到全球市场的玩家。行了,这个视频也够长了,今天就先讲到这里,看完的给我评论区留言。看完了下个视频,我们聊一聊华为的升腾,点个关注,一起发财,拜拜!