梁胜闹麻了,梁胜,一个亿托克纳你只收七块三毛三吧。梁胜,你别出扣丁顿了, 你就一直打折吧。梁胜,没人打得过你,国产只有你了。梁胜真的是太狠了,真的。
粉丝297获赞3.4万

token 翻译成中文叫什么?叫词源,是模型处理文本的最基本单位。 token 和字呢?有什么区别? token 呢,可以是一个字,一个词,甚至半个字,那这是谁规定 的?是模型看了大量人类文字统计出来的,这样表达呢,更省事。常见的字和词就用一个 token 表示,其他的就用多个 token 拼接。 一个 token 到底是多少钱? deep 呢?输出一百万 token 呢?约等于三本新华字典只需要三块钱, gpt 五呢更贵,超过九十块 token 和上网流量收费是一样的道理吗?不是的, token 收的是计算费,是生产成本,而流量收费呢,是搬运费,不是一回事。为什么养龙虾要烧 token? 是 因为龙虾要用大模型思考和回答问题,因为大模型按 token 收费,所以就说烧 token。 本地部署大模型是不是就不用烧 toon 了?还是要用到 toon, 因为 toon 机制本身和部署方式无关。本地部署呢,不需要按量付费,但电费得自己掏,算上硬件成本不一定划算。如果我把一段话复制粘贴进去,是不是就算一次 toon 不是 文字越多呢?计算的输入 toon 数量就越多? 我问的问题很长,但答案很短,是不是只扣答案的 token 不是, 输了 token 呢?也要算钱?表情符号算几个 token 会不会比一个字还贵?常见的表情呢,是一个 token, 不 常见的会用两到四个 token 拼接表示。 deepsea 和 gpt 的 token 是 一样的吗? 不一样,互相不认识。 y, y, d, s 这种网络词是几个 token, 一 般拆成 y, y 和 d s 两个 token, 要是这个词足够火,也可能被模型当做一个整体。同样的问题,我上午问和下午问,输出的 token 数会不一样吗?不一样,模型输出具有随机性,每次输出的 token 数量不同。 那小龙虾帮我下载电影是否要按 token 计费?小龙虾思考怎么下载?打开下载网站,执行下载命令,这些都需要消耗 token, 但是下载电影本身不消耗 token, 因为电影不是大模型生成的, 电影是存在第三方服务器上,只消耗下载流量,不消耗 token。 为什么我和 ai 聊得越久,回复同样一句话,花的钱就越多? 模型是基于对话历史进行回答的,所以你所有说过的话呢,都会参与计算,计算成本就越高,这也是 ai 还需要按照输入 token 数量计费的原因。 怎么才能少用点 token 输入更少的提示词去掉?你好,请问这类废话规定模型输入长度,加一句五十字以内回答,但很有可能问题没有说清楚,回答呢也不够准确。如果前后问题呢?不相关也可以新开对话,避免历史对话参与计算。 托管是加密的密码吗?不是,托管只是一种文字编码方式,虽然你看不懂,但他并没有加密。 图片和文本的托管是一样的吗?不一样,图片会切分成很多小小的方块,每个方块呢?当做一个视觉托管,就像拼图一样。托管是为了收费而发明的吗? 不是,托管是技术发明,是为了能表达和能计算,只是计算的成本和托管数量正相关,所以就按照托管数量收费。我使用豆包没有付费啊。为什么说托管是收费的?大厂为了抢占市场让你免费使用,成本呢?暂时不用你出, 如果你是企业用户或者养龙虾就需要支付费用。我在一段话里疯狂敲空格, ai 是 视而不见还是会偷偷扣我的钱? 空格也算钱,虽然有的模型会把几个空格打包,大部分时候你多敲一个空格就再多烧一份算力。那 ai 产生的废话是不是能退费?不能,因为废话也是显卡辛辛苦苦算出来的。

好一个良渥的恩情还不完了,三亿 toon 只用了不到十九块钱。不过纯烧 toon 氧 hems 和 openclaw 这种智能体的话还是有点兜不住。我用 cloud code 接 deepseek 的 ipi 做两个软件,一个是在前端监测癌症的画 cid 图的软件, 还加入了基础的绘图功能,能自己去改一改图。另一个是 doident 的 管理面板和监测面板,还加入了聊天弹窗功能。就这两个软件,一共差不多才用了一亿的 token, 只花了差不多七块钱。做完之后,我这的 token 显示只有一亿多,余额还有十二块多。但是我的 ident 在 做东西的时候犯的错有点多,我就训了他一会, 不到一个小时,回来一看 token 直接飙到了两亿多,余额直接剩了四块,直接扣走了我八块钱。虽然一亿 token 八块钱也很便宜,但是这种纯聊天儿的消耗速度也有点兜不住。所以我比较推荐的方案是在养 openclock 和 hermes 的 时候 也备一个 mini max 的 ipi。 mini max 蹦归蹦,但是量大管饱,再加上这样的一个快速切换,训练对话的时候用 mini max, 正经做任务的时候切换成 deepsea, 也不用担心 太笨的模型会把你的智能体给养傻。这些智能体本质上就是本地的文文档,然后发给大模型去处理,不管你对话过程中是怎么样的,只要你最后写进记忆文件的文本是对的,它就没问题。

最近 togan 到底怎么翻译?在互联网上引发了一波热议。起因是一条来自国家官网的新闻,相当于官宣了 togan 的 意法。词源 一时激起千层浪,先别急着站队,我们先把 togan 这个词捋清楚。 togan 本意是象征,比如情人节送人玫瑰就是 a token of love, 爱的象征。在不同领域中,它隐身出了不同的含义。玩阶级时,那种圆圆的 token 意为游戏币。计算机安全领域中的 token 意为令牌。加密世界里的资产单位意为代币。到了 ai, 这意为词源。那么这个词源到底怎么去理解呢? 根据官方的解释, token 是 大模型处理信息时的最小单位。大模型处理一个文本时,不是整段整段的读, 而是会把它拆成一个个更小的单元,再逐步处理。从这个角度来看,词源这个翻译其实在强调它既跟词有关,又是一个基本单位源。这有点理工男的风格啊,不浪漫,但是也确实抓住了本质。不过一些网友不太买账啊,有人说词源太别扭了,并且提出了像智源等更有科技感的议法。 也有人觉得,不管叫什么,有中文名字总是一件好事。因为这一波 ai 浪潮里,大量底层概念都是来自于英文世界。什么 chatbot、 prompt agent、 token, 如果不进行一轮中文重构,那么这些词就会变成一种圈内的黑化,懂的人越懂,不懂的人呢,直接劝退, 久而久之,就会形成一个隐形的门槛,把大量普通人挡在门外。正如当年我们把 laser 翻译成激光,把 computer 翻译成电脑就挺成功的,既好记又突出了特点,还极易传播。所以给 token 找一个好的中文名啊,本质上是在做一件更大的事, 是用我们的母语去构建数字世界的底层认知。但另一派的观点也很鲜明,就是 togel 作为一个外来的专有名词,没必要用中文硬翻。这个评论倒让我想起了 dna 这个说法,貌似没有简洁的译法,但也不妨碍大家交流使用,对吧? 这样争论还挺有意思的,它不只是一个词的翻译问题,背后其实藏着一个更大的命题,就是我们要不要为新技术建立一个属于自己的语言体系呢?词源或许不是一个最优解,但是它至少是一个开始。你接受词源这个翻译吗?还是更愿意直接说 token 评论区聊聊?

全网首发,今天一条视频教会你获取 token 的 四种渠道,搞定中转站上游。 第一种, azure open ai, 作为目前大陆获取 open ai token 的 主要合规渠道, 虽然目前已经不再是获取 open ai 模型的唯一云渠道,但阿塞尔在大陆的特殊地位不变。微软也明确强调,在大陆提供的 hr open ai 服务没有变化,获取的一线货源稳定性与合规性极强,持有大量企业级合规认证。 第二种, safar ipi, 手动搭建,借助 safar ipi 等开源工具,将自己的网页订阅额度转换为 ipi。 如果账号很多,甚至可以调用 safar ipi 的 管理 ipi 编辑脚本,实现批量自动导入。但是这种方式只适合个人学习与技术探索。 第三种,逆向。这种方式极不推荐偷看,有效期非常短,只适用于私人且低频非重要的技术测试。逆向是验证想法的快速途径,但需自行承担风险。第四种,薅羊毛。 利用海外企业的免费试用额度或建立大量耗时赋用分发羊毛党滥用免费额度,且有巨大的时间沉没成本。 最后获取 token 推荐大家还是选择官方云厂商的直联或者 ai api 聚合平台,用激进官方的稳定性换来极低的价格。最后,祝大家创造力不断,用 ai 探索出更多惊喜!

强行给粉丝科普 token, token 呢,现在被翻译成词源,那用到了源这个字,就说明它是最小与一单位,比如说你我,它这三个字分别是三个单独的 token 啊,还有一些呢是常用词,比如说,呃,葡萄,苹果、实验室,这三个是单独的三个 token, 所以 这一句话我喜欢去实验室呃,看起来虽然字比较多,但它其实只有四个 token。 英语中一些常见的前缀,后缀,比如这个 in is 等等,也可以做一个单独的 token。 除了文字是这样,图片和声音也是这样的,图片会分解成呃像素的 toc, 那 声音会分解成声波的 toc。 呃,今天外国有很多这个大圆模型是收费的嘛,所以这个人们老说他费 toc, 因为他不光输出 呃,收费就输出的答案按 toc 收费,他的输入就是你给他的提示词,也是按 toc 收费的。嗯, 对,还有啊,还有就是那个豆包和 deepsea 今天很多给你的那个答案啊,它看似好像是一段话,然后几个句子,它其实的生成模式有点类似于 token 接龙,就是 它是一个 token 加一个 token 加一个 token 这样,然后最后给你生成了一个答案哦。

今天和我的一个同学聊到了 token, token 呢也叫词源,最近这个词特别火,那为什么要聊到 token 这个东西呢?因为未来我们可能几乎每个人都可能要用到 token。 我 们现在用的很多大模型,比如豆包、 deepsea, 我 们的手机端用到的其实都是很多是阉割版的,也是低配版的。如果你要去使用满血版的话, 你就需要去接入 api 或者进行本地化部署。但进行本地化部署是需要非常性能非常高的硬件设施才能够去匹配,才能够达到本地化部署跑满血版的那个要求。但对于个人来说,这个成本和费用太高了, 那就可以通过 api 接口去降低单个的拓客成拓坑的成本。现在的很多大模型都是免费的,它是因为还现在还处于一种破客 和抢流量的阶段。当越来越多的人用 ai 离不开 ai, 对 ai 产生了粘性,那么就在未来就可能会对某些 比较消耗算力的功能部分会进行收费,那收费就要消耗我的头肯。

今天咱们来聊一个你可能天天听到,但一直没搞明白的词。 token 这个词听着是不是像金融圈的代币或者程序员敲的什么神秘代码?但今天我用几分钟,让你不仅懂它,还能让你在朋友面前装个大的。 咱们来打个比方,假设 ai 是 一个正在玩乐高的三岁小孩,你给他一本红楼梦,说给我讲个贾宝玉的故事。 ai 不 会魔法,他得先把这本厚厚的书拆成一块一块的小积木,这就是 token。 假是一个积木,宝是一个积木,玉是一个积木,句号也是一个积木。然后他把这些积木编号、理解、存储,最后拼出一个新故事给你。 所以 token 就是 ai 看世界的最小积木块。你写,我喜欢吃火锅, ai 眼里是,我喜欢吃火锅,四个 token 你 写 chad gpt, 真牛。 ai 眼里是 chad gpt, 真牛。一共四个 token, 因为英文单词可能会被拆。 ai 其实是个文盲,他只认识数字。 token 的 作用就是当翻译官把每个积木块词或者字变成一个数字编号。比如我是幺二五, 喜欢是三零六,吃是七八,火锅是四四二零,然后 ai 就 看着这些数字开始疯狂计算。幺二五后面常常出现三零六,三零六,后面可能是七八或者八八八,他根本不知道火锅是什么味道,他知道火锅辣, 冬天好吃。这些偷看经常一起出现。所以 ai 其实是个超级统计学家,不是真正理解, 但是他演的太像了。如果你用过任何 ai 的 付费 a p i, 你 会发现 token 就是 流量,流量就是钱,你说的话占多少? token 收费, ai 回话占多少? token 收费每一千个 token 大 概几里钱?但积少成多,聊嗨了可能一顿饭钱就没了。 所以下次和 ai 聊天,别废话连篇,省 token 就是 省钱。顺便给个参考啊,一个汉字约等于一至两个 token, 一 千个 token 约等于七百五十个英文单词,一部翻体三部曲约等于九十万个 token。 你 看 ai 读完整套翻体也就几块钱,是不是比买纸质书还便宜?我觉得 token 这个东西还是特别有意思的,它就像 ai 的 呼吸频率, 以前的 ai 一 次只能呼吸两千个 toc, 大 概一千五百个字,聊着聊着就忘了开头,像鲸鱼一样。 现在的 ai 能呼吸二十万个 toc, 可以 陪你读完一本小说,再和你讨论细节,这是质的飞跃。但更有趣的是,人类说话也有 toc 密度,有人一句话说半天没重点。 toc 多但信息少,有人三言两语就能直击要害。 toc 少但质量高, ai 在 拼命堆 token 求智能,我们人类却可以用有限的 token 创造无限的可能,这不就是我们探击生物的优越感吗?

什么是 tiktok? 警局?有一天,你在办公室对着 ar 打了这么几个字,我爱你。你按下回车,屏幕上 ar 就 开始回复你,看起来只不过是再普通不过的对话了,但是这背后却发生着一件复杂的计算。 在 ar 的 眼里,他不认识人类自然语言,就像是计算机,满脑子只有零和一一样, ar 的 脑子里只有一段信号的,它会被拆开,变成一段一段可以计算的单位。这些最小单位有一个名字叫做 token, 中文叫做词源。那什么是 token 词源呢?我们就来做一个测试好了。中文,我爱你是三个 tokens, 三个字母,英文的 i love you 也是三个 tokens, 十个字母。这里的中英文的 token 的 数量是一样的,这说明了什么呢? token 不是 字,也不是词,而是模型,用来理解世界的最小计量单位。或者说 token 把人类语言拆解成机器能懂的碎片了。 听到这里,大多数人就会以为这只是一个技术细节,干嘛告诉我啊,因为它很重要啊。当你输入我爱你的时候,这些 token 就 会被模型计算, 当 ar 开始回复你的时候,它会在一个一个的生成 token。 也就是说,人类与 ar 的 对话,本质上是一场 token 词源的流动, 而流动就意味着一件事情消耗。比如你让他做一张海报,消耗了多少 tok 呢? ar 完成了多少工作量呢?那么问题来了,当工作产量可以用 tok 衡量的时候,他的成本和价格 应该怎么定呢?王富贵有一家电商公司,每天都要做一张拖鞋促销海报。过去他有一个美工,月工资是九千块钱,一天做一张海报,每张海报的成本大概是三百块钱嘛。 后来他开始用 ar, 同样一张海报一分钟内完成,几乎没有时间成本,而这张海报带来的结果并没有什么巨大的差别。那么问题又来了,这张海报成本是多少呢? 有可能你会说,不要钱啊,现在很多的 ar 工具都是免费的,豆包千万元宝随便用啊。 但是这里有一个非常大的误解,免费不等于没有成本啊,这些免费只是因为有人在替你付费,而这些大模型的背后,数据中心是在烧电的,模型是不断在推理的。也就是说,每一次的生成其实都是在消耗真实的资源, 只不过现在这个成本被平台补贴了而已嘛。但是你看另外一边, chat、 gpt 和 gemina, 它们都是付费订阅的呀,当补贴结束的时候,当竞争稳定的时候,天下肯定是没有午餐的嘛。 但是这个我们今天就不再讨论范围了,回到这张海报的成本,不是零,而是消耗了多少头肯。于是我们就可以得出一个结论,这个结论是非常重要的,成本从时间函数变成了计算函数。 什么意思呢?如果你仔细想一想,就会发现一件有趣的事情,人类的劳动报酬几乎都是按时间计算的,上班是按月薪或者是时薪的。 过去整个社会经济的成本计算方式本质上就是时间。为什么呢?因为在人类的世界里边,有一个无法绕开的事实,生命是单向消耗的,一个美工一天只有二十四个小时,他今天做了这张海报,就不可能再同时做另外一张了。 所以当王富贵付他三百块钱的时候,他买的是这个生命体不可逆的一段时间。工作八个小时,本质上就是把八个小时的人生 卖给了公司。而公司也很清楚一件事情,这八个小时里边并不全是有效产出的,里边包含了发呆、走神、摸鱼、情绪等等。 在叹气的世界里边,这些损耗是不可避免的呀。但是 ar 把这件事给彻底掀翻了, ar 不 卖时间,他甚至是没有时间的概念的,他不疲劳、不休息、不焦虑,也不会因为状态不好,今天就少出两个版本的海报, 他只做一件事情计算,当 ar 生成一张海报的时候,他没有工作了。一段 token 词源, ar 时代是整个底层价格体系的重塑,这就是托肯经济。但是如果你觉得这只是做海报变便宜了,那就太低估这件事情了。那么我们再来换一个例子, 你用过 iphone 的 吧,一台售价七千九百九十九的手机,如果拆开来看,你会发现一件非常有意思的事情,屏幕、电池、外壳加起来可能就是三千块钱,工厂组装可能只要十几块钱,那剩下的四千块钱去了哪里呢? 答案很简单,我们在为思考付钱,为芯片设计、为系统架构,为工业设计、为算法优化等等。也就是说,买的不是手机本身,而是人类最顶级的大脑世界, 这个叫做智力溢价。但是现在这件事情就开始变喽,我们把王富贵的逻辑套到了 iphone 身上,过去设计一个模块需要五十个工程师开会争论,试错要花三个月甚至更长的时间, 但是现在只要输入一个复杂的指令模型就开始运行了,消耗海量的东西开始发生了变化。 第一是效率的意义变了,过去效率的提升意味着用更少的时间赚更多的钱嘛。但是在 token 的 世界里,时间已经不是成本了。第二,竞争的本质变了。 过去公司之间拼什么呢?拼人、拼团队,拼谁更努力。但是现在开始就变成了拼谁的 token 更便宜,更加智能。于是竞争的核心就从人力资本转向了算力加上算法。 第三是权力的分配变了,在旧世界里,最重要的资源是人,谁能够组织更多的人,谁就更强嘛。但是在新世界里,真正重要的资源变成了 token, 你 会发现这个结构就非常熟悉了,资源垄断、定价权和石油时代的逻辑几乎是一模一样的。 第四,最深层的一层变化来了,当劳动被拆解成 token 之后,一件几乎不可逆的事情就发生了, 劳动被彻底的标准化了。过去每个人的能力不同,每个作品是带着人的差异的,以后越来越多的工作可以被还原成一段计算的流程,这意味着什么呢?脑力劳动开始像支付水和电一样被使用了, 用户根据实际消耗支付费用。这段话该怎么理解呢?你想一想,现在是怎么用电的,你不会关心哪个电厂发电的,是哪台发电机在运转的,你只关心一件事情,用了多少度的电,要付多少的钱。 用水也是一样的,你打开水龙头,水就出来了呀,你只要看水表,多少吨的水要付多少钱,而 ar 正在把办公室劳动变成了同样的东西。 过去,你用一个人,要面试,要管理,要沟通,要发工资,要承担他的情绪和状态。现在你用 ar, 只需要输入一句,结果就出来了。中间发生了什么呢?不需要知道,只需要知道一件事情,这次深层是消耗了多少的头肯。 同样的,王富贵也不再关心是哪个设计师做的,做了多久,他只关心一件事情,做出这家海报要消耗多少的头肯。 但是,如果你把这件事情再往上看一层,你就会发现,这已经不是王富贵的账本的问题了,这个就是国家层面的事情了。过去,中国是一个典型的工业国, 向全世界输出物质资料,家电、服装、汽车等等。但是在 ar 时代,这件事情正在发生变化,生产资料正在从物质转向计算。 未来的竞争不只是谁的工厂更大,谁的制造能力更强,而是谁能生产更多、更便宜、更智能的 token, 或者你可以把它理解成一次角色的转换。工业时代,中国输出的是商品,而在 ar 时代,中国如果要升级,输出的将是智能,从工业国走向智算国。而在另外一边,中美的竞争也在悄悄地转换战场。 过去争什么呢?石油、航道、能源。但是现在真正的核心资源已经变了,很多人还在用旧世界的视角去理解竞争,传统的能源大国之间的思维去争夺石油、关税、制造业等等。但是真正的新石油已经出现了, 不是黑色的液体,而是 token。 谁控制 token 的 生产,谁控制 token 的 成本和智能,谁掌握 token 的 定价权,谁就掌握了这个时代的新能源, token 就是 数字时代的石油。 对了,今天我们讲的 token 只是针对 ar 世界里的,在加密货币世界里的 token, 我 们是还没有讲的,有兴趣我们再下次讲。好了,说完了,再见。

你今天跟 deepsea 聊天,或者打开豆包,某个 ai 助手敲下一行字,请给我写一句关于夕阳的诗词,然后按下回车。你以为 ai 这时候已经开始疯狂推理了? 不,此时此刻,屏幕内头的 ai 大 模型大脑还是一片空白。他看到的就是一串普普通通的文字,跟你发微信敲备忘录没有任何区别,就是一个冷冰冰的字幕串,安静的躺在内存里。没有 token, 没有计算,什么都没有。那真正的故事从下一秒开始。 第一步,你的这句话先被扔进一个叫分词器的工具里。分词器的工作特别简单,他按照 ai 提前训练好的规则,把完整的一句话切成一小块一小块的碎片。比如,请给我写一句关于夕阳的诗句, 切完之后大概是这样,请给给我,我载写载一句关于载夕阳值得采的词句,每一块小碎片就是一个 token。 中国官方给他起了个中文名叫词源。 切分的规则也不复杂,经常搭配在一起出现的字,比如夕阳,关于会被合并成一个 token, 不 常出现,比较生僻的字就单独切开。 你可以把分词器想象成一个手艺精湛的厨子,处理食材的时候常用搭配整块,保留生僻食材,单独切, 分寸感拿捏的刚刚好。但切完就完事了吗?没有。 ai 不 认识中文,它只认识数字。所以接下来每个 token 都要被翻译成一个专属的数字编号, 这个编号叫 token id。 每个大模型出生的时候,都自带一本专属字典,行业里叫词表。这本字典里存放着这个模型能识别的所有 token, 每个 token 对 应一个唯一的整数,比如夕阳可能对应一千两百一十三, 关于对应两千九百八十八,请对应二七八。不同模型的编号不一样,但逻辑是一样的。经过这一步转换,你刚才敲的那句人话就变成了一串 ai 能识别的数字。 ai 拿到这串数字之后,会给每个数字匹配上对应的语义,让模型知道这一串数字代表的是夕阳,而不是一串冰冷的数字。这个过程技术细节不用深究,你只需要知道, 转换完成后,这些数字就有了灵魂,变成了 ai 能真正用来计算的内容,然后它才能开始思考 要怎么给你写那句关于信仰的事。 token 说白了就是 ai 理解和生成信息时所使用的最小积木块。不管是文本、图像、音频还是代码,在 ai 眼里全是由一个个 token 拼出来的。就像我们人类看世界是由一个个物体、 一个个细节组成的一样, ai 看世界就是由一个个 token 组成的。 token 用的越多, ai 能处理的信息就越丰富,生成的内容就越精准。 国家数据局最新数据显示,咱们国家每天消耗的投更量已经超过了一百四十万亿。这个数字背后,是 ai 正在被应用到千行百业。写代码、做设计、辅助医疗、智能制造。 token 不 再是冷冰冰的技术名词,它已经成了 ai 时代的价值锚点和结算单位。我是麦田,我长期深耕 ai 大 模型聚合服务领域。如果你对磁源经济感兴趣,主页联系我,可以免费赠送一本我写的电子书。磁源经济, ai 时代普通人的黄金赛道。

你每天都在用 chat、 gpt、 cloud gemini、 deepseat, 但你可能一直忽略了一个最基础也最关键的概念, token。 很多人以为 ai 是 按字数理解你的问题,按字数计算费用,但实际上不是。 ai 真正处理的不是一个个汉字,也不是一个个单词,而是一个更底层的单位, tocan。 你 可以把 tocan 理解成文字进入 ai 模型之前被切分出来的最小语言单位。它可能是一个字,也可能是一个词,也可能只是一个词的一部分。 比如,我喜欢人工智能这句话,在人眼里就是七个汉字,但在模型眼里,它可能被拆成其他形式。 不同模型、不同分词器对同一句话的拆分方式不一定完全一样。所以这里要记住第一点, token 不 等于自述。这也是很多人算 ai 成本时容易犯错的地方。 你以为你只输入了一小段话,但在模型系统里,它已经被转换成了一串 token, 然后这些 token 会继续被转换成数字。因为大模型本质上不是直接读文字,它不是像人一样看到一句中文,然后理解意思,它真正处理的是数字。整个过程大概是这样, 文字先被拆成 token, token 再被编码成数字。数字进入模型参与计算,最后模型再把计算结果转换成 token, 再还原成你能看懂的文字。所以, token 是 什么?一句话说清楚。 token 是 文字进入 ai 模型之前的编码单位, 它是人类语言和模型计算之间的中间层。理解了这一点,你就能理解很多 ai 产品里的核心设计。比如,为什么 ai 按 token 计费, 因为模型每处理一个 token 都需要消耗计算资源,你输入的内容越长,模型要处理的输入 token 就 越多,模型回复的越长,生成的输出 token 也越多。所以 ai 的 成本一般可以拆成两部分, 输入 tocan 加输出 tocan, 你 给他一篇一万字的论文,让他帮你总结,这就会消耗大量输入 tocan, 你 再让他输出一篇三千字的分析报告,这又会消耗大量输出 tocan。 所以 很多 api 价格表里会分别写,输入多少钱、一百万 tocan 输出多少钱、一百万 tocan 为什么输出通常更贵?因为生成内容比读取内容更消耗算力。模型不是一次性把答案吐出来,而是一个 token, 一个 token 的 预测下一个内容, 它每生成一点都要继续计算,所以你让 ai 写得越长,成本就越高。这也是为什么有些平台会限制你的使用次数,上下文长度、输出长度。不是平台故意抠门,而是背后真的有算力成本。 再往下看, token 还决定了另一个非常重要的能力。上下文窗口,你经常会看到一些模型宣传,三二 k 上下文、幺二八 k 上下文、二百 k 上下文,甚至一 m 上下文。 这里的 k 不是 字数,也不是词数,它说的是 token 数量。上下文窗口本质上就是模型一次最多能处理多少 token。 比如一个模型支持幺二八 k 上下文,意思就是 你输入的内容,历史对话系统提示词,模型要生成的回答加起来不能超过这个 token 容量。这就像一个人的工作台, 上下文窗口越大,工作台越大,你能一次性摊开的资料就越多。所以,长上下文模型更适合做什么?适合读论文、读合同、读代码库、分析长文档、整理复杂项目资料。 但这里也有一个误区,上下文越长,不代表模型一定越聪明,它只是能一次性看更多内容, 能不能抓住重点,能不能推理,能不能总结出真正有价值的结论,还要看模型本身的能力。所以,判断一个 ai 产品,不要只看上下文窗口有多大,还要看它的推理能力、信息提取能力、稳定性,以及常上下文下是否会丢细节。 token 这个概念虽然听起来很技术,但它其实直接影响你使用 ai 的 体验。它决定了三件事,第一,你能输入多少内容。第二, ai 能记住多少上下文。第三,你使用 ai 的 成本是多少? 所以,为什么同样是问 ai, 一个人觉得很便宜,另一个人觉得额度一下就没了?核心差异往往不在问题数量,而在 token 消耗短,问题短、回答消耗少,长文档长、对话长、输出消耗高。 尤其是你让 ai 帮你改论文、分析代码、处理报告的时候, token 消耗会非常快。因为这类任务不是简单聊天,而是在让模型处理大量上下文。最后总结一下,你只需要记住三句话, token 是 ai 的 文本单位, token 决定使用成本。 上下文窗口本质上也是 tocan 数量。理解 tocan, 你 才能真正理解 ai 产品的价格、额度、上下文窗口和能力边界。也就是说, tocan 不是 一个冷冰冰的技术词, 它是你理解 ai 产品最重要的入口之一。因为大模型时代,谁能更好地理解 tocan, 谁就能更清楚地判断哪个模型更适合,常闻到 哪个产品更划算,哪个会员更值得买,以及为什么同样一次对话,有时候成本会差很多。这就是 token ai 世界里最基础但也最容易被忽略的语言单位。

你知道什么是 talking 吗? ai 的 正式中文名还在甄别哦。 talking 的 正式中文名已经在确定了,就叫词源。词源呢,就是我们跟 ai 对 话, ai 理解世界的最小单位。词源不同于网络的字节,比如说一个英文字母是一个字节,一个中文字是两个字节。 但是呢,在 ai 词源的世界里啊,中文和英文都是一样的,跟字母没有太大的关系。比如中文,我喜欢你是四个词,三个词源,英文 i love you 也是三个词源,它是根据语义来计算的。 所以啊,在 ai 时代,生产的成本完全不一样了。现在生产成本都是按时间算的,月薪时薪本质上买的是人的时间,还得承担摸鱼情绪等损耗。但 ai 时代不一样,成本只看资源消耗,它不消耗时间,不疲劳,只靠算力和电力工作。 以后呢,使用 ai 啊,就根据资源数量收费了。你会问我每天都在用 ai 也没收费啊。那是因为啊,现在都在抢客户,等到以后成熟了呢,就会开始收费了。 不过在我们国家, ai 成本会比较便宜,因为我们国家有电力优势,资源成本就低,这在未来的竞争中啊,就有非常强的优势。说白了,资源就是 ai 时代的新石油,看懂它呢,就看懂了未来的科技竞争。

我估计顶多一两年以后豆包绝对会收费。你问一下豆包生成个图片,其实豆包是亏钱的。我现在才明白这个托肯还有低级托肯,跟高级托肯他们价格差七八倍。我还以为说,我说我问豆包这个消耗是低级托肯,他不,他这个是那个推理,这是消耗的高级托肯 其实很昂贵的,比如你跟豆包对话就在消耗唾沫,本来应该收费,只是现在豆包在补贴而已,其背后的就是流量啊,他有点像中移动的那个流量费用电话费一样,这是个巨大的产业。我一个朋友在广州,原来做算力设备的,最近他又在做 托肯的中介,他就找很多那个云计算中心去采购这个托肯,然后再卖个腾讯,他还组建了个队伍去给工程师打电话说我这里有便宜的托肯,因为现在那些大公司卖的贵,就是刚刚盈利第一个月,他说他能赚六十万。我刚跟他开了半个小时电话会, 仔细了解了一下,这个确实成立的,但我认为这属于巨头的声音,未来就属于那种大的云计算中心,大的托肯工厂。因为托肯又分种类,比如 deepsea 的 托肯跟那个豆包的托肯都不一样, kimi 也不一样,开源闭源那个也不一样,还有高级和低级差好多倍呢。但是我们俩这个趋势是在了,我 第一次听说他妈卖托肯能挣钱。托肯你可以理解为就是就。你问豆包明天深圳天气怎么样,就是明天深圳天气怎么样,十个字嘛,等于大概差不多就五个托肯, 这个现在一百万个托肯才卖八块左右,到海外卖的贵。另外他托肯分高级和低级,分开源和币源。这个我也是刚刚搞明白,你买一台那个 b 三百的服务器, 大概六百万一台,两年半就能收回成本,这个回报很高了好不好。这个托肯真的我也正在研究,但我确实看到我这位这个小兄弟本来是亏损的,现在一个月他公司有四五十号人,第一次叫做倒卖托肯,一个月利润六十万,第一次看到 中国托克出海也是个大买卖。我现在我们是叫做跨境电商,把商品卖到全球去,未来就是卖托克,因为中国是电力便宜啊。你看现在那个智普的托克吊链已经是排在全球第一了。现中国的全球大模型消耗托克链,中国占六层,那个美国只占四层。 全球除了中美之外哪里还有大模型?你听说非洲什么日本啊,日韩啊,哪里搞出来这个大模型?我们已经习以为常了,但我在那地方没人才, 也没有这个技术。对,也没有这个基础设施。说托管出海是个好牛逼的生意,你不就是把无形的商品卖到全球去吗?哎,这是国家支持的,这跟那个挖那个什么比特币的矿还不一样。但托管出海这个是好大的买卖,我最近也在看,在研究。

朋友们,最近大家上网应该都被小龙虾和酱板鸭刷屏了吧,随着这个小龙虾爆火, talkin 这个词也被反复提到,很多朋友大概知道它跟 ai 有 关,但具体是什么也不太清楚, 网上消息比较杂。前两天看了一个大 v 提出这样一种假设,说 talkin 用来计算算力,而算力决定着生产力能够产生价值,所以在不久的将来, talkin 可能成为世界货币。 那么直到昨天,我妈突然跟我讲,说最近要把黄金给卖掉,想办法多囤点 tok, 我 就知道有义务要帮大家来做一期视频解决这些困惑了。今天呢,就跟大家聊聊 tok 是 什么,它将来会怎么发展,以及它到底能不能成为世界货币。 专业术语中,我们把 tok 定义为 ai 处理文字的最小单元,它是一种算力消耗的计费单位。 那既然叫做计费单位,其实大家就能够明白了,这和我们手机流量差不多流量的计费单位是 gb 吗?多少钱一个 g? 而算力的计费单位就是托克, 流量可以用来上网看视频,那算力呢,就可以用来深层视频。再说直白一点,和咱们家里的一个月电用多少度,今天跑了多少千米是一样的,本质上他就是一个单位。中文差不多一个字就是一个陀刻,而英文呢,大概是四个字母算一个陀刻。 明白了 tokken 是 什么,肯定马上就会有朋友疑惑说,既然跟流量一样,那为什么豆包、元宝这些 ai 不 收我钱呢?我每天让它生成那么多酱板鸭,耗费了那么多个 tokken, 难道不要钱吗? 这也太好了吧!其实不妨让我们回忆一下二零一一年左右,美团、大众点评等等这些外卖平台的千团大战, 当时资本疯狂的给我们消费者补贴,其实目的就是为了用钱烧到对手先倒下。现在各大 ai 平台其实也是处于这个阶段,因为后期一旦形成寡头甚至垄断,坐稳了这个生态位,那么就会是赢家通吃啊, 只是还没到时候,所以大家趁这段时间多薅薅大草羊毛,把各大模型玩个遍,搞清楚各大 ai 更擅长做什么,怎么做 是很有性价比的一件事情。等到后面生态成熟了,需求稳定了,这个算力就会跟流量一样,到时候全民基础设施统一标准化之后,那肯定要收费了。 有兴趣的朋友可以了解一下东数西算以及全国一体化算力网。好了,那么涛肯他究竟能不能成为货币呢?咱们先来看一下这个很多博主逻辑啊, 因为小龙虾爆火,这个蒜粒实打实的就成了生产力,那么生产力就会有价值,所以小龙虾消耗的每个托肯就会变成货币了。 呃,这个逻辑链条看似很完美,但其实有点投羊换鹿了,因为价值它并不等价于货币。蒜粒的价值目前只能在 ai 圈里面用。举个例子吧,比如说 对一个小朋友来讲,奥特曼是他的光,所以奥特曼卡片在他的朋友之间就很有价值,可以拿来换萝卜刀啊,换游戏皮肤啊, 对吧?但咱们不能说奥特曼卡片就是货币吧,所以 tucker 确实有价值,但是他只是算力世界的结算工具, 你比如说用 tok 来买菜就不太方便了。那么第二点呢?现在各大 ai 模型的 tok 完全不一样, open ai 的, 谷歌的,还有咱们国产的,这个计费的标准还有使用规则都不太互通, 这家 tok 是 没办法直接在另一家平台上使用的,这个流通就没办法做到。还有非常重要的一点, 要想作为货币,一定要保持币值的稳定,但是算力这个东西,他天生不稳定。为什么呢?因为算力靠电力驱动,只要电力的技术一升级,比如说咱们实现了可控核聚变,那算力成本马上就暴跌啊。这就直接把 tucker 的 货币论判了死刑。 不过虽然 tucker 他 无法成为货币,但是电力带来算力,而算力带来生产力,这个逻辑是没有错的, 这给了我们一个新的启发。要知道中国的年发电量居世界首位啊,占世界的发电量三分之一,那由于电力的物理特性,它是很难实现长距离低成本运输的,所以中国以前是没办法做到电力出口的。 但现在思路变了,如果我们可以把电力转换成算力,然后让这个算力通过光纤网络实现全球范围的低成本流通,那不就有意思了吗?如果中国能够给世界提供稳定的算力服务,那其实就完成了 ai 的 核心基建 以后,世界的很大一部分的生产力都跟中国的算力会挂钩了。那如果算力出口这一步走通,那这就是一条康庄大道。为什么呢?他不通过战争收割,不通过直民掠夺, 也不会像美元霸权这种干预,对吧?真的很期待这一天到来。最后呢,想跟大家聊聊我对这个货币的观点啊,我觉得在 ai 时代,个人手里最硬的货币其实就是我们的注意力和审美能力。 注意力呢,它可以帮我们深度学习完善这个认知结构,更好的让 ai 帮我们做事。而审美呢,它决定着我们能否从 ai 量产的内容中脱颖而出。 这两点以后有机会跟大家展开聊一聊。那么希望今天呢,大家在我的视频中有所收获,关注我不迷路,下次咱们接着聊。


这个突然爆火,国家如此重视的词源到底是个啥?为什么说掌握了它就掌握了数字时代的硬通货?咱们尽量别整那些虚头巴脑的技术名词。我给大家打个最接地气的比方,在 ai 时代之前,咱们用互联网,那是按流量计费的对吧? 你看了多少视频,下了多少文件,运营商收你多少钱流量,就是那个时代的数字通货。到了 ai 时代,这个逻辑变了。 想象一下, ai 大 模型就像一个超级智囊团,当你向他提问,让他帮你写代码,做表格,生成视频的时候,他的大脑得飞速运转, 他理解你的意图,然后组织语言回复你的。这个过程是需要把信息切碎了,切成一个个它能消化的最小单位来进行计算的。这个最小单位就是 token, 中文名称就是词源,它可以是一个词、一个字,甚至图片里的一个小方块儿。 以前的大模型,厂商卖的是能力,好比卖给你一台发电机,你可以自己发电玩。但以后呢?商业模式彻底变了,他们卖的是用量,就好比直接给你拉了根电线,装了个电表,你用多少度电就交多少钱。你每次让 ai 干活, 后台的那个电表都在疯狂转动,消耗的就是一个个磁源。所以这个磁源,它就是 ai 时代的数字电力,就是数字经济里最硬的硬通货, 谁手里的资源多,谁生产资源的效率高,谁就掌握了未来的财富密码。连英伟达的皮衣老黄都忍不住出来喊话了,他说现在的数据中心已经不是咱们传统印象里那个冷冰冰的存文件的仓库了, 它们变了,它们变成了工厂,是日夜不停吞吐数据生产 token 的 超级工厂,计算能力现在直接就等同于收入。说到这,真正让人热血。

董事长们,今天聊一个正在发生的很多人还没意识到的事,中国 ai 正在悄悄掌握全球的 token 定价权。你没听错,就是定价权。以前这个词咱们经常在能源矿产上听到,现在轮到人工智能最基础的原材料 token 了。 token 是 什么?你可以把它理解成 ai 时代的字。大模型每回答你一个问题,背后消耗的就是 token。 央视财经刚报导了,国产模型的 token 价格已经低到了国际竞品的三分之一甚至二十分之一。 这不是在打价格战,这是一个体系性的成本优势。我跟你说几个数你就明白了。从今年二月份开始,中国的大模型在一个叫 opi 聚合平台上周掉用量多次反超美国,而且持续霸榜。 调用量是什么?是全世界开发者用脚在投票。那问题来了,为什么我们能这么便宜?三个原因环环相扣。第一,开源。像 deepsafe、 v 四这种级别的模型发布就开源 api, 直接开放百万字超长上下文能力,以前是要花大价钱用的,现在直接进入普惠阶段。 更牛的是什么?八家国产芯片在同一天就完成了适配,这意味着开发者用国产芯片跑国产模型的门槛被降到非常低。第二,咱们有电价的优势,西部那些低价电力,配上这几年猛健的算力基础设施,让运营成本天然就比海外低一大截, 这个是别人想学都很难学的结构优势。第三,也是最容易被忽略的一点, ai 智能体时代来了。 以前你跟 ai 聊天儿一问一答消耗的 token 少,现在智能体要帮你干一个活儿,背后可能得调用工具、查数据库来回思考。几十步 单次任务的 token 消耗暴涨了二三十倍。用量这么大,价格弹性一下子就出来了,咱们便宜,而且便宜一个数量级以上,你说全球的开发者往哪儿跑?所以别把这当成简单的便宜货出海。这背后是中国 ai 能力的系统输出, 开源模型快速覆盖了东南亚、中东、拉美市场。很多海外公司直接把训练和推理任务部署在中国的算力中心,这就是 token 出海好。说到这儿,做投资的朋友肯定要问了,这会产生哪些投资机会? 整个链条得倒着看,最确定利好的是那些卖铲子的人。算力基础设施,不管哪家模型公司的 token 火了,它都得跑。在服务器上,都得消耗算力。 你看现在一个头部模型,日军 token 调用量就超五十万亿,这得多少服务器撑着?所以提供算力底座的出租 gpu 服务器的订单和开机率是最踏实的。再往深一层,弹性最大的环节可能在哪儿? 在芯片调用量爆发,算力需求就爆发。但现在海外高端芯片出口还在管制,但国产 ai 芯片的供需缺口会持续存在,而且可能越来越大,这里面谁能顶上谁的业绩,弹性就可能被放大。 有了算力和芯片的支撑,才轮到模型 a p i 层和应用层。模型公司不只是卖 token, 更是在跟全球最顶尖的对手抢夺开发者生态。已经有公司在涨了价之后,调用量不降反升, 这恰恰说明,当你的模型性能强到变成刚需,你就有了真正的定价权,那最终这些能力会落在五花八门的应用上。不管是 ai 视频剪辑工具在海外的爆火,还是跨境电商的智能客服, 它们是中国 ai 能力服务全球的最终触角。所以,整条线捋下来,一个正在发生的巨大变化时, ai 时代的基础资源定价体系,正在因为中国力量的加入而发生倾斜。 那些在海外的算力中心,那些疯狂增长的钓用量数字,是全球市场在为我们的成本优势和技术能力买单。这里面有长坡厚雪,也有大浪淘沙,但方向已经摆在这儿了。

大家现在天天在用 ai, 但是我敢说,百分之九十的人可能根本就不知道 token 是 什么。今天这期视频来给大家科普一下什么是 token。 首先跟大家说核心,它是 ai 处理信息的最小单元,不是凭空生成的虚拟代码,算是 ai 时代的数字硬通货了,背后藏着巨头激烈竞争的万亿算力生意。 token 的 本质是靠海量电力,添加 gpu 加速芯片、先进液冷散热系统这些实打实的硬件和能源,一步步转化出来的工业级产物 生产,它主要依靠二十四小时满负荷运转的超大型制算中心,这也是现在全球算力硬件和能源基建增强白热化的核心原因。为了二十四小时连轴转生产这些 token, 全世界的科技巨头都在疯了一样抢夺算力硬件与能源基建。某软 asia 为了填补算力耗电缺口,斥巨资重击核电站。 某歌云给最新的 tpu 算力集群全面铺设高价的液冷系统。某迅 a w s 一 边疯狂并购核能数据中心, 重金投入自研芯片,一边和 a 社签下了超千亿美元的十年算力长单。像国内的华子、某李云、某迅云某英,也都在疯狂扩建万卡级计算机群,布局自研芯片和液冷基建。 大家拼的就是这条 ai 时代的核心护城河。说白了,你在终端调用的每一次 token, 实质上都是在为这套宏大且极其昂贵的物理运转网络与硬件的折旧买单。像咱们平常使用 ai 聊天,内容深沉,看着只是输入一句话的事,可是它机器根本没法直接听懂人类的自然语言, 他得首先把你输入的句子拆解成像乐高积木一样小的 togg 单元,再转成计算机能处理的高纬度数学矩阵。之后大冒险会靠着海量数据训练出的概率分布,动用算力层层推算,顺着语句往下顺,选出最贴合的下一个词语。 如果 ai 输出的内容足够精准、有逻辑靠谱,还得提前经过较为严苛的数据清洗、精细化的指令微调以及底层的推理优化。国内有不少专业数据服务商,还有各类模型中间公司,深根的就是这块能决定 ai 输出质量的核心壁垒业务。 不同的 ai 算法对于 token 的 消耗量简直是天差地别,平时简单问个问题聊几句天, token 的 消耗量微乎其微,可一旦你要调用顶级大模型去做大型代码库的逻辑分析,或者是复杂的 bug 修复, 再或者是企业级的 ai 全流程自动化办公多模态,或者 ai 视频生成之类的,那头等的消耗量就会出现夸张的非限性暴涨。这是因为 ai 为了完成这些复杂的长周期任务,会在你看不见的后台不停的自我反思,观察环境,要用外部工具甚至反复进行多轮的自我对话。 这种自动化的循环机制,会让机器在底层及其高频的深层和预测语境,不经意间就收掉海量的算力资源。这就是为什么如今某英旗下的模型日均 token 消耗量突破一百二十万亿,某里旗下的模型日均 token 消耗量也突破了十万亿的核心原因。 以后大家看到 token 余额不足,就知道钱花在哪了。那么以上就是今天的全部内容,这里是 bryce, 我 们下期再见。

这个你肯定没有听说过,刀啃出海,刚刚跟多年前做海外的业务的朋友聊天,他说他准备做这个事,而且这个事情是非常明确的,在两会都被提出来了,未来绝对可能会成为一个非常庞大的产业,但是说实话挺有门槛的, 我觉得可以给大家聊一聊,做不做不要紧,要知道是什么吧? 就是你现在用的这个所谓的 ai 软件,什么豆包啊, open ai 啊,千问啊,然后 deepsafe, 它每回答你一个问题,每帮你产生一张图片,都需要消耗 tokken 的, 而 tokken 是 需要花钱买的, 你说现在也不用花钱啊,是因为大厂还没有给你收费,而且文字的消耗的 top 是 非常少的。你这么说吧,前段时间我养个龙虾,然后一天的话大概要销售四十块,而且一瞬间大家都觉得所有大厂都在推, 因为这些 ai 的 大厂发现 ai 变不了线,你用了什么豆包啊,然后千万啊, deepsea 啊,消耗的 top 太少了, 所以他要推出一个,他要推出一个滔肯,消耗非常多的东西。用过龙虾的都知道,一旦真正的 ai 代替了你的工作,就要消耗非常多的滔肯, 你就需要往里边充钱。这里边有一个非常牛逼的数据啊,在二零二五年的中国,滔肯的消耗消耗量应该是三十万亿,而二零二六年上半年截止到现在已经一百八十万亿了,就这个增长速度, 知道为什么大厂现在布局 ai 了吧?你看腾讯都把所有的工程师拉出来,让所有人都去下载这个龙虾, 而且你看春晚也是哐哐的砸广告对不对?现在什么行业有这样的增长?甚至现在还没有到 ai 大 爆发的时候,那桃肯这个东西值多少钱呢? toker 出海又是什么呢?首先我们为什么说 ai 的 时代绝对是中国的时代,因为只要你用 ai, 你 就会消耗 toker, 而中国是全世界 toker 成本最低的地方,因为 toker 的 成本就是电力和算力, 如果你现在在新疆买一度电,你可能只需要两毛钱,那这一度电通过算力就能产生五百万的 toker, 五百万的 toker 在中国的大厂就卖你十块钱,这已经翻了二十倍了。但是现在在美国, oki 这样的大厂五百万的掏坑可能需要四百。扎里芒格说过,人挣不到认知以外的钱, 所以你要向顶层人学习认知,然后我们再落地去做事。你全世界最有钱的那帮富豪都在干嘛?你看孙雨辰,然后去年就说要看发电,然后那个特朗普 啊,要搞这种石油,然后马斯克去搞这种上太空发电啊,做太阳能。当时我还不太理解,现在我们认知够了,那我们普通人应该怎么去赚钱呢?下期我们讲一讲怎么让普通人做掏坑出海。