中国电信宣布要从卖流量转向卖 token。 一 家打电话、发短信、装宽带的公司突然说要卖 ai 的 燃料,这意味着什么? 你回想一下,二十年前,中国电信卖的是什么?打电话按分钟收费,发短信一条一毛。后来四 g 来了,电话短信不赚钱了,开始卖流量,按计收费。 现在 ai 来了,中国电信又要转一次货价,从卖流量转向卖 token。 为什么?因为他看到了一组数据,中国日均 token 掉量已经突破一百四十万亿,两年涨了一千四百倍,而且还在以每个月百分之几十的速度往上涨。 流量的增长已经见顶。你每个月用多少 g 流量?基本就那样了,但 token 的 消耗量才刚刚开始爆发,每一个用 ai 的 人,每一家用 ai 的 企业,每一个跑起来的智能体,都在不停地燃烧 token。 中国电信看到的是, token, 就是 下一代的流量。 这件事听起来离你很远,但你想想,十几年前,你听运营商要卖流量的时候,你也觉得跟自己没关系。后来呢?你每个月花几十块钱买流量,刷短视频,点外卖、打车、网购,你的整个生活都建立在流量上面, tokyo 正在走同一条路。 现在你用豆包,用 deepsafe 免费问问题,觉得 token 跟你没关系,但等智能体替你干活, ai 帮你管公司,你的手机每个操作都在调用大模型的时候,你每个月就要交 token 费了,就像现在交话费和流量费一样。当中国电信这种级别的公司开始转向卖 token, 说明这件事不是概念了,是倒计时。 二十年前交话费,十年前交流量费,以后交 token 费,运营商换货价的速度就是时代变化的速度,他们比任何一人都清楚下一个十年该卖什么。我是文思,关注我,每天带你看懂 ai。
粉丝3.4万获赞37.2万


不是吧,电信要开始卖 token 了,那移动跟联通是不是也快跟上了?是不是都要推出个九十八幺二八幺九八的套餐?超出套餐部分十块钱一个 token, 你 们这三大运营商垄断完流量又想来垄断 token 了,是不是也得等我们这些韭菜涨涨再来收割呀?

token 翻译成中文叫什么?叫词源,是模型处理文本的最基本单位。 token 和字呢?有什么区别? token 呢,可以是一个字,一个词,甚至半个字,那这是谁规定 的?是模型看了大量人类文字统计出来的,这样表达呢,更省事。常见的字和词就用一个 token 表示,其他的就用多个 token 拼接。 一个 token 到底是多少钱? deep 呢?输出一百万 token 呢?约等于三本新华字典只需要三块钱, gpt 五呢更贵,超过九十块 token 和上网流量收费是一样的道理吗?不是的, token 收的是计算费,是生产成本,而流量收费呢,是搬运费,不是一回事。为什么养龙虾要烧 token? 是 因为龙虾要用大模型思考和回答问题,因为大模型按 token 收费,所以就说烧 token。 本地部署大模型是不是就不用烧 toon 了?还是要用到 toon, 因为 toon 机制本身和部署方式无关。本地部署呢,不需要按量付费,但电费得自己掏,算上硬件成本不一定划算。如果我把一段话复制粘贴进去,是不是就算一次 toon 不是 文字越多呢?计算的输入 toon 数量就越多? 我问的问题很长,但答案很短,是不是只扣答案的 token 不是, 输了 token 呢?也要算钱?表情符号算几个 token 会不会比一个字还贵?常见的表情呢,是一个 token, 不 常见的会用两到四个 token 拼接表示。 deepsea 和 gpt 的 token 是 一样的吗? 不一样,互相不认识。 y, y, d, s 这种网络词是几个 token, 一 般拆成 y, y 和 d s 两个 token, 要是这个词足够火,也可能被模型当做一个整体。同样的问题,我上午问和下午问,输出的 token 数会不一样吗?不一样,模型输出具有随机性,每次输出的 token 数量不同。 那小龙虾帮我下载电影是否要按 token 计费?小龙虾思考怎么下载?打开下载网站,执行下载命令,这些都需要消耗 token, 但是下载电影本身不消耗 token, 因为电影不是大模型生成的, 电影是存在第三方服务器上,只消耗下载流量,不消耗 token。 为什么我和 ai 聊得越久,回复同样一句话,花的钱就越多? 模型是基于对话历史进行回答的,所以你所有说过的话呢,都会参与计算,计算成本就越高,这也是 ai 还需要按照输入 token 数量计费的原因。 怎么才能少用点 token 输入更少的提示词去掉?你好,请问这类废话规定模型输入长度,加一句五十字以内回答,但很有可能问题没有说清楚,回答呢也不够准确。如果前后问题呢?不相关也可以新开对话,避免历史对话参与计算。 托管是加密的密码吗?不是,托管只是一种文字编码方式,虽然你看不懂,但他并没有加密。 图片和文本的托管是一样的吗?不一样,图片会切分成很多小小的方块,每个方块呢?当做一个视觉托管,就像拼图一样。托管是为了收费而发明的吗? 不是,托管是技术发明,是为了能表达和能计算,只是计算的成本和托管数量正相关,所以就按照托管数量收费。我使用豆包没有付费啊。为什么说托管是收费的?大厂为了抢占市场让你免费使用,成本呢?暂时不用你出, 如果你是企业用户或者养龙虾就需要支付费用。我在一段话里疯狂敲空格, ai 是 视而不见还是会偷偷扣我的钱? 空格也算钱,虽然有的模型会把几个空格打包,大部分时候你多敲一个空格就再多烧一份算力。那 ai 产生的废话是不是能退费?不能,因为废话也是显卡辛辛苦苦算出来的。

小米大模型公布了涛肯包月套餐的价格,性价比的话我觉得还好,但最让我欣喜的是取消了五小时窗口期调用次数的限制。包月套餐额度 可以在一次性集中的使用,而不用像其他大模型一样会有五小时窗口期调用次数的限制。特别是对于集中性使用大模型去完成工作的, 不会因为五小时调用次数的限制而影响任务的进度。为什么每一次这种比较方便?大家的这种方式大多都是由小米率先发起改革的呢?

你以为你在跟 ai 聊天,其实你每发一句话,他都在疯狂烧显卡电费和服务费。 ai 他 不按字收费,而是按 token。 token 呢,就是他处理文字的最小单位,中文大概一个字就是一个 token, 英文呢,三到四个字母就是一个 token。 你每发一句话,他背后会拆成几十上百个 token 来计算。那为什么处理 token 会这么贵呢?因为每处理一个 token, 他 都要动一次算力,而算力就等于显卡加电费加服务器,越复杂的内容,就需要动越多的显卡。 你输入十个字和一百个字, ai 的 计算量可能差十倍。但真正让高级 ai 贵的原因,其实不是因为头肯多,而是因为他想的更深。 普通模型处理一个头肯可能只需要思考两到三层,但顶尖模型可能会思考二十层,甚至更多。 也就是说,推理的越深,显卡压力越大,计算成本不是呈性上涨,而是成倍飙升。 所以你付费买的不是智慧,而是背后那一大堆为你烧掉的算力。而故事的起点,就是一个小小的 token。 这里是 ai 小 白学 ai 关注我,我们一起见证 ai 的 成长,我们明天见,拜拜!

你的话费又要涨价了!这一次不是流量乱加价,是三大运营商直接换了整个赚钱逻辑。 你回想一下,最早收短信费,一条一毛,后来收通话费、长途漫游,再到流量费五元三十兆,每一代都是先贵再普及,最后降价,然后立刻推出新的收费项目。现在真相来了,流量马上白菜价,但你的话费可能更贵, 因为中国电信直接官宣,全面转向 token 经营,资本开支压降,算力疯狂加码,未来不卖流量,主打 token。 很多人问,为什么非要把 token 当主营? 我一句话讲透, token 就是 ai 的 算力。 ai 时代的通用流量,是你生活、沟通、娱乐、工作、创作全都要烧的东西,刷智能内容,玩下一代游戏, ai 聊天、视频娱乐,普通人每天都要用。 tocan 在 尝鲜群体里已是非常火爆了,输入和输出双向收费,像现在火爆的视频生成,多是一秒计费的普通视频基本在两毛到八毛左右,高质量的成倍增。像不像当年的话费市场购涨,运营商的营收也将迎来暴涨。 但最关键的是,这不仅仅是多一项收费,同时也说明个体经济真正要崛起了。 token 一, 普及,普通人用 ai 办公、做内容、搞副业、创业、娱乐交流,甚至近期火爆的养龙虾,门槛直接降到地板。 以前是平台赚大头,你只能消费,未来人人能用 token 驱动 ai, 人人能创造价值,个体力量第一次能跟大平台站在同一条赛道上。 再加上国家要做大生态,探索国际化,意味着 token 不 只是国内用,是全民参与、全球通用的超级赛道。 短信通话流量 token 世代收费革命,这一次体量最大、覆盖最广、机会最猛。流量降价是为 token 让路, token 普及是为每个人的机会开路,运营商赚大钱。而我们普通人真正迎来了个体崛起的黄金时代。那么 token 时代来了,你觉得是机会更多还是花费更高?

这个月公司部属的 ai 龙虾智能体进度如何?呃,还在推,还有裁员,要快。好的,这个养龙虾他的偷虫费。什么是偷虫?就是词源 就很贵,安装费还要五百呢。要五百,就这么个东西,你不能自己学着装吗?这点事你都干不了,你迟早被 ai 取代。 老板,咱们要不用天翼 ai 云电脑养鹿下吧,那个操作简单,首页还免费。哎,五百就五百,你能不能打开一点?对公司长远发展投资贵点不算什么,你给我找一个人定制一套顶配的给我 看见没?这才叫 ai, 这才站在风口吃到红利。要不说您是老板呢,眼光就是长远,哎,来,小百万,把内部报价表发到部门群里,并通知大家下午两点集体开会。 喂,骆总,北总,你这个报价不地道啊,合作取消吧。啊?取消?哎,别呀,骆总不是哎。嗯,赶紧赶紧,来人,把这破玩意给我卸了。老板这才装一斤钱花,你给我整一堆破事,这些钱够我装七八个世界上了。老板说高端 ai 得专业操作,卸载也要三百。什么又要三百,早说让您用天翼 ai 云电脑养龙虾了,首月零元,操作简单,安装卸载都方便,关键不守在云端也不会泄露您的本地信息啊。行吧,你把你刚刚说的那个天翼 ai 云电脑等会给我出个方案。崩溃了,我现在崩溃了。

token 的 中文名叫词源,是 ai 模型处理文本的最基本单位。 token 和汉字有什么区别? token 可以 是一个字一个词甚至半个字。在模型的向量空间中,不单可以对这些词进行编码,还可以方便地计算它们之间的关系。 一个 token 多少钱? deepsea 官方接口数出一百万 token 大 概三本新华字典的内容只需要几块钱,国外的 gpt 五 cloud 就 很贵,要几十块钱。 talk 和上网流量收费是一个原理吗?不是, talk 收的是计算费,属于生产成本,而流量费是信息的传输费,不是一回事儿。

用户问 ai 大 模型一句,今天天气怎么样,他马上告诉你答案,我们觉得这很自然,就像朋友聊天一样。但你有没有想过, ai 是 怎么听懂这句话的? 其实在我们看不见的背后, ai 首先把这句话拆分成了一个一个他能理解的小碎片,每个小碎片对应了一个数字, ai 就是 通过这些数字来理解语义的,而这些小碎片就是我们最近经常能听到的一个词。 token, 也叫词源。大模型处理信息为什么必须要用 token? 直接用人类语言不行吗? 腾讯研究院教授级工程师王鹏解释说,计算机呢,只认识数字,听不懂人类语言,但如果每一句话都翻译成一组数字,人类的语言有无穷多种组合,这个存储量就太大了,根本不现实。 所以大模型的做法是先把自然语言拆成了一个一个最小的语义单位就是 token, 然后让计算机去理解和计算这些 token, 从而感知整句话的意思,也同样做出回答。大模型技术帮助计算机能把我们的日常的语言 拆成一个一个的机器能理解的最小的语义单元。 ai, 它其实有点像查字典,它要去它的库里去查一个一个的语, 一单元的意思到底是什么?这个与单元彼此之间是可以去计算的,比如说国王加女性就是女王,国王加配偶就是王后,就这样的方式,计算机它又能理解,它又能计算。因为每家模型都有自己的分词法, 怎么拆怎么算,规则都不一样,所以托肯又有点像各家模型自造的方言,互相之间没法通用,模型有自己的分词法,还有自己的向量的算法, 自己有一套自己输出的理解方式,彼此之间是不能互通的。但是同一个模型内部,它是用同一套方法。我们每一次与大模型的对话背后都在消耗着成千上万个 token, 有 消耗就有成本,有成本也会有价格。 目前国内 token 的 定价是在怎样的水平?又会基于哪些成本定价呢?王鹏说, token 的 生产,它其实也是一个工业化的一个流程,它最大的一头就是赚利,成本 很贵的,这样的这个 gpu 显卡,它肯定有它的折旧费,其实第二笔钱就是电费,它非常的费电,所以说这两样加一块其实就已经是 token 成本的大头了。定价现在大概是可能百万级的,这个 token 应该是几毛钱几块钱,这样的价格, 一百万个 token 相当于什么呢?可能就是你一本红楼梦加一本西游记,差不多就是这样一个概念。说到这儿,很多人可能会问,我天天在用大模型加一本西游记,差不多就是这样一个概念。说到这儿,很多人可能会问,我天天在用大模型,我没有付。 其实大家平时问个问题,聊两句天,或者简单让模型给写个文本,消耗的 token 非常少,少到厂家愿意免费请你用。不过对于一些重度 ai 用户来说, token 的 费用已经实实在在地出现在了账单里。 为什么这类智能体这么烧钱?王鹏解释说,因为以前我们用 ai 聊天,现在是用 ai 干活,这完全是两个量级,因为我们以前 说话聊天这件事是很省 token 的, 国内的厂商的策略就是先免费,但是现在的问题为什么大家开始重视起来?因为现在有了智能体这个东西,它除了 说聊天说话以外,开始干活了,包括我最近在写一本书,这本书的书稿可能要几十万字,它为了写着几十万字,可能要读我之前上百万字的我的论文,我的一些其他的作品,让它整理分几百美金。 包括我日常,比如说我做一个 ppt, 它其实又要看图,甚至还要背后还要看视频,帮我去这个排版做了一个下来。目前来看,其实成本还是很高的,可能几十块钱的人民币。 数据显示,到今年三月,我国的日军 token 的 调运量已经超过了一百四十万亿,相当于一千万亿个中文词汇,也相当于二百五十个中国国家图书馆的资源量。 随着钓用量的大幅增长, token 的 价格会不会出现变化?王鹏认为,长远来看, token 的 价格一定会是越来越便宜的。不过近期行业也出现了小幅的涨价, 近期其实有一个趋势,大家都在涨价,倒不是说它一定要赚这个钱,而是说之前定价可能跟成本太接近,甚至说有时候在赔钱,这量一大了,可能大家都无法承受了。为了可出去发展,其实近期还是要适当的去提这个价格。今年一来就是大量的 非程序员开始用这样的 agent 的 工具去提效了,那他也会逐渐习惯于大量的去消耗。但是这个钱,这个成本,其实我觉得可能未来不一定是由个人来承担,很大的概率应该是企业去承担, 因为这个东西实际上是给老板在干活,其实是在提高企业的生产效率。如果说大量的消耗,可能成本会交给企业去承担。就像我们现在大厂都是给员工去发 token, 从随口问答到深度协作, toc 早已不只是技术的最小语义单元,更成为了丈量 ai 与人类关系的新刻度。它燃烧着算力与电量,助推生产力的变化,也标志着智能时代从免费走向普惠、从尝鲜走向刚需的必经之路。 收费与否只是表象,真正值得期待的是,技术在成本与普惠之间,走出一条更可持续、更贴近普通人的未来之路。

一个例子你就能明白 token 是 什么,你把 token 理解成电话费,那么公用电话亭打电话是免费的,也就是我们日常使用的豆包 tips 这种开源大模型的 app 和网页端。但是你比如说你要在自己手机上打电话的话,首先你得你得安装一个电话卡吧,全网通电话卡的话,你可以把它理解为安装 openclock, 那么你需要给 openclo 装一个模型进去,也就是说你理解成你要给你的电话卡选择一个运营商,那么这个运营商你选择的是移动电信还是联通,那么也就是说你的大模型选择的是豆包 dipic 还是千万这些。 这时候你在手机上打电话都是计费的,所以要收费。很多人不明白 tok 为什么要收费,是因为你现在在你个人设备上使用,你可以把它理解为在自己设备上使用或你公共电话亭打电话免费,而我们手机上打电话是要收费的, 大家就可以这么类比的理解,只不过打电话运营商是按分钟收费的,而大模型是按 token 收费的,那么你这里的 token 就 可以粗浅的理解成字数。

现在各种各样的 ai 大模型,是不是让你的工作生活都方便了不少?那如果我要跟你说啊,未来大模型可能要收费了,你怎么想呢?如果大模型要收费,那 token 就很可能成为计费的单位。 我们先来说说大模型是怎么消耗 token 的,比如啊,我们问大模型一句,今天的天气怎么样,他马上呢就能给出答案,我们觉得这也很正常哈,就像朋友聊天一样。但是你有没有想过,大模型是怎么听懂这句话的呢? 其实呢,在我们看不见的背后呢, ai 首先是把这句话拆分成了一个一个他能理解的小碎片,每个小碎片呢,都对应一个数字, ai 呢,就是通过这些数字来理解羽翼的,而这些小碎片就是我们最近经常能听到的一个词。 token, 中文呢,可以叫词源。大模型处理信息为什么 一定要用 tok? 直接用人类语言不行吗?那答案呢,肯定是不行,因为计算机啊,他只能认识数字,听不懂人类语言。但如果每一句话都翻译成一组数字,那人类的语言有无穷多种组合,这个存储量就太大了,根本就不现实。 所以大模型的做法就是先把自然语言拆分成一个一个最小的语音单位,就是 token。 比如说,国王这个词是一个 token, 女性这个词呢,也是个 token, 这两个 token 在一起,就是国王加女性,那就是女王,那国王加配偶呢,就是王后。 计算机呢,就是这样去理解和计算这些 token 的,从而感知整句话的意思,也同样做出回答。这里需要注意的是呢,不同的大模型之间呢,他都有自己不同的 token 分次方法和输入输出的理解方式,所以不同大模型之间的 token 并不能 不通。总之啊,我们每一次和大模型对话背后呢,都在消耗着成千上万个 token。 而生产 token 那是有成本的,主要就来源于算力成本和电费,那有成本也会有价格,那目前呢,国内的价格大概是在百万级的 token 几毛钱或几块钱左右, 那一百万个偷看呢,就相当于一本红楼梦加一本西游记差不多呢,这个量。说到这啊,很多人可能会问了,我天天都在用大模型,我没有交过钱呢,这偷看的费用我也没有付啊, 那是因为你是大模型的轻量用户,就是平时问个问题,聊两句天,或者是简单的让大模型给你写个文本,这样消耗的 tok 是非常少的,少到厂家愿意免费请你用。但是对于依赖 ai 生成视频的创作者,或者是其他的 ai 重度用户, tok 账单其实是很常见的。 尤其随着 ai 智能体的出现,比如说最近火爆全网的龙虾,那它可以自动的处理邮件,做表格,甚至呢写代码,两天呢,就能够烧掉几千万 token, 费用直达上千元。 随着人工智能继续高速的向前发展, ai 能帮我们做的事呢,无疑会越来越多,我们也期待着 ai 能够让我们更加的轻松,最好呢,是能帮我们把活都给干了。 到那个时候,像龙虾这样的智能体,甚至是更高效的智能体都会被大家普遍的去运用,那么普通用户消耗的偷啃数量也会呈指数级增长。 虽然说随着技术的发展, token 的价格肯定会越来越低,但是千万级别的消耗完全免费似乎不可能。那么问题就来了,你愿不愿意为 ai 大模型的使用付费呢?付多少可以被接受呢? 有人说呀,我接受包月套餐,就是跟之前的手机流量一样。有人说呢,我用大模型都是为了让工作更高效,我的公司是不是可以给我承担 token 的费用呢? 现在呢,也确实有企业在给员工发 tok 了。你说未来会不会有一种炫耀,就是我的 tok 额度是用不完的呢?

token 的 中文名终于定了,前段时间养龙虾的朋友肯定听过这个词,但你真的知道 token 是 个啥吗?其实特别好理解,工业时代我们交电费,电信时代我们交话费,互联网时代我们交网费。到了 ai 时代,我们交的就是 token 费。你每问 ai 一 句话, ai 每回你一句话,都在消耗 token。 所以养龙虾的朋友为什么账单吓人?因为 openclaw 帮你干活的时候,每一步都在烧 token, 就 像你打电话一样,每一秒都在计费。但 token 这个词一直没有正式的中文名, 就在前两天,官方给托肯正式定名叫词源。为什么?因为 ai 要理解你说的话,得先把你的文字拆成一个个碎片来处理,每个碎片就是一个词源,它就是词的元素。记住,以后别人再问你托肯是啥,就两个字,词源。 ai 时代的电费,你觉得这个名字起的好吗?

朋友们,运营商们正在集体换燃料。电信和移动最新宣布,战略重心从流量转向 tock。 为什么?因为传统语音流量业务增长已几乎停滞。与此同时, ai 爆发,我国日军 tock 掉用量已达一百四十万亿,是两年前的千倍以上。 电信已将滔刻服务定为经营主线,为一家企业年消耗就达一点二万亿。移动则通过养龙虾等 ai 应用,用滔刻拉动算力需求。运营商手握网络节点和政企客情,这是他们打赢 ai 基础设施战场的独特优势。当巨头们全力压住滔刻,他们唯一的退路就是向前冲。

ai 大 模型呢,为什么要按照托肯收费?同样是一百万的托肯呢?为什么价格能差三十倍?等等,你可能会说啊,我们平时用的豆包啊,元宝啊,也没交过钱啊。没错,咱们平时用的网页版或者 app 呢,确实是免费的,那是大厂为了抢占市场给的福利。 但如果你是专业用,或者是使用最近爆火的小龙虾,那就必须通过 api 接口来调用大模型,按量付费,烧起钱来也是非常吓人的。那这些钱到底烧在哪了? 当模型正式发布后呢?它的使用成本其实由两个部分组成。第一部分呢,是固定成本,也就是模型上线前已经砸下去的钱, 包括前期的研发与训练投入,还有算力基础设施的建设,像建机房,采购显卡,配齐内存和硬盘。最近大家可能也注意到了,显卡和内存价格是一路上涨,很大程度就是因为 ai 需求暴增呢,把硬件价格也推高了。但这些成本呢,有个特点,它是沉没的, 在模型发布前呢,就已经支出了,随着用户越来越多,这部分费用呢,会被不断贪薄,贪到每一次调用上呢,它的占比会越来越低,甚至低到可以忽略不计。 那第二部分呢,是动态成本,也就是每一次调用模型实打实消耗掉的东西,每次计算都要消耗电力,还需要占用内存, 数据在传输过程中呢,也需要消耗网络流量。而所有这些消耗呢,都和 token 的 数量呢,直接相关。这里呢,快速同步一个概念。到底什么是 token? token 的 中文呢,可以翻译为词源,可以是一个字,一个词,一个分词,甚至一个字节。在大模型中呢,被表达为一组数字序列,用于计算下一个 token。 token 越多呢,模型的计算的时间就越长,占用的算力和资源呢,自然就越多。所以,按照 token 数量收费,本质上是一个多用多付少用呢少付的计费方式, 非常直观呢,也非常合理。这像什么呢?就像我们每个月交的水电气一样。从这个角度看呢, ai 正悄悄完成一个转变,它正从一项技术、产品呢,演变成一种基础服务。我们想要获得智力呢,就需要购买算力。 说不定以后每个月的水电账单旁边呢,就会多出一行 token 费用。那既然都是按 token 收费呢,为什么不同大模型的价格差这么多?比如你输入一百万 token, deepsea v 三的收费呢,是零点二八美元,而 g p t 模型呢,要二点五美元。如果是输出 token 呢,差距更夸张, deepsea 呢是零点四二美元, g p t 呢是十五美元,整整差了三十多倍。 同样都是 token 呢,为什么价格能差出这么多?其实 token 的 价格呢,主要是由两个因素决定的。第一,电力和人工成本不同。在美国、中国、中东等不同地区,电价运为成本,人力成本差异非常大,而这些呢,最终都会反映到价格里。第二呢,算法不同。 好的算法呢,就像一台省油的发动机,同样是跑一百公里啊,有的车呢,只需要三升油,而有的车呢,却要烧掉十升。大模型也是一样,算法呢,设计的越巧妙呢,达到同样质量的输出,消耗,算力呢就越少。所以优化算法是模型研发人员最最重要的任务之一。 算法越高效,成本就越低,价格自然就更有优势。在这方面呢,有很多创新的工作,比如 deepstack 引入的 mo 机制,想了解的朋友可以翻看我之前的这期视频。 那为什么输出托管的价格比输入托管贵这么多?原因呢?很简单,输入和输出呢,干的活不一样。输入的托管呢,是你的提示词, 模型可以一次性全部读取参与计算,多一个少一个呢,对显卡的负担影响呢,是有限的。但输出 token 就 不一样了,它是一个接一个逐自生成的,每生成一个 token 呢,模型都要重新算一次。输的 token 是 配角,输出的 token 呢是主角,所以给出的片酬呢,就不一样。 具体的技术原理呢,也可以看我这期视频,理解注意力机制对托根计算量的影响。这里呢,再顺便澄清一个常见的误解,托根的发明初衷呢,不是为了计费。 托根是纯粹的算法创新和工程发明,是为了把人类的语言翻译成机械能听懂的数学坐标。 只是后来大家发现呢,托管的数量呢,恰好决定了计算量,这才顺理成章的用它来计费,绝不是因为要收钱才搞出来这么个复杂的概念。当这里可以像自来水一样按量计费,一个属于算力文明的时代就真正开始了。

用大模型心疼钱?先搞懂什么是 token, 不 然你可能一直在背多收费。 ai 收费和计费全都按 token 算,不是按汉字算。那什么是 token 呢?简单说,就是 ai 处理语言的最小单位。 英文来讲,一个单词可能是一个或多个 token。 中文来讲,一个汉字通常是一到两个 token。 举个例子,今天天气很好,这六个汉字在 ai 眼里可能是八到十个 token。 我算笔账你就懂了。假设你用 gpt 五输入加输出一起算,发一千个汉字约等于一千五百个 token。 一 千五百个 token 乘以价格大约等于几分钱。但如果你发一万字的长文档,几毛钱可能就没了。 这就是为什么长对话的 ai 会突然失忆,因为他的上下文窗口,也就是他的头根上线满了,只能把前面的忘掉。 我们简单来记,中文等于字数乘以一点五,等于 to 整数。写题时的时候能精简就精简,既省钱又高效。当然,现在已经有很多免费的大模型,比如豆包,已经非常好用。 关注我,明天讲为什么 ai 会失忆,以及怎么让 ai 不 忘事儿。

大家好,今天我们来拆解 ai 领域最受关注的 token 收费机制,帮你理清每一笔消费。 首先明确 token 是 ai 模型处理文本的最小单位,一千 token 约等于七百五十个中文字。 主流 ai 平台都会区分输入和输出 token, 两者的计费单价通常不一样。海外头部平台 openai gpt 三点五 turbo 输入仅零点零零五美元每千, token 性价比极高。 gpt 四 turbo 和 gpt 四 o 则针对复杂任务,输入零点零一美元每签, token 输出零点零三美元每签。国内平台比如通一签、问闻心一言,基本按人民币计费,签 token 成本在零点零零七到零点零二四元区间。 多数平台给新用户提供免费额度,比如十万到五十万免费 token 足够日常测试使用。 需要注意,上下文越长,对话越复杂, token 消耗就越多,成本也会相应提升。 简单任务可以用低价模型,比如 gpt 三点五,没必要调用高价的 gpt 四能省不少成本。优化 prompt 也能减少 token 消耗,比如明确要求简洁回答,避免犹豫输出。 企业级 api 调用的收费标准和个人版不同,通常会有批量折扣和专属服务。总体来看, ai token 消费门槛极低,合理使用就能以低成本获得高效的 ai 服务。

三月二十二号,当微信正式上线了 cloudbook 插件,宣布啊全面接入了 opencloud 智能体。那一刻,整个中国 ai 行业都闻到了一股熟悉让人脊背发凉的杀气。兄弟们,你们还没有反应过来这意味着什么吗? 十三年前,微信凭着一己之力,把运营商一毛钱一条,每年九百一条的短信生意啊,硬生生的打上了它的壁环。 还是那个拥有十亿用户的微信,带着他的龙虾矩阵杀回来了。他这次瞄准的不是别人,正是现在所有的 ai 大 魔蝎的厂商的命根子, talk, 按次收费的模式。记住这句话啊,所有按次收费的管道生意,在社交巨头的生态面前,通通都是纸老虎。咱们来盘一盘,现在的 ai 市场跟当年的短信市场,你看像不像?简直就像是像素级的复刻。 那个时候的运营商啊,掌握了通讯通道,你发一条,他收一毛。现在模型厂上掌握算力的通道,你用一次,他收几分钱的托管费?大家都在那卷价格,小米卷完阿里卷,阿里卷完腾讯卷,可是结果呢, 普通用户根本就不买账,大家都是薅一把免费的羊毛就走了,根本就养不成付费的习惯。数据显示,现在百分之五的托管消费啊,都在企业端, c 端的用户占比连百分之十五都不到。 这个时候啊,微信进场了,他压根就不给你去卷什么 talkin 多少钱,他直接把 ai 变成了聊天框里的一句话,微信的逻辑太流氓了,但是啊,也太无敌了, 我把 talkin 全部免费掉,我靠生态来赚钱。你想想啊,你是愿意去下载一个专门的 app 研究半天的提示词,还得绑卡续费?还是愿意直接在微信里面去喊一声,哎?帮我订张机票,帮我写个周报,帮我查一查这家公司的底细, 这就是降维打击。如果 token 彻底免费了, ai 行业会发生什么天崩地裂的变化?第一,所谓的百魔大战可以宣告结束了。未来啊,是入口营者通吃。当技术不再是门槛,流量和入口就是唯一的真理。 除了微信自己的抖音,阿里的淘宝,百度的搜索,这些手握国民级入口的大厂,会瞬间瓜分掉百分之九十的普通用户。那些既没有入口又没有核心芯片技术的中小模型的厂商,如果不转型,结局只有一个,在价格战的废墟里边彻底消失。 第二, b 端市场将成为唯一的血战场。通用模型免费了,但是行业专属的模型永远不会免费。就像当年的短信收费没了,运营商开始转头去做政企数字化,做五 g 的 专网。未来的大模型的厂商,必须从卖蒜粒的包工头转型为卖解决方案的服务商。 华为已经说了,二零二六年是行业加 ai 的 深耕之年,制造业要提效,金融要分控,医疗要辅助诊疗,这些垂直领域才是真真正正的金矿啊。那么,谁能够在这场洗牌中笑到最后? 除了手握入口的巨头,还有一类人活得很好,那就是掌握底层算力和芯片的人。马斯克为什么拼了命要去建两纳米的芯片工厂?为什么要往太空里边去搬运算力? 因为人家看透了,当托克免费,需求量会成指数级的爆炸,算力,将会成为像水电煤一样的技术物资。你平台玩的再花,底层架构还得用我的。 苹果的 ceo 库克说, ai 是 对人能力的放大,而不是取代技术的终极意义。从来都不是为了去建立一个又一个收费的围墙,而是为了打破壁垒。 十三年前,微信没有消灭通讯,它只是让我们的沟通更直接、更自由。今天, token 免费也不会消灭 ai 的 大模型,它只是让 ai 从极客的玩具,变成人人都能够触碰到的普惠工具。 当 token 不 再计费,当 ai 像呼吸一样自然,这场变格才真正开始。我是明哥,关注我,带你看透流量背后的商业真相,我们下期见!