toker 是 什么?现在 ai 圈里面都在讲 toker 出海、 toker 代理、 toker 中转等等,都能搞到大钱,是普通人千载难逢的翻身的机会,那这个事情有没有这么神?当然很多人都在讲这个,确实是能搞到钱是个机会, 也有一小部分人说这个,他们就是在割韭菜呢。那 toker 是 什么东西?其实它简单来说就是变利,变成算利, 再转化成投币,用中文名说的话就是资源。比如说你在淘宝上面问他一个问题,那他回答你的问题的时候呢,就要消耗很多这个投币。 我再举个例子你就听得明白了,比如说你手机想上网,那你就得去这些三大运营商上面去买那个流量包,当你发出去一张图片之后呢,你这个流量就消耗了多少多少兆,大概就是这个意思了。 那这个头可能他后面就是需要这个电力,还有啊算力啊,包括一些芯片啊、基础设施啊、大圆模型啊等等些来去支撑的。 比如说些像之前那种大的企业支持我们去用这个豆泡的时候,他要花了掉很多很多钱去做建设,去做维护的。 所以呢,我们只是简单问个问题,可能用免费版本就可以,但是你真的需要去很专业为你这个工作,需要去完成你的工作任务的话,那你就得去要用专业版。这个你看个新闻你就懂了。 比如说现在豆包他准备推出这些收免费的套餐服务了,六八八到五零八八一年。那接下来可能很多人会说,我需要去做一个智能题啊,写一段代码啊,做一个 ai 客服啊,像这些工作你肯定是需要花钱才能做的到的, 也就是说以后会有很多很多的企业或者个人去买豆干,我给你看一张图你就懂 这是 ai 发展完整的一个链条,现在前八层都已经很成熟了,从第九层的智能体到第十层 ai 原生部门、原生公司、原生生态,这些成熟了之后呢? 只要你想在 ai 这个领域里面去做事情,你就得买托克来完成你的企业运行,完成你的工作。 目前我在招聘平台上还没有发现南宁有托管方面的任何的工作的信息,因为我真的想去了解一下这个事情背后面的逻辑,是不是我们普通人能搞的事情。比如说 我搞不了这种托管出海,我可以做国内的,若若我做不了这个代理,我可以给这个代理商去做销售啊,那比如说我做销售也在在这个行业里面也比那些传统的销售会强一些, 因为我们能进入这个圈子里面,认识这里面的资源,了解这方面的资讯,那接下来能不能搞到大钱,就看我们的商业嗅觉和谈量。关注我南宁找工作不踩坑。
粉丝3.1万获赞47.1万

你知道 ai 是 怎么收费的吗?啊?其实 ai 就是 每一百万 token 收费两块钱到二十块钱,那么你会问 什么是 token? 其实 token 就是 ai 的 计量单位,一个 token 你 可以理解为一个单词或者是一个汉字,那百万 token 就是 一百万个汉字或者一百万个单词。 比如我现在问豆包今天天气怎么样?豆包回答我今天天气非常好,那一共十五个字,那就消耗了十五个 pos, 所以 你觉得百万 pos 二十块钱贵不贵呢?

ai 时代,大家都在说 token, 这是什么意思呢? ai 的 token, 国内专门给它起个名字叫词源,它是 ai 大 模型处理文本的最小单位。 token 呢,可以是一个字一个词,也可以是半个字,这是大模型根据人类文字统计出来的。比如说你好可以拆分成你和好两个 token。 我 喜欢 ai, 可以 被拆分成我喜欢 ai 三个 token, 常见的字和词就用一个 token 来表示,其他的就用多个 token 拼接。而图片呢,会切分成很多小小的方块,每个方块当做一个视觉的 token, 就 像拼图一样。那 token 具体是怎么收费的呢?为什么我们使用豆包或者其他大模型都没有收费呢? 但你使用 a s 记费呢?通常是按 token 的 数量来计算的,一般以百万 token 为计算单位。一百万 token 呢,约等于三本新华字典。 根据目前各大模型的收费价格,输入价格是在八毛钱到八块钱一百万 to k, 输出价格在两块钱到八十元一百万 to k。 目前各大 ai 应用为了抢占市场,让你免费使用,成本呢,暂时不用你出,如果你是企业用户或者演龙虾,就需要你支付费用。

什么?豆包也要收费了?就在大家还沉浸在五一假期的时候,豆包在 app store 悄悄更新了三档付费订阅声明,分别是,标准版六十八元一个月,加强版两百元一个月,专业版五百元一个月。 更离谱的是,专业版的包年标准价甚至一度被飙到了五千零八十八元。更戏剧性的是,当你亲自跑到豆包软件里去问他,你要收费了吗?他却脸不红心不跳的回答,放心,我永久免费。其实这背后的本质是,算力太贵了,张一鸣也烧不起。 截至今年三月,豆爆的日军偷更使用量已经突破了一百二十万亿。这意味着,他每多一次对话,背后的 gpu 集群就要真金白银的烧电。根据流传的成本核算显示,你的每次推力成本里,硬件折旧占了百分之五十八,电力成本占了百分之二十九。 现在豆包月活三点四五亿,换算下来就是一笔天价账单。你很难想象,自洁这两年的模型,巨震对标 g p t 五点二的 c d 二点零, pro 对 标 sora 的 c d 二点零。还有编程模型,它内部的能力其实已经能和国外一线掰手腕了。 免费版因为要控成本,上下文窗口和推理深度都压得很克制,所以你眼中的豆包长期停留在挺方便,但没那么强。而未来收费的这六十八元、两百元甚至五百元,很大程度上是在向重度用户展示,这才是真正的满血版算力。 但对于普通用户来说,其实不用焦虑,基础闲聊、文案拷写、信息查询这些功能依然是免费的。真正要收钱的,是那些极度消耗算力的场景,比如几个人合作用 ai 生成一部商业大片,一次深度的数据分析,或者让豆包给你做一个超级复杂的编程。 其实这场付费风波的背后,是我们终于学会用真金白银为技术进步买单,也提醒我们手里这些 ai 工具比我们想象的更值钱。

最近很多人都在说 ai 开销太大了,头坑太贵了,真的吗?我们换个角度聊一下呢?我最近花了大概五百美金的头坑,开发了一套文档写作系统。你可能会说,写文档随便哪个 ai 一 句话的事情,你花五百美金,你傻吗? 但是我这套系统不是帮你写个文档那么简单,它可以多端同步管理我的所有文件,接入了我的自建知识库,有一套完整的多账号体系,而且支持多人协助头脑风暴,还有我自定义的多种工作模式, 一键切换就能产出完全不同的方案内容。你告诉我,市面上哪家 ai 能做到这种程度的定制化,还能随时按照我的想法迭代更新?没有, 因为这不是一个通用产品,这是一个完全按照我的工作流量身打造的系统,开发周期有多长?一周 甚至很多功能细节是我拿着手机在聊天框里完成迭代的。五百美金,大概三千多块钱人民币,这笔钱你能在市场上干点什么呢?你能请到两位技术大佬,一位前端,一位后端,帮你从零开始开发部署到云端,还是说能够保证七乘以二十四小时的运行呢? 比如说三千块、三万块钱,你都不一定搞得定这个事情。所以你看,五百美金的头壳,买到的不是五百美金的文字输出,买到的是一个完整的可持续运行、可以迭代的生产线系统。这笔账怎么算都不亏。 那什么才叫贵呢?如果啊,我,我是说如果你的龙虾背后挂载的是 cloud 四点六 opus, 然后你用他问今天天气怎么样,打开网易云音乐,放首歌,或者搜搜附近有什么好吃的,那才是真的贵。头啃从来不贵,用错地方才叫贵。

豆包不是免费的吗?为什么 token 还可以卖钱?很多小白刚接触 token 的 时候都会问这两个问题,我从两点来回答你,一、 token 的 产生其实是很贵的, token 本身其实是使用大模型和 ai 进行对话的,计量单位差不多一个汉字会消耗一点五个 token 额度。 token 的 成本有百分之五十以上是英伟达的芯片和海力士美光的存储,有百分之二十是配套的数据中心、 ai 服务器配件、网络冷却和电力的成本, 有百分之十五是大模型研发和训练的成本,还有百分之十五是销售的成本或者毛利。这笔直是我个人的一个简单预估,你的 token 成本其实很高。二、为什么豆包是免费的?你用的豆包 app 是 自结的一个独立事业部的产品,这个事业部再补贴大量的 token 费用 给到他自己的算力部门。元宝跨客也是一样,这些大厂为了争夺 c 端的流量而补贴了 token 的 费用,未来也都会收费。但是当其他人想用豆包元宝先问的 token 的 时候,全部都要收费的。 就像个人可以免费尝楼下蛋糕店的试吃蛋糕,你要买一整个的时候是需要付费的。总结一下,豆包和元宝 app 里面的 token 是 免费的, 但是你基于 ai 开发软件生产慢距视频和企业级智能体的时候,都需要购买大量的 token, 而且还很贵。但是你会发现,花了一千块钱买了编程的 token 以后,它能替代一个一万五工资的工程师,明白了吗?

你以为你在跟 ai 聊天,其实你每发一句话,他都在疯狂烧显卡电费和服务费。 ai 他 不按字收费,而是按 token。 token 呢,就是他处理文字的最小单位,中文大概一个字就是一个 token, 英文呢,三到四个字母就是一个 token。 你每发一句话,他背后会拆成几十上百个 token 来计算。那为什么处理 token 会这么贵呢?因为每处理一个 token, 他 都要动一次算力,而算力就等于显卡加电费加服务器,越复杂的内容,就需要动越多的显卡。 你输入十个字和一百个字, ai 的 计算量可能差十倍。但真正让高级 ai 贵的原因,其实不是因为头肯多,而是因为他想的更深。 普通模型处理一个头肯可能只需要思考两到三层,但顶尖模型可能会思考二十层,甚至更多。 也就是说,推理的越深,显卡压力越大,计算成本不是呈性上涨,而是成倍飙升。 所以你付费买的不是智慧,而是背后那一大堆为你烧掉的算力。而故事的起点,就是一个小小的 token。 这里是 ai 小 白学 ai 关注我,我们一起见证 ai 的 成长,我们明天见,拜拜!

大家好,我是贺老毛,接下来和大家来聊一聊 open 的 计费方式。因为很多人到现在也不明白 open 是 怎么计费的,只知道我充上钱花呗以后我接着再充钱。至于我是怎么花呗的,心中是没有一个特定的概念。其实 open 它的主要消耗是 两部分,第一部分是输入,第二部分是输出。首先, open 并不是等同于单词或者是字母,它是模型处理文本的一个基本单元, 英文通常就是一投款约等于零点七五个英文单词,中文的投款消耗往往要高于我们的一个直觉。所以我们在购买三方的投款时,一定要先用官方的投款去测试一下,不要估算着好像是我 赚便宜了,其实都是玩到朝三暮四的把戏,往往他的费用会更贵。偷拍的一个常规的计算公式就是这个图上的啊,大家可能看不懂,说实话有点难理解,其实就是几点,第一是输入,第二呢输出,第三是他的一个家族 模型的版本,还有 a、 p、 r。 所以 说呢,就是很多时候读大量的上下文,未必就是消耗很多的投款,反而是写长答案,长思考,调 长代码,往往呢会更贵。当然呢,还有一些隐藏成本,比如就是思考推理开销,开启 thinking 后,额外的推理图解往往按输出测成本理解,还有错误重试 excel 在 工具调用、解析 权限或环境上失败后,往往会触发额外的轮次。还有一个 contacts 膨胀,多轮对话中历史记录持续增长,会推高每轮的输入成本。 总之, open 的 成本目前来说并没有一个很准确标准的计算答案,所以大家在用的时候一定要有自己的考量。

那 token 到底要怎么定价呢?一度 token 到底要多少钱?那我们给 token 定一个新单位,一百万的 token 等于一度 token, 那 现在一度 token 的 话,最便宜的要八毛钱。那我给大家分享一下,市面上主流的 token 大 概是什么价格?就按照我们刚刚聊到的,一百万的 token 等于一度 token, 那像豆包的话,呃,一度 token 差不多是八毛。嗯, deepsea 在 一元左右,国外的像 chat 的 gpt 在 十五元一度,然后 gmini 更贵了,差不多要十八元,所以你看国内外的这个模型呢?嗯, token 价格其实相差还是蛮大的, 所以对于企业主户,我们个人玩家来说就很清晰了。如果你追求量大,很便宜的话,就用国内的大模型。如果你要处理一些复杂的任务,或者是一些专业度比较高的,你就优先选择国外的模型, chat 的 gpt 啊,然后 gmini 这些。 所以对大家来说,一旦我们开始计算 token 的 成本,那 ai 就 不再是管玩具了,而是真正的生产力的工具。 那我们企业在接入 ai 时,接入这些大模型的接口,嗯,就不是在跟他闲聊了,而是要把他真正用到业务里。比如说我们在 c d 行业,现在有一些企业对于一些基本的客服运维的问题,都已经接入了大模型,他可以随机的去切换业务或者是下发业务。那其他行业,比如说一键设计海报,或者是优化你的这个审稿、改稿文案这些,他 它的每一个优化的条件和建议,其实都是在背后在燃烧 token, 那 在今年的二零二六年已经不是在比谁的这个大模型大的年代,而是在比谁用最少的 token 设计出最佳的方案的时代。

token 翻译成中文叫什么?叫词源,是模型处理文本的最基本单位。 token 和字呢?有什么区别? token 呢,可以是一个字,一个词,甚至半个字,那这是谁规定 的?是模型看了大量人类文字统计出来的,这样表达呢,更省事。常见的字和词就用一个 token 表示,其他的就用多个 token 拼接。 一个 token 到底是多少钱? deep 呢?输出一百万 token 呢?约等于三本新华字典只需要三块钱, gpt 五呢更贵,超过九十块 token 和上网流量收费是一样的道理吗?不是的, token 收的是计算费,是生产成本,而流量收费呢,是搬运费,不是一回事。为什么养龙虾要烧 token? 是 因为龙虾要用大模型思考和回答问题,因为大模型按 token 收费,所以就说烧 token。 本地部署大模型是不是就不用烧 toon 了?还是要用到 toon, 因为 toon 机制本身和部署方式无关。本地部署呢,不需要按量付费,但电费得自己掏,算上硬件成本不一定划算。如果我把一段话复制粘贴进去,是不是就算一次 toon 不是 文字越多呢?计算的输入 toon 数量就越多? 我问的问题很长,但答案很短,是不是只扣答案的 token 不是, 输了 token 呢?也要算钱?表情符号算几个 token 会不会比一个字还贵?常见的表情呢,是一个 token, 不 常见的会用两到四个 token 拼接表示。 deepsea 和 gpt 的 token 是 一样的吗? 不一样,互相不认识。 y, y, d, s 这种网络词是几个 token, 一 般拆成 y, y 和 d s 两个 token, 要是这个词足够火,也可能被模型当做一个整体。同样的问题,我上午问和下午问,输出的 token 数会不一样吗?不一样,模型输出具有随机性,每次输出的 token 数量不同。 那小龙虾帮我下载电影是否要按 token 计费?小龙虾思考怎么下载?打开下载网站,执行下载命令,这些都需要消耗 token, 但是下载电影本身不消耗 token, 因为电影不是大模型生成的, 电影是存在第三方服务器上,只消耗下载流量,不消耗 token。 为什么我和 ai 聊得越久,回复同样一句话,花的钱就越多? 模型是基于对话历史进行回答的,所以你所有说过的话呢,都会参与计算,计算成本就越高,这也是 ai 还需要按照输入 token 数量计费的原因。 怎么才能少用点 token 输入更少的提示词去掉?你好,请问这类废话规定模型输入长度,加一句五十字以内回答,但很有可能问题没有说清楚,回答呢也不够准确。如果前后问题呢?不相关也可以新开对话,避免历史对话参与计算。 托管是加密的密码吗?不是,托管只是一种文字编码方式,虽然你看不懂,但他并没有加密。 图片和文本的托管是一样的吗?不一样,图片会切分成很多小小的方块,每个方块呢?当做一个视觉托管,就像拼图一样。托管是为了收费而发明的吗? 不是,托管是技术发明,是为了能表达和能计算,只是计算的成本和托管数量正相关,所以就按照托管数量收费。我使用豆包没有付费啊。为什么说托管是收费的?大厂为了抢占市场让你免费使用,成本呢?暂时不用你出, 如果你是企业用户或者养龙虾就需要支付费用。我在一段话里疯狂敲空格, ai 是 视而不见还是会偷偷扣我的钱? 空格也算钱,虽然有的模型会把几个空格打包,大部分时候你多敲一个空格就再多烧一份算力。那 ai 产生的废话是不是能退费?不能,因为废话也是显卡辛辛苦苦算出来的。

ai 现在很火,我们是做软件开发的,已经开始使用 ai 有 两个月了,有粉丝让我们分享做一个项目用了多少头,肯换了多少钱。我就拿最近我们做的一个项目来举例,最近做了一个 内训培训的项目,我们如果没有 ai 的 话,工期预估是在两个半月到三个月, 我们投入的开发人员呢是十个人,如果按三个月来算的话,每个人按一万,十个人就是十万,三个月就是三十万,还不算 u i 测试产品等等其他这些岗位。然后我们有了 ai 以后,我们这个工期缩短到了 一个半月,那我们人工也就是减少了一半,人工支出的话,按十个人一个半月除以二就是十五万。我们用了多少头?可能就是从开始开发到现在应该用了有五六千块钱,那到结束应该是 差不多不到一万块钱,如果是这样使用,你们能接受吗?做一个三十万的项目,用了 一万块钱的掏坑费用,你们觉得怎么样?这样合算?是不是心里就平衡了,然后就能接受了?说实话是真的能够提升我们的效率。就是举个例子,我们前端 去写页面的时候, ui 出完图,我们直接对接 ai, 还原度做到了百分之九十九,其他都是微调。再有就是这个 接口的对接,只要和后端看好这个接口的数据和说呃,这个注视也是直接一把成,所以同学们,兄弟们,所以不要抗拒 ai 了。

豆包要收费这事我其实一点都不意外,就很多人其实没有意识到, ai 对 话他不是免费的 token, 他 是有成本的。以前我们用微信呢,抖音呢,那多一个用户呢?平台只是多承担一点服务器成本,编辑成本没有那么夸张。但大模型他不一样,你每问一句,他背后都是在烧 token 的, 你让他陪你聊天和他视频,那本质上都是算利的成本。五一我回老家,看到我爷爷奶奶都在用豆包跟豆包聊天视频,我当时就在想,在普通人眼里就这么玩一玩的事,但在大模型公司,就是钱一直在往外哗哗的流。 所以说大模型他很难照搬以前互联网那套逻辑,先圈免费用户,以后再想办法变现。以前免费用户不怎么烧钱,用户越多呢,平台想象力空间越大。但现在是不一样,每个免费用户都在持续消耗成本, 以前是人越多越好,那现在是如果这些用户不能产生价值,可能越多越亏。所以我觉得啊,豆包收费这事,本质上不是突然想赚钱了,而是他开始必须要算账了。我自己其实是愿意为 ai 付费的。 我现在每个月花在大模型上的费用大概在八百块钱左右,贵不贵?贵,但是它为我节省下来的时间和创造的价值远远超过这八百块钱。对我来说哈,时间成本比会员费贵多了, 而且还有一个很多人看不见的成本,叫工作流迁移成本。我的 promote skill agent, 很多东西都是在一个固定的模型里调出来的, 你换模型不是就接个接口那么简单,后面一堆细节要重新打磨的。所以我不是不愿意为 ai 付费,我是愿意为生产力模型付费,但我很难为一个陪我聊天、陪我娱乐的模型付费的。 这也是豆包比较尴尬的地方,他现在很多用户可能只是把它当做陪玩的工具、娱乐的玩具。这些用户数量看起来很大,但付费意愿未必很强。而真正愿意持续为 ai 付费的人群,可能大多数都是用了很顶级的模型,把 ai 用在生产力上。 所以说,大模型这门生意,最后可能会比短视频平台更残酷。短视频平台可以共存,是因为内容风格不一样,有人爱看图文,有人爱刷视频, 有人喜欢热闹,有人喜欢安静。但模型他不一样,处理重要的事情时候,很少有人说我要用一个啊,差不多点的模型就行。嗯,只要他不太贵,没有关系,他笨一点都没有关系。那真正用在生产力上的模型,大部分的人都要用一个更顶级的模型。 所以大模型公司最终都要想清楚一个问题,就是到底赚谁的钱。我的判断是,哈,不是赚所有人的钱,而是赚那些能把 token 变成生产力的人和公司的钱。所以豆包收费,我不觉得意外。

关于豆包最近打算收费这件事情,我讲几个我自己的判断。第一个就是托肯是有成本的,但是大多数用户没有这个意识,就是大模型跟过去的互联网软件它不是一回事情。就像之前的 呃软件,比如说呃抖音、微信,这些软件开发完之后的边界成本是几乎为零的,多一个用户少一个用户,它的成本差别不大,所以 之前的大量的软件都是用免费引流加后端变现的,这种商业模式是成立的,但是 token 不是, 就是每一次对话,每一次生成,它背后都是有成本的,其这个成本的确是不低。但是现在的问题是,大量 豆包的用户对于这件事情是完全没有感知的。就我五一期间回老家的时候,我发现我的父母和我上幼儿园的小侄女都大量的用豆包视频聊天,比如说我的小侄女还给豆包听音乐, 虽然我不知道为什么要给豆包听音乐,就是等等的这些行为在我看来都是极其 奢侈的,头肯消耗,但是他们就完全没有感觉。第二个就是互联网那一套先免费后变现的逻辑,在大模型这里呃不成立, 因为以前免费养用户是因为用户本身不花钱,而现在每一个免费用户都在持续烧你的钱。比如说我有一个微信号,背后接的都是我的 open cloud, 我 时不时还会删那个微信号上的人,就是把我觉得说没有价值的好友删掉,因为我 不想要他们呃浪费我的托克。你想以前都是大量的把人往死里薅,而现在我却是主动的想要把这些人删掉。 呃,第三就是我其实是愿意为顶级的智力付费的,但是不会为差不多的智力买单。比如说我现在是用 cloud, 两百美元的会员,折合人民币大概一千四左右,但是在我看来这个非常的划算,因为我 用这一千四起码创造了几十倍上百倍的价值。那国产模型呃,差多少呢?客观来讲,我觉得现在顶级的一些国产大模型,像是 kimi, 像是智浦,呃,跟 cloud 之间可能就差个百分之五,百分之十, 就是客观上来讲,它们差距并没有很大,但是就是你一旦用过顶级智力之后,你就回不去了。就说同样 一件事情,我用 cloud, 可能我花十分钟能够给我九十分的结果,那用次一档的模型,我可能花半个小时,一个小时都只能有一个。八十分的结果就是我的时间 是很值钱的,我的产出是很值钱的。而且还这里还有一个隐形成本,就是工作流的迁移成本, 虽然这个大模型是可以一键切换的,我 cloud code 我 可以接啊, deepsea 我 可以接, kimi, 这些都可以。但是当你真正的围绕一个模型打造出一套工作流之后,你 如果你换了一条模型之后,可能你的 front, 你 的 skill, 你 的每一个 agent, 很多很多大量的细节都是需要你重新去调整优化的。工作流的迁移成本对于我来讲是非常高的,这种成本让我心甘情愿,或者是说不得不每个月就是持续给它付一千多块钱。 第四是大模型是隐者通吃的生意,就是智力这个东西,它不存在风格之分, 比如说抖音、快手、小红书可以共存,因为不同的平台它的啊内容,它的风格是不一样的。但是模型这个事情不是这样子的,没有人会因为说我喜欢豆包的风格而选择一个智力差一截的模型来处理重要的事情。所以只要所以只要这个价差没有 很夸张,最强的模型都会把所有正在用 ai 创造价值的用户吸走。那豆包尴尬的地方就是在这里,现在它的用户大盘里绝大多数都是像我父母,像我侄女儿那样把它当聊天玩具的人,就是他们是绝对不会付费的。而像我这样 啊,愿意付费能用 ai 创造价值的人已经在用啊 cloud gpt 了,那次一点的可能也会选择说啊智普、智普、 kimi 等等。像 像智普现在它的套餐是每天是要靠抢的,是限量发售的,现在以前是很难想象的一件事情。这个 说明什么?这个说明愿意为顶级智力付费的人其实比想象中的哦要多很多。就是这些大模型公司已经意识到说不能免费抢用户这条路了,而是 而是开始做配额,做分层,我觉得这个是这个行业走向理性的标志。最后一个,我觉得所有大模型公司都要想清楚一件事情,要赚什么样人的钱。我个人的判断是 大模型应该去赚那些能够把托肯变成生产力的人或者是公司的钱,因为人与人之间的转化效率差异是非常非常大的。 那对于我来讲,我可能一百块的托肯,我能够创造一万块的价值,那对于有些人来讲,可能一百块的托肯他能够创造几万、十几万的价值,但是对于 呃很多普通的用户来讲,可能一百块的托肯就只能创造几百块的价值,或者就是根本也没有创造什么价值,就是娱乐一下。 所以基于这个差异,那些真正创造出价值的人是愿意为这个持续付费而付很多钱的。那至于这些 c 端娱乐场景烧出来的用户规模看起来很大,但是这些用户和 算利成本之间是负 r o i, 就是 当你的用户越多,亏得越多,且没有任何呃向上变现的路径。

豆包五月四号公布了它这个订阅收费计划,它几个影响,第一个证明就是 token 确实越来越值钱啊,它不会一直所有都免费。那这个豆包呢?它这次订阅是在免费的基础上,就是现有的功能,它仍然给你免费的,它说的是 然后一些专业的功能,比如像 ppt 生成等等,它会有收费。我看它的价格其实还挺贵的,一年要大几百,甚至到大几千,二年订阅。那要想起去年,就是文心妍也是大概开始收费,然后开始一蹶不振。这个跟它这个文心妍模型本身能力也有一定关系啊,也不全是收费的问题, 但这里边还有一些细节,就是说呃,他收费,但是像呃元宝啊, deepsea 啊,包括这个千问呢,他可能甚至缉缉缉灭他,可能长远还是不收费,他用来抢用户, 也就是说用户在大模型终端这上面其实没有什么忠诚度的,你只要你收费,另外不收费,他我认为能接受,效果差一点他就跑,他会迁移,所以这个也不知道豆包会怎么应付。再一个是现在大模型这个流量入口还是蛮强大的,对软件行业影响特别大。 那怎么说呢?就是说他们收费对这个软件行业也是打击很大,因为他有入口在这,他随手方便可以做了,就非常非常方便,不像那些模型,嗯,不像,就是软件他要用这个用那个, 但是你不收费,对他影响也很大。也就是说现在软件行业其实被大模型这种,我说软,就那种工具类的软件, 那被这个大明星影响的真的是超级超级大,所以这这个不知道以后会怎么样,但至少 token 这个愈来愈值钱,就是以后这些软件做的基础工作都会换算成 token 这个数量,这个趋势应该是固定的。

ai 免费午餐终于还是收费了,拥有超三亿月活的国民级应用豆包悄然上线的付费订阅服务,一档甚至达到了五百元一个月,这不仅标志着大模型烧钱换市场的阶段正式翻篇,更在整个 ai 圈引发了地震。上个月字节在公布利润降低百分之七, 我就说豆包在二零二七年一定会开始收费,没想到提前了。我回答一下大家,这对 tocun 到底会带来哪些深邃的影响?主要有三点。首先, tocun 经济学被迫觉醒。过去两年,国内 ai 大 模型就像不收水费的自来水厂,用户疯狂的消耗 tocun, 企业在后台疯狂烧钱。要知道现在豆包日军 tocun 掉用量已经 突破了一百二十万亿,算力、租赁和折旧都是天文数字,完全免费的模式是难以为继的。让深层 ppt 做深度数据分析和深层视频的高消耗用户来为昂贵的 token 买单,成了行业的必然选择。 token 将成为水电煤气网络之外的下一个天然的支出。 其次, token 定价也正在告别白菜价了。就在豆包尝试收费的同时,国产的大模型厂商和云服务商也一改去年的价格战,集体进入涨价通道。因为随着 ai 智能体的广泛应用,全网的 token 消耗规模激增,直接推高了底层的算力需求和硬件价格。 b 三百乘四百 涨到六百多万呢。面对昂贵的硬件和紧缺的算力 api, token 的 价格正在回归还应有的商业价值。谷歌的 token 涨价,阿里的 token 涨价,质朴更是涨价百分之八十。再次,行业的竞争核心也变了,从拼参数规模变成了拼单位 token 的 效能。一片涨价声和收费潮也在倒逼行业思考, 怎么样才能用更少的托管去办事情。比如用大模型搞定复杂的推理,可以用小模型处理高频的轻量人物,大小结合。大家会发现,研究如何审托管和大幅提高托管使用量,这两个看似矛盾的东西会一直在这几年 同时发生,伴随着我们的企业成长。总而言之,豆包试水收费不仅仅是一家公司的财务考量,更是国产 ai 和全球 ai 向自我造血转型的一个冲锋号。二零二六年将是托更商用的元年,你会发现你身边的企业用托更花了很多钱,看上去很冤枉,但它的效率大幅提高于你。豆包的付费版,你会花钱吗?

哈喽大家,我是青云啊,上期我们说了这个大模型啊,然后我们接下来就说这个 token, 也就是这个 ai 是 怎么花钱的啊? ai 的 计量单位啊,这个叫叫做呃, token, 在 中文里面的话呢,我们管它叫这个词源,那今天我们就 简单给大家说一下,这个词源到底是什么样的东西,它是怎么样去计算做计量单位的啊? 首先什么是 talk 呢?你跟 ai 说的每一句话都会被切成一个一个的 talk, talk 呢就是 ai 处理文本的最小的单位,也是 ai 公司向你收费的一个基础单位啊,它是这么去计算这个价格的。 那一般来说,这个中文的话,一到三个字母约等于一个 token。 英文的话呢,是按单词算的话,大概零点七五个单词左右啊,约等于一个 token 啊,这个没有特别特别准确,但是基本上不会呃超过这个范围。比如说我们说这句,我是蒋青云说测试, 就这一句话的话,我们可以给它切分成七个 token 啊,比如说我是蒋青云说啊,这里面,然后测试它会给它计算成一个这个呃一个 token 啊, 那 token 是 怎么收费的呢?不同的大模型,不同的公司有不同的这个收费的一个标准。打个比方,比如说像 gpt 四 o 的 话呢,它是呃一百万啊,我 one million 的 这个 token 一 百万 token, 它是十美金, 然后 cloud 三点五的话,大概是呃,一百万是十五美金啊,这个是输入价格,也就是说你提交对话给 ai 的 一个计算价格,然后 ai 经过自己的一个处理之后,返回给你的一个价格又是不一样的,这属于有两种不一样的价格, 呃,这边是返回的是 gpt, 这边是三十美金啊,一百万 token 啊,然后 cloud 是 七十五美金,一百万 token, 当然这个价格会有波动啊,这个东西仅供大家参考一下吧啊?然后,嗯,如果是一百万个 token 的 话呢,约等于七十五万个单词,你可以这么去理解 吧,呃,约等于五十万个中文字,也就是说你花大概,比如说 gdp, 你 花大概,呃,这十多美金,二十美金吧,几十美金吧大概,你可以换得大概,嗯,五十万字左右的一个这个数据啊, 如果是一篇三千字的文章,大约的话呢?如果你是输入的话,大概就是五百到一千的托克,如果你是输出的话,输出一个三千字文章的话,大概就是一千到两千托克。 呃,平均算下来的话,一次问答大概是在呃零点零一美金到零点一美金左右吧。这个东西没有办法计算那么精确啊。 那么测试工程师怎么在工作中去节省 talk 呢?首先一点就是我们要养成一个规范啊,就是首先你写这个 prep 要简洁不要啰嗦,直接说重点,比如说很多人 写那个题词,喜欢写很多水词啊,帮我写一个 function, 用来干嘛干嘛干嘛干嘛干嘛。那就直接写写个计算 talk 的 function 啊,这个是最简洁的一种。呃,提问方式。再一个的话就是给例子,不要从头解释,你可以直接给几个事例让 ai 去参考,这样的话呢,我们可以很快地就 可以让 ai 来给予我们呃,这个,这个想要的这种答案啊。再一个就是设定这个输出的限制,告诉 ai 输出要多长啊,比如说用五十个字以内解释什么是 token, 哎,这个也是一个控制成本的一个这种方法。 再一个就是用系统的这种 property 啊,比如说一次设置,多次复用这种的话,就可以去呃设定一个 ai 的 角色和能力啊,比如说 skys 啊,比如说设定一个这个 agent 啊,然后让它去 呃节省我们的一个对话啊的一个这个上下文,所以啊,记住省头肯就是省钱啊,也是省这个响应时间啊。关于这个 skills 和 agent 的 这一个的话呢,我们后面还会再讲啊,我再补充一下,如果,呃你们用的是公司内部的这种呃大模型啊,就不是那种外部付费的话,那就没有 这么这么讲究了啊,就没有这么讲究了,当然话,当然我们养成这种写这种呃精简呃简要的这种 talk 啊,还有这些习惯,其实,呃虽然不是节省 talk, 但是也是可以提高这个呃 ai 回答你问题的一个效率啊。

听好了啊,一个月赚两万美金,成本就会为零,方法更贵。我告诉你个数字啊,国内 ai over 一 分钱,国外的三分减二,每分差了二十倍,就这个假茶全是钱。只是你不知道怎么去拿三个玩法,第一个 搬砖去拿阿里公益那种千万级的 ad 授权包装成本低的工具卖给东南亚电商。人家那边啊,拿这个东西当生产力抢着买,毛利六十五个点,你赚的就是他。不知道国内这么便宜, 觉得还行啊,不要着急,下一个压缩样本,二十 g 的 模型压到市里丢到东南亚的廉价算链上去。高成本多少?零点零零零八美分,天跑十一个亿头,净利润两万美金每天啊,还挖什么矿, 这个在他面前就是个笑话。还有一个是是道理,这个一般人就玩不了,但你还是得知道一下,欧洲白天啊,电费贵对吧?你就把推理任务调动去南美那边夜间极方便宜,算完再卖给亚洲,白天的高需用成本再降四十个 g, 这不是赚钱,这是降维打词。所以你看信息差这玩意算不说了,这玩意现在知道的人还不多。