粉丝1.3万获赞74.1万

中国电信出了个 tock 套餐,好多人都在问, tock 到底怎么用?我用一个比喻,一分钟给你讲明白。你买个机器人回家,就等于提了辆新车,车有了能开走吗?不能,你得加油,得充电,这个油,这个电就是 tock。 tock 就是 机器人的饭,不给他吃,他连话都说不出来,一堆废铁, 那怎么用呢?三样东西对号入座。第一,买偷看包,这是给机器人买饭票,你是包月随便吃,还是吃一顿买一顿自己选。第二,买提速包,这是给机器人修路,你叫网速慢,机器人就抢,等于豪车跑泥巴路,再贵也白搭。这个包给你铺一条高速,让他跑起来。第三,买安全包, 这是给机器人上保险,请保镖,你跟机器人说的隐私,让他处理的合同文件,这个包帮你防贼。所以偷看怎么用,就是你买智能产品后花的智商费,没它,智能产品就是个废铁摆设。 但这还只是基础玩法,电信真正在步的是一盘大棋。塞利王、 tokyo 银行、 tokyo 超市,这才是未来 ai 世界的真正高速公路和加油站。关注我,下期给你讲透这三个到底是什么,跟你有啥关系?

就在前两天,三大运营商同一天上线了一个新的套餐,叫 token 套餐,就在充话费的那个页面,直接就能购买 token 了。那 token 是 什么呢?就是你每一次打开 facebook, 打开豆包,你问他一个问题,他给你回答,整个过程消耗的计算资源就是 token, 你 可以把它理解成 ai 的 电。 ai 每工作一秒钟都在抄 token, 这件事情为什么重要呢?你还记得英美达的老黄吗?就是那个穿皮夹克的,他今年三月在自己的发布会上说了一句话,原话是这个意思,说 token 就是 ai 时代的硬通货,未来数据中心不是用来存文件的,就是用来生产 token 的 工厂。他甚至说,以后公司给员工发 offer, 薪资之外还要配一个 token 的 年度额度,就像现在给员工配电脑,配手机是一样的,这是标配。 当然,看到这个信息,我的第一反应就是,这不就是当初流量的故事吗?你回想一下,两千年初,手机流量还是按照 kb 计费的,你发一张图片可能要好几块钱。谁也没有想到,有一天流量会变成月租里的赠品。后来四 g 时代来了, 流量套餐开始普及,那些最早理解流量就是生产力的人,早早地布局了自媒体,做了线上的生意,抓住了整个时代的红利。现在同样的事情正在发生,只不过这次换成了头衔。你想想,你身边有没有做自媒体的?天天用 ai 改稿子,想选题剪视频的脚本, 做电商的,用 ai 写详情页,做竞品分析,做程序员的,现在谁不用 ai 辅助写代码,这已经是基本操作了,所以这些人每天都在消耗大量的 token, 区别只是他们自己知不知道而已。而且你知道现在中国每天的 token 掉量是多少吗? 一百四十万一次,这个数字两年前才是一千亿,两年的时间涨了一千倍。所以三大运营商现在冲进来卖 toc 套餐,逻辑非常清晰,他们就是看到了这个市场已经大到不能忽视了。所以我想说的是,现在很多做传统行业的朋友,现在可能觉得这个事情跟你没有太大的关系,但是你认真想一想, 你的竞争对手如果已经在用 ai 提效,而你还没有,这个差距会越来越大。 toc 已经不是程序员专属的东西了,它是所有人进入 ai 时代的门票。这一次消息来得很早,机会也来得很早。

你的手机话费套餐里,马上就要多出一笔你从来没有见过的费用。不是流量,不是通话,是一个叫 token 的 东西。五月十五日,上海电信正式发布了 token 算力套餐,一块钱二十五万,额度点从三十九块九到二百九十九块九,基础版、专业版、旗舰版都有, 话费直接扣。你的手机号就是 ai 账号,听起来是不是特别像十五年前的流量包?其实逻辑完全是一样的。回忆一下,上一次运营商把一个新的技术塞进套餐里卖,后面发生了什么? 二零零九年,三 g 流量包上线,三年时间只没收入腰斩网约车重购了出行市场,移动支付代替了现金,长视频跟短视频分走了一大部分注意力。不是说技术本身有多厉害,是运营商 在卖它的那一刻,就意味着这项技术的普及已经不可逆了,它从吉克手里的玩具变成了水电煤。再看一个数据国家数据局,譬如中国,日前日军 tokin 的 钓用量已经突破了一百四十万亿。 你今天打开的每一个 app 背后,大概率都在消耗 token。 智能客服在烧, ai 推荐在烧,你的公司用的那个自动报价系统也在烧,只不过以前这些成本藏在企业技术预算里,你感知不到。现在电信把它拎出来,明码标价塞进话费单,是因为消耗量已经大到要像水电一样要按照表收费的程度。 同时,电信还搭了三个入口, ai 云电脑当 agent 的 运行主体。智能城市做企业赋地化服务,一张基础设施的网正在从上到下的铺开。电信这一步,表面上看是出了一个新套餐。往深一层, ai 的 计费权正在从科技公司手里转移到基础设施运营商手里,谁掌握计费通道,谁就掌握用户关系。十年前,微信跟支付宝抢的就是支付入口,今天,运营商抢的就是算力入口。对普通人来说,你不需要搞懂 token 到底是什么,就像二零零九年时,你不需要搞懂什么是 tcp ip 协议。 再回过头来看,上一次运营商改变计费单位的时候,反应过来的那批人用流量红利筑起了自己的生意。这一次的节奏呢,会更快,留给人反应的时间呢,也会更少。

兄弟们,最近跑这个 agent token 烧起来是真的心疼,所以今天这期我们专门聊一件事情,怎么搞到便宜的甚至免费的大模型调用金额。先搞清楚你到底在烧多少钱。普通聊天场景的豆包、 germany 这类网页产品, 一问一答大概就是几千到几万投坑,一个月下来大约就是三四百万,花不了几块钱。但是 agent 就是 完全是另一个级别了,他要自己拆任务,自己执行,自己复盘,跑一个任务可能调用几十上百个模型。我翻了一下自己的使用日制,每个月消耗大概在三亿投坑左右,算一下账, 可二个四点五的定价,输入三美元,输出十五美元,每百万投坑考虑存储比折扣大约五美元,每百万投坑。 按照这个价格,每个月光跑 a 阵子就要烧掉近一千五百万美元,换成国产模型便宜很多,但一个月也要两三百美元。所以今天这期没有任何广告,纯粹是我自己踩坑后的真实的经验分享。 一个思考框架先放在这里,省钱这件事情本质上是三个维度的取舍,价格、稳定性、模型、能力。 三个不可能同时拥有。想要严格,效果又稳定,那就贵。想要便宜,就能在能力或者稳定性上做让步。但是这个逻辑咱们逐个拆解一下。先说 cloud 的 扣,折扣最大,但是坑也最多。 有人实际测算过,订阅一百美元的套餐,利用期限能兑换价值一千三百五十美元的金额,相当于不到一折,换算成人民币大约是零点五。人民币能消耗一美元的量, 但是有两个大坑,第一,账号在国内极其容易被封。第二,官方允许接入第三方工具,但是只能在 cloud code 的 此类官方产品里面使用。 想要套餐折扣,又想要灵活接入吗?那就得无限中转这条路了。但是中转站本质上是批量采购,再零售成本价也是零点五人民币兑换一美元,其实零售价是在人民币一块钱以上的,所以建议不要一次性充太多。 open ai 呢, 最大规模活动也非常多,相比 cloud 动不动封号, open i 是 非常大方的,不仅允许接入自家产品,还可以对接 open cloud、 open code 这类的第三方项目。总换算上大约零点三人民币,能消耗一美元的量, 而且活动是真多。比如说 g p t 的 套餐,首月免费,网上你搜一搜团队拼车,几块钱就可以用上原价二十五美元的一个月的这个会员,拿上这个会员跑偷啃,几乎等于白嫖。缺点是呢,写代码的速度偏慢,但是可以多开任务,用数量换时间。 谷歌 java 呢,能力稍微弱一点,但是有白嫖的空间。 java 系列写代码的综合表现整体是略逊于 clod 还有 gpt 的。 但是有一个骚操作,通过教育活动申请免费的一年的谷歌 ai 会员,用谷歌的东西, 用它来跑 clod 的 模型。还有更丰富的玩法,用 clod 的 api 把 ide 里面的模型接口转出来给 clod code 的 这类工具调用成本约为零。 最近谷歌在间隙调整了 ide 的 限制,用了多少人之后,稳定性就开始下降了,这种方式只能是仅供参考了。国产型号现在价格最香,看需求选国产模型的零售价本来只有海外的一到两折,套餐之后呢,更便宜了。 kimi k 二点五。 目前我觉得国产力最强的实测能力跟 club 的 四点五差距不大,海外版呢,有首月零点九九美元的活动能得到呢,原价九十九的套餐还支持接入第三方工具。 国内版本的活动力稍微弱一点,而且套餐里的 token 给的量也稍微少一点,控制台也看不到具体的消耗数字,这一点其实我是挺介意的。 tbc 目前国内体验下来最大放地下,最低档每月二十元,每年二百四十元, 接口开放度非常高,各类工具接驳,缺点是高峰,因为这个套餐买的人太多了嘛, token 速度有时候慢的真是离谱。 mini max 设置策略和 diss 比较像,但是这里就不重复展开了,再说。因为答这个,很多人好像就突然想到了,它是提供完全免费,限额不限。 这个开源模型的接口,包括 kimi 二点五, d 四点七, mini max m 二点一都有这个,但是用到的人实在是太多了,热门模型的响应真是慢到离谱了,你只需要做了解就可以了。 最后整理一下角色策略,如果你追求最强的效果, club 的 中转站目前得分最高,预算有限呢?国产首选 d p c 的 套餐是最优惠的。 kimi k 二点五的效果是最好的,想要白嫖 open ai, open ai 的 拼车几乎是零门槛,效果也不差。 但是这次呢,我只是用到了我测到的渠道,还有很多我没测到的渠道。如果你有更好的方式评论区见,大家一起交流一下。

那 token 到底要怎么定价呢?一度 token 到底要多少钱?那我们给 token 定一个新单位,一百万的 token 等于一度 token, 那 现在一度 token 的 话,最便宜的要八毛钱。那我给大家分享一下,市面上主流的 token 大 概是什么价格?就按照我们刚刚聊到的,一百万的 token 等于一度 token, 那像豆包的话,呃,一度 token 差不多是八毛。嗯, deepsea 在 一元左右,国外的像 chat 的 gpt 在 十五元一度,然后 gmini 更贵了,差不多要十八元,所以你看国内外的这个模型呢?嗯, token 价格其实相差还是蛮大的, 所以对于企业主户,我们个人玩家来说就很清晰了。如果你追求量大,很便宜的话,就用国内的大模型。如果你要处理一些复杂的任务,或者是一些专业度比较高的,你就优先选择国外的模型, chat 的 gpt 啊,然后 gmini 这些。 所以对大家来说,一旦我们开始计算 token 的 成本,那 ai 就 不再是管玩具了,而是真正的生产力的工具。 那我们企业在接入 ai 时,接入这些大模型的接口,嗯,就不是在跟他闲聊了,而是要把他真正用到业务里。比如说我们在 c d 行业,现在有一些企业对于一些基本的客服运维的问题,都已经接入了大模型,他可以随机的去切换业务或者是下发业务。那其他行业,比如说一键设计海报,或者是优化你的这个审稿、改稿文案这些,他 它的每一个优化的条件和建议,其实都是在背后在燃烧 token, 那 在今年的二零二六年已经不是在比谁的这个大模型大的年代,而是在比谁用最少的 token 设计出最佳的方案的时代。

有好多人说像我这么玩 tucker 根本着不住,其实还好,你看我一共三天花了十三亿的 tucker, 呃,第一天是用了十四块六,第二天用了十八块四,第三天用了十三块九,一共做了八个 aj 的 去操作我那么一套东西,包括写小说的,还有炒股的,还有预测彩票的,其实还好,一共花了不到五十块钱。

昔日黄蟹堂前燕,今日飞入百姓家。上海电信呢,最近有一个很大的动作啊,推出了 token 套餐,而且是面向了上海电信的手机用户的啊, 那这个套餐便宜到什么程度呢?就是一块钱可以大概计算二十五万的 talk, 它的计算方式有两种,一种就是你按量啊,来买啊, 另外一种方式呢,你调用多少,用多少算多少,这有什么意义呢?这意味着什么呢?原来啊,所谓高科技科技领域的这种工具和消耗量,现在呢,进入到了 c 端啊,进入到了手机客户端,进入到了 一般的用户手上,这个价格啊,呃,跟大家举个形象的例子,十块钱大概可以消耗二百五十万托克,二百五十万托克什么意思呢?就是 大概经过程序啊,能够形成一百本十万字的电子数,意义就在这里了,一般的手机用户呢,就通过手机啊,就可以结成一百本十万字的电子数, 我突然想,电子书可能就没戏了,就被这个行业给淘汰了啊。这个就是上海电信了推出托肯套餐的一个意义,他把托肯这个概念给普及化了,而且呢,怎么说呢,引导到了我们日常消费啊,他成为一个消费品,托肯现在这个东西就像水电煤气一样,就成为我们生活的一个 基本生活资料啊,过去是生产资料,现在变成了生活资料,那他的免疫一下子就扩大了,这也意味着我们这个社会呢, 恐怕就此真正的进入了 ai 时代。所以你看三大电信公司啊,最近股价呢,蹭蹭蹭的往上涨,不光是中国电信了,中国电信已经是连续崇高,中国移动也一样的,包括呢,中国联通也一样的啊,因为中国电信呢, 在上海这是开了个头,其他的电信公司啊,一样的,招蜂抓药都会推出呢,各自不同的套餐。总之一句话, talk 进入了我们热场,生活 ai 已经成为了生活 必需品, talk 由生产资料正在转化成生活资料。如果同意我这个观点话呢,点点赞,不同意也 ok 的, 在我评论区呢,发表发表你的看法。

如果你在用 openclaw 或任何 ai 自动化工具,却不懂 token 的 计费逻辑,你的信用卡随时会报。今天不讲故事,只讲三个核心事实, token 怎么算钱? openclaw 哪里在偷偷扣费?未来会更便宜吗? 看完这三分钟,帮你省下真金白银。第一部分, token 是 什么? token 就是 ai 把人类语言翻译成它自己能消化的数字之前的最小切分单位。 token 不 等于字,也不等于词, 它是介于字和词之间的一种智能切片。 ai 不 认识字,它只认 token。 想象语言是一张大披萨, token 就是 切好的小块。英文 pizza 切法比较规则, 通常一个单词约等于一点三个 token。 例如 hello 是 一个 running, 可能被切分为 run 加 name 就是 两个 token。 中文披萨切法比较碎,通常一个汉字约等于一点五到两个 token。 比如这个词,人工智能可能被切成人工加智能,可能会计算成七到九个 token。 第二部分,收费标准与三大致命坑,这里有三个烧钱的坑 坑一,输出比输入贵三到五倍。 ai 读你的话很便宜,但写出回答很贵, 无论模型多便宜,输出永远更贵。 g p d 四,输出是输入的三倍, cloud 甚至高达五倍,对测试永远加上限制,比如限一百字坑二,隐形消耗巨大 system prompt 每轮对话必收 我们普通的聊天室,你问一句,我答一句。但在 openclo 里,每次对话都会自动打包三样东西,第一是系统指令,告诉 ai 它是谁。第二是历史记忆,就是你过去的聊天记录。第三才是你提出的问题, 哪怕你只是和 openclo 打个招呼,发了你好两个字, openclo 后台可能已经偷偷发送了三千到一万五千个 token 的 背景信息给 ai, 这意味着你还没开始聊就已经欠费了。 对策,定期清理记忆库,别让书包太重坑。三、自动化死循环这是最可怕的,如果你的脚本出错,陷入到死循环,即 ai 生成代码,到运行报错,再到 ai 修复之后系统再报错, ai 再修复, 有用户脚本死循环,一周跑出一点八亿 token 的 天价账单。更有 ai 后台崩溃,重洗四千六百七十一次,主人却完全不知情,你没操作,电脑在空转,钱在狂烧。 对策,必须设置每日消费上限。第三部分,未来 token 会便宜吗?结论,单价必跌,总账难审,为什么跌?因为以后算法会更强,芯片会更便宜,大厂会进行价格战,现在价格已经是两年前的百分之一。 那为什么总账难审?因为杰文斯贝论越便宜,你用的越疯。以前只敢问一句话,以后会让 ai 读完整个图书馆,结果单个托肯像自来水一样便宜,但你家的水费账单反而更高了,别指望免费,要指望控制用量。 第四部分,立刻执行的四条止损指令,一、切换模型简单任务,如翻译总结,强制使用经济型模型,如 deepsea quiz。 问 turbo, 别用旗舰版杀机二、设置应限额,去云厂商后台设置 daily budget, 每日预算超支自动停机。 三、限制输出长度,在所有提示词末尾加上回答,严格控制在两百字以内。四、清理上下文,每周清理一次 opencloud 的 长期机密库,减小背景包体积,不做这四步,你的下一次账单爆炸只是时间问题。 节语 token 是 ai 时代的电费, opencloud 给了你超级算力,但也给了你超级账单的风险。懂规则才能驾驭它,不懂规则就是为它收割。觉得有用点赞收藏,转给你那个正在乱用 ai 的 朋友。

兄弟们,一天两个亿,这个水平怎么样?最近小米那个 over 百亿补贴,我领了八亿的 token, 然后不到五天全部都用完了。我用的模型是 miami v 二点五 pro, 基本上一条 prom 就 要耗费几十上百万的 token。 我 跟你讲,这个 token 消耗的速度就跟高三漏了底的油箱一样,那个油表的指征就是以肉眼可见的速度疯狂的往下掉, 然后下一站还有更好更贵的模型在等着宰你。最近呢,也有些信息就是豆包看收费了,其他平台也在收紧他们的政策。这让我突然反应过来,我焦虑的其实不是这些免费的额度正在不断被消耗,而是这个 ai 的 廉价的学习窗口马上就要关闭了。 你想现在消耗头可让大模型跟你合作去做各种产品,它其实就是你交的学费。而我们现在面临的现实是,现在可能只要一分钱一节的课,未来可能要变到一块钱一节课,甚至十块钱一节课。 所以你懂我在说什么呢?你现在花的模型的 token 可能就是未来 token 价格的最低点。你现在每一次试错都是在抢一个越来越贵的入场券,所以你尽可能多的去消耗你的 token 吧,未来可能没有那么便宜的吧。

我就用上海电信开出了他第一张的 token 的 账单啊,这是否标志的 token 已经进入了水电煤这些基础设施的日常的一个清单?而且目前已经开始使用了上海本地业务 可以直接接入电信的 token 服务,目前的资费大约是一元二十五万的 token 的 使用量,而且接入的模型不再是单一模型,你像主流的一些智普,千万, kimi 这些全部能直接调用。其实我在四月份的视频中已经说过啊, tiktok 是 借水电煤通讯费后第五项基础日常使用花费。所有兄弟们,全民 tiktok 的 时代比我们想象中还快啊。算力够不够用啊?算力板块看一下吧兄弟们。

兄弟们,又来了一个大事件,上海电信正式推出了个人 token 算力套餐,一块钱啊,买二十五万 token 直接走手机话费的扣费。在这之前呢,三大运营商已经集体宣布啊,流量经营时代结束了, token 经营时代 开启了,移动、联通、电信啊,全都在卖 token 的, 那做词源聚合风发的,你该慌吗?哎,先别急啊,我帮你把这件事情呢猜一猜。首先啊,运营商入场卖 token, 对 整个赛道来说是巨大的利好,为什么?因为它帮你完成了最难的第一步,市场教育。 以前呢,你跟客户说你需要买 token 来用 ai 啊,大部分人听不懂啊。但是现在,运营商用话费套餐的方式把 token 卖给了十亿级别的用户,那相当于是帮你把什么是 token 这个概念普及到了每一个普通人的手机账单里面。 好,市场认知一旦建立起来,你做资源分销的获客成本就会大幅降低。那其次,你要看清楚运营商的软肋啊,运营商卖的是 took, 底层模型全都不是自己的呀,运营商的角色本质上就是分销商,那跟二十年前的卖别人的内容,收自己的流量费的逻辑是一毛一样,嘿嘿,你意味着 这意味着四个结构性的弱点,第一,没有定价权,那 took 的 价格基础呢?是有模型厂商定的,那运营商只能加价转售,一旦模型方啊, 直接面向 c 端去卖 token, 那 运营商的价格优势就立刻消失了。好。第二呢,看不到用户数据,用户跟 ai 聊了什么偏好,什么用在什么场景,全都沉淀在模型方那里,运营商只能看到账单,看不到用户好。 第三,依赖单一供应商啊,那压住某一家模型,万一对方涨价断供或者是调整合作条款,那整个产品线那可就被动了。第四呢,是内部打架,各省公司各自推套餐啊,价格相近,用户重叠,长期只会互相压价,贪保利润。那听到这里, 你发现没有,运营商面临的这些问题,恰恰就是资源的聚合平台要解决的问题。你做 token 聚合,风化天然, 那就是多模型的接入嘛,不依赖单一的供应商,你帮客户做智能路由啊,自动选择最合适的模型,不是替某一家模型卖货,你能沉淀客户的使用数据和场景需求,那反过来优化服务。说运营商啊,要从卖 token 升级到卖场景, 要建 token 中台做智能调度啊,要从分销商变成生态调度的中枢纽,这不就是我们一直在聊的资源聚合平台的终极形态吗?哎,所以运营商入场对你来说不是威胁,而是信号,它证明了 token 经济已经开始从开发者的圈子走进了主流市场,连国家队都下场了。好 运营商做的是大水漫灌式的标准化的服务,你做的是精准低灌式的个性化的服务。帮客户选模型啊,做路由,控成本,解决具体场景问题,这些运营商干不了了,也不会干。兄弟们, 运营商把你教育的市场,你帮客户解决具体问题,各赚各的钱好吧。嘿,我是大卫,深耕 ai 大 模型聚合服务,关注我,带你看懂磁源赛道的每一个重大变局啊!

小心下个月交话费的时候,你的账单上可能会多一项 token 费。不是乱投费,是运营商开始卖 ai 了。上海电信昨天发了个 token 资费套餐,一块钱二十五万 token, token 就是 让 ai 干活的工作量,二十五万够你跟 chat gpt 聊三百轮。 十块钱两百五十万,够 ai 帮你读一百本十万字电子书,你这辈子都不一定读得完的量。但真正值得说一说的是支付方式, 不用绑信用卡,不用翻墙注册,直接走话费账单跟交流量费一模一样,短信写着,您本月 toker 消费 x x 元。以前 ai 是 小圈子的玩具,你得会注册懂 api, 翻得了墙才能用。以后 ai 跟水电煤一样,拧开就有,交话费就行。 而且这事不是上海电信一家在试水报废,中国电信同一天砸了一百七十四亿。在试水报废,中国联通也出了算力套餐, 三大运营商同一时间窗口全部转向。这不是巧合,背后就一个数字,全国 token 掉用量两年涨了一千四百倍。运营商的账是这么算的,以前收你流量费,一个月几十块顶天了。以后 token 费可能是流量费的好几倍,所以他们不卖水管了,他们开始卖水。 以前交话费买的是能上网,以后交话费买的可能是能思考最后一问,如果话费账单从此分两栏,左边流量费,右边 ai 费,你觉得合理吗?

中国电信 token 套餐值不值得用,先看四点,它解决什么问题?买 token 不 用到处找,电信一站式搞定。它替代了谁?替代不了大厂模型,但适合稳定用量。 成本高不高?三十九点九元起,最低档购个人玩普通人今天能不能用上?能,但要先注册天意账号适合谁?适合稳定用量的开发者,中小企业不适合偶尔用 ai 的 普通人。我的判断可以关注,不用急着买,先看看后续价格会不会降。