最近有个词开始频繁出现,黄仁轩在说, ar 圈在说,官媒也在说,这个词,就是托肯。现在他已经有了明确的中文名,叫词源, 大象前行,精彩开讲。那词源到底是什么了?为什么他会突然崛起? 他和中国的电力算理布局到底又有什么关系了?最关键的是,他跟普通人有什么连接了?先说最核心的一句, 磁源不是代币,它是 ar 计算的计量单位,电脑运行要耗电,汽车上路要烧油,给 ar 下一次指令也一样要消耗资源。这个资源怎么量化,靠的就是磁源。 所以它不是拿来炒的,它是拿来算账的。现在主流 ar 浮底层就是这么收费的。以 open ar 为例, a p r 价格按输入和输出 token 分 别计费,给模型多少内容,模型返回多少内容,最后都能折算成 版本。更关键的是,这不是小趋势,国家数据局,譬如我国日均资源调用量二零二四年初还是一千亿,到二零二五年底月升到一百万亿,到二零二六年三月已经突破了一百四十万亿, 两年时间增长超千倍。这个变化说明 a r 已经不是好不好玩的问题了,而是开始进入怎么算钱,怎么算成本、怎么算价值的阶段。资源崛起的不是一个新名词,而是 a r 这场生产力变更,开始进入可计量、可定价、 可落地的阶段。为什么资源会突然崛起?因为它背后拼的不是概念,而是基础设施。很多人一说 ar, 马上想到模型、算法、芯片。但最先进的 ar, 只要真正落地,就绕不开一个最现实的问题,电力 电便宜,算力成本就低,投坑成本也就低,电贵自然这些也更贵。所以中国这几年做的不是简单一句发展 ar, 而是在搭底做去公布。 二零二五年,全国发电量达到十万五千七百五十二点五亿千瓦时,年末全国发电装机容量达到三十八点九一三四亿千瓦,其中风电装机六点四零零亿千瓦,太阳能发电装机十二点零一七三亿千瓦, 两项都在高速增长。这个盘子决定了中国做 ar 不是 空着底座往前冲,而是背后已经有超大规模能源系统在拖底。你想让大模型长期跑,让数据中心大规模开,让算力长期稳定释放,没有这个电力盘子,根本谈不上产业化。 那么第二张底牌就是东数西算。二零二二年,国家正式批复建设八个国家算力枢纽节点,十个国家数据中心集群。截止二零二四年六月底,八大枢纽节点直接投资已超过 四百三十五亿元。到二零二五年,八大枢纽节点的算力规模已经约占全国总量的百分之七十。 这说明中国已经不是哪里缺算力就临时搭机房,而是在全国范围内,把电力网络、土地数据中心和算力调度系统性连成一张网,这背后是一整套国家级的布局。 你再看具体的地方就更清楚了。比如贵州。十四五时期,贵州在线及投运的重点数据中心从七个增加到五十个,算力规模从零点八四 f 洛克斯 提升到一百六十 f 洛克斯,标准基价提升到三十二万加,而且算力用户百分之九十以上来自省外。二零二五年贵州算力运营服 务收入达到八百二十四亿元。这说明西部不只是电便宜,而是已经把电力优势变成算力优势,再把算力优势变成了服务能力,这才是真正厉害的地方。因为 ar 进入下半场之后,决定竞争力的不是会不会做模型, 而是谁能把模型背后的算力、成本、服务做成一个稳定的产业。理解了资源背后的生产力变化,你就知道这件事跟普通人到底有什么关系了。现在很多人还没感觉,是因为行业还在免费抢量阶段,平台愿意先让你用, 先让你形成习惯,先把市场做起来。这跟当年很多互联网产品的发展路径很像,先免费, 先扩张,先抢用户,等格局慢慢稳定之后,再进入更精细的计费模式, ar 大 概率也会走这个方向。这也是为什么越来越多的企业会开始重视 ar 产出的效率。过去很多岗位考核的是经验、流程、工时, 未来越来越多的岗位看的会是你能不能把 ar 真正接入日常工作。所以普通人现在最该做的不是围着 token 这个词打转,而是立刻提升三件事。第一,把概念理解对词源不是币,不是投资门票, 它就是 ar 计算单位,你先把方向搞对,后面才不会一开始就跑偏。第二,把 ar 真正接近工作。这句话很重要,不是会问几个问题就会用 ar。 真正有用的是把 ar 接近你每天都在做的事例,比如写提纲、整理资料、提炼重点、优化表达、做会议纪要、拆解任务、列执行步骤,只要把它接近工作流, 他才会变成你的能力。那么第三呢?提前适应未来的计费和绩效逻辑。未来很多企业看中的不是谁更忙,而是谁最有效率。所以你必须尽快成为一个会借 ar 提高产出的人。 你是做行政的,就让自己整理材料更快。你是做销售的,就让自己整理客户信息,准备沟通话术更快。你是做管理的,就要让自己做计,要拆任务,做复盘更快。所以普通人真正要抓住的机会,不是围着瓷源这个瓷转, 而是借着这场生产力的变更,把自己往前推一步。你觉得呢?评论区,咱们一起来聊一聊,关注大象不迷路!
粉丝977获赞8349

一人给二十二万人民币的托克,把几万员工当 ai 特种兵在死练。小马哥这次是真的急了,看了英佛麦神爆料俄内部的绝密项目,打算为微信接入全新 ai 智能体,以赶超阿里和字节。紧接着外网爆料,腾讯员工每人配置了二十二万的托克额度,全员全副武装。看来手握着微信十几亿 用户的腾讯,这次是真想借着 open cloud 风上桌吃饭。就在凌晨,小马哥亲自端出了一桌龙虾全家桶,有自研龙虾、本地虾、云端虾、企业 虾、云桌面虾,还有安全隔离虾房、云保安和知识库。这一套下来,明显就是想 o 硬 ai 生态,把用户和小程序、支付、公众号、视频号全部打通,塞进一个超级 ai 大 脑里。要知道隔壁豆包月活快两亿了,阿里也砸了三十亿补贴抢用户,这春节腾讯元宝花了十亿, 就好像丢水里,想都没听到。也难怪,这波要把 ai 全线植入微信,这是要绝地反击的。而这里我们也看出, 当大厂 ai 竞赛进入下半场,拼的不是谁模型参数强,是谁能让十几亿人不知不觉用上 ai。 所以 一堆人跟风安装 open club, 却不知道大厂用人均二十二万额度来练兵, 普通人根本没必要凑热闹,硬卷普通人才算真正吃上工业革命的红利。

同样输出一句话,我是中国人,不同的 ai 花的 token 居然不一样,今天我们实操一波,来看看 token 究竟是什么?来,我们直接上网看。 ok, 那 我们现在看一下,同样输入一句话,我是中国人,不同的大模型输出是什么样的?先来看一下 gbt 五输入这句话 啊,可以显示,看到这里显示了三个不同的高亮色块,每个色块就指的是一个 token 词源啊,所以这里是一共有三个 token。 好,其实呢,输入计算机的时候,托肯是会转换成为 id 的, 像这样,每个托肯对应的是一个唯一的数字 id, 这些数字 id 还需要进行矩阵转置,变成高维度的向量坐标,最终再输入到大模型进行处理。 可以同样看到,如果是 gpt 四的话啊,同样一句话,我是中国人,他输出的托肯数是四个的,那么 gpt 五其实还是针对这些中文词组做了一定的优化。 看一下国内的大模型,同样输入一句话,我是中国人,输出的 to k 数主要两个,因为我们国内的大模型可能相对于一二或者词语的分割来讲,是对国外要更优一些的,所以输出的 to k 数会更少,也就要看一个有意思的。我们看一下火山这边, 像图片照样也能通过图片的长宽,然后再除以一个固定值,也可以算出图片消耗的 to k, 图片消耗的 to k 量其实会更大, 所以我们用一些图形或者视频处理的大模型的时候,整整体的费用是会更高的。好了,那我们的演示就到这里结束了,所以我们为什么要关注 tok 呢?因为现在我们用的大模型 api 都是按 tok 计费的, toker 越少,同样的对话花费就越少, ai 一 次性能技术的内容就更多,所所以选对模型能省不少。当然,其实 toker 的 费用也跟模型本身的参数量成正相关。 toker 计算器的链接我已经放在评论区,大家可以试一下,输入你最常用的句子,看看需要用多少个 toker。

ai 时代,大家都在说 token, 这是什么意思呢? ai 的 token, 国内专门给它起个名字叫词源,它是 ai 大 模型处理文本的最小单位。 token 呢,可以是一个字一个词,也可以是半个字,这是大模型根据人类文字统计出来的。比如说你好可以拆分成你和好两个 token。 我 喜欢 ai, 可以 被拆分成我喜欢 ai 三个 token, 常见的字和词就用一个 token 来表示,其他的就用多个 token 拼接。而图片呢,会切分成很多小小的方块,每个方块当做一个视觉的 token, 就 像拼图一样。那 token 具体是怎么收费的呢?为什么我们使用豆包或者其他大模型都没有收费呢? 但你使用 a s 记费呢?通常是按 token 的 数量来计算的,一般以百万 token 为计算单位。一百万 token 呢,约等于三本新华字典。 根据目前各大模型的收费价格,输入价格是在八毛钱到八块钱一百万 to k, 输出价格在两块钱到八十元一百万 to k。 目前各大 ai 应用为了抢占市场,让你免费使用,成本呢,暂时不用你出,如果你是企业用户或者演龙虾,就需要你支付费用。

各位,这两天有个事啊,看起来不大,但是我觉得很多人都低估了阿里、腾讯开始给员工发 token 了,一年人均大概二十二万 token。 很多人看到这条新闻的第一反应是,发点额度呗,让大家多拥有 ai, 就 像以前发办公软件权限一样。还有人说是公司发福利了, 如果你真的这么想,那你可能没看懂,如果是福利,为什么不是发钱?如果是权限,为什么不是发工具,偏偏是 token? toker 这个东西本质是什么?简单来说,就是 ai 世界里的消耗单位。你问一句话,它要消耗你生成一张图,它要消耗你,让 ai 帮你做一整套工具,它更要消耗。也就是说,你不是在用 ai, 你 是在消耗一种资源。以前互联网的逻辑是什么?流量最重要, 谁有用户,谁就有话语权。现在开始慢慢变成另一种东西,谁能生产 toker, 谁能承载消耗,谁就有位置。 所以你现在看看这些公司,不是突然变大方的,而是被逼的。因为 ai 现在进入了一个新阶段,不是拼谁更聪明,是在拼谁能扛得住使用量。你现在用 ai 只是没问题, 但接下来越来越多的是让 ai 干活,写报告、做分析、跑流程,巴拉巴拉巴拉,很多任务里边会调用几十次,上百次 ai, 这个时候 token 的 消耗是指数级增长的。 问题来了,如果没人用你模型再强是不是也没什么意义?如果用的人太多,你扛不住,那是不是更麻烦?所以最直接的办法是什么?不是等用户把人推进去用, 员工就是第一批的测试用户,你给他额度,你让他天天用,他自然会把工作迁移到 ai 上,整个过程其实就在干一件事,练使用习惯,一旦习惯形成,就回不去了。 而且你们有没有发现,最近一段时间,一边在发抖币,另一边在涨价,人厂商的 ai 价格在往上走,有的甚至直接翻了几倍,这听起来是不是有点矛盾?一 边送一边涨,前期让你习惯使用,后期让你离不开。这套逻辑你其实见过当年的外卖、打车短视频,全是先补贴你离不开了,再开始重建价格体系。现在这套东西被搬上了 ai, 只是这次换了个单位, 不再是钱,是 token。 阿里甚至开始把 token 使用量当成了核心指标,这意味着什么?这意味着以后衡量一个 ai 公司,不只是看模型多强, 还要看每天被用了多少次。就像电厂不是看你能发多少电,而是看有多少人在真正的用你的电。所以你现在再回头看那二十二万 token, 它就不再是一个福利,它更像是一张门票,把人拉进这个新系统里。 一旦你开始用 ai 做事,你的工作流程就会变,你的效率会变,甚至你对工作的理解都会变。用不完的员工裁掉,因为这说明他不会用 ai, 用的飞快的员工,让他一个人干 n 个人的活,要不然这 ai 使用力都浪费了,偷看都用哪去了?所以有的时候不得不佩服资本的潜台性啊,只是一个简单的发福利就能撬动如此巨大的市场,我等平民有的时候反抗实在是堂必当车。在时代的洪流下,我觉得没有多少人能够从容的游到岸边。

腾讯和阿里现在给员工发的不是月饼,也不是打车券,而是 ai token。 每人每年二十多万的算利率度,直接打进你的工作账号。这不是科幻设定,而是二零二六年大厂的真实日常。阿里从三月起全面推行悟空平台, 员工用钉钉就能调用 ai 写代码、做设计、跑日制,所有操作在企业权限体系内完成,数据不出内网。腾讯更狠,工程师每月能拿到近两万块的 token 额度,光是 cloud internal 和 cursor 这两项就各值五千块, 再加上客户的 body、 g、 l、 m 这些工具,一年算下来人均二十二点八万元。重点来了,这些额度不是摆设,而是被当成绩效指标来用。有团队已经要求每天必须达到最低 token 消耗量,没用完可能影响季度评级。 ai 分享会一周开两三次,产品经理甚至放话,有 ai 我 们为什么还要那么多研发? 听起来夸张,但现实就是,不用 ai 的 人正在被系统性的边缘化。更关键的是,公司根本不在乎这点钱。过去三年, ai 推理成本降了上百倍,花七万美元买一个顶级工程师的 ai 配额,换来的效率提升,远超再招一个人。 而且员工高频使用 cloud gpt 这些闭源模型时产生的高质量交互数据,还能反哺自家大模型训练,等于一边干活一边帮公司养 ai。 现在的大厂,已经不是会不会用 ai 的 问题,而是能不能让 ai 持续产出高价值。结果 有人用 ai 只写个 redmi, 有 人却把百分之九十的常规开发全自动化,自己专注架构和审查,差距就在这一念之间。免费三餐曾是互联网的标配福利,后来变成远程办公补贴,现在轮到了 ai token。 照这个趋势,到二零二七年底,薪加 token 加股权,很可能成为知识型岗位的新薪酬结构,算力正在成为职场新货币。

腾讯每个人给了二十二万的滔凯,二十二万啊,非常夸张啊,非常夸张,有钱啊,非常豪横。说白了,大公司都是在给员工 无限的滔凯,让他们用 ai 去试错,但是我说实话,现在还没有一个公司敢拍板说我们公司把 ai 利用到极致了。其实你想想吧,你跟腾讯的员工其实都在干的一件事,你们都是在跟 ai 动画,你用的模型,可能他们不外乎就是他的稍微的滔凯更多一点,你跟他有什么区别呢? 没啥区别吧,所以说你们要明白一点哈,就是我们现在你跟大公司的人其实已经实现技术平局,我们虽然被别人平局了,但是我们也跟他们去平局了,慢慢慢慢的所有人,我靠,基本上就全废掉啊,都废掉了,你会干啥我也会干啥,因为他们都一样啊,你你你有模型,我也有模型,买买 tiktok 就 好了呀。

最近网上有个特别火的词叫 token, 我 自己也用过好几款 ai 工具,像腾讯的那个 workbody、 kimi code 等等,他们每一次处理任务都会调用 token。 那 么我们应该怎么去理解这个 token 呢? 说白了,它背后代表的就是电力、算力、内存还有流量,是 ai 运行的真实成本。 这一段经历一下子就把我拉回到二十几年前,那个时候二 g 网络刚普及,流量特别稀缺,计算方式也特别直观,就是多用多付,少用少付。 那么放到我们采购的工作里,想要靠那个 ai 降本增效,思路其实是一模一样的。 我们在替公司选那个 ai 服务三的时候,重点看两个核心因素,第一, 电力、算力人工成本不同,直接决定了它的基础报价。第二,算法效率不同。好的算法就像一台省油的发动机,同样的是消耗更低,成本更少。 企业在选型时就可以按照这两个维度去比价和筛选。同时我们还要针对这种新的工作模式,重新制定 sop, 优化每一步操作细节,这样才能真正把 ai 的 使用成本降下来。 这个领域还有很多创新空间,未来也会诞生一批新的岗位、新的人才需求。大家可以翻一翻我前几期的视频,记住,认知领先一步,你就比对手强一点点。我是小爱,关注我,下期更精彩!

a i 里的套路到底是啥?说白了就是 ai 按次数收费的计算方式,你输入的文字和 ai 回复的内容,每一个字都要算钱。不是按对话次数收费哦, 而是实打实的按次数计费。你问题问的越长, ai 回答的越多,你额度就消耗的越快。所以额度用完真不是你操作失误,纯粹是是次数堆出来的。记住这个核心 涛哥就是统计你用了 ai 多少字。知道这个原理后,你就再也不会被突然用完额度吓到了。关注崽崽,带你用 ai 高效提升自己!

腾讯、阿里开始给员工发 token, 也就是 ai 工具的算力额度了。腾讯的员工现在人均一年有二十二万的 token, 很多人欢呼说大厂福利太香了,简直堪比免费的三餐下午茶,这才是真正的 ai 时代福利。但是 别傻了,那不是福利,那只是新的挖掘机而已。这条视频我们会用资本的逻辑去翻译一下,你就会全明白了。 先来看看什么叫福利。以前你在工地上搬砖,老板每天管你一顿红烧肉盒饭,那叫福利,那是为了让你吃饱了之后能多搬两块砖。现在呢,老板给你配了一台价值两百万的重型挖掘机,然后告诉你,这也是福利哦,好好干。 你坐在驾驶室,吹着空调,听着音乐,觉得老板真大方。那你想过没有,给你挖掘机,是为了让你一个人干出一百个人的量,不是让你更轻松,是让你的产出翻一百倍。 其次就是工具变强了,并不等于你变轻松了,这是很多人最深的误解,你以为公司发 token 是 为了让你用 ai 工具提高效率,然后早点下单。 其实真实的剧本是这样的,以前你不用 ai, 写个底层代码要一周。现在给你 curser, 你 半天就该跑通。以前你写文档慢一点,别人糙一点,大家还能互相打掩护,摸个鱼。现在呢?只要你部门有一个人能用好这些 token, 一个人干了以前三个人的活,剩下的两个人就要面临被优化的危险。 工具变强了,意味着你必须变得更强,否则你就是那个无法适配新生产力的落后,才能也该淘汰了。 第三就是,这不仅仅不是福利,甚至是一种生产工具的强行升级。这是让我想起一百多年前的泰勒科学管理就是当年福特发明流水线,不是为了让工人更轻松,而是为了把工人每一个动作都标准化、量化,让机器来控制人的节奏。 现在的 ai 工具,就是新时代脑力劳动者的全自动化流水线。你拿了无限额度的 g、 l m, 拿了高额的 cursor, 拿了很多 token, 但到了年底考核,你的产出并没有发生质的飞跃。在领导和 hr 眼里,你就是那个无法适配新生产力的人。 历史规律无数次告诉我们,技术革新带来的效率红利,大头从来不会流向底层的打工人,老板拿走绝大多数的增量打工人面临的是更高维度的无差别内卷。 所以说,回到问题本身,有人问算力, token 到底会不会成为以后大厂的标配?一定会,但是绝不会以福利的形式出现,而是以基础设施和考核指标的形式出现。 二十年前,互联网公司给员工配台式电脑连宽带,那是福利吗?不是,那是基本的办公条件。未来的 token 也是一模一样的宿命,它只是这些大厂的基本工具罢了。你今天领了 token, 明天就要交出答卷,你用了不好,产出不够,你就是那个该被优化的人。 那我们该怎么办呢?游戏的规则变了,以前你可以在舒适区里待着,慢慢干,慢慢学,但现在不行了,要么你变成一个人能干三个活的人,要么你就成为被剩下的两个人之一。 所以该怎么选?第一就是我们不要把 token 当做福利,要把它当武器,公司给你挖掘机你就得开,你不仅要会开,你还要把它当成坦克来开。第二就是你不只要会用工具,你还要能设计工作流,让 ai 干 ai 的 活,你干你的活,你负责判断决策单责,这才是 ai 现在替代不了的事。 再就是我们要把工具的能力变成你自己的资产,公司给的 token 是 公司的,但是你自己的,你在公司用 ai 练出来的能力,以后去哪都能用。 这半年我也一直在做一件事,就是帮职场人、管理者和创业者去看清 ai 时代真正的规则,不是教你用工具,而是一起聊你的处境,你的行业,你的卡点,然后帮你找到那个 ai 替代不了的位置。 所以,如果你也在思考怎么从被考核的人变成考核决策和用工具的人,怎么让 ai 帮你提效,而不是帮你内卷,怎么在工具升级的浪潮里成为那个不被剩下的人。 欢迎来找潘妮聊聊个人和团队企业咨询,也欢迎后台私信咨询了解详情。当然,如果你想给自己留条后路,我还整理了全国十七个城市的 o p c 一 人公司政策资料,可以先看看哪些地方再给你送钱,私信留言 o p c 获取。 总而言之,大厂发 token 不是 福利,你可以选择坐在驾驶室里等着被安排,也可以学会开挖掘机,甚至造挖掘机,让自己变成那个能够以一敌百的人。关注潘妮,我们一起看清规则,玩对新游戏!

token, 大家都觉得这是个挺高级的技术名词,甚至还有人以为是搞区块链炒币的那个代币。你如果没搞懂 token 的 底层逻辑,你就根本看不懂现在这帮 ai 大 厂到底在赚什么钱。你在对话框里跟 ai 说的每一句话,它不是按一个字一个词去理解的。 为什么?这逻辑很简单,你要是按整词去算,中英文词汇量,几百万模型脑容量根本装不下,遇到个生僻词直接就蒙了。你要是按单个字猜,那完全就是碎片,没有上下文逻辑,他根本学不会。所以行业里是怎么干的?他把高频出现的连续字固定的词根打包成一个小块, 这个最小的处理单位就叫 token, 中文差不多一个汉字对应一到两个 token。 这样做既把词汇表压缩了,又保住了句子的核心意思。它其实是 ai 时代的核心消耗品, 是整个 ai 行业的底层硬通货。大家回想一下历史,第一次工业革命,机器转起来靠什么烧煤?第二次垫起革命,全世界的命脉是什么? 是电?再往后,全球经济为了抢油田甚至能打仗,对不对?现在这个 ai 时代,所有大模型跑起来烧的全是 tok? 你 觉得你是在用 ai 写剧本划分境?你觉得大厂在搞毫秒级的金融交易?无人驾驶?拨开表面看本质,每一次点击背后全是在疯狂地烧 tok。 你顺着这个思路去盘整条 ai 产业链,最底层的电力是基础能源,英伟达卖的那些天价 gpu, 其实就是生产 tok 的 发电机,那些云厂商和大模型公司,本质上就是 tok 制造工厂和批发商,而最终我们用的各种 ai 软件全都是消耗终端。整个行业的商业逻辑 掰开了,揉碎了,其实就八个字,生产 token, 售卖 token。 未来 token 的 价格绝对会像今天的电价水价一样,成为整个社会最核心的经济指标。 谁能把生产 token 的 成本给打下来,谁就掐住了所有行业的脖子,掌握了真正的定价权。你平时用 ai 的 时候关注过 token 消耗吗?评论区聊聊。

给 ai 发连续重复的文字,比如哈哈哈,六六六这种 token 会变少吗?其实从严格意义上来说, token 不 会变少的。比如说你发八个六和发二十个六,对大模型来说,它的理解的意义不一样的,它可能需要把十个六分成六六六,和另外的七个六六六 其实是不一样的,包括哈哈哈,也是因为他不知道你到底是几个哈,想要表示什么意思。如果说他托克会变少的话,我给他发十个,哈哈,我问他是几个,哈哈,他是不是就识别不出来了呢?所以说这个地方是不会变少的。 我把 ai 本地部署后还会消耗 tok 吗?本地部署以后其实还会消耗 tok 的, 因为刚刚我讲过, tok 只是个低廉单位。那为什么说本地部署以后不费钱呢?是因为你本地部署以后算力是由你自己的电脑提供的,那它不需要去买 tok。 但是 tok 的 使用和消耗是实打实存在的,只 不过这个 token 不 花钱。大小写不同的。同一个单词算同一个 token 吗?这两个其实不会算做同一个 token 的, 因为有些单词,尤其是英文单词,它大小写会有一些不一样的意思。理解大模型需要正确的理解你词语的含义,需要分大小写、 缩写和完整的拼写, token 会一样多吗?这个地方要看大模型的厂商它们的词表或者词库 有没有收录这个单词。比如说可能我们常见的 ai, g、 d、 p、 u、 r、 l 这些单词是大模型已经收录过的,那其实缩写和完整拼写它 们消耗的托管是一样多的,有些单词的缩写是 ai 没有收录的,或者说还没有来得及收录的,比如什么 y y d s, 比如说 divx d s, 那 其实它的托管和完整的拼写来说是不一样的。 ai 到底是怎么分词的呀? 其实它就是通过词表词库来进行分词,它其实涉及到了 n l、 p 自然语言处理,它是会把一个句子拆分成多个词, 或者叫多个托肯,然后为给大模型进行理解。这样的好处在于大模型不会因为一个字的变化或者一个字的错误去理 片意思。比如说我问他今天天气很好,他其实会拆成今天一个天气,一个很好,那其实就非常方便理解了。但是如果说他一个字一个字区分的话,今天天气很好, 在这种情况下他理解会出现偏差,并且消耗的算力会更多。所以说大模型在输入输出之前都会进行一轮分词。

什么是 agent? 什么是 m c p? 什么是 skill? 还有什么叫 token? 你 是不是每次看 ai 教程感觉听懂了,好像又没听懂?今天我用最土的话把八个词给你说明白。先说第一个词, token, ai 它不像是人一样读字,它把文字是切成一小块一小块的来处理,每一块就叫一个 token, 就 像是超市收银台,不管你买什么都要一件一件的扫码计费, 那这个 tok 就是 ai 的 扫码单位。比如中文它是一个字就是一个 tok, 英文就是四个字母是一个 tok, 也就是说它说的越多, tok 的 越多,花钱就越多。接下来我们说第二个 context, 它就是 ai 的 短期记忆,比如你说帮我改一下 ai, 就 知道你指的是刚才那篇文章,这就是 context。 这像是一张便利贴,能记的内容是有限的,如果贴满了, ai 也会忘, 但是记忆是有上限的,如果你聊得太久了,它就会变笨,因为它的记忆满了,这个东西越大, ai 记住的东西越多,它就越厉害。第三个就是 a p a, 这个就是两个软件之间的一个通道,你可以把它当成软件里面的插座, 一个软件可以通过这个,它可以调用另一个软件的能力。比如说天气的软件需要通过这个知道气象局,它的数据库,最后就显示时间,这个就是要开始用 token 的 计费了。第四个就是工作流,就像是麦当劳做汉堡、 烤面包、放肉、加酱、包装,每个步骤都是固定的,工作流就相当于是流水线。比如说让 ai 写文章,它要自动配图,然后自动发布,收到邮件它自动分类,自动回复, 它的优点就是非常稳定,步骤固定。但是它的缺点就是非常死板,如果遇到意外,它就不会变通。工作流是死的,它只能按照你设计的步骤走。第五个就是 agent, 它就是智能体,像普通的 ai 就是 你问一句,他答一句。这个 agent 就 像是你雇了一个员工,你说把这个事情搞定,但你不需要告诉他你要怎么做,他会自己想办法,做完之后再汇报。 所以说工作流是死的, agent 是 活的,它能理解任务,并且能自主地去拆解,需要什么资料它都自己去搜索,操作文件出错了也会自己去调整。第六个就是 skill, skill 是 agent 安装的功能插件,需要什么能力就装什么,就像你的手机 app, 你 用什么就下载什么,不用全装 skill 就 能决定 agent 能做什么,装的越多,能力越强。 第七个 m c p, 它就是让 ai 只会说话,升级到真正动手操作。以前,你需要告诉 ai 怎么整理文件,有了这个之后, ai 就 会直接帮你整理好。第八个就是多智能体写作,一个 agent, 它搞不定的事情,就需要组一个 ai 团队,多个 agent 分 工写作,各干各的。它就像是一个项目团队,要有产品经理、设计师、程序员、测试,一起去完成这个任务。

欢迎来到 ai 的 底层世界,当你与 chat、 gpt 或 cloud 对 话时,屏幕下方常会闪过一行小字,本次消耗了多少 token? 你 是否好奇过,为什么 ai 不 按字数计费,而要发明 token 这个奇怪的单位?今天,我们将拆解 ai 的 思维,看看它是如何读懂人类语言的。 首先,我们需要打破一个幻觉, ai 并不真的认识文字。在我们眼中,今天天气很好,是一句充满阳光的话语。但在 ai 的 处理器里,它只是一串冰冷的数字序列, 文字只是人类为了理解而披上的外衣。 ai 处理语言的第一步是切碎,这个过程叫 tokenization 模型会将句子拆解成最小的羽翼单位。比如今天天气很好,可能会被切成。今天天气很好,这些被切出来的碎片就是 token, 它是 ai 认知的最小颗粒度。 切碎之后,每个 token 都会领到一张身份证,也就是数字 id。 比如天气对应的可能是五八三一,很好,对应的是九二七。 通过这种映射,感性的文字彻底变成了理性的数字。一句话就这样变成了一串数字 id 系列。但仅仅有编号是不够的, ai 还需要理解词与词之间的关系,于是数字 id 会被进一步转化为向量。想象一个拥有几千个维度的巨大空间,每个词都在其中有一个精确的坐标。 猫和狗的坐标离得很近,因为它们都是宠物,而猫和手机则相距甚远。这就是 ai 理解语义的方式。 有了坐标, ai 就 可以开始思考了。大语言模型的核心逻辑其实非常简单。接龙,当你输入今天很模型会计算所有可能出现的下一个 token 的 概率,好的概率是百分之八十五,冷是百分之十。 ai 会选择概率最高的那一个,接在后面循环往复,直到生成完整的回答。 然而, ai 的 记忆是有极限的,这就是上下文窗口,它就像一个滑动的取景框,只能同时处理一定数量的 token。 一 旦对话太长,最早的信息就会被挤出窗口,导致 ai 出现断片或逻辑混乱。 这也是为什么窗口越大,模型就越昂贵。你可能会发现,中文对话有时比英文更贵,这是因为中英文的拆分效率不同, 英文单词通常对应一到两个 token, 而复杂的汉字或词组往往会被拆得更碎。经验告诉我们,一千个 token 能写七百五十个英文单词,但只能写不到五百个汉字。 为什么要按 token 收费呢?因为每一个 token 的 生成背后都是数以亿次的矩阵运算, token 越多,算力消耗就呈平方级增长。 你付出的每一分钱,本质上都是在为这些庞大的数学计算买单。总结来说,我们看到的是文字, ai 看到的是 token、 数字与概率。 ai 并不真正理解我们的情感,它只是通过极致的计算预测出最合理的下一个词。理解了 token, 你 就理解了 ai 认知的边界。

你有没有发现一件特别奇怪的事,现在不管是豆包、腾讯元宝,还是其他 ai 智能体,日常聊天、写文案、查东西,全都不用花钱也不用,算什么头肯大家用的理所当然。但很少有人真的去想,算,力不要钱吗?研发不要钱吗?服务器不要钱吗?平台凭什么免费给我们用? 背后真正的逻辑,其实比你想象的更现实,也更精彩。首先,我们得先看懂一个关键点, coco 到底意味着什么?它不只是一个计费单位,它本质上是 ai 的 运算成本。你每问一句话, ai 每回一段话,都要经过海量的计算、推理、调度,这背后是显卡、电力贷宽堆出来的。放在几年前,大模型刚出来的时候,成本高到吓人,所以只能 收费限额度按 token 算钱。但为什么现在全都免费了?第一个底层逻辑是,成本被规模彻底击穿了。当用户从几百万涨到几亿,当模型不断压缩、优化迭代,单次对话的成本已经低到可以忽略不计。 对大厂来说,让几亿人免费日常对话,这笔开销完全扛得住,甚至比打广告拉新还要便宜。第二个逻辑是,商业模型彻底换了赛道,你以为平台靠收你对话费赚钱? 根本不是面向普通人,免费是为了拿到最珍贵的东西。真实对话数据, ai 越用越聪明,数据越多越值钱,等模型足够强了,再去赚企业的钱。 api 调用、行业解决方案、私有化部署、政企项目,这些才是真正的利润来源。 用 c 端免费换数据,换生态,用 b 端服务赚利润,这才是现在所有 ai 的 通用玩法。第三个逻辑是,行业竞争已经白热化,今天你收费,明天用户就跑到别家免费平台去。 ai 不 再是高科技、奢侈品,而是像微信、抖音一样的基础工具, 谁能让用户零门槛、无负担、随手可用,谁就能占据用户的使用习惯和时间。免费已经不是福利, 是入场券。所以你看到的免费根本不是慈善,也不是套路,他是技术成熟、规模效应、商业逻辑、行业竞争,几件事叠加在一起的必然结果,不是某一家平台大方,而是整个行业都走到了这一步。 对我们普通人来说,这反而是最舒服的时代。不用算额度,不用看 token, 不 用纠结该不该问,不用为了省钱省着用。 工作需要写材料,学习遇到难题,生活拿不定主意,随时开口就用。很多人还在担心,免费的是不是最贵的。其实在 ai 这个行业里,恰恰相反,能让你放心大胆免费使用的,才是真正有实力、有稳定商业模式的平台。 下一次再用 ai 的 时候,你就不用再疑惑为什么不用花钱了,这不是巧合,而是整个行业走到今天最合理也最必然的样子。

现在的 ai 越来越火, token 这个词也开始频繁的出现在大家的耳边,但很多人还不明白 token 到底是什么,为啥用它还要花钱呢?今天这条视频我就一次性讲清楚, 怎么把 ai 当成你的朋友,你发消息让他帮忙带饭,帮我买一份东北的锅包肉,多放醋,少放糖,再带一碗米饭。这句话会被 ai 拆成一个个叫 token 的 小任务,就像把你的需求写成一张张便利贴,朋友按章处理, 不会出错。可能很多人都会好奇,为什么 ai 要按照 token 来收费呢?因为 ai 的 研发和维护成本极高, 训练一个大模型要花几十亿,后续服务器转运、工程师优化还需要持续投钱。把服务拆成 token 计费,就像按便利贴数量收费,你用多少张就付多少钱,不用再为多余的东西买单。这种方式对用户和公司都公平, 用多少付多少,灵活又合理。说到这里,大家肯定又会问,那为什么平时我们用豆包千问这种文字聊天基本都是免费的,可生成图片和视频却要花那么多 talk 呢? 还是用代饭类比文本对话,就像让朋友帮你写个菜单,报个菜名,动动嘴就可以了。用的便利贴很少,但生成一张东北锅包肉的图片, 相当于让朋友直接进厨房开火放油、做菜摆盘,又动用整个厨房的锅碗瓢盆,麻烦多得很,消耗自然就大了。 生成视频就更夸张了,相当于让朋友连续做好多道菜,一道接着一道的,费时费力又费材料,成本差了成千上万倍,自然收费更高了。既然知道了 tock 是 怎么消耗的, 最后我就来教大家一个实用的小技巧,如何节省 token, 关键就是减少描述,比如带饭需求。不要说一大堆废话, 这会拆出超多便利贴,直接说买东北锅包肉,多醋少糖加米饭同样清晰,还能少用很多便利贴,花更少的钱办同样的事情。不过大家也不必刻意去扣字,毕竟咱们平时用的豆包、千玺这些平台,日常聊天都是免费的,完全不用心疼。

大哥最近老是刷到 tok 的 视频,那么 tok 到底是个啥玩意啊? tok 呢,其实就是 ai 处理人类语言的最基本单位。举个例子, 托肯就是 ai 世界里的小积木。咱们平时玩积木啊,不管是搭房子啊,搭汽车啊,得有一块一块的小积木,少一块都不行。 ai 干活也一样,他不认识完整的一句话,一段文字,只能把咱们说的话写的字拆成小小的积木块,那这个积木块就是托肯。 嗯,那么 top 跟 ai 算力有什么关系呢?呃,咱们还是用比喻把这个关系讲透。咱们把 ai 比作一个超级厨师,这个厨师的工作就是给咱们做回答,这道菜, 那 top 就是 厨师做菜的食材,不管是蔬菜啊,肉类啊,还是米和面,每样的食材就对应一个 top。 而算力就是厨师的厨房设备和干活的速度。比如说,你让厨师做一桌子菜 啊,食材给够了,但厨师只有一个人,一个小灶台,一把锅铲,厨师一个人忙前忙后,半天只做出一道菜,速度特别慢。但如果厨房有超级的灶台,全自动的厨具,还有好几个帮手,厨师就能很快处理食材, 就能很快做好一桌子的好菜。 token 呢?是 ai 的 食材,呃,算力是 ai 的 做饭能力,而 ai 是 厨师,三者缺一不可。没有 token, ai 没得可处理,没有算力, ai 处理的又慢又差。 有了足够的托管和算力, ai 才能高效的干活,帮咱们解决问题。怎么样?听完我这个比喻,呃,是不是就彻底明白了托管 ai 和算力的关系?下次再听到别人了解这个托管,就不会一脸懵逼了。