你有没有想过啊,当你在和 ai 聊天,让它帮你做 ppt、 工作总结,和老板斗智斗勇的时候, ai 是 靠什么干活的呢?它是怎么来理解你的呢?这背后啊,离不开一个叫 talkin 的 东西。有人说它就是 ai 时代的数字石油,也有人说它是下一代经济的基本单位。那它到底是啥? 别急,今天啊,咱们就一次性讲透 talkin 的 本质和未来。 talkin 中文名字叫词源,听着挺玄乎的,但其实说白了,它就是数字世界里的最小处理单元。你发给 ai 的 一句话, 一段代码、一张图片的描述, ai 其实根本看不懂完整的句子,它只会把这些内容拆成一个个小的碎片,也就是 talkin, 然后再去理解、计算、生成。如果把互联网比作物流体系, 数据是五花八门的货物,那 token 就是 标准化的数字集装箱。不管是文字、指令、代码还是逻辑,全都打包成统一规格的 token, 方便计算、传输、计费和交易。没有 token, ai 就 没法高效运转, 就像没有集装箱,全球贸易很难规模化。而它呢,有三个最关键的特点,可计量、可定价、可交易。这三个属性啊,直接决定了 talkin 不 只是一个技术单位,更是一种数字经济单位。你用 ai 服务花的钱,本质上是在为 talkin 付费 平台提供算力服务,赚的也是 talkin 的 钱。未来啊, talkin 会像流量、电量、算力一样,成为互联网和 ai 时代的硬通货。 你用 ai 写一篇工作报告,消耗几百 tok。 企业用大模型做服务、做风控、做智能决策,一天消耗几百万 tok。 智能体数字员工自动化、 ai 应用更是 tok 消耗大户。随着 ai 越来越智能,逻辑越来越复杂, talk 的 消耗量会呈现指数级增长。由此啊,诞生了一个全新的经济模式, talkin 经济。那 talkin 是 从哪里来的呢?当然不是从天上掉下来的,它需要算力、算法、数据共同支撑,数据中心、 gpu 集群、云计算平台本质都是在生成 talkin, 算力越强,生成的 talkin 的 效率越高, 成本越低,竞争力就越强。更重要的是, talkin 正在重塑能源与数字经济的关系,算力需要电力支撑,电力变成算力,算力变成 talkin, talkin 再变成数字服务。这意味着,绿电充足、电价稳定的地区将在 talkin 经济中占据天然优势,甚至形成新的区域经济格局。 以后的算力中心,不是逐水草而居,而是逐绿电而居。对国家和产业来说, tucker 更是大国科技竞争的关键赛道。谁掌握了更大规模的算力,谁就能提供更便宜、更高效的 tucker 服务,谁就能在 ai 时代拥有更强的话语权。 这背后啊,拼的是芯片,是能源,是基础设施,也是国家级的战略布局。而对我们用户来说呢, token 消耗量就是你使用 ai 服务的成本。下次再和 ai 闲聊的时候,可得好好斟酌下每句话消耗出的 token, 那 都是白花花的钱呐!
粉丝165.2万获赞1926.5万

想跟上 ai 时代,先得听懂 token 是 个啥?最近黄仁勋抛了个新概念,整个 ai 圈都炸了,啥概念呢? token 算力?工厂经济学?以后,因为达不只是卖芯片,还卖 token。 此话一出,全球芯片固执,直接颠覆。 为什么会这样呢?今天咱一次性把这事说个透,什么是 token? 因为达的优势在哪里?我们国家的优势在哪?普通人又该如何抓住红利?先说最简单的 toker, 它是 ai 的 一个单位,两颗苹果五百克,这是重量单位。一杯奶茶五百毫升,这是容量单位。一篇稿子五百 toker, 这就是 ai 算力的单位了。五百 toker 有 多大呢?举个简单的例子, 你问豆包老师,今天是星期几?六个汉字会被切割成三到六个 toker, 而你说的文字越多, toker 消耗也就越多, ai 的 工作量就越大,对应的就需要支付越多的费用。你说,哎, 平时我和 ai 聊天怎么不用花钱呢?很简单,现在行业还在抢用户、抢数据,等技术成熟了, token 就 会跟石油一样金贵。那 token 到底是怎么算出来的?分成三步, 第一步,你的指令被翻译成 token。 第二步,芯片收到输入的 token, 开始疯狂做题,一秒能计算几亿次。第三步,计算出新的 token, 被翻译成你看到的答案,明白了吗?第二个步骤,芯片计算就是 token 经济学的核心了。黄仁勋所说的 token 萨利工厂经济学核心概念就一个, 同样多的店,谁算出了更多的拓客,谁就多赚钱。用大白话讲,店价不变的情况下,一句瓦的店,普通方案一年产出九亿拓客啊,多了三十四倍,一年多赚一点五亿美元, 所以老黄才敢放话,到明年年底至少赚他一万亿美元。那易伟达凭啥这么牛呢?第一,他的芯片断档领先,哪怕咱的顶级芯片算的一半。第二,库大生态太猛了,全球四百多万开发者, 我们本土才几十万,要问开发者都有什么用?能产生飞轮效应呀?越多人用,模型越多,音质越好,生态就越强。这就是因为打恐怖的护城河了,就像一个巨大的摩天轮,根本停不下来。但你要说因为打无敌,那就有点被老黄带节奏喽。 所有假设都建立在一个前提下,电费一样,电量一样受到这发电,那可就是涨的主场了。美国的工业电价一度零点八到一点二元,我们呢,零点四八到零点六亿元,是他们的一半左右。更狠的是西部算力枢纽,也就是甘肃新疆宁夏这地方绿电的合约价格能低到每度 零点一三元,同样是烧一百万度电,我们花三十万,而美国要花一百二十万。怎么做到的?三个大国工程你一定得知道。一是东数西算,把东部的算力需求调度到西部绿电负极区,八大算力枢纽集中了全国百分之六十以上的新增算力,二十特高压电网, 四十六条超级输电线路,把西部的风电光伏水电高效送到数据中心,损耗才百分之三到百分之四,全球最稳。第三,算电协调,也就是算力跟着电力走。怎么跟呢?电多的地方多建算力中心,电少的地方算力就少跑一点, 通过空间布局,时间调度,让电力更便宜,算力更稳定,算电协调有多重要呢?二零幺六政府工作报告首次将它纳入了国家级新基建工程。而且很多人不知道的是, toon 出海,我们已经占了全球的百分之六十一,前五的大模型里,中国占了四席,而且中国百万 toon 零点三到零点五美元是美国的十分之一。说到底, toon 拼的不只是芯片, 还有电,还有统计效率。我们的优势是绿电加稳定,特高压加东数西算加算电协同,全方位碾压,这就是我们无可替代的底牌啊!最后咱说说普通人能做点啥?给你三个实打实的方向。一、轻资产的闲置,算力共享。把家里的高性能电脑接入正规分布式算力平台, 空闲时借小规模训练,普通显卡月入五百左右,高端显卡能到一千加二、当算力时代的水电工,你可以去考个电工证,要知道东数西算八大枢纽未来大量招人,现在很多地方已经开始技能培训补贴了, 有资源的朋友可以在三四线城市对接本地企业或高校的算力需求,提供算力租赁、数据处理。于武汉,就对算力服务的小微企业提供房租补贴、贷款贴息等。想搞算力服务的话,现在还是蓝海时期哦。总结一下, tock 是 算力的基本单位,而 tock 经济学就是运用电力算力效率来定价格,算成本,赚利润。别看黄人勋最近把 tock 经济学吹得天花乱坠,其实咱依靠强大的电力系统,早就低调拿下了全球过半的市场。未来掌握在谁的手里?答案已经很清晰了吧,再见!

哈喽,各位小伙伴们,我们又见面了,现在不管是刷新闻还是聊行业,算力两个字已经刷屏,很多人呢听的是一头雾水,这东西到底是什么呢?跟我现在做的事情 有什么关系?今天一条视频讲透,让你看懂这波 ai 风口到底怎么变成实实在在的收益。算力简单说就是数据处理、网络传输、信息存储的一个综合能力,数字时代最核心的生产率,你刷短视频 精准推荐内容,开车导航、实时算路线,手机拍照、智能美颜、 ai 对 话秒回答,那么甚至自动驾驶的安全运行背后,全都是算力在支撑, 算力也分三六九等,那基础算力呢?满足的是我们日常刷视频、办公、上网这些基础需求。智能算力呢,专门给到 ai 大 国型训练推理使用, 每秒呢预算是万亿级的一个起步,那么还有超算算力,又在天气预报、航天研发、高精尖这样的一个科研这些关键领域行业里,用 flopos 来衡量算力强弱,从百万次、十亿次到万亿次级别,这样的一个越来越高,价值就 越来越大。那么曾经科幻片里的超级算力,现在一张高端显卡就能实现,那么我国的超算呢,更是领跑全球, 截止二零二五年呢,中国的智能算力规模已经稳居世界前列,那么算力就是数字时代的能源,就像当年的电力一样,无处不在,缺一不可。 未来智能设备的爆发, ai 全面普及,算力需求只会一路暴涨,算力缺口呢,也会越来越大。有任何相关问题呢?欢迎评论区留言交流!

今年 ai 很 火,算力也很火,那么算力它到底能干什么呢?以我们这里提供的一个算力硬件为例啊,比如说这个是 a 一 百,这个是 h 两百, 那么 h 两百它的参数是怎么样呢?这个单卡是一百四十一 g 的 选存,八张卡呢,就是一千一百二十八 g 的 选存,总 体的算力在 f p 八情况下能够达到三十二 p, 什么意思呢?也就是它一秒钟能够执行三点二亿亿次的浮点预算。那么它在运行大模型的时候,比如说我们拿它来测试 deepsea, 六百七十一币,基本上每秒钟能够生产五千个 token, 像三体这种小说,它基本上一分钟就可以写出一本了。

你们知道吗,中国现在已经找到一种很特别的出口方式,它不出口一度电,也不运一块芯片,但全世界可能都在为中国的电买单。听起来有点玄华,但它有个很洋气的名字, 叫 tokun 出海。这个是现在爱炫的热词,不管在哪里,你总能听到 tokun, tokun? tokun? 那 tokun 是 什么啊? tokun 出海又是什么?它跟电什么关系?给我一分钟,我画给你看, 我们先把主角请出来啊! token, 中文名词源,虽然名字听着挺高冷,但是呢,很简单,你可以把它理解成 ai 世界里的计量单位。就像电是按度算的,奶茶按杯算,那 ai 呢?就按 token 算, 你跟 ai 说一句话,他回你一句,或者帮你写点东西,做点图,都在消耗 token, 就 像你手机的流量包一样,用完就得花钱买。那问题来了,这个 token 是 从哪来的呢? 它不是凭空冒出来的,它是算出来的。靠什么算呢?靠算力?算力靠什么产生呢?靠芯片?芯片靠什么跑呢? 靠电。所以你别看你跟 i i 聊半天,表面上只是几个字,几个 token, 但往底下一扒,其实是电带着芯片在狠狠干活。你可以理解为电是原料,芯片产出的算力是加工, token 是 成品。那现在 i 圈最火的 token 出海是啥意思呢?你看啊, 以前出口呢,我卖的是衣服,手机、冰箱,装存就走。但 i 时代不一样啊,咱不能把电装存,运出去,太麻烦了,也不划算。所以呢,现在咱玩的是升级版,先把咱们国内很便宜的电,通过我们的国产芯片 啊,变成算力,再把算力变成 token, 最后呢,鼠标一点就卖到国外。比如一个日本人在用中国的 ai 聊天作图 代码,表面上它是在用这些功能,但实际上它是在为背后的 token 买单。而这些 token 本质上呢,都是中国这边用电和算力给做出来。所以 token 出海,说白了就是咱们不直接卖电,而是把电加工一下再卖出去。 所以讲到最后啊, token 出海这件事,中国最大优势其实在底层,电够便宜,够稳定,规模够大,算力才能铺得开, 服务才有成本,优势才可能迈向全球。但光有电呢?还不够电,只是原料,中间还需要一整套的加工能力,把电变成真正能用的智能。而在这套能力里,最核心的一环就是芯片。所以你会发现,讲透肯讲算力,讲出海,最后还是会回到一个点,国产芯片。因为芯片不只是个零件, 它更像一个生产机器,决定了你能不能把店变成算力,再把算力变成可以卖出去的智能服务。而所谓的托管出海,表面是在卖 ai 服务,本质上是把能源、算力和技术重新组织成一种新的出口形态。以上就是托管出海的故事,你们记住了吗?关注我,期待下个故事!

分享了很多期关于 oppo 可乐的,我们今天来说一个热点词汇啊, token, 我 们来看一下什么是 token? token 其实最早的理解就是词源啊,其实按照我们中文来说就是最小的语义单元,其实它就是一个词组,我想我想去北京啊,这就可以变成三个, 这是三个偷看啊,这就是偷看的最早的定义。那么偷看是怎么产生的?只要我们跟大模型进行交互,不管是输入和输出,它都会产生偷看。那么最近为什么大家会疯狂的在说偷看的词语呢?因为偷看已经发生了本质上的变化,现在的偷看等于等于模型能力加 算力综合投入,其实它是 ai 时代的计价与结算单元,也其实是 ai 时代的通用货。模型能力是指的什么呢?就是算法体系啊,回答的精准度啊,那算力的综合投入呢?包括了我们常见的基建了,机房了,贷款了,包括芯片里边 gpu, tpu, 包括 所指的电力啊,这些都是算力的综合投入,其实抽根等于模型能力加算力的综合投入。我们来 呃看一下目前 tok 的 这个提供商呢?都有哪些呢?一种是模型原厂,咱们也可以叫它原声 tok, 再来就是算力厂商或算力集成商,那么模型的原厂呢?有哪些厂家呢?就大家耳熟能详的,比如说 gopro, gpt 啊, 吉米尼啊,可沃达等等,这些模型厂家产出的模型呢,相对来说质量是比较高的,当然也包括我们国内的天安门,豆包,他们相对来说因为一直在对模型不停的进行升级、优化和训练,那么他回答的这个精准度啊,包括质量都是非常高的。 还有一种就是算力厂商和算力集成商,那么比如说我们现在知道的像亚马逊,阿里啊,华为啊,英伟达这些都属于算力厂商,因为他们直接生产的是芯片啊。还有一些就是算力集成商,比如说我们知道的国内的浪潮啊,或三大运营商,因为他们本本质上他们不生产芯片, 他们是将所有的这个算力做成集权,那么他们是将所有的这个算力做成集权,那么他们是将所有的算力千万的 太原的各个版本的模型,那么他们主打的是什么呢?性价比,尤其是这个算力集成商,因为他们自己本身不生产模型,也不生产芯片啊,他们只是把这些算力齐全在一起,那么他们输出的就是这种透肯呢,可能从质量上 并没有原生模型的透肯的质量高,但是相对来说就比较便宜啊。那么来看一下国家最近在鼓励的所谓的透肯出海啊。透肯出海是什么意思呢?就是因为 整个全世界目前在 ai 上投入的最大的两个国家,人工智能这块真正竞产生竞争的其实就是中美啊。那么为什么我们要通过出海呢?本质上约等于电力出海啊,为什么这么说呢?我们来看一下,其实我们国内的整个基础配套设施是比较发达的啊,也比较完善, 尤其是什么我们店里的价格非常低,因为我们大量的发展这个光伏发电和风力发展,所以呢我们整体的价格是比较低的,所以我们通过偷啃出海的方式呢? 其实也是店里出海,国内的模型跟国外的模型有没有差距?我们要客观的承认是存在差距的。但是 针对一般型的企业,国内的模型比如说像通一千,他其实已经可以满足大部分企业的日常使用,其实我们出海还是非常具备竞争力的。那么最后来看一下 hokken 竞赛,其实就是中美的竞赛,那么后期呢?可能美国呢?主要是以什么以模型能力为他的进化方向。那么我们国内呢?其实就是在酸利成本上我们不停的去 优化啊,还是有很大很大的优势,那么包括我们也在不停的去升级优化训练我们现有的模型, 后期的主要竞争就是这两块。呃,最近不管是各大厂商也也罢,还是厂家也罢,都在说 top, 包括黄仁勋近一次的发布会也在说到 top 就是 未来时代的结算货币。今天我的分享就结束。

最近有个概念非常火,叫 top 出海。 top 是 什么呢?我们国家刚刚对这个英文单词进行了一个权威命名,叫词源,就是文本切分的最小语义单元, 也是模型计费的最小的单位。正因如此呢,滔氓就成了算力核心的计量和计费的水准。简单来说,就跟我们说起钱一样,这个源他不是财富,是财富单位。所以说这个滔氓出海本质上就是算力出口。 与人类历史上的历史工业革命一样,对外的发展需要两种设施,一种是技术层面的,一种是能源层面的, 就跟汽车跟石油一样,或者说电子产品跟电力一样,他们之间是一种相互依存又相辅相成的关系。 ai 的 竞争,从国家层面上来看,归根结底 主要是中美两国的竞争。中国在技术设施层面跟美国相比略有差距,但差距不大。但是在能源设施层面,中国具有先天的优势。中国的电力资源比较丰富,跟美国比起来电价比较低。 当电力转化为算力之后,托管出海就变成了一门利润非常丰厚的生意。一些具有前瞻眼光的公司,比如昆仑、万维和字节等,就从这方面赚了大钱。 但是我们中国公司呢,比较爱卷,未来他们会不会把托管出海卷成一门微利甚至负利的生意?不是没有这种可能性,当然这是题外之话。 我们说回到 ai 竞争,任何产业的竞争无外乎是技术创新和应用创新。我们中国公司的优势在于应用创新,当然在技术创新方面,我们的脚步也追了上来。同时在基础设施方面,我们又具有先天的能源优势, 所以中国 ai 产业的前景是非常值得期待的。唯一值得警惕的就是 ai 轮流问题。

来聊聊 ai token 的 中文定义,词源以及最近火热的 token 出海,也就是词源出海。 很简单,词源也就是 token, 它的单位是电力驱动下的 ai 算力的计价单位。 而一个托肯或者一个词源等于零点七个到一个的英文单词或者标点符号, 就是如此简单而火热的资源出海。托肯出海,全世界都在调用我们价格低廉的 资源,因为我们电力平易,我们 ai 大 模型所生产的托肯价格低廉,就是如此简单。大聪明们明白了没有?好了,拜拜。

你看过吗? token 正在悄悄改变人类的财富格局。这可不是科幻。黄仁勋最近举例说,他发现一个年薪五十万美金的手下,一年只花五千刀买 token, 他 会恐慌死。为啥? 因为他不关心你加班多久,只在乎你是不是让 ai 算力像流水一样哗哗烧。但我们天天用 ai 工具,像豆包、 dipstick, 咋没感觉 token 的 存在?简单说, token 就是 ai 工作的计量单位,和你手机的流量包。十年前看视频烧流量有价码,但现在, ai 的 每个问题、每个回答、思考过程,都在默默消耗 token。 普通问题提问少,你忽略了,但当你开专家模式或让 ai 搞研究做 ppt, 它就得拉群写作,消耗飙升一百万 tokin, 机票 app 直接弹窗让你掏钱,费用不费。说白了,买 tokin 就是 买提问权,买 ai 的 深度智慧现在更萌,硅谷流行 tokin max 比赛,比谁消费多?有人一周刷两千一百亿 tokin 够填满为几百颗三十三遍。有的工程师 ai 写代码,月账单十五万美金, shopechat 这些公司都把 token 用量写进绩效奖励,用 ai 的 淘汰不用者,全球巨头正在把它当作第四薪酬。为啥 token 成了新生产资料?会不会是划分阶级的最后机会?二零二四年,中国日均消耗一千亿 token, 三个月就冲到一百四十万亿, 两年涨一千多倍,技术变更史无前例。黄仁勋的英伟达已经转型,芯片、服务器全瞄准造 toc 工厂,目标是把 toc 标准化生产,像水电一下量价,结果 ai 杀入实体经济,沃尔玛、丰田等巨头都用它驱动自动驾驶医疗机器人。一百一十款工具在 gtc 大 会上亮相,但警惕 ai 接管物理动作时, token 消耗指数增长,顶级算力变稀缺品,到时候工作会不会更卷?贫富差距艰难撼动,脑力价值可能更加的崩塌?你准备好当 token 的 主人还是燃料?关注我,一起解码 ai 未来!

今天我来想给大家讲一下到底是什么?什么是 token? 其实 token 特别好懂,它就像 ai 世界的游戏币。最近我看你们也被黄仁勋的这个 gtc 的 大会刷屏,他有讲七十多次 token, 那 我就想给大家去分享一下 token 这个到底是一个什么东西。我们用一个最简单的例子来 举例,大家都去玩过电玩城,你去电玩城里,你是不是先要把现金换成游戏币,然后才能去玩一些项目,不管是娃娃机啊,赛车,它就是消耗,比如说三个币或者五个币,而这里 token 它在这个 ai 世界就是相当于你这个游戏币。 我们在日常生活中,你让 ai 帮你写文案,改代码,或者是分析财报,或者是日常,你就用豆包 dipic, 你 给他提些问题,他给你一些答案,他都是在消耗这些 token, 消耗算力,所以这里的 token 就是 计量这份智力的最小单位。 以前我们在 ai 智能时代,我们是要用水、用电或者是用流量,那现在我们渐渐走入了 ai 的 这个时代,我们就要开始消耗算力的最小单元 token。 那 很多人都说我们在用豆包的时候, deep sec 并没有花钱,那是因为我们在免费的用这些聊天的窗口,由这些大企业去承担了这个成本。但是我们真正的企业在用 ai 的 时候,他走的都是 api 接口,所以说 企业在使用算力的时候都是在烧都 token, 每一分都是真金白银。大家有理解, token 它并不是一个玄学,而是我们 ai 时代真正的一个新的度量衡。

今天给大家重点介绍一下 a、 i、 d、 c 云服务、算力租赁。很多人对这三个概念特别容易混淆, 它们到底是什么关系?包括算力和 token 是 什么意思好? 第一, a、 i、 d、 c 简单说就是专门给 ai 干活的超级机房,里面全是服务器,显卡供电散热,它就是个场子,是 ai 的 硬件底座,没有它,算力根本跑不出来。 第二,云服务,这是个大平台,就像一个综合大商场,阿里云、腾讯云都属于这个, 他啥都能租,服务器、存储宽带软件,算力只是他里边的一项业务,平台最大最全,但弹性最分散。第三,算力租赁,这就是专门租显卡, 租计算能力, ai 要跑,要生成内容全靠他,他就是平台里最赚钱最硬核的单品。总结一下, a、 i、 b、 c 是 平台,算力租赁是平台里的一项核心业务, 大小关系很清楚,平台最大,场子次之,算力租赁是最直接赚钱的业务。再给大家分清一个容易搞混淆的点,算力和 token 根本不是一个东西,算力是 ai 的 力气,发动机就是显卡的计算能力 越足,跑得越快。 token 是 ai 生成内容的计量单位,你问一句话, ai 回一段话都在消耗 token。 它们的关系就是一句话,算力不够, token 就 缺 token, 越缺算力越值钱。 现在 ai 领域的最缺什么?不是模型,不是应用,最缺的就是算力,放到投资上,逻辑也特别简单, tucker 越紧张越立好上游。算力 想弹性大,爆发力强,看算力租赁想稳,想长期看 ai, dc 想安全大而全看云平台。一句话记住, ai 缺算力, 算力看租赁,底座看 a i d c token 只是结果,算力才是核心。那你心中的算力租赁之王是哪家公司呢?点个关注评论区聊一聊。

用大白话聊聊 ai 算力中的 talking 到底是什么? talking 作为 ai 算力中唯一且只有的 ai 服务型的计价单位而存在,而 talking 的 产生是电力加算力 产生的计价单位,比较绕,你就可以理解,直接理解为计价单位就 ok 了,因为电力产生算力,然后作为计价单位。而一个托肯 是等于一个汉字,一个汉字等于一个托肯,而一个英文单词等于零点七五到一点三托肯。而托肯的价格 水跟着当地的电力有关,按照十万级百万级作为一个统一的计价单位,多少钱,百万级多少钱,几十块或者十几块, 按照这样去计算的。这里大聪明肯定就懂我们电力充足,所以说我们的算力便宜。 talk 便宜。对对对,就这个意思。现在流行的 ai 欧本卡小龙虾为什么能养?因为我们的蒜粒便宜。还有一点 叫境外调用我们的蒜粒便宜,自然而然全世界都可以从我们调取蒜粒 大模型中的算力。明白了没有?因为未来我们的生活与 ai 将密不可分,随机应运而生的就是 托肯的成本以及以及托肯的价值。当然是越便宜越好了, 否则的话怎么消耗得起啊。有些人想养小龙虾,一天只花了二十块钱, 但是有些人一个一一天要花两三百块钱,那就用途不一样。再说说最火的 ai 漫剧与托克是密不可分的,因为牵涉到算力图片生成,视频生成一个 十秒或者十五秒的短视频消耗的托克是以十万计计的, 或者百万机器看啊,应用场景不懂,这里面就牵涉到成本的控制。再说海外了,回来 ai 算力的竞争就是托肯价值的竞争,谁便宜 流量朝谁走,底层逻辑电力。说到这里肯定有人就明白了。评论区聊好了,本期话题就到这里,喜欢点个评论点个赞,赞点点个关注,咱下期见。拜拜了你。

很多人一听到 token, 第一反应是,这又是啥技术术语?即使把思维转个弯, token 就是 ai 世界的计算单位, 或者更直白点说,它是你购买 ai 智能的货币。你想想看,以前我们用电是按度来算的,现在你用 ai 就是 按 token 来算的。你输入的每一个字, ai 回复的每一句话,本质上都是在调用算力,而算力就是钱。所以 token 就是 ai 服务的计价器。但更深层的逻辑在于, token 的 消耗速度决定了 ai 应用的 级速度。现在的阶段,就像当年四 g 刚出来,流量还很贵的时候,大家都不敢随便刷视频,因为心疼流量费。现在大家用 ai 也是小心翼翼,生怕对话太长,烧的太多 token。 但历史的规律是什么?技术越发展,单位成本就越低,就像现在流量几乎免费一样,未来 token 也会变得极其廉价。到那时候真正爆发的是什么?不是卖流量的,而是那些能帮你省 token, 或者是能用 token 创造更大价值的应用。所以,理解 token 就是 理解 ai 商业化的第一步,谁能让 token 花的最值,谁就是赢家。

大家晚上好啊,昨天我发视频聊了那个 token 啊,就是那个词源啊,嗯,说了一些,就是它的大概意思和概念啊,然后今天有朋友问我啊, token 到底具体是什么东西啊?昨天说的不够细啊,它 不太理解,我今天再用大白话说一遍,其实 talk 你 可以这么理解,就是不管你用豆包啊,文心一言或者说是 deepsea 啊这种软件啊,呃, ai 大 模型啊,就是你问他一个问题,就比如说去苏州旅游啊,哪里比较好玩啊,然后你的这句话就会被 ai 上传到算力中心啊,拆分成一个个的 talk 啊,就是词源啊, 就是比如苏州旅游啊,然后去哪里玩啊,好玩啊这类单元啊,然后 ai 就 会靠这些 token 去理解你的问题啊,然后再从数据库啊,然后一些公开的网页啊,去抓取那些信息 啊,然后后台的算力会生成大量的 token, 去整理整合内容啊,最后把答案返回给你啊,然后,然后最后如果说你觉得这些答案还不够精细,精细精准啊,然后就会你可以再给他一些更精细的提示词啊,就比如说苏州哪里园林比较值得去啊,然后 ai 就 会更精准的搜索计算生成,再给你结果, 然后整个过程里面啊,这些被拆分计算生成的那个语言的单元啊,其实就是 token, 也就是大家说的词源啊, 然后那普通人怎么去利用这个偷卡啊?靠, ai 这个趋势是赚钱啊,我觉得主要是两个方向,就我自己认为的啊,一个是布局相关的赛道,优质公司的股票啊,然后尤其是做算力大模型、 ai 基础设施的这些企业啊,第二就是抓住这些新兴的就业机会啊,岗位啊,就比如说 it 啊,算法工程师啊,提示 指示词工程师啊之类啊,都是 ai 时代的新机会啊。同时 ai 也会带来一些职场的变化,甚至会淘汰一批人啊,就比如说很多企业的一些忠诚管理啊, 原来的核心工作呢,就是对接基层啊,汇总信息,向上汇报啊,但现在基层呢,就是可以直接把这数据啊丢给 ai 啊,然后 ai 呢就自动整理分析,然后生成一些就是更加精准的报表啊,高层的话就直接可以看到结果,就这么一来的话,就很多中层的管理岗位的价值啊,就会被大幅的削入, 未来呢就很有可能会面临这些淘汰的风险啊。这个呢,就是我对这个偷看啊,资源啊,呃, ai 啊,就是这些 接下来可能会带来变化的理解,然后后面想到再想到什么东西我再说吧。嗯,现在我我自己个人想到的可能还是比较比较浅的,我觉得后面发生的改变还是非常大的,会有很多东西,真的会有很多东西,得慢慢来。

token 经济火了,嘿,为了给他一个叫做词源的中文一名,国家层面还要特意宣告一下,比如全国科学技术名词审定委会今年三月敲定的这个翻译后啊,发了个公告。你可能不明白,为什么这么一个词语翻译一下还要广而告之,还这么多人追捧啊。 比如说英伟达 gtc 大 会上, talk 这个词语,黄仁勋讲了五十次,把 talk 定义为 ai 时代的新大宗商品。阿里呢,最近还成立了一个叫做 talkhop 事业群,由 ceo 亲自挂帅。这还挺有意思的,不管是 talk 还是词源,听起来就像是一个学术词汇和技术词汇,怎么就成了一个到处都在说的词语呢? 而且看着势头还不小,现在连我爸都跑过来问我,耶,这个 toc 是 啥意思啊?没关系啊,你很快就会懂了,因为这个词语心情呢,离不开大家的 ai 焦虑。不过这一期呢,我们不会去讲这个过多的技术定义啊,就从经济角度把这个事给你说明白了。 toc 是 什么,背后包裹着怎样的商业真相,以及未来会怎么样。其实这个词啊,也不是什么新鲜的词,它现在被翻译为词源, 我就想先感慨一下,世上还真是一个轮回。这个词上世纪五六十年代就出现了,那会也是一个经常被人们提到的词语。当时程序员写代码,计算机看不懂,得先把代码切成一节,一节他认识的最小单元,这个方法就叫做词法分析, 而这切出来的每一节就是 talk。 比如一句简单的中文编程语句,整数假等于一,就会被切成整数假等于 一分号这五个 token, 所以 在那个时候, token 就是 词法单元。在这之后,随着计算机技术发展的不同潮流, token 的 含义又经历了网络安全时代的身份令牌、区块链时代的通证等各种中文翻译。 今天呢,又回到了起点,因为 ai 成为时代趋势, token 直接被文艺复兴,又回到了词法单元的本意。当 ai 大 模型处理文本,它也需要把句子切成一小块,然后每一小块呢就是一个 token, 比如说 unbelievable 会被切成 unbelieve, abou 三个 token。 另外呢,我们要注意,在和 ai 对 话的过程中啊,无论是我们把问题发给 ai, 让 ai 去理解问题,还是让 ai 回答我们的问题, ai 都需要用托管来消耗计算。这就好比我们上网消耗流量,现在你用 ai 啊,就要消耗这个托管。 不过这里有一点不一样,流量只计算你看了多少数据,而托管计算的是 ai 想了多少,算了多少。但是大部分人今天对这个托管消耗是无感的,你知道是为什么吗?哦,因为现在大部分模型是免费或者采取订阅模式的, 也许哪天就都要收费了,大家就能感受到花 token 这件事,和流量啊,是一个意思。哎,说到这里,我还要澄清一点,很多人以为消耗算力和消耗 token 是 一个意思,其实差别还挺大的。那消耗算力呢,是笼统的描述了我们消耗多少计算资源,就像是我们开车消耗了多少发动机的能力, 而消耗 token 就 好比我们开车跑了这么多路,烧了多少升油啊。因此, token 的 出现是把模糊的算类消耗变成了标准化的用量计价,相当于 ai 时代的计量单位。深刻说到这,你有没有想把钱包存紧一点的冲动呢?这 ai 消耗的计量单位都确定了,离收费还远吗? 那我们就来看看这个账单啊。首先呢,你还是得知道这个账单可以被拉出来的时候呢,就代表 token 经济啊,一点都不远了。 说到这里呢,我顺便就想提一下现在大火的这个龙虾, openclaw, 正是这只龙虾啊,让大家突然意识到, tucker 原来是如此的昂贵啊。 openclaw 是 一个开源的 ai agent 的 框架,因为 logo 是 一只红龙虾,大家就把这个装机和使用行为称为养龙虾。这个龙虾可不是简单的聊天工具人,而是一个真正的数字流氓。 猎豹 ceo 傅盛说自己骨折期间用龙虾自主发推文,产出一条百万阅读的爆款,一下子就点燃了全网养龙虾的热情,可以说是趋之若鹜。结果好家伙,在这股龙虾热潮下,大家发现了一个问题,龙虾烧头啃的速度简直离谱。 我们平时用豆包查了 gpt 这些 ai chat bot, 聊个天一个来回也就几百 token, 但这养的龙虾为了完成一个工作任务,动不动就是几百万 token 起步, token 消耗指数级上涨。 我身边有朋友算了一下,一个月 token 消耗就花了一万多块,这到底是为什么呢?那首先是因为各大 ai 大 模型的 token 收费本身就不一样,国内厂商呢,输入价格大概在三毛钱到四块钱每百万, token, 输出价格呢,六毛到十六块钱每百万 token, 那 国外模型平均就是要比国内贵个四倍五倍。也就是说,如果你的龙虾调用国外模型更多,那恭喜了,账单上这个数字啊,不免就是大一点点。 其次是因为 ai agent 的 任务消耗量大,和简单的对话不是一个量级。我举个例子啊,你给一个指令, ai agent 像一个员工一样,得自己拆解任务,规划步骤,调用工具,检查结果,甚至试错重试,每一步都需要消耗 token。 之前很火的 agent minus 就 提到,处理一个典型任务平均要调用约五十次工具, i sir pick 也说 agent 经常要对话几百轮。更可怕的是,像龙虾这类框架还有一个心跳机制, 每隔十五分钟到三十分钟自动唤醒一次检查代办同步状态,每次唤醒都是一次完整的 a p i 调用,就算你啥也没干,也在消耗头坑。还有顺便分享一下网上流行那副对联内容啊, 上联是收费安装小龙虾,下联是收费卸载小龙虾,横批是自讨苦吃。哎,真的很贴合大部分人追风人的心态,包括我自己也是。 调侃归调侃,还是有很多老板们买账呢,比如说前面的富顺,还有我接触到的一些创业者啊,他们就非常的热衷,从他们的角度出发,比起招几个员工月月发工资,还存在着沟通不畅的问题。那你去搞几个 ai agent, 只是烧点托管费用,老板们觉得这还是很有性价比的。 所以说啊,这个龙虾确实就是加速了用户对 ai agent 的 付费意愿。大家从过去不愿意给聊天的 ai chatbot 付费,到现在开始愿意给能代理干活的 ai agent 买单了,黄仁勋最近在发布会上说,公司百分之一百的员工都在使用 cloud code, codex 和 coso 这些 ai agent。 那 中国市场也是全球 tucker 消耗增长最快的市场,二零二四年初,中国日军 tucker 掉油量约为一百万亿,今年三月已经突破了一百四十万亿, 两年增长超千倍。你看看这增长速度,如果把中国二零幺五年这一年的头肯钓用量按照付费计算,你猜猜是多少钱? 根据公开数据计算,市场价值一年约在四百多亿元至二十多万亿元人民币之间。哎,这个测算出来的这个区间跨度有点大,主要是因为国内厂商的钓用单价差距太大了。那么如此惊人的数字,是不是有一批公司得乐开花了呀? 那你们猜猜又都有谁呢?其实就是最近大家常说的 token 产业链上的各个玩家,从最上游的芯片和能源,到中游的云厂商,再到中下游的大模型公司。那先说说最上游的,其中就有这个英伟达,他们的 ceo 黄仁勋在 gtc 发布会上花了一大半的时间都在讲这个 token, 他 还整出了 token 经济学、 token 定价体系等等的这一大堆的概念啊,不拉不拉,整个演讲内容呢非常的长,那我就总结了几条最精华的观点,和大家一起回顾一下。 那核心呢,就主要是两个部分,第一部分是对 ai 未来趋势的判断,他认为 token 消耗要大爆炸,因为 ai 已经跨越了一个关键的拐点,从训练全面转向推理,过去两年,全球 ai 算力需求增长了一百万倍, 推理所需的计算量可能是训练的数万倍甚至数十万倍,反映到他们的业务预期上。他给的数字也很惊人,到二零二七年, blackwell 和 ruby 这两个核心 ai 芯片架构订单收入就将突破一万亿美元。 这是个什么概念啊?相当于英伟达当前年收入的近五倍。哎!不过提醒一下,英伟达这波操作啊,不排除有 peo 下游的这个成分,因为大家用偷个月多,也就意味着云厂商和大模型公司就得多买他家的芯片。哎,这个呢,咱们得心里有数啊。 第二部分就更有意思了,咱们要上一点思维的高度了。黄仁勋讲的不是技术,而是一套全新的生产力分配和价值衡量逻辑。比如他说,未来企业聘用员工, 有一半的成本可能是要给这个员工购买 token, 员工就用这些 token 啊,去选择好的模型和 agent 来产出。更炸裂的是,他还提出了一个 token 经济学模型,把 token 分 为五层, token 的 质量就决定了这个员工输出的质量,只有厉害的人才配用最贵的 token。 哎,这是不是意味着,以后看我们普通打工人混的好不好,就看有没有用这个高速托肯套餐了。上游呢?还有一类玩家,电力这些能源公司相对人就好理解一些,因为 ai 工厂本质上就是用电来换托肯。这也引出了最近很火的一个概念,托肯出海。 什么意思呢?就是海外开发者通过 api 调用中国大模型,按托肯来付费。虽然算力可能跑在海外服务器上,但模型是中国产的, 钱是付给中国公司的。小龙虾最火的那一周啊,中国大模型以四点一二万亿 token 掉油量首次超过美国,在全球 top 五的模型中,中国独占四席。前面我们说了,海外 token 会比国内贵个好几倍,所以中国 token 呢,就通过大模型这样的方式啊,出海了, 惊不惊喜?意不意外?扯远了一点,我们再往下说,还有谁会开心中有算力服务商啊,云厂商呢,得算一个。最近阿里云、百度智能云、腾讯云三家集体大涨价,最高涨了百分之三十。这边对企业的云服务涨价,另一边却给养龙虾的用户免费送托,肯吸引他们用自家的模型。 看起来有点矛盾,但意图呢,非常的清晰,他们更看重的是抢占 ai 应用生态的这个入口。对企业涨价呢,是因为算力啊,确实供不应求了,企业客户迁移成本高,他涨价也会用, 但面对未来这个庞大的 c 端流量,那谁先圈住啊,就等于锁定了未来的 top 消费习惯。最后就是中下游的大模型公司,比如质朴,今年已经涨了百分之二十。哎,我们知道 ai 大 模型厂商是非常烧钱的, 就拿欧本 ai 来说,前前后后融资超过了一千二百二十亿美元,但去年上半年亏损就达到了一百三十五亿美元。而他们尝试的订阅付费模式,目前也只有不到百分之十的用户在买单。现在 ai 政策一爆发,他们作为底层的卖水人,未来的商业化预计会提速。最后简单聊两句, token 这个事儿跟咱们普通人有啥关系?那第一呢, token 这个计量单位,一定下来, ai 收费大概率就会提速啊。但换个角度想啊,他敢收费,就说明 ai 真的 能帮人干活了,不然谁会去买单呢?那第二呢,就是以后用好了 token, 可能会成为一种新的竞争力啊。 同样一个任务,有人花几千个分期就能搞定啊,有人要烧个几百万,效率呢是天差地别。说不定哪天面试,别人会问你,你平常用 ai token 效率怎么样?未来你的手机套餐里啊,除了流量包、通话包,可能还会多个 token 包。而你能不能用上这个高速 token, 可能真的会决定你干活快不快,值不值钱。 好了,这期关于 token 经济的客服呢,就到这里,关注伦巴蒂宝姐,带你读懂新资产背后的财富逻辑。

token, 大家都觉得这是个挺高级的技术名词,甚至还有人以为是搞区块链炒币的那个代币。你如果没搞懂 token 的 底层逻辑,你就根本看不懂现在这帮 ai 大 厂到底在赚什么钱。你在对话框里跟 ai 说的每一句话,它不是按一个字一个词去理解的。 为什么?这逻辑很简单,你要是按整词去算,中英文词汇量,几百万模型脑容量根本装不下,遇到个生僻词直接就蒙了。你要是按单个字猜,那完全就是碎片,没有上下文逻辑,他根本学不会。所以行业里是怎么干的?他把高频出现的连续字固定的词根打包成一个小块, 这个最小的处理单位就叫 token, 中文差不多一个汉字对应一到两个 token。 这样做既把词汇表压缩了,又保住了句子的核心意思。它其实是 ai 时代的核心消耗品, 是整个 ai 行业的底层硬通货。大家回想一下历史,第一次工业革命,机器转起来靠什么烧煤?第二次垫起革命,全世界的命脉是什么? 是电?再往后,全球经济为了抢油田甚至能打仗,对不对?现在这个 ai 时代,所有大模型跑起来烧的全是 tok? 你 觉得你是在用 ai 写剧本划分境?你觉得大厂在搞毫秒级的金融交易?无人驾驶?拨开表面看本质,每一次点击背后全是在疯狂地烧 tok。 你顺着这个思路去盘整条 ai 产业链,最底层的电力是基础能源,英伟达卖的那些天价 gpu, 其实就是生产 tok 的 发电机,那些云厂商和大模型公司,本质上就是 tok 制造工厂和批发商,而最终我们用的各种 ai 软件全都是消耗终端。整个行业的商业逻辑 掰开了,揉碎了,其实就八个字,生产 token, 售卖 token。 未来 token 的 价格绝对会像今天的电价水价一样,成为整个社会最核心的经济指标。 谁能把生产 token 的 成本给打下来,谁就掐住了所有行业的脖子,掌握了真正的定价权。你平时用 ai 的 时候关注过 token 消耗吗?评论区聊聊。

toker 是 ai 的 零钱,那为什么现在大家都把它称为 ai 时代的基础货币呢?核心在于一个人,英伟达 ceo 黄仁勋,他在最近的 gtc 大 会上放了狠话, 未来的计算机唯一任务就是生成 token。 为什么这么重要?因为 ai 变了。以前的电脑是帮你找答案,就像翻书,只需要找对位置,不用费脑子。但现在的 ai 是 自己想答案,他要一步步推理自我纠错,这个过程每一秒都在疯狂消耗 token。 你可以这么理解, token 越多, ai 就 越聪明,思考的越全面。现在的 ai 智能体,比如那个像全能实习生一样的 openclop, 一 天就要烧掉几千万个 token。 这种指数级增长的需求,就让 token 变成了 ai 时代最稀缺的硬通货。记住这句话,谁掌握了更低成本的 token, 谁就掌握了 ai 时代的话语权。想知道 token 是 怎么生产出来的吗?咱们下一期拆解它的底层产业链。