就在昨天,国家刚把 tucker 命名叫磁源,但人民网给 ai 争中文名,到现在还没确定下来,网友们的投票真的是绝了!第三名你绝对意想不到, 居然叫傻妞,多少带点情怀了。第二名叫气灵,文化自信,直接拉满断层。第一,毫无悬念叫智脑,电脑是通电的大脑,智脑就是智慧大脑,名字到现在还没确定下来,你们觉得叫什么最合适呢?
粉丝18.8万获赞104.9万

token 终于有自己的正式名字了,就在今天,中国政府网正式发布, token 正式定名为词源。在大模型时代, token 指的是模型处理语言的最小语义单位,比如郑逍遥,在模型眼里就是郑和逍遥两个 token, 也就是说,模型理解世界是按照语义单位来处理的。 从这个角度来看,词源翻译的确实挺贴切,因为词的基本单元就是最小语义单位。在词源这个官方译名出现之前,其实大家已经给 token 想过一堆五花八门的中文名了,就像前几天大家给 ai 起中文名也是一样的,大家群策群力,百花齐放,这个过程其实挺有意思的, 从一堆民间叫法到最后官方下场定义,我们可能现场见证了一个技术概念在中文世界完成命名的过程。这么一看,相信 ai 的 正式命名肯定也不会太远。

token 可以 说是 ai 世界里的流量与货币。有公司已经把 token 的 使用量写进了绩效考核、奖励、重度使用者工资结构,除了薪资、奖金和股权之外,也把 token 加入进去。 token 是 衡量算力、消耗、智能服务的基本单位。 简单说,我们每一次与 ai 对 话、提问、生成内容都在消耗 token。 它就像手机的流量一样,是进入 ai 世界的通行证。从个人到企业,从实体经济到智能制造, token 正在全面渗透。它不再是科技圈的专属名词,而是每个人都必须理解的 新时代应通过未来掌握 token, 使用 ai 的 能力将成为人与人、企业与企业之间的核心差距。当 token 像水电一样成为基础的生产要素, ai 就 不再是极客的玩具,而是杀入实体经济腹地的杀手。 您的竞争对手可能正在用 ai 写方案、做设计、管库存、服务客户,他们消耗的每一分碳都在拉大与您的差距。企业的自动化转型不是选择题,是生存题,也希望您的公司尽快开始自动化时代,让 t 肯为您创造价值,而不是成为被时代折算的燃料。

现在 ai 最赚钱的事情应该真的是这帮卖托盘做中转站的,就现在就有人来问说这事还能不能做,如果要做的话需要注意点什么,那么 就我把这个事情了解的我说一下,你听到最后应该是有很大的收益,他们说日入过万,我觉得在之前应该没那么夸张,应该有可能是真的。 这个事情为什么这么火爆啊?它解决两个问题,第一个就是解决了很多人没法用海外顶级模型的这个困难,真的用不到,不是有钱的问题。第二个呢,就是你用到了,价格也很贵,是这样子,那么他赚钱的这个方式或者是什么呢? 有两个点,其中第二个点我真的是最近才知道,我觉得一一般人真的不知道,就是你把这个第二点听到了,你你你都很大收益。第一个简单,大家很多人可能了解到,就是套利嘛,就是把海外的这种,呃订阅账号,嗯,用工具,比如说 safo api 的 这个形式, 呃给它做成 apikey 可以 分发的这个使用,然后给分给所有需要的人。那么以 cloud 为例,比如说单个个人最大的订阅账号应该是两百美元, 那么可以用到两千四百美元,这里就有就就有一个空间嘛,而且这当中呢,他们还会超卖,把这个分成小份,他赌你用不完,所以这个利润空间也有。再个就是他们这有些坏人就是,嗯,往里掺杂质,或者说是这个 tiktok 掺杂质,还有这个魔性酱汁, 你就说比如说你定的是这个 off 四点六,那么他后边呢?给你偷偷接一部分这个 samsung, 你 看不出来,有的更坏的就就直接用那个 kimi 或者智普,你根本看不出来。那么重点来了,就是第二点,他们怎么赚钱?现在我真的是听着说了以后我特别震惊,他们是这样,他们把你 所有跟大语言模型的输入,包括语言模型的输出打包一起卖给那些模型蒸馏,还有给那些想训练模型的公司, 把你这个东西一份两卖,赚两份钱。那这里边你想一个商机就来了,不是所有的公司都能接受,你要是小公司一个人,那无所谓,拿去训练训练了也没什么大损失。但是有些公司他是真的不能接受,说我这个东西在没开发完之前就已经泄露了,所以这个商机是很大的。 这个事情就是现在还能不能做到,我觉得是不能像之前那样做。第一个就是现在价格卷的也比较厉害了,不像之前那么有收益了,这真的。第二个呢?现在就是像 cloud 这种封号封的非常非常厉害,尤其针对咱们 这个公司,真的很可恶。我跟你讲,所以你维护他这个耗时的稳稳定,对外提供服务这个事就很难做到。但是现在这个叉 s g p t 扣贷这一套呢?因为一些技术原因,还有一些他们态度问题,对我们其实还好。 呃,有比较好的这个渠道和方式,我是建议大家如果做到可以用这这这个走这个路,因为现在带 gpt 的 这扣定能力还有其他能力其实也在提升,跟这个 cloud 应该是也差不多少。 那么现在最有价值的来了,就是说这些方式我认为很快就会都过去的,不会让他想象那么赚钱,要不然也不会全网都在说。 其实现在最好的赚钱方式是什么?做增值服务,做企业赋能,给企业做这个碎化部署,解决他什么问题呢?第一个就是数据防止泄露的问题,因为第三方现在卖数据的真的挺多的。第二个呢是说呃,一些企业他很难给每一个人配个账号, 而而且这个账号封了或者说是不能用了,就耽误这人工作,所以要公司一个公司内统一去调度,并且公司呢可以看到每个人这个工作的这个量啊,使用通量也对他工作有很好衡量。 这个一般一个企业你给他搞一套几千块钱到上万块钱还是很容易的,对企业很有帮助。从这个就是我们能看出来啊,就是在 ai 这个领域,大家不要担心说什么替代你工作了,我也不懂 ai 怎么办,你会发现真的在这个领域能赚钱的,有的时候并不是真的 去深入研究模型或者是做什么深入开发的,其实你就是围绕这个产业做服务,一直把他们有需求的东西给它解决掉了,你不需要懂 ai 一 样能赚钱。

当全世界都还盯着英伟大的 ai 算术战士,中国已经悄悄换了个战场,这里没有武器,不收关税,只收一样东西。 token? 那 什么是 token? 你 跟 ai 聊天,让他画图、剪视频、写代码, 都得消耗这玩意。你打的每个字每个标点拆成 token 为 ai, 这叫输入。 ai 吐给你的也一样,这叫输出。 token 简直就是 ai 世界的结算货币。 今年三月,中国每天消耗的 token 突破了一百四十万亿。什么概念?二零二四年初,这个数只有一千亿,两年就翻了一千多倍,这增速啊,黄金看了都得沉默,比特币看了都得流泪,更觉得是 token。 今年呢,被官方上户口了,你说这战略地位?数据局局长刘烈红亲自宣布,中文叫做词源, 官方定位就是智能时代的价值锚点。工业时代呢,我们按度来买电,信息时代,我们按兆按 g 来买流量。那么到了 ai 时代呢?我们就要靠 token 来买算力了。今天我们就来聊聊这个 token 和被它带动的新战场。 toon 为啥烧的这么猛?今年年初, aint 智能体爆发后, ai 的 用法彻底变了。以前是聊天工具,而现在 ai 是 数字员工,你扔一个目标过去,他自己搜索笔架,填表、纠错,甚至还让别的 ai 帮他干活。再加上现在 ai 写代码、升视频、升图片都不是什么新鲜事了, 哪个不是 toon? 吞金兽?摩根大通预测,未来五年,中国 ai 推理的 toon 消耗量要翻三百七十倍。更 刺激的就是啊,中国 token 现在在以白菜价的姿态横扫全球。先给你们看个数据啊,以百万 token 记 deep six r 一 大概是输入零点五美元,输出二点一九美元。而 colod opus 四大概输入是五美元,输出是二十五美元。 当国产价格呢,普遍是国外的五分之一,甚至是二十分之一的时候,这已经不是我考虑一下要用哪个的问题了,简直就是单选择题。今年二月啊,中国大模型在 open route 上的 token 调用量第一次超过了美国。 全球前九大模型中国就占了五席,全球周透肯调用量中国就占了六成。美国百分之八十的 ai 初创公司,底层跑的都是中国开源模型。 阿里通一千万,全球下载量突破七亿次,全球第一,什么意思?不是海外的华人在甩量,而是那些可能来自硅谷的,伦敦的,纽约的金融分析师、创业者、程序员,在用自己的母语疯狂地调用我们的 ai。 那你一定会有一个问题啊,中国的 token 价格为什么能这么低?要理解这个问题,首先我们必须要知道, token 的 成本谁说了算?答案很简单,看什么资源最稀缺,短期呢,就要看芯片。现在国外英伟达对我们擦脖子,英伟达高端的 gpu 我 们拿不到,成本呢,就下不来。 中期呢,要看电力等技术突破,芯片也降价了以后, ai 数据中心耗电量就会疯狂攀升,耗电呢,就会成为大头,这是实打实的物理成本。但是长期呢,我们就要看人才和数据。 芯片和电力终将会被技术的进步磨平,但训练顶级模型的研究人才,数据积累才是真正的稀缺资源。所以说, token 的 定价毛呢,就会从 gpu 到电力,再到人才和数据。那咱们具体干了些什么?三件事,层层叠 buff。 第一是算法榨干 mo, 一 架构极致量化,同样的 gpu 呢,中国团队就能榨出更多的 token。 就 像别人一生有跑十公里,我们可以跑二十公里。 其次就是电力碾压。中国西部绿电零点二元一度,美国折合人民币零点八元到一点二元,光这一项就差了五倍。东数西算加西部绿电这套组合拳,全球独一份。 供应链闭环,华为、深腾、韩五 g 海关、国产推力芯片已经能抗事,没有它英伟达,我们的 token 产业照样赚。三件事叠加形成一个结果,中国能以美国十几分之一的价格提供稳定持续、海量的 token 输出。但是呢,我现在就要泼一盆冷水,现在还并没有到开箱冰的时候。 斯坦福最新报告,中美顶尖模型差距已经缩小到个位数,百分比百分之九十的场景,中国的模型已经够用且好用了。但是百分之九十够用这件事本身就挺危险的。为什么?因为 ai 产业的价值高度集中在剩下的百分之十里, 比如说新要研发高频量化、顶级法律咨询这些高利润的场景,恰恰对到百分之二到三的性能差距极度敏感。就像黄仁勋强调的 token 效率, token 不 仅要便宜,还要吞吐量和速度。便宜可以打开大门,但打不开天花板。所以这只是开始。 因为这张牌桌上坐着可不止咱们,美国还攥着最顶尖模型的定价权、全球算力基础设施的标准制定权、高端芯片的分配权,而中国攥着全球最大的 ai 应用市场、最激进的开源生态,以及性价比战场上最锋利的刀。 二十年前,中国靠成本优势切入全球制造业。二十年后,中国靠极致技术优化庞大的内需、贪薄的成本、激进的开源政策,拿到了一张新牌桌的入场券。 所以,未来的三到五年,真正的考验并不是谁的 token 价格更低,而是从便宜走到不可替代。当海外开发者不只是因为便宜而用你,而是因为只有你才能解决那个问题。到那一天,我们才可以说,中国不仅仅是 token 工厂,还是 token 的 标准。而现在,战争才刚刚开始。

什么?豆包居然开始收费了?还在等 ai 一 直给你当免费?牛马的朋友们,这回可能真的要醒醒了。五一假期,豆包在 app store 更新了一行字,付费订阅,并且分为三档价格, 标准版六十八元每月,加强版两百元每月,专业版五百元每月。官方明确说了,豆包始终提供免费服务。咱普通人日常用的那些功能,比如聊天、写文案、查资料等,都是免费的。那收费的到底是什么?是高级功能? 如图片生成、视频生成。以前这些功能每天都有免费次数,用完就不能用了。现在推出会员付费之后,不仅没有每日次数限制,高峰期还能优先使用,不用排队卡顿。这消息一出,网友立刻就坐不住了,有人喊着卸载,也有人表示,烧了这么久的钱,终于开始收费了。那豆包为什么突然要付费了?让咱来仔细盘一盘。 豆包从发布至今,基础功能始终免费开放,你每一次向豆包输入指令的背后,都是一颗颗芯片在烧电和消耗算力,也是字节在为你垫付这些高昂的成本。 此前数据显示,豆包到二零二六年第一季度,月活已经干到了三点四五亿,相当于第二名到第五名的总和。今年春节期间,日活竟然破天荒地冲到了一点四五亿。 这里有个反常识的坑要告诉大家,对于 ai 大 模型来说,用户越多,亏损的窟窿反而可能越大,不像咱们平时用的 app 多,一个人下载几乎不花钱。 ai 可不一样, 你每问一个问题,它背后都有一排 gpu 在 疯狂烧电、跑硬件,每一次回复都是实打实的成本账单。有业内爆料给出过一份成本明细,单次推理的成本里,硬件折旧占百分之五十八,电力占百分之二十九。 火山引擎的数据更恐怖,豆包日军偷看使用量已突破一百二十万亿,半年翻倍,比发布时增长了一千倍。这么大的用户量,自洁这时候再不收费,账可就算不过来了。所以,这六十八元根本不是为了赚你这六十八元,它是为了筛选出谁才是真正的号能大户, 把这些增值服务和高端算力精准分配给有意愿付费的用户,然后告诉你兄弟,要么掏钱,要么降级, ai 的 付费时代即将来临,所以,别再留恋打开软件随便深读的免费时代了。豆包的一小步,是 ai 行业的一大步, 当收费成为整个行业的共识,就意味着这场轰轰烈烈的 ai 技术革命,终于不再是空中楼阁,开始长出支撑长期发展的骨骼和肌肉,真正走向可持续的商业化道路。如果豆包也要付费,你们还会继续使用吗?

做一个只有两百位粉丝的财经博主,从今天起,我将开始帮大家深度解读百万财经博主的调研视频,一直跟踪他的朋友,有的人都已经翻了好几倍,就仅仅四月份的利通同学,截至目前涨幅已达百分之一百八十。 但很多人苦恼他的视频太长太专业。从今天起,小飞帮你来梳理清楚,为什么算力五月份了还在疯涨。这一期视频帮你看透脱困工厂背后的逻辑。博主在视频中系统的拆解了算力租赁行业的下一代商业模式,脱困工厂,这不仅是一个新的概念, 更是未来几年整个 ai 基础设施领域最重要的投资主线之一。接下来,我将用最清晰的逻辑将视频梳理清楚,带大家彻底搞懂这个未来的大风口。本次解析将分为五个部分,第一个部分主要讲了当前算力价格飙升导致供需矛盾激化。 博主在视频开头就提到了两个五一假期发生的重磅事件。第一,豆包 app 开始收费,这背后是其 token 消耗量暴增一千倍,算力成本不堪重负。第二,全球算力价格疯涨, 英伟达的 h 幺零零、 b 二零零租赁价大幅上涨,国内 b 三零零服务器更是被黄牛炒到了七百万一台。这两件事共同说明一个问题,算力的需求已经远远超过了共体, 传统的卖硬件模式已经过时,市场迫切需要一种新的解决方案。我们来看具体数据。国内 b 三零零服务器的价格在短短半个月内从五百四十五万涨到了七百万,涨幅惊人。与此同时,北美市场的 h 幺零零和 b 二零零租赁价格也分别大涨了百分之二十二和百分之六。 这说明算力紧缺是全球性的问题,特别是 gpu, 由于出口管制,供给被进一步收紧,导致它的顶级度比存储、 cpu 等其他硬件更高。这也印证了博主一直强调的拿卡能力强者恒强,那些有能力拿到一手货源的头部公司正在享受巨大的利润空间。第二部分,博主主要讲了算力价格飙升的解决方案, 那么新的解决方案是什么呢?市场给出的答案就是 token 工厂。为了理解它,我们需要先理清三个概念的递进关系。最基础的是传统算力租赁就是简单的出租服务器,收固定租金。在此之上,出现了 token 分 成模式,不再按硬件收费,而是按最终产出的 token 量来分成。 而要实现 token 分 成,就必须有强大的技术体系支撑,这就是 token 工厂,它是一个集软硬件优化于一体,专门生产 token 的 高效数据中心。 那么这两种模式的本质区别在哪里?我们可以通过这个表格清晰的看到,传统算力租赁卖的是硬件核心壁垒,是搞到芯片的能力, 而 token 工厂卖的是加工好的 token, 核心壁垒变成了技术优化能力。盈利模式上,一个是固定的一锤子买卖,另一个是与客户收益直接挂钩的分成,潜力巨大。最直观的就是财务指标,净利润从百分之十至百分之十五有望翻倍到百分之三十以上,回本周期也从三至五年缩短到两年左右。 这是一个从资源生意到价值生意的根本性升级。那么最关键的信息差在哪里?就是分成比例到底有多少?在深度合作的 token 工厂模式下, 大模型公司愿意把高达百分之六十到百分之八十的 token 销售收入分给算力服务商。为什么?因为算力成本占了他们总成本的七成以上, 没有算力,他们的模型就是空中楼阁。这意味着,算力服务商的收入不再是固定的租金,而是直接与应用的成功挂钩,利润弹性巨大,收入甚至可以达到传统模式的五到十倍。紧接着,为了让大家更具体的理解,博主还举了一个机构调研的案例。 有一家公司已经明确将 token 工厂作为核心战略,他们将像 deepsea 这样的大模型部署在自己的算力中心,并与模型方进行分成,预计能拿到百分之七十的收入。根据测算,这种模式的盈利能力远超传统租赁,两年就能回本。 同时,这家公司正在大规模扩张,计划建设多个万卡集群,并准备了三百亿的资金。这充分说明,头部玩家已经开始抢占 token 工厂的赛道了。 第三部分,博主讲了 toko 工厂的赚钱逻辑。那么 toko 工厂究竟是如何实现利润倍增的呢?博主用了一个非常形象的比喻,精耕细作。传统的算力租赁就像把整块地租出去,不管租户重不重,租金都是固定的。而 toko 工厂则是把地分成小块, 按实际收成来分成。具体来说,通过算利息、切割、分时赋用、智能任务调度和软件优化这四大手段投坑工厂,能把同样的硬件资源利用到极致,白天给企业用,晚上给科研机构用简单任务用便宜的卡, 复杂任务用贵的卡,这样一来,收入自然就上去了。这种精细化运营带来的效率提升是实实在在的。目前行业的平均有效使用时长大约是每天八小时, 如果通过优化能把这个时长提升到十二小时,那么算力使用效率就提升了百分之五十,利润也会同步增长。更重要的是,这种模式有很强的抗风险能力,即使未来托肯价格下降,只要能通过技术手段提升使用时长,就能抵消价格下跌的影响,保持稳定的高收益。 这说明托肯工厂的商业模式比传统租赁更健康、更可持续。第四部分,博主主要讲了 toko 工厂将重塑行业估值, toko 工厂的出现将彻底改变市场对算力公司的估值方式。过去 算力租赁被看作是周期性的重资产行业,估值很低,但 toko 工厂是一个持续性的服务行业,它的核心是运营效率和稳定的现金流,更像是一个平台。这种属性的转变意味着它的估值模型将从传统的 p、 e、 p、 b 转向更看重未来现金流的 ps 或者 d、 c、 f 模型, 从而打开了整个行业的市值天花板。未来具备技术能力的头部公司将获得更高的估值,行业会出现明显的分化。 那么这个模式离我们有多远呢?他已经从一个纯粹的概念开始走向现实,目前已经有公司开始试水,而他预测,在今年的二三季度,我们将会看到大量的算力公司宣布进入这个赛道,这意味着托根工厂的投资机会已经到来。我们需要关注的不是他短期内能带来多少利润, 而是他代表了行业未来的发展方向,提前布局,那些有能力转型的公司,就有可能抓住这次估值重塑的巨大红利。第五部分,博主主要讲了风险,让大家理性看待短期与长期。 首先,价格已经接近天花板,七百万一台的服务器再涨就没人买了。其次,未来存在很多不确定性,比如下游大厂可能联合起来压低价格,或者政策变化导致供给增加。所以我们不能简单的认为算力会一直涨下去,市场的狂热之下往往隐藏着风险,保持理性,直观重要。 从更长远的角度看,博主指出了一个更深刻的规律,技术进步会不断稀释硬件的稀缺性。历史上无论是 cpu 还是内存,只要价格足够高,产业链就会通过各种技术手段来降低成本, 比如模型压缩、专用芯片等等。就像摩尔定律结实的那样,单位计算成本长期来看是下降的,所以硬件的高溢价永远是暂时的。 博主最后总结到,真正伟大的公司不能只靠卖硬件赚钱,更要成为平台和标准的制定者,这才是长期的护城河。最后,我们来总结一下,第一,算力依然是未来至少三年的结构性机会,需求非常强性。第二, 偷看工厂是这个赛道的下一个大风口,他将重塑行业格局。第三,投资要保持理性,不要追涨杀跌,要关注长期逻辑。第四,我们要看到整个产业生态的变化,国家正在从顶层设计上打造我们自己的 ai 全产业链。最后感谢各位原始股东的观看,欢迎点赞、关注、收藏。

同样的百万 token 啊, gbt 五点四卖四十五美元,而 deepsea 只卖零点二八美元,在中间差了一百六十倍,但这个差价它不会永远存在,能够吃几年呢,就看你什么时候动手了。好,我来先给你念一组真实的定价啊,这是二零二六年三月全球主流模型的 api 的 价格。 国产阵营我们来看 deepsea 的 v, 三点二输入是零点二八美元。好,那 mini max 啊, m 二点七输入是零点三美元。 kimi t 二点五输入是零点六美元。通用千问啊,输入呢是零点六美元。我们再来看海外阵营, cloud solid 啊,四点六的输入是三美元,输出呢是十五美元。 cloud ops 四点六输入是三十美元,输出是一百八十美元。 gbt 的 五点四输入是四十五美元,输出呢是一百三十五美元。好,综合来看, 国产比海外便宜了八到十倍,能力接近的模型之间呢,价差啊,尤其明显。好,这个价差他是怎么来的啊?一共是三个结构性的原因,第一呢是能源成本, 中国西部的绿电啊,两三毛钱一度,东数西算政策让数据中心建在电费最低的地方,那美国数据中心啊,是中国的两三倍,这个电费好。第二呢就是架构效率,国产模型广泛的采用的是 m o e 的 混合专家架构,那推理效率比传统的架构高了一个量级。 好,第三就是竞争的格局了,国内几十家模型厂商啊,贴身肉搏,价格被压到了极致,那海外市场寡头垄断啊,价定价权呢,就定在了少数的几家手里。好,那这个价差他还能够持续多久呢?我的判断是二零二六年进入到价值的回归期,价格战趋缓, 但结构性的成本优势,像能源啊,供应链啊,工程化的优化啊,这个是不会消失的。也就是说啊,绝对价差能够缩小,但是相对优势会长期存在。那对于做 token 的 代理来说啊,现在的窗口就是最肥的时期。一把国产 token 啊, 按照比海外低百分之五十到七十的价格,卖给海外的开发者,你还有巨大的利润空间。那八倍价差呢,是结构性的,而不是一阵风。但是最肥的窗口期就是现在。那关注我下期具体讲怎么跨境做 token 的 风发。

hokken 出海怎么看 later 我 这么跟他讲吗我不懂啊略懂。好吧略懂略懂我我跟你讲正好只略懂百分之一啊今天还跟小女孩聊天呢哎呀我问他我说不要把他说的话当真啊好 我说我说你知道什么是头坑吗嗯真的不开玩笑我真今天这个正好跟小女儿在聊天嗯因为我我一直是在思考嘛就是因为我让小女儿平时用我的那个 ai 嘛嗯让他互相聊天什么的然后我就跟他说我说你知道我为什么这些 ai 他 能回答你问题吗 其实 ai 本身他并不像人他其实什么都不知道的他回答你什么他也不知道的。嗯你知道那你知道 ai 是 怎么回答的吗 就是从网上搜罗数据啊。对啊差不多就是这样差不多对对对啊就基本上这三步了第一步就你跟他讲的东西他需要接收接收他就要需要消耗算力那算力就是以 token 的 模式对吧第二就是他输出他也需要 token 而且他的比例基本上到一比五一比六喽就输入如果是一一块钱的话输出他就要六块哦然后其实除此之外他还是有一个就是刚才讲的内存的就你输出进去你比如说你现在 ai 力还在哪你跟他讲这件事情 过五六天你再提到类似的事情他会帮你联想到上一件事情嗯这都是要说存储的,存储也需要用到算力的也需要用到投分的嗯大概是六分之一到十分之一。嗯 所以你你跟 ai 干一次嗯要花三笔钱第一笔输入输入假设是一块对吗?嗯啊,输出大概就五到六块。嗯,还有一笔存储,存储就是差不多零点二块到零点三块。哦,那就是七块,七块五毛钱哦,干一次要七块五毛钱,好贵啊,跟 ai。 不是,我这只是假设啊,当然没有这么贵,他是百万来百万都给他算。所以现在出现一个问题,就是你知道美国的这些大模型跟中国这些大模型如果在算力差不多的情况下,美国的托克比中国要贵好多, 是吗?对,这就为什么有人就提出怎么看 ai 啊?就是这托克出海,因为这国内东西便宜,他才有资格出海吗?啊?便宜,那这不就是个好机会吗? 是,但是现在可能这是一个机会,所以大家如果是干这行的,我觉得可以先干两,但他不一定知道啊。他说的不对,他也不是搞技术的想法,但是未来技术如果干大了,还是某某普在上面,他一定还是要封锁你。

朋友们,今天看到一组数据,我反复确认了三遍,确认没看错。 idc 最新报告,二零二五年中国共有云上大模型掉用量达到一千九百四十四万亿个 token, 同比增长十六倍。什么概念?二零二四年这个数字才一百一十四万亿,一年时间翻了十六倍。 idc 预计,二零二六年全年 token 消耗量还要再涨二十倍,直接干到四万万亿。 如果你到现在还觉得 ai 只是个聊天工具,那今天这条视频你一定要好好听完。咱们先把这组数据的含金量说清楚。日军 token 调用量已经突破一百四十万亿,比二零二四年初增长了一千多倍。 这不是某个小赛道的增长,这是整个中国 ai 基础设施的底层需求在爆炸式扩张。国 家数据局透露的数字,日均一百四十万亿 token, 意味着每一秒钟都有海量的企业级 ai 调用在发生,覆盖了工业、金融、医疗、政务这些核心领域, ai 已经从实验室跑进了工厂、车间、银行后台、医院系统。 再看一个让人震惊的数据,火山引擎以百分之四十九点五的份额拿下了中国马斯市场第一,接近半壁江山。阿里云百分之二十七排第二, 两家加起来吃了超过百分之七十六的市场。为什么火山引擎能跑到这么前面?自洁系的产品矩阵太狠了,豆包月活三点四五亿,远远甩开千问的一六十六亿和 deepsea 的 一点二七亿。豆包一家的月活比后面两家加起来还多 三点四五亿。用户每天产生的 token 掉用量,直接把火山引擎推到了市场第一的位置, 但今天真正让我兴奋的,不是谁拿了第一,而是整个行业正在发生一个根本性的转变,从免费到收费,从烧钱到赚钱。豆包刚刚开始收费了三点四五亿,月活扛不住,算利账单,免费午餐到此结束。 智普更狠,二零二六年一季度, api 调用定价直接提价百分之四百,涨价百分之八十三,用量涨四倍。这是什么信号? 说明市场对 ai 算力的需求已经到了攻不硬俏的程度,价格弹性极低。阿里云和腾讯云也在跟进涨价, 腾讯会员的掉用量暴增十六倍,阿里云部分模型服务价格上调百分之二到百分之七。全行业都在从补贴换规模转向正常商业化运营。 这个转变背后,最确定性的受益环节是谁?不是大模型厂商本身,而是撑起这套 token 经济的基础设施。中国 ai 大 模型的周掉用量已经到了七九十四万亿, token 环北增长八十一,百分之七。 而美国大模型周掉用量才三二十六万亿,环比还在下滑百分之三十四点六。中国反超了,算力需求只会越来越猛。 光模块、液冷散热、国产算力芯片这些环节,正在从主题炒作切换到业绩验证阶段。无问新琼今天也宣布拿到超七亿融资,刷新了国内 agi 基础设施单笔融资记录。红山、北极光这些顶级机构都在压注。 但冷静下来也要看到风险。 token 调用量涨得猛,不代表每个厂商都能赚到钱。算力成本是刚性支出,如果 api 定价提不上去,或者客户付费意愿不足,烧钱模式就还在继续。 而且火山引擎一家独占近百分之五十的份额,中小厂商的生存空间会被持续挤压,行业集中度只会越来越高。 ai 商业化虽然加速了,但从掉用量增长到真正规模化盈利,中间还有很长的路要走。 核心判断, token 经济已经从概念走向规模化,实践从免费走向收费,这个拐点比大多数人想象的来的更早更猛,谁手里有算力、有用户、有商业化闭环,谁就能在这轮洗牌中活下来。 以上纯属个人看法和产业分析,不构成投资建议。你们觉得 ai 收费时代,你愿意为哪些 ai 服务买单?评论区聊聊,我们下期见。

你每刷一条短视频,背后都在燃烧一种比黄金更稀缺的资源,而你可能连他的名字都不知道。接下来六十秒钟,我会告诉你什么是 token。 这六十秒啊,可能是你今年最重要的信息补给。 因为不懂偷啃的人呐,正像当年不懂互联网的人一样,被悄悄甩下车。二零二四年,全球科技公司为这个东西烧掉的钱超过三千亿美元。这不是未来,这是正在发生的财富大迁移。 而你还在用旧地图找新大陆,先证个明啊!清华大学杨斌院长专门提议把 ai 领域的 token 翻译成魔源。人民币的源。 什么意思啊?因为区块链有 token, 游戏里面有 token, 但是它们完全不是一回事。 ai 时代的 token, 值得一个专属的名字,大模型的模模,圆圆就是钱的意思。但是今天呢,为了让你听懂全球的产业链,我还是用 token 来讲,什么是 token? token 是 大模型能听懂的最小的原单位。 你问 ai 一个问题啊,他按 token 来计费,让他写报告,他按 token 计费, 翻译啊,编程啊,画图啊,统统都按 token 计费。二零二四年呢,全球消耗的 token, 相当于全人类五千年写下的所有文字总和的一百倍,它是数字经济时代的水电和煤气。 一个头肯,你可以理解成一吨水、一度电,或者是一平方米的煤气。它已经成为 ai 人工智能时代的基础设施。 头肯为什么这么重要?点赞,关注,让我们来看看,在 ai 产业链上,谁赚钱最稳,谁又能赚大钱。讲个老故事, 淘金热里面发财的首先不是淘金者,而是卖铲子的,但铲子只是工具,真正的大钱在挖到金矿的人的手里。什么叫做挖到金矿? 这里咱们就不得不提到三种拥有 tokens 的 资源优势。第一个,数据资产独家数据就是独家 token, 有二十年金融数据的呀,有十亿用户行为数据的呀,这就是矿脉,别人挖不走。第二个,算力储备 gpu 集群就是偷坑的工厂,谁手里有算力中心,数据中心谁就能批量生产偷坑服务。 第三场景入口搜索,电商、办公、社交,有场景偷看才能变现,没有场景就是一堆算力在空转。最后再来说一说哪些企业手里的偷看资源最多 收藏转发,我列出四大 tocs 的 矿主企业。第一类数据,矿主手里握着垂直领域独家数据的啊,比如金融啊,医疗、教育、通信这些行业的龙头科技公司,你记住, 数据越封闭越值钱。第二类算力的房东,有自己大模型的,有建自己的数据中心的, 有做服务器集群专门对外出租的,也就是咱们最近常说的算力租赁企业。这些都是手里掌握着大量算力 tokens 的,是当下 ai 人工智能爆发式增长的直接受益者。 第三类场景的霸主,有搜索入口的,有电商流量的,有企业级办公软件的,有打车的、购物的、买票的、订餐的,这些都是 tokens 变现的天然场景。 第四类最隐蔽啊,能源巨头,你没听错, ai 算力是电老虎,一个超算中心年消耗电等于二十万个家庭, 谁有便宜稳定的店,谁就能吸引算力落户,间接控制了 tokens 的 成本。 三句话咱们结尾, token 是 ai 时代的生产要素,不是技术概念,是资产的概念。投资 ai, 别看谁的技术炫,看谁手里的 tokens 资源丰厚。 卖铲子的人赚稳钱,但赚大钱的往往是手里握着大量算力资源,拥有源源不断低成本 tokens 的 人。我是六六说财清六哥,看清底层逻辑,才能抓住真实机会。

董事长们,今天聊一个正在发生的很多人还没意识到的事,中国 ai 正在悄悄掌握全球的 token 定价权。你没听错,就是定价权。以前这个词咱们经常在能源矿产上听到,现在轮到人工智能最基础的原材料 token 了。 token 是 什么?你可以把它理解成 ai 时代的字。大模型每回答你一个问题,背后消耗的就是 token。 央视财经刚报导了,国产模型的 token 价格已经低到了国际竞品的三分之一甚至二十分之一。 这不是在打价格战,这是一个体系性的成本优势。我跟你说几个数你就明白了。从今年二月份开始,中国的大模型在一个叫 opi 聚合平台上周掉用量多次反超美国,而且持续霸榜。 调用量是什么?是全世界开发者用脚在投票。那问题来了,为什么我们能这么便宜?三个原因环环相扣。第一,开源。像 deepsafe、 v 四这种级别的模型发布就开源 api, 直接开放百万字超长上下文能力,以前是要花大价钱用的,现在直接进入普惠阶段。 更牛的是什么?八家国产芯片在同一天就完成了适配,这意味着开发者用国产芯片跑国产模型的门槛被降到非常低。第二,咱们有电价的优势,西部那些低价电力,配上这几年猛健的算力基础设施,让运营成本天然就比海外低一大截, 这个是别人想学都很难学的结构优势。第三,也是最容易被忽略的一点, ai 智能体时代来了。 以前你跟 ai 聊天儿一问一答消耗的 token 少,现在智能体要帮你干一个活儿,背后可能得调用工具、查数据库来回思考。几十步 单次任务的 token 消耗暴涨了二三十倍。用量这么大,价格弹性一下子就出来了,咱们便宜,而且便宜一个数量级以上,你说全球的开发者往哪儿跑?所以别把这当成简单的便宜货出海。这背后是中国 ai 能力的系统输出, 开源模型快速覆盖了东南亚、中东、拉美市场。很多海外公司直接把训练和推理任务部署在中国的算力中心,这就是 token 出海好。说到这儿,做投资的朋友肯定要问了,这会产生哪些投资机会? 整个链条得倒着看,最确定利好的是那些卖铲子的人。算力基础设施,不管哪家模型公司的 token 火了,它都得跑。在服务器上,都得消耗算力。 你看现在一个头部模型,日军 token 调用量就超五十万亿,这得多少服务器撑着?所以提供算力底座的出租 gpu 服务器的订单和开机率是最踏实的。再往深一层,弹性最大的环节可能在哪儿? 在芯片调用量爆发,算力需求就爆发。但现在海外高端芯片出口还在管制,但国产 ai 芯片的供需缺口会持续存在,而且可能越来越大,这里面谁能顶上谁的业绩,弹性就可能被放大。 有了算力和芯片的支撑,才轮到模型 a p i 层和应用层。模型公司不只是卖 token, 更是在跟全球最顶尖的对手抢夺开发者生态。已经有公司在涨了价之后,调用量不降反升, 这恰恰说明,当你的模型性能强到变成刚需,你就有了真正的定价权,那最终这些能力会落在五花八门的应用上。不管是 ai 视频剪辑工具在海外的爆火,还是跨境电商的智能客服, 它们是中国 ai 能力服务全球的最终触角。所以,整条线捋下来,一个正在发生的巨大变化时, ai 时代的基础资源定价体系,正在因为中国力量的加入而发生倾斜。 那些在海外的算力中心,那些疯狂增长的钓用量数字,是全球市场在为我们的成本优势和技术能力买单。这里面有长坡厚雪,也有大浪淘沙,但方向已经摆在这儿了。

一个人一个月应该烧多少? taco 这个事?对对对,我看,其实,其实我说一个月一个亿,我是往少里说,我是怕别人。我当时在公司全体大会上嘛,我是怕大家跟不上。对啊,我真实的烧大概是一个月二十亿到三十亿左右。 哇,这还算少的?少的,因为我有一个朋友是一个独角兽的 c t o。 对 啊,他去年十月份开始花了三个月时间,大概呃,六千美金。对,然后呢?把他们公司一百多个程序员写了七八年的那个项目啊,他一个人重写了一遍八百万韩 r s 的 代码, 六千美金。哦,才六千美金啊。然后呢?每天二十亿 tiktok? 对 啊,每天二十亿 tiktok。 啊,我,我都快疯了啊。这个数据也是合格的吗?是合理的吗?因为 facebook 的 内部不是在搞 tiktok 大 阿赛吗?哎,他有个员工是一个月烧了两千一百亿, 这个是世界纪录吧?然后我那个朋友一个月是六百亿,我觉得已经够恐怖的。是我才一个月才二十多亿,很惭愧。

孙哥卖托肯就算了,即将访华的特朗普家族,他们也卖起了托肯,甚至连自己搞 ai 的 马斯克,他也把他的二十二万张的英美达显卡全部出租了给 angelababy。 那 么很多朋友就问啊,到底这个生意是不是真的这么赚钱呢啊?答案是,肯定是赚钱的,但是 赚钱的时代已经过去了,现在我们拼的什么?拼的是服务,拼的是稳定性,拼的是性价比。我后台非常多的私信在问啊,现在到底通肯是做代理还是自己做个中转站呢?当然啊,肯定是哪个赚钱做哪个嘛。如果说你真的是这么想的话,那么你应该多点去了解代理跟中转站,他们之间到底是怎么赚钱呢?他们区别到底是什么? 我们先来说说代理吧,为什么会有代理呢?其实你们看腾讯云、阿里云都已经十多年了嘛,但是至今为止还有几十万上百万家的代理商,那么 token 也是一样,而且它还是一个新兴行业, 如果我们直接用官方的价格呢,是非常贵的。虽然说官方也偶尔会搞活动嘛啊,比如说小米的人均最近七亿 token, 然后还有 dbc 最近也在搞活动嘛啊,从五月七号,然后延续搞到五月底嘛, 但是我们个人使用起来其实还是非常贵的。于是乎呢,就有很多小企业,小工作室啊,想去跟官方谈个低价对不对?结果一上来量太少了,官方根本就瞧不上。于是呢,就出现了一种服务商,他们有钱有量有团队,他们一上来呢,就直接先上一百个,逼的透肯, 那么价格肯定是不一样的,所以说这个时候代理商他就来了,慢慢下面的代理商也开始多起来了,所以代理商的代理商就是给返佣的模式嘛,他们会有一个自己专属的 a p i t 啊,然后自己去找客户,然后去赚点差价, 价格当然还是会比官方低的。如果你自己对接了代理,你认为是非常有优势的话,你想加价卖的话,那么这个时候你就可以去搭一个你自己的中转站, 成为一个渠道商,也就是大家经常听的我是上游,我是上游,他的好处呢,就是可以去做一个自己的网站嘛,然后管理客户,管理资金 啊,你可以自己去设置好倍率,然后去赚点差价,可以给一些小团队,小公司做一些专属的定制套餐啊,甚至还可以去做一些专项后肯。如果你是想自己做中转站的话,第一个你一定要有个租赁公司,因为要开票嘛,毕竟很多企业如果说你没有发票,他是无法跟你进行正常的一个采购合同嘛, 你要跟你上面的总代理先支付预付的一个采购款嘛,动不动的话可能就几十万上百万啊,当然这个情况下你的政策肯定会比普通代理强很多嘛。然后第三个就是责任了, 一定要确保你站点的稳定性,你资金的安全性,还要去组建你的服务团队。第四,一定要有获客能力啊,如果说你没有获客能力的话,那么你就完全不要去考虑自己做中转站这个事情了,你没有客户的话,然后你上游的钱啊,你购买算力,购买购买额度的钱你又压在那里, 久而久之你只能逼着自己降价,降着降着你甚至可能会亏钱,因为这个行业还非常不稳定,今天一个价,明天一个价,而且大家懂的都懂啊,这个行业到底应该要怎么去做的话,真的就取决于你们自己了。好吧,你们自己去考虑。

coco 这个生意,这个买卖到底能不能干啊?好多粉丝都在问啊,我可以非常笃定啊,现在甚至是今年啊,都是一个比较好的时机。这里边唯一你要关注的一个点是什么呢?就是你能不能取得一些优质的生产资料, 比如 cloud gpt, gmail 啊,还有我们花一千万拿的这个 cds 二点零这个接口,这都属于优质的生产地资料。你手里边只要拥有这种优质的生产地资料啊,原则上你只要有一定的销售能力就可以干。