粉丝49.3万获赞287.0万

tokyo 工厂里的 tokyo 到底是怎么生产出来的?它能不能像电能一样储存在电池里?还是和手机流量一样无法储存,随用随消耗?答案其实是后者。 tokyo 并不是实体的资源,没法储存,只在你 问 ai 做答的过程中,实时核算实时的消耗。当你像 deepsea 这类大模型发送问题, ai 进行思考并生成回复时,背后的高性能 ai 服务器会高速运转,持续耗电完成整套运算。逻辑系统会精准统 问题回答问题里的所有文字标点,以此核算消耗成本。由于大模型原声适配英文逻辑,我们的中文提问大多会先转为英文,再变异为数字进行计费统计换算参考,以 一个中文字约消耗一点二到一点五个 token, 成本上也是有明显区别的,用户提问成本更低, ai 思考作答更贵。换算下来,提问约每百万字两元, ai 回复可达每百万字八元。核心原因是 ai 需要复杂推理运算。除此之外,日常使用豆包 deepsea 时,为了保 障回答连贯,贴合语境模型会自动带上你们过往的全部对话记录,一并运算,这也是 token 消耗飙升的关键原因。简单来说, 生产 token 只是通俗比喻,方便大家理解。 token 本质是 ai 算力的计量单位,就像手机流量的 m b g b 一 样,是消耗统计标尺。我们每消耗一次 token, 实际消耗的是 ai 芯片的损耗, 机房算力资源,场地设备的折旧,巨额的电费,还有大模型研发工程师、数据中心运维人员的技术成本。记住核心的结论, token 只是计量工具,不是可以买卖储存的实体商品。

全网首发,今天一条视频教会你获取 token 的 四种渠道,搞定中转站上游。 第一种, azure open ai, 作为目前大陆获取 open ai token 的 主要合规渠道, 虽然目前已经不再是获取 open ai 模型的唯一云渠道,但阿塞尔在大陆的特殊地位不变。微软也明确强调,在大陆提供的 hr open ai 服务没有变化,获取的一线货源稳定性与合规性极强,持有大量企业级合规认证。 第二种, safar ipi, 手动搭建,借助 safar ipi 等开源工具,将自己的网页订阅额度转换为 ipi。 如果账号很多,甚至可以调用 safar ipi 的 管理 ipi 编辑脚本,实现批量自动导入。但是这种方式只适合个人学习与技术探索。 第三种,逆向。这种方式极不推荐偷看,有效期非常短,只适用于私人且低频非重要的技术测试。逆向是验证想法的快速途径,但需自行承担风险。第四种,薅羊毛。 利用海外企业的免费试用额度或建立大量耗时赋用分发羊毛党滥用免费额度,且有巨大的时间沉没成本。 最后获取 token 推荐大家还是选择官方云厂商的直联或者 ai api 聚合平台,用激进官方的稳定性换来极低的价格。最后,祝大家创造力不断,用 ai 探索出更多惊喜!

普通人能不能自己生产托肯自己卖,这是最近遇到最多的问题啊。今天一条视频给你讲清楚,另外,以后每条视频给你们随机靠二十位粉丝安排托肯,帮助你们学习成长, 前提是要证明你会用啊。先说结论,能生产,但是算完账你就不会干了。原因很简单啊,自己生产这一百万的托肯,至少要花十几万去买 gpu, 再装一台服务器,还有二十四小时不断电,就这样,一台机器 还要花十几个小时才能生产出一百万个托肯。这就是普通人生产托肯面临的问题啊,不是做不了,而是做了一定亏。作为一个普通人,你想做托肯这门生意,正确的姿势不是自己生产托肯,而是用便宜的托肯去创造贵的服务和保障。我 再给你举个例子啊,用海外大魔星花了三块钱买了一百万个托肯,然后让 ai 帮你写十篇小红书文章,通过小红书给你写的这文案带货挣钱,那么成本就是三块钱 赚的其实不是托肯的差价,而是知道怎么用托肯,而别人不知道的是信息差,没听懂是吧?我再给你举个例子,用 ai 帮一个企业去搭建一套 ai 的 agent, 成本可能不到十块钱,但是可以收企业五千块钱的咨询费。 其实企业买的不是你那十块钱的托肯,而是你的认知力和有效产出。所以,不要跟资本抢着去生产托肯,要想着怎么用三块钱的托肯去创造三千块钱的价值。生产托肯的钱就留给资本去赚,普通人就用好托肯就够了。

怎么开始做托管生意呢?今天给大家再分享一个完整的实操步骤啊,一定要点赞收藏!首先第一步呢,你得拥有自己的聚合平台,因为托管像水聚合平台呢,像供水管一样,我们不能见一个人,就问你要不要喝水,是不是等我们有了水,有了管道,才能把托管 卖给 ai 行业当中的企业或者是个人工作者?那第二步啊,你需要把拿到的大模型的 a p a 接口接到你的平台,那么怎么找这些大模型来接入呢?这里有几个办法啊。 首先,目前国内主流正规的大模型厂商,比如说像呃, mini max, 阿里的百链,腾讯的火源这些呢,它头部平台都开放了,这个开发者的 a p a 接口没有啥门槛儿,你可以直接在官网上申请一个开发者的权限就可以了。 呃,等他通过之后,咱们按量付费就行了。这里要记住啊,一开始呢,不要去纠结比价, 不要去纠结有没有专属的一些折扣什么的,刚开始最主要的目的就是跑通完整的业务流程,等到后期你的平台消耗量做起来,再拿着这些单量的消耗呃和厂商谈折扣。 那同时呢,你也可以跟这个托管工厂的直接合作,甚至是一些海外托管的供应商来合作,合作的越多,你提供的就越丰富。然后呢,就可以把这些平台可以把你平台当中的大魔性的 ap 接口推广给你自己的这种上下游的客户还有工作者了。 那么通过上面的这些群体呢,我们把市场上的托管供应商基本上都找到了,是吧?那么最后一个问题来了, 跟这些云服务商啊,还有这个海量的第三方以及海外的公司打交道呢,争取折扣对于来个人来说或者小公司来说是不是非常的难? 所以这个时候呢,咱们也可以选择直接找一个聚合平台去做他们的服务商。大的聚合平台呢,他们都有稳定的病发量,这个对于刚开始的业务稳定性是非常有帮助的。还想知道哪些留在评论区。

大部分人都错了, ai 时代,你根本不需要绞尽脑汁去修炼什么葵花宝典,你只需要专注一个东西,就是 ai 投研。现在无论是硅谷的大厂,科技新贵,还是华尔街的金融高管、法律高管,他们都在吐槽一件事情,就是最聪明的 ai 投研根本不够用。 这个东西往他一层层深究,可能涉及到,比如说土地不够用,数据中心建的太慢,电力不够充沛, gpu 的 卡配的不够快。这也是为什么马斯克宣称要做太空 ai, 黄仁勋也在宣称做太空 ai 镜片,我觉得就紧紧围绕一个主线,你有能力你就去造出来牛逼的 ai 头啃, 无论是大模型还是巨深智能世界模型。但有人说,我不想搞那种硅谷的宏大趋势,我就想赚点小钱怎么办?你看现在富盛还有孙哥都在加长做这种头啃的中转站。当然最近他们基本上干啥啥叫富,但这里面一定是有小团队存活下来的机会。 所以我觉得过去服务人类的商业模式,商业行为,那些低垂的果实基本上都被摘干净了,未来属于服务 ai 造出来最好用的 ai 透坑,并且把它卖出去。

听好了,一个月赚两万美刀,基本上是零成本,方法还合规,国内的 ai 托克一分钱,国外能卖到三倍的价格, 这中间的差价全是机会,只是很多人不知道怎么把握。今天给你分享三个玩法。第一个搬砖玩法,去对接国内的头部大模型厂家的千万级 api 授权,把他们做成本地化的 ai 工具套装,卖给东南亚的电商,他们那边把托克当成核心力的生产工具,抢着采购, 毛利率能达到百分之六十五,你赚的也是这波信息差,他们不清楚国内的成本这么低,觉得性价比已经拉满了。第二个玩法,就是压缩降本,把两百亿参数的大模型压缩到四十亿,丢到东南亚的廉价算力上去运行,每托肯的成本低至零点零零八美分,一天跑个十一亿,托肯净赚两万美刀,一天 挖矿,跟这比起来,哼,都不值一提。第三个玩法,识趣套利,这个玩法门槛高,就把推理任务 调度到蓝美的夜间,低成本计访处理完再卖给亚洲白天的刚需用户,成本直接再降百分之四十,这不是普通的赚钱,这是降维式的打击盈利。所以你看这种信息差的玩法,很多人还不知道。

今天一条视频告诉大家,头肯分销还能不能做?怎么做?头肯分销的存在是因为其中有一个必不可少的作用,就是承上启下,承厂商之上,起用户之下。而分销渠道直接决定了你的运营上限,选错渠道不仅效率低下,还可能触碰各类行业风险。 本期视频通过四大板块完整拆解头肯分销到底是什么,大家可以点赞收藏,以免找不到。 第一部分核心逻辑, top 分 销的底层逻辑就是上游对接高性价比渠道,下游对接需要程序开发、代码生成,或者一键慢距的开发者或者团队,赚取其中的差价,这就是核心的玩法。 那选择渠道该考量些什么呢?筛选渠道主要看三大核心维度,第一,稳定性。第二,渠道价格。第三,结算方式。稳定性无需多言,是能否长久运营的首要条件。第二,渠道价格也是绝大多数人都踩过的坑,那就是只对比资源单价而忽略渠道来源, 相当于忽略了致命的隐形风险。第三,结算方式一定拒绝先行垫付,一旦平台爆雷便血本无归。那知道怎么筛选渠道?我们来对比一下。主流的三类渠道分别为官方、直联、聚合平台以及分销商,三种渠道各有优劣, 直联的官方渠道优势在于没有中间商,但是套餐固化,服务单一,定价统一。第二种聚合平台优势在于支持全网的模型一键调用,适合规模化运营,资源覆盖面广,适配中小创业者,不过会有一点技术门槛。 最后一种就是偷啃分销商,优势在于上手简单,对接省心,不过劣势也比较明显,在于资源层级受限,需要依赖上游,大家按需选择即可。那视频最后给大家出一个避坑小指南, 新手小白在保证渠道稳定性的前提下,小成本测试积累客户刚入行切记不要急于求成,有固定客源以后要做好售后服务,并且要抱有一个长期主义者的心态。我整理好了几个运营稳定的渠道清单, 以及各类渠道优缺点,评论区留言 ai 直接获取。好啦,我是小爱,下期视频再见,拜拜喽!


想了解 token 工厂是怎么做的,今天给你拆解以下关键步骤,简单易懂,小白也能快速 get。 首先是选 token, ai 用的 token 和电力可不一样,电力是标准化的,谁产的都差不多,但 token 是 智力单位,不同大模型产出的 token 差异大了去了。有的聪明,有的稍弱, 有的擅长编程,比如 cloud code, 有 的擅长做视频,像 vo, sora 还有 cds。 还有的在软件工程方面很厉害,比如 g l m。 这里得注意,像 g p t, cloud gemini、 豆包、 minimax 这些闭源模型,就算你有 ai 服务器也部署不了, 只能选开源大模型,比如千问 deepseek、 g l m 来生产销售的性价比了。 再说说运营,销售主要有三种方式,一是把 token 上架到分发平台,比如 openroot, 直接在上面开店就行。 二是让云服务商代卖,不过这种得交不少费用。三是自己去找渠道,向高校、影视、动漫公司这些地方分销。要是你觉得这些内容有用,就点个赞,关注一下,我会持续更新 token 出海的那些事,也会提供相应的技术支持服务哦。

哎,兄弟们,说个好生意啊,这应该是大家最关心的啊, token 中转站,那我们已经做了半个多月了啊,昨天是两万多,前天是一万多,而且可预期的未来几个月啊,我觉得会越来越多, 那最近应该很多人都听过这个项目吧,那你们可以上网查一下啊,做的人越来越多了啊,今天这个视频就给你们拆透啊,记得点赞!先给大家讲一下什么是 tok 啊,这个可以理解为 ai 时代的话费 啊,大家都用 ai 吧,不管是这个豆包呀,还是最近比较火的这个小龙虾,你让 ai 干任何事, ai 都要去思考, ai, 只要思考它就要消耗一个东西,就叫算力啊,也就是这个 token, 那 token 这个东西呢,它有贵的,有便宜的啊,便宜的像呃, deepsea 啊,非常便宜。那贵的 你们要知道,这个地球上现在最强大最顶级的三个 ai 啊,这个拆的 gpt 啊,可洛的啊,金迷你啊,非常厉害啊,但是也非常贵,让我昨天啊,我充了一百块钱,二十分钟就用完了, 并且呢,像可洛这家公司,他们的算力那不让中国人用,哎,你给钱都不让你用, 呃,你要偷偷买,给你封号。于是呢, tok 中转站这个项目就出现了啊,给你们讲一下啊, 首先呢,嗯,搭一个中转站,就是一个网站,这里边呢,把现在目前世界上主流的这些 ai 算力模型啊,全部都接入进来,像什么豆包呀, deepsea 呀,迷你 max 呀, cloud 呀, gpt 啊啊,都接进来。然后呢,呃,从这个中转站再开出很多个小接口啊,干什么呢?卖给普通用户。 呃,那这个中转站里边的 tucker 从哪来呢?去上游刚才我说过的那些公司啊,从他那去购买,那有人要问,呃,你从这边买了算力啊,再卖给这边,你图啥呢? 来,我给你们讲一下啊,这里边的商业逻辑。那首先呢啊, token 的 充值,它跟话费一样啊,有两种方式。第一种呢,叫 余额充值,什么意思呢?呃,就跟你话费一样,那我充一百,那我打电话打一分钟,你扣我几毛钱,直到扣完为止啊,这是第一种。 第二种呢啊,就叫套餐,包月套餐,比如说我一个一个月二十五十一百啊,我不用也是这么多,我二十四小时的用也是这么多啊,这个大家应该能听明白吧啊 top 肯他也是一样的。还有两种方式,一种是你买多少用多少扣多少啊,一种是包月。 那于是呢啊,这个中转站这个项目是怎么做呢?先去上游买套餐,那比如说 cloud, 那 买个一个月二百美元的套餐,那接入到我的这个中转池里边 啊,相当于从人家的公司接了一个粗管子,对吧?你二百美元一交啊,他就能这个接一个粗的这个管子啊,你这个你要用,你相当于把水龙头打开,你用不用一个月,反正都是这么多。 然后呢,他在中转站里边啊,搭了一个叫耗池啊,也就是你可以理解为一个蓄水池, 又从这个蓄水池呢开了很多个小管子啊,就是我刚才说的卖给普通用户的啊,普通用户从这边充值 啊,你说充一百充二百,你用多少从你这扣啊?这边呢,反正就一个粗管子,一个月二百美金。哎,你们讲一下啊, 拿可乐举例子,目前是这样啊,二百美金的啊,目前啊,二百美金的套餐啊,能拆出两千四百美金的 套,肯卖掉啊,十二倍啊,这是其中的一种方式啊。啊,第二种按扣,这个我就不在这里说了啊,你们懂的人就懂啊。第三, 以次充好。哎,就是这边我给关,我给这个,这边我给普通用户讲啊,我卖的是 cloud 啊,实际上你用的时候给你参一些啊,好了,我就不多说了啊。然后呢?现在这个 token 的 市场是什么样的? 供不应求啊?就是你只要有这个优质的 tucker 不 愁卖,那就跟你手上有周杰伦的演唱会门票一样,你只要敢说你有,哎,你不管有多少都有人去买。为什么呢?因为 tucker 的 生产需要两个东西,一是电力,二是 啊显卡啊,就是英伟达的显卡,而这两个东西目前在地球上都是饱和的啊,你电,现在地球上电已经不够了,因为 ai 行业第二啊,显卡啊,你显卡这东西不是说造就造的啊,他这个生产是很慢的 啊,所以现在 top 肯的需求量暴增,导致一直都是优质的 top 肯都是 供不应求的。哦,刚没说完,这个中转站里边啊,他不是接入了很多个这个模型啊,每个模型都去买包月套餐啊,然后灌入到这个水池里。 呃,那用户呢?充充值,你比如说充一百,他想用哪个模型用哪个模型啊?比如说我做复杂任务的时候,我选择这个。呃,高级的模型 啊,他做一些简单的任务,手也可以切换到这个便宜的模型,每一个模型的每一次调用的这个价格都是不一样的,因为现在很多公司以及个人啊,都在用这个 ai 当动力工具 啊,你们想一下,以前啊,能把啊这个高频消耗品、必需品加长期复购品融合到一起的产品有哪些啊?烟电 水啊,这个能源啊,这在以前啊,都是垄断的啊,好了,我就说这么多啊, 呃,但为什么这么多人在做呢?那我这两天看新闻,特朗普、孙雨辰 啊,这个中国移动啊,都开始做这个。呃,纷纷入场,并且呢 这个生意是没有门槛的啊,没有技术门槛,唯一的门槛就是信息差啊,你知道他不知道啊,所以你做他没做啊,就是这样说一下这个中转站的搭建啊,你要会搭你就自己去搭 啊,不会搭可以让龙虾啊给你去搭一个啊,再不计你可以去代理一个。呃,人家,呃,这个中转站的分销渠道,你比如说像我们这个中转站,我们现在一共开放了六百多个。呃,这个 分销渠道啊,这个我们这几天已经放出去一些了,我估计要不了多久这六百个我也就放完了。 好,这个项目就拆完了啊,我觉得已经讲的非常细了啊,大家如果听懂了,对你有帮助啊,可以给主播点一个点赞。好吧,那有问题我们评论区见。

很多人一直搞不清楚, token、 算力、大模型、 ai 应用,它到底之间是什么关系?今天给大家一条视频讲清楚啊。首先第一个啊,我们要明白 ai 服务器它是怎么来的, 一块芯片配上了主板内存硬盘,把它组装起来就成了一个 ai 服务器,这个是按整机来卖的,所以这个叫硬件贸易。然后第二个呢,叫裸金属服务器租赁啊, 把服务器批量放进这个 a i d c 通过通电组网之后,然后直接按台按月对外出租行业呢,把这个叫做裸金属租赁。然后第三个呢,就叫做算力出租, 那单台服务器效率有限,云厂商呢,通过调度系统,把大量的机器进行整合虚拟化,形成统一的算力池,然后按照它的运算量、使用量来计费,那这个才是真正意义上的叫做算力出租。然后第四个呢,就是大模型和 token 啊,这个是 ai 企业首先是一托于算力池,给这个大模型的,为海量的这个数据来训练它。那大模型呢,是没有办法直接识别文字的,它会把文字转换成一串数字的编码,所以这个就是 token 啊,一个汉字呢,大概是零点六到零点八个 token, 那 它其实是模型问答服务的唯一结算单位啊。最后一层呢,就是 ai 应用和出海了,这个是大家关心最多的啊, 原生的大模型呢,它是只能通过代码来调用,普通人你是没有办法直接来去调大模型的, 那工程师呢,会把大模型封装成 a p p 或者工作流或者小程序,这个就是我们日常在使用的这个 ai 应用,比如说像豆包啊,元宝啊啊,目前呢,有些版本它是免费的,那其实这些都是平台自己掏腰包采购 token 来补贴用户, 那多数的第三方的 ai 应用呢,都是需要用户你自己去买这个 token 的, 所以由此就诞生了 token 交易, token 工厂。然后呢,再依靠国内电力成本的优势,就有了大家在关注的叫 token 出海啊,一句话来总结一下,就是大模型呢,它是个主体, token 呢就是流通货币,那 ai 应用呢,它是最终的一个产品,那 token 出海呢,就是国内算力优势延伸出的一个新商业机会。

我拿到小米二十三亿 token 的 时候,其实是有点懵的,不是兴奋的那种懵事就这就这也能过迪那种懵?这个是 max 套餐的十六亿,这个是 pro 套餐的七亿。先交代一下背景,小米最近搞了个活动, 叫咪蒙 over 的 百万亿 token 创造者激励计划,三十天免费送一百万亿 token, 最高给到 max 上十六亿 cash, 等值六百五十九块钱。 这个话题已经有很多博主写过了,活动也快到尾声了,五月二十八日截止,还剩不到一周,按理说不该再蹭了。但我之所以还是写,是因为我发现了一个特别简陋 特别巧的方法,几乎百分之百能拿 max 档。这个方法我一会儿说,先把活动本身聊透。咪猫是小米自研的大模型,最新版本 v 二点五 分两个模型, pro 版面向复杂任务深度适配 a 剑客和编程,在 gdp v a l a a 和 clever 榜单上开源第一。还有一个是全模态版,文本、图像、视频、音频都支持 v 二点五, pro 用的 mo 架构,总参数三零九 b 激活十五 b, 原声支持一百万 to k 上下文推理成本只有国际币源旗舰的百分之二点五, api 定价大约是国际竞品的五分之一。 你可能觉得这不就是个国产模型吗?但坦率地讲,这次小米的成绩确实够硬。 texturina 全球综合第五, labyrinth 全球第四。 open route 上周以百分之三十多的试战率登顶第一 周条用量四点八二万亿 token, 而且它是开元的 mit 协议商用自由。说真的,全球前十开元模型里,中国占六席, 小米是第一个登顶开元榜首的手机厂商回到活动,这次 over 的 计划分两部分,一部分是面向开发者的百万亿 toc 创造者激励,另一部分是面向 ainc 框架团队的生态共建。我们聊的是前者,申请流程不复杂,去 mimo 填个表单,三个工作日出结果, 通过后邮件通知、登录开放平台等权益到账就行。但很多人卡在评估这步,拿到的是赠金,而不是 tiktok plan 或者档位很低。网上常见的建议是要写详细的项目描述,要有 github 链接,要做完整的项目, 有些教程甚至建议你前后端数据库齐活,搞得跟融资 b p 似的。我一开始也这么想,然后我发现了一个更聪明的路子,就是只做一个前端,一个用歪不扣定搞出来的非常非常厉害的前端不需要,后端不需要数据库,不需要部署上线, 就是一个纯前端页面,但视觉要炸,交互要丝滑,让人点开第一眼就觉得,卧槽,为什么这招管用? 你想啊,评估的人一天看几百份申请,大多数是 github 仓库链接和 api 文档,他点开一个仓库可能还没看完 readyme 就 关了,但你给他一个牛逼的前端,点开就是成品,视觉冲击力直接拉满,谁都能一眼看出来这东西好不好。后端逻辑写得再复杂, 评估的人不懂你的业务逻辑啊。但一个漂亮的页面,不需要专业知识就能判断质量。我自己 pro 档就是这么拿到的项目就一个纯前端页面,没写一行后端代码。我朋友按照我的方法拿到了 max 档。 噗儿当倒是我实打实拿作品申请的,自己写的 app, 还有几个 skill, 两者加起来一共二十三亿 token。 再说一个很多人踩的坑,一定要先注册好小米账号,绑好邮箱和手机号,申请表里填的邮箱必须跟小米账号绑定的邮箱一致, 如果不一致,或者你用的是手机号注册的账号,没绑邮箱,通知邮件根本发不到你手上,全一批了你也拿不到。 我一开始就翻车,在这折腾了好久才搞明白。所以正确顺序是先去小米官网注册账号,绑好邮箱,然后再去申请。操作上也不复杂,用 cloud code、 科斯尔或者任何顺手的 ai 编程工具,让 ai 帮你 vibble 扣度一个炫酷的前端页面,重点放在视觉效果和交互上,动画动效,享意识布局,这些能让页面看起来很贵的东西。多搞深情表里,把截图放上去, 项目描述写清楚,用了什么工具,做了什么功能,解决什么问题,就这样。最后说说这个 tucker 值不值得薅。 mmo v 二点五 pro 的 编程能力,我自己用下来的感受是比我日常用的 g l m 五车报强不少,跟 g l m 五点一比也差不了太多。 a p r 能直接对接 cloud code 浏览器, oppo 跨这些主流工具。十六亿 tucker 免费活动五月二十八日截止,池子部等人免费的羊毛,而且是比较厚的那种,不薅确实亏了。

一百六十四点五一亿,这是中国电信刚刚发起的中国第一个以 token 工厂命名的百亿级采购项目。这个词, token 工厂。 二零二六年三月,英伟达黄仁勋在 gtc 大 会上第一次提出,到现在才两个多月。但今天 a 股已经有超过二十家上市公司宣布入局,三大运营商全部推出了 token 套餐。 中国电信的定价,个人用户每月九块九一千万, token 开发者每月三十九块九一千五百万 token。 这期视频我用七分钟跟你讲清楚三件事, token 工厂到底是什么?为什么?这个模式正在重塑整个 ai 产业,以及对你、我、对投资者,这意味着什么?我们先说一个非常本质的变化, 过去几十年,我们建数据中心是为了什么?存数据、跑网站、做云计算,本质上它是一个仓库,你把数据放进去,需要的时候取出来。 但黄仁勋在 gtc 上说了一句很颠覆的话,他说未来的数据中心不再是存储文件的仓库,而是生产 token 的 工厂。他还有一句更直接的, 计算能力等同于收入。 token 是 什么?你可以把它理解成 ai 世界的基本粒子、 ai 模型,不管是写一句话,识别一张图,还是生成一段代码, 本质上都在处理 token。 就 像工厂用原材料造产品一样,未来的数据中心输入的是电力和数据,输出的就是 token, 也就是 ai 的 智能。这个转变的核心是什么?过去数据中心是成本中心,花钱维护 token 工厂是利润中心,每生产一个 token 都在创造价值。这就好比一百多年前,电刚发明的时候,每家工厂都得自己装发电机。后来呢,出现了专门的发电厂,电变成了一种标准化的商品,按度计价。 现在, token 正在走完全一样的路,从自己驯模型自己用,变成像买电一样买智能。好概念讲清楚了, 但真正让资本市场兴奋的不是概念本身,而是三件事在同一年撞在了一起。第一件事,需求结构变了。以前是训练为王,大家都在比谁的大模型更聪明。现在是推理主导。 二零二六年, ai 推理算力需求已经是训练需求的四到五倍。什么意思?以前大家花大钱把模型训出来,现在是真有人在大量使用这些模型了。推理需求一上来, token 的 消耗量就爆炸式增长,数据说明一切,推理算力的租金价格半年涨了接近百分之四十。 第二件事,商业模式跑通了。五月十七号,中国电信在全国推出了商用的 token 套餐,个人每月九块九就能用一千万个 token。 这是什么概念?意味着 token 已经从一个技术概念,变成了一个能扫码支付的商品。中金公司的计算更刺激, 自建 token 工厂理论毛利率可以达到百分之六十,海外头部模型厂商的毛利率已经做到了百分之四十到百分之五十。 这个利率是什么水平?比绝大多数制造业都高。为什么利润这么高?因为 token 工厂一旦建好,每多生产一个 token 的 边际成本几乎为零,它天然是一个规模效应极强的生意。第三件事,中国玩家跑步进场。 东方财富 choice 的 数据显示,截至五月二十三号, token 工厂概念板块已经有超过二十家 a 股公司主动批露了相关布局。润建股份宣布把五项云股智算中心向 token 工厂方向升级, 红信电子联手无锡高新区,用华为、升腾、三八四超节点算力集群来建 token 工厂。三大运营商电信、移动、联通全部推出了 token 套餐。 从概念提出到产业落地两个月,这个速度在科技行业非常罕见。我知道很多观众最关心这个问题, token 工厂这么火,跟我的投资有什么关系?我不见股,但我给你一个分析框架, token 工厂这个赛道从上到下可以分成四层。第一层,算力基础设施就是建工厂的人、运营商、算力租赁公司、制算中心,他们投钱建机房、买芯片、搭集群,然后对外卖 token。 这层的逻辑是,谁先建好,谁先赚钱。第二层,硬件供应链、 ai 服务器、光模块、液冷高速 pcb, 这些都是 tok 工厂的生产设备, 你想建工厂就得买设备,这层的确定性最强。第三层,芯片, gpu、 ai 加速卡,这是 tok 工厂的发动机,华为升腾、韩五 g、 海光 国产替代,是这层最大的固式线。第四层,应用和生态 token 成本降下来了,谁会受益?所有用 ai 的 公司,从自动驾驶到智能客服,从药物研发到游戏开发, 这层空间最大,但不确定性也最高。框架给你了,你可以对照着去研究。但有一条核心逻辑我帮你拎出来。 token 工厂的本质是把 ai 从奢侈品变成日用品,谁的 token 越便宜、越快,质量越高,谁就能赢。所以你要关注的是那些在降低 token 成本这件事上最关键的环节。最后,帮你回顾一下今天的三个核心结论。 第一, token 工厂不是概念炒作,它已经从一个技术词汇变成了一个能扫码付费的商品,而且毛利率高达百分之六十。第二, ai 产业正在经历一次根本性的商业模式改革,从卖模型变成卖智能,就像一百年前,电力从自备发电机变成了电网。 第三,产业链上中下游都在受益,但确定性最强的是卖铲子的,给 token 工厂提供硬件基础设施的环节。 如果你觉得这期内容对你有帮助,点赞、关注、收藏,因为这期内容值得你以后拿出来对照着看,也欢迎在评论区告诉我,你觉得 token 工厂这个赛道哪个环节最有投资价值,我每条评论都会看。

有一个做企业的学员问我,汤姆,如果我想做一个托管工厂,这个投入大概要多少钱?我给他算了笔明摆账啊,你们听听看。比如你只想做一个迷你的托管工厂,弄台五零九零的显卡,这个价格大概在三万左右,每分钟呢,能产二十万左右的托管。 但如果你想做一个小型的托管工厂,想冲到每分钟有一千万左右的产量,那么这个时候就得六十四台的五零九零或者是八台的 b 三百,这个的投建费大概是在三千到五千万之间。 然后如果是我想做一个中型的工厂,每分钟的产量要达到五千万左右的产量,那么这个时候就得六十四台的 h 两百,或者是三十二台的 b 三百的这种,那这个设备的投入资金呢,大概就是两个小目标起步。 如果是大型投客工厂的话,每分钟产能要过亿,那么就得一百二十八台的 h 两百,或者六十四台的 b 三百了,这个投建费就得四个小目标起步,更不要说去建一个巨型的集群工厂。千台的这个 h 两百或者是五百多台的 b 三百,那么这种它每分钟的产能差不多在十亿左右, 这个投入大概是在八到十万左右。 b 三百的话呢,大概每个月是十六到十八万,而且这还是上个月的价格,所以这个租金大概就能劝退百分之九十九的人了。这个行业他明面上呢就是算力,规模越大 托克你的溢价呢就越高,平摊下来的运营成本呢就越低,而且你还能给大的厂商去稳定的供货,但是呢,反而你这个工厂的规模越小,你的设备稳定性呢就越高,销路呢也特别的不稳定。 所以你们觉得普通传统企业入局 ai token 生意,做这个 token 工厂的生态站位对吗?应该站在哪个环节呢?评论区留下你的看法。