你有没有想过, cursor 和 cloud code 变慢,可能不是模型不行,而是 windows 终端正在给他喂乱码。你看这些中文输出,只要一乱码, ai 就 会误判,重试绕路, 最后浪费的不是一点 token, 而是诊断排查效率。来,我给你演示一下真实过程,你让 cursor agent 执行一个命令,他调用 powershell 返回中文,结果但是中文全变成了乱码, agent 看不懂就会重试,还是乱码就换个方式再试。 每一次无效返回, ai 都要把乱码重新带进上下文理分析,这不是多花几千 token 的 问题,而是无效信息会越堆越多,响应越来越慢。 cloud code 也一样,它调用 shell 执行命令,返回的中文全是问号和方块。原因很简单, windows 的 powershell 默认用 g b k 编码输出中文一个中字, g b k 用两个字节表示,但是 cursor、 cloud code 这些 ai 工具期望收到 utf 杠八 同一个中字,在 utf 杠八里用三个字节,两边编码不一样, ai 把 g b k 的 字节当 utf 杠八来解码,自然就变成了乱码。而且问题不只是看着难受,你的每一次交互都在多传无效数据给大模型。修复方法,只要三行代码打开 power shell 输入 notepad 空格 dollar profile, 在 打开的文件里加上这三行第一行,让控制台输出编码也改成 utf 杠八。 第三行 chcp 六五零零一,把整个代码页切换到 utf 杠八,保存关闭。下次打开终端, coser 能看懂了, cloud code 也能看懂了,不再乱码,不再重试,不再浪费 token 来看,对比修复前, ai 每次执行命令都在和乱码做斗争,多花 token 响应变慢,修复后输出干干净净,一次成功少走很多弯路。 如果你用 windows pro cursor 或 cloud code 这个设置,建议先改掉它,不炫酷,但非常实用,因为 ai 编程助手的效率很多时候就卡在这种不起眼的环境细节里。
粉丝6645获赞8664

上期视频讲董王后台一直有问我两件事情,最近孙哥的 b a i 到底能不能用小白自建中转站,到底靠不靠谱,今天就跟你说清楚。因为这两条路我都研究过,也经过太多人在上面交学费。先说 b a i, 他 打的还是 平差价用 gpt, 我 理解这个吸引力听起来比很多中转站都良心,但已经有人测出来了,折扣是真的,但里面有个记费项,价格比官方贵了将近十倍,相当于左手给你打折,右手又悄悄加价,账单算下来根本就没有省到钱。加上 bia 整个生态跟孙宇辰的加密圈是深度绑定的, 平台的风险跟他个人的信誉是连在一起。这条线上出过太多事情了。不用我多说,我的结论就一句话,看折扣之前,先把每一项的单价都算清楚,然后说自荐想自己搭。我太理解这个冲动了,但说真的,自荐踩的坑一点都不比用孙哥的少,只是死法不一样而已。 而且有个最现实的问题,完全不懂技术的人根本搭不起来。密钥管理,并发症,防攻击,随便哪一个没搞好,建完就是摆设。我见过太多人建完跑不起来,或者跑了三天就崩了。合规上用官方密钥对外提供服务,违反的是平台条款,查到了轻则封闭密钥,重则封账号。现在查的是越来越严, 服务器代发还要持续烧钱,普通人大概率入不付出。自建这条路不是不能走,而是做好准备再走,想省事的找一个靠谱的县城给他用就行,不用什么都自己扛。所以不管是县城还是自建,核心就一条,别被便宜和冲动冲昏的头脑。我在这一行待了够长的时间,踩过的坑不少。关注我,下期继续说干货。

这几天有一个非常值得关注的新信号,中国电信、中国移动、中国联通三大电信运营商相近,面向西端推出了 token 套餐,那上海移动甚至是推出了一元四十万 tokens 的 套餐,而且呢,支持一个额度一个价格任选模型。那这是什么意思呢? 过去咱们买的流量套餐,比如说多少 g 流量,多少分钟通话,但是现在呢,运营商开始试水一种新的 token 套餐。也就是说,未来我们 呃在使用 ai 大 模型的时候,可能不再是单独的去买一个模型平台充值了,而是像买手机流量一样,直接买 token 额度。那这背后反映出来的是,三大运营商正在从过去的流量经营逐步转向 token 经营。 如果 token 算力套餐化这件事情跑通了,那它很可能会催生一批新的 ai 基础设施公司,这也说明 token 经济正在加速进入下一个新的阶段。当前市场正处于一个非常关键的窗口期。从过去的算力租赁逐步上 token 工厂, toker 运营商切换,为什么焦点会开始转移呢?从商业逻辑来看,焦点有望逐步的导导到 toker 工厂以及 toker 运营商。核心原因呢,主要有三个。第一个原因呢,是商业模式升级带来的估值重供。 那过去的算力租赁本质上更像是出租 gpu 服务器,收固定的租金,那这种模式 虽然现金有稳定,但估值通常不会特别高,一般呢就是给到十几个 p e 来定价。但是 token 工厂不一样, token 工厂可 不是简单的出租机器,而是把算力模型推理优化、 api 调用能力整合起来,最后按照用量分成,那 token 工厂的毛利率可以达到百分之五十以上,并且具备更强的平台属性 以及技术含量,因此呢,它有机会享受更高的 ps 估值。那第二个原因是海外已经开始有验证了。 那海外现在呢,已经出现了几个非常典型的对标公司,比如 callif, 它呢,主要代表的是算力租赁模式, 也是通过大量的 gpu 资源为客户提供算力服务,市场已经给了他比较高的定价啊。再比如 nebules, 它呢,原本也是和算力服务相关的,但是 现在通过收购 egen ai 啊,强化推理优化能力,开始向 token 工厂方向转型。还有 together ai, 它也是 token 工厂方向的重要代表。那 openroot 更像是 token 运营商,它把很多的模型把它聚合起来,让用户可以通过统一的入口调用不同的大模型。 openroot 最新一轮的估值大概去到十三亿美元。 这说明呢,在海外市场,算力租赁、 tok 工厂、 tok 运营商这三类角色已经开始逐渐形成比较清晰的产业路径。那第三个原因呢,是国内催化剂开始密集出现。 从五月以来,国内出现了很多起重要事件,比如说最近这几天运营商推出的 tok 套餐啊,中国电信启动一百七十四亿 tok 工厂集彩, 无锡建设、华为升腾 token 工厂,建润股份,以和字节签订 token 分 成合同。那这些呢,说明 token 你 不仅仅是概念,而是从这个预期走向落地。 也就是说,市场过去关注的是谁有 gpu, 谁能够出租算力,但是接下来市场会更加关注,谁能够把算力变成 token 服务,谁能够把 token 服务卖出去,谁能够形成平台化的入口? 接下来我们看海内外的对标。那第一类是 i d c 公司,海外的代表企业有 equineous, digital wallet 啊,还有万国数据。这这类公司的核心特征是大规模数据中心运营,长期稳定租金收入,那 重资产属性非常明显。国内的对标企业包括润泽科技,万国数据,四季互联啊,数据港,官邸,新网,还有大卫科技。那这些公司呢,更偏向传统的 idc 以及数据中心运营。主要逻辑是数据中心资源啊,机房机柜, 电力和网络基础设施。那第二类呢?是第二类呢,是算力租赁公司。海外代表企业包括 call with nebules, 还有 apply digital。 算力租赁,这一类公司的核心特征是裸 gpu 租赁,通常呢要签三到五年的合同,这种资产属性非常强。 呃,行业格局非常集中。那国内对标企业包括协创数据,红景科技、利通电子、节创智能,那这类公司呢,目前主要还是围绕算力资源、服务器、机房、客户订单和租赁模式展开。那第三类呢,是 token 工厂,也就是重资产生产端。那还会代表企业包括 knabels, together ai, firework ai 以及 call with。 这里要注意的是, call with 虽然呢起点是算力租赁,但是它也可以往 token 工厂方向延伸,所以我很看好它好。 together ai 呢,是 token 工厂的重要代表, 那 token 工厂呢?这类公司的核心特征是自己有算力,同时呢跟模型公司来进行分成, token 的 比例分成大概是三比七,八比二,也就是说它不是单纯的出租 gpu, 而是呢, 利用这个收入分成,这类公司的毛利率可以达到百分之五十。种技术壁垒,种这个推理优化能力,种平台的交付能力。国内对标企业包括润健股份、品质信息、红杏电子、 呃,商汤软件、云天利飞。其中呢?尤其是润健,它的 token 工厂模式是率先落地。那第四类呢?是 token 运营商,也就是轻资产聚合平台。 海外的代表企业主要有 openroot。 那 它是全球最大的 token 运营平台,它的 a p i 接入了所有的主流模型,并且采用 按照充值金额收取百分之五点五平台费的模式。啊, token 运营商的核心特征呢,是不自持算力,主要是做分发聚合和技术路由服务。那这种模式是轻资产,高成长,更适合 ps 估值。那国内目前呢,还没有对标的 企业。国内更接近的角色包括华盛天成、力昂技术以及一点天下未来呢?呃,这个运营商 mars 平台,以及阿里的 a t h。 呃,电信的 token hop 可能会承担一部分 token 运营商的角色。 那为什么这件事情值得大家重视?因为它背后其实代表的是 ai 基础设施商业模式的变化。 那第一个阶段呢?市场关注的是 idc, 谁有数据中心,谁有机柜,谁有电力,谁就有价值。那第二阶段呢?市场关注的是算力租赁,谁有 gpu, 谁能够拿到英伟达的芯片,谁就能够签下大客户,谁就有价值。 那第三阶段呢?市场开始关注 token 工厂,也就是谁能够把 gpu 算力服务、模型推理优化、 api 调用 整合起来,按 token 用量来赚钱。那第四个阶段呢,就是 token 运营商,也就是谁能够啊,成为 ai 调用的入口,谁能够聚合更多的模型,谁拥有更强的分发能力,谁就有可能成为 token 经济时代的 平台型公司。所以呢,这不是简单的算力故事,而是从卖算力到卖 token, 从租机器到运营 ai 流量的变化。 我们来总结一下,三大运营商推出 token 套餐呢,不仅是一个简单的新业务,而是 ai 基础设施商业化模式的变化信号。那过去我们看的是 idc, 看的是机柜,看的是 gpu 租赁,那接下来呢?市场可能会越来越关注 token 工厂以及 token 运营商, token 工厂负责把算力加工成 ai 调用服务,而 token 运营商负责把不同模型和 token 能力聚合起来,卖给开发者、企业以及 c 端用户。 当 ai 调用像手机流量一样被套餐化之后,谁掌握 token 生产力,谁掌握 token 分 发入口,谁就有可能在下一轮 ai 基础设施重估中占核心地位。 那所以呢,当前正处于算力租赁一项 token 工厂 token 运营商切换的初期窗口,那这一轮变化值得 我们持续,最终大家可以重点关注具备大厂绑定能力啊,推理优化能力的 token 工厂,以及具备平台化潜力的 token 运营商。以上就是本期的所有内容,我是派我们下期继续聊。

你可以把它理解成一个小型 ai 机房,区别是它不用机柜,不用云服务器,只是一台放在办公室里的 macbook。 所有工具要用模型的时候,先来这里领 token。 哈喽,大家好,今天我们继续折腾这一台六十四 g 的 内存的 macbook。 上一期我们聊了为什么我会买一台 mmax 六十四 g 的 macbook 用来跑本地大模型。 但是啊,如果只是我自己一个人用,那其实还没有完全发挥它的价值。所以今天我做了一件更实用的事情,我把这一台 macbook 啊 这套架构里面, macbook 负责跑模型和统一转发请求管理系统负责记录是谁发起调用,用了多少上下文,生成了多少 token, 速度是多少。前面的 openclhermes dx 其实都只是客户端部署成了一台局域网里面的本地大模型服务器。什么意思呢? 就是以后不是每一台设备都自己去跑模型了,而是统一用这一台六十四 g 卖布在后台提供的 token。 局域网里的其他电脑工具 agent 都可以通过 api 来调用它。同时,我今天还部署了一套本地大模型的管理系统,它可以统一管理本地大模型 api 调用 to 肯用量或它的速度表现,上下文限制,还有访问权限,都可以进行统一的管理。 现在我已经接入了几个本地的一个服务, open cloud, hermes, 还有 cloud code 啊, 我最看重的不是能不能跑起来,而是跑起来之后能不能被管理。以前本地模型像一堆散落的工具,现在它变成了一个可观察的服务 模型,原调用、日制访问密钥、错误率都在一个面板里啊,真正落地的时候,接入流程其实很简单,模型跑在这台 macbook 上,管理站对外提供一个兼容 open ai 的 接口,局域网里的工具,只要把 base u i l 改成这台机器的地址, 再换成自己的访问 key, 就 能开始使用本地 token。 而且这样我就很清楚地看到谁在调用模型,用了多少 token, 速度是多少上下文有没有超限制?这个东西对小团队和工作室其实是非常有用的,因为你不一定 需要每一个人都买一台高配的机器,对吧?也不一定所有任务都走云端, api 放在办公室里,让他二十四小时提供 本地模型的服务。小团队用它的好处非常直接,设计、剪辑、运营、开发。每个人都不需要单独配一台高性能机器,也不需要把所有资料发到云端局域网里,有权限的人拿自己的 key 调用同一套本地能力。 这里最关键的不是把 key 发出去,而是每个 key 后面都有边界,哪个客户端能用,哪个模型,能不能访问长上下文,出了问题能不能立刻停掉,这些都应该在管理层完成,而不是靠口头约定。那我们成本是什么呢?成本主要就是电费了,对吧?我们跑在本地,主要就是就是一个电费的成本 啊。还有就是这个台机器本身的成本好处也是显了异见的,那数据在本地,服务在本地,权限也可以自己控制, 尤其是一些数据安全要求比较高的业务,或者需要连续运行的项目,就很适合这种方式。 比如本地 agent, 内部自动化流程,长期运行的一个 ai 助手,甚至我们说的本地养虾,都可以从这里开始。 当然,它不是免费午餐,机器成本、电费、维护成本都还在。但对一些每天都要连续跑的任务来说,本地 token 的 编辑成本会越来越低,更重要的是,原始数据可以尽量留在自己的网络里。当然,这台机器不是无限抢啊, 因为六十四 g 内存能跑的模型、上下文长度、并发数量都是有限制的。所以后面我会继续测试这套本地托管服务到底能撑多少,设备同时使用速度会不会明显下降。 open cloud、 hermes cloud code 同时调用的时候,它能不能稳定运行啊?我也不想把它说成万能服务器。六十四 g 内存能跑的模型大小、并发数量、上下文长度都有天花板, 所以这期先搭框架,下一期我会用多个客户端同时压测,看它到底能撑到什么程度。这期先把框架搭起来,从今天开始,这台六十四 g macbook 就 不是 就不只是一个本地跑模型的机器了,它变成了我这个小工作室里的本地 ai token 的 服务站。这件事真正有意思的地方,是把个人电脑变成团队基础设施。当本地模型访问权限、 token 统计和自动化流程连在一起, 本地养虾就不再是玩具,而是一个可以持续运营的小系统啊。如果你也想看这台机器的真实上线,可以在评论区告诉我下一期怎么压测,比如三个客户端一起跑长上下文,或者让他连续二十四小时处理自动化任。

大家好,我是分享干货的薛子。五幺七世界电信日,中国电信正式推出 ai tok 包月套餐,目前该业务仅在国内部分省份进行试点落地, 尚未完成全国范围内的全面普及。移动呢,也只是进行小范围试水,暂时没有推出同类型全网通用的套餐。既然运营商正式入局推出产品,那么我们先来理清它的定价与额度标准。 电信设置了多档不同价位的套餐,其中市场关注度最高的便是九点九元个人版与三十九点九元的基础版。九点九元每月包含一千万通用通款,核算下来,每一百万通款仅需零点九九元。对比同款模型,官方输出定价 折扣低至一点一八折。三十九点九元每月内含一千五百万投款,折算每百万成本二点六六元,折合三点一七折。两款主流套餐的价格差距也十分清晰。一、多长期做算力资源的行业经验, 我们此前也专门面向高校打造过专属的算力套餐卡。经过实际价格与权益对比,不难看出,在所有套餐品类里,仅有九点九元这个入门档位优势比较突出,其余中高端档位套餐,我们自身推出的产品性价比 整体还要更占优势,价格层面的差异一目了然。而决定实际使用体验好坏的模型配置,这一套运营商 套餐选用的都是往期成熟的旧版模型,并非当下行业主流的全新顶配版本,并且这类模型大多数是开源之后由运营商自主部署搭建,即便外在标注的版本号保持一致,和原厂正统全新模型相比,在逻辑推理、 长文案创作以及整体内容输出的质感上都存在明显的差距,这也就注定了他只能满足基础使用,很难支撑高标准专业需求。正因为模型本身存在性能局限,大家最关心的调用使用方式也依旧存在诸多不确定性。目前九点九元个人版本 能否开通正规 api 接口,能不能直接对接 opencloud 这类智能体进行调用,至今还没有明确的统一定论。即便后续逐步开放相关使用通道,平台也势必会设置严格的流量管控。 再加上个人套餐本身明令偏向自用属性支持对外商用流转,自然也就无法实现大批量、高并发的稳定跑量作业。结合普通用户真实使用习惯来看, 这种使用层面的限制也进一步放大了额度浪费的问题。绝大多数人日常只用来闲聊对话、简单问题咨询,每月实际消耗 token 也就两三百万,面对千万级别的大额包月额度, 绝大部分资源都会闲置浪费。抛开表面廉价的定价,实际到手的使用性价比并没有看上去那么理想, 也只有频繁的创作文案、做个人项目调试的人群才能提升额度利率。如果用户想摆脱流量限制,实现合规商用与大批量稳定调用,就只能选择三十九点九元及以上更高档位的套餐。这类高阶套餐仅仅只是解锁了使用权限, 开放了相关管控,内置搭载的模型和低价的个人版本完全一致,没有任何性能层面上的升级优化,无法从根本上解决体验软板实际使用价值并不突出,畅眼整个 ai 算力行业, hogan 本身具备全网自由流通的属性, 不会受到地域区域的约束,这也让运营商内部的市场竞争愈发激烈。各大省级公司都在背负着硬性营收业绩指标,为了完成考核抢占市场份额,后续各个省份大概率会出台成本补贴政策,下调售价,对内形成 电信各省公司之间业务内耗,对外还要和移动同类算力业务正面角逐。其中东部经济实力雄厚的省份,依靠充足的补贴优势,很容易抢占西部省份的同类业务市场。整个行业低价内卷的趋势已经难以避免,市场格局不断变化, 也给整个偷看分发赛道带来了比较实在的影响。整体而言,对于我们渠道从业者属于利好趋势。一方面,运营商大规模线上线下推广, 无形中完成了全民 ai 算力市场科普,帮助我们省去大量用户教育与宣传推广的成本。另一方面,我们通过资源整合运营商这类合规头肯产品, 还能进一步丰富我们的货源结构,精准匹配不同层级的客户使用需求,成为我们业务布局中优质的补充资源。与此同时,行业持续低价内卷,也让普通民众日常使用 ai 工具的整体成本稳步下降, 普及广大普通用户。综合所有产品特性、使用局限以及行业发展趋势,不难得出结论,电信这类低价包月套餐,最适配的就是普通用户日常闲聊轻度体验使用,可一旦涉及规模化投垦、资源分发,搭建大型智能体项目,或是落地各类高端商务业务。 不管是模型本身的综合性能,还是各类使用权限规则,都无法达到行业落地标准,只能当做临时备用资源,绝对不能当做长期稳定的主力算力。

别再研究跑本地模型了,没有什么意义,还是花钱去买偷看吧。本来想看看这个本地模型,现在是这个千万三点五九币的,他的能力怎么样?做了个小测试啊,让他给我写一个俄罗斯方块的小游戏, 我觉得应该是个很简单的任务,写了一整天,写都写不好,各种各样的 bug 呀,然后报错呀,无法运行啊等等。用 workbody 去给他调试和修改。还是这个 workbody 比较厉害啊, 然后给这个给 hermes 安装了几个呃 skill, 然后也是有问题,然后就让这个 workbody 去给他改。 刚开始有一些问题,改的还比较不错,后来就越改越夸张,越改越乱,改来改去找不到问题出在哪里就去改我的系统代理,改我的这个 telegram 连接,然后给我改的 telegram 跟 hermes 连接不上了。改的这个,呃, hermes 调用这个浏览器调用不出来,而且这个没有网络连接了。 这 workbody 自己就在这无限的改这改那,改了一一下午也没改好,实在不行了,不用 workbody 改了,把这个问题啊,然后又发给这个呃 codex, codex 五分钟不到,把所有问题全部改好,全部解决了。所以真的别用本地大模型了, 也最好别用国内模型,真的能用这个国际模型就用国际模型。我不是专业搞编程的,我没有用过这个 cloud code, 但是就我自然语言的理解啊,就我用过的,我觉得 codex 真的 牛逼啊,还是用 codex 吧。

朋友们,今天看到一组数据,我反复确认了三遍,确认没看错。 idc 最新报告,二零二五年中国共有云上大模型掉用量达到一千九百四十四万亿个 token, 同比增长十六倍。什么概念?二零二四年这个数字才一百一十四万亿,一年时间翻了十六倍。 idc 预计,二零二六年全年 token 消耗量还要再涨二十倍,直接干到四万万亿。 如果你到现在还觉得 ai 只是个聊天工具,那今天这条视频你一定要好好听完。咱们先把这组数据的含金量说清楚。日军 token 调用量已经突破一百四十万亿,比二零二四年初增长了一千多倍。 这不是某个小赛道的增长,这是整个中国 ai 基础设施的底层需求在爆炸式扩张。国 家数据局透露的数字,日均一百四十万亿 token, 意味着每一秒钟都有海量的企业级 ai 调用在发生,覆盖了工业、金融、医疗、政务这些核心领域, ai 已经从实验室跑进了工厂、车间、银行后台、医院系统。 再看一个让人震惊的数据,火山引擎以百分之四十九点五的份额拿下了中国马斯市场第一,接近半壁江山。阿里云百分之二十七排第二, 两家加起来吃了超过百分之七十六的市场。为什么火山引擎能跑到这么前面?自洁系的产品矩阵太狠了,豆包月活三点四五亿,远远甩开千问的一六十六亿和 deepsea 的 一点二七亿。豆包一家的月活比后面两家加起来还多 三点四五亿。用户每天产生的 token 掉用量,直接把火山引擎推到了市场第一的位置, 但今天真正让我兴奋的,不是谁拿了第一,而是整个行业正在发生一个根本性的转变,从免费到收费,从烧钱到赚钱。豆包刚刚开始收费了三点四五亿,月活扛不住,算利账单,免费午餐到此结束。 智普更狠,二零二六年一季度, api 调用定价直接提价百分之四百,涨价百分之八十三,用量涨四倍。这是什么信号? 说明市场对 ai 算力的需求已经到了攻不硬俏的程度,价格弹性极低。阿里云和腾讯云也在跟进涨价, 腾讯会员的掉用量暴增十六倍,阿里云部分模型服务价格上调百分之二到百分之七。全行业都在从补贴换规模转向正常商业化运营。 这个转变背后,最确定性的受益环节是谁?不是大模型厂商本身,而是撑起这套 token 经济的基础设施。中国 ai 大 模型的周掉用量已经到了七九十四万亿, token 环北增长八十一,百分之七。 而美国大模型周掉用量才三二十六万亿,环比还在下滑百分之三十四点六。中国反超了,算力需求只会越来越猛。 光模块、液冷散热、国产算力芯片这些环节,正在从主题炒作切换到业绩验证阶段。无问新琼今天也宣布拿到超七亿融资,刷新了国内 agi 基础设施单笔融资记录。红山、北极光这些顶级机构都在压注。 但冷静下来也要看到风险。 token 调用量涨得猛,不代表每个厂商都能赚到钱。算力成本是刚性支出,如果 api 定价提不上去,或者客户付费意愿不足,烧钱模式就还在继续。 而且火山引擎一家独占近百分之五十的份额,中小厂商的生存空间会被持续挤压,行业集中度只会越来越高。 ai 商业化虽然加速了,但从掉用量增长到真正规模化盈利,中间还有很长的路要走。 核心判断, token 经济已经从概念走向规模化,实践从免费走向收费,这个拐点比大多数人想象的来的更早更猛,谁手里有算力、有用户、有商业化闭环,谁就能在这轮洗牌中活下来。 以上纯属个人看法和产业分析,不构成投资建议。你们觉得 ai 收费时代,你愿意为哪些 ai 服务买单?评论区聊聊,我们下期见。

其实最顶尖的 ai, 普通人是接触不到的,目前全球 ai 的 真正第一梯队就是中美两国,其他国家呢,基本就是边角料了。美国在顶尖模型能力上 整体上依然领先,比如美国的安斯洛匹克,他最近发布了一款大模型,叫做密索斯,他可以自主的发现一些系统的漏洞,串联起攻击链, 可以轻易攻破运行了几十年的安全系统。但是呢,密索斯他不像公众开放,他只是给了十几家机构做测试。这就带来了一个问题,像这种强 a i, 如果保持闭源,只服务于那些少数的机构, 普通人接触不到这种厉害的 ai, 那 么这就会带来一种 ai 上的不平权。 这根据清华大学教授金卫平老师讲过一组有意思的数据啊,今年年初的时候呢,美国在 token 上的调用量是中国的三点六倍,而最近呢, 中国反超了美国 token 上的调用量是美国的四点二倍。 ai 它其实比拼的不只是它本身的实力, 更是一种迭代的速度,而 token 的 调用会催化 ai 的 迭代,按照这一种你来我往的架势发展下去,中美 ai 之间的竞争还远远没有结束。

兄弟们,我们可以零托肯使用小龙虾了,这是我梳理出来的他的技术的一个底层逻辑,其实就是通过要用底层的外包 ipi 的 形式直接治好了我们的骚托肯焦虑。大家听起来可能太神奇,那么耳听为虚,验证为实,我们来实操一下,不会安装了也没关系。我们这里已经梳理出了一个很简明的一个安装指南, 然后照到上面一步步的复制粘贴就可以了,如果大家有需要的话可以在评论区留言。现在我们在做的就是第一步步骤翻译好,这里我们已经做完了。然后第二步就是配置认证,其实这里的话每一步就是一个执行命令,因为里面的脚本我们都已经做好了,直接复制粘贴就可以。 当我们执行完脚本,它自动会把一些豆包, kimi 或者 deepsea 这些的网页给我们弹开,然后我们只需要 用扫码或者是手机登录进去就完成了这个验证。第三步就是起一个浏览器代理,也就是以后我们在用的时候不需要再去用手机验证或者是扫码,国内网页端 ai 的 使用是不费拖沓的。我们来看看我们刚才大家如果登录了,登录上了有哪些的话,就在这下面填哪些序号对应的,比如说我刚才登录了有 dbic, 那 就是三 字幕清言,那就是四,还有 kimi, 选择完之后直接点击回车,一分钟之后我们可以看到好,这里全部都已经授权完毕, 然后这个终端窗口大家不要关闭,重新打开一个新的终端,这里面输入我们最后一步,也就是启动我们龙虾的 get 位,执行完毕之后,它会自动弹出我们的 opencloud 界面,然后我们用斜杠默认去看一下现在目前有哪些可用的大模型,哎,大家可以看到 这里的大模型跟我们用 api 调用的大模型的名字都不一样,它后面都是加了一个,比如说就是一个杠 web 豆包杠 web。 那我们把 openclo 装安装好了,到这个位置我们也没有配置各个大模型平台的一个 api king, 对 吧?那它自然也不会有各个大模型平台的托管计费系统向我们去扣费了。那么有少妇人的问题就来了,你这样搞的大模型能用起来吗?我们就来试一下,我们直接在龙虾的对话框里输入,我们想做一个贪吃蛇的游戏, 看他能不能正常帮我们生成出来,只过了两分钟时间,然后他给了一个链接给我们,我们点进去看一下,打开游戏,然后能正常去玩这个攀枝花游戏,说明他这个是一次性就把我们已经做好了的。通过这个小游戏的制作的话,我们可以知道这个方法既能帮我们完成一些任务,而且又不费任何的拓坑。

股友们, ai 时代最炸裂的 token 革命真的来了!以后你除了流量费和话费,还有一行叫 token 费。五月十六号,上海电信宣布正式面向用户推出 token 资费套餐,成为上海第一个卖 token 的 运营商。什么意思呢?一块钱买二十五万额度点? 以现在很火的 kimi k 二点五大模型为例,二十五万额度点相当于二十五万输入 tokens 十块钱二百五十万额度点,能让你的程序自动帮你总结一百本十万字的电子书,支持话费账单直付。 你没听错,买 ai 算力跟充话费一样简单。通过标准 a p i 接口,你可以调用三十多款主流大模型,文本的、多模态的全都有。用多少买多少,批量买还打折。这件事为什么值得你停下来认真听? 因为它意味着一个根本性的变化, ai 算力正在从程序员的工具变成普通人的基础消费品。你想想,十五年前,运营商卖的是语音分钟,数十年前卖的是流量一 g、 二 g、 五 g 包,现在它卖 token 了。黄仁勋今年三月在 gtc 二零二六大会上说了一句话, token 是 ai 时代的新大宗商品,石油驱动了工业时代一百年, token 将驱动智能时代的下一个百年。运营商从卖话音到卖流量花了十年,从卖流量到卖 token 只花了两年,这个速度说明 ai 的 商业化闭环正在跑通。如果你觉得上海电信卖一块钱套餐只是个噱头,那你看看背后的大动作。中国电信宁夏分公司刚刚发布了一个项目,叫偷看工厂生成能力、服务集中采购规模多大?含税一百七十四点三八亿元。这是三大运营商里第一个以偷看工厂命名的百亿级集 采。十一个标包服务器,六十个月标包一到标包四,每个都是十四到十五亿的规模,要求中标方三十天内交付标准。偷看生成能力, 你品品这个概念,一百七十四亿,买的不是服务器,不是芯片,买的是 token 的 生产能力。就像中石油,不是买油井,是买每天能产多少桶油。不止中国电信,中国移动四月二十一号就推出了算力 token 套餐,北京移动五点九九元次,包二十四点九九元月,包含一千万 tokens。 五月八号,中国移动还专门开了 token 运营发展论坛,拉上了腾讯、阿里、华为、中兴、科大、讯飞成立了 token 运营生态联盟。中国联通也推出了算力融合订阅套餐。三大运营商二零二六年算力投资占比提升到总资本开支的百分之三十五以上。中国电信更是直接喊出了口号,以 token 经营重塑公司业务。 这不是说着玩的,这是战略级转型,从管道商变成算力服务商,运营商的估值逻辑会被彻底重塑。你以为只有运营商在玩?大厂比谁都急。 百度五月十三号宣布,智能云的 mas 模型服务正式升级为 token factory 磁源工厂。阿里更猛,五月十四号财报电话会上, ceo 吴永明第一次公开 ai 的 收入数据, ai 相关产品在阿里云外部收入占比突破百分之三十,达到八十九点七一亿元,年化收入已经超过三百五十八亿元。包含百炼 mas 平台在内的 ai 模型与应用服务 a r r 在 六月份季度将突破一百亿元,年底目标三百亿。 token 屌用量呢?五到六月比去年十一到十二月增长了超过十倍。中金公司给算了一笔账, token 工厂在自建算力场景下,理论毛利率可以达到百分之六十, 海外头部厂商现在已经做到百分之四十到百分之五十的毛利,这个商业模式是跑通了的。说回到一块钱,二十五万 token 能干嘛?如果你是做自媒体的,二十五万 token 大 概够你用 ai 生成五到八篇两千字的深度文章出稿。 如果你是做跨境电商的,可以自动翻译处理几十个商品 listing。 如果你是学生,可以让 ai 帮你读完一学期的论文。 关键是话费账单只付,没有技术门槛,不用注册开发者账号,不用绑信用卡。这一步的意义在于, ai 的 使用权开始真正下沉到每一个普通人。以前用 ai 大 模型,你得懂 api、 懂编程,懂怎么调餐,现在跟充话费一样,这就是基础设施化的力量。 十五年前,你买的是通话分钟数,信息是按条卖的。十年前,你买流量按 j 计费,今天你开始买 token 了,按智能计费。从语音到流量到 token, 卖的东西变了三次,但本质没变。谁掌握了时代的计量单位,谁就掌握了印钞机。 黄仁勋说, token 是 新的石油,那运营商就是新的加油站。你打算好充值了吗?觉得有用,点个关注,我来讲透每一条消息背后的硬逻辑。

大家好,今天我来试用一下我老公写的这个 skill, 这 skill 是 可以减帮你减少百分之八十到九十的 token 消耗量以及运行时间。我自己有一个痛点,我有一个社交媒体 分发的分发的工具也是在在 com 代码库里,用的是 c d p 的 一个技术,但是它非常的消耗这个 token, 因为它会用到 dom d o m。 我今天在几个社交平台发,那可以看到右下角,我是运行了多次的 c d p 多平台的分发,它大概可能三到四次,它一共就有消耗了我这么多的 token。 所以 我今天来试着优化一下,我看能不能把这个技能加进去,让我的设为分发浏览器。 ok, 好, 我开启了 pro mode, 让他来让 call to code 来帮我分析一下这个透肯消耗减少的技术方案。按照这个开源代码库的方案,把我的 call form 的 社媒 c d p 分 发的功能进行一个透肯消耗量的改进。 ok, 来看 call to, 他 给我写了一个技术方案,用这个 sk flow 的 思路来优化一下 call form 社媒 c d p 分 发的透肯消耗的问题。 它现在的问题是我们的设眉分发流程,每步都经过大模型对 n 个步骤进行重复,那么每次都会读取相同的 skill 和 yam 文档。这一部分是消耗头衔,最多会消耗三千到五千个头衔,为每个平台单独做一次工具调用, 会消耗五百到一千个头衔。实际上只需要大模型判断,只有生成适配各平台的文案。所以这个 sk flow 的 核心思路的话,它就是把 maco skill 编一成状态机脚本。对,相当于我,我们这个 c d p 分 发流程中的执行 y m l 步骤已经不需要大模型了,需要大模型的只有文案生成和错误诊断。 ok, 这是他给的一个方案的架构后肯节省预估大概有百分之九十。然后我们来看一下需要修改的文件,有这些文件, ok, 可以 看一下这边关键设计决策里面,它 说第一个是一次询问 vs 多次询问,那么这次会使用一次性的询问,而非每个平平台单独询问。第二点是 control rules 作为 data 传入 ask。 第三点是 c d p 端口检测,使用脚本自动化,不使用大模型判断错误处理,也不是每次都给大模型 feel only 模式作为默认 大模型,帮你填好了射眉的这些输入框以后,等待用户手动发布也是比较符合我们的习惯,因为他有时候填的会有一些小的误差,好让我们来跳过所有的 和眉神,让他自动执行去修改这个代码,他居然运行了二十分钟,二十多分钟终于把这个我的代码库给 又画好了,那我们现在来测试一下。我还有一个 tiktok 的 视频没发,我给他发了指令,这指令有点长,是因为浏览器控制有的时候会跟你本地的环境啊,还有配置有关系,我觉得其实此时根据我自己电脑的 环境重新调整过的,大家可以看一下,他已经掌管了我的浏览器,他已经在这里有上传我的视频,开始帮我填视频的描述以及对应的 tag。 ok, 我 这里你都没有看到我的手鼠标,因为这个全都是 ai 在 操控,对他这个封面他也会自己帮我去 手动上传。好,我们回到终端里面看,他已经全部填写完成,总共耗时只有七十五秒了,所有的地方都填好了, 我们看一下这个部的托管消耗有多少,我记得之前可能一个平台要上传个五分钟左右,现在就只有七十五秒,相当于 确实节省了百分之八十多的时间。我们刚才建的四 k 浮楼是两千两百个托管,单单平台节省百分之八十,所以八个平台加起来会有百分之九十五的一个节省。

一行命令直接让你暴省几万块! apple coding 的 时候, top 是 不是烧的飞起?于是聪明的你给小龙虾丢了这样一个命令,紧接着你会发现, a 证的工具调用直接砍掉了百分之九十六, top 直接省了九成!你省的不是数字,而是实打实的饭钱! 而且不管你用的是 tree 还是 coser 还是 cloud, code 还是 code 叉,它全都能用!装一次可以持续帮你省钱!这波格局直接拉满!记得点赞收藏评论区扣一看,看你的 ai 能帮你省多少钱!

想实现 to 肯自由的,今天这条视频一定要看完,我把自己踩过的坑、总结的经验全部分享给你们,全程干货!你们平时用 open class 或者 hermes 的 时候,是不是还在调用收费的大模型? 说实话,要是让机器人一天不停运行,费用普通人根本扛不住。我一开始也试过本地部署大模型安装奥了马下载大模型,但是我的电脑 gpu 配置只有两 g, 只能用小参数模型, 可小参数模型智商又不在线,而且在奥莱姆里对话还勉强能忍。一旦部署到 open claw、 hermes 或者其他需要大模型的软件里,一句简单的问答都要等五分钟以上,复杂任务就更别想了, 所以我果断放弃了这条路。后来在 github 上下载了开源项目 ray ray free l l m, 它就是一个开源的 ai 网关工具,核心功能特别实用, 把 gemini、 grok、 mister、 roberts 这些平台的免费模型接口全都聚合到一起,还给你提供统一的 open layer 兼容接口,甚至支持自动容灾和负荷均衡,完全不用自己操心。 而且配置超级简单,就在项目跟目录新建一个 emv 文件,把你的 api key 填进去就行。重点来了, 怎么用它实现偷啃自由其实很简单,不管是国内还是国外,只要有厂商提供免费或者试用额度的大模型,你就去申请 apikey, 越多越好。 然后把这些 apikey 全部加到 relay free l l m 的 配置文件里,它会自动封装这些 key, 统一成一个接口, 要是遇到限流或者某个模型不可用,它会自动切换到下一个。你也可以根据大模型的强弱,还有多模态语言推理这些功能,给他们排个序,按顺序调用,这样一来,透肯自由就实现了。 以后玩小龙虾爱马仕随便用随便造。我自己用了好几个月,一直都正常,可能是我工作量不算大,但对普通人来说完全够用了。 最后提醒一句,如果你们是用 aaa 工具做项目开发,那我不建议用这些大模型。如果非要用很多 i d e 工具,不支持本地 url 直接内网穿透建立隧道,除此之外,日常用真的香。

我们都知道啊,调用 ai 大 模型去跑任务啊,写文案等等这些操作的话,都是需要消耗 talkin 的, 那么 talkin 呢,现在还比较贵啊,需要花钱去购买的。 那么在十五号举行的第六届啊电信科技节上面,上海电信面向上海电信用户啊,推出了 talkin 算力服务,成为上海首个发布 talkin 资费套餐运营商。 具体来说呢,一是按量来购买,一元呢对应二点五万啊,额度点,那么以 k m 二点五啊为模型去计算的话,约可支持调用二十五万 token, 也就相当于一元能购买二十五万的 token 输入。 第二呢是按需购买,就用多少买多少啊,量大则优,同时呢也支持话费账单支付。目前上海电信这边已经通过 api 接口对接了三十余款 ai 大 模型,那么购买上海电信的拓客的话,将在这三十款 ai 大 模型上面进行使用。 那么我们记得在此之前的话,国内最大的一个 ai 大 模型集成平台正式发布了啊,就是移动发布的,已经接入了三百多款 ai 大 模型了, 那么这种集成式服务将给大家带来很大的便利,它能根据你的需求去帮你调配对应的 ai, 去匹配,让你服务。

大家知道上周全球掉用量最高的 ai 大 模型是谁吗?不是 deep tech, 不是 kimi, 也不是千问,是混元三,而且它已经蝉联了两周全球第一。姚振宇加入以后,混元还是有一些肉眼可见的变化。 国内 ai 上周的钓用量是七点九四万亿,头肯是对面三点七六万亿的二点一一倍。连续两周蝉联全球第一,很多人都知道核心原因是我们的头肯成本低,但是到底有多低,估计很多人还没有概念。给大家列一个数据, ipc 个 v 四,每百万 token 输入只要两分钱, gpt 五点五大概是它的一百七十倍。 kimi 二点六,每百万 token 大 概是四美元,比 cloud 和 gpt 五点五便宜六到八倍。另外,估计大家也好奇为什么会员三能蝉联第一, 核心原因很简单,不是它有多强,是它背靠的平台用户数够多。 ai 发展到现在,核心竞争力已经很清晰了,用户数、 token 成本比短时间的技术领先更重要。

那通讯商推出 ai token 套餐业务,一个账号一次付费调研各种主要大模型,是否意味着三大运营商进入 ai 服务入口? 目前这个服务,这个 token 有 这么几个模式吧,一个运营商模式就当于他,他是自来水厂吗?相当于电厂,他就卖这个电啊,是可以相当于国家电网。 还有就是模式嘛,中间商模式相当于我,我给你提供 token 在 我的模型上跑啊,这么来消耗。相当于微信模式嘛,相当于微信,就是说白了就是流量,你自己就流量还是运营商的,大家都在使我的这个信,都都用这种 token, 顺便我再卖一道。还有 模式呢,是老贩子了啊,对吧?就比如说现在很多人就买一些那种什么谷歌的呀,这个 jammin 的 啊,用流量然后拼啊,跟你 说他买一包月,然后给十个人,这样呢,把钱又给收回来了,这种二道贩子模式,现在这种模式比较多啊,所以我们专门写一期这个文章来分析这个偷啃的事吧。我,我也在思考这个问题,现在这个模式呢,还没跑通啊,现在需要大量偷啃的人还是太少,东西 没形成消费能力啊,没形成消费能力,你现在无论是元宝啊, tic 啊,还是豆包啊这种,他还都都是免费版,大家用它来更多的呢,这还都是帮闲的,就是闲聊天。那昨天我们也问大家,形成生产力的有多少, 其实看起来没有太多形成省力的啊,公司来说呢,现在 ai 就是 省力,能赚到钱的恐怕也不太多啊,所以综合来看呢,我觉得还没到,还没到时候,更多的未来的这个行业就真的就以前能够形成省力啊,通过 ai 赚大把钱了,大把赚钱了,我觉得这个事就彻底跑通了。

ai 板块炒了一轮又一轮,到底什么才是能落地、有真实业绩兑现的真商业模式?今天这条视频给你讲透 ai 行业最新的核心赛道场景 token, 从底层商业逻辑,到全产业链已落地的核心公司,全给你扒的明明白白。 首先郑重声明,本期视频所有内容仅为行业逻辑与上市公司公开信息分享,不构成任何投资建议。 首先给大家画个核心重点,现在 token 已经有了官方统一定名叫磁源,它直接实现了 ai 掉用量的标准化计量。别小看这个标准化,这意味着 ai 的 调用终于变成了像水电一样可计量可收费的标准化商品。 目前全行业日均 token 掉用量已经达到了一百四十万亿,这个天量数字的背后,是一个正在快速爆发的全新市场。而在这个市场里,最具落地性、最有业绩潜力的不是大家听烂了的算力和大模型,而是我们今天要讲的核心场景 token。 想要抓住这个赛道的机会,你必须先搞懂 token 的 三层价值体系,我用一个所有人一听就懂的类比,给你讲的透透的。第一层,底层的算力 token 对 应的就是算力厂商,它们就像是 ai 行业的发电厂,卖的是算力,也就是电,按算力使用量收费,赚的是基础能源的钱。 第二层,中层的模型 token 对 应的就是各大通用大模型厂商,它们就像是电网公司,把发电厂的算力转化成了可标准化流通的 token, 按调用量收费,赚的是标准化流通的钱。 而最有想象空间也是当下机构资金重点关注的就是第三层、上层的场景 token, 它的本质就是把通用大模型的能力和垂直行业的私有数据、深度行业经验结合,把 ai 从需要专业能力才能用的工具,变成了开箱即用的业务解决方案。 企业不用再自己烧钱搞大模型、大算力,直接为最终的业务效果、业务效率付费,这个市场的空间远比单纯卖模型、卖算力要大得多。更关键的是,现在这个赛道已经跑出了一套成熟的、可盈利的商业模式,那就是 token 运营模式。 这套玩法的逻辑非常清晰,厂商先向大模型、大厂低价批发基础 token, 再结合自己的行业数据、合规经验、垂直领域的专业积累,把这些基础 token 加工成对应行业刚需的 ai 功能,打包成标准化的解决方案,卖给有需求的企业客户。 这套模式的核心优势就是不靠烧钱卷大模型参数,而是靠垂直行业的壁垒和服务能力赚钱, 盈利确定性更强,也是当下 ai 应用落地最核心的方向之一。目前在场景 token 赛道,已经有多家上市公司落地了相关业务,形成了成熟的商业模式,从营销全链路、出海运营到垂直行业场景,都跑出了明确的落地成果。 最先跑出亮眼业绩的就是蓝色光标公司,把 ai 深度嵌入社媒洞察、广告投放、视频内容生产等营销全链路, 已经形成了按 token 消耗量计费的成熟业务模式。二零二五年, token 调用量直接突破万亿, ai 驱动收入达到三十七点二五亿元,同比增长百分之两百一十,智能体协同任务完成一点四六亿次,百分之八十五的作业场景里, ai 表现已经超越了人类。 和蓝色光标。全链路营销不同,一点天下走出了一条 token 运营的全新路径。作为阿里云等大厂的 token 分 销商,他在批发 token 之后,结合自身深耕多年的出海营销数据与行业 no 号, 为慢距、社交等赛道的出海商家提供定制化增值服务,完整打通了 token 批发到增值变现的商业闭环。 除了营销和出海赛道,垂直行业的场景 token 落地也有明确进展。面向财税赛道的税友股份就把 ai 能力封装为可计费的场景 token, 形成了按效果按 token 消耗量收费的成熟模式,把 ai 能力精准落地到了财税这个强刚需的垂直赛道。 而聚焦 ai coding ide 工具的着意信息,则和智普等多家大模型厂商深度合作,深度受益于 coding 场景 token 消耗量六个月增长十五倍的行业红利,目前也已经形成了按开发者订阅、按 token 调用收费的成熟商业模式。 在泛娱乐赛道,昆仑万维也有清晰的差异化布局,公司业务覆盖 agc、 深沉式 ai 社交娱乐、信息分发等多个领域。 和纯粹的弊端 sas 厂商不同,它更侧重于 ai 加泛娱乐的场景落地,在泛娱乐赛道的场景 token 应用上走出了自己的专属路线。 而在跨境出海这个大赛道,更是有多家企业扎堆布局,深耕 b two b、 跨境电商和外贸 sas 服务的焦点科技。它的 ai 核心价值就在于利用垂直行业的私有数据,比如买家采购习惯、行业合规标准等,处理外贸全流程的具体业务。 不管是 ai 助手帮外贸企业自动生成符合目标市场习惯的产品描述、自动回复询盘,还是智能匹配,买家都把 ai 能力完整落地到了跨境电商的全场景。手握流量入口核心优势的省广集团,同样在出海赛道站稳了脚跟, 旗下的 c i m c 云平台拥有超四十亿数据和两千五百家人群标签,掌握七点八亿人群画像,能为 ai 模型提供精准的场景燃料。 同时,作为 tiktok ads 出海核心代理和巨量引擎全国最大代理商,他直接掌握了将 token 投放到全球市场的流量入口,目前已经服务茅台、海天等三百家标杆客户 ai 中台预计二零二六年覆盖百分之五十短视频订单,每年能为企业节省三千万元的成本。同样在海外营销赛道持续发力的还有引力传媒 公司,把 ai 深度应用于当下火热的短剧营销,通过剧本共创,将品牌产品融入短剧,实现高效种草。 同时和 tiktok、 youtube、 instagram 等全球主流平台达成了战略合作,能在海外市场直接附用其成熟的 ai 内容生产能力,在短剧营销这个细分场景实现了场景 token 的 落地变现。我们做个总结,场景 token 的 核心是 ai 能力的场景化、产品化、可计废化, 它解决了 ai 从能用到有用、从技术到生意的核心问题,也是未来 ai 应用落地最核心的方向之一。最后再次郑重声明,本视频仅作为行业科普,不构成任何投资建议。投资有风险,入市需谨慎!

兄弟们,上集讲的 token 是 啥?那这一集呢,我们来讲 token 的 需求到底有多猛?哎,一组数据啊,二零二四年初,我国日均 token 交易量是一千亿,二零二六年三月份就变成了一百四十万亿,哎,两年涨了一千倍, 为什么涨这么快呢?哎,报告里面说了有三个原因啊。第一个,应用场景质变, ai 不 再只是聊天工具,它变成了数字员工, ai agent 才能自己写代码,分析数据,处理邮件,七乘二十四小时不停的跑, 但用户 token 消耗量是传统对话的几十倍呀。啊!第二,多模态加入了,以前呢 ai 处理文字啊,现在要处理图片、视频、语音, token 消耗量直接跳了一个数量级啊。第三,商业闭环啊,跑通了, 按 token 计费啊,让 ai 服务变得可以量化,像水电一样,明码标价,按量付费啊。大模型产生呢,从一次性的项目收入变成了持续的流水型收入,那谁在买 token? 互联网企业占了百分之五十三,那服务行业十八个点,政府百分之九,电信、工业制造、教育、金融各占百分之四左右。那你看,不是只有科技公司在用,各行各业都在接入,而且呢,这个结构还在快速变化, 金融啊,制造啊,教育啊,这些传统行业的占比在快速上升啊,因为他们正在把 ai 嵌入到业务流程里面,需求涨了一千倍,那供给跟不上,中间需要分发渠道,这就是 tok 中间商的基本盘。 好,我是大卫,深耕 ai 模型聚合服务,那想了解这个生意怎么做呢?评论区扣 ai, 送你一本我写的经济,磁源经济啊, ai 时代,普通人的黄金赛道。

各位朋友, token 工厂系列从第一集画全景图开始,一路拆完了算力租赁、 i d c c d n 企业云、 ai 智能体,做了横向对决和去伪存真。今天是第十集,也是这个系列的收官集。 我们把整个产业链上的核心公司拉通,给出完整的 token 工厂投资时钟。先看宏大的产业数据,到二零二六年三月,中国日军 token 掉用量突破一百四十万亿,相比二零二四年初的一千亿增长了一千多倍。 相比二零二五年底的一百万亿,三个月时间又增长了百分之四十多。全球九大云服务商谷歌、 a w s meta、 甲骨文字节跳动,腾讯、阿里、百度 集体上休。二零二六年资本支出止引至八千三百亿美元,年增速从百分之六十一大幅提升至百分之七十九。阿里在 q 四财报分析师电话会上明确表态,为了满足庞大的 ai 需求,未来资本支出将超过原计划的三千八百亿元,对标大模型爆发前的二零二二年 要建的数据中心规模是十倍以上的增长。这些数据指向同一个方向, token 工厂正在重塑全球科技产业的资本流向。再看市场空间,二零二六年国内算力租赁市场规模预计达两千六百亿元,高端 gpu 出租率超过百分之九。十。 一季度算力租赁市场规模已达六百八十亿元,同比增长百分之六十。二。字节跳动将二零二六年 ai 基础设施资本开支上调至两千亿元,将年初方案增幅至少百分之二十五, 其中约八百五十亿元用于 ai 芯片采购,其余投向数据中心、液冷系统、万卡级训练集群等基础设施建设。 这是 tok 工厂产业最底层的发动机。没有字节、阿里、腾讯、百度这些巨头的天量资本开支,就没有上游算力租赁和 i d c。 的 增长基石一 上,有谁的成本最低,谁就是赢家。算力租赁已从裸金属按月租金的中间商模式,进化到按 token 产出效率定胜负的工厂模式。红信电子绑定华为升腾,落地国内首个基于三八四超节点的 token 工厂实体项目, 一季度规模净利润同比暴增百分之四百五十七,合同负债暴增百分之三百零八,预示订单饱满。绿电成本加自研夜冷 p u e。 做到一点零八每瓦。 tuken 产出效率位居国产算力第一梯队。东方国信在内蒙古和林格尔砸下重注,绿电长单价零二十八元每度, 叶冷 p u e。 做到一点零五每瓦, token 产出效率 a 股最低中标中国电信首个以 token 工厂命名的百亿级集彩项目百分之十五份额。利润拐点仍在验证期,但成本底线优势一旦转化为规模订单,业绩弹性可期。上游的核心逻辑一句话, token 工厂的竞争最终是电力成本和散热效率的竞争。二、中游绑定谁的生态决定了收入的天花板。 idc 板块润泽科技是字节跳动第一大 idc 供应商,收入占比超过百分之六十四。廊坊智算中心十年长单锁定承接自节约百分之五十,新增 ai 算力 二零二五年 ai d c 业务毛利率高达百分之四十八点五零,光环新网走 a w s 中国加自洁生态双路线 idc 业务毛利率百分之三十二到百分之三十五, 商誉简直一次性出清后,机构预测二零二六到二零二七年利润三点八五亿到四点九三亿。困境反转逻辑数据港绑定阿里生态,二零二六年一月续签一百六十亿元长单至二零三零年奥菲数据绑定百度智能云, 华北区域最大自建数据中心合作方,二零二六年老协议集中到期,新续约租金大幅上涨。 c d n。 板块网速科技拥有全球两千八百多个边缘节点,覆盖七十个国家,正把 c d n。 节点升级为 ai 边缘推理节点。 token 分 发单价是传统 c d n。 的 三到五倍,同时是大模型出海唯一合规高速通道。首都在线走算力出海加全球分布式推理的高弹性路线,空有得逻辑一句话,字节和阿里是国内 token 掉用量最大的两家公司,绑定它们生态的服务商,卡位最有价值。 三、下游与生态 token 工厂的全景产业链当前, ai 产业链已演化为算力、 token、 agent 三层体系。 token 工厂的上游是算力基础设施,包含 gpu 集群、算力租赁、夜冷散热和高速光互联。 中游是 token 分 发与商业化,包含 i d c c d n。 企业云和算力调度平台。下游是 ai 智能体应用, 包括办公 agent、 编程 agent 和垂直行业 agent。 三大运营商竞相布局 token 工厂,中国移动打造百万亿级 token 调度能力,中国电信启动百亿级 token 工厂集采算力中心正从数据存储库升级为智能价值创造工厂 共识,效率已成为 ai 时代真正的核心竞争力。但必须说清楚风险,技术路线未收敛、产能爬坡期折旧压力巨大,客户集中度极高,可能导致压价风险。地缘政治影响、芯片供应概念炒作阶段,市场情绪波动大,这些都是这条万亿赛道上不可忽视的暗礁。 四、 token 工厂投资时钟第一阶段,炒上游基础设施的稀缺性, gpu 供给缺口持续扩大,算力租赁市场规模预计达两千六百亿元,高端 gpu 出租率超百分之九十,谁手上有卡,谁就掌握了定价权。 第二阶段,炒中游 token 分 发的效率升级, cdn 节点向边缘推理节点升级, token 分 发单价是传统 cdn 的 三到五倍, 算力网建设的推进将加速 token 跨地域调度。第三阶段,炒下游 agent 生态爆发后,对上游的二次拉动。 ai 智能体在办公、编程、工业等场景规模化落地后, token 消耗量将呈指数级增长, 上游算力和中游分发的需求会被新一轮拉动。长期中局看, token 工厂最终的胜利者不是 gpu 最多的,不是 i、 d、 c 最大的, 而是能用最低成本、最高效率生产出每一颗 token 的 那家公司。这才是 token 工厂的核心竞争公式。从算电协同解决电从哪儿来?到功率半导体解决电怎么控,到先进封装解决芯片怎么堆,到半导体材料解决材料怎么造,再到 token 工厂解决智能怎么产, 这五个系列构成了 ai 产业从能源端到应用端的完整蓄势闭环。 token 工厂系列到此全部讲完,这是一条确定性与弹性兼具的万亿赛道, 从一百四十万亿日军 token 调用量开始,整个产业链的价值重估才刚刚按下启动键,感谢各位一路陪伴我们,下个系列见。