有一个电站能不能做 token 工厂?怎么做?我很明确的说可以,但也很明确的说,这个其实不是标准的工厂,更像是 token 做法,使用场景和销售是完全不一样的群体。 怎么做?一、你首先需要招商引资。电只占 token 工厂成本的一小部分,在推理场景下,电力消耗占比在百分之十左右,百分之九十的成本来自于设备的折旧和维护, 你卖多少店就倒算一下要招商多少。我们也确实看到了很多基金在准备这件事情和在找电站。二、你需要做一整套的规划,包括硬件的建设、软件的部署、销售和维护的方案,还有一个长期的团队,我们在做这件事情的过程中发现其实比想象的要难。三、销售。 现在主流的云服务厂商和分发平台对上家的 token 的 稳定性和并发性要求很高,普通 token 工厂或者说是做坊是无法接入的,只能选择小的分发平台或者电商平台合作。 总结一下,对于持有电站或者廉价电力的小伙伴来说, token 工厂能做,但也有难度。比较好的消息是,多个大型公司正在建立支持小型电站的 token 分 发平台和调度系统,这一进度将会很快,电站的小伙伴确实可以密切关注和做好准备。
粉丝2.9万获赞11.2万

中国 taco 出海,很多人只看懂了一半,如果用一句话来总结, taco 出海其实就是一场由电力、算力和模型共同驱动的全球 ai 服务贸易竞争。 这个事情是什么时候开始火的呢?大概是从去年年底开始,到今年的春节之后,直接成为全球科技圈和资本市场的焦点。 那先来说一个很关键的数据,那上个月呢, openroot 发布了一份周报,在中国 ai 圈直接刷屏了。那报告里面有一句话非常炸, 在这个平台排名前十的模型中,中国模型消耗了百分之六十一的 token, 而且前三名分别是 minnes, kimi、 智普,全部都来自中国。听起来是不是很猛?但问题是,这百分之六十一 到底意味着什么?我们先来搞清楚一个核心问题, open world 到底是什么呢?你可以把它理解成一个模型超市,是全球最大的 ai api 聚合平台之一。开发者呢,可以在上面自由地选择不同的模型,按需来调用。 但这里有一个很关键的点,像大模的观点就是, open world 是 整个全球生城市 ai 市场里面 大概只占百分之二的份额。而且它的用户是谁呢?主要是价格敏感的开发者,中小型公司真正的大客户高价值调用。其实呢,还是直接走向 openai and thorpe 这样的公司的官方 a p i。 所以 结论很重要, open 者上面的百分之六十一,不能简单地等同于中国已经主导全球 ai 服务的市场了, 它更像是一个细分化市场里面的突破,但是趋势是真的,而且非常清晰。很多人开始提出了一个判断, tucker 出海可能是中国这轮 ai 竞争里面实现弯道超车的关键机会。 那为什么这么说呢?和声音就两个词,性能够用极致性价比。比如到今年二月的中下旬 开始,出现了一个标志性的变化,中国模型的调用量第一次超过美国模型,达到了五万亿 token 级别,而且在全球超五模型里面,中国就占了四席。这意味着什么?说明了一件事情,海外用户已经开始征用你 了。那背后的底层逻辑其实是一个铁三角模型,算力、电力。我们一个一个来说。第一,模型能力。 现在呢,国产模型在代码生成、 agent 这些核心场景里面,已经可以做到跟海外的顶尖模型媲美了。比如说 cloud 这一类,百分之八十的性能,那不仅是能用,甚至呢 是相当不错了。那第二是算力在哪?几乎所有的研究都有一个共识,中国模型的推理算力基本上全部在国内,也就是说海外用户在调用 a、 b、 i 的 时候,数据是经过海底光缆传到中国的,中国的数据中心完成计算, 再把结果传回去。那这样呢,有一个特别关键的点,咱们的电力没有出海,但是价值出海了。 你可以理解为中国在卖算力服务,本质就是在卖店加算力加模型能力。而且这个模型还有一个隐藏的优势, 它绕开了高端芯片的出口管制,同时呢,把中国最强的优势,基础设施便宜、供给充足,转化为全球竞争力。所以本质上这件事情不是偶然的爆发,而是一个非常典型的供需匹配。 一边呢,是啊,全球开发者想要更便宜更好用的模型。那另外一边呢,是中国有低成本算力,而且可用模型充足电力两边一对上,就形成了一个可持续的商业闭环。 那接下来重点来了,托肯出海到底怎么赚钱?谁在受益?这不是一个单点机会,而是一整条产业链的传导。他的逻辑呢,其实很清晰,海外调用需求增加, 模型厂商赚钱,扩建算力拉动芯片、服务器、 idc, 最终变成了对算力的持续消耗。你会发现这是一条从软件一路传导到能源的链条。而整个产业链的变现大概可以分成四层。 那第一层呢,是最前端的 api 直接收费,模型公司呢,靠低成本的推理赚调用费,平台是赚中间的佣金。那第二层是中油算力和基础设施云厂商数据中心,靠租 gpu 机柜电力赚钱。那第三层是上游的硬件、芯片和服务器,需求一爆发,就是典型的量价齐升。 那第四层是最底层的电力,尤其是西部的绿电,还有算电协同协调,我们来看有哪些在产业链上的代表公司。产业链呢,主要有六个环节。其实底层呢,还是我们经常聊到的 ai 基建模型和聚合环节,主要有 啊智普、 ai、 minimax、 kimi 以及 d c 算力服务以及 idc 环节主要是润泽科技、首都在线、红景科技、数据、港澳飞啊,世纪互联。国产算力硬件环节主要是海光、韩五 g、 华为生腾店里面的啊华锋。 那电力能源环节是主要是经开能源、内蒙华电、净能电力、国能日新电网。设备环节主要是中国西电、特变电工、许继电器。最后的配套环节呢,主要是网速科技、 深信服以及安恒信息的。那本质上,你可以用一句话来总结,前端赚不赚钱,取决于后端的成本低不低,而中国最大的优势恰恰就在这规模化的低价电力加高效的算力基础设施。但最后,我必须给你一个更冷静的判断, 中国偷肯出海,在价格敏感型市场确实已经打开了窗口,但是你把它外推,中国马上就要颠覆全球 ai 格局,那是有点过早了。因为长期来看,真正的壁垒不只是成本,而是三件更硬的东西,数据、主权、 地缘政治以及生态体系。 ai 竞争已经不仅仅是商业竞争,而是全球权力结构的一部分。美国现在在做什么呢?本质是在构建一个排他性的技术同盟体系。所以接下来真正值得关注的不是一句,中国模型到底厉不厉害, 而是在这场电力加算力加模型的商业战中,最终把中国 ai 带到哪里。如果你觉得这期视频有用,欢迎关注,我是派,下期见。

真的好焦虑啊,大家还记得我在二月份就发过 open core 吗? a 股什么时候开始炒作的?三月初,然后慢慢炒,炒到后来又给 tokyo 嘛?到现在还有不断的涨停啊,今天的 tokyo 方向还是很多很多的涨停,甚至国内的电力没法出口嘛。那 tokyo 呢?就可以代替电力啊,出口卖到全世界嘛。但你们知道吗?现在就是 有那个服务器,你买回来啊,可以自己搭建大模型开源吗?然后呢?搭建完之后呢?你可以自己做一个小型服务器,就是 tokyo 是 不用花钱的本地化了,自己做服务器,自己提供 tokyo 呢?当然了,这个这个概念还没有开始炒作,我估计我现在讲这个事情要等到四月份才开始炒作。那 炒的不就是硬件吗?对吧?你自己搭建服务器,在家里买台,买台服务器回去大概几万块钱吧。但是你这样下去,一个小团队用这个 tokyo 的 话,用这个大模型的话, 你是永远都不用给花钱,你只需要花自己家的店,你自己家店又出不了国了。为什么?因为国外也在买这个服务器啊,那用自己的 talking 自己的服务器,所以我觉得四月份五月份可能,呃,会延迟一点啊,这个消息 就是可能到时候慢慢炒,慢慢炒,炒到后来就是还是炒到硬件,因为你没有硬件,怎么搭建设备,你怎么搭建电力,你怎么样去生产自己的一个服务器,而用自己本地化的,那到时候各种硬件,各种 cpu, 各种服务器,各种存储,这些东西 就慢慢变得更值钱了。所以我估计四月份五月份还在往上发展,但比较慢。因为我二月份讲的,三月份才开始炒。那我三月份讲的可能四五月份才开始炒,对吧?你关注我,反正有任何逻辑和消息呢,我就随你们讲。好吧, respect。

toker 出海怎么出?四种模式,你会如何选择?一、传统模式,你通过电话邮件或者是聊天工具告诉海外的云服务商,你有一个定量的 toker 包,比如一千亿的千万 g l m 或者 cds 的 toker, 然后让海外的小伙伴线下去销售。但这个沟通商务时差,老外的效率、邮件方式和收付款都很低效,在做这件事情的时候未必划算,只适合大客户和大订单才能这么做。 二、聚合分发模式,把你的 token api 接入到大的聚合分发平台,它们根据稳定性和价格进行调用,低价就多调用一些,高价就少调用一些。 c 端统一一个 api 可接入的平台, 我们其实已经做好这些平台的接入要求,但在缓慢的排队中,接入的效率以及商务其实不太开放。 三、打包借通道的模式,这个需要你的 token 包很大很稳定,这几个小的 token 工厂的包 打包在一起,通过大厂和运营商进行一个合规的备案,出海到海外的大 b 端或者 c 端。四、 toc 模式,哪怕你只有几十亿的 token 价值在数千,你可以通过电商或者社交媒体进行少量的 toc 转售。 总结一下,托肯出海和磁源经济是一个三月份才开始进入大众视野的事情,还很早期受制于 openroot 的 不 open。 我 们团队决定做一个中国版的 openroot 是 有很多挑战,但我认为磁源经济和托肯需要一个更开放的生态和宅体。月十一号的广州线下沙龙,我们将发布这个中国版的 openroot。

token, 中国电力的数字集装箱,万亿产业链的投资逻辑你知道吗?中国的电力正以一种全新的数字形态走向世界,它就是 token, 这背后是一条万亿级的新型产业链,更是中国在 ai 时代的换道超车密码。一、 为什么说 token 是 中国真正的电力出口?中国是全球第一发电大国,二零二五年发电量超九万亿度,占全球总发电量的三分之一,风电、光伏装机量更是连续多年世界第一。 但过去我们面临电太多用不完的尴尬,西电东输后仍有大量赋雨,电力存储成本高,只能弃风弃光或输送给高耗能产业。电力无法存储和运输,就像握着金矿却运不出去。 直到 token 的 出现改变了这一切,我们把赋予的电力转化为算力,再将算力封装成 token, 卖到全世界。二、 token 到底是什么?官方将其意为磁源,它是 ai 大 模型理解和处理信息的最小语义单位, 就像用电按度、打电话、按分钟计量,使用 ai 大 模型写代码、升图、做问答,全是按投肯计量消耗。比如让 ai 写一篇回锅肉教程,他会先把指令拆解成五花肉、焯水、豆瓣酱等,一个个投肯解锁匹配后再重组输出, 整个过程消耗的 token 数,就是 ai 调用算力的成本依据。三、中国 token 的 全球竞争力中国模型在全球 token 调用市场已占据半壁江山,全球前十大模型总 token 消耗量超二十八七万亿, 中国贡献十四点六九万亿,占比百分之五十一点二,且百分之四十七的用户来自美国,这背后是极致的性价比。中国西北绿电给算力中心的电价最低,仅零十五元每度,不到欧美国家的五分之一。 国产模型定价极具竞争力,比如 deepsea v 三,每百万 token 仅一元,比硅谷大厂便宜十倍以上。四、 token 产业链的核心投资模型这条产业链可分为四层,前端模型厂商靠 api 调用和平台佣金盈利。 上游算力应景需求爆发,拉动芯片服务器产业。中游算力中心通过出租 gpu 机柜和电力服务盈利。 底层电力与智能调度,西部绿电和智能调度技术是核心支撑。斜上起三周清平链子,并促由泛力服务、国产硬件、电力、能源、电网设备、网络安全等多个环节, 每一环都在这场电力数字出口中扮演关键角色。从西北的风电光伏,到数据中心的 gpu 集群,嗯,再到全球用户的屏幕,中国的电力价值正以偷看的形式实现跨境交付。 这不是简单的弯道超车,而是换道超车。用算法正外汇,让曾经气风气光的绿电焕发新价值。在 ai 时代的全球竞争中,中国正以电力与算力的深度融合,重新定义产业规则。

上条视频火了,我来给你们拆解一下当下最赚钱的托克生意。小龙虾出来以后,国内赚钱最多的就是他们那些搞中转站的。那国外的大模型可乐来说,二十美金,每百万托克,他们卖五美金,纯赚四美金。我的天,要是黑心一点,再参点假,那利润 最关键的是全国的流量就涌进他们百来家中转站,你们想想有多离谱。而且这个技术都不算难的,网上成熟的中转站原码一大堆,老手都不用自己写代码上去扒,一个原码下来 v i p 一 遍,当天就能开业。而且 你们以为他们是从官方拿的话,其实直接有免费的开源逆向工具什么意思?就是你只需要有大量的订阅账号,你就能把这些账号转化为 a p i。 拿可乐来说,官方定价二十美金,每百万 ko, 可以 通过这个方式打到一块钱,卖出来的全都是利润。 工具我已经放在上面了,你们感兴趣的自己可以去研究,反正这个生意刚起步,可以先研究一下。这以后国内大魔星起来以后,托肯出海卖给国外,不是又便宜又好用啊?

我再进一步拆解托管生意,我们都知道啊,卖托管做中转站非常赚钱,聪明的你肯定也明白,因为这个模式解决了大多数人无法使用海外顶级模型的核心问题,其次又解决了高价的痛点,所以它成了现在普通人 ai 创业当之无愧的第一生意。 现在这个生意你普到什么程度啊?你想去当二道贩子,给别人的网站建分站做推广,拿提成,你还得交钱,这不是小刀拿屁股开了眼吗?但如果你真的想从事这门生意,你首先要解决的就是大量的耗资问题, 因为现在这行客户根本就不愁流量完全处于溢出状态,很多中转站根本就忙不过来,导致停收用户。为什么?因为耗磁里面特别容易封号,你要有足够的维护能力去解决这个源源不断的封号问题, 提供稳定优质的服务,你才能持续放大自己的核心用户群,不然你的耗磁一挂,那用户全部退款,那还干什么?关注我,下期继续拆解。

三种算力销售模式算力闭口租赁算力开口租赁和偷啃销售有什么本质区别?哪个更赚钱?我们一个一个来看。 一、算力闭口租赁起因是大厂需要大量的 ai 服务器,又不能买,因为他的设备或者不想中投资,所以找人买了租给他,但是资产方担心你租了一年以后不租了,我也找不到别人用啊,这不完蛋了吗?所以就要求大厂担保,租到他回本回息为止, 这个我们称之为闭口协议。大傻觉得你既然要我全兜了等于我买,那你也别想太赚钱,你就拿点利息吧,用完以后的旧设备还是要送给我。这样就形成了成熟的算力闭口租赁模式,大概就是一百块钱,五年能多拿二十块钱左右。 二、算力开口租赁随着 ai 紧凑度的提高,开始有资产方发现这些电子产品和服务器还能增值,也不快,旧设备免费送太可惜了,而且使用方也越来越多,不担心砸在手里, 于是就开始接受短租一年到两年。而大厂也不想承担 ai 服务器的价格波动或者更新换代的滞约,原来的五年闭口租赁模式开始往一年两年的中期合约转变,资产方来承担风险,享受增值和残值。 三、 token 工厂模式随着 open cloud 把 ai 应用和大模型解开捆绑,此外 ai 编程也大幅提高了 token 的 消耗量。资产方也可以抛开大厂,用开源大模型部署,直接给客户提供大模型的 token 服务。这个是三月份 gtc 二零二六黄仁勋开始大力站台后的一个全新的模式。 总结一下,算力闭口租赁其实更像建大楼给一个企业。算力开口租赁更像建一栋大楼,按年出租给不同的企业。而 token 工厂就像建一栋大楼,开一家酒店,接受预定,按天收费。

别再死磕显卡了,二零二六年搞钱的核心是算力 token, 今天给大家分享三种 token 的 商业模式,看懂直接变现。第一种是 api 按需付费,这是目前最成熟现金流最稳的模式,就像交水电费一样,企业用多少算力就付多少钱。只要快速搭建好集群, 客户调用 ai 越频繁,流水进的越快,那这里主要是针对一些弊端客户,他是有技术能力去调用 api 接口的。那第二种商业模式是投坑工厂模式,是针对有超大规模的算力需求,这里拼的不是机器多,而是店价, 它的核心就是一度电能产出多少价值的计算,业务的毛利提高,掌控着算力基建的核心话语权。那第三种商业模式呢?就是合规的 token 出口,利用我们现在政策最大的红利,把中国算力和 ai 技术通过合规的 a p i 形式输出给全球,按 token 量结算,这个是镇静的 跨境数字贸易,赚全世界的钱。像国内的豆包一百万 token 在 一元左右,海外的机迷你啊,差不多在十五元左右,那这样我们把国内的算力 token 输出给海外的这些需求方,这个利润空间就是相当可观的。 最后我们一句话总结,算力 token 是 智能时代的价值硬通货,我们要赚服务的钱,赚规模的钱,赚钱全球的钱。想要了解更多关于算力 token 的 信息,可以后台私信我们,我们下期见,拜拜!

托管出海会怎么出呢?四种模式啊,大家会如何选择呢?第一种就是传统的模式,你们通过电话邮件或者是这个聊天工具告诉海外的语音服务商,比如说我有一个定量的托管包, 比如说一千亿的千万啊,或者是智普,或者是这个 cds 的 token, 然后让你的这个海外的小伙伴线下呢去销售,但是这个沟通的时间还是商务成本呢,太慢了,对吧?然后邮件的方式和收付款呢,都是比较低效的,所以在做这件的时候呢,未必划算, 只适合大客户还有这个大订单才能这么做。第二种呢就是聚合平台的分发模式,把我们的 token 的 api 接入到这个大的聚合平台去做分发, 它们呢根据稳定性和这个价格进行这个调用,那低价的就多调用一些,对吧?高价的我就少调用一些。 c 端呢,统一有一个 api 的 这个可接入的平台。 那么第三呢,就是呃,接通道的模式,这个需要你的 tucker 的 包很大很稳定,那么有几个小的这种 tucker 工厂的包打包在一起,对吧?通过大厂和运营商呢,进行一个合规的备案,出口到海外的大 b 端啊,或者是 c 端。 第四种呢是 toc 的 模式,哪怕你只有个几十亿的 toc 价值呢?几千,对吧?那你可以通过电商或者社交媒体进行一个少量的这个 toc 的 转售。 我总结一下啊, toc 出海呢和资源经济呢,是一个三月份才开始进入到大众视野的一个事情,还很早期是有很多挑战的,但是我认为资源经济和 toc 它需要一个更开放的一个生态和在内体。

同样输出一句话,我是中国人,不同的 ai 花的 token 居然不一样,今天我们实操一波,来看看 token 究竟是什么?来,我们直接上网看。 ok, 那 我们现在看一下,同样输入一句话,我是中国人,不同的大模型输出是什么样的?先来看一下 gbt 五输入这句话 啊,可以显示,看到这里显示了三个不同的高亮色块,每个色块就指的是一个 token 词源啊,所以这里是一共有三个 token。 好,其实呢,输入计算机的时候,托肯是会转换成为 id 的, 像这样,每个托肯对应的是一个唯一的数字 id, 这些数字 id 还需要进行矩阵转置,变成高维度的向量坐标,最终再输入到大模型进行处理。 可以同样看到,如果是 gpt 四的话啊,同样一句话,我是中国人,他输出的托肯数是四个的,那么 gpt 五其实还是针对这些中文词组做了一定的优化。 看一下国内的大模型,同样输入一句话,我是中国人,输出的 to k 数主要两个,因为我们国内的大模型可能相对于一二或者词语的分割来讲,是对国外要更优一些的,所以输出的 to k 数会更少,也就要看一个有意思的。我们看一下火山这边, 像图片照样也能通过图片的长宽,然后再除以一个固定值,也可以算出图片消耗的 to k, 图片消耗的 to k 量其实会更大, 所以我们用一些图形或者视频处理的大模型的时候,整整体的费用是会更高的。好了,那我们的演示就到这里结束了,所以我们为什么要关注 tok 呢?因为现在我们用的大模型 api 都是按 tok 计费的, toker 越少,同样的对话花费就越少, ai 一 次性能技术的内容就更多,所所以选对模型能省不少。当然,其实 toker 的 费用也跟模型本身的参数量成正相关。 toker 计算器的链接我已经放在评论区,大家可以试一下,输入你最常用的句子,看看需要用多少个 toker。

上一期我们讲完的 ai 芯片是怎么生产出来的,今天我们讲 ai 芯片怎么变成 ai 酸粒。芯片生产出来了以后先要放到 pcb 板上面, 就类似于我们的 cpu 需要放到主板上面。 pcb 板的生产厂家有圣红科技,棚底控股,棚底以前的份额更大,但是把精力放到移动端的 pcb 板上面,结果圣红做的更好了,还有互电股份以及生意。像现在主流的英伟达、 gb 三百都是一颗 cpu, 然后两颗 gpu, 只不过每个 gpu 上面可能是两个带或者四个带。接下来不同的是 gpu 本身,如果是我们常说的四零九零、五零九零等消费级显卡,它的 散热芯片跟一二是不封装到一起的,围着在这个 gpu 附近。如果是像 b 两百、 b 三百这种 gpu, 跟 它的显存也就是 hbm 是 封装到一起的, hbm 就是 高速内存,相同大小的 hbm 是 我们硬盘价格的几百倍。能生产 hbm 的 目前主要是 s k, 海力士最多,其次是三星,随后是镁光。我们国家能生产 hbm 的 只有一家,叫长芯存储, 今年应该会上市,而他的兄弟公司叫长江存储。长江存储是生产硬盘的,长兴的难度会比长江高很多,价格也会贵很多,这个在课程里面会有详细的介绍。主板安装好了以后, 我们就到了高速互联部分,所谓的高速互联就是把服务器内和服务器外的高速显卡连起来,也就是把率连的起来。在内部有这个 叫网卡,网卡上面要插光模块,光模块呢要连线,或者有光模块跟线放到一起的,我们称之为 aoc 网卡里面比较有名的就是麦克斯的 ib 网卡 以及现在 c 叉九网卡, c 叉九网卡既支持 ib 互联,又支持以太互联。光模块里面大家都耳熟能详呢,就是中继续创, 然后新益盛还有天府通信,这两个是生产光模块,天府通信只生产光模块的主件, 线缆里面也就光纤线缆里面看着地图成飞光纤就可以了。而 aoc 还是光模块的厂商,当然还包括国内比较有名的光纤科技。主网完了以后就到了冷却,冷却里面大家都知道伊维克 现在是 t 一 级的供应商,然后还剩下了高栏股份,森林环境以及叶冷的曙光加入了冷却以后变就是这个电源,电源记住两个,一个是麦格米特,一个是提供淡化甲电源的璎珞赛科,接下来就是把它就组装到一起的整体集成公司。 工业互联,也就是富士康以及浪潮华山和超巨变,中兴通讯等等。在国外呢分为 o d m 和 o e m, o e m 就是 工业互联,广达,英业达等等。 o e m 就是 我们耳熟能详的超威,戴尔、 g 加、华硕、微星等,等到他们整机到他们组装完成以后就上架到云服务的厂商,像 阿里云,火山,腾讯等等,到这里就变成了我们的 ai 算力,或者说是 token, 我 们公司租的云算力就包括五六家,整个算力产业链就讲到这里,更多更详细的内容以及公司分析请看我的课程,谢谢!

哈喽,大家好,我是 paper, 那 今天我们来说一下我们最常用的 token 本地模型和外部的模型该怎么样去使用?就是 token, token 是 什么呢?一方面它是有这个最小计算机处理文本单元, 另一方面它也是其他的,还有很多身份认证啊,指令串密密实都百度的话,你要使用在我们的 ai 大 模型中,你就记录这个最小文本处理单元就可以了。我们再来看这个本地模型去哪里找啊?一般的话,像这个最常见的开源社区 hackin face, 我们在这里面去找本地模型,我们登录进来,然后找到这个 browser two m 加 models, 或者说你直接在搜索栏中搜索对应的名称,像这个主页,它这个首页里已经有这些,比如说像这个 minimax 的 二点一,千万的三点三,还有一些各种各样的 模型, open i 的 gptos 啊,你可以或者说这个 kimi 二点五等等,你可以点击这里去我们要找的像一些文本到图片的模型, 就是 ai 绘画模型,还有像这个文本到视频的模型啊, text to video, 还有像这个文本到文本,也就是我们的语言模型,就像豆包,千文,这些都是语言模型,我们只要去搜一下这个 text generation 文本生成,我们就可以在这里看到有千文,三点五啊,还有各种各样的 emoji 三啊,各种各样的 mini max 等等啊,只要是你所熟悉大厂,那基本他发了都在这里面啊。你看这个 b 嘛, 这个币数越大,比如十七币,八十币,三十二币,一百九,十九币,甚至这个二十八币,或者说这个四币的,这肯定效果没有那么好,是吧?那因为达到六十七币,一二一百二十四币都很大, 这东西像这个 mini max, 二点五,二点二十九币啊,二百二十九币,这个更大,这个你要是下下来,你会发现 你可能你的电脑用不了啊,就是这么简单哈。 ok, 我 们再看这个像一些其他的开放的 a p i 怎么去使用?那这里我以这个 g m 举例啊,我们直接去找到 a p i k, 点一下就进入到这个页面了, 这个页面就是你的 a p i 密匙了,我们在这个项目管理 a p i key 中找到它,像这个已经有的 a p i, 你 用到别的地方可以去,这样子你也可以直接删除,我们再可以添加个新的 a p i, 比如说你这个 a p i, 你 要去用到自己的 call 啊,那么龙虾上我们就点击 call, 然后把它复制过来,然后粘到这个 call 里,你就给它充钱就可以了哈。 你还想还想要再用一个 a p i 去做别的项目,那比如说我这个叫这个 agent agent, 那 这个 a p i 呢?我们给它复制过来,去放到别别的调用的端口里给它充钱就可以了哈。 像这个 open a d b c 的 a p i 啊,页面也差不多哈,你可以在这里点击 create new c c 啊,你也可以在这里点一样的啊,这里 name 我 写 call 啊。这个 project 你 可以放到你的默认 project 里,不过一般只有一个啊,点击 quit 就 可以了哈, 配置完之后呢,一样的,你就给自己的套餐充钱就可以了。那这个 api 呢?它不同于你的和你的传统的大模型,你直接问它那种网页对答模型不一样的啊,因为 api 呢?它 是啊, api 它是实时计费的,就说你要是用的话,你可以用到很多层面上不同,不停去调用这个模型。而你的网页因为问答呢,只要你这个模型啊,只要你这个网页关了,你就用不了了,是吧?你要是想用它,你是不是得二十四小时数在电脑前啊?你在电脑前你才能用它,但 api 不 一样,你可以做成全自动化的东西, 这样子呢,它的费用就会很高了。所以说 a p i 是 单独收费的啊。 ok, 那 今天呢,学完这课,咱们这个玩龙虾啊,或者说玩什么都会更轻松一些哈。咱们就先到这里啊, ai 啊,一定要去关注这些啊,最基础的东西,如果说这些基础东西你都不知道,那你去你就很难玩得转这些东西哈。

token 成本中,电力占百分之六十到百分之七十,其中西部低电价绿电运营商、电网调度、电力设备最为受益。 token 电力产业链三大细分领域梳理绿电运营商核心梳理一甘肃能源二携星能科三经开新闻四长江电力五、川投能源电力设备核心梳理 一特变电工二曲奇电器三思源电器电网调度与智能配电核心梳理一国电南瑞二、南网数据点赞加关注,下期讲解三国惊天!

中国出口的全新机会,万亿级市场,不需要海运,每个普通人都有机会参与,那就是扑克出海, 他你肯定认识。豆包,你现在每天处理多少 token? 这是豆包给我的数据,每天服务的用户是一级单轮对话,通常是几百到几千 token, 整体算下来,每天处理的 token 是 百十亿甚至更高。这个量级我给大家一个概念,每一 token 的 推力消耗大约六百度电, 豆包每天需要处理百十亿至千万亿级的 token, 也就是六十万度电到六百万度电。豆包运行一天,相当于消耗了一座小型城镇一整天的用电量, 也相当于一台春晚的语速机器人,连续工作两百七十四年。大模型推理不是清运算,每生成一句话,模型就要走上千亿次。参数计算, gpu 七乘二十四小时满负荷跑一张 h 一 百,功耗为七百瓦,一个机柜就是几十千瓦,还要算上空调供电, 语数据中心 pe 通常为一点二到一点四,电还要再放大,这背后所需要的生产资料,电 只有中国能做的到。那这和普通人有关系吗?有,而且关系很大,因为豆包每天消耗掉的电不是在耗电,而是在炼金。另一种叫做 token 的 数字黄金。

随着龙虾的爆火,那么 token 这个名字也被家喻户晓,那么网红经济学家也出来作妖了,说我们也可以把 token 搞成一种商品,然后用于出口呢? 这明显是一种概念混淆,我们原来时候讲的商品,如果说非常廉价,那么就非常有出口竞争力,只要改变它的属权,然后通过运输的方式出口就完成了,非常简单,这里面唯一要求的出口的标准达到验货才可以完成。 今天说的头肯也就是算力真的一样吗?不得不承认,我们在这上面有非常大的优势。第一个,店便宜。众所周知,我们是一个基础建设非常强大的国家,所以说店天生就便宜,所有的东西都要在建立在店的基础上去运作,那么就导致最后的算力可能会比较便。 第二点是我们的工程师多,也就代表着用人成本低,那么最后也是会算到上面电力,呃,这个算力会比较低。第三点就是工程优化做得比较好,比如说我们可以把 gpu 的 这个算力拉到最大,或者说我们把算法提升啊,本质上也是卷工程师的一种表现。在 ai 算力的时代,真的便宜代表一切呢,并不是 真正的客户。看算力是怎么看?第一点,上游的稳定供给,比如说你的芯片来源是否稳定,是否能保持所有的交付的东西得到一种稳定。在二零二四到二零二五之间,美国出台了一系列芯片法压制我们,导致你登录不了服务器和网站。第二个是法律问题,可明显新加坡和欧洲制定了 ai 的 相关法律, 这就要求你的工资必须要在法律框架下才得以运行,这样又筛掉了一大批算力供给平台。第三点是什么?是安全问题,因为算力的供给本质上你要去拿到甲方的所有日制,所有的客户信息,以及一些敏感词,一些数据库都在这里。 第四点本质上是生态,因为欧美客户如果你做过外贸的话,都知道欧美客户一般会用一家供应商,如果用的好的话,他不会换,除非用的不好,他会才会考虑换第二家,这就代表着你所提供的廉价。算力不是第一梯队的选择, 可能是第二梯队的选择,那要不你把算力卷的更加便宜,但是也很难。为什么呢?因为在整个 ai 产业中,很多的一个公司啊,他固执很大,他没必要在这种成本上去审,那审的话,可能他的一些安全、法律生态或者上游的稳定性出现了一些问题了,以后他的股价的损失可能远远大于花这一点算力的价 格。所以说,再也不要被这种网红经济学家给忽悠,背叛的人我都送他一百万,将来忠诚于我的人,那就是几个亿了。听懂掌声, 对于很多事情,我们要静下心来,稍作研究,再去做判断,喜欢就点个关注吧!