普通人到底要如何参与到算力租赁这个风口呢?今天这个视频呢,就完整的教给大家。那最近算力租赁头肯出海,这些概念就跟着 ai 一 起火出圈了。像算力啊,或者 api 租赁到底是什么?要怎么赚钱呢?简单说呢,其实就是租你电脑的算力给别人用。 我举个例子啊,比如说你想跑一个 ai 大 模型,或者用 ai 做批量的视频生成,但是呢,是能实现这种目标的设备啊,你光买显卡就得花几十万,但假如此时此刻你租别人的算力,按小时付费,那成本呢,就直接可以省百分之七十。那租算力给别人的那一方呢,也可以通过源源不断的订单来赚钱。那 api 租力呢,就更简单了,他就像是租别人的 ai 能力,比如说你想做一个聊天机器人,你不用自己直接搞技术, 租一个 api 呢,直接用别人的,非常方便。那现在 ai 可太火了呀,像做 ai 视频,搞大模型,开发智能应用,全部都得靠算力,但好的显卡呢,一台就几十万,普通人和小企业呢,其实根本是承受不住的,所以租算力呢,就成了刚需。那对于我们普通人来说呢,最简单的入局方式其实就是去大厂代理 空手套白狼。那意思呢,比如说你去当腾讯自结这些大厂的算力,或者 a p i 代理,就像帮他们卖算力套餐,你不用花一分钱啊,只要能拉到客户呢,就能拿百分之十到百分之三十的返点。 我举个例子啊,就是你推荐客户买了一万块的算力套餐,最少呢也能挣一千块,客户越多赚的越多,享用门槛非常低啊,我觉得几乎每个人都可以干。 第二种呢,就是线上平台托管算力卡,基本上等于躺着收租了,要是你手里有闲置的一些高端显卡,可以放到一些线上平台上去托管,那平台呢,会帮你把显卡租给需要的人,你什么都不用管,每天看着租金到账就行。 第三种呢,其实是适合有实力有资金的朋友啊,你们可以租个正规的 a、 i、 d、 c 机房,比如说像阿里云、华为云的机房,然后呢,自己去买一对高端显卡,配置好后呢,租给企业客户。但是 a、 i、 d、 c 机房是受国家严格监管的,所以必须要有 a i、 d、 c 的 资质,企业才可以搞,个人呢,可千万别瞎折腾。
粉丝6.1万获赞77.0万

上一期我们讲完的 ai 芯片是怎么生产出来的,今天我们讲 ai 芯片怎么变成 ai 酸粒。芯片生产出来了以后先要放到 pcb 板上面, 就类似于我们的 cpu 需要放到主板上面。 pcb 板的生产厂家有圣红科技,棚底控股,棚底以前的份额更大,但是把精力放到移动端的 pcb 板上面,结果圣红做的更好了,还有互电股份以及生意。像现在主流的英伟达、 gb 三百都是一颗 cpu, 然后两颗 gpu, 只不过每个 gpu 上面可能是两个带或者四个带。接下来不同的是 gpu 本身,如果是我们常说的四零九零、五零九零等消费级显卡,它的 散热芯片跟一二是不封装到一起的,围着在这个 gpu 附近。如果是像 b 两百、 b 三百这种 gpu, 跟 它的显存也就是 hbm 是 封装到一起的, hbm 就是 高速内存,相同大小的 hbm 是 我们硬盘价格的几百倍。能生产 hbm 的 目前主要是 s k, 海力士最多,其次是三星,随后是镁光。我们国家能生产 hbm 的 只有一家,叫长芯存储, 今年应该会上市,而他的兄弟公司叫长江存储。长江存储是生产硬盘的,长兴的难度会比长江高很多,价格也会贵很多,这个在课程里面会有详细的介绍。主板安装好了以后, 我们就到了高速互联部分,所谓的高速互联就是把服务器内和服务器外的高速显卡连起来,也就是把率连的起来。在内部有这个 叫网卡,网卡上面要插光模块,光模块呢要连线,或者有光模块跟线放到一起的,我们称之为 aoc 网卡里面比较有名的就是麦克斯的 ib 网卡 以及现在 c 叉九网卡, c 叉九网卡既支持 ib 互联,又支持以太互联。光模块里面大家都耳熟能详呢,就是中继续创, 然后新益盛还有天府通信,这两个是生产光模块,天府通信只生产光模块的主件, 线缆里面也就光纤线缆里面看着地图成飞光纤就可以了。而 aoc 还是光模块的厂商,当然还包括国内比较有名的光纤科技。主网完了以后就到了冷却,冷却里面大家都知道伊维克 现在是 t 一 级的供应商,然后还剩下了高栏股份,森林环境以及叶冷的曙光加入了冷却以后变就是这个电源,电源记住两个,一个是麦格米特,一个是提供淡化甲电源的璎珞赛科,接下来就是把它就组装到一起的整体集成公司。 工业互联,也就是富士康以及浪潮华山和超巨变,中兴通讯等等。在国外呢分为 o d m 和 o e m, o e m 就是 工业互联,广达,英业达等等。 o e m 就是 我们耳熟能详的超威,戴尔、 g 加、华硕、微星等,等到他们整机到他们组装完成以后就上架到云服务的厂商,像 阿里云,火山,腾讯等等,到这里就变成了我们的 ai 算力,或者说是 token, 我 们公司租的云算力就包括五六家,整个算力产业链就讲到这里,更多更详细的内容以及公司分析请看我的课程,谢谢!

想跟上 ai 时代,先得听懂 token 是 个啥?最近黄仁勋抛了个新概念,整个 ai 圈都炸了,啥概念呢? token 算力?工厂经济学?以后,因为达不只是卖芯片,还卖 token。 此话一出,全球芯片固执,直接颠覆。 为什么会这样呢?今天咱一次性把这事说个透,什么是 token? 因为达的优势在哪里?我们国家的优势在哪?普通人又该如何抓住红利?先说最简单的 toker, 它是 ai 的 一个单位,两颗苹果五百克,这是重量单位。一杯奶茶五百毫升,这是容量单位。一篇稿子五百 toker, 这就是 ai 算力的单位了。五百 toker 有 多大呢?举个简单的例子, 你问豆包老师,今天是星期几?六个汉字会被切割成三到六个 toker, 而你说的文字越多, toker 消耗也就越多, ai 的 工作量就越大,对应的就需要支付越多的费用。你说,哎, 平时我和 ai 聊天怎么不用花钱呢?很简单,现在行业还在抢用户、抢数据,等技术成熟了, token 就 会跟石油一样金贵。那 token 到底是怎么算出来的?分成三步, 第一步,你的指令被翻译成 token。 第二步,芯片收到输入的 token, 开始疯狂做题,一秒能计算几亿次。第三步,计算出新的 token, 被翻译成你看到的答案,明白了吗?第二个步骤,芯片计算就是 token 经济学的核心了。黄仁勋所说的 token 萨利工厂经济学核心概念就一个, 同样多的店,谁算出了更多的拓客,谁就多赚钱。用大白话讲,店价不变的情况下,一句瓦的店,普通方案一年产出九亿拓客啊,多了三十四倍,一年多赚一点五亿美元, 所以老黄才敢放话,到明年年底至少赚他一万亿美元。那易伟达凭啥这么牛呢?第一,他的芯片断档领先,哪怕咱的顶级芯片算的一半。第二,库大生态太猛了,全球四百多万开发者, 我们本土才几十万,要问开发者都有什么用?能产生飞轮效应呀?越多人用,模型越多,音质越好,生态就越强。这就是因为打恐怖的护城河了,就像一个巨大的摩天轮,根本停不下来。但你要说因为打无敌,那就有点被老黄带节奏喽。 所有假设都建立在一个前提下,电费一样,电量一样受到这发电,那可就是涨的主场了。美国的工业电价一度零点八到一点二元,我们呢,零点四八到零点六亿元,是他们的一半左右。更狠的是西部算力枢纽,也就是甘肃新疆宁夏这地方绿电的合约价格能低到每度 零点一三元,同样是烧一百万度电,我们花三十万,而美国要花一百二十万。怎么做到的?三个大国工程你一定得知道。一是东数西算,把东部的算力需求调度到西部绿电负极区,八大算力枢纽集中了全国百分之六十以上的新增算力,二十特高压电网, 四十六条超级输电线路,把西部的风电光伏水电高效送到数据中心,损耗才百分之三到百分之四,全球最稳。第三,算电协调,也就是算力跟着电力走。怎么跟呢?电多的地方多建算力中心,电少的地方算力就少跑一点, 通过空间布局,时间调度,让电力更便宜,算力更稳定,算电协调有多重要呢?二零幺六政府工作报告首次将它纳入了国家级新基建工程。而且很多人不知道的是, toon 出海,我们已经占了全球的百分之六十一,前五的大模型里,中国占了四席,而且中国百万 toon 零点三到零点五美元是美国的十分之一。说到底, toon 拼的不只是芯片, 还有电,还有统计效率。我们的优势是绿电加稳定,特高压加东数西算加算电协同,全方位碾压,这就是我们无可替代的底牌啊!最后咱说说普通人能做点啥?给你三个实打实的方向。一、轻资产的闲置,算力共享。把家里的高性能电脑接入正规分布式算力平台, 空闲时借小规模训练,普通显卡月入五百左右,高端显卡能到一千加二、当算力时代的水电工,你可以去考个电工证,要知道东数西算八大枢纽未来大量招人,现在很多地方已经开始技能培训补贴了, 有资源的朋友可以在三四线城市对接本地企业或高校的算力需求,提供算力租赁、数据处理。于武汉,就对算力服务的小微企业提供房租补贴、贷款贴息等。想搞算力服务的话,现在还是蓝海时期哦。总结一下, tock 是 算力的基本单位,而 tock 经济学就是运用电力算力效率来定价格,算成本,赚利润。别看黄人勋最近把 tock 经济学吹得天花乱坠,其实咱依靠强大的电力系统,早就低调拿下了全球过半的市场。未来掌握在谁的手里?答案已经很清晰了吧,再见!

欢迎收看我是大叔,只跟你聊最实在、最有用、最有意思的内容。好,我们来看一下 ai playground 的 功能介绍。第一个是历史展示,然后应用设置,还有一个中间的一个聊天窗口, 先看一下它的设置,配置设置像有一个语言的切换,还有个主题的切换,大家可以根据自己的喜欢切换不同的主题。 另外一个还有一个是镜像源地址的配置,大家可以根据,呃,如果是国内用户的话,可以根据跟我配的这个地址是一样的。另外一个这边是展示 后台的一个运行状态,那主要程序的话是就是这个 ai playground。 另外一个就是模型的运行工具,就是朗玛 c p p 的 运行工具, 然后这个可以不需要勾上,这个是音频转文本的功能。 还有一个是模型加载,这个最好是勾上,因为在切换模型的时候它不会释放掉上一个模型。 然后还有一个是开发者控制台,这个是启动时候它会默认开启。另外一个是呃管理后端的一个组建, 这边主要是用来做重启后端服务的,如果有修改配置,这边要点一下重启。 好,我们再来看一下这个窗口的功能,这边主要一个功能就是一个切换的模式,聊天模式切换, 这边是发送,然后这边的话是设置,咱们每次聊天的时候采用了一些模型,那模型的分类功能,模型的功能它只会分为这几种, 一个是基本的聊天,然后还有一个是推理,一个是图片,另外一个是 a j。 还有一个是这边我们要注意一点,就是我们如果使用这个 g c c u f 的 g c c u f 格式的话,它会列出来你使用到了那个显卡设备是否在这里面,如果有的话,我们正常这边是可以看到我们自己的显卡的,那我们的显卡是一个英特的显卡,那这样子就能 呃识别到我们这个显卡,就可以调用到我们的英特尔显卡。 还有这个是模型的选择,模型选择的话,它默认的话,如果你选择的是基本聊天配置的话,就基本上就是呃要选择对应的这些模型进行做添加, 添加部分的话是在这个地方,那这个地方的话要选择对应的我们的这个模型的一个地址, 现在我们把模型地址和镜像地址改成这个, 然后点一下验证记,记得还要点一下这个重启,点一下确定好,等这边它重启完就可以了。好,关掉, 再拉到这边选择这个 s 的 选,选择添加 这个地址添加进去,这个地址一定要按照它的格式来命名空间一个, 命名空间一个,然后再加上仓库地址,仓库名称运营空间,仓库名称文件路径 点,添加我这边的话,我这个模型已经本地已经有了,然后如果你那边在操作的时候,它会跳到下载,自动下载,等待下载完成就可以了,现在模型就下载完了。 这边是对模型的一个参数进行调整,这个有一个温度 temperature, 建议调成零点八上,下文调成三十二 k。 好, 那我们来测试一下模型, 好会先导入模型,等待一会儿 好,模型已经正常工作了,这样子我们基本上大功告成了, 接下来再跟大家介绍一下这里面的开发工具,选择网络我们可以查看到接口的一个地址,把它复制下来, 在这边输入我们的设置的地址,然后加上 b e 模型,这样子我们就可以查看到目前可用的模型。 模型 id 这部分是可以直接配到我们的 open crop 里面的,也可以直接使用 ai pixel, 跟大家介绍差不多了。如果本期视频对大家有帮助,请点赞加关注,如果有什么问题可以在评论区留言,谢谢大家观看!

想养大龙虾 open 客,但是还怕 top 太贵?一个视频教你薅到免费的羊毛, ai 模型直接免费用,轻松实现无限的 top 自由。就是这个网站,先去用邮箱注册一个账号,接着验证一下手机号,就能直接调用 api。 最主要的是这个平台支持国内的手机号,而且不需要科学上网。注册好之后,随便选一个大模型进入聊天界面就行,就能切换各种顶级的开源模型,直接实现 token 和算力双自由渠道和手把手的使用。教程已经准备好了,放在了主页,胖虎 ai 军火库,需要的直接自取。

大家好,今天我们来讲一下 token 概念。那最近在 ai 行业里经常会听到一个词叫 token, 它呢不是某种产品,也不是交易概念,而是 ai 系统内部用来衡量一次请求复杂度的技术单位。简单理解就是当你向 ai 发出指令,让它生成内容时,系统需要调用算力来完成理解和输出, 而这些计算过程呢,会被拆分成一个个 token 来管理。那最近这个概念的话被频繁提起,主要是因为 ai 服务正在加速走向海外场景,当用户规模、语言种类、使用频率同时提升,系统就必须更精细的控制计算过程,确保不同地区、不同场景下的稳定运行。 那 ai 出海其实真正考验的并不是功能多不多,而是底层计算机制是否足够成熟。那这里的话主要就是云平台、成本端和光通信三个板块。 我们先来看第一部分,这一部分可以关注一下,主要就是润泽科技,它是多模型加多合作方算力订单数据港,这里是阿里云大客户,有长期订单。奥菲数据呢,是服务多家 ai 平台。云平台,这里是 token 体系的调动中书,它呢是把上层需求转换为系统可以执行的计算指令。 那有阿里巴巴是阿里云 ai 和 token api 渠道,全球平台能力强,腾讯控股,这里是腾讯云和海外布局。百度集团呢,是百度智能云加 ai 生态。 第三个成本端的话呢,那当服务规模扩大后呢?单靠中心化云资源是不够的,就更需要靠近用户的技术方案,主要是网速科技,是高并发 api 加 cdn 和优科德云服务边缘能力。最后一块的话是光通信,那所有 token 的 计算和调度呢?最终都是要回到最底层的。网络连接有中际续创是高速光模块, 新益盛这里是光通信核心部件,天府通信呢是光纤链路基础。

怎么样子节约?第一种就是说你在命令行加上 compact 就 压缩你的上下文,只要你在输入内容的时候加上斜杠,再加上这个 compact, 这样子系统它就会自动去把你的 历史的内容进行压缩,然后减少上下文的长度,那从而它是可以降低整个的 token 的 消耗。 第二就是说你需要把长的对话总结成短的栽秧,然后再进行对话,那这样子就可以把可能你让他去帮你做一件事情,你通过这样的方式 扔给他,那他最终就是消耗的托克到可能从原来的十几万压缩到只有几千这样的一个级别。 这是第三种就去用一些云平台,他们会推出比如像阿里云、腾讯云,还有像那个 mini max 云, 再还有 kimi 的 云,还有像华为云,意思就是说用这些云平台他们会推出这样的一个 呃综合的价格低的算力成本,因为它是综合采购商,它集中像 kimi, 还有像 mini max, 像 deepsea, 像 cloud 人,以及其他这些有想法的人,在数字世界中需要它来给你做助手的这些人的工具, 你在数世界可能有百分之二三十甚至六七十的事务性的工作,就那些重复性多,又是一些常规要去做的这些东西,你就可以扔给他,扔给他之后他会消耗很多的托管双利费,就像我过年前的时候,我在用这个的时候, 一天最高的时候就是说托管费,他高的时候有七八百甚至上千,后来调调调调调到现在 一天就几十块钱,就是二十块钱不到。我现在是三个在用,第一个是用的是富盛的 原质 ai, 我 原来买的是月费,我现在改成年费了,因为它后面用的是 cloud 的 四点六 oppo 四,它之前直播的时候,它讲的第二个我用的是乌班图, 我在改造过之后,我用原切 a r, 原来我是用 cloud, 酷狗就用 a r 编程,让他去帮我按照我的想法去改的,后来完全一托于原切 a r, 让他去给我改, 改完之后我扔上去就测,特别是安全问题,以及根据我的情况,我的诉求的问题,我有很多事务性的工作,我就扔给他做。第三个我是在测 mac, 我 也在看有没有更好的东西,其实这个本身来说是一样的,因为 mac 相对 windows 和步班图来说,它的安全性会更高,还有 windows, 所以我会很注重这个安全性。当然我这三个都是在我的统一的 windows 的 bm 虚拟机下面,并且我这三个上面都装了相应的安全。 windows 有 windows 的 三六零体式安全,也无端的 linux 下面的一个安全 mark, 它本身就已经也很安全了,我又装了一个对应的安全应用,这样子在,并且我的龙虾,我自己也也让 ai 以及参考了别人的帮我安全包了几层,这样子我就相对来说它要突破三四层, 用我的自己的 windows, 我 又用三六零加 windows 防火墙,就做了极致的安全,这样子我的安全基础的就已经有了 产我的 ai 时代下的产品专家已经上线了,它是包含三个部分,一部分就是说它通过一个又一个的技能,最终把这些技能形成一个体系,让这些体系内化成你的叫做手感。 第二个,你的你的产品如果是一个软件类或者是 ai 应用类,那么用教你用 ai 编程, ai coding 的 方式让它怎么样子完成,并且把你的这个产品上线可用。第三就说如果你在数字世界中需要有 就是这样多智能体,类似于你要去用 opencloud 或者是 nano cloud, 就 用龙虾这样的工具去做多智能体的去处理的,那么会教你用 ai 编程的方式去手搓这个东西,去按照你的意志,去你的想法去打造你的专有的龙虾。

哈喽,同志们,今天我们聊聊算力。 ai 时代的全球竞争本质上是一场关于弹药的战争,而在 ai 时代, token 就是 子弹。可能有很多人到现在还不明白 token 到底是什么东西,其实很简单,我这句话给你说明白,就是你跟 ai 哪怕说对话, 说一句话,你让他给你写一个方案,让他给你生成一个视频,生成一张图片等等一系列的,只要你跟他有互动,这些都需要消耗 token。 那 像我们普通人,你平时凑个热闹,跟 ai 去交流交流,让他给你画个图啊什么的, 让他给你设计点什么东西,那就像玩具枪里面的塑料子弹去打个气球一样的,可能你打两枪就不打了,玩过就不玩了嘛。 那现在不一样了,现在的话,因为我们 ai 大 模型的不断升级,不断进化,对吧?我们 ai 越来越牛逼了嘛,那全行业都在用 ai 去干活赚钱了呀,做业务就好像程序员用 ai 写代码,创作者用 ai 去做视频,设计师用 ai 画图等等。 那到了这一步, tokon 就 不是塑料弹了,它是正儿八经能打仗的真枪实弹了,它可以被用来去打市场,用来去赚取真金白银了,就这个子弹打出就能换订单,换零售,换市场了。 但是你要知道,子弹它不会凭空出来的,对吧?每一颗 tokon 的 子弹都得用算力来生产,那算力它就造子弹的兵工厂, 你有多少稳定低成本自己能说了算的算力,你就能造多少子弹,你能造多少子弹,你就能接多大的生意,你能接多大的生意,你就在,你就能在 ai 这条赛道里站的多稳?那为什么现在突然聊这个呢?因为从今年 开年开始,整个情况就突然变屌了。那我们国内的朋友应该是最早感受到这个变化的,先不说远的,就说大家都 刷到过的那个字节的 c 蛋是二点零。这个视频大魔性有多火,不用我多说了吧,前面我也专门,我也有专门出过这个视频,可以去翻一下我前面的视频。 这个大魔性牛逼,是真的很牛逼,能够直接生成剧情啊,带运镜啊之类的对吧?画面也很牛逼,但随之而来的是什么?是全网都在吐槽的排队。就算是你充了五千一百九十九块的高级会员,高峰期提交一个视频生成任务也要排队。就算是你充了五千一百九十二个小时才能拿到一段十几秒的视频, 那我们普通用户就更不用说了,前面排几万人一天都未必能够出片。而且这个还不是个例啊,现在国内所有的头部大模型都在缺算力,都在要排队,小米新模型上线二十天,收入就超过了过去整整一年。二十天对比一年啊兄弟们。 结果就是直接公开高喊缺算力,缺显卡,满世界去找算力合作伙伴。讲一个实打实的数据,就是今年二月份,全球性的 ai 接口聚合平台 open loop 出了官方榜单, 全球掉用量最高的五个大模型,我们中国就占了四个,而且二月每周的 toker 掉用量比一月还比这 翻了一倍。那这组数据的背后,不只是我们国内用的人多了,更关键的是,现在全世界都在认可我们中国的 ai 能力了,像海外的企业创作者、开发者也都在用我们中国的 ai 了,这就不是我们单纯在国内小打小闹了,这是把账直接打到全球市场去了。 那说到这里,就大家都最近都听到的那个算力出海了吗?那很多人以为算力出海就是把服务器啊,芯片啊是这种东西卖到国外去,那我只能说格局小了, 像过去的几十年,三四十年吧,我们中国是靠什么?我们是靠卖衣服,卖家电,卖工业品这种东西去完成全球化的原始积累,赚到了全世界的钱。 那现在呢?现在 ai 时代, ai 时代全世界最缺的是什么?缺的是 ai 算力啊,兄弟们,像现在的海外 ai 应用,用户排队动议就要排一天对吧? 有的甚至可能要排几天,有些国际巨头为了抢产量,连自己的股权期权都拿出来了,就为了能稳定的拿到货。那咱们的算力出来,本质上就是拿着我们自己造的兵工厂给全世界提供 ai 子弹。 那具体的来说就两条路径,第一条就是把我们的国产 ai 芯片、服务器全站系统出海,这个属于硬件出海,是去抢占全球算力基建的份额。第二条是在海外建立合法合规的算力中心,用我们自己的算力底座去给全世界提供 ai 服务, 用我们稳定高性价比的头壳的供给去换美元,换用户,换行业话语权。然后到了这里,有一个很核心的前提, 也是大多数人会忽略的,就是你不可能总拿着别人造的枪管去打仗吧,对吧?说白了就你要是你的 芯片,你的核心技术都是别人的,那别人随时能卡你脖子的对吧?人家一卡你脖子,你不完蛋了?你的兵工厂直接就停工了,你的枪直接就压火了, 那还怎么打仗?怎么出海去赚钱?就像过去我们的数字经济很多时候就是在别人的地级上盖房子,人家一抽地级房子就直接塌掉了。但是现在不一样了,我们国产的高端 ai 新,比如华为升腾的九五零,它核心的推理性能, 也就是我们平时用 ai 干活最常用的能力,已经对标了英伟达的 a 一 百很多场,甚至很多场景下性能还会比人家高一截。同时我们国内的头部大模型现在都在优先配备我们自己的国产算力生态, 先进制程的才能也在慢慢往上爬。也就是说我们有了我们自己的从头到尾全链条都是自己说了算的弹药生产线,有了能够支撑我们把账打到全球去的底气。至于算力会不会过剩,那如果真能过剩,那也是牛逼了。 就现在这个情况,只有缺口没有过剩。按照国际头部券商还有伽纳这种全球第三方机构的测算,我们国内 ai 训练和推理用的算力缺口至少到二八年都会持续存在。因为 ai 对 我们的生活生产的改造才刚刚开始, 我们现在还只是简单的用 ai 去做做内容,写写代码,搞搞设计什么的,那未来 ai 机器人、 ai 驾驶、 ai 制造全部都会深度的用上 ai, 可以 说到时候 ai 应用的地方只有我们想不到,那到了那个时候, tiktok 的 消耗量只会从指数级的往上去 跑,会比现在的这个量要翻好几个量级。那一边是按月甚至按周翻倍的子弹需求,另外一边是建一个数据中心,造一条芯片生产线,动不动就是一年半载,三年五年的 供给周期,需求涨得飞快,然后供给又跟不上。就这条赛道最硬的逻辑,以前的互联网时代,建服务器买算力就是 纯纯花出去的成本,是为了支撑住自自己的业务。那现在对于做算力计件的厂商来说,算力就是能直接赚钱的核心资产了,兵工厂只要开起来,造出的每一颗子弹都能卖钱。而对于下游用 ai 的 公司来说,算力就是现在它最大的刚性成本了, 谁能拿到更便宜更稳定的算力,谁就能比同行更赚钱。也就是现在全世界的公司都想降本, 都想拿稳定的算力,才给了我们国产算力出海最好的历史性机会。投坑为蛋,算力为己,自主可控为核,全球化合规布局为界。这场关于算力的竞争,不是一次短期的风口炒作,而是一场关乎未来 十年中国 ai 产业的长期战役。而能走到最后的,永远是那些手里握着自己的弹药生产线,能把子弹稳稳打到全球市场的玩家。行了,这个视频也够长了,今天就先讲到这里,看完的给我评论区留言。看完了下个视频,我们聊一聊华为的升腾,点个关注,一起发财,拜拜!

启蒙啊,审核能不能通过?能不能啊? siri 审核能不能通过?

宝贝们,今天我们来聊一个百分之九十九的人都没有看懂的东西。很多人觉得 ai 就是 聊天的机器人,就是帮你写写文案,画画图。如果你还停留在这个认知,那你就已经错过了这个时代最大的财富重构。 一九五六年,美国发明了集装箱,之前全球的贸易成本有一半花在装卸的费用上,集装箱一出现,货物被标准化了,而今天的世界格局就是那个铁皮箱子鉴定的。 二零二六年, ai 的 时代也出现了一个集装箱,它不是铁皮做的,它叫 token。 什么叫 token? 简单的来说就是 ai 处理信息计算的单位,你问他一句话,他给你写一段代码,生成一份报告,这背后都在消耗 token。 很多老板听到这个词,觉得这个技术词跟自己没关系。错了, token 的 本质是一次电力时代的重新定价,而你把电力想象成之前的货物,它不 好运输啊,他装卸费用高啊。而这个 taco 就是 把电力直接让他便于运输了。你想想,之前我们家的电力要想卖到全世界,他是不得建电网,是不得特高压。而现在直接我们把算力中心建在我们家,电 力直接在算力中心里面生成算力 taco, 我 们就可以直接卖给世界上的其他国家。道德经讲的,天下万物生于有,而有生于无。 taco 就是 把看不见的智能变成了看得见的,可以买卖的。有啊, 接下来我给你算一笔账,你就明白了。一度电直接卖大概五毛钱,这一度电拿去电检铝,能够卖到一块五毛钱,翻了三倍。但如果你把这一度电拿去跑大模型推理呢?一度电大概能够产出五百多万个 token, 按照国内模型的定价,能卖到十一块钱, 是直接卖电的二十二倍,这个比其他行业的利率可大太多了,对不对?而如果按美国 openai 价格计算呢?那可以卖到将近四百块钱, 那是七百八十五倍啊!同样一度电,换一个赛道,价值差就几十倍上百倍。这不是能源的生意,这是算力的生意,这是标准化的脑力出口啊。道德经说,有是无之相生,难是意志相成啊。电和投肯本质上是同一个东西, 但有和无之间的转化,就是几百倍的价值差。未来谁能够完成有生与无的转化,谁就掌握了新时代的定价。 更关键的一点是,电不能装箱啊,不能跨国流动啊。你要修电网,得建特高压,还得对方的国家批准,但是头肯不一样,只要一根网线就完成了算力传输啊。印度创业者还可以调用中国的 a p i, 背后就是甘肃的风电和青海的光伏。在转 没有出国,但是算力出国了,他钱就回来了,这才是结构性的机会。有人说了, ai 现在这么卷,价格都打烂了,还赚什么钱呢?兄弟,你只要看懂一件事,现在的二十二倍,它可不是天花板,它是价格战的结果。没 美国把投坑的价格铆定在了高位,负责教育市场,而让全世界都知道这个东西很值钱。中国在有工程能力把成本打下来,负责规模的收割,美国负责定价,哎,我们负责走量,这就是新的全球分工。所以你别看他现在卖的便宜, 你等美国给他定完价以后,他没有生产能力,那我们有生产能力的不就拥有了新的定价权了吗?所以你不要 用现在的投坑价格给我预算以后的投坑价格,知不知道未来是不是 ai 的 时代?你能不能离开 ai? 你 能, 能比 ai 更智慧?你们能不能比 ai 算的更快?如果不能,你想想这个头看值不值钱。那个又说那美国不会跟我们捣乱吗?大不了到时候分他一点不就完了吗? 他不就不闹了吗?你看看今天他都开始给俄罗斯卖石油松口了,你猜这里边美国要不要分一杯羹啊?前两天那俄罗斯的天然气船是让谁给炸的? 我干不成,我能毁呀?我不需要有价值,我只需要不闹,你就得给我好处。你回看一下,黄毛这一年来是不是都是这么干的?而你以为只有黄毛会这么干吗?我们也会啊, 只不过我们干的比它隐蔽啊。之前我们为什么要大力发展新能源?哎,首先的目的不是我们能赚多少钱, 第一就是要打破美国的石油霸权,第二就是让美国的汽车他赚不着钱,结果不光美国的汽车,连奔驰宝马奥迪他都赚不到钱了,而 deepthink 的 横空出世直接开元,这是要赚钱吗?这还是要让美国的 ai 赚不到钱,你还心机之门吗? 哎,你还想美元绑定算力吗?我直接把你的门给你拆了。这不最近 open club 火了,大家都在研究怎么样养龙虾,但是都忽略了养龙虾也已经上线了,展示的功能,他 可能不如进口的龙虾,但是我们便宜,我们免费啊,这你受得了吗?当下就是美国干什么,哎,我们就干什么,我们不一定干的有多好,但是我们一定能拆的很好, 只要什么商机。哎,美国先把它的价格炒上去了,中国立刻就用低成本来切入,你以为是价格战?这是对未来世界的定义权的博弈。美国,你光有 ai, 但你没有算力呀啊 啊,你还想美元铆定算力?未来就是中国铆定算力的时代。哎,你还别不信,你也别不服啊,美国缺电力,缺的都不见发电厂都开始去买柴油发电机了。我的妈呀,这柴油发电机发电得多贵啊? 这玩意他能不卖四百块钱一度吗?我们十一块钱一度就赚了二十二倍,他得卖四百,知道吧?因为压是柴油发电, 所以说当下值得我们思考的不是哪个模型更强,而是在这个时代,你是卖店的,还是卖 token 的? 你是卖原材料的,还是卖标准化算力的?所有的产业都会被 token 冲过,教育按 token 计算,服务按 token 计费, 编程、营销、法务、设计、咨询,全部都会变成可以计量的智能服务啊。一旦被计量,就可以规模化,一旦规模化,就会诞生新的巨头啊。生意的本质从来没有变过,谁掌握标准,谁赚的溢价, 谁只卖原材料,谁就会被压价呀。一九五六年,掌握集装箱标准的人重塑了整个全球制造业。 而二零二零年,掌握头看标准的人,将能够重塑未来世界的全球智能算力市场。道德经说,智 知人者智,知己者明啊。如果你是老板,现在真正该问自己的不是要不要用 ai, 而是你能不能把自己的产业装进 tokken 里去卖啊,实在不行了,咱就去提前买入 tokken, 咱未来去卖,再不然就布局成为 tokken 的 生产的股东啊。电力过剩不是问题,算力过剩才是机会 基数,他可以东算,这战争才刚刚开始,算力需要充沛的电力支撑,目前全世界超过三分之一的电力,哎,就在中国产生,当下全世界的国家连民用电都保障不了,哪个国家还有电力去生产?算力就在刚刚,哎,我们朗哥可神助攻了, 炸了阿联酋和巴林的数据中心啊,理由是他们为美军提供了军事算力。那你猜全世界的国家既有充足的电力的,又有安全的保障的,他是谁呀?而他们家未来算力的发展所带来的利益,你敢想象吗?我只能帮你到这了,看 懂趋势才能看懂未来。别老问我买什么了,买客,我是个卖客的,不是卖消息的。当然付费可以缩短时间,买客可以拉近你我的距离,钱可以解决的事,就别总指望白嫖了。白嫖的信息你敢信吗?你敢用吗?你不敢用的信息有价值吗?没有价值的信息,你白嫖了真的就是白嫖了。 姐,多事是心,居士,透过现象看本质,让我们跟国家一起乘风飞扬,就忘了那个曾经伤害过你的人。 请不要独自在深夜里喝酒和哭泣,你要相信这个世界,相信总有一天你的盖世英雄会踏着漂亮的云彩来娶你, 对自己好一些妹妹。

朋友们,你敢相信吗?中国有一样看不见摸不着的东西,正在悄悄占领全世界。它不是手机,不是汽车,也不是衣服,而是一种叫 token 的 数字服务单位。有朋友可能不太懂什么是 token? 你 可以把它想象成 ai 的 工作量计数器。比如,你让 ai 写一段话,回答一个问题,画一张图,它就要干活,每干一点活,就消耗一个或多个 token。 全球开发者调用 ai 服务,就是按 token 来付费的。 最近,全球最大的 ai 模型平台 open router 公布了一组惊人数据,二月九号到十五号,中国 ai 模型的掉用量第一次超过了美 国。紧接着第二周,咱们直接冲到五点一六万一,三周直接大涨百分之一百二十七,近乎翻倍,而美国那边反而在下降。 更厉害的是,全球使用最多的前五款 ai 模型里,四款都是翻倍,而美国那边反而在下降。更厉害的是 m 二点五,智普的 glm 五, 还有 deepsea 的 v 三点二,加起来占了全球 top 五总使用量的百分之八十五点七。为什么全球开发者都开始用中国模型?两个字,又快又便宜?我们的 ai 不 仅性能强,关键是成本低。而这个低成本的背后,藏着一个很多人没看懂的秘密,中国正在通过 token 把电卖到全世界。 你可能会问,电怎么能卖出国?电线又不能跨太平洋扑过去。确实,物理上的电没法装箱,出口 耗大、成本高,还受国界限制。但聪明的做法是不用送电,送电算出来东西就行。举个例子,一个美国用户调用中国 ai 模型,他的请求通过海底光缆传到中国数据中心, ai 在 中国用本地的电力完成计算,再把结果传回去,整个过程一度电都没出国,但电的价值已经 通过 to 肯实现了。跨境变线,这波操作真的太绝了。要知道,在 ai 的 成本里,电费加算力设备占了七成以上,而中国西部有大量便宜的风电、水电、光伏等绿色电力,电价只有欧美国家的三分之一到五分之一。 再加上我们有完整的服务器、散热光模块等产业链,建数据中心又快又省。所以同样的 ai 服务, 中国能卖的更便宜,响应更快,还更稳定。全球开发者当然愿意用脚投票,纷纷转向中国模型。这一切都是因为全球对 token 的 需求在爆炸式增长。以前中国靠出口衣服、家电、手机赚外汇,那是体力活。 现在我们靠出口店家算力加 ai 服务赚外汇,这是脑力加能源的高附加值生意。屋里的店有国界,但数字的 token 没有国界。店走不出去的路, ai 帮他走,店做不到的事,算力帮他做,店赚不到的钱, token 帮他赚。 这不是炒作,而是一场静悄悄的产业革命。未来,随着 ai 走进医疗、教育、金融、制造各个领域, token 的 消耗只会越来越多。 中国凭借廉价绿电加强大算力加优质模型的组合拳,正在打开一条全新的数字能源出货通道。 这可不是单纯的技术牛,更是咱们国家的战略眼光选对了路,把我们丰富的清洁能源转化为全球都能用的数字服务,既赚了外汇,又利用了清洁能源,还不用跟别人掰扯贸易壁垒, 这波操作简直太妙了!朋友们,中国 ai 这波靠 token 实现电力出口,是不是太牛了?你觉得这四家中国模型谁能成为全球老大?评论区聊聊你的看法。我是率先在全球提出硅基生命与硅基文明的硅基智能创始人司马华鹏,关注我,每天传播正能量,带你解锁更多硬核科技!

但凡你是关注 ai 的 兄弟,就会注意到最近有一个爆炸性新闻,就是最近阿里新成立的一个事业部叫 token 事业部,这是继他几个大事业部整合,第一次推出一个全新的事业部。那这个事业部基本上把它 ai 各种相关的都包到里边,但是为什么它不叫 ai 事业部 叫 token 事业部,这里边就有一个重要的研判在里边了。我非常喜欢阿里这套分法,上周的时候我跟大家聊过一个事情,核心想给大家表达那八个字叫算法退位, token 为王。他第一次把 ai 这个东西用做基础设施的比喻给说明白了。 那他说的所谓创造托根、输送托根、应用托根我还是听不懂,但是你见过发电、输电和用电吧?是不是都是基础设施?是不是提的什么概念叫算电协调啊?既然算和电都是基础设施,那么是不是他们的分类就应该类似? 阿里是不是把他所有的五个部门全都装到这里边去了?装到这里边第一个创造托根的是什么东西?就就是做模型的呗,同意吗? 它就像发电站一样去创造模型,创造 token。 那 输送 token 的是谁啊?输送 token 是 不是就是那些数据中心啊?我之前上一周跟大家聊过那个数据中心的对接呢? 那包括你数据中心需不需要有些接口接进来?那就是不是就是他那些 api 呀?那就是接口,是不是啊?各种接口你都凸 b 的 也好啊,凸 c 的 也好,是吧?这些接口全都接近的,接近你的技术设施来,让他能在上面跑。而且这个所谓的输送 token 就 说非常形象,为什么?就是你既然是一个输送 token, 就 类似书店这种功能,那是不是只能输阿里的 token? 不对吧?那你应该是所有的店或者是所有的拓客你都能在上面跑,那所以大家如果真的在用这个阿里云服务的时候,大家会发现他的小龙虾其实里边是可以用其他的模型的, 他也能用 mini max, 也能用,也能用 kimi, 所以 这是不是把输送拓客这个东西说的非常形象了? 最后一个叫什么叫应用图腾,按理说之前的应用图腾是应该是什么?就是现在的小龙虾是不就是很典型的 原生的叫 ai 应用啊?那阿里已经不满足于单纯的就给各种软件开一些接口,或者说单纯的为各种商业流程去做一个工作流,这种事情已经做厌了,而且每一个工作都有自己的特殊性,很难做到 让大家满意。现在他要做一个什么东西?是一个 b 端的应用平台,像小龙虾一样平台,所以他的三块内容是不是比较清晰了?那这三块内容其实大家会发现基本上都属于什么东西,都跟什么偷看有关。大家都知道 ai 的 三大元素, 算力、算法、数据。那我们看一下其实阿里数据有没有数据?他在另一个大的事业部里边,智能云事业部有吧? 算力他平,头哥好像没病到里边是不是专门做芯片研发的?是不是他也有?那我问大家算法去哪了?算法之前是不是阿里的同意在做? 那同意,现在是不是被完完整整的被并到了头肯事业部里边的创造头肯这个部分里边去了。所以我跟大家说,算法这个东西现在重要性,还能够跟数据算力平头共进吗? 如果他那么重要,为什么我们在输送托肯的时候,不仅可以输送千万的托肯,他也可以输送 kimi, 也可以输送其他,只要国外大厂你愿意把算力接进来,他也可以输送呢? 他更像是一种基础设施里边的一部分了。这个研判跟上周我跟大家说的一致吧。那么看再看其他几个事业部, 之前的千问和百炼,一个是凸 c, 一个是凸 b 的, 大家用过没有啊?我用千问这东西我老是找不到北 就是他的阿里云,千问百炼各有一个借口,然后完了之后我一搜,然后完进去之后点点点啊,在各个平台这些切切切,现在他并成一个,全都并成 输送 token 这个部分去了。而最新成立的这个悟空啊,会放到应用 token 里边,不过它还有一个创新事业部。但是总体大家看下来就是把算法挪到了第二期队里边,而把 token 整合成了一个第一期队, 那以后大家聊起来就不是算力算法数据了,以后就是算力数据和 token 了,而算法是不是放到了 token 的 一个子模块里边,就证明算法这个东西对于整个 ai 系统的影响正在变小。 这个框架一推出以后,你有可能还会看见更强的芯片,有可能会看见更好的数据归机方式和更好的云,但是单靠一个模型或者单靠一些好的算法 就能够脱颖而出的时代一去不复返了,以后比的是电力、钻力和模型的各种协同,比的是你的 ai 是 否能够真正被大家接受,真正能够很好的应用,比的是整个的 ai 协同的生态。那现在这种生态比较好的在哪里啊? 是不是还带我们大港股?这也是上周我跟大家说港股大家可以多几份期待的一个原因。说实话,最近用一段时间龙虾之后,我还是有一点感慨的,就是之前我们老形容我们自媒体做得好叫公平公正啊,客观, 但是现在看起来,我们再公平,再空中快客观,也很难客观过 ai 了以后,算法都变成了一个统一的标准体之后,它生产出来东西就是公平、公众和客观。我们这些自媒体人所在的意义在哪呢?我也在想,以前我特别 不太理解天天给大家疏通这种情绪价值,但是在看完了 ai 同理之后,我觉得可能未来我的真正的功能也是给大家提供情绪价值,让大家在搜完了 ai 的 一些答案之后说啊,真人也是这么看的 啊,所以我现在诚心审视我自己的价值,然后多给大家没事唠唠嗑,在大家情绪低点时候,带,大家没有信心的时候带,大家 不太坚定的时候,我能够站出来说啊,除了 ai, 人也是这么看的,真人也是这么看的啊,所以珍惜每一个还在独立思考,跟 ai 做了最后斗争的人类啊,真人希望每天可以见到你们,再见!拜拜!

token 主要是指 ai 大 模型里的词源,简单说, ai 处理文字的最小计算单位,一个 token 约等于零点五个中文字或者一个英文词。使用擦的 gpt 豆包、 deepsea 本字都是在卖 token 消耗算力 而暴利收割全球。算力变现指的是电加 gpu 等于算力,而算力等于 token。 token 卖给全球。 中国的优势是西部绿电便宜,零点一到零点三元每一度,而欧美是一到两元每一度。电模型优化强单位 token 消耗耗电极低, 一度电约等于生成五百到九百万 token, 而 openai 百万 token 卖约七十元,而中国模型百万 token 卖约两元,那成本一度电约等于零点二元。卖 token 收入约等于十到十八元,毛利率约等于百分之九十八, 这是成本与售价的倍数差,便通过 token 进行价值放大。为什么叫收割全球?因为没有实体零关税,绕开贸易壁垒,只卖 api 服务,不出口芯片或者服务器 全球定价权。中国 token 成本是欧美的十分之一到五十分之一,价格却能对标全球第 三。规模效应,全球 ai 掉用量暴涨,中国模型周掉用量已经超过美国。万亿级 token 约等于万亿级收入本质上面是把中国廉价电力, 中国 ai 算力包装成高附加值数字商品,卖给全世界。 ai token 的 暴利来源是人员加算力加规模加国际化的极致效率,它的风险面临监管、数据安全和价格战。 中国用便宜绿点加高效 ai 模型把算力包装打包成 tocan, 零关税卖给全球,成本极低,售价不低,形成全球级的数字暴力生意。

咱们今天来聊一个特别有意思的话题,一种你看不见也摸不着的出口。他没集装箱,也不走货轮,但他正在用一种我们可能都还没意识到的方式,悄悄改变着全球的经济格局。 来,先给大家看一个数字,绝对会让你大吃一惊。摩根大通有个预测,说到二零三零年,短短五年时间,中国市场的透肯消耗量会增长超过四百倍。你没听错,是四百倍,年复合率高达三百三十倍, 这什么概念?这根本就不是普通的增长,这简直就是一场爆炸呀!好,那问题就来了,这个即将要暴涨四百倍的东西,这个所谓的透肯到底是个啥? 我给你打个比方啊,咱们都听过一句话,叫数据是新时代的石油,对吧?那偷看呢?它就是 ai 世界的硬通货,是驱动整个 ai 世界的钱。 说白了,它就是 ai 世界里的度量衡,你跟 ai 说的每一句话,下的每一个指令,让他写的每一行代码。其实啊,背后都是用偷看来计费和计算的 啊。你想想,四百倍的增长又是个什么概念?这可能就意味着,几年之后,咱们每天跟 ai 互动,让他干活的次数可能会比现在刷微信的次数还要多。这可就不只是个技术问题了,他会彻彻底底改变我们的生活和工作方式。 哎,说到这,你可能就好奇了,这个 token 跟咱们中国的电力能有什么关系?嘿,别急,最有意思的部分来了,咱们来拆解一下这个看不见的出口到底是怎么一回事? 来,咱们来想象一个画面啊,一个在旧金山的程序员,深夜里啪啪啪敲下一行代码,想让 ai 帮他干活,他可能觉得,哦,这请求是发到硅谷那个福气上了吧。 但实际上呢,这些数据啊,嗖的一下,穿过太平洋海底的光缆,直接就跑到了咱们中国,比如贵州的大山里或者廊坊的数据中心,然后成千上万的 gpu 瞬间被点亮,开始疯狂计算,用的可全都是咱们中国的电, 算完之后,结果在原路返回,啪出现在那个程序员的屏幕上。你看啊,整个过程,电没出去, server 也没搬家,但真正出口的就是这个叫 token 的 东西。 所以你看华泰证券有个说法,我觉得特别到位,说 token 是 最纯粹的电力衍生品。为什么这么说呢?你想啊, 一个 token 的 成本里头,超过百分之七十都是电费和硬件,这就厉害了,对吧?这就意味着,咱们中国现在正在用咱们一直以来的一个巨大优势,便宜的电去撬动一个未来最值钱的东西,全球 ai 服务的定价权, 这就把我们带到了一个全新的战场。如果说 ai 竞赛的上半场,大家比的是谁的芯片牛,那下半场我跟你讲,比的就是能源,比的是谁家的电更便宜更足。咱们来看看中美现在的情况,这个对比就非常有意思了, 美国那边技术是强,但现在碰到个大麻烦,缺电,电网老旧,想建个新电厂,那个审批流程能拖死人,搞的那些科技巨头都急了,琢磨着自己建核电厂了。 你再看咱们中国这边,情况就不一样了,咱们有全世界最大的清洁能源电网,有成熟的特高压技术,能把戈壁滩上那一望无际的光伏板 这么一对比,能源成本上的差距一下就成了这场比赛里最重要的升幅首。而且啊,这种能源上的差别已经不是纸上谈兵了,它已经实实在在的开始影响全球的云计算市场了。 你听听这个消息,谷歌允前段时间突然宣布,在北美一些数据传输服务的价格直接翻倍,涨了一百趴, 亚马逊的 a w s 也跟着涨了百分之十五。哎,你可别小看这个涨价,要知道,在过去快二十年里,云计算这个行业的主题永远只有一个字,降! 大家都在疯狂打价格战,现在突然掉头涨价,这说明什么?说明风向彻底变了。全球的算力已经从一个谁都能来挑挑拣拣的买方式场 当算力成了稀缺品,那谁的成本低,谁手里有货,谁就说了算,谁就有定价权。好,那咱们把刚才说的这些点全都串起来,看看这背后到底是一盘怎样的大棋,一场多大的改革正在发生。 这里有一个核心概念叫工业电力的金融化。听着有点绕,其实很简单,你想想,过去咱们是怎么用电的呢?我们把电变成电视机、冰箱、衣服这些看得见摸得着的东西,然后出好到全世界。 但现在呢,我们把店变成了看不见的算力,变成了 token, 再卖给全世界,这本质上是一次价值链的巨大升级啊。那这对我们来说意味着什么呢?我觉得至少有三点。 第一,定价权。咱们从以前那个只能给别人代工被动接受价格的角色,变成了现在可以参与制定核心服务价格的玩家。 第二,我们得重先看看咱们的家底了,那些电网啊,数据中心啊,以前觉得就是些基建,现在呢,它们就是 ai 时代的新油田。第三,未来可能会有一种新的通货膨胀, 以前咱们老盯着猪肉价格、石油价格,以后啊,说不定大家都要开始关心偷啃通涨了,因为全球的钱都要来抢这点算力。 所以你看这场用电驱动的算力出海,他虽然看起来静悄悄的,但背后是一场非常深刻的产业变化。 好,那最后也留给大家一个问题,咱们一起思考一下,你觉得咱们中国在电力和能源上的这个优势到底能保持多久?在未来的这场全球算力竞赛里,他会是我们真正的沪深核吗?欢迎把你的想法打在评论。

你今天用了多少 token? 大家好,我是爱挖钻石的小爵牛。大家最近是不是总刷到一个词, token。 二零二六年三月十一日,国家超算互联网,也就是国家级算力基础设施平台,针对平台全体欧邦克劳用户大手笔赠送了 每人限时两周,总计一千万 tokens 的 算利额度。很多人一看操作门槛就摆摆手说,跟我没关系。确实,当下绝大多数普通人因为设备、操作习惯、认知的原因,暂时还没法直接领到这波福利。但我想跟大家说, 别急,这只是开始。国家送 token 送的不是一张只能少数人领的优惠券,而是给整个 ai 行业的在接力大红包。现在一大批专业开发者、技术团队正拿着国家给的算力福利,日夜不停的打磨模型。 他们在做什么?不是造高高在上的实验室产品,而是把复杂的大模型拆成我们每个人都能用的小工具。 未来你会看到不会用电脑,也能对着手机说话。 ai 帮你写文案、做表格,不懂技术也能一键生成海报、剪辑视频、整理资料。农民、 小店主、上班族、学生,人人都有贴身 ai 助手。那到底什么是偷坑呢?我用最通俗最接地气的话解释给你听,你就明白了,偷坑是算利的计量单位。你跟 ai 说一句话, ai 回你一段话,它不是按字数算,而是按多少元算,每亿元 就是一个 token。 举个最简单的例子,你问今天天气怎么样? ai 先把这句话切成一小段一小段,这就是几个 token。 ai 回答, 今天晴,气温二十度,适合出门。这句话又会被切成另外几个 token。 你 用 ai 的 过程就是你喂它 token, 它吃进去,消化完以后,它又吐出 token 给你。 所以啊,偷坑就是 ai 的 计算单位说的话,越常用的偷坑越多,算力越贵,偷坑就越值钱。一句话总结,偷坑就是 ai 干活的工作量,你用 ai 越久,聊得越多,消耗的偷坑就越多。今天你可能还没摸到偷坑,但明天 ai 会以最简单的样子走到你身边。不用懂部署,不用懂代码,点开就能用。国家把算力底座搭起来,工程师把好用的产品做出来, 最后受益的是我们每一个普通人。你只需要相信人工智能的时代,红利一定会普惠到每一个人。点赞加关注,陪你一起活在当下,布局未来!

大家好,今天我们用三分钟讲透 ai 产业底层商业逻辑。黄仁勋提出的 token 工厂经济学,首先明确核心概念。这里的 token 中文意思叫磁源,和虚拟货币、区块链没有任何关系,它是 ai 大 模型处理信息的最小数据单元,是 ai 时代的标准化产品。 黄仁勋这套理论的核心,就是把 ai 算力变成了一套标准化、可量化、可盈利的制造业体系,它彻底重构了数据中心的价值。 传统数据中心是存文件的仓库,而 ai 时代的数据中心就是一座二十四小时不间断生产 token 的 智能工厂。这座工厂的完整逻辑非常清晰, 电力是生产原料, ai 芯片与算力集群是生产核心的硬件底座, ai 服务器、高速光互联、液冷散热、高端 pcb 是 核心生产设备,最终产出的产品就是 ai token。 而整个工厂的核心 kpi 也是核心盈利密码就是 token w, 也就是每瓦电力能产出的 token 数量。核心目标就是在固定电力上限下最大化 token 产出,最小化单位 token 成本。为什么这个指标是行业黄金标准?因为黄仁勋点破了 ai 产业的物理铁律, 是 token 工厂不可突破的天花板。一个数据中心的供电总量是锁死的,单纯堆显卡、堆积柜没有长期意义。未来 ai 算率的竞争,本质就是效率的竞争。同等电力下, token w 越高,生产效率越高,单位成本越低,盈利能力就越强。这套经济学彻底改写了算力行业的游戏规则, 全产业链的价值平台都围绕能不能提升 token w 展开,而算力租赁就是 token 工厂产能的商业化分销出口。在这套思维下,行业竞争的核心早已不是单一芯片的比拼, 而是算力集群整体系统能力的提升。在这一赛道中国具备全球领先的核心竞争优势。首先是无可替代的电力成本优势。 剔除西部丰富的绿电资源与东数西算工程的全国算力网络布局,我们拥有全球极具竞争力的低电价,直接击穿 tiktok 工厂的核心成本线,从根源上拉高磁源瓦的核心效率。其次是全链条自主可控的配套优势,我们拥有光互联、 pcb、 叶冷等 tiktok 工厂全环节的全球核心产能, 供应链稳定性与成本优势独步全球。更关键的是全球顶尖的系统级优化能力,以华为 atlus 九百五十算力集群为典型代表,通过算力调度、网络协调、能效管理的全占优化,实现了万卡集群百分之九十以上的限行加速比, 把算力损耗降到最低,直接将磁源瓦效率拉至全球第一梯队。这些从能源底座、硬件配套到系统优化的全闭环优势,让中国在全球 toc 工厂的竞争中掌握了核心的效率话语权。 也正是基于这套核心逻辑,我们准备了三期系列节目,带大家完整梳理 tiktok 工厂的全产业链机会。第一期聚焦 tiktok 工厂的传输神经网络光互联赛道。第二期拆解工厂的硬件载体 与散热心脏, pcb 与夜冷赛道。第三期落到产能变现中局算力租赁赛道筛选同步高成长标地。感谢收听我们系列节目,再见!

两天在 gtc 前天听了黄仁勋的演讲,他当时现场给大家算了一笔透坑的经济账,当时听觉得很烧脑,这两天反复思考,现在终于有点时间来和大家试着分析一下他的观点。那黄仁勋是通过这个透坑分层的定价模型 来说明了未来推理的商业价值。那老黄在现场做了一个假设,他是把算力分成了四份,分别用这四份去刨免费层、 中端层、高端层,还有顶级层。那就是通过这个分层模型,老黄算出了一个惊人的结果, blackwell 平台创造的收入 能够比传统的模式提升五倍。听到这,你可能在想,这是在算什么账?为什么同样的模型算力收入能翻倍呢?老黄其实有句话说的非常的直白, token 正在成为新的数字大宗商品,而商品一旦成熟,市场就会分化。那这句话其实正是说出了 token 商业化的这 时代的开端。那既然是成熟的商业化运作,就存在需求和价值的差异化,对吧?那就像同一趟航班,有经济舱、公务舱、头等舱,价格差好几倍,但是它们能够 去匹配的不同乘客的需求。那数据中心的算力分配其实也是这样的,用来对应不同层级的使用和消费需求。那比如像免费层,它就可以通过高吞吐低响应, 主要可以来吸引新的用户,培养新的习惯,那终端层就可以来服务这个普通的日常查询, 那到了高端层,可能呃就可以用于长的上下文进行深度的推理。到了顶级层,就专门给那些做超长研究,或者说对实时响应要求非常高的这种关键业务来使用,那这部分其实就有点像头等舱,是可以来实现溢价服务的模式的。 那这样一来,可就不是用同样的店产,同样的头肯卖同样的价格了,而是用同样的店产,不同价值的头肯卖不同的价格。 当然了,光有想法不行,硬件得跟得上,而要支撑这个分层芯片,就必须具备两个能力。整场演讲的重点也就来了, 那首先要有足够高的能效,同样的点产出更多的 token。 老黄就在现场展示了一个数据, g b 三百 n v l 七二的每瓦性能是竞品的五十倍,那这就意味着在同样的功耗下,你就能产出来比别人多五十倍的 token, 那 成本自然就下来了。 第二呢,要有足够灵活的算力,既要能跑免费层的简单任务,还要能跑顶级层的超长推力。那我猜测这也就是为什么老黄发布了最新的这个 rubin 平台, 把 rubin gpu 还有 rock lpu 组合在一起,那一个来负责大容量的预填充,一个来负责低延迟的解码,那也就是这种硬件的突破,才能让这种分层定价去落地。 那老黄的这个布局你看懂了吗?有不同的观点,欢迎大家在评论区交流,关注,动心看懂 ai 背后核心价值!

今天我们一起来学习一下 tokken 出海的行业梳理, tokken 啊,是 ai 大 模型的最小语言单位, 也是呢, ai 大 模型收费的一个标准啊,大模型的话, ai 都是按照 tokken 来去计费的。从二零二六年二月份开始啊, 中国模型的 tokin 的 雕有量已经超过了北美,而且呢,黄仁勋最近啊正式定义数据中心为 tokin 的 生产工厂。接下来我们详细的学习梳理一下。 目前啊整个 talking 这边主要是与大模型进行绑定。目前国内的第几家大模型大家可以详细的看一下,第一个就是 mini max, 第二个是 kimi, 第三个是 deepsea, 第四个是智普 ai, 第五个是字节的豆包,第六个是阿里的千问,第七个是腾讯的元宝,最后一个是百度的 文心。接下来我们详细的梳理一下。首先我们先看与 mini max 合作的,目前国内的洪博股份公司,首都在线公司都有与 mini max 提供分布式的算力与制算的服务。第二个是 kimi, 目前国内的润泽科技公司,亚康科技公司都直接或间接的通过火山引擎的云服务为 kimi 提供算力的服务。再一个是 deepsea, deepsea 的 话,目前国内的 润泽科技公司和韩钢股份公司主要为 deepseek 进行提供这种数据中心以及算力集群的一个部署。下一个是智普 ai, 智普 ai 方面,目前与它绑定的 网速科技公司,优克德公司、奥菲数据公司。这三家公司啊,主要为智普提供这种边缘的算力 c、 d、 n 的 分发,包括提供算力的基础施施和支持。下一个我们看一下豆包方面, 豆包方面的话,目前国内与豆包自结合作的,国内的润泽科技公司、东阳光公司、东方国信公司 都为字节跳动 a i d c 的 服务商。下一个我们看阿里的方面,阿里千万方面,目前国内的数据杆公司,韩钢股份公司,锐健股份公司,锐健股份公司啊,这三家公司有为阿里云 提供相应的智算服务,以及云计算的一个数据服务提供商。下一个腾讯元宝方面,目前国内的科华数据公司,润泽科技公司、群星玩具公司,这三家公司啊, 与腾讯啊有相应的数据中心的合作,以及算力的租赁的一个长期的单量, 包括算力集群的一个服务。最后一个是百度,百度方面的话,百度文新方面,目前国内的奥菲数据公司、数据港公司、一米康公司有相应的这种 与百度签订了长期的这种算力长单,以及提供 idc 的 托管服务,包括数据中心的这种温控和部分微模块的一个实施。 未来大模型是发展的核心方向,而托肯是整个大模型计费输出的核心环节,号称 ai 的 新石油,大家可以详细的学习梳理一下。

前两天有粉丝跟我吐槽说用龙虾太费偷啃了,平均一小时就要烧掉一百块,问我有没有节省偷啃的方法。今天就会分享我们在跟龙虾对话的过程中常用到的三个命令,把这三个命令用好,能帮你合理的节省偷啃用量。第一个命令就是杠 status, 这个命令的话呢,是用来指示检查偷啃消耗情况的,当我们发送了这个杠 status 这个命令之后呢, 他就会回复我们这几行信息。请重点看一下这个 context 当前上下文占用的比例,如果你发现下文已经快满了,就要让他去总结和记忆,那让他进行总结的话呢,我们就是会使用到第二个命令放 compact。 这里先给大家普及一个知识点,当我们在聊天界面跟龙虾对话的每一条消息,龙虾都会记下来,存到一个叫 scissor 的 文件里,当你输入一条新的消息给他的时候,龙虾就会把最新的一条消息加 scissor 里面保存的历史消息一并发给大母星,这样的话就会导致我们 to call 的 消耗会增加。那你使用 compact 这个命令是来压缩历史对话的,它压缩的话就是龙虾在 scissor 里保存的历史消息。 你看,当我发送完这条指令之后,他五九 k 的 对话内容压缩到了二点六 k, 就是 节约了很多上下文的空间。那第三个命令就是杠六,清空上下文,开启全新的对话。这个适合的场景就是当你的龙虾完成了任务一以后, 你又给他布置了任务二,这个时候的话呢,是其实是需要自己评估一下,如果任务一和任务二没有任何关系,你就可以使用杠六这个命令来清空一下上下文。 我不清空一下,龙虾在做第二个任务的时候,就会混着你任务一的对话记录一起传给大模型,那这样其实也是一种偷啃的消耗,浪费了你的偷啃,同时速度也会变慢。 当我发送了杠六这个命令之后的话,他给我反馈了这样的一条提示,就是告诉我可以开启一个全新的对话了。一个杠六的话,大家可能会担心,这样做我的龙虾不就失忆了吗?重要的信息我要让他保存下来,怎么办呢?那这个就需要 memory。 当我跟我的龙虾说了这样的一段非常重要的消息, 加上这样的一句话,以上内容存入 memory, 这样这条重要的消息呢就会存在 memory 里。存进去之后的话呢,你再使用前面的杠 compact 杠 new 命令,也不会对它产生任何影响了。最后建议大家还是要选择一个 ottoman 模型套餐来用,像是阿里云百联的 ottoman, kimi 的 ottoman, 评价都不错,性价比也挺高的。