抖音最近爆火的 tucker, 百分之九十的人都不懂是什么,却不知道他背后藏着能让一度电翻七百八十五倍的时代红利。一九五六年,集装箱发明让全球贸易成本暴跌百分之九十,催生了无数万亿巨头。 二零二六年的今天, tucker 就是 ai 时代的新集装箱,正在重构所有生意的赚钱逻辑。今天这条视频,不仅给你讲透 tucker 到底是什么,更把产业链核心、受益龙头、底层商业逻辑一次性扒透, 别划走,全是外面看不到的干货。 先给大家讲透到底什么是 token。 简单说,它就是 ai 处理内容的最小标准化计量单位,国家数据局已经给他定了官方中文名 词源。你问 ai, 一 句话,写一段代码,生成一份商业报告,背后全在消耗 token。 而它最核心的价值,和当年的集装箱一模一样。 他让原本难以标准化、难以交易的智能服务,被装进了这个标准化的数字容器里。集装箱让散装的货物能全球流通,而 tucker 让无形的脑力、智能服务,能像标准化的货物一样,卖到全世界的每一个角落。 他可以被精准计量,被标准化计费,被无壁垒跨境出口,这才是他最颠覆的地方。 接下来这笔账,所有人一定要听仔细,这就是透肯时代最核心的生意逻辑。一度电直接出口大概只能卖零点五元, 练成旅定大概能卖一点五元,价值翻了三倍。可如果拿去跑大模型推理,一度电能产出五百多万,透肯按国内大模型的定价,能卖到十一元,是直接卖电的二十二倍, 如果按海外 openai 的 定价算,能卖到近四百元,翻了整整七百八十五倍。你看到重点了吗?同样是一度电,换个载体价值差几十倍上百倍,这早就不是传统的能源生意,这是算力生意, 是标准化的脑力出口生意。更关键的是,电不能装箱,跨境运输,可 tucker 可以, 它的跨国流动,不用建电网,不用修特高压,不用对方国家的审批,只要一根网线就能完成全球流通。 印度的创业者调用中国的 i a p i 背后是甘肃的风电,青海的光伏在运转,发电便没踏出国门一步,可钱已经赚回来了。这就是 t 肯时代,我们国家独有的结构性机会。 很多人说 ai 太卷了,价格都打烂了,还赚什么钱?你一定要明白,现在的二十二倍溢价根本不是天花板,反而是价格战打出来的结果。美国把 tucker 的 全球价格毛在高位, 负责教育市场,中国用极致的工程能力把成本打下来,负责规模化收割,这就是 tucker 时代新的全球分工。 既然 token 是 ai 时代的集装箱,那这条完整的产业链就和当年的集装箱全球贸易体系一模一样,分为上中下游三个核心环节,每个环节都有已经站稳脚跟的核心受益龙头企业 第一,也就是生产 token 的 算力。基础设施是整个赛道最核心的,没有它,就没有 token 的 规模化生产。这一环节的核心企业,就是 token 产业链最直接的受益方。浪潮信息,国内 ai 服务器龙头, ai 服务器实战率稳居国内第一,是生产 token 所需算力的核心硬件底座,相当于造集装箱的核心。钢厂中继续创全球高速光模块龙头。 eight hundred g one point sixty t 光模块实战率全球第一, 是 ai 算力网络的核心血管,保障 toc 生产传输的高速稳定。奥瑞德,国内算力服务核心玩家,以蓝宝石材料算力综合服务,双轮驱动布局多个智算中心,提供大模型训练推理所需的核心算力, 直接服务于 tokken 规模化生产。美利云东数西算西部节点核心 i d c 龙头,规划五万架机柜,主打绿电算力 p o 值行业领先, 是 tokken 生产的核心绿色算力底座。光环新网,国内 i d c 行业龙头,布局北京、天津等核心城市。智算中心,提供 g p u 算力租赁、大模型推理托管服务,是 tokken 生产的核心算力服务商。 顺网科技,国内边缘算力龙头,布局全国近二百个城市的算力节点,打造 ai 制算平台,深度适配主流大模型,覆盖 token 生产的边缘算力场景。 第二,也就是把上游算力转化为标准化 token 服务的算力平台与服务商,是 token 的 流通核心环节, 这一环节的核心企业包括二六三国内企业。通信与云服务龙头,布局全国 ai 算力节点,提供云计算算力租赁服务,是 tok 算力服务的核心分销商。偏机科技, 国内 it 基础设施运为核心服务商提供云计算 ai 算力解决方案,服务于算力集群的全生命周期运营,保障 tok 生产的稳定运转。 第三,也就是 token 的 终端消费市场,所有需要用到 ai 能力的场景,都是 token 的 消耗方。对应用集装箱做全球贸易的商家,是 token 需求爆发的核心增长引擎,覆盖智能办公、 企业服务、自动驾驶、 ai agent、 商业咨询等全行业场景。真正值得所有老板思考的,从来不是哪个大模型更强,而是在这个时代,你是卖店的,还是卖 token 的, 你是卖原材料的,还是卖标准化能力的。未来,所有产业都会被 token 重构, 教育会变成按 token 计费,客服会变成按 token 计费,编程、营销、法务设计、商业咨询,所有的脑力服务都会变成可计量的标准化智能服务。而生意的本质从来没变,谁掌握了标准, 谁就能赚溢价。谁只会卖原材料,谁就只能被压价。一九五六年,集装箱改变了全球制造业的格局。二零二六年, tucker 正在改变全球脑力市场的规则。 电力过剩从来不是问题,算力过剩才是真正的机会。美国把 tucker 的 价格炒上去,中国把 tucker 的 成本打下来悉数东算的时代,战争才刚刚开始。 如果你是老板,现在真正该问自己的,从来不是要不要用 ai, 而是你能不能把自己的行业装进 token 这个集装箱里,卖到全世界。
粉丝77获赞266

真正的代理是只拿平台返点的,我们阿里云这边如果有客户都是从阿里云官方网上下订单的,客户的账号只需要跟我的账号绑定就可以了,资金都是进阿里云的账户,我们只是单纯的拿个返点,发票也是阿里云这边开的。有时候真的不想 去喷那些人,说人家大厂的产品要你推销,你凭什么中间吃一道?很简单,第一,凭我能卖出去。第二个,任何品牌的竞争都是代理商渠道的竞争,品牌之所以是品牌,是因为 这么多经销商把他堆起来的,或者他自己广告砸出来的,根本就没有第三条路,有时候真的不想去解释,只是想做好自己的事情,风来了,我站好自己位置,希望能把我自己吹起来就行了。

现随着 ai 应用的遍地开花, ai 的 talk 消耗量越来越大,甚至有人开玩笑,今天赚了多少个 talk, 还有一个应用场景,大家每天在使用 openclo 的 时候, 它的消耗量也是非常惊人,今天为大家分享一种方式,可以白嫖 talk, 而且它不是那种小模型,而是我们国内的 gim 五, 接下来我们看一下如何使用。哈喽,大家好,这里是二 pop openclock, 相信大家现在已经人手一只了吧,但是它的 talk 消耗量就非常大,今天我们分享一种可以免费获取 talk 的 办法,这就是互联网大善人英伟达免费开放的, 之前我也在公众号分享过,今天我们来手把手实操一下。我们打开英伟达官网的模型列表,大家可以看到这里有各种各样的模型,像千万三点五,还有智普五点零, 还有 kimi 二点五等等,这些都是可以免费试用的,使用方式也非常简单。我们先点击这里的注册,当然在这里注册的时候,我们要注意一点,我们要使用海外的邮箱,就比如 gmail 或者是微软的 outlook, 不要使用 qq 邮箱,这种是没法通过的,我已经给大家试验过了。 我这里粘贴我的谷歌邮箱,点击下一步,这里输入你觉得合适的密码,我们点击创建一个账户,这里他会给你的邮箱发送一个验证码,输入验证码,点击继续。这里是按选择是否接受通知,我们直接提交就可以, 没有任何影响。这里输入一个名字,这里也没有任何限制,直接输就行,这时候我们就注册完成了。回到了这个页面,大家可以看到最上边有一行,请验证你的获取 api, 我 们这里点击一下验证, 这里验证是需要输一个手机号的,这个手机号我们也试验过,输入国内的手机号,也就是加八六的,前面我们选择中国 china, 这里我们输入八六,这里我们选择中国。以后输入一个我个人的手机号,点击提交,这时候你的手机就会收到这样一条验证码, 是优速通发的,我们输入进去,点击验证,可以看到这里基本上是秒通过的,我们在这里随机选择一个模型,就比如智普的这个五点零, 然后点击这里的 welcome, 这里获取 api k, 可以 看到已经能拿到了,接下来我们验证这个 api k 到底可不可以用呢?在之前我分享过一个很好用的工具, cherry studio, 就是 这个樱桃的,它是一个开源项目,我们可以在 github 上直接下载到,然后在这里测试一下这个 api k 到底可不可用,我们点击左下角这个齿轮, 这里选择添加模型供应商,我就添英伟达下面供应商类型,我们选择 open ai, 点击确认,这里需要填密钥还有地址,我们粘贴 api k, 粘贴 url, 添加模型,这里要注意这是英伟达自定义的一个模型名称,就这个 z 杠 ai glm, 我 们拷贝过来,点击添加,这时我们打开对话试一下, 这里要注意模型切换,我们切换成刚才添加的,因为答的这个 z a i g m i 五,我们问它是什么模型,看一下它的反应,这里因为我的网络问题,可以看响应速度稍微有点慢,但是它是完全没问题的,可以看到它是由 z 点 ai 训练的大约模型,然后是 g a m, 这时我拿到这个模型大家就知道怎么用了吧,比如我们把它绑定到我们的小龙虾,或者是绑定到我们的 agent 上,这时候就可以无限的耗羊毛了, 而且我还没有碰到过说使用限流或者是 taco 被用完的情况。大家如果需要更多的账号,完全可以按照我这个方式注册几个谷歌账号,然后并且做一个手机绑定就可以了。更多 ai 和变现的方式我们一起来研究。

自愿辞职,他自己签的,不要赔偿。他才二十二岁,才入职四十三天,他就是想把代码写完,他有什么罪他有什么罪啊? 写不了了,真的写不了了。用个 tab 补全吧。 v s 口自带的。 九月,好久不见,我以为你不会来看我了。对不起,不怪你,是我自己的手废了。今天下午查不出表跟加了个先证。我二十年前闭着眼睛都能写,今天我从两点做到现在,九个小时连一个 unchange 都写不全。我老婆不知道, 他以为我加班是因为活多,他不知道我是因为写不出来,我不敢告诉他。我写了六十年,尖端的人现在连一个表单都写不了。我要是被优化了房贷孙子刚哥,我听说了,下午要查你电脑里那些东西, 完了,查到我就完了。小浩,你干什么?如哥,你帮了这层楼那么多人,该我了。你疯了,你还有四十七天转正不是四十七天了?如哥,你等着小浩回来。小浩,你回来 自愿辞职,他自己签的,不要赔偿。他才二十二岁,才入职四十三天,他就是想把代码写完,他有什么罪?他有什么罪啊? 九鱼,从今年二月到现在,你用公司服务器搭了一个 cloud 的 a p i 代理 转卖 token 给三个部门,四十七个人,证据全在这了,抵赖不了。哼,转卖我一分没收, 人家找我要,我给了怎么就成转卖了?你没收钱,那后台怎么有一笔笔的转账记录?那是他们自己要给的良心钱,再说了,我给他们用的时候,他们管我叫什么。如哥,救命恩人,没有你我这个月绩效就完了,现在倒好,成了 token 贩子了。少跟我扯这些,我问你,你代理的 token 源头是哪来的?谁给你开的 api 权限? 我搭代理这半年发现这个行业只有一种 bug, 什么 bug? 写不出代码?这种 bug 你 修不了,你也修不过来,你把全公司的可老爹都禁了,把 a p i 都封了,把我开了,该写不出代码的人还是写不出代码?他们不是不想写,是 ai 把他们的手废了。你觉得是我害的? 我只不过是在他们的手废了之后给他们续了一根拐杖。就你,你知不知道你这个事有多严重?公司数据安全,哈哈哈, 我就算是被开了,也比那些没有 token 坐在电脑前一行代码都敲不出来,等着下个月绩效被打 c 然后被优化的人强。九鱼,事情已经查清楚了,你有什么想说的?现在可以说 我违反了公司规定。搭代理发 token 该怎么处理我没话讲, 但是看着这些同事,我心里难过。他们不是不想自己写代码,他们是写不了了。你们知道旭阳吗?前端写了二十年,站了三个的人, 上个礼拜他坐在地上前面九个小时,一言都飘不出来。不是,不会,是他的手离了, ai 不 会动了,他回家不敢跟老婆说,他有房贷有孩子,他只是想把今天的活干完,他有什么错?还有小号实习生,二十二岁 才来三个月,他从入行第一天就跟 ai 一 起写代码,他甚至不知道没有 ai 的 世界长什么样,他为了帮我毁掉证据被开除了, 他还差四十七天就能转正。我一开始搭代理就是为了自己方便,但后来越来越多的人找我,如哥救救我,代码写不出来,我没办法拒绝, 我不收费,他们硬给我知道 ai 是 工具,不该依赖数据,安全也很重要,但是公司四百多号程序员都要跟单骂处,有多少人还能离开 ai 而不是被他吃掉?希望这一天能早点来吧。

还是有很多大聪明不停的问我,博士,我如何跟你卖托肯?托肯到底是啥啊?我觉得你想跟我卖托肯可以,你首先要理解什么叫做托肯,很多人根本就不明白,以为托肯是一件很简单的事情,其实并不是这样 啊,有的人说是字节,有的人说是字数,其实我觉得都不对吧,用通俗的话,普通人能够理解的话就是啊,托肯就是 ai 世界的律师费吧, 你想想,你去问一个大律师,人家可能是按照分钟来收费,对吧?你一问一答, ai 也一样,但是 ai 他 没法一个定量的去按时间来,因为有的 ai 快, 有的 ai 慢,就是根据背后的算力 啊。 ai 不 看你问了几个问题,他是把你这些问题打碎之后,然后在他脑子里面赚了多少颗粒度? 呃,比如说在中文里面,我们大概一个 token 就是 一个一个字,然后在英文里面,一个 token 大 概是零点七五个字。所所以说,比如说 brightness, 它叫 bright, 然后 ness, 然后 darkness, 它这个你看,呃, brightness 和 darkness 它里面相似度就是一个 n e s s, 这就是一个具体解释, 在 ai 里面, token 就是 处理逻辑的最小代价。如果你问,比如说吃了吗,你问博士吃了吗?我可以秒回 ai, 也可以秒回,它不需要呃,用太多的算力,但是如果你让它写个什么对赌协议, 什么销售协议,它还是得调动很多的神经元。 token 记录的,其实某种意义上讲就是说,哎,它在它脑子里面运转了多久 好?这时候关键问题来了,很多人都不明白 token, 他 觉得 token 是 个标准品,其实 token 不是 一个标准品, ok, 它是根据不同的模型,它会产生不同的 token, 你 比如说你有 deepsea, 你 有 jamaican, 你 有 john cloudy, 你 还有这 gorn, 对 吧?不同的模型。 所以呢,很多人在这建这种机房的话,去卖这个,卖这个,托肯,我觉得这也不 make sense, 本质上这些只有大公司在做,因为你要有自己的模型。当然了,你说,哎,兄弟,我不怕,我自己有把开源模型 放到我自己的机房里去让,然后给别人提供也 ok, 但是开源模型是在不停的演化的,所以你有自己的技术力量去不停的去开源模型嘛,对吧?都是一些问题,实际的问题。 然后呢?还有还有说不同的模型,我再解释更清楚一点,他就想找律师,你找一个刚毕业的实习律师,他可能问一个问题,收你五百块钱, 然后他给你建议,可能赵本山哥,甚至可能还不如大模型,对吧?如果你是去找一个身价千万的顶级合伙人,他跟你的回答的问题他可能完全是不一样,而且他每一个回答他可能都是根据他处理了很多问题啊,根据他几千个真实的案例来。 所以大模型也一样,大模型有有七 b 的 小模型,就像现在所有人都说,哎, mac mini, 呃,我去,让这种小模型,这种出海三裂,那都是小模型,它产生吞坑速度很快。其实 mac mini 也不快啊,但是它脑子里没有深度,它给你的逻辑可能根本就不通的, 像 gbt4 啊。然后 jimmy 这种大模型,它每一个,呃,大模型,它不是升级,它其实升级的过程中它也是融合了很多的各种各样的最新的这些知识,它其实在其实某种意义上讲,其实我就为什么说其实做垂直领域的大模型其实没有多大的 啊?一,因为你会发现我刚搞一些 dota 出来,然后一些大厂,他马上就把这些新的 dota, 新的垂直行业的领域的东西放到他的大模型里面, 而且他自己有很多自己的算力中心。如果你单纯的用一个呃开运的模型去做的话,开运模型大部分人我都说过是真流出来的,几乎是没什么用的,其实本质上就是说你你你用什么样的模型也会对应着什么样的算力,对吧? 呃,其实某种意义上讲,我们再来讲一讲大模型,为了突出一个头肯,它其实也有需要很多的 gpu 的 协调合作, 它不是说不是说一个一个小 mac mini 就 就可以去卖了,其实你你想想的大模型它都是几几个几个逼量的参数,它肯定要进行很多的这种举矩阵运算, 就为了你一句提问,比如说你问一个问题很简单,问题它可能秒回,但是大的东西的话它还是要很多做协助呢。 小模型呢,就是一个 mac mini, 他 自己在这想速度快,他其实质量也很差,所以呢, token 的 成本其实本质上取决于你这个模型的大小 和你这个算力的这个这种消耗。如果你的需求大,这种问的问题很深,你就需要这种顶级的律师事务所的合伙人,所以你就要更更强的算力,更强的大脑。如果你只是问一个博士吃了吗?我跟你可以卖 token 吗?这种话,那肯定话就很很很简单, 所以呢,在这我们这个时代,你不要想着就是单纯去卖 token 啊什么的,你要想去卖 token, 你 首先要想好 你 token 的 客户是谁,他会问到什么样的问题,你需要用什么样的模型去解决,你需要匹配什么样的算力?而往往这些东西都是我们这种云厂商,比如我们代理亚马逊云云厂商来解决的。不是说一个小白什么都不懂,然后,然后上来说我跟你卖 token 嘛?这这这简直就不 make sense。

这两天网友说我的透更纯度不够,我去检查了一下,确实是纯度有问题,然后我就换了高纯度的透更,终于解决了部分问题。现在发现这些厂商一个比一个坏,每次写的是 百分百纯度的头肯,就后面发现一去检查百分之七十纯度的,百分之五十纯度的。各位在用 ai 工具的时候,是不是也遇到了这一些黑心厂家,打着打着四点六的版本,给的是你是三点五的版本, 要么就打着五点四的版本,给的是五点一的版本。无论是做中转的还是做原厂的,出来混的没一个讲实话的,这也是正常的,毕竟这种头梗消耗量这么大, 在里面给你偷偷的降点质,降点版本你也不清楚,希望有关部门出一个消费者维权的,他要是给我们降版本,偷偷的降质,要制裁一下, 这个是不是间接的也算是诈骗,把我们忽悠的这么惨。说好的这五点四的,给的是五点零的,说好的是四点六的,给的是三点五的, 估计以后这个方面也会有相关的惩罚机制,总不能一直让我们当大冤种对不对?怪不得我的代码经常出各种新的 bug, 原来是这么回事。你们有没有买到那种掺水的透坑,评论区打出来我们都看看是哪一些黑心厂商做的事情。

为什么以前我反对大家参与算利租赁,但现在又非常看好偷啃工厂模式呢?今天花两分钟时间讲一下我参与整个算利租赁的过程。有一点长,二 三年底和二四年初的时候,我有个朋友去加州投了两个英伟达的 h 一 百的算利基金,两个都是三十二台的 h 一 百。那个时候算利租赁很热,差不多回的周期是两年半,产值当时预期是百分之四十,但现在看来,实际的产值是百分之八十到九十, 我们当时并不知道,当然这个是后话。当时我正准备从基金出来,他找到我做技术支持,一起摸底了国内的算力租赁行业,准备国内和其他工友一起来建 a i d c。 我 们当时一个星期跑了五个城市,两个月,摸透了整个模式、技术和风控,随后开始做合规组建公司以及沟通客户。 就是这几个月的时间,二零二四年六月到十月,算力租赁从三年周期一下子变成了五年周期,几个月市场卷上了天际。 尤其是当时西部,为了发展算力中心,大家压根不在乎算力注定的回报,一窝蜂的为了换指标去卖。算力项目一个比一个烂,为了让大厂闭口租赁杀价一个比一个狠,结果很多算力项目烂尾了,大部分项目的新能源指标并没有下来。当时还有一堆人借着算力租赁搞各种杀猪盘,尤其是海外的, 什么七个月回本这种也有人信,我就发了几个视频,劝大家千万别参与,我也拒绝了那些找我想把算力租赁这种也有人信,我也很难租出去, 我的朋友里面就没有人会使用算力服务器这种东西的,除了大厂,但没有人会买柴油发电机放在家一样。但是二零二六年变化的起点就是 opencloud 和 ai coding 重构了整个算力的消耗模式。你不只是去买大厂捆绑着算力的 app 服务,而是用 opencloud 的 同时随便买哪家的算力 app 应用和 token 不 再捆绑了,就像家用电器和电不再捆绑了。当然像 gbtcloud, jimmy 豆包只能他们卖,但是 deepseek、 千问和拉玛这些开源模型的 token 谁都可以卖,而且还卖得出去。大量的 token 分 发平台像雨后春笋一样。我现在卖 token 比出租服务器要简单的多得多得多。 token 工厂借着分发平台,就像衣服工厂借着电商平台一样。一句话,时代变了,算力注定退场。 token 工厂将重构算力。关注,我后续会持续讲 token。

最近我收到最多的后台私信就是 token。 既然是个新的大众商品,那普通人能不能自己生产 token 自己卖?今天一条视频给你讲清楚。先说结论,能生产,但你算完账,你就不会干了。我们来算一笔账, deepstack 目前最火的大模型,它卖 token 的 价格是多少?输出,每百万个 token 三块钱。 一百万个 token 是 什么概念?大约相当于五十到七十万个中文字,一本书大概十万字,也就是说, ai 帮你能写将近七本书的内容,只收你三块钱。反过来说,你自己要生产这一百万 token, 至少得花几十万买个 gpu, 装一台服务器, 二十四小时不断电。就这样,你的一台机器大概需要十几个小时才能生产出这一百万个 token。 而且这个你还没有算你的工程师维护机房电费和宽带费。 deepsea 为什么能卖三块钱?因为它拥有几万张 gpu, 同时跑,一天处理上千亿个头梗,成本被摊到几乎为零。这就好比你自己在家养了一头牛,挤了奶想拿出去卖,一瓶卖五块, 你觉得能赚,但是你一算,买牛花了两万,饲料每月两千,一天只能挤几斤奶,隔壁蒙牛一天出几千吨,一瓶卖三块钱还能赚?你的奶不比它的差,但是你的成本是它的一百倍还要多。 这就是普通人生产 token 面临的问题,不是做不了,是做了一定亏。所谓普通人在 token 这门生意里的正确姿势,不是自己生产 token, 而是用便宜的 token 去创造贵的服务。 举个例子,你用 deepstack 花三块钱买一百万个 token, 让 ai 帮你写十篇小红书文案,通过小红书的文案带货去赚钱,那么你的成本就是三块钱。 你赚的不是 token 的 差价,是你知道怎么用 token, 而别人不知道的信息差。再举个例子,你用 ai 帮一个小型企业搭建一套 ai agent 的 token, 成本可能不到十块钱,但你收企业五千块钱的咨询费, 企业买的不是你那十块钱的 token, 而是你的判断力和方案。不要去跟巨头抢着生产 token, 要去想怎么用三块钱的 token 创造三千块钱的价值。生产 token 的 钱留给巨头去赚,用 token 去做赚钱的生意,才是留给普通人的机会。我是文思,关注我每天带你看懂 ai。

弟们,两个星期几千万的托克也买过来的,教训你一定要听啊!养龙虾,我告诉你最快捷、最稳的方式是这样的,你呢?不要去用原声的,也不要用腾讯的,那个太复杂了,你就用这个, 这个是开源的,特别好用,你看界面也好看,而且呢,它可以配置啥?配置一些国外的大模型。 第二个,你就打开这个网站, p p word 点心这个网址,找到 api king, 申请一个 king 之后呢,你看所有的国际大模型,这里都有了,你看六十多个 g b t, gmail, cloud 都有的,你把它配进去,名字复制进去,这个大写改成小写, 你看我这个里面就可以用这个大模型了。用这两个搭配起来干活才是最快的,又省事,又快又省。 talking, 你 听我的。

最近网上都在说全世界都在用中国的托肯,呃,这个确实有点自嗨的成分啊。但是这个背后不是简单的这种中文热和虚假繁荣,它其实也是一种啊,极致性价比导致,导致这种隐形渗透。 首先这个中文热跟这个托肯搬砖热完全是两码事。其实国外很多流行的应用,底层的可能就是中国的代码,像中国的代码往全球跑是很多的。 对于开发者而言,他不需要去讨论什么什么模型存在主义,他只需要模型能够翻译总结些简单的代码润色就 ok 了。 其实你想想,当 deepsea 千万能以 open ai 十分之一的价格来做百分之九十逻辑能力的时候,我相信理性的开发者会毫不犹豫的去选择这种中国头壳。 就中国外国人不是在学中文的,他其实是在给中国的头壳打工,因为便宜好好使对吧。 其实对于大部分的 ai 应用的话,托肯模型只是一个异号品。那么这面呢?一点五啊,很 flash, 很 便宜,免费的时候我就用 google, 如果 deepsea 就 很便宜,那我就用 deepsea。 其实现在算力市场也是碎片化的,很多同学不是想做算力吗?中国的大模型在逻辑中转和这种低客单价上面已经形成了这种全球的工业标配,更像是中国制造的这种异物版变成了这种 ai 版。 呃,说在国外都在用这 token, 其实某种意义是 openwater 上的聚合平台上排名,其实真相就是,呃,在这一平台上, gatsby 和亲吻经常排名前三, 这不代表美国的主流。呃在用它写法律文件和印应用,因为,因为,因为 openwater 本身是个羊毛党,呃,羊毛党的好的的地方,呃,内容工厂啊,简单的 a 阵的,大家都会用的 openwater, 因为包括中国的人有人翻墙啊什么的。 呃,比较简单一点,在高端市场仍然是这种 cloud, 然后 gmail 啊,这,这 gpt for 来什么?呃,占占据主主导。 所以的话呢,其实某种意义上讲,黄金层啊,黄金层,包括我们,我就是某种意义上讲,我们来分析一下算力市场的算足底力就哪些模型会比较多。就是黄金层肯定是这种 cloudy 啊, gbt 啊, jamaican, 白银可能就是 deepsea 啊,然后千万 number three, 然后青铜可能就是 jimmy flash, 呃,这种快速便宜羊毛岛,然后快速来弄,然后其实这不是中文热啊,在总结就是这是一场就是某种意义上中国供应链的全球渗透, 外国人可能根本不知道自己 app 后面用的是中国模型,就像他们不知道自己家里面的这种吸尘器用的是中国哪家工厂一样。 在某种意义上讲,隐形也说明了中国大模型和中国算力在工程化和成本控制上的成功。呃,但是也某种意义上讲,这离这种文化和意识形态输出还是有点距 离。总结来说,这种性价比替代路线就跟中国品牌手机一样。其实,呃,在国外也有人用,你就包括在非洲的传音,对吧?但是你要说他完全渗透国外还是很难,就是在美国的话,大部分人会用 iphone, 几乎没有人会用华为一样道理。

研究怎么卖的问题。昨天托克的中文名出来了,叫磁源,今天我们的系统也测试的差不多了,服务器和托克的代理也已经搞定了。阿里云的接下来你们那些黑粉,你们看看我是怎么卖的,我有没有马上落地变现的方案?我说过了,我这个人别的不好, 执行力超强,明知风来了,我不可能浪费时间跟你们在评论区聊这些有的没的。男人最重要的是什么?搞钱 怎么评论?那是你们的事情,我做我的事情就好了,风来了,我站好我的位置是吧?至于你们评论这些,评论那些,我只想告诉你们,大点声,我听不见。

今天是二零二六年三月二十四日星期二视频日记的第五天。今天想和大家聊聊 tok 前一段网上特别流行使用 pos 工作流一键生成带字幕、声音、图片的视频,很多人呢,都花钱去学。 其实这也无可厚非,毕竟 ai 是 个大趋势,你不会用自然会感觉跟不上时代。我其实也一直在用, 呃,也洗过几个工作流,光调试就把免费的积分用完了,你想要继续的话呢,就得充钱, 这里的积分对应的就是你 talking 的 消耗。如果你关注 ai 的 发展进程,你就会发现,黄仁勋在最近的 gtc 大 会上发表了两个小时的演讲,其中有一个词说了超过七十次,这个词不是 ai, 也不是芯片, 而是 talking。 阿里甚至专门成立了一个和淘宝平级的事业部,就叫 talking 事业部。为什么所有人都在盯着 talking? 今天我用三分钟给你讲清楚。先说什么是 talking, 简单说,它就是 ai 处理信息的最小单位。 你说一句今天天气怎么样, ai 不 会整句的理解,而是把它拆成今天天气怎么样这样的 talkin, 你 得到的回答在 ai 那 边也是一堆 talkin, 所以 你用 deepstack、 chat、 gpt 等等大模型的 api, openai 怎么收费?按 talkin 收,输入多少, talkin 输出多少, talkin 明码标价。那为什么 talkin 这么重要? 黄仁勋给出了三个答案。第一, talking 正在成为 ai 时代的成本单位,他把 talking 处理分成了五个档次,最便宜的每百万 talking 收三美元,最贵的要一百五十美元,差了五十倍。区别在哪? 响应速度?回答质量?能处理的上下文长度,就像快递、普通包裹和同城当日达价格当然不一样。 换句话说, talking 不 再是抽象的概念,而是一种可以被分级定价的服务。第二, talking 是 ai 的 效率单位。 黄仁勋说,过去两年, ai 推理的计算量增长了一万倍。什么概念?每年翻一百倍?在这个背景下,数据中心正在变成 talking 工厂。以前衡量数据中心,看存储容量,以后看每秒能产出多少。 talking 就像钢铁厂,不问厂房有多大,只问年产量有多少吨钢。英伟达最新发布的芯片,核心卖点就是同样的店,能多生产好几倍的 talking。 第三, talking 正在成为新货币。 华人细心预测,未来的科技公司给工程师发薪水,除了工资,还会给 token 的 配额。为什么?因为现在写代码、调试、写文档都离不开 ai, 每一次调用都在消耗 token。 如果公司不给你额度,你自己花钱买,效率就会受到影响。事实上,硅谷一些公司已经在这么做了。未来会不会用 ai, 会不会高效的使用 ai? 差距就体现在 talking 的 效率上。 也就是说,同样的 talking, 你 能产出多少价值?你顺着这个逻辑,黄仁轩还画了一张更大的图。他说,整个 ai 产业像五层蛋糕,最底层是能源, ai 需要大量的电。往上是芯片,这是英伟达的主场。再往上是数据中心,从存储仓库变成 token 工厂,再往上是模型层, gbt、 deepsea 这些大模型,本质上就是把算力转化成 token 的 生产线。最上面才是我们普通人接触的应用层。从电到芯片到数据中心,到模型到应用, 这是一条 tokken 的 生产消费链,每一个环节都在围绕着 tokken 创造经济活动。而且有意思的是,整个链条会创造大量的就业,很多岗位甚至不需要你懂 ai。 建一个数据中心需要电工、不限员、消防安全员,这些都是实打实的蓝领岗位。 ai 不是 只会替代人,它也在创造新的岗位。所以你看 talking 这个词背后是一整套经济学。 理解它,你就看懂了 ai 产业的底层逻辑。未来的核心竞争力可能不是你懂多少算法,而是你的 talking 效率有多高。同样一个 talking, 你 能比别人产出更多的价值。如果你想在这个时代不掉队,那么从现在开始,多多使用 ai 吧, 多留意你每一次和 ai 对 话时的 token 消耗,试着用更精准的提示词,拿到更好的结果。我是和你一起每日迭代的朋友,觉得有用的话点个赞,评论区聊聊视频日记,明天见!

最近这个 open cloud 不是 很火吗?大家都说这个东西很烧 talk 啊,我昨天找到了一个对于我们普通用户来说几乎接近免费而且又好用的一个模型 talk, 这就是一个千万呐。 嗯,千万的贪。新人注册每个模型他下面有一共两百两百多个模型,每个模型都送一百万托克,对我们测试而用的话应该是很够用的,如果不够用找亲友借一下也是非常不错的。看一下他这个速度怎么样,你是什么模型? 这个回复也是很快,大家如果有需要的话,可以后台私信我给大家说一下这个加入模型,加入这个代码之后就自己连接。

你有没有想过,为什么 ai 能读懂你的问题,还能写出那么长的回答?秘密就藏在 token 这个词里。今天花三分钟带你彻底搞懂大模型的核心 token 技术,欢迎来到 ai 科普系列 基础篇。今天我们要聊的是大模型 token, 它是 ai 理解世界的词汇表。接下来我会带你从概念应用到核心意义,全面解析 token 技术。 token 就是 文本的基本单元,你可以把它想象成人类语言中的单词。 ai 通过将连续文本拆分成一个个有意义的 token, 才能开始阅读。比如英文单词 hello, 中文汉字,你还有子词 an 和 happy 组合成的 an, happy 都是 token 的 典型例子。 token 的 工作流程很简单,输入文本分字处理。 token 工作流程 很简单,输入文本分字处理 token 就 有一个唯一的数字 id 模型,就是通过这些 id 来理解文本的。 token 主要有三种类型, 词级 token、 字词 token 和字母 token。 词级 token 用完整单词,语意明确,但词汇表庞大。词词 token 通过拆分词词来平衡效率与覆盖。比如 bpe 算法, 字幕 tucker 以单个字幕为单位,词汇表极小,但续列过长。 tucker 在 大模型中的应用非常广泛,文本生成如 chat、 gpt、 对 话、机器翻译、中英互译、情感分析、评论分类、代码生成、自动编程都离不开它。 tucker 是 连接文本与模型计算的桥梁。常见的 tucker 化算法 有 byte parent code, n b p e, word piece 和 sentence piece。 b p e 通过统计高频次复队逐步合并用于 gpt 系列。 word piece 基于概率合并,子词用于 part sentence piece 语言无关直接处理原始文本, token 长度直接影响计算成本。输入文本越长, token 数量越多, 计算时间和内存占用就越高。模型都有上下文窗口限制,如四零九六八一九二。 token 处理长文本时需要采用摘要、分段等技巧来平衡语义完整性与计算效率。 token 技术的核心意义在于统一了不同语言格式的文本表示,实现了跨语言模型训练。 通过子词 token 平衡了语义与计算效率,还能适应新词汇和领域术语,支持持续学习。 token 和字母有什么区别? token 是 由语义的,单元 字母只是书写符号。一个 token 可能包含多个字母。 token 长度有限制吗?模型有上下文窗口限制,但 token 本身无固定长度。中文 token 如何处理?常用汉字单独成 token, 生僻字可能拆分为子词或字母。记住四个关键点, token 是 文本的基本表示,单元分词算法影响模型效率。 token 技术统一多语言处理,理解 token 有 助于优化 ai 应用。建议你亲自使用 tokanizer 工具体验分词过程。阅读 bird gpt 论文,了解细节,并关注新分词技术的进展。谢谢观看, 希望这期内容帮你真正理解了 token。 ai 科普系列持续更新中,下期你想了解哪个 ai 概念?评论区告诉我。

我现在用了差不多二十七亿的 top, 花了差不多四千七百多美金,马上五千美金了。得到几个结论,第一,用且只用最贵的模型是这个时代收益最高的事情。 第二,用且只用最简单的方法是这个用 ai 最好的方法。这指的是不用乱七八糟的多智能 t, 不 用 agent, 因为对于你的场景来说,百分之九十九的功能用不上,只需要最简单的把话说清楚,这件事做好就可以了。 第三,写代码只需要三个步骤,第一,和 cloud office 讨论需求,第二,让 cloud office 写设计文档的文案。第三,让 codex 去执行,去写真实的代码就可以了。 其他的各种什么 m, c, p 啦, skill 啦,百分之九十的情况全部都是花里胡哨,最简单的一定是最好用的。

偷偷出海,正在把中国的电变成世界的商品,中国把过剩电力变成了全球疯抢的一种商品,一度电出口赚五毛,未给 ai 后竟卖出四百元。行,如果啊,你是冲着电力套利和东数西算这样热到的词语点进来的,你可能就要输忘了,因为今天啊,我要泼三盆冷水。 嗨嗨,我是艾瑞斯,一个天天跟 ai 模型账单打交道的创业者。最近呢,偷偷出海这个词啊,火到了发烫,但是呢,我却越看越心惊啊, 因为呀,几乎所有的分析呢,都错到了根上。今天这条视频啊,我只说三句大实话,帮你把幻觉突破。第一句实话呀, ai 的 竞争从来都不是挖矿,别用电费便宜来幻想统治世界了,很多人啊,算账,中国电费便宜。所以呢, ai 的 老细胞,也就是扑克,成本就低,出口呀,必胜, 大错特错,英伟达的脑皇的五层蛋糕理论说的已经很清楚了, ai 的 产业呢,有五层,从下到上啊,是能源、芯片、基础设施, ai 模型和应用。电费呢,只是最底层,最基础的一层,在整个总成本里啊,它只占百分之十五到百分之二十五。真正烧钱的是什么呀?就是几十上百亿甚至上千亿的研发投入 砸出来的模型是贵上天的, g p u 显卡也是整个系统的工程优化,你电费再便宜,能够便宜过这些吗?所以呢,纯电费套地啊,本质上就是用挖矿的思维去规划发射卫星的生意赛道啊。从一开始就看错了。第二句实话呀,中美模型的价差呢,不是成本差,而是物种差。 openai 的 gpt 敢卖天价,咱们国产模型却只能做到它的几十分之一,这是为什么呢?技术上啊,美国的主流模型是全院专家会诊,问题呢,再简单也需要全体的专家到场,成本啊,极高。咱们的主流呢,是智能分诊,也就是用谁叫谁,效率至上。 从商业上啊,美国卖的是华尔街硅谷认可的技术霸权和确定性。是啊,奢侈品。咱们呢,卖的是给普罗大众的 补贴工具和生态门票,是基础设施。市场上呢,咱们美国消费者为顶级的生产率付费是习惯。咱们呢,还在用地板价去教育市场,我自己公司啊,就分的很清,写核心代码,搞系统设计。咱们呢,会用美国的高价模型 买的呀,是可信和效率,但是处理文档,生成文案这些国产模型啊,绝对是 y y d s。 是 因为啊,足够好且便宜太多。这个价差的背后呢,是技术路线、商业策略、市场阶段的三重差异。你买的呢,根本就不是同一种福分。 第三句实话啊,出本出海呢,不是开个 a p i 就 收美金,而是啊,闯进了全球最复杂的雷区。你以为啊,把夫妻搭好,翻译个文档就能够收全球的钱了吗?这个太天真了。第一道鬼门关是数据合规,欧盟的 g d p r, 美国的各种法律,你的数据能不能出镜呢? 很多的海外公司根本啊,就不可能数据要传回中国的 ai 服务。第二道卡是地缘政治,在去风险的背景下,你今天的生意做的很好,可是明天啊,一纸禁令就可能让你归零了。第三呀,是税务法律,实体 钱怎么收费怎么交,在哪个国家啊?被告了怎么办?这些问题呢,就能够让一个技术团队呢直接崩溃了。所以呀, 通过出海有机会吗?有的,但是呢,绝对不是一个懒人捡钱的机会。真正的初度呢,我认为只有三条,第一啊,是去友好市场,比如像东南亚等地,中国的模型呢,好用不贵,靠极致的性价比呀,取上核心啊,是做好区域深耕,而不是啊全球撒网。 第二呢,是全球开发者的杠杆在 openner 上啊,中国模型的这个钓流量呢,已经超过了美国了,咱们呢,已经是无数开发者的性价比首选啊。第三呢,是模式生伪和草船借箭, 从卖 a p i 变成卖本地合规的解决方案。但是啊,这需要巨大的资源和实力,或者呢,和海外合规平台,比如说 fireworks, ai 等等合作,作为模型供应商融入他们的生态,这也是许多中国开源模型团队的实际选择。说到底呀, ai 的 全球竞争是技术、工程、生态、规则的全方位博弈,突破价格呢,只是一个缩影, 未来的赢家啊,绝对不是吆喝着我的电费最低的人,而是能够让每一度电,每一秒算你都产生更高智能价值的团队。热闹呢,是别人的成本呀,是自己的。在 ai 这场无限游戏里面,看错地图啊,比跑得慢可怕了一万倍。 我是艾瑞斯,在 ai 创业一线专治各种简单归因和认知幻觉。如果呀,这条视频让你呢更清醒了一点,记得呀,点赞分享,咱们下期再见了,拜拜。

我引用了两亿的免费托盘来养龙虾,前两天发的关于免费养龙虾就是 open globe 的 视频火了,呃,很多朋友私信我,我也帮很多朋友解决问题。那今天答应大家出一个完整的视频教程,我是用的 mac os 的 系统,然后呢,接下来是以 mac 教学为准,而 windows 的 话呢,可能大家可以问问豆包或 tipisk, 一 步一步截图问它都能解决的。 那可以看到这里我是消耗的是零元,对,然后我之前的 a p i k, 嗯,网络速度也慢了,不好意思啊。对,你看到也是零元的状态。嗯,然后我们进入到那个 opencode 的 官方网站,对,它其实是 opencode 点 ai, 然后有个文档,上面呢,其实会有一些安装的说明, 因为我已经装过了。看,这是我的小龙虾的 space 状态,可以看到它是正常的一个状态。所以说我们这边重新带大家走一下那个新手引导的一个配置,然后其实我只要复制这个命令,然后打开终端里面, 然后输入这样一个重置的新数引导,那就相当于会进入到配置过程,它是麦上的终端,终端 app 搜索一下就可以了。然后我们重新进入引导,快速引导,然后更,这里因为我之前配置过,所以说会有之前的配置,那我们这里选更新配置, 到这一步呢,就会选 model, 就 模型的供应商啊,它这里有 open ai, 有 mini max, 也有谷歌,那我们是 open rota, 免费的模型就选 open rota, 这里有,然后大家可以看到有这样,这里有这样多非常多的模型,而我们的模型是什么呢?就是, 呃,叫做那个 jason 星辰就 stay fun 三 new flash 就 free。 呃,它其实是这样一个模型 id, 哎,复制一下。对,它现在在那个,呃小龙虾的榜单上,哇 啊,可以看到,就是已经消耗了一点五四五 t 的 图片,免费的。对,就是排名了很多天的第一。那么回到刚刚的配置界面, 呃,这里呢,其实是可以通过那个方向键就上下左右的上下来控制,因为它太很多,就是你一个一个找到肯定能找到的。但是呢,它这里提供了一个就是输入,对,输入 enter model。 那 我们这里选进去之后呢,把之前的这里删掉,因为要留一个 open road 的 默认的前缀,所以说我们这里,哎,对,输入进去, 这样就 ok 了。呃,我之前设置这里到这个环节呢,是设置那个我们用哪个 i m 去控制去连接?我们这里先跳过,然后这里的搜索呢?其实也可以先跳过, 然后跳过之后呢?就是,是不是那个呃,调调成近的,那我们这里选择一直跳过,然后这里是 no, 对, no, no, 这些是一些具体的一些设像,我们选 no, 但有需要的话呢,大家可以呃,就说 自己去设置。那我们只是今天先讲模型的过程,那我们选重启。哎,对,然后这个,呃,小龙虾的服务就在重启,我们刚刚重新走了一遍新手的设置。那,那我们现在等待它重启。对, 好,它就这里重启成功了,然后那我选择打开网页, open the web y, 哎,它就会自动打开网页,对,就刚刚的网页重置了,然后我们这里输入一个 states, 相当于就是可以看到它当前的一个状态, 然后返回一个当前的状态。 哦,好像说错了秘密了,应该是 s t a u t s? 不好意思 啊,反正没关系,它好像识别了。嗯,对,可以看到我这里配置的是基于新成的模型,因为 p i k 呢,其实我之前已经配置过了,所以说它,呃,不会让我重新再配置。 对,这里显示一些中文。对,然后这里的模型的配置呢?其实我们就回到 openroot 点 ai 这个网站,然后呢去创建一个新的 a p i k, 比如说我们今天是来自于抖音,嗯,点抖音,然后这里的信用额度限制呢,我们选个零点一美金,相当于其实花钱的话也 最多就七毛钱。然后这个额度的重置呢,我们不用不用管它永久都是零点一美金,就是七八毛钱,过期时间一年。那相当于我们就会有一个 a 四值大小按钮。很多朋友也都问我怎么复制, 哎,这就复制好了。这个 k 呢,其实是是在刚刚的配置环境里面,选模型的环境里面,它会让你有一步调配置的,因为我刚是已经配过了。然后呢,如果是你已经是正常的模型了,其实本质上你已经配过小龙虾的话,你在这里输,输 k 给他,然后输模型给他,然后把那个 open source 这个网站输给他,其实也能切换,正如正如我刚上一个视频讲的, 还有就是说,呃,我们在那个呃 open note 的 这个网站呢,它不光,它不光有很多的那个付费模型,它其实是我们在 mod 这里去输的话,你输 free, 它除了接下来三点五,还有很多免费的模型, 对,包括之前的智普的四点五的 air 是 免费的。英文答,有很多模型其实都是免费的,包括 open air、 gpt。 其实也有免费的模型开源的,包括千问。啊,这个千问三呢?其实是,这是一个专门用来编程的一个模型,也是免费的。其实有很多,大家其实可以是一个个去找。对, 然后技能商店的话呢?呃,腾讯最近两天出了一个,呃,中国版的 skill hub, 呃,它本质上呢,其实是在可融 hub 技术上呢,其实做了一个技巧战,呃,这个其实也不错的,然后,呃,你也可以去那个可融 hub 去下载一些技能。呃,腾讯这个专为中国用户呢,它会有个榜单, 你相当于就是你看这里有一段话,看见没有,相当于就复制下来。呃,发给小龙虾,对,他就会去检查,帮你安装这个技能商店,然后你就可以和小龙虾对话,去在里面找更多技能去安装了。我是之前已经安装过了。对,那我们今天就这样。