一年发电九万亿度,全世界的 ai 都在向中国买电,而你每天玩 ai 用掉的 token, 正在为中国赚取二十倍的巨大利差。这笔钱,全世界只有中国能挣,没有夸张。这是两会提及的现实。今年我国一点五万亿的贸易瞬差,也有 ai 的 一份功劳。 一条视频告诉你,中国电力如何成为世界 ai 的 算力支柱。中国 ai 未来的算力中心不在杭州、深圳,甚至不在贵州,而是在内蒙古乌兰察布。 在大雪覆盖的戈壁滩上,成片的风车和光伏板正在发电,而一墙之隔,就是自洁华为的数据中心。在这里,电厂和机房之间只隔着一道围栏,这就是中国独有的戈壁经济。 电力刚刚出生,就直接变成算力。 ai 时代,中国正在把电力出口升级成算力出口。这种升级的底气很简单,中国是全世界最大的发电国。二零二五年,我国全年发电量超过九万亿度,几乎是美国、欧盟加印度的总和,占全球发电量的三分之一。 风电和光伏产业的装机量更是连续多年位居世界第一。在过去,电太多用不完,西电东输都仍有赋余。最后解决办法只有那么几个,要么降低发电功率,让部分风机停转,要么把电送往高能耗产业, 比如电铁、铝冶金,实在不行,就只能弃风吸光,让已经发出来的绿电白白浪费了。而现在,这些电有了一个全新的去处,把电变成算力,再把算力变成 token, 卖给全世界。 而就在这个月,两会正式给 token 定下了中文官方一名词源。这个名字看似学术,其实是在打直球。电力驱动算力,算力驱动模型,模型用词源计价, 全球 ai 都在靠中国的电力运算,每个人用 ai 打字、生图、写代码,本质就是在花费词源购买中国的算力。从制造业到 ai, 中国总有一种能力让高端技术不再昂贵。 所谓 token, 是 ai 大 模型处理文本的最小单位,我们调用大模型生成文本图像代码,本质就是消耗 token 购买算力。 通俗来讲呢,可以理解成畅玩 ai 的 点卡。对比起国外厂商的天价 token, dipstick v 三每百万 token 输出价一元,而一两元、千万三点五 plus 二到四元。这也就意味着使用国内大模型厂商的 api 价格比硅谷大厂至少便宜了十倍。 今年二月,全球前十模型总 token 消耗量超过二十八点七万亿,其中中国模型贡献了十四点六九万亿,占比百分之五十一点二,首次超越美国模型,而且这其中有百分之四十七的用户来自美国。这意味着中国 ai token 的 爆发式增长,不仅仅是靠国内市场撑起来的,这是全球开发者的功劳, 尤其是北美、欧洲的成全的选择,他们主动放弃 gpt 五、 cloud、 四点六等硅谷模型,集体倒戈国产大模型,在性能上丝毫不虚, mini max、 智普、 deepsea 等模型在各项榜单上追平甚至超越 gpt 和 cloud, 价格就只有美国同行的十分之一。在性价比这个领域,国产模型可以说是遥遥领先。 那么我们是怎么做到的呢? token 出海的本质是电力换皮出海,把我国西部戈壁滩上零点一八元一度的风光电能输入数据中心的 gpu 集群,把电力包装成可交易的 token, 再通过海底光缆交付,最终顺着网线发到美国成权的账户里。 所以,让几毛一度的电价翻倍的谜底就藏在谜面上。 ai 时代的能源出口不再只是石油和天然气,还有算力。而在这个赛道上,同时拥有超大规模电力、完整制造业产业链和互联网平台的国家,全世界只有一个。 先说电力,中国西北的风电和光伏,在风水期和大风期,经常会出现一个很反直觉的现象,电太多了,用不完。 理论上这是最理想的绿色能源,但现实却是,电网不一定接得住这么多电,于是就会出现气风气光现象,发出来的电用不掉,只能白白浪费。近年来,西北部分地区的气风气光率一度超过百分之十,也就是说,每十度绿电就一度要被浪费掉。 而 ai 数据中心恰恰是这部分绿电最完美的出口,只要有电,它就能把电变成算力,再把算力变成 token。 再说硬件,一台服务器里,从机柜、电源到高速模块,基本零部件多数出自中国制造。哪怕是核心 gpu 来自海外,整机的集成和规模化部署的成本也能被国内供应链压到最低。 在美国,新建大型数据中心往往要经历漫长的审批流程和社区听证,一来一回就要扯皮好几年。而在中国,得益于政策支持,从拿地到通电有时候只需要几个月。于是,一个非常独特的产业结构就出现了。中国西部的风光电供应全球最便宜的能源, 中国东部的制造业有着全球最完整的设备供应链,来自全国各地的工程团队建设速度全球最快。最后,北上广深的互联网公司把算力空装成 token 卖给全世界。 过去二十年,中国出口的是衣服、家电和手机,后来出口的是光伏板、锂电池和电动车。而现在,中国开始出口算力本身。当美国程序员调用 api 生成代码时,当欧洲创业者用模型训练克服机器人时,他们消耗的每一个 token 背后其实都是乌兰察布的风、宁夏的阳光和一套完整的工业体系。 从电力到算力,一度电在戈壁滩上只值几毛钱,但当他绕地球一圈,以 token 上只值几毛钱。但当他绕地球一圈,以 token 的 形式回到硅谷账户时,价格已经翻了二十倍。 好了,让我们回到最开始的问题,为什么这钱只有中国能挣呢?做到这一切需要什么?首先需要国家东数西算的百年战略决策,需要能源、工信、电网等几十家单位部门的协调调度,还需要上百家科研机构搞定 风光电存储一体化、液冷散热等高精线技术。再加上几百家下游配套企业,隆基的光伏板、金峰的风机、华为的升腾芯片、浪潮的服务器,最后才轮到数据中心把电力封禁,偷看通过海底光缆出口。
粉丝86.6万获赞952.0万

大家好,我是你们的科普达人,今天咱们来聊聊个人开发者怎么低成本入门 tocan 生产。很多朋友可能觉得 ai 模型部署门槛高,成本贵,其实只要配置得当,咱们普通人也能玩转。先说说硬件怎么选, 如果预算在一万五以内,想先试试水,那 rtx 四零九零 d 或者四零九零显卡是首选。二十四 gb 或十三 b 的 模型,搭配 i 五或 r 五的 cpu、 三十二 gb 内存, e t b 的 nvme 固态硬盘,再加上一千瓦的电源和一套散热好的机箱,总价大概一万一到一万六就能稳定运行。模型 托肯吞吐量能到每秒两百到五百个,日常测试和小流量使用完全够了。要是预算能到两到四万,想搞小批量生产,那就可以考虑上双卡四零九零 b, 或者直接上 a 一 零零,内存加到六十四 gb, 这样吞吐量能到每秒八百到两千个,接下小 b 客户的需求也没问题。硬件搞定了,软件和模型怎么选呢?模型方面,七 b 规模的 q 文二七 b instruct 或者 lama 三七 b 就 很适合入门,显存占用小,延迟低, 聊天、写文案、生成代码都在行。十三 b 的 模型像 q d r 杠一三 b instruct, 复杂推理和行业知识库的应用效果更好。这里有个小技巧,优先用 i n t 四量画板,显存占用能降百分之七十五, 速度还能提升两到三倍,效果几乎没损失,性价比超高。推理框架推荐 v l l m 开源免费,吞吐量比原声 pie torch 高十倍以上,个人开发者首选。部署工具方面, fast api 或 flask 用来封装 api 接口, prometheus 和 grafana 监控性能, e l k stack 记录日记这些都是免费又好用的工具。大家最关心的成本问题来了,按三年折旧算,入门级硬件每月折旧大概四百一十七元。电费方面,单卡四零九零币,满载运行 每月电费差不多一百九十四元,总成本约六百一十一元。按每天产出两千五百九十二万 token 算,单位 token 成本约零点零零零零二三六元,也就是二点三六分。每千 token 对 比 openai 的 gpt 三点五 turbo, 成本只有它的四分之一,价格优势很明显,想快速上手, 一天内就能跑通,先装 uber 二二点零四 lts 系统,然后安装 cuda 十二点一 cuda n, 再装 python 三点一零和 vl l m。 接着用命令启动模型服务, 最后用 qiro 测试一下生成 token, 看看返回结果里的 usage 词段,统计 token 数就搞定了。最后给大家几个进阶优化建议,用 v l l m 的 批量请求功能提升吞吐量,尝试模型蒸馏,降低显存占用和延,使用 radis 做请求队列应对高流量 在整个数据库记录用户 token 消耗,实现自动计费。这样一套下来,你的 token 生产系统就既高效又经济了。怎么样,是不是觉得个人搞 token 生产没那么难?你最想先用这个系统来生成什么内容呢?评论区告诉我吧!

普通人到底要如何参与到算力租赁这个风口呢?今天这个视频呢,就完整的教给大家。那最近算力租赁头肯出海,这些概念就跟着 ai 一 起火出圈了。像算力啊,或者 api 租赁到底是什么?要怎么赚钱呢?简单说呢,其实就是租你电脑的算力给别人用。 我举个例子啊,比如说你想跑一个 ai 大 模型,或者用 ai 做批量的视频生成,但是呢,是能实现这种目标的设备啊,你光买显卡就得花几十万,但假如此时此刻你租别人的算力,按小时付费,那成本呢,就直接可以省百分之七十。那租算力给别人的那一方呢,也可以通过源源不断的订单来赚钱。那 api 租力呢,就更简单了,他就像是租别人的 ai 能力,比如说你想做一个聊天机器人,你不用自己直接搞技术, 租一个 api 呢,直接用别人的,非常方便。那现在 ai 可太火了呀,像做 ai 视频,搞大模型,开发智能应用,全部都得靠算力,但好的显卡呢,一台就几十万,普通人和小企业呢,其实根本是承受不住的,所以租算力呢,就成了刚需。那对于我们普通人来说呢,最简单的入局方式其实就是去大厂代理 空手套白狼。那意思呢,比如说你去当腾讯自结这些大厂的算力,或者 a p i 代理,就像帮他们卖算力套餐,你不用花一分钱啊,只要能拉到客户呢,就能拿百分之十到百分之三十的返点。 我举个例子啊,就是你推荐客户买了一万块的算力套餐,最少呢也能挣一千块,客户越多赚的越多,享用门槛非常低啊,我觉得几乎每个人都可以干。 第二种呢,就是线上平台托管算力卡,基本上等于躺着收租了,要是你手里有闲置的一些高端显卡,可以放到一些线上平台上去托管,那平台呢,会帮你把显卡租给需要的人,你什么都不用管,每天看着租金到账就行。 第三种呢,其实是适合有实力有资金的朋友啊,你们可以租个正规的 a、 i、 d、 c 机房,比如说像阿里云、华为云的机房,然后呢,自己去买一对高端显卡,配置好后呢,租给企业客户。但是 a、 i、 d、 c 机房是受国家严格监管的,所以必须要有 a i、 d、 c 的 资质,企业才可以搞,个人呢,可千万别瞎折腾。

万万没想到,让当下最火爆的 open clone 帮我们赚钱,结果他却要我们先花钱给他充 talking! 本期视频就来教你白嫖上千万 talking 的 神操作!首先打开这个网站,下滑找到这个输入输出都是零元的 deep secret, 轻轻一点它就会弹出详情页,点击打开这个 a p i 文档后,直接在 post 栏下复制这串网站的域名 url, 然后我们打开电脑自带的命令提示, 以管理员身份运行后,我们下滑找到龙虾的 api 配置页面,把刚才的 url 域名复制到下面后,回车,龙虾就会问我们索要 apikey, 此时我们再回到刚才的网站,找到 apikey 秘钥栏,新建一个自己的 apikey 后,我们点击复制,然后粘贴到龙虾的 apikey 索要栏下,继续回车, 等它提示我们输入模型 id, 再回到 deepseki 的 详情页的最顶端,点击这个复制符号,模型 id 就 已经到手。 此时只用粘贴到输入窗口,然后回车,一个无限 talking 的 龙虾就已经配置完毕,此时随便给他发布什么任务,等他完成后,我们进入消耗后台,可以看到我们已经消耗了十二万的 talking, 却没有花一分钱。

还是有很多大聪明不停的问我,博士,我如何跟你卖托肯?托肯到底是啥啊?我觉得你想跟我卖托肯可以,你首先要理解什么叫做托肯,很多人根本就不明白,以为托肯是一件很简单的事情,其实并不是这样 啊,有的人说是字节,有的人说是字数,其实我觉得都不对吧,用通俗的话,普通人能够理解的话就是啊,托肯就是 ai 世界的律师费吧, 你想想,你去问一个大律师,人家可能是按照分钟来收费,对吧?你一问一答, ai 也一样,但是 ai 他 没法一个定量的去按时间来,因为有的 ai 快, 有的 ai 慢,就是根据背后的算力 啊。 ai 不 看你问了几个问题,他是把你这些问题打碎之后,然后在他脑子里面赚了多少颗粒度? 呃,比如说在中文里面,我们大概一个 token 就是 一个一个字,然后在英文里面,一个 token 大 概是零点七五个字。所所以说,比如说 brightness, 它叫 bright, 然后 ness, 然后 darkness, 它这个你看,呃, brightness 和 darkness 它里面相似度就是一个 n e s s, 这就是一个具体解释, 在 ai 里面, token 就是 处理逻辑的最小代价。如果你问,比如说吃了吗,你问博士吃了吗?我可以秒回 ai, 也可以秒回,它不需要呃,用太多的算力,但是如果你让它写个什么对赌协议, 什么销售协议,它还是得调动很多的神经元。 token 记录的,其实某种意义上讲就是说,哎,它在它脑子里面运转了多久 好?这时候关键问题来了,很多人都不明白 token, 他 觉得 token 是 个标准品,其实 token 不是 一个标准品, ok, 它是根据不同的模型,它会产生不同的 token, 你 比如说你有 deepsea, 你 有 jamaican, 你 有 john cloudy, 你 还有这 gorn, 对 吧?不同的模型。 所以呢,很多人在这建这种机房的话,去卖这个,卖这个,托肯,我觉得这也不 make sense, 本质上这些只有大公司在做,因为你要有自己的模型。当然了,你说,哎,兄弟,我不怕,我自己有把开源模型 放到我自己的机房里去让,然后给别人提供也 ok, 但是开源模型是在不停的演化的,所以你有自己的技术力量去不停的去开源模型嘛,对吧?都是一些问题,实际的问题。 然后呢?还有还有说不同的模型,我再解释更清楚一点,他就想找律师,你找一个刚毕业的实习律师,他可能问一个问题,收你五百块钱, 然后他给你建议,可能赵本山哥,甚至可能还不如大模型,对吧?如果你是去找一个身价千万的顶级合伙人,他跟你的回答的问题他可能完全是不一样,而且他每一个回答他可能都是根据他处理了很多问题啊,根据他几千个真实的案例来。 所以大模型也一样,大模型有有七 b 的 小模型,就像现在所有人都说,哎, mac mini, 呃,我去,让这种小模型,这种出海三裂,那都是小模型,它产生吞坑速度很快。其实 mac mini 也不快啊,但是它脑子里没有深度,它给你的逻辑可能根本就不通的, 像 gbt4 啊。然后 jimmy 这种大模型,它每一个,呃,大模型,它不是升级,它其实升级的过程中它也是融合了很多的各种各样的最新的这些知识,它其实在其实某种意义上讲,其实我就为什么说其实做垂直领域的大模型其实没有多大的 啊?一,因为你会发现我刚搞一些 dota 出来,然后一些大厂,他马上就把这些新的 dota, 新的垂直行业的领域的东西放到他的大模型里面, 而且他自己有很多自己的算力中心。如果你单纯的用一个呃开运的模型去做的话,开运模型大部分人我都说过是真流出来的,几乎是没什么用的,其实本质上就是说你你你用什么样的模型也会对应着什么样的算力,对吧? 呃,其实某种意义上讲,我们再来讲一讲大模型,为了突出一个头肯,它其实也有需要很多的 gpu 的 协调合作, 它不是说不是说一个一个小 mac mini 就 就可以去卖了,其实你你想想的大模型它都是几几个几个逼量的参数,它肯定要进行很多的这种举矩阵运算, 就为了你一句提问,比如说你问一个问题很简单,问题它可能秒回,但是大的东西的话它还是要很多做协助呢。 小模型呢,就是一个 mac mini, 他 自己在这想速度快,他其实质量也很差,所以呢, token 的 成本其实本质上取决于你这个模型的大小 和你这个算力的这个这种消耗。如果你的需求大,这种问的问题很深,你就需要这种顶级的律师事务所的合伙人,所以你就要更更强的算力,更强的大脑。如果你只是问一个博士吃了吗?我跟你可以卖 token 吗?这种话,那肯定话就很很很简单, 所以呢,在这我们这个时代,你不要想着就是单纯去卖 token 啊什么的,你要想去卖 token, 你 首先要想好 你 token 的 客户是谁,他会问到什么样的问题,你需要用什么样的模型去解决,你需要匹配什么样的算力?而往往这些东西都是我们这种云厂商,比如我们代理亚马逊云云厂商来解决的。不是说一个小白什么都不懂,然后,然后上来说我跟你卖 token 嘛?这这这简直就不 make sense。

最近我收到最多的后台私信就是 token。 既然是个新的大众商品,那普通人能不能自己生产 token 自己卖?今天一条视频给你讲清楚。先说结论,能生产,但你算完账,你就不会干了。我们来算一笔账, deepstack 目前最火的大模型,它卖 token 的 价格是多少?输出,每百万个 token 三块钱。 一百万个 token 是 什么概念?大约相当于五十到七十万个中文字,一本书大概十万字,也就是说, ai 帮你能写将近七本书的内容,只收你三块钱。反过来说,你自己要生产这一百万 token, 至少得花几十万买个 gpu, 装一台服务器, 二十四小时不断电。就这样,你的一台机器大概需要十几个小时才能生产出这一百万个 token。 而且这个你还没有算你的工程师维护机房电费和宽带费。 deepsea 为什么能卖三块钱?因为它拥有几万张 gpu, 同时跑,一天处理上千亿个头梗,成本被摊到几乎为零。这就好比你自己在家养了一头牛,挤了奶想拿出去卖,一瓶卖五块, 你觉得能赚,但是你一算,买牛花了两万,饲料每月两千,一天只能挤几斤奶,隔壁蒙牛一天出几千吨,一瓶卖三块钱还能赚?你的奶不比它的差,但是你的成本是它的一百倍还要多。 这就是普通人生产 token 面临的问题,不是做不了,是做了一定亏。所谓普通人在 token 这门生意里的正确姿势,不是自己生产 token, 而是用便宜的 token 去创造贵的服务。 举个例子,你用 deepstack 花三块钱买一百万个 token, 让 ai 帮你写十篇小红书文案,通过小红书的文案带货去赚钱,那么你的成本就是三块钱。 你赚的不是 token 的 差价,是你知道怎么用 token, 而别人不知道的信息差。再举个例子,你用 ai 帮一个小型企业搭建一套 ai agent 的 token, 成本可能不到十块钱,但你收企业五千块钱的咨询费, 企业买的不是你那十块钱的 token, 而是你的判断力和方案。不要去跟巨头抢着生产 token, 要去想怎么用三块钱的 token 创造三千块钱的价值。生产 token 的 钱留给巨头去赚,用 token 去做赚钱的生意,才是留给普通人的机会。我是文思,关注我每天带你看懂 ai。

如果一个龙虾我跳通了,龙虾起号成功了,我直接复制十个龙虾,我原来每个月还要发有十个人七万块钱工资,我现在是七万块钱工资都不花了,然后他可能就花一万块钱的头,等下来六万块钱全是我的利润。首先把 a a 当人看,你把它当做一个经纪人,把它当做一个毕业生,或者是一个小白。比如 你现在找了个小助理,如果说能找到市场上现成的,就你给他一本操作手册,比如说那个自媒体账号,偏偏十万加起号秘籍这样的,就你给他一本操作手册,比如说那个自媒体,就你自己 手把手做一遍啊,比如说 tina, 我 觉得 tina 是 一个,就是确实在在网管这方面比我有天赋太多的一个人。比如他如果去喜欢的话,他就教龙虾首先选题怎么选,然后选完之后内容怎么去组织,比如说哪些地方要加一些情绪钩子啊,标题怎么去抓住人们的吸引力、注意力怎么去?一步步教 ai 做, 拍完之后,然后再跟 a a a 说,你把刚才的那个过程写成 excel 就 可以了,它就是最贴合自己的一个 excel。 包括说你如果有更多的电脑,十几二十台电脑同时在跑,然后它就通过电脑去复制这个逻辑,它其实就和开公司逻辑很像了。比如说你今天去招一个自媒体写手,找一个文案,可能在二线城市 五千块几千块招他进来,然后给他一些培训,你那个 skill, 你 那个 s o p 手册给他之后,然后他发现,哎,他起了号,他照着做能起号,然后起号之后他能够挣到钱,他能够每个月带来超过他这个工资的收益。那 做老板是不是就可以说我开始搞几十号,我搞十个,搞二十个号,然后我招十个员工,每个人搞两个号,那这个事情他其实放到 ai 上是管理 有效的。如果一一个龙虾我跳通了,龙虾七号成功了,那我直接复制十个龙虾,我原来每个月还要发有十个人七万块钱工资,那我现在这七万块钱工资都不花了,然后可能就花一万块钱的头等省下六万块钱,全是我的利润。现在 ai 在 做智力工作时候,它和人的区别真的已经非常非常小了。 还有个点就是如果说我们不去梳理 skill, 不 去梳理一些 s o p, 我 招人进来之后,他说你去网上找一点案例,然后你去学一下,要求他一点经验,然后这样去取号。这时候就类似于说我们有了模型,但是没有 skill。 如果你招到一个非常聪明的人,他可能是北大的,学中文的,然后他那个文字就是可以很打动人心,那大家就是贵,就像你今天去用那个 opps 的 模型一样,大家就是贵,你一个月才挣一万,然后这个人一个人的工资花你一万五,你说是一个纯亏。然后可能我们通过比如说用一些国产的模型, 虚拟的模型,然后它便宜,价格可能只有海外模型的八分之一,甚至十分之一,当然确实是那个模型性的有差距,然后我们就通过这个 skill 来填,就是更便宜的模型加 skill 的 方式去达到原来的效果,让这个账号每个月可以挣一万块钱,怎么可能只有原来的十分之一?那这个事情它就会有利润,这也是相似的逻辑。

偷偷出海,正在把中国的电变成世界的商品,中国把过剩电力变成了全球疯抢的一种商品,一度电出口赚五毛,未给 ai 后竟卖出四百元。行,如果啊,你是冲着电力套利和东数西算这样热到的词语点进来的,你可能就要输忘了,因为今天啊,我要泼三盆冷水。 嗨嗨,我是艾瑞斯,一个天天跟 ai 模型账单打交道的创业者。最近呢,偷偷出海这个词啊,火到了发烫,但是呢,我却越看越心惊啊, 因为呀,几乎所有的分析呢,都错到了根上。今天这条视频啊,我只说三句大实话,帮你把幻觉突破。第一句实话呀, ai 的 竞争从来都不是挖矿,别用电费便宜来幻想统治世界了,很多人啊,算账,中国电费便宜。所以呢, ai 的 老细胞,也就是扑克,成本就低,出口呀,必胜, 大错特错,英伟达的脑皇的五层蛋糕理论说的已经很清楚了, ai 的 产业呢,有五层,从下到上啊,是能源、芯片、基础设施, ai 模型和应用。电费呢,只是最底层,最基础的一层,在整个总成本里啊,它只占百分之十五到百分之二十五。真正烧钱的是什么呀?就是几十上百亿甚至上千亿的研发投入 砸出来的模型是贵上天的, g p u 显卡也是整个系统的工程优化,你电费再便宜,能够便宜过这些吗?所以呢,纯电费套地啊,本质上就是用挖矿的思维去规划发射卫星的生意赛道啊。从一开始就看错了。第二句实话呀,中美模型的价差呢,不是成本差,而是物种差。 openai 的 gpt 敢卖天价,咱们国产模型却只能做到它的几十分之一,这是为什么呢?技术上啊,美国的主流模型是全院专家会诊,问题呢,再简单也需要全体的专家到场,成本啊,极高。咱们的主流呢,是智能分诊,也就是用谁叫谁,效率至上。 从商业上啊,美国卖的是华尔街硅谷认可的技术霸权和确定性。是啊,奢侈品。咱们呢,卖的是给普罗大众的 补贴工具和生态门票,是基础设施。市场上呢,咱们美国消费者为顶级的生产率付费是习惯。咱们呢,还在用地板价去教育市场,我自己公司啊,就分的很清,写核心代码,搞系统设计。咱们呢,会用美国的高价模型 买的呀,是可信和效率,但是处理文档,生成文案这些国产模型啊,绝对是 y y d s。 是 因为啊,足够好且便宜太多。这个价差的背后呢,是技术路线、商业策略、市场阶段的三重差异。你买的呢,根本就不是同一种福分。 第三句实话啊,出本出海呢,不是开个 a p i 就 收美金,而是啊,闯进了全球最复杂的雷区。你以为啊,把夫妻搭好,翻译个文档就能够收全球的钱了吗?这个太天真了。第一道鬼门关是数据合规,欧盟的 g d p r, 美国的各种法律,你的数据能不能出镜呢? 很多的海外公司根本啊,就不可能数据要传回中国的 ai 服务。第二道卡是地缘政治,在去风险的背景下,你今天的生意做的很好,可是明天啊,一纸禁令就可能让你归零了。第三呀,是税务法律,实体 钱怎么收费怎么交,在哪个国家啊?被告了怎么办?这些问题呢,就能够让一个技术团队呢直接崩溃了。所以呀, 通过出海有机会吗?有的,但是呢,绝对不是一个懒人捡钱的机会。真正的初度呢,我认为只有三条,第一啊,是去友好市场,比如像东南亚等地,中国的模型呢,好用不贵,靠极致的性价比呀,取上核心啊,是做好区域深耕,而不是啊全球撒网。 第二呢,是全球开发者的杠杆在 openner 上啊,中国模型的这个钓流量呢,已经超过了美国了,咱们呢,已经是无数开发者的性价比首选啊。第三呢,是模式生伪和草船借箭, 从卖 a p i 变成卖本地合规的解决方案。但是啊,这需要巨大的资源和实力,或者呢,和海外合规平台,比如说 fireworks, ai 等等合作,作为模型供应商融入他们的生态,这也是许多中国开源模型团队的实际选择。说到底呀, ai 的 全球竞争是技术、工程、生态、规则的全方位博弈,突破价格呢,只是一个缩影, 未来的赢家啊,绝对不是吆喝着我的电费最低的人,而是能够让每一度电,每一秒算你都产生更高智能价值的团队。热闹呢,是别人的成本呀,是自己的。在 ai 这场无限游戏里面,看错地图啊,比跑得慢可怕了一万倍。 我是艾瑞斯,在 ai 创业一线专治各种简单归因和认知幻觉。如果呀,这条视频让你呢更清醒了一点,记得呀,点赞分享,咱们下期再见了,拜拜。

一九五六年,美国人发明了集装箱,在那之前,全球贸易的成本一半是装卸费。集装箱一出现,世界变了,货物被标准化,运输成本暴跌,全球贸易爆炸。今天 ai 时代也出现了一个集装箱,它叫 token。 很多老板听到 token 只当技术名词,但如果你是做生意的,你要看到的是,这是一次电力的重新定价。 什么是 token? 简单说就是 ai 处理文字的技能班位。你问一句话,写一段代码,生成一份报告,背后都在消耗 token。 重点在于, token 可以 被计量,被计费、被出口。这就像集装箱,把原本难以交易的智能服务装进标准化容器,从此脑力可以像货物一样卖到全球 来。算一笔账,一度电直接出口大概卖零点五元,炼成铝定大概卖一点五元,翻三倍。如果拿去跑大模型推理呢? 一度电大概能产出五百多万。 tokyo 按国内模型定价算,可以卖到十一元,十一元是直接卖电的二十二倍。如果按 open i 的 价格算,将近四百元, 七百八十五倍。你看到中奖了吗?同样是一度电,换个皮价值差几十倍上百倍。这不是能源生意,这是算力生意,是标准化的脑力出口。更关键的一点,电不能装箱,但 tucker 可以 跨国流动, 不用电网,不用特高压,不用对方国家批准,只要一根网线。印度创业者调用中国 api, 背后是甘肃的风电,青海的光伏在转电没出国,钱出国了,这才是结构性机会。 很多老板问, ai 这么卷,价格都打烂了,还赚什么钱?你要明白一件事,现在的二十二倍,不是天花板,是价格战的结果。美国把价格毛在高位,中国用工程能力把成本打下来。一个负责教育市场,一个负责规模收割,这就是新的全球分工。 真正值得你思考的,不是模型谁更强,而是在这个时代,你是卖店的,还是卖 token 的,是卖原材料还是卖标准化能力。 所有产业都会被 token 重构,教育变成按 token 计费,客服变成按 token 计费,编程变成按 token 子计费,营销、法务、设计、咨询全部变成可计量的智能服务。一旦被计量,就可以规模化, 一旦规模化,就会诞生新的巨头。生意的本质从来没变,谁掌握标准,谁赚溢价,谁只卖原料,谁被压价。 一九五六年,集装箱改变了全球制造业。二零二六年, taco 正在改变全球脑力市场。电力过剩不是问题,算力过剩才是机会。美国把 taco 价格炒上去,中国把 taco 成本打下来,悉数东算的战争才刚刚开始。 如果你是老板,现在真正该问自己的,不是要不要用 ai, 而是你能不能把自己的行业装进 tokyo 里卖。

你是不是也觉得 ai 时代来了,但自己插不上手,看着别人用 ai 赚钱,自己却连门路也找不到?别急,今天我给你指条明路,给 ai 当启蒙老师,赚托坑奖励。 简单说, ai 像一个婴儿,需要有人教他认识世界。你的工作就是给图片打标签,给文本分类,把语音转成文字, 每完成一条,平台就给你发 token。 现在有两个平台特别火,第一个是可莱德语言,你上传自拍视频文档,平台处理后卖给 ai 公司,训练模型注册只需要手机号上传就有钱,有人最高月入七千四百美元, 虽然大多数人赚的是零花钱,但胜在门槛为零。第二个是嗨歌,就是区块链驱动的去中心化平台,你完成图像、文本、视频标注,实时获得嗨歌带币奖励。注册需要钱包连接,但收益更透明,每天花十五分钟能赚四到五美元。 实操路径,三步走选平台新手建议,从可莱德 ai 开始,有经验再玩台歌做任务,从简单的情感分类做起,单价零点一到零点三元每条提收益,可莱德直接提现到银行卡。台歌是把代币换成 usdt 再变现。 真实的案例告诉你,武汉大学生李明课余做标注,月入一千到两千五百元。深圳残障青年小齐通过数据标注实现就业,月薪稳定。可来的平台头部贡献者呢?靠上传高质量的数据,月入七千四百美元。但要注意风险, 选错平台,小平台可能跑路,只选百度、中测、京东众志这类大厂背景的数据隐私,绝不授权人脸、身份证、实时位置等敏感信息, 收益预期,别信月入过万的忽悠,大多数就是赚个零花钱。第一步迈出去,你就从 ai 旁观者变成了参与者。记住,技术是杠坎,认知才是支点。与其观望,不如从今天开始,用你的碎片时间给 ai 当老师赚头坑奖励。

别再瞎用 openclaw 了,别人用 ai 啊,一分钱不花,你却在疯狂地烧 talk。 今天一条视频告诉你, openclaw 到底能连哪些大模型, talk 又该怎么薅?哪几个模型便宜又好用? openclaw 能连的模型啊,就三类, 国际大厂 g b t cloud, 国产头部空一千万 g l m kimi, mini max, 还有本地的 alama 开源模型,零成本啊,随便跑,想省 talk 啊?记住三招, 第一,新用户免费额度全领一遍。 deepseek 百链智普注册呢,就能白拿几百万的 token, 每月还有赠送的额度。第二,简单任务,用低价模型,复杂任务呢,再上高端。 第三,本地跑开元模型,一分钱不花,如果追求性价比,日常清量啊,用 deepseek 加千万 flash 免费额度就够你用了。中等任务呢,选 mini max g o m 四点五,便宜又稳,复杂推理直接上 cloud, 索尼 g p 四 o 迷你效果顶价格还不心疼?逻辑通了,你一个人就是一家二十四小时无人公司,关注我带你用 ai 早点下班!

现随着 ai 应用的遍地开花, ai 的 talk 消耗量越来越大,甚至有人开玩笑,今天赚了多少个 talk, 还有一个应用场景,大家每天在使用 openclo 的 时候, 它的消耗量也是非常惊人,今天为大家分享一种方式,可以白嫖 talk, 而且它不是那种小模型,而是我们国内的 gim 五, 接下来我们看一下如何使用。哈喽,大家好,这里是二 pop openclock, 相信大家现在已经人手一只了吧,但是它的 talk 消耗量就非常大,今天我们分享一种可以免费获取 talk 的 办法,这就是互联网大善人英伟达免费开放的, 之前我也在公众号分享过,今天我们来手把手实操一下。我们打开英伟达官网的模型列表,大家可以看到这里有各种各样的模型,像千万三点五,还有智普五点零, 还有 kimi 二点五等等,这些都是可以免费试用的,使用方式也非常简单。我们先点击这里的注册,当然在这里注册的时候,我们要注意一点,我们要使用海外的邮箱,就比如 gmail 或者是微软的 outlook, 不要使用 qq 邮箱,这种是没法通过的,我已经给大家试验过了。 我这里粘贴我的谷歌邮箱,点击下一步,这里输入你觉得合适的密码,我们点击创建一个账户,这里他会给你的邮箱发送一个验证码,输入验证码,点击继续。这里是按选择是否接受通知,我们直接提交就可以, 没有任何影响。这里输入一个名字,这里也没有任何限制,直接输就行,这时候我们就注册完成了。回到了这个页面,大家可以看到最上边有一行,请验证你的获取 api, 我 们这里点击一下验证, 这里验证是需要输一个手机号的,这个手机号我们也试验过,输入国内的手机号,也就是加八六的,前面我们选择中国 china, 这里我们输入八六,这里我们选择中国。以后输入一个我个人的手机号,点击提交,这时候你的手机就会收到这样一条验证码, 是优速通发的,我们输入进去,点击验证,可以看到这里基本上是秒通过的,我们在这里随机选择一个模型,就比如智普的这个五点零, 然后点击这里的 welcome, 这里获取 api k, 可以 看到已经能拿到了,接下来我们验证这个 api k 到底可不可以用呢?在之前我分享过一个很好用的工具, cherry studio, 就是 这个樱桃的,它是一个开源项目,我们可以在 github 上直接下载到,然后在这里测试一下这个 api k 到底可不可用,我们点击左下角这个齿轮, 这里选择添加模型供应商,我就添英伟达下面供应商类型,我们选择 open ai, 点击确认,这里需要填密钥还有地址,我们粘贴 api k, 粘贴 url, 添加模型,这里要注意这是英伟达自定义的一个模型名称,就这个 z 杠 ai glm, 我 们拷贝过来,点击添加,这时我们打开对话试一下, 这里要注意模型切换,我们切换成刚才添加的,因为答的这个 z a i g m i 五,我们问它是什么模型,看一下它的反应,这里因为我的网络问题,可以看响应速度稍微有点慢,但是它是完全没问题的,可以看到它是由 z 点 ai 训练的大约模型,然后是 g a m, 这时我拿到这个模型大家就知道怎么用了吧,比如我们把它绑定到我们的小龙虾,或者是绑定到我们的 agent 上,这时候就可以无限的耗羊毛了, 而且我还没有碰到过说使用限流或者是 taco 被用完的情况。大家如果需要更多的账号,完全可以按照我这个方式注册几个谷歌账号,然后并且做一个手机绑定就可以了。更多 ai 和变现的方式我们一起来研究。

toker 到底怎么赚钱?大家好,我是程序老张,上一集我们说了 toker 就是 ai 的 电费加流量费,那这一集我们就来拆解一个核心的问题, toker 到底怎么赚钱?先说一个简单的公式,收入 等于 toker 单价乘以 toker 消耗量。听起来很简单,对吧?但里面的逻辑跟以前完全不一样, 以前软件怎么赚钱?卖许可证?一个账号收一分钱,用户用多少,你收入都一样,但头肯不一样,你用的越多,我就赚的越多。这导致一个结果,在 ai 时代,你的收入上限不再被用户数限制了。 我给你举个例子,假设一个企业用 ai 处理客服,以前招十个客服,成本固定,现在用 ai 成本按 top 算,业务增长十倍, top 销货也涨十倍, 你的收入也涨十倍。这就是 top 生意的本质,它是按使用量收费的规模化生意。现在你回头看一个数据,中国 ai 大 模型一周调用量五万亿, top 五万亿乘以 toker 单价收入是多少?这就是为什么云厂商母婴厂商全部都在讲 toker 入口,因为谁掌握了 toker 的 出口,谁就掌握了 ar 时代的水龙头。 那问题来了,这个生意普通人能不能分一杯羹呢?下一集我们就讲普通人怎么参与 toker 经济。

使用 openglue 呢,如何让每一个 token 都花在刀刃上?先问一个问题啊,就是你用 openglue 一个月花了多少钱?有的人可能花了六百美金,有的人呢,花二十美金,但是他们干的活有可能是差不多的。差距在哪里啊? 差距就在于你有没有让每一个 token 呢,都花在这个刀刃上。今天这条视频,我把社区里面验证过的是, token 就是省钱的方法呢,全部浓缩成三部,看完你立刻就能用。我们先说一个真实案例啊, reddit 上呢,有一个老哥跑了一个自动化新闻分析的 agent, 他 以为呢,每天的消耗呢,是很低的,结果呢,外部 a p i 返回了一个异常数据, agent 开始无限循环重试,结果一觉醒来,账单已经 一万两千八百四十七美金。所以 opencube 的 透视消耗呢,有一个最大的坑,就是上下文累积。你每发的一条信息,它会把之前所有的当前的筛选的对话历史,系统提示工具定义,还有 skill 的 定义,全部重新发一遍。注意啊,这里面系统提示词可不是说几句话或者几段话的。这种事我之前有个视频详细讲过 opencube 的 五大配置文件,那里面也提到了,就是我们每次对话开始呢,这五个文件呢,全部内容 都会加载到系统提示词里面,包括这个 agent, m d, sun m d, u s m d, heartbeat m d 以及 open clue 点 jason 这五大文件。 现在你对话一百轮之后,光 token 输入呢,就是两万多 token, 一个月下来几百美金就这么烧掉了,那我们要省钱怎么破呢?三步走啊!第一步,做模型的分层,不要用大炮打蚊子。 open clue 二零二六年最近的一个重要更新,就是支持了 自适应的模型路由。简单说呢,就是我简单的任务呢,我用便宜的模型,然后复杂任务呢,我才上贵的。给大家一个社区验证过的五层方案啊。第一个就是心跳检测,简单分类这些,用 gemna flash 这个模型,一百万 token 才一毛钱。第二个呢,你做日常分析讨论,用 kimi k 二点五或者是 deepsea v 三六毛钱,一百万 token 呢,不到一块钱。第三个,你做内容创作,内容创作呢,对表达是有要求的,那你上 cloudsonet 这个模型啊。第四就是最难的决策,采用 cloud operas。 那 从开源社区的反馈来看,用户呢,就靠这一招,月份呢,就可以从八十七美金降到二十七美金,省了百分之七十。 第二步啊,砍掉隐形的浪费。三个最容易忽略的 token 黑洞。第一个呢,就是 send 点 m d 文件太长了,很多人写了这个两三千字的系统提示,每次调用都要重新发,我们要把它砍到三百字以内,这样历省百分之三十到百分之五十, 怎么来压缩呢?首先,你得懂 sao m d 的 构成,可以看我往期的这个视频,或者看我们的蓝皮书。第二呢,有可能你没有开 prompt capture 的 提示词缓存功能,能够把重复内容的费用呢,降低百分之九十,通过 catch retention 这个参数可以一行配置的。是呢,很多人却不知道。第三个,心跳任务用了贵模型,那 open cool 呢?这个心跳任务呢,是每半个小时它就要触发一次的,如果你用的是 opengool, 那 一个月光心跳,那就得烧几十美金。 所以我们要把心跳模型呢,单独设成着 hico 或者更便宜的模型,这笔钱呢,你就省下来了。那还有一步呢,就是设安全网,防止翻车。大家要记住这个三道防线啊。第一个就是 opencloud 的 层面,设置,单独的请求上线,每小时上线和每天的上线。第二呢,还可以在 api 平台层面来设置,比如说 osmic 或者 openai, 或者第三方的中转,比如说 apprutor, 他 们在后台你都可以设置使用的上限的限制的。再一个呢,就是支付层面,用预付费的账户可以充多少呢?用多少,不要透支。前面讲的那个一晚上烧了一万二的脑壳呢,就是因为这些防线呢,他一道都没有做啊。 所以最后我们总结一下,第一个模型分层,第二个砍掉浪费,第三个设好防线,这三步做完,社区的平均数据呢,是这样的,月费呢,能够从六百美金降到 五十美金左右,不是省一点,而是省下了一个数量级。 opencube 的 核心理念是让 ai 帮你干活,帮你赚钱,但前提是呢,你得管好成本对吧,这样你才有利润,虽然它有收入,但是呢,你成本太高,可能你利润没有了,所以呢,只有你的 r o i 大 于百分之百,那这个 token 呢, 挖的才值, ok。 以上这些完整的配置方案和踩坑的清单,都更新在了一百八十九页的 open clue 蓝皮书的最新版本里面。如果这条视频呢,对你有用,可以点赞收藏,我们下个视频呢,继续聊,当然最重要的就是你看完得马上用起来。

今天我给大家讲讲谁才是真正的烧头肯在赚钱。别看全网都在吹这个 open call, 真正用量大的背后闷声发大财的其实就是那种那么几类人, 别刷那些一键支付的视频了,洗洗睡吧。大部分人的话,烧头肯其实是在给自己烧纸,说的比较难听啊,烧的是创业梦,真正月入百万的大佬,他跟你玩的根本不是一个东西 啊。今天我就用 ai 做个图给大家拆解一下。第一类就是灰厂老司机吧,就是搞灰厂和内容工厂的,这种人最简单粗暴,他用 ai 批量生产这种深夜情感故事,或者大哥点点关注发财关注我。 只要转换率够,那种头肯费用对他来说算个屁。记住, roi 就是 投资回报率只要大于一的话,那个头肯就是印纸的钱,他们买头肯基本上跟买打印机纸一样,不心疼。 第二类就是我,我称之为大模型,偷师学艺派,表面上他们说在自研国产之光背,背地里天天吊什么 jimmy 呀啊 grog 啊,接口去为那个模型用顶级的老师训个廉价的徒弟,然后去割垂直行业 啊,其实也不叫割韭菜吧,他这叫智商降维套利费点钱,但真能忽悠 啊。当然互联互联网上我也不能瞎说太多,懂的都懂,谁叫我们遥遥领先呢,对吧。第三种 p o d 呃,现在比较火的就是 print on demand, 这种还是挺多的,在美国特别就是 呃客户下个单,或者是自己通过 ai 来定义一些产品,包括这种 t 恤啊,然后客户下单以后我才去印,这样的话会结,减少很少成本,以前请个设计师可能一天磨磨蹭蹭出三张图, 现在调个 api, ai 一 天吐个几千张印在 t 恤马上拿走。在这种他们眼里, ai 不是 什么人工智能, ai 是 一个不交社保不吃午饭还不会呃改稿子跟你辞职的这种劳力。这种人其实是现在的一种新的商业模式,而且很快 啊。还有一个就是商业演技派了,我觉得最搞笑的是帮搞 ai 传销骗投资人的这路数。想起我之前的去一个叫做未来云,我也被坑了,当然我是给他们面子, 就是大家也经常看到几千个人就是几千个手机啊,几千个 mac mini 啊,翻那刷单演戏啊。现在艺人公司基本上也是这样的,整一堆 a 证的脚本托管烧的飞起,其实是演给 vc 和这种个人投资人看。 呃,这头更烧的不是算力啊,实算的是演技,是 ppt 的 灵魂。然后就是这种燃料区嘛,所谓燃料区就是 就是我们普通的韭菜吧,普通人就包括我自己在内。业务闭环没没影呢,当然当然,我自己公司是有业务闭环的。然后,然后天天被博主忽忽悠配置什么 open club 啊,然后把自己呃绕晕在环境配置里面。呃,烧头肯 其实没没多大用。你以为你在创业,其实你是在给 ai 行业捐款。当然呢,你自己某种意义上讲你自己,你像我做个 ppt, 做个这种视频,其实基本上你用免费的工具去做做都可以。 所以呢,基本上可以这样说,我不骗穷人吧。然后下一期我可以给大家讲讲啊,这种算成本如何?就是什么情况下你自己去租机器,什么时候直接调别人 api? 这样的话你对自己的商业逻辑也有一个很清晰的认识。那种一天开发一百二十个软件的,然后投的公司,你觉得你信吗?你觉得开发一个软件丢出去直接就能挣钱吗?我从来不这么认为。