我今天不是发了一个关于 tikken 中转的视频吗?没想到流量还挺好的,然后涨了不少粉丝,大家都在问说这东西该怎么做,所以呢我就给大家说一下它这个的完整的流程吧。首先第一步呢,也就是注册一个账号,然后你能获得一个自己的推广链接, 接着你就去各个平台上面去把这个链接卖掉就好了,比如说小红书啊、闲鱼啊,嗯呐呃,抖音啊,都可以做一个节流的工作。然后呢,然后客户通过你的链接去下单之后呢,他的所有后续的消费都能够绑定在你的账户上面做一个返佣。 然后呢,你在这个网站上面你可以查询到自己的返佣的数据,这个佣金的结算的话是每天都能结算的。 实际上大家听完之后也知道,其实他也就是做一个销售的工作,如果说你自己能力真的很强的话,你也可以不用做 tok 的 中转,如果你真的业务能力很强的话, 像我们之前做的那些在闲鱼上面卖这些教培资料的东西,你都可以去做啊,只要是你自己的能力够强,你自己想要做销售的话,完全不用局限于 tok 中转这个业务。
粉丝819获赞1970

最近我收到最多的后台私信就是 token。 既然是个新的大众商品,那普通人能不能自己生产 token 自己卖?今天一条视频给你讲清楚。先说结论,能生产,但你算完账,你就不会干了。我们来算一笔账, deepstack 目前最火的大模型,它卖 token 的 价格是多少?输出,每百万个 token 三块钱。 一百万个 token 是 什么概念?大约相当于五十到七十万个中文字,一本书大概十万字,也就是说, ai 帮你能写将近七本书的内容,只收你三块钱。反过来说,你自己要生产这一百万 token, 至少得花几十万买个 gpu, 装一台服务器, 二十四小时不断电。就这样,你的一台机器大概需要十几个小时才能生产出这一百万个 token。 而且这个你还没有算你的工程师维护机房电费和宽带费。 deepsea 为什么能卖三块钱?因为它拥有几万张 gpu, 同时跑,一天处理上千亿个头梗,成本被摊到几乎为零。这就好比你自己在家养了一头牛,挤了奶想拿出去卖,一瓶卖五块, 你觉得能赚,但是你一算,买牛花了两万,饲料每月两千,一天只能挤几斤奶,隔壁蒙牛一天出几千吨,一瓶卖三块钱还能赚?你的奶不比它的差,但是你的成本是它的一百倍还要多。 这就是普通人生产 token 面临的问题,不是做不了,是做了一定亏。所谓普通人在 token 这门生意里的正确姿势,不是自己生产 token, 而是用便宜的 token 去创造贵的服务。 举个例子,你用 deepstack 花三块钱买一百万个 token, 让 ai 帮你写十篇小红书文案,通过小红书的文案带货去赚钱,那么你的成本就是三块钱。 你赚的不是 token 的 差价,是你知道怎么用 token, 而别人不知道的信息差。再举个例子,你用 ai 帮一个小型企业搭建一套 ai agent 的 token, 成本可能不到十块钱,但你收企业五千块钱的咨询费, 企业买的不是你那十块钱的 token, 而是你的判断力和方案。不要去跟巨头抢着生产 token, 要去想怎么用三块钱的 token 创造三千块钱的价值。生产 token 的 钱留给巨头去赚,用 token 去做赚钱的生意,才是留给普通人的机会。我是文思,关注我每天带你看懂 ai。

做 token 代理,卖 api 接口赚钱,这绝对是今年最大的韭菜盘。最近后台问我最多的就是能不能去批量批发豆包、 deepsea, 千问这些大厂的算力资源 token, 然后当个二道贩子卖给别人赚差价。听完我只问了他们三个问题,第一,人家凭什么买你的? 成为代理商的门槛你自己知道吗?豆包、 deepsea 官方的接口又便宜又稳定,你一个私人搭的草台班子,三天两头断线,你卖给谁? 第二,你的护城河在哪?你既没有自己研发底层模型的能力,也没有独家的客户渠道,你就是一个纯粹没有任何附加值的中间商,在算力成本无限趋近于零的今天,中间商死的最快。第三,也是最致命的, 大厂一旦打价格战宣布免费,你的库存瞬间变成一堆废纸,就连大厂的脚后跟都摸不着。记住,在 ai 时代,单纯的算力搬运工作没有任何生存空间。你要做的是拿着豆包千万的便宜算力,去开发一个能帮助大多数企业解决问题的工具, 赚应用层的钱。别去碰底层的基建,不是普通人玩的。任何人跟你谈偷看代理和销售的,要么是大佬,要么就是要割你。我是文思,关注我每天带你看懂 ai。

普通人怎么参与 token 这项业务呢?首先要明确一个逻辑啊,就是 token 生产的这件事情是大厂的专属赛道, 不管是算力 token 还是用模型去调用 token, 这个背后其实都需要很大的这个服务器集群 技术研发合规的这个资质,普通人既没有这个能力,也没有资金参与,强行入局的话呢,只会血本无归。所以普通人要做的就是避开生产端,你去聚焦这个流通端,做上下游之间的链接器,全职的时间呢?去代理 tokken 的 销售,或者搬运一些便宜的 tokken 的 a p i 呢?去海外的这个市场去销售。我给你们四条建议啊, 第一个就是千万不要去找那些不靠谱的算力设备平台去托管投资,投个几万几十万的跟你说,哎呀,能在一年到两年回本,三年到四年翻番的, 你们记住了啊,没有那么多天上能掉馅饼的事情给你。第二,如果你是云服务算力或者是 ai 相关行业的人,那么快速调整到托肯工厂的这个赛道, 这个赛道的发展速度其实是会很快的,现在 ai 的 建设进场速度呢,非常非常的高,你们需要提前在技术和岗位上进行调整,要等待时机。然后第三的话呢,如果你既非技术人员啊, 那么可以选择在电商平台或者分发平台进行 token 的 销售,但是它不能像卖房子那么简单,它有一定的学习的门槛啊,不过我认为在现在 ai 工具的驱动下,一般人都是可以学的会 学的懂,而且学的很快,并不是只有那些学大模型算法的那样子高不可攀。然后第四,如果你不想投资建设,也不想学技术,甚至不愿意去做这个 token 的 销售, 那么你就把 token 的 场景融入到你的工作当中,比如说用它去写一个 ppt, 用它去做个短视频啊,做文案就是能让 ai 做的,你自己就不要去再参与了。就是你再用豆包 deepstack 的 时候,其实就是在用别人免费给你的 token, 所以 这个也是普通人参与 token 的 工作方式之一。

很多人觉得涛肯代理就是二道贩子,但你可能不知道,大厂其实非常需要你做代理,甚至可以说,没有代理,涛肯这门生意很难做大。 为什么?因为大厂缺的不是技术,而是渠道。阿里云、腾讯云、火山引擎,他们的销售盯的是大客户,一个单子几十万、几百万,而中小企业一年可能只花几千块钱,大厂不会去做,但这个市场非常大,于是就出现了一层 投很大力。还有个原因,中小企业根本看不懂这些技术,大壮说 api, 企业说帮我赚钱,大壮说推理服务,企业说帮我省人。你做的事情就是把技术变成生意, 这就是滔腾代理的价值,而且这个模式不会很快消失。云计算发展十几年,代理商依然存在, ar 时代可能也是一样的逻辑。所以说,滔腾代理不是短期机会,而是长期生意。如果你也在研究滔腾代理,评论区打代理,我看看多少人 已经开始关注这个机会。下一期,我讲最现实的问题,普通人第一个滔腾客户从哪里来?关注我,一起探索 ar。

最近很多人都在说 ai 开销太大了,头坑太贵了,真的吗?我们换个角度聊一下呢?我最近花了大概五百美金的头坑,开发了一套文档写作系统。你可能会说,写文档随便哪个 ai 一 句话的事情,你花五百美金,你傻吗? 但是我这套系统不是帮你写个文档那么简单,它可以多端同步管理我的所有文件,接入了我的自建知识库,有一套完整的多账号体系,而且支持多人协助头脑风暴,还有我自定义的多种工作模式, 一键切换就能产出完全不同的方案内容。你告诉我,市面上哪家 ai 能做到这种程度的定制化,还能随时按照我的想法迭代更新?没有, 因为这不是一个通用产品,这是一个完全按照我的工作流量身打造的系统,开发周期有多长?一周 甚至很多功能细节是我拿着手机在聊天框里完成迭代的。五百美金,大概三千多块钱人民币,这笔钱你能在市场上干点什么呢?你能请到两位技术大佬,一位前端,一位后端,帮你从零开始开发部署到云端,还是说能够保证七乘以二十四小时的运行呢? 比如说三千块、三万块钱,你都不一定搞得定这个事情。所以你看,五百美金的头壳,买到的不是五百美金的文字输出,买到的是一个完整的可持续运行、可以迭代的生产线系统。这笔账怎么算都不亏。 那什么才叫贵呢?如果啊,我,我是说如果你的龙虾背后挂载的是 cloud 四点六 opus, 然后你用他问今天天气怎么样,打开网易云音乐,放首歌,或者搜搜附近有什么好吃的,那才是真的贵。头啃从来不贵,用错地方才叫贵。

还是有很多大聪明不停的问我,博士,我如何跟你卖托肯?托肯到底是啥啊?我觉得你想跟我卖托肯可以,你首先要理解什么叫做托肯,很多人根本就不明白,以为托肯是一件很简单的事情,其实并不是这样 啊,有的人说是字节,有的人说是字数,其实我觉得都不对吧,用通俗的话,普通人能够理解的话就是啊,托肯就是 ai 世界的律师费吧, 你想想,你去问一个大律师,人家可能是按照分钟来收费,对吧?你一问一答, ai 也一样,但是 ai 他 没法一个定量的去按时间来,因为有的 ai 快, 有的 ai 慢,就是根据背后的算力 啊。 ai 不 看你问了几个问题,他是把你这些问题打碎之后,然后在他脑子里面赚了多少颗粒度? 呃,比如说在中文里面,我们大概一个 token 就是 一个一个字,然后在英文里面,一个 token 大 概是零点七五个字。所所以说,比如说 brightness, 它叫 bright, 然后 ness, 然后 darkness, 它这个你看,呃, brightness 和 darkness 它里面相似度就是一个 n e s s, 这就是一个具体解释, 在 ai 里面, token 就是 处理逻辑的最小代价。如果你问,比如说吃了吗,你问博士吃了吗?我可以秒回 ai, 也可以秒回,它不需要呃,用太多的算力,但是如果你让它写个什么对赌协议, 什么销售协议,它还是得调动很多的神经元。 token 记录的,其实某种意义上讲就是说,哎,它在它脑子里面运转了多久 好?这时候关键问题来了,很多人都不明白 token, 他 觉得 token 是 个标准品,其实 token 不是 一个标准品, ok, 它是根据不同的模型,它会产生不同的 token, 你 比如说你有 deepsea, 你 有 jamaican, 你 有 john cloudy, 你 还有这 gorn, 对 吧?不同的模型。 所以呢,很多人在这建这种机房的话,去卖这个,卖这个,托肯,我觉得这也不 make sense, 本质上这些只有大公司在做,因为你要有自己的模型。当然了,你说,哎,兄弟,我不怕,我自己有把开源模型 放到我自己的机房里去让,然后给别人提供也 ok, 但是开源模型是在不停的演化的,所以你有自己的技术力量去不停的去开源模型嘛,对吧?都是一些问题,实际的问题。 然后呢?还有还有说不同的模型,我再解释更清楚一点,他就想找律师,你找一个刚毕业的实习律师,他可能问一个问题,收你五百块钱, 然后他给你建议,可能赵本山哥,甚至可能还不如大模型,对吧?如果你是去找一个身价千万的顶级合伙人,他跟你的回答的问题他可能完全是不一样,而且他每一个回答他可能都是根据他处理了很多问题啊,根据他几千个真实的案例来。 所以大模型也一样,大模型有有七 b 的 小模型,就像现在所有人都说,哎, mac mini, 呃,我去,让这种小模型,这种出海三裂,那都是小模型,它产生吞坑速度很快。其实 mac mini 也不快啊,但是它脑子里没有深度,它给你的逻辑可能根本就不通的, 像 gbt4 啊。然后 jimmy 这种大模型,它每一个,呃,大模型,它不是升级,它其实升级的过程中它也是融合了很多的各种各样的最新的这些知识,它其实在其实某种意义上讲,其实我就为什么说其实做垂直领域的大模型其实没有多大的 啊?一,因为你会发现我刚搞一些 dota 出来,然后一些大厂,他马上就把这些新的 dota, 新的垂直行业的领域的东西放到他的大模型里面, 而且他自己有很多自己的算力中心。如果你单纯的用一个呃开运的模型去做的话,开运模型大部分人我都说过是真流出来的,几乎是没什么用的,其实本质上就是说你你你用什么样的模型也会对应着什么样的算力,对吧? 呃,其实某种意义上讲,我们再来讲一讲大模型,为了突出一个头肯,它其实也有需要很多的 gpu 的 协调合作, 它不是说不是说一个一个小 mac mini 就 就可以去卖了,其实你你想想的大模型它都是几几个几个逼量的参数,它肯定要进行很多的这种举矩阵运算, 就为了你一句提问,比如说你问一个问题很简单,问题它可能秒回,但是大的东西的话它还是要很多做协助呢。 小模型呢,就是一个 mac mini, 他 自己在这想速度快,他其实质量也很差,所以呢, token 的 成本其实本质上取决于你这个模型的大小 和你这个算力的这个这种消耗。如果你的需求大,这种问的问题很深,你就需要这种顶级的律师事务所的合伙人,所以你就要更更强的算力,更强的大脑。如果你只是问一个博士吃了吗?我跟你可以卖 token 吗?这种话,那肯定话就很很很简单, 所以呢,在这我们这个时代,你不要想着就是单纯去卖 token 啊什么的,你要想去卖 token, 你 首先要想好 你 token 的 客户是谁,他会问到什么样的问题,你需要用什么样的模型去解决,你需要匹配什么样的算力?而往往这些东西都是我们这种云厂商,比如我们代理亚马逊云云厂商来解决的。不是说一个小白什么都不懂,然后,然后上来说我跟你卖 token 嘛?这这这简直就不 make sense。

我再进一步拆解托管生意,我们都知道啊,卖托管做中转站非常赚钱,聪明的你肯定也明白,因为这个模式解决了大多数人无法使用海外顶级模型的核心问题,其次又解决了高价的痛点,所以它成了现在普通人 ai 创业当之无愧的第一生意。 现在这个生意你普到什么程度啊?你想去当二道贩子,给别人的网站建分站做推广,拿提成,你还得交钱,这不是小刀拿屁股开了眼吗?但如果你真的想从事这门生意,你首先要解决的就是大量的耗资问题, 因为现在这行客户根本就不愁流量完全处于溢出状态,很多中转站根本就忙不过来,导致停收用户。为什么?因为耗磁里面特别容易封号,你要有足够的维护能力去解决这个源源不断的封号问题, 提供稳定优质的服务,你才能持续放大自己的核心用户群,不然你的耗磁一挂,那用户全部退款,那还干什么?关注我,下期继续拆解。

ai 大 模型呢,为什么要按照托肯收费?同样是一百万的托肯呢?为什么价格能差三十倍?等等,你可能会说啊,我们平时用的豆包啊,元宝啊,也没交过钱啊。没错,咱们平时用的网页版或者 app 呢,确实是免费的,那是大厂为了抢占市场给的福利。 但如果你是专业用,或者是使用最近爆火的小龙虾,那就必须通过 api 接口来调用大模型,按量付费,烧起钱来也是非常吓人的。那这些钱到底烧在哪了? 当模型正式发布后呢?它的使用成本其实由两个部分组成。第一部分呢,是固定成本,也就是模型上线前已经砸下去的钱, 包括前期的研发与训练投入,还有算力基础设施的建设,像建机房,采购显卡,配齐内存和硬盘。最近大家可能也注意到了,显卡和内存价格是一路上涨,很大程度就是因为 ai 需求暴增呢,把硬件价格也推高了。但这些成本呢,有个特点,它是沉没的, 在模型发布前呢,就已经支出了,随着用户越来越多,这部分费用呢,会被不断贪薄,贪到每一次调用上呢,它的占比会越来越低,甚至低到可以忽略不计。 那第二部分呢,是动态成本,也就是每一次调用模型实打实消耗掉的东西,每次计算都要消耗电力,还需要占用内存, 数据在传输过程中呢,也需要消耗网络流量。而所有这些消耗呢,都和 token 的 数量呢,直接相关。这里呢,快速同步一个概念。到底什么是 token? token 的 中文呢,可以翻译为词源,可以是一个字,一个词,一个分词,甚至一个字节。在大模型中呢,被表达为一组数字序列,用于计算下一个 token。 token 越多呢,模型的计算的时间就越长,占用的算力和资源呢,自然就越多。所以,按照 token 数量收费,本质上是一个多用多付少用呢少付的计费方式, 非常直观呢,也非常合理。这像什么呢?就像我们每个月交的水电气一样。从这个角度看呢, ai 正悄悄完成一个转变,它正从一项技术、产品呢,演变成一种基础服务。我们想要获得智力呢,就需要购买算力。 说不定以后每个月的水电账单旁边呢,就会多出一行 token 费用。那既然都是按 token 收费呢,为什么不同大模型的价格差这么多?比如你输入一百万 token, deepsea v 三的收费呢,是零点二八美元,而 g p t 模型呢,要二点五美元。如果是输出 token 呢,差距更夸张, deepsea 呢是零点四二美元, g p t 呢是十五美元,整整差了三十多倍。 同样都是 token 呢,为什么价格能差出这么多?其实 token 的 价格呢,主要是由两个因素决定的。第一,电力和人工成本不同。在美国、中国、中东等不同地区,电价运为成本,人力成本差异非常大,而这些呢,最终都会反映到价格里。第二呢,算法不同。 好的算法呢,就像一台省油的发动机,同样是跑一百公里啊,有的车呢,只需要三升油,而有的车呢,却要烧掉十升。大模型也是一样,算法呢,设计的越巧妙呢,达到同样质量的输出,消耗,算力呢就越少。所以优化算法是模型研发人员最最重要的任务之一。 算法越高效,成本就越低,价格自然就更有优势。在这方面呢,有很多创新的工作,比如 deepstack 引入的 mo 机制,想了解的朋友可以翻看我之前的这期视频。 那为什么输出托管的价格比输入托管贵这么多?原因呢?很简单,输入和输出呢,干的活不一样。输入的托管呢,是你的提示词, 模型可以一次性全部读取参与计算,多一个少一个呢,对显卡的负担影响呢,是有限的。但输出 token 就 不一样了,它是一个接一个逐自生成的,每生成一个 token 呢,模型都要重新算一次。输的 token 是 配角,输出的 token 呢是主角,所以给出的片酬呢,就不一样。 具体的技术原理呢,也可以看我这期视频,理解注意力机制对托根计算量的影响。这里呢,再顺便澄清一个常见的误解,托根的发明初衷呢,不是为了计费。 托根是纯粹的算法创新和工程发明,是为了把人类的语言翻译成机械能听懂的数学坐标。 只是后来大家发现呢,托管的数量呢,恰好决定了计算量,这才顺理成章的用它来计费,绝不是因为要收钱才搞出来这么个复杂的概念。当这里可以像自来水一样按量计费,一个属于算力文明的时代就真正开始了。

家人们,这个 a p p 中转太牛逼了,看我今天消耗了八千万,但是实际上只花了五块钱不到,就直接到达官方的一折。然后包括看它的 card code, 它可以演一个 key, 使用任何模型。比如说我现在切完模型可以选择 oppo s sony color default, 包括 gpt 啊 gmail 我 都可以使用。我靠,这个真的是方便,而且非常稳定,三月的时候 cloud 官方都吃湿了,结果这家店完全没有任何情况。牛逼。

以后每一家除了要交网费、水电气费这些以外,还要交一笔 toc 订阅费,这是百分之百要发生的事。嫁妆可能以后就不叫五金一钻一果了,黄仁勋的英伟达显卡以后也会变成新婚家庭的硬通货, 那么嫁妆就会变成五金一钻一果一卡了。为什么这么说呢?首先今天也看到了一个不知道真假的消息,今年企鹅鹅厂给员工发放了二十二万元的 toc 套餐, 具体套餐有什么,我放一张图片大家看看。然后是在 gtc 年会上,皮衣哥黄仁勋说,以后 公司不止给员工要发放工资,还要留出一笔预算给每个员工配备 top。 员工在入职的时候也会考虑这家公司会不会提供 top, 如果这个公司不给员工 top, 那 是不是员工自己需要花钱去买这些 top 才能利用模型工作呢? 还有的例子就是最近人人都在尝试装的那个 openclo 龙虾插件,这个插件全天运行下来也需要不少 token 呢。另外现在很多个人开发者也需要包括 coloco 的 这种模型的 token 额度, 所以现在整个互联网和工作流有关,和代码有关的所有事情都需要 tok。 然后讲到最开始的话题,为什么说以后 tok 会变成居家旅行的基本生活物资, 就像是大家用的水电气、米面油这些东西一样。你甚至以后可以看到小区里面的大爷大妈都会在讨论最近桃坑涨价了,用不起了这些话题。这是因为在最近二零二六年 a w e 上海家电展上,已经有很多家务机器人展出了 这些机器人,虽然他不是人形机器人,他没办法跳舞翻跟头,但是他们这些机器人的专业性非常强,比如说把脏衣服放进洗衣机里,收拾地上的玩具, 收拾厨房的卫生,这些工作基本上差不多都能做了,只是速度有点慢,等后面这些产品等待它功能完善之后,肯定会在每家每户出现的。这些机器人在我理解肯定是 toon 在 驱动他们工作,因为比方说一个机器人他在切菜,他肯定要识别这个菜的图像, 那么一张图像大概折合下来是多少, toon 就 会把这个 toon 送给后台的算力卡,算力生成结果, 结果的这些 token 再去发送给机械币,完成抓取操作,这些功能也就是这张图片上呈现。当你提供电力和显卡算力卡之后, 你所拥有的算力会得到 token, 这个 token 可以 驱动各个大模型去运行,处理一些软件层面的操作。 那么以后滔肯将会驱动机器人去做比方说做家务,做饭,照顾孩子,照顾病人这些现在看起来比较麻烦的家务。所以你就会想象到一个场景,在你工作一天之后,你回到家,带着你今天挣到了算力, 充值到机器人的身上,机器人会帮你把所有的家务料理的非常周到,你回到家之后只需要去学习或者是娱乐。当然了,以后大家如何去赚这些滔肯我也说不上来,因为现在 ai 去替代人的这个趋势 实在是阻挡不住,可能程序员再一次迟到了时代红利,程序员、工程师这些职业有可能在工作期间使用的 tucker, 没有使用完的情况下,把它带回来 再充值给自己的家庭机器人,这也不是没可能的。所以说驱动这些机器运行的算力 tucker 从哪来呢?无非是两种模式,一种模式就是你直接买到算力卡,在你家专门会有一块地方放大量的算力卡, 恨不得有一墙的显卡,然后这些各种各样的家务机器人通过 wifi 和这些显卡连接显卡计算得到 toon, 再去指挥这些机器人干活,这样这些机器人才能处理复杂的场景, 而不是去完成一些机定化、程序化的简单操作。第二种模式就是订阅厂家的 toon, 厂家或者给你推出一个包月的套餐,或者是按照流量去计费,这种方式呢,不用你去买显卡这些硬件, 但是你每个月如果想使用这些高级的家务功能,肯定你要付钱买 tock。 可能以后大家就要算一笔账, 如果你在家囤了很多算力卡,通过这些算力卡驱动机器人干活比较划算,还是说订阅厂家的 tock, 你 的家务不是很多的情况下,可能订阅 tock 这种方式更省钱一些。最后总结,电器工业革命时代之后,每家每户都要使用电力, 互联网革命之后,每家每户都需要装宽带了,这次 ai 技术革命之后,每个月都要有预算去购买 tucker 时代的洪流马上就来了,你准备好了吗?

上条视频火了,我来给你们拆解一下当下最赚钱的托克生意。小龙虾出来以后,国内赚钱最多的就是他们那些搞中转站的。那国外的大模型可乐来说,二十美金,每百万托克,他们卖五美金,纯赚四美金。我的天,要是黑心一点,再参点假,那利润 最关键的是全国的流量就涌进他们百来家中转站,你们想想有多离谱。而且这个技术都不算难的,网上成熟的中转站原码一大堆,老手都不用自己写代码上去扒,一个原码下来 v i p 一 遍,当天就能开业。而且 你们以为他们是从官方拿的话,其实直接有免费的开源逆向工具什么意思?就是你只需要有大量的订阅账号,你就能把这些账号转化为 a p i。 拿可乐来说,官方定价二十美金,每百万 ko, 可以 通过这个方式打到一块钱,卖出来的全都是利润。 工具我已经放在上面了,你们感兴趣的自己可以去研究,反正这个生意刚起步,可以先研究一下。这以后国内大魔星起来以后,托肯出海卖给国外,不是又便宜又好用啊?

各位老板们,这几天我有一个顿悟, ai 时代,你要用尽你所有的智慧,所有的认知,干成一件事,让你的公司从过去的烧钱到现在的烧 token。 你 想想你公司所有花钱的事,在 ai 时代都可以变成让 ai 来干, ai 只需要烧 token, 而现在的 token 跟钱之间的汇率啊,基本是一百比一,就是你烧一块钱的 token, 能实现你原来一百块钱请人干的事,无论是投流、获客、履约、客服推广,所有的岗位,所有的工作,所有的业务,哪些你能用 ai, 能用烧 token 的 方式去解决, 你一定要用烧透根方式来解决,因为那是一百比一的成本的大幅度的下降,而且现在你在上海,在北京,在杭州这些 ai 之城,你烧的透根也有人帮你报销,所以你想想你公司今年的收入,整体不变,成本变成一百分之一,甚至是零 那种状态,你的公司在这个行业就不是一个维度的竞争,那是神一样的存在,但是这个窗口期只有一到三个月,谁能快速的在你的行业跑出来, 谁就有可能成为 ai 时代的第一家真正跑在 ai 系统的公司,猛劲烧头啃。

大家好,我是你们的科普达人,今天咱们来聊聊个人开发者怎么低成本入门 tocan 生产。很多朋友可能觉得 ai 模型部署门槛高,成本贵,其实只要配置得当,咱们普通人也能玩转。先说说硬件怎么选, 如果预算在一万五以内,想先试试水,那 rtx 四零九零 d 或者四零九零显卡是首选。二十四 gb 或十三 b 的 模型,搭配 i 五或 r 五的 cpu、 三十二 gb 内存, e t b 的 nvme 固态硬盘,再加上一千瓦的电源和一套散热好的机箱,总价大概一万一到一万六就能稳定运行。模型 托肯吞吐量能到每秒两百到五百个,日常测试和小流量使用完全够了。要是预算能到两到四万,想搞小批量生产,那就可以考虑上双卡四零九零 b, 或者直接上 a 一 零零,内存加到六十四 gb, 这样吞吐量能到每秒八百到两千个,接下小 b 客户的需求也没问题。硬件搞定了,软件和模型怎么选呢?模型方面,七 b 规模的 q 文二七 b instruct 或者 lama 三七 b 就 很适合入门,显存占用小,延迟低, 聊天、写文案、生成代码都在行。十三 b 的 模型像 q d r 杠一三 b instruct, 复杂推理和行业知识库的应用效果更好。这里有个小技巧,优先用 i n t 四量画板,显存占用能降百分之七十五, 速度还能提升两到三倍,效果几乎没损失,性价比超高。推理框架推荐 v l l m 开源免费,吞吐量比原声 pie torch 高十倍以上,个人开发者首选。部署工具方面, fast api 或 flask 用来封装 api 接口, prometheus 和 grafana 监控性能, e l k stack 记录日记这些都是免费又好用的工具。大家最关心的成本问题来了,按三年折旧算,入门级硬件每月折旧大概四百一十七元。电费方面,单卡四零九零币,满载运行 每月电费差不多一百九十四元,总成本约六百一十一元。按每天产出两千五百九十二万 token 算,单位 token 成本约零点零零零零二三六元,也就是二点三六分。每千 token 对 比 openai 的 gpt 三点五 turbo, 成本只有它的四分之一,价格优势很明显,想快速上手, 一天内就能跑通,先装 uber 二二点零四 lts 系统,然后安装 cuda 十二点一 cuda n, 再装 python 三点一零和 vl l m。 接着用命令启动模型服务, 最后用 qiro 测试一下生成 token, 看看返回结果里的 usage 词段,统计 token 数就搞定了。最后给大家几个进阶优化建议,用 v l l m 的 批量请求功能提升吞吐量,尝试模型蒸馏,降低显存占用和延,使用 radis 做请求队列应对高流量 在整个数据库记录用户 token 消耗,实现自动计费。这样一套下来,你的 token 生产系统就既高效又经济了。怎么样,是不是觉得个人搞 token 生产没那么难?你最想先用这个系统来生成什么内容呢?评论区告诉我吧!

用户问 ai 大 模型一句,今天天气怎么样,他马上告诉你答案,我们觉得这很自然,就像朋友聊天一样。但你有没有想过, ai 是 怎么听懂这句话的? 其实在我们看不见的背后, ai 首先把这句话拆分成了一个一个他能理解的小碎片,每个小碎片对应了一个数字, ai 就是 通过这些数字来理解语义的,而这些小碎片就是我们最近经常能听到的一个词。 token, 也叫词源。大模型处理信息为什么必须要用 token? 直接用人类语言不行吗? 腾讯研究院教授级工程师王鹏解释说,计算机呢,只认识数字,听不懂人类语言,但如果每一句话都翻译成一组数字,人类的语言有无穷多种组合,这个存储量就太大了,根本不现实。 所以大模型的做法是先把自然语言拆成了一个一个最小的语义单位就是 token, 然后让计算机去理解和计算这些 token, 从而感知整句话的意思,也同样做出回答。大模型技术帮助计算机能把我们的日常的语言 拆成一个一个的机器能理解的最小的语义单元。 ai, 它其实有点像查字典,它要去它的库里去查一个一个的语, 一单元的意思到底是什么?这个与单元彼此之间是可以去计算的,比如说国王加女性就是女王,国王加配偶就是王后,就这样的方式,计算机它又能理解,它又能计算。因为每家模型都有自己的分词法, 怎么拆怎么算,规则都不一样,所以托肯又有点像各家模型自造的方言,互相之间没法通用,模型有自己的分词法,还有自己的向量的算法, 自己有一套自己输出的理解方式,彼此之间是不能互通的。但是同一个模型内部,它是用同一套方法。我们每一次与大模型的对话背后都在消耗着成千上万个 token, 有 消耗就有成本,有成本也会有价格。 目前国内 token 的 定价是在怎样的水平?又会基于哪些成本定价呢?王鹏说, token 的 生产,它其实也是一个工业化的一个流程,它最大的一头就是赚利,成本 很贵的,这样的这个 gpu 显卡,它肯定有它的折旧费,其实第二笔钱就是电费,它非常的费电,所以说这两样加一块其实就已经是 token 成本的大头了。定价现在大概是可能百万级的,这个 token 应该是几毛钱几块钱,这样的价格, 一百万个 token 相当于什么呢?可能就是你一本红楼梦加一本西游记,差不多就是这样一个概念。说到这儿,很多人可能会问,我天天在用大模型加一本西游记,差不多就是这样一个概念。说到这儿,很多人可能会问,我天天在用大模型,我没有付。 其实大家平时问个问题,聊两句天,或者简单让模型给写个文本,消耗的 token 非常少,少到厂家愿意免费请你用。不过对于一些重度 ai 用户来说, token 的 费用已经实实在在地出现在了账单里。 为什么这类智能体这么烧钱?王鹏解释说,因为以前我们用 ai 聊天,现在是用 ai 干活,这完全是两个量级,因为我们以前 说话聊天这件事是很省 token 的, 国内的厂商的策略就是先免费,但是现在的问题为什么大家开始重视起来?因为现在有了智能体这个东西,它除了 说聊天说话以外,开始干活了,包括我最近在写一本书,这本书的书稿可能要几十万字,它为了写着几十万字,可能要读我之前上百万字的我的论文,我的一些其他的作品,让它整理分几百美金。 包括我日常,比如说我做一个 ppt, 它其实又要看图,甚至还要背后还要看视频,帮我去这个排版做了一个下来。目前来看,其实成本还是很高的,可能几十块钱的人民币。 数据显示,到今年三月,我国的日军 token 的 调运量已经超过了一百四十万亿,相当于一千万亿个中文词汇,也相当于二百五十个中国国家图书馆的资源量。 随着钓用量的大幅增长, token 的 价格会不会出现变化?王鹏认为,长远来看, token 的 价格一定会是越来越便宜的。不过近期行业也出现了小幅的涨价, 近期其实有一个趋势,大家都在涨价,倒不是说它一定要赚这个钱,而是说之前定价可能跟成本太接近,甚至说有时候在赔钱,这量一大了,可能大家都无法承受了。为了可出去发展,其实近期还是要适当的去提这个价格。今年一来就是大量的 非程序员开始用这样的 agent 的 工具去提效了,那他也会逐渐习惯于大量的去消耗。但是这个钱,这个成本,其实我觉得可能未来不一定是由个人来承担,很大的概率应该是企业去承担, 因为这个东西实际上是给老板在干活,其实是在提高企业的生产效率。如果说大量的消耗,可能成本会交给企业去承担。就像我们现在大厂都是给员工去发 token, 从随口问答到深度协作, toc 早已不只是技术的最小语义单元,更成为了丈量 ai 与人类关系的新刻度。它燃烧着算力与电量,助推生产力的变化,也标志着智能时代从免费走向普惠、从尝鲜走向刚需的必经之路。 收费与否只是表象,真正值得期待的是,技术在成本与普惠之间,走出一条更可持续、更贴近普通人的未来之路。

很多人觉得做投资很难,但其实和卖保险几乎一样,我给你讲完你就懂了。卖保险的人很多也不懂保险产品,更不懂精算。但他们为什么能卖? 因为他们认识人,他们知道谁刚买房子,谁养孩子,谁开始关注,保障 他们收集需求,再推荐保险产品,成交之后他们拿佣金。而且很多卖保险的人,以前可能是老师、司机、宝妈、刚毕业的学生,他们并不是专业人士,但是他们都能做 token 渠道。其实是一样的逻辑,你不需要懂 ai 技术,你也不需要做产品,你只需要认识人,收集需求。比如你有个朋友做电商,他说每天写文案太累, 你去找一个已经做好的 ai 写作工具,拿到分销资格,推荐给他,客户用了,背后就在消耗 token, 而你拿销售佣金。为什么这个模式成立?因为现在很多 ar 公司有产品,没有销售渠道,就像保险公司,有产品,但需要代理人,普通人就是那个代理人。 其实 ar 行业正在复制当年保险、房产、云计算的发展路径,技术公司做产品,渠道负责 渠道负责卖,而 token 就是 ar 时代的消耗品。所以普通人做 token 最合适的角色不是技术人员,而是 ar 产品代理。 就像卖保险一样,你卖的是产品,背后是服务,在背后是 talkin。 问,第一个 talkin 客户从哪里来?你身边第一个有需求的人开始。 如果你认识做生意的人、开店的人、做销售的人,其实你已经具备做做 租 talk 渠道的条件呢?如果你身边已经有人需要写文案、做客服,做短视频评论区,打个代理,看看有多少人已经具备租 talk 渠道的条件。关注我,一起探索 ar。

装龙虾容易,养龙虾难呀,市场装机部署也就两百到五百块钱不等,但是你养龙虾那真的是没个底啊,我用了两天,大概消耗了头壳,花了我两千多美金,而且还是一些基本上简单的操作,就根本还没有什么训练,一些复杂的操作就有一种什么感觉呢?有一种花了两万块买了台劳斯莱斯,很好,但是加油呢,一定要花两千万的感觉。 就所以很多人说 ai 时代普通人用不起啊,这头壳这么贵,这是富人的游戏啊。但是我非常明确的可以肯定的告诉你一句话啊,未来 ai 最不值钱的东西很有可能就是头壳,而且会便宜到什么程度呢?便宜到你今天都想象不到,就为什么我敢这么做啊?呃,因为历史已经发生过一模一样的事情了,很多年轻人可能不知道 十亿年前手机流量有多么的贵啊。我记得当年最早用诺基亚手机的时候,三十块钱只能买五兆的流量,五 mb, 你 没有听错,五兆啊,按现在的情况,发一张照片就没了,打开流量数据你放大不动就没了,那现在呢?你看 三十块钱最少是几 gb 对 吧?有的套餐几十 gb, 甚至还有无限流量卡。所以为什么?因为技术一旦进入了规模化阶段,成本就会断崖式下降。 ai 现在正在处在什么阶段?就像当年的移动互联网早期一样,服务器贵,算力贵,模型训练贵,所以通常看起来很贵。但是只要下面三件事情发生啊,价格一定会暴跌,第一个就是算力规模爆炸,第二就是模型销售提升,第三个就是市场竞争加锯,如果再有一个,很可能就是核聚变突破啊,能源价格廉价低廉, 所以我们现在看到的是 openai 啊, google 啊, ipad 啊,还有一大堆公司在拼命的卷,他们在卷什么呢?不是卷价,是在卷效率,谁能用更少的算力跑出更强的模型,谁就能够把价格打下来。所以未来会发生什么事啊? ai 调用成本就会像水电网络一样,几乎接近免费,真正值钱的不是投资,而是会让你用 ai 解决问题的能力。 很多人今天纠结啊, ai 这么贵,我先等一等,但是我告诉你啊,真正的聪明人在干什么?他们在趁现在学习,因为技术成熟以后,会用 ai 的 人和不会用 ai 的 人差距会越来越大。所以不要问 ai 贵不贵啊,问问你自己,当 ai 变得像空气一样便宜的时候,你会不会用?

其实现在还是有一些确定性的,甚至称得上是风口的机会,并且是今年两会被明确提出来,在未来注定会爆发的长周期赛道,这点事就是 token 出海。要知道 token 的 背后是算力,而算力的背后是电力。咱们国家不仅有便宜的绿色电力, 更有成熟的算力基群。在新疆,一度绿电只要两毛钱,通过算力可以转化成五百万个 token。 这五百万个 token 在 国内可以卖到十块钱五十倍的利润, 在美国可以卖到四百块钱八百倍的利润。不管你是做外贸的还是做跨境的,我就问你,你卖什么产品能有这么高的利润?而且这个市场在未来很长一段时间内都将处于严重的供不应求的阶段。现在国外有海量的 ai 开发者和中小公司,需要用大模型干活,但美国本土的头壳 实在太贵,所以只要你能把蒜粒分装出海,就会有人买。类似八十年代的中国内寿,生产量跟不上,只要你能从沿海往内地拉回一批货,不管质量好坏,不 管价格高低,立马就能卖掉。因为 token 正在从技术、服务转变为类似原油、贵金属一样的数字大众商品。但归根结底,这还是属于大佬们的资本游戏,虽然简单粗暴,但普通人确实没办法参与。不过我们可以绕个弯子,如果 token 是 原油的话, 那我们是不是可以把原油加工成汽油卖出去呢?就像有的人是在菜市场卖猪肉,那我们是否可以开个饭店,把猪肉买回来加工成红烧肉呢?我相信话说到这里,一定有人知道该怎么做了,评论区说说你的看法。