家人们想做个透坑工厂,今天把成本估算一下,听完你就会明白。先讲迷你入门版,当张五零九零显卡就能起,部门卡几乎为零, 每分钟能产二十万左右,透坑全套弄下来,三万左右就能搞定,但不建议这么做。再看小型量产工厂,想冲到每分钟一千万透坑有两种配置, 要么六十四台五零九零整机集全,要么八台 b 三百。顺利服务器整套投建下来三千五百万到五千万左右。 接下来是中型规模工厂,保底每分钟五千万 t 肯标配六十四台 h, 两百或者三十二台 b 三百服务器矩阵 启动资金两到三个小目标。在网上,大型工厂每分钟要破亿投,肯得买一百二十八台 h, 两百或者六十四台 b 三百,投建会用四到五个小目标。还有巨型算力集权,每分钟产能 十个亿头,肯要上千台 h, 两百或者五百多台 b 三百,总投入三十五到四十个小目标。就算不重资产买设备,选包月租赁也不便宜,单台 h 两百,每月八到十一万租金 b 三百更狠,十三万到十九万一台每月。跟大家说句大实话,顺利规模越大,头肯溢价越高, 运营成本还能无限摊薄,还能稳定对接大厂长期订单。但工厂越小越长,设备稳定性差,成本高,销路还特别不稳定,根本没法 长期做。看到这,你对 tucker 工厂的投资应该有所明白。评论区聊聊你的看法。
粉丝642获赞1791

家人们想做个透坑工厂,今天把成本估算一下,听完你就会明白。先讲迷你入门版,当张五零九零显卡就能起,部门卡几乎为零, 每分钟能产二十万左右透坑全套弄下来,三万左右就能搞定,但不建议这么做。再看小型量产工厂,想冲到每分钟一千万透坑有两种配置, 要么六十四台五零九零整机集全,要么八台 b 三百。顺利服务器整套投建下来三千五百万到五千万左右。 接下来是中型规模工厂,保底每分钟五千万,偷啃标配六十四台 h 两百或者三十二台 b 三百服务器矩阵 启动,资金两到三个小目标。在网上,大型工厂每分钟要破亿投,肯得买一百二十八台 h, 两百或者六十四台 b 三百,投建会用四到五个小目标。还有巨型算力集权,每分钟产能 十个亿头,肯要上千台 h 两百或者五百多台 b 三百,总投入三十五到四十个小目标。就算不重资产买设备,选包月租赁也不便宜,单台 h 两百,每月八到十一万租金 b 三百更狠,十三万到十九万一台每月。跟大家说句大实话,顺利规模越大,头肯溢价越高, 运营成本还能无限摊薄,还能稳定对接大厂长期订单。但工厂越小越长,设备稳定性差,成本高,销路还特别不稳定,根本没法 长期做。看到这,你对 tucker 工厂的投资应该有所明白。评论区聊聊你的看法。

最近我收到最多的后台私信就是 token。 既然是个新的大众商品,那普通人能不能自己生产 token 自己卖?今天一条视频给你讲清楚。先说结论,能生产,但你算完账,你就不会干了。我们来算一笔账, deepstack 目前最火的大模型,它卖 token 的 价格是多少?输出,每百万个 token 三块钱。 一百万个 token 是 什么概念?大约相当于五十到七十万个中文字,一本书大概十万字,也就是说, ai 帮你能写将近七本书的内容,只收你三块钱。反过来说,你自己要生产这一百万 token, 至少得花几十万买个 gpu, 装一台服务器, 二十四小时不断电。就这样,你的一台机器大概需要十几个小时才能生产出这一百万个 token。 而且这个你还没有算你的工程师维护机房电费和宽带费。 deepsea 为什么能卖三块钱?因为它拥有几万张 gpu, 同时跑,一天处理上千亿个头梗,成本被摊到几乎为零。这就好比你自己在家养了一头牛,挤了奶想拿出去卖,一瓶卖五块, 你觉得能赚,但是你一算,买牛花了两万,饲料每月两千,一天只能挤几斤奶,隔壁蒙牛一天出几千吨,一瓶卖三块钱还能赚?你的奶不比它的差,但是你的成本是它的一百倍还要多。 这就是普通人生产 token 面临的问题,不是做不了,是做了一定亏。所谓普通人在 token 这门生意里的正确姿势,不是自己生产 token, 而是用便宜的 token 去创造贵的服务。 举个例子,你用 deepstack 花三块钱买一百万个 token, 让 ai 帮你写十篇小红书文案,通过小红书的文案带货去赚钱,那么你的成本就是三块钱。 你赚的不是 token 的 差价,是你知道怎么用 token, 而别人不知道的信息差。再举个例子,你用 ai 帮一个小型企业搭建一套 ai agent 的 token, 成本可能不到十块钱,但你收企业五千块钱的咨询费, 企业买的不是你那十块钱的 token, 而是你的判断力和方案。不要去跟巨头抢着生产 token, 要去想怎么用三块钱的 token 创造三千块钱的价值。生产 token 的 钱留给巨头去赚,用 token 去做赚钱的生意,才是留给普通人的机会。我是文思,关注我每天带你看懂 ai。

mac mini 能否做 token 工厂?答案是肯定的,可以,但请看到视频的结束,你需要知道一件事情,你的 token 工厂的 token 是 需要能购买的,目前能够实现商业闭环,大家去争相购买的 token 指的是 cds, gm 五点零, timi 二点五, deep seek, r e v 三点一, v 三点二这些满血版的大户型的 token。 而普通的 mac mini 只能安装拉玛 deep seek 千万的八 b 左右的模型,经过各种优化,顶多是七十 b 的 模型,这些模型的收费是很低甚至免费的,而同价格的 mac mini 产出的效率也远低于五零九零算力卡和国产算力卡。用 mac mini 做 token 工厂就有点像你开一个货运公司, 但是去买几百台装修非常漂亮的两轮电动车,放弃使用五零九零这辆轻型货车,更放弃供不应求的 b 三百这种重型卡车。大部分粉丝问我和期待 mate mini 能做 token 工厂的原因都是因为它便宜买得起,但是市场不需要啊,电动车谁家都有,为什么要租你的呢?听明白了吗?

做 token 工厂的投件,到底该用训练级别的 b 三百还是推理级别的五零九零呢?一条视频讲清楚啊, 首先 token 工厂的盈利呢,就是靠部署模型来产 token, 最后实现商业闭环,那 token 又是大模型问答交互的基础单位, 像目前 gbt 啊, dbc 一 些主流的模型已经能优化到一个汉字,大概是零点六个 token, 这里面的设备条件起到了关键的因素。 那第一梯队啊,一定是旗舰商用型的 b 三百服务器,虽然整机的成本超过了六百万,但是它有两点零二 t 的 超大显存,单机就能全量部署当下所有的主流大模型。像这个 g p t 的 五点五啊, d o c 个 v 四啊, g l m 的 五点一啊, kimi 的 二点六啊,都是全能适配的。 b 三百主打量产级商业运营,满产率高。 然后第二梯队的话呢,就是终端推理,你去选择五零九零,总价不到五十万,听着便宜,但是险存受限,没有 emilyk 的 高速互联能力,本质它其实就是消费级别的游戏推理卡,只能去跑轻量级的小模型。 然后适合边缘的智能体基础的教学场景。现实的痛点是什么呢?是 b 三百的服务器一机难求,但是五零九零在市场的 呃,库存量还是很足的。 pos 生意的前置条件,首先是比拼这个硬件的承载力,选对核心的算力卡才是最稳最靠谱的一个终极布局。最后呢,给所有行业者一个定论啊,就很多人说边缘算力也能产出 pos, 靠边缘节点来赚钱, 这个其实叫混淆视听。 token 赛道拼的就是高端集群强承载力,还有稳定的供货能力,踏踏实实的选对核心的算力卡才是唯一这个稳健的长期布局。

b 三百和五零九零可以部署 deepsea v 四吗?如果可以, token 的 产值又是多少?首先, deepsea v 四分为 pro 版和 fresh 轻量版, pro 版在激进的 f p 八压缩策略下,也需要一点六 t 的 现存,所以至少需要 b 两百, h 一 百和 h 两百都不行,除非是 ins 四级别的量化 是支持 h 两百的。而 deepsea fresh 版本 f p 八需要现存三百 g, note 四需要显存一百六十 g, 可以 分别勉强部署在 pro 六千和五零九零八卡机上面。但是由于没有卡肩的 n v link 互联, pro 六千和五零九零都会很慢, fresh 版本也兼以步数在 a 一 百上面。其次,产量。我引用英伟达的测评结果, deepsea v 四在 b 三百的并发 token, 如下图所示。我这里对这个图做一个解释,就是当牺牲用户的 token 速度的时候, b 三百的单卡,它的 token 产量是比较高的,达到三千五百 tokins 每秒。当需要并发 token 树立较高,用户体验较好的时候,单卡的产值就会跌到五百 token 每秒。我会倾向选择十五 token 每秒的单用户和两千五百 tokens 每秒的单卡输出。那么八卡整机的月 token 产量差不多是五万一千八百四十个单位, 每个单位是指一百万透坑,按照 open loop 的 价格,差不多是一点八五美元每单位。这样算下来, b 三百八卡整机满载的月产值将是九万六千一百四十五美元。当实际满载率和主网后的降速情况,我们将在后续聆听科技的课程和沙龙中公布。 总结一下, deepstack 微视由于参数量巨大,再一次引领了算力硬件的更新换代,训练服务器和推理服务器将共同指向高 h p m 的 算力卡系列。而今天我看到的网上流传 b 三百单机能产生五万亿 token 是 比较离谱的。

买一台五零九零或者 b 三百生产 token 去卖可不可以?答案是可以,但我不建议。四个理由,一、成本平摊。你一台服务器卖 token, 你 需要部署硬件租网,软件系统,运维系统,配备软件工程师、硬件工程师和运营工程师,还有销售, 你一百台也是配备这些,一台的话,你的团队平摊成本太高了,集群越大平摊越低。二、销售控制。 如果是一台服务器生产的 token, 目前除了我们平台会接纳你的 token, 很 难找到第二家,你可能面临很多空置。而如果你是一个三十二台 b 三百以上的基群,你可以卖给很多很多家,控制率低。三、模型受限,五零九零,你只能部署轻量级的模型,欢迎的满血版 deepsea, gm 五点零, timi 二点五都没办法部署。你的客户很窄,客户愿意支付的价格也不高。四、企业推广受限,企业客户都会考量你的电网偷啃并发的稳定性,一台服务器是难以支撑企业客户需求的。 总结一下,迷你的偷啃工厂可以建,但我不建议又组合到一起,有规模效应,偷啃工厂才更能发挥价值,而且价值会比你了解的算力注定要高很多,明白了吗?

大家好,今天我们用三分钟讲透 ai 产业底层商业逻辑。黄仁勋提出的 token 工厂经济学,首先明确核心概念。这里的 token 中文意思叫磁源,和虚拟货币、区块链没有任何关系,它是 ai 大 模型处理信息的最小数据单元,是 ai 时代的标准化产品。 黄仁勋这套理论的核心,就是把 ai 算力变成了一套标准化、可量化、可盈利的制造业体系,它彻底重构了数据中心的价值。 传统数据中心是存文件的仓库,而 ai 时代的数据中心就是一座二十四小时不间断生产 token 的 智能工厂。这座工厂的完整逻辑非常清晰, 电力是生产原料, ai 芯片与算力集群是生产核心的硬件底座, ai 服务器、高速光互联、液冷散热、高端 pcb 是 核心生产设备,最终产出的产品就是 ai token。 而整个工厂的核心 kpi 也是核心盈利密码就是 token w, 也就是每瓦电力能产出的 token 数量。核心目标就是在固定电力上限下最大化 token 产出,最小化单位 token 成本。为什么这个指标是行业黄金标准?因为黄仁勋点破了 ai 产业的物理铁律, 是 token 工厂不可突破的天花板。一个数据中心的供电总量是锁死的,单纯堆显卡、堆积柜没有长期意义。未来 ai 算率的竞争,本质就是效率的竞争。同等电力下, token w 越高,生产效率越高,单位成本越低,盈利能力就越强。这套经济学彻底改写了算力行业的游戏规则, 全产业链的价值平台都围绕能不能提升 token w 展开,而算力租赁就是 token 工厂产能的商业化分销出口。在这套思维下,行业竞争的核心早已不是单一芯片的比拼, 而是算力集群整体系统能力的提升。在这一赛道中国具备全球领先的核心竞争优势。首先是无可替代的电力成本优势。 剔除西部丰富的绿电资源与东数西算工程的全国算力网络布局,我们拥有全球极具竞争力的低电价,直接击穿 tiktok 工厂的核心成本线,从根源上拉高磁源瓦的核心效率。其次是全链条自主可控的配套优势,我们拥有光互联、 pcb、 叶冷等 tiktok 工厂全环节的全球核心产能, 供应链稳定性与成本优势独步全球。更关键的是全球顶尖的系统级优化能力,以华为 atlus 九百五十算力集群为典型代表,通过算力调度、网络协调、能效管理的全占优化,实现了万卡集群百分之九十以上的限行加速比, 把算力损耗降到最低,直接将磁源瓦效率拉至全球第一梯队。这些从能源底座、硬件配套到系统优化的全闭环优势,让中国在全球 toc 工厂的竞争中掌握了核心的效率话语权。 也正是基于这套核心逻辑,我们准备了三期系列节目,带大家完整梳理 tiktok 工厂的全产业链机会。第一期聚焦 tiktok 工厂的传输神经网络光互联赛道。第二期拆解工厂的硬件载体 与散热心脏, pcb 与夜冷赛道。第三期落到产能变现中局算力租赁赛道筛选同步高成长标地。感谢收听我们系列节目,再见!

三十一 b 级大模型,原本要接近五九 g 显存,现在十八点五 g 就 能塞进单张五千零九十,还快了二点五倍。这个 jam 四 turbo 直接把本地部署门槛砍下来了, 它不是又一个量化包,而是把原版五十八点九 dip、 英伟达量化版三十一 dip 继续压到十八点五 dip。 对 五十系新卡来说,这才像真能日常用的三十一 b, 而且不是拿速度换体积,基准里预填充标到一万五千多,单路生成五十一,批量吞吐一千二百四十四,质量只掉一到三个点,这个交换比非常能打, 他把视频和音频部分包掉,只保留文本能力,再专门吃满英伟达 f p 四张量核心。所以五千零九十 pro 六千这类卡,终于能把三十一币当工具用, 热度也不是自嗨模型社区这版已经冲到五万,下载作者发布贴五天拿到上千,互动技术论坛里单张五千零九十,跑马二五六 k 的 帖子也有两百多票和上百条评论。 但别高兴太早,这套 turbo 基本是给五十系新卡定制的,四千零九十这类老卡吃不到完整加速,可如果你手上正好是五千零九十,这可能就是现在最值得试的本地三十一币方案。追星不盲从,实测出真知。

现在这个托肯工厂的生意非常火,那么去生产托肯需要什么东西呢?其实就是像这种 gpu 算力,现在很多机房都开始建设了,很多用的型号呢,像这种 a 一 百, 然后这种是 h 一 百, h 两百,目前比较火的就是 h 两百这个型号,像这里演示的是一个八卡的 h 两百模组啊,由八张卡组成,单张卡的显存是一百四十一 g, 八张卡呢就是一千一百二十八 g, 三张卡加在一起呢, f p 八的算率是三十二 p, 这什么意思呢?就是它在一秒钟的时间内能执行三点二亿亿次普点预算,那这么大的算利用来生产 token 能生产多少呢?那经过我们的测试啊,跑这种大模型,比如说像 deep secret 六百七十 e b 的 模型呢,每秒钟能够生产五千个 token, 也就是说我们写一本几百万字的书,可能几分钟就会写完了,而且它在极端的情况下,能够同时承担几千甚至上万个用户的同时请求。

tokyo 工厂里的 tokyo 到底是怎么生产出来的?它能不能像电能一样储存在电池里?还是和手机流量一样无法储存,随用随消耗?答案其实是后者。 tokyo 并不是实体的资源,没法储存,只在你 问 ai 做答的过程中,实时核算实时的消耗。当你像 deepsea 这类大模型发送问题, ai 进行思考并生成回复时,背后的高性能 ai 服务器会高速运转,持续耗电完成整套运算。逻辑系统会精准统 问题回答问题里的所有文字标点,以此核算消耗成本。由于大模型原声适配英文逻辑,我们的中文提问大多会先转为英文,再变异为数字进行计费统计换算参考,以 一个中文字约消耗一点二到一点五个 token, 成本上也是有明显区别的,用户提问成本更低, ai 思考作答更贵。换算下来,提问约每百万字两元, ai 回复可达每百万字八元。核心原因是 ai 需要复杂推理运算。除此之外,日常使用豆包 deepsea 时,为了保 障回答连贯,贴合语境模型会自动带上你们过往的全部对话记录,一并运算,这也是 token 消耗飙升的关键原因。简单来说, 生产 token 只是通俗比喻,方便大家理解。 token 本质是 ai 算力的计量单位,就像手机流量的 m b g b 一 样,是消耗统计标尺。我们每消耗一次 token, 实际消耗的是 ai 芯片的损耗, 机房算力资源,场地设备的折旧,巨额的电费,还有大模型研发工程师、数据中心运维人员的技术成本。记住核心的结论, token 只是计量工具,不是可以买卖储存的实体商品。

最近偷看的概念很火,因为大模型生产偷看未来可能是一个计算标准,那么什么东西才能生产?偷看?这就是算力,像这个是 a 一 百的八卡总机, 这个是 h 两百的,以及后面的 h 一 百、 h 八百、 a 八百等等。那么这些算力到底运行什么?大模型每秒钟能跑多少?偷看,关注我,我们后面每一个都会测给大家看。

token 词源是怎么产生出来的?首先, token 其实不是一件商品,是你使用 ai 大 模型的技术单位,就像我们计算我们用电用了多少瓦,手机流量用了多少兆一样。 其次, token 的 生产过程其实是一个对话问答的过程,分为以下五步,一、当你对大国先提问,你好安排一个五一去故宫的参观攻略。二、我们会把这个提问变成数字,一共包括了十八个符号, 十八个符号需要转换成大模型能够理解的数字,也就是 token。 有 些大模型需要把汉字转换成英文,再转数字,有些就直接转换成数字,这句话转换后差不多是二十二到三十个 token。 三、 提问加上下文,你的问题通常会加上一些,我是谁,我昨天提的什么问题,我之前的要求等等,一起发给大模型,就是上下文加问题,一起发给大模型。你给大模型的问题其实很长远,不是二十二到三十个透根,可能是一千零二十二到一千零三十个透根。 四、你用的智能题,把问题通过网络发给 a、 i、 d、 c, 再发到大模型里面去。五、大模型会根据你的问题, 依靠训练好的参数对故宫和攻略进行思考,比如我现在要思考你是一个学生,暑假去故宫等等等等等等。这些思考过程和最后输出给你的全部都要算输出 token 要收费的。 这些回答通过网络再回到你的智能体。总结一下,你会发现 ai 服务器其实只是在回答问题,并且按照 token 计费, 通常输入也就是你发给大模型的问题,转换的 token 便宜,而他回答你的 token 很 贵。比如智普的 gm 五输入是十块钱,输出可能是要一百多块钱,每百万 token, 你 听明白了吗?

偷啃工厂的真实情况如何?今天说几点反常识的。一、 b 三百的算力是三十六匹,差不多等于十一台的五零九零的三十七匹, 价格上面也差不多是五百五十万对比五十万,但他们在偷啃工厂这件事情上面差别很大。 b 三百的商业闭关和财务模型非常好,而五零九零基本上只能用于传统的算力注定。 二,大家都习惯了从小到大的认知,摩尔定律告诉我们,十八个月芯片就会提升一倍,但这个定律早就失效了, 芯片的进步速度明显减缓。三,我们习惯了电子产品三到五年当垃圾卖,但是 ai 芯片和存储将刷新你的认知,因为当你抛开城建 具体去看芯片的产量增速和需求增速对比以后,就会懂我在说什么。托管工厂和 ai 算力基础设施的未来属于高认知和看得懂的人。

想知道 ai 时代的财富密码吗?它就藏在三毛钱一度电,怎么变成六十美元这个账里。这就是 tok, 中文名磁源经济的秘密。今天花两分钟把 tok 经济的四大环节给你讲透,怕找不到的先点赞收藏! token 经济分四大环节,生产、分发、结算、使用。搞懂他们,你就知道普通人怎么上车了。我们从第一层开始。第一层是生产层, token 的 不是凭空产生的,它需要三大基础设施做支撑,自算中心好比 token 的 生产厂房,提供海量算力, ai 芯片加服务器,如同 token 的 生产机器,负责快速生成数据和大模型,则是生产原料决定了 token 的 质量。 ai 芯片公司、服务器厂商、 ai dc 服务商等属于这一层。第二层呢,是分发层,生产出来的 token 如何送到用户手中, 这就需要分发层,它就像一个高速的传输网络,无论是阿里云、华为云这样的公有云大厂,还是专门的 token 分 发平台,都在确保 token 能更快、更稳定、更精准地到达企业和个人手中。 第三层是结算层, token 作为 ai 时代的新货币,必须有定价和交易规则,这就是结算层的作用,相当于 ai 时代的收银台。比如我们调用 api 按 token 收费,企业购买 ai 服务的订阅套餐,这些背后都有专门的计费系统在运作。拥有网络,蚂蚁集团就是这一层的典型代表。 第四层是应用层, token 只有被使用才有价值,这也是我们最熟悉的场景,从 ai 写作、 ai 客服,到我们常用的豆包、季梦、千问、元宝 app 以及各个领域的 ai 服务都属于应用层,是 token 价值的最终体现。 总的来说, token 经济的核心逻辑很简单, token 的 消耗量就是 ai 时代的 gdp, 用的越多,说明 ai 越普及,相关产业的前景就越广阔。当年淘宝刚出来,很多人看不懂,今天 token 经济就是当年的淘宝,普通人也能上车。想一起研究 token 经济的评论区扣六六六。

很多人以为透坑是靠挖出来的,我告诉你们,这个理解错误的离谱。在算力世界里,透坑的本质是算力资源的标准化凭证,怎么生产?它是分为三步走, 第一步,接入易购算力、公有云、私有云、边缘节点、超算中心等等,全给它接进来。第二步,封装成标准单位,一个算力透坑等于一卡十的基础算力,不管你是 a 幺零零还是国产卡,用户只认透坑,不看型号。 第三步,调度系统上线,用户发起任务,系统自动匹配最优节点,消耗对应数量的 token。 我 给你们一个直观的数据,一个算力 token 能跑一次中等规模的 ai 推理,或者生成五百张高清图,又或者做十分钟的大模型微调, 目前头部平台一天就能生产并调度几百万个 token, 背后呢,是几十万核的算力池在支撑。 所以你发现没有, token 不是 靠挖出来的,而是攒出来的。那么问题来了,你觉得这种 token 跟市面上其他 token 最大的区别在哪里?评论区留言你的看法,点关注下一条视频,我来给你们讲中国的算力 token 怎么出海。

各位小伙伴们,我们又见面了。英伟达创始人曾抛出过一段极具警示性的观点,团队工程师如果全年在 ai top 资源上的投入过低,恰恰说明创新动力不足,效率呢?停滞, 这也是科技企业最大的隐患。那绝大多数普通人呢,每天都在使用各类 ai 的 一个工具,却完全不了解 top 的 核心价值。 通俗来讲呢, token 就是 人工智能领域的通用的流量与消耗单位。相对于移动互联网时代的流量密码,我们每一次指令的输入, ai 智能应答后台的一个逻辑运转、内容生成、创作全程都会持续消耗这样的一个 token 资源, 它是 ai 运转不可或缺的一个底层燃料。那么整个行业的爆发速度,刷新了人类科技发展的历史记录。两年前,国内每日 talk 的 消耗规模呢,仅千亿级别,短短时间内直接暴涨至一百四十万亿辆级, 千倍级的爆发式增长呢,是 ai 产业化全面落地的一个最真实的缩影。那 纵观历史的工业革命、科技改革,从来没有哪个赛道能达到如此恐怖的增长的一个节奏,那也足以印证算力与 ai 的 赛道的刚需属性。当下呢,硅谷的头部科技圈早已把 tucker 资源那个消耗呢, 与高效 ai 的 运转当成了核心竞争的指标。顶尖企业员工高频深度使用大模型完成复杂的研发、内容创作、数据处理, 个人呢?阅读 ai 使用成本呢,大幅度攀升。那放眼全球一线科技企业,规则已经彻底改写, matter 字节等头部平台直接将 ai 平台使用率、 talk 的 合理的调度能力 纳入了员工的考核体系,越来越多的企业呢,把优质 talk 的 算力资源当做薪资福利之外的第四类核心激励。 那么行业底层的逻辑呢?很简单,未来呢?核心竞争力不再是单纯的人力和时间,而是算力与 talk。 谁能掌握优质算力的一个资源,驾驭这样的一个 ai 的 工具, 谁就能熟练的掌握 ai 时代的一个生产资料。那过去几十年呢?人与人之间的差距由信息差拉开,而当下 ai 浪潮之下,认知差和算力使用权 正在重新划分竞争格局,那时代的风水岭已经出现,有人主动布局算力生态,拿捏 top 肯的一个主动权,借助 ai 放大自身价值。 也有人固守传统模式,慢慢的被智能化的浪潮给淘汰掉,那想顺势入局算力赛道,抢占 top 肯时代的红利?了解合规合作方式,欢迎留言交流!

现在这个 token 工厂的生意非常火,那么去生产 token 需要什么东西呢?其实就是像这种 gpu 算力,现在很多机房都开始建设了,很多用的型号,像这种 a 一 百, 这种是 h 一 百, h 两百,目前比较火的就是 h 两百这个型号,那么它的参数是怎么样的?像这里演示的是一个八卡的 h 两百模组,由八张卡组成,单张卡的显存是一百四十一 g, 八张卡就是一千一百二十八 g, 八张卡加在一起,那 p 八的算力是三十二 p, 这什么意思呢?就是它在一秒钟的时间内能执行三点二亿亿次浮点计算,那这么大的算力用来生产 token 能生产多少呢?那经过我们的测试,跑这种大模型,比如说像 deep secret 六百七十一 b 的 模型,每秒钟能够生产五千个 token, 也就是说我们写一本几百万字的书,可能几分钟就会写完了,而且它在极端的情况下能够同时承担几千甚至上万个用户的同时请求。然后我们有 ph 两百正在测试交付,大家看一下测试的环境。