粉丝1230获赞3852

ai 现在很火,我们是做软件开发的,已经开始使用 ai 有 两个月了,有粉丝让我们分享做一个项目用了多少头,肯换了多少钱。我就拿最近我们做的一个项目来举例,最近做了一个 内训培训的项目,我们如果没有 ai 的 话,工期预估是在两个半月到三个月, 我们投入的开发人员呢是十个人,如果按三个月来算的话,每个人按一万,十个人就是十万,三个月就是三十万,还不算 u i 测试产品等等其他这些岗位。然后我们有了 ai 以后,我们这个工期缩短到了 一个半月,那我们人工也就是减少了一半,人工支出的话,按十个人一个半月除以二就是十五万。我们用了多少头?可能就是从开始开发到现在应该用了有五六千块钱,那到结束应该是 差不多不到一万块钱,如果是这样使用,你们能接受吗?做一个三十万的项目,用了 一万块钱的掏坑费用,你们觉得怎么样?这样合算?是不是心里就平衡了,然后就能接受了?说实话是真的能够提升我们的效率。就是举个例子,我们前端 去写页面的时候, ui 出完图,我们直接对接 ai, 还原度做到了百分之九十九,其他都是微调。再有就是这个 接口的对接,只要和后端看好这个接口的数据和说呃,这个注视也是直接一把成,所以同学们,兄弟们,所以不要抗拒 ai 了。

这几天有一个非常值得关注的新信号,中国电信、中国移动、中国联通三大电信运营商相近,面向西端推出了 token 套餐,那上海移动甚至是推出了一元四十万 tokens 的 套餐,而且呢,支持一个额度一个价格任选模型。那这是什么意思呢? 过去咱们买的流量套餐,比如说多少 g 流量,多少分钟通话,但是现在呢,运营商开始试水一种新的 token 套餐。也就是说,未来我们 呃在使用 ai 大 模型的时候,可能不再是单独的去买一个模型平台充值了,而是像买手机流量一样,直接买 token 额度。那这背后反映出来的是,三大运营商正在从过去的流量经营逐步转向 token 经营。 如果 token 算力套餐化这件事情跑通了,那它很可能会催生一批新的 ai 基础设施公司,这也说明 token 经济正在加速进入下一个新的阶段。当前市场正处于一个非常关键的窗口期。从过去的算力租赁逐步上 token 工厂, toker 运营商切换,为什么焦点会开始转移呢?从商业逻辑来看,焦点有望逐步的导导到 toker 工厂以及 toker 运营商。核心原因呢,主要有三个。第一个原因呢,是商业模式升级带来的估值重供。 那过去的算力租赁本质上更像是出租 gpu 服务器,收固定的租金,那这种模式 虽然现金有稳定,但估值通常不会特别高,一般呢就是给到十几个 p e 来定价。但是 token 工厂不一样, token 工厂可 不是简单的出租机器,而是把算力模型推理优化、 api 调用能力整合起来,最后按照用量分成,那 token 工厂的毛利率可以达到百分之五十以上,并且具备更强的平台属性 以及技术含量,因此呢,它有机会享受更高的 ps 估值。那第二个原因是海外已经开始有验证了。 那海外现在呢,已经出现了几个非常典型的对标公司,比如 callif, 它呢,主要代表的是算力租赁模式, 也是通过大量的 gpu 资源为客户提供算力服务,市场已经给了他比较高的定价啊。再比如 nebules, 它呢,原本也是和算力服务相关的,但是 现在通过收购 egen ai 啊,强化推理优化能力,开始向 token 工厂方向转型。还有 together ai, 它也是 token 工厂方向的重要代表。那 openroot 更像是 token 运营商,它把很多的模型把它聚合起来,让用户可以通过统一的入口调用不同的大模型。 openroot 最新一轮的估值大概去到十三亿美元。 这说明呢,在海外市场,算力租赁、 tok 工厂、 tok 运营商这三类角色已经开始逐渐形成比较清晰的产业路径。那第三个原因呢,是国内催化剂开始密集出现。 从五月以来,国内出现了很多起重要事件,比如说最近这几天运营商推出的 tok 套餐啊,中国电信启动一百七十四亿 tok 工厂集彩, 无锡建设、华为升腾 token 工厂,建润股份,以和字节签订 token 分 成合同。那这些呢,说明 token 你 不仅仅是概念,而是从这个预期走向落地。 也就是说,市场过去关注的是谁有 gpu, 谁能够出租算力,但是接下来市场会更加关注,谁能够把算力变成 token 服务,谁能够把 token 服务卖出去,谁能够形成平台化的入口? 接下来我们看海内外的对标。那第一类是 i d c 公司,海外的代表企业有 equineous, digital wallet 啊,还有万国数据。这这类公司的核心特征是大规模数据中心运营,长期稳定租金收入,那 重资产属性非常明显。国内的对标企业包括润泽科技,万国数据,四季互联啊,数据港,官邸,新网,还有大卫科技。那这些公司呢,更偏向传统的 idc 以及数据中心运营。主要逻辑是数据中心资源啊,机房机柜, 电力和网络基础设施。那第二类呢?是第二类呢,是算力租赁公司。海外代表企业包括 call with nebules, 还有 apply digital。 算力租赁,这一类公司的核心特征是裸 gpu 租赁,通常呢要签三到五年的合同,这种资产属性非常强。 呃,行业格局非常集中。那国内对标企业包括协创数据,红景科技、利通电子、节创智能,那这类公司呢,目前主要还是围绕算力资源、服务器、机房、客户订单和租赁模式展开。那第三类呢,是 token 工厂,也就是重资产生产端。那还会代表企业包括 knabels, together ai, firework ai 以及 call with。 这里要注意的是, call with 虽然呢起点是算力租赁,但是它也可以往 token 工厂方向延伸,所以我很看好它好。 together ai 呢,是 token 工厂的重要代表, 那 token 工厂呢?这类公司的核心特征是自己有算力,同时呢跟模型公司来进行分成, token 的 比例分成大概是三比七,八比二,也就是说它不是单纯的出租 gpu, 而是呢, 利用这个收入分成,这类公司的毛利率可以达到百分之五十。种技术壁垒,种这个推理优化能力,种平台的交付能力。国内对标企业包括润健股份、品质信息、红杏电子、 呃,商汤软件、云天利飞。其中呢?尤其是润健,它的 token 工厂模式是率先落地。那第四类呢?是 token 运营商,也就是轻资产聚合平台。 海外的代表企业主要有 openroot。 那 它是全球最大的 token 运营平台,它的 a p i 接入了所有的主流模型,并且采用 按照充值金额收取百分之五点五平台费的模式。啊, token 运营商的核心特征呢,是不自持算力,主要是做分发聚合和技术路由服务。那这种模式是轻资产,高成长,更适合 ps 估值。那国内目前呢,还没有对标的 企业。国内更接近的角色包括华盛天成、力昂技术以及一点天下未来呢?呃,这个运营商 mars 平台,以及阿里的 a t h。 呃,电信的 token hop 可能会承担一部分 token 运营商的角色。 那为什么这件事情值得大家重视?因为它背后其实代表的是 ai 基础设施商业模式的变化。 那第一个阶段呢?市场关注的是 idc, 谁有数据中心,谁有机柜,谁有电力,谁就有价值。那第二阶段呢?市场关注的是算力租赁,谁有 gpu, 谁能够拿到英伟达的芯片,谁就能够签下大客户,谁就有价值。 那第三阶段呢?市场开始关注 token 工厂,也就是谁能够把 gpu 算力服务、模型推理优化、 api 调用 整合起来,按 token 用量来赚钱。那第四个阶段呢,就是 token 运营商,也就是谁能够啊,成为 ai 调用的入口,谁能够聚合更多的模型,谁拥有更强的分发能力,谁就有可能成为 token 经济时代的 平台型公司。所以呢,这不是简单的算力故事,而是从卖算力到卖 token, 从租机器到运营 ai 流量的变化。 我们来总结一下,三大运营商推出 token 套餐呢,不仅是一个简单的新业务,而是 ai 基础设施商业化模式的变化信号。那过去我们看的是 idc, 看的是机柜,看的是 gpu 租赁,那接下来呢?市场可能会越来越关注 token 工厂以及 token 运营商, token 工厂负责把算力加工成 ai 调用服务,而 token 运营商负责把不同模型和 token 能力聚合起来,卖给开发者、企业以及 c 端用户。 当 ai 调用像手机流量一样被套餐化之后,谁掌握 token 生产力,谁掌握 token 分 发入口,谁就有可能在下一轮 ai 基础设施重估中占核心地位。 那所以呢,当前正处于算力租赁一项 token 工厂 token 运营商切换的初期窗口,那这一轮变化值得 我们持续,最终大家可以重点关注具备大厂绑定能力啊,推理优化能力的 token 工厂,以及具备平台化潜力的 token 运营商。以上就是本期的所有内容,我是派我们下期继续聊。

听我说关于滔凯代理这个项目,很多人都觉得滔凯代理呢,就是个二道贩子啊,没有什么技术含量。但你可能不知道,如果是没有代理啊,滔凯这边生意呢,可能做不大,因为大厂缺的不是技术,是渠道。 你像阿里云、腾讯云、火山引擎,他们的销售体系呢,定的是大客户,一个单子几十万几百万,但中小企业呢,一年可能花个几千,甚至不到一万块钱,大厂呢,看不上,但是这个市场会非常大, 于是中间出现了一层人,就是滔凯代理。还有一个更现实的原因就是中小型企业呢,根本看不懂这些技术。那么你做的事情其实不是倒卖,是翻译,就是把你的技术变成生意啊,这才是滔凯代理的真正价值,而且这个模式不会很快消失。 你可以看云计算发展了十几年,那么代理商呢?依然活着。 ai 时代呢?可能也是一样的逻辑,就是底层技术越标准化,中间层越需要懂场景,懂客户的人。 top 代理可能不是那种短期的机会,会是一个长期的项目。所以不要小看 top 代理, 技术是矿啊,渠道呢,是路,如果没有路,矿挖出来可能也运不出去。如果你也在研究 top 代理,跟谁聊一聊,我看还有多少人已经在关注这个机会。下一期呢?我讲最现实的问题,普通人的第一个 top 客户从哪里来?

今天就给大家揭秘一下平时我用的是什么模型,然后以及用了多少,然后统计一下,最近三四个月我大概用了将近三百亿 token 的 一个用量,然后给大家看看我到底用了些什么模型, 我还是给大家看看,免得大家说我没用过什么模型,就在这吹建模型。这是我公司的电脑,公司电脑上面看到没有?这个地方总共用了两百多亿,透坑哈,然后对方是一万两千多美元,这是公司电脑,你可以看到我这方用了非常多的模型,嗯,然后还有我自己家里面的电脑, 对,你看这方家里面电脑,这是我的那个 mac mini, 上面也用了大概三千多美元一个量。那你可以看到我用了各种各样的模型, 然后我还有台电脑,还有台电脑在那边,然后没开机,这是我,嗯,之前最早的时候,嗯,开发用的一台电脑上面应该也有几千美元的消耗量。 对,大家就知道其实这些东西真的不是我在乱说,是确实他就是要花这么多钱,然后每个我都去试过了,就是告诉我大家,就是告诉大家我自己一个真实的体验,他到底是怎么样的,然后以后不准再乱黑了哈。

我问一个问题,滔凯到底怎么赚钱啊?听我拆一个公式,收入呢,等于滔凯的单价乘以滔凯的消耗量,这个听起来很简单,对吧?但是里面的逻辑跟以前卖软件完全不一样。那么以前卖软件怎么赚钱?就是卖许可证,卖账号,一个账号呢,收一份钱, 用户用多用少,你收入都差不多,但滔肯不一样,你用的越多,他可能就赚的越多。那么这导致一个结果,在 ai 时代呢,就是你收入的上限不再被用户的数量上限。 我再给你举一个例子,假设一个企业用 ai 做客服,那么以前招十个客服,成本呢?是固定的,那么现在用 ai 成本按滔肯算, 业务增长十倍,滔凯消耗也涨十倍,那么你的收入呢?也涨十倍,这就是滔凯这个项目的本质,按使用量收费的规模化生意。现在呢,你回头看一个数据,中国 ai 大 模型一周呢,调研量突破了五万亿,滔凯 五万亿乘以 top 单价收入是多少?这就是为什么现在的云厂商、模型厂商全部都在抢这个 top 的 入口,因为谁掌握了 top 的 出口,谁就掌握了 ai 时代的水龙头。那么问题来了,就是这个生意普通人能不能分一杯羹呢?啊?评论区可以聊一聊,就是你觉得 top 这个项目,普通人能不能参与。

我上个月花了四十个亿的 token, 相当于花了多少钱?那今天就跟大家来聊聊这个事,就是关于 ai 时代的 token, 它是怎么样去算钱 啊?先拿我那四十个亿的 token 来举例啊,如果用的是克劳德这个模型的话呢,大概就是两万多美金,也就是十几万人民币, 如果换成 deepsea v 四的话呢,大概就是几千块钱吧。好,那么聊到这里呢,呃,你最近有没有经常听到你身边的小伙伴,或者是经常刷到别人说 啊,我动不动就花了多少多少 token, 多少多少 token 呢?其实 ai 时代的 token, 我 们如果换成一个简单的理解的话,你可以把它理解为 ai。 呃,读书写字时候啊,消耗了这个计量单位, 嗯,他不是一次性付费的,他是按照干了多少活来给你去计算的。举个非常接地气的例子,就类似于你去打印店 打印资料啊,他并不是说你完成打印资料这一件事,他的价格是固定的,他要看你打了多少张纸 来算钱的,就是每一张纸的定价是多少,然后按照你最终的这个数量来进行算钱的。好,理解了这个概念之后呢,我们接下来就要讲到下一个知识点,就是我们如果去用 ai 的 话, 怎么样去节约 token, 就是 我们怎么样用到最少的 token 去做最多的事情。特别是我们现在很多 企业当中,如果要运用 token 的 话呢,那么这条视频应该蛮有帮助的。在讲这个之前,再多植入一个概念啊,我们 token 分 为两种, 一个叫做输入 token 啊,另外一个叫做输出 token, 你 给 ai 的 东西就叫做输入 token, 然后 ai 还给你的东西就叫做输出 token。 举一个比较简单的例子,就好比你要厨师把菜谱炒出来就贵了。 好,那么其实最终的总结就是决定我们用 ai 做事情的价格的是三个因素,第一个,你用的模型是便宜的还是贵的?第二个,你是输入多 还是输出多?第三个,你有没有重复的塞给 ai 很多没有用的内容 啊?就很多公司其实它透坑烧得快,它并不一定是 ai 本身用得多,而是这个公司的用法比较浪费。比如说你想让 ai 帮你去改一个标题,但是你却给了它一整本这个产品的宣传手册, 那么如果你这种用法的话呢,就会非常的浪费,因为你的输入很多,然后输出只有一点点啊,这就好比你上学的时候,暑假作业有一道题不会做,然后呢,你却把整本学习资料全部扔给老师,你说我其中一道题不会做 啊,那么老师就要把所有东西全部看完一遍啊,再再还给你,就是这个道理。所以看完这一期视频的小伙伴就可以以后 啊,用 ai 的 时候呢,就可以先自己思考一下,我需要用这个 ai 去得到什么,那么我可以怎么样的给他最少的东西,让他给到我我最想要的这个东西? 嗯,这个以后是一个蛮值钱的技能,因为啊,所有的人都能用 ai, 谁用更少的 toc 做出更多的东西,就会在 ai 时代变得更加的有竞争力。

一百万 tok 能用几天?到底能聊多少?为什么我随便说了几句话就用完了?大家好,今天给大家分享一个让你笑中带泪的 tok, 科普你有没有过这样的崩溃时刻?刚让 ai 写个周报,翻译一封邮件,再问两句女朋友为啥生气, 结果直接弹出今日额度已用完。明明写着一百万 tok, 怎么几句话就没了?今天咱们就用最通俗的话,把 tok 彻底讲明白。 首先, token 到底是啥?简单说,它就是大模型的字数碎片,模型会把我们说的话切成小块,每一块就是一个 token, 中文大概一个字对应一到两个 token, 英文一个词也差不多。比如今天天气真好啊,拆分成几块就是五个 token。 那 一百万 token 听起来很多,实际能聊多少呢?按正常对话算,你问五十字, ai 打五百字, 一轮下来大概八百二十五个 token, 算一算,能撩一千两百多轮,但千万别高兴太早,真正吞 token 的 大胃王是上下文累积。 ai 不 会忘记你之前说的话,每一次对话都会把之前的内容一起算进去,第一轮大概零点八 k, 第五轮就到四 k, 第十轮直接八 k 以上。越聊到后面, token 消耗得越快。更扎心的是,这些场景最费 token, 写论文反复改,开头改一次少几千 token 改代码不停调参数换格式,额度直线下降。翻译长篇内容点一次继续, ai 重翻一遍就再扣一次费。而且每点一次重新生成,都要重新消耗 token, 相当于反复买单。可能有人疑惑,为啥企业总说一百万 token 很 慷慨? 给大家算一笔账, gpt 四的一百万 token 要花两百到四百块钱,换算成汉字大概七十五万字,差不多一套三体三部曲。但对我们普通人来说,真的需要 ai 记住三天前的聊天内容吗? 最后给大家五招,省 token 秘籍,学会了额度直接翻倍!第一,聊完一个话题就开新对话, 别让 ai 带着旧记录聊新内容。第二,提问精准,少废话,别只说写脚本,要说清功能和字数限制。第三,别反复点,重新生成,想清楚再发送。 第四,用好系统提示词,一开始就明确需求,减少来回修改。第五, ai 生成的内容及时保存,别让它重复创作。 其实一百万 token 能做的事特别多,有人用它写完一部小说,有人靠它学会 python, 关键看你怎么用技术, token 虽好,可不要浪费,用好技巧,每天都能畅快用。 ai 内容对你有用的话,点亮个小红心吧,谢谢大家支持!

花了三个亿的 token 打造出这玩意,这不是闹吗?苏醒了,猎杀时刻。 哈喽,今天来聊一下 open crop。 呃,我也玩了整整一个月了吧,主要是想聊一下我是怎么花了五天时间去搭建的一个自动化交易。 呃,你可以看一下这里,这个是最近五天所花费的一个 token 量。其实说实话, diptyc 是 真的很便宜哎,我看了一下,好像最近推出那个 v 四就挺便宜的,是打二点五折吗?先充了十块钱之后去试,哎,好像发现第一天跑下来好像花的费用还挺低的,才几块钱,直接就把全部的 a 准全部就接入 dptyc, 而且他还挺调皮的,换了个说法,二点五折变成四分之一。然后呢,回到这个系统上榜 就是,我是一开始是跟 dc 去头脑风暴,之后我才真正套路搭建环节的。其实也遇到过很多问题,比如说大家关心的一个数据,实时订单铺跟下单,当时倒是也刷到过一个妙手 skill。 这个好像是呃,就是教大家是怎么去连到东方那个 app 的, 它应该算是挺可以的,但是我一直看的是小黄鱼比较多嘛,但是想要拿到小黄鱼的订单, 要么你就只能购买他接数据源的 a p i, 要么就是找免费那种延后的,那延后的话意义就不大了嘛, 所以说我当时也是觉得挺麻烦的。后面就是我就看到了 ok 他 自己的 ok 的 颗粒,然后呢,我立马就去验证了一下这个 skill 到底是能不能用的。然后就是花了五天,整整就是花了五天去搭建了这个东西。然后呢,这个系统我基本上也已经是升级到了三点五版本, 为什么要去做这个猎杀系统呢?其实我也讲一下我的思路吧,因为从我接触到现在,因为在整个上涨趋势中,即使是上车做事商完全也可以出现货去打压价格,做事商进场挂单的位置的,除非你是有购买它额外的一些软件的一个数据, 所以说这个对我们来说是一个劣势来着,那么就是做空,就是一个匿名属性的一个交易系统,然后就说一下整体的一个核心,呃,之后的话细节我可以弄出个文档,或者说下一期再去跟大家 详细的聊一下。现在整个面板上面,其实你是可以看到它的名称,然后就是方向了,我这里是用了一个核心逻辑,拿到它能给到的全部的订单铺,然后去判断它的一个 可以入场的位置。这里呢我通常会用到一个通道,因为我觉得通道这个东西怎么说呢?如果你是真正的一个最高点去猎杀的通道的一个 判断逻辑,就是因为要判断他有没有去突破一个上轨,这个只是一个参考的一个方式。然后呢他是要共振的,就比如说你还要去考虑他那个飞波纳气的扩展位,还有就是订单库的墙,他卖盘比较偏多的, 然后还要有个 rsi, 其实对我来说还算是挺清晰的,然后呢他基本上就是有 呃,分了四图,然后还有一个现价入场,知音知水,因为 我这个炼沙系统是直接算是一个挂单的,不是说哎,我们当时看到了我,我就立马要试驾进去,不是这样的,就是等它指标它共振之后,它才出现一个入场的一个价格。然后呢,我同时是在这个 面板上面是直接搭建的一个一键挂单,可以直接点它,它就直接帮我把整个订单先再挂进去, 这个是方便我先去整理它的一整个 ai 判断的逻辑,因为我还是在测试中,这还算是我的一个三点五版本,它还算是要继续升级的。 那么这个情况下我就是还不会让他去自动化交易,其实我想让他自动化去交易也算是可以的了, 但是他是暗箱去操作的话,我就觉得还不太 ok, 所以 说我就先去验证,通过这个面板去验证他的判断逻辑。所以说今天就是讲到这些了。嗯,下期再聊吧。

兄弟们,一天两个亿,这个水平怎么样?最近小米那个 over 百亿补贴,我领了八亿的 token, 然后不到五天全部都用完了。我用的模型是 miami v 二点五 pro, 基本上一条 prom 就 要耗费几十上百万的 token。 我 跟你讲,这个 token 消耗的速度就跟高三漏了底的油箱一样,那个油表的指征就是以肉眼可见的速度疯狂的往下掉, 然后下一站还有更好更贵的模型在等着宰你。最近呢,也有些信息就是豆包看收费了,其他平台也在收紧他们的政策。这让我突然反应过来,我焦虑的其实不是这些免费的额度正在不断被消耗,而是这个 ai 的 廉价的学习窗口马上就要关闭了。 你想现在消耗头可让大模型跟你合作去做各种产品,它其实就是你交的学费。而我们现在面临的现实是,现在可能只要一分钱一节的课,未来可能要变到一块钱一节课,甚至十块钱一节课。 所以你懂我在说什么呢?你现在花的模型的 token 可能就是未来 token 价格的最低点。你现在每一次试错都是在抢一个越来越贵的入场券,所以你尽可能多的去消耗你的 token 吧,未来可能没有那么便宜的吧。

每个月我们烧多少 talk 这件事情现在变得越来越有意思,为什么呢?因为大家都知道现在普通员工可能一个月也就是几百万到几千万,然后呢?对于 ai 的, 嗯,头顶用户呢和技术员工,我们现在每个月大是几亿到几十亿一个月,但是对于重度的 a 境特和英菲尔用户呢?一个月上百亿已经成为一个事实。大家都知道啊,小龙虾的作者现在一个月六千亿啊,没他的内部就搞的 比赛吧,最高的一个工程师花了呃,两千一百八十亿,对吧?我我觉得就是说 在同一家公司里啊,几百万 tucker 和几千亿都可以共存, tucker 的 确成了这个 ai 时代的一个电力消耗。大家都知道,我们看一个国家的产业就是看它的电力消耗。 我觉得以后比如说对于中国来说,中国为什么能成为世界工厂?因为中国的电力消耗是一年十万亿,美国是四万亿,那么印度只有两万亿,这就是铁,就是铁打的这种啊,国家这个工业实力的对比, 那么我觉得以后国家的这种 talking 消耗量应该来说也会成为这个其 ai 实力的一个对比。

学习 ajc 大 约需要花多少钱?这里仅以我个人的经历给大家做一个参考啊。首先是工具方面的费用,那我们想把这个技能练好,光靠平台的免费积分肯定是不够用的啊,开会员是免不了的了, 那我当时开了一个吉梦的标准会员,是九百多吧,当时活动时候买的,还开过一个 type n 的 基础会员啊,年费是呃,六百多人, 呃,开过一个微度的阅读会员是两百多,开过一个小云雀的阅读会员,几十块钱啊,这种几十块钱呢,可能也有几个加起来啊,还有剪映啊,剪映的年费大约是三百多块钱, 杂七杂八的工具方面加起来大概有个两三千块钱吧啊,然后就是学习方面的费用了,我当时呢是选择报课啊,我选择跟着有结果的人 去学啊,是快一点,我的想法就是花钱买时间嘛,比自己摸索学的快一些。当时课程费用大约花了有七千块钱左右吧啊,加起来大概一万块钱左右,大致就这样。

这是我的一个开源项目,叫 ai token dashboard。 他 想解决一个很具体的问题,每天到底把多少 token 花在了 ai 工具上。他默认只读取本机日制 写入本地 sq lite, 不 上传数据,也没有遥测。 cloud code codex c l i gemini c l i hermes open cloud 都可以汇总到一个看版里,你能看到每日趋势,模型占比 缓存命中率和费用估算。多台设备也可以用自己的 token 推送到同一个 hub, 它是纯 java script node, 二十二点五以上就能跑。想开源一个真正实用的 ai 用量看板,这个版本已经可以发布了。

token 翻译成中文叫什么?叫词源,是模型处理文本的最基本单位。 token 和字呢?有什么区别? token 呢,可以是一个字,一个词,甚至半个字,那这是谁规定 的?是模型看了大量人类文字统计出来的,这样表达呢,更省事。常见的字和词就用一个 token 表示,其他的就用多个 token 拼接。 一个 token 到底是多少钱? deep 呢?输出一百万 token 呢?约等于三本新华字典只需要三块钱, gpt 五呢更贵,超过九十块 token 和上网流量收费是一样的道理吗?不是的, token 收的是计算费,是生产成本,而流量收费呢,是搬运费,不是一回事。为什么养龙虾要烧 token? 是 因为龙虾要用大模型思考和回答问题,因为大模型按 token 收费,所以就说烧 token。 本地部署大模型是不是就不用烧 toon 了?还是要用到 toon, 因为 toon 机制本身和部署方式无关。本地部署呢,不需要按量付费,但电费得自己掏,算上硬件成本不一定划算。如果我把一段话复制粘贴进去,是不是就算一次 toon 不是 文字越多呢?计算的输入 toon 数量就越多? 我问的问题很长,但答案很短,是不是只扣答案的 token 不是, 输了 token 呢?也要算钱?表情符号算几个 token 会不会比一个字还贵?常见的表情呢,是一个 token, 不 常见的会用两到四个 token 拼接表示。 deepsea 和 gpt 的 token 是 一样的吗? 不一样,互相不认识。 y, y, d, s 这种网络词是几个 token, 一 般拆成 y, y 和 d s 两个 token, 要是这个词足够火,也可能被模型当做一个整体。同样的问题,我上午问和下午问,输出的 token 数会不一样吗?不一样,模型输出具有随机性,每次输出的 token 数量不同。 那小龙虾帮我下载电影是否要按 token 计费?小龙虾思考怎么下载?打开下载网站,执行下载命令,这些都需要消耗 token, 但是下载电影本身不消耗 token, 因为电影不是大模型生成的, 电影是存在第三方服务器上,只消耗下载流量,不消耗 token。 为什么我和 ai 聊得越久,回复同样一句话,花的钱就越多? 模型是基于对话历史进行回答的,所以你所有说过的话呢,都会参与计算,计算成本就越高,这也是 ai 还需要按照输入 token 数量计费的原因。 怎么才能少用点 token 输入更少的提示词去掉?你好,请问这类废话规定模型输入长度,加一句五十字以内回答,但很有可能问题没有说清楚,回答呢也不够准确。如果前后问题呢?不相关也可以新开对话,避免历史对话参与计算。 托管是加密的密码吗?不是,托管只是一种文字编码方式,虽然你看不懂,但他并没有加密。 图片和文本的托管是一样的吗?不一样,图片会切分成很多小小的方块,每个方块呢?当做一个视觉托管,就像拼图一样。托管是为了收费而发明的吗? 不是,托管是技术发明,是为了能表达和能计算,只是计算的成本和托管数量正相关,所以就按照托管数量收费。我使用豆包没有付费啊。为什么说托管是收费的?大厂为了抢占市场让你免费使用,成本呢?暂时不用你出, 如果你是企业用户或者养龙虾就需要支付费用。我在一段话里疯狂敲空格, ai 是 视而不见还是会偷偷扣我的钱? 空格也算钱,虽然有的模型会把几个空格打包,大部分时候你多敲一个空格就再多烧一份算力。那 ai 产生的废话是不是能退费?不能,因为废话也是显卡辛辛苦苦算出来的。

cloud code 公司,也就是 azurepic 宣布盈利了,它原本计划是二零二八年,盈利比计划提前了两年。众所周知,现在所有的 ai 公司其实都在烧钱阶段,大部分公司还没有盈利,营收更是少的可怜。这原因其实是 ai 公司就是 cloud code, 它主要是面对 tob 的 用户, 它的每个用户都是要付费的。其实 ai 时代有一个非常反直觉的问题,就是之前互联网是用户越多,企业越赚钱,比如说你开发一个软件,一百万人用和一千万人用,其实就是一个非常大的数量级的差距。 toky 的 掉用量随着用户增多而增多。以互联网公司的惯性思维就是说我先拿流量,我先来,用户会发现它其实不是一笔很划算的买卖,因为所有的用户可以用完你的这个 ai, 用另一个 ai。 我 相信很多人的手机里可能都不止一款 ai 的 软件, 所以 cloud code 的 母公司盈利转正以后,我相信很多的 ai 公司他都会去效仿,包括一些国内的互联网公司,像豆包,像千万一样,这在未来会不会导致一种恶性循环?它的 tob 用户用的 ai 是 最好的,最先进的、最快的,很多普通用户或者免费用户,他用的 ai 就是 最烂的。 这会不会导致一种情况,就是你越用差的 ai, 你 的生产率越低,你就越赚不到钱,就越买不了好的 ai。 然后你越用好的 ai, 你 的生产率就越高,你就越赚到钱,你可以用更好的 ai。 所以 这会不会导致一种贫富差距的加聚呢?所以很可能以后大家上大学不是学知识,而是什么大学可以给你付费买更新更好、更贵的 ai, 然后大学把 ai 这个 token 发给大家,大家去用以后大学这张比较变成 token 的 比较,这其实挺值得深思的,但是我建议现在所有的人还是去开一下付费的 ai 的 这个会员,我觉得 callix 其实就是一个比较划算的。

一个月的 token, 有 人卖一百三十五块,有人卖六万多,相差了五百多倍。这个玩意他到底是什么?怎么就成了账单上的数字?今天把这笔账给你彻底算清楚! token 是 什么?他不是字,也不是词,他就是大模型里面的语言积木, 英语切得细,中文通常是一两个字,你问的每一句,他回的每一段,都要拆成 toon, 他 就是 ai 世界里面的度量尺。一个月 toon 能干啥?如果你只是写写邮件做翻译,够用五十年。但如果你是自媒体,天天产出长文,大约能撑两年。 这是换成企业客服,一天就要烧掉上千万的头啃。一个亿只够用十天。来看二零二六的报价,第一梯队,超清量豆包通利专门奶,一百多块,一个亿像矿泉水一样便宜。第二梯队,旗舰机, gdp 五 pro 的 扣四要四千多块左右,逻辑更稳,推力更强。 最贵的是顶级模型,一个亿要六万多,那是给科研和金融弄的黄金为什么差这么多?因为基础能力已经成为了标准品,但深度推理、高精度的代码仍然是稀缺自然。记住,输出比输入贵, 生成的内容更费电,比你提问要贵十倍。不想让账单爆炸,教你三招,第一个,精简提示值,删掉废话,节省百分之七十成本。第二,模型分级,简单的活找便宜的,难活,再找旗舰机。第三,压缩上下文,别把聊天记录全部喂给 ai, 看懂了 token, 就 看懂了 ai 时代的价格逻辑。它不是遥远的技术,它是每个人都要学会用的钥匙。关注我,带你省钱,用好 ai!

一个野路子的中专生,竟然用三千块十天的时间做出了国产爱死机,让好莱坞导演看完以后全网跨国通缉,评论区直接炸翻。三千块钱,我拍个 vlog 都不止这个价呀!这个效率,直接把传统影视按在地上摩擦,只有真正干 a i g c 的 才懂这 这个操作有多逆天,不敢想传统 cd 行业会受到什么样的冲击啊!其实三千元能做到的你也可以,不是他天赋异禀,而是他找对了 ai 短剧的创作逻辑,而这一套可以复制的零门槛的实操方法,曹峰在如何制作一部 ai 短剧里面,手把手的交给了所有人。我 就觉得曹老师的书备受好评的一点在哪里呢?就是哪里不会点哪里。第一章就第一步,第二章第二步,从剧本到分镜,从角色到动态化,从配音到剪辑,确保你不仅能够看懂,而且还能亲手做出来。 而且他本人也堪称是爽文,主角被骂二十年废柴,然后靠短剧改写人生。 ai 是 工具,创意在人书中不只教技术,更聚焦于导演思维。网友们都说 ai 短剧会颠覆传统 cg 行业,这个话没错,但是机会永远都会留给那些有准备的人。

各位家人们,各位同行们,各位在座的各位,我今天拍这条视频之前,手是抖的,心是颤的,因为雷总他又来了,不是造车,不是造手机,这回是来砸 i 算力的场子。 小米旗下的密谋大模型平台今天直接官宣,密谋 v 二点五系列 api 永久降价,最高降幅百分之九十九。没听错,不是打九折,不是打五折,是直接打到骨折。 我掐指一算,这不就是把偷啃的价格打成白菜价吗?雷总这是要让全行业的 ai 创业者人手一把白菜回家炖粉条啊!来,坐好,咱们慢慢聊。今天这条信息量巨大, 先别急,我知道很多观众老爷要问我,偷啃是个啥?能吃吗?我用最简单的话给你解释,你跟 ai 聊天的时候,你说的每一个字,他都不是直接看字的,而是把字拆成一小块一小块的偷啃来处理。 你可以把 token 理解成 ai 世界的流量,就像你手机上网要花流量一样,用 ai 大 模型就要花 token, 你 问 ai 一个问题,消耗一些 token, ai 回答你 再消耗一些 token。 token 用的越多,费用就越高。所以 token 的 价格直接决定了你用 ai 有 多贵。以前呢,很多 ai 平台的 token 价格怎么说呢?就好比你去景区买矿泉水,明明超市卖两块,他非要卖你二十,你渴了没办法,只能掏钱。 现在雷总站出来说,这瓶水我给你降到两毛,就问你同行怕不怕?好,具体降了多少,我给大家翻译成人话, 以前你用密默的 api, 假设花一百块钱能跑的量,现在同样的钱能跑原来的五到八倍。我再说直白点,以前你花一百块, ai 帮你写一百封邮件,现在花同样的钱, ai 能帮你写五百到八百封邮件。 而且这个降价是永久的,不是搞促销,不是限时特惠,不是什么双十一来了赶紧屯,是直接把价格刻在那了,以后就这么便宜。这就好比什么呢?你楼下的煎饼果子原来八块钱一个,老板突然宣布,以后永远三块钱一个, 而且煎饼还比以前大了,你什么感受?就是隔壁卖煎饼的要睡不着觉了。而且这次还有一个特别狠的地方,不再区分输入长度了。以前很多平台有个坑,你的 prom 越长价格越贵,现在密谋说了长短一个价,这对于那些做长文本处理代码分析的朋友来说, 简直就是天上掉馅饼,还是热乎的。再说一个事儿,之前密谋搞了个百万亿 toon 创造者激励计划, 简单说就是白送 token 给你,用量大管饱。这个活动有多火呢?原计划分批发的一百万一个 token, 到五月二十六号下午就已经被全球用户抢光了,比双十一抢茅台还快。 活动虽然收官了,但是注意这个,但是所有还在有效期内的 token 破案用户,你的额度全部重置了。重置是啥意思?就是不管你之前用了多少, 不管你用了百分之九十还是百分之九十九,一夜回到满血状态,而且按新价格重新算,这就相当于你手机流量套餐月底告诉你,之前用的流量不算了,从今天起重新给你满个流量, 而且资费还降了,家人们这种好事上哪找去?更贴心的是,如果你是之前买过头肯帕案但已经过期的老用户,密谋还说了也有惊喜给你,未来一周公布,你看管理者这人做事,老用户也不会忘。有较真的朋友肯定要问了,降这么多, 不会是割韭菜吧?不会偷工减料吧?还真不是,人家是靠真技术优化把成本打下来的。他们做了一个叫苏尔滑动窗口注意力的技术优化,配合多级缓存策略,把 gpu、 显存、 cpu、 内存、 ssd 之间的数据搬运量达到了原来的七分之一。打个比方,原来 ai 思考一个问题,需要从仓库搬七趟砖,现在优化完了,搬一趟就够了,而且能缓存的偷啃数量变成了原来的五倍,命中率上去了,效率上去了,成本自然就下来了。 所以人家降价不是赔本赚吆喝,是真有技术底子在撑着。好,最后给大家总结一下今天这条消息的重点,第一, b m b 二点五系列 api 永久降价,最高降幅百分之九十九, cocoon 正式进入白菜价时代。 第二, cocoon 按加量不加价,同样预算用量提升五到八倍。第三,现有用户额度全量重置,过期老用户也有惊喜在入手。 第四,降价靠的是真技术,不是烧钱。所以我说这波操作真的是把让更多人用上更好的 ai 这句话从口号变成现实, ai 这个行业终于开始卷价格了, 而这一次是小米带头卷火。好了,家人们这期视频就到这,觉得有用的话点赞、投币、收藏三连安排,上评论区,告诉我,你觉得这个价格怎么样?你最想拿来去做什么?咱们下期再见,拜拜!

可以直接让你五十块的 tokyo 一 块钱。前几天呢, deepsea 官宣超级大降价,直接打二五折,本来以为够便宜,结果呢,小米直接跟进,直接降价百分之九十八。一觉醒来,百万 tokyo 直接变成了千万 tokyo, 这已经够便宜了。但是后台呢,总有人问我还有没有更便宜的? 有的有的,看完这条视频呢,我可以直接让你五十块的头筹一块钱就是这个 github 的 开源工具 rsvs, 点赞收藏起来你们也找不到,它就是为了 devic 终端而生的。我们再看 devic 的 价格表,有没有看到一个小字,缓存命中两分钱。缓存未命中的一块钱,直接就降了五十倍的价格。 那什么是缓存命中呢?简单来说,缓存命中了,就代表你要的数据刚好放在了你的仓库,你直接调用快速省钱。没命中呢,代表你的仓库里没有它,要去云端找,那么就要更多的钱。所以最快也是最直接的省钱办法就是提高缓存命中率。而 resix 这款工具可以直接提高你的缓存, 经常保持在百分之九十以上,那么你用你也能省。它还为 deepsea 做了很多优化,它的桌面端类似 colex, 还可以选择给 ai 不 同的权限,比要有科技才能用的 colex 和黑窗口的 closed code 好 用太多了。如果你也感兴趣评论回复一,关注我,下期出使用教程。

你是不是天天听人家说 talking, 以为是什么金融代币或者神秘代码?错了,今天我用一分钟让你彻底搞懂。而且以后聊天绝对能装个大的。来个比方, 爱就像一个玩乐高的三岁小孩,你给他一本红楼梦,他先得把书拆成一个个的小积木块甲宝玉,句号都是单独的积木,这个最小的积木块就叫 tokyo, 你写我喜欢吃火锅, ai 眼里就是四个积木,我喜欢吃火锅。第二件事,这玩意真花钱,你用 ai 的 付费接口, 你说的话算托克,他回答的话也算托克,聊嗨了,一顿饭的钱可能就没了。顺嘴一提啊,一套三体三部曲,大约九十万个托克, ai 读完也就几块钱,比买书便宜多了。 最牛的是托肯,是 ai 的 呼吸。以前的 ai 只能记住两千个托肯,聊着聊着就失忆了。现在的 ai 能记住二十万个,能陪你读完一本小说在细聊 里面的细节。但最有意思的是,人类说话也有托肯的密度。有人废话连篇,托肯多,但信息少,有人三言两语直接要害 a i 在 拼命的对 talk 求智能,而我们人类却可以用有限的 talk 创造无限的可能,这就是我们叹气生物最大的优越感。懂了没?下次聊 a i, 你 就这样跟他说。