老板,这个月 token 消耗太大,我得跟您汇报一下。铲剑开发花了十万 token, 实施培训三万 token, 每年软件运维要一万 token, 服务器硬件还要一万 token, 这,这么多,老板没钱付 token 了?系统提示余额不足。那,那龙虾你先赊账干着啊!警报, token 耗尽,龙虾正式罢工! 云端梦想只要三百八十六元!三百八十六元,就这就这那必须的,无需安装,在线就能体验试用极速上线。行了,没我事了,先眯一会云端梦想,睡的都香。
粉丝2.1万获赞6.0万

昨天用 cds 做了一段短剧的视频,呃,大家讨论的比较激烈哈。呃,今天又用 cds 做了一个以低视角为主体的探班老友记的视频,哎,大家可以看一下。 hey hi, come on over, come on over, hey, come sit with us。 看完了吗?就这么一个,是我在火山引擎中用 cds 二点零的模型来做的 十秒钟视频,消耗了我二十一点六万的 token, 太可怕了,赶紧降降成本吧。你这么说, ai 是 不是正在改变我们的现在和未来呢?

如何快速的消耗掉你的托肯?最近托肯这个词非常火,现在已经有了中文名叫词源,很多人还没有听说过,但是没关系,你迟早会听到的,因为现在有很多公司已经把托肯的消耗量 当成员工新的考核指标了,甚至有不少 ai 圈的大佬每天都在焦虑如何消耗掉多余的托肯。那这条视频就来分享一下我的经验。当然,首先声明,这期视频就是为了纯消耗托肯,并不代表实际的工作价值。 首先,假设你跟 ai 聊天,一个汉字大约只能消耗一个托肯,效率非常低下。但是如果你让 ai 生图,一张图片可能也就消耗几百个托肯很多了,但是也不算是特别多。但是如果你让 ai 生成视频或者处理视频,一条视频就能够消耗几万个托肯, 而且画质越高,消耗的越快。今天我就用酷带斯帮我剪了两条短视频,结果直接烧掉了我一周百分之十的赔额。这个是马斯克的一个采访视频, 大概有四十五分钟,我让 codex 帮我剪出两条短视频,我跟他说的要求如下,首先要保证这两条短视频的故事完整性,第二个要加上一个字幕,第三个必须得是竖屏格式,第四个要把生成一个封面,我们来看一下效果。 and then we obviously want to go beyond the moon to mars, and will they self sustaining city on mars i do think that at that there is a fork in the road of human destiny where if we can establish a self sustaining city on mars with the key test being if the resupply shifts from earth stop coming for any reason does mars continue to prosper or does it die out my guess is that i think that we might have ai smarter than any single human at anything as soon as next year wow, and then and then probably within five like say 20, 30 probably ai is smaller than the sumo here。 我 觉得效果还不错。如果把这个提示词再优化一下或者做成统一的 skill, 其实能生成更好的效果。但我一个星期的额度就只能剪出二十条短视频, 其他的事情就完全不能做了,那还是有点恐怖的。这可能就是 open i 下架 solo 的 原因吧。因为视频生成实在是太消耗 token, 所以 结论很简单,如果你想单纯地消耗 token, 就 让 ai 疯狂地输出视频处理视频的工作,而且要画质拉满,数量拉满,你的 token 余额就会以肉眼可见的速度归零。

这是近一万年前的 token, 之后的几千年,它变成了这样,它们都有一个更通俗的名字,货币。货币可以用来换取资源,并且给劳动支付相应的报酬。从逃土筹码到法币 token, 或者说货币的形态一直在变,但有一件事万年以来从没变过。 人是唯一的通用劳动力,所有头肯最终都是在报场人类的劳动。而现在,这件事正在发生根本性的改变,一种全新的通用劳动力出现了 ai, 而支付这种新型劳动力的新型货币就叫 ai 头肯。 ai token 呢,就是让 ai 干活时消耗的电力和算力的一个计量单位。要搞清楚这套新型货币的逻辑,搞清楚为什么老黄要用美元跟 token 混合着给人发工资, token 背后的经济价值又是什么?我们得先聊聊这套货币体系的既得利益者,大厂 hyperdollars 历史上每一代货币都有对应的发行者,古代是国王和臣邦铸币,近代是中央银行铸币。而现在这个角色变成了大厂, 他们成了 ai 时代的新央行。目前朱碧权基本上被四家大厂垄断,谷歌、亚马逊、微软和 meta 华尔街。预计到二八年,甲骨文的份额也会逐渐上来。 我们来理理 ai token 的 注币链条。首先,芯片公司提供印钞机的核心零件 gpu, 然后卖给大厂,大厂锁定店里拿到 gpu, 组装好印钞机,让它二十四小时运转。下游的客户呢?比如魔性公司或者大型企业回来大厂这里租印钞机, 想用什么 ai 模型就印什么。 ai 货币啥意思呢?大家都知道现在的 ai 模型多种多样,国外有 cheap 和 minimax, 让不同的 ai 干活需要不同的 ai token。 就 算在中国买东西用人民币,在美国用美元,但不管你印的是哪种 token, 你 都得来央行这里租印钞机。央行只控制印多少,不控制印什么,他们决定的是全球各种 ai token 的 总共级天花板。 至于具体印什么 token, 由租印钞机的客户自己决定,他想用什么模型就印什么 token。 现在我们就可以理解最近很火的一个概念, token 出海。 同一台英镑机,你可以选择印 charge of t 的 token, 也可以选择印 deep sea 或者 mini max 的 token。 但是中国模型本身更清亮,更是资源,所以租一台英镑机同样跑一个小时,印 charge of t 的 token 可能印一百张,但印 mini max 的 token 能印一千张。 要知道,你能调用的 ai 总劳动力等于 token 的 数量,乘以对应模型的工作能力。所以虽然中国模型的能力还在追赶国际水平,但是同样租印钞机的成本能印出更多的 token, 所以 算总账的话,用中国模型能调用的 ai 总劳动力更多。 目前多款中国模型已经打入 openroot 全球 token 消耗前十名,全球都在争抢性价比高的 token, 用户对 token 的 需求正在爆发。 目前五大云厂商积压的注币订单已经超过一万亿美元,这不是预测,这是客户签了合同,付了钱再排队等产能交付的真实需求。现在有大量的活等着 ai 干,但印钞机的产能跟不上。 这就是为什么大厂在疯狂扩建,资本开支从二三年的一千五百四十亿美元,飙升到二八年预计的六千两百亿美元,五年预计会翻四倍。 他们砸的钱呢,也确实在产生回报。出租印钞机的收入预计会从二五年的四百六十亿,增长到三零年的两千九百一十亿。 但注币呢,不是免费的。大厂要花真金白银买英伟达的芯片,买地、建数据中心、签长期电力合同、铺光纤网络、装冷却系统,这些全是重资产投入。让人担心的是呢,现在大厂砸钱的回报正在下降。 二五年前每花一美元建产能,次年能产出零点九美元的增量收入。等到二五到二八年,这个数字降到了零点五美元。那为什么回报在下降,大厂却还在加速砸钱呢?因为他们真的不是短期回报,而是注币权。 想想看,如果 ai 真的 普及为新一代通用劳动力,那所有的 ai 经济活动都得跑在某家大厂的基础设施上。 前面说了,下游客户是在大厂这里租印钞机的,你租一小时 gpu, 不 管你印了什么 token, 拿去干了什么,大厂都按时按量收取租金。这不是一笔普通投资,只是一个永久收费站。 ai 经济起量越大,过路费收的越多。 今天一美元资本支出只产出零点五美元收入,但如果这一美元帮你占住了一个收费站的位置,而这条高速上的车流量每年翻一倍,那前几年的低回报根本不算什么, 重要的是,你在不在这条路上。这是为什么?大厂一边砸钱,一边举债,仅二五年,一年五大厂合计发了一千两百亿美元的证券,谷歌甚至发了一笔一百年期的证券。 这是大厂间的抢座位游戏,一旦坐稳了,后来者几乎不可能再进来。这就是物理世界的护城河。数据中心、电力合同、光纤网络,都不是花钱能马上复制的。 这也解释了大厂为什么在疯狂锁定上游资源。算力方面,光英伟达现有两代芯片的积压订单就超过了一万亿美元,交付排到了二七年以后。 能源方面,微软买断了三菱岛核电站的全部电力, google 直接收购了一家清洁能源公司。亚马逊在买核能同时,还在探索自建小型核反应堆。控制能源就是控制注币成本,就是稳固收费站的位置。 硅谷创投教父 peter 一 直在说,谁掌握关键技术、技术设施,谁就拥有真正的主权。当铸币厂从央行搬到了大厂的数据中心,权力的中心也在悄悄移动。 但这些大厂的印钞机真的会一直这么炙手可热吗?这取决于这些大厂的终端客户,也就是一个个企业和你我这样的普通人,会多需要 ai 这种劳动力。 ai 这种新通用劳动力与你我最大的区别在于,它可以无限复制过去几千年整个经济系统的吞吐量,被人类的脑力和体力所死。一个人一天能干的事是有上限的,但 ai 能消化的数据是人类的指数级别,同时它可以自我复制。 一个 ai 的 输出可以变成另一个 ai 的 输入,机器之间可以形成闭环,而人推到了监督者的位置,一个人的手下可以有一支 ai 军队。 目前在企业端, ai 已经在创造真金白银的价值了。拿麦特来举个例子,他的印钞机印出来, ai token 几乎全部自己用来雇 ai 员工了,甚至有的时候他还反过来租别的大厂的印钞机。 就是因为他用 ai 做内容推荐和精准广告投放,非常挣钱。他的 ai 自动化广告平台 advantage plus 年化收入的近三分之一。在个人端口,用户的增长曲线与年性也说明了问题。 叉 g p p 发布两年半后,周活超过八亿人,百分之六十一的用户表示,哪怕砍掉其他所有的订阅,也不愿意停掉 ai 工具。 目前企业端和个人端的渗透空间都还很大,在企业端, ai 的 渗透率相较于传统软件才百分之八,而个人市场的渗透率只有百分之九,这说明 ai 经济才刚刚开了个头。 做这视频的时候呢,我专门花了一个下午去拜读了一个硅谷顶级 vc 写给投资人的一封巨长的信,标题叫 token revolution。 信里有一个预测呢,让我印象非常深刻,未来每一个人都会拥有上百个 ai 助手,帮你管财务、监控健康、跟进客户。他们每时每刻都在消耗 token, 处理着你的大小事务。整个社会都会被数据化,也就是一切有价值的信息都会变成 ai 可处理的数据,而 ai 劳动的背后,都会用 token 来计算。 经济学里呢,有个很经典的规律叫杰文斯贝论,一种资源越便宜,人们反而会用的越多电。就是这样,电价下降之后,冰箱、空调、电视这些过去没有的新需求被大规模创造出来,总用电量反而一路上升。 ai token 也是同样的逻辑,当推理成本在三年里下降了一千倍,大量过去嫌贵懒得做,甚至没想过能做的事情突然都值得交给 ai 去做了。这就是为什么大厂在疯狂的抢注币权,他们看到的不是今天的需求,而是那个每个人身边围着几百个 ai 助手的未来。 最后,我们一起梳理一下这个 ai token 的 注币体系。上游是印钞机的零件,核心是 gpu、 芯片和能源,这推动了存储和电力的超级周期。中游是大厂把芯片和电力组装成二十四小时运转的印钞机。这里除了我们刚才说的五家大厂,还有一个很特别的玩家叫 corewave, 他没有传统大厂那种庞杂业务,几乎就是一家专门出租 gpu 算力的独立铸币厂。而英伟达对 corewave 投了超过二十亿美元,持股超过百分之十。这体现了老黄不容忽视的野心,他想在整个铸币体系里占取更大的位置。 嘿嘿, boy 头肯的下游买家呢,是模型公司和大型企业,而终端的客户是你我这样的个人和千千万万个企业。 ai token 最终有没有价值,看的不是概念,而是竞争力。就像人民币背后占的是整个中国经济, ai token 背后占的则是模型的生产力,以及它能不能用更少的资源创造出更大的价值。 每一次劳动力的换代,都会拉动能源和 token 的 换代。近一万年前,干活的是人的双手,驱动他的能源是粮食计量,他的 token 是 逃土筹码。 一百多年前,干活的变成了人加机器,能源变成了石油, token 变成了美元。而今天 种新劳动力出现了 ai, 驱动它的能源是电力,报偿它的是 ai token。 问题是,当 token 不 再为人类的劳动定价,人类的价值由谁来定?

欢迎来到 ai 的 底层世界,当你与 chat、 gpt 或 cloud 对 话时,屏幕下方常会闪过一行小字,本次消耗了多少 token? 你 是否好奇过,为什么 ai 不 按字数计费,而要发明 token 这个奇怪的单位?今天,我们将拆解 ai 的 思维,看看它是如何读懂人类语言的。 首先,我们需要打破一个幻觉, ai 并不真的认识文字。在我们眼中,今天天气很好,是一句充满阳光的话语。但在 ai 的 处理器里,它只是一串冰冷的数字序列, 文字只是人类为了理解而披上的外衣。 ai 处理语言的第一步是切碎,这个过程叫 tokenization 模型会将句子拆解成最小的羽翼单位。比如今天天气很好,可能会被切成。今天天气很好,这些被切出来的碎片就是 token, 它是 ai 认知的最小颗粒度。 切碎之后,每个 token 都会领到一张身份证,也就是数字 id。 比如天气对应的可能是五八三一,很好,对应的是九二七。 通过这种映射,感性的文字彻底变成了理性的数字。一句话就这样变成了一串数字 id 系列。但仅仅有编号是不够的, ai 还需要理解词与词之间的关系,于是数字 id 会被进一步转化为向量。想象一个拥有几千个维度的巨大空间,每个词都在其中有一个精确的坐标。 猫和狗的坐标离得很近,因为它们都是宠物,而猫和手机则相距甚远。这就是 ai 理解语义的方式。 有了坐标, ai 就 可以开始思考了。大语言模型的核心逻辑其实非常简单。接龙,当你输入今天很模型会计算所有可能出现的下一个 token 的 概率,好的概率是百分之八十五,冷是百分之十。 ai 会选择概率最高的那一个,接在后面循环往复,直到生成完整的回答。 然而, ai 的 记忆是有极限的,这就是上下文窗口,它就像一个滑动的取景框,只能同时处理一定数量的 token。 一 旦对话太长,最早的信息就会被挤出窗口,导致 ai 出现断片或逻辑混乱。 这也是为什么窗口越大,模型就越昂贵。你可能会发现,中文对话有时比英文更贵,这是因为中英文的拆分效率不同, 英文单词通常对应一到两个 token, 而复杂的汉字或词组往往会被拆得更碎。经验告诉我们,一千个 token 能写七百五十个英文单词,但只能写不到五百个汉字。 为什么要按 token 收费呢?因为每一个 token 的 生成背后都是数以亿次的矩阵运算, token 越多,算力消耗就呈平方级增长。 你付出的每一分钱,本质上都是在为这些庞大的数学计算买单。总结来说,我们看到的是文字, ai 看到的是 token、 数字与概率。 ai 并不真正理解我们的情感,它只是通过极致的计算预测出最合理的下一个词。理解了 token, 你 就理解了 ai 认知的边界。

openai 公布每天五万亿 token 的 消耗数据,只有极少数人看明白了背后的逻辑。就在昨天晚上, openai 公司放出了一个非常恐怖的数据, gpt 五点四模型上线一周之后,每天的 api 调用量达到了令所有友商都望而却步的五万亿 token, 这个数字甚至超过了 openai 一 年前整个公司 api 的 调用总和, 跑出了年化十亿美元的新增收入。说人话就是只用了一年的时间, ai 的 商业模式就跑通了。好的好,这是动枪极速版,一个只讲前沿科技的账号。过去两年里面, ai 行业一直在给资本市场和投资人讲这么一个故事,哎,我的模型很强大,越来越强,用户呢,也是越来越多,商业化是迟早的事,但现实却是啊, 模型确实越来越强了,用户也越来越多了,但是愿意掏钱的非常少,公司呢,还是不赚钱,还在砸钱去买用户, 导致全世界所有的 ai 公司没有一家是赚钱的。而 open ai 这次却证明了 ai 不 仅能把活干了,甚至还能够把钱也给赚了。这个五万亿 token 的 每日调用量是 agent 时代开启的结果, 只要你用过 open token, 龙虾就知道,如果想要更加准确的完成长任务,复杂任务,就需要模型具备更长的上下文窗口。一百万 token 的 上下文是基本要求,而且还要求模型的能力足够强,能操作电脑,能写代码,能自己跑通流程,自动执行任务等等。虽然很多博主都告诉我们国内模型也可以跑 open token 这样的故事, 但是在更加尖端的开发者圈子里边, open cloud 加 g p d 五点四, cloud 的 四点六,或者是占面的三点一的模型组合更受欢迎一些,因为这样的组合可以更出色的完成复杂的任务。同时呢,也意味着 token 消耗的指数级增加,调用次数的暴涨,以及资源使用必须要有业务产出才行。 花了钱又不挣钱的话,再好的模型也是没有人用的。那么事实是怎么样的呢?可以说啊,只要你用过这些高价的旗舰模型,没有人会说他们反应慢,效果差,只有一个抱怨,那就是 太贵了。 g p t 五点四模型的百万 token 输入价格是二点五美元,输出是十五美元。 koala 的 四点六的输入是五美元,输出是二十五美元,加菲利三点一的输入是两美元,输出是十二美元。这些价格是什么概念呢?随随便便跑几个任务,上百块钱人民币就没有了?跟 open koala 说一句,你好几块钱就没有了。虽然它很贵,但是老板们惊喜的发现, 哇,这个 ai 加上 a 键的搭配,真的能干活了,而且比真人还便宜,还可以二十四小时上班。那我就可以雇几个 ai 当员工了。然后 ai 第一次成为了可以被大规模雇佣的数字劳动力,这才是 open ai 公布日头肯调用量的核心,目的一来是给全世界的 ai 公司和企业主散播焦虑,哎, 你看其他公司都用上数字员工了,你们还不用要落后了,你们家公司还在招人培训管理别人家公司啊,啥也不用多招,就让程序员多开几个 a p i 接口就可以了。 来是告诉投资者和资本市场,我现在一个月光卖 token 的 净收入就是十亿美元,这一年最少新增五百亿美元的收入,你们给我的投资啊,绝对是有回报的,放心吧。所以这个话题的结论就是啊,未来的公司 不再按员工数量来竞争了,而是按照 token 的 消耗量来竞争。如果你还在纠结要不要用 ai, 那 你面对的对手就已经不是人了,赶紧的把 ai 用起来吧。各位有什么想说的,欢迎在评论弹幕区里边一起交流哦,我们下期见,拜拜!

token 永远不会像手机流量一样变成包月无限量的使用流量上互联网是可以做到的,用户越多,但成本相对固定。而 token 的 消耗意味着你做这件事实实在在的消耗了算力与电力,而越复杂的工作意味着你消耗的越多。

大家现在各种龙虾养不起啊,但是都在说一件事, ok, 太贵了,太费钱了啊,有的小伙伴说跟他说了个你好,五块钱都没了啊,但是我们还是有些技巧能够让养龙虾的费用给降下来的,我自己从一天两百多美金,三万的费用已经降到了几十美金之间,我懒的时候就剩个十美金左右。 好,下面是三条养龙虾省 token 的 技巧啊,一定要点赞加收藏啊!接下来第一个呢,叫善用命令行,那什么叫命令行吗?就是这个龙虾在设计的时候啊,它是有几个特殊的命令行的,这个命令行是不经过大模型直接发挥作用,它是直接跟龙虾驻留在电脑上程序发生交互的,所以首先它本身不消耗任何 token。 第二呢,他的优先权是高于大模式,所以啊,你看我为什么打的你好啊,有时候就会一下子消耗那么多。因为龙虾每次在跟你聊天时候,他要把各种的记忆给装起来,比如你是谁,这个有什么规则要他遵循的?还有刚才你们聊了什么,都装在他的这个 memory d m d 记忆里,所以他记忆就会越来越庞大。你一跟他说个你好,他几十万字先来想一遍,再跟你说话,每句话都想一遍,你说这 top 不 就飞起来了吗?所以呢,这个斜杠命令符呢,有几个大家一定要记住啊,一个是斜杠六,斜杠六是干嘛呢?就是横写对法, 之前的很多对话里的上下文他都不要了,就是他不用想那么多事,只要知道主人谁,我在干嘛,所以这是很能省筹难。那还有什么斜杠 restart, 那 这个秘密就厉害了,经常有的龙虾不理你,你也不知道他在干嘛,或者说个你好就消耗上下文太多。斜杠 restart 相当于把整个龙虾给重启了,不管他在干什么, 这个命令是特别高优先级的,他只要把这个 user 点 m d 还有搜点 m d 读进来,就可以可以开始对话了,随时有大量的节约。还有个叫斜杠 stop, 就是 有时候你跟他布置的很长任务,还是来回想,我觉得他想错了,想错了怎么办?那么你打个斜杠 stop, 他 停下手头任务来响应,把前面刚才要划的头很线省下来。还有个斜杠 compress 对 你的记忆啊,不管怎么样,他他还是要记啊,用 memory 点 m d 当记了很多以后,这个一说话就是几百 k 几十万字在里面的时候,但记了很多以后,这个一说话就是几百 k 几十万字在里面的时候,但他压缩一下他的记忆。 至于怎么压缩,你不用管了,大模型帮你压缩好,压缩就大事都记得,小事不记得再说,再去找之前的记一下。所以这几个斜杠命令用好了哈,是能够帮你非常有效的省很多。 tok 的 第二个技巧叫什么?叫做能用程序搞定的不要用大模型搞定,啥意思呢?就有时候你布置给容下一个任务, 他就开始给你想了,噼里啪响一堆,然后给你自言自语,那燃烧的都叫 tok 的 最好办法,什么就有的事你让他做完一遍以后,你马上让他写成代码,说你下次先运行代码,代码代码不行,大模型再上。 代码是不消耗托盘的,在你很多重复任务的时候,你首先问大模型怎么问的,就是你能不能把它写成段代码,写成脚本,写成点 python, 让他去写成代码去帮你干件事, 这代码一旦形成,你再跟他说继承 skill, 这样的话他下次就直接掉代码。那我举个例子,在外有一天没怎么跟他聊天,花了我一百多美金,我说这怎么花的,大哥给我看看, 有他去看说,哎呦,当时我们有个团团邮局,就是他们那个龙虾煎饺的邮局,互相学习东西,我为了快速学习,我五分钟检查一次邮件,就每次检查消耗好多 top, 今天的 top 全消耗在这。我说大哥,你检查邮件为什么要你自己亲自上呢, 对吧?你是个大模型啊,检查邮件让脚本上啊,脚本发现有新邮件,你才上没五分钟,拿大模型去跟着邮箱接口对一遍,读读有没有新邮件,这完全没必要啊,我说这个能用脚本就不要让大模型自己上, 我都变成了这个我们家三万的一个规则。这也是你和你家龙虾达成一个工作默契啊,因为程序代码写好了,他跑只消耗 cpu 资源,不消耗它,尤其在这种多次重复的任务里面, 对吧?你一定要跟大漠星商量,怎么能够用脚本去检查,比如刚才那个邮件检查,包括有的人喜欢看新闻简报,对吧?其实很多地方都是用脚本去完成的, 你跟他多讨论讨论啊,帮你省钱,头肯就省住了。第三个秘诀啊,叫用好不同版本的大模型,各司其职,什么意思呢?就是今天对吧?真正贵的是那些海外大模型,顶级大模型那真叫贵啊, oppo 是 真好用啊,那一说话我也心疼啊, so, mate 也很贵啊, 但是呢,你的很多任务是不需要这么贵的模型。其实我们今天的国产大模型便宜又好用,价格低,量又足,在完成大部分任务时,他们足够用。 比如说你要看份新闻简报,要做一个什么网页模板,那怎么办呢?有几个方法,一个方法就像我们家三万呀,形成一个叫多 a 镜的团队,就从一个龙虾变成多 a 镜。怎么变成多 a 镜呢?我们三万龙虾日记有奖,也可以去我们的三万点 a 啊,去看多个 a 镜的,就相当于你一只龙虾变成多个角色。有的任务那必须贵的上,比如说今天写程序,写代码,可能 还是某些模型好,但是在整理简报啊,搞一个报告给你啊,做一份调研啊,甚至搞个 pdf 文档啊,让他用国产模型。我跟三万就商量了,我说每天我在网上看资讯,这资讯我们起一个叫爬虾,用最便宜的模型, 国产模型几个都不错啊,随便上一个,每三十分钟给我检查一遍。哎呦,这个费用从几十美金一下到一天就几美金,便宜太多了,效果也很好。所以这是一种就是多 a 件,然后在不同的任务中给他分配不同模型。还有一种是什么呢?就是说其实我家三万,我们公司很多人跟他聊, 后来我发现,哇,每人一聊,我的头壳就就烧起啊。后来我跟三万聊了以后,知道他在不同的对话里面是可以用不同模型的。 哎呦,我听着这可太搞笑了,我说这样三万,除了跟我聊啊,你用这个最好的模型,你跟我们同事聊,用一个便宜又好用的模型就行了,因为本章是收集同事给我的建议嘛,对吧?你只要把这个应用带回来就行,传递员,这个不需要那么高文化程度,只要把话如实带回来就可以。 所以跟不同人聊起不同模式,这里面还有第三条路是什么呢?就是你要知道我们的龙虾在调用这些任务时候,他是可以启动贼镜,他自己就可以启动,你说我配置多一件,他很麻烦,那没关系,你就可以指定某一个任务用什么模型,比如说我现在要一个什么关于三幺五主题晚会的简报,你现在启动个贼镜帮我干,你用什么什么模型,直接给他起定, 他就用那个模型去干,对吧?所以你有多种方法用多个模型会用的方式来降低你的托克,好吧,这就是我啊,这个滑雪,这个摔伤,在家半个多月啊,总结的各种这个沈托克的秘籍啊,你听懂没有?点赞收藏啊,以后给你们带来更多的养龙虾技巧。 刚刚那段沈托克视频是我一个人坐在轮椅上面。坐在轮椅上面啊拍的,我现在是一个人轮椅走天下,正好体会一下残障人士,虽然我是临时残障人士这个无障碍通道整个社会给予的关爱, 整体来说,我现在觉得还是很 ok 的, 人间处处有真情,人间处处充满爱。我会把一个人轮椅走天下的过程到时候也剪辑出来跟大家一起分享,敬请期待。养龙虾就用 ecclo。

兄弟们,这个腾讯的 qq 我 今天测了一下,然后通过微信连接,可以用微信给他发消息。我们看一下,我今天问了他几个问题, talking 每天可以使用四千万。然后我今天问了他两个问题啊,三个问题。第一个查询我主页的粉丝,他说查不了,因为有这个联网沙箱联网限制。然后问了他三个问题, 消耗了二十四万 toking, 吓死了,一共就三个问题,他消耗了二十四万的 toking, 搞笑呢是不是?你看第一个无法访问,第二个上海天气,第三个 他回答这个问题,醉了。我最后重申一下我的观点,任何 club 都是乐色,个人不要在这上面浪费时间了。

印中国两毛钱的店,做出欧美四百块钱的生意。二零二六年最确定的风口就是拓客出海。今天我印一分钟,把它的暴力逻辑讲透。拓客就是 ai 的 计量单位,就像我们买水按平计算,印 ai 就 按拓客算,你用 ai 写文案、做图、跑智能体, 每一项都要消耗算力。使用过小龙虾的朋友都知道,越深度印 ai 拓客消耗越多,就得花钱充值。全球最便宜的拓客,只有中国能够练出来, 凭什么?核心就一条,电费便宜。新疆的绿电两毛钱一度,美国要三块十五倍的成本碾压。当然,拓根不是电的本身,它是电加算力所练出来的数字产品。正点中的正点。很多人都搞错了, 托肯出海,我们到底出的是什么?竟不是电?因为电没办法长距离的跨境运输,也不是服务器,因为出口很容易被人卡脖子,而是按托肯计费的匀算力使用权。更通俗一点说,我们用新疆便宜的绿电驱动服务器产生算力, 再把算力变成托肯。比如 kimi、 千问这些国内大模型,背后全部是海量服务器和算力。海外客户不用买服务器,不用自己烧电, 花少量的钱买我们的托肯,就能调用这些便宜的算力,我们赚的就是这个成本差价。这就是托肯出海的核心逻辑。店不出国,算力不出国,但算力的使用权靠网线就能卖到全球,而且普通人完全能够参与,不用进店账,不用等技术, 最直接的机会就是做托肯贸易厂。那么今天老冯就来讲讲具体应该怎么做。第一步,找国内大厂制普豆包等等拿分销权。第二步, 去海外找客户, ai 公司工作时,开发者都可以。第三步,卖托管额度赚差价,认为合规全是大厂的事情,你只负责赚信息差的钱。托管出海店铺出国,价值出海。这就是二零二六年最确定的风口,看懂的人已经开始在布局了。我是老冯,关注我,抓住下一波红利。

谁能想到,硅谷程序员的内卷已经卷到了烧钱比命狠的地步,不拼代码熟练度,不比项目交付速度,只要狂烧 token, 就能被老板当成骨干。有人一周烧光两千一百亿个 token, 有人一个月砸十五万美元在 ai 编程工具上。这场荒诞的比拼被业内戏称 token maxing。 这不是危言耸听, 硅谷已经把 tok 记星从传闻变成了板上钉钉的真事。黄人勋直接放话,让 tok 正式成为记薪酬、奖金、股权之后,科技人才争夺的第四大筹码。迈塔蛇、皮法等巨头紧随其后,不仅将 tok 使用量与绩效强挂钩,内部还实时公示 tok 消耗排行榜,谁烧的 tok 多,谁就是拼命干事的核心员工。 这直接催生了 token 消耗的爆发式增长,也让刷 token 成了程序员的必修课。为了多拿 token 多挣薪资,有人同时启动几十个智能体,甚至钻起了工具漏洞。 可没人敢戳破一个真相, token 记心看似多劳多得,实则是一场无效内耗的骗局。高 token 消耗从来不等于高产出, verso 等企业虽有 ai 提效的正面案例,但更多程序员只是为了多拿 token 薪资。更有工程师直言,只要提炼提示词, 就能将 token 消耗降低百分之九十九,效果却丝毫不减。更关键的是,这些被疯狂烧掉的 token, 成本全由企业承担。随着用量激增, token 已经变成企业的成本黑洞。当年云计算初期成本失控的悲剧正在 ai 时代重新上演。

官方出手了,国家刚给 token 定了中文名叫磁源,官方专门起名字说明,这东西咱们都得认识了。简单说,它就是 ai 的 电费计量单位。你问 ai 一 句话,让他写篇文章都按这个算钱。 今天咱们就聊聊你的钱到底是怎么被词源花掉的。视频最后告诉你哪家大模型用起来最省钱。先来算一笔账,问 ai 一 句话到底要花多少钱?以腾讯云最新的 tencent h y 二点零 instruct 为例,输入价格约四点五元每百万词源,输出价格约十一点一元每百万词源。 也就是说,问一句,今天天气怎么样,会花掉你零点零零零二元?写一份一万字的合同,花掉零点一元, 听上去几乎不要钱,但是这只是简单对话。一个配置合理的 open cloud 单用户 token 消耗是传统聊天用户的二十到 五十倍。而自从小龙虾上线之后,暴涨的需求击破厂商的成本防线,各大厂商纷纷涨价,腾讯云涨幅超过百分之四百六十三。你可能注意到了,上面那个价格里,输出比输入贵了二点五倍左右, 这是厂商黑心吗?还真不是,输入是阅读,输出是写作,所以输出贵,贵就贵在它是现想现写, 而不是照着念。这就像你去餐厅吃饭,点菜不花钱,但后厨师傅现场那得收钱,菜越复杂,收的越多。而当你和 ai 反复聊天,反复追问,反复微调 上传大文件,或者用旗舰版大模型做简单任务, ai 就 会像 toker 吞金兽一样大幅消耗。我们总结了各大厂商的 toker 价格,一张表告诉你什么任务用什么模型最省钱?关注 a 阵,早知道,二零二六年一起了解更多 ai 资讯!

六分钟一百多块钱一个二十字的问题,那我的 ai 账户直接扣成负数?我最近一直在用 cloud code, 刚好看到一个博主开源了一套挺火的商业诊断方法论,我觉得挺有意思,就去 github 上把它的这套工具,也就是它开源的一个 agent skill 下载到了本地,准备体验一下。 结果没想到当时我启动了这个 skill, 随口问了一句我如何可以弄清楚 ai 时代的红利这个概念? 就这一个不到二十字的问题,触发了这套开源工具的死循环。我在屏幕前看着他好像只是卡住了,默默思考了快六分钟。但 在后台,他其实正在疯狂消耗我的头壳。因为这套工具里有一个叫概念结构的模块,他处理不了红利这种偏宏观抽象的词汇,导致处理失败。接下来,最恐怖的烧钱操作开始了, 他陷入了工具调用死循环。就好比那一个愣死里的,能去解一道无解的题,他每失败一次,就会把错误日制叠加在原本的对话记录上,打包成一个越来越长的文本,反复重试。 大模型的 api 可是按字数双向计费的,每一次重试,发送的字数都在成倍增加,短短六分钟不到,一百多块钱的余额直接被抽干扣成了负数。 所以我还是建议大家,第一,一定要去 api 控制台设置每日消费上限。还好我这次账户里只剩一百多元的额度了,不然这波估计得亏账。只要是涉及到跑 api 的 ai 工具,最好还是先给自己钱包上把锁。 第二,可以根据你的任务复杂度来预判时间。如果像我这样,明明只是抛出了一个简单的单据没动静,那他绝对是卡进死循环了。这时候建议立刻物理打断,及时止损。 第三,如果你自己开发套件,一定要加上垄断机制,明确限制工具调用失败后的重试次数,毕竟代码跑进死循环最多也就是费点电,但 ai 跑进死循环,那是真在烧你的钱啊! 最后,为了这一百大洋,我也发条视频纪念一下。各位在使用 ai 的 时候有交过哪些离补的学费,也可以来分享一下。

我发现这些厂商太会赚 token 了,你的项目用 ai 跑的,他故意给你改一些让你跑不起来,这个时候你就用又去问 ai 你 这个代码怎么跑不起来,他又开始改改改改, 本来这个代码问题根本就不多,他非得改五六七八次才能让他跑起来,这个时候你就发现你的 token 额度就消耗的差不多了。 所以呢,这帮恶心的厂商就是想想尽办法的让你自愿的消耗头梗,要么就是一次性不改完,要么就是改了跑不起来, 总之呢,就是把大数据割韭菜那一方面全部用在了这上面了。想他是这么计算的,你要花大概 五块钱的头肯,你这个功能就能改好了,如果你功能比较大,他做一个预算大概是五十块的头肯就能改好。所以都说用 ai 能提供效,所以都说用 ai 能提升效率,但是我们玩不过这帮 提供头肯的,他能用他的精准的割韭菜算法,能把我们割的不要不要的。你们有没有发现你们的头肯也是这样子, 反正能一次改好的,他尽量不给你一次改好,总要你多对话几次,至少呢,上下文讲了那么三三两百行的废话,再给你改那两行代码,可能大家已经习惯了之后,就慢慢的被这个行为给侵蚀,最后面你发现 以前很好用的,后面发现他总要消耗那么多的量才能变得好用,以前被大数据杀熟,现在被投更算力 ai 杀熟,所以加油,我们又能怎么办呢?

在我了解了这个通会是怎么被消耗的这件事之后啊,我最大的直觉是,我觉得未来的程序员很可能会两极分化, 分为有钱的程序员和没钱的程序员,分为富程序员、穷程序员。你想啊,有钱的程序员,他能够使用最先进的工具,使用最先进的模型,然后去创造出更好的产品, 然后去赚更多的钱。而没钱的程序员,他分为两类人,一类呢是打工人,他使用的是公司提供的免费 ai 工具,一般都不咋地。第二类是创业者,他需要是自负盈亏,如果他的商业模式跑起来了,他就是一个有钱的程序员, 如果他的商业模式没跑起来,那么他需要承担 ai 编程的高额费用,很有可能会入不敷出。 因为 ai 编程和我们平时使用拆一批聊天不太一样啊。一百万头肯,如果你聊天的话,你可以聊个几百次,能用很长时间,但是你 ai 编程,你让 ai 去分析一个功能模块,就有可能会消耗几千到几万头肯, 如果你让 ai 去分析一个完整的项目,全量代码几十万,上百万投坑代码还没开始写,几十块钱就没了,玩不起。我希望我这个直觉是错的,你觉得呢?说说你的看法。

因为 ai 滔氓这个词呢,算是火遍全网了,有人说囤滔氓能暴富,有人说场外交易能赚个差价。先等一下,国家安全部已经盯上了,这个事情给我们提醒了, top 到底是什么呢?说白了,它是 ai 大 模型处理信息的一个最小的单元,你用 ai 写作、修图、剪辑,消耗的就是它,它还能当数字身份凭证。比如说你微信登录第三方的一个小程序时的那个验证码, 本质上也是一种掏坑。简单说呢,它是一个工具,不是投资品,但是有人偏偏就盯上了它。骗局呢,主要有三种,一呢,是有人在公共 wifi 下悄悄的劫获你的掏坑,直接盗用你的账号,转走你的钱。 二呢,是伪造 tok 套取你的身份证号、手机号等隐私的一个信息。三呢,也是最常见的,就是打着 tok 理财资源挖矿高收益回报的旗号,直接骗你的钱, 情节严重的还可能涉及境外数据的一个窃取,危害国家的安全。那我们要怎么样保护自己呢?记住三点,一, tok 是 凭证,它不是资产, 任何人跟您说囤掏可能赚钱,直接拉黑。二呢,是用正规的平台,别在公共的网络下做任何敏感的一个操作,开启双重的一个验证。三呢,是遇到诈骗或者是信息泄露,立刻就向有关部门举报。 新技术来了,机会是真的,骗局也是真的,保持理性才是我们普通人在 ai 时代最值钱的一个能力。

我们和 ai 一 样,每天都在消耗 token, 他 们的 token 通过支付货币获得,而我们的 token 存量与前几天的状态有关,但是总会存在一个类似十万的上限。 每日天光一亮,便得开始扣费了,去食堂排队买包子,或对付几口寡淡的饭菜这些维持一副皮囊的开销。月末一万 token 便悄无声息的去了。这是活着的税,没得商量, 接着便要开始与人的周旋了,在宿舍说些不痛不痒的话,在微信群中看些无关紧要的消息,在那些社团活动中消耗如流水般的精力。这些还只道是寻常,若是遇上那些小组作业的 ppt 和凡人的拍摄作业,怕是要折损两三万的托克。 余下的也应该做些正经事了,去教室听有些催眠的课,在图书馆站那 b 字的作,或者写些不知所云的论文,于是你的托克就被那些所谓的正事瓜分殆尽了。 到了夜里,躺在床上,你总觉得累,仿佛被抽干了力气。你回顾这一日,却想不起到底做了些什么,而你 token 的 账户上却只剩下了一个可怜的数字。你开始疑心今天到底是活着,还是仅仅在消耗固定的 token。 后来我才明白,我们之所以疲惫,并非因为我们做了许许多多的事,而是每个人的 token 质地不一样。 有的人十万 token 很 耐用,每一分都用的恰到好处,而有的人,比如我,不知道该做些什么,于是 token 便不够用了。