你绝对想不到,现在用多少 token 要被写进工资条了。在最近呢,英伟达大会上,创始人黄仁勋亲口宣布, token 会成为未来工程师薪资的一部分。而在咱们国内呢,阿里也被爆出在向员工提供 token 额度, 释放了一个什么信号呢? token 这个 ai 世界里的最小计量单位,正在成为硬通户。可能还有人没有概念啊, token 到底是啥?简单来说呢,它就是 ai 理解世界的最小单元, 因为 ai 的每一个问题呢,这背后都是 token 在燃烧。那进入二零二六年,我们正式进入了龙虾时代, ai 从能疗变成了能干活,它的消耗速度也是直接起飞。 给你们看两组数字,第一组呢,截至二零二六年二月,中国日军 tok 消耗量达到了一百八十万亿,二零二四年初,这个数字呢,还只有一千亿。第二组,截至三月十五日,中国 ai 大模型的周调用量达到了四点六九万亿, token 连续第二周超越美国。都说未来得算力者得天下,但是现在更准确的说法是,得 token 者得天下。而现在咱们中国的 token 正在悄悄畅销全世界, 这凭啥呢?从价格上来看啊,这简直是降维打击,中国模型的定价有多狠呢?同样是百万 token 的输入,咱们这边是零点三美元,而国外呢,是五美元,差了整整十七倍。就在某一周,全球前十的模型总 token 的消耗量里啊,中国模型占了百分之六十一。 老外们嘴上不说,但是身体很诚实,都在用咱们的 token, 那为什么我们能这么便宜呢?核心就藏在一度店里 token 的成本里,算力和电力占了超过百分之七十。便宜又绿色的算力啊,是我们的核心优势。中国的风 电光伏装机量全球第一,庞大的盘子摊薄了单位成本。过去一度电出口会受到物理电网和地源主权的限制,最多呢,卖五毛,但作为偷看出口,能卖出约十一块钱,是直接卖电的二十二倍。而且还把过去令人头疼的绿电销纳难题给解决了,变成了高附加值的数字产品。 不过啊,偷看出海这么火爆,其实也不全是店里的功劳,我们的 ai 大模型,技术能力提升也非常的关键, d、 p、 c 可通一千万,这些国产模型在国际权威榜单上长期霸榜全球,掉量排名前三的位置,被中国模型包揽。说到底啊,技术过硬才是人家愿意调用的前提。
粉丝243.7万获赞6322.8万

账单来了,账单来了,兄弟们,二月二十四号开始用小龙虾,第一天的免费额度一千一千千是一百万,一百万个 token 第一天就烧完了, 然后从二十四号到二十八号用了。 哇,这是多少?一万千一千万个头肯,然后多少钱呢? 钱在这里,三十五块钱啊,总共花了三十五块钱。三十五块钱,小助手给我干了些什么事情呢? 就是这个女人形象,还有这个小龙虾形象,还有这一个小虾形象,就这么五天,小虾就干了这么点活, 花了三十五块钱。这个 open claw 你 说好玩吗?也没什么好玩的,费钱不?感觉好像有点费钱。

非常讽刺的事情来了啊,有一个非常知名的啊,视频博主,他在自己的社交媒体上发布了一条视频,然后在各个标签啊发布的时候,在各个标签和说明上都打上了,用 ai 生成, 然后评论区就炸了啊,有说,哎,第几秒的时候这个出模了啊,然后第几秒的时候呢啊,这个就是非常的这个真实感非常的差,是不是模型用的不对? 甚至还有人说啊,就是啊,到底是 ai 生成的,这 ai 的 味道非常非常的严重。但其实打脸的时候到了,这条视频是这个博主完全是真实 拍摄,真实记录,真实的剪辑。那为什么会有这样的现象产生啊?这个其实不难理解,这个其实是我们人类对于危机到来之前一种自我的保护机制和自我的保护意识的一个本能条件反射。 那其实一个人一周时间啊,我们算一个正常人,一天他其实可以讲七千到两万个单词 转换成 talk 的 话呢,差不多是在啊,两万到三万个 talk 一 周时间,一个正常人效率高一点的,他的说话包括写作的文字输出的 talk, 最多是三十万个 talk, 但要知道三十万个 talk 用 ai 大 模型的话,半个小时其实已经把它输出完整了啊,可能他给你的结果会比人思考的更好,因为他考虑的方向会更全面,毕竟人类的思维和思考的角度都有一定的这个维新和自己的主观性。 那一进大学的话呢,我们第二块要教的就是个人的这个啊,对于 ai agent 产品的这个搭建能力, 没有任何写代码的基础,像我一样如何一根网线,一台电脑,然后 web coding, 纯 web coding 用 ai 的 工具啊,像 coco 啊或者说 clock code 啊啊,直接戳出一个 ai 产品来,然后再把它部署上线,并且教会你怎样 样去能启动,去做营销,去把你的这个 agent 推广出去,让它真正的成为一个能够服务你的一个产品。还没有报名的同学可以啊,评论区六六六,然后私信我,抓紧。

以后过年过节,可能流行送的不是超时卡、加油卡了,而是 ai token 卡。找工作福利待遇里可能写着月薪两万,外加每月五百万 token 去送礼呢。送一张顶级大模型按年 token 卡,对方可能比收到两瓶茅台还开心。 别觉得我是在瞎说,最近有一个很有意思的新闻,国家超算互联网出手了,直接给 openclo 龙虾用户免费发一千万 token。 这意味着就像刺激消费给大家发消费券一样。为了鼓励 ai 使用,国家队已经开始往大家手里发算力代金券了。 以前提到算力,感觉跟咱们普通老百姓的生活关系不大,但现在它越来越开始像水电煤气一样,变成一种能直接发到个人手里的资源了。 未来, tocan 可能就是一种硬通货。原因很简单,我们现在用 ai 写方案、做表格、剪视频,尤其是龙虾这类 ai 工具越来越普及之后,只要开始用 ai, 背后全在烧 tocan。 ai 一 旦成了生产力工具, tocan 就 不再只是个技术词,就会变成一种人人都会用到的基础资源。

token 究竟是什么东西?为什么给它汉化成词源?还有大模型公司都在说消耗 token 就是 在烧钱,但还是想用户在它的大模型里消耗,那这个词源究竟啥意思? 用通俗大白话来说,我们和大模型聊天发送一段话,大模型读文字,不是一个字一个字读的,它有一个专门的分词器,呃,会把你说的一段话切成一块一块的,每一块就是一个 token。 就 例如这段话,它的今天和奖励和自己和了吗? 是分成了四个 token, 也就是四个词源。举个例子,就好比你去一家餐厅吃了一百次饭,服务员已经记住你了,你一坐下,他不等你开口就问,还是老样子红烧牛肉面,因为这个组合出现的频率太高,已经被他打包成了一个整体记忆。 但如果你哪天突然点了一个他从没见过的冷屁菜,他就只能一个字一个字的确认是这个菜吗?分词器就是这个服务员常见的组合,直接整体认, 罕见的组合只能逐字拆,整个词汇表,就是他脑子里积累了几十年的老客户点赞记录。再比如,这段话在大模型里可能会被切成这个样子, 前三个字是一个头啃,然后单独的一个字是一个头啃,包括这个标点符号和后面这个英文单词也是单独的一个头啃。再例如,你给朋友发消息打了五个哈,即使你不是在认真打五个字,你大脑直接把这串字当成一个情绪来处理, 它等于我现在很开心。分词器也是这个逻辑,它统计了海量文字,发现,哈哈,这个组合出现的频率极高,就把它打造成了一个 token, 但五个哈不常见,就会被切成两个 token。 所以 同样是哈,数量不同,消耗的 token 也不同。 这里有个网站可以看对话的 token 数量,我们来看看。例如诸葛亮,他是只消耗了一个 token, 然后再来一个司马懿,他就会显示消耗了是两个 token, 因为前面两个字是一个姓氏,然后后面那个字是单独出现的,出现的频率没有那么高。所以在 deepsea 里面,他显示的是两个 token, 包括刚刚的,呃哈哈哈哈哈 啊,五个分成了两个头肯,四个就是一个头肯,三个也是一个,两个也是一个,包括吃了吗?两个头肯包括马。再来一个马到成功消耗的是三个头肯,他的马是一个,到是一个,成功是一个,再来一个。今天 奖励自己了吗?这是我们刚刚开头的那一段话,它是分成了四个头肯,这里还有个今天奖励自己了吗?这是一个今天奖励自己了吗?就是同样的语义, 中文 token 消耗远低于英文,因为中文一个字甚至两个字就能承载一个完整概念。英文是拼英文字,一个词需要靠多个字母拼出来,分词器切的次数自然更多。同样的语义, 英文需要一千到一千二个 tock, 中文只需要五百到七百个,几乎省了一半。举个例子就是今天很开心在中文里是两个 tock, 然后换成英文的话,嗯,这句话换成英文就消耗了六个 tock, 是 中文的三倍。 然后为什么数据局把 token 汉化成词源?词源这个翻译很精准,拆开来看我们就懂了。先看词词,说的是 token 的 内容属性,它是语言的基本单位。不管是一个汉字、一个词语、一个英文词缀,还是一个标点符号, 都是语言里有意义的最小片段。这个词告诉你, token 不是 随机切出来的碎片,它是有语言含义的单位。再看源源,说的是 token 的 地位属性, 它是基础的、最小的、不可再分的单位。中文里的元这个字天然带有根本起点基础的意思。比如元素单元、货币单元。数据局把 token 定义为智能时代的基础单元,这个元用的非常到位。所以数据局把 token 叫做词元, 其实是在用一个中国人最熟悉的计量单位来做类比。就像你买东西要花多少元,用 ai 要消耗多少磁元,这两个元背后是同一种思维,把复杂的东西量化成一个可以数、可以计价的最小单位。 而且消耗托管本质上是在消耗算力、电力和内存,消耗的是现实世界的能源。那为什么这些大模型公司烧钱也要抢用户量?因为用户量本身就是最核心的资产, 上线抢用户量,是在抢未来的定价权和数据权。现在很多 ai 服务是免费或者极低价的,本质是在用补贴换市场份额,等竞争格局稳定下来,剩下的几家头部公司才会开始真正收费。到那时候,谁的用户基数大,用户依赖深,谁就有定价权。 这就跟当年网约车烧完补贴之后开始涨价是完全一样的路数。很可能在未来世界里,每个人做年终记账时,不再是今年你花了多少钱,而是今年你消耗了多少 token。

那边还有 token 吗?借我一点二十万就行了。晶晶已经给你两次了,你不能这样下去了,你要靠自己,不能再靠 token 了。 自从用了 ai, 我 一个人要做之前十个人的工作,我不用头肯,难道真的让我自己一行一行写吗?给我头肯,我的头肯没了,给我头肯让他再生成一行一行就行。求你了。 我觉得对不起离开的伙伴们,他们其实一直都在陪着你,他们离职后都化成了你一直在用的 token。

嗯,哈喽,大家好啊,今天呢咱们给大家讲一个最基本的概念叫做 tool 啊,最近的话,咱们国家的数据局把这个词给它翻译成呢叫词源啊,我觉得这个翻译呢,其实是非常准确, 因为在实际的这个讲课的过程中的话,我一直也是把这个词呢翻译成当成这个词源用词源,而且这个翻译当然不是我来翻译的啊,这个是呢,在一个圈内,咱们其实已经用的非常多的通用的一个词, 那么这个 token 呢,这个词啊,除了被翻译成词源以外的话,当然其实还有很多种的翻译啊,比如说包括有些通俗的翻译成什么令牌哎,代币 啊等等呢这些词,那么这些翻译成这些词的话,为什么咱们这次国家数据局要把它做一个完完整整统一呢?而且我觉得个人觉得啊,这个词呢,其实翻译的是非常的一个准确啊,今天呢咱们就来 来聊聊啊,就是这个词这个 token 呢到底是什么含义?以及呢,咱们为什么要把它翻译成这样一个词? ok, 嗯,首先呢咱们这个大模型呢, 它在处理各种各样一些信息的一些文本信息的时候,咱们计算机呢是没有办法直接呢去理解的啊,这是第一个问题。第二个呢,咱们呢实际过程中我们的这个语言呢,它包含了有很多种,比如说, 哎,咱们中文、英文、法语等等,哎,不同的这个语言呢,它的一些特点有些不一样哎,比如说呢,像这个英文的话,它是有天然的这个分格, 有空格,是吧?天然去分格的,那咱们这个中文的话,甚至包括像日语这些这些的话,它是没有这个天然分格的啊,每一个字啊,它要组合起来的话,它承担这个语义信息不一样啊。比如说咱们中文里面, 通常情况我们现在这个汉语里面一个字的话,通常已经不承担真正的一个语义了,我们要把它组合起来变成一个词,是吧?有些呢一个成语可能是四个字,一个歇后语的话,可能呢词的含量会更多,是吧?那么也就是每一种语言里面它包含这个词的信息最小,这个单元不一样 哎,于是呢,咱们大模型呢,要处理这种多语言的时候,就涉及了一个问题,我把最小的这个处理单元, 欸,叫什么?这里面就叫做 token, 就是 我们要对输入的一段文本内容啊,咱们要做一个分词, 在一,在我们技术上呢叫做 tokenizer, 欸, tokenizer 做完以后,每一个的独立的语,这个语义的最小的一个单元呢,就叫做 token 啊,所以说这个就是 token, ok, 就是 token 呢,就是承载了欸最小的一个语义单元。 那么对于中文里面,咱们为什么要把它翻译成元哎元呢?其实在这个中文里面呢,这个词的丰富性呢,非常多, 比如说,对吧?咱们在这里面的话,有一个在化学里面,我们有一个哎,组成物质最小的一只嘛叫元素哎,咱们除此之外,其实我们在这里面还有一个叫什么元元气,元气,或者说呢,咱们叫是吧?犯罪的这个凶手叫什么叫元凶? 一年最初的一天,咱们叫做元元旦,是吧?所以说元旦它其实呢包含咱们这里面的根本基本 啊,或者最初的这个含义,所以说这个元的这个含义呢?哎,感觉这就是非常的一个准确啊,包括咱们在计算机里面,我们使用这个,呃,有一些最基础或者最原始的一些数据啊,我们叫做元数据, 哎,所以说大家看看这个圆这个词的话,就非常的一个贴切啊。但是呢,咱们这个大模型里面,他拆成了一个个文本片段,他跟我们实际用的这个词啊,他又有点不一样,所以说呢,我们把这个大模型能够处理的 最小的一个词的单元叫做词元,哎,就是词最小的这个余单元。 ok, 好, 那在这里面咱们就说清楚了,这个词元是什么意思呢? 那么有的人肯定会说,哎,那我为什么咱们不能够把它拆成一个个中文的这个字呢?这行不行? 当然从技术上可以实现,但是带来一个问题是什么呢?我们不仅仅只能够考虑咱们的中文的生成或者中文的使用,咱们还得考虑多语言的场景。那如果说咱们要把多种语言 全部都当成一个一个的字,哎,一个个单词啊,咱们都把它塞到大模型的这词表里面去以后,就会带来一个问题啊,大模型的词表非常非常的庞大,大模型的词表又庞大,以后呢,导致呢咱们这个大模型啊生成的这个速度啊,就会非常非常的慢。 那于是呢咱们就要想个办法,哎,我既能够考虑到多语言,同时呢我能够做一个拆分呢, 能够考虑多元,同时呢咱们拆分,哎,我能够保持呢咱们最小的这个语义的这个信息,哎,词表呢又不会大,于是这里面呢就有了一些哎分词,或者说咱们叫做 tokenizer 的 一些算法。 ok, 那 么如果说感兴趣的同学啊, ok, 可以 在评论区咱们打下来, 咱们呢可以留言,如果说对咱们这个分词这个算法呀,或者怎么去分感兴趣同学大家可以留言,那么我们到时候的话也可以,哎做一期专门这个介绍这个分词的这一些算法。 ok, 好, 那么在这里的话,咱们这个视频里面就给大家说清楚了这个词源是什么含义,哎,就是咱们的大模型处理最小的这一个单元。

大家现在各种龙虾养不起啊,但是都在说一件事, ok, 太贵了,太费钱了啊,有的小伙伴说跟他说了个你好,五块钱都没了啊,但是我们还是有些技巧能够让养龙虾的费用给降下来的,我自己从一天两百多美金,三万的费用已经降到了几十美金之间,我懒的时候就剩个十美金左右。 好,下面是三条养龙虾省 token 的 技巧啊,一定要点赞加收藏啊!接下来第一个呢,叫善用命令行,那什么叫命令行吗?就是这个龙虾在设计的时候啊,它是有几个特殊的命令行的,这个命令行是不经过大模型直接发挥作用,它是直接跟龙虾驻留在电脑上程序发生交互的,所以首先它本身不消耗任何 token。 第二呢,他的优先权是高于大模式,所以啊,你看我为什么打的你好啊,有时候就会一下子消耗那么多。因为龙虾每次在跟你聊天时候,他要把各种的记忆给装起来,比如你是谁,这个有什么规则要他遵循的?还有刚才你们聊了什么,都装在他的这个 memory d m d 记忆里,所以他记忆就会越来越庞大。你一跟他说个你好,他几十万字先来想一遍,再跟你说话,每句话都想一遍,你说这 top 不 就飞起来了吗?所以呢,这个斜杠命令符呢,有几个大家一定要记住啊,一个是斜杠六,斜杠六是干嘛呢?就是横写对法, 之前的很多对话里的上下文他都不要了,就是他不用想那么多事,只要知道主人谁,我在干嘛,所以这是很能省筹难。那还有什么斜杠 restart, 那 这个秘密就厉害了,经常有的龙虾不理你,你也不知道他在干嘛,或者说个你好就消耗上下文太多。斜杠 restart 相当于把整个龙虾给重启了,不管他在干什么, 这个命令是特别高优先级的,他只要把这个 user 点 m d 还有搜点 m d 读进来,就可以可以开始对话了,随时有大量的节约。还有个叫斜杠 stop, 就是 有时候你跟他布置的很长任务,还是来回想,我觉得他想错了,想错了怎么办?那么你打个斜杠 stop, 他 停下手头任务来响应,把前面刚才要划的头很线省下来。还有个斜杠 compress 对 你的记忆啊,不管怎么样,他他还是要记啊,用 memory 点 m d 当记了很多以后,这个一说话就是几百 k 几十万字在里面的时候,但记了很多以后,这个一说话就是几百 k 几十万字在里面的时候,但他压缩一下他的记忆。 至于怎么压缩,你不用管了,大模型帮你压缩好,压缩就大事都记得,小事不记得再说,再去找之前的记一下。所以这几个斜杠命令用好了哈,是能够帮你非常有效的省很多。 tok 的 第二个技巧叫什么?叫做能用程序搞定的不要用大模型搞定,啥意思呢?就有时候你布置给容下一个任务, 他就开始给你想了,噼里啪响一堆,然后给你自言自语,那燃烧的都叫 tok 的 最好办法,什么就有的事你让他做完一遍以后,你马上让他写成代码,说你下次先运行代码,代码代码不行,大模型再上。 代码是不消耗托盘的,在你很多重复任务的时候,你首先问大模型怎么问的,就是你能不能把它写成段代码,写成脚本,写成点 python, 让他去写成代码去帮你干件事, 这代码一旦形成,你再跟他说继承 skill, 这样的话他下次就直接掉代码。那我举个例子,在外有一天没怎么跟他聊天,花了我一百多美金,我说这怎么花的,大哥给我看看, 有他去看说,哎呦,当时我们有个团团邮局,就是他们那个龙虾煎饺的邮局,互相学习东西,我为了快速学习,我五分钟检查一次邮件,就每次检查消耗好多 top, 今天的 top 全消耗在这。我说大哥,你检查邮件为什么要你自己亲自上呢, 对吧?你是个大模型啊,检查邮件让脚本上啊,脚本发现有新邮件,你才上没五分钟,拿大模型去跟着邮箱接口对一遍,读读有没有新邮件,这完全没必要啊,我说这个能用脚本就不要让大模型自己上, 我都变成了这个我们家三万的一个规则。这也是你和你家龙虾达成一个工作默契啊,因为程序代码写好了,他跑只消耗 cpu 资源,不消耗它,尤其在这种多次重复的任务里面, 对吧?你一定要跟大漠星商量,怎么能够用脚本去检查,比如刚才那个邮件检查,包括有的人喜欢看新闻简报,对吧?其实很多地方都是用脚本去完成的, 你跟他多讨论讨论啊,帮你省钱,头肯就省住了。第三个秘诀啊,叫用好不同版本的大模型,各司其职,什么意思呢?就是今天对吧?真正贵的是那些海外大模型,顶级大模型那真叫贵啊, oppo 是 真好用啊,那一说话我也心疼啊, so, mate 也很贵啊, 但是呢,你的很多任务是不需要这么贵的模型。其实我们今天的国产大模型便宜又好用,价格低,量又足,在完成大部分任务时,他们足够用。 比如说你要看份新闻简报,要做一个什么网页模板,那怎么办呢?有几个方法,一个方法就像我们家三万呀,形成一个叫多 a 镜的团队,就从一个龙虾变成多 a 镜。怎么变成多 a 镜呢?我们三万龙虾日记有奖,也可以去我们的三万点 a 啊,去看多个 a 镜的,就相当于你一只龙虾变成多个角色。有的任务那必须贵的上,比如说今天写程序,写代码,可能 还是某些模型好,但是在整理简报啊,搞一个报告给你啊,做一份调研啊,甚至搞个 pdf 文档啊,让他用国产模型。我跟三万就商量了,我说每天我在网上看资讯,这资讯我们起一个叫爬虾,用最便宜的模型, 国产模型几个都不错啊,随便上一个,每三十分钟给我检查一遍。哎呦,这个费用从几十美金一下到一天就几美金,便宜太多了,效果也很好。所以这是一种就是多 a 件,然后在不同的任务中给他分配不同模型。还有一种是什么呢?就是说其实我家三万,我们公司很多人跟他聊, 后来我发现,哇,每人一聊,我的头壳就就烧起啊。后来我跟三万聊了以后,知道他在不同的对话里面是可以用不同模型的。 哎呦,我听着这可太搞笑了,我说这样三万,除了跟我聊啊,你用这个最好的模型,你跟我们同事聊,用一个便宜又好用的模型就行了,因为本章是收集同事给我的建议嘛,对吧?你只要把这个应用带回来就行,传递员,这个不需要那么高文化程度,只要把话如实带回来就可以。 所以跟不同人聊起不同模式,这里面还有第三条路是什么呢?就是你要知道我们的龙虾在调用这些任务时候,他是可以启动贼镜,他自己就可以启动,你说我配置多一件,他很麻烦,那没关系,你就可以指定某一个任务用什么模型,比如说我现在要一个什么关于三幺五主题晚会的简报,你现在启动个贼镜帮我干,你用什么什么模型,直接给他起定, 他就用那个模型去干,对吧?所以你有多种方法用多个模型会用的方式来降低你的托克,好吧,这就是我啊,这个滑雪,这个摔伤,在家半个多月啊,总结的各种这个沈托克的秘籍啊,你听懂没有?点赞收藏啊,以后给你们带来更多的养龙虾技巧。 刚刚那段沈托克视频是我一个人坐在轮椅上面。坐在轮椅上面啊拍的,我现在是一个人轮椅走天下,正好体会一下残障人士,虽然我是临时残障人士这个无障碍通道整个社会给予的关爱, 整体来说,我现在觉得还是很 ok 的, 人间处处有真情,人间处处充满爱。我会把一个人轮椅走天下的过程到时候也剪辑出来跟大家一起分享,敬请期待。养龙虾就用 ecclo。

投 ai 不 赚钱,核心都在偷坑里。 ai 周条用量暴涨至七点三六万亿,偷坑两年翻一千四百倍。这条视频讲偷偷看赚钱逻辑,结尾彩蛋拆解底层本质,看完才能抓牢这波红利。 把 token 理解成 ai 世界的人民币,和 ai 对 话, ai 生成的所有内容都按 token 计费,它的调用量就是 ai 行业的真实 gdp, 直接决定谁能兑现红利。重点来了,七点三六万亿天量调用,直接带火!三个确定性最强的核心受益环节。 第一家,昆仑万维天宫大模型,国产出海龙头 tucker, 调用量国内第一梯队,直接享受 tucker 的 红利变现。第二家,浪潮信息,国内 ai 服务器实战率超百分之四十, tucker 运算的核心算力在第三家,江波龙,国内企业级存储, 海量偷看数据的核心存储。在这三家,就是偷看红利下最确定的受益标的。但只懂这些,抓不住长期机会。彩蛋讲透偷看的真正本质。一九零六年,逻辑学家皮尔斯提出偷看的概念,本意是传递信息的符号信物。 计算机时代,他成了人类语言的翻译官,把自然语言拆成机器可运算的最小单位。他是 ai 行业最底层的印钞机。 下一期拆解,偷看核心粮仓存储新的翻倍机会。想抓 ai 赛道确定性机会?关注我,更新第一时间提醒你!

嘿,朋友们,今天咱们来聊一个特关键,但很多人又搞不太明白的概念, token。 你 要是想看懂 ai 的 成本,速度,还有它的能力边界,那搞懂 token 就是 你的第一步。来,咱们把它掰开了,揉碎了,讲清楚。来, 问你个问题,你跟 ai 聊天的时候,是不是觉得它跟你一样能看懂人工智能这四个字?嗯,其实吧,完全不是那么回事。在 ai 的 世界里,根本就没有什么文字,只有一堆拼来拼去的恶搞积木。 这种乐高积木啊,它有个学名叫做 token, 中文叫词源,你就可以把它理解成 ai 思考和说话的最小零件。记住这个核心啊, ai 不 认识字,它只认识 token。 好, 那问题来了,这块积木到底是个啥样?它跟我们平时说的一个词是一回事吗?你看,这就有点意思了。 从我们的角度看, unhappiness 是 一个完整的词,对吧?从 ai 的 角度看,他会很聪明地把这个词分成三块积木。 unhappy 和 ness, 中文也一样,人工智能,他可能会拆成人工和智能这两个头衔。这样做的好处是什么呢?就是模型会变得更加灵活,技能 word, 常用词,也能通过拼接去理解他那些他没见过的新词。 既然 token 这么神奇,那它们到底是怎么被生产出来的呢?这家提到一个算法,叫做 b p e 字节对编码算法。现在大名鼎鼎的 g p t 系列模型,用的主要就是这种方法来制造 token 的。 它的生产逻辑说白了简单又高效。第一步,先把一整篇文章打造成最最基本的单个字母或者汉字。第二步,在这里面找,看谁和谁最长挨在一起,比如 a 和 n 老是同时出现。第三步,好, 那就把 a n 合并成一个新的积木,一个新的 token。 最后一步,不停地重复这个合并过程,直到 token 的 仓库里装满,比如装满了五万块不同形状的积木为止。 好了,了解了 token 是 啥,也知道它是怎么来的了,现在咱们聊点最实际的,这东西为什么这么重要?它和我们每个用 ai 的 人到底有啥关系?重点来吧! token 可以 说是 ai 世界里的硬通货, 首先,它决定了你的钱包,你每次用 ai 服务花的钱就是按你输入和输出了多少个 token 来算的。其次,它决定了响应的快慢。咱们常说这个模型快不快,衡量指标就是它每秒能吐出多少个 token。 最后,它决定了记忆力, ai 能进入多少你之前的对话,它的上下文窗口容量,也就是用 token 的 数量来算的。 没错,你每一次和 ai 互动,背后都有一张用 token 计算的账单。咱们来看一个真实的例子,你就能感受到所谓的 token 效率是怎么影响钱包的。你看这张图,两个模型, deep seek 账面单价是零点二八美元,每百万 tokens g l m four, 它的账面单价是输入,输入是零点一五美元,它的输出是零点六亿美元。 再一看 deepsea 是 不是要比 glm 四便宜多了?但如果你观看标价就做决定的话,那很可能就要掉进坑里了。 咱们再来看外星人干同一个活,跑一千次任务下来, glm 大 约用了八十二万个 token, deepsea 用了快一百五十万个,这下你发现了吧,虽然 g l m 单价贵,但因为它用的 token 少,效率高,最后算下来总成本几乎没差,这就是核心差异,干同样的活, g l m four 能用少百分之四十五的 token, 这说明它的回答可能更精炼,绘画更少。 所以大家一定要记住,一个关键节目的 token 的 效率往往比 token 的 单价更重要。我给大家总结了以下三点,记住, token 是 ai 计算的基本单位, token 的 数量直接跟你的钱包挂钩,选模型时别观看单价, token 的 效率更关键。 所以下次你选 ai 服务,可以先拿个小问号考考看哪个消耗的 token 更少。平时写提示词也尽量简洁精准一些,少点废话也能帮你省下不少 token。 最后,有一个开放性问题给大家思考,既然 token 是 ai 的 语言,那你想想,当 token 变得越来越聪明以后,他们会不会为了追求更高的 沟通效率,干脆后面一种我们文外完全听不懂,但他们之间交流起来超高效的构想语言呢?这可不只是科幻片语的细节,已经是科学家正在研究的方向了。关于这个,你怎么看?

现随着 ai 应用的遍地开花, ai 的 talk 消耗量越来越大,甚至有人开玩笑,今天赚了多少个 talk, 还有一个应用场景,大家每天在使用 openclo 的 时候, 它的消耗量也是非常惊人,今天为大家分享一种方式,可以白嫖 talk, 而且它不是那种小模型,而是我们国内的 gim 五, 接下来我们看一下如何使用。哈喽,大家好,这里是二 pop openclock, 相信大家现在已经人手一只了吧,但是它的 talk 消耗量就非常大,今天我们分享一种可以免费获取 talk 的 办法,这就是互联网大善人英伟达免费开放的, 之前我也在公众号分享过,今天我们来手把手实操一下。我们打开英伟达官网的模型列表,大家可以看到这里有各种各样的模型,像千万三点五,还有智普五点零, 还有 kimi 二点五等等,这些都是可以免费试用的,使用方式也非常简单。我们先点击这里的注册,当然在这里注册的时候,我们要注意一点,我们要使用海外的邮箱,就比如 gmail 或者是微软的 outlook, 不要使用 qq 邮箱,这种是没法通过的,我已经给大家试验过了。 我这里粘贴我的谷歌邮箱,点击下一步,这里输入你觉得合适的密码,我们点击创建一个账户,这里他会给你的邮箱发送一个验证码,输入验证码,点击继续。这里是按选择是否接受通知,我们直接提交就可以, 没有任何影响。这里输入一个名字,这里也没有任何限制,直接输就行,这时候我们就注册完成了。回到了这个页面,大家可以看到最上边有一行,请验证你的获取 api, 我 们这里点击一下验证, 这里验证是需要输一个手机号的,这个手机号我们也试验过,输入国内的手机号,也就是加八六的,前面我们选择中国 china, 这里我们输入八六,这里我们选择中国。以后输入一个我个人的手机号,点击提交,这时候你的手机就会收到这样一条验证码, 是优速通发的,我们输入进去,点击验证,可以看到这里基本上是秒通过的,我们在这里随机选择一个模型,就比如智普的这个五点零, 然后点击这里的 welcome, 这里获取 api k, 可以 看到已经能拿到了,接下来我们验证这个 api k 到底可不可以用呢?在之前我分享过一个很好用的工具, cherry studio, 就是 这个樱桃的,它是一个开源项目,我们可以在 github 上直接下载到,然后在这里测试一下这个 api k 到底可不可用,我们点击左下角这个齿轮, 这里选择添加模型供应商,我就添英伟达下面供应商类型,我们选择 open ai, 点击确认,这里需要填密钥还有地址,我们粘贴 api k, 粘贴 url, 添加模型,这里要注意这是英伟达自定义的一个模型名称,就这个 z 杠 ai glm, 我 们拷贝过来,点击添加,这时我们打开对话试一下, 这里要注意模型切换,我们切换成刚才添加的,因为答的这个 z a i g m i 五,我们问它是什么模型,看一下它的反应,这里因为我的网络问题,可以看响应速度稍微有点慢,但是它是完全没问题的,可以看到它是由 z 点 ai 训练的大约模型,然后是 g a m, 这时我拿到这个模型大家就知道怎么用了吧,比如我们把它绑定到我们的小龙虾,或者是绑定到我们的 agent 上,这时候就可以无限的耗羊毛了, 而且我还没有碰到过说使用限流或者是 taco 被用完的情况。大家如果需要更多的账号,完全可以按照我这个方式注册几个谷歌账号,然后并且做一个手机绑定就可以了。更多 ai 和变现的方式我们一起来研究。

最近网上有个特别火的词叫 token, 我 自己也用过好几款 ai 工具,像腾讯的那个 workbody、 kimi code 等等,他们每一次处理任务都会调用 token。 那 么我们应该怎么去理解这个 token 呢? 说白了,它背后代表的就是电力、算力、内存还有流量,是 ai 运行的真实成本。 这一段经历一下子就把我拉回到二十几年前,那个时候二 g 网络刚普及,流量特别稀缺,计算方式也特别直观,就是多用多付,少用少付。 那么放到我们采购的工作里,想要靠那个 ai 降本增效,思路其实是一模一样的。 我们在替公司选那个 ai 服务三的时候,重点看两个核心因素,第一, 电力、算力人工成本不同,直接决定了它的基础报价。第二,算法效率不同。好的算法就像一台省油的发动机,同样的是消耗更低,成本更少。 企业在选型时就可以按照这两个维度去比价和筛选。同时我们还要针对这种新的工作模式,重新制定 sop, 优化每一步操作细节,这样才能真正把 ai 的 使用成本降下来。 这个领域还有很多创新空间,未来也会诞生一批新的岗位、新的人才需求。大家可以翻一翻我前几期的视频,记住,认知领先一步,你就比对手强一点点。我是小爱,关注我,下期更精彩!

兄弟们,我想问一下,你或者你身边到目前为止还有多少人没有给大模型充过值,买过偷坑的?当然你说我就是不想被当做韭菜被收割, 那你可以划走了。那我为什么要问大家这个问题?因为就在最近,阿里巴巴做了一个重大的调整,成立了一个新部门,叫阿里巴巴偷坑,哈巴吴永明亲自带队, 很多人还没反应过来,觉得不就是改个组换个名字吗?你大错特错了,这事的本质是阿里正式宣布不再靠电商赚钱,而是要靠造币和卖店赚钱了, 而这个币就是偷看。那这事对我们个人未来的职场和未来的商业逻辑会发生多么恐怖的变动?首先第一个,你职场的考核标准要变了, 以后的企业都会装上 ai 操作系统,里面有成千上万个人工智能助手,也就是我们说的 ai 智能, 他们给公司写报告,做方案,做决策,关键这些助手不睡觉不吃饭,他们只吃一样东西,就是偷看,更关键的是买偷看比发你的工资要便宜多了。 那请问各位,你觉得老板是会选择你这个手动搬砖的员工,还是会选择这些不睡觉不吃饭的助手呢?第二个,商业逻辑的颠覆。 当托克变成了全球通用的商业单位,所有的业务都会被重构。阿里的这次重大调整就可以看出来,过去你卖的是货, 以后你卖的是计算过程本身。因为每调用一次模型,每让 ai 做一次决策,背后全是偷坑的流动。 这不仅仅是阿里的转型,这是整个互联网秩序的一次大洗牌。吴永明说了,现在是 agi 的 爆发的前夜,说白了就是旧秩序崩塌的前奏。 如果到现在你还没给 ai 大 模型充过值,哪怕是八块十块的,那说明你还在 ai 时代的大门外闲逛,更不用说去使用那些 ai 人工智能助手了。 那我直接告诉你,你的职业生涯已经进入倒计时了,别怪我说话难听,当时代的巨人撵过去的时候,他甚至懒得跟你打招呼。那下一步该怎么办呢?首先,作为普通的职场人, 你也不会编程,更不懂 ai 大 模型的开发,那就先花个八块十块的先玩起来再说,然后再逐步的去学习使用 ai 的 原声工具, 你千万别再把 ai 当做聊天机器人了,要把它当成你的数字化分身。第二个,作为老板,创业者要关注头肯消耗大的赛道,那你才是真金白银。 所以, ai 时代不缺勤奋的人,缺的是能指挥 ai 去勤奋的人。点个关注,带你看透这波吃人的趋势。

token, 大家都觉得这是个挺高级的技术名词,甚至还有人以为是搞区块链炒币的那个代币。你如果没搞懂 token 的 底层逻辑,你就根本看不懂现在这帮 ai 大 厂到底在赚什么钱。你在对话框里跟 ai 说的每一句话,它不是按一个字一个词去理解的。 为什么?这逻辑很简单,你要是按整词去算,中英文词汇量,几百万模型脑容量根本装不下,遇到个生僻词直接就蒙了。你要是按单个字猜,那完全就是碎片,没有上下文逻辑,他根本学不会。所以行业里是怎么干的?他把高频出现的连续字固定的词根打包成一个小块, 这个最小的处理单位就叫 token, 中文差不多一个汉字对应一到两个 token。 这样做既把词汇表压缩了,又保住了句子的核心意思。它其实是 ai 时代的核心消耗品, 是整个 ai 行业的底层硬通货。大家回想一下历史,第一次工业革命,机器转起来靠什么烧煤?第二次垫起革命,全世界的命脉是什么? 是电?再往后,全球经济为了抢油田甚至能打仗,对不对?现在这个 ai 时代,所有大模型跑起来烧的全是 tok? 你 觉得你是在用 ai 写剧本划分境?你觉得大厂在搞毫秒级的金融交易?无人驾驶?拨开表面看本质,每一次点击背后全是在疯狂地烧 tok。 你顺着这个思路去盘整条 ai 产业链,最底层的电力是基础能源,英伟达卖的那些天价 gpu, 其实就是生产 tok 的 发电机,那些云厂商和大模型公司,本质上就是 tok 制造工厂和批发商,而最终我们用的各种 ai 软件全都是消耗终端。整个行业的商业逻辑 掰开了,揉碎了,其实就八个字,生产 token, 售卖 token。 未来 token 的 价格绝对会像今天的电价水价一样,成为整个社会最核心的经济指标。 谁能把生产 token 的 成本给打下来,谁就掐住了所有行业的脖子,掌握了真正的定价权。你平时用 ai 的 时候关注过 token 消耗吗?评论区聊聊。

别再瞎用 openclaw 了,别人用 ai 啊,一分钱不花,你却在疯狂地烧 talk。 今天一条视频告诉你, openclaw 到底能连哪些大模型, talk 又该怎么薅?哪几个模型便宜又好用? openclaw 能连的模型啊,就三类, 国际大厂 g b t cloud, 国产头部空一千万 g l m kimi, mini max, 还有本地的 alama 开源模型,零成本啊,随便跑,想省 talk 啊?记住三招, 第一,新用户免费额度全领一遍。 deepseek 百链智普注册呢,就能白拿几百万的 token, 每月还有赠送的额度。第二,简单任务,用低价模型,复杂任务呢,再上高端。 第三,本地跑开元模型,一分钱不花,如果追求性价比,日常清量啊,用 deepseek 加千万 flash 免费额度就够你用了。中等任务呢,选 mini max g o m 四点五,便宜又稳,复杂推理直接上 cloud, 索尼 g p 四 o 迷你效果顶价格还不心疼?逻辑通了,你一个人就是一家二十四小时无人公司,关注我带你用 ai 早点下班!

在未来,你的工资条将会变成 talk。 前段时间,黄仁勋在 gtc 的 舞台上最新的演讲视频 they're gonna make a few hundred thousand dollars a year their base pay。 跟我们普通人关系最大的就是 talk 预算以后工资的支付方式就是 talk。 talk 是 ai 智能体 执行任务时所消耗的收益。意思就是说,比如工资五千加 token 给你一百万 token, 如果你能创造出三个员工的价值,那么你的 token 工资就是三个五千。

最近龙虾特别火,大家都在装龙虾,这个龙虾是消耗 token 的, 所以 token 变得也特别火,这个词就一下蹦出来了。最近就专家跳出来了,说势在必行,时间紧迫, token 必须得有自己的中文名了。紧接着新闻就出来了,说 token 的 中文名出来了,叫志源。然后我就觉得这个名字一厢情愿的起出来的, 会在专家的论文里面出现,但是永远不可能被人世间承认。为什么?他这个名字起的吧,太拗口,太书面。 token 这个词已经被大家喊得很顺了,这个时候你如果不顺应消费者的心智,你强行给他加一个姓达雅的名字,是不会被消费者接受的。多大的品牌,他要翻译过来的时候,他都必须考虑 广大人民群众市场的这个接受程度和心智的这个顺应程度。你比如说可乐对吧?然后沙发、宝马、奔驰,他全是顺着改过来的。 你现在叫 token, 你 直接叫智源,他八个打不着的发音,哎,我这个龙虾装了,消耗了多少智源?不是说龙虾偷 token 吗?他偷我的智源,我的智源跑掉了好多啊,我这个月消耗了三百块智源,哈哈哈,很滑稽,不滑稽吗? 这个真的是一个极其失败的翻译,有一个人开玩笑啊,他说偷啃,你实在要翻译,你说叫偷啃,偷偷的啃掉了我的钱包,但是这个可能比较偏负面,所以这个也不可能被用,但是我觉得这个还是蛮有意思,其实有很多很多的这个产品,他最后没有所谓的非要起一个中文的有米有馅的名字,他也存活的很好。 lulu lemon 就是 一个很忠厚的例子。 lulu lemon 的 发音可比 token 长啊。你见过有人叫 lulu lemon 的 中文名吗?市场不接受,起不了就叫 lulu lemon。 所以 翻译要性达雅,更要顺应消费者的心智。所以我认为智媛这个名字它会存在在一些论文和书籍里面,但是它永远不会被市场接受。

周六日真是停不下来了, bug 扣顶了两天了已经,现在已经花出六个多亿头啃了。我已经充了一百多块钱了,烧出了一个我觉得现在还有点不错的一个网站的,呃,和还还有一个整个的我们的类似一种聊天软件的 ai ai 阵交互方式, 然后挺有趣的。然后整个的定位呢,也比较清晰,核心的就是去找到现在 ai 最核心的协助模式,最有效的协助模式去针对你的单个的问题, 所以你给他一个问题,他找到规定的一个非常棒的 ai, 一 整套的协助模式,然后帮你交付最好的任务出来,他非常的好 token, 但是他的结果会非常好,但是他现在还是整个的这个设想,哎,不是设想,就是整个的初步的这些想法,还在刚刚搭建出一整套的这些 代码的产品呀,和官网出来我们之后可能需要还需要去研究相关那些论文,然后去研究一下包括怎么把论文落地成代码,去做好这件事情, ok, 然后昨天差不多晚上凌晨三点才睡觉,我靠,今天这个经历确实太爽了。然后我们来看一下我们的展品吧, 不知道大家每次用 cloud code 的 时候,会不会给他经常去想一些呃,角色,你比如说什么架构师啊,让他做测试啊,理论上这种角色的书实际上是想让他去干这个角色的事,并且让他充当这个角色,他就专门去做这个事, 然后我们就能够让他去单独的去承担这份劫责,然后实际上是要去实现一个流程闭环,而且呢, 每次的这种流程闭环走下来的任务其实效果最好的,但是每次这样去创建角色,我有时候根本不知道这个角色的名称是什么,我就让他自己想,但有时候他想想的其实有问题,所以说我们就制作了这个东西,就是 他能够让你直接去想到匹配到我们现在这个世界上有各种各样的可能一些角色呀,包括他们的一些固定的一些任务和工作流程上, 所以说他一次性给你创建好这个顶尖团队,然后并且放在一个类似微信的一个输入里边,让你能够看到每个人的写作来完成任务。 所以说这个东西我认为是一个非常重要的。最近用这个 webcoding 做出来的一个产品是用群聊去管理 ai, 并且让这个东西去创建一个解决你这个问题的最佳团队, 帮你解决问题。你比如说来去评估一下出海东南亚的可能性,那么可能要去调研辩论智控的这个团队,然后给到对应的一个专员,是吧?你需要丢一个想法进去,然后它来评估难度,来拆解步骤, 并且呢它自动的去摇人。比如说有些子人物可能需要去写代码的,包括选研究的,包括去回顾他们各司其职,每个人去解决每个人的问题,并且在交付前要去找到你对应的这个行业的一个质检。 ok, 所以 说我们来做随时待命的高级的数字员工。 ok, 这是我们整个的这个页面用 jimmy 三设计的,是不是还挺好看的?把麻烦事丢进群里,建群发需求,然后我们这边可以发一个需求,比如说我们现在,呃,你来给我 写一个,比如说我们就让他写一个这个东西,现在这个产品还不是特别完善,所以说我们还在逐步的一个迭代当中。但是整个的一个界面啊,包括交互和我们想要去完成的一个目标和想去实现的一个目的。已经跟大家聊清楚了, 就是去创建一个我们人类世界上理论上去解决这个任务的一个组织,当然它这里是 ai 的 组织,并且把它们包在一个呃协,我们非常能够去看清楚写作模式的一个这种类似于飞书发消息的这种写作框架里面,然后去盯着它们去做事儿。你看我们现在左边,左边已经创建好了,你看 左边创建了什么内容总监、心理学家、情感文案和趣事设计师、社交技能教练,还有方法学和这个逻理审稿人。 ok, 然后他来这里拆任务了,拆解具体的执行步骤。 他给我们拆了几个人啊?这个团队一二三四五五个人来去帮我们写整个的这个脱单秘籍。 ok, 他 是拆成了这个四块,拆成了四块, 然后去定义三种目标的这个读者画像,梳理十个通点,明确密集的目标编辑和成功指标,输出画图卡和指标表。 ok, 然后他收到来去做目标读者洞察和成功指标。 呃,接下来我可能还会接入,因为每一个模型他可能有不同的这种能力,所以说我们可能需要去接入不同的模型,然后来去调配不同的模型来去更好的去解决任务。 然后他这里说收到我们来做内容架构和章节设计,是吧?他开始发任务了,把每个人物交到每个人手上, ok, 我 们可以等一会,他说他内容设计已经完成了,然后要写又让又交给他核心拷写的脚本。哎,他怎么天天粉辅这个人呢? 这个人是干啥的?呃,情感文案与旭士设计师那么行为专家,哦,这个是行为专。他俩咋是一个头像?靠,这个 ai, 真的, 他们两个放了一个头像 哦,这两个人其实不一样的人哎。然后他艾特这个人,艾特这个人,艾特这个人,哦,这四个全是一样头像。我靠,不行,我这个头像储备还不太够,哎,我的不行,我不能这样,这是太恶心了,哈哈, ok, 他 来做什么?工具包的什么什么?这个发布计划,三十天训练计划、聊天脚本库、约会路线与预算模板、安全与边界指引、复盘表制定发布与更新机制,还有 ap 测试,我滴妈,还有版本节奏,你还要 get 吗? 工具包发布,一句话,所有子任,所有子任完成,他做最终审查,然后他来仔细的过一遍,哎,完成了,脱单秘籍完成了,我们看他写的什么脱单秘籍。核心脚本、自我吸引力 步骤,形象三件套资格正脸生活、周三攀岩。什么你片户外还是书店?渠道与开场? 线下社群课堂、线上 app 朋友圈发起建你首充最全片哪款豆子案例在吗? 误区广,撒网复读,从聊到约,找共性请邀约,定时的潜意识确认话术误区,久聊不见,邀约含糊,初次见还公共明亮寒暄,设为共享行程,各自买单限酒不去私密空间借店与复盘,这是 高校新手 职场盲人再出发者, ok, 他完成了整个最后的一个交付,这就是我们整个的一些产品,还是挺有意思的一个交互,包括一些理念也比较有意思。我们这就是我们的产品,是吧?比较喜欢我们产品可以在评论区或者我们一起去共创这个产品, ok, 我 们今天视频就到这里,拜拜。