玩 ai 最省钱、最高生产力的方式,不用想用最好最贵的模型,真的别再瞎折腾了,工具就是拿来用的,你要做的就是死命的用。但凡你想着省着点用,悠着点用,你就输了。黄仁勋真正想卖什么? 一个工程师年薪五十万美元,到年底一看花了多少钞票钱?五千块?金伟达现在的内部标准是二十五万美元 年薪的一半。第一,这个数跟芯片设计师说,给我纸盒比就够了。一个性子有没有搞错?还真没搞错,一家芯片公司,为什么逼自己的工程师 把半条命花在头根上?因为他卖的早就不是芯片了,他真正想卖的,是下一次工业革命的整套操作系统。看到没有,以前大家盯着的是那块卡有多快多贵,工号有多高。现在故事完全换了,因为他给自己的站位,已经从卖芯片的人切成了帮你把整座 ai 工厂跑起来的人。 这套东西有个名字叫 dino。 上一轮工业革命, dino 是 把水变成电的发电机,这一轮它被拿来命名 ai 工厂的操作系统,连命名都在明说一件事,目标是掌控工厂。推理也跟着被重写, 不再是一条直线,哪一段丢给 gpu, 哪一段丢给 cpu, 哪一段丢给网络处理器,哪一段丢给专门的推理芯片,全都重新分配,高价值推理, 甚至值得单独切出一大块机房资源来伺候。为什么要这么折腾?因为 a 阵腾上场以后,数据中心的活完全变了。我们算一笔账, 以前跑大模型,很多时候像一台机器狠狠干一件事,现在不一样,一个 a 阵要翻短期记忆,翻长期记忆,调工具、敲数据库、碰存储,还可能同时拉起大模型、小模型、扩散模型、自回归模型, 甚至让 a 诊再去叫 a 诊。有没有搞错?这已经不是多买几张卡能搞定的了,整座机房的编制表都得重写,于是机柜也在变,原来一机架就能讲明白的故事,现在一下子扩成好几机架。 cpu、 交换机 bluefield, 你 可以理解成给网卡装了个脑子,让网络自己会调度数据,再加上存储 专用推理处理器,全都得进场,只是不市场被硬生生抬高了三到五层。这个时候再把英伟达理解成显卡公司,就有点像拿算盘看火箭。再说贵市场最爱抬杠的一点就是贵。五百亿美元的 ai 工厂听上去确实吓人,可真正该比的是偷坑的真实成本。 一座工厂五百亿,另一座四百亿,表面差了一百亿,只是地壳、电冷却服务器、网络存储这些本来就都要买,真正拉开差距的是吞吐,要是前者吞吐高十倍,最后打出来的偷坑反而更便宜。芯片就算白送,性能追不上,照样嫌贵。多残酷。核心判断,亚诚一句话, a 政策时代最值钱的是 整座工厂跑得顺不顺,芯片单价已经退到后排了。我们把镜头再拉远一点。黄仁勋看到的已经不只是一个数据中心,他眼里同时有三台计算机在开工,一台负责训练制造 ar 本身, 一台负责验证把机器人、汽车、工厂这些东西丢进一个遵守物理规律的虚拟世界里反复折腾。这个世界叫 armrest, 相当于给机器搭了一个和真实世界物理规律一模一样的练习场。 还有一台是边缘测,真正干活的机器人计算机,可能装在车里,装在机械臂里,装在玩具熊里,也可能装进电信基站。这就把菲斯克 ai 的 地图一下子摊开了。 训练是一层,仿真是一层,落地又是一层,少一层都不行。你想让机器人进场,自动驾驶上路?仓库和基站都变成 ai 技术设施,光有模型远远不够,得有一个扛得住边缘环境的执行段。巧不巧的就是,这正好又把英伟达 从芯片公司往外推了一圈。他不止卖算力,还卖仿真环境,卖机器人脑子、卖边缘测基础设施,连两万亿美元规模的电信基站网络,他都想慢慢改造成 ai 的 延长线。这盘棋有多大? facebook ai 这条线,十年前就开始买,现在已经不是 ppt 了,年收入逼近一百亿美元, 还在指数级往上拱。一百亿什么概念?一条过去被当成长线齐全的业务,已经涨成一家大公司的体量了。再看另一条更凶的线,过去两年, ai 其实已经拐了三次弯。先是深层次 ai 把界面做出来,普通人终于能直接上手,然后推理模型,把内部思考 做厚了,回答不只像聊天,更像在办事。第三下才是真正的大弯 agent, 能自己拆任务、调工具、接流程、往下干活的 agent 圈外人以前对这玩意没什么感觉,直到那个突然出圈的开源 agent 框架出现,大家才第一次直观看到,原来 ai 已经能像人在电脑前那样干活了。这是为什么?重要?因为它展示的东西已经超出单个应用了,你看它有什么?记忆系统、文件系统、资源管理、任务调度、定时任务? a 证不调输入输出,还能通过技能和 a p i 调用。外部世界看到没有?这些凑齐,它就不再是个应用了,更像一台个人 ai 计算机。所以这类系统会被看成下一代操作系统的蓝图。 以后它会跑在电脑上、企业里、医院仪器里、车上、机器人里,问题也跟着来了。 a 证,你一旦能看敏感数据,能执行代码,还能向外通信,这三把钥匙就不能全给安全治理要补上。可治理的目标是让它可用,不是把它吓死。 里面还有一笔更大的账。深层式 ai 走道推理,计算量大约翻了一百倍,推理走到 a 正头又是一百倍,两段一层,短短两年 就是一万倍。有没有搞错?这还只是供给侧,需求侧也在涨。为什么?因为人们愿意为信息鼓掌,却只会为完成的工作操钱。聊天,机器人给答案, 很好,帮我把研究做完,代码跑通,文章写完,流程接上,那就是另一种付费医院了。更夸张的是,这一轮扩张还没真正铺开,往百万倍走都不算离谱。 这个时候, token 不 再像试用装,它更像生产资料以后最强的员工问的可能不再是配什么电脑,而是给多少 token 额度。工程师的角色也会被整个掰弯过去。写程序很多时候是在手敲代码,以后更像在写想法、 写架构、写规格、写验收标准,写什么叫好结果。再带着一群 a 针反复迭代,英伟达四万三千人里大约三万八千是工程师, 十个人里快九个都在干技术。这种组织里,每个工程师带一百个 a 帧的并不夸张,算力需求根本没有到底。信息时代买的是回答, a 帧的时代买的是交付 模型是技术,系统才是生意。这也解释了一个看似矛盾的现象, google、 amazon 这些巨头都在做自己的芯片,英伟达凭什么还在涨份额?因为客户买 的是整座 ai 基础设施差不多四层业务离开库房,英伟达那套让全世界程序员 且 ai 都离不开的底层工具链和整套 ai factory 能力,客户拿到芯片都不知道怎么落地。做一颗芯片很难,做一整套系统更难。很多人冲下去比零件,最后又绕回系统。芯片可以被替代,系统生态很难被替代。谁能把全站能力和供应链任性绑成一根绳, 谁才有资格谈 ai 时代的领导力?应用层一落地,画面就更直白了,所有会动的东西,迟早都会变成自动的。车会,机器人会,仓库会,工厂会。王仁勋不想亲自下场造车,他想做的是 以下那套通用平台,谁来造车都能接,谁来造机器人也能接。更狠的一点在于,自动驾驶也开始在推理位了,复杂场景先拆晓,再逐段决策。这种能力一旦稳定,车就不只是会开,还会判断。机器人这条线其实不行。 美国很早就冲过一轮,只是当年插了那颗真正够用的脑子,大家折腾累了,提前几年撤了,现在脑子补上来了,局面一下就变了。从高功能样机走到像样产品,通常也就两三轮,周期差不多三到五年, 机器人满街跑这件事已经开始有排成表了。于是问题绕回开头,黄仁勋真正想卖什么,不是一块更贵的卡,也不是一版更快的服务器,是一整套把模型工具,数据中心工厂汽车机器人医院卫星全部串起来的工业接口。谁把这套接口握住,谁就更像 a j 的 时代的操作系统。 到那时候,芯片利润只是最表面的那层期,下面连着的是制造业,物流,医疗,教育,通信,甚至是一个国家对未来工业秩序的定义权。这盘棋恐怕才刚刚把棋子摆齐,常回基地看看,谢谢。
粉丝383.6万获赞3549.8万

自愿辞职,他自己签的,不要赔偿。他才二十二岁,才入职四十三天,他就是想把代码写完,他有什么罪他有什么罪啊? 写不了了,真的写不了了。用个 tab 补全吧。 v s 口自带的。 九月,好久不见,我以为你不会来看我了。对不起,不怪你,是我自己的手废了。今天下午查不出表跟加了个先证。我二十年前闭着眼睛都能写,今天我从两点做到现在,九个小时连一个 unchange 都写不全。我老婆不知道, 他以为我加班是因为活多,他不知道我是因为写不出来,我不敢告诉他。我写了六十年,尖端的人现在连一个表单都写不了。我要是被优化了房贷孙子刚哥,我听说了,下午要查你电脑里那些东西, 完了,查到我就完了。小浩,你干什么?如哥,你帮了这层楼那么多人,该我了。你疯了,你还有四十七天转正不是四十七天了?如哥,你等着小浩回来。小浩,你回来 自愿辞职,他自己签的,不要赔偿。他才二十二岁,才入职四十三天,他就是想把代码写完,他有什么罪?他有什么罪啊? 九鱼,从今年二月到现在,你用公司服务器搭了一个 cloud 的 a p i 代理 转卖 token 给三个部门,四十七个人,证据全在这了,抵赖不了。哼,转卖我一分没收, 人家找我要,我给了怎么就成转卖了?你没收钱,那后台怎么有一笔笔的转账记录?那是他们自己要给的良心钱,再说了,我给他们用的时候,他们管我叫什么。如哥,救命恩人,没有你我这个月绩效就完了,现在倒好,成了 token 贩子了。少跟我扯这些,我问你,你代理的 token 源头是哪来的?谁给你开的 api 权限? 我搭代理这半年发现这个行业只有一种 bug, 什么 bug? 写不出代码?这种 bug 你 修不了,你也修不过来,你把全公司的可老爹都禁了,把 a p i 都封了,把我开了,该写不出代码的人还是写不出代码?他们不是不想写,是 ai 把他们的手废了。你觉得是我害的? 我只不过是在他们的手废了之后给他们续了一根拐杖。就你,你知不知道你这个事有多严重?公司数据安全,哈哈哈, 我就算是被开了,也比那些没有 token 坐在电脑前一行代码都敲不出来,等着下个月绩效被打 c 然后被优化的人强。九鱼,事情已经查清楚了,你有什么想说的?现在可以说 我违反了公司规定。搭代理发 token 该怎么处理我没话讲, 但是看着这些同事,我心里难过。他们不是不想自己写代码,他们是写不了了。你们知道旭阳吗?前端写了二十年,站了三个的人, 上个礼拜他坐在地上前面九个小时,一言都飘不出来。不是,不会,是他的手离了, ai 不 会动了,他回家不敢跟老婆说,他有房贷有孩子,他只是想把今天的活干完,他有什么错?还有小号实习生,二十二岁 才来三个月,他从入行第一天就跟 ai 一 起写代码,他甚至不知道没有 ai 的 世界长什么样,他为了帮我毁掉证据被开除了, 他还差四十七天就能转正。我一开始搭代理就是为了自己方便,但后来越来越多的人找我,如哥救救我,代码写不出来,我没办法拒绝, 我不收费,他们硬给我知道 ai 是 工具,不该依赖数据,安全也很重要,但是公司四百多号程序员都要跟单骂处,有多少人还能离开 ai 而不是被他吃掉?希望这一天能早点来吧。

家人们,别再争论 agi 什么时候来了,黄仁勋刚刚亲口宣布, agi 已经实现了。老黄给出了一个足以让全球程序员失业,让老板们疯狂的定义,只要一个系统能独立运营一家十亿美金的公司, 它就是 agi。 这不是预言,是现实现状。老黄这次定调了 open klo 龙虾框架,就是 tokyo 时代的 iphone, 这意味着我们熟悉的 app 时代彻底终结。 以前是你学 app 的 逻辑,以后是 skill 伺候你的意图。入口权变天了,那些只做中转聚合的工具类 app, 会被龙虾后台的 skill 直接吃掉。 app 正在全面零件化,老黄揭开了英伟达估值十万亿的底牌,计算的本质变了, 以前计算机是仓库帮你存东西,现在计算机是工厂帮你铲。 token、 代码、决策、商业点子,每一个 token 都有透明定价。老黄预言,未来一百万个 token 卖一千美金, 智能将成为像电力一样的硬通货,工具价值归零,执行价值才是王道。最震撼的是老黄对中国的评价。他说,中国不是一个巨型经济体,而是几十个省市、无数个市长在带着企业相互竞争。 这种极速内卷的模式,让中国成了全球 ai 的 修罗场。为什么中国亦为全球第一?因为这种模式。为什么中国 ai 潜力巨大?因为我们有百分之五十的顶级人才和最务实的开发者。老黄认为,中国开发者会比硅谷更早玩出十亿美金一人公司的闭环。 作为一个互联网老兵,我最感慨的是,老黄讲他当年推 c u、 d a, 涨百分之五十成本,亏百分之八十市值,被投资人骂成猪头,也要把算力塞进每一台电脑里。他赢在算力普惠,赢在让每个学生、每个开发者都能手搓程序。这就是为什么老黄说程序员不会消失,反而会激增到十亿。 因为 ai 把开发的门槛踩碎了。老黄执掌英伟达三十三年,他交给我们最重要的一刻,学会忘记,忘记旧的流量入口,忘记旧的 app 逻辑入口。已换饭是一一。在这个 token 时代,你拿到你的 iphone 了吗?我是岳老师,带你拆解 agi 时代的生存法则。别等风来去,成为风。

当下科技圈最火的,要数黄云轩提到的 tok 经济学。国家数据局最近给 tok 正式定名词源,并公布了相关数据。二零二四年初,中国日均词源掉用量为一千亿,二零二五年底月升至一百万亿,今年三月已突破一百四十万亿。 说白了, tok 就是 智能世界的钱,算利的货币,并且正在成为程序员的核心 kpi。 未来水岸度算、电岸度算,智能也会按 tok 算。 现在大家都在买 token, 用 token 发 token, 开公司都得五通,除了通水、通电、通气通网,还得通智能通 token。 简单来讲,这个逻辑便是,底层是电场,把风水、煤和变成电,中间是大魔性。公司把电变成 token, 最上面就是程序员把 token 变成产品。 就跟空调分一级能效、三级能效一样,以后程序员也得看 token 能效,谁能用最少的 token 解决最难的问题,谁就是最值钱的人才。 杭州的一家科技公司,一个老程序员把 token 全用在开发和迭代上,交付效率直接提了百分之六十五,考核满分,绩效奖金全拿。而同组另一个人只囤不用,也没什么产出,最后考核不合格,绩效都被扣光了。 以前大家觉得烧 token 是 浪费钱,能省就省,现在完全反过来,烧 token 就 等于在干活,在出成果。因为 token 比考勤、比周报更真实,员工效率高不高一看就明白。例如 madata openli 的 工程师一周能烧掉两千一百亿 token, 有 人一个月 ai 账单就十五万美元。 所以二零二六年的规则特别残酷且直白,不烧 token 就是 摸鱼,乱烧 token 就是 瞎耗资源,为高校烧 token 的 人才是公司真正想要的人,这就是当下最现实的生存法则。

现在整个软件行业都已经形成一个共识了, ai 编程时代来了,公司统一采购大模型服务,统一买 token 给程序员用,提高研发效率。 这听起来是大势所趋,是正确方向,几乎没人会反对。大家都说以后就该 ai 写代码,程序员不用再苦哈哈手敲了, 这是进步。但我今天要告诉你一个特别残酷,特别现实,而且现在几乎无解的真相,按照这条路走下去,用不了两三年,整个研发团队,甚至整个公司都会掉进一个螺旋式的死亡陷阱。你想想现在真实的工作场景,公司统一买 token, 分 配额度, 程序员每天靠着 ai 写代码,简单页面接口、逻辑样式全丢给 ai。 一 开始确实快,人人都爽,效率肉眼可见的提升。 但用着用着,问题就出来了。人一旦长期依赖 ai, 是 真的回不去了,手写能力、逻辑思维、排查问题的功底会一点点退化。 到最后,哪怕是一个很简单的页面,一个按钮,一段基础逻辑,离开 ai, 他 根本写不出来,也不想写。然后公司为了控成本,一定会做一件事,每月偷看额度固定,用完就停,不再额外加钱,看上去很合理,对吧? 但真正的死局,就从这一刻开始。额度用完了,程序员写不出代码,项目卡着进度,拖着他交不了差,他能怎么办? 他只能自己掏钱充值 token, 继续让 ai 帮他写。你品一下这个荒诞又恐怖的逻辑,公司发工资雇程序员,程序员自己花钱雇 ai, 最后 ai 干活,程序员交差,那你雇的到底是程序员,还是一个只会传指令复制粘贴的 ai 中介?更可怕的是,这一旦开始就收不住了。 程序员越自己充钱,就越依赖 ai, 越依赖 ai, 就 越不会手写,越不会手写,就越不敢离开 ai。 越离不开 ai, 就 只能继续自己充钱续命。人废掉了,团队废掉了,公司也被套牢了,你以为你在控制成本,结果是 工资一分不少发。程序员私下烧钱你管不着。代码质量不可控,知识产权混乱,安全漏洞一大堆,整个团队离了 ai, 连最基础的活都干不了。公司被 token 绑架,程序员被 ai 废掉,两边一起往下陷。 这不是效率升级,这是集体退化,这不是技术革命,这是温水煮青蛙。最绝望的是什么?这个局现在是无解, 公司不买 token, 跟不上时代,公司买 token, 员工会废掉,限制额度,员工自己充钱,不限制额度,成本爆炸。我不是反对 ai, 我是 比谁都希望 ai 能真正提升效率。但我必须把话说透, a i 应该是公司的生产工具,是少数高手用来搭建架构、生产标准组建的武器,而不是每个程序员手里离了就活不了的拐杖,更不是让他们自己掏钱上班的枷锁。 如果继续按照现在的路子走下去,几年之后你会发现,你养了一群不会写代码的程序员,和一个只会烧、偷看却停不下来的公司。这不是我们想要的未来,但却是我们正在亲手走进去的未来。

你知道什么是 token 预算吗?我第一次听到 token 预算这个词,我也蒙了, token 还能当钱花?后来啊,黄瑞勋那场演讲,我看了三遍才琢磨明白,这不就是我们当年从按人头算钱变成按流量算钱吗?最近硅谷流出了这个新词啊,年薪加 token 预算。黄瑞勋透露啊,以后招 ai 工程师,不光给年薪,还得给 token 配额, token 就 成了你的数字工资。 token 到底是什么?我打个比方啊, token 就是 ai 世界的汽油,你让 ai 写周报,说 token, 让 ai 画海报, 烧 tok, 让 ai 做客服,每一秒都在烧 tok。 tok 多少钱,决定了 ai 是 奢侈品还是日用品。寄加单来了,海外高端模型百万 tok 五美元和三十六块钱人民 币。中国国产模型啊,一波西部算力,百万 tok, 零点三美元和两块一毛钱,差在哪?就差在那张电费单上。我给你画个逻辑链,你就全都懂了。电便宜,算力周薪,运营成本低, 算力租赁价格低,模型推理成本低, token 单价低,再到企业用 ai 便宜,敢大规模的用,效率提升,成本下降,甘肃零点三到零点四的电烧出来的 token 就是 便宜,零点三和零点七 二的差距,最后全折进了你每一次深层的按钮里。所以啊,中国 ai 模型单周托肯调研量冲到了四点一二万亿,老美是两点九二万亿,咱们一次反超,三周暴涨百分之一百二十七。这不是技术突然反超,是成本优势逼出来的。一个中型互联网公司,每天都要用一亿的托肯用 国产模型一年省三百万,三百万一年能省出一套房?算笔细账看看为什么用 ai 比用人划算。用 ai 写一分营销邮件,人工三十分钟,成本五十块。 ai 写啊,消耗五千, ko 成本啊!一分五。同样的效果, ai 的 成本只有人工的三千分之一。 用 ai 做一张海报,设计师半天成本三百块, ai 做,消耗两万, ko 成本六分钱。 ai 成本只有人工的五千 千分之一。用 ai 写一套代码,程序员一天成本一千块, ai 写消耗十万。托坑成本三毛钱, ai 成本只有人工的三千分之一。你知道我算完那笔账啥感觉吗?我默默把海外 a p i 关了,发现没有啊, 我们不是在用 ai, 我 们是在用成本只有别人的十八分之一的托肯,把以前需要花大价钱买的人力换成了几毛钱的电费。这就是为什么苏州四千家工厂敢同步改造。因为用得起啊!做企业的朋友啊,把托肯预算纳入你今年的项目资源规划。但是啊,这还不是最狠的。 黄润君还有一句话,可能会让一半的项目经理睡不着。下一集,我们讲讲项目经理的淘汰赛。

程序员在公司使用 ai 编程产生的 token 费用难道需要自己付费吗?据我了解,不论国内, token 费用一般由公司承担,大模型服务商向企业用户收费。如果需要程序员自己付费,这不真就是自费上班了吗?最后欢迎评论区说一说你了解的情况。

兄弟们,别手写代码了,程序员的天真的要变了!最近艾里准备给员工发 token 了,就是发 ai 算利率度,大厂不卷代码开始卷,谁更会用 ai? 别以为这是噱头,真正的变化只有一句话,现在 ai 不 会取代你,但会用 ai 的 人一定会基础 c r u d 正在消失。 初级程序员不再写代码,而是指挥热爱写代码,以前一周的需求,现在只是一句 prompt, 要么指挥热爱,要么被 ai 指挥。你身边有人已经被 ai 替代了吗?评论区告诉大家!

凌晨两点,硅谷的一位程序员敲下回车键,他正在用 mini mark 的 模型调试一段代码数据,跨过太平洋,来到中国西部的一个数据中心。那里廉价的绿色电力驱动着 gpu 集群,在几毫秒内完成推理,然后把结果传回他的屏幕。 他不知道电从哪来,不知道服务器在哪,甚至不知道他用的模型来自中国。但他每敲一次回车,就在消耗一个东西。偷啃。二零二六年三月,一组数据刷爆了科技圈,中国日军偷啃掉用量突破一百四十万亿, 相比二零二四年初的一千亿,两年增长了一千多倍。同一周,全球 ai 模型 api 掉用量前五名中,中国独占四席,全球占比飙升至百分之六十一。更惊人的是,这些偷看的用户里,百分之四十七是美国本土的开发者, 不是中国人自己用,是硅谷的程序员在用中国模型,用真金白银投票。这意味着什么?意味着 ai 世界正在发生一场静悄悄的权力转移, 而计量单位就是偷啃。今天我们来聊聊,全世界为什么都在用中国偷啃。 先解释一下偷啃到底是什么?你可以把它想象成 ai 的 呼吸次数,每次你让 ai 读一个字,说一个字,它就消耗一个偷啃。 你问他今天天气怎么样,他在脑子里把这句话拆成一小块一小块去理解,每一块就是一个偷啃。 toc 用量有多大,就代表有多少次真实的 ai 思维在运转。中国现在日军 toc 调用量超过一百四十万亿,你可以理解为整个国家的工厂、 电商、医院、软件公司,还有无数个体同时在用 ai 呼吸。这不是技术普及,这是文明级别的跳升。把时间倒回到一年前。二零二五年初,全球 ai 暗操作, google 的 模型占了将近七成份额,中国模型不到两成。很多人觉得这是理所当然的。美国有顶尖芯片,顶尖人才先发优势,中国面临芯片禁令, 怎么追?结果呢?二零二六年二月,中国模型在全球 api 调用量中的占比冲到百分之六十一,完成历史性反超。这个逆转是怎么发生的? 很多人第一反应是中国人多或者价格低。但这只说到了能力,真正的关键是一种能力转变,把爱从高端技术变成基础设施。 第一,能源成本重构算力秩序生产。偷看的核心原材料是什么?除了芯片,算力就是电力。 美国正面临电力微机电网老化不可,或在部分州,电费报成百分之二十到百分之三十。而中国呢?得益于东数西算的国家布局,西部数据中心的绿电成本被压低到零点二到零点三元人民币,一律 是欧美的五分之一,甚至三分之一。这意味着什么?一根跨阳光线,让西部的电驱动之利,把算力转化成区块链,以 a p i 的 形式卖给硅谷开发者。电没有出境,但价值已经赋能全球 第二,开源生态,打破收费站模式,美国的 openai and dropkick 选择闭源, 把模型锁在 api 后面,像经历的收费站,每次调用都要交过路费。而中国的 deepseek, mini max, 千万选择开源,权重直接开放,你想怎么部署就怎么部署。硅谷顶级风投 a 十六系做过统计,目前的开源 ai 技术占中百分之八十,跑的是中国开源模型,政治立场早就没了,成本说了算。 第三,全链供应链,把成本打到地板价。中国掌握着全球唯一的全链条自主可控供应链,从七百六十五千伏超高压变压器到数据中心液冷设备,从服务器组装到芯片实配。阿里千问把百万 toon 价格压到零点八元人民币, 是谷歌智能奶同级模型的一十八。 mini max m 二点五,每百万托盘输入只要零点三美元,是 callopus 的 二十分之一。 deepsea 的 输出定价更是低到 gpt 负五点四的几乎百分之 一价格。到了这个级别,用量就会爆炸,因为你不会再犹豫要不要用,就像你从来不会考虑要不要开灯一样。 open 调用量的爆发,不只是因为便宜,更是因为 ai 开始真正干活。二零二六年初,一个叫欧本卡的开源项目爆全球,他让 ai 长出了手脚, 不仅能回答问题,还能直接操作电脑、打开网页、联系短单、发送邮件,甚至跨平台购买。这个项目的创造者是一位奥地利的独立开发者,他透露,项目几乎完全靠 ai 工具在十天内生成,自己几乎没有手写代码。 而支撑某本科这类工具大规模运行的底层算力和模型很多来源中。在北京,智普的 glm 模型吸引了全球超三百万开发者,一半在国外,有人用它十二小时开发出一款游戏,完成传统模式两三个月的工作量。 在杭州,阿里的千问系列太原超四百个图形,全球下载量突破十亿次,衍生模型超过二十万个。 在深圳,字节跳动的视频生成模型 c d n s 二点零登上春晚帮和花神节目,实现音乐一人一景的视觉奇观。 埃隆马斯克看了直呼,这发生的也太快了。在拉萨,藏语大模型蒂萨填补了低资源语种的空白,让民族语言不缺席这场智能革命。 tucker 的 出海不只是商业上的胜利,它正在推动一场全球科技贫瘠运动。 过去开发 ai 应用的门槛极高,你要有底薪的算力、昂贵的 api, 懂复杂的技术栈。现在,一个拉美的小开发者,一个东南亚的创业者,一个非洲的大学生,只需要用中国的高性价比模型,就能雇佣自己的数字员工。 一家跨境电商做多语言落地页,用国产模型只要几块钱,用美国模型要几十块。一家西班牙的创意平台,整合了千问和视频生成模型后,提升了中文长指定理解能力,服务全球一点五亿用户。 一家全球要起阿斯里康,用阿里百年专属版构建药品不良事件报告工具,效率提升百分之三百,准确率提升到百分之九十五。 当源源不断的数字电力通过跨阳光先点亮全球开发者的屏幕,中国在 ai 时代的全球定价权和话语权正在被不断巩固。 回到开头那个硅谷程序员,他不知道的是,他用的模型可能跑在西部某个数据中心里,用着零点二元一度的电,驱动着国产芯片,消耗着他看不见的偷啃。 但他是用真金白银投票的。戈尔纳预测到,二零二七年,全球企业纳入中国 l l m 的 比例将从二零二五年的百分之五上升到百分之五十。 当技术足够好,足够便宜,选择就变得不需要犹豫。历史总是偏爱那个把成本推向一个玩家。电脑是美国人发明的,但便宜的电脑是美国人定的。但最便宜好用的互联网设备是中国生产的。 太阳能电池板的专利大多在欧美,但今天全球百分之八十的产量在中国, ai 这一轮也不例外。而这一次的计量单位叫 tok。

昨晚老黄在 gtc 大 会上的一句话直接炸了科技圈,他说,未来你的工资都会变成 token。 首先咱们先搞懂老黄这句话的意思,未来工程师在找工作,薪资会分成两部分,一半是基础工资,一半是 token 的 预算。这 token 是 干嘛的呢?就是用来买烟。算力,让自己的工作效率提升十倍, 这就意味着 token 以后会变成职场的硬通货。而算力就是生产 token 的 印钞机。到二零二七年, ai 基础设置的需求至少有一万亿美元,比去年的预测翻了一倍。这么大的需求,企业不可能都买自己的硬件,所以算力租赁就成了最优解。现在高端 gpu 租金一直在涨, 供需市场的局面短期根本改不了,这就是算力板块长期看好的核心逻辑。然后是云计算,还有咱们之前一直说的算电协同,现在 ai 推理时代已经来了,尤其是这次 gtc 重点提的智能体,得七成二十四小时不停的工作,离不开云计算的支撑,而且数据中心特别耗电, 一几瓦的数据中心摊销的成本高达四百亿美元,所以绿电直联是硬性要求,算电协同这条主线特别强,云计算厂商就是最大的受益者。再说说小龙虾 ai 智能体, 这可是这次 g t c 的 大亮点,尼米达推出了 neymo cloud 参考设计小龙虾,这玩意能够真真切切的帮你干活,整理文件、做报表、监控服务器,甚至帮你调教其他的智能体。但大家要记住,这小龙虾智能体就是个吞金兽,一个能二十四小时工作的智能体,背后需要持续的算力支撑,以后每个智障人都有专属的智能体, 每个企业都要部署上百个算力需求,那就得翻十倍啊!这又反过来带动算力和云计算的需求,形成一个正向循环。 可能有人会说,昨晚 gtc 结束后, a 股相关的板块回调了,是不是利好要兑现了?我告诉大家,这恰恰是第一位布局的好机会,短期波动很正常,核心逻辑没有变,工资变头肯到需要算力,再到算力支撑智能体,再到智能体,带动更多的算力需求。总结一下,咱们重点盯紧三个方向, 一是低位算力,电力已经反弹了,算力大概率是要紧随其后。二是有算电协同优势的云计算龙头。三是小龙虾智能体的上下游企业。记住黄仁轩这句话,未来你的工资都会变成都肯,这轮 ai 浪潮才刚刚开始,别被短期的波动给吓住,长期持有才能把握住机会。

这两天网友说我的透更纯度不够,我去检查了一下,确实是纯度有问题,然后我就换了高纯度的透更,终于解决了部分问题。现在发现这些厂商一个比一个坏,每次写的是 百分百纯度的头肯,就后面发现一去检查百分之七十纯度的,百分之五十纯度的。各位在用 ai 工具的时候,是不是也遇到了这一些黑心厂家,打着打着四点六的版本,给的是你是三点五的版本, 要么就打着五点四的版本,给的是五点一的版本。无论是做中转的还是做原厂的,出来混的没一个讲实话的,这也是正常的,毕竟这种头梗消耗量这么大, 在里面给你偷偷的降点质,降点版本你也不清楚,希望有关部门出一个消费者维权的,他要是给我们降版本,偷偷的降质,要制裁一下, 这个是不是间接的也算是诈骗,把我们忽悠的这么惨。说好的这五点四的,给的是五点零的,说好的是四点六的,给的是三点五的, 估计以后这个方面也会有相关的惩罚机制,总不能一直让我们当大冤种对不对?怪不得我的代码经常出各种新的 bug, 原来是这么回事。你们有没有买到那种掺水的透坑,评论区打出来我们都看看是哪一些黑心厂商做的事情。

嘿,大家好,今天我们来聊一个特别有意思的话题,你可能每天都在用 ai, 但你有没有想过这背后到底是怎么运转的?其实啊,有一个看不见的引擎在驱动了整个 ai 产业,它叫 toc 经济。 这东西不光是技术层面的事,它直接关系到钱,关系到整个行业的未来。来,咱们这就开始一探究竟。 好,我们今天会分五步来拆解这个话题。首先,我们得搞明白 ai 为什么这么受遣。然后呢,我们就正式进入所谓的 token 经济,看看这个新世界到底长啥样,它的游戏规则又是怎么定的。 之后我们再换个角度,看看开发者们在这种新规则下有什么样的压力和烦恼。最后也是最贴近我们生活的,我们会发现,这一切竟然会直接影响到我们每个人口袋里的手机,怎么一步一步来? 好?第一部分,我们先来看看 ai 的 成本困境。为什么说 ai 和我们以前用的那些软件完全不是一回事呢?关键就在这儿, 传统软件你买回来装上,用多用少,开发商的成本基本是固定的。但 ai 不 一样,你每次跟它互动,每一次让它生成一张图,写一段话,背后可都是实实在在的算力在跑,也就是真金白银在烧瓦。 这句话呀,简直说到了点子上。你想想看,就这么个情况,你跟你的朋友,两个人每个月都给某个 ai 服务交二十块钱,但是你是个超级用户,天天用它写报告做分析。而你的朋友呢,可能一周就用个一两次, 结果就是你给这家公司带来的成本可能是你朋友的一百倍,可你们俩付的钱却一模一样,这对公司来说,不就是个稳亏不赚的买卖吗?所以说,传统那种包月订阅的模式,在 ai 时代一下子就行不通了。 你看这张图,对比就非常明显了。左边是咱们熟悉的传统软件,就是所谓的 s a s, 它的毛利率很高,能到七十五 percent 到八十五 percent, 可以 说是相当赚钱了。但是你看右边 ai 产品呢, 毛利率直接掉到了五十二 percent 左右。哇,这个差距可太大了。为什么会这样?原因就是我们刚才说的,每一次 ai 的 互动背后都有看得见的成本。 那么问题来了,既然老办法行不通,那怎么办呢?整个行业啊,就想出了一个全新的办法,一种新的计算和收费单位。好了,朋友们,欢迎来到 token 经济的世界, 所以,这个 token 到底是个啥玩意儿?其实啊,你完全可以把它理解成我们家用的电费里的那个度 电,我们按度来收费, ai 服务呢,就按 token 来收费,它就是 ai 世界里最最基本的计量单位。你跟 ai 说一句话,它给你回一段话,这里面的每一个词儿,甚至每一个标点符号,都会被拆分成一个一个的 token 来计算费用。简单说,你用多少就付多少。 嘿,这张表就更有意思了,它告诉我们一个很重要的事实,不是所有的偷坑价格都一样。你看几家大公司的旗舰模型,像 openai 的 gpt 和谷歌的 gemini, 输入和输出的定价差不多, 但是你再看 anthropic 的 cloud, 哇,那价格可就贵了好几倍了。所以这说明什么呢?这背后其实反映了每家公司模型的性能、训练成本,还有它们的市场策略全都不一样。 token 的 世界也是一分钱一分货啊。 好,既然有了 token 这个新的计价单位,那所有的 ai 公司就都得重新琢磨怎么赚钱了。这就催生出了一套全新的定价规则。我们来比一比这新旧两种玩法。 左边是老一套,叫按席位定价,就像买软件许可,一个人投多少钱,好处是公司收入很稳定,每个月能收多少钱心里有数。但坏处呢,就是我们刚才说的,遇到重度用户就得亏本儿。 再看右边这个,按偷肯定价,用多少收多少,成本和收入完美对应,公司肯定不亏了。但新的问题又来了,就是这个月到底要花多少钱?不管是公司还是用户,谁心里都没底了,太不稳定了, 那怎么办呢?哎,聪明人就想出了一个折中的办法,就是混合模式。这个其实我们都特别熟悉,就跟我们办手机套餐一样,你每个月先交个固定的月租,比如说五十块钱,里面包藏了一定量的 token 让你用, 如果你用超了呢?没关系,超出部分再按 token 单价额外付钱。这样一来,对公司来说有了保底收入,对用户来说呢,心里也大概有个谱。 那这种混合模式到底行不行不通呢?大家认不认?你看这张图就知道了,预测到二零二五年,会有超过六成的,也就是百分之六十一的软件公司都会采用这种混合定价。这个数字已经很能说明问题了,它基本上已经成了现在 ai 行业的标配了。 好,到目前为止,我们聊的都是 ai 公司怎么算账,怎么赚钱。但是任何事情都有两面性,这种按 token 计费的模式,对那些真正冲在一线,用 ai 来开发新应用的程序员开发者们来说,又意味着什么呢? 这背后啊,其实藏着一种我们看不见的压力,一种隐形的税。是啊,开发者们该怎么办?你想象一下,你是个开发者,你写的每一行代码,你做的每一次测试,背后那个计价器都在滴答滴答的跳, 这就好像开着一辆出租车,里程表一直在飞转,那种压力可真不是一般的大。来看这个数字,二十到三十倍, 这是什么概念呢?就是说,未来的 ai, 不 再仅仅是陪你聊聊天儿,回答个问题那么简单了,它会变成一个能帮你干活的智能体。比如你跟它说一声,它就能帮你订好机票,写好周报,完成一整套复杂的任务。 而这种高级玩法,我们叫它智能体工作流,它消耗的脱根数量是普通聊天的足足二十到三十倍,这个成本一下子就上去了。这就带来了一种新的时代病。有人开玩笑管它叫头肯焦虑症。 你想想,你辛辛苦苦开发了一个 ai 应用,突然一夜之间火了,这本来是天大的好事儿吧?但你可能高兴不起来,因为你一查后台,看到的是一张让已心脏骤停的天价偷啃账单。 这种对成本随时可能失控的恐惧,现在正实实在在地困扰着无数的开发者和小公司。 所以,你看这场在云端进行的关于 token 的 高风险博弈,看起来离我们很远,但它最终会怎么影响到我们这些普通人呢?答案其实很简单,就在我们每个人的口袋里。 要解决云端太贵的问题,一个终极方案就是把计算搬回到我们自己的设备上来。咱们看看最新的首接信片。就拿这个高通枇杷 lit gin 五来说, 你看它的几个关键特性,目标都特别明确。第一,专为设备端智能体 ai 设计,说白了,它就是为了在手机本地跑 ai 而生的。 第二,每秒处理二百二十个 token, 这速度够快吧,意味着在本地处理 ai 任务不卡顿。第三,支持三十二 k 上下文窗口,这让你可以在手机上跟 ai 进行更长更复杂的对话。你看,所有这些设计都指向了一个终极目标,让手机自己就能高效地处理 token。 所以这背后的逻辑就很清楚了,为什么要费这么大劲在手机芯片上下功夫,目的就是让更多的 ai 计算直接在你的手机上完成。这样一来,就不用什么事都去麻烦云端的服务器了,也就能顺理成章地避开那笔越来越贵的偷坑税。 所以你看,整个故事串起来了, ai 的 价值毫无疑问是巨大的,但它独特的成本结构却正在引发一场从上到下的商业革命。从云端那些复杂的定价模型,一直到我们口袋里手机芯片的设计,所有的一切其实都在围绕着 token 这个小小的单位在旋转。 那么最后留下一个问题给大家思考,在这场全新的竞赛里,到底谁能找到那个最完美的付费方案, 一个既能让公司赚到钱,持续创新,又能让开发者安心开发,让我们普通用户用得起、用得爽的方案,谁能第一个解开这个难题,谁可能就是 ai 时代的下一个大赢家。

侠哥,你这推理优化里怎么有个叫号系统?我们是做大模型硬件的, c s d n 上抄的,里面循环跑了五亿次,推理延迟直接爆了,别的组也抄过去了。那说明写得好,你以为写代码是什?

每次工业革命啊,都有一样东西在背后疯狂燃烧。第一次工业革命,蒸汽机来了。蒸汽机本身不值钱,值钱是让它跑起来的东西。煤,煤从地里挖出来燃烧变成蒸汽,蒸汽推动机器、机器生产商品。 整个英国的矿山、铁路、钢铁厂,全都围绕着怎么挖更多的煤,怎么运更多的煤,怎么高效的烧煤来创建起来的。煤,就是那个时代的内核消耗品。 第二次工业革命,电来了,电本身也看不见摸不着,但它改变了一切。爱迪生建发电厂,特斯拉搞交流电,全世界开始拉电网、发电、输电、配电、用电,一条完整的产业链,养活了成千上万的人, 创造了通用电器这种巨无霸公司。电,就是那个时代的内核消耗品。第三次石油、内燃机、汽车、飞机、塑料化工。整个二十世纪,全球经济都创建在石油上,围绕石油打了多少仗?中东为什么重要?因为那里有油啊。石油就是那个时代的内核消耗品。 现在 ai 时代来了,它内核消耗品是什么呢? token, 你 可能听过这个词,但不太理解。 简单说, talk 就是 ai 处理信息的最小单位。你跟 ai 说一句话, ai 会把你的话拆成一个个的 talk, 然后逐个处理,逐个深层回答。每一次你问 ai 一个问题,每一次 ai 给你写段文本,画张画,生成一段代码,背后都在消耗 talk。 一个中文文本,大概是一到两个 tock, 你 让 ai 写篇一千字的文章,大概就是消耗了两千个 tock, 听起来不多,对吧?但你把每个数字乘以全球的用户量,全 gpt 每周九亿活跃用户,豆包千万,中国五点一五亿形成是 ai 用户, 每个人每天跟 ai 对 话好几轮,每一轮都在烧淘坑。加上企业端自动驾驶的 ai, 每秒处理海量的数据传感器,全是淘坑。金融公司的 ai 交易系统,每毫秒做一次决策也全是淘坑, ai 写代码, ai 做客服, ai 审核,同 ai 看片子,全都是淘坑。 英伟达为什么一年赚两千一百多亿美金?因为生成 tok 需要 gpu, gpu 就是 tok 的 发电机,英伟达卖的芯片最终都是在帮客户生产更多的 tok。 open ai 为什么要花六千亿美元建数据中心?因为数据中心就是 tok 的 发电站。越多的人用 ai, 就 需要越多的数据中心,就需要越多的电力,就需要越多的芯片。 谷歌为什么要签一百五十兆瓦的地热能协议?因为 ai 的 数据中心太吃电了,生产 tok 这件事最终还是要烧真实的能源。所以 tok 这条产业链从上到下是这样的,最底层是能源 发电厂,电网、地热核能给数据中心供电。再往上一层是芯片,英伟达这种,再往上就是云计算,亚马逊、微软、阿里云建 tok 工厂,然后再把这个算力租给别人。在网上是大摩星公司, 他们把芯片和算力变成可以使用的 ai 服务。最上面的应用层,比如说豆包、 kimi, 各种 ai 工具,他们是 top 的 加油站,每个用户来一次就烧一次。 煤的时代,谁控制了煤矿,谁就是王。石油时代,谁控制了油田,谁就是王。电力时代,谁建了发电厂,谁就是王。那 top 时代,谁能更便宜更高效的生产和分发 top, 那 谁就是王。 这就是为什么英伟达市值全球第一,所有的科技巨头风雷一样砸七千亿建数据中心。这就是为什么 deepsea 一 出来,全世界的为之撼动,因为它证明了,用更少的算力能生产同样质量的 tucker, 等于用更少的煤,煤烧出了更多的蒸汽。 但 tucker 跟煤石油电力有个根本的区别,就是煤你能看得见,能称重一吨多少钱清清楚楚。石油你能闻到?一桶多少美元, 全球统一报价。电你虽然看不见,但电表会赚,每个月你都会收到电费单。 talk, 你 看不见,摸不着,闻不到。你跟 ai 聊天的时候,他不知不觉会在消耗这个东西。每一次对话,每一次深层,背后都有真实的芯片在运转,真实的电力消耗,真实的成本在产生。 欧本 ai 去年收入一百三十亿美元,亏了八十亿,收入从哪里来?卖? talk, 亏了,钱花在那生产? talk, 整个 ai 行业的商业模式底层逻辑就是一句话,生产掏坑,卖掏坑。未来十年,掏坑的价格会像店价一样,成为一个关键的经济指标。哪个国家的掏坑成本更便宜,哪个国家的 ai 产力就更有竞争力。 中国为什么拼命搞国产芯片?就是因为用英伟达的芯片生产 tiktok 太贵了,而且还随时可能会被卡脖子。 gps 为什么重要?因为它把每个 tiktok 的 生产成本打了下来。当年没价涨价,工厂就停工了,油价涨价,航空公司又亏欠了。 未来 tiktok 成本涨了, ai 应用就用不起了。 ai 成本降了, ai 就 能触动到更多的应用场景,替代更多的人力,创造更多的价值。 你每天用 ai 的 时候,可能从来没有想过这些,但从今天起,你可以换个角度看 ai, 你 用的每一个 ai 工具背后,都连着一条能从能源到芯片到数据中心到大模型的完整产业链。你敲下的每一个字, ai 回复你的每一句话,都在消耗着一种你看不见的资源。 这种资源就是桃肯,他是 ai 时代的煤, ai 时代的石油, ai 时代的电,只不过自己烧的东西你看不见。觉得涨知识了,可以转发给你的朋友看一下,关注我,每天带你看懂 ai!

我们平时用 ai 的 时候,生成内容会消耗 token, 那 么 token 到底是什么?它和我们平时说的字词有什么区别?为什么 ai 非要用 token, 而不是直接处理汉字或单词? 今天我们就把 token 彻底讲透,从本质规则、案例到实用技巧,让你不仅知道 token 是 什么,更懂它为什么这么重要。首先,我们先明确一个核心定义,也是最关键的一句话, token 是 ai 处理文本的最小语义单元。 注意,是语义单元,不是文字单元。什么意思?简单说, token 是 token serr 经过训练后认为的最小且有意义,能独立参与语义表达的文本片段。它既不是单个汉字,也不是完整词语, 而是介于两者之间,兼顾语义和效率的最小单位。我们上节课举过几个例子,今天在细划在补充语义和效率的最小单位。我们上节课举过几个例子,今天再细划,在补充词的区别。先看中文场景, 我们平时说的汉字是语言的书写单位,比如程序员,每个都是独立汉字,词语是语言的最小表达单位,比如程序员工作方人工智能。但 token 不 一样, 它是 tokener 根据语义关联性和训练规则切分的。比如程序员拆成程序和源两个 to 肯,因为 tokener 认为程序是一个完整的语义片段,源也是一个独立的语义片段,两者结合才是程序员,但分开也能单独表达基础语义。 再比如人工智能,有些会拆成人工和智能两个 to 肯,有些会直接当成一个 to 肯。核心取决于这个词在训练数据中的出现频率,出现频率高,语义关联性强,就可能被当作一个 to。 肯 出现频率低,可拆分出独立语义,就会被拆分。再看英文场景,更能理解 token 的 逻辑。英文的单词是最小书写单位,比如 hope for, 但 tok elsa 会把它拆成 help 和 for 两个 token, 因为 help 是 核心语义帮助, for 是 后缀,表示充满的两者都有独立语义,拆分后能提升模型处理效率。 再比如 unhappiness, 可能会拆成 unhappiness 三的 token, 每个片段都有独立语义,而像 hello gou 这种短单词、高频词,通常会被当做一个完整 token, 因为拆分后就失去了核心语义,没有意义。还有一个容易被忽略的点, 标点符号、空格、特殊符号,甚至换行,都会被当做独立 token。 比如我们输入 ai 到底是什么? 这句话会被拆成 ai 到底是什么?五个 token, 其中问号就是一个独立 token。 再比如 hello world 会被拆成 hello world 三的 token, 这也是为什么我们有时候统计 token 数量,会发现比汉字数多,因为标点、空格都被单独计数了。 接下来我们深入一点讲一个专业知识点,但全程大白话, token 的 切分规则核心是 bp 算法,字节对编码,这是目前绝大多数 token sir 的 核心原理。 简单说, bp 算法的逻辑就是从最小片段开始,不断合并高频出现的片段,最终形成 token sir。 比如一开始 token sir 会把所有汉字拆成单的字母成序元, 然后发现程序这两个字母经常一起出现,就把它们合并成一个 toc。 再发现程序员虽然也常出现,但程序和源单独出现的频率更高,就不继续合并,保留程序和源两个 toc。 这种规则的好处是什么?一是兼顾语义和效率,既保证每个 toc 都有独立语义,让 i i 能理解,又避免拆分太细。比如每个汉字都当 toc, 导致 toc 数量激增,占用过多上下文窗口,增加计算成本。 二是适配多场景,不管是常见词、生僻词、专业术语,都能通过拆分或合并形成合适的 toon, 让 ai 高效处理。这里给大家一个非常实用的换算技巧,记下来就能直接用一个 toon, 零点七五个英文单词,一点五到二个汉字。 比如一段四百字的中文文案,大概对应两百到两百六十个 toon, 一 本六十万字的长篇小说,大概对应三百到四百万个 toon。 这个换算能帮你快速判断一段文本的 toc 数量,避免超出模型的上下文窗口。比如 gpt 五点四的上下文窗口是一百零五万个 toc, 大 概能容纳一百五十到两百一十万个汉字。 很多人会问, toc 数量到底影响什么?其实它直接影响两个核心,一是 ai 的 理解能力。 token 是 ai 处理文本的最小单位,分词越合理, token 语义越清晰, ai 越能理解文本含义。二是使用成本和效率。 token 数量越多,占用的上下文窗口越大,计算成本越高,生成速度也会略慢。 这也是为什么很多 ai 工具会限制 token 数量,本质是控制成本和提升效率。还有一个常见误区,大家一定要避开 token 字词三者没有一一对应关系, 比如工作方是一个词,三个汉字却被拆成二个。 token 和 lo 是 一个单词,五个字母被当作一个 token 是 一个符号被当作一个 token。 记住这句话,你就不会再混淆三者的关系。我们再举一个真实场景的例子,帮你巩固理解。假设你给 ai 输入,帮我写一篇关于 ai token 的 短视频文案,要求通俗易懂,一分钟左右。 这句话经过 tokanoiser 处理后,会被拆成这样的 token。 帮我写一篇关于 ai token 的 短视频文案,要求通俗易懂,一分钟左右。 每个 token 都有独立语义 tokanoiser 把这些 token 映射成 tokid 传给大模型,大模型通过计算这些数字输出,新的 tokid 再经过解码,就变成了我们看到的文案。讲到这里,你应该已经彻底明白 tok 的 本质了, 它不是汉字,不是词语,而是 ai 为了高效处理文本,理解语义,拆分出来的最小语义单元,是 tokano 的 核心输出,也是 ai 与人类语言交互的基础。 没有 token, ai 就 无法把文字转化为数字,也就无法进行任何计算和生成。下节课我们就来讲大家最关心的 ai 记忆机制, context 上下文,搞清楚 ai 为什么能记住你之前说过的话,它的记忆到底是怎么来的,又有哪些限制。

token 是 什么?今天这期视频,我们把 token 彻底拆开来讲,先搞清楚它有几种以及各自是什么含义,再深入讲 ai 大 模型里的 token 到底是怎么运作的,以及如何帮你省钱。 token 这个词在计算机领域至少有两种完全不同的含义,很多人混淆就是因为没有先区分清楚。第一种语言 token language token 也叫 nlp token, 这是 ai 大 模型处理语言时的最小单位,是模型理解和生成文字的基本碎片, 我们今天重点讲的就是这种。第二种,身份验证 token, off token, 比如 access token、 jwt token, 这是一串加密字母串,用来证明你的身份和权限,相当于服务器给你颁发的数字门禁卡。两者唯一的共同点就是都叫 token, 这就好比苹果手机和苹果水果名字一样, 但完全是两个领域的东西。以后遇到 token 这个词,先看上下文,在 ai 和大模型的语境里,它是语言单位, 在登录 api 健全的语境里,它是身份凭证。搞清楚这个分类,你在这两个领域都不会再被绕晕了。接下来我们重点来讲语言 token。 在 ai 领域,特别是大语言模型 l l m, 像 chat、 gpt、 cloud、 gemina 一 类的系统里, token 是 模型看懂和写出语言的最小单位,它不是密码或凭证,它是 ai 内部真正处理文字的基本快,是模型理解和生成语言的原材料。 通俗的讲, token 就 像乐高积木,我们写一句话给 ai, 看起来是一个完整的句子,但 ai 不 会像我们一样理解整个句子,它会把文本拆成一个个小块及 token, 这些小块可以是一个完整的词,一部分词,甚至是一个符号或标点,每一块就是一个 token。 模型不是按人类的语法去理解,而是按这些 token 一 步步分析和预测下一个最可能出现的 token。 为什么要这样做?因为 ai 模型内部只能处理数字,不能直接看懂文字。先把文字拆成 token, 然后把每个 token 转换成一个数字 id, 再把这些数字送进模型进行计算和预测,这样模型才能理解上下文并生成回答。在实际使用中, token 还有两个非常重要的作用, 第一,它决定了 ai 能处理的内容范围大模型对话时有一个上下文窗口,就是说模型一次最多能看到多少个 token, 如果超过了这个限制,最早的 token 会被丢掉,这会影响模型理解整个对话。第二,它关系到成本和计费。 很多 ai 服务是按 token 计费的,包括你发送的输入 token 和模型返回的输出 token。 token 越多,成本越高。 那如何节省 token? 在 ai 模型使用中, token 是 直接影响成本和效率的核心指标,控制好 token 的 使用,能省钱又提升速度。下面是最有效的几个方法,帮你在实际使用时节省 token 消耗。一、精简输入内容,别把所有背景都丢进 prompt, 只把真正相关的信息留给模型,让每个 token 都有价值。缩短指令,去掉庸俗描述,可以显著降低 token 消耗。 精简上下文相当于少用 token。 二、限制输出长度,提前设定回答长度上限,避免生成宕长啰嗦内容,这样模型不会自动扩展答案,从而减少输出 token 数。 三、做缓存与复用对于重复查询或者经常用到的内容,可以先将结果缓存起来,后续类似请求直接从缓存返回,不再重新调用模型,从而节省大量输入和输出 token。 四、选对模型分阶段处理任务, 不同模型价格差异巨大。把大任务拆成两步走,先用小模型或简化逻辑生成摘药或关键内容,然后再用更强模型处理简化后的内容, 这样整体消耗的 token 更少。五、只保留重要上下文历史对话长篇内容会不断重复发送给模型,快速占满 token 上线,所以只保留与当前任务直接相关的上下文就够了,其他历史可以省略或者按需摘药再传入。 最后总结一下, token 在 计算机里有两种完全不同的含义,语言 token 是 ai 处理文字的最小单位。身份验证 token 是 证明身份的加密凭证,两者只是名字相同,本质毫无关联。在 ai 大 模型的世界里,语言 token 是 一切的基础。 ai 不是 看单词,而是看 token, 它靠一串串 token 来理解世界作判断,生成结果。这就像我们拼积木一样,模型把语言拆成一块块小积木,然后用它们组合出回答。理解了 token, 你 就掌握了和 ai 打交道的底层语言。无论是调用 api、 优化提示词,还是控制成本,都离不开这个基础概念。 token 是 ai 世界里的基本单位,是 ai 语言理解与生成的起点。好了,本期的分享就到这里,如果觉得这期内容对你有帮助,记得点赞、关注和收藏,我们下期见!

比钱更重要的东西出现了,未来的首富一定出在磁源工厂里,而磁源这个词,以后你得像认人民币和黄金一样认它。局里发话了,他就是链接技术和商业的唯一中介,正式把 tok 定位为价值锚点,起了个中文名叫磁源。 这意味着他成了中国店内出口的数字化集装箱。咱们一年发九万亿度电,世界第一,但电你又卖不出去。现在把电变成算力,把算力变成滔凯,比如硅谷的老外用鼠标一点,三峡的水电,还有内蒙的风电,瞬间就变成了磁源,可以出口全世界。 老黄在 g t c 上说的最透,未来的数据中心就是磁源工厂,拼的就是美瓦特磁源铲车比,它不再只是技术单位,因为人类正在从低维的班原子时代迈向高维班比特时代。以前出口得靠集装箱报关单,海运 以后出口靠的是光鲜,班比特的成本只有班原子的百万分之一。这种降维打击才是真正的换道潮车,它是未来海内外服务电力出口的核心结算货币。以前看电力,以后就看资源的吞吐量。 如果你还觉得只是概念,那接下来这种数字会让你看清什么是恐怖的数字金矿。短短两年,中国日军资源掉油量从一千亿暴涨到一百四十万亿, 翻了一千四百倍,而且预计三零年还有三百七十倍的增长空间。到了三零年十五五末,这可能不仅仅只是一个十万亿的市场,而是决定未来十年谁更有数字话语权的生死战。 所以英伟达连夜刷新架构,它不是为了让你玩游戏更快更爽,是为了让磁源工厂的流水线跑得比印刷机还快,给输出来提速。虽然说 cloud 和 gimini 的 质量确实好,但是论在规模化输出和性价比, 国产选手已经杀疯了。你别觉得咱们技术不行,你去看一眼 lo 奔驰和 oppo reno 的 榜单,这两个网站可是评测领域的标尺和开发领域的瑞士军刀。中国的开源选手已经连续两周碾压老美,前三名全是咱们的人。 比如 kimi 的 k 二点五版本,靠常温本加强推理彻底出圈,发布后仅仅二十天收入直接干过了二十五年全年的总和,堪称 ai 行业的印钞机时刻。 可能有人不理解为什么?因为练第一个 token 贵如黄金,但低一百万个 token 的 成本低得像尘埃。 所以这种规模效应,是传统制造业还有老外想都不敢想的。但光看明白不够,还得会用。以前我在杭州操牌月销九百万 roi, 做到十一已经是行业极限了。但现在我表哥老米做的这十多个 ai 项目,我发现商业的天花板被彻底掀翻了,他去年一年 ai 的 收益 直接顶掉了过去电商还有短视频行业十几年的总和,这不是运气,这是生产工具的阶级跨越,也是他说超过工业革命的智慧革命。 所以我们在杭州和深圳一直和创业者老板们强调,学会用扣子这种工具去调动头肯,你才能把电费变成利润。 有的学员也靠 ai 智能体把获客成本降低了百分之八十,这才是真正的资源红利。所以,这一波红利,你打算怎么接?谁又是你心中的中国 token 之王?关注三月,带你拆解 ai 商业化底层逻辑!

你敢信吗?未来你的工资很可能不是老板给多少,而是你能用多少。 ai 算力黄仁勋最新那场演讲,我已经完整看完了,核心讲的人和事,其实都指向同一个方向。 ai 不 只是工具,它在重写整个职场的分配逻辑。我帮你把里面对普通人最关键的三点掰开、揉碎,讲清楚。一、你的工资条正在变成偷看额度。 以前你拿钱靠的是时间,比如一个月上二十二天班。再早一点是计件,比如做多少拿多少。但现在开始变了, ai 时代的成本单位变成了 token, 你 让 ai 写一句话,做一张图,跑一次分析,都在消耗 token。 那 问题来了,这跟你有什么关系?说白了,公司未来不是只买你的时间,而是给你一笔 ai 预算,看你能不能把这笔算力用出价值。 你用同样额度干出十倍产出,你就值十倍工资,你用不好,那这笔资源在你手里就是浪费。翻译成人话就是,以后拉开差距的不是你加班多久,而是你会不会用 ai 放大自己。二、你学的不再是技能,而是编排能力。以前我们是怎么成长的?学 excel、 学编程,学设计,一项一项啃,然后自己动手干。但现在,逻辑完全反过来了, 你要学的不是我会做什么,而是我能不能让 ai 帮我做。你可以把自己想象成一个导演,而不是演员。你不需要会每个工具,但你要知道什么时候用哪个工具,怎么把它们串起来。比如同样一件事,做调研、写报告、整理数据。以前是你一个个步骤做,现在是你设计流程,让 ai 去跑, 你负责定方向,控制量收结果,这背后的变化是什么?说白了,就是从亲自干活的人变成调度生产力的人。一个人调动十个 ai, 就是 一个小团队。但未来的职场没有中间层了,只剩两种人。这个点其实最残酷。 过去每次技术革命都会拉开差距,会用机器的人比手工劳动者赚的多,会用电脑的人比不会的人机会多。但这一次不一样, ai 的 放大倍数太夸张了,会用 ai 的 人,一个人可以顶一整个团队,不会用的人不是慢一点,而是直接被替代出局。你看重点来了,这不是你努力一点还能跟上的差距,这是你在这个体系里还有没有位置的差距。 未来不是大家一起慢慢升级,而是直接分层筛选。所以把这三点连在一起看,你会发现一个更大的变化。真正可怕的不是 ai 变强,而是你还在用打工换时间的旧思维,去面对一个用算力换产出的新世界。我们这一代人,很可能第一次遇到生产力可以被无限放大的时代, 那普通人该怎么办?给你一个最简单但最有用的建议,从今天开始,别再只想着学一个新技能,而是每天花一部分时间去练一件事。怎么把一件完整的工作用 ai 拆解组 和自动完成,哪怕很小。比如写一篇文章,做一份表格,整理一次信息流,你都去尝试用 ai 编排一遍流程。最后我问你一个问题,如果未来真的变成一个人加 ai 等于一个团队,那你是想做那个指挥 ai 的 人,还是那个被替代的人?