一周烧掉两千一百亿,老板夸他会花钱。烧的越多越狼性,烧的越少越摸鱼。现在程序员 kpi 不 看代码,看字数,我就纳闷这字数是啥学名? talking, 简单说就是你跟 ai 聊天,按字收费, 字越多,老板越觉得你卖力。 made up shopify 搞了个 talking 排行榜,烧得多就是狼性,烧得少就是摸鱼。好家伙,数字时代的计件工资 最离谱的是啥?有人为了刷 talking, 同时开了十几个 ai 窗口,跟打游戏开小号刷经验一样,纯属无效内耗。 有工程师说了实话,其实一句话能说清的是,非要拆成十句 talking, 立马翻十倍,效果一样。但谁敢精简? 精简了,次数少了, kpi 就 低了,工资就少了。这就好比明明骑共享单车五分钟能到,非要打车绕三环,老板还让你开发票报销。要我说,这就是新时代的摸鱼经济学。 不是摸鱼,是摸 talking, 表面上多劳多得,实际上劳的是技术,得的是焦虑。烧的是公司的钱,企业更惨,这玩意已成成本黑洞。当年云计算烧钱烧到失控,现在悲剧又来一遍, 因为打老板黄仁勋还放话,要让托管成为继工资、奖金、股权之后的第四大筹码。好家伙,把烧钱写进劳动合同。所以兄弟们,不管你是写代码、做表格还是写 ppt, 都得长个心眼。工具是帮你偷懒的,不是帮你演戏的。 记住抠脚大叔这句话,真正的效率是让工具帮你少干活,虚假的努力是让工具帮你多花钱。咱们学的是偷懒的智慧,不是烧钱的姿势。觉得有道理的评论区扣个摸字,咱们下期见!
粉丝172获赞587

颠覆传统薪资体系的变化,正在全球科技行业悄然发生。 ai 计算单位 token 中文名称、词源被正式纳入国外多家大厂工资条,员工的核心竞争力不再是工作时长,而是用最少 token 创造最大价值的能力,成为继基本工资、奖金、期权之后的第四薪资支柱。 从英伟达 meta、 open ai 到爱立信 shopify, 国外企业纷纷将 token 用量与薪资绩效考核深度绑定,重塑 ai 时代的职场规则与价值分配逻辑。 英伟达 token, 星球革命的全球标杆底薪加 token 双轨制落地作为这场变更的发起者,英伟达将 token 写入工资条的方案最为激进且系统化。 黄仁勋在 gtc 大 会上明确提出,未来英伟达工程师的星球结构将分为两部分,一是几十万美元的基本工资,二是相当于底薪百分之五十的 token 预算。 例如,年薪五十万美元的工程师将额外获得二十五万美元的 token 配额,用于调用 ai 模型运行智能体开展研发工作。黄仁勋甚至直言,若年薪五十万的工程师一年仅消耗五千美元, token, 将被视为资源浪费与效率低下。 不用 token 的 工程师就像芯片设计师,坚持用纸笔画电路。这一方案的核心是将 token 从成本项转为新筹项,企业通过发放 token 配额,倒逼员工深度使用 ai 工具,实现效率十倍提升。目前,英伟达已为四万名员工规划 token 预算,目标是实现人机比例一比一百, token 预算总规模预计突破二十亿美元,成为全球首个将 token 纳入核心薪资体系的巨头企业 met, 原 facebook token 消耗排行榜算力竞争纳入绩效考核。 mate 作为 ai 研发的头部企业,虽未直接将 token 金额写入工资条,但已将 token 消耗量作为员工绩效考核的核心指标,形成算力竞争的职场文化。据纽约时报报道, mate 内部推行 ai 使用量排行榜,工程师、研究员比拼单日单月 token 消耗数据, 重度使用 ai 的 员工可获得绩效加分,奖金倾斜,而极少使用 ai 的 员工会被约谈,甚至影响晋升。 met 工程师的 token 消耗规模惊人,部分研发人员单月消耗超两千一百亿 token, 相当于读完三十三遍为几百克的全部内容,单日 token 成本可达数千美元, 这些消耗全部由公司承担,并纳入人力预算。 met 的 逻辑是, token 消耗直接反映员工对 ai 工具的使用深度,在 ai 驱动研发的模式下,算力投入与产出成正比。 将 token 消耗纳入考核,本质是推动全员拥抱 ai, 避免员工因固守传统工作方式而被淘汰,这模式已成为硅谷科技公司的通用做法。 openai token 预算分极致按岗位价值分配算力资源作为 ai 模型的研发源头, openai 自身的薪资体系改革极具代表性, 其采用 token 预算分极致,将 token 配额与员工职级、岗位价值直接挂钩,写入员工月度薪酬明细。 openai 将员工分为普通研发、技术骨干、核心研究员三个等级,对应不同的 token 预算。普通研发人员月 token 预算约五千美元,技术骨干提升至一点五万美元,核心研究员则无上限, 可根据研发需求申请额外配额。同时, openai 建立 token 使用复盘机制,每月统计员工 token 消耗效率,即每美元 token 创造的研发成果效率,排名靠前的员工可获得额外奖金,排名靠后的则会缩减下月预算。 这一模式既保障了基础算力供给,又通过效率考核,避免资源浪费,让 token 成为衡量员工研发能力的量化指标,也让薪资分配更贴合 ai 时代的价值创造逻辑。 爱立信跨国算力新筹 token 成本超越员工年薪瑞典电信巨头爱立信是欧洲企业中率先推行 token 新筹的代表,其模式更具国际化特征。据斯的戈尔摩工程师透露,爱立信为全球研发团队统一配置 token 预算,欧洲工程师主要调用 anthropic 的 cloud 模型, 亚洲团队则适配本地 ai 工具, token 成本由公司全额承担,并计入员工薪酬福利。部分资深工程师的月度 token 消耗成本已超过自身基本工资。例如一位年薪八万美元的工程师,月均 token 支出达一万美元, 全年 token 成本超十二万美元,远超年薪。爱立信的核心考量是电信行业的网络优化、设备研发高度依赖 ai 仿真与数据分析,充足的 token 配额能大幅缩短研发周期,降低人力成本。尽管单员工 token 支出高昂, 但整体效率提升带来的收益远大于成本,这也印证了 token 薪酬在重研发行业的可行性。加拿大电商巨头 shopify ai 工具补贴加 token 报销柔性落地 token 薪酬体系 方案更偏向柔性落地,未直接将固定 token 金额写入工资条,而是通过 ai 工具补贴加 token 费用全额报销的方式,将 token 成本纳入员工薪酬利范畴。 shopify 为所有员工提供免费的 ai 工具订阅服务,包括 chat、 gpt、 enterprise、 gotify、 compilot 等,同时设立专项报销额度,员工因工作产生的额外 token 消耗可全额报销,每月报销上限与员工职级挂钩,普通员工五百美元,管理层两千美元。此外, shopify 将 ai 使用效率纳入年度考核,员工提交的工作成果需标注 token 消耗数据, 高效利用 ai 的 员工可获得算力先锋奖。奖金直接与 token 消耗效率挂钩,这种模式兼顾了灵活性与激励性,适合业务多样化、 ai 使用场景分散的企业,也为传统企业转型提供了参考。总结 token 写入工资条的三大模式,覆盖不同企业的落地需求。 综合国外企业案例, token 薪酬主要分为三种模式,一是直接计入薪酬,如英伟达的底薪加 token 双轨制,将 token 配额作为工资的固定组成部分,写入工资条明细。二是绩效挂钩模式,如 meta openai, 将 token 消耗与效率纳入绩效考核,间接影响奖金与晋升。 三是福利补贴模式,如 shopify、 爱立信通过报销补贴承担 token 成本,将其作为员工福利的一部分。三种模式各有侧重,直接进入模式适合科技研发型企业。 绩效挂钩模式适合追求效率竞争的企业。福利补贴模式适合传统行业转型企业,共同构成了 ai 时代薪酬体系的新框架。 token 薪酬带来的深层变更,重塑职场生态与价值分配。 首先,职场考核标准从看时长转向看算力,员工的核心竞争力变为 ai 使用效率,不会用 ai 低效消耗 token 的 员工将面临淘汰。其次,企业成本结构重构, token 支出从 it 预算转移至人力预算,算力成为企业的核心人力成本。 最后,人才流动逻辑改变, token 配额充足、算力支持完善的企业更具吸引力。全球人才竞争从薪资竞争转向算力竞争。同时, token 薪酬也带来争议。部分员工认为,过度强调 token 消耗会导致为烧钱而烧钱,忽视实际产出,且不同岗位的 token 需求差异大, 统一标准易引发不公平。但不可否认的是, token 写入工资条已是不可逆的趋势。正如黄仁勋所言, token 正在成为新的硬通货,谁掌握 token, 谁就掌握 ai 时代的生产力。对于全球职场人而言, token 不 再是陌生的技术术语, 而是与工资、奖金同等重要的薪酬组成部分。学会高效利用 token, 提升算力产出效率,将成为未来职场的核心生存技能。而对于企业而言,构建科学的 token 薪酬体系,平衡算力投入与效率产出,将是在 ai 竞争中占据优势的关键。这场由 token 驱动的薪酬革命才刚刚拉开序幕。

ai 时代的内卷真的是太逼火了,硅谷程序员的内卷彻底变天,不比代码写的好不好,不比项目交付快不快,就比谁的 talking 烧得多。这场疯狂的视频,业内称之为 talking maxing。 talking 刚刚定义为词源,本 是 ai 行业的标准计量单位,结果转头就成为了硅谷打工人的内卷利器。有的工程师一周烧光两千一百亿个词源,相当于三十三本完整记为百科的文字量。还有人一个月砸十五万美元在 ai 工具上,纯是为了烧钱换绩效。更离谱的是,这不是私下内卷, 黄仁勋在 gtc 大 会上直接放话,资源要成为继薪资股权奖金之后,科技人才争夺的第四大筹码,甚至要给工程师发相当于半年薪的资源预算。硅谷大厂已经把这件事从传闻变成了事实。 tucker 说的越多,就是骨干,就是核心人才。甚至有人为了出数据让 ai 整夜空转, 完全背离了 ai 提效的初衷。 ai 是 帮人省力气提效率的工具,现在反倒变成了打工人的努力疯狂内卷的枷锁。最后我想说一句,真正努力的不是烧出来的资源数据,而是实实在在的价值。别让 ai 便利变成打工人的焦。 ai 时代的内卷你怎么看?来评论区里聊一聊。

万万没想到, ai 还没彻底解放职场,却先把打工人的 kpi 卷成了玄学。如今,连消耗多少个 token 都能成为衡量绩效的硬指标。这场激情的内卷,正在颠覆太多人的工作逻辑。企业急于落地 ai 战略, 标榜数字化转型,却缺乏衡量 ai 使用价值的科学标准。为降低管理成本,倒逼员工使用已投入的 ai 工具,便将滔滔消耗量、 ai 使用率、 ai 解决率等可量化数据,直接与绩效、岗位留存挂钩,让 ai 从工作工具沦为职场新枷锁。这类考核已在多行业落地, 其有真实案例佐证。硅谷 openai 米塔工程师被要求充 token 消耗,有员工一周耗两千一百亿 token, 堪比三十三个为几百颗文本量,月度 ai 账单高达十五万美元。国内部分大厂划定 ai 使用率硬指标,基础工作也必须走 ai 流程。 电商、金融行业要求客户 ai 解决率超百分之九十五,即便 ai 达非所问,员工也不能随意转人工,程序员群体更遭双重压榨, 团队精简后工作量不减,还需完成翻倍 ai 相关考核。为迎合考核,职场人刻意拆任务、刷无效交互,甚至造假数据,核心工作被搁置,效率不升反降。企业则面临 ai 成本暴涨、服务质量下滑、 客户体验变差的困境,投入与回报完全失衡。说到底,离谱的 ai kpi 并非技术问题,而是企业考核思维的僵化与功利化。 i 核心是辅助工作,唯有建立以实际成果为核心的考核体系,让 ai 回归工具本质,才能避免技术沦为内卷推手,实现企业与员工的双赢。

朋友们大家好,现在的硅谷有一套全新的评价程序员的标准,看你消耗的算力够不够多。在 meta 和 open ai 内部,如今挂着一种全新的员工排行榜, 榜单上的核心指标是谁能以最快的速度烧掉公司的算力。这就是当前硅谷最流行的新考核机制 token。 ai 工具的使用量已经成为绩效评估的参考指标之一, 主管们会奖励那些大量使用 ai 工具的员工,同时敲打那些用的太少的人。 token 是 人工智能处理文本的基本计量单位, 要让 ai 干活,就得消耗 token, 而每一个 token 都标着明确的价格。用消耗量来考核工作表现,就像按照打空了多少发子弹来评价一名士兵的战功,哪怕这些子弹全打在了天上, 员工们很快就把数字刷到了令人折舌的地步。一位 openai 的 工程师单人就烧掉了两千一百亿个 token, 相当于把整个维基百科的内容翻来覆去读了三十三遍。 一位瑞典软件工程师则表示,公司单在他一人的 cloud code token 上花的钱就超过了他本人的工资。一个人当然烧不掉这么多算力,因为活根本就不是人干的。 今年,一种名为智能体的技术被视为 ai 领域最重要的新突破。过去是人问一句,机器答一句。 现在以 openclaw 为代表的智能体平台中写了规则,你只需给出一个模糊的目标, ai 就 会自动拆解任务、编辑代码、运行测试并自我修正。在这一系列自动化操作中, ai 在 后台不断进行自我对话,海量 token 就 在机器的高频循环中化为乌有, 这种全自动模式极具传染性。随后, openai 招募了 opencloud 的 创建者,外界认为此举意在巩固其行业领先地位。其他平台也都在狂奔, cloudcode 刚刚推出手机端功能,让程序员在马桶上也能逃出手机指挥 ai 干活对公司内部 token 是 成本。对公司外部 token 是 业绩。 对员工个人 token 又开始变成态度。科技巨头对这种挥霍态度暧昧,甚至鼓励。 open ai 的 高管最近公开炫耀其主打编程的模型,每天要处理五万亿个 token。 庞大的数字被直接包装成成功的标志,当做安抚投资者的定心丸。 在这套逻辑里,效率的定义正在被悄然重写。从用最少的资源办最多的事,变成用最贵的资源办最少的事,机器说的话越来越多,至于人到底做成了什么,反而成了更需要费力辨认的那部分。 所以当你看到 openai 每天处理五万亿 token 的 新闻时,不要以为那是用户在疯狂提问。更可能的是,一群程序员正被 kpi 逼着让 ai 自己跟自己聊天,好把公司的算力账单刷的足够漂亮。 这套考核机制本质上是一场大型的资源错配游戏。公司要证明 ai 有 用,员工要证明自己有用,于是大家一起把算力当烟花放。烟花很好看,但谁在为火药买单? 是投资人,也是未来要为 ai 服务付费的你我当消耗算力本身成为业绩真正的生产力,反而成了没人关心的背景噪音。

大家好呀,上周呢,黄圣经 gtc 大 会讲了两个多小时啊,芯片架构,外引市场信息量巨大,但我今天只想聊一件事情,在这演讲里呢,真正跟你我打工人有关系的啊,其实他塞进了一个公式, 叫做皇室陈述,他说未来每个工程师呢,除了年薪,还会有一笔这个年度的 token 预算,他打算在员工基本工资的基础上呢,再额外拿出一半的薪水,全部用来买 token。 换回来的是什么呢?那当然是十倍百倍的生产力啊,你品一下这个账, 假如说一个工程师的年薪是三十万美元,王俊雄说他会再花十五万美元呢,给你买 tucker, 十五万呢,换出来的是十倍几十倍的这个生产力啊,这根本就不是什么怨情啊,他是一个真正的, 而任勋把它提炼成一公式,叫做皇室陈述,也叫做呢人机算力杠杆笔。算法很简单,就是员工的消耗的 token 的 净额除以他的员工的薪资啊,就是这个人机杠杆的算力笔。 黄仁兴认为这个理想值是零百分之零点五,就是你花在 ai 上的钱呢,应该是工资的一半。那这个公式呢?那这个公式到底会怎么改变我们这些打工人呢?主要是以下三个方面啊。首先呢,肯定是我们的薪资结构变了, 过去呢,我们的 offer 呢,是底薪加期权,未来呢,还会多一项,就是提成,远远不止这个数啊。 而新的原话是, token 预算已经成为这个谷歌的标配了,谷歌招聘的标配了, offer 里呢,现在都要写一行新的内容,这岗位附带的是多少额度的 token 啊?你想想,这意味着什么呢? 过去你跳槽,看薪资,看股票,看团队,未来呢?你给大家再问一句,你给我配多少 token 呀?人少了我可不去啊,因为没有这个 token 呢,我的工作价值发挥不出来的。第二个变化呢,就是衡量你这不值钱的标准变了, 过去看你产出多少代码,写多少方案,谈多少客户。未来老板呢,可能会给你一个新的指标,就是你托克消耗量。 这不是我瞎说啊,国内已经有很多公司呢,在执行这个标准了,他们给技术团队每日下达消耗 kpi 的 这个消耗托克的 kpi, 他 们的逻辑也非常简单啊,就如果一个技术员工,他消耗的托克特别少,说明他在说明他没有更好的利用这个 ai 这个杠杆。 结果怎么样呢?功能交付速度更快了,以前大家不愿意干的脏活累活,比如说 qq 啊,写文档啊,测试啊, ai 接手呢,之后呢,效率翻倍, 整个团队的工作方式呢,变得更加 ai native。 后来反过来,反过来你也可以想,如果两个工程师,一个是大量消耗头,更产出翻倍,另外一个呢,是纯手工古法编程,效率不变,你是老板的话,你会怎么选?答案已经很 绝了,这就是皇室臣的精妙之处,也是他的错,他不是考核 ai 的, 他是考核人的。第三个变化呢,就是一人等于一家公司啊,正在成为一个现实。 黄仁清说,如果员工一半的薪水就偷啃,让生产力放大十倍,那你反过来算,如果一个人掌握十倍的杠杆,那他还需要十个人的团队吗? 这就是过去一年全网都在讨论的热热点啊,一人公司一个人在多少 ai ai 的 协助下,独立完成产品的设计、开发、测试、上线、投放,做到直接呢?以前可能需要十几个人,二十多个人, 但是现在呢,可能就一个人就可以跑,跑完整个全全链条全路径了。所以你会发现,我之前讲的不只是英美达的事啊,英美达的芯片,它其实是讲一个更大的人的价值呢,该怎么重新定义过去你的价值呢?是技能乘以时间啊, 未来你的价值就是你的判断,你的决策里乘以你能撬动的 token 的 量,技能可以被 ai 替代,技能可以被 ai 替代,时间是有上限的,但判断里 token 杠杠的, 理论上是没有天花板。最后呢,我们来总结一下黄氏陈述这个公式啊,表慢象呢,是一个企业核算 ai 成本的工具,但它背后却隐藏着三个信号,第一呢,就是 token 正在成为跟薪资平行的成本相, 企业给你花钱,一半是养你的脑子,一半是为 ai 啊。第二就是你消耗 token 的 能力会变成你新的竞争的能力, 不是你会不会用 ai, 而是你能不能用 ai 把你的战斗力放大。第三呢, ai 不是 在取代人,它是在用新的质量标准, tokyo 的 标准去判断人。谢谢大家啊!

又有公司把全麦阿尔法纳入公司的考核章程里面了,从账号支持到绩效考核,实行末尾淘汰制。但是里面提到一点,每个月只支持一百美金,有人就说,这一百美金可能都不够一天烧的。 黄仁勋也说过,如果一名五十万年薪的程序员,一年烧托克烧不到二十五万,那将令人抓狂。未来托克用多少,就是你水平得多少。 今天国家超算互联网又开始送三千万的头肯,大家都可以去领了啊!这所有的信息都表明,未来头肯就像水电煤、电话费一样,他是能源之一,每一次工业革命,他背后烧的都是能源。 第一次工业革命看上去是蒸汽机,实际烧的是煤。第二次工业革命它是电,后来我们的是石油。现在进入我们的投坑时代,投坑未来跟我们水电煤一样,投坑的本质是算力和电力,电本身的传输是不能走太远,是没法出口的,但是电力可以通过 算力转化为 token, token 进行出口。未来所有公司对人效的管理,都要变成对百万 token 的 价值的管理,也就单位内的 token 到底能产生多少价值。未来所有人都会用 ar 工具,都会使用 ar 场景,但是 同样一个人使用同样的 token, 创造的价值肯定是不一样的,这将是一个长期计算和管理的一个过程。 阿里已经成立悟空事业部了,他就看准了整个拓客市场,未来拓客市场必定是像水电煤一样成为我们的日用品。现在拓客还在免费和低价的时代,咱们一定要抓住这个波红利,去拥抱 ai, 未来再去学习 ai, 可能成本就没有这么低了。

谁能想到,硅谷程序员的内卷已经卷到了烧钱比命狠的地步,不拼代码熟练度,不比项目交付速度,只要狂烧 token, 就能被老板当成骨干。有人一周烧光两千一百亿个 token, 有人一个月砸十五万美元在 ai 编程工具上。这场荒诞的比拼被业内戏称 token maxing。 这不是危言耸听, 硅谷已经把 tok 记星从传闻变成了板上钉钉的真事。黄人勋直接放话,让 tok 正式成为记薪酬、奖金、股权之后,科技人才争夺的第四大筹码。迈塔蛇、皮法等巨头紧随其后,不仅将 tok 使用量与绩效强挂钩,内部还实时公示 tok 消耗排行榜,谁烧的 tok 多,谁就是拼命干事的核心员工。 这直接催生了 token 消耗的爆发式增长,也让刷 token 成了程序员的必修课。为了多拿 token 多挣薪资,有人同时启动几十个智能体,甚至钻起了工具漏洞。 可没人敢戳破一个真相, token 记心看似多劳多得,实则是一场无效内耗的骗局。高 token 消耗从来不等于高产出, verso 等企业虽有 ai 提效的正面案例,但更多程序员只是为了多拿 token 薪资。更有工程师直言,只要提炼提示词, 就能将 token 消耗降低百分之九十九,效果却丝毫不减。更关键的是,这些被疯狂烧掉的 token, 成本全由企业承担。随着用量激增, token 已经变成企业的成本黑洞。当年云计算初期成本失控的悲剧正在 ai 时代重新上演。

在深圳呢,在公司总部,在深圳这边的话有一个新的一个考核方式,是什么呢? ai 绩效考核,跟这边的朋友吃饭聊天都聊到了一个问题,今年公司增加的新指标, 第一个是 ai 使用率,第二个是 ai 技能考核,企业内部已经出现了考核,企业招聘也会有一个对 ai 使用的一些面试的一些新花样,网上还有开玩笑说的,面试官要求你提供偷看使用记录, 当然呢,没那么恶搞啊,面试官没有那么无聊,可以看到今年的大趋势,各大的公司都在用 ai 转型,从各种各样的部门, 所以你不扣顶这个东西会成为接下来半年的时间给到各大公司转型,会给到很多人新的岗位机会, 但是呢,也会淘汰掉非常多的一些跟不上的,像现在每天都在更新新的模型,新的技术方案,新的工具,这些工具还都还不稳定,还是属于是争市场的阶段, 到后续了就会慢慢的固定出来哪个是擅长什么方向的。 所以这两年变化会非常的大,会需要适应非常多的工具,非常多的模式,以及非常多的团队变化。 ok, 希望你们也能跟上这个节奏。

绩效考核就是为了扣工资以及 pua 你 而诞生的制度,你不会真的以为这套制度是用来激励你、培养你、肯定你的吧?我跟你讲,大错特错。他真正的逻辑从一开始就设计好了,标准由他们定,门槛由他们调节,释权永远在他们手里。你拼尽全力做到合格,他们就把目标再往上提。 好不容易达成优秀,他们就把规则再收紧,反正总有理由让你拿不到全额的钱。最讽刺的是,久而久之,你被训化了。每次考核结果一出来,你第一反应不是在质疑规则,而是拼命反思自己啊,我哪里做的不好,我哪里还不够?我该怎么改啊? 你主动把所有的问题都揽在自己的身上,你的底气一点一点被磨没,腰杆越站越弯。然而他们要的就是这个效果呀,就是要让你从心底里觉得自己不配拿更多。当你默认自己不够好,你就不敢谈加薪,不敢提要求,不敢反抗。 你越是自我否定,就越好管理啊。在很多公司眼里,好管远比能干更重要。公司最怕的从来就不是你不够努力,而是你根本不在乎这个考核。你不追优秀,不贪好评,甚至不纠结于那点分数,那他们这一套用来拿捏你的工具,瞬间就废了呀。记 住一句话啊,绩效考核从来不是衡量你的价值,他只是用来控制你的手段。所以啊,别再拿他们的尺子去量你自己的人生,你自己的价值,不该有一张考核表说了算。

如果有人告诉你,工程师每周在工作上烧掉三十三个维基百科内容的文本量,你会想到什么?疯狂加班?超大规模项目?都不准确,这烧掉的不是时间,也不是精力,而是偷啃 人工智能时代最核心的计量单位。过去一年里,这个概念从一个只有技术专家才懂的专业术语,迅速渗透到了招聘谈判、绩效考核、员工福利乃至企业的战略布局之中。 但问题随之而来,当企业用 token 消耗量来定义一个程序员的价值时,我们衡量的到底是生产力,还是一场无谓的数字狂欢? 一、硅谷新蜂巢烧 token 成了 kpi 竞赛如果你最近走进硅谷一家科技公司的办公室,可能会对那里的聊天氛围感到陌生。一位 met 工程师向外媒透露,一午餐时的话题已经不是你在做什么项目,而是你同时在跑几个 agents。 这里的 agents 指的可不是特工,而是那些二十四小时不间断运行的 ai 智能体,负责编程、数据分析甚至是报告专写。这氛围的起源,是一种被称为 token maxing 的 隐性文化。 在一些顶尖科技公司,例如 meta 和 open ai 内部,竟然出现了实时的 token 消耗排行榜,像游戏中的战力榜一样 滚动,显示着哪位员工在 ai 上的开销最大。数字的疯狂程度远超常人想象。据二零二六年初的报道, open 有 一名工程师在一周内消耗了两千一百亿个 toc, 足以填满整个维基百科三十三遍。 这甚至还不是个例,一位爱立信驻斯德格尔摩迪工程师每月在 cloud ai 上花费的账单高达十五万美元,超出了他自己的薪资,费用则完全由公司承担。 这些 token 数字背后不再是个人兴趣或实验,而是正在被制度化的新型绩效指标。梅塔和 shopify 等巨头已经宣布将 ai 驱动的影响力或 ai 使用 正式纳入所有员工的绩效考核。二、丰厚的 token 预算甚至作为一种新型的员工福利被写进了录用通知,其定位类似于曾经的免费午餐、交通补贴。 英伟达西医欧皇人勋甚至公开预测,未来工程师年薪中的 token 预算可能占到总薪酬的一半,与现金同等重要。产业层也在印证这股浪潮。在二零二六年三月的英伟达 gtc 大 会上,皇人勋将 token 定义为 ai 时代的基石和最值钱的大众商品。 次。阿里巴巴紧跟步伐,宣布成立全新的阿里巴巴 toker hop 事业群,明确其职责为创造 toker、 输送 toker、 应用 toker。 这一切都清晰表明, toker 已从一个技术单元演变为贯穿技术组织和商业的核心货币。 然而,这个新赛道上,所有人都只关心烧掉了多少,却没人追问这到底烧出了什么价值。二、成本迷宫为什么 toker 便宜了,总账单却更贵了? 当你听说 cloud opus 的 价格降至五美元每百万 token、 deepseek 等中国模型低至零点二八美元时,可能会以为 ai 的 使用成本在大幅下降。 但如果你是一位企业首席技术官,很可能会看到一张相反趋势的账单,这背后是一张远比我们想象中复杂的成本网络。 聪明的代价模型正在变的话,多技术进步并非单向降低成本。推理模型变得更加聪明, 但他们思考和生成的过程也更长了。业内分析报告指出,推理模型的平均输出 token 使用量是非推理模型的五点五倍。 antropica、 openai 等公司已把扩展思考 extended thinking 产生的 token 纳入输出计费。因此,尽管单个 token 单价下降,但完成同一个任务所需的总 token 量可能翻了几倍, 最终成本并未降低甚至更高。 agent 的 涌现从一次性消耗到持续燃烧过去用户使用 ai 是 随用随开,现在编程智能体 coding agents, 如 cloud code、 open code 等,可以无人指手地运行数小时甚至数天。它们能自动拆解任务、 调用代码、修复漏洞,并派生子 agents 协助。每一步都在燃烧成千上万个 token, 这不再是交互,而是一场连续的、自动化的消耗。 据阿里云估算,单个 a 阵的算力消耗是传统问答式 ai 的 一百到一千倍,直接推动中国日军偷啃,消耗量在短短数月内激增数倍,从三十万亿月升至一百八十万亿级别。底层油费在暴涨 ai 模型只是引擎,而运行引擎的燃油及底层基础设施成本正全线看涨。 算力与存储从二零二六年初开始,各大云厂商陆续提价,阿里云、百度智能云宣布上调 ai 算力和存储产品价格,最高涨幅达百分之三十四。谷歌云则宣布在五月上调 ai 基础设施费用。 计费项分类,过去费用主要包含输入输出 token, 现在网页搜索、 web search、 文件检测、 file search 代码执行容器、 code container、 运行绘画、 sessions、 内存、 memory bank 全部成为独立的收费项。 例如 openai 对 gpt 五模型进行网页搜索的收费是每千次调用二十五美元。 anthropomorphic 为 cloud 模型的不同服务模式,如标准缓存、批量高速设定了完全不同的 token 价格体系,差距可达十余倍。 新的价格结构以 openai 为例,其定价页面明确区分了多个层级的收费项目。二、模型能力之外的附属环节被拆分成一个个独立的成本中心。 google 的 vertex ai 平台也正沿着相同的路径推进,对 agent 中的每一项具体能力分向标价。三、 简单来说,用户已经不再是只为想法付钱,而是为运行一个智能体所需的全套可计算环境、计算存储记忆、搜索买单。 当你还在为 token 单价下跌而感到欣喜时,可能没意识到支撑整个环境的高速费和停车费正越来越贵。三、 kpi 陷阱无度消耗背后的焦虑与盲区在铺天盖地的 token 消耗新闻中,一份 shopify ceo 二零二五年的内部备忘录颇有深意。 tobiao tokyo 在 备忘录中声称, ai 带来了此前认为不可能的十倍产出,但他没有透露任何关于如何具体衡量这种产出的细节。这正是当前 toc 经济学结构性缺陷的核心。 整个行业似乎陷入了一个循环,只衡量投入 toc 消耗量,却无法有效衡量产出完成任务的价值和效率。一、这导致了至少两个层面的严重问题, 成本指标、扭曲效率信号。内部排行榜的逻辑很简单,消耗多的排钱。于是便会出现一种反常情况,一个低效的 agent 花了一百万 token 完成某个任务,在排行榜上表现优秀。 而一个经过精心调优,只花了十万 token 就 完成同样任务的 agent 反而名落孙山。这种激励机制实质上是在奖励低效和浪费。 新型职业焦虑的诞生当 token 消耗量被等同于工作能力和 ai 影响力时,一种被投资人描述为 token 焦虑、 token anxiety 的 新型焦虑便产生了。工程师们开始担心不利用公司慷慨的 token 预算不在排行榜上名列前茅,是不是说明自己不够现代、不够高效? 至于早期的网站建设热潮、后来的 app 开发热潮如出一辙,技术的采纳行为本身被符号化,消耗量成了是否跟上潮流的代理指标。然而,这一次的成本是真实且高昂的,十五万美元的月度 ai 账单绝不是一个可以忽略的数字。 最终,这种无实质回报的生产力表演不仅不能创造真正的商业价值,还可能将企业拖入一个深不见底的成本黑洞。 四、破局如何与 tucker 浪潮共处而不被吞食?面对这场正在席卷职场的 tucker 军备竞赛,无论你是程序员、团队管理者还是企业决策者,被动的随波逐流绝非上策。从效率工具的使用者转型为智能工作流的设计者, 是在这场变更中保持优势的关键。回归初心,关注任务完成率衡量 ai 价值的核心应从每百万 tucker 多少钱,回归到完成一件有价值的事情值得花多少钱? 管理者需要建立 token 投入产出比报表,结合业务价值,如商业价值,平分决策质量系数来对冲单纯的消耗量考核,推动考核维度改革,增加类似人工干预率等平衡指标,避免 kpi 被单一数字绑架。技术优化用巧劲而非蛮力 任务分层处理,将标准化、流程化的工作交给预设指令清晰的智能体 a 阵化,可有效降低百分之三十的 toc 开销。而对于复杂任务,应采取决策树策略,先本地提取关键信息,再调用 ai 处理核心决策点,避免全量数据扔给模型造成的无效消耗。 模型调度与选型建立智能模型路由策略行业最佳实践表明,将百分之七十的轻量任务路由至低价模型,如 antropica 海库,百分之二十给终极模型如 sonet, 仅百分之十。留给最昂贵的高性能模型如 opus, 总成本可降低约百分之六十。 善用技术与定价策略,充分利用模型商提供的成本优化工具,如批处理 batch api 已获得半价优惠。利用缓存机制,将重复内容的读取价格降至标准输入的十分之一。成本监控与弹性管理 意识,改变行为。安装 token 计量插件,实时了解不同操作的消耗量,培养算力经济性思维。同时,利用云服务商的差异化定价策略,如在电力成本较低的西部地区或电网股时段运行重载任务,可显著降低单位算力成本。 五、未来的路口从数据崇拜走向价值衡量 token 价格的持续下降是毫无悬念的趋势,市场的真正分野将发生在那些盲目崇拜消耗数据的企业和那些建立了精细价值衡量体系的企业之间。 这场由 token 引发的职场革命,揭示了数字经济从资源消耗型迈向价值创造型的必然阵痛。 他拷问的不仅是技术效率,更是我们如何在激励创新与遏制浪费之间找到平衡。当所有人都疯狂参与这场刷量大赛时,真正有远见的玩家或许已经悄悄退出了排行榜,开始计算他们用同样的头肯解决了多少真正棘手的难题, 创造了多少不可替代的价值。毕竟,在人工智能的时代,最昂贵的或许不再是烧掉了多少 token, 而是我们用它点亮了什么。从投入到产出的惊险一跃,将是所有参与者接下来必须要面对的终极考验。 以上便是本期视频的全部内容,感谢收看!我是陌上懒喵,希望大家能点赞、关注、转发、支持一下,谢谢!

最近, token, 也就是词源,已经被科技公司写进薪酬年包和绩效激励里。昆仑万维二月底发出的通知中强调,将把 ai 编程能力纳入正式考核体系,技术研发人员必须强制使用东鹏 ai codex 或 quote code, 效率没提高百分之五十,或者没达到 ai 编程要求百分之五到百分之二十的人员,会被末位淘汰。 万维集团董事长兼 ceo 方汉透露,公司每个月给每人充七百块钱,抽啃算下一年支出最少约一千二百万元,但他觉得太值了,每月百万元的开支,约等于二十个员工的成本,基本是公司一个月自然流失的员工数量,但换来的是研发速度提高了超过百分之五十,尤其是架构师和 team meter 级别, 估可以达到三到五倍的提升。五八同城的姚靖波更夸张,现在公司每天消耗两千亿的 token, 他现在不问员工加不加班,而是问团队卡怎么还没用完,下一批啥时候买。在他的逻辑里, token 用的越多越好,员工要是 ai 应用不足, 真的会当场发火。不难发现,以前是靠人力熬通宵,现在是靠 vi 跑数据。你的价值不再是能加班,而是能不能调教 ai。

鬼谷的程序员们最近盯上的不是代码质量,而是 token 消耗量。有人一周烧掉两千一百一个 token, 有 人一个月砸下十五万美元,在 ai 编程工具上一日内给这个新趋势起了个名字, token maxing。 这不是传闻。黄仁勋公开表示, token 正在成为继薪酬、奖金、股权之后,科技人才争夺的第四大筹码。 meta、 shopify 等公司紧随其后,不仅将 token 使用量与绩效挂钩,内部甚至开始公示 token 消耗排行榜, 谁烧的 token 多,谁就被视为核心员工。这直接催生了 token 消耗量的爆发式增长,也让刷 token 成了部分程序员的必修课。 为了拉高消耗,有人同时运行几十个智能体,有人钻起了工具的漏洞。但一个值得警惕的问题是, token 记性看似多劳多得,实则可能带来资源错配。 高 token 消耗并不等于高产出。有工程师直言,通过优化提示词,完全可以将 token 消耗降低百分之九十以上,效果却丝毫不减。 更关键的是,这些被大量消耗的 token 成本最终由企业承担。随着用量激增, token 正在成为企业的新增成本压力。当年云计算初期成本失控的场景,似乎正在 ai 时代重新上演。

朋友们,一场由 token 驱动的生产力革命,正从技术底层席卷到企业管理和职场规则。三月二十四日,国家数据局公布,到今年三月,我国日军 token 呃 掉用量已经超过了一百四十万亿,相比二零二四年初增长了一千多倍。相比二零二五年底的一百万亿,三个月时间里又增长了百分之四十多啊!托克已经成为了科技企业的新型硬通货,开始被写进薪酬年包和绩效激励里。 呃,入职时会附带多少 token 配额,也成了硅谷近期的热门招聘话题。呃,英伟达二零二六啊 g t c 大 会长黄世勋预测说,未来英伟达的每一位工程师都需要年度 token 预算 啊,他们的年薪可能是几十万美元,我会额外再给他们相当于薪资一半的 to cap 配额,让他们实现十倍的效率提升。那国内企业呢?几十七号啊,三月十七号,就媒体报道说,是阿里巴巴集团正在推动一项内部计划,向员工提供 to cap 额度, 以此鼓励员工使用悟空啊等啊付费的 ai 工具。此外啊,员工购买 呃,会员或者是外部的 ai 开发工具啊,都可以申请报销啊,都是跟偷看相关的啊,就是你一年消耗多少,你偷看啊,呃,用多少资源啊,这些呢,可能都会记录你的整个工资账户。关注我,投资不迷路!

mate 员工正在用 token 证明自己的价值,你的 kpi 还停留在加班吗?今天 mate open ai, 把 ai 使用情况纳入绩效考核,内部甚至出现了 token 消耗排行榜。 有个工程师一周消耗两千一百亿 token, 相当于读完三十三遍维基百科。李宁教授说,任天这把尺子已经在说谎了。 a 员工加班七十二小时, b 员工用 ai 只花四十分钟产出,完全一样,你说这算几个人?天,我见过一位前阿里屁九,出来创业后天天逼自己社交,后来才发现他其实是 ngg, 习惯深度思考,却被逼着做 ngg 的 事,三个月后崩溃了。不是能力不够,是操作系统错了。 比尔盖茨离开微软后,用思考者的方式做慈善。张一鸣卸任 ceo 说,我要换个更适合我的模式去创造。你以为你了解自己,你只是在用别人的标准评价自己。评论区留言欧米,看看你的操作系统在 ai 时代该怎么运行。