大家好,我是 cos。 前一个图文作品发布后,很多人问普通人怎么在 a a 浪潮里赚钱,今天我用一个视频告诉你,不做研发,不写代码,靠倒卖托克到底行不行? 开始之前先叠个 buff。 视频所有内容仅代表个人观点,所有数据均来自于公开渠道,仅供参考,不构成投资建议。接下来咱们直接开整。 先看第一个数据,国内大模型过去半年全球掉用量暴涨百分之四百二十一,从去年九月到今年三月,全球份额从百分之十九冲到百分之四十三。也就是说,现在全球每五次 api 调用,就有一次来自于国内模型,海外用户正在疯狂涌入。 来看第二条,价格方面,国内主流模型像 deepsea、 千问豆包、百问托肯只要零点二到三点六元,而海外 gpt 要三十块, closed 要三十五块, 国内价格只有海外价格的十分之一到十七分之一,性能方面却能达到百分之九十以上。如果你是开发者,你会用哪个?再看海外数据, 半年即增百分之一百五,哪里便宜又好用,用户就往哪里跑,这就是背后的真实需求,也是当 ai 前客的黄金窗口期。所以结论很明显,能干但是要干的聪明,你不需要自己训练模型,只要把这些模型聚合起来,做一个模型超市,把性价比优势做出来,这就是可行的。 接下来七天,我会每天出一期视频,从市场趋势、渠道注册、网关搭建等带你跑通全流程,关注我,别错过!也欢迎大家来我主页找我交流,我是 cos, 咱们下期见!
粉丝3433获赞9438

提供情绪价值是一个繁重的权益劳动,这个概念,群众当中大部分时间大家还不太理解。现在有个困难,大家发现头肯都是耗电,都是耗钱的,你自己的钱也是一样。你给别人提供情绪价值,首先要看别人情绪,烦了之后,自己先管控自己的情绪,自己先不要烦,对吧?然后谈谈观色,思考对方需要听到什么样的话,然后组织自我,做自己语言,一种温和的 supportive 方式去安抚对方的情绪。 一系列过程,包括大家控制自己的情绪,观察对方的微表情,然后思考,组织自己的语言。都是闲来的繁重工作,你这个过程中可能一整天下午也没干什么真正的活,但光跟同事聊天聊着天,回到家以后就很累了。为什么很累了?因为你切切实实的消耗自己的头肯。跟大象相比,你自己的头肯就是只消耗馒头,不消耗钱吗?但他不是不消耗钱,你自己会累吗? 这概念我觉得好多人不懂,好多人就是在工作的时候,把很多自己的头肯已经浪费掉了,把自己的高级知识功能全都在日常消费完了之后,回到家了之后,没有头肯用了,没有钱的时候,只能用一些比较便宜的,廉价的一些,降低低工 降频的、低功率的。强烈的思考,然后去应付自己家里人的情绪,你说不好吗?反过来,你在职场上就应该嗯啊哈哈哈。哦。回到家以后再跟老婆跟孩子,然后提供自己的情绪价值,这才是一个你的情绪价值该用的地方,你投的电费应该花在刀刃上。

token 出海是什么意思?我们一起来看一下,先和大家讲一下什么是 token。 token 其实就是 ai 服务的一个计费单位啊, 既然是计费单位哈,我们通俗的来讲,就换成英文单词或者是中文的这个汉字,一个 token 大 概等于零点七五个英文单词,或者约等于一点三五个中文汉字,每个国家都有,每个国家的这个语言和文字是大家是不通的啊,那么最公平 最公开的一个方式呢,就把这个文字呢转换成 token, 比如说你问 ai, 今天天气怎么样啊?这么简单的一句话,那么 实际上呢,会对 ai 来讲哈,它就是变成了若干个 token。 那 么 ai 回答你啊,今天的天气晴啊,这个温度是二十度。回答出来,这个文字呢,也是转换成 token 啊,不管你送哪个国家的这个文字都一样的,都转换成 token。 token 出海这个词听上去好像很高大上,其实是什么意思呢?其实就是让外国人,让鬼佬来用中国的这个 app, 用中国的这个大模型,用中国的 ai 服务,这个就叫 token 出海。 第一啊,我们先说一下模型层啊,什么叫模型层,就是呃大模型层面的啊,然后呃它的体现形式,可能是 app, 也可能是提供这个 api 的 这个接口啊,就直接地卖 token, 也就说直接赚鬼佬的钱,可能是包月包年啊,怎么样的 直接面向鬼佬来提供这个 ai 服务的啊?我列了这五家,一家 mini max, 它是呃港股的龙头啊,全球的。这个钓用量呢,应该是第一,海外的收入就是占比了百分之七十几啊。 第二呢是呃制服 ai 啊,它是面向东南亚和中东比较多一些。第三呢是 kimi, kimi 就是 月字暗面啊,它的这个优势在于它的这个长文本的这个模型啊,在海外还是很受欢迎的,并且它海外的这个收入也超过了国内。 第四个呢是 deepsea 啊,大家很熟悉啊,用,而且只有 open ai 的 大概十分之一左右。第五个是昆仑万维啊,昆仑万维有一个叫天宫大模型,这个海外的这个收入占比也是逐步在提升的, 这是模型层啊,模型的背后是什么呢?是算力啊,就在背后提供算力的啊,比较核心的我列了这三家啊, 第一,宏博股份,它对应的是这家啊, minmax, 它是 minmax 的 这个独家的这个双利提供商,而且呢,在那个美国,呃,有自建这个数据中心啊,打算这个海外做交付。 第二呢是手足在线啊,手足在线对应的是这个智普 ai 啊,是智普 ai 背后的这个算力提供商。第三个润泽科技啊,这个呃是字节的这个核心的这个算力合作伙伴啊,呃,主要主打这个东南亚的算力项目, 还有一些做呃,跨境的这个算力的啊,火烈了这四家,其中网速科技呢,是做全球的这个 c、 d、 n 加速的,并且它也有做这个边缘计算。中北通信主要是呃海外算力和这个跨境网络两个布局啊,服务于这个东南亚和中东的一些模型出。海 利通电子呢,主要是跟英伟达做一个合作哈,然后呢,自己呢,布局这个国内和东南亚的这个算力的这个租赁。回到最开始的这个标题哈,电力加算力 token 出海啊,因为中国的这个电力呢,相对来讲是比较便宜的,那我们的算力呢,是比较厉害的, 所以呢,这个在背后做支持,我们就可以 token 出海。很多人搞不懂 token 出海是什么意思,因为有不少媒体把简单的事情复杂化,显得自己高深莫测,其实 token 出海就是这么简单,我们下期见。

哈喽,大家好,欢迎收听我们的播客,今天咱们要聊的话题呢是 token 出海,那这个话题呢,我们会从 token 出海的基本逻辑,为什么现在这个时间点 token 出海会成为一个风口,让包括 token 出海的产业链上面有哪些重要的企业,以及 token 出海未来的市场会怎么发展这几个角度来给大家聊一聊。 好,那我们就直接开始今天的主题吧。咱们先第一个先来聊出海的逻辑啊,就这个 token 出海到底是个什么东西?它的本质是什么啊?就是简单讲就是,呃,海外的用户或者企业,他通过调用我们国内的这个大模型的 a p i, 然后呢?呃,他每消耗一个 token, 就 相当于他用了我们国内的一份算力嘛?那这个时候他的这个请求是通过网络发过来的,我们国内的这个智算中心进行计算之后,把结果再回传给他。 这个过程其实就是一个我们把算力以 token 为单位卖到了海外,听起来像把国内的算力变成了一种可贸易的数字商品,没错没错,对,那它的这个底层其实是靠我们国内的这个绿电以及我们的这个大规模的 gpu 集群,还有我们的这个先进的大模型技术,然后把我们的这个电力变成了一种高附加值的数字服务出口, ok, 对, 那它其实跟这个传统的这种硬件或者说云服务的出海还是不太一样的,它是一种 更高效的、更灵活的一种跨境的商业模式。你觉得中国的这个 token 出海为什么可以在全球市场形成这么强的商业模式,你觉得中国的这个绿电价格非常便宜啊,可能就欧美电价了四分之一, 然后呢,我们又有这个大规模的制算中心,所以我们的这个算力的成本也被拉下来了。我们可能就是,呃,每百万 token 处理的成本比欧美要低百分之三十到六十,有的甚至可以说我们的这个成本只是他们的十分之一到二十分之一,成本优势确实吓人。对,然后更巧的是这个 wto 的 这个电子传输是免征关税的, 所以我们这个 token 出海是几乎没有什么贸易壁垒的。再加上我们的这些国产的大模型在国际上面的这个评测当中也越来越强,所以我们现在不光是有价格的优势,我们现在也有技术的优势,所以就是相当于我们这个竞争力是非常非常强的。你觉得这波 token 出海热潮背后的核心的推动力到底是什么?我觉得首先第一个就是全球对 ai 算力的需求是爆发式的, 你看这个多模态,还有这个 ai agent 这些新的玩法出来之后,大家对这个推理的需求就是成倍的往上翻,然后市场规模可能接下来几年都是以万亿为单位的, ok, 但是呢,这个海外的这些云厂商呢,他们又在不断的提价, 所以大家就开始寻找更便宜的地方。那这个时候呢,中国的这个算力就成了一个新的宠儿。确实,现在大家都在追求又便宜又好用的算力嘛。然后呢,我们国家又有这个东数西算这个工程,把我们西部的这个绿电和我们的这个大规模的集群都用起来了,所以我们的这个算力的成本是全球最低的。我们的这些国产的大模型 在国际上面的这个评测当中也越来越强,再加上我们的这个政策层面,不光是给你免税,还给你把这个数据跨境和这个合规的框架都搭得非常的稳, 所以就是相当于给你铺了一个高速公路,让你这个东西可以出海。然后咱们来进入第二部分,就是咱们来聊一聊这个 talkin 出海的这个产业链都有哪些核心的企业在这个不同的环节。 ok, 那 这个产业链主要都分哪些环节呢?整个这个产业链的话,其实可以分成上游的绿电和跨境网络,以及下游的这个大模型 a、 p、 i 和 mas 平台。 ok, 那 在这个其中呢, 其实每一个环节都有一些骨干的企业在里面发挥作用,就说每一个关键的步骤都有专门的玩家在里头深耕,是吧?没错没错没错,是的是的,你比如说像这个提供绿电的和能耗指标的,那肯定就是一些 大型的能源企业啊,然后包括一些有地方国资背景的一些公司在做。那这个智算集群和算力租赁呢,就有一些头部的这种云计算的公司啊,也有一些这个专门的这种新锐的玩家在里面。 那这个跨境网络和数据的流通呢,就有一些呃专业的这种 c、 d、 n 和边缘计算的公司在帮你做保证,这个芯片和硬件呢就更不要提了,有一些呃国产的这种芯片巨头在帮你做支撑。这个大模型和 mas 平台呢,就更是有一些这种本土的这种 ai 龙头和一些呃,全球化的这种平台在帮你做。最后就是这个 金融和合规这一块,也是有一些支付科技的公司和一些啊持牌的这种机构在帮你做,保驾护航, ok, 对, 就是这样大家才能形成一个合力,把这个 token 出海这件事情真正的做起来。你觉得这些 token 出海的这些企业,他们在布局上面有什么共通的地方吗?呃,其实我觉得他们第一个就是大家都在跟头部的大模型做深度的绑定, 就是确保自己的这个 token 的 消费是有一个持续的很大的量的。然后第二个就是大家都在电价比较低的地方,或者说绿电比较充裕的地方去建自己的这个智算中心 啊,来压低成本。所以就说既拼技术也拼资源呗,没错没错没错。然后除了这个智算中心的布局呢,大家也都在全球各地去铺自己的这个节点啊,来减少用户的访问延迟,包括在网络的合规啊,数据的安全啊,上面下很多的功夫,就是让你能够 跨国的这个调用就像本地一样的顺畅。同时呢,大家都是聚焦在这个推理的算力上面啊,来实现一个更高的资源利用率和一个稳定的收益。你觉得这些企业在这个头肯出海这个赛道里面,他们的竞争优势到底在哪里?我觉得首先就是他们已经形成了一个从 绿电的供给啊,到芯片啊,到这个制算中心啊,到这个跨境的网络啊,到大模型啊,再到这个金融的合规啊,这样的一个完整的产业生态, 那这个其实是全球范围内都是非常少见的哦,等于说大家是在多维度展开竞争。对,而且就是呃,头部的公司都在加紧的绑定这个低价的绿电啊,然后扩充自己的这个制裁的潜能啊,不断的去拓展海外的市场啊,也在跟这个监管啊,去推动这个合规的互任啊等等的。那这些其实都是一些门槛,让后来者很难去快速的跟上, 所以就说未来的格局会越来越清晰,那这些龙头的公司的优势也会越来越明显。我们来进入第三个板块,我们来聊一聊未来的趋势啊,就是中国的这个 token 出海的市场份额和这个地域的格局会怎么发展?呃,这个其实最近的数据已经很震撼了,就是中国的这个 ai 模型的 token 的 全球的市占率已经超过了百分之六十。 然后呢,这个头部的厂商里面有很多,他们的海外的收入已经占到了大头,甚至有一些就是纯海外的用户占比超过九成啊,这个就是说海外的需求已经成为绝对主力了。对,没错,而且这个日军的 token 的 消耗在过去的一年半的时间里面涨了三百倍,然后呢,预计到二零二六年可能会突破五百万亿,就是全球每消耗三美金的推理的算力就有两美金,是中国的 这个北美、欧洲是主要的市场,但是呢,东南亚、中东这些地方也在加速的增长,所以就说未来中国的这个主导地位只会越来越巩固,可能到二零三零年的时候市占率会超过百分之七十,你觉得接下来几年这个 tokin 出海在技术和产业生态上会有哪些新的变化?呃,我觉得就是首先就是芯片和硬件层面的这个国产替代会明显的加速, 就是升腾啊,海光啊、韩五 g 啊这些本土的方案会成为智算中心的主力。然后呢这个也会让整个这个算力的占从下到上都能够自主的掌控,所以整个链条都在变得更自主、更高效。对,没错。然后呢,包括这个大模型本身也会在这个 混合专家模型啊,包括这个迪比特量化啊,包括这个多模态的能力上面不断的去突破,包括这个智算中心本身也会往这个夜冷啊、绿色节能啊去发展。 整个这个液态也会从这个单纯的卖 api 调用到这个提供一整套的这种算力加模型、加应用,加合规的这种全站的解决方案,甚至是跟这个终端的应用出海形成一个壁画,所以就是说这个技术和生态的这个护城河也会越来越高。你觉得就未来这个 token 出海在商业模式和这个产业格局上会有哪些新的变化? 呃,现在大家还是以这个按 token 计价的这种推理机服务为主。那未来的话,这个通过开源模型和这个微调工具来吸引用户,然后再叠加这个企业级的定制啊,和这个生态的分成,会成为一个主流, 那这个聚合平台的作用也会越来越大,就是他会成为一个全球的开发者,都来接入中国的这个算力的一个统一的入口,所以头部公司的优势会越来越明显吗?对,就是这样,就是最终会形成一个 强者越强的一个局面,就是那些拥有低价绿电的啊,然后拥有大规模的制算中心的,以及掌握了核心的模型的,这些巨头会牢牢的占据这个主导地位,那其他的一些小的玩家可能就会被整合,或者是说就出局了,那整个这个产业的协助也会变得更加的紧密。那同时呢,大家也要去面对这个各地的监管的挑战啊,数据合规的挑战, 所以这个行业的门槛也会越来越高。对,今天我们从这个托肯出海的基本的逻辑,到他背后的一些驱动力,然后再到这个产业链的全景以及未来的一些趋势给大家聊了一遍。那其实最后我们也可以看出来,就是这个 浪潮其实给投资者带来的是一个非常独特的横跨多个高成长赛道的这样的一个投资机会。好了,那就是这一期节目咱们就到这里了,然后感谢大家的收听,咱们下期再见,拜拜。拜拜。

买一亿 token, 从一百三十五元到六万八千零四十元不等,但问题是, token 到底是什么?它如何变成账单上的数字?一亿 token 梦干啥?这篇文章从本质消耗到价格,给你把账清。 token 到底是什么?很多人把 token 等同于汉字或单词,其实不是。 token 是 大模型理解语言的最小计算单位。模型眼里,文本不是连续的句子,而是一堆被拆分好的积木。你问的每一句话,发的每段文字,都会被先切成 token, 再送入模型处理。 不同模型的切法不一样。英文模型多用 bpe 算法,把单词拆成更短的片段,压缩性强。中文模型则偏向单字或词组分词,更贴近我们的表达习惯。简单理解,一个 token 大 约对应一到两个汉字,但这只是估算 精确技术,要看模型内部算法。为什么按 token 计费?因为它能精确度量、算力消耗、输入提问要算,输出回答也要算。每多一千个 token, 对 应的 gpu 运行时间、电费、人力成本都是限性增加的。 对开发者和企业来说, token 是 最直观、最可控的成本单位。你可以把 token 看作 ai 世界的度量横。没有 token, 模型无法量化你输入的内容,也无法给出公平的价格。 日常任务到底消耗多少 token? 不 同人、不同场景, token 消耗天差地别。下面按使用人群分级,给你一个可直接套用的计算。每天写五封邮件,翻译两篇短文,偶尔问几个问题,属于轻度用户。 这类场景 token 消耗很低,每天大约两千 token。 如果你只做这些,一亿 token 够你用整整五十年。中度办公与内容创作,每天写代码、处理文档、整理会议纪要、批量写稿,属于中度用户,日均消耗大约五万 token。 一 亿 token 大 约能用两年。 自媒体创作者日更一到两篇长文,每篇两千到三千字,单次生成约三千 token。 加上批量修改标题优化,多轮对话, 全天消耗可能落在三万到六万 token 区间。重度企业场景,比如企业级 ai 客服智能知识库内部 agent 系统,一个中型客服系统,每天一万轮对话,每轮平均两百 token 就是 两百万 token。 如果再加上自动回访、语义解锁、总结分析,消耗量可能到一千万到两千万 token, 每天 一亿 token, 对 这类公司来说,大约只能撑五天到十天。专业高消耗任务编程 agent 代码生成,项目级开发科研模拟一个完整的小项目, agent 可能要反复写代码,调试解释逻辑,单次任务消耗可达一百万 token, 代码审查一次也可能消耗五万 token。 所以 你看到的是一个问题,一句话,但模型背后可能是成百上千次的内部计算和 token 消耗。二零二六年最新价格,一亿 token 到底值多少钱?以下价格按二零二六年三月行情第一超清量模型梯队,这些是个人用户、中小业务的首选。性价比拉满。 genuine flashlight 一 百三十元每一 token。 通一千问一百四十元每一 token。 gpt 五一百六十二元每一 token。 deepsea, 两百四十八元每一 token。 选择这一档,个人日常办公足够用五年以上。对中小公司来说,月度 a p i 成本几乎不会成为负担。第二,终端模型梯队。适合中小企业日常业务、中等复杂度任务。 gpt 五 mini 八百一十元每一 token。 kimi k 二,九百九十元每一 token。 gemini are flash, 一 千零八元每一 token。 这一档在逻辑推理、内容结构化、代码生成上比轻量模型更稳,同时价格可控, 很多公司把百分之八十的非核心业务放在这一档。第三,旗舰模型梯队。企业级核心应用的主力配置, g p t 五,四千零五十元每一 token germany r pro, 四千零五十元每一 token。 cloudsonnet, 四,六千四百八十元每一 token。 它们的上下文窗口大,推理能力强,长文本处理稳定,适合知识库、科研分析、多模态内容生成等关键业务。第四,顶级推理模型梯队。这是 ai 产业的塔尖。 cloud opus 四,三万两千四百元每亿 token gpt 五 pro 六万八千零四十元每亿 token。 主要用于尖端科研、金融量化、高端代码开发、复杂系统仿真,普通场景很少用到,但它们能完成普通模型无法完成的深度推理。从一百三十五元到六万八千零四十元,一亿 token 的 价格差距超过五百倍。为什么差这么多? 因为能力、算力、成本、战略目标完全不同。价格差背后的真相是,基础能力、廉价化模型、基础能力,文本理解、内容生成、基本问答已经成为标准化商品,技术成熟,竞争激烈,所以超轻量模型能把成本压到百元级别。顶尖推理、稀缺化 数学推导、跨领域深度分析、高精度代码生成仍然需要千亿参数、海量数据、高端 gpu 集群,这些资源,成本居高不下,导致顶级模型价格无法下降。二零二六年的 ai 市场很清晰,基础能力像矿泉水便宜且可替代 顶级推理,像黄金仍然稀缺且昂贵。另外,输出比输入贵三到十倍,大部分模型输出 token 价格是输入的三到十倍。 输入是你说的话,输出是模型生成的内容,生成过程更复杂,成本更高。如果你在做长文本创作、报告生成、故事写作,要特别注意这一点,一篇五千字报告,输出可能比输入贵十倍。 a 阵时代消耗暴增,怎么省 token? 三个方向七成成本可压缩。第一,提示词精简, 把永长指令改成简短要点,比如,请详细、全面、系统的分析问题,并给出创新、实用的方案,约一百五十 toc 优化成分析问题,并提供三个实用方案,约四十 toc, 节省超过七成。 删除废话,保留核心动词和名词,不要用形容词堆句子。第二,模型分级,使用简单任务用轻量模型,复杂任务用终端,关键业务采用旗舰,这叫模型路由,是企业降低成本的最有效手段。 第三,缓存上下文压缩 r a g 缓存重复问题,命中率可达三成,成本低十倍。定期压缩对话历史可节省五成到七成。用剪缩增强生成替代长提示词指剪缩最相关内容,节省三成到七成。总结下, token 是 ai 世界的通用计量单位,是你和模型之间的成本桥梁。 日常使用它藏在每一句话里,企业使用它体现在每天的账单上。二零二六年,一亿 token 从一百三十五元到六万八千零四十元不等,背后是能力、成本战略的分层。 看懂 token, 就 能看懂 ai 时代的价格逻辑,也能在数亿元的产业中找到最适合自己的性价比区间。 ai 不是 遥远的技术,它正在变成每一个人、每一个公司都要掌握的工具,而 token 就是 你打开工具大门的钥匙。

玩 open 可乐大龙虾必踩了十个坑,今天我给你总结一下,我用了三台电脑,部署了三个大龙虾,用了一个月烧了上亿的偷啃,含泪总结的,看这大炮起 的。第一坑啊,烧,偷啃,我最开始不懂啥是偷啃,我就花钱买了点用用就没了,我说这玩意就再买点呗,但咱也买不起,我就十块钱十块钱充,然后就在这一天晚上,我用了十五分钟时间烧了一百刀偷啃, 我用三天就烧光了半个月的头发,关键烧头肯不可怕,可怕的是烧了还没有效果。第二坑,那老 agent, 他 都自带幻觉 呀,你让他写代码,他去写,给你写个诗你受得了吗?第三坑,我纯纯代码小白,我啥也不懂了, 那老代码一报错,给我整的天书根本看不懂啊。第四坑啊,自己嘎自己,我天天跟他说,我说你刚才进行了错误配置,你导致系统非常乱呐,哎呀,你搁这处理状态呀,就你可能睡一觉或者你你说了个确认,他夸嚓他把他配置代码 全删没了。第五坑,我以为我这大模型都老好了,他跟我说天花乱坠的,结果他说了干不干,说干了没干,我说你把那个插件给我装了,他说好嘞,马上去装,我说你装好没,他说我装好了,你再一检查他啥也没干,你说气人不? 他的第六坑,大模型琳琅满目,你就是不会选,你感觉哪个都挺好,你也不知道到底哪个好。 第七坑啊,都想让他自己出去赚钱吧,都想自己搁家躺着睡觉,一睁眼大龙虾给你干回来二十万吧。 开玩笑呢,实际情况是他可比你会花钱呐,还花的多呢。第八坑,你以为自己不熟老牛逼,结果出来一个词你不认识。出来一个词你不认识。你慢慢发现你好像啥也不认识,除了会说点自然语言之外,啥也不会呀。 第九坑,你以为他能自己打怪升级夸夸一顿进化,你一睁眼一闭眼他就变假维斯了,天天早上爷爷,晚上爸爸叫你,那结果就是他经常被自己的影子分身一顿臭骂。第十坑, 哼哼,整了大龙虾之后,睡觉吃饭啥也不干,天天就想着养龙虾。哎呦,我的龙虾咋又嘎了呢?怎么修呢?欧文可乐,嗯,可以。

如果你花了三十块钱买了三百道的 cloud 的 流量包,你要小心了,它可能正在摧毁你的数字资产和浪费掉你宝贵积累资产的时间。 今天我们来讲一下 cc 反向代理的代价。那我们知道啊,这个 cc 的 话,在国内你很难去买到正版的,或者即使你买到的话,你会花很多时间在网络的连接,连通信以及这个高昂的费用上。 那很多呢,在某鱼上边儿就有卖这种的流量包,比如说买可洛的话,去充值二十八,或者说三十的话,就获得三百刀这样的 一个优惠包。那当你使用的时候呢,你当然你可以直接接到那个 c c 里边去用啊,但是它最大的问题呢,它是通过反向代理 出来的,这些 a p i 接到了你的 c c 上。那什么叫反向代理呢?就比如说我们现在呢,有很多的开发工具 ide, 比如说 kro 啊,或者按按 t grip 啊, 然后这些 ide 的 话,它们本身是支持很多种不同的模型的,那这些模型的 ip 和调用的方式呢?通过一些网络的方式,其实我们是能抓取到这些接口的,那从而呢,我们可以把这些 ide 的 模型的调用呢,我们给它暴露出来,暴露出一个正常的一个 api 出来, 那这些 api 呢,从而让它支持 cloud cc 的 这种兼容模式,那它就可以放在 cc 的 cloud 中去使用了,那这样的方式呢,就变成了一个反向代理的方式, 那它价格呢,就变得极其便宜。就比如说 kiro 或者 angelgrati, 你 办一个比较大的会员,或者使用学生账号或者其他途径的话,它是有很多免费版本的,所以呢, 即使这个商家在做三十元三百刀的时候,其实还是有利用空间的。那这里边我们需要关心的是这些 ide 暴露出来的 cloud code 这些模型的话,为什么对我们构建数的资产是有影响的呢?我们知道这些 ide 里边其实都是自己设置了一个 system prompt, 就是如果你去给它暴露出来的时候,你调用的时候也是带有这个 ide 的。 呃,里边的 prompt, 比如说是如果是 kiro 的 话,它就会 system 里边 prompt 会写着说你是 kiro, 是 一个编程助手。什么什么?这是基于 kiro ide 的 一些规则, anti gravity 其实是一样,包括后边 curso 也都是一样的。 然后它们的 system prompt 的 话,就对我们原来的这些模型呢,其实是进行了一个系统提示词的一个污染,那所以结合克拉扣,它自己也有提示词,我们就变成了这样的。 就原始的 cloud code 呢,是我们有一个 c 自动 cloud code, 这个就是 c c 自己的系统提示词,下边接着我们 u 的 这些信息就可以了。那我们通过反代去使用的这些 a、 p、 i 呢,它就会在 我们 c c 的 这个提示词下边呢,也追加到这个 i、 d、 e 里边的提示词,所以你看啊,上下文就进行污染了,它在最顶层上下文的提示词中呢,其实是 c c 自己的系统提示词中间这一部分和下边这部分 实际才是我们真正调模型这些提示词,那下边两部分是 i、 d、 e 通过反向代理出来的,那你会发现啊,那系统提示词就有两部分,那我们的整个的提示词呢?就进行了一个污染, 那当这个系统提示词进行微污染的时候,我们有很多的 skills, 我 们有很多需要复利工程的让模型去帮我们处理的这些内容呢, 实际上呢,我们就在污染的涉案文里边继续进行操作了。那你说那我污染涉案文,如果我都是 k 肉情况下,我自己也是可控的。其实这里边最大的问题是什么?当我们购买了这种流量包的时候呢?其实它是一个路由的,它一会是 k 肉的,一会是 antigravity 的, 就你很难去数字资产化你的提示词也很难去呃 复利化,你整个的数字的一个债务资产。我给大家举个例子啊,你看这里边呢,是我用了购买流量包的反向代理的 c c, 那 这里边你去问他你是谁的时候,因为他是有两层提示词的嘛,所以他就会说我是 kiro。 那 你知道这个我是 kiro 的 计划,其实是 kiro 里边的 id 反向出来的 api。 然后呢后边有一部分呢,是关于 cc 的 提示词里边的这个身份认证,你发现它就会有两部分的身份认证。当然它去操作的时候,因为 kiro 本身是有它自己的工具调调用的方式,然后 cc 是 有它自己调用工具的方式的,所以你整个的呃关于工具的调用方式也是混乱的。 所以如果大家在使用的话,如果真的觉得 cc 我 们原生去氪金来讲的话,它非常贵的话,我们其实是可以使用国内的这些模型的,最起码里边的上下文其实是不受污染的,不受在不受污染的上下文中呢,我们去构建 我们自己的数据资产,那这个东西才是可持续、可迭代的一种方式。那也希望呢,今天内容对你有收获,关注雷哥,关注 ai 工程化落地。

一九五六年,美国人发明了集装箱,在那之前,全球贸易的成本一半是装卸费。集装箱一出现,世界变了,货物被标准化,运输成本暴跌,全球贸易爆炸。今天 ai 时代也出现了一个集装箱,它叫 token。 很多老板听到 token 只当技术名词,但如果你是做生意的,你要看到的是,这是一次电力的重新定价。 什么是 token? 简单说就是 ai 处理文字的技能班位。你问一句话,写一段代码,生成一份报告,背后都在消耗 token。 重点在于, token 可以 被计量,被计费、被出口。这就像集装箱,把原本难以交易的智能服务装进标准化容器,从此脑力可以像货物一样卖到全球 来。算一笔账,一度电直接出口大概卖零点五元,炼成铝定大概卖一点五元,翻三倍。如果拿去跑大模型推理呢? 一度电大概能产出五百多万。 tokyo 按国内模型定价算,可以卖到十一元,十一元是直接卖电的二十二倍。如果按 open i 的 价格算,将近四百元, 七百八十五倍。你看到中奖了吗?同样是一度电,换个皮价值差几十倍上百倍。这不是能源生意,这是算力生意,是标准化的脑力出口。更关键的一点,电不能装箱,但 tucker 可以 跨国流动, 不用电网,不用特高压,不用对方国家批准,只要一根网线。印度创业者调用中国 api, 背后是甘肃的风电,青海的光伏在转电没出国,钱出国了,这才是结构性机会。 很多老板问, ai 这么卷,价格都打烂了,还赚什么钱?你要明白一件事,现在的二十二倍,不是天花板,是价格战的结果。美国把价格毛在高位,中国用工程能力把成本打下来。一个负责教育市场,一个负责规模收割,这就是新的全球分工。 真正值得你思考的,不是模型谁更强,而是在这个时代,你是卖店的,还是卖 token 的,是卖原材料还是卖标准化能力。 所有产业都会被 token 重构,教育变成按 token 计费,客服变成按 token 计费,编程变成按 token 子计费,营销、法务、设计、咨询全部变成可计量的智能服务。一旦被计量,就可以规模化, 一旦规模化,就会诞生新的巨头。生意的本质从来没变,谁掌握标准,谁赚溢价,谁只卖原料,谁被压价。 一九五六年,集装箱改变了全球制造业。二零二六年, taco 正在改变全球脑力市场。电力过剩不是问题,算力过剩才是机会。美国把 taco 价格炒上去,中国把 taco 成本打下来,悉数东算的战争才刚刚开始。 如果你是老板,现在真正该问自己的,不是要不要用 ai, 而是你能不能把自己的行业装进 tokyo 里卖。

问你个扎心的问题,同样是一度电,有人只能卖五毛钱,有人却能卖四百块,差价八百倍,钱被谁赚走了?这不是技术差距,这是认知差。划走的人,明年可能继续骂生意难做。 答案就在这个词, token。 这可是二零二六年最硬通的数字集装箱背后消耗的计量单位。 过去脑力没法承受,没法打包。今天托肯干了一件事,把人的脑力装进了标准化的容器里。 来,我给你算笔账,算完你就知道钱流向了哪里。一度电直接出口,只能卖五毛钱,这是卖原料的命。把这一度电拿去练电节律,能卖一块五,翻了三倍,这是干工业的活。但如果拿这一度电去跑 ai 推理呢?他能产出五百多万个托肯, 按国内现在的价格,能卖十一块钱,是直接卖电的二十二倍。如果按欧盟 i 的 定价,能卖将近四百块钱,七百八十五倍, 看懂了吗?同样的能源,换了个形态,价值差百倍,更可怕的优势是什么?电需要电网,需要特高压,需要领国的批准。但托肯不用一根网线,托肯就能跨境。 印度程序员调用中国的 a p i, 背后赚的是甘肃的风电,青海的光伏电。没出国,服务出国了,钱流进中国了,这叫资源不出境,脑力买全球。接下来所有的行业都会被 tucker 重构 教育不再按课时按托管计费,客服不再按人头按托管计费,编程设计、法务咨询,只要能被语言描述的服务,都能变成托管打包出售。能计量的就能规模化,能规模化的就能诞生新的巨头。 很多人问二零二六年,他有没有机会,机会从来没消失,他只是换了个马甲。过去,谁掌握石油,谁掌控世界。后来谁掌握电力,谁掌控工业。今天谁掌握托肯,谁掌控脑力。 生意的本质从来没变,制定标准的人赚溢价,出卖原料的人被压价。如果你是老板,别再问 ai 怎么用,你真正该问的是我的行业能不能装进托克里,买到全世界。去 评论区聊聊你的行业。

token 才是中国真正的电力出口。电卖不出国境线,但 token 可以。 一个想了两年才想通的产业逻辑。先说一个反常识的事实,中国是全球发电量第一的大国,年发电量超过九万亿度,比美国、印度、日本加起来还多。但去查海关数据,电力出口这一项几乎可以忽略不计。不是几乎, 是真的可以忽略。为什么?因为电这玩意没法储存,没法长途运输,高压线,跨个国境都费劲,总不能把三峡大坝的电用充电宝打包发往硅谷吧?所以问题来了,手里攥着全球最大的能源,才能却只能在国境线以内打转,这就像开了个金矿,但金子太重,运不出去,只能自己在院子里堆着玩。 直到 token 这个概念出现,事情才开始变得有意思。一算理,即电力,这是第一层窗户纸。很多人到现在还没想明白,为什么美国人对 ai 芯片那么疯魔?为什么英伟达的市值能飙到三万亿美金? 他们买的不是芯片,是算力,而算力的底层是电力训练。一个大模型耗电量相当于三千个美国家庭一整年的用电总和。 openai 搞 gpt negative four 的 时候,光电费账单就吓死人。马斯克去年公开吐槽过,说 ai 再这么发展下去,美国的电网要先崩为敬。这时候再回头看,中国 有电,有大量的电,有全世界最便宜的工业电价。但问题是,把电卖给谁?直接卖电,电网不联通协议谈不拢,地缘政治一缴获十年都搞不定。 但如果把电变成算力,再把算力变成 token 呢?这就是那层窗户纸电出不了国境,但 token 可以。 token 是 数字的,是计时的,是点一下鼠标就能穿越太平洋的东西。在北京,用一千度电算出来的结果,一秒钟后就能出现在旧金山的屏幕上,没人能拦得住。 二、 token 是 电力的压缩包。理解这个逻辑,需要换个脑子。以前出口商品走的是实物路线,原材料工厂、集装箱、轮船、货架这条路线上,中国卡在中间环节,赚的是辛苦钱, 但 token 走的是另一条路,电力算力、模型输出,订阅付费。在这个链条里,电力是原材料,算力是加工厂, token 是 最终产品。而且这个产品有个逆天特性,编辑成本趋近于零。 练一次大模型花掉一千万度电,但产出的 token 可以 无限复制。第一个 token 贵如黄金,第一百万个 token 便宜如尘埃。这种规模效应,是传统制造业想都不敢想的。更妙的是, token 的 定价权在谁手里? 在模型厂商手里。 open 一个 gpt negative four 的 订阅卖二十美金,一个月毛利率超过百分之八十。这百分之八十里面,有一大块是电力的增值。只是增值的方式变了,从卖电变成了卖电的智力成果。中国现在缺的不是电,缺的是把电变成 token 的 炼金术。 三、为什么这事想了两年才想通。说实话,这个逻辑业界琢磨了整整两年,不是笨,是路径依赖太可怕。 这一代商人被世界工厂的趋势淹入味了,总觉得出口就是集装箱,就是码头,就是报关单。数字产品,那是虚拟经济,是泡沫,是脱石象虚。这种偏见根深蒂固,以至于很多人看不见。一个基本事实,全球贸易的增量百分之七十已经发生在数字领域。另一个障碍是技术迷雾。 token、 大模型、算力、集群、推理、优化。这些词堆在一起,天然巨人千里,但拨开术语的外衣,核心逻辑朴素的很。人类正在从搬运原子转向搬运比特,而比特的搬运成本 是原子的百万分之一。想通这一点,再看中国的能源优势,视角完全不同。内蒙古的风电,四川的水电,新疆的光伏。以前愁的是消纳问题,发出来了用不完气风气光,心疼的要命。现在呢?直接建算力中心,就地转化,变废为宝。 电还是那些电,但出口形态变了,价值链位置变了,利润空间变了,这不是弯道超车,这是换道超车。四、暗战已经开始。美国人不是傻子,他们一边喊 ai 安全,一边卡芯片出口,本质上就是在抢电力。 toc 转换链的控制权。 英伟达的 h y, 韩准为什么禁售?因为那是当前最高效的电力压缩器,没有它,电再便宜,转化效率也上不去。但封锁从来都是双刃剑。中国的应对策略很清晰,堆规模,拼效率,找替代。华为升腾、韩五 g、 海光,国产芯片的生态在艰难爬坡。与此同时,算法层面的优化也在狂飙,用更少的算力,干更多的活。 这场战争的终局是什么?可能是一个新的全球分工。美国掌握顶尖模型和生态,中国掌握底层算力和制造。欧洲在边上打监管牌, 听起来有点悲观,但别忘了,电是硬通货,算力是硬通货,而 token 的 产量最终受制于这两样东西的供给,谁有电,谁就有底气,谁能把电高效的变成 token, 谁就能在新一轮全球化里切到最大的蛋糕。


oppo 可浪呢,是我目前用过最强大的软件和工具,但它的 togg 消耗量也确实让很多人望而却步,甚至呢,因为高额成本不敢完全释放它的潜力。 今天呢,我就教大家四种方法,在性能完全不打折的情况,就是前提下把成本降到最低,实现 top。 四。在讲方法之前呢,我们要先弄明白 top 到底花在哪。 其实呢,你每问 ai 一个问题,发过去的就是并不是一句话,而是一个巨大的工作包,它包含五部分, 一、系统规则,他是谁,能干啥。二、工作去文件, a 阵 g 文件等等。三、对话历史会形成滚雪球效应,越聊越贵。四、工具的输出,抓取的网页,论文日制等等。 最后才是你当时的问题。这个呢,就像你雇了一个员工,然后每次想让他工作,你都得把员工手册,公司章程,岗位职责先从头到尾的就是跟他说一遍,然后再问他今天你中午吃了什么,你说这能不会吗?对吧? 那如何节省掏根呢?就是我们今天要告诉他步骤,而不是问题。第一种方法, qm, 传统情况呢,就是把整个资料像填鸭一样,整天给报大模型,就会呢导致输入 token 的 爆炸。 qmd 的 逻辑呢,就是在本地把 make down 数据库建立,所以你问问题的时候,它只提取最相关的几个片段和摘录给部分框,也就是模型,不再读全库,只读需要的部分,那它是如何工作?所以库是如何建立的呢? 第一个是 update, 所以 文件刷新。第二个呢,是向量的更新,以及向量的投,就是投射。重点呢是这两件事全是在本地跑,不消耗云端的投币,也就是说 qmd 把云端投币用来读所有文件和信息的成本都转化为了本地所有的成本。 那如何安装 qm 币呢?你可以让你的 opencloud 帮你安装,或者呢你想就是手动的安装,那么也只有这三步。首先呢就是运行这些命令到我们终端里安装 qm 币,之后呢,我们去到 opencloud 点 json 文件, 确保我们的 memory 是 这样的,然后呢我们就重启网关,这样呢就结束了。还有一点呢,值得一提的就是 qm d 还允许你精确的去控制你的预算,通过三个参数来实现,还是在我们的 open file 边最顺,这个文件形式就是里面 可以看到厘米的,下面呢有三个参数, max result 是 最多可以注入几段, max snivetime charts 是 每段允许多长,而 max injector charts 是 每轮总注入最多允许多长,也就是总的预算阀门。 接下来呢,我们来看第二种方法,就是用本地模型跑心跳,心跳呢就是 open clock 定时的唤醒行为,他呢按照你配置的频率把 a 阵的叫醒一次,让他呢执行一段心跳清单,他的屁的心跳本身就是走一次完整的 a 阵的回合, 他呢可以当监工,比方说你给我们可到一个特别长期的任务,他做就是承诺做完之后可能做一步就不会往下推进了,这个时候呢,我们就可以使用心跳, 定期的呢,每三十分钟的去刺激一下,触发一下我们 a 阵,疼,让他呢没有完成任务之前不准停下来。 这样呢我就保证了我们整个这阵的 open cloud, 我 们 ai 助手有一次性能确保完成我们的长期任务。那为什么心跳呢?会花费很多的 token 呢?因为每次心跳的输入通常都会包含系统提示词, worker space 文件的输入,尤其是 memory 点 md 和 agent 点 md 可能会变得很大,还有可能的对话历史。还有呢,就是 hadbeat 心跳本轮的提示词或清单,所以它的输出可能会很短,可能就是 ok 没有问题,但是输入可能会很大很长。 那如何减小心跳的成本呢?除了增大时间间隔这种常规的方法外呢,最根本还是直接让本地的大模型,小的大模型来跑心跳这种低智商的任务。 心跳呢,只用来触发,不用来执行任何任务。如果用本地的模型呢,大家需要下载一个欧莱吗? 然后呢,根据你电脑内存的配置来选择相对比较好的模型,比方这里的千万的各个参数的模型。然后呢,大家可以去告诉 openclock 心跳呢,触发任务 用本地小模型来做。然后呢,第三种方法,也就是最简单一种方法,就是尽量用订阅,而不是 api 用量。值得注意的呢,是很多的厂商是不支持这么做的,比方说安卓配,比方说谷歌, 他们的订阅呢,是严禁禁止使用到 open klo 的, 避免的,但是 open ai 目前他们是收购了 open klo 的, 所以呢,他们还是开放状的这个状态。如果呢,想要极致的稳定 走 api 用量而不走订阅,这个时候呢,你要注意了,如果你用最新的模型,不论是 azure 还是 open ai 的 模型,你的账单可能会成倍的增长。 最后呢,第四种方法,直接呢给你的 overclock 发指令,让他呢给你生成一个成本的体检报告,不用固定形式, 让他给你一份靠谱起的消耗驱动清单,可以是百分比的形式,看看到底哪项任务呢,最烧钱,最高的消耗来自于哪里找到不合理的地方。因为你刚开始利用 overclock, 总是会有很多不合理的地方, 比如说一个简单的轻任务,却携带了巨就是巨大的上下文。其实呢,有很多不合理的地方是可以被优化, 而高消耗其实不一定是必要的成本,很多很可能是那种就是流程和配置的浪费,我们呢是要根据我们自己的用处和任务来杜绝掉,那发现问题呢?如何优化呢?这里可以分为流程和模型两个方面考虑, 流程方面呢,能不能有一些轮询的任务改成就是事件触发符不符合条件。然后呢就是我们刚才讲的 gdp, 也是一个非常好的减少上下工序, 就是注入的一个方法。第二点呢就是从模型方面,有一些轻任,我们能用更便宜的模型或者小模型来替代,就像我们刚才说过的,用本地模型来做心跳也是一个非常好的方法。 最后呢就是由 openkey 给出的任务清单,和他讨论有哪些任务可以就是优化来减少成本。最后呢我们总结一下 大幅减少就是成本的四种方法,分别呢是使用 g m d 大 幅减少上下文的注入,心跳呢用本地的模型。第三个呢就是尽量用订阅,而不是走 a g i 消耗。第四个呢就是跟你自己的 openkey, 让他列出所有的就是 消耗投款的任务,由大到小。然后呢,跟他讨论优化的可能性以及如何优化,按照这个方案,保证你的欧文克劳既聪明又省钱。如果呢,你的理论别忘了点赞关注,我们下期再见。

这件事啊,真的关乎中国 ai 的 未来,我们不能再让宝贵的算力资源被低价的外流了,更不能让当年 光伏的教训在 ai 行业重演。刚刚看到明源老师讲的一件事情,我非常认同他的观点, 国家呢,必须尽快规范 ai token 的 出口,先给大家用大白话讲清楚啊, token 就是 你跟 ai 对 话时的计费单位, 你问 ai 一 句话, ai 回你一句话,都要消耗相应的投感,它背后对应的是我们的电力、算力贷款服务器,是国家实实在在的基础资源。 当年呢,光伏行业就是因为内部无序的竞争,互相压价,最后整个行业吃了大亏。今天的 ai token 出口正在面临同样的风险。 呃,这不是限制发展哈,而是为了让我们的 ai 走得更稳更强。很多人还没有意识到这里的问题有多关键,现在真实的情况是什么样的呢?我们的 ai token 正在大量低价的出口, 国外机构可以用极其低的成本使用我们的算力来训练他们的 ai, 反过来,我们想用到他们的高端芯片先进算力的时候呢,却处处受限,处处被卡脖子,就形成了一种 我为人用人难为我用的不对等的局面。长此以往呢,我们的核心资源很可能变成别人发展 ai 的 廉价工血包。呃,这也不是谁的错啊,但必须有人提前的提醒,防范,提前的规范。所以呢,呼吁国家相关的部门针对 ai token 的 出口 制定具体务实的方案。第一,把 ai token 纳入国家战略服务出口管理,设立出口价格底线,禁止无序的 低价竞争,不让宝贵的资源被贱卖。第二,建立对等的原则。别人对我们限制算力,限制芯片,那我们也规范好我们自己的 token 出口,形成合理的制衡。三、对出口 token 征收必要的调节税。 这笔钱呢,可以反哺国内的研发,用来攻坚芯片、攻坚大模型、攻坚核心算法, 只有这样,才能形成出口有规范、价格有底线、收益、反哺科技的良性循环。这才是真正对我们 ai 负责,对国家的未来负责。中国 ai 要想真正强大,不仅要技术过硬,更要 清晰的规则,底线牢固。这就是我今天想完整传递给大家的观点,我已经通过我自己的渠渠道把这些建议向上反映了, 如果你也认同,也请你通过合理正规的渠道,一起把这份建言呢传递上去,让国家听见我们的声音啊,关注老杨,贡献自己一份绵薄之力,陪着国家一起强大!