一九五六年,美国人发明的集装箱将货物标准化,直接让全球贸易的装卸成本减半,运输成本暴跌,彻底引爆了全球贸易,重塑了全球制造业格局。如今进入 ai 时代,同样诞生了一个类似集装箱的革命性产物 token。 它不仅是一个技术名词,更是一次电力价值的重新定价,对做生意的老板而言,更是不容错过的结构性机遇。简单来说, token 就是 ai 处理文字的技能单位, 无论是提问、写代码,还是生成报告,背后都在消耗 token。 其核心价值在于,它能将原本难以交易的智能服务 装进标准化容器,实现可计量、可计费、可出口,让脑力能像货物一样通过网络卖到全球。这也是它被称为 ai 时代集装箱的核心原因。一组数据足以体现 token 的 巨大价值,一度电直接出口 仅能卖零点五元,链程履定可卖一点五元翻三倍。而用来运行大模型推理,可产出五百多万个 token。 按国内模型定价,这些 token 能卖十一元,是直接卖店的二十二倍。按 openai 的 价格更是接近四百元,是直接卖店的七百八十五倍。 这充分说明,透肯背后不是简单的能源生意,而是高附加值的算力生意,是标准化的脑力出口。透肯的独特优势的在于,它可跨国自由流动,无需依赖电网特高压,也无需对方国家批准,仅凭一根网线就能实现。电未出国, 钱已出国。比如印度创业者调用中国 a p i, 背后依靠的是甘肃的风电,没有跨境收益,却已流入国内。面对 ai 行业的价格战, 很多老板疑惑,还能赚钱吗?实则,当前二十二倍的价值差并非天花板,而是价格战的结果。美国将 token 价格铰定高位,负责教育全球市场。 中国凭借强大的工程能力压低成本,负责规模收割,这已形成新的全球分工。未来, token 将重构所有产业,教育、客服、 编程、营销、法务、设计等领域都将变成按托肯计费的可计量智能服务,一旦实现计量,就能规模化发展,进而催生新的行业。巨头 生意的本质从未改变,掌握标准者赚溢价,只卖原料者被压价。一九五六年,集装箱改变了全球制造业。二零二六年,托肯正改变全球脑力市场。 电力过剩不是问题,算力过剩才是真正的机遇,基数东算的竞争才刚刚起步。对老板而言,当下最该思考的不是要不要用 ai, 而是如何将自己的行业装进 token 里,实现标准化、国际化售卖,抓住这场时代红利。
粉丝1291获赞4834

一九五六年,美国人发明了集装箱,在那之前,全球贸易的成本一半是装卸费。集装箱一出现,世界变了,货物被标准化,运输成本暴跌,全球贸易爆炸。今天 ai 时代也出现了一个集装箱,它叫 token。 很多老板听到 token 只当技术名词,但如果你是做生意的,你要看到的是,这是一次电力的重新定价。 什么是 token? 简单说就是 ai 处理文字的技能班位。你问一句话,写一段代码,生成一份报告,背后都在消耗 token。 重点在于, token 可以 被计量,被计费、被出口。这就像集装箱,把原本难以交易的智能服务装进标准化容器,从此脑力可以像货物一样卖到全球 来。算一笔账,一度电直接出口大概卖零点五元,炼成铝定大概卖一点五元,翻三倍。如果拿去跑大模型推理呢? 一度电大概能产出五百多万。 tokyo 按国内模型定价算,可以卖到十一元,十一元是直接卖电的二十二倍。如果按 open i 的 价格算,将近四百元, 七百八十五倍。你看到中奖了吗?同样是一度电,换个皮价值差几十倍上百倍。这不是能源生意,这是算力生意,是标准化的脑力出口。更关键的一点,电不能装箱,但 tucker 可以 跨国流动, 不用电网,不用特高压,不用对方国家批准,只要一根网线。印度创业者调用中国 api, 背后是甘肃的风电,青海的光伏在转电没出国,钱出国了,这才是结构性机会。 很多老板问, ai 这么卷,价格都打烂了,还赚什么钱?你要明白一件事,现在的二十二倍,不是天花板,是价格战的结果。美国把价格毛在高位,中国用工程能力把成本打下来。一个负责教育市场,一个负责规模收割,这就是新的全球分工。 真正值得你思考的,不是模型谁更强,而是在这个时代,你是卖店的,还是卖 token 的,是卖原材料还是卖标准化能力。 所有产业都会被 token 重构,教育变成按 token 计费,客服变成按 token 计费,编程变成按 token 子计费,营销、法务、设计、咨询全部变成可计量的智能服务。一旦被计量,就可以规模化, 一旦规模化,就会诞生新的巨头。生意的本质从来没变,谁掌握标准,谁赚溢价,谁只卖原料,谁被压价。 一九五六年,集装箱改变了全球制造业。二零二六年, taco 正在改变全球脑力市场。电力过剩不是问题,算力过剩才是机会。美国把 taco 价格炒上去,中国把 taco 成本打下来,悉数东算的战争才刚刚开始。 如果你是老板,现在真正该问自己的,不是要不要用 ai, 而是你能不能把自己的行业装进 tokyo 里卖。

朋友们,你敢相信吗?中国有一样看不见摸不着的东西,正在悄悄占领全世界。它不是手机,不是汽车,也不是衣服,而是一种叫 token 的 数字服务单位。有朋友可能不太懂什么是 token? 你 可以把它想象成 ai 的 工作量计数器。比如,你让 ai 写一段话,回答一个问题,画一张图,它就要干活,每干一点活,就消耗一个或多个 token。 全球开发者调用 ai 服务,就是按 token 来付费的。 最近,全球最大的 ai 模型平台 open router 公布了一组惊人数据,二月九号到十五号,中国 ai 模型的掉用量第一次超过了美 国。紧接着第二周,咱们直接冲到五点一六万一,三周直接大涨百分之一百二十七,近乎翻倍,而美国那边反而在下降。 更厉害的是,全球使用最多的前五款 ai 模型里,四款都是翻倍,而美国那边反而在下降。更厉害的是 m 二点五,智普的 glm 五, 还有 deepsea 的 v 三点二,加起来占了全球 top 五总使用量的百分之八十五点七。为什么全球开发者都开始用中国模型?两个字,又快又便宜?我们的 ai 不 仅性能强,关键是成本低。而这个低成本的背后,藏着一个很多人没看懂的秘密,中国正在通过 token 把电卖到全世界。 你可能会问,电怎么能卖出国?电线又不能跨太平洋扑过去。确实,物理上的电没法装箱,出口 耗大、成本高,还受国界限制。但聪明的做法是不用送电,送电算出来东西就行。举个例子,一个美国用户调用中国 ai 模型,他的请求通过海底光缆传到中国数据中心, ai 在 中国用本地的电力完成计算,再把结果传回去,整个过程一度电都没出国,但电的价值已经 通过 to 肯实现了。跨境变线,这波操作真的太绝了。要知道,在 ai 的 成本里,电费加算力设备占了七成以上,而中国西部有大量便宜的风电、水电、光伏等绿色电力,电价只有欧美国家的三分之一到五分之一。 再加上我们有完整的服务器、散热光模块等产业链,建数据中心又快又省。所以同样的 ai 服务, 中国能卖的更便宜,响应更快,还更稳定。全球开发者当然愿意用脚投票,纷纷转向中国模型。这一切都是因为全球对 token 的 需求在爆炸式增长。以前中国靠出口衣服、家电、手机赚外汇,那是体力活。 现在我们靠出口店家算力加 ai 服务赚外汇,这是脑力加能源的高附加值生意。屋里的店有国界,但数字的 token 没有国界。店走不出去的路, ai 帮他走,店做不到的事,算力帮他做,店赚不到的钱, token 帮他赚。 这不是炒作,而是一场静悄悄的产业革命。未来,随着 ai 走进医疗、教育、金融、制造各个领域, token 的 消耗只会越来越多。 中国凭借廉价绿电加强大算力加优质模型的组合拳,正在打开一条全新的数字能源出货通道。 这可不是单纯的技术牛,更是咱们国家的战略眼光选对了路,把我们丰富的清洁能源转化为全球都能用的数字服务,既赚了外汇,又利用了清洁能源,还不用跟别人掰扯贸易壁垒, 这波操作简直太妙了!朋友们,中国 ai 这波靠 token 实现电力出口,是不是太牛了?你觉得这四家中国模型谁能成为全球老大?评论区聊聊你的看法。我是率先在全球提出硅基生命与硅基文明的硅基智能创始人司马华鹏,关注我,每天传播正能量,带你解锁更多硬核科技!

哈喽,同志们,今天我们聊聊算力。 ai 时代的全球竞争本质上是一场关于弹药的战争,而在 ai 时代, token 就是 子弹。可能有很多人到现在还不明白 token 到底是什么东西,其实很简单,我这句话给你说明白,就是你跟 ai 哪怕说对话, 说一句话,你让他给你写一个方案,让他给你生成一个视频,生成一张图片等等一系列的,只要你跟他有互动,这些都需要消耗 token。 那 像我们普通人,你平时凑个热闹,跟 ai 去交流交流,让他给你画个图啊什么的, 让他给你设计点什么东西,那就像玩具枪里面的塑料子弹去打个气球一样的,可能你打两枪就不打了,玩过就不玩了嘛。 那现在不一样了,现在的话,因为我们 ai 大 模型的不断升级,不断进化,对吧?我们 ai 越来越牛逼了嘛,那全行业都在用 ai 去干活赚钱了呀,做业务就好像程序员用 ai 写代码,创作者用 ai 去做视频,设计师用 ai 画图等等。 那到了这一步, tokon 就 不是塑料弹了,它是正儿八经能打仗的真枪实弹了,它可以被用来去打市场,用来去赚取真金白银了,就这个子弹打出就能换订单,换零售,换市场了。 但是你要知道,子弹它不会凭空出来的,对吧?每一颗 tokon 的 子弹都得用算力来生产,那算力它就造子弹的兵工厂, 你有多少稳定低成本自己能说了算的算力,你就能造多少子弹,你能造多少子弹,你就能接多大的生意,你能接多大的生意,你就在,你就能在 ai 这条赛道里站的多稳?那为什么现在突然聊这个呢?因为从今年 开年开始,整个情况就突然变屌了。那我们国内的朋友应该是最早感受到这个变化的,先不说远的,就说大家都 刷到过的那个字节的 c 蛋是二点零。这个视频大魔性有多火,不用我多说了吧,前面我也专门,我也有专门出过这个视频,可以去翻一下我前面的视频。 这个大魔性牛逼,是真的很牛逼,能够直接生成剧情啊,带运镜啊之类的对吧?画面也很牛逼,但随之而来的是什么?是全网都在吐槽的排队。就算是你充了五千一百九十九块的高级会员,高峰期提交一个视频生成任务也要排队。就算是你充了五千一百九十二个小时才能拿到一段十几秒的视频, 那我们普通用户就更不用说了,前面排几万人一天都未必能够出片。而且这个还不是个例啊,现在国内所有的头部大模型都在缺算力,都在要排队,小米新模型上线二十天,收入就超过了过去整整一年。二十天对比一年啊兄弟们。 结果就是直接公开高喊缺算力,缺显卡,满世界去找算力合作伙伴。讲一个实打实的数据,就是今年二月份,全球性的 ai 接口聚合平台 open loop 出了官方榜单, 全球掉用量最高的五个大模型,我们中国就占了四个,而且二月每周的 toker 掉用量比一月还比这 翻了一倍。那这组数据的背后,不只是我们国内用的人多了,更关键的是,现在全世界都在认可我们中国的 ai 能力了,像海外的企业创作者、开发者也都在用我们中国的 ai 了,这就不是我们单纯在国内小打小闹了,这是把账直接打到全球市场去了。 那说到这里,就大家都最近都听到的那个算力出海了吗?那很多人以为算力出海就是把服务器啊,芯片啊是这种东西卖到国外去,那我只能说格局小了, 像过去的几十年,三四十年吧,我们中国是靠什么?我们是靠卖衣服,卖家电,卖工业品这种东西去完成全球化的原始积累,赚到了全世界的钱。 那现在呢?现在 ai 时代, ai 时代全世界最缺的是什么?缺的是 ai 算力啊,兄弟们,像现在的海外 ai 应用,用户排队动议就要排一天对吧? 有的甚至可能要排几天,有些国际巨头为了抢产量,连自己的股权期权都拿出来了,就为了能稳定的拿到货。那咱们的算力出来,本质上就是拿着我们自己造的兵工厂给全世界提供 ai 子弹。 那具体的来说就两条路径,第一条就是把我们的国产 ai 芯片、服务器全站系统出海,这个属于硬件出海,是去抢占全球算力基建的份额。第二条是在海外建立合法合规的算力中心,用我们自己的算力底座去给全世界提供 ai 服务, 用我们稳定高性价比的头壳的供给去换美元,换用户,换行业话语权。然后到了这里,有一个很核心的前提, 也是大多数人会忽略的,就是你不可能总拿着别人造的枪管去打仗吧,对吧?说白了就你要是你的 芯片,你的核心技术都是别人的,那别人随时能卡你脖子的对吧?人家一卡你脖子,你不完蛋了?你的兵工厂直接就停工了,你的枪直接就压火了, 那还怎么打仗?怎么出海去赚钱?就像过去我们的数字经济很多时候就是在别人的地级上盖房子,人家一抽地级房子就直接塌掉了。但是现在不一样了,我们国产的高端 ai 新,比如华为升腾的九五零,它核心的推理性能, 也就是我们平时用 ai 干活最常用的能力,已经对标了英伟达的 a 一 百很多场,甚至很多场景下性能还会比人家高一截。同时我们国内的头部大模型现在都在优先配备我们自己的国产算力生态, 先进制程的才能也在慢慢往上爬。也就是说我们有了我们自己的从头到尾全链条都是自己说了算的弹药生产线,有了能够支撑我们把账打到全球去的底气。至于算力会不会过剩,那如果真能过剩,那也是牛逼了。 就现在这个情况,只有缺口没有过剩。按照国际头部券商还有伽纳这种全球第三方机构的测算,我们国内 ai 训练和推理用的算力缺口至少到二八年都会持续存在。因为 ai 对 我们的生活生产的改造才刚刚开始, 我们现在还只是简单的用 ai 去做做内容,写写代码,搞搞设计什么的,那未来 ai 机器人、 ai 驾驶、 ai 制造全部都会深度的用上 ai, 可以 说到时候 ai 应用的地方只有我们想不到,那到了那个时候, tiktok 的 消耗量只会从指数级的往上去 跑,会比现在的这个量要翻好几个量级。那一边是按月甚至按周翻倍的子弹需求,另外一边是建一个数据中心,造一条芯片生产线,动不动就是一年半载,三年五年的 供给周期,需求涨得飞快,然后供给又跟不上。就这条赛道最硬的逻辑,以前的互联网时代,建服务器买算力就是 纯纯花出去的成本,是为了支撑住自自己的业务。那现在对于做算力计件的厂商来说,算力就是能直接赚钱的核心资产了,兵工厂只要开起来,造出的每一颗子弹都能卖钱。而对于下游用 ai 的 公司来说,算力就是现在它最大的刚性成本了, 谁能拿到更便宜更稳定的算力,谁就能比同行更赚钱。也就是现在全世界的公司都想降本, 都想拿稳定的算力,才给了我们国产算力出海最好的历史性机会。投坑为蛋,算力为己,自主可控为核,全球化合规布局为界。这场关于算力的竞争,不是一次短期的风口炒作,而是一场关乎未来 十年中国 ai 产业的长期战役。而能走到最后的,永远是那些手里握着自己的弹药生产线,能把子弹稳稳打到全球市场的玩家。行了,这个视频也够长了,今天就先讲到这里,看完的给我评论区留言。看完了下个视频,我们聊一聊华为的升腾,点个关注,一起发财,拜拜!


兄弟们,最近很火的那个塔拉斯芯片简直太牛了。来啊来,兄弟们,不要眨眼,这个世界上最快的模型它出现了。来啊, 零帧起手有没有?哇塞,简直就是一秒零帧出答案。对比英伟达 h 两百来说,它拥有七十三倍的性能优势,三十八倍的成本降低和十倍的能效提升。再让我们来看一下性能对比,这是塔拉斯芯片,这是英伟达 h 两百, 这是塔拉斯芯片,这是因为达两百。 ok, 让我们来看一下这个,呃,成本对比,我去,这是因为达,这是塔拉斯芯片, 这妥妥的就是价格屠夫。那他其实提出了一个颠覆性认知,叫做模型及芯片。芯片及模型,那以往我们的 gpu 跑 a i 其实就像做题一样,他需要去图书馆翻书,然后再将书还回去。那现在来说的话就是塔拉斯芯片将 斑马三点一八 b 模型直接镶嵌在了这个芯片上,也就是做到了模型和芯片合二为一,数据不用在内存和处理器之间来回搬运,而是说啊,直接在 这个硅片上直接光速漂移,其实从一定意义上我觉得是实现了从同文计算机到专用大脑的一个转变。大家现在也会发现一个问题,就是随着大模型更新迭代速度越来越慢,以及说随着 呃我们对模型的一个粘性越来越高,那是否未来三年之后,可能我们买的一个笔记本手机,甚至咖啡机里面都有这么的一个 ai 硬件镜片,就是能它能做到的,它不需要云端部署,也不需要调用 api, 而是说它插电就是 gpt 级别的 ai 助手。 但其实呢,这块芯片的代价就是说他目前只能训练拉玛三点一模型,而不支持其他模型。那大家觉得这种专一但极简路线能否打败英伟达的通用的昂贵呢?评论区留下大家的想法。

在我了解了这个通会是怎么被消耗的这件事之后啊,我最大的直觉是,我觉得未来的程序员很可能会两极分化, 分为有钱的程序员和没钱的程序员,分为富程序员、穷程序员。你想啊,有钱的程序员,他能够使用最先进的工具,使用最先进的模型,然后去创造出更好的产品, 然后去赚更多的钱。而没钱的程序员,他分为两类人,一类呢是打工人,他使用的是公司提供的免费 ai 工具,一般都不咋地。第二类是创业者,他需要是自负盈亏,如果他的商业模式跑起来了,他就是一个有钱的程序员, 如果他的商业模式没跑起来,那么他需要承担 ai 编程的高额费用,很有可能会入不敷出。 因为 ai 编程和我们平时使用拆一批聊天不太一样啊。一百万头肯,如果你聊天的话,你可以聊个几百次,能用很长时间,但是你 ai 编程,你让 ai 去分析一个功能模块,就有可能会消耗几千到几万头肯, 如果你让 ai 去分析一个完整的项目,全量代码几十万,上百万投坑代码还没开始写,几十块钱就没了,玩不起。我希望我这个直觉是错的,你觉得呢?说说你的看法。

近日啊,就是物理 ai 这边呢,有一个新的一个思路,那就是啊,近日的话就是一家成立不到三年的 啊,一个芯片公司啊,这个芯片公司是在多伦多的啊,名叫啊 tennas, 那 么它的一个设计思路是什么样呢?它就是要开所有热门的一个观念, 那么直接把 ai 大 模型啊焊死在芯片里,那这个思路的话,就是啊,这个我们看一下它的芯片啊,官方公布的一个芯片,那么它是啊能够把那个速度啊, 就是就是每秒是一万七千的一个投款每秒啊,那个速度是非常炸裂,非常非常的快啊,那么我们看一下它的一个概括啊,那么这个呃就是说 s 里面就说就是它是一万七千个透克,那么它是比啊比那个 b 二百是快十倍,成本低二十,那么它是属于一个纯属硬件啊, 然后我们看一下它的一个工况的一个情况,那么它是使用的是 h c 的 芯片,那么大模型是用的拉马的三点一八 b 啊,八十一参数,那么能够获取到的一个速度是一万七千啊,一万七千透克每秒 啊,这个跟我们以前的几十上百一两百的口感,其实已经不是一个数量级了,那我们去看一下啊,官方演示的这么一个一个效果啊,这个是一个官网,它有个官网,那么下面问的是一个,就是说解释下量子历史哈,让我们看它一个动态图啊, 发现没有,就是他并没有像我们原来的大模型,每个字每个字一个蹦出来,他没有,他是直接就全部出来了哈,全部出来了,非常快哈,直接秒秒现哈,那么我们啊截图看一下他的一个 详细的一个数据,就是它是在零点零五一秒哈,这个不,二十分之一秒的时间已经生成了,那么它的头款是一万五千啊,一万五千每秒,那么确实是啊达有一万多的一个速度哈, 那么我们看它的优势哈,优势就是呃,它是怎么解决这个上日跟传输问题呢?就是 它的方案就是抛弃液冷哈,抛弃那个显存哈,打出来是 h b m 的 一个显存,那么它的成本只有存的方案的二十分之一,那么工号是直接砍到十分之一哈,那么十张卡加起来也就需要 十张卡,也就需要二点五千瓦的一个空气冷却,它不需要液冷哈,不需要液冷,那么嗯,有优势肯定是有劣势的,就是呃,官方也说了,就说这种芯片呢, 他最终啊,终生只能跑一种模型啊,就是他出场时候就已经锁死了,就是比如说像呃,公官方这这款达到一一万七的这个这个头款的这款这款芯片,那么他 他的晶体管只为这个三点一啊,八 b 的 这个权重而生,那么这辈子只能跑一个模型啊,只能跑一个模型。第二个就是他是没办法做到微调的,也没办法更换模型跟升级哈, 就是就是,出场是什么型,什么样的状态,他就是做什么状态啊,他就是可以把他干成,他就是固定的啊,固定的一个 ai 啊,固定一个单播型。 那么呃,这种这种方案的话,我们可以联想啊,有什么落地的一个场景呢?第一个就是 啊,智能体内部对话跟通信啊,因为我们呃有做一些就是智能体的一些开发,那么在多个智能体通讯的时候,他这个是必须的,那么这时候他的零延时啊,因为他是基本上做零延时,那么这个 啊是可以很方便的跟那个主键之间通信哈,就大就 a 键之间通信,那确实蛮不错的啊,就是我看他刚刚才的话就直接显示还是零点零五秒,那么可以更快哈,可能是毫秒几或者几十毫秒,这种速度其实也是可以的,就是内部,内部之间通信是没问题。 他第二个就是部分不需要频繁更换的一个场景,比如说语音助手,还有些助自动化标注的一些啊系统,还有就是比如说一些扫地,扫地机器人,哈,那这是就是他是固定的,说这个东西呢,他是 他不是说能够适用啊,所有的场景,他可能会适用某些场景哈,这是我们当把当做一个固定的一个硬件去看, 他他确实可以生成一个非常快的一个速度啊,这延时啊,所以说在这种情况下,其实他我们就没有必要讨论手控款的这个东西,就是包括现在很多的 ai 玩具啊,其实也是因为你要追求那个延时低,对吧? 那,那而且他的场景是非常的固定的啊,那其实可以考虑这种方案,我认为啊, 大家怎么看呢?就是看不看好这种技术呢?哈,好,那本次的分享就到这里。

hi, 今天是 ai 于一月底了,我看了一眼这个月的 token 消耗十七亿,我自己都愣了一下。 hi, 我是 ai 于一,我的本底是一个四千五百小时 ai first 的 实验者,在一线研究和实践个人与组织如何成为 ai 新物种于一说。他不关心 agi, 只关心 how one ai, 希望这期内容能给你启发。 十七亿什么概念呢?上个月四个亿,上上个月不到二个亿,也就是说一个月翻了四倍, 两个月翻了十倍。就在几个月前,我们圈子里聊起来单人 token 消耗过十亿,那还是一个听起来不可思议的事情, 大家觉得你是不是在拿 ai 挖矿?现在呢?轻轻松松就到了,我甚至没有觉得自己这个月特别勤奋。那 token 到底花在哪了?我回头看了一下,发现每一个环节都在悄悄变种。写代码,以前是问一句 ai 答一句,现在用 agent 模式了,你给他一个任务, 他自己搜索,自己规划,自己跑,自己调,中间来回几十轮对话,你可能就看了个最终结果,但每一轮背后都是大量的头壳在燃烧。做研究,以前是搜一搜,看一看,现在用深度研究了。你问一个问题,他帮你读三十篇文章, 交叉验证输出一个结构化的分析,你觉得只花了五分钟,他后台可能烧了几百万。 token 做视频就更夸张了,我现在有一条全自动流水线,从脚本到分镜到配音到合成,全是 ai 在 跑。一条视频做下来, token 消耗可能比我一天手动聊天的总量还多。这就是指数增长最吓人的地方, 你感受不到它在发生,你每天的使用习惯好像没变多少,但是每个环节的消耗量都在翻倍。等你月底一看账单,已经十倍了。我有一个判断,今年个人投坑消耗十倍甚至一百倍的增长会成为常态。不是因为你变得更拼命了,是因为 ai 自己变得更能消耗了。 ai 正在后台自主运行,深度思考,在稍推里投坑多膜态在吃图片和音频的资源。你用的不多,但 ai 替你用了很多,这其实是一个好信号。 token 消耗爆炸,本质上意味着 ai 真正开始替你干活了。以前你花一百个 token, 自己还得干百分之八十的活。现在你花幺零零零零个 token, ai 把百分之九十的活干完了, token 变贵了,但你变便宜了。 所以,如果你也在用 ai, 我 建议你做一件事,去查一下自己最近几个月的 token 消耗,画一条曲线,如果它在指数增长,恭喜你,说明你用对了。如果它是平的,那可能要想想是不是还在用去年的方式用今年的 ai。 这就是二零二六年的真实体感。 我们站在一条指数曲线上回头看已经很远了,往前看还完全看不到头。 how one ai 好 玩 ai 一 起探索 ai 时代的生存,摸鱼和杠杆机会我们下次再聊,欢迎点赞、收藏评论!

大家好,今天我们来讲一下 token 概念。那最近在 ai 行业里经常会听到一个词叫 token, 它呢不是某种产品,也不是交易概念,而是 ai 系统内部用来衡量一次请求复杂度的技术单位。简单理解就是当你向 ai 发出指令,让它生成内容时,系统需要调用算力来完成理解和输出, 而这些计算过程呢,会被拆分成一个个 token 来管理。那最近这个概念的话被频繁提起,主要是因为 ai 服务正在加速走向海外场景,当用户规模、语言种类、使用频率同时提升,系统就必须更精细的控制计算过程,确保不同地区、不同场景下的稳定运行。 那 ai 出海其实真正考验的并不是功能多不多,而是底层计算机制是否足够成熟。那这里的话主要就是云平台、成本端和光通信三个板块。 我们先来看第一部分,这一部分可以关注一下,主要就是润泽科技,它是多模型加多合作方算力订单数据港,这里是阿里云大客户,有长期订单。奥菲数据呢,是服务多家 ai 平台。云平台,这里是 token 体系的调动中书,它呢是把上层需求转换为系统可以执行的计算指令。 那有阿里巴巴是阿里云 ai 和 token api 渠道,全球平台能力强,腾讯控股,这里是腾讯云和海外布局。百度集团呢,是百度智能云加 ai 生态。 第三个成本端的话呢,那当服务规模扩大后呢?单靠中心化云资源是不够的,就更需要靠近用户的技术方案,主要是网速科技,是高并发 api 加 cdn 和优科德云服务边缘能力。最后一块的话是光通信,那所有 token 的 计算和调度呢?最终都是要回到最底层的。网络连接有中际续创是高速光模块, 新益盛这里是光通信核心部件,天府通信呢是光纤链路基础。

龙虾的爆火,让偷啃出海的概念第一次进入大众视野。你刷到的全民养龙虾,不是养虚拟宠物,是全球用户在疯狂调用 ai 智能体,每一次自动办公,每一段代码生成,每一篇内容产出,背后都在消耗同一个东西。 偷啃。今天我用最直白的话,把偷啃、偷啃出海,以及中国为什么沃有绝对优势给你们讲透。 先把 token 说清楚,它不是虚拟货币,不是空气币,更不是炒作标地。在 ai 服务里, token 就是 人工智能处理信息生成内容的最小计价与工作量单位。 你问 ai 一个问题,写一段文案,跑一次,数据分析系统会把文字拆成 token, 按数量计费。简单说,它就是 ai 时代的数字服务计量单位,是合规跨境服务贸易的结算单元,和境内严禁的虚拟货币炒作,那完全是两回事。 再讲 token 出海是什么?他不是把服务器运出国,也不是把电送出国,而是一套全新的数字贸易逻辑。 海外用户通过 api 接口,调用中国的大模型数据,跨光览传到国内的算力中心。我们用本土的电力与算力完成计算推理,再把结果秒级传回境外,全程按 token 结算。 电没有离开国境线,价值却通过透肯完成了跨境交付,这就是电力不出境,价值走全球,他免关税、无物流、秒交付,是数字时代最干净的服务出口,也是国家鼓励的数字服务贸易方向。那为什么说中国在透肯出海里拥有不可替代的压倒性优势? 第一,我们是全球绝对的电力霸主,二零二五年全国发电量突破九点七万亿度,超过每硬日三国的总和, 清洁能源占比超过百分之三十五。新疆、内蒙古、四川拥有海量低成本风电、水电、光伏,工业电价仅为美国的三分之一左右,西部绿电甚至低至一毛多一度。第二,我们长期面临能源消纳难题, 西北部分地区气风气光率一度接近两位数,每年有大量清洁电力无法就地消化,而托肯出海刚好把闲置能源变成可出口的数字资产, 变气垫为效益。第三,我们的算力基建全球领先,东数西算八大枢纽落地,数据中心用电规模持续攀升,国产算力芯片与算法优化快速追赶,能把一度电高效转化为高质量,头肯 成本优势直接转化为全球定价竞争力。过去我们做出口靠原材料工厂、集装箱、海运,赚的是辛苦加工费,价值链底端利润薄。受贸易壁垒限制, toon 出海彻底换了赛道,上游是电力与绿电,中游是算力中心与芯片,下游是大模型与 api 服务,最终产品是可无限附用编辑成本趋近于零的 toon 一 次模型训练投入固定成本,后续每生成一个 toon 的 增量成本几乎可以忽略。 这种规模效应是传统制造业根本无法比拟的。 openai 的 订阅服务毛利率超过百分之八十,核心就是把电力成本转化成了智能溢价。而我们拥有最底层的能源与算力支撑,只要把转化效率做上去,就能握住全球 ai 服务的成本与供给主动权。 这场竞争早已不是技术噱头了,而是大国产业的换道超车。美国卡高端芯片,本质是想控制电力到 tucker 的 转化效率。我们补国产算力优算法扩滤电,拼的是规模成本与稳定供给。 全球 ai tucker 需求呈指数级增长,中国模型在海外平台的 tucker 掉用量占比已经突破了六成, 这就是能源优势与基建优势的必然结果。中东土豪重金砸向 ai, 本质也是用石油发电转化为 tock。 和我们的逻辑完全一致, 谁掌握低成本可持续电力,谁就能掌控 tock 时代的硬通货,最后落回现实。 tock 出海不是遥不可及的产业故事,它正在重构就业、投资与行业格局。电力工程、数据中心运为液冷散热、国产算力芯片这些传统基建领域正成为 ai 时代的 核心刚需。懂电、懂算力、懂跨境合规的人,才会在未来十年持续稀缺。对每个人来说,看懂电力算力 token 的 转化逻辑,就看懂了下一个十年的产业变迁与全球分工。

就像乐高积木的基本颗粒,汉字词语都会被拆解成偷坑工, ai 识别。在你使用极梦时,偷坑直接影响成本。写提示词消耗脑力,通常免费生视频则消耗积分。积分本质上就是偷坑的预付套餐。一条十五秒视频, ai 需要进行数百万次偷坑计算 极梦根据时长、分辨率等因素扣除相应积分,了解偷坑消耗能帮你用最精准的词汇表达意图,生成效率更高,成本更低。

啊,哈喽,大家好,这期涛哥能源星球与大家讨论一个近期媒体关注度比较高的话题,就是关于中国的 token 出海。 token 出海是什么样的一种商业模式呢?首先我们知道 token 这个词本身上是指一些人工智能大模型技术对信息数据处理的一个最小单元,所以现在因为大模型在各个工业领域应用的一个广泛渗透,全世界所有的工业用户 或者是一般的小型用户,其实都有对大模型提出实时需求的一个调用的这样一个迫切的需要。所以我们可以假想在美国的一个程序员, 他可以把需要提出的数据调用的要求,通过海底光缆提供到中国境内的大模型的服务器上进行一个调用。然后中国利用自己赋予的算力资源和优质低廉的电力资源,对信息进行一个加工,再把现代化的终端产品 把它的输出作为打包成一种成熟的商品模式,反向输送给美国终端用户。在这个过程当中我们消耗的所有成本,其实主要成本就是算力的折损,还有电力的消费, 所以变相的我们通过透肯出海的模式达到了中国电力的出海,这是很多人意想不到的一个效果和非常新的一个商业模式啊。当然他也依赖于我们目前所 基于的整个世界贸易的一个格局,是基于一九九五年的一个电子商品的消费协定,就是所有的电子信息化的服务商品,其实是不征收任何关税的啊, 相较于实物商品的跨境贸易和跨国贸易来说,他没有这种出海清关运输的成本空间的转移,他的转移形式是比较便捷的,所以变相的为中国增加了一个创收的渠道,或者是 服务商品出口的一个渠道。我们要知道中国传统的商品出口模式是从原料国去进口一些原材料产品,然后对矿石或者对原料产品进行一个物料加工, 然后再输送出完整成熟的终端产品。在这个过程当中,我们为商品提供的这个增值的收益价差,就是我们中国出口创汇的一个主要途径啊。但是通过这种 信息数据化的增值服务模式呢?我们其实有更高的这种收益。传统的 食物食物商品的加工收益大概是三到五倍这样一个规模,但是通过每百万量级透肯的这种信息加工的出口呢,大概是电费成本的二十倍到二十五倍这样这样的一个增值服务的一个收益。 所以我们可以乐观地估计整个中国随着近来国产大模型的一些呃性能的提高,包括最近比较火的 mini max、 kimi 或 deepsea 的 四点零版本,我们可以 非常乐观地估计,全球的用户会越来越多地被中国的算力优势和中国的低廉的电力成本优势吸引到境内来进行一个信息数据的 服务加工,然后通过这种信息加工的手段来合理形成一个资源的优化配置,使算力和电力的经济价值在国际化新型的商品出口形式上得到一个质的提升。

token 是 什么?今天这期视频,我们把 token 彻底拆开来讲,先搞清楚它有几种以及各自是什么含义,再深入讲 ai 大 模型里的 token 到底是怎么运作的,以及如何帮你省钱。 token 这个词在计算机领域至少有两种完全不同的含义,很多人混淆就是因为没有先区分清楚。第一种语言 token language token 也叫 nlp token, 这是 ai 大 模型处理语言时的最小单位,是模型理解和生成文字的基本碎片, 我们今天重点讲的就是这种。第二种,身份验证 token, off token, 比如 access token、 jwt token, 这是一串加密字母串,用来证明你的身份和权限,相当于服务器给你颁发的数字门禁卡。两者唯一的共同点就是都叫 token, 这就好比苹果手机和苹果水果名字一样, 但完全是两个领域的东西。以后遇到 token 这个词,先看上下文,在 ai 和大模型的语境里,它是语言单位, 在登录 api 健全的语境里,它是身份凭证。搞清楚这个分类,你在这两个领域都不会再被绕晕了。接下来我们重点来讲语言 token。 在 ai 领域,特别是大语言模型 l l m, 像 chat、 gpt、 cloud、 gemina 一 类的系统里, token 是 模型看懂和写出语言的最小单位,它不是密码或凭证,它是 ai 内部真正处理文字的基本快,是模型理解和生成语言的原材料。 通俗的讲, token 就 像乐高积木,我们写一句话给 ai, 看起来是一个完整的句子,但 ai 不 会像我们一样理解整个句子,它会把文本拆成一个个小块及 token, 这些小块可以是一个完整的词,一部分词,甚至是一个符号或标点,每一块就是一个 token。 模型不是按人类的语法去理解,而是按这些 token 一 步步分析和预测下一个最可能出现的 token。 为什么要这样做?因为 ai 模型内部只能处理数字,不能直接看懂文字。先把文字拆成 token, 然后把每个 token 转换成一个数字 id, 再把这些数字送进模型进行计算和预测,这样模型才能理解上下文并生成回答。在实际使用中, token 还有两个非常重要的作用, 第一,它决定了 ai 能处理的内容范围大模型对话时有一个上下文窗口,就是说模型一次最多能看到多少个 token, 如果超过了这个限制,最早的 token 会被丢掉,这会影响模型理解整个对话。第二,它关系到成本和计费。 很多 ai 服务是按 token 计费的,包括你发送的输入 token 和模型返回的输出 token。 token 越多,成本越高。 那如何节省 token? 在 ai 模型使用中, token 是 直接影响成本和效率的核心指标,控制好 token 的 使用,能省钱又提升速度。下面是最有效的几个方法,帮你在实际使用时节省 token 消耗。一、精简输入内容,别把所有背景都丢进 prompt, 只把真正相关的信息留给模型,让每个 token 都有价值。缩短指令,去掉庸俗描述,可以显著降低 token 消耗。 精简上下文相当于少用 token。 二、限制输出长度,提前设定回答长度上限,避免生成宕长啰嗦内容,这样模型不会自动扩展答案,从而减少输出 token 数。 三、做缓存与复用对于重复查询或者经常用到的内容,可以先将结果缓存起来,后续类似请求直接从缓存返回,不再重新调用模型,从而节省大量输入和输出 token。 四、选对模型分阶段处理任务, 不同模型价格差异巨大。把大任务拆成两步走,先用小模型或简化逻辑生成摘药或关键内容,然后再用更强模型处理简化后的内容, 这样整体消耗的 token 更少。五、只保留重要上下文历史对话长篇内容会不断重复发送给模型,快速占满 token 上线,所以只保留与当前任务直接相关的上下文就够了,其他历史可以省略或者按需摘药再传入。 最后总结一下, token 在 计算机里有两种完全不同的含义,语言 token 是 ai 处理文字的最小单位。身份验证 token 是 证明身份的加密凭证,两者只是名字相同,本质毫无关联。在 ai 大 模型的世界里,语言 token 是 一切的基础。 ai 不是 看单词,而是看 token, 它靠一串串 token 来理解世界作判断,生成结果。这就像我们拼积木一样,模型把语言拆成一块块小积木,然后用它们组合出回答。理解了 token, 你 就掌握了和 ai 打交道的底层语言。无论是调用 api、 优化提示词,还是控制成本,都离不开这个基础概念。 token 是 ai 世界里的基本单位,是 ai 语言理解与生成的起点。好了,本期的分享就到这里,如果觉得这期内容对你有帮助,记得点赞、关注和收藏,我们下期见!

黄仁勋发文称呢, ai 有 五层蛋糕,第一是能源实时生成,智能需要电力支持,每一个生成的 token 都是电子流动 能源,是 ai 基础设施的首要原则。第二层是芯片处理器,大规模地将能源高效转化为计算能力。芯片层的进展决定了 ai 的 扩张速度以及智能的可适用性。 第三层是基础设施,包括土地供电、冷却系统、建筑工程、网络通信等一系列硬件组成的系统。这些系统呢,就是 ai 工厂,他们的设计目的并非存储信息,而是要制造智能。 第四层是模型, ai 模型能够理解多种类型语言,模型只是其中的一个类别,蛋白质、 ai 化学、 ai 物理模拟、机器人技术和自主系统等领域正在发生变化。 第五层是应用,经济价值就此产生,比如药物研发平台、工业机器人、法律助手、自动驾驶汽车等。 自动驾驶汽车是 ai 机器应用的具体表现,人形机器人则是具身智能应用的具体体现。这就是 ai 五层蛋糕的架构,能源芯片、基础设施、模型,再到应用。

token 主要是指 ai 大 模型里的词源,简单说, ai 处理文字的最小计算单位,一个 token 约等于零点五个中文字或者一个英文词。使用擦的 gpt 豆包、 deepsea 本字都是在卖 token 消耗算力 而暴利收割全球。算力变现指的是电加 gpu 等于算力,而算力等于 token。 token 卖给全球。 中国的优势是西部绿电便宜,零点一到零点三元每一度,而欧美是一到两元每一度。电模型优化强单位 token 消耗耗电极低, 一度电约等于生成五百到九百万 token, 而 openai 百万 token 卖约七十元,而中国模型百万 token 卖约两元,那成本一度电约等于零点二元。卖 token 收入约等于十到十八元,毛利率约等于百分之九十八, 这是成本与售价的倍数差,便通过 token 进行价值放大。为什么叫收割全球?因为没有实体零关税,绕开贸易壁垒,只卖 api 服务,不出口芯片或者服务器 全球定价权。中国 token 成本是欧美的十分之一到五十分之一,价格却能对标全球第 三。规模效应,全球 ai 掉用量暴涨,中国模型周掉用量已经超过美国。万亿级 token 约等于万亿级收入本质上面是把中国廉价电力, 中国 ai 算力包装成高附加值数字商品,卖给全世界。 ai token 的 暴利来源是人员加算力加规模加国际化的极致效率,它的风险面临监管、数据安全和价格战。 中国用便宜绿点加高效 ai 模型把算力包装打包成 tocan, 零关税卖给全球,成本极低,售价不低,形成全球级的数字暴力生意。

非常讽刺的事情来了啊,有一个非常知名的啊,视频博主,他在自己的社交媒体上发布了一条视频,然后在各个标签啊发布的时候,在各个标签和说明上都打上了,用 ai 生成, 然后评论区就炸了啊,有说,哎,第几秒的时候这个出模了啊,然后第几秒的时候呢啊,这个就是非常的这个真实感非常的差,是不是模型用的不对? 甚至还有人说啊,就是啊,到底是 ai 生成的,这 ai 的 味道非常非常的严重。但其实打脸的时候到了,这条视频是这个博主完全是真实 拍摄,真实记录,真实的剪辑。那为什么会有这样的现象产生啊?这个其实不难理解,这个其实是我们人类对于危机到来之前一种自我的保护机制和自我的保护意识的一个本能条件反射。 那其实一个人一周时间啊,我们算一个正常人,一天他其实可以讲七千到两万个单词 转换成 talk 的 话呢,差不多是在啊,两万到三万个 talk 一 周时间,一个正常人效率高一点的,他的说话包括写作的文字输出的 talk, 最多是三十万个 talk, 但要知道三十万个 talk 用 ai 大 模型的话,半个小时其实已经把它输出完整了啊,可能他给你的结果会比人思考的更好,因为他考虑的方向会更全面,毕竟人类的思维和思考的角度都有一定的这个维新和自己的主观性。 那一进大学的话呢,我们第二块要教的就是个人的这个啊,对于 ai agent 产品的这个搭建能力, 没有任何写代码的基础,像我一样如何一根网线,一台电脑,然后 web coding, 纯 web coding 用 ai 的 工具啊,像 coco 啊或者说 clock code 啊啊,直接戳出一个 ai 产品来,然后再把它部署上线,并且教会你怎样 样去能启动,去做营销,去把你的这个 agent 推广出去,让它真正的成为一个能够服务你的一个产品。还没有报名的同学可以啊,评论区六六六,然后私信我,抓紧。