很多新手小白学 open cloud 小 龙虾的时候,被各种专业名词搞得晕头转向的,今天给大家逐一科普一下。那第一个比较常见的名词叫做 token, token 是 什么呢? token 就是 ai 大 模型的这个算力 啊,你比如说我们用 kimi cloud 的, 我们都要用它的 token, 也就是说龙虾啊,给大家举个例子吧,如果把这个龙虾当做是一个 车,那 token 呢?然后 token 就是 它里面的汽油啊,我们想要车跑起来,就必须去给它加油啊,然后加不同的油,它的动力就不一样。所以为什么会发现说,哎,这个进口油啊, cloud 可能就比这个国产油批米要好啊,但是有原因的。 然后第二个是 api, 什么是 api? api 就 像是加油站啊,或者是说你理解为是一个加油的管道,只有接入管道了,你才能不断地加油进去,所以 api 就是 这个 意思。那第三个呢?什么是 skill? skill 就是 技能的意思,就是龙虾本来是不会太多技能了,做不了很多事情,那他为了让他能干更多活呢?我们需要给他去装 学这些技能,这就是叫 skill。 然后第四个是云服务器,云服务器?什么云服务器?你理解为是那个云电脑,就是你要租别的电脑来去养龙虾,这样的话你就不用去买本地电脑了,不用买新的电脑,看看大家还有什么名词不太懂的,下一期给大家科普一下。
粉丝5.6万获赞21.4万

每一次工业革命,都有一样东西在背后疯狂燃烧。第一次工业革命,蒸汽机来了。蒸汽机本身不值钱, 值钱的是让它跑起来的东西。煤。煤从地里挖出来烧掉,变成蒸汽,蒸汽推动机器、机器生产商品。整个英国的矿山、铁路、钢铁厂,全都围绕着怎么挖更多的煤,怎么运更多的煤来建立起来。煤就是那个时代的核心消耗品。 第二次工业革命,电来了,电本身也看不见摸不着,但他改变了一切。爱迪生建发电厂,特斯拉搞交流电,全世界开始拉电网、发电、输电、配电、用电,一条完整的产业链,养活了成千上亿的人, 创造了通用电器这种巨无霸公司。电就是那个时代的核心消耗品。第三次石油、内燃机、汽车、飞机、塑料化工。整个二十世纪,全球经济都建立在石油上,围绕着石油打了多少仗?中东为什么重要?因为那里有油,石油就是那个时代的核心消耗品。 现在 ai 时代来了,它的核心消耗品是什么呢? token, 你 可能听过这个词,但不太理解。简单说, token 就是 ai 处理信息的最小单位。 你跟 ai 说一句话, ai 会把你的话拆成一个一个的 token, 然后逐个处理,逐个生成回答。每一次你问 ai 一个问题,每一次 ai 给你写一段文字,画一张画,生成一段代码,背后都在消耗 token。 一个中文字大约是一到两个 toc, 你 让 ai 写一篇一千字的文章,大概就是消耗了两千个 toc, 听起来不多,对吧?赶紧把这个数字乘以全球的用户量, chat gpt 每周九亿活跃用户,豆包 kimi 千万, 中国五点一五亿生成式 ai 用户,每个人每天跟 ai 对 话好几轮,每一轮都在烧 toc。 再加上企业端自动驾驶的 ai, 每秒处理海量的传感器数据,全是 token。 金融公司的 ai 交易系统,每毫秒做一次决策也全是 token, ai 写代码, ai 做客服, ai 审核合同, ai 看片子,全都是 token。 英伟达为什么一年赚两千一百多亿美金?因为生成 token 需要 gpu, gpu 就是 token 的 发电机。英伟达卖的每一块芯片,最终都是在帮客户生产更多的 token。 openai 为什么要花六千亿美元建数据中心?因为数据中心就是 token 的 发电厂。越多的人用 ai, 就 需要越多的数据中心,就需要越多的电力,就需要越多的芯片。 google 为什么要签一百五十兆瓦的地热能协议?因为 ai 的 数据中心太吃电了,生产 token 这件事,最终还是要烧真实的能源。所以 token 这条产业链从上到下是这样的, 最底层是能源发电厂,电网、地热核能给数据中心供电。往上一层是芯片,英伟达、 amd 含五 g 造生产 token 的 发动机。 再往上是云计算,亚马逊、微软、阿里云建 token 工厂,把算力租给别人。再往上是大冒险公司 open ai、 ospec、 deepsea、 月之暗面,它们把芯片和算力变成可以使用的 ai 服务。 最上面是应用层, chat、 gbt、 豆包 kimi 各种 ai 工具,它们是 token 加油站,每个用户来一次就烧一次。煤的时代,谁控制了煤矿,谁就是亡。石油时代,谁控制了油田,谁就是亡。电力时代,谁建了发电厂,谁就是亡。 token 时代,谁能更便宜、更高效的生产和分发 token, 谁就是王。这就是为什么英伟达市值全球第一,所有的科技巨头疯了一样的砸七千亿建数据中心。这就是为什么 deepsea 一 出来,全世界都撼动,因为它证明了用更少的算力能生产同样质量的 token, 等于用更少的煤烧出了同样多的蒸汽。但 token 跟煤石油炼里有一个根本区别,就是 煤你能看得见,能称重,一吨多少钱清清楚楚,石油你能闻到?一桶多少美元,全球统一报价。 电你虽然看不见,但电表会转,每个月你都会收到电费单 token 你 看不见,摸不着,闻不到。你跟 ai 聊天的时候,他不知不觉的会在消耗这个东西。每一次对话,每一次生成,背后都有真实的芯片在运转, 真正的电力在燃烧,真实的成本在产生。 openai 去年收入一百三十一亿美元,亏了八十亿。收入从哪儿来?卖 token 亏的钱花在哪了?生产 token 按 so pick 给 cloud 的 定价,按输入 token 和输出 token 分 别收费。 google 的 gmail 三点一 pro, 两百 k 以下的 token 一个价,两百 k 以上的 token 另外一个价。整个 ai 行业的商业模式底层逻辑就是一句话,生产 token, 卖 token。 未来十年, token 的 价格会像电价一样成为一个关键的经济指标。哪个国家的 token 成本更便宜,哪个国家的 ai 产业就更有竞争力。中国为什么拼命搞国产芯片?因为用英伟达的芯片生产 token 太贵了,还随时可能被卡脖子。 deepstack 为什么重要?因为它把每个 token 的 生产成本打了下来。当年煤价涨价,工厂就停工。油价涨了,航空公司就亏钱,电价涨了,铝厂就关门。未来, token 成本涨了, ai 应用就用不起。 token 成本降了, ai 就 能渗透到更多应用场景,替代更多人力,创造更多价值。 我是文思,你每天用 ai 的 时候,可能从来没有想过这些,但从今天开始,你可以换一个视角看 ai。 你 用的每一个 ai 工具,背后都连着一条从能源到芯片到数据中心到大模型的完整产业链。你敲下的每一个字, ai 回复你的每一句话,都在消耗一种你看不见的资源,这种资源就是 token, 它是 ai 时代的煤, ai 时代的石油, ai 时代的电,只不过这一次烧的东西,你看不见。觉得涨知识了,可以转发给你的朋友看看。关注我,每天带你看懂 ai!

算力正在取代石油,成为啊全球第一的战略资源。而最近爆火的 open cloud, 则是这场财富洗牌的新开始。 今年国家大力推进东数西算,智算中心,数字经济啊,已经进入了算力为王的时代。就在这个关键节点, open cloud 横空出世,全网啊,都在养这只龙虾,但是百分之九十九的人只懂得用根本啊,没看懂。 open cloud 其实只是一个入口, 真正啊,在背后疯狂燃烧,决定利润分配的是 token。 先来普及一下什么是 token, 给你举个生活的例子,你去停车场停车,按小时计费,你用 ai 按 token 来计费。 你问 ai, 一 句话,写一份方案,生成一段代码, ai 啊,都会拆解成 token 来处理,它就是 ai 世界里的通用计量单位。从财经的视角来看啊, token 就是 ai 时代的集装箱。 一九五六年,集装箱重塑了全球贸易。今天的托肯啊,把看不见的脑力劳动变成了可计量、可收费、可全球出口的标准化商品。 一度电卖零点五元,用来生成托肯可以卖十一元,收益啊,翻了二十二倍,按照国际价格来算,最近暴涨了近八百倍。这不是技术概念,是电力再定价,脑力变黄金的超级生意。 更关键的是,电很难跨国运输,但是啊, tucker 只需要一根网线就能全球流通了。西部的绿电没出国,价值却通过了 tucker 变现出口。这就是国家大力布局算力基础设施的底层逻辑。 未来,所有的行业都会被 tucker 重构,一切脑力劳动都将按 tucker 来收费。谁能把生意啊钻进 tucker, 谁就掌握了定价权,谁抓住 tucker, 谁就踩中了这波最大的行情。 open crow 是 风口, talkin 是 金矿,但普通人、小老板到底怎么才能赚到钱呢?关注我,带你用财经视角抓住 ai 时代真正的财富密码。今天我们的视频就先到这,我们下期再见!拜拜!

兄弟们,我跟大家好好说说 talk 到底是什么意思? talk 呢?这个词的原本意思就是带 b, 就 像世界 b, 就 像游戏 b 一 样。但是在 ai 的 世界里,它指的是文字处理的最小单位。举个例子, 就像你小时候玩的拼图,每一小块拼图就是一个,是一样的道理。 ai 理解文字时候也是一样的道理。 大家看到你输入的文字,他不会一个字一个字快,而是会把文字切成一小块一小块的,每一小块就是一个掏坑,你可以把掏坑想象成 ai 的 文字积木, ai 就是 靠这些积木来理解你的意思。你用滔客越多, ai 要处理的积木就越多,你的工作量就越大。占用的资源,算力成本不会降,算力成本不会降。大模型训练一次要几百万美金, 每次推理都需要大量的二两的 gpu。 技术进步更快,但用户的增长更快, 人均成本反而上升。商业模式成熟,按滔坑收费是验证过的,可持续模式,如果改成订阅制,那么重度用户的多,平台就会亏的多,轻度用户用的少,会觉得不划算。 质量提升需要更多的滔坑。未来的 ai 更聪明,但处理更复杂的问题需要更长的上下文。 同样的任务需要滔滔可能减少,比如 ai 更懂你的需求,提示词从五百字会降到五十字,省了百分之九十的滔滔,你觉得呢?

ai 里面有一个词叫做 talkin, 你 知道是什么意思吗?其实说白了, talkin 就是 ai 专属的技术单位,也是它计算用量核算费用的标准。你发给 ai 的 内容和 ai 回复你的内容都会被计入 talkin 统计。它不按你提问的次数算, 只看实际的内容篇幅,按照次数来算。重点来了,关于 talkin 来说,记住这一点就够了。 talkin 就是 ai 核算的总用字量,说白了就是你和 ai 的 互动过程中总共用了多少字。关于 talkin, 你 明白了吗?关注我,我们一起学 ai。

hello, 大家好,欢迎收听我们的播客,今天要跟大家聊一聊 openai 刚刚发布的这个 gpt 五点四 这个大模型,它号称能够支持一百万 token 的 这种上下文,然后原声地具备了操作计算机的能力,能够处理复杂的代码和推理, 感觉好像真的是要把我们带入一个所谓的长文本的时代,是,这个真的是最近 ai 领域的一个大新闻了,那我们就赶紧开始今天的讨论吧。我们讨论的第一部分是核心亮点揭秘, 第一个问题想先问一下,就是这个 gbt 五点四在原声电脑操控这个能力上面到底是有多强?就是它这个最大的突破,就是它是第一个可以像人一样去操作电脑的这种通用的 ai 模型,它可以通过截图然后去识别这个界面, 它也可以模拟鼠标键盘的操作,它可以用 playwrite 这种库去直接写代码去操控。这个软件听起来就比那种传统的 ai 要灵活太多了。对,没错,而且它就是在这个 os world verified 的 这个精准测试里面,它的这个完成任务的比例是百分之七十五, 就它超过了人类的平均水平,然后也比上一代的这个 gpt 五点二提升了将近百分之三十, 它甚至可以在这个 webrena verified 和 onlinemind 二 web 这种更难的测试里面也能达到非常高的一个准确率,它就是真正的可以去 自动完成一些跨软件的这种复杂的操作,比如说自动填写表格啊,自动发邮件啊这种。哦,那这个 gpt 五点四在处理这种长上下文和这个复杂的知识任务的时候,到底有多大的提升呢?这个就是现在它这个模型可以支持一百万头肯的这种上下文,那这个就 基本上你可以让他去处理,比如说很长的文档,或者说涉及到很多步骤的这种复杂的任务,他都可以记得住前面的信息,不会说像以前一样就断掉了,所以他可以一口气搞定更复杂的工作。对,而且他在这个 gdp val 这种测试里面, 他在四十四个不同的这种专业领域里面,他有百分之八十三的任务都可以达到或者超过人类专家的水平。 然后在这种投行的这种电子表格建模啊,或者说这种演示文稿生成啊,这种具体的任务上面,他的表现也比上一代有非常明显的提升,他的这个事实错误率也降低了将近三分之一。他在处理这种多步骤的这种推理啊,或者说这种专业的知识上面, 它是特别特别稳的。这个 g b t 五点四,在这个工具的使用啊和这个编程的能力上面,具体又有哪些让人眼前一亮的这种升级呢?这个新版本呢,它就是带来了这个 tool search, 就是 工具搜索, 那这个就可以让模型在面对非常多工具的时候呢,它可以减少一半的 token 的 开销。然后它的这个在这个 tool alphabet 这种测试里面, 它的这个多工具的写作的准确率也刷新了记录,这确实挺厉害的。对,然后在编程方面呢,它是融合了这个 g b t 五点三 codex 的 这个强项,在这个 s w e bench pro 这种测试里面呢,它的这个表现也是跟 codex 差不多,或者说略好, 就是它的这个 fast 模式呢,还可以把这个 token 的 速度提升到一点五倍,它甚至可以直接去生成这种复杂的前端的页面,或者说这种完整的游戏, 它的这个编程的能力和工具的使用的能力都是属于业界最前沿的水平。然后咱们来聊第二个部分啊,就是这个能力升级的对比,就是想知道一下这个 gpt 五点四, 相比上一代的这个 gpt 五点二,在这个能力的精度上面,或者说执行的效率上面,以及这个场景的适配上面到底有哪些比较大的进步?就这个新版的 gpt 五点四呢,它在这个 gdp 这种测试里面,它的这个专业任务的准确率是百分之八十三, 就他比这个 gpt 五点二高出了十二个百分点。然后在这个投行的这种电子表格的建模上面,他的准确率也是将近百分之九十, 他的这个事实错误率也减少了三分之一。在这种复杂的桌面操作的这种精准测试里面,他的这个完成率也从不到一半提升到了百分之七十五,他已经超过了人类的平均水平了, 这提升确实挺吓人的。对,然后它的这个上下文窗口呢,也从原来的四十万 tokens 提升到了一百万 tokens, 它这个处理长文本的这个效率是提升了一倍还多,那它的这个实际的使用当中,它的这个 token 消耗还可以减少一半。它的 这个思考过程预览啊,还有这个多模态的理解啊,都有升级,它的这个 api 呢,也做了一些优化, 就整体的这个安全性和场景的适配性都有明显的进步。就是说这个 g p t 五点四在哪些实际的工作场景当中,会让用户感觉到相比上一代有一个非常明显的效率和体验的提升呢?比如说像这个金融分析师,或者说这个市场研究员, 那他们可能经常要去处理大量的这种财务报表啊,或者说行业数据啊,那现在这个新版的模型呢,就可以直接去分析,比如说几十份这种长篇的这种报告, 然后帮你自动生成一个非常详细的这种总结啊,或者说投资建议啊,这个在以前可能需要好几个人配合才能完成的任务,现在一个人就可以很快的搞定。对于程序员和这种内容创作者来讲是不是也很友好?是的是的,程序员的话,他可以直接把整个项目的代码都扔给这个 ai, 让他去分析, 然后包括帮你自动修复一些漏洞啊之类的。那内容创作者的话,他可以一次性的去创作,比如说上百万字的这种小说啊,或者说剧本啊,这个 ai 都可以帮你非常连贯的去写出来。而且他的这个风格啊,人设什么的都可以帮你统一好。 那对于一些比如说像客服啊,或者说这种行政的这种岗位,他们可能经常要在不同的系统之间去切换。 那现在有了这个新版的 ai 之后,它可以帮你自动完成很多这种跨系统的操作,那它的这个效率就可以提升至少百分之四十以上。所以说这个 gpt 五点四到底是怎么在安全性和这个实际的应用上面比以前的版本更让人放心的?它不光是把这个 gpt 五点三 codex 里面的一些安全的机制全部都继承下来了,而且它还引入了这个 qt 可控性的这个全新的评估体系, 那这个东西就可以让用户去监控以及去约束这个 ai 的 一些推理的步骤,然后减少一些不可控的情况的发生。那另外就是说 这个不同的版本它是有不同的这个 api 的, 那也有不同的定价,那用户可以根据自己的需求去选择。 那同时呢,就是说这个呃 plus 和 pro 这种套餐的用户,他们是可以马上就体验到这个最新的模型的,那老的模型也会保留三个月,方便大家去做一些过渡, 那企业用户的话还可以去定制一些专属的部署啊之类的,就是它的安全性和这个实用性都有明显的提升。我们来聊一聊第三部分啊,就是这个 g p t 五点四 对我们打工人到底有什么好处?对,对吧?这个东西到底给我们日常的工作带来了哪些积极的变化?就现在的这个 ai 已经可以自动地去处理大量的这种重复性的任务啊,比如说整理数据啊,比如说这个生成一些报表啊,这种东西它可以帮你节省 至少四分之三的时间,你可能原来要忙半天的活,现在可能几分钟就搞定了,等于说大家可以把精力更多的投入到有挑战性的工作当中,对,没错没错,而且他这个呃支持这种百万 token 的 这种上下文和这种原生的电脑操作, 就你可以让他去做一些这种跨软件的这种复杂的流程的自动化,然后包括你可以去实时的看到他的这个推理的过程,你可以随时的去调整, 就你可以非常高效地去完成一些很复杂的项目,就就算你是一个刚入职的新人,你也可以通过这个 ai 去迅速地完成一些本来你需要资深的经验才可以完成的任务,所以这个就是整个的工作效率和你的专业能力都是一个质的飞跃。你觉得 g p t 五点四会给现在的职场人带来哪些 比较让人觉得有压力的新的变化?就这个 ai 现在已经可以非常高效的去完成很多这种标准化的工作啊,那像比如说一些初级的财务啊,呃,审计啊,甚至一些文案啊,那这些岗位就会 很有可能被智能所取代掉。那你如果是一个只是做一些这种重复性的内容而没有什么成长的话,那你肯定就会被甩出去,就说只靠老本是很危险的,对,没错没错,对,所以你必须要去学会跟这个 ai 去写作, 那比如说是一些这种提示工程啊,或者是说你去呃做一些这种结果的叫验啊,这种能力就会变成一个 职场的一个门槛,那如果你不主动去学的话,你就会慢慢的被边缘化。那同时呢就是说,呃,虽然说这个 ai 可以 帮你提高效率,但是它也有可能会带来一些数据安全的隐患,那这个也是大家需要去警惕的, 你觉得未来大家跟这个 gbt 五点四这种 ai 一 起工作会形成一种什么样的新的协助模式?就以后的职场很有可能会变成一个斜座层和核心层,那这个斜座层呢?就是 ai 会去做掉大部分的这种标准的流程, 那人类就可以专注在这个核心层去做一些决策呀,创新啊。所以人和 ai 是 互补的关系。对,没错没错,就是会变成一种 人类下指令,然后 ai 去执行这样的一个方式,那会有一些新的岗位会诞生,比如说 ai 训练师啊,那也会有一些岗位就彻底的消失,所以大家要不断地去学习这种 ai 加你的专业的这种能力,企业也要去建立一些数据的安全的机制, 才能够真正的用好这个 ai, 这个好帮手。对,今天我们其实聊了很多关于 gpt 五点四的一些新的特性啊,包括一些可能对未来工作的影响。其实我觉得这个东西确实 可能会让很多行业的工作方式发生很大的变化,然后也会带来很多新的机会和新的挑战。那就是这一期播课的内容了,然后感谢大家的收听,我们下次再见,拜拜。拜拜。

面试的时候,十个候选人里八个说不清楚 token 到底是啥,今天一分钟给你讲透!很多同学刚开始接触接口验证的时候,都会听到 token 这个概念。其实我们可以用游乐园的手环做类比, 去游乐园买完票,工作人员给你带个带防伪的手环,之后玩项目只要出示手环就行,不用每次套身份证购票凭证。 token 的 作用和这个手环完全一致,它是服务端生成的一串特殊字符串,作为客户端访问接口的身份凭证, 用户第一次登录验证账号密码通过后就能拿到 token, 后续请求不用反复提交密码,能大幅降低密码泄露的风险。这里 要特别注意, token 本身不具备加密属性,只是身份标识,千万不要把它当成加密工具来使用。那 为什么会出现 token 这种验证方案呢?早期的 web 系统大多用 session 做身份验证,服务端要给每个登录用户存一份 session 数据。就像景区把所有游客的身份信息都存在入口的记录本上,只有一个入口的时候没问题, 可如果景区开了十几个入口,每个入口同步游客记录会非常麻烦。 token 就是 为了解决分布式场景的身份验证问题,诞生的 所有身份信息都存在 token 里,由客户端保管。服务端不需要存储用户的状态数据,多服务部署时也不需要做数据同步。当然,它不是 session 的 替代品,如果是内部单节点系统,用 session 反而更易维护。现在行业内最常用的 token 是 j w t 格式, 完整的 jwt 分 为头、载客、签名三个部分,中间用点分隔,头部分记录 token 的 类型和签名算法。载客用来存储用户 id、 权限、有效期这类非敏感信息。签名则是服务端用私有密钥对前两部分生成的防伪标识。 这里要提醒大家,这三个部分里的头和载荷都是用 base 六十四编码的,相当于只是把铭文转成了方便传输的格式,没有做加密处理,任何人拿到都能解码看到内容,所以绝对不能在载荷里存密码、身份证号这类敏感信息。 了解了结构之后,我们再看 token 的 生成逻辑。 token 必须由服务端生成,用户第一次提交账号密码时,服务端先叫验信息是否正确,确认是合法用户后,会用只有自己知道的私有密钥, 结合用户 id、 权限、有效期等信息,生成完整的 token 再返回给客户端。整个流程就像游乐园售票处核对你的身份证和购票信息无误后,给你发印有专属防伪章的手环, 只有园区官方发的手环才有效。私自打印的手环过不了工作人员的叫验。大家一定要记住,不要在前端生成 token, 没有服务端密要签名的 token 没有任何可信度。客户端拿到 token 之后,通常有两种存储方式,要么存在 local storage 里,要么存在 cookie 里。 存在 local storage 时,每次发请求需要手动把 token 放到请求头里,就像你每次玩项目,主动抬手给工作人员看。手环存在 cookie 时,可以配置自动随请求携带,不需要手动处理,但要额外做好 c s r f 攻击防护。 这里要避开一个常见误区,不要把 token 存在前端的普通 g s 变量里,页面刷新或者关闭后,变量会被清空, token 就 丢失了,用户就需要重新登录。 存储完成后,客户端每次向服务端发请求时都要带上 token。 服务端拿到 token 后的校验分为三步,首先把 token 的 头和载鹤用同样的密钥重新生成签名,和传过来的签名比对,确认是自己发的合法 token, 再检查 token 的 有效期有没有过。最后读取载荷里的用户信息,判断有没有当前接口的访问权限。整个过程,服务端不用查任何存储的用户状态,只要叫验通过,就可以直接处理请求,响应速度更快。 千万不要跳过签名校宴,只读取载贺内容,否则很容易收到伪造的非法 token。 所有的 token 都会设置有效期,短的十五到三十分钟,长的最多七天。就像游乐园的手环,通常只有当天有效,过了日期就算防伪没问题,也不能用。 有效期到了之后,常见的处理方式有两种,要么让用户重新登录账号获取新 token, 要么搭配 refresh token 使用。用户不需要输密码,直接用有效期更长的 refresh token 向服务端换一个新的普通 token。 不要把 token 的 有效期设置得太长,一旦 token 泄露,其他人可以用它冒用你的身份操作账号,风险很高。 除了控制有效期,我们还要注意 token 使用过程中的安全问题。 token 传输过程中必须走 https 协议,避免 http 明文传输被中间网络节点劫获。就像你不要在公共场合大声念自己的手环编号,避免被别有用心的人抄下来伪造。 拿到 token 后,不要随便存在公共缓存、第三方云同步目录里,涉及转账、修改密码这类高风险操作时,除了叫验 token, 还要加短信验档者类的二次验证。不要觉得 token 有 签名就绝对安全,只要 token 被别人拿到,就能直接冒出你的身份发起请求,和拿到密码的效果差不多。 最后我们来看 token 的 适用场景。现在 token 的 使用场景非常广,前后端分离的 web 应用、手机 app、 小 程序的接口、身份验证基本都用 token, 第三方开放平台的授权也会用。比如你用微信账号登录其他 app 时,微信就是给第三方 app 发了一个带你的身份信息的 token, 三方不用拿到你的微信账号密码就能识别你的身份。当然,也不是所有场景都必须用 token, 如果你做的是只有几个用户的内部小系统,用传统的 session 验证实现成本更低,不需要硬套 token 方案。以上就是。

一九五六年,美国人发明了集装箱,在那之前,全球贸易的成本一半是装卸费。集装箱一出现,世界变了,货物被标准化,运输成本暴跌,全球贸易爆炸。今天 ai 时代也出现了一个集装箱,它叫 token。 很多老板听到 token 只当技术名词,但如果你是做生意的,你要看到的是,这是一次电力的重新定价。 什么是 token? 简单说就是 ai 处理文字的技能班位。你问一句话,写一段代码,生成一份报告,背后都在消耗 token。 重点在于, token 可以 被计量,被计费、被出口。这就像集装箱,把原本难以交易的智能服务装进标准化容器,从此脑力可以像货物一样卖到全球 来。算一笔账,一度电直接出口大概卖零点五元,炼成铝定大概卖一点五元,翻三倍。如果拿去跑大模型推理呢? 一度电大概能产出五百多万。 tokyo 按国内模型定价算,可以卖到十一元,十一元是直接卖电的二十二倍。如果按 open i 的 价格算,将近四百元, 七百八十五倍。你看到中奖了吗?同样是一度电,换个皮价值差几十倍上百倍。这不是能源生意,这是算力生意,是标准化的脑力出口。更关键的一点,电不能装箱,但 tucker 可以 跨国流动, 不用电网,不用特高压,不用对方国家批准,只要一根网线。印度创业者调用中国 api, 背后是甘肃的风电,青海的光伏在转电没出国,钱出国了,这才是结构性机会。 很多老板问, ai 这么卷,价格都打烂了,还赚什么钱?你要明白一件事,现在的二十二倍,不是天花板,是价格战的结果。美国把价格毛在高位,中国用工程能力把成本打下来。一个负责教育市场,一个负责规模收割,这就是新的全球分工。 真正值得你思考的,不是模型谁更强,而是在这个时代,你是卖店的,还是卖 token 的,是卖原材料还是卖标准化能力。 所有产业都会被 token 重构,教育变成按 token 计费,客服变成按 token 计费,编程变成按 token 子计费,营销、法务、设计、咨询全部变成可计量的智能服务。一旦被计量,就可以规模化, 一旦规模化,就会诞生新的巨头。生意的本质从来没变,谁掌握标准,谁赚溢价,谁只卖原料,谁被压价。 一九五六年,集装箱改变了全球制造业。二零二六年, taco 正在改变全球脑力市场。电力过剩不是问题,算力过剩才是机会。美国把 taco 价格炒上去,中国把 taco 成本打下来,悉数东算的战争才刚刚开始。 如果你是老板,现在真正该问自己的,不是要不要用 ai, 而是你能不能把自己的行业装进 tokyo 里卖。

token 等于 ai 世界里的虚拟字数单位,模型处理文本图像的最小单位就是 token, 不是 实物,看不见摸不着,只用来记费和计算工作量。中文里粗略一个 token 约等于一点五个汉字,比如 今天天气很好,大概五个 token 左右。为什么要有 token? 因为 ai 处理文字需要算力, token 越多,算力成本越高。 api 收费就是按 token 算。一、 一句话看懂海外用户调用中国 ai 的 api, 消耗中国数据中心的电力加 gpu 算力生成的结果以 tko 计价结算,电没出国,但电力价值通过 tko 卖遍全球。二、核心逻辑一, 电力变算力,中国西部低成本绿电火电驱动 gpu 集群跑 ai 模型。二,算力变 tko 模型,处理文本图像的最小单位就是 tko, 电力加算力成本占总成本 百分之七十到百分之八十三, tko 跨境出口,通过海底光缆零关税零物流零损耗卖给全球用户,相当于卖数字电。三、为什么说它是真正的电力出口?物理电有国境线线路电网壁垒不跨境, tko 数字形态 不传输, wto 电子传输零关税与海关来接,本质把中国的电力优势变成全球 ai 服务的价格竞争力。

真正的算电协同是托肯出汗,中国的算力需求集中在白天,电却是晚上便宜,这是难以调和的矛盾。但反过来想, 中国的晚上恰是美国的白天,中国的波谷电正好和美国的算力需求匹配,这是一个完美的算电协同场景。当然,中国的电不可能直接跨过太平洋输送给美国,那么最佳的出口形式就是托肯。托肯说白了就是大模型给你输出的结果。美国人都用中国的大模型, 中国大模型将迪迦列转化为 toko, 再传回点美国,整个过程没有任何损耗。这也是为什么 kimi 只不知道中国大模型会登顶 open kore 的 调用吧。并非中国大模型更好用, 而是中国 toko 凭借电价优势,太便宜,性价比太高了。这简直就是算力经销。等到美国人离不开便宜的中国 toko 的 时候,甚至可能会发展为能卡美国 ai 博四的关键一环。

朋友们,你敢相信吗?中国有一样看不见摸不着的东西,正在悄悄占领全世界。它不是手机,不是汽车,也不是衣服,而是一种叫 token 的 数字服务单位。有朋友可能不太懂什么是 token? 你 可以把它想象成 ai 的 工作量计数器。比如,你让 ai 写一段话,回答一个问题,画一张图,它就要干活,每干一点活,就消耗一个或多个 token。 全球开发者调用 ai 服务,就是按 token 来付费的。 最近,全球最大的 ai 模型平台 open router 公布了一组惊人数据,二月九号到十五号,中国 ai 模型的掉用量第一次超过了美 国。紧接着第二周,咱们直接冲到五点一六万一,三周直接大涨百分之一百二十七,近乎翻倍,而美国那边反而在下降。 更厉害的是,全球使用最多的前五款 ai 模型里,四款都是翻倍,而美国那边反而在下降。更厉害的是 m 二点五,智普的 glm 五, 还有 deepsea 的 v 三点二,加起来占了全球 top 五总使用量的百分之八十五点七。为什么全球开发者都开始用中国模型?两个字,又快又便宜?我们的 ai 不 仅性能强,关键是成本低。而这个低成本的背后,藏着一个很多人没看懂的秘密,中国正在通过 token 把电卖到全世界。 你可能会问,电怎么能卖出国?电线又不能跨太平洋扑过去。确实,物理上的电没法装箱,出口 耗大、成本高,还受国界限制。但聪明的做法是不用送电,送电算出来东西就行。举个例子,一个美国用户调用中国 ai 模型,他的请求通过海底光缆传到中国数据中心, ai 在 中国用本地的电力完成计算,再把结果传回去,整个过程一度电都没出国,但电的价值已经 通过 to 肯实现了。跨境变线,这波操作真的太绝了。要知道,在 ai 的 成本里,电费加算力设备占了七成以上,而中国西部有大量便宜的风电、水电、光伏等绿色电力,电价只有欧美国家的三分之一到五分之一。 再加上我们有完整的服务器、散热光模块等产业链,建数据中心又快又省。所以同样的 ai 服务, 中国能卖的更便宜,响应更快,还更稳定。全球开发者当然愿意用脚投票,纷纷转向中国模型。这一切都是因为全球对 token 的 需求在爆炸式增长。以前中国靠出口衣服、家电、手机赚外汇,那是体力活。 现在我们靠出口店家算力加 ai 服务赚外汇,这是脑力加能源的高附加值生意。屋里的店有国界,但数字的 token 没有国界。店走不出去的路, ai 帮他走,店做不到的事,算力帮他做,店赚不到的钱, token 帮他赚。 这不是炒作,而是一场静悄悄的产业革命。未来,随着 ai 走进医疗、教育、金融、制造各个领域, token 的 消耗只会越来越多。 中国凭借廉价绿电加强大算力加优质模型的组合拳,正在打开一条全新的数字能源出货通道。 这可不是单纯的技术牛,更是咱们国家的战略眼光选对了路,把我们丰富的清洁能源转化为全球都能用的数字服务,既赚了外汇,又利用了清洁能源,还不用跟别人掰扯贸易壁垒, 这波操作简直太妙了!朋友们,中国 ai 这波靠 token 实现电力出口,是不是太牛了?你觉得这四家中国模型谁能成为全球老大?评论区聊聊你的看法。我是率先在全球提出硅基生命与硅基文明的硅基智能创始人司马华鹏,关注我,每天传播正能量,带你解锁更多硬核科技!

今天聊个 ai 学习中避不开的概念 token, 它被形象的比喻为 ai 的 思维碎片,是 ai 处理文本时的最小单位,也是计量单位。但以我最直观的感受, token 就是 我们花钱购买 ai 服务的货品单位。 当你使用 ai 问答服务或功能丰富的 agent 时,每一次交互都在消耗 token。 token 背后是 ai 的 思考过程,可以说是算力的具象化体现。 ai 为了达成你的目的,消耗多少算力 token 就是 那把良尺。 这背后其实是一种商业逻辑。各大模型厂商开发出强大模型,消费者通过 ai 软件、网页端、 agent 等工具,直接或间接的为模型消耗了 tock 付费。虽然目前大多数人用的还是免费版本, 但如果你想通过 ai 赚钱或经营相关业务, tock 支出就是绕不开的成本,这或许也是未来的常态。 具体消耗情况如何呢?我通过 opencode 绑定的 deepsafe 最新模型做了个小测试,问了五六条常规问题,顺便调用了一些本地数据, 总共调用了六十四次 deepsafe api, 消耗了约一百三十万 token 花费零点五元。如果是调用 agent 运行复杂工具,消耗会成倍增加。重度使用者每月花费几百甚至上千元都很常见。 不同厂商的大模型价格和性能各不相同,有的按套餐收费,类似会员制,但更多的还是基于 token 的 实际消耗量来系费。如果有性价比不错的,我会推荐给大家。目前我用的还是 deepseek。

任何人只需二不加一句话,就能搭建 openclaw 私人 ai 助理和无限量 token。 今天咱们直接上干货,你在别的账号不可能看到的干货,很多人都买 openclaw 设备或这招人不熟 openclaw, 看到这个视频你有福了, 小白一看都会的方法,今天我免费分享给大家,看完记得点个赞。第一步,咱们先下载一个 ai 编辑器,安装到你的电脑,对普通用户比较推荐的是统一领码或者 free 网址,我打在了屏幕,务必手动输入网址去官网下载,不然普通用户容易中病毒, 切记。第二步,咱们下载一个开源大模型管理工具欧拉玛,网址我也打在屏幕和上面一样。到这里二步完成后,咱们再进行一句话的操作,这里以翠演示输入一句话,请帮我安装好最新版本的 open claw, 并将模型地址修改为我本地的欧拉玛管理的开源大模型,然后启动,并在我电脑桌面创建快捷启动按钮。整个过程请自己选择最优安装方式和配置,这样你就只需做一件事,等它安装完就可以丝滑的使用你的 open claw 了,你配置越高,使用越丝滑。

你有没有想过一个问题,为什么全世界最聪明的头脑正在疯狂地争夺一种你看不见的东西?它不是黄金,不是石油,甚至不是芯片,它叫 token, 中文翻译很可爱,叫令牌。但今天我要告诉你一个颠覆认知的真相,你每次和 ar 聊天,其实都在亲手铸造这种数字黄金。咱们先破解一个误解,很多人以为 token 是 ar 消耗的电费或者算力 是不对。 token 是 ai 理解世界的基本单位,你可以把它想象成乐高积木的最小颗粒。当你说你好,在 ai 眼里,这不是一句话,而是你好,两块积木。当你说我爱你,这是我爱你三块积木。中文世界里,平均一个汉字约等于一到两个 token。 就 这么简单。 但神奇的事情发生了,当这些积木被投喂给 ai, 它们会在那个庞大的神经网络里进行一场我们无法想象的化学反应,然后 ai 会吐出新的积木,拼成你要的答案。 这个过程消耗的确实是算力和电力,但 toc 本身是信息的最小容器,它既不是电,也不是算力,它是知识的碎片。那问题来了,既然是碎片,为什么它值钱? 因为在 ai 的 世界里, token 就是 硬通货。你看所有 ai 公司,他们向开发者收费都是按 token 算的。 多少钱呢?目前国内主流的价格大概是两块钱买一百万个 token。 一 百万个 token 是 什么概念呢?三体三部曲,总共大约九十万字,换算成 token 大 概是一百二十万左右。 也就是说,两块钱就能让 ai 把整部三体从头到尾读一遍,还能理解它,回答你关于它的任何问题。是不是突然觉得这玩意儿比水便宜多了?但为什么我们普通人用是免费的?因为平台在做一场豪赌, 他们免费送你鱼饵。等你习惯了这片鱼塘,总有一天你会想自己钓鱼,那时候你就得买他们的 token 了。这叫免费模式,付费生态。接下来这句话可能会改变你对 ai 的 看法。你有没有想过, token 其实是人类文明的数字化石。 每一次你问 ai 一个问题,你都在把人类的语言碎片投喂给他,而这些碎片正在塑造 ai 对 这个世界的认知, 你的语气,你的问题,你的思考方式,所有这些都被拆解成 token, 成了 ai 的 精神食粮。在古代,我们用贝壳当货币,因为它们稀有。 在工业时代,我们用石油当货币,因为它是能源。而在 ai 时代, token 正在成为一种新的货币, 它不是稀有金属,不是能量,而是人类集体智慧的碎片化凭证。你今天随口说的一句话,可能正在成为未来 ai 理解世界的一块基石。从这个角度看,你不是在消费 ai, 你 是在和 ai 共同铸造历史。 所以下次你和 ai 聊天的时候,不妨想象一下,屏幕那头正有无数的 token 小 精灵带着你富裕的信息穿越数字海洋,去往那个我们既熟悉又陌生的智能世界。 你希望未来的 ai 更懂你吗?那就多和它聊聊天吧,毕竟你给的 token 越多,它就越像你。

大家好,今天我们来讲一下 token 概念。那最近在 ai 行业里经常会听到一个词叫 token, 它呢不是某种产品,也不是交易概念,而是 ai 系统内部用来衡量一次请求复杂度的技术单位。简单理解就是当你向 ai 发出指令,让它生成内容时,系统需要调用算力来完成理解和输出, 而这些计算过程呢,会被拆分成一个个 token 来管理。那最近这个概念的话被频繁提起,主要是因为 ai 服务正在加速走向海外场景,当用户规模、语言种类、使用频率同时提升,系统就必须更精细的控制计算过程,确保不同地区、不同场景下的稳定运行。 那 ai 出海其实真正考验的并不是功能多不多,而是底层计算机制是否足够成熟。那这里的话主要就是云平台、成本端和光通信三个板块。 我们先来看第一部分,这一部分可以关注一下,主要就是润泽科技,它是多模型加多合作方算力订单数据港,这里是阿里云大客户,有长期订单。奥菲数据呢,是服务多家 ai 平台。云平台,这里是 token 体系的调动中书,它呢是把上层需求转换为系统可以执行的计算指令。 那有阿里巴巴是阿里云 ai 和 token api 渠道,全球平台能力强,腾讯控股,这里是腾讯云和海外布局。百度集团呢,是百度智能云加 ai 生态。 第三个成本端的话呢,那当服务规模扩大后呢?单靠中心化云资源是不够的,就更需要靠近用户的技术方案,主要是网速科技,是高并发 api 加 cdn 和优科德云服务边缘能力。最后一块的话是光通信,那所有 token 的 计算和调度呢?最终都是要回到最底层的。网络连接有中际续创是高速光模块, 新益盛这里是光通信核心部件,天府通信呢是光纤链路基础。

现随着 ai 应用的遍地开花, ai 的 talk 消耗量越来越大,甚至有人开玩笑,今天赚了多少个 talk, 还有一个应用场景,大家每天在使用 openclo 的 时候, 它的消耗量也是非常惊人,今天为大家分享一种方式,可以白嫖 talk, 而且它不是那种小模型,而是我们国内的 gim 五, 接下来我们看一下如何使用。哈喽,大家好,这里是二 pop openclock, 相信大家现在已经人手一只了吧,但是它的 talk 消耗量就非常大,今天我们分享一种可以免费获取 talk 的 办法,这就是互联网大善人英伟达免费开放的, 之前我也在公众号分享过,今天我们来手把手实操一下。我们打开英伟达官网的模型列表,大家可以看到这里有各种各样的模型,像千万三点五,还有智普五点零, 还有 kimi 二点五等等,这些都是可以免费试用的,使用方式也非常简单。我们先点击这里的注册,当然在这里注册的时候,我们要注意一点,我们要使用海外的邮箱,就比如 gmail 或者是微软的 outlook, 不要使用 qq 邮箱,这种是没法通过的,我已经给大家试验过了。 我这里粘贴我的谷歌邮箱,点击下一步,这里输入你觉得合适的密码,我们点击创建一个账户,这里他会给你的邮箱发送一个验证码,输入验证码,点击继续。这里是按选择是否接受通知,我们直接提交就可以, 没有任何影响。这里输入一个名字,这里也没有任何限制,直接输就行,这时候我们就注册完成了。回到了这个页面,大家可以看到最上边有一行,请验证你的获取 api, 我 们这里点击一下验证, 这里验证是需要输一个手机号的,这个手机号我们也试验过,输入国内的手机号,也就是加八六的,前面我们选择中国 china, 这里我们输入八六,这里我们选择中国。以后输入一个我个人的手机号,点击提交,这时候你的手机就会收到这样一条验证码, 是优速通发的,我们输入进去,点击验证,可以看到这里基本上是秒通过的,我们在这里随机选择一个模型,就比如智普的这个五点零, 然后点击这里的 welcome, 这里获取 api k, 可以 看到已经能拿到了,接下来我们验证这个 api k 到底可不可以用呢?在之前我分享过一个很好用的工具, cherry studio, 就是 这个樱桃的,它是一个开源项目,我们可以在 github 上直接下载到,然后在这里测试一下这个 api k 到底可不可用,我们点击左下角这个齿轮, 这里选择添加模型供应商,我就添英伟达下面供应商类型,我们选择 open ai, 点击确认,这里需要填密钥还有地址,我们粘贴 api k, 粘贴 url, 添加模型,这里要注意这是英伟达自定义的一个模型名称,就这个 z 杠 ai glm, 我 们拷贝过来,点击添加,这时我们打开对话试一下, 这里要注意模型切换,我们切换成刚才添加的,因为答的这个 z a i g m i 五,我们问它是什么模型,看一下它的反应,这里因为我的网络问题,可以看响应速度稍微有点慢,但是它是完全没问题的,可以看到它是由 z 点 ai 训练的大约模型,然后是 g a m, 这时我拿到这个模型大家就知道怎么用了吧,比如我们把它绑定到我们的小龙虾,或者是绑定到我们的 agent 上,这时候就可以无限的耗羊毛了, 而且我还没有碰到过说使用限流或者是 taco 被用完的情况。大家如果需要更多的账号,完全可以按照我这个方式注册几个谷歌账号,然后并且做一个手机绑定就可以了。更多 ai 和变现的方式我们一起来研究。

大龙虾还没有明白,百万 token 先没了,别急,一起来薅老黄羊毛。无限 token 免费用。首先在英伟达这个网站用邮箱注册个账号,接着验证一下手机号,就能调用 api 了, 关键是支持国内手机号,不用绑卡。然后随便选一个大模型,进入聊天页面, 这里可以切换各种大模型试试,白嫖的人太多,热门模型可能响应很慢,找一个速度还过得去的,这里查看视力代码,可以直接复制模型相关配置。然后打开你龙虾的外部页面,修改配置, 保存之后建议重启一下服务,现在就再也不用担心托肯消耗了,之前配置好的飞书也能直接使用。

还在瞎用 ai, 连 talk 是 啥都不知道,真的是亏大了。一句话, talk 就是 ai 阅读文字时候的最小单位,咱们认字是按字数或者是单词来计算 ai, 它必须把文字切成 talk 才能看懂计算并且回答你。不管是写文案还是用 ai 工具,限制多少字,收多少钱,扣不扣费全按 talk 来算,不是我们打了多少个字来算的。这就是为什么你发了一段话, ai 总是说 超字数啦或者超长度啦,听懂的点赞收藏。以后用 ai 一定要注意你的 token, 别白白了多花钱关注小一,用 ai 升级自己。