我不认为说未来 token 的 价格会越来越低,因为现在都是科技大佬在按照自己的逻辑去讲话,我推荐大家多用 ai 去做一些编程,而不是用 ai 去做一些文字性的工作。为什么?因为现在这个 token, 也就是说现在的算力是非常便宜的,但这不愧是一个持久的状态。今天市场上其实 有一个盲目乐观情绪,就是说技术成本会越来越低,从技术层面来说这是对的,但是从社会管理学的来说,这是错的。 ai 的 发展本质上它应该是繁荣就业,但现在并没有。所以我预计啊,在未来一两年之内, 如果我们的 ai 继续,实际上导致的是所有的企业都在雇佣 ai 员工,而削减实体员工的话,中美两国就不得不出台一个政策, 就是把算利的价格提高,其实就是等于是再次分配,对 ai 企业收重税。这就好像就是我们呃,雇佣这个实体员工一样,你有一个最低工资标准,那现在 token 的 价格其实是市场化的,企业按照自己的标准来制定, 所以 token 的 价格也就是我们所说的算力大量被浪费,然后 token 呢?也是几乎啊,成本在无限趋近于零,但是这种情况是不可持续的,你可以想想,就作为这个社会管理学的角度来说,如果每个企业都雇佣数字员工, 最后代替了实体员工,并不是所有人都能在科技革命的这个转型当中能够适应社会的继续向前发展的,很多人会被淘汰掉。那么这一个国家,一个民族,他外部还没怎么样,他内部就乱了, 但是中美两国现在由于在科技竞争的这个过程当中,谁都不可能采取实际的这样的方式,因为你一旦把你的算力计算的这个价格提高了,也就意味着你基本上就退出了第一梯队了,所以现在大家都是硬扛。但是问题在于,如果两年之内就业双方都没有让就业繁荣, ai 没有让就业繁荣,反而是让这个就业呃,继续下滑,那不好意思,那他只能是提高这个算力的成本,也就是说他会强制这些卖 token 的 企业提升价格,或者对 token 有 一个基本的定价,那这样的话其实计算成本就大幅提高了。 所以其实这两年是一个非常重要的窗口期,无论你是学生啊,青年人、中年人还是企业家,你无论是什么样的身份,都应该尽快的用 ai 去做一些无用的东西,因为你现在浪费算力几乎等于是零成本, 等有一天政府进行再次分配的时候,收重税的时候,那就很贵了。就你可能会发现你雇一个数字人跟雇一个实体员工大概价格差不多, 那这个时候其实就达到了一个社会的平衡。所以我不认为说未来 token 的 价格会越来越低,因为现在都是科技大佬在按着自己的逻辑去讲话,因为这些完全是没有社会管理学的因素进来。那确实是这样的,但是 一个社会的向前发展,它绝不是一个学科的向前发展,它是多个学科融合,所以未来很有可能会出现什么呢?就是 token 的 价格会上升, 所以抓紧这个时间,尤其是企业家,千万不要让员工代劳,而是你要自己去做语自然语言编程,你把这些算力浪费就浪费,你编出屎来都没关系。为什么?因为实际上 他是彻底改变了一种人际交互的方式,也是彻底改变了人跟社会,人跟结构的这种关系,就是他会让你的思维产生巨大的变化,让你重新审视这个社会发展的方向,以及你行业的特点,以及行业的痛点,以及行业未来的机遇在哪,你不下场去实操,你是理解不了这些事情的。 所以越是企业家,越是现在身居高位的人,他越应该用自然语言编程去做一些他自己喜欢玩的东西,都可以,无所谓。其实他的目的并不是说你真的弄个龙虾,弄个什么 a 阵的,然后你就财富自由了不是?而且企业家其实很多已经财富自由了,你是在学习, 你是在用这种工具去真实的触摸社会,去学习,这个才是本质。但是现在很多人没有理解,你想等两年以后,三年以后,如果真的对 token 收重税的时候,对吧?规定一个最低的价格的时候, 你学习,你付出的成本也很高,而且那个时候社会又会迎来一次巨变,那怎么样我们不知道,但是 token 无限的就是算力的成本越来越低的,这种可能性不太可能会发生,它最后甚至有可能成为一种真实的社会的货币, 就是它替代金钱变成一个真实的货币,这是有可能的。所以你想想,当它真的代替货币成为价值交换的一个流通渠道的时候,其实它的价格会越来越贵的,所以,嗯,辩论的去看这个问题。
粉丝49.9万获赞268.3万

咱们来聊聊光云科技这家企业,它于二零零九年在杭州成立,是电商 sars 第一股。简单说就是给电商商家做运营工具箱的, 从店铺管理、打单发货到客户管理全覆盖,不管是淘宝小卖家还是品牌大商家都能用。现在累计服务四百多万商家,客户一百二十万,接入了淘宝、抖音、拼多多等五十多个平台,妥妥的电商生态卖水人。 他的技术水平在 ai 赋能真落地,研发团队占比超百分之二十七,二零二五年研发砸了近四千万,手里有不少专利, 核心的 ai 工具超实用。深汇 ai 能自动生成商品主页和详情页,比人工快太多。 ai 客服机器人快卖小,智效率提升三倍。二零二五年上半年收入涨了百分之十七点八九, 还搞了微服务架构,产品两到四周就迭代一次,响应商家需求特别快。 ai 模块付费升级后,客单价都涨了百分之二十到百分之三十。在行业地位上,电商 sars 赛道的老牌强者。 在阿里商家服务市场稳居领先地位。多平台布局后,非阿里系收入快过半了。二零二五年三季度营收四点零五亿,毛利率百分之七十点三一,远超行业平均的百分之三十。 大商家业务是增长主力,二零二五年上半年收入涨了百分之二十二点七三,占总营收近四成。产品优势 全场景覆盖加粘性超强,中小商家有超级店长、快递助手这些刚需工具, 客单价低,但用户基数大。大商家有 erp 加 c r m 加 w m s 全套解决方案, 客单价高达五到五十万元,续费率超百分之九十,订阅制收入占比百分之八十以上,现金留稳,还能适配抖音、拼多多等新平台,帮商家搞定全平台运营,换合作方的成本极高,客户资源、商家基础超扎实, 四百万累计服务商家里既有初创小卖家,也有品牌大商家,覆盖电商全产业链,绑定了阿里、抖音等主流平台,二零二五年还新进了香港某公司、国寿、安保等机构股东,客户和资本都认可 抖音平台,收入逆势涨了百分之七十八点。四亿多平台布局让客户结构更稳。发展前景, ai 加多平台打开增长空间现在电商商家都要精细化运营, ai 工具能帮他们降本增效,需求越来越旺。 公司一边靠 ai 提价增收,一边拓展大商家和新平台,二零二五年三季度已经减亏百分之七十三,盈利拐点快到了, 后续还要靠供应链 sars 完善生态,跟着电商行业增长喝汤,加上订阅制的稳定现金流,只要稳住续费率,控制好费用,长期增长很有盼头。希望以上信息能帮助您更多了解这家企业。

中国 taco 出海,很多人只看懂了一半,如果用一句话来总结, taco 出海其实就是一场由电力、算力和模型共同驱动的全球 ai 服务贸易竞争。 这个事情是什么时候开始火的呢?大概是从去年年底开始,到今年的春节之后,直接成为全球科技圈和资本市场的焦点。 那先来说一个很关键的数据,那上个月呢, openroot 发布了一份周报,在中国 ai 圈直接刷屏了。那报告里面有一句话非常炸, 在这个平台排名前十的模型中,中国模型消耗了百分之六十一的 token, 而且前三名分别是 minnes, kimi、 智普,全部都来自中国。听起来是不是很猛?但问题是,这百分之六十一 到底意味着什么?我们先来搞清楚一个核心问题, open world 到底是什么呢?你可以把它理解成一个模型超市,是全球最大的 ai api 聚合平台之一。开发者呢,可以在上面自由地选择不同的模型,按需来调用。 但这里有一个很关键的点,像大模的观点就是, open world 是 整个全球生城市 ai 市场里面 大概只占百分之二的份额。而且它的用户是谁呢?主要是价格敏感的开发者,中小型公司真正的大客户高价值调用。其实呢,还是直接走向 openai and thorpe 这样的公司的官方 a p i。 所以 结论很重要, open 者上面的百分之六十一,不能简单地等同于中国已经主导全球 ai 服务的市场了, 它更像是一个细分化市场里面的突破,但是趋势是真的,而且非常清晰。很多人开始提出了一个判断, tucker 出海可能是中国这轮 ai 竞争里面实现弯道超车的关键机会。 那为什么这么说呢?和声音就两个词,性能够用极致性价比。比如到今年二月的中下旬 开始,出现了一个标志性的变化,中国模型的调用量第一次超过美国模型,达到了五万亿 token 级别,而且在全球超五模型里面,中国就占了四席。这意味着什么?说明了一件事情,海外用户已经开始征用你 了。那背后的底层逻辑其实是一个铁三角模型,算力、电力。我们一个一个来说。第一,模型能力。 现在呢,国产模型在代码生成、 agent 这些核心场景里面,已经可以做到跟海外的顶尖模型媲美了。比如说 cloud 这一类,百分之八十的性能,那不仅是能用,甚至呢 是相当不错了。那第二是算力在哪?几乎所有的研究都有一个共识,中国模型的推理算力基本上全部在国内,也就是说海外用户在调用 a、 b、 i 的 时候,数据是经过海底光缆传到中国的,中国的数据中心完成计算, 再把结果传回去。那这样呢,有一个特别关键的点,咱们的电力没有出海,但是价值出海了。 你可以理解为中国在卖算力服务,本质就是在卖店加算力加模型能力。而且这个模型还有一个隐藏的优势, 它绕开了高端芯片的出口管制,同时呢,把中国最强的优势,基础设施便宜、供给充足,转化为全球竞争力。所以本质上这件事情不是偶然的爆发,而是一个非常典型的供需匹配。 一边呢,是啊,全球开发者想要更便宜更好用的模型。那另外一边呢,是中国有低成本算力,而且可用模型充足电力两边一对上,就形成了一个可持续的商业闭环。 那接下来重点来了,托肯出海到底怎么赚钱?谁在受益?这不是一个单点机会,而是一整条产业链的传导。他的逻辑呢,其实很清晰,海外调用需求增加, 模型厂商赚钱,扩建算力拉动芯片、服务器、 idc, 最终变成了对算力的持续消耗。你会发现这是一条从软件一路传导到能源的链条。而整个产业链的变现大概可以分成四层。 那第一层呢,是最前端的 api 直接收费,模型公司呢,靠低成本的推理赚调用费,平台是赚中间的佣金。那第二层是中油算力和基础设施云厂商数据中心,靠租 gpu 机柜电力赚钱。那第三层是上游的硬件、芯片和服务器,需求一爆发,就是典型的量价齐升。 那第四层是最底层的电力,尤其是西部的绿电,还有算电协同协调,我们来看有哪些在产业链上的代表公司。产业链呢,主要有六个环节。其实底层呢,还是我们经常聊到的 ai 基建模型和聚合环节,主要有 啊智普、 ai、 minimax、 kimi 以及 d c 算力服务以及 idc 环节主要是润泽科技、首都在线、红景科技、数据、港澳飞啊,世纪互联。国产算力硬件环节主要是海光、韩五 g、 华为生腾店里面的啊华锋。 那电力能源环节是主要是经开能源、内蒙华电、净能电力、国能日新电网。设备环节主要是中国西电、特变电工、许继电器。最后的配套环节呢,主要是网速科技、 深信服以及安恒信息的。那本质上,你可以用一句话来总结,前端赚不赚钱,取决于后端的成本低不低,而中国最大的优势恰恰就在这规模化的低价电力加高效的算力基础设施。但最后,我必须给你一个更冷静的判断, 中国偷肯出海,在价格敏感型市场确实已经打开了窗口,但是你把它外推,中国马上就要颠覆全球 ai 格局,那是有点过早了。因为长期来看,真正的壁垒不只是成本,而是三件更硬的东西,数据、主权、 地缘政治以及生态体系。 ai 竞争已经不仅仅是商业竞争,而是全球权力结构的一部分。美国现在在做什么呢?本质是在构建一个排他性的技术同盟体系。所以接下来真正值得关注的不是一句,中国模型到底厉不厉害, 而是在这场电力加算力加模型的商业战中,最终把中国 ai 带到哪里。如果你觉得这期视频有用,欢迎关注,我是派,下期见。

every industry is here, every tech company is here, every ai company is here incredible。 历史会记住二零二六年三月二十日, 不是因为黄仁勋发布了什么新芯片,也不是因为英伟达股价又创新高,而是因为这一天,这位身着黑色皮衣的 ai 领域从业者在凹印播客现场,对着四位硅谷投资人说出了一句让整个科技行业备受触动的话, 一个年薪五十万美元的工程师,如果一年只花五千美元的 token, 我 会让他立刻离开。仅仅二十四小时后,这番话就像一颗深水炸弹,在硅谷的 hr 部门,在华尔街的分析师会议室,在全球数百万工程师的邮箱里,同时引发热议。 你发现了吗?这不是一次普通的商业访谈,这是黄仁勋在向全世界释放的重要信号。在这个房间里,没有 ppt, 没有产品演示,只有一个客观的事实,不会用 ai 的 人,已经难以跟上行业发展的步伐了。 今天,我们要拆解这场访谈中黄仁勋透露的关键信息,看看在算力需求大幅增长的趋势中,我们普通人手里最后还有什么筹码。访谈一开场,主持人问了一个所有人都在想的问题, ai 算力需求到底增长有多快? 黄仁勋没有直接回答,他先讲了一个让全场安静的真实案例。去年,一家中型互联网公司的 ceo 找到他,自信满满地说,他们的数据中心已经扩容完成,足以满足未来五年的 ai 算率需求。黄仁勋笑着说,你可能连五个月都撑不过去。结果不出所料,三个月后,这家公司的技术负责人再次找上门, 语气急切,算力已经无法支撑,需要紧急采购十倍于之前的资源。这只是开始。随后黄仁勋抛出了那个极具冲击力的数字,从生成式 ai 到推理式 ai, 算力需求增长了一百倍。从推理式 ai 进入智能体时代,又增长了一百倍,仅仅两年时间。一万倍。 这不是现象增长,这是指数级增长,是一场没有人能够置身事外的算力改革。为什么? 黄仁勋的解释客观而清晰?过去的叉 g p t 是 一问一答,你提问,他回答,交互结束,就像去餐厅点一份菜,厨师做好递给你完事。 但 ai 智能体的工作方式已经发生了本质的变化。当你给一个智能体任务时,它要调用长期记忆查找工具和数据,拆解复杂任务,与其他智能体协作。你以为你在用一个单独的智能体,实际上你调动的是一整支 ai 体系。 一个简单的请求背后可能是几千次计算操作。黄仁勋举了一个生活化的例子,你想做一顿三人晚餐,预算五百元,过去你自己买菜、清洗、烹饪、摆盘、清理,全程靠自己。现在 ai 智能体会自动拆解, 一个子智能体负责采购,一个负责清洗切配,一个负责烹饪,一个负责摆盘,一个负责清理厨房。 更值得关注的是记忆系统,过去的 ai 用完就忘,像没有记忆力的人,但智能体需要记住一切,建立知识图谱, 这甚至比整个 chat gpt 模型还要庞大。还有外部工具调用,一个能熟练调用十种工具的智能体, 算力消耗是不调用工具的八十倍以上,而未来的智能体可能需要同时调用上百种工具。黄仁勋给出了一个客观判断,未来五年, 绝大多数科技公司都会因算力不足面临发展困境,不是因为没钱买服务器,而是因为根本无法理解算力需求的增长速度,无法跟上这场技术革命的步伐,最终被时代淘汰。他举了一个真实的案例, 一家大型银行部署 ai 智能体,最初计划采购一千台服务器,测试阶段就发现连基本任务都无法满足,最终不得不采购一万五千台,是最初计划的十五倍,而这还只是开始, 未来十二个月内可能还要再采购五万台。摩根士丹利预测,到二零三零年,全球 ai 算力服务市场规模将达到一万亿美元, 而英伟达作为 ai 芯片的领先企业,将成为最大受益者。黄仁勋透露,最新 verubin 架构已经将 ai 智能体的算力效率提升了三十五倍,这不是单纯在卖芯片,这是在搭建通往新世界的通道, 而算力就是进入这个新世界的关键。如果说一万倍算力增长还不够有冲击力,那么黄仁勋透露的英伟达内部考核标准绝对让全场嘉宾倍感意外。 当主持人问起英伟达员工的 ai 使用情况时,黄仁勋没有直接回答数字,而是讲了一个假设的情况,假设有一个年薪五十万美元的工程师,到年底我问他花了多少 token, 他 说五千美元。我真的会很生气,我会觉得这个人完全没有跟上时代,他没有资格继续在英伟达工作。全场愣住, 主持人追问,那你期望是多少?黄仁勋毫不犹豫,至少二十五万美元。这不是建议,这是基本要求。 二十五万美元相当于年薪的一半。英伟达要求员工把一半的工作预算花在 ai 工具上。这种激进的考核方式,在整个科技行业都是前所未有的。黄仁勋的解释直接而客观,这就好像一个高级会计师跟你说,我不用 excel, 我 坚持用纸和笔做财务报表, 你会怎么想?思想守旧,落后于时代,无法胜任工作。现在的 ai 工具就像二十年前的电脑,十年前的智能手机, 不是可选工具,是必备工具。拒绝使用 ai 完成工作,就等于在二十一世纪选择低效的出行方式,在互联网时代选择传统的沟通方式。更受关注的是,英伟达已经将 token 消耗纳入绩效考核, 定期查看每个员工的 token 使用情况,消耗过低地提供培训,培训后无改善地调整岗位,甚至解除聘用。黄瑞勋透露,英伟达计划为工程团队投入二十亿美元的 token 预算, 这不是成本,是投资。因为 ai 能让工程师从重复性工作中解放,有更多精力思考挑战性问题,探索未知领域,创造价值。他反复强调一个观点,未来的职场不再需要指挥执行任务的执行者, 而是需要能够指挥 ai 完成任务的主导者。未来的程序员写的不是代码,是想法、架构和评估标准。你不需要一行行写代码,而是要告诉 ai 你 想要什么,然后让多个智能体去执行。 你设计任务、分配资源、监督进度、评估结果,这不是在提高工作效率,这是在重新定义工作本身。黄仁勋的 token 考核制背后是深刻的商业逻辑,强制员工学习 ai, 形成 ai 优先的文化,释放创造力,构建生态护城河。 员工用的 ai 越多,对英伟达芯片的需求就越大,但这给我们普通人的信号再清晰不过。在 ai 时代, token 消耗量能体现你的工作能力和适配性,不会用 ai 的 人很难在行业中立足。 访谈中,黄仁勋用了大量时间谈论 opencloud 这个被他称为人类历史上规模大、受认可的开源项目。他说,大多数人严重低估了 opencloud 的 价值,他远不只是一个 ai 助手。 opencloud 有 四个核心要素, 内存、系统、技能库、任务调度、 i o 输入、输出。这就是一台计算机的完整定义。所以, opencloud 是 第一台真正的人类个人 ai 计算机, 它的意义不亚于一九八一年 ibm 推出的第一台个人电脑,甚至可能开启一个全新的计算时代。内存系统存储和管理数据模型上下文相当于硬盘和内存 技能库,提供预训练能力和工具,相当于操作系统和应用程序。任务调度、拆解复杂任务相当于 cpu 和调度器。 i o 系统与用户和外部系统交互,相当于键盘、鼠标和显示器。 有了这四个要素, opencloud 不 再是简单的 ai 助手,而是能够独立完成任务,自主学习、自我进化的个人 ai 计算机。你不需要任何技术知识,只要会说话、会写字,就能通过自然语言让它完成复杂任务。黄仁勋举了一个例子, 规划七天欧洲旅行,预算一万美元,偏好文化和美食。过去,你自己打开浏览器,搜索目的地,查找航班、酒店,制定行程,考虑交通门票需要花费几天时间。现在,告诉欧盟可靠你的需求,它自动完成所有工作。 选择目的地,查找航班、酒店,制定行程,推荐小众景点和美食,提醒天气习俗。你不需要任何手动操作,只需等待结果,稍作调整。 这不是提高效率,这是彻底降低了使用计算机的门槛。计算机不再是少数人的工具,而是每个人的伙伴。黄仁勋预测, opencloud 将成为下一个具有重要影响力的开源项目,甚至可能超越 linux。 lenox 开启了个人计算机时代, openclock 开启个人智能体时代短短几周内的开源热度已经取得了远超 lenox 初期三十年的发展成果。到二零二七年,全球将有超过十亿人使用 openclock。 更重要的是, openclock 推动了 ai 从中心化向去中心化的转变。 过去, ai 服务由少数科技巨头掌控,现在,每个人都可以拥有自己的个人 ai 计算机,不需要依赖巨头。这不是在发布产品, 这是在打破旧有的行业壁垒。当每个人都有 ai 计算机时,那些靠掌控算力发展的公司将面临发展挑战。访谈进行到一半,主持人抛出了一个敏感问题。 antrotica 的 ceo 达里奥一直在提及 ai 的 安全问题,甚至说 ai 可能给人类发展带来挑战。 如果你坐在 astonropica 董事会,你会说什么?黄仁勋沉默几秒,然后缓缓开口。他先客观地评价了大力奥,优秀的技术人才,安全意识良好,执行力出色。克拉的模型有很多值得借鉴的地方,但话音刚落,他突然画风一转,语气变得坚定,过度渲染焦虑并不可取。 技术领袖的话很有分量,一言一行都会影响公众、政策制定者,整个行业。你不能随意做出 ai 会给人类发展带来重大挑战的极端预测,去引发公众焦虑,影响政策、阻碍行业发展,这很不妥,也不够负责任。 黄仁勋具体指出,达里奥声称 ai 将在五年内淘汰百分之五十入门级白领工作失业率大幅上升至百分之二十,甚至呼吁暂停 ai 发展,直到找到安全措施。 这些言论过于极端,缺乏科学依据,容易引发公众不必要的焦虑。 ai 不是 生物,不是外星生物,没有自主意识,它只是一段代码,是人类创造的工具,不会自己思考,不会自己做决定,更不会主动对人类造成不利影响。 这番话展现了 ai 领域的不同发展观点。发展派马斯克、黄仁勋、 sam 奥特曼坚定认为, ai 是 人类历史上最伟大的技术革命,应该全力推动发展,相信 ai 能帮助解决疾病、气候、能源等方面的难题, 风险可以通过技术手段和监管进行控制,不能因为心存顾虑而停止发展。谨慎派杰弗里辛顿、哈萨比斯达里奥认为, ai 发展速度已超出人类的把控能力,可能产生与人类利益不一致的目标,主张暂停发展,直到找到有效的安全措施。 黄仁勋显然是发展派的坚定支持者,他说, ai 带来的价值远远大于潜在风险。如果因为心存顾虑而停止发展,我们将错失巨大机遇。就像因为担心汽车事故而拒绝使用汽车,因为担心飞机故障而拒绝乘坐飞机。但这番话不可避免地带有他的立场。 英伟达是 ai 芯片领域的领先企业, ai 发展越快,算力需求越大,英伟达的发展空间就越广阔。然而,它的 ai 理性论对当前行业发展是有积极意义的。确实有一些 ai 公司为吸引投资而夸大风险,有媒体为博取关注而报道极端预测, 有所谓的技术专家为提升知名度而制造话题。这些行为误导公众,影响政府决策,阻碍 ai 健康发展。 正确的态度应该是重视安全问题,采取有效措施降低风险,但不能过度焦虑、阻碍发展。 以理性、科学的态度看待 ai, 认识到它是为人类服务的工具,而不是威胁。但对我们普通人来说,这场行业观点的分歧带来的启示是,无论哪种观点成为主流,难以适应 ai 发展的人都会面临发展困境。 访谈接近尾声,主持人问了一个敏感问题,你怎么看待中国在 ai 和机器人领域的发展?很多美国科技巨头会刻意回避或片面评价, 但黄仁勋给出了客观甚至高度评价的回答,中国在机器人领域的优势比想象中要大得多。他说,机器人的核心零部件,微电子、稀土电机、磁铁。 中国拥有全球领先的供应链,就像手机时代绕不开台积电,机器人时代也绕不开中国的零部件生态,这是客观事实,是全球机器人产业发展的必然趋势。 四大核心优势,每一个都有坚实数据支撑。第一,稀土资源与加工能力。中国的稀土开采量占全球近百分之七十, 更关键的是掌握百分之八十五到百分之九十的精炼分离才能,以及百分之九十以上的稀土磁铁成品制造能力。而稀土磁铁是机器人电机的核心,英伟达的一些机器人项目也在使用中国生产的稀土磁铁。 第二,微电子制造能力。中国在芯片制造和封装测试方面进步迅速,机器人需要的大量传感器和控制芯片正是中国的优势领域。中国生产的传感器和控制芯片价格实惠,性能稳定。 第三,电机与控制系统。中国是全球最大的电机生产国,产量占全球百分之五十以上,工业机器人电机占全球百分之四十,服务机器人电机占百分之三十五,越来越多的全球机器人企业开始在中国采购相关产品。 第四,完整的供应链生态。从稀土开采加工到微电子制造,再到电机和控制系统,中国形成了从原材料到成品的完整产业链, 这种生态是其他国家无法比拟的,能够降低成本、提高效率,确保供应链稳定。相比之下,日本虽然在整机制造有优势,但核心零部件依赖进口。 德国虽然电机控制系统较强,但稀土资源匮乏,只有中国能提供一站式零部件供应服务。 黄仁勋预测,未来三到五年,机器人将大规模进入现实生活,走进千家万户家庭,服务机器人、医疗机器人、教育机器人将得到广泛应用,而中国的供应链将影响全球机器人产业的发展速度和方向。这不是在夸赞竞争对手, 这是在承认一个客观的现实,在物理世界的制造领域,中国已经建立了显著的供应链优势。任何想要在这个领域发展的公司,都必须先考虑一个问题,你的供应链是否与中国有合作? 访谈最后,主持人问对屏幕前的观众有什么建议。黄仁勋沉思片刻,说了一句让所有人印象深刻的话,无论你接受什么样的教育,都要确保自己成为使用 ai 的 专业人士, 这是 ai 时代最核心的竞争力,也是你不被时代淘汰的关键。他进一步解释,未来你不需要学编程,不需要掌握复杂技术知识,你只需要学会怎么把复杂的想法说清楚,传递给 ai, 表达得足够精准,足够有想象空间, ai 就 能帮你实现。最让人意外的是, 黄仁勋认为,文学专业的人可能会在这个时代获得更好的发展,因为他们擅长表达,擅长沟通,擅长把复杂想法用简单语言说清楚。他总结了 ai 时代每个人都应具备的三大核心能力,第一,想法表达能力。 未来最重要的不是你会写多少代码,而是你能表达多少想法,清晰表达需求、目标,期望,让 ai 准确理解你的意图。第二,架构设计能力。把复杂任务拆解成多个简单子任务,分配给不同 ai 智能体完成。 像建筑设计师不需要自己砌砖,而是设计整体结构和外观。第三,评估标准制定能力制定清晰的评估标准,判断 ai 完成的任务是否符合要求,是否达到预期。像产品经理不需要自己开发产品, 而是定义功能、性能和用户体验。这三大能力与专业背景无关,无论你是学文学的、艺术的,还是工程的、科学的,都可以通过学习和实践掌握。黄仁勋的话,传递的核心意思是技术门槛被抹平了,但表达和设计的要求被大幅提高。未来的竞争不是比谁代码写得好, 而是比谁想得更清楚,说得更明白,设计得更精妙。复盘完这场访谈,我们可以看到一个清晰的行业趋势,算力正在以每年十倍的速度指数级增长,到二零三零年将是现在的一千倍以上。 token 消耗正在成为衡量职场人能力的重要指标, 不会用 ai 的 人将难以获得工作机会。 opencloud 正在打破科技巨头的行业壁垒,让每个人都有机会拥有个人 ai 计算机,中国在机器人核心零部件领域建立了显著的供应链优势。黄仁勋在二零二六年三月二十日传递的这些信息不是警告,而是行业筛选。 筛选掉那些还在纠结 gpt 会员费用、目光短浅的管理者。筛选掉那些坚持用纸和笔做报表、思想守旧的从业者。 筛选掉那些过度放大 ai 风险、主张暂停发展、制造焦虑的人。同时,这也是在筛选那些能够指挥 ai 体系、能够清晰表达复杂想法、能够设计任务架构的新时代从业者。二零二六年, ai 行业的发展门槛已经形成,算力是发展的核心, toc 消耗能体现职场生存能力、表达能力是核心竞争力。在这个被算法深度影响的世界里,保持自身的创造力、精准的表达力、系统的设计力,可能才是我们最核心的竞争优势。 我是启示录,如果你想在这场即将到来的 ai 行业改革中看清局势,找到自己的发展方向,请一定记得关注我。在通往未来的路上,我们需要结伴而行,我们下期见。

大家好,我是你们的科普达人,今天咱们来聊聊个人开发者怎么低成本入门 tocan 生产。很多朋友可能觉得 ai 模型部署门槛高,成本贵,其实只要配置得当,咱们普通人也能玩转。先说说硬件怎么选, 如果预算在一万五以内,想先试试水,那 rtx 四零九零 d 或者四零九零显卡是首选。二十四 gb 或十三 b 的 模型,搭配 i 五或 r 五的 cpu、 三十二 gb 内存, e t b 的 nvme 固态硬盘,再加上一千瓦的电源和一套散热好的机箱,总价大概一万一到一万六就能稳定运行。模型 托肯吞吐量能到每秒两百到五百个,日常测试和小流量使用完全够了。要是预算能到两到四万,想搞小批量生产,那就可以考虑上双卡四零九零 b, 或者直接上 a 一 零零,内存加到六十四 gb, 这样吞吐量能到每秒八百到两千个,接下小 b 客户的需求也没问题。硬件搞定了,软件和模型怎么选呢?模型方面,七 b 规模的 q 文二七 b instruct 或者 lama 三七 b 就 很适合入门,显存占用小,延迟低, 聊天、写文案、生成代码都在行。十三 b 的 模型像 q d r 杠一三 b instruct, 复杂推理和行业知识库的应用效果更好。这里有个小技巧,优先用 i n t 四量画板,显存占用能降百分之七十五, 速度还能提升两到三倍,效果几乎没损失,性价比超高。推理框架推荐 v l l m 开源免费,吞吐量比原声 pie torch 高十倍以上,个人开发者首选。部署工具方面, fast api 或 flask 用来封装 api 接口, prometheus 和 grafana 监控性能, e l k stack 记录日记这些都是免费又好用的工具。大家最关心的成本问题来了,按三年折旧算,入门级硬件每月折旧大概四百一十七元。电费方面,单卡四零九零币,满载运行 每月电费差不多一百九十四元,总成本约六百一十一元。按每天产出两千五百九十二万 token 算,单位 token 成本约零点零零零零二三六元,也就是二点三六分。每千 token 对 比 openai 的 gpt 三点五 turbo, 成本只有它的四分之一,价格优势很明显,想快速上手, 一天内就能跑通,先装 uber 二二点零四 lts 系统,然后安装 cuda 十二点一 cuda n, 再装 python 三点一零和 vl l m。 接着用命令启动模型服务, 最后用 qiro 测试一下生成 token, 看看返回结果里的 usage 词段,统计 token 数就搞定了。最后给大家几个进阶优化建议,用 v l l m 的 批量请求功能提升吞吐量,尝试模型蒸馏,降低显存占用和延,使用 radis 做请求队列应对高流量 在整个数据库记录用户 token 消耗,实现自动计费。这样一套下来,你的 token 生产系统就既高效又经济了。怎么样,是不是觉得个人搞 token 生产没那么难?你最想先用这个系统来生成什么内容呢?评论区告诉我吧!

生成一百个汉字,就要消耗一百五十个 token, 你 以为这只是计数参数?黄仁勋和奥尔特曼最近放出了一个极其炸裂的信号,以后发工资可能直接发 token, 甚至它会计入全民基本收入。这到底是科技攻里,还是收割普通人的新镰刀字节?阿里、 kimi 这些巨头集体转向卖 token 模式?好家伙, token 是 什么?它就是 ai 处理信息的最小单位。你可以理解为 ai 界的计件工资。为什么大佬们这么疯狂?逻辑很简单, ai agent, 也就是人工智能体正在爆发。 以前是咱们搜资料,现在是 ai 帮咱们跨应用自主干活。英伟达更是直接把未来的数据中心叫做 token 工厂。黄仁勋甚至想给工程师发年薪加 token 预算。 本质上,巨头们是在争夺 ai 时代的认知、水电煤定价权。谁掌握了 token 的 计量标准,谁就是未来数字世界的美联储。 这事离咱们普通人远嘛?算力、硬件、散热材料、存储芯片的逻辑全变了。以前看芯片出货量,以后得看 token 的 吞吐效率。对普通打工人,如果未来算力成了全民低保,你不会用 ai, 可能连基本的生存资源都领不到。未来最值钱的可能不是劳动力,而是你名下的算力配额。 如果有一天,你的银行卡里不再是余额,而是能让 ai 替你干活的 token, 你 觉得这是一种进步,还是另一种形式的数字奴役?评论区,聊聊你的看法。

大家好啊,今天咱们来聊聊一个听起来有点神秘,但其实和我们上网息息相关的东西。 token。 你 可能在登录 app、 使用某些服务时,不知不觉就和它打过交道了。那 token 到底是个啥呢?简单说, token 就 像是你在数字世界里的一张临时身份证。 比如说你登录某个购物 app, 输入账号密码后,服务器会给你发一个 token, 有 了这个 token, 你 接下来浏览商品,加入购物车 app, 就 不用每次都让你输密码了,它会通过这个 token 来确认你是谁。就像你去游乐园买了门票后,会得到一个手环, 凭着手环就能玩各种项目,不用每次都重新买票。这个手环就有点像抽肯的作用,它的作用可不小,首先它能帮我们省去反复输入密码的麻烦,让登录更顺畅。其次,它比直接在网络上传输密码要安全的多, 因为抽肯通常有时间限制,而且就算被别人拿到,有效期也短,风险相对小一些。那抽肯都用在哪些地方呢? 除了咱们常用的 ip 登录,像微信支付、支付宝支付的时候,背后也有 tocom 在 默默工作,确认你的身份和支付权限。还有一些 api 接口调用,比如你用某个天气艾特它,调用气象局的接口获取数据,也可能需要用 tocom 来验证权限。 不过使用 tocom 也有几个常见问题要注意。第一个就是 tocom 的 有效期一般不会太长,过了期就会失效,这时候就得重新获取, 所以有时候你会发现,过一段时间艾特会让你重新登录,就是这个原因。第二个是 token 要妥善保管,虽然它比密码安全,但如果被别人获取,在有效期内还是可能造成安全风险,所以不要随便把 token 泄露给别人。 还有就是不同的服务可能用的 token 格式和规则不一样,这个咱们作为用户了解一下就行。总的来说, token 就 像是我们在数字世界里的快速通行证,既方便又相对安全。现在你明白 token 是 怎么回事了吗? 下次登录 app 的 时候不妨想想是不是有个小小的 token 正在帮你证明身份呢?你还在哪些场景中遇到过需要 token 的 情况呀?可以在评论区分享一下哦!

偷偷出海,正在把中国的电变成世界的商品,中国把过剩电力变成了全球疯抢的一种商品,一度电出口赚五毛,未给 ai 后竟卖出四百元。行,如果啊,你是冲着电力套利和东数西算这样热到的词语点进来的,你可能就要输忘了,因为今天啊,我要泼三盆冷水。 嗨嗨,我是艾瑞斯,一个天天跟 ai 模型账单打交道的创业者。最近呢,偷偷出海这个词啊,火到了发烫,但是呢,我却越看越心惊啊, 因为呀,几乎所有的分析呢,都错到了根上。今天这条视频啊,我只说三句大实话,帮你把幻觉突破。第一句实话呀, ai 的 竞争从来都不是挖矿,别用电费便宜来幻想统治世界了,很多人啊,算账,中国电费便宜。所以呢, ai 的 老细胞,也就是扑克,成本就低,出口呀,必胜, 大错特错,英伟达的脑皇的五层蛋糕理论说的已经很清楚了, ai 的 产业呢,有五层,从下到上啊,是能源、芯片、基础设施, ai 模型和应用。电费呢,只是最底层,最基础的一层,在整个总成本里啊,它只占百分之十五到百分之二十五。真正烧钱的是什么呀?就是几十上百亿甚至上千亿的研发投入 砸出来的模型是贵上天的, g p u 显卡也是整个系统的工程优化,你电费再便宜,能够便宜过这些吗?所以呢,纯电费套地啊,本质上就是用挖矿的思维去规划发射卫星的生意赛道啊。从一开始就看错了。第二句实话呀,中美模型的价差呢,不是成本差,而是物种差。 openai 的 gpt 敢卖天价,咱们国产模型却只能做到它的几十分之一,这是为什么呢?技术上啊,美国的主流模型是全院专家会诊,问题呢,再简单也需要全体的专家到场,成本啊,极高。咱们的主流呢,是智能分诊,也就是用谁叫谁,效率至上。 从商业上啊,美国卖的是华尔街硅谷认可的技术霸权和确定性。是啊,奢侈品。咱们呢,卖的是给普罗大众的 补贴工具和生态门票,是基础设施。市场上呢,咱们美国消费者为顶级的生产率付费是习惯。咱们呢,还在用地板价去教育市场,我自己公司啊,就分的很清,写核心代码,搞系统设计。咱们呢,会用美国的高价模型 买的呀,是可信和效率,但是处理文档,生成文案这些国产模型啊,绝对是 y y d s。 是 因为啊,足够好且便宜太多。这个价差的背后呢,是技术路线、商业策略、市场阶段的三重差异。你买的呢,根本就不是同一种福分。 第三句实话啊,出本出海呢,不是开个 a p i 就 收美金,而是啊,闯进了全球最复杂的雷区。你以为啊,把夫妻搭好,翻译个文档就能够收全球的钱了吗?这个太天真了。第一道鬼门关是数据合规,欧盟的 g d p r, 美国的各种法律,你的数据能不能出镜呢? 很多的海外公司根本啊,就不可能数据要传回中国的 ai 服务。第二道卡是地缘政治,在去风险的背景下,你今天的生意做的很好,可是明天啊,一纸禁令就可能让你归零了。第三呀,是税务法律,实体 钱怎么收费怎么交,在哪个国家啊?被告了怎么办?这些问题呢,就能够让一个技术团队呢直接崩溃了。所以呀, 通过出海有机会吗?有的,但是呢,绝对不是一个懒人捡钱的机会。真正的初度呢,我认为只有三条,第一啊,是去友好市场,比如像东南亚等地,中国的模型呢,好用不贵,靠极致的性价比呀,取上核心啊,是做好区域深耕,而不是啊全球撒网。 第二呢,是全球开发者的杠杆在 openner 上啊,中国模型的这个钓流量呢,已经超过了美国了,咱们呢,已经是无数开发者的性价比首选啊。第三呢,是模式生伪和草船借箭, 从卖 a p i 变成卖本地合规的解决方案。但是啊,这需要巨大的资源和实力,或者呢,和海外合规平台,比如说 fireworks, ai 等等合作,作为模型供应商融入他们的生态,这也是许多中国开源模型团队的实际选择。说到底呀, ai 的 全球竞争是技术、工程、生态、规则的全方位博弈,突破价格呢,只是一个缩影, 未来的赢家啊,绝对不是吆喝着我的电费最低的人,而是能够让每一度电,每一秒算你都产生更高智能价值的团队。热闹呢,是别人的成本呀,是自己的。在 ai 这场无限游戏里面,看错地图啊,比跑得慢可怕了一万倍。 我是艾瑞斯,在 ai 创业一线专治各种简单归因和认知幻觉。如果呀,这条视频让你呢更清醒了一点,记得呀,点赞分享,咱们下期再见了,拜拜。

各位朋友,今天聊二零二六年科技圈的核心关键词 token。 这个原本的工程师术语, 今年春天突然站上产业风口,英伟达、阿里、中国电信、腾讯纷纷布局中国日军 token 调用量突破一百四十万亿,两年暴涨上千倍。这背后是科技产业围绕 ai 电网的新基建革命, token 就是 这场革命的核心。过去, token 只是大模型处理文本的最小计算单位,藏在算法后台无人知晓。但开源 ai 智能体 open call 的 爆火改变了一切,它能自主拆解任务、 多轮调用模型,单次 token 消耗是传统对话的数十上百倍,直接引爆全球 token 的 指数级需求。如今的 token 拥有了可计量、可定价、可交易三大新属性, 从技术细节变成了能纳入商业体系的 ai 产出单位。这就像电力标准化为千瓦时,流量标准化为 g b token, 让 ai 第一次有了通用计量体系。 它之于 ai, 就 如电量之于工业,是产业规模化的基础。 token 此时爆发,是三大趋势叠加的必然。其一, ai 从训练时代进入推理时代,过去拼模型规模, 现在拼调用使用,每一次 ai 交互都是 token 消耗调用成主流, token 自然成核心。其二, ai 终于有了统一定价语言,告别按四按功能的混乱模式, token 实现了跨场景标准化售卖。其三, ai agent 成为涌动调用者。 open call 的 普及更是放大了需求缺口, 到逼全产业链加速适配, token 正在重塑三类核心企业竞争逻辑彻底改写, ai 公司从拼模型转向拼低成本造 token、 高价值用 token, 阿里成立 token 事业群, 正是转向 token 的 流通与经营,各大企业也在优化适配 open call 的 调用效率。云计算公司从卖算力 转向卖 token, 用户只关心智能,结果云厂商纷纷推出适配智能体的 token 套餐,降低大规模调用成本。通信运营商的改革最具颠覆性,中国电信提出 token 经营,跳出流量逻辑,凭借边缘算力、高速网络成为 token 高效流动的关键支撑, 真正切入 ai 价值链。 token 体系如同 ai 时代的国家,电网分为三层且动态博弈。上游是英伟达等算力生产者,是发电厂, 决定 token 的 成本和供给上限。中游是 openai、 阿里等模型平台,是调度中心,即黄仁勋所说的 token 工厂,决定 token 的 价格和使用方式。下游是腾讯、苹果等平台及 open call 这类智能体 是用电入口掌控用户, ai 调用权决定 token 分 发路径,而 opencoin 也让入口竞争更多元。这场博弈的核心是从互联网流量入口向 ai token 入口的迁移。互联网拼用户时间, ai 时代拼调用权,腾讯开放微信接口打造 token 分 发平台, 中国电信依靠网络布局渗透各行业, opencoin 则以智能体形态成为全新入口,未来模型会逐渐隐形化, 掌握入口者将占据优势。比入口更核心的是定价权,就像电力系统的调度定价,谁定 token 价格,谁就是真正的基础设施掌控者。目前定价权分散在算力、模型、入口三类玩家手中,而 open call 成为关键变量, 国产模型凭借成本优势占据其百分之八十的调用份额,让定价权博弈从头部垄断转向生态协同。黄仁勋预测,未来工程师会有年度 token 预算,金额达基础薪资一半,这意味着 token 成本将从企业实验性支出变成电费、网费般的刚性运营成本。 token 的 竞争本质是定价权的长期博弈。说到底, token 不是 简单的科技风口, 而是 ai 产业新秩序的开端。它让 ai 有 了统一计量, open core 激活了需求,让 ai 规模化应用有了支撑。有计量就有定价,有定价就有交易, 有交易才会形成真正的 ai 产业。谁会成为 ai 时代的国家电网?答案或许不为一,但可以确定这场新基建战争的国家电网?答案或许不为一,但可以确定这场新基建战争的国家电网才刚刚开始。

token 这个词中文名该叫啥?网上已经炒炸锅了,有人说叫词源,有人说叫令牌,还有人说啊,干脆别翻,就叫 token。 token 到底是啥?为啥一直没有中文翻译呢? 其实呢, token 就是 ai 理解和处理文本的最小单位,它可能是一个字一个词,也可能是标点符号,只要让 ai 帮你干活,它就会消耗 token。 但如果说 token 没有中文翻译,那其实是一个非常大的误区啊, 人家几十年前就有名字了,在加密货币的领域啊,人家叫代币,在计算机的领域里,人家叫令牌。只不过啊,这些名字作为专业术语使用的人很少,而且呢,也并不符合现在 ai 行业的需要。所以啊,得有一个新名字。这时候就有人问了,那为啥争着要给偷看起中文名呢?在清华大学教授的嘴里,他都快成了关乎产业升级、技术落地的大事了。 原因呢,也很简单啊,在 ai 时代, tocan 太重要了。那我们现在在使用大模型的时候,也经常会把 ai 对 tocan 的 消耗量啊作为收费的依据。而前两天的时候呢,黄仁勋更是把 tocan 的 地位提高到了一个前所未有的高度。 在英伟达 gtc 上,老黄就说啊,过去几年里,人类的计算需求增长了一百万倍,换句话来说,就是 tocan 的 消耗量增长了一百万倍。而在未来呢,所有企业都有推理需求,都将为 tocan 付费。市场庞大, 谁能生产出更多的头肯,谁就更有价值。但头卡也不会凭空产生,需要由一个个的芯片、超节点、服务器、 ai 数据中心计算出来。所以啊,它还会推动历史上最大规模的计算基础设施建设。另外一位科技巨头呢,也拿出了行动。 在 t t c 的 同一天,阿里就宣布成立了 at h 事业群。千万告诉我,这个以 token 命名的事业群,在地位上跟阿里的云服务和电商都是并驾齐驱的。这就说明啊,阿里已经把 token 当成了企业的顶级战略资源,是由 ceo 直管的核心业务。 值得注意的是呢, token 不 光对企业有影响,更左右着东西方两个大国 ai 行业的走向。要知道啊, token 不 同于电力或者手机流量这些只有数量差异的资源,它还有等级之分呢。能力强的 token 呢,可以完成商业决策。能力差的 token, 那 就只能做做小学数学题了。所以呢, token 越强,价格越贵, 受制于物理因素的影响呢, tok 的 生产,它不光需要 ai 的 芯片,更需要耗电。在漂亮国和我们发电能力的差异下呢,漂亮国的 tok 定价普遍都是我们的四倍或者更高。 所以呢, openclaw 爆火之后,全球消耗 token 的 排行榜里啊,前五里有四个都是咱们中国的大魔镜。那 token 这么重要,那跟我们普通人有什么关系呢?那关系可大了啊,二零二三年,只有程序员玩得起 a p i, 才用得上 token。 但在二零二六年,六十岁的老人和十岁的孩子都在和 ai 聊天儿,默默消耗着 token。 像我自己,完全没有编程基础的小白,今年开始配置自己的大龙虾,开通了一堆的 a t i, token 的 消耗量那是直线上升,可以说呢, token 未来就像交电费、话费一样的成为我们生活当中的必需品,所以说啊,这么重要的一个产品,你觉得中文名该叫啥呢?

未来最值钱的不是钱,不是算力,而是这个词,托肯。最近科技圈有个词特别火,就是托肯,很多人听不懂。今天我用最简单的话给你讲明白,托肯到底是什么?为什么连英伟达、阿里都在疯狂抢 先看两个大新闻?英伟达老板黄仁勋在今年 g t c 大 会上,托肯这个词讲了七十多次。同一天,阿里直接成立了托肯事业部,和阿里云、淘宝一个级别,这说明什么?托肯不是小概念,是未来的大方向。那托肯到底是啥? 很简单, token 就是 ai 世界的最小单位,相当于 ai 的 字。你跟 ai 说一句话, ai 会把它切成一个个 token 再处理。再回答,你用 ai 其实就是在消耗 token, 为什么它这么重要?我总结三点,一听就懂。第一, token 就是 钱,你用 chat、 gpt, 用各种 ai 都是按 token 收费的。黄仁勋直接把 token 分 成了不同的价格,便宜的几块钱一百万,贵的一百多块,就像点外卖,速度不同,质量不同,价格差几十倍。 ai 服务 本质就是卖 token。 第二, token 就是 效率,以前是看数据中心,看算理,看储存,以后看什么,看每秒能生产多少 token。 数据中心不再是仓库,而是托肯工厂,谁能用最少的店,更少的算力产出更多托肯,谁就赢。第三,托肯未来就是工资,就是福利。黄仁勋直接说,以后公司招员工,除了工资还会给你托肯额度, 你写代码、做方案、做设计都要靠 ai, 没有托肯你就没法干活。谁能用更少的托肯干更多的事,谁的竞争力就更强。 更关键的是, tokun 撑起了一条产业链,从电芯片服务器大模型到我们用的 ai 软件,全都是围绕 tokun 的 生产和消费。 这就是黄仁勋说的 tokun 经济学。甚至他还说, ai 会创造大量工作,电工布线运维基建,很多岗位 根本不需要你懂 ai, 因为建 tokin 工厂需要大量实实在在的人。最后总结三句话,一 ai 不是 技术,是一整条经济网络。二, 未来所有人都在围绕 tokin 工作。三,你的 tokin 效率就是你未来核心竞争力。听懂 tokin, 你 就看懂了未来 ai 的 整个商业逻辑。

今天咱们来聊一个你可能天天听到,但一直没搞明白的词。 token 这个词听着是不是像金融圈的代币或者程序员敲的什么神秘代码?但今天我用几分钟,让你不仅懂它,还能让你在朋友面前装个大的。 咱们来打个比方,假设 ai 是 一个正在玩乐高的三岁小孩,你给他一本红楼梦,说给我讲个贾宝玉的故事。 ai 不 会魔法,他得先把这本厚厚的书拆成一块一块的小积木,这就是 token。 假是一个积木,宝是一个积木,玉是一个积木,句号也是一个积木。然后他把这些积木编号、理解、存储,最后拼出一个新故事给你。 所以 token 就是 ai 看世界的最小积木块。你写,我喜欢吃火锅, ai 眼里是,我喜欢吃火锅,四个 token 你 写 chad gpt, 真牛。 ai 眼里是 chad gpt, 真牛。一共四个 token, 因为英文单词可能会被拆。 ai 其实是个文盲,他只认识数字。 token 的 作用就是当翻译官把每个积木块词或者字变成一个数字编号。比如我是幺二五, 喜欢是三零六,吃是七八,火锅是四四二零,然后 ai 就 看着这些数字开始疯狂计算。幺二五后面常常出现三零六,三零六,后面可能是七八或者八八八,他根本不知道火锅是什么味道,他知道火锅辣, 冬天好吃。这些偷看经常一起出现。所以 ai 其实是个超级统计学家,不是真正理解, 但是他演的太像了。如果你用过任何 ai 的 付费 a p i, 你 会发现 token 就是 流量,流量就是钱,你说的话占多少? token 收费, ai 回话占多少? token 收费每一千个 token 大 概几里钱?但积少成多,聊嗨了可能一顿饭钱就没了。 所以下次和 ai 聊天,别废话连篇,省 token 就是 省钱。顺便给个参考啊,一个汉字约等于一至两个 token, 一 千个 token 约等于七百五十个英文单词,一部翻体三部曲约等于九十万个 token。 你 看 ai 读完整套翻体也就几块钱,是不是比买纸质书还便宜?我觉得 token 这个东西还是特别有意思的,它就像 ai 的 呼吸频率, 以前的 ai 一 次只能呼吸两千个 toc, 大 概一千五百个字,聊着聊着就忘了开头,像鲸鱼一样。 现在的 ai 能呼吸二十万个 toc, 可以 陪你读完一本小说,再和你讨论细节,这是质的飞跃。但更有趣的是,人类说话也有 toc 密度,有人一句话说半天没重点。 toc 多但信息少,有人三言两语就能直击要害。 toc 少但质量高, ai 在 拼命堆 token 求智能,我们人类却可以用有限的 token 创造无限的可能,这不就是我们探击生物的优越感吗?