问题是我们现在在中国用到的大部分的主流的 ai 产品依然是免费的,比如说 kimi 是 免费的,豆包是免费的,夸克是免费的。我甚至很难举出来一个在中国一定要收费的 ai 产品。如果你要去完成更高要求的任务时候,你会切换到其他的模型,对吧?然后付费, 因为其他模型它参数更大,它的那个投款成本更高,因为付费模型它 确实效果好,它效果好有一个原因就是因为它能够承担更高的算力成本,所以刚才举的那那几个你也不常用,你真的在使用的是付费模型,这就说明了如果真的能解决你的问题,你是愿意付费的, 然后你是在中国付费的,对吧?这这个就说明用户需求是有的,如果他真的能完成我的工作,他真的能帮我解决问题,我是愿意付费的。所以他不是 中国更不愿意付费,或者中国订阅制更行不通的问题,而是能力的问题。你能力不行,大家不愿意付费。如果你能力真的很行,大家想方设法也要去充个可乐会员,开个叉 g p 的 两百美元的会员来付费,这是一个你不行是因为你菜,不要怪任何的什么 大伙不愿意付费,不要怪任何的商业模式,你不行就是因为你能力不行,就是因为你菜。这样说有点绝对,但是实际上大家在付费,只是没有付给你,那是因为你菜,哈哈哈哈。
粉丝105获赞707

ai 大 模型呢,为什么要按照托肯收费?同样是一百万的托肯呢?为什么价格能差三十倍?等等,你可能会说啊,我们平时用的豆包啊,元宝啊,也没交过钱啊。没错,咱们平时用的网页版或者 app 呢,确实是免费的,那是大厂为了抢占市场给的福利。 但如果你是专业用,或者是使用最近爆火的小龙虾,那就必须通过 api 接口来调用大模型,按量付费,烧起钱来也是非常吓人的。那这些钱到底烧在哪了? 当模型正式发布后呢?它的使用成本其实由两个部分组成。第一部分呢,是固定成本,也就是模型上线前已经砸下去的钱, 包括前期的研发与训练投入,还有算力基础设施的建设,像建机房,采购显卡,配齐内存和硬盘。最近大家可能也注意到了,显卡和内存价格是一路上涨,很大程度就是因为 ai 需求暴增呢,把硬件价格也推高了。但这些成本呢,有个特点,它是沉没的, 在模型发布前呢,就已经支出了,随着用户越来越多,这部分费用呢,会被不断贪薄,贪到每一次调用上呢,它的占比会越来越低,甚至低到可以忽略不计。 那第二部分呢,是动态成本,也就是每一次调用模型实打实消耗掉的东西,每次计算都要消耗电力,还需要占用内存, 数据在传输过程中呢,也需要消耗网络流量。而所有这些消耗呢,都和 token 的 数量呢,直接相关。这里呢,快速同步一个概念。到底什么是 token? token 的 中文呢,可以翻译为词源,可以是一个字,一个词,一个分词,甚至一个字节。在大模型中呢,被表达为一组数字序列,用于计算下一个 token。 token 越多呢,模型的计算的时间就越长,占用的算力和资源呢,自然就越多。所以,按照 token 数量收费,本质上是一个多用多付少用呢少付的计费方式, 非常直观呢,也非常合理。这像什么呢?就像我们每个月交的水电气一样。从这个角度看呢, ai 正悄悄完成一个转变,它正从一项技术、产品呢,演变成一种基础服务。我们想要获得智力呢,就需要购买算力。 说不定以后每个月的水电账单旁边呢,就会多出一行 token 费用。那既然都是按 token 收费呢,为什么不同大模型的价格差这么多?比如你输入一百万 token, deepsea v 三的收费呢,是零点二八美元,而 g p t 模型呢,要二点五美元。如果是输出 token 呢,差距更夸张, deepsea 呢是零点四二美元, g p t 呢是十五美元,整整差了三十多倍。 同样都是 token 呢,为什么价格能差出这么多?其实 token 的 价格呢,主要是由两个因素决定的。第一,电力和人工成本不同。在美国、中国、中东等不同地区,电价运为成本,人力成本差异非常大,而这些呢,最终都会反映到价格里。第二呢,算法不同。 好的算法呢,就像一台省油的发动机,同样是跑一百公里啊,有的车呢,只需要三升油,而有的车呢,却要烧掉十升。大模型也是一样,算法呢,设计的越巧妙呢,达到同样质量的输出,消耗,算力呢就越少。所以优化算法是模型研发人员最最重要的任务之一。 算法越高效,成本就越低,价格自然就更有优势。在这方面呢,有很多创新的工作,比如 deepstack 引入的 mo 机制,想了解的朋友可以翻看我之前的这期视频。 那为什么输出托管的价格比输入托管贵这么多?原因呢?很简单,输入和输出呢,干的活不一样。输入的托管呢,是你的提示词, 模型可以一次性全部读取参与计算,多一个少一个呢,对显卡的负担影响呢,是有限的。但输出 token 就 不一样了,它是一个接一个逐自生成的,每生成一个 token 呢,模型都要重新算一次。输的 token 是 配角,输出的 token 呢是主角,所以给出的片酬呢,就不一样。 具体的技术原理呢,也可以看我这期视频,理解注意力机制对托根计算量的影响。这里呢,再顺便澄清一个常见的误解,托根的发明初衷呢,不是为了计费。 托根是纯粹的算法创新和工程发明,是为了把人类的语言翻译成机械能听懂的数学坐标。 只是后来大家发现呢,托管的数量呢,恰好决定了计算量,这才顺理成章的用它来计费,绝不是因为要收钱才搞出来这么个复杂的概念。当这里可以像自来水一样按量计费,一个属于算力文明的时代就真正开始了。

你以为你在跟 ai 聊天,其实你每发一句话,他都在疯狂烧显卡电费和服务费。 ai 他 不按字收费,而是按 token。 token 呢,就是他处理文字的最小单位,中文大概一个字就是一个 token, 英文呢,三到四个字母就是一个 token。 你每发一句话,他背后会拆成几十上百个 token 来计算。那为什么处理 token 会这么贵呢?因为每处理一个 token, 他 都要动一次算力,而算力就等于显卡加电费加服务器,越复杂的内容,就需要动越多的显卡。 你输入十个字和一百个字, ai 的 计算量可能差十倍。但真正让高级 ai 贵的原因,其实不是因为头肯多,而是因为他想的更深。 普通模型处理一个头肯可能只需要思考两到三层,但顶尖模型可能会思考二十层,甚至更多。 也就是说,推理的越深,显卡压力越大,计算成本不是呈性上涨,而是成倍飙升。 所以你付费买的不是智慧,而是背后那一大堆为你烧掉的算力。而故事的起点,就是一个小小的 token。 这里是 ai 小 白学 ai 关注我,我们一起见证 ai 的 成长,我们明天见,拜拜!

opencloud 太火了,大家都想养一只电子虾帮自己干活,但很多人刚进坑就被成本劝退了。今天老兵带你算算,养一只虾到底要花多少钱? 第一笔是房租,最好的方案是家里的闲置旧电脑, windows, mac, linux 都行,把它当服务器用,成本只有电费。还有一种是租各种云服务器,一个月几块到十几就行, 这就是穷养。第二笔是伙食费,千万别用按量付费的 api, open klo 思考,一次就能跑几万头,捆几天就能把你吃穷。 必须买包月套餐,成本固定,随便吃。记住,模型决定了虾的智商,套餐决定了你的钱包,有了房和粮,还得有耐心。现在的 open klo 还是个玩具,不是员工,你需要陪他聊,叫他 do skill, 慢慢调教, 别指望他马上能替你上班,他现在能不给你捣乱就不错了。养虾是乐趣,不是生意,你的虾养活了吗?

今年真的就是不用 ai 你 就 out 了,阿里这边呢,又出了一个新的 ai, 叫做悟空啊,他有去接入生意参谋,这边有说,对吧?一人网店还有一些其他的功能,比如说一人门店呐,然后一人客服,一人设计等等, 也就是说你可以一个人通过 ai 把这些功能都给它实现,让 ai 去帮你去做这些事情。 当然要注意一个点,你自己招人需要花钱,那你用 ai 同样也需要 token 啊。 token 这个东西简单理解就是你跟他对话,然后他生成东西给你,那这个东西你需要去付费,对不对?但是呢,如果这个东西的效率以及效果能够比部分人工好,我觉得其实也是没有问题的, 所以说这个一定是未来的趋势。那至于说你比如说像悟空这种,如果接入了参谋,甚至接入了无界,后期能不能自动帮你去开车,或者说开全站等等, 我觉得以阿里现在的这个 ai 的 能力,他是数一数二踢队的绝对是没有问题的。只不过说他愿不愿意这样去做,或者说阿里妈妈这边愿不愿意让他这样去介入,这个就是后话了。当然未来趋势一定是这样。 至于说为什么现在还有很多人一直纠结所谓的标准计划、手动计划,我觉得这个东西在未来,在现在这个趋势情况之下,这一部分是一定会被淘汰的,且未来可能就没有这些手动东西了, 因为 ai 能够去替代的东西,为什么还要去人工一个一个去点的操作呢?对不对?所以说未来的趋势现在已经有 迹象表明他就会这样去变,所以说 ai 这些东西大家都可以去接触一下。当然我觉得现阶段来说对于整个电商来说可能还不是很好去用,但是呢趋势是这样,先了解准没错。

以后我们用 ai, 可能要像交水电费一样,按用量付费了,免费的就慢一点,付费的就快一点。这不是我说的,而是黄仁勋在二零二六年 gtc 大 会上宣布的 token 就是 未来 ai 时代的水电煤。那这个所谓的 token 到底是什么呢?简单说就是你和 ai 交互的计量单位,你问 ai 一个问题,它生成了一段回答,都是需要消耗 token 的。 黄仁勋在现场说,未来硅谷的招聘手段之一,可能是这份工作能附带多少的 tucker 额度。这不是在开玩笑,他是认真算过账的, 员工的基础年薪可能是几十万美元,企业会在此基础上再额外给一半薪酬,以 tucker 的 形式发放。那为什么要这样做呢?因为 tucker 能让员工的生产力放大十倍, 比如原来一天写十封邮件,现在能写一百封。那 takken 怎么定价呢?黄仁勋给未来的 takken 做了几类分级,免费套餐,高吞吐量、低速度,用来吸引更多的普通用户。 终端套餐模型更大、速度更快,输入上下文更长。高端套餐支持极高的 takken 生成速度,用于重要的不能出错的任务。 最高级别的尊享套餐,每百万 tucker 一 百五十美元,用于专业的科研场景。他觉得模型越大,智能程度就越高,输入 tucker 上下文就越长,结果也就越精准。 当然,速度越快,思考就会越充分, ai 也就越聪明,每上一个台阶,价格就能相应的提成。那英伟达在这次大会上都做了什么事呢?主要有这三件事,其实都是为了 tucker 经济铺路。第一,推出了 verubin 芯片, 这是专为智能体 ai 设计的,算力特别强,整机算力达到三点六二次浮点,预算每兆瓦的算力吞吐量提升了三十五倍。什么意思呢?就是同样的电能多干三十五倍的活,而且这套新系统实现了百分之百夜冷,并且能做到所有传统电缆全部消失。 黄仁勋说,采用 blackwell 平台能比哈珀实现五倍的营收增长,而最新的 vero rubin 能比 blackwell 再带来五倍的营收提升。第二,推出了企业级 openclaw, 参考方案叫 nameclaw, 这是基于 openclaw 的 企业版,你可以直接下载使用,二次开发,还能对接全球所有的萨斯公司。它内置了一整套智能体 ai 工具级。黄仁勋说, openclaw 其实开源了智能体计算机的操作系统, 就像当年 windows 让我们得以创造个人电脑一样,如今 open cloud 的 出现,让我们能够创造个人智能体了。而第三件事就是拉了一大堆的合作伙伴,比亚迪、吉利、现代、日产都加入了英伟达的自动驾驶出租车计划, 加上此前已经加入的奔驰、丰田、通用等厂商,未来支持 robot taxi 的 汽车数量将较为可观,这些厂商每年能合计生产一千八百万辆汽车,当然未来打车也会更加的便宜,更加的安全。 那这些变化跟我们的生活又有什么关系呢?我先说一个最直接的影响,以后我们用 ai 可能真的要像交水电费一样,用多少交多少了, 但这还不是最重要的,最重要的是,从今年开始, ai 不 再是堆参数、拼算力、讲故事了,而是走向企业,走向实处了。说到这,那我们该怎么办呢? 在新的一周,我会花一个小时把我们常用的 ai 工具都过一遍,看看他们是怎么收费的,哪些功能免费,哪些要花钱,然后算算我们的业务需要多少 tokyo 额度,不用一下子全部搞懂,先弄明白一件事就行。

写代码还在按透坑付费吗?那你真的亏大了,现在的 ar 辅助编程,随手一个重构就是几十万,透坑啊!按量付费就像坐着跳表的出租车,心都在滴血。兄弟们, 二零二六年,各大厂商终于卷出了包月套餐,但我把市面上九家主流的扣丁普兰拔了一遍,发现全是信息差。想省心直接看这几家,如果想要性价比,闭眼从字节方舟或者百度千帆, 四十块钱能通吃多家的旗舰模型,生态兼容做的最好。如果要搞万行代码的大工程, kimi 依然是目前的常文本优选,几万行代码丢进去,他真能接得住。如果追求逻辑骚扰,阿里云的千万山在算法重构上确实稳,也就是大家说的懂代码。但是呢,别急着掏钱,这里面藏着三个大坑,厂商绝对不会告诉你。第一, 警惕动态限流,很多套餐说是无限量,其实是你每天前一百次是高速,后面直接给你限速到断网, 系统一旦判定你高频生成,立马熔断。第二,谨防模型降至。为什么同样的这个 v 三点二有的平台用起来特别笨呢?因为为了省成本,他们给你偷换成了量化版的模型。这就像把学霸的脑子切了一半,复杂的逻辑题根本做不对。 第三,小心杀手涨价,千万别被首月几十块的体验家忽悠了,很多大厂第三个月续费直接翻倍。 最后呢,听我一句劝,不管你定哪家,千万别直接报年,先开一个月,在你常用的 id 里面实测一下响应速度,好用再续,否则存够代码卡死的时候哭都没地方哭。

朋友们,大家有没有想过一个问题,为什么 ai 大 模型要按透坑消费?同样的一百万透坑,不同的大模型之间价格能差三十多倍。 你可能会说,咱们平时用的豆包、元宝这些也没交过钱啊。没错,网页版和 app 确实免费,那是大厂为了抢占市场给的福利。但如果你是专业用户,或者使用 api 调用大模型, 那就得按量付费,烧起钱来就真的非常吓人了,这身钱到底烧在哪里?当模型正式发布后,使用成本其实分为两个部分。第一部分,固定成本, 包括前期的研发投入、训练成本,还有算力基础设施建设。呃,比如建机房、采购显卡、购置内存和硬盘。 最近大家可能都注意到,显卡和内存价格一路上涨,很大程度就是因为 ai 需求暴增,把硬件价格推高了。但这些成本有个特点,它是沉没的,在魔性发布前就已经支出了。随着用户越来越多,这部分费用会被不断地摊薄, 到每次调用时占比会越来越低,甚至可以低到忽略不计。第二个部分就是动态成本,每次调用模型时实打实消耗的东西,比如电力消耗、内存占用、网络流量传输, 所有这些消耗都和 token 的 数量直接相关。 token 中文可以翻译成词语,它可以是一个字儿、一个词儿、一个分词,甚至一个字节。在大模型中, token 被表达为一组数字序列,用于计算下一个 token。 token 越多,模型的计算时间就越长, 占用的算力和资源自然就越多。所以按照托管数量收费,本质上是一个多用多付、少用少付的计费方式,非常直观,也非常合理,这就像我们每个月交着水电气一样。 从这个角度看, ai 正悄悄完成一个转变,它从一项技术产品变成了一种基础服务。我们想要获得治理,就需要购买算力,说不定以后每个月的水电账单旁边就会多出来一行托管费用。 既然都是按 token 收费,为什么不同大模型的价格差这么多?比如一百万 token, bitcoin 的 收费是零点二八美元, gbt 模型要二点五美元输出 token 的 差距更夸张, bitcoin 是 零点四二美元, gbt 是 十五美元,整整差了三十多倍。 同样都是头肯,为什么价格能差出这么多?决定价格的两大因素,第一,电力和人工成本不同。在美国、中国、中东等不同地区,电价、运维成本、人力成本差异非常大,这些最终会反映到价格里。 第二就是算法不同。好的算法就像一台省油的发动机,同样跑一百公里,有的车只需要三升油, 有的车却烧掉十升。大模型也一样,算法设计的越巧妙,达到同样质量的输出,消耗算力就越少。所以优化算法是模型研发人员最重要的任务之一。算法越高效,成本就越低,价格自然就更有优势。这里顺便澄清一个常见的误解, token 的 发明初衷不是为了计费。 token 是 纯粹的算法创新的发明,是为了把人类的语言翻译成机器能听懂的数学坐标。 只是后来大家发现, token 的 数量恰好决定了计算量,这才顺理成章的用它来计费,绝不是因为收钱才搞出来这么个复杂的概念,当 ai 像自来水一样按量收费,一个属于算力文明的时代就真正开始了。关注我,我会为大家持续科普。

当你不小心拥有了一个 open class, 但你总感觉它傻傻的,不好用于事。聪明的你钻研了一番后,明白了,小龙虾只是这个智能体的一双手,大模型才是它的大脑,决定了它是否聪明,而 skills 是 它的工作技能,决定了它是否有能力处理各种任务。 而大家总提到了 token, 就是 智能体的能量。使用智能体需要让大脑运转并调动小龙虾的双手并使用技能, 所以会消耗 token。 这也是为什么我们需要向大模型厂商付费。然后聪明你开始尝试使用不同的国内大模型来给智能体安装不同的大脑。这个时候你发现了接入了 cloud code 的 时候,这个智能体他是最聪明的,任务的完成质量最高,但是费用也最高。 然后你又发现接入了国产模型的时候呢,他也能完成很多任务,花销也很划算。于是不想当冤大头的你,想着好像可以让不同的小龙虾安装不同的大模型, 简单的一些工作,比如每日发送日报,这种工作就可以直接交给接通了国内大模型的小龙虾去做,赶紧去这么做吧。然后聪明的你为了让小龙虾能更快更好的完成任务,打算教给他各种 skills, 也就是技能。于是你在 skills 后面加上了 s h, 发现这里有七万多个 skills, 你 又了解到 open club 官方 skills 也有一万多个。不要慌,我已经给非技术背景的你准备好了十个基础 skills 和五十个进阶 skills, 咱们放心使用。这个时候呢,不想当月大头的你,感觉还是有方法能降低 token 的 成本?没错,这里我给你准备了三个方法,让你的 token 花费能降低十倍。一是多使用订阅而非 api 的 用量模式。 二是建立本地的 markdown 知识库, opencloud, 每次读取的时候只读取锁瘾。三是部署一个小模型来在本地跑。 opencloud 的 心跳模式,就是那个让你们感觉小龙虾火起来的关键机制,实际上是小龙虾内置了一个每过一段唤醒自己一次完成任务的机制。 除了以上三个方法呢,你还可以给你的小龙虾建立体检机制,及时的找到那些高消耗的任务并及时优化。别慌啊,以上方法听起来有点复杂,我已经帮聪明的你把上述方法的详细的文字版也整理好了。我是拉菲儿,这是 openclaw 实战系列的第二期,后面会有更多实操,咱们下次见。

程序员在公司使用 ai 编程产生的 token 费用难道需要自己付费吗?据我了解,不论国内, token 费用一般由公司承担,大模型服务商向企业用户收费。如果需要程序员自己付费,这不真就是自费上班了吗?最后欢迎评论区说一说你了解的情况。

呃,刚刚有一条消息啊,阿里给员工发 tok, 鼓励使用 ai 工具工作。阿里巴巴集团正在推进一步一项内部计划啊,向员工提供 tok 额度,鼓励员工在工作中使用先进的 ai 模型与工具。根据该计划,阿里员工可以免费使用悟空等付费 ai 工具 啊,用于技术研发和通用办公,公司将向员工提供托管额度。此外的话,员工购买百炼抠定 play 会员或者外部 ai 开发工具可以申请报销 啊,这是一个 ai 趋势,里边又是一条。呃,又是一又一个这个重要线索啊,包括前一段时间龙虾的爆火,包括各种 ai 应用的爆火,包括现在大厂开始推进 ai 的 应用的工作, 已经落到时速,咱们会发现慢慢的可能就短短一两个月,这个变化会越来越快,会超乎我们的想象。所以的话,短期我们还是要重点关注一下数据中心,还有国产算力这个赛道。

各位股友,今天咱来聊个有意思的事,不是讲哪个票涨了,而是看一条刚出的消息,背后藏着什么门道。国家超算互联网, 这个听着就很高大上的平台,搞了个活动,给所有用户免费送三千万 tokens, 而且把特惠价格直接干到了零点一块钱一百万 tokens 还延期到四月六号。咱得把这背后的故事掰开揉碎,讲清楚到底怎么回事。先讲这个三千万 tokens 到底是个什么概念, 咱普通人可能没概念,但打个比方,如果你用 ai 帮你写论文、跑模型,这三千万 tokens 够你玩儿挺长时间了。按现在市场上商业 e p i 的 价,这得值个几十块钱。平台图啥, 就图送这点钱肯定不是人家算的,是大账。你想啊,免费送你三千万,但条件是你要去用它们新推的科研智能体叫 s cloud, 谐音科研龙虾,挺有意思的名字。这一招其实是以免费换人心,把百万级的科研人员、开发者都吸引过来,让他们习惯用这个平台。 你一旦用顺手了,后续的超低价格、海量算力就都在这儿了。这不就是典型的先养鱼再捕鱼吗?再说这个价格,零点一元一百万 tokens 什么水平? 我跟你讲,现在市面上大厂的价格大概在五毛到两块钱之间,他这个直接打到地下室去了, 能这么便宜,背后是有底气的。截至二零二六年,这个平台已经整合了全国十四个省市,超过三十家国家级超算和质算中心算力资源包括十五万张以上的加速卡、两百万核心的易购算力, 单日处理作业峰值超过一百万个,累计已经跑了近两亿次作业。这么大的资源池,闲置也是闲着,用极低成本激活是双赢。但为什么偏偏是现在搞这个活动?其实是因为整个 ai 产业正处在一个爆发前夜。 有公开数据显示,咱们国家每天的 token 消耗量已经飙到了一百八十万亿,平均每一点五天就有一个新模型冒出来。 这就好比一条高速公路,车已经多的不行了,但收费太贵,大家跑不起。现在国家超算互联网把过路费降下来,还发免费券, 目的就是让更多车开上来,把这条算力高速公路用足。你可能会问它降这么低,自己亏不亏账不是这么算的。 对平台来说,真正值钱的不是那点 token 费,而是海量用户在使用过程中产生的数据,尤其是科研领域的高质量语料,能反过来训练优化它那个 club 智能体,让它越来越聪明。 同时,这个平台上目前已经有六百家服务商,七千两百款算力商品完成过二十万次交付。人家赚的是生态的钱, token 就 相当于这个生态里的货币,现在多发点货币是为了让整个经济循环赚起来。 那这事跟咱普通人有啥关系?简单说,当算力便宜到像水电一样随取随用,当像 s club 这样的科研智能体成为标配,就意味着 ai 应用的门槛被彻底打掉了。以前只有大厂烧得起钱干的事,现在小团队甚至个人都能试一试,这对整个 ai 产业的影响是深远的。 好,咱接着往下聊。刚才把国家超算互联网送 token 这事讲清楚了,那有股友肯定要问了,这事背后有没有什么值得关注的方向? 咱不聊具体个股,就纯聊逻辑,把产业链上哪些环节可能会因此受益,给你掰扯明白。第一条线是国产算力硬件,你想啊,每天几百亿甚至上百万亿的 token 在 跑,靠什么跑? 靠算力卡。这个超算互联网平台整合了全国三十多家超算中心,十五万张以上的加速卡,这里面很大一部分是国产芯片在支撑,当平台的用户越来越多, token 掉用量越来越大,对算力底座的需求自然水涨船高。 不是说哪个厂家的卡卖的多了,而是整个国产算力产业链,从芯片到服务器,都处在一个需求被持续拉动的通道里。第二条线是算力调度和网络。这个可能很多人容易忽略, 超算互联网不是把一堆机器堆在一起就完事了,它得能调度的动。你想十几个省市,三十多个中心,十几万张卡,怎么让一个用户发个请求就能找到最合适的那块?算力 靠的是调度系统,同时跨地域的数据传输,对网络的要求极高。所以那些做算力调度平台、做数据中心互联设备的厂商,其实是这个算力网络里看不见的基建。他们的机会在于 算力资源越分散,调用越频繁,调度和网络的价值就越凸显。第三条线是 ai 应用和智能体,也就是用算力的那一端,这个其实跟普通投资者关系更近一些。 当 tokens 的 价格降到零点,一元一百万意味着什么?意味着过去只有大厂烧得起钱的 ai 应用,现在小团队甚至个人都能去尝试。尤其是这次活动重点推的 s club 科研智能体,瞄准的是科研、教育、工业、仿真这些垂直场景。 当算力成本不再是门槛,那些深耕具体行业,能做出好用智能体的公司,它们的商业模式就跑得通了。 这三条线其实对应的是同一个逻辑,算力正在从稀缺资源变成普惠水电。当基础设施铺好了,价格降下来了,最先受益的是造基础设施的,其次是搭调度网络的,最后是那些在上面盖房子开店的。 咱们看清了这个链条,再看相关的产业动态,心里就有数了。还是那句话,咱不推荐任何东西,只把产业链的逻辑给你讲透。至于怎么用,那就是股友们的功课了。

春节期间,海外大模型聚合平台发布了全球大模型排行榜,数据显示,中国模型在全球排名前十的大模型 token 总用量中占比很高,这引发了国内对国产 ai 全球变现的关注,也催生了 token 出海的新趋势。今天我们来聊聊 token 出海目前落地的三种商业模式。 第一种是模型聚合平台上的 api 调用,这是目前最直接的出海方式,也是资本市场认可的模式。 海外开发者通过全球模型聚合平台调用中国大模型的 api 推理过程,在国内数据中心完成,海外用户按实际使用的 token 付费,中国大模型企业从中受益, 核心优势是电力核算力不出镜,但价值出镜。第二种是海外版 ai 应用,这类产品面向海外普通用户, 属于 c 端 token 出海。国内比较成功的有字节跳动的豆包海外版和 mini max 的 ai 陪伴应用。前者在东南亚、墨西哥等国的免费 ai 应用市场表现突出,日活超千万。后者吸引了近两百万海外付费用户,是 mini max 的 核心变现产品。这些应用依靠国内 i d c 服务的性价比 推理服务用国内平台,但变现方式是订阅、广告等 c 端模式,不是直接卖 token 给开发者。第三种是开源权重出海,这是长期抢占生态的打法, 中国公司将模型权重免费开源,海外推理算力平台在本地部署这些开源模型。不过这种模式下,海外开发者的 token 消耗在当地平台, 中国大模型公司无法直接受益。严格来说和 token 出海没有直接关系,但开源模型能抢占全球开发者心智,后期可通过高性能闭源模型导流到自家 api, 实现真正的 token 出海。总结来说,这三种商业模式本质还是国产算力的趋势, token 出海更像是给国产算力套了个新马甲,大家要注意其中的炒作风险。

别再刷怎么安装 openclaw 了,洗洗睡吧。我发现大部分人,他就算部署了 openclaw, 他 去烧 token 其实也是在烧纸。而真正的大佬,真正烧 token 能赚钱的人啊,他们基本都集中在下面四个领域,而且我发现他们都有一个共同的思维方式啊,不是技术,而是叫做异常值思维。 那这期视频呢,我跟大家聊聊,普通人玩 openclaw 怎么少踩坑多赚钱。先说说他们在哪几个领域啊?第一类叫做龟铲老司机, 最近有客户啊,做灰厂和内容工厂啊,找我聊数的人系统,他说大黄,你这个的不秀系统确实不错,而且确实便宜,但其实我用不用无所谓。我说为什么,他说因为我们搞这个业务呢,他们搞的是那个深夜情感故事啊, 只要转换率够,托管费用对我来说算个屁。他这句话一下让我醍醐灌顶啊, r o i 只要大于一托管就是印钞的纸,我们去买托管,其实就跟买打印的纸一样,不心疼,无非就是赚多少而已。第二点呢,就是搞大模型套壳,他们往往对外话术都是自言国产之光,背地里其实用 jammerite gpt 四 用顶级模型去训练一个廉价的徒弟,然后去割垂直行业韭菜。其实也不叫割韭菜吧,毕竟现在搞套盒的确实比搞研发的要赚钱太多了啊,赚的就是情怀和信息差的钱。那第三类呢,叫做按需付费类的。 现在有个词又火了,叫做 print on demand, 就是 用户给你下单,或者通过 ai, 它去自定义产品,下单之后你才去生产才去印,这样就能减少你的库存成本。以前你请一个设计师,一天磨磨唧唧出三张图, 调一个 a p i, ai 一 天就搞几千张,印完了直接拿走。那在他们眼里呢? ai 不是 什么人工智能,是一个不交社保,不吃午饭,他也不会因为改稿跟你辞职的廉价劳动力。 那第四类叫做商业演技派。我去年也跟几个投资人聊过,带着他们去见过一些创业团队,有很多创始人呢,打着一人公司的旗号,在那里摆几千个手机,几千个 mac mini, 在 那里去做电商,做自媒体,刷单演戏, 他们也在烧托肯,但他们不是在赚钱,他们是在演给你看,演给投资人看,那这个托肯他烧的不是算力,是演技,是 ppt 啊,是一个追梦的机会。然后就是第五类啊,所谓的燃料区,就是我们这种普通人, 包括我自己在内,如果你业务壁还没有跑通,天天被这些狗屁博主忽悠去配置 open colo, 配置环境搞一大堆,先把自己绕晕了,最后终于可以烧托肯了。其实发现啊,跟 ai 赚钱差的还很远, 你以为你在创业,其实你在给 ai 行业捐款。但是你看过这四类大佬之后,你会发现他们有一个共同的思维方式啊,就是异常值思维。会展老司机的 roi 是 十,花一块钱,托肯能赚十块钱,这就叫异常值内容老司机的 roi 是 花一块钱,托肯能赚一万的流量,那 这也是异常值。而你的 roi 是 零点一,你花一百块钱,托肯赚十块钱,甚至一块钱都赚不到,那这是正常值。 正常值思维的人,他注定就是炮灰。找到异常值其实就是创业的最佳起点。当然很多人也不是说我冲着我立马要去赚钱去的,我提前准备提高效率和能力也不错。所以下期我给你们介绍一个,普通人也能低成本用上 opencloud 的 方式,再帮你们省几百块吧。

token 是 什么?这个 ai 零的概念被翻译成词源,而且已经被中国政府网人民日报等官媒确认为标准中文译名。那它到底是什么意思?又有什么用呢?说白了,它就是你使用付费 ai 工具的收费计量单位, 就像你的手机流量一样,一个 g 就是 十块钱。你使用付费 ai 工具,就按照你消耗的投坑数量,也就是资源的数量来收费, 也就是说它是一种国际互联网的通用货币。我看到有一个人一天就消耗了等额两千块钱的投坑, 本来想让 ai 替自己打工,结果却发现根本就养不起,只好含泪卸载了付费 ai。 你 已经使用过付费 ai 了吗?欢迎在评论区聊聊。