粉丝326获赞1471

卖 ai token 这门生意的毛利率居然是百分之九十二,但比这个数字更可怕的是,网上教你做这个的博主,没有一个人把真正的风险讲出来。 我花了三天的时间拆了一遍,把好处和坏处一次性给你讲清楚。国内的大部分人因为网络问题,是没有办法用上 cloud 拆的 gpt 这样先进的国外大模型,那能用上的人就想了一个办法, 我去 cloud 官网买一张月卡,然后把里面的 token 组成一个大的 token 池,再把这些 token 分 批次地卖给有需要的人。 举一个例子,我购买了一张两百美元的 cloud 月卡,它可以使用的 token 额度按照官方的标准计价是两千四百美元啊。所以说两千二除以两千四 百分之九十二,就是这个事情的毛利率。那我有了一个很大的 token 池之后,我就可以把 token 分 为很多块,卖给不同的消费者。消费者可以买到的产品有两种形式,第一种是固定额度的 cloud token, 比如说十美元。 第二种是一张月卡售价三百人民币,那你每天可以使用三十美元的 cloud token。 普通人参与这个事情的方式有两种,第一种是当推广员,第二种是建立自己的 token 池。 推广员意思就是说,你只需要推广自己的专属链接,吸引更多的人通过你的这个链接来下单 token 就 可以了。至于说月卡的购买, token 池的构建, 你完全都不用操心,参与的方法也很简单。呃,现在比较成熟的,规模比较大的中转站都有自己的推广计划, 你直接找到他们的负责人,说我要当你的推广员就可以了。那么第二种是构建自己的 token 池。大家不要觉得这个事情听上去很难,其实现在市面上百分之九十九的中转站用用的都是同一套开源的 github 框架,名字叫做 sub to api。 这个框架非常的成熟和强大, 它帮你搞定了多账户的管理,托管的计费,托管之间的动态协调,你只需要输入自己的 cloud 定位链接就可以了。这件事情我推荐普通人先从第一种方式做起,再逐步过渡到第二种方式。原因是第一种它是零成本, 你只需要负责销售就好了,你获得的正反馈也很快,当你积累了足够多的客户,也就是你的需求端稳定了,那对你的服务的稳定性会有更高的要求,这个时候你再把之前获得的利润投入到再生产才是划算的好处都讲完了,接下来我们讲一讲风险。 第一个是大部分人都大大低估了流量获取的难度,但是你不妨带入买家的视角想一想, 你正在上网,一个陌生人突然过来给你说点我这个链接,从我这里买 token 吧,你会怎么想?第二个风险点是官方封禁,其实 cloud 是 不支持月卡、拼卡这种行为的,他也在积极的检测这种模式,并且一旦检测到就进行封号。 这个时候如果你只是一个推广员,你只做销售,这个环节又变成了一个缺点,因为你无法推动上游,也就是真正的中转站去解决封号的问题, 这就会导致售后环节会大大消耗你的心神。所以这也就是为什么我建议普通人一定要从第一个阶段,也就是推广员逐步过渡到第二阶段,建立起自己的好势。 现在的推广员中转站有很多,技术上也没有门槛,所以大家都在同质化竞争打价格战。但客户关心的始终都是服务的稳定性。 当你有了自己的好吃,你可以多买几张月卡,即使一两张被封禁了,剩下的也足够支撑你所有的客户服务不下线。只有你积累足够多的客户和信任,你才能跳出同质化的竞争,打出自己的品牌。这里是 bridge, 我 们下次见。

腾讯给核心研发岗员工配置了年度约二十二万元的 ai token 套餐,覆盖多款主流模型字节,宣布工作场景, ai 工具不限额度,员工业余使用报销百分之五十。不是员工自己偷偷充值在用,是公司正式采购、正式分配,正式写进预算。更狠的是 meta, meta 内部搞了一个 token 消耗排行榜, 用的多的员工拿称号,用的少的面临淘汰。制度一出,三十天内全公司 token 总消耗从六万亿飙到七十三点七万亿,翻了十二倍。阿里自洁的技术团队也在把 token 使用量作为转正和晋升的参考依据。这些动作加在一起,说明一件事, token 正在从员工自己掏钱买的小工具,变成企业统一采购的正式预算科目。 这个变化的分量,很多人没意识到。你想想,公司什么时候会把一样东西纳入正式预算,只有当这个东西变成了日常运转的必需品。电费是正式预算,因为没电。公司停摆。房租是正式预算,因为没地方办公。办公软件是正式预算,因为没有他,员工没法干活。现在头肯也进预算了, 说明在这些公司的判断里,没有 token 供给,员工的日常产出会打折扣。而且不只是大厂,三大运营商同步推出了 token 算力套餐,个人版九点九元包一千万, token, 开发者版三十九点九元包一千五百万 token。 运营商把 token 做成标准化套餐来卖,说明 token 消费正在从专业圈子向大众市场扩散。从我们做 token 渠道的角度来看,这件事的影响非常直接。 客源增加了,以前你的客户主要聚焦已经在用 ai 跑业务的团队、电商内容开发者,他们自己意识到需要 token, 自己来找你。现在多了一大类客户被公司推着用 ai 的 员工和团队。以前他们不用 ai, 不 消耗 token 跟你没关系,但现在公司给他们配了 token 套餐,把 token 消耗量纳入了 kpi, 他 们不得不用。 一家公司几千名员工同时开始消耗 token, 月总消耗量是天文数字。而且这类企业客户的采购方式跟个人完全不同,个人用户自己去官网充个几十块就行了。 企业需要统一采购业务,需要多家模型搭配,需要批量折扣,需要清晰的账单,还要做部门分配,每个员工业务定多少偷看额度,这些是企业不可能自己去一家家模型官网搞,他需要一个供应商帮他打包搞定。偷肯聚合平台就是这个供应商。 你帮企业做批量采购,压低成本,帮他做统一账单,部门分配和预算管控。你切入的不是一次性的充值生意,是企业每月固定的采购流程。 当 token 变成跟电费、房租一样的企业日常支出,卖 token 就 跟卖办公用品一样稳定,每家公司每个月都要采购,永远不会停。我是牧野,深耕算力与磁源赛道,专注分享行业干货,咱们下期再见!


这是一张手机话费账单,往下一拉,你会看到流量、语音、短信之类的消费情况。可如果我把它换成未来的账单,你会发现流量的消费情况不见了,取而代之的是一串陌生的数字偷看。 就在五月十七日,中国电信正式推出了全国层面的市商用 token 套餐,紧接着中国移动也下场了。这意味着运营商正在改变计费模式,传统的流量 g b 时代,正在向 ai token 计价时代转变, 这也是运营商底层商业逻辑的一次彻底重构。很多人看不懂 token, 以为它是高深的技术术语,其实放在大众视角理解起来很简单。如果说流量是互联网时代的上网单位,那么 token 就是 ai 时代的算力单位。 token 本质上来自大模型处理信息时的最小动作, ai 每次推理以及生成回答,这背后都有无数算力在微观层面不断叠加,最终形成一个可计量的数字单位。 我们现在用 ai 要计算 token, 而 token 也正在悄悄改变整个 ai 产业的运行方式。以往你用 ai 可能会发现, a 家的会员不能用 b 家的大模型, ai 工具之间出现了互不兼容的情况,体验非常割裂。但现在,运营商把 token 封装成了标准化的产品,就像我们平时用的流量包一样,一号通用,还能跨平台使用,甚至可以用话费去支付。如果说流量是互联网时代的水, 那 token 就是 ai 时代的电。你生成一张图,写一段文案,或者让 ai 帮你写代码,让智能体跑一个任务, 背后消耗的都是 token。 它能把人、模型、算力、应用全部连接到一起,成为 ai 世界的通用度量单位,这就是 token 时代的核心意义。 电信这次做的非常彻底,率先全国市商用 token 套餐,直接不再按 gb 计费,改成按 token 计费。针对个人、家庭、小微、企业,开发者 划分出了全套梯度套餐,最低档每月九块九就可以进行 ai 办公学习。二十块可以开五 g a 高速速率包, 叠加五块,还能加个智能安全防护,普通人低成本就能配齐全套 ai 工具。而针对企业和开发者, 三十九块九起步,专业算力套餐适配代码开发、模型调试以及智能体搭建和高算力运算,还能叠加企业专属宽带提速跟智能体护栏风控, 适配了专业人群的需求。再加上星辰 tiktok 智能调度平台系统自动择优匹配模型,用最优成本、输出最稳的 ai 服务,把专业算力变得平民化。 紧随其后,中国移动更是喊出了一元四十万 token 口号,让 ai 使用门槛大幅降低。在不久的将来,你在中国移动这里开的 token 叠加包,可能跟你现在用的流量包一样,会按月结算,还能跨端通用。你在一个地方存下的 ai 额度, 换一个地方照样能用。那为什么运营商做 token 比任何人都合适呢?因为他们天生擅长这三件事, 连接用户、管理网络以及做大规模服务体系。他们最近还提出了四项核心工作,人人都有 token, 处处可用 token 行行受益于 token 缓缓融入 token, token 正在从一个技术词变成 ai 产业里的关键连接器,也是盘活整个 ai 生态不可忽略的关键 dna。 未来你可能会看到这样的场景,你买的 token 像流量一样,可以按月结算。它能在手机上用,也能在电脑上用,甚至还可以在云端用。你在 a d 存的 ai 额度到 b d 照样能用。你问 ai 一个问题, 生成一张图,甚至跑一个任务,消耗情况都能被清晰计量。 ai 不 再会是高高在上的技术,而会像水电一样变得基础, 再也不用去纠结这个 app 会员太贵或是那个模型用不起,一个 token 包全能搞定。以前运营商赚的是数据传输的钱, 靠流量消耗来盈利,增长早就见顶,天花板也变得越来越低。现在运营商赚的是智能算力的钱,靠 token 服务盈利,打开了万亿级 ai 市场的全新增长空间。 token 原本是大模型里的技术名词,现在却开始向大众普及。它让 ai 不 再是少数人的工具,而是所有人的能力。这大概是 token 到目前为止最有烟火气的一种用途。

豆包收费上的热搜,为什么同样是收费, chad gdp, plus 每个月是二十美元。嗯, copod pro 每个月是十七美元, max 是 一百美元, zamani 也是收费, plus 是 七点九九美元, pro 是 十九点九九美元。全部都比豆包要贵, 有的呢,是贵一倍还多。但是你有没有发现一件很奇怪的事情,没有人骂拆的 gbt 割韭菜,也没有人说可沃德德不配位。那些花二十美金订拆他 gdp 的 人,不仅没有骂,还在朋友圈推荐别人买, 为什么呢?为什么同样是 ai, 同样收费,比豆包还贵?嗯,这个问题我想了一天,当然,本视频绝对不是写什么崇洋媚外,然后来煽动什么骗点流量什么的。嗯,我觉得大家真正骂的并不是六十八块钱,而是正在用互联网时代的思维 去理解 ai 时代的产品。嗯,什么意思呢?你看看手机里面装了多少免费的东西? 对,微信免费,微博免费,是抖音免费。嗯,二十年来,中国互联网给了我们一个极其稳固的信念。嗯,网上的东西应该是不要钱的。是啊,但是天下真的有免费的午餐吗?没有,微信有几十万台的服务器要养, 抖音每天消耗的贷款是天文数字。百度有庞大的研发团队,如果用户没有付钱,那么钱是谁出的呢?答案是广告主。对,所以互联网时代最经典的商业模式只有一句话,用户免费,商家买单。 但是,难道全世界的互联网都是这样的吗?是,其实也不是,很多内容本来就是要收费的, 比如华尔街日报是要订阅的,纽约时报也要订阅,很多国外的新闻网站,你看多了几篇,弹窗就出来了,请订阅。在很多欧美用户的眼里,软件是工具,内容是产品。 既然创造了价值,收费本来就是一件很正常的事情,但是中国互联网走的是另外一条路。嗯, 二十年前,中国互联网最大的任务不是赚钱,而是抢用户。对,喜欢用大战去抢市场,比如网约车大战、外卖大战,先把人挖进来再说。 于是慢慢就形成了一种非常特殊的商业模式,用户免费,广告买单。你刷视频的时候,广告组在付钱,嗯,你看新闻的时候,广告组还在付钱。 久而久之,我们的大脑就会形成一张地图,互联网产品就应该免费。所以很多人今天讨论豆包收费的时候,其实出现了一个认知错位, 他们是在用互联网时代的逻辑去理解 ai 时代的产品。互联网解决的是什么问题?什么问题啊?信息传递,比如我产生了一个视频平台, 只是把它传递给你,平台对内容是没有任何加工和生产的,对,他就是一个中介。嗯,这个成本很高吗?高。我用 ai 查了一下啊,数据贷款成本大概是占总成本的百分之五到百分之十五。 不是说这个成本不存在,而是他有一个关键的特征。嗯,用户越多,成本就越分摊。 一个视频上传一次,一个人看跟一亿人看平台多付的钱,它差别是极小的。 所以可以免费啊。对啊,但是 ai 不 一样, ai 的 成本藏在每一个 talk 里面。那什么是 talk 呢?啊?你可以把它理解为是 ai 的 思考最小单位。哦,我之前有视频专门讲过。嗯,你问 ai 一 句话, 他处理你的问题,调取知识,组织语言,生成回答,然后每一步步骤都是在消耗 tucker 的。 嗯,你问他苹果是什么颜色啊,几个 tucker 也花不了多少钱。对,但是如果说你让他帮我整理全世界的苹果产地, 然后分析不同产地的苹果口感差异,做成一份带图表的 ppt。 嗯,它要理解需求,拆解任务,调取知识,组织逻记,生成内容输出结构。嗯,这一整套下来,消耗的 token 可能是前一个问题的几百倍。 嗯,而 talk 的 背后是算力,算力的背后是电力,是真实的在燃烧着的能源。嗯,用户越多,账单就越大。嗯,这跟互联网平台用户越多,成本越薄,是两套完全相反的误导定律。 所以黄仁勋一直在讲一个词,啊,滔肯经济。他说未来的劳动会像水电煤一样被计算啊,不是按人头来收费,而是按工作量来结算。嗯,你用了多少的算力,消耗了多少的,滔肯 付了多少钱?对,简单的事他就便宜。是的,复杂的事干的越多,就烧的越多。是的,这个逻辑就跟你家电表本质上是没有任何区别的。嗯,所以豆包收费这个事情,我认为讨论的根本不是六十八块钱, 真正的问题只有一个,嗯,当人类第一次开始大规模购买机器的脑力劳动,对,我们走进了一个什么样的时代? 互联网时代最稀缺的是信息,谁掌握了信息,谁就掌握了权力。对,搜索引擎因此诞生,电商也因此繁荣,算法推荐成为这个时代最值钱的能力。 ai 时代最稀缺的是另一种能力, 不是找到答案的能力。是,而是直接交付结果的能力。对,互联网帮你查找信息,剩下的事情还要你自己来解决。嗯, ai 开始直接替你做事,这两件事情本质上就是完全不同的事。对,那这条视频的意义到底是什么呢? 不是告诉你豆包值不值六十八块钱,对,而是想说,每一次时代的齿轮的转动都不会敲锣打鼓的通知你。 互联网起来的时候,大多数人只看到了新起和泡沫电商机会来的时候,大多数人会觉得这个生意靠谱吗? 短视频机会来的时候,一开始很多人都觉得这个好像上不了台面吧?对啊,但是每一次总有一小批人,他会比别人更早的看清楚了方向。 那你说 ai 时代到底怎么样抓住机会呢?嗯,坦白来说,我也没有答案。嗯,如果有人告诉你他已经完全看懂了未来十年的 ai 新世界,对,那大概率都是在骗你的。 因为我们不是站在历史书的后面去复盘,而是站在历史发生的现场。 所以豆包收费这件事情,我觉得讨论的根本不是六十八块钱,而是另外一件事情啊。过去二十年,我们习惯了互联网免费,习惯了广告买单,习惯了把软件当成工具,把内容做成流量。 但是 ai 不 一样,他开始出售的不是信息,而是能力,而是劳动。当人类第一次开始大规模购买机器,脑力劳动的时候,嗯,很多旧的商业逻辑将会被重新改写。嗯,这句话是要划重点的。 所以豆包收费可能只是一个非常小的新闻,但是很多年以后回头来看,他也许是第一次网购,第一次扫码付款,是一样的, 成为一个时代转弯时候留下的目标。这一路通向哪里没人知道。对,但是车已经转向了。

其实大部分人都错了,现在你去看最聪明那些零零后甚至零五后的年轻人,他们把钱花在什么地方?答案是最贵、最前沿的 ai 头干。因为他们知道一件事,就是说我用免费的豆包,甚至免费的 check gbd, 跟他网页上聊聊天,吹吹水, 跟我真金白银,每个月花几百美金去买最牛逼的 cloud code, 甚至 check gbd 扣代码 x, 让这些 ai 机构帮我去做高价值任务,这样的差距日积月累会非常之大。所以这也是为什么 他们哪怕每个月只有小几千块钱的生活费,也宁愿拿出钱来买这些托管。这个决心是非常大的,但很少有人看得到。所以这就是为什么我太空 ai 三类公司现在提出来一个太空黑帮计划,拨出来一百万美金去赞助各种各样的海内外的 ai 黑客松 ai 活动比赛。 比如说过两天在深圳就有一个两三百人参加的一个黑客峰比赛,主办人之一是我的一个清华的学弟,每个人赞助个小一百美金,其实就两三万美金花出去了。这个从商业化的角度来说,很难回本。 但如果说今年真是人类文明基点,那我就要大力去支持这些年轻人,用最好的 ai token 去做最牛逼的 ai 任务。

好了大家今天呢,我们来聊聊 ai 模型的收费方式。那现在的收费方式五花八门的,有的按 token 计费,有的按次数收费,还有的按输入输出分开计费等等。今天这期视频我就用一张图给你讲清楚,你到底适合哪个方式,记得点赞、收藏关注,我们正式开始。 第一类,官方会员订阅,指的是在官网买不同梯度的会员套餐,这里的会员套餐就像你每个月给手机买的流量套餐,按一定额度和使用次数收费, 超过了额度就会限速或者是额外收费,等下个月再重新开始。那这种方式最大的好处就是稳定正规。但国外的套餐在网络问题上还有支付方式上都有一定的门槛,大家根据自己的情况,还可以从以下三个付费方式里挑选出最适合自己的。 第二类,第三方套餐订阅背靠大厂的火山云、阿里云、腾讯云或者是 cursor、 winserve、 github、 copilot 等等这类 ida 平台都有自己的第三方套餐,价格从四十块钱到一千块钱一个月不等,你可以根据用量灵活地选导。 那第二点,不被一个模型所死,可以在第三方套餐里丝滑地切换 deepsafe 或 mini max。 第三点,用起来真的方便, 支持国内直接付费。但像小龙虾等这类 ai agent 应用出现后呢, token 的 消耗猛增,所以现在套餐的额度都在收紧。好的,那以上呢,就是按套餐收费的两种形式,可以基本包含新手小白的大部分需求。那如果你对 token 的 消耗有着明确且大量的需求, 再来看看用 a p i 收费的形式。第三类,官方 a p i 按量收费,这个方式最直接,就像你家的电费,用多少交多少,靠打表计费。那 ai 的 计费单位叫头肯,可以粗暴理解为 ai 字数,那接入官方的 a p i 连上大冒险后,你发给 ai 的 字, ai 回你的字,一来一回都要计费。 需要注意的是,不同模型的 api 计价的差异会非常的大。像 cloud 的 旗舰版模型, open 四点七,输入每百万 token 是 五美元,输出每百万 token 是 二十五美元。那国产的 mini max m 二点七模型, 输入每百万的 token 只要零点三美元,输出每百万 token 只要一点二美元,便宜了将近十七倍。 所以在不同的任务需求上,可以灵活的搭配各家的模型。简单的任务呢,用便宜的模型,复杂的任务,再用旗舰版的模型, 整体的成本就能压下来,但是需要自己配置。 apikey 有 一定的技术门槛,而且呢,需要自己盯账单,所以比较适合进阶型选手。第四类,就是最近特别火的第三方 api 中转站。你可能听说过孙雨辰在做,董王家族在做, 猎豹浏览器的富盛也在做,很多人都在做,但这一格的坑也是最多的。那什么是中转站呢?它的本质就是一个偷看的中间商,拿着自己买来的 api key, 帮你把请求转发给 cloud 或者是 gp 模型,再把结果送回来,中间赚一个差价, 那价格确实会便宜不少。但有三个风险,你必须提前知道风险。一,模型可能会被掉包,比如说你附了 cloud 旗舰版的模型,但它有可能实际给你跑的是其他模型,而且你几乎看不出来。风险二, 数据安全有隐患。因为你的每条对话都需要经过第三方的服务器,如果你的信息都要经过一个陌生人的电话转接,虽然听不听是他的事,但你的信息就在他手里过了一遍,有潜在的数据。风险第三点,如果第三方的中转站哪天突然关门了, 你充值的钱可能就追不回来了。推荐大家用有背书或者是更大型的 a p i 中转站,像目前最权威的还是 open router, 大家已经习惯看上面的模型的量来选择模型。我把市面上主流模型的付费套餐汇总成了一张统计表,放在了评论区,需要的朋友们可以自取。我用四个场景帮你选好方案,你只要根据使用场景对号入座就行。 如果你平时高频的需要跟 ai 对 话,用来写文档查资料,不用折腾,直接开官方入门会员就好了。首选 cloud pro, 二十刀一个月。如果 cloud 访问有问题的话,可以选叉 gpt plus, 同样也是二十刀一个月,那最新的五点五模型非常的好用。如果你是谷歌全家桶的深度用户啊,那直接选 gemini advanced, 配合 notebook lm, 做学习和资料的整理都特别的顺手。第二档,轻度编程加简单 a 整用户。如果你偶尔写代码跑自动化任务,那就开始有挑模型的必要了,不同模型的代码能力差距是非常大的。海外首选 cloud max, 入门党,一百刀一个月的配合, cloud code 是 目前最强的一个编程组合, 如果你搞不定 cloud 的 风控,也可以用 gpt pro 加 codex, 也是属于编程的第一梯队,非常的能打,如果你要用国内的模型,推荐的是智普 pro 的 glm 五点一能跑,外部的 agent 框架在国产模型里也是最强的编程梯队。 第三档如果你是重度编程加重度 agent 用户,每天都要跑 ai coding 的 话,这一档啊就就省不了了。逻辑呢,就是一个高级会员打底,再备一到两第三方套餐应急, 主力呢是开 cloud max 两百到一个月的档位,或者是叉 gpt 的 pro 也是两百到一个月,结合到 codex 和 cloud code 现在都非常的能打。那为什么要再备一个第三方的套餐呢? 因为重度的用户很容易就撞上这个五小时的限额,或者是撞上这个周度的限额,一卡就是干的。所以有第三方的备选套餐就可以直接切换丝滑的过渡。那备选的推荐火山引擎的 agent plane 或者是质朴的 coding plane, 或者呢是用 open rotor 充点余额去应急。 那这一档其实还有个省钱的玩法,就是把已经跑通的固定工作流换成 mini max m 二九五这类性价比特别高的模型 api 来跑,整体的成本就能降很多。 这一套组合的核心思路呢,就是用主力模型保性能,用第三方套餐保连续性,那同时用低成本模型跑自动化好。最后一档就如果你是专业或者是企业级用户,要接近自己的产品,批量的服务的话呢,就直接走官方的 api, 原因很简单, 套餐容量再大也有上限,企业用量的话分分钟就会触达他限额。官方的 a p i 有 正式的 sl a 和合规的协议可以开发票,还有企业版的定价,有专门的谈判空间,不是普通的套餐可以比的。好的到这里就讲完了,回头看一下,今天讲到的四项限是告诉你他们钱是怎么收的, 这个档位是告诉你我们钱应该怎么花。那你现在用的是什么 ai 模型呢?每个月你会花多少的费用在 ai 上面?欢迎在评论区分享。好的,那如果这条视频帮助到你的话呢?记得点赞收藏关注,我们下期再见。

这个视频告诉大家哪里有免费的 ai token 啊?我也是靠这个免费的 ai token 日常来去运行这个爱马仕和小龙虾的 就是免费的 ai token, 在 这里叫 open router, 然后那 open router 里边其实有很多的模型你可以看到,然后那, 呃,这里边你只需要输入四个字, free, 然后你就可以看到它这里边所有的免费的模型。那第一个是排行第一的是腾讯的魂元三,这个是英伟达的模型, 然后这个是蚂蚁的模型,这是 mini max 模型,你会发现每一个都有免费版。那么我日常使用的最多的模型其实是 open ai 的 open ai 的 这个 gptos 一 百二十 b 的 模型。我为什么用这个模型呢?因为这个模型是看起来就是我日常用起来 跑爱马仕和小龙虾这种 agent 最稳定的。但是你会发现这些免费的模型当中有一个点就是它不支持多模态,所以,呃,我也会用这个多模态的免费模型。那我也告诉大家在哪里输入 free 回车,然后把这个地方点上 image。 好,那你可以看到这里边就都是免费的,能够支持读取图片的这个多模块模型。我一般会使用这个英伟达的这个模型,呃,因为它日常用上去这个支持的病发数量都不错, 所以基本上借助这个 open router 你 就可以实现。呃,日常用你的爱马仕和小龙虾不花任何 ai token 的 钱。 当然了,你也不要指望说这些这个模型能够比得上什么 opus 四点七,然后呃, gpt 五点五,它是不可能的,但是因为日常你用爱马仕和小龙虾都不会执行特别重要的工作, openroute 的 免费模型已经足够用了。 如果你的朋友还在花钱买 ai token 去养这个爱马仕和小龙虾,你可以把这个视频转发给你的朋友,告诉他免费的 ai token 其实就够用。

一块钱能干啥?大不了买一瓶水,但是上海电信他说能调用二十五万个 tokyo。 对, 就是用 ai 大 模型认字的那个 tokyo。 以前的大模型要么是办会员,要么是单独充值。 现在上海电信直接把 ai 它这个套餐塞进这个话费套餐里面,一块钱能买二十五万个 tokyo, 随时用,随时交费。那么十块钱能干啥呢?能让 ai 帮你总结一百本书, 这就是运营商用流量思维来卖 ai, 就是 用多少付多少,跟这个买流量套餐一样。打个比方你就明白了,你像国外的菜的 gdp 和咱们国内豆瓣现在推出了付费,像那贵的每个月几百元上千元,而便宜的我们可能就 几十元。但是上海电信它这套餐是一块钱二十五元套餐,你用几次算几次,不花钱不得不说啊,算力么?真的来了,像国家现在已经出手,要把算力变成像水啊电和 网络一样的公共设施。一边是用的多,你交的多,而另一边是你用不用每个月都交固定的费用,当然有可能比较便宜。你到底习惯选择哪一种付费模式?评论区聊聊,我是毛晴,一个关注恩爱的媒体人。

印中国两毛钱的店,做出欧美四百块钱的生意。二零二六年最确定的风口就是拓客出海。今天我印一分钟,把它的暴力逻辑讲透。拓客就是 ai 的 计量单位,就像我们买水按平计算,印 ai 就 按拓客算,你用 ai 写文案、做图、跑智能体, 每一项都要消耗算力。使用过小龙虾的朋友都知道,越深度印 ai 拓客消耗越多,就得花钱充值。全球最便宜的拓客,只有中国能够练出来, 凭什么?核心就一条,电费便宜。新疆的绿电两毛钱一度,美国要三块十五倍的成本碾压。当然,拓根不是电的本身,它是电加算力所练出来的数字产品。正点中的正点。很多人都搞错了, 托肯出海,我们到底出的是什么?竟不是电?因为电没办法长距离的跨境运输,也不是服务器,因为出口很容易被人卡脖子,而是按托肯计费的匀算力使用权。更通俗一点说,我们用新疆便宜的绿电驱动服务器产生算力, 再把算力变成托肯。比如 kimi、 千问这些国内大模型,背后全部是海量服务器和算力。海外客户不用买服务器,不用自己烧电, 花少量的钱买我们的托肯,就能调用这些便宜的算力,我们赚的就是这个成本差价。这就是托肯出海的核心逻辑。店不出国,算力不出国,但算力的使用权靠网线就能卖到全球,而且普通人完全能够参与,不用进店账,不用等技术, 最直接的机会就是做托肯贸易厂。那么今天老冯就来讲讲具体应该怎么做。第一步,找国内大厂制普豆包等等拿分销权。第二步, 去海外找客户, ai 公司工作时,开发者都可以。第三步,卖托管额度赚差价,认为合规全是大厂的事情,你只负责赚信息差的钱。托管出海店铺出国,价值出海。这就是二零二六年最确定的风口,看懂的人已经开始在布局了。我是老冯,关注我,抓住下一波红利。

给大家分享一个颠覆认知的 ai 新商机。现在不少中型企业每月 ai tok 消耗量已达数万亿级别,按当前市场价格算,单月成本轻松几万到几十万,头部企业更是量级翻倍,而且用量还在持续暴涨。 企业大规模落地意见后,员工日常使用 ai 七成以上成本都花在 talk 上,成本失控、用量不明、浪费严重,已经成为企业 ai 化的最大痛点。谁能帮企业管好 talk, 谁就能抓住这波确定性红利。企业真正需要的不只是买 talk, 而是一整套 talk 管理服务。 第一,全面路透明,按部门、按项目清晰对账,每一分钱花在哪,一目了然。第二,智能降本,通过智能调度、语音缓存、 请求优化,砍掉无效消耗。第三,规模化溢价,以批量集采拿到低价,再为企业提供稳定供给,赚取合理差价。这套是企业自己做,不划算,它不是一锤子买卖,而是持续的运营与优化服务, 按月产生稳定复购。做 tokun 中间商,本质是做企业 ai 成本管家,用服务锁客,形成长期稳定的现金流。我是 vico, 专注 ai 大 模型聚合服务。如果你想抓住 tokun 经济的风口,留言 ai, 一 起把握 ai 时代的新财富机会。

董总,所有的机器人保养都好了,这是费用清单,您看看。天啊啊,这机器人保养费这么贵?那是基础保养费,您这批机器二十四小时工作机制,会员也到期了啊,需要精准缝纫、精准裁剪、故障自剪、固件升级等功能,还得开通至尊 vip 服务,费用是八千八百八十八元,速度要充会员,清线头要会员,固件升级还要顶配 vip, 合着不花钱,机器就只能当个摆设。没办法,这是公司规定,会员我一分不充,机器全部停工。立刻联系老员工返港。好的,马上联系。

豪赌七百亿美元搞 ai, 折合人民币四千七百五十亿,最敢砸钱的字节居然开始收费了!近日,月活三点四五亿用户的豆包宣布从六月起推出付费服务,从六十八到五百元三档订阅基础功能正常使用,但更高阶的 ai 能力开始明码标价。很多人第一反应是,连不那么 聪明的豆包都开始收费了,其他国产大模型还远吗?可问题是,中国 ai 不 能永远靠免费续命。过去三年,中国大模型卷的太狠了,模型卷参数、产品卷体 体验平台卷,月活烧光几千亿,却没赚到多少钱。每一次回答背后,芯片、服务器、电费和真金白银的算力成本都在熊熊燃烧。反观国外 openai 早就靠 chat gpt 订阅跑出百亿美元及收入,安 tropic 的 crow 也已经把商业化做成基本盘。也就是说,别人已经靠 ai 赚钱,我们还在靠烧钱续命。造 ai 不是 做公益,免费只能换来一时的用户。如果永远免费,行业就只能靠资本输血,靠平台补贴、靠发布会、讲故事等。国外 ai 靠真实现金流继续买芯片、建算力去模型,咱们只能在免费狂欢里被越甩越远。所以,豆包这次不是简单 向用户伸手要钱,而是在替国产 ai 扛一条商业造血的新路,把国产 ai 从免费聊天框真正推向生产力工具。未来大国竞争,拼的一定是 ai 和科技,当智能变成第一生产力,变现能力就是科技国力的一部分。从豆包宣布收费的那一刻起,中国 ai 的 青春期结束,今后能自己造血的 ai, 才配真正走上国际竞争牌桌。

卖 ai token 这门生意的毛利居然是百分之九十二,但比这个数字还要更可怕的是,网上教你做这个的博主,没有一个人把真正的风险讲出来。我花了三天时间全部拆了一遍,我把好处和坏处一次性都跟你讲透。先说现象,我们再来说好处啊。 咱们国内的大部分人,因为网络问题,没有办法用上 cloud chat gdp 这些先进的外国大模型, 但能用上的人,他就想了一个办法,我去 cloud 官网买一张月卡,然后把这里面的 token 组成一个大的 token 池,再把这些 token 分 批次地去卖给每一个需要的人。 举个例子啊,我购买了一张两百美元的 cloud 月卡,它可以使用的 token 额度按照官网的标准计价是两千四百美元。所以说百分之九十二就是这个事情的毛利率。我有了一个很大的 token 池之后啊,我就可以把 token 分 成很多份,然后卖给不同的消费者。消费者可以买到这个产品有两种形式, 一种是固定额度的 cloud token, 比如说十美元,第二种是一张月卡售价三百人民币,那你每天可以使用三十美元的 token。 好 处是普通人参与这个事情的方式有两种,第一种呢是当推广员,第二种呢是建立自己的 token 池。 推广员的意思呢,就是你只需要推广自己的专属链接,吸引更多的人通过你这个链接来下单 token 就 可以了。 至于说月卡的购买, token 池的构建,你完全不用担心参与。这个方式啊,也非常的简单,模型比较成熟,比较 正规的中转站都有自己的推广计划,你直接找到他们的负责人,说我要当你的推广员就可以了。第二种是构建自己的 token 池, token 的 计费, token 之间的动态协调,你只需要输入自己的 cloud 的 订阅链接就可以了。这件事情我推荐普通人先从第一种方式做起,再逐步的过渡到第二种方, 原因是因为第一种他是零成本的,你只需要负责销售好就行了,有客户就好了,你获得正反馈也非常的快。当你积累了足够多的客户,也就是说你的需求端稳定了,那你对你的服务稳定性会有更高的要求,这个时候你再把之前的利润投入到再生产才是划算的。你看好处我现在都讲完了, 接下来我们来讲一讲风险。第一个就是大部分人都大大低估了这个流量获取的难度,你只要做销售就好了。这句话听上去很简单,但是你不妨用买家的视角想一想,你现在正在上网,一个陌生人突然过来给你甩个链接,说从我这里买托管吧,你会怎么想?第二,官方封禁。 其实 cloud 官网它是根本不支持拼卡这种行为的,它也在积极的检测这种东西,一旦检测到,那么就是封号。这个时候如果你只是一个推广员,你只做了销售,那这个环节它就有天然的缺点,因为你无法控制上游,也就是让真正的中转站去解决封号的问题, 这会导致售后环节会消耗你大量的心神。所以这也就是我为什么建议普通人一定要从第一个阶段,也就是推广员逐步过渡到第二个阶段,建立自己的好池。现在的推广员中转站有非常多, 技术上也没有什么太大门槛,所以大家都在进行同质化的竞争,打价格战。价格低的客户也许会多一点,但是售后也很容易把你拖死。 所以说你要明白,客户最终关心的一定是服务的稳定性。当你有了自己的号池时,你可以多买几张约卡,即使一两张被封禁了,剩下的也足以支撑你所有的客户服务都不会下线。 只有你积累了足够多的客户和信任,你才能跳出同质化的竞争,打出自己想要的品牌。如果你想要了解更多关于 talk 的 信息,也可以点击我左下角的直播预约,我会在直播间更深度的和你聊一聊。

市面上有很多大模型, a p i 平台接口都差不多,模型列表也很花哨。在我看来,其中真正称得上运行在国产算力巅峰的平台,只有华为云的大模型及服务平台 mars, 也就是华为云的 ai token 服务。作为华为云 ai token 服务中的核心产品, 华为云 model r studio 把底层升腾算力,特别是当前国产算力技术巅峰 cloud metrics 三八四超节点,封装成按照 token 计费的服务, 让大模型像水电一样按量付费,随处调用。 ai 偷看到底有多重要?根据国家数据局统计,仅在二零二四年一月到二零二五年六月一年半的时间内,全国日军偷看消耗量提升了三百倍。 按照现在创投圈的说法,偷看用量多少已经成为衡量一个公司未来发展潜力的标尺。如果一家以 ai 为核心业务的初创公司,但 三日偷坑的消耗量可以达到十亿级别,就会被认为是非常有价值、有前景的公司,会成为未来的独角兽。让我们再回到具体的业务场景, 假如你是一个公司的 ai 架构师或者技术负责人,对于骂死平台的选择,其实真正在意的只有三件事,一、推理速度是否够快,以及能不能顶住高病发。二、运营是否安全可靠。三、面对复杂的国际形势,能不能确保业务的连续性。本期视频我们就从这三个点 深度拆解,体验一下华为云 mas。 先说性能,华为云 ai token 服务的高性能源于其从芯片、网络到框架的软硬协同与全站创新。华为云 ai token 服务全面接入了 cloud metrics 三八四超节点, 它是由三百八十四颗升腾 n p o 与一百九十二颗鲲鹏 c p o 组成的通过 metrix 令可高速网络构建出的超级 a f o 器。因为可以同时调度三百八十四张升腾 n p o, 所以 针对 m o e 这种在推理过程中要把任务路由到不同专家的稀疏大模型, 华为云就可以使用一卡一,专家推理时的通信占比大幅降低,可以并行处理和接纳更多的推理任务需求, 从而大幅提升推理吞吐量,并且降低推理的食盐,加上利用弹性内存以存强算,降低食盐 p d 分 离,把模型的执行流程分断并行,不再互卡,让更多的用户在使用大模型的时候享用速度变得更快。 华为云 ai token 服务通过软硬深度协调优化,使得推理速度达到了 h 二零等主流 gpu 性能的四倍,为业务提供了极致的性能体验。 接下来我们来做一个小实验,把 deepsea 的 官方 a p i 和华为云的 a p i 同时接入 cherry studio, 我 们来对比一下它们的速度。我们先把华为云的 ai token 服务接入 cherry studio 这里,来到模型服务,点击添加供应商类型,选择 open ai, 因为华为云提供的接口是兼容 open ai 的。 然后我们来到 model studio 的 模型广场, 这里我们都使用 deepsafe v 三点二,在右侧推理调用,这里有一个 api 地址,我们复制到 v 二这里,填写到 api 地址里面,点击添加模型,模型 id 填 deepsafe v 三点二,我们点击这里的 api k 管理,创建一个密钥,复制下来,保存好,填写到 cherry studio 里面,这样就配置完成。 我用同样的方式配置了 deepsea 的 官方 api, 还有火山引擎。我们先来试试 deepsea 的 官方 api, 我 询问他一个竖列的证明问题,我们看到 deepsea 的 官方 api 首次实言九百零二毫秒每秒输出三十 to 肯。接下来我们来测试火山引擎, 火山一秦首次食言一零四八,每秒输出三十三 token。 最后是华为云的 api, 华为云的首次食言只有六百四十四毫秒每秒输出三十七 token, 表现非常的好。根据我的测试,华为云应该是国内市场上 deepsea 大 模型推理性能最好的 mas 平台。 华为云已经在全国建立了三大业冷高密大规模 ai 数据中心,拥有百万张最领先的国产算力卡。对于 deepsea 模型,华为云可以提供单服务四万 r p m, 六百万 t p m 级别的推理能力, 这个量级已经足够撑起一个中大型应用的高峰流量。有一个案例是某个情感陪伴类的 app, 在 国庆期间业务暴涨了三十六倍,两次触发友商的限流。而在华为云这边实现了无缝切换,弹性扩容, r p m 从几百扩到几千,最终顺利扩容到几万,全面满足了流量需求。 华为云的 ai token 有 百万卡资源,完全可以满足更大规模的流量需求。你的共 供应商会不会变成你的竞争对手?这是技术选型中重要却容易被忽视的维度。现在很多云厂商的打法是一边卖算力和自家的闭源大模型,一边自己做一堆 to c 的 应用来抢占市场。如果你用了某大厂的闭源大模型,就得一边交钱用大模型, 同时因为业务需求,要联合大厂的团队去提升大模型的能力来满足自身的业务需求,然后还得一边提心吊胆。如果大模型厂商推出类似的应用,凭借流量优势蚕食掉你的市场,就变成了一边给对方付钱,一边被对方打。 华为云这边明确提出了不碰用户数据、不做流量应用、不抢客户生意的定位。不碰数据指的是华为云没有数据变现的业务, 也不用客户数据训练模型,格守业务边界,这对那些合规性要求极高的机构和团队来说,是一层非常重要的保障。而对于创业公司的保障是,华为云只做底座,不做流量业务应用 马斯平台主要跑的是开源大模型,本身也不做流量型业务,对于创业公司来说更像是基础设施盟友,而不用担心今天是供货商,明天变成竞品。更棒的是,如果做的是原生鸿蒙应用,还能在终端和流量侧拿到额外的生态支持。 在平台能力方面,华为云也设置了三道安全防线,基础设施安全,通过高可用服务架构、全链路实时多级告警, 全面保障了业务安全稳定、持续运行。平台安全,华为云 mas 提供统一的 i a m 身份认证、 api k 管理、访问审计、角色权限等功能,支持 ip 白名单等企业级的访问控制。内容安全,提供了文本加图片的多模态审核、敏感词过滤, 还有 prompt 提示词等多种攻击检测,拦截率百分之九十加,对于企业级的 ai 应用,供应链安全也是技术选型中的重要一环。作为国产自主创新的标杆,华为云全占自研的 ai 解决方案提供了一个高度确定性的技术底座。 无论国际形势如何变换,华为云都能确保 ai token 服务的稳定运行与业务连续性。这种确定性极大地降低了外部环境带来的风险,保障了我们在此之上的投入,能够长期持续地产生价值。 华为云 ai token 服务大力支持国产大模型,包括开源和闭源大模型,越来越多的国产大模型都在拥抱升腾生态。在华为云大模型及服务平台的模型广场,可以找到代码模型、文本生成、视频生成、图像理解、图片生成等各种能力的模型。新模型适配速度特别的快, 比如 deepsea 为三点二一开源,华为云当天就完成了适配和上架,越来越多的主流大模型都在主动适配升腾。 像是美团的大模型 longkit 发布之初便原生支持升腾,并且同步上架了华为云。华为云 ai token 服务已经变成了国产大模型的黑土地,各种优秀的 ai 模型都在这里生根发芽,茁壮成长,并且结出商业上的硕果。 本期视频我们从 ai 架构师的角度分析了华为云的大模型及服务平台 model art studio。 在 底层,他用升腾算力与 cloud metrics 超节点,将各类 sota 开元大模型的推理性能拉到国内的顶尖水平,并且放到模型广场里面提供统一的调用。在中间层,通过 m c p server、 drag agent、 garr 的 这些组建化的能力,把各种工具打包成一套应用底座。有了这些能力,我们在上层搭建业务的体验更像是组装积木,而不是一行行的扣代码。更关键的是,华为云在算力和模型之上又划出了一道很清晰的边界,不碰用户数据,不做流量应用, 抢客户生意。华为云 mark 更像是一块铺好的黑土地和一台企业级发动机,而远不止是一个只卖 a p i 的 模型。百货商场好,今天的视频就到这里,感谢大家,我们下期再见。