我经常被问一个问题,直接去官网买 apf 就 行了,为什么要多一层资源?聚合平台?这个问题背后有一个隐藏的假设,你只用一家的模型,但现实是没有哪一家模型能包打所有场景,写长文用这个,做代码用那个要便宜,选这家要快,选另一家。 真正把 ai 用起来的团队,手里同时跑着三家五家模型是常态。想象你在管一个装修工程,木工找一家,水电找一家,瓦工找一家,油漆工找一家,四支队伍四套报价,四种结算方式。哪天木工临时跑了,你那天的工期就断了。这些协调的事压在你身上,你还怎么管?项目本身 装修总包就是来干这件事的,你只跟一个人对接,他负责调度所有工种统一结算,出了问题他来扛,你省出来的精力拿去盯质量、管进度。 磁源聚合平台做的是同一件事,但真正的价值不只是省事,是三件事。第一,稳定性。你只接一家模型的 a p i, 它今天服务波动,你的业务就跟着停,今年头部模型都出过档期。聚合平台的价值在于, 一家模型出问题,立刻自动切到另一家,你的用户感知不到任何波动。就像装修总包的木工,临时缺货,它当天就能从备用供应商调材料,工期不耽误。第二,最优匹配。没有人有时间把十几家模型一个个测完再做决策。 聚合平台根据任务类型自动匹配最合适的模型,速度优先走这家,成本优先走那家,精度要求高再换一家。这个判断你自己做要花大量时间,平台帮你做,只需要一个配置。 第三,账目可控,对接五家模型,就要管五套后台,五份账单,五种计费逻辑。聚合平台,用一个面板把所有消耗汇总,每笔 token 花在哪里,花了多少,哪个团队花的清清楚楚。 规模一大,这个账目管理的价值比省钱更实在。有人会说,我自己对接也不是不行,对,能做。但有一件事值得想清楚,你创业是来干什么的?是来对接模型 a p i 的, 还是来做产品,做客户?做业务的?装修项目可以自己当包工头,满北京找木工,找水电 找得到,但你的时间和精力是有限的,花在这上面的每一个小时,都是从核心业务上拿走的。资源聚合平台不是多余的中间商,是让你把精力放在值钱的世上的前提条件。我是牧野,深耕算力与资源赛道,专注分享行业干货,咱们下期再见!
粉丝138获赞324

最近很多人都听说过,但是可能大部分人都没有完全搞明白的一个东西,就是 api 中转站,你可能听别人说他很便宜,也可能听别人说他很赚钱,甚至还有人说普通人也可以做这样一个生意。 但在决定你要不要买,要不要用,甚至要不要入局之前,得先把它搞明白,它到底是什么,它的钱从哪里来?风险到底在哪里。 ok, 大家好,我是 fred, 专注帮普通小白从零到一去学习 ai 和 bug 定,去提升自己的工作和生活效率。 我们先来聊就是 api 中转站为什么会火啊?其实它火的一个本质的原因是需求变大的,就因为现在像 cloud code 或者 codex 或者 open cloud 那 工具一旦真的帮你去写代码,改文件、跑任务, token 消耗会比普通聊天快非常多。 可官方的 a p i 对 于很多小白来说又会有门槛。如果你要自己去做呃订阅账号呢?他又不会不够顺手,包括有些代理网络的问题。所以说中转站抓的就是这样的一个空档,把充值接口包括模型的选择都打包成了一个更省事的入口。 嗯,这里面先要分清楚的一点啊,就是这三个的区别,订阅 api 和众转站。首先订阅是什么?就像会员,你可以买去 gpt 等这类的服务,有些官方工具也可以订,能够登录订阅账号来用它的一些呃 koine 的 一些 呃工具,但它通常有套餐,有额度,有时间的窗口,或者说一些频率的限制。而 a p i 的 话,是给到工具和程序去调用模型的接口,一般按照实际的用量去 k 扣费。 而中转站呢,这则是你和 a p i 中间又加了一层第三方,他给了你一个入口和一个余额的系统背后再帮你转到可能不同的上游。好处是省事儿,代价是你需要多信任一个中间的一个人。 而中转站转的也不是一些什么神秘的资源啊,而就是请求。你可以想象,你在工具里面去发任务请求先到中转站,中转站看到你的屁 余额模型选择,再转给上游的模型,模型生成结果之后,再通过中转站返回给你你的工具。所以说,多了这一层,不只是多了一个地址,而是多了账单、日制模型来源和整体的一个数据流向。 他中转站赚钱啊,就不只是赚 tiktok 的 差价,他可以拿,比如低价拿一些额度,然后再按量去卖,卖给用户。也可以让比如用户去呃预付款,然后形成现金流, 还可以去卖一些套餐,因为很多人可能买呢,但是不用就有点类似,比如说健身房这种感觉啊。更长期的做法可能是卖这种企业的服务,比如说统一的账单权限、审计稳定性和售后。 所以真正能够长期做的,往往不是单纯的去倒卖 api token, 而是把支付账单模型和服务都打包在一起。 但你要注意的就是特别夸张,这种暴利往往不是来源于最正规的那种部分啊。如果一个站又便宜又满血又不限量,又说不清楚来源,就不能够只理解成这是优惠, 他可能用的订阅号赠送额度或者低价的渠道,也可能是前台写的是这种 很强的模型,比如说四点七,但后台可能给你换了一个国产的模型,还有可能通过倍率上下文和输入输出的价格重新去包装,让你以为省钱。再往后其实就是一些 数据和日制的问题,就你的 prompt, 你 的代码,你的文件,有没有被这个中转站所保存,谁能够看到?说不清,我觉得就是风险。 现在很多人在教你,会告诉你说,哎,中转站很赚钱,你可以做代理啊,你可以卖系统啊,你也可以做代件啊。我想我建议大家一定一定要冷静啊,就是但凡真正稳定赚钱,风险又小的生意,还能够通过短视频完整的送到你面前吗? 大家想一想对吧?如果到处都在讲这个机会,很可能说明他已经没有那么好赚钱了,或者是上游需要更多的下游代理和客户来消耗他的额度 啊。普通人进去之后往往接到的往往不是核心的利润,而是获客、客服退款、解释,甚至是背锅你,你想一想,上游封号用户找你, 比如模型不稳,用户骂你,对吧?余额退不了,售后也在你这里,所以说这个生意不是说不能做,而是绝对不能够买套系统,你就能够躺着就赚钱,对吧? 我们再来聊一聊,就是我们普通用户到底能不能用,我觉得可以啊,就,但是要分场景,就如果你是一些低风险的试测试啊,你可以小额充值,包括你自己没用过,你去跑一些不敏感的任务, 尝试一下 ai 或者 webcoing 所带来的这种提效,我觉得完全可以去尝试,但是不要一上来就去大额充值,也不要把一些长期的工作流绑到一个小的呃,中转站上面, 你至少要问清楚说,哎,它的便宜到底从哪里来的对吧?这种模型到底能不能验证?哎?账单的倍率能不能看到问题啊?然后出了问题谁负责?余额到底能不能马上换走? 另外呢,我觉得有几类场景,就不要随便去走一些不明的中转啊,比如说公司的代码,客户的资料, 对吧?合同的报价,包括这种私有的文件,还有能读文件或者跑命令的。这种 a 镜的工具啊,我觉得都要谨慎,因为这类工具不只是聊天,它可能真的会读取项目,修改文件,调用环境。包括说你自己的 api key 啊, 就能限额就限额,能能换就能换,能看用量就看用量,不要走这种不明的中转, ok, 最后记住一句话,就是 a p i 中转转不是单纯的便宜接口,它是支付账号模型 啊,包括账单和信任的。整一个生意,你的低风险你可以小额去试一试,但长期的工作也不要被低价去绑定。如果你想要做这门生意,也不要只看利润,你还要看售后退款稳定性和信用的问题。 ok, 我是 fred, 我 们下期继续给大家猜怎么把 ai 放到你实际的工作流,我们下期再见。

卖投肯做一篇分发,到底能不能赚钱?已经消耗过千亿,投肯封了几十万个账号,实打实的在这个行业的经验告诉你答案,肯定能赚钱啊,甚至一天可以赚几万,一个月可以赚几十万,但是他适合一个普通人吗? 事实上,绝大部分人根本不可能靠卖投肯赚到钱。多人被网上的暴富神话洗脑了。记住一句话,再好的生意,他本质还是一个生意,不是捡钱。 现在投垦市场,整个行业极其内卷,想要做好这门生意,还是需要具备一条件,以下五个核心条件,只要你符合其中的一点,这碗饭你就可以吃。大家可以对照看一下,自己到底能符合几点。 第一点,有足够强的一手渠道,打一个信息差和时间差,这是最粗暴的赚钱方式。比如当下爆火的 cds 二点零, 如果你能在他刚刚出来的时候,全网都在找借口的时候,甚至首月供不应求的时候,快速拿到极低折扣的内部价格或者代理渠道啊。在别人还在找门路的时候,你手里有货,拿到渠道就等于拿到了印钞机。第二点,自带天然的产业资源, 这属于圈层的降维变现。如果你本身所处的行业就有海量的 ai 需求,那你根本就不需要去卷价格,也不需要再去找客户 啊。比如你本身在这个电商圈已经摸爬滚打了很多年,身边全是做跨境出海搞短视频带货啊的老板,他们一天跑几千个商品切片,跑几万条产品图或者产品视频, 那么他们的 a p i 消耗量就是一个天文数字,或者眼下爆火的 ai 漫剧啊,有大量的生图或者生视频的这样的一些需求,你当朋友抱怨没有稳定接口的时候,你顺手丢一个过去,就帮他们解决了痛点,自己也赚到了极其稳定的利润。 第三点,如果你本身就在做流量啊,拥有极强的获客能力或者投流的能力,你本身就是懂流量生意的高手,懂买量,懂做爆款,懂私域运营。那么在大家提供 token 的 服务和价格都大差不差的情况下,你的获客成本只有别人的啊,一半或者 百分之二十,甚至百分之十,你能用最高效最低成本的方式触达到海量有需求的客户,靠规模效应直接碾压同行。第四点,你具备 开发 agent 将 token 巨像化的到一个服务里面的这样一个能力啊,把标准化的 token 服务做成非标的溢价啊,把低毛利的生意做成高毛利的 一个生意,同样是卖生图模型,同样是卖生视频模型,别人是按次卖接口啊,两毛一次,五毛一次,一块钱一次。而你是根据特定固定的场景,比如苍蝇老板生成菜品图,电商老板做主图啊,电商老板做详情图,封装成一个傻瓜式的工作流啊,别人卖五毛,你可以卖两块, 你可以让老板们一次就能成功,或者两次就成功,让老板们跳过了反复学习,反复测试的这样一个过程啊,一个美工一个月的佣人成本啊,七八千,八九千,但是你通过一个工作流啊,能让老板原本 五个美工才能干完的事情,一个美工就可以操作你的工作流去实现的啊,一个月能帮老板省几万块钱的这样一个一个成本,那么你就拥有了核心竞争力。第五点 也是拥有顶尖的底层技术能力,这个路线比较高危,也比较硬核,这个属于很敏感的一种方式,属于纯纯的技术套利,主要是针对像 cloud gpt 这种风控,比起 很严格,然后又是全球主流的应用量很大的这样一些模型。如果你懂底层的协议意向,能搞定复杂的风控绕过,以及拥有维护高病发耗磁的技术实力, 相当于你就能用极低成本的方式把散户的号源整合成企业级的接口,这其中的利润空间极大,同时也是门槛最高,风险最大的一种方式。

往期视频已经教过大家如何搭建中转站,今天教大家如何让中转站调用你想用的大模型。直接开始这里修改完信息提交就可以了。接着在渠道界面添加新的渠道类型,大家可以按需选择 添加一个名称,分组保留 default 就 可以删掉不需要的模型,我只保留了两个密钥。这里我们去阿里云百链获取一下右上角控制台,点击 api key, 右上角创建, 这时候我们就拿到了自己的 api key, 直接复制粘贴到后台的密钥里,渠道就配置好啦。 再点击上方令牌,添加新的令牌,输入名称,注意这里过期时间要选择永不过期,并且额度留空, 再次点击令牌就可以看到啦。我们再回到渠道里测试一下,有响应时间就说明我们的大模型已经接入到自己的中转站啦,还不会搭建中转站的可以观看我的往期视频哦,拜拜!

你们是不是每个月都为 api 账单感到肉疼?但是啊,偷看还是不够用,一不小心啊,超量还会被自动扣费百分之九十九的人啊!不知道, 官方啊,正在免费发放永久的 api k, 支持 tipsy、 v 四 pro、 智浦、五点一,还有十几个最新大模型随便调用,不用绑信用卡,不用充值。重点是啊,流程特别简单,小白也能搞定。 我们打开官方网站,点击右上角的 log in 进行注册。我这里已经注册过了啊,直接登录即可。然后点击头像,找到 api case, 点击创建 api k, 输入一个名字,然后选择到期时间,我们可以选择永久有效。然后我们把 api k 复制到一个方便我们一会儿可以使用的地方。然后我们来到 excel 页面, 随便找一个模型,来找到模型的 face url, 这里边有非常多的模型都可以使用, devic, 智普这些热门大模型基本上都能直接调用。 然后我们可以将这些信息配置到我们的 agent 里边。以我用的 hermes 为例,我安装了这个 hermes web ui, 这样我们直接可以在窗口进行配置,不需要使用复杂的命令。行了 输入命令,打开我们的 hermes webui, 在 左边找到模型选项,选择添加 provider, 选自定义,然后将我们得到的 face url 和 api k 填进去, 点击获取。如果里边显示有模型,那证明我们已经连接成功了,里边有大量的热门模型可以选择,然后点击添加,就能配置完成了,然后我们就可以开心地使用了。 关注我,我是老李专发工具里的硬核干货,推荐真正好用的效率神器,点个关注!

哈喽大家好,欢迎来到信息的视频。那今天给大家介绍一个宝藏开元项目,那这个项目呢?还真的是有点难崩。为什么这么说呢?因为奸商看到他呢,绝对会眼前一亮,满眼都是暴力, 感觉韭菜都快隔着屏幕长到他家去了。那另一边呢?如果是心没那么黑的小白用户,你也可以靠着他狂薅大场的羊毛,当然只要你心不是太黑,靠着他撑起一个挣钱的副业,那是完全没有问题。 那接上的黑幕呢?我们放到视频的后面再给大家讲,我们先来看一下对于普通用户来说到底有什么好处。我相信如果大家接触过一段时间这种相关的 ai ai 阵的工具了之后呢,就会发现,质疑你最终场景落地效果的其实就是那个模型的能力。 有的时候顶级模型大家又觉得太贵,然后就会去网上去搜各种各样的打折优惠薅羊毛的这种信息。因为各家的这个战略和节奏的不同呢,所以它的各种优惠程度和时间周期都不一样。你本地又装了各种各样不同的工具,有可能你是 codex, open claw, claw code, 然后又有这个 co worker 等等一系列的购单工具。一旦你当前用的这家供应商活动结束了,然后你想换到另外一家,换完之后你又得把所有的 api 配置全部都改一遍,非常繁琐。 我自己也有类似的感受,那每到这种时候,我就会在想,如果有一个工具能够让我把所有 api key 的 配置全部都收拢到一起,做一个集中的代理,这样的话,我的各个 ai 工具都只需要配置这一个代理工具就可以,以后如果有新的供应商 api key, 那 我只需要接入到这个代理里面就可以。 今天给大家介绍的正是这样一个开源项目,它叫 new api, 它能够实现呢就是把上游所有模型渠道的 api key 全部都收拢到一起,让大家进行统一的配置和管理。这样的话,作为新手小白,你可能各家都能够薅到一些新用户的羊毛。如果你想 ai 搞钱做副业的话, 你就可以打造自己的 token 池子,然后转卖给下游的用户来挣钱。那你的利润主要来源三个维度,第一呢就是批量 token 采购的一个折扣, 这个后面会提到。第二个就是你可以把新用户的免费额度呢融合进付费的套餐。那第三个呢,就是考同一个模型,不同供应商之间的一个折扣差异。实际的场景下,大家可以结合这个性能,供应商的稳定性,它的报价,整体的服务质量 各方面去进行一个综合评定,来维护你的模型托肯池子,你的最终目的呢,就是在留住用户的这个前提下,尽可能提高你的利润空间。好呢,先给大家看一下演示啊,这个项目到底怎么去搭建和配置? 首先带大家来看一下这个项目的 get up 首页安装的过程呢,其实也非常简单,它需要一个 dog 的 环境来部署,大家把代码呢克隆到本地之后,确保你的 dog 引擎和 dog compose 都已经正确的安装和设置好,配置文件改好了之后,直接运行 dog compose on 就 可以启动了,其实非常简单,然后再带大家看一下这个 new api 的 配置文件哈, 这里面其实大多数配置如果你是本地使用的话,不改也没有什么问题。唯一需要注意的是,关于这个流逝的响应模式超时这个的话呢,建议大家稍微配的大一点,因为配置的过小的话,有可能会出现流逝响应的时候中断的问题啊。再往下呢,它底层是依赖了 res 和一个关系数据库啊,它默认的是 posgrid 啊, posgrid 的 这个密码大家最好改一下在这个地方。 然后最后一点需要注意的就是它的这个端口号,这里大家选一个没有被占用的就可以,等一下服务启动起来之后呢,你要用它来访问网页的控制台啊。那配置好了之后呢,大家只需要进入你暴露的这个端口号啊,就会看到这样的一个触手的一个界面, 直接点击下一步,然后把用户名密码填一下,然后这里呢可以设置对外服务的模式,如果你想要对外提供多租户的商业化服务,拿这个挣钱的话就选这个, 如果你是自己本地使用的话,就用这个。选好了之后呢,点击这个出纸化系统好,过了一会他就出纸化好了,大家看到这个就是你的一个入口网关,如果你是对外提供服务的话呢,你应该去注册一个公网的域名,然后把这里呢通过配置文件改成你的这个正式域名, 接下来你点击这个获取密钥好,他会调整到你的控制面板。大家看到因为我是按照外部服务商的模式来出纸化的,所以这其实是一个多租户的模式, 包括你的调用量、数据看板,你 a p i token 的 管理,每个用户都可以拥有自己的 token, 内部直接继承了邀请、奖励和兑换码这种 营销的模式,也就是如果你想要运营一个中转商的话,你可以用这种模式来发展你的用户,让他帮你们去做营销宣传。你订阅的模式其实也是非常的丰富的,你可以去自己新建套餐,如果我是一个 a p i 中转商的话,我可以给我的用户定制一个属于他们的套餐, 比如说我建一个 pro 套餐,一个月是二十块吧,一种是美金,然后你可以设置购买上限,有效的单位重置周期啊,都是可以的。渠道管理这里呢就可以定义你的 token 的 来源,不管你是个人用户还是服务商,可以通过这里添加 api token 的 一个来源。大家看到这里,其实常见的供应商都是支持的, openai、 astropic、 aws, vertex, 包括国内的一些大模型全部都支持啊,包括 openai 的 这个 os 模式它也是支持的,即使有些小众的模型它没有支持,那一般情况下呢,那些模型它也都会提供 openai 或者 astropik 兼容的这种 api 模式啊,你也可以用这两个 直接去配置,也是 ok 的。 填好之后呢,你把对应的 api key 放在这里啊,注意这里的 api key 呢,不是发给你的用户的 api key, 而是你从上游购买的时候,那个上游服务商给你的 api key, 大家一定要分清楚啊, 然后在这个令牌管理这里呢,才是给你自己或者说你的下游用户他们去添加 apikey 的 地方,让大家看到你还可以给你的 apikey 去设置额度啊,设置模型的访问限制, ip 的 白名单啊,都是可以的啊,因为如果你是服务商的话,你有可能被你的下游用户去薅羊毛,那如何去规避这种情况 啊?然后在系统设置里面,你可以去做很多局的这种管控,来控制你的用户怎么样去使用这些模型啊?这个是性能的这个限制,这个是模型部署。对小白用户来讲,其他的这些系统设置大家都不需要操心啊,只需要去看这里。一个是渠道管理, 用来接入上游的一些供应商啊,不管你想薅哪一家的羊毛,哪家有免费的额度,你都可以去那边注册账号,然后在这边去添加就可以。然后这里给大家看一下他的这个高级设置。这里面啊还可以去设置一些 这个默认的参数,比如说你有一些系统提示词,你有一些这个 prompt catch 的 一些这种参数的启动,你都可以在这里直接去改这个请求头,参照官方的这个配置文档去改就可以了,包括系统提示词,你也可以直接覆盖,这个就是在 api 的 维度去配置了,相当于只要你调这个接口,它就会默认的把这个系统提示词改掉。 除了聊天的这个 check completion 之外呢,它还能支持音频、 embedding, 图像、视频甚至 revamped 的 模型啊,它都是有的, 也就是说基本上你对 ai 大 模型的所有类型的模型需求,都可以通过这一套框架在你自己的本地把 apikey 的 配置收拢起来,如果你自己想做 token 的 渠道商的话呢,那你完全可以用这个东西搭一套自己的管理后台。就有点像大家以前去做 vpn 搭梯子的时候用的那一套东西, ituray 啊, smartbox 等等这些。过去是做这个网络流量的生意,那现在到了 ai 的 时代,它就变成了做 token 的 生意,其实本质上是一套东西,大家把模型的渠道商配置好了之后呢,就可以实际的开始使用了,这个是它的官方文档,大家只需要把这里的域名改成你自己的域名啊,或者你的 ip 就 可以了。也就说不管你本地是什么样的客户端 啊,你是 openclaw, 你 是 clawco 还是什么其他的系统,那你都可以通过这一套模式在配置的时候用一个统一的地址去配。 那以后如果你有任何的新的渠道商的接入啊,或者你想要切换一个渠道商,那你需要回到那个管理控制台,然后在这个模型管理里面去做切换就可以。甚至对于同一个模型,你都可以换不同的供应商。比如说你在模型这里配了一个 cloud office, 然后供应商这里呢,你可以随时切换。你之前是 astropopy, 那 后续如果你觉得 a w s 或者 anti gravity 有更好的这个折扣和 deal, 那 你可以随时在这里改 cloco, openclaw 这些应用的配置完全不需要动。然后再给大家看一下模型部署这个地方,它的模型部署呢,是依赖了 i o dot net 这样的一个平台,带大家过去看一下 这个 i o dot net 呢,其实就是一个算力的供应商,大家可以把它列入成 a w s 啊,谷歌,只不过它专门是来提供 g p u 相关的这个算力的, 它并不像传统云浮供应商产品体积那么完整,而是专注在 gpu 的 这一块。大家看你可以在上面去直接买 he 版、 a 版这些英伟达的顶级的算力卡,直接去部署那些满血的模型,也就是说它从拓客的供应商呢,相对来说是非常全面。像这种 gpu 算力的供应商 啊,你可以直接采购 h 一 百 a 一 百的卡,然后回到渠道管理里面,你可以去依赖大模型的官方 api, 你 也可以去依赖云服务供应商。 而且像 a w s 谷歌这些呢,它们也有云端的这个 g p o 的 讯息机,比如说你直接在 a w s 上买了一个 a e 版的讯息机,然后在上面部署一个大模型,通过 open i a p i 兼容的这种方式也可以集成到这里面。然后大家看到这里还有欧拉嘛,比如你自己本地有个五零九零, 我上次一期视频给大家看过那个巴卡的魔改五零九零,那如果你是这样的用户的话,自己本地部署好了之后,用欧拉玛把这个巴卡的五零九零工装成一个模型, api 也可以在这里提供出来,大家看到它的选择还是相当丰富的 啊。刚才给大家讲了,普通的小白用户怎么样靠这个开源项目来提升自己 ai 工具使用的一个效率,来薅各种大厂的羊毛。那接下来我们黑化一下,来聊一下从奸商的这个事情 怎么样靠这些东西割韭菜赚取暴利?当然这里并不是鼓励大家去这样做啊,因为但凡有灰色利润的地方,他就会有一些政策和法律风险,大家就纯粹从用户的视角去看一下,尽量避免让自己踩到这种黑心的 api token 终端。商其实工具是同一套, 那这帮奸商为了攥取利润,势必就需要从各种不同的方向去压缩他的这个成本。这里给大家列一下,比如说他们会通过一些公网扫描的这些黑客的脚本去 扫那些有安全漏洞的 a 证网关。尤其是最近 openclaw 大 火了之后,有大量没有安全意识的用户,其实是把自己的 openclaw 网关直接开放在公网上, 而且也没有任何的 open 加密,那这些用户就极易被这些黑客脚本扫到,从而导致自己的 api key 泄露出去。 而且刚才给大家展示管理控制台的时候应该也已经看到了,他其实可以非常精细的去调整每一个账号,每一个模型供应商他的用量和额度。假如说我通过黑客脚本把你的 ip 抓过来,那我就是为了不让你发现,我可以把占用你额度的这个量调的非常低, 只要我拿到的这些泄露 a p i p 的 数量足够多,那其实所有的用户都在隐形的给我输血,而这些用户他有可能完全感知不到。那第二个呢,就是通过隐形的去压榨剩余的投肯,比如说他在卖给他的下游用户的时候,我声称给你 一周一百万的投肯,但实际呢,在你的用量达到比如说九十万甚至更低八十五万的时候,我就告诉你,哎,额度受限,你已经用完了,他就在赌大多数的用户不会做精细的投肯数量统计。 再有一个呢,就是他们会用大量虚拟的这个手机卡去注册各个大模型平台的一个免费账号,然后把这些免费的额度全部都薅一遍,因为虚拟卡它可以无限注册嘛,用完了,一波免费洋房薅完了,那我再注册一堆虚拟卡,如此网富。 那再接下来呢,是一种相对合规的操作吧,就是通过批量购买账号的方式,因为各家当你的账号购买额度购买的这个量大到一定程度的时候,都会有一些企业级折扣的。我通过注册公司账号,联系各家大国型供应商的企业服务的销售团队,然后让他们给我打折。 各个大国型供应商,他们的区域授权团队,为了获客,他们都有一定的折扣空间,那么这个空间也是我的潜在地。 那最后就是你更黑心的一点,那他们就会按比例直接去掺那些低智商低价格的模型,比如说我卖给你是 pro opus 四点六,那实际上我会在里面掺一定比例的海库,甚至更低尺子的模型,他们掺假的这个量呢,也会动态的调整,一边让你感觉不到, 同时另一边呢,它的利润也能最大化。希望这个工具可以提高大家使用 ai 服务的一个效率,然后同时避免遇到一些黑心的投坑中转商。 想要创业的朋友呢,也能在里面看到一些搞钱的机会。好,那今天的视频就这些,如果你觉得这期视频对你有用,欢迎点赞、评论、转发,那我们下期视频见。

很多人买了 token 套餐之后,最大的困惑就是,这玩意儿到底怎么用?甚至很多人以为 token 就是 聊天次数,其实完全不是。今天我用最简单的话给你讲清楚, 现在所有大模型 token 基本只有两种使用方式,第一种,普通人使用,第二种,开发者使用。 先说第一种,也是大部分人现在正在用的方式,就是通过网页 app 直接和 ai 对 话。比如 deepsea、 豆包元宝,你输入一句话, ai 给你回答,你写方案,查资料,生成 ppt, 做表格、翻译文档, 这些动作本质上都在消耗 token。 很多人其实每天都在用 token, 只是自己不知道。比如你问,帮我查一下 ai 行业趋势,消耗可能不高,但如果你说,请深度研究中国 ai, 抠定行业的发展趋势, 结合最新资讯,生成一份包含市场变化、商业机会、行业风险的研究报告。 这时候 token 消耗立刻就会上升。因为 ai 需要读取更多上下文,进行更复杂的推理, 生成更长内容。所以你会发现, token 本质上不是聊天次数,而是 ai 算力,你让 ai 干的活儿越复杂,它消耗越多。但问题来了,为什么有的人 token 特别耐用,有的人却几天就烧完? 核心原因就一句话,很多人不会提需求。比如很多人只会说,帮我生成一个报告, 这种方式效率最低。 ai 不知道你的行业,不知道你的目标,也不知道你到底想解决什么问题, 于是只能生成一堆泛泛而谈的内容,然后你继续修改,继续重来, token 就 在反复试错里浪费掉了。真正高效的人怎么做,他们会一次性把需求说清楚。比如,你是一位 ai 产业分析师, 目标读者是软件公司老板,请结合最新行业趋势,输出一份关于 ai coding 商业机会的深度研究报告,重点分析未来三年的变化,你会发现 ai 质量立刻提升, 因为你减少了大量反攻。这就是普通人最核心的 token 使用技巧。接下来第二种玩法来了,也是未来最重要的一种 api 调用。 很多人觉得 a p i 很 复杂,其实你可以简单理解成让软件自动调用 ai, 比如客服系统自动回复用户、 ms 系统自动分析生产异常、 e r p 自动生成经营报告、 震动监测系统自动生成故障分析。这些背后本质上都在调用大模型 a p i, 而每一次调用都在消耗 token, 这时候使用 token 的 已经不是人,而是系统。所以未来会发生一个巨大的变化,以前是人使用软件, 未来可能变成软件调用 ai。 这也是为什么现在越来越多软件公司开始研究 token 经济, 因为未来的软件很可能不再按功能收费,而是按 ai 调用量收费。最后总结一下, token 的 使用方式其实只有两种,第一种,人直接使用 ai, 通过网页 app 对 话。第二种,系统自动使用 ai, 通过 a p i 接入业务流程。前者提升个人效率,后者改变整个行业。而真正巨大的机会恰恰在第二种。

大家好,欢迎来到今天的分享。在二零二六年,大语言模型已经成为驱动创新的核心引擎,但如何选择合适的计费模式,直接决定了我们项目的成本和扩展性。今天我们将深入剖析按流量计费与套餐计费的核心区别,并为您提供最新的模型选型与成本优化指南。 本次分享将分为四个部分,首先我们会解析两种核心的计费模式,接着通过深度对比和决策模型,帮助大家找到最适合自己的方案。然后我们会介绍二零二六年值得关注的主流模型。最后,分享一些实用的成本优化技巧。 在深入探讨计费模式之前,我们必须先理解一个核心概念, token。 简单来说, token 就是 ai 模型处理信息的最小单位,你可以把它想象成文字的原子。我们输入的每一个字,模型输出的每一句话,都会被拆分成 token 来计算费用。特别要注意的是,模型生成内容的成本远高于理解内容, 所以输出托根的价格通常更贵。第一种计费模式是按流量计费,就像我们用自来水一样,用多少水付多少钱。它的优点是灵活启动成本低,非常适合项目刚开始的时候。但缺点也很明显,单价最高,而且当你的用量突然变大时,账单可能会让你大吃一惊。 第二种是套餐计费,更适合企业用户,它主要分两种,一种是席位订阅,就像买会员,先付一笔固定费用,获得高级权限,然后再按用量付费。另一种是预留吞吐量,你可以把它理解为包下一条专用高速公路, 保证你随时都有稳定快速的服务,但需要预付费用。为了更直观的理解这三种模式,我们来看这个对比矩阵。从成本结构、可预测性、单价灵活性等多个维度进行比较。可以看到,按流量计费最灵活,但成本不可控。预留吞吐量成本最低且性能最好,但前期投入大且不灵活。 习未订阅则介于两者之间,是成长型业务的平衡之选。那么,到底什么时候该从按量计费转向套餐呢?这里有个成本效益平衡点公式, 简单来说,就是计算出一个 token 使用量的临界点,当你的月用量超过这个点,套餐就更划算。反之,按量计费更经济。比如这个例子,月用量超过二十亿, token 套餐才开始显现优势。 为了让决策更简单,我们可以遵循这个流程图。首先看你的业务阶段,如果是初创期,果断选择按流量计费。如果业务已经规模化,再看用量是否稳定。如果对延迟要求极高,就选预留吞吐量。 如果需要企业级安全管理,就选习卫。订阅这个疗程图可以帮助大家快速找到自己的最佳路径。了解了计费模式,我们再来看看二零二六年市面上有哪些主流模型。 这张页面汇总了各大厂商的旗舰和自旗舰模型,包括它们的性能、评分、价格和核心优势。可以看到, clogs 四点七在推理能力上目前处于行业顶尖水平,适合处理复杂逻辑任务。 而 gpt 五点四则凭借其完善的生态系统和 api 集成能力,依然是企业级应用的首选。 同时,像通用千万 max 和 g p t 四 o mini 这样的模型在保持不错性能的同时,拥有极高的性价比,适合大规模业务部署。而拉玛四在 grok 的 支持下提供了极致的速度体验。那么到底哪个好用呢?这不仅仅是性能问题,我们从开发者体验、可信和社区支持三个维度来评估。 open i 的 文档和社区支持最好能让你快速上手。 astropica 的 可信行业领先,适合企业级应用, google 在 多模态方面又是明显, 而 gork 和 mr 则以其独特的优势在特定场景下表现出色。为了让大家更方便的选择,我们按场景进行了推荐。如果你需要写复杂代码,首选 cloud 四点七。如果是做通用聊天机器人 gpt, 五点四是全能选手处理长文档 gemna 二点五, flash 的 超长上下文式优势。而对于需要极速响应的实时应用, gork 上的 luma 四是最佳选择。 每个场景我们都给出了首选和性价比替代方案。最后我们来谈谈如何省钱成本优化的第一步是优化模型选择,不要用大炮打轮子,简单的任务用便宜的模型就够了。同时也要学会优化你的 prompt, 让指令更简洁。要求模型输出结构化内容,并限制他的回答长度,这些都能直接减少投屏消耗。更进一步的优化可以利用平台提供的高级功能,比如上下文缓存。对于重复使用的固定内容,可以节省百分之九十的成本。对于非实时任务,使用批量处理功能可以享受半价优惠。 在架构层面,构建一个多提供商的智能路由系统,是实现成本与性能最佳平衡的终极方案。我的分享到此结束,希望能帮助大家更好的理解大语言模型的计费模式,并做出明智的选择。感谢大家点赞支持!

今天我们聊一个在 ai 圈持续升温,目前还是蓝海的赚钱赛道。 token 进口,也叫 api 中转站,简单说,它做的是一件进口生意,把国外顶级 ai 大 模型的使用额度 token 通过中转渠道销售给国内的个人开发者和企业用户, 目前入局的人已经不少,但市场需求增速更快,风口依然存在。需求的根源在于一批桌面级 ai 应用的集中爆发。不同于我们平时用的豆包、文心这类对话软件, 桌面级 ai 应用能够直接操控你的电脑,帮你写代码、剪辑视频、分析财务报表,甚至自动下单交易。代表产品包括 cursor ai 编程助手 cloud code、 anthropic 出品的代码智能体、 open ai 的 桌面版 operator, 以及各类基于 api 的 自动化工作流工具。当 ai 从聊天玩具升级为真正帮你干活的员工, token 的 消耗量就呈指数级上升, 你雇了员工就得付工资,而 ai 的 工资就是 token。 国内大模型价格确实很便宜, 但综合能力上目前仍相当于本科水平,能处理日常任务,性价比高,但在复杂推理、深度代码生成、多步骤任务协助上,跟国际顶级模型仍有差距。 g p t 四 o cloud three point five、 sonic gemini ultra 这些则是毫无疑问的硕士级选手。 以 cloud code 为例,每百万 token 的 独取成本约五美元,折合三十五元人民币,重度使用一天轻松超过一百美元,比雇一个兼职人工还贵 贵,但个人开发者和企业端依然愿意付,因为效率是人力的数十倍。于是问题出现了,国内用户想用顶级模型,但面临三道门槛,没有支付途径,没办法上网,不熟悉注册流程。 这道门槛就是 token 进口生意存在的核心理由。然后我们说说这门生意的三层结构。第一层,资源供应方提供低价 token 额度。资源方获取低价额度的主要方式有以下几种, 一、抛企业扶持项目羊毛。例如微软 azure for startups 会向初创公司赠送数万美元的免费额度,有渠道的人注册空壳公司即可获取。 二、账号轮转策略,同一账号的免费或低价位度每隔一定时间重置,通过管理大量账号,实现持续的额度轮换供给。 三、不合规渠道,包括利用一些漏洞刷取免费额度等方式,存在明显的合规风险。第二层,中转服务商搭建 api 中转站,将上游的低价偷看,通过技术手段封装成标准 api 接口,对外提供接近官方体验但价格更低的调用服务。 类似于早年海外代购的逻辑,正品渠道加价格,挖地加本地化服务。第三层,终端用户、个人开发者、企业客户通过购买中转 token, 以更低成本调用国际顶级模型,用于编程、辅助、内容创作、数据分析、自动化工作流等场景。 中转站有哪几种主要变现方式呢?变现方式一,价差销售。在闲鱼、小红书等平台, cloud code max 会员官方售价约一千四百元人民币,而中转渠道的报价往往在七百到九百元左右,资源方成本可能仅需数十至百余元,薄利多销,走量为主。 变现方式二,数据变现风险最高。用户在与桌面级 ai 交互时,会产生大量真实的 prompt 数据和业务信息,这些数据对国内大模型训练公司极具价值。 数据越真实,越贴近真实业务场景,售价越高,部分中转站会在用户不知情的情况下将这些数据打包出售。变现方式三,偷换模型,黑心操作 对外宣传提供 gpt 四 o 或 club 三点七等旗舰模型,实际调用时悄悄替换为性能较弱的上一代次旗舰,节省成本。用户通常难以通过使用体验直接察觉,更无法留存证据。最后,如果你想入这行,现在还有机会吗? 答案是有,但门槛在提高,入局要趁早。技术壁垒依然不高,搭建一个中转服务的基本能力门槛相对较低, 但风控压力正在急剧上升。 openai、 anthropic 等公司已意识到国内羊毛党的存在,近期正在大规模封禁可疑账号,导致资源稳定性越来越差,售后压力越来越大,市场需求仍在上行,但供给侧的竞争也在加聚。 真正能做出差异化的关键在于稳定可靠的上游资源渠道、良好的用户信任和口碑积累、合理的定价体系和清晰的服务边界。 这条赛道适合有一定渠道资源、技术执行力强且能长期稳定运营的玩家。追风口进来,快进快出,大概率亏损出局。

我刚接触 api 的 时候,光 api 这几个字看,翻来覆去的看了好几遍,完全不知道是什么。今天我用最简单的方式解释,保证你三分钟就懂了。 api k 直译叫做接口密钥,我更喜欢把它理解成一把万能的钥匙,有了这把钥匙,你用的任何软件都能直接调用大模型,不用打开菜鸡皮皮网站,不用订阅 ai 能力,直接嵌在你常用的工具里。举个我自己的例子吧, 我用 obsidian 记笔记装了一个插件,把 ai a、 p、 i、 k 填进去,现在我直接在笔记里问 ai, 都不用开新的窗口。 我写代码用威斯柯达装了个扩展替代插件,接入 cloud 之后,代码五权比官方还准,还便宜。用浏览器看英文文档,装一个沉浸式的翻译插件,填上 k, 从此看英文技术材料,全程双语翻译的质量远远超过普通的机器翻译。 那 a、 b、 i、 k 从哪里来呢?有两种途径,第一,我们可以从官方直接申请去 open ai、 astroopic 这些官网注册开发者账号,创建密钥绑定支付方式, 这条路呢比较折腾,但是原生。第二,通过国内的 api 汇聚服务,这类服务相当于中间商,他们去和官方对接,你只需要在国内注册充钱,他们给你一个 key, 用法和官方一模一样。这种方式省掉了网络、信用卡这些问题,效率高很多。 选哪种看你的具体情况,没有绝对的好坏。补充一个常见的误区, api k 跟账号没关系,你用 api 的 方式调用,不存在什么号没了问题, k 就是 k, 失效了,换一个就 行,数据和兑换全都在你自己的手里,而且用 api 的 时候,你的使用记录不在网页端, openai 官网看不到你的 api 兑换,这意味着你的使用会更加私密。下期我们讲几个不需要写代码,但是能把 api 用得飞起的工具。

tock 经济到底有没有泡沫?如果他只是停留在资本游戏和资本狂欢,那确实是有泡沫的,但是技术是没有的,尤其是他已经落入到普通人和家庭这一层,真正的落地了,并且产生了增量价值的时候。 就在上周,上海干了一件大事,上海电信发布了两个重要的东西,一个是面向个人和企业用户的 to 肯套餐,主要服务的是专业的 a p i 调研需求。但是今天我想重点讲的是另一个家庭 ai 助手,简单说就是把一个聪明的智能体塞进你家里的智慧屏, 然后就可以精准的服务到家里的每一个人了。不要觉得啊,这是运商又来忽悠我升级,我家的 a i 也来了。但是现实很残忍,就 是我们每个人跟 ai 的 关系好像还是停留在这种一问一答的 ai 搜索阶段,并没有真正的来到 ai 能够主动为我服务,主动帮我干活的实用阶段。尤其是家庭场景,有老人有小孩, 他们才是最需要 agent 来服务,但是又最不会用 ai 的 一群人。那所以 ai 真正进入家庭,不能只靠一个聊天框,它必 必须得听得懂你是谁,记得住你的习惯,还得能主动帮你把事办了。所以这次上海电信升级的家庭 ai 助手,他的核心就是在解决这几件事。首先他有了声闻识别能力,老人说方言他能听得懂,小孩问问题,他不止给你答案,还会用更适合孩子的这种理解方式去解释。 同时他有了长期记忆,能够记住家庭成员的习惯,偏好、饮食、健康情况,只有这样, ai 才能越懂你。那有了声闻识别和记忆能力,还得能主动服务, 比如说提醒你天气温度,出门的安排,甚至帮你联动家里的设备。你只需要说一句,我想吃麻婆豆腐啦,他就能推荐附近的餐厅,甚至打通闪送和免密支付,直接实现动口不动手,饭来直接张口,听起来很性感对不对?但是这套只能体, 在没有底层的网络和算力支撑下,它是跑不起来的。这就是为什么上海电信要联合华为这些生态伙伴来做这件事情。那我经常在家会用 agent 去执行任务,执行到一半,哎,卡住了,白花花的 tiktok 浪费了。这其实不是 ai 的 功, 也不是 agent 的 能力问题,而是你家里的网络跟宽带在用网高峰期,它根本撑不起各种上传和高频的 token 消耗的需求。那我经常在家做直播的时候,也会出现这种情况,我们一家就一根网线,我妈看电视,我爸刷视频,我直播经常就卡成了 ppt。 那在不久的未来,我只需要对家里的 ai 助手说一句,我要直播,帮我加速。这个指令直接下发给天意志平,通过 f t t r。 家庭组网设备和网络智能板,在物理层就可以给我的直播开一条专属的绿色通道。未来不管我是打游戏还是上网课,还是家里开个视频会议,都能够动态的智能的分 充沛贷款。我之前其实带大家看过,就是中国电信在全国有自己的智算中心,加上他们的网络能力、网络优势,它来负责源源不断地输送 token。 那 f t t r。 家庭组网设备和网络智能处理设备,这些用来保障钻利能够毫秒即地送到每一个家庭, 最终能让家里的每个成员通过高贷、宽大、上行去真正的享受 agent 来服务你。这是家庭 ai 助手的真实价值,当算率落入到普通人,产生了价值,那 ai 泡沫论就会终结。可是问题来了,你会给家里装一个天翼制品,升级一个家庭 ai 助手吗?评论区可以聊聊。

大家好,欢迎来到我们的系列分享第二期,今天我们将进入更实战的环节,当你创造出有价值的 token 后,如何把它卖出去?市面上有很多复杂的商业模式,我只给大家介绍三种最经典新手起步的模式,掌握它们,你就能开启你的 token 变现之路。 我们来聊聊萨斯定价中最常见的按量计费模式,请大家把它理解为手机流量模式,你用了多少就付多少钱。 这种模式最大的特点是低门槛和高灵活性,对于客户来说,不用一下子掏一大笔钱,也不用担心买多了浪费, 所以非常容易尝试。对于平台来说,你的收入是和客户的业务量成正比的,客户用的越多,你赚的越多,他非常适合 api 这类产品。如果你是新手,想做按量计费,我有三点建议, 第一,定价要简单,不要搞复杂的公式。第二,给点免费额度,让客户先试试。 第三,技术上一定要把用量统计做准,千万不要算错账。第二种商业模式, token 套餐,也叫预充值模式,用户先花钱买一堆 token, 然后每次消费扣减点数。对平台来说,这是一个非常有价值的策略,主要体现在两点,第一,锁定收入, 用户提前把钱给了你,不仅能改善现金流,还利用了沉没成本的心理,让用户卡上有钱,总觉得不花掉可惜。 第二,提升客单价,通过买的多,单价越便宜的策略,你可以很容易的让用户买比他当前需求更多的额度。想设计好这个模式,关键在于套餐梯度的设计,一定要有明显的价差感, 同时可以考虑给 token 加个有效期来刺激消耗。第三种模式,订阅制,它的定义很简单,就像我们订阅 netflix 或者音乐 app 一 样,用户按固定周期, 比如每月或每年支付一笔固定费用,然后在这个周期内可以无限次地使用你的服务。模式的特点就是能为你带来稳定的收入,同时订阅模式能极大地提高用户忠诚度,一旦用户习惯了你的服务,他们就会长期续费。 它的试用场景非常广泛,它的核心优势在于一个订阅用户的长期价值远远高于那些只购买一次的用户。 对于新手来说,我有三个建议,第一,设计分层订阅,提供不同级别的选项,满足不同用户的需求。第二,一定要提供免费试用,这是吸引用户订阅的黄金法则。第三,要清晰的告诉用户订阅后他们能获得什么持续的、独特的价值。 讲完了三种模式,大家可能会问,到底哪一种最适合我呢?这里我给大家一个简单的对比表格,我给大家三个终极建议,第一,从简单开始。如果你的产品刚上线,用户量还不大,我建议你先从按量计费或者 token 套餐开始, 他们技术实现相对简单,也更容易让早期用户接受。第二,打组合拳,不要局限于一种模式,你可以提供一个基础的按量计费模式来吸引新用户,同时提供更优惠的拓客套餐给那些重度用户。 再推出一个订阅制来提供高级功能或无线使用。第三,持续测试和迭代。没有完美的模式上线后,你需要根据用户的反馈和数据,比如转化率、复购率 来不断调整你的定价和模式。记住,做生意是一个动态优化的过程,用三句话快速总结三种模式的精髓,按量计费适合引流 token 套餐适合提高客单价。订阅制适合沉淀高价值用户。行动号召部分要充满鼓励性, 降低观众的心理门槛,强调开始比完美更重要。希望大家回去之后能结合自己的产品思考并落地其中的一种模式。

最近很多人问我,托肯到底怎么卖?今天用一分钟讲明白什么叫托肯中转站。很多人以为他只是简单赚差价,但真正赚钱的地方其实是整合服务。左边是上游大模型平台,比如百度字节、阿里、腾讯、讯飞、智普、 mini max。 托肯中转站的逻辑很简单, kimi 这些正规平台,他们都有官方接口, 有清晰的调用价格。中间是你搭建的统一入口,负责账号管理、接口分发额度统计、计费、充值限额控制和售后服务。右边就是你的客户,比如个人用户、小团队、工作室,甚至企业客户。那 top 中转站到底赚什么钱? 第一,转信息差。很多用户知道 ai 好 用,但不知道去哪里开通接口,也不懂怎么配置。你把多个模型能力整合到一个入口呗,用户直接充值就能用, 这就是价值。第二,赚效率差。客户不想研究接口文档,不想管理多个平台账号,也不想每天算调用成本。你帮他把复杂流程变简单,他愿意为省事付费。第三,赚服务费。个人用户适合做低价套餐,成交快,但消耗不稳定。大企业用量大, 但要求高,价格也压的低。普通人刚开始更适合做中小团队和工作室,因为他们有稳定需求, 又不像大企业那么难谈,只要你的服务稳定,结算灵活,售后及时,就有长期复购的机会。所以 token 中转站真正赚的不是单纯的差价,而是信息整合、技术整合、计费管理和售后服务的钱。它的本质就是把上游复杂的大模型能力 包装成下游能直接使用的简单产品。想要这套或客话术和成交方法?评论区打 token, 下一期视频教大家如何搭建自己的 a p i 中转站。