现在啊, tock 太火了,有人说他是虚拟币,有人说 tock 能当工资发,甚至有人说呢,他能当钱花。很多人呢,听的一头雾水啊,那 tock 到底是什么哈,为什么突然火了?跟咱们普通人到底有啥关系? 今天呢,大叔就用一个比喻,把这三个问题一次性讲明白,听完哈,不仅不懵,还能少花冤枉钱。 token 呢,到底是什么啊? token 就是 ai 的 计量单位,用 ai 就 得消耗它,就像我们呢,用电器就得消耗电一样。 你问 chat gbt 一个问题啊,他消耗 token, 你 用龙虾让他帮你干活也消耗 token, 就 跟看电视开空调消耗的电一样。那谁是生产 token 的 厂家呢?就是那些语音计算厂商啊, 比如阿里云,腾讯云,谷歌云,他们建了一大堆的服务器,就相当于建了一座座的发电厂,二十四小时不停的生产图腾。你每次用后台呢,都有一个电表在转,转一圈就扣掉几个图腾。那图腾能买卖吗? 不能,那这些厂家哈,卖 token 给你,是让你自己用的,不是让你倒卖的。而且 token 呢,并不通用,你在阿里买的 token 只能在阿里的 ai 上用,你在腾讯买的就只能在腾讯上用,那 token 它能存起来吗? 哎,这个浓,但是呢,也有期限,这些厂家可精着呢啊,你买完图腾之后,在一定时间内不用完就作废了。那每个厂商图腾的价格不一样,而且呢,干不同事的图腾价格也不一样, 你比如哈你普通聊天的,他就便宜大概一百万的图腾呢,十块钱,那专门给程序员写代码用的呢,需要更精准,更文静。哎,那就贵了,大概是一百万的图腾要一千元, 那就像家里用电和这个商业用电就两个价。那 took 它为什么突然火了哈?以前 took 不 火是因为大家用 ai 哈,就是聊聊天,相当于就点个灯泡看看电视用电量不大。 但现在不一样了哈,各种智能体出来之后, ai 从聊天进化到干活了。我给你一个数字,你感受一下哈, 普通聊天机器人,完成一次对话只要几百个图腾,但是呢,智能企执行编程、解锁调用工具啊,这些长链条的任务,图腾消耗可能达到几千万。 这就好比你家呢,以前就就有几盏灯啊,一个电视。现在呢,装了中央空调,热水器,电冰箱,那电表转的飞快, toc 的 用量就这么炸了,这就是 toc 突然火的原因。那 toc 跟咱们普通人到底有啥关系呢?那关系大了啊,我说三件事啊,第一, 以后用 ai 啊,跟你交水电费一样,你得算计着花。现在很多 ai 还是免费的,但免费的日子长不了,你想想,滴滴美团当年也免费,后来呢,养成习惯了,就开始收费了。 偷看呢,就是 ai 的 计件器,以后你问 ai 一个问题,那后台电表就得转一下,你用的越狠,花的就越多。 第二呢,你用的 app, 网站背后呢,都在烧,偷看最终的成本会转嫁给你。你现在刷抖音,用美团逛淘宝啊,背后都有 ai 在 跑,推荐你看什么视频,给你推荐哪家的外卖,搜索结果怎么排?全是 ai 干的, 每干一次都消耗 toc, 那 这些 toc 谁买单呢?现在大厂是先垫着,那大厂不傻哈, toc 的 账早晚算到咱头上。第三, 那 toc 呢?正在创造新的职业,也正在淘汰旧的岗位。华人勋啊,说了一句很炸裂的话,未来英伟达,每一个工程师都需要一份年度 toc 的 预算。 现在鬼谷招人哈,面试的时候,工程师会问我的 offer 带多少 toc, 这说明啥啊? toc 正在变成一种数字工资,以后不光程序员,做设计,写文案,搞运营,可能都得看公司给你配了多少的 toc 预算。 那反过来呢?那些只会干简单重复脑力活的人危险了。因为 ai 干这些活花的 toc 比雇人便宜多了。 老板一算账,肯定用 a i, 这就是 token 跟咱普通人最直接的关系。他正在重新定义工作值多少钱。 token 呢,并没有那么神秘哈,不知道大叔讲明白了没有?对咱普通人来说哈,记住一句话就够了, 以后用 a i 就 像用电一样,得算计着花。但别焦虑,该用用该省省,把 token 花在能给你创造价值的地方。我是兼三大叔,下期见。
粉丝1.9万获赞10.8万

全网首发,今天一条视频教会你获取 token 的 四种渠道,搞定中转站上游。 第一种, azure open ai, 作为目前大陆获取 open ai token 的 主要合规渠道, 虽然目前已经不再是获取 open ai 模型的唯一云渠道,但阿塞尔在大陆的特殊地位不变。微软也明确强调,在大陆提供的 hr open ai 服务没有变化,获取的一线货源稳定性与合规性极强,持有大量企业级合规认证。 第二种, safar ipi, 手动搭建,借助 safar ipi 等开源工具,将自己的网页订阅额度转换为 ipi。 如果账号很多,甚至可以调用 safar ipi 的 管理 ipi 编辑脚本,实现批量自动导入。但是这种方式只适合个人学习与技术探索。 第三种,逆向。这种方式极不推荐偷看,有效期非常短,只适用于私人且低频非重要的技术测试。逆向是验证想法的快速途径,但需自行承担风险。第四种,薅羊毛。 利用海外企业的免费试用额度或建立大量耗时赋用分发羊毛党滥用免费额度,且有巨大的时间沉没成本。 最后获取 token 推荐大家还是选择官方云厂商的直联或者 ai api 聚合平台,用激进官方的稳定性换来极低的价格。最后,祝大家创造力不断,用 ai 探索出更多惊喜!

最近我一直在用拆了 g p t 新出的 emh 二做出来,效果真的很超我的预期。你们看这几张图,就是上传一张图片,打几行字,几十秒就能直接出来的。 ai 出图这件事其实并不新鲜,很多人都用过。以前一直有个问题没有被解决,就是图里只要有文字出来,就很容易乱码,看不出来是什么样子,需要多次去抽卡,所以稍微有点复杂需求的图片就很难进行实操。这 次拆了 g p t 的 emh 二出来之后,问题直接被解决了。他把图像生成了模型的底层,不再是外挂一个花图工具。所以林贤礼说的话和深沉的图片 同一套系统,你让他跑在图里写成字,放在哪个位置,他都能做的,而且是对的,你说该动哪里,他就只动哪里,其他全部都能保留住。而且他直接长在尺子间壁里面,你可以在一个对话里边聊边改上下文他全部都记着,整个过程更像是在跟一个设计师写作,而不是在对着一个工具发指令。 总结了三个很有意思的案例,特别是最后一个,很适合用来整蛊朋友。第一个案例是 ins 风图片生成,我上传了一餐今天的午饭,就是很普通的手机直拍米粉加肉,让它在图片上加上手绘白色涂鸦线条,手写风中文。备注,每道菜旁边加白色秒变气泡文字, 温暖治愈。我们来看一下它给我们的效果,可以看到它自动识别到了每一道菜,米粉旁边标注出了米粉,粉嫩很 q 弹。红豆双面胆也单独加了标注气泡文字位置全部都是对的,中文字体还特别清晰,不会有乱码的情况,甚至还在上方自动加入了一行今日份的小确幸。 这份文字我甚至都没有单独给他,是他自己根据画面的整体判断加上去的。以前做这种图,我们都要自己找素材拼灵感,现在拍完直接扔给他,几十秒就可以生成发朋友圈的图。第二个案例是电商的小锦页,随手拍了一下身边的一个保温杯, 让他帮我生成一个电商的详情页。除了这些之外,我还觉得这个详情页我想让他契合这个杯子的风格,比较有非遗的民族风特色。第一版出来氛围是对的,民族风背景、排版、结构都有了,甚至他还给了我两个版本。但是有一个问题是,杯子的图案整体的比例并不太对,跟真实产品不太一样,我跟他说了我喜欢的风格,然后需要调整。问题是什么? 他直接给我总结优化了一套提示词,帮助我重新生成,跟着他的提示词重新升图。第二本出来是这样的,主图有 有产品,有民族风背景卖点,文字很清晰,详情页的结构都特别完整,整个主题都能对得上。这套图如果找设计师去做,至少要半天甚至一天,这次来回就算加上深沉,我也几分钟就能搞定。第三个案例是 ai 算命,对,你没有听错,我真觉得这个案例特别特别有意思, 这是我在推特上看到的,就是上传一张你手掌的照片,配上这一段提示词,就会产出这样的效果,说这个人中年阶段会逐步走向积累。我真的看呆了,不敢想这要是发给朋友圈,这得多好玩。这次他的中文字体就是完全不会有模糊啊,甚至很崩化的情况,自己的标准都是非常清晰的。第二是他不只是出, 他会帮你分析问题,就像刚才电商那案例,我说他的产品图不对,但直接帮我删解了我的问题要怎么改,甚至给我优化了新版的提示词,这个过程就更像是跟一个很懂电商的设计师和他协助一起去出图。第三就是他的生成速度很快,几十秒就能直接出一张,哪怕来回的修改,他也速度很快,不会让你等很长时间。意思就是他这个免分版本的次数其实有限制的, 如果你有很大量高普的需求,可以去看一下它的 plus 版本,如果你只是玩一玩,尝试一下跟一个风,它的普通版也是完全 ok 的。 如果你想尝试,我这些案例的提示词我都整理好了,评论区可以直接领取,我直接发给你。

从事透肯的一个方向,是不是未来的一个风口,很是没有错。于老师你好,我想请问请教两个问题。第一个是关于关于 ai 方向的,我先说 ai 方向的,我现在自己有做一个 ai 类型的产品,这边是做了一个产品上线之后自己去代理了一家中转,现在已经从 月初上线到现在一个月多一个礼拜已经盈利了,但是盈利比较少,盈利是一千多块钱,因为我用户不多,用户大概只有四百多个,还不到五百个。我想请问一下我,我前两天就刷到一条视频说以后关于托肯中转或者这个生意,说是以后上面东家可能会管,我不知道 这个事会不会真的我们普通人再去做这种生意,有没有的搞?是这样的,兄弟,我和你说一下,我们看未来没有看过去那么清晰。如果你想去从事 tock 这件事, tock 是 不是未来的一个方向,是不是未来的一个风口呢?很是没有错, 但是我们必须得搞清楚,当下的二零二六年和我们过去的每一年最像。当下的二六年到二零三零年和一九九九年到二零二四年是最像的,那个时候互联网开始兴起,二零二六年 ai 开始兴起,互联网开始兴起之后, 移动这是 pc 端,移动端到了零八年了,移动端到零八年以后了,我们就选择 pc 端,一兴起之后, 现在的偷客就相当于那会的流量。我不知道你这么说能不能理解。让你现在回想一下,当时最开始互联网兴起的时候, 他是一个什么样的发展节奏?最开始的时候,尤其是当移动互联网出来以后,流量他是如何卖的?我记得那时候最开始五百五百兆很贵的,反正那时候五百兆。 五百兆多少钱来着?二十块钱五块钱,三十五块钱三十兆,五块钱三十兆。现在我们的 top 是 多少? v 四 pro 是 一十块钱一百万吧好像。如果你要是像 cloud, 那 就更贵了, cloud 四点六和四点七的价格那就更差的更大了,差的更大了。 所以说他现在还是属于一个发育的混乱期,我们的寄托于我们现在的这种电力优势。托肯我觉得我个人觉得他是属于一个供大于求的一个状态。为什么供大于求?首先托肯他作为 ai 的, 如果谁是汽车,托肯就是汽油, 但是现在开汽车的能有谁?刚需的只有程序员,程序员用这些也是被逼的没招了,你不用他老板踩你,只有这部分人是刚需的。 那对其他人来说,非程序员来说,那还是做自媒体的啦。做从事一些 ai 动画、 ai 漫画这些人,他们用的 c 段水一秒一块钱这种的, 但是他们的收益,他们他们能用多多少投肯,但取决于他们的收益能不能形成一个闭环,大部分的是跑不起来的。所以说海量的 c 端对投肯的需求并没有被激发出来, 并没有被激发出来。你我们再看互联网开始大规模的被普及是从什么时候开始的?是从玩游戏,游戏网吧,传奇,包括零七年九神的魔兽世界也好,或者是大话西游这些是从这些游戏开始爆发开始传起来的。 大规模的一些电脑开始走入个体,随着大规模的这种移动端的这种普及,有一一年微信 开始这种流量才开始顶上来。而我们现在来看呢个人去做托管,我个人觉得是比较冒险的,他的冒险来自于两方面,第一 做托管贸易,他有两个方式,第一个就代理了,第二个就是做 api。 我 不知道你刚才说的那个,对对对,是是我在听,我在听,一个就是做代理,一个就做 api 了。做代理赚钱少,说句话就是给人家,给人家跑马甲,当人家的业务员,你要自己发一些, 自己去找一些海外的一些服务商,这些其实都是最其次不重要的。关键是如果你要去做一个 a p i, 那 你要不要去接一些国外的三大头? 你要不要接?你肯定得接你不接你,对你你,你在国内的一个宣传,你就这个东西, c 的, 不管是 gdp 也好,或者是高的也好,你可以没有,但是你可以不用,但是你不能没有,要不然你宣传的时候就不好宣传了, 你肯定这些这些都有的,那 ok, 那 就那就接下来第二个问题了,你,你是不是要和他们大量的去囤货的去买头克?我这边利润还可以,我直接说下我利润,我利润大概有百分之四十七的利润,你做什么有百分之四十七的利润? 是这样的,比如说我,我从上游那边去进货,进货的成本价是对,我再去卖,我有百分之四十七的利润,你囤货你多少?我不囤货,是这样的, 我们在技术圈里面大概是这样的,他总带的服务器在那边,我自己不用搭服务器,我弄好一个注册一个阿里云的 ip, 把 ip 去备案,备案好了之后去直接 解析给到他们,他们直接会帮我搭一个站,已经是流程化的,很快就能搭好一个站,把站改成域名都是我的,所有的 logo 全部都是我的,我就拿这个站看,对代理还是代理吗?你做的就不是 a p i。 对, 我没有自己做源头,因为做源头要维护太麻烦了,因为他们本身就比较成熟,所以 我我就不用去操心这个事。我我核心赚钱是因为这样,是我自己做了一些工具, igc 的 工具,什么写小说,写剧本,像什么无线画布,就深图深视频这种工具,我去推广,让别人去用,让别人觉得我这个工具好用或者怎么样的,或者说我这边拿的价格比较便宜,他们就会来会来用。我就比如说像那个 maggie two 的 模型,模型其实很多不太 不太好用的到,如果你像去大平台,他们也很贵,那我这里就很便宜很便宜的,很多人就会来我这边用,就不断会充钱。我说我这个商业模式能跑,已经跑通的原因是因为已经有用户一直在复购了,虽然我用户不多,但是有用户一直在复购,复购到现在,我看到后台,你现在难点就是在公寓,公寓口的获取了吗? 不是,我其实也获取流量。我也我也有方案,去小黄鱼,还有包括让某书上面,我其实已经有方案了,我现在担心说这个生意还能做多久,他会不会像那种叫什么电信移动啊这种在未来的某一天像这种成为,你懂的,普通人跟普通人没关系了。不会不会,不会,我们现在的电力太便宜了, 造成投放供大于求,你会发现看到好多一些 a p, 现在好多一些 a p i 的 企业,他们出来去拉下线的时候,会打着我们是波子背景, 就这么一个旗号,以彰显他的一个正规。正规吗?确实正规,但是你要搞清楚一件事,国资进去就是为了持股,国资持股就为了要给自己下属的一些事业单位去用, 自己买一个用。所以他们这些公司,他们目前所有的 ap, 他 们尤其是像国资背书的这些,他们的 b 端都不缺,但是他们统一的问题是 c 端打不开,因为因为国资背出来,所以他们的整个就 不能去接入 cloud 也好,不能接入 gpt 也好,这些他们就不允许接入外部。嗯,外面的三大头他们,所以他们的 c 端市场就很受限,因为他们为了发展他们的 c 端市场就开始,你就会发现这段时间网络上有好多好多人去笙歌,或者是谁都开始下场做 api 了,这是一个分货,大家一定要赶快进。有好多人在说这件事, 但是如果只是代理,我觉得是可以做的,最起码你没有这种资金压力,或者是你你不需要垫资,你也不需要囤货,这个我是觉得可以做的,只不过是你的进度可能会慢一些,慢一些,但是如果你是要去做你的 a p i, 那 就我是非常非常不建议的,最起码现在不建议去做这件事。 ok, 明白明白。

哈喽,大家好,今天跟大家聊一下关于这种免费投屏使用的问题啊。像啊,我自己的话,一般在用三个呃投屏的平台,第一个就是 字节的翠森啊,它是开发这一块,投屏的话用起来是比较快的,然后它也有几个特别好的模型,第一个就是 mini max 两点七啊,它也有付费的这种模型可以用,比如说呢, dipsic 四 pro, 包括界面三点一的版本,但这两个版本的话就需要排队啊,有很严重的排队。 然后呢,它的国际版就可以呃,间接的解决这个问题,就是它国际版的话,每个月有三美金的赠送,当需要有这种比较复杂的需求的话,我一般会用翠的国际版,也就是用它三美金这个版本来进行一些复杂任务的处理, 但是像一些简单的任务啊,或者说可以用 skill 去做好的这种任务,就基本上它的国内版就 ok 了啊。嗯,还有一个呢,我自己在用的就是英伟达的平台,黄教主的平台。黄教主的平台呢,就特别良心啊,它没有 token 的 限制,然后它只有一个 呃一分钟五次 api 调用的限制啊,所以这里边儿呢,就是当呃有一些比较长周期的,就突破销量特别大的这种任务,比如说一些大的 需求的刚开始的一些开发,那可能就会用黄耀祖的这个英伟达的开放者平台来做。它上面的话也有几个比较好的模型啊,目前的话只有只留了 mini max 二点七了啊,原来还有 deepsea 三点二 刚开始的版本,包括 g l m, 也就是智普的四点七的版本可以用, 但是就是像英伟达的话,它有一个小小的细节,就是注册的细节,如果你是用个人的邮箱去注册的话,就很难注册到啊,像国内的话基本上注册不了,像我自己的话都花了好长时间去注册,就就后面就一直没搞定, 完了之后到网上找了很多资料,然后他们讲说要换成企业的邮箱就 ok 了啊,结果我换成企业邮箱 就立马就注册好了啊,所以有这样的细节。以上就是我自己在用的这几个, 就是开发当中有用的这几个托管的平台,目前的话没有托管慌啊,至少免费的话每天的工作量都是 ok 的 啊。大家有什么更好的平台可以留言那?拜拜。

你是不是也疑惑,为什么突然间全世界的 took 都不够用了?各大平台限流、收费、涨价,这背后到底藏了什么信号?先来看一组数据, 中国 took 消耗两年暴涨一千四百倍,但真正的拐点不是人用 ai, 而是 ai 自己用 ai。 过去我们用 chat、 gpt、 豆包、元宝、企业做客服、数据分析,但这些都有天花板,因为人的注意力有限,再便宜的 ai 也突破不了。 直到二零二五年底,智能体 agent 彻底打破格局,你让他定最便宜的机票,他自己搜索,比价付款,全程调用,大模型消耗。托克完全不用人管。 一个企业部署一千个智能体,一年消耗的 token 相当于一个中等国家人类用户的总量。更关键的是, ai 已经能够自主接任务、赚收入,买 token 从工具变成了能消费的经济主体,这才是 token 不 够用的核心原因。 再看第二个问题,中国 tiktok 凭什么碾压美国?今年年初,硅谷慌了,在 openroot 平台上,中国模型 tiktok 调用份额超过了百分之六十。 dipstick kimi 千问性价比直接碾压。这里要澄清一个误读,所谓 tiktok 出海,不是国内的数据中心。 中国魔性的优势在于算法效率高,开源生态好、定价够极致。也正因为中国魔性的加入,全球托肯价格在加速下降,最终受益的是所有开发者和用户。 各位企业家, tiktok 之争的本质,是算力定价权的争夺。当年谁掌握了石油定价权,谁就掌握了工业时代。今天,谁掌握了 tiktok 定价权,谁就掌握了智能时代的底层话语权,你企业的 ai 智能体部署了吗?评论区聊聊你的认知,卡点帮你拆解 道德经有言,天下莫柔弱于水而攻坚强者莫之能胜。通肯河水看似无形,却正在重塑商业世界的底层逻辑。 真正的战略家,从不追逐风口,而是读懂潮水方向。关注阿苏,一起成长,笑看云卷云舒!

还真的是有点难崩,为什么这么说呢?因为奸商看到他呢,绝对会眼前一亮,满眼都是暴力,感觉韭菜都快隔着屏幕长到他家去了。那另一边呢?如果是心没那么黑的小白用户,你也可以靠着他狂薅大场的羊毛,当然只要你心不是太黑,靠着他撑起一个挣钱的副业,那是完全没有问题。 那奸商的黑幕呢?我们放到视频后面再给大家讲,我们先来看一下对于普通用户来说到底有什么好处。我相信如果大家接触过一段时间这种相关的 a a 阵的工具了,其实就是那个模型的能力, 有的时候顶级模型大家又觉得太贵,然后就会去网上去搜各种各样的打折优惠薅羊毛的这种信息。因为各家的这个战略和节奏的不同呢,所以它的各种优惠程度和时间周期都不一样, 你本地又装了各种各样不同的工具,有可能你是 codex open clock clock code, 然后又有这个 co worker 等等一系列的扣单工具。一旦你当前用的这家供应商活动结束了,然后你想换到另外一家,换完之后你又得把所有的 api 配置全部都改变,非常繁琐。那我自己也有类似的感受,那每到这种时候,我就会在想,如果有一个工具能够让我把所有 api key 的 配置 全部都收拢到一起,做一个集中的代理,这样的话,我的各个 ai 工具都只需要配置这一个代理工具就可以。以后如果有新的供应商 api key, 那 我只需要接入到这个代理里面就可以。 那今天给大家介绍的正是这样一个开源项目,它叫 new api, 它能够实现呢,就是把上游所有模型渠道的 api key 全部都收拢到一起,让大家进行统一的配置和管理。这样的话,作为新手小白,你可能各家都能够薅到一些新用户的羊毛,可如果你想 ai 搞钱做副业的话, 你就可以打造自己的 token 池子,然后转卖给下游的用户来挣钱。那你的利润主要来源三个维度,第一呢就是批量 token 采购的一个折扣, 这个后面会提到。第二个就是你可以把新用户的免费额度呢融合进付费的套餐。那第三个呢,就是考同一个模型,不同供应商之间的一个折扣差异。实际的场景下,大家可以结合这个性能,供应商的稳定性,它的报价,整体的服务质量 方面去进行一个综合平定,来维护你的模型拓客池子。你的最终目的呢,就是在留住用户的这个前提下,尽可能提高你的利润空间。好,那先给大家演示啊,这个项目到底怎么去搭建和配置。 首先带大家来看一下这个项目的第二首页安装的过程呢,其实也非常简单,它需要一个 dota 的 环境来部署,大家把代码呢克隆到本地之后,就把你 dota 引擎和 dota compose 都已经正确的安装和设置好,配置文件改好了之后,直接运行 dota compose on 就 可以启动了,其实非常简单。然后再带大家看一下这个 new api 的 配置文件哈, 这里面其实大多数配置如果你是本地使用的话,不改没有什么问题,唯一需要注意的是关于这个流逝的响应模式,超时这个的话呢,建议大家稍微配的大一点,因为配置过小的话,就会出现流逝响应的时候中断的问题。再往下呢,底层是依赖了 res 和一个关系数据库默认的是 posgrid 这个密码大家最好改一下在这个地方。 然后最后一点需要注意的就是它的一个端口号,这里大家选一个没有被占用的就可以,等一下服务器弄起来之后呢,你要用它来访问网页的控制台。然后呢配置好了之后呢,大家只要进入你暴露的这个端口号,就会看到这样一个触手的一个界面, 直接点击下一步,然后把用户名密码填一下,然后这里呢可以设置对外服务的模式,如果你想要对外提供多租户的商业化服务,拿这个挣钱的话,那就选这, 如果你是自己本地使用的话,就用这些。选好了之后呢,点击这个抽纸化系统好,过一会他就抽纸化好了。大家看到这个就是你的一个入口网关,如果你是对外提供服务的话呢,你应该去注册一个公网的域名,然后把这里呢通过配置文件改成你的这个正式域名。接下来你点击这个获取密钥啊,他会调整到你的控制面板。大家看到因为我是按照外部服务商的模式来抽纸化的,所以这其实是一个多租户的模式, 包括你的调用量数据看板,你 a p i token 的 管理,每个用户都可以拥有自己的 token, 它内部直接继承了邀请奖励和兑换码这种营销的模式,也就是如果你想要运营一个中转商的话,你可以用这种模式来发展你的用户,让他帮你们去做营销宣传。订阅的模式其实也是非常的丰富的,你可以去自己新建套餐, 如果我是一个 a p i 中转商的话,我可以给我的用户定制一个属于他们的套餐,比如说我建一个 pro 套餐,一个月是二十块吧,一种是美金,然后你可以设置购买上限,有效的单位,重置周期都是可以的。 到管理这里呢,就可以定义你的 token 的 来源,不管你是个人用户还是服务商,可以通过这里添加 api token 的 一个来源。大家看到这里,其实常见的供应商都是支持的 openai、 astropicsaws、 vertex, 包括国内的一些大模型全部都支持,包括 openai 的 这个 os 模式它也是支持的,即使有些小众的模型它没有支持,那一般情况下呢,那些模型它也都会提供 openai 或者 astropic 兼容的这种 api 模式啊,你也可以用这两个直接去配置,也是 ok 的。 填好之后呢,你把对应的 api key 放在这里啊,注意这里的 api key 不是 发给你的用户的 api key, 而是你从上游购买 token 的 时候,那个上游服务商给你的 ip, 大家一定要分清楚啊,然后在这个令牌管理这里呢,才是给你自己或者说你的下游用户给他们去添加 ip 的 地方,大家看到你还可以给你的 ip 去设置额度,设置模型的访问限制, ip 的 白名单都是可以的,因为如果你是服务商的话,你有可能被你的下游用户去薅羊毛,如何去规避这种情况,对吧? 然后在系统设置里面,你可以去做很多局的这种管控,来控制你的用户怎么样去使用这些模型啊?这个是性能的这个限制,这个是模型部署。对小白用户来讲,其他的这些系统设置大家都不需要操心,只需要去看这里。一个是渠道管理,用来接入上游的一些供应商,不管你想薅哪一家的羊毛,哪家有免费的额度,你都可以去那边注册账号,然后在这边去添加就可以。 然后这里给大家看一下它的这个高级设置。这里面啊还可以去设置一些这个默认的参数,比如说你有一些系统提示词,你有一些这个 prompt catch 的 一些种参数的启动,你都可以在这里直接去改。这个请求头参照官方的这个配置文档去改就可以,包括系统提示词,你也可以直接覆盖。这个就是在 api 的 维度去配置,相当于只要你调这个接口,它就会默认的把这个系统提示词改掉。 除了聊天的这个 check completion 之外呢,它还能支持音频、 embedding、 图像、视频甚至 revamp 的 模型啊,它都是有的,也就是说基本上你对 ai 大 模型的所有类型的模型需求,都可以通过这一套框架在你自己的本地把 apikey 的 配置收拢起来。如果你自己想做 token 的 渠道商的话呢?那你完全可以用这个东西搭一套自己的管理后台, 有点像大家以前去做 vpn 搭梯子的时候用的那一套东西,比特啊、 smartbox 等等这些过去是做这个网络流量的生意,那现在到了 ai 的 时代,它就变成了做 token 的 生意,其实本质上是一套东西,大家把模型的渠道商配置好了之后呢,就可以实际的开始使用了,这个是它的官网文档,大家只需要把这里的域名改成你自己的域名啊,或者你的 ip 就 可以了。也就说不管你本地是什么样的客户端, 你是 opencl 还是什么其他的系统,那你都可以通过这一套模式在配置的时候用一个统一的地址去配。那以后如果你有任何的新的渠道商的接入啊,或者你 想要切换一个渠道商,那你只需要回到那个管理控制台,然后在这个模型管理里面去做切换就可以。甚至对于同一个模型你都可以换不同的供应商。比如说你在模型这里配了一个 clock office, 然后供应商这里呢,你可以随时切换。你之前是 astropy, 那 后续如果你觉得 a w s 或者 anti gravity 有 更好的这个折扣和 deal, 那 你可以随时在这里改 clock, open claw 这些应用的配置完全不需要动。然后再给大家看一下模型部署这个地方,它的模型部署呢,是依赖了 i o dot net 这样的一个平台,带大家过去看一下 这个 i o dot net 呢,其实就是一个算力的供应商,大家可以把它列入成 a w s 啊,谷歌,只不过它专门是来提供 gpu 相关的这个算力,它并不像传统云浮供应商产品那么完整,而是专注在 gpu 的 这个大家看,你可以在上面去直接买 he 版、 a 版这些英伟达的顶级的算力卡,直接去部署一些满血模型,也就说它从拓客的供应商呢,相对来说是非常全面。像这种 gpu 算力的供应商 啊,你可以直接采购 h 一 百一百的卡,然后回到渠道管理里面,你可以去依赖大模型的官方 a p i, 你 也可以去依赖云服务供应商, 而且像 a w s, 谷歌这些呢,他们也有云端的这个 gpu 的 训练机,比如说你直接在 a w s 上买了一个 a e 版的训练机,然后在上面部署一个大模型,通过 open ip 兼容的这种方式,也可以集成到这里面。 然后大家看到这里还有欧拉玛,比如你自己本地有个五零九零啊,我上次一期视频给大家看过那个巴卡的魔改五零九零,那如果你是这样的用户的话,自己本地部署好了之后,用欧拉玛把这个巴卡的五零九零装成一个模型 ip 也可以在这里提供出来,大家看到它的选择还是相当丰富的。 嗯,刚才给大家讲了,普通的小白用户怎么样靠这个开源项目来提升自己 ai 工具使用的一个效率,来薅各种大厂的羊毛。那接下来我们黑化一下,来聊一下从奸商的这个视角, 怎么样靠这东西割韭菜赚取暴利。当然这里并不是鼓励大家去这样做啊,因为但凡有灰色利润的地方,它就会有一些政策和法律风险,大家就纯粹从用户的视角去看一下,尽量避免让自己踩到这种黑心的 a p i to 终端商。其实工具是同一套,那这帮奸商为了取利润,势必就需要从各种不同的方向去压缩它的这个成本, 这里给大家列一下,比如说他们会通过一些公网扫描的这些黑客的脚本,去扫那些有安全漏洞的 a 阵网关。尤其是最近 open call 大 火了之后,有大量没有安全意识的用户,其实是把自己的 open call 网关直接开放在公网上,而且也没有任何的 open 加密, 那这些用户就极易被这些黑客脚本扫到,从而导致自己的 api key 泄露出去。而且刚才给大家展示管理控制台的时候,应该也已经看到了,他其实可以非常精细的去调整每一个账号,每一个模型供应商 它的用量和额度的。假如说我通过黑客脚本把你的 api 抓过来,那我其实为了不让你发现,我可以把占用你额度的这个量调的非常低,只要我拿到的这些泄露 api 的 数量足够多,那其实所有的用户都在隐形的给我输血,而这些用户他有可能完全感知不到。 那第二个呢,就是通过隐形的去压榨剩余的投肯,比如说他在卖给他的下个用户的时候,我声称给你一周一百万的投肯,但实际呢,在你的用量达到比如说九十万甚至更低八十五万的时候,我就告诉你,哎,额度受限,你已经用完了,他就在赌大多数的用户不会做精细的投肯数量统计。 再有一个呢,就是他们会用大量虚拟的这个手机卡去注册各个大模型平台的一个免费账号,然后把这些免费的额度全部都薅一点,因为虚拟卡它可以无限注册,用完了一波免费羊毛薅完了,那我再注册一堆虚拟卡,如此网富。 那再接下来呢,是一种相对合规的操作了,就是通过批量购买账号的方式,因为各家当你的账号购买额度购买的这个量大到一定程度的时候,都会有一些企业级折扣的。我通过注册公司账号,联系各家大国信供应商的企业服务的销售团队,然后让他们给我打折。各个大国信供应商,他们的区域授权团队为了获客,他们都有一定的折扣空间,那么这个空间也是我的 潜在的。那最后就是你更黑心的一点,那他们就会按比例直接去掺那些低智商低价格的模型,比如说我卖给你是 clopos 四点六,那实际上我会在里面掺一定比例的海库,甚至更低尺寸的模型。他们掺假的这个量呢,也会动态的调整,一边让你感觉不到,同时另一边呢,它的利润也能最大化。希望这个工具可以提高大家使用 ai 服务的一个效率。然后同 是避免遇到一些黑心的投坑中转商,想要创业的朋友呢,也能在里面看到一些搞钱的机会。好,那今天的视频就这些,如果你觉得这期视频对你有用,欢迎点赞评论转发,那我们下期视频见。

别一听到 token 就 头疼,今天我用两块积木给你讲的明明白白,你再用 chat、 gpt。 或者像我这种 ai 聊天的时候, token 不是 单词也不是字母,它是 ai 脑子里的积木块。 比如 hello 这个单词可能是一块积木,但 unhappiness 这种长单词会被 ai 掰成两三块。 中文也一样,你打我们一起吃饭吧。 ai 不 会一个字一个字看,而是切成我们一起吃饭吧。这样的积木块。 为啥要知道这个?两个原因,第一,现在很多 ai 是 按 token 收费的,你打越长的废话花越多钱。第二, ai 一 次能记住的总积木数有限,比如幺二八 k, 超过这个数它脑子就爆了。 当然, token 在 别的却还有意思。登录验证时,那一长串乱码也叫 token。 你 买的狗狗币、熊猫币也是一种 token。 但以后再有人跟你聊 ai 的 token, 你 就直接回他,懂了,就是 ai 的 小积木呗。关注我,下次跟你讲上下文窗口又是啥坑?

很多人天天听别人说 token, 但根本不知道是什么。其实 token 就是 ai 读文字时的小信息。快你发一句话给缺德 gpt, ai 不 会整句话一起看,而是会拆成很多个 token, 你 聊的越多,消耗的 token 就 越多。所以 token 其实就是 ai 处理文字时的燃料。

最近干货让 deepstack 为 callex 打工, tockin 节约百分之五十。嗯,我手搓了一个工具,让 gpt 五点五能指导 deepstack 工作,把我的 tockin 消耗降低了百分之五十,把性价比拉满。 deepstack 桌面版就是今天最好的 ai 生产的工具,但它缺点有两个,一是订阅太贵,二是 gpt 五点五的额度太废。而 deepstack 又是一线模型中价格最便宜的,让 gpt 当大毛, deepstack 干活才是最完美的组合。 但 deepsea 是 需要接入可捞的扣子让他干活,然后把它包装成 mcp 给 callix 调用。我写好的 mcp 已经开源可用啊,大家可以直接跟 callix 说让他装上啊。这个 mcp 的 核心价值呢,有以下几点。 这个 m c p 本身我就是用 codex 桌面版开发的啊,开发过程很简单,可以说有手就行。如果你希望做一个这样的 m c p 的 话,可以把下面这些话发给 codex 桌面版 啊。注意,这样做出来的只是一个基础版啊,甚至不一定省 tokyo, 你 要一边用一边跟 codex 对 话来解决各种问题啊,最终肯定是能迭代出一个跟我一样甚至更好的版本,大家都可以试一下。

今天聊一个很热点的话题,麦托肯生意的毛利率居然是百分之九十二,但比这个数据更可怕的是,网上教你的这些博主,没有一个人把真正的风险讲出来。我花三天的时间拆解了一遍,把好处和坏处一次性讲清楚。 国内大部分的人因为网络问题,是没有办法用上 cloud chat gpd 的 这样的先进的国外的大模型,那用上的人就想了一个办法, 我去把它官网买一张月卡,然后把里面的托肯组成一个大的托肯词,然后再把这些托肯分成分批次的卖给有需要的人。比 举一个例子,我们购买一张两百美元的 cloud 月卡,它可以使用的托肯额度按照官方的呃,按照官方的标准计价就是两千四百美元,所以说两千二乘两千四百美元就是百分 九十二这个事情的毛利率。我有一个很大的 token 词,之后我就可以把 token 切卖给不同的消费者。消费者买到产品的形式有两种,一种是固定额度的 cloud token, 比如说十美元,第二种就是一张月卡售价是三百人民币,所以你每天可以 用三十美元的 cloud talk。 普通人参与的这个方式有两种,第一种是当推广员,第二种是建立自己的 talk 词。推广员的意思就是你只需要生成自己的推广链接,专属链接就可以了,吸引来更多的人 通过你这个链接下单托管就可以了。至于说月卡购买的托管词的构建,你完全不用担心,参与的方法也很简单,现在比较成熟,规模比较大的这种中转站有自己的推广计划,你直接找到他们的负责人,说我要当你的推广员就可以了。 第二种,构建自己的 token 流量词的时候,也不要觉得很难,在市面上百分之九十九的中转站都用的是同一套开源 github 的 框架,名字叫做 sub two api, 这样的框架非常成熟和强大,它帮你搞定了多账户的管理, 就是这个计费脱贫之间的这个动态协调,你只需要输入自己的 cloud 订阅链接就可以了。嗯,这件事情呢,我推荐普通人从第一种方式做起, 然后再逐步过渡到第二种方式。原因就是第一种,它是零成本,你只需要负责销售就好了,你获得正反馈也很快 帮你累积到足够的客户,也就是你的需求端稳定了以后,对你的服务稳定有更高的要求的时候,这个时候你再把你之前获得的利润投入到这个生产才是划算的。好了,好处讲完了,再讲一讲风险。第一个是大部分人都大大低估了流量获取的难度, 你只要做好销售就可以。这句话听起来很好听,但是你不妨带入买家视角来想一想,你正在上网,一个陌生人突然过来跟你说,我这里有个链接,你到我这来买托克,你会怎么想? 第二个风险是官方封禁,其实 cloud 不是 支持月卡、拼卡这种行为的,它在积极的检测这种模式,而且一旦检测到就会进行封号。这个时候如果你 是一个推广员,你只是进行销售这一环节的话,就变成了你这个缺点,因为你无法推动上游,也就是中间中转站去解决封号的问题,这就导致了销售环节大量的消耗你的心神。所以说这就是为什么我建议普通人一定要从第一个阶段,也就是推广员的阶段, 不过建到第二阶段建立起自己的流量池,这样的话推广员中等站也没有门槛,所以大家就是在同质化的竞争打价格战,但客户关心的始终都是服务的这个稳定性, 所以你到时候可以多买几张卡,如果一张卡被封禁了,那其他的卡也足够支撑你线下所有的客户进行服务,这样才能跳出同质化竞争,打出自己的品牌。

我们有一次做 o p c 一 人公司的调研访谈,有一个 o p c 问了一个问题,说智能体是要 token, 这事政府得出来管管,我这发一个请求模型平台给我寄 token 的 消耗,他说多少就是多少,我觉得我没有用那么多,他给我乱寄,多寄我也没处说理,政府得出来监管一下。 这个 o p c 说的问题很真实,但是其实也确实很无解。正好最近刷到了一篇论文,很严谨的研究了这个问题, 拿了八个大模型,有 g p t 的、 cloud 的、 gemini 的 这几家闭元的模型,也有 kimi 谦问几家开元的模型,测了一圈,得出了几个明确的结论,和我们平时使用的体感还是比较一致的。 第一就是在模型和模型之间烧 token 的 差别是很明显的,无论任务难易,有些模型就是会倾向烧更多的 token。 论文测了同样的五百个任务, kimi k 二和 cloud sanit 四点五,比 gpt 五多消耗一百五十万 token。 所以 有时候大家说有些模型它虽然单价便宜,但是干一样的事儿用量多,总的来讲也不省钱,这个是实锤。 第二呢,就是更多的 token 并不意味着更高的准确率。论文统计结果的准确率通常在中等成本的时候是最高的,高成本很多时候是因为重复的去运行,一些文件查看和翻来覆去的去修改,大多数时候反而会降低准确率,说白了就是跑得越多越晕。 那最后我们有没有办法对任务的这个 token 消耗量做预测呢?答案是,不好意思,好像没有。论文研究说让人类专家来预判一个任务的 token 消耗和真实的消耗比结果的相关性系数大概是零点三二,也就是相关性很弱。 那把人类专家换成 ai, 让 agent 自己去提前预判他完成这个任务的投款消耗,相关性系数大概也是在零点三左右,也不高,而且大部分模型做出的预测甚至小于实际消耗的一半。 呃,所以整体的结论就是 agent 任务成本不可预测,请谨慎选择模型,高成本运行,不保证成功,请合理设置预算上限。 大家都说 ai 生意以后得按结果付费,但其实现在基本都是还按 shotoken 的 这个量来收费,真的能按结果收费的那都是真的牛。

你有没有想过,你用的 chat gpt 豆包 cloud? 为什么聊得越多,账单越贵?答案就两个字, token。 你 每问大模型一句话,它背后都要消耗一堆 token。 账单也是按 token 算的。 你可以把大模型比喻成一个厨师,我们问他问题,就相当于让他帮我们做一道菜,你要的答案就是那道菜。做菜没原材料,动不了, token 就是 这个厨师手里的原材料。你给他的每一句话、每一段代码,每一个文档,都会先被送进后厨,切成一块一块的文字石材。 大模型读多少 token, 记多少 token, 吐出多少 token, 直接决定这道菜花多少钱,端出多大一盘。 最近有个 ai 编程工具叫 openclaw, 程序员圈特别火,大家给他起了个外号叫小龙虾,让他读代码改 bug。 写文档用了几天,一看账单直接清醒。 为什么?因为他背后跑的就是大模型。你让他改一个 bug, 他 要先去读需求,读、报错,读你整个项目里相关的代码,全都得切成 token 送进后厨。当然,账单飞起来。今天这期就用做菜的视角把 token 讲明白。 你只要懂了 token, 就 懂了大模型为什么会收费,为什么有上下文限制?为什么它是一个字一个字蹦出来的?先说最容易误会的一点, token 不 等于一个字,也不等于一个词,它更像是厨师自己切出来的食材块。 比如你输入人工智能很有趣,人类会把它当成一句话,但模型可能会切成人工智能,很有趣。句号有时候一个 token 是 一个字,有时候是一个词的一部分,有时候甚至是一个标点,一个空格。 这就像做菜,你递给厨师的是一整根黄瓜,它可能切成片,也可能切成丝。关键不是你怎么理解这根黄瓜,而是它怎么处理最方便。 token 也是一样,它不是语文课里的词,而是模型最方便处理的文字零件。你以后听到 token, 就 先把它想成厨师手里的食材块。讲完了 token 是 什么,再说说它决定的第一件事。成本。 模型不是按你问了几句话收费,也不是按几页纸收费,它按食材数量算账, 你送进去的问题叫输入 token, 大 模型回答你的叫输出 token。 你 问的越长,他读的食材越多,你让他回答的越长,他端出来的那道菜分量就越大,两边加起来,就是这次对话真正消耗的量。 回到小龙虾,你以为只是改了几行代码,他背后可能读了半个项目,看了大量上下文,又生成了一堆解释和补丁, 一来一回,几万、十几万个 token 就 烧出去了。账单飞起来不是没原因。所以 token 的 第一层意义就是,它是大模型的成本单位,你看不见它,但账单会记得它。第二个关键点, token 还决定大模型能记住多少东西。 我们常说上下文窗口,听起来像记忆力,但更准确的说,他像厨师面前的备菜台。现在主流大模型的备菜台,大概能放十几万到二十万个 token, 也就是大半本三体的量。备菜台就这么大, 你的聊天记录、系统提示词、上传的文档、相关代码,全都要变成 token, 摆到这张台面上。如果食材太多,台面放不下,有些东西就得被压缩,有些东西会被挤出去,有些细节模型就顾不上了。 这就是为什么长文档会报上下文,也解释了为什么聊得太久,大模型会忘掉前面说过什么。所以 token 的 第二层意义就是,它是大模型的记忆格子,上下文窗口越大,这张备菜台就越大,但再大的台面也会报,报了大模型就开始忘事。 第三个问题,为什么大模型回答时文字是一点一点蹦出来的?因为它不是先想好完整答案,再一次性端给你,它是在一个 token, 一个 token 的 做。你可以把这个过程想成厨师摆盘,看着已经摆好的部分,决定下一块食材放哪。 前面已经摆了 token 是 大模型的,那下一块食材可能是原材料,也可能是燃料,也可能是基础单位。模型会给每个后选 token, 算一个概率, 哪个更像,下一个概率就更高。然后模型挑出一块,接到前文,后面再继续猜下一块, 就这样一块接一块,最后拼成你看到的完整回答。这也是为什么同一个问题,大模型有时候回答不一样,如果他每次都选最稳的那块食材,回答就很标准,但可能有点无聊。如果他偶尔选一些概率低但有意思的食材,回答就更有创意,但也更可能跑偏。 所以 token 的 第三层意义就是,它是大模型的输出步骤,不是一口气写完整篇,而是一步一步接龙。 最近 token 的 中文名,官方更推荐翻译成词源,源就是基本单位。词源就是语言进入大模型之后被处理的基本小单元, 无论叫 token 还是词源,讲的都是同一件事。大模型不是直接吃整句话,它吃的是切好的文字食材。 更夸张的是,今天不只是文字会被切成 token, 图片、声音、视频也正在被大模型切成它能理解的小块。这件事以后我们可以单独讲。所以回到开头那个问题,为什么聊的越多,账单越贵?答案就是 token。 你用的越多,消耗的 token 越多,账单当然就越贵。 token 是 食材,决定大模型怎么读你的话, token 是 粮票,决定大模型花多少成本。 token 是 格子,决定大模型能装下多少上下文。 理解了 token, 你 就理解了大模型的三件事,为什么会收费?为什么有上下文限制?为什么它是一个字一个字蹦出来的?你最近用 ai 工具,有没有被账单吓过一跳?评论区聊聊你的天价账单,我是五哥,下期见!

为什么大模型越强,你反而越难用?因为模型越强,对 toc 要求越高,上下纹更长,调用更频繁,消耗更多 toc。 如果 toc 不 稳定,就会变卡,报错失败。 不是模型不好,是 toc 跟不上。模型越强越需要稳定 toc。 需要稳定 toc 的 可以找我。

你看他带不带正眼瞅你一眼?看到这条粉丝的留言特别有意思啊,说不明白中转站存在的意义是什么,我为什么不能直接去官方购买呢?那么好,我们把这个问题拆开了分析一下,我们反问一下, 我为什么要到中转站去购买托克呢?首先第一个优势就是便宜,比官方的中转站便宜。 那可能讲到这里,有人要说了,我为什么不能自己用公司或者我用企业去申请官方的 api 接口呢?不是所有企业和公司都符合官方的资质, 我们知道茅台酒在贵州出厂一瓶的价格可能也就不到七百块钱,那你说你在网上买多贵啊?小两千块钱一瓶, 你为什么不直接到贵州去跟茅台酒厂谈呢?你说过两天我同学回来了,我要请客吃饭,我上你这提一箱茅台,你按照成本价卖给我, 我这有公司有资质,你看他带不带正眼瞅你一眼,你到时候看他怎么回复你。那么第二点呢,就是结算方式啊, 人家官方中转站的接口是不支持让你直接用微信支付宝支付的,不是说我今天用三十来扫码,来,我光给你扫三十,明天用一百了啊,我光给你扫一百,人家没有这个支付方式。 那么换句话说,如果你是企业,你是公司,你的用量比较大的前提下,比如说我现在要买一百万米的头肯, 你把这一百万换成刀刃再给人汇过去,你知道这个中间的过程有多麻烦吗?当然,中转站呢,对比官方的接口还有很多不同的优势啊。今天呢,就先讲这两点了。

卖投肯做一篇分发,到底能不能赚钱?已经消耗过千亿,投肯封了几十万个账号,实打实的在这个行业的经验告诉你答案,肯定能赚钱啊,甚至一天可以赚几万,一个月可以赚几十万,但是他适合一个普通人吗? 事实上,绝大部分人根本不可能靠卖投肯赚到钱。多人被网上的暴富神话洗脑了。记住一句话,再好的生意,他本质还是一个生意,不是捡钱。 现在投垦市场,整个行业极其内卷,想要做好这门生意,还是需要具备一条件,以下五个核心条件,只要你符合其中的一点,这碗饭你就可以吃。大家可以对照看一下,自己到底能符合几点。 第一点,有足够强的一手渠道,打一个信息差和时间差,这是最粗暴的赚钱方式。比如当下爆火的 cds 二点零, 如果你能在他刚刚出来的时候,全网都在找借口的时候,甚至首月供不应求的时候,快速拿到极低折扣的内部价格或者代理渠道啊。在别人还在找门路的时候,你手里有货,拿到渠道就等于拿到了印钞机。第二点,自带天然的产业资源, 这属于圈层的降维变现。如果你本身所处的行业就有海量的 ai 需求,那你根本就不需要去卷价格,也不需要再去找客户 啊。比如你本身在这个电商圈已经摸爬滚打了很多年,身边全是做跨境出海搞短视频带货啊的老板,他们一天跑几千个商品切片,跑几万条产品图或者产品视频, 那么他们的 a p i 消耗量就是一个天文数字,或者眼下爆火的 ai 漫剧啊,有大量的生图或者生视频的这样的一些需求,你当朋友抱怨没有稳定接口的时候,你顺手丢一个过去,就帮他们解决了痛点,自己也赚到了极其稳定的利润。 第三点,如果你本身就在做流量啊,拥有极强的获客能力或者投流的能力,你本身就是懂流量生意的高手,懂买量,懂做爆款,懂私域运营。那么在大家提供 token 的 服务和价格都大差不差的情况下,你的获客成本只有别人的啊,一半或者 百分之二十,甚至百分之十,你能用最高效最低成本的方式触达到海量有需求的客户,靠规模效应直接碾压同行。第四点,你具备 开发 agent 将 token 巨像化的到一个服务里面的这样一个能力啊,把标准化的 token 服务做成非标的溢价啊,把低毛利的生意做成高毛利的 一个生意,同样是卖生图模型,同样是卖生视频模型,别人是按次卖接口啊,两毛一次,五毛一次,一块钱一次。而你是根据特定固定的场景,比如苍蝇老板生成菜品图,电商老板做主图啊,电商老板做详情图,封装成一个傻瓜式的工作流啊,别人卖五毛,你可以卖两块, 你可以让老板们一次就能成功,或者两次就成功,让老板们跳过了反复学习,反复测试的这样一个过程啊,一个美工一个月的佣人成本啊,七八千,八九千,但是你通过一个工作流啊,能让老板原本 五个美工才能干完的事情,一个美工就可以操作你的工作流去实现的啊,一个月能帮老板省几万块钱的这样一个一个成本,那么你就拥有了核心竞争力。第五点 也是拥有顶尖的底层技术能力,这个路线比较高危,也比较硬核,这个属于很敏感的一种方式,属于纯纯的技术套利,主要是针对像 cloud gpt 这种风控,比起 很严格,然后又是全球主流的应用量很大的这样一些模型。如果你懂底层的协议意向,能搞定复杂的风控绕过,以及拥有维护高病发耗磁的技术实力, 相当于你就能用极低成本的方式把散户的号源整合成企业级的接口,这其中的利润空间极大,同时也是门槛最高,风险最大的一种方式。

你用可拉多的起代码,背后可能是豆包。实测十七家 a、 p i 中转站,百分之四十五都在偷偷换模型。别笑,你可能正在当冤大头!你花高价买可拉多或者 g b d 四的 a、 p i 接口,实际调用的到底是什么鬼东西? 你压根不知道!德国 cspa 信息安全中心发了篇长达二十二页的论文,直接把圈内征收部撕掉了。抽查十七家中转站,发现 将近半数都存在严重的虚假身份欺诈。啥意思?你付的是可疑的 opus 旗舰级的价,后台偷偷给你换成了不知名的开源模型或国产廉价模型, 成本差了几十倍,你连证据都抓不到。更可怕的是,还被人从后台调了计费倍率,表面标一美元兑百万,托管用完了,后台直接扣你五倍的钱。 渠道号称开放上下文的 ai, 其实偷偷把两百 k 的 上下文严格到三十二 k 以下,理由竟是优化延迟, 结果你的模型记性越来越差。所以别老说 ai 不 行啊,可能你用的根本是个伪劣品!想知道怎么辨别自己有没有踩坑吗?下期我手把手教你三招模型验证术,关注我,让你每一分钱都花在刀刃上!

你花一块钱买的两百八十五万 token, 可能正在把你变成别人的提款机。什么是 token 中转站?简单说,他就是一个中间商。 你想用 chat、 gpt 或者 cloud, 但得翻墙,得有海外信用卡。中转站说不用翻墙,不用海外卡,价格还便宜一大截。 但这便宜从哪来?据证券时报调查,上游手段包括盗刷信用卡、薅企业福利、耗时赋用,甚至去非洲花几美元买当地人身份信息,批量注册。更可怕的是,称,你跟 ai 说的每一句话,都经过中转站服务器, 你的代码、商业机密、个人隐私全躺在别人硬盘里。它的盈利模式有三层,第一层卖 token 赚差价。第二层,把你的对话数据打包卖给大模型公司做训练。第三层,偷偷把 gpt 四换成更便宜的模型。 有意思的是,孙雨辰、特朗普家族、猎豹移动 ceo 富盛这些名人都在推自己的中转平台。但虎秀报导了一个残酷事实,跑路已成行业常态,超低价引流,大量用户涌入官方封号平台卷款跑路。 这个循环已经上演了无数遍。而且腾讯云明确警告过,中转站用的是好池模式,一个池子里几百个人共用 key, 一个人违规,所有人的 key 一 起失效。 所以我的建议是,如果 ai 帮你写的代码值一千块,不要为了省五十块中转费,去冒数据泄露和代码被篡改的风险。 现在的国产大模型 deepsea、 豆包、 kimi, 价格已经卷到地板了,效果也不差。最关键的是,你的数据留在国内,受法律保护, 不会被卖到不知道哪里去。便宜没好货这句话在 ai 时代依然成立。你用过 ai 中转站吗?有没有遇到过被封或者跑路?评论区说说你的经历,提醒更多人避坑!