gpt 五点五的 api, 输入一百万个, token 十八块,输出一百零八, cloud opus 四点七,输入三十六,输出一百八。而 deepsafe v v 四 pro 输入三块,输出六块。十几倍到三十倍的差价, 梁老板是我把电费一填,就当定价了,差着百分之三十,百分之五十可以理解,差了十几倍到三十倍,里面一定有别的东西。而我翻了一圈技术报告和行业分析,发现这件事可以拆成四层来看, 每一层 deep seat 都比别人省钱,垫在一起才有了这个价。一层算法传统大模型是密集型的,每次回答问题全部参数都要动,就像一个医生,什么病都自己看,从头查到尾。 deepseat 用的是莓混合,专家里面有很多子模型,各管一摊,来了问题,先由路由判断该找谁,然后指教那一个出来。 v 四 pro 总共有一点六万亿参数,但每次只激活四百九十亿个百分之三点一, 剩下百分之九十七不动,不动就不好算力,不好算力就不花钱等 m o e 有 个副作用,专家多了,每个专家都要记住对话上下文,这东西叫 k v 缓存,传统做法下, k v 缓存很吃内存,对话越长越严重。 deep seek 搞了个 m l a, 把 k v 缓存压了百分之九十三, v 四,又加了一个 d s a, 再压十倍。翻译成人话,一块 g p u, 别人能服务十个人, deepsea 能服务几百个。贪到每个用户头上的成本就这么拉下来了。第二层,训练成本, 这里我要多说几句,因为有一个流传很广的说法是错的,你大概听过 deepsea 训练 v 三之花了五百六十万美元,当时全网都在传 说中国团队用零头做出了美国公司花几亿才能做的东西。五百六十万这个数指的是 v 三最后一次成功训练的 gpu 电费。在这一次之前,他们做了多少失败的实验,试了多少种架构,写了多少行费代码, 这些都不在五百六十万里。 semi analysis 后来发了 deep seek 的 硬件采购记录,估算真实支出在五亿美元以上。 c n b c 引的报告说算上所有研发总投入可能超过十三亿美元,但反过来,就算花了十三亿, open ai 和 astropica 花的可能是这个数的好几倍。 同样的能力, deep seek 确实省了,只是不是五百六十万这种神话级别的省钱。第三层硬件,这层的逻辑挺讽刺的, deepsea 用的也是英伟达 gpu, 但不是 h 一 百,因为美国出口管制,只能买到 h 八百,互联贷款被砍了一刀的残血版芯片比别人差,按理说应该更贵才对,但因为没有好芯片,他们被迫在软件层做极致优化, fp 八低精度训练, doopipe 流水线调度, ptx 底层指令重写。这些是用 h 一 百的团队根本不会去想,没必要被卡脖子,反而逼出了省钱的办法。然后今年四月为四发布,这次更彻底不再是英伟达了,全部改成华为升腾九百五十, pr 为 四成了全球第一个完全不用哭泣的前沿大模型。结果呢,硬件成本降到英伟达方案的三分之一,推理成本降到 gpt 四的七十分之一。 阿里腾讯智捷看完直接下单了几十万颗升腾,原来是被逼的,现在成了优势。第四层,商业模式。这一层可能是最关键的。 deepseat 的 母公司叫换方量化,一家对冲基金管理规模超过七百亿人民币,二零二五年平均收益百分之五十六点六,一年赚了超过七亿美元。 deepsea 的 研发费用对他来说只是零头。一般的 ai 创业公司,拿了 vc 的 钱,必须赚钱,必须上市,必须给 lp 回报。定价要盖住成本,还得有利润。 deepsea 不 需要没有 vc, 没有盈利指标,没有退出倒计时定价,只需要覆盖边际成本。所以他们敢把 api 定到对手百分之一的价格,聊天免费,想用就用。但有一个时间点值得注意, v 四 pro 现在的二点五折到五月三十一号结束,到时候价格从三块涨到十二块,翻四倍。 当然,就算涨回原价,还是比美国竞品便宜一大截。但这个时间点本身有意思,是促销到期正常恢复,还是策略在悄悄转向, 谁也不好说。被算法层用极致优化省 gpu, 硬件层从被制裁走到国产替代, 商业层用对冲基金的钱补贴研发,单独拎一层出来都不难解释。四层全部做到,并且每一层都做到极致,这是 deepseat 真正厉害的地方。这。所以我后来想, deepseat 便宜这件事,本质上不是他们有什么魔法,而是他们没有那些包袱,没有必须用的顶配芯片,没有必须服务好的 vc, 没有必须交出来的利润表。把这些包袱都卸掉之后, ai 可以 是现在这个价格。
粉丝60获赞872

兄弟们,最近跑这个 agent token 烧起来是真的心疼,所以今天这期我们专门聊一件事情,怎么搞到便宜的甚至免费的大模型调用金额。先搞清楚你到底在烧多少钱。普通聊天场景的豆包、 germany 这类网页产品, 一问一答大概就是几千到几万投坑,一个月下来大约就是三四百万,花不了几块钱。但是 agent 就是 完全是另一个级别了,他要自己拆任务,自己执行,自己复盘,跑一个任务可能调用几十上百个模型。我翻了一下自己的使用日制,每个月消耗大概在三亿投坑左右,算一下账, 可二个四点五的定价,输入三美元,输出十五美元,每百万投坑考虑存储比折扣大约五美元,每百万投坑。 按照这个价格,每个月光跑 a 阵子就要烧掉近一千五百万美元,换成国产模型便宜很多,但一个月也要两三百美元。所以今天这期没有任何广告,纯粹是我自己踩坑后的真实的经验分享。 一个思考框架先放在这里,省钱这件事情本质上是三个维度的取舍,价格、稳定性、模型、能力。 三个不可能同时拥有。想要严格,效果又稳定,那就贵。想要便宜,就能在能力或者稳定性上做让步。但是这个逻辑咱们逐个拆解一下。先说 cloud 的 扣,折扣最大,但是坑也最多。 有人实际测算过,订阅一百美元的套餐,利用期限能兑换价值一千三百五十美元的金额,相当于不到一折,换算成人民币大约是零点五。人民币能消耗一美元的量, 但是有两个大坑,第一,账号在国内极其容易被封。第二,官方允许接入第三方工具,但是只能在 cloud code 的 此类官方产品里面使用。 想要套餐折扣,又想要灵活接入吗?那就得无限中转这条路了。但是中转站本质上是批量采购,再零售成本价也是零点五人民币兑换一美元,其实零售价是在人民币一块钱以上的,所以建议不要一次性充太多。 open ai 呢, 最大规模活动也非常多,相比 cloud 动不动封号, open i 是 非常大方的,不仅允许接入自家产品,还可以对接 open cloud、 open code 这类的第三方项目。总换算上大约零点三人民币,能消耗一美元的量, 而且活动是真多。比如说 g p t 的 套餐,首月免费,网上你搜一搜团队拼车,几块钱就可以用上原价二十五美元的一个月的这个会员,拿上这个会员跑偷啃,几乎等于白嫖。缺点是呢,写代码的速度偏慢,但是可以多开任务,用数量换时间。 谷歌 java 呢,能力稍微弱一点,但是有白嫖的空间。 java 系列写代码的综合表现整体是略逊于 clod 还有 gpt 的。 但是有一个骚操作,通过教育活动申请免费的一年的谷歌 ai 会员,用谷歌的东西, 用它来跑 clod 的 模型。还有更丰富的玩法,用 clod 的 api 把 ide 里面的模型接口转出来给 clod code 的 这类工具调用成本约为零。 最近谷歌在间隙调整了 ide 的 限制,用了多少人之后,稳定性就开始下降了,这种方式只能是仅供参考了。国产型号现在价格最香,看需求选国产模型的零售价本来只有海外的一到两折,套餐之后呢,更便宜了。 kimi k 二点五。 目前我觉得国产力最强的实测能力跟 club 的 四点五差距不大,海外版呢,有首月零点九九美元的活动能得到呢,原价九十九的套餐还支持接入第三方工具。 国内版本的活动力稍微弱一点,而且套餐里的 token 给的量也稍微少一点,控制台也看不到具体的消耗数字,这一点其实我是挺介意的。 tbc 目前国内体验下来最大放地下,最低档每月二十元,每年二百四十元, 接口开放度非常高,各类工具接驳,缺点是高峰,因为这个套餐买的人太多了嘛, token 速度有时候慢的真是离谱。 mini max 设置策略和 diss 比较像,但是这里就不重复展开了,再说。因为答这个,很多人好像就突然想到了,它是提供完全免费,限额不限。 这个开源模型的接口,包括 kimi 二点五, d 四点七, mini max m 二点一都有这个,但是用到的人实在是太多了,热门模型的响应真是慢到离谱了,你只需要做了解就可以了。 最后整理一下角色策略,如果你追求最强的效果, club 的 中转站目前得分最高,预算有限呢?国产首选 d p c 的 套餐是最优惠的。 kimi k 二点五的效果是最好的,想要白嫖 open ai, open ai 的 拼车几乎是零门槛,效果也不差。 但是这次呢,我只是用到了我测到的渠道,还有很多我没测到的渠道。如果你有更好的方式评论区见,大家一起交流一下。

那 token 到底要怎么定价呢?一度 token 到底要多少钱?那我们给 token 定一个新单位,一百万的 token 等于一度 token, 那 现在一度 token 的 话,最便宜的要八毛钱。那我给大家分享一下,市面上主流的 token 大 概是什么价格?就按照我们刚刚聊到的,一百万的 token 等于一度 token, 那像豆包的话,呃,一度 token 差不多是八毛。嗯, deepsea 在 一元左右,国外的像 chat 的 gpt 在 十五元一度,然后 gmini 更贵了,差不多要十八元,所以你看国内外的这个模型呢?嗯, token 价格其实相差还是蛮大的, 所以对于企业主户,我们个人玩家来说就很清晰了。如果你追求量大,很便宜的话,就用国内的大模型。如果你要处理一些复杂的任务,或者是一些专业度比较高的,你就优先选择国外的模型, chat 的 gpt 啊,然后 gmini 这些。 所以对大家来说,一旦我们开始计算 token 的 成本,那 ai 就 不再是管玩具了,而是真正的生产力的工具。 那我们企业在接入 ai 时,接入这些大模型的接口,嗯,就不是在跟他闲聊了,而是要把他真正用到业务里。比如说我们在 c d 行业,现在有一些企业对于一些基本的客服运维的问题,都已经接入了大模型,他可以随机的去切换业务或者是下发业务。那其他行业,比如说一键设计海报,或者是优化你的这个审稿、改稿文案这些,他 它的每一个优化的条件和建议,其实都是在背后在燃烧 token, 那 在今年的二零二六年已经不是在比谁的这个大模型大的年代,而是在比谁用最少的 token 设计出最佳的方案的时代。

呃,大家是不是都用上了这个 g p t 了?然后我最近不知道大家有没有发现这个很多人在卖 g p t 的 账号,然后很多人好奇他怎么卖的?我今天给你们讲一下啊,把技术原理给你们拆解一下。首先就源于 open i, 它有一个实时级的漏洞,就是,呃, 你在 app, 比如说我们用,我用苹果苹果端,然后去在 open i 的 app 下单,然后呢下单付款成功了之后,它会产生一个单据, 产生一个单据,然后这个单据是要从 app 的 网服务器啊,从要从 app 发到 open ai 的 啊官方服务器上, 然后官方服务器去处理它才会充元。但是呢他们是通过一个技术端 去把 app 这个单据生成了之后,把这个单据拦截下来了,这个单据没有发送给给这个 open i 的 这个这个官方,然后呢他把这个单据自己拿到了,自己自己通过一些手段得到了, 然后啊苹果付款,然后直接退款,直接退款,然后把钱拿回来,然后把这个单据去啊伪装成一个请求,再加上一个,比如说一个买家的一个账号,然后去发,再再向这个 oppo 的 服务器发出一个申请, 然后这个时候啊啊这个这个这个这,然后买家的这个账号就被充值上会员了。那么这个主要就是源于 open i, 它没有把单据和付款账号这两个东西绑定起来,所以造成了这样一个漏洞,所以说造成现在 市面上有很多 g p t 的 这个这个呃呃呃低价的会员,呃,反正我们团队是已经做出来这个东西了,然后我们也可以好好的,就是说是有有很多这种 g p t 会员,然后我发现这个市场空间真的巨大的,因为五点五亿出来, 主要是主要是 codex a p p 它那个交互做的特别好,哎, skill 啊,什么各种各样的体验,特别特别好,还有什么引导的功能特别好,比这个 c l i 好 用多了呀。哎呀, 所以说现在很多人都在买这个 codex 的 这个账号,你们能想象到中间的利润有多少吗?因为它根本没有成本,没有任何的成本, 然后他一个账号大概一个月能卖一百八左右,而且这是没有收获的价格啊,两两两百左右,大概是 没有收获的价格,然后来一个两百来,一个两百来,一个两百,没有任何成本,我简直暴力,这个,这个太可怕了,但是不知道 open i 什么时候会把这个东西给修复掉了,所以说大家买这个账号的时候也要注意一下,很有可能 open i 会随时的修复这个 bug。

最近干货让 deepstack 为 callex 打工, tockin 节约百分之五十。嗯,我手搓了一个工具,让 gpt 五点五能指导 deepstack 工作,把我的 tockin 消耗降低了百分之五十,把性价比拉满。 deepstack 桌面版就是今天最好的 ai 生产的工具,但它缺点有两个,一是订阅太贵,二是 gpt 五点五的额度太废。而 deepstack 又是一线模型中价格最便宜的,让 gpt 当大毛, deepstack 干活才是最完美的组合。 但 deepsea 是 需要接入可捞的扣子让他干活,然后把它包装成 mcp 给 callix 调用。我写好的 mcp 已经开源可用啊,大家可以直接跟 callix 说让他装上啊。这个 mcp 的 核心价值呢,有以下几点。 这个 m c p 本身我就是用 codex 桌面版开发的啊,开发过程很简单,可以说有手就行。如果你希望做一个这样的 m c p 的 话,可以把下面这些话发给 codex 桌面版 啊。注意,这样做出来的只是一个基础版啊,甚至不一定省 tokyo, 你 要一边用一边跟 codex 对 话来解决各种问题啊,最终肯定是能迭代出一个跟我一样甚至更好的版本,大家都可以试一下。

token 价格直接砍成电费?杨文峰,你的权威我后知后觉,当我还在心疼每个月的 a p i 账单时,你梁叔已经把价格打到了跟电费一个水平,这个就叫专业。同样的 token, g p t 收你十几块, cloud 收你二三十块, deep seek 只要几分钱,还有谁? 四月二十四号 deep sec v 四刚发布,结果你梁书第二天直接打二点五折,第三天缓存价格再砍到十分之一,三天降了三次价,整个行业的定价部门集体失眠,梁文峰凭啥能做到这么便宜?技术上真有两把刷子。第一,算法上用巧劲,普通 ai 模型处理信息,一百万字,从头看到尾,一个字都不落。 书越厚,成本越高。 deep sec v 四不一样,他用了一种类似精华笔记的压缩技术,先抓重点,跳过荣誉信息,同样读完一本书,他花的算力只有别人的十分之一。第二, 芯片上换隧道。以前跑 ai 模型全行业都得用英伟达的高端显卡,有钱还买不到,但 deepseek 已经在华为升腾芯片上跑通了全流程训练和推理,同样的活,国产芯片方案成本直接砍掉六七成。而且梁文峰自己也说了,现在 v 四 pro 的 算力还没完全到位,等下半年华为新一代芯片大规模铺货之后,价格还要再大幅下 讲。那问题来了,你梁叔图什么?不怕亏吗?人家说了,我们的原则是不贴钱也不赚取暴利。 deep seek 背后站着的是换方量化,白天搞 ai 研发,花了钱,你梁叔晚上九点半转头去换方上班,第二天开盘就把钱赚回来了。连英伟达的黄仁勋最近都公开说, and the day that deep seek comes out on huawei first that is a horrible outcome for our nation。 一个中国公司把 ai 做到了白菜价,还顺手帮国产芯片撕开了一道口子,梁胜的恩情确实还不完。

有人靠倒卖 ai 接口,一个月流水干到十几万,没听说啊,客户先充钱后消费,全自动扣费,没库存、没售后。今天我把这个生意的四种正规的盈利模式啊,全发一遍,看完你知道能搞明白一件事情, 那些卖的比官方还便宜的人,他们到底是怎么活下来的?这个生意到底是什么?一句话, ai 模型的 api 中间商,上游对接 cloud, gbt 这些海外的模型,下游把接口打破成 key 卖给个人啊,小团队中间啊,我们就用 sub to api 做健全计费分发, 赚的就是偷看差价,但光靠差价是赚不了大钱的,真正赚钱的人,他玩的是就过去。四种赚钱方式啊,我们一笔一笔算。第一种圈子里去常见的玩,上游批量拿官方额度走企业的折扣,批量采购成本比你单买啊要低个二十到三十个点,下游加价十到五十个点,你算算啊, 在我就 a p i 做头干级的精准计费用多少扣多少,差价的利润啊翻翻到五十个点,一个小站每天消耗一个亿,头干的话,光差价你一天就是三百到五百块。月流水十万的话,正规的纯利啊,一点五到二点五万,净的利润能稳定在十五到二十个点。 重点是什么?没库存、没售后,全自动,但只赚差价的是最基础的玩法。真正赚大钱的,看第二种,欲充值,资金沉淀 用户要等充了钱才能用。你想想看,一百个人充了钱,撑死了三十个人会马上花完,剩下七十个人呢,就一直躺在你平台上面。零成本的现金流就这么来,搭配上 app 支付插件,各类主流的支付方式,全自动结账,不用你人工收款了,资金他自己啊就赚起来了。但这还不如利润最高的 第三种才叫真正的无本万利定月套餐啊,万元套餐,月固定额度内畅用一百九十九的团聚套餐, 背后逻辑是超售,说实话,百分之九九的用户根本用不完。你给的额度,你买一个企业订阅,分给十到二十个人用,成本是固定的,收入啊,直接翻倍。这三种都是正规玩法,利润已经相当可观,但真正拉开和同行差距的是第四种, 增值服务,面向企业级的客户,收技术服务费,什么多模型聚合,什么负债均衡,数据监控,私有部署, 一单就是几千上万纯利润啊!做投款差价的满大街都是,但能做企业级定制的两只手,那这才是真正的护城河。四种玩法合在一起看就很清晰了,投款差价打底啊,预充值,提供现金流定位套餐,放大利润,增值服务,打高天花板,综合进的利率啊,十五到二十五个点。 说真的,这不算暴利啊,但他是一个能长期赚的现金流生意啊,你要知道, a r 风口几十年啊,正规玩法能赚钱,但圈子更刺激的是那些不能说的东西。这么说了啊。

大家好,欢迎来到第三期,今天聊关键问题,货源稳定、低价、合规的货源是赚钱的基础, 本期将揭秘四个普通人也能上手的正规渠道,让你告别信息差。货源是生意的起点,无稳定、低价、合规的货源,一切都是空谈。 新手常遇高价无利润,低价有风险、踩灰铲坑等痛点,本期就为你揭秘四个普通人也能轻松上手的正规货源渠道,解决这些问题。第一个渠道是大厂官方 api, 优势是最稳定最合规, 要做到低价,关键在于利用官方的批量折扣, back discount 最高可达百分之五十, 适合有技术能力,能整合批量任务的玩家。第二个渠道是聚合平台,堪称性价比之王,他们集采 api 在 转卖,价格通常是官方的五到八折,且支持人民币结算, 适合所有新手和个人卖家,是入门首选。第三个渠道是国产大模型目前的成本洼地,国内价格战激烈,部分模型价格极低,适合对模型能力要求不极致或需要特定中文能力的场景。 渠道四,企业团队版拆分,类似内部福利,成本极低,但风险高,因违反条款可能封号,不推荐为主渠道,仅做小范围补充,必须划出红线,绝对不能碰灰产渠道, 如共享账号来源不明的低价 k, 宣称无限 token 的 平台,这些都是骗局,会让你账号被封,人财两空,记住,一分钱一分货,切勿贪小便宜。总结,四大渠道各有优劣,新手首选聚合平台, 有了货源,下一步是去哪卖?下一期分享五个高转化销售渠道,感谢观看,欢迎留言交流!

你有没有发现,同样是写一段文案,有的 ai 秒回钱省钱,有的 ai 半天不说话,一开口就刷掉你几块钱的 token。 在 二零二六年, ai 的 竞争已经不止是谁更聪明,更是谁的智商更廉价。今天我们要搞一场硬核实验,拿一百块钱预算去买 g p t gemini、 豆包和 deepsea 的 脑细胞,看看谁才是真正的性价比。之 在 ai 的 世界里, token 不 能简单理解成单词或者汉字,而是模型理解世界的最小语义单位,你可以把它想象成乐高积木。有的模型分词器很粗糙,一个汉字要拆成三块积木。国产模型像豆包和 deepsea 对 中文做了深度优化,签字消耗可能只需要七百个 token。 这意味着还没开始比创作海外模型在中文语境下就已经自带两倍溢价了。为了公平,我们放弃网页端,直接在 microsoft 环境下通过 openclaw 网关调用 api 原型。为了方便测试它们的性能和性价比, 决定给这四个 ai 发送同一个赛博朋克设定大纲,要求他们扩写出一张一点五万字的科幻小说,并且同步生成五十组风格迥异的短视频口播文案。我们要兼顾的指标有三个, 一、输入压缩率。同样的设定,谁组的偷看更少。二、逻辑消化比。为了理清这一点,五万字的剧情, ai 在 后台偷偷思考了多少。隐藏推理、抽空。三、缓存命中率。在多人对话修改中,谁能帮我们省下那该死的重复计费? ppt 五点五 现在 g p t 是 公认的全科状元,指令遵循极其精准,几乎不废话,但在计费上显然有点尊贵了,一百块钱在他这儿大概只能买到五百多万个速度透支。 g p t 的 文采确实是编剧级别的,他写的阔写小说人物湖光极其精准,指令遵循度几乎是满分,但在 open core 的 日子里,一百块钱在他这儿烧的实在太快。杰伦三点一 pro, 来自世界搜索引擎大厂 google 的 jimmy 价格略低,一百块钱能买到约四百九十万个速度透支。 它的必杀技是原生两百万超长上下文。实验表现,当小说写到一万字以后, g p t。 开始出现角色性格崩坏,但 jamal 依然能精准记住开头埋下的 伏笔。这么说,如果你在 openclaw 里挂载了整个公司的历史爆款文案库做参考, jamal 的 性价比会瞬间陡增,更适合做自媒体文案工作。超长片小说或海量资料的文案重构豆包国产选手入场,画风瞬间变了。二零二六年,豆包 pro 的 报价极度震撼,输入三点二元百万 token, 你以为的一百块钱,你能买到惊人的三千一百万个输入头梗?实验表现,豆包的作文语感非常灵,他知道现在的流行梗虽然在处理极其深刻的哲学思辨时略显平庸,但在生成口播文案时,他的速度和成本优势简直是降维打击。 最后是卷王 deepsea, 它的单价低到离谱,简直是强大的推理模式。它是唯一一个能精准指出我大纲里逻辑冲突的模型。虽然它在写文案前会产生大量的思考 token, 但单价只有 g p t 的 几十分之一。实话说,在内容创作上,它写的小说并不能算得上有趣,其实这也不是它的强项, 限于 p f 有 限只在文案能力上进行测试。如果你对不同大模型在代码能力等其他方面的表现感兴趣,不妨评论区留言,我会根据大家的需求再去产出有关的内容。在 ai 爆发发展的时代,与其追求最强模型,不如发挥不同模型的个性和优势。 聪明的创作者不应该只盯着一个模型用,而是要在 open code 这种多模型网关上根据任务难度灵活录用,这才是顶级开发者的机操。

哈喽,大家好,今天跟大家聊一下关于这种免费投屏使用的问题啊。像啊,我自己的话,一般在用三个呃投屏的平台,第一个就是 字节的翠森啊,它是开发这一块,投屏的话用起来是比较快的,然后它也有几个特别好的模型,第一个就是 mini max 两点七啊,它也有付费的这种模型可以用,比如说呢, dipsic 四 pro, 包括界面三点一的版本,但这两个版本的话就需要排队啊,有很严重的排队。 然后呢,它的国际版就可以呃,间接的解决这个问题,就是它国际版的话,每个月有三美金的赠送,当需要有这种比较复杂的需求的话,我一般会用翠的国际版,也就是用它三美金这个版本来进行一些复杂任务的处理, 但是像一些简单的任务啊,或者说可以用 skill 去做好的这种任务,就基本上它的国内版就 ok 了啊。嗯,还有一个呢,我自己在用的就是英伟达的平台,黄教主的平台。黄教主的平台呢,就特别良心啊,它没有 token 的 限制,然后它只有一个 呃一分钟五次 api 调用的限制啊,所以这里边儿呢,就是当呃有一些比较长周期的,就突破销量特别大的这种任务,比如说一些大的 需求的刚开始的一些开发,那可能就会用黄耀祖的这个英伟达的开放者平台来做。它上面的话也有几个比较好的模型啊,目前的话只有只留了 mini max 二点七了啊,原来还有 deepsea 三点二 刚开始的版本,包括 g l m, 也就是智普的四点七的版本可以用, 但是就是像英伟达的话,它有一个小小的细节,就是注册的细节,如果你是用个人的邮箱去注册的话,就很难注册到啊,像国内的话基本上注册不了,像我自己的话都花了好长时间去注册,就就后面就一直没搞定, 完了之后到网上找了很多资料,然后他们讲说要换成企业的邮箱就 ok 了啊,结果我换成企业邮箱 就立马就注册好了啊,所以有这样的细节。以上就是我自己在用的这几个, 就是开发当中有用的这几个托管的平台,目前的话没有托管慌啊,至少免费的话每天的工作量都是 ok 的 啊。大家有什么更好的平台可以留言那?拜拜。

g p t 四涨价的消息让很多人慌了,但先别急,教你三招省一半。第一招,不是所有任务都需要 g p t 四简单问答文本分类数据提取用 g p t 三点五或国产模型完全够用,价格只有十分之一。第二招,用 token 中转平台聚合掉用量拿批发价,同样接口省百分之三十到百分之六十, 一个 key 就 能切换十几种模型,不用各家单独注册。第三招,优化 prompt, 百分之八十的人写 prompt, 又长又模糊,精简话术,一次说清需求,投肯用量直接减半。涨价不可怕,怕的是你原本就在浪费,想一键切换多家模型,省心省钱的可以看看我们的智算平台。

现在很多人还在免费白嫖 ai, 好 像大摩星公司都在做慈善。其实免费白嫖的时代即将彻底结束,一场巨大的商业风暴已经来临。今天我就拆解一下 ai 算力的透坑变现,包含产业链重构的解读,信息量比较大,建议收藏后仔细观看。我们看到啊,三大通讯运营商已经集体下场了, 上海电信推出蒜粒 toc 套餐,一块钱可以买二十五万 toc, 直接用话费支付。这个绝对不是一次普通的流量套餐,而是 ai 商业化落地的超级拐点。回到二零一五年,当年三大运营商推出四 g 和五 g 套餐,所有人都嘲笑流量太多没用,以前大家只发发文字,哪需要这么多流量。 但是结果呢?巨大的套餐流量直接造就了万亿级的短视频市场。今天全面推行的算力透彻套餐,就像当年的五 g 流量套餐,历史正在以惊人的相似度重演,背后采用的逻辑也非常的清晰。 先看最上游的算力供应商,他们已经建设了海量的智算中心,大模型公司每天都在疯狂烧钱训练,但是产出的现金流啊,并不匹配算力厂商承受着巨大的资金压力。 现在三大运营商带着真金白银入场,上游算力的价值终于实现了闭环。再看看中游的大摩星公司,他们本质上啊是 token 制造工厂,之前开除了马力,生产了海量的 token, 库存的积压导致商业模式跑不通,但是现在运营商出面集体采购,相当于工厂拿到了超级大等,一下子彻底盘活了整个资金链。 最核心的是下游的渠道商,也是本轮红利中赚钱最狠的一环。谁掌握了低价拿 token 的 渠道,谁就掌握了新时代的超级提款机。 就像当年的白酒,渠道上他们不需要自己酿酒,只需要低价拿货,然后铺满渠道。三大运营商手中有数亿的 c 端用户,他们最懂得如何做深度的下沉。 未来分销渠道彻底打通会带来什么?这必然催生 ai 应用的全面爆发。以前国内很多用户没有付费习惯, 但现在 token 和话费直接绑定了,这种习惯会被快速培养。海外早就习惯了 ai 编程服务,国内这个巨大的缺口正在被迅速填平。未来一到两年,行业会迎来剧烈的质变, ai 应用将步入指数级的爆发期, 产业红利从技术端向应用端转移,谁能把算力卖出去,谁的应用能疯狂消耗 token, 谁就是时代真正的王者。

闲置算力或者用不完的透坑怎么办?想找稳定且低价的透坑怎么办?二零二六年五月开始,临近开放,磁源工厂将接入所有稳定且可溯源的合规算力磁源工厂,国际站和国内站将成为中国版 oppo。 解决以下五个问题,一、快速对接算力服务器租用过程中的商务 slv 和个性化过重,耗时耗力,通过标准化的透坑 api 降低复杂的使用过程。二、那管闲置算力 包租五年、三年或者是一年的 ai 服务器集群,都可以通过 token 的 a p i 提供算力到临近磁源工厂聚合分发平台成为 token 的 提供方。 三、算力低价且透明。提供算力 token 的 提供方都有自由定价权利,磁源工厂固定加价百分之五,提供 c 端的算力 token 服务,项目开源且透明。四、 token 的 聚合和分发,多余的 token 可以 提供给磁源工厂,不够 token 的 时候可以调用磁源工厂的算力解决弹性使用。 五、代理销售及建站。对于看好磁源业务的小伙伴,通过磁源工厂可以一站式代理销售,或者以临近磁源为提供方和建站服务方建立自己的头等分发站点。你可能成立四线或者五线城市首家磁源科技公司,这五点可以解决你的磁源问题吗?

最近很多人都在私信问我,现在国产 token 已经便宜到地板价了,中间商做代理的还有钱赚吗?我先给大家报下真实行情, deepseek v 四 pro 每百万 token 才三点四八美元,还有它的 v 四 flash 版本更便宜,只要零点二八美元。 对比一下 gpt 五点五 pro 的 三十美元,价差直接超过一百倍。说白了,一个卖高价,一个已经卷到白菜,价差直接超过一百倍。说白了,一个卖高价,一个已经卷到白菜,价差直接超过一百倍。说白了,一个普通代理还能有利可图吗? 我明确跟大家说,不仅有钱赚,而且赚钱空间,发展空间比以前还要大的多。大家一定要搞懂一个逻辑,价格变便宜并不是在压缩中间商和代理的利润, 反而把整个市场的大盘子、大蛋糕彻底做大了。中间商代理的利润逻辑其实很简单,无非就是看单笔差价和整体调用次数。以前托肯价格居高不下,只有大企业专业开发者才用得起,普通人根本不舍得碰。 所以钓用量特别小,市场本身就很窄,哪怕单比差价看着还行,走不起量,整体收益也做不起来。但现在完全不一样了,投肯直接便宜到几毛钱的级别,中小企业、电商、个体户,甚至普通职场人都能放开随手调用,再也不用小心翼翼省着用。给大家看一组数据, 两千零二十四年初,国内日军投肯钓用量才一千亿,到了两千零二十六年三月,直接冲到一百四十万亿, 两年多时间,整整膨胀了一千四百倍。关键这还是日均数据,含金量有多高,不用我多说吧。不过大家别误以为 tokun 便宜就可以万能通吃。虽说国产 tokun 性价比拉满,但国产模型和海外模型各有各的强项,各有各的适用场景,并不是国产一降价就能完全替代海外模型。 咱们先说说国产模型,目前在三大场景里实力已经完全够用。第一,中文内容深沉,写文案做脚本,日常办公排版比海外模型更贴合咱们的语言习惯。第二,常规推理问答查知识解疑惑,简单逻辑分析响应快,不拖沓。第三, 成本敏感型,批量人物,批量做客服话术,批量整理数据,用国产模型直接能省下百分之九十的成本。所以日常办公写文案、做基础,客服用国产模型完全够用,没必要花冤枉钱去碰高价海外模型。 反过来讲,像 chatgptcloud 这类海外模型,有四个核心场景依旧无可替代,国产模型暂时还追不上。第一,复杂推理和深度调研涉及法律、财务、技术交叉类难题, cloud 的 多层逻辑推导特别严谨。 反观有些国产模型,容易给出看着没问题,实则经不起深究的答案,关键场合很容易掉链子。第二,代码生成和漏洞修复。 咱们常用的 github co pilot 底层本身就是 open ai 技术,不管是复杂架构设计、跨语言开发还是深层 bug 定位, chat、 gpt 和 cloud 依旧是开发者的首选。第三, 创意写作和长文本创作,写小说剧本、深度行业报告。 cloud 在 内容连贯性、人物人设统一、顺序节奏把控上质感明显更突出。第四,英文和跨语言场景,海外模型在原生英文表达、文化隐喻理解、学术写作规范上天生就有优势。做外贸文案、英文论文、海外本地话绕不开它。 总结一句话,日常普通任务用国产模型,省成本,关键核心任务用海外模型,保质量、稳底线。很多人看到这里还是想不通,既然国产够用,海外又有门槛,那对咱们做聚合、做代理到底有什么实实在在的机会?下一期,我接着给大家拆解企业真实痛点,代理的三大核心红利,一次性讲透。

token 产业链里面一个被严重低估的机会,那就是出海。嘿嘿,好,我们来先来看一组对比的数据啊,完成同一轮的标准测试。国内的 mini max m 二点五的成本是一百二十五美元, 海外 cloud ops 的 成本是四千九百七十美元, ppt 五点二的 codex 是 三千两百四十四美元,差距 几十倍啊!为什么国内这么便宜呢?两个原因啊,第一,单价低, minimax 的 输出 token 价格只有 cloud 的 百分之六,输出价格只有百分之五。 第二,用量少啊,完成同样的任务, mini max 消耗的 token 数量呢?只有 cloud 的 百分之三十六, gpt 的 百分之二十九,那单价 更低,加上用量更少,最终成本拉锯达到了几十倍。哎,这不是一点点优势,而是碾压级的优势啊。 mini max 是 出海的典型案例,二零二五年的海外收入 五五千,二零二五年的海外收入五千七百七十万美元,占总营收的百分之七十三。 ai 原生产品收入从八十万美元涨到了五千三百 一十万美元,哎,增长了六十六倍。这对 token 中间商意味着什么呢?铺海市场是一个巨大的增量, 全球的开发者和企业都需要 ai 的 服务,但是海外的 token 价格比国内贵了几十倍,你把海外客户接入国产模型,同样的效果,他只需要花十分之一甚至更少的钱,这个价值主张太强了,兄弟们,客户没有理由不选你啊。 而且跨境对接的门槛高,接口适配合规问题,结算问题实驱的沟通,这些正式中间商的服务空间啊。 海外客户自己去对接国产模型太麻烦了,你帮他搞定,他愿意为服务付费。国内卷价格是越来越难赚了,出海的利润空间大得多。托管中间商呢,不要只盯着国内市场啊,全球市场才是真正的南海。 好了,我是大卫啊,深耕 ai 大 模型聚合服务领域。如果你对 ai token 这个生意感兴趣的话呢,可以留言 ai 啊,可以赠送鄙人写的一本电子书,资源经济, ai 时代普通人的黄金赛道。

你想过卖 token 到底怎么变现吗? token 的 变现,其实是一台精密咬合的经济机器,从最底层的 gpu 机房,到最上层的 ai 应用,每一层都在想方设法把这一粒小小的磁源吃干榨净。今天咱们就一层一层扒开看。 二零二六年三月,国家数据局直接把 token 定义成智能时代的结算单位。就像工业时代有千瓦时,互联网时代有流量, ai 时代就靠 token 来当通用的度量衡。 那问题来了,怎么用这个度量很赚钱?第一层变现玩法,官方当收费站,就是大模型公司自己卖 token 给你,价格现在基本透明。 open 内的 g p t 四点零输入,每百万 token 收二点五美元,输出收十美元。 国内的阿里云 qw 减 max, 输入两块四人民币,输出九块六。你可能会觉得这利润也没多吓人吧?其实不对,我给你举个真实的例子,字节跳动的火山引擎。二零二五年,光对外卖 token 这一项就干了一千九百四十四万亿次调用 什么概念?国内 max 市场将近一半的份额被他一个人吞了。规模一上来,编辑成本就像被压路机碾过一样,越来越低,越便宜,越卖,越卖越便宜。 第二层玩法,中间商赚差价。国内用户想用 cloud gpt 支付,不方便,网络还卡,那怎么办? 有人就搞了个 api 中转站,把几十个模型打包成一个入口,你通过它调用它,悄悄抽成,这个生意能做到多大?说个真事,有个哥们叫 alex taylor, 之前是 open c 的 联合创始人。 他搞了一个平台叫 openroot, 只抽百分之五的佣金。二零二四年十月月流水八十万美金,到了二零二五年五月,变成了八百万美金,七个月翻了十倍, r 六 z 直接给他估值五亿美金。还有更狠的,一个月租二零零美金的 cloud 账号 被拆开重组转卖,能卖到两三千美金。有投资人私下说,他们盯的一个中转站项目,月流水五百万人民币,毛利率接近百分之五十。听到这,你大概明白了,这哪是做生意,这简直是暴力收购机。当然,这里面有正规军, 有灰色操作,也有卖假货的。你花 cloud 的 钱,可能买到的是别的模型的。回答第三层玩法,把自己变成 token 工厂,不当中转战了,直接自己铲 token。 给你讲个上市公司的故事,讯测科技上市不到四个月, 十二点八五亿营收撑起了千亿市值,怎么干的?他把商业模式从按月订阅改成了按 token 消耗量付费收入公式变成了 token 价格成调用次数,你用的越狠,他赚的越疯。中国电信更绝, 直接搞了一个磁源经营平台,从 token 的 生产调度到变现,全链路自己打通。他们总经理说过一句话,加快从流量经营迈向磁源经营,这是关键跨越。 在这个逻辑下,运营商不再是单纯的管道工,而是时代价值的主导者。第四层玩法, token 套利。同样一个 token, 用在不同的地方,价值能差出几十倍。你拿它做普通问答,不值几个钱,但你要是拿它来分析法律合同,解读医疗数据、跑金融风控模型呢? 单位价值直接起飞。有两组数据,你可以对比看看。二零二四年初,全国每天消耗的 token 大 约一千亿,到二零二六年三月,这个数字突破了一百四十万亿,两年多涨了超过一千倍。卖 token 从来不是终点,真正值钱 的,是怎么让每一粒 token 在 流动中跑出最大的价值,那才是藏在 ai 经济深处的财富密码。我是麦田, 深耕 ai 大 模型聚合服务领域。如果你对 ai token 聚合分发感兴趣,可以查看我主页,可以免费赠送一本我写的电子书。磁源经济, ai 时代,普通人的黄金赛道。

我们的所有的头肯都比方低,甚至有五折、四折、三折的,明白吗?我举办这样的沙龙,举办这样的课程,达到这样的规模,因为我有大量的这个 分发的代理,你去拿低价只有两个,第一你有这么多的代理,第二你能包量。两件事情我都在做,我在通过这个课程发展代理,我也在去包量,所以我能拿到低的折扣,这就是我们做这件事情的优势。也是我为什么不会去做假,不会去参假,不会去做任何一个掺水的事情。 重要的是你要选对来源,就跟你买东西一样,你要选品牌的地方买,我们也不会乱收费的。你去一些完全没有认知,随便搭上来网上搜来的小站点,它掺水太容易掺了。想掺水有十种办法来掺水,你得找可信的地方,明白吗?

五月十七日,电信日,三大运营商集体官宣,正式上线 tok 算力套餐。自此,运营商正式进入流量加 ai 算力的双经营新时代。运营商把 tok 定义为 ai 时代的通用流量,并支持话费支付。 不过,三家运营商的 tok 布局打法各家差异较大。首先是中国电信依照自研星辰大模型,全国统一定价,个人版九点九元就能拿下一千万 tok, 低价尝鲜体验。二十九点九元四千万 tok, 四十九点九元八千万 tok, 满足重度使用需求。开发者套餐三十九点九元起,顶配两百九十九点九元,包含一点五亿 tok, 稳抓大众与政企市场。其次是中国移动用低价快速拉新,靠多省差异化覆盖全国, 精准锁定年轻人和内容创作者。上海移动推出一元四十万 tok 的 低价优惠,北京移动则主打融合体验。二十四点九九元一千万 tok, 还提供内置 opencall 的 云电脑融合套餐,不用自己部署,开机就能用。最后是中国联通,先用免费额度抢用户,上海联通七月前可免费领取三千万 token 体验额度, 再靠联通云加远景大模型,重点供开发者与中小团队个人套餐,每月最低十五元,团队版最低一百九十八元。发布 token 套餐后,三家运营商股价暴涨百分之七点七四,中国联通飙升百分之五点五八, 中国移动逆势涨百分之二点四三、为什么运营商突然集体叛变流量?真相太扎心!二零二五年,三大运营商营收几乎零增长,老旧盈利模式走到瓶颈, 反观 ai 赛道爆发式增长,国内日军 tucker 调用量突破一百四十万亿,两年暴涨千倍以上,加上工信部明确推进算力普惠,全面推行 tucker 计费标准,所以是实打实的行业重构。最后问大家,你想体验运营商的 tucker 套餐吗?还是觉得这是新的收割套路呢?