每个月的可瑞克的大模型 top 消耗,我用两个技巧至少能砍掉一半。第一个是 r t k, 它是一个请求拦截器,能够自动过滤掉每次提问的荣誉信息,比如什么多余的文件路径,重复的格式说明全部裁掉,只把有价值的内容啊传给 ai, 平均能够省百分之五十以上的投坑。第二个技巧啊,是定型运行压缩指令。一个绘画,你聊久了,上下文啊就会越来越长。后面你每条消息啊,都会把前面的所有内容重新问给 ai, 这时候啊,压缩一下 gray 的, 就可以把历史压缩成一段灾药,拓克消耗啊,立刻就减少了。建议你每完成一个阶段性的任务就压缩一次。两个技巧啊,叠着用,场景化的场景还是能够省不少费用的,记得关注再走哦!
粉丝1.8万获赞9.5万

全网首发,今天一条视频教会你获取 token 的 四种渠道,搞定中转站上游。 第一种, azure open ai, 作为目前大陆获取 open ai token 的 主要合规渠道, 虽然目前已经不再是获取 open ai 模型的唯一云渠道,但阿塞尔在大陆的特殊地位不变。微软也明确强调,在大陆提供的 hr open ai 服务没有变化,获取的一线货源稳定性与合规性极强,持有大量企业级合规认证。 第二种, safar ipi, 手动搭建,借助 safar ipi 等开源工具,将自己的网页订阅额度转换为 ipi。 如果账号很多,甚至可以调用 safar ipi 的 管理 ipi 编辑脚本,实现批量自动导入。但是这种方式只适合个人学习与技术探索。 第三种,逆向。这种方式极不推荐偷看,有效期非常短,只适用于私人且低频非重要的技术测试。逆向是验证想法的快速途径,但需自行承担风险。第四种,薅羊毛。 利用海外企业的免费试用额度或建立大量耗时赋用分发羊毛党滥用免费额度,且有巨大的时间沉没成本。 最后获取 token 推荐大家还是选择官方云厂商的直联或者 ai api 聚合平台,用激进官方的稳定性换来极低的价格。最后,祝大家创造力不断,用 ai 探索出更多惊喜!

现在 code 可以 直接使用 dc v 四了, code 确实好用,但是额度真的是不经烧,随便几个问题直接就清空了,又得等五个小时。所以我试着把 dc v 四接进去,烧了四 e token 之后,发现操作竟然很丝滑,体验也完全不输原版,关键是真的大碗便宜, 后面我会带你一步步接好。其实步骤是非常简单的,就三样东西, c c 叉, d c 的 a p i, 还有 c c switch, 而且工具我都已经整理好,你照着我这几部点,基本几分钟就可以搞定。 解压后先打开 c c 叉的文档,然后打开 emv 文件,里面会有一个密钥,这里你可以保持默认,也可以自己去修改一个。改完之后记得先保存,然后启动 c c 叉,它会弹出一个终端,你找到这个管理界面的地址, 然后按住 ctrl 键再点击,就会来到这个页面。进去之后把刚才 e v m 里面的密钥粘进去,就能够进入到后台,这里你可以顺手切成中文就行,这部分就基本搞定了。接下来我们去到 d c 的 官网,点击 api 开发平台,第一次进来得先注册一下,然后点击左边的 api key, 新建一个 key, 名字可以随便填。创建完记得先保存好,因为它只会显示一次。然后回到 c c 叉上面,选择 code, 中间点击添加频道,这里就可以直接把这个文档粘进去。最下面把刚才复制的 a p i 粘进去,创建就算成功了。记得顺手做两个设置,一个是选一下 openchain, 另外一个是把规范化,非常健 打开。这一步搞定, d c 其实已经接近来了,然后打开 cc switch, 点击上面的这个标志,右边新增一个配置,具体的参数你可以按照这个来就好。这里有三点是需要注意一下, 首先,这里的 api key 不是 d c 的 那个,是一开始 emv 里面的那个密钥。第二点,点击一下这个获取模型列表,就不用自己手动去填写了。第三点,把 e m 上下文窗口勾上,这样子才能全力去跑,下面这些都不用管,填完之后直接点击保存, 然后点击启动,最后把 codex 安装或重启一下,到了这一步就已经接好了。打开之后, codex 这里不是显示 d c, 它只会显示自定义。别慌,这个时候你随便发一句话,先试试能不能是正常使用。然后直接去看看 cc switch 的 使用记录,你会看到模型这一栏已经变成了 d c v 四 pro, 来源是 codex, 那 说明已经是链接成功了,也就是说后台真正在跑的已经是 deepsea 了。最后我补两个词,已踩过的坑。第一个坑是 cc switch 最新的版本,现在有 bug 会连不上 codex, 所以 别手痒去更新,直接用包里面的版本就行。 第二个坑是 d c v 四没有视觉能力,所以一旦你平时有看图识图这类型的需求,进来之后可能会有部分的能力用不上。不过好消息是这套流程本身是通用的,你可以直接换成其他的多模态模型,思路也是一样的。我是木马,陪你一起玩 air 赛博达子,咱们下期见,拜拜!

一个小技巧就让你节约一点三亿。 token 这个很火的开源项目专门干这件事。 r t k 它不是优化模型,而是 token, 让你成本可以减少百分之六十到九十之间已获得四十一 k star。 r t k 是 在命令进入上下文,对其进行压缩,更好的推理, 延长上下文对话。你可以把它理解成装在终端和 ai 助手中间的一层省油器。常见开发命令能节省百分之八十左右的上下文消化。

我拿到小米二十三亿 token 的 时候,其实是有点懵的,不是兴奋的那种懵事就这就这也能过迪那种懵?这个是 max 套餐的十六亿,这个是 pro 套餐的七亿。先交代一下背景,小米最近搞了个活动, 叫咪蒙 over 的 百万亿 token 创造者激励计划,三十天免费送一百万亿 token, 最高给到 max 上十六亿 cash, 等值六百五十九块钱。 这个话题已经有很多博主写过了,活动也快到尾声了,五月二十八日截止,还剩不到一周,按理说不该再蹭了。但我之所以还是写,是因为我发现了一个特别简陋 特别巧的方法,几乎百分之百能拿 max 档。这个方法我一会儿说,先把活动本身聊透。咪猫是小米自研的大模型,最新版本 v 二点五 分两个模型, pro 版面向复杂任务深度适配 a 剑客和编程,在 gdp v a l a a 和 clever 榜单上开源第一。还有一个是全模态版,文本、图像、视频、音频都支持 v 二点五, pro 用的 mo 架构,总参数三零九 b 激活十五 b, 原声支持一百万 to k 上下文推理成本只有国际币源旗舰的百分之二点五, api 定价大约是国际竞品的五分之一。 你可能觉得这不就是个国产模型吗?但坦率地讲,这次小米的成绩确实够硬。 texturina 全球综合第五, labyrinth 全球第四。 open route 上周以百分之三十多的试战率登顶第一 周条用量四点八二万亿 token, 而且它是开元的 mit 协议商用自由。说真的,全球前十开元模型里,中国占六席, 小米是第一个登顶开元榜首的手机厂商回到活动,这次 over 的 计划分两部分,一部分是面向开发者的百万亿 toc 创造者激励,另一部分是面向 ainc 框架团队的生态共建。我们聊的是前者,申请流程不复杂,去 mimo 填个表单,三个工作日出结果, 通过后邮件通知、登录开放平台等权益到账就行。但很多人卡在评估这步,拿到的是赠金,而不是 tiktok plan 或者档位很低。网上常见的建议是要写详细的项目描述,要有 github 链接,要做完整的项目, 有些教程甚至建议你前后端数据库齐活,搞得跟融资 b p 似的。我一开始也这么想,然后我发现了一个更聪明的路子,就是只做一个前端,一个用歪不扣定搞出来的非常非常厉害的前端不需要,后端不需要数据库,不需要部署上线, 就是一个纯前端页面,但视觉要炸,交互要丝滑,让人点开第一眼就觉得,卧槽,为什么这招管用? 你想啊,评估的人一天看几百份申请,大多数是 github 仓库链接和 api 文档,他点开一个仓库可能还没看完 readyme 就 关了,但你给他一个牛逼的前端,点开就是成品,视觉冲击力直接拉满,谁都能一眼看出来这东西好不好。后端逻辑写得再复杂, 评估的人不懂你的业务逻辑啊。但一个漂亮的页面,不需要专业知识就能判断质量。我自己 pro 档就是这么拿到的项目就一个纯前端页面,没写一行后端代码。我朋友按照我的方法拿到了 max 档。 噗儿当倒是我实打实拿作品申请的,自己写的 app, 还有几个 skill, 两者加起来一共二十三亿 token。 再说一个很多人踩的坑,一定要先注册好小米账号,绑好邮箱和手机号,申请表里填的邮箱必须跟小米账号绑定的邮箱一致, 如果不一致,或者你用的是手机号注册的账号,没绑邮箱,通知邮件根本发不到你手上,全一批了你也拿不到。 我一开始就翻车,在这折腾了好久才搞明白。所以正确顺序是先去小米官网注册账号,绑好邮箱,然后再去申请。操作上也不复杂,用 cloud code、 科斯尔或者任何顺手的 ai 编程工具,让 ai 帮你 vibble 扣度一个炫酷的前端页面,重点放在视觉效果和交互上,动画动效,享意识布局,这些能让页面看起来很贵的东西。多搞深情表里,把截图放上去, 项目描述写清楚,用了什么工具,做了什么功能,解决什么问题,就这样。最后说说这个 tucker 值不值得薅。 mmo v 二点五 pro 的 编程能力,我自己用下来的感受是比我日常用的 g l m 五车报强不少,跟 g l m 五点一比也差不了太多。 a p r 能直接对接 cloud code 浏览器, oppo 跨这些主流工具。十六亿 tucker 免费活动五月二十八日截止,池子部等人免费的羊毛,而且是比较厚的那种,不薅确实亏了。

不知道大家公司有没有使用沃克包利进行办公呢?给大家分享一下沃克包利节省投坑的小妙招,就是最近上班的工作量完全完全取决于公司每天提供的投坑量,就是没有投坑,就像阶段反应一样,完全干不了活,也不是不想干,是真的干不了。 就是 ai 写的那么长的提示词,或者他做的 html 的 demo, 让人工肉眼去改,你不仅会改出问题,而且你可能会少改漏改错改就每天,最近用沃克邦利大概一天需要消耗一千到两千的积分吧。呃,用的太快了, 只能用开源节流一,一方面去向公司申请,另一方面自己使用的时候肯定也要节省一点。有三个小妙招这里给大家分享一下。就是第一点,大家在使用沃克邦利的时候,模型那边一定要注意,之前, 呃,没有那个选项呢,之前就是想想用什么模型就用什么模型,现在它是区分了一个不同的梯度,比如智普的 glm 是 一点零六 x, 像 deepsea v 四 flash 只有零点零六 x, 就 数字越小,代表它这个模型 花费的积分越便宜越少,想想一点零六和一点零六差了几十倍。第二个点就是大家在个人设置的面,一定要把那个绘画风格设置成 高效直接,就这样就文字少,但信息量大,这个也要去设置。然后三点的话,在绘画管理那边要设置成三小时自动开启新绘画,或者两小时的开启新绘画。 因为有的时候就算想起来去新建一个任务,但有这个东西的时候,假如你两小时没跟他绘画的时候,他就会自动切分成一个新绘画,就会把历史的上下文给丢掉,形成一个干净的上下文吧,就要这样就减少头跟的输入输出了。 除了三个软件上的小妙招,然后大家在写提示词的时候也要有一个核心的目标,就是让模型少猜、少读、少改、少重复,少走弯路,把我们的 problem 写具体,按照一定架构写具体,这样就会大大节省我们消耗的头衔。

哈喽大家好,欢迎来到信息的视频。那今天给大家介绍一个宝藏开元项目,那这个项目呢?还真的是有点难崩。为什么这么说呢?因为奸商看到他呢,绝对会眼前一亮,满眼都是暴力, 感觉韭菜都快隔着屏幕长到他家去了。那另一边呢?如果是心没那么黑的小白用户,你也可以靠着他狂薅大场的羊毛,当然只要你心不是太黑,靠着他撑起一个挣钱的副业,那是完全没有问题。 那接上的黑幕呢?我们放到视频的后面再给大家讲,我们先来看一下对于普通用户来说到底有什么好处。我相信如果大家接触过一段时间这种相关的 ai ai 阵的工具了之后呢,就会发现,质疑你最终场景落地效果的其实就是那个模型的能力。 有的时候顶级模型大家又觉得太贵,然后就会去网上去搜各种各样的打折优惠薅羊毛的这种信息。因为各家的这个战略和节奏的不同呢,所以它的各种优惠程度和时间周期都不一样。你本地又装了各种各样不同的工具,有可能你是 codex, open claw, claw code, 然后又有这个 co worker 等等一系列的购单工具。一旦你当前用的这家供应商活动结束了,然后你想换到另外一家,换完之后你又得把所有的 api 配置全部都改一遍,非常繁琐。 我自己也有类似的感受,那每到这种时候,我就会在想,如果有一个工具能够让我把所有 api key 的 配置全部都收拢到一起,做一个集中的代理,这样的话,我的各个 ai 工具都只需要配置这一个代理工具就可以,以后如果有新的供应商 api key, 那 我只需要接入到这个代理里面就可以。 今天给大家介绍的正是这样一个开源项目,它叫 new api, 它能够实现呢就是把上游所有模型渠道的 api key 全部都收拢到一起,让大家进行统一的配置和管理。这样的话,作为新手小白,你可能各家都能够薅到一些新用户的羊毛。如果你想 ai 搞钱做副业的话, 你就可以打造自己的 token 池子,然后转卖给下游的用户来挣钱。那你的利润主要来源三个维度,第一呢就是批量 token 采购的一个折扣, 这个后面会提到。第二个就是你可以把新用户的免费额度呢融合进付费的套餐。那第三个呢,就是考同一个模型,不同供应商之间的一个折扣差异。实际的场景下,大家可以结合这个性能,供应商的稳定性,它的报价,整体的服务质量 各方面去进行一个综合评定,来维护你的模型托肯池子,你的最终目的呢,就是在留住用户的这个前提下,尽可能提高你的利润空间。好呢,先给大家看一下演示啊,这个项目到底怎么去搭建和配置? 首先带大家来看一下这个项目的 get up 首页安装的过程呢,其实也非常简单,它需要一个 dog 的 环境来部署,大家把代码呢克隆到本地之后,确保你的 dog 引擎和 dog compose 都已经正确的安装和设置好,配置文件改好了之后,直接运行 dog compose on 就 可以启动了,其实非常简单,然后再带大家看一下这个 new api 的 配置文件哈, 这里面其实大多数配置如果你是本地使用的话,不改也没有什么问题。唯一需要注意的是,关于这个流逝的响应模式超时这个的话呢,建议大家稍微配的大一点,因为配置的过小的话,有可能会出现流逝响应的时候中断的问题啊。再往下呢,它底层是依赖了 res 和一个关系数据库啊,它默认的是 posgrid 啊, posgrid 的 这个密码大家最好改一下在这个地方。 然后最后一点需要注意的就是它的这个端口号,这里大家选一个没有被占用的就可以,等一下服务启动起来之后呢,你要用它来访问网页的控制台啊。那配置好了之后呢,大家只需要进入你暴露的这个端口号啊,就会看到这样的一个触手的一个界面, 直接点击下一步,然后把用户名密码填一下,然后这里呢可以设置对外服务的模式,如果你想要对外提供多租户的商业化服务,拿这个挣钱的话就选这个, 如果你是自己本地使用的话,就用这个。选好了之后呢,点击这个出纸化系统好,过了一会他就出纸化好了,大家看到这个就是你的一个入口网关,如果你是对外提供服务的话呢,你应该去注册一个公网的域名,然后把这里呢通过配置文件改成你的这个正式域名, 接下来你点击这个获取密钥好,他会调整到你的控制面板。大家看到因为我是按照外部服务商的模式来出纸化的,所以这其实是一个多租户的模式, 包括你的调用量、数据看板,你 a p i token 的 管理,每个用户都可以拥有自己的 token, 内部直接继承了邀请、奖励和兑换码这种 营销的模式,也就是如果你想要运营一个中转商的话,你可以用这种模式来发展你的用户,让他帮你们去做营销宣传。你订阅的模式其实也是非常的丰富的,你可以去自己新建套餐,如果我是一个 a p i 中转商的话,我可以给我的用户定制一个属于他们的套餐, 比如说我建一个 pro 套餐,一个月是二十块吧,一种是美金,然后你可以设置购买上限,有效的单位重置周期啊,都是可以的。渠道管理这里呢就可以定义你的 token 的 来源,不管你是个人用户还是服务商,可以通过这里添加 api token 的 一个来源。大家看到这里,其实常见的供应商都是支持的, openai、 astropic、 aws, vertex, 包括国内的一些大模型全部都支持啊,包括 openai 的 这个 os 模式它也是支持的,即使有些小众的模型它没有支持,那一般情况下呢,那些模型它也都会提供 openai 或者 astropik 兼容的这种 api 模式啊,你也可以用这两个 直接去配置,也是 ok 的。 填好之后呢,你把对应的 api key 放在这里啊,注意这里的 api key 呢,不是发给你的用户的 api key, 而是你从上游购买的时候,那个上游服务商给你的 api key, 大家一定要分清楚啊, 然后在这个令牌管理这里呢,才是给你自己或者说你的下游用户他们去添加 apikey 的 地方,让大家看到你还可以给你的 apikey 去设置额度啊,设置模型的访问限制, ip 的 白名单啊,都是可以的啊,因为如果你是服务商的话,你有可能被你的下游用户去薅羊毛,那如何去规避这种情况 啊?然后在系统设置里面,你可以去做很多局的这种管控,来控制你的用户怎么样去使用这些模型啊?这个是性能的这个限制,这个是模型部署。对小白用户来讲,其他的这些系统设置大家都不需要操心啊,只需要去看这里。一个是渠道管理, 用来接入上游的一些供应商啊,不管你想薅哪一家的羊毛,哪家有免费的额度,你都可以去那边注册账号,然后在这边去添加就可以。然后这里给大家看一下他的这个高级设置。这里面啊还可以去设置一些 这个默认的参数,比如说你有一些系统提示词,你有一些这个 prompt catch 的 一些这种参数的启动,你都可以在这里直接去改这个请求头,参照官方的这个配置文档去改就可以了,包括系统提示词,你也可以直接覆盖,这个就是在 api 的 维度去配置了,相当于只要你调这个接口,它就会默认的把这个系统提示词改掉。 除了聊天的这个 check completion 之外呢,它还能支持音频、 embedding, 图像、视频甚至 revamped 的 模型啊,它都是有的, 也就是说基本上你对 ai 大 模型的所有类型的模型需求,都可以通过这一套框架在你自己的本地把 apikey 的 配置收拢起来,如果你自己想做 token 的 渠道商的话呢,那你完全可以用这个东西搭一套自己的管理后台。就有点像大家以前去做 vpn 搭梯子的时候用的那一套东西, ituray 啊, smartbox 等等这些。过去是做这个网络流量的生意,那现在到了 ai 的 时代,它就变成了做 token 的 生意,其实本质上是一套东西,大家把模型的渠道商配置好了之后呢,就可以实际的开始使用了,这个是它的官方文档,大家只需要把这里的域名改成你自己的域名啊,或者你的 ip 就 可以了。也就说不管你本地是什么样的客户端 啊,你是 openclaw, 你 是 clawco 还是什么其他的系统,那你都可以通过这一套模式在配置的时候用一个统一的地址去配。 那以后如果你有任何的新的渠道商的接入啊,或者你想要切换一个渠道商,那你需要回到那个管理控制台,然后在这个模型管理里面去做切换就可以。甚至对于同一个模型,你都可以换不同的供应商。比如说你在模型这里配了一个 cloud office, 然后供应商这里呢,你可以随时切换。你之前是 astropopy, 那 后续如果你觉得 a w s 或者 anti gravity 有更好的这个折扣和 deal, 那 你可以随时在这里改 cloco, openclaw 这些应用的配置完全不需要动。然后再给大家看一下模型部署这个地方,它的模型部署呢,是依赖了 i o dot net 这样的一个平台,带大家过去看一下 这个 i o dot net 呢,其实就是一个算力的供应商,大家可以把它列入成 a w s 啊,谷歌,只不过它专门是来提供 g p u 相关的这个算力的, 它并不像传统云浮供应商产品体积那么完整,而是专注在 gpu 的 这一块。大家看你可以在上面去直接买 he 版、 a 版这些英伟达的顶级的算力卡,直接去部署那些满血的模型,也就是说它从拓客的供应商呢,相对来说是非常全面。像这种 gpu 算力的供应商 啊,你可以直接采购 h 一 百 a 一 百的卡,然后回到渠道管理里面,你可以去依赖大模型的官方 api, 你 也可以去依赖云服务供应商。 而且像 a w s 谷歌这些呢,它们也有云端的这个 g p o 的 讯息机,比如说你直接在 a w s 上买了一个 a e 版的讯息机,然后在上面部署一个大模型,通过 open i a p i 兼容的这种方式也可以集成到这里面。然后大家看到这里还有欧拉嘛,比如你自己本地有个五零九零, 我上次一期视频给大家看过那个巴卡的魔改五零九零,那如果你是这样的用户的话,自己本地部署好了之后,用欧拉玛把这个巴卡的五零九零工装成一个模型, api 也可以在这里提供出来,大家看到它的选择还是相当丰富的 啊。刚才给大家讲了,普通的小白用户怎么样靠这个开源项目来提升自己 ai 工具使用的一个效率,来薅各种大厂的羊毛。那接下来我们黑化一下,来聊一下从奸商的这个事情 怎么样靠这些东西割韭菜赚取暴利?当然这里并不是鼓励大家去这样做啊,因为但凡有灰色利润的地方,他就会有一些政策和法律风险,大家就纯粹从用户的视角去看一下,尽量避免让自己踩到这种黑心的 api token 终端。商其实工具是同一套, 那这帮奸商为了攥取利润,势必就需要从各种不同的方向去压缩他的这个成本。这里给大家列一下,比如说他们会通过一些公网扫描的这些黑客的脚本去 扫那些有安全漏洞的 a 证网关。尤其是最近 openclaw 大 火了之后,有大量没有安全意识的用户,其实是把自己的 openclaw 网关直接开放在公网上, 而且也没有任何的 open 加密,那这些用户就极易被这些黑客脚本扫到,从而导致自己的 api key 泄露出去。 而且刚才给大家展示管理控制台的时候应该也已经看到了,他其实可以非常精细的去调整每一个账号,每一个模型供应商他的用量和额度。假如说我通过黑客脚本把你的 ip 抓过来,那我就是为了不让你发现,我可以把占用你额度的这个量调的非常低, 只要我拿到的这些泄露 a p i p 的 数量足够多,那其实所有的用户都在隐形的给我输血,而这些用户他有可能完全感知不到。那第二个呢,就是通过隐形的去压榨剩余的投肯,比如说他在卖给他的下游用户的时候,我声称给你 一周一百万的投肯,但实际呢,在你的用量达到比如说九十万甚至更低八十五万的时候,我就告诉你,哎,额度受限,你已经用完了,他就在赌大多数的用户不会做精细的投肯数量统计。 再有一个呢,就是他们会用大量虚拟的这个手机卡去注册各个大模型平台的一个免费账号,然后把这些免费的额度全部都薅一遍,因为虚拟卡它可以无限注册嘛,用完了,一波免费洋房薅完了,那我再注册一堆虚拟卡,如此网富。 那再接下来呢,是一种相对合规的操作吧,就是通过批量购买账号的方式,因为各家当你的账号购买额度购买的这个量大到一定程度的时候,都会有一些企业级折扣的。我通过注册公司账号,联系各家大国型供应商的企业服务的销售团队,然后让他们给我打折。 各个大国型供应商,他们的区域授权团队,为了获客,他们都有一定的折扣空间,那么这个空间也是我的潜在地。 那最后就是你更黑心的一点,那他们就会按比例直接去掺那些低智商低价格的模型,比如说我卖给你是 pro opus 四点六,那实际上我会在里面掺一定比例的海库,甚至更低尺子的模型,他们掺假的这个量呢,也会动态的调整,一边让你感觉不到, 同时另一边呢,它的利润也能最大化。希望这个工具可以提高大家使用 ai 服务的一个效率,然后同时避免遇到一些黑心的投坑中转商。 想要创业的朋友呢,也能在里面看到一些搞钱的机会。好,那今天的视频就这些,如果你觉得这期视频对你有用,欢迎点赞、评论、转发,那我们下期视频见。

全网最全教程,给所有想要做 toker 的 生意,但又不知道从哪里下手的小白,把底层逻辑和操作步骤一次性的给你们讲清楚。首先你们要知道 toker 是 个什么东西,简单来说,它就是 ai 模型的燃料, 不管是签的 gbt 豆包还是 dbsec 或者 jammin 或者其他的大模型,只要你想用它们的 api 接口,都要消耗 toker。 没有 talk, 一 切都是空谈。那我们做 talk 生意赚的是什么钱呢?其实核心就两个字,差价。官方平台 talk 价格普遍都偏高,而且有的还需要外币卡,需要特殊网络才能购买, 这对于大部分普通人来说就是一个门槛,一大半的人都被挡在了门外,但这对于我们来说就是机会,从上游渠道以更低的价格拿到批发价的客户,赚的就中间的差价,就这么简单。那这门生意的优势在哪里呢? 第一,门槛低,不需要你去懂技术,不需要你去搞什么服务器,也不需要囤货,有客户你就对接,没有客户也没什么成本。第二个,就市场很大, 现在 ai 相关业务的公司,工作室,还有自媒体博主、设计师,对于托管的需求越来越大,而且这个就是一个刚需,只要 ai 行业一直发展下去,这门生意就一直有的做。第三个,利润可观, 单比的利润可能没有那么高,但是胜在复购率高,客户一旦认可你的渠道之后就会持续的在你这边充值,积少成多。接下来是重点,小白从零开始,具体该怎么操作呢?第一步,找上游的渠道,这是最关键的一步, 渠道必须要正规,保证 top 不 参水,交易要合规,不然很容易出现问题,一定要多对比几家,确认渠道稳定,价格有优势才行。第二步,找客户。 客户呢,主要分成两类,一类呢,是企业客户,比如 ai 工具开发的公司,内容创作的工作室,他们对于托管的需求量非常大, 复购稳定。另一类客户呢,是个人用户,比如自媒体博主、设计师,还有一些想用 ai 工具的普通人。第三步,搭建属于你自己的交易流程,客户找到你之后,怎么去下单,怎么去付款,怎么去发货,要形成一套完整的流程。最后啊,我要提醒大家一句,做托管生意一定要守住底线, 渠道正规,交易合规, talk 不 掺水,这才是长久能做下去的核心,别想着投机取巧,记住,灰色地带的钱千万不要碰。我是做艺人公司 ai 创业卖 talk 的 老周,有任何问题都可以找我聊聊。

大家好,欢迎来到今天的分享。在二零二六年,大语言模型已经成为驱动创新的核心引擎,但如何选择合适的计费模式,直接决定了我们项目的成本和扩展性。今天我们将深入剖析按流量计费与套餐计费的核心区别,并为您提供最新的模型选型与成本优化指南。 本次分享将分为四个部分,首先我们会解析两种核心的计费模式,接着通过深度对比和决策模型,帮助大家找到最适合自己的方案。然后我们会介绍二零二六年值得关注的主流模型。最后,分享一些实用的成本优化技巧。 在深入探讨计费模式之前,我们必须先理解一个核心概念, token。 简单来说, token 就是 ai 模型处理信息的最小单位,你可以把它想象成文字的原子。我们输入的每一个字,模型输出的每一句话,都会被拆分成 token 来计算费用。特别要注意的是,模型生成内容的成本远高于理解内容, 所以输出托根的价格通常更贵。第一种计费模式是按流量计费,就像我们用自来水一样,用多少水付多少钱。它的优点是灵活启动成本低,非常适合项目刚开始的时候。但缺点也很明显,单价最高,而且当你的用量突然变大时,账单可能会让你大吃一惊。 第二种是套餐计费,更适合企业用户,它主要分两种,一种是席位订阅,就像买会员,先付一笔固定费用,获得高级权限,然后再按用量付费。另一种是预留吞吐量,你可以把它理解为包下一条专用高速公路, 保证你随时都有稳定快速的服务,但需要预付费用。为了更直观的理解这三种模式,我们来看这个对比矩阵。从成本结构、可预测性、单价灵活性等多个维度进行比较。可以看到,按流量计费最灵活,但成本不可控。预留吞吐量成本最低且性能最好,但前期投入大且不灵活。 习未订阅则介于两者之间,是成长型业务的平衡之选。那么,到底什么时候该从按量计费转向套餐呢?这里有个成本效益平衡点公式, 简单来说,就是计算出一个 token 使用量的临界点,当你的月用量超过这个点,套餐就更划算。反之,按量计费更经济。比如这个例子,月用量超过二十亿, token 套餐才开始显现优势。 为了让决策更简单,我们可以遵循这个流程图。首先看你的业务阶段,如果是初创期,果断选择按流量计费。如果业务已经规模化,再看用量是否稳定。如果对延迟要求极高,就选预留吞吐量。 如果需要企业级安全管理,就选习卫。订阅这个疗程图可以帮助大家快速找到自己的最佳路径。了解了计费模式,我们再来看看二零二六年市面上有哪些主流模型。 这张页面汇总了各大厂商的旗舰和自旗舰模型,包括它们的性能、评分、价格和核心优势。可以看到, clogs 四点七在推理能力上目前处于行业顶尖水平,适合处理复杂逻辑任务。 而 gpt 五点四则凭借其完善的生态系统和 api 集成能力,依然是企业级应用的首选。 同时,像通用千万 max 和 g p t 四 o mini 这样的模型在保持不错性能的同时,拥有极高的性价比,适合大规模业务部署。而拉玛四在 grok 的 支持下提供了极致的速度体验。那么到底哪个好用呢?这不仅仅是性能问题,我们从开发者体验、可信和社区支持三个维度来评估。 open i 的 文档和社区支持最好能让你快速上手。 astropica 的 可信行业领先,适合企业级应用, google 在 多模态方面又是明显, 而 gork 和 mr 则以其独特的优势在特定场景下表现出色。为了让大家更方便的选择,我们按场景进行了推荐。如果你需要写复杂代码,首选 cloud 四点七。如果是做通用聊天机器人 gpt, 五点四是全能选手处理长文档 gemna 二点五, flash 的 超长上下文式优势。而对于需要极速响应的实时应用, gork 上的 luma 四是最佳选择。 每个场景我们都给出了首选和性价比替代方案。最后我们来谈谈如何省钱成本优化的第一步是优化模型选择,不要用大炮打轮子,简单的任务用便宜的模型就够了。同时也要学会优化你的 prompt, 让指令更简洁。要求模型输出结构化内容,并限制他的回答长度,这些都能直接减少投屏消耗。更进一步的优化可以利用平台提供的高级功能,比如上下文缓存。对于重复使用的固定内容,可以节省百分之九十的成本。对于非实时任务,使用批量处理功能可以享受半价优惠。 在架构层面,构建一个多提供商的智能路由系统,是实现成本与性能最佳平衡的终极方案。我的分享到此结束,希望能帮助大家更好的理解大语言模型的计费模式,并做出明智的选择。感谢大家点赞支持!

拷坑计费时代可能会土崩瓦解。用三十二步打败了别人一零二四步的结果,训练数据只用了人家的十分之一。这是 mit 和凯明团队最近发的论文里的数字模型,叫 e l f 模型。同一个礼拜,字节跳动 c 的 实验室也发了一篇几乎同方向的东西模型,叫 kolldim 模型。如果方法有效,拷坑计费时代可能会土崩瓦解。 先看 mit 和凯明团队的王炸 elf 模型,三个数据直接颠覆认知,三十二步打败别人一零二四步的生成质量,训练数据只用四百五十亿,逃坑是主流模型的十分之一参数仅一点零五亿,却碾压千亿级效果,什么概念?别人要走一零二四步才能写完的文章,他三十二步搞定,速度快三十倍。 别人要为五千亿数据才学会的知识,他五百亿就精通,成本直接砍百分之九十。更炸裂的是,字节跳动 c 的 实验室同一个礼拜甩出考了 d o m 模型,和海可明思路几乎同方向。全球两大顶级 ai 力量不约而同放弃 g p t 式逐掏坑生成, 转向连续向量空间建模,最后一步才转文字。这意味着什么?按掏坑计费的时代可能要土崩瓦解。现在铲车 g p t 闻香一言全是按次数收费,以后 ai 生成又快又便宜,成本近乎白菜价。 也就是说,以前的那些收费逻辑都是错的,相当于新的成本。以后大家都是算力成本加一点点运营费用,写作、翻译、编程,所有 ai 应用价格大翘水。和凯明加自己联手捅破 ai 天花板,你觉得免费 ai 时代真的要来了吗?

ai 党直接狂喜,这个工具能直接把 token 消耗砍掉百分之六十到百分之九十。记住这个项目它不做花里胡哨的上下文压缩,而是从源头下手,在内容进入大模型之前就压缩干净。 com 压缩省百分之五十七, api 返回结果压缩省百分之二十六到百分之七十八。 command rewriting 最高省百分之九十五。大策略全自动跑,市面上的大模型基本适用,纯 ras 开发,零依赖 c l i 直接用也能集成进 agent 框架,自带统计面板,省了多少一目了然。

大家好,最近大家都应该刷到那条新闻了吧,深圳一个程序员用了某个在线工具,才三天就花掉一万二,全是掏坑费用,真的太吓人了。很多朋友跟我说,现在都有掏坑焦虑了,不敢随便用,不敢随便问,生怕一个不小心就扣费, 其实真的没有必要,今天我就教大家一个完全免费,不靠 talkin, 不 联网也能用的方法。本地部署大模型用到的工具就叫欧拉玛,它就是专门让你在自己的电脑上快速跑大模型的,像什么 deepsea、 千问这些主流大模型全都能本地跑。 接下来我就一步步带大家操作,跟着我做,你也能轻松把大冒险装在自己的电脑上。首先我们打开欧拉玛的官网, 这个时候我们会看到右上角有一个下载按钮,来我们点击一下, 在当前页面我们就可以选择适合我们操作系统的版本, 那么我的是 windows, 我 就选 windows, 然后继续点击下载按钮,这个时候呢就已经开始下载了,因为这个文件比较大,它需要的时间可能会长一些, 然后我们就找到我们下载完的这个文件,双击 双击之后就会开始安装,然后我们进行下一步 啊,等他完安装完成以后呢,他就会自动启动,那么这个时候呢,就出现了这么一个界面,就说明已经安装成功了。 我们来看一下这个界面,这里呢给大家说一个小技巧,如果在安装过程当中遇到什么问题,我们可以把问题发送给抖包,让抖包来协助解决。 那么接下来呢,我们就来验证一下欧莱玛是否运行成功, 当我们看到这个反馈界面的时候,就说明已经成功了, 那么这里呢,我也会把一些常用的指令分享给大家,赶快去下载试试吧!

嗨,朋友们!此时此刻,我的电脑上正运行着开源工具 open code, 它搭载着 deepsea v 四开源大模型,正在全力地执行我的一项重要的软件开发工作。 这几个月呢,我深度的使用了 open code 的 小龙虾,以及很多的开源 a 神的工具,大约烧掉了一百多亿的 toc, 也订阅了三家以上的 toc 平台,也买了一些中转站的二手 toc。 我 基本上已经实现了 ai 驱动,也做起了真正的 opc。 那我本人在互联网公司从业了十多年,担任过两家公司的技术总监,曾经也是很多人羡慕的一线互联网大厂的牛马,创办过三家公司,其中两家拿到过融资,最后一家被上市公司并购,那也算是一个真正的超级程序员了。 那因为小龙虾蹦极乐的爆火呢?我身边的朋友最近总是在调侃我说啊,你写了那么多年的代码,到今天是不是突然觉着这十多年,呃,白活了? 那这个问题我没有办法回答,说没白活,太较真,说白活了。说实话,我不甘心,那毕竟我没有参与到当今爆火的大模型和 ai 智能体工具的研发中。 当我看到大魔星像雨后春笋一样涌出的时候,其实我心里特别不是滋味,因为这些技术我好像都没有参与,也正是这个原因呢,促使我必须站出来做点事。所以这期视频我会大约花费五到十分钟时间,让你全面的了解现在爆火的 ai 话题。头肯, 首先,什么是 token? token 就是 算力这个词呢,在互联网圈和币圈一直都不陌生,过去我们多用它来描述一个互联网应用的健全秘钥,或者是说区块链技术发行的代币,像比特币。 但是现在呢,它基本上已经成为了 ai 时代的定价单位,几乎所有的大模型都是以 token 来定价。我举个例子啊,国内领先的开源大模型 deepsea 定价为,输入三块钱一百万投铳,输出六块钱一百万投铳。而美国的商业 ai 大 模型和 loftops 定价居然达到了输入五美元一百万投铳,输出二十五美元一百万投铳。 你可能会想,这个单价到底是什么概念呢?我直白来告诉你啊,一个汉字占大约一到三个投铳。 比如说我最近在读的这一本遥远的向日葵帝,这本书呢,大约有十五万字。如果 ai 去写一本十五万字的书,大约会消耗掉二十到三十万的 token。 但这并不是说使用二十到三十万 token 就 一定能写出 这么好的作品,那你可能需要多次调教优化,实际耗费的头肯可能多达几千万,甚至几个亿。说到这,你可能会觉着头肯有点抽象,但本质上来说,这就跟当年智能手机发展初期,移动互联网来临时的流量套餐, 我们买的流量多少兆和多少 gb 区别不是很大。只是今天的主要产品呢,从过去的手机变成了 ai 大 模型。 接下来聊聊 token 怎么产生。先说结论, token 由电力产生。为什么这么说呢? token 是 大元模型部署运行在搭载着专用的高端 gpu 显卡芯片的 ai 服务器上。 它通过软件运行和运算,将用户提出的问题任务经过推理,生成对应的答案,然后再告诉你,因为算力运转的背后就是电力消耗, 高性能的 gpu 服务器每分每秒都在耗电,以现在一级难求的 b 三百算力服务器,整机功耗来说,就能达到五十到六十千瓦,这是什么概念? 是一个小时用电量高达五十到六十度,二十四小时用电量大约一千两百度,一个家庭一个月的用电量大约才三百度左右,你可想而知这是什么概念,那未来全球电力 都会不够用。而由于 openclaw 等 ai 工具的崛起,全球算力的需求量相比去年呢,暴涨了一百多倍,而且现在是供不应求,算力越紧缺,电力就越值钱,这就是算力,就是电力的 底层逻辑。第三呢,普通人怎么抓住 ai 和 token 的 机遇?首先,不知道做什么不要紧,你只要做就已经抓住了机会,哪怕只是下载了豆包 dipic 的 手手机软件。因为你身边的人还不明白 ai 是 什么的时候,你就先行了一步, 因为机会总是会从有准备的人中挑选幸运者去降临的,而你不做,就永远不会被挑选到。对于技术型互联网的从业者呢,有这么几件事情其实是可以做的啊。第一,投行销售。目前的投行销号主力军是全国的一千万软件工程师,主要用于抠顶 以及一百万多的 ai 短距运营者。如果你有一定的资源,可以面向软件开发企业啊,视频制作企业啊,帮助他们去采购和 管理他们的 token 资源。而 token 销售还有一个最低成本的方式,就是搭建 token 中转站, 其实这是一个我非常建议有一定技术基础和推广能力的互联网从业者去做的事,不管他赚不赚钱,我都建议你做,这也是你可以熟悉 token 的 商业模式,最低成本的一条路。 你可以通过 token 中转站聚合起来各大厂家的官方合规算力 api, 既能帮助到大模型厂家销售投垦,也能帮助算力的需求方整合 api 资产,方便调用。 但我绝对不建议你通过非法途径将海外的大模型通过代理服务器中转到国内销售,这种行为不但会触犯法律,而且会危害我们的国家数据安全。 今天我就不展开讲,但是我后期会专门推出一期视频来跟大家分享。海外模型中转站为什么会危害国家安全? 第二件可以做的事情呢,就是 ai 的 应用开发。开发 ai 相关的应用现在成本已经非常低了,可以使用 ai 工具去开发小而解决问题的应用。比如说你通过 呃 ai 工具开发了一个 ai 生成音乐、 a i p s 照片, ai 生成短剧等等。这样的小应用可以将 ai 的 能力封装为小而美又便捷的应用,提供给需要的用户。用户使用的时候,每次向你支付 使用的平台费用,就变相地将头肯销售了出去,那互联网时代的网站 app 最终都会成为互联网遗产。 过去在互联网时代所做过的事情,用 ai 的 逻辑我觉着都必须要重新做一遍。各行各业的 erp、 mess 系统、 oa 系统等等,都会推去到幕后,进而接替他们走向台前的是 ai 智能软件。 那除了刚刚所说的软件之外,各行各业使用的还有客服系统、营销系统、门店管理系统等等,都会在两年之内由网站 app 模式转向 ai 智能调度的后台模式,但这是我的预测啊。 第三个可以做的事情呢,就是 ai 相关的直播和网络讲师,这件事情是真的谁都可以去尝试做的事情,一年通过它轻松赚几十万应该是没有太大难度的。这件事情呢我就不详细, 对于非技术型的互联网从业者呢,我有以下几个建议,第一呢,通过 ai 工具和 ai 应用去升级现有的互联网和新媒体的运营策略, 比如说用 ai 工具去提升内容制作、用户运营的效率,比如豆包、 deepsea, 复杂一点的像扣子、龙虾等等的基础的 ai 工具就可以帮助你在电脑上的工作效率几乎可以翻倍提升了,那你就可以省下更多时间去 开展客户渠道了。第二呢,可以去开展线下的 ai 工具的培训, 当你成为 ai 的 先行者之后,你就可以掌握知识的定价权。在信息闭塞的小城市,尤其是二三线城市,三四线城市,完全可以办起来一个针对成人的 ai 培训小班, 比如说一个人我们收费九百九十九元,一期收一百个学生,一年只办四期,不要多办,那这件事情完全是行得通的。第三 就是 ai 大 模型的应用本地落地。其实我们回想一下,在互联网时代,或者说在移动互联网时代,所有的政府部门、企事业单位几乎都做了两件事情,第一就是建设企业网站或单位网站。第二呢,就是 内部的管理系统,也就 o a 或 erp 等等,那这些其实都是旧时代的数字基建,而在 ai 时代,基建两件事,也就是 ai 智能和算力, 尤其是国有的企事业单位和政府部门,一定会要求私有化部署,这就意味着有三个产品你可以卖,第一个呢就是 a 智能软件,第二个呢就是大模型的整机,算力整机。第三呢就是智能体的定制, 这些都能确实帮助到本地企事业单位的将 ai 的 模型落地到实际的业务中去。接下来我分享传统的企业如何借助 ai 叉上发展的翅膀。 如果你正在创业,公司规模并不大,或者说处于二十人以内的规模,我建议朝着一人公司,一人 o p c 的 方向的角度去尝试发展。但这并不是说公司只有一个人,而是过去所主持的 业务、生产、交付等各个环节,都可以借助 ai 工具去实现高效率的全流程突破式提效管理。那如果说你已经有了一家相对稳定的公司,无论是传统公司还是传统科技公司,几乎任何行业都可以借助 ai 工具去提质增效。 首先可以干的事就是迅速的梳理出公司的各个流程中的卡点啊,并分析是人为卡点还是流程卡点还是技术卡点。当然除了人为卡点之外,我觉着都是可以用 ai 工具来赋能优化流程的。 其次呢,就是建立一套企业级的 ai 智能工具链,那使用免费的开源工具就可以实现这些,将公司内部的 oa 系统、财务系统、 max 系统、 erp 系统等等各种系统全部都实现接入, 那第三步呢?我建我非常建议是全员凹印 ai, 尤其是从管理层的尝试,到全面接受,再到全员的深度使用,我相信只要两到三个月,就可以让你的企业插上 ai 的 翅膀。 其实我还想分享一点的是,所有的企业,无论规模大小,千万不要想用 ai 去裁掉人类员工的工作。 我们应该牢记自己的创业使命是实现中华民族的伟大复兴。通过 ai 赋能必然会带来效率的提升, 你可能会认为会有很多岗位会被 ai 所替代,但 ai 的 效率提升会带来更多的新矛盾和新问题,而这些新矛盾和新问题都是因为 ai 赋能引起的 维度级别的矛盾,这些矛盾也都必须由人类员工去解决啊。现在呢,我们正处于人类文明有史以来可能 最大的一次科技革命之中,这一次改革和革命以及机遇甚至比过去的工业革命的规模和机会还要大 很多。生活在二三线城市,远离科技和 ai 互联网的朋友可能感受不到,但是在美国,在新加坡以及北京、上海、杭州等等一线城市,如果一个创业者的项目不是 ai 项目,那他可能甚至很难获得投资者的投资了。 直到现在呢,我这个视频已经录制了十七分钟,通过剪辑可能会压缩到十到十五分钟吧。那后期我也会通过 视频直播的形式跟大家见面交流关于 ai 时代的话题。当然,我也会延续我超级程序员的身份,不断去尝试 ai 领域的技术创新和对开源世界的探索。我会不定期的将自己的一些技术通过视频分享给大家, 下次如果你希望我分享什么问题呢?可以在评论区分享出来,我会非常用心的一一阅读每一条评论并回复你,我们下次见。

经常有人在后台问我,你用什么模型,怎么节省 taco? 或者怎么能买到便宜的 taco? 那 我今天回答这三个问题。第一个是我平时用什么模型,我主要是用四点六、 sony 四点六 这个模型基本上可以应付我大部分的工作场景,从我的经验来看,这一个模型就够了。如果你有更高的要求,比如你重新写一个软件的时候,你要对这个软件进行架构规划,这个时候你可以用欧普斯四点六。 我的经验来看就是新手不需要考虑怎么节省掏坑,因为新手期都是在摸索和探索当中,这个时候你就是需要大量消耗的掏坑, 这样你才能积攒经验,等经验积攒下来之后,你自然而然就会节省掏坑了,那个时候你的指令会更加精准,这样就能避免浪费掏坑。那还有就是怎么能买到便宜的掏坑。我推荐大家一个网站, 这个网站里有非常多 a p i 的 中转站,而且每个网站价格都不同,像便宜的桑内特四点六模型才八块钱一百万。 top 已经非常便宜了,基本上实现了代码自由。如果你要是有生图需求的话,像香蕉二模型 也才不到一毛一张。我这个视频估计要把卖 top 的 得罪了,以后没人再去网上买 top 了。

今天教大家一下如何最大化的节约你 cloud code 的 token。 第一个就是这个切模型,你切模型的话就相当于把你的缓存命中给清空了,这个这样的话你的缓存命中率就降低了,消耗的 token 就 会更多。 还有一个就是你新装这个工具 m c p, 你 装这个绘画内新装 m c p 是 不影响的,不影响当前的绘画的,但是你复位或者是 reload 插件 触发工具数值重组之前的这个缓存就全没了。还有一个就是我们经常改的 cloud md, 这 cloud md 它也是启动的时候读一次,你这个改,改完这个,嗯, cloud md 之后 不要 resume, 否则,否则你的缓存也是清空的。最后一个点就是这个这个东西, 它这个缓存时间是五分钟,呃,你做长任务之前添加这个命令,把这个缓存时间延长到一个小时,这样的话可以上头看,就这个命令。