free token router 是 一个聚合国内主流大模型的统一 ai 网关与流量分发系统,面向用户、开发者和企业三方构建闭环,用户通过签到、邀请、广告等方式免费获取 token, 并调用 deepseek、 quan g l m 等模型。 开发者通过 open ai 兼容接口,一套 sdk 加一个 key 即可调通全部模型。企业则通过赞助 token 定向投放给目标人群,用户在使用 agent 或调用模型时消耗赞助额度,实现精准获客。 技术上,基于 next and j 加 post girl sequel 双重记账钱包加 open ai 协议,网关向上统一调用体验,向下做多模型路由与计费,抽象本质是在做一个 token 级流量调用级转化的 ai 版拼多多分发网络。
粉丝9.4万获赞41.6万

最近玩智能体啊,实在太消耗 token 了,所以我们今天要来讨论说啊,哪里能搞到便宜的甚至是免费的大模型 token 呢?首先我们来看一下,如果正常使用 token, 大 概是个什么价格呢?像我们日常最常用的这个网页版的聊天机器人啊,类似于豆包、 jammy 这些网页的服务, 一问一答,大概每一次呢会消耗几千到几万的 token。 一个月下来呢,大概可能就是三百万的 token, 数量也就是几块钱。但 agent 就 完全不一样了,它要自己规划,自己执行,自己反思,一个任务跑下来呢,可能会调用几十上百次模型。像我们最常使用的 cloud code, open code、 open cloud 这些智能体啊,每一次跑起来都要消耗几万甚至上百万数量级的 token。 我 也翻了一下我自己的使用日志啊,然后大概估算了一下,我每个月的使用量呢,大概是三亿个 token 左右。然后我们来算笔账,如果你使用的是 cloud sum 的 四点五这个模型, 它的价格呢,大概是每一百万的 token, 输入呢是三美元,输出呢是十五美元。考虑上一些这个缓存啊,折扣啊,平均价格呢,你可以认为是每一百万的 token 五美元左右。那这么一算啊,其实你跑一个 agent, 每个月其实要烧掉一千五百美元左右, 就算是换成便宜的多的国产模型啊,一个月也要用到两百到三百美元,这个价格呢,我觉得还是蛮离谱的。所以这期视频啊,我就来跟大家聊聊,怎么才能搞到便宜的甚至是免费的大模型接口。先说好,这期视频呢,是没有任何的广告的,全是我自己实测 实际使用的经验。在正式开始之前啊,我想先给你一个这个思考框架,省钱这件事情呢,本质上其实就在做三个维度的取舍,价格、稳定性、模 的能力。你不可能三个都要,如果你想要最强的模型并且稳定,那肯定就会稍微贵一点,如果你想要便宜,那肯定就要牺牲一些模型的能力或者是稳定性。我们带着这个框架呢,然后再来逐个看各家的方案。先来说这个 cloud 买套餐到底能省多少钱呢?官方没有公布套餐的实际使用量,但有人测过了数据呢,放在这个网址里面,我给大家总结了一下,如果你订阅一百刀的这个套餐,用到极限的话,就能用掉价值一千三百五十刀的这个额度, 相当于打了不到一折,换成人民币算的话,差不多就是零点五元的人民币就能买到一美元的这个使用量。但 cloud 的 官方有两个大坑啊,大家也都知道,第一呢就是国内的用户特别容易封号。第二个呢就是不允许介入其他第三方的服务, 只能在这个 cloudco 的 这些官方应用里面使用,没有办法拿它去接入 opencloud 或者是其他第三方的这个智能体。如果你又想要这个按量付费的这个灵活性,又想要这个套餐的折扣价,那怎么办呢?我觉得唯一的选择啊,就是中转站,中转站呢,你可以把它理解成为这个零售商,就他们会去批量的向 cloudco 的 官方购买 这个套餐,然后呢在中间加一些价格再卖给你刚才说的,比如说零点五元的人民币兑换一美元以上, 市面上有上百家的这个中软站,那怎么挑呢?有人做了一个中软站稳定性的监测,大家想要购买,想要具体了解的,其实可以看这个网站,上面呢监控了几家比较大的这个中软站的稳定性。不过说实话,这个中软站呢,基本上还是一门比较灰色地带的生意, 所以呢,建议大家每次别充太多,这里呢就不具体展开了。然后我们来说第二家那个 check gpt, 相比较那个 cloud code 的, 动不动就封号啊,然后不让接其他的这个工具 open i 呢,其实就大方了很多, 它不仅能接自家的这个 codex, 还允许你去接 open code, 允许你去接 open cloud 这些第三方的项目,而且额度啊,要比 cloud 的 要给的多,大概是零点三元人民币就能买到一美元的使用量。更香的是啊, open i 的 活动特别多,比如说像那个 gpt 开通团队套餐,首月免费,你可以去某鱼搜这个 team, 新车几块钱呢,就能用上价值二十五刀一个月的会员。如果你拿这个会员去跑 codex 啊 token, 相当于说完全白嫖。 codex 的 缺点呢,就是它写代码的速度啊,会相对来说比较慢一点,不过呢,你可以开多个 agent, 让它并行去跑 数量去换取速度。然后下面一个是这个谷歌 gemini gemini 系列模型写代码的综合能力啊,普遍来说稍微比这个 cloud 和 gpt 弱一点,但有个骚操作啊,就是可以通过教育活动拿到免费一年的谷歌 ai 会员,然后用这个谷歌的编程 i d e anti gravity 来跑这个 cloud 模型,然后还有一个更狠一点的玩法,就 使用这个项目 cloud proxy api, 它可以把 antigravity 里面 cloud 的 模型转接出来给 cloud code, open cloud 这些工具去用。因为谷歌会员啊,几乎都能白嫖,所以它对应的这个 token 啊,也约等于免费。不 过这么玩的人啊太多了。谷歌最近呢,在频繁调整这个 anti gravity 的 额度,所以这个方法我也不是太推荐,因为它可能之后就不太稳定了。聊完了预三家之后啊,我们来聊一聊国产的这些模型。国产的模型呢,本来零售价就只有海外模型的一到两折,购买套餐之后呢,就会更便宜了。在国产模型里面啊,我觉得当下最强的可能就是最近推出的这个 kimi k 二点五,我实际用下来它的能力其实跟 cloudsonic 四点五几乎没有什么差别。有兴趣的朋友啊,可以去 kimi 的 海外版看一看, 有个首月零点九九美元的活动,能拿到原价九十九元的套餐,还可以支持这个接入第三方的 cloud code open cloud。 国内版 kimi 的 活动呢,就稍微差点意思了, 每周大概五元左右。但是 kimi 我 觉得最大的问题啊,就是套餐额度给的比较抠,控制台里呢,只显示了使用的百分比,看不到具体的 token 使用量。我实际测下来呢,比下面两家我要介绍的这个国产模型啊,给的量都要少得多。 gim 呢,应该是国内三家里面我觉得最大方的, 然后套餐的额度给的非常的足,最低档的套餐呢,是每个月二十元,每年两百四十元,但价格是真的香,我自己也买了。接口方面呢,也很开放,可以支持接入各种的工具。缺点呢,就是现在 g i m 四点七啊,它的模型效果暂时不如 kimi, 而且高峰时间段呢,因为顾忌它 套餐卖得太多了, token 的 吐字呢,我觉得巨慢。另外一个 mini max 呢,我觉得它的套餐跟 g l m 很 像,然后这里也不跟大家重复了。然后还有一家呢,大家可能没想到,就比较小众,就是英伟达。英伟达呢,其实它也提供这个完全免费,额度不限的这个开源模型, 包括前面说的 kimi k 二点五,然后 jimmy 四点七, mini max m 二点一。但是呢,因为可能门槛太低了,然后用的人实在太多,热门模型的速度呢,慢得离谱。所以这个呢,我就更不推荐了,只是跟大家介绍一下,英伟达,它其实也有这个免费的接口。最后啊,来再帮大家整理一下思路,如果你想追求最强的效果, pro 的 中转站呢,是目前性价比最高的选择。如果你的预算有限啊,那国产模型里面 g i m 的 套餐最实惠。 timi k 二点五的效果最好,但是有传闻呢,说这个月会有大批的这个模型,会推出新一代的模型,到时候呢,我再跟大家更新。然后如果你想白嫖呢? openai 的 这个 timi 拼车几乎是完全零门槛的, 效果也不错。这期盘点里面当然肯定没有包括说这个百分之一百所有的方案,市面上还有很多我没发现,或者是我没有测过的这个方案。如果你有更好的渠道,欢迎在评论区补充,大家一起交流。好了,今天视频就到这里了,我是迪总,黑心李超,我们下次见。

给你们看啊,我用 cloud code 制作了一个英语学习的 app, 用的是这个 g o m 五点一的模型,并且在手机上也可以成功模拟测试了。看这里的翻转卡片功能,分级词汇库,还有像影子跟读这些功能都可以用,生成效果很好,就算你没有编程经验,也可以很快速的上手做出一个高质量的 app 了。 今天给大家分享啊,怎么零基础的去使用 cloud code 生成高质量的 app? 我 们主要会用到的一些工具有哪些?我们先准备一下环境啊,去官网先下载 node js, 再下载 git 就 可以了,大概就两三分钟吧。 然后我们来安装 cloud code, 只要一行代码,你在电脑里搜索 power shell, 一定要以管理员的方式运行哈,大家可以参考这个教程终端呢,输入这个安装指令,安装 cloud code, 运行完之后,你再输入 cloud 杠 version, 你 就可以看到这个回复的版本了,那就说明安装成功了。安装好之后我们要配置 api 的 key, 这里我用 cloud code 绑定了 g o m 五点一的模型给大家做演示啊,因为它的编程能力真的是对齐 cloud open 四点六的,而且在开源模型 call 定排名当中非常靠前,目前是开源第一,国产第一。我自己实测下来,我觉得生成 app 的 效果也很不错哎,我们中国团队做出这个能连续工作八个小时的 ai 模型了。 我先说怎么获取 a p i 啊,访问智普的开放平台注册账号,那我选的就是这个 g l m 五点一模型的 coding plan。 登录之后呢,在右上角个人中心页面点击 a p i 的 key, 创建一个新的 api 的 key 就 可以了,然后我们就把这个 api 加载到 cloud code 当中,用这一行代码就可以快速运行。它是一个 coding tool helper, 你 可以理解为它是个自动部署的一个工具,然后你就会看到这个页面啊,界面语言选择中文套餐呢,就选择 g o m coding plan 中国版 api key 就 把你刚获取的复制过来, 随后选择 cloud code, 往下到 m c p 服务,选择解释一下 m c p 啊,它是模型上下文协议,有了它才能让 ai 去外接工具, 比如说去控制浏览器连接你的本地文件,去执行操作。这里我们直接选一键安装所有的 m c p, 最后我们选择启动 cloud code, 给它权限,选择 yes trust folder, 跳出这个橙色界面,你就装好了, 你跟他 say hi, 你 看他就可以回复你。这个时候我再输入杠 model, 你 就可以看到我的模型现在还不是 g o m 五点一。回到官方文档,你会看到要用最新的五点一模型,你还需要配置 json 文件,改一下环境变量参数,这个不麻烦啊,你只要复制需求,直接让 cloudco 自己改, 你看它现在已经在操作了,它标注绿色部分就是改的部分,你选择 yes, 给个权限,它就改好了,是不是很方便?然后我们重新开一个 power shell 的 终端,打开 cloud code, 再输入杠 model, 你 看模型,它就变成 g o m 五点一了。 cloud 的 装好了,我会觉得命令行页面用起来不太方便,所以我还会在下一个 cursor, 它是一个 ai 编辑器啊,配合 cloud 的 开发,它就可以让整个开发过程变得格式化,文件管理也很直观,你看它左侧会显示 app 文件加右侧呢,会有一个 ai 助手帮你 debug 去解释代码的含义, 直接去官网下载就可以,然后你点开里面的 terminal, 然后再输入 call, 启动显示橙色的标识,就是成功打开了。好,那现在我们来做 app 啊,注意不要直接给指令啊,让 g l m 做一个什么什么样的 app。 我 们开始之前先搭一个最基本的 app 框架,框架稳固了,后续才能节省 token 并且避免出错。 怎么建立框架?这里用 xbow, 它呢,是专门为开发打造的一个全能框架,你只需要用这一条指令, npx create xbow 杠 app, 创建 react native 项目,你就有了一个标准的 app 框架模板, 然后他问你 app 的 名字啊,你随便输入一个 my app, 现在你就可以给模型你的详细需求了。为了让 app 生成效果更好,我们把 skills 装一下去,强化模型的开发能力啊,让它的 ui 生成的更加美观。复制下面的代码,我们就能安装 ui skills, 选择安装 building native ui 这个技能,这里选择 cloud code, 选择 project 啊,后续基本都选 yes, 然后你看到 complete, 那 就是装好了,你会看到右侧文件夹里多了一个 skills 文件,点进去你就可以看到具体的技能介绍。 接下来我们重新打开 cloud code, 输入杠 plan, 进入 plan mode 这个功能呢,它是让 cloud 先想清楚怎么做,经过你的确认授权之后再开始干活。那现在我们和 glm 模型去描述 app 的 制作需求,你可以像这样几句话描述啊,如果你希望 app 生成效果更加符合你的要求,建议大家让 ai 来帮你完善一个产品需求文档, 详细的告诉 ai 你 要做什么产品,什么功能,越详细实现效果越好。给他下达指令之后,你可以看到这个 glm 五点一模型在分阶段的设计功能,还有开发方案,他自己规划了五个阶段,每完成一项,他自己会划掉标注完成。我看他运作还是蛮有条理的。 从零给需求你到真正调试做出来 app, 我 大概花了三个小时左右,它可以自主帮你规划交付,基本都不太需要我辅助,我做的最多就是在给它授权,它自己也可以 db 去解决代码的问题,如果它生成的代码你要是不太懂,你想了解一下,你就选中它,右侧 cursor 的 ai 助手就会帮你去解答。 那等你全部完成这个 app 之后,你也可以在手机上实时预览啊。你只要在手机上应用商店下载 expo go app, 随后在终端输入 n p x expo star, 它就会弹出一个二维码,你用手机相册扫码啊,就可以直接打开去实时的在手机上体验了。 你想电脑端预览,就可以点击这个 link, 也可以体验里面的功能了。你像我有单词翻转卡还有跟读的功能,都是可以直接用的。好啦,快去试试看吧!艾特闺蜜好朋友,一起从零到一,搭建一款属于你自己的 app, 有 啥问题可以评论区见!今天就到这里啦,拜拜!

今天给大家分享一个福利,免费领用两亿的 talking, 两亿啊,然后模型种类也很多的。 之前呢,我是在阿里云百联,然后注册了一个账号,购买了他们的十块钱的一个 callin pro, 试用了一下, 然后过去呢,一直用我账户里的钱,就发现其实消耗太快了,我无意中发现他们其实是有免费的模型可以使用的,总共大概有两百多个。 然后模型的种类也很多,像 deepsea 呀,还有千万 plus, 还有其他的 kimi, 包括 grm 都会有 啊,我已经用完了那些比较热门的模型,还有一些其他的模型可以去选的,我再一个去使用, 每个模型大概用额度的话是一百万这样子。那你用的之前的话,记得一定要是把这个选一下,免费额度用完就停掉,不然可能会消耗你账户里的钱。 那这些模型呢,也有很多啊,然后他的智力水平也不一样,所以呢啊,你在用的时候呢,可以有选择性地去使用一下。好,这是今天的福利,分享给大家。

最近这个吹的价格涨的太厉害了,之前到四月四号的时候,他还是一直按照次数来进行对我收费,当时花二十刀,实际只要自己付十刀就能体温差不多六百次 就用高级模式。现在升级之后,我发现有的时候问一个 gpt 五点四问题一复杂他就能发出去一点四个美刀,按这样的话我的二十美刀也就够体温几次就没了,这谁用的起啊,所以我直接给他取消订阅了,实在是发不起啊, 之前一直连着定了三个月,我现在试了一下这个,嗯,这个其实也还可以,可以扣的白点,但长得丑了点,但是我发现他其实做的比吹更完善,吹上面到现在为止一直都没有这个第二商店,但是这个我这个扣的白点上面已经有了, 还有 m c p 的 商店也更加的好,还有规则的记忆啊,技能啊,我感觉这些其实做的不比吹差, 甚至很多的 ipad 交互面板,我感觉是做的更好的,所以我们把它擦掉。我感觉他这里的做的其实更好,而且他这里会显示上下文,你用了多少上下文,他会给你显示出来。他 吹的连这个基本的功能都没有,大家可以去试一下。我现在用的是国内版的,因为国内版他免费送很多的额度,大家可以登录那个叫什么,有个叫我八千八千的积分,我用 gm 五点一, 基本上平均每个问题复杂点的话差不多在五十个积分,那这样的话也差不多能够提供个一百到两百次, 有些简单的问题的话,他可能只会消耗比较少十几个积分,那这样就能提供好几百次,够大家用个差不多一两个月了。也别着急,大家去花钱去买那种扣丁牌,搞不好后面又有什么新的免费证书吗?所以能白嫖就先白嫖,对吧?

cloud 限额了, cursor 报错了, codex 配额用完了,你一个月花两百块订阅 ai 编程工具,结果还是天天被限速。今天介绍一个项目,让你的 ai 编程永不停歇,而且可以完全免费。九、 router 的 核心是三层智能回退, 第一层优先用你的订阅, cloud codex 全力输出,配额耗尽,自动切到廉价层 g o m 六毛钱一百万 token, 再不行就切到免费层。 icloud clem, 三个平台无限免费用,整个过程完全自动,零感知切换。最狠的是你可以完全零成本。 gemini c o i 每月免费十八万次请求。 icloud 提供八个模型无限免费用, clem 三个模型也是无限免费。 有人用了一周,仪表板显示成本两百九十美金,但实际花费是零。一个本地地址搞定所有工具, cloud code cursor、 colex climb, gemini cioi co pilot, 十二个主流 ai 编程工具全部兼容,背后是四十多个供应商,超过一百个模型设置,只需要改一个地址。技术上有两个巧妙的点, 第一是协议翻译,你的工具发 open ai 格式。九、 router 自动转成 cloud 或 gemini 原声格式,反过来也行。第二是 r t k 优化,自动压缩请求 token, 同样的任务省掉百分之四十的消耗,整个项目完全本地运行,数据从不出你的机器。 技术战很新, next js 十六 react 十九 t o win 四,不需要数据库,一个 js o n 文件搞定。仪表板做的很漂亮,实时看配额管,供应商建模型组合, docker 一 键部署也行。这个项目已经有超过四千颗 star, 单日新增两百多颗,还在快速增长。 mit 开源协议,完全免费使用,适合所有用 ai 编程工具的开发者。关注我,下期继续带你发现好项目!

最近养小龙虾实在是太消耗,偷看了用它自动搜资料做表格生成格式化报告确实省心,但一跑复杂任务,偷看没几下就见底了。所以今天就来跟大家分享一款便宜又好用的订阅方案,就是刚上线的 agnes talking plan。 先说说我是怎么用的,前期花了一个小时把模型配置和 skill 安装搞定,一次性搭好环境 之后,就开始让他干活了。 ai 信息收集、生成、 ppt 输出、格式化报告全都交给他。你可能会问,这么跑成本高吗?我觉得 agnes token plan 可能是目前全网性价比最高的方案,因为他直接换了一套玩法,不按 token 计费, 而是按高强度生产时间订阅,直接帮你省下百分之三十至百分之五十的使用成本。具体来看, agnes ai 提供了三个档位的套餐, starter 入门版 每月四美元,适合日常轻量使用,副业搞钱的朋友支持一个智能体,基础搜索、图像理解全都有,相当于每天只花零点一三美元就能拥有一个专属 ai 助理。 plus 进阶版每月十美元,能开一至两个智能体,从调研 ppt 设计到数据表格,一个人直接干成一个小团队。 pro 专业版 每月五十美元,适合重度用户或小团队多任务并行,支持二至三个智能体同时跑,文本、图像、视频全能生成,相当于一整套并行 ai 生产系统。换成传统 token 计费,同等用量可能得上百美元,这里五十美元直接封顶。 总而言之,不管你选哪一档,对比市面上主流按 token 计费的模型, agnes 订阅制都能大幅省钱。 订阅步骤也很简单,两步就能搞定。第一步,访问 agnes 官方网站,点击右上角注册,可以通过 google 或者 tiktok 账号完成账号注册。第二步,登录后进入产品中心,根据自身需求选择 token plan 套餐,完成支付后,系统自动生成专属 token, 点击 api keys, 创建一个新的 key, 将生成的 token 复制保存,就能配置使用了。不管你选哪个档位,你买到的都是一个五小时的固定请求窗口,在这五小时内随便跑,多 agent 并行,不加价。而且它的响应速度很快, 通过对话输出,从生成美业的具体内容到输出一份完整的 ppt 成品,平均只要三到五分钟。举个例子,我让他对每一冲突升级对黄金现货的影响做可式化解毒,他能直接输出一份完整美观的报告, 如果对哪部分不满意,直接在对话框里说一声它就能改,非常高效便捷。如果你也一样,长期高频用 ai 疯狂消耗 token, 又蹲不到 g l m 五点一直接换成 agnes token plan, 省心还不肉疼。我把地址放下面了,可以去试试。

嗨,朋友们好,咱们又见面了,今天聊一下这个最近刚出的智普的 glm 五点一,我这几天 使用了一些心得体会,之前使用的主力模型是 mini max 二点七,那么今天我把这辆模型放在一块对比,来给大家说一下具体的使用心得。我设计了三个任务,让他们分别去执行。第一个是比较简单,就写一个登录页面, 包括后台的逻辑啊,前后台的逻辑就写了一个登录页面。然后第二个是一个做了一个相对复杂一点的,就是税户备份跟恢复的这么一个功能 啊。第三个,呃,就更复杂一点,是做了一个量化交易的一个策略,我把这三个任务分别交给这两个模型去执行,然后我们看一下,从三个方面去看一下他的对比,第一个是时间,第二是个成本,第三是质量, 从这三个方面来对比一下。首先说这个最简单的,这个登录页面,两个模型分别都跑了大概五分钟左右,速度差不多,具体的后面的小数点我就不说了,大概五分钟左右都跑出来了, 然后运行呢?基本上都是一次通过,没有给我留坑,一次通过,然后调用的这个成本我查了一下, mini max 大 概是花了一块五吧,反正挺便宜,没多少钱, 因为这个任务比较简单。第二个,咱说第二个任务,第二个任务是做了一个备份恢复的这么一个任务啊,那这个 mini max 跑了大概十二分 钟,然后交安跑了大概跑了十五分钟,速度相差不大,差了三分钟,然后 mini max 执行完了之后,我跑了一下程序,呃,有点小瑕疵,然后我又把这个日期给到他,然后 他自己又修了一下,基本上最后也能运行。最后我查了一下这个调用的成本,大概是四块多,不到五块钱,然后 jm 呢?不错,就一把够。然后我查了一下调用成本,大概也是五块多一点啊,比 mini max 稍微贵一点。 ok, 然后最后一个比较复杂的,这个一个交易策略的这个量化模型实现。嗯,那这次呢? mini max 掉链子了,嗯,怎么调都过不去,最后我手动干预才过去了, 然后前后花了大概半个多小时吧,三十五六分钟,差不多四十分钟,然后费用大概是十块钱,然后那个 g m 基本上是一把过,有一些小瑕疵,把日子扔给他,大概是调了一次就一把过了。嗯, 时间也是二十来分钟,二十五分钟左右,然后成本的话看了一下,大概是十二到十三块钱。然后综上所述啊,我觉得这安排的挺香的,尤其是在处理这个复杂任务的时候。 ok, 今天就聊这么多,嗯,谢谢大家。

我前两天把创作工作流的模型从 cloud 换成了 glm 五点一,结果我的头款消耗涨了十倍。 一开始我以为我看错了,你想啊,我们选国内模型图啥?不就是图便宜吗?那 glm 五点一也是刚出不久,单价也比 cloud 的 要低一大截,那跑分呢?还非常接近 cloud, opus 四点六,那这站我一算肯定是 glm 合适啊。结果那天我刚好周限额刚刚结束啊,我跑了一次工作流,直接用掉我百分之十五的限额。 哎,这就不对了呀,那我就让他把每个节点内容都给我整理出来,刚刚完成的这个任务中,每个节点用的都是哪个模型?那你消耗了多少 token? 哎,给我整成一张表,结果我一看他读过热点素材,他用 g l m 五点一啊,整理复盘资料,他也用 g l m 五点一, 最后写文章他还是 g l m 五点一,就从头到尾五点一,一气儿录到底。但 cloud 不是 这么干的,他读东西他知道,找个便宜的模型去跑,到关键写作那一步,他才会上最强的 opus。 最后拼装组合的时候呢,他用 samsung 就 够了。哎,你看 cloud 这边,模型有三档, hikou 散热器,还有 opus。 那 g l m 配置呢?我也对应设置了三档,四点七,五点零五点一,那区别在哪呢? cloud 它会自己贴 g l m 呢,它全程是五点一, 所以你就明白我们的 koink 到底花在哪了。就大家都在说 koink 赚翻了,为啥呀?因为它根本就不会给你省啊,全程最强模型入到底,哪怕是 koink 的 这种能够自动切换模型的 agent, 你 接 g l m 进来它也不好使。 后来我就学奸了呀,我直接强制他在某一个节点只能用某个模型,那这样我每周的偷根才能抗用一点。说到这,我就不得不吐槽一下这个 g l m 啊, 他动不动就给你速愈限制。我平时用飞书控制可拉扣子,在家里电脑上干活,路上我给他发指令,家里就开始跑嘛。那结果用 g l m 以后呢,动不动就没动静了,我还以为家里断网了,回家我一看速愈限制了,我一天都没有用啊,晚上回来我一发消息还是速愈限制。 你限制没问题,你高峰期三倍也没毛病。因为我之前对这个模型的印象非常好,刚开始五点零还没有发布的时候,我就在 openroot 上去测过,当时我还跟很多人去推荐这个模型,但是现在我只想说,再穷不能穷模型,再省不能省 token, 你 懂的。我们下期见。拜拜。

我之前推荐了 t r a e 啊,然后但是我今天把它退掉了,当然也不是说特别不好的问题啊,主要是现在各家的这个计量啊,真的是我觉得有很大的问题,它都不太透明。 第一个是计量方式不一样,然后第二个是计量方式就算一样啊,比如我都按次数或者都按头看,但实际上你一个任务发出去之后,它到底花多少量?不知道啊,真的不知道。 在这种情况下呢,我觉得就是试一下吧,网上看大家说我觉得没有什么直接的感受,没有什么直观的感受,大家说啥的都有啊,所以我觉得还是得自己试一下。然后呢,从焦老板那搞了一个质朴的试用版, 七天啊,只能用那个四点七的模型啊,很失望,就基本上就一个多小时,两个小时的时间,然后大概搞了四五个任务吧,然后直接把一周用量的百分之八十五耗完了, 这个量肯定是没法接受的,而且四点七呢,就是还出现了重大的需求理解错误的问题, 就是他那五点一应该是很厉害,但是呢,买不到,对吧?买不到。然后接下来就在排行榜上去看啊。接下来是啥 排行榜?瞅了一眼就发现排除掉。首先排除掉反华的,对吧?然后排除掉外外,外国那些很容易被封号的啊,我觉得折腾那些事情没有意义。 然后呢,再排除掉买不到的,对吧?现在一个是智普的买不到,然后阿里那个千万三点六也买不到,他那个只有一个每个月两百的套餐,但是也买不到, 排除完之后居然只剩下这个东西了,所以试吧,试一试小米,看到底靠不靠谱。

别再看跑分了,深度用了一周 g l m 点一和两天 kimi k 二点六直接说结论,这两个模型我替你们踩过坑了。编程能力上它们差不多,但用法完全不同。 g l m 点一长任务复杂,工程首推,但是高峰期算力紧张,所以你懂的。 kimi k 二点六响应快,但代价偷啃消耗快真的没开玩笑, 可能一个任务能消耗你百分之十的周额度,还没订阅的考虑清楚后再下单也不迟。收藏这条,等你遇到同样的坑回来找我关注我爱不落伍。

分布式的 token 工厂用 pro 六千有多大的产量?测试过程有哪些结果和意外呢?这是一台八卡的 pro 六千,可以分布式的部署在不同的机房和电站旁。我们选用了 kimi 二点六、 glm 五点一和 deepsea v 四 flash 三个模型进行测试, 并分别从 model scope 和 hackinface 获取模型的权重,开展部署以性能评估。考虑到 pro 六千服务器总显存为七百六十八巨币, kimi 二点六和 gim 五点一的满血版都无法直接加载,因此本次测试统一采用 f p 四量化版模型。 模型部署和测试结果如下,一、 kimi 二点六模型结构符合主流的推理框架,完成部署后,初步压缩的结果是峰值 token 生产率为一千一百五十 token 每秒, 整体表现符合预期。日产 token 为九十九个单位,也就是一亿 token, 而单个单位的 timi 二点六在 openroot 的 价格为一点六美金左右,理论满产价值为一百六十美金每天。 dm 五点一部署过程中出现了模型加载失败的问题,初步判断是以 v 二二 m 官方镜像的适配性有关去进一步排查或等待兼容版本来支持。三、 deepsea v 四 flash 同样出现了加载失败,经核察是黑心为核心算第 g e m m 在 pro 六千 sm 幺二零架构上存在设备不足的问题,需要等待针对该模型优化的 v i l m 版本后再进行测试。先点关注,一起了解偷啃工厂和聚合分销的那些事儿。

我找到了一个免费使用 cloud code 的 办法,不需要购买模型,厂商的 coding plan 也可以使用。今天分享给大家,我刚刚成功领取到了小米赠送的 talking 余额,够用一段时间了。看完这个视频,你也可以领取并接入到 cloud code 之中。 这个就是小米推出的创造者百亿 token 激励计划。链接我已放入评论区,只需要五步就可以免费申请领取。首先我们点击立即申请前三项,按照我们的实际情况进行,填写 你的邮箱常用的开发工具。然后目前使用的底层模型。第四项和第五项是需要我们重点填写的。第四项,我们可以将我们的日常项目进行包装,利用 ai 进行润色描述, agent 或者 ai 驱动的具体成果 写的越丰富,通过率也就越高。第五项,可以上传我们 ai 平台的账单截图,还有终端运行日记等, 这个最多支持五个文件,可以上传图片或者是录屏都可以。在最后可以覆盖我们 github 的 演示地址。 点击提交,系统会在三个工作日内提交评估结果,之后会收到这样的一个小米 miimo 创造者激励计划。然后我们在这里点击开放平台地址, 我们点击控制台,这样平台送给我们的余额已经到账。我们选择 api case, 新建 api case, 填写 api k 名称,选择比较好记忆的名称,点击确认即可,这时会弹出一个 k, 它只会显示一次,我们要把它提前复制好。接下来我们使用 cc switch, 我们在添加中添加新供应商。以下是 cloud 供应商,我们选择小米米某。需要注意的是,供应商名称官网链接已经填写就绪,我们只需要在这里粘贴我们刚才复制好的 api k 即可。 我们要注意是否请求地址与以上保持一致。还要注意的是目前主流模型有 v 二 pro, 如果想体验小米最新模型,我们可以把这里换成 v 二点五 pro, 点击添加, 这样即可生成。我们点击旁边的这个按钮,点击起用。我们在终端输入 cloud, 这样我们就会发现 mini v 二 pro 已经被我们正常使用了。以上就是全部内容,如果有什么问题,我们可以在评论区沟通,我们下集再见。

终于找到了一个好用的国产模型,智普 glm 五点一搭配游乐龙虾效果很好。之前试过两款国产的,一个是某包的 回答慢,感觉像弱智,另一个是企鹅的某原模型, tucker 烧的飞快,没几个动作几十万的 tucker 就 全没了。 今天试了 glm 五点一,效果真的出乎意料,跟 clodson 四点六有一拼。唯一的缺点就是 talking 比较快,但配合某山的 callin plan talking 焦虑直接解决,国产魔性真的在进步。

我找到了一个免费使用 cloud code 的 办法,不需要自行购买,墨星厂商的扣丁 plan 也可以使用。今天分享给大家,我刚刚成功领取到了小米赠送的七亿 token, 够我使用一段时间了。 看完这个视频,你也可以领取并进入到 cloud code 之中。这就是小米最近推出的创造者百亿 token 激励计划。我们只需要填写五道题目就可以免费申请领取。 我们申请这个活动只需要下面两步,第一步,打开活动官网,然后填写页面中的问题。前三道题随便填写,但真正卡人的就是第四题。 因为很多小白不知道如何使用 agent 或者 ai 构建项目,但没关系,我已经将我成功申请使用的项目描述可进入到 cloud code 的 详细步骤,写入到了文档之中想要的评论区留言。 我们在完成题目提交申请之后,我们就只需要等待审核。审核通过之后,我们会收到小米官方的邮件,邮件中会包含开放平台的地址。我们进入到开放平台,首先需要进行登录,如果你还没有注册过小米账号,可以先使用手机号进行注册。注册完成之后,你也可以使用手机号进行登录。 登录完成之后,我们可以点击右上角的头像,选中个人中心,然后再绑定我们申请使用到的邮箱。绑定完成之后,我们再点击控制台,然后再点击左侧的订阅管理, 我们就能看到我们领取的 token plan。 在 这里我们可以申请 token plan 的 专属 api key。 下面就是将我们领取到的 token plan。 通过 cc switch 接入到 cloud code 之中,我们需要打开 cc switch, 然后点击加号添加一个新的模型供应商。在这里我们选择小米 miimo, 选中之后我们向下滑,然后将上面申请到的 api key 填写在这里。注意这个请求地址需要改成这个,因为这是 token plan 的 专属请求地址,具体的地址我已经放在文档中了。下面的模型最好也贴换成小米最新的 mimo v 二点五 pro 模型。 配置完成之后,我们点击保存就可以了。添加完成之后,我们点击骑用小米 mimo 的 配置就可以了。 我们可以打开终端,启动 cloud, 然后检查我们的配置是否生效。 token 我 们已经成功领取到了, cloud code 也接通了。如果你想知道如何使用 cloud code 实战,麻烦点个关注,我们下期开始讲解实战内容。

脸,脸都不要了。事情是这样的,我的朋友写了一个 ai 用量监控的一个菜单软件,我建议他开源出来,但是他不同意,于是我就花了几天时间写了一个比他的功能更完善,支持更多平台的 ai 用量监控的一个软件,并且开源了出来,提供给大家下载使用。 大家觉得这样算朴切吗?这我就不太清楚了,下面我就给大家分享一下完整的创作过程。我现在已经确定了基础方案和 api, 现在是下午五点,我现在开始,如果今天能够完成开发,我就把插件的源代码发出来放到 guitar 上。经过半个小时的漫长等待,八个步骤的反复确认, 那么我们已经完成了这个插件的开发,看一下效果。 基本的使用方式就是下载 d m g 拖动到 application 双击,然后我们就可以看到菜单里边有任何的插件的一个显示,然后点设置, 进行三个 api, key 和 cookie 的 一个设置,小米密密的 cookie 从这里粘贴,打开小米密密的后台,然后打开浏览器工具,然后粘贴完整的 cookie 就可以了。这就是简单的使用方式,我把代码也用二八七二点零的协议开源了,然后大家可以随意使用,并且可以商用。 那欢迎大家来看我的代码,我也会把安装文件放出来,到时候大家就可以直接下载安装使用了。我的原则就是让大家用最轻松的方式来监控日常使用的 ai 平台的余额和用量。希望大家多多提供宝贝的建议和意见,或者你希望在添加哪个平台,我来帮你开发。

最近我在疯狂玩智能体,但有个问题真的太烧 token 了,普通聊天机器人一问一答就几万 token, 一个月几十块钱搞定。但智能体不一样,一个任务能掉几十上百次,模型一个月几一 token, 主流模型平均大概五美元,每百万 token 一个月要烧一千美元,就算用国产模型也要两三百美元。所以这期就讲一件事,怎么搞到便宜甚至免费。先给你一个核心思路,省钱本质就是在三件事里做取舍,价格、稳定性、模型能力。 但是智能体、磁源 token 工厂可以同时做到这三点。如果你想更省钱,国产模型力 g l m 最便宜,批量效果最好,想要最强又稳定,那就贵一点。最后总结一句话,没有最完美的方案,只有最适合你预算的组合。