算力网关与流量分发系统 Free Token Router 是一个聚合国内主流大模型的统一 AI 网关与流量分发系统，面向用户、开发者和企业三方构建闭环：用户通过签到、邀请、广告等方式免费获取 Token 并调用 DeepSeek、Qwen、GLM 等模型；开发者通过 OpenAI 兼容接口，一套 SDK + 一个 Key 即可调通全部模型；企业则通过赞助 Token 定向投放给目标人群，用户在使用 Agent 或调用模型时消耗赞助额度，实现精准获客。技术上基于 Next.js + PostgreSQL 双重记账钱包 + OpenAI 协议网关，向上统一调用体验，向下做多模型路由与计费抽象，本质是在做一个“Token 即流量、调用即转化”的 AI 版拼多多分发网络。

glm赠送token使用教程

52

1

40

15

举报

发布时间：2026-05-09 08:31

查看AI文稿

阳仔AI技术支持

粉丝9.4万获赞41.6万

相关视频

06:23
如何买到便宜的大模型token？#chatgpt #claude #gemini #glm #minimax
查看AI文稿
AI文稿
最近玩智能体啊，实在太消耗 token 了，所以我们今天要来讨论说啊，哪里能搞到便宜的甚至是免费的大模型 token 呢？首先我们来看一下，如果正常使用 token，大概是个什么价格呢？像我们日常最常用的这个网页版的聊天机器人啊，类似于豆包、 jammy 这些网页的服务，一问一答，大概每一次呢会消耗几千到几万的 token。一个月下来呢，大概可能就是三百万的 token，数量也就是几块钱。但 agent 就完全不一样了，它要自己规划，自己执行，自己反思，一个任务跑下来呢，可能会调用几十上百次模型。像我们最常使用的 cloud code， open code、 open cloud 这些智能体啊，每一次跑起来都要消耗几万甚至上百万数量级的 token。我也翻了一下我自己的使用日志啊，然后大概估算了一下，我每个月的使用量呢，大概是三亿个 token 左右。然后我们来算笔账，如果你使用的是 cloud sum 的四点五这个模型，它的价格呢，大概是每一百万的 token，输入呢是三美元，输出呢是十五美元。考虑上一些这个缓存啊，折扣啊，平均价格呢，你可以认为是每一百万的 token 五美元左右。那这么一算啊，其实你跑一个 agent，每个月其实要烧掉一千五百美元左右，就算是换成便宜的多的国产模型啊，一个月也要用到两百到三百美元，这个价格呢，我觉得还是蛮离谱的。所以这期视频啊，我就来跟大家聊聊，怎么才能搞到便宜的甚至是免费的大模型接口。先说好，这期视频呢，是没有任何的广告的，全是我自己实测实际使用的经验。在正式开始之前啊，我想先给你一个这个思考框架，省钱这件事情呢，本质上其实就在做三个维度的取舍，价格、稳定性、模的能力。你不可能三个都要，如果你想要最强的模型并且稳定，那肯定就会稍微贵一点，如果你想要便宜，那肯定就要牺牲一些模型的能力或者是稳定性。我们带着这个框架呢，然后再来逐个看各家的方案。先来说这个 cloud 买套餐到底能省多少钱呢？官方没有公布套餐的实际使用量，但有人测过了数据呢，放在这个网址里面，我给大家总结了一下，如果你订阅一百刀的这个套餐，用到极限的话，就能用掉价值一千三百五十刀的这个额度，相当于打了不到一折，换成人民币算的话，差不多就是零点五元的人民币就能买到一美元的这个使用量。但 cloud 的官方有两个大坑啊，大家也都知道，第一呢就是国内的用户特别容易封号。第二个呢就是不允许介入其他第三方的服务，只能在这个 cloudco 的这些官方应用里面使用，没有办法拿它去接入 opencloud 或者是其他第三方的这个智能体。如果你又想要这个按量付费的这个灵活性，又想要这个套餐的折扣价，那怎么办呢？我觉得唯一的选择啊，就是中转站，中转站呢，你可以把它理解成为这个零售商，就他们会去批量的向 cloudco 的官方购买这个套餐，然后呢在中间加一些价格再卖给你刚才说的，比如说零点五元的人民币兑换一美元以上，市面上有上百家的这个中软站，那怎么挑呢？有人做了一个中软站稳定性的监测，大家想要购买，想要具体了解的，其实可以看这个网站，上面呢监控了几家比较大的这个中软站的稳定性。不过说实话，这个中软站呢，基本上还是一门比较灰色地带的生意，所以呢，建议大家每次别充太多，这里呢就不具体展开了。然后我们来说第二家那个 check gpt，相比较那个 cloud code 的，动不动就封号啊，然后不让接其他的这个工具 open i 呢，其实就大方了很多，它不仅能接自家的这个 codex，还允许你去接 open code，允许你去接 open cloud 这些第三方的项目，而且额度啊，要比 cloud 的要给的多，大概是零点三元人民币就能买到一美元的使用量。更香的是啊， open i 的活动特别多，比如说像那个 gpt 开通团队套餐，首月免费，你可以去某鱼搜这个 team，新车几块钱呢，就能用上价值二十五刀一个月的会员。如果你拿这个会员去跑 codex 啊 token，相当于说完全白嫖。 codex 的缺点呢，就是它写代码的速度啊，会相对来说比较慢一点，不过呢，你可以开多个 agent，让它并行去跑数量去换取速度。然后下面一个是这个谷歌 gemini gemini 系列模型写代码的综合能力啊，普遍来说稍微比这个 cloud 和 gpt 弱一点，但有个骚操作啊，就是可以通过教育活动拿到免费一年的谷歌 ai 会员，然后用这个谷歌的编程 i d e anti gravity 来跑这个 cloud 模型，然后还有一个更狠一点的玩法，就使用这个项目 cloud proxy api，它可以把 antigravity 里面 cloud 的模型转接出来给 cloud code， open cloud 这些工具去用。因为谷歌会员啊，几乎都能白嫖，所以它对应的这个 token 啊，也约等于免费。不过这么玩的人啊太多了。谷歌最近呢，在频繁调整这个 anti gravity 的额度，所以这个方法我也不是太推荐，因为它可能之后就不太稳定了。聊完了预三家之后啊，我们来聊一聊国产的这些模型。国产的模型呢，本来零售价就只有海外模型的一到两折，购买套餐之后呢，就会更便宜了。在国产模型里面啊，我觉得当下最强的可能就是最近推出的这个 kimi k 二点五，我实际用下来它的能力其实跟 cloudsonic 四点五几乎没有什么差别。有兴趣的朋友啊，可以去 kimi 的海外版看一看，有个首月零点九九美元的活动，能拿到原价九十九元的套餐，还可以支持这个接入第三方的 cloud code open cloud。国内版 kimi 的活动呢，就稍微差点意思了，每周大概五元左右。但是 kimi 我觉得最大的问题啊，就是套餐额度给的比较抠，控制台里呢，只显示了使用的百分比，看不到具体的 token 使用量。我实际测下来呢，比下面两家我要介绍的这个国产模型啊，给的量都要少得多。 gim 呢，应该是国内三家里面我觉得最大方的，然后套餐的额度给的非常的足，最低档的套餐呢，是每个月二十元，每年两百四十元，但价格是真的香，我自己也买了。接口方面呢，也很开放，可以支持接入各种的工具。缺点呢，就是现在 g i m 四点七啊，它的模型效果暂时不如 kimi，而且高峰时间段呢，因为顾忌它套餐卖得太多了， token 的吐字呢，我觉得巨慢。另外一个 mini max 呢，我觉得它的套餐跟 g l m 很像，然后这里也不跟大家重复了。然后还有一家呢，大家可能没想到，就比较小众，就是英伟达。英伟达呢，其实它也提供这个完全免费，额度不限的这个开源模型，包括前面说的 kimi k 二点五，然后 jimmy 四点七， mini max m 二点一。但是呢，因为可能门槛太低了，然后用的人实在太多，热门模型的速度呢，慢得离谱。所以这个呢，我就更不推荐了，只是跟大家介绍一下，英伟达，它其实也有这个免费的接口。最后啊，来再帮大家整理一下思路，如果你想追求最强的效果， pro 的中转站呢，是目前性价比最高的选择。如果你的预算有限啊，那国产模型里面 g i m 的套餐最实惠。 timi k 二点五的效果最好，但是有传闻呢，说这个月会有大批的这个模型，会推出新一代的模型，到时候呢，我再跟大家更新。然后如果你想白嫖呢？ openai 的这个 timi 拼车几乎是完全零门槛的，效果也不错。这期盘点里面当然肯定没有包括说这个百分之一百所有的方案，市面上还有很多我没发现，或者是我没有测过的这个方案。如果你有更好的渠道，欢迎在评论区补充，大家一起交流。好了，今天视频就到这里了，我是迪总，黑心李超，我们下次见。
4.5万第四种黑猩猩
05:24
详细教程｜如何用GLM 5.1制作高质量APP #智谱 #GLM #GLM51
查看AI文稿
AI文稿
给你们看啊，我用 cloud code 制作了一个英语学习的 app，用的是这个 g o m 五点一的模型，并且在手机上也可以成功模拟测试了。看这里的翻转卡片功能，分级词汇库，还有像影子跟读这些功能都可以用，生成效果很好，就算你没有编程经验，也可以很快速的上手做出一个高质量的 app 了。今天给大家分享啊，怎么零基础的去使用 cloud code 生成高质量的 app？我们主要会用到的一些工具有哪些？我们先准备一下环境啊，去官网先下载 node js，再下载 git 就可以了，大概就两三分钟吧。然后我们来安装 cloud code，只要一行代码，你在电脑里搜索 power shell，一定要以管理员的方式运行哈，大家可以参考这个教程终端呢，输入这个安装指令，安装 cloud code，运行完之后，你再输入 cloud 杠 version，你就可以看到这个回复的版本了，那就说明安装成功了。安装好之后我们要配置 api 的 key，这里我用 cloud code 绑定了 g o m 五点一的模型给大家做演示啊，因为它的编程能力真的是对齐 cloud open 四点六的，而且在开源模型 call 定排名当中非常靠前，目前是开源第一，国产第一。我自己实测下来，我觉得生成 app 的效果也很不错哎，我们中国团队做出这个能连续工作八个小时的 ai 模型了。我先说怎么获取 a p i 啊，访问智普的开放平台注册账号，那我选的就是这个 g l m 五点一模型的 coding plan。登录之后呢，在右上角个人中心页面点击 a p i 的 key，创建一个新的 api 的 key 就可以了，然后我们就把这个 api 加载到 cloud code 当中，用这一行代码就可以快速运行。它是一个 coding tool helper，你可以理解为它是个自动部署的一个工具，然后你就会看到这个页面啊，界面语言选择中文套餐呢，就选择 g o m coding plan 中国版 api key 就把你刚获取的复制过来，随后选择 cloud code，往下到 m c p 服务，选择解释一下 m c p 啊，它是模型上下文协议，有了它才能让 ai 去外接工具，比如说去控制浏览器连接你的本地文件，去执行操作。这里我们直接选一键安装所有的 m c p，最后我们选择启动 cloud code，给它权限，选择 yes trust folder，跳出这个橙色界面，你就装好了，你跟他 say hi，你看他就可以回复你。这个时候我再输入杠 model，你就可以看到我的模型现在还不是 g o m 五点一。回到官方文档，你会看到要用最新的五点一模型，你还需要配置 json 文件，改一下环境变量参数，这个不麻烦啊，你只要复制需求，直接让 cloudco 自己改，你看它现在已经在操作了，它标注绿色部分就是改的部分，你选择 yes，给个权限，它就改好了，是不是很方便？然后我们重新开一个 power shell 的终端，打开 cloud code，再输入杠 model，你看模型，它就变成 g o m 五点一了。 cloud 的装好了，我会觉得命令行页面用起来不太方便，所以我还会在下一个 cursor，它是一个 ai 编辑器啊，配合 cloud 的开发，它就可以让整个开发过程变得格式化，文件管理也很直观，你看它左侧会显示 app 文件加右侧呢，会有一个 ai 助手帮你 debug 去解释代码的含义，直接去官网下载就可以，然后你点开里面的 terminal，然后再输入 call，启动显示橙色的标识，就是成功打开了。好，那现在我们来做 app 啊，注意不要直接给指令啊，让 g l m 做一个什么什么样的 app。我们开始之前先搭一个最基本的 app 框架，框架稳固了，后续才能节省 token 并且避免出错。怎么建立框架？这里用 xbow，它呢，是专门为开发打造的一个全能框架，你只需要用这一条指令， npx create xbow 杠 app，创建 react native 项目，你就有了一个标准的 app 框架模板，然后他问你 app 的名字啊，你随便输入一个 my app，现在你就可以给模型你的详细需求了。为了让 app 生成效果更好，我们把 skills 装一下去，强化模型的开发能力啊，让它的 ui 生成的更加美观。复制下面的代码，我们就能安装 ui skills，选择安装 building native ui 这个技能，这里选择 cloud code，选择 project 啊，后续基本都选 yes，然后你看到 complete，那就是装好了，你会看到右侧文件夹里多了一个 skills 文件，点进去你就可以看到具体的技能介绍。接下来我们重新打开 cloud code，输入杠 plan，进入 plan mode 这个功能呢，它是让 cloud 先想清楚怎么做，经过你的确认授权之后再开始干活。那现在我们和 glm 模型去描述 app 的制作需求，你可以像这样几句话描述啊，如果你希望 app 生成效果更加符合你的要求，建议大家让 ai 来帮你完善一个产品需求文档，详细的告诉 ai 你要做什么产品，什么功能，越详细实现效果越好。给他下达指令之后，你可以看到这个 glm 五点一模型在分阶段的设计功能，还有开发方案，他自己规划了五个阶段，每完成一项，他自己会划掉标注完成。我看他运作还是蛮有条理的。从零给需求你到真正调试做出来 app，我大概花了三个小时左右，它可以自主帮你规划交付，基本都不太需要我辅助，我做的最多就是在给它授权，它自己也可以 db 去解决代码的问题，如果它生成的代码你要是不太懂，你想了解一下，你就选中它，右侧 cursor 的 ai 助手就会帮你去解答。那等你全部完成这个 app 之后，你也可以在手机上实时预览啊。你只要在手机上应用商店下载 expo go app，随后在终端输入 n p x expo star，它就会弹出一个二维码，你用手机相册扫码啊，就可以直接打开去实时的在手机上体验了。你想电脑端预览，就可以点击这个 link，也可以体验里面的功能了。你像我有单词翻转卡还有跟读的功能，都是可以直接用的。好啦，快去试试看吧！艾特闺蜜好朋友，一起从零到一，搭建一款属于你自己的 app，有啥问题可以评论区见！今天就到这里啦，拜拜！
467是Skye学姐呀
01:19
你还在为Token付费吗？2亿免费Token送给你 2亿免费的AI大模型Token分享给你，有deepseek，Qwen，Kimi，GLM……薅羊毛！#openclaw #AI大模型 #免费token #科技下一站 #懒人科技小妙招
查看AI文稿
AI文稿
今天给大家分享一个福利，免费领用两亿的 talking，两亿啊，然后模型种类也很多的。之前呢，我是在阿里云百联，然后注册了一个账号，购买了他们的十块钱的一个 callin pro，试用了一下，然后过去呢，一直用我账户里的钱，就发现其实消耗太快了，我无意中发现他们其实是有免费的模型可以使用的，总共大概有两百多个。然后模型的种类也很多，像 deepsea 呀，还有千万 plus，还有其他的 kimi，包括 grm 都会有啊，我已经用完了那些比较热门的模型，还有一些其他的模型可以去选的，我再一个去使用，每个模型大概用额度的话是一百万这样子。那你用的之前的话，记得一定要是把这个选一下，免费额度用完就停掉，不然可能会消耗你账户里的钱。那这些模型呢，也有很多啊，然后他的智力水平也不一样，所以呢啊，你在用的时候呢，可以有选择性地去使用一下。好，这是今天的福利，分享给大家。
33AI Lab
01:47
我已经放弃订阅 Trae，太贵了，次数计费改成 token 计费后，相当于涨价 10倍，穷鬼程序员用不起来，试了一下腾讯的 workbuddy 配合 GLM5.1 效果不错，基本可以替代 trae+gemini3-flash
大家可以试试
查看AI文稿
AI文稿
最近这个吹的价格涨的太厉害了，之前到四月四号的时候，他还是一直按照次数来进行对我收费，当时花二十刀，实际只要自己付十刀就能体温差不多六百次就用高级模式。现在升级之后，我发现有的时候问一个 gpt 五点四问题一复杂他就能发出去一点四个美刀，按这样的话我的二十美刀也就够体温几次就没了，这谁用的起啊，所以我直接给他取消订阅了，实在是发不起啊，之前一直连着定了三个月，我现在试了一下这个，嗯，这个其实也还可以，可以扣的白点，但长得丑了点，但是我发现他其实做的比吹更完善，吹上面到现在为止一直都没有这个第二商店，但是这个我这个扣的白点上面已经有了，还有 m c p 的商店也更加的好，还有规则的记忆啊，技能啊，我感觉这些其实做的不比吹差，甚至很多的 ipad 交互面板，我感觉是做的更好的，所以我们把它擦掉。我感觉他这里的做的其实更好，而且他这里会显示上下文，你用了多少上下文，他会给你显示出来。他吹的连这个基本的功能都没有，大家可以去试一下。我现在用的是国内版的，因为国内版他免费送很多的额度，大家可以登录那个叫什么，有个叫我八千八千的积分，我用 gm 五点一，基本上平均每个问题复杂点的话差不多在五十个积分，那这样的话也差不多能够提供个一百到两百次，有些简单的问题的话，他可能只会消耗比较少十几个积分，那这样就能提供好几百次，够大家用个差不多一两个月了。也别着急，大家去花钱去买那种扣丁牌，搞不好后面又有什么新的免费证书吗？所以能白嫖就先白嫖，对吧？
74教你宇宙级AI编程（求关注）
05:53
AI 太贵用不起？两大省钱平台来了！（附代码） GPT-4 烧钱太快？智谱 AI 零费用无限制+ModelScope 每日 2000 次！手机就能开通，附 Python 代码直接用🚀 #AI工具 #技术干货 #实用资源 #程序员日常 #token
4大书大
01:42
9Router 的核心是三层智能回退。第一层优先用你的订阅，Claude、Codex 全力输出。配额耗尽自动切到廉价层，GLM 六毛钱一百万 Token。再不行就切到免费层，iFlow、Qwen、Kiro 三个平台无限免费用。整个过程完全自动，零感知切换。#token #trending #免费token
查看AI文稿
AI文稿
cloud 限额了， cursor 报错了， codex 配额用完了，你一个月花两百块订阅 ai 编程工具，结果还是天天被限速。今天介绍一个项目，让你的 ai 编程永不停歇，而且可以完全免费。九、 router 的核心是三层智能回退，第一层优先用你的订阅， cloud codex 全力输出，配额耗尽，自动切到廉价层 g o m 六毛钱一百万 token，再不行就切到免费层。 icloud clem，三个平台无限免费用，整个过程完全自动，零感知切换。最狠的是你可以完全零成本。 gemini c o i 每月免费十八万次请求。 icloud 提供八个模型无限免费用， clem 三个模型也是无限免费。有人用了一周，仪表板显示成本两百九十美金，但实际花费是零。一个本地地址搞定所有工具， cloud code cursor、 colex climb， gemini cioi co pilot，十二个主流 ai 编程工具全部兼容，背后是四十多个供应商，超过一百个模型设置，只需要改一个地址。技术上有两个巧妙的点，第一是协议翻译，你的工具发 open ai 格式。九、 router 自动转成 cloud 或 gemini 原声格式，反过来也行。第二是 r t k 优化，自动压缩请求 token，同样的任务省掉百分之四十的消耗，整个项目完全本地运行，数据从不出你的机器。技术战很新， next js 十六 react 十九 t o win 四，不需要数据库，一个 js o n 文件搞定。仪表板做的很漂亮，实时看配额管，供应商建模型组合， docker 一键部署也行。这个项目已经有超过四千颗 star，单日新增两百多颗，还在快速增长。 mit 开源协议，完全免费使用，适合所有用 ai 编程工具的开发者。关注我，下期继续带你发现好项目！
30GiftLee
02:42
放弃抢GLM-5.1后，我找到了更划算的Token Plan #AlAgent #Token #AI智能体 #AI模型 #AI小龙虾
查看AI文稿
AI文稿
最近养小龙虾实在是太消耗，偷看了用它自动搜资料做表格生成格式化报告确实省心，但一跑复杂任务，偷看没几下就见底了。所以今天就来跟大家分享一款便宜又好用的订阅方案，就是刚上线的 agnes talking plan。先说说我是怎么用的，前期花了一个小时把模型配置和 skill 安装搞定，一次性搭好环境之后，就开始让他干活了。 ai 信息收集、生成、 ppt 输出、格式化报告全都交给他。你可能会问，这么跑成本高吗？我觉得 agnes token plan 可能是目前全网性价比最高的方案，因为他直接换了一套玩法，不按 token 计费，而是按高强度生产时间订阅，直接帮你省下百分之三十至百分之五十的使用成本。具体来看， agnes ai 提供了三个档位的套餐， starter 入门版每月四美元，适合日常轻量使用，副业搞钱的朋友支持一个智能体，基础搜索、图像理解全都有，相当于每天只花零点一三美元就能拥有一个专属 ai 助理。 plus 进阶版每月十美元，能开一至两个智能体，从调研 ppt 设计到数据表格，一个人直接干成一个小团队。 pro 专业版每月五十美元，适合重度用户或小团队多任务并行，支持二至三个智能体同时跑，文本、图像、视频全能生成，相当于一整套并行 ai 生产系统。换成传统 token 计费，同等用量可能得上百美元，这里五十美元直接封顶。总而言之，不管你选哪一档，对比市面上主流按 token 计费的模型， agnes 订阅制都能大幅省钱。订阅步骤也很简单，两步就能搞定。第一步，访问 agnes 官方网站，点击右上角注册，可以通过 google 或者 tiktok 账号完成账号注册。第二步，登录后进入产品中心，根据自身需求选择 token plan 套餐，完成支付后，系统自动生成专属 token，点击 api keys，创建一个新的 key，将生成的 token 复制保存，就能配置使用了。不管你选哪个档位，你买到的都是一个五小时的固定请求窗口，在这五小时内随便跑，多 agent 并行，不加价。而且它的响应速度很快，通过对话输出，从生成美业的具体内容到输出一份完整的 ppt 成品，平均只要三到五分钟。举个例子，我让他对每一冲突升级对黄金现货的影响做可式化解毒，他能直接输出一份完整美观的报告，如果对哪部分不满意，直接在对话框里说一声它就能改，非常高效便捷。如果你也一样，长期高频用 ai 疯狂消耗 token，又蹲不到 g l m 五点一直接换成 agnes token plan，省心还不肉疼。我把地址放下面了，可以去试试。
4AI-GitHub
02:49
GLM5.1香香的#知识分享 #功能测试 #Ai测评 #token #GLM
查看AI文稿
AI文稿
嗨，朋友们好，咱们又见面了，今天聊一下这个最近刚出的智普的 glm 五点一，我这几天使用了一些心得体会，之前使用的主力模型是 mini max 二点七，那么今天我把这辆模型放在一块对比，来给大家说一下具体的使用心得。我设计了三个任务，让他们分别去执行。第一个是比较简单，就写一个登录页面，包括后台的逻辑啊，前后台的逻辑就写了一个登录页面。然后第二个是一个做了一个相对复杂一点的，就是税户备份跟恢复的这么一个功能啊。第三个，呃，就更复杂一点，是做了一个量化交易的一个策略，我把这三个任务分别交给这两个模型去执行，然后我们看一下，从三个方面去看一下他的对比，第一个是时间，第二是个成本，第三是质量，从这三个方面来对比一下。首先说这个最简单的，这个登录页面，两个模型分别都跑了大概五分钟左右，速度差不多，具体的后面的小数点我就不说了，大概五分钟左右都跑出来了，然后运行呢？基本上都是一次通过，没有给我留坑，一次通过，然后调用的这个成本我查了一下， mini max 大概是花了一块五吧，反正挺便宜，没多少钱，因为这个任务比较简单。第二个，咱说第二个任务，第二个任务是做了一个备份恢复的这么一个任务啊，那这个 mini max 跑了大概十二分钟，然后交安跑了大概跑了十五分钟，速度相差不大，差了三分钟，然后 mini max 执行完了之后，我跑了一下程序，呃，有点小瑕疵，然后我又把这个日期给到他，然后他自己又修了一下，基本上最后也能运行。最后我查了一下这个调用的成本，大概是四块多，不到五块钱，然后 jm 呢？不错，就一把够。然后我查了一下调用成本，大概也是五块多一点啊，比 mini max 稍微贵一点。 ok，然后最后一个比较复杂的，这个一个交易策略的这个量化模型实现。嗯，那这次呢？ mini max 掉链子了，嗯，怎么调都过不去，最后我手动干预才过去了，然后前后花了大概半个多小时吧，三十五六分钟，差不多四十分钟，然后费用大概是十块钱，然后那个 g m 基本上是一把过，有一些小瑕疵，把日子扔给他，大概是调了一次就一把过了。嗯，时间也是二十来分钟，二十五分钟左右，然后成本的话看了一下，大概是十二到十三块钱。然后综上所述啊，我觉得这安排的挺香的，尤其是在处理这个复杂任务的时候。 ok，今天就聊这么多，嗯，谢谢大家。
13老韦
02:10
为什么你的AI那么费钱 #Claudecode #GLM #抖音精选 #Token
查看AI文稿
AI文稿
我前两天把创作工作流的模型从 cloud 换成了 glm 五点一，结果我的头款消耗涨了十倍。一开始我以为我看错了，你想啊，我们选国内模型图啥？不就是图便宜吗？那 glm 五点一也是刚出不久，单价也比 cloud 的要低一大截，那跑分呢？还非常接近 cloud， opus 四点六，那这站我一算肯定是 glm 合适啊。结果那天我刚好周限额刚刚结束啊，我跑了一次工作流，直接用掉我百分之十五的限额。哎，这就不对了呀，那我就让他把每个节点内容都给我整理出来，刚刚完成的这个任务中，每个节点用的都是哪个模型？那你消耗了多少 token？哎，给我整成一张表，结果我一看他读过热点素材，他用 g l m 五点一啊，整理复盘资料，他也用 g l m 五点一，最后写文章他还是 g l m 五点一，就从头到尾五点一，一气儿录到底。但 cloud 不是这么干的，他读东西他知道，找个便宜的模型去跑，到关键写作那一步，他才会上最强的 opus。最后拼装组合的时候呢，他用 samsung 就够了。哎，你看 cloud 这边，模型有三档， hikou 散热器，还有 opus。那 g l m 配置呢？我也对应设置了三档，四点七，五点零五点一，那区别在哪呢？ cloud 它会自己贴 g l m 呢，它全程是五点一，所以你就明白我们的 koink 到底花在哪了。就大家都在说 koink 赚翻了，为啥呀？因为它根本就不会给你省啊，全程最强模型入到底，哪怕是 koink 的这种能够自动切换模型的 agent，你接 g l m 进来它也不好使。后来我就学奸了呀，我直接强制他在某一个节点只能用某个模型，那这样我每周的偷根才能抗用一点。说到这，我就不得不吐槽一下这个 g l m 啊，他动不动就给你速愈限制。我平时用飞书控制可拉扣子，在家里电脑上干活，路上我给他发指令，家里就开始跑嘛。那结果用 g l m 以后呢，动不动就没动静了，我还以为家里断网了，回家我一看速愈限制了，我一天都没有用啊，晚上回来我一发消息还是速愈限制。你限制没问题，你高峰期三倍也没毛病。因为我之前对这个模型的印象非常好，刚开始五点零还没有发布的时候，我就在 openroot 上去测过，当时我还跟很多人去推荐这个模型，但是现在我只想说，再穷不能穷模型，再省不能省 token，你懂的。我们下期见。拜拜。
34鲤掌贵
01:48
准备开始实测各家token性价比现在每一家的计量本质上都不是透明的，相同的任务，并不知道需要消耗多少token或次数。
所以到底咋样，还是得自己实际使用之后再做判断。
#token #GLM #Trae #MIMO #小米
查看AI文稿
AI文稿
我之前推荐了 t r a e 啊，然后但是我今天把它退掉了，当然也不是说特别不好的问题啊，主要是现在各家的这个计量啊，真的是我觉得有很大的问题，它都不太透明。第一个是计量方式不一样，然后第二个是计量方式就算一样啊，比如我都按次数或者都按头看，但实际上你一个任务发出去之后，它到底花多少量？不知道啊，真的不知道。在这种情况下呢，我觉得就是试一下吧，网上看大家说我觉得没有什么直接的感受，没有什么直观的感受，大家说啥的都有啊，所以我觉得还是得自己试一下。然后呢，从焦老板那搞了一个质朴的试用版，七天啊，只能用那个四点七的模型啊，很失望，就基本上就一个多小时，两个小时的时间，然后大概搞了四五个任务吧，然后直接把一周用量的百分之八十五耗完了，这个量肯定是没法接受的，而且四点七呢，就是还出现了重大的需求理解错误的问题，就是他那五点一应该是很厉害，但是呢，买不到，对吧？买不到。然后接下来就在排行榜上去看啊。接下来是啥排行榜？瞅了一眼就发现排除掉。首先排除掉反华的，对吧？然后排除掉外外，外国那些很容易被封号的啊，我觉得折腾那些事情没有意义。然后呢，再排除掉买不到的，对吧？现在一个是智普的买不到，然后阿里那个千万三点六也买不到，他那个只有一个每个月两百的套餐，但是也买不到，排除完之后居然只剩下这个东西了，所以试吧，试一试小米，看到底靠不靠谱。
31嘉豪
00:30
用过GLM-5.1和Kimi K2.6的人不会告诉你的事 #ai #大模型 #glm #token #kimi
查看AI文稿
AI文稿
别再看跑分了，深度用了一周 g l m 点一和两天 kimi k 二点六直接说结论，这两个模型我替你们踩过坑了。编程能力上它们差不多，但用法完全不同。 g l m 点一长任务复杂，工程首推，但是高峰期算力紧张，所以你懂的。 kimi k 二点六响应快，但代价偷啃消耗快真的没开玩笑，可能一个任务能消耗你百分之十的周额度，还没订阅的考虑清楚后再下单也不迟。收藏这条，等你遇到同样的坑回来找我关注我爱不落伍。
22程序员雨未凝
01:18
分布式Token工厂用什么设备什么模型 #token工厂 #算力 #分布式 #电站 #储能
查看AI文稿
AI文稿
分布式的 token 工厂用 pro 六千有多大的产量？测试过程有哪些结果和意外呢？这是一台八卡的 pro 六千，可以分布式的部署在不同的机房和电站旁。我们选用了 kimi 二点六、 glm 五点一和 deepsea v 四 flash 三个模型进行测试，并分别从 model scope 和 hackinface 获取模型的权重，开展部署以性能评估。考虑到 pro 六千服务器总显存为七百六十八巨币， kimi 二点六和 gim 五点一的满血版都无法直接加载，因此本次测试统一采用 f p 四量化版模型。模型部署和测试结果如下，一、 kimi 二点六模型结构符合主流的推理框架，完成部署后，初步压缩的结果是峰值 token 生产率为一千一百五十 token 每秒，整体表现符合预期。日产 token 为九十九个单位，也就是一亿 token，而单个单位的 timi 二点六在 openroot 的价格为一点六美金左右，理论满产价值为一百六十美金每天。 dm 五点一部署过程中出现了模型加载失败的问题，初步判断是以 v 二二 m 官方镜像的适配性有关去进一步排查或等待兼容版本来支持。三、 deepsea v 四 flash 同样出现了加载失败，经核察是黑心为核心算第 g e m m 在 pro 六千 sm 幺二零架构上存在设备不足的问题，需要等待针对该模型优化的 v i l m 版本后再进行测试。先点关注，一起了解偷啃工厂和聚合分销的那些事儿。
387灵鲸科技袁亮
02:48
安装ClaudeCode后别先掏钱买token 小米百万亿token全闭环教你领取+接入Claudecode中!#小米百万亿token #claudecode #小米Mimo #vibecoding
查看AI文稿
AI文稿
我找到了一个免费使用 cloud code 的办法，不需要购买模型，厂商的 coding plan 也可以使用。今天分享给大家，我刚刚成功领取到了小米赠送的 talking 余额，够用一段时间了。看完这个视频，你也可以领取并接入到 cloud code 之中。这个就是小米推出的创造者百亿 token 激励计划。链接我已放入评论区，只需要五步就可以免费申请领取。首先我们点击立即申请前三项，按照我们的实际情况进行，填写你的邮箱常用的开发工具。然后目前使用的底层模型。第四项和第五项是需要我们重点填写的。第四项，我们可以将我们的日常项目进行包装，利用 ai 进行润色描述， agent 或者 ai 驱动的具体成果写的越丰富，通过率也就越高。第五项，可以上传我们 ai 平台的账单截图，还有终端运行日记等，这个最多支持五个文件，可以上传图片或者是录屏都可以。在最后可以覆盖我们 github 的演示地址。点击提交，系统会在三个工作日内提交评估结果，之后会收到这样的一个小米 miimo 创造者激励计划。然后我们在这里点击开放平台地址，我们点击控制台，这样平台送给我们的余额已经到账。我们选择 api case，新建 api case，填写 api k 名称，选择比较好记忆的名称，点击确认即可，这时会弹出一个 k，它只会显示一次，我们要把它提前复制好。接下来我们使用 cc switch，我们在添加中添加新供应商。以下是 cloud 供应商，我们选择小米米某。需要注意的是，供应商名称官网链接已经填写就绪，我们只需要在这里粘贴我们刚才复制好的 api k 即可。我们要注意是否请求地址与以上保持一致。还要注意的是目前主流模型有 v 二 pro，如果想体验小米最新模型，我们可以把这里换成 v 二点五 pro，点击添加，这样即可生成。我们点击旁边的这个按钮，点击起用。我们在终端输入 cloud，这样我们就会发现 mini v 二 pro 已经被我们正常使用了。以上就是全部内容，如果有什么问题，我们可以在评论区沟通，我们下集再见。
47爱吃汉堡（科技感）
00:33
挖到宝藏国产大模型！GLM5.1 适配有道龙虾太好用实测多款国产大模型，终于解锁适配有道龙虾的 GLM5.1，质感堪比 Claude Sonnet 4.6，搭配套餐直接解决 Token 焦虑！#GLM5.1 #国产大模型 #有道龙虾 #OpenClaw #AI 模型实测 #人工智能 #大模型推荐 #AI 避坑
查看AI文稿
AI文稿
终于找到了一个好用的国产模型，智普 glm 五点一搭配游乐龙虾效果很好。之前试过两款国产的，一个是某包的回答慢，感觉像弱智，另一个是企鹅的某原模型， tucker 烧的飞快，没几个动作几十万的 tucker 就全没了。今天试了 glm 五点一，效果真的出乎意料，跟 clodson 四点六有一拼。唯一的缺点就是 talking 比较快，但配合某山的 callin plan talking 焦虑直接解决，国产魔性真的在进步。
11叶赛文
02:15
安装 Claude Code 后别先掏钱买token！小米百万亿 token 全闭环教你领取+接入Claudecode中！ #claudecode #小米Mimo #vibecoding #ai新星计划
查看AI文稿
AI文稿
我找到了一个免费使用 cloud code 的办法，不需要自行购买，墨星厂商的扣丁 plan 也可以使用。今天分享给大家，我刚刚成功领取到了小米赠送的七亿 token，够我使用一段时间了。看完这个视频，你也可以领取并进入到 cloud code 之中。这就是小米最近推出的创造者百亿 token 激励计划。我们只需要填写五道题目就可以免费申请领取。我们申请这个活动只需要下面两步，第一步，打开活动官网，然后填写页面中的问题。前三道题随便填写，但真正卡人的就是第四题。因为很多小白不知道如何使用 agent 或者 ai 构建项目，但没关系，我已经将我成功申请使用的项目描述可进入到 cloud code 的详细步骤，写入到了文档之中想要的评论区留言。我们在完成题目提交申请之后，我们就只需要等待审核。审核通过之后，我们会收到小米官方的邮件，邮件中会包含开放平台的地址。我们进入到开放平台，首先需要进行登录，如果你还没有注册过小米账号，可以先使用手机号进行注册。注册完成之后，你也可以使用手机号进行登录。登录完成之后，我们可以点击右上角的头像，选中个人中心，然后再绑定我们申请使用到的邮箱。绑定完成之后，我们再点击控制台，然后再点击左侧的订阅管理，我们就能看到我们领取的 token plan。在这里我们可以申请 token plan 的专属 api key。下面就是将我们领取到的 token plan。通过 cc switch 接入到 cloud code 之中，我们需要打开 cc switch，然后点击加号添加一个新的模型供应商。在这里我们选择小米 miimo，选中之后我们向下滑，然后将上面申请到的 api key 填写在这里。注意这个请求地址需要改成这个，因为这是 token plan 的专属请求地址，具体的地址我已经放在文档中了。下面的模型最好也贴换成小米最新的 mimo v 二点五 pro 模型。配置完成之后，我们点击保存就可以了。添加完成之后，我们点击骑用小米 mimo 的配置就可以了。我们可以打开终端，启动 cloud，然后检查我们的配置是否生效。 token 我们已经成功领取到了， cloud code 也接通了。如果你想知道如何使用 cloud code 实战，麻烦点个关注，我们下期开始讲解实战内容。
8831林克AI实战录
01:39
📉 AI 额度又用超了？我开源了一个多平台用量监控利器帮你我用AI编程写了一个AI用量监控的软件，在GitHub和GitEE开源，提供给大家任意使用，大家可以⭐起来，现在支持智谱AI的GLM、MiniMax和小米MiMo，后续还会支持更多AI平台，欢迎大家提供宝贵建议。 #AI编程 #开源项目 #普通人在AI时代 #大模型 #TOKEN监控
查看AI文稿
AI文稿
脸，脸都不要了。事情是这样的，我的朋友写了一个 ai 用量监控的一个菜单软件，我建议他开源出来，但是他不同意，于是我就花了几天时间写了一个比他的功能更完善，支持更多平台的 ai 用量监控的一个软件，并且开源了出来，提供给大家下载使用。大家觉得这样算朴切吗？这我就不太清楚了，下面我就给大家分享一下完整的创作过程。我现在已经确定了基础方案和 api，现在是下午五点，我现在开始，如果今天能够完成开发，我就把插件的源代码发出来放到 guitar 上。经过半个小时的漫长等待，八个步骤的反复确认，那么我们已经完成了这个插件的开发，看一下效果。基本的使用方式就是下载 d m g 拖动到 application 双击，然后我们就可以看到菜单里边有任何的插件的一个显示，然后点设置，进行三个 api， key 和 cookie 的一个设置，小米密密的 cookie 从这里粘贴，打开小米密密的后台，然后打开浏览器工具，然后粘贴完整的 cookie 就可以了。这就是简单的使用方式，我把代码也用二八七二点零的协议开源了，然后大家可以随意使用，并且可以商用。那欢迎大家来看我的代码，我也会把安装文件放出来，到时候大家就可以直接下载安装使用了。我的原则就是让大家用最轻松的方式来监控日常使用的 ai 平台的余额和用量。希望大家多多提供宝贝的建议和意见，或者你希望在添加哪个平台，我来帮你开发。
3岩创 AI
00:39
GLM、deepseek 随便切！全网最高性价比的 Token 调度方案我帮你找好了~#Token成本 #降本增效 #Kimi大模型 #GLM #API接口
查看AI文稿
AI文稿
最近我在疯狂玩智能体，但有个问题真的太烧 token 了，普通聊天机器人一问一答就几万 token，一个月几十块钱搞定。但智能体不一样，一个任务能掉几十上百次，模型一个月几一 token，主流模型平均大概五美元，每百万 token 一个月要烧一千美元，就算用国产模型也要两三百美元。所以这期就讲一件事，怎么搞到便宜甚至免费。先给你一个核心思路，省钱本质就是在三件事里做取舍，价格、稳定性、模型能力。但是智能体、磁源 token 工厂可以同时做到这三点。如果你想更省钱，国产模型力 g l m 最便宜，批量效果最好，想要最强又稳定，那就贵一点。最后总结一句话，没有最完美的方案，只有最适合你预算的组合。
0Gnomic智能体
19:46
真保姆级！手把手教你安装 openclaw 对接飞书沉浸式安装 openclaw 小龙虾，对接 GLM-4.7-FlashX 实现免费使用不花一分token钱！！！#openclaw
415教你宇宙级AI编程（求关注）

热门推荐

热门分类