粉丝369获赞5659

截至二零二六年五月十五日,国内各家厂商的 coding plan 套餐。 coding plan 简单来说就是花一笔固定月费就能在 cursor、 cloud code 这些工具里大量调用 ai 编程模型。 今天我就来帮大家把八家平台一次性对比清楚。先说质谱, glm codein 旗下旗舰模型 glm 五点一,括定能力,开源 sota 能可靠交付。生产级代码套餐分三档, like 四十九元, pro 一 百四十九元, max 四百六十九元。不过智普是限量抢购,手慢无 再说火山引擎方舟这个是模型聚合平台,豆包二点零 code deepseek v 三点二、 g l m 五点一、 k m k 二点六、 mini max 二点七,全都能用,还有 auto 模式自动帮你选模型。 like 四十元 pro 两百元月额度九万次,购买容易。阿里云现在是 token plan, 主推 q one 三点六 plus, 支持图片理解,还集成了 kimi k 二点五、 g l m 五、 mini max m 二点五, 不过目前还不支持 kimi k 二点六和 g l m 五点一 pro 套餐两百元一个月,月额度九万次,限量抢购 腾讯云独家的会员模型 h v 二点零,加上 g l m 五 kimi k 二点五、 mini max m 二点五。 light 四十元 pro 两百元额度和其他家一样,也是限量抢购。 百度千帆文星系列模型加上 g l m 五 kimi k 二点五、 mini max m 二点五 deep six v 三点二 套餐同样是 light 四十元 pro 两百元,购买容易,不用抢。 kimi code 月租四十九元起,主打 kimi 最新旗舰模型,输出速度最高,每秒一百个 token, 适合复杂项目分析和 ai agent 场景, 不过月额度相对少,一千到一万两千次, mini max 起步价最低二十九元每月起 旗舰模型 m 二点七,而且不止编程,还支持语音视频图片音乐全模态,一站式 包年更便宜。最后是小米咪某,三十九元每月起,咪某系列八款模型可选。总结一下,同档位额度总体差不多,各家自家模型都是最新的支持的,其他家模型会稍微晚点 四十到两百元这个区间。 pro 档基本都在九万次月额度,买不上的可以考虑火山引擎和百度千帆购买门槛最低。好,这就是目前国内 ai 抠订方案的全景图,只对比不推荐大家按需选择。

今天给大家分享一个比较便宜的普通小白都能用的一个大模型。我们知道我们在学习 ai 或者使用 ai 的 过程中,就会发现 它是一个巨大的氪金的东西,因为会消耗大量的 token, 很多大模型靠这个 token 的 消耗令来盈利来赚钱。今天分享的这个呢,就是阿里云的一个最新的叫扣丁普兰的 这个头,跟他这个主题呢,说是量大环保,支持阿里云的千万的三点五,还有 mini max, 还有 嗯 g m m 等等各种模型,他是按照消耗的次数调用的,次数就每月呢大概有一万八千次的这个调用额度,每月的这个套餐费用是四十块钱,现在打折啊,现在二十块钱 对于普通小白是完全够用的,因为很多人反映这个 投币量很少,而且比较慢,如果你只是说我掌握一下 ai 的 基本应用,跑一下简单的流程,知道这个 ai 是 干嘛的, 我觉得是完全够用,它还支持这个龙虾,还有支持可乐扣的。另外一个呢,就是我们在调用这个 api 的 时候,一定要记得是扣丁普兰的 api, 不是 那个百炼的 api, 因为百炼的那个 api 呢,它是后付费的,你消耗多少投币就扣多少钱。 我上个月签约的时候,当时结果 api 填的是那个百炼的,他一天就给我花费了一百块钱,当时把我吓坏了。我觉得阿里云他这个售后比较好,因为是今天那个售后小哥给我打电话, 我把这个事情给他说了,他说你是调用错了 api 了,今天就把那个 api 给改过来了,我觉得这个是比较划算,因为一个月就二十块钱,大家可以试试。

有人说 opencode 的 购套餐啊,这个我早在用,好处呢,它是可以用到国产的最新的模型,只要出最新,它立马就会接入到它这个购套餐里。 但是不好的地方,它其实本质上也是按 token 来计费啊。我跑了两天,基本上一半的额度就已经跑完了。就如果你是正常的任务来跑或者编码来用,肯定是用不完的。 但是如果像我一样你跑任务,其实它这种 token plan 根本不耐用,这是跑了两天的额度。我的任务是用来生成代码,然后不断的测试,生成代码,不断的测试,然后不停的去跑,跑了两天就这样。所以你们可以试试看啊。但最划算的其实还是 token plan, 这个相当于 token plan。

我拿到小米二十三亿 token 的 时候,其实是有点懵的,不是兴奋的那种懵事就这就这也能过迪那种懵?这个是 max 套餐的十六亿,这个是 pro 套餐的七亿。先交代一下背景,小米最近搞了个活动, 叫咪蒙 over 的 百万亿 token 创造者激励计划,三十天免费送一百万亿 token, 最高给到 max 上十六亿 cash, 等值六百五十九块钱。 这个话题已经有很多博主写过了,活动也快到尾声了,五月二十八日截止,还剩不到一周,按理说不该再蹭了。但我之所以还是写,是因为我发现了一个特别简陋 特别巧的方法,几乎百分之百能拿 max 档。这个方法我一会儿说,先把活动本身聊透。咪猫是小米自研的大模型,最新版本 v 二点五 分两个模型, pro 版面向复杂任务深度适配 a 剑客和编程,在 gdp v a l a a 和 clever 榜单上开源第一。还有一个是全模态版,文本、图像、视频、音频都支持 v 二点五, pro 用的 mo 架构,总参数三零九 b 激活十五 b, 原声支持一百万 to k 上下文推理成本只有国际币源旗舰的百分之二点五, api 定价大约是国际竞品的五分之一。 你可能觉得这不就是个国产模型吗?但坦率地讲,这次小米的成绩确实够硬。 texturina 全球综合第五, labyrinth 全球第四。 open route 上周以百分之三十多的试战率登顶第一 周条用量四点八二万亿 token, 而且它是开元的 mit 协议商用自由。说真的,全球前十开元模型里,中国占六席, 小米是第一个登顶开元榜首的手机厂商回到活动,这次 over 的 计划分两部分,一部分是面向开发者的百万亿 toc 创造者激励,另一部分是面向 ainc 框架团队的生态共建。我们聊的是前者,申请流程不复杂,去 mimo 填个表单,三个工作日出结果, 通过后邮件通知、登录开放平台等权益到账就行。但很多人卡在评估这步,拿到的是赠金,而不是 tiktok plan 或者档位很低。网上常见的建议是要写详细的项目描述,要有 github 链接,要做完整的项目, 有些教程甚至建议你前后端数据库齐活,搞得跟融资 b p 似的。我一开始也这么想,然后我发现了一个更聪明的路子,就是只做一个前端,一个用歪不扣定搞出来的非常非常厉害的前端不需要,后端不需要数据库,不需要部署上线, 就是一个纯前端页面,但视觉要炸,交互要丝滑,让人点开第一眼就觉得,卧槽,为什么这招管用? 你想啊,评估的人一天看几百份申请,大多数是 github 仓库链接和 api 文档,他点开一个仓库可能还没看完 readyme 就 关了,但你给他一个牛逼的前端,点开就是成品,视觉冲击力直接拉满,谁都能一眼看出来这东西好不好。后端逻辑写得再复杂, 评估的人不懂你的业务逻辑啊。但一个漂亮的页面,不需要专业知识就能判断质量。我自己 pro 档就是这么拿到的项目就一个纯前端页面,没写一行后端代码。我朋友按照我的方法拿到了 max 档。 噗儿当倒是我实打实拿作品申请的,自己写的 app, 还有几个 skill, 两者加起来一共二十三亿 token。 再说一个很多人踩的坑,一定要先注册好小米账号,绑好邮箱和手机号,申请表里填的邮箱必须跟小米账号绑定的邮箱一致, 如果不一致,或者你用的是手机号注册的账号,没绑邮箱,通知邮件根本发不到你手上,全一批了你也拿不到。 我一开始就翻车,在这折腾了好久才搞明白。所以正确顺序是先去小米官网注册账号,绑好邮箱,然后再去申请。操作上也不复杂,用 cloud code、 科斯尔或者任何顺手的 ai 编程工具,让 ai 帮你 vibble 扣度一个炫酷的前端页面,重点放在视觉效果和交互上,动画动效,享意识布局,这些能让页面看起来很贵的东西。多搞深情表里,把截图放上去, 项目描述写清楚,用了什么工具,做了什么功能,解决什么问题,就这样。最后说说这个 tucker 值不值得薅。 mmo v 二点五 pro 的 编程能力,我自己用下来的感受是比我日常用的 g l m 五车报强不少,跟 g l m 五点一比也差不了太多。 a p r 能直接对接 cloud code 浏览器, oppo 跨这些主流工具。十六亿 tucker 免费活动五月二十八日截止,池子部等人免费的羊毛,而且是比较厚的那种,不薅确实亏了。

mini max 今天上线了一个新功能,发布了一个 skill, 它现在是你订阅它的 token 套餐就能支持全模态。也就是说之前很多人担心的烧 token 的 问题,现在彻底解决了, 不需要调用按量付费的 a p i 就 能实现全模态,这个非常非常牛。 当然订阅了不同套餐,他是有不同的用量限制啊,如果是用了高级版的套餐,他可以每天生成几首歌,然后还有视频 配置也很简单啊,它是发布了一个 skill, 在 这里你只需要复制这个地址,然后去浏览器打开,当然我之前打开过就这个这个 skill, 你 把它给安装上就可以用了。 那我们详细看一下他这个 skill 具体有哪些能力啊?文本转语音生成音乐,还有做视频图像处理, 媒体处理,他甚至能做一些基础的剪辑工作。当然我订阅的是他的基础版的功能,所以我们现在测试一下,让他生成一张图, 看一下效果。好,这里已经生出来了,我们看一下效果啊。白色的马在草原上奔跑,效果还不错啊。那么之前订阅了 mini max 套餐的赶紧去试一下吧,牛逼!

电信、移动和阿里的 token 套餐是什么样的?有什么样的区别?两分钟给你讲清楚。一、先看电信新发布的套餐,分为基础版、专业版和旗舰版,分别是一千五百万 token, 是 三十九点九元每个月, 相当于两点六六元每百万 token。 第二档是七千万 tokens, 一 百五十九点九元,相当于二点二八元每百万 token。 第三档是一点五亿 tokens, 两百九十九点九元,相当于两元每百万 token。 其实挺便宜的,大概在二到二点六六元每百万 token, 但好像隐约有点问题,就是 并没有说明是什么模型的 token, 毕竟智普 g r m。 五点一和千万二点五杠三十二 b 价差挺大的。所以这个角度来看,电信的包月套餐可能主打就是通用 和便宜,卖给不在意模型的人。在意模型和专业比较懂的客户,应该会选择固定大模型的 a p i 而不是一个盲盒 a p i。 二、再来看移动的 token 包,一样是盲盒 a p i。 北京移动推出了二十四点九九元每一千万 token 的 月包,差不多是二点五元每百万 token, 加速移动的 token 也差不多是两元每百万 token, 也没有指明模型,和电信的 token 包是比较接近的。三、阿里的 token plan 分 为三档,一百九十八换二点五万积分,六百九十八换 换十万积分和一千三百九十八换二十五万积分,差不多就是一分钱换一点二五到一点七九个积分。支持的大模型包括了几十个自由模型和近百个 三方模型,比较全面,每个模型对应的积分消耗也是不一样的,整体上比较适合真实的开发者们,小白用户看到这些场景应该晕了。而且模型分为 a、 b、 c 三类,对于预付和后付的采用不同的折扣,还有大家关心的 happy house 热门的 g、 l、 m 也有比较少的折扣。总结一下,运营商的 token 包主要是给普 通和小白用户用的,阿里的 token 包是给开发者用的,所以也提醒作为 token 词源聚合分发站点的我们,在给 ai 开发者低价 token api 的 同时,也应该准备一些给小白用户的 token 包了。

用 ai、 大 模型、小龙虾编程这些可以考虑一下。小米的这个大模型,现在降价了,三十四块,三毛二,续费是三十九块钱一个月,四十一亿的 top, 这个九十块钱的九十九块钱,一百一十亿,以前这个四十块钱,三十九块钱的只有七个亿,只有两个亿, 这个九十九块的,七个亿,可以高频率的编程,可以用七天, 那现在一百一十个亿用一个月问题不大。还可以考虑这个讯飞的口径,可能三十九块钱可以用到 glm 五点一,有多个模型可以选择。

说 ai 不 说价,生意做不大。阿里云前两天不是上线了一个团队版的 token 套餐吗?价格我直接贴出来啊,标准版是幺九八一个月,高级版是六九八一个月,尊享版是幺三九八一个月,还一个共享用量包啊,五千一个月,单砍 u 九八。嗯,确实不贵,就一顿饭钱, 但老板们也算个账,一九八貌似不贵,但如果是十人团队版呢?全砍,高级版呢?一个月,再叠加上什么云服务器啊,什么 a 阵的工具啊,一年小十万没了啊, 有这钱啊,还真不如请一个出局成员呢,好歹呢,也是自己的资产贷款,还能沉淀。还记得之前阿里云卖的那个 call 定套餐啊,他这个方案有两个大问题,第一个就是限流啊,你用着用着咔 用不了了。第二个呢,就是库存抢不到。我们记住啊,天天大半夜凌晨去抢,抢不着,这玩意被开发者给喷墨了。如果说这个团队版的这个透明套餐还是这个套路,那可真有点说不过去了。那所以问题来了,这个价格,假如你是老板,你会买单吗?

兄弟们,天塌了呀, token plane 要越来越贵了。据传啊,阿里要把那个两百块钱投 pro 套餐给下架了 啊,他之前就把那个 light 那 个穷鬼套餐下架,现在 pro 也要下架,然后还要改那个计费模式啊,以后就不是这个 coding plan 的 这种模式,要改成类似腾讯那种 token plane, 就是 总量模式。 那也就意味着说你以前是呃每隔一段时间会给你 fresh 这个使用额度的,这种情况就消失了。大家都是看总量的啊,虽然跟 api 比啊,那调用就跟 api 调用量比啊,可能还是划算的,但是绝对不可能像以前那么便宜的啊。我之前就做过一个计算, 我在使用 mini max 的 时候我算了一下,我说,呃,如果同样一礼拜的调用用 api 计费是多少?当时给我计算出来好像是快五千块钱一星期。如果按照那个 api 的 算力价值哈,但其实我只付了九十九块啊。那你想一下, 真实的算力价值跟 taco play 卖给你的价值差的有多大?即使算上有所谓的这个缓存命中率问题,反正这东西啊,我们也不一定看得见。然后还有他后台的计费方式不透明,但我仍然认为 taco play 目前只是因为在大模型推广机 厂家拿出来的一个呃,这个缓兵之策而已。那后面他发现你们越用越上头,越用越上瘾,他就开始涨价了 啊。所以我建议你们第一,现在能续费的,要么年费就给他续上啊,或者直接给他多续几个月啊,要么你要开始考虑本地模型的部署了啊。我告诉大家,比如说我们部署一个三十 b 参数左右的本地模型的硬件成本啊,基本上可能也要破万 一万多块钱。那你想一下,那相当于说如果我一年的情况下,那我大概一个月也要花个一千多块钱嘛,那这个才是合理正常的现象嘛, 对吧?那如果你说你用云端的那么便宜,那你说那云端他是不是他没有用硬件设备吗?他也是用硬件设备啊,他也是这样。呃,这个算利卡的矩阵啊, 那难道那玩意比我们买还便宜吗?我相信它集中的效应啊,它可以呃利用架构去做一些成本上的这个节省,但是你仍然摆脱不了那个负债越高你压力就越大。 而且你们最近在用的时候是不是也发现我虽然买了套餐,但他好像不太能用,我买的越便宜套餐他好像越不能用,哎,动不动就给我什么限速,哎呀,不然就卡死不回应怎么着? 太正常了,这服务器资源不够嘛,他本来你这个你这个价值是被低估的情况下,然后他还要把这个服务器资源给你,因为毕竟对他来说其实就出个电费而已。 电费啊,这个贷款费用也没什么了,对吧?那他主要是希望说整个我们的社会能够去习惯,能够去高度依赖这种算力的使用。 现在势头已经出现了啊,我认为未来不出一年之内我这里下个论断我个人的看法,反正大家蛮说,我蛮说你蛮听,一年之内 本地算力的需求会大幅度的上升,那其次呢?呃,这个 token 的 计费方式, token 的 这个价值会被重新的。呃,这个估值一次就是你不可能像现在这样便宜的价格去购买这些套餐。 哎,当然了,我还是得说啊,目前海外的 g p t 或者克劳的模模型,由于他们可能认为他们的主要营收来源仍然是 to b 部分,对政府对企业的这部分收入是占了大头, 对于你普通用户来说还是在一个体验期,所以目前他们还是比较大方的。我现在高度依赖 g p t, 所以 我推荐你们, 虽然它跟我们国内的大模型比贵了一点,但是你会发现它更加的稳定。 第二,它的能力确实也更强啊,它能力也不体现在跑分上,体现在具体能力这个执行使用过程中啊,所以你们不妨试试看,也不用整天去抢那些套餐的, 抢了也可能没用,指不定哪天他跟你说这个不能用了啊,或者改一改积分模式,规则一改,你前面的这些东西就都不算数了啊。

广东移动的免费 token 你 们领了吗?无缝接入 open club, 支持 mini max 模型,有两个套餐,现在都可以免费试用啊。那对于运营商来说呢,传统的流量业务其实已经到达天花板了,我们一直把它归到这种收息型的公用事业资产里,按照 p b p e 去估值,但是现在 token 经营呢,是按科技类的成长性,也就是 p e g 估值去算的, 那现在运营商股息率呢,一般是在百分之六到百分之六点六, 这个呢就提供了极强的下行保护,试错成本很低,加上这个 ai token 时代的第二增长曲线,还是很有诱惑力的,特别是在这个政企客户市场,运营商拥有互联网大厂都比不了的这种数据安全的背书啊,本地化部署能力啊,和这个极低的宽带网络成本, 这个就是他们做偷看生意的核心护城河。那如果做成了 ai 时代的国家电网,那就很有意思了。但是这个行业呢,需要很强的软件生态调度能力和这个算法迭代能力,按照现在运营商的这个管理经营方式呢,能不能做到还是需要去观察的。 那现在呢,除了运营商,像这个绿电啊,城投啊,还有类似金融终端,或者这个医疗数据库这些垂直高价这种数据机构,还有这种硬件终端巨头呢,根据我们最近的走访调研发现呢,都有去做这个 token 生意的意向和计划。

感谢雷总,现在小米大模型我又可以免费用一个月了,大家看我现在这个 token 额度是多少?三百亿 token 多到根本用不完。这个操作方法也很简单,首先我们要开通创造者激励计划, 还没开通的可以先去看我之前那篇教程。然后我们先打开套餐管理,启动自动续费弹窗,然后点击前往订阅,选择这个,然后点击下一步就会自动减免,不过次月会恢复正常价格,所以完成后建议关闭自动续费。好了,接下来可以尽情使用了。

太炸裂了, deep seek 半夜发推直接宣布 v 四 pro 永久二点五折,不是限时活动,是永久。老外直接疯了,五万多个点赞,评论区全在喊,这也太便宜了吧。 智普 g l m 月卡一百四十九,还得靠抢 api 价格更吓人,输入八块, d s 才三块,缓存命中那块人家两块, d s 两分五八十倍的差距,这还比啥? timmyui 确实牛,但价格也是真敢定。四十九的 on dante 套餐,两三轮对话就见底了。 api 缓存不命中六块九,比 d s 翻了一倍,还拐弯 小米 minimo 表面便一时则天价。 token plan 了解一下?三九入门看着还行, pro 模型一跑, credits 直接翻倍,扣算下来比 d s 贵到不知道哪去了。 最离谱的是阿里腾讯,模型一般般吧,价格是真的能打打用户的那种 coding plan 说改就改,我看这业务八成不打算好好做了。 一张表全明白了。 ds 输入价,腰斩输出价,膝盖斩,缓存价直接砍到脚趾头了。最狠的是 v 四 flash, 还能再砍百分之六十六, 能力一点不输 g l m 和 timi 价格。把铜型按在地上摩擦,我现在直接充钱,用多少扣多少,太便宜了反倒有点担心。 ds 你 可别扛不住啊。

传统 ai 暗透坑,计费成本难把控,月底账单极易超支,团队用着格外揪心。如今,行业迎来新改革,火山引擎率先推出 a 证专属订阅套餐,彻底告别算力乱收费乱向。套餐分四档定价,每月四十元到一千元全覆盖。从个人新手开发、小型项目测试,到初创团队、中小企业商用, 不同需求的用户都能按需选购,完美适配各类预算和使用场景,定额消费预算清晰,再也不怕超额支出。更惊喜的是,套餐内含自洁自研全系列模型,还聚合多款主流大模型, 一站式打通文本、图像、视频全模态能力开发创作智能体搭建,调用起来十分方便。想要详细套餐对比企业专属报价评论区扣,需要欢迎来聊,记得点赞关注哦!

我感觉啊,这个云厂商真的被龙虾给干死了。为什么这么说啊?就是我发现最近这段时间云厂商呢,国内云厂商呢,它这个 talkin plan 全部被就是慢慢的再退款,然后呢再禁止续费。为什么这样子啊?我来给大家讲讲啊。 首先呢就是龙虾啊,它是一个非常好这个 talkin 的 一个东西,因为它的上下文很大。第二个呢就是龙虾它跟写代码不一样, 他会有个什么问题啊?龙虾他的这个每次他的输入啊,他都大部分不一样。比如说呢,你今天晚上十二点你跟别人在聊 a 话题,比如说你说啊,吃什么东西最养生,那你明天早上你又想着说啊,我让我要让龙虾帮我生成一个什么定时任务, 然后后天呢,你又想要龙虾去帮你,帮你去收集一个什么什么数据,然后呢再帮你做成一个什么什么文件,然后再给你每次你的上下文,他是完全不一样的,基本上 所以它的缓存特别少。这个呢,很吃这个,其实是很很吃那个,你的那个显卡的哈,就虽然显卡在 perfect, 在 perfect 阶段还是可以并行,但是呢谁都扛不住啊,这个东西太吃卡,太吃显卡了,我自己就知道我这快两千个用户了,我是很清楚的,这个东西你如果没有这个一定的实力,真的 你想靠这个东西赚钱不可能,之前云厂商卖的是什么?三十九块九,二十九块九,一个月,我告诉你,绝对被薅爆了, 那龙虾搞一下十二十万的那个输入,然后给你来个一两万的输出,完蛋了你这个,哈哈哈,所以现在云彩山扛不住了,哥们。但是我想说啊,就是对于普通人来说,我认为龙虾是一个非常好的一个,呃, 非常好的一个产品,为什么呢?因为他的上手,每个人很容易就能上手,而且真的能帮你做事情,他缺点就是,呃,就是做的事情有限嘛。然后第二个就是比较烧托肯,不过我觉得这是目前来讲普通人去折腾最好的一个机会吧,就是如果屏幕前的你不是搞技术的,我还是很建议你去折腾一下龙虾的,好不好? 然后很多人想开中转站赚钱,我告诉你,第一个,你中转站一上来,人家不会充很少你,只要你这个东西速度和这个质量不行,人家马上跑路了。 第二个就是中转站现在很多呢,它掺水的像我自己,我去逆向那个 cloud 和 gpt, 啊,这个东西啊,我对这个速度我是很不满意的,所以我是不会放到上面来的哈,就是你,你能把这个东西做得非常完美啊,它很难, 对技术要求真的很高,因为相当于是灰厂嘛,对不对?然后呢,现在很多中转站怎么做呢?你发个你好,它就给你换成 cloud, 你 花,你要是输入个十万托,肯输出个两万,它就把你换成小模型, 所以你会发现,哎,用着用着怎么就降质了,对吧?我当然我怀疑他们那个 cloud 的 内部也会这样做哈,他发现你是,你是,你输入的是中文,然后你输入的很大,他可能给你降质,我真怀疑他会这样干,因为他他不喜欢中国人嘛,就 cloud 这个公司。嗯,然后, 呃,如果你对这个中转站是有需求的,对托肯可以看看我这个啊,就平时六毛钱一百万托肯,晚上的话和星期四是三毛钱一百万托肯感谢大家支持啊,谢谢点赞、关照、关注、收藏,谢谢。

你们今天刷到豆包要开始收费的消息了吗?我今天看到一些媒体截图说豆包的 app store 页面里面大概有三档,标准版是六十八元一个月, 加长版两百一个月,专业版是五百一个月。当然现在还不能说已经正式上线了,官方回应是目前还在测试阶段,免费服务也会暂时先保留 ai 像以前那种免费额度使用的阶段可能真的快过去了。首先你要知道, ai 每回答你一次问题,背后都是成本, 服务器、显卡、电费、贷款、模型推理,全部都是要钱的。现在,嗯, 已经不仅是简单的单模态语音聊天了,现在的图片、语音、视频文件、 ppt 代码 全都开始往 ai 里面塞,这就是我们说的多模态。多模态意味着更高的计算量,更长的处理电路,也会带来更高的成本。所以现在所有的 ai 公司几乎都在做两件事,一个是把模型能力做强,还有一个是把编辑成本压下去。一个是筹密模型,就是每次你回答问题的时候,大模, 呃,大部分参数都会参与计算,它会更加稳定,也会更勤,它们更稳定,但是也更吃算力。还有一种是稀疏模,它的总参数可以很大,但是每次真正激活的参数没有那么多。比如我们常用的 deepsea 三,就是一个六百七十一 b 的 总参数,但是每次 toker 大 概只激活三十七 b 的 参数。 kimi 的 k 二更夸张,它是一个 t 的 总参数,但是每次激活大概只有三十二 b。 这就是为什么现在模型的定价越来越复杂,不同模型、不同算力、不同上下文、不同速度、不同推理深度,以及不同的多模态能力,价格都会不一样。比如说开源模型、拉玛千万、 deep seek、 g l m, 它们是可以下载权重,然后自己去部署和微调的,但是这不代表就是完全就免费了,因为还是需要算力、 gpu 服务器、显卡、电费和运维的。 所以开源模型更像是配方公开,但是食材和厨房还得自己准备,通常是厂商不公开。完整的权重你不能自己下载部署,只能通过 app 或者 a p i 调用。你付的钱里面也包含了模型能力、算力、接口、运维、安全和稳定性,就是轻任务。我们可以用免费额度和便宜模型,等重任务的时候再开强模型, 有批量任务可以走 api, 隐私任务用本地开源,千万不要被参数和宣传口径给忽悠了,看清楚自己到底需要什么,然后再决定我们要为哪一部分能力去支付费用。

哈喽,大家好,我是孟凡五,好久不见,今天跟大家聊一聊关于投坑费用的问题。呃,随着 ai 的 普及,呃,越来越多人在使用龙虾类的或者 ai 扣定类的产品,不知道大家有没有感觉啊,就是现在投坑的费用的支出呢,是越来越高了, 随着我们使用量的增加呢,套圈消耗已经开始从赠送的用不完,再到小额订阅,再到订阅的不够用,伴随而来的就是一开始的薅羊毛还用不完,到最后的话小额的订阅包进行体验,到最后订阅正式的扣定方案,到最后正式的扣定方案可能也不够用,这种情况 伴随而来呢,是投坑消耗带来的经济支出的快速增加。说个比较扎心的事实,就说本人定用的二十米一个月的 c 零普兰,如果在重度工作任务的情况下,可能一天的时间就会消耗完, 甚至有人调侃扣定费用的支出呢,将会成为打工人返贫的重要原因。那如何降低透坑费用的支出呢?我觉得有几有两个方面可以考虑,第一个是订阅透坑 plan 的 时候货比三家,现在其实也是有一些比较便宜的,像二十多块钱一个月的透坑 plan 的 这样一些订阅计划的。 不过在订阅的时候一定要注意,通常情况下,廉价的模型带来的是较差的推理能力,它可能在完成工作的时间、准确度以及错误率上都非常的不理想。遇到这种情况,我建议果断放弃 低质的投分 plan, 选择更贵,效果更好的模型,毕竟 ai 扣定出来的产品,第八个的成本是相当高的。 另外有个小技巧就是用好提示词优化,其实很多 ai 扣铃软件呢,就自带提示词优化功能,它可以帮助你让大模型更好的了解你的意图, 快速完成任务,并且减少错误率。最后我们从行业角度来分析一下这个现象,脱困费用非常像手机移动上网,从产生到普及,那随着 ai 应用的增多,我们对于脱困的消耗量越来越大, 可以说 tokun 就 会像水电燃气一样,成为我们学习或工作中的基础生活设施。我们可以看得到国家层面的,国家在大力推广国家算力网的建设。在未来 tokun 算力资源供给有一个非常特殊的群体,就是运营商,因为运营商掌握着我们连接模型的网络 条件,所以说他提供相关的 tokun 服务呢,具有先天的优势。我们可以看到已经有运营商在推出 tokun 套餐, 那伴随着国家算力资源的不断建设呢,算力的成本也望逐渐得到降低。好的各位,以上就是本期视频的全部内容,如果视频对你有所帮助,请点赞支持,我是孟凡五,我们下期再见!

在与 ai 同行的路上,绕不开一个自带流量的热门词汇,它就是 token 词源。那么普通百姓如何用上词源?企业如何低成本调用词源资源? 本次大会上,中国联通给出了自己的答案。中国联通现已搭建了完美的全站 ai 云体系,为各类智能企平台提供安全、 充沛、可靠的算力工具。目前分为个人版和团队版,共计六款套餐。个人版推出了月十五元、三十元、四十五元三种套餐,最高每月可提供一千八百万的 tocs 算力,适配 ai 成千日常高频使用、深度开发等个人需求, 性价比高、轻量化灵活。团队版推出每月一百九十八元、六百九十八元和一千三百九十八元三种套餐,最高提供二十五万 credit 点数计量算力, 适配于各种 ai 辅助办公、 ai 编程开发、深度技术研发等规模化场景,支持多人协助与批量算力调用,助力企业 ai 业务落地提效。更多产品敬请关注中国联通 tompan 产品上市了!