看到雷军甩出的王炸,我总算知道梁文峰为什么妥协了。五月二十七日凌晨,小米官宣自家大模型 mymove 二点五系列 api 永久降价,最高降幅百分之九十九。 五天前, deepseek 刚宣布 v4 pro api 降价,最高可达百分之七十五,热度仅维持一周。小米直接正面开大,甚至更狠,每百万 token 零点零二五元,且不区分上下文长度。 这是二零二五年以来, deepseek 靠性价比筑起的护城河,第一次被正面击穿。时间回到二零二四年,雷军开出千万年薪,挖来了 deepseek v 二核心开发者、天才少女罗弗利。自从接上梁文峰的左膀右臂,小米大模型就像装上了火箭。 十二月、二月、三月,小米像下饺子一样发布大模型,混合专家架构,万亿参数,百万 to 上下文,像极了 deepseek 的 孪生兄弟。 最绝的是二零二六年三月, openroot 上冒出两个匿名模型, hunter alpha、 heli alpha。 外界都在疯传 deep seek v 四即将发布,结果雷军却在微博亲自认领。 就像科技媒体三十六课文章里写的,罗弗利的加入,使得 deep seek 的 基因被小米直接复刻,匿名测试的打法也被小米学得炉火纯青。中国 ai 实验室的技术路线已经趋同到分不清你我。 前段时间, deepsea 破天荒地宣布对外开放融资。要知道,自 deepsea 诞生第一天起,梁文峰坚持不融资、不站队,也不急于商业化。 他曾说过,公司的核心目标是实现通用人工智能,而资本会干预技术稀释控制权。但当他带领着研究员在无人区里探路时,巨头们却在后面开出八位数年薪疯狂挖人。 而一核心贡献者郭达雅被阿里腾讯自劫疯抢, v 二 v 三核心作者罗弗利被雷军收入麾下,不出意外的话,这份名单还将继续增加。 所以梁王峰罕见妥协了,以五百亿美元估值对外开放融资,这一方面是给核心成员手中的期权定价,另一方面也为更为激烈的竞争备足子弹。或许在残酷的商业竞争面前,所有纯粹的技术理想主义都将迎来折中。
粉丝354获赞1.1万

那今天给大家分享一下如何只花一分钱就能够续订小米的这个米某的 token plane 的 套餐呢?你看他原价的话,我这个是要九十九块钱的,但是我这边支付的话其实是只用一分钱。那这条视频的话给大家讲一下怎么样去操作啊?这两天小米他不是清空了这个 token 的 套餐吗?你看我这一方的话已经是使用是零了, 但是有一个问题,我这个套餐的有效期是到五月二十八号就到期了,但是今天已经是二十七号了,意思就是明天他就到期了,那我的余额的话,现在还剩下百分之百,我就享受不到他这个清空的这个额度了。那如果是跟我一样就是一两天要过期的话,我来教大家一个小技巧。那 我的上一份套餐呢,也是他送的,就是这个百万亿创作的基地计划吗?就是他送的一个月的套餐。那你看,比如说我是这个套餐吗?我没有开自动续费,你可以给他开起来,然后他就会自动给你跳转到这个续订的页面, 再点击前往。又或者你也可以直接点击这个 tocomplain 的 这个订阅的界面嘛,它默认的话会跳到你这个包年的,你给它选的那个连续包月的,然后你找到你的这个现在订阅的套餐呢?比如说你是 lite 的 话,它这地方就会显示出来, 像我的话是这个套餐它就是继续订阅,如果你是 pro 的 话,这个地方应该就是,呃,继续订阅当成套餐呢?那我这边的话就以这个九十九的为例啊,然后直接点击一下这个继续订阅, ok, 他 会弹出来让你付费吗?他这个地方的逻辑就是你现在套餐的还剩余的那个量吗?他会给你转换成钱,那因为我们这边的话剩余的话是百分之百就是没有用的,所以说我这个原来的套餐话,他是价值九十九块,但是我们新订阅的时候啊,他这个套餐的话,因为我是自动续费的嘛,七七折,所以说他只只 七十六块钱,那所以说这边下面算下来的话,他还应该要倒给我二十二块七一个月,但是他是不可能会补你钱的。那所以说你这地方就要继续付费吗?他小米支付,那一般的话很少有人用这个吧?那微信支付宝都可以啊,直接点一下, 然后同意一下,按确定支付,然后这个地方的话弹出来的话,你就只用付一分钱就可以续订一个月的套餐了。 ok, 你 看这边已经支付成功了,就只花了一分钱,然后你可以继续在你的这个自动续费再给他关掉, 然后就 ok 了。然后你这边续订完以后嘛,他不仅会给你满额的这个额度,然后因为你以前的这个套餐的钱的话是高于这个的,他还会额外的补充你一些积分,就是非常的爽,学会的话可以转发给你的朋友。小米的这个 mimo 的 模型还是非常的好用的。

小米开始掀桌子了, deepsea 前脚降百分之七十五,小米后脚降百分之九十九。三天之内,两家中国公司把 ai 模型的 api 调用价格打到了原来的百分之一,输入缓存命中的价格从两毛美金掉到了零点零三六美分。说实话,我第一次看到这个数字的时候,反复确认了三遍,小数点 lite 套餐六美元没变,原来给六千万 token, 现在给四十一亿, 翻了六十八倍。六十八倍是什么概念?昨天你花同样的钱能跑一个项目,今天能跑六十八个,这是在把 token 从商品变成自来水。小米把 token 打到这个价,赚的也不是水电费,是你在它生态里留下来的时间数据和下一代模型需要的反馈。降价只是幌子,锁住用户数据才是关键。

今天这期视频呢,来讲讲小米 mini v 二点五这个大模型的降价情况。现在呢,这个 mini v 二点五它跟 deepsea 已经是一个价格了。 mini v 二点五和 deepsea v 四 flash 是 一个价格,二点五 pro 跟 deepsea v 四 pro 价格一样, 之前我们都说 tbisc 的 价格很便宜,现在小米也便宜了,然后我测试了一下,随便跑了一下 agent, 然后它的缓冲泵动力呢,达到了百分之九十四,九十五,所以说就非常便宜。另外呢,小米有 tocom plan, tbisc 没有,所以说呢,小米现在呢,要比 tbisc 还要便宜一点点, 最低档呢,这个小米是三十九块钱,然后呢,你首次购买呢,有八八折,算下来就是三十四块多一点。然后呢,你可以用大概四十一块钱的 toc 的 量, 然后呢,你在晚上的零点到早上的八点,还有一个八折的额外的一个优惠,哎,所以说呢,你大概算下来就是你第一个月可以用三十四块三毛二买到大概五十一块钱的 talkin 的 这个一个量,所以说就是非常非常划算的。 那么它现在呢,对比来看,跟之前的 talkin plan 对 比来看,就是说呢,涨了大概五十到七十倍,可以说是非常非常良性了。 那今天的零点呢,他还把所有的额度给重置了,我今天上去一看,哎,我额度重置了。小米的大魔镜有两个隐形的好处,它的 v 二点五是多模态,但是这个 deepsea 呢,它就不是多模态。另外一个,它有一个语音的克隆的生成,它都是免费的,不需要花任何钱,所以说,比如说你的视频配音啊啊都不需要花钱的。 那假设呢?假设就是我们做到理论上的百分之九十五的缓存命中,大概这个三十四块钱的这个月卡可以买到 v 二点五五亿多的一个 top, 至少五亿的一个 top。 如果是 v 二点五 pro 呢,至少也能有一个一点九亿的 top, 可以 说是很实惠。 那就我个人来说,我现在主力呢还是 deepsea v 四 pro, 然后呢,我买了一个最便宜的一个小米的一个 mini 的 月卡,三十四块钱。然后呢为为的是什么呢?就是享受他的二点五的这个多模态啊。另外还有一个免费的语音克隆,那一个月三十四块钱还是非常便宜的。那这样呢,就可以覆盖我的绝大多数场景了。

大家好啊,今天我们来算一笔账,来看小米大模型 miimo vr pro 在 openroute 这个平台上,一天到底能够收多少钱?先上省流版啊,根据四月二十号的最新流量数据进行测算,那这个大模型呢,通过 openroute 单日收入大约是四十万人民币,注意啊,这里是收入,不是利润,千万不要搞混了, 那四十万比你预想的是多还是少呢?评论区呢,可以说说你的看法。有觉得我算错了的,或者是想看详细计算过程的朋友,麻烦你点个赞,我们一步一步往下算,只要你会加减乘除就能听懂。 好,先给大家说三个必懂的基础知识点。第一个,大模型的计费核心单位叫做 token, 之前呢,我们中文也给他定了一个统一的翻译,叫词源,那这个行业里面统一都是按百万 token 进行计费的,英文简写呢是 m。 第二,今天会用到比 m 更大的单位是币,也就是十亿一币呢,是等于一千 m。 第三,大模型的收费标准通常是把输入和输出分开进行计费的。这个 prompt 也就是输入,代表的是给模型发的提问或者是引用的一些资料。 那输出呢,又包括两个部分,一个呢是它内部的推理思考过程 reason。 另一个呢,是模型给你的答案生成的内容 combination。 这两个呢,都算输出。 ok, 掌握了这些基础知识啊,我们就可以直接开算了。 先上输入,我们可以看到四月二十号的小米大模型,输入总量是一百六十五 b, 那 这里把它先转换成 m 这个单位,那也就是等于十六万五千 m, 再乘上它的单价零点三三美元,算下来呢,就是五万四千四百五十美元, 再算输出。刚才已经讲过,这里要把推理和生成的内容加起来,他们都算输出,那这里总共就是一千零八十五 m, 再乘上他的单价三点零八美元,算下来就是三千三百四十美元。最后呢,把这两个数字相加,等于 五万七千七百九十美元,换算成人民币呢,就大约是四十万。那这个数就是这么来的。怎么样,学会了吗?学会了的麻烦给我点个赞。今天的分享就到这里,谢谢大家。


先说结论,小米 miimo 确实降价了,而且降的不少,但降幅百分之九十九这个说法,咱们得打个问号,因为没人知道它原来到底卖多少钱。 credit 是 怎么回事? 小米搞了个中间层,叫 credit, 你 先买套餐,比如三十九元,一个月给你六千万个 credit, 然后用的时候按 credit 扣。降价之前, pro 模型要扣两个 credit, 长文本甚至要扣四个。 降价之后,小米说取消了四倍 credit 的 计费方式,但具体 pro 模型现在是扣一个还是两个,官方没说清楚, 直接看价格更实在。小米公布了 token 价格,输入缓存命中零点零二五元每百万 token 输入缓存为命中三元每百万, token 输出六元每百万 token 输入只要两分五厘钱就能买一百万个 token。 和 deep seek 比怎么样?巧了, deep seek v 四 pro 的 价格完全一样。小米这是明摆着对标 deep seek, 价格完全对齐, 那到底降了多少?小米说最高降幅百分之九十九,如果这是真的,那原来 pro 模型的输出价格应该是六百元每百万 to 肯左右。 但问题是小米从来没公布过原来的官方价格表,所以百分之九十九降幅这个数字只能信一半。 普通人该怎么选?如果你追求简单透明,小米和 dipsic 价格一样,选哪个都行。如果你担心被套路,别买套餐,直接按量付费,这样就是明确的价格,没有 credit 换算的弯弯绕。 最终结论,小米 mimo 降价是真的,价格也确实便宜,但降幅百分之九十九的宣传,因为缺乏原价数据,没法完全验证,和 dipsic 比价格完全一样。 credit 机制有没有猫腻?官方没把降价后的换算比例说清楚,这是个隐患。

零点零一元续费,小米大模型白拿一百多亿 token。 二十七号零点之后,也就是今天,系统会刷新三百八十亿的套餐用量, 然后点续费,当前套餐系统会根据你剩余的价值来估算。比如你现在还剩三百八十亿,他不但不让你补钱,还倒找你七十五块,直接转成新的 token。 选一个支付方式, 显示一分钱,确认支付续费完成,花了零点零一元找的七十多,换成了一百多亿 tucker。

小米大模型公布了涛肯包月套餐的价格,性价比的话我觉得还好,但最让我欣喜的是取消了五小时窗口期调用次数的限制。包月套餐额度 可以在一次性集中的使用,而不用像其他大模型一样会有五小时窗口期调用次数的限制。特别是对于集中性使用大模型去完成工作的, 不会因为五小时调用次数的限制而影响任务的进度。为什么每一次这种比较方便?大家的这种方式大多都是由小米率先发起改革的呢?

我拿到小米二十三亿 token 的 时候,其实是有点懵的,不是兴奋的那种懵事就这就这也能过迪那种懵?这个是 max 套餐的十六亿,这个是 pro 套餐的七亿。先交代一下背景,小米最近搞了个活动, 叫咪蒙 over 的 百万亿 token 创造者激励计划,三十天免费送一百万亿 token, 最高给到 max 上十六亿 cash, 等值六百五十九块钱。 这个话题已经有很多博主写过了,活动也快到尾声了,五月二十八日截止,还剩不到一周,按理说不该再蹭了。但我之所以还是写,是因为我发现了一个特别简陋 特别巧的方法,几乎百分之百能拿 max 档。这个方法我一会儿说,先把活动本身聊透。咪猫是小米自研的大模型,最新版本 v 二点五 分两个模型, pro 版面向复杂任务深度适配 a 剑客和编程,在 gdp v a l a a 和 clever 榜单上开源第一。还有一个是全模态版,文本、图像、视频、音频都支持 v 二点五, pro 用的 mo 架构,总参数三零九 b 激活十五 b, 原声支持一百万 to k 上下文推理成本只有国际币源旗舰的百分之二点五, api 定价大约是国际竞品的五分之一。 你可能觉得这不就是个国产模型吗?但坦率地讲,这次小米的成绩确实够硬。 texturina 全球综合第五, labyrinth 全球第四。 open route 上周以百分之三十多的试战率登顶第一 周条用量四点八二万亿 token, 而且它是开元的 mit 协议商用自由。说真的,全球前十开元模型里,中国占六席, 小米是第一个登顶开元榜首的手机厂商回到活动,这次 over 的 计划分两部分,一部分是面向开发者的百万亿 toc 创造者激励,另一部分是面向 ainc 框架团队的生态共建。我们聊的是前者,申请流程不复杂,去 mimo 填个表单,三个工作日出结果, 通过后邮件通知、登录开放平台等权益到账就行。但很多人卡在评估这步,拿到的是赠金,而不是 tiktok plan 或者档位很低。网上常见的建议是要写详细的项目描述,要有 github 链接,要做完整的项目, 有些教程甚至建议你前后端数据库齐活,搞得跟融资 b p 似的。我一开始也这么想,然后我发现了一个更聪明的路子,就是只做一个前端,一个用歪不扣定搞出来的非常非常厉害的前端不需要,后端不需要数据库,不需要部署上线, 就是一个纯前端页面,但视觉要炸,交互要丝滑,让人点开第一眼就觉得,卧槽,为什么这招管用? 你想啊,评估的人一天看几百份申请,大多数是 github 仓库链接和 api 文档,他点开一个仓库可能还没看完 readyme 就 关了,但你给他一个牛逼的前端,点开就是成品,视觉冲击力直接拉满,谁都能一眼看出来这东西好不好。后端逻辑写得再复杂, 评估的人不懂你的业务逻辑啊。但一个漂亮的页面,不需要专业知识就能判断质量。我自己 pro 档就是这么拿到的项目就一个纯前端页面,没写一行后端代码。我朋友按照我的方法拿到了 max 档。 噗儿当倒是我实打实拿作品申请的,自己写的 app, 还有几个 skill, 两者加起来一共二十三亿 token。 再说一个很多人踩的坑,一定要先注册好小米账号,绑好邮箱和手机号,申请表里填的邮箱必须跟小米账号绑定的邮箱一致, 如果不一致,或者你用的是手机号注册的账号,没绑邮箱,通知邮件根本发不到你手上,全一批了你也拿不到。 我一开始就翻车,在这折腾了好久才搞明白。所以正确顺序是先去小米官网注册账号,绑好邮箱,然后再去申请。操作上也不复杂,用 cloud code、 科斯尔或者任何顺手的 ai 编程工具,让 ai 帮你 vibble 扣度一个炫酷的前端页面,重点放在视觉效果和交互上,动画动效,享意识布局,这些能让页面看起来很贵的东西。多搞深情表里,把截图放上去, 项目描述写清楚,用了什么工具,做了什么功能,解决什么问题,就这样。最后说说这个 tucker 值不值得薅。 mmo v 二点五 pro 的 编程能力,我自己用下来的感受是比我日常用的 g l m 五车报强不少,跟 g l m 五点一比也差不了太多。 a p r 能直接对接 cloud code 浏览器, oppo 跨这些主流工具。十六亿 tucker 免费活动五月二十八日截止,池子部等人免费的羊毛,而且是比较厚的那种,不薅确实亏了。

原本两亿的筹款,现在直接变成一百一十亿,还有三十二亿的补偿基分根本用不完! deepsea 宣布降价之后,小米的 mini 模型也宣布了永久降价,原本订阅用量提升到了原来的五到八倍,在今天零点正式生效,并且原有订阅的额度也全部重置刷新 上个月申请了雷总的免费 token 的 兄弟们,可以直接在订阅里面一分钱续费一个月。逻辑是这样的, miimo 的 套餐续费会重置这个月的账单日期直接重新算到下个月的。今天 本月没用完的积分可以折算抵扣下个月续费的价格。但是今天额度重置后,就是完全百分百的抵扣,而首月开通又有七七折的优惠,这导致雷总还欠你中间百分之二十三的差价。于是雷总不仅让你零点零一续费,还把这欠你的差价换成补偿积分,加到你下个月套餐里面。 开启自动续费后,扣零点零一即可续费。下个月一定要记得马上关闭自动续费,防止被返号。然后不要点第二次重新续费,这会取消补偿积分。原本两亿的扣款,现在直接变成一百一十亿,还有三十二亿的补偿积分,根本用不完!

又免费送,不好意思,这次要收费了。小米 mini 大 模型推出磁源计划,简单来说就是开始收费了, 分为四个档次的包月套餐大模型也是好起来了,不知道友商的这个千古大模型还在不在?

最近 ai 圈的价格战真的是越打越热闹了,上个月啊, deepsea 宣布永久降价百分之七十五的时候,大家已经觉得很便宜了,结果呢,小米昨天直接跟进 mimo v 二点五系列 api 永久降价,最高降幅达到百分之九十九。 那今天我们不聊按量付费的 a p r 价格,咱们聊聊更实在的小米的 top 盘套餐。这次降价,小米把套餐的额度直接提升了五到八倍,什么意思呢?原来三十九块钱一个月的套餐,每月只有六千万的额度,现在呢,直接涨到了四十一亿。 原来九十九块钱的套餐,每个月呢是两亿的额度,现在呢,涨到了一百一十亿。注意啊,小米的额度是用信用点计算的,和 token 的 换算比例不太一样,但是关键是这个量对于我们普通人来说绝对够用了。 说到小米这家公司,我是真的佩服的,小米最擅长的事情就是把那些高高在上的高科技,一点一点的拉到老百姓触手可及的地方,把原本我们用不起用不上的东西,硬生生打到地板价, 从手机到家电,从手环到充电宝,凡是有小米进入的行业,老百姓就能够花更少的钱享受更好的产品。小米的性价比基因啊,已经刻在了他的骨子里。 这一次的 ai 大 模型领域,小米同样把这种风格带了过来。别人卖几十上百的一个月,小米呢,直接三十九块钱给你四十一亿的额度,九十九块钱给你一百一十亿。这不是简单的降价,这是要把 ai 的 门槛彻底砸碎。 所以问题来了,小米这一次跟进 deepsea 的 降价,其他的 ai 公司会跟吗?整个 ai 行业会不会因此陷入到更激烈的内卷竞争当中?咱们拭目以待。但是不管怎么样,厂商打的越凶,咱们消费者来讲就越受益。这场价格战呢?真正能够把 ai 从奢侈品打成日用品, 昨天我还建议大家不要搞本地部署大模型了。今天看了小米的这个价格,我更加坚定了这个观点,花三十九块钱,每个月四十一亿的额度,厂商帮你去做维护,帮你去做升级,帮你保障稳定,不香吗?干嘛非要自己折腾本地部署呢?未来 ai 肯定会越来越便宜,咱们安安心心的享受厂商给到的福利就够了。

大冒险价格正式开打,小米米某突然官宣大幅降价,最高降幅达到百分之九十九,同时托克帕伦加量不加价标准这一档的用量从原来的两个亿飙涨到一百一十 亿的积分。你没听错啊,一百一十亿翻了五十五倍。兄弟们,其他话不要多说了啊,赶紧去试一下。我靠,这个真的太太,小米太太牛逼了。

ai 圈在先,降价风暴小米正式宣布密某 v 二点五系列 api 永久降价,最高降幅达到百分之九十九,取消复杂的上下文差别定价,统一计费。同时 token 套餐加量不加价额度直接翻五至八倍,在校用户全额重置额度。 靠着滑动窗口注意力缓存扩容和集群优化三大底层技术硬降成本, tds 还限时免费开发者落地, ai 成本直接砍到底。

感谢雷总,现在小米大模型我又可以免费用一个月了,大家看我现在这个 token 额度是多少?三百亿 token 多到根本用不完。这个操作方法也很简单,首先我们要开通创造者激励计划, 还没开通的可以先去看我之前那篇教程。然后我们先打开套餐管理,启动自动续费弹窗,然后点击前往订阅,选择这个,然后点击下一步就会自动减免,不过次月会恢复正常价格,所以完成后建议关闭自动续费。好了,接下来可以尽情使用了。

朋友们,最高降价百分之九十九!小米刚刚把 ai token 的 价格直接打到了地板上,那些压住二六年 token 会大涨价的人,短短一周就被连扇两个巴掌。 上周 deep sync 刚宣布 v 四 pro 永久降价,今天凌晨,小米 miimo v 二点五系列直接跟进,最高降幅百分之九十九,而且不再区分上下纹长度,全球同步生效。 不过先别急着喊真香,这个百分之九十九的降幅有个关键前提,输入缓存必须命中。一旦命中,咪某 v 二点五 pro 的 输入价格直接干到零点零二五元每百万, token 没命中的话,还是三元每百万,输出六元。那这个价格有多夸张呢? 相当于原来花一百块钱才能买到的东西,现在只要两毛五。而且和 deepthink 一 模一样,两家直接把国产模型的 缓存命中输入价判死在了零点零二五元这条线上。为什么偏偏是缓存价格打骨折? 因为大模型早就不是用来聊天的了, agent 才是未来一个 agent, 任务后台可能跑几十次调用读几十万字的上下文, 而系统提示词、代码、文档这些内容会反复出现缓存价格越低,越适合高频干活的真实场景。 更有意思的是,小米大模型负责人一个月前还公开反对价格战,说盲目降价会成本失控。结果现在自己打的最狠, 靠的就是硬工程能力,把 k v cash 的 搬运量降了七倍,可缓存量提了五倍,硬生生的把成本打了下来。这波降价之后, 中小模型公司基本跟不起了,没有主业输血,没有过硬的工程实力, 只能被挤到垂直角落。接下来, ai 行业的内卷会彻底从价格战转向模型质量和 agent 生态的比拼。模型能力决定 ai 的 上限, 而推理成本决定 ai 普及的规模。当真正便宜的 token 涌入市场,属于 ai 的 下一个爆发时代可能真的就要来了。 朋友们,对于这事你怎么看?欢迎在评论区一起聊一聊,关注我,每次聊点不一样的。

小米模型降价百分之九十九,直接和 deepsea 硬钢,看来 deepsea 给的压力还是挺足啊。那小米的 mimo 和 deepsea 相比到底怎么样呢? 今天咱们就详细聊聊小米 mimo v 二点五 pro 和 deepsea v 四 pro 这两款国内顶尖大模型,帮大家分清两种的定位和适用场景。首先看基础信息, 两者上下文都做到了百万头肯,而且全部开放 m i t 开源协议,个人和企业都能自由商用,门槛很低。参数上, deepsea 整体规模更大,不过小米这边额外做了图像、语音一体的全模态,而 deepsea 目前只支持纯文本交互, 这是两者最直观的区别。接下来看核心能力比拼。第一块是智能体 app 的 能力,这一块小米眉目优势非常明显,在多项权威评测里得分更高,而且执行任务时投分利用力更高,能省下接近一半的调用成本,非常适合搭建 自动化工作流、智能助手等一类产品。第二块是代码的专项,榜单里表现拔尖,软件工程、算法编程、 实战写代码的能力目前位居行业潜力,是程序员开发团队的首选。第三块数学与逻辑推理,同样是 deepsea v 四 pro 更强数理计算、复杂推理的实测成绩非常亮眼,很适合科研和数理分析。总结一下,首先两款大模型都是国货之光,都很优秀, 如果你的需求涉及图片、语音、多媒体交互,或是要做智能体,首选小米 mini。 如果是专业编程开发、数学科研、纯文本内容创作、深度逻辑推演,那 deepsea 会更加适合你。关注我,了解更多最新资讯和实用技术。

最近看到很多人说小米的大模型还有 deepsea 大 模型很贵,打个你好就要花不少钱。但我不是这样的,我某天用 deepsea 跑了,一点一,一个 token 花费十三点二三元,算下来,每百万 token 只要零点一一九元。 还有一次用小米的大模型花了三千五百万 token, 按照小米米某月卡最低档三十四块多的价格来算,这三千五百万 token 花费四点八元,每百万 token 零点一三七元,确实是大降价。 我花一分钟把这个事说清楚。 ai 大 魔仙收钱,分三块,缓存位命中、输出,缓存命中。你第一次发一段内容给 ai, 他 得从头读一遍,完整算一次。这个过程叫缓存位命中,价格是三块钱,每百万投坑。但同一段内容你再发第二次,第三次的时候,系统发现你发的东西和之前一模一样,他就不重新算了,直接从缓存里调,结果这个过程叫缓存命中。 缓存命中的价格是多少?零点零二五,差了一百二十倍。所以那些说打个你好就花了多少钱的人,测试的是什么场景? 第一次到 a p i 发一句你好, ai 回复全程缓存未命中,这当然很贵。简单来说就是你让 ai 听一本书, ai 第一次读会花不少钱,因为这对 ai 来说是新内容,每百万头啃三块钱。但之后再让 ai 根据这本书的内容和你交流,就是旧内容了,每百万头啃零点零二五元。现在你明白了吗?打个你好测试花了多少钱没有意义。

第七个,前脚刚刚降价,小米就也来凑热闹,售价直降百分之九十九,更是把输入缓存命中的价格从原本的零点二美元暴跌至零点零三六美分。最具冲击力的是小米的癞蛤套餐,六美元的月费保持不变,但包含的 token 数量从原来的六千万直接飙升至四十一亿,整整翻了六十八倍。 六十八倍意味着什么?昨天同样的预算只能支撑一个项目的运行,今天就能同时跑六十八个,这已经不是简单的降价,而是在彻底改变 token 的 商品属性,让它像自来水一样成为一种基础资源。