朋友们,最高降价百分之九十九!小米刚刚把 ai token 的 价格直接打到了地板上,那些压住二六年 token 会大涨价的人,短短一周就被连扇两个巴掌。 上周 deep sync 刚宣布 v 四 pro 永久降价,今天凌晨,小米 miimo v 二点五系列直接跟进,最高降幅百分之九十九,而且不再区分上下纹长度,全球同步生效。 不过先别急着喊真香,这个百分之九十九的降幅有个关键前提,输入缓存必须命中。一旦命中,咪某 v 二点五 pro 的 输入价格直接干到零点零二五元每百万, token 没命中的话,还是三元每百万,输出六元。那这个价格有多夸张呢? 相当于原来花一百块钱才能买到的东西,现在只要两毛五。而且和 deepthink 一 模一样,两家直接把国产模型的 缓存命中输入价判死在了零点零二五元这条线上。为什么偏偏是缓存价格打骨折? 因为大模型早就不是用来聊天的了, agent 才是未来一个 agent, 任务后台可能跑几十次调用读几十万字的上下文, 而系统提示词、代码、文档这些内容会反复出现缓存价格越低,越适合高频干活的真实场景。 更有意思的是,小米大模型负责人一个月前还公开反对价格战,说盲目降价会成本失控。结果现在自己打的最狠, 靠的就是硬工程能力,把 k v cash 的 搬运量降了七倍,可缓存量提了五倍,硬生生的把成本打了下来。这波降价之后, 中小模型公司基本跟不起了,没有主业输血,没有过硬的工程实力, 只能被挤到垂直角落。接下来, ai 行业的内卷会彻底从价格战转向模型质量和 agent 生态的比拼。模型能力决定 ai 的 上限, 而推理成本决定 ai 普及的规模。当真正便宜的 token 涌入市场,属于 ai 的 下一个爆发时代可能真的就要来了。 朋友们,对于这事你怎么看?欢迎在评论区一起聊一聊,关注我,每次聊点不一样的。
粉丝7874获赞12.3万

小米模型降价百分之九十九,直接和 deepsea 硬钢,看来 deepsea 给的压力还是挺足啊。那小米的 mimo 和 deepsea 相比到底怎么样呢? 今天咱们就详细聊聊小米 mimo v 二点五 pro 和 deepsea v 四 pro 这两款国内顶尖大模型,帮大家分清两种的定位和适用场景。首先看基础信息, 两者上下文都做到了百万头肯,而且全部开放 m i t 开源协议,个人和企业都能自由商用,门槛很低。参数上, deepsea 整体规模更大,不过小米这边额外做了图像、语音一体的全模态,而 deepsea 目前只支持纯文本交互, 这是两者最直观的区别。接下来看核心能力比拼。第一块是智能体 app 的 能力,这一块小米眉目优势非常明显,在多项权威评测里得分更高,而且执行任务时投分利用力更高,能省下接近一半的调用成本,非常适合搭建 自动化工作流、智能助手等一类产品。第二块是代码的专项,榜单里表现拔尖,软件工程、算法编程、 实战写代码的能力目前位居行业潜力,是程序员开发团队的首选。第三块数学与逻辑推理,同样是 deepsea v 四 pro 更强数理计算、复杂推理的实测成绩非常亮眼,很适合科研和数理分析。总结一下,首先两款大模型都是国货之光,都很优秀, 如果你的需求涉及图片、语音、多媒体交互,或是要做智能体,首选小米 mini。 如果是专业编程开发、数学科研、纯文本内容创作、深度逻辑推演,那 deepsea 会更加适合你。关注我,了解更多最新资讯和实用技术。

先说结论,小米 miimo 确实降价了,而且降的不少,但降幅百分之九十九这个说法,咱们得打个问号,因为没人知道它原来到底卖多少钱。 credit 是 怎么回事? 小米搞了个中间层,叫 credit, 你 先买套餐,比如三十九元,一个月给你六千万个 credit, 然后用的时候按 credit 扣。降价之前, pro 模型要扣两个 credit, 长文本甚至要扣四个。 降价之后,小米说取消了四倍 credit 的 计费方式,但具体 pro 模型现在是扣一个还是两个,官方没说清楚, 直接看价格更实在。小米公布了 token 价格,输入缓存命中零点零二五元每百万 token 输入缓存为命中三元每百万, token 输出六元每百万 token 输入只要两分五厘钱就能买一百万个 token。 和 deep seek 比怎么样?巧了, deep seek v 四 pro 的 价格完全一样。小米这是明摆着对标 deep seek, 价格完全对齐, 那到底降了多少?小米说最高降幅百分之九十九,如果这是真的,那原来 pro 模型的输出价格应该是六百元每百万 to 肯左右。 但问题是小米从来没公布过原来的官方价格表,所以百分之九十九降幅这个数字只能信一半。 普通人该怎么选?如果你追求简单透明,小米和 dipsic 价格一样,选哪个都行。如果你担心被套路,别买套餐,直接按量付费,这样就是明确的价格,没有 credit 换算的弯弯绕。 最终结论,小米 mimo 降价是真的,价格也确实便宜,但降幅百分之九十九的宣传,因为缺乏原价数据,没法完全验证,和 dipsic 比价格完全一样。 credit 机制有没有猫腻?官方没把降价后的换算比例说清楚,这是个隐患。

我拿到小米二十三亿 token 的 时候,其实是有点懵的,不是兴奋的那种懵事就这就这也能过迪那种懵?这个是 max 套餐的十六亿,这个是 pro 套餐的七亿。先交代一下背景,小米最近搞了个活动, 叫咪蒙 over 的 百万亿 token 创造者激励计划,三十天免费送一百万亿 token, 最高给到 max 上十六亿 cash, 等值六百五十九块钱。 这个话题已经有很多博主写过了,活动也快到尾声了,五月二十八日截止,还剩不到一周,按理说不该再蹭了。但我之所以还是写,是因为我发现了一个特别简陋 特别巧的方法,几乎百分之百能拿 max 档。这个方法我一会儿说,先把活动本身聊透。咪猫是小米自研的大模型,最新版本 v 二点五 分两个模型, pro 版面向复杂任务深度适配 a 剑客和编程,在 gdp v a l a a 和 clever 榜单上开源第一。还有一个是全模态版,文本、图像、视频、音频都支持 v 二点五, pro 用的 mo 架构,总参数三零九 b 激活十五 b, 原声支持一百万 to k 上下文推理成本只有国际币源旗舰的百分之二点五, api 定价大约是国际竞品的五分之一。 你可能觉得这不就是个国产模型吗?但坦率地讲,这次小米的成绩确实够硬。 texturina 全球综合第五, labyrinth 全球第四。 open route 上周以百分之三十多的试战率登顶第一 周条用量四点八二万亿 token, 而且它是开元的 mit 协议商用自由。说真的,全球前十开元模型里,中国占六席, 小米是第一个登顶开元榜首的手机厂商回到活动,这次 over 的 计划分两部分,一部分是面向开发者的百万亿 toc 创造者激励,另一部分是面向 ainc 框架团队的生态共建。我们聊的是前者,申请流程不复杂,去 mimo 填个表单,三个工作日出结果, 通过后邮件通知、登录开放平台等权益到账就行。但很多人卡在评估这步,拿到的是赠金,而不是 tiktok plan 或者档位很低。网上常见的建议是要写详细的项目描述,要有 github 链接,要做完整的项目, 有些教程甚至建议你前后端数据库齐活,搞得跟融资 b p 似的。我一开始也这么想,然后我发现了一个更聪明的路子,就是只做一个前端,一个用歪不扣定搞出来的非常非常厉害的前端不需要,后端不需要数据库,不需要部署上线, 就是一个纯前端页面,但视觉要炸,交互要丝滑,让人点开第一眼就觉得,卧槽,为什么这招管用? 你想啊,评估的人一天看几百份申请,大多数是 github 仓库链接和 api 文档,他点开一个仓库可能还没看完 readyme 就 关了,但你给他一个牛逼的前端,点开就是成品,视觉冲击力直接拉满,谁都能一眼看出来这东西好不好。后端逻辑写得再复杂, 评估的人不懂你的业务逻辑啊。但一个漂亮的页面,不需要专业知识就能判断质量。我自己 pro 档就是这么拿到的项目就一个纯前端页面,没写一行后端代码。我朋友按照我的方法拿到了 max 档。 噗儿当倒是我实打实拿作品申请的,自己写的 app, 还有几个 skill, 两者加起来一共二十三亿 token。 再说一个很多人踩的坑,一定要先注册好小米账号,绑好邮箱和手机号,申请表里填的邮箱必须跟小米账号绑定的邮箱一致, 如果不一致,或者你用的是手机号注册的账号,没绑邮箱,通知邮件根本发不到你手上,全一批了你也拿不到。 我一开始就翻车,在这折腾了好久才搞明白。所以正确顺序是先去小米官网注册账号,绑好邮箱,然后再去申请。操作上也不复杂,用 cloud code、 科斯尔或者任何顺手的 ai 编程工具,让 ai 帮你 vibble 扣度一个炫酷的前端页面,重点放在视觉效果和交互上,动画动效,享意识布局,这些能让页面看起来很贵的东西。多搞深情表里,把截图放上去, 项目描述写清楚,用了什么工具,做了什么功能,解决什么问题,就这样。最后说说这个 tucker 值不值得薅。 mmo v 二点五 pro 的 编程能力,我自己用下来的感受是比我日常用的 g l m 五车报强不少,跟 g l m 五点一比也差不了太多。 a p r 能直接对接 cloud code 浏览器, oppo 跨这些主流工具。十六亿 tucker 免费活动五月二十八日截止,池子部等人免费的羊毛,而且是比较厚的那种,不薅确实亏了。

小米现在的 token plan 它不用 token 计费了,现在是改成用 credit 计费了,那么这下面有一个表,就是说明了这个 credit 对 应的这个 token, 那 么就是以这个 mate 二点五 pro 的 这个输出为例吧, 就是一个 token 对 应六百 credit, 那 么一百万个 token 对 应的就是六亿的 credit, 那 么看到这边开放平台这边的这个按量计费价格是一百万的输出 token 密码。二点五 pro 是 六块钱, 那就相当于是六块钱等于六亿的 credit 呀,那就是一块钱一个亿的 credit 嘛?那看到这上面这边的话,就三十九块一个月的,这边是四点一亿,就四点四十一亿的这个 credit, 那按照一个一块钱一亿的话,那这里相当于真实价值就是四十一块钱,相当于你买三十九送了两块钱。后面也是这边就一百一减九十九吗?三十八。呃,三百八减三百二十九吗? 这里以此类推,这样看下来其实优惠力度也不怎么大呀,还不如按量付费呢,至少灵活一点。

主播上个月申请了小米 mimo 百万亿 token 计划,送了主播两个亿 token, 不 出意外的被我全部用完了。该说不说,小米的 token 消耗的是真快,之后主播就转战了 deep x, deep x 是 真便宜, 感谢良胜。突然微信收到密木降价通知,续费直接只要一分钱,不知道是 bug 还是福利, 之前的两亿 token 直接变成了一百四十亿积分了,让主播都不好意思了。 所以出一期视频给小米 mini 宣传宣传。现在的 a p i 价格已经和 deep ckey 一 样了,可以说非常香了, 但是缓存命中率确实不如 deep ckey。 实用体验感我感觉俩家差不太多,卖萌有时候会慢一点,但是和 opace 四点七和 gpt 五点五还是有一些差距,对主播来说是够用了,但是也感谢国内厂商的努力,才让我们用到这么便宜的顶级大模型。

最近 ai 圈的价格战真的是越打越热闹了,上个月啊, deepsea 宣布永久降价百分之七十五的时候,大家已经觉得很便宜了,结果呢,小米昨天直接跟进 mimo v 二点五系列 api 永久降价,最高降幅达到百分之九十九。 那今天我们不聊按量付费的 a p r 价格,咱们聊聊更实在的小米的 top 盘套餐。这次降价,小米把套餐的额度直接提升了五到八倍,什么意思呢?原来三十九块钱一个月的套餐,每月只有六千万的额度,现在呢,直接涨到了四十一亿。 原来九十九块钱的套餐,每个月呢是两亿的额度,现在呢,涨到了一百一十亿。注意啊,小米的额度是用信用点计算的,和 token 的 换算比例不太一样,但是关键是这个量对于我们普通人来说绝对够用了。 说到小米这家公司,我是真的佩服的,小米最擅长的事情就是把那些高高在上的高科技,一点一点的拉到老百姓触手可及的地方,把原本我们用不起用不上的东西,硬生生打到地板价, 从手机到家电,从手环到充电宝,凡是有小米进入的行业,老百姓就能够花更少的钱享受更好的产品。小米的性价比基因啊,已经刻在了他的骨子里。 这一次的 ai 大 模型领域,小米同样把这种风格带了过来。别人卖几十上百的一个月,小米呢,直接三十九块钱给你四十一亿的额度,九十九块钱给你一百一十亿。这不是简单的降价,这是要把 ai 的 门槛彻底砸碎。 所以问题来了,小米这一次跟进 deepsea 的 降价,其他的 ai 公司会跟吗?整个 ai 行业会不会因此陷入到更激烈的内卷竞争当中?咱们拭目以待。但是不管怎么样,厂商打的越凶,咱们消费者来讲就越受益。这场价格战呢?真正能够把 ai 从奢侈品打成日用品, 昨天我还建议大家不要搞本地部署大模型了。今天看了小米的这个价格,我更加坚定了这个观点,花三十九块钱,每个月四十一亿的额度,厂商帮你去做维护,帮你去做升级,帮你保障稳定,不香吗?干嘛非要自己折腾本地部署呢?未来 ai 肯定会越来越便宜,咱们安安心心的享受厂商给到的福利就够了。

兄弟们,跟你们说个事情哈,昨天看到小米 mayo v 二点五降价,脑子一热就充了最便宜的四十块套餐,想着四十一亿 credits 怎么都够造的对吧? 其实到现在为止,我也就用了六七个小时,已经用掉百分之四十多了,你以为我干了啥大工程呢?其实就是让他读了个 github 仓库的代码,再扫了扫我电脑里的文件,就这点事,照这速度估计也就够用两天。所以打算入这个套餐的朋友注意下消耗速度啊,太惨爆了!

小米 mimo 大模型 api 永久降价,最高降幅百分之九十九五月二十七日,小米宣布对 mimov 二点五系列大模型 api 实施永久降价,最高降幅达到百分之九十九。本次调价不再区分上下文窗口, 同时优化计费方案,同等价格下,开发者可使用的 token 用量提升至原来的五到八倍。雷军也公开表态,欢迎更多开发者介入小米 mimo 大模型,进一步降低 ai 应用的开发成本。

ai 圈在先,降价风暴小米正式宣布密某 v 二点五系列 api 永久降价,最高降幅达到百分之九十九,取消复杂的上下文差别定价,统一计费。同时 token 套餐加量不加价额度直接翻五至八倍,在校用户全额重置额度。 靠着滑动窗口注意力缓存扩容和集群优化三大底层技术硬降成本, tds 还限时免费开发者落地, ai 成本直接砍到底。

对不起了梁胜,雷军给的实在太多了,一觉醒来以为出 bug 了,百万头肯变成百亿头肯。五月二十七日,雷军官宣小米猫某永久降价,降幅百分之九十九,同时老用户额度全量重置 转角。 deepsea 刚把价格砍到四分之一,小米直接跟进,把大模型价格打穿了,地板输入百万 token 零点零二元。比 deepsea v 四更低更狠的是,小米 mini 是 多摩态输入,也就是说,你的文字、图像、音频、视频他也能理解实践真正的内容全流程自动化,而不是 deepsea 单单文本输入。这波操作到底是恶性价格战,还是说雷总想做普惠大众的 ai 呢?

用 ai、 大 模型、小龙虾编程这些可以考虑一下。小米的这个大模型,现在降价了,三十四块,三毛二,续费是三十九块钱一个月,四十一亿的 top, 这个九十块钱的九十九块钱,一百一十亿,以前这个四十块钱,三十九块钱的只有七个亿,只有两个亿, 这个九十九块的,七个亿,可以高频率的编程,可以用七天, 那现在一百一十个亿用一个月问题不大。还可以考虑这个讯飞的口径,可能三十九块钱可以用到 glm 五点一,有多个模型可以选择。

dpc 刚把价格打到地板,小米直接砸穿了地心。五月二十七日,小米 mini v 二点五系列 api 永久降价,最高降幅百分之九十九,输入缓存命中最低只要两分钱,每百万托更 说出最低两块钱什么概念。以前跑一个 ai 项目可能要花几千块,现在几十块钱就够了。雷军凌晨亲自发文,欢迎更多开发者进入。从二五折到一百分之一,国产大模型正在变成水电煤独立开发者的黄金时代真的来了。

今天 vr 圈最狠的价格战来自小米 mini 微二点五系列 a p r 从今天开始永久降价,最高降幅达到百分之九十九,而且取消长文本意价,所有上下文统一计费。 旗舰模型 mini v 二点五 pro 的 价格被直接打穿,缓存命中、缓存未命中和输出价格都进入极低区间。更关键的是, token plan 也升级了,六美元到一百美元,四档套餐不涨价,但可用额度提升到原来的五到八倍。 同时,所有仍在有效期内的历史套餐额度全量重置,相当于老用户也直接吃到这次降价红利。另一边,小米的百万亿 tocan 创造者激励计划提前收官, 全球五十四万多人申请,最终二十四万多人获批,一百万亿 tocan 已经全部发完。这说明大模型 api 的 竞争正在从模型参数转向推理成本、缓存效率和开发者生态。 对创业者和开发者来说,问题变了。当模型调用越来越便宜,你会把哪些 ai 应用重新做一遍?关注我,并在评论区留下你的判断。

这次小米米墨的新 token 盘,最容易让人误会的是单位你看到的四点一币,不是四点一币 token, 而是 credits。 真正能跑多少,要看你用哪个模型,以及这段 token 是 缓存命中未命中输入还是输出。 按官方文档约度,套餐分四档, lite 是 三十九元四点一 b 酷热 ipad standard 是 九十九元十一 b gridadius pro 是 三百二十九元三十八 b gridadius max 是 六百五十九元八十二 b gridadius。 表面看很大,但要继续往下换算, 真正的计费公式在这里,它 movie 二点五 pro, 每个缓存命中 token 扣二点五 credits, 未命中输入 token 扣三百 credits, 输出 token 扣六百 credits。 普通迷迷模糊二点五跟 d 分 别是二一百和二百 credits。 官方给了一个很好懂的例子,如果你买那一套餐,一共有四点一 bp 转一次,你用掉十 m 的 迷蒙 mo, 二点五 pro 未命中输入 token, 就 会消耗三千元回资,剩下的额度就只有一千一百元回资。 所以官方说用量提升五到八倍,并不等于任何场景都无脑多五到八倍缓存命中多输入能赋用输出,别太爆情感就会更划算。如果你是涨让五 d 缓存输出很多,那科技消耗会快很多。 还有一个边界要看清, token plan 是 面向 i 编程工具的订阅方案,不是给你随便接近自定义后端做自动化脚本的普通 api 套餐额度用完后系统会停止服务,不会继续扣你的赠金或账户余额。 最后给一个买钱判断,第一,你是不是主要拿它跑客厅工具?第二,你的任务缓存命中高不高?第三,你的输出 token 会不会很多?把这三件事算清楚,才能判断 token 盘是真便宜还是你应该继续走普通暗恋 a p i。

小米的 ai 大 模型 miimo 今天干了一件事,永久降价,最高降幅百分之九十九。你没听错,不是促销,不是限时活动,是直接改价。具体怎么降, miimo v 二点五全系列 api 从今天开始执行新价格,而且不再区分输入长度, 全球同步生效。如果你之前买过 token plan, 还有一个好消息,用量直接提升到原来的五到八倍!什么概念?我自己的实测数据,原来的最贵套餐六百五十九块钱一个月,十六亿 token 对 我来说撑不到一个月。 现在调整之后,最便宜的套餐三十九块钱一个月,给你四十一亿 token。 最贵的套餐呢?直接给到八百二十亿 token, 这不叫加量不加价,这叫龙虾自由。更猛的是,所有当前还在有效期的 token plan 用户,今天凌晨额度全量重置,不管你之前用了多少,直接给你清零重来,按新价格重新算。那问题来了,小米凭什么敢这么降?答案是推理技术的优化。小米技术团队基于 s g land high cash, 完整支持了滑动窗口注意力机制,把 kv cache 在 gpu、 显存、 cpu、 内存、 ssd 之间的数据搬运量压到了优化前的七分之一,可缓存的 token 数量提升到近五倍, 缓存命中率和推理效率都上了一个台阶。再加上专家并行方案和输入长度分桶策略的优化,集群吞吐能力进一步提升, 每个 token 的 服务成本就这么降下来了。说白了,不是小米在亏本补贴,是技术真的跑通了,成本结构变了。另外,之前那个百万亿 token 创造者激励计划,一百万亿个 token 已经全部发完了, 活动提前收官。不过 apache 软件基金会成员的专属福利不受影响,长期有效,历史付费,用户也别急。小米说,未来一周还有惊喜,小米自己说了一话,让更多的人能用到更好的模型,这是 mimo 不 变的使命。你现在用的是哪家的 ai 模型?评论区聊聊,看看谁的成本最高?