粉丝244获赞3310

小米 mimo 大模型 api 永久降价,最高降幅百分之九十九五月二十七日,小米宣布对 mimov 二点五系列大模型 api 实施永久降价,最高降幅达到百分之九十九。本次调价不再区分上下文窗口, 同时优化计费方案,同等价格下,开发者可使用的 token 用量提升至原来的五到八倍。雷军也公开表态,欢迎更多开发者介入小米 mimo 大模型,进一步降低 ai 应用的开发成本。

对不起了梁胜,雷军给的实在太多了,一觉醒来以为出 bug 了,百万头肯变成百亿头肯。五月二十七日,雷军官宣小米猫某永久降价,降幅百分之九十九,同时老用户额度全量重置 转角。 deepsea 刚把价格砍到四分之一,小米直接跟进,把大模型价格打穿了,地板输入百万 token 零点零二元。比 deepsea v 四更低更狠的是,小米 mini 是 多摩态输入,也就是说,你的文字、图像、音频、视频他也能理解实践真正的内容全流程自动化,而不是 deepsea 单单文本输入。这波操作到底是恶性价格战,还是说雷总想做普惠大众的 ai 呢?

就在刚刚,小米没摸 v 二点五系列 a p i 宣布永久降价,最高降幅达到百分之九十九。第一,单价报价 v 二点五 pro 输入缓存命中,只要零点零二五元每百万 hokken。 第二,取消上下文窗口分级,长窗口和短窗口一个价,计费规则肉眼可读。第三, 存量用户的额度全量重置,办新规则重新跑,等于老用户也吃满这波红利。大模型厂商普遍还在算怎么把推理成本摊回用户头上,小米反手把利润空间自己先砍掉,背后撑腰的是推理系统的底层优化和团队基础红利。

今天这期视频呢,来讲讲小米 mini v 二点五这个大模型的降价情况。现在呢,这个 mini v 二点五它跟 deepsea 已经是一个价格了。 mini v 二点五和 deepsea v 四 flash 是 一个价格,二点五 pro 跟 deepsea v 四 pro 价格一样, 之前我们都说 tbisc 的 价格很便宜,现在小米也便宜了,然后我测试了一下,随便跑了一下 agent, 然后它的缓冲泵动力呢,达到了百分之九十四,九十五,所以说就非常便宜。另外呢,小米有 tocom plan, tbisc 没有,所以说呢,小米现在呢,要比 tbisc 还要便宜一点点, 最低档呢,这个小米是三十九块钱,然后呢,你首次购买呢,有八八折,算下来就是三十四块多一点。然后呢,你可以用大概四十一块钱的 toc 的 量, 然后呢,你在晚上的零点到早上的八点,还有一个八折的额外的一个优惠,哎,所以说呢,你大概算下来就是你第一个月可以用三十四块三毛二买到大概五十一块钱的 talkin 的 这个一个量,所以说就是非常非常划算的。 那么它现在呢,对比来看,跟之前的 talkin plan 对 比来看,就是说呢,涨了大概五十到七十倍,可以说是非常非常良性了。 那今天的零点呢,他还把所有的额度给重置了,我今天上去一看,哎,我额度重置了。小米的大魔镜有两个隐形的好处,它的 v 二点五是多模态,但是这个 deepsea 呢,它就不是多模态。另外一个,它有一个语音的克隆的生成,它都是免费的,不需要花任何钱,所以说,比如说你的视频配音啊啊都不需要花钱的。 那假设呢?假设就是我们做到理论上的百分之九十五的缓存命中,大概这个三十四块钱的这个月卡可以买到 v 二点五五亿多的一个 top, 至少五亿的一个 top。 如果是 v 二点五 pro 呢,至少也能有一个一点九亿的 top, 可以 说是很实惠。 那就我个人来说,我现在主力呢还是 deepsea v 四 pro, 然后呢,我买了一个最便宜的一个小米的一个 mini 的 月卡,三十四块钱。然后呢为为的是什么呢?就是享受他的二点五的这个多模态啊。另外还有一个免费的语音克隆,那一个月三十四块钱还是非常便宜的。那这样呢,就可以覆盖我的绝大多数场景了。

主播上个月申请了小米 mimo 百万亿 token 计划,送了主播两个亿 token, 不 出意外的被我全部用完了。该说不说,小米的 token 消耗的是真快,之后主播就转战了 deep x, deep x 是 真便宜, 感谢良胜。突然微信收到密木降价通知,续费直接只要一分钱,不知道是 bug 还是福利, 之前的两亿 token 直接变成了一百四十亿积分了,让主播都不好意思了。 所以出一期视频给小米 mini 宣传宣传。现在的 a p i 价格已经和 deep ckey 一 样了,可以说非常香了, 但是缓存命中率确实不如 deep ckey。 实用体验感我感觉俩家差不太多,卖萌有时候会慢一点,但是和 opace 四点七和 gpt 五点五还是有一些差距,对主播来说是够用了,但是也感谢国内厂商的努力,才让我们用到这么便宜的顶级大模型。

同行涨价,小米却一刀砍掉百分之九十九。五月二十七日,雷军宣布米某大模型永久降价, pro 版输入缓存命中直接达到零点零二五元每百万透根子,与 deep 五天前锁定的 v 四 pro 永久价完全一致。 不是巧合,是对标大模型价格战已从杭州烧到北京,谁能把推理成本压到最低,谁就拿到了 ai 下半场的入场券。

小米开始掀桌子了, deepsea 前脚降百分之七十五,小米后脚降百分之九十九。三天之内,两家中国公司把 ai 模型的 api 调用价格打到了原来的百分之一,输入缓存命中的价格从两毛美金掉到了零点零三六美分。说实话,我第一次看到这个数字的时候,反复确认了三遍,小数点 lite 套餐六美元没变,原来给六千万 token, 现在给四十一亿, 翻了六十八倍。六十八倍是什么概念?昨天你花同样的钱能跑一个项目,今天能跑六十八个,这是在把 token 从商品变成自来水。小米把 token 打到这个价,赚的也不是水电费,是你在它生态里留下来的时间数据和下一代模型需要的反馈。降价只是幌子,锁住用户数据才是关键。

就在昨天,五月二十七号,小米大模型宣布永久降价,最高降幅百分之九十九。别急着划走!这不只是小米一家的事,过去半年,国内大模型行业正在经历一场史无前例的定价大洗牌。有的厂商在疯狂降价,降幅拉到百分之九十九。 有的厂商却在拼命涨价,最高涨了百分之四百六十三。同一行业完全相反的定价策略,这背后是大模型商业化正在发生的 k 型分化。这直接决定了你以后用 ai 是 越来越便宜还是越来越贵。 先看降价派,这一派的逻辑是降价走量,抢占生态。小米昨天宣布 miimo v 二点五系列 a p i 永久降价,最高降幅百分之九十九。调价后, pro 版核心价格与 deepsea v s pro 完全对齐,输入缓存命中零零二五元,百万 tokens 输入未命中三元,输出六元。 同时 token plan 计费体系升级,同等价格下额度提升五至八倍。 deepsea 是 这一波降价的发起者,四月二十六号限时二点五折优惠, 五月二十二号宣布永久化降幅锁定百分之七十五。第三方数据计算, v 四 pro 平均执行成本约为 g p t 五点五的十分之一。阿里通一千问自结豆包也在今年初跟进。百度文心一言,降价百分之六十。这个建议你点个收藏。接下来这组行业数据, 把降价的底层逻辑讲清楚了。中国信通院报告显示,二零二六年,国内大模型 a p i 平均价格较二零二三年下降超百分之九十,但性能反而提升了三到五倍。降价的底气来自底层技术突破, m o e 混合专家架构推理、缓存压缩、 k v catch 效率提升,让成本实现了结构性下降。但硬币的另一面是涨价派,这一派的逻辑是,成本扛不住涨价保利润。腾讯会员 h i 二点零 instruct 模型输入价格从零点零零零八元每千 tokens 涨到零 四千五百零五元,涨幅百分之四百六十三。智普年内三次提价, glm 五系列 a p i 价格累计上涨百分之八十三。 ceo 说涨价后掉用量反而增长了百分之四百,供不应求。阿里云平头哥 ai 算力卡涨了百分之五到百分之三十四,文件存储涨了百分之三十。百度智能云 ai 算力全线涨了百分之五到百分之三十。为什么涨价? 核心原因三个字,算力贵。 h p m 高宽带内存价格半年暴涨超百分之五百,高端 p p u 供不应求。截至三月,豆包大模型日军 token 使用量突破一百二十万亿,相比二零二四年五月增长了整整一千倍。 ai 产品的经济模型是颠倒的,每多一个活跃用户,就多一张实打实的算力账单,成本压力正沿着硬件、云应用链条一路向终端传导。第二个值得收藏的点来了,怎么理解这种又涨又降的矛盾?行业里有人把它总结为一句话, codex cloud 定上限, deepseek 定斩杀线,跟他持平,没议价落后他就出局。 通用型模型拼规模走低价,高端模型拼能力走溢价,这就是 k 型分化。海外也在上演同样的剧本, google i o 推出一百美元每月入门套餐,同时原高阶套餐从两百五十降到两百美元。 openai gpt 五点五, a p i 输入定价五美元,百万 tokens pro 版三十美元,比上一代翻三倍。但 chat gpt 订阅价不变, 大动端稳价,企业端涨价。 anthropic 把 agent 用量从订阅里剥离出来,六月十五号开始按新计费体系收费,重度用户可用额度缩水近十倍。 mate 的 lama 四训练成本暴降百分之九十二,输入定价仅零十五美元,百万 tokens 继续压底价,海外形成 openai 保高端、 google 抢中层 mate 压底价的梯队。那么这事跟你有啥关系?第一,用 ai 的 成本在快速下降, 两年前调用一次 gpt 四可能要几毛钱,现在调用 deepsea v 四处理百万字只要几分钱, token 正在变成自来水,打开就有。第二,免费时代在终结,按需付费成常态,豆包推出六十八到五百元每月付费计划, 国内主流平台形成五十到五百元清晰价格带,以后用 ai 会像用电一样随用随付,用多少付多少。第三,选模型正在变成一种新的数字理财, 最便宜的模型和最强的模型价格差可达几十倍。你的需求是什么?该选哪个?用多少额度?这些决策直接挂钩你的钱包和效率。你怎么看这轮大模型价格战,你现在用哪个 ai 工具觉得值这个价吗?评论区聊聊,我是前沿,关注科技前沿说,每天拆解科技和搞钱的深层逻辑,仅知识分享,不构成投资建议。

还记得上个月 deepsea 降价,今天小米跟进了。五月二十七日,小米旗下咪蒙大模型发布公告, v 二点五系列 模型 api 永久性降价,最高降幅百分之九十九。更狠的是不再区分上下文窗口长度。 token plan, 即费油化,同等价格下用量提升值原来的五到八倍。从 deepsea 到小米,咪蒙 a 大 模型降价已经成了二零二六年的主旋律。为什么?嗯,因为真正的科技不是用来炫耀参数的,而是要让每个人都能用得起。科技不是高高在上,得大众才是王道。关注我,带你看好牌怎么打!

中国的 ai 厂商已经快要把 tucker 卖成白菜价了,就在今天,五月二十七号,小米也跟了 deepsea 价格战,宣布 mimo v 二点五系列 api 永久降价, 最高降幅接近百分之九十九。雷军更是直接下场公开喊话,欢迎更多开发者接入小米 mimo 大 模型。上周的五月二十二号, deepsea 宣布 v 四 pro api 永久降价,输入缓存命中价格直接压到零点零二五元每百万 tokens。 而现在小米 miimo v 二点五 pro 的 缓存命中价格同样也来到了零点零二五元每百万 tokens。 而且这一轮降价并不只是 deepsea 和小米, 五月二十一号千问昆浪输入价格下调百分之九十七,四月字节豆包 pro 三十二 k 输入价格下调百分之九十九点三,百度文星轻量版价格下调约百分之七十。 整个国产大模型行业都在往低成本推理的方向走,因为现在行业发现真正贵的已经不只是训练模型而 推理,尤其 agent coding、 deep research 这些场景,一个任务背后可能就要跑几十轮。搜索长上下文,推理代码执行和结果较验, token 的 消耗会指数级上涨。所以现在大家卷的是谁能够把推理成本压下来? 小米这次甚至专门提到降价背后其实是推理系统优化、缓存策略和吞吐效率的提升。 此外,更有意思的是,现在连运营商都开始卖 token 了,前段时间三大运营商已经陆续推出 token 套餐,中国移动甚至提出 token 运营生态,把 token 定义成 ai 时代的新型基础资源。 这个变化很关键啊,因为过去运营商卖的是流量,未来很可能卖的就是 ai 调用额度。而当 token 开始像流量一样被标准化之后, ai 行业就不再只是拼谁的模型参数最大, 是比谁的推理成本更低,谁的调用更稳定,谁能够真正让 ai 像水没电一样被使用。毕竟啊,只有当 ai 足够便宜的时候,越来越多的企业才会真的开始无限调用 ai。


零点零一元续费,小米大模型白拿一百多亿 token。 二十七号零点之后,也就是今天,系统会刷新三百八十亿的套餐用量, 然后点续费,当前套餐系统会根据你剩余的价值来估算。比如你现在还剩三百八十亿,他不但不让你补钱,还倒找你七十五块,直接转成新的 token。 选一个支付方式, 显示一分钱,确认支付续费完成,花了零点零一元找的七十多,换成了一百多亿 tucker。

五月二十六号,小米发了二零二六年一季度财报,营收九百九十一亿,但利润大幅下滑。同一天,雷军宣布未来三年在 ai 上砸六百亿。 五月二十七号凌晨,小米 mimo 大 模型降价,最高降百分之九十九。一边是利润在掉,一边是六百亿砸下去,一边是 api 价格砍到地板。这三件事连在一起,才能看懂雷军到底要干什么。先说降价本身, m i m o v 二点五 pro 降价后缓存命中,每百万 token 零点零二五元,输出六元,什么感觉呢?一个程序员用 ai 辅助写一整天代码,可能就花几毛钱,搁去年,这个数字得成个几十倍。但这只是表面,真正狠的是另外两刀。第一刀砍掉了上下文,分段计价。 以前你跟 ai 聊天聊得越久,它越贵,因为它每轮都要把前面说过的话重新算一遍钱。一个写代码的 agent 跑一下午,上下文越滚越长,你的账单就跟着越滚越大。现在小米把这套规则废了,统一价,不管聊多长。第二刀, token 套餐用量直接翻五到八倍, 老用户额度全额重置,等于你之前买的套餐。小米按新规矩给你重新算了一遍,还往多了算,这两刀下去不是打折,是把计费体系拆了重建。然后看时间。五月二十二号, deepsea 宣布 v 四 pro 永久降价,价格铆定,原价四分之一,五月二十七号,小米跟上,五天之内,两家先后永久降价。你要是还觉得这是巧合, 那你就没看懂这个行业正在发生什么。去年大家比跑分比谁模型更聪明,今年不比了,或者说比不出太大差距了。 国内头部的几家模型,在绝大多数日常场景下已经难分高下。你让普通用户盲测,十个有九个分不清,那既然分不出胜负,竞争就转移到下一个战场,谁更便宜? 这不是主动选的,是被迫的。大家能力差不多,价格就是最直接的武器。再来想一个问题,小米凭什么敢这么降?赔本赚吆喝谁都行。小米团队给了一个技术解释,他们用了新的推力架构 k v 缓存,传输量降到了原来的七分之一, 可缓存的 token 量多了将近五倍。翻译成人话就是硬件还是那套硬件,但软件优化让同样的算力能服务更多请求,单次调用的成本却是降下来了。但这只是技术层面,更重要的底气来自别的地方。小米不是一家靠卖 api 赚钱的公司,它有手机, 一季度还在出货。它有汽车溯期,首年交了十三万辆,累计六十五万辆。它有十亿台 iot 设备铺在用户家里。大模型对小米来说,不是一个独立的产品线,而是给人撤家全生态装大脑的底层能力。 api 卖多少钱,对小米的生死没有影响, 但对那些只做模型、只靠 api 收费的创业公司来说,这就是灭顶之灾。你卖一块钱,我一毛钱,你亏不起, 我亏得起,因为我的钱从手机和汽车那边来。这才是降价的真正杀伤力。它不是在跟 deepsea 打价格战,它是在用整个集团的利润池补贴一条新战线。受伤最重的是中间层的模型公司,你既没有小米的硬件生态做后盾,又没有 deepsea 的 极简架构带来的超低成本, 你拿什么跟?二零二四年,已经有智普、百川能厂商被迫跟着降价,降幅超过百分之九十。二零二五年继续洗,中小模型公司陆续退场。 e o 智库的预判是,到二零二七年,到二零二八年,通用大模型市场会变成三到五家寡头格局。现在二零二六年五月,我们正在经历的就是这个初侵过程最猛烈的一段,受益的是开发者,以前只有大公司跑得起的 ai agent, 自动编码,长上下文推理, 现在小团队也跑得起了。一块钱能买到三本三国演义字数的 ai 调用,这是字节跳动豆包的定价,小米和 deepsea 的 价格跟这个同一量级, 而这反过来又会让 ai 应用的爆发提前到来。当调用成本不再是一道门槛,该出现的东西就会出现了。就像四 g 流量降到白菜价之后,短视频才真正爆发。 不是因为之前没人想拍短视频,是因为拍得起,传不起,最后收回。雷军五月二十六号宣布六百亿 ai 投入, 五月二十七号,大模型降价百分之九十九,这两步之间的逻辑是连贯的。六百亿不是用来养一个模型的,是用来建一条 ai 基础设施的。你先把路修好,把过路费降到最低,让所有开发者都走你的路,然后再在路两边做生意。手机上 mimo 已经集成到小爱同学、小米浏览器、金山办公里、 汽车上车机系统需要大模型做云交互和智能推荐,家里十亿台 iot 设备等着被 ai 重新激活。雷军赌的是未来 ai 的 价值不在模型本身,而在模型跟硬件,跟场景,跟用户绑在一起的那个闭环。 模型本身可以不赚钱,但闭环里面的每一环都赚钱。这套打法小米在手机上玩过一回, 二零一一年小米一卖一九九九,同配置的别人卖四千,硬件不赚钱,甚至亏钱,靠 m i u i 的 互联网服务把钱赚回来。现在雷军把同样的逻辑搬到 ai 上,模型便宜甚至免费, 靠人车加生态把钱赚回来。十四年前的套路,十四年后再拿出来用。不一样的是,这回对手不是中华库联,是整个中国大模型行业,而这一次,他手里有六百亿。看到这的咱们,希望能点个关注和收藏,随时分享新内容。

小米降价百分之九十九, ai 行业要变天了!就在刚刚,小米 ai 模型咪蒙 v 二点五系列官宣降价,最高降幅百分之九十九。最低档的套餐使用额度从六千万增加到四十一亿,增长六十八倍。最高档的套餐额度从十六亿增加到八百二十亿,增长五十一倍。 此外,这次调整还取消了上下文窗口长度的区分,统一计费,对用户来说更简单透明了。除了官宣的降价,针对老用户还端出了套餐有效期内额度重置和一分钱续订的福利,雷总和罗胜的恩情属实是还不完了。不过值得注意的是,不只是小米一家在券价格, 早在五月二十二日, deepsea 就 抢先宣布 vc pro 模型永久降价至原价的四分之一。国外的顶尖 ai 公司 open ai 虽然没官宣降价,但 codex 的 套餐内额度重置却越来越频繁,最近一周就重置了三次,相当于给用户多送了几倍的额度。 这一切都说明, token 的 大幅度降价已经成为 ai 行业的共识,同样意味着 ai 行业也已经迎来了拐点。一方面,用户的需求在爆发式的增长,据统计,我国每天有高达一百四十万亿的 ai token 消耗,并且这个数字还在飞速增加。从过去的聊天到现在的写代码、 ppt, ai 已经接管了许多人的工作,电脑成为了真正的生产力工具。另一方面, ai 大 模型也已经进入了一个相对稳定的发展阶段, ai 的 智力提升放缓,各大 ai 公司也越来越关注 ai 在 实际场景中的落地和体验,通 通过技术优化来降低成本。简而言之,降价增量不是个别公司的良心发现,而是 ai 正在从一个新兴概念逐渐转变成一个刚需的基础设施。今天,用户消耗偷啃,就像十年前消耗手机流量一样,技术的成熟、成本的下降,需求的爆发,都让 ai 从少数人的玩具变成每个人工作生活中不可缺少的一部分。 此刻你真正需要关注的不仅仅是降价这件事,还有当 ai 变成基础设施之后对每一个人产生的影响。不管你有没有准备好,改革已经开始,你是选择主动上手,还是被裹挟着走,这个选择可能会拉开未来十年人与人之间最大的差距。
