啪啪打脸啊兄弟们,前段时间我还说了 token 焦虑,什么小米 vivo token 本来用的很快啊,还有什么 cloud codex 套餐很贵啊,我还说什么 token 可能越来越贵,我,啊, 怕怕打脸。就在这两晚,小米突然之间他就降价了,他别人降价都是打五折打几折他,他降价最多百分之九十九,并且他还重置了我的三兆套餐,我之前是两个亿的套餐,现在我有多少?现在, 现在有一百一十个亿,一百一十亿 crazy, 太疯狂了,兄弟们,太疯狂了!现在属于 token 的 价格战已经打响,兄弟们。
粉丝3669获赞17.6万

原本两亿的筹款,现在直接变成一百一十亿,还有三十二亿的补偿基分根本用不完! deepsea 宣布降价之后,小米的 mini 模型也宣布了永久降价,原本订阅用量提升到了原来的五到八倍,在今天零点正式生效,并且原有订阅的额度也全部重置刷新 上个月申请了雷总的免费 token 的 兄弟们,可以直接在订阅里面一分钱续费一个月。逻辑是这样的, miimo 的 套餐续费会重置这个月的账单日期直接重新算到下个月的。今天 本月没用完的积分可以折算抵扣下个月续费的价格。但是今天额度重置后,就是完全百分百的抵扣,而首月开通又有七七折的优惠,这导致雷总还欠你中间百分之二十三的差价。于是雷总不仅让你零点零一续费,还把这欠你的差价换成补偿积分,加到你下个月套餐里面。 开启自动续费后,扣零点零一即可续费。下个月一定要记得马上关闭自动续费,防止被返号。然后不要点第二次重新续费,这会取消补偿积分。原本两亿的扣款,现在直接变成一百一十亿,还有三十二亿的补偿积分,根本用不完!

小米 mimo 大模型 api 永久降价,最高降幅百分之九十九五月二十七日,小米宣布对 mimov 二点五系列大模型 api 实施永久降价,最高降幅达到百分之九十九。本次调价不再区分上下文窗口, 同时优化计费方案,同等价格下,开发者可使用的 token 用量提升至原来的五到八倍。雷军也公开表态,欢迎更多开发者介入小米 mimo 大模型,进一步降低 ai 应用的开发成本。

小米开始掀桌子了, deepsea 前脚降百分之七十五,小米后脚降百分之九十九。三天之内,两家中国公司把 ai 模型的 api 调用价格打到了原来的百分之一,输入缓存命中的价格从两毛美金掉到了零点零三六美分。说实话,我第一次看到这个数字的时候,反复确认了三遍,小数点 lite 套餐六美元没变,原来给六千万 token, 现在给四十一亿, 翻了六十八倍。六十八倍是什么概念?昨天你花同样的钱能跑一个项目,今天能跑六十八个,这是在把 token 从商品变成自来水。小米把 token 打到这个价,赚的也不是水电费,是你在它生态里留下来的时间数据和下一代模型需要的反馈。降价只是幌子,锁住用户数据才是关键。

今天这期视频呢,来讲讲小米 mini v 二点五这个大模型的降价情况。现在呢,这个 mini v 二点五它跟 deepsea 已经是一个价格了。 mini v 二点五和 deepsea v 四 flash 是 一个价格,二点五 pro 跟 deepsea v 四 pro 价格一样, 之前我们都说 tbisc 的 价格很便宜,现在小米也便宜了,然后我测试了一下,随便跑了一下 agent, 然后它的缓冲泵动力呢,达到了百分之九十四,九十五,所以说就非常便宜。另外呢,小米有 tocom plan, tbisc 没有,所以说呢,小米现在呢,要比 tbisc 还要便宜一点点, 最低档呢,这个小米是三十九块钱,然后呢,你首次购买呢,有八八折,算下来就是三十四块多一点。然后呢,你可以用大概四十一块钱的 toc 的 量, 然后呢,你在晚上的零点到早上的八点,还有一个八折的额外的一个优惠,哎,所以说呢,你大概算下来就是你第一个月可以用三十四块三毛二买到大概五十一块钱的 talkin 的 这个一个量,所以说就是非常非常划算的。 那么它现在呢,对比来看,跟之前的 talkin plan 对 比来看,就是说呢,涨了大概五十到七十倍,可以说是非常非常良性了。 那今天的零点呢,他还把所有的额度给重置了,我今天上去一看,哎,我额度重置了。小米的大魔镜有两个隐形的好处,它的 v 二点五是多模态,但是这个 deepsea 呢,它就不是多模态。另外一个,它有一个语音的克隆的生成,它都是免费的,不需要花任何钱,所以说,比如说你的视频配音啊啊都不需要花钱的。 那假设呢?假设就是我们做到理论上的百分之九十五的缓存命中,大概这个三十四块钱的这个月卡可以买到 v 二点五五亿多的一个 top, 至少五亿的一个 top。 如果是 v 二点五 pro 呢,至少也能有一个一点九亿的 top, 可以 说是很实惠。 那就我个人来说,我现在主力呢还是 deepsea v 四 pro, 然后呢,我买了一个最便宜的一个小米的一个 mini 的 月卡,三十四块钱。然后呢为为的是什么呢?就是享受他的二点五的这个多模态啊。另外还有一个免费的语音克隆,那一个月三十四块钱还是非常便宜的。那这样呢,就可以覆盖我的绝大多数场景了。

零点零一元续费,小米大模型白拿一百多亿 token。 二十七号零点之后,也就是今天,系统会刷新三百八十亿的套餐用量, 然后点续费,当前套餐系统会根据你剩余的价值来估算。比如你现在还剩三百八十亿,他不但不让你补钱,还倒找你七十五块,直接转成新的 token。 选一个支付方式, 显示一分钱,确认支付续费完成,花了零点零一元找的七十多,换成了一百多亿 tucker。

太炸裂了!小米这次直接把大模型价格打到了空气价,老用户额度全部充至原来几十万, top 的 额度突然变成百亿级。更离谱的是,小米直接宣布 mini 永久降价,最高降幅百分之九十九,输入百万 top 只要两分钱!你要知道, dbc 个前脚刚把价格砍到四分之一,小米后脚就直接把地板给掀了。但真正恐怖的还不是便宜,而是小米开始完全能 ai, 文字、图片、音频、视频全都能一起理解。以前 deepsea 像文字聊天高手,而现在 vivo 更像全能数字员工。更关键的是,小米这波不是单纯降价,而是在疯狂扩大开发者生态。因为 ai 时代最后拼的不是谁模型最贵,而是谁先把 ai 彻底铺满全世界!

对不起了梁胜,雷军给的实在太多了,一觉醒来以为出 bug 了,百万头肯变成百亿头肯。五月二十七日,雷军官宣小米猫某永久降价,降幅百分之九十九,同时老用户额度全量重置 转角。 deepsea 刚把价格砍到四分之一,小米直接跟进,把大模型价格打穿了,地板输入百万 token 零点零二元。比 deepsea v 四更低更狠的是,小米 mini 是 多摩态输入,也就是说,你的文字、图像、音频、视频他也能理解实践真正的内容全流程自动化,而不是 deepsea 单单文本输入。这波操作到底是恶性价格战,还是说雷总想做普惠大众的 ai 呢?

大冒险价格正式开打,小米米某突然官宣大幅降价,最高降幅达到百分之九十九,同时托克帕伦加量不加价标准这一档的用量从原来的两个亿飙涨到一百一十 亿的积分。你没听错啊,一百一十亿翻了五十五倍。兄弟们,其他话不要多说了啊,赶紧去试一下。我靠,这个真的太太,小米太太牛逼了。

先说结论,小米 miimo 确实降价了,而且降的不少,但降幅百分之九十九这个说法,咱们得打个问号,因为没人知道它原来到底卖多少钱。 credit 是 怎么回事? 小米搞了个中间层,叫 credit, 你 先买套餐,比如三十九元,一个月给你六千万个 credit, 然后用的时候按 credit 扣。降价之前, pro 模型要扣两个 credit, 长文本甚至要扣四个。 降价之后,小米说取消了四倍 credit 的 计费方式,但具体 pro 模型现在是扣一个还是两个,官方没说清楚, 直接看价格更实在。小米公布了 token 价格,输入缓存命中零点零二五元每百万 token 输入缓存为命中三元每百万, token 输出六元每百万 token 输入只要两分五厘钱就能买一百万个 token。 和 deep seek 比怎么样?巧了, deep seek v 四 pro 的 价格完全一样。小米这是明摆着对标 deep seek, 价格完全对齐, 那到底降了多少?小米说最高降幅百分之九十九,如果这是真的,那原来 pro 模型的输出价格应该是六百元每百万 to 肯左右。 但问题是小米从来没公布过原来的官方价格表,所以百分之九十九降幅这个数字只能信一半。 普通人该怎么选?如果你追求简单透明,小米和 dipsic 价格一样,选哪个都行。如果你担心被套路,别买套餐,直接按量付费,这样就是明确的价格,没有 credit 换算的弯弯绕。 最终结论,小米 mimo 降价是真的,价格也确实便宜,但降幅百分之九十九的宣传,因为缺乏原价数据,没法完全验证,和 dipsic 比价格完全一样。 credit 机制有没有猫腻?官方没把降价后的换算比例说清楚,这是个隐患。

小米 miimo v 二点五大降价百分之九十九,很多大聪明的反应是,不就是降价吗?别家也能做啊?错!真正恐怖的地方,从来不是能不能做,而是敢不敢做!这才是这件事最炸裂的核心。 g l m kimi、 千万豆包这些大模型理论上能不能做缓存优化呢?当然能,甚至我怀疑很多公司可能早早就偷偷做了。为什么? 因为缓存优化这个东西,本质上就是把 ai 已经算过的内容缓存起来,下次再有人问类似的问题,直接读缓存。 那么以前 ai 每次回答问题都想重新做一遍高考数学卷,现在变了,这题老子做过了,直接抄答案,成本一下就暴跌,尤其是配合 ssd 缓存以后,显存的压力会下降的非常夸张。而显存才是一个 ai 公司最贵的东西。 所以问题来了,如果大家理论上都能做,为什么行业价格一直没有崩呢?那是因为没人敢。 你发现没有,现在很多 ai 公司表面上在卷模型能力,实际上拼的是什么?拼的是融资,拼的是利润,拼的是资本。故事 谁都知道价格还能降,但谁都不想第一个动刀,因为一旦有人掀桌子,整个行业的利润都会血崩。结果小米干了什么?别人偷偷优化,小米就直接公开砍价,这才是最狠的地方。 最离谱的是,他现在几乎做到同 deepsea 同价,同样 e m 的 上下文,而且他还有多模态,大家知道这基本上相当于 deepsea 四点一提前发布了。老铁 为什么这么说?因为过去大家一直以为 deepx 这么便宜,是因为他技术带差太大,别人短时间根本追不上,结果现在小米告诉行业不一定哦,别人可能也能做到,只是很多人不愿意降价而已, 因为他直接把整个 ai 行业的底库掀了。原来很多公司的护城河可能根本就不是技术,而是大家默契的维持高价。而小米最恐怖的地方是什么? 不是模型,不是论文,不是参数,他最擅长干一件事,那就是价格战。手机行业他这么干过,家电行业也这么干过,那汽车行业呢?他也在这么干。现在终于轮到 ai 了, 以后 ai 行业最可怕的事情呢,可能不是哪个模型更聪明,而是谁先把 ai 做成白菜价。因为当 ai 成本下降十倍的时候,变化的不是利润,而是整个世界的使用习惯。以前大家问一句 ai 嫌贵 以后可能默认全程挂着 ai, 那 时候真正难受的不是技术差的公司,而是成本明明已经降下来了,却还不敢降价的公司。兄弟们,你们觉得呢?

主播上个月申请了小米 mimo 百万亿 token 计划,送了主播两个亿 token, 不 出意外的被我全部用完了。该说不说,小米的 token 消耗的是真快,之后主播就转战了 deep x, deep x 是 真便宜, 感谢良胜。突然微信收到密木降价通知,续费直接只要一分钱,不知道是 bug 还是福利, 之前的两亿 token 直接变成了一百四十亿积分了,让主播都不好意思了。 所以出一期视频给小米 mini 宣传宣传。现在的 a p i 价格已经和 deep ckey 一 样了,可以说非常香了, 但是缓存命中率确实不如 deep ckey。 实用体验感我感觉俩家差不太多,卖萌有时候会慢一点,但是和 opace 四点七和 gpt 五点五还是有一些差距,对主播来说是够用了,但是也感谢国内厂商的努力,才让我们用到这么便宜的顶级大模型。

主播上个月申请了小米 mimo 百万亿 token 计划,送了主播两个亿 token, 不 出意外的被我全部用完了。该说不说,小米的 token 消耗的是真快,之后主播就转战了 deep x, deep x 是 真便宜, 感谢良胜。突然微信收到密木降价通知,续费直接只要一分钱,不知道是 bug 还是福利, 之前的两亿 token 直接变成了一百四十亿积分了,让主播都不好意思了。 所以出一期视频给小米 mini 宣传宣传。现在的 a p i 价格已经和 deep ckey 一 样了,可以说非常香了, 但是缓存命中率确实不如 deep ckey。 实用体验感我感觉俩家差不太多,卖萌有时候会慢一点,但是和 opace 四点七和 gpt 五点五还是有一些差距,对主播来说是够用了,但是也感谢国内厂商的努力,才让我们用到这么便宜的顶级大模型。

谁能想到,当 deepsea 官宣永久降价后,今天凌晨小米甩出王炸 miami v 二点五系列永久降价,最高百分之九十九,彻底取消上下文窗口差价。这意味着什么?就是你让 ai 读一本几十万字的小说,和让他写一句你好,价格完全一样。 miami v 二点五 pro 基础版甚至比 deepsea vs flush 更便 宜。国产大模型正式进入决利。下半场, deepsea 先行,小米接棒,两家联手把国产大模型打到了全球最低价。这不是内卷,而是用技术、实力、权势。技术的意义,就是让每个人都能平等享受科技的红利。

还记得上个月 deepsea 降价,今天小米跟进了。五月二十七日,小米旗下咪蒙大模型发布公告, v 二点五系列 模型 api 永久性降价,最高降幅百分之九十九。更狠的是不再区分上下文窗口长度。 token plan, 即费油化,同等价格下用量提升值原来的五到八倍。从 deepsea 到小米,咪蒙 a 大 模型降价已经成了二零二六年的主旋律。为什么?嗯,因为真正的科技不是用来炫耀参数的,而是要让每个人都能用得起。科技不是高高在上,得大众才是王道。关注我,带你看好牌怎么打!

今天 vr 圈最狠的价格战来自小米 mini 微二点五系列 a p r 从今天开始永久降价,最高降幅达到百分之九十九,而且取消长文本意价,所有上下文统一计费。 旗舰模型 mini v 二点五 pro 的 价格被直接打穿,缓存命中、缓存未命中和输出价格都进入极低区间。更关键的是, token plan 也升级了,六美元到一百美元,四档套餐不涨价,但可用额度提升到原来的五到八倍。 同时,所有仍在有效期内的历史套餐额度全量重置,相当于老用户也直接吃到这次降价红利。另一边,小米的百万亿 tocan 创造者激励计划提前收官, 全球五十四万多人申请,最终二十四万多人获批,一百万亿 tocan 已经全部发完。这说明大模型 api 的 竞争正在从模型参数转向推理成本、缓存效率和开发者生态。 对创业者和开发者来说,问题变了。当模型调用越来越便宜,你会把哪些 ai 应用重新做一遍?关注我,并在评论区留下你的判断。

欢迎来到 ai 日报,先来看看今天最重磅的新闻!一、小米 mimo v 二点五系列 api 价格永久下调,最高降幅达百分之九十九,现与 digic v 四 pro 同价 token 套餐同步升级,同等价格下可用 token 量增加五至八倍。计费规则更简单透明, 所有现有用户套餐额度将全额重置。此次降价源于 mimo 全站推理优化与服务效率提升,后续将发布技术薄册讲述细节。 mimo v 二点五 p t s 限时免费,新定价于五月二十六日生效。二、 color 平台限时半价使用 queen 三点七 max 模型,如果你是新用户,你每天还能获得一百次免费模型调用 自动应用无需领取、无需开关,桌面端 jack brains 插件 c l i cutter work 全部覆盖。三、 cloud code 发布 v 二点一点一五二版本更新 核心改进包括斜杠 code review fix, 现在会将审查建议直接应用于工作目录技能与斜杠命令,支持通过 front matter 的 disallow tools 移除模型工具。新增 relo skills 命令,可不重启绘画重新扫描技能目录 session start 钩子,现可返回 relo skills 初重新扫描技能,并可通过 hook specific output session title 设置绘画标题。新增 message display 钩子事件,以变换或隐藏助手消息。其他更新涉及插件市场管理、主模型不可用时自动切换至 four back model、 绘画用量统计优化等。 同时修复了终端样式退化、沙箱警告显示、思考摘药 m c p 服务器去重远程绘画连接及多种绘画卡顿问题。四、 ko 的 w cloud 伦敦活动上, andropica 宣布了 cloud manage agents 的 两项新能力,自托管沙箱和 m c p 隧道贝塔版本。 这两项功能使 ai 智能体的工具执行环境与企业私有网络内的 m c p 服务器连接,均可运行在客户自有基础设施或指定托管服务商处。 活动还介绍了如何通过 cloud code 优化思维预算以及模型努力级别来提升开发体验。目前包括 spotify、 a 四四和 lagola 在 内的客户已在使用这些新功能。五、 cloud code 推出安全漏洞识别插件,可在编辑代码时帮助识别和修复漏洞。 所有 cloud code 的 用户均可使用,可以从插件市场 plugins 安装。六、阿里云在阿里云在每一层的全站能力认可,其是首个将整个平台围绕智能体范式进行构建的云服务商。 七、我国将加快研究推进人工智能健康发展综合性立法、低空经济立法等。八、阿里云宣布以白金会员身份加入 pattorche 基金会,作为 ai 基础设施全球领导者。阿里云是开源模型家族矿的缔造方,以在多样化硬件上大规模运行 pattorche, 将为社区带来生产级工程经验。 九、消息称,沟通与字节跳动达成 a i a c 芯片合作,采购量在数百万颗级别。十、 andropic 宣布认命批央卓为韩国代表董事,已支持其即将在首尔开设的办公室。根据 andropic 的 经济指数,韩国是 cloud ai 全球最活跃的市场之一,其使用率超过人口规模预期的三点五倍,主要用于技术和创意领域。 pianchoi 此前曾担任 snowflake 韩国区总经理,在 google、 cloud、 adobe 等公司拥有超过三十年的科技行业领导经验。他将在韩国领导市场战略,支持本地企业和初创公司应用 cloud。 例如法律科技公司 lawrence company 及韩国电信巨头 s k telcom 均已在使用 cloud 构建产品。 十一、 entropic 工程师 shoto douglas 表示, cloud missiles 在 周末期间解决了 openai 提出的 irdos 单位距离猜想问题,并给出了一个巧妙简洁的证明。这一成果被描述为人工智能在数学发现领域存在严重超前迹象。 十二、 open ledger 宣布完成由 capitol gdc 领投的一点一三亿美元闭门融资。过去六个月,随着 ai 从实验快速转向生产, open ledger 的 周处理量从五万亿增长到二十五万亿 token, 我 们对未来充满期待。十三、微软亚洲研究院发起全球 ai 价值观挑战赛,承邀哲学、论理、法学和社会科学领域的研究人员共同探索。 十四、马一百零 at antini g i 团队推出 k pop, 用于稳定大规模梦模型的智能体强化学习训练。它用基于二元 k l 散度的自适应野马机制替代了此前 s pop 方法中的固定比例,野马能根据训练过程中的训练推理不匹配程度动态调整。 这一改进使得 r n 二点六 e t。 模型在无需修改基础设施或路由重放的情况下,仅通过纯 r l 训练,在 swbench verify 上取得了超过七十六分的成绩。 十五、规藏发布小红书图文排版 a s q。 集成地图与自动配图 design social cards q 是 一款针对小红书图文常见类别进行优化的 a s q, 其亮点在于为旅行博主集成了地图组建用户输入目的地和线路后, ai 能自动在底图上标记并嵌入图片。根据引用, ai q 完全基于 html 和实拍图片生成,内容不会被平台标注为 ai 生成,并会主动从高质量图片网站寻找对应主题图片以优化图文排版。 十六、 open ai 奥尔特曼称, ai 对 白领冲击不如预期般严重,我很高兴自己当时错了。十七、 google 发布了其多模态模型 gemini 的 视频生成功能使用指南, 该模型可通过 gemini 应用、 google flow 等平台体验。指南包含五项提示词技巧,利用模型已有的现实世界知识进行简洁描述,精确控制文本在视频中的渲染与排版。使用专业镜头指令,如推拉、遥移,像电影摄影师一样调度画面。通过迭代编辑、高效修改视频,以及在生成中直接调整角色的动作、节奏或情绪。 其核心在于通过精准的提示词引导模型生成复杂且可控的视频内容。十八、 eason molly 写了一篇新文章,探讨我们需要保留哪些人类特质,以及哪些可以交给 ai。 其中涉及教育咨询领域的实验,以及最近关于文学奖的争议。 他指出,社交媒体平台上的帖子内容正变得越来越相似,这种趋同现象可能意味着大量内容正在被 ai 生成或同质化处理,引发了人们对于内容原创性与人类独特视角的讨论。 十九、 entropic 通过三重机制控制 cloud 智能体的部署风险,包括用户误用模型、异常行为和外部攻击,其防护策略聚焦于三个层面,通过沙箱、虚拟机和网络出口控制限制智能体运行环境、利用系统提示词和模型训练引导其行为,以及对 m c p、 服务器、第三方插件等外部内容实施细力度全线管理。 文章以 cloud code、 cloud a r 和 cloud co work 为例,讲述了不同产品如何设计对应的隔离架构。二十、 open sans nova 开源了 sans nova u 一 的完整训练代码库,支持其八 b 密集模型与 a 三 b mode 架构。 该代码库使用一个统一的框架,可同时训练多种多模态任务,包括文本到图像生成、图像编辑、交错生成及文本与视觉理解 工程上为大规模训练设计,支持混合并行流势、可恢复数据管线、环境变量驱动配置,以及从一乘以八 g p u s 到多节点群的扩展能力。代码已在 github 开源,采用 apache 二点零协议。二十一、 runway 通过 project luxo 研究发现 ai 生成视频已跨越恐怖谷。 他们向创意生态从业者展示了 derog 等 ai 短片及广告样片,评估显示观众开始关注故事本身而非技术瑕疵。所有作品均由单人团队制作,耗时从三周到四小时不等。 one 位认为这标志着 ai 媒体成熟,当技术足够好以至于隐形观众沉浸于故事时,便实现了这一跨越。 二十二、 google 与 alphabet ceo sundry pry 在 google i o 后受访,回顾了公司为应对 chat gpt 而进行的战队重组与高管调整。 访谈聚焦于新的 gemini 模型及其在产品中的整合,包括全新的智能搜索框与 gemini spark 智能体平台只在让搜索从提供结果转向启动任务。 tiche 讨论了这些变化对开放网络的持续冲击,回应了主持人此前提出的 google zero 概念及来自 google 的 网站流量可能归零,并提及 google 正利用 youtube 视频训练模型以改变视频搜索与缩影方式。 最后,他对 google deepmind ceo dennis hussabeez 关于处于智能起点起步阶段的言论表示认同,并分享了对 a g i。 时间线的看法。今天的日报就到这里,每晚十一点准时更新,日报有用记得关注哦!你的鼓励真的很重要!

ok, 朋友们,咱们消费者最喜欢的商战环节随时站到啊!这样 ai 价格战还是随着梁总 deepsea 的 果断开团,以及雷总小米的光速跟团悄然展开。 就在二十七号凌晨,小米发布重磅公告, vivo v 二点五系全系永久降价,最高降幅达百分之九十九。而当我们来看一下价格, 二点五 pro 缓存命中数从原本的两块八降到了现在的两分五,而未命中缓存数从原本的十四块钱降到现在三块钱,而叔叔从原本的四十二块钱降到现在六块钱。我们看到这三个板块上价格,会发现有种莫名其妙熟悉的感觉, 没错,他就是原封不动对标 deepsea 的 输入跟输出价格,一分钱都没有改。这不禁让我想到当年的外卖大战, 各大平台也是大量的发送各种大额补贴,以获取出使用户啊,做原始的用户积累。而小米的各项测试成绩其实在国产的这些 ai 大 模型中还是有一席之地的, 放到国际舞台上的话,确实还是能看到有些明显的差距,但是确实这个差距也在逐步缩小,而现在这个性价比你是不能不考虑进去的,所以都这个价格了,你还要什么自行车呢?所以没啥好说的,干就完了。

五月二十七日,小米宣布 mini v 二点五系列 api 永久降价,最高降幅高达百分之九十九,并且不再区分上下文窗口长度。小米 mini 负责人罗福利随后发文揭秘了降价的技术底气,其 推理框架新增了针对所有的分层 k v 缓存优化,这项优化让缓存托克容量提升了五倍,相当于降低了百分之八十的缓存成本。同时,得益于模型架构中极端的一比七稀疏比例, 小米将原始推理成本压到了远低于行业平均水平,从而把结构性成本红利直接让渡给开发者。目前,在最新定价下,小米的生产推理引擎已接近满负荷运行,但依然能够维持数值平衡。官方也表示,只有底层架构优化跟上,才能避免流血降价。这次降价不仅打破了成本底线, 更意味着大模型正通过极致的推理优化到 b 底层 ai 硬件价值重估平价算力,将真正引爆全球规模化的推理应用需求。

dpc 刚把价格打到地板,小米直接砸穿了地心。五月二十七日,小米 mini v 二点五系列 api 永久降价,最高降幅百分之九十九,输入缓存命中最低只要两分钱,每百万托更 说出最低两块钱什么概念。以前跑一个 ai 项目可能要花几千块,现在几十块钱就够了。雷军凌晨亲自发文,欢迎更多开发者进入。从二五折到一百分之一,国产大模型正在变成水电煤独立开发者的黄金时代真的来了。