粉丝3.5万获赞287.5万

家人们,今天科技圈又有大动作,五月三十号,小米正式公开了 mimo v 二点五系列模型的推理系统全链路优化技术细节。这可是业内第一次完整公开这种复杂复合架构的大规模工程落地方案。 而且就在三天前,小米刚刚把 mimo 的 api 价格永久降了百分之九十九,这次公开的技术就是这次白菜价背后的真正原因。 这次优化最核心的突破就是解决了大模型最费钱的记忆问题。简单说,大模型跟你聊天的时候,需要把之前说过的所有话都记下来,记的东西越多,占用的算力就越多,成本也就越高。 小米通过技术重构,把这个记忆的存储空间压缩到了同级方案的七分之一。也就是说,用同样的硬件设备,现在能同时服务七倍的用户,成本自然就大幅下降了。除了成本大降,速度也提升了很多。 官方数据显示,优化后的推理吞吐量比之前翻了三倍,前一百二十八个字母的生成速度快了二点三倍, 而且多模态能力也变得更强了,处理一个小时的视频内容原来需要一百五十六秒,现在只要二十三秒,快了将近七倍。最关键的是,模型的能力一点都没有缩水,还是原来那个能写代码、看视频、处理上百万字长文档的水平。 这次技术公开,标志着大模型行业已经进入了一个新的阶段。以前大家都在拼谁的模型参数多,谁的能力强,现在开始拼谁的工程效率高,谁的成本低。成本大幅下降之后,更多的企业和普通开发者都能用得起大模型了,这肯定会催生出更多有意思有用的 ai 应用。 未来我们用 ai 会越来越便宜,越来越方便, ai 也会真正融入到我们生活的方方面面。内容仅为客观科普,不构成任何投资建议及决策参考。想了解更多最新的科技产业动态,欢迎关注我!

先说结论,小米 miimo 确实降价了,而且降的不少,但降幅百分之九十九这个说法,咱们得打个问号,因为没人知道它原来到底卖多少钱。 credit 是 怎么回事? 小米搞了个中间层,叫 credit, 你 先买套餐,比如三十九元,一个月给你六千万个 credit, 然后用的时候按 credit 扣。降价之前, pro 模型要扣两个 credit, 长文本甚至要扣四个。 降价之后,小米说取消了四倍 credit 的 计费方式,但具体 pro 模型现在是扣一个还是两个,官方没说清楚, 直接看价格更实在。小米公布了 token 价格,输入缓存命中零点零二五元每百万 token 输入缓存为命中三元每百万, token 输出六元每百万 token 输入只要两分五厘钱就能买一百万个 token。 和 deep seek 比怎么样?巧了, deep seek v 四 pro 的 价格完全一样。小米这是明摆着对标 deep seek, 价格完全对齐, 那到底降了多少?小米说最高降幅百分之九十九,如果这是真的,那原来 pro 模型的输出价格应该是六百元每百万 to 肯左右。 但问题是小米从来没公布过原来的官方价格表,所以百分之九十九降幅这个数字只能信一半。 普通人该怎么选?如果你追求简单透明,小米和 dipsic 价格一样,选哪个都行。如果你担心被套路,别买套餐,直接按量付费,这样就是明确的价格,没有 credit 换算的弯弯绕。 最终结论,小米 mimo 降价是真的,价格也确实便宜,但降幅百分之九十九的宣传,因为缺乏原价数据,没法完全验证,和 dipsic 比价格完全一样。 credit 机制有没有猫腻?官方没把降价后的换算比例说清楚,这是个隐患。

dpc 刚把价格打到地板,小米直接砸穿了地心。五月二十七日,小米 mini v 二点五系列 api 永久降价,最高降幅百分之九十九,输入缓存命中最低只要两分钱,每百万托更 说出最低两块钱什么概念。以前跑一个 ai 项目可能要花几千块,现在几十块钱就够了。雷军凌晨亲自发文,欢迎更多开发者进入。从二五折到一百分之一,国产大模型正在变成水电煤独立开发者的黄金时代真的来了。

小米 mimo 大模型 api 永久降价,最高降幅百分之九十九五月二十七日,小米宣布对 mimov 二点五系列大模型 api 实施永久降价,最高降幅达到百分之九十九。本次调价不再区分上下文窗口, 同时优化计费方案,同等价格下,开发者可使用的 token 用量提升至原来的五到八倍。雷军也公开表态,欢迎更多开发者介入小米 mimo 大模型,进一步降低 ai 应用的开发成本。

ai 圈在先,降价风暴小米正式宣布密某 v 二点五系列 api 永久降价,最高降幅达到百分之九十九,取消复杂的上下文差别定价,统一计费。同时 token 套餐加量不加价额度直接翻五至八倍,在校用户全额重置额度。 靠着滑动窗口注意力缓存扩容和集群优化三大底层技术硬降成本, tds 还限时免费开发者落地, ai 成本直接砍到底。

太炸裂了!小米这次直接把大模型价格打到了空气价,老用户额度全部充至原来几十万, top 的 额度突然变成百亿级。更离谱的是,小米直接宣布 mini 永久降价,最高降幅百分之九十九,输入百万 top 只要两分钱!你要知道, dbc 个前脚刚把价格砍到四分之一,小米后脚就直接把地板给掀了。但真正恐怖的还不是便宜,而是小米开始完全能 ai, 文字、图片、音频、视频全都能一起理解。以前 deepsea 像文字聊天高手,而现在 vivo 更像全能数字员工。更关键的是,小米这波不是单纯降价,而是在疯狂扩大开发者生态。因为 ai 时代最后拼的不是谁模型最贵,而是谁先把 ai 彻底铺满全世界!

小米的 ai 大 模型 miimo 今天干了一件事,永久降价,最高降幅百分之九十九。你没听错,不是促销,不是限时活动,是直接改价。具体怎么降, miimo v 二点五全系列 api 从今天开始执行新价格,而且不再区分输入长度, 全球同步生效。如果你之前买过 token plan, 还有一个好消息,用量直接提升到原来的五到八倍!什么概念?我自己的实测数据,原来的最贵套餐六百五十九块钱一个月,十六亿 token 对 我来说撑不到一个月。 现在调整之后,最便宜的套餐三十九块钱一个月,给你四十一亿 token。 最贵的套餐呢?直接给到八百二十亿 token, 这不叫加量不加价,这叫龙虾自由。更猛的是,所有当前还在有效期的 token plan 用户,今天凌晨额度全量重置,不管你之前用了多少,直接给你清零重来,按新价格重新算。那问题来了,小米凭什么敢这么降?答案是推理技术的优化。小米技术团队基于 s g land high cash, 完整支持了滑动窗口注意力机制,把 kv cache 在 gpu、 显存、 cpu、 内存、 ssd 之间的数据搬运量压到了优化前的七分之一,可缓存的 token 数量提升到近五倍, 缓存命中率和推理效率都上了一个台阶。再加上专家并行方案和输入长度分桶策略的优化,集群吞吐能力进一步提升, 每个 token 的 服务成本就这么降下来了。说白了,不是小米在亏本补贴,是技术真的跑通了,成本结构变了。另外,之前那个百万亿 token 创造者激励计划,一百万亿个 token 已经全部发完了, 活动提前收官。不过 apache 软件基金会成员的专属福利不受影响,长期有效,历史付费,用户也别急。小米说,未来一周还有惊喜,小米自己说了一话,让更多的人能用到更好的模型,这是 mimo 不 变的使命。你现在用的是哪家的 ai 模型?评论区聊聊,看看谁的成本最高?

谁能想到,大模型圈的风向说变就变,先是阿里字节纷纷砍掉低价编码服务,智普 api 调用价更是暴涨百分之八十三,行业涨价分为拉满。就在大家以为低价时代走到头时, deepsea 突然出手, 大幅下调定价,并承诺永久保价。本以为 deepsea 已经把价格压到行业底线,万万没想到小米紧接着高调下场,直接把内卷拉到新高度。五月二十七日,小米正式官宣米一 v 二点五系列 a di 永久降价,最高降幅居然达到百分之九十九,还取消了复杂的上下文分档计价计费规则同步优化,同等价钱下,使用量直接翻了五到八倍,诚意拉满。特别有意思的是,就在不久前, 小米密码大模型负责人罗福利还公开表态,劝同行别盲目打价格战。话音未落,小米自己就全力加入价格战。不少网友调侃,嘴上说着不要行动,却比谁都积极。面对外界疑问,罗福利还做出了解释,表示小米敢大幅降价,靠的是自研模型架构和顶尖的推理优化能力, 能把运行成本压到极低,这是纯技术实力打底。顺便提醒同行,没有技术储备,千万别盲目跟风。这一套组合拳 真是越品越有看点。这边有人降价有人涨价,那边平台调用榜单的变化更是让人眼花缭乱。就在半个多月前,小米咪们还稳居全球调用榜前列,风透一时无两。可短短两周过后,排名直线下滑,周榜掉到第十四名,月榜更是跌至十六名, 榜单前三席位全被 deep seek 占据。短短两周排名大洗牌,也让人不禁琢磨,低价换来的热度究竟能不能沉淀下真正的用户。短短一个多月,小米从开源模型、百一 token 免费活动,再到跟进永久降价, ai 布局节奏越来越快。对于咱们普通开发者而言,使用成本降低绝对是实实在在的福利。 但放眼整个行业,这场疯狂的价格消耗战已经不再是简单的比拼定价、技术实力、生态布局、成本控制,每一环都决定着企业能走多远。照这个趋势来看,这场大模型混战的终局恐怕会比所有人想象中来得更早。接下来行业还会出现哪些新变化,我们接着看吧。

你平时用的 ai 工具突然涨价了,三十六克,刚爆了,集体涨价,大模型开始找你要钱。但是另一边呢, deepic ipi 永久降价到原来的四分之一,也就百分之二十五,小米咪魔的 ipi 呢,直接降到百分之九十九,接近于白送。 嗯,有些人说啊,涨价就用不起 ai 了,你搞反了。涨价只会让 ai 不 管是国内还是国外,他的竞争越来越激烈,对我们用户是越来越有利的。 很多人也说便宜没好货,但是 deepsea 和 v 四 pro 的 编程能力现在排咱们全球前二。 嗯,也有人说啊,我只用一个工具就够了。但是你要知道,现在是 ai 整的时代, 是多工具结合的时代好吧。嗯, ai 的 价格战逻辑跟当年的云服务一样,巨头呢,烧钱抢用户,普通人呢就抄底。然后目前的事实就是 deepsea 微四 pro 写文案分析数据,小米 mini 的 中文场景优化 以及各开源的模型本地部署成本几乎为零,构成了一个前所未有的低成本 ai 工具矩阵。 嗯,想想当年打车大战,滴滴和快滴的烧钱时,打车几乎是不要钱,而且还会反米。今天的 ai 价格战,本质上呢,是一样的逻辑,大厂在慢慢的培养我们用户的习惯, 一边是大模型公司集体涨价要求,一边是 deepsea, 小 米主动降价,说明这个市场远还没有到收割阶段,竞争才是用户最大的利好。 对于我们做电商的十亿人来说,这一波价格战意味着我可以用几乎零成本的试错所有的 ai 工具,找到最适合自己的工作流,比方说 open globe 或者是 how much asian? 嗯,如果说是你用完之后市场已经成熟了,但是你已经是老手了。所以说推荐兄弟们可以去注册一个 deepsea ipi 或者是小米的 ipi, 你 可以充个十块钱,够用你一个月啊。如果说你编程的话可能会多一点,但是的话, 呃,正常使用一个月足够了,对比着用找一下差异。好吧,这一期呢?呃,就讲这么多,再见兄弟们。

各位观众早上好,今天是五月二十八日,欢迎收看 ai 早报。屏幕上是今天的所有内容。 第一条小米咪某官方文档显示,咪某 v 二点五系列 api 已从五月二十七日起永久降价,最高降幅百分之九十九。 这次不是短期活动, token plan 不 加价,用量额度提升到五到八倍,有效期内已购额度也会重置。 官方还解释了成本下降原因,包括 swa 和 sg land high cash 让 kv 缓存传输量接近降至七分之一。第二条 openai 五月二十七日发布 taxai 工程案例,联合 thrive 和 create 用 codex 持续改进真实税务申报流程。 这套系统已经在三十多家会计师事务所试点,本季处理七千份报税,节省约三分之一工时。它当前覆盖一零四零和一零四一税表,人工纠错会回流为 codex 评测任务,再推动模型和产品修正。 第三条 robin hood 五月二十七日上线, a i agent 和 a i agent 接入金融操作。 官方同步开放吹定与 banking mcp 交易策支持独立 agent 账户,并能查看活动记录和盈亏变化。 信用卡策可以设置虚拟卡限额和手动审批。股票交易先以贝塔上线,这会直接考验金融 agent 的 权限边界。第四条 cloud code 五月二十七日发布 v 二点一点一百五十二代码审查、自动修复和 skills 重载是这次更新重点。 code review fix 现在可以把审查发现直接应用到工作区。 simplify 也会调用同一套修复流程, 同时新增 reload skills 和 message display hook 管理员还能限制工具权限并配置插件。市场白名单。第五条腾讯云公告显示, h y 三 preview 和 deep seek v 四 pro 从五月二十七日十点起结束免费公测, 这两个模型转入智能体开发平台正式商用。服务调用会按照模型用量计费,套餐订阅用户可继续抵扣 pu 使用,非套餐用户需要及时切换购买套餐。这是国内平台从公测走向收费的典型信号。 第六条 google 五月二十七日将 preferred sources 接入 ai overviews 和 ai mode, 用户以后可以在 ai 搜索回答里优先看到自己选定的站点。 google 还新增 hylsiety 的 标记和热点文章轮播。 google 称用户已经选择三十四点五万个来源,相关内容点击率约为两倍。 ai 搜索正在重新分配流量入口。第七条 ping identity 五月二十七日发布 agent 企业身份控制平面,目标是给企业 agent 建立权限和审计边界。 它覆盖 m c p c l i a p i 等入口,可以发现 agent 分 配责任并跟踪生命周期。更重要的是,桌面编码 agent 可以 按需获得权限,但不直接暴露密钥,代码提交也能归音到具体 agent。 第八条 talkdesk 五月二十七日面向零售和金融服务推出主动式 ai agent, 零售侧覆盖契购跟进、召回通知、个性化推荐和结账。金融侧覆盖贷款预审、存款转化和早期催收。 它的价值不在通用聊天,而是在把外乎话术和规限制和行业流程做成可部署模板。今天最值得关注的是,模型调用开始降价, agent 正在进入税务、金融搜索、身份治理和客户运营这些真实流程。以上就是今天的 ai 早报。

小米 mini 大 模型又降价了,降价幅度非常大,大家去看一看这个到底性价比高不高?你们说小米没有技术,小米直接有个账号就叫小米技术,不了解的可以去关注去看看。

今天 vr 圈最狠的价格战来自小米 mini 微二点五系列 a p r 从今天开始永久降价,最高降幅达到百分之九十九,而且取消长文本意价,所有上下文统一计费。 旗舰模型 mini v 二点五 pro 的 价格被直接打穿,缓存命中、缓存未命中和输出价格都进入极低区间。更关键的是, token plan 也升级了,六美元到一百美元,四档套餐不涨价,但可用额度提升到原来的五到八倍。 同时,所有仍在有效期内的历史套餐额度全量重置,相当于老用户也直接吃到这次降价红利。另一边,小米的百万亿 tocan 创造者激励计划提前收官, 全球五十四万多人申请,最终二十四万多人获批,一百万亿 tocan 已经全部发完。这说明大模型 api 的 竞争正在从模型参数转向推理成本、缓存效率和开发者生态。 对创业者和开发者来说,问题变了。当模型调用越来越便宜,你会把哪些 ai 应用重新做一遍?关注我,并在评论区留下你的判断。

随着大模型应用从概念走向普及,企业级调用成本成为开发者关注的核心痛点。近日,小米正式宣布下调 mimo 大 模型系列 api 调用价格,通过成本优化与算力调度升级,进一步降低中小开发者、 初创企业接入 ai 能力的门槛,持续推动通用人工智能落地。此次调价覆盖对话生成、 内容创作、多模态理解等主流服务接口,不同参数版本均有不同幅度降价。面向清亮场景的基础模型降幅更为明显,能够满足文案拣写、 智能问答、简单逻辑推理等高频清亮需求,适合个人开发者与小微企业试水 ai 项目。 除价格调整外,小米同步优化了 a p i 响应速度与调用稳定性,针对高病发场景升级调度机制,减少高峰期延迟与调用失败率。 同时开放更灵活的计费模式,支持按梁阶梯定价,调用量越高,单价越低,有效控制长期使用成本。 在 ai 赛道竞争日趋激烈的当下,价格调整只是表象,背后是小米在自研算力、集群模型、轻量化推理加速等技术上的持续突破。 通过压缩推理成本,企业能够更放心地将 ai 能力融入产品,降低试错成本。此次降价决策不仅提升了小米大模型生态的吸引力,也为行业注入普惠化动力,让更多创新应用借助低成本 ai 接口快速落地。