粉丝9850获赞51.3万

大冒险价格正式开打,小米米某突然官宣大幅降价,最高降幅达到百分之九十九,同时托克帕伦加量不加价标准这一档的用量从原来的两个亿飙涨到一百一十 亿的积分。你没听错啊,一百一十亿翻了五十五倍。兄弟们,其他话不要多说了啊,赶紧去试一下。我靠,这个真的太太,小米太太牛逼了。

ai 短报小米 mini 二点五 pro 大 幅降价,以 deepseek v 四 pro 同价最高降幅达百分之九十九,现与 deepseek v 四 pro 同价 token 套餐同步升级,同等价格下可用 token 量增加五到八倍,计费规则更简单透明, 所有现有用户套餐额度将全额重置。此次降价源于 memo 全站推理优化与服务效率提升,后续将发布技术革克详述细节。 memo v 二点五 tts 限时免费新定价于五月二十六日生效。

欢迎来到 ai 日报,先来看看今天最重磅的新闻!一、小米 mimo v 二点五系列 api 价格永久下调,最高降幅达百分之九十九,现与 digic v 四 pro 同价 token 套餐同步升级,同等价格下可用 token 量增加五至八倍。计费规则更简单透明, 所有现有用户套餐额度将全额重置。此次降价源于 mimo 全站推理优化与服务效率提升,后续将发布技术薄册讲述细节。 mimo v 二点五 p t s 限时免费,新定价于五月二十六日生效。二、 color 平台限时半价使用 queen 三点七 max 模型,如果你是新用户,你每天还能获得一百次免费模型调用 自动应用无需领取、无需开关,桌面端 jack brains 插件 c l i cutter work 全部覆盖。三、 cloud code 发布 v 二点一点一五二版本更新 核心改进包括斜杠 code review fix, 现在会将审查建议直接应用于工作目录技能与斜杠命令,支持通过 front matter 的 disallow tools 移除模型工具。新增 relo skills 命令,可不重启绘画重新扫描技能目录 session start 钩子,现可返回 relo skills 初重新扫描技能,并可通过 hook specific output session title 设置绘画标题。新增 message display 钩子事件,以变换或隐藏助手消息。其他更新涉及插件市场管理、主模型不可用时自动切换至 four back model、 绘画用量统计优化等。 同时修复了终端样式退化、沙箱警告显示、思考摘药 m c p 服务器去重远程绘画连接及多种绘画卡顿问题。四、 ko 的 w cloud 伦敦活动上, andropica 宣布了 cloud manage agents 的 两项新能力,自托管沙箱和 m c p 隧道贝塔版本。 这两项功能使 ai 智能体的工具执行环境与企业私有网络内的 m c p 服务器连接,均可运行在客户自有基础设施或指定托管服务商处。 活动还介绍了如何通过 cloud code 优化思维预算以及模型努力级别来提升开发体验。目前包括 spotify、 a 四四和 lagola 在 内的客户已在使用这些新功能。五、 cloud code 推出安全漏洞识别插件,可在编辑代码时帮助识别和修复漏洞。 所有 cloud code 的 用户均可使用,可以从插件市场 plugins 安装。六、阿里云在阿里云在每一层的全站能力认可,其是首个将整个平台围绕智能体范式进行构建的云服务商。 七、我国将加快研究推进人工智能健康发展综合性立法、低空经济立法等。八、阿里云宣布以白金会员身份加入 pattorche 基金会,作为 ai 基础设施全球领导者。阿里云是开源模型家族矿的缔造方,以在多样化硬件上大规模运行 pattorche, 将为社区带来生产级工程经验。 九、消息称,沟通与字节跳动达成 a i a c 芯片合作,采购量在数百万颗级别。十、 andropic 宣布认命批央卓为韩国代表董事,已支持其即将在首尔开设的办公室。根据 andropic 的 经济指数,韩国是 cloud ai 全球最活跃的市场之一,其使用率超过人口规模预期的三点五倍,主要用于技术和创意领域。 pianchoi 此前曾担任 snowflake 韩国区总经理,在 google、 cloud、 adobe 等公司拥有超过三十年的科技行业领导经验。他将在韩国领导市场战略,支持本地企业和初创公司应用 cloud。 例如法律科技公司 lawrence company 及韩国电信巨头 s k telcom 均已在使用 cloud 构建产品。 十一、 entropic 工程师 shoto douglas 表示, cloud missiles 在 周末期间解决了 openai 提出的 irdos 单位距离猜想问题,并给出了一个巧妙简洁的证明。这一成果被描述为人工智能在数学发现领域存在严重超前迹象。 十二、 open ledger 宣布完成由 capitol gdc 领投的一点一三亿美元闭门融资。过去六个月,随着 ai 从实验快速转向生产, open ledger 的 周处理量从五万亿增长到二十五万亿 token, 我 们对未来充满期待。十三、微软亚洲研究院发起全球 ai 价值观挑战赛,承邀哲学、论理、法学和社会科学领域的研究人员共同探索。 十四、马一百零 at antini g i 团队推出 k pop, 用于稳定大规模梦模型的智能体强化学习训练。它用基于二元 k l 散度的自适应野马机制替代了此前 s pop 方法中的固定比例,野马能根据训练过程中的训练推理不匹配程度动态调整。 这一改进使得 r n 二点六 e t。 模型在无需修改基础设施或路由重放的情况下,仅通过纯 r l 训练,在 swbench verify 上取得了超过七十六分的成绩。 十五、规藏发布小红书图文排版 a s q。 集成地图与自动配图 design social cards q 是 一款针对小红书图文常见类别进行优化的 a s q, 其亮点在于为旅行博主集成了地图组建用户输入目的地和线路后, ai 能自动在底图上标记并嵌入图片。根据引用, ai q 完全基于 html 和实拍图片生成,内容不会被平台标注为 ai 生成,并会主动从高质量图片网站寻找对应主题图片以优化图文排版。 十六、 open ai 奥尔特曼称, ai 对 白领冲击不如预期般严重,我很高兴自己当时错了。十七、 google 发布了其多模态模型 gemini 的 视频生成功能使用指南, 该模型可通过 gemini 应用、 google flow 等平台体验。指南包含五项提示词技巧,利用模型已有的现实世界知识进行简洁描述,精确控制文本在视频中的渲染与排版。使用专业镜头指令,如推拉、遥移,像电影摄影师一样调度画面。通过迭代编辑、高效修改视频,以及在生成中直接调整角色的动作、节奏或情绪。 其核心在于通过精准的提示词引导模型生成复杂且可控的视频内容。十八、 eason molly 写了一篇新文章,探讨我们需要保留哪些人类特质,以及哪些可以交给 ai。 其中涉及教育咨询领域的实验,以及最近关于文学奖的争议。 他指出,社交媒体平台上的帖子内容正变得越来越相似,这种趋同现象可能意味着大量内容正在被 ai 生成或同质化处理,引发了人们对于内容原创性与人类独特视角的讨论。 十九、 entropic 通过三重机制控制 cloud 智能体的部署风险,包括用户误用模型、异常行为和外部攻击,其防护策略聚焦于三个层面,通过沙箱、虚拟机和网络出口控制限制智能体运行环境、利用系统提示词和模型训练引导其行为,以及对 m c p、 服务器、第三方插件等外部内容实施细力度全线管理。 文章以 cloud code、 cloud a r 和 cloud co work 为例,讲述了不同产品如何设计对应的隔离架构。二十、 open sans nova 开源了 sans nova u 一 的完整训练代码库,支持其八 b 密集模型与 a 三 b mode 架构。 该代码库使用一个统一的框架,可同时训练多种多模态任务,包括文本到图像生成、图像编辑、交错生成及文本与视觉理解 工程上为大规模训练设计,支持混合并行流势、可恢复数据管线、环境变量驱动配置,以及从一乘以八 g p u s 到多节点群的扩展能力。代码已在 github 开源,采用 apache 二点零协议。二十一、 runway 通过 project luxo 研究发现 ai 生成视频已跨越恐怖谷。 他们向创意生态从业者展示了 derog 等 ai 短片及广告样片,评估显示观众开始关注故事本身而非技术瑕疵。所有作品均由单人团队制作,耗时从三周到四小时不等。 one 位认为这标志着 ai 媒体成熟,当技术足够好以至于隐形观众沉浸于故事时,便实现了这一跨越。 二十二、 google 与 alphabet ceo sundry pry 在 google i o 后受访,回顾了公司为应对 chat gpt 而进行的战队重组与高管调整。 访谈聚焦于新的 gemini 模型及其在产品中的整合,包括全新的智能搜索框与 gemini spark 智能体平台只在让搜索从提供结果转向启动任务。 tiche 讨论了这些变化对开放网络的持续冲击,回应了主持人此前提出的 google zero 概念及来自 google 的 网站流量可能归零,并提及 google 正利用 youtube 视频训练模型以改变视频搜索与缩影方式。 最后,他对 google deepmind ceo dennis hussabeez 关于处于智能起点起步阶段的言论表示认同,并分享了对 a g i。 时间线的看法。今天的日报就到这里,每晚十一点准时更新,日报有用记得关注哦!你的鼓励真的很重要!

ai 价格战彻底打疯了,小米今天直接掀桌子, mymo v 二点五大模型永久降价百分之九十九,雷军亲自转发,输入一百万字只要二分钱!而且人家这个模型本来就是专为智能体时代打造的, 支持一百万上下文窗口工具调用能力笔尖 gpt 五!这意味着什么?以前用不起 ai 的 普通商家,现在成本直接降到了几乎为零!不用你自己买 gpu, 不 用你自己开发对接,不用你养技术团队,我们的 ai 员工正是基于顶尖国产大模型技术打造,专为营销或客量深定制。不用你养技术团队,我们的 ai 员工正是基于顶尖短视频评论区,经 准锁定高一项客户,不用熬夜轮班,智能体全年无休,二十四小时在线,合规专业自动接待,不用手动导流量,抖音微信企为一键打通,客户自动沉淀思域,从引流转化到复购,全流程无人执手,全自动跑通。现在大模型成本降到了地板价,正是你用 ai 员工赚钱的最佳时机!想看真实落地效果的评论区,扣六六六,我立马给你演示!

五月二十七日 gdc 永久降价后,小米入局大模型价格战,一位二点五系列 a p i 最高降幅百分之九十九,取消输入长度区分,平台升级计费体系,原套餐价不变,额度提升五至八倍,存量订阅用户额度同步重置加码。

小米 mini 大 模型又降价了,降价幅度非常大,大家去看一看这个到底性价比高不高?你们说小米没有技术,小米直接有个账号就叫小米技术,不了解的可以去关注去看看。

好戏来了,就在刚刚,小米 mimo v 二点五降价百分之九十九对标 deepsea v 四 pro, token 量还翻五到八倍。两天前, deepsea 刚挥刀,小米就把刀架在了自己脖子上。这不是两家公司的恩怨,是国内对国外 ai api 市场的集体绞杀。 openai 的 定价体系正在被撕碎, tony 从美元计价走向人民币内卷, 当算力成本被压到地板下,真正的竞争才刚开始。不是谁更便宜,是谁能在白菜价里还能活下来。

今天 vr 圈最狠的价格战来自小米 mini 微二点五系列 a p r 从今天开始永久降价,最高降幅达到百分之九十九,而且取消长文本意价,所有上下文统一计费。 旗舰模型 mini v 二点五 pro 的 价格被直接打穿,缓存命中、缓存未命中和输出价格都进入极低区间。更关键的是, token plan 也升级了,六美元到一百美元,四档套餐不涨价,但可用额度提升到原来的五到八倍。 同时,所有仍在有效期内的历史套餐额度全量重置,相当于老用户也直接吃到这次降价红利。另一边,小米的百万亿 tocan 创造者激励计划提前收官, 全球五十四万多人申请,最终二十四万多人获批,一百万亿 tocan 已经全部发完。这说明大模型 api 的 竞争正在从模型参数转向推理成本、缓存效率和开发者生态。 对创业者和开发者来说,问题变了。当模型调用越来越便宜,你会把哪些 ai 应用重新做一遍?关注我,并在评论区留下你的判断。

今天一早上我就看到了 mimo v 二点五系列模型开启的永久降价那而且有意思的是,它降完之后,那价格基本上就跟 deepsea 的 模型价格保持一致了。那因为就我个人体验来说,那 mimo v 二点五对比 deepsea v 四,那单论模型能力的话,两者其实并没有拉开特别大的差距, 那 mimo 唯一的优势也就是比 deepsea 多了多摩态的能力。那但 deepsea 降价之后,那这个价格就被定下来了,那会无形中逼着国内其他模型厂商跟着他这个价格走,那除非你们的模型能够比我强,而且还要强很多。 那从这个角度来看, deepsea 不 愧是国内大模型行业的价格屠夫,那国内公司做模型那也是真的卷。

小米 mini v 二点五十世纪更新,四月二十二日法版,五月二十七日官宣,永久降价百分之九十九,加额度翻八倍,全球同步生效三百一十亿稀疏木易一百万滔肯超长上下文, 文本图像、视频音频全模态原声,支持 pro 版推理效率加缓存提升五倍,数据搬运减至七分之一。业内公认国产第一梯队全模态水桶机,综合最强五端版实测 agent 理解力,顶尖工具调用最强反爬最稳跑数据,抓信息,碾压同行。 破版对标 cloud open 四点六,接近 g p t 无水平开发者,每百万 token 仅五毛钱成本,砍到骨头里。创业零门槛,普通人 ai 绘画、文案编程,视频配音免费玩,语音克隆永久免费,中小团队直接平替进口顶级模型,省钱又好用。

今天这期视频呢,来讲讲小米 mini v 二点五这个大模型的降价情况。现在呢,这个 mini v 二点五它跟 deepsea 已经是一个价格了。 mini v 二点五和 deepsea v 四 flash 是 一个价格,二点五 pro 跟 deepsea v 四 pro 价格一样, 之前我们都说 tbisc 的 价格很便宜,现在小米也便宜了,然后我测试了一下,随便跑了一下 agent, 然后它的缓冲泵动力呢,达到了百分之九十四,九十五,所以说就非常便宜。另外呢,小米有 tocom plan, tbisc 没有,所以说呢,小米现在呢,要比 tbisc 还要便宜一点点, 最低档呢,这个小米是三十九块钱,然后呢,你首次购买呢,有八八折,算下来就是三十四块多一点。然后呢,你可以用大概四十一块钱的 toc 的 量, 然后呢,你在晚上的零点到早上的八点,还有一个八折的额外的一个优惠,哎,所以说呢,你大概算下来就是你第一个月可以用三十四块三毛二买到大概五十一块钱的 talkin 的 这个一个量,所以说就是非常非常划算的。 那么它现在呢,对比来看,跟之前的 talkin plan 对 比来看,就是说呢,涨了大概五十到七十倍,可以说是非常非常良性了。 那今天的零点呢,他还把所有的额度给重置了,我今天上去一看,哎,我额度重置了。小米的大魔镜有两个隐形的好处,它的 v 二点五是多模态,但是这个 deepsea 呢,它就不是多模态。另外一个,它有一个语音的克隆的生成,它都是免费的,不需要花任何钱,所以说,比如说你的视频配音啊啊都不需要花钱的。 那假设呢?假设就是我们做到理论上的百分之九十五的缓存命中,大概这个三十四块钱的这个月卡可以买到 v 二点五五亿多的一个 top, 至少五亿的一个 top。 如果是 v 二点五 pro 呢,至少也能有一个一点九亿的 top, 可以 说是很实惠。 那就我个人来说,我现在主力呢还是 deepsea v 四 pro, 然后呢,我买了一个最便宜的一个小米的一个 mini 的 月卡,三十四块钱。然后呢为为的是什么呢?就是享受他的二点五的这个多模态啊。另外还有一个免费的语音克隆,那一个月三十四块钱还是非常便宜的。那这样呢,就可以覆盖我的绝大多数场景了。

小米 miimo v 二点五大降价百分之九十九,很多大聪明的反应是,不就是降价吗?别家也能做啊?错!真正恐怖的地方,从来不是能不能做,而是敢不敢做!这才是这件事最炸裂的核心。 g l m kimi、 千万豆包这些大模型理论上能不能做缓存优化呢?当然能,甚至我怀疑很多公司可能早早就偷偷做了。为什么? 因为缓存优化这个东西,本质上就是把 ai 已经算过的内容缓存起来,下次再有人问类似的问题,直接读缓存。 那么以前 ai 每次回答问题都想重新做一遍高考数学卷,现在变了,这题老子做过了,直接抄答案,成本一下就暴跌,尤其是配合 ssd 缓存以后,显存的压力会下降的非常夸张。而显存才是一个 ai 公司最贵的东西。 所以问题来了,如果大家理论上都能做,为什么行业价格一直没有崩呢?那是因为没人敢。 你发现没有,现在很多 ai 公司表面上在卷模型能力,实际上拼的是什么?拼的是融资,拼的是利润,拼的是资本。故事 谁都知道价格还能降,但谁都不想第一个动刀,因为一旦有人掀桌子,整个行业的利润都会血崩。结果小米干了什么?别人偷偷优化,小米就直接公开砍价,这才是最狠的地方。 最离谱的是,他现在几乎做到同 deepsea 同价,同样 e m 的 上下文,而且他还有多模态,大家知道这基本上相当于 deepsea 四点一提前发布了。老铁 为什么这么说?因为过去大家一直以为 deepx 这么便宜,是因为他技术带差太大,别人短时间根本追不上,结果现在小米告诉行业不一定哦,别人可能也能做到,只是很多人不愿意降价而已, 因为他直接把整个 ai 行业的底库掀了。原来很多公司的护城河可能根本就不是技术,而是大家默契的维持高价。而小米最恐怖的地方是什么? 不是模型,不是论文,不是参数,他最擅长干一件事,那就是价格战。手机行业他这么干过,家电行业也这么干过,那汽车行业呢?他也在这么干。现在终于轮到 ai 了, 以后 ai 行业最可怕的事情呢,可能不是哪个模型更聪明,而是谁先把 ai 做成白菜价。因为当 ai 成本下降十倍的时候,变化的不是利润,而是整个世界的使用习惯。以前大家问一句 ai 嫌贵 以后可能默认全程挂着 ai, 那 时候真正难受的不是技术差的公司,而是成本明明已经降下来了,却还不敢降价的公司。兄弟们,你们觉得呢?

ok, 朋友们,咱们消费者最喜欢的商战环节随时站到啊!这样 ai 价格战还是随着梁总 deepsea 的 果断开团,以及雷总小米的光速跟团悄然展开。 就在二十七号凌晨,小米发布重磅公告, vivo v 二点五系全系永久降价,最高降幅达百分之九十九。而当我们来看一下价格, 二点五 pro 缓存命中数从原本的两块八降到了现在的两分五,而未命中缓存数从原本的十四块钱降到现在三块钱,而叔叔从原本的四十二块钱降到现在六块钱。我们看到这三个板块上价格,会发现有种莫名其妙熟悉的感觉, 没错,他就是原封不动对标 deepsea 的 输入跟输出价格,一分钱都没有改。这不禁让我想到当年的外卖大战, 各大平台也是大量的发送各种大额补贴,以获取出使用户啊,做原始的用户积累。而小米的各项测试成绩其实在国产的这些 ai 大 模型中还是有一席之地的, 放到国际舞台上的话,确实还是能看到有些明显的差距,但是确实这个差距也在逐步缩小,而现在这个性价比你是不能不考虑进去的,所以都这个价格了,你还要什么自行车呢?所以没啥好说的,干就完了。

各位观众早上好,今天是五月二十八日,欢迎收看 ai 早报。屏幕上是今天的所有内容。 第一条小米咪某官方文档显示,咪某 v 二点五系列 api 已从五月二十七日起永久降价,最高降幅百分之九十九。 这次不是短期活动, token plan 不 加价,用量额度提升到五到八倍,有效期内已购额度也会重置。 官方还解释了成本下降原因,包括 swa 和 sg land high cash 让 kv 缓存传输量接近降至七分之一。第二条 openai 五月二十七日发布 taxai 工程案例,联合 thrive 和 create 用 codex 持续改进真实税务申报流程。 这套系统已经在三十多家会计师事务所试点,本季处理七千份报税,节省约三分之一工时。它当前覆盖一零四零和一零四一税表,人工纠错会回流为 codex 评测任务,再推动模型和产品修正。 第三条 robin hood 五月二十七日上线, a i agent 和 a i agent 接入金融操作。 官方同步开放吹定与 banking mcp 交易策支持独立 agent 账户,并能查看活动记录和盈亏变化。 信用卡策可以设置虚拟卡限额和手动审批。股票交易先以贝塔上线,这会直接考验金融 agent 的 权限边界。第四条 cloud code 五月二十七日发布 v 二点一点一百五十二代码审查、自动修复和 skills 重载是这次更新重点。 code review fix 现在可以把审查发现直接应用到工作区。 simplify 也会调用同一套修复流程, 同时新增 reload skills 和 message display hook 管理员还能限制工具权限并配置插件。市场白名单。第五条腾讯云公告显示, h y 三 preview 和 deep seek v 四 pro 从五月二十七日十点起结束免费公测, 这两个模型转入智能体开发平台正式商用。服务调用会按照模型用量计费,套餐订阅用户可继续抵扣 pu 使用,非套餐用户需要及时切换购买套餐。这是国内平台从公测走向收费的典型信号。 第六条 google 五月二十七日将 preferred sources 接入 ai overviews 和 ai mode, 用户以后可以在 ai 搜索回答里优先看到自己选定的站点。 google 还新增 hylsiety 的 标记和热点文章轮播。 google 称用户已经选择三十四点五万个来源,相关内容点击率约为两倍。 ai 搜索正在重新分配流量入口。第七条 ping identity 五月二十七日发布 agent 企业身份控制平面,目标是给企业 agent 建立权限和审计边界。 它覆盖 m c p c l i a p i 等入口,可以发现 agent 分 配责任并跟踪生命周期。更重要的是,桌面编码 agent 可以 按需获得权限,但不直接暴露密钥,代码提交也能归音到具体 agent。 第八条 talkdesk 五月二十七日面向零售和金融服务推出主动式 ai agent, 零售侧覆盖契购跟进、召回通知、个性化推荐和结账。金融侧覆盖贷款预审、存款转化和早期催收。 它的价值不在通用聊天,而是在把外乎话术和规限制和行业流程做成可部署模板。今天最值得关注的是,模型调用开始降价, agent 正在进入税务、金融搜索、身份治理和客户运营这些真实流程。以上就是今天的 ai 早报。

五月二十七日,小米密墨大模型宣布 v 二点五系列 api 永久降价,最高降幅达百分之九十九。调整后不再区分上下文窗口长度收费 token plan 计费体系也完成优化,在相同价格下,用户可获得原来五至八倍的使用量。

小米 memo v 二点五系列宣布永久降价,最高降幅百分之九十九,且不再区分输入长度。降价后价格和 deepseek 基本一致。小米 memo 真的 香吗?接下来我们进入实测环节。模型使用 memo v 二点五 pro 生成的旅游推荐网站思考五点六秒生成一个圆球,跟随鼠标轨迹思考二点五秒又给了他一个初中数学题测试逻辑推理能力,思考二十六点八秒解答思路正确,答案对得上。不过解析过程稍微麻烦了些, 虽然给出了正确答案,但不是最优解。由于以上测试思考时间都是秒级,大概率缓存命中,为了得到更加真实的结果,进行复杂任务测试,这一次思考时间直接拉到九百四十六点五秒。 通过测试不难发现,咪某中文语境文化适配高推理速度并没有宣传那么快。常练推理,自我纠错不足、隐秘 bug 排查无明确提示时自主思考,落需用户主动引导调整。 所以小米密谋降价后,在大多数常见使用场景下,尤其是缓存命中率高的场景,确实能显著省钱, 但对于输出密集型或低缓存命中率的特殊场景,需根据实际 token 消耗计算,成本没有想象中那么便宜。建议根据自身使用模式,结合套餐额度和实际调用情况,综合评估成本效益。

就在刚刚,小米没摸 v 二点五系列 a p i 宣布永久降价,最高降幅达到百分之九十九。第一,单价报价 v 二点五 pro 输入缓存命中,只要零点零二五元每百万 hokken。 第二,取消上下文窗口分级,长窗口和短窗口一个价,计费规则肉眼可读。第三, 存量用户的额度全量重置,办新规则重新跑,等于老用户也吃满这波红利。大模型厂商普遍还在算怎么把推理成本摊回用户头上,小米反手把利润空间自己先砍掉,背后撑腰的是推理系统的底层优化和团队基础红利。
