粉丝1783获赞1.3万

今天给大家介绍一种可以免费养虾的办法,我们打开这个网站, 然后你要先登录,好吧,想办法登录这个网站,然后我们骑到模型这里, 我们找到一些免费的东西。好,现在有那个千玺三点六 plus 的, 有今夜星辰的三点五 flash, 还有这个英伟达的,质朴的都有。好吧,就看你想用哪个。那比如说我们想用前面三点六,那么我们就切到这个 ipi case 密钥这里。 这个我先不管他,现在我们新建一个,你就建一个名字吗?好, 这是蜜柚。好吧,我们点击复制就复制好你的这个蜜柚,之后你可以放到你的那个龙虾那里。好了,我们直接用这个 cherry studio 来验证一下,看行不行。 这里是。呃,首页,然后到设置这里,然后我们在这个模型这边找到 open loop 就 行了,然后我们刚刚刚复制进来了,我们检测一下能不能行。 这里有个免费的。这个 好,这里显示连接成功,我们这里有个三点六,如果没有的话,你就是 点击这里获取模型,你搜一下这里,然后他这里就会有一些他出来的这个带免费的这个后缀的这个模型三点六,然后但还有其他的哈, 看你想要哪个。那 mini max 二点五。好,我们这里我已经给它加上来了, 我们测试一下,我们对话测试看一下。 嗯,随便添加个默认助手,有段时间没用了哈,我们切换成这个模型,我们直接打个字吧。 好,它是能够正常回来的哈, 那同理,你把刚刚复制的这个 api, 你 把这个 api 复制到咱们的那个龙虾的面板上, 配置就能用了。好吧,但是这个免费的模型他有个有个问题,就是说他可能会应答,会超时,以及你的数据是可以被他用来训练的, 这个需要注意一下,但这个只是用来就是咱们想免费体验一下怎么养虾,好吧?至于你要拿来做 webcody 啊,也可以,但是还是建议上国产的那些 open plan 或者 coding plan 付费,但是你可以先免费去体验一下,感受一下什么是养龙虾,什么是 webcody。 哎,可以简单去 去试用一下,你要觉得合适的话,你再再付费就好了。好吧,今天就这个视频就到这里。

miui 口支持添加云端模型,一般来说,填完 u i l 和 key 之后,点击模型名称一栏就会弹出第三方模型列表来供我们选择。如果添加的时候没有弹出列表,很多同学会误以为该模型还没有被 miui 口支持。 这不是大家的问题,只是小米官方文档写的太简陋,不适合小白部署而已,我们来看怎么解决。我们以小米 miui 大 模型为例,我们先进入小米 miui 开放平台,先创建一个 api keys, 并复制保存到记事本。 返回首页,打开 a p i 文档,我们搜索 base url, 找到正确的 a p i 根地址复制保存。 接着搜索 model, 找到对应可用的模型名称,可以看到当前模型的具体名称叫做 mimovide flash 依旧复制保存。 现在我们把得到的 facebook l 和 api key 粘贴回 miloc 的 对应栏目内,而模型名称一栏粘贴我们刚才得到的名称就行,一字不改,一字不能错。保存之后,因为这个模型不支持视觉推理,所以我们指定为规划大模型就行。 返回首页,输入文字测试一下,发现规划大模型能正常跑起来。所以对于任何已经提供了 api key 的 模型,我们都可以通过上述流程添加到迷路口。下期视频我们解决部分摄像头总是处于离线的问题。

你平时用的 ai 工具突然涨价了,三十六克,刚爆了,集体涨价,大模型开始找你要钱。但是另一边呢, deepic ipi 永久降价到原来的四分之一,也就百分之二十五,小米咪魔的 ipi 呢,直接降到百分之九十九,接近于白送。 嗯,有些人说啊,涨价就用不起 ai 了,你搞反了。涨价只会让 ai 不 管是国内还是国外,他的竞争越来越激烈,对我们用户是越来越有利的。 很多人也说便宜没好货,但是 deepsea 和 v 四 pro 的 编程能力现在排咱们全球前二。 嗯,也有人说啊,我只用一个工具就够了。但是你要知道,现在是 ai 整的时代, 是多工具结合的时代好吧。嗯, ai 的 价格战逻辑跟当年的云服务一样,巨头呢,烧钱抢用户,普通人呢就抄底。然后目前的事实就是 deepsea 微四 pro 写文案分析数据,小米 mini 的 中文场景优化 以及各开源的模型本地部署成本几乎为零,构成了一个前所未有的低成本 ai 工具矩阵。 嗯,想想当年打车大战,滴滴和快滴的烧钱时,打车几乎是不要钱,而且还会反米。今天的 ai 价格战,本质上呢,是一样的逻辑,大厂在慢慢的培养我们用户的习惯, 一边是大模型公司集体涨价要求,一边是 deepsea, 小 米主动降价,说明这个市场远还没有到收割阶段,竞争才是用户最大的利好。 对于我们做电商的十亿人来说,这一波价格战意味着我可以用几乎零成本的试错所有的 ai 工具,找到最适合自己的工作流,比方说 open globe 或者是 how much asian? 嗯,如果说是你用完之后市场已经成熟了,但是你已经是老手了。所以说推荐兄弟们可以去注册一个 deepsea ipi 或者是小米的 ipi, 你 可以充个十块钱,够用你一个月啊。如果说你编程的话可能会多一点,但是的话, 呃,正常使用一个月足够了,对比着用找一下差异。好吧,这一期呢?呃,就讲这么多,再见兄弟们。

我去,小米 miimo 大 模型官宣永久降价,最高降幅百分之九十九,从五月二十七日起,小米 miimo v 二点五系列的 api 永久降价, token plant 计费体系优化,用量提升至原来的五到八倍。这个是真不得了了, 我最近一直没怎么用小米的米某,就是因为这家伙相比 deepsea 这些是挺贵的,没想到今天开始大降价。昨晚我又刷到了那个马卡雄的视频,在那里大吹特吹。大模型没啥用,卖卡才是王道,说什么只有 seedance 才有竞争力, 哎。说实话,在这里我很真诚的告诉大家,包括对面那些姓马卡熊的人, ai 时代真的是不一样,你们千万不要相信这种脑残无知的言论,也许对面很多网友像我一样啊,年纪不小,但是你们肯定也有小孩, 你们可以无视 ai, 认为 ai 只能聊聊天啊,最多就是做做视频,但是你们一定要让你们的孩子尽早去使用 ai。 我 说的是使用, 不是聊天这种,而是把 ai 当工具用在解决实际问题当中。很多人都说 ai 时代到来啊,人人都能用 ai 干事业, 其实这是对 ai 最大的误解, ai 的 到来只会拉大专业和非专业之间的一个鸿沟。 ai 是 放大器,你自身的能力越强,你和别人的差距也越大。年纪大点的可能已经思维固化,很难去接受新事物了, 但是一定要推动你们的孩子尽早用上 ai, 你 们可以跟不上,但是如果你们的孩子未来也跟不上的话,那才是最大的问题。我们家两个孩子每天都在用,老大因为学习紧张呢,更多的是用来辅助学习。老二才九岁,但是已经在用 ai 来制作游戏了,虽然界面很难,但却是他自己一手一脚做出来的。 现在的孩子小,用 ai 做什么其实不重要,重要的是学会用 ai, 学会提需求,学会发现问题并解决问题,这才是关键。对面那些相信马卡雄的人,你们自己信他无所谓,千万别让你们的下一代以后也相信这种货色。

今天 vr 圈最狠的价格战来自小米 mini 微二点五系列 a p r 从今天开始永久降价,最高降幅达到百分之九十九,而且取消长文本意价,所有上下文统一计费。 旗舰模型 mini v 二点五 pro 的 价格被直接打穿,缓存命中、缓存未命中和输出价格都进入极低区间。更关键的是, token plan 也升级了,六美元到一百美元,四档套餐不涨价,但可用额度提升到原来的五到八倍。 同时,所有仍在有效期内的历史套餐额度全量重置,相当于老用户也直接吃到这次降价红利。另一边,小米的百万亿 tocan 创造者激励计划提前收官, 全球五十四万多人申请,最终二十四万多人获批,一百万亿 tocan 已经全部发完。这说明大模型 api 的 竞争正在从模型参数转向推理成本、缓存效率和开发者生态。 对创业者和开发者来说,问题变了。当模型调用越来越便宜,你会把哪些 ai 应用重新做一遍?关注我,并在评论区留下你的判断。

这次小米米墨的新 token 盘,最容易让人误会的是单位你看到的四点一币,不是四点一币 token, 而是 credits。 真正能跑多少,要看你用哪个模型,以及这段 token 是 缓存命中未命中输入还是输出。 按官方文档约度,套餐分四档, lite 是 三十九元四点一 b 酷热 ipad standard 是 九十九元十一 b gridadius pro 是 三百二十九元三十八 b gridadius max 是 六百五十九元八十二 b gridadius。 表面看很大,但要继续往下换算, 真正的计费公式在这里,它 movie 二点五 pro, 每个缓存命中 token 扣二点五 credits, 未命中输入 token 扣三百 credits, 输出 token 扣六百 credits。 普通迷迷模糊二点五跟 d 分 别是二一百和二百 credits。 官方给了一个很好懂的例子,如果你买那一套餐,一共有四点一 bp 转一次,你用掉十 m 的 迷蒙 mo, 二点五 pro 未命中输入 token, 就 会消耗三千元回资,剩下的额度就只有一千一百元回资。 所以官方说用量提升五到八倍,并不等于任何场景都无脑多五到八倍缓存命中多输入能赋用输出,别太爆情感就会更划算。如果你是涨让五 d 缓存输出很多,那科技消耗会快很多。 还有一个边界要看清, token plan 是 面向 i 编程工具的订阅方案,不是给你随便接近自定义后端做自动化脚本的普通 api 套餐额度用完后系统会停止服务,不会继续扣你的赠金或账户余额。 最后给一个买钱判断,第一,你是不是主要拿它跑客厅工具?第二,你的任务缓存命中高不高?第三,你的输出 token 会不会很多?把这三件事算清楚,才能判断 token 盘是真便宜还是你应该继续走普通暗恋 a p i。

ai 圈在先,降价风暴小米正式宣布密某 v 二点五系列 api 永久降价,最高降幅达到百分之九十九,取消复杂的上下文差别定价,统一计费。同时 token 套餐加量不加价额度直接翻五至八倍,在校用户全额重置额度。 靠着滑动窗口注意力缓存扩容和集群优化三大底层技术硬降成本, tds 还限时免费开发者落地, ai 成本直接砍到底。

小米的 ai 大 模型 miimo 今天干了一件事,永久降价,最高降幅百分之九十九。你没听错,不是促销,不是限时活动,是直接改价。具体怎么降, miimo v 二点五全系列 api 从今天开始执行新价格,而且不再区分输入长度, 全球同步生效。如果你之前买过 token plan, 还有一个好消息,用量直接提升到原来的五到八倍!什么概念?我自己的实测数据,原来的最贵套餐六百五十九块钱一个月,十六亿 token 对 我来说撑不到一个月。 现在调整之后,最便宜的套餐三十九块钱一个月,给你四十一亿 token。 最贵的套餐呢?直接给到八百二十亿 token, 这不叫加量不加价,这叫龙虾自由。更猛的是,所有当前还在有效期的 token plan 用户,今天凌晨额度全量重置,不管你之前用了多少,直接给你清零重来,按新价格重新算。那问题来了,小米凭什么敢这么降?答案是推理技术的优化。小米技术团队基于 s g land high cash, 完整支持了滑动窗口注意力机制,把 kv cache 在 gpu、 显存、 cpu、 内存、 ssd 之间的数据搬运量压到了优化前的七分之一,可缓存的 token 数量提升到近五倍, 缓存命中率和推理效率都上了一个台阶。再加上专家并行方案和输入长度分桶策略的优化,集群吞吐能力进一步提升, 每个 token 的 服务成本就这么降下来了。说白了,不是小米在亏本补贴,是技术真的跑通了,成本结构变了。另外,之前那个百万亿 token 创造者激励计划,一百万亿个 token 已经全部发完了, 活动提前收官。不过 apache 软件基金会成员的专属福利不受影响,长期有效,历史付费,用户也别急。小米说,未来一周还有惊喜,小米自己说了一话,让更多的人能用到更好的模型,这是 mimo 不 变的使命。你现在用的是哪家的 ai 模型?评论区聊聊,看看谁的成本最高?

说个轻松点的话题,豆包收费了,标准版六十八块一个月,加强版两百块,专业版五百块,最高年费五零八八。消息一出呢,热搜骂了整整三周啊,豆包笨,还收费啊,也跟着上了热搜,连人民日报都下场评论了。 但最魔幻的啊,不是豆包收钱了啊,同一周呢,这个 deepsea 呢,把这个旗舰模型价格砍了百分之七十五,小米更狠呐,这个字眼大,模型直接就打了个零点一折,降价百分之九十九。 同一天,这个麦塔呢,也出了付费订阅啊,七点九九美元一个月,那同一时期啊,有人涨价,有人打骨折啊,有人抄作业啊,这个到底是怎么回事呢?哎, 新闻看热闹,严哥看门道。今天就聊聊啊,这个国产 ai 的 免费午餐啊,为什么到头了,以后啊,咱们用 ai, 它到底要不要花钱啊,以及呢,这件事,它背后藏着一个大部分人没注意到的行业秘密。 先说这个豆包收了什么钱啊,就五月四号呢,这个豆包在苹果商店悄悄上线了这个付费声明,官方说呢,就基础功能啊,永久免费啊,像什么日常聊天呐,写文案呐,查资料啊,翻译啊,这些呢,一分钱不 收啊,但收钱的呢,只有像 ppt 生成啊,数据分析啊,影视制作啊,这这些吃算力的活,相当于啊,简装免费,精装加钱啊,这个逻辑没毛病啊,但问题来了,就为什么偏偏是现在呢啊, 因为啊,账算不平了,那个传统产品呢,它有个铁律,就是生产的越多啊,单个成本就越低。你像造这个一百万辆车,那每辆的成本,它肯定比造一万辆车要便宜, 但是 ai 不 这样,就你多用一次豆包,它的服务器呢,就会多转一圈啊, gpu 呢,就可能多烧一度电,这用户越多,总成本就越高,而不是越低。 这可能是整个 ai 行业最反直觉的一个事实啊,那豆包每天消耗一百二十万亿个头肯啊,什么概念呢?两年前啊,他刚上线的时候呢,就只有现在的千分之一, 但如果按行业公开的价格粗略的算的话,那光输入成本啊,就每天就要三到五个亿了。那自洁自己啊,有这个自研芯片和推理优化啊,那个实际呢,这个成本呢,肯定会低一些,但就算打个折啊,一年免费用户啊,也要烧掉几百个亿。 那自结呢,二零二五年 ai 算力呢?采购花了是九百亿,二零二六年呢,计划再砸八百五十亿来买芯片,这个总的 ai 预算呢,这直接就干到两千亿了,结果呢,你看净利润啊,是跌了超过百分之七十,这账啊,谁算谁头疼啊。 所以啊,这个豆包收费啊,与其说他是想赚钱啊,不如说呢,他是再不收钱就撑不住了更合适。但 有意思的是啊,这个豆包它宣布收费之后呢,这不到一个月啊,就另外两家就反向操作了。五月二十二号,在 deepsea 宣布旗舰模型 v 四 pro 啊,就永久降价百分之七十五,因为之前它是限时优惠的啊,发现反响太好了,这干脆就永久化了。 那五月二十七号呢,这个小米跟进啊,就自研大模型咪某 v 二点五啊,最高降价百分之九十九。那然后啊,同一天,这个麦塔呢,就推出了 ai 付费订阅,七点九九美元一个月,跟这个豆包是一模一样的路线啊,就是基础免费啊,高级收费。 这不是巧合,是整个 ai 行业走到了同一个分水岭。那这个价格到底是该涨还是该降呢?答案呢,可能会出乎你的意料,两边都对啊,因为啊,降的和涨的,它根本就不是同一个东西。 你要 type c 和小米啊,它降的是什么呀?是 api 调用价格啊,面向的是开发者和企业。那这些 b 端客户呢,要的是便宜好用的接口啊,你降的越狠,他们用的越多啊,这个用量上去了,生态就起来了。 那这跟亚马逊当年卖那个 kindle 啊是一个道理啊,就硬件几乎是不赚钱的,靠,就靠那个卖电子书啊赚钱。那豆包和这个麦塔呢,它涨的是什么呢?是 c 端增值服务, 面向呢,是用 ai 做 ppt, 写深度报告啊,做视频的专业用户。一次这个 ppt 生成呢,可能就顶这个几百次,甚至是上千次的普通聊天了。那这种重度场景吃蒜粒,那吃的是真吓人, 不收钱你根本就扛不住。所以啊,你会发现这个降价和涨价同时在发生,就一点也不矛盾。一个呢是拿降价抢这个企业客户建生态。一个呢是拿这个收费啊,养活自己,保服务,两条路殊途同归啊,都是为了让这个 ai 呢活下去,因为啊, ai 它不可能永远烧钱的。 你看这个 open ai, 年收入一百三十亿美元,这国内就更惨了,大部分这个 ai 公司啊,连收入可能都还没有, 企业得活下去啊,你要活下去,才能持续的迭代这个模型才能越来越好用,才会对所有人都有利啊。那对咱们这个普通用户有什么影响吗?哎,短期看呢,是基本没有豆包说了啊,这个基础功能永久免费啊,那至于这个永久它是多久,那就不知道了, 但有了付费用户分摊成本啊,是不是这个免费版哎,反而可能啊,能更持久一点呢,那中期来看呢,就可能会有变化,就如果这个更多的厂商跟进收费的话,那免费版的功能啊,可能会慢慢的收窄了, 也就是变少,就跟啊,这个视频网站一样,那免费能看,但有广告啊,这个高清要钱啊,独家要钱。当你有了 vip, 你 会发现还有 vvip, vvip 等着你呢, 那整不好 ai 呢,也大概率会走这条路啊。那其实呢,现在的情况啊,我认为是这国产 ai 它到底该不该收钱,收多少钱,连他们自己也没想清楚呢。 但有一点是确定的,就是以前靠免费抢用户这条路算是走到头了,那接下来怎么走啊?可能比这个技术本身更值得我们看了。那对于咱们来说呢,就是该薅的羊毛啊,还得继续薅啊,该花的钱呢,等真正需要的时候啊,再花也不迟。新闻看热闹,严哥看门道,关注看懂经济科技与国家发展。

先说结论,小米 miimo 确实降价了,而且降的不少,但降幅百分之九十九这个说法,咱们得打个问号,因为没人知道它原来到底卖多少钱。 credit 是 怎么回事? 小米搞了个中间层,叫 credit, 你 先买套餐,比如三十九元,一个月给你六千万个 credit, 然后用的时候按 credit 扣。降价之前, pro 模型要扣两个 credit, 长文本甚至要扣四个。 降价之后,小米说取消了四倍 credit 的 计费方式,但具体 pro 模型现在是扣一个还是两个,官方没说清楚, 直接看价格更实在。小米公布了 token 价格,输入缓存命中零点零二五元每百万 token 输入缓存为命中三元每百万, token 输出六元每百万 token 输入只要两分五厘钱就能买一百万个 token。 和 deep seek 比怎么样?巧了, deep seek v 四 pro 的 价格完全一样。小米这是明摆着对标 deep seek, 价格完全对齐, 那到底降了多少?小米说最高降幅百分之九十九,如果这是真的,那原来 pro 模型的输出价格应该是六百元每百万 to 肯左右。 但问题是小米从来没公布过原来的官方价格表,所以百分之九十九降幅这个数字只能信一半。 普通人该怎么选?如果你追求简单透明,小米和 dipsic 价格一样,选哪个都行。如果你担心被套路,别买套餐,直接按量付费,这样就是明确的价格,没有 credit 换算的弯弯绕。 最终结论,小米 mimo 降价是真的,价格也确实便宜,但降幅百分之九十九的宣传,因为缺乏原价数据,没法完全验证,和 dipsic 比价格完全一样。 credit 机制有没有猫腻?官方没把降价后的换算比例说清楚,这是个隐患。

最近看到很多人说小米的大模型还有 deepsea 大 模型很贵,打个你好就要花不少钱。但我不是这样的,我某天用 deepsea 跑了,一点一,一个 token 花费十三点二三元,算下来,每百万 token 只要零点一一九元。 还有一次用小米的大模型花了三千五百万 token, 按照小米米某月卡最低档三十四块多的价格来算,这三千五百万 token 花费四点八元,每百万 token 零点一三七元,确实是大降价。 我花一分钟把这个事说清楚。 ai 大 魔仙收钱,分三块,缓存位命中、输出,缓存命中。你第一次发一段内容给 ai, 他 得从头读一遍,完整算一次。这个过程叫缓存位命中,价格是三块钱,每百万投坑。但同一段内容你再发第二次,第三次的时候,系统发现你发的东西和之前一模一样,他就不重新算了,直接从缓存里调,结果这个过程叫缓存命中。 缓存命中的价格是多少?零点零二五,差了一百二十倍。所以那些说打个你好就花了多少钱的人,测试的是什么场景? 第一次到 a p i 发一句你好, ai 回复全程缓存未命中,这当然很贵。简单来说就是你让 ai 听一本书, ai 第一次读会花不少钱,因为这对 ai 来说是新内容,每百万头啃三块钱。但之后再让 ai 根据这本书的内容和你交流,就是旧内容了,每百万头啃零点零二五元。现在你明白了吗?打个你好测试花了多少钱没有意义。

就在刚刚,小米没摸 v 二点五系列 a p i 宣布永久降价,最高降幅达到百分之九十九。第一,单价报价 v 二点五 pro 输入缓存命中,只要零点零二五元每百万 hokken。 第二,取消上下文窗口分级,长窗口和短窗口一个价,计费规则肉眼可读。第三, 存量用户的额度全量重置,办新规则重新跑,等于老用户也吃满这波红利。大模型厂商普遍还在算怎么把推理成本摊回用户头上,小米反手把利润空间自己先砍掉,背后撑腰的是推理系统的底层优化和团队基础红利。

今天凌晨呢,小米旗下的大模型 miimo v two pro 宣布降价,说法是最高降幅百分之九十九,但实际情况呢,是和 deepsea v 四 pro 的 价格是完全一样。而 miimo 的 v 二点五,它的所谓的 flash 模型跟 deepsea v 四 flash 呢,价格也是几乎完全一样。 这个价格呢,基本上已经属于跌到脚踝了,因为 deepsea 在 周末刚宣布把它的 v 四 pro 模型呢,原本限是二点五折的优惠的永久化,这种地板价的价格呢,以我们自己的附属的, 呃,接下来看呢,基本上只是电费和一些运营费用。那 dips 为什么价格能降那么低呢?也是因为它做了一系列优化,比如说 m o e 架构,比如说 k v k 式压缩,比如说投机解码和多头痕的预测, 包括缓存的复用量化和低精度的部署。这些呢,我在前面几期的视频号上都分享过。当然呢,即使把这些都做完之后,也没法做到现在的报价。所以呢,更可能的原因是 dips 呢,已经通过 公司二方科技提供了硬件的自主权,就拥有了所有的 g p u, 所以呢,已经作为沉没成本,而他只是要覆盖他的运营成本,就是电力和运营费用而已。那 d p c 的 长期逻辑是 agm, 所以 他把价格压到这么低的核心的目标是把电容量做起来,能成为全球使用量最高的模型公司之一。目前从 oppo rata 的 收益来看,确实也是这么 回事。小米呢,可能是更加激进一点,因为小米的核心的利润并不来自于大模型,而模型呢,又是他在二手市场上讲故事的很重要的支点,所以呢,他愿意以不盈利的方式持续亏损作为战略性投入 来获取时长的声浪。同时呢,因为他在生产店中的站位,未来的手机、汽车、 iot 机器人这些终端都需要低成本的模型,与其采用别人家的,不如用自己的模型。所以呢,虽然两家的降价逻辑并不相同,但是结果指向了同一价格, deepsea 先动,小米 mimo 贴身跟上。问题在于,这个价格一旦被这两家公司同时铆定,就很难再往上走了。所以呢,结论就是,那些能力不如 open ai and fava, 价格又打不过 deepsea, mimo 的 中间场上可能会率先被挤压出海桌,国内资源大冒险的大厂以及模型创业公司,迟早都要被拉出来表个态,到底是否跟进? 而这个价格战呢,目前还没有波及到市场。另外一端就是预参加 g p t cloud 和 jimmy, 原因呢,是市场正在分层,对于价格敏感的开发者跟中小企业,会被 deepsea 跟 mmo 低价带走。但是对合规性多模态能力,包括编程能力有特定需求,大客户 暂时可能还会留在国家区间,但是这个用户呢,其实比较有限,而且呢,集中在欧美国家和发达国家。所以接下来呢,大模型市场可能会分成两个阵营,一端是集低价的基础设施层,负责提供便宜稳定可 规模的头肯。另一端是高溢价偏能力层,继续卖最强推、最强 a 阵、最强多模态和企业级安全能力。而两端都够不着的场上既没有成本优势,又没有能力避雷,大概率就是人出局 了,而即使是短期油箱的分层,随着模型技术能力的提升,低价格的模型并表示能力回差,反而呢,可能会不断的升级,不断侵蚀所谓的高溢价高能力的模型。所以呢,未来的市场份额一定会被低价甚至免费的模型占住,而所有的其他模型会竞争的百分之十的最复杂的应用场景。

还记得上个月 deepsea 降价,今天小米跟进了。五月二十七日,小米旗下咪蒙大模型发布公告, v 二点五系列 模型 api 永久性降价,最高降幅百分之九十九。更狠的是不再区分上下文窗口长度。 token plan, 即费油化,同等价格下用量提升值原来的五到八倍。从 deepsea 到小米,咪蒙 a 大 模型降价已经成了二零二六年的主旋律。为什么?嗯,因为真正的科技不是用来炫耀参数的,而是要让每个人都能用得起。科技不是高高在上,得大众才是王道。关注我,带你看好牌怎么打!

一分钟了解全球 ai 大 事。第一条统治 ai 十年的 transformer, 被联合发明人送上被告席,就金山举办一场擂台式 ai 架构辩论, transformer 联合发明人 lucas kaiser 为其辩护,另一联合发明人 lily and johnson 等三位专家组成后, transformer 挑战方 直指 transformer 五大架构死穴,围绕 ai 下一代架构展开激烈交锋,堪称近十年 ai 架构领域最重磅论战。第二条小米明谋 a p i。 永久降价百分之九十九,雷军宣布三年投六百亿 小米宣布 mayo v 二点五系列大模型 a p i 全球永久降价,最高降幅达百分之九十九,同步优化计费体系。 同日曝露的二零二六年 q 一 财报显示利润大幅下滑,但雷军仍坚定加码 ai, 宣布未来三年 ai 投入六百亿元。第三条 python 逆天改命,开源 harmis agent 六比五击败 openai 原子编写的 codex, 上演 python 解释型语言逆袭 rust 性能语言的逆天改命时刻。 第四条马斯克甩出 ai 编程双王牌 rock build 的 上线加一点五 t 参数 rock v 九即将登场。马斯克旗下 x ai 接连打出 rock build 的 编程智能体与 rock v 九大模型两张牌, 正式发力 ai 编程赛道,追赶 cold code、 openai、 codex 等对手。第五条 ai token 中转站爆火, open router 半年流量暴涨五倍。 ai 模型 a p i 聚合平台 open router 完成一点一三亿美元闭轮融资, 由谷歌母公司 alphabet 旗下 capitol g 领头,英伟达、 a 一 六 z 等参头,估值从五点四七亿美元飙升至十三亿美元,一年翻倍。

各位观众早上好,今天是五月二十八日,欢迎收看 ai 早报。屏幕上是今天的所有内容。 第一条小米咪某官方文档显示,咪某 v 二点五系列 api 已从五月二十七日起永久降价,最高降幅百分之九十九。 这次不是短期活动, token plan 不 加价,用量额度提升到五到八倍,有效期内已购额度也会重置。 官方还解释了成本下降原因,包括 swa 和 sg land high cash 让 kv 缓存传输量接近降至七分之一。第二条 openai 五月二十七日发布 taxai 工程案例,联合 thrive 和 create 用 codex 持续改进真实税务申报流程。 这套系统已经在三十多家会计师事务所试点,本季处理七千份报税,节省约三分之一工时。它当前覆盖一零四零和一零四一税表,人工纠错会回流为 codex 评测任务,再推动模型和产品修正。 第三条 robin hood 五月二十七日上线, a i agent 和 a i agent 接入金融操作。 官方同步开放吹定与 banking mcp 交易策支持独立 agent 账户,并能查看活动记录和盈亏变化。 信用卡策可以设置虚拟卡限额和手动审批。股票交易先以贝塔上线,这会直接考验金融 agent 的 权限边界。第四条 cloud code 五月二十七日发布 v 二点一点一百五十二代码审查、自动修复和 skills 重载是这次更新重点。 code review fix 现在可以把审查发现直接应用到工作区。 simplify 也会调用同一套修复流程, 同时新增 reload skills 和 message display hook 管理员还能限制工具权限并配置插件。市场白名单。第五条腾讯云公告显示, h y 三 preview 和 deep seek v 四 pro 从五月二十七日十点起结束免费公测, 这两个模型转入智能体开发平台正式商用。服务调用会按照模型用量计费,套餐订阅用户可继续抵扣 pu 使用,非套餐用户需要及时切换购买套餐。这是国内平台从公测走向收费的典型信号。 第六条 google 五月二十七日将 preferred sources 接入 ai overviews 和 ai mode, 用户以后可以在 ai 搜索回答里优先看到自己选定的站点。 google 还新增 hylsiety 的 标记和热点文章轮播。 google 称用户已经选择三十四点五万个来源,相关内容点击率约为两倍。 ai 搜索正在重新分配流量入口。第七条 ping identity 五月二十七日发布 agent 企业身份控制平面,目标是给企业 agent 建立权限和审计边界。 它覆盖 m c p c l i a p i 等入口,可以发现 agent 分 配责任并跟踪生命周期。更重要的是,桌面编码 agent 可以 按需获得权限,但不直接暴露密钥,代码提交也能归音到具体 agent。 第八条 talkdesk 五月二十七日面向零售和金融服务推出主动式 ai agent, 零售侧覆盖契购跟进、召回通知、个性化推荐和结账。金融侧覆盖贷款预审、存款转化和早期催收。 它的价值不在通用聊天,而是在把外乎话术和规限制和行业流程做成可部署模板。今天最值得关注的是,模型调用开始降价, agent 正在进入税务、金融搜索、身份治理和客户运营这些真实流程。以上就是今天的 ai 早报。

主播上个月申请了小米 mimo 百万亿 token 计划,送了主播两个亿 token, 不 出意外的被我全部用完了。该说不说,小米的 token 消耗的是真快,之后主播就转战了 deep x, deep x 是 真便宜, 感谢良胜。突然微信收到密木降价通知,续费直接只要一分钱,不知道是 bug 还是福利, 之前的两亿 token 直接变成了一百四十亿积分了,让主播都不好意思了。 所以出一期视频给小米 mini 宣传宣传。现在的 a p i 价格已经和 deep ckey 一 样了,可以说非常香了, 但是缓存命中率确实不如 deep ckey。 实用体验感我感觉俩家差不太多,卖萌有时候会慢一点,但是和 opace 四点七和 gpt 五点五还是有一些差距,对主播来说是够用了,但是也感谢国内厂商的努力,才让我们用到这么便宜的顶级大模型。


最近 ai 圈的价格战真的是越打越热闹了,上个月啊, deepsea 宣布永久降价百分之七十五的时候,大家已经觉得很便宜了,结果呢,小米昨天直接跟进 mimo v 二点五系列 api 永久降价,最高降幅达到百分之九十九。 那今天我们不聊按量付费的 a p r 价格,咱们聊聊更实在的小米的 top 盘套餐。这次降价,小米把套餐的额度直接提升了五到八倍,什么意思呢?原来三十九块钱一个月的套餐,每月只有六千万的额度,现在呢,直接涨到了四十一亿。 原来九十九块钱的套餐,每个月呢是两亿的额度,现在呢,涨到了一百一十亿。注意啊,小米的额度是用信用点计算的,和 token 的 换算比例不太一样,但是关键是这个量对于我们普通人来说绝对够用了。 说到小米这家公司,我是真的佩服的,小米最擅长的事情就是把那些高高在上的高科技,一点一点的拉到老百姓触手可及的地方,把原本我们用不起用不上的东西,硬生生打到地板价, 从手机到家电,从手环到充电宝,凡是有小米进入的行业,老百姓就能够花更少的钱享受更好的产品。小米的性价比基因啊,已经刻在了他的骨子里。 这一次的 ai 大 模型领域,小米同样把这种风格带了过来。别人卖几十上百的一个月,小米呢,直接三十九块钱给你四十一亿的额度,九十九块钱给你一百一十亿。这不是简单的降价,这是要把 ai 的 门槛彻底砸碎。 所以问题来了,小米这一次跟进 deepsea 的 降价,其他的 ai 公司会跟吗?整个 ai 行业会不会因此陷入到更激烈的内卷竞争当中?咱们拭目以待。但是不管怎么样,厂商打的越凶,咱们消费者来讲就越受益。这场价格战呢?真正能够把 ai 从奢侈品打成日用品, 昨天我还建议大家不要搞本地部署大模型了。今天看了小米的这个价格,我更加坚定了这个观点,花三十九块钱,每个月四十一亿的额度,厂商帮你去做维护,帮你去做升级,帮你保障稳定,不香吗?干嘛非要自己折腾本地部署呢?未来 ai 肯定会越来越便宜,咱们安安心心的享受厂商给到的福利就够了。

随着大模型应用从概念走向普及,企业级调用成本成为开发者关注的核心痛点。近日,小米正式宣布下调 mimo 大 模型系列 api 调用价格,通过成本优化与算力调度升级,进一步降低中小开发者、 初创企业接入 ai 能力的门槛,持续推动通用人工智能落地。此次调价覆盖对话生成、 内容创作、多模态理解等主流服务接口,不同参数版本均有不同幅度降价。面向清亮场景的基础模型降幅更为明显,能够满足文案拣写、 智能问答、简单逻辑推理等高频清亮需求,适合个人开发者与小微企业试水 ai 项目。 除价格调整外,小米同步优化了 a p i 响应速度与调用稳定性,针对高病发场景升级调度机制,减少高峰期延迟与调用失败率。 同时开放更灵活的计费模式,支持按梁阶梯定价,调用量越高,单价越低,有效控制长期使用成本。 在 ai 赛道竞争日趋激烈的当下,价格调整只是表象,背后是小米在自研算力、集群模型、轻量化推理加速等技术上的持续突破。 通过压缩推理成本,企业能够更放心地将 ai 能力融入产品,降低试错成本。此次降价决策不仅提升了小米大模型生态的吸引力,也为行业注入普惠化动力,让更多创新应用借助低成本 ai 接口快速落地。