最近啊,有个朋友,他问我,小米现在能买吗?我说啊,你先回答我一个问题,你觉得小米是做什么的?朋友就说呀,他不就是卖手机啊,还有那个什么车的,挺火的。 我说,那你再看看他的财报,手机收入只占四成,汽车呢,占两成多,还有 iot, 互联网服务,芯片,机器人等等这些啊,你根本不知道他主要靠什么赚钱的业务。朋友立刻就沉默了,我说啊,这就是问题所在, 小米呢,就像那个你朋友圈里面那个朋友,今天晒健身照,明天晒读书打卡,后天啊,突然说在学烘焙,你看着挺上镜,但你就是想不起来他到底是干什么的,二零二五年小米才不发出来,业绩是好的离谱, 收入四千五百七十三亿,利润呢将近四百亿,汽车业务还赚了九个亿,但股价呢,从六十一块跌到了三十块,市值啊,蒸发了八千亿。 为什么?因为啊,投资者终于看明白了,这家公司把自己啊活成了一个谜。而股市最不喜欢的就是谜。你看小米汽车,首年交付四十一万辆,毛利率百分之二十四点三,比特斯拉还高,从第一辆车下线到赚钱,只用了五个季度, 未来小鹏奋斗了近十年才盈利,特斯拉呢,用了十七年,小米就用了两年。但问题不在于他能不能赚钱,而在于市场不知道怎么给他估值。股价巅峰时呢,市场把小米当做科技股, 市盈率给到了四十二倍,跟英伟达对标,现在呢,市盈率只剩下了十八倍,跟格力美的一个区间,估值啊,直接腰斩。市场在害怕什么? 第一,手机毛利率掉到了百分之八点三,内存涨价还在蚕食利润。第二,汽车虽然赚钱,但二六年竞争只会更惨烈。第三, ai 投入,它就是一个无底洞,三年要砸六百亿。 但是说啊,如果你只看到这些风险,你可能错过了小米正在做的事,它不是在做四个独立的生意,而是向在织一张网。举个例子啊,小米苏七的用户,百分之五十二是苹果用户转化来的, 这些人原本跟小米生态毫无关系,但后来他们买了车之后,下载了米家 app, 发现可以用手机控制车内的空调,查看充电状态,远程预热。用着用着,有人就换了小米手机,因为啊,这样携同的体验确实好。 这不是什么营销话术,是真实发生的用户的一个迁移。再来看数据,小米全球月活七点五四亿, a i o t 平台连接设备超过了十亿台, 这是什么概念?你买了小米手机就有概率买小米手环,买了手环就有概率买小米耳机,买了耳机就有概率换什么呢?小米空调,因为米家 app 里一键控制所有设备,比你装五六个不同品牌的 app 方便得多。 这一套转化链路,苹果有,但苹果不做终端,低端华为有,但华为被变后,海外市场受限,全球能把手机、汽车、智能家居这三件事同时做好的,好像目前只有小米。 再说说看那些看不见的东西,小米自研的三纳米芯片悬界 o y 已经量产了,使手机 b o m 成本降低百分之十二, 这意味着什么?以前小米买高通芯片,价格啊,高通说了算,现在有了自己的芯片,溢价能力完全不同。他自研的大模型 miimo vr pro 拿下了 openroot 平台掉用量周榜第一,开发者真金白银的在用。 还有那个被嘲笑为人形机器人,已经在汽车工厂实习,成功率达到百分之九十点二,未来五年要大批量进场。 这些投入短期看不到回报,但他们在做一件事,把核心技术攥在自己的手里。卢伟兵在财报电话会上说的很直白,只有掌握底层核心芯片能力,才能真正做到长期有差异化的产品体验。这 不是一句空话,是已经落地的战略。五年研发投入两千亿, ai 领域三年六百亿,芯片做了十一年,造车做了四年。现在回到股价的问题, 市场把小米当成硬件制造业来进行估值,看的是单品利率。但小米的真正价值啊,在于用户生命周期价值。一个用户从买手机到买车到买全屋家电到订阅云服务,这个链条能贡献多少收入? 苹果的模式小米在学,但小米的覆盖面更广,价格带呢更低。互联网服务收入三百七十四亿,占总营收的百分之八,但毛利率接近了百分之八十,这意味着什么呀?每收入一百块钱,成本不到二十四块,这才是小米真正的利润蓄水池。 境外互联网服务收入一百二十六亿,占比呢,提升到百分之三十三点八,这说明小米的商业模式正在国际化复制,而不是说只在中国有效。 所以啊,三十块的小米,到底是价值陷阱还是黄金坑,取决于你怎么看他,如果你还是认为啊,他是啥都干啥都不精的杂牌军,那可能觉得现在的估值还是有点贵,但如果你看到他正在构建一个人车家 全生态的护城河,十亿设备,七亿用户自研芯片,年销四十万辆车,那现在的股价可能是一个被严重低估的入口。毕竟呀,全球同时手握这几张牌的公司,你再找找第二家看看。投资有风险,理财需谨慎。我是欧阳少侠,我们下期再见。
粉丝42获赞425

小米的营销是真厉害,我领到这么多算力额度,如果你是 ai 开发者,兴许也听说过小米官宣了咪某 ai 启动百万亿算力激励计划,面向开发者免费发放算力额度。 作为 ai 编程深度使用者,这种官方福利必须得试试。官方审核挺快,提交第二天凌晨一点半就通过了,第二天一早登录,十六亿 credit 的 额度就已经到账。这么多算力, 当然要好好测试一下。我打开 open code, 接入 a p i k, 测试 memo v 二点五 pro 的 编程能力,任务是修复一个软件界面的显示 bug。 memo 处理这个任务花了将近十七分钟,速度偏慢,完成后看控制台三千七百万 credi 的 直接消耗了,就修复一个 react 界面问题,花了三千七百万 credi 官方标注 credi 的 余算力单元的换算是二比一。他请教一下,是我操作问题还是什么呢?有大神解答一下吗?

小米刚发布了二零二六年一季度的财报,九百九十一亿的营收,六十一亿的净利润,汽车八万台,研发九十亿,可以说是经营稳健向前啊。不过如果你最近关注小米港股的话,我相信你应该也会知道,就是小米从去年六月六十一港币的高点跌到现在,可以说是腰斩了。就一家公司,为什么他季度赚了六十一亿,但是股价会跌成这个样子? 为什么有的公司他常年亏损,但是股价照常能起飞?这两者之间到底是什么关系?首先呢,我们来说股价和财报啊,股票价格从来就不是给上一份财报来打分的,而是给公司下一段故事来进行估值的。 市场看的呢,是预期,而不是现在的结果。一家公司财报漂亮,但未来的故事黯淡,那股价会照样跌,一家公司财报亏损,哎,但他的故事依然充满想象,那股价就照样涨。那小米呢,现在其实处于一个相对尴尬的时期, 财报数字本身还说的过去,但市场原本期待他讲那个故事,现在呢,就需要更多时间来兑换。所以读懂这份财报呢,重点不在于数字本身啊,而在于小米哪几块业务是投了钱但还没有回报的窗口期,哪些是之前比较稳,但现在又不急预期了。 首先我们来看啊,九百九十一亿的营收,那去年同期呢,是一千一百一十一,利润是六十一亿啊,对,去年同期是一百零七亿,同比掉了百分之 十三,营收和利润双双下降。上一次小米出现这种情况呢,还得是二零二二年第四季度啊,会出现这个现象,和手机市场的表现啊关系非常大。小米手机毛利率二零二三年的时候呢,还有百分之十 四点六,二零二四年是百分之十二点六,到了二零二五年第四季度就直接掉到了八点三,那这一季度靠均价上涨了百分之八点二,估算的利润呢?回到了九到十个点。 手机毛利率下降原因呢,很多人都比较清楚,就是 ai 把这个内存抢走了,卢伟兵在三月的年报会上呢,把这一轮存储涨价定性为了长周期大涨幅比预判还要激进。 成本上涨就导致了这个售价上涨,售价上涨就导致了销量啊,自然跟着下降。小米全球出货同比下降了百分之十九,中国市场掉的更狠啊, 家机构口径都调到了下降百分之三十五左右。手机说完了呢,汽车呢? q 一 小米汽车交付了八万台,跟去年第四季度的十四万台一比啊,也是环比掉了快一半。但呢,这个不是产的问题啊,首先是一月份啊,新能源购置税退坡,春节也是传统的淡季,外加这一次苏七 在换代期。所以说 q 一 啊,小米汽车销量的数字下滑其实也合理啊,这点我觉得是要理性看待的。那小米汽车 q 一 的均价估算在二十三点七万,比去年第四季度二十五万少了一万多,毛利率呢,从百分之二十二点七一估算回落到了百分之二十左右啊,但这个数字放在整个汽车行业仍然是同步水平。 如果只看这两块呢,这是一份手机承压加汽车换代的财报,小米这一季度其实还做了另一件大动作,就是研发九十亿,同比增长了百分之三十三点四,全年预算投入四百亿,未来三年 ai 投入就要六百个亿, 这是个挺关键的信号啊。这个操劳就属于小米,用现在的利润换 ai 这张更长期的牌。小米的 mini 二点五 pro 这个模型数据还比较漂亮,并且小米呢,也挖来了罗浮丽这种人才。但卢伟兵三月份的年报会上也说了啊,单纯从 ai 的 商业化角度来看,目前的阶段为时尚早。 张云国际算过啊,二零二五年第四季度,小米 ai 加汽车的运营费用就同比上涨了百分之五点九。这个就是我前面说的啊,小米当下比较尴尬的一个位置, 投入看得见,但兑现却需要时间,中间这段窗口期,市场的估值就要先成压,这可能也是小米财报和估价比较割裂的原因所在。那站在不同身份的人该怎么看这份财报呢?哎,如果你是米黑的话,那小米股价短期内确实是很难找回巅峰期,下一个爆发还正经得等一等。 如果你是米粉的话,这份财报告诉了你,小米现在还在加大研发, ai 这张牌已经开始打了,只不过短期内啊,别把嫉妒的财报当成生死状,需要一些耐心。那如果呢?你是一个真正关注小米这家公司本身的人呢?那要看的则是三件事,第一个就是存储涨价到底什么时候见顶, 这个对于小米手机来说非常关键。然后呢,就是汽车毛利率能不能一直稳住在二十个点,毕竟小米预期标准版也出了,而且它必然是走量大头。第三呢,就是咪某这套 ai 体系什么时候能开始正经的商业化变现?这个可能是小米下一个业务比较大的一个增长点,大家伙你怎么看?

小米 mini 大 模型突破一万亿, toon 在 国内算什么水平啊?为何盘古大模型没有公布自己的调用量呢? toon 啊,是 ai 信息处理的最小单元,也可以简单离页为流量,调用量越大,就代表该模型被用户使用的越多。我们来看一下最近一周的国内排名啊,第一呢是千万三点六 plus, 四点六万亿。第二呢就是小米的 mini, vivo pro, 三点零八亿。 所以说呀,小米的一万亿 token 呢,已经达到了国内头部玩家的水平。而华为的盘古大模型呢,它不是单一模式调用啊,而是模型加平台模式,尤其是在工业、医疗、气象、金融、政务等专业领域啊,提供可落地的完整的 ai 解决方案。 他呢,不仅有自己的盘古大模型系列啊,还继承了千万 deepsea 的 模型。就在上周啊,国内大模型调用总量为十二点九六万亿啊,老美呢,为三点零三万亿。我们呢,已经连续五周啊超越老美了, 这个数据啊,说明我们的 ai 产业强大的竞争力,而在这一切庞大数据的背后啊,算力支撑才是七寸, 我们希望啊,除了华为的阿达拉斯之外呢,还有其他公司也加入进来,一起把我们自己的 ai 底座做强做实做大。

不是雷军雷总你半夜不睡觉的吗?啊,凌晨发了一个公告,小米的掏坑拍来重置了。 我的这个之前是十六亿的额度,一觉醒来直接给我干成。这是多少?八百二十亿啊, 不过还没有我的余额多啊,用不完,根本用不完。并且呢,小米的 mini v 二点五 pro 的 模型直接降价啊,最高降幅百分之九十九。 看来它这个策略是完全为了应对那个 deepsea 啊,你们就猛猛竞争吧,让我们早日都用上那一个好用便宜超大碗的模型。

二零二六年四月二十八日凌晨,小米干了件大事,旗下旗舰大模型 memov 二点五全系列开源 n i t 协议随便商用随便改,随便拿去赚钱。 同时启动 orbit 计划,三十天内面向全球免费发放一百万亿 token。 gdp val a a 和 cloudy val 双榜全球开源第一,成本只有国际币源旗舰的百分之二点五。雷军宣布今年 ai 投入超一百六十亿, 评论区瞬间爆了。但最热的问题不是小米牛逼,而是一句反问,华为盘古呢?好问题。今天我们把这件事掰开来讲,因为盘古的故事比 mimo 的 发布更值得聊。 盘古最早亮相是二零二一年,那时候国内大模型赛道还没成型,盘古就以两千亿参数的规模刷了一波存在感。真正的巅峰。在二零二三年,盘古气象大模型登上 nature 正刊。 这不是普通论文,是科学界最高殿堂。它能在几秒钟内算完传统超级计算机要算几小时的天气预报,欧洲中期天气预报中心和中央气象台实测后,都承认它效果更好, 同年入选中国十大科学进展。它是盘古最高光的时刻。然后发生了什么?二零二五年六月,华为在开发者大会上发布盘古五点五,喊了一句非常有辨识度的口号, 不作诗,只做事。这句话本身就是一种战略宣言。盘古不跟你比,写文章、画图、写代码,它要解决的是煤矿里的安全问题,钢厂里的效率问题,银行里的操作问题。但这些事太专业了,专业到普通人根本接触不到。也是二零二五年六月,盘古把 pro mo e 模型开圆了。 开源本是好事,但不到一周翻车了。 q top 上有人做了技术分析,发现盘股的注意力参数和阿里 q 文二点五的相似度高达零点九二七,正常独立训练的模型之间一般不超过零点七。更尴尬的是,开源代码文件里留着版权所有二零二四 q david 玩队、阿里巴巴集团的标注。 紧接着,匿名文章盘古之商出现,自称盘古前成员,爆料团队因算力不够,领导施压,采取了套壳、竞品、模型、续训习水印等手段。华为诺亚方舟实验室否认了,说盘古是基于升腾芯片丛林训练的 部分组建,参考了开源代码,但都合规标注。但这次争议之后,盘股在舆论场上就彻底静默了。很多人的认知就停在了这里,盘股抄袭,盘股不行了。但事实是,盘股根本没有消失,它只是从来没活在你手机里。我们看看盘股现在到底在干嘛? 在煤矿,山东能源集团一托盘股建了全行业第一个大模型平台,覆盖采煤、掘进、机电运输、通风、习选等九大业务系统,开发了一百多个 ai 算法, 主运皮带上的异物识别精度做到百分之九十八,掘进工序的动作规范识别做到百分之九十五,巡检人员减少了百分之二十。你要知道,这是在几百米深的井下,不是实验室。 在钢厂,上海宝武钢铁用盘古做热炸生产线的参数优化,预测精度提高百分之五以上,成才率提升百分之零点五。一年能多出两万吨钢板,增收九千多万。 这不是 ppt 上的数字,是车间里跑出来的。在银行,广东省农信联社用盘股的 ocr 识别手写单据, 准确率从百分之八十三点九提升到百分之九十一。人力从两个人录一个人叫对,变成一个人录一个人叫对单,比业务效率翻了一倍。银行柜员助手把一次业务操作从五步降到一步,时间缩短了五分钟以上。工商银行用盘股做风险防控项目进度监测精度提升了百分之十。 建设银行四千多个网点用盘股辅助办公,日军处理两百多万次咨询,解决率百分之九十二。 在铁路,郑州铁路局,用盘股做车辆故障图像检测作业效率提高了百分之两百,故障发现率达到百分之九十九点三,检测时间压缩了一半。在气象,它本来就是王者, 台风路径预报、降雨预测、深圳地质区域预报模型,这些都是盘股的后花园。在医药 天士,利用盘古学习了三百七十八万篇文献和一千本中医古籍,做成了数字本草大模型, 帮助筛选方剂和发现新药。另有药企的 drug x 项目研发成本因为盘古降低了百分之七十。 在正午,深圳福田区基于盘古做了一网通办、一网同管、一网协同城市事件从发现到分拨,从小时级变成分中级,处理效率提升了百分之五十以上。 三十多个行业、四百多个场景,一千两百多个合作伙伴、两千五百多个 ai 解决方案,这就是盘古消失之后真正在干的事。听到这里,你可能会觉得这些数字听起来不错,但到底有多强,没有对比就没有概念,我们来比一比。先说矿山, 煤矿皮带跑偏,大块煤堵料以前全靠人盯着,一个人盯一条皮带八小时轮班打瞌睡是常态。盘古上去之后,异物识别准确率干到百分之九十八,巡检人员减了百分之二十。这不是实验室数字,是山东能源集团井下跑出来的。 全球范围来看,能把 ai 大 规模部署到井下作业面的大模型,一只手数得过来?谷歌没做过, deepsea 没做过, mimo 没做过? 盘古是全世界少数几个真正让 ai 下了几百米深井的大模型。再说钢铁,宝武钢铁的恶炸生产线温度上千度,参数几十个,以前调一次工艺,靠老师傅的经验, 干了三十年,手一摸就知道大概温度。盘古把这套经验变成了数学模型,精确度提高了百分之五以上。别小看这百分之五,一年就是两万吨钢板,九千万营收。同样是制造业 ai 应用,你去找全球其他大模型在钢厂落地的案例几乎没有, 因为 c 端模型根本处理不了工业场景的高温高压实时性要求。然后是金融,其他大模型在银行的应用大多停留在智能客服聊天层面,盘股干的是票据识别、风险监测、流程优化, 这些是银行真正的核心业务。还有一个数据能说明问题,盘股在一千多个煤矿场景中已经应用了约百分之三十,平均帮企业提升利润百分之十八。百分之十八是什么概念?一个年产值十亿的煤矿,一年多赚一点八亿,这不是叉 g p t 能干的活? 所以盘股跟 memo 跟 deepsea, 跟 kimi 根本不是同一个赛道。 c 端大模型在比,谁能写更好的诗?谁能写更快的代码?谁在榜单上排第一?盘股在比,谁能帮煤矿一年少死几个人?谁能帮钢厂多出两万吨钢?谁能帮银行柜员少点五次鼠标? 一个是谁更聪明,一个是谁更有用?智商比赛和实用比赛比的根本不是同一张卷子。那问题来了,盘古既然这么强,为什么大家不知道?因为他太专业了,你在抖音刷不到盘古,帮宝武钢铁提升成才率百分之零点五这种内容。他不性感, 但他的客户不需要他性感,他的客户需要他好用。一个煤矿老板不会因为大模型上了 nature 就 买单,但他会因为巡检少死了两个人,一年多赚了几千万而续费。这就是盘股消失的真相。 它没有消失,它只是从来不在你手机里。它在几百米深的矿井下,在上千度的炼钢炉旁,在银行柜台的操作系统里,在气象中心的服务器及群里。你做 c 端的热闹,我做 b 端的钞票,各走各路,觉得有收获,点赞转发关注我,继续拆解 ai 圈儿那些没人告诉你的事儿。

那今天想跟大家聊一聊最近这个小米的这个 mimo 模型啊,这个调用量冲到了全球第一,单月贡献了一点四十五万亿 token, 这个是怎么做到的?这个真的挺让人惊讶的,所以我们今天就来聊一聊背后的故事。咱们第一个要聊的就是为什么它能够成为大家首选的这个推理引擎啊?就是它这个 model 本身到底厉害在什么地方? 就是这个 model 它是小米自研的嘛?对,然后它有一个旗舰的版本和一个全模态的版本。它的旗舰版呢是有一点零二万亿的参数,但是它在推理的时候只需要激活四百二十亿。 它的这个全模态的呢,是有三千一百亿的参数,但是它在推理的时候只需要激活一百五十亿,所以它的效率还是很高的。它的这个呃稀疏混合专家的这个技术路线,所以它能够做到非常非常大的模型,但是它又不会在推理的时候把你的资源全都吃光。那这个模型它在这种实际的任务当中表现又怎么样呢?它这个旗舰版呢,在那个 s h v h pro 上面是百分之五十七点二, 已经非常非常接近那个 gbt 五 point 四了。然后它的这个呃 cloud evo pass three 是 百分之六十四,它的这个 token 消耗是比同类的这些大模型都要低百分之四十到六十,它在这个 artificial analysis 的 这个智能指数里面是全球第六, 国内第二。就是它这个实际的任务的完成率是要比这个 g r m 五 point one 和这个 kimi k two point six 都要高的,所以它就是非常非常适合这种 做这个 ai 智能体的这个首选的推理引擎。就说这个 m m o, 它在一些关键的技术点上面,它到底是怎么做到这么强的?它就是用了这个混合注意力机制,它是这个局部的滑动窗口,注意力和这个全局的注意力是交错的,所以它能够既能够 压缩这个 kpi cache, 又能够处理这种超长的上下文,那它这个旗舰版就可以一口气处理一百万 toc, 这确实很夸张啊,这个上下文长度,对,然后它还呃用了这个多 toc 预测,还有这个轻量化的前馈网络,让它的这个推理速度有三倍的提升。它还支持非常多的工具的原声调用,它是跟这个主流的这个开源的框架都是深度集成的,它的 这个多模态的版本还可以处理图片、音频和视频。它的这个中文的 tts 也做的核心的这个模型呢, 就是因为 hermes, 它本身是一个非常追求自进化和这个跨绘画记忆的一个 agent 的 框架嘛。那这个东西其实对模型的要求是非常高的,就是你要有超大的上下文, 然后你要能够非常高效地去记住这些东西,处理这些东西,那正好就是 memo 可以 非常完美地契合,这个听起来是一个天作之合呀,没错没错,而且就是 memo 不 光是在这个任务完成率上面有百分之四十七的提升,在延迟上面有百分之三十二的降低。它还通过了这个 nos portal 给全球的开发者提供了非常方便的免费的接入。 然后它的这个调用的价格只是国际上那些同类的闭源模型的五分之一,所以它就是真正的让这个 ai 智能体变得好用,而且便宜, ok, 对, 所以 这也直接带动了 hermes 的 这个全球的 token 调用量暴涨,对,就它的性价比和它的这个适配度都是非常非常领先的。然后咱们再来讲讲啊,这个 mimo 在 生态布局上面的一些动作啊,就这次这个开源和这个合作,小米到底是怎么玩的?就是最近小米把这个 mimo v two five 这个系列 全部都开源了,然后它是用的是 mit 的 协议嘛,就是你几乎什么都不用受限,就可以全球的开发者都可以非常随心所欲地去下载,去商用,这就一下子就把这个门槛降到了最低,这确实挺大胆的这个操作。然后更有意思的是,它还搞了这个 orbit 一 百 t token 的 这个计划,就是它在一个月的时间里面免费的发放一百万亿的 token 啊,就是 不光是个人开发者,还有这个 agent 框架的团队,芯片的厂商,他们都可以来申请,你就可以得到非常高额的这个额度的免费的投票。而且它是跟这个主流的这个推理框架和七家芯片厂商都是在开源的当天就已经完成了适配,就它整个这个流程就是让你创新的这个团队可以无缝的接入,你觉得就是这一套生态布局的这套操作,小米到底想要呢? 得到什么?其实小米它就是把这个几乎所有的主流的国产芯片和国际上的一些芯片全都拉进来一起适配,然后它就是为了让这个模型可以随处都能用它的这个 orbit 计划的这个海量的 token, 它就是为了吸引全球的这个创新团队都来用它的这个平台,它的这个 mit 协议更是让大家彻底地打消了这个商业化的顾虑。 所以它的重点其实并不是卖模型本身,对,就是它要让大家都用起来,然后它的这个硬件和它的这个 ai 一 起形成一个闭环,它的这个未来的这个商业模式是靠这个开发者和这个硬件的这个结合来进行一个双向的绑定, 它的这个核心还是要抢占这个生态的话语权,而不是说靠我这一个模型来赚钱。最近这段时间就是这个咪某这么大规模的开源,你觉得在行业里面和开发者之间掀起了哪些新的波澜? 就这个短短半个月的时间,这个一百万亿的这个免费的 token 就 已经发出去了八成,然后全球的这个日调用量直接飙到了接近三千万亿。就是这个 oppo rot 上面这个榜单直接就是第一,就是大家真的是用行动在投票。这波确实挺震撼的,就是大家都觉得这个对于初创公司和独立开发者来说,这简直就是及时与就是大大降低了他们的试错门槛,然后这个生态的适配又做得这么好, 大家用起来也非常的流畅。但是有一些人也会担心说这个东西,呃,模型的这个能力和这个币源的大模型还是有一些差距的, 包括这个审核的机制,包括这个 token 的 有效期,包括这个实名认证,这些事情可能还可以再优化,但是整体的反馈还是非常正面的,包括这个资本和这个行业都是非常认可的。然后咱们来来到第三部分啊,咱们来聊一聊这个 mimo 未来的一些可能的发展方向啊。对,这个你觉得它最有可能在哪些方面会有比较大的突破?呃,我觉得就是 首先就是这个团队的迭代速度是非常快的。对,然后他们也有很明确的目标,就是要做这个 agent 时代的这个首选的模型,所以我觉得他们在技术上面会持续的去发力,比如说他们的这个多模态的融合能力啊,会持续的升级。 那可能未来的话就不只是说这个图文啊,语音的这种多模态可能会有更丰富的这种输入输出的形式,那这个也是跟现在这个行业的需求是非常相关的哦,这都是很让人期待的一些升级。然后包括他们也在做一些模型,做的更清亮啊,能够跑在这个边缘设备上,这样的话就可以让这个终端的用户也可以享受到这种大模型的能力。 再加上他们有这么大的一个硬件的生态和这个数据的生态的加持,所以我觉得他们在产业的落地上面和这个生态的壁垒上面是会有比较大的动作的。 对,我觉得这是一个非常值得关注的方向。哎,你觉得就目前来看,阻碍这个咪蒙大规模落地的核心难题都有哪些?呃,我觉得最明显的就是在一些需要深度推理,或者说需要跨领域的这种复杂的任务上面,他和这个国际上最顶尖的闭源模型还是有一些差距的, 就他的这个自主纠错啊,包括一些这种高阶的能力还是需要加强的,这个确实会影响一些专业场景的使用体验。对,然后另外就是他的这个国内的调用的价格其实比一些同类的开源的模型要贵啊, 所以这也是为什么有很多小的团队可能在免费期结束之后就会流失,再加上就是这个频繁的升级和这个很高调的营销,也让 社区里面有一些声音觉得说这个技术的积累和这个开发者的忠诚度还是需要时间来检验的。你觉得这小米的这个米某这个大模型会怎么样去改变中国的 ai 在 全球的格局?呃,它就是首先它的这个技术上面的一些突破,比如它的这个超长的上下文和它的这个多模态的能力啊,已经让这个国产的大模型第一次在这个国际的榜单上面冲到了前列, 然后它的这个实际的任务的能力也已经可以跟这个顶级的闭源模型去叫板了。再加上它的这个非常激进的开源的策略 和它的这个芯片的适配,以及它的这个开发者的激励计划,也让全球的这个创新的力量都开始涌向了中国的这个 ai 的 生态。对,确实是一个产业协调的一个新的局面。然后包括这个端云一体的这个战略,让它能够在自己的这个非常庞大的智能硬件的生态上面不断的去打磨这个模型,也让这个硬件和这个 ai 之间形成了一个互相促进的一个闭环。 对,所以这个也会加速中国的标准在全球的这种扩散,也让中国的 ai 从一个追赶者变成一个规则的参与者,甚至规则的主导者。哎,说到这,其实我们已经可以看到了, 就是这个 mimo 带来的不仅仅是一个技术和生态的改革,更多的是它有可能重新定义智能时代的标准和想象力。好了,那么这期节目咱们就到这里了,然后感谢大家的收听,咱们下期再见。拜拜。

我拿到小米二十三亿 token 的 时候,其实是有点懵的,不是兴奋的那种懵事就这就这也能过迪那种懵?这个是 max 套餐的十六亿,这个是 pro 套餐的七亿。先交代一下背景,小米最近搞了个活动, 叫咪蒙 over 的 百万亿 token 创造者激励计划,三十天免费送一百万亿 token, 最高给到 max 上十六亿 cash, 等值六百五十九块钱。 这个话题已经有很多博主写过了,活动也快到尾声了,五月二十八日截止,还剩不到一周,按理说不该再蹭了。但我之所以还是写,是因为我发现了一个特别简陋 特别巧的方法,几乎百分之百能拿 max 档。这个方法我一会儿说,先把活动本身聊透。咪猫是小米自研的大模型,最新版本 v 二点五 分两个模型, pro 版面向复杂任务深度适配 a 剑客和编程,在 gdp v a l a a 和 clever 榜单上开源第一。还有一个是全模态版,文本、图像、视频、音频都支持 v 二点五, pro 用的 mo 架构,总参数三零九 b 激活十五 b, 原声支持一百万 to k 上下文推理成本只有国际币源旗舰的百分之二点五, api 定价大约是国际竞品的五分之一。 你可能觉得这不就是个国产模型吗?但坦率地讲,这次小米的成绩确实够硬。 texturina 全球综合第五, labyrinth 全球第四。 open route 上周以百分之三十多的试战率登顶第一 周条用量四点八二万亿 token, 而且它是开元的 mit 协议商用自由。说真的,全球前十开元模型里,中国占六席, 小米是第一个登顶开元榜首的手机厂商回到活动,这次 over 的 计划分两部分,一部分是面向开发者的百万亿 toc 创造者激励,另一部分是面向 ainc 框架团队的生态共建。我们聊的是前者,申请流程不复杂,去 mimo 填个表单,三个工作日出结果, 通过后邮件通知、登录开放平台等权益到账就行。但很多人卡在评估这步,拿到的是赠金,而不是 tiktok plan 或者档位很低。网上常见的建议是要写详细的项目描述,要有 github 链接,要做完整的项目, 有些教程甚至建议你前后端数据库齐活,搞得跟融资 b p 似的。我一开始也这么想,然后我发现了一个更聪明的路子,就是只做一个前端,一个用歪不扣定搞出来的非常非常厉害的前端不需要,后端不需要数据库,不需要部署上线, 就是一个纯前端页面,但视觉要炸,交互要丝滑,让人点开第一眼就觉得,卧槽,为什么这招管用? 你想啊,评估的人一天看几百份申请,大多数是 github 仓库链接和 api 文档,他点开一个仓库可能还没看完 readyme 就 关了,但你给他一个牛逼的前端,点开就是成品,视觉冲击力直接拉满,谁都能一眼看出来这东西好不好。后端逻辑写得再复杂, 评估的人不懂你的业务逻辑啊。但一个漂亮的页面,不需要专业知识就能判断质量。我自己 pro 档就是这么拿到的项目就一个纯前端页面,没写一行后端代码。我朋友按照我的方法拿到了 max 档。 噗儿当倒是我实打实拿作品申请的,自己写的 app, 还有几个 skill, 两者加起来一共二十三亿 token。 再说一个很多人踩的坑,一定要先注册好小米账号,绑好邮箱和手机号,申请表里填的邮箱必须跟小米账号绑定的邮箱一致, 如果不一致,或者你用的是手机号注册的账号,没绑邮箱,通知邮件根本发不到你手上,全一批了你也拿不到。 我一开始就翻车,在这折腾了好久才搞明白。所以正确顺序是先去小米官网注册账号,绑好邮箱,然后再去申请。操作上也不复杂,用 cloud code、 科斯尔或者任何顺手的 ai 编程工具,让 ai 帮你 vibble 扣度一个炫酷的前端页面,重点放在视觉效果和交互上,动画动效,享意识布局,这些能让页面看起来很贵的东西。多搞深情表里,把截图放上去, 项目描述写清楚,用了什么工具,做了什么功能,解决什么问题,就这样。最后说说这个 tucker 值不值得薅。 mmo v 二点五 pro 的 编程能力,我自己用下来的感受是比我日常用的 g l m 五车报强不少,跟 g l m 五点一比也差不了太多。 a p r 能直接对接 cloud code 浏览器, oppo 跨这些主流工具。十六亿 tucker 免费活动五月二十八日截止,池子部等人免费的羊毛,而且是比较厚的那种,不薅确实亏了。

原本两亿的筹款,现在直接变成一百一十亿,还有三十二亿的补偿基分根本用不完! deepsea 宣布降价之后,小米的 mini 模型也宣布了永久降价,原本订阅用量提升到了原来的五到八倍,在今天零点正式生效,并且原有订阅的额度也全部重置刷新 上个月申请了雷总的免费 token 的 兄弟们,可以直接在订阅里面一分钱续费一个月。逻辑是这样的, miimo 的 套餐续费会重置这个月的账单日期直接重新算到下个月的。今天 本月没用完的积分可以折算抵扣下个月续费的价格。但是今天额度重置后,就是完全百分百的抵扣,而首月开通又有七七折的优惠,这导致雷总还欠你中间百分之二十三的差价。于是雷总不仅让你零点零一续费,还把这欠你的差价换成补偿积分,加到你下个月套餐里面。 开启自动续费后,扣零点零一即可续费。下个月一定要记得马上关闭自动续费,防止被返号。然后不要点第二次重新续费,这会取消补偿积分。原本两亿的扣款,现在直接变成一百一十亿,还有三十二亿的补偿积分,根本用不完!

我真的服了小米米某这个积分啊真的很虚,这两天我实际大约消耗了八千多万的 token, 但是积分已经消耗掉了二十二个亿,简单计算一下,积分大约是 token 的 二十六倍, 况且这是在大量缓存命中的情况下得出的。那么标准套餐虽然给到了一百一十亿的积分,换算下来也不过四个亿左右的 token, 照比之前两亿积分对一亿左右的 token 实际涨幅也有三倍左右。小米你真的有必要整这么唬人的数字吗?难道只是营销大于实际吗啊。

对不起了梁胜,雷军给的实在太多了,一觉醒来以为出 bug 了,百万头肯变成百亿头肯。五月二十七日,雷军官宣小米猫某永久降价,降幅百分之九十九,同时老用户额度全量重置 转角。 deepsea 刚把价格砍到四分之一,小米直接跟进,把大模型价格打穿了,地板输入百万 token 零点零二元。比 deepsea v 四更低更狠的是,小米 mini 是 多摩态输入,也就是说,你的文字、图像、音频、视频他也能理解实践真正的内容全流程自动化,而不是 deepsea 单单文本输入。这波操作到底是恶性价格战,还是说雷总想做普惠大众的 ai 呢?

今天这期视频呢,来讲讲小米 mini v 二点五这个大模型的降价情况。现在呢,这个 mini v 二点五它跟 deepsea 已经是一个价格了。 mini v 二点五和 deepsea v 四 flash 是 一个价格,二点五 pro 跟 deepsea v 四 pro 价格一样, 之前我们都说 tbisc 的 价格很便宜,现在小米也便宜了,然后我测试了一下,随便跑了一下 agent, 然后它的缓冲泵动力呢,达到了百分之九十四,九十五,所以说就非常便宜。另外呢,小米有 tocom plan, tbisc 没有,所以说呢,小米现在呢,要比 tbisc 还要便宜一点点, 最低档呢,这个小米是三十九块钱,然后呢,你首次购买呢,有八八折,算下来就是三十四块多一点。然后呢,你可以用大概四十一块钱的 toc 的 量, 然后呢,你在晚上的零点到早上的八点,还有一个八折的额外的一个优惠,哎,所以说呢,你大概算下来就是你第一个月可以用三十四块三毛二买到大概五十一块钱的 talkin 的 这个一个量,所以说就是非常非常划算的。 那么它现在呢,对比来看,跟之前的 talkin plan 对 比来看,就是说呢,涨了大概五十到七十倍,可以说是非常非常良性了。 那今天的零点呢,他还把所有的额度给重置了,我今天上去一看,哎,我额度重置了。小米的大魔镜有两个隐形的好处,它的 v 二点五是多模态,但是这个 deepsea 呢,它就不是多模态。另外一个,它有一个语音的克隆的生成,它都是免费的,不需要花任何钱,所以说,比如说你的视频配音啊啊都不需要花钱的。 那假设呢?假设就是我们做到理论上的百分之九十五的缓存命中,大概这个三十四块钱的这个月卡可以买到 v 二点五五亿多的一个 top, 至少五亿的一个 top。 如果是 v 二点五 pro 呢,至少也能有一个一点九亿的 top, 可以 说是很实惠。 那就我个人来说,我现在主力呢还是 deepsea v 四 pro, 然后呢,我买了一个最便宜的一个小米的一个 mini 的 月卡,三十四块钱。然后呢为为的是什么呢?就是享受他的二点五的这个多模态啊。另外还有一个免费的语音克隆,那一个月三十四块钱还是非常便宜的。那这样呢,就可以覆盖我的绝大多数场景了。

零点零一元续费,小米大模型白拿一百多亿 token。 二十七号零点之后,也就是今天,系统会刷新三百八十亿的套餐用量, 然后点续费,当前套餐系统会根据你剩余的价值来估算。比如你现在还剩三百八十亿,他不但不让你补钱,还倒找你七十五块,直接转成新的 token。 选一个支付方式, 显示一分钱,确认支付续费完成,花了零点零一元找的七十多,换成了一百多亿 tucker。

先说结论,小米 miimo 确实降价了,而且降的不少,但降幅百分之九十九这个说法,咱们得打个问号,因为没人知道它原来到底卖多少钱。 credit 是 怎么回事? 小米搞了个中间层,叫 credit, 你 先买套餐,比如三十九元,一个月给你六千万个 credit, 然后用的时候按 credit 扣。降价之前, pro 模型要扣两个 credit, 长文本甚至要扣四个。 降价之后,小米说取消了四倍 credit 的 计费方式,但具体 pro 模型现在是扣一个还是两个,官方没说清楚, 直接看价格更实在。小米公布了 token 价格,输入缓存命中零点零二五元每百万 token 输入缓存为命中三元每百万, token 输出六元每百万 token 输入只要两分五厘钱就能买一百万个 token。 和 deep seek 比怎么样?巧了, deep seek v 四 pro 的 价格完全一样。小米这是明摆着对标 deep seek, 价格完全对齐, 那到底降了多少?小米说最高降幅百分之九十九,如果这是真的,那原来 pro 模型的输出价格应该是六百元每百万 to 肯左右。 但问题是小米从来没公布过原来的官方价格表,所以百分之九十九降幅这个数字只能信一半。 普通人该怎么选?如果你追求简单透明,小米和 dipsic 价格一样,选哪个都行。如果你担心被套路,别买套餐,直接按量付费,这样就是明确的价格,没有 credit 换算的弯弯绕。 最终结论,小米 mimo 降价是真的,价格也确实便宜,但降幅百分之九十九的宣传,因为缺乏原价数据,没法完全验证,和 dipsic 比价格完全一样。 credit 机制有没有猫腻?官方没把降价后的换算比例说清楚,这是个隐患。

小米昨天刚出一机爆,今天股价直接干了二十八元抗压位,手握两千两百亿现金,直接砸出史上最大两百亿港元回购。另外鲜灵魔大摩西永久降价,最高降百分之九十九,一边砸钱不盘,一边试 ai 价格,屠夫市场到底在爬什么?

小米密密被严重低估了,我实测发现他反应又快又强,这条视频全程无加速,直接用密密激活。小白龙系统启动中,正在运行自检,进入系统之后,他主动开始自检,可以看到右上角他在准备进行自检操作,正在检查文件读写能力。让我感到吃惊的是,这个小米密密真的是挺快的, 而且所有的工具调用都是成功正常,中间是白龙马的记忆节点, 正在检查热点面板。哇,这个太酷炫了,咪某给我调出一个网络热点追踪系统,他检查完今天的热点之后,他就把整个页面收起来了,看到了吧,执行全部成功,都是绿色的。 正在检查视频模式,他现在在上网找一个视频,然后再准备进行播放,检测他的视频功能,上网搜索需要时间。 哇,这么快就打开了,这个速度还是可以的,挺强的。在检测完成之后,他就把视频给关了,这已经是后来者居上,弯道超车了。我们来让他做点事情吧, 你打开 b 站上面那个雷军唱 are you ok 的 视频,按下空格键说话松开就发送了, 你们看,他已经搜索到了,他在理解、分析和判断。搜索到打开了,真的强啊, are you ok?

五月二十七日,小米宣布 mini v 二点五系列 api 永久降价,最高降幅高达百分之九十九,并且不再区分上下文窗口长度。小米 mini 负责人罗福利随后发文揭秘了降价的技术底气,其 推理框架新增了针对所有的分层 k v 缓存优化,这项优化让缓存托克容量提升了五倍,相当于降低了百分之八十的缓存成本。同时,得益于模型架构中极端的一比七稀疏比例, 小米将原始推理成本压到了远低于行业平均水平,从而把结构性成本红利直接让渡给开发者。目前,在最新定价下,小米的生产推理引擎已接近满负荷运行,但依然能够维持数值平衡。官方也表示,只有底层架构优化跟上,才能避免流血降价。这次降价不仅打破了成本底线, 更意味着大模型正通过极致的推理优化到 b 底层 ai 硬件价值重估平价算力,将真正引爆全球规模化的推理应用需求。

啪啪打脸啊兄弟们,前段时间我还说了 token 焦虑,什么小米 vivo token 本来用的很快啊,还有什么 cloud codex 套餐很贵啊,我还说什么 token 可能越来越贵,我,啊, 怕怕打脸。就在这两晚,小米突然之间他就降价了,他别人降价都是打五折打几折他,他降价最多百分之九十九,并且他还重置了我的三兆套餐,我之前是两个亿的套餐,现在我有多少?现在, 现在有一百一十个亿,一百一十亿 crazy, 太疯狂了,兄弟们,太疯狂了!现在属于 token 的 价格战已经打响,兄弟们。

小米疯了!小米疯了!小米疯了!雷神今天直接把 ai 价格打骨折, api 降价最高百分之九十九套餐无痛升级五到八倍, 之前 pro 套餐七亿 to 肯,现在三百八十亿,之前 max 套餐十六亿 to 肯,现在八百二十亿。 八百二十亿头肯是什么概念?你从盘古开天地开始用,用到今天都用不完,而且不用你操作任何东西,系统自动升级,这叫什么?这就叫无痛升级! 雷总格局,你们卷模型,我卷到让每个人都用得起!真香警告。