二零二六年四月,国际权威大模型评测平台 texterina 最新榜单出炉,小米自研 m a m o 大 模型综合实力位列全球第五, 在衡量实验室整体 ai 研发能力的 lab rank 维度排名全球第四,代码专项评测全球第五,多项成绩跻升全球第一梯队。 小米 mmo 大 模型都全球第五了,直到现在,还有人敢说小米没技术吗?话题刷屏全网狠狠打脸小米没技术,只会组装的配件, 用硬核实力证明,小米不仅有技术,而且是全球顶尖水平。长期以来,网络上总有一种刺耳声音,小米没核心技术,只会组装营销打价格战。小米就是个组装厂,没有自研能力。这种先见 好却无视小米在芯片、 ai 大 模型、系统影像、快充等核心技术领域 的如今小米 mmo 大 模型登顶全球第五,用无可辩驳的硬核成绩彻底击碎这些偏见,让世界看到小米的技术硬实力。小米 mmo 大 模型的全球第五含金量十足,绝非刷榜得来。 tesarina 采用独有的双盲测试机制,模型身份完全隐藏,由全球真实用户基于回答质量实时投票,有效杜绝传统评测中针对数据及刷榜的行为,结果极具公信力。 小米 m a o 杠 vr pro 凭借在复杂逻辑推理、常指令遵循、多轮对话、工具调用等高阶能力上的稳定表现, 从全球数百款大模型中脱颖而出,超越众多国际顶级币源模型,稳居全球第五, 成为中国 ai 的 骄傲。不止全球第五,小米 m l 大 模型近期战绩全面爆发,多项数据领跑全球。四月二十三日,莓莓 b 二点二五 pro 在 artificial analysis 评测中,综合智能指数位居全球开源大模型并列第一, agent 智能体指数同样全球开元第一。在 openroot 平台 vivo vr pro 以百分之三十加试战率登顶周榜第一, 周掉用量达四点八二万亿投放,终结 mini max 连续榜首纪录全球前十开元模式中,中国占六席,小米成为首个登顶全球开元榜首的手机厂商,标志国产 ai 从追赶进入领跑阶段。 小米 m i o 大 模型能取得如此成绩,源于硬核技术架构。以千亿级研发投入, m a m v 二 pro 采用混合专家架构,总参数达三零九 b, 原生支持一百万 token, 超长上下文推力成本仅为国际币源旗舰的百分之二点五。在复杂软件工程、长城任务规划、近千轮工具调用等维度 达到全球顶尖水平,可稳定完成超长复杂任务。 a p i 定价约为国际竞品的五分之一, 大幅降低开发者门槛,兼具高性能、高性价比。很多人疑惑,一个手机厂商怎么能在 ai 大 模型领域做到全球第五?答案很简单,小米从未停止技术研发,长期坚持技术为本,每年投入百亿级资金 核心技术研发,累计专利超万件。从早期的 m i u i 系统、自研快充芯片澎湃 p e 影像芯片澎湃 c e, 到如今的 m i m o 大 模型、全界芯片、汽车自动驾驶,小米在核心技术领域持续深耕,一步一个脚印, 从无到有,从弱到强,用硬核研发打破组装厂偏见。更值得骄傲的是,小米 m m o 大 模型 并分实验室产物,以全面落地应用赋能全生态。目前,米某大模型已深度植入小米手机、平板汽车、智能家居等全场景设备,实现 ai 助手、智能写作、代码生成、影像优化、智能家居控制、自动驾驶辅助等多远功能。 普通用户日常使用的小爱同学文案生成、照片修复、家居联动背后都是 mimo 大 模型的技术支撑,让 ai 技术真正走进生活,服务用户,而非体 育实验室。网友纷纷热议,为小米技术突破点赞,直言还有人敢说小米没技术吗?有网友表示,全球第五,开源第一, 狠狠打脸那些说小米没技术的人,小米的技术实力早就全球顶尖了。也有网友感慨,从组装厂到全球第五 ai 大 模型,小米用实力证明性价比不等于没技术,低价也没有硬核科技。 还有网友自豪的说,中国 ai 崛起,小米 mmo 全球第五,和华为、百度一起 让中国 ai 领跑全球,太骄傲。当然,我们也要清醒认识到,小米在技术领域仍有进步空间,与全球顶级科技巨头相比,在部分前沿技术领域仍需持续深耕。但不可否认的是,小米早已不是当年的组装厂, 而是拥有全球顶尖 ai 大 模型、自研芯片、全生态技术能力的科技巨头。 mmo 大 模型全球第五 只是小米技术实力的一个缩影,未来还会有更多技术突破惊艳世界。那些还在说小米没技术的人,不妨看看这份硬核成绩单。 m i m o 大 模型全球第五,开源第一, 玄界芯片性能强劲澎湃,芯片自研成功, m i u i 系统全球用户超五亿,汽车自动驾驶技术领跑,累计专利超万件。这些成绩不是营销得了,不是组装得了,而是百亿级研发投入,数万工程师 日夜深耕,十年如一日,坚持技术为本,换来硬核实力无可辩驳。总而言之,小米 mmo 大 模型全球第五,是小米技术实力的里程碑,也是中国 ai 崛起的重要标志。 他用无可辩驳的硬核成绩,彻底击碎小米无技术的偏见,让世界看到中国科技的硬实力。性价比从来不是没技术的借口,低价也能有硬核科技,小米用实际行动证明了这一点。 未来期待小米继续深耕核心技术,带来更多惊喜,让中国科技在全球舞台上发光发热,领跑世界。
粉丝7313获赞29.2万

小米的这个七个亿的 toc 已经到账了啊,这个是小米最近推出的百万亿 toc 创造者激励计划,这个普通人也可以申请啊,你只要是按照他这个要求去填写一些相关的信息就可以了。我这个审核的就半天时间他就通过了,然后他就给你发了个邮件, 这个是昨天下午三点发的啊,然后今天上午就到账了。这七个亿 toc 你 如果单独订阅的话,相当于 五十美金一个月的,这个额度啊,足够使用了。小米最新出这个 mini v 二 pro, 这个模型还不错啊,在这个权威榜的 rfc 上排名也比较靠前啊, 它是在国产跟 kimi k 二点六并列第一对吧?五十四分,你看第一的这个 gpt 五点五也就六十分,差距也不是特别大。当然我现在还没有正式开始用,我一般是用在这个 hms 里面,帮我推送一些这个 x 上的一些最新的信息,接下来评测的最新结果我也会给大家跟进一下。 这波雷总还是非常大气的,咱也不能差事,对吧?专门给他拍一条视频,支持一下小米迷谋,加油!

我拿到小米二十三亿 token 的 时候,其实是有点懵的,不是兴奋的那种懵事就这就这也能过迪那种懵?这个是 max 套餐的十六亿,这个是 pro 套餐的七亿。先交代一下背景,小米最近搞了个活动, 叫咪蒙 over 的 百万亿 token 创造者激励计划,三十天免费送一百万亿 token, 最高给到 max 上十六亿 cash, 等值六百五十九块钱。 这个话题已经有很多博主写过了,活动也快到尾声了,五月二十八日截止,还剩不到一周,按理说不该再蹭了。但我之所以还是写,是因为我发现了一个特别简陋 特别巧的方法,几乎百分之百能拿 max 档。这个方法我一会儿说,先把活动本身聊透。咪猫是小米自研的大模型,最新版本 v 二点五 分两个模型, pro 版面向复杂任务深度适配 a 剑客和编程,在 gdp v a l a a 和 clever 榜单上开源第一。还有一个是全模态版,文本、图像、视频、音频都支持 v 二点五, pro 用的 mo 架构,总参数三零九 b 激活十五 b, 原声支持一百万 to k 上下文推理成本只有国际币源旗舰的百分之二点五, api 定价大约是国际竞品的五分之一。 你可能觉得这不就是个国产模型吗?但坦率地讲,这次小米的成绩确实够硬。 texturina 全球综合第五, labyrinth 全球第四。 open route 上周以百分之三十多的试战率登顶第一 周条用量四点八二万亿 token, 而且它是开元的 mit 协议商用自由。说真的,全球前十开元模型里,中国占六席, 小米是第一个登顶开元榜首的手机厂商回到活动,这次 over 的 计划分两部分,一部分是面向开发者的百万亿 toc 创造者激励,另一部分是面向 ainc 框架团队的生态共建。我们聊的是前者,申请流程不复杂,去 mimo 填个表单,三个工作日出结果, 通过后邮件通知、登录开放平台等权益到账就行。但很多人卡在评估这步,拿到的是赠金,而不是 tiktok plan 或者档位很低。网上常见的建议是要写详细的项目描述,要有 github 链接,要做完整的项目, 有些教程甚至建议你前后端数据库齐活,搞得跟融资 b p 似的。我一开始也这么想,然后我发现了一个更聪明的路子,就是只做一个前端,一个用歪不扣定搞出来的非常非常厉害的前端不需要,后端不需要数据库,不需要部署上线, 就是一个纯前端页面,但视觉要炸,交互要丝滑,让人点开第一眼就觉得,卧槽,为什么这招管用? 你想啊,评估的人一天看几百份申请,大多数是 github 仓库链接和 api 文档,他点开一个仓库可能还没看完 readyme 就 关了,但你给他一个牛逼的前端,点开就是成品,视觉冲击力直接拉满,谁都能一眼看出来这东西好不好。后端逻辑写得再复杂, 评估的人不懂你的业务逻辑啊。但一个漂亮的页面,不需要专业知识就能判断质量。我自己 pro 档就是这么拿到的项目就一个纯前端页面,没写一行后端代码。我朋友按照我的方法拿到了 max 档。 噗儿当倒是我实打实拿作品申请的,自己写的 app, 还有几个 skill, 两者加起来一共二十三亿 token。 再说一个很多人踩的坑,一定要先注册好小米账号,绑好邮箱和手机号,申请表里填的邮箱必须跟小米账号绑定的邮箱一致, 如果不一致,或者你用的是手机号注册的账号,没绑邮箱,通知邮件根本发不到你手上,全一批了你也拿不到。 我一开始就翻车,在这折腾了好久才搞明白。所以正确顺序是先去小米官网注册账号,绑好邮箱,然后再去申请。操作上也不复杂,用 cloud code、 科斯尔或者任何顺手的 ai 编程工具,让 ai 帮你 vibble 扣度一个炫酷的前端页面,重点放在视觉效果和交互上,动画动效,享意识布局,这些能让页面看起来很贵的东西。多搞深情表里,把截图放上去, 项目描述写清楚,用了什么工具,做了什么功能,解决什么问题,就这样。最后说说这个 tucker 值不值得薅。 mmo v 二点五 pro 的 编程能力,我自己用下来的感受是比我日常用的 g l m 五车报强不少,跟 g l m 五点一比也差不了太多。 a p r 能直接对接 cloud code 浏览器, oppo 跨这些主流工具。十六亿 tucker 免费活动五月二十八日截止,池子部等人免费的羊毛,而且是比较厚的那种,不薅确实亏了。

还有人没领这个小米 mini 模型的这个 token 吗?我是已经领到了,给你们看一下, 直接给我发放了两亿的 token, 这可以够我用,很够我用一段时间的。领取方法也很简单,就直接去他们这个网站申请就行了。然后我的申请是写了三百个字,申请也很快,三个小时就出结果了。 据说有人领了八十多个亿的头肯,还有十几二十个亿的都很都很多人拿,但是我只拿到了两个亿,我不知道为什么,是不是我写的文章太水了。呃,你们赶紧去申请一下吧。这个可以接小龙虾,如果你是开发者也可以用他们的 a p i。 他 们现在是 v 二点五 pro 吧。这个还是挺好用的。我用了一下。嗯。

哈喽,朋友们好啊,这波给小米上大份。今天早上我看罗浮丽的推文,上面说小米一次性开源了两款模型,都是他们的 mimo v 二点五系列,一款是 mimo v 二点五 pro, 是 他们的旗舰模型,有一万亿的参数, moe 架构,四百二十一激活,主打是 koine 和 agent 的 场景。另外一款是 mimo v 二点五, 是一个原生的全模态模型,支持文字、图像、音频和视频,两款都是的 m i t 协议,比 dbc 的 阿帕奇二零还要更宽松,可商用,可二次训练,无需授权上热门窗口,这次也给足到了一百万头肯,并且最关键的是它性能很强。卢福利这次没有玩参数游戏,而且直接拿榜单去说话。 gdp y 六 a a 全球开源模型 l m 拿的第一 ad 它的专项指数也是全球开源第一, 全球综合排行进了前五,比肩蝙蝠的 opus 四点五和 g t 五点四这种闭源的商业模型,而且车就像里面就包含了四年前刚刚发布的 deepsea v 四 pro 以及发布不久的 kimi k 二点六。也就是说 miami v 二点五 pro 是 目前全球开源模型里边能力最强的那一档了。 更狠的是,它的生态也铺满了,发布当天就完成了七家芯片之星, amd rocum a w r 四 training two v r m s g line 这些主流的推理框架,也是零 day 同步上线。而且这次小米在开源的同一天发布了一个叫 albeit 的 计划,小米计划在三十天内给全球开发者发一百万亿的 token, 只要你去申请,并且小米审核了你的申请,你就可能获得最低到 standard 的 最高调 max 的 token plan 计划。申请过程也比较简单,填上你的邮箱以及你常用的 ai 开发或者是 agent 的 工具。再有就是主要使用了底层模型系列式那些。它的申请表中四项和五项比较关键。 我的建议是,如果你最近在使用 agent 或者 ai 来驱动构建你的项目的话,你可以把整个过程写的详细一些。第五项是,如果你能够提供一些相关的证据来表明你使用 ai agent 的 能力,你可以尽量贴的详细一些,这样就方便小米对于你的申请 用一个更好的评估。那博主不才,我最近在做一个 ai 多整体编排和杀青的项目,所以我最近可要扣的用量比较多,可以用到每天将近一点六亿左右的 token。 所以 小米给我了一个评定,就是一个 pro 版本,我可以一个月之内使用小米 pro 的 一个 token plan, 可以 使用到将近七千万的一个 token 的 uhc 用量。但最后不得不说啊,小米这次无论是 memo 的 开源模型还是这个 obit 的 开发者激励计划,必须给到哈。

很多人估计没想到啊,上周的 toon 消耗量呢,小米的大模型 miami v 二 pro 直接冲到了第一,哈哈啊,而且它还成了 openroot 历史上第一个啊,周 toon 消耗量超过三万亿的模型 啊。还有一个数据也挺猛的啊,就是这个 miami v 二 pro, 呃,它在编程领域的市场占有率呢?呃,超过百分之三十,呵呵呵,有点离谱。嗯, 那问题来了,小米的大模型为什么突然就起来了呢?甚至进入了全球的第一梯队了?呃,我把这个事简单的捋一下啊,呃,其实是一步一步走过来的。 先说时间线,呃, mimo 的 团队呢,是二零二五年四月才成立的,一开始呢,规模很小,也就几十个人 啊。真正的关键的变化呢,是在二零二五年十一月啊,雷军从 deepsea 挖来了核心人员啊,罗福利啊,他现在是咪毛大模型的负责人, 他来了之后呢,呃,变化是比较明显的,主要有两个啊,第一个呢,就是技术路线发生了调整啊。第二个呢,就是团队的结构也发生了变化啊,当然也慢慢的扩大了嘛 啊,再叠加一个很现实的因素,就是小米开始明显的加大投入了啊。到了二零二六年三月十一日,小米呢就把 mimo 的 早期版本匿名上线了啊,起了一个名字叫 啊, honda r 法。一开始大家不知道是小米做的啊,但是在海外慢慢火起来了,头盔消耗量呢,连续的拔榜, 直到三月十九日啊,小米才正式官宣啊,这就是 miami v 二 pro。 我 刚刚看了一下啊,这个模型在啊 arctic facial analytics 这个评测榜上呢,已经排到了第七名了啊,算是正式进入了主流的视野了。 所以你回头看啊,其实不是突然的崛起的,而是几件事叠加在一起的,挖队人,改路线,扩团队,加大投入啊等等啊,然后用匿名产品先试试水,再集中爆发啊。 最后说一句啊,这件事对小米的意义还是非常大的啊,因为大模型啊,一旦做出来,它是反过来可以强化它的人车加生态的啊,从系统到硬件再到服务啊,都会被重新的给串联起来啊。 如果后面的模型能力呢,能够持续的跟上,那小米的生态呢啊,就会很值得期待了,你觉得呢?

小米的米诺大模型终于发布了,很多人都说他特别厉害,有的人甚至说他能力仅次于 deepsea。 结果苏苏我就问了他一个最简单的问题,他就翻车了, 这你敢信?这个问题呢,就是经典哲学题,问你是谁?我打开了深度思考,跟米诺说了一句,介绍一下你自己。结果相当奇怪,得出来的结论是,书虫、追星族、馋猫。 这都什么乱七八糟的呀?然后点开一看,才发现他搜出来一个我是谁的小学生的作文,然后总结了一遍。 哎,那不信邪的我肯定重新又问了一遍呀。这次终于正常了,不过也花了二十秒才思考明白, 相比之下,别的 ai 怎么样呢?我把同样的问题问了一遍深度思考的豆包和 deepsea, 豆老师是真的快,可以说是秒回,也没有答非所问。 deepsea 呢,花了五秒来思考,回答的不仅准确详细,还特别有韵味。 我的怀疑啊,是因为咪某刚出生,还没两个钱的熟练,可能在操练一段时间也能变得更好吧。那我们就给他点时间吧。对了,希望咪某能早点出个 app, 目前只能网页版,真是麻烦。

四月二十八号,小米正式开源了咪蒙 v 二点五系列大模型,采用 mit 协议,支持商用推理部署于二次训练,无需额外授权。更炸裂的是,小米推出了咪蒙 obit 一 百 t token 计划,限时发放一百万亿 token, 活动时间从四月二十八日到五月二十八日。这波操作直接把开源大模型的门槛拉到了地板上。今天这期视频我就来拆解一下小米这次开源到底有多猛, 以及如何免费领取这一百万一 token。 先看看这次开源的咪蒙 v 二点五系列包含什么?有两款模型,分别是咪蒙 a 二点五 pro 和咪蒙 a 二点五。咪蒙 v 二点五 pro 面向复杂任务场景, 深度适配 a 阵七与 call 定应用,在 gdp y a a 和 cloud evo 榜单上位列全球开源模型第一。这意味着在开源大模型里,它的 a 阵 t 能力和 call 对 能力是顶级的。 mimo v 二点五是原生全模态模型,支持文本、图像、视频和音频理解,具备强大的 a 镇定能力。 最关键的是,两款模型都支持一百万上下文的窗口。一百万上下文是什么概念呢?相当于可以一次性处理整本三体三部曲或者整个项目的代码库。这次开源最关键的一点是采用 mit 协议。 mit 协议意味着什么呢? 意味着你可以商用推理部署,可以进行二次训练,无需额外授权。换句话说,你可以拿密莫为二点五做产品,可以拿它训练自己的模型,可以把它集成到你的业务里,完全不用担心版权问题,这对于开发者来说简直是福音。 很多开源大模型都有商用限制,或者需要额外授权,但小米这次直接把门槛降到了最低。小米这次推出的 miimoabe 一 百 t tock 计划,发放总额是一百万亿 tock。 一 百万亿 tock 是 什么概念呢?假设一个普通开发者每天调用一百万次 api, 每次消耗一千 tock, 那么一百万亿 token 足够他用二十七年。当然,这是理论值,实际使用中可能没那么夸张,但这个量级确实非常惊人。活动时间从二零二六年四月二十八日到五月二十八日,整整一个月。申请地址是,而且注册新用户积的十元 api 体验金。 申请流程非常简单,第一步,访问申请地址。第二步,填写表单,表单会问你一些基本信息, 比如你的项目类型、使用场景等。第三步,上传项目成果,可以上传成果截图、运行截图,其他 ai 平台的账单截图,还有你的 github 项目地址,这些信息是为了证明你真的开发过, 审核通过后会给你更多的 token。 如果没有项目成果怎么办?可以直接 ai 生成,把这一块的截图发给他,让他给出创意。第四步,提交申请,等待审核通过。整个过程非常简单,几分钟就能完成。如果你是开发者或者对 ai 感兴趣,千万不要错过这个机会。

兄弟们屌爆了啊,今天小米不是发布了那个 mimo studio 吗?刚才我实测了一下,确实啊,咱们废话不多说,直接看一下它到底怎么样。来啊,我们随便给他一个指令,帮我生成一个贪吃蛇的游戏程序,并且适配网站正常运行,我们直接开着看它能给我们生成什么样。现在呢,它就像一个程序员一样在编程这个代 码,屌不屌?屌,而且,而且它给你生成出来之后,它是直接可以玩的。刚才呢,我也用那个千问, 然后和豆包试了一下,他几乎最后给到你的一个结果,就是这一对待嘛,他没有一个实质性的一个东西能给 到你,而且你们可以看到他这个是直接可以上手试玩的啊。咱们先说一下 mimo studio 他的两个优势啊,第一呢,是给中文场景做了深度的优化,像平时咱们大学生写论文啊这些他就是比较合适的,因为小米更懂我们 中国的这个论文,它到底有一个什么样的模型,什么样的要求啊?第二呢,就是它的一个小米生态原生的融合啊,所以说这次小米的这个大模型的发布,我觉得还是挺挺实用的。

免费送,免费送!又是免费送!小米 vivo v 二点五正式开园了,小米正式开启百亿 token 计划, 计划在三十天内免费送出一百万亿 token。 权益当然是有条件限制的,首先你必须主动申请,其次你必须在四月二十八到五月二十八之间完成。 那么现在已经完成了以主流 ai 芯片厂商的一个接入适配,包括阿里平头哥,亚马逊,云科技, amd, 还有百度昆仑芯。哎,不对啊,怎么没有华为升腾芯片?难道华为升腾还不够主流吗?

大模型圈子里,小米密谋是个很拧博的存在,参数漂亮,跑分能打。今年三月在 open root 上靠免费策略冲的特别猛,一度登顶周榜单,周 token 消耗超过三万亿,但免费期一过,排名立刻变脸,不到一个月就从榜首掉到了第九。 再看 arina 点 ai 的 综合盲测,四月七日那周,小米排在第三十五位,这个榜单没有品牌干扰,模型全匿名,全靠真实用户投票。三十五名的排位,很客观的反映了他在真实体验层面和国际主流模型的差距。这就回到了小米这家公司的老问题。从手机到汽车,他有一套贯穿始终的打法, 在供应链成熟后进入整合最好的零件,用最低的成本讲最响的故事。手机时代,高通芯片、三星屏幕、安卓系统全是现成的,它不需要死磕核心技术,要做的就是整合。汽车也是。速七卖的不错,不是因为技术多强,是因为成熟供应链的地板已经很高了。 这套打法我称之为快消品。逻辑强,营销弱产品,产品本身不够强,就在包装上找卖点, 品牌趋势、参数,轰炸创始人 ip, 所有能让你感觉这东西很强的手段。这套逻辑在成熟硬件市场无往不利,但在 ai 时代开始失效了。再看小米是怎么把咪蒙做出来的,凭的是一套叫 m o p d 的 技术。 多教师在线蒸馏,让模型同时向多个老师学习代码能力学 cloud, 数学、推理学 deepsea, 安全对齐学 jimmy nike, 用极低的成本快速追平参数差距。蒸馏本身不是原罪,后发者用这种方式追赶是务实的选择,但问题在于,参数可以蒸馏,生态是蒸馏不出来的。 小米有手机、有汽车,有 ai o, 看但这些设备产生的是什么数据、行为认知、 几点解锁、用了什么 app、 家里温度几度?这些冷冰冰的记录,能渲染出懂人的恩爱吗?当然不能。你在微信里聊天,在抖音里刷视频,在抖淘宝里购物,这些最鲜活的表达数据,全在腾讯字节、阿里的生态里, 小米只是一个硬件通道,数据从他身上流过,但不留下任何痕迹。有硬件没数据,有工程没水源。更尴尬的是,小米到现在连一个面向大众的咪蒙原声 app 都没发布出来, c 端存在感几乎是零。 所以小米搞大模型,只能走蒸馏这条捷径。蒸馏能复制能力,但复制不了生态。能追平参数,但建立不了护城河。当大家的技术参数被逐渐拉平的那一天,用户凭什么选你? 小米的品牌心智是性价比,整合商不是技术信仰。而 ai 产品最终卖的不是性价比,是信任。 这恰恰是快消品逻辑最不擅长建立的东西。所以,小米一诺的困境,不是技术问题,是身份问题。他想当高科技公司,但组织、技术、记忆全是快消品的手机时代这套逻辑活得很好, ai 时代会完全失效。 参数可以靠蒸馏追平,但品牌的泥足会在每一次技术升级的浪潮里越陷越深。外表再庞大,根基不稳,终究站不稳脚跟。

deepsea v 四刚发布没几天,全网都在讨论它的技术突破,国产算力、开源生态,结果小米跳出来了, 小米官宣 miimo v 二点五 pro 在 artificial analysis 评测上编码能力得分超越 deepsea v 四 pro, 登顶开源第一。公关稿写的那叫一个振奋, 好像小米一夜之间成了开源大冒险的扛把子。零点一分就多了零点一分,小米 memo 二点五编码得分八十一, deepsea v 四 pro 得分八十点九。就这零点一分的维度,就是小米就开始全网发通稿,说什么超越 deepsea v 四, 你不仔细看,还以为小米把 deepsea 全面范围碾压了。今天我就把 artificial analysis 这张榜单扒给你看, 他到底测什么?小米吹的到底有多大水分。 artificial analysis 是 二零二三年成立的独立 ai 评测机构,两个在谷歌实习时认识的年轻人创立。因为发现 ai 厂商各说各话,评测标准混乱,他们决定自己搞一套独立的评测体系。 跟那些厂商自己报成的野鸡榜单不同, artificial analysis 是 独立跑测试的,所有模型在相同条件下零样本测试,用自己的账号跑真实 api, 甚至还搞神秘顾客政策,不用自己的域名注册评测账号,防止厂商给评测量身定制特权通道。 正是因为这种独立性, artificial analysis 在 开发者圈子里认可度相当高,连 astropica、 open ai、 谷歌这些巨头都会关注它的评测结果。很多人以为 artificial analysis 就是 个编码跑分榜,大错特错, artificial analysis 的 评测体系至少包含两大综合指标, 智能指数综合了推理能力、编码能力、知识广度、 agent 能力等多个维度。这四个指数里,编码只占百分之二十五的权重,还有 agent 能力占百分之二十五,通用知识占百分之二十五,科学推理占百分之二十五,四个维度各占四分之一,才能拼出一个完整的智能画像。 质量指数评测模型输出的可读性、逻辑结构。综合质量这个指标更贴近真实用户体验。模型能不能给出结构清晰、逻辑严密的回答?除了这两个核心指标, artificial analysis 还测指令遵循多语言能力、常文本处理,甚至还有开放性指数 评估模型的透明度,包括训练数据公开了多少、方法论批漏了多少。所以,当小米只拿 artificial analytics 的 编码单向来宣传开元第一时,你就要多留个心眼,它是不是只在某一个维度上拿了高分,而在其他维度上表现平平? 我们来看看 artificial analysis 最新评测中两个模型的多维度对比。在智能指数上, deepsea v 四 pro 全球排名第八,小米 miimo 二点五排名第十二,差距明显。这说明 deepsea 在 推理、知识、 agent 等综合能力上其实整体领先于小米, 在质量指数上差距更明显。 dbc v 四 pro 得分八十三,排名全球第五,小米 mini 二点五得分七十八,排名第十。质量指数衡量的是模型输出的综合质量,这恰是用户最直观感受到的东西,回答是否可靠,逻辑是否清晰。 而小米选择只吹编码单项,不是因为它在其他维度也强,而是因为只在这个单项,它的数据稍微好看一点。小米这次的操作,说白了就三个字,蹭热度。 deepsea 微四刚刚发布,全网关注的最高的时候,小米跳出来说,我开元第一,我超越了 deepsea, 但仔细一看,是单项超过了零点一分。 这就像两个人考试,一个人的总分,综合能力、各科均衡性都遥遥领先,另外一个人只在美术课上比前者多花了一笔,然后就满世界喊我比他强, 你信吗?更让人不舒服的是,小米还是故意模糊这个界限的?公关稿里说,登顶全球开源大模型综合智能指数并列第一。但你看看 artificial analysis 的 数据,它的智能指数在开源模型里并不是第一。它玩的是另一种选择性强调的把戏, 在对自己有利的维度上放大音量,对自己不利的维度上假装不存在,差距根本不在那零点一分。差距在于,一个在解决中国爱的底座能不能摆脱美国芯片这种最难的问题,另一个在琢磨用哪个榜单更显得我比 deepsea 强。格局的差距从一开始就决定了。

以前觉得 ai 大 模型离普通人很远,要么收费昂贵,要么只有大厂能用上,可小米这波操作直接打破了所有壁垒,普通人也能零成本薅到顶级 ai 的 福利。 四月二十八日,小米正式官宣,咪墨微二点五系列大模型全面开园,一下子放出了两个核心版本,还采用了最宽松的 m i t 协议,简单说就是不管是个人还是小企业,都能免费下载使用,就算修改模型拿来商用,也不用额外申请授权,没有任何隐藏套路。 这波开源的核心其实很实在,两个版本分工明确, v 二点五 pro 主打复杂任务,比如写复杂代码,分析长篇文档, 实力强到登顶全球开源大模型榜首,比近期大热的 deep sec v 四 pro 表现更出色,完成同样任务还能比 kimi k 二点六节省百分之四十二的 token, 但和 gpt 五点四、 cloud opus 四点六比,在高阶推理上还有一点点差距。 v 二点五是全模态全能选手,能同时处理文字、图片、音频和视频,日常用完全够用,视频理解分数接近 germany。 三 pro, 只是在高帧率视频分析上稍显不足, 日常编程能力也比不上 cloud opus 四点六。两款模型都支持一百万超长上下文,能一次性读完百万字内容,逻辑还不混乱,这一点比很多同类开源模型都有优势。 开源首日就适配了七家主流芯片,国产芯片全覆盖下载部署也很方便,普通显卡就能运行,不用像用一些高端模型那样, 必须配备昂贵的专业设备。很多网友都说小米太良心,直接解决了开发者和创业者的痛点。对个人开发者来说,不用花几十万买高端设备,普通显卡就能上手。对创业者和小公司,零成本就能用上顶级 ai, 开发 app 做内容创作都能省不少钱, 它的推理成本只有国际大牌的百分之二点五。就算不搞开发,我们以后用的 ai 聊天视频剪辑工具也会因为这次开源变得更便宜、更好用。小米这次开源不只是一次技术发布,更是把高端 ai 的 门槛彻底拉平。曾经遥不可及的顶级技术,现在人人都能免费上手,不用再被高昂的授权费卡脖子。这大概就是技术的意义, 不是用来抬高门槛,而是让每个人都能实实在在享受到科技带来的红利,让 ai 真正走进普通人的生活。

同学们,跟大家说一个新的模型啊,叫做 mimo, 来自于小米。那之前我们讲到国内的大模型的时候都会讲谁呢?都会讲啊, deepsea, 包括有千问,包括元宝这些,包括了那个,还有 kimi 啊等等这样的一些模型。哎,但是现在出了一个新的模型叫做 mimo 啊,来自于小米的,而且我认为未来的大模型很可能啊,我认为就这三家,第一是小米的 mimo, 第二是千问 啊,第三个就是,呃,这个豆包 deepsea 很 有可能会闽南众人,就像当初那个叫商仲永一样啊,少时寥寥,大腕必佳啊,为什么呢?啊?像这个,目前我们单纯从一些跑分的数据来看,他在啊,最近出的那个新的智能体叫爱马仕 hermes, 这个它类似之前的那个 open color 一 样,它的整个的,呃呃,因为本是开源的吧,那可以去调用的模型就很多,那 miimo 这个模型,它在这个,呃智能体里边的引用的开源的模型 token 消耗里边,目前是全世界范围以内排名最高, 并且已经连续霸榜三周了啊那。呃,当然这是一些数据上的澄清啊,我们再回顾一下啊,我,我一直以来都非常的关注小米之家企业,我发现雷军这个人做事情他有一种有一种风格,就是说 我一旦认准了某个事情,那我就要去,我就要去挑战这个行业里边最牛的存在,比如说之前做那个苏七,对不对?那做啊,做,包括后来出了这个 u 七,好,那干嘛?那跑分呗, 那去跑那个牛北嘛,对吧?那 ok, 把整个牛北跑下来,那所有用户全部闭嘴了,那现在出了这个新的这个开放政策以后,一样的,那就让他去用他的模型参数来去看大家实际的销量有多少,并且现在最近他们正在搞一个活动,是什么?送两千万亿还是多少来?我不太记得啊, 两千万亿还是一千万亿来着?送啊,送这么多的托管你,你去申请。所以各位朋友哈,如果说各位同学你们手头绝技的可以去申请一下,薅钱毛,看你能薅得着。 那我们说回来啊,这样一些新的模型的进化啊,未来会怎么样不好说,但是呢,大家也多多多去关注你既然是想在 ai、 g、 c、 d 等领域里长久的发展下去,那么对于一些新的模型的关注是你必须要做的一件事情。

在四月二十八日,小米宣布开源 mymo v 二点五 pro 的 同时,上线的开发者激励计划,向全球高质量 ai 开发者发放百万亿 token。 这个计划是以月套餐发放剩最后九天时间,教你如何领取十六亿 token 的 月套餐,支持全新旗舰模型 mi mo v 二点五 pro 等八款模型。 小米自研的 m o v 二点五 pro 总参数量一点零二万亿,采用 m o v 架构,上下吻窗口来到一百万头等对标可拉萨内,四点六更加是汉藏任务和 agent。 接下来是全部教程。首先输入网址来到官方计划页面,切记是以小米账号为领取用户,每个电话和邮箱只能创建一个账户,每个小米用户只能领取一次,可详细阅读下面文档。 接下来直接点击立即申请,填入你绑定小米账号的邮箱,或者后续再绑定,也可以再填一些问卷。 接下来是关键步骤,稳定领取十六亿 tokyo 的 关键发放审核并没有查中,很精塞,关注私信给你项目结果以及 github 仓库链接,直接复制即可。 我已经领取了十六亿 token, 已经使用了八亿 token。 我 对接了哈密在 cloud code 共同做了一些项目,除了这些还提供 a p i model 服务,像素之类的 id 也可以使用。以 card code 为例,提供 android 兼容协议, a p i 领取到的其实就是 max 套餐。后续解析, him 是 以 cloud code 对 接 myme 二点五 pro 做的项目, 以及对比相同提示,此下 deepsea 一 四与 mymo 二点五 pro 项目完成结果的不同。最后可能有人会说这个模型不好用,但是对于 ai 小 白以及我这样没有很高生产力需求的学生,简直是天降横财。 最感兴趣的项目,对基和 miss 科奥库里以及其他 a 阵框架实现工程化落地完全没问题。最后,希望国产模型越来越强,小米 m i m o。 越来越强。

现在是小米的 max 阅读套餐啊,这个十六亿的 token 是 小米送,然后从昨天早上八点钟开始吧,到现在差不多四点八亿,快五亿了,也就三十多个小时。五亿 token, 这还是在它这个运算速度受影响的情况, 就是它的这个运算速度跟 calculator 里面的这个就是包月的,这个模型的运算速度还是没法比, calculator 里面有一个叫做 auto 的 这种模式,就这个模式可能比这个小米啊,比千万的 plus 这种运算速度,至少我觉得至少得快十倍或者八倍、七八倍这样子 的。就是如果说这个小米的这个大模型,只要算力够的话,一天烧掉七八个亿或者十来个亿的 token 不 在话下。然后我用这个 小米的 miimo, 这个是 miimo 二点五 pro, 然后这边是一个千万三点六 plus, 然后他们昨天晚上分别做了两个重构的任务,就是非常长的任务,基本上这两个做的都差不多,就是我没想过小米的这个模型其实做出来的这个效果也不错, 但是这两个模型都没有完全的把任务全完成,因为这个涉及到的文件确实挺多的,可能得几十万行代码吧, 他得扫描十几万行代码,那现在这个项目接近二十五万行代码,光文档就有十三万行,所以说体量非常大。这个重构呢,也是重构这个所有的这个命名就是很多变量名,他在写的过程当中命名不规范,然后我就写了一个命名的规范这个文档,让他们重新的把所有的命名全部规范一下, 说为什么这个项目没有上线就重构啊?是因为就是过去,比如说我们做一个项目的话,可能一两年或者两三年就写了一堆的代码,然后史山代码这个时候就有一些比较 大拿吧,技术大拿,或者说是有点洁癖的这些人,他就喜欢去重构这些东西,就是把那些分散在各个角落重复被写的这些功能,然后浓缩到一个工具里面,或者浓缩到一个函数里面, 让所有的业务都去掉这个函数以后每次我想去改点什么东西的话,我就直接在这个函数里面改,其他的这些业务就跟着都变了,大概就是这么个意思吧,重构就是这么个意思,过去你要想重构的话,写出大量重复代码的话,得花很长时间,很多人 才会出现这种问题。但是 ai 恰恰相反,就是它很快就能写出来一堆东西,然后你就会发现你的需求是一个个提上去的,然后它就一个个给你完成,最后你会发现这个需求和那个需求之间它有一些共用的东西,那这个时候你就必须得让它抓紧重构,如果不重构的话 就是属于恶性循环,你的代码会越来越乱,越来越乱,第一是你自己也梳理不清楚,第二就是 ai 也会越来越糊, 就是你的这个项目架构,特别是这个底子如果不好的话,那后面你给他提个需求,他得查一大堆东西。所以比如说我要改一个人的头像,那么这个头像就得在一个地方去改,以后我再上传头像,或者在裁切头像,或者在干其他的事情, 就只要和头像相关的都到这个模块下面去做,如果不这样的话,你这边业务这个页面上有个头像,你想在这改一下,然后你又换了个页面,也在那也改一下,他很快就给你写出来,然后很快就能实现。 你在写的过程当中你好像觉得没什么,但是慢慢你会发现,比如说原来那个头像是切成方的,那我又现在又想把它切成这个长方形的,那这个时候这边切了正方形的,然后那边那个长方形的可能还没动,它还是长方形的,这就会导致就是有可能你的界面不一致什么之类的,反正就是大概类似这样的问题 吧。所以说 ai 写代码只要你发现了有一些重复性的东西的话,它重复在改相同的错误,比如说这个页面上的错误跟 另外一个页面上的错误基本上是一致的,但是他改完这另外一个没变,那就说明这两个地方他是有重复的,两两部分代码就是实现了两次,相当于说是甚至实现三次都有可能。 因为我们的这个需求不可能是一下子就提的特别清楚的,而且架构也不是一下子就能设计的特别完美,所以说这个就是在不停的写,不停的改,然后不停的重构,好在就是重构还不错,然后这个小米的这个 执行呢,一晚上跑下来整个也没断,就他可以跑六七个小时,七八个小时,千问其实也可以跑六七个小时、七八个小时,这两天千问他没有断,就是以前我不是说上个视频,我不是说这个千问就跑着跑着就断了吗?就是算力,这个叫什么?到了到了一个算力上限了, 他就断了这两天。这个千问三点六 plus 就是 这几天啊,还不错。我也不知道是因为我装了小米的原因还是怎么样的,反正就是这两天他没有因为这个算力给我限制了。 小米这个 miimo 二点五 pro 的 这个模型也是一直没有那个断掉过,就是用下来还是蛮稳定的,就白天的时候会有点慢,晚上十二点之后到凌晨的那段时间,它是算力低谷,然后那个时候它是零点乘一个零点八的系数吧,然后整个的这个 算下来的结果我觉得不错,因为我的任务实在是太长了,所以说它是会丢掉一部分东西,但是你再去审核一遍的话会发现,然后再让它去补充这些业务,就一次可能比如列了七八个任务,它就会给你完成三到五个, 然后有些是完成了一半,最后你问他完成了吗?他告诉你只完成了这几项,然后你再接着让他继续完成。那这个过程其实蛮长的,就是从昨天早上八点一直到今天晚上八点三十多个小时吧。呃,有二十多个小时就是完成两个长任务。其实我觉得还不错,毕竟这个人家是白给的嘛,咱也得这 也不能说是完全无脑夸啊。但是确实还不错,就是作为一个卖手机的,卖汽车的,然后做了个大模型,能达到这种水平,就我觉得是不输千问三点六 plus 的, 然后他给的这个 max 的 套餐,我在这个平台上也看了一下。卧槽,这个有点贵啊,这一年合五千多, 五六千吧,然后一个月大概十六亿的 token, 按照这种使用量的话,如果说它的速度不限制的话,我估计这个 十六亿的话,可能也就三四天就能这个给它用光了。但是啊,就是这个项目是这样的,就是在初期的时候野蛮生长的,这个过程当中肯定会消耗很多 token, 但是随着这个功能稳定下来之后,它可能就用不到那么多 token 了, 因为我已经有好多个这个编程账号了,都花了钱的它可能用不到了,我也不会盲目的去一下子买太多账号吧,先看看吧,因为这个项目基本上也到了一个收尾的阶段,所以 说就给大家汇报一下,我觉得如果说你想用 mimo 去编程没有问题,这绝对不是个玩具,这应该是一个工业级的比较可靠的一个大模型了,特别是编程,我觉得还不错。

聊聊 miimo 大 模型吧,普通人现在主要接触的更多应还是 lm 模型,多模态模型暂不做本次参考。目前市面上的主流模型,国外无非是 cloud、 emote 诞生 gemini、 gpt、 groc, 国内主要的 glm、 deepsea、 qn、 dobao、 kimi。 但是经过前两年的混战后,大家使用大模型基本都跟公司采购和个人习惯趋于稳定,而国内网络的现状让国内 ai 大 模型能力独立竞争。 在这样的条件下,雷军组建自己的大模型团队, mimo 诞生。 mimo 第一代产品 flash 发布时,和其他开源 ai 一 样,我们 同步进行跟进,并在内测社区对模型进行测试和问题反馈。初代模型能力下, mimo 整体推理能力并没有解决当时所有模型的长链路思考、大数计算、上下文专注度、思考循环等等常见问题。 但是他当时有一个共识的优点,思考速度非常之快,也就是如此快速的思考能力,第一批测试者迅速将 mimo 的 测试模型推到 openroot 的 榜单第一, 每个人轻松百万级别的投币消耗让咪某团队连续几天高强度运转更新,迭代速度十分之快。长达两周的模型测试之后,咪某的能力肉眼可见的提升,随之咪某宣布延长免费期到一月二十日。而伴随咪某长达一个多月的免费使用,第一个迭代下,咪某的推理能力较快的追上了国内领先 批队,正式入局 ai 大 模型市场。一月二十日,咪某正式发布,开始收费。不过在当时 ai 的 token 消耗主要依赖于用户问答形式消耗的环境下,咪某其实并不占据优势,但随着 openclaw 开始爆火,一个我称之为 token 燃烧器的软件引爆全球。 如果不是因为贡献者是一位非 ai 公司的独立开发,我严重怀疑这个软件是 ai 公司造出来烧 token 收钱的。而有了这个 token 燃烧利器, open router 的 免费模型中,推理能力占优的模型开始出名。三月十一日,神秘模型 hunter alpha 命名上线,上线凭借强大的模型能力连续霸榜 open router。 三月十九日, mimo 团队正式官宣,认领 hunter alpha, 终结了对这个横空出世的模型的猜测。这次免费使 mimo 完成了能力训练,并积累大量经验用于构建 micro。 而月底,不知道是为了提高知名度还是继续强化模型能力,韦总再次宣布免费。自此 mimo 正式完成大模型布局, 开始大规模收费,中期发布 token plan。 最后总结一下,目前对咪咪的应用评价为,可以使用能力不错。 token plan 个人观点,定价稍高,如果 token plan 定价有优惠,可以直接上。非理能力和助手能力都处于领先,但个人习惯不主推这个模型。 雷总经常发布免费试用,可以多关注下,体验下能力。这时可能有人要问,盘古大模型也讲讲,这个就得多随嘴了,你知道 good top 和 q win 吗?啥不知道,那老规矩后面没必要听。