就在今天,小米正式发布了自家的开源大模型 mimo v 二 flash, 发布会上的主讲人正是前 deepsea 的 核心成员,被称为天才少女的罗弗利。虽然 mimo 的 总参数量只有三百零九币,激活参数量只有十五币, 但是在性能上已经可以媲美 deepsea v 三点二了。不少网友进行了实测, mimo v r flash 的 响应速度确实比豆包和 deepsea 更快, 而且它的推理速度来到了每秒一百五十 token, 更夸张的是它的成本压到了零点一美元,就可以处理一百万 token, 这和免费有什么区别?区别就是没有免费。看来小米现在已经正式在大模型领域发力了,大模型加上小米的人车加战略,这或许就是小米以后最深的护城河了。
粉丝2396获赞5.0万

小米的米诺大模型终于发布了,很多人都说他特别厉害,有的人甚至说他能力仅次于 deepsea。 结果苏苏我就问了他一个最简单的问题,他就翻车了, 这你敢信?这个问题呢,就是经典哲学题,问你是谁?我打开了深度思考,跟米诺说了一句,介绍一下你自己。结果相当奇怪,得出来的结论是,书虫、追星族、馋猫。 这都什么乱七八糟的呀?然后点开一看,才发现他搜出来一个我是谁的小学生的作文,然后总结了一遍。 哎,那不信邪的我肯定重新又问了一遍呀。这次终于正常了,不过也花了二十秒才思考明白, 相比之下,别的 ai 怎么样呢?我把同样的问题问了一遍深度思考的豆包和 deepsea, 豆老师是真的快,可以说是秒回,也没有答非所问。 deepsea 呢,花了五秒来思考,回答的不仅准确详细,还特别有韵味。 我的怀疑啊,是因为咪某刚出生,还没两个钱的熟练,可能在操练一段时间也能变得更好吧。那我们就给他点时间吧。对了,希望咪某能早点出个 app, 目前只能网页版,真是麻烦。

今天,我们来深入聊聊一场正在你我身边悄然发生的科技巨头之战。嗯,这场战争争夺的可不仅仅是你的手机屏幕,而是你整个的生活空间,你的家,你的车。没错,以及连接着一切的智能体验。这个战场的名字听起来很宏大,叫人车家全生态。是的, 而我们今天要把放大镜对准一个核心玩家小米,他们最近在二零二五年的人车家全生态合作伙伴大会上扔出了一堆重磅消息,对,我看了几篇关于这次大会的深度报道。呃,有几个点特别有意思,一份是关于他们新上任的 ai 负责人,那个被称为天才少女的罗夫里的首秀演讲,信息量很大。嗯, 还有几份是专门儿拆解他们新发布的那个 ai 大 模型的性能分析报告。把这些材料放在一起看,就能拼凑出小米未来的一个大蓝图。这是正是我们这次的任务,为你剖析小米的这个红大蓝图到底是什么。 我们将一起看看他们所谓的秘密武器。一个叫 miimo v two flash 的 新 ai 模型,究竟只是又一个市场宣传噱头?还是说,它真的有可能成为那个改变你未来生活方式的游戏规则改变者?好,我们先从大背景说起。 人车家全生态这个词听着就挺唬人的,但它其实并不是小米第一个提出来。没错,这更像是当前整个科技行业的一个核心趋势,或者说一个终极战场。嗯,它的理念其实很简单,就是把你的个人设备,比如手机、手表, 你的出行工具就是汽车和你家里的所有智能设备,什么音箱、电视、空调全都彻底打通,目的呢?创造一个无缝连贯的用户体验。给我举个具体的例子,它到底能解决什么痛点?你想象一下这个场景啊, 你开车回家,拿导自动把预计到达时间发给家里的系统。好的,在你到家前五分钟,空调提前打开,调到你喜欢的温度,热水器开始加热。这个我喜欢。当你把车停进车库,车里正在播放的播客,在你推开家门那一刻,无缝切换到客厅的智能音向上继续播放。哇,整个过程你什么都不用做,系统会主动为你服务, 就是他想实现的终极便利。听起来确实很诱人,这意味着这块市场蛋糕会非常大吧?不是一般的大。我们手头的资料里引用了波士顿咨询的一份预测,说到二零三零年人车家这个生态将占据整个智能硬件市场增量的百分之五十八。五十八 对,这几乎是未来增长的半壁江山了,所以你看,谁都不想错过。明白了,难怪这么拥挤。那现在这个赛道上都有哪些主要玩家在掰手腕?这就是一个非常有趣的跨界战场。你仔细看会发现,主要有三股势力背景完全不同哦。 第一股也是最强势的,就是科技巨头。这里面的老大哥是华为,他们早在二零一九年就靠鸿蒙系统提出了一 plus、 八 plus n 的 全场建战略,起步非常早。对,可以说起步最早,布局也最深,小米现在是卯足了劲在后面追赶。等一下,你把另外两股势力说一下,我感觉这里面有点意思, 除了华为,小米这种做手机个系统的还有谁?另外两股势力就更有趣了,一股是车圈新贵,你像比亚迪、蔚来理想这些。嗯,造车新势力,他们发现光把车造好还不够,必须给车加上智能的标签, 所以他们也想把生态从车里延伸出去,用这个来提升汽车的吸引力,让车成为一个移动的智能生活空间。那另一个呢?是传统家电厂商,正是向海尔、美的这些家电举头。他们本来是家这个场景里的绝对王者,但现在也感到了焦虑。他们焦虑什么? 他们害怕自己辛辛苦苦做的智能家电,最后都变成了给别人打工的,硬件、操作系统和入口都被手机厂商控制了,所以他们也想主动出击,把自己的产品线从家庭延伸出去,寻找新增长点。这就有意思了, 你把华为、比亚迪还有海尔放在一起,这三波人平时八竿子打不着,现在却在同一个战场上。对,但他们的起点和能力完全不在一个量级上,他们抢的真的是同一个东西吗?还是说车企和家电企业最终都得选边站,成为科技巨头的富翁?你这个问题问到点子上了, 表面上大家都说人车家,但核心诉求和打法完全不同。怎么说科技公司?像华为和小米,他们手里有最强的牌、操作系统和 ai, 他 们想做的是装甲,是平台的搭建者。嗯,制定规则的人。对,希望把所有设备都纳入自己的体系,用软件和服务来锁定用户,建立生态护城河。就像苹果做的那样,一旦进去了就很难出来。没错,而车企和家电企业目前更像是玩家, 他们的核心优势还是在硬件制造上。嗯嗯,他们也想做生态,但更多是做为一种差异化的卖点,或者说是一种防御策略,防止自己被管道化。 但从长远看,他们独立构建一个能和鸿蒙或者小米的澎湃 o s 抗衡的底层系统的难度非常大,所以未来可能会出现合作与结盟。对,但主导权之争会异常激烈。本质上,大家都在抢夺用户全场生活的那个唯一的总开关,而小米为了抢这个总开关,这次是下了血本儿, 绝对是下了血本儿。他们在大会上宣布,未来五年计划在研发领域投入两千亿人民币。两千亿,这是一个非常惊人的数字,而且钱要花在哪里,目标非常明确。芯片、操作系统和 ai 这三大柱子,就是它们构建人车加生态的地基。好了,铺垫了这么多宏观背景,我们终于要说到那个最核心的部分了。 花了这么多钱,总得有个能镇场子的东西。嗯,为了驱动这个庞大的生态,小米亮出了他们的王牌,一个叫 miimo vivo flash 的 新 ai 模型。而发布它的人正是它们新上任的 ai 负责人罗福利。对,媒体上都说它是前 deep six 的 核心成员,甚至称它为雷军的秘密武器。 这个名号可不小,确实不小,它的首秀演讲信息量非常大,最耐人欣慰的是它对 ai 发展路径的一个看法,它用生物进化来类比, 但他说 ai 的 发展路径和生物的演化是倒序的。倒序?这个比喻太妙了,我从来没这么想过。展开说说怎么个倒序法。他是这么解释的, 生物的进化是先有行动和感知,一个最简单的,虫子首先要会动,会躲避危险,会寻找食物。嗯,先生存。对,然后慢慢发展出更复杂的思考和模拟能力。最后,人类才在智能金字塔的顶端掌握了语言这个强大的工具。你看,这是一个从底层,也就是行动往上走的过程。我明白, 那 ai 呢? ai 恰恰相反。现在的 ai 大 模型是通过学习互联网上亿万的文本和代码,先掌握了语言这个顶层能力。嗯,他天生就是一个语言学家和程序员,但他对我们生活的这个物理世界几乎一无所知。他不知道苹果是硬的,水是会流动的,没错,玻璃是会碎的。 所以 ai 现在才反过来试图去弥补对物理世界的感知和模拟能力。它的路径是从顶层,也就是语言往下走。这就像一个天生就会写诗的学者,现在才反过来学怎么走路和感知冷暖。 这路径确实很奇怪,很有反直觉,完全正确。所以罗弗里得出一个结论,现在的大模型,很多都只是一个完美的语言外壳,缺乏对现实世界的真正铆钉。嗯, 因此,通往 a g i, 也就是通用人工智能的真正道路,不是去写一个更会聊天的程序,而是要去推演整个世界的运作逻辑,打造一个虚拟宇宙。这是一个非常宏大的愿景, 也解释了它们模型的底层设计思路。正是。好,那我们就来看看这个承载了如此宏大愿景的新模型, moe v two flash 到底有什么特别之处?我们可以从几个关键点来看。首先是参数,这里面有个巧妙的障眼法哦, 它的总参数高达三万九千亿。这个数字听起来非常吓人,属于巨无霸级别,但是它用了一种叫做 m o e, 也就是专家混合的架构。专家混合?对,你可以把它想象成一个拥有三万九千一个脑细胞的大脑,但你在思考一个具体问题时,并不需要调动所有的脑细胞, 只需要激活最相关的那一小部分专家就行,所以它每次实际激活的参数只有十五亿。没错,既庞大又轻巧。接下来这个点我猜猜是最小米的, 也是最吸引 developer 和企业的地方。极致的性价比。是的,这一点非常小米。资料里的数字对比很惊人,第一是速度,推理速度达到每秒一百五十个 token, 对 于这么大体量的模型来说非常快。嗯哼。 第二是成本,价格低到夸张,每 buy money 输入 token 只需要零点一美元。零点一美元?对,做个对比,性能和时呃,速度跟它在同一个水平线的谷歌 gemini 二点五 pro, 成本是它的整整二十倍。 等一下,二十倍的差距,这听起来几乎好到不真实了。俗话说便宜没好货,它的性能真的能打吗? 还是说这是只是官方发布会上公布的,经过优化的测试数据,我们知道这种测试是有操作空间的,这是个很好的问题,也是很多人会有的疑虑。 从他们公布的多个权威测试榜单来看,他的表现确实进入了全球开源模型的顶尖行列。是吗?嗯,在编程、数学和科学知识这些硬核能力上可以和那些比他大量捍卫的模型相比为, 比如在一项横聊代码能力的 human evo 测试中,它甚至超过了所有已知的开源模型。这么厉害?当然,你说的很对,这些都是官方数据,我们还需要等待更多第三方的独立测评来验证,但至少从纸面上看,它打破了高性能必然高沉稳的定律。好的,那我们暂时相信它的数据。 总结一下就是,一个旗舰级的性能,却只卖一个入门级的价格。对,这就好像用买一台普通家轿的钱买到了一辆性能跑车。那他们到底是怎么做到的?我们来深入聊聊那些听起来有点硬核但很酷的技术细节吧。好的,我尽量用通俗的方式来解释,主要有三大技术创新。 第一个叫混合注意力机制。混合注意,嗯,你可以把 ai 阅读一段文字,想象成我们自己看书。 我们看书的时候,大部分注意力都集中在当前这句话和上下文的几个词儿上,以保证连,连贯性。对,连贯性,但我们也会时不时地抬头扫一眼整个段落或者章节标题,确保自己没有偏离主旨。所以,这个混合注意力机制就像让 ai 学会了我们这种阅读方式, 平时只看眼前的几个词,但每隔一小段就抬头扫一眼大局,确保自己没跑偏。你这个比喻非常精准,他就是用这种聪明的办法,让模型既能关注局部细节,又能兼顾大局信息,同时极大地减少了对 g 气门内存的占用。嗯,而且这里面他们还发现了一个反直觉的神奇窗口。 你可能以为 ai 一 次看得越多越好,但他们通过实验发现,一百二十八个 token 大 小的这个窗口效果是最佳的。欸,有意思,盲目扩大窗口反而会导致性能下降。这就像我们人的专注力一样,有一个最佳的范围。那第二个技术创新呢?第二个叫多拎盆儿预测,英文是 m t p。 传统的 ai 模型生成内重,就像我们说话一样,是一个词儿一个词儿往外蹦的。嗯,但 m t p 技术让它能一次性并行预测好几个词儿。 这就好像一个人在说话前,脑子里已经想好了后面三四个词儿要说什么,然后一口气说出来。哦,我懂了。这个创新非常直接,让内容的生成速度提升了二到三倍。这个很好理解,就是从逐字输出变成了逐句输出,效率大大提升了。 那第三个呢?听起来更复杂一点。第三个是一种叫 m o p d 的 高校训练范式,我们可以把它理解为一种超级学徒训练法。超级学徒,嗯,想象一下,你想培养一个全才学生模型, 传统的方法可能是找一个全能的老师模型来教他。但小米的方法是找来一群专家老师,一个老师是数学家,一个是程序员,一个是文学家啊啊。然后让这个学生模型同时向所有这些专家学习,就像一个学生同时上了所有顶尖科学家的私教课。可以这么理解, 学生模型会自己生成一些内容,然后让所有专家老师来打分,给出非常密集、多维度的指导,效率很高极高,只用传统方法五十分之一的算力就能达到甚至超过老师的水平。 而且更有意思的是,资料里提到,今天的学生还能成为明天更强的老师,形成一个循环。对,当学生很快超越老师之后,他们就可以用这个更强的学生模型来当新的老师,去教下一代学生,形成一个自我净化的飞轮。这个飞轮效应听起来很可怕,潜力巨大。 好了,我们现在知道它又快又好又便宜,技术上也很有突破。嗯,但作为一个普通用户,我最关心的问题来了,我什么时候能在我的小米手机上离线用到这个强大 ai 呢? 我期待的是一个真正装在手机里的超级大脑,而不是一个必须联网的云端工具。这就触及到了理想和现实之间最关键的差距。 尽管 memo v two flash 在 设计上已经把效率推到了极致,但它那一百五十亿的激活参数,对于目前最高端的旗舰手机来说,仍然是房间里的大象。怎么说? 是手机的芯片,算力根本带不动吗?对,我们的资料里有明确的数据,现在手机端侧模型的舒适区大概是在三十亿到七十亿参数之间。三十亿到七十亿对,一旦超过这个范围,功耗和发热就会变得难以控制。一百五十亿已经远远超出了这个舒适区。 嗯,所以,尽管小米在发布会上描给了一个万物互联的端侧智能图景,但就这个旗舰毛型本身而言,它目前本质上还是一个云端模型, 你的设备必须联网才能使用它的全部能力。我明白了,所以我们期待的那种所有 ai 能力都在手机本地完成,不依赖网络,绝对保护隐私的真正的 ai 手机改革可能还需要一些时间。是的,这个 ai 大 脑主要还是在云端服务器里,而不是在我手边的设备里。是的,这是一个非常清新的现实。 对于用户手中的终端来说,这依然是一个重度依赖网络的云端模型。端侧的梦想很美好,但硬件的限制是目前最大的瓶颈。 那么,把所有这些信息串联起来,这一切到底意味着什么?小米的最终目标是什么?如果我们把这与更大的途径联系起来,罗夫里在演讲中把 mimo v two flash 称为他们 agi 路线图上的第二步。第二步对 这个表态非常重要。这清晰地表明,小米的长期目标绝不仅仅是做一个更好的聊天机器人或者语音助手。那他们的目标或者说第三步是什么?他们的愿景是让 ai 从被动的回答问题进化到主动的完成任务。回答问题到完成任务。对,这是一个本质的跨越。 回答问题本质上还是信息处理停留在数字世界,而完成任务则需要理解物理世界,做出规划并与现实世界进行互动,就像一个真正能帮你办事儿的私人助理,而不是一个只能陪你聊天的笔友,非常贴切。 而要实现这一点, ai 就 必须具备全模态的感知能力,要能看懂图像,听懂声音,真正理解物理世界,而不仅仅是处理文本。嗯,做逻辑最终的目标是把这个 ai 无缝地迁入到像智能眼睛、汽车机器人这样的端侧里,让它成为我们在真实世界中的眼睛、耳朵和代理, 让我想起了他演讲里那句很有力量的结束语。是的,那句话可以说是画龙点睛。真正的智能绝对不是在文本里读出来的,而是在交互里活出来的,活出来的。嗯, 这才是他们真正想做的事情,也是整个人车家生态最终的灵魂。好的,我们来回顾一下,小米正凭借着未来五年两千亿的巨额研发投入, 全力压住人车家这个终极战场。嗯,他们新推出的 ai 模型 mimo v two flash 在 技术上展示了其在性能和效率上的强大实力。 凭借橘汁的性价比,很可能会给开源 ai 市场带来一个新的小米时刻对,迫使所有玩家重新审视自己的成本和定价。是的,这个 将物理世界与数字智能完全融合的愿景非常宏大。但我们今天也看到了,核心的矛盾依然存在,一方面是 ai 能力激动人心的飞跃,另一方面是现实中硬件算力的瓶颈和生态系统整合的巨大挑战。 模型本身令人印象深刻,但那个真正的 ai 无所不在的端侧智能梦想仍在路上。你知道吗?我们今天聊了这么多科技公司如何为我们打造一个无缝连接的智能生态,但聊到最后,我脑子里一直有个问题挥之不去。嗯,最后留给你思考一下, 当这些巨头真的为我们构建起这些无所不包的虚拟宇宙,当一家公司的 ai 同时管理着你的汽车、你的家、你的日程,甚至你的个人健康数据时,这对我们的选择、自由和个人隐私到底意味着什么, 是个好问题。当一家公司既知道你要去哪里,也知道你家里的温度,还知道你的购物清单时,这究竟是终极的便利,还是一个我们无法逃离的被精心设计好的美丽新世界?

小米最近也发布了它的单模型,名字叫 miimo, 据称是世界第二,那咱们今天看看它是不是真的有世界第二的能力。 咱们今天选择的模型是小米官方推荐的七 b 模型,其中最强的是七 b 二 l, 咱们今天就用这个模型来和千门八 b 做对比。 转眼之间我就用 mm studio 把这两个模型都下载好了。啊,咱们先测试一下小米的七 b 二 l 模型,那我就不客气了,我首先问他的问题,你是谁?看他怎么回答,嗯,回答的还不错。然后我再问一下他和谦问的关系,经过一段思考, 答的也不错,不过我高兴的不要太早。于是我又问了他,你和 mata 有 什么关系?他就开始莫名其妙的出英文了,可能是有 mata 两个字吧。 随后我又问了他数学问题,就是一点一零和一点九哪个大,他经过非常慢速的思考,最终得出了正确的答案。 这里看起来非常快,是因为我用了四倍速,想想如果不用四倍速的话,这里又非常非常漫长的。最后我测试他的代码能力,让他帮我复刻一下谷歌的主页,最后给了我一个 html 文件。到最后咱们和千万的版本一起对比。 好,现在咱们进行千问的测试。首先呢,我问了第一个问题,就是千问你是什么?然后第二个问题是一点一零和一点九哪个大?第三个问题也是让他帮我写一份谷歌的首页复刻, 然后他也给了我一份 html 文件。嗯,这里呢,就是快速略过,然后有兴趣大家可以暂停观看。 我这里总结一下测试的结果,在总体上来说,我感觉千万要更好一些,第一个就是文本,他会有更强的逻辑性,上下文更加连贯。然后第二个数学的测试呢,就是速度来说,千万会更好一些。第三个网页测试呢,大家看一下效果吧, 你猜哪一个是千文写的,哪一个是 mimo 写的呢?把你的答案写在评论区吧,之后我会在评论区公布答案。如果你喜欢我的视频的话,可以关注、点赞、转发,谢谢大家。

科技前沿狄采先言,欢迎大家收看二零二五年十二月十七日科技信息差。第一,小米自研 mimo 大 模型二零二五小米人车家全生态合作伙伴大会已经举行,小米 mimo 大 模型负责人罗福利迎来入职小米后首秀, 而且小米近期还发布开源梦模型,小米 mimo v 二 flash 推理速度飞快,罗福利解释其围绕极致推理效率设计结构实现速度提升,该模型多项表现优异。他还谈到下一代智能体系统, 但别的不说,就这个 ppt 我是 非常喜欢的,原因是作者这几天也在做 ppt, 真的 是一个头两个大。 第二,史上最火 mate 近期有博主称历史上华为 mate 三十系列狂销两千多万台,销量最高。但是从 mate 八十系列起,华为公布麒麟芯片型号,显示国产芯片供应链全链路自主可控。或许在未来的某一天,会有新的 mate 系列机型得到更高的销量。 第三,机器人开始自学习。智猿 agb 官宣,联合团队提出面向真实世界的人形机器人全身 vision language action 框架 wholebody vla。 该工作基于智猿灵犀 x 二研究,针对 local manipulation 挑战,引入从人类视频学习面向移动操作的 rl 控制器两项方案。 经真机实验验证, wholebody vla 具备多种泛化能力,为推动人形机器人走向复杂场景提供重要基础,看来机器人也开始自学习了。 第四, intel 新处理器消息, intel 新一代 panzer lake 处理器临近上市,而近日酷睿 ultra 七三百六十五初步跑分现身 gift bench, 单核两千四百五十一分,多核九千七百一十四分,成绩不及前代 ultra 七二六八 v, 关键二者架构相同,但三百六十五因是样品锐屏仅四点七千兆赫兹左右。不过目前曝光的是早期工程样,硬件驱动和系统优化未到位,此前在 passmark 测试中,它展现出一定潜力。第五, iphone 十八外形大调整。 据外媒报道,苹果或对下一代 iphone 外形大变格,计划在 iphone 十八 pro 和 pro max 上摒弃灵动岛耀丸型挖孔,采用左上角单打孔前置镜头与屏下 face id 技术,相关设计概念图已放出。而此前就有消息称其屏幕形态有变,政策是特殊 h i a 挖孔方案。 供应链人士称,这是实现完美全屏前稳妥的高画质自拍方案。不过也有人吐槽苹果在走安卓老路。第六,京东方、三星和解。 全球显示产业两大巨头京东方与三星历经近三年专利拉锯战,后于二零二五年年末握手言和。纠纷始于二零二二年底三星发起三百三十七调查后双方互诉。 要知道二零二五年上半年对抗白热化,下半年局势转机,双方高层互访后,关注点转向商业合作,最终双方就 oled 专利及商业秘密诉讼达成全面和解,还就扩大面板供应达成共识。 第七, iphone air 二翻身。今年苹果进军超薄手机领域,发布 iphone air, 因 esim 等问题销量表现差,首周激活量远低于 iphone 十七 pro max 开设五天,第三方平台降价,供应链也大幅缩减产能。 为扭转颓势,苹果计划提升 iphone air 二吸引力,升级双摄、降低定价,还推迟其发布时间至二零二七年春季,与 iphone 十八等同步推出,形成春秋双发布周期。第八,澎湃 o s 三后台堆叠排布测试 小米澎湃 os 三后台堆叠排布样式在小米社区开启内测招募,报名成功用户可获新版桌面安装包,安装后能在系统设置中切换样式。而且新版本内测上线后,此前纵向与横向排布样式仍保留。 值得一提的是,堆叠后台能以打开时间排序显示程序,可滑动查看。该设计最初源于 webos, 苹果 ios 九也曾采用。第九,小米之后,荣耀宣布即将涨价, 近期内存涨价,全球终端产品面临成本考验。其中博主爆料,小米部分在售平板已涨价,涨幅一百杠三百,其他厂商已发售终端机也会涨价。二零二六年部分终端新机或取消 epb 版本。 而且荣耀相关负责人称,平板即将涨价,建议尽快入手。网友询问新机是否大涨,得到肯定答复。第十,鸿蒙星光盛典新消息 要视频消息,原定十一月二十八日晚举办的中央广播电视总台鸿蒙星光盛典,因香港大部火灾延迟至十二月二十日录播,将在多平台同步播出。 需要了解,盛典以在一起为主题,聚焦开元鸿蒙创新发展,通过四大篇章推进舞台,兼具东方哲学与科技感,还运用前沿技术,众多明星以追光人身份参与。最后祝十二月十七日的朋友生日快乐!以上就是本期消息,让我们下期见。

本来没打算说小米 ai 开源大模型的,有粉丝想知道我对它的评价,我就客观的来说一下吧。小米千万年薪挖来的 ai 天才少女罗福林在昨天的发布会上宣布了小米 vivo v 二 flex 这个免费开源, 也有一些在测评的各种夸这个开源大模型,说算力快,所需费用低。我没有用过咪膜,但我之前用过其他的 g、 p、 d 和 deepsea 豆包等等,还在发布会上自称世界第二。 我给大家说一下,目前在 ai 这一块儿做的比较好的有阿里的前文亲爱的 gbt, 还有罗浮屠的钱东家做的 deep sack。 就 小米目前的研发的投入和成果说明我是世界第二,这个我是持怀疑态度的。

小米刚刚发布了它自研的 ai 大 模型,叫 mimo, 那 我们现在呢进入到的是 mimo 的 api 官网,那这个大模型呢,属于是推理大模型,那最近的这个新闻呢,是十二月十六号,就是现在这个大模型版本是 mimo v 二 flash, 就是 能够支持推理代码和 agent 机座,那现在呢,主要它面向的是开发者,所以做的是 api。 然后同时呢它也做了一个官网,就是这个小米 mimo studio, 它这功能就比较简单了,跟谷歌 ai studio 是 不具备可比性的。当然它也不是针对个人开放的,它只是针对开发者测试用的。 然后我们就简单做一个测试,比如我想写一个这个亚马逊 pua 的 一个申诉文案,那我就在这写了一个我简单的一个需求,然后它给我生成了一个专业的这个 prompt 代码啊,这是 prompt 提示词,然后我就把这个提示词我直接复制粘贴到这里面来, 那这里面呢,我们就不详细看了,你自己去看一下就行了。然后主要就是啊,需要我们自己手动填一下客户投诉的问题,那这个客户投诉的问题呢?比如说我就说这个产品不好用, 产品不好用跟产品页面描述,就我就这么说嘛,就是就是,反正我做一个投诉嘛,不管是无理取闹还是就就是这么回事,反正我就这么说,然后我就可以让他给我生成我的 pua 文件了, 它这个看出来就反应速度还确实很快,因为它现在强调就是它输出这个速度非常快,跟咱们 deepsea 的 一开始做的时候差不多,因为这个开发团队本身就是 deepsea 的 开发工程师挖过来的嘛,一个天才少女叫罗弗利吧, 所以你看他已经把这个东西给你做好了,对吧?做的非常清楚。然后因为我们要做的是什么呢?我们是不是要做的是英文的,所以说翻译成英文 重新输入啊?但是其实我这个提示词这个块,我就,我就可以去调整, 让它变成中英文的。我这是因为我就随时做了一个东西,所以就没那么完善。如果我在提示词里面,你看这已经做好以后,如果我在上面这个提示词,这直接说明给我封成中英文两种语言的这个文案,它就直接就出库了,一次性出库了。 ok, 我 觉得测试下来他这个至少输出速度很快。然后从中文文案来讲,你看他写的还是不错的啊,因为我给他讲了这个逻辑吗? 对吧?现在的根本问题是什么?然后他去描述了一下,然后如何去做整改,是吧?然后未来的一个预防计划,就是基本上是完全根据我的需求来的,然后写了这么一个申诉信。

在我来看,他已经进入了全球 top 一二。

兄弟们,小米发布并开源了自己的最新 ai 大 模型 miimo v 二 flash 啊,说是可以对标 deepsea v 三点二的,我实测了一下,它运行速度是非常的快啊,感觉是要比 deepsea 要快的。然后呢,有两个比较独特的优势吧。第一个就是给中文场景做了深度的优化, 这个呢,我是非常喜欢的,因为我正在写。说是 bi 论文啊,因为我之前用的都是这么奈,小米更懂中国高校的论文要求和评判标准。 第二个呢,就是小米生态原生融合,就是米家生态嘛,对不对?更好的融入数字生活场景。所以呢,这个小米大模型还是有点东西的啊,我把这个网址放在下面了,你们可以去试一试。


我直接找到罗弗利干了两套大模型,一个咪莫一个米洛口啊,我现在听过最好笑的笑话是什么?说罗弗利就加盟两个月就做出了两个大模型出来,说这一定是抄的什么之类的。我靠, 人家罗弗利不是去年挖的吗?人家已经在小米待了将近一年了,只是现在这两个月才正式入职啊,而且咪莫大模型的前身 他不是小爱同学吗?他只是在这个基础上进化而来的呀。啊,还有那个 milo 就 更不用说了,小米做支架也做了一年多了吧,这些技术本身就是通用的,怎么到你们嘴里成了突然冒出来的一样呢? 像罗弗利这种人才,他是过来给你指明方向哎,教你怎么弯道超车的,或者说告诉你呃,怎么做才是最有效的办法给你解决问题的。 那干活的肯定还是手底下一帮人在干的,不可能是他一个人干的事情吧,对吧? 就像你公司的老板负责规划未来啊,然后指明正确的方向,那手底下的员工呢,就负责干活,没有老板这个路可能就走不通,没有员工呢,这个活也干不成,不就是这个道理吗?

ai 圈要被小米给彻底颠覆了。就在刚刚,小米闪电发布了自研 buy 某 v 二 flash 大 模型,站台发布的是号称 ai 天才少女的罗福丽。这位九五后技术大神在二零二五人车加全生态大会上,一上台就放出狠话,小米模型在代码和智能体能力上已杀尽全球前二,媲美中国最强开源模型 deepsea v 二。 不少网友第一时间进行了实测体验。在问题响应速度方面, mimo vr flash 的 确比豆包、 deepseek 以及元宝等模型更快,更出乎意料,甚至能边聊边联网搜索关键更狠的是,小米早已注册 mimo 商标, 覆盖科学仪器、自动驾驶等领域。这哪是做个模型,分明是要把 ai 塞进手机、汽车、家居,打造人车加全生态。当科技巨头还在收费币源时,小米直接把核弹级 ai 免费丢给全球开发者。这一招恐怕要让整个 ai 战场重新洗牌。而我们下一台智能生命体,或许就来自小米。

小米正式大模型深夜突袭,直接来了一个性能 deepsea 同档价格却只要 deepsea 零头的超级性价比模型,这是回归到了当年的不忘初心吗?我们只给大家一九九九的大模型是不是 d b 了,这个模型零点一美元处理一百万 token, 这个要是你要是说给那些美国闭元大模型,他会觉得这玩意就作弊,这不就是免费吗?而且每秒速度一百五十个 token。 团队负责人,天才少女 rufrey 罗福利讲话, 这是小米 agi 路线的第二步,大家应该都记得前段时间一直在炒作罗福利是谁从 deepsea 来的,当年他带队搞出的 miimo v 二 flash 编程能力 cheer 三点四分,直接碾压所有开源模型,最最逼近顶级闭元 s o t a a 到 z 二的模型,而且别人只需要花百分之五十以内的算力,而小米用的是一份相当于百分之一达到同样效果。雷神现在应该是正式发力大模型了,连摩克士大力费时卡罗特来份羊棒,说米德克这部机下的太深了,表面上是个大模型,实际上是用用这个 l l m 怎么样 把手机、汽车、智能家居全部打通,且成本低到几乎没有构建一个别人无法进来的护城河。还记得 咱前面说十四年前的一角角小米手机吗?当年就重新定义了什么叫性价比,现在米玩说了,老子要在 ai 领域再来一次啊!当时我就决定了,要用极致性价比和白菜的价格让所有人都用上顶级 ai。 雷神这盘棋越下越大了啊!

九五后, ai 届顶尖才女罗福丽入职新东教后首次公开亮相。罗福丽先后在阿里达魔院主导多语言与训练模型 vceo 研发,推动 icemind 开源生态落地,成为业内知名多语言模型标杆。后加入 deepsea 后核心参与顶尖猫大模型研发,助力团队实现开源模型与顶尖技术差距从三年缩短至数月的突破。 如今执掌新小米 mini 大 模型,井越于便带着重磅成果登台,虽稍显紧张,却难掩超越年龄的专业锋芒。有请小米 mini 大 模型负责人罗福利女士。 哈喽,各位开发者大家上午好,我是罗福利,今天呢,我想带大家换一个视角, 从十亿年生物进化的长河中重新去审视。我们正在经历这一场 ai 改革。本次发布会上,他谈及了独特的行业洞见, ai 正以非限性的方式重演人类大脑六亿年的进化史。 ai 不是 对参数这么简单,得像大脑一样谱全认知拼图。 比如他后续要做的物理世界交互,就是让模型看懂众因果,这些规律也只当语言复读机。语言是人类思维和物理世界在符号空间的投影。在他看来,光会说话不算真智能,得多模态融合。比如模型得能看懂 听声,连终端,像人一样用全身感官认知世界。真正的护城河是科学的研究文化与产品转化能力,他带的团队就进行这点小而美重创新研究产品工程凝成一股绳,用好奇心驱动探索,不搞虚头巴脑的技术壁垒。 开源是人类智慧共同进化的唯一路径,每一句都彰显顶尖研究者的通透与格局。这次发布会,他直接缩哈模型全重技术免费用行动说,开源才是技术加速的王道。 本次发布会亮点十足。他主导研发的全新模型,以三零九 b 总参数仅十五 b 激活量的高效设计,掌握全球开源模型套二加计,凭借哈瑞 s w a 架构与三层 n t p 推理加速技术,推理速度提升二至二点六倍,同类顶尖模型中成本大幅降低,实现效能与性价比双突破。 更重磅的是,发布会当天即宣布全量开源模型全重技术开放用行动进行。开源是分布式技术加速主义的理念。 谈及后续研究方向,它明确三大核心,一是补全 a 氧化拼图,聚焦物理世界交互能力,让模型看懂物理规律,理解世界运作逻辑,而非单纯的语言模拟器。二是强化多模态感知融合, 推动模型嵌入智能终端,融入日常工作流。三是持续深耕高效能模型架构,以更优推理效率和扩展能力,助力 agi 普绘画落地。其背后小而美、重创新的团队将坚持研究产品工程深度藕合,以好奇心驱动未知探索。

算力和数据了也并非最终的护城河。就在刚刚,雷军千万年薪挖来的天才少女罗弗利迎来了他的公开演讲首秀。虽然肉眼可见的有点紧张,但他带来的这款小米最新大模型 mimo vr flash 也可以说是诚意满满。 mimo vr flash 总餐数量高达三百零九币, 激活参数只有十五 b。 罗弗利表示,这是一个非常小的模型,但在代码和 agent 测评精准测试中,已经达到全球开源模型啪啪。而罗弗利在演讲中也解密了其背后的魔法。首先,怎么做到极致的快,这次 小米搞了个 hybrid s w a 架构和三层 m t p 推理,简单来说就是模型不再是一个字一个字往外蹦,而是一次性预测好几个词, 让他的推理吞吐量直接飙升,推理速度提升了二到二点六倍。其次,怎么让模型更聪明?罗弗利表示,传统的强化学习太不稳定,小米提出了一种叫 m o p d 的 全新后训练范式,这就像请了一个专家团,手把手教着一个学生, 用极少的算力就能让模型能力快速跃升。当前,咪蒙 vr flash 已经初步具备了模拟世界的能力,比如通过 html 写操作系统,模拟太阳系,画一棵圣诞树。罗弗利在演讲中也谈到了对未来的判断, 因为其实我认为真正的下一代智能体的系统,它不是一个语言模拟器,它是需要 跟我们的世界共存的一个智能体,本质上我们认为技术上是可以追赶的算力和数据了,也并非最终的护城河。然后,真正的护城河呢?其实我认为是科学的研究文化和方法 是将未知的问题转化成模型的优势,最终去结合可用产品的一个能力。