粉丝1.8万获赞103.6万

小米 miimo ai 大 模型呢,开源了,据说呢,它是可以和 d p 三点二白一白时光的,那除了常规的问答之外呢,它是可以生成直接网页端可用的代码, 比如我在这里输入帮我写一个三角函数的关系式 e, 可以 网页端运行的那种,那只要几分钟呢,它就会生成一串代码,并且呢,这串代码是可以直接在线预览的。 说实话,这种在线生成代码并且在线预览的功能呢,对普通人来说其实用处并不大,但别忘了,小米的智能家居生态呢,可不是闹着玩的,来发挥一下想象,当小爱同学也揭露了咪某,也许在未来的某一天,我们只需要跟小爱同学说,哇,好无聊啊,来找个游戏打发一下时间吧。 那这个时候空调根据温度自动打开加湿器呢,也会自动判断空气的湿度,那像什么投影仪,窗帘、音响、灯光这些呢,全部都帮你自动设置好,这个时候你只需要拿起手机美美的畅玩一整天。那又或许你跟小爱同学说今晚下班呢,我出去吃个饭可能九点半才回家, 那这个时候家里的扫地机器人呢,开始工作,扫完地,拖完地之后,自动打开窗帘,开始通风晾干。当你打开家门的那一刻,小黑音响响起了他的声音,他说,今天玩的怎么样,还开心吗?热水呢,我已经准备好了,快去洗澡吧。 也许在未来,我们真的可以拥有属于自己的贾维斯。那么视频的最后,你们觉得小米咪某算不算是国产 ai 的 第一梯队呢?欢迎评论区留言。

大家好,我是 eden。 小 米呢,推出了微软 vr flash 模型,我们可以看到呢,在多项机选上这个模型,表现都非常优异,现在来看一下它的技术报告啊。 vr flash 呢,意味着这个模型就是很快, 它的目标是在长短上下文推理 agent 三者同时要长的场景里,做到更快更省,总参数三百零九币,激活参数十五币。所以它是一个 m o e。 的 模型, 训练的数据量呢,达到了二十七 t token, 它是用到混合注意力,然后用到 m t p。 之前我在介绍千问三 s 的 时候,也介绍了 m t p。 它的有个很大的核心设计呢,是 popd, 也就是多位老师模型给出逐步的 token 指导,让学生同时学会多项专长。 左侧可以看出,虽然这个模型呢,它规模啊要比 k 二 cking 或者是 deepsea v 三点二要小很多, 但是在编码还有工具调用数学方面,它还是非常优秀的。而在 g p q a 科学问题方面,可以看到它是不如 k 二的。 s w a 呢,滑动窗口就是像只看附近几行的代码上下文,它可以省内存, 而 g a 全局注意力,它是偶尔全局搜索一次。在这个模型里呢,用到的比例呢是五比一,不要 flash。 它的长上下文解锁成功率还是非常不错的,我们可以看一下, 在六十四 k 的 时候,它的成功率是九十九点九。 m t p 呢,它可以让深层的 tucker 变成并行验收。在后训练阶段, popd 的 直观效果呢,就相当于把老师的技能拼起来。 当你既想要会写代码,又想要这个模型呢,会算题,还想要这个模型会用工具,那 m o p d, 它就会减少这些不同能力之间的互相牵制。 vr flash, 它的总参数对比其他真的是啊,低到非常多。 从这篇报告我们就可以感知它在对比其他模型的时候,推理速度会要更快。它的上下文有二百五十六 k, 还是要比 deepsea v 三点二的一百二十八 k 要好很多。但是呢,它也有一些不足,因为它的模型啊,比较小, 所以呢,它在纯知识问答上不如更大的模型。那我们来到它的 api 文档可以看到呢,它这里写了是支持 c c, 也支持 codex。 但是他在支持 c c 的 时候呢,他这里写了啊,暂时不匹配 c c 的 思考模式,需要在 thinking of 的 模式下使用。我在 client 和 lucid 里面可以设置 open ui 兼容的 啊格式来调用它。但是目前还没办法打开它的推理开关。所以今天的测试呢,主要在 mimo 的 air studio 里,先让它做一个无与伦比的理发网页。我们看到它生成的效果的话,和 k 二是非常类似的效果。 这是他生成的悟空的穿越新生活,切换不同的场景。他生成的这个场景的话,感觉,哎,也挺有趣, 可能会给我的感觉像 crowd 三点七左右的程度。再让他生成 a s c i i 的 烟花表演,点击一下, 它这里的先是烟花往上,然后爆炸。它的这个效果呢,是,呃,比较平坦,我们看一下 opus 四点五生成的效果, 这个烟花效果还有不同颜色,色彩,螺旋状,很像呃,烟花爆发的这种感觉。再让他梳理一下人类简史这本书的核心道理,我们可以看到他这里执令追寻做的还是很不错的, 有很多图表,排版的话还行。再看兵马俑街舞的动画, 那我们可以看到这里兵马俑在跳,但是他的兵马俑的造型做的比较简单, 我点击加入更多的兵马俑,再看他生成的绵阳理发店。这道题,其实我让多个模型都测过,我们可以看到左侧,其实我给他的要求是特别多的, 我是希望他是否第一能遵循我给他的指令,第二呢,啊,是否能理解这么多不同的物品,或者说人物 啊,他们之间的关系。可以看到窗户,这里的光源是没有什么特别的变化,最上方的风扇呢,也是有点问题。 然后这里的等待小羊啊,造型也不够美观,而且这里缺少了一个理发的小羊。 左下角欢迎地垫呢,嗯,做的也是一般,而且呢,我们可以看到这个瓶子已经啊不在这个架子上了,所以这里是有些问题的。再让他写一个不超过三百字的短故事, 他生成的这个故事还是挺有趣味性的。在之后呢,我让他用恰好四十个字写一段话, 它的技术呢,和上面它输出的文字啊,数量是不匹配的,也没有达到我一开始给他的要求,所以在这个问题上,是不是啊, m t p 反而限制了它。再看它生成的万花筒名片生成器, 我们点击随机生成不同的图案,那它是可以生成的,它生成的这些图案的话,样式比较简单,这是它导出之后的效果,这和我们日常用的名片的尺寸还是有很大差别的。当我不开启思考,在 client 里面让它生成新怪诞主义的网页的时候, 我们可以看到他啊深沉的,还是非常遵守新怪诞主义的这种样式的。这是开启思考的记忆书房。但是呢,当我点击不同的年份的时候,我们会看到这个书房呢,又不知道跑去哪里了,我得再刷新一下。 现在他才能在啊页面上进行停留一八年呢。是说啊,第一本书放在桌上,但是我们可以看到这里有 呃,像是两本书,但是都是悬浮在书桌上。这是他生成的现代元素周期表,我们可以看到呃一次提示后,他生成的元素是有的,但是数量不是那么多。这是他生成的打字机测速应用。当我在这里 输入一些内容的话,点击停止书写下方,他并没有实时反应准确率是多少, 所以它的界面做的还是挺不错的,但是有些逻辑它没有添加。总体而言, vr flash 在 我的体验里呢,它和那些大很多的开源的模型呢?在我的简单体验里,编码上可能是不如的, 但是我们看它的价格,它的价格是非常有性价比的,它在这样的一个尺寸里面,它完成一些小任务完全是没有问题的。 tipster v 三零二在我看来已经是非常非常优惠了。而 vr flash 呃比它呢还要便宜更多,还是非常推荐大家呃调用它的 api, 然后在一些呃小任务里面去使用它的。以上呢,就是我今天的分享,如果喜欢我的视频,欢迎加入我的知识星球,我会分享最新的 ai 资讯,分享源代码,回答你的提问,我们下次再见。

今天,我们来深入聊聊一场正在你我身边悄然发生的科技巨头之战。嗯,这场战争争夺的可不仅仅是你的手机屏幕,而是你整个的生活空间,你的家,你的车。没错,以及连接着一切的智能体验。这个战场的名字听起来很宏大,叫人车家全生态。是的, 而我们今天要把放大镜对准一个核心玩家小米,他们最近在二零二五年的人车家全生态合作伙伴大会上扔出了一堆重磅消息,对,我看了几篇关于这次大会的深度报道。呃,有几个点特别有意思,一份是关于他们新上任的 ai 负责人,那个被称为天才少女的罗夫里的首秀演讲,信息量很大。嗯, 还有几份是专门儿拆解他们新发布的那个 ai 大 模型的性能分析报告。把这些材料放在一起看,就能拼凑出小米未来的一个大蓝图。这是正是我们这次的任务,为你剖析小米的这个红大蓝图到底是什么。 我们将一起看看他们所谓的秘密武器。一个叫 miimo v two flash 的 新 ai 模型,究竟只是又一个市场宣传噱头?还是说,它真的有可能成为那个改变你未来生活方式的游戏规则改变者?好,我们先从大背景说起。 人车家全生态这个词听着就挺唬人的,但它其实并不是小米第一个提出来。没错,这更像是当前整个科技行业的一个核心趋势,或者说一个终极战场。嗯,它的理念其实很简单,就是把你的个人设备,比如手机、手表, 你的出行工具就是汽车和你家里的所有智能设备,什么音箱、电视、空调全都彻底打通,目的呢?创造一个无缝连贯的用户体验。给我举个具体的例子,它到底能解决什么痛点?你想象一下这个场景啊, 你开车回家,拿导自动把预计到达时间发给家里的系统。好的,在你到家前五分钟,空调提前打开,调到你喜欢的温度,热水器开始加热。这个我喜欢。当你把车停进车库,车里正在播放的播客,在你推开家门那一刻,无缝切换到客厅的智能音向上继续播放。哇,整个过程你什么都不用做,系统会主动为你服务, 就是他想实现的终极便利。听起来确实很诱人,这意味着这块市场蛋糕会非常大吧?不是一般的大。我们手头的资料里引用了波士顿咨询的一份预测,说到二零三零年人车家这个生态将占据整个智能硬件市场增量的百分之五十八。五十八 对,这几乎是未来增长的半壁江山了,所以你看,谁都不想错过。明白了,难怪这么拥挤。那现在这个赛道上都有哪些主要玩家在掰手腕?这就是一个非常有趣的跨界战场。你仔细看会发现,主要有三股势力背景完全不同哦。 第一股也是最强势的,就是科技巨头。这里面的老大哥是华为,他们早在二零一九年就靠鸿蒙系统提出了一 plus、 八 plus n 的 全场建战略,起步非常早。对,可以说起步最早,布局也最深,小米现在是卯足了劲在后面追赶。等一下,你把另外两股势力说一下,我感觉这里面有点意思, 除了华为,小米这种做手机个系统的还有谁?另外两股势力就更有趣了,一股是车圈新贵,你像比亚迪、蔚来理想这些。嗯,造车新势力,他们发现光把车造好还不够,必须给车加上智能的标签, 所以他们也想把生态从车里延伸出去,用这个来提升汽车的吸引力,让车成为一个移动的智能生活空间。那另一个呢?是传统家电厂商,正是向海尔、美的这些家电举头。他们本来是家这个场景里的绝对王者,但现在也感到了焦虑。他们焦虑什么? 他们害怕自己辛辛苦苦做的智能家电,最后都变成了给别人打工的,硬件、操作系统和入口都被手机厂商控制了,所以他们也想主动出击,把自己的产品线从家庭延伸出去,寻找新增长点。这就有意思了, 你把华为、比亚迪还有海尔放在一起,这三波人平时八竿子打不着,现在却在同一个战场上。对,但他们的起点和能力完全不在一个量级上,他们抢的真的是同一个东西吗?还是说车企和家电企业最终都得选边站,成为科技巨头的富翁?你这个问题问到点子上了, 表面上大家都说人车家,但核心诉求和打法完全不同。怎么说科技公司?像华为和小米,他们手里有最强的牌、操作系统和 ai, 他 们想做的是装甲,是平台的搭建者。嗯,制定规则的人。对,希望把所有设备都纳入自己的体系,用软件和服务来锁定用户,建立生态护城河。就像苹果做的那样,一旦进去了就很难出来。没错,而车企和家电企业目前更像是玩家, 他们的核心优势还是在硬件制造上。嗯嗯,他们也想做生态,但更多是做为一种差异化的卖点,或者说是一种防御策略,防止自己被管道化。 但从长远看,他们独立构建一个能和鸿蒙或者小米的澎湃 o s 抗衡的底层系统的难度非常大,所以未来可能会出现合作与结盟。对,但主导权之争会异常激烈。本质上,大家都在抢夺用户全场生活的那个唯一的总开关,而小米为了抢这个总开关,这次是下了血本儿, 绝对是下了血本儿。他们在大会上宣布,未来五年计划在研发领域投入两千亿人民币。两千亿,这是一个非常惊人的数字,而且钱要花在哪里,目标非常明确。芯片、操作系统和 ai 这三大柱子,就是它们构建人车加生态的地基。好了,铺垫了这么多宏观背景,我们终于要说到那个最核心的部分了。 花了这么多钱,总得有个能镇场子的东西。嗯,为了驱动这个庞大的生态,小米亮出了他们的王牌,一个叫 miimo vivo flash 的 新 ai 模型。而发布它的人正是它们新上任的 ai 负责人罗福利。对,媒体上都说它是前 deep six 的 核心成员,甚至称它为雷军的秘密武器。 这个名号可不小,确实不小,它的首秀演讲信息量非常大,最耐人欣慰的是它对 ai 发展路径的一个看法,它用生物进化来类比, 但他说 ai 的 发展路径和生物的演化是倒序的。倒序?这个比喻太妙了,我从来没这么想过。展开说说怎么个倒序法。他是这么解释的, 生物的进化是先有行动和感知,一个最简单的,虫子首先要会动,会躲避危险,会寻找食物。嗯,先生存。对,然后慢慢发展出更复杂的思考和模拟能力。最后,人类才在智能金字塔的顶端掌握了语言这个强大的工具。你看,这是一个从底层,也就是行动往上走的过程。我明白, 那 ai 呢? ai 恰恰相反。现在的 ai 大 模型是通过学习互联网上亿万的文本和代码,先掌握了语言这个顶层能力。嗯,他天生就是一个语言学家和程序员,但他对我们生活的这个物理世界几乎一无所知。他不知道苹果是硬的,水是会流动的,没错,玻璃是会碎的。 所以 ai 现在才反过来试图去弥补对物理世界的感知和模拟能力。它的路径是从顶层,也就是语言往下走。这就像一个天生就会写诗的学者,现在才反过来学怎么走路和感知冷暖。 这路径确实很奇怪,很有反直觉,完全正确。所以罗弗里得出一个结论,现在的大模型,很多都只是一个完美的语言外壳,缺乏对现实世界的真正铆钉。嗯, 因此,通往 a g i, 也就是通用人工智能的真正道路,不是去写一个更会聊天的程序,而是要去推演整个世界的运作逻辑,打造一个虚拟宇宙。这是一个非常宏大的愿景, 也解释了它们模型的底层设计思路。正是。好,那我们就来看看这个承载了如此宏大愿景的新模型, moe v two flash 到底有什么特别之处?我们可以从几个关键点来看。首先是参数,这里面有个巧妙的障眼法哦, 它的总参数高达三万九千亿。这个数字听起来非常吓人,属于巨无霸级别,但是它用了一种叫做 m o e, 也就是专家混合的架构。专家混合?对,你可以把它想象成一个拥有三万九千一个脑细胞的大脑,但你在思考一个具体问题时,并不需要调动所有的脑细胞, 只需要激活最相关的那一小部分专家就行,所以它每次实际激活的参数只有十五亿。没错,既庞大又轻巧。接下来这个点我猜猜是最小米的, 也是最吸引 developer 和企业的地方。极致的性价比。是的,这一点非常小米。资料里的数字对比很惊人,第一是速度,推理速度达到每秒一百五十个 token, 对 于这么大体量的模型来说非常快。嗯哼。 第二是成本,价格低到夸张,每 buy money 输入 token 只需要零点一美元。零点一美元?对,做个对比,性能和时呃,速度跟它在同一个水平线的谷歌 gemini 二点五 pro, 成本是它的整整二十倍。 等一下,二十倍的差距,这听起来几乎好到不真实了。俗话说便宜没好货,它的性能真的能打吗? 还是说这是只是官方发布会上公布的,经过优化的测试数据,我们知道这种测试是有操作空间的,这是个很好的问题,也是很多人会有的疑虑。 从他们公布的多个权威测试榜单来看,他的表现确实进入了全球开源模型的顶尖行列。是吗?嗯,在编程、数学和科学知识这些硬核能力上可以和那些比他大量捍卫的模型相比为, 比如在一项横聊代码能力的 human evo 测试中,它甚至超过了所有已知的开源模型。这么厉害?当然,你说的很对,这些都是官方数据,我们还需要等待更多第三方的独立测评来验证,但至少从纸面上看,它打破了高性能必然高沉稳的定律。好的,那我们暂时相信它的数据。 总结一下就是,一个旗舰级的性能,却只卖一个入门级的价格。对,这就好像用买一台普通家轿的钱买到了一辆性能跑车。那他们到底是怎么做到的?我们来深入聊聊那些听起来有点硬核但很酷的技术细节吧。好的,我尽量用通俗的方式来解释,主要有三大技术创新。 第一个叫混合注意力机制。混合注意,嗯,你可以把 ai 阅读一段文字,想象成我们自己看书。 我们看书的时候,大部分注意力都集中在当前这句话和上下文的几个词儿上,以保证连,连贯性。对,连贯性,但我们也会时不时地抬头扫一眼整个段落或者章节标题,确保自己没有偏离主旨。所以,这个混合注意力机制就像让 ai 学会了我们这种阅读方式, 平时只看眼前的几个词,但每隔一小段就抬头扫一眼大局,确保自己没跑偏。你这个比喻非常精准,他就是用这种聪明的办法,让模型既能关注局部细节,又能兼顾大局信息,同时极大地减少了对 g 气门内存的占用。嗯,而且这里面他们还发现了一个反直觉的神奇窗口。 你可能以为 ai 一 次看得越多越好,但他们通过实验发现,一百二十八个 token 大 小的这个窗口效果是最佳的。欸,有意思,盲目扩大窗口反而会导致性能下降。这就像我们人的专注力一样,有一个最佳的范围。那第二个技术创新呢?第二个叫多拎盆儿预测,英文是 m t p。 传统的 ai 模型生成内重,就像我们说话一样,是一个词儿一个词儿往外蹦的。嗯,但 m t p 技术让它能一次性并行预测好几个词儿。 这就好像一个人在说话前,脑子里已经想好了后面三四个词儿要说什么,然后一口气说出来。哦,我懂了。这个创新非常直接,让内容的生成速度提升了二到三倍。这个很好理解,就是从逐字输出变成了逐句输出,效率大大提升了。 那第三个呢?听起来更复杂一点。第三个是一种叫 m o p d 的 高校训练范式,我们可以把它理解为一种超级学徒训练法。超级学徒,嗯,想象一下,你想培养一个全才学生模型, 传统的方法可能是找一个全能的老师模型来教他。但小米的方法是找来一群专家老师,一个老师是数学家,一个是程序员,一个是文学家啊啊。然后让这个学生模型同时向所有这些专家学习,就像一个学生同时上了所有顶尖科学家的私教课。可以这么理解, 学生模型会自己生成一些内容,然后让所有专家老师来打分,给出非常密集、多维度的指导,效率很高极高,只用传统方法五十分之一的算力就能达到甚至超过老师的水平。 而且更有意思的是,资料里提到,今天的学生还能成为明天更强的老师,形成一个循环。对,当学生很快超越老师之后,他们就可以用这个更强的学生模型来当新的老师,去教下一代学生,形成一个自我净化的飞轮。这个飞轮效应听起来很可怕,潜力巨大。 好了,我们现在知道它又快又好又便宜,技术上也很有突破。嗯,但作为一个普通用户,我最关心的问题来了,我什么时候能在我的小米手机上离线用到这个强大 ai 呢? 我期待的是一个真正装在手机里的超级大脑,而不是一个必须联网的云端工具。这就触及到了理想和现实之间最关键的差距。 尽管 memo v two flash 在 设计上已经把效率推到了极致,但它那一百五十亿的激活参数,对于目前最高端的旗舰手机来说,仍然是房间里的大象。怎么说? 是手机的芯片,算力根本带不动吗?对,我们的资料里有明确的数据,现在手机端侧模型的舒适区大概是在三十亿到七十亿参数之间。三十亿到七十亿对,一旦超过这个范围,功耗和发热就会变得难以控制。一百五十亿已经远远超出了这个舒适区。 嗯,所以,尽管小米在发布会上描给了一个万物互联的端侧智能图景,但就这个旗舰毛型本身而言,它目前本质上还是一个云端模型, 你的设备必须联网才能使用它的全部能力。我明白了,所以我们期待的那种所有 ai 能力都在手机本地完成,不依赖网络,绝对保护隐私的真正的 ai 手机改革可能还需要一些时间。是的,这个 ai 大 脑主要还是在云端服务器里,而不是在我手边的设备里。是的,这是一个非常清新的现实。 对于用户手中的终端来说,这依然是一个重度依赖网络的云端模型。端侧的梦想很美好,但硬件的限制是目前最大的瓶颈。 那么,把所有这些信息串联起来,这一切到底意味着什么?小米的最终目标是什么?如果我们把这与更大的途径联系起来,罗夫里在演讲中把 mimo v two flash 称为他们 agi 路线图上的第二步。第二步对 这个表态非常重要。这清晰地表明,小米的长期目标绝不仅仅是做一个更好的聊天机器人或者语音助手。那他们的目标或者说第三步是什么?他们的愿景是让 ai 从被动的回答问题进化到主动的完成任务。回答问题到完成任务。对,这是一个本质的跨越。 回答问题本质上还是信息处理停留在数字世界,而完成任务则需要理解物理世界,做出规划并与现实世界进行互动,就像一个真正能帮你办事儿的私人助理,而不是一个只能陪你聊天的笔友,非常贴切。 而要实现这一点, ai 就 必须具备全模态的感知能力,要能看懂图像,听懂声音,真正理解物理世界,而不仅仅是处理文本。嗯,做逻辑最终的目标是把这个 ai 无缝地迁入到像智能眼睛、汽车机器人这样的端侧里,让它成为我们在真实世界中的眼睛、耳朵和代理, 让我想起了他演讲里那句很有力量的结束语。是的,那句话可以说是画龙点睛。真正的智能绝对不是在文本里读出来的,而是在交互里活出来的,活出来的。嗯, 这才是他们真正想做的事情,也是整个人车家生态最终的灵魂。好的,我们来回顾一下,小米正凭借着未来五年两千亿的巨额研发投入, 全力压住人车家这个终极战场。嗯,他们新推出的 ai 模型 mimo v two flash 在 技术上展示了其在性能和效率上的强大实力。 凭借橘汁的性价比,很可能会给开源 ai 市场带来一个新的小米时刻对,迫使所有玩家重新审视自己的成本和定价。是的,这个 将物理世界与数字智能完全融合的愿景非常宏大。但我们今天也看到了,核心的矛盾依然存在,一方面是 ai 能力激动人心的飞跃,另一方面是现实中硬件算力的瓶颈和生态系统整合的巨大挑战。 模型本身令人印象深刻,但那个真正的 ai 无所不在的端侧智能梦想仍在路上。你知道吗?我们今天聊了这么多科技公司如何为我们打造一个无缝连接的智能生态,但聊到最后,我脑子里一直有个问题挥之不去。嗯,最后留给你思考一下, 当这些巨头真的为我们构建起这些无所不包的虚拟宇宙,当一家公司的 ai 同时管理着你的汽车、你的家、你的日程,甚至你的个人健康数据时,这对我们的选择、自由和个人隐私到底意味着什么, 是个好问题。当一家公司既知道你要去哪里,也知道你家里的温度,还知道你的购物清单时,这究竟是终极的便利,还是一个我们无法逃离的被精心设计好的美丽新世界?

兄弟们,小米发布并开源了自己的最新 ai 大 模型 miimo v 二 flash 啊,说是可以对标 deepsea v 三点二的,我实测了一下,它运行速度是非常的快啊,感觉是要比 deepsea 要快的。然后呢,有两个比较独特的优势吧。第一个就是给中文场景做了深度的优化, 这个呢,我是非常喜欢的,因为我正在写。说是 bi 论文啊,因为我之前用的都是这么奈,小米更懂中国高校的论文要求和评判标准。 第二个呢,就是小米生态原生融合,就是米家生态嘛,对不对?更好的融入数字生活场景。所以呢,这个小米大模型还是有点东西的啊,我把这个网址放在下面了,你们可以去试一试。

小米的米诺大模型终于发布了,很多人都说他特别厉害,有的人甚至说他能力仅次于 deepsea。 结果苏苏我就问了他一个最简单的问题,他就翻车了, 这你敢信?这个问题呢,就是经典哲学题,问你是谁?我打开了深度思考,跟米诺说了一句,介绍一下你自己。结果相当奇怪,得出来的结论是,书虫、追星族、馋猫。 这都什么乱七八糟的呀?然后点开一看,才发现他搜出来一个我是谁的小学生的作文,然后总结了一遍。 哎,那不信邪的我肯定重新又问了一遍呀。这次终于正常了,不过也花了二十秒才思考明白, 相比之下,别的 ai 怎么样呢?我把同样的问题问了一遍深度思考的豆包和 deepsea, 豆老师是真的快,可以说是秒回,也没有答非所问。 deepsea 呢,花了五秒来思考,回答的不仅准确详细,还特别有韵味。 我的怀疑啊,是因为咪某刚出生,还没两个钱的熟练,可能在操练一段时间也能变得更好吧。那我们就给他点时间吧。对了,希望咪某能早点出个 app, 目前只能网页版,真是麻烦。

还记得我说的吗?小米的咪莫大模型,它的运营成本非常的低,输入和输出的价格呢,仅为 deepsea 的 四分之一啊,一个是七毛钱,一个是二点一块钱啊, 所以大家可以想象出小米做的东西有多恐怖了吗?嗯,而且我发现很多人可能不知道米洛克和咪莫的区别啊, 你 logo 是 拿来干嘛的呢?它是一个视觉语言大模型啊,就是它能通过摄像头知道你在干嘛,它可以用在呃支架上,用在机器人上,还有家里的智能家居上, 他只需要通过摄像头看到你在做什么,他就可以执行相应的动作,或者他认为的动作。然后这个咪莫大模型呢,你可以把它理解为一个高级的小爱同学啊。而且你知道咪莫这个运营成本低到这个价格之后有多么的恐怖吗?嗯, 低成本能够让他快速的铺开,快速的铺开呢,又能让他更快的进化啊, 或者说小米做出了这个 mimo 之后有多么的恐怖吗?我给你举个例子吧,我今天看到特斯拉又和 rock, 然后人家就读了这么一段指令,哎,我想去电影中,我想去旧金山中经常被炸的那座大桥,然后再去吃个麦当劳。 嗯,不过去麦当劳之前先带我去充电站充电,然后他就给他规划出了金山啊啊,金山大桥啊,就给他规划出了金门大桥,然后去麦当劳的路线,中途给他规划了一个超冲路线,让我看完这个之后有多震撼吗? 我们的。然后这个东西我现在只在小米身上看到了未来,因为只有小米能够把它落地到车上面,或者说更多的智能家居上面,你这种数量滚起来的训练速度你知道有多可怕吗? 然后又只有小米能落地,因为其他车子他做不了这种东西,你就就正向循环,建立起来之后真的除了恐怖我找不出其他形容词了。

小米咪猫机做大模型今天正式公布了一条视频,带你了解小米自研的大模型有多快! ready go!

如何看待小米发布并开源了自己的最新 ai 大 模型 mimo v 二 flash? 哎,我先说结论吧,如何判断 ai 大 模型?它强不强,只需要看能不能帮助我们 普通人审视。你吹得再高端没有任何用,老百姓用不上它就是垃圾。那我们再说说 mimo v 二 flash。 按照官方的说法,这次它对标的是 dimix v 三点二发布会,我这里就不再 误数了。我只说一件事,我们团队经过十次,他是真的快,不是感觉快,是你在用的时候会明显感觉到他反应快,反馈直接,不拖泥带水。但普通人不关心他模型有多牛,只关心他能不能替我少操点心。如果你对下面两种真实的生活场景有需求,那么这个模型你必须重点关注。很多人用 a s 大 的通点 是什么?他懂中文,但不懂中国话,也听不懂中国人的生活方式。咪某这类模型真正有价值的地方在于,他不是翻译式的中文,是本土语境的中文。 比如工作群五十多条废话帮你提炼,重点合同通知、政策文件,用人话讲给你听,让你明白,长语音会议机要直接变成结论。说白了,工作党可以重点注意。第二点, ai 如果只存在于在 app 里,那么它就是一个玩具。如果能进入在系统里,那么才能叫做 工具。你想象一下,你的手机,你的平板,你的任何小米设备日程备忘,家庭设备状态,不用你一个个点一个个找你,此时此刻只需要说一句话,我今天很忙,帮我把能自动的都自动了,噔 提醒形成设备,在同一逻辑下协调工作,说人话,把 ai 变成了我们的生活管家,而不是那个傻乎乎的聊天对象。要记住, ai 的 价值不是模型的大小,是替你省下了多少事。如果 ai 不 能融入我们的生活,那么它再快,它也只是参数。

小米最近也发布了它的单模型,名字叫 miimo, 据称是世界第二,那咱们今天看看它是不是真的有世界第二的能力。 咱们今天选择的模型是小米官方推荐的七 b 模型,其中最强的是七 b 二 l, 咱们今天就用这个模型来和千门八 b 做对比。 转眼之间我就用 mm studio 把这两个模型都下载好了。啊,咱们先测试一下小米的七 b 二 l 模型,那我就不客气了,我首先问他的问题,你是谁?看他怎么回答,嗯,回答的还不错。然后我再问一下他和谦问的关系,经过一段思考, 答的也不错,不过我高兴的不要太早。于是我又问了他,你和 mata 有 什么关系?他就开始莫名其妙的出英文了,可能是有 mata 两个字吧。 随后我又问了他数学问题,就是一点一零和一点九哪个大,他经过非常慢速的思考,最终得出了正确的答案。 这里看起来非常快,是因为我用了四倍速,想想如果不用四倍速的话,这里又非常非常漫长的。最后我测试他的代码能力,让他帮我复刻一下谷歌的主页,最后给了我一个 html 文件。到最后咱们和千万的版本一起对比。 好,现在咱们进行千问的测试。首先呢,我问了第一个问题,就是千问你是什么?然后第二个问题是一点一零和一点九哪个大?第三个问题也是让他帮我写一份谷歌的首页复刻, 然后他也给了我一份 html 文件。嗯,这里呢,就是快速略过,然后有兴趣大家可以暂停观看。 我这里总结一下测试的结果,在总体上来说,我感觉千万要更好一些,第一个就是文本,他会有更强的逻辑性,上下文更加连贯。然后第二个数学的测试呢,就是速度来说,千万会更好一些。第三个网页测试呢,大家看一下效果吧, 你猜哪一个是千文写的,哪一个是 mimo 写的呢?把你的答案写在评论区吧,之后我会在评论区公布答案。如果你喜欢我的视频的话,可以关注、点赞、转发,谢谢大家。

今天小米 mini 大 模型正式发布,那大家手上的小米手机有搭载这个大模型吗?我们问问小爱吧。小爱同学怎么了?我在请问你怎么看今天你们发布的 mini v 二大模型呢? 你说的应该是小米 miimo vr flash 大 模型,它是强大、高效且超高速的基础语言模型,在推理代码和智能体场景方面表现出色,是出色的日常任务通用助手。其总参数量三千零九十亿, 激活参数量一百五十亿,专为智能体 ai 设计,在多项综合机准测试中表,我是基于小米自研的小米大模型开发的智能体, 目前未安装 mi mode vr flash 模型。我的能力和功能由小米大模型提供支持,专注于为你。看来小爱同学暂时还没搭载,等等看后续吧。


今天咱就来一口气,深度解析小米发布的最新咪某大模型。很多人可能觉得大模型这东西不就是一堆科技术语堆积出来的概念吗?离咱普通人生活远着呢。 我告诉你们,可别小瞧了这咪某大模型,它可是要掀起一场科技风暴的存在。先说说大模型是个啥?简单来讲,大模型就像是一个超级智慧大脑, 他能学习海量的数据,然后根据这些数据进行分析、推理和决策。这就好比古代的谋士,上知天文下知地理,能给你出各种绝妙的主意。 而小米的密谋大模型就是这样一个集万千智慧于一身的科技谋士。小米在研发密谋大模型时可是下足了功夫,他拥有强大的语言理解和生成能力, 你跟他聊天,就像跟一个知识渊博的朋友交流,不管是诗词歌赋还是科学技术,他都能对答如流。这就好像你身边突然有了一个无所不知的万事通,随时为你答疑解惑。在智能交互方面,米某大模型更是表现卓越, 它能精准识别你的语音指令,还能理解你的情感和意图。就好比你有一个贴心的私人助理,能在你还没把话说完的时候就知道你想要什么,然后迅速帮你搞定。而且你某大模型还能和小米的各种智能设备深度融合。 想象一下,你回到家只要跟他说一声,灯光会自动调节到你喜欢的亮度,空调会调到合适的温度,电视会播放你爱看的节目。这就像拥有了一个智能魔法世界, 一切都能按照你的心意运转。朋友们,小米的咪谋大模型是科技实力的象征,更是未来生活的新方向,它将改变我们与科技互动的方式,让我们的生活变得更加便捷、智能和有趣。现在我想问大家,面对这样强大的咪谋大模型, 你觉得他会在哪些方面给我们的生活带来最大的改变呢?快来评论区分享你的想法吧!

本来没打算说小米 ai 开源大模型的,有粉丝想知道我对它的评价,我就客观的来说一下吧。小米千万年薪挖来的 ai 天才少女罗福林在昨天的发布会上宣布了小米 vivo v 二 flex 这个免费开源, 也有一些在测评的各种夸这个开源大模型,说算力快,所需费用低。我没有用过咪膜,但我之前用过其他的 g、 p、 d 和 deepsea 豆包等等,还在发布会上自称世界第二。 我给大家说一下,目前在 ai 这一块儿做的比较好的有阿里的前文亲爱的 gbt, 还有罗浮屠的钱东家做的 deep sack。 就 小米目前的研发的投入和成果说明我是世界第二,这个我是持怀疑态度的。