小米 ai 的 商业变现模式已经非常清晰了,这几天小米连续放了两个大招,一是 miimo 大 模型单日掉流量直接干到了一万亿 token。 二是推出 miimo token plan, 这一套下来,信号特别的明显, 就大模型不再是小米硬件的一种配套了,而是单独一门赚钱的生意。今天我们来捋一下面某大模型怎么赚钱,它的商业模式比较复杂,比单纯的卖酸力要复杂的多。我们总结一下就是三条商业路线。第一条,直接卖托,肯赚钱。以前大模型的企业都是按用量来扣费, 企业根本没法去预算,小米直接改成了订阅制,这种模式比较稳定可控,方便规模化,而且密密的价格,性价比极高,符合小米一贯的调性。第二条,用 ai 拉高硬件的价值, 让手机、汽车、家电变得更值钱。鲁总之前也说了,首款 ai 原生手机已经在封测的阶段,后面还要铺导其他的设备来打通人、车、家的生态。这不只是说当一个 ai 助手,就像小龙虾一样,它是可以直接帮你办事的。还有小米的智能家居,小米这套 milo 的 方案 可以靠视觉和语音理解你的意图,比如你往床上一躺,盖好被子不用说话,灯会自动关闭,窗帘拉上,空调也会给你调好,它是从被动控制变成了主动的服务。小米 ai 的 整个闭环非常清晰, 从 ai 提升硬件竞争力,到硬件卖的更多,再到更多人使用 ai, 然后数据和交易量暴涨,最后反过来优化模型,越用越强,这就是小米 ai 的 闭环。 第三条,大模型开源,把生态做大,既分摊成本,又能购入护城河。另外,小米还跟金山办公合作, word、 excel、 ppt、 pdf 全部覆盖,几乎拿下了所有的日常文档。我们再说说咪默的真正优势, 为什么它很有可能跑赢别人。第一,生态壁垒太强,小米 a i o t 设备已经破了十亿台,两百多个品类, 全球每几家公司能同时在手机、汽车、家庭三个空间同时落地实体 ai, 它的掉电量几乎没有天花板。然后第二点,小米可以走两条路线,而不是只能局限在屏幕里。小米 ai 还有聚生智能这条赛道,这又是一个完全不一样的故事。当然,我们不能说好的, 小米现在的问题也很现实。首先太依赖硬件,豆包靠抖音,千问靠阿里,元宝靠微信,咪某基本就靠手机靠汽车这些智能终端。那么一旦手机、汽车销量不稳, ai 的 价值会直接下滑。 小米的这套硬件加软件加服务的模式虽然非常独特,但前提是硬件生态能够持续的扩张,所以未来三年就不市场验证小米 ai 城市的关键时期。 另外,小米未来的对手不止是硬件厂商,还有阿里自己。这些互联网的巨投资金压力很大,特别是现在手机面临内存涨价,跟那些互联网巨头相比,算你底座和资金储备并没有优势, 所以小米想突围也不轻松。最后,我们再看看他的未来增长主要分三步走,短期靠托肯套餐、规模化变现, 而且正好撞上了同行集体涨价的一个窗口。中期靠卡位 ai、 智能体时代、手机车 i o t 三个场景互相带动,形成正向的循环,长期来看就是物理 ai, 小 米研发投入了六百亿,里面有很大一部分会砸到机器人, 一旦成了米某,就不只是大脑,而是有身体的完整智能体,这也是小米最有想象空间的地方。
粉丝2.7万获赞23.5万

兄弟们,见证时代,小米米某大模型登顶世界第一,成为全球掉用量最大的模型,比第二和第三加起来都要高,而千玺好像从这个排行榜上已经彻底掉队了, 不知道后面华为会 copy 哪一家呢?是直接 copy 小 米吗?还是 copy deep sync 和 copy mini max? 可能会把小米的模型下载下来改个名字,这发不了上去吗? 我们来分析一下,为什么小米的这个模型使用的人为什么会这么多?其实我还是跟小米现在这个有一半的免费政策有关系, 在他接入 open clone 的 时候他是免费的,而这个 open clone 这个地方有很多的使用人士就使用 open clone 小 龙虾的再接再厉吧,希望到时候小米恢复社会的时候还能是世界第一的水平。

兄弟们,小米米某 v 二 pro 大 模型连续霸榜三周世界第一之后,他终于推出了自己的固定服务,比如说为我们程序员提供的,那也不仅为程序员,他其实是也可以用在小龙虾这种地方 定价,大家看一下,我觉得其实有点偏贵的,从这个套餐上来讲的话,如果你想养殖小龙虾的话,可以买这个最便宜套餐,但一个月也要四十块钱。 作为屏幕前各位穷鬼来讲,我觉得大家应该是不会去掏这个钱的,如果要是程序员的话,我觉得基本上要买这个套餐才够用, 但各位穷鬼就更不可能掏钱了,所以后面大家我觉得也不用看了,我这个价格其实说实话没有人掏起这个钱,但是我可以打我的。小米的这个迷你魔大模型就是国产编程能力最强的,如果大家有想要编程的计划的话,我建议你不用考虑其他的模型了,其他模型其实效果都不怎么好, 直接考虑小米这个。当然如果你能使用国外的模型的话,那也不用考虑这个,小米完全不与不了国外的那三个大模型。

小米呢在今年发布了一款新的模型,叫 miami v 二 pro, 据说是非常厉害,不管是在编程工作有非常出色的表现,那么就来测试一下编程方面到底是怎么样的。那在测试之前,我们先来了解一下这款模型的一些参数啊。 那首先第一个是就是是它的这个总参数量是一个 t, 那 激活是四十二 b, 还有一个非常重要的是它是支持一百万 tokyo 就 一兆的上下文,这是已经是顶级的水平了,目前基本上主流的模型都是这个上下文长度, 那这边的话,它之前是在 oppo reno 里面是以这个匿名的这个模型去发布的,然后也是得到了非常大的关注啊,那表现也是非常不错的。那我们具体来看一下它跟其他的几款模型,比如说 oppo 的 四点六,散热器四点六,还有 jimmy 三 pro, 杰比利五点二,说实话它对比的 这两款模型是版本已经落后了,我们知道这个加密的三点一已经出来了,那 jpg 已经发布到了五点四的版本,我们看下具体的分数吧。然后这个是复杂多步骤任务的,这个是适用于工作场景的,那这边的话它是比这个五点二还要强,然后的话是弱于这个 solo 的 系列和 opus 系列, 那我们接着看这个编程与代码能力这个维度,那么在 s w e 这个测试当中,它的这个分数的话是接近这 collect 四点六的,然后是差不多相差一点六,那比 jammer 三 pro 高一些,那么在这个终端直线命令拼脚本和系统能力的上, 那么是超过这个 jammer 三 pro 以及 jpg 五点二跟这个 collect 四点六是只相差两分, 那其他就是一些搜索能力了。然后这边的话它就说它是一个顶级的编程能力的模型啊,内部评价是跟 opus 模型是非常接近的,那我们就来测试一下在编程这块它到底是怎么样的,然后 看整个参数是非常不错。那么我们这里的测试的话也是分为了前后端测试啊,那我使用的测试的客户端是 crayon, 然后使用的是这个 openrotor 里面的 memo 模型,目前是免费的。 然后呢分别会进行一个前端测试和这个 app 测试,以及我们的这个后端的 java 测试。 那第一个测试就是非常经典的这个三人斗地主游戏了,那这个目的是为了测试它的逻辑和它 ui 生成能力啊。然后的话看一下 他的这个玩法能不能玩起来,比如说什么发牌啊,叫地主啊,斗地主之类的这些规则能不能有一个简单规则,就我们不期望就说一次对话就能完整的实现一个斗地主的游戏,我们就看一下他的下线到底在哪里,那这边是他做出来的效果啊,说实话是我觉得是非常不错的,比如说现在玩一把 我们可以去选这个, 就是这个规则基本上都可以,然后的话不出, 然后这个机器人出牌也是对的,虽然说他可能就是合作之间还会相互去竞争啊,这个不太符合这个基本的常理。那我们就这样三带一个啊,没有人要,那我们就看再看三带一,对 没有人要,好,我们先出这个, 哎,所以这一盘是很顺利的完成。那目前这个斗地主的测试啊,使我测试所有的模型,包括 oppo 的 四点六, 这个是最完整的,而是一次通过。这个是让我非常非常惊讶,非常非常惊讶,非常非常意外啊。接下来就测试的就是一个 app 的 全站测试,那这个我们要求它用 flat 来完成一个包含 app 和包含后端,然后使用 python 和 my circle, 然后有这是一个外卖点单的一个功能啊,可以登录,可以看到菜单,可以看到购物车,可以加减,可以看到图片啊,商品啊,这是一个比较小小型的 mvp 的 一个产品呢,我们来看一下它实现的效果,那这个是它启动的效果啊,但是呢我在这里要特别强调一下,在我在整个开发过程中呢, 它前面开发非常顺利啊,但是在启动我们的这个 python 服务和这个客户端的时候,出现了非常多的问题,特别是这个 python 服务, 然后你把错误信息发给他之后,他一直解决不了,我已经进行了多轮对话都解决不了。那最后呢,我是通过这个 class 让他去修复这个问题,然后他这边一轮对话就把这个问题修复了。那这个其实也说明一个什么问题呢?就是 mimo 这个模型可能在解决问题,或者说你的上下文非常长之后,它有可能会产生幻觉,然后是一直会兜兜转转的。那么我在完成这个 app 里面也包含了前段后段,那产生代码量是非常大的,所以呢这个在这方面能力是非常有欠缺。那我们用 flex 修复完之后, 我们再看进去,看一下能不能进去。 ok, 这边是它的页面,然后的话也是中规中矩吧,页面上是我觉得还行,那我们加购物车看一下, 失败,就有些功能还没有完成。 ok, 那 我们接着往下测,那接下来测试的是一个 java 的 一个优选与结算的一个系统啊, 那这个的测试的目的呢?就是有多种规则情况下,他怎么去实现这样功能?那促销里面有经常有这这种优惠叠加,还优惠互斥啊,多种优惠券混在一起呢,怎么去算这个价格? 那还掺杂着什么运运费啊,或者这些东西。所以呢,这个模块是有点复杂,我们来看一下密密最终的实现效果,就是他做完之后啊,他自己进行了一个单元测试,因为我们在生成这个 pran 的 时候,他会生成这样的一个比较小的一个测试单元,测试用力,他这边跑完是已经全部通过了, 但是我在看具体代码的时候,其实他考虑的场景是有一些肉的,这个跟之前我在测试 mini max m 二点五的时候非常像,就说他考虑的场景没有 colis 考虑的那么全,所以这一块是有一些不足的,但是 已经做的非常不错了,这个在我之前所有的模型里面应该能排到前三吧,这个基本上考虑到了,只是一些比较细的,比如说优惠券的这个类别判断啊,这一系列可能去需要一个非常详细的提示词才能去完成这样的功能,那整体表现上我觉得是非常不错, 所以总的看下来就是跟其他的啊, oppo 四点六啊,或者说杰布迪五点三这一个对比的话,在纯前端逻辑上,就斗地主这个游戏反馈上,我觉得是非常非常表现不错,但是在全站上因为可能代码量多啊,导致这个他这个产生一个幻觉,修复问题非常非常的 啊,兜兜转转的。那修复问题呢?经常兜兜转转的,最终都没有起来啊,是靠住第三方工具才去给他修复好,那否则加了后端上,我觉得表现的也还行。所以呢,总对这个模型进行一个总结,就优点就是一照到上下文非常爽, 然后在 ui 上表现是非常出色,特别是这个斗地主这款游戏啊,是完成所有模型里面完成最好的,非常出人意料。 第三个呢,在 java 的 这个后端的这个促销逻辑上也是非常不错的,虽然说场景不全,但测单人测试基本上通过了。 那缺点就是我刚刚一直在讲的修复 bug 的 能力很欠缺,容易得得卵卵,除非人为干预,而且我已经人为干预了两三次了,还是没有解决, 然后偶尔出现就是代码啪啪啪写完了,但是呢,翻译的时候不通过,然后他要去修复问题,那像 cloud 或者 jpt 模型,基本上生成完代码之后,翻译是一次通过了,那所以在这个环节上就有些差距的。 那总的来说,我觉得 mimo 是 一个非常不错的模型,远超我的预期。其实我来做评测的时候,我是觉得可能啊,这个模型因为只发布了两个版本,还没有那么强,但是 结果其实是超过我的预期的,那比一点零一点零版本是有非常大的进步,那编码能力我觉得是肯定是不如这个散热的四点五万,虽然说官方在跟散热的四点六对比,但是我觉得还没有到散热的四点五的这个水平,而且是比 智普五点零和这个 mini max m 二点七,我觉得还是呃差一些。那目前的话就测试的场景就这些,就是我个人的测试场景,并不代表一个权威的一个结果啊,只是我自己的一些看法。

一、某 vr 破这一款大模型呢,是面向 a 键的时代的旗舰机座大模型, 它的总参数是一万亿的参数的 mo 模型,采用了小米自研的创新的混合注意力架构,支持了百万的上下文长度。 我们来看看全球权威的大模型的综合智能排行榜,我们在今天凌晨发布的时候呢,全球总榜第八, 按品牌排名的话全球第五,我们超过了 s a i 的 沃克菲尔普。不仅仅是智能上限高,更重要的是 a 检测的综合能力更强, 它具备持续可靠完成复杂工作流的编排,长流程的规划和精准的工具调用,它更适合做扣顶和养虾用好。谈到 a 卷的能力呢, 养虾人最关心的聘请这个榜单,他是考核任务完成率的,那么维尔普尔呢,以平均任务完成率百分之八十一排在全球第三,主要的 a 卷的能力的基作评测级, 我们跟 cloud, tbt、 jimmy 相比,都在同一梯队展现了领先的智能水平。上周呢,我们在 openroot 里面第一发布,一上线以后很快就排到日榜第一。 openroot 呢,是全球最大的大模型的 a p i 的 聚合平台, 当你调用量越高,一般来说意味着开发者的认可度越高。所以呢,全球的开发者对维尔托的评价是,智商高,情商也高,关键是任务执行又快又准。 今天呢,我们在公众号上发布了三个模型,刚才谈了 vr pro, 还有我们全模特的模型 vr 奥曼尼,他能看、能听、能推理能执行,特别适合养龙虾。我们还有一个 vr 的 tts 的 模型, 我们上亿小时的语音数据,根据文字的内容和语音上下文,能够输出更令人的声音,而且有喜怒哀乐这些功能,未来我们都会连入超级小爱,所以超级小爱未来的整个语音交流会更自然更流畅。好, 我们的大模型的科提姆呢,是一个原生的 ai 团队,他非常非常年轻,平均年龄只有二十五岁,但是人才密度超高,几乎全部来自于国内的顶尖高校,博士占比呢高达百分之五十五。 其中最年轻的研究员只有十九岁,是北大图林班一个大二的同学,他正在我们这里实习,也做了不少的贡献。 在 ai 等硬核的科技赛道里面呢,我们可能相对比较低调,但实际上我们推进的速度可能比外界看到的要快很多,就包括芯片、聚生智能、人性激情各个领域啊。 在 ai 领域,我们未来三年的计划呢,是至少投六百亿。其实呢,今年我们的预算在 ai 上研发和资本开支就超过了一百六十亿, 我们有人车加全生态的优势,还有一往无前的勇气。在 ai 时代呢,请大家放心,我们一定会交出一份靓丽的答卷。

本周 ai 大 事件神秘模型揭晓,小米咪魔来袭!过去这整整一周,在全球最大的 a p i 聚合平台 open router 上,两个神秘的匿名模型 hunter alpha 和 helo alpha 横空出世。他们是谁? 参数规格极其夸张,能力表现强到离谱,全网都在疯狂猜测,甚至连 open claw 的 创作者都忍不住发文到处打听,无数业内人士信誓旦旦旦旦的惊呼,这绝对是传说中的 deepsea v 四。然而就在三月十九日凌晨, 真相揭晓,炸翻了整个科技圈。这两个把一众硅谷巨头按在地上摩擦的神秘模型,正是由中国科技巨头小米亲自认领的小米咪某。 他是直接甩出一套完整组合拳,一个负责高强度推理和 a 阵的执行,一个负责文本视觉语音全模态理解,一个负责更像真人、更有情感的语音生成。说白了,小米是在试图搭一整套面向智能体时代的全站模型家族。 先看旗舰机座大模型米某维尔 pro 总餐数量直接突破恐怖的 e t, 也就是万亿级别,激活参数达四十二 b, 支持一百万上下文。更关键的是,它专门针对 a 阵的场景做了深度优化,复杂工作流编排、 长城规划、精准工具调用都是它的主战场。在 open cloud 和 cloud code 的 这类智能体框架里,自己拆任务,自己调工具,自己修正错误,最后把结果交出来。更夸张的是价格, mimo v 二 pro 的 api 定价大约只有 cloud ops 四点六的五分之一, 这很有小米风格,不仅要做强,还要把价格打下来,不仅要充能力,还要充性价比。而全模态机座模型 mini v 二 omni, 更像是小米压住未来的一张牌。文本、视觉、语音三模态打通,意味着它不只是会看文字,它还能看图、听声、理解环境、执行任务。 你让他去小红书搜攻略、整理配置差异,再去京东比价,甚至联系客服砍价,他不是单点回答,而是按步骤推进,像一个真正会干活的数字助手。 这背后其实释放了一个非常清晰的信号, ai 竞争已经开始,从谁更会聊天,进入到谁更像操作系统里的执行者。 那么,究竟是怎样的一支神仙团队,能在短短几个月内把大模型能力拉升到全球一线梯队?要知道,连 mate 重金打造的超级智能实验室,近期都在频频跳票。扒开咪墨背后的研发名单,你会震撼地发现, 这几乎是一支被北大承包的梦之队。从带领团队的大模型负责人、被日内称为天才少女的原 deepsea 核心成员罗富利,到核心骨干肖邦俊、马文涵、 朱大伟等,清一色来自北大 moe。 整个团队不仅技术底子厚,很多人长期研究常上下文、推理能力强化学习 agent 系统这些最关键的方向。再加上罗富利本身就是原 deepsea 核心成员,这种技术血统、工程能力和产品化思路被小米迅速揉在了一起。所以 moe 的 崛起不是偶然, 它背后是学术积累、工业化落地、工程效率、产品思维一起发力。但说到这里,更有意思的地方来了,咪莫这次越强,越说明一个事实,国内厂商已经把下一代模型的天花板越抬越高了,因为咪莫这波匿名出圈,证明了一件事,国产模型不但能做出来, 而且已经开始在全球开发者最真实的使用场景里抢位置、抢流量。它能霸榜 open router, 已经不是实验室里的自嗨,而是全球开发者对它的直接认可。 因为中国大模型真正精彩的从来不是一家独大,而是你追我赶,层层加码,不断把上限顶高。而对于整个行业来说,这反而是最好的局面,竞争越激烈,模型越强,开发者越受益, 中国 ai 的 整体速度就越快。所以这次小米密某,他更像是在告诉所有人,系统级智能体的战争真的开始了。而我们也完全有理由继续期待,谁会是下一个真正震动全球 ai 圈的名字,或许就是 deepsea 维斯。答案也许很快就要揭晓了。

小米发布的 mini vivo pro 是 真的强,在万亿参数大模型中已经能排进全球第八,国内第二了。牛掰啊,这才是真研发,钱这么花才对嘛。另外有一点比较骚的是,之前传的很厉害的亨德阿尔法居然就是小米 mini, 这你敢信?不过有一说一,这个操作确实六,我先匿名,你们用完之后都夸厉害,然后我再爆出来,这下你们不能骂了吧,总不能自己打自己脸吧。

最近 openroot 被一个名叫亨特阿尔法的神秘模型给霸榜了啊,很多人都在猜测这玩意到底是谁家模型,那么直到十九号上午终于被小米给认领了, 这个神秘的模型就是小米最新的 miimo vr pro 模型。小米接连发布了三款大模型,并且开启了一段时间的免费试用。可能有很多平常不关注大模型的朋友感到非常的好奇,想知道这个玩意到底该怎么样去使用,那么今天这期视频我将教会大家怎么用上小米的大模型。 好,那我们废话不多说,直接开始。先说最简单的用法,就是把它当成普通的聊天大模型来使用。如果你使用的是小米手机,可以直接打开小米自带的浏览器,点击中间的 ai 图标,就能够直接使用小米的 mini 大 模型。当然不是小米的手机也没关系,我们可以直接来到小米 mini 的 官方网站, 然后点击 web demo, 可以 看到左边有一个侧边栏叫做 memo chat, 我 们点击就可以和大模型进行聊天了,然后左上角还有可以切换模型。如果你只是把大模型当成聊天工具,那么网页端就差不多够用了,但是如果你想让他帮你处理文件,调用工具,接入工作流的话,那就要把它接入智能体了。 接下来我会教大家怎么把它接入智能体上面。智能体这个词可能听起来有点复杂,但大家不要被吓住了。智能体也就是 agent, 它是一个以大语言模型 l l m 为大脑,能够自主规划、记忆并使用工具来完成目标的一个智能系统。 传统的 l l m 本质上还是你问一句,他答一句,比如豆包千问菜的 g p t 这一类,你给他一个问题,他就返回一段内容,基本上也就结束了。但是 a 卷的不一样,他不只是负责回答,他还会接着往下做。 你给他一个目标之后,他会自己理解任务规划步骤,然后一边执行一边根据结果继续调整,直到把这件事情做完。 比如你让他帮你整理一个文件夹里面的资料,顺便提炼重点,再写成一份总结,他就不只是简单的给你一句建议,而是真的会一步一步的把这件事情往下做。所以简单来说,普通的 ai 更像是在跟你聊天,而 a 检测它是真正的在帮助你干活。 像 open code codex 以及 cloud code, 还有前段时间爆火的 open clone, 都属于智能体,目前 open code 提供了免费的密膜大模型的使用,我们以 open code 为例,演示一下怎么把大模型接入智能体。在安装 open code 之前,我们首先需要安装一下 node js, 我们来到 loggs 的 官网,根据对应的系统下载安装包,把 loggs 安装好之后,接着我们打开终端,输入下面这串命令,这样我们就完成了安装,再输入 open code 就 能够直接进行启动,我们跟它对话试一下,可以看到它已经开始回应我们了。 那么接下来我们把模型切换到 m 模模型,按住 ctrl 加 p, 或者使用斜杠 model s 命令切换使用模型。 这里我们直接搜索 mimo, 可以 看到 opencode 为我们提供了两个免费的模型,选中之后就可以看到这里的模型已经发生了改变,这样我们就可以开始对话了。 这里我让他帮我生成一个小霸王游戏的 svg 动画,放在我的桌面上可以看到他已经在接受命令之后开始工作了,我们看看效果如何。 前面我们使用的是 open code 为我们提供的免费大模型,通常他会以降低速度或者是一些其他的方式来限制你的使用,并且免费期一过就不能够再继续使用了。所以接下来再给大家演示一下怎么接入小米的 api key 来进行使用。在 open code 里面输入斜杠 connect, 我们这里可以搜索模型提供商,这里可以接入各种各样的大模型,像亲爱的 g p g gmail 等等,我们直接搜索小米。然后我们来到小米官网,点击 api access, 然后点击申请 api key, 我 们创建一个 api key, 把 api key 复制回到终端回车,这样我们就能够选择模型来跟它进行对话了。 这里必须要保证你的账户余额充足,不然是不能够进行对话的。 ok, 以上就是使用小米密墨大模型的全流程啊,感谢您的收看,如果你喜欢这期视频,记得给我点亮收藏,后续我也会分享更多跟 ai 相关的知识,我们下期视频再见!拜拜!

小米 miimo ai 大 模型呢,开源了,据说呢,它是可以和 d p 三点二白一白时光的,那除了常规的问答之外呢,它是可以生成直接网页端可用的代码, 比如我在这里输入帮我写一个三角函数的关系式 e, 可以 网页端运行的那种,那只要几分钟呢,它就会生成一串代码,并且呢,这串代码是可以直接在线预览的。 说实话,这种在线生成代码并且在线预览的功能呢,对普通人来说其实用处并不大,但别忘了,小米的智能家居生态呢,可不是闹着玩的,来发挥一下想象,当小爱同学也揭露了咪某,也许在未来的某一天,我们只需要跟小爱同学说,哇,好无聊啊,来找个游戏打发一下时间吧。 那这个时候空调根据温度自动打开加湿器呢,也会自动判断空气的湿度,那像什么投影仪,窗帘、音响、灯光这些呢,全部都帮你自动设置好,这个时候你只需要拿起手机美美的畅玩一整天。那又或许你跟小爱同学说今晚下班呢,我出去吃个饭可能九点半才回家, 那这个时候家里的扫地机器人呢,开始工作,扫完地,拖完地之后,自动打开窗帘,开始通风晾干。当你打开家门的那一刻,小黑音响响起了他的声音,他说,今天玩的怎么样,还开心吗?热水呢,我已经准备好了,快去洗澡吧。 也许在未来,我们真的可以拥有属于自己的贾维斯。那么视频的最后,你们觉得小米咪某算不算是国产 ai 的 第一梯队呢?欢迎评论区留言。

小米又做了一件很小米的事情,四月三号,他们的 miimo 大 模型出了一个订阅方案,叫 talk and plan 啊,最低三十九块钱一个月三十九块钱能干嘛?你能用三个模型,旗舰推理模型、全模态交互模型、语音合成模型,全包了, 知道 cloud pro 多少钱吗?二十美金啊,折合人民币将近一百四十块六。 d plus 也是二十美金,小米三十九块啊,给你三个模型选择,但最狠的不是价格,是它的计费方式,不按模型收费, 按统一的 credit 点数收费。什么意思?就是你买的算力额度,你想用哪个就用哪个啊,语音图像代码、 agent、 任务虚拟器,而且没有五小时的使用额度限制, 现在很多产品你用着用着就限流了,对吧?小米说你买了多少就用多少吧,不限速看,这就是小米模式,别人卖品牌溢价,他卖性价比,手机这么干, ai 也这么干, 你说这行业好不好?太好了,因为只有价格打下来,普通人才真的用得起 ai。 你 会为 ai 付费吗?你愿意付多少钱?

屌爆了,阿基米这家伙居然闷声做大事,这个亨哥阿尔法模型真的居然是小米的模型!小米此刻已经官宣了,这个米某 v 二的中号版本就是出现在奥本路特上的这一个排名第三的模型。 小米太强了,果然是雷军的做事风格,此刻可以说出那晶晶金光闪闪的六个大字,友商是在 ai 时代,小米全面追赶上,而华为已经全面落后掉队了,为什么这两家公司会有这么大的差别呢?作为后来者, 一刚开始肯定不完美,总会被嘲笑,被怀疑,这些都是意料之中的事情, 但我相信这个世界终究不会是强者恒强,后来者总有机会。无论前方有多少困难, 我们都决不放弃,我们一定要坚持下去,只要开始追赶,我们就走在赢的路上,不要怕,坚持下去,坚持到最后的胜利!

恭喜小米,前脚刚赢了官司,后脚又登顶了 openroot。 就 在大家还在讨论神秘的 hunt alpha 是 不是 deepsea v 四的时候,小米正式领养并一口气发布了三款最新的大模型。今天我试着放下偏见,单从技术的角度浅聊下这三款模型。 先说咪某 v 二 pro, 在 m o e 的 架构基础上,它的总参数量超过了一万亿,其中激活参数达到四百二十亿,并支持高达一百万 token 的 超长上下门窗口,使它在多步推理、长周期工作流等场景下游刃有余。 此外,混合注意力机制的混合比例从五比一提升到了七比一,实现显著的大规模扩展的同时,依然能保持极高的推移效率。第三点呢,就是引入了轻量级的多投屏预测层,从而实现快速的文本生成。 简单的说,这就是小米为智能体时代打造的全模态基础模型。这个模型反而是我个人最为关注的,也是我认为在架构理念设计上最具未来感的, 因为它不同于传统多模态插件式的组合,它是通过统一的底层架构,实现了对图像、视频、音频和文本的实时同步感知能力,使得模型能够像在真实世界中运行的智能体一样,同时进行看、听和读的操作。 据官方说明,他能深度理解超过十个小时的连续音频,能看懂画面,还能展现出极强的情景感知和预测能力。 这是一个语音合成模型,它允许用户使用自然语言来描述想要的声音,并且自然的融入咳嗽、叹惜、清嗓子、犹豫以及不同程度的笑声和哭腔。值得一提的是,官方说可以自动推断情感,也就是无需任何显示的风格提示词, 就能直接从文本内容中推断出适当的说话风格。经过这一年来的舆论风波,很多人对这家公司有了新的认识。 让我决定做这期视频的原因是,官网上他多次引用了前 openai 首席科学家伊利亚的很多观点,而伊利亚恰好是我认为这个时代最伟大的 ai 领域的科学家引路人,希望他真的能长久务实的进行。

毋庸置疑,我们已经进入了一个全新的时代,这段时间最火的就是全民养龙虾, 两周前呢,我们也发布了自己的龙虾产品,小米米克闹,作为首款的手机,龙虾也非常火爆,这款龙虾如果融合了人车家全生态,可以实现以前无法想象的操作。 当然最让我们自豪的是,小米龙虾背后是我们刚刚发布的非常强大的机座大模型李某 vr pro。 今天呢,我们在公众号上发布了三个模型,刚才谈了 vr pro, 还有我们全模态的模型 vr omni, 他能看、能听能推,你能执行,特别适合养龙虾。刚才比 vivo 更强的是这个 omni 的 模型啊,在这个这个 a 键的里面,尤其是他推你的速度更快,他是一个全模态的模型,而且呢,我们还有一个 vr 的 tts 的 模型。 然后呢,我们上亿小时的语音数据啊,根据文字的内容和语音上下文,能够做出更感人的声音,而且有喜怒哀乐啊,这些功能未来我们都会啊,连录超级小爱, 对,超级小爱未来的整个语音交流会更自然更流畅。而且有啊,这个喜怒哀乐这大模型的 q 提姆呢,是一个原声的 ai 团队, 他非常非常年轻,平均年龄只有二十五岁,但是人才密度超高,几乎全部来自国内的顶尖高校,博士占比呢高达百分之五十五, 其中最年轻的研究院只有十九岁,是北大图林班一个大二的同学, 他正在我们这里实习,也做了不少的贡献,我觉得我在他们身上看到了他们对 ai 极高的热爱,全情的投入,让我们在 ai 探索的路上呢,迈出了一大步, 在 ai 等硬核的科技赛道里面呢,我们可能相对比较低调,但实际上我们推进的速度可能比外界看到的要快很多,就包括芯片、聚生、智能、人性、激情各个领域啊, 我觉得真正的硬核创新需要长时间的持续投入,所以呢,我在内部要求我们的团队呢,低调一些,做出成绩呢,再给大家汇报,在 ai 领域,我们未来三年的计划呢是至少投六百亿, 其实呢,今年我们的预算在 ai 上研发和资本开支就超过了一百六十亿, 所以大家会看到我们在很多硬核科技上的推进速度会越来越快,我们有人家全生态的优势,还有一往无前的勇气。在 ai 时代的请大家放心,我们一定会交出一份靓丽的答卷。

小米 mini 大 模型突破一万亿, toon 在 国内算什么水平啊?为何盘古大模型没有公布自己的调用量呢? toon 啊,是 ai 信息处理的最小单元,也可以简单离页为流量,调用量越大,就代表该模型被用户使用的越多。我们来看一下最近一周的国内排名啊,第一呢是千万三点六 plus, 四点六万亿。第二呢就是小米的 mini, vivo pro, 三点零八亿。 所以说呀,小米的一万亿 token 呢,已经达到了国内头部玩家的水平。而华为的盘古大模型呢,它不是单一模式调用啊,而是模型加平台模式,尤其是在工业、医疗、气象、金融、政务等专业领域啊,提供可落地的完整的 ai 解决方案。 他呢,不仅有自己的盘古大模型系列啊,还继承了千万 deepsea 的 模型。就在上周啊,国内大模型调用总量为十二点九六万亿啊,老美呢,为三点零三万亿。我们呢,已经连续五周啊超越老美了, 这个数据啊,说明我们的 ai 产业强大的竞争力,而在这一切庞大数据的背后啊,算力支撑才是七寸, 我们希望啊,除了华为的阿达拉斯之外呢,还有其他公司也加入进来,一起把我们自己的 ai 底座做强做实做大。

又一个行业的饭碗没了!北京时间三月二十三日凌晨三点,当大家沉浸在马斯克联合 space x 特斯拉与 x a 正式宣布 terra fab 项目成为人类算力里程碑时,小米雷军重磅推出大模型小米 vivo v 二 pro, 专为高强度而建的工作场景而打造。更炸裂的是把它接入了微信, 打造出一款足以让销售型企业翻身的神器,用好了可以直接退休。我亲眼目睹了他是如何把一个忧郁的客户从一步一步引导下单,那销售逻辑打造出一款足以让销售型企业翻身的表, 表达精准又自然。这哪里是 a, 分 明是真人!而这一切仅用了短短三十分钟,大大超越了我们公司的销冠!如果我开一百个分身,直接能变成一只永不疲倦的销售小群,二十四小时帮我去做业绩,直接干翻传统销售模式。如果你也想体验小米大模型销冠系统,赋能你的销售团队,评论区留言 ai。

屌爆了,阿基米这家伙居然闷声做大事,这个亨哥阿尔法模型真的居然是小米的模型!小米此刻已经官宣了,这个米某 vr 的 中号版本就是出现在奥本路特上的这一个排名第三的模型。 小米太强了,果然是雷军的弱势风格,此刻可以说出那金金金光闪闪的六个大字,友商是在 ai 时代,小米全面追赶上,而华为已经全面落后掉队了,为什么这两家公司会有这么大的差别呢? nice 作为后来者,一刚开始肯定不完美,这些都是意料之中的事情, 但我相信这个世界终究不会是强者恒强,后来者总有机会。无论前方有多少困难, 我们都决不放弃,我们一定要坚持下去,只要开始追赶,我们就走在赢的路上,不要怕,坚持下去,坚持到最后的胜利。

大家好,欢迎回来,今天我们来聊一个最近在 ai 圈炸开了锅的事。小米,对,就是那个做手机的。小米发布了他们自研的大模型家族 mimo v 二。为什么说炸开了锅呢?因为这次小米一口气发了三个模型, 而且其中旗舰模型的参数量突破了一万亿,上下文窗口达到了一百万 token。 更关键的是,在正式发布之前,这个模型还上演了一出无间道, 但这个我们后面再说,先来看看 miimo 到底是什么。 miimo 的 全称是 xiaomi model, 是 小米自研的大语言模型系列, 它的发展其实非常快,第一代 miimo 七 b 是 在二零二五年四月发布的,只有七十亿参数,是一个非常小的模型。但就是这么小的模型,在数学推理基础测试 aime 二零二五上,竟然超越了 openai 的 oe mini 七币打赢 o e mini, 这让整个社区都非常震惊。到了二零二五年十二月,小米发布了 memo v 二 flash, 参数量直接跳到了三千零九十亿, 采用 memo 混合专家架构,激活参数只有一百五十亿,非常高效,而且是以 a patch 二点零协议完全开源的。 再到二零二六年三月十八号,也就是上周,小米深夜突然上线了 memo v 二全家族 pro、 omni 和 tts 三个模型同时发布,这个发展速度从七十亿参数到万亿参数只用了不到一年时间。 这次发布的三个模型各自负责不同的能力维度。首先是旗舰模型 memo v 二 pro, 它是小米的认知大脑, 总参数超过一万亿,激活参数四百二十亿,采用 m o e 混合专家架构,注意力层的比例是七比一,上下文窗口达到了惊人的一百万 token, 这意味着你可以一次性丢进去一整本书,甚至好几本书。在 swbench 软件工程精准测试上拿到了七十八分,已经非常接近 cloud ops 的 八十点八分了。 第二个是 mimo v 二 omni, 这是一个多模态模型,可以理解图片、视频和音频,它支持结构化的工具调用,能够自主进行 ui 导航。 简单说就是它不仅能看懂世界,还能动手操作。在 mmmu pro 多模态评测上拿到了七十六点八分,甚至超过了 cloud opus 的 七十三点九分。 第三个是 memo v 二 t t s 语音合成模型,这个模型有一个很有意思的特点,它支持自然语言控制情感,你可以跟它说用刚睡醒有点沙哑的声音说话,它就能做到。 而且它是目前唯一一个商用的能同时说话和唱歌的 t t s 模型,还支持四川话、河南话、粤语和台湾腔,认知、感知、表达三为一体,这就是小米构建 ai 智能体的完整能力矩阵。 好,现在来说说开头提到的那出无间道。在三月十八号正式发布之前, miimo v 二 pro 其实已经在 open router 上悄悄运行了十五天,小米给他起了一个代号叫 hunter alpha 猎人阿尔法完全匿名上线。结果呢, 这个没人知道来历的模型迅速登上了 open router 的 日活跃榜首,十五天内处理了超过一百二十七万次 api 请求,吞吐了一千一百四十六亿个 prompt token。 社区里各种猜测,很多人都以为这是 deep seek v 四提前泄露了,直到小米在发布会上揭晓真相,这就是我们的 miimo v 二 pro, 这个操作真的很聪明, 它让所有用户在完全不知道品牌的情况下,纯粹凭模型本身的能力来评价,用实力说话,这比任何营销都有说服力。接下来看硬核数据。 在 s w e bench verified 软卷工程测试上, miimo v 二 pro 拿到了七十八分。作为参考,目前最强的 cloud opus 四点六是八十点八分,差距只有不到三个百分点,已经是第一梯队的水平了。 而开源的 memo v 二 flash 也拿到了七十三点四分,是开源模型的最高分。在 aimee 二零二五数学推理测试上, memo v 二 flash 拿到了百分之九十四点一的正确率,这个成绩非常恐怖。而最早的 memo 七 b 也有百分之五十五点四, 超过 openai oe mini 的 百分之五十点七多。模态方面, miimo v 二 omni 在 mmeu pro 上拿到了七十六点八分,击败了 cloud opus 的 七十三点九分和 gemini 三 pro 的 七十二点一分。 在 livecodebench 实时编程测试上, flash 和 pro 也都在七十九到八十分的水平。总的来说, miimo v 二系列已经全面进入了全球大模型的第一梯队。为什么 miimo 能做到这么强?来看看它背后的核心技术。第一个是混合注意力机制, 它交替使用滑动窗口,注意力和大局注意力比例是七比一。这样做的好处是 kv cache 的 存储降低了大约六倍,让百万 token 的 超长上下文成为可能。 第二个是多 token 预测,简称 mtp, 它用一个很轻量的模块,每个只有三亿三千万参数,实现了自推策解码, 推理速度直接提升二到二点六倍,而 token 的 接受率高达百分之九十。第三个是多教师在策略蒸馏,简称 popd, 这是一个非常创新的后训练方法, 它把知识蒸馏重新定义为一个强化学习过程,用多个领域专家模型提供密集的 token 级监督信号。 第四个是大规模智能体强化学习训练。小米从真实的 github issues 中提取了超过十万个可验证的任务,用 kubonetis 集群支持一万多个并发 pod 来跑训练。 最后是自研的 seamless rollout engine, 训练速度提升二点二九倍,验证速度提升近两倍。这些技术创新加在一起,才让 miimo 实现了从小模型到万亿参数的跨越。开源方面,小米做得相当大方, mimo 七 b 是 完全开源的,提供了从 base 到 r l 的 四个检查点,你可以在 huggingface 和 github 上直接下载。 mimo v 二 flash 同样完全开源,采用 a patch 二点零许可证,三千零九十亿参数的模型 你可以自由使用,甚至商用。 pro omni 和 tts 目前是通过 api 提供服务, 但小米也表示,等模型稳定后会考虑开源。再来看价格,这可能是最让人惊喜的部分。 miimo v 二 pro 的 api 定价是,输入一美元每百万 token, 输出三美元每百万 token。 作为对比, cloudsonet 是 三美元和十五美元, cloud opus 是 十五美元和七十五美元, gpt 五点二是五美元和二十五美元,也就是说, miimo v 二 pro 的 价格只有 cloud opus 的 十五分之一到二十五分之一,但性能已经非常接近了。 这种性价比对于开发者和企业来说是非常有吸引力的。最后一个数字,雷军宣布,二零二六年小米在 ai 领域的研发投入将超过一百六十亿人民币,大约二十二亿美元。这个投入力度说明小米是认真的, ai 大 模型不再只是互联网大厂的游戏,硬件厂商正在全面入场。总结一下, miimo v 二家族的发布,标志着小米从一家硬件公司正式成为 ai 大 模型赛道上的重要玩家。 从手机到汽车到互联网,再到现在的大模型,小米的 ai 野心已经非常清晰,构建一个覆盖手机、智能家居、汽车和机器人的全站 ai 智能体生态。 hunter alpha 的 故事也告诉我们,在 ai 时代,最好的营销就是让产品自己说话。好了,今天的内容就到这里,如果你觉得有用,别忘了点赞、投币、收藏加关注,我们下期见!

在 openroot 连续霸榜好几天的神秘匿名大语言模型被证实了啊,就是小米的 miimo v 二 pro, 它是咱们国内首个同时满足万亿级参数加百万级上下文的旗舰大模型,唯一一个啊,在咱们国内, 这款大模型专为高强度的 agent 智能体工作的这个场景进行了深度优化,也就是说,搭配现在最火的 open cloud 小 龙虾使用的话,任务执行更稳、更长、更准, 全面领先。这些传统的大模型真的是很厉害,多模态强推理,强工具调用,国际权威机构测评综合得分四十九分,代码得分四十一分, agent 能力得分六十三分,非常突出啊,仅仅落后于拆的 gpt 五点四 和 jimmy 三点一 pro pro, vivo 稳稳地位居全球第一梯队。同时小米之前发布的这个 miimo v 二 flash 啊,它是运行在我们一些手机啊,移动终端的这些小型设备上的, 端侧本地运行,隐私更安全,就和现在刚发布的这个 pro 版形成了端侧随身 ai 的 完整的这么一个矩阵, 云端大算力哎,随身小移动设备上面更安全更隐私。小米端云一体的 ai 体系正式形成了。之前那些黑小米的小黑子,现在还有什么可说的? 小米不单单是在硬件层面新建层面,现在连自研的大语言模型 ai 层面,现在也是稳稳的国内第一梯队,世界第一梯队。我在网上也刷了半天,确实还没有看到针对小米这个大模型的黑稿,我估计大概是啊, 这些低质的小黑子们还搞不懂什么是 ai, 什么是大圆模型,黑稿还没写出来呢,咱们再看看那个整天硬蹭小米啊,总是贬损雷军,贬损小米的友商,你们那个像样的大模型去哪了呢? 大模型刚火的那会,你们可谓是如日中天呀,今天一个盘这个,明天一个红那个的,是不是最后居然被爆出来?怎么样,抄袭人家阿里的查重率超过了百分之九十七,现在你们的大模型去哪了啊? 最后用友商领导的一句话,小米才是真牛逼,有些人就是吹牛逼就是假牛逼,我们只喜欢真牛逼,我们鄙视假牛逼。

哈喽,大家好,欢迎收听我们的播客,今天要聊的呢是小米刚刚发布的这个 mini v two 系列的大模型。对,这个也是在最近啊,可以说是刷爆了这个科技圈啊,这三款大模型呢,也正式的为小米的这个人车家的生态啊,提供了这个 ai 的 底层的支撑。没错,那我们就直接开始今天的主题吧,我们先来聊第一块啊,就是这个三款模型的分工啊,这个感知决策表达,这个闭环的构建。 想先问一下啊,就是这个小米的这三款新的大模型,他们分别是负责什么的啊?然后主要的技术参数有哪些亮点?那这个系列呢,它其实是有三款啊,一款呢是叫做 pro, 它是一个旗舰的大脑, 这他是负责做决策的,做规划的,那他的参数呢,是超过了一万亿啊,然后他的这个激活的参数呢是四百二十个 g。 他 还有一个特别厉害的,就是他能够支持一百万透根的这种超长的上下文, 这个是很厉害的,就是他可以呃做一些很复杂的多步骤的任务。那他的这个在国际的榜单上面的排名呢,也是非常非常靠前的,他的这个价格呢,只有国际上同级别产品的五分之一。哇,这个价格真的很有杀伤力。然后另外一个呢就是欧米尼,他是一个全模态的一个感官, 就它能够同时去处理文本、图像、音频、视频。嗯,那它的这个音频理解呢,是超过了这个业界的标杆啊,它能够支持十个小时的这种连续的音频的分析,它的这个图片和视频的这个推理呢,也是非常非常强的。 最后一个呢就是 tts, 它是一个语音合成的专家,就是它能够把这个 ai 说的话变得非常的有感情,而且它可以切换方言,它甚至可以模拟唱歌, 就它的这个表现力是非常强的。就说这三款模型在实际应用中具体都有哪些让人眼前一亮的表现呢?比如说这个 pro, 它不光是在这个权威的测试里面表现的非常好,就是它的这个多部的任务啊,包括工具的调用啊,都非常的稳定,然后它也在这个真实的生产环境当中去做了验证。这个 omni 呢,它是在这个多模态的理解上面和这个跨模态的执行上面都刷新了这个行业的记录, 同时它也已经被接入到了这个主流的办公软件当中去提升这个操作的体验。这个 t t s 呢就更不用说了,它的这个语音的效果就是已经可以以假乱真了,而且它已经被集成到了这个小米的全生态当中去提供这种高拟真的这种交互。就是说这三款大模型一起到底给我们带来了一个什么样的全新的局面呢?就这三个其实是一个完整的智能体的一个能力的战, 就他把这个感知、决策和表达全都打通了,所以说他可以让这个 ai 去理解这个世界,然后去思考这个世界,去和这个世界进行非常自然的交流。这就不光是让这个智能助手变得更聪明了,他其实也给整个产业,给开发者,给这个生态带来了一个新的升级的一个机会, 就是小米的这个 ai 已经正式的进入到了这个第一梯队当中,我们接下来要聊的就是战略价值凸显出来的这个部分了,就是小米的这一套 miimo two 系列的大模型,到底在这个智能体的赛道上面实现了哪些差异化的突破?小米其实这次的布局非常的激进啊,就是他是直接想要从这个通用的助手这个层面直接跨越到能够在真实的物理世界当中去自主行动的这样的智能体。 那它的这三款大模型呢,就分别是负责思考、感知和表达的这样的一个功能,就把这个智能体的这个核心的能力全部都打通了。哦,这三个分工就很明确啊,那这背后的技术亮点还有哪些?就是它这个 pro 这个模型呢,它是用上了万亿级的参数, 然后呢又加上了这个百万级的这种上下文的窗口,就它其实是可以做这种非常复杂的多步骤的任务的,这个在业界都是非常领先的。这个 omni 呢,它是可以原声的去处理图像、视频、音频和文本,就它是一个全模态的一个输入,而且它甚至可以理解连续十个小时的这种音频内容。 这个 t t s 呢,它就是让这个 ai 可以 用非常自然的带感情的声音跟你交流,而且它甚至可以模仿不同的方言唱歌都可以, 所以这三个组合起来就形成了一个非常强的独特的竞争力。对,那我现在就是想知道,就是小米的这一套 mini v two 系列的大模型,到底是怎么让自己的这个硬件和软件实现了这种深度的血统呢,就是小米其实它是把这套大模型作为一个智能的核心, 然后植入到了它的这个所谓的人车家这一个全生态当中,就包括手机啊、汽车呀、智能家居啊等等的这些设备当中都有这个大模型的这个能力,所以它是真正的打通了这个端源的壁垒啊,让这个设备之间可以无缝的协助,所以就是说用户能够在各种场景下都能够享受到这种一致的智能体验。对,没错没错没错,那比如说它的这个 pro 这个模型可以让你的家电去执行一些非常复杂的任务, 然后这个 omni 呢,可以让你的汽车 s u 七能够去理解复杂的路况,这个 t t s 呢可以让你的这个语音助手变得非常的有个性。所以就说小米它其实不仅仅是在做一个产品,它其实是在把整个生态都升级成一个有自主行动能力的这种智能体的系统。那你觉得就是小米在推动这个 m m v two 系列的大模型的开源和开放生态这方面, 你觉得他们做的怎么样?小米这次的动作我觉得非常的大,他就是说不光是给开发者提供了这个非常非常低的门槛啊,就是他的这个 a p i 的 价格是比国际上的那些巨头都要低很多,然后他还限时的免费,对,他就是希望说让大家能够都来用。他也同时对接了五大主流的这个 agent 的 开发框架,他的这个最最新的这个 flash 这个模型呢,甚至是完全开源的,用的是 mit 的 协议, 这对整个行业会有什么样的影响?就是这个就会让全球的开发者都能够非常轻易的来接入,然后也会让这个创新的项目会大量的涌现出来。再加上小米本身有非常多的硬件的设备和这个活跃的用户,所以他其实是在很短的时间内就可以打造出一个非常繁荣的 ai 的 新生态,这个也会大大加快这个产业的升级和技术的落地。我们来聚焦一下啊,就是技术落地和生态壁垒这几个关键点, 想先请你解读一下小米 mini v 二系列大模型在技术创新上到底筑起了哪些护城河?就小米的这个参数规模是超过了一万亿, 然后它是使用了这个混合注意力机制和这个分层的记忆压缩啊,它可以支持百万级别的这种上下文的 tokens, 它在这个实际的推理上面的速度也提升了将近一半, 它的这个算力的消耗也比同类的要低百分之七十以上,这个性能确实是挺吓人的。那不光是这个,它的这个多模态的这个输入啊,就是图片、音频、视频它是可以一起输入的,它的这个音频的理解能力是超过了这个页面的这个标杆,它的这个 tts 是 可以做到非常细致的去控制这个音色和情感, 它是一个全站自研的一个技术,再加上它的这个端云的协同,以及它的这个安全的保护啊,这都是形成了一些很难去复制的一些壁垒。小米这个米某 v two 系列的大模型到底在哪些场景下已经开始落地应用了?就是现在已经开始在小米的这个智能助手上面,以及这个澎湃 os 上面,还有这个 su 七的这个智能座舱里面都已经开始使用了。 然后在这个办公领域也有和这个金山 wps 进行合作,在这个工业质检上面也有落地,而且它这个在这个多终端上面是可以无缝的进行协同的,所以它这个覆盖的范围特别广, 听起来已经挺成熟了这个应用。是的是的,而且他们不光是这个模型本身的这个技术做的很强,他们在这个开发者生态上面也是下足了功夫,就是他们的这个 api 价格是远远低于这个国际巨头的。 然后他也有这个限时免费和这项的技术支持,他也和五大主流的这个 a 阵的框架进行了深度的打通,所以就说整个的这个创新的活力被充分的激发出来了,所以这个技术的变现的速度也是非常快的。你觉得小米这个米某维 two 系列的大模型,在现在这个时间点,它的实际的产业地位到底怎么样?这个我觉得就是首先它是国内第一家把这个万亿级的参数和这个百万级的上下文做到了一个标准, 然后它在这个国际的榜单上面也是牢牢的占据了第一梯队的这个位置。就是它的这个无论是在长文党的处理,还是在这个复杂的推理,还是在这个多模态的理解上面,它都是刷新了这个行业的这个天花板,所以它是真正的做到了这种软硬件一体化的这种布局嘛,没错没错,而且它是深度的绑定了这个澎湃 o s 和这个小米的全站的硬件,然后它是形成了一个完整的从端到圆的一个智能的闭环, 它的这个开放的策略又是非常的激进,所以这个是会推动整个 ai 产业的,这个壁垒已经非常的明显了,所以这个是会推动整个 ai 产业的一个加速的升级。今天咱们就看到了小米这三款大模型, 不光是技术上面有非常大的突破,嗯,而且他们真的是在落地和生态上面迈出了非常关键的一步。嗯,对,所以我觉得小米的这个 ai 新征程确实让人充满期待。好了,那这期节目咱们就到这里了,然后感谢大家的收听,咱们下期再见,拜拜。

小米的米诺大模型终于发布了,很多人都说他特别厉害,有的人甚至说他能力仅次于 deepsea。 结果苏苏我就问了他一个最简单的问题,他就翻车了, 这你敢信?这个问题呢,就是经典哲学题,问你是谁?我打开了深度思考,跟米诺说了一句,介绍一下你自己。结果相当奇怪,得出来的结论是,书虫、追星族、馋猫。 这都什么乱七八糟的呀?然后点开一看,才发现他搜出来一个我是谁的小学生的作文,然后总结了一遍。 哎,那不信邪的我肯定重新又问了一遍呀。这次终于正常了,不过也花了二十秒才思考明白, 相比之下,别的 ai 怎么样呢?我把同样的问题问了一遍深度思考的豆包和 deepsea, 豆老师是真的快,可以说是秒回,也没有答非所问。 deepsea 呢,花了五秒来思考,回答的不仅准确详细,还特别有韵味。 我的怀疑啊,是因为咪某刚出生,还没两个钱的熟练,可能在操练一段时间也能变得更好吧。那我们就给他点时间吧。对了,希望咪某能早点出个 app, 目前只能网页版,真是麻烦。