如何看待小米发布并开源了自己的最新 ai 大 模型 mimo v 二 flash? 哎,我先说结论吧,如何判断 ai 大 模型?它强不强,只需要看能不能帮助我们 普通人审视。你吹得再高端没有任何用,老百姓用不上它就是垃圾。那我们再说说 mimo v 二 flash。 按照官方的说法,这次它对标的是 dimix v 三点二发布会,我这里就不再 误数了。我只说一件事,我们团队经过十次,他是真的快,不是感觉快,是你在用的时候会明显感觉到他反应快,反馈直接,不拖泥带水。但普通人不关心他模型有多牛,只关心他能不能替我少操点心。如果你对下面两种真实的生活场景有需求,那么这个模型你必须重点关注。很多人用 a s 大 的通点 是什么?他懂中文,但不懂中国话,也听不懂中国人的生活方式。咪某这类模型真正有价值的地方在于,他不是翻译式的中文,是本土语境的中文。 比如工作群五十多条废话帮你提炼,重点合同通知、政策文件,用人话讲给你听,让你明白,长语音会议机要直接变成结论。说白了,工作党可以重点注意。第二点, ai 如果只存在于在 app 里,那么它就是一个玩具。如果能进入在系统里,那么才能叫做 工具。你想象一下,你的手机,你的平板,你的任何小米设备日程备忘,家庭设备状态,不用你一个个点一个个找你,此时此刻只需要说一句话,我今天很忙,帮我把能自动的都自动了,噔 提醒形成设备,在同一逻辑下协调工作,说人话,把 ai 变成了我们的生活管家,而不是那个傻乎乎的聊天对象。要记住, ai 的 价值不是模型的大小,是替你省下了多少事。如果 ai 不 能融入我们的生活,那么它再快,它也只是参数。
粉丝95.1万获赞480.4万

小米呢在今年发布了一款新的模型,叫 miami v 二 pro, 据说是非常厉害,不管是在编程工作有非常出色的表现,那么就来测试一下编程方面到底是怎么样的。那在测试之前,我们先来了解一下这款模型的一些参数啊。 那首先第一个是就是是它的这个总参数量是一个 t, 那 激活是四十二 b, 还有一个非常重要的是它是支持一百万 tokyo 就 一兆的上下文,这是已经是顶级的水平了,目前基本上主流的模型都是这个上下文长度, 那这边的话,它之前是在 oppo reno 里面是以这个匿名的这个模型去发布的,然后也是得到了非常大的关注啊,那表现也是非常不错的。那我们具体来看一下它跟其他的几款模型,比如说 oppo 的 四点六,散热器四点六,还有 jimmy 三 pro, 杰比利五点二,说实话它对比的 这两款模型是版本已经落后了,我们知道这个加密的三点一已经出来了,那 jpg 已经发布到了五点四的版本,我们看下具体的分数吧。然后这个是复杂多步骤任务的,这个是适用于工作场景的,那这边的话它是比这个五点二还要强,然后的话是弱于这个 solo 的 系列和 opus 系列, 那我们接着看这个编程与代码能力这个维度,那么在 s w e 这个测试当中,它的这个分数的话是接近这 collect 四点六的,然后是差不多相差一点六,那比 jammer 三 pro 高一些,那么在这个终端直线命令拼脚本和系统能力的上, 那么是超过这个 jammer 三 pro 以及 jpg 五点二跟这个 collect 四点六是只相差两分, 那其他就是一些搜索能力了。然后这边的话它就说它是一个顶级的编程能力的模型啊,内部评价是跟 opus 模型是非常接近的,那我们就来测试一下在编程这块它到底是怎么样的,然后 看整个参数是非常不错。那么我们这里的测试的话也是分为了前后端测试啊,那我使用的测试的客户端是 crayon, 然后使用的是这个 openrotor 里面的 memo 模型,目前是免费的。 然后呢分别会进行一个前端测试和这个 app 测试,以及我们的这个后端的 java 测试。 那第一个测试就是非常经典的这个三人斗地主游戏了,那这个目的是为了测试它的逻辑和它 ui 生成能力啊。然后的话看一下 他的这个玩法能不能玩起来,比如说什么发牌啊,叫地主啊,斗地主之类的这些规则能不能有一个简单规则,就我们不期望就说一次对话就能完整的实现一个斗地主的游戏,我们就看一下他的下线到底在哪里,那这边是他做出来的效果啊,说实话是我觉得是非常不错的,比如说现在玩一把 我们可以去选这个, 就是这个规则基本上都可以,然后的话不出, 然后这个机器人出牌也是对的,虽然说他可能就是合作之间还会相互去竞争啊,这个不太符合这个基本的常理。那我们就这样三带一个啊,没有人要,那我们就看再看三带一,对 没有人要,好,我们先出这个, 哎,所以这一盘是很顺利的完成。那目前这个斗地主的测试啊,使我测试所有的模型,包括 oppo 的 四点六, 这个是最完整的,而是一次通过。这个是让我非常非常惊讶,非常非常惊讶,非常非常意外啊。接下来就测试的就是一个 app 的 全站测试,那这个我们要求它用 flat 来完成一个包含 app 和包含后端,然后使用 python 和 my circle, 然后有这是一个外卖点单的一个功能啊,可以登录,可以看到菜单,可以看到购物车,可以加减,可以看到图片啊,商品啊,这是一个比较小小型的 mvp 的 一个产品呢,我们来看一下它实现的效果,那这个是它启动的效果啊,但是呢我在这里要特别强调一下,在我在整个开发过程中呢, 它前面开发非常顺利啊,但是在启动我们的这个 python 服务和这个客户端的时候,出现了非常多的问题,特别是这个 python 服务, 然后你把错误信息发给他之后,他一直解决不了,我已经进行了多轮对话都解决不了。那最后呢,我是通过这个 class 让他去修复这个问题,然后他这边一轮对话就把这个问题修复了。那这个其实也说明一个什么问题呢?就是 mimo 这个模型可能在解决问题,或者说你的上下文非常长之后,它有可能会产生幻觉,然后是一直会兜兜转转的。那么我在完成这个 app 里面也包含了前段后段,那产生代码量是非常大的,所以呢这个在这方面能力是非常有欠缺。那我们用 flex 修复完之后, 我们再看进去,看一下能不能进去。 ok, 这边是它的页面,然后的话也是中规中矩吧,页面上是我觉得还行,那我们加购物车看一下, 失败,就有些功能还没有完成。 ok, 那 我们接着往下测,那接下来测试的是一个 java 的 一个优选与结算的一个系统啊, 那这个的测试的目的呢?就是有多种规则情况下,他怎么去实现这样功能?那促销里面有经常有这这种优惠叠加,还优惠互斥啊,多种优惠券混在一起呢,怎么去算这个价格? 那还掺杂着什么运运费啊,或者这些东西。所以呢,这个模块是有点复杂,我们来看一下密密最终的实现效果,就是他做完之后啊,他自己进行了一个单元测试,因为我们在生成这个 pran 的 时候,他会生成这样的一个比较小的一个测试单元,测试用力,他这边跑完是已经全部通过了, 但是我在看具体代码的时候,其实他考虑的场景是有一些肉的,这个跟之前我在测试 mini max m 二点五的时候非常像,就说他考虑的场景没有 colis 考虑的那么全,所以这一块是有一些不足的,但是 已经做的非常不错了,这个在我之前所有的模型里面应该能排到前三吧,这个基本上考虑到了,只是一些比较细的,比如说优惠券的这个类别判断啊,这一系列可能去需要一个非常详细的提示词才能去完成这样的功能,那整体表现上我觉得是非常不错, 所以总的看下来就是跟其他的啊, oppo 四点六啊,或者说杰布迪五点三这一个对比的话,在纯前端逻辑上,就斗地主这个游戏反馈上,我觉得是非常非常表现不错,但是在全站上因为可能代码量多啊,导致这个他这个产生一个幻觉,修复问题非常非常的 啊,兜兜转转的。那修复问题呢?经常兜兜转转的,最终都没有起来啊,是靠住第三方工具才去给他修复好,那否则加了后端上,我觉得表现的也还行。所以呢,总对这个模型进行一个总结,就优点就是一照到上下文非常爽, 然后在 ui 上表现是非常出色,特别是这个斗地主这款游戏啊,是完成所有模型里面完成最好的,非常出人意料。 第三个呢,在 java 的 这个后端的这个促销逻辑上也是非常不错的,虽然说场景不全,但测单人测试基本上通过了。 那缺点就是我刚刚一直在讲的修复 bug 的 能力很欠缺,容易得得卵卵,除非人为干预,而且我已经人为干预了两三次了,还是没有解决, 然后偶尔出现就是代码啪啪啪写完了,但是呢,翻译的时候不通过,然后他要去修复问题,那像 cloud 或者 jpt 模型,基本上生成完代码之后,翻译是一次通过了,那所以在这个环节上就有些差距的。 那总的来说,我觉得 mimo 是 一个非常不错的模型,远超我的预期。其实我来做评测的时候,我是觉得可能啊,这个模型因为只发布了两个版本,还没有那么强,但是 结果其实是超过我的预期的,那比一点零一点零版本是有非常大的进步,那编码能力我觉得是肯定是不如这个散热的四点五万,虽然说官方在跟散热的四点六对比,但是我觉得还没有到散热的四点五的这个水平,而且是比 智普五点零和这个 mini max m 二点七,我觉得还是呃差一些。那目前的话就测试的场景就这些,就是我个人的测试场景,并不代表一个权威的一个结果啊,只是我自己的一些看法。

三月十九号,小米发布了一个新的模型啊,这个模型号称可以免费七天,但是我进它的官网之后发现它用不了,调了一下它的 a p i 接口是说欠费的。我今天又发现了,它可以用,需要借助于 open code 这个编辑器来做。在这里 米某 v 二 pro 模型它是免费的。本来昨天就想体验一下的,那今天的话才能用得上,那我今天就简单地对它做一个测评吧。 测评的话主要分为这个两部分,首先讲一下它的这个参数,然后让它做一个前端的一个驳刻,嗯,最后的话就是这个后端的这个测试的话,其实是想用它来修 bug。 这个我在白天的时候已经试过了,先看一下它的这个参数吧。这个参数,嗯, 这个 ppt 是 让这个模型来做的,其实还是做得不错的,就是现在比较流行这种深层的网页形式的这种 ppt, 然后我按前后方向键是可以翻页的。那它这个模型的参数的话,是所谓的万亿的参数。三个大模型, 第一款的话是这个基座的模型,支持代码推理和规划。第二款的话是这个视觉模型、音频模型和文本模型的统一感知能力的方面的所谓多胞态吧。那最后一款模型的话,是测出你这个语音的,它的这个参数的话,其实还是比较亮眼的。那排名方面的话是排到第八了,号称 超过了这个 x 的 goroc 模型呢,成本也比较低。呃,这个模型的话其实已经有一段时间了,在这个 open root 上面,它是匿名上线的,它的调用量还是比较高的。在这个 open root 上面都已经登顶了啊。 嗯,之前很多人猜测它是一个 deepsea 的 v 四模型,但在三月十九号的应该是早上啊,早上上班的时候看到这个,雷军宣布了这个模型的这个名称,官网上面也 说是可以免费调用啊,但其实是调不了的,一直到现在的三月二十号的晚上,整整两天过去了,它还是不能调用,那它这个 a p i 也是相对来说这个价格还好啊。它这个模型的这个发展历程的话,大概是就是最早是 二五年的四月份开始做的,一直到现在。嗯,正如雷军所说的,就是这个模型的进步确实也是挺快的啊,就是之前的话,可能主流的模型里面都没有关注到有小米的这个模型。嗯,了解一下他们这个团队负责人啊。 是这个,简单说就是高材生。那他支持的生态的话,现在有一个 miklo 的 这个。嗯,龙虾嘛,龙虾,小米版的龙虾,然后还有他自家的自己的一些生态, 现在有一个福利,就是说七天免费调用的,这是他号称的,实际现在还是有问题的。小米版龙虾我也体验了一下,就是目前在他的官网是可以就是免费体验,但是每次体验的时长应该是只有一个小时啊,过了这个时间他会给你轻松的。 然后昨天试了一下这个,昨天就可以用,然后今天又试了一下它。其实,呃,常见的一些问题的话还是可以回答到的。我问了它是基于 opencloud 来构建的吗?它这个地方也回答了,就是看它的这个目录结构就是 确实是通过 open class 来构建的,右边能显示使用的这些文件啊,我昨天体验的时候还让他在这里做了一个 ppt 啊,这个 ppt 的 效果是在这个右边,然后可以直接在线的播放,做的 ppt 的 效果还是不错的。然后第二个的话是让他写了一个博客, 这是通过这个 open code, 这个大家如果想体验的话,目前我发现的这个渠道啊,就是这一个 open code 通过这个 mod 可以 来切换这种模型啊,就是可以选得到这个免费的 mimo v 二 pro 模型。然后我这里就是让这个模型来写,写了一个啊播客,这个 包括的一个效果的话,大概是这样子,这个还是比较现代化风格的一个单网页吧,然后续我觉得可以在这个基础上面做一些嗯,优化,然后让它这个 功功能更完善一下。这里也对比了一下它和其他的主流模型的一个数据的情况。我现在用的是这一款的 kimi 的 二点五,可以看到它的这个调用量的话,其实还是不错的,就是可以和这个 kimi 的 来进行对比了,这个调用量越多的话,说明它这个模型还是越受欢迎。然后下面这些其他的数据的话,其实大差不差啊,要注意它是不支持这个流逝输出的,并且它是这个文本模型啊, 就是不支持这个图片的,嗯,包括这个 mini max 二点七,它也同样是不支持图片的,它的图片能力其实需要通过外界的 m c p 来实现的啊。而像这个 kimi 二点五的话,它的这个, 嗯,它是原生支持图片的,就是我们在 cloud code 里面使用的时候,是可以直接把图片丢进去,它可以直接识别到的, 这点的话其实还是很有优势的。大家如果想体验一下这个模型的话,可以下载一个 open code, 就 大概就涨这么多吧,然后去用这个模型的一些体验的话,会持续的进行分享。

恭喜小米,前脚刚赢了官司,后脚又登顶了 openroot。 就 在大家还在讨论神秘的 hunt alpha 是 不是 deepsea v 四的时候,小米正式领养并一口气发布了三款最新的大模型。今天我试着放下偏见,单从技术的角度浅聊下这三款模型。 先说咪某 v 二 pro, 在 m o e 的 架构基础上,它的总参数量超过了一万亿,其中激活参数达到四百二十亿,并支持高达一百万 token 的 超长上下门窗口,使它在多步推理、长周期工作流等场景下游刃有余。 此外,混合注意力机制的混合比例从五比一提升到了七比一,实现显著的大规模扩展的同时,依然能保持极高的推移效率。第三点呢,就是引入了轻量级的多投屏预测层,从而实现快速的文本生成。 简单的说,这就是小米为智能体时代打造的全模态基础模型。这个模型反而是我个人最为关注的,也是我认为在架构理念设计上最具未来感的, 因为它不同于传统多模态插件式的组合,它是通过统一的底层架构,实现了对图像、视频、音频和文本的实时同步感知能力,使得模型能够像在真实世界中运行的智能体一样,同时进行看、听和读的操作。 据官方说明,他能深度理解超过十个小时的连续音频,能看懂画面,还能展现出极强的情景感知和预测能力。 这是一个语音合成模型,它允许用户使用自然语言来描述想要的声音,并且自然的融入咳嗽、叹惜、清嗓子、犹豫以及不同程度的笑声和哭腔。值得一提的是,官方说可以自动推断情感,也就是无需任何显示的风格提示词, 就能直接从文本内容中推断出适当的说话风格。经过这一年来的舆论风波,很多人对这家公司有了新的认识。 让我决定做这期视频的原因是,官网上他多次引用了前 openai 首席科学家伊利亚的很多观点,而伊利亚恰好是我认为这个时代最伟大的 ai 领域的科学家引路人,希望他真的能长久务实的进行。

哈喽,大家好,欢迎收听我们的播客,今天要聊的呢是小米刚刚发布的这个 mini v two 系列的大模型。对,这个也是在最近啊,可以说是刷爆了这个科技圈啊,这三款大模型呢,也正式的为小米的这个人车家的生态啊,提供了这个 ai 的 底层的支撑。没错,那我们就直接开始今天的主题吧,我们先来聊第一块啊,就是这个三款模型的分工啊,这个感知决策表达,这个闭环的构建。 想先问一下啊,就是这个小米的这三款新的大模型,他们分别是负责什么的啊?然后主要的技术参数有哪些亮点?那这个系列呢,它其实是有三款啊,一款呢是叫做 pro, 它是一个旗舰的大脑, 这他是负责做决策的,做规划的,那他的参数呢,是超过了一万亿啊,然后他的这个激活的参数呢是四百二十个 g。 他 还有一个特别厉害的,就是他能够支持一百万透根的这种超长的上下文, 这个是很厉害的,就是他可以呃做一些很复杂的多步骤的任务。那他的这个在国际的榜单上面的排名呢,也是非常非常靠前的,他的这个价格呢,只有国际上同级别产品的五分之一。哇,这个价格真的很有杀伤力。然后另外一个呢就是欧米尼,他是一个全模态的一个感官, 就它能够同时去处理文本、图像、音频、视频。嗯,那它的这个音频理解呢,是超过了这个业界的标杆啊,它能够支持十个小时的这种连续的音频的分析,它的这个图片和视频的这个推理呢,也是非常非常强的。 最后一个呢就是 tts, 它是一个语音合成的专家,就是它能够把这个 ai 说的话变得非常的有感情,而且它可以切换方言,它甚至可以模拟唱歌, 就它的这个表现力是非常强的。就说这三款模型在实际应用中具体都有哪些让人眼前一亮的表现呢?比如说这个 pro, 它不光是在这个权威的测试里面表现的非常好,就是它的这个多部的任务啊,包括工具的调用啊,都非常的稳定,然后它也在这个真实的生产环境当中去做了验证。这个 omni 呢,它是在这个多模态的理解上面和这个跨模态的执行上面都刷新了这个行业的记录, 同时它也已经被接入到了这个主流的办公软件当中去提升这个操作的体验。这个 t t s 呢就更不用说了,它的这个语音的效果就是已经可以以假乱真了,而且它已经被集成到了这个小米的全生态当中去提供这种高拟真的这种交互。就是说这三款大模型一起到底给我们带来了一个什么样的全新的局面呢?就这三个其实是一个完整的智能体的一个能力的战, 就他把这个感知、决策和表达全都打通了,所以说他可以让这个 ai 去理解这个世界,然后去思考这个世界,去和这个世界进行非常自然的交流。这就不光是让这个智能助手变得更聪明了,他其实也给整个产业,给开发者,给这个生态带来了一个新的升级的一个机会, 就是小米的这个 ai 已经正式的进入到了这个第一梯队当中,我们接下来要聊的就是战略价值凸显出来的这个部分了,就是小米的这一套 miimo two 系列的大模型,到底在这个智能体的赛道上面实现了哪些差异化的突破?小米其实这次的布局非常的激进啊,就是他是直接想要从这个通用的助手这个层面直接跨越到能够在真实的物理世界当中去自主行动的这样的智能体。 那它的这三款大模型呢,就分别是负责思考、感知和表达的这样的一个功能,就把这个智能体的这个核心的能力全部都打通了。哦,这三个分工就很明确啊,那这背后的技术亮点还有哪些?就是它这个 pro 这个模型呢,它是用上了万亿级的参数, 然后呢又加上了这个百万级的这种上下文的窗口,就它其实是可以做这种非常复杂的多步骤的任务的,这个在业界都是非常领先的。这个 omni 呢,它是可以原声的去处理图像、视频、音频和文本,就它是一个全模态的一个输入,而且它甚至可以理解连续十个小时的这种音频内容。 这个 t t s 呢,它就是让这个 ai 可以 用非常自然的带感情的声音跟你交流,而且它甚至可以模仿不同的方言唱歌都可以, 所以这三个组合起来就形成了一个非常强的独特的竞争力。对,那我现在就是想知道,就是小米的这一套 mini v two 系列的大模型,到底是怎么让自己的这个硬件和软件实现了这种深度的血统呢,就是小米其实它是把这套大模型作为一个智能的核心, 然后植入到了它的这个所谓的人车家这一个全生态当中,就包括手机啊、汽车呀、智能家居啊等等的这些设备当中都有这个大模型的这个能力,所以它是真正的打通了这个端源的壁垒啊,让这个设备之间可以无缝的协助,所以就是说用户能够在各种场景下都能够享受到这种一致的智能体验。对,没错没错没错,那比如说它的这个 pro 这个模型可以让你的家电去执行一些非常复杂的任务, 然后这个 omni 呢,可以让你的汽车 s u 七能够去理解复杂的路况,这个 t t s 呢可以让你的这个语音助手变得非常的有个性。所以就说小米它其实不仅仅是在做一个产品,它其实是在把整个生态都升级成一个有自主行动能力的这种智能体的系统。那你觉得就是小米在推动这个 m m v two 系列的大模型的开源和开放生态这方面, 你觉得他们做的怎么样?小米这次的动作我觉得非常的大,他就是说不光是给开发者提供了这个非常非常低的门槛啊,就是他的这个 a p i 的 价格是比国际上的那些巨头都要低很多,然后他还限时的免费,对,他就是希望说让大家能够都来用。他也同时对接了五大主流的这个 agent 的 开发框架,他的这个最最新的这个 flash 这个模型呢,甚至是完全开源的,用的是 mit 的 协议, 这对整个行业会有什么样的影响?就是这个就会让全球的开发者都能够非常轻易的来接入,然后也会让这个创新的项目会大量的涌现出来。再加上小米本身有非常多的硬件的设备和这个活跃的用户,所以他其实是在很短的时间内就可以打造出一个非常繁荣的 ai 的 新生态,这个也会大大加快这个产业的升级和技术的落地。我们来聚焦一下啊,就是技术落地和生态壁垒这几个关键点, 想先请你解读一下小米 mini v 二系列大模型在技术创新上到底筑起了哪些护城河?就小米的这个参数规模是超过了一万亿, 然后它是使用了这个混合注意力机制和这个分层的记忆压缩啊,它可以支持百万级别的这种上下文的 tokens, 它在这个实际的推理上面的速度也提升了将近一半, 它的这个算力的消耗也比同类的要低百分之七十以上,这个性能确实是挺吓人的。那不光是这个,它的这个多模态的这个输入啊,就是图片、音频、视频它是可以一起输入的,它的这个音频的理解能力是超过了这个页面的这个标杆,它的这个 tts 是 可以做到非常细致的去控制这个音色和情感, 它是一个全站自研的一个技术,再加上它的这个端云的协同,以及它的这个安全的保护啊,这都是形成了一些很难去复制的一些壁垒。小米这个米某 v two 系列的大模型到底在哪些场景下已经开始落地应用了?就是现在已经开始在小米的这个智能助手上面,以及这个澎湃 os 上面,还有这个 su 七的这个智能座舱里面都已经开始使用了。 然后在这个办公领域也有和这个金山 wps 进行合作,在这个工业质检上面也有落地,而且它这个在这个多终端上面是可以无缝的进行协同的,所以它这个覆盖的范围特别广, 听起来已经挺成熟了这个应用。是的是的,而且他们不光是这个模型本身的这个技术做的很强,他们在这个开发者生态上面也是下足了功夫,就是他们的这个 api 价格是远远低于这个国际巨头的。 然后他也有这个限时免费和这项的技术支持,他也和五大主流的这个 a 阵的框架进行了深度的打通,所以就说整个的这个创新的活力被充分的激发出来了,所以这个技术的变现的速度也是非常快的。你觉得小米这个米某维 two 系列的大模型,在现在这个时间点,它的实际的产业地位到底怎么样?这个我觉得就是首先它是国内第一家把这个万亿级的参数和这个百万级的上下文做到了一个标准, 然后它在这个国际的榜单上面也是牢牢的占据了第一梯队的这个位置。就是它的这个无论是在长文党的处理,还是在这个复杂的推理,还是在这个多模态的理解上面,它都是刷新了这个行业的这个天花板,所以它是真正的做到了这种软硬件一体化的这种布局嘛,没错没错,而且它是深度的绑定了这个澎湃 o s 和这个小米的全站的硬件,然后它是形成了一个完整的从端到圆的一个智能的闭环, 它的这个开放的策略又是非常的激进,所以这个是会推动整个 ai 产业的,这个壁垒已经非常的明显了,所以这个是会推动整个 ai 产业的一个加速的升级。今天咱们就看到了小米这三款大模型, 不光是技术上面有非常大的突破,嗯,而且他们真的是在落地和生态上面迈出了非常关键的一步。嗯,对,所以我觉得小米的这个 ai 新征程确实让人充满期待。好了,那这期节目咱们就到这里了,然后感谢大家的收听,咱们下期再见,拜拜。

科技界又迎来重磅突破,小米刚刚开源了首个机器人 ai 模型 xiaomi robotix 零,这个拥有四十七亿参数的视觉语言动作模型将彻底改变机器人的智能水平。这个黑科技采用了创新的混合 transformer 架构,将高层推理和精确运动控制完美分离。 最厉害的是,它解决了机器人 ai 领域长期存在的卡顿问题。通过异步执行技术,机器人可以一边执行当前动作,一边计算下一个动作,让机器人动作像人类一样流畅自然。在性能测试中,这款模型表现惊人, 在 l i b e r o 测试中成功率高达百分之九十八点七,在其他多项测试中也遥遥领先。三十个对比模型, 这得益于它庞大的训练数据、两亿个机器人动作轨迹和八千万视觉语言样本。更令人兴奋的是它的实际表现,搭载这个模型的双臂机器人能完成超高难度的任务,拆解二十元积木的乐高,组建 折叠毛巾时还能自动调整抓取方式,甚至学会甩动布料露出隐藏的边角。目前,小米已经在 github 和哈根费上公开了全部原代码和模型权重。这是继去年自动驾驶模型后, 小米在 ai 领域的又一重大突破。雷军此前透露,小米计划五年内在工厂部署人形机器人,这次开源或许正是这一战略的重要一步。

大反转来了!全网猜了一周的万亿参数神秘模型不是 deepsea v 四,而是小米的 memo vr pro。 小 米罗弗利还自报这是他的作业,并承诺等模型稳定时,模型将开源。事情是这样的,上周,代号为 hunter alpha 的 神秘模型悄悄上线了全球最大 a p i 聚合平台 open roter, 短短七天内累计调用量突破一万亿, toon 连续多日登顶榜单。有不少网友就猜测这是 deepsea v 四的内测版本, 理由也非常简单,其推理模型和之前 deepsea 模型中常见的思维链风格非常相似。而就在刚刚,小米官方正式认领 hunter alpha, 宣布推出三款模型,分别是 mimo、 vr pro、 vr omni 和 vr tts。 其中 vr pro 就是 hunter alpha 的 真身,有一万亿参数,百万超长上下文,也是国内首个万亿参数大模型,在权威榜单 artificial analysis 上,它排名全球第八,国内第二。 随后,小米 mimo 大 模型负责人罗福利也在 x 上发长文表示,这是小米首款真正为智能体时代打造的全站产品系列,并承诺当模型足够稳定的时候,模型将会开源。 小米创始人雷军也在微博发文表示,小米在 ai 领域上相对比较低调,但实际进展可能比大家看到的要快很多。不过更让人惊喜的还是,目前这三个模型的 api 都是免费的 openclo 天选模型。

小米 miimo ai 大 模型呢,开源了,据说呢,它是可以和 d p 三点二白一白时光的,那除了常规的问答之外呢,它是可以生成直接网页端可用的代码, 比如我在这里输入帮我写一个三角函数的关系式 e, 可以 网页端运行的那种,那只要几分钟呢,它就会生成一串代码,并且呢,这串代码是可以直接在线预览的。 说实话,这种在线生成代码并且在线预览的功能呢,对普通人来说其实用处并不大,但别忘了,小米的智能家居生态呢,可不是闹着玩的,来发挥一下想象,当小爱同学也揭露了咪某,也许在未来的某一天,我们只需要跟小爱同学说,哇,好无聊啊,来找个游戏打发一下时间吧。 那这个时候空调根据温度自动打开加湿器呢,也会自动判断空气的湿度,那像什么投影仪,窗帘、音响、灯光这些呢,全部都帮你自动设置好,这个时候你只需要拿起手机美美的畅玩一整天。那又或许你跟小爱同学说今晚下班呢,我出去吃个饭可能九点半才回家, 那这个时候家里的扫地机器人呢,开始工作,扫完地,拖完地之后,自动打开窗帘,开始通风晾干。当你打开家门的那一刻,小黑音响响起了他的声音,他说,今天玩的怎么样,还开心吗?热水呢,我已经准备好了,快去洗澡吧。 也许在未来,我们真的可以拥有属于自己的贾维斯。那么视频的最后,你们觉得小米咪某算不算是国产 ai 的 第一梯队呢?欢迎评论区留言。

当大家还在关注消费电子的迭代升级时,小米已经悄悄在 ai 领域拿下重磅突破。三月十九日凌晨的这场 ai 发布会,小米直接亮出三大自研核心模型,宣告正式发力,智能体时代 也让国产大模型再一次站上全球舞台。本次发布的 mimo 杠 v 二系列三款模型分工明确,各有所长,构建起小米完整的全站 ai 技术底座。 作为核心旗舰的 m i m o v 二铺,是小米迄今为止最强的云端基座模型。万亿级总参数搭配四百二十亿激活参数搭配创新架构,实现了一百万 token 的 超长上下文支持。 这意味着它能轻松处理超长文档、完整代码库多轮复杂任务,在全球权威模型榜单中跻身第八、国内第二,性能碾压一众竞品,成为智能体场景的核心算力支撑。 而 me e me o v r o m e n e 则主攻全模态感知,打破了传统 r i d。 模态的局限,原生融合文本、 图像、音频、视频四大维度的理解能力。不管是长达十小时的连续音频解析,还是高精度的视觉推理、图表拆解,亦或是完整视频的语义理解,都能做到精准高效、 完美适配内容创作、智能办公、数据分析等多元场景,真正实现 ai 的 跨模态无感交互。最后一款 mimo v 二 tts 则聚焦情感化交互,攻克了传统语音合成生硬无情绪的痛点, 通过自研技术实现拟人化的语音生成,不仅能调节音色语速,还能精准把控情感语气。后续将全面适配澎湃 os、 小 米速七智能座舱、智能家居全场景, 让每一次智能交互都更有温度,彻底拉近人与 ai 的 距离。目前,这三大自研 ai 模型已经正式开放 api 接口,限时免费一周供用户和开发者体验。后续,小米也会持续推进技术落地, 把顶尖 ai 能力融入全场景生态。从手机、汽车到智能家居,小米正在用自研技术把高端 ai 从实验室走向大众生活。 这不仅是小米的技术跨越,更是国产 ai 稳步崛起的有力证明,属于全民 ai 的 智能生活,已经越来越近了。

这几天,有一个匿名模型 hunter alpha 在 海外刷屏,甚至龙虾作者也在猜,究竟是哪家公司,上线仅三天就冲上了日榜第一,累计使用量更是超过一万亿,头肯位列全球第八,中国第二,仅次于 glm 五和 mini max。 当所有人都以为这是 deepseek v 四时,谜底揭晓,真身竟然是小米,惊掉了一众网友的下巴。 许多模型还在测试阶段,就铺天盖地的预热,生怕市场不知道他做了什么。唯独小米一点风声没露。匿名上线小米大模型,之前闻所未闻,但这次一口气亮出了三张王牌旗舰模型 vivo v 二 pro, 总参数超过一 t, 激活参数四十二 b, 支持最高一百万上下文。还有多模态大模型 mini v 二 omni 和语音模型 mini v 二 tts。 其实不看数据,光看使用量就已经能说明它的实力,我们也在第一时间上手试玩,只能说确实很符合小米主打实用的一贯画风。为什么 mini 会突然一鸣惊人, 在海外甚至把谷歌的 jimmy 三 pro 都给比下去了?其实这就是典型的小米十打法,虽然很晚入场,但我一步到位,米家很多业务都是这个节奏,前期偷偷发育,一旦出手就是王炸。 认领完这份成绩,雷总又悄悄干了一件大事,小米顺手上线了小米龙虾,简称小虾米,是国内首款手机端龙虾智能体 深度接入金山办公生态,能调用 agent 处理 wps 全家桶。接下来小米要面对的问题是,再往前走,就无法摸着石头过河了,行业的无人区,没有人可以对标,也没有现成答案。这一次,小米走在了浪潮的最前面。

屌爆了,阿基米这家伙居然闷声做大事,这个亨哥阿尔法模型真的居然是小米的模型!小米此刻已经官宣了,这个米某 v 二的中号版本就是出现在奥本路特上的这一个排名第三的模型。 小米太强了,果然是雷军的做事风格,此刻可以说出那晶晶金光闪闪的六个大字,友商是在 ai 时代,小米全面追赶上,而华为已经全面落后掉队了,为什么这两家公司会有这么大的差别呢?作为后来者, 一刚开始肯定不完美,总会被嘲笑,被怀疑,这些都是意料之中的事情, 但我相信这个世界终究不会是强者恒强,后来者总有机会。无论前方有多少困难, 我们都决不放弃,我们一定要坚持下去,只要开始追赶,我们就走在赢的路上,不要怕,坚持下去,坚持到最后的胜利!

向我来看,他已经进入了开卷模型当中,全球 top 一 二小米新自言 ai 模型上来就开大招,比肩 cloudsonnet。 四点五,以为到年尾了, ai 大 模型这一块应该没有大热闹了吧? 谁知小米千万年新挖来的九五后 ai 女神罗福丽,带着屠龙宝刀,直接给小米搞出个三零九 b 参数的 ai 模型。咪蒙 v 二 flash 这姐妹儿北大计算语言学毕业,从阿里达摩院到换方 deepsea, 再到小米接下咪蒙大旗,入职一个月就交出重量级的大模型, 听说代码能力跟 cloud 不 相上下,性价比还卷到 cloud 的 百分之二点五,这不是降维打击吗?只能说天才的职场节奏根本不是试用期,而是直接解锁终极任务。普通人还在摸鱼熟悉环境,他上来就炸场,连小爱同学都直接连夜换成了自家模型。当你问他名字的时候,他会告诉你,他叫 mimo。 这是换名字了?小爱同学, 别装了,你到底是谁?行我摊牌,但我真的就是 vivo 呀!而且小米该模型直接开源,程序员们狂喜,终于能白嫖企业级大模型了。不过真实效果到底咋样,相信不久就会有答案。

兄弟们,小米竟然发布了他的开源大模型 mi 某 vr, 网址,我放评论区了,按照小米的说法是可以对标 tiktok, 三点二,我也实测了一下,运行速度确实快,比 tiktok 快 多了,这也是天才少女罗普利加入小米后的第一个产品。 然后这次小米大模型呢,有两个优势,第一就是中文场景的深度优化,这个我还是觉得超级实用的,在写文案写脚本的时候,包括写提示词的时候,确实没有这么费劲巴拉的了。 第二个优势呢,更重磅一点就是小米生态的原生融合啊,其实也就是米家生态吗啊,届时米某于啊将深度融合,澎湃 vs 未来的米家生态呢,将具备场景理解与主动调节的能力,通过分析用户的作息习惯,健康舒郁啊,结合室内外的一个天气空气质量,将自动调节空调温度啊,空气净化器 等等等等的智能家居,让人车家这个概念真正的智能融合,所以这个点可以说是非常的有想象力啊,让 ai 开始接触大家一个真实的生活了, 打破了目前好像 ai ai 只能做到梗图的概念。所以总结一下,小米的大模型还是真的有点东西的,虽然目前还是处于比较早期的阶段,但是只要融入了小米生态,我觉得未来还是不可估量的。

万万没想到,竟然是雷军!一个名叫亨特 alpha 的 神秘大模型突然空降,参数量高达恐怖的一万亿一百万的超长上下文窗口, 极度强悍的复杂逻辑推理能力!根据最新的 gitlab 代码提交记录,实锤亨特 alpha 其实是小米最新研发的咪蒙 v 二 pro 纯文本推理模型,而和它一起上线的 heli alpha 则是小米的多模态全能大模型!直接让外网老哥惊呼,小米的参数和能力已经挤进了全球第一梯队!最离谱的是,这种顶配前沿大模型,目前竟然完全免费随便用!赶紧去白嫖,体验一下雷总的最强大脑!

小米天才少女罗弗利首秀称小米开源模型全球前二!这不是一次普通的站台, 因为这是罗弗利正式执掌小米麦某大模型团队之后,第一次系统性的对外讲清楚,小米到底要怎么做大模型, 又要把 ai 带到什么地方去。现场的气氛其实很微妙,小米创始人雷军没有出现,集团总裁卢伟兵率先登台,把业务成绩和战略方向凸开。而真正把全场注意力拉到 ai 上的, 是第三位登台的罗富利,他现在的身份是小米 mimo 大 模型负责人,但在行业里,他更为人熟知的标签是前 deepsea 核心成员。一上台,他没有先讲参数, 也没有讲成绩,而是直接把时间拉回到了六亿年前。他说, ai 正在以一种非限性的方式重演人类大脑六亿年的进化史。罗弗利在现场明确给出了小米打造 agent 语言基作模型的三个重点方向,第一 是极强的代码能力和工具调用能力,因为在 agent 的 时代,代码本身就是高效沟通的语言。 第二是围绕极致推理效率设计的模型结构,支撑高带宽的 agent 的 写作。第三是全新的后训练范式,用来保证强化学习可以稳定扩展。 真正让现场出现讨论声的,是他随后给出的一个判断。他说, miami v 二 flash 模型体量并不算大,但在代码能力和 agent 测评的世界级公开评估榜单中,已经进入全球开源模型前二。于是问题来了,这个前二意味着什么? 支持的一派认为这是一个非常强烈的信号。过去几年,大家一提 ai, 总觉得核心能力在国外?过去几年大家一提 ai, 总觉得核心能力在国外。现在天才少女站出来说, 在公开评测中排到前列,这本身就值得被讨论。现在天才少女站出来说,在公开评测中排到前列,这本身就值得被讨论。也有不少人说,这至少说明一件事,小米已经不是蹭 ai 热度, 而是在这个方向上认真投入了。但质疑声也很快出现,有网友说,不同榜单标准不一样,前二到底是哪些维度?也有人提醒, ai 模型更新很快,排名只是阶段性的,这些声音其实都很正常。 但有意思的是,这次讨论并没有停留在你行不行上。更多人开始讨论的是另一件事, 那就是小米为什么要反复强调开源。不少评论提到,现在很多公司更愿意做闭源,把能力握在自己手里,而小米选择把模型开放出来,本身就是一种态度, 不是单纯秀成绩,而是想进入一个更大的技术生态。罗弗利在台上也提到,开源不是做慈善,而是一种加速方式。 这句话被很多网友单独简出来讨论,有人觉得理想主义,有人觉得这是长线打法,但不管站在哪一边,大家都认可一点,那就是小米这次是真的把 ai 放到了一个非常靠前的位置。还有一个 话题也被频繁提及,那就是罗弗利本人,九五后,女性,纯技术背景,从学校到大厂,再到今天站在舞台中央,很多人说这样的技术负责人本身就很有象征意义, 甚至还有人说他的发言风格让人想起早期的小米,反复强调长期投入,也有人提醒不要因为一个发布会就给任何公司下结论, ai 是 长期战,真正的考验在后面。但从舆论层面看,这次首秀已经达成了一个效果, 那就是小米的 ai 不 再是一个模糊的概念,而是有了具体的人,有了清晰的态度,也有了可以被讨论的坐标, 有人会继续质疑排名,有人会等待实际应用,也有人只是单纯记住了一个名字。但可以确定的是,从这场首秀开始,小米在 ai 这条路上已经很难再被忽视了,而罗弗利也注定会成为接下来一段时间里被反复讨论的人。

兄弟姐妹们,咱们今天聊点干的?今天聊一个藏了很久才亮相的重磅消息,小米的万亿参数大模型终于浮出水面了,它叫 mimo v 二 pro, 在 正式发布之前,它以 hunter alpha 的 代号匿名测试全球开发者,掉用量已经突破了一万亿 token。 更戏剧的是,这期间所有人都在猜这是谁家的模型,有人说是 deepsea v 四,有人说是 g l m 五点五, 没人想到是小米。先说清楚他牛在哪?第一,全模态不是只会聊天的文本模型,是能看能听能动手的多模态怪物集成了语音合成,你可以跟他说话,他也能跟你说话,还能看懂图片视频。 第二,上下文窗口一百万 token, 这意味着什么?你可以扔给他一本书,一份几十页的合同,一整段对话记录,他都能记住,都能理解,都能基于这么长的上下文给你回应。 第三,评测成绩, airtime analysis 综合评分四十九分,全球第十,略低于 gpt 五点二 codex 的 五十分。但在 gdp vl 真实任务评测中,他拿了一千四百二十六分,国产排名第一,超越了 glm 五的一千四百零六分。 这个对比很有意思,综合排名第十,但真实任务国产第一,说明什么?小米没在追求跑分,而是在追求干活的能力。小米想干什么? 不是做一个 chat gpt 的 竞品,而是做小米生态的 ai, 大 脑、手机、汽车、全屋智能硬件全部接入 mimo v 二 pro, 云端和终端协同,实现真正的智能联动。 你早上醒来,手机上的咪木知道你今天的日程,告诉家里的智能音箱放什么音乐,让扫地机器人避开你即将出门的时间段,给汽车提前调好空调和导航?这不是幻想,这是 a 阵的能力。任务调度,多设备联动,主动服务。为什么匿名测试?小米这次玩了一手漂亮的 匿名上线,让市场自己评判,不靠品牌背书,纯靠实力说话。结果开发者们用疯了,一万亿 token 的 调用量,说明模型真的好用。猜来猜去,猜不到是小米,反而证明了小米的技术实力被严重低估。深层意义是什么? 小米正在从硬件厂商转型为 ai 加生态服务商。以前小米卖手机、卖电视、卖扫地机器人,每个产品是独立的。现在有了 mav、 二 pro, 这些产品全部被一个大脑连接起来,形成智能生活的完整闭环。这不是堆硬件,是卖体验。一个能听懂你、预判你、服务你的智能生活。 对比 growq 这种纯技术流,小米的优势在于生态整合能力。 growq 的 模型再强,没有硬件落地,小米的模型虽然排名第十,但有几亿台设备等着它赋能。 最后说几句, mini v 二 pro 的 发布,标志着中国大模型竞争进入了生态战阶段,不只是比谁的参数多,谁的跑分高,而是比谁能让 ai 真正融入生活。小米的策略很清晰,不追求全能冠军,而是追求场景冠军, 在智能生活这个赛道上,做最好用的大模型。但问题也来了,当小米的 ai 大 脑掌控了你家里的所有设备,你的隐私、你的数据、你的生活习惯都暴露给他了,这种便利, 你愿意用多少隐私来换?那么问题来了,如果小米的 ai 能帮你搞定生活的一切,你愿意让他知道你的所有习惯吗?

屌爆了,阿基米这家伙居然闷声做大事,这个亨哥阿尔法模型真的居然是小米的模型!小米此刻已经官宣了,这个米某 vr 的 中号版本就是出现在奥本路特上的这一个排名第三的模型。 小米太强了,果然是雷军的弱势风格,此刻可以说出那金金金光闪闪的六个大字,友商是在 ai 时代,小米全面追赶上,而华为已经全面落后掉队了,为什么这两家公司会有这么大的差别呢? nice 作为后来者,一刚开始肯定不完美,这些都是意料之中的事情, 但我相信这个世界终究不会是强者恒强,后来者总有机会。无论前方有多少困难, 我们都决不放弃,我们一定要坚持下去,只要开始追赶,我们就走在赢的路上,不要怕,坚持下去,坚持到最后的胜利。

万万没想到,小米的大模型直接封神,最近在全球最大的 a p i 聚合平台上, 突然杀出了一匹黑马,一路狂飙,冲到了第一。这个模型有多强?很多人猜是 deepsea 微视, 就连 open core 创始人都在公开打探他的消息。今天答案揭晓了,是小米的 mimo v 二 pro。 更令人震惊的是,小米一口气发布了三款新模型,真的是火力全开, 中国首个万亿参数支持百万级上下文的旗舰模型,居然是一家硬件公司做出来的,带队的正是从 devic 走出来的天才少女罗浮丽。 目前小米已经挤进国内大模型第一梯队了。小米为什么要做大模型?我觉得不是为了蹭热点,而是人、车家生态必须要有一个真正的大脑, 手机、汽车、智能家居,单独用都只是工具。但如果有一个大模型,把它们连起来,让它们能够理解用户的意图,自主协助痊愈互联,那想象空间就大了。 ai 大 模型从来都不只是聊天,而是要走进生活,解决具体问题。这一次,小米站在了最前列。

晚上好,以下是过去二十四小时全球科技动态,小米认领霸榜神秘模型三款四颜大模型齐发,股价逆势大涨,超百度报道、媒体见面新闻、华尔街见闻、证券时报、澎湃新闻三月十九日凌晨,小米正式发布 mini 大 模型十点三零, 其中旗舰机务模型 selimi mini b r pro 被证实正式起现在全球 a b i 平台 open router 上蝉联榜首,引发全网猜测为 神秘模型蝙蝠 alpho, 拥有万米同宽数量,支持一百万超长数据。北京表示,该模型在全球综合智能排行榜 entrepreneur analysis 分 别列全球第八名,品牌排名全球第五,超越了 xai 的 group 受重磅 ai 成果发出新一代小米 m 一 七十万像素 中小企业股价在港股大盘走低的背景下遇势大涨,涨幅一度超过百分之五点一二。 openai 发布 g p t 五点零新 mini banana, 主打高峰股量与实时推移报道媒体 techweb openai 周二推出迄今为止最强的小型模型,装备、代码助手、智能股计算机系统等。 g p t 五点四 mini 在 运行速度上比 g p t 五 mini 提高两倍以上,且在代码编辑和多模态理解方面运行大一点。它在 s w e benzco 等基本上呈现出色,能在复杂专业领域中保持可靠的公信效率。