科技界在先, ai 风暴!小米刚刚宣布了一项震惊行业的重磅投资计划,未来三年将豪掷六百亿人民币,折合八十七亿美元,全力压住人工智能研发。这是中国科技企业迄今为止最大规模的 ai 投资承诺。 这场 ai 革命的核心是一款代号 hunter alpha 的 神秘模型。这个万亿参数级的 m i m o。 杠 v 二杠 p r o。 大 圆模型,竟然在上周悄然上线 open router 平台后,就以惊人的性能迅速登顶排行榜。开发者们惊讶地发现,这个被误以为是初创公司产品的黑马 竟然出自小米之手,更令人惊叹的是,它的性能超越 claude 四六 sonnet 通用智能接近 oppo 四点六,但成本仅为竞争对手的五分之一。小米 ceo 雷军自信满满地表示,全球开发者都评价他智商、情商双高,执行任务又快又准。小米的 ai 野心远不止于此, 公司同时发布了能处理多模态输入的 mymo vr omni, 以及能模仿地方方言的情感语音合成模型 m i m o v r t t s。 更值得关注的是,小米正在内部测试手机端 ai 智能体 micro, 预示着 ai 将直接进驻我们的掌上设备。这场发布会释放出一个明确信号,中国科技巨头正集体从简单聊天机器人 转向能自主执行复杂任务的 ai 智能体赛道。随着八十七亿美元的重金投入,小米显然准备在全球 ai 竞赛中放手一搏。未来三年,这场智能革命将如何改变我们的数字生活,让我们拭目以待。
粉丝937获赞1.2万

三月十九号,小米发布了一个新的模型啊,这个模型号称可以免费七天,但是我进它的官网之后发现它用不了,调了一下它的 a p i 接口是说欠费的。我今天又发现了,它可以用,需要借助于 open code 这个编辑器来做。在这里 米某 v 二 pro 模型它是免费的。本来昨天就想体验一下的,那今天的话才能用得上,那我今天就简单地对它做一个测评吧。 测评的话主要分为这个两部分,首先讲一下它的这个参数,然后让它做一个前端的一个驳刻,嗯,最后的话就是这个后端的这个测试的话,其实是想用它来修 bug。 这个我在白天的时候已经试过了,先看一下它的这个参数吧。这个参数,嗯, 这个 ppt 是 让这个模型来做的,其实还是做得不错的,就是现在比较流行这种深层的网页形式的这种 ppt, 然后我按前后方向键是可以翻页的。那它这个模型的参数的话,是所谓的万亿的参数。三个大模型, 第一款的话是这个基座的模型,支持代码推理和规划。第二款的话是这个视觉模型、音频模型和文本模型的统一感知能力的方面的所谓多胞态吧。那最后一款模型的话,是测出你这个语音的,它的这个参数的话,其实还是比较亮眼的。那排名方面的话是排到第八了,号称 超过了这个 x 的 goroc 模型呢,成本也比较低。呃,这个模型的话其实已经有一段时间了,在这个 open root 上面,它是匿名上线的,它的调用量还是比较高的。在这个 open root 上面都已经登顶了啊。 嗯,之前很多人猜测它是一个 deepsea 的 v 四模型,但在三月十九号的应该是早上啊,早上上班的时候看到这个,雷军宣布了这个模型的这个名称,官网上面也 说是可以免费调用啊,但其实是调不了的,一直到现在的三月二十号的晚上,整整两天过去了,它还是不能调用,那它这个 a p i 也是相对来说这个价格还好啊。它这个模型的这个发展历程的话,大概是就是最早是 二五年的四月份开始做的,一直到现在。嗯,正如雷军所说的,就是这个模型的进步确实也是挺快的啊,就是之前的话,可能主流的模型里面都没有关注到有小米的这个模型。嗯,了解一下他们这个团队负责人啊。 是这个,简单说就是高材生。那他支持的生态的话,现在有一个 miklo 的 这个。嗯,龙虾嘛,龙虾,小米版的龙虾,然后还有他自家的自己的一些生态, 现在有一个福利,就是说七天免费调用的,这是他号称的,实际现在还是有问题的。小米版龙虾我也体验了一下,就是目前在他的官网是可以就是免费体验,但是每次体验的时长应该是只有一个小时啊,过了这个时间他会给你轻松的。 然后昨天试了一下这个,昨天就可以用,然后今天又试了一下它。其实,呃,常见的一些问题的话还是可以回答到的。我问了它是基于 opencloud 来构建的吗?它这个地方也回答了,就是看它的这个目录结构就是 确实是通过 open class 来构建的,右边能显示使用的这些文件啊,我昨天体验的时候还让他在这里做了一个 ppt 啊,这个 ppt 的 效果是在这个右边,然后可以直接在线的播放,做的 ppt 的 效果还是不错的。然后第二个的话是让他写了一个博客, 这是通过这个 open code, 这个大家如果想体验的话,目前我发现的这个渠道啊,就是这一个 open code 通过这个 mod 可以 来切换这种模型啊,就是可以选得到这个免费的 mimo v 二 pro 模型。然后我这里就是让这个模型来写,写了一个啊播客,这个 包括的一个效果的话,大概是这样子,这个还是比较现代化风格的一个单网页吧,然后续我觉得可以在这个基础上面做一些嗯,优化,然后让它这个 功功能更完善一下。这里也对比了一下它和其他的主流模型的一个数据的情况。我现在用的是这一款的 kimi 的 二点五,可以看到它的这个调用量的话,其实还是不错的,就是可以和这个 kimi 的 来进行对比了,这个调用量越多的话,说明它这个模型还是越受欢迎。然后下面这些其他的数据的话,其实大差不差啊,要注意它是不支持这个流逝输出的,并且它是这个文本模型啊, 就是不支持这个图片的,嗯,包括这个 mini max 二点七,它也同样是不支持图片的,它的图片能力其实需要通过外界的 m c p 来实现的啊。而像这个 kimi 二点五的话,它的这个, 嗯,它是原生支持图片的,就是我们在 cloud code 里面使用的时候,是可以直接把图片丢进去,它可以直接识别到的, 这点的话其实还是很有优势的。大家如果想体验一下这个模型的话,可以下载一个 open code, 就 大概就涨这么多吧,然后去用这个模型的一些体验的话,会持续的进行分享。

上周, openroot 上突然冒出两个匿名模型,一个叫 hanter 阿尔法,一个叫黑了阿尔法没有宣传,没有署名,钓鱼量直接飙升到日榜第一,累计干了一万亿投竿的钓鱼量。 当时全网都在猜,这是 deepsea 的 v 四,还是月之暗面的新模型,连 open 可乐的创人都在 x 上发文打听, 最终答案揭晓,所有人都愣住了,是乔米!他们不仅认领了 hunter 阿尔法,还一口气发布了三款自研模型 miami vr 系列。其中旗舰模型 miami vr pro 万亿参数百万上下文,在全球大模型榜单上直接冲到第八,国内第二。其实比参数更值得琢磨的,是小米做这件事的逻辑。 你看它的模型,全是冲着 agent 那 去的,不是跟你聊天的机器人,而是能帮你干活、能调用工具、能编排复杂任务的数字助手。小米要的不是一个会说话的 app, 他要的是一个能连接所有设备的大脑。手机、电视、汽车、智能家居。这些东西如果各自为战,价值有限,但如果有一个大模型能把它们串起来,听懂你的意图,自动完成任务,那就是另一回事了。 雷军昨天也说了,小米今年在 ai 上的研发投入会超过一百六十亿。高盛直接给了买入评级,说小米正在从 ai 研发的投入期迈向成果兑现期。 所以,别再把小米当成单纯的硬件厂商了。在 ai 这条赛道上,又多了一个有声采、有场景、有执行力的玩家。对用户来说,多一个强光型就多一个选择。当然,好不好用自己试了才知道。但有一点是确定的,能解决问题的 ai 才是好 ai。

前几天 openroot 日榜第一的神秘模型原来是小米的。小米今天正式发布了三款顶级模型,其中最炸的是 memo vr pro, 这个模型一周前以 hunter alpha 的 代号匿名上线, openroot 上线就杀疯了,多天登顶日榜,掉用量突破一 t, tokens 参数规模直接突破一万亿,支持 em 超长上下文,在全球权威排行榜二 gps 上排第八,国内第二。更关键的是,它专为 agent 场景打造,在 opencloud 的 标准评测中表现顶尖,能力直接对标 cloudsonnet 四六和 gpt 五二,另外两款也很强。 memo vr omni 是 多膜态感知模型,负责帮 agent 理解环境。 mimo v r t t s 是 语音模型,让 agent 能跟人自然对话。三个模型组合起来就是一个完整的智能体解决方案,价格也不贵,两百五十六 k 上下文内输入一美元,输出三美元。小米这波 ai 布局你怎么看?

ai 圈被两款匿名神秘大模型彻底整炸锅了,这两款大模型很有可能是来自米子的啊,当然也有人猜测有可能是 deepsea 的 v 四或者是智普的, 怎么回事儿呢?就是这两天在 openroot 上边儿突然上架了两款大模型,都是匿名的,一个代号是 hunter arthur, 一个是 hilda arthur。 这两款大模型上线没几天,直接调用量狂飙啊,整个技术社区都在扒他们到底是谁? 先给不懂的朋友们科普一下啊! openroot 就是 一个全球大模型的聚合平台,你在这个平台上可以通过一个统一的接口,同时调用几百加大模型, 谁强谁弱啊,这个数据是没法造假的。这两个匿名的大模行为啥热度这么高啊,就是他们的实力实在是太强了。咱们先说说这个 hunter alpha 啊, 复杂推理逻辑代码常文本能力啊,直接秒杀了一众非常牛逼的大模型,尤其是多部任务多智能体联合调用的时候,表现真的碾压一众牛逼的大模型。 咱们再来说第二个叫 heli 阿尔法,他这个对话理解安全队及内容生成特别强,而且还是多模态的,稳定性特别好,生成速度非常快啊。 关键是这两款大模型现在都是免费用,所以一上线整个社区就爆了,调用量层层的往上飙,现在整个技术社区的工程师都在疯狂的扒这个到底是谁们家出的这么牛的大模型 啊。现在有三个目标,第一,高度指向小米的 miimo 大 模型,大概率说的就是 miimo v 二 pro 的 一个辉度测试版本,还有就是高度疑似 deepsea v 四或者智普的 g l m 五, 不管是谁吧,这都是咱们中国厂商做出的牛逼的 ai 大 模型啊,真的为他们点赞! 再加上小米前几天刚刚公布的一则新闻啊,就是罗富利带领着小米团队和北大团队共同推出了一个 a r l time 系统,它能直接把 ai 的 算力成本大降百分之七十一点二。 大家都知道啊,算力成本现在越来越成为致力于整个 ai 行业发展的一个瓶颈,训练效率也大幅提升。 而且就在前两天,雷军在一个视频当中也说了一句话,我还给大家发了个视频,他说过几天向大家汇报小米在 ai 领域的重大进展。 咱们大家把这几件事串起来想想,如果这个正在线上做灰度测试的牛逼的大模型,真的是小米的 miimo, 哎呀,想想就令人激动啊,那就说明小米的人车加全生态将由一个非常厉害的大语言模型进行赋能, 想一想这个整个闭环的生态,再加上强大的 ai 的 加持,未来会给我们整个使用的体验带来一个什么样翻天覆地的变化,真的是令人很兴奋啊! 再一个就说明我们中国的大模型真的非常能打,这不,两个匿名大模型又霸榜了,模型是实实在在的,热度也是真的高,黑科技也是真的多,雷军的预告从来也没有落空过, 接下来最期盼的就是雷军向咱们大家汇报小米在 ai 领域到底有哪些进展了,真的是非常的期盼啊,相信小米和雷军也会越来越好,我们中国的 ai 行业也会发展的越来越快,加油吧!

这周 ai 圈最离谱的事情应该就是 open router 上匿名霸榜的神秘模型 hunter arthur。 所有人都在猜这家模型属于谁,有人猜是 deepsea v 四,有人觉得这是自己的秘密武器。就连龙虾的创始人 peter 也好奇这个神秘选手的身份。 结果昨晚真身揭晓,是小米。昨天晚上,小米一口气发布了三款模型, mimo v 二 pro、 mimo v 二 omni, 还有 mimo v 二 t t s。 那先说 mimo v 二 pro 总参数量突破一万亿,然后激活参数四十二笔,上下文直接给到一百万 tucker。 百万 tucker 就 意味着你可以把一整本的长篇小说或者是一整套的项目文档一次性维给他,他能从头到尾理解。 而且小米给他的定位是 agent 时代的工作大脑。那实测数据方面,在第三方机构 artificial analyst 的 评测里面, pro 拿到了国产第二,全球第九的排名。 在数学、推理和代码这三大核心能力上,它与国内一众顶尖模型打得有来有回,而小米内部工程师的提杆评价是已经接近了 cloud 四点六 ops 的 水平。 那再说过来这个 hunter arthur 的 故事,闷声干大事,先让实力说话,再让品牌收割。这种蒙面歌王式的出场很有说服力。第二款就是 miimo vr 奥 mini, 如果说 pro 是 大脑,那奥 mini 就是 眼睛、耳朵和手, 它是一个全模态机座大模型,从底层把文本、视觉、语音三种能力统一到一个架构里。那统一架构的好处就是打个比方讲,它可以同时看一段视频,听里面的对话,然后去理解画面内容,最后给到你一个综合判断,那官方说它可以处理超过十小时的连续长音频, 在音频理解上甚至超过了 jimmy 三 pro。 但这里我要说 omni 的 第三方独立评测数据还比较少,我看到的大部分数据都是来自于官方自测,因此还需要更多的独立机构来验证,所以它的真实水位现在就不下定论了。 那第三款就是 miimo v 二 t t s 专攻语音合成,据说它的训练数据量突破了上亿小时,支持各种方言和音色来回切换,也具备音色克隆的能力。那比较有意思的实测案例就是用刘德华的声音叫你起床, 它还可以模仿人类说话的自然韵律,在同一句话里完成语气转折和情感地变。不过坦白来说, t t s 是 这三款模型里面公开信息最少的,而且也没有发布详细的技术规格,没有大规模的公开试听库,连第三方测评也几乎没有。 但是我觉得它目前更像是一个补齐拼图的角色, pro 负责思考,欧米尼负责多模态输入,那 t t s 就 只差最后一步,开口说话。好!三款模型的参数我们过了一遍,我们再来看看小米的这部棋是怎么下的, 大家想想看。大脑加感官加嘴巴,这其实就是一整套从理解到感知到表达的完整电路。然后我们再想想小米有什么手机、汽车、智能音箱、摄像头、手环、电视、扫地机器人。 所以我理解是小米做大模型首先的目标就是把自己庞大的硬件生态全面 ai 化你手机里的小爱同学。然后汽车里的座舱交互,或者是家里的智能设备,在未来这些可能全都要跑到咪膜上面。 那最后我还想说几个需要冷静看待的点。第一,万亿参数。这个数字很震撼,但目前 pro 也没有公开完整的技术报告, flash 版本里有详细的论文,但 pro 没有。所以万亿是怎么组织的?每一步激活有多少参数?训练成本多少,这些关键细节还是开箱。第二,欧米尼和 tts 的 独立验证严重不足, 目前我们看到的主要官方数据和媒体表述,缺少了很多第三方机构的独立评测,多模态能力到底有多强,还需要时间来证明。 第三,一百万上下文不等于一百万都能好用,能塞进去和真正好用是两回事儿。那上下文的解锁精度,信息疑似率,然后推理衰减,还有注意力机制,这些都需要实测来验证。总结一句话,小米 mimo 这次发布, 我觉得是在争夺 ai 时代基础设施的位置, pro 已经占上了牌桌, omni 呢展现了野心, tts 补齐了闭环,但是从发布到被充分验证,中间还有一段路要走。 二零二六年, ai 已经从当年专注训练的百魔大战转向了对 ai 应用的下一步探索。那我觉得现在的胜负手就在于谁能把模型变成产品,然后把产品嵌入生态,再把生态变成用户离不开的体验。 小米的手里现在有手机,有汽车,有全屋智能,现在还有了自己的模型全家桶,如果这副牌打好了,那也许真的能改变游戏规则。

天呐,没想到小米居然在偷偷搞 ai! 当国内大厂都在围绕着 open core 搞事情的时候,有一款神秘的大模型已经在 openroot 上悄悄霸榜了 一段时间。大家一开始都在猜呀,这是不是 deepsea v 四的提前试水呢?结果昨天深夜,小米自己来认领了 来,这就是他们专门面对 age 时代推出的新一代模型,叫做 memo v two pro。 跟他一起发布的还有面向多模态场景的 memo v two omni, 以及超女人语音大模型 memo v two tts。 这也正如雷总今天发微博官宣时说的,小米在 ai 这件事上一直比较低调,但实际的进展可能比很多人想象都快得多,这次确实有点一鸣惊人的意思。而且 mobile v two pro 的 定位也很明确,它不是那种只陪你聊天的模型,而是专门充着 a 准的 执行能力去的。总参数呢,超过一千 b, 激活参数四十二 b, 还支持百万上下窗口明显就是冲着复杂任务练和长工作流来的。那今天呢,参数我就不念了,我直接拿出祖传的测试题来考考这颗 ai 领域的操心心。 我们先来看一下它 a p i 的 界面啊,他说呢,目前是首周呢,就可以免费的试用,而且他自己这里也说了,要推向 a 准的时 在,所以呢,用来养龙虾应该是挺爽的。那是不是一直先进行一些对话的测试?它这个界面叫做小米 miimo 的 studio, 左上角呢,有几个模型选择,有这个最新的 v two pro 和 v two omni, 我 们选这个 v two pro 看一下。首先来一个难倒很多大模型的一个思考题,我想洗车,我家离洗车店五十米,我是开车去还是走路去?他正在思考当中, 我给他深度思考了十七点六秒,给我的回答呢,也是正确的,就是洗车通常都把车开到洗车店,而且还告诉我可以去咨询一下可不可以上门取车。第一条测试题是通过的, 那第二个测试题我就上点难度考,他试图并且呢破解密码的能力,他正在思考,用十九点六秒,哎,但是他没有 给我一个答案,也就是说这一道题它是翻车了,就没有破解这三个数字有可能是用的这个模型,它不是多模态的,我试一下切换一个模 型,比如说我切换这个,再来一遍这个就开始解题了,用时三十一点六秒,最终答案是正确的,所以你要多模态,就是不要选这个, be to omni 就 可以解决了。那接下来我再出第三题给大家,我又用回这个不是多模态的, 试一下。我上传一张车的图片啊,他提取不到,就是说我们这个 pro 的 模型,他识别不了这个图片,他只能识别文字,那就要用多模态这个了,那我用多模态这个上传这个 车的图片,问一下他这个车的基础信息以及售价。好在思考当中,他只用了五点七秒,他说这是红旗的 l 五,然后呢,这个官方指导价五百万人民币, 所以他识别图片查询信息也是没问题的。那接下来呢,我想测试一下他的代码能力,我用这个 pose 一下,我要做贪吃蛇这个网页的游戏,看一下他能不能做啊。哦,他很快就开始做了, ok, 貌似他已经做出来了,我试一下玩。哎,开始可以玩了。哎呀,输掉了,重新开始 挺有趣的,所以前端代码这一趴也是过的。那我再给他一道题,就是我的字幕工作流贴给他,看他怎么反应,但是忘了切换多模态的。但没关系,我试一下,你看他是无法上传 mp 三,所以这个 pro 是 不能多模态的。我们切换到 v two omni 这里,把提示词再贴给他,然后上传音频 发送不了,是太长还是怎么样?不知道为什么,反正我这个音频发送不出去,这里是灰色的,我试一下换一个 也是不行的。 mp 三无法发送给他,那我这个字幕的工作留在这边就搞不定。看一下它这里有个录音,我们试一下。 hello, 你 好, 我正在测试小米的 miimo v two pro, 哎,它果然这边有一个录好的 mp 三,但是也是发送不出去的。那它这个录音用来干嘛呢?搞不懂,不知道我有什么操作错误的。反正就是 mp 三,它能够上传,但是无法发送给它。 ok, 不 管它直播的工作流搞不定。那音频不可以,视频可以吗?我试一下, 超过二十 m 就 没法上传,那这个就没什么用处了,就不用管他了。那最后我们来测试一下 memo call, 立即创建,继续创建,需要 等约两分钟。 ok, 已经创建成功了,右上角有一个倒计时,就是这个测试只有三十分钟。帮我找到今天全球五条热门 ai 新闻,并且用语音的形式播报 给我,看他能不能做到。好,他开始干活了,他已经收集到今天的热门新闻,现在生成语音播报,语音已经保存在工作目录,可以播放收听,但问题是你的工作目录在哪里呢?工作目录在哪里? 问一下他,他这个地址应该在沙河里面的,我要不就直接让他发给我吧,你把通过链接的方式发给我, 他说他没办法给到我这个,那就再试一个方法,把音频上传到任意公开的网盘, 然后给我下载链接,看他能不能办到。 ok, 他 给我这个链接了,看一下是不是真的可以试一下这个 catbox, 然后直接访问, ok, 看能不能下载允许。大家好,以下是二零二六年三月十九日,全球 ai 领域五大热门新, 果然可以第一 open ai 开启战略收缩。 ok, 我 们来总结一下,刚刚我让他生成五条 ai 热门新闻,并且用语音播报形式给我,他说呢,已经做好了,但是我是访问不到他这个工作 目录的,然后我就让他提供一个下载链接给我,他说他没办法办到,我再想一个办法,就是上传到公开网盘,这个方式呢就刚刚好。所以呢,就是只要跟他多对话,其实他也是能够解决问题的,还是蛮不错的我感觉。 那我们最后再看一下它的价格啊,输入从一美元到两美元,输出呢,从三美元到六美元。那如果他跟这个 crook 对 比呢?整体确实是比他便宜很多 的,那经过刚刚的测试,我们可以看到小米这一波,至少呢,不是来凑热闹的,他真正想抢的已经不是谁更会聊天这个赛道了,而是下一个阶段 谁能替人干活。以前我们用 ai 本质上是在问答,你提一个问题,他回你一段话,那现在的所有大模型明显已经在往另一条路上走了。不是回答你,而是开始替你执行了。所以这是小米最值得关注的,不是他加入了大 大模型的队伍,而是他在告诉所有人, ai 的 下半场已经不是聊天了,而是执行。谁能把 ai 从会说做成会做,谁才能真正摸到了 a 准时代的门把手。你已经开始测试了吗?感觉怎么样?我们评论区里聊一下。 ok, 以上就是今天的所有内容,我们下期再见。

好,各位好,我是小刘,今天我们一起来看一下小米最新发布的一款新模型 miimoway two pro 啊,这个名字有点绕口啊,但是因为 opencloud 带来的热度哦,它也是在匿名的榜单里面排名第一名,就是这个模型的表现是最好的, 那它支持一照的上下文,大家可以看到,其实呃它和很多的模型进行对比,它也是排到了比较强烈的一个位置哦,这个橙色的是 miimoway two, 大家看有一个小米的图标对吧?那我们可以看到跟呃 cloud 比起来其实相近哦,就是很多地方打分的话,其实我感觉跑分没有很多实质意义啊,就是很多的跑分是专门 很多模型是专门针对跑分进行训练的,但实际上编程并不怎么行。那我自己呢,也是用了一下这个 miami 二兔去嗯,来完成日常的工作。 我觉得相比于 cloud 的 oppo 的 四点六来说还是有一点差距,但它这个价格确实会便宜一点,大家可以看一下它支持一照上下文,那一照的话就是我觉得 就很不错了,相比于那些像,比如说像 dpigs 对 吧,它就高很多。你看这是一个简单的排行对吧?它排到这个位置,排到这个智普的后面,就是智普五的五点零的后面嘛, 它也是一个万亿参数的高价购,就我觉得什么呢?它有点,就是有点那种扫地僧的感觉,之前一直没有看到他身影忽然冒出来,你看它的这个位置,还是一款很强的模型哦,就简单用下来的话,它也是推出了三个型号,这个 fresh 的 话是比较快的,然后这个 v two 的 话是旗舰版本,然后我们现在点击这个地方有一个呃, try not, 然后点击进来就可以去尝试了。那我自己也尝试一下,我觉得怎么说呢?嗯,用一下还可以,但我感觉它有点慢,相比于这个那些其他的模型来说,这里也是可以支持。还有一个 miimo cloud 也可以直接去使用它, 大家可以看到,对吧?其实整个的开放页我觉得还是不错,那我就不测了,我觉得没什么好测的,因为测的话也是做这些基础的操作,你就做前端开发,对吧?你做一个简单游戏,大家可以看到这是其他人做的,已经有很多的博主做过测试了。那我们简单来看一下这个这款模型吧。大家看到一照上下文开放了这个 api 支持一百万的令牌, 然后这是他的收费,哦,就是,呃,每百万 token 就是 一美元那输出啊,就是啊,就是可以看到这边有一个那个具体的一个价格,然后缓存也是一样的,对吧? 那从和对比的什么对比的?这个拿的是 cloud 四点六和它进行对比,那这样对比的话是不是很划算的?性价比非常高。然后它也是什么?小米的 agi 的 第一个里程碑,就是因为这是小米第一个模型嘛,对吧?它,嗯,确实表现非常出色。第一个模型就这么出色了,是吧? 因为它是属于呃,后起之秀嘛。就我开发出了一个简单物流管理系统,你看大家可以看到对不对? 效果是非常的不错,是不是?你看我跟他说开发一个简单的物流管理系统他就开发出来了,你看这个仪表盘,包括这个,呃,效果,这个展示效果是不是非常 nice, 是 不是?然后呢,我们再看一下其他效果,比如说这物流管理系统,再开发一个学生管理系统的原型图, 那这个圆形图我们也看一下。呃,这个效果我们点开,你看是不是也很不错,是吧?这个 miami 2 pro 我 觉得真的强烈推荐大家去尝试一下,当然相比于 cloud 的 索尼四点六还是有差距,而且我在想啊,这个 啊,当然我只是一个猜测,因为这个 miami 2 之前没有水花,呃,它做出来的效果感觉跟 cloud opus 四点六有点相似,真的 第一次就这么出色,大家觉得怎么样呢?好吧,好,这是我最对这款模型的一个基本的解读。好吧,大家觉得他是否进入了全球顶级的水平呢?大家可以去尝试一下。好了,那本期视频就全部看完了,我是小刘,我们下期再见。

还有人不知道怎么免费使用新发布的咪莫大模型,我们可以看到两个新模型的表现是在第一梯队的, 并且和 oppo 四其实非常接近了,官方发布的时候说可以免费使用首周,但是我看还有很多人不知道怎么去用。那我们可以看到在这五个框架下面是本周是可以免费使用的。但是很多人在 opencloud 里直接加小米的 api, 发现是要扣费的。 我们只需要在 open router 里面注册一个账户,得到我们自己的这个 api k, 然后我们把我们自己的 api k 复制下来, 到自己的终端里配置一下,就可以免费使用了。我们可以直接输入这样一段提示词,帮我配置模型。用 open router 的 demo vr pro 到它模型的链接,还有自己的 api, 让小龙虾可以自己帮你把模型给给配置进来。 配置进来之后,我们在 model 切换里面就可以去选择 ro 的 模型。你好, 你是什么模型?可以看到他已经成功的使用了小米的 vr pro 的 模型了。好,下面我们来跑几个案例,看看它的效果如何。测试的过程中,我发现咪蒙的这个网站的前端做的非常的简练有趣, 所以我准备尝试测试一下用咪蒙可不可以也做一个同样的网站,直接用这个提示词让咪蒙去复制他们的网站,并且宣传自己的大模型。 好了,复刻的网站出来了,我们可以看到他很快可以复制出来一个百分之八九十相似的网站,同样也是有动效的布局,基本上是完整保持了设计理念。我下载了一张速七的照片,给了这样一段提示词,让他用这个照片为素材,制作一个赛车的游戏, 我们看看密密模型能做成什么样,他自己写完并且跳出来的。这个游戏名叫小米速七狂飙,我们只需要左右移动加速就可以玩了。 点开这游戏,它是一个纯三 d 的 游戏,但是它这个游戏其实有 bug, 它一次只能变两个车道,并不能停在中间的车道,有点类似寺庙逃亡,还是非常丝滑的。我们来测试一下它的前端的性能,给这样一组的提示词,让它写一个浏览器的操作系统, 它已经跑完了。打开链接可以看到它的背景是闪烁的星空,这边有一个时间,但稍微有点丑。它有一个菜单,里面有备用的应用, 第一个是记事本,随便打一些字,但是没有保存。下一个是计算器,我们算一下九乘六等于五四,这个倒是对的。还有一个贪吃车游戏,但是这个难度是稍微有点高的,他在打砖快,他移动速度也是比较慢,但整体的配色还有这个 ui, 我 还是觉得挺不错的。下一个是天气哈尔滨, 看一下区域宠物点击宠物互动,但宠物在哪里?它的前端虽然完成的比较好,但可能具体的这些应用还是多多少少都是有些 bug。 总结一下,这个模型总体来说确实技能是在现在的第一梯队, 甚至接近于 ludo pos 的 水平,这点是没得说的。但目前看收费是比较高的。虽然说现在开了一周的免费的体验,但是还是希望小米早点出自己的固定 play, 让大家可以更实惠的把这个模型用起来。

本视频是免费使用 micro 模型的教程,首先打开 openraw 的 官网,点击右上角的个人,点击活动,点击 ipi 密钥,点击创建, 填好之后就可以,注意额度,别填零会报错,零点几就可以。搞好之后点击复制 pi 密钥,然后去使用 on board 或者 config, 设置好 pi 模型名字可以去这里复制。 重启 open q 二之后就 ok 了,注意免费到二十五号哦。

事出反常必有妖,我总觉得今晚的发布会绝对不简单。这讲一下,如果你是雷军,在小米汽车发布会当天,你还会抛出其他震撼行业的重磅炸弹吗?就在今早六点五十三分,雷总亲自官宣了小米自研的 ai 大 模型。这个模型的背景极其强悍,之前化名 hunter alpha 在 顶级 api 平台内测,不仅多日蝉联榜首, 调用量更是冲破了一万亿 tokens, 日内纷纷猜测是 kimi deepsea 或 g l m, 结果底牌亮出,竟然是小米!惊喜远不止于此, 此次联发三款模型,旗舰级 mymo v 二 pro 拥有万亿参数和百万级上下文 agent 能力,稳居国内榜首,智力评分位列全球前十,价格却仅为 cloud 同级的百分之二十。同步推出的还有全模态 v 二 omni, 具备视觉、听觉及操作能力,甚至还有个会饶舌的 tts。 如此王炸的产品,按理说该和汽车发布会错开或同台引爆, 可雷总却反其道而行之,在大清早低调发布。还有一个细节,三月十六日,雷总已经公开了新车的全系配置,加上之前的各种预热汽车的参数,几乎已经明牌了,悬念由此产生。既然干货都提前放完了,那今晚的发布会他准备讲什么?我敢断定,真正的大招一定被留到了今晚。

大反转来了!全网猜了一周的万亿参数神秘模型不是 deepsea v 四,而是小米的 memo vr pro。 小 米罗弗利还自报这是他的作业,并承诺等模型稳定时,模型将开源。事情是这样的,上周,代号为 hunter alpha 的 神秘模型悄悄上线了全球最大 a p i 聚合平台 open roter, 短短七天内累计调用量突破一万亿, toon 连续多日登顶榜单。有不少网友就猜测这是 deepsea v 四的内测版本, 理由也非常简单,其推理模型和之前 deepsea 模型中常见的思维链风格非常相似。而就在刚刚,小米官方正式认领 hunter alpha, 宣布推出三款模型,分别是 mimo、 vr pro、 vr omni 和 vr tts。 其中 vr pro 就是 hunter alpha 的 真身,有一万亿参数,百万超长上下文,也是国内首个万亿参数大模型,在权威榜单 artificial analysis 上,它排名全球第八,国内第二。 随后,小米 mimo 大 模型负责人罗福利也在 x 上发长文表示,这是小米首款真正为智能体时代打造的全站产品系列,并承诺当模型足够稳定的时候,模型将会开源。 小米创始人雷军也在微博发文表示,小米在 ai 领域上相对比较低调,但实际进展可能比大家看到的要快很多。不过更让人惊喜的还是,目前这三个模型的 api 都是免费的 openclo 天选模型。

来了来了,兄弟们,今天上午一直备受人关注的那个亨特阿尔法模型被小米认领了,这个模型其中最猛的万亿参数 miimo v 二 pro 一 百万透坑上下文是国内目前唯一突破百万级的大模型。 这个模型匿名以亨特尔法的名义挂了一周,连续多天日榜第一,全球开发者调用突破一一万亿 token。 大家猜了一圈,什么 kimi、 k 三、 deepsea v 四、 glm 都猜了,最后谁都没想到会是小米。 而且小米这一波最狠的不是跑分,而是 agent 能力,也就是说特别适配 opencl, 很有可能将来这个模型要内置到小米生态的硬件里,小米的手机、汽车、全屋智能家具都将拥有一颗 ai 大 脑,这让友商们以后该怎么玩?继续跳转调用豆包吗?

大模型刺客出现了!全网猜错,强到可怕的匿名玩家居然是小米!上周,全球最大的 ai 平台 openroot 上突然冒出一个代号 alpha 的 匿名模型,它没有任何宣传,且连续多天霸榜第一,掉用量直接突破了一万亿头,肯 强到什么程度呢?在全球大模型智力排行榜上,他直接冲到了世界第八,国内第二。最戏剧性的是,小米一直藏着掖着,让大家先客观评测。最开始因为表现太猛,风格又像,所有人都以为是 deepsea 要出 v 四了,结果今天罗福利亲自出来认领,是小米干的。 这模型到底强在哪呢?它虽然有着万亿参数的知识储备,但每次处理问题只激活最关键的四百二十亿参数,又聪明又高效,还支持一百万字的超长上下文。并 且除了这个推理大脑之外,还推出了能看能听能动手的全模态模型,以及一个会说唱、有情感的语言合成模型。再匹配上小米一直以来的杀手锏性价比,这个顶级模型的 a p i 价格就有国外同类产品的五分之一, 这意味着开发者用更少的钱就能享受到顶尖的 ai 能力。这一下压力给到了国内其他 oemai 的 大厂,花了更多的钱,结果却表现一般。所以你说小米这次可以靠着 miimo 走出低谷吗?

谷友们重磅消息,就在三月十九号凌晨,小米扔出了一个王炸!他们新发布的 ai 旗舰模型 smilson mimo vor pro, 在 artificial analysis 全球排行榜上直接冲到了全球第八,国内第二。你可能要问, 这个榜单含金量有多高?它是全球公认的 ai 评测权威,小米能跟谷歌、 open i 那 些国际巨头排在一起, 说明咱们的国产大模型已经真正站上了世界第一梯队。那这个模型到底牛在哪儿?它背后又藏着哪些投资机会?今天这条视频,我用几分钟时间给你掰扯清楚。很多朋友听到大模型,第一反应可能就是参数多大,跑分多少,但如果你只看这些,可能就错过了真正的重点。这次小米的模型最大的不同是,它是冲着 agent 去的。 什么叫 agent? 就是 智能体,你可以把它理解成一个有脑子、能干活,甚至能自己规划怎么干活的数字员工。为什么说它是王炸?咱们得看它的硬核指标。这个模型总餐数量超过一万亿,但激活餐数量只有四百二十亿。 这个技术很关键,它意味着这个模型既拥有万亿参数级别的聪明大脑,但在实际干活的时候,只用调动四百二十亿的参数,能耗和成本大大降低,它们的 api 定价直接干到了头部同类产品的五分之一。 这就是在告诉市场,我要用极致的性价比,让开发者和企业都用得起我的 ai 能力。更关键的是,它支持一百万 tokens 的 超长上下文,这是什么概念?它能一口气读完像三体三部曲那么厚的内容,并且记住所有细节, 有了这个能力,这个智能体才能帮你处理复杂的、长周期的任务。比如帮你规划一次全家出国旅行,从订机票、酒店到做行程攻略,甚至帮你盯住汇率变化,告诉你什么时候换会最划算。他说的从 coding 到 club 的 泛化就是这个意思,从给程序员写代码,扩展到在现实世界里帮你干活儿。 正因为有这样的技术底子,他才能在 artificial analysis 上拿下全球第八,国内第二。这个排名不只是面子,更是实力的证明。好,说完技术,我们来看最重要的就是投资机会, 一个能改变行业格局的产品发布,必然会催生出一批受益的公司。我们可以沿着算力硬件应用这条线来看,首先最直接的就是算力大模型,无论是训练还是运行,都需要海量的算力支撑。 小米要撑起这么庞大的 agent 调用量,就必须有强大的数据中心和 gpu 集群。这里面有两家公司值得重点关注。一家是大卫科技,它的全资子公司森华一藤,已经被市场公认为是小米 ai 算力的核心供应商,为小米提供 i d c 机房托管和 gpu 算力配套服务, 小米的模型训练就离不开它的支持。另一家是金山云,它是小米和金山生态的云底座,将直接承载小米 miimo 大 模型海量的 api 调用,这是看得见的增量收入。其次是端侧的硬件云,端大脑再聪明,最后要执行任务,还得靠你手里的手机、车机或者家里的智能音箱, 这就对端侧的芯片提出了更高的要求。这里面有两家公司深度绑定小米生态,一个是全智科技,它是小米生态链核心芯片供应商。市场分析显示,它的芯片已经专门针对小米的大模型进行优化,能支持最高七十亿参数级别的模型在本地部署, 意味着以后很多 ai 计算可以在你手机上完成,不用每次都上传云端,既快又保护隐私。另一个是帝奥威,这是一家小米持股的模拟芯片公司, ai 能力越强,设备对电源管理、信号传输的要求就越高。 d r v 就是 提供这些核心模拟芯片的,是 ai 硬件升级浪潮中确定性很强的受益者。最后也是想象空间最大的是生态应用智能体最终要干的事都得落在具体的软件上。这里面有两个战略伙伴,第一个是金山办公,也就是 wps, 这次发布会明确说了,他们的智能体模块已经全面打通了金山 wps 的 生态。你以后写报告、做 ppt 可能都不用自己动手了,跟你的智能体说一声,它就能直接调用 wps, 帮你生成,帮你改。 wps 从一个工具软件,正在变成一个智能服务平台, 这个价值重估的空间非常大。第二个是中科创达,它是做智能操作系统技术的,在小米人车加全生态里,不同设备、不同系统的协调是关键难点,而中科创达就是那个打通底层的技术底座,重要性会越来越高。 总结一下,小米这次发布的不仅是技术,更是一张清晰的 ai 生态蓝图, ai 从动嘴到动手的时代,已经加速向我们走来。

破案了! openroot 掉流量连续多日霸榜,龙虾之父 peter steimberg 也在发帖询问的神秘模型 hunter alpha, 原来是小米的万亿旗舰 memo vr pro。 今天凌晨,小米团队官宣了三款 memo vr 新模型 pro omni 和 tts。 其中 pro 的 官方介绍中明确提到,它就是此前占领 open router 掉用量榜单第一,总使用量迅速突破一 t token's hunter alpha, 那 它究竟强在哪儿?下来看。数据方面, miimoire pro 在 artificial analysis 全球智能指数中排名全球第八,国产第二。 pinchmentch 得分八十四点零, cloud evo 得分六十一点五,整体表现也超越了 gemini。 三、 pro 应用方面, miimoire pro 参数规模过万亿,支持百万级上下文, 更擅长应对真实场景中的任务。单看这些硬核开发工具的调用量,就知道它在生产环境中也不逊色。当然,大哥 pro 强悍,如此,一同亮相的 omni 和 tts 也差不到哪去。全模态模型 miami vr omni 把图像、视频和音频编码器融合进了一个主办网络里,看听读一把抓。 tts 则是一个专门给智能体赋予感情的语音模型,能根据上下文变化语气的同时,还可以自然地加入咳嗽、叹气等细节。 模型公开后,负责人罗富利发了个铁说等模型稳定了会开源,还聊到开发时的一个小插曲,为了让团队使用新模型,我告诉大家,对话少于一百次的成员就可以辞职了,可见这次的小米模型是要动真格了。

我用了一千万拓展去验证最适合 open globe 小 龙虾的模型搭子来了,亨特阿尔法,它目前在 open road 上是一个免费的,是一个另一门公司测试的模型。呃,据传闻它可能是 deep deepsea v 四版本,或者说是智谱,或者说是小米的新一代模型。然后它的特点就是一万亿参数,然后上下文有一百万, 它是相当于,呃可以处理七十五万字的中文或者一百五十万的英文单词,在一个对话框内,那相当于就说它是我们之前推荐的 g 月星辰三点五,就 sleep sleep 三点五 flash 的 四倍,然后专门为了 opencloud 啊小龙虾这种 app 去做了优化,然后它目前也是在 opencloud 上是免费的。然后魔性 id 我 贴在了我们视频的评论区里面, 呃,我让他去呃做了一些安全的测试,就是我们之前上个视频提到的自防护,呃,就相当于模型 agent 的 自防护能力,然后可以看到就是亨特尔法是百分百通过的,然后 sleep 三点五 flash, 然后通过度只有百分之六十五,那相当于就是说这个模型能力上,亨特尔法是远远强于 sleep 三点五 flash 的。 呃, open road 上呢,就是,呃有很多免费的模型,目前是有二十八个,那在第一梯队的呢?相当于就是我们的亨特尔法,它是接近了 g p d 四或是 cloud 的 这种商用模型的能力。呃,后面还有很多其他的特殊的免费模型,比如说多模态啊,视频啊这种,我下一个视频会给大家介绍。 那比如说就是,呃,我们来看就是亨特阿尔法六大模型的横向对比,那从整个的呃就是编程能力来看,肯定是商用的 cologne 最强,然后推理能力和编程能力都是商用的 cologne 最强。然后 agent 的 控制调用呢?嗯,那就是亨特阿尔法这种免费的专门 agent 的 设计,最强,你可以看到远远超过。 嗯,包括那样,就是,呃那个亨特阿尔法的定位,它其实本质上呢,其实是专用呃 a 技能做设计,那它和最强的付费的 a 技能模型呢?那其实是是也各有胜负。对, 那我们看到我这边的 status 状态呢,其实是呃它的上下文,你看我新的窗口采用了百分之四,非常的充裕。 嗯,和那个呃 sleep 三点五 flash 的 对比呢,相当于可以看到 a 技能的能力,然后呃 超文档处理是远远超过的。然后中文能力呢,它其实是属于待验证。因为呃, steve 三点五阶跃星辰呢,他知道是中国公司模型,亨特尔法也知道是中国公司的,所以说中文能力呢,其实属于一个待验证的状态。 然后推理速度呢,因为它有 a t 的 参数,呃,相当于是呃那个参数更大,然后推理说会更慢。呃,但其实是呢,呃,我们其实是等待时间,没有强,很强要求的话,那其实还是这种 a 级的能力上还是远远超过的。 那我们现在可以看到,就是我这边用了那个接近一千万的脱贫去做了验证和测试。对,呃,九九点六百万。 那亨特尔法啊,他现在在那个小龙虾的登陆排行榜上是,呃排名第八。对,然后我之前推荐的 super 三六 flash, 现在是远远排名第一。那,那我觉得后续的话就是亨特尔法,呃,他不管是更,嗯,就是正式发布他名称之后还是怎么样,那我觉得还是一个很大的竞争空间的。对, 然后这是我之前跑了一个测试,用它去跑的一个呃哆啦 a 梦的图像,因为它是纯文本的模型呢,它只能靠文本里面简介和想象,这是用 svg 来绘制的,相比于它的上半部分,其实是已经绘制的非常接近了。 然后整体上的话呢,其实是在呃 log 里面,比如说,呃,或者说我们看到 a p i k 对, 它其实都是免费的,对,都是一直已经切到了那个呃,对,你可以看到我的小龙虾都已经切到了亨特尔反应在用,对。

恭喜小米,前脚刚赢了官司,后脚又登顶了 openroot。 就 在大家还在讨论神秘的 hunt alpha 是 不是 deepsea v 四的时候,小米正式领养并一口气发布了三款最新的大模型。今天我试着放下偏见,单从技术的角度浅聊下这三款模型。 先说咪某 v 二 pro, 在 m o e 的 架构基础上,它的总参数量超过了一万亿,其中激活参数达到四百二十亿,并支持高达一百万 token 的 超长上下门窗口,使它在多步推理、长周期工作流等场景下游刃有余。 此外,混合注意力机制的混合比例从五比一提升到了七比一,实现显著的大规模扩展的同时,依然能保持极高的推移效率。第三点呢,就是引入了轻量级的多投屏预测层,从而实现快速的文本生成。 简单的说,这就是小米为智能体时代打造的全模态基础模型。这个模型反而是我个人最为关注的,也是我认为在架构理念设计上最具未来感的, 因为它不同于传统多模态插件式的组合,它是通过统一的底层架构,实现了对图像、视频、音频和文本的实时同步感知能力,使得模型能够像在真实世界中运行的智能体一样,同时进行看、听和读的操作。 据官方说明,他能深度理解超过十个小时的连续音频,能看懂画面,还能展现出极强的情景感知和预测能力。 这是一个语音合成模型,它允许用户使用自然语言来描述想要的声音,并且自然的融入咳嗽、叹惜、清嗓子、犹豫以及不同程度的笑声和哭腔。值得一提的是,官方说可以自动推断情感,也就是无需任何显示的风格提示词, 就能直接从文本内容中推断出适当的说话风格。经过这一年来的舆论风波,很多人对这家公司有了新的认识。 让我决定做这期视频的原因是,官网上他多次引用了前 openai 首席科学家伊利亚的很多观点,而伊利亚恰好是我认为这个时代最伟大的 ai 领域的科学家引路人,希望他真的能长久务实的进行。

谁能想到,之前霸占 open alpha 全球掉用量榜首的神秘模型 hunter alpha, 不是 gpt, 不是 deepsea, 居然是小米的咪蒙 v 二 pro! 就 在几天前,一个名叫 hunter alpha 的 模型横空出世,万亿参数加百万 tokin 上下文直接霸榜! 连龙虾之父 peter steinfeld 都在社交平台疯狂打听。昨天,小米发布了 miami v 二家族三款最新模型 pro amnes 和 tts, 并提及 pro 就是 此前的 hunter alpha。 这不闷声干大事,直接把国产 ai 的 排面拉满了。这次的 miami 二 pro 直接挺进全球 ai 第一梯队, 总参数高达一万亿,激活参数四十二 b, 是 上一代的三倍。并且直接升级了记忆模式,不管是百万字的文档还是一次啃完整本书,都毫无压力。 混合注意力机制拉满到七比一,简直是又快又能打!搭载与北大强强联手研发的资源管理系统,把 ai 的 算力成本直接砍了七成多, 还直接打通金山软件生态,自主办公全拿捏手机端就能免费体验。这还没完,除了 pro 款之外,安利全模态模型,能看能听能行动, 刷视频看图片都能秒懂你的意思,还能自己在网上比价购物 t t s。 语音模型更绝,能控音色,能加情绪,咳嗽叹气笑声说来就来,比真人说话还自然。乖,先把这杯温水喝了, 今天在外面累坏了吧?这些可不是花架子。在 artface 奥尼尔拉斯排行榜上, memo v 二 pro 位列全球第八,国内第二, 代码能力直逼 clout 三纳特四点六,写游戏代码做网页,一个提示词直接搞定生产力,不仅靠谱甚至离谱,目前限时免费开放一周,赶紧去体验一下这款普通人也能玩转的顶配 ai 吧! 谁能想到,之前霸占 open world 全球掉用量榜首的神秘模型 hunter alpha, 不是 g p t, 不是 deepsea, 居然是小米的咪蒙 v 二 pro! 就 在几天前,一个名叫 hunter alpha 的 模型横空 出世,万亿参数加百万托克尼上下文直接霸榜!连龙虾支付 peter stanford 都在社交平台疯狂打听。昨天小米发布了咪蒙 v 二家族三款最新模型 奥秘和 tds, 并提及 pro 就是 此前的 hunter alpha。 这波闷声干大事,直接把国产 ai 的 排面拉满了。这次的密谋 b 二 pro 直接杀进全球 ai 第一梯队,总参数高达一万亿,激活参数四十二 b, 是 上一代的三倍。并且直接升级了记 忆模式,不管是百万次的文档还是一次啃完整本书,都毫无压力。混合注意力机制拉满到七比一,简直是又快又能打!它在与北大堂堂联手研发的资源, 把 ai 的 算力成本直接考了七成多,还直接打通冰山软件生态,自主办公全拿捏手机端就能免费体验。这还没完,除了 pro 款之外,安利全模态模型,能看能听能行动, 刷视频看图片都能秒懂你的意思,还能自己在网上比价购物。 tts 语音模型更绝,能控音色,能加情绪,咳嗽叹气笑声说来就来,比真人说话还自然。乖, 先把这杯温水喝了,今天在外面累坏了吧?这些可不是花架子。在 arctopus 排行榜上, meowv 二 pro 位列全球第八,国内第二,代码能力直逼 clark 三 max 四点六写游戏代码做网页,一个提示词直接 搞定生产力,不仅靠谱甚至离谱!目前限时免费开放一周,赶紧去体验一下这款普通人也能玩转的顶配 ai 吧!