你们给我翻译翻译,什么叫核心科技啊?小米今天早上毫无征兆突然神经病一样的公布两款大模型啊, mymo v 二 pro, 就是 之前匿名的那个 hunter alpha, 总参数量突破一 t, 也就是一万亿,在那个大模型综合排行榜上直接冲到全球第八,国内第二, 全面超越 jimmy 三 pro, 毕竟 cloud 的 office 四点六还有一个呢,是多模态的啊,从文本视觉到语音全链路字眼,啥都干啊。没错,这俩模型就是之前在开源模型平台上拿下趋势榜第一,周榜第三,掉用量直接突破 et token 的 两个匿名模型。我真的, 我看到脑壳都要炸裂,就是完全不理解小米为什么突然要在今天早上,在没有人看的时候没有流量的时候啊,突然把这个消息发出来, 这你搞定了一个一万亿参数的大模型啊,这不比今天晚上发的速器还重要吗?啊,新款的速器,它是一个已经被证明过路径的成功案例,就你只要照这个样子去卖车,它就不会出事了。但是大模型对于小米来说,那是一个全新的时代,我说夸张一点,十款速器加起来都没有这一个大模型的意义重要。 那你自己去看榜单吗?绝对实力排名第八,甚至超过了马斯克的 guke。 如果只按大模型公司来算,那小米已经是全球第五了。 关键小米他不是一个纯种的互联网公司,他是一个苦哈哈,干制造业的硬件公司,他把这个模型干出来,你知道在全球要打多少人的耳光吗?啊,这么多年以来,从来都是互联网公司吃肉,小米这样的硬件公司喝汤,结果几十年下来,哦,你们吃肉吃的恼满肠肥,被人家一个喝汤的一拳打的眼冒金星,满地找牙啊。 对于小米这样一个业务空前多元化,同时赞助了手机、家电、互联网汽车的超级制造业巨头,他把这个机座模型掏出来是能快速落地的,到时候还有谁能阻止他啊? 你要知道前两天那个小米自己的龙虾米克洛出来的时候,我估计不少干家电和互联网的都已经吓得心脏病突发了吧。雷军都已经把贾维斯快干出来了。早上能让这个床垫摇来摇去喊用户起床,你还在那边纠结啊,要不要给我们这个东西加一个蓝牙开关? 他用机关枪打你们这群石器时代原始人。但凡脑门上多一颗汗珠,都是对自己实力的不尊重。这么牛的模型,今天晚上发布会应该是他唱主角,然后让速器来当配角啊。因为他强盗让喷子根本无从下嘴了。三百六十度无死角啊,苍蝇找不到落脚的地方, 过去天天碰什么啊?小米是买办,没有核心技术,天天就知道抄,那行啊, et 的 大模型别人怎么就不抄呢啊?中国能搞这么先进的大模型的公司,怎么就不超过一个巴掌呢?为什么这一个巴掌里面它就有小米呢? 别人家不做是因为不喜欢吗?那我都能想到接下来还会有人说什么啊。小米只会跑分, ok? 这个榜单连 oppo, ai、 谷歌都在用,非常的公开透明,测试用力也很严格,你要不服你就跑一个,那即使我们把它扔掉,你去看小米之前匿名发布的调用量就明白了,趋势榜排名第一啊,开发者都在抢着用, 不好能抢着用吗?谁愿意搞一个烂模型?当然了,肯定会有一堆大模型专家一夜之间冒出来啊,各种阴谋论说小米蒸馏了别人,或者干脆说小米套壳, ok, 我 提前回答你们一提,也就是一万亿的这个参数量,大模型就这么多,而且这个事情好就好在小米是提前匿名发布了啊,预判了你们的预判, 所以为了猜他是谁家的产品,那些开发者早就把它拆给稀烂,最后汇总的结果是他是个掏壳的,讨论的方向早就乱到没边了好吧。哎, 说实话,爽啊,太爽了,就是小米绝对的核心科技领先的让人害怕,就喷子们面对这玩意,就好像那个蚊子站在玻璃上啊,无从下嘴。 一个毛利远远不如互联网公司,硬件公司,一个天天被扣帽子是买办的公司研发出了世界范围内一流的基座大模型,一万亿的体量啊,多少互联网公司各种烧钱买卡,想尽办法撬墙角搞来各种天才,结果连个五千亿参数的模型都训不出来,经常训到崩溃, 连上牌桌的资格都没了啊,纯纯的就是菜菜的抠脚。你说雷军的利润能有你们高吗?抢计算卡的时候他能抢得过你们啊?而且现在各种原材料涨价,小米全新业务都在面临压力, 结果人家变大招,硬是掏出了一万亿参数的大模型,测试下来还是真正的第一梯队,因为小米真的是在核心技术上吃亏吃太多了,所以雷总才会发狠,不惜代价都要把芯片、 ai 大 模型这些东西给干出来。 黑子还有话说吗啊?讲话现在来看,手机上最强的对手苹果 ai 是 全打包给谷歌了。汽车上最强的对手特斯拉啊,马斯克旗下的购客排名在那摆着呢,这一次也被 miami v 二 pro 给超过去了。 雷总收手吧,我真的怕你干完汽车这一波就去造火箭打卫星了,到时候把这小喷子一个个揪出来,全给打到火星上面去。
粉丝11.0万获赞5.1万

国内的模型基本没怎么用,结果想买的时候试一试,发现买不了了,包括阿里云、百联和智普 ai, 智普的 g m m 也用不了了,每天都需要去抢。刚才我去十联讲了一下,发现它的网页是在转呢,跟抢票一样。 所以大家啊,早买早用,现在这个 kimi 还是可以用的。这个 kimi 还能用,赶快去买一下。我建议买个四十九到或者九十九的都可以,我买个九十九的 kimi 还是可以用上,感觉跟克拉扣的是有些差距,但是便宜,大家可以试一试,尽早用 其他的模型,比如说迷你 max 或者是 dipsic, 这些还是一般,有的说迷你麦草, 目前迷你 max 是 它的,这个定制 plan 是 可以用的。我买了一个 plus, 先试一试。刚才试了一下啊,还行,但是你要让玩龙虾比较贵,我不太建议用龙虾,用迷你 max 有 点贵了,我可以用本地去部署, 或者你就用一下提米豆的就可以了。还有庆大家一些,这些 ai 的 层出不穷,一个月一个版本,所以我建议大家就买一个月就试一试就得了,不要开这种连续包年的。这种的你看比如说前两天刚 充值 cds 二点零的,现在又出了新模型,所以一个月左右基本上就过时了,所以大家还是自己看一下,如果有钱无所谓,可以试试用这种单月的。

小米呢在今年发布了一款新的模型,叫 miami v 二 pro, 据说是非常厉害,不管是在编程工作有非常出色的表现,那么就来测试一下编程方面到底是怎么样的。那在测试之前,我们先来了解一下这款模型的一些参数啊。 那首先第一个是就是是它的这个总参数量是一个 t, 那 激活是四十二 b, 还有一个非常重要的是它是支持一百万 tokyo 就 一兆的上下文,这是已经是顶级的水平了,目前基本上主流的模型都是这个上下文长度, 那这边的话,它之前是在 oppo reno 里面是以这个匿名的这个模型去发布的,然后也是得到了非常大的关注啊,那表现也是非常不错的。那我们具体来看一下它跟其他的几款模型,比如说 oppo 的 四点六,散热器四点六,还有 jimmy 三 pro, 杰比利五点二,说实话它对比的 这两款模型是版本已经落后了,我们知道这个加密的三点一已经出来了,那 jpg 已经发布到了五点四的版本,我们看下具体的分数吧。然后这个是复杂多步骤任务的,这个是适用于工作场景的,那这边的话它是比这个五点二还要强,然后的话是弱于这个 solo 的 系列和 opus 系列, 那我们接着看这个编程与代码能力这个维度,那么在 s w e 这个测试当中,它的这个分数的话是接近这 collect 四点六的,然后是差不多相差一点六,那比 jammer 三 pro 高一些,那么在这个终端直线命令拼脚本和系统能力的上, 那么是超过这个 jammer 三 pro 以及 jpg 五点二跟这个 collect 四点六是只相差两分, 那其他就是一些搜索能力了。然后这边的话它就说它是一个顶级的编程能力的模型啊,内部评价是跟 opus 模型是非常接近的,那我们就来测试一下在编程这块它到底是怎么样的,然后 看整个参数是非常不错。那么我们这里的测试的话也是分为了前后端测试啊,那我使用的测试的客户端是 crayon, 然后使用的是这个 openrotor 里面的 memo 模型,目前是免费的。 然后呢分别会进行一个前端测试和这个 app 测试,以及我们的这个后端的 java 测试。 那第一个测试就是非常经典的这个三人斗地主游戏了,那这个目的是为了测试它的逻辑和它 ui 生成能力啊。然后的话看一下 他的这个玩法能不能玩起来,比如说什么发牌啊,叫地主啊,斗地主之类的这些规则能不能有一个简单规则,就我们不期望就说一次对话就能完整的实现一个斗地主的游戏,我们就看一下他的下线到底在哪里,那这边是他做出来的效果啊,说实话是我觉得是非常不错的,比如说现在玩一把 我们可以去选这个, 就是这个规则基本上都可以,然后的话不出, 然后这个机器人出牌也是对的,虽然说他可能就是合作之间还会相互去竞争啊,这个不太符合这个基本的常理。那我们就这样三带一个啊,没有人要,那我们就看再看三带一,对 没有人要,好,我们先出这个, 哎,所以这一盘是很顺利的完成。那目前这个斗地主的测试啊,使我测试所有的模型,包括 oppo 的 四点六, 这个是最完整的,而是一次通过。这个是让我非常非常惊讶,非常非常惊讶,非常非常意外啊。接下来就测试的就是一个 app 的 全站测试,那这个我们要求它用 flat 来完成一个包含 app 和包含后端,然后使用 python 和 my circle, 然后有这是一个外卖点单的一个功能啊,可以登录,可以看到菜单,可以看到购物车,可以加减,可以看到图片啊,商品啊,这是一个比较小小型的 mvp 的 一个产品呢,我们来看一下它实现的效果,那这个是它启动的效果啊,但是呢我在这里要特别强调一下,在我在整个开发过程中呢, 它前面开发非常顺利啊,但是在启动我们的这个 python 服务和这个客户端的时候,出现了非常多的问题,特别是这个 python 服务, 然后你把错误信息发给他之后,他一直解决不了,我已经进行了多轮对话都解决不了。那最后呢,我是通过这个 class 让他去修复这个问题,然后他这边一轮对话就把这个问题修复了。那这个其实也说明一个什么问题呢?就是 mimo 这个模型可能在解决问题,或者说你的上下文非常长之后,它有可能会产生幻觉,然后是一直会兜兜转转的。那么我在完成这个 app 里面也包含了前段后段,那产生代码量是非常大的,所以呢这个在这方面能力是非常有欠缺。那我们用 flex 修复完之后, 我们再看进去,看一下能不能进去。 ok, 这边是它的页面,然后的话也是中规中矩吧,页面上是我觉得还行,那我们加购物车看一下, 失败,就有些功能还没有完成。 ok, 那 我们接着往下测,那接下来测试的是一个 java 的 一个优选与结算的一个系统啊, 那这个的测试的目的呢?就是有多种规则情况下,他怎么去实现这样功能?那促销里面有经常有这这种优惠叠加,还优惠互斥啊,多种优惠券混在一起呢,怎么去算这个价格? 那还掺杂着什么运运费啊,或者这些东西。所以呢,这个模块是有点复杂,我们来看一下密密最终的实现效果,就是他做完之后啊,他自己进行了一个单元测试,因为我们在生成这个 pran 的 时候,他会生成这样的一个比较小的一个测试单元,测试用力,他这边跑完是已经全部通过了, 但是我在看具体代码的时候,其实他考虑的场景是有一些肉的,这个跟之前我在测试 mini max m 二点五的时候非常像,就说他考虑的场景没有 colis 考虑的那么全,所以这一块是有一些不足的,但是 已经做的非常不错了,这个在我之前所有的模型里面应该能排到前三吧,这个基本上考虑到了,只是一些比较细的,比如说优惠券的这个类别判断啊,这一系列可能去需要一个非常详细的提示词才能去完成这样的功能,那整体表现上我觉得是非常不错, 所以总的看下来就是跟其他的啊, oppo 四点六啊,或者说杰布迪五点三这一个对比的话,在纯前端逻辑上,就斗地主这个游戏反馈上,我觉得是非常非常表现不错,但是在全站上因为可能代码量多啊,导致这个他这个产生一个幻觉,修复问题非常非常的 啊,兜兜转转的。那修复问题呢?经常兜兜转转的,最终都没有起来啊,是靠住第三方工具才去给他修复好,那否则加了后端上,我觉得表现的也还行。所以呢,总对这个模型进行一个总结,就优点就是一照到上下文非常爽, 然后在 ui 上表现是非常出色,特别是这个斗地主这款游戏啊,是完成所有模型里面完成最好的,非常出人意料。 第三个呢,在 java 的 这个后端的这个促销逻辑上也是非常不错的,虽然说场景不全,但测单人测试基本上通过了。 那缺点就是我刚刚一直在讲的修复 bug 的 能力很欠缺,容易得得卵卵,除非人为干预,而且我已经人为干预了两三次了,还是没有解决, 然后偶尔出现就是代码啪啪啪写完了,但是呢,翻译的时候不通过,然后他要去修复问题,那像 cloud 或者 jpt 模型,基本上生成完代码之后,翻译是一次通过了,那所以在这个环节上就有些差距的。 那总的来说,我觉得 mimo 是 一个非常不错的模型,远超我的预期。其实我来做评测的时候,我是觉得可能啊,这个模型因为只发布了两个版本,还没有那么强,但是 结果其实是超过我的预期的,那比一点零一点零版本是有非常大的进步,那编码能力我觉得是肯定是不如这个散热的四点五万,虽然说官方在跟散热的四点六对比,但是我觉得还没有到散热的四点五的这个水平,而且是比 智普五点零和这个 mini max m 二点七,我觉得还是呃差一些。那目前的话就测试的场景就这些,就是我个人的测试场景,并不代表一个权威的一个结果啊,只是我自己的一些看法。

拿走监控下的魔方,会发生什么事呢?哎呀,我的魔方不见了! 因为不会安装小米视觉大模型米 logo 而无法体验未来智能家居系统的伙计们,我扒了 github 小 米官方指南,删掉了一半开发者的内容,反复测试了多遍,终于总结出米 logo 小 白三步安装法,具体步骤如下,记得一键三点点赞收藏加关注。 打开控制面板,点击程序,点击起用或者关闭 windows 功能,把这个 hyper 杠杯前面的勾打上,点击确定。完成安装后会重新启动电脑。接下来我们安装 windows 的 linux 子系统 wsl 安装包我已经分享到了粉丝群。 接着打开 windows 自带的应用商店,搜索乌邦图,二十四点零四点击安装。安装结束后直接打开,等待系统启动。 首次登录需要设置用户名和密码,在这里输入用户名,接着输入两次密码,密码输入时是不可见的,输入完成后直接回车即可出现这个界面就是已经安装好了。然后在开始菜单中找到 ws city, 并打开点击网络,把网络模式改成镜像。在开始菜单中使用管理员身份运行终端,依次输入这两段命令,配置 type 杠 v 的 防火墙出现这个画面就配置完成了。关闭所有窗口, 重新在开始菜单,打开入帮图,输入命令,安装 dos 出现这行文字,就重复执行上面的命令, 直到提示输入密码,这里输入之前设置好的误帮图密码,回车完成安装。接着输入命令,将当前用户加入 dk 组,输入命令,重启 dk, 再输入命令,查询 dk 版本号,返回版本号,说明 dk 已经安装好了。 最后输入这行命令,编辑雕刻的镜像原,在笔记中复制这段代码。在乌邦图界面,按键盘的 ins 键进入编辑状态,粘贴大码,按 esc 键,接着输入冒号 wq 保存退出, 执行安装米洛口的命令。进入菜单,显卡是英伟达三零七八 g, 内存以上的在这里输一,其他的输二。开始安装,安装位置默认回车即可,端口号小白默认大声随意出现这样的选项就选小米 fds, 在 这里输入优方复合密码,在这里同样选小米 fds。 到这个界面, milo 就 安装结束了。回车进入菜单,选择三,启动 milo, 打开浏览器,输入主页地址,设置 milo 的 登录密码,输入密码绑定小米账号, 点击跳转进入主页,点击模型管理规划大模型需要一个云端的,我们打开阿里云百店,进入体验中心,首次进入会送一百万个 token。 点击密影管理,创建密影, 选择用户,点击确定即可复制 a p r k, 返回拎拎口,点击添加模型,粘贴 k, 这里输入链接,然后选择模型名称,有本地模型的可以选 stick 三点二, 没有本地模型的可以选择千问三 vr plus 高级配置中没有本地模型的两个都用云端,有本地模型的规划,模型选云端,视觉模型选米洛口七 b, 现在就可以进入 ar 中心进行测试。到此整个教程都已经结束了,记得点赞收藏关注主播,后续还有更精彩的内容分享给大家!

冲上榜一的神秘模型居然不是 deepsea 微四,而是小米的咪某大模型,这你敢信吗?哈喽大家好,这是东强极速版,一个只讲前沿科技账号,真是没有想到啊,一夜之间,小米真的出息了!就在最近,小米一口气发布了三款自研的咪某 v 二大模型,凭借着小米一贯的性价比路线,所带来的强悍性能和亮眼跑分, 直接就在 ai 圈子里面刷屏了。这期视频用两分钟带你快速了解小米的咪某 v 二模型。小米这次发布的三个大模型分别是旗舰通用大模型咪某 v 二 pro, 它是专门为高强度智能体场景打造的模型, 拥有一万亿参数、四百二十亿活跃参数和一百万 token 的 超长上下文,擅长自主编排复杂的工作流、长城规划以及精准的工具调用,相当于是 ai 代理的大脑。第二个是 mimo vr 模型,它是一个全模态技术模型,能够处理文本、视觉、语音等多模态信息。 它能跨模态理解复杂环境,自主制定执行计划并实时纠正难度。第三个 mimo vr tds 模型呢,是一个超大规模的语音合成模型, 可以为 ai 智能体提供非常逼真的人声输出,支持多种方言和角色的语调转换,甚至可以在一句话中情绪转折,开口唱歌,真正能够实现能说能演还能唱。据说啊,已经在小米汽车上使用了。 在性能跑分方面呢,小米的 mimo 系列模型给了大家惊喜,各种榜单的数据显示已经开始逼近顶级模型水平了。比如 cloud evo 的 智能体测评榜单 mimo vr pro, 也就是之前代号 hunter alpha 的 神秘模型,综合成绩位列全球第三,仅次于两个 cloud 的 四点六模型。 在 rtf 上影响力上全球排名第八,国内排名第二,在 opencloud agent 精准测试中也能够排到第三名。而真正让小米的 mimo v 二出圈的是性价比。 mimo v 二 pro 和 osropes cloud 四点六系列模型的 a p r 价格对比的话,你就会发现 mimo 的 调用价格是对手的五分之一,可以说是非常便宜了。如 如此悬殊的价差,大大降低了前沿 ai 能力的使用门槛。而小米大模型的负责人罗浮丽是这么说的,时代突然变了,过去三年里面,我们以为 ai 是 聊天工具,但突然之间世界切换到了另外一个模式, agent 智能代理,也就是 ai 从会说话变成了能干活。所以这次小米大模型的切换也非常及时,也算是跟上了潮流 啊。真的,今年的国内大模型真的是傻疯了,从互联网巨头到创业公司都在扎堆推出大模型,老牌的百度文心、阿里千问、新锐的智普 g i m, 现在小米又悄悄杀了出来,中国的 ai 研发实力已经逼近全球一线了。那么问题来了,在用 ai 的 时候,你会优先考虑中国模型呢还是国外模型呢?欢迎在评论区里面一起交流,我们下个视频再见!拜拜!

小米今天把 miui p i 做全球首周限免,你可以先零成本上手试一圈。同时它在第三方平台 artificial analysis 上排到了全球第八,国内第二。说明它不是来凑热闹的, 这对普通人有什么影响的?一句话,多一个稳定的可选项 ai, 它并不是越强越好,而是随时能用。稳定好接入,多一家大厂把模型做出来,就等于我们多了一个备胎。而且它价格我看了一下, miui 二 pro 的 头壳定价差不多是其他海外模型的百分之二十,这 意味着 cloud code 又有了一个低成本的牛马。如果你也在用 cloud code, 或者平时 a p i 花费有点肉疼,建议这周趁下面去试一下,具体的使用感受也欢迎来交流。

晚上好,以下是过去二十四小时全球科技动态。一、小米手机版龙虾 simu mcl 封测扩容,新增小米十五及 m i x flip 二等机型报道媒体 it 之家凤凰网科技玩转小米澎湃 aos, 小 米官方于三月二十二日宣布,其基于 miimo 大 模型构建的 lay open club agent 应用小米 mcl 开启新一轮封测。 本次风测新增了 xiaomi 十五 ultra、 xiaomi 十五 pro、 xiaomi mix flip 二四款热门机型。作为国内首个手机端 agent 应用, macbook 只在探索复杂的 ai 交互任务。官方提醒,由于仍处于稳定性优化阶段,目前仅面向即刻用户和发烧友小规模开放,建议普通用户暂不用于日常处理 机。二、国产大模型 mini max m 二点五连续五周夺得全球掉用量冠军报道媒体二十一世纪经济报道新浪财经三十六课全球 ai 模型 a p i 聚合品牌 oppo rder 数据显示, 截至三月中旬,国产大模型 mini max m 二点五已连续五周位居全球大模型周调用量榜首。店内人士分析,国产模型在同等能力水平下,推理成本仅为海外模型的十分之一。这种极致性价比源于底层架构的创新以及国 内的能源成本优势。这标志着国产大模型成功从追赶者转变为全球应用市场的实干派,中国 ai 正在以极具竞争力的算力成本优势重塑全球生态。以上为今日新闻内容,带你追踪实时要闻!

哎,今晚又是大半夜给你们录视频,那就在刚刚十九号凌晨,小米官方终于发文承认了前几天在大模型领域引起巨大讨论的两个匿名模型 heller alpha 和 hunter alpha, 都属于小米的字眼大模型 miimo v 二, 那这两个模型有多厉害呢?那 hunter alpha 上线第三天,就在 open claw, 也就是小龙虾的全球模型调研中直接登顶, 紫色的就是 hunter alpha 模型的调用,而红色的则是 hero alpha。 要知道养龙虾可不是靠嘴巴喊领先,喊吊打或者去喊爱国,在网上找几个六八零大脑智慧老灯去造谣就会产生改变的东西, 它呢,是全世界的用户在不同大模型之中亲自去使用,对比最后选择的能力强大而且好用的大模型。要知道在几天前,大家看着这两个如此强大的模型,还在猜测是不是 deepsea 的 v 四大模型匿名发布了, 那目前看来,大模型赛道如此的安静,主要原因就这个赛道的竞争是讲科学的,是讲事实的,你很难通过造谣抹黑去产生效果。 那 hunter alpha, 也就是 miimo v 二 pro, 它是一个旗舰的基座模型,核心的技术突破在于万亿参数规模的混合注意力架构的高效落地, 它的总参数量突破了一个 t, 也就是 one trillion, 激活参数四十二 b, 也就是四百二十一,通过优化的 hybrid attention, 也就是混合注意力机制将混合比例提升至七比一,这参数量相对于它的前代,也就是米某 vr flash 扩大了三倍的同时,维持了高效的推理能力, 并且它支持百万级别的超长上下文窗口,这使得它在复杂的长线层任务规划和多工具场景中具有先天的优势。那么它在小龙虾的框架测评中, vr pro 在 pinchbench, cloud, evaluation 等等榜单上都处在全球顶尖的水平。 实际它的体感已经超越了 cloud 的 索尼四点六,它逼近了 opus 四点六,但是它的 api 定价只有后者的五分之一, 它极大程度降低了 agent 的 应用的落地成本。那从匿名测试的数据来看,它的早期版本 hunter 阿尔法在 open root 的 平台上线后直接就登顶了日榜,它的调用量突破了一 t tokens, 直接验证了它在真实场景下的可用性。并且它还同步上线了 wps、 灵犀、 michael、 小 虾米和小米浏览器,用户可以直接使用小米的字眼大模型来替代外国模型,完成几乎所有的日常工作。 而小米的另一个命名模型则是 hunter r 法,也就是 miimo vr omni。 它的重点是一个全模态模型,也就是我们现在理解的很多国内顶级公司正在做的全能大模型。 而小米这个模型的特点就是在感知行动闭环上作出了突破,它打破了传统多模态模型重理解、轻执行的局限性。在感知端,它的音频理解能力超越了 german 三 pro, 支持十个小时以上的连续长音频深度分析,那你们开会的时候的一些音频就很好搞定了。 图像理解能力则 b german 三 pro 在 复杂图标分析和多学科视觉推理上,它的表现非常突出。 视频理解则实现了原声音频联合输入的情景感知和未来推理。那么在执行端,这个模型在 opencloud 的 框架下,可以完成浏览器的全流程操控,从商品选购、砍价、下单到短视频的制作发布,它实现了完整的端到端的任务交付。 并且它已经和金山办公生态进行了深度的集成测试,能够直接生成高质量的 word、 结构化的 excel 拍板、规范的 pdf 与完整的 ppt。 那为什么我又在熬夜做这个视频呢?答案很简单,小米这两个模型的出现,已经充分证明了小米这家公司在核心技术领域的研发成果已经开始了快速的落地,同时他也等同于揭开了大量国内公司拿开源模型包装一下骗钱的骗局。 那过去一个星期,因为小米这两个模型都是匿名的,没有人知道他其实是小米的,所以在网上你甚至看不见黑稿。 那现在的黑稿主要集中在攻击小米超强刚获得的奖项,他不是国家科学进步奖这种顶级奖项, 他去讽刺攻击这个我国工信部管理的社团是小的、假的不权威的东西。但是你仔细看就会注意到,他们没有一个人敢说这个材料的强度是假的, 也没有一个人敢提这个钢材强度相对比他们吹捧的品牌哪个更高,因为他们很清楚,从产品那省下的钱才是他们的工资和军费,那千万不可以进行比较,这反而会让他们的粉丝醒悟过来,原来有的人他不在乎他们的生命安全。 现在小米公开认领了这两个匿名的模型,那我相信大模型的黑港没多久就要上线了,我把预言放在这,我们拭目以待。

有点意思啊,小米还真钓到鱼了。就在十六号,某财经居然发文夸过小米,哦不对,准确来说是夸过亨特阿尔法。果然小米这招瞒天过海就是六,真钓到鱼了,还是条大鱼。 我看了这篇文章,写的还不错,挺客观的。所以这不是能写出对国产品牌正面评价的文章吗?现在爆出亨特阿尔法就是小米的大模型,不知道接下来他会不会写一篇文章来夸夸小米。

破案了! openroot 掉流量连续多日霸榜,龙虾之父 peter steimberg 也在发帖询问的神秘模型 hunter alpha, 原来是小米的万亿旗舰 memo vr pro。 今天凌晨,小米团队官宣了三款 memo vr 新模型 pro omni 和 tts。 其中 pro 的 官方介绍中明确提到,它就是此前占领 open router 掉用量榜单第一,总使用量迅速突破一 t token's hunter alpha, 那 它究竟强在哪儿?下来看。数据方面, miimoire pro 在 artificial analysis 全球智能指数中排名全球第八,国产第二。 pinchmentch 得分八十四点零, cloud evo 得分六十一点五,整体表现也超越了 gemini。 三、 pro 应用方面, miimoire pro 参数规模过万亿,支持百万级上下文, 更擅长应对真实场景中的任务。单看这些硬核开发工具的调用量,就知道它在生产环境中也不逊色。当然,大哥 pro 强悍,如此,一同亮相的 omni 和 tts 也差不到哪去。全模态模型 miami vr omni 把图像、视频和音频编码器融合进了一个主办网络里,看听读一把抓。 tts 则是一个专门给智能体赋予感情的语音模型,能根据上下文变化语气的同时,还可以自然地加入咳嗽、叹气等细节。 模型公开后,负责人罗富利发了个铁说等模型稳定了会开源,还聊到开发时的一个小插曲,为了让团队使用新模型,我告诉大家,对话少于一百次的成员就可以辞职了,可见这次的小米模型是要动真格了。

小米推出了新一代大模型 miimo v 二 pro, 那 么根据 artificial analysis 的 指数排名呢,它已经来到了全球第八的位置,那其他数据也表明它已经接近了智普的 l g m 五还有这个 j 月星辰的 step 三点五了。智普和 minis 光靠大模型就已经来到了三千亿的市值,而小米的市值是八千到九千亿, 那么如果能重新估值的话,当然对小米是有非常好的这个利益的。而且高盛也指出, mimo v 二 pro 的 核心竞争力那是在成本控制,而且这个成本是比智普的 l g m 五还要便宜百分之三十六,那么比美国那些厂商 clock 便宜百分之九十左右。 小米发展 ai 大 模型是非常有好处的,因为不管在汽车可以用到它手下的机器人,也可以做出视觉的这些大模型啊,还有它的手机去运用,还有智能家电的互联,那么都可以证明它在大模型上 是有御用武之地的。小米的大模型非常厉害,我当时我觉得也不能凭空给他增加三千亿市值,毕竟智普和 mini max 可能是高估了,对不对啊?但是对于小米来说还是非常好的啊。

前几天 openroot 日榜第一的神秘模型原来是小米的。小米今天正式发布了三款顶级模型,其中最炸的是 memo vr pro, 这个模型一周前以 hunter alpha 的 代号匿名上线, openroot 上线就杀疯了,多天登顶日榜,掉用量突破一 t, tokens 参数规模直接突破一万亿,支持 em 超长上下文,在全球权威排行榜二 gps 上排第八,国内第二。更关键的是,它专为 agent 场景打造,在 opencloud 的 标准评测中表现顶尖,能力直接对标 cloudsonnet 四六和 gpt 五二,另外两款也很强。 memo vr omni 是 多膜态感知模型,负责帮 agent 理解环境。 mimo v r t t s 是 语音模型,让 agent 能跟人自然对话。三个模型组合起来就是一个完整的智能体解决方案,价格也不贵,两百五十六 k 上下文内输入一美元,输出三美元。小米这波 ai 布局你怎么看?

hello, 兄弟们,有没有觉得我瘦一点?最近在努力减肥啊,另外,很多朋友问我,为什么最近直播少啊,而且下播那么早,一个很重要的原因,保住账号。大家知道我这个账号的这个坎坷经历啊,我就不多说啊。 呃,平台比较严,后面有很多重要的活动要参加,比如 semicon china, 有 一些新片的发布会会去现场参加啊,保住账号要紧好不好?兄弟们 啊,希望大家体谅理解,关注啊,后续还有很多精彩内容啊,讲讲最近啊内发生的事情,还有我自己个人的理解或者解读啊,很多呃,有些品牌的粉丝们,呃,也在也在催我要做一些解读 啊。第一个,小米发布了三款模型,呃, mini v 二 pro、 mini v 二的 omni, mini v 的 tts。 我 在看着,我在微博上也发了相关的文章, 我们先不说那些他跑分呢,刷榜的一些成绩,当然有一个我觉得很重要啊,他的那个啊,编码能力啊,确实啊,有用,我有身边有用的人 啊,再用它这个编版能力啊,官方说接近了这个 club 的 oppo 是 四点五还是四点六啊?呃,差不多还可以,确实还挺好用的啊。啊,我们不说那些榜啊,那些榜无所谓,以前高居榜首,那些模型后面最后也是引人众人啊,多的是啊,这个不重要啊,不重要, 我的解读的一个方向是什么呢?第一个,小米这三款模型,其实大家仔细看一下啊,仔细看一下,它实际上是围绕着感知、决策、执行三个角度来发布了三个模型。感知是什么呢?一个是迷你 v 二的欧米,还有一个是, 呃, mini v 二的 t t s 啊, t t s 呢?是做语音识别的那个 v 二呢啊?那个 v 二米啊, v 二的那个欧米尼呢?是做那个呃,全模态感知处理啊,摄像头,麦克风硬件的一些输入啊,让设备看得见,听得懂。然后呢,这个 v 二 pro 呢, 他是一个叫什么类似于大脑的一个中央的模型啊,他有一万亿参数啊,四百二十亿参数的这个激活啊,为了做决策的。这个呢,看上去啊,我的感受啊,看上去小米是在为他的这个智能硬件,智能家居 的一个应用场景啊, a 型的应用场景正在做铺垫。但是呢,我觉得现在这个阶段呢,还是一个比较早期的阶段,为什么一个模型比较大? 那比较大其实不适合在智能家居场景用,我估计他后面还会加强训练,然后针对智能家居场景做一些强化学习啊,然后让他变得更好,然后蒸馏之后,然后做更好的这个本地部署。 嗯,第二个呢,随着小米他的这个投入啊,持续的投入,加上啊,现在大厂都在挖天才啊,挖人,我个人觉得呢,他去围绕自己的场景做一个好用的智能家居的一个龙虾或者一个类似于 a 型的出来,是 可以期待的啊,可以期待的。然后呢,也有也有看到有人说他在那个 可乐的评估里面啊,而且包括他在 oppo 可乐的调用里面,现在是很高的排名好像第一吧,是吧?就他的他的他的 top 是 用的最多的,其实这个我觉得倒还好,因为他现在免费,他现在免费啊,免费一周,是吧,所以呢,他的这个调用量最多,情有可原啊,大家都想薅羊毛,很正常,很正常 啊,所以呢,我个人觉得还是看重他的是什么呢?他的这种布局啊,感知啊,决策执行啊,这这这这三个方向在做他的 ai 的 这个布局,希望他能够好好的走下去啊,这是一个,接下来呢,说一下那个 kimi 的 最新的论文, 注意力残差啊,叫做 attention resist 啊,这个名字好难读啊。啊,这个呢,本来呢,想用一个很长的视频跟大家详细的解读啊,注意力残差是怎么回事?跟以前有什么区别?但是我想了想,大多数人跟我反馈啊,我有时候视频说了,他们听不太懂,我简单的用一个 日常的例子跟大家理解一下这个论文的威力啊,我们把它想象成,把模型训练,想象成一个开会。董事长,召集两百位高管在一个会议室里面开会,董事长 最先发言,比如去年的业绩啊,还有什么问题啊,今年的展望,总体的发言,然后呢,由这一百位高管分别发言,这是大模型训练的过程,最后输出一个结果啊,最后输出一个什么呢?会议纪要啊,就是一个结果。以前的方式呢,是把董事长的语言啊 记下来,然后再把这一这两百位高管的发言全部记下来啊,这里变成了一个输出,就会出现一个什么问题呢?董事长的话,可能会被后面这些人发发的话所淹没,董事长在董事长发的话呢,在这个整个会议记录里面的权重会变低, 这是以前的问题。那现在这个 kimi 的 新论文做了什么改变呢? kimi 做了一件事情也是一样,让董事长先发言,发完言,然后让其他的一两百位高管也都各自发言。但是呢,问题在于后面的这个总结,他不是像之前那样,把所有 董事长加上高管的发言全部记下来,叫做我们呢,这叫残差连接啊,我们叫残差连接,就全部加起来汇总输出。那这一次呢, kimi 的 这个论文是什么呢?在这两百位高管的发言里面,哎,做了一个叫做啊 权重聚合啊,就是做了一次 attention, 大家可以去看一看 attention 的 原理啊。然后呢,做了这个之后呢,就会出现一个什么问题呢?把这两百位高管里面的发言的重点把它提取出来,把这两百位高管发言的这些跟董事长比较接近的,哎,这个东西可以 提取出来,然后再结合董事长的发言输出。那么这两百位高管里面可能有一些人没什么脑子,是不是有些人啊,我们在工作中可以看到,有些领导说话,他就是走不着调,他就是说不到重点的,这些都会被这个算法呢, 被 kimi 的 这个算法给它,给它,给它去掉,只留下那些跟董事长跟公司的核心啊,这会议的内容相关的,还把它的权重提高,然后把它记下来。最后呢,董事长在这个整个发言里面的权重占比呢,会保持的比较高,这解决了什么问题呢? 第一种方法,全部集合,会有会给看的人看会议纪要的人有时候会看迷糊,这就是模型的幻觉, 是吧?第二种呢,第二种呢,他直接就是把主要的意思都集中在以围绕董事长的发言,公司的主要策略发言为中心的一些观点。那你一看这个结果就知道非常清楚,他就不会漂移,我们叫什么注意力也不会被分散。这就是 kimi 团队的这个论文的一个非常厉害的地方啊,这解从根源上一定程度的解决了这个大模型幻觉的问题。和那个 deepsea 的 mhc 呢,虽然都想达到同样的效果,但是呢,它这个这个,这个注意力,注意力缠差要比那个 m h c 啊, deep stick 的 要通用多了,而且方法要简单很多啊,这是一个十七岁的天泽少年想出来的一个思路啊,很厉害。另外呢,还有其他的一些问题,比如 这个一九二百,基本上,哎,是要进来了。嗯,还有一些啊, deep stick 物, deep stick v 四 啊,我们这个这个,这个是什么?变成旺夫石了。兄弟们啊,感觉整个国产半导体,国产芯片国的算力都需要他的出现,大家就好好的等着吧,然后这一段时间不太平,注意自己的钱袋子,好吧。

小米昨晚发生了两件大事,一、收了几十份祝福。二、发了三款大模型,一同行送祝福。捧杀还是真心?三月十八日晚,新一代苏七发布前夕,比亚迪、理想未来、奔驰等几十家车企集体送祝福。雷军回应, 与所有同行一起推动产业进步。这波操作其实是礼尚往来,各取所需。新式历届顶流蹭热度,传统车企做口碑不落人口时, 行业共识已成,小米已是牌桌上的玩家,表面不得罪,交个朋友二、三款大模型在行业内什么水平?三月十九日凌晨,小米全球发布三款大模型, mimo v 二 pro 旗舰机做模型总餐量超一。 t artificial analysis 全球第八,国内第二,整体体感超越 cloudsonet, 毕竟 opus api 定价仅为对手五分之一。 mimo v 二 omni 全模态模型音频理解超 gemini 三 pro, 图像理解逼近 gemini 三 pro 支持原声音视频联合输入 miimo vr tts 语音合成模型,支持方言角色扮演,歌声合成。结论,国内第二,全球前十, ai 赛道已挤进第一梯队。三、对小米的长远影响,正面影响清晰。汽车加 ai 大 模型加速生态闭环,定价仅为对手五分之一, 可低成本扑进全系车型,逼对手跟进或看着小米打价格战。从保十米到被同行送祝福,硬科技标签正在贴上, 风险也明确。大模型迭代速度惊人,小米能不能持续跟进,把技术落地成体验才是真考验。同行送祝福是面子,大模型排名是里子,面子能赢一时好感,里子才能赢一世江山。

哈喽,大家好,欢迎收听我们的播客,今天要聊的呢是小米刚刚发布的这个 mini v two 系列的大模型。对,这个也是在最近啊,可以说是刷爆了这个科技圈啊,这三款大模型呢,也正式的为小米的这个人车家的生态啊,提供了这个 ai 的 底层的支撑。没错,那我们就直接开始今天的主题吧,我们先来聊第一块啊,就是这个三款模型的分工啊,这个感知决策表达,这个闭环的构建。 想先问一下啊,就是这个小米的这三款新的大模型,他们分别是负责什么的啊?然后主要的技术参数有哪些亮点?那这个系列呢,它其实是有三款啊,一款呢是叫做 pro, 它是一个旗舰的大脑, 这他是负责做决策的,做规划的,那他的参数呢,是超过了一万亿啊,然后他的这个激活的参数呢是四百二十个 g。 他 还有一个特别厉害的,就是他能够支持一百万透根的这种超长的上下文, 这个是很厉害的,就是他可以呃做一些很复杂的多步骤的任务。那他的这个在国际的榜单上面的排名呢,也是非常非常靠前的,他的这个价格呢,只有国际上同级别产品的五分之一。哇,这个价格真的很有杀伤力。然后另外一个呢就是欧米尼,他是一个全模态的一个感官, 就它能够同时去处理文本、图像、音频、视频。嗯,那它的这个音频理解呢,是超过了这个业界的标杆啊,它能够支持十个小时的这种连续的音频的分析,它的这个图片和视频的这个推理呢,也是非常非常强的。 最后一个呢就是 tts, 它是一个语音合成的专家,就是它能够把这个 ai 说的话变得非常的有感情,而且它可以切换方言,它甚至可以模拟唱歌, 就它的这个表现力是非常强的。就说这三款模型在实际应用中具体都有哪些让人眼前一亮的表现呢?比如说这个 pro, 它不光是在这个权威的测试里面表现的非常好,就是它的这个多部的任务啊,包括工具的调用啊,都非常的稳定,然后它也在这个真实的生产环境当中去做了验证。这个 omni 呢,它是在这个多模态的理解上面和这个跨模态的执行上面都刷新了这个行业的记录, 同时它也已经被接入到了这个主流的办公软件当中去提升这个操作的体验。这个 t t s 呢就更不用说了,它的这个语音的效果就是已经可以以假乱真了,而且它已经被集成到了这个小米的全生态当中去提供这种高拟真的这种交互。就是说这三款大模型一起到底给我们带来了一个什么样的全新的局面呢?就这三个其实是一个完整的智能体的一个能力的战, 就他把这个感知、决策和表达全都打通了,所以说他可以让这个 ai 去理解这个世界,然后去思考这个世界,去和这个世界进行非常自然的交流。这就不光是让这个智能助手变得更聪明了,他其实也给整个产业,给开发者,给这个生态带来了一个新的升级的一个机会, 就是小米的这个 ai 已经正式的进入到了这个第一梯队当中,我们接下来要聊的就是战略价值凸显出来的这个部分了,就是小米的这一套 miimo two 系列的大模型,到底在这个智能体的赛道上面实现了哪些差异化的突破?小米其实这次的布局非常的激进啊,就是他是直接想要从这个通用的助手这个层面直接跨越到能够在真实的物理世界当中去自主行动的这样的智能体。 那它的这三款大模型呢,就分别是负责思考、感知和表达的这样的一个功能,就把这个智能体的这个核心的能力全部都打通了。哦,这三个分工就很明确啊,那这背后的技术亮点还有哪些?就是它这个 pro 这个模型呢,它是用上了万亿级的参数, 然后呢又加上了这个百万级的这种上下文的窗口,就它其实是可以做这种非常复杂的多步骤的任务的,这个在业界都是非常领先的。这个 omni 呢,它是可以原声的去处理图像、视频、音频和文本,就它是一个全模态的一个输入,而且它甚至可以理解连续十个小时的这种音频内容。 这个 t t s 呢,它就是让这个 ai 可以 用非常自然的带感情的声音跟你交流,而且它甚至可以模仿不同的方言唱歌都可以, 所以这三个组合起来就形成了一个非常强的独特的竞争力。对,那我现在就是想知道,就是小米的这一套 mini v two 系列的大模型,到底是怎么让自己的这个硬件和软件实现了这种深度的血统呢,就是小米其实它是把这套大模型作为一个智能的核心, 然后植入到了它的这个所谓的人车家这一个全生态当中,就包括手机啊、汽车呀、智能家居啊等等的这些设备当中都有这个大模型的这个能力,所以它是真正的打通了这个端源的壁垒啊,让这个设备之间可以无缝的协助,所以就是说用户能够在各种场景下都能够享受到这种一致的智能体验。对,没错没错没错,那比如说它的这个 pro 这个模型可以让你的家电去执行一些非常复杂的任务, 然后这个 omni 呢,可以让你的汽车 s u 七能够去理解复杂的路况,这个 t t s 呢可以让你的这个语音助手变得非常的有个性。所以就说小米它其实不仅仅是在做一个产品,它其实是在把整个生态都升级成一个有自主行动能力的这种智能体的系统。那你觉得就是小米在推动这个 m m v two 系列的大模型的开源和开放生态这方面, 你觉得他们做的怎么样?小米这次的动作我觉得非常的大,他就是说不光是给开发者提供了这个非常非常低的门槛啊,就是他的这个 a p i 的 价格是比国际上的那些巨头都要低很多,然后他还限时的免费,对,他就是希望说让大家能够都来用。他也同时对接了五大主流的这个 agent 的 开发框架,他的这个最最新的这个 flash 这个模型呢,甚至是完全开源的,用的是 mit 的 协议, 这对整个行业会有什么样的影响?就是这个就会让全球的开发者都能够非常轻易的来接入,然后也会让这个创新的项目会大量的涌现出来。再加上小米本身有非常多的硬件的设备和这个活跃的用户,所以他其实是在很短的时间内就可以打造出一个非常繁荣的 ai 的 新生态,这个也会大大加快这个产业的升级和技术的落地。我们来聚焦一下啊,就是技术落地和生态壁垒这几个关键点, 想先请你解读一下小米 mini v 二系列大模型在技术创新上到底筑起了哪些护城河?就小米的这个参数规模是超过了一万亿, 然后它是使用了这个混合注意力机制和这个分层的记忆压缩啊,它可以支持百万级别的这种上下文的 tokens, 它在这个实际的推理上面的速度也提升了将近一半, 它的这个算力的消耗也比同类的要低百分之七十以上,这个性能确实是挺吓人的。那不光是这个,它的这个多模态的这个输入啊,就是图片、音频、视频它是可以一起输入的,它的这个音频的理解能力是超过了这个页面的这个标杆,它的这个 tts 是 可以做到非常细致的去控制这个音色和情感, 它是一个全站自研的一个技术,再加上它的这个端云的协同,以及它的这个安全的保护啊,这都是形成了一些很难去复制的一些壁垒。小米这个米某 v two 系列的大模型到底在哪些场景下已经开始落地应用了?就是现在已经开始在小米的这个智能助手上面,以及这个澎湃 os 上面,还有这个 su 七的这个智能座舱里面都已经开始使用了。 然后在这个办公领域也有和这个金山 wps 进行合作,在这个工业质检上面也有落地,而且它这个在这个多终端上面是可以无缝的进行协同的,所以它这个覆盖的范围特别广, 听起来已经挺成熟了这个应用。是的是的,而且他们不光是这个模型本身的这个技术做的很强,他们在这个开发者生态上面也是下足了功夫,就是他们的这个 api 价格是远远低于这个国际巨头的。 然后他也有这个限时免费和这项的技术支持,他也和五大主流的这个 a 阵的框架进行了深度的打通,所以就说整个的这个创新的活力被充分的激发出来了,所以这个技术的变现的速度也是非常快的。你觉得小米这个米某维 two 系列的大模型,在现在这个时间点,它的实际的产业地位到底怎么样?这个我觉得就是首先它是国内第一家把这个万亿级的参数和这个百万级的上下文做到了一个标准, 然后它在这个国际的榜单上面也是牢牢的占据了第一梯队的这个位置。就是它的这个无论是在长文党的处理,还是在这个复杂的推理,还是在这个多模态的理解上面,它都是刷新了这个行业的这个天花板,所以它是真正的做到了这种软硬件一体化的这种布局嘛,没错没错,而且它是深度的绑定了这个澎湃 o s 和这个小米的全站的硬件,然后它是形成了一个完整的从端到圆的一个智能的闭环, 它的这个开放的策略又是非常的激进,所以这个是会推动整个 ai 产业的,这个壁垒已经非常的明显了,所以这个是会推动整个 ai 产业的一个加速的升级。今天咱们就看到了小米这三款大模型, 不光是技术上面有非常大的突破,嗯,而且他们真的是在落地和生态上面迈出了非常关键的一步。嗯,对,所以我觉得小米的这个 ai 新征程确实让人充满期待。好了,那这期节目咱们就到这里了,然后感谢大家的收听,咱们下期再见,拜拜。

万万没想到,小米的大模型直接封神,最近在全球最大的 a p i 聚合平台上, 突然杀出了一匹黑马,一路狂飙,冲到了第一。这个模型有多强?很多人猜是 deepsea 微视, 就连 open core 创始人都在公开打探他的消息。今天答案揭晓了,是小米的 mimo v 二 pro。 更令人震惊的是,小米一口气发布了三款新模型,真的是火力全开, 中国首个万亿参数支持百万级上下文的旗舰模型,居然是一家硬件公司做出来的,带队的正是从 devic 走出来的天才少女罗浮丽。 目前小米已经挤进国内大模型第一梯队了。小米为什么要做大模型?我觉得不是为了蹭热点,而是人、车家生态必须要有一个真正的大脑, 手机、汽车、智能家居,单独用都只是工具。但如果有一个大模型,把它们连起来,让它们能够理解用户的意图,自主协助痊愈互联,那想象空间就大了。 ai 大 模型从来都不只是聊天,而是要走进生活,解决具体问题。这一次,小米站在了最前列。

三月十九号,小米发布了一个新的模型啊,这个模型号称可以免费七天,但是我进它的官网之后发现它用不了,调了一下它的 a p i 接口是说欠费的。我今天又发现了,它可以用,需要借助于 open code 这个编辑器来做。在这里 米某 v 二 pro 模型它是免费的。本来昨天就想体验一下的,那今天的话才能用得上,那我今天就简单地对它做一个测评吧。 测评的话主要分为这个两部分,首先讲一下它的这个参数,然后让它做一个前端的一个驳刻,嗯,最后的话就是这个后端的这个测试的话,其实是想用它来修 bug。 这个我在白天的时候已经试过了,先看一下它的这个参数吧。这个参数,嗯, 这个 ppt 是 让这个模型来做的,其实还是做得不错的,就是现在比较流行这种深层的网页形式的这种 ppt, 然后我按前后方向键是可以翻页的。那它这个模型的参数的话,是所谓的万亿的参数。三个大模型, 第一款的话是这个基座的模型,支持代码推理和规划。第二款的话是这个视觉模型、音频模型和文本模型的统一感知能力的方面的所谓多胞态吧。那最后一款模型的话,是测出你这个语音的,它的这个参数的话,其实还是比较亮眼的。那排名方面的话是排到第八了,号称 超过了这个 x 的 goroc 模型呢,成本也比较低。呃,这个模型的话其实已经有一段时间了,在这个 open root 上面,它是匿名上线的,它的调用量还是比较高的。在这个 open root 上面都已经登顶了啊。 嗯,之前很多人猜测它是一个 deepsea 的 v 四模型,但在三月十九号的应该是早上啊,早上上班的时候看到这个,雷军宣布了这个模型的这个名称,官网上面也 说是可以免费调用啊,但其实是调不了的,一直到现在的三月二十号的晚上,整整两天过去了,它还是不能调用,那它这个 a p i 也是相对来说这个价格还好啊。它这个模型的这个发展历程的话,大概是就是最早是 二五年的四月份开始做的,一直到现在。嗯,正如雷军所说的,就是这个模型的进步确实也是挺快的啊,就是之前的话,可能主流的模型里面都没有关注到有小米的这个模型。嗯,了解一下他们这个团队负责人啊。 是这个,简单说就是高材生。那他支持的生态的话,现在有一个 miklo 的 这个。嗯,龙虾嘛,龙虾,小米版的龙虾,然后还有他自家的自己的一些生态, 现在有一个福利,就是说七天免费调用的,这是他号称的,实际现在还是有问题的。小米版龙虾我也体验了一下,就是目前在他的官网是可以就是免费体验,但是每次体验的时长应该是只有一个小时啊,过了这个时间他会给你轻松的。 然后昨天试了一下这个,昨天就可以用,然后今天又试了一下它。其实,呃,常见的一些问题的话还是可以回答到的。我问了它是基于 opencloud 来构建的吗?它这个地方也回答了,就是看它的这个目录结构就是 确实是通过 open class 来构建的,右边能显示使用的这些文件啊,我昨天体验的时候还让他在这里做了一个 ppt 啊,这个 ppt 的 效果是在这个右边,然后可以直接在线的播放,做的 ppt 的 效果还是不错的。然后第二个的话是让他写了一个博客, 这是通过这个 open code, 这个大家如果想体验的话,目前我发现的这个渠道啊,就是这一个 open code 通过这个 mod 可以 来切换这种模型啊,就是可以选得到这个免费的 mimo v 二 pro 模型。然后我这里就是让这个模型来写,写了一个啊播客,这个 包括的一个效果的话,大概是这样子,这个还是比较现代化风格的一个单网页吧,然后续我觉得可以在这个基础上面做一些嗯,优化,然后让它这个 功功能更完善一下。这里也对比了一下它和其他的主流模型的一个数据的情况。我现在用的是这一款的 kimi 的 二点五,可以看到它的这个调用量的话,其实还是不错的,就是可以和这个 kimi 的 来进行对比了,这个调用量越多的话,说明它这个模型还是越受欢迎。然后下面这些其他的数据的话,其实大差不差啊,要注意它是不支持这个流逝输出的,并且它是这个文本模型啊, 就是不支持这个图片的,嗯,包括这个 mini max 二点七,它也同样是不支持图片的,它的图片能力其实需要通过外界的 m c p 来实现的啊。而像这个 kimi 二点五的话,它的这个, 嗯,它是原生支持图片的,就是我们在 cloud code 里面使用的时候,是可以直接把图片丢进去,它可以直接识别到的, 这点的话其实还是很有优势的。大家如果想体验一下这个模型的话,可以下载一个 open code, 就 大概就涨这么多吧,然后去用这个模型的一些体验的话,会持续的进行分享。

那么就在前几天, open roder 上突然冒出来两个没有署名的拟模型,没有宣传,没有介绍,上线没有几天就直接霸榜,日榜累计掉量干到了差不多一梯的 token, 那 所有人都在猜,这肯定是 dc 憋的一个大招,毕竟参数性能全对上了。 这个连 openclock 的 一个创始人都专门发推问这两个模型到底是谁家的。那么就在三月十九号凌晨,也就是今天的凌晨,小米站出来认领他了,不好意思,这两个是我们的。这个操作其实让我很震惊,毕竟确实没有想到这两个性能如此强悍的一个模型场上会是小米。就让我想起了李总说了一句话,有咱也欠下的,干输了就当没干过。 这两个模型呢,其实就是小米这次发布的 mimo b r 家族的核心成员,分别是 hunter alpha 以及 heller alpha。 那 我们先说第一个 hunter alpha, 其实就是 mimo b r pro, 这个模型对我来说印象比较深的这三个词分别性价比,第二个是注意力,第三个是上下文 手叉的总参数是突破了差不多一 t 啊,万亿级别的一个概念了,但是推理的时候它仅激活了四十二 b 的 一个参数,通过混合注意力机制把混合比例提升到了七比一, 比如说我们在针对主要任务的时候,我们会以七层的一个比例去给到它,同时会留出差不多一层的一个注意力,去给到一些次要的细节上,在参数量较潜在三倍的情况下,依然维持了一个高效的推理,包括它支持一个一百万透杆的超长上下网。什么概念呢?可以简单理解成 这个模型在性能更优的同时,执行任务的时候,针对主要任务和次要任务的细节都能够基本把握,同时上下网还增加了。那么在性能方面,在全球大模型综合排行榜上,它位列全球第八,品牌第五, 说是直接超过了马斯克的 group。 同时在 a 整能力上,也是对标了一些顶级模型,包括,呃,有了一些扣顶工序调用多步推理的能力,和和 clubsonne g p 五点二 g m 三 pro 站在了同一个梯队。但最让我感兴趣的是它的定价,同样是顶级的 a 整能力,它的 aj 价格只有 cluboff 四点六的五分之一。 那么在官方的一个养龙虾测试里,只要说一句,帮我做一个每天十九点更新新股上市网站,他会从写拍等爬虫去抓新股数据,到生成静态页面代码,再到完成步骤上线,再到运行中发现数据不匹配,就自己去优化,整个过程中不用写一行代码,不用管部署,全程他自己就可以搞定。 那么在这个场景中呢,放在以前,用点击魔镜跑这么一套流程的话,没有大几十块你是根本下不来的,那么现在的话,他的一个成本将会大大降低了。那么如果说我是一个只会思考的大脑的话,我迷你就是一个戴眼睛、耳朵、手脚的一个全能数字打工人。他的 算法也就是一个全模态机座,他分为两个端,用来感知端和执行端,这种感知端能听能看,他能够处理十个小时的一个长内容,包括音频。语言能力上,他能处理十小时以上的连续长录音, 这就意味着以后开会的时候,你根本不用自己去听了,你可以直接把手机放在那里,然后打开我们的我们的模型,把这种杂的录音发给他,他就能够整理成带班资料。 同时在图像视频理解上都有了提高,包括一些复杂的行业图标和学科的视觉推理,甚至一些带声音的视频情景分析他都能够搞定。他的执行官能够自主操控浏览器,完成全流程的任务,同时他也内置了小米的浏览器,在浏览器自动化操纵上也是有了效率上的提高。 那么我前一期视频吐槽的 oppo pro 操作一段轻慢的一个问题似乎也能够被解决了。这个模型呢,就属于是你给他需求,他就能够直接给你生成相对应的交互物,包括生成版本好的 word、 比较 pdf, 甚至完整的 pdf, 他 都是能够做到的,甚至不用你再调格式改变,拿到手的话他就可以直接用。那 可以想一下,如果说我们能够把把我们之前用的所有的 skill 都丢给他的话,他可能会完成的更加好。很多人都说小米这是是一个闷声发大财,就突然搞出一个这么的模型。但是我在一年前读的小米创业四号里面 有注意到一个点,其实这根本就不是一个突然爆发,我觉得这是一个小米玩了十几年的一个套路。在小米创业思考这本书里面讲述过一个前期起步的一个故事,就是在二零一零年,小米还没起步的时候, 没灵气、没广告、没预算,当时其实连手机都还没有做,但是他们就先做了 u i 的 一个系统,之后呢,他们会在社区论坛里面找一百个发烧友,把这个半成品的系统发给他们测,然后每周去更新,然后他们有一个非常接地气的一个社区 用户提什么需求,他们这一周就会把它改掉。那我们都做了一年之后呢?没有一分钱推广,就攒了三十万的一个手机用户,在这之后发布了第一代的一个小米手机,后来就一炮而红。那么对比这一次那个模型,有没有有种似曾相识的感觉? 不官宣,将用户用脚投票,先把这个半枕饼的模型扔到全球的一个开发平台,也就是 open source 这里之后,让全世界的一个开发者来判断这个模型到底好不好用, 然后用用户的反馈来快速迭代。那么在用户的反馈以及小米的快速迭代下,这个模型就能够不断的去优化自己能力,然后在长相、效果能力、 a 型场景的一个稳定性上会不断的打磨的明明白白。那么等口碑起来之后再出来认领,就像现在用户用了,哎,可以啊,都说,哎,这模型不错啊,有点牛逼啊。那么这时候他们再出来认领,你说这就是我们的模型, 也就说我们其实在不知不觉中已经成为了这个模型的某种角度的参与者,不过就让我兴奋来自它的一个五分之一,那么这意味着对于像我这样的一个个体, 以后用 ai 的 门槛会更低,且在玩 ai 的 过程中成本会更低,那对我来说是有一个很大的帮助的,就像 pk 十年前预言过的几个趋势,在这波 ai 战场里面是真的有不断的凸显,我就不断的意识到是确实是这样子的, 植化、流动、评毒、重混这四个趋势,在这次的这个场景下,有一个明显的感觉到了这样的一个趋势,那我在想,如果说在未来互联网再加上智能家居,再加上我们真正的一个智能体,在这个不断的植化形成的一个发展趋势下,未来会是什么样子?有可能在未来整一个全屋智能家居都是一个系列的产品,每一个产品都有一定的智能, 如果我们把每一个产品都进行植化产生智能,而每一个产品都类似于一个 open house, 或者是一个笼统的共享智库, 每个人的每一个智能家居,它的信息都能够同步加载到对应的一个上下文,且每一个上下文都是足够大的,能够承载大量信息的话,那么在未来我们使用这些智能家居的时候会越来越简单,使用的方式也会越来越方便。有可能我们只需要通过手势,通过语言,通过一些体表的温度方式、眼神,就能让智能家居对我们进行评估,同时我们也能够对它进行一定的使用。 在这样的方式下,我觉得在未来整个生态会变得非常的丰富,这就可以让我们的居住的整个小区都火起来,可能到时候单体智能就变成了全皮智能, 所以说能够有这样一个数据,我确实很兴奋。而且随着 ai 的 一个不断发展,不断的把上下维变大,不断 ai 的 注意力和幻觉问题解决掉,不断的让它变得越来越智能,越来越平稳,在过去、现在、未来,一切都在不断的形成,可能再过几年,我们真的可以实现一个非常高效的自动化, 就不再需要我们去进行一些很简单的任务,或者说我们不用去参与一些真的要去落地制定的东西了。我们可能只需要提供一个想法,提供一个 idea, 然后给他一个调研方向, ai 就 会不断地基于这个方向想法、 idea, 不 断地调研,不断地深挖,那么这个未来其实很难想象的。 不过这里面一个问题就是,在未来 ai 的 一个技术不断发展下,我们生活会变成什么样子?如果说生产力已经大幅提升了,那我们生活是会变得越来越好,还是会变得越来越坏?总而言之,技术是一直在不断发展的,就像前几天我还在讲二分炮,还在讨论它的浏览器操作怎么做慢, 那么现在又来了一个更加智能的模型,更快更便宜,那么技术确实在不断发展,不断迭代,只能说期待未来吧。 那么这就是今天的一个内容。其实没什么干货,就去看到这一个新闻,想说点什么,小米这波匿名的模型操作,你觉得怎么样呢?是营销手段还是说真的有实力?欢迎在评论区告诉我你的想法。那么如果你觉得这是对你有帮助的话,是已经三点,那么我是彼得坦子,一个 ai 实战成长博主,关注我,咱们一起探索 ai 的 未来。那么话不多说,我下期继续充值,玩下这个新模型,下期见。

如何看待小米发布并开源了自己的最新 ai 大 模型 mimo v 二 flash? 哎,我先说结论吧,如何判断 ai 大 模型?它强不强,只需要看能不能帮助我们 普通人审视。你吹得再高端没有任何用,老百姓用不上它就是垃圾。那我们再说说 mimo v 二 flash。 按照官方的说法,这次它对标的是 dimix v 三点二发布会,我这里就不再 误数了。我只说一件事,我们团队经过十次,他是真的快,不是感觉快,是你在用的时候会明显感觉到他反应快,反馈直接,不拖泥带水。但普通人不关心他模型有多牛,只关心他能不能替我少操点心。如果你对下面两种真实的生活场景有需求,那么这个模型你必须重点关注。很多人用 a s 大 的通点 是什么?他懂中文,但不懂中国话,也听不懂中国人的生活方式。咪某这类模型真正有价值的地方在于,他不是翻译式的中文,是本土语境的中文。 比如工作群五十多条废话帮你提炼,重点合同通知、政策文件,用人话讲给你听,让你明白,长语音会议机要直接变成结论。说白了,工作党可以重点注意。第二点, ai 如果只存在于在 app 里,那么它就是一个玩具。如果能进入在系统里,那么才能叫做 工具。你想象一下,你的手机,你的平板,你的任何小米设备日程备忘,家庭设备状态,不用你一个个点一个个找你,此时此刻只需要说一句话,我今天很忙,帮我把能自动的都自动了,噔 提醒形成设备,在同一逻辑下协调工作,说人话,把 ai 变成了我们的生活管家,而不是那个傻乎乎的聊天对象。要记住, ai 的 价值不是模型的大小,是替你省下了多少事。如果 ai 不 能融入我们的生活,那么它再快,它也只是参数。

听说小米搞个大模型很牛啊,这两天就说 h u 什么憨憨憨。哎,老师都教不会,我不知道怎么读。没用啊,我就跟你说,小米从四十多块钱我们拍视频,现在三十多了,马上破二十了, 我们那个朋友呢,可能是给小米套住了,现在天天在群里面说,哇,小米又有新的消息了,立好立好啊,排在 open ai 后面的大模型啊,排在第五名啊。 哎呀,说不定你是真的很屌哦。人家可能真的是跟 open clock 一 样哦,他上头了你知道吗?明明有一个很好的,你看他给我们推荐的那个说的那个什么美光很厉害,然后说那个迷你妹很厉害,然后呢?现在呢?自己呢?就去 那些好的,他就不去,自己搞了个小米,对吧,自己就是小米,然后呢,就陷入了一个死循环。叫什么?因为你搞了小米, 他就天天呢发点消息来去证明小米是多好的。哇,你不要这么说,等一下群里面证明好知道吧, 小米最大的不好我已经告诉了你了,你现在还记得吗?现在山西的内存工厂已经罢工了。嗯,卡塔尔那边在打打打着。那个天天燃气没有内存呢,严重到你红米手机不是加价的问题?嗯, 是出不了这么多型号,你只能卖那个红米十七啊,十六啊,就买回原来的,今年就根根本不更新手机了,只能卖库存机了。对,只能卖库存,因为你没有内存的,内存被被苹果买了,被特斯拉买的特斯拉马斯克啊,现在都要自己开新面场啊,他自己都没有内存的, 小米的百分之七十的业务来自于这个,不管你的大模型多厉害。嗯,现在其实汽车还有家电都是要内存的啊,汽车也不少了,好像他基本每个设备都要内存的。对,所以呢,你要不就涨价, 要不就是那个那个那个那个什么,自己盖个厂出来。对,而且汽车业务呢,有三代发力。哎,你现在发力大模型会不会太晚了呢? 因为国内已经垄断了嘛,你技术再牛逼你能冲上去吗?也不一定垄断吧,说不定人家很牛呢。国内三大巨头,豆包,元宝那个 dj 是 不是。嗯,华为都没有大模型啊,大哥都轮不上他,他这么多设备,你别说小米了。 是不是啊,国外的哎,你也去不了。我是觉得就算沦丧了他好了,但是他短期也没法靠那个赚钱, 这是个问题。大模型现在在烧钱呢。你好了,烧的更多,训练的烧的更多,这不是个好事情。 mini max 那 些呢?还能赚点会员费什么的。你小米的只能免费给小米手机 的基本用啊,你还想在大冒险收他的钱啊?你豆包都免费的,为什么不用豆包?所以呢,你越搞这些技术呢你你就越越惨了,现在三三十多块钱,你这么说你叫人家雷总怎么办嘛。 哎,我会不会发完这条视频那个我朋友把我拉黑了啊。不能再说了,等会没兄弟做了。他选的那些挺好的,就是 就中毒一样的天天。自从苹果换了小米手机就中毒一样了。哎,麻烦,我们都是高中的,生活变好了。是小米手机换上了苹果。 不知道,他生活变好了之后苹果手机换上了小米。哎,人家也用苹果啊,但是还是爱小米吧。好吧, ok。