粉丝140.1万获赞584.6万

如何看待小米发布并开源了自己的最新 ai 大 模型 mimo v 二 flash? 哎,我先说结论吧,如何判断 ai 大 模型?它强不强,只需要看能不能帮助我们 普通人审视。你吹得再高端没有任何用,老百姓用不上它就是垃圾。那我们再说说 mimo v 二 flash。 按照官方的说法,这次它对标的是 dimix v 三点二发布会,我这里就不再 误数了。我只说一件事,我们团队经过十次,他是真的快,不是感觉快,是你在用的时候会明显感觉到他反应快,反馈直接,不拖泥带水。但普通人不关心他模型有多牛,只关心他能不能替我少操点心。如果你对下面两种真实的生活场景有需求,那么这个模型你必须重点关注。很多人用 a s 大 的通点 是什么?他懂中文,但不懂中国话,也听不懂中国人的生活方式。咪某这类模型真正有价值的地方在于,他不是翻译式的中文,是本土语境的中文。 比如工作群五十多条废话帮你提炼,重点合同通知、政策文件,用人话讲给你听,让你明白,长语音会议机要直接变成结论。说白了,工作党可以重点注意。第二点, ai 如果只存在于在 app 里,那么它就是一个玩具。如果能进入在系统里,那么才能叫做 工具。你想象一下,你的手机,你的平板,你的任何小米设备日程备忘,家庭设备状态,不用你一个个点一个个找你,此时此刻只需要说一句话,我今天很忙,帮我把能自动的都自动了,噔 提醒形成设备,在同一逻辑下协调工作,说人话,把 ai 变成了我们的生活管家,而不是那个傻乎乎的聊天对象。要记住, ai 的 价值不是模型的大小,是替你省下了多少事。如果 ai 不 能融入我们的生活,那么它再快,它也只是参数。

小米刚刚开源的这个大模型 miyamoto flash 到底厉害在哪里?它跟其他的那些 ai 模型有什么不一样的地方?就是这个模型它的参数是三千零九十亿,然后推理速度是 deepsea 的 三倍,成本却只有十分之一。更厉害的是它是完全开源免费的。对, 而且它是专门为具身智能设计的,所以它不仅仅可以聊天,还可以真正地去跟现实世界进行互动。 说到这个,那为什么小米在让 ai 落地到现实生活这件事情上面,会比其他的公司更有优势呢?这是因为小米是全球唯一一家同时拥有手机、汽车、全屋智能这三大物理主体的公司,所以 ai 可以 通过这些主体真正地做到在现实世界里面去感知和行动。 听起来好像是说小米把 ai 的 大脑和身体都给造出来了,然后让它可以无处不在。没错,就是手机、汽车、家电全部都跑在同一个澎湃 os 上面,然后共用一个米某大模型, 所以就形成了一个非常完整的独一无二的生态闭环。那其他的公司哪怕再大,他们目前都还缺其中的某一块拼图。就是这背后的逻辑是什么?怎么就可以做到不同设备之间的联动呢? 其实这背后的逻辑就是你的手机会变成一个随身的 ai 大 脑,然后它会跟你的车、你的家里的各种智能设备去互相沟通。 比如说你忘了吃药,手机会弹窗提醒你,然后同时你的智能药盒也会弹出来,如果你需要买药车的导航还会帮你找到最近的药店, 就是完全是跨设备的协同,太实用了,这种跨设备的协同体验真的是太实用了,那它和以前那种各自为战的智能设备相比,到底强在哪里?以前的那些智能设备都是你用你的,我用我的,就手机是手机的智能,汽车是汽车的智能,家电是家电的智能,它们之间没有任何的交流, 但是现在小米把所有的这些东西全部都连接在了一起,所以这个 ai 就 好像是有了一个身体,它可以在不同的场景下面自动的去帮你处理各种事情,而不是说像以前一样,你要自己去打开这个 app, 那 个 app, 然后自己去操作, 这确实是一个质的飞跃。对,感觉生活一下就简单了很多。是的,其实现在很多人还是在很痴迷于这个模型参数的高低,但对于我们普通人来说,这个参数再高也不如用起来顺手来的实在。 那小米的这个思路其实就是把这个 ai 从高高的云端拉到了我们的身边,让大家都可以很容易的去用上真正对自己有帮助的智能的服务。所以小米现在这种全生态的战略,它的核心竞争力到底是什么?小米真正的野心并不是说要做一个多么牛逼的大模型, 它是想要用这个 ai 生态去包围所有人的生活。对,就是现在这个所谓的人车加全生态的布局, 在全球范围里面也只有小米可以做到。哦,原来关键在这里,那这个 ai 聚生化接下来会在哪些新的场景里面出现呢?除了我们现在看到的手机、汽车、家里的智能设备之外,其实办公场景也是一个非常大的方向, 比如说未来你的这个智能办公设备,可以自动帮你整理文件,自动帮你安排会议。然后还有健康场景,比如说你的智能穿戴设备,可以随时地监控你的身体状况,然后一旦有异常就可以自动帮你联系家庭医生。 对,今天我们聊了这么多,其实主要就是围绕着小米的这个全生态的 ai 战略,它是如何让我们的日常生活变得更加便捷和智能的。好了,那这期播课就到这里了,然后感谢大家的收听,咱们下期再见,拜拜。拜拜。

兄弟们,这里是你们的老朋友慢刀青衣。我知道很多兄弟心底都在嘀咕,小米的大模型怎么这么厉害,一出来就是世界第二。 慢刀青衣今天来叭叭这件事,其实就是你把平时练习的题拿来做了考试题跑分当然高了。慢刀青衣用大白话讲清小米大模型世界第二的真相,本质是优化包装,而非颠覆性创新。核心问题集中在对比有猫腻,技术有取舍,落地有落差。一、 先看世界第二的分数,选对赛道加压对题不是真全能。一、所谓代码能力世界第二,是专挑了自己擅长的题考。小米在 s w e bench verified 拿了七十三百分之四的解决率,但这里有两个坑,测试的代码案例大量来自 get up 开源库, 而小米训练数据里就有这些库,相当于考试前压中了原题,分数看着高,真遇到没见过的冷门代码,解决率直接暴跌。 他只敢跟开源模型比,不敢跟闭源的。 gpt 五, cloud 四点五,硬钢 gpt 五参数一点八万亿,是小米模型的六倍,训练数据量更是不在一个量级。拿开源第二偷换世界第二,属于玩文字游戏。二、实际用起来复杂任务直接拉跨 处理非结构化问题,小米模型能卡二十三分钟没答案。而同类开源模型 deep seek 只要十秒,多轮聊天,超过十轮就失忆,前一秒说要保护用户隐私,后一秒就建议收集生物特征,逻辑根本串不起来。 这哪是世界第二,分明是专注单向全面拉垮。二、再看技术创新,换汤不换药,优化不等于颠覆。一、 宣传的黑科技其实是取舍后的妥协。所谓混合注意力机制,说能省六倍存储支持两百五十六 k 长文本,代价是顾头不顾尾。 读长文章时前面的内容记不住,语义连贯度比 deepsea v 三满刀青衣。我知道很多兄弟心底都在嘀咕,小米的大明星怎么这么厉害。所谓多 token, 预测推理速度达一百五十 tokens 秒,看着很快,但只适合写代码这种结构化任务, 要是让他写文章做复杂逻辑推理,就会出现句子碎片化,还得人工改半天。二、参数规模的猫腻,总参数看着大,实际能用得少。小米说自己是三零九 b 参数模型,但真实激活的参数只有十五 b, 相当于一个公司宣称有三百零九个员工,实际干活的只有十五个,剩下的都是挂名。这种设计确实能省成本,但性能必然打折。比如数学推理得分只有六十八百分之二,比 deepsea v 三二的百分之七十五点一低不少, 而 gpt 五激活参数占比达百分之二十,相同算力下能处理更复杂的活,小米的参数效率根本没优势。三、开源生态加硬件协同,看着热闹,实际没落地。一、开源不是真共享,而是没人捧场。 小米说模型开源,但发布两周内, github 上非小米团队的代码贡献只有十二个,还都是改文档的,没有开发者愿意做深度应用。反观 deepstack v 三二已经接入自结美团,日均处理十亿次 a p r 请求,差距一目了然。 说白了,小米的开源生态就是自家人捧场,宣传的花哨,用着很拉胯,端侧部署 宣称能在十二 gb 显存设备运行,但实际在手机上推理速度只有五十 tocs 秒,是云端的三分之一,发个指令要等半天。跨设备控制不是直接连接,而是要经过云端中转,延迟超过两秒, 这在自动驾驶实时控制场景里根本没法用。聚深智能在仿真环境里成绩不错,但到了真实场景,成功率只有百分之六十二,比特斯拉 optimus 的 百分之八十五差远了,连拿红色杯子这种简单任务错误率都高达百分之三十七 四。最后算笔账,成本低是真,但前提是偷工减料。小米说训练成本是传统方法的五十分之一,看着很划算,但其实是隐性成本,没算进去。 他用的多教师蒸馏技术,确实省了直接算力,但得靠自建的六千五百张 gpu 集群做数据预处理,这部分硬件投入没算进训练成本里。统称 对比对象选得巧,币源模型的成本里,百分之六十花在数据标注和算法优化上。而小米模型靠开源数据省了这部分钱,相当于别人花大价钱做原创,他抄作业省了稿费。这种成本对比根本不公平。 小米大模型不是世界第二的全能选手,而是在特定赛道、特定测试、特定对比对象下的优化版选手。 它的本质是换了个更省成本的壳,把现有技术做了取舍优化,适合做代码辅助、简单家居控制这类场景化工具,但离世界第二的综合实力还差得远。所谓世界第二,更多是商业宣传的话术,而非技术上的真实地位。

vivo 大 模型开源了,有没有人去看看它里面有没有千万的代码?昨天小米不是出了 vivo 大 模型吗?啊,我不是很懂,就去问了一下从业人员,他跟我说小米大概就是用一半的参数,用非常低的算力做出了一个接近于 deepsea 水平的大模型啊,当然不是百分百,大概八九十左右吧。 可以看到小米这个资源水平有点太高了,而且他做出来的东西也非常有性价比,因为算力用的越少,成本越低,因为我们知道算力卡要钱,电费也要钱, 那么这个东西就非常的有竞争力了。真的,我觉得很多公司看到小米之后会非常的绝望,因为你很难找出像小米这样子横跨多个行业,出货量还大的公司出来啊,手机, 智能家居,汽车啊,谁能做到像小米这样子出货量大,自己的东西又好用,成本还低呢?啊,你很难想象小米以后的进化速度了,真的,你就是让别人超你都超不了,追也追不上了。


就在昨天,小米正式发布了自家的开源大模型 mimo vr flash, 发布会上的主讲人正是前 deepsea 的 核心成员,被称为天才少女的罗弗利。 根据页内的测评数据啊, mimo 的 综合性能已经跻身大模型的第一梯队,而且成本极低。我其实并不关心这些参数,我更多的在想一件事情,就是小米为什么要在这个时候发布这个东西。 你想,小米在 ai 大 模型的赛道上,其实并不是最早的那一批,而且在很多人的概念里,大模型的格局好像已经差不多定了,该有的玩家都有了,该跑出来的也基本跑出来了。 那么在这样的一个时间点,小米选择把资源大模型推出来,而且还直接开源,这个动作本身就已经比模型强不强更值得讨论了。 低层意思,说明,这件事情已经从少数人能干变成了后来者也能进场。注意,我说的不是谁已经赢了,而是这个门是不是还开着。 如果这是一条门槛极高,已经彻底封死的路,那么后来者通常会选择等,或者干脆不做了。小米自研大模型的推出,其实在释放一个信号, 就是大模型这件事情正在从拼命抢跑进入到工程能力慢慢显现的阶段。 第二层意思, ai 真正难的地方可能已经不再有没有模型了,模型会越来越多,能力会越来越接近,甚至价格也会越来越低。 那接下来拼什么?我更倾向于一个判断,拼的是谁更懂现实世界,谁更懂怎么落地。 而这个恰恰是一些传统科技公司的优势区间,不管你喜不喜欢小米,他长期干的一件事情就是把复杂的技术塞进一个普通人能用而且能够长期用的系统里。 ai 一 旦走到这一步,光靠模型本身是不够的。 再说一个,我觉得挺关键,但是可能大家聊的不多的一个点就是开源这件事情本身正在改变 ai 的 节奏。你会发现现在越来越多的模型选择开源,这会带来一个结果, ai 的 创新速度会越来越快,而垄断的时间会越来越短。以前可能是某一家领先半年,一年优势非常明显,但现在很可能是你领先三个月,后面有一堆人已经追上来了。 这对整个行业来说其实是好事,对创业者,对应用层反而是机会。所以我并不急着下结论说小米这个模型最后会走到一个什么样的结果,我会把它当做一个信号事件来看。 ai 这件事情还没有走到终局,后来者依然有入场空间。真正的分水岭可能在于怎么用,而不是谁更强。因为当一件事情开始变得没有那么神秘的时候,属于普通人的机会可能已经到来了。

刚刚小米开源三千零九十亿参数大模型,小米这次是真的有点不一样了,竟然直接开源了他们刚刚发布的 memo v two flash。 小 米这次开源的 memo v 二 f l a s h 可不是一般的强,作为目前互联网上又一个以上线可用的开源大模型,它拥有三千零九十亿的总参数量,专注于智能体场景 实测,发现其响应速度远超目前所有主流的国产大模型。最关键的是它的 api 接口价格还十分便宜。在通用基准测试中, mimo v r f l a s h。 的 表现基本追其当前最强的 deepsea v 三点二,而在一些特定场景表现更加优异。同时其成本约为头部模型的三分之一负二分之一。 可以说,小米这次的开源既保证了性能,又大幅降低了成本。为什么小米愿意放弃这么重要的流量收入?答案还是因为他们想做智能体领域的安卓。小米想要用米通操作系统去连接未来的所有智能体,而这就需要先把底层做好。小米之所以如此重视智能体, 只因为他们判断真正的智能体大规模普及至少还需要五年。在这期间,小米希望通过米通操作系统来提前预定未来智能体的入口。 小米能在现在推出米通操作系统绝不是心血来潮。首先,小米有足够的能力支持系统研发,其次,作为上市公司需要新的增长点。最后,小米是一家有梦想的公司。朋友们,你们有没有发现,我们的国产人工智能的竞争越来越有味道了呀? 曾经我们看美国 openai 发布的新版本,感觉美国人在不断卷餐数量、卷算力,但是现在不一样了,我们国内的大模型的竞争已经进入了下半场,下半场的竞争重点不再是简单的餐数量,而是要比拼可用性、成本、速度、场景适配。 就像小米这样,能将三千零九十亿参数的模型压缩到只需要一百五十亿的活跃参数,并且还能保持如此强劲的能力,这才是真正的技术进步。 所以我预言,如果小米真的能借助他们擅长的硬件优势,率先实现端侧模型的部署,那么未来人工智能的竞争可能会出现新的分工,云端负责训练,终端负责推理,而这也将再次重塑全球人工智能基础设施的竞争格局。总结一句话,小米这次的开源大模型目标是要成为未来智能体时代的操作系统。

在二零二零年那会的开源模型,距离世界顶尖的闭源模型的代差,我认为至少有三年。 但是如今大家都能看到中国像 deepsea、 q n g m m s 等等包括咪某载源的在内的开源模型,其实距离世界的顶顶尖的闭源模型的差距,可能这个差距只有数月了。 我认为开源是实现 agi 的 普绘化,是确保所有人类的智慧共同进化的唯一路径。 刚刚加入小米,曾任 deepsea 核心研发的顶尖 ai 研究员罗弗利首次公开演讲就抛出了两个重磅判断,第一,中国顶级开源模型发展极快,与全球顶尖闭源技术的差距已经从过去的几年缩短到了现在的几个月。 第二,他带队的小米 mini 目标更为颠覆,要超越当前只有语言外壳的 ai, 打造能理解并与真实物理世界交互的空间智能,这被认为是通向 agi 的 关键一步。 虽然现在的大模型呢,它能聊天,能写代码,但是呢,我相信大家还是很不放心把你的身边很复杂任务交给他。 因为其实我认为真正的下一代智能体的系统,它不是一个语言模拟器,它是需要跟我们的世界共存的一个智能体。所以其实下一代的智能体它必须要具备两个潜能,第一个是它要从 回答问题变成完成任务。这里边其实大家可能会在很多场合去看到说 ok, 他 要有记忆能力、推理能力、自主决策规划等等, ok, 但是其实这些在我来看,他背后的研究的深度都很深,就是每个方向他都是有非常深的研究深度。 然后此外的话,我们相信有这些能力的基础,它必须要产生交互的前提是它要有一个目的的一个感知能力,也就说我们做一个统一的动态系统是非常必要的,它也是为我们去理解整个世界一个很很关键的基础。 在这些基础上,当我们有了这样的一个模型的基础上的时候,那么我们可以很无缝的去进入到像眼镜这样的一些智能终端,更无缝的去融入到我们的生活流。 回到我们一开始的讨论的话题就是大模型其实它本质上是用了算力的暴力美学,直接去攻克了最顶层的语言,第二层的强化学习, 但是呢他跳过了中间的非常多的步骤,比如说第三层关于对世界的一个感知,对世界的磨砺,以及对于第一层他必须要有个实体跟这个环境产生交互, 这是为什么?现在大家认为大模型其实他已经做到了数学奥林匹克竞赛的水平,他可能有时候也能去模仿莎士比亚的风格去写作,但是你发现他其实本质上并不太懂重力这样的一些物理法则的含义, 并且他有时候经常会产生一些具生的幻觉。也就说其实我们现在大模型它其实只有一个完美的语言的外壳,它没有一个描定现实世界的一个物理模型, 所以我认为其实呃 ai 进化了一个,下一个起点是一定要有一个可以跟这个真实环境产生交互的一个物理模型。我们本质上要打造的并不是一个程序,其实是一个具备在物理上一致性呃时空 连贯性的这样的一个虚拟的宇宙。这其实本质上是代表着 ai 的 能力有一个本质的跨越, 他不仅仅满足于说他要去看懂画面,而是说要理解背后的物理规律,也不仅仅局限于说 ok, 他 要去处理文本,而是说他要去推演后边整个世界的一个运作逻辑。 我相信真正的智能绝对不是纯粹是在文本里边读出来的,而是说他在交互里边活出来。 其实呢,我本质上我们认为技术上是可以追赶的算力和数据了,也并非最终的护城河, 有点奇怪吧?其实确实数据也不是。然后真正的护城河呢?其实我认为是科学的研究文化和方法是将未知的问题转化成模型的优势,最终去结合可用产品的一个能力。 小米的大模型的扩团队其实就是在这样的长期愿景中诞生的。我们构建了一个研究产品工程深度藕合的一个年轻化的团队,他非常具备创业精神,我们团队员每个人都极度好奇,追求真理, 乘着自由的风,满怀着对这个世界极致的关怀,在一起去探索智能的边界。 嗯,在呃这个演讲的结尾,我想跟大家回顾一下,在二零二零年,我刚去进入大模型这个领域的时候, 呃一开始也是去做开源模型,那会的开源模型距离世界顶尖的闭源模型的代差我认为至少有三年。 但是如今大家都能看到中国像 deepsea, qwind, jon, me, mass 等等,包括 me 某灾源的灾类的开源模型,其实距离世界的顶顶尖的闭源模型的差距,可能这个差距只有数月了。 我们,我们相信开源的价值并不仅仅是说我们分享了模型,分享了代码。而我开源的价值本质上是一种分布式的技术的加速的主义。 我认为开源是实现 a g i 的 普绘化,是确保所有人类的智慧共同进化的唯一路径。 从数据的极致压缩到算法的范式创新,再到与物理空间的深度链接, 小米与全球 ai 共同定义未来,谢谢大家。

小米天才少女罗弗利首秀称小米开源模型全球前二!这不是一次普通的站台, 因为这是罗弗利正式执掌小米麦某大模型团队之后,第一次系统性的对外讲清楚,小米到底要怎么做大模型, 又要把 ai 带到什么地方去。现场的气氛其实很微妙,小米创始人雷军没有出现,集团总裁卢伟兵率先登台,把业务成绩和战略方向凸开。而真正把全场注意力拉到 ai 上的, 是第三位登台的罗富利,他现在的身份是小米 mimo 大 模型负责人,但在行业里,他更为人熟知的标签是前 deepsea 核心成员。一上台,他没有先讲参数, 也没有讲成绩,而是直接把时间拉回到了六亿年前。他说, ai 正在以一种非限性的方式重演人类大脑六亿年的进化史。罗弗利在现场明确给出了小米打造 agent 语言基作模型的三个重点方向,第一 是极强的代码能力和工具调用能力,因为在 agent 的 时代,代码本身就是高效沟通的语言。 第二是围绕极致推理效率设计的模型结构,支撑高带宽的 agent 的 写作。第三是全新的后训练范式,用来保证强化学习可以稳定扩展。 真正让现场出现讨论声的,是他随后给出的一个判断。他说, miami v 二 flash 模型体量并不算大,但在代码能力和 agent 测评的世界级公开评估榜单中,已经进入全球开源模型前二。于是问题来了,这个前二意味着什么? 支持的一派认为这是一个非常强烈的信号。过去几年,大家一提 ai, 总觉得核心能力在国外?过去几年大家一提 ai, 总觉得核心能力在国外。现在天才少女站出来说, 在公开评测中排到前列,这本身就值得被讨论。现在天才少女站出来说,在公开评测中排到前列,这本身就值得被讨论。也有不少人说,这至少说明一件事,小米已经不是蹭 ai 热度, 而是在这个方向上认真投入了。但质疑声也很快出现,有网友说,不同榜单标准不一样,前二到底是哪些维度?也有人提醒, ai 模型更新很快,排名只是阶段性的,这些声音其实都很正常。 但有意思的是,这次讨论并没有停留在你行不行上。更多人开始讨论的是另一件事, 那就是小米为什么要反复强调开源。不少评论提到,现在很多公司更愿意做闭源,把能力握在自己手里,而小米选择把模型开放出来,本身就是一种态度, 不是单纯秀成绩,而是想进入一个更大的技术生态。罗弗利在台上也提到,开源不是做慈善,而是一种加速方式。 这句话被很多网友单独简出来讨论,有人觉得理想主义,有人觉得这是长线打法,但不管站在哪一边,大家都认可一点,那就是小米这次是真的把 ai 放到了一个非常靠前的位置。还有一个 话题也被频繁提及,那就是罗弗利本人,九五后,女性,纯技术背景,从学校到大厂,再到今天站在舞台中央,很多人说这样的技术负责人本身就很有象征意义, 甚至还有人说他的发言风格让人想起早期的小米,反复强调长期投入,也有人提醒不要因为一个发布会就给任何公司下结论, ai 是 长期战,真正的考验在后面。但从舆论层面看,这次首秀已经达成了一个效果, 那就是小米的 ai 不 再是一个模糊的概念,而是有了具体的人,有了清晰的态度,也有了可以被讨论的坐标, 有人会继续质疑排名,有人会等待实际应用,也有人只是单纯记住了一个名字。但可以确定的是,从这场首秀开始,小米在 ai 这条路上已经很难再被忽视了,而罗弗利也注定会成为接下来一段时间里被反复讨论的人。

天才少女罗福利首秀称小米开源模型全球前二二零二五小女人车家全生态合作伙伴大会今日举行,罗福利首次登场称小米开源模型的代码能力和 aj 的 能力在世界级非常公开公正的评估榜单上已经进入了全球前二。 罗福利认为,下一代智能体系统不是一个语言模拟器,而是一个真正理解我们世界并与之共存的智能体。此前有传言称雷军以千万年薪挖角罗福利,但当时罗福利和小米集团并未正式回应。

在二零二四年,也就是去年,小米决定进入基座大模型的领域,今年小米陆续推出了咪蒙语言大模型、多模态大模型、语音大模型和巨型大模型,它全面开源赋能了我们的开发者,推出后呢也收到开发者的好评。 我想呢,昨天晚上大家呢都特别特别的关注,就是小米 vivo, vivo splash 的 模型已经正式开源上线, 今天呢,上午发现有特别多的热评,那么他是迈向 a 阵的时代的,全新的理念的基座, 也得到了大家对,我们这次处理的速度特别快,特别的成本特别低,我想呢,大家都倍受好评。一会呢,罗胡丽呢给大家做非常详细的介绍,他写总参数只有三百零九币,激活参数只有十五币, 但是它的代码能力和 age 的 能力在这些世界级非常公开公正的一些评估榜单上,在我来看,它已经进入了全球 top 一 二。 呃,开源模型当中的全球 top 一 二,哈,我们相信有这些能力的基础,它必须要产生交互的前提是它要有一个宏观的一个感知能力,也就说我们做一个统一的动态系统是非常必要的,它也是会为我们去理解整个世界一个很关键的基础。 从数据的极致压缩,到算法的范式创新,再到与物理空间的深度链接,小米与全球 ai 共同定义未来,谢谢大家。

本来没打算说小米 ai 开源大模型的,有粉丝想知道我对它的评价,我就客观的来说一下吧。小米千万年薪挖来的 ai 天才少女罗福林在昨天的发布会上宣布了小米 vivo v 二 flex 这个免费开源, 也有一些在测评的各种夸这个开源大模型,说算力快,所需费用低。我没有用过咪膜,但我之前用过其他的 g、 p、 d 和 deepsea 豆包等等,还在发布会上自称世界第二。 我给大家说一下,目前在 ai 这一块儿做的比较好的有阿里的前文亲爱的 gbt, 还有罗浮屠的钱东家做的 deep sack。 就 小米目前的研发的投入和成果说明我是世界第二,这个我是持怀疑态度的。

咱们今天借着罗夫利录制小米的事情,来聊一聊一个更大的话题。当下顶尖的 ai 科学家遇上了一个庞大的硬件帝国,到底能不能修成正果? 首先,咱们的读懂罗夫利迈去宣言里的雄心,他说智能终将从语言迈向物理世界。他本质上是说,过去几年我们引以为傲的大模型, 即使多数还停留在纸上谈兵阶段,他们能够写出华丽的诗篇,能够解答复杂的逻辑题,但他们依然被困在服务器的新篇里面, 是虚拟世界里面的幽灵和物理世界,是不满不确定性的厨房,是路况复杂的街道,是每个家庭成员都有不同 习惯的客厅。让 ai 在 这里发挥作用,是比通过任何考题都难上数倍的挑战。 那么小米能够提供什么呢?他提供的正是 ai 梦寐以求的肉身。小米的人车加生态里有手机、汽车、扫地机器人、智能音箱等等数以亿计的设备,这些设备就是 ai 感知世界作用于 世界的感官和手脚。罗夫利米莫团队的研究将不再仅仅是发表一篇顶尖的学术论文,而是可能直接让一辆汽车行驶能够拟人化。然而呢,理想很丰满,现实最大的挑战在于文化融合。这里我说的不是人际关系的文化, 而是硅谷研究文化。以深圳硬件文化的碰撞, ai 研究的文化追求的是前沿,是突破,是容忍失败。一个实验方向的失败,收获了经验,认为可能依然有价值。 它的节奏迭代、硬件制造文化追求的是稳定,是可靠,是成本控制。一辆车,一个家电,功能必须万无一, 他的生产链条很长,开模成本很高,他的节奏是交付,这就带来一个核心的矛盾,那我们再往远看,这场实验也预示着科技巨头对 a g i。 布局的不同判断。小米的路径是试图用海量的硬件终端形成一个包围圈,让 ai 无处不在的 生长出来。所以罗富力的入职是一个标志性的事件,它标志着小米不再满足将 ai 作为手机的卖点或者语音助手的功能。如果它成功了,将证明软硬件结合是通往 a g i。 成功的大道 和他的任何挫折也将成为整个行业反思这种路径价值的重要参考。我们关注的不仅仅是一个天才研究员的职业选择,我们是在目睹一场正在进行的关键探索。当虚拟的智能灵魂试图注入庞大的硬件躯体, 他究竟会步履蹒跚,还是真正能够奔跑起来直至起飞?这个问题只有时间才能给出答案。


我想跟大家回顾一下,在二零二零年我刚去进入大模型这个领域的时候,一开始也是去做开元模型,那会的开元模型距离世界顶尖的闭元模型的代差我认为至少有三年。 但是如今大家都能看到中国像 deepsea, q n g n, me max 等等包括 me 某在内的开元模型,其实距离世界的顶尖的闭元模型的差距,可能这个差距只有数月了。 我们相信开源的价值并不仅仅是说我们分享了模型,分享了代码。开源的价值本质上是一种分布式的、技术的加速的主义。我认为开源是实现 a g i。 的 普绘化,是确保所有人类的智慧共同进化的唯一路径。 从数据的极致压缩,到算法的范式创新,再到与物理空间的深度链接,小米与全球 ai 共同定义未来。