粉丝1.2万获赞1.7万

今天我们使用两台音箱来组建一个立体声同步播放手机里面的音乐。啊,我左边这个是小米智能音箱,右边这个是小米智能音箱 pro, 让我们期待一下效果。先将两台音响都绑定在米家 app 中,点击任意一台音响 开始播放音乐。选择这里的全屋播放,选择需要播放的音响。

小爱同学在关闭电视。好的,如果你刚好在家里面刷到这条抖音,是不是我把你们家的电视控制了?哈哈哈,现在的小米电视基本上都带这个小爱语音音箱的功能, 如果你喊了小爱同学没反应的话,那么怎么操作呢?在小米的设置里面里面有一个小爱同学打开 把这个语音唤醒开关,打开麦克风已启动,这样就启动了麦克风,然后里面还有相关的设置语音关机,可以设置成息屏或者是关机, 如果设置熄屏的话,他屏幕熄了,但是小爱同学是还可以唤醒的。播放音乐的默认应用可以根据自己的安装的应用去选择语言设置,只有普通话和方言音色 可以选择。小爱同学回你声音的音色,声纹实验室像我刚刚这样设置的,咱们现在把遥控器把电视关掉啊,这样子他电视他是息屏状态,但是你喊小爱同学他是还有反应的,比如说要控制什么家电啊, 那么就选择息屏,如果电视设置关闭的话,它就没用。小爱同学在打开餐厅灯啊,这样子就比较方便。

好,我现在给大家装车一下。嗯,我现在相机放在我的中控台上面了, 这是我的车机平板,我打算给它装在这个位置这个背后看视频发现它这有一个隐藏式的一个装法啊,这样,那个我虽然买是挂平板,但是它是可以靠胶粘在这个背后实现这个隐藏式的效果。我打算试一下,看这个胶粘的牢不牢。因为它送的是三 m 的 胶, 商家说是正版三 m, 这个粘性特别大,这个粘性确实有点大,撕都撕不下来。你先找准最中间的位置给它对上去一下,同时也要保证它是水平的啊,过了以后确实是很难动的,所以一定要先提前对准好位置,在胶没有撕下来的时候要提前找好位置, 我刚刚已经拍视频,之前我已经找好几次了,然后就是下面这里的话要给他固定了。嗯,整体粘的感觉还可以吧。 好的,来给大家看一下啊,我是水平,这和这个屏幕看出来效果有点缝隙,不知道还能调整一下不,然后这个背面的效果给大家看一下啊,差不多是这样的效果,可以看一下啊, 它主要靠这两块胶给它支撑在这里,不知道这两块胶的寿命怎么样,如果寿命够好的话,因为车内到夏天以后温度特别高的很多胶的话,到了夏天它会被太阳晒的直接失效,不知道老板这两块胶怎么样,你干嘛?哈哈, 好的,这个就是安装好以后的效果啊,上个视频当中有人说没有帽子,没有发光,耳机不好看,正好这有个喝剩下的咖啡杯子杯垫, 用来充当他的帽子感觉也挺有意思的,刚刚我在安装的过程当中也发生了很多意外,跟大家讲一下,首先他这里你想给他做了这种隐藏式的效果, 这个胶的位置要调整好,还有就是如果你的车机屏幕是带旋转的话,你下方旋转的口就是一定要预留好充足的位置,以避免旋转过程当中把这个你的宝机器人给他打掉了。这是我遇到的一些问题,给大家演示一下他车机上播放音乐它的效果吧。小爱同学,播放音乐, 音乐来了, 小爱同学来了,停止播放,搞定了。好的,这个是车外的展示效果,我的是挂平板,然后大家可以看一下这个线路的隐藏情况,我个人觉得效果其实还是蛮不错的,因为现在是晚上嘛,在地下车库也看不太清楚,等有空的时候白天给大家补一张照片啊。我觉得整体效果其实还是可以的。 好的,车内效果和车外效果都给大家展示了一下,目前我使用过程当中发现还是有一些小 bug 存在,商家也跟我说这些 bug 后续可以通过 ok 去修复,具体什么时候也要看商家那边怎么去安排, 别的问题都不是很大。在车内去唤醒这个动作是比较灵敏,比在室内在别的地方要好一点,给大家演示一下啊。小爱同学,晚上好!你好,小迪来了, 小爱同学,晚上好!你好,小迪,在大家可以看到他还是比较灵敏的,你每一次唤醒时他都会去配合你去有一个动作,这点我感觉还是蛮好的。好的,本期视频就要结束了,看到最后的家人们,我想问一个问题,如果是你的话,你愿意去为了这样的情绪价值产品买单吗?

很多朋友担心家里放多个小爱同学会被同时唤醒,就像这样。小爱同学,哎我在。其实只要打开小爱音箱 app, 点击我的点击就近唤醒, 打开旧金唤醒开关,就不会出现这种情况。小爱同学在作为智能生活助手的小爱同学建议每个房间都放一个。

小爱同学对我们来说真的非常的方便,平时大多数都是唤醒小爱同学帮我做。小爱同学,哎。关闭音乐,打开方向盘夹子,打开座椅通风,打开了一会就暖和了,指令做完了,他还没完全退出,有时候我们跟身边人聊天 或者打电话的时候,他就会时不时出来插话,这个时候就很烦,怎么才能避免这个情况?打开设置,找到超级小爱,把连续对话默认的二十秒直接关闭。小爱同学播放音乐,打开后排车窗, 打开后排阅读灯,你看我把连续对话已经选择关闭,但是它可以仍然完成一系列的指令,它完成你下达的指令之后就会自动退出,不会再啰嗦。关注我,分享更多优期用车小技巧!

小艾教你避免一呼百应,打开小艾同学,在我的中找到设置,点击语音唤醒,开启多设备协同唤醒,小艾音箱也是同理,点击右上角设置, 找到唤醒与通话,打开协同唤醒,这样小爱就会乖乖的啦!

观众朋友大家好,今天我做这个视频想要解决小米有史以来一直存在并且影响很深远的一个问题,就是视频播放当中涉及到小爱同学的这个唤醒词的时候,我们其他这个设备,无论是小米的手机、平板电视还是音箱,他都会被唤醒,然后问你,哎,干什么是吧? 这个问题我希望能够解决啊,如果真的在我的这个提议和帮助下解决了啊,能不能考虑把这个小米百万美金技术大奖分我一点点,对吧?啊,我也算这个团队当中的一份子啊。 啊,那首先我们说一个最常见的问题,就是雷总开发布会啊,他提到好几次这个小爱同学怎么怎么样,我记得最夸张的一次就是有上千万的这个设备同时被唤醒,导致小爱同学当机了, 就是你那时候再说小爱同学,他没有反应了,那我是特别喜欢看雷总和小米这个发布会的,经常他们会提及小爱同学,所以呢,经常会唤醒我的各种设备。那么我觉得第一个你可以做的就是发布会啊,你要知道是哪些主持人啊,他会上台说到这个小爱同学,你就进行一个规避,因为你这个 主持人的这个声纹啊,和他这个发布会的时间,这两个条件一确定,你就可以啊,做一个降低敏感度的处理。哎,那你如果在这个时段听到这个雷军的这个声音,他在那叫,要不他在那说小爱同学,这时候你就不要唤醒,对吧?这是最简单粗糙最暴力最无脑啊,也是最直接的一个办法 啊,这个不是特别好的办法,现在我们再说第二点啊,第二点非常好的办法,就是你自己的这个小米的手机 电脑在播放这视频的时候,如果这个视频里面他所提到小爱同学,这个时候因为你是你自己设备播放的,你自己可以很轻松的搞懂,这是啊不应该被召唤的,这个时候你的什么音箱啊、电视啊,包括说我是在车里看啊,那那个车里的那个小爱同学,他就不应该被召唤,对吧? 这个东西是绝对应该要去做的这个设置。第三个呢,就是在用户这一端可以设置一个呃,属于他的这个声纹啊,比如说我做的我的小米苏西这个主架,我经常坐在那休息,然后听着那个呃,雷总发布会也好,或者说别人做的一些小米相关的评测也好。提到了这个小爱同学, 这个时候你想呃我那个车子,我所设置的是我扫码,我扫码登录的我自己的账号, 那么我是不是可以设置一个声纹,我作为主驾坐在这的时候,那你其他的一个人声在主驾这个位置发出这个声音召唤小爱同学,他就不应该响应了,对不对? 同理,你的这个手机,你的这个平板,你的这个电脑,我在说小爱同学的时候,他是不是不应该被别人召唤啊?对吧?这是呃,很需要做的一个事情,我觉得这个 也是很好去做的事情。然后第四点啊,有些语句天然的就可以判断出他不是召唤,比如我们说这样的一句话,我们说小爱同学有视频误触发的这个问题,对吧?那我这个小爱同学前后是有词汇, 那我这句话的这个小爱同学,他前面后面都是有语句的,正常来说你要召唤小爱同学,你说小爱同学,对吧?他前面后面都是有留白的,都是有停顿的,但有的人他可能说,小爱同学帮我洗碗怎么样,对吧?他可能后半段他是连成一个句子的,但是他前面他总会有停顿的,通过这样的这个句间的这个判断,你可以知道他是不是在召唤你 啊?这是第四点,但是第五点呢,是一个最终的形态。就是我们来问这样一个问题啊,假设在这样一个场景当中,一个房间里有个人在说话,那么同样是在这个房间当中,现在变成一个手机在播放这个人讲话的这个视频,那么 我们假设一个正常人啊,他闭上眼睛过来,能否分得出哪个是人讲话,哪个是视频在播放人声,对吧?因为现在我们要解决问题就是这些电子设备播放出这个人声的问题。 如果说一个正常的人,他能够区分两者,这个是电子设备发出声音,这个是正常人说的这个声音,对吧?他两只耳朵就能很轻松的区分出来。 那么经过啊模型的训练,这个电脑也一定具备这样的能力,可以把两者区分开。那么我也问了下 gpt, 我 说啊,这个答案是什么?他说大多数情况下,正常人闭上眼睛都是能分出来的,尤其是在同一房间,距离不远,环境比较安静的时候。 原因很简单,真人说话的时候和手机放出来这个人声啊,在声学特征上差别很大。真人讲话有几个特点,第一,声音是从人的口腔、胸腔、鼻腔自然发出来的,声源体积更大, 低频和中频更自然。手机扬声器很小,低频弱,声音会更薄、更扁、更尖一些。对,特别是这个手机,应该是占了绝大多数这个误触的这个场景,因为大多数人看视频就是用手机看的,对吧? 第二点,真人声音会随着头部、身体、嘴巴方向变化而有细微变化,对吧?啊,比如他转头、低头,身体晃动,声音方向和反射都会发生变化。手机播放通常时间固定在手机位置,变化少,这个我觉得比较难。第三,真人说话有真实的空间感, 你能感觉声音来自一个人的身体的位置,而手机播放则更像是从一个小点出发生长窄。第四,手机扬声器有压缩、失真和限频, 视频声音经过录音、压缩、播放三道处理,通常会丢掉很多细节,比如气息、齿音、胸腔共鸣啊,房间混响层次,这我觉得这个也比较重要,所以在普通条件下闭眼听大概能分辨出来, 哎。但是有一些情况也会很难区分啊,就是手机音质很好,音量调的很接近真人啊,手机放在人原本说话的这个位置啊,视频录音质量很高,房间里有混响,就是有其他声音啊,那这个可能短时间分辨不出来, 尤其是如果只听一两秒啊,或者内容本身就是普通说话声怎么怎么样,哎,其实这个不是一两秒啊,就是你这些音箱,比如小米音箱,它在监测这个小爱同学的时候,它是连续的,连续监测的,我播放一个视频也是连续播放的,对吧? 连续播放一个节目,所以他能够检测有充分的时间来检测他是不是处在一个播放视频的一个状态,而不是说只有小爱同学的一两秒那个声音啊,去检测他,他不是的,所以他其实有充分的时间去检测他是不是一个视频,所以呢,经过模型的训练,他就能做出这个区分出来, 所以我的结论是这个问题早就应该解决了,而且他就应该立马引起重视并且于解决,然后呢,解决这个问题也是可行的。这就是我今天这个结论 啊,希望能分我一点点。分一万美金也可以啊,对吧?就百万美金大奖啊。谢谢雷总啊,谢谢各位小米集团的这工作人员,也谢谢各位观众的厚爱啊。视频先到这里,我是妄图,我们下期视频再见。拜拜。