00:00 / 00:38
连播
清屏
智能
倍速
点赞135
00:00 / 02:10
连播
清屏
智能
倍速
点赞9
Siri的语音交互看似简单,背后却是一套软硬件深度协同的精密系统。从你开口说出“嘿 Siri”到耳机触发响应,每一个环节都涉及低功耗检测、音频传输协议和云端智能的复杂配合。 🎙️ 语音唤醒:永远在线的“耳朵” Siri的唤醒功能依赖于一个始终低功耗运行的检测系统,核心是两步唤醒机制: · 第一步:协处理器初步检测:iPhone等设备内置了M系列运动协处理器(AOP),它功耗极低,能全天候监听麦克风信号。当你说出“嘿 Siri”,AOP上运行的一个参数仅32个神经元的小型神经网络会进行初步识别。一旦达到阈值,它就会唤醒主处理器。 · 第二步:主处理器精确验证:主处理器启动后,会调用一个包含192个神经元的更大、更精确的深度神经网络,对音频进行二次确认。这个过程不仅识别语音内容,还会通过注册时的声纹信息验证说话人身份,防止他人误唤醒你的手机。 🎧 耳机触发:按键背后的“暗号” 通过耳机唤醒Siri主要有两种方式,其原理截然不同: · 有线耳机:操作耳机线控上的中间按键(应答键),会通过耳机插头特定的电路闭合,向手机发送一个模拟电压信号。手机硬件检测到该信号后,将其解析为固定的“开始语音输入”指令,从而启动Siri。 · 蓝牙耳机(如AirPods):当你长按耳机柄或敲击耳机时,耳机内部的芯片会将其转换为遵循HFP(免提规范)或自定义扩展协议的数字指令。该指令通过蓝牙低功耗通道迅速发送给手机。系统内核接收到这个带有特定识别码的指令包后,便直接唤醒Siri服务。 🎤 音频传输:麦克风声音如何“抵达”手机 耳机麦克风采集的语音需要高效、保真地传输给手机,这背后的协议是关键: · 有线连接:现代Lightning或USB-C接口耳机,通常采用MIPI SoundWire或I²S(集成电路内置音频总线)协议。SoundWire是一种低能耗、低延迟的双线接口,能同时传输多个音频流与控制命令,确保你的指令清晰无误地送达。 · 无线连接:蓝牙耳机采集的语音经过DSP(数字信号处理)降噪后,会被编码(如通过高采样率48kHz的编解码器)并打包。随后通过2.4 GHz频段的蓝牙链路实时传输给手机,整个过程延迟通常控制在5ms以内,以保证交互的流畅感。 🔄 上下行交互:完整的对话闭环 Siri的完整交互是一个从本地到云端再返回的循环: 1. 上行链路(你的声音
00:00 / 03:45
连播
清屏
智能
倍速
点赞2
00:00 / 00:43
连播
清屏
智能
倍速
点赞35
00:00 / 01:32
连播
清屏
智能
倍速
点赞187
00:00 / 00:38
连播
清屏
智能
倍速
点赞6