SCI剖析:TI-YOLO——问题针对性强! 一、问题针对性强,临床价值明确 聚焦临床痛点:气管插管(TI)中快速、准确地识别声门等解剖结构对患者安全至关重要,但现有视频喉镜视野有限、计算资源受限,尤其在困难气道场景下挑战巨大。 目标务实:提出一种轻量化、高效率的目标检测模型TI-YOLO,在保证精度的同时满足嵌入式平台实时推理需求,具有很强的临床转化潜力。 二、模型创新点显著,技术组合合理 基于YOLOv11的轻量化改进 使用MobileNetV4重构主干网络,大幅降低参数量和计算量(参数减少28.9%,FLOPs减少10.5%),模型权重仅4.6 MB。 多尺度特征融合(BiFPN) 替代传统FPN/PAN,引入可学习融合权重的双向特征金字塔,提升对不同尺度解剖结构(如会厌、声门、牙齿)的检测能力。 可变形注意力Transformer(DAT) 在检测头前集成DAT模块,通过稀疏、自适应的采样点聚焦关键解剖区域,增强对遮挡、尺度变化和运动模糊的鲁棒性。 Slide Weight Function(SWF)损失函数 缓解类别不平衡问题,动态为难样本赋予更高权重,提升对稀有但关键结构(如Cormack-Lehane 3级声门)的学习效果。 量化感知训练(QAT) 采用INT8量化,在嵌入式平台(OrangePi 5)上实现超过50 FPS的推理速度,且模型压缩至2.9 MB,兼顾精度与实时性。 三、实验设计严谨,评估全面 数据集:自制喉镜数据集(4140张图像,8类解剖结构+CL分级),采用五折交叉验证,避免过拟合。 对比基线:与YOLOv5n、v8n、v10n、v11n等主流轻量检测器进行全面对比。 评价指标丰富:不仅使用mAP50、mAP50:95,还报告Precision、Recall、FLOPs、参数量、模型大小、FPS,兼顾精度与效率。 消融实验:逐一验证BiFPN、DAT、SWF模块的贡献,并展示两两组合及三者联合的效果,证明各模块互补且有效。 嵌入式部署实测:在OrangePi 5上测试真实帧率,并展示部署后的识别效果图,极具说服力。
00:00 / 05:29
连播
清屏
智能
倍速
点赞100
00:00 / 02:52
连播
清屏
智能
倍速
点赞815
00:00 / 03:01
连播
清屏
智能
倍速
点赞NaN
00:00 / 01:41
连播
清屏
智能
倍速
点赞7004