00:00 / 00:48
连播
清屏
智能
倍速
点赞85
00:00 / 00:39
连播
清屏
智能
倍速
点赞13
YOLOv13最新创新改进——双卷积核(DualConv) YOLOv13最新创新改进系列:双卷积核(DualConv)结合了 3×3 和 1×1 卷积核来同时处理相同的输入特征图通道,旨在构建轻量级深度神经网络,目标检测YOLOv13有效涨点神器!! CNN 架构通常对内存和计算要求很高,这使得它们对于硬件资源有限的嵌入式系统不可行。 我们提出双卷积核(DualConv)来构建轻量级深度神经网络。 DualConv 结合了 3×3 和 1×1 卷积核来同时处理相同的输入特征图通道,并利用组卷积技术来有效地排列卷积滤波器。 DualConv 可用于任何 CNN 模型,例如用于图像分类的 VGG-16 和 ResNet-50、用于对象检测的 YOLO 和 R-CNN 或用于语义分割的 FCN。 在本文中,我们广泛测试了 DualConv 的分类功能,因为这些网络架构构成了许多其他任务的骨干。 我们还在 YOLO-V3 上测试了 DualConv 的图像检测功能。 实验结果表明,结合我们的结构创新,DualConv 显着降低了深度神经网络的计算成本和参数数量,同时在某些情况下令人惊讶地实现了比原始模型略高的精度。 我们使用 DualConv 将轻量级 MobileNetV2 的参数数量进一步减少了 54%,而在 CIFAR-100 数据集上的准确率仅下降了 0.68%。 当参数数量不是问题时,DualConv 在相同数据集上将 MobileNetV1 的准确率提高了 4.11%。 此外,DualConv 显着提高了 YOLO-V3 目标检测速度,并将其在 PASCAL VOC 数据集上的准确率提高了 4.4%。#YOLO
00:00 / 06:19
连播
清屏
智能
倍速
点赞44
YOLOv13最新创新改进——LDConv创新 YOLOv13最新创新改进:采用LDConv线性可变形卷积改进传统卷积,为卷积采样形状提供更多探索选项,突破卷积操作的极限,提升目标检测精度与效率。 基于卷积操作的神经网络在深度学习领域取得了显著成果,但标准卷积操作存在两个固有缺陷。一方面,卷积操作局限于局部窗口,因此无法捕捉其他位置的信息,且其采样形状是固定的。另一方面,卷积核的大小固定为 (k \times k) 的正方形,参数数量随着大小的平方增长。尽管可变形卷积(Deformable Conv)解决了标准卷积固定采样的问题,但其参数数量仍呈平方增长,且未探索不同初始采样形状对网络性能的影响。 针对上述问题,本文提出了线性可变形卷积(Linear Deformable Convolution,简称 LDConv)。LDConv 赋予卷积核任意数量的参数和采样形状,为网络开销与性能的平衡提供了更丰富的选择。在 LDConv 中,定义了一种新型坐标生成算法,用于生成任意大小卷积核的不同初始采样位置。为适应目标变化,加入了偏移量(offsets),以调整每个位置的采样形状。LDConv 将标准卷积和可变形卷积参数数量的平方增长趋势改为线性增长。相比于可变形卷积,LDConv 提供了更丰富的选择,并在参数数量等于 (k^2) 时可等效于可变形卷积。此外,本文还探索了在相同卷积核大小下使用不同初始采样形状的神经网络性能。通过不规则卷积操作完成高效特征提取,LDConv 为卷积采样形状提供了更多探索选项。 #YOLO
00:00 / 10:06
连播
清屏
智能
倍速
点赞18
大家好,本期带小白做程序设计,本期是基于 YOLO 深度学习的饺子数量检测系统微信小程序。采用 YOLOv8n + PyTorch 构建目标检测模型,Flask 提供后端推理服务,微信小程序原生框架构建前端界面;模型层采用 CBAM 注意力机制优化密集目标检测能力;系统支持图像采集、实时检测、数量统计、密度评估、历史记录、数据可视化等完整业务闭环,演示 AI 视觉检测在餐饮智能化场景的设计与实现。有需要点个关注哦。 【核心功能】 图像检测模块:支持相机拍照、相册选择两种图像输入方式,上传后自动调用 YOLO 模型进行目标检测,返回饺子数量、位置坐标、密度评估结果,检测结果可视化标注展示; 数量统计模块:实时显示检测到的饺子总数,支持密度分类(稀疏/密集/严重拥挤),坐标位置详情展示,点击标记点高亮显示对应饺子位置; 统计报表模块:检测次数/累计饺子数/平均准确率统计卡片、密度分布柱状图、模型性能指标环形图(mAP/Precision/Recall)、检测历史记录列表; 技术方案模块:算法改进方案展示、网络结构流程图、数据集构建信息(2156张图像/8:1:1划分)、训练配置参数、训练曲线可视化、模型评估指标对比; 项目介绍模块:课题作用与意义、技术架构展示、研究难点与解决方案、学生信息展示,完整呈现毕业设计研究内容。 【业务流程】 图像检测流程:选择拍照或相册→获取图像→上传至服务端→YOLO 模型推理→返回检测结果→前端渲染标记点→显示数量与密度; 模型推理流程:图像预处理(Resize 640×640)→Backbone 特征提取→CBAM 注意力增强→多尺度检测头→NMS 后处理→输出坐标与置信度; 数据集构建流程:网络爬取+自行拍摄→LabelImg 标注→数据清洗→8:1:1 划分→数据增强(旋转/裁剪/亮度调整)→生成 YOLO 格式标签; 模型训练流程:加载 COCO 预训练权重→迁移学习微调→余弦退火学习率→监控 mAP/Loss→早停防止过拟合→导出最优权重; 端侧部署流程:PyTorch 模型导出→TNN 格式转换→小程序端加载→图像推理→结果解析→界面渲染。 【技术亮点】 YOLOv8n 轻量化模型:仅 6.2MB 模型大小,3.2M 参数量,45 FPS 推理速度,适合移动端部署; #软件开发 #网站开发 #网页设计
00:00 / 00:27
连播
清屏
智能
倍速
点赞1