专利基于改进YOLOV4的水下目标检测方法

(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202111664231.9 (22)申请日 2021.12.3 0 (71)申请人华南理工大学地址 510640 广东省广州市天河区五山路 381号 (72)发明人王豪　肖南峰　 (74)专利代理机构广州市华学知识产权代理有限公司 4 4245 代理人冯炳辉 (51)Int.Cl. G06V 20/00(2022.01) G06V 10/762(2022.01) G06V 10/80(2022.01) G06V 10/82(2022.01) G06K 9/62(2022.01)G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称基于改进YOLOV4的水下目标检测方法 (57)摘要本发明公开了一种基于改进YOLOV4的水下目标检测方法，包括： 1)前期数据处理，包括对原始数据集进行Albumentations数据增强和 Retinex数据增强，将处理后的数据集通过k ‑ means聚类算法对数据集中的边界框进行聚类； 2)把聚类结果作为改进YOLOV4的边界框大小，将处理后数据集输入到主干网络模块，通过主干网络模块获取目标的特征信息，将提取的特征信息输入到特征提取模块，特征提取模块进行不同尺度的最大池化和融合操作，特征融合后的信息进行卷积运算，得到不同尺度的特征层输出，最终由预测模块对输出的数据进行信息分析和处理，得出检测结果。本发明具有了深度学习技术的特性，通过训练可以不断优化网络，提高检测能力。权利要求书1页说明书4页附图2页 CN 114373118 A 2022.04.19 CN 114373118 A 1.基于改进YOLOV4的水下目标检测方法，其特征在于，该方法是基于改进YOLOV4实现水下目标的精准检测，该改进YOLOV4是对原来YOLOV4的主干网络模块、特征提取模块和预测模块都进行了改进，其中，对主干网络模块的改进是：加入深度可分卷积，并且把原来的激活函数改为DyReluB激活函数；对特征提取模块的改进是：在最大池化层后加入通道关注的注意力机制网络；对预测模块的改进是：增多了一个检测小目标样本的YOLO头部；该水下目标检测方法的具体实施包括以下步骤： 1)前期数据处理，包括对原始数据集进行Albumentations数据增强和Retinex数据增强，将处理后的数据集通过k‑means聚类算法对数据集中的边界框进行聚类； 2)把聚类结果作为改进YOLOV4的边界框大小，然后将处理后数据集输入到主干网络模块，通过主干网络模块获取目标的特征信息，将提取的特征信息输入到特征提取模块，特征提取模块进行不同尺度的最大池化和融合操作，特征融合后的信息进行卷积运算，得到不同尺度的特征层输出，最终由预测模块对特征提取模块输出的数据进行信息分析和处理，得出检测结果。 2.根据权利要求1所述的基于改进YOLOV4的水下目标检测方法，其特征在于，在步骤1) 中，所述Albumentations数据增强的情况是：对原始数据进行行逐像素的转换和空间转换；所述Retinex数据增强的情况是：水下成像的背景为蓝色或绿色，因此要进行复原，修正图像色度，提升图像对比度，使图像拥有更好的视觉效果，更加明显的图像细节；通过上述两个数据增强，能够提高改进Y OLOV4的泛化能力，防止过拟合；将经过增强后的数据集使用k ‑ means聚类算法对数据集中的边界框进行聚类，获得12个聚类结果。 3.根据权利要求1所述的基于改进YOLOV4的水下目标检测方法，其特征在于，在步骤2) 中，经过前期处理后的数据集输入到主干网络模块中，主干网络模块读取输入的图像信息，进行5次下采样，获取不同尺寸目标的特征信息，主干网络模块包括CSPX模块和CBDW R模块，其中CSPX模由卷积层和残差模块拼接组成， CBDWR模块包含依次连接的卷积层、标准化层、深度可分卷积、标准化层和DyReluB激活层，该CBDWR模块中加入了深度可分卷积和DyReluB 激活层，使得主干网络模块的信息读取能力更强；特征提取模块是将主干网络模块输出的特征信息作为输入，把不同尺度的特征图进行融合，特征提取模块在改进Y OLOv4中的目的是增加网络的感受野，更好地提取融合特征，提升性能，不同尺度的特征图的处理不会改变输入图像的尺寸，每个最大池化结果都是512个通道，在最大池化后加入通道关注的注意力机制模块，这能适当地跨信道交互降低网络复杂度，同时获得性能提高；预测模块是将特征信息通过上采样的方式进行传递融合成特征图，得到特征图后进行预测，最后采用非极大值抑制方法并调整先验框来确定最终的结果，预测模块包含4个Y OLO 头部，而YOLO头部由卷积层和CBDR模块组成， CBDR模块包括一个卷积层、一个标准化层和一个DyReluB激活层，改进YOLOV4在预测模块中增多了一个专门用来检测小目标样本的YOLO 头部，即把原来YOLOV4的头部尺度由19 ×19、 38×38、 76×76扩展为19 ×19、 38×38、 76× 76、 152×152四个维度，有利于对水下小目标的检测。权　利　要　求　书 1/1 页 2 CN 114373118 A 2基于改进Y OLOV4的水下目标检测方法技术领域 [0001]本发明涉及深度学习图像处理的技术领域，尤其是指一种基于改进YOLOV4的水下目标检测方法。背景技术 [0002]在现代社会大部分海洋生物具有一定的经济价值，充分利用和保护海洋生物，有效监测海洋生物生长，做出科学有效的管理方案显得尤为重要。人工检测方法成本高，耗费时间，而且精度低下；另一方面，随着观测规模的增加，这种方法越来越不可行。目前，目标检测技术的飞速发展，其应用的范围也越来越大，水下目标检测在海洋环境探索，生态保护，渔业养殖辅助等方面发挥着越来越重要的作用。海洋生物资源丰富多样，为了更好地了解、利用和保护这些有限资源，传统的方法是通过肉眼观察图片或者视频来获取相关水下生物的生长情况。但是这种方法存在不足，在光照条件不足和部分遮挡的时候，产生的图像通过肉眼难以识别，而且效率很低。因此，把目标检测的技术应用到水下环境的探索十分有必要。 [0003]在2016年，有学者提出了深度学习时代的单阶段模型Y OLO(You Only Look Once) 和后来的YOLOv2、 YOLOv3。以及SSD、 Retina Net等目标检测算法。 2017年，相关学者提出基于候选区域提出的RCNN和Fast R‑CNN。目标检测一般分为一阶检测器和二阶检测器，一阶检测器是直接对特征图像上的每个位置进行类别预测，而二阶检测器是首先使用候选框生成器生成稀疏的候选框集，然后使用深度卷积网络编码生成候选框的特征向量，最后使用区域分类器预测候选框区域类别。二阶检测器代表性算法为R ‑CNN、 fast R‑CNN、 faster R‑ CNN等。一阶检测器代表性算法有YOLO系列、 SSD、 RetinaNet等。考虑到实时性和准确性的要求，本文选择YOLOv4 算法来实现水下目标检测。 [0004]人们一直在探索水下的环境，而我们常用的检测算法和理论在一定的程度上受到了很多限制。由于水下环境比陆地上要复杂的多，在水下没有光源的情况下，水下的视频采集系统必须依赖人造光源提供照明，光在水中传输时又会受到水的吸收、反射和散射等影响而发生严重的衰减，采集到的水下图像难免会出现可见范围有限、模糊不清、低对比度、非均匀光照、色彩不协调及噪声等问题。 [0005]随着深度学习技术逐渐崛起，智能算法被应用于各种生活的场景。本发明出一种基于改进Y OLOV4的水下目标检测方法来检测四种水下生物：海参、水草、海胆、扇贝和海星。首先，在主干网络模块加入深度可分卷积；在特征提取模块中增加通道关注的注意力机制，提升效果显著；在预测模块增多了一个YOLO头部，有利于对小目标的检测。其次，使用k ‑ means聚类算法对数据集中的边界框进行聚类，根据聚类结果作为改进YOLOV4的边界框。改进后的YOLOV4方法在水下目标检测的准确率更高，泛化能力好。发明内容 [0006]本发明的目的在于针对现有的YOLOV4模型特点，考虑水下目标检测的光线条件说　明　书 1/4 页 3 CN 114373118 A 3

专利 基于改进YOLOV4的水下目标检测方法

专利基于改进YOLOV4的水下目标检测方法