专利图像特征融合及模型训练方法、装置、设备以及存储介质

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202211067385.4 (22)申请日 2022.09.01 (71)申请人阿波罗智联（北京）科技有限公司地址 100176 北京市大兴区北京经济技术开发区瑞合西二路7号院1号楼1层101 (72)发明人夏春龙　 (74)专利代理机构北京柏杉松知识产权代理事务所(普通合伙) 11413 专利代理师丁芸　马敬 (51)Int.Cl. G06V 10/80(2022.01) G06V 10/82(2022.01) G06V 10/764(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称图像特征融合及模型训练方法、装置、设备以及存储介质 (57)摘要本公开提供了一种图像特征融合及模型训练方法、装置、设备以及存储介质，涉及图像处理技术领域，尤其涉及计算机视觉、深度学习等领域。具体实现方案为：获取不同感受野的图像特征；利用不同感受野的图像特征中的底层图像特征，对不同感受野的图像特征中的高层图像特征进行通道信息增强，得到通道信息增强后的增强高层特征；其中，高层图像特征的感受野大于底层图像特征的感受野；利用不同感受野的图像特征中的高层图像特征，对不同感受野的图像特征中的底层图像特征进行空间信息增强，得到空间信息增强后的增强底层特征；将增强高层特征和增强底层特征进行融合，得到融合后特征。本公开能够更好地进行图像特征融合，提高图像特征的准确性。权利要求书5页说明书16页附图5页 CN 115482443 A 2022.12.16 CN 115482443 A 1.一种图像特征融合方法，包括：获取不同感受野的图像特征；利用所述不同感受野的图像特征中的底层图像特征，对所述不同感受野的图像特征中的高层图像特征进行通道信息增强，得到通道信息增强后的增强高层特征；其中，所述高层图像特征的感受野大于所述底层图像特征的感受野；利用所述不同感受野的图像特征中的高层图像特征，对所述不同感受野的图像特征中的底层图像特征进行空间信息增强，得到空间信息增强后的增强底层特征；将所述增强高层特征和增强底层特征进行融合，得到融合后特征。 2.根据权利要求1所述的方法，其中，所述获取不同感受野的图像特征，包括：获取待处理图像，将所述待处理图像输入用于图像特征融合的模型，通过所述用于图像特征融合的模型中的特征提取网络，提取所述待处理图像的不同感受野的图像特征；所述利用所述不同感受野的图像特征中的底层图像特征，对所述不同感受野的图像特征中的高层图像特征进行通道信息增强，得到通道信息增强后的增强高层特征，包括：通过所述用于图像特征融合的模型中的通道注意力网络，利用所述不同感受野的图像特征中的底层图像特征，对所述不同感受野的图像特征中的高层图像特征进行通道信息增强，得到通道信息增强后的增强高层特征；所述利用所述不同感受野的图像特征中的高层图像特征，对所述不同感受野的图像特征中的底层图像特征进行空间信息增强，得到空间信息增强后的增强底层特征，包括：通过所述用于图像特征融合的模型中的空间注意力网络，利用所述不同感受野的图像特征中的高层图像特征，对所述不同感受野的图像特征中的底层图像特征进行空间信息增强，得到空间信息增强后的增强底层特征；所述将所述增强高层特征和增强底层特征进行融合，得到融合后特征，包括：通过所述用于图像特征融合的模型中的融合网络，将所述增强高层特征和增强底层特征进行融合，得到融合后特征。 3.根据权利要求2所述的方法，其中，所述通道注意力网络包括全局池化层、第一感知层和归一化层；所述通过所述用于图像特征融合的模型中的通道注意力网络，利用所述不同感受野的图像特征中的底层图像特征，对所述不同感受野的图像特征中的高层图像特征进行通道信息增强，包括：利用所述全局池化层对所述底层图像特征进行全局池化操作；利用所述第一感知层基于全局池化操作后的结果，通过全连接操作，得到与所述高级图像特征的通道维度一致的列向量；利用所述第一归一化层对与所述高级图像特征的通道维度一致的列向量进行归一化操作，得到第一归一化后的列向量，所述第一归一化后的列向量中的值表示通道重要度系数；所述空间注意力网络包括第二感知层和所述第二归一化层；所述通过所述用于图像特征融合的模型中的空间注意力网络，利用所述不同感受野的图像特征中的高层图像特征，对所述不同感受野的图像特征中的底层图像特征进行空间信息增强，包括：权　利　要　求　书 1/5 页 2 CN 115482443 A 2利用所述第二感知层对所述高层图像特征进行全连接操作，得到与所述底层图像特征的空间维度一致的列向量；利用所述第二归一化层对所述与所述底层图像特征的空间维度一致的列向量进行归一化操作，得到第二归一化后的列向量，所述第二归一化后的列向量中的值表示空间重要度系数。 4.一种用于图像特征融合的模型训练方法，包括：获取多个样本图像以及各个样本图像对应的标签；针对各个样本图像，将所述样本图像输入用于图像特征融合的模型，得到融合后特征；基于所述融合后特征进行图像处理，得到图像处理结果；计算所述图像处理结果与所述样本图像对应的标签之间的差异；基于所述差异调整所述用于图像特征融合的模型的模型参数；基于调整后的模型参数以及所述多个样本图像，继续进行模型参数的调整过程，直至满足预设迭代结束条件；将满足预设迭代结束条件时所得到的模型参数作为训练后的模型参数，将包括所述训练后的模型参数的用于图像特征融合的模型作为训练后的用于图像特征融合的模型；其中，所述用于图像特征融合的模型包括通道注意力网络、空间注意力网络和融合网络；所述通道注意力网络，用于利用所述不同感受野的图像特征中的底层图像特征，对所述不同感受野的图像特征中的高层图像特征进行通道信息增强，得到通道信息增强后的增强高层特征；其中，所述高层图像特征的感受野大于所述底层图像特征的感受野；所述空间注意力网络，用于利用所述不同感受野的图像特征中的高层图像特征，对所述不同感受野的图像特征中的底层图像特征进行空间信息增强，得到空间信息增强后的增强底层特征；所述融合网络，用于将所述增强高层特征和增强底层特征进行融合，得到融合后特征。 5.根据权利要求4所述的方法，其中，针对各个样本图像，所述样本图像对应的标签包括所述样本图像的类别标签、检测标签和/或分割标签；所述基于所述融合后特征进行图像处理，得到图像处理结果，包括：基于所述融合结果进行图像分类、图像检测和/或图像分割，得到针对所述样本图像的分类结果、检测结果和/或分割结果；所述计算所述图像处理结果与所述样本图像对应的标签之间的差异，包括：计算所述分类结果与所述类别标签之间的差异、所述检测结果和所述检测标签之间的差异和/或所述分割结果与所述分割标签之间的差异。 6.根据权利要求4所述的方法，其中，所述通道注意力网络包括全局池化层、第一感知层和归一化层；所述全局池化层，用于对所述底层图像特征进行全局池化操作；所述第一感知层，用于基于全局池化操作后的结果，通过全连接操作，得到与所述高级图像特征的通道维度一致的列向量；所述第一归一化层，用于对与所述高级图像特征的通道维度一致的列向量进行归一化操作，得到第一归一化后的列向量，所述第一归一化后的列向量中的值表示通道重要度系权　利　要　求　书 2/5 页 3 CN 115482443 A 3

专利 图像特征融合及模型训练方法、装置、设备以及存储介质

专利图像特征融合及模型训练方法、装置、设备以及存储介质