专利模型的训练方法和装置、目标识别方法、设备、介质

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210509810.4 (22)申请日 2022.05.11 (71)申请人平安科技（深圳）有限公司地址 518000 广东省深圳市福田区福田街道福安社区益田路5033号平安金融中心23楼 (72)发明人司世景　王健宗　 (74)专利代理机构广州嘉权专利商标事务所有限公司 4 4205 专利代理师廖慧贤 (51)Int.Cl. G06V 10/80(2022.01) G06V 10/40(2022.01) G06V 10/764(2022.01) G06V 10/82(2022.01)G06V 40/10(2022.01) G06K 9/62(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称模型的训练方法和装置、目标识别方法、设备、介质 (57)摘要本申请实施例提供了一种模型的训练方法和装置、目标识别方法、设备、介质，属于人工智能技术领域。模型的训练方法通过对原始可见光图像进行特征提取，得到第一特征图像，对原始红外图像进行特征提取，得到第二特征图像，然后，再对第一特征图像和第二特征图像进行跨模态融合处理，得到第一融合图像和第二融合图像，再根据第一特征图像、第二特征图像、第一融合图像和第二融合图像对双流网络模型进行训练，得到目标识别模型，该目标识别模型用于对目标图像进行识别处理，得到目标识别结果。本申请实施例的技术方案，提高了模型对目标图像识别的准确性。权利要求书3页说明书17页附图7页 CN 114937189 A 2022.08.23 CN 114937189 A 1.一种模型的训练方法，其特征在于，所述模型的训练方法包括：获取原始训练图像；其中，所述原始训练图像包括原始红外图像和原始可见光图像，所述原始红外图像由拍摄预设目标得到，所述原始可见光图像由拍摄所述预设目标得到；将所述原始训练图像输入至预设的双流网络模型；其中，所述预设的双流网络模型包括第一网络模型和第二网络模型，所述第一网络模型和所述第二网络模型相同；通过所述第一网络模型对所述原始可见光图像进行第一初步特征提取，得到第一初步特征图像，并对所述第一初步特征图像进行第一关键特征提取，得到第一特征图像；其中，所述第一特征图像用于表征所述预设目标的特征；通过所述第二网络模型对所述原始红外图像进行第二初步特征提取，得到第二初步特征图像，并对所述第二初步特征图像进行第二关键特征提取，得到第二特征图像；其中，所述第二特征图像用于表征所述预设目标的特征；对所述第一特征图像和所述第二特征图像进行跨模态融合处理，得到第一融合图像和第二融合图像；其中，所述第一融合图像用于表征所述预设目标的特征，所述第二融合图像用于表征所述预设目标的特征；根据所述第一特征图像、所述第二特征图像、所述第一融合图像和第二融合图像，对所述双流网络模型进行训练，得到目标识别模型；其中，所述目标识别模型用于对目标图像进行识别处理，得到目标识别结果；所述目标图像包括由拍摄第一目标得到的目标可见光图像和由拍摄第二目标得到的目标红外图像，所述目标识别结果包括：所述第一目标与所述第二目标相同的第一结果；或者所述第一目标与所述第二目标不相同的第二结果。 2.根据权利要求1所述的方法，其特征在于，所述对所述第一初步特征图像进行第一关键特征提取，得到第一特征图像，包括：对所述第一初步特征图像进行自注意力强化处理，得到第一强化图像；对所述第一强化图像进行卷积处理，得到所述第一特征图像。 3.根据权利要求2所述的方法，其特征在于，所述对所述第一初步特征图像进行自注意力强化处理，得到第一强化图像，包括：对所述第一初步特征图像进行聚合处理，得到聚合图像；对所述聚合图像进行归一激活处理，得到通道激活图像；对所述通道激活图像进行调整处理，得到通道注意力图像；对所述第一初步特征图像像进行压缩处理，得到压缩图像；对所述压缩图像进行归一激活处理，得到空间激活图像；对所述空间激活图像进行调整处理，得到空间注意力图像；根据所述第一初步特征图像、所述通道注意力图像和所述空间注意力图像，得到所述第一强化图像。 4.根据权利要求3所述的方法，其特征在于，所述对所述通道激活图像进行调整处理，得到通道注意力图像，包括：获取预设的响应阈值；获取所述通道激活图像的像素值，得到通道图像像素值；权　利　要　求　书 1/3 页 2 CN 114937189 A 2根据所述响应阈值和所述通道图像像素值，对所述通道激活图像进行强化或者削弱处理，得到所述通道注意力图像。 5.根据权利要求4所述的方法，其特征在于，所述根据所述响应阈值和所述通道图像像素值，对所述通道激活图像进行强化或者削弱处理，得到所述通道注意力图像，包括：获取预设的强化因子，获取预设的削弱因子；若所述响应阈值大于或等于所述通道图像像素值，则以所述强化因子对所述通道图像像素值对应的区域进行强化处理，得到所述通道注意力图像；若所述响应阈值小于所述通道图像像素值，则以所述削弱因子对所述通道图像像素值对应的区域进行削弱处理，得到所述通道注意力图像。 6.根据权利要求1至5任意一项所述的方法，其特征在于，所述根据所述第一特征图像、所述第二特征图像、所述第一融合图像和第二融合图像，对所述双流网络模型进行训练，得到目标识别模型，包括：根据所述第一特征图像、所述第二特征图像、所述第一融合图像和所述第二融合图像，计算得到第一损失值；根据所述第一特征图像和所述第二特征图像，计算得到第二损失值；根据所述第一损失值和所述第二损失值，计算得到目标损失值；根据所述目标损失值对所述双流网络模型的参数进行更新处理，得到所述目标识别模型。 7.一种目标识别方法，其特征在于，所述目标识别方法包括：获取目标图像；其中，所述目标图像包括目标可见光图像和目标红外图像，所述目标可见光图像由拍摄第一目标得到，所述目标红外图像由拍摄第二目标得到；将所述目标可见光图像和所述目标红外图像输入至目标识别模型；其中，所述目标识别模型为根据权利要求1至 6任意一项所述的模型的训练方法训练得到；通过所述目标识别模型对所述目标可见光图像进行识别、对所述目标红外图像进行识别，得到目标识别结果；其中，所述目标识别结果包括：所述第一目标与所述第二目标相同的第一结果；或者所述第一目标与所述第二目标不相同的第二结果。 8.一种模型的训练装置，其特征在于，所述模型的训练装置包括：获取模块，用于获取原始训练图像；其中，所述原始训练图像包括原始红外图像和原始可见光图像，所述原始红外图像由拍摄预设目标得到，所述原始可见光图像由拍摄所述预设目标得到；图像输入模块，用于将所述原始训练图像输入至预设的双流网络模型；其中，所述预设的双流网络模型包括第一网络模型和第二网络模型，所述第一网络模型和所述第二网络模型相同；可见光提取模块，用于通过所述第一网络模型对所述原始可见光图像进行第一初步特征提取，得到第一初步特征图像，并对所述第一初步特征图像进行第一关键特征提取，得到第一特征图像；其中，所述第一特征图像用于表征所述预设目标的特征；红外提取模块，用于通过所述第二网络模型对所述原始红外图像进行第二初步特征提权　利　要　求　书 2/3 页 3 CN 114937189 A 3

专利 模型的训练方法和装置、目标识别方法、设备、介质

专利模型的训练方法和装置、目标识别方法、设备、介质