专利 图像的识别方法及装置

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210960566.3 (22)申请日 2022.08.09 (71)申请人上海闪马智能科技有限公司地址 200210 上海市浦东新区自由贸易试验区临港新片区环湖西二路8 88号C楼 (72)发明人林亦宁　易芮　安超　 (74)专利代理机构北京康信知识产权代理有限责任公司 1 1240 专利代理师赵静 (51)Int.Cl. G06V 10/764(2022.01) G06V 10/80(2022.01) G06V 10/82(2022.01) G06V 10/40(2022.01) G06N 3/04(2006.01)G06N 3/08(2006.01) (54)发明名称图像的识别方法及装置 (57)摘要本发明实施例提供了一种图像的识别方法及装置，包括：获取待识别图像；通过目标神经网络模型的主干神经网络对待识别图像进行下采样，得到N个下采样特征图；通过目标神经网络模型的特征金字塔网络对N个下采样特征图进行上采样，得到M个上采样特征图；通过目标神经网络模型的信息整合网络对M个上采样特征图进行处理，得到待识别图像的识别结果。通过本发明，解决了图像中目标对象的识别准确率较低的问题，进而达到了提高目标对象识别准确率的效果。权利要求书2页说明书10页附图3页 CN 115205603 A 2022.10.18 CN 115205603 A 1.一种图像的识别方法，其特征在于，包括：获取待识别图像；通过目标神经网络模型的主干神经网络对所述待识别图像进行下采样，得到N个下采样特征图，其中， N大于1；通过所述目标神经网络模型的特征金字塔网络对所述N个下采样特征图进行上采样，得到M个上采样特征图，其中， M大于或等于N，所述M个上采样特征图中的部分特征图与所述 N个下采样特征图中的部分特征图的倍率相同；通过所述目标神经网络模型的信息整合网络对所述M个上采样特征图进行处理，得到所述待识别图像的识别结果，其中，所述识别结果包括所述待识别图像中目标对象的类别、所述目标对象的位置信息。 2.根据权利要求1所述的方法，其特征在于，通过目标神经网络模型的主干神经网络对所述待识别图像进行下采样，得到N个下采样特征图，包括：通过所述主干神经网络对所述待识别图像进行下采样，得到8倍下采样特征图、 16倍下采样特征图和32倍下采样特征图，所述N个下采样特征图包括：所述8倍下采样特征图、 16倍下采样特征图和32倍下采样特征图；通过所述目标神经网络模型的特征金字塔网络对所述N个下采样特征图进行上采样，得到M个上采样特征图，包括：通过所述特征金字塔网络对所述8倍下采样特征图、 16倍下采样特征图和32倍下采样特征图进行上采样，得到4倍上采样特征图、 16倍上采样特征图、 32 倍上采样特征图和64倍上采样特征图，其中，所述M个上采样特征图包括：所述4倍上采样特征图、所述16倍上采样特征图、所述32倍上采样特征图和所述64 倍上采样特征图。 3.根据权利要求2所述的方法，其特征在于，所述通过所述目标神经网络模型的信息整合网络对所述M个上采样特征图进行处理，得到所述待识别图像的识别结果，包括：通过所述目标神经网络模型的信息整合网络对所述4倍上采样特征图、所述16倍上采样特征图、所述32倍上采样特征图和所述64倍上采样特征图进行处理，得到所述待识别图像的识别结果。 4.根据权利要求2所述的方法，其特征在于，在所述通过所述目标神经网络模型的特征金字塔网络对所述 N个下采样特征图进行上采样之前，所述方法还包括：获取训练样本图像集合；通过所述训练样本图像集合对待训练的初始神经网络模型进行迭代训练；在训练过程中，若所述初始神经网络模型输出的样本识别结果与输入的训练样本图像的已知识别结果满足预设损失条件，则停止训练得到所述目标神经网络模型，若不满足所述预设损失条件，则调整所述初始神经网络模型的模型，继续进行训练。 5.根据权利要求4所述的方法，其特征在于，通过所述训练样本图像集合对待训练的初始神经网络模型进行迭代训练，包括：通过以下步骤对所述待训练的初始神经网络模型进行第i轮训练，其中， i大于或等于 1，第0轮训练的初始神经网络模型为未经训练的初始神经网络模型：将第i轮训练使用的训练样本图像输入第i ‑1轮确定的初始神经网络模型，通过第i ‑1 轮确定的主干神经网络对所述训练样本图像进行下采样，得到N个样本下采样特征图；通过第i‑1轮确定的特征金字塔网络对所述N个样本下采样特征图进行上采样，得到M权　利　要　求　书 1/2 页 2 CN 115205603 A 2个样本上采样特征图，其中，所述M个样本上采样特征图中的部分特征图与所述N个样本下采样特征图中的部分特征图的倍率相同；通过第i‑1轮确定的信息整合网络对所述M个样本上采样特征图进行处理，得到所述第 i轮训练使用的训练样本图像的样本识别结果；在所述样本识别结果与所述第 i轮训练使用的训练样本图像的已知识别结果满足所述预设损失条件的情况下，将所述第i ‑1轮确定的初始神经网络模型确定为所述目标神经网络模型。 6.根据权利要求5所述的方法，其特征在于，在所述样本识别结果与所述第i轮训练使用的训练样本图像的已知识别结果满足所述预设损失条件的情况下，将所述第i ‑1轮确定的初始神经网络模型确定为所述目标神经网络模型，包括：获取所述样本识别结果中所述训练样本图像中样本对象的预估类别，以及所述样本识别结果中所述样本对象的预估位置；确定所述样本对象的预估类别与所述样本对象的已知类别之间的第一损失值，其中，所述已知识别结果包括所述样本对象的已知类别；确定所述样本对象的预估位置与所述样本对象的已知位置之间的第二损失值，其中，所述已知识别结果还包括所述样本对象的已知位置；在所述第一损失值和所述第二损失值满足所述预设损失条件的情况下，将所述第i ‑1 轮确定的初始神经网络模型确定为所述目标神经网络模型。 7.根据权利要求6所述的方法，其特征在于，所述方法还包括：将所述第一损失值和所述第二损失值的和确定为目标损失值；在所述目标损失值小于或等于预设阈值的情况下，确定所述第一损失值和所述第二损失值满足所述预设损失条件。 8.一种图像的识别装置，其特征在于，包括：获取模块，用于获取待识别图像；第一处理模块，用于通过目标神经网络模型的主干神经网络对所述待识别图像进行下采样，得到N个下采样特征图，其中， N大于1；第二处理模块，用于通过所述目标神经网络模型的特征金字塔网络对所述N个下采样特征图进行上采样，得到M个上采样特征图，其中， M大于或等于N，所述M个上采样特征图中的部分特征图与所述 N个下采样特征图中的部分特征图的倍率相同；第三处理模块，用于通过所述目标神经网络模型的信息整合网络对所述M个上采样特征图进行处理，得到所述待识别图像的识别结果，其中，所述识别结果包括所述待识别图像中目标对象的类别、所述目标对象的位置信息。 9.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质中存储有计算机程序，其中，所述计算机程序被处理器执行时实现所述权利要求1至7任一项中所述的方法的步骤。 10.一种电子装置，包括存储器和处理器，其特征在于，所述存储器中存储有计算机程序，所述处理器被设置为运行所述计算机程序以执行所述权利要求 1至7任一项中所述的方法。权　利　要　求　书 2/2 页 3 CN 115205603 A 3

专利 图像的识别方法及装置

专利图像的识别方法及装置