专利 一种图像处理方法及装置

(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202111526049.7 (22)申请日 2021.12.14 (71)申请人北京有竹居网络技术有限公司地址 101299 北京市平谷区林荫北街13号信息大厦802 (72)发明人张家鑫　黄灿　 (74)专利代理机构北京信远达知识产权代理有限公司 1 1304 代理人储倩 (51)Int.Cl. G06V 30/14(2022.01) G06V 30/18(2022.01) G06V 30/19(2022.01) G06V 30/24(2022.01) G06K 9/62(2022.01)G06N 7/02(2006.01) G06N 20/00(2019.01) (54)发明名称一种图像处理方法及装置 (57)摘要本申请公开了一种图像处理方法，包括：获取待处理图像；将待处理图像输入预先训练得到的字符识别模型，得到待处理图像中包括的字符；字符识别模型用于：提取待处理图像的图像特征，并根据图像特征，得到待处理图像中包括的字符。在训练字符识别模型时，可以提取训练图像的第一特征，并确定第一特征中对应字符的特征，而后，对第一特征中对应字符的特征进行模糊处理，得到第二特征，根据第二特征，得到字符预测结果，并基于字符预测结果和训练图像对应的标签，更新字符识别模型的参数。因此，该字符识别模型，具备了预测被模糊处理的字符对应的特征对应的真实字符的能力，利用该方法，能够准确的识别出待处理图像中的字符。权利要求书2页说明书9页附图4页 CN 114187593 A 2022.03.15 CN 114187593 A 1.一种图像处理方法，其特征在于，所述方法包括：获取包括字符的待处理图像；将所述待处理图像输入所述字符识别模型，得到所述待处理图像中包括的字符；其中：所述字符识别模型，用于：提取所述待处理图像的图像特征，并根据所述图像特征，得到所述待处理图像中包括的字符；其中：所述字符识别模型，通过如下方式训练得到：获取训练图像以及训练图像对应的标签，所述训练图像对应的标签，用于指示所述训练图像中包括的字符；基于所述训练图像和所述训练图像对应的标签，训练字符识别模型，所述字符识别模型用于识别图像中的字符；其中：所述基于所述训练图像和所述训练图像对应的标签，训练字符识别模型，包括：提取所述训练图像的第一特征；确定所述第一特征中对应字符的特征；对所述第一特征中对应字符的特征进行模糊处理，得到第二特征；根据所述第二特征，得到字符预测结果；基于所述字符预测结果和所述训练图像对应的标签，更新所述字符识别模型的参数。 2.根据权利要求1所述的方法，其特征在于，所述对所述第一特征中对应字符的特征进行模糊处理，包括以下任意一项或者多项：去除所述第一特征中对应的字符的特征中的部分特征；或者，修改所述第一特征中对应的字符的特征中的部分特征。 3.根据权利要求1所述的方法，其特征在于，所述字符识别模型，包括解码器和N个编码器；所述N个编码器中的前i个编码器串联，所述前i个编码器，用于根据所述训练图像得到所述第一特征，所述第一特征为所述第i个编码器的输出， i 为小于N的正整数；所述后(N ‑i)个编码器串联，所述后(N ‑i)个编码器，用于对所述第二特征进行处理，得到第三特征；所述解码器，用于根据所述第三特征，得到所述字符预测结果。 4.根据权利要求3所述的方法，其特征在于，在利用所述字符识别模型识别所述待处理图像中的字符时，所述N个编码器用于提取所述待处理图像的图像特征，所述解码器用于根据所述图像特征，得到所述待处理图像中包括的字符。 5.根据权利要求1所述的方法，其特征在于，所述确定所述第一特征中对应字符的特征，包括：利用特征提取模块确定所述第一特征中对应字符的特征，所述特征提取模块，用于根据所述第一特征，确定所述第一特征中对应字符的特征，其中，所述特征提取模块独立于所述字符识别模型。 6.根据权利要求5所述的方法，其特征在于，所述特征提取模块，为时序分类算法CTC分类模块。 7.根据权利要求1所述的方法，其特征在于，所述对所述第一特征中对应字符的特征进行模糊处理，得到第二特征，包括：权　利　要　求　书 1/2 页 2 CN 114187593 A 2利用独立于所述字符识别模型的特征处理模块，对所述第一特征中对应字符的特征进行模糊处理，得到第二特征。 8.根据权利要求1 ‑7任意一项所述的方法，其特征在于，根据所述第二特征，得到字符预测结果，包括：根据所述第二特征和所述第一特征中对应背景噪声的特征，得到字符预测结果。 9.一种图像处理装置，其特征在于，所述装置包括：获取单元，用于获取包括字符的待处理图像；处理单元，用于将所述待处理图像输入所述字符识别模型，得到所述待处理图像中包括的字符；其中：所述字符识别模型，用于：提取所述待处理图像的图像特征，并根据所述图像特征，得到所述待处理图像中包括的字符；其中：所述字符识别模型，通过如下方式训练得到：获取训练图像以及训练图像对应的标签，所述训练图像对应的标签，用于指示所述训练图像中包括的字符；基于所述训练图像和所述训练图像对应的标签，训练字符识别模型，所述字符识别模型用于识别图像中的字符；其中：所述基于所述训练图像和所述训练图像对应的标签，训练字符识别模型，包括：提取所述训练图像的第一特征；确定所述第一特征中对应字符的特征；对所述第一特征中对应字符的特征进行模糊处理，得到第二特征；根据所述第二特征，得到字符预测结果；基于所述字符预测结果和所述训练图像对应的标签，更新所述字符识别模型的参数。 10.一种设备，其特征在于，所述设备包括处理器和存储器；所述处理器用于执行所述存储器中存储的指令，以使得所述设备执行如权利要求1至8 中任一项所述的方法。 11.一种计算机可读存储介质，其特征在于，包括指令，所述指令指示设备执行如权利要求1至8中任一项所述的方法。权　利　要　求　书 2/2 页 3 CN 114187593 A 3

专利 一种图像处理方法及装置

专利一种图像处理方法及装置