专利 基于文本掩膜结构相似度的文本印刷质量评价方法

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202211261004.6 (22)申请日 2022.10.14 (66)本国优先权数据 202210744269.5 202 2.06.28 CN (71)申请人西安电子科技大学地址 710071 陕西省西安市太白南路2号 (72)发明人贺王鹏　赵敏敏　蒋元淑　李诚　刘恒言　郭宝龙　 (74)专利代理机构西安嘉思特知识产权代理事务所(普通合伙) 6123 0 专利代理师勾慧敏 (51)Int.Cl. G06V 30/418(2022.01) G06V 30/148(2022.01) G06V 30/18(2022.01)G06V 30/19(2022.01) G06V 10/80(2022.01) G06V 10/82(2022.01) (54)发明名称基于文本掩膜结构相似度的文本印刷质量评价方法 (57)摘要本发明公开了一种基于文本掩膜结构相似度的文本印刷质量评价方法：通过基于文本掩膜的动态感知文本分割网络，对印刷文本图像以及标准文本图像进行处理，得到多通道文本精分割特征图；利用图像细化算法对多通道文本精分割特征图进行文字骨架信息提取，根据提取过程中去除像素的顺序，赋予每层像素不同的权值并建立文本骨架模板；采用结构相似度图像质量评价算法，对标准文本骨架模板及印刷文本骨架模板进行文本印刷质量检测，得到印刷文本骨架模板与标准文本骨架模板的平均结构相似度值；根据平均结构相似度值，判定文本印刷质量。本发明构建文本分割网络，输出是具有文本掩膜信息的特征图，提高了检测范围以及检测准确度。权利要求书2页说明书12页附图3页 CN 115457587 A 2022.12.09 CN 115457587 A 1.一种基于文本掩膜结构相似度的文本印刷质量评价方法，其特征在于，所述基于文本掩膜结构相似度的文本印刷质量评价方法包括：通过构建的基于文本掩膜的动态感知文本分割网络，对印刷文本图像以及标准文本图像进行处理，得到多通道文本精分割特征图；所述印刷文本图像与所述标准文本图像的图像内容相同，所述基于文本掩膜的动态感知文本分割网络通过带有真实标签的文本图像数据集预先训练获得，所述多通道文本精分割特征图携带语义掩膜信息；利用图像细化算法对所述多通道文本精分割特征图进行文字骨架信息提取，根据提取过程中去除像素的顺序，赋予每层像素不同的权值，并建立文本骨架模板；所述文本骨架模板包括印刷文本骨架模板和标准文本骨架模板；采用结构相似度图像质量评价算法，对所述标准文本骨架模板及所述印刷文本骨架模板进行文本印刷质量检测，得到所述印刷文本骨架模板与所述标准文本骨架模板的平均结构相似度值；根据所述平均结构相似度值，判定文本印刷质量。 2.根据权利要求1所述的基于文本掩膜结构相似度的文本印刷质量评价方法，其特征在于，所述基于文本掩膜的动态感知文本分割网络，包括编码网络、多层次特征融合模块、解码网络；所述通过构建的基于文本掩膜的动态感知文本分割网络，对印刷文本图像以及标准文本图像进行处理，得到多通道文本精分割特征图，包括：通过所述编码网络，对所述印刷文本图像以及所述标准文本图像进行特征提取和特征编码，得到编码后的多通道特征图；通过所述多层次特征融合模块，对所述编码后的多通道特征图进行包括特征重建、拼接及特征映射的处理，完成特征聚合功能，得到粗分割结果图Fcoarse和语义特征向量 Fsemantics；通过所述解码网络，结合所述语义特征向量Fsemantics对粗分割结果图Fcoarse进行特征强化，生成所述多通道文本精分割特征图。 3.根据权利要求2所述的基于文本掩膜结构相似度的文本印刷质量评价方法，其特征在于，所述多层次特征融合模块包括特征增强模块、 Co ncat层、非线性特征映射模块；所述通过所述多层次特征融合模块，对所述编码后的多通道特征图进行包括特征重建、拼接及特征映射的处理，完成特征聚合功能，得到粗分割结果图Fcoarse和语义特征向量 Fsemantics，包括：通过所述特征增强模块，对所述编码后的多通道特征图进行特征重建，并将重建后的特征图输入所述Co ncat层；利用所述Co ncat层，将重建后的特征图按通道进行拼接，得到拼接后的特征图；通过所述非线性特征映射模块，对所述拼接后的特征图进行特征映射，完成特征聚合功能，得到粗分割结果图Fcoarse和语义特征向量Fsemantics。 4.根据权利要求1所述的基于文本掩膜结构相似度的文本印刷质量评价方法，其特征在于，所述利用图像细化算法对所述多通道文本精分割特征图进行文字骨架信息提取，根据提取过程中去除像素的顺序，赋予每层像素不同的权值，并建立文本骨架模板，包括：采用ZS细化算法对所述多通道文本精分割特征图逐像素扫描，通过对目标像素的八邻权　利　要　求　书 1/2 页 2 CN 115457587 A 2域进行算术逻辑运算，将运算结果满足预设条件的目标像素进行去除，得到所述多通道文本精分割特征图的文字骨架；根据去除像素的顺序赋予每层像素不同的权值，基于所述权值建立文本骨架模板。 5.根据权利要求1所述的基于文本掩膜结构相似度的文本印刷质量评价方法，其特征在于，所述采用结构相似度图像质量评价算法，对所述标准文本骨架模板及所述印刷文本骨架模板进行文本印刷质量检测，得到所述印刷文本骨架模板与所述标准文本骨架模板的平均结构相似度值，包括：设计一个指定大小的视窗，每次以像素为单位移动视窗，计算每个视窗内图像的结构相似度值，得到多个局部结构相似度值；将所述多个局部结构相似度值求平均，得到所述印刷文本骨架模板与所述标准文本骨架模板的平均结构相似度值。 6.根据权利要求2所述的基于文本掩膜结构相似度的文本印刷质量评价方法，其特征在于，对所述基于文本掩膜的动态感知文本分割网络的预先训练包括：获取训练文本图像样本，所述训练文本图像样本为带有真实标签的文本图像，所述真实标签携带所述训练文本图像样本中的字符和语义掩膜信息；使用所述训练文本图像样本对所述基于文本掩膜的动态感知文本分割网络进行训练。 7.根据权利要求6所述的基于文本掩膜结构相似度的文本印刷质量评价方法，其特征在于，所述使用所述训练文本图像样本对所述基于文本掩膜的动态感知文本分割网络进行训练，包括：对所述训练文本图像样本进行处理，得到预测标签；计算所述预测标签与其对应的真实标签的损失值；基于所述损失值，通过采用梯度下降法对所述基于文本掩膜的动态感知文本分割网络进行迭代训练。 8.根据权利要求7所述的基于文本掩膜结构相似度的文本印刷质量评价方法，其特征在于，所述计算所述预测标签与其对应的真实标签的损失值，包括：通过以下公式计算所述损失值： L＝Lcoarse+α Lrefine+β Lreg； Lcoarse＝CrossEntropy(Fcoarse,Flabel)； Lrefine＝CrossEntropy(Frefine,Flabel)； Lreg＝CrossEntropy(Freg,Flabel)；其中， Lcoarse为文本粗分割图的损失值， Lrefine为多通道文本精分割特征图的损失值， Lreg为从所述文本粗分割图Fcoarse中裁剪对应的子图像区域并送入字符识别网络获得的字符识别损失值； CrossEntropy( ·)为交叉熵损失函数， Flabel为真实标签值， Frefine为所述多通道文本精分割特征图， Freg为字符识别网络的结果值， α 及β 为预设值。 9.根据权利要求2所述的基于文本掩膜结构相似度的文本印刷质量评价方法，其特征在于，所述解码网络为目标上下文表示网络OCR。权　利　要　求　书 2/2 页 3 CN 115457587 A 3

专利 基于文本掩膜结构相似度的文本印刷质量评价方法

专利基于文本掩膜结构相似度的文本印刷质量评价方法