(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211261004.6
(22)申请日 2022.10.14
(66)本国优先权数据
202210744269.5 202 2.06.28 CN
(71)申请人 西安电子科技大 学
地址 710071 陕西省西安市太白南路2号
(72)发明人 贺王鹏 赵敏敏 蒋元淑 李诚
刘恒言 郭宝龙
(74)专利代理 机构 西安嘉思特知识产权代理事
务所(普通 合伙) 6123 0
专利代理师 勾慧敏
(51)Int.Cl.
G06V 30/418(2022.01)
G06V 30/148(2022.01)
G06V 30/18(2022.01)G06V 30/19(2022.01)
G06V 10/80(2022.01)
G06V 10/82(2022.01)
(54)发明名称
基于文本掩膜结构相似度的文本印刷质量
评价方法
(57)摘要
本发明公开了一种基于文本掩膜结构相似
度的文本印刷质量评价方法: 通过基于文本掩膜
的动态感知文本分割网络, 对印刷文本图像以及
标准文本图像进行处理, 得到多通道文本精分割
特征图; 利用图像细化算法对多通道文本精分割
特征图进行文字骨架信息提取, 根据提取过程中
去除像素的顺序, 赋予每层像素不同的权值并建
立文本骨架模板; 采用结构相似度图像质量评价
算法, 对标准文本骨架模板及印刷文本骨架模板
进行文本印刷质量检测, 得到印刷文本骨架模板
与标准文本骨架模板的平均结构相似度值; 根据
平均结构相似度值, 判定文本印刷质量。 本发明
构建文本分割网络, 输出是具有文本掩膜信息的
特征图, 提高了 检测范围以及检测准确度。
权利要求书2页 说明书12页 附图3页
CN 115457587 A
2022.12.09
CN 115457587 A
1.一种基于文本掩膜结构相似度的文本印刷质量评价方法, 其特征在于, 所述基于文
本掩膜结构相似度的文本印刷质量评价方法包括:
通过构建的基于文本掩膜的动态感知文本分割网络, 对印刷文本图像以及标准文本图
像进行处理, 得到多通道文本精分割 特征图; 所述印刷 文本图像与所述标准文本图像的图
像内容相同, 所述基于文本掩膜的动态感知 文本分割网络通过带有真实标签的文本图像数
据集预先训练获得, 所述多通道文本精分割特 征图携带语义掩膜信息;
利用图像细化算法对所述多通道文本精分割特征图进行文字骨架信 息提取, 根据提取
过程中去除像素的顺序, 赋予每层像素不同的权值, 并建立文本骨架模板; 所述文本骨架模
板包括印刷文本骨架模板和标准文本骨架模板;
采用结构相似度图像质量评价算法, 对所述标准文本骨架模板及所述 印刷文本骨架模
板进行文本印刷质量检测, 得到所述印刷文本骨架模板与所述标准文本骨架模板的平均结
构相似度值;
根据所述平均结构相似度值, 判定文本印刷质量。
2.根据权利要求1所述的基于文本掩膜结构相似度的文本印刷质量评价方法, 其特征
在于, 所述基于文本掩膜的动态感知文本分割网络, 包括编码网络、 多层次特征融合模块、
解码网络;
所述通过构建的基于文本掩膜的动态感知文本分割网络, 对印刷文本图像以及标准文
本图像进行处 理, 得到多通道文本精分割特 征图, 包括:
通过所述编码网络, 对所述 印刷文本图像以及所述标准文本图像进行特征提取和特征
编码, 得到编码后的多通道特 征图;
通过所述多层次特征融合模块, 对所述编码后的多通道特征图进行包括特征重建、 拼
接及特征映射的处理, 完成特征聚合功能, 得到粗分割结果图Fcoarse和语义特征向量
Fsemantics;
通过所述解码网络, 结合所述语义特征向量Fsemantics对粗分割结果图Fcoarse进行特征强
化, 生成所述多通道文本精分割特 征图。
3.根据权利要求2所述的基于文本掩膜结构相似度的文本印刷质量评价方法, 其特征
在于, 所述多层次特 征融合模块包括特 征增强模块、 Co ncat层、 非线性特 征映射模块;
所述通过所述多层次特征融合模块, 对所述编码后的多通道特征图进行包括特征重
建、 拼接及特征映射的处理, 完成特征聚合功能, 得到粗分割结果图Fcoarse和语义特征向量
Fsemantics, 包括:
通过所述特征增强模块, 对所述编码后的多通道特征图进行特征重建, 并将重建后的
特征图输入所述Co ncat层;
利用所述Co ncat层, 将重建后的特 征图按通道进行拼接, 得到拼接后的特 征图;
通过所述非线性特征映射模块, 对所述拼接后的特征图进行特征映射, 完成特征聚合
功能, 得到粗分割结果图Fcoarse和语义特 征向量Fsemantics。
4.根据权利要求1所述的基于文本掩膜结构相似度的文本印刷质量评价方法, 其特征
在于, 所述利用图像细化算法对所述多通道文本精分割 特征图进行文字骨架信息提取, 根
据提取过程中去除像素的顺序, 赋予每层像素不同的权值, 并建立文本骨架模板, 包括:
采用ZS细化算法对所述多通道文本精分割特征图逐像素扫描, 通过对目标像素的八邻权 利 要 求 书 1/2 页
2
CN 115457587 A
2域进行算术逻辑运算, 将运算结果满足预设条件的目标像素进行去除, 得到所述多通道文
本精分割特 征图的文字骨架;
根据去除像素的顺序赋予每层像素不同的权值, 基于所述权值建立文本骨架模板 。
5.根据权利要求1所述的基于文本掩膜结构相似度的文本印刷质量评价方法, 其特征
在于, 所述采用结构相似度图像质量评价算法, 对所述标准文本骨架模板及所述印刷 文本
骨架模板进行文本印刷质量检测, 得到所述印刷文本骨架模板与所述标准文本骨架模板的
平均结构相似度值, 包括:
设计一个指定大小的视窗, 每次以像素为单位移动视窗, 计算每个视窗内图像的结构
相似度值, 得到多个局部结构相似度值;
将所述多个局部结构相似度值求平均, 得到所述 印刷文本骨架模板与 所述标准文本骨
架模板的平均结构相似度值。
6.根据权利要求2所述的基于文本掩膜结构相似度的文本印刷质量评价方法, 其特征
在于, 对所述基于文本掩膜的动态感知文本分割网络的预 先训练包括:
获取训练文本 图像样本, 所述训练文本 图像样本为带有真实标签的文本 图像, 所述真
实标签携带 所述训练文本图像样本中的字符和语义掩膜信息;
使用所述训练文本图像样本对所述基于文本掩膜的动态感知文本分割网络进行训练。
7.根据权利要求6所述的基于文本掩膜结构相似度的文本印刷质量评价方法, 其特征
在于, 所述使用所述训练文本图像样本对所述基于文本掩膜的动态感知 文本分割网络进 行
训练, 包括:
对所述训练文本图像样本进行处 理, 得到预测标签;
计算所述预测标签与其对应的真实标签的损失值;
基于所述损失值, 通过采用梯度下降法对所述基于文本掩膜的动态感知文本分割网络
进行迭代训练。
8.根据权利要求7所述的基于文本掩膜结构相似度的文本印刷质量评价方法, 其特征
在于, 所述计算所述预测标签与其对应的真实标签的损失值, 包括:
通过以下公式计算所述损失值:
L=Lcoarse+α Lrefine+β Lreg;
Lcoarse=CrossEntropy(Fcoarse,Flabel);
Lrefine=CrossEntropy(Frefine,Flabel);
Lreg=CrossEntropy(Freg,Flabel);
其中, Lcoarse为文本粗分割图的损失值, Lrefine为多通道文本精分割特征图的损失值,
Lreg为从所述文本粗分割图Fcoarse中裁剪对应的子图像区域并送入字符识别网络获得的字
符识别损失值; CrossEntropy( ·)为交叉熵损失函数, Flabel为真实标签值, Frefine为所述多
通道文本精分割特 征图, Freg为字符识别网络的结果 值, α 及β 为预设值。
9.根据权利要求2所述的基于文本掩膜结构相似度的文本印刷质量评价方法, 其特征
在于, 所述 解码网络为目标 上下文表示网络OCR。权 利 要 求 书 2/2 页
3
CN 115457587 A
3
专利 基于文本掩膜结构相似度的文本印刷质量评价方法
文档预览
中文文档
18 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共18页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 16:57:50上传分享