(19)中华 人民共和国 国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202111660490.4
(22)申请日 2021.12.3 0
(71)申请人 国电南京自动化股份有限公司
地址 210009 江苏省南京市 鼓楼区新模范
马路38号
(72)发明人 肖振远 宗起振 陶征勇 李实秋
管金酉 卢沁欣
(74)专利代理 机构 南京纵横知识产权代理有限
公司 32224
代理人 董建林
(51)Int.Cl.
G06V 20/60(2022.01)
G06V 20/70(2022.01)
G06V 10/40(2022.01)
G06V 10/80(2022.01)G06V 10/82(2022.01)
G06V 10/764(2022.01)
G06K 9/62(2022.01)
G06N 3/04(2006.01)
G06N 3/08(2006.01)
(54)发明名称
一种基于SW-FSSD的数字仪表字符检测方法
(57)摘要
本发明公开了一种基于SW ‑FSSD的数字仪表
字符检测方法, 其包 括: 构建SW ‑FSSD模型作为数
字仪表字符检测模型, 并进行模型训练; 利用IPC
采集数字仪表的字符图像; 将 字符图像输入训练
好的数字仪表字符检测模型; 利用数字仪表字 符
检测模型对字符图像进行特征提取并分类, 将模
型的高低层予以特征融合获得字符类别, 输出字
符检测结果。 本发明能够提升数字仪表字符检测
的准确性和有效性, 满足牵引变电所数字仪表字
符智能化检测的需求。
权利要求书2页 说明书8页 附图3页
CN 114399754 A
2022.04.26
CN 114399754 A
1.一种基于SW ‑FSSD的数字仪表字符检测方法, 其特 征在于, 包括如下步骤:
利用IPC采集数字 仪表的字符图像;
将字符图像输入预先构建的数字仪表字符检测模型, 其中, 所述数字仪表字符检测模
型采用SW ‑FSSD模型;
利用数字仪表字符检测模型对字符图像进行特征提取并分类, 获得字符类别, 输出字
符检测结果。
2.根据权利要求1所述的一种基于SW ‑FSSD的数字仪表字符检测方法, 其特征在于, 所
述SW‑FSSD模型包括依次连接的主干特征提取网络、 多尺度特征提取网络、 特征融合结构和
分类器, 其中, 主干特征提取网络采用VGG16网络的前十三层卷积层, 多尺度特征提取网络
包括3组不同尺度分辨 率输出的卷积层, 特 征融合结构采用FPN结构。
3.根据权利要求1所述的一种基于SW ‑FSSD的数字仪表字符检测方法, 其特征在于, 所
述SW‑FSSD模型的分类损失函数采用部分加权损失函数SW Loss。
4.根据权利要求1所述的一种基于SW ‑FSSD的数字仪表字符检测方法, 其特征在于, 数
字仪表字符检测模型的训练方法包括:
获取数字仪表的多幅字符图像;
将字符图像划分为训练集和 测试集, 并对每幅字符图像进行 标注;
初始化数字 仪表字符检测模型的模型参数;
通过数字仪表字符检测模型对训练集中的字符图像进行特征提取、 特征融合和特征分
类处理, 得到字符图像 检测结果;
根据字符图像的标注和检测结果, 利用损失函数计算数字仪表字符检测模型的总损
失;
根据总损失对数字仪表字符检测模型的模型参数进行更新, 并利用更新后的数字仪表
字符检测模型处 理训练集中的字符图像;
重复更新模型参数, 直至数字仪表字符检测模型的总损 失收敛, 得到训练好的数字仪
表字符检测模型。
5.根据权利 要求2或4所述的一种基于SW ‑FSSD的数字仪表字符检测方法, 其特征在于,
对训练集中的字符图像进行 特征提取、 特 征融合和特 征分类的方法为:
将训练集中的字符图像输入主干特 征提取网络, 通过 特征提取得到第一语义特 征;
将第一语义特征输入多尺度 特征提取网络, 通过特征提取得到第二、 第 三、 第四语义特
征;
利用特征融合结构对主干特征提取网络和多尺度 特征提取网络输出的4个语义特征进
行特征融合, 得到具有高低层语义信息的特 征图;
利用分类 器对特征图进行分类处 理, 得到字符图像对应的字符类别。
6.根据权利要求4所述的一种基于SW ‑FSSD的数字仪表字符检测方法, 其特征在于, 数
字仪表字符检测模型的总损失包括分类损失和回归损失, 总损失的计算公式如下:
其中, L(x,c,l,g)表示数字仪表字符检测模型的总损失, x表示预测锚框和标注锚框关
于任一字符类别是否匹配的指标参数, c表示数字仪表字符检测模型预测字符类别的概率权 利 要 求 书 1/2 页
2
CN 114399754 A
2值, l表示数字仪表字符检测模型预测的锚框位置, g表示标注的锚框位置, κ为多任务不平
衡因子, SWLconf(x,c)表示数字仪表字符检测模型 的部分加权分类损失, N为数字仪表字符
检测模型 预测的锚框总数量, Lloc(x,l,g)表示数字 仪表字符检测模型的回归损失。
7.根据权利要求6所述的一种基于SW ‑FSSD的数字仪表字符检测方法, 其特征在于, 部
分加权分类损失SW Lconf(x,c)的表达式如下:
其中, p为字符类别总数, k=0,1, …,p, Lconf(x,c)表示每个字符类别的分类损失, βk表
示第k个字符类别的类别不平衡因子 。
8.根据权利要求7所述的一种基于SW ‑FSSD的数字仪表 字符检测方法, 其特征在于, Lconf
(x,c)的表达式如下:
其中, Pos表示正样本, 正样本指与标注锚框的重叠度达到预设阈值的预测锚框, Neg表
示负样本, 负样 本指与标注锚框的重叠度未达到预设阈值的预测锚框,
表示第i个预测锚
框与第j个标注锚框关于第k个字符类别是否匹配的指标参数,
表示
的正则
化值,
表示第i个预测锚框预测为第k个字 符类别的概率值,
表示
的正则化值,
表示
第i个预测锚框预测为背景类的概率值, i=1,2, …,N, j=1,2, …,M, M为字符图像中标注锚
框的总数量。
9.根据权利要求6所述的一种基于SW ‑FSSD的数字仪表字符检测方法, 其特征在于, 回
归损失Lloc(x,l,g)的表达式如下:
其中, Pos表示正样本, cx、 cy、 w、 h分别表示锚框的中心点横坐标、 中心点纵坐标、 宽度
和高度,
分别表示第i个 预测锚框的中心点横坐标、 中心
点纵坐标、 宽度和高度转换到锚框坐标体系中的编码值 ,
分别表示第j个标注锚框的中心点横坐标、 中心点纵坐标、 宽度和高度转
换到锚框坐标体系中的编码值。
10.根据权利要求9所述的一种基于SW ‑FSSD的数字仪表字符检测方法, 其特征在于,
其中,
分别表示第j个标注锚框的中心点横坐标、 中心点纵坐标、 宽度和高
度,
分别表示第i个预测锚框对应的预先划分网格的中心点横坐标、 中
心点纵坐标、 宽度和高度。权 利 要 求 书 2/2 页
3
CN 114399754 A
3
专利 一种基于SW-FSSD的数字仪表字符检测方法
文档预览
中文文档
14 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共14页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-19 03:54:37上传分享