说明:收录全网最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210386933.3 (22)申请日 2022.04.14 (71)申请人 浙江霖研精密科技有限公司 地址 313000 浙江省湖州市南 浔区练市镇 茹家甸路10 0号 (72)发明人 张晓武 陈斌 李伟 徐朝彬  (74)专利代理 机构 成都君合集专利代理事务所 (普通合伙) 51228 专利代理师 尹新路 (51)Int.Cl. G06V 30/148(2022.01) G06N 3/08(2006.01) G06N 3/04(2006.01) G06K 9/62(2022.01) G06V 10/774(2022.01)G06V 10/80(2022.01) G06V 10/82(2022.01) (54)发明名称 一种基于无锚框算法的轻量化文字检测方 法及装置 (57)摘要 本发明涉及无锚框算法技术领域, 公开了一 种基于无锚框算法的轻量化文字检测方法, 包 括: 步骤S1.获取工业产品上文字被框选的工业 产品图像样 本作为工业产品数据集, 对工业产品 数据集进行标注并将工业产品数据集分为测试 集和训练集; 步骤S2.将无锚点检测头网络工业 产品数据集的训练集输入网络模型获取训练后 的网络模型, 无锚点检测头网络网络模型包括依 次连接的主干网络、 特征金字塔网络和无锚点检 测头网络; 步骤S3.使用无锚点检测头网络测试 集测试训练后的网络模型得到文字检测模型; 步 骤S4.将待处理数据输入文字检测模型进行检测 并输出检测结果。 本发明还公开了一种基于无锚 框算法的轻量 化文字检测装置 。 权利要求书2页 说明书9页 附图4页 CN 114463759 A 2022.05.10 CN 114463759 A 1.一种基于无锚框算法的轻量化文字检测方法, 其特征在于, 包括以下步骤:  步骤S1: 获取工业产品上文字被框选的工业产品图像样本作为工业产品数据集, 对工业产品数据集 进行标注, 并将工业产品数据集分为测试集和训练集;  步骤S2: 基于Anchor ‑Free算法将所 述工业产品数据集的训练集输入网络模型获取训练后的网络模型, 所述网络模型包括依次 连接的主干网络、 特征金字塔网络和无锚点检测头网络, 所述无锚点检测头网络引入了广 义焦点损失, 并去掉了FCOS检测器使用的焦点损失中的Centerness分支;  步骤S3: 使用所 述测试集测试训练后的网络模型得到文字检测模 型; 步骤S4: 将待处理数据输入文字检测 模型进行检测并输出检测结果。 2.根据权利要求1所述的一种基于无锚框算法的轻量化文字检测方法, 其特征在于, 所 述步骤S1包括: 对所述工业产品图像样本进行数据增强处理得到增强后的工业产品图像样本作为工 业产品数据集; 所述数据增强处理的方法包括依次对工业产品图像样本进行镜像操作和尺寸调整操 作, 所述尺寸调整操作为随机扩充或者随机 裁剪。 3.根据权利要求1所述的一种基于无锚框算法的轻量化文字检测方法, 其特征在于, 所 述步骤S2包括:  步骤S21: 将所述工业产品数据集的训练集输入到主干网络获取不同尺寸 的提取特征图;  步骤S22: 将所述提取特征图输入到特征金字塔网络进行多级预测获取融 合特征图;  步骤S23: 将所述融合特征图输入到无锚点检测 头网络进行分析和回归计算获 取检测特征图;  步骤S24: 计算无锚点检测头网络获取的检测特征图和多层特征图集中各 图之间的误差, 根据所述误差采用反向传播算法对所述网络模型进行训练, 把检测特征图 的每个位置作为训练样本, 对于检测特征图中的每个位置对应原图的边框都进行回归, 最 终获取训练后的网络模型。 4.根据权利要求3所述的一种基于无锚框算法的轻量化文字检测方法, 其特征在于, 所 述步骤S21中的主干网络包括Shuf fleNetV2网络; 所述ShuffleNetV2网络从前至后依次设置卷积层、 批标准化层、 激活函数层和若干个 ShuffleNet 基本单元, 并去掉了最后一层卷积, 抽取8、 16、 32倍下采样的特征对工业产品数 据集的训练集进行多尺度的特 征融合, 获取不同尺寸的提取 特征图; 所述ShuffleNet基本单元包括从前至后依次设置的分组卷积层、 通道随机混合操作 层、 深度可分离卷积层、 卷积层和特 征相加层。 5.根据权利要求3所述的一种基于无锚框算法的轻量化文字检测方法, 其特征在于, 所 述步骤S22中的特征金字塔网络包括PAN网络; 所述PAN网络中去掉了所有卷积层, 保留从主干网络中特征提取后的1x1卷积来进行特 征通道维度的对齐; 所述PAN网络中的上采样和下采样均使用插值完成, 并且将多尺寸的提取特征图直接 相加。 6.根据权利要求3所述的一种基于无锚框算法的轻量化文字检测方法, 其特征在于, 所 述步骤S23中的无锚点检测头网络包括: 所述无锚点检测头网络采用了共享权重的检测头, 对从特征金字塔网络出来的多尺度 特征图使用同一组卷积预测检测框, 然后每一层使用一个可学习的缩放值作为系 数, 对预权 利 要 求 书 1/2 页 2 CN 114463759 A 2测出来的框进行缩放, 并且在检测头上使用了组归一 化层的处 理方式。 7.根据权利要求3所述的一种基于无锚框算法的轻量化文字检测方法, 其特征在于, 所 述步骤S2 4中计算无锚点检测头网络获取的检测特征图和多层特征图集中各图之间的误差 的方法包括: 无锚点检测头网络的损失值GFL代表了无锚点检测头网络获取的检测特征图和多层特 征图集中各图之间的误差, 无锚点检测头网络的损失值GFL表示 为: ; 其中, 和 表示预测模型的两个变量, 这两个变量的概率值为 和 , , 连续标签 满足 , 最终预测为两个 变量和概 率的线性组合: ; 是调节因子; 是交叉熵的完全表现形式。 8.一种基于无锚框算法的轻量化文字检测装置, 其特征在于, 包括采集模块、 训练模块 和检测模块: 所述采集模块用于采集工业产品上文字被框选的工业产品图像样本作为工业产品数 据集, 并将工业产品数据集分为测试集和训练集; 所述训练模块用于采集训练集训练网络模型, 所述网络模型包括主干网络、 特征金字 塔网络和无锚点检测网络; 所述检测模块用于使用所述测试集测试训练后的网络模型得到文字检测模型, 所述文 字检测模型用于进行文字检测。 9.根据权利要求8所述的一种基于无锚框算法的轻量化文字检测装置, 其特征在于, 包 括: 所述训练模块将训练集输入进主干网络中进 行特征提取得到不同尺寸的特征图, 再采 用特征金字塔网络对不同尺寸的特征图进 行多级预测, 最后在无锚点检测网络中对不同尺 寸的特征图进行分类和回归处理, 把特征图的每个位置作为训练样本, 对于特征图中的每 个位置对应原图的边框都进行回归, 最终得到训练好的网络模型。 10.根据权利要求8所述的一种基于无锚框算法的轻量化文字检测装置, 其特征在于, 所述训练模块包括: 所述训练模块采用了训练辅助模块, 并结合了动态的标签匹配策略; 所述训练模块包括从前至后依次设置的卷积层、 组归一化层, 并在不同尺度的特征图 间共享参数; 所述分标签匹配策略采用自适应正负anchor选择的匹配策略, 为每一层特征图动态选 取匹配样本 。权 利 要 求 书 2/2 页 3 CN 114463759 A 3

.PDF文档 专利 一种基于无锚框算法的轻量化文字检测方法及装置

文档预览
中文文档 16 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于无锚框算法的轻量化文字检测方法及装置 第 1 页 专利 一种基于无锚框算法的轻量化文字检测方法及装置 第 2 页 专利 一种基于无锚框算法的轻量化文字检测方法及装置 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 07:33:27上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。