(19)中华 人民共和国 国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202111679589.9
(22)申请日 2021.12.31
(71)申请人 上海临冠 数据科技有限公司
地址 200436 上海市 静安区万 荣路1256、
1258号1102室
申请人 上海合合信息科技股份有限公司
上海生腾数据科技有限公司
上海盈五蓄数据科技有限公司
(72)发明人 曹超阳 郭辉辉 郭丰俊 丁凯
张驰 李旭阳 刘文亮 郑齐
陆大公 龙腾
(74)专利代理 机构 上海双霆 知识产权代理事务
所(普通合伙) 31415
代理人 殷晓雪(51)Int.Cl.
G06V 30/414(2022.01)
G06V 30/413(2022.01)
G06Q 50/20(2012.01)
G06N 3/08(2006.01)
G06N 3/04(2006.01)
(54)发明名称
一种错题本自动生成方法及装置
(57)摘要
本申请公开了一种错题本自动生 成方法。 对
题目图像进行智能裁剪, 仅保留所述图像中的文
档区域, 去除所述图像中的非文档 区域。 通过神
经网络方法对 所述图像的文档区域进行检测, 并
将所述图像的文档区域划分为三类子区域。 基于
已训练的基于神经网络的目标检测算法并结合
印刷体的形态特征, 将所述图像的文档区域分割
成一个或多个题目区域, 同时得到每个题目区域
的位置信息。 在每个题目区域中确定该题目的批
改内容并分类。 在每个题目区域中, 去除手写内
容。 将答案为错误、 无手写内容、 仅有完整印刷内
容的题目生成为错题本。 本申请实现了自动获取
每个错题的坐标, 无需人工调整错题坐标, 生成
错题本的效率更高。
权利要求书2页 说明书5页 附图2页
CN 114359940 A
2022.04.15
CN 114359940 A
1.一种错题本自动生成方法, 其特 征是, 包括如下步骤;
步骤S10: 将做过的题目拍摄为图像, 或者输入做过的题目的图像; 对所述图像进行裁
剪, 仅保留所述图像中的文档区域, 去除所述图像中的非文档区域;
步骤S20: 通过神经网络方法对所述图像的文档区域进行检测, 并将所述图像的文档区
域划分为多个子区域, 这些子区域分为三类: 印刷体子区域、 印刷体手写体重叠子区域、 手
写体子区域;
步骤S30: 基于已训练的基于神经网络的目标检测算法并结合印刷体的形态特征, 将所
述图像的文档区域分割成一个或多个题目区域, 同时得到每个题目区域的位置信息; 每个
题目区域中, 均包 含题目、 答案、 批改这 三部分内容;
所述步骤S20与步骤S30 的顺序或者互换, 或者 同时进行; 在步骤S20和步骤S30均执行
完毕后, 每个题目区域中, 均包含印刷体子区域、 印刷体手写体重叠子区域、 手写体子区域
这三类子区域;
步骤S40: 在每个题目区域中的手写体子区域和印刷体手写体重叠子区域中确定该题
目的批改内容; 通过已训练的批改内容分类器判断每个题目的批改内容是标记该题目的答
案为正确还是错 误;
步骤S50: 在每个题目区域中, 运用背景色填充手写体子区域; 在每个题目区域中的印
刷体手写体重 叠子区域中, 运用背景色填充手写内容, 同时保留印刷内容的完整性;
步骤S60: 将答案为 错误、 无手写内容、 仅有完整印刷内容的题目生成为 错题本。
2.根据权利要求1所述的错题本自动生成方法, 其特征是, 所述步骤S10 中, 所述图像 中
的文档区域是指图像中有字符或图形 的区域, 仅有一个; 所述图像中的非文档区域是指图
像中的空白区域, 分布在所述图像中的文档区域的四周。
3.根据权利要求1所述的错题本自动生成方法, 其特征是, 所述步骤S30 中, 所述基于神
经网络的目标检测算法采用无锚框的目标检测算法, 所述印刷体的形态特征是指印刷体的
边特征和一致性特征, 所述图像的文档区域、 印刷体的形态特 征共同作为神经网络的输入。
4.根据权利 要求1所述的错题本自动生成方法, 其特征是, 在步骤S20和步骤S30均执行
完毕后, 在一个题目区域中, 题目在印刷体子区域或印刷体手写体重叠子区域中, 答案在手
写体子区域或印刷体手写体重叠子区域中, 批改在手写体子区域或印刷体手写体重叠子区
域中。
5.根据权利要求1所述的错题本自动生成方法, 其特征是, 所述步骤S40 中, 所述批改内
容分类器采用ResNet ‑101二分类模型, ResNet ‑101是具有101层深度的卷积神经网络 。
6.根据权利要求1所述的错题本自动生成方法, 其特征是, 所述步骤S50 中, 采用图像修
复方法通过判断缺失像素点对应周围像素点的信息依次修复缺失像素点, 通过像素点分类
结果来保留印刷内容的完整性。
7.根据权利要求1所述的错题本自动生成方法, 其特征是, 所述步骤S60改为步骤S62;
步骤S62: 将用户选择的、 答案为错误、 无手写内容、 仅有完整印刷内容的题目生成为错题
本。
8.根据权利要求1所述的错题本自动生成方法, 其特征是, 所述步骤S60改为步骤S64;
步骤S64: 通过题库匹配找出错题的参考答案, 将答案为错误、 无手写内容、 仅有完整印刷内
容、 无参考答案的题目生成为 错题本, 同时生成对应的参 考答案。权 利 要 求 书 1/2 页
2
CN 114359940 A
29.根据权利要求1所述的错题本自动生成方法, 其特征是, 所述步骤S60改为步骤S66;
步骤S66: 通过题库匹配找出用户所选择的错题的参考答案, 将用户选择的、 答案为错误、 无
手写内容、 仅有完整印刷内容、 无参考答案的题目生成为错题本, 同时生成对应的参考答
案。
10.一种错题本自动 生成装置, 其特征是, 包括裁剪单元、 子区域划分单元、 题目分割单
元、 批改分类单 元、 手写填充单 元、 以及生成单 元一;
所述裁剪单元用于将做过的题目拍摄为图像, 或者输入做过的题目的图像; 对所述图
像进行裁 剪, 仅保留所述图像中的文档区域, 去除所述图像中的非文档区域;
所述子区域划分单元用于通过神经网络方法对所述图像的文档区域进行检测, 并将所
述图像的文档区域划分为多个子区域, 这些子区域分为三类: 印刷体子区域、 印刷体手写体
重叠子区域、 手写体子区域;
所述题目分割单元用于基于已训练的基于神经网络的目标检测算法并结合印刷体的
形态特征, 将所述图像的文档区域分割成一个或多个题目区域, 同时得到每个题目区域的
位置信息; 每个题目区域中, 均包含题目、 答案、 批改这三部分内容; 每个题目区域中, 均包
含印刷体子区域、 印刷体 手写体重 叠子区域、 手写体子区域 这三类子区域;
所述批改分类单元用于在每个题目区域中的手写体子区域和印刷体手写体重叠子区
域中确定该题目的批改内容; 通过已训练的批改内容分类器, 判断每个题目的批改内容是
标记该题目的答案为 正确还是错 误;
所述手写填充单元用于在每个题目区域中, 运用背景色填充手写体子区域; 还在每个
题目区域中的印刷体手写体重叠子区域中, 运用背景色填充手写内容, 同时保留印刷内容
的完整性;
所述生成单元一用于将答案为错误、 无手写内容、 仅有完整印刷内容的题目生成为错
题本。权 利 要 求 书 2/2 页
3
CN 114359940 A
3
专利 一种错题本自动生成方法及装置
文档预览
中文文档
10 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共10页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-19 00:19:18上传分享