说明:收录全网最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210704685.2 (22)申请日 2022.06.21 (71)申请人 科大讯飞股份有限公司 地址 230088 安徽省合肥市高新 开发区望 江西路666号 (72)发明人 刘青青 卢明敬  (74)专利代理 机构 北京布瑞知识产权代理有限 公司 11505 专利代理师 尚文文 (51)Int.Cl. G06V 30/19(2022.01) G06V 30/41(2022.01) G06F 40/30(2020.01) (54)发明名称 文本定位方法、 装置、 电子设备、 扫描笔和存 储介质 (57)摘要 本申请提出一种文本定位方法、 装置、 电子 设备、 扫描笔和存储介质, 方法包括检测与输入 数据内容对应的识别文本中是否包含用于指示 跳转至目标文本的特定文本位置的文本跳转指 令, 输入数据内容包括文本图像数据和/或语音 数据。 如果包含则将目标文本中的与文本跳转指 令相匹配的文本位置确定为文本定位结果; 如果 不包含则将目标文本中的与文本跳转指令相 匹 配的文本位置确定为文本定位结果, 进而当用户 通过纸质书阅读到某一位置时, 能够根据输入数 据内容快速定位到电子书籍的同一位置, 使用便 捷, 能够有效提高用户的阅读效率。 而且, 本申请 可以通过语音进行控制, 进一步提高使用的便捷 性。 权利要求书3页 说明书25页 附图4页 CN 115223176 A 2022.10.21 CN 115223176 A 1.一种文本 定位方法, 其特 征在于, 包括: 检测与输入数据内容对应的识别文本中是否包含文本跳转指令; 其中, 所述输入数据 内容包括文本图像数据和/或语音数据; 所述文本跳转指令用于指示跳转至目标文本的特 定文本位置; 若所述识别文本 中包含文本跳转指令, 则将所述目标文本 中的与所述文本跳转指令相 匹配的文本位置确定为文本 定位结果; 若所述识别文本 中不包含文本跳转指令, 则将 从所述目标文本中检索到的与 所述识别 文本匹配的文本的位置, 确定为文本 定位结果。 2.根据权利要求1所述的方法, 其特征在于, 所述检测与输入数据内容对应的识别文本 中是否包 含文本跳转指令, 包括: 通过对所述识别文本进行语义理解, 从所述识别文本中检测文本 跳转指示信息; 若从所述识别文本 中检测到文本跳转指示信 息, 则确定所述识别文本中包含文本跳转 指令。 3.根据权利要求2所述的方法, 其特征在于, 从所述识别文本 中检测到文本跳转指示信 息时, 所述方法还 包括: 判断所述文本跳转指示信 息是否符合场景指令条件; 所述场景指令条件包括在 当前场 景下、 所述文本 跳转指示信息作为文本 跳转指令所应符合的条件; 若所述文本跳转指示信 息符合场景指令条件, 则确定所述识别文本 中包含文本跳转指 令, 并将检测到的文本 跳转指示信息确定为文本 跳转指令; 若所述文本跳转指示信 息不符合场景指令条件, 则确定所述识别文本中不包含文本跳 转指令。 4.根据权利要求3所述的方法, 其特征在于, 所述判断所述文本跳转指示信 息是否符合 场景指令条件, 包括: 判断所述文本 跳转指示信息与所述目标文本的语种是否相同; 若所述文本跳转指示信 息与所述目标文本的语种不同, 则确定所述文本跳转指示信 息 符合场景指令条件。 5.根据权利要求1所述的方法, 其特征在于, 所述检测与输入数据内容对应的识别文本 中是否包 含文本跳转指令, 包括: 检测所述识别文本中是否包 含文本位置信息; 若所述识别文本中包 含文本位置信息, 则确定所述识别文本中包 含文本跳转指令 。 6.根据权利要求5所述的方法, 其特征在于, 所述检测所述识别文本 中是否包含文本位 置信息, 包括: 判断所述识别文本是否为页码; 若所述识别文本为页码, 则确定所述识别文本中包 含文本位置信息 。 7.根据权利要求6所述的方法, 其特 征在于, 所述判断所述识别文本是否为页码, 包括: 判断所述识别文本的文本 长度是否在所述目标文本的页码长度阈值内; 若所述识别文本的文本长度在所述目标文本的页码长度阈值内, 则判断所述识别文本 中是否仅包括数值文本; 若所述识别文本 中仅包括数值文本, 则判断所述识别文本对应的数值是否在所述目标权 利 要 求 书 1/3 页 2 CN 115223176 A 2文本的页码数值阈值以内; 若所述识别文本对应的数值在所述目标文本的页码数值阈值以内, 则确定所述识别文 本为页码。 8.根据权利要求1所述的方法, 其特征在于, 所述将从所述目标文本 中检索到的与 所述 识别文本匹配的文本的位置, 确定为文本 定位结果, 包括: 从所述目标文本的第 一检索区域中检索与 所述识别文本匹配的文本; 所述第 一检索区 域包括当前文本位置所在的文本区域以及与当前文本位置相 邻的文本区域, 所述当前文本 位置包括上一次文本 定位得到的文本 定位结果或者预设位置; 若从所述目标文本的第 一检索区域中检索到与 所述识别文本匹配的文本, 则将从所述 目标文本的第一检索区域中检索到的与所述识别文本匹配的文本的位置, 确定为文本定位 结果; 若从目标文本的第 一检索区域中未检索到与所述识别文本匹配的文本, 则将从所述目 标文本的第二检索区域中检索到的与所述识别文本匹配的文本的位置, 确定为文本定位结 果; 所述第二检索区域, 包括所述目标文本中的除所述第一检索区域之外的文本区域。 9.根据权利要求8所述的方法, 其特征在于, 所述将从所述目标文本的第 一检索区域中 检索到的与所述识别文本匹配的文本的位置, 确定为文本 定位结果, 包括: 若从所述目标文本的第一检索区域中检索到的与所述识别文本匹配的文本的位置的 数量为一个, 则确定从所述目标文本的第一检索区域中检索到的与所述识别文本匹配的文 本的位置为文本 定位结果; 若从所述目标文本的第一检索区域中检索到的与所述识别文本匹配的文本的位置的 数量为至少 两个, 则输出检索到的各个与所述识别文本匹配的文本的位置, 并根据用户反 馈的选择指令, 确定文本 定位结果; 所述选择指令包括用户从至少两个与所述识别文本匹配的文本的位置中选择文本位 置的指令 。 10.根据权利要求8所述的方法, 其特征在于, 所述将从所述目标文本的第二检索区域 中检索到的与所述识别文本匹配的文本的位置, 确定为文本 定位结果, 包括: 从目标文本的第二检索区域中检索与所述识别文本匹配的文本; 若从目标文本的第 二检索区域中检索到与 所述识别文本匹配的文本, 则根据从所述目 标文本的第二检索区域中检索到的与所述识别文本匹配的文本的位置, 确定文本定位结 果; 若从目标文本的第 二检索区域中未检索到与所述识别文本匹配的文本, 则 输出提示信 息, 所述提示信息用于提 示用户重新输入所述输入数据内容。 11.根据权利要求8所述的方法, 其特征在于, 所述第一检索区域包括第一区间和第二 区间; 所述从所述目标文本的第一检索区域中检索与所述识别文本匹配的文本, 包括: 从所述目标文本的第 一区间中检索与所述识别文本匹配的文本; 所述第 一区间包括当 前文本位置的所在页以及当前文本位置之后的M页; 若从所述目标文本的第 一区间中未检索到与所述识别文本匹配的文本, 则从所述目标 文本的第二区间中检索与所述识别文本匹配的文本, 所述第二区间包括当前文本位置之前权 利 要 求 书 2/3 页 3 CN 115223176 A 3

.PDF文档 专利 文本定位方法、装置、电子设备、扫描笔和存储介质

文档预览
中文文档 33 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共33页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 文本定位方法、装置、电子设备、扫描笔和存储介质 第 1 页 专利 文本定位方法、装置、电子设备、扫描笔和存储介质 第 2 页 专利 文本定位方法、装置、电子设备、扫描笔和存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 14:13:22上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。