说明:收录全网最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210725560.8 (22)申请日 2022.06.24 (71)申请人 科大讯飞股份有限公司 地址 230088 安徽省合肥市高新区望江西 路666号 (72)发明人 颜伟 王士进 盛志超 汪洋  李宝善 李荣真 童寅 齐海霞  (74)专利代理 机构 北京布瑞知识产权代理有限 公司 11505 专利代理师 尚文文 (51)Int.Cl. G06F 40/253(2020.01) G06F 40/295(2020.01) G06F 40/30(2020.01) (54)发明名称 识别语法的方法、 装置、 电子设备、 扫描笔及 存储介质 (57)摘要 本发明实施例提供了一种识别语法的方法、 装置、 电子设备、 扫描笔及存储介质, 方法包括: 获取待识别语句中每个单词的语义信息; 其中, 每个单词的语义信息包括字词、 原型、 词性、 命名 实体字段和文本位置; 根据所述每个单词的语义 信息, 从第一语 法识别规则中确定出与所述待识 别语句匹配的第一目标语 法识别规则; 所述第一 语法识别规则, 包括用于识别至少一种语法错误 的规则; 根据所述第一目标语 法识别规则对应的 语法错误类型, 以及所述每个单词的语义信息, 确定所述待识别语句的语 法错误信息。 本发明实 施例提供的方法能够识别出语句中存在的语法 错误。 权利要求书3页 说明书18页 附图2页 CN 115221867 A 2022.10.21 CN 115221867 A 1.一种识别语法的方法, 其特 征在于, 所述方法包括: 获取待识别语句中每个单词的语义信息; 其中, 每个单词的语义信息包括字词、 原型、 词性、 命名实体字段和文本位置; 根据所述每个单词的语义信 息, 从第一语法识别规则中确定出与所述待识别语句匹配 的第一目标语法识别规则; 所述第一语法识别规则, 包括用于识别至少一种语法错误的规 则; 根据所述第一目标语法识别规则对应的语法错误类型, 以及所述每个单词的语义信 息, 确定所述待识别语句的语法错 误信息。 2.根据权利要求1所述的方法, 其特征在于, 所述第 一语法识别规则包括用于识别至少 一种句法错 误的规则; 当所述第一目标语法识别规则为句法识别规则时, 所述根据所述第 一目标语法识别规 则对应的语法错误类型, 以及所述每个单词的语义信息, 确定所述待识别语句的语法错误 信息, 包括: 根据所述第一目标语法识别规则对应的句法错误类型, 以及所述每个单词的语义信 息, 确定所述待识别语句的句法错 误信息; 其中, 所述句法错误信息包括句法错误类型、 句法修改建议和对句法的评语中的至少 一项, 以及句法错 误位置。 3.根据权利要求1所述的方法, 其特征在于, 所述第 一语法识别规则包括用于识别至少 一种词法错 误的规则; 当所述第一目标语法识别规则为词法识别规则时, 所述根据所述第 一目标语法识别规 则对应的语法错误类型, 以及所述每个单词的语义信息, 确定所述待识别语句的语法错误 信息, 包括: 根据所述第一目标语法识别规则对应的词法错误类型, 以及所述每个单词的语义信 息, 确定所述待识别语句的词法错 误信息; 其中, 所述词法错误信息包括词法错误类型、 词法修改建议和对词法的评语中的至少 一项, 以及词法错 误位置。 4.根据权利要求1 ‑3任一项所述的方法, 其特征在于, 所述获取待识别语句中每个单词 的语义信息, 包括: 获取所述待识别语句; 对所述待识别语句进行分词, 得到 至少一个单词; 识别所述待识别语句中每 个单词的语义信息 。 5.根据权利要求4所述的方法, 其特征在于, 在所述对所述待识别语句进行分词, 得到 至少一个单词之前, 所述方法还 包括: 识别并修 正所述待识别语句的错 误字符和/或错 误格式。 6.根据权利要求1所述的方法, 其特征在于, 在所述获取待识别语句中每个单词的语义 信息之后, 所述方法还 包括: 根据所述每个单词的语义信 息, 从第二语法识别规则中确定出与所述待识别语句匹配 的第二目标语法识别规则; 所述第二语法识别规则, 包括用于识别至少一种语法点的规则; 根据所述第二目标语法识别规则对应的语法点, 以及所述每个单词的语义信息, 确定权 利 要 求 书 1/3 页 2 CN 115221867 A 2所述待识别语句的语法点信息 。 7.根据权利要求6所述的方法, 其特征在于, 所述语法点信息包括语法点卡片、 语法点 水平、 语法点展示优先级中的至少一项, 以及语法点 位置。 8.根据权利要求6所述的方法, 其特征在于, 所述第二语法识别规则还包括高级词汇 和/或高级短语识别规则; 当所述第二目标语法识别规则为高级词汇和/或高级短语识别规则时, 所述根据所述 第二目标语法识别规则对应的语法点, 以及所述每个单词的语义信息, 确定所述待识别语 句的语法点信息, 包括: 根据所述第二目标语法识别规则对应的高级词汇和/或高级短语, 以及所述每个单词 的语义信息, 确定所述待识别语句的高级词汇和/或高级短语信息; 所述高级词汇和/或高级短语信息包括高级词汇和/或高级短语的位置, 以及对高级词 汇和/或高级短语的评语。 9.根据权利要求1所述的方法, 其特征在于, 所述获取待识别语句中每个单词的语义信 息之后, 所述方法还 包括: 根据所述每个单词的语义信 息, 从所述词典中检测与 所述待识别语句的每个单词匹配 的词条, 词典中包括单词、 词组和命名实体词; 若对于所述待识别语句中的任一单词, 未从所述词典中检测到与该单词 匹配的词条, 则根据该 单词的语义信息, 确定所述待识别语句的拼写错 误信息; 所述拼写错误信息包括 拼写错误位置和对拼写错 误的评语。 10.一种识别语法的装置, 其特 征在于, 所述装置包括: 获取模块, 用于获取待识别语句中每个单词的语义信息; 其中, 每个单词的语义信 息包 括字词、 原型、 词性、 命名实体字段和文本位置; 确定模块, 用于根据所述每个单词的语义信息, 从第一语法识别规则中确定出与所述 待识别语句匹配的第一 目标语法识别规则; 所述第一语法识别规则, 包括用于识别至少一 种错误语法的规则; 还用于根据所述第一 目标语法识别规则对应的语法错误类型, 以及所 述每个单词的语义信息, 确定所述待识别语句的语法错 误信息。 11.一种电子设备, 其特 征在于, 包括: 存 储器和处 理器; 其中, 所述存 储器与所述处 理器连接, 用于存 储程序; 所述处理器, 用于通过运行所述存储器中的程序, 实现如权利要求1至9中任一项所述 的识别语法的方法。 12.一种扫描笔, 其特 征在于, 所述扫描笔包括: 扫描摄像头, 以及与所述扫描摄 像头连接的处 理器; 所述扫描摄 像头用于采集待识别语句, 并将所述待识别语句发送给 所述处理器; 所述处理器用于识别获取的待识别语句中每个单词的语义信息; 其中, 每个单词的语 义信息包括字词、 原型、 词性、 命名实体字段和文本位置; 还用于根据所述每个单词的语义 信息, 从第一语法识别规则中确定出与所述待识别语句匹配的第一 目标语法识别规则; 所 述第一语法识别规则, 包括用于识别至少一种语法错误的规则; 还用于根据所述第一 目标 语法识别规则对应的语法错误类型, 以及所述每个单词的语义信息, 确定所述待识别语句 的语法错 误信息。权 利 要 求 书 2/3 页 3 CN 115221867 A 3

.PDF文档 专利 识别语法的方法、装置、电子设备、扫描笔及存储介质

文档预览
中文文档 24 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共24页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 识别语法的方法、装置、电子设备、扫描笔及存储介质 第 1 页 专利 识别语法的方法、装置、电子设备、扫描笔及存储介质 第 2 页 专利 识别语法的方法、装置、电子设备、扫描笔及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 14:14:49上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。