说明:收录全网最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210394592.4 (22)申请日 2022.04.14 (71)申请人 海信电子科技(武汉)有限公司 地址 430073 湖北省武汉市东湖新 技术开 发区软件园东路1号软件产业4.1期B2 栋13层02号-2 (72)发明人 胡胜元 曹晚霞  (74)专利代理 机构 北京弘权知识产权代理有限 公司 11363 专利代理师 逯长明 许伟群 (51)Int.Cl. G06F 16/33(2019.01) G06F 16/335(2019.01) G06F 16/36(2019.01) G06F 40/126(2020.01)G06F 40/232(2020.01) G06F 40/295(2020.01) G06F 40/30(2020.01) (54)发明名称 一种用于多语言语义理解的实体纠错方法 及智能设备 (57)摘要 本申请实施例提供一种用 于多语言语义理 解的实体纠错方法及智 能设备, 方法包括: 获取 待纠错实体后, 利用音形码算法对待纠错实体进 行编码。 在音形码数据库中查找与编码后的待纠 错实体匹配的候选实体。 根据知识图谱对候选实 体进行筛选, 得到结果实体, 知识图谱描述候选 实体之间的关联关系, 结果实体为与其他候选实 体具有关联关系的候选实体。 本申请提供的用于 多语言语义理解的实体纠错方法及智能设备, 针 对多语言语义理解提供统一的框架, 可以在缺少 大规模训练数据的情况下, 跨越不同语言的影 响, 实现对不同语言的文本进行实体纠错, 从而 提升语义理解和实体识别的准确率, 提升多语言 语音识别产品的性能, 进 而提升用户使用体验。 权利要求书2页 说明书10页 附图5页 CN 114817465 A 2022.07.29 CN 114817465 A 1.一种用于多语言语义理解的实体纠错方法, 其特 征在于, 包括: 获取待纠 错实体, 其中, 所述待纠 错实体为对用户输入的请求语句进行语义分析处理 后得到的实体; 利用音形码算法对所述待纠错实体进行编码; 在音形码数据库中查找与编码后的所述待纠错实体匹配的候选实体; 根据知识图谱对所述候选实体进行筛选, 得到结果实体, 其中, 所述知识图谱描述所述 候选实体之 间的关联关系, 所述结果 实体为与其他所述候选实体具有关联关系的所述候选 实体。 2.根据权利要求1所述的用于多语言语义理解的实体纠错方法, 其特征在于, 在音形码 数据库中查找与编码后的所述待纠错实体匹配的候选实体, 具体步骤为: 获取所述待纠错实体的语言类型; 根据所述待纠错实体的语言类型调用所述音形码数据库; 在所述音形码数据库中查找与编码后的所述待纠错实体匹配的候选实体。 3.根据权利要求1所述的用于多语言语义理解的实体纠错方法, 其特征在于, 在音形码 数据库中查找与编码后的所述待纠错实体匹配的候选实体, 具体步骤为: 获取所述待纠错实体的业 务类型; 根据所述待纠错实体的业 务类型调用所述音形码数据库; 在所述音形码数据库中查找与编码后的所述待纠错实体匹配的候选实体。 4.根据权利要求1所述的用于多语言语义理解的实体纠错方法, 其特征在于, 在音形码 数据库中查找与编码后的所述待纠错实体匹配的候选实体, 具体步骤为: 在根据编码后的所述待纠错实体从音形码数据库中召回的候选实体数量为零 时, 从所 述待纠错实体中截取子 字符串; 利用音形码算法对所述子字符串进行编码, 以及在音形码数据库中查找与编码后的所 述子字符串匹配的候选实体。 5.根据权利要求1所述的用于多语言语义理解的实体纠错方法, 其特征在于, 在音形码 数据库中查找与编码后的所述待纠错实体匹配的候选实体, 具体步骤为: 在根据编码后的所述待纠错实体从音形码数据库中召回的候选实体数量大于数量阈 值N时, 计算所有所述 候选实体与所述待纠错实体的编辑距离; 按照编辑距离对所有所述候选实体进行排序, 以及将编辑距离按照由小到大的顺序排 序的前N个所述 候选实体确定为 最终的所述 候选实体。 6.根据权利要求1所述的用于多语言语义理解的实体纠错方法, 其特征在于, 实体编码 后具有特征向量, 第一实体的特征向量与第二实体的特征向量在编码空间的距离, 与所述 第一实体和所述第二实体的发音相似程度相匹配, 其中, 所述第一实体的语言类型和所述 第二实体的语言类型不同。 7.根据权利要求1所述的用于多语言语义理解的实体纠错方法, 其特征在于, 根据知识 图谱对所述候选实体进行筛 选, 得到结果实体, 具体步骤为: 在所述知识图谱中存在与 所述候选实体匹配的预存实体时, 将所述预存实体确定为所 述结果实体; 在所述知识图谱中不存在与 所述候选实体匹配的预存实体, 且在所述知识图谱中存在权 利 要 求 书 1/2 页 2 CN 114817465 A 2与所述候选实体中的子 字符匹配的预存实体, 将所述预存实体确定为所述结果实体。 8.根据权利要求1所述的用于多语言语义理解的实体纠错方法, 其特征在于, 所述音形 码数据库为预设的常用指令集, 所述 候选实体为用于生成常用指令的实体。 9.一种用于多语言语义理解的实体纠错的智能设备, 其特 征在于, 包括: 待纠错实体获取单元, 用于执行: 获取待纠错实体, 其中, 所述待纠 错实体为对用户输 入的请求语句进行语义分析处 理后得到的实体; 编码单元, 用于执 行: 利用音形码算法对所述待纠错实体进行编码; 候选实体查找单元, 用于执行: 在音形码数据库中查找与编码后的所述待纠 错实体匹 配的候选实体; 筛选单元, 用于执行: 根据知识图谱对所述候选实体进行筛选, 得到结果实体, 其中, 所 述知识图谱描述所述候选实体之间的关联关系, 所述结果实体为与其他所述候选实体具有 关联关系的所述 候选实体。 10.根据权利要求9所述的用于多语言语义理解的实体纠错的智能设备, 其特征在于, 在音形码数据库中查找与编码后的所述待纠错实体匹配的候选实体, 具体步骤为: 获取所述待纠错实体的语言类型; 根据所述待纠错实体的语言类型调用所述音形码数据库; 在所述音形码数据库中查找与编码后的所述待纠错实体匹配的候选实体。权 利 要 求 书 2/2 页 3 CN 114817465 A 3

.PDF文档 专利 一种用于多语言语义理解的实体纠错方法及智能设备

文档预览
中文文档 18 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共18页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种用于多语言语义理解的实体纠错方法及智能设备 第 1 页 专利 一种用于多语言语义理解的实体纠错方法及智能设备 第 2 页 专利 一种用于多语言语义理解的实体纠错方法及智能设备 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 08:54:32上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。