说明:收录全网最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210590459.6 (22)申请日 2022.05.26 (71)申请人 阿波罗智联 (北京) 科技有限公司 地址 100176 北京市大兴区北京经济技 术 开发区瑞合西二路7号院1号楼1层101 (72)发明人 陈如君  (74)专利代理 机构 北京市汉坤律师事务所 11602 专利代理师 姜浩然 吴丽丽 (51)Int.Cl. G06F 40/30(2020.01) G06F 40/247(2020.01) G06F 16/35(2019.01) (54)发明名称 用于语义识别的方法及 装置、 控制指令的生 成方法及装置 (57)摘要 本公开提供了一种用于语义识别的方法及 装置、 控制指令的生成方法及装置, 涉及自动驾 驶、 车联网、 智能座舱等人工智能技术领域, 尤其 涉及自然语言处理。 实现方案为: 将获取到的语 音数据转化为文本信息; 根据预先存储的第一词 集合确定文本信息所包含的至少一个目标词, 其 中, 第一词集合包括按照词义被预先分类成多个 类别的多个目标词; 以及响应于文本信息所包含 的至少一个目标词满足预设的多个匹配条件中 的至少一个匹配条件, 根据预先确定好的与至少 一个匹配条件中的每个匹配条件相对应的子语 义, 确定文本信息的语义。 多个匹配条件中的每 个匹配条件包括: 文本信息所包含的至少一个目 标词所属的至少一个类别包括多个类别中针对 该匹配条件预 先选定好的至少一个目标类别。 权利要求书2页 说明书11页 附图4页 CN 114861675 A 2022.08.05 CN 114861675 A 1.一种用于语义识别的方法, 包括: 将获取到的语音数据转 化为文本信息; 根据预先存储的第一词集合确定所述文本信息所包含的至少一个目标词, 其中, 所述 第一词集 合包括按照词义被预 先分类成多个 类别的多个目标词; 以及 响应于所述文本信息所包含的至少一个目标词满足预设的多个匹配条件中的至少一 个匹配条件, 根据预先确定好的与所述至少一个匹配条件中的每个匹配条件相对应的子语 义, 确定所述文本信息的语义, 其中, 所述多个匹配条件中的每个匹配条件包括: 所述文本 信息所包含的至少一个目标词 所属的至少一个类别包括所述多个类别中针对该匹配条件 预先选定好的至少一个目标类别。 2.根据权利要求1所述的方法, 其中, 所述多个匹配条件中的至少部分匹配条件还包 括: 所述文本信息中属于所述至少一个目标类别的至少一个目标词按照针对该匹配条件 预先设定好的顺序在所述文本信息中排列。 3.根据权利要求2所述的方法, 其中, 所述多个匹配条件中的至少部分匹配条件还包 括: 所述文本信息中属于所述至少一个目标类别的至少一个目标词在所述文本信息中所 占的字数比例大于或等于针对该匹配条件预 先设定好的阈值比例。 4.根据权利要求1所述的方法, 其中, 所述将 获取到的语音数据转化为文本信 息之后还 包括: 查询预先存储的包括多个偏差词的第 二词集合, 从所述文本信 息中确定至少一个偏差 词; 以及 对于所述至少一个偏差词中的每个偏差词, 利于预先确定好的与该偏差词相对应的替 换词对所述文本信息中的偏差词进行替换。 5.根据权利要求1所述的方法, 其中, 所述将 获取到的语音数据转化为文本信 息之后还 包括: 查询预先存储的包括多个忽略词的第 三词集合, 从所述文本信 息中确定至少一个忽略 词; 以及 从所述文本信息中删除所述至少一个忽略词。 6.根据权利要求1所述的方法, 其中, 将获取到的语音数据转 化为文本信息包括: 根据所述语音数据中存在的静音间隔将所述语音数据划分成多个 语音语句; 以及 对于所述多个语音语句中的每个语音语句, 将该语音语句转化为待进行语义识别的文 本信息。 7.根据权利要求1 ‑6中任一项所述的方法, 还 包括: 在将获取到的语音数据转化为文本信息之前, 获取当前接收到的网络信号的信号强 度; 响应于所述信号强度大于预设的强度阈值, 将获取到的语音数据上传至服务器, 利用 所述服务器内的语义识别模型进行在线语义识别。 8.根据权利要求1 ‑6中任一项所述的方法, 还 包括: 响应于所述文本信 息不满足预设的多个匹配条件中的任一匹配条件, 重新将 获取到的权 利 要 求 书 1/2 页 2 CN 114861675 A 2语音数据转 化为文本信息或确定所述文本信息不包 含任何语义。 9.一种控制指令的生成方法, 包括: 获取用户输入的语音数据; 执行如权利要求1 ‑8中任一项所述用于语义识别的方法; 以及 根据所确定的文本信息的语义, 生成控制指令 。 10.一种用于语义识别的装置, 包括: 转化单元, 配置成将获取到的语音数据转 化为文本信息; 第一确定单元, 配置成根据 预先存储的第 一词集合确定所述文本信 息所包含的至少一 个目标词, 其中, 所述第一词集 合包括按照词义被预 先分类成多个 类别的多个目标词; 以及 第二确定单元, 配置成响应于所述文本信 息所包含的至少一个目标词满足预设的多个 匹配条件中的至少一个匹配条件, 根据预先确定好的与所述至少一个匹配条件中的每个匹 配条件相对应的子语义, 确定所述文本信息的语义, 其中, 所述多个匹配条件中的每个匹配 条件包括: 所述文本信息所包含的至少一个目标词所属的至少一个类别包括所述多个类别 中针对该匹配条件预 先选定好的至少一个目标类别。 11.一种控制指令的生成装置, 包括: 获取装置, 配置成获取用户输入的语音数据; 如权利要求10所述的用于语义识别的装置; 以及 生成装置, 配置成根据所确定的文本信息的语义, 生成控制指令 。 12.一种电子设备, 包括: 至少一个处 理器; 以及 与所述至少一个处 理器通信连接的存 储器; 其中 所述存储器存储有可被所述至少一个处理器执行的指令, 所述指令被所述至少一个处 理器执行, 以使所述至少一个处 理器能够执 行权利要求1 ‑9中任一项所述的方法。 13.一种存储有计算机指令的非瞬时计算机可读存储介质, 其中, 所述计算机指令用于 使所述计算机执 行根据权利要求1 ‑9中任一项所述的方法。 14.一种计算机程序产品, 包括计算机程序, 其中, 所述计算机程序在被处理器执行时 实现权利要求1 ‑9中任一项所述的方法。权 利 要 求 书 2/2 页 3 CN 114861675 A 3

.PDF文档 专利 用于语义识别的方法及装置、控制指令的生成方法及装置

文档预览
中文文档 18 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共18页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 用于语义识别的方法及装置、控制指令的生成方法及装置 第 1 页 专利 用于语义识别的方法及装置、控制指令的生成方法及装置 第 2 页 专利 用于语义识别的方法及装置、控制指令的生成方法及装置 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 14:14:10上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。