专利用于语义识别的方法及装置、控制指令的生成方法及装置

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210590459.6 (22)申请日 2022.05.26 (71)申请人阿波罗智联（北京）科技有限公司地址 100176 北京市大兴区北京经济技术开发区瑞合西二路7号院1号楼1层101 (72)发明人陈如君　 (74)专利代理机构北京市汉坤律师事务所 11602 专利代理师姜浩然　吴丽丽 (51)Int.Cl. G06F 40/30(2020.01) G06F 40/247(2020.01) G06F 16/35(2019.01) (54)发明名称用于语义识别的方法及装置、控制指令的生成方法及装置 (57)摘要本公开提供了一种用于语义识别的方法及装置、控制指令的生成方法及装置，涉及自动驾驶、车联网、智能座舱等人工智能技术领域，尤其涉及自然语言处理。实现方案为：将获取到的语音数据转化为文本信息；根据预先存储的第一词集合确定文本信息所包含的至少一个目标词，其中，第一词集合包括按照词义被预先分类成多个类别的多个目标词；以及响应于文本信息所包含的至少一个目标词满足预设的多个匹配条件中的至少一个匹配条件，根据预先确定好的与至少一个匹配条件中的每个匹配条件相对应的子语义，确定文本信息的语义。多个匹配条件中的每个匹配条件包括：文本信息所包含的至少一个目标词所属的至少一个类别包括多个类别中针对该匹配条件预先选定好的至少一个目标类别。权利要求书2页说明书11页附图4页 CN 114861675 A 2022.08.05 CN 114861675 A 1.一种用于语义识别的方法，包括：将获取到的语音数据转化为文本信息；根据预先存储的第一词集合确定所述文本信息所包含的至少一个目标词，其中，所述第一词集合包括按照词义被预先分类成多个类别的多个目标词；以及响应于所述文本信息所包含的至少一个目标词满足预设的多个匹配条件中的至少一个匹配条件，根据预先确定好的与所述至少一个匹配条件中的每个匹配条件相对应的子语义，确定所述文本信息的语义，其中，所述多个匹配条件中的每个匹配条件包括：所述文本信息所包含的至少一个目标词所属的至少一个类别包括所述多个类别中针对该匹配条件预先选定好的至少一个目标类别。 2.根据权利要求1所述的方法，其中，所述多个匹配条件中的至少部分匹配条件还包括：所述文本信息中属于所述至少一个目标类别的至少一个目标词按照针对该匹配条件预先设定好的顺序在所述文本信息中排列。 3.根据权利要求2所述的方法，其中，所述多个匹配条件中的至少部分匹配条件还包括：所述文本信息中属于所述至少一个目标类别的至少一个目标词在所述文本信息中所占的字数比例大于或等于针对该匹配条件预先设定好的阈值比例。 4.根据权利要求1所述的方法，其中，所述将获取到的语音数据转化为文本信息之后还包括：查询预先存储的包括多个偏差词的第二词集合，从所述文本信息中确定至少一个偏差词；以及对于所述至少一个偏差词中的每个偏差词，利于预先确定好的与该偏差词相对应的替换词对所述文本信息中的偏差词进行替换。 5.根据权利要求1所述的方法，其中，所述将获取到的语音数据转化为文本信息之后还包括：查询预先存储的包括多个忽略词的第三词集合，从所述文本信息中确定至少一个忽略词；以及从所述文本信息中删除所述至少一个忽略词。 6.根据权利要求1所述的方法，其中，将获取到的语音数据转化为文本信息包括：根据所述语音数据中存在的静音间隔将所述语音数据划分成多个语音语句；以及对于所述多个语音语句中的每个语音语句，将该语音语句转化为待进行语义识别的文本信息。 7.根据权利要求1 ‑6中任一项所述的方法，还包括：在将获取到的语音数据转化为文本信息之前，获取当前接收到的网络信号的信号强度；响应于所述信号强度大于预设的强度阈值，将获取到的语音数据上传至服务器，利用所述服务器内的语义识别模型进行在线语义识别。 8.根据权利要求1 ‑6中任一项所述的方法，还包括：响应于所述文本信息不满足预设的多个匹配条件中的任一匹配条件，重新将获取到的权　利　要　求　书 1/2 页 2 CN 114861675 A 2语音数据转化为文本信息或确定所述文本信息不包含任何语义。 9.一种控制指令的生成方法，包括：获取用户输入的语音数据；执行如权利要求1 ‑8中任一项所述用于语义识别的方法；以及根据所确定的文本信息的语义，生成控制指令。 10.一种用于语义识别的装置，包括：转化单元，配置成将获取到的语音数据转化为文本信息；第一确定单元，配置成根据预先存储的第一词集合确定所述文本信息所包含的至少一个目标词，其中，所述第一词集合包括按照词义被预先分类成多个类别的多个目标词；以及第二确定单元，配置成响应于所述文本信息所包含的至少一个目标词满足预设的多个匹配条件中的至少一个匹配条件，根据预先确定好的与所述至少一个匹配条件中的每个匹配条件相对应的子语义，确定所述文本信息的语义，其中，所述多个匹配条件中的每个匹配条件包括：所述文本信息所包含的至少一个目标词所属的至少一个类别包括所述多个类别中针对该匹配条件预先选定好的至少一个目标类别。 11.一种控制指令的生成装置，包括：获取装置，配置成获取用户输入的语音数据；如权利要求10所述的用于语义识别的装置；以及生成装置，配置成根据所确定的文本信息的语义，生成控制指令。 12.一种电子设备，包括：至少一个处理器；以及与所述至少一个处理器通信连接的存储器；其中所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行权利要求1 ‑9中任一项所述的方法。 13.一种存储有计算机指令的非瞬时计算机可读存储介质，其中，所述计算机指令用于使所述计算机执行根据权利要求1 ‑9中任一项所述的方法。 14.一种计算机程序产品，包括计算机程序，其中，所述计算机程序在被处理器执行时实现权利要求1 ‑9中任一项所述的方法。权　利　要　求　书 2/2 页 3 CN 114861675 A 3

专利 用于语义识别的方法及装置、控制指令的生成方法及装置

专利用于语义识别的方法及装置、控制指令的生成方法及装置