专利基于语义识别的语音外呼方法、装置、设备及介质

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210743094.6 (22)申请日 2022.06.27 (71)申请人深圳市北科瑞声科技股份有限公司地址 518036 广东省深圳市福田区梅林街道梅都社区中康路136号深圳新一代产业园3栋1201-6 (72)发明人黄石磊　廖晨　陈诚　冯湘　熊霞　 (74)专利代理机构深圳智汇远见知识产权代理有限公司 4 4481 专利代理师蒋学超 (51)Int.Cl. H04M 3/523(2006.01) G10L 15/22(2006.01) G10L 15/18(2013.01) G10L 15/26(2006.01)G06F 40/186(2020.01) G06F 40/30(2020.01) G06K 9/62(2022.01) (54)发明名称基于语义识别的语音外呼方法、装置、设备及介质 (57)摘要本申请涉及一种基于语义识别的语音外呼方法、装置、设备及存储介质。所述方法包括：通过获取用户的电话号码及行程信息，基于电话号码向用户发起外呼请求，当用户响应外呼请求时，向用户反馈行程信息对应的模板文本生成的模板语音数据，接收用户基于模板语音数据反馈的待处理语音，基于预设的意图文本集或预先训练的语义识别模型，识别出待处理语音的目标语义信息，基于目标语义信息从预设的话术表单中匹配出目标话术文本，将目标话术文本转换成中间语音数据后反馈至用户。本申请可以提高自动流调的外呼过程中语音识别的准确率。权利要求书2页说明书10页附图2页 CN 115174748 A 2022.10.11 CN 115174748 A 1.一种基于语义识别的语音外呼方法，其特征在于，所述方法包括：获取用户的电话号码及行程信息，基于所述电话号码向所述用户发起外呼请求；当所述用户响应所述外呼请求时，向所述用户反馈所述行程信息对应的模板文本生成的模板语音数据；接收所述用户基于所述模板语音数据反馈的待处理语音，基于预设的意图文本集或预先训练的语义识别模型，识别出所述待处理语音的目标语义信息；基于所述目标语义信息从预设的话术表单中匹配出目标话术文本，将所述目标话术文本转换成中间语音数据后反馈至所述用户。 2.如权利要求1所述的基于语义识别的语音外呼方法，其特征在于，在接收所述用户基于所述模板语音数据反馈的待处理语音之后，所述方法还包括：对所述待处理语音执行回声消除处理、降噪处理及增强放大处理，得到预处理后的所述待处理语音。 3.如权利要求1或2所述的基于语义识别的语音外呼方法，其特征在于，所述基于预设的意图文本集或预先训练的语义识别模型，识别出所述待处理语音的目标语义信息，包括：基于预先训练的语音识别模型识别所述待处理语音的文本信息，将所述文本信息与所述意图文本集进行相似度计算，得到所述文本信息与所述意图文本集中每个意图文本的相似度值；判断是否存在相似度值大于预设阈值的意图文本；当判断存在相似度值大于预设阈值的意图文本时，从相似度值大于预设阈值的意图文本中选取出相似度值最大的意图文本，将相似度值最大的意图文本的语义作为所述待处理语音的目标语义信息；当判断不存在相似度值大于预设阈值的意图文本时，将所述文本信息输入所述语义识别模型，得到所述待处理语音的目标语义信息。 4.如权利要求3所述的基于语义识别的语音外呼方法，其特征在于，所述基于预先训练的语音识别模型识别所述待处理语音的文本信息，包括：获取所述用户的身份信息，基于所述身份信息调用所述待处理语音对应的语音识别模型；将所述待处理语音输入所述语音识别模型，得到所述待处理语音的文本信息。 5.如权利要求3所述的基于语义识别的语音外呼方法，其特征在于，所述将所述文本信息与所述意图文本集进行相似度计算，得到所述文本信息与所述意图文本集中每个意图文本的相似度值，包括：分别将所述文本信息及每个意图文本转换成对应的句向量；利用相似度算法分别计算所述文本信息的句向量与每个意图文本的句向量的相似度，得到所述文本信息与所述意图文本集中每个意图文本的相似度值。 6.如权利要求1所述的基于语义识别的语音外呼方法，其特征在于，所述基于所述目标语义信息从预设的话术表单中匹配出目标话术文本，包括：将所述目标语义信息与所述话术表单中的话术文本集进行匹配；当所述目标语义信息与所述话术文本集中任一话术文本匹配成功时，将匹配成功的话术文本作为所述目标话术文本；权　利　要　求　书 1/2 页 2 CN 115174748 A 2当所述目标语义信息与所述话术文本集中的话术文本均匹配失败时，将预设的通用话术文本作为所述目标话术文本。 7.如权利要求1所述的基于语义识别的语音外呼方法，其特征在于，在将所述目标话术文本转换成中间语音数据后反馈至所述用户之后，所述方法还包括：将所述待处理语音及所述中间语音数据存储预设数据库。 8.一种基于语义识别的语音外呼装置，其特征在于，所述装置包括：外呼模块：用于获取用户的电话号码及行程信息，基于所述电话号码向所述用户发起外呼请求；第一反馈模块：用于当所述用户响应所述外呼请求时，向所述用户反馈所述行程信息对应的模板文本生成的模板语音数据；识别模块：用于接收所述用户基于所述模板语音数据反馈的待处理语音，基于预设的意图文本集或预先训练的语义识别模型，识别出所述待处理语音的目标语义信息；第二反馈模块：用于基于所述目标语义信息从预设的话术表单中匹配出目标话术文本，将所述目标话术文本转换成中间语音数据后反馈至所述用户。 9.一种电子设备，其特征在于，包括处理器、通信接口、存储器和通信总线，其中，处理器，通信接口，存储器通过通信总线完成相互间的通信；存储器，用于存放计算机程序；处理器，用于执行存储器上所存放的程序时，实现权利要求1至7中任一项所述的基于语义识别的语音外呼方法。 10.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述基于语义识别的语音外呼方法的步骤。权　利　要　求　书 2/2 页 3 CN 115174748 A 3

专利 基于语义识别的语音外呼方法、装置、设备及介质

专利基于语义识别的语音外呼方法、装置、设备及介质