说明:收录全网最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210743094.6 (22)申请日 2022.06.27 (71)申请人 深圳市北 科瑞声科技股份有限公司 地址 518036 广东省深圳市福田区梅林街 道梅都社区中康路136号深圳新一代 产业园3栋1201-6 (72)发明人 黄石磊 廖晨 陈诚 冯湘 熊霞  (74)专利代理 机构 深圳智汇远见知识产权代理 有限公司 4 4481 专利代理师 蒋学超 (51)Int.Cl. H04M 3/523(2006.01) G10L 15/22(2006.01) G10L 15/18(2013.01) G10L 15/26(2006.01)G06F 40/186(2020.01) G06F 40/30(2020.01) G06K 9/62(2022.01) (54)发明名称 基于语义识别的语音外呼方法、 装置、 设备 及介质 (57)摘要 本申请涉及一种基于语义识别的语音外呼 方法、 装置、 设备及存储介质。 所述方法包括: 通 过获取用户的电话号码及行程信息, 基于电话号 码向用户发起外呼请求, 当用户响应外呼请求 时, 向用户反馈行程信息对应的模板文本生成的 模板语音数据, 接收用户基于模板语音数据反馈 的待处理语音, 基于预设的意图文本集或预先训 练的语义识别模 型, 识别出待处理语音的目标语 义信息, 基于目标语义信息从预设的话术表单中 匹配出目标话术文本, 将目标话术文本转换成中 间语音数据后反馈至用户。 本申请可以提高自动 流调的外呼过程中语音识别的准确率。 权利要求书2页 说明书10页 附图2页 CN 115174748 A 2022.10.11 CN 115174748 A 1.一种基于语义识别的语音外呼方法, 其特 征在于, 所述方法包括: 获取用户的电话 号码及行程信息, 基于所述电话 号码向所述用户发起外呼请求; 当所述用户响应所述外呼请求 时, 向所述用户反馈所述行程信 息对应的模板文本生成 的模板语音数据; 接收所述用户基于所述模板语音数据反馈的待处理语音, 基于预设的意图文本集或预 先训练的语义识别模型, 识别出 所述待处 理语音的目标语义信息; 基于所述目标语义信 息从预设的话术表单中匹配出目标话术文本, 将所述目标话术文 本转换成中间语音数据后反馈 至所述用户。 2.如权利要求1所述的基于语义识别的语音外呼方法, 其特征在于, 在接收所述用户基 于所述模板语音数据反馈的待处 理语音之后, 所述方法还 包括: 对所述待处理语音执行回声消除处理、 降噪处理及增强放大处理, 得到预处理后的所 述待处理语音。 3.如权利要求1或2所述的基于语义识别的语音外呼方法, 其特征在于, 所述基于预设 的意图文本集或预 先训练的语义识别模型, 识别出 所述待处 理语音的目标语义信息, 包括: 基于预先训练 的语音识别模型识别所述待处理语音的文本信 息, 将所述文本信 息与所 述意图文本集进 行相似度计算, 得到所述文本信息与所述意图文本集中每个意图文本的相 似度值; 判断是否存在相似度值大于预设阈值的意图文本; 当判断存在相似度值大于预设阈值的意图文本时, 从相似度值大于预设阈值的意图文 本中选取出相似度值最大的意图文本, 将相似度值最大的意图文本的语义作为所述待处理 语音的目标语义信息; 当判断不存在相似度值大于预设阈值的意图文本时, 将所述文本信 息输入所述语义识 别模型, 得到所述待处 理语音的目标语义信息 。 4.如权利要求3所述的基于语义识别的语音外呼方法, 其特征在于, 所述基于预先训练 的语音识别模型识别所述待处 理语音的文本信息, 包括: 获取所述用户的身份信 息, 基于所述身份信 息调用所述待处理语音对应的语音识别模 型; 将所述待处 理语音输入所述语音识别模型, 得到所述待处 理语音的文本信息 。 5.如权利要求3所述的基于语义识别的语音外呼方法, 其特征在于, 所述将所述文本信 息与所述意图文本集进行相似度计算, 得到所述文本信息与所述意图文本集中每个意图文 本的相似度值, 包括: 分别将所述文本信息及每 个意图文本转换成对应的句向量; 利用相似度算法分别计算所述文本信 息的句向量与每个意图文本的句向量的相似度, 得到所述文本信息与所述 意图文本集中每 个意图文本的相似度值。 6.如权利要求1所述的基于语义识别的语音外呼方法, 其特征在于, 所述基于所述目标 语义信息从预设的话 术表单中匹配出目标话 术文本, 包括: 将所述目标语义信息与所述 话术表单中的话 术文本集进行匹配; 当所述目标语义信 息与所述话术文本集中任一话术文本匹配成功时, 将匹配成功的话 术文本作为所述目标话 术文本;权 利 要 求 书 1/2 页 2 CN 115174748 A 2当所述目标语义信 息与所述话术文本集中的话术文本均匹配失败时, 将预设的通用话 术文本作为所述目标话 术文本。 7.如权利要求1所述的基于语义识别的语音外呼方法, 其特征在于, 在将所述目标话术 文本转换成中间语音数据后反馈 至所述用户之后, 所述方法还 包括: 将所述待处 理语音及所述中间语音数据存 储预设数据库。 8.一种基于语义识别的语音外呼装置, 其特 征在于, 所述装置包括: 外呼模块: 用于获取用户的 电话号码及行程信息, 基于所述电话号码向所述用户发起 外呼请求; 第一反馈模块: 用于当所述用户响应所述外呼请求时, 向所述用户反馈所述行程信息 对应的模板文本生成的模板语音数据; 识别模块: 用于接收所述用户基于所述模板语音数据反馈的待处理语音, 基于预设的 意图文本集或预 先训练的语义识别模型, 识别出 所述待处 理语音的目标语义信息; 第二反馈模块: 用于基于所述目标语义信息从预设的话术表单中匹配出目标话术文 本, 将所述目标话 术文本转换成中间语音数据后反馈 至所述用户。 9.一种电子设备, 其特征在于, 包括处理器、 通信接口、 存储器和通信总线, 其中, 处理 器, 通信接口, 存 储器通过通信总线完成相互间的通信; 存储器, 用于存放计算机程序; 处理器, 用于执行存储器上所存放的程序时, 实现权利要求1至7中任一项所述的基于 语义识别的语音外呼方法。 10.一种计算机可读存储介质, 其上存储有计算机程序, 其特征在于, 所述计算机程序 被处理器执行时实现如权利要求1至7中任一项所述基于语义识别的语音外呼方法的步骤。权 利 要 求 书 2/2 页 3 CN 115174748 A 3

.PDF文档 专利 基于语义识别的语音外呼方法、装置、设备及介质

文档预览
中文文档 15 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于语义识别的语音外呼方法、装置、设备及介质 第 1 页 专利 基于语义识别的语音外呼方法、装置、设备及介质 第 2 页 专利 基于语义识别的语音外呼方法、装置、设备及介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 14:12:20上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。