说明:收录全网最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210833826.0 (22)申请日 2022.07.15 (71)申请人 中国建设银行股份有限公司 地址 100033 北京市西城区金融大街25号 申请人 建信金融科技有限责任公司 (72)发明人 炊向军 范会善 王炼 罗贤桂  赵新阳 董劲麟  (74)专利代理 机构 北京清亦华知识产权代理事 务所(普通 合伙) 11201 专利代理师 孟洋 (51)Int.Cl. G10L 15/22(2006.01) G10L 15/02(2006.01) G10L 15/20(2006.01) G10L 25/30(2013.01)G06F 40/30(2020.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 语音交互方法、 装置、 电子设备及存 储介质 (57)摘要 本公开提出了一种语音交互方法、 装置、 电 子设备及存储介质, 涉及人工智能语音识别技术 领域, 该方法包括: 获取候选对象相对机器人的 特征数据; 基于特征数据确定候选对象的筛选权 重; 基于筛选权重从候选对象中确定机器人需要 服务的一个或多个目标对象; 基于目标对象 的数 量, 确定机器人的目标服务模式; 控制机器人从 当前服务模式切换至目标服务模式。 通过对候选 对象的特征数据进行分析确定候选对象的筛选 权重, 进而根据筛选权重从候选对象中确定目标 对象, 可以提升确认目标对象的准确率, 并根据 目标对象的数量选择不同的目标服务模式, 提升 了不同目标对象数量下目标对象与机器人的交 互体验和交 互效率。 权利要求书2页 说明书10页 附图5页 CN 115240669 A 2022.10.25 CN 115240669 A 1.一种语音交 互方法, 其特 征在于, 包括: 获取候选对象相对机器人的特 征数据; 基于所述特 征数据确定所述 候选对象的筛 选权重; 基于所述筛选权重从所述候选对象中确定所述机器人需要服务的一个或多个目标对 象; 基于所述目标对象的数量, 确定所述机器人的目标服 务模式; 控制所述机器人从当前服 务模式切换至所述目标服 务模式。 2.根据权利要求1所述的方法, 其特征在于, 所述特征数据包括所述候选对象与所述机 器人之间的有效距离, 所述基于所述特 征数据确定所述 候选对象的筛 选权重, 包括: 从所述候选对象中, 获取所述有效距离小于距离阈值的第一候选对象, 并捕捉所述第 一候选对象的人脸信息; 响应于捕捉所述第 一候选对象的人脸信 息成功, 将捕捉成功的所述第 一候选对象确定 为第二候选对象; 采集所述第二候选对象的语音数据, 并基于所述人脸信息、 所述语音数据和所述第二 候选对象的坐标确定所述第二 候选对象的筛 选权重。 3.根据权利要求2所述的方法, 其特征在于, 所述基于所述人脸信息、 所述语音数据和 所述第二 候选对象的坐标确定所述第二 候选对象的筛 选权重, 包括: 对所述人脸信息、 所述语音数据和所述第二候选对象的坐标各自的有效值进行加权; 以及 对所述人脸信息、 所述语音数据和所述 候选对象的坐标 各自预设的偏移值进行加权; 基于加权后的所述有效值和 加权后的所述偏移值确定所述第二 候选对象的筛 选权重。 4.根据权利要求1 ‑3中任一项所述的方法, 其特征在于, 所述基于所述筛选权重从所述 候选对象中确定所述机器人需要服 务的一个或多个目标对象, 包括: 确定所述筛 选权重值大于目标阈值的所述第二 候选对象为所述目标对象。 5.根据权利要求1所述的方法, 其特征在于, 所述控制所述机器人从当前服务模式切换 至所述目标服 务模式之后, 还 包括: 基于所述目标服 务模式调整麦克风阵列单 元, 以采集所述目标对象的实时语音; 选取与所述目标服务模式匹配的语音处理模式, 并基于所述语音处理模式对所述实时 语音进行语义处 理; 基于语义处 理结果生成所述目标对象的应答信息 。 6.根据权利要求5所述的方法, 其特征在于, 所述基于所述目标对象的数量, 确定所述 机器人的目标服 务模式, 包括: 响应于所述目标对象的数量 为多个, 选取第一 服务模式作为所述目标服 务模式; 或者 响应于所述目标对象的数量 为一个, 选取第二 服务模式作为所述目标服 务模式。 7.根据权利要求6所述的方法, 其特征在于, 所述目标服务模式为所述第一服务模式, 所述方法还 包括: 根据所述目标对象的所述筛选权重, 确定所述机器人为所述目标对象提供服务的服务 顺序; 增强朝向所述服务顺序最前的所述目标对象方向的所述麦克风阵列 单元的采音功能,权 利 要 求 书 1/2 页 2 CN 115240669 A 2并采集实时语音; 将所述语音处理模式切换至第一语音处理模式, 其中, 所述第一语义处理模式对应的 语料数据小于或者 等于第一语料 数量; 基于所述第一语音处 理模式对所述实时语音 进行语义处 理; 基于语义处 理结果对所述 服务顺序最前的所述目标对象进行应答。 8.根据权利要求6所述的方法, 其特征在于, 所述目标服务模式为所述第二服务模式, 所述方法还 包括: 强化朝向所述目标对象方向的所述麦克风阵列 单元的采音功能, 并弱化其他方向的所 述麦克风阵列单 元的采音功能, 并采集实时语音; 将所述语音处理模式切换至第二语音处理模式, 其中, 所述第二语音处理模式对应的 语料数据大于第二语料 数量; 基于所述第二语音处 理模式对所述实时语音 进行语义处 理; 基于语义处 理结果对所述目标对象进行应答。 9.一种语音交 互装置, 其特 征在于, 包括: 获取模块, 用于获取候选对象相对机器人的特 征数据; 确定模块, 用于基于所述特 征数据确定所述 候选对象的筛 选权重; 筛选模块, 用于基于所述筛选权重从所述候选对象中确定所述机器人需要服务的一个 或多个目标对象; 选取模块, 用于基于所述目标对象的数量, 确定所述机器人的目标服 务模式; 切换模块, 用于控制所述机器人从当前服 务模式切换至所述目标服 务模式。 10.一种电子设备, 其特 征在于, 包括存 储器、 处理器; 其中, 所述处理器通过读取所述存储器中存储的可执行程序代码来运行与 所述可执行 程序代码对应的程序, 以用于实现如权利要求1 ‑8中任一项所述的方法。 11.一种计算机可读存储介质, 其上存储有计算机程序, 其特征在于, 该程序被处理器 执行时实现如权利要求1 ‑8中任一项所述的方法。 12.一种计算机程序产品, 包括计算机程序, 所述计算机程序在被处理器执行时实现根 据权利要求1 ‑8中任一项所述的方法。权 利 要 求 书 2/2 页 3 CN 115240669 A 3

.PDF文档 专利 语音交互方法、装置、电子设备及存储介质

文档预览
中文文档 18 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共18页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 语音交互方法、装置、电子设备及存储介质 第 1 页 专利 语音交互方法、装置、电子设备及存储介质 第 2 页 专利 语音交互方法、装置、电子设备及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 14:15:02上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。