(19)国家知识产权局
(12)发明 专利
(10)授权公告 号
(45)授权公告日
(21)申请 号 202210807024.2
(22)申请日 2022.07.11
(65)同一申请的已公布的文献号
申请公布号 CN 114863929 A
(43)申请公布日 2022.08.05
(73)专利权人 深圳市人马互动科技有限公司
地址 518000 广东省深圳市粤海街道高新
区社区高新南环路46号留学生创业大
厦二期20层
(72)发明人 李进峰 高爱玲 赖晓荣 杨雯绚
(74)专利代理 机构 深圳市华盛智荟知识产权代
理事务所(普通 合伙) 44604
专利代理师 王晓艳
(51)Int.Cl.
G10L 15/22(2006.01)G10L 15/30(2013.01)
G10L 13/02(2013.01)
G06F 40/30(2020.01)
(56)对比文件
CN 111508477 A,2020.08.07
CN 111508477 A,2020.08.07
CN 111508474 A,2020.08.07
CN 112818096 A,2021.0 5.18
CN 112637431 A,2021.04.09
CN 114724561 A,202 2.07.08
CN 111402881 A,2020.07.10
CN 113113013 A,2021.07.13
CN 111970409 A,2020.1 1.20
审查员 孙筱逸
(54)发明名称
语音交互方法、 装置、 系统、 计算机设备和存
储介质
(57)摘要
本申请涉及一种语音交互方法、 装置、 系统、
计算机设备和存储介质。 语音交互方法包括: 接
收语音控制机器人发送的待播报语音信息以及
与所述待播报语音信息关联的控制指令; 所述控
制指令为针对所述待播报语音信息中的至少一
个语句的控制指令; 对所述待播报语音信息进行
语音播报; 基于所述控制指令获取语音播报过程
中与至少一个语句对应的语音输入信息; 基于所
述语音输入信息, 从所述语音控制机器人中获取
响应语音信息, 并对所述响应语音信息进行语音
播报。 上述方案能够针对性获取语音输入对应的
响应语音信息, 进而对响应语音信息进行播报,
可以对语音输入进行可靠 响应, 实现与用户的智
能语音交 互。
权利要求书7页 说明书22页 附图3页
CN 114863929 B
2022.10.21
CN 114863929 B
1.一种语音交 互方法, 其特 征在于, 所述方法包括:
接收语音控制机器人发送的待播报语音信息以及与所述待播报语音信息关联的控制
指令; 所述控制指令为针对所述待播报语音信息中的至少一个语句的控制指令; 所述控制
指令的类型包括输入反馈控制指令、 允许打断指令和禁止打断指令; 所述控制指令下设二
级指令; 所述允许打断指令的二级指令包括时间反馈指令, 所述禁止打断指令的二级指令
包括追加内容指令、 禁止识别指令和允许识别指令;
对所述待播报语音信息进行语音播报;
基于所述控制指令获取语音播报过程中与至少一个 语句对应的语音输入信息;
基于所述语音输入信息, 从所述语音控制机器人中获取响应语音信息, 并对所述响应
语音信息进行语音播报;
若所述控制指令包括输入反馈控制指令, 所述方法还包括: 在所述待播报语音信息中
的至少一个语句结束播报后到达输入启动节点; 当用户在所述输入启动节点没有语音输入
时进行追问, 而当用户持续没有语音输入时即时结束语音交 互;
若所述控制指令包括所述允许打断指令且所述允许打断指令包含时间反馈指令, 所述
方法还包括: 基于语音输入内容和输入时间从语音控制机器人中获取响应 语音信息;
若所述控制指令包括所述禁止打断指令且所述禁止打断指令包含追加内容指令, 所述
方法还包括: 若用户语音输入能匹配到回答, 将匹配到的回答添加到追加内容指令指定的
文本位置之后进行播报;
若所述控制指令为禁止打断指令且所述禁止打断指令携带禁止识别指令, 所述方法还
包括: 在对所述待播报语音信息进行语音播报的过程中监听到与至少一个语句对应的语音
输入时, 忽略所述语音输入;
若所述控制指令为禁止打断指令且所述禁止打断指令携带允许识别指令, 所述方法还
包括: 在对所述待播报语音信息进行语音播报的过程中监听到与至少一个语句对应的语音
输入时, 将所述语音输入对应的语音输入信息发送给语音识别器后忽略所述语音识别器返
回的语音 文本。
2.根据权利要求1所述的方法, 其特征在于, 所述基于所述控制 指令获取语音播报过程
中与至少一个 语句对应的语音输入信息, 包括:
当所述控制指令为允许打断指令且在语音播报的允许打断时间段中监听到与至少一
个语句对应的语音输入时, 中断对所述待播报语音信息的语音播报, 在语音输入结束时确
定所述语音输入 对应的语音输入信息 。
3.根据权利要求2所述的方法, 其特征在于, 所述待播报语音信 息包含至少一个交互节
点;
所述在语音输入结束时确定所述语音输入 对应的语音输入信息, 包括:
获取语音输入对应的语音输入内容以及所述语音输入内容对应的输入时间, 得到所述
语音输入信息;
相应的, 所述基于所述语音输入信 息, 从所述语音控制机器人中获取响应语音信 息, 包
括:
基于所述输入时间在所述至少一个交互节点中确定所述语音输入内容对应的目标交
互节点;权 利 要 求 书 1/7 页
2
CN 114863929 B
2基于所述语音输入内容和所述目标交互节点从所述语音控制机器人中获取响应语音
信息。
4.根据权利要求3所述的方法, 其特征在于, 所述基于所述语音输入信息, 从所述语音
控制机器人中获取响应 语音信息, 包括:
若所述允许打 断指令携带时间反馈指令, 接收所述语音控制机器人获取的与 所述语音
输入内容和所述输入时间对应的响应 语音信息 。
5.根据权利要求3所述的方法, 其特征在于, 所述基于所述语音输入内容和所述目标交
互节点从所述语音控制机器人中获取响应 语音信息, 包括:
将所述语音输入内容和所述目标交 互节点发送至所述语音控制机器人;
接收所述语音控制机器人获取的与所述语音输入内容和所述目标交互节点对应的响
应语音信息; 所述语音控制 机器人用于基于所述语音输入内容进行语义理解, 基于语义理
解的结果和所述目标交互节点确定用户意图, 确定与所述用户意图相匹配的响应语音信
息。
6.根据权利要求3所述的方法, 其特征在于, 所述基于所述控制 指令获取语音播报过程
中与至少一个 语句对应的语音输入信息之后, 还 包括:
若基于所述语音输入信 息未从所述语音控制机器人中获取到响应语音信 息, 则判定响
应失败;
若所述待播报语音信 息未播报完毕, 则从中断位置继续对所述待播报语音信 息进行语
音播报。
7.根据权利要求2所述的方法, 其特征在于, 所述基于所述控制 指令获取语音播报过程
中与至少一个 语句对应的语音输入信息, 包括:
若所述允许打 断指令为任意打断指令, 则在语音播报过程的任意 时刻监听到与至少一
个语句对应的语音输入时, 确定所述语音输入 对应的语音输入信息;
若所述允许打 断指令为智能打断指令, 确定所述待播报语音信 息对应的允许打断时间
段, 当在所述允许打断时间段中监听到与至少一个语句对应的语音输入时, 确定所述语音
输入对应的语音输入信息 。
8.根据权利要求7所述的方法, 其特征在于, 所述待播报语音信 息包含至少一个语音播
报端点;
所述确定所述待播报语音信息对应的允许打断时间段, 包括:
根据预先设置的允许打断时长、 允许打断起始端点和允许打断终止端点中的至少两项
确定所述待播报语音信息对应的允许打断时间段。
9.根据权利要求1至8任一项所述的方法, 其特征在于, 所述对所述待播报语音信息进
行语音播报之后, 还 包括:
在所述控制指令为禁止打断指令的情况下, 当在语音播报的过程中监 听到与至少一个
语句对应的语音输入时, 或者, 在所述控制指 令为允许打断指 令的情况下, 当在语音播报的
禁止打断时间段中监听到与至少一个语句对应的语音输入时, 继续对所述待播报 语音信息
进行语音播报, 并在语音播报的过程中获取 所述语音输入 对应的语音输入信息;
在所述待播报语音信 息中的至少一个语句结束播报后, 基于所述语音输入信 息从所述
语音控制机器人中获取响应 语音信息, 并对所述响应 语音信息进行语音播报。权 利 要 求 书 2/7 页
3
CN 114863929 B
3
专利 语音交互方法、装置、系统、计算机设备和存储介质
文档预览
中文文档
33 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共33页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 14:15:03上传分享