说明:收录全网最新的团体标准 提供单次或批量下载
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111633258.1 (22)申请日 2021.12.2 9 (71)申请人 广州繁星互娱信息科技有限公司 地址 510500 广东省广州市黄埔区广新路 680、 682、 684 号701房 (仅限办公用途) (72)发明人 何思远  (74)专利代理 机构 北京柏杉松知识产权代理事 务所(普通 合伙) 11413 代理人 项京 孙翠贤 (51)Int.Cl. H04N 21/435(2011.01) H04N 21/439(2011.01) H04N 21/4788(2011.01) H04N 21/2187(2011.01) G10L 13/047(2013.01)G10L 25/51(2013.01) G06F 16/33(2019.01) G06K 9/62(2022.01) (54)发明名称 一种语音信息的生成方法、 装置、 电子设备 及存储介质 (57)摘要 本发明实施例提供了一种语音信息的生成 方法、 装置、 电子设备及存储介质, 上述方法包 括: 在接收到第一目标用户触发预设事件的触发 指令后, 获取与该预设事件对应的预设文本信 息, 将预设文本信息输入预先训练得到的声音模 拟模型, 生成对应的第一语音信息, 将第一语音 信息发送至第一目标用户所在的终端, 以使终端 播放第一语音信息。 采用该方法可以根据进入第 一目标用户之间的用户的不同定义不同的预设 文本信息, 实现了在不影 响第二目标用户进行直 播的前提下, 为进入第二目标用户直播间的用户 提供比较个性的语音信息, 丰富了用户之间的信 息交流方式。 权利要求书2页 说明书12页 附图2页 CN 114302217 A 2022.04.08 CN 114302217 A 1.一种语音信息的生成方法, 其特 征在于, 包括: 在接收到第 一目标用户触发预设事件的触发指令后, 获取与 该预设事件对应的预设文 本信息, 其中, 所述预设事件为: 第二目标用户的直播间的观看直播选项、 关注选项、 评论选 项、 弹幕选项或点赞选项被 触发的事 件; 将所述预设文本信息输入预先训练得到的声音模拟模型, 生成对应的第一语音信息, 其中, 所述声音模拟模型为基于样本文本信息和所述第二目标用户的声音 特征进行训练得 到的; 将所述第一语音信 息发送至第 一目标用户所在的终端, 以使所述终端播放所述第 一语 音信息。 2.根据权利要求1所述的方法, 其特 征在于, 所述声 音模拟模型的训练方法包括: 将样本文本信息 输入待训练声 音模拟模型, 并输出对应的语音信息; 提取所述语音信息的声 音特征; 确定所述声 音特征和所述第二目标用户的声 音特征之间的特 征差异值; 如果所述特征差异值小于预设差异阈值, 将当前的待训练声音模拟模型确定为训练得 到的所述声 音模拟模型; 如果所述特征差异值不小于预设差异阈值, 调整待训练声音模拟模型的参数, 并返回 所述将样本文本信息 输入待训练声 音模拟模型的步骤。 3.根据权利要求1所述的方法, 其特征在于, 在所述将所述预设文本信 息输入预先训练 得到的声 音模拟模型之前, 还 包括: 获取所述第一目标用户的用户名; 根据所述用户名和所述预设文本信息生成目标文本信息; 所述将所述预设文本信 息输入预先训练得到的声音模拟模型, 生成对应的第 一语音信 息, 包括: 将所述目标文本信息 输入预先训练得到的声 音模拟模型, 生成对应的第一语音信息 。 4.根据权利要求1所述的方法, 其特征在于, 在所述获取与该预设事件对应的预设文本 信息之前, 还 包括: 获取所述第一目标用户与所述第二目标用户之间的亲密度; 所述获取与该 预设事件对应的预设文本信息, 包括: 判断所述亲密度是否高于预设亲密度阈值; 如果所述亲密度高于所述预设亲密度阈值, 查找与所述第 一目标用户对应的预设语音 信息, 并将所述预设语音信息发送至第一 目标用户所在的终端, 以使所述终端播放所述预 设语音信息, 其中, 所述预设语音信息为所述第二 目标用户预先针对所述第一目标用户录 制的; 如果所述亲密度不高于所述预设亲密度阈值, 获取与该预设事件对应的预设文本信 息。 5.根据权利要求1所述的方法, 其特征在于, 在所述将所述第 一语音信 息发送至第 一目 标用户所在的终端之前, 还 包括: 确定是否 接收到所述第二目标用户发送的不认可 所述第一语音信息的指令; 如果是, 获取 所述第二目标用户录制的第二语音信息;权 利 要 求 书 1/2 页 2 CN 114302217 A 2计算所述第二语音信息与所述第一语音信息之间的相似度; 所述将所述第一语音信息发送至第一目标用户所在的终端, 包括: 判断所述相似度是否大于预设相似度阈值; 如果所述相似度 大于预设相似度阈值, 将所述第 二语音信 息发送至第 一目标用户所在 的终端。 6.根据权利要求1所述的方法, 其特征在于, 所述预设事件为所述第 一目标用户触发所 述第二目标用户的直 播间的观看直 播选项; 在所述终端播 放所述第一语音信息之前, 还 包括: 确定所述第二目标用户是否处于在直 播间进行 讲话的状态中; 如果是, 将所述第 一目标用户所在终端所播放的所述第 二目标用户的讲话音量调 整至 预设音量, 其中, 所述预设音量小于所述终端播 放的所述第一语音信息的音量。 7.一种语音信息的生成装置, 其特 征在于, 包括: 第一文本信息获取模块, 用于在接收到第一目标用户触发预设事件的触发指令后, 获 取与该预设事件对应的预设文本信息, 其中, 所述预设事件为: 第二目标用户的直播间的观 看直播选项、 关注选项、 评论选项、 弹幕选项或点赞选项被 触发的事 件; 语音信息生成模块, 用于将所述预设文本信息输入预先训练得到的声音模拟模型, 生 成对应的第一语音信息, 其中, 所述声音模拟模型为基于样本文本信息和所述第二 目标用 户的声音特征进行训练得到的; 语音信息发送模块, 用于将所述第一语音信息发送至第一目标用户所在的终端, 以使 所述终端播 放所述第一语音信息 。 8.一种电子设备, 其特征在于, 包括处理器、 通信接口、 存储器和通信总线, 其中, 处理 器, 通信接口, 存 储器通过通信总线完成相互间的通信; 存储器, 用于存放计算机程序; 处理器, 用于执 行存储器上所存放的程序时, 实现权利要求1 ‑6任一所述的方法步骤。 9.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质内存储有计算机 程序, 所述计算机程序被处 理器执行时实现权利要求1 ‑6任一所述的方法步骤。权 利 要 求 书 2/2 页 3 CN 114302217 A 3

.PDF文档 专利 一种语音信息的生成方法、装置、电子设备及存储介质

文档预览
中文文档 17 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共17页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种语音信息的生成方法、装置、电子设备及存储介质 第 1 页 专利 一种语音信息的生成方法、装置、电子设备及存储介质 第 2 页 专利 一种语音信息的生成方法、装置、电子设备及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 20:43:02上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。