说明:收录全网最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111682661.3 (22)申请日 2021.12.2 9 (71)申请人 深圳市优必选科技股份有限公司 地址 518000 广东省深圳市南 山区学苑大 道1001号南山智园C1栋16、 2 2楼 (72)发明人 丁万 黄东延 赵之源 杨志勇  (74)专利代理 机构 深圳中一联合知识产权代理 有限公司 4 4414 专利代理师 田甜 (51)Int.Cl. G10L 13/02(2013.01) G10L 19/16(2013.01) G10L 25/24(2013.01) G10L 25/30(2013.01) G06N 3/04(2006.01)G06N 3/08(2006.01) (54)发明名称 模型训练方法、 装置、 终端设备及计算机可 读存储介质 (57)摘要 本申请适用于数据处理技术领域, 提供了一 种模型训练方法、 装置、 终端设备及计算机可读 存储介质, 包括: 根据符合第一音频动态范围的 第一样本集对预设模型进行训练, 获得第一次训 练后的所述预设模型; 若第一次训练后的所述预 设模型在验证集上的第一模型精度小于目标精 度, 则扩大所述第一音频动态范围, 得到第二音 频动态范围; 根据符合所述第二音频动态范围的 第二样本集对第一次训练后的所述预设模型继 续进行训练, 直至获得满足所述目标精度的目标 模型。 通过上述方法, 可 以有效保证深度学习模 型的收敛效果, 降低深度学习模型的训练难度。 权利要求书2页 说明书10页 附图2页 CN 114512111 A 2022.05.17 CN 114512111 A 1.一种模型训练方法, 其特 征在于, 包括: 根据符合第 一音频动态范围的第 一样本集对预设模型进行训练, 获得第 一次训练后的 所述预设模型; 若第一次训练后的所述预设模型在验证集上的第 一模型精度小于目标精度, 则扩大所 述第一音频动态范围, 得到第二音频动态范围; 根据符合所述第二音频动态范围的第二样本集对第一次训练后的所述预设模型继续 进行训练, 直至获得满足所述目标精度的目标模型。 2.如权利要求1所述的模型训练方法, 其特征在于, 所述根据符合第 一音频动态范围的 第一样本集对预设模型进行训练, 获得第一次训练后的所述预设模型, 包括: 计算预设音频库中的音频样本的第三音频动态范围; 将所述预设音频库中满足预设条件的音频样本添加到所述第一样本集中, 其中, 所述 预设条件为所述第三音频动态范围小于所述第一音频动态范围。 根据所述第一样本集训练所述预设模型, 获得第一次训练后的所述预设模型。 3.如权利要求2所述的模型训练方法, 其特征在于, 所述将所述预设音频库中满足预设 条件的音频样本添加到所述第一样本集中, 包括: 若所述预设音频库中不存在满足所述预设条件的音频样本, 则将所述预设音频库中的 音频样本 压缩为满足所述预设条件的音频样本; 将满足所述预设条件的音频样本添加到所述第一样本集中。 4.如权利要求2所述的模型训练方法, 其特征在于, 所述将所述预设音频库中满足预设 条件的音频样本添加到所述第一样本集中, 包括: 从所述预设音频库中获取满足所述预设条件的音频样本, 得到第一 集合; 计算所述第一 集合中每个所述音频样本的训练价 值; 将所述第一 集合中训练价 值大于预设值的音频样本添加到所述第一样本集中。 5.如权利要求4所述的模型训练方法, 其特征在于, 所述计算所述第 一集合中每个所述 音频样本的训练价 值, 包括: 获取当前的所述预设模型在所述验证集上的第二模型精度; 根据所述第 二模型精度和所述第 一集合中每个所述音频样本的第 三音频动态范围, 计 算所述第一 集合中每个所述音频样本的训练价 值。 6.如权利要求2所述的模型训练方法, 其特征在于, 所述根据所述第 一样本集训练所述 预设模型, 获得第一次训练后的所述预设模型, 包括: 提取所述第一样本集中音频样本的声学特征和所述声学特征对应的音频采样点的实 际值; 将所述声学 特征输入所述预设模型, 输出音频采样点的预测值; 根据所述声学特征对应的音频采样点的所述实际值和所述预测值, 计算所述预设模型 的第一损失值; 若所述第一损失值大于第 一阈值, 则根据 所述第一损失值更新所述预设模型的模型参 数; 所述所述第 一损失值小于第 一阈值, 则将当前的预设模型确定为第 一次训练后的所述 预设模型。权 利 要 求 书 1/2 页 2 CN 114512111 A 27.如权利要求1所述的模型训练方法, 其特征在于, 在根据符合第 一音频动态范围的第 一样本集对预设模型进行训练, 获得第一次训练后的所述预设模型之后, 所述方法还 包括: 若第一次训练后的所述预设模型在验证集上的第 一模型精度等于或大于目标精度, 则 将第一次训练后的所述预设模型确定为目标模型。 8.一种模型训练装置, 其特 征在于, 包括: 第一训练单元, 用于根据符合第一音频动态范围的第一样本集对预设模型进行训练, 获得第一次训练后的所述预设模型; 范围扩大单元, 用于若第 一次训练后的所述预设模型在验证集上的第 一模型精度小于 目标精度, 则扩大 所述第一音频动态范围, 得到第二音频动态范围; 第二训练单元, 用于根据符合所述第 二音频动态范围的第 二样本集对第 一次训练后的 所述预设模型继续进行训练, 直至获得满足所述目标精度的目标模型。 9.一种终端设备, 包括存储器、 处理器以及存储在所述存储器中并可在所述处理器上 运行的计算机程序, 其特征在于, 所述处理器执行所述计算机程序时实现如权利要求1至7 任一项所述的方法。 10.一种计算机可读存储介质, 所述计算机可读存储介质存储有计算机程序, 其特征在 于, 所述计算机程序被处 理器执行时实现如权利要求1至7任一项所述的方法。权 利 要 求 书 2/2 页 3 CN 114512111 A 3

.PDF文档 专利 模型训练方法、装置、终端设备及计算机可读存储介质

文档预览
中文文档 15 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 模型训练方法、装置、终端设备及计算机可读存储介质 第 1 页 专利 模型训练方法、装置、终端设备及计算机可读存储介质 第 2 页 专利 模型训练方法、装置、终端设备及计算机可读存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-19 03:56:41上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。