专利模型训练方法、装置、终端设备及计算机可读存储介质

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202111682661.3 (22)申请日 2021.12.2 9 (71)申请人深圳市优必选科技股份有限公司地址 518000 广东省深圳市南山区学苑大道1001号南山智园C1栋16、 2 2楼 (72)发明人丁万　黄东延　赵之源　杨志勇　 (74)专利代理机构深圳中一联合知识产权代理有限公司 4 4414 专利代理师田甜 (51)Int.Cl. G10L 13/02(2013.01) G10L 19/16(2013.01) G10L 25/24(2013.01) G10L 25/30(2013.01) G06N 3/04(2006.01)G06N 3/08(2006.01) (54)发明名称模型训练方法、装置、终端设备及计算机可读存储介质 (57)摘要本申请适用于数据处理技术领域，提供了一种模型训练方法、装置、终端设备及计算机可读存储介质，包括：根据符合第一音频动态范围的第一样本集对预设模型进行训练，获得第一次训练后的所述预设模型；若第一次训练后的所述预设模型在验证集上的第一模型精度小于目标精度，则扩大所述第一音频动态范围，得到第二音频动态范围；根据符合所述第二音频动态范围的第二样本集对第一次训练后的所述预设模型继续进行训练，直至获得满足所述目标精度的目标模型。通过上述方法，可以有效保证深度学习模型的收敛效果，降低深度学习模型的训练难度。权利要求书2页说明书10页附图2页 CN 114512111 A 2022.05.17 CN 114512111 A 1.一种模型训练方法，其特征在于，包括：根据符合第一音频动态范围的第一样本集对预设模型进行训练，获得第一次训练后的所述预设模型；若第一次训练后的所述预设模型在验证集上的第一模型精度小于目标精度，则扩大所述第一音频动态范围，得到第二音频动态范围；根据符合所述第二音频动态范围的第二样本集对第一次训练后的所述预设模型继续进行训练，直至获得满足所述目标精度的目标模型。 2.如权利要求1所述的模型训练方法，其特征在于，所述根据符合第一音频动态范围的第一样本集对预设模型进行训练，获得第一次训练后的所述预设模型，包括：计算预设音频库中的音频样本的第三音频动态范围；将所述预设音频库中满足预设条件的音频样本添加到所述第一样本集中，其中，所述预设条件为所述第三音频动态范围小于所述第一音频动态范围。根据所述第一样本集训练所述预设模型，获得第一次训练后的所述预设模型。 3.如权利要求2所述的模型训练方法，其特征在于，所述将所述预设音频库中满足预设条件的音频样本添加到所述第一样本集中，包括：若所述预设音频库中不存在满足所述预设条件的音频样本，则将所述预设音频库中的音频样本压缩为满足所述预设条件的音频样本；将满足所述预设条件的音频样本添加到所述第一样本集中。 4.如权利要求2所述的模型训练方法，其特征在于，所述将所述预设音频库中满足预设条件的音频样本添加到所述第一样本集中，包括：从所述预设音频库中获取满足所述预设条件的音频样本，得到第一集合；计算所述第一集合中每个所述音频样本的训练价值；将所述第一集合中训练价值大于预设值的音频样本添加到所述第一样本集中。 5.如权利要求4所述的模型训练方法，其特征在于，所述计算所述第一集合中每个所述音频样本的训练价值，包括：获取当前的所述预设模型在所述验证集上的第二模型精度；根据所述第二模型精度和所述第一集合中每个所述音频样本的第三音频动态范围，计算所述第一集合中每个所述音频样本的训练价值。 6.如权利要求2所述的模型训练方法，其特征在于，所述根据所述第一样本集训练所述预设模型，获得第一次训练后的所述预设模型，包括：提取所述第一样本集中音频样本的声学特征和所述声学特征对应的音频采样点的实际值；将所述声学特征输入所述预设模型，输出音频采样点的预测值；根据所述声学特征对应的音频采样点的所述实际值和所述预测值，计算所述预设模型的第一损失值；若所述第一损失值大于第一阈值，则根据所述第一损失值更新所述预设模型的模型参数；所述所述第一损失值小于第一阈值，则将当前的预设模型确定为第一次训练后的所述预设模型。权　利　要　求　书 1/2 页 2 CN 114512111 A 27.如权利要求1所述的模型训练方法，其特征在于，在根据符合第一音频动态范围的第一样本集对预设模型进行训练，获得第一次训练后的所述预设模型之后，所述方法还包括：若第一次训练后的所述预设模型在验证集上的第一模型精度等于或大于目标精度，则将第一次训练后的所述预设模型确定为目标模型。 8.一种模型训练装置，其特征在于，包括：第一训练单元，用于根据符合第一音频动态范围的第一样本集对预设模型进行训练，获得第一次训练后的所述预设模型；范围扩大单元，用于若第一次训练后的所述预设模型在验证集上的第一模型精度小于目标精度，则扩大所述第一音频动态范围，得到第二音频动态范围；第二训练单元，用于根据符合所述第二音频动态范围的第二样本集对第一次训练后的所述预设模型继续进行训练，直至获得满足所述目标精度的目标模型。 9.一种终端设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现如权利要求1至7 任一项所述的方法。 10.一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的方法。权　利　要　求　书 2/2 页 3 CN 114512111 A 3

专利 模型训练方法、装置、终端设备及计算机可读存储介质

专利模型训练方法、装置、终端设备及计算机可读存储介质