专利多任务模型训练方法、装置及计算机可读存储介质

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210568388.X (22)申请日 2022.05.23 (71)申请人北京地平线信息技术有限公司地址 100094 北京市海淀区丰豪东路9号院 2号楼3层1单元301 (72)发明人周恩慈　张骞　黄畅　 (74)专利代理机构北京思源智汇知识产权代理有限公司 1 1657 专利代理师李洪娟 (51)Int.Cl. G06V 10/774(2022.01) G06V 10/80(2022.01) G06V 10/82(2022.01) G06N 3/08(2006.01) G06N 5/04(2006.01) (54)发明名称多任务模型训练方法、装置及计算机可读存储介质 (57)摘要公开了一种多任务模型训练方法、装置及计算机可读存储介质。该方法包括：确定多个数据源对应的多组样本图像，其中，每一数据源对应一组样本图像；确定待训练的多任务模型的目标 BN参数、目标权重参数和目标偏置参数；通过多组样本图像，对目标BN参数、目标权重参数和目标偏置参数进行第一阶段训练；将目标BN参数置于推理状态；在目标BN参数的推理状态下，通过多组样本图像对目标权重参数和目标偏置参数进行第二阶段训练。本公开实施例可以提升训练得到的多任务模型的性能。权利要求书2页说明书13页附图9页 CN 114998676 A 2022.09.02 CN 114998676 A 1.一种多任务模型训练方法，包括：确定多个数据源对应的多组样本图像，其中，每一数据源对应一组样本图像；确定待训练的多任务模型的目标BN 参数、目标权重参数和目标偏置参数；通过所述多组样本图像，对所述目标BN参数、所述目标权重参数和所述目标偏置参数进行第一阶段训练；将所述目标BN 参数置于推理状态；在所述目标BN参数的推理状态下，通过所述多组样本图像对所述目标权重参数和所述目标偏置参数进行第二阶段训练。 2.根据权利要求1所述的方法，其中，所述目标BN参数包括所述多任务模型的BN均值、 BN方差、 BN权重和BN偏置，所述目标权重参数包括所述多任务模型的除了BN权重之外的权重，所述目标偏置参数包括所述多任务模型的除了BN偏置之外的偏置；或者，所述目标BN参数包括所述多任务模型的BN均值和BN方差，所述目标权重参数包括所述多任务模型的BN权重和所述多任务模型的除了BN权重之外的权重，所述目标偏置参数包括所述多任务模型的BN偏置和所述多任务模型的除了BN偏置之外的偏置。 3.根据权利要求2所述的方法，其中，若所述目标BN参数包括所述多任务模型的BN均值、 BN方差、 BN权重和BN偏置，所述将所述目标BN 参数置于推理状态，包括：将所述多任务模型中BN层的层状态值设置为第一预设值；将所述多任务模型中BN权重和BN偏置各自的参数状态值均设置为第二预设值；或者，若所述目标BN参数包括所述多任务模型的BN均值和BN方差，所述将所述目标BN参数置于推理状态，包括：将所述多任务模型中BN层的层状态值设置为第一预设值。 4.根据权利要求1所述的方法，其中，所述将所述目标BN 参数置于推理状态，包括：将所述多任务模型中的特征提取网络的第一BN参数置于推理状态，所述第一BN参数至少包括所述特征提取网络的BN均值和BN方差；将所述多任务模型中的特征融合网络的第二BN参数置于推理状态，所述第二BN参数至少包括所述特征融合网络的BN均值和BN方差；所述方法还包括：在所述第一BN参数的推理状态下，通过所述多组样本图像对所述特征提取网络的除了所述第一BN参数之外的权重和偏置，所述第二BN参数，所述特征融合网络的除了所述第二 BN参数之外的权重和偏置，以及所述多任务模型中的非共享网络的权重和偏置进行第三阶段训练。 5.根据权利要求1至4中任一所述的方法，其中，所述第一阶段训练使用的学习率为第一学习率；所述第二阶段训练使用的学习率为第二学习率，所述第二学习率大于或等于所述第一权　利　要　求　书 1/2 页 2 CN 114998676 A 2学习率。 6.根据权利要求1至4中任一所述的方法，还包括：响应于所述多任务模型中的非共享网络中的目标预测网络满足预设参数更新条件，将所述非共享网络中除了所述目标预测网络之外的预测网络的权重和偏置均置于推理状态；将所述多任务模型中的共享网络的位于所述目标BN参数之外的权重和偏置均置于推理状态；通过所述多组样本图像对所述目标预测网络的权重和偏置进行第四阶段训练。 7.根据权利要求6所述的方法，还包括：响应于所述目标检测网络的权重和偏置均置于推理状态，将所述目标检测网络的权重和偏置由推理状态切换为训练状态；所述通过所述多组样本图像对所述目标预测网络的权重和偏置进行第四阶段训练，包括：在所述目标预测网络的权重和偏置的训练状态下，通过所述多组样本图像对所述目标预测网络的权重和偏置进行第四阶段训练。 8.一种多任务模型训练装置，包括：第一确定模块，用于确定多个数据源对应的多组样本图像，其中，每一数据源对应一组样本图像；第二确定模块，用于确定待训练的多任务模型的目标BN参数、目标权重参数和目标偏置参数；第一训练模块，用于通过所述第一确定模块确定的所述多组样本图像，对所述第二确定模块确定的所述目标BN参数、所述目标权重参数和所述目标偏置参数进行第一阶段训练；第一状态设置模块，用于将所述第二确定模块确定的所述目标BN 参数置于推理状态；第二训练模块，用于在所述第二确定模块确定的所述目标BN参数的推理状态下，通过所述第一确定模块确定的所述多组样本图像对所述第二确定模块确定的所述目标权重参数和所述目标偏置参数进行第二阶段训练。 9.一种计算机可读存储介质，所述存储介质存储有计算机程序，所述计算机程序用于执行上述权利要求1 ‑7中任一所述的多任务模型训练方法。 10.一种电子设备，所述电子设备包括：处理器；用于存储所述处理器可执行指令的存储器；所述处理器，用于从所述存储器中读取所述可执行指令，并执行所述指令以实现上述权利要求1 ‑7中任一所述的多任务模型训练方法。权　利　要　求　书 2/2 页 3 CN 114998676 A 3

专利 多任务模型训练方法、装置及计算机可读存储介质

专利多任务模型训练方法、装置及计算机可读存储介质