专利用于文本检测的模型训练方法、装置、计算机设备及介质

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210608453.7 (22)申请日 2022.05.31 (71)申请人深圳壹账通智能科技有限公司地址 518000 广东省深圳市前海深港合作区前湾一路1号A栋201室 (72)发明人蒋宏达　陈家豪　徐亮　 (74)专利代理机构深圳众鼎专利商标代理事务所(普通合伙) 44325 专利代理师姚章国 (51)Int.Cl. G06F 40/30(2020.01) G06F 40/242(2020.01) G06K 9/62(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称用于文本检测的模型训练方法、装置、计算机设备及介质 (57)摘要本发明涉及人工智能技术领域，尤其涉及一种用于文本检测的模型训练方法、装置、计算机设备及介质。该方法将训练文本输入模板预测模型得到预训练模板，并确定预训练模板与多个人工模板的相似度最大值为训练参考值，将训练文本与预训练模板拼接为预检测文本，输入文本检测模型，得到预检测结果，根据预检测结果、标注以及训练参考值，训练模板预测模型，再将训练文本输入训练好的模板预测模型，将输出的预测模板与训练文本拼接为检测文本，并输入文本检测模型，得到检测结果，根据检测结果和标注，训练文本检测模型，得到训练好的文本检测模型，采用预测模板能够有效地提高文本检测模型的训练效率和准确性，以及文本检测模型的泛化能力。权利要求书3页说明书13页附图3页 CN 114925700 A 2022.08.19 CN 114925700 A 1.一种用于文本检测的模型训练方法，其特征在于，所述方法包括：将已知标注的训练文本输入模板预测模型得到预训练模板后，将所述预训练模板与N 个人工模板进行相似度计算，确定计算结果的最大值为训练参考值， N为大于零的整数；将所述训练文本与所述预训练模板拼接构成的预检测文本，输入预训练好的文本检测模型，得到预检测结果；根据所述预检测结果与所述训练文本的标注的比较结果，以及所述训练参考值，更新所述模板预测模型的参数，迭代直至收敛，得到训练好的模板预测模型；将所述训练文本输入所述训练好的模板预测模型，输出的预测模板与所述训练文本拼接构成检测文本，并将所述检测文本输入预训练好的文本检测模型，得到检测结果；根据所述检测结果与所述训练文本的标注的比较结果，更新所述文本检测模型的参数，迭代直至收敛，得到训练好的文本检测模型。 2.根据权利要求1所述的模型训练方法，其特征在于，所述将所述预训练模板与N个人工模板进行相似度计算，确定计算结果的最大值为训练参考值包括：使用预训练好的语义模型，提取所述预训练模板的预测词向量以及N个人工模板的人工词向量；计算所述预测词向量与每个人工词向量的余弦相似度，确定N个余弦相似度中的最大值为训练参考值。 3.根据权利要求2所述的模型训练方法，其特征在于，所述预测词向量包括M个预测词项，所述人工词向量包括K个人工词项， M和K均为大于零的整数；在所述提取所述预训练模板的预测词向量以及N个人工模板的人工词向量之后，还包括：针对任一人工词向量，采用最大权匹配算法，将所述预测词向量的预测词项与人工词向量的人工词项进行匹配，得到对应预测词项的匹配人工词项；提取所有匹配人工词项在所述人工词向量中的位置顺序，按照所述位置顺序更新对应预测词项在所述预测词向量中的位置顺序，得到更新的预测词向量；所述计算所述预测词向量与每个人工词向量的余弦相似度包括：计算更新后的预测词向量与更新所使用的人工词向量的余弦相似度。 4.根据权利要求1所述的模型训练方法，其特征在于，所述预检测结果包括文本预检测类别和对应的预检测置信度；所述根据所述预检测结果与所述训练文本的标注的比较结果，以及所述训练参考值，更新所述模板预测模型的参数，迭代直至收敛，得到训练好的模板预测模型包括：将所述文本预检测类别与所述训练文本的标注进行比较，得到第一比较结果，所述第一比较结果包括相同和不相同；根据所述第一比较结果，确定预训练指标值，所述第一比较结果为相同时，所述预训练指标值为所述对应的预检测置信度，所述第一比较结果为不相同时，所述预训练指标值为第一预设值；根据所述训练参考值和所述预训练指标值更新所述模板预测模型的参数，迭代直至收敛，得到训练好的模板预测模型。 5.根据权利要求4所述的模型训练方法，其特征在于，所述根据所述训练参考值和所述权　利　要　求　书 1/3 页 2 CN 114925700 A 2预训练指标值更新所述模板预测模型的参数，迭代直至收敛，得到训练好的模板预测模型包括：根据所述训练参考值和所述预训练指标值计算第一损失函数，以所述第一损失函数为依据，采用梯度下降法反向更新所述模板预测模型的参数，迭代直至所述第一损失函数收敛，得到训练好的模板预测模型，其中，所述第一损失函数具体为： L1＝k1(s‑1)2+k2(p1‑1)2 其中， L1为所述第一损失函数， s为所述训练参考值，值域为[0， 1]， p1为所述预训练指标值，值域为[0， 1]， k1为第一权重， k2为第二权重。 6.根据权利要求1至5任一项所述的模型训练方法，其特征在于，所述检测结果包括文本检测类别和对应的检测置信度；所述根据所述检测结果与所述训练文本的标注的比较结果，更新所述文本检测模型的参数，迭代直至收敛，得到训练好的文本检测模型包括：将所述文本检测类别与所述训练文本的标注进行比较，得到第二比较结果，所述第二比较结果包括相同和不相同；根据所述第二比较结果，确定训练指标值，所述第二比较结果为相同时，所述训练指标值为所述对应的检测置信度，所述第二比较结果为不相同时，所述训练指标值为第二预设值；根据所述训练指标值更新所述文本检测模型的参数，迭代直至收敛，得到训练好的文本检测模型。 7.根据权利要求6所述的模型训练方法，其特征在于，所述根据所述训练指标值更新所述文本检测模型的参数，迭代直至收敛，得到训练好的文本检测模型包括：根据所述训练指标值计算第二损失函数，以所述第二损失函数为依据，采用梯度下降法反向更新所述文本检测模型的参数，直至所述第二损失函数收敛，得到训练好的文本检测模型，其中，所述第二损失函数具体为： L2＝k3(p2‑1)2 其中， L2为所述第二损失函数， p2为所述训练指标值，值域为[0， 1]， k3为第三权重值。 8.一种用于文本检测的模型训练装置，其特征在于，所述模型训练装置包括：参考值计算模块，用于将已知标注的训练文本输入模板预测模型得到预训练模板后，将所述预训练模板与N个人工模板进行相似度计算，确定计算结果的最大值为训练参考值， N为大于零的整数；预检测模块，用于将所述训练文本与所述预训练模板拼接构成的预检测文本，输入预训练好的文本检测模型，得到预检测结果；预测模型训练模块，用于根据所述预检测结果与所述训练文本的标注的比较结果，以及所述训练参考值，更新所述模板预测模型的参数，迭代直至收敛，得到训练好的模板预测模型；检测模块，用于将所述训练文本输入所述训练好的模板预测模型，输出的预测模板与所述训练文本拼接构成检测文本，并将所述检测文本输入预训练好的文本检测模型，得到检测结果；检测模型训练模块，用于根据所述检测结果与所述训练文本的标注的比较结果，更新权　利　要　求　书 2/3 页 3 CN 114925700 A 3

专利 用于文本检测的模型训练方法、装置、计算机设备及介质

专利用于文本检测的模型训练方法、装置、计算机设备及介质