专利语义解析结果重排序方法及系统

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 20221073123 5.2 (22)申请日 2022.06.24 (71)申请人中国科学院自动化研究所地址 100190 北京市海淀区中关村东路95 号 (72)发明人何世柱　刘康　赵军　张翔　 (74)专利代理机构北京路浩知识产权代理有限公司 11002 专利代理师张睿 (51)Int.Cl. G06F 40/30(2020.01) G06F 40/205(2020.01) G06F 16/31(2019.01) G06F 16/33(2019.01) G06F 16/338(2019.01)G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称语义解析结果重排序方法及系统 (57)摘要本发明提供一种语义解析结果重排序方法及系统，该方法包括：通过语义解析器，对目标自然语言语句进行解析，得到所述目标自然语言语句的候选逻辑表示集合；将所述目标自然语言语句和所述候选逻辑表示集合输入到重排序模型，得到候选语义重排序结果；根据所述候选语义重排序结果，确定所述目标自然语言语句的目标逻辑表示；其中，所述重排序模型是基于样本自然语言语句对应的自然语言相似样本和样本候选逻辑表示预测结果对应的逻辑表示相似样本，对预训练的深度神经网络进行训练得到的。本发明通过对语义解析结果进行重排序，有助于进一步搜索概率空间，从而根据重排序结果确定最终的语义解析结果，提高语义解析中推理算法的性能和准确性。权利要求书2页说明书12页附图2页 CN 115238705 A 2022.10.25 CN 115238705 A 1.一种语义解析结果重排序方法，其特征在于，包括：通过语义解析器，对目标自然语言语句进行解析，得到所述目标自然语言语句的候选逻辑表示集合；将所述目标自然语言语句和所述候选逻辑表示集合输入到重排序模型，得到候选语义重排序结果；根据所述候选语义重排序结果，确定所述目标自然语言语句的目标逻辑表示；其中，所述重排序模型是基于样本自然语言语句对应的自然语言相似样本和样本候选逻辑表示预测结果对应的逻辑表示相似样本，对预训练的深度神经网络进行训练得到的。 2.根据权利要求1所述的语义解析结果重排序方法，其特征在于，在所述将所述目标自然语言语句和所述候选逻辑表示集合输入到重排序模型，得到候选语义重排序结果之前，所述方法还包括：基于预设语义向量索引，获取所述目标自然语言语句对应的目标相似自然语言；基于预设结构性索引，获取所述候选逻辑表示集合中各个候选逻辑表示对应的目标相似逻辑表示；通过所述目标相似自然语言和所述目标相似逻辑表示，对重排序模型进行精调训练，得到精调训练后的重排序模型；所述将所述目标自然语言语句和所述候选逻辑表示集合输入到重排序模型，得到候选语义重排序结果，包括：将所述目标自然语言语句和所述候选逻辑表示集合输入到所述精调训练后的重排序模型，得到候选语义重排序结果。 3.根据权利要求1所述的语义解析结果重排序方法，其特征在于，所述重排序模型通过以下步骤训练得到：根据样本自然语言语句和所述样本自然语言语句对应的样本逻辑表示，构建第一训练样本集；通过所述第一训练样本集，对神经网络进行训练，输出每个所述样本自然语言语句对应的多个样本候选逻辑表示预测结果，并得到所述语义解析器；对每个所述样本候选逻辑表示预测结果标记正误标签，并根据所述样本自然语言语句和标记正误标签后的样本候选逻辑表示预测结果，构建第二训练样本集；通过所述第二训练样本集，对深度神经网络进行训练，得到预训练的深度神经网络；通过预设语义向量索引和所述样本自然语言语句，获取自然语言相似样本；通过预设结构性索引和所述样本候选逻辑表示预测结果，获取逻辑表示相似样本；根据所述自然语言相似样本和所述逻辑表示相似样本，构建第三训练样本集；通过所述第三训练样本集，对所述预训练的深度神经网络进行训练，得到所述重排序模型。 4.根据权利要求3所述的语义解析结果重排序方法，其特征在于，在所述通过所述第一训练样本集，对神经网络进行训练之后，所述方法还包括：获取所述神经网络输出的样本候选逻辑表示预测结果；基于柱搜索算法和预设候选结果数量，确定每个所述样本自然语言语句对应的多个样本候选逻辑表示预测结果。权　利　要　求　书 1/2 页 2 CN 115238705 A 25.根据权利要求3所述的语义解析结果重排序方法，其特征在于，在所述通过预设语义向量索引和所述样本自然语言语句，获取自然语言相似样本；通过预设结构性索引和所述样本候选逻辑表示预测结果，获取逻辑表示相似样本之前，所述方法还包括：通过预训练BERT模型，获取所述样本自然语言语句对应的样本向量表示；根据所述样本向量表示和相似度算法，构建预设语义向量索引；通过树编辑距离算法和所述样本候选逻辑表示预测结果，构建预设结构性索引。 6.根据权利要求3所述的语义解析结果重排序方法，其特征在于，所述深度神经网络的对齐层设置有关注机制，编码层设置有长短时记忆网络。 7.根据权利要求1至6任一项所述的语义解析结果重排序方法，其特征在于，在所述通过语义解析器，对目标自然语言语句进行解析，得到所述目标自然语言语句的候选逻辑表示集合之前，所述方法还包括：对目标自然语言语句进行预处理，得到与所述目标自然语言语句相同含义的标准语句；所述通过语义解析器，对目标自然语言语句进行解析，得到所述目标自然语言语句的候选逻辑表示集合，包括：通过语义解析器，对所述标准语句进行解析，得到候选逻辑表示集合。 8.一种语义解析结果重排序系统，其特征在于，包括：候选逻辑表示生成模块，用于通过语义解析器，对目标自然语言语句进行解析，得到所述目标自然语言语句的候选逻辑表示集合；候选语义重排序模块，用于将所述目标自然语言语句和所述候选逻辑表示集合输入到重排序模型，得到候选语义重排序结果；语义解析结果生成模块，用于根据所述候选语义重排序结果，确定所述目标自然语言语句的目标逻辑表示；其中，所述重排序模型是基于样本自然语言语句对应的自然语言相似样本和样本候选逻辑表示预测结果对应的逻辑表示相似样本，对预训练的深度神经网络进行训练得到的。 9.一种电子设备，包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述语义解析结果重排序方法。 10.一种非暂态计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至7任一项所述语义解析结果重排序方法。权　利　要　求　书 2/2 页 3 CN 115238705 A 3

专利 语义解析结果重排序方法及系统

专利语义解析结果重排序方法及系统