说明:收录全网最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 20221073123 5.2 (22)申请日 2022.06.24 (71)申请人 中国科学院自动化研究所 地址 100190 北京市海淀区中关村东路95 号 (72)发明人 何世柱 刘康 赵军 张翔  (74)专利代理 机构 北京路浩知识产权代理有限 公司 11002 专利代理师 张睿 (51)Int.Cl. G06F 40/30(2020.01) G06F 40/205(2020.01) G06F 16/31(2019.01) G06F 16/33(2019.01) G06F 16/338(2019.01)G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 语义解析结果重排序方法及系统 (57)摘要 本发明提供一种语义解析结果重排序方法 及系统, 该方法包括: 通过语义解析器, 对目标自 然语言语句进行解析, 得到所述目标自然语言语 句的候选逻辑表示集合; 将所述目标自然语言语 句和所述候选逻辑表示集合输入到重排序模型, 得到候选语义重排序结果; 根据所述候选语义重 排序结果, 确定所述目标自然语言语句的目标逻 辑表示; 其中, 所述重排序模型是基于样本自然 语言语句对应的自然语言相似样本和样本候选 逻辑表示预测结果对应的逻辑表 示相似样本, 对 预训练的深度神经网络进行训练得到的。 本发明 通过对语义解析结果进行重排序, 有助于进一步 搜索概率空间, 从而根据重排序结果确定最终的 语义解析结果, 提高语义解析中推理算法的性能 和准确性。 权利要求书2页 说明书12页 附图2页 CN 115238705 A 2022.10.25 CN 115238705 A 1.一种语义 解析结果重排序方法, 其特 征在于, 包括: 通过语义解析器, 对目标自然语言语句进行解析, 得到所述目标自然语言语句的候选 逻辑表示 集合; 将所述目标自然语言语句和所述候选逻辑表示集合输入到重排序模型, 得到候选语义 重排序结果; 根据所述 候选语义重排序结果, 确定所述目标自然语言语句的目标逻辑表示; 其中, 所述重排序模型是基于样本自然语言语句对应的自然语言相似样本和样本候选 逻辑表示预测结果对应的逻辑表示相似样本, 对预训练的深度神经网络进行训练得到的。 2.根据权利要求1所述的语义解析结果重排序方法, 其特征在于, 在所述将所述目标自 然语言语句和所述候选逻辑表示集合输入到重排序模型, 得到候选语义重排序结果之前, 所述方法还 包括: 基于预设语义向量索引, 获取所述目标自然语言语句对应的目标相似自然语言; 基于 预设结构性索引, 获取所述候选逻辑表示集合中各个候选逻辑表示对应的目标相似逻辑表 示; 通过所述目标相似自然语言和所述目标相似逻辑表示, 对重排序模型进行精调训练, 得到精调训练后的重排序模型; 所述将所述目标自然语言语句和所述候选逻辑表示集合输入到重排序模型, 得到候选 语义重排序结果, 包括: 将所述目标自然语言语句和所述候选逻辑表示集合输入到所述精调训练后的重排序 模型, 得到候选语义重排序结果。 3.根据权利要求1所述的语义解析结果重排序方法, 其特征在于, 所述重排序模型通过 以下步骤训练得到: 根据样本自然语言语句和所述样本自然语言语句对应的样本逻辑表示, 构建第 一训练 样本集; 通过所述第一训练样本集, 对神经网络进行训练, 输出每个所述样本自然语言语句对 应的多个样本候选 逻辑表示预测结果, 并得到所述语义 解析器; 对每个所述样本候选逻辑表示预测结果标记正误标签, 并根据 所述样本自然语言语句 和标记正 误标签后的样本候选 逻辑表示预测结果, 构建第二训练样本集; 通过所述第二训练样本集, 对深度神经网络进行训练, 得到预训练的深度神经网络; 通过预设语义向量索引和所述样本自然语言语句, 获取自然语言相似样本; 通过预设 结构性索引和所述样本候选 逻辑表示预测结果, 获取逻辑表示相似样本; 根据所述自然语言相似样本和所述逻辑表示相似样本, 构建第三训练样本集; 通过所述第三训练样本集, 对所述预训练的深度神经网络进行训练, 得到所述重排序 模型。 4.根据权利要求3所述的语义解析结果重排序方法, 其特征在于, 在所述通过所述第 一 训练样本集, 对神经网络进行训练之后, 所述方法还 包括: 获取所述神经网络 输出的样本候选 逻辑表示预测结果; 基于柱搜索算法和预设候选结果数量, 确定每个所述样本自然语言语句对应的多个样 本候选逻辑表示预测结果。权 利 要 求 书 1/2 页 2 CN 115238705 A 25.根据权利要求3所述的语义解析结果重排序方法, 其特征在于, 在所述通过预设语义 向量索引和所述样本自然语言语句, 获取自然语言相似样本; 通过预设结构性索引和所述 样本候选 逻辑表示预测结果, 获取逻辑表示相似样本之前, 所述方法还 包括: 通过预训练BERT模型, 获取 所述样本自然语言语句对应的样本向量表示; 根据所述样本向量表示和相似度算法, 构建预设语义向量索引; 通过树编辑距离算法和所述样本候选 逻辑表示预测结果, 构建预设结构性索引。 6.根据权利要求3所述的语义解析结果重排序方法, 其特征在于, 所述深度神经网络的 对齐层设置有关注机制, 编码层设置有长短时记 忆网络。 7.根据权利要求1至6任一项所述的语义解析结果重排序方法, 其特征在于, 在所述通 过语义解析器, 对目标自然语言语句进行解析, 得到所述 目标自然语言语句的候选逻辑表 示集合之前, 所述方法还 包括: 对目标自然语言语句进行预处理, 得到与所述目标自然语言语句相同含义的标准语 句; 所述通过语义解析器, 对目标自然语言语句进行解析, 得到所述目标自然语言语句的 候选逻辑表示 集合, 包括: 通过语义 解析器, 对所述标准语句进行解析, 得到候选 逻辑表示 集合。 8.一种语义 解析结果重排序系统, 其特 征在于, 包括: 候选逻辑表示生成模块, 用于通过语义解析器, 对目标自然语言语句进行解析, 得到所 述目标自然语言语句的候选 逻辑表示 集合; 候选语义重排序模块, 用于将所述目标自然语言语句和所述候选逻辑表示集合输入到 重排序模型, 得到候选语义重排序结果; 语义解析结果生成模块, 用于根据所述候选语义重排序结果, 确定所述目标自然语言 语句的目标逻辑表示; 其中, 所述重排序模型是基于样本自然语言语句对应的自然语言相似样本和样本候选 逻辑表示预测结果对应的逻辑表示相似样本, 对预训练的深度神经网络进行训练得到的。 9.一种电子设备, 包括存储器、 处理器及存储在所述存储器上并可在所述处理器上运 行的计算机程序, 其特征在于, 所述处理器执行所述计算机程序时实现如权利要求1至7任 一项所述语义 解析结果重排序方法。 10.一种非暂态计算机可读存储介质, 其上存储有计算机程序, 其特征在于, 所述计算 机程序被处 理器执行时实现如权利要求1至7任一项所述语义 解析结果重排序方法。权 利 要 求 书 2/2 页 3 CN 115238705 A 3

.PDF文档 专利 语义解析结果重排序方法及系统

文档预览
中文文档 17 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共17页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 语义解析结果重排序方法及系统 第 1 页 专利 语义解析结果重排序方法及系统 第 2 页 专利 语义解析结果重排序方法及系统 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 14:14:54上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。