说明:收录全网最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210557374.8 (22)申请日 2022.05.20 (71)申请人 中国科学院自动化研究所 地址 100190 北京市海淀区中关村东路95 号 (72)发明人 何世柱 刘康 赵军 孙润鑫  (74)专利代理 机构 北京路浩知识产权代理有限 公司 11002 专利代理师 毛宏宝 (51)Int.Cl. G06F 40/205(2020.01) G06F 40/189(2020.01) G06F 40/30(2020.01) G06F 40/289(2020.01) G06F 40/295(2020.01)G06K 9/62(2022.01) (54)发明名称 对齐增强语义解析方法、 装置和计算机程序 产品 (57)摘要 本发明涉及自然语 言处理技术领域, 提供一 种对齐增强语义解析方法、 装置和计算机程序产 品, 所述方法包括: 预测知识问答任务中对应对 齐关系的短语, 并基于对应对齐关系的短语的类 型生成对应的查询片段, 其中, 对齐关系包括短 语和对应的查询片段; 将序列化的对齐 关系拼接 至输入序列, 并将输入序列输入编码器 ‑解码器 解析模型的编码器模型, 获取对齐的编码结果; 将对齐的编码结果进行注意力操作并输入编码 器‑解码器解析模型的解码器模型, 解析并输出 对齐关系对应的查询语句, 其中, 解码器模型是 利用含噪对齐训练获得。 本发明可 实现较大粒度 的建模对齐, 且提高解析准确度及噪声对解析模 型的鲁棒 性。 权利要求书2页 说明书9页 附图2页 CN 115062603 A 2022.09.16 CN 115062603 A 1.一种对齐增强语义 解析方法, 其特 征在于, 包括: 预测知识问答任务中对应对齐关系的短语, 并基于所述对应对齐关系的短语的类型生 成对应的查询片段, 其中, 所述对齐关系包括短语和对应的查询片段; 将序列化的所述对齐关系拼接至输入序列, 并将所述输入序列输入编码器 ‑解码器解 析模型的编码器模型, 获取对齐的编码结果; 将所述对齐的编码结果进行注意力操作并输入编码器 ‑解码器解析模型的解码器模 型, 解析并输出对齐关系对应的查询语句, 其中, 解码器模型 是利用含噪对齐训练获得。 2.根据权利要求1所述的对齐增强语义解析方法, 其特征在于, 所述预测知识问答任务 中对应对齐关系的短语, 并基于所述对应对齐关系的短语的类型生成对应的查询片段, 其 中, 所述对齐关系包括短语和对应的查询片段, 包括: 基于所述知识问答任务, 利用序列标注方法预测对应对齐关系的短语, 并识别所述短 语的类型, 其中, 所述短语的类型包括以下任一种: 关键 字类型、 列类型和值类型; 根据所述短语的类型, 生成短语对应的查询片段。 3.根据权利要求2所述的对齐增强语义解析方法, 其特征在于, 所述根据 所述短语的类 型, 生成短语对应的查询片段, 包括: 在所述短语的类型包括关键字类型的情况下, 基于序列生成模型, 获取关键字类型短 语对应的查询片段。 4.根据权利要求2所述的对齐增强语义解析方法, 其特征在于, 所述根据 所述短语的类 型, 生成短语对应的查询片段, 包括: 在所述短语的类型包括列类型或值类型的情况下, 基于注意力机制, 获取特定表格中 与列类型短语或值类型短语匹配度最高的列。 5.根据权利要求1 ‑4中任一项所述的对齐增强语义解析方法, 其特征在于, 将序列化的 所述对齐关系拼接至输入序列, 并将所述输入序列输入编码器 ‑解码器解析模型 的编码器 模型, 获取对齐的编码结果, 包括: 在所述编码器 ‑解码器解析模型的编码器模型, 将每个对齐类别符号、 所述对应对齐关 系的短语和短语对应的查询片段拼接入输入序列内, 用于实现知识问答任务与特定表格内 容相链接 。 6.根据权利要求5所述的对齐增强语义解析方法, 其特征在于, 所述将所述对齐的编码 结果进行注意力操作并输入编码器 ‑解码器解析模型 的解码器模型, 解析并输出对齐关系 对应的查询语句, 其中, 解码器模型 是利用含噪对齐训练获得, 包括: 基于预训练模型, 在训练集中包括标注对齐关系和含噪对齐关系的情况下, 利用交叉 验证方法训练解码器模型; 将所述输入序列中每条对齐 类别符号的隐状态对 对齐关系进行注意力操作; 将所述输入序列中每条对齐类别符号的隐状态的注意力操作向量拼接前一个单词的 嵌入表示, 并输入解码 器模型中, 输出解析的查询语句, 用于将对齐关系注入至下一时刻的 隐状态中。 7.一种对齐增强语义 解析装置, 其特 征在于, 包括: 预测模块, 用于预测知识问答任务中对应对齐关系的短语, 并基于所述对应对齐关系 的短语的类型生成对应的查询片段, 其中, 所述对齐关系包括短语和对应的查询片段;权 利 要 求 书 1/2 页 2 CN 115062603 A 2编码模块, 用于将序列化的所述对齐关系拼接至输入序列, 并将所述输入序列输入编 码器‑解码器解析模型的编码器模型, 获取对齐的编码结果; 解析模块, 用于将所述对齐的编码结果进行注意力操作并输入编码器 ‑解码器解析模 型的解码器模型, 解析并输出对齐关系对应的查询语句, 其中, 解码器模型是利用含噪对齐 训练获得。 8.一种电子设备, 包括存储器、 处理器及存储在所述存储器上并可在所述处理器上运 行的计算机程序, 其特征在于, 所述处理器执行所述程序时实现如权利要求1至6任一项所 述对齐增强语义 解析方法。 9.一种非暂态计算机可读存储介质, 其上存储有计算机程序, 其特征在于, 所述计算机 程序被处 理器执行时实现如权利要求1至 6任一项所述对齐增强语义 解析方法。 10.一种计算机程序产品, 包括计算机程序, 其特征在于, 所述计算机程序被处理器执 行时实现如权利要求1至 6任一项所述对齐增强语义 解析方法。权 利 要 求 书 2/2 页 3 CN 115062603 A 3

.PDF文档 专利 对齐增强语义解析方法、装置和计算机程序产品

文档预览
中文文档 14 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共14页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 对齐增强语义解析方法、装置和计算机程序产品 第 1 页 专利 对齐增强语义解析方法、装置和计算机程序产品 第 2 页 专利 对齐增强语义解析方法、装置和计算机程序产品 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 14:12:41上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。