说明:收录全网最新的团体标准 提供单次或批量下载
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111646121.X (22)申请日 2021.12.2 9 (71)申请人 科大讯飞股份有限公司 地址 230088 安徽省合肥市高新区望江西 路666号 (72)发明人 赵崇帅 顾成敏 代旭东 周维  李宝善 陈志刚 魏思  (74)专利代理 机构 北京集佳知识产权代理有限 公司 11227 代理人 宋东阳 (51)Int.Cl. G06F 16/35(2019.01) G06K 9/62(2022.01) (54)发明名称 事件抽取方法、 相关 设备及可读存 储介质 (57)摘要 本申请公开了一种一种事件抽取方法、 相关 设备及可读存储介质。 该方案中, 将待进行事件 抽取的文本输入参数抽取模型, 该参数抽取模型 对该文本进行处理后, 输出该文本对应的参数信 息, 基于该文本对应的参数信息, 确定该文本中 包含的至少一个事件。 本方法中, 由于参数抽取 模型以训练用文本标注的预设的各个事件类型 和参数类型 组合对应的参数内容为样本标签, 实 现了事件检测和参数识别的联合学习, 降低了级 联误差影响。 因此, 采用本方案能够提升事件抽 取结果的准确率。 权利要求书2页 说明书13页 附图3页 CN 114201608 A 2022.03.18 CN 114201608 A 1.一种事 件抽取方法, 其特 征在于, 所述方法包括: 获取待进行事件抽取的文本; 将所述文本输入参数抽取模型, 所述参数抽取模型对所述文本进行处理后, 输出所述 文本对应的参数信息, 所述参数信息包括参数内容、 参数类型和事件类型; 所述参数抽取模 型是以训练用文本为训练样本, 以所述训练用文本标注的预设的各个事件类型和参数类型 组合对应的参数内容 为样本标签, 训练得到的; 基于所述文本对应的参数信息, 确定所述文本中包 含的至少一个事 件。 2.根据权利要求1所述的方法, 其特 征在于, 所述 参数抽取模型包括编码器和解码器; 所述编码器用于对所述文本进行编码, 得到所述文本的特 征向量; 所述解码器用于对所述文本的特征向量进行解码, 得到输出向量, 所述输出向量用于 指示所述文本中与预设的事 件类型和参数类型组合对应的参数内容。 3.根据权利要求1所述的方法, 其特征在于, 所述基于所述文本对应的参数信息, 确定 所述文本中包 含的至少一个事 件, 包括: 将事件类型相同的参数信息进行组合, 得到所述文本中包 含的至少一个候选事 件; 从所述至少一个候选事 件中确定待拆分事 件; 对所述待拆分事 件进行拆分, 得到拆分后的事 件; 将无需拆分的事 件与拆分后的事 件确定为所述文本中包 含的至少一个事 件。 4.根据权利要求3所述的方法, 其特征在于, 所述从所述至少一个候选事件中确定待拆 分事件, 包括: 针对每个候选事件, 确定所述候选事件的参数信息中是否包括核心参数类型; 所述核 心参数类型为预设的事件类型对应的参数类型中, 对应多个参数内容且不同的参数内容对 应不同的事 件的参数类型; 如果所述候选事件的参数信 息中包括核心参数类型, 且所述核心参数类型对应的参数 有至少两个, 则将所述候选事件确定为待拆分事件; 否则, 将所述候选事件确定为 非待拆分 事件。 5.根据权利要求4所述的方法, 其特征在于, 所述核心参数类型对应的参数为核心参 数, 所述候选事件的参数信息中除所述核心参数类型之外的参数类型为其他参数类型, 其 他参数类型对应的参数为其他参数, 则所述对所述待拆分事件进行拆分, 得到拆分后的事 件, 包括: 针对每个核心参数, 从所述其他参数中, 确定所述核心参数的相关参数; 所述相关参数 是与所述核心参数存在关联关系的参数; 基于每个核心参数, 以及所述核心参数的相关参数, 对所述待拆分事件进行拆分, 得到 拆分后的事 件。 6.根据权利要求5所述的方法, 其特征在于, 所述从所述其他参数中, 确定所述核心参 数的相关参数, 包括: 针对每个其他参数, 将所述文本的特征向量、 所述核心参数以及所述其他参数输入参 数关联模型, 所述参数关联模型输出参数关联结果, 所述参数关联结果用于指示所述核心 参数与所述 其他参数是否相关; 所述参数关联模型是以训练用文本的特征向量、 训练用核心参数以及训练用其他参数权 利 要 求 书 1/2 页 2 CN 114201608 A 2为训练样本, 以训练用文本标注的训练用其 他参数为样本标签, 训练得到的。 7.根据权利要求6所述的方法, 其特征在于, 所述参数关联模型包括特征提取层、 参数 类型编码层、 特 征融合层和解码层; 所述特征提取层用于从所述文本的特征向量中提取所述核心参数的特征向量, 以及所 述其他参数的特 征向量; 所述参数类型编码层用于对所述核心参数对应的参数类型进行编码, 得到所述核心参 数对应的参数类型的特征向量, 以及, 对所述其他参数对应的参数类型进 行编码, 得到所述 其他参数对应的参数类型的特 征向量; 所述特征融合层用于获取所述核心参数对应的参数类型的特征向量、 所述其他参数对 应的参数类型的特征向量, 并将所述核心 参数的特征向量、 所述其他参数的特征向量、 所述 核心参数对应的参数类型的特征向量、 所述其他参数对应的参数类型的特征向量进行融 合, 得到融合后的特 征向量; 所述解码层用于对所述融合后的特 征向量进行解码, 得到参数关联 结果。 8.一种事 件抽取装置, 其特 征在于, 所述装置包括: 获取单元, 用于获取待 进行事件抽取的文本; 参数信息确定单元, 用于将所述文本输入参数抽取模型, 所述参数抽取模型对所述文 本进行处理后, 输出所述文本对应的参数信息, 所述参数信息包括参数内容、 参数类型和事 件类型; 所述参数抽取模型是以训练用文本为训练样本, 以所述训练用文本标注的预设的 各个事件类型和参数类型组合对应的参数内容 为样本标签, 训练得到的; 事件确定单元, 用于基于所述文本对应的参数信息, 确定所述文本中包含的至少一个 事件。 9.一种事 件抽取设备, 其特 征在于, 包括存 储器和处 理器; 所述存储器, 用于存 储程序; 所述处理器, 用于执行所述程序, 实现如权利要求1至7中任一项所述的事件抽取方法 的各个步骤。 10.一种可读存储介质, 其上存储有计算机程序, 其特征在于, 所述计算机程序被处理 器执行时, 实现如权利要求1至7中任一项所述的事 件抽取方法的各个步骤。权 利 要 求 书 2/2 页 3 CN 114201608 A 3

.PDF文档 专利 事件抽取方法、相关设备及可读存储介质

文档预览
中文文档 19 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共19页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 事件抽取方法、相关设备及可读存储介质 第 1 页 专利 事件抽取方法、相关设备及可读存储介质 第 2 页 专利 事件抽取方法、相关设备及可读存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 20:43:14上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。