说明:收录全网最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210663568.6 (22)申请日 2022.06.13 (71)申请人 北京石油化工学院 地址 102600 北京市大兴区黄 村清源北路 19号 (72)发明人 栾婷婷 邓明月 张丽佳 李红儒  张雪 常建超  (74)专利代理 机构 北京凯特来知识产权代理有 限公司 1 1260 专利代理师 郑立明 陈亮 (51)Int.Cl. G06F 16/36(2019.01) G06F 16/35(2019.01) G06F 40/242(2020.01) G06F 40/253(2020.01)G06F 40/30(2020.01) G06N 3/04(2006.01) G06Q 10/06(2012.01) G06Q 50/26(2012.01) (54)发明名称 一种危化品事故事理图谱的构建方法与系 统 (57)摘要 本发明公开了一种危化品事故事理图谱的 构建方法和系统, 所述方法首先通过预先设置的 事件定义信息构建危化品事故事理图谱的模式 层; 以国内外重大危化品事故为基础, 根据危化 品事故的特点构建危化品事故调查报告资料库; 对收到的危化品事故调查报告文本进行语法分 析与数据预处理; 抽取危化品事故因果关系事件 对, 并与危化品事故领域本体进行事件元组映 射; 根据事件元组映射, 将危化品事故因果关系 事件对中的所有事件改写成危化品事故领域本 体中相似度最高的元组, 形成危化品事故事理图 谱。 上述方法和系统能够提高因果事理图谱构建 的准确性, 将 事理图谱应用于挖掘事故的因果关 系, 为事故因果分析提供了新的分析工具和途 径。 权利要求书2页 说明书7页 附图3页 CN 115221332 A 2022.10.21 CN 115221332 A 1.一种危 化品事故事理图谱的构建方法, 其特 征在于, 所述方法包括: 步骤1、 通过预先设置的事件定义信息构建危化品事故事理图谱的模式层; 其中, 所述 预先设置的事件定义信息包括危化品事故事件类型的定义信息、 不同类型的危化品事故触 发词和事 件元素角色的定义信息、 事 件关系的定义信息; 步骤2、 以国内外重大危化品事故为基础, 根据危化品事故的特点构建危化品事故调查 报告资料库; 步骤3、 对收到的危 化品事故调查报告 文本进行语法分析与数据预处 理; 步骤4、 通过所述模式层从步骤3处理后的危化品事故调查报告文本中抽取危化品事故 因果关系事 件对; 步骤5、 将抽取的危化品事故因果关系事件对与危化品事故领域本体进行事件元组映 射; 其中, 所述危化品事故领域本体是将步骤2得到的危化品事故调查报告资料库中的文本 进行处理后形成的; 步骤6、 根据事件元组映射, 将危化品事故因果关系事件对中的所有事件改写成危化品 事故领域本体中相似度最高的元组, 形成危 化品事故事理图谱。 2.根据权利要求1所述危化品事故事理图谱的构建方法, 其特征在于, 所述步骤3的过 程具体为: 以收到的危化品事故调查报告文本为基础, 通过去噪、 分句数据 预处理, 生成有逻辑语 义的句子; 对生成的每 个句子进行分词和词性标注处 理, 过滤掉除指定词性外的其 他词; 再进行句子切分、 词的切分, 并标注 因果关系提示词, 每类因果关系提示词对应不同的 因果句法模式; 所述因果关系提 示词根据各类事故特点归纳为以下五类: 1)由因到果居端的因果关系提示词, 包括: 由于| 因为|既|既然|如果|只要有|可 能是| 可能原因是|可能的原因|调查发现; 2)由因到果居中的因果关系提示词, 包括: 导致了|会导致|导致|以致|促使|促成了| 引起|所以|以致于|以致|因此|因而|致使|以至|造成|使得|从而导致|从而引起|从而造 成|从而使得|以至 于|从而|进而|有助于; 3)由果溯因居中的因果关系提示词, 包括: 是由于|是因为|原因是|归因于|影响因素 是|可能的原因; 4)由因到果配套的因果关系提示词, 包括: <因为|由于|如果| 受, 所以|以至于|以致于 |因此|因而 |故|而|就|影响>; 5)由果溯因配套的因果关系提示词, 包括: <造成|使得|导致|促使|引起|之所以|致使 |总结, 可能的原因是|原因是|是因为|是由于|是因为>。 3.根据权利要求1所述危化品事故事理图谱的构建方法, 其特征在于, 在步骤4中, 抽取 危化品事故因果关系事 件对包括显式抽取和隐式抽取, 其中: 首先将距离因果关系提 示词位置最近且词性 为动词的词作为事 件触发词; 获取所述事件触发词对应的主语和宾语, 并确定事件对的表示形式为: {主语及其相关 成分, 触发词及其相关成分, 宾语及其相关成分}; 所述显示抽取基于双层模型的因果关系抽取法, 采用Bootstrappin g算法, 将因果关系权 利 要 求 书 1/2 页 2 CN 115221332 A 2抽取问题转化为对事件序列的两次模式识别标注; 在第一次模式识别时,标注因果关系的 语义角色, 并将标注的语义角色作为新的特征传递给第二层模式识别, 用于因果关系边界 标注; 所述隐式抽取采用基于自注意力机制的双向LSTM方法, 以带有事件触发词位置标识的 句子集作为输入, 以因果关系事 件元组对作为输出。 4.根据权利要求3所述危化品事故事理图谱的构建方法, 其特征在于, 所述基于双层模 型的因果关系抽取法的过程具体为: 首先为从危化品事故调查报告文本中得到的事件序列中的每一个事件赋予标签,以表 示其在因果关系中对应的语义角色; 具体是引入一个标签集f={C,E,N}, 其中C表 示原因事 件; E表示结果事件; N表示其他事件; 根据标签集f中各个元素的定义, 标注事件序列因果关 系的语义角色; 然后再为经过标注的因果关系语义角色标记边界标签,确定因果关系的边界; 其中, 边 界标签采用组块分析中的BIO标签集; B表示因果关系的开始; I表示因果关系的中间或结 尾; O表示 其他。 5.根据权利要求1所述危化品事故事理图谱的构建方法, 其特征在于, 在步骤5 中, 进行 事件元组映射的过程是计算两字符串的相似性, 即计算抽取的危化品事故因果关系事件对 与危化品事故领域本体中元组的相似度, 具体来说: 首先将所有词汇都映射到同一个向量空间, 采用词向量嵌入, 利用样本单词和该样本 单词的上 下文一起训练词向量, 训练出的词向量包 含了词的上 下文语义信息; 通过计算抽取的危化品事故因果关系事件对与危化品事故领域本体中对应词向量的 相似度, 来判定 两个事件的相似程度, 并将相似的两个事 件进行事 件元组映射。 6.一种危 化品事故事理图谱的构建系统, 其特 征在于, 所述系统包括: 模式层构建模块, 用于通过预先设置的事件定义信 息构建危化品事故事理图谱的模式 层; 数据库模块, 用于以国内外重大危化品事故为基础, 根据危化品事故的特点构建危化 品事故调查报告资料库; 语法分析与 数据预处理模块, 用于对收到的危化品事故调查报告文本进行语法分析与 数据预处 理; 事件对抽取模块, 用于通过所述模式层构建模块构建的模式层从处理后的危化品事故 调查报告 文本中抽取危 化品事故因果关系事 件对; 事件元组映射模块, 用于将抽取的危化品事故因果关系 事件对与危化品事故领域本体 进行事件元组映射; 危化品事故事理图谱生成模块, 用于根据事件元组映射, 将危化品事故因果关系事件 对中的所有事件改写成危化品事故领域本体中相似度最高的元组, 形成危化品事故事理图 谱。权 利 要 求 书 2/2 页 3 CN 115221332 A 3

.PDF文档 专利 一种危化品事故事理图谱的构建方法与系统

文档预览
中文文档 13 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种危化品事故事理图谱的构建方法与系统 第 1 页 专利 一种危化品事故事理图谱的构建方法与系统 第 2 页 专利 一种危化品事故事理图谱的构建方法与系统 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 10:52:28上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。