说明:收录全网最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210724550.2 (22)申请日 2022.06.23 (71)申请人 浙江大学 地址 310058 浙江省杭州市西湖区余杭塘 路866号 (72)发明人 巫英才 刘玉亭 傅四维  (74)专利代理 机构 杭州求是专利事务所有限公 司 33200 专利代理师 贾玉霞 (51)Int.Cl. G06F 16/36(2019.01) G06F 16/34(2019.01) (54)发明名称 一种针对时序知识图谱的可视化分析系统 和方法 (57)摘要 本发明公开一种针对时序知识图谱的可视 化分析系统和方法, 用户迭代式地选择时序知识 图谱中感兴趣的实体、 关系、 时间点, 系统依据用 户选择自动生成故事线与点线图相结合的可视 化图表, 向用户展示图谱中相应实体与关系的拓 扑结构及其时序变化, 同时生 成描述性文本作为 可视化图表的补充。 本发明满足了时序知识图谱 的可视化需求, 能有效降低时序知识图谱的探索 难度, 同时增强用户对图谱中时序变化的感知, 促进了时序知识图谱的研究与应用。 权利要求书4页 说明书12页 附图3页 CN 115168601 A 2022.10.11 CN 115168601 A 1.一种针对时序知识图谱的可视化分析系统, 其特 征在于, 该系统包括: 概览生成模块, 该模块基于概览配置数据生成数据集 概览; 故事线生成模块, 该模块基于故事线配置数据生成故事线; 文本生成模块, 该模块基于故事线配置数据生成描述 性文本; 画板模块, 该模块展示系统生成的概览、 故事线和文本, 并响应用户交互, 更新概览配 置数据和故事线配置数据; 其分为配置面板、 概览面板和故事线面板; 其中, 配置面板用于 接收用户对概览配置数据及故事线配置数据的修改; 概览面板用于展示 概览视图, 接收用户选择的实体, 并初始化故事线配置数据; 故事线面板用于展示故事线视图, 接收用户对实体、 关系 、 时间点的交 互操作。 2.根据权利要求1所述的针对时序知识图谱的可视化分析系统, 其特征在于, 所述故事 线面板又分为时间轴、 静态部分和时序部 分, 静态部 分用于展示静态关系, 时序部 分用于展 示时序关系和事 件关系。 3.一种针对时序知识图谱的可视化分析方法, 其特征在于, 该方法基于权利要求1~2 中任意一项的可视化分析系统来实现, 该 方法包括: 系统根据用户输入的概览配置数据, 生成概览视图, 展示给用户; 系统根据用户在概览视 图选择的实体, 初始化故事线配置数据; 再根据故事线配置数 据生成故事线视图和描述 性文本, 展示给用户; 系统根据用户在故事线视图上对实体、 关系、 时间点的交互操作, 更新故事线配置数 据, 再根据故事线配置数据生成故事线视图和描述 性文本, 展示给用户。 4.根据权利要求3所述的针对时序知识图谱的可视化分析方法, 其特征在于, 所述概览 配置数据包括时间跨度分段 方式、 实体编码方式、 面积图编码方式; 所述故事线配置数据包括监测状态标志、 选中实体集、 监测实体集、 可见实体集、 选中 关系集、 可 见关系集、 选中时间点 集、 可见时间点 集、 操控时间点。 5.根据权利要求3所述的针对时序知识图谱的可视化分析 方法, 其特 征在于, 系统根据用户输入的概览配置数据, 生成概览视图, 具体包括: 首先对数据集的总体时间跨度进行分段, 分出的时间段映射到y轴上; 随后对每一时间 段内的信息进行面积编码, 编码值映射到x轴上, 绘制出面积图; 最后对每一时间段内存在 的实体进 行编码, 编码值映射为文本大小, 实体类别映射为文本颜色, 在面积图对应时间段 的内部绘制出词云。 6.根据权利要求3所述的针对时序知识图谱的可视化分析方法, 其特征在于, 根据故事 线配置数据生成故事线视图的具体子步骤如下: (1)计算可 见集; ①使用选中实体集初始化可见实体集、 选中关系集初始化可见关系集、 选中时间点集 初始化可 见时间点 集; ②若当前处于监测状态, 则将监测实体集中所有实体及其关联非静态关系的开始时 间、 开始时间 ‑单位时间、 结束时间、 结束时间+单位时间加入可见时间点集; 将监测实体集 中所有实体及 扩展步长内可达的实体加入可见实体集; 将可见实体集中所有实体两两间的 关系加入可 见关系集; ③将选中关系集中所有关系的主体和客体加入可 见实体集;权 利 要 求 书 1/4 页 2 CN 115168601 A 2(2)计算故事线; 计算实体故事线的线条次序; 计算所有故事线的线条次序; 计算故事线布局; 扩展故事 线布局。 (3)计算故事线上的图布局; 按时间顺序遍历可见时间点集, 在任一时间点, 需布局的子 图包含可见关系集中在该 时间点新出现或在下一时间点消失的所有关系及这些关系的关联实体, 经若干次移动实体 位置或关系位置, 在满足约束条件下使得目标函数最小的情况下, 得到该时间点故事线上 的图布局。 其中, 每一个关系均对应从主体位置到关系位置的线段及从关系位置到客体位置的线 段, 所述约束条件为: 需布局的实体或关系在y轴 上落于其故事线在该时间点的对应位置, 在x轴上落于限定宽度内; 所述限定宽度为每个子图的宽度; 所述目标函数为: 需布局的关 系对应的两条线段与其他关系对应的两条线段, 及其他需布局的实体或关系对应的包围盒 的交叉数量之和; (4)计算静态图布局 静态图需布局的子图包含可见关系集中所有静态关系及这些关系的关联实体, 对这些 关系在y轴上的位置不做约束; 而实体若为静态实体, 则实体在y轴上的位置不做约束; 否则 实体落于其 故事线在操控时间点的对应y轴位置, 若对应故事线不存在于操控时间点上, 则 依据对应故事线是未出现还是已消失, 令实体落于内部画布的上方或下方; 其余约束条件 与优化目标函数与计算故事线上的图布局相同。 7.根据权利要求3所述的针对时序知识图谱的可视化分析方法, 其特征在于, 根据故事 线配置数据生成描述 性文本的子步骤如下: (1)预处理: 对各选中集进行整理与补充, 得到文本生成开始时间点、 文本生成结束时 间点、 文本生成实体集、 文本生成关系集, 若数据不足以生成文本则结束 文本生成; (2)序列化: 依据时间信息、 图拓扑结构、 用户操作 顺序, 对文本生成实体集和文本生成 关系集中的实体与关系进行排序, 得到有序的实体及实体关联关系列表, 使得最终生成的 文本有序、 有条理且与用户意图相符 (3)模板填充: 使用给定的模板及组合 规则将序列化结果 转化为描述性文本。 8.根据权利要求7所述的针对时序知识图谱的可视化分析方法, 其特征在于, 所述序列 化的具体子步骤如下: (a)计算实体、 关系与时序无关的优先级; 对于文本生成实体集中的每一个实体, 其权重为(中心度 ‑选中次序/文本生成实体集 大小), 权重高者优先级高, 权重相同则选中次序在前者优先级高; 对于文本生成关系集中 的每一类关系, 文本生成关系集中同类关系 数量少者优先级高; 对于文本生成关系集中的 每一个关系, 选中次序在前者优先级高; (b)将文本生成实体集中的实体划分为若干 簇; 每一个非静态实体为一个独立的簇; 由静态关系关联的两个静态实体划分至同一个 簇; 每个簇中优先级最高的实体为该簇的根实体; (c)计算时间点 集, 并将非静态实体与非静态关系分入若干个时间点桶; 列出文本生成实体集与文本生成关系集中所有实体与关系关联的、 在文本生成开始时权 利 要 求 书 2/4 页 3 CN 115168601 A 3

.PDF文档 专利 一种针对时序知识图谱的可视化分析系统和方法

文档预览
中文文档 20 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共20页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种针对时序知识图谱的可视化分析系统和方法 第 1 页 专利 一种针对时序知识图谱的可视化分析系统和方法 第 2 页 专利 一种针对时序知识图谱的可视化分析系统和方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 10:56:33上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。