说明:收录全网最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111643595.9 (22)申请日 2021.12.2 9 (71)申请人 沈阳东软智能医疗科技研究院有限 公司 地址 110179 辽宁省沈阳市 浑南区创新路 175-2号419室 (72)发明人 王伟光 蔡巍 张霞  (74)专利代理 机构 北京英创嘉友知识产权代理 事务所(普通 合伙) 11447 专利代理师 贺晓蕾 (51)Int.Cl. G16H 50/20(2018.01) G16H 50/70(2018.01) G16H 40/20(2018.01) G06K 9/62(2022.01) (54)发明名称 信息特征提取方法、 装置、 可读存储介质及 电子设备 (57)摘要 本公开涉及一种信息特征提取方法、 装置、 可读存储介质及电子设备, 该方法包括: 获取获 取用户来访 记录信息, 根据用户来访记录信息构 建结构化数据, 基于结构化数据构建用户来访记 录信息的特征化表示, 特征化表 示包括用户来访 记录信息的空间特征、 时间特征及时空特征, 根 据空间特征、 时间特征及时空特征, 提取用户来 访记录信息的时空依赖特征, 时空依赖特征为用 户的多次来访记录中目标事件之间的语义关系 及时间序列特征。 融入与用户来访 记录信息相关 的先验知识的同时, 从时间、 空间和时空三个维 度全方位捕获用户来访记录信息的特征, 学习更 鲁棒、 更准确的用户来访记录信息的特征表示, 提升疾病预测任务的预测效果。 权利要求书3页 说明书12页 附图7页 CN 114496215 A 2022.05.13 CN 114496215 A 1.一种信息特 征提取方法, 其特 征在于, 包括: 获取用户来访记录信息, 根据所述用户来访记录信息构建结构化数据, 所述用户来访 记录信息中包 含用户的多次来访记录; 基于所述结构化数据构建所述用户来访记录信 息的特征化表示, 所述特征化表示包括 所述用户来访记录信息的空间特征、 时间特征及时空特征; 所述空间特征表征同一次来访 记录中目标事件之 间的语义关系, 所述时间特征为所述不同次来访记录中同一目标事件之 间的时间序列特 征, 所述时空特 征表征不同次所述 来访记录中目标事 件之间的语义关系; 根据所述空间特征、 所述时间特征及所述时空特征, 提取所述用户来访记录信息的时 空依赖特征; 所述时空依赖特征表征所述用户的多次来访记录中目标事件之间的语义关系 及时间序列特 征。 2.根据权利要求1所述的方法, 其特 征在于, 所述基于所述结构化数据构建所述用户来访记录信息的特 征化表示的步骤 包括: 根据所述结构化数据构建所述用户来访记录信 息的特征矩阵; 所述特征矩阵为表征所 述用户来访记录信息的原 始数据的矩阵; 根据所述结构化数据构建所述用户来访记录信 息的空间邻 接矩阵; 所述空间邻 接矩阵 为表征所述用户来访记录信息的空间特 征的矩阵; 提取所述用户来访记录信息中的时间特 征; 根据所述结构化数据构建所述用户来访记录信 息的时空邻 接矩阵; 所述 时空邻接矩阵 为表征所述用户来访记录信息的时空特 征的矩阵。 3.根据权利要求2所述的方法, 其特征在于, 所述根据所述空间特征、 所述时间特征及 所述时空特 征, 提取所述用户来访记录信息的时空依赖特 征的步骤 包括: 基于所述特 征矩阵、 所述空间邻接矩阵计算所述用户来访记录信息的空间 张量; 基于所述时间特 征, 将所述空间 张量在时间维度上进行时间卷积 操作, 得到时间 张量; 将所述时间 张量与所述时空邻接矩阵进行时空卷积 操作得到所述时空依赖特 征。 4.根据权利要求3所述的方法, 其特征在于, 所述基于所述特征矩阵、 所述空间邻接矩 阵计算所述用户来访记录信息的空间 张量的步骤 包括: 通过卷积神经网络扩展所述特 征矩阵得到扩展特 征矩阵; 将所述扩展特 征矩阵与所述空间邻接矩阵进行图卷积 操作得到所述空间 张量。 5.根据权利要求 4所述的方法, 其特 征在于, 所述空间 张量的计算公式包括: 其中, D为度矩阵, GA为所述空间邻接矩阵, I为所述特征矩阵的 单位矩阵; 表示进行图卷积操作; x ′为所述扩展 特征矩阵, x ′=∑x·Wcnn+b, x为所述特征 矩阵, x∈R|V|×(T‑1), |V|为所述目标事件的个数, T为来访记录的次数, b为所述卷积神经网络 的偏置向量, Wcnn为所述卷积神经网络的权重矩阵, Wcnn∈Rd×d, d为所述扩展特征矩阵的特征 维度; Wgcn为所述图卷积的权 重矩阵。 6.根据权利要求3所述的方法, 其特 征在于, 所述时间 张量的计算公式包括:权 利 要 求 书 1/3 页 2 CN 114496215 A 2其中, |V|为所述目标事件的个数, d为所述扩展特征矩阵的特征维度, Wtcn为所述时间 卷积的权重矩阵, Fspatial(*, T‑1, *)为所述空间张量, T为来访记录的次数, btcn为所述时间卷积 的偏置向量。 7.根据权利要求3所述的方法, 其特 征在于, 所述时空依赖特 征的计算公式包括: 其中, GTA为所述时空邻接矩阵, D为度矩阵, I为所述特征矩阵 的单位矩阵, 表示进行图卷积操作; Ftemporal(|V |, T‑1, d)为所述时间张量, |V |为所述目标事件 的个数, T为来访记录的次数, d为扩展特征矩阵的特征维度; Wstcn为所述时空卷积的权重矩 阵。 8.根据权利要求1所述的方法, 其特征在于, 所述根据所述空间特征、 所述时间特征及 所述时空特 征, 提取所述用户来访记录信息的时空依赖特 征的步骤之后包括: 通过全连接神经网络对所述时空依赖特 征进行特征提取, 生成提取向量; 将所述提取向量与标签向量进行损 失计算, 得到损 失函数; 所述标签向量是基于所述 用户来访记录信息中最后一次来访记录得到的; 根据所述损失函数更新特征提取模型的参数; 所述特征提取模型用于提取所述时空依 赖特征, 根据所述时空依赖特 征预测所述用户下一次来访记录 。 9.根据权利要求8所述的方法, 其特 征在于, 所述标签向量为 yp∈{0, 1}|V|, |V|为所述目标事件的个 数, 所述提取向量的计算公式包 括: 所述损失函数的计算公式包括: 其中, i为目标事件的个 数, Fst为所述时空依 赖特征, FCN(Fst)表示通过所述全连接神经 网络对所述时空依赖特征提取到 的特征, yi为所述最后一次来访记录中第i个目标事件对 应的标签向量, 为FCN(Fstcn)中第i个目标事 件对应的提取向量。 10.一种信息特 征提取装置, 其特 征在于, 包括: 获取模块, 用于获取用户来访记录信 息, 根据所述用户来访记录信 息构建结构化数据, 所述用户来访记录信息中包 含用户的多次来访记录; 处理模块, 用于基于所述结构化数据构建所述用户来访记录信息的特征化表示, 所述 特征化表示包括所述用户来访记录信息的空间特征、 时间特征及时空特征; 所述空间特征 表征同一次来访记录中目标事件之 间的语义关系, 所述时间特征为所述不同次来访记录中 同一目标事件 之间的时间序列特征, 所述时空特征表征不同次所述来访记录中目标事件之 间的语义关系; 提取模块, 用于根据 所述空间特征、 所述 时间特征及所述时空特征, 提取所述用户来访权 利 要 求 书 2/3 页 3 CN 114496215 A 3

.PDF文档 专利 信息特征提取方法、装置、可读存储介质及电子设备

文档预览
中文文档 23 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共23页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 信息特征提取方法、装置、可读存储介质及电子设备 第 1 页 专利 信息特征提取方法、装置、可读存储介质及电子设备 第 2 页 专利 信息特征提取方法、装置、可读存储介质及电子设备 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 20:43:24上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。