说明:收录全网最新的团体标准 提供单次或批量下载
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111649814.4 (22)申请日 2021.12.2 9 (71)申请人 中国工商银行股份有限公司 地址 100140 北京市西城区复兴门内大街 55号 (72)发明人 裴冉 李福海 狄程 杨喆炜  (74)专利代理 机构 北京康信知识产权代理有限 责任公司 1 1240 代理人 黄海英 (51)Int.Cl. G06F 16/215(2019.01) G06F 16/22(2019.01) G06F 16/28(2019.01) G06K 9/62(2022.01) (54)发明名称 数据处理方法及装置 (57)摘要 本申请公开了一种数据处理方法及装置。 涉 及金融科技领域, 该方法包括: 通过增长算法对 目标数据进行处理, 得到目标数据对应的频繁模 式树, 其中, 频繁模式树包括多个代表数据项的 节点, 以及具有关联关系的数据项的节点之间连 线; 根据项合并策略对频繁模式树进行合并处 理, 得到合并后的频繁模式树; 对合并后的频繁 模式树进行迭代处理, 得到迭代后的频繁模式 树, 其中, 迭代后的频繁模式树中所包括的每个 数据项对应一种虚拟物品。 通过本申请, 解决了 相关技术中无人销售数据, 需要进行分析和分 类, 存在效率低准确性低的问题。 权利要求书2页 说明书14页 附图6页 CN 114328491 A 2022.04.12 CN 114328491 A 1.一种数据处 理方法, 其特 征在于, 包括: 通过增长算法对目标数据进行处理, 得到所述目标数据对应的频繁模式树, 其中, 所述 频繁模式树包括多个代 表数据项的节点, 以及具有关联关系的数据项的节点之间连线; 根据项合并策略对所述频繁模式树进行合并处 理, 得到合并后的频繁模式树; 对所述合并后的频繁模式树进行迭代 处理, 得到迭代后的频繁模式树, 其中, 所述迭代 后的频繁模式树中所包括的每 个数据项对应一种虚拟物品。 2.根据权利要求1所述的方法, 其特征在于, 通过增长算法对目标数据进行处理, 得到 所述目标 数据对应的频繁模式树包括: 扫描用于存储所述目标数据的数据库, 获取多个不同事务的数据项的项集, 以及每个 数据项的频 数; 按照所述频 数降序生成频繁项目列表; 再次扫描所述数据库, 提取 各个事务的数据项; 根据所述频繁项目列表的先后顺序, 将各个事务的数据项逐项插入, 生成所述频繁模 式树。 3.根据权利要求2所述的方法, 其特征在于, 通过增长算法对目标数据进行处理, 得到 所述目标 数据对应的频繁模式树之前, 所述方法还 包括: 对所述数据库中的所述目标 数据进行清洗; 对清洗后的目标数据进行审查与 校验, 其中, 所述审查与 校验包括下列至少之一: 填补 空缺信息, 删除重复信息, 纠正 错误信息, 调整数据结构; 对校验后的目标 数据进行有效性分析, 将无效的数据删除。 4.根据权利要求2所述的方法, 其特征在于, 根据所述频繁项目列表的先后顺序, 将数 据项逐项插 入, 生成所述频繁模式树包括: 创建初始频繁模式树, 所述初始频繁模式树的根节点; 根据所述频繁项目列表的先后顺序, 将每个事务的数据项逐项创建节点进行连接, 并 记录所述数据项的频 数; 为不同的事务创建不同的分枝, 在创建分支的事务与已有分枝的数据项相同的情况 下, 将相同的数据项合并, 生成所述频繁模式树。 5.根据权利要求4所述的方法, 其特征在于, 根据项合并策略对所述频繁模式树进行合 并处理, 得到合并后的频繁模式树包括: 从所述频繁模式树的根节点开始遍历所述频繁模式树的每一个数据项, 确定所述每个 数据项的频繁模式树路径; 在所述频繁模式树路径为非单链的情况下, 根据 所述项合并策略对所述频繁模式树路 径进行合并, 得到所述 合并后的频繁模式树; 对所述合并后的频繁模式树进行迭代处 理, 得到迭代后的频繁模式树包括: 在合并后的频繁模式树路径为非单链的情况下, 根据所述频繁模式树路径的节点重新 生成频繁模式树, 根据所述项合并策略进行迭代, 得到迭代后的频繁模式树, 其中, 所述迭 代后的频繁模式树的所述数据项的频繁模式树路径为单链。 6.根据权利要求5所述的方法, 其特征在于, 对所述合并后的频繁模式树进行迭代处 理, 得到迭代后的频繁模式树之后, 所述方法还 包括:权 利 要 求 书 1/2 页 2 CN 114328491 A 2根据需求将单链的所述频繁模式树路径上的一个或多个节点与 所述数据项合并, 生成 频繁项集; 设置算法最小支持度和最小置信度, 通过所述增长算法对所述频繁项集进行迭代, 直 至满足所述最小支持度和最小置信度的要求, 停止迭代, 输出运行结果; 根据所述运行结果 确定频繁项集中的数据项之间的关联关系。 7.根据权利要求6所述的方法, 其特征在于, 根据 所述运行结果确定频繁项集中的数据 项之间的关联关系之后, 所述方法还 包括: 获取预设的销售策略; 按照所述销售策略和所述关联关系, 确定不同数据项对应的虚拟物品的摆放策略。 8.一种数据处 理装置, 其特 征在于, 包括: 处理模块, 用于通过增长算法对目标数据进行处理, 得到所述目标数据对应的频繁模 式树, 其中, 所述频繁模式树包括多个代表数据项的节点, 以及具有关联关系的数据项的节 点之间连线; 合并模块, 用于根据项合并策略对所述频繁模式树进行合并处理, 得到合并后的频繁 模式树; 迭代模块, 用于对所述合并后的频繁模式树进行迭代处理, 得到迭代后的频繁模式树, 其中, 所述迭代后的频繁模式树中所包括的每 个数据项对应一种虚拟物品。 9.一种处理器, 其特征在于, 所述处理器用于运行程序, 其中, 所述程序运行时执行权 利要求1至7中任意 一项所述的数据处 理方法。 10.一种电子设备, 其特征在于, 包括一个或多个处理器和存储器, 所述存储器用于存 储一个或多个程序, 其中, 当所述一个或多个程序被所述一个或多个处理器执行时, 使得所 述一个或多个处 理器实现权利要求1至7中任意 一项所述的数据处 理方法。权 利 要 求 书 2/2 页 3 CN 114328491 A 3

.PDF文档 专利 数据处理方法及装置

文档预览
中文文档 23 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共23页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 数据处理方法及装置 第 1 页 专利 数据处理方法及装置 第 2 页 专利 数据处理方法及装置 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 20:44:36上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。